Analisis Komparatif Algoritma One-Class Untuk Klasifikasi Teks Iklan Judi Online Berbasis Embedding IndoBERT
DOI:
https://doi.org/10.36423/index.v7i2.2309Keywords:
Deteksi Anomali, IndoBERT, One-Class SVM, Autoencoder, Iklan Judi OnlineAbstract
Penyebaran iklan judi online di Indonesia terus meningkat meskipun berbagai upaya pemblokiran telah dilakukan. Iklan-iklan ini menyebar luas melalui media sosial dan situs daring, sehingga dibutuhkan sistem otomatis yang mampu menyaring konten iklan judi secara efektif. Penelitian ini mengusulkan pendekatan deteksi anomali satu kelas (one-class anomaly detection) sebagai metode penyaringan awal berbasis pembelajaran hanya dari data teks judi. Untuk merepresentasikan teks, digunakan contextual embedding IndoBERT yang menghasilkan vektor fitur berdimensi 768. Selanjutnya, dilakukan analisis komparatif terhadap tiga algoritma deteksi anomali: One-Class SVM, Isolation Forest, dan Autoencoder. Pengujian dilakukan dalam dua skenario: data seimbang dan tidak seimbang. Pada skenario seimbang, OCSVM menunjukkan performa terbaik dengan F1-score mencapai 91%. Sementara itu, dalam skenario tidak seimbang yang meniru kondisi dunia nyata, model Autoencoder mendapatkan recall terbaik mencapai 94% dengan jumlah false positive yang sangat rendah. Hasil ini menunjukkan bahwa Autoencoder layak direkomendasikan sebagai sistem penyaringan awal sebelum proses klasifikasi lanjutan atau validasi manual dilakukan.
References
S. H. Bakhtiar and A. N. Adilah, “Fenomena Judi Online : Faktor, Dampak, Pertanggungjawaban Hukum,” Innovative: Journal Of Social Science Research, vol. 4, no. 3, pp. 1016–1026, May 2024, doi: 10.31004/innovative.v4i3.10547.
PRESIDEN REPUBLIK INDONESIA, “UNDANG UNDANG REPUBLIK INDONESIA NOMOR 1 TAHUN 2024,” 2024. Accessed: May 12, 2025. [Online]. Available: https://peraturan.bpk.go.id/Download/332870/UU%20Nomor%201%20Tahun%202024.pdf
PPATK, “Promensisko 2025: Menjawab Ancaman Judi Online dan Kejahatan Digital Lewat Aksi,” PPATK. Accessed: May 12, 2025. [Online]. Available: https://www.ppatk.go.id/siaran_pers/read/1474/promensisko-2025-menjawab-ancaman-judi-online-dan-kejahatan-digital-lewat-aksi-.html
Populix, “84% Pengguna Internet Indonesia Terpapar Iklan Judi Online,” POPULIX. Accessed: May 12, 2025. [Online]. Available: https://info.populix.co/articles/iklan-judi-online/
R. Bayu Perdana, I. Budi, A. Budi Santoso, A. Ramadiah, and P. Kresna Putra, “Detecting Online Gambling Promotions on Indonesian Twitter Using Text Mining Algorithm,” 2024. [Online]. Available: www.ijacsa.thesai.org
D. Challa, “Comprehensive Review of One-Class Classification Approaches for Anomaly Detection,” 2024.
P. Perera, P. Oza, and V. M. Patel, “One-Class Classification: A Survey,” Jan. 2021, [Online]. Available: http://arxiv.org/abs/2101.03064
L. Strani, M. Cocchi, D. Tanzilli, A. Biancolillo, F. Marini, and R. Vitale, “One class classification (class modelling): State of the art and perspectives,” Feb. 01, 2025, Elsevier B.V. doi: 10.1016/j.trac.2024.118117.
B. Wilie et al., “IndoNLU: Benchmark and Resources for Evaluating Indonesian Natural Language Understanding,” in Proceedings of the 1st Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics and the 10th International Joint Conference on Natural Language Processing, K.-F. Wong, K. Knight, and H. Wu, Eds., Suzhou, China: Association for Computational Linguistics, Dec. 2020, pp. 843–857. doi: 10.18653/v1/2020.aacl-main.85.
J. Devlin, M.-W. Chang, K. Lee, and K. Toutanova, “BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding,” Oct. 2018, [Online]. Available: http://arxiv.org/abs/1810.04805
B. Schölkopf, J. C. Platt, J. Shawe-Taylor, A. J. Smola, and R. C. Williamson, “Estimating the Support of a High-Dimensional Distribution,” Neural Comput, vol. 13, no. 7, pp. 1443–1471, Jul. 2001, doi: 10.1162/089976601750264965.
F. T. Liu, K. M. Ting, and Z.-H. Zhou, “Isolation Forest,” in 2008 Eighth IEEE International Conference on Data Mining, 2008, pp. 413–422. doi: 10.1109/ICDM.2008.17.
J. An and S. Cho, “Variational Autoencoder based Anomaly Detection using Reconstruction Probability,” 2015. [Online]. Available: https://api.semanticscholar.org/CorpusID:36663713
D. Jurafsky and J. H. Martin, Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition with Language Models, 3rd ed. 2025. [Online]. Available: https://web.stanford.edu/~jurafsky/slp3/
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2025 Muhamad Randi septiansah, Cepy Slamet, Gitarja Sandi

This work is licensed under a Creative Commons Attribution 4.0 International License.



