Analisis Komparatif Algoritma One-Class Untuk Klasifikasi Teks Iklan Judi Online Berbasis Embedding IndoBERT

Authors

DOI:

https://doi.org/10.36423/index.v7i2.2309

Keywords:

Deteksi Anomali, IndoBERT, One-Class SVM, Autoencoder, Iklan Judi Online

Abstract

Penyebaran iklan judi online di Indonesia terus meningkat meskipun berbagai upaya pemblokiran telah dilakukan. Iklan-iklan ini menyebar luas melalui media sosial dan situs daring, sehingga dibutuhkan sistem otomatis yang mampu menyaring konten iklan judi secara efektif. Penelitian ini mengusulkan pendekatan deteksi anomali satu kelas (one-class anomaly detection) sebagai metode penyaringan awal berbasis pembelajaran hanya dari data teks judi. Untuk merepresentasikan teks, digunakan contextual embedding IndoBERT yang menghasilkan vektor fitur berdimensi 768. Selanjutnya, dilakukan analisis komparatif terhadap tiga algoritma deteksi anomali: One-Class SVM, Isolation Forest, dan Autoencoder. Pengujian dilakukan dalam dua skenario: data seimbang dan tidak seimbang. Pada skenario seimbang, OCSVM menunjukkan performa terbaik dengan F1-score mencapai 91%. Sementara itu, dalam skenario tidak seimbang yang meniru kondisi dunia nyata, model Autoencoder mendapatkan recall terbaik mencapai 94% dengan jumlah false positive yang sangat rendah. Hasil ini menunjukkan bahwa Autoencoder layak direkomendasikan sebagai sistem penyaringan awal sebelum proses klasifikasi lanjutan atau validasi manual dilakukan.

References

S. H. Bakhtiar and A. N. Adilah, “Fenomena Judi Online : Faktor, Dampak, Pertanggungjawaban Hukum,” Innovative: Journal Of Social Science Research, vol. 4, no. 3, pp. 1016–1026, May 2024, doi: 10.31004/innovative.v4i3.10547.

PRESIDEN REPUBLIK INDONESIA, “UNDANG UNDANG REPUBLIK INDONESIA NOMOR 1 TAHUN 2024,” 2024. Accessed: May 12, 2025. [Online]. Available: https://peraturan.bpk.go.id/Download/332870/UU%20Nomor%201%20Tahun%202024.pdf

PPATK, “Promensisko 2025: Menjawab Ancaman Judi Online dan Kejahatan Digital Lewat Aksi,” PPATK. Accessed: May 12, 2025. [Online]. Available: https://www.ppatk.go.id/siaran_pers/read/1474/promensisko-2025-menjawab-ancaman-judi-online-dan-kejahatan-digital-lewat-aksi-.html

Populix, “84% Pengguna Internet Indonesia Terpapar Iklan Judi Online,” POPULIX. Accessed: May 12, 2025. [Online]. Available: https://info.populix.co/articles/iklan-judi-online/

R. Bayu Perdana, I. Budi, A. Budi Santoso, A. Ramadiah, and P. Kresna Putra, “Detecting Online Gambling Promotions on Indonesian Twitter Using Text Mining Algorithm,” 2024. [Online]. Available: www.ijacsa.thesai.org

D. Challa, “Comprehensive Review of One-Class Classification Approaches for Anomaly Detection,” 2024.

P. Perera, P. Oza, and V. M. Patel, “One-Class Classification: A Survey,” Jan. 2021, [Online]. Available: http://arxiv.org/abs/2101.03064

L. Strani, M. Cocchi, D. Tanzilli, A. Biancolillo, F. Marini, and R. Vitale, “One class classification (class modelling): State of the art and perspectives,” Feb. 01, 2025, Elsevier B.V. doi: 10.1016/j.trac.2024.118117.

B. Wilie et al., “IndoNLU: Benchmark and Resources for Evaluating Indonesian Natural Language Understanding,” in Proceedings of the 1st Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics and the 10th International Joint Conference on Natural Language Processing, K.-F. Wong, K. Knight, and H. Wu, Eds., Suzhou, China: Association for Computational Linguistics, Dec. 2020, pp. 843–857. doi: 10.18653/v1/2020.aacl-main.85.

J. Devlin, M.-W. Chang, K. Lee, and K. Toutanova, “BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding,” Oct. 2018, [Online]. Available: http://arxiv.org/abs/1810.04805

B. Schölkopf, J. C. Platt, J. Shawe-Taylor, A. J. Smola, and R. C. Williamson, “Estimating the Support of a High-Dimensional Distribution,” Neural Comput, vol. 13, no. 7, pp. 1443–1471, Jul. 2001, doi: 10.1162/089976601750264965.

F. T. Liu, K. M. Ting, and Z.-H. Zhou, “Isolation Forest,” in 2008 Eighth IEEE International Conference on Data Mining, 2008, pp. 413–422. doi: 10.1109/ICDM.2008.17.

J. An and S. Cho, “Variational Autoencoder based Anomaly Detection using Reconstruction Probability,” 2015. [Online]. Available: https://api.semanticscholar.org/CorpusID:36663713

D. Jurafsky and J. H. Martin, Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition with Language Models, 3rd ed. 2025. [Online]. Available: https://web.stanford.edu/~jurafsky/slp3/

Downloads

Published

2025-11-10

How to Cite

Randi septiansah, M., Slamet, C., & Sandi, G. (2025). Analisis Komparatif Algoritma One-Class Untuk Klasifikasi Teks Iklan Judi Online Berbasis Embedding IndoBERT. Informatics and Digital Expert (INDEX), 7(2), 98–104. https://doi.org/10.36423/index.v7i2.2309