Analysis of Dropout and Learning Rate on BiLSTM-ANN Performance in Hate Speech Detection
DOI:
https://doi.org/10.57096/lentera.v3i2.142Keywords:
BiLSTM-ANN, Dropout, tingkat pembelajaran, deteksi ujaran kebencian, media sosialAbstract
Penyebaran ujaran kebencian di media sosial semakin meningkat, sehingga menuntut pengembangan model deteksi yang akurat dan efisien. Penelitian ini menganalisis dampak dari parameter dropout dan learning rate terhadap kinerja model BiLSTM-ANN dalam mendeteksi ujaran kebencian di media sosial Indonesia. Tujuan utama dari penelitian ini adalah untuk mengevaluasi akurasi, F1-score, precision, recall, dan AUC yang dihasilkan oleh model, serta untuk menentukan nilai optimal untuk learning rate dan dropout. Model diuji menggunakan data komentar dari platform media sosial Indonesia. Metode penelitian menggunakan pendekatan CRISP-DM, dengan pengumpulan 2064 komentar dari TikTok dan Twitter (X), yang kemudian diproses melalui berbagai tahap, termasuk prapemrosesan teks, pembelajaran mendalam dengan BiLSTM-ANN, serta evaluasi performa model. Model diuji dengan berbagai kombinasi dropout (0,02–0,7) dan learning rate (0,00001–0,01) untuk menemukan konfigurasi optimal. Hasil uji menunjukkan bahwa model BiLSTM-ANN mencapai akurasi sebesar 68,12%, dengan precision sebesar 53,71% dan recall sebesar 82,55%. Meskipun recall model cukup tinggi, precision yang relatif rendah menunjukkan kesulitan dalam mendeteksi kelas minoritas. Ketidakseimbangan data dan variasi bahasa di media sosial menjadi tantangan utama bagi model ini. Penelitian ini menyimpulkan bahwa optimasi parameter, peningkatan data pelatihan, dan penerapan teknik yang lebih canggih diperlukan untuk meningkatkan kinerja deteksi ujaran kebencian, dengan implikasi untuk sistem moderasi konten di platform media sosial. Implikasi penelitian ini mencakup perbaikan dalam sistem moderasi konten berbasis kecerdasan buatan, dengan potensi implementasi model BiLSTM-ANN pada platform media sosial untuk meningkatkan efektivitas dalam mengidentifikasi ujaran kebencian secara real-time. Diperlukan penelitian lanjutan dengan dataset yang lebih besar serta penerapan teknik balancing data untuk meningkatkan akurasi dan generalisasi model.
Published
Issue
Section
License
Copyright (c) 2025 Ranny Erzitha, Dony Novaliendry , Khairi Budayawan

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.