Klasifikasi URL Berbahaya yang Efisien: MBERT – Varian BERT yang Dimodifikasi untuk Peningkatan Pemahaman Semantik
Klasifikasi URL Berbahaya yang Efisien: MBERT – Varian BERT yang Dimodifikasi untuk Peningkatan Pemahaman Semantik
Boyang Yu1, Fei Tang1, Daji Ergu1, Rui Zeng2, Bo Ma1, and Fangyao Liu1
1College of Electronic and Information, Southwest Minzu University, Chengdu, China
2College of Pharmacy, Southwest Minzu University, Chengdu, China
Corresponding author: Fangyao Liu (FLIU028@163.COM)
Situs web berbahaya menghadirkan ancaman besar terhadap keamanan dan privasi individu yang menggunakannya
internet. Pendekatan tradisional untuk mengidentifikasi situs-situs berbahaya ini sulit untuk diseimbangkan
strategi serangan yang berkembang. Dalam beberapa tahun terakhir, model bahasa telah muncul sebagai solusi potensial
secara efektif mendeteksi dan mengkategorikan situs web berbahaya. Penelitian ini memperkenalkan novel BiDirectional
Model Representasi Encoder dari Transformers (BERT), berdasarkan arsitektur encoder Transformer,
dirancang untuk menangkap karakteristik terkait dari alamat web berbahaya. Selain itu, bahasa berskala besar
model digunakan untuk pelatihan, penilaian kumpulan data, dan analisis interpretabilitas. Hasil evaluasi
menunjukkan efektivitas model bahasa besar dalam mengklasifikasikan situs web berbahaya secara akurat,
mencapai tingkat presisi yang mengesankan sebesar 94,42%. Performa ini melampaui bahasa yang ada
model. Selain itu, analisis interpretabilitas menyoroti proses pengambilan keputusan model,
meningkatkan pemahaman kita tentang hasil klasifikasinya. Kesimpulannya, model BERT yang diusulkan, dibangun
pada arsitektur encoder Transformer, menunjukkan kinerja yang kuat dan kemampuan interpretasi dalam identifikasi
dari situs web berbahaya. Ini menjanjikan sebagai solusi untuk meningkatkan keamanan pengguna jaringan dan melakukan mitigasi risiko yang terkait dengan aktivitas online berbahaya.
source: IEEE