Nanda, Oktaviana (2026) OPTIMASI AKURASI KATEGORISASI KONTEN KESEHATAN BERBASIS PENYAKIT MENGGUNAKAN MODEL XGBOOST DAN LIGHTGBM. Diploma thesis, Universitas Nasional.
|
Text
Cover (Cover, Lembar Penunjang, Abstrak, Kata Pengantar, Daftar Isi) 2.pdf Download (1MB) |
|
|
Text
BAB I.pdf Download (297kB) |
|
|
Text
BAB II.pdf Download (991kB) |
|
|
Text
BAB III.pdf Download (564kB) |
|
|
Text
BAB IV.pdf Download (1MB) |
|
|
Text
BAB V.pdf Download (155kB) |
|
|
Text
LAMPIRAN.pdf Download (723kB) |
Abstract
Konten kesehatan berbahasa Indonesia pada platform X (Twitter) berkembang
sangat cepat dan memuat berbagai informasi serta pengalaman masyarakat terkait
penyakit, sehingga diperlukan sistem yang mampu melakukan klasifikasi konten
kesehatan secara otomatis dan akurat. Penelitian ini bertujuan untuk
mengoptimalkan akurasi klasifikasi konten kesehatan berbasis penyakit dengan
memanfaatkan IndoBERT embedding sebagai representasi semantik teks serta
membandingkan performa algoritma XGBoost dan Light Gradient Boosting
Machine (LightGBM) sebagai model klasifikasi. Data penelitian diperoleh melalui
proses data scraping dari platform X dengan fokus pada tiga kategori penyakit, yaitu
jantung, hipertensi, dan diabetes, kemudian dilakukan prapemrosesan teks dan
pembentukan embedding IndoBERT. Selanjutnya, embedding digunakan sebagai
masukan untuk pelatihan model XGBoost dan LightGBM, dengan evaluasi kinerja
menggunakan metrik accuracy, precision macro, recall macro, dan F1-score macro
melalui pendekatan K-Fold Cross Validation. Hasil penelitian menunjukkan bahwa
kombinasi IndoBERT + LightGBM menghasilkan performa terbaik dengan nilai
accuracy sebesar 85,26%, precision macro 85,29%, recall macro 85,26%, dan F1score
macro
85,27%,
lebih
tinggi
dibandingkan
kombinasi
IndoBERT
+
XGBoost
yang
memperoleh akurasi 83,25%. Penelitian ini diharapkan dapat memberikan
kontribusi dalam pengembangan sistem klasifikasi konten kesehatan digital
berbahasa Indonesia yang lebih akurat dan kontekstual, serta mendukung
peningkatan literasi kesehatan digital di Indonesia.
| Item Type: | Thesis (Diploma) |
|---|---|
| Subjects: | T Technology > T Technology (General) |
| Divisions: | Skripsi > Fakultas Teknologi Komunikasi dan Informatika > Program Studi Sistem Informasi |
| Depositing User: | Irna Irna Yunita |
| Date Deposited: | 28 Apr 2026 02:58 |
| Last Modified: | 28 Apr 2026 02:58 |
| URI: | https://repository.unas.ac.id/id/eprint/15411 |
Actions (login required)
![]() |
View Item |
