Hutagalung, Pancar Hizkia (2026) Analisis Komparatif Performa XGBoost dan Random Forest dalam Skrining Risiko Penyakit Jantung Berdasarkan Data Survei Kesehatan dengan Optimasi Sensitivitas dan SHAP. Diploma thesis, Universitas Nasional.
|
Text
COVER.pdf Download (2MB) |
|
|
Text
BAB I.pdf Download (308kB) |
|
|
Text
BAB II.pdf Download (612kB) |
|
|
Text
BAB III.pdf Download (600kB) |
|
|
Text
BAB IV.pdf Download (1MB) |
|
|
Text
BAB V.pdf Download (253kB) |
|
|
Text
LAMPIRAN.pdf Download (774kB) |
Abstract
Penyakit jantung merupakan salah satu masalah kesehatan utama yang memerlukan pendekatan deteksi dini, termasuk melalui skrining risiko pada tingkat populasi. Penelitian ini bertujuan membandingkan kinerja algoritma XGBoost dan Random Forest untuk skrining risiko penyakit jantung menggunakan data Behavioral Risk Factor Surveillance System (BRFSS), dengan penekanan pada optimasi sensitivitas dan interpretasi model menggunakan SHAP (SHapley Additive exPlanations). Penelitian ini menempatkan keluaran model sebagai alat skrining risiko, bukan diagnosis klinis.
Tahapan penelitian meliputi konversi data BRFSS dari format .XPT ke
.CSV, data preparation (pemuatan data, analisis awal, seleksi variabel, pembersihan data, dan pembentukan dataset final), serta pemodelan dan evaluasi. Data kemudian dibagi menjadi data latih dan data uji dengan rasio 70:30. Pemodelan dilakukan melalui dua tahap, yaitu model baseline (Random Forest dan XGBoost) serta optimasi model XGBoost melalui penyesuaian ambang batas (threshold) dan hyperparameter tuning menggunakan RandomizedSearchCV. Evaluasi model dilakukan menggunakan metrik klasifikasi yang relevan untuk skrining, terutama sensitivitas (recall) dan F2-score, disertai analisis confusion matrix dan kurva evaluasi. Model terbaik selanjutnya diinterpretasikan menggunakan SHAP untuk menjelaskan kontribusi fitur terhadap prediksi.
Hasil penelitian menunjukkan bahwa pendekatan machine learning pada data BRFSS dapat digunakan untuk mendukung skrining risiko penyakit jantung pada konteks populasi. Perbandingan model menunjukkan adanya perbedaan karakteristik kinerja antara Random Forest dan XGBoost, dan optimasi pada XGBoost meningkatkan kesesuaian model terhadap tujuan skrining, khususnya dalam mendukung deteksi kelas positif. Interpretasi menggunakan SHAP memberikan transparansi tambahan melalui penjelasan kontribusi fitur, sehingga hasil prediksi tidak hanya informatif dari sisi performa, tetapi juga lebih mudah
dipahami.
| Item Type: | Thesis (Diploma) |
|---|---|
| Subjects: | T Technology > T Technology (General) T Technology > TK Electrical engineering. Electronics Nuclear engineering |
| Divisions: | Skripsi > Fakultas Teknologi Komunikasi dan Informatika > Program Studi Sistem Informasi |
| Depositing User: | Delvy Aplirizani - |
| Date Deposited: | 02 Jun 2026 07:53 |
| Last Modified: | 02 Jun 2026 07:53 |
| URI: | https://repository.unas.ac.id/id/eprint/16349 |
Actions (login required)
![]() |
View Item |
