Analisis Komparatif Performa XGBoost dan Random Forest dalam Skrining Risiko Penyakit Jantung Berdasarkan Data Survei Kesehatan dengan Optimasi Sensitivitas dan SHAP

Hutagalung, Pancar Hizkia (2026) Analisis Komparatif Performa XGBoost dan Random Forest dalam Skrining Risiko Penyakit Jantung Berdasarkan Data Survei Kesehatan dengan Optimasi Sensitivitas dan SHAP. Diploma thesis, Universitas Nasional.

[thumbnail of COVER.pdf] Text
COVER.pdf

Download (2MB)
[thumbnail of BAB I.pdf] Text
BAB I.pdf

Download (308kB)
[thumbnail of BAB II.pdf] Text
BAB II.pdf

Download (612kB)
[thumbnail of BAB III.pdf] Text
BAB III.pdf

Download (600kB)
[thumbnail of BAB IV.pdf] Text
BAB IV.pdf

Download (1MB)
[thumbnail of BAB V.pdf] Text
BAB V.pdf

Download (253kB)
[thumbnail of LAMPIRAN.pdf] Text
LAMPIRAN.pdf

Download (774kB)

Abstract

Penyakit jantung merupakan salah satu masalah kesehatan utama yang memerlukan pendekatan deteksi dini, termasuk melalui skrining risiko pada tingkat populasi. Penelitian ini bertujuan membandingkan kinerja algoritma XGBoost dan Random Forest untuk skrining risiko penyakit jantung menggunakan data Behavioral Risk Factor Surveillance System (BRFSS), dengan penekanan pada optimasi sensitivitas dan interpretasi model menggunakan SHAP (SHapley Additive exPlanations). Penelitian ini menempatkan keluaran model sebagai alat skrining risiko, bukan diagnosis klinis.
Tahapan penelitian meliputi konversi data BRFSS dari format .XPT ke

.CSV, data preparation (pemuatan data, analisis awal, seleksi variabel, pembersihan data, dan pembentukan dataset final), serta pemodelan dan evaluasi. Data kemudian dibagi menjadi data latih dan data uji dengan rasio 70:30. Pemodelan dilakukan melalui dua tahap, yaitu model baseline (Random Forest dan XGBoost) serta optimasi model XGBoost melalui penyesuaian ambang batas (threshold) dan hyperparameter tuning menggunakan RandomizedSearchCV. Evaluasi model dilakukan menggunakan metrik klasifikasi yang relevan untuk skrining, terutama sensitivitas (recall) dan F2-score, disertai analisis confusion matrix dan kurva evaluasi. Model terbaik selanjutnya diinterpretasikan menggunakan SHAP untuk menjelaskan kontribusi fitur terhadap prediksi.
Hasil penelitian menunjukkan bahwa pendekatan machine learning pada data BRFSS dapat digunakan untuk mendukung skrining risiko penyakit jantung pada konteks populasi. Perbandingan model menunjukkan adanya perbedaan karakteristik kinerja antara Random Forest dan XGBoost, dan optimasi pada XGBoost meningkatkan kesesuaian model terhadap tujuan skrining, khususnya dalam mendukung deteksi kelas positif. Interpretasi menggunakan SHAP memberikan transparansi tambahan melalui penjelasan kontribusi fitur, sehingga hasil prediksi tidak hanya informatif dari sisi performa, tetapi juga lebih mudah
dipahami.

Item Type: Thesis (Diploma)
Subjects: T Technology > T Technology (General)
T Technology > TK Electrical engineering. Electronics Nuclear engineering
Divisions: Skripsi > Fakultas Teknologi Komunikasi dan Informatika > Program Studi Sistem Informasi
Depositing User: Delvy Aplirizani -
Date Deposited: 02 Jun 2026 07:53
Last Modified: 02 Jun 2026 07:53
URI: https://repository.unas.ac.id/id/eprint/16349

Actions (login required)

View Item View Item