IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOR (KNN) DAN ALGORITMA RANDOM FOREST DALAM MENGIDENTIFIKASI PENYAKIT DIABETES

Diranisha, Virly (2024) IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOR (KNN) DAN ALGORITMA RANDOM FOREST DALAM MENGIDENTIFIKASI PENYAKIT DIABETES. Bachelor thesis, Universitas Nasional.

[img] Text
COVER.pdf

Download (3MB)
[img] Text
BAB I.pdf

Download (886kB)
[img] Text
BAB II.pdf

Download (1MB)
[img] Text
BAB III.pdf

Download (1MB)
[img] Text
BAB IV.pdf

Download (1MB)
[img] Text
BAB V.pdf

Download (854kB)
[img] Text
LAMPIRAN.pdf

Download (1MB)

Abstract

Diabetes salah satu jenis penyakit yang tidak dapat ditularkan antar orang (PTM) saat ini menjadi mengancam kesehatan utama di seluruh dunia. Selama ini gejala diabetes hanya di diagnosis oleh orang sesuai dengan karakteristik fisik yang diketahui tanpa dukungan bukti faktual atau pertimbangan medis lainnya. Dengan kemajuan teknologi, memungkinkan penggunaan algoritma dapat menyelesaikan berbagai macam masalah. Salah satu kecerdasan buatan (AI) yaitu machine learning berkonsentrasi pada pembuatan sistem yang dapat belajar dari data. Penelitian ini menggunakan algoritma K-Nearest Neighbor (KNN) dan Random Forest yang dapat dimanfaatkan sebagai algoritma pengujian untuk mengidentifikasi penyakit diabetes. Membandingkan kedua algoritma antara algoritma KNN dan Algoritma Random Forest. Dengan membagi data testing dan data training menggunakan perbandingan 20% : 80% data dari total data 768 menjadi 614 data training dan data test 20% darti total data 768 menjadi 154 data. Hasil dari evaluasi akurasi yang didapatkan dari Confusion Matrix menunjukkan bahwa Algoritma Random Forest memiliki nilai akurasi terbaik 80%, Presisi 80%, Recall 58% dan F1-Score 67% dengan estimator 100 pohon, kriteria entropy, min sample leaf 5, max features 0.2, max depth 5. Sedangkan Algoritma KNN akurasi yang didapatkan sebesar 75%, Presisi 67%, Recall 62% dan F1-Score 64% dari nilai K=7. Berdasarkan hasil Perbandingan dari kedua algortima tersebut menunjukkan bahwa nilai akurasi yang didapatkan lebih besar algoritma Random Forest walaupun nilai yang didapat tidak jauh berbeda. Data Hasil ditampilkan dengan framework streamlit menampilkan visualisasi data dan percobaan prediksi hasil. Kata Kunci : Klasifikasi, Diabetes, Perbandingan, Random Forest, KNearest Neighbors, Streamlit.

Item Type: Thesis (Bachelor)
Subjects: H Social Sciences > HA Statistics
T Technology > T Technology (General)
Divisions: Skripsi > Fakultas Teknologi Komunikasi dan Informatika > Program Studi Teknik Informatika
Depositing User: Delvy Aplirizani -
Date Deposited: 21 Mar 2024 03:13
Last Modified: 21 Mar 2024 03:13
URI: http://repository.unas.ac.id/id/eprint/10242

Actions (login required)

View Item View Item