ANALISIS KOMPARASI ALGORITMA LIGHTGBM DAN CATBOOST DALAM KLASIFIKASI KUALITAS UDARA UNTUK MENENTUKAN PEMODELAN TERBAIK

Nazwa, Maulidatun (2026) ANALISIS KOMPARASI ALGORITMA LIGHTGBM DAN CATBOOST DALAM KLASIFIKASI KUALITAS UDARA UNTUK MENENTUKAN PEMODELAN TERBAIK. Diploma thesis, Universitas Nasional.

[thumbnail of COVER .pdf] Text
COVER .pdf

Download (1MB)
[thumbnail of BAB 1.pdf] Text
BAB 1.pdf

Download (256kB)
[thumbnail of BAB 2.pdf] Text
BAB 2.pdf

Download (718kB)
[thumbnail of BAB 3.pdf] Text
BAB 3.pdf

Download (675kB)
[thumbnail of BAB 4.pdf] Text
BAB 4.pdf

Download (891kB)
[thumbnail of BAB 5.pdf] Text
BAB 5.pdf

Download (211kB)
[thumbnail of LAMPIRAN.pdf] Text
LAMPIRAN.pdf

Download (528kB)

Abstract

Kualitas udara di DKI Jakarta dalam beberapa tahun terakhir masih
didominasi kategori Sedang dan Tidak Sehat berdasarkan Indeks Standar Pencemar
Udara (ISPU). Tingginya konsentrasi polutan partikulat seperti PM2.5 dan PM10
menuntut adanya model klasifikasi yang akurat untuk mendukung analisis kualitas
udara berbasis data. Penelitian ini bertujuan untuk melakukan analisis komparatif
antara algoritma LightGBM dan CatBoost dalam klasifikasi kualitas udara berbasis
data numerik ISPU guna menentukan model yang paling optimal.
Data yang digunakan merupakan data ISPU periode 2020–2025 yang
diperoleh dari Portal Satu Data Jakarta, mencakup enam parameter polutan utama,
yaitu PM2.5, PM10, SO₂, CO, O₃, dan NO₂. Proses penelitian meliputi tahap
preprocessing data, pembagian data latih dan uji, pembangunan model klasifikasi,
serta evaluasi menggunakan metrik accuracy, precision, recall, dan F1-score.
Interpretasi model dilakukan menggunakan metode SHAP untuk mengidentifikasi
pengaruh masing-masing fitur terhadap keputusan klasifikasi.
Hasil penelitian menunjukkan bahwa CatBoost menghasilkan performa yang
lebih unggul dibandingkan LightGBM. LightGBM memperoleh akurasi sebesar
95%, sedangkan CatBoost mencapai akurasi sebesar 99%. Selain memiliki tingkat
akurasi yang lebih tinggi, CatBoost juga menunjukkan kestabilan performa yang
lebih baik pada distribusi kelas yang tidak seimbang. Analisis SHAP mengonfirmasi
bahwa PM2.5 dan PM10 merupakan fitur yang paling dominan dalam menentukan
kategori kualitas udara. Berdasarkan hasil tersebut, CatBoost direkomendasikan
sebagai model paling optimal untuk klasifikasi kualitas udara berbasis ISPU pada
penelitian ini.

Item Type: Thesis (Diploma)
Subjects: T Technology > T Technology (General)
Divisions: Skripsi > Fakultas Teknologi Komunikasi dan Informatika > Program Studi Sistem Informasi
Depositing User: Irna Irna Yunita
Date Deposited: 28 Apr 2026 03:08
Last Modified: 28 Apr 2026 03:08
URI: https://repository.unas.ac.id/id/eprint/15415

Actions (login required)

View Item View Item