Ardiansyah, Ardan (2026) KLASIFIKASI MULTIKATEGORI BERITA OLAHRAGA INDONESIA MENGGUNAKAN ALGORITMA KNN DAN SVM. Diploma thesis, Universitas Nasional.
|
Text
Cover.pdf Download (1MB) |
|
|
Text
BAB 1.pdf Download (443kB) |
|
|
Text
BAB 2 .pdf Download (643kB) |
|
|
Text
BAB 3.pdf Download (657kB) |
|
|
Text
BAB 4-.pdf Download (1MB) |
|
|
Text
BAB 5-.pdf Download (388kB) |
|
|
Text
Lampiran.pdf Download (661kB) |
Abstract
Perkembangan portal berita daring di Indonesia menyebabkan meningkatnya volume berita olahraga yang dipublikasikan setiap hari, sehingga proses pengelompokan berita secara manual menjadi kurang efisien dan berpotensi menimbulkan inkonsistensi kategorisasi. Penelitian ini mengkaji dan membandingkan kinerja algoritma K-Nearest Neighbor (KNN) dan Support Vector Machine (SVM) dalam mengklasifikasikan berita olahraga berbahasa Indonesia ke dalam tiga subkategori, yaitu Sepak Bola, Badminton, dan MotoGP. Representasi teks dilakukan menggunakan metode Term Frequency Inverse Document Frequency (TF-IDF) setelah melalui tahapan preprocessing teks yang meliputi case folding, tokenizing, stopword removal, dan stemming. Dataset diperoleh melalui proses Web Scraping portal berita daring Detik.com dan dibagi ke dalam dua skenario pembagian data, yaitu 70:30 dan 80:20 menggunakan metode stratified sampling. Hasil eksperimen menunjukkan bahwa kedua algoritma menghasilkan performa yang sangat tinggi dengan akurasi melebihi 99% pada kedua skenario pengujian. Pada pembagian 70:30, KNN dan SVM memperlihatkan hasil yang relatif identik, sedangkan pada skenario 80:20, SVM menunjukkan performa yang sedikit lebih unggul dan lebih stabil dibandingkan KNN. Validasi menggunakan Stratified K-Fold Cross Validation serta analisis macro average dan learning curve mengindikasikan bahwa model memiliki kemampuan generalisasi yang baik tanpa gejala overfitting yang signifikan. Implementasi sistem berbasis Streamlit juga membuktikan bahwa model mampu mengklasifikasikan berita olahraga aktual secara langsung. Berdasarkan hasil penelitian, algoritma SVM dinilai sebagai model yang paling optimal dalam klasifikasi multikategori berita olahraga berbahasa Indonesia.
| Item Type: | Thesis (Diploma) |
|---|---|
| Uncontrolled Keywords: | klasifikasi teks, berita olahraga, TF-IDF, K-Nearest Neighbor, Support Vector Machine. |
| Subjects: | T Technology > T Technology (General) T Technology > TA Engineering (General). Civil engineering (General) |
| Divisions: | Skripsi > Fakultas Teknologi Komunikasi dan Informatika > Program Studi Sistem Informasi |
| Depositing User: | Fitria Nur Indah Hasanah |
| Date Deposited: | 07 May 2026 07:57 |
| Last Modified: | 07 May 2026 07:57 |
| URI: | https://repository.unas.ac.id/id/eprint/15778 |
Actions (login required)
![]() |
View Item |
