IMPLEMENTASI METODE FITUR EKSTRAKSI DAN ALGORITMA SUPERVISED LEARNING DALAM MENGIDENTIFIKASI JENIS KELAMIN BERDASARKAN NAMA

Rizkiansyah, Muhammad (2022) IMPLEMENTASI METODE FITUR EKSTRAKSI DAN ALGORITMA SUPERVISED LEARNING DALAM MENGIDENTIFIKASI JENIS KELAMIN BERDASARKAN NAMA. Diploma thesis, Universitas Nasional.

[img] Text
BAB 1.pdf

Download (124kB)
[img] Text
BAB 2.pdf

Download (242kB)
[img] Text
BAB 3.pdf

Download (161kB)
[img] Text
BAB 4.pdf

Download (689kB)
[img] Text
BAB 5.pdf

Download (108kB)
[img] Text
COVER.pdf

Download (1MB)
[img] Text
LAMPIRAN (Daftar Pustaka, Lembar Awal Turnitin).pdf

Download (169kB)

Abstract

Pemegang data memiliki dokumen terkait data personal akan tetapi tidak adanya variabel gender dalam dokumen tersebut. Dalam hal ini, memungkinkan pemilik data mengklasifikasikan variabel gender berdasarkan nama yang ada secara manual. Mengklasifikasikan dokumen secara manual dinilai tidak seefisien seperti dulu, karena jumlah data yang semakin meningkat. Algoritma supervised learning yang ada pada machine learning dapat berperan, sebagai cara alternatif dalam pengklasifikasian dokumen. Penelitian ini dilakukan untuk mencari model yang terbaik dalam mengidentifikasi jenis kelamin berdasarkan nama, yang diimplementasikan ke dalam aplikasi prediksi berbasis web, dengan menggunakan fitur ekstraksi countvectorizer dan pemanfaatan n-gram serta membandingkan kedua algoritma supervised learning yaitu logistic regression dan multinomial naive bayes. Hasil dari penelitian ini didapatkan model terbaik yaitu model logistic regression pada rentan 2-12 gram dengan split data 80:20 yang memiliki tingkat akurasi 94.76%, dan berdasarkan uji validasi model menggunakan confusion matrix logistic regression memperoleh 0.95 f1-score pada semua labeling, beserta dari hasil uji prediksi yang mendapatkan kesalahan prediksi tersedikit yaitu 28. Maka dari itu model logistic regression dengan split data 80:20 yang akan diterapkan ke dalam aplikasi prediksi berbasis web. Kata Kunci: Identifikasi, Fitur Ekstraksi, Model Klasifikasi, Confusion Matrix, Aplikasi Prediksi.

Item Type: Thesis (Diploma)
Subjects: Q Science > Q Science (General)
T Technology > T Technology (General)
Depositing User: - Abdurrahman -
Date Deposited: 10 Jul 2023 01:55
Last Modified: 10 Jul 2023 01:55
URI: http://repository.unas.ac.id/id/eprint/7510

Actions (login required)

View Item View Item