EVALUASI KINERJA MODEL PRE-TRAINED WAV2VEC 2.0 BERBASIS WAVEFORM UNTUK ASR BAHASA INDONESIA DAN PERBANDINGANNYA DENGAN PENDEKATANEKSTRAKSI FITUR

Wijaya, Adam (2025) EVALUASI KINERJA MODEL PRE-TRAINED WAV2VEC 2.0 BERBASIS WAVEFORM UNTUK ASR BAHASA INDONESIA DAN PERBANDINGANNYA DENGAN PENDEKATANEKSTRAKSI FITUR. Bachelor thesis, Universitas Nasional.

[img] Text
COVER.pdf

Download (1MB)
[img] Text
BAB I.pdf

Download (680kB)
[img] Text
BAB II.pdf

Download (1MB)
[img] Text
BAB III.pdf

Download (969kB)
[img] Text
BAB IV.pdf

Download (1MB)
[img] Text
BAB V.pdf

Download (428kB)
[img] Text
LAMPIRAN.pdf

Download (1MB)

Abstract

Penelitian ini menilai efektivitas model Wav2Vec 2.0 dibandingkan dengan pipeline tradisional MFCC + RASTA-PLP untuk pengenalan suara otomatis (ASR) bahasa Indonesia. Evaluasi dilakukan menggunakan 5.041 rekaman audio, baik yang bersih maupun yang telah ditambahkan noise Gaussian, semuanya disampling pada 16 kHz. Hasil penelitian menunjukkan bahwa Wav2Vec 2.0 memiliki performa yang lebih baik pada kedua kondisi pengujian. Pada pemrosesan audio bersih, Wav2Vec 2.0 secara signifikan menurunkan character error rate (CER) dari 0,6350 menjadi 0,1332 dan word error rate (WER) dari 0,9837 menjadi 0,4999. Dalam kondisi bising, dengan rata-rata noise Gaussian sebesar 3,28%, performanya tetap kuat dengan CER sebesar 0,1600 dan WER sebesar 0,5575. Tingkat kesalahan ini secara konsisten lebih rendah dibandingkan pipeline Hybrid. Meskipun model self-supervised Wav2Vec 2.0 memerlukan investasi komputasi yang lebih besar, yakni waktu pemrosesan selama 11 jam 2 menit serta penggunaan memori sebesar 10,7 GB (sekitar 7,5 kali lebih lama dan 1,2 kali lebih besar dibandingkan pendekatan Hybrid), akurasi yang lebih unggul serta ketahanan terhadap noise dianggap sebagai pertukaran yang adil atas biaya komputasi tambahan tersebut. Temuan ini menunjukkan bahwa model self-supervised berbasis waveform seperti Wav2Vec 2.0 merupakan pilihan yang layak dan sering kali lebih unggul untuk aplikasi ASR bahasa Indonesia. Model ini sangat bermanfaat terutama pada kondisi bising atau lingkungan dengan keterbatasan sumber daya, di mana akurasi dan ketangguhan menjadi faktor yang sangat penting.

Item Type: Thesis (Bachelor)
Subjects: Q Science > Q Science (General)
T Technology > T Technology (General)
Divisions: Skripsi > Fakultas Teknologi Komunikasi dan Informatika > Program Studi Teknik Informatika
Depositing User: Miss Rahma Rahmawati
Date Deposited: 23 Sep 2025 03:32
Last Modified: 23 Sep 2025 03:32
URI: http://repository.unas.ac.id/id/eprint/14184

Actions (login required)

View Item View Item