EVALUASI KINERJA MODEL PRE-TRAINED HuBERT MENGGUNAKAN METODE BiLSTM BERBASIS WAVEFORM

Marfiano, Rafly (2026) EVALUASI KINERJA MODEL PRE-TRAINED HuBERT MENGGUNAKAN METODE BiLSTM BERBASIS WAVEFORM. Diploma thesis, Universitas Nasional.

	Text COVER.pdf Download (3MB)
	Text BAB 1.pdf Download (515kB)
	Text BAB 2.pdf Download (587kB)
	Text BAB 3.pdf Download (665kB)
	Text BAB 4.pdf Download (1MB)
	Text BAB 5.pdf Download (460kB)
	Text LAMPIRAN.pdf Download (582kB)

Abstract

Perkembangan self-supervised learning pada pemrosesan sinyal suara telah
mendorong lahirnya model pre-trained seperti HuBERT yang mampu
mengekstraksi representasi fitur ucapan secara efektif langsung dari sinyal suara
mentah (raw waveform), sehingga penelitian ini secara khusus bertujuan untuk
mengevaluasi kinerja integrasi model HuBERT dengan arsitektur Bidirectional
Long Short-Term Memory (BiLSTM) pada tugas Automatic Speech Recognition
(ASR) menggunakan dataset Bahasa Indonesia (Common Voice v13) dan Bahasa
Inggris (LibriSpeech_ASR_ASR) dalam kondisi akustik bersih maupun bising
(Gaussian noise 20 dB). Melalui tahapan metodologis yang mencakup praproses
audio bersampel 16kHz, ekstraksi fitur otomatis, pelatihan model, serta evaluasi
berbasis metrik Word Error Rate (WER) dan Character Error Rate (CER), hasil
eksperimen membuktikan bahwa penambahan lapisan BiLSTM sukses
meningkatkan akurasi model HuBERT standar di seluruh skenario pengujian.
Secara spesifik model HuBERT+BiLSTM menunjukan performa superior dengan
mengalahkan model Wav2Vec 2.0 pada dataset Bahasa Inggris dalam kondisi
bersih, dan juga noise, pada kondisi bersih HuBERT+BiLSTM meraih CER sebesar
0.0063, WER sebesar 0.2620. Dan dalam kondisi noise HuBERT+BiLSTM meraih
CER sebesar 0.0058, serta mendapatkan WER sebesar 0.2340. Namun kendati
model Wav2Vec 2.0 masih mendominasi pada dataset Bahasa Indonesia dalam
kondisi bersih dan juga berisik. Secara keseluruhan, temuan penelitian ini
memberikan konfirmasi empiris bahwa penambahan memori sekuensial dua arah
sangat efektif dalam mengoptimalkan representasi fonetik dari model HuBERT,
sekaligus menghadirkan tingkat ketahanan (robustness) yang tangguh terhadap
gangguan derau akustik.

Item Type:	Thesis (Diploma)
Subjects:	Q Science > Q Science (General) Q Science > QA Mathematics
Divisions:	Skripsi > Fakultas Teknologi Komunikasi dan Informatika > Program Studi Teknik Informatika
Depositing User:	Vira Desintha Larasati
Date Deposited:	12 May 2026 03:06
Last Modified:	12 May 2026 03:06
URI:	https://repository.unas.ac.id/id/eprint/15911

Actions (login required)

View Item