Record Detail Back
STUDI KOMPARASI PERFORMA MODEL WAV2VEC2 dan OPENAI WHISPER UNTUK ASR (Automatic Speech Recognation) PADA PENGENALAN UCAPAN BAHASA INDONESIA
Perkembangan teknologi pengenalan ucapan otomatis (Automatic Speech
Recognition/ASR) telah membawa kemajuan signifikan dalam interaksi manusia
dan komputer, terutama melalui penerapan model berbasis deep learning. Namun,
pengenalan ucapan dalam Bahasa Indonesia masih menjadi tantangan karena
keragaman fonetik dan dialeknya. Penelitian ini bertujuan untuk membandingkan
performa dua model ASR populer, yaitu Wav2Vec2 dan OpenAI Whisper, dalam
mengenali ucapan berbahasa Indonesia. Metode yang digunakan adalah studi
eksperimen komparatif menggunakan dataset publik Mozilla Common Voice versi
11 Bahasa Indonesia. Evaluasi dilakukan berdasarkan tiga metrik utama: akurasi
transkripsi yang diukur dengan Word Error Rate (WER), kecepatan pemrosesan
(latency), dan efisiensi komputasi (penggunaan memori dan GPU). Hasil penelitian
menunjukkan bahwa Whisper memiliki akurasi transkripsi yang lebih tinggi dengan
rata-rata WER sebesar 0.08220 dibandingkan Wav2Vec2 yang memiliki WER
0.21764. Namun, dari segi kecepatan pemrosesan, Wav2Vec2 menunjukkan waktu
inferensi rata-rata yang jauh lebih cepat (sekitar 0.05 detik per sampel atau 22 kali
lebih cepat) dan lebih efisien dalam penggunaan sumber daya komputasi.
Berdasarkan hasil tersebut, Whisper lebih unggul dalam hal akurasi, sedangkan
Wav2Vec2 lebih efisien untuk aplikasi yang membutuhkan kecepatan tinggi seperti
transkripsi real-time.
Kata Kunci: Automatic Speech Recognition (ASR), Wav2Vec2, Whisper, Word
Error Rate (WER), Bahasa Indonesia, Eksperimen Komparatif
RYAN SEPTIAN GANDI - Personal Name
NONE
Text
INDONESIA
TEKNIK INFORMATIKA UNLA
2025
BANDUNG
LOADING LIST...
LOADING LIST...
APA Citation
RYAN SEPTIAN GANDI. (2025).STUDI KOMPARASI PERFORMA MODEL WAV2VEC2 dan
OPENAI WHISPER UNTUK ASR (Automatic Speech
Recognation) PADA PENGENALAN UCAPAN BAHASA
INDONESIA.(Electronic Thesis or Dissertation). Retrieved from https://localhost/etd






