Analisis Sentimen Hasil Transkripsi Audio Berbahasa Indonesia Menggunakan T5 (Text-to-Text Transfer Transformer)

Hilman Suhendar; Cepy Slamet; Undang Syaripudin

doi:10.32664/smatika.v15i01.1521

Artikel

Diterbitkan Jun 28, 2025

DOI : https://doi.org/10.32664/smatika.v15i01.1521

Halaman : 115-125
Abstract views : 33
PDF views : 22

Hilman Suhendar

UIN Sunan Gunung Djati Bandung, Indonesia

Cepy Slamet

UIN Sunan Gunung Djati Bandung, Indonesia

Undang Syaripudin

UIN Sunan Gunung Djati Bandung, Indonesia

Abstrak

Dalam era digital, analisis sentimen menjadi alat penting untuk memahami opini publik, khususnya pada data yang berasal dari media digital seperti video. Namun, analisis sentimen berbasis suara dalam bahasa Indonesia masih jarang dilakukan. Penelitian ini bertujuan untuk mengembangkan model T5 untuk analisis sentimen teks bahasa Indonesia yang dihasilkan dari konversi suara menggunakan teknologi speech-to-text. Keunggulan utama model T5 terletak pada kemampuannya untuk menangani teks panjang, memahami konteks bahasa alami, dan menyesuaikan pelatihan untuk tugas spesifik seperti analisis sentimen. Dataset penelitian diambil dari 20 video YouTube yang dipecah menjadi beberapa segmen berdurasi maksimal 15 detik, menghasilkan total 300 kalimat yang terdiri dari 150 sentimen positif dan 150 sentimen negatif. Data teks yang dihasilkan diproses menggunakan model T5 yang dilatih khusus untuk mendeteksi sentimen positif dan negatif dengan optimalisasi hyperparameter tertentu. Hasil penelitian menunjukkan bahwa model T5 mampu mencapai akurasi sebesar 83%, dengan precision 0.85, recall 0.83, dan f-measure 0.83 pada pengujian menggunakan dataset yang berbeda dari data pelatihan. Penelitian ini menunjukkan bahwa model T5 dapat diadaptasi untuk analisis sentimen berbasis suara dalam bahasa Indonesia dengan hasil yang cukup baik. Temuan ini memberikan kontribusi pada pengembangan teknologi analisis sentimen berbasis suara yang dapat diaplikasikan dalam analisis opini atau ulasan produk. Ke depan, peningkatan tahap pre-processing dan penggunaan dataset yang lebih beragam diharapkan dapat meningkatkan performa model secara keseluruhan.

Terbitan

Vol 15 No 01 (2025): SMATIKA Jurnal : STIKI Informatika Jurnal

Bagian

Articles

##submission.license.cc.by-sa4.footer##

Penulis telah menyetujui bahwa pemegang hak cipta adalah SMATIKA Jurnal. Dan Author berhak menyebarkan artikel tanpa seijin SMATIKA jurnal.

Referensi

Mempermudah Catatan Praktik Diagnosis Pasien Dengan Metode NLP,” Journal of Multidisciplinary Inquiry in Science Technology and Educational Research, vol. 1, no. 3c, pp. 1456–1463, 2024, doi: 10.32672/mister.v1i3c.1935.
[20] S. Shon, P. Brusco, J. Pan, K. J. Han, and S. Watanabe, “Leveraging Pre-trained Language Model for Speech Sentiment Analysis.”

##plugins.themes.bootstrap3.article.sidebar##

##plugins.themes.bootstrap3.article.main##

Abstrak

##plugins.themes.bootstrap3.article.details##