Skip to main content

JAKARTA – Debat perdana capres dan cawapres telah usai digelar pada Kamis lalu, 17 Januari 2019. Namun ada yang menarik untuk dibahas dari ajang tersebut. Selama kurang lebih 90 menit proses debat berlangsung, salah satu startup UMG Idealab yakni Bahasa Kita menunjukan kemampuannya dalam mentranskrip setiap percakapan dalam debat secara real time serta menyajikan data analitik dari percakapan tersebut.

Menurut Oni Bintoro, Chief Data Scientist Bahasa Kita,
Teknologi dalam Bahasa Kita merupakan cabang ilmu komputer dan ilmu linguistik yang membahas interaksi komputer dan bahasa alami manusia yang dikenal sebagai Natural Language Processing (NLP). Dalam proses debat perdana capres dan cawapres, mesin dibantu dengan teknologi kepintaran buatan (Artificial Intelligence) untuk mentranskrip data secara akurat. Beliau juga mengklaim bahwa teknologi pada Bahasa Kita lebih pintar daripada asisten pribadi milik Google.

“Memang teknologinya ada Artificial Intelligence, jadi saat kita sedang rapat (sebelumnya) hanya bisa mentranskrip 80 persen. Akan tetapi dengan AI Notula lebih terlatih dan hampir sempurna. Jadi sebelumnya, suara kedua pasangan calon diperkenalkan lebih dahulu ke mesin Notula melalui video yang tersebar di internet.”
Lanjut Oni “Ketika notulanya sudah belajar itu butuh berapa hari untuk adaptasi. Jadi ketika di waktu berikutnya mesin mendengarkan suara kedua pasang Capres dan Cawapres ia hampir tepat. Misalnya, apapun yang diucapkan pak Jokowi itu akan ter-transkrip dengan tepat. Kalau namanya tidak terkenal memang sedikit kurang tepat,” pungkasnya.

Melalui situs resmi www.bahasakita.co.id, kita dapat mengunduh hasil transkripsi debat tersebut serta mendapat data analitik seperti: jumlah kata yang diucapkan, porsi ucapan, distribusi kata kunci, jumlah kata unik dan kata berulang dari masing masing calon.

Dari olah data Bahasa Kita, terdapat 5.744 kata yang dilontarkan oleh dari paslon Jokowi – Ma’ruf dan Prabowo – Sandi. Dari ribuan kata tersebut didapati bahwa Prabowo yang paling banyak bicara dengan persentase 40.6%, yakni total 2.332 kata dengan 684 kata unik, lalu Jokowi 39.4%, total 2.274 kata dengan 634 kata unik, Sandiaga 14.8%, total 850 kata dengan 334 kata unik, dan Ma’ruf 5.2%, total 298 kata dengan 167 kata unik.

Dalam konteks sebaran sebaran kata (Terkecuali stopword: kata hubung yang tidak memiliki makna seperti “yang”, “di”, “ke”), Prabowo didapati paling sering mengucapkan kata “hukum”, “orang” dan “kuat”, sedangkan Jokowi paling sering mengucapkan kata “hukum”, “menteri” dan “jabat”, Sandi dengan kata “hukum”, “masyarakat”, dan “kerja”, serta Maruf dengan kata “laku”, “terorisme” dan “disabilitas”.