Apa itu Linguistik Komputasi?

Linguistik komputasional adalah bidang umum yang mencakup banyak aspek psikologi, linguistik, logika, dan ilmu komputer. Hal ini berkaitan dengan membantu komputer memahami masalah linguistik agar menjadi lebih baik dalam mengotomatisasi aspek terjemahan, generasi, ucapan dan pemahaman.

Pria memegang komputer

Linguistik komputasi lahir setelah sejumlah upaya gagal pada terjemahan otomatis. Pada akhir 1940-an, pemerintah AS melihat kebutuhan untuk terjemahan teks yang ditangani mesin, terutama teks Rusia. Diasumsikan, mengingat kemudahan komputer yang telah diadaptasi untuk menangani masalah matematika, mengajar mereka untuk menerjemahkan bahasa akan menjadi urusan yang sederhana. Dengan cepat menjadi jelas bahwa masalahnya jauh lebih sulit, bagaimanapun, dan disiplin linguistik komputasi diciptakan.

Pada hari-hari awal linguistik komputasi, bidang ini didominasi oleh ilmuwan komputer. Namun, sejak tahun 1970-an, menjadi jelas betapa rumitnya bahasa sebenarnya, dan linguistik komputasional kontemporer memanfaatkan para ahli dari sejumlah bidang.

Terjemahan mesin selalu menjadi tujuan utama linguistik komputasi, dan salah satu bidang yang telah membuat kemajuan besar. Tugasnya sangat kompleks, membutuhkan identifikasi bagian-bagian ucapan, pemahaman tata bahasa, kosakata yang luas, dan mekanisme untuk menangani bahasa sehari-hari dan bahasa gaul. Terjemahan mesin jauh dari sempurna, tetapi setiap tahun terjemahan menjadi lebih akurat dan tidak terlalu dipaksakan.

Pengenalan ucapan adalah bidang lain dari linguistik komputasi yang telah menarik banyak minat publik. Setelah beberapa upaya yang gagal pada perangkat lunak pengenalan suara arus utama pada pertengahan 1990-an, bidang itu menjadi sunyi untuk sementara waktu. Namun, pada awal abad ke-21, sejumlah rangkaian perangkat lunak pengenalan suara baru tiba di pasar dengan sistem pembelajaran yang ekstensif dan tingkat akurasi yang tinggi. Hal ini telah menyebabkan minat baru dalam perangkat lunak pengenalan suara oleh masyarakat umum dan peningkatan yang menyertainya dalam pendanaan dan penelitian.

Generasi pidato adalah bidang terkait linguistik komputasi yang telah melihat perkembangan yang stabil sejak tahun 1980-an. Mencapai pembacaan teks tertulis yang terdengar alami adalah masalah yang sangat sulit, tetapi memiliki potensi manfaat yang sangat besar. Untuk pengguna yang tidak dapat melihat, perangkat lunak generasi ucapan dapat menjadi penting untuk menikmati buah dari era digital.

Linguistik komputasional juga memainkan peran besar dalam sistem koreksi tata bahasa otomatis, seperti yang terintegrasi ke dalam pengolah kata paling populer. Pemeriksa tata bahasa yang akurat membutuhkan kemampuan canggih untuk mengidentifikasi bagian-bagian ucapan dan daftar lengkap aturan tata bahasa dan pengecualian. Sementara sebagian besar pemeriksa tata bahasa arus utama masih memiliki banyak masalah, mereka sudah menjadi sangat diperlukan bagi banyak orang di generasi baru.

Linguistik komputasional adalah bidang yang menarik dari berbagai disiplin ilmu. Masalah yang harus ditanganinya banyak, dan tidak ada yang sederhana. Visi futuris yang diharapkan, bagaimanapun, membuatnya menjadi perjuangan yang berharga. Dari impian penerjemah universal hingga pengenalan ucapan yang sempurna, tujuan linguistik komputasional tidak dapat tidak membangkitkan rasa takjub.