Natural Language Processing

Natural Language Processing (NLP) merupakan istilah lain dari computational linguistic dimana bahasa dikenali atau diproses dengan bantuan komputer. Tentu saja perlu pemahaman yang baik tentang teori bahasa yang melibatkan tata bahasa (grammar), semantik dan fonetik. Bahasa sendiri terdiri dari dua pokok yaitu berbicara (speaking) dan bacaan/tulisan (text).

Peran Machine Learning

Ada istilah classical computational linguistic. Istilah klasik berarti menggunakan komputasi model lama. Model lama di sini memang karena sudah dikembangkan sejak dulu. Teori bahasa dan otomata merupakan induk dari metode komputasi klasik. Sempat juga belajar, dari otomata, teori bahasa formal, hingga mesin turing. Sulit juga ternyata, karena melibatkan teorema-teorema yang tidak disukai oleh orang teknik (misalnya: for all .. there exist … dan sejenisnya), mungkin kalau orang MIPA sudah terbiasa.

Perkembangan yang lebih modern melibatkan statistik, sehingga dikenal dengan Statistical Natural Language Processing. Statistik mulai diterapkan dalam NLP karena melibatkan data-data yang berukuran besar sehingga melibatkan teori-teori statistik dalam komputasinya. Teori-teori probabilitas sangat penting karena berguna dalam melakukan suatu inferensi/perkiraan. Tetapi karena karakter bahasa yang fleksibel dan terkadang melibatkan hal-hal yang tidak pasti, tidak lengkap, dan sejenisnya yang sulit dikelola dengan statistik, membuat peran fuzzy dan teori-teori soft computing lainnya kian penting. Akibatnya peran machine learning dalam NLP saat ini kian penting. Dalam penerapannya machine learning biasanya digunakan untuk menangani data teks dan membuat suatu sistem yang menyerupai manusia dalam bekerja dengan bahasa alami.

Deep Learning dalam NLP

Saat ini Jaringan Syaraf Tiruan (JST) lebih disukai untuk mengelola NLP karena memiliki karakteristik yang robust. JST itu sendiri merupakan komponen utama dari subyek deep learning, yaitu JST yang melibatkan lapisan yang banyak (multilayer). Lihat post terdahulu tentang apa itu deep learing.

Penerapan dan Riset NLP Saat Ini

Jadi kesimpulannya, saat ini riset tentang NLP berkecimpung dengan machine learning yang mengelola input berupa teks dan output yang berupa bahasa yang semirip mungkin dengan manusia (natural language). Bidang ini dapat diterapkan ke dalam pembelajaran jarak jauh (PJJ) dalam mengelola naskah-naskah yang menjadi alat komunikasi antara siswa dengan tutor online. Dulu sempat jadi proposal disertasi saya sebelum beralih ke data spasial. Siapa tahu ada yang berminat dan mencoba melakukan riset PJJ (lihat riset tentang ini) yang melibatkan machine learning atau soft computing. Jawaban siswa yang menjiplak, absen online, dan lain-lain dapat ditangani dengan cepat dan akurat lewat bantuan soft computing. Semoga pembaca tertarik.

Referensi:

https://machinelearningmastery.com/natural-language-processing/

Iklan