Kita pernah mendengar istilah-istilah konversi dari bahasa Inggris ke bahasa Indonesia. Di sini banyak yang bermasalah mengingat keterbatasan bahasa kita. Salah satunya adalah dalam bidang Machine Learning (termasuk juga Deep Learning). Postingan ini sedikit mengupas problem yang muncul, khususnya pada skripsi/tugas akhir mahasiswa.
Prediksi
Istilah ini muncul ketika fuzzy. inference system (FIS) muncul. Istilah inference ketika diterjemahkan artinya prediksi. Nah, munculah istilah ini pada mesin-mesin yang dengan masukan variabel-variabel tertentu dihasilkan prediksinya. Nah, saat ini jika istilah ini digunakan akibatnya jadi rancu karena istilah ini sangat umum. Kita bisa saja memprediksi kurs dolar beberapa hari ke depan, bisa saja mengatakan memprediksi nilai tertentu masuk dalam kelas apa, atau memprediksi nilai kontinyu tertentu dari fitur-fitur input. Tentu saja istilah itu seharusnya diganti berturut-turut menjadi proyeksi (forcasting), klasifikasi, dan regresi.
Klasifikasi
Klasifikasi adalah proses memasukan suatu set dalam kelas-kelas tertentu, misalnya pada model deteksi kanker, suatu set data dimasukan dalam kelas positif kanker atau negatif kanker, jika dua kelas. Jika lebih dari dua kelas, bisa saja kanker, kanker jinak, bukan kanker, pengapuran, dan lain-lain. Istilahnya dulu disebut multiclass untuk membedakan yang dua kelas. Nah, saat ini model ML hampir lebih dari dua kelas, jadi istilah multiklas sudah jarang disebut, baik dalam konten apalagi dalam judul artikel ilmiah. Untuk akurasi biasanya menggunakan matrix confusion. Sekali lagi jika diindonesiakan jadi matriks kebingungan .. bingung kan??
Regresi
Regresi mirip dengan klasifikasi, hanya saja outputnya bukan kelas tapi nilai tertentu yang biasanya bilangan real pecahan. Nah, untuk mengecek akurasinya tentu saja tidak bisa dengan matriks konfusi (saya lebih suka istilah ini daripada matriks kebingungan) karena sangat sulit nebak benar angka kontinyu yang tak hingga. Biasanya menggunakan Mean square Error (MSE).
Proyeksi
Nah ini merupakan prediksi jenis lain. Atau sebaiknya kata prediksi tidak dipakai ya karena terlalu umum. Langsung saja peramalan (projection). Salah satu syarat proyeksi adalah adanya data time-series. Misalnya prediksi harga saham maka variabel yang mempengaruhi adalah harga saham itu sendiri tapi berbeda waktunya (sequantial). Walaupun saat ini proyeksi dikombinasikan dengan regresi dengan eksternal input (dalam contoh ini selain harga saham, misalnya inflasi) yang bisa saja memengaruhi nilai proyeksi.
Object Detection, Segmentasi Semantik, Instance Segmentation
Nah istilah-istilah spesifik lainnya silahkan searching di internet baik definisi maupun paper-paper yang membahasnya. Jika object detection bermaksud mendeteksi (dengan pointer tertentu, misal kotak berwarna) kelas tertentu dalam satu gambar, segmentasi dan instan segmentasi bermaksud mengklasifikasi piksel gambar/citra/video menjadi warna tertentu yang merepresentasikan kelasnya. Misalnya segmen di video jalan raya, segmentasi semantik akan memberi warna objek tertentu, misal orang, mobil/kendaraan lain, pedesterian, rambu lalulintas dan lain-lain. Bagaimana instance segmentation? Ini merupakan tingkat yg lebih advance dari segmentasi semantik yang membedakan warna pada kelas yang berbeda, instance segmentation membedakan kelas yang sama, misalnya ada tiga ayam maka ada tiga warna untuk tiap-tiap ayam.
Klasterisasi (Clustering)
Ini sangat berbeda dengan klasifikasi dkk karena di sini data yang digunakan sebagai data training tidak memiliki label/kelas tertentu. Oiya, data training merupakan bahan baku model machine learning saat proses training untuk membuat model. Jadi jangan menggabungkan Naive bayes atau KNN dengan K-Means karena merupakan domain problem yang berbeda (yang satu klasifikasi, yang lain clustering). Tentu saja ada kombinasi problem, misalnya antara SVM yang klasifikasi dengan SVR yang regressi.
Jadi ketika menggunakan istilah-istilah itu sebaiknya dipahami dahulu agar tidak membingungkan orang lain. Contoh di atas hanya sebagian saja, silahkan selidiki problem lain misalnya optimization.