Scikit-learn menyediakan modul Neural Network (NN) untuk melakukan klasifikasi data iris menggunakan algoritma MLPClassifier (Multilayer Perceptron Classifier). Algoritma ini memungkinkan pengguna untuk membangun model jaringan saraf tiruan dengan mempertimbangkan parameter seperti jumlah lapisan, jumlah neuron pada setiap lapisan, dan aktivasi fungsi untuk setiap neuron. Namun, saat ini penggunaan Tensorflow lebih dominan dari pada MLPClassifier.
Alur preprocessing dengan StandardScaler untuk klasifikasi dengan TensorFlow Neural Networks umumnya terdiri dari beberapa tahapan, yaitu:
-
Import library: Pertama, kita harus mengimpor library TensorFlow dan Scikit-learn (yang berisi StandardScaler) ke dalam program Python.
-
Load data: Data iris (atau data lain yang akan diklasifikasikan) harus dimuat ke dalam program Python. Data ini kemudian akan diproses dan dimasukkan ke dalam model jaringan saraf tiruan TensorFlow.
-
Preprocessing: Langkah berikutnya adalah preprocessing data menggunakan StandardScaler. StandardScaler melakukan normalisasi data dengan mengubah rata-rata menjadi nol dan standar deviasi menjadi satu. Ini membantu mempercepat proses konvergensi dan mengurangi dampak outlier pada hasil klasifikasi.
-
Split data: Data yang sudah di-preprocessing kemudian dibagi menjadi data latih dan data uji. Data latih digunakan untuk melatih model, sedangkan data uji digunakan untuk menguji performa model.
-
Definisikan model: Model TensorFlow Neural Networks didefinisikan dengan menentukan jumlah lapisan dan jumlah neuron pada setiap lapisan. Kemudian, fungsi aktivasi untuk setiap neuron ditentukan.
-
Latih model: Model kemudian dilatih dengan data latih menggunakan fungsi optimizer dan fungsi loss untuk menghitung gradien dan memperbarui bobot dan bias jaringan saraf.
-
Evaluasi model: Setelah model dilatih, model dievaluasi dengan data uji untuk mengukur akurasi, presisi, dan metrik lainnya.
Dengan menggunakan alur ini, kita dapat mengklasifikasikan data iris (atau data lainnya) menggunakan TensorFlow Neural Networks dengan tingkat akurasi yang lebih baik. Preprocessing data menggunakan StandardScaler membantu meningkatkan kinerja model dan membuatnya lebih stabil. Berikut ilustrasi pembuatannya.