X Decision Tree

Oleh: Rahmadya Trias H., ST, MKom

Pohon keputusan (decision tree) merupakan salah satu teknik terkenal dalam data mining. Tugas paling umum yang diserahkan kepada pohon keputusan adalah klasifikasi. Dari set database kita bisa mengetahui apakah suatu nasabah merupakan nasabah yang baik atau tidak dari riwayatnya, seseorang berpeluang terkena suatu penyakit tertentu berdasarkan riwayatnya dan lain-lain.

Pohon keputusan merupakan teknik yang paling efisien. Ibaratnya, kita menyaring sesuatu lewat pohon keputusan, apakah suatu data lolos atau tidak terhadap saringan kita dengan proses yang cukup cepat. Teknik regresi sangat banyak, tetapi yang paling terkenal adalah algoritma yang diperkenalkan oleh Prof. Briemann dengan istilah The Classification and Regression Tree (CART).

10.1. Prinsip Dasar

Untuk lebih mempercepat pemahaman tentang pohon keputusan, ada baiknya kita mengambil contoh kasus data “college plan” yang meriset beberapa orang yang akan mengambil kuliah berdasarkan IQ, Paksaan Orang Tua, Ekonomi dan Gender. Sasarannya adalah kita mampu membuat pohon keputusan, apakah seseorang kemungkinan besar mengambil kuliah atau tidak berdasarkan IQ, Paksaan Orang Tua, Ekonomi dan Gender.

Masalah pertama pada pembuatan pohon keputusan adalah, variabel manakah yang menjadi akar dari pohon tersebut. Akar di sini adalah pemisah pertama dari pohon keputusan. Dikenal istilah Bayesian Score yang menilai suatu variabel, atau dalam Pohon Keputusan terkenal dengan sebutan Entropi. Entropi dihitung dengan rumusan sebagai berikut:

Akar dipilih berdasarkan nilai entropi terendah, dan berdasarkan hasil hitungan ternyata entropi terendah adalah Paksaan Orang tua. Jadi penentu pertama peluang tertinggi seseorang mengambil kuliah berdasarkan database tersebut adalah paksaan orang tua.

10.2. Penggunaan MS BI Development

Langkah pembuatan dengan Microsoft Business Intelligent Development sama dengan bab IX tentang Naive Bayes. Bedanya adalah pada saat menentukan Mining Technique, kita memilik “Microsoft Decision Tree”. Pilih ID sebagai Key, kemudian pilih semua variabel sebagai input, prediksi kita pilih “College Play” yang berisi data “yes” atau “no”.

Coba Sendiri !!!

Gambar 10.1. Hasil Mining

IX Naive Bayes

Oleh: Rahmadya Trias H., ST, MKom.

Algoritma bayes mempelajari kejadian-kejadian dari rekaman database dengan cara memperhitungkan korelasi antara variabel yang dianalisa dengan variabel-variabel lainnya. Hasilnya adalah kita dapat memprediksi sesuatu, misalnya apakah seseorang berasal dari golongan tertentu berdasarkan variabel-variabel yang melekat padanya. Selain itu, naive bayes dapat juga menganalisa variabel-variabel yang paling mempengaruhinya dalam bentuk peluang.

9.1. Algoritma

Naive bayes memanfaatkan teori peluang, yakni jika diketahui suatu hipotesa H dengan kejadian tentang hipotesa E, maka kita dapat mengkalkulasi probabilitas dari H dengan formula:

Atau secara sederhana dapat dikatakan bahwa probabilitas dari hipotesa kita terhadap suatu kejadian sama dengan probabilitas kejadian yg memberikan hipotesis dikalikan dengan probabilitias hipotesa yang kemudian dinormalkan.

9.2. Naive Bayes dengan Microsoft BI Development

Dengan Ms BI Development kita diberika empat views yang menggambarkan data yang kita “Mining”, antara lain:

Dependency Net
Attribute Profiles
Attribute Characteristics
Attribute Discrimination

Berikut adalah prosedur yang kita lakukan:

Buka MS BI Development
Buat Project dengan cara File – New – Project, Piliha “Analysis Services”.

Gambar 9.1. New Project Creation

Klik kanan “Data Source” pada Solutian Explorer lalu pilih database yang akan diambil (New Data Source). Cari data provider yang sesuai, dalam hal ini microsoft jet 4 OLE DB Provider.
Klik Next, dilanjutkan dengan mengklik “New”

Gambar 9.2. Mengambil Database Yg akan Diolah

Jangan lupa pada “Impersonation Information” diklik “Use the Service account” jika tidak kita password.
Berikutnya klik kanan pada “Data Source View” dilanjutkan “New Data Source View”. Pilih Data Source yang telah kita buat sebelumnya.
Langkah terakhir dan terpenting adalah memasukkan Mining Structure dengan mengklik kanan “Mining Structure” dilanjutkan dengan “New Mining Structure”.
Klik Next, hingga saat dijumpai pilihan “Mining Technique” Pilih Microsoft Naive Bayes.
Pilih Key, Input dan Predict yang sesuai lalu klik “Sugest” untuk menganalisa variabel-variabel mana yang paling tinggi peluangnya sekaligus paling berpengaruh terhadap prediksi dari partai mana seseorang.

Gambar 9.3. Sugest Related Columns

Klik “Process Mining …” untuk memproses Data Mining. Klik “Yes” dilanjutkan dengan proses Mining. Tunggu hingga selesai.
Klik “RUN” saat selesai, tunggu sesaat dan jika telah selesai “CLOSE” hasil Running.
Klik tab “Mining Model Viewer” akan menghasilkan Dependency network sebagai berikut:

Gambar 9.4 Dependency Network

Coba sendiri dengan data yang lainnya.

Pertemuan XII: TUGAS

Buat tulisan di blog masing-masing yang isinya login (jangan disertai pasword) di:

1. Facebook/twitter

2. Millis – kaskus.us/indowebster.com

3. digilib.itb.ac.id

4. storage: ziddu.com/4shared.com

FIS – ANFIS – NEURAL NETWORK DGN MATLAB

Riset yang berkaitan dengan Soft Computing saat ini sedang marak dari bidang sains, teknik hingga kedokteran. Sedangkan buku yang berisi penerapan langsungnya dirasa jarang, apalagi yang berbahasa Indonesia. Oleh karena itu, rencananya Kami akan membuat buku panduan pengguanaan MATLAB berbasis GUI tentang bidang-bidang Soft Computing yang terkenal yaitu FIS, ANFIS dan NN. Berikut ini rancangan buku tersebut, kami mengharapkan masukan dari siapapun .. Bismillahirrohmaanirrohiim.

Judul:
Penerapan Logika Fuzzy dan Jaringan Syaraf Tiruan berbasis GUI dengan MATLAB

DAFTAR ISI

Kata Pengantar
Daftar Isi
I. Teori Dasar Fuzzy Inference System (FIS)
1.1.
1.2.
…
1.x. Studi Kasus Penerapan FIS dengan MATLAB

II. Teori Dasar Adaptive Neuro-Fuzzy Inference System
(ANFIS)
2.1.
2.2.
…
2.x. Studi Kasus Penerapan ANFIS dengan MATLAB

III. Teori Dasar Jaringan Syaraf Tiruan
3.1.
3.2.
…

3.x. Studi Kasus Penerapan Jaringan Syaraf Tiruan dengan MATLAB
IV. Kompilasi
4.1. Project Deployment
4.2. Packaging

Penutup
Daftar Pustaka

S	S	R	K	J	S	M
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

S	S	R	K	J	S	M
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30