Jika data berukuran kecil dan sedang, dengan mudah kita mengimport suatu data dari excel, notepad, dan sejenisnya. Tetapi jika berukuran besar akan menjadi masalah jika kita mengimport data dari kedua text editor tersebut. Hal ini terjadi ketika saya akan membuat vektor dan matriks data ke dalam vormat Matlab agar bisa dilakukan text mining. Excel cenderung akan memotong data menjadi 65 ribuan record saja. Sementara notepad memiliki masalah ketika akan dieksport ke Matlab (Mat).
Langkah yang cukup akurat adalah menggunakan sistem manajemen basis data, misalnya Microsoft Access. Langkah pertama adalah membuka file data tersebut (misalnya berformat xls, atau csv) ke microsoft access untuk dilakukan pemilahan menjadi kolom-kolom yang sesuai jika data yang ada berbeda jenisnya. Jangan lupa menghilangkan Field Name dengan mengisi check pada kotak isian seperti gambar di bawah ini.
Berikutnya setelah dipilah-pilah, data kita eksport ke format text yang ada di menu Micorosft Access. Tunggu hingga selesai karena jika datanya berukuran besar (sekitar 1 giga) akan memakan waktu yang lama.
Jika selesai maka secara otomatis akan berganti menjadi pesan yang ada di access.
Berikutnya tinggal kita tarik data tersebut dengan Matlab. Buka matlab anda, dan tekan tombol impor yang ada di jendela Workspace (mudah2an tidak tersembunyi). Cari datanya, lalu lakukan proses impor dengan mudah.
Tekan tombol yang bertanda panah ke bawah dilanjutkan dengan mencari file txt yang telah disimpan sebelumnya. Untuk gampangnya, simpanlah di current directory Anda.
Berikutnya tinggal mengklik tombol Next hingga tombol finish muncul. Tampak di workspace variabel yang telah Anda masukan. Coba iseng jalankan, jangan semua record dilihat, takutnya matlab Anda hang.
Baru kali ini saya mengalami mengolah file matlab (MAT) hingga kehabisan sumber daya RAM.