Matlab selain digunakan untuk perhitungan angka ternyata dapat juga digunakan untuk mengolah kata dalam Text Data Mining (TDM). Singkat saja, di sini kita buat data yang berisi sepuluh nama orang yang akan kita searching.
Kita akan mencari beberapa nama yang ada unsur “abdul”, misalnya, terlebih dahulu, konversi menjadi huruf kecil semua dengan fungsi lower.
Perhatikan, seluruh record menjadi huruf kecil semua, berikutnya kita membuat script yang akan digunakan untuk mencari orang yang ada unsur nama ‘abdul’-nya, kemudian memunculkan kode author beserta nama lengkapnya dalam satu matriks.
Sebelumnya Anda harus memasukkan terlebih dahulu vektor kode author (di sini dengan nama auth1) yang sesuai dengan nama author. Perhatikan cara penggunaan fungsi regular expression yang tersedia di Matlab (regexp).Copy kode tersebut kemudian jalankan di command window:
Berikutnya tugas berat menanti, di sini keywoard untuk mencari sudah tersedia, yakni contohnya ‘abdul’. Bagaimana jika kata kuncinya berdasarkan tiap record. Misalnya kita akan mencari dari sekumpulan nama-nama yang bernama belakang ada yang sama.