Arsip Harian: 25 September 2014

Term Frequency dan Invers Document Frequency (Tf-Idf)

Karena kelemahan scoring dengan Jaccard adalah tidak disertakannya frekuensi suatu term dalam suatu dokumen, maka diperlukan skoring dengan kombinasi dari Term Frequency dan Invers Document Frequency atau disingkat tf-idf. Term Frequency (tf) Tf menyatakan jumlah berapa banyak keberadaan suatu term … Baca lebih lanjut

Dipublikasi di Data Mining, Information Retrieval | 8 Komentar

Koefisien Jaccard

Antara query dengan document perlu dihitung skor untuk mengetahui ranking hasil dari searching kita. Salah satu teknik termudah adalah dengan koefisien Jaccard. Koefisien ini mudah karena kita tinggal mencari item mana saja yang sama dibagi dengan total item keduanya. Berikut … Baca lebih lanjut

Dipublikasi di Data Mining, Information Retrieval | Meninggalkan komentar