Mereview Paper

Sejak sekolah dasar kita sudah diajari membaca dan menulis. Ya, belajar membaca dulu baru menulis karena tanpa bisa membaca tidak mungkin bisa menulis, kecuali Cak Lontong dalam lawakannya mengatakan bahwa dia akan berencana menulis satu buku. Ketika diingatkan oleh rekannya bahwa dia sejak dahulu tidak bisa membaca, dengan santainya dia bilang “aku yang menulis, kan orang lain yang membaca”.

Membaca, Menulis dan Mereview

Me-review itu sendiri adalah proses membaca. Bedanya di sini kita harus bisa menemukan “sesuatu” dalam tulisan yang kita baca. “Sesuatu” di sini bukan sekedar informasi yang terkandung dalam suatu tulisan melainkan hal-hal lain yang luput dari sekedar membaca, antara lain: keunikan, orisinalitas, kekuatan dan kelemahan, temuan, dan hal-hal lain yang biasanya diminta ketika kita mereview suatu tulisan, khususnya artikel ilmiah. Biasanya yang perlu diperhatikan adalah novelty, metode, bahasa, research question, dan yang tak kalah penting adalah apakah artikel tersebut layak diterima pada jurnal/prosiding.

Suasana ketika mereview (sumber Fb Prof Teddy – Sampoerna Univ.)

Sebaiknya seorang reviewer paper adalah seorang yang sudah banyak menulis paper. Jika pernah menulis maka akan memahami kesullitan-kesulitan apa saja yang dihadapi ketika menulis. Hasil review nya pun akan sangat membantu si penulis tersebut, walaupun menyakitkan karena ditolak. Berbeda ketika yang mereview kurang banyak menulis atau bahkan tidak memiliki tulisan. Reviewer ini sulit menghargai sebuah tulisan yang memang dibuat terkadang sampai “berkeringat darah”.

Membaca Cepat

Membaca cepat bukan suatu keharusan, melainkan suatu kebutuhan. Bayangkan dalam setengah hari, terkadang dibutuhkan review sebanyak hampir 30 judul artikel, terutama jika ditunjuk menjadi Technical Program Committee (TPC) yang bertugas memutuskan suatu artikel secara keilmuwan layak publish atau tidak. Tentu saja cepat di sini bukan asal cepat secepat-cepatnya, melainkan bijaksana. Ketika membaca hal-hal yang kurang penting mungkin sekelebat, tetapi ketika melihat hipotesa, metode, dan hasil mungkin perlu di-rem sedikit.

Tahan Membaca

Ini tidak kalah penting. Percuma membaca cepat sekali tetapi baru setengah jam sudah KO, gagal fokus, dan menguap terus. Salah seorang pengacara kondang (sayangnya sekarang mendekam di penjara) memiliki kemampuan membaca berkas perkara setebal kitab suci hanya dalam waktu 30 menit. Saya yakin kemampuan itu karena seringnya dia membaca, dan yang pasti senang dengan apa yang dia baca. Naskah doctoral tesis saya dibaca oleh external examiner dari Jepang hanya dalam waktu beberapa hari. Atau mungkin dalam beberapa jam pelaksanaannya. Bukan Cuma skimming atau sekilas, tetapi serius dibaca kata perkata. Memang diakui, negara lain memiliki kemampuan membaca di atas kemampuan membaca negara kita.

Mungkin itu saja sharing informasi ketika sibuk mereview naskah untuk konferensi, siapa tahu bermanfaat. Perlu diketahui, dengan membaca naskah-naskah jurnal, banyak ide-ide yang dapat kita ambil sebagai pelajaran, walau sekecil apapun. Jangan lupa membaca. Jika Anda sampai membaca kalimat terakhir ini, maka berarti sudah dianggap gemar membaca, he he, dibanding kawan-kawan kita yang jadi korban hoax karena hanya baca judul-nya saja dari berita yang dishare lewat medsos.

Iklan

Matrix Confusion pada Matlab

Matriks Confusion digunakan untuk mengukur akurasi dan memvalidasi model yang dibuat. Untuk menghitungnya dapat dilihat pada rumus yang disertakan pada pos terdahulu. Untuk mempermudah perhitungan, Matlab menyediakan fasilitas untuk menghitung matriks confusion ini.

Data Aktual Versus Data Prediksi

Untuk membuat matriks confusion diperlukan dua data yaitu data real/aktual dan data prediksi yang dihitung dari model. Berikut ini contoh data yang akan dibuat matriks confusion-nya. Buka command window dan masukan kode berikut (

  • yaktual=transpose([0 1 1 0 1 1 1 0]);
  • yprediksi=transpose([1 1 1 0 1 0 1 0]);

Untuk membuat matriks confusion, dibutuhkan fungsi confusionmat yang memerlukan dua data masukan tersebut di atas. Jalankan kode berikut:

  • [matriks,label]=confusionmat(yaktual,yprediksi)
  • matriks =
  • 2 1
  • 1 4
  • label =
  • 0
  • 1

Perhatikan matriks berwarna merah di atas, tampak matriks confusion sebagai berikut:

Jadi dapat diketahui a, b, c, dan d berturut-turut 2, 1, 1, dan 4. Jadi dapat dihitung recall, precision, false positive, false negative.

Recall atau dengan nama lain True Positif:

TP=4/(1+4)=4/5=0.8. Nilai lain dengan mudah dapat dihitung.

Kasus Lebih dari Dua Label

Matriks Confusion bisa juga untuk kasus lebih dari dua label. Misal ada dua data dengan tiga label, matriks confusion-nya adalah:

  • yaktual=transpose([0 1 1 2 1 2 1 0]);
  • yprediksi=transpose([0 1 2 2 1 2 1 0]);
  • [matriks,label]=confusionmat(yaktual,yprediksi)
  • matriks =
  • 2 0 0
  • 0 3 1
  • 0 0 2
  • label =
  • 0
  • 1
  • 2

Tampak pada matriks confusion label 2 ada satu error. Precision-nya = 2/(1+2) = 2/3 (lihat rumus di pos yang lalu). Semoga bermanfaat.

Mengukur Akurasi – Confusion Matrix

Untuk proyeksi yang prediksinya berupa data kontinyu, kebanyakan menggunakan Mean Absolute Percent Error (MAPE). Untuk mengukur hasil uji yang berisi True dan False Positive atau Negative diperlukan matriks Receiver Operating Characteristic (ROC). Tetapi jika datanya diskrit atau berupa kelas, misalnya baik, cukup, kurang, maka biasanya peneliti menggunakan matriks confusion.

Dasar-Dasar Matriks Confusion

Paling mudah adalah dengan menggunakan data dua kategori: Positif dan Negatif. Seperti tampak pada gambar di bawah ini, Lihat rujukannya.

Secara logika, akurat bila aktualnya a dan diprediksi a atau aktualnya d dan diprediksi tepat d. Namun sebelumnya perlu mengetahui istilah recall dan precision.

Recall. Dikenal dengan istilah true positive rate (TP) proporsi kasus positif (d) yang secara akutal teridentifikasi (c dan d). Jadi rumusnya:

Precision. Adalah proporsi prediksi positif yang tepat dengan seluruh prediksi positif (b dan d). Rumusnya:

False Positif (FP). Istilah ini banyak digunakan untuk pengecekan biometriks, seperti sidik jari. Nilai ini besar jika banyak sidik jari yang harusnya dimiliki orang lain tetepi diakui oleh yang diuji. Rumusnya adalah perbandingan atas kesalahan yang harusnya negatif (milik orang lain) tetapi diaku miliknya (b):

False Negatif (FN). Adalah kebalikan dari false positif.

True Negatif (TN). Mirip recall tetapi yang dibandingkan adalah negatifnya.

Sekian postingan tentang matiks confusion, mudah-mudahan bisa menjadi sitasi cepat jika lupa istilah-istilah di atas. Postingan berikutnya akan dibahas penggunaannya dalam Matlab.

Polemik Jurusan Sistem Informasi

Di bidang informasi dan komputer (INFOKOM) dikenal dua jurusan yang biasanya ada bersamaan di kampus-kampus yaitu: Teknologi Informasi dan Sistem Informasi, selain tiga lainnya (ilmu komputer, teknik komputer, dan rekayasa perangkat lunak). Di antara kelima bidang infokom tersebut (terkadang diistilahkan dengan “computing”) yang paling membingungkan adalah sistem informasi (information system). Bukan hanya membingungkan bagi para mahasiswa, bahkan dosen/pengajarnya pun memiliki pendapat-pendapat yang berbeda. Bahkan tanggal 2 Juli 2018 nanti akan diadakan pertemuan para kaprodi SI untuk merumuskan kurikulum SI ke depan dan membedakannya dengan jurusan-jurusan lainnya, terutama tetangga terdekatnya yaitu teknologi informasi.

Banyak referensi-referensi yang mendefinisikan secara rinci apa itu sistem informasi. Salah satunya dari [1] yang secara sederhana merinci komponen sistem informasi harus mencakup komponen-komponen berikut:

  • Perangkat Keras
  • Perangkat Lunak
  • Data
  • Orang
  • Proses

Karena cakupannya tersebut, SI menjadi rancu karena terkadang hanya beberapa bagian saja yang dibahas, padahal akan tumpang tindih dengan dengan jurusan lain, misalnya jika hanya membahas perangkat keras, lunak dan data maka akan berimpitan dengan jurusan teknologi informasi. Mungkin video promosi ini sedikit memperkenalkan apa yang dipelajari di jurusan SI.

Karena konten yang ada aspek sosialnya (manusia), maka SI terkadang membutuhkan ilmu-ilmu sosial dan cenderung “lebih mudah” karena tidak terlalu matematis. Hasilnya beberapa kampus yang membuka dua jurusan SI dan TI banyak yang lebih suka memilih TI ketimbang SI. Mungkin salah satunya adalah gengsi. Hal-hal berikut mungkin perlu dilakukan para praktisi atau dosen yang memilih SI sebagai kompetensi, termasuk saya.

Bangga Terhadap Bidang Sistem Informasi

Riset TI memang menantang, menarik, dan perkembangannya sangat cepat. Sebenarnya karena TI bagian dari SI (hardware, software, dan data) maka perkembangan SI pun otomatis cepat pula. Bahkan dulu Apple menciptakan Ipad terlebih dahulu dibanding Iphone. Setelah Ipad siap diluncurkan, divisi SI melakukan riset dan ternyata banyak yang meminta perangkat kecil. Alhasil divisi TI menswitch ke pembuatan Iphone lebih dahulu, dan ternyata sukses. Bayangkan tanpa ada peran SI waktu itu. Selalu, aspek finansial menjadi fokus. Barang canggih seperti apapun jika tidak ada yang suka dan membelinya, akan di-grounded juga.

Masalah lainnya biasanya karena TI dan SI dalam satu fakultas/divisi yang sama, cenderung kurikulum tidak jauh berubah. Banyak kejadian mahasiswa yang pindah jurusan dari SI ke TI karena merasa bobotnya sama tetapi kesan kuliah TI lebih “OK” dibanding SI. Ada dua kemungkinan, TI yang agak melenceng ke SI atau SI yang tidak bisa menemukan core utama jurusan SI. Namun tentu saja ada pembobotan/proporsi antara teori dan aplikasi di jurusan SI [2], [3]. Perhatikan sistem dan struktur lebih fokus ke sisi aplikasi (terapan).

Cukup Sistem Informasi saja, Jangan Dipecah Lagi

Saya termasuk yang baru masuk ke jurusan SI (karena kuliah di field of study: information management). Karena sifatnya yang general, ternyata muncul jurusan-jurusan baru yang keluar dari SI karena aspek penamaan yang lebih menjual, seperti IT bisnis, bisnis digital, e-learning, dan lain-lain. Sebenarnya sistem informasi geografis (SIG) itu bagian dari SI, termasuk IT bisnis dan sejenisnya. Karena sudah terbentuk ya menurut saya tidak jadi masalah, tapi untuk yang mau membentuk sebaiknya ditahan dulu. Memang presiden Jokowi mengeluarkan ide jurusan kopi, jurusan toko online, dan sejenisnya. Seperti yang diucapkan Prof. Ucok, sebenarnya ilmu dasarnya kan sama saja, tinggal diberi saja mata kuliah atau konsentrasi itu. Termasuk sistem informasi kopi .. kalau mau, he he. Mengapa ini penting, sebab tidak tertutup kemungkinan jurusan SI akan musnah karena masih-masing mencetuskan jurusan-jurusan uniknya.

Yuk .. Gabung ke Sistem Informasi

Memang jurusan SI merupakan jurusan unik yang multidisiplin. Banyak melibatkan ilmu-ilmu lain. Dan saya yakin banyak dosen-dosen yang sebenarnya SI tetapi memilih TI sebagai core riset yang diminatinya. Bagi yang lebih suka ngajar yang berbau analis, manajemen-manajemen, dan risetnya di decision support system (DSS), Structural Equation Modelling (SEM), dan sejenisnya, perlu berifikir lagi apakah terus di TI atau SI. Sekian, semoga bisa jadi referensi.

Referensi

[1]    D. T. Bourgeous, “What Is an Information System?,” Inf. Syst. Bus. Beyond, pp. 5–64, 2014.

[2]    T. D. Susanto, Sebuah Kajian Akademik Berdasarkan Dokumen Computing Curricula 2005 Computing sebagai sebuah Rumpun Ilmu. 2005.

[3]    H. Topi, J. s. Valacich, R. T. Wright, and K. M. Kaiser, “Is 2010,” 2010.

Scopus vs Thomson – Mana yg Lebih Baik?

Ketika berbicara mengenai pengindeks internasional, tidak akan lepas dari dua nama pengindeks yaitu Scopus dan Thomson. Keduanya merupakan pengindeks terbaik di dunia. Thomson, yang dikenal dengan Web of Science (WoS) sudah lama muncul, tetapi Scopus mulai menarik minat para peniliti dunia sejak kemunculannya di tahun 2004. Postingan ini muncul karena grup WA ada yang share berita bahwa jurnal tidak harus terindeks Scopus, via media indonesia online link berikut.

Disebutkan bahwa ada alternatif pengindeks lain selain Scopus, yaitu JJ Thomson dan Copernicus. Saya sedikit tersenyum karena Thomson justru menurut saya lebih sulit dimasuki. Ibarat minta keringanan malah dikasih yang lebih berat. Mungkin Copernicus lebih mudah, tetapi banyak terindikasi jurnal-jurnal predator di dalamnya, info dari wikipedia ini. Mungkin paper berikut bisa menjelaskan perbandingan antara Scopus dengan Thomson. Unik juga ada paper yang membahas pengindeksnya, ibarat menulis tentang baik buruknya WordPress lewat postingan di WordPress. Mana yang lebih baik? Scopus atau Thomson, Yuk .. dibaca.

Menulis Artikel Ilmiah atau Menulis Buku?

Kalau kita perhatikan dunia pendidikan tinggi di lingkungan kampus kita masing-masing, akan tampak dosen yang pakar dengan bidang tertentu seperti mengelola jaringan, membuat web, atau aplikasi lainnya. Tetapi mereka minim sekali mempublikasikan artikel ilmiah (yang bukan buku). Mengapa bisa terjadi? Postingan ringan kali ini hanya analisa singkat mengenai fenomena ini.

Buku & Kepakaran

Dari taman kanak-kanak kita sudah mengenal buku. Dari yang berisi informasi hingga panduan mengerjakan sesuatu. Buku biasanya berisi ilmu-ilmu yang sudah established atau sudah fix, hampir tidak ada perdebatan besar mengenai kontennya. Pengarang dalam menulis buku mengandalkan kepakaran dan pengalamannya. Namun tentu saja tanpa sesuatu hal baru, penulis buku tidak bisa menulis suatu artikel ilmiah di jurnal atau seminar-seminar. Coba saja menulis artikel yang isinya pembahasan materi dari buku, sudah dipastikan akan ditolak oleh pengelola jurnal. Kecuali kalau memang jurnal itu kekurangan tulisan, tentu saja dengan modifikasi di sana sini.

Jurnal ilmiah

Jika buku biasanya ilmu-ilmu yang sudah baku berasal dari puluhan tahun lalu, jurnal berisi temuan-temuan baru kurang dari sepuluhan tahun. Bahkan artikel yang baru terbitpun sesungguhnya diteliti sekitar satu hingga tiga tahun, tergantung berapa lama proses revisinya. Bahkan ada naskah yang proses revisi hingga sembilan tahun.

Aktif Menulis Buku & Artikel Ilmiah

Jadi apakah penulis buku yang kebanyakan pakar berpengalaman tidak bisa menulis artikel ilmiah di jurnal dan sebaliknya penulis aktif di jurnal kesulitan menulis buku? Menurut saya baik menulis buku maupun jurnal bisa oleh penulis yang sama. Sedikit penjelasannya adalah berikut ini.

Ambilah contoh seorang pakar menggali sumur pantek di perumahan. Dia memiliki segudang pengalaman dalam membuat sumur itu. Tentu saja dia bisa membuat buku mengenai tatacara menggali dan menemukan lokasi sumurnya. Tetapi untuk menghasilkan suatu artikel ilmiah dia harus menemukan hal-hal baru ketika melakukan aktivitas menggalinya. Ditambah dia harus aktif mengikuti perkembangan terbaru masalah gali menggali. Jika dia hanya fokus ke menggali sumur, beres, menerima bayaran, dia tidak akan bisa menemukan hal-hal baru dan menulisnya dalam suatu artikel ilmiah. Begitu juga dengan seorang dosen, misalnya mengajar jaringan komputer. Jika dia hanya berfokus mengajar “crimping”, setting IP, dan sejenisnya saja, atau sekedar menjalankan tugas me-maintain jaringan di institusinya, tentu saja tidak bisa dihasilkan suatu artikel ilmiah tanpa hal-hal baru dan mengikut perkembangan jaringan komputer terkini lewat jurnal-jurnal.

Terus terang ketika studi, saya mendapati rekan-rekan yang jago di mata kuliah tertentu, tetapi ketika riset mengalami kesulitan dan terhambat lulusnya, apalagi doktoral mengharuskan adanya publikasi di jurnal internasional. Sebenarnya perlu adanya sikap ingin tahu yang lebih, disertai ketidakpuasan mengenai metode-metode yang saat ini ada, agar diperoleh “gap” antara ilmu terkini dengan masalah yang dijumpai. Research Question yang ditemukan merupakan obor yang memicu seorang untuk meneliti. Oiya, untuk yang sedang riset disertasi, jangan harap bisa menemukan jawaban langsung dari internet, buku, atau bahkan bertanya ke supervisor karena memang masalah tersebut belum terselesaikan dengan tuntas, bahkan belum ada jawabannya. Selamat menemukan hal-hal baru.

Tipe Machine Learning

Walaupun kecerdasan buatan (Artificial Intelligent), Machine Learning, dan Deep Learning berbeda tetapi satu sama lain berhubungan. Deep Learning, yang dimotori oleh Jaringan Syaraf Tiruan lapis banyak, adalah salah satu jenis Machine Learning. Machine Learning itu sendiri adalah salah satu jenis dari kecerdasan buatan.

Machine Learning yang merupakan proses induksi ada tiga jenis. Penerapannya beragam, dari pengenalan gambar, pengenalan suara, pengenalan bahasa, dan lain-lain. Berikut ini jenis-jenisnya:

1. Suppervised Learning

Kebanyakan Machine Learning diterapkan pada jenis ini. Alur prosesnya antara lain: 1) memilih basis pengetahuan untuk menyelesaikan problem. Bandingkan jawaban dengan hasil sesungguhnya, 2) jika jawaban salah, modifikasi basis pengetahuan. Langkah 1) dan 2) diulangi terus hingga jawaban mirip dengan hasil sesungguhnya. Basis pengetahuan itu sendiri diistilahkan dengan Model. Jika disimpulkan suppervised learning memiliki pola:

{ input, correct output }

Dua tipa aplikasi terkenal dari machine learning jenis ini adalah klasifikasi dan regresi. Jika klasifikasi membagi dalam kelas-kelas yang diskrit, regresi bukan dalam kelas melainkan harga tertentu. Masalah yang sering dijumpai adalah Overfitting, yaitu adanya anomali dimana akurasi training yang bagus ketika diaplikasikan dalam kondisi real jatuh. Hal ini terjadi karena proses training tidak mampu menghasilkan generalisasi dari data dalam artian terlalu kaku mengikuti data training.

Namun terkadang klasifikasi dan regresi bekerja sama membentuk sistem seperti support vector regressin, juga neural network regression. Biasanya mengklasifikasi dulu baru meregresi hasil pastinya.

2. Unsuppervised Learning

Berbeda dengan suppervised learning, pada unsuppervised learning tidak diperlukan hasil sesungguhnya (correct output). Pada mulanya hal ini sulit dimengerti, tetapi dapat diterapkan untuk kasus yang memang tidak ada hasil sesungguhnya. Polanya adalah sebagai berikut:

{ input }

Salah satu representasi dari aplikasi unsuppervised learning adalah pengklusteran (clustering) dimana data training diinvestigasi karakteristiknya sebelum dikategorisasi.

3. Reinforcement Learning

Machine learning ini memasukan aspek optimasi dalam pembelajarannya. Jadi selain input, beberapa output dengan grade/kualitasnya digunakan untuk training. Biasanya diterapkan dalam bidang kontrol dan game plays.

{ input, some output, grade for this output }

Clustering dan Classification

Dua aplikasi tersebut serupa tapi tak sama. Untuk jelasnya kita ambil kasus pembagian kelas siswa menjadi IPA dan IPS. Jika kita memiliki data dengan label (output) IPA jika nilai IPA lebih besar dari IPS dan begitu pula sebaliknya kelas IPS jika nilai IPS lebih besar dari IPA, maka karena proses learningnya memiliki target/label/output, maka masuk kategori suppervised learning dan otomatis masuk domain klasifikasi. Namun jika kebanyakan guru IPA-nya “killer”, maka dikhawatirkan seluruh siswa masuk kelas IPS. Disinilah peran pengklusteran. Di awal kita tidak memiliki output tertentu, biarlah data yang membagi menjadi dua, baru diselidiki mana kelompok kelas IPA mana IPS. Tetapi waspadalah, jangan sampai kita membagi dua kategori (cluster) yang salah, bukannya IPA dan IPS malah kelas IPA dan IPS yang bagus dan kelas IPA dan IPS yang jelek, alias membagi siswa menjadi dua kategori siswa pintar dan siswa yang perlu lebih giat belajar (kata Kho Ping Hoo tidak ada orang pintar dan bodoh, tetapi tahu dan tidak tahu). Semoga bermanfaat.