Penerapan BERT untuk Name Entity Recognition (NER)

Dalam sesi kali ini, kita mempelajari penggunaan model BERT untuk tugas Name Entity Recognition (NER). NER adalah proses dalam Natural Language Processing (NLP) yang bertujuan untuk mengidentifikasi dan mengklasifikasikan entitas-entitas penting dalam teks seperti nama produk, organisasi, lokasi, tanggal, dan lainnya. Dengan bantuan model seperti BERT, proses identifikasi ini dapat dilakukan secara otomatis dengan tingkat akurasi yang cukup tinggi.

Model BERT (Bidirectional Encoder Representations from Transformers) merupakan salah satu model berbasis transformer yang dikembangkan untuk mengatasi keterbatasan model-model sebelumnya seperti LSTM yang bersifat serial dan lebih lambat. Kelebihan BERT adalah kemampuannya untuk memproses data secara paralel, sehingga jauh lebih cepat dan efisien, khususnya dalam konteks pemrosesan bahasa alami.

Untuk penggunaan dalam bahasa Indonesia, model yang digunakan adalah IndoBERT, yaitu versi BERT yang telah disesuaikan dengan karakteristik bahasa Indonesia. Dalam praktiknya, IndoBERT digunakan bersama dengan pustaka Transformers di lingkungan Google Colab. Instalasi dan pemanggilan model dilakukan secara langsung dari cloud, sehingga prosesnya cukup lancar tanpa kendala bandwidth lokal.

Selama demonstrasi, dilakukan proses instalasi tokenizer dan pemuatan model IndoBERT yang telah fine-tuned khusus untuk tugas NER. Setelah model berhasil dimuat, dilakukan pengujian terhadap beberapa teks berbahasa Indonesia. Hasilnya menunjukkan bahwa entitas-entitas seperti ORGANIZATION (ORG), PRODUCT (PRD), LOCATION (LOC), dan DATE berhasil dikenali dengan cukup baik. Meskipun sempat ditemukan beberapa ketidaksesuaian hasil, masalah tersebut dapat diatasi dengan mencocokkan versi model dan tokenizer yang digunakan.

Terakhir, dilakukan pengujian dengan teks yang lebih kompleks untuk melihat konsistensi hasil. Model berhasil mengenali entitas dengan benar seperti nama organisasi, produk, tanggal, dan lokasi. Evaluasi ini menunjukkan bahwa penggunaan IndoBERT untuk tugas NER pada teks bahasa Indonesia cukup efektif, meskipun tetap diperlukan pemilihan model yang sesuai dan validasi hasil secara manual untuk memastikan akurasi maksimal.

Rahasia Backup WhatsApp Tanpa Ganggu Email Utama

Saat ini, aplikasi Google Drive masih menjadi favorit banyak pengguna. Salah satu alasan utamanya adalah karena penyimpanan gratis yang ditawarkan. Namun, kendala utamanya adalah batas memori yang hanya 15 GB. Ini menjadi masalah ketika digunakan untuk mencadangkan data WhatsApp, yang bisa memakan hampir 10 GB sendiri. Jika file-file lama tidak dibersihkan, penyimpanan pun akan penuh dengan cepat.

Masalah lainnya adalah jika akun yang digunakan untuk backup merupakan email utama. Hal ini bisa menyulitkan ketika penyimpanan sudah tidak cukup, karena email tersebut juga digunakan untuk keperluan lain. Solusinya adalah membuat akun email baru khusus untuk keperluan backup. Cukup buat akun Google seperti biasa, lalu masuk ke Google Drive menggunakan akun tersebut.

Setelah masuk, periksa menu “Cadangan” atau “Backup” yang ada di kanan atas Google Drive. Jika masih kosong, maka akun siap digunakan untuk mencadangkan data baru. Selanjutnya, buka aplikasi WhatsApp, masuk ke “Setelan” → “Chat” → “Cadangan chat”, lalu ganti akun Google ke email baru yang tadi dibuat.

Jangan lupa untuk login dan memasukkan password saat menambahkan akun baru di WhatsApp. Ikuti semua instruksi sampai proses selesai. Jika ternyata ada file cadangan yang ukurannya besar, bisa dipindahkan ke komputer terlebih dahulu secara manual, agar tidak menghabiskan ruang penyimpanan di akun Google baru.

Lakukan proses backup ini di malam hari agar tidak mengganggu aktivitas lainnya. Pastikan juga bahwa proses backup benar-benar berhasil sebelum menghapus data dari akun lama. Selamat mencoba dan semoga berhasil mengatasi masalah penyimpanan penuh!

Mengelola Email dengan Filter untuk Kemudahan Penghapusan

Kotak masuk email yang penuh sering kali menyulitkan kita dalam menghapus pesan yang tidak diperlukan. Oleh karena itu, penting untuk membuat filter agar email lebih rapi dan memudahkan proses penghapusan.

Salah satu cara yang efektif adalah dengan membuat folder khusus, misalnya folder “Jurnal”, yang secara otomatis menampung email dengan kategori tertentu. Dengan begitu, saat ingin menghapus email dalam jumlah banyak, kita cukup menghapusnya dari folder tersebut tanpa harus memilah satu per satu.

Selain itu, memori email sering penuh akibat backup WhatsApp. Solusi terbaik adalah membuat akun email baru yang khusus digunakan untuk menyimpan cadangan WhatsApp. Dengan demikian, email utama tetap bersih dan tidak cepat penuh.

Untuk membuat filter, masuk ke pengaturan email dan buat aturan berdasarkan kata kunci tertentu. Setelah itu, gunakan fitur pencarian untuk memastikan aturan bekerja dengan benar. Jika berhasil, selanjutnya kita bisa menentukan apakah email tersebut akan dipindahkan ke folder tertentu atau diberi label khusus.

Cara lain yang lebih cepat adalah dengan mencari email di Inbox, kemudian klik ikon titik tiga dan pilih opsi “Filter”. Setelah aturan dibuat, kita bisa langsung memindahkan email dari Inbox ke label atau folder yang telah ditentukan. Jangan lupa mencentang opsi penerapan otomatis agar filter langsung bekerja di masa mendatang.

Dengan menerapkan filter ini, email dengan ciri tertentu akan langsung masuk ke folder yang sesuai, sehingga lebih mudah dikelola dan dihapus jika diperlukan. Langkah terakhir adalah membersihkan file atau lampiran yang tidak diperlukan agar ruang penyimpanan tetap optimal.

Dasar Dasar GIS dan Website Unduh Data Geospasial

Sistem Informasi Geografis (SIG) adalah teknologi berbasis komputer yang memiliki peran penting dalam pengelolaan dan analisis data spasial. Dengan menggunakan teknologi seperti GPS, remote sensing, dan interpolasi, SIG dapat membantu memahami pola dan perubahan wilayah secara lebih akurat. Penerapan SIG tidak hanya terbatas pada penggunaan peta digital, tetapi juga dapat diterapkan dalam berbagai bidang, seperti perencanaan tata ruang, pengelolaan lingkungan, dan analisis bencana.

SIG dapat membantu dalam membuat keputusan yang lebih tepat dengan mempertimbangkan lokasi dan wilayah. Dengan demikian, teknologi ini sangat penting dalam pengambilan keputusan berbasis lokasi. Beberapa contoh aplikasi SIG yang telah dikembangkan di Indonesia adalah Google Street View, Tata Ruang Online (RTRW/RDTR), dan tanahair.go.id, yang dapat membantu dalam pengelolaan informasi geografis secara lebih efektif.

Selain itu, SIG juga dapat memberikan akses ke data geografis yang ada di dunia. Misalnya, dengan menggunakan situs USGS (United States Geological Survey), kita dapat memperoleh data dan informasi tentang bencana alam, perubahan iklim, dan lain-lain. Oleh karena itu,SIG memiliki potensi besar dalam meningkatkan kesadaran dan pahaman akan pentingnya pengelolaan sumber daya yang berkelanjutan dan pengambilan keputusan yang lebih tepat.

Pengembangan SIG tidak hanya terbatas pada aspek teknologi, tetapi juga memerlukan kerja sama antar stakeholder dalam mencegah dan mengurangi dampak bencana alam. Dengan demikian, SIG dapat menjadi sarana yang efektif untuk mendukung pengambilan keputusan berbasis lokasi, serta meningkatkan kesadaran akan pentingnya pengelolaan sumber daya yang berkelanjutan dan pengambilan keputusan yang lebih tepat.

Tambah Informasi ke Chatbot via RAG: Jawaban Lebih Akurat Tanpa Pelatihan Ulang

Chatbot yang menggunakan model bahasa besar (LLM) biasanya hanya bisa menjawab berdasarkan data yang sudah dilatih sebelumnya. Jika pertanyaan yang diajukan berada di luar cakupan datanya, jawabannya bisa jadi kurang relevan atau umum. Oleh karena itu, metode Retrieval-Augmented Generation (RAG) menjadi solusi untuk meningkatkan akurasi jawaban dengan menambahkan data eksternal yang lebih spesifik. Dengan RAG, chatbot bisa mencari informasi di database lokal terlebih dahulu sebelum memberikan jawaban, sehingga lebih sesuai dengan kebutuhan pengguna.

Dalam pengimplementasiannya, data yang digunakan oleh chatbot bisa disimpan dalam bentuk embedding vektor yang memudahkan pencarian informasi relevan. Sebagai contoh, jika chatbot awalnya tidak mengetahui tren konsumsi gas domestik, pengguna dapat menambahkan dataset terbaru ke dalam sistem. Dengan begitu, chatbot dapat memberikan jawaban berdasarkan sumber yang lebih aktual tanpa perlu melatih ulang modelnya. Hal ini sangat berguna dalam skenario seperti informasi harga minyak terkini atau jadwal pendaftaran mahasiswa yang selalu diperbarui setiap tahun.

Keunggulan utama dari metode RAG dibanding fine-tuning adalah fleksibilitasnya. Fine-tuning memerlukan waktu dan sumber daya komputasi yang besar untuk melatih ulang model dengan data baru. Sebaliknya, dengan RAG, cukup dengan memperbarui repository data eksternal, chatbot dapat memberikan jawaban yang lebih akurat tanpa perlu melakukan pelatihan ulang. Oleh karena itu, pendekatan ini lebih efisien untuk aplikasi yang membutuhkan pembaruan informasi secara berkala.

Panduan Instalasi dan Penggunaan Large Language Model (LLM) di Windows

Large Language Model (LLM) dapat dijalankan secara lokal di Windows dengan mengunduh source code dan menginstalnya. Proses ini memerlukan ruang penyimpanan yang cukup besar, tergantung pada ukuran model yang dipilih. Setelah unduhan selesai, instalasi dilakukan dengan menjalankan installer yang tersedia, kemudian membuka program yang telah terpasang untuk memastikan bahwa LLM dapat berjalan dengan baik.

Setelah instalasi, langkah berikutnya adalah mengecek apakah model telah berfungsi dengan benar. Ini dapat dilakukan melalui terminal dengan memeriksa versi yang terinstal serta mencoba menjalankan perintah sederhana. Salah satu fitur unggulan dari model ini adalah kemampuannya untuk berkomunikasi melalui API, memungkinkan interaksi dengan jaringan lokal. Jika belum ada model yang terpasang, pengguna dapat mengunduh model yang sesuai, seperti LLaMA versi 3, dengan ukuran yang bervariasi tergantung pada kompleksitasnya.

Untuk mengakses LLM melalui web, pengguna dapat menggunakan framework seperti Flask dengan menghubungkannya ke file HTML untuk input dan output. Hal ini memungkinkan interaksi melalui browser, di mana pengguna dapat mengajukan pertanyaan atau melakukan tugas seperti analisis sentimen. Dalam implementasinya, penting untuk memperhatikan waktu eksekusi agar sistem dapat menangani permintaan dengan efisien. Setelah konfigurasi selesai, pengguna dapat menguji chatbot dengan berbagai skenario, termasuk matematika dan pemrosesan bahasa alami.

Cara Mudah Memotong dan Menggabungkan PDF di Mac Tanpa Aplikasi Berbayar

Assalamualaikum pengguna Mac! Terkadang kita dipusingkan dengan aplikasi berbayar untuk mengedit PDF. Namun, dengan aplikasi PDF Reader Pro, kita bisa memanfaatkan fasilitas gratisnya untuk memotong halaman PDF. Caranya cukup mudah, pertama, buka file PDF dengan aplikasi tersebut. Kemudian, untuk memotong halaman tertentu, gunakan fitur “Print”, lalu pilih “Range From” dan tentukan halaman yang ingin dipotong. Setelah itu, pilih “Save as PDF” di bagian bawah dan beri nama sesuai keinginan. Dengan cara ini, kita bisa menyimpan halaman yang diinginkan tanpa harus menggunakan aplikasi berbayar.

Selanjutnya, bagaimana jika ingin menggabungkan beberapa halaman PDF, misalnya menggabungkan cover dengan isi dokumen? Caranya hampir sama dengan langkah sebelumnya. Pilih opsi “Print” dan tentukan halaman yang ingin digabungkan. Setelah itu, simpan hasilnya dengan nama baru, misalnya “Isi”. Jika ingin menyisipkan cover dengan isi, buka terlebih dahulu file cover, lalu di menu “File” pilih “Merge PDFs”. Selanjutnya, pilih file isi yang ingin digabungkan dengan cover, lalu beri nama baru untuk file hasil gabungan tersebut.

Setelah selesai, cek hasilnya dan pastikan halaman telah tersusun dengan benar. Dengan trik ini, kita bisa memotong dan menggabungkan halaman PDF tanpa perlu aplikasi berbayar. Meskipun ada aplikasi online yang bisa digunakan, namun ada risiko data kita diambil tanpa izin. Dengan menggunakan PDF Reader Pro, kita bisa mengedit PDF dengan aman dan gratis. Semoga tutorial ini bermanfaat. Wassalamualaikum warahmatullahi wabarakatuh.

Review Paper Aman dengan AI Offline via Chatbox

Beberapa aplikasi chatbot sudah mendukung mode offline, sehingga tidak memerlukan koneksi internet untuk beroperasi. Dengan fitur ini, pengguna tetap dapat mengakses berbagai layanan seperti pembuatan ringkasan atau analisis teks tanpa harus terhubung ke server online. Namun, penggunaan chatbot offline memiliki keterbatasan, salah satunya adalah kebutuhan perangkat dengan prosesor CPU dan GPU yang cukup tinggi agar proses berjalan lancar.

Salah satu keuntungan utama dari chatbot offline adalah privasi yang lebih terjaga. Karena data tidak dikirim ke server eksternal, risiko informasi tersebar atau dibagikan secara tidak sengaja ke pihak lain dapat diminimalkan. Dalam pengujian terhadap sebuah paper ilmiah, chatbot offline mampu mengenali bahwa dokumen tersebut adalah studi literatur yang berisi ringkasan berbagai penelitian terdahulu. Dengan demikian, pengguna dapat dengan cepat memahami konteks dokumen tanpa harus membaca seluruh isinya.

Meskipun hasil yang diberikan cukup baik, chatbot offline masih memiliki keterbatasan dalam memahami dan menyajikan informasi. Dalam beberapa kasus, penggunaan prosesor yang tinggi dapat mempengaruhi kinerja perangkat, terutama jika dokumen yang diproses sangat kompleks. Namun, chatbot ini tetap memberikan manfaat dengan kemampuannya membaca abstrak, mengenali isi utama, serta memberikan gambaran umum dari sebuah artikel sebelum pengguna membacanya lebih lanjut.

Menganalisis Sentimen dengan Hugging Face

Pemanfaatan Hugging Face untuk analisis sentimen dimulai dengan proses pendaftaran guna mengakses fasilitas yang tersedia. Setelah itu, dilakukan instalasi library Transformers di Google Colab, diikuti dengan impor modul penting seperti AutoTokenizer dan AutoModel. Inferensi dilakukan dengan mengecek sentimen dari sebuah kalimat yang dimasukkan, namun hasil awal menunjukkan skor positif yang terlalu tinggi, mengindikasikan kurangnya akurasi pada model yang digunakan.

Untuk meningkatkan akurasi, model kemudian diganti dengan yang lebih sesuai, seperti IndoBERT. Model ini diunduh dan dijalankan menggunakan tokenizer serta pipeline yang tersedia. Dengan memanfaatkan BERT multilingual yang telah dilatih untuk memahami berbagai bahasa, termasuk bahasa Indonesia, analisis sentimen menunjukkan hasil yang lebih akurat. Sentimen positif dan negatif dapat diidentifikasi dengan lebih baik dibandingkan model sebelumnya.

Pengujian lebih lanjut dilakukan dengan beberapa contoh kalimat untuk memastikan keakuratan model. Input dengan sentimen negatif diuji untuk melihat apakah model dapat mengenalinya dengan benar. Hasilnya menunjukkan peningkatan akurasi, di mana skor yang semakin mendekati lima menunjukkan sentimen yang semakin positif. Dengan pendekatan ini, Hugging Face berhasil dimanfaatkan untuk analisis sentimen menggunakan Transformers, memberikan hasil yang lebih andal untuk pemrosesan bahasa alami. Lihat link Colab berikut.

Mengamankan Data di Era Digital dengan Strategi, Ancaman, dan Solusi Berbasis – Standar DAMA-BOK

Dalam postingan video di bawah, saya membahas secara mendalam mengenai keamanan data dan perlindungan informasi dalam manajemen data. Saya menjelaskan berbagai konsep dasar terkait pengamanan data, termasuk pentingnya mengenali jenis data yang dikelola serta risiko kebocoran informasi. Selain itu, saya juga menguraikan langkah-langkah preventif yang dapat diambil oleh organisasi untuk menjaga data mereka dari ancaman siber yang semakin meningkat.

Saya juga menyoroti berbagai ancaman yang dapat membahayakan keamanan data, seperti serangan siber, kebocoran informasi, serta eksploitasi terhadap sistem yang rentan. Dalam postingan ini, saya menjelaskan bagaimana metode enkripsi seperti hashing, RSA, dan AES dapat digunakan untuk menjaga kerahasiaan data. Selain itu, saya menekankan bahwa regulasi pemerintah dan kebutuhan bisnis memiliki peran penting dalam menentukan strategi keamanan data yang efektif.

Lebih lanjut, saya mengulas berbagai teknologi perlindungan, seperti firewall, PGP, serta sistem autentikasi dan otorisasi yang tepat untuk mencegah akses tidak sah. Saya juga merekomendasikan agar organisasi terus melakukan evaluasi serta pembaruan kebijakan keamanan guna menghadapi ancaman yang terus berkembang. Dengan menerapkan strategi yang tepat, saya yakin keamanan data dapat tetap terjaga, dan risiko kebocoran informasi dapat diminimalisir.

Scopus & AI: Cara Kilat Cari dan Ringkas Paper buat Riset!

Scopus dapat dimanfaatkan untuk studi literatur atau Systematic Literature Review (SLR) dengan fitur pencarian kata kunci dan filter waktu. Pengguna bisa mengunduh abstrak atau full paper jika kampus memiliki langganan jurnal, sementara paper open access dapat diakses gratis. Scopus membatasi unduhan hingga 50 paper per batch, sehingga proses harus dilakukan bertahap jika jumlahnya banyak.

Untuk mempercepat analisis, AI seperti ChatGPT dapat digunakan untuk meringkas paper, mengekstrak novelty, atau mencari informasi spesifik dalam dokumen PDF. Fitur upload PDF di ChatGPT kini tidak memiliki batasan jumlah halaman, hanya dibatasi ukuran maksimal 20 MB, sehingga mempermudah peneliti dalam meninjau referensi dengan lebih efisien.

Cara Pakai AI Gratis di Laptop

Perkembangan kecerdasan buatan (AI) semakin pesat, dan salah satu yang banyak digunakan saat ini adalah model bahasa besar (LLM). Salah satu model yang tengah mendapat perhatian adalah DeepSeek, yang dapat dijalankan secara lokal di perangkat pengguna. Sejumlah antarmuka grafis (GUI) telah tersedia untuk mempermudah penggunaannya, salah satunya adalah Ollama.

DeepSeek menawarkan beberapa varian model, termasuk versi yang telah disuling (distilled) agar lebih ringan. Model aslinya berukuran sekitar 400GB, sehingga kurang praktis untuk dijalankan di laptop pribadi. Sebagai alternatif, tersedia model yang lebih kecil dengan ukuran berkisar antara 4.7GB hingga 9GB, yang lebih ramah bagi perangkat dengan keterbatasan daya komputasi.

Untuk menjalankannya, pengguna dapat mengunduh dan menginstal perangkat lunak melalui terminal. Salah satu GUI yang banyak direkomendasikan adalah LM Studio, yang memiliki tampilan lebih intuitif dibandingkan dengan antarmuka berbasis chat lainnya. LM Studio memungkinkan pengguna memilih berbagai model AI, mulai dari Llama 3.2 yang berukuran 2GB hingga model yang lebih besar seperti 70B dengan ukuran sekitar 37GB.

Keunggulan utama AI lokal seperti DeepSeek adalah kemampuannya untuk beroperasi tanpa memerlukan koneksi internet. Hal ini berbeda dengan ChatGPT, yang membutuhkan akses ke server di luar negeri. Namun, ada tantangan tersendiri dalam penggunaannya, seperti beban pemrosesan yang lebih tinggi pada CPU dan GPU, yang dapat membuat perangkat lebih panas dan proses lebih lambat dibandingkan AI berbasis cloud.

Fitur unggulan lain yang ditawarkan adalah kemampuan membaca dokumen, termasuk file Word. Berbeda dengan ChatGPT yang membatasi fitur unggah dokumen pada versi berlangganan, AI lokal memungkinkan pengguna mengakses fitur ini secara gratis. Meski demikian, pemrosesan dokumen pada AI lokal membutuhkan waktu lebih lama dibandingkan layanan berbasis cloud.

Dengan semakin banyaknya pilihan model AI lokal, pengguna kini memiliki alternatif untuk mengakses teknologi AI tanpa ketergantungan pada layanan berbayar. Meskipun prosesnya tidak secepat layanan berbasis cloud, kebebasan dan fleksibilitas yang ditawarkan menjadi nilai tambah tersendiri bagi pengguna yang mengutamakan privasi dan akses tanpa batasan kuota.

Makanan Bergizi

Udara pagi di desa membuat segar setelah semalaman tidur nyenyak karena lelah akibat perjalanan Bekasi ke Ciamis di malam hari. Menyusuri jalan beraspal sambil memandang sawah yang masih hijau membuat rileks hati. Sesekali kendaraan melalui jalan itu diselingi dengan bunyi jangkrik di pinggir kali.

Kebetulan di dekat rumah bibi ada gedung yang akan dijadikan dapur makan bergizi, proyek dari presiden Prabowo, sesuai dengan janji saat kampanye dulu. Postingan ini hanya selingan terkait dengan perang AI antara Amerika Serikat dengan China. Lalu apa hubungannya dengan proyek makan bergizi Prabowo?

Ketika tulisan ini dibuat, baru saja saya menginstal DeepSeek dari China yang diberikan mesin AI-nya secara cuma-cuma. Berbeda dengan ChatGPT dimana GPT tidak bisa kita pasang di laptop atau server kita, bahkan untuk memanfaatkan GPT untuk aplikasi yang dibuat perlu berlangganan. Itu pun hanya berupa Application Programming Interface (AI) dan mesin AI tidak berada di server kita.

China secara mengejutkan membuat mesin AI yang kabarnya lebih canggih dari ChatGPT, khususnya di bidang matematis. Sebelumnya Alibaba memang menampilkan QWEN yang memiliki ketangguhan mirip ChatGPT, dengan kekhususan di bidang bisnis. Tentu saja dengan DeepSeek, aplikasi-aplikasi berbasis LLM dan Generative AI yang tadinya berlangganan ChatGPT pasti berhenti berlangganan. Berikut video untuk menginstall DeepSeek versi mini (diberi istilah distilled atau hasil penyulingan) agar bisa dipasang di laptop atau server kecil. Ukuran bervariasi dari 1,5 gigabyte hingga 400-an Gb.

Jika dibandingkan ternyata untuk pertanyaan sederhana sepertinya ChatGPT masih lebih praktis dan cepat, apalagi di Macbook ada fasilitas menekan Option+Space untuk mengaktifkan ChatGPT instan. Ini merupakan keunggulan ChatGPT dimana versi onlinenya selalu ok, berbeda dnegan DeepSeek yang terkadang “busy”, karena tidak sanggup menjawab pertanyaa orang-orang seluruh dunia. Tapi tetap saja kita bisa memasang secara offline yang tidak perlu pulsa di komputer atau laptop kita.

Untuk interface, banyak aplikasi yang menyediakan selain Chatbox, salah satunya yang saya coba adalah LM Studio. Kemampuan DeepSeek dalam DeepThink bisa dilihat, dan tentu saja fasilitas upload PDF tersedia, walaupun di ChatGPT pun bisa upload PDF. Jadi jika kita malas membaca paper, tinggal upload file pdf paper/artikel ilmiah dan tanya saja atau minta resume.

Jadi dengan AI anak-anak kita dengan mudah belajar apapun. Tinggal bagaimana otak anak-anak kita bisa segera menyerap ilmu yang sekarang bebas diakses. Jadi sebesar apapun biaya untuk fasilitas pembelajaran, jika otak anak-anak kita ‘melempem’ sepertinya mubazir. Lebih baik investasi ke kecerdasarn generasi kita ke depan, karena kalau sudah cerdas, tinggal diasah mental (keimanan, cinta tanah air, dan lain-lain) dan belajar dari media apapun, terutama memanfaatkan Artificial Intelligence (AI).

Peralatan Data Sains

Saat ini bidang-bidang ilmu memerlukan instrumen dalam analisis data yang ada. Instrumen tersebut biasanya terkait dengan informatika atau ilmu komputer. Tentu saja bidang-bidang ilmu seperti kedokteran, ekonomi, psikologi, dan lain-lain akan memerlukan waktu jika diharuskan belajar ilmu komputer. Oleh karena itulah pakar-pakar ilmu komputer berusaha menyediakan sarana berupa aplikasi agar bidang lain selain informatika dapat memanfaatkan metode atau teknik yang dikembangkan oleh pakar ilmu komputer untuk menyelesaikan problem masing-masing bidang/disiplin ilmu.

Tahun 2008 merupakan tahun yang mengesankan karena di tahun itu perkuliahan pasca sarjana bidang ilmu komputer saya mulai. Bidang ilmu komputer merupakan bidang baru karena sarjana saya yang cukup berbeda, yaknik teknik mesin. Tiap jumat malam dan sabtu, dengan mengendarai motor suzuki thunder, perjalanan bekasi ke jakart terasa ringan, walau kalau dipikir-pikir saat ini, kaget juga, mengapa saya kuat berkendara roda dua sejauh itu. Salah satu dosen kebetulan bukan doktor bidang ilmu komputer, namun memiliki kemampuan dan juga kebijaksanaan dalam mengajari para mahasiswa terkait ilmu komputer. Salah satunya adalah data mining, dimana Dr. Prabowo Pudjo Widodo, kerap membagikan software-software untuk mengelola data mining, salah satunya adalah RapidMiner.

Walaupun software itu sejatinya untuk peneliti non komputer, tetapi cocok juga untuk praktik dasar-dasar data mining (dalam bahasa Indonesia diberi istilah penambangan data). Nah, saat ini RapidMiner sudah ada versi 2025 yang dikenal dengan sebutan Altair AI Studio. Seperti penamaan standar, nama depan berarti vendornya, yakni Altair. Seperti Microsoft Word, berarti Microsoft itu vendornya. Visualisasi, analisa statistik, pengolahan data, dan pekerjaan-pekerjaan sains data lainnya dapat dimanfaatkan oleh software free tersebut (asalkan data <= 10.000 record). Memang software lain, seperti tableau, atau power BI lebih powerful, tapi berbayar.

Salah satu paket menarik dari RapidMiner adalah AutoModel. Di sini kita jika punya satu set data, khususnya dalam format CSV, ketika diunggah ke RapidMiner maka secara otomatis akan diberikan rekomendasi apa saja yang bisa dilakukan, seperti Clustering, Prediction/Inference, Regression, Association Rule, dan lain-lain. Silahkan lihat postingan berikut mengenai fungsi-fungsi dalam Data Mining.

Predictive Analysis – DTree

Clustering – KMeans

Market Basket Analysis

Association Rule

Era Open Source Mulai

Kira-kira satu atau dua tahun yang lalu, beberapa proyek meminta untuk implementasi AI di aplikasi berbasis web. Kebetulan karena jamannya pilpres dan pilkada, teknik scrapping berita di media online kemudian mengecek sentimen dan emosi dari postingan banyak yang minta. Alhasil mengingat keterbatasan yang ada, Naive Bayes, SVM dan metode klasik lainnya jadi andalan. Dengan data terbatas bisa dilatih model yang mampu mengetahui sentimen dari berita online, dengan akurasi yang tidak jauh dari 80%.

Waktu itu ChatGPT mulai muncul dan tentu saja mengalahkan model-model klasik lainnya. Salah satu keterbatasannya adalah jika ingin memanfaatkan fasilitas model GPT itu, harus berlangganan, dan karena berbasis Application Programming Interface (API), mesin AI tidak berada di sisi kita, melainkan hanya ‘menyewa’. Biayanya pun tidak tanggung-tanggung, hitungan per kata.

Untuk menghitung sentimen, dengan metode klasik pun bisa, tapi jika diminta membuat ringkasan (summary), meringkas, melaporkan (reporting), tentu saja mengandalkan model LLM gratis, waktu itu masih kurang akurat. Namun toh, aplikasi bisa berjalan dengan tetap pengguna mengecek ulang keakuratannya dan tidak serta-merta percaya.

Waktu terus berjalan, Donald Trump tampil dan mengumumkan perang dagang dengan China. Nah, di sinilah muncul DeepSeek, AI buatan China yang mengungguli ChatGPT dari sisi kalkulasi matematis. Bukan hanya itu, mesin AI-nya pun dibagikan secara cuma-cuma dalam skema Opensource. Sehingga pengguna tidak perlu berlangganan jika ingin memanfaatkan Generative AI tersebut. Bayangkan, bagaimana hebohnya pengguna yang sudah terlanjur berlangganan ChatGPT, dipastikan akan beralih ke yang gratis. Walaupun tentu saja masih banyak yang ragu, tapi toh, model yang dibagikan itu karena open source, bisa terlihat struktur dalamnya. Ada beberapa bias, khususnya informasi terkait Taiwan, yang menurut DeepSeek masih bagian dari China. Sebelumnya, model QWEN dari Alibaba juga mulai menyaingi ChatGPT, yang cocok untuk bisnis, tapi dari sisi matematis masih kalah dengan DeepSeek.

Kelebihan DeepSeek ternyata tidak didukung oleh situs onlinenya yang terkadang ‘sibuk’ ketika ditanya, terutama ketika memanfaatkan fasilitas ‘deepthink’ dan ‘web’. Namun, toh bisa kita install di laptop kita dan dapat berjalan walau tanpa terkoneksi ke jaringan, sangat cocok untuk yang tidak punya pulsa. Berikut video bagaimana menginstallnya di Mac, dengan bantuan situs Ollama [Link] dan interface Chatbox [Link].