Server RIG dengan GPU

Pagi ini tiba server dengan spesifikasi HPE ProLiant DL380 Gen10 dengan BIOS/ROM U30 v2.90 (07/20/2023), RAM 64 GB, prosesor 2 × Intel Xeon Gold 5218, serta storage 1 × 2.2 TB. Namun tipenya adalah rig, yaitu komputer rakitan khusus dengan frame terbuka yang dirancang untuk komputasi intensif dan memudahkan pemasangan banyak GPU, dengan 4 buah GPU tipe RTX.

Di dalamnya sudah terpasang Ubuntu Server 22.04 yang dapat menyala, tetapi password tidak dipegang sehingga belum bisa dilakukan pengujian lebih lanjut. Agak unik, tipe rig dengan GPU seperti ini biasanya digunakan untuk komputasi paralel berintensitas tinggi seperti mining cryptocurrency, rendering grafis, simulasi, atau pelatihan model AI/deep learning karena membutuhkan banyak unit pemrosesan secara bersamaan.

Namun di SOCS Universitas Nusa Putra perangkat ini digunakan untuk keperluan Deep Learning, bukan untuk mining crypto. Agak bingung pada awalnya, dimulai dari pemasangan UPS yang cukup berat. Terdapat dua Power Supply Unit (PSU), di sisi kanan dan kiri. Hal yang unik adalah mencari tombol start yang berbentuk seperti kabel kecil memanjang dengan ujung berupa tombol yang ditekan untuk proses booting. Selain itu, masih perlu belajar lagi dalam melakukan pengaturan jaringan (network) pada server melalui terminal.

Utak-Atik Server Linux Ubuntu

Terkadang kita dengan mudah membuat aplikasi Artificial Intelligence (AI), misalnya Chatbot. Nah, selain rancangan harus sesuai dengan keinginan user, masalah lain muncul ketika harus bekerja dengan tim lain yang terkadang menggunakan bahasa dan framework yang berbeda.

Biasanya aplikasi yang dibuat tidak sama dengan AI yang dirancang, misalnya AI dengan Python sementara aplikasi induknya dengan Node JS, Laravel, maupun Java. Ini yang membutuhkan kerja sama yang pas antara Web Developer dengan AI designer. Jika sudah pun terkadang ketika diinstal di server production, perlu dites kembali, mengingat library yang menyertai AI harus seluruhnya sesuai. Jika sudah, pihak Web Developer harus bisa menghubungkan port AI dengan web yang dirancang.

Web developer perlu sedikit dijelaskan prinsip dasar menjalankan Python yang terintegrasi dengan PHP, javascript, dan modul-modul HTML yang menyertai. Juga saat menu Restart AI dan cek AI, yang harus diberikan bagi Admin guna memastikan engine AI berjalan dengan baik. Video berikut mengilustrasikan bagaimana ribetnya bekerja Remote ke server tujuan, khususnya Linux.

Action Chatbot Sederhana

Saat ini, Artificial Intelligence (AI) telah menjadi “tokoh utama” dalam perkembangan teknologi modern. Menariknya, AI dapat berperan sebagai tokoh baik maupun tokoh buruk (villain). Di satu sisi, AI memudahkan pekerjaan manusia; namun di sisi lain, sifatnya yang instan sering membuat orisinalitas hilang, menumbuhkan rasa malas, dan menimbulkan ketergantungan. Meski begitu, manfaat yang dirasakan pengguna tetap sangat besar.

Salah satu kemampuan AI yang paling populer saat ini adalah sifat generatifnya (generative AI), misalnya dalam membuat presentasi. Dengan hanya memberikan prompt tertentu, model yang dikenal dengan nama Large Language Models (LLMs) mampu menghasilkan konten sesuai permintaan, termasuk pembuatan slide PowerPoint.

Jika dahulu chatbot hanya memberikan saran atau rekomendasi, kini telah berkembang menjadi action chat: chatbot tidak hanya memberi saran, tetapi juga mengeksekusi perintah secara langsung. Apakah hal ini berbahaya? Tentu saja ada potensi risikonya. Anda mungkin teringat film Mission Impossible yang dibintangi Tom Cruise, di mana AI mampu mengeksekusi tindakan berbahaya seperti pengeboman tanpa melibatkan manusia.

Dalam contoh yang lebih aman, berikut ini adalah demonstrasi action chat di mana chatbot mengeksekusi pembuatan file PowerPoint yang dapat langsung diunduh. Materi presentasi diambil dari file PDF yang diunggah pengguna, kemudian diproses menjadi database vektor menggunakan teknologi seperti FAISS, Chroma, Pinecone, dan lainnya. Proses ini dalam istilah teknis dikenal dengan nama Retrieval-Augmented Generation (RAG).

Auto Model Pada RapidMiner

RapidMiner masih menjadi andalan bagi banyak pemula dalam data mining, terutama mereka yang berasal dari luar bidang IT. Antarmukanya yang berbasis drag-and-drop memudahkan pemrosesan data tanpa perlu menulis kode. Namun, satu hal yang sering membingungkan bagi pemula adalah memahami domain atau kategori penelitian yang tersedia. Misalnya, apa perbedaan antara klasifikasi, regresi, dan clustering? Apalagi ketika memasuki model yang lebih kompleks seperti association rules atau anomaly detection, pengguna baru sering kali merasa tidak yakin harus memulai dari mana.

Software RapidMiner dapat diunduh secara gratis melalui situs resminya di http://rapidminer.com. Meski demikian, beberapa fitur lanjutan tidak tersedia secara gratis, termasuk fitur yang akan dibahas di sini, yaitu Auto Model. Namun, jika Anda baru pertama kali menginstal RapidMiner, fitur Auto Model biasanya tersedia untuk dicoba secara gratis selama masa awal penggunaan atau melalui paket trial.

Untuk latihan, RapidMiner menyediakan beberapa dataset contoh saat pertama kali dibuka. Meski begitu, akan lebih baik jika Anda juga menggunakan data milik sendiri atau mengunduh dari situs penyedia dataset seperti Kaggle (http://kaggle.com), UCI Machine Learning Repository (http://archive.ics.uci.edu/ml), atau Data World (http://data.world). Sebagai ilustrasi penggunaannya dalam praktik, Anda bisa melihat video tutorial berikut di YouTube:

LLM, Solusi AI yang Kian Populer di Berbagai Sektor

Large Language Model (LLM) merupakan model kecerdasan buatan yang saat ini tengah berkembang pesat. Hal ini disebabkan oleh kemampuannya dalam memahami dan menghasilkan bahasa alami secara luas, dengan penggunaan yang beragam di berbagai bidang, salah satunya sebagai chatbot. LLM seperti LLaMA dari Meta, meskipun sangat canggih, tetap membutuhkan informasi tambahan agar dapat menjawab pertanyaan khusus, misalnya terkait data internal perusahaan. Oleh karena itu, integrasi dengan sumber data tambahan menjadi sangat penting dalam penerapannya.

RAG Permudah Adaptasi LLM Tanpa Pelatihan Ulang yang Mahal

Retrieval-Augmented Generation (RAG) menjadi solusi praktis untuk mengoptimalkan LLM tanpa memerlukan pelatihan ulang (retraining) yang kompleks. Sebagai perbandingan, model seperti ChatGPT membutuhkan waktu hingga beberapa hari atau bahkan minggu untuk melatih ulang satu set informasi baru. Dengan pendekatan RAG, cukup digunakan basis data vektor sebagai referensi pengetahuan, salah satunya dengan memanfaatkan Facebook AI Similarity Search (FAISS). Model ini mengubah sumber data atau dokumen menjadi representasi vektor yang disebut embeddings, sehingga pencarian konteks menjadi jauh lebih cepat dan efisien.

FAISS Dapat Digunakan Bersama API LLM Tanpa Infrastruktur Berat

Pemanfaatan FAISS tidak terbatas pada sistem lokal saja, tetapi juga dapat diintegrasikan dengan layanan API dari berbagai penyedia LLM seperti OpenAI (ChatGPT), DeepSeek, Claude dari Anthropic, hingga Mistral. Pengguna cukup menyediakan database vektor dan menghubungkannya melalui API berbayar tanpa memerlukan server lokal atau perangkat keras khusus. Hal ini membuka peluang bagi perusahaan kecil dan menengah untuk menerapkan AI canggih tanpa harus mengelola infrastruktur teknis yang rumit.

Penerapan BERT untuk Name Entity Recognition (NER)

Dalam sesi kali ini, kita mempelajari penggunaan model BERT untuk tugas Name Entity Recognition (NER). NER adalah proses dalam Natural Language Processing (NLP) yang bertujuan untuk mengidentifikasi dan mengklasifikasikan entitas-entitas penting dalam teks seperti nama produk, organisasi, lokasi, tanggal, dan lainnya. Dengan bantuan model seperti BERT, proses identifikasi ini dapat dilakukan secara otomatis dengan tingkat akurasi yang cukup tinggi.

Model BERT (Bidirectional Encoder Representations from Transformers) merupakan salah satu model berbasis transformer yang dikembangkan untuk mengatasi keterbatasan model-model sebelumnya seperti LSTM yang bersifat serial dan lebih lambat. Kelebihan BERT adalah kemampuannya untuk memproses data secara paralel, sehingga jauh lebih cepat dan efisien, khususnya dalam konteks pemrosesan bahasa alami.

Untuk penggunaan dalam bahasa Indonesia, model yang digunakan adalah IndoBERT, yaitu versi BERT yang telah disesuaikan dengan karakteristik bahasa Indonesia. Dalam praktiknya, IndoBERT digunakan bersama dengan pustaka Transformers di lingkungan Google Colab. Instalasi dan pemanggilan model dilakukan secara langsung dari cloud, sehingga prosesnya cukup lancar tanpa kendala bandwidth lokal.

Selama demonstrasi, dilakukan proses instalasi tokenizer dan pemuatan model IndoBERT yang telah fine-tuned khusus untuk tugas NER. Setelah model berhasil dimuat, dilakukan pengujian terhadap beberapa teks berbahasa Indonesia. Hasilnya menunjukkan bahwa entitas-entitas seperti ORGANIZATION (ORG), PRODUCT (PRD), LOCATION (LOC), dan DATE berhasil dikenali dengan cukup baik. Meskipun sempat ditemukan beberapa ketidaksesuaian hasil, masalah tersebut dapat diatasi dengan mencocokkan versi model dan tokenizer yang digunakan.

Terakhir, dilakukan pengujian dengan teks yang lebih kompleks untuk melihat konsistensi hasil. Model berhasil mengenali entitas dengan benar seperti nama organisasi, produk, tanggal, dan lokasi. Evaluasi ini menunjukkan bahwa penggunaan IndoBERT untuk tugas NER pada teks bahasa Indonesia cukup efektif, meskipun tetap diperlukan pemilihan model yang sesuai dan validasi hasil secara manual untuk memastikan akurasi maksimal.

Tambah Informasi ke Chatbot via RAG: Jawaban Lebih Akurat Tanpa Pelatihan Ulang

Chatbot yang menggunakan model bahasa besar (LLM) biasanya hanya bisa menjawab berdasarkan data yang sudah dilatih sebelumnya. Jika pertanyaan yang diajukan berada di luar cakupan datanya, jawabannya bisa jadi kurang relevan atau umum. Oleh karena itu, metode Retrieval-Augmented Generation (RAG) menjadi solusi untuk meningkatkan akurasi jawaban dengan menambahkan data eksternal yang lebih spesifik. Dengan RAG, chatbot bisa mencari informasi di database lokal terlebih dahulu sebelum memberikan jawaban, sehingga lebih sesuai dengan kebutuhan pengguna.

Dalam pengimplementasiannya, data yang digunakan oleh chatbot bisa disimpan dalam bentuk embedding vektor yang memudahkan pencarian informasi relevan. Sebagai contoh, jika chatbot awalnya tidak mengetahui tren konsumsi gas domestik, pengguna dapat menambahkan dataset terbaru ke dalam sistem. Dengan begitu, chatbot dapat memberikan jawaban berdasarkan sumber yang lebih aktual tanpa perlu melatih ulang modelnya. Hal ini sangat berguna dalam skenario seperti informasi harga minyak terkini atau jadwal pendaftaran mahasiswa yang selalu diperbarui setiap tahun.

Keunggulan utama dari metode RAG dibanding fine-tuning adalah fleksibilitasnya. Fine-tuning memerlukan waktu dan sumber daya komputasi yang besar untuk melatih ulang model dengan data baru. Sebaliknya, dengan RAG, cukup dengan memperbarui repository data eksternal, chatbot dapat memberikan jawaban yang lebih akurat tanpa perlu melakukan pelatihan ulang. Oleh karena itu, pendekatan ini lebih efisien untuk aplikasi yang membutuhkan pembaruan informasi secara berkala.

Panduan Instalasi dan Penggunaan Large Language Model (LLM) di Windows

Large Language Model (LLM) dapat dijalankan secara lokal di Windows dengan mengunduh source code dan menginstalnya. Proses ini memerlukan ruang penyimpanan yang cukup besar, tergantung pada ukuran model yang dipilih. Setelah unduhan selesai, instalasi dilakukan dengan menjalankan installer yang tersedia, kemudian membuka program yang telah terpasang untuk memastikan bahwa LLM dapat berjalan dengan baik.

Setelah instalasi, langkah berikutnya adalah mengecek apakah model telah berfungsi dengan benar. Ini dapat dilakukan melalui terminal dengan memeriksa versi yang terinstal serta mencoba menjalankan perintah sederhana. Salah satu fitur unggulan dari model ini adalah kemampuannya untuk berkomunikasi melalui API, memungkinkan interaksi dengan jaringan lokal. Jika belum ada model yang terpasang, pengguna dapat mengunduh model yang sesuai, seperti LLaMA versi 3, dengan ukuran yang bervariasi tergantung pada kompleksitasnya.

Untuk mengakses LLM melalui web, pengguna dapat menggunakan framework seperti Flask dengan menghubungkannya ke file HTML untuk input dan output. Hal ini memungkinkan interaksi melalui browser, di mana pengguna dapat mengajukan pertanyaan atau melakukan tugas seperti analisis sentimen. Dalam implementasinya, penting untuk memperhatikan waktu eksekusi agar sistem dapat menangani permintaan dengan efisien. Setelah konfigurasi selesai, pengguna dapat menguji chatbot dengan berbagai skenario, termasuk matematika dan pemrosesan bahasa alami.

Review Paper Aman dengan AI Offline via Chatbox

Beberapa aplikasi chatbot sudah mendukung mode offline, sehingga tidak memerlukan koneksi internet untuk beroperasi. Dengan fitur ini, pengguna tetap dapat mengakses berbagai layanan seperti pembuatan ringkasan atau analisis teks tanpa harus terhubung ke server online. Namun, penggunaan chatbot offline memiliki keterbatasan, salah satunya adalah kebutuhan perangkat dengan prosesor CPU dan GPU yang cukup tinggi agar proses berjalan lancar.

Salah satu keuntungan utama dari chatbot offline adalah privasi yang lebih terjaga. Karena data tidak dikirim ke server eksternal, risiko informasi tersebar atau dibagikan secara tidak sengaja ke pihak lain dapat diminimalkan. Dalam pengujian terhadap sebuah paper ilmiah, chatbot offline mampu mengenali bahwa dokumen tersebut adalah studi literatur yang berisi ringkasan berbagai penelitian terdahulu. Dengan demikian, pengguna dapat dengan cepat memahami konteks dokumen tanpa harus membaca seluruh isinya.

Meskipun hasil yang diberikan cukup baik, chatbot offline masih memiliki keterbatasan dalam memahami dan menyajikan informasi. Dalam beberapa kasus, penggunaan prosesor yang tinggi dapat mempengaruhi kinerja perangkat, terutama jika dokumen yang diproses sangat kompleks. Namun, chatbot ini tetap memberikan manfaat dengan kemampuannya membaca abstrak, mengenali isi utama, serta memberikan gambaran umum dari sebuah artikel sebelum pengguna membacanya lebih lanjut.

Menganalisis Sentimen dengan Hugging Face

Pemanfaatan Hugging Face untuk analisis sentimen dimulai dengan proses pendaftaran guna mengakses fasilitas yang tersedia. Setelah itu, dilakukan instalasi library Transformers di Google Colab, diikuti dengan impor modul penting seperti AutoTokenizer dan AutoModel. Inferensi dilakukan dengan mengecek sentimen dari sebuah kalimat yang dimasukkan, namun hasil awal menunjukkan skor positif yang terlalu tinggi, mengindikasikan kurangnya akurasi pada model yang digunakan.

Untuk meningkatkan akurasi, model kemudian diganti dengan yang lebih sesuai, seperti IndoBERT. Model ini diunduh dan dijalankan menggunakan tokenizer serta pipeline yang tersedia. Dengan memanfaatkan BERT multilingual yang telah dilatih untuk memahami berbagai bahasa, termasuk bahasa Indonesia, analisis sentimen menunjukkan hasil yang lebih akurat. Sentimen positif dan negatif dapat diidentifikasi dengan lebih baik dibandingkan model sebelumnya.

Pengujian lebih lanjut dilakukan dengan beberapa contoh kalimat untuk memastikan keakuratan model. Input dengan sentimen negatif diuji untuk melihat apakah model dapat mengenalinya dengan benar. Hasilnya menunjukkan peningkatan akurasi, di mana skor yang semakin mendekati lima menunjukkan sentimen yang semakin positif. Dengan pendekatan ini, Hugging Face berhasil dimanfaatkan untuk analisis sentimen menggunakan Transformers, memberikan hasil yang lebih andal untuk pemrosesan bahasa alami. Lihat link Colab berikut.

Mengamankan Data di Era Digital dengan Strategi, Ancaman, dan Solusi Berbasis – Standar DAMA-BOK

Dalam postingan video di bawah, saya membahas secara mendalam mengenai keamanan data dan perlindungan informasi dalam manajemen data. Saya menjelaskan berbagai konsep dasar terkait pengamanan data, termasuk pentingnya mengenali jenis data yang dikelola serta risiko kebocoran informasi. Selain itu, saya juga menguraikan langkah-langkah preventif yang dapat diambil oleh organisasi untuk menjaga data mereka dari ancaman siber yang semakin meningkat.

Saya juga menyoroti berbagai ancaman yang dapat membahayakan keamanan data, seperti serangan siber, kebocoran informasi, serta eksploitasi terhadap sistem yang rentan. Dalam postingan ini, saya menjelaskan bagaimana metode enkripsi seperti hashing, RSA, dan AES dapat digunakan untuk menjaga kerahasiaan data. Selain itu, saya menekankan bahwa regulasi pemerintah dan kebutuhan bisnis memiliki peran penting dalam menentukan strategi keamanan data yang efektif.

Lebih lanjut, saya mengulas berbagai teknologi perlindungan, seperti firewall, PGP, serta sistem autentikasi dan otorisasi yang tepat untuk mencegah akses tidak sah. Saya juga merekomendasikan agar organisasi terus melakukan evaluasi serta pembaruan kebijakan keamanan guna menghadapi ancaman yang terus berkembang. Dengan menerapkan strategi yang tepat, saya yakin keamanan data dapat tetap terjaga, dan risiko kebocoran informasi dapat diminimalisir.

Cara Pakai AI Gratis di Laptop

Perkembangan kecerdasan buatan (AI) semakin pesat, dan salah satu yang banyak digunakan saat ini adalah model bahasa besar (LLM). Salah satu model yang tengah mendapat perhatian adalah DeepSeek, yang dapat dijalankan secara lokal di perangkat pengguna. Sejumlah antarmuka grafis (GUI) telah tersedia untuk mempermudah penggunaannya, salah satunya adalah Ollama.

DeepSeek menawarkan beberapa varian model, termasuk versi yang telah disuling (distilled) agar lebih ringan. Model aslinya berukuran sekitar 400GB, sehingga kurang praktis untuk dijalankan di laptop pribadi. Sebagai alternatif, tersedia model yang lebih kecil dengan ukuran berkisar antara 4.7GB hingga 9GB, yang lebih ramah bagi perangkat dengan keterbatasan daya komputasi.

Untuk menjalankannya, pengguna dapat mengunduh dan menginstal perangkat lunak melalui terminal. Salah satu GUI yang banyak direkomendasikan adalah LM Studio, yang memiliki tampilan lebih intuitif dibandingkan dengan antarmuka berbasis chat lainnya. LM Studio memungkinkan pengguna memilih berbagai model AI, mulai dari Llama 3.2 yang berukuran 2GB hingga model yang lebih besar seperti 70B dengan ukuran sekitar 37GB.

Keunggulan utama AI lokal seperti DeepSeek adalah kemampuannya untuk beroperasi tanpa memerlukan koneksi internet. Hal ini berbeda dengan ChatGPT, yang membutuhkan akses ke server di luar negeri. Namun, ada tantangan tersendiri dalam penggunaannya, seperti beban pemrosesan yang lebih tinggi pada CPU dan GPU, yang dapat membuat perangkat lebih panas dan proses lebih lambat dibandingkan AI berbasis cloud.

Fitur unggulan lain yang ditawarkan adalah kemampuan membaca dokumen, termasuk file Word. Berbeda dengan ChatGPT yang membatasi fitur unggah dokumen pada versi berlangganan, AI lokal memungkinkan pengguna mengakses fitur ini secara gratis. Meski demikian, pemrosesan dokumen pada AI lokal membutuhkan waktu lebih lama dibandingkan layanan berbasis cloud.

Dengan semakin banyaknya pilihan model AI lokal, pengguna kini memiliki alternatif untuk mengakses teknologi AI tanpa ketergantungan pada layanan berbayar. Meskipun prosesnya tidak secepat layanan berbasis cloud, kebebasan dan fleksibilitas yang ditawarkan menjadi nilai tambah tersendiri bagi pengguna yang mengutamakan privasi dan akses tanpa batasan kuota.

S	S	R	K	J	S	M
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

S	S	R	K	J	S	M
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31