Pemimpin Pikiran
LLM Khusus untuk Setiap Bisnis? DeepSeek Menunjukkan Jalannya

Dahulu kala, seruan teknologi adalah “ponsel untuk semua orang” – dan komunikasi seluler memang telah merevolusi bisnis (dan dunia). Saat ini, hal yang setara dengan seruan tersebut adalah memberikan akses kepada semua orang ke AI aplikasi. Namun, kekuatan AI yang sesungguhnya terletak pada pemanfaatannya untuk kebutuhan khusus bisnis dan organisasi. Jalan yang dirintis oleh perusahaan rintisan Tiongkok DeepSeek menunjukkan bagaimana AI benar-benar dapat dimanfaatkan oleh semua orang, terutama mereka yang memiliki anggaran terbatas, untuk memenuhi kebutuhan khusus mereka. Memang, munculnya AI berbiaya rendah menjanjikan perubahan pola solusi AI yang sudah mengakar kuat yang sering kali tidak terlihat oleh banyak bisnis dan organisasi kecil karena persyaratan biaya.
LLM adalah – atau dulunya – sebuah usaha yang mahal, yang membutuhkan akses ke sejumlah besar data, sejumlah besar komputer canggih untuk memproses data, dan waktu serta sumber daya yang diinvestasikan dalam pelatihan model. Namun, aturan tersebut berubah. Beroperasi dengan anggaran terbatas, DeepSeek mengembangkan LLM-nya sendiri, dan aplikasi tipe ChatGPT untuk kueri – dengan investasi yang jauh lebih kecil daripada sistem serupa yang dibuat oleh perusahaan Amerika dan Eropa. Pendekatan DeepSeek membuka jendela pengembangan LLM untuk organisasi yang lebih kecil yang tidak memiliki miliaran untuk dibelanjakan. Faktanya, hari itu mungkin tidak lama lagi ketika sebagian besar organisasi kecil dapat mengembangkan LLM mereka sendiri untuk melayani tujuan spesifik mereka sendiri, biasanya memberikan solusi yang lebih efektif daripada LLM umum seperti ChatGPT.
Sementara perdebatan tetap lebih dari sekadar biaya sebenarnya dari DeepSeek, bukan hanya biayanya saja yang membedakannya dengan model serupa: Ini adalah fakta bahwa ia mengandalkan chip yang kurang canggih dan pendekatan yang lebih terfokus pada pelatihan. Sebagai perusahaan Tiongkok yang tunduk pada pembatasan ekspor AS, DeepSeek tidak dapat mengakses chip Nvidia canggih yang umumnya digunakan untuk komputasi tugas berat yang diperlukan untuk pengembangan LLM, dan karena itu terpaksa menggunakan chip Nvidia H-800 yang kurang bertenaga, yang tidak dapat memproses data dengan cepat atau efisien.
Untuk mengimbangi kurangnya daya tersebut, DeepSeek mengambil pendekatan yang berbeda, lebih terfokus, dan langsung terhadap pengembangan LLM-nya. Alih-alih melemparkan segunung data ke suatu model dan mengandalkan kekuatan komputasi untuk memberi label dan menerapkan data tersebut, DeepSeek mempersempit pelatihan, memanfaatkan sejumlah kecil data “cold-start” berkualitas tinggi dan menerapkan IRL (pembelajaran penguatan iteratif, dengan algoritme yang menerapkan data ke berbagai skenario dan belajar darinya). Pendekatan yang terfokus ini memungkinkan model untuk belajar lebih cepat, dengan lebih sedikit kesalahan dan lebih sedikit daya komputasi yang terbuang.
Mirip dengan bagaimana orang tua dapat memandu gerakan khusus bayi, membantunya berguling dengan sukses untuk pertama kalinya – daripada membiarkan bayi mencari tahu sendiri, atau mengajari bayi berbagai gerakan yang lebih luas yang secara teori dapat membantu berguling – ilmuwan data yang melatih model AI yang lebih terfokus ini berfokus pada apa yang paling dibutuhkan untuk tugas dan hasil tertentu. Model semacam itu kemungkinan tidak memiliki aplikasi yang dapat diandalkan seluas LLM yang lebih besar seperti ChatGPT, tetapi dapat diandalkan untuk aplikasi tertentu, dan menjalankannya dengan presisi dan efisiensi. Bahkan kritikus DeepSeek mengakui bahwa pendekatannya yang efisien terhadap pengembangan secara signifikan meningkatkan efisiensi, memungkinkannya melakukan lebih banyak hal dengan jauh lebih sedikit.
Pendekatan ini adalah tentang memberikan AI masukan terbaik sehingga dapat mencapai tonggak sejarahnya dengan cara yang paling cerdas dan paling efisien, dan dapat berharga bagi organisasi mana pun yang ingin mengembangkan LLM untuk kebutuhan dan tugas spesifiknya. Pendekatan semacam itu semakin berharga bagi bisnis dan organisasi kecil. Langkah pertama adalah memulai dengan data yang tepat. Misalnya, perusahaan yang ingin menggunakan AI untuk membantu tim penjualan dan pemasarannya harus melatih modelnya pada kumpulan data yang dipilih dengan cermat yang mengasah percakapan, strategi, dan metrik penjualan. Ini mencegah model membuang-buang waktu dan daya komputasi pada informasi yang tidak relevan. Selain itu, pelatihan perlu disusun secara bertahap, memastikan model menguasai setiap tugas atau konsep sebelum beralih ke yang berikutnya.
Hal ini juga memiliki kesamaan dalam membesarkan bayi, seperti yang saya pelajari sendiri sejak menjadi seorang ibu beberapa bulan lalu. Dalam kedua skenario tersebut, pendekatan yang dipandu dan bertahap menghindari pemborosan sumber daya dan mengurangi gesekan. Terakhir, pendekatan seperti itu dengan bayi manusia dan model AI menghasilkan peningkatan berulang. Saat bayi tumbuh, atau model belajar lebih banyak, kemampuannya meningkat. Ini berarti model dapat disempurnakan dan ditingkatkan untuk menangani situasi dunia nyata dengan lebih baik.
Pendekatan ini menekan biaya, mencegah proyek AI menjadi pemborosan sumber daya, sehingga lebih mudah diakses oleh tim dan organisasi yang lebih kecil. Pendekatan ini juga menghasilkan kinerja model AI yang lebih baik dengan lebih cepat; dan, karena model tidak dibebani dengan data yang tidak relevan, model juga dapat disesuaikan untuk beradaptasi dengan informasi baru dan perubahan kebutuhan bisnis – yang menjadi kunci dalam pasar yang kompetitif.
Kedatangan DeepSeek dan dunia AI yang lebih murah dan lebih efisien – meskipun awalnya menyebarkan kepanikan di seluruh dunia AI dan pasar saham – secara keseluruhan merupakan perkembangan positif bagi sektor AI. Efisiensi yang lebih besar dan biaya AI yang lebih rendah, setidaknya untuk aplikasi tertentu yang terfokus, pada akhirnya akan menghasilkan lebih banyak penggunaan AI secara umum, yang mendorong pertumbuhan bagi semua orang, mulai dari pengembang hingga pembuat chip hingga pengguna akhir. Faktanya, DeepSeek mengilustrasikan Paradoks Jevons – di mana efisiensi yang lebih tinggi kemungkinan besar akan menghasilkan penggunaan sumber daya yang lebih banyak, bukan lebih sedikit. Karena tren ini tampaknya akan terus berlanjut, usaha kecil yang berfokus pada penggunaan AI untuk memenuhi kebutuhan spesifik mereka juga akan lebih siap untuk tumbuh dan sukses.