Kecerdasan buatan

Sapient Intelligence Mengumumkan HRM-Text, Model AI yang Terinspirasi Otak yang Dibangun untuk Mengalahkan Perlombaan Skala-Pertama

mm

Saat industri AI terus mengeluarkan miliaran dolar untuk model bahasa yang lebih besar dan pusat data yang lebih masif, perusahaan riset AI asal Singapura Sapient Intelligence mengambil pendekatan yang sangat berbeda.

Perusahaan ini telah mengumumkan HRM-Text, model bahasa alasan baru dengan 1 miliar parameter yang dirancang di sekitar arsitektur berulang hierarkis yang terinspirasi oleh cara otak memisahkan pemrosesan yang lambat dan sengaja dari pemrosesan yang cepat dan lebih rendah.

Daripada mencoba memenangkan melalui skala murni, Sapient memposisikan HRM-Text sebagai bukti bahwa kedalaman alasan dan efisiensi komputasi mungkin menjadi lebih penting daripada hitungan parameter mentah dalam fase selanjutnya dari pengembangan AI.

Peluncuran ini juga melanjutkan tren yang lebih luas yang muncul di seluruh sektor AI: skeptisisme yang tumbuh bahwa hanya dengan menskala transformer secara tak terbatas akan cukup untuk mencapai bentuk inteligensi yang lebih umum.

Melampaui Buku Petunjuk Transformer

Sebagian besar model bahasa besar modern bergantung pada arsitektur Transformer yang memproses informasi melalui sistem yang sebagian besar feed-forward yang fokus pada prediksi token berikutnya. Kerangka HRM Sapient memperkenalkan struktur berulang hierarkis di mana beberapa lapisan alasan berinteraksi secara internal sebelum output dihasilkan.

Perusahaan menjelaskan arsitektur ini beroperasi melalui dua sistem yang saling terkait: kontroler “lambat” tingkat atas yang bertanggung jawab atas perencanaan abstrak dan alasan, dan pekerja “cepat” tingkat bawah yang menangani perhitungan rinci.

Ini berbeda dari metode rantai pikiran yang secara luas digunakan dalam sistem AI saat ini, di mana alasan dinyatakan melalui urutan teks yang panjang dan terlihat. HRM-Text melakukan sebagian besar alasan secara internal dalam ruang laten sebelum menghasilkan respons.

Sapient berargumen bahwa struktur ini memungkinkan sistem yang lebih kecil untuk melakukan alasan multi-langkah yang lebih canggih tanpa bergantung pada ukuran model yang besar atau biaya inferensi yang masif.

Menurut hasil benchmark yang disediakan oleh perusahaan, HRM-Text mencapai 56,2% pada MATH, 81,9% pada ARC-Challenge, 82,2% pada DROP, dan 60,7% pada MMLU meskipun jejaknya yang relatif kecil.

Efisiensi Menjadi Pertempuran Strategis AI

Peluncuran ini tiba pada saat ketika kekhawatiran seputar biaya infrastruktur AI, konsumsi daya, dan ketersediaan komputasi menjadi isu industri sentral.

Melatih dan menerapkan sistem AI mutakhir sekarang sering memerlukan klaster GPU besar, pusat data hyperscale, dan tingkat konsumsi energi yang semakin diperiksa oleh pemerintah dan penyedia infrastruktur. Argumen Sapient adalah bahwa terobosan di masa depan mungkin tidak datang dari menskala sistem yang lebih besar, tetapi dari merancang ulang arsitektur itu sendiri.

Perusahaan ini mengklaim bahwa HRM-Text dapat dilatih dalam sekitar satu hari menggunakan 16 GPU di dua mesin dengan biaya sekitar $1.000. Dibandingkan dengan model bahasa skala depan yang memerlukan anggaran pelatihan yang mencapai ratusan juta dolar.

Profil penerapan model yang kompak juga sangat mencolok. Pada kuantisasi int4, HRM-Text dilaporkan menempati sekitar 0,6 GiB, membuat penerapan lokal di smartphone dan perangkat tepi secara teoretis memungkinkan.

Fokus pada sistem yang lebih kecil dan lebih dapat diterapkan ini dapat menjadi semakin penting karena perusahaan mendorong AI pada perangkat, inferensi yang sensitif terhadap privasi, dan sistem alasan offline yang tidak sepenuhnya bergantung pada infrastruktur cloud.

Dorongan yang Lebih Luas Menuju AI yang Terinspirasi Otak

Kerja Sapient mencerminkan gerakan yang lebih luas dalam penelitian AI yang menjelajahi alternatif dari penskalaan transformer tradisional.

Arsitektur HRM perusahaan ini banyak mengambil konsep dari neurosains seperti pemrosesan hierarkis, pemisahan temporal, dan komputasi berulang.

Di situs webnya, Sapient menjelaskan tujuan jangka panjangnya sebagai mengejar Kecerdasan Buatan Umum melalui arsitektur yang mampu melakukan alasan, perencanaan, dan pembelajaran adaptif daripada mengandalkan memorisasi statistik.

Tim penelitian perusahaan ini termasuk mantan kontributor dari organisasi seperti DeepMind, DeepSeek, dan xAI, serta peneliti yang terhubung dengan lembaga seperti MIT, Carnegie Mellon University, Tsinghua University, dan Universitas Cambridge.

Versi sebelumnya dari Model Alasan Hierarkis Sapient telah menarik perhatian dalam lingkaran penelitian AI karena mencapai kinerja alasan yang kuat menggunakan hitungan parameter yang jauh lebih kecil daripada LLM konvensional.

Perubahan dalam Cara Kemajuan AI Diukur

Apakah arsitektur seperti HRM pada akhirnya akan menyaingi model terbesar di garis depan masih merupakan pertanyaan terbuka. Industri AI telah berulang kali melihat alternatif yang menjanjikan muncul sebelum diatasi oleh ekonomi skala yang tak henti-hentinya.

Meskipun demikian, peluncuran Sapient tiba pada saat ketika industri ini semakin menghadapi keterbatasan ekspansi brute. Kekurangan GPU, botol leher daya, biaya inferensi, dan pengembalian yang menurun dari dataset yang lebih besar memaksa peneliti untuk mempertanyakan asumsi yang telah mendominasi beberapa tahun terakhir pengembangan AI.

Jika sistem seperti HRM-Text terus ditingkatkan, mereka dapat mengubah cara kemajuan AI diukur — mengalihkan perhatian dari hitungan parameter dan menuju efisiensi, kedalaman alasan, dan kemampuan adaptasi.

Perusahaan ini telah membuka sumber HRM-Text secara penuh melalui GitHub sebagai bagian dari peluncuran.

Antoine adalah seorang pemimpin visioner dan mitra pendiri Unite.AI, didorong oleh semangat yang tak tergoyahkan untuk membentuk dan mempromosikan masa depan AI dan robotika. Seorang wirausaha serial, ia percaya bahwa AI akan sama-sama mengganggu masyarakat seperti listrik, dan sering tertangkap berbicara tentang potensi teknologi mengganggu dan AGI.

As a futurist, ia berdedikasi untuk mengeksplorasi bagaimana inovasi ini akan membentuk dunia kita. Selain itu, ia adalah pendiri Securities.io, sebuah platform yang fokus pada investasi di teknologi-teknologi canggih yang mendefinisikan kembali masa depan dan membentuk kembali seluruh sektor.