Kecerdasan Buatan
Naluri Baru AI: Mengapa Berpikir Lebih Cerdas Lebih Penting daripada Berpikir Lebih Lama

Kemajuan dalam kecerdasan buatan (AI) telah lama didorong oleh keyakinan bahwa peningkatan data dan daya komputasi dapat meningkatkan kinerja. Pendekatan "brute force" ini telah menghasilkan sistem AI yang mengesankan, seperti GPT-3, yang telah berkinerja sangat baik selama bertahun-tahun. Namun, paradigma ini mencapai batasnya. Seiring dengan semakin kompleksnya permasalahan AI, semakin jelas bahwa sekadar menambahkan daya pemrosesan saja tidak akan menjadi solusi yang berkelanjutan atau efektif untuk kemajuan jangka panjang. Kesadaran ini telah mendorong para peneliti untuk memikirkan kembali pendekatan mereka terhadap pengembangan AI. Dalam konteks ini, Deep Cogito Cogito v2 Model ini memperkenalkan pendekatan baru yang dapat mengubah masa depan pengembangan AI. Alih-alih bergantung pada daya pemrosesan yang lebih besar atau penalaran yang lebih luas, Cogito v2 mengembangkan "naluri" internal yang memandu model untuk mengidentifikasi jalur yang tepat bahkan sebelum memulai pencarian. Ini merupakan pergeseran paradigma dalam pengembangan AI dengan berfokus pada berpikir lebih baik, bukan berpikir lebih lama.
Pergeseran dalam Pengembangan AI
Selama bertahun-tahun, kekuatan pendorong di balik kemajuan AI adalah gagasan bahwa “lebih banyak lebih baikPendekatan ini telah menghasilkan model AI yang menghasilkan rantai penalaran ekstensif untuk memecahkan masalah kompleks. Model OpenAI, seperti GPT-3, adalah contoh pendekatan ini, di mana rantai pemikiran yang lebih panjang telah menghasilkan hasil yang mengesankan pada tugas-tugas sulit. Meskipun metode ini telah menghasilkan hasil yang mengesankan, metode ini memiliki kekurangan yang signifikan. Rantai penalaran yang lebih panjang membutuhkan lebih banyak sumber daya komputasi yang mengakibatkan waktu inferensi yang lebih lambat dan biaya operasional yang lebih tinggi. Selain itu, penelitian telah menunjukkan bahwa proses yang diperpanjang ini sering kali menghasilkan hasil yang semakin berkurang, sementara penalaran yang lebih panjang menyebabkan bias yang lebih besar dan efisiensi yang lebih rendah. Masalah mendasarnya adalah bahwa mengandalkan rantai penalaran yang panjang dan meningkatkan daya komputasi tidak lagi menjadi solusi yang efektif untuk mengatasi masalah AI yang kompleks. Pendekatan ini dibatasi oleh waktu pemrosesan dan kebutuhan memori yang sangat besar.
Mengapa 'Naluri Usus' Penting bagi AI
Berbeda dengan sistem AI saat ini yang bergantung pada penalaran yang diperluas, manusia seringkali mengandalkan apa yang disebut "insting" (suatu bentuk penilaian cepat dan intuitif) untuk memecahkan masalah. Meskipun insting mungkin tampak seperti konsep abstrak, insting seringkali merupakan hasil dari pengalaman, pembelajaran, dan pemrosesan konteks selama bertahun-tahun yang memungkinkan manusia untuk membuat keputusan cepat tanpa menganalisis setiap detail secara menyeluruh. Intuisi jenis inilah yang membedakan komputasi mentah dari penalaran seperti manusia. Manusia membangun 'insting' ini melalui pengenalan pola dan pengalaman yang terakumulasi, dan hal ini memungkinkan kita untuk membuat keputusan tanpa harus mengeksplorasi setiap opsi yang memungkinkan secara mendalam. "usus naluri" bertujuan untuk meniru proses ini.
Gagasan ini, yang juga disebut sebagai "intelligence prior", dapat menjadi kunci untuk memberdayakan sistem AI dengan penalaran layaknya manusia dan membuatnya lebih efisien. Model AI dengan kecerdasan prior yang kuat dapat mengantisipasi solusi mana yang kemungkinan besar akan berhasil tanpa harus melalui komputasi yang ekstensif. Alih-alih mengandalkan metode pencarian yang komprehensif, insting memungkinkan sistem AI untuk memanfaatkan pengetahuan sebelumnya, dengan berfokus pada jalur paling efektif menuju solusi.
Bagaimana Cogito v2 Mengintegrasikan 'Instinct'
Cogito telah memasukkan gagasan 'insting' (secara teknis, kecerdasan sebelumnya) ke dalam model Cogito v2 yang baru dirilis. Mereka mengintegrasikan gagasan ini menggunakan mekanisme yang disebut Distilasi dan Amplifikasi Berulang (IDA)Mekanisme ini memungkinkan model untuk belajar dari proses penalarannya sendiri dan menyempurnakan keterampilan pemecahan masalahnya seiring waktu. Alih-alih mengandalkan perintah statis atau guru yang tetap, IDA memungkinkan AI untuk menyaring kembali jalur penalaran yang berhasil ke dalam parameter inti modelnya. Proses peningkatan diri ini menyempurnakan kemampuan penalaran model seiring waktu, mengoptimalkan tidak hanya jawaban yang akurat, tetapi juga metode berpikir yang paling efisien.
-
Distilasi dan Amplifikasi Berulang (IDA)
Untuk memahami cara kerja IDA, kita dapat melihat teori proses ganda, yang membagi pemikiran manusia menjadi dua sistem: Sistem 1 dan Sistem 2. Sistem 1 mengacu pada pengambilan keputusan yang cepat dan intuitif, sementara Sistem 2 lebih lambat, dengan penalaran yang lebih terarah. Teori ini menunjukkan bahwa manusia mengandalkan Sistem 1 untuk sebagian besar tugas, tetapi beralih ke Sistem 2 ketika dihadapkan pada keputusan yang lebih kompleks.
IDA adalah siklus dua langkah: amplifikasi dan distilasi. Pada fase amplifikasi, model menggunakan metode komputasi intensif untuk menghasilkan solusi berkualitas tinggi atau jejak penalaran. Ini seperti pemikiran Sistem 2, di mana AI meluangkan waktu untuk mengevaluasi solusi potensial secara cermat. distilasi Pada fase ini, model kemudian menginternalisasi wawasan dari fase amplifikasi, mengubah proses penalaran dari Sistem 2 ke Sistem 1. Sebagaimana pengemudi manusia menjadi lebih intuitif setelah mendapatkan pengalaman, model AI dengan IDA dapat membuat keputusan yang lebih cepat dan efisien seiring waktu.
Ide kunci di balik IDA adalah menggunakan penalaran intensif komputasional dalam fase amplifikasi, kemudian menyaring penalaran yang disempurnakan kembali ke dalam parameter model. Proses ini memungkinkan model untuk menginternalisasi strategi penalaran efektif yang membangun kapasitasnya untuk berpikir intuitif ketika memecahkan masalah. Dengan mengulangi siklus ini, sistem AI terus meningkatkan kemampuannya untuk membuat keputusan dengan sumber daya komputasi yang lebih sedikit.
Keuntungan Mengintegrasikan 'Instinct' ke dalam AI
Salah satu keunggulan utama insting AI adalah efisiensinya. Model seperti Cogito v2 menunjukkan rantai penalaran yang hingga 60% lebih pendek dibandingkan model pesaing. Ini berarti model tersebut dapat menghasilkan jawaban dengan langkah internal yang lebih sedikit, sehingga mengurangi waktu dan sumber daya yang dibutuhkan untuk inferensi. Misalnya, masalah yang mungkin membutuhkan lebih dari 1 token untuk dipecahkan oleh DeepSeek R200 dapat diselesaikan oleh Cogito v2 dalam waktu kurang dari 100 token.
Selain itu, biaya pelatihan Cogito v2 jauh lebih rendah dibandingkan model AI tradisional. Seluruh proses pelatihan Cogito v2, yang mencakup berbagai parameter, menghabiskan biaya di bawah $3.5 juta, jauh lebih rendah dibandingkan biaya yang biasanya terkait dengan model skala besar seperti GPT-4.
Cogito v2 juga telah menunjukkan kemampuan yang muncul di area yang tidak dilatih secara eksplisit. Misalnya, meskipun dilatih terutama pada teks, Cogito v2 dapat bernalar tentang gambar, mendapatkan wawasan tentang komposisi gambar dan habitat. Kemampuan penalaran lintas modalitas ini merupakan langkah signifikan menuju kecerdasan umum, sebuah tonggak penting dalam perjalanan menuju Kecerdasan Umum Buatan (AGI).
Memikirkan Kembali Pengembangan AI
Keberhasilan kecerdasan buatan menunjukkan bahwa strategi pengembangan AI membutuhkan perubahan mendasar. Alih-alih hanya meningkatkan ukuran model atau sumber daya komputasi, pengembangan AI harus berfokus pada pembangunan sistem yang dapat mengembangkan dan menyempurnakan strategi kognitifnya sendiri. Pergeseran ini mencerminkan perkembangan kognitif manusia, di mana kecerdasan bukanlah hasil dari otak yang lebih besar atau waktu berpikir yang lebih lama, melainkan model mental dan strategi penalaran yang lebih baik. Perubahan pendekatan ini dapat memiliki implikasi jangka panjang. Dengan menekankan penalaran yang lebih cerdas daripada daya komputasi murni, AI dapat menjadi lebih fleksibel, adaptif, dan mampu menangani tantangan baru. Pergeseran ini dapat mempercepat penerapan AI dalam industri seperti layanan kesehatan, keamanan siber, dan transportasi otonom, sehingga menjadikan sistem AI lebih efisien, hemat biaya, dan berdampak.
The Bottom Line
Keberhasilan Cogito v2 menunjukkan bahwa masa depan AI bukan terletak pada peningkatan skala model atau daya komputasi, melainkan pada penyempurnaan arsitektur penalaran dan pengoptimalan untuk pemecahan masalah yang lebih cerdas. Pergeseran ini menjanjikan masa depan AI yang lebih berkelanjutan dan mudah diakses, di mana sistem dapat terus berkembang dan beradaptasi dengan lebih sedikit ketergantungan pada sumber daya komputasi yang besar. Dengan berfokus pada penalaran cerdas, alih-alih komputasi brute-force, AI dapat menjadi lebih mampu menangani masalah dunia nyata yang kompleks.