Kecerdasan buatan

Evolusi Mind DeepMind: Mempower Large Language Models untuk Pemecahan Masalah Dunia Nyata

Published February 6, 2025

Updated April 26, 2026

Dr. Tehseen Zia

Dalam beberapa tahun terakhir, kecerdasan buatan (AI) telah muncul sebagai alat praktis untuk menggerakkan inovasi di seluruh industri. Di garis depan kemajuan ini adalah model bahasa besar (LLMs) yang dikenal karena kemampuan mereka untuk memahami dan menghasilkan bahasa manusia. Sementara LLMs berperforma baik pada tugas seperti AI konversasional dan pembuatan konten, mereka sering mengalami kesulitan dengan tantangan dunia nyata yang kompleks yang memerlukan penalaran terstruktur dan perencanaan.

Misalnya, jika Anda meminta LLMs untuk merencanakan perjalanan bisnis multi-kota yang melibatkan koordinasi jadwal penerbangan, waktu pertemuan, keterbatasan anggaran, dan istirahat yang cukup, mereka dapat memberikan saran untuk aspek individu. Namun, mereka sering menghadapi kesulitan dalam mengintegrasikan aspek-aspek ini untuk secara efektif menyeimbangkan prioritas yang bersaing. Keterbatasan ini menjadi lebih jelas ketika LLMs semakin digunakan untuk membangun agen AI yang mampu memecahkan masalah dunia nyata secara otonom.

Google DeepMind baru-baru ini mengembangkan solusi untuk mengatasi masalah ini. Terinspirasi oleh seleksi alam, pendekatan ini, yang dikenal sebagai Mind Evolution, memperhalus strategi pemecahan masalah melalui adaptasi iteratif. Dengan membimbing LLMs secara real-time, itu memungkinkan mereka untuk menangani tugas dunia nyata yang kompleks secara efektif dan beradaptasi dengan skenario dinamis. Dalam artikel ini, kita akan menjelajahi bagaimana metode inovatif ini bekerja, aplikasi potensialnya, dan apa yang dimaksud untuk masa depan pemecahan masalah yang didorong oleh AI.

Mengapa LLMs Mengalami Kesulitan dengan Penalaran dan Perencanaan yang Kompleks

LLMs dilatih untuk memprediksi kata berikutnya dalam kalimat dengan menganalisis pola dalam dataset teks besar, seperti buku, artikel, dan konten online. Ini memungkinkan mereka untuk menghasilkan respons yang tampak logis dan kontekstual. Namun, pelatihan ini didasarkan pada pengenalan pola rather than pemahaman makna. Sebagai hasilnya, LLMs dapat menghasilkan teks yang tampak logis tetapi mengalami kesulitan dengan tugas yang memerlukan penalaran yang lebih dalam atau perencanaan terstruktur.

Keterbatasan inti terletak pada bagaimana LLMs memproses informasi. Mereka fokus pada probabilitas atau pola rather than logika, yang berarti mereka dapat menangani tugas terisolasi—seperti menyarankan pilihan penerbangan atau rekomendasi hotel—tetapi gagal ketika tugas-tugas ini perlu diintegrasikan ke dalam rencana yang kohesif. Ini juga membuatnya sulit bagi mereka untuk mempertahankan konteks seiring waktu. Tugas kompleks sering memerlukan pemantauan keputusan sebelumnya dan beradaptasi ketika informasi baru muncul. LLMs, bagaimanapun, cenderung kehilangan fokus dalam interaksi yang diperpanjang, menghasilkan output yang terfragmentasi atau inkonsisten.

Bagaimana Mind Evolution Bekerja

Mind Evolution DeepMind mengatasi keterbatasan ini dengan mengadopsi prinsip dari evolusi alam. Sebagai gantinya menghasilkan satu respons untuk pertanyaan kompleks, pendekatan ini menghasilkan beberapa solusi potensial, memperhalusnya secara iteratif, dan memilih hasil terbaik melalui proses evaluasi terstruktur. Misalnya, pertimbangkan tim brainstorming ide untuk proyek. Beberapa ide bagus, yang lain kurang. Tim mengevaluasi semua ide, menyimpan yang terbaik dan membuang sisanya. Mereka kemudian memperbaiki ide terbaik, memperkenalkan variasi baru, dan mengulangi proses sampai mereka tiba pada solusi terbaik. Mind Evolution menerapkan prinsip ini pada LLMs.

Berikut adalah breakdown tentang bagaimana itu bekerja:

Generasi: Proses dimulai dengan LLM membuat beberapa respons untuk pertanyaan yang diberikan. Misalnya, dalam tugas perencanaan perjalanan, model mungkin menggambar berbagai itinerari berdasarkan anggaran, waktu, dan preferensi pengguna.
Evaluasi: Setiap solusi dievaluasi melawan fungsi kebugaran, ukuran seberapa baik itu memuaskan persyaratan tugas. Respons berkualitas rendah dibuang, sementara kandidat paling menjanjikan maju ke tahap berikutnya.
Pemurnian: Inovasi unik dari Mind Evolution adalah dialog antara dua persona dalam LLM: Penulis dan Kritikus. Penulis mengusulkan solusi, sementara Kritikus mengidentifikasi kelemahan dan menawarkan umpan balik. Dialog terstruktur ini mencerminkan bagaimana manusia memperbaiki ide melalui kritik dan revisi. Misalnya, jika Penulis menyarankan rencana perjalanan yang mencakup kunjungan restoran yang melebihi anggaran, Kritikus menunjukkannya. Penulis kemudian merevisi rencana untuk mengatasi kekhawatiran Kritikus. Proses ini memungkinkan LLMs untuk melakukan analisis mendalam yang tidak dapat mereka lakukan sebelumnya menggunakan teknik penandaan lain.
Optimasi Iteratif: Solusi yang diperbarui menjalani evaluasi dan rekombinasi lebih lanjut untuk menghasilkan solusi yang diperbarui.

Dengan mengulangi siklus ini, Mind Evolution secara iteratif memperbaiki kualitas solusi, memungkinkan LLMs untuk menangani tantangan kompleks lebih efektif.

Mind Evolution dalam Aksi

DeepMind menguji pendekatan ini pada benchmarks seperti TravelPlanner dan Natural Plan. Menggunakan pendekatan ini, Gemini Google mencapai tingkat keberhasilan 95,2% pada TravelPlanner, yang merupakan perbaikan luar biasa dari baseline 5,6%. Dengan Gemini Pro yang lebih maju, tingkat keberhasilan meningkat hingga hampir 99,9%. Kinerja transformasional ini menunjukkan efektivitas evolusi pikiran dalam menangani tantangan praktis.

Menariknya, efektivitas model tumbuh dengan kompleksitas tugas. Misalnya, sementara metode single-pass mengalami kesulitan dengan itinerari multi-hari yang melibatkan beberapa kota, Mind Evolution konsisten outperform, mempertahankan tingkat keberhasilan tinggi bahkan ketika jumlah keterbatasan meningkat.

Tantangan dan Arah Masa Depan

Meskipun kesuksesannya, Mind Evolution tidak tanpa keterbatasan. Pendekatan ini memerlukan sumber daya komputasi yang signifikan karena proses evaluasi dan pemurnian iteratif. Misalnya, memecahkan tugas TravelPlanner dengan Mind Evolution mengonsumsi tiga juta token dan 167 panggilan API—substantially lebih banyak daripada metode konvensional. Namun, pendekatan ini tetap lebih efisien daripada strategi brute-force seperti pencarian exhaustif.

Selain itu, merancang fungsi kebugaran yang efektif untuk tugas tertentu bisa menjadi tugas yang menantang. Penelitian masa depan mungkin fokus pada optimasi efisiensi komputasi dan memperluas teknik ini untuk berbagai masalah, seperti penulisan kreatif atau pengambilan keputusan yang kompleks.

Area lain yang menarik untuk dijelajahi adalah integrasi evaluator domain-spesifik. Misalnya, dalam diagnosis medis, mengintegrasikan pengetahuan ahli ke dalam fungsi kebugaran dapat lebih meningkatkan akurasi dan keandalan model.

Aplikasi di Luar Perencanaan

Meskipun Mind Evolution terutama dievaluasi pada tugas perencanaan, itu bisa diterapkan pada berbagai domain, termasuk penulisan kreatif, penemuan ilmiah, dan bahkan generasi kode. Misalnya, peneliti telah memperkenalkan benchmark yang disebut StegPoet, yang menantang model untuk mengkodekan pesan tersembunyi dalam puisi. Meskipun tugas ini tetap sulit, Mind Evolution melampaui metode tradisional dengan mencapai tingkat keberhasilan hingga 79,2%.

Kemampuan untuk beradaptasi dan mengembangkan solusi dalam bahasa alami membuka kemungkinan baru untuk menangani masalah yang sulit untuk diformalisasi, seperti memperbaiki alur kerja atau menghasilkan desain produk inovatif. Dengan menggunakan kekuatan algoritma evolusioner, Mind Evolution menyediakan kerangka yang fleksibel dan scalable untuk meningkatkan kemampuan pemecahan masalah LLMs.

Intinya

Mind Evolution DeepMind memperkenalkan cara praktis dan efektif untuk mengatasi keterbatasan kunci dalam LLMs. Dengan menggunakan pemurnian iteratif yang terinspirasi oleh seleksi alam, itu meningkatkan kemampuan model ini untuk menangani tugas kompleks, multi-langkah yang memerlukan penalaran terstruktur dan perencanaan. Pendekatan ini telah menunjukkan kesuksesan signifikan dalam skenario yang menantang seperti perencanaan perjalanan dan menunjukkan janji di berbagai domain, termasuk penulisan kreatif, penelitian ilmiah, dan generasi kode. Sementara tantangan seperti biaya komputasi tinggi dan kebutuhan akan fungsi kebugaran yang dirancang dengan baik tetap ada, pendekatan ini menyediakan kerangka yang scalable untuk meningkatkan kemampuan AI. Mind Evolution menetapkan panggung untuk sistem AI yang lebih kuat yang mampu berpikir dan merencanakan untuk memecahkan tantangan dunia nyata.

Dr. Tehseen Zia

Dr. Tehseen Zia adalah Profesor Asosiasi Tetap di COMSATS University Islamabad, memegang gelar PhD di AI dari Vienna University of Technology, Austria. Mengkhususkan diri dalam Kecerdasan Buatan, Pembelajaran Mesin, Ilmu Data, dan Penglihatan Komputer, ia telah membuat kontribusi signifikan dengan publikasi di jurnal ilmiah terkemuka. Dr. Tehseen juga telah memimpin berbagai proyek industri sebagai Penyelidik Utama dan menjabat sebagai Konsultan AI.