Robotika

Bagaimana Robot Belajar Minta Bantuan

Diterbitkan 1 Desember 2023

Diperbarui 22 Mei 2026

Oleh

Alex McFarland

Dalam dunia robotika yang terus berkembang, sebuah kolaborasi inovatif antara Universitas Princeton dan Google menonjol. Insinyur dari lembaga-lembaga bergengsi ini telah mengembangkan metode baru yang mengajarkan robot keterampilan penting: mengenali kapan mereka membutuhkan bantuan dan bagaimana meminta bantuan. Pengembangan ini menandai lompatan besar dalam robotika, menjembatani kesenjangan antara fungsi otonom dan interaksi manusia-robot.

Perjalanan menuju robot yang lebih pintar dan mandiri selalu dihambat oleh satu tantangan signifikan: kompleksitas dan ketidakjelasan bahasa manusia. Tidak seperti kejelasan biner kode komputer, bahasa manusia dipenuhi dengan nuansa dan kesubtletan, membuatnya menjadi labirin bagi robot. Misalnya, perintah sederhana seperti “angkat mangkuk” dapat menjadi tugas kompleks ketika beberapa mangkuk hadir. Robot, yang dilengkapi untuk memahami lingkungan dan merespons bahasa, sering kali menemukan diri mereka di persimpangan ketika menghadapi ketidakjelasan linguistik seperti itu.

Mengukur Ketidakpastian

Untuk mengatasi tantangan ini, tim Princeton dan Google telah memperkenalkan pendekatan baru yang mengukur ‘kekaburan’ bahasa manusia. Teknik ini pada dasarnya mengukur tingkat ketidakpastian dalam perintah bahasa dan menggunakan metrik ini untuk memandu tindakan robot. Dalam situasi di mana perintah mungkin mengarah ke beberapa interpretasi, robot sekarang dapat mengukur tingkat ketidakpastian dan memutuskan kapan harus mencari klarifikasi lebih lanjut. Misalnya, dalam lingkungan dengan beberapa mangkuk, tingkat ketidakpastian yang lebih tinggi akan meminta robot untuk bertanya mangkuk mana yang harus diangkat, sehingga menghindari kesalahan atau ketidakefisienan potensial.

Pendekatan ini tidak hanya memberdayakan robot dengan pemahaman bahasa yang lebih baik, tetapi juga meningkatkan keselamatan dan efisiensi mereka dalam mengeksekusi tugas. Dengan mengintegrasikan model bahasa besar (LLM) seperti yang digunakan di balik ChatGPT, peneliti telah mengambil langkah signifikan dalam menyelaraskan tindakan robot lebih dekat dengan harapan dan kebutuhan manusia.

Peran Model Bahasa Besar

Integrasi LLM memainkan peran penting dalam pendekatan baru ini. LLM sangat penting dalam memproses dan menafsirkan bahasa manusia. Dalam konteks ini, mereka digunakan untuk mengevaluasi dan mengukur ketidakpastian yang ada dalam perintah bahasa yang diberikan kepada robot.

Namun, ketergantungan pada LLM tidak tanpa tantangan. Seperti yang ditekankan oleh tim peneliti, output dari LLM terkadang dapat tidak dapat diandalkan.

Anirudha Majumdar, asisten profesor di Princeton, menekankan pentingnya keseimbangan ini:

“Mengikuti rencana yang dihasilkan oleh LLM secara buta dapat menyebabkan robot bertindak dengan cara yang tidak aman atau tidak dapat dipercaya, dan sehingga kita perlu robot LLM kita untuk mengetahui kapan mereka tidak tahu.”

Hal ini menyoroti kebutuhan akan pendekatan yang lebih halus, di mana LLM digunakan sebagai alat bimbingan daripada pembuat keputusan yang tidak dapat diandalkan.

Aplikasi Praktis dan Pengujian

Kemampuan praktis metode ini telah diuji dalam berbagai skenario, menunjukkan fleksibilitas dan efektivitasnya. Salah satu pengujian melibatkan lengan robot, yang ditugaskan untuk mengategorikan makanan mainan ke dalam kategori yang berbeda. Pengaturan sederhana ini menunjukkan kemampuan robot untuk menavigasi tugas dengan pilihan yang jelas secara efektif.

Gambar: Universitas Princeton

Kompleksitas meningkat secara signifikan dalam eksperimen lain yang menampilkan lengan robot yang dipasang pada platform roda di dapur kantor. Di sini, robot menghadapi tantangan dunia nyata seperti mengidentifikasi item yang benar untuk ditempatkan di microwave ketika diberikan beberapa pilihan.

Melalui pengujian ini, robot berhasil menunjukkan kemampuan mereka untuk menggunakan ketidakpastian yang diukur untuk membuat keputusan atau mencari klarifikasi, sehingga memvalidasi utilitas praktis metode ini.

Implikasi Masa Depan dan Penelitian

Menghadap ke depan, implikasi penelitian ini meluas jauh melampaui aplikasi saat ini. Tim, yang dipimpin oleh Majumdar dan mahasiswa pascasarjana Allen Ren, sedang menjelajahi bagaimana pendekatan ini dapat diterapkan pada masalah yang lebih kompleks dalam persepsi robot dan kecerdasan buatan. Ini termasuk skenario di mana robot perlu menggabungkan informasi visual dan bahasa untuk membuat keputusan, lebih lanjut menutup kesenjangan antara pemahaman robot dan interaksi manusia.

Penelitian yang sedang berlangsung bertujuan tidak hanya untuk meningkatkan kemampuan robot untuk menyelesaikan tugas dengan akurasi yang lebih tinggi tetapi juga untuk menavigasi dunia dengan pemahaman yang serupa dengan kognisi manusia. Penelitian ini dapat membuka jalan bagi robot yang tidak hanya lebih efisien dan aman tetapi juga lebih sesuai dengan tuntutan nuansa lingkungan manusia.

Anda dapat menemukan penelitian yang diterbitkan di sini.

Alex McFarland

Alex McFarland adalah seorang jurnalis dan penulis AI yang menjelajahi perkembangan terbaru dalam kecerdasan buatan. Ia telah berkolaborasi dengan berbagai startup dan publikasi AI di seluruh dunia.

Unite.AI

Bagaimana Robot Belajar Minta Bantuan

Mengukur Ketidakpastian

Peran Model Bahasa Besar

Aplikasi Praktis dan Pengujian

Implikasi Masa Depan dan Penelitian

You may like