Connect with us

Robotika

Meningkatkan Embodied AI: Bagaimana Meta Membawa Sentuhan dan Kelincahan Menyerupai Manusia ke AI

mm

AI telah berkembang pesat dalam persepsi visual dan pemrosesan bahasa. Namun, kemampuan ini tidak cukup untuk membangun sistem yang dapat berinteraksi dengan dunia fisik. Manusia menangani objek atau membuat gerakan terkontrol menggunakan indera peraba. Kami merasakan tekstur, mengindera suhu, dan mengukur berat untuk memandu setiap aksi dengan akurasi. Umpan balik taktil ini memungkinkan kami untuk memanipulasi barang-barang rapuh, menggunakan alat dengan kontrol, dan melakukan tugas-tugas rumit dengan mulus.

Meta, yang terkenal karena karyanya dalam realitas virtual dan augmented, sekarang menghadapi tantangan menciptakan AI yang dapat berinteraksi dengan dunia fisik seperti manusia. Melalui inisiatif FAIR Robotics, Meta mengembangkan alat dan kerangka kerja sumber terbuka untuk meningkatkan indera peraba dan kelincahan fisik robot. Upaya ini dapat mengarah pada pengembangan embodied AI — sistem yang tidak hanya melihat tetapi juga dapat merasakan dan memanipulasi objek seperti yang dilakukan manusia.

Apa itu Embodied AI?

Embodied AI menggabungkan interaksi fisik dengan kecerdasan buatan, memungkinkan mesin untuk merasakan, merespons, dan berinteraksi secara alami dengan lingkungannya. Alih-alih hanya “melihat” atau “mendengar” input, ini memungkinkan sistem AI untuk merasakan dan bertindak di dunia. Bayangkan sebuah robot yang dapat merasakan tekanan yang diterapkan pada sebuah objek, menyesuaikan genggamannya, dan bergerak dengan lincah. Embodied AI memindahkan AI dari layar dan speaker ke dunia fisik, membuatnya mampu memanipulasi objek, melakukan tugas, dan berinteraksi lebih bermakna dengan orang.

Misalnya, sebuah robot yang dibangun pada Embodied AI bisa membantu seorang lanjut usia mengambil barang-barang rapuh tanpa merusaknya. Dalam perawatan kesehatan, itu bisa membantu dokter dengan memegang instrumen secara tepat selama operasi. Potensi ini jauh melampaui lengan robot di laboratorium atau lengan otomatis di pabrik; ini tentang menciptakan mesin yang memahami dan merespons lingkungan fisik mereka secara real-time.

Pendekatan Meta terhadap Embodied AI

Meta fokus pada tiga area kunci untuk membawa embodied AI lebih dekat ke sentuhan menyerupai manusia. Pertama, perusahaan ini mengembangkan teknologi penginderaan taktil canggih yang memungkinkan mesin untuk mendeteksi hal-hal seperti tekanan, tekstur, dan suhu. Kedua, Meta menciptakan model persepsi sentuhan yang memungkinkan AI untuk memahami dan merespons sinyal-sinyal ini. Terakhir, Meta membangun platform pengembangan taktil yang mengintegrasikan beberapa sensor dengan model persepsi ini, menawarkan sistem lengkap untuk membangun AI yang dapat disentuh. Berikut adalah bagaimana Meta mendorong kemajuan dalam embodied AI di setiap area ini.

Meta Digit 360: Penginderaan Taktil Tingkat Manusia

Meta telah memperkenalkan Digit 360 ujung jari, sebuah teknologi penginderaan taktil yang dirancang untuk memberikan embodied AI sentuhan menyerupai manusia. Dengan lebih dari 18 fitur penginderaan, itu dapat mendeteksi getaran, panas, dan bahkan bahan kimia di permukaan. Dilengkapi dengan chip AI, ujung jari memproses data sentuhan secara instan, memungkinkan respon cepat terhadap input seperti panas kompor atau tusukan jarum. Teknologi ini bertindak sebagai “sistem saraf perifer” dalam embodied AI, mensimulasikan respon refleksif serupa dengan reaksi manusia. Meta telah mengembangkan ujung jari ini dengan sistem optik unik yang berisi lebih dari 8 juta taxels yang dapat menangkap sentuhan dari setiap sudut. Ini mendeteksi detail kecil, hingga gaya sekecil satu millinewton, memberikan embodied AI kepekaan yang sangat halus terhadap lingkungannya.

Meta Sparsh: Dasar untuk Persepsi Taktil

Meta meningkatkan kemampuan persepsi sentuhan untuk membantu AI memahami dan merespons sensasi fisik. Dinamai dari kata Sanskerta untuk “sentuhan”, Sparsh bertindak sebagai “otak sentuhan” untuk embodied AI. Model ini memungkinkan mesin untuk menafsirkan sinyal taktil kompleks seperti tekanan dan genggaman.

Salah satu fitur unggulan Sparsh adalah fleksibilitasnya. Sistem taktil tradisional menggunakan model terpisah untuk setiap tugas, sangat bergantung pada data yang diberi label dan sensor tertentu. Sparsh mengubah pendekatan ini sepenuhnya. Sebagai model tujuan umum, itu beradaptasi dengan berbagai sensor dan tugas. Ini belajar pola sentuhan menggunakan pembelajaran mandiri (SSL) pada basis data besar lebih dari 460.000 gambar sentuhan—tanpa memerlukan data yang diberi label.

Meta juga memperkenalkan TacBench, sebuah benchmark baru dengan enam tugas berbasis sentuhan untuk mengevaluasi kemampuan Sparsh. Meta mengklaim bahwa Sparsh mengungguli model tradisional sebesar 95,1%, terutama dalam skenario data rendah. Versi Sparsh yang dibangun pada arsitektur I-JEPA dan DINO Meta menunjukkan kemampuan luar biasa dalam tugas seperti estimasi gaya, deteksi slip, dan manipulasi kompleks.

Meta Digit Plexus: Platform untuk Pengembangan Sistem Taktil

Meta telah memperkenalkan Digit Plexus untuk mengintegrasikan teknologi penginderaan dan model persepsi taktil untuk menciptakan sistem embodied AI. Platform ini menggabungkan sensor ujung jari dan telapak tangan dalam satu tangan robotik untuk memungkinkan respon sentuhan yang lebih terkoordinasi. Pengaturan ini memungkinkan embodied AI untuk memproses umpan balik sensorik dan menyesuaikan tindakannya secara real-time, seperti bagaimana tangan manusia bergerak dan bereaksi.

Dengan memstandarkan umpan balik sentuhan di seluruh tangan, Digit Plexus meningkatkan presisi dan kontrol embodied AI. Pengembangan ini sangat penting dalam bidang seperti manufaktur dan perawatan kesehatan, di mana penanganan yang hati-hati sangat diperlukan. Platform ini menghubungkan sensor seperti ujung jari dan ReSkin ke sistem kontrol, menyederhanakan pengumpulan data, kontrol, dan analisis—semua melalui satu kabel.

Meta merilis desain perangkat lunak dan perangkat keras untuk Digit Plexus ke komunitas sumber terbuka. Tujuannya adalah untuk memfasilitasi kolaborasi dan mempercepat penelitian dalam embodied AI, mendorong inovasi dan kemajuan dalam bidang ini.

Mempromosikan Penelitian dan Pengembangan Embodied AI

Meta tidak hanya meningkatkan teknologi tetapi juga sumber daya untuk mempromosikan penelitian dan pengembangan embodied AI. Salah satu inisiatif kunci adalah pengembangan benchmark untuk menilai model AI. Salah satu benchmark, PARTNR (Planning And Reasoning Tasks in humaN-Robot collaboration), mengevaluasi bagaimana model AI berinteraksi dengan manusia selama tugas rumah tangga. Menggunakan simulator Habitat 3.0, PARTNR menyediakan lingkungan realistis di mana robot membantu dengan tugas seperti membersihkan dan memasak. Dengan lebih dari 100.000 tugas berbasis bahasa, ini bertujuan untuk mempercepat kemajuan dalam embodied AI.

Selain inisiatif internal, Meta berkolaborasi dengan organisasi seperti GelSight Inc. dan Wonik Robotics untuk mempercepat adopsi teknologi penginderaan taktil. GelSight akan mendistribusikan sensor Digit 360, sementara Wonik Robotics akan memproduksi Allegro Hand, yang mengintegrasikan teknologi Digit Plexus. Dengan membuat teknologi ini tersedia melalui platform sumber terbuka dan kemitraan, Meta membantu menciptakan ekosistem yang dapat mengarah pada inovasi dalam perawatan kesehatan, manufaktur, dan bantuan rumah tangga.

Intinya

Meta meningkatkan embodied AI, membawanya melampaui penglihatan dan suara untuk mencakup indera peraba. Dengan inovasi seperti Digit 360 dan Sparsh, sistem AI memperoleh kemampuan untuk merasakan dan merespons lingkungannya dengan presisi. Dengan berbagi teknologi ini dengan komunitas sumber terbuka dan bermitra dengan organisasi kunci, Meta membantu mempercepat pengembangan penginderaan taktil. Kemajuan ini dapat mengarah pada terobosan dalam bidang seperti perawatan kesehatan, manufaktur, dan bantuan rumah tangga, membuat AI lebih mampu dan responsif dalam tugas dunia nyata.

Dr. Tehseen Zia adalah Profesor Asosiasi Tetap di COMSATS University Islamabad, memegang gelar PhD di AI dari Vienna University of Technology, Austria. Mengkhususkan diri dalam Kecerdasan Buatan, Pembelajaran Mesin, Ilmu Data, dan Penglihatan Komputer, ia telah membuat kontribusi signifikan dengan publikasi di jurnal ilmiah terkemuka. Dr. Tehseen juga telah memimpin berbagai proyek industri sebagai Penyelidik Utama dan menjabat sebagai Konsultan AI.