Robotik

Robotların Yardım İsteme Öğrenmesi

mm

Robotik dünyasında, Princeton Üniversitesi ve Google arasındaki bir işbirliği öne çıkıyor. Bu prestijli kurumların mühendisleri, robotlara bir beceri öğretmeyi başardı: yardım needediklerini tanımlama ve yardım isteme. Bu gelişme, robotların otonom işlevler ve insan-robot etkileşimi arasında önemli bir adım anlamına geliyor.

Robotların daha akıllı ve bağımsız olması yolundaki yolculuk, her zaman insan dilinin karmaşıklığı ve belirsizliği tarafından engellenmiştir. Bilgisayar kodlarının ikili açıklığından farklı olarak, insan dili nüanslar ve inceliklerle dolu bir labirenttir. Örneğin, “kâseyi al” gibi basit bir komut, birden fazla kâse olduğunda karmaşık bir görev haline gelebilir. Çevresini algılayabilen ve dili yanıtlayabilen robotlar, bu tür dil belirsizlikleriyle karşılaştıklarında thường bir köşe başında kalırlar.

Belirsizliği Ölçmek

Bu zorluğu ele almak için Princeton ve Google ekibi, insan dilinin “belirsizliğini” ölçen yeni bir yaklaşım geliştirdi. Bu teknik, dil komutlarındaki belirsizlik seviyesini ölçer ve bu ölçüyü robot eylemlerini yönlendirmek için kullanır. Bir komut birden fazla yorumlanmaya yol açabilecek durumlarda, robot şimdi belirsizlik seviyesini ölçebilir ve daha fazla açıklama istemek için karar verebilir. Örneğin, birden fazla kâse olan bir ortamda, daha yüksek bir belirsizlik seviyesi robotu hangi kâseyi alacağını sormaya yönlendirecektir, böylece potansiyel hataları veya verimsizlikleri önleyecektir.

Bu yaklaşım, robotlara dil hakkında daha iyi bir anlayış kazandırmanın yanı sıra, görevlerin yürütülmesinde güvenlik ve verimliliği de artırır. Araştırmacılar, ChatGPT’nin arkasındaki büyük dil modelleri (LLM’ler) gibi LLM’leri entegre ederek, robotik eylemleri insan beklentileri ve gereksinimleriyle daha yakın hizalayan önemli bir adım attılar.

Büyük Dil Modellerinin Rolü

Bu yeni yaklaşımda LLM’lerin entegrasyonu kilit bir rol oynar. LLM’ler, insan dilini işleme ve yorumlama konusunda çok önemlidir. Bu bağlamda, robotlara verilen dil komutlarındaki belirsizliği değerlendirmek ve ölçmek için kullanılırlar.

Ancak LLM’lere bağımlılık, bazı zorluklar olmadan değildir. Araştırma ekibi, LLM’lerin çıktılarının bazen güvensiz olabileceğini belirtti.

Princeton’da yardımcı profesör olan Anirudha Majumdar, bu dengenin önemini vurguladı:

“LLM tarafından oluşturulan planlara kör olarak uymak, robotların güvensiz veya güvenilir olmayan bir şekilde davranmasına neden olabilir, bu nedenle LLM tabanlı robotlarımızın ne zaman bilmediklerini bilmeleri gerekir.”

Bu, LLM’lerin karar verme konusunda rehber olarak kullanıldığı, ancak kusursuz decision-makers olarak görülmediği nüanslı bir yaklaşımın gerekliliğini vurgular.

Pratik Uygulama ve Test

Bu yöntemin pratikliği, çeşitli senaryolarda test edildi ve esnekliği ve etkinliği gösterildi. Bir test, bir robotic kolumun, oyuncak gıda maddelerini farklı kategorilere ayırma görevini içeriyordu. Bu basit kurulum, robotun açık seçenekler içeren görevleri etkili bir şekilde navigasyon edebildiğini gösterdi.

Resim: Princeton Üniversitesi

Diğer bir deney, ofis mutfağında tekerlekli bir platforma monte edilmiş bir robotic kolu içeriyordu. Burada, robot gerçek dünya zorluklarıyla karşılaştı, örneğin birden fazla seçeneği sunulan bir mikrodalga fırına hangi öğeyi koyması gerektiğini belirleme.

Bu testler, robotların belirsizliği ölçmek ve kararlar almak veya açıklama istemek için bu metriği erfolgreich bir şekilde kullandığını göstererek, bu yöntemin pratik faydasını doğruladı.

Gelecek İmpilikasyonları ve Araştırma

İleriye bakıldığında, bu araştırmanın etkileri mevcut uygulamaların çok ötesine uzanıyor. Majumdar ve yüksek lisans öğrencisi Allen Ren liderliğindeki ekip, bu yaklaşımın daha karmaşık robot algılama ve yapay zeka sorunlarına nasıl uygulanabileceğini araştırıyor. Bu, robotların görme ve dil bilgilerini birleştirmek zorunda kaldıkları senaryoları içerir, böylece robotların anlama ve insan etkileşimi arasındaki farkı daha da kapatır.

Süregelen araştırma, robotların görevleri daha yüksek doğrulukla gerçekleştirmelerini ve aynı zamanda insan bilişine benzer bir anlayışla dünyayı navigasyon etmelerini sağlamak amacını taşıyor. Bu araştırma, daha verimli, daha güvenli ve insan ortamlarının nüanslı gereksinimlerine daha uygun olan robotlar için bir yol açabilir.

Araştırmayı yayınlanan makale burada bulunabilir.

Alex McFarland yapay zeka muhabiri ve yazarıdır ve yapay zekadaki son gelişmeleri araştırıyor. Birçok yapay zeka başlangıç şirketi ve dünya çapındaki yayınlarda işbirliği yaptı.