Robotik

MIT Araştırmacıları, Görev Yürütme İşlemlerini İyileştirmek için Robot Hareket Verilerini Dil Modelleriyle Birleştirdi

Published March 27, 2024

Updated April 4, 2026

Alex McFarland

Ev robotları, increasingly, bir insan tarafından gösterilen hareketleri taklit etme sürecinde karmaşık görevleri gerçekleştirmek için eğitiliyor. İnsanların mükemmel birer taklitçi olduklarını kanıtlamalarına rağmen, görev yürütme sırasında ortaya çıkan kesintilere veya beklenmedik durumlara uyum sağlamakta zorluk yaşıyorlar. Bu sapmalarla başa çıkmak için açık bir programlama olmadan, robotlar görevi baştan başlatmak zorunda kalıyor. Bu zorluğu gidermek için, MIT mühendisleri, robotlara beklenmedik durumlarla karşılaştıklarında ortak bir anlayış duygusu kazandırmayı amaçlayan yeni bir yaklaşım geliştiriyorlar, böylece robotlar manuel müdahale gerektirmeden görevlerine devam edebiliyorlar.

Yeni Yaklaşım

MIT araştırmacıları, robot hareket verilerini “ortak anlayış bilgisini” büyük dil modelleri (LLM’ler) ile birleştiren bir yöntem geliştirdiler. Bu iki öğeyi birbirine bağlayarak, yaklaşım robotların bir ev görevini alt görevlere mantıksal olarak ayrıştırmasını ve her bir alt görevdeki kesintilere fiziksel olarak uyum sağlamasını sağlıyor. Bu, robotun tüm görevi baştan başlatmak zorunda kalmadan devam etmesine ve mühendislerin yol boyunca olası her başarısızlık için düzeltmeler programlamasına gerek kalmamasına olanak tanıyor.

MIT’in Elektrik Mühendisliği ve Bilgisayar Bilimi (EECS) bölümünden lisansüstü öğrencisi Yanwei Wang, “Yöntemimizle, bir robot yürütme hatalarını kendiliğinden düzeltebilir ve genel görev başarısını iyileştirebilir” diyor.

Yeni yaklaşımını göstermek için araştırmacılar, basit bir ev işini kullandılar: bir kaptan mermerleri alıp başka bir kaba dökme. Geleneksel olarak, mühendisler bir robotu süpürme ve dökme hareketleri boyunca bir akışkan traiyektore boyunca hareket ettireceklerdi, genellikle bir robota taklit etmesi için birden fazla insan gösterisi sunacaktı. Ancak Wang, “insan gösterisi bir uzun, sürekli traiyektordür” diyor. Ekibin anlaşılması, bir insanın tek bir görevi bir defada göstermesine rağmen, görevin bir dizi alt görevden oluştuğudur. Örneğin, robot önce bir kaba ulaşmadan önce mermerleri süpürmeden önce, boş kaba gitmeden önce mermerleri süpürmelidir.

Bir robot bu alt görevlerin herhangi birinde hata yaparsa, tek çaresi durmak ve baştan başlamaktır, trừ ki mühendisler her bir alt görevi etiketler ve programlar veya robotun hatadan kurtulmasına yardımcı olmak için yeni gösteriler toplar. Wang, “o düzeyde planlama çok zahmetlidir” diyor. İşte araştırmacıların yeni yaklaşımı devreye giriyor. LLM’lerin gücünü kullanarak, robot genel görevde yer alan alt görevleri otomatik olarak tanıyabilir ve kesintiler durumunda olası kurtarma eylemlerini belirleyebilir. Bu, mühendislerin robotu her olası başarısızlık senaryosunu işleyecek şekilde manuel olarak programlamasına gerek kalmamasını sağlıyor, böylece robot daha uyumlu ve ev işlerini yürütmede daha verimli hale geliyor.

Büyük Dil Modellerinin Rolü

LLM’ler, MIT araştırmacılarının yeni yaklaşımında kritik bir rol oynuyor. Bu derin öğrenme modelleri, büyük metin kütüphanelerini işler ve kelimeler, cümleler ve paragraflar arasında bağlantılar kurar. Bu bağlantılar aracılığıyla, bir LLM, öğrenilen kalıplara dayanarak yeni cümleler oluşturabilir, temelde bir kelimenin veya ifadenin bir önceki kelimenin veya ifadenin ardından muhtemel olarak hangi türde olacağını anlar.

Araştırmacılar, LLM’lerin bu yeteneğinin, bir görevdeki alt görevleri ve kesintiler durumunda olası kurtarma eylemlerini otomatik olarak tanımlamak için kullanılabileceğini fark ettiler. Robot hareket verilerini LLM’lerin “ortak anlayış bilgisini” birleştiren yeni yaklaşım, robotların bir görevi alt görevlere mantıksal olarak ayrıştırmasını ve beklenmedik durumlara uyum sağlamasını sağlıyor. LLM’ler ve robotik arasındaki bu entegrasyon, ev robotlarının programlanması ve eğitilmesi şeklini devrimleştirme potansiyeline sahip, onları daha uyumlu ve gerçek dünya zorluklarını işleyebilecek hale getiriyor.

Robotik alanının ilerlemeye devam etmesiyla, AI teknolojileri gibi LLM’lerin entegrasyonu giderek daha önemli hale gelecek. MIT araştırmacılarının yaklaşımı, sadece insan eylemlerini taklit edebilen değil, aynı zamanda gerçekleştirdikleri görevlerin altındaki mantığı ve yapısını anlayan ev robotları oluşturma yönünde önemli bir adımdır. Bu anlayış, karmaşık, gerçek dünya ortamlarında otonom ve verimli bir şekilde çalışan robotlar geliştirmek için anahtardır.

Ev Robotları için Daha Akıllı, Daha Uyumlu Bir Gelecek Doğru

Yürütme hatalarını kendiliğinden düzeltebilmesi ve genel görev başarısını iyileştirebilmesi sayesinde, bu yöntem, robot programlamasındaki önemli bir zorluğu – gerçek dünya durumlarına adaptasyon – ele alıyor.

Bu araştırmanın etkileri, basit mermer süpürme görevinin çok ötesine uzanıyor. Ev robotları daha yaygın hale geldikçe, dinamik, yapılandırılmamış ortamlarda çeşitli görevleri işleyebilecek yeteneklere sahip olmaları gerekecek. Alt görevlere ayırma, altındaki mantığı anlama ve kesintilere uyum sağlama yetenekleri, bu robotların etkili ve verimli bir şekilde çalışması için temel olacaktır.

Ayrıca, LLM’ler ve robotik arasındaki entegrasyon, AI teknolojilerinin robotları programlama ve eğitim şeklini devrimleştirme potansiyelini gösteriyor. Bu teknolojiler ilerledikçe, daha zeki, daha uyumlu ve otonom robotları evlerimizde ve işyerlerimizde görmeye başlayacağız.

MIT araştırmacılarının çalışması, gerçek dünya karmaşıklıklarını gerçekten anlayan ve gezinen ev robotları oluşturma yönünde kritik bir adımdır. Bu yaklaşım, daha geniş bir görev yelpazesine uygulanırken, hayatlarımızı kolaylaştırmaya ve daha verimli hale getirmeye potansiyeli vardır.

Unite.AI

MIT Araştırmacıları, Görev Yürütme İşlemlerini İyileştirmek için Robot Hareket Verilerini Dil Modelleriyle Birleştirdi

Yeni Yaklaşım

Büyük Dil Modellerinin Rolü

Ev Robotları için Daha Akıllı, Daha Uyumlu Bir Gelecek Doğru

You may like