stub Naukowcy z MIT łączą dane o ruchu robotów z modelami językowymi, aby usprawnić wykonywanie zadań - Unite.AI
Kontakt z nami

Robotyka

Naukowcy z MIT łączą dane o ruchu robotów z modelami językowymi, aby usprawnić wykonywanie zadań

Zaktualizowano on
Zdjęcie: Jose-Luis Olivares, MIT

Roboty domowe są coraz częściej uczone wykonywania złożonych zadań poprzez uczenie się przez naśladownictwo – proces, w którym są programowane tak, aby kopiowały ruchy wykazywane przez człowieka. Chociaż roboty okazały się doskonałymi naśladowcami, często mają trudności z przystosowaniem się do zakłóceń lub nieoczekiwanych sytuacji napotkanych podczas wykonywania zadań. Bez wyraźnego oprogramowania obsługującego te odchylenia roboty zmuszone są rozpoczynać zadanie od zera. Aby sprostać temu wyzwaniu, inżynierowie MIT opracowują nowe podejście którego celem jest zapewnienie robotom zdrowego rozsądku w obliczu nieoczekiwanych sytuacji, umożliwienie im dostosowania się i kontynuowania zadań bez konieczności ręcznej interwencji.

Nowe podejście

Naukowcy z MIT opracowali metodę, która łączy dane o ruchu robota ze „zdroworozsądkową wiedzą” na temat: duże modele językowe (LLM). Łącząc te dwa elementy, podejście umożliwia robotom logiczną analizę danego zadania domowego na podzadania i fizyczne dostosowanie się do zakłóceń w każdym z podzadań. Dzięki temu robot może kontynuować pracę bez konieczności ponownego uruchamiania całego zadania od początku i eliminuje potrzebę bezpośredniego programowania przez inżynierów napraw każdej możliwej awarii po drodze.

Jak wyjaśnia student Yanwei Wang z Wydziału Inżynierii Elektrycznej i Informatyki (EECS) MIT: „Dzięki naszej metodzie robot może samodzielnie korygować błędy wykonania i poprawiać ogólny sukces zadania”.

Aby zademonstrować swoje nowe podejście, badacze wykonali prostą czynność: zgarnęli kulki z jednej miski i wsypali je do drugiej. Tradycyjnie inżynierowie przemieszczali robota, wykonując ruchy nabierania i nalewania cieczy po jednej trajektorii, często zapewniając robotowi wiele demonstracji na ludziach. Jednakże, jak zauważa Wang, „ludzka demonstracja to jedna długa, ciągła trajektoria”. Zespół zdał sobie sprawę, że chociaż człowiek może zademonstrować jedno zadanie za jednym razem, zadanie to zależy od sekwencji podzadań. Na przykład robot musi najpierw sięgnąć do miski, zanim będzie mógł zgarnąć, i musi zebrać kulki, zanim przejdzie do pustej miski.

Jeśli robot popełni błąd podczas któregokolwiek z tych podzadań, jedynym rozwiązaniem jest zatrzymanie się i rozpoczęcie od początku, chyba że inżynierowie wyraźnie oznaczą każde podzadanie i zaprogramują lub zorganizują nowe demonstracje, aby robot mógł odzyskać siły po awarii. Wang podkreśla, że ​​„ten poziom planowania jest bardzo nudny”. W tym miejscu wchodzi w grę nowe podejście badaczy. Wykorzystując moc LLM, robot może automatycznie identyfikować podzadania składające się na ogólne zadanie i określać potencjalne działania naprawcze w przypadku zakłóceń. Eliminuje to potrzebę ręcznego programowania robota przez inżynierów, aby poradził sobie z każdym możliwym scenariuszem awarii, dzięki czemu robot jest bardziej elastyczny i wydajny w wykonywaniu zadań domowych.

Rola modeli dużego języka

LLM odgrywają kluczową rolę w nowym podejściu badaczy z MIT. Te modele głębokiego uczenia się przetwarzają ogromne biblioteki tekstu, ustanawiając powiązania między słowami, zdaniami i akapitami. Dzięki tym powiązaniom LLM może generować nowe zdania w oparciu o wyuczone wzorce, zasadniczo rozumiejąc rodzaj słowa lub frazy, które prawdopodobnie nastąpi po ostatnim.

Naukowcy zdali sobie sprawę, że tę zdolność LLM można wykorzystać do automatycznej identyfikacji podzadań w ramach większego zadania i potencjalnych działań naprawczych w przypadku zakłóceń. Łącząc „zdroworozsądkową wiedzę” LLM z danymi o ruchu robota, nowe podejście umożliwia robotom logiczną analizę zadania na podzadania i dostosowywanie się do nieoczekiwanych sytuacji. Ta integracja LLM i robotyki może zrewolucjonizować sposób programowania i szkolenia robotów domowych, czyniąc je bardziej elastycznymi i zdolnymi do radzenia sobie z wyzwaniami świata rzeczywistego.

W miarę ciągłego rozwoju robotyki coraz większe znaczenie będzie miało włączanie technologii sztucznej inteligencji, takich jak LLM. Podejście badaczy z MIT stanowi znaczący krok w kierunku stworzenia robotów domowych, które mogą nie tylko naśladować ludzkie działania, ale także rozumieć leżącą u podstaw logikę i strukturę wykonywanych przez nie zadań. Ta wiedza będzie kluczem do opracowania robotów, które będą mogły działać autonomicznie i wydajnie w złożonych środowiskach rzeczywistych.

W stronę inteligentniejszej i bardziej elastycznej przyszłości robotów domowych

Umożliwiając robotom samokorygowanie błędów wykonania i poprawę ogólnego powodzenia zadań, metoda ta rozwiązuje jedno z głównych wyzwań w programowaniu robotów: zdolność dostosowywania się do sytuacji w świecie rzeczywistym.

Konsekwencje tych badań wykraczają daleko poza proste zadanie nabierania kulek. W miarę jak roboty domowe będą coraz bardziej powszechne, będą musiały być w stanie wykonywać różnorodne zadania w dynamicznych, nieustrukturyzowanych środowiskach. Zdolność dzielenia zadań na podzadania, rozumienia leżącej u ich podstaw logiki i dostosowywania się do zakłóceń będzie niezbędna, aby roboty te mogły działać skutecznie i wydajnie.

Co więcej, integracja LLM i robotyki pokazuje, że technologie AI mogą zrewolucjonizować sposób, w jaki programujemy i szkolimy roboty. W miarę ciągłego rozwoju tych technologii możemy spodziewać się, że w naszych domach i miejscach pracy pojawią się coraz bardziej inteligentne, przystosowujące się i autonomiczne roboty.

Praca badaczy z MIT to kluczowy krok w kierunku stworzenia robotów domowych, które będą w stanie naprawdę zrozumieć złożoność prawdziwego świata i poruszać się po nim. W miarę udoskonalania tego podejścia i stosowania go do szerszego zakresu zadań może ono zmienić sposób, w jaki żyjemy i pracujemy, czyniąc nasze życie łatwiejszym i wydajniejszym.

Alex McFarland jest dziennikarzem i pisarzem zajmującym się sztuczną inteligencją badającym najnowsze osiągnięcia w dziedzinie sztucznej inteligencji. Współpracował z wieloma startupami i publikacjami AI na całym świecie.