Robotyka
Ramowy system AI z udziałem człowieka obiecuje szybsze uczenie się robotów w nowych środowiskach

W erze przyszłej, w której domy będą coraz bardziej inteligentne, posiadanie robota do ułatwienia codziennych zajęć nie będzie rzadkością. Niemniej jednak, może pojawić się frustracja, gdy te automatyczne pomocniki nie są w stanie wykonać prostych zadań. Wkraczają Andi Peng, naukowiec z wydziału Elektrotechniki i Informatyki MIT, która wraz ze swoim zespołem toruje drogę do poprawy krzywej uczenia się robotów.
Peng i jej zespół badaczy z różnych dziedzin stworzyli interaktywny ramowy system człowiek-robot. Najważniejszym elementem tego systemu jest jego zdolność do generowania narracji przeciwnych faktom, które wskazują na niezbędne zmiany, aby robot mógł wykonać zadanie pomyślnie.
Przykładowo, gdy robot ma trudności z rozpoznaniem dziwnie pomalowanego kubka, system oferuje alternatywne sytuacje, w których robot mógłby odnieść sukces, np. gdyby kubek miał bardziej powszechny kolor. Te narracje przeciwnych faktom, połączone z informacjami zwrotnymi od ludzi, usprawniają proces generowania nowych danych do dokształcania robota.
Peng wyjaśnia, “Dokształcanie to proces optymalizacji istniejącego modelu machine learning, który jest już wykwalifikowany w jednym zadaniu, umożliwiający mu wykonanie drugiego, analogicznego zadania.”
Skok w wydajności i osiągach
Gdy system został poddany testom, wykazał imponujące wyniki. Roboty wyszkolone przy użyciu tej metody wykazały szybkie zdolności uczenia się, jednocześnie redukując czas poświęcony przez ich ludzkich nauczycieli. Jeśli system zostanie z powodzeniem wdrożony na większą skalę, może on pomóc robotom w szybkim adaptowaniu się do nowych otoczeń, minimalizując potrzebę posiadania przez użytkowników zaawansowanej wiedzy technicznej. Ta technologia może być kluczem do odblokowania robotów o ogólnym przeznaczeniu, które mogą skutecznie pomagać starszym lub niepełnosprawnym osobom.
Peng uważa, “Ostatecznym celem jest umożliwienie robotom uczenia się i funkcjonowania na poziomie abstrakcyjnym, podobnym do ludzkiego.”
Rewolucjonizacja szkolenia robotów
Główną przeszkodą w nauce robota jest “przesunięcie dystrybucji”, termin używany do opisu sytuacji, gdy robot spotyka obiekty lub przestrzenie, z którymi nie miał do czynienia podczas okresu szkolenia. Badacze, aby rozwiązać ten problem, wdrożyli metodę “nauczania przez naśladownictwo”. Jednak miała ona ograniczenia.
“Wyobraź sobie, że musisz zademonstrować 30 000 kubków, aby robot mógł podnieść dowolny kubek. Zamiast tego, wolę zademonstrować tylko jeden kubek i nauczyć robota, aby zrozumiał, że może podnieść kubek dowolnego koloru” – mówi Peng.
W odpowiedzi na to, system zespołu identyfikuje, które atrybuty obiektu są niezbędne do wykonania zadania (jak kształt kubka) i które nie są (jak kolor kubka). Uzbrojony w tę wiedzę, generuje on syntetyczne dane, zmieniając “nieistotne” elementy wizualne, tym samym optymalizując proces uczenia się robota.
Łączenie ludzkiego rozumowania z logiką robota
Aby ocenić skuteczność tego systemu, badacze przeprowadzili test z udziałem ludzi. Uczestnicy zostali poproszeni o to, czy narracje przeciwnych faktom systemu ulepszają ich zrozumienie wydajności zadania robota.
Peng mówi, “Stwierdziliśmy, że ludzie są naturalnie zdolni do tego rodzaju rozumowania przeciwnych faktom. To element przeciwnych faktom pozwala nam na płynne tłumaczenie ludzkiego rozumowania na logikę robota”.
W trakcie wielu symulacji robot konsekwentnie uczył się szybciej przy użyciu ich podejścia, przewyższając inne techniki i wymagając mniej demonstracji od użytkowników.
Patrząc w przyszłość, zespół planuje wdrożyć ten system w prawdziwych robotach i pracować nad skróceniem czasu generowania danych za pomocą modeli machine learning. Ten przełomowy podejście ma potencjał, aby przekształcić trajektorię uczenia się robota, otwierając drogę do przyszłości, w której roboty będą harmonijnie współistnieć w naszym codziennym życiu.












