Connect with us

Robotika

Výzkumníci z MIT kombinují data o pohybu robotů s jazykovými modely pro zlepšení provádění úkolů

mm

Roboty pro domácnost se stále častěji učí vykonávat složité úkoly prostřednictvím imitačního učení, procesu, při kterém jsou programovány pro kopírování pohybů demonstrovaných člověkem. Zatímco roboti se ukázali být vynikajícími napodobiteli, často mají potíže s přizpůsobením se poruchám nebo neočekávaným situacím, které nastanou během provádění úkolu. Bez explicitního programování pro zpracování těchto odchylek jsou roboti nuceni úkol začít od začátku. Aby tato výzva byla řešena, inženýři z MIT vyvíjejí nový přístup, který má dát robotům smysl pro běžný smysl, když se setkají s neočekávanými situacemi, umožňující jim přizpůsobit se a pokračovat v úkolu bez nutnosti manuálního zásahu.

Nový přístup

Výzkumníci z MIT vyvinuli metodu, která kombinuje data o pohybu robotů s “znalostmi běžného smyslu” velkých jazykových modelů (LLM). Tímto spojením umožňuje přístup robotům logicky rozložit daný domácí úkol na podúkoly a fyzicky se přizpůsobit poruchám v rámci každé podúkoly. To umožňuje robotovi pokračovat bez nutnosti restartovat celý úkol od začátku a eliminuje potřebu, aby inženýři explicitně programovali opravy pro každou možnou chybu na cestě.

Jak vysvětluje absolvent Yanwei Wang z oddělení elektrotechniky a počítačových věd (EECS) na MIT, “Naším metodou může robot sám opravovat chyby při provádění a zlepšovat celkový úspěch úkolu.”

Aby demonstrovali svůj nový přístup, výzkumníci použili jednoduchý úkol: nabrání kuliček z jedné misky a vylití jich do druhé. Obvykle by inženýři pohybovali robotem skrz pohyby nabírání a vylití v jednom plynulém trajektorii, často poskytující多 human demonstrations pro robot, aby je napodobil. Nicméně, jak Wang uvádí, “lidská demonstrace je jeden dlouhý, nepřetržitý trajektorie.” Tým si uvědomil, že zatímco člověk může demonstrovat jeden úkol v jednom kroku, úkol závisí na posloupnosti podúkolů. Například robot musí nejdříve dosáhnout do misky, než může nabrat, a musí nabrat kuličky, než se přesune do prázdné misky.

Pokud robot udělá chybu během některé z těchto podúkolů, jeho jediným východiskem je zastavit a začít od začátku, pokud inženýři explicitně neoznačí každou podúkol a neprogramují nebo nevyberou nové demonstrace pro robota, aby se zotavil z chyby. Wang zdůrazňuje, že “taková úroveň plánování je velmi únavná.” Zde přichází nový přístup výzkumníků do hry. Díky využití síly LLM může robot automaticky identifikovat podúkoly zapojené do celkového úkolu a určit potenciální akční kroky v případě poruch. To eliminuje potřebu, aby inženýři ručně programovali robota, aby zpracoval každou možnou chybu, což dělá robota více přizpůsobivým a efektivním při provádění domácích úkolů.

Role velkých jazykových modelů

LLM hrají zásadní roli v novém přístupu výzkumníků z MIT. Tyto hluboké učící modely zpracovávají rozsáhlé knihovny textu, vytvářejí spojení mezi slovy, větami a odstavci. Prostřednictvím těchto spojení může LLM generovat nové věty na základě naučených vzorců, vlastně chápající typ slova nebo fráze, který je pravděpodobně následovat po posledním.

Výzkumníci si uvědomili, že tato schopnost LLM může být využita k automatickému identifikování podúkolů v rámci většího úkolu a potenciálních akčních kroků v případě poruch. Kombinací “znalostí běžného smyslu” LLM s daty o pohybu robotů umožňuje nový přístup robotům logicky rozložit úkol na podúkoly a přizpůsobit se neočekávaným situacím. Toto začlenění LLM a robotiky má potenciál revolucionizovat způsob, jakým jsou programovány a trénovány domácí roboty, dělají je více přizpůsobivými a schopnými zvládat reálné výzvy.

Jak se pole robotiky dále rozvíjí, začlenění AI technologií, jako jsou LLM, se bude stále více důležitým. Přístup výzkumníků z MIT je významným krokem směrem k vytváření domácích robotů, které mohou nejen napodobovat lidské akce, ale také chápat základní logiku a strukturu úkolů, které vykonávají. Toto chápání bude klíčové pro vývoj robotů, které mohou fungovat autonomně a efektivně v komplexních, reálných prostředích.

Smerem k chytřejší, více přizpůsobivé budoucnosti pro domácí roboty

Povolováním robotům, aby opravovaly chyby při provádění a zlepšovaly celkový úspěch úkolu, tento metod řeší jednu z hlavních výzev v programování robotů: přizpůsobivost reálným situacím.

Dopady tohoto výzkumu sahají daleko za jednoduchý úkol nabírání kuliček. Jak domácí roboti se stanou více rozšířené, budou muset být schopné zvládat širokou škálu úkolů v dynamických, nestrukturovaných prostředích. Schopnost rozložit úkoly na podúkoly, pochopit základní logiku a přizpůsobit se poruchám bude zásadní pro tyto roboty, aby fungovaly efektivně a efektivně.

Kromě toho začlenění LLM a robotiky demonstruje potenciál AI technologií pro revolucionalizaci způsobu, jakým programujeme a trénujeme roboty. Jak tyto technologie budou pokračovat v rozvoji, můžeme očekávat vidět více inteligentní, přizpůsobivé a autonomní roboty v našich domech a pracovních místech.

Práce výzkumníků z MIT je kritickým krokem směrem k vytváření domácích robotů, které mohou skutečně chápat a navigovat komplexity reálného světa. Jak tento přístup je rafinován a aplikován na širší škálu úkolů, má potenciál transformovat způsob, jakým žijeme a pracujeme, dělají naše životy jednodušší a efektivnější.

Alex McFarland je AI novinář a spisovatel, který zkoumá nejnovější vývoj v oblasti umělé inteligence. Spolupracoval s mnoha AI startupy a publikacemi po celém světě.