Stumm MIT Fuerscher kombinéiere Roboter Bewegungsdaten mat Sproochmodeller fir d'Task Ausféierung ze verbesseren - Unite.AI
Connect mat eis

nächst Joer

MIT Fuerscher kombinéieren Roboter Bewegungsdaten mat Sproochmodeller fir d'Task Ausféierung ze verbesseren

aktualiséiert on
Bild: José-Luis Olivares, MIT

Haushaltsroboter ginn ëmmer méi geléiert komplex Aufgaben duerch Imitatiounsléieren auszeféieren, e Prozess an deem se programméiert sinn fir d'Beweegunge vun engem Mënsch ze kopéieren. Iwwerdeems Roboteren sech als exzellente Mimik bewisen hunn, kämpfen se dacks sech un Stéierungen oder onerwaart Situatiounen unzepassen, déi während der Ausféierung vun der Aufgab begéint sinn. Ouni explizit Programméierung fir dës Ofwäichungen ze handhaben, sinn Roboter gezwongen d'Aufgab vun Null unzefänken. Fir dës Erausfuerderung unzegoen, entwéckelen MIT Ingenieuren eng nei Approche dat zielt Roboter e Sënn vu gesonde Mënscheverstand ze ginn wann se mat onerwaarte Situatioune konfrontéiert sinn, wat hinnen erlaabt hir Aufgaben unzepassen an weiderzeféieren ouni manuell Interventioun ze erfuerderen.

Déi nei Approche

D'MIT Fuerscher hunn eng Method entwéckelt, déi Roboterbewegungsdaten mat dem "Gesonde Verstandskenntnisser" kombinéiert grouss Sproochmodeller (LLMs). Andeems Dir dës zwee Elementer verbënnt, erméiglecht d'Approche Roboteren logesch eng bestëmmte Stot Aufgab an Ënnertasks ze analyséieren a kierperlech un Stéierungen an all Ënnertask unzepassen. Dëst erlaabt de Roboter weiderzekommen ouni d'ganz Aufgab vun Ufank un nei ze starten, an eliminéiert de Besoin fir Ingenieuren explizit Fixe fir all méiglech Feeler am Wee ze programméieren.

Als Graduéierter Schüler Yanwei Wang vum MIT's Department of Electrical Engineering and Computer Science (EECS) erkläert: "Mat eiser Method kann e Roboter d'Ausféierungsfehler selwer korrigéieren an den allgemengen Erfolleg vun der Aufgab verbesseren."

Fir hir nei Approche ze demonstréieren, hunn d'Fuerscher eng einfach Aarbecht benotzt: Marmer aus enger Schossel schëdden an se an eng aner ze schëdden. Traditionell wäerten d'Ingenieuren e Roboter duerch d'Beweegunge vum Schëppen a Gießen an enger flësseger Trajectoire beweegen, déi dacks verschidde mënschlech Demonstratiounen ubidden fir de Roboter ze mimikéieren. Wéi de Wang awer betount, "d'mënschlech Demonstratioun ass eng laang, kontinuéierlech Trajectoire." D'Team huet gemierkt datt wärend e Mënsch eng eenzeg Aufgab an engem Wee kann demonstréieren, d'Aufgab hänkt vun enger Sequenz vun Ënneraufgaben of. Zum Beispill muss de Roboter fir d'éischt an eng Schossel erreechen ier e ka schëpfen, an e muss Marmer ophalen ier e sech an déi eidel Schuel plënnert.

Wann e Roboter e Feeler während enger vun dësen Ënnertasks mécht, ass säin eenzege Recours vun Ufank un ze stoppen an unzefänken, ausser Ingenieuren explizit all Ënnertask a Programm markéieren oder nei Demonstratiounen sammelen fir de Roboter aus dem Versoen ze erholen. Wang betount datt "dee Planungsniveau ganz langweileg ass." Hei kënnt déi nei Approche vun de Fuerscher an d'Spill. Andeems Dir d'Kraaft vun LLMs benotzt, kann de Roboter automatesch d'Subtasks identifizéieren, déi an der Gesamtaufgab involvéiert sinn a potenziell Erhuelungsaktiounen am Fall vun Stéierungen bestëmmen. Dëst eliminéiert de Besoin fir Ingenieuren fir de Roboter manuell ze programméieren fir all méiglech Ausfallszenario ze handhaben, wat de Roboter méi adaptéierbar an effizient mécht fir Hausaufgaben auszeféieren.

D'Roll vu grousse Sproochmodeller

LLMs spillen eng entscheedend Roll an der neier Approche vun de MIT Fuerscher. Dës Deep Learning Modeller veraarbecht grouss Bibliothéike vun Text, etabléieren Verbindungen tëscht Wierder, Sätz, a Paragrafen. Duerch dës Verbindungen kann en LLM nei Sätz generéieren op Basis vu geléierte Mustere, am Wesentlechen d'Aart vu Wuert oder Saz ze verstoen, déi méiglecherweis déi lescht verfollegen.

D'Fuerscher realiséiert datt dës Fäegkeet vun LLMs benotzt ka ginn fir automatesch Ënnertasks bannent enger méi grousser Aufgab a potenziellen Erhuelungsaktiounen am Fall vun Stéierungen z'identifizéieren. Duerch d'Kombinatioun vum "Gesonde Verstandskenntnisser" vun LLMs mat Roboterbewegungsdaten, erlaabt déi nei Approche Roboteren eng Aufgab logesch an Ënnertasks ze analyséieren an un onerwaart Situatiounen unzepassen. Dës Integratioun vu LLMs a Robotik huet d'Potenzial fir d'Art a Weis wéi Haushaltsroboter programméiert an trainéiert ginn ze revolutionéieren, sou datt se méi adaptéierbar a fäeg sinn d'real Welt Erausfuerderungen ze handhaben.

Wéi d'Feld vun der Robotik weider geet, wäert d'Inkorporatioun vun AI Technologien wéi LLMs ëmmer méi wichteg ginn. D'Approche vun de MIT Fuerscher ass e wesentleche Schrëtt fir Haushaltsroboter ze kreéieren déi net nëmme mënschlech Handlunge kënne mimikéieren, awer och d'Basislogik an d'Struktur vun den Aufgaben déi se ausféieren verstoen. Dëst Verständnis wäert de Schlëssel sinn fir Roboteren z'entwéckelen déi autonom an effizient a komplexen, real-Welt Ëmfeld funktionnéiere kënnen.

Richtung eng méi schlau, méi adaptéierbar Zukunft fir Haushaltsroboter

Andeems de Roboter et erméiglecht d'Ausféierungsfehler selwer ze korrigéieren an de gesamten Aufgabesuccès ze verbesseren, adresséiert dës Method eng vun de groussen Erausfuerderunge bei der Roboterprogramméierung: Adaptabilitéit un real-Welt Situatiounen.

D'Implikatioune vun dëser Fuerschung erstreckt sech wäit iwwer déi einfach Aufgab fir Marmer ze schëdden. Wéi Haushaltsroboter méi verbreed ginn, musse se fäeg sinn eng grouss Varietéit vun Aufgaben an dynameschen, onstrukturéierten Ëmfeld ze handhaben. D'Kapazitéit fir Aufgaben an Ënneraufgaben opzedeelen, déi ënnerierdesch Logik ze verstoen an un Stéierungen unzepassen ass essentiell fir dës Roboter effektiv an effizient ze bedreiwen.

Ausserdeem weist d'Integratioun vu LLMs a Robotik d'Potenzial fir AI Technologien fir d'Art a Weis wéi mir Roboteren programméieren an trainéieren ze revolutionéieren. Wéi dës Technologien weiderfueren, kënne mir erwaarden méi intelligent, adaptéierbar an autonom Roboteren an eisen Haiser an Aarbechtsplazen ze gesinn.

D'Aarbecht vun de MIT Fuerscher ass e kritesche Schrëtt fir Haushaltsroboter ze kreéieren déi d'Komplexitéite vun der realer Welt wierklech kënne verstoen an navigéieren. Wéi dës Approche raffinéiert an op eng méi breet Palette vun Aufgaben applizéiert gëtt, huet se d'Potenzial fir d'Art a Weis wéi mir liewen a schaffen ze transforméieren, wat eist Liewen méi einfach a méi effizient mécht.

Den Alex McFarland ass en AI Journalist a Schrëftsteller deen déi lescht Entwécklungen an der kënschtlecher Intelligenz exploréiert. Hien huet mat villen AI Startups a Publikatiounen weltwäit zesummegeschafft.