Ohjelmistorobotiikka

MIT-tutkijat yhdistävät robotin liiketiedot kielimalleihin parantaakseen tehtävien suorittamista

Päivitetty on Maaliskuussa 27, 2024

Kuva: Jose-Luis Olivares, MIT

Kotitalousrobotteja opetetaan yhä useammin suorittamaan monimutkaisia tehtäviä jäljitelmäoppimisen avulla, joka on prosessi, jossa ne ohjelmoidaan kopioimaan ihmisen osoittamia liikkeitä. Vaikka robotit ovat osoittautuneet erinomaisiksi jäljittelijöiksi, niillä on usein vaikeuksia sopeutua häiriöihin tai odottamattomiin tilanteisiin, joita kohdataan tehtävän suorittamisen aikana. Ilman erityistä ohjelmointia näiden poikkeamien käsittelemiseksi, robotit pakotetaan aloittamaan tehtävän tyhjästä. Vastatakseen tähän haasteeseen MIT:n insinöörit kehittävät a uusi lähestymistapa jonka tarkoituksena on antaa roboteille järkeä odottamattomissa tilanteissa, jolloin he voivat mukautua ja jatkaa tehtäviään ilman manuaalista puuttumista.

Uusi lähestymistapa

MIT-tutkijat kehittivät menetelmän, joka yhdistää robotin liiketiedot "maalaisjärkeen" tietoon suuret kielimallit (LLM). Yhdistämällä nämä kaksi elementtiä lähestymistapa antaa roboteille mahdollisuuden jäsentää tietyn kotityötehtävän loogisesti osatehtäviksi ja fyysisesti mukautua häiriöihin kunkin alitehtävän sisällä. Tämän ansiosta robotti voi siirtyä eteenpäin ilman, että koko tehtävää tarvitsee käynnistää uudelleen alusta, ja insinöörien ei tarvitse erikseen ohjelmoida korjauksia kaikkiin mahdollisiin virheisiin matkan varrella.

Kuten jatko-opiskelija Yanwei Wang MIT:n sähkötekniikan ja tietojenkäsittelytieteen laitokselta (EECS) selittää: "Menetelmämme avulla robotti voi korjata suoritusvirheet itse ja parantaa tehtävien yleistä menestystä."

Uuden lähestymistavan esittelemiseksi tutkijat käyttivät yksinkertaista työtä: kaavittiin marmoreita yhdestä kulhosta ja kaadettiin ne toiseen. Perinteisesti insinöörit liikuttivat robottia kauhaamalla ja kaatamalla samalla nesteen liikeradalla, mikä usein tarjosi useita ihmisesityksiä, joita robotti matkii. Kuitenkin, kuten Wang huomauttaa, "ihmisen esittely on yksi pitkä, jatkuva liikerata." Tiimi ymmärsi, että vaikka ihminen voi esittää yhden tehtävän yhdellä kertaa, tehtävä riippuu osatehtävien sarjasta. Esimerkiksi robotin täytyy ensin kurkottaa kulhoon ennen kuin se voi kauhaa, ja sen on kauhattava marmorit ennen siirtymistään tyhjään kulhoon.

Jos robotti tekee virheen jonkin näistä osatehtävistä, sen ainoa keino on pysähtyä ja aloittaa alusta, elleivät insinöörit nimeä erikseen jokaista osatehtävää ja ohjelmaa tai kerää uusia esityksiä robotille toipuakseen viasta. Wang korostaa, että "sellainen suunnittelutaso on erittäin tylsää". Tässä tulee esiin tutkijoiden uusi lähestymistapa. Hyödyntämällä LLM:ien tehoa robotti voi automaattisesti tunnistaa kokonaistehtävän osatehtävät ja määrittää mahdolliset palautustoimenpiteet häiriötilanteissa. Tämä eliminoi insinöörien tarpeen ohjelmoida robottia manuaalisesti käsittelemään kaikkia mahdollisia vikatilanteita, mikä tekee robotista mukautuvamman ja tehokkaamman kotitaloustehtävien suorittamisessa.

Suurten kielimallien rooli

LLM:t ovat ratkaisevassa roolissa MIT:n tutkijoiden uudessa lähestymistavassa. Nämä syväoppimismallit käsittelevät laajoja tekstikirjastoja ja muodostavat yhteyksiä sanojen, lauseiden ja kappaleiden välille. Näiden yhteyksien kautta LLM voi luoda uusia lauseita oppimien kaavojen perusteella ja ymmärtää olennaisesti sen tyypin sanan tai lauseen, joka todennäköisesti seuraa viimeistä.

Tutkijat ymmärsivät, että tätä LLM:n kykyä voidaan hyödyntää tunnistamaan automaattisesti suuremman tehtävän osatehtävät ja mahdolliset palautustoimenpiteet häiriötilanteissa. Yhdistämällä LLM:ien "terveen järjen tietämyksen" robotin liikedataan, uusi lähestymistapa antaa roboteille mahdollisuuden jäsentää tehtävän loogisesti osatehtäviksi ja mukautua odottamattomiin tilanteisiin. Tämä LLM-yritysten ja robotiikan integrointi voi mullistaa tavan, jolla kotitalousrobotit ohjelmoidaan ja koulutetaan, mikä tekee niistä mukautuvampia ja kykenevämpiä käsittelemään todellisia haasteita.

Robotiikan alan edistyessä, tekoälyteknologioiden, kuten LLM:ien, sisällyttämisestä tulee yhä tärkeämpää. MIT:n tutkijoiden lähestymistapa on merkittävä askel kohti kotitalousrobottien luomista, jotka eivät vain pysty jäljittelemään ihmisen toimintaa, vaan myös ymmärtämään suorittamiensa tehtävien taustalla olevaa logiikkaa ja rakennetta. Tämä ymmärrys on avainasemassa kehitettäessä robotteja, jotka voivat toimia itsenäisesti ja tehokkaasti monimutkaisissa, todellisissa ympäristöissä.

Kohti kotitalousrobottien älykkäämpää ja mukautuvampaa tulevaisuutta

Antamalla roboteille mahdollisuuden itse korjata suoritusvirheet ja parantaa tehtävien yleistä menestystä, tämä menetelmä vastaa yhteen robotin ohjelmoinnin suurimmista haasteista: sopeutumiskyvystä todellisiin tilanteisiin.

Tämän tutkimuksen vaikutukset ulottuvat paljon pidemmälle kuin pelkkä marmorien kauhaaminen. Kun kotitalousrobotit yleistyvät, niiden on kyettävä käsittelemään monenlaisia tehtäviä dynaamisissa, jäsentämättömissä ympäristöissä. Kyky jakaa tehtävät osatehtäviin, ymmärtää taustalla oleva logiikka ja sopeutua häiriöihin on välttämätöntä, jotta nämä robotit toimivat tehokkaasti ja tehokkaasti.

Lisäksi LLM:ien ja robotiikan integrointi osoittaa, että tekoälyteknologiat voivat mullistaa tapamme, jolla ohjelmoimme ja koulutamme robotteja. Kun nämä tekniikat kehittyvät jatkuvasti, voimme odottaa näkevämme kodeissamme ja työpaikoillamme entistä älykkäämpiä, mukautuvampia ja autonomisempia robotteja.

MIT:n tutkijoiden työ on kriittinen askel kohti kotitalousrobottien luomista, jotka voivat todella ymmärtää ja navigoida todellisen maailman monimutkaisuudessa. Koska tätä lähestymistapaa on jalostettu ja sitä sovelletaan laajempaan tehtäviin, se voi muuttaa tapaamme elää ja työskennellä tehden elämästämme helpompaa ja tehokkaampaa.

Liittyvät aiheet:Ohjelmistorobotiikka

Seuraavaksi

Uraauurtavat biomimeettiset hajulastut Käytä tekoälyä mahdollistamaan robottien haju

Älä missaa

Miten käsitykset robotin autonomiasta muokkaavat vastuuta

Alex McFarland

Alex McFarland on tekoälytoimittaja ja kirjailija, joka tutkii tekoälyn viimeisintä kehitystä. Hän on tehnyt yhteistyötä lukuisten AI-startup-yritysten ja -julkaisujen kanssa maailmanlaajuisesti.

Unite.AI

MIT-tutkijat yhdistävät robotin liiketiedot kielimalleihin parantaakseen tehtävien suorittamista

Ohjelmistorobotiikka

MIT-tutkijat yhdistävät robotin liiketiedot kielimalleihin parantaakseen tehtävien suorittamista

Sisällysluettelo

Uusi lähestymistapa

Suurten kielimallien rooli

Kohti kotitalousrobottien älykkäämpää ja mukautuvampaa tulevaisuutta

Uusimmat viestit

Unite.AI

MIT-tutkijat yhdistävät robotin liiketiedot kielimalleihin parantaakseen tehtävien suorittamista

Sisällysluettelo

Uusi lähestymistapa

Suurten kielimallien rooli

Kohti kotitalousrobottien älykkäämpää ja mukautuvampaa tulevaisuutta

Saatat pitää

Uusimmat viestit