стуб Гуглова вештачка интелигенција учи роботе како да се крећу посматрајући псе - Уните.АИ
Повежите се са нама

Роботицс

Гоогле-ов АИ учи роботе како да се крећу посматрајући псе

mm
Ажурирано on

Чак и неки од најнапреднијих робота данас се и даље крећу на помало незграпне, трзаве начине. Да би навели роботе да се крећу на реалистичније, флуидније начине, истраживачи у Гуглу су развили систем вештачке интелигенције који је способан да учење из покрета стварних животиња. Гоогле истраживачки тим је објавио а препринт папир који детаљно описује њихов приступ крајем прошле недеље. У раду и пропратној блог пост, истраживачки тим описује образложење система. Аутори рада верују да би давање робота природнијим кретањем могло да им помогне да остваре задатке у стварном свету који захтевају прецизно кретање, као што је испорука предмета између различитих нивоа зграде.

Како је известио ВентуреБеат, истраживачки тим је користио учење појачања да обучи своје роботе. Истраживачи су започели прикупљањем снимака стварних животиња које се крећу и коришћењем техника учења појачања (РЛ) како би гурнули роботе да имитирају покрете животиња у видео снимцима. У овом случају, истраживачи су обучили роботе на клиповима пса, дизајнираним у симулатору физике, дајући упутства четвороножном Унитрее Лаикаго роботу да имитира покрете пса. Након што је робот био обучен, био је способан да постигне сложене покрете попут скакања, окретања и брзог хода, брзином од око 2.6 миља на сат.

Подаци о обуци састојали су се од приближно 200 милиона узорака паса у покрету, праћених у симулацији физике. Различити покрети су затим вођени кроз функције награђивања и политике са којима су агенти учили. Након што су политике креиране у симулацији, пренете су у стварни свет користећи технику која се зове латентна просторна адаптација. Пошто су симулатори физике који се користе за обуку робота могли само да приближе одређене аспекте кретања у стварном свету, истраживачи су насумично применили различите пертурбације на симулацију, намењену симулацији рада у различитим условима.

Према истраживачком тиму, успели су да прилагоде политике симулације роботима из стварног света користећи само осам минута података прикупљених у 50 различитих испитивања. Истраживачи су успели да покажу да су роботи из стварног света били у стању да имитирају низ различитих, специфичних покрета као што су кас, окретање, скакање и ходање. Чак су могли да имитирају анимације које су креирали уметници анимације, као што је комбинација скока и окретања.

Истраживачи сумирају налазе у раду:

„Показали смо да коришћењем референтних података о кретању, један приступ заснован на учењу може аутоматски да синтетише контролере за разнолик репертоар [од] понашања за роботе са ногама. Уграђивањем примера ефикасних техника прилагођавања домена у процес обуке, наш систем је у стању да научи прилагодљиве политике у симулацији које се затим могу брзо прилагодити за примену у стварном свету.”

Контролне политике коришћене током процеса учења поткрепљења имале су своја ограничења. Због ограничења која намећу хардвер и алгоритми, било је неколико ствари које роботи једноставно нису могли да ураде. Нису били у стању да трче или праве велике скокове, на пример. Научене политике такође нису показале толику стабилност у поређењу са покретима који су ручно дизајнирани. Истраживачки тим жели да одведе посао даље тако што ће контролере учинити робуснијим и способнијим за учење из различитих врста података. У идеалном случају, будуће верзије оквира ће моћи да уче из видео података.