stubs Robots māca sevi staigāt, izmantojot pastiprināšanas mācības — Unite.AI
Savienoties ar mums

Robotika

Robots māca sevi staigāt pastiprinošām mācībām

Izdots

 on

Kamēr Boston Dynamics un dejojoši roboti parasti tiek pievērsta lielākā daļa uzmanības, aizkulisēs notiek daži nozīmīgi notikumi, kas netiek pietiekami atspoguļoti. Viens no šiem notikumiem nāk no Bērklijas laboratorijas, kur robots vārdā Cassie spēja iemācīties staigāt pastiprināšanas mācībās. 

Pēc izmēģinājumiem un kļūdām robotu kāju pāris iemācījās orientēties simulētā vidē, pirms tika pārbaudīti reālajā pasaulē. Sākotnēji robots demonstrēja spēju staigāt visos virzienos, staigāt, pietupoties, mainīt sevi, kad tiek izstumts no līdzsvara, un pielāgoties dažāda veida virsmām. 

Cassie robots ir pirmais divkājains robots, kas veiksmīgi izmanto pastiprinājumu, kas mācās staigāt. 

Dejojošo robotu bijība

Lai gan roboti, piemēram, no Boston Dynamics, ir ārkārtīgi iespaidīgi un apbrīno gandrīz visus, kas tos skatās, ir daži galvenie faktori. Jo īpaši šie roboti ir manuāli ieprogrammēti un horeogrāfēti, lai sasniegtu rezultātu, taču šī nav ieteicamā metode reālās situācijās. 

Ārpus laboratorijas robotiem jābūt izturīgiem, elastīgiem, elastīgiem un daudz ko citu. Turklāt viņiem ir jāspēj saskarties ar neparedzētām situācijām un tikt galā ar tām, ko var izdarīt, tikai ļaujot viņiem pašiem tikt galā ar šādām situācijām. 

Zhongyu Li bija daļa no komandas, kas strādāja pie Cassie Bērklijas universitātē. 

"Šie videoklipi var likt dažiem cilvēkiem domāt, ka šī ir atrisināta un vienkārša problēma," saka Li. "Taču mums vēl ir tāls ceļš ejams, lai humanoīdu roboti droši darbotos un dzīvotu cilvēku vidē." 

Pastiprināšanas mācības divkāju robotu stabilai parametrizētai pārvietošanās kontrolei

 

Pastiprināšanas mācības

Lai izveidotu šādu robotu, Bērklija komanda paļāvās uz pastiprināšanas mācīšanos, ko izmantojuši tādi uzņēmumi kā DeepMind, lai apmācītu algoritmus, lai pārspētu cilvēkus pasaules sarežģītākajās spēlēs. Pastiprināšanas mācīšanās pamatā ir izmēģinājumi un kļūdas, robotam mācoties no savām kļūdām. 

Cassie robots izmantoja pastiprināšanas mācīšanos, lai iemācītos staigāt simulācijā, kas nav pirmā reize, kad tiek izmantota šāda pieeja. Tomēr tas parasti neizkļūst no simulētās vides un nonāk reālajā pasaulē. Pat neliela atšķirība var izraisīt to, ka robots nevarēs staigāt. 

Pētnieki izmantoja divas simulācijas, nevis vienu, no kurām pirmā bija atvērtā koda apmācības vide ar nosaukumu MuJoCo. Šajā pirmajā simulācijā algoritms mēģināja un mācījās no iespējamo kustību bibliotēkas, un otrajā simulācijā ar nosaukumu SimMechanics robots tās pārbaudīja reālākos apstākļos.

Pēc izstrādes abās simulācijās algoritms nebija precīzi jāpielāgo. Tas jau bija gatavs lietošanai reālajā pasaulē. Tas ne tikai spēja staigāt, bet arī daudz vairāk. Pēc pētnieku domām, Kesijai izdevās atgūties pēc tam, kad robota ceļgalā nedarbojās divi motori.

Lai gan Kesijai var nebūt visi zvani un svilpes kā dažiem citiem robotiem, tas daudzējādā ziņā ir daudz iespaidīgāks. Tam ir arī lielāka ietekme uz tehnoloģiju, kad runa ir par izmantošanu reālajā pasaulē, jo šādu staigājošu robotu varētu izmantot daudzās dažādās nozarēs.  

 

Alekss Makfārlends ir AI žurnālists un rakstnieks, kurš pēta jaunākos sasniegumus mākslīgā intelekta jomā. Viņš ir sadarbojies ar daudziem AI jaunizveidotiem uzņēmumiem un publikācijām visā pasaulē.