Robotikk
Robotter kan lære kompliserte oppgaver fra få demonstrasjoner

I ett av de siste fremstegene innen robotikk, har forskere ved University of Southern California (USC) utviklet et system der roboter kan lære kompliserte oppgaver med få demonstrasjoner. Enda mer imponerende er det at noen av demonstrasjonene kan være uperfekte.
Forskningen ble presentert på Conference on Robot Learning (CoRL) den 18. november, med tittelen “Learning from Demonstrations Using Signal Temporal Logic.”
Systemet
Kvaliteten på hver demonstrasjon måles så systemet kan lære fra sine suksesser og feil. I motsetning til nåværende metoder, som krever minst 100 demonstrasjoner for å lære en bestemt oppgave, krever det nye systemet bare noen få. På en intuitiv måte, ligner måten disse robotene lærer på måten mennesker lærer av hverandre. For eksempel, ser mennesker på og lærer av andre som fullfører oppgaver suksessfullt eller uperfekt.
Aniruddh Puranic er hovedforfatter av forskningen og en ph.d.-student i datavitenskap ved USC Viterbi School of Engineering.
“De fleste maskinlærings- og forsterkningslærings-systemer krever store mengder data og hundrevis av demonstrasjoner – du trenger en menneske til å demonstrere gang på gang, noe som ikke er gjennomførbart,” sa Puranic.
“Og, de fleste mennesker har ikke programmeringskunnskaper til å eksplisitt angi hva roboten må gjøre, og et menneske kan ikke mulig demonstrere alt som en robot må vite,” fortsatte han. “Hva hvis roboten møter noe den ikke har sett før? Dette er en nøkkelutfordring.”
Forskerne brukte “signal temporal logikk” eller STL for å bestemme kvaliteten på demonstrasjonene, rangerte dem etter hvert og skapte innebygde belønninger.










