Robotica

Metodo di apprendimento che consente ai robot di imparare guardando gli esseri umani

mm

Un nuovo metodo di apprendimento sviluppato da ricercatori della Carnegie Mellon University (CMU) consente ai robot di imparare direttamente da video di interazione umana e di generalizzare le informazioni per nuovi compiti, aiutandoli a imparare come eseguire faccende domestiche. Il metodo di apprendimento si chiama WHIRL, che sta per In-the-wild Human Imitating Robot Learning, e aiuta il robot a osservare i compiti e a raccogliere i dati video per imparare eventualmente a completare il lavoro da solo.

La ricerca è stata presentata alla conferenza Robotics: Science and Systems di New York.

Imitazione come modo di imparare

Shikhar Bahl è uno studente di dottorato presso il Robotics Institute (RI) della School of Computer Science della Carnegie Mellon University.

“L’imitazione è un ottimo modo per imparare”, ha detto Bahl. “Far imparare ai robot guardando direttamente gli esseri umani rimane un problema irrisolto nel campo, ma questo lavoro rappresenta un passo significativo per consentire questa capacità.”

Bahl ha lavorato insieme a Deepak Pathak e Abhinav Gupta, entrambi membri della facoltà del RI. Il team ha aggiunto una telecamera e il loro software a un robot commerciale che ha imparato a completare oltre 20 compiti. Questi compiti includevano tutto, dall’aprire e chiudere elettrodomestici a prendere un sacchetto di spazzatura dal bidone. Ogni volta che il robot guardava un essere umano completare i compiti prima di tentare di farlo da solo.

Pathak è un professore assistente presso il RI.

“Questo lavoro presenta un modo per portare i robot nelle case”, ha detto Pathak. “Invece di aspettare che i robot siano programmato o addestrato per completare con successo diversi compiti prima di deployarli nelle case delle persone, questa tecnologia consente di deployare i robot e farli imparare a completare i compiti, adattandosi ai loro ambienti e migliorando solo guardando.”

WHIRL vs. metodi attuali

La maggior parte dei metodi attuali per insegnare a un robot un compito si basa sull’imitazione o sull’apprendimento per rinforzo. Con l’apprendimento per imitazione, gli esseri umani operano manualmente un robot e gli insegnano a completare un compito, il che richiede essere eseguito più volte prima che il robot impari. Con l’apprendimento per rinforzo, il robot è solitamente addestrato su milioni di esempi in simulazione prima di adattare l’addestramento al mondo reale.

Sebbene entrambi questi modelli siano efficienti nell’insegnare a un robot un singolo compito in un ambiente strutturato, si rivelano difficili da scalare e deployare. Ma con WHIRL, un robot può imparare da qualsiasi video di un essere umano che completa un compito. È anche facilmente scalabile, non limitato a un compito specifico e può operare in ambienti domestici.

WHIRL consente ai robot di completare compiti nel loro ambiente naturale. E sebbene i primi tentativi siano solitamente finiti in fallimento, il robot può imparare molto rapidamente dopo solo pochi successi. Il robot non sempre completa il compito con gli stessi movimenti di un essere umano, ma questo è perché ha parti diverse che si muovono in modo diverso. Detto questo, il risultato finale del completare i compiti è sempre lo stesso.

“Per scalare la robotica nel mondo selvaggio, i dati devono essere affidabili e stabili e i robot devono migliorare nel loro ambiente praticando da soli”, ha detto Pathak.

Alex McFarland è un giornalista e scrittore di intelligenza artificiale che esplora gli ultimi sviluppi nel campo dell'intelligenza artificiale. Ha collaborato con numerose startup di intelligenza artificiale e pubblicazioni in tutto il mondo.