Robotica
Mens-gestuurde AI-raamwerk belooft snellere robotische leerprocessen in nieuwe omgevingen

In de toekomstige era van slimme huizen zal het niet ongebruikelijk zijn om een robot aan te schaffen om huishoudelijke taken te vereenvoudigen. Niettemin kan frustratie intreden wanneer deze geautomatiseerde hulpmiddelen falen om eenvoudige taken uit te voeren. Komt Andi Peng, een onderzoeker van de afdeling Elektrotechniek en Informatica van MIT, die, samen met haar team, een pad baant om de leercurve van robots te verbeteren.
Peng en haar interdisciplinaire team van onderzoekers hebben een mens-robot interactief raamwerk ontwikkeld. Het hoogtepunt van dit systeem is de mogelijkheid om contrafeitelijke verhalen te genereren die de benodigde veranderingen aangeven voor de robot om een taak succesvol uit te voeren.
Om dit te verduidelijken, wanneer een robot moeite heeft om een vreemd geverfde mok te herkennen, biedt het systeem alternatieve situaties waarin de robot zou zijn geslaagd, misschien als de mok een meer voorkomende kleur had. Deze contrafeitelijke verklaringen, gecombineerd met menselijke feedback, versnellen het proces van het genereren van nieuwe gegevens voor het fijnafstellen van de robot.
Peng legt uit: “Fijnafstellen is het proces van optimaliseren van een bestaand machine learning-model dat al bedreven is in een taak, om het in staat te stellen een tweede, analoog taak uit te voeren.”
Een sprong in efficiëntie en prestaties
Toen het systeem werd getest, toonde het indrukwekkende resultaten. Robots die met deze methode werden getraind, toonden snelle leerprestaties, terwijl ze de tijdsinvestering van hun menselijke leraren verminderden. Als dit innovatieve raamwerk met succes op grote schaal wordt geïmplementeerd, kan het helpen om robots snel aan te passen aan nieuwe omgevingen, waardoor de behoefte voor gebruikers om geavanceerde technische kennis te bezitten, wordt geminimaliseerd. Deze technologie kan de sleutel zijn om algemene doelstellingen te bereiken voor robots die ouderen of gehandicapten efficiënt kunnen helpen.
Peng gelooft: “Het einddoel is om een robot in staat te stellen om te leren en te functioneren op een menselijk abstract niveau.”
Revolutionaire robottraining
De belangrijkste hindernis in robotische leerprocessen is de ‘verdelingsverschuiving’, een term die wordt gebruikt om een situatie te beschrijven waarin een robot objecten of ruimtes tegenkomt die het niet heeft ontmoet tijdens de trainingsperiode. De onderzoekers hebben, om dit probleem aan te pakken, een methode genaamd ‘imitatieleer’ geïmplementeerd. Maar deze had zijn beperkingen.
“Stel je voor dat je 30.000 mokken moet demonstreren voor een robot om elke mok op te pakken. In plaats daarvan geef ik de voorkeur aan demonstreren met slechts één mok en de robot leren dat het een mok van elke kleur kan oppakken”, zegt Peng.
Als reactie hierop identificeert het systeem van het team welke attributen van het object essentieel zijn voor de taak (zoals de vorm van een mok) en welke niet (zoals de kleur van de mok). Gewapend met deze informatie, genereert het synthetische gegevens, waarbij de “niet-essentiële” visuele elementen worden gewijzigd, waardoor het leerproces van de robot wordt geoptimaliseerd.
Menselijke redenering verbinden met robotlogica
Om de effectiviteit van dit raamwerk te meten, voerden de onderzoekers een test uit met menselijke gebruikers. De deelnemers werden gevraagd of de contrafeitelijke verklaringen van het systeem hun begrip van de taakprestaties van de robot verbeterden.
Peng zegt: “We vonden dat mensen van nature bedreven zijn in deze vorm van contrafeitelijke redenering. Het is dit contrafeitelijke element dat ons in staat stelt om menselijke redenering naadloos om te zetten in robotlogica.”
In het kader van meerdere simulaties leerde de robot consequent sneller met hun aanpak, waardoor andere technieken werden overtroffen en minder demonstraties van gebruikers nodig waren.
In de toekomst plannen het team om dit raamwerk op echte robots te implementeren en te werken aan het verkorten van de gegevensgeneratietijd via generatieve machine learning-modellen. Deze baanbrekende aanpak heeft het potentieel om de robotleercurve te transformeren, waardoor de weg wordt geëffend voor een toekomst waarin robots harmonieus samenleven in ons dagelijks leven.












