Robotica
Hoe robots leren om om hulp te vragen

In de evoluerende wereld van robotica springt een baanbrekende samenwerking tussen Princeton University en Google in het oog. Ingenieurs van deze prestigieuze instellingen hebben een innovatieve methode ontwikkeld die robots een cruciale vaardigheid leert: herkennen wanneer ze hulp nodig hebben en hoe ze daarom moeten vragen. Deze ontwikkeling markeert een significante stap voorwaarts in de robotica, waarbij de kloof tussen autonome functionaliteit en mens-robotinteractie wordt overbrugd.
De reis naar meer intelligente en onafhankelijke robots is altijd gehinderd door één significante uitdaging: de complexiteit en dubbelzinnigheid van de menselijke taal. In tegenstelling tot de binaire duidelijkheid van computercode, is de menselijke taal doorspekt met nuances en subtiliteiten, waardoor het een labyrint voor robots wordt. Bijvoorbeeld, een opdracht als eenvoudig als “pak de kom” kan een complexe taak worden wanneer er meerdere kommen aanwezig zijn. Robots, die zijn uitgerust om hun omgeving te kunnen waarnemen en te reageren op taal, vinden zich vaak aan een kruispunt wanneer ze worden geconfronteerd met dergelijke linguïstische onzekerheden.
Het kwantificeren van onzekerheid
Om deze uitdaging aan te pakken, heeft het team van Princeton en Google een novale aanpak geïntroduceerd die de ‘fuzziness’ van de menselijke taal kwantificeert. Deze techniek meet feitelijk het niveau van onzekerheid in taalopdrachten en gebruikt deze meting om robotacties te leiden. In situaties waarin een opdracht tot meerdere interpretaties kan leiden, kan de robot nu het niveau van onzekerheid meten en beslissen wanneer hij verdere verduidelijking moet zoeken. Bijvoorbeeld, in een omgeving met meerdere kommen, zou een hoger niveau van onzekerheid de robot ertoe brengen om te vragen welke kom hij moet pakken, waardoor potentieel fouten of inefficiënties worden vermeden.
Deze aanpak geeft robots niet alleen een beter begrip van taal, maar verhoogt ook hun veiligheid en efficiëntie bij het uitvoeren van taken. Door het integreren van grote taalmodellen (LLM’s) zoals die achter ChatGPT, hebben de onderzoekers een significante stap gezet in het beter afstemmen van robotacties op menselijke verwachtingen en behoeften.
De rol van grote taalmodellen
De integratie van LLM’s speelt een cruciale rol in deze nieuwe aanpak. LLM’s zijn instrumenteel in het verwerken en interpreteren van menselijke taal. In deze context worden ze gebruikt om de onzekerheid in taalopdrachten die aan robots worden gegeven te evalueren en te meten.
Maar de afhankelijkheid van LLM’s is niet zonder uitdagingen. Zoals de onderzoeksgroep opmerkt, kunnen de uitvoer van LLM’s soms onbetrouwbaar zijn.
Anirudha Majumdar, een assistent-professor aan Princeton, benadrukt het belang van deze balans:
“Blindly volgen van plannen die zijn gegenereerd door een LLM kan ertoe leiden dat robots op een onveilige of onbetrouwbare manier handelen, en dus hebben we onze LLM-gebaseerde robots nodig die weten wanneer ze het niet weten.”
Dit benadrukt de noodzaak van een genuanceerde aanpak, waarbij LLM’s worden gebruikt als hulpmiddelen voor leiding in plaats van onfeilbare beslissers.
Praktische toepassing en testen
De praktische toepasbaarheid van deze methode is getest in verschillende scenario’s, waardoor de veelzijdigheid en effectiviteit ervan wordt aangetoond. Een van deze tests betrof een robotarm die was belast met het sorteren van speelgoedvoedsel in verschillende categorieën. Deze eenvoudige setup demonstreerde de capaciteit van de robot om taken met duidelijke keuzes effectief te navigeren.

Afbeelding: Princeton University
De complexiteit nam aanzienlijk toe in een ander experiment met een robotarm gemonteerd op een wielenplatform in een keuken. Hier moest de robot echte werelduitdagingen aan, zoals het identificeren van het juiste item om in een magnetron te plaatsen wanneer er meerdere opties aanwezig waren.
Door deze tests hebben de robots succesvol aangetoond dat ze de gekwantificeerde onzekerheid kunnen gebruiken om beslissingen te nemen of verduidelijking te zoeken, waardoor de praktische bruikbaarheid van deze methode wordt bevestigd.
Toekomstige implicaties en onderzoek
Kijkend naar de toekomst, gaan de implicaties van dit onderzoek verder dan de huidige toepassingen. Het team, geleid door Majumdar en promovendus Allen Ren, onderzoekt hoe deze aanpak kan worden toegepast op meer complexe problemen in robotperceptie en AI. Dit omvat scenario’s waarin robots visie- en taalinformatie moeten combineren om beslissingen te nemen, waardoor de kloof tussen robotbegrip en menselijke interactie verder wordt gesloten.
Het lopende onderzoek is gericht op het verbeteren van de capaciteit van robots om taken met hogere nauwkeurigheid uit te voeren, maar ook om de wereld te navigeren met een begrip dat vergelijkbaar is met menselijke cognitie. Dit onderzoek kan de weg vrijmaken voor robots die niet alleen efficiënter en veiliger zijn, maar ook meer in overeenstemming met de subtiele eisen van menselijke omgevingen.
U kunt het gepubliceerde onderzoek hier vinden.












