Robotikk

Hvordan roboter lærer å be om hjelp

Publisert 1. desember 2023

Oppdatert 22. mai 2026

Alex McFarland

I den utviklende verden av robotikk, står et banebrytende samarbeid mellom Princeton University og Google ut. Ingeniører fra disse prestisjefylte institusjonene har utviklet en innovativ metode som lærer roboter en kritisk ferdighet: å gjenkjenne når de trenger hjelp og hvordan de skal be om det. Denne utviklingen markerer et betydelig sprang fremover i robotikk, og broer gapet mellom autonom funksjon og menneske-robot interaksjon.

Reisen mot mer intelligente og uavhengige roboter har alltid vært hindret av en betydelig utfordring: kompleksiteten og tvetydigheten i menneskespråk. I motsetning til den binære klareheten i datakoder, er menneskespråk fullt av nyanser og subtiliteter, og gjør det til en labyrint for roboter. For eksempel, kan en kommando så enkel som “plukk opp skålen” bli en kompleks oppgave når det er flere skåler til stede. Robotene, utstyrt for å sanse omgivelsene og svare på språk, ofte finner seg selv i en kryssvei når de møter slike lingvistiske usikkerheter.

Kvantifisering av usikkerhet

For å møte denne utfordringen, har Princeton- og Google-teamet introdusert en ny tilnærming som kvantifiserer “uskarpheten” i menneskespråk. Denne teknikken måler essensielt nivået av usikkerhet i språkkommandoer og bruker denne målingen til å guide robotens handlinger. I situasjoner hvor en kommando kan føre til flere tolkninger, kan roboten nå måle nivået av usikkerhet og bestemme når den skal søke ytterligere forklaring. For eksempel, i en omgivelse med flere skåler, ville en høyere grad av usikkerhet få roboten til å spørre hvilken skål den skal plukke opp, og dermed unngå potensielle feil eller ineffektiviteter.

Denne tilnærmingen ikke bare gir robotene en bedre forståelse av språk, men også forbedrer deres sikkerhet og effektivitet i oppgaveutførelse. Ved å integrere store språkmodeller (LLM) som de bak ChatGPT, har forskerne tatt et betydelig skritt i å tilpasse robotens handlinger nærmere menneskelige forventninger og behov.

Rollen til store språkmodeller

Integreringen av LLM spiller en avgjørende rolle i denne nye tilnærmingen. LLM er instrumentale i å prosessere og tolke menneskespråk. I denne konteksten brukes de til å evaluere og måle usikkerheten i språkkommandoer gitt til roboter.

Men avhengigheten av LLM er ikke uten utfordringer. Som forskningsteamet påpeker, kan utdata fra LLM noen ganger være upålitelige.

Anirudha Majumdar, en assistentprofessor ved Princeton, understreker viktigheten av denne balansen:

“Å følge blindt planer generert av en LLM kan få roboter til å handle på en usikker eller upålitelig måte, og derfor trenger våre LLM-baserte roboter å vite når de ikke vet.”

Dette understreker nødvendigheten for en nyansert tilnærming, hvor LLM brukes som verktøy for veiledning i stedet for ufeilbarlige beslutningstakere.

Praktisk anvendelse og testing

Den praktiske anvendelsen av denne metoden har blitt testet i ulike scenarier, og illustrerer dens fleksibilitet og effektivitet. En slik test involverte en robotarm, som ble bedt om å sortere lekematvarer inn i ulike kategorier. Denne enkle oppsettet demonstrerte robotens evne til å navigere oppgaver med klare valg effektivt.

Bilde: Princeton University

Kompleksiteten økte betydelig i en annen eksperiment med en robotarm montert på en hjulbasert plattform i et kontorkjøkken. Her møtte roboten virkelige utfordringer som å identifisere riktig gjenstand å plassere i en mikrobølgeovn når det var flere alternativer.

Gjennom disse testene, demonstrerte robotene suksessfullt sin evne til å bruke kvantifisert usikkerhet til å fatte beslutninger eller søke forklaring, og dermed validerte den praktiske nytten av denne metoden.

Fremtidige implikasjoner og forskning

Ser vi fremover, går implikasjonene av denne forskningen langt utenfor nåværende anvendelser. Teamet, ledet av Majumdar og graduate student Allen Ren, utforsker hvordan denne tilnærmingen kan anvendes på mer komplekse problemer i robotpersepsjon og kunstig intelligens. Dette inkluderer scenarier hvor roboter må kombinere visuell og språklig informasjon for å fatte beslutninger, og dermed lukke gapet mellom robotforståelse og menneskelig interaksjon.

Forskningsarbeidet søker å ikke bare forbedre robotenes evne til å utføre oppgaver med høyere nøyaktighet, men også å navigere i verden med en forståelse lik menneskelig kognisjon. Denne forskningen kan åpne veien for roboter som ikke bare er mer effektive og sikrere, men også mer i harmoni med de nyanserte kravene i menneskelige miljøer.

Du kan finne den publiserte forskningen her.

Alex McFarland

Alex McFarland er en AI-journalist og forfatter som utforsker de nyeste utviklingene innen kunstig intelligens. Han har samarbeidet med tallrike AI-startups og publikasjoner verden over.

Unite.AI

Hvordan roboter lærer å be om hjelp

Kvantifisering av usikkerhet

Rollen til store språkmodeller

Praktisk anvendelse og testing

Fremtidige implikasjoner og forskning

You may like