Robotik
Hvordan robotter lærer at bede om hjælp

I den udviklende verden af robotteknologi udgør et banebrydende samarbejde mellem Princeton University og Google en fremtrædende position. Ingeniører fra disse prestigefyldte institutioner har udviklet en innovativ metode, der lærer robotter en afgørende færdighed: at genkende, når de har brug for hjælp, og hvordan de beder om det. Denne udvikling markerer et betydeligt skridt fremad i robotteknologi, idet den broer gapet mellem autonom funktion og menneske-robot-interaktion.
Rejsen mod mere intelligente og uafhængige robotter er altid blevet hindret af en væsentlig udfordring: kompleksiteten og tvetydigheden af menneskesprog. I modsætning til den binære klarhed i computerkoder er menneskesprog fyldt med nuancer og subtiliteter, hvilket gør det til en labyrint for robotter. For eksempel kan en kommando så simpel som “tag skålen” blive til en kompleks opgave, når der er flere skåle til stede. Robotter, der er udstyret til at fornemme deres omgivelser og reagere på sprog, finder ofte sig selv i en krydsvej, når de står over for sådanne sproglige usikkerheder.
Kvantificering af usikkerhed
For at imødekomme denne udfordring har Princeton- og Google-holdet introduceret en ny tilgang, der kvantificerer “uskarpheden” i menneskesprog. Denne teknik måler grundlæggende niveauet af usikkerhed i sprogkommandoer og bruger denne måling til at guide robot-handlinger. I situationer, hvor en kommando kan føre til multiple fortolkninger, kan robotten nu bedømme niveauet af usikkerhed og afgøre, hvornår den skal søge yderligere opklaring. For eksempel i en omgivelse med flere skåle ville et højere niveau af usikkerhed få robotten til at spørge, hvilken skål den skal tage, og dermed undgå potentielle fejl eller ineffektiviteter.
Denne tilgang giver ikke kun robotter en bedre forståelse af sprog, men forbedrer også deres sikkerhed og effektivitet i opgaveudførelse. Ved at integrere store sprogmodeller (LLM’er) som dem, der ligger bag ChatGPT, har forskerne taget et væsentligt skridt i retning af at tilpasse robot-handlinger mere nøjagtigt til menneskelige forventninger og behov.
Rollen for store sprogmodeller
Integrationen af LLM’er spiller en afgørende rolle i denne nye tilgang. LLM’er er afgørende for at bearbejde og fortolke menneskesprog. I denne kontekst bruges de til at evaluere og måle usikkerheden, der er til stede i sprogkommandoer givet til robotter.
Men afhængigheden af LLM’er er ikke uden udfordringer. Som forskerholdet har påpeget, kan output fra LLM’er undertiden være upålidelige.
Anirudha Majumdar, en adjunktprofessor ved Princeton, understreger vigtigheden af denne balance:
“At blinde følge planer genereret af en LLM kan få robotter til at handle på en usikker eller utroværdig måde, og derfor har vi brug for, at vores LLM-baserede robotter ved, når de ikke ved.”
Dette understreger nødvendigheden af en nuanceret tilgang, hvor LLM’er bruges som værktøjer til vejledning snarere end ufejlbarlige beslutningstager.
Praktisk anvendelse og test
Den praktiske anvendelighed af denne metode er blevet testet i forskellige scenarier, der illustrerer dets fleksibilitet og effektivitet. Et sådant test involverede en robotarm, der skulle sortere legetøjsmadvarer i forskellige kategorier. Denne simple opsætning demonstrerede robotens evne til at navigere opgaver med klare valg effektivt.

Billede: Princeton University
Kompleksiteten øgedes betydeligt i et andet eksperiment, der involverede en robotarm monteret på en hjulplatform i et kontorkøkken. Her stod robotten over for virkelige udfordringer som at identificere den korrekte vare til at placere i en mikrobølgeovn, når der var flere muligheder.
Gennem disse tests demonstrerede robotterne med succes deres evne til at bruge den kvantificerede usikkerhed til at træffe beslutninger eller søge opklaring, og dermed validerede den praktiske nytte af denne metode.
Fremtidige implikationer og forskning
Settende blikket fremad, går implikationerne af denne forskning langt ud over de nuværende anvendelser. Holdet, ledet af Majumdar og ph.d.-studerende Allen Ren, udforsker, hvordan denne tilgang kan anvendes på mere komplekse problemer i robotperception og kunstig intelligens. Dette inkluderer scenarier, hvor robotter skal kombinere visuel og sproglig information for at træffe beslutninger, og dermed lukke gapet mellem robotforståelse og menneskelige interaktioner.
Forskningen sigter mod ikke kun at forbedre robotternes evne til at udføre opgaver med højere præcision, men også at navigere i verden med en forståelse lignende menneskelig kognition. Denne forskning kunne bana vejen for robotter, der ikke kun er mere effektive og sikrere, men også mere i harmoni med de nuancerede krav i menneskelige miljøer.
DU kan finde den publicerede forskning her.












