Følg os

Tanke ledere

Den humanoide æra kommer ikke – den er allerede her

mm

Tidligere på måneden, i Kina, en humanoid robot ved navn Shuang Shuang indtog scenen ved en dimissionsceremoni for gymnasiet i Fujian for at modtage et diplom – hvor de gav hånd og glædede både elever og lærere. Øjeblikke som disse repræsenterer et meningsfuldt skift, et hvor menneskelignende robotter begynder at træde ind i det offentlige liv på meget synlige måder.

Disse øjeblikke markerer mere end blot offentlig nysgerrighed – de signalerer et skift mod integration i den virkelige verden. Denne artikel undersøger, hvordan humanoider bevæger sig fra show og skue til funktionalitet – og hvorfor det, der tilsyneladende kun er en hardwarebaseret bedrift, i virkeligheden handler om den integrerede intelligens, der gør det muligt for disse maskiner at gå, interagere og lære i miljøer, der ikke er designet til automatisering. Vi vil også diskutere, hvordan vi griber kommercialisering an gennem tidlig implementering og langsigtede partnerskaber.

Hvordan humanoider skubber AI ind i den virkelige verden

Kløften mellem virtuel ydeevne og fysisk pålidelighed er fortsat en af de mest oversete udfordringer inden for AI. En chatbot kan generere afsnit med flydende tekst uden nogensinde at skulle handle på dem – på samme måde som en visionsmodel kan identificere et trin i et billede uden fysisk at skulle navigere i det eller risikere at falde. Humanoider har ikke den luksus.

For at fungere i den virkelige verden skal AI efterlade statiske datasæt og kontrollerede forhold. Den skal se, beslutte og handle i miljøer, der ændrer sig sekund for sekund. Det inkluderer ujævne gulve, forkert placerede genstande, uforudsigelig menneskelig adfærd og kontekstafhængige nonverbale signaler. Resultatet er en daglig konfrontation med støj, tvetydighed og potentiel fiasko.

Det er her, kropsliggjort ræsonnement – hvor sprog er forankret i rum, tid og konsekvens – begynder at betyde mere end symbolsk forudsigelse. Hvis et menneske for eksempel siger "pas på, det er glat", skal robotten ikke blot forbinde den sætning med en orddefinition, men også med rumlig bevidsthed, potentielle risici og justeringer i realtid.

Samtidig bliver multimodal læring afgørende, fordi ingen enkelt inputkanal er pålidelig nok til at fungere alene. Et kamera kan overse en glat overflade, men tryksensorer i foden kan registrere et pludseligt tab af trækkraft. Eller i en anden situation kan talegenkendelse svigte i et støjende lager, men visuelle signaler eller bevægelser kan udfylde hullet.

Generalisering bliver også afgørende. En robot kan ikke regne med at se det præcise miljø to gange. Den er nødt til at tilpasse sin adfærd, når gulvet er vådt, belysningen ændrer sig, eller kassen ikke er, hvor den var i går. Dette bliver forskellen mellem vellykket udførelse og fiasko.

Hos Humanoid starter vi derfor tidligt med at teste med kommercielle partnere. Vi integrerer vores robotter i live-miljøer for hurtigt at opdage potentielle fejl og sikre optimal funktion inden implementering. En robot, der klarer sig godt i simulering eller demo, er ikke den samme som en, der vinder tillid under pres, fordi den tillid i sidste ende er bygget på læring fra den virkelige verden.

Vi ved, at humanoider vil være kommercielt tilgængelige inden for de næste to år – men vi venter ikke. For os starter kommercialisering tidligt. Det betyder at opbygge langsigtede partnerskaber omkring reelle anvendelsesscenarier. Gennem en række pilotprogrammer uddanner vi ikke kun vores partnere om teknologien – vi lærer også sammen med dem. Denne fælles læringsproces hjælper os også med at forfine omkostningsstrukturer og ydeevnepålidelighed fra dag ét – hvilket sikrer de bedst mulige samlede ejeromkostninger (TCO), efterhånden som systemerne skaleres.

Hvorfor humanoider er det ultimative testmiljø for generel intelligens

Den verden, vi har skabt i løbet af de sidste hundrede år, er skræddersyet til menneskelig skala. Dørhåndtag, gaffeltrucks, lagre – alt antager bestemte dimensioner, bevægelsesområder og implicitte sociale adfærdsmønstre. Humanoider skal tilpasse sig denne virkelighed, ellers risikerer de at blive ekstremt begrænsede i deres funktionalitet.

For at kunne gå ovenpå, bære en genstand, fortolke en pegebevægelse eller genkende tøven i en stemme, skal en robot forstå kontekst langt ud over visuel klassificering eller scriptet bevægelsesplanlægning. Den skal udlede intention, lære en ny opgave ved at observere et menneske, tilpasse denne færdighed til et lidt anderledes layout og forbedre sin ydeevne over tid. I praksis udvider dette system effektivt, hvad AI kan gøre under reelle begrænsninger.

Hos Humanoid accelererer vi denne proces gennem teleoperation. I de tidlige stadier af udviklingen guider menneskelige operatører robotten gennem nøgleopgaver. Disse praktiske data bliver grundlaget for træning af ny adfærd. Over tid indgår disse demonstrationer i vores komplette modeller og hjælper os med at opbygge pålidelig autonomi.

Fra smalle systemer til integreret intelligens

De fleste AI-systemer i dag udmærker sig ved snævre opgaver. Isoleret set fungerer de alle godt. Men humanoider behøver ikke usammenhængende specialister. For at integrere med succes har vi brug for systemer, der kan ræsonnere på tværs af modaliteter og tidsskalaer.

En humanoid kan modtage en relativt vag instruktion – "Gå hen og bring mig den gule kasse fra opbevaringsrummet på den anden side af gangen" – og skal afkode den til en række delopgaver: lokalisere taleren, navigere i en korridor, identificere den rigtige kasse, justere gribestyrken, undgå kollisioner og selvfølgelig vende sikkert tilbage.

Hver del af den sekvens involverer et forskelligt delsystem – syn, bevægelse, sprog, manipulation og feedback. Og helhedens pålidelighed afhænger af, hvor godt disse dele kommunikerer under skiftende forhold.

Modulær arkitektur er en måde at imødekomme denne udfordring på. Dette giver os mulighed for at iterere på delsystemer uafhængigt, samtidig med at vi opnår systemomfattende koordinering. Derudover gør det os i stand til at skalere funktioner på tværs af flere miljøer uden at skulle genopbygge fra bunden. Det er sådan, vi bevæger os fra lukkede demoer til ydeevne i en åben verden.

Indsatsen er enorm – og den er global

Det er nemt at fremstille humanoider som futuristiske. Men når vi taler med vores kunder, er behovet akut. Masser af lagre, samlebånd og andre engang travle arbejdspladser kæmper nu for at holde bemandet oppe.

Denne mangel på arbejdskraft er demografiske problemer. I Japan, næsten 30% af befolkningen er over 65 årI Europa er nøglesektorer – som har en samlet lønsum på 1.7 billioner dollars — er kæmper med at rekruttere yngre medarbejdereDet er ikke den slags roller, de fleste mennesker ønsker, og i stigende grad heller ikke den slags roller, folk er villige til at udføre.

Ved at komme ind som hjælpende hænder, ikke som erstatninger, kan humanoider påtage sig fysisk krævende, gentagne eller farlige opgaver – flytning af inventar, lastning af paller, betjening af maskiner – uden risiko for træthed eller skader. Dette frigør menneskelige arbejdere til at fokusere på mere komplekse, kreative eller interpersonelle aspekter af jobbet.

Derudover skaber dette langsigtet økonomisk modstandsdygtighed. Når arbejdskraften er ustabil eller utilgængelig, kan intelligente maskiner bidrage til at sikre kontinuitet – alt sammen uden at gå på kompromis med sikkerhed, kvalitet eller tilpasningsevne.

Et andet aspekt, der skal fremhæves, er de lovgivningsmæssige rammer. De fleste teams – især i løst regulerede jurisdiktioner – venter med at tænke over dette. Vi startede der. Europas sikkerheds- og datalovgivning er nogle af de strengeste i verden, men i stedet for at behandle dem som hindringer, betragter vi dem som vores konkurrencefordel. Efterhånden som andre markeder indfører strengere regler, vil vi være klar til at imødekomme dem, mens andre virksomheder måske kæmper.

En ny AI-race – men ikke den, du tror

Meget af diskursen omkring AI i dag centrerer sig om computerkraft, parametre og træningsdata. Men det virkelige gennembrud kan komme fra en anden grænse: integration i den fysiske verden. Det er der, intelligens skal lære at præstere, i stedet for blot at forudsige.

I denne henseende handler kapløbet om det mest kapable system – et system, der kan fungere i offentlige rum, under sikkerhedsmæssige begrænsninger og med mennesker i kredsløbet. Dette system vil, udover at lære af data, også – og især – lære af virkeligheden og arbejde sammen med mennesker uden at forstyrre tingenes strømning.

Derfor venter vi ikke med at starte implementeringen. Fra starten arbejder vi direkte med kommercielle partnere for at integrere i virkelige miljøer – og sikrer, at systemet forbedres der, hvor det betyder mest: i praksis.

Den form for læring i den virkelige verden er præcis, hvor smalle systemer kommer til kort. Selvom disse har bragt os langt, blev de aldrig designet til denne form for kompleksitet. Humanoider kræver noget andet - koordination, robusthed og som nævnt evnen til at lære af det uventede.

Det er den enorme mulighed, der ligger foran os. Ikke at automatisere alting, men at bygge maskiner, der kan forstå, navigere i og samarbejde med den menneskelige verden.

Artem Sokolov er grundlæggeren af Humanoid, samt en global investor og iværksætter. Han overtog med succes sin familievirksomhed og vækstede den til en værdi af 1 milliard dollars. Han grundlagde senere Humanoid for at bygge sikre og pålidelige humanoide robotter, der frigør mennesker fra fysisk krævende arbejde. I dag leder han et team på over 130 fagfolk fra nogle af verdens førende teknologivirksomheder og bringer teknisk dybde i verdensklasse til at designe fremtiden for menneske-maskine-samarbejde.