Robotik

Den humanoid-æra kommer ikke — Den er allerede her

Published July 30, 2025

Updated April 26, 2026

Artem Sokolov, Founder of Humanoid

Tidligere denne måned i Kina, trådte en humanoid robot ved navn Shuang Shuang op på scenen ved en high school-afslutningsceremoni i Fujian for at modtage en diplome — hånd i hånd og fornøjede studerende og lærere. Øjeblikke som disse repræsenterer en meningsfuld skift, en hvor humanoid-robotter begynder at træde ind i offentligt liv på meget synlige måder.

Disse øjeblikke markerer mere end offentlig nysgerrighed — de signalerer en skift mod reel integration. Denne artikel udforsker, hvordan humanoids bevæger sig fra show og skue til funktionalitet — og hvorfor det, der synes at være en hardware-præstation alene, i virkeligheden handler om den integrerede intelligens, der gør det muligt for disse maskiner at gå, interagere og lære i miljøer, der ikke er skrevet for automation. Vi vil også diskutere, hvordan vi tilgår kommerciel gennem tidlig udvikling og langsigtede partnerskaber.

Hvor humanoids skyder AI ind i den virkelige verden

Gapet mellem virtuel præstation og fysisk pålidelighed er en af de mest oversete udfordringer i AI. En chatbot kan generere paragrafer af flydende tekst uden nogensinde at skulle handle på dem — på samme måde som et vision-model kan identificere et skridt i et billede uden at skulle fysisk navigere det eller risikere at falde. Humanoids har ikke den luksus.

For at fungere i den virkelige verden, må AI forlade statiske datasæt og kontrollerede betingelser. Det må se, beslutte og handle i miljøer, der skifter sekund for sekund. Det inkluderer ujævne gulve, forkert placerede objekter, uforudsigelige menneskelig adfærd og kontekstafhængige non-verbale signaler. Resultatet er en daglig konfrontation med støj, tvetydighed og potentiel fejl.

Det er her, hvor inkorporeret resonnering — hvor sprog er grundlagt i rum, tid og konsekvens — begynder at være mere vigtig end token-prædiction. For eksempel, hvis et menneske siger “pas på, det er glat”, skal robotten kunne forbinde den frase ikke kun til en orddefinition, men til rumlig bevidsthed, potentiel risiko og realtidsjusteringer.

På samme tid bliver multimodal læring essentiel, fordi ingen enkelt inputkanal er pålidelig nok til at fungere alene. En kamera kan misse en glat overflade, men tryksensorer i foden kan registrere et pludseligt tab af trækkraft. Eller i en anden situation, kan talegenkendelse fejle i et støjende lager, men visuelle signaler eller gestus kan udfylde hullet.

Generalisering bliver også kritisk. En robot kan ikke regne med at se det samme miljø to gange. Den skal tilpasse sit adfærd, når gulvet er vådt, belysningen ændrer sig, eller kassen ikke er, hvor den var i går. Det bliver forskellen mellem succesfuld udførelse og fejl.

Ved Humanoid, er det derfor, vi starter med at teste tidligt med kommercielle partnere. Vi integrerer vores robotter i live-miljøer for at opdage potentielle fejl og sikre optimal funktionalitet før udrulning. En robot, der fungerer godt i simulation eller demo, er ikke det samme som en, der opnår tillid under pres, fordi den tillid er bygget på reel læring.

Vi ved, at humanoids vil være tilgængelige kommercielt inden for de næste to år — men vi venter ikke. For os begynder kommerciel udvikling tidligt. Det betyder at bygge langsigtede partnerskaber omkring reelle brugstilfælde. Gennem en række pilotprogrammer lærer vi ikke kun vores partnere om teknologien — vi lærer også sammen med dem. Denne fælles læringsproces hjælper os også med at forfine omkostningsstrukturer og funktionspålidelighed fra dag én — sikrer den bedst mulige samlede ejeromkostning (TCO), når systemerne skalerer.

Hvorfor humanoids er den ultimative testbane for generel intelligens

Verden, vi har skabt over de sidste hundred år, er tilpasset menneskestørrelse. Dørhåndtag, gaffeltruck, lager — alt antager visse dimensioner, bevægelser og implicit sociale adfærder. Humanoids må tilpasse sig den virkelighed eller risikere at være ekstremt begrænsede i deres funktionalitet.

For at gå op ad trapper, bære et objekt, fortolke en pegegestus eller genkende tøven i en stemme, skal en robot forstå kontekst langt ud over visuel klassificering eller skrevet bevægelsesplanlægning. Den skal slutte sig til hensigt, lære en ny opgave ved at se på et menneske, tilpasse den færdighed til en lidt anderledes layout og forbedre sin præstation over tid. I praksis udvider dette system, hvad AI kan gøre under reelle begrænsninger.

Ved Humanoid, accelererer vi denne proces gennem teleoperation. I de tidlige udviklingsfaser vejleder menneskelige operatører robotten gennem nøgleopgaver. Denne hånd-til-hånd-data bliver grundlaget for træning af nye adfærder. Over tid føder disse demonstrationer ind i vores end-to-end-modeller, hvilket hjælper os med at bygge mod pålidelig autonomi.

Fra snævre systemer til integreret intelligens

De fleste AI-systemer i dag excellerer i snævre opgaver. I isolation fungerer hver af dem godt. Men humanoids har ikke brug for separate specialister. For at integrere med succes, har vi brug for systemer, der kan resonere på tværs af modaliteter og tidsrammer.

En humanoid kan modtage en relativt vag instruks — “Gå og hent den gule kasse fra lageret på den anden side af gangen” — og skal dekodere det til en sekvens af underopgaver: lokaliserer taleren, navigerer en korridor, identificerer den rigtige kasse, justerer grebsstyrke, undgår kollisioner og selvfølgelig returnerer sikkert.

Hver del af den sekvens involverer et andet subsystem — vision, locomotion, sprog, manipulation og feedback. Og pålideligheden af hele systemet afhænger af, hvor godt disse dele kommunikerer under skiftende betingelser.

Modulær arkitektur er en måde at møde denne udfordring på. Dette giver os mulighed for at iterere på subsystemer uafhængigt, mens vi stadig opnår systemomfattende koordination. Desuden giver det os mulighed for at skalerer funktioner på tværs af multiple miljøer uden at skulle genopbygge fra bunden. Det er, hvordan vi bevæger os fra lukkede demoer til åben-verden-præstation.

Indsatsen er massiv — og den er global

Det er let at ramme humanoids som fremtidsorienterede. Men når vi taler med vores kunder, er behovet øjeblikkeligt. Mange lager, samlebånd og andre tidligere travle arbejdssteder kæmper nu for at holde personalet.

Disse arbejdskraftmæssige mangler er demografiske problemer. I Japan er næsten 30% af befolkningen over 65. I Europa er nøglesektorer — der har en kombineret løn på 1,7 billioner dollar — kæmper for at rekruttere yngre arbejdere. Disse er ikke de slags roller, de fleste mennesker ønsker, og stadig mindre, de slags roller, folk er villige til at udføre.

Ved at komme ind som hjælpende hænder, ikke som erstatninger, kan humanoids overtage fysisk krævende, gentagne eller farlige opgaver — flytte lager, laste paller, operere maskiner — uden risiko for træthed eller skade. Dette frigør menneskelige arbejdere til at fokusere på mere komplekse, kreative eller interpersonlige aspekter af jobbet.

Desuden skaber dette langsigtede økonomisk robusthed. Når arbejdskraft er volatil eller utilgængelig, kan intelligente maskiner hjælpe med at sikre kontinuitet — alt uden at ofre sikkerhed, kvalitet eller tilpasning.

En anden aspekt at fremhæve er den regulerende ramme. De fleste hold — især i løst regulerede jurisdiktioner — venter, til de skal tænke på det. Vi startede der. Europas sikkerheds- og datalove er nogle af de strengeste i verden, men i stedet for at behandle dem som hindringer, betragter vi dem som vores konkurrencemæssige fordel. Når andre markeder adopterer strengere reguleringslove, vil vi være klar til at møde dem, mens andre virksomheder måtte kæmpe for at følge med.

En ny AI-kapgang — men ikke den, du tror

Meget af diskursen omkring AI i dag handler om beregningskraft, parametre og træningsdata. Men den virkelige gennembrud kan komme fra en anden front: integration i den fysiske verden. Det er, hvor intelligens må lære at fungere, i stedet for blot at forudsige.

På den måde handler kapgangen om det mest kapable system — et, der kan fungere i offentlige rum, under sikkerhedsbegrænsninger og med mennesker i løkken. Det system, ud over at lære fra data, vil også — og især — lære fra virkeligheden og arbejde sammen med mennesker uden at forstyrre flowet.

Det er derfor, vi ikke venter, til udrulning begynder. Fra starten arbejder vi direkte med kommercielle partnere for at integrere i reelle miljøer — sikrer, at systemet forbedres, hvor det betyder mest: i praksis.

Den slags reel læring er netop, hvor snævre systemer falder kort. Mens disse har ført os langt, var de aldrig designet til denne kompleksitet. Humanoids kræver noget andet — koordination, robusthed og, som nævnt, evnen til at lære fra det uventede.

Det er den massive mulighed foran os. Ikke for at automatisere alt, men for at bygge maskiner, der kan forstå, navigere og samarbejde med den menneskelige verden.

Unite.AI