Tankeledere
Indenfor den nye robotteknologiske kapløb: Data, modeller og fremstilling

Innovation opstår sjældent i isolation. Mere ofte er det født i samtaler mellem ingeniører, grundlæggere, forskere og investorer, der forsøger at forstå, hvor teknologien er på vej.
Over en periode på et år deltog jeg i dusinvis af konferencer rundt om i verden. Forretningsrejser kan nogle gange vare i månedsvis, og møder med partnere og kunder finder sted fra Asien til Nordamerika. Men en af mine seneste rejser til Schweiz viste sig at være særligt interessant – primært på grund af menneskene og samtalerne, der fandt sted der.
Zürich viste sig at være et af stederne, hvor fremtiden for robotteknologi og Physical AI aktivt diskuteres i dag. Og jo dybere disse samtaler går, jo mere åbenlyst bliver det, at det virkelige kapløb i robotteknologi udvikler sig omkring data.
Europas Silicon Valley
Zürich har traditionelt været associeret med den finansielle sektor, men i de seneste år er det mere og mere blevet kaldt Europas Silicon Valley. Meget af denne rygte er knyttet til ETH Zürich, et af de mest respekterede ingeniør-universiteter i Europa. Det tiltrækker forskere, ph.d.-studerende, iværksættere og ingeniører fra hele verden. Som resultat heraf er der dannet et kraftfuldt teknologisk økosystem omkring universitetet, hvor forskning, startups og industrielle projekter udvikler sig næsten samtidig.
En af grundene til min rejse var at få en dybere forståelse for, hvad Introspector kan tilbyde robotmarkedet, som har været i rivende udvikling siden begyndelsen af 2025. Det er en branche, som en lang række startups forsøger at komme ind i, mens teknologiske gennembrud fra store tech-virksomheder aktivt omformer den. Men på trods af al denne fremdrift, rejser feltet stadig mere spørgsmål, end det giver svar.
Zürich er også hjemsted for vores partnere Lightly, som hjalp mig med at introducere mig for ligemænd, der arbejder ved skæringen af robotteknologi, computer vision og AI. Der er én vigtig aspekt af det lokale teknologiske økosystem, som jeg gerne vil fremhæve: Menneskene her er bemærkelsesværdigt åbne og imødekommende. De er ikke bange for at dele deres idéer og hypoteser, at tale om de udfordringer, de forsøger at løse, og de eksperimenter, de kører. Som resultat heraf begynder du at forstå markedets virkelige kontekst og hvor industrien er på vej meget hurtigere.
For øvrigt, når folk spørger mig, hvordan det europæiske “Silicon Valley” adskiller sig fra det amerikanske, overrasker svaret ofte dem. I Zürich føles balancen mellem arbejde og liv meget stærkere: sport om morgenen, fokuseret arbejde under dagen i en rolig, men produktiv rytme, og aftenen tilbragt i bjergene med familien eller blot afslappende. I San Francisco er der ofte en følelse af, at du konstant skal bevise, at du arbejder hårdere end alle andre. I Zürich er tempoen anderledes – mere bæredygtig. Men niveauet af teknologisk ambition her er ikke lavere.
Bedre data før bedre robotter
En af de vigtigste takeaway fra denne rejse var en ret enkel observation: mange mennesker i dag ønsker at arbejde med robotteknologi. Men på trods af den enorme interesse for branchen, er mange hold stadig i en eksplorerende fase, hvor de forsøger at forstå, hvilken rol de kan spille i den nye bølge af robotteknologi og Physical AI, og hvilken bidrag de kan yde.
Mange samtaler ender til sidst med at konvergere om det samme emne: data. I dag mangler industrien data om finmotoriske opgaver, dvs. fine motorfærdigheder. På dette område er robotternes evner stadig ekstremt begrænsede. Det, som mennesker gør med deres hænder næsten automatisk – at samle et objekt op, vende det, placere det omhyggeligt et sted eller udføre en lille manipulation – er stadig en af de mest udfordrende opgaver for robotter.
Nøglen til fremgang her ligger primært i store, ordentligt indsamlede datasets. I dag taler folk ofte om egocentriske datasets, optaget fra en førstepersonsperspektiv, hvor systemet fanger menneskelige handlinger, som om det selv udførte dem. Men i praksis viser det sig, at selv konceptet om en “egocentrisk dataset” kan betyde meget forskellige ting og rejser en række tekniske spørgsmål. Hvor skal kameraet placeres? På panden, på brystet eller måske på øjenhøjde? Hvilke sensorer skal ledsage videooptagelsen? Hvis vi fanger håndbevægelser, skal operatørerne bruge specielle handsker? Og hvis det er tilfældet, skal handskerne så indeholde taktilsensorer, gyroskoper eller andre bevægelsessporingssystemer?
Et endnu mere komplekst spørgsmål opstår: hvordan man korrekt fanger dybden af bevægelse. Det er nemlig vigtigt at forstå ikke kun positionen af en hånd i en todimensionel plane, men også, hvordan den bevæger sig gennem tre dimensioner – frem, tilbage, op eller ned.
Indtil nu har industrien ikke nået en ensartet svar. Derfor eksperimenterer mange hold i dag med forskellige sensorskonfigurationer, optagningsmetoder og datasetformater.
Flervalente systemer
Så snart samtalen drejer sig om dataindsamling til robotteknologi, opstår et andet emne hurtigt – yderligere sensorer og flervalens, som muliggør optagelse af kropsbevægelser, håndhandling og objekinteraktioner med større præcision. De hjælper også med at reducere fejl under dataset-indsamlingen.
Når en person optager deres handlinger på kamera, er der altid en risiko for, at en del af materialet er ubrugeligt. Kameraet kan skifte lidt, optagningsvinklen kan være forkert, operatøren kan utilsigtet vende den forkerte vej, eller operatøren kan udføre en bevægelse for hurtigt. Som resultat af dette bliver en betydelig del af det optagede materiale smidt væk. Et enkelt eksempel: for at opnå en time rigtig brugbar video, skal en operatør ofte optage omkring to timer af råmateriale.
Yderligere sensorer hjælper med at kompensere for nogle af disse problemer. Selv hvis kameraet skifter lidt, kan sensordata stadig gøre det muligt at rekonstruere håndbevægelsen eller kroppens position i rummet. Som resultat af dette kan det i stedet for to timers optagning tage omkring en time og tyve minutter at opnå samme mængde brugbar data. Dette øger betydeligt effektiviteten af dataset-indsamlingen og reducerer omkostningerne ved at oprette dem.
Det er derfor ikke tilfældigt, at mange hold også lægger mærke til en stigende interesse for flervalent data-annotation. Dette er blevet en af de mere synlige trends direkte forbundet med udviklingen af robotteknologi og inkarneret AI.
Næste punkt er mærkning af sådanne datasets. Vi har stødt på lignende spørgsmål hos Keymakr, når vi arbejder med kunde-datasets for robot-sager: hvordan skal sådan en mærkning se ud i praksis? Skal den være skeletagtig? To- eller tredimensionel? Skal elementer af forstærket læring inkorporeres i pipeline? Der er dusinvis af sådanne spørgsmål. Ingeniørerne selv indrømmer, at ingen endnu kan sige med sikkerhed, hvilken bestemt datakonfiguration, der vil føre til et rigtigt teknologisk gennembrud.
Disse bekymringer er forståelige. Opbygning af komplekse datasets er en dyrekøbt proces. Hver fejl i datastrukturen kan koste tusinder eller endda millioner af dollars. Det er muligt at indsamle den “forkerte” dataset eller optage den under betingelser, der er svære at genskabe i den virkelige verden, og som kan undergrave hele projektet. Det er præcis derfor, at der i dag lægges mere og mere opmærksomhed på både modellerne selv og kvaliteten og arkitekturen af data, som disse modeller trænes på.
Hvilke slags robotter har markedet brug for?
Klassiske industrirobotter, som har været i drift på bilfabrikker i årtier, kræver faktisk meget lidt computer vision eller komplekse AI-modeller. Deres opgave er ekstremt specifik: at udføre strengt repetitive bevægelser – venstre, højre, op, ned – med høj præcision og konsistens. På dette område har de længe overgået mennesker.
En helt anden kategori er humanoid robotter. Disse systemer kræver “hjerner”: evnen til at navigere i rummet, percipere den omgivende miljø, forstå konteksten af en situation og kontrollere manipulatorer ikke gennem forudprogrammerede baner, men ved at tilpasse sig den virkelige verden.
Selv med det høje niveau af automation på moderne fabriksgulve udføres mange opgaver stadig af mennesker. At flytte et objekt, samle en kasse op, sortere dele, fastgøre en komponent eller organisere materialer – disse er små handlinger, der kræver fleksibilitet og koordination. Dette område er stadig et af de sværeste at automatisere, og det er netop her, humanoid systemer kan finde deres rolle.
Mange af holdene, jeg talte med, bruger en lignende forretningsmodel. De nærmer sig en fabrik og foreslår at løse et bestemt produktionscase. For eksempel kan en arbejder bruge hele dagen på at flytte kasser mellem lagerzoner. Ingeniørerne foreslår et relativt enkelt eksperiment: udstyre arbejderen med en kamera og en sæt sensorer, optage tusinder af timers handlinger og bruge denne data til at træne en model, der kan styre en humanoid robot. På denne måde lærer robotten at udføre præcis de opgaver, der udføres af den menneskelige arbejder.
I virkeligheden køber virksomheden en humanoid platform, mens udviklingsteamet bygger en brugerdefineret model, der replikerer adfærd hos en bestemt operatør. Dette er ikke en universel intelligens, der kan løse enhver opgave. Det er snarere en samling af færdigheder trænet til en bestemt scenario eller en gruppe produktionsopgaver. For mange ingeniører i dag synes denne tilgang at være langt mere realistisk. I stedet for at forsøge at skabe en universel robot med det samme, fokuserer holdene på snævre, men økonomisk bæredygtige automatiserings-scenarier.
Den forretningsmæssige dimension
Hvis fremtiden ligger i brugerdefinerede modeller, er det vigtigt at forstå, at dette fra en økonomisk synsvinkel er en ret lang udviklingsvej.
Hver industri er i virkeligheden sin egen verden. Hver produktionsmiljø har sine egne processer, arbejdsgange og undtagelser. En robot trænet til at fungere i en bilfabrik kan ikke bare overføres til fødevarefremstilling eller lagerlogistik. I hvert tilfælde skal systemet gen-trænes fra scratch.
Dette fører til det næste logiske spørgsmål: hvem vil være de første kunder af sådan teknologi?
På dette stadium er de primære adoptere sandsynligvis store virksomheder – dem, der har budgetterne og for hvem automation kan generere en meningsfuld økonomisk effekt. I dag koster en humanoid robot omkring 60.000-90.000 dollars kun for hardwaren. Dette er kun grundkonfigurationen. Derudover kommer vedligeholdelsesomkostninger, batterier, opladningsstationer, infrastruktur og software.
Som resultat af dette er de virksomheder, der er bedst i stand til at eksperimentere med sådanne systemer, store organisationer, bilproducenter, fødevarekoncerner og store industrielle virksomheder.
Selvfølgelig kan også mindre sektorer se nogle tidlige adoptere. Nogle virksomheder kan købe en eller to robotter til bestemte opgaver. Men i de fleste tilfælde er disse virksomheder simpelthen ikke klar til at investere hundredtusinder af euros i at indsamle og annotere de brugerdefinerede datasets, der kræves for at træne systemer til højt specifikke operationelle scenarier. For dem er menneskeligt arbejdskraft stadig den billigste mulighed.
Det lange spil om robotteknologisk innovation
Vi ender til sidst med en grundlæggende økonomisk spørgsmål: hvad er mere effektivt – et menneske eller en robot? Hvis vi ser på dagens økonomi, er svaret åbenlyst: menneskeligt arbejde er billigere, tilpasser sig hurtigere til nye forhold og kræver ikke kompleks infrastruktur.
Så hvorfor fortsætter industrien med at investere i robotteknologi i dag? Svaret er primært strategisk.
Mange virksomheder forstår, at en slags kapløb om teknologisk lederskab er i gang. De udvikler allerede løsninger, på trods af de høje omkostninger, for at være foran, når økonomien omkring robotteknologi skifter.
Så snart elektronikken udvikler sig, komponentomkostningerne falder, og beregnings-effektiviteten forbedres, vil robotteknologi sandsynligvis blive mere billig. Og når det sker, vil fordelene tilhøre de virksomheder, der allerede har bygget modeller, akkumuleret data og etableret den nødvendige teknologiske infrastruktur.
Forestil dig for eksempel, at nye regler opstår, der tillader en storstilet brug af humanoid robotter i fremstilling. Eller at regeringer begynder at subsidere robotisering af industrier. I sådant et scenario kunne markedet vokse dramatisk inden for blot få år. Og de, der forberedte sig i forvejen, de med eksisterende modeller, forskning, datasets og en klar teknologisk stack, vil være dem, der nyder mest.
Derfor fortsætter udviklingen, selv nu, hvor forretningsøkonomien måske ikke ser ideel ud. For mange virksomheder er det en investering i fremtiden – i det øjeblik, hvor teknologier bliver mere tilgængelige, og efterspørgslen stiger skarpt.
Og i dette kapløb, som i mange teknologiske revolutioner, viser det sig ofte, at én faktor er afgørende: hvem startede først. På denne måde ligner robotteknologien i dag de tidlige faser af kunstig intelligens. Dengang var der også mere spørgsmål end svar. Men det var holdene, der begyndte at arbejde med data og infrastruktur før andre, der til sidst formede retningen for hele industrien.












