Connect with us

Varför fysisk AI är svårare än vi trodde

Tankeledare

Varför fysisk AI är svårare än vi trodde

mm

Fysisk AI rör sig snabbt från imponerande demonstrationer till ingenjörsverklighet. Om uppmärksamheten tidigare främst fokuserades på dess förmågor, är dagens fråga om skalbarhet alltmer angelägen: vad hindrar dessa system från att bli riktigt utbredda och tillförlitliga?

Fysisk AI och humanoid robotik står nu vid skärningspunkten för tre stora utmaningar – teknisk, kognitiv och investeringsrelaterad. Intelligens som opererar i den fysiska världen ställer fundamentalt olika krav än programvarubaserad AI: här är misstag dyra, och miljön förblir oförutsägbar. Det är därför samtalet skiftar från wow-effekten till konkreta tekniska, marknads- och regulatoriska hinder.

Mekaniker som måste lära sig att tänka

Den första utmaningen är finmotorik. Vi har motorer och servon som kan utföra högt precisa mikrorörelser. Men att replikera mänsklig känslighet, flexibilitet och förmåga att anpassa sig omedelbart när man hanterar små föremål är oerhört svårt. Den mänskliga handen reglerar omedvetet kraft, vinkel, hastighet och bana – allt inom bråkdelen av en sekund, ständigt anpassande sig till även de minsta förändringarna.

Den andra utmaningen är balans och kraftkontroll. En robot måste interagera med föremål av olika former, vikter och texturer: ett äpple, ett glas, en smycke, en metallkomponent, ett blött eller halande föremål. En robot kan besitta betydande fysisk styrka, men den måste kunna beräkna och tillämpa den styrkan korrekt. Detta kräver taktila sensorer, system som tillåter den att “känna” tryck, motstånd och ytkontakt. Likaså viktigt är inte bara att upptäcka kraft, utan att tolka den korrekt inom ramen för en specifik handling. Det blir en fråga om att förstå de fysiska egenskaperna hos föremål – materialegenskaper, elasticitet, friktion och andra parametrar.

En annan allvarlig utmaning är rumslig orientering – den så kallade 6D-representationen. Detta hänvisar inte till en “sexdimensionell värld” i en science fiction-bemärkelse, utan till tre positionskoordinater, höjd, bredd och djup, plus tre orienteringskoordinater: vinklarna av rotation längs varje axel. Till exempel är ett rör eller ett glas ett tredimensionellt föremål. Men för en robot räcker det inte att känna till dess koordinater. Den måste förstå föremålets orientering, dess position i förhållande till gravitationen och hur dess position kommer att förändras när manipulatoren roterar. Om en robot plockar upp ett glas och vill hälla vatten från det, kan den inte bara “luta föremålet”. Den måste beräkna den exakta banan, vinkeln och rotationshastigheten, samtidigt som den tar hänsyn till den flytande inuti, dess tröghet och gravitationskraften. Allt detta kräver sofistikerad rumslig modellering och förutsägelse av handlingens konsekvenser.

Varför marknaden fortfarande är försiktig

När man överväger fysisk AI i sammanhanget med humanoid robotik, är det viktigt att erkänna den fortfarande märkbara nivån av skepticism.

En del av denna skepticism är psykologisk. Den obehagliga dalen-effekten – när något verkar nästan mänskligt men inte riktigt realistiskt nog – skapar obehag och ångest. Onaturliga ansiktsuttryck, något styva eller “brutna” rörelser, mekanisk intonation – allt detta genererar emotionell motstånd. Och teknologier som väcker obehag tenderar att antas långsammare.

Men den största barriären är ekonomisk. Investorer ser att företag har visat imponerande prototyper under årtionden, men skalbara kommersiella modeller förblir begränsade. Teknologisk framsteg är uppenbar, men en hållbar massmarknad har ännu inte helt utvecklats.

Spelare som Boston Dynamics bygger ingenjörsverk, men deras tillämpningar förblir nischade och dyra. Tesla utvecklar sina egna humanoidprojekt. Nya företag som Figure AI lockar betydande investeringar, lovar robotar för tillverkning, logistik och vårdindustrier.

Tillverkning förblir en uppenbar riktning i detta sammanhang. Robotisering, det är ingen fråga om om, utan om hastighet och kostnad för distribution.

Ett ännu tydligare exempel är logistik och lagerhantering. Logistikrobotar är redan bland de mest lönsamma och breda segmenten av robotik idag. Jag minns att, på Keymakr, många logistikföretag närmade sig oss för annoteringstjänster medan de implementerade sådana teknologier, med ambitiösa planer på att skala dem ytterligare. Omfattningen av global e-handel kräver rörelse av enorma volymer av varor i hög hastighet och precision. Människor är fysiskt oförmögna att operera i den takten. Som ett resultat har lagerautomatisering blivit ett “hett” ämne, vilket gett upphov till en hel industri: autonoma plattformar navigerar rutter, sorterar, transporterar och distribuerar last.

Risk blir en del av arkitekturen

En separat diskussionsnivå gäller reglering och cybersäkerhet. En omfattande regulatorisk ram för fysisk AI har ännu inte fullständigt formats. Branschen är fortfarande i sin formativa fas: det finns inga mogna standarder, ingen allmän närvaro i vardagsmiljöer och inga etablerade certifieringsprotokoll. Regleringar kommer oundvikligen att uppstå – men, liksom i andra teknologicykler, kommer de att vara en följd av skalning.

Vad som är viktigare just nu är en annan fråga – förtroende för system som vinner fysisk autonomi. En robot i ett hem, lager eller kritisk infrastrukturanläggning är en nätverksnod utrustad med sensorer, kameror, mikrofoner och kommunikationskanaler. Dess beteende bestäms av programvara och uppdateringar. Och även om en robot initialt är programmerad att utföra endast säkra åtgärder, kvarstår möjligheten till cyberhot. Med otillräckligt skydd kan illvilliga aktörer teoretiskt sett få tillgång till en nätverksnod och försöka använda den för skadliga ändamål.

Scenarier som involverar hacking av autonoma fordon eller robotnätverk är redan i korten. De behandlas som en del av riskbedömning – liknande vad som en gång hände med banksystem, internet och molntjänster.

Men historien visar att teknologisk framsteg sällan stoppas på grund av hot. Istället stärker branschen skyddet genom att etablera standarder, implementera övervakning och bygga flerskiktade säkerhetssystem. Fysisk AI kommer att följa samma väg. Frågan är inte om risker kommer att uppstå, utan hur snabbt säkerhet blir inbäddad i hela ekosystemet.

En industri byggs runt det

Alla utmaningar som nämns, tekniska, marknads- och regulatoriska, delar en viktig egenskap: ingen av dem kan lösas i isolering.

Fysisk AI kan inte ses som en fristående produkt eller ens som en enskild teknologi. Vad vi bevittnar är bildandet av en hel infrastruktur där maskinvara, beräkning, energi, data och material utvecklas i takt. Och det är just här det blir tydligt: detta är uppkomsten av ett nytt industriellt ekosystem.

En robot är autonom och rörlig. Det betyder att den inte kan förlita sig enbart på molnet. Till skillnad från LLM som körs på serverkluster, måste fysisk intelligens fatta beslut lokalt, i realtid. Detta förändrar fundamentalt kraven på chip: de måste vara kraftfulla, energisnåla och optimerade för inferens på edge-enheter.

Detta skapar i sin tur ett brett spektrum av nya utvecklingsområden: energisnåla chip för robotik; kompakta, optimerade AI-modeller för edge-distribution; plattformar för utbildning av sådana modeller; dataannoteringssystem och förberedelse av specialiserade dataset, som vi gör på Introspector, samt framsteg inom batterier och autonoma kraftsystem.

Koncept diskuteras redan för att en robot ska kunna byta ut sina egna batterier: ta bort ett urladdat modul, placera det på laddning och ansluta ett laddat utan att stänga av systemet helt. Detta kan i sig bli en separat marknad.

En omfattande industri formas gradvis runt fysisk AI. Utöver beräkning och energi kommer materialvetenskap att behöva utvecklas: syntetiska beläggningar som imiterar hud, flexibla sensorsytor, säkra och taktilt behagliga material för mänsklig interaktion.

Om en robot opererar bredvid människor, blir dess utseende och fysiska egenskaper en del av användarupplevelse och förtroende för teknologin.

I denna mening är fysisk AI om hela den tekniska stacken, från chip och batterier till sensorer, programvara, material och mänskliga perceptionsaspekter. Det är inom denna komplexitet som den verkliga skalan av den framtida industrin ligger.

Michael Abramov är grundare och VD för Introspector, och bringar över 15+ års erfarenhet av programvaruteknik och datorsyn AI-system till utvecklingen av företagsklassade märkningsverktyg.

Michael började sin karriär som programvarutekniker och R&D-chef, och byggde skalbara datasystem och ledde tvärfunktionella ingenjörsteam. Fram till 2025 har han varit VD för Keymakr, ett företag som erbjuder datamärkningstjänster, där han banade väg för mänskliga-i-loopen-arbetsflöden, avancerade QA-system och skräddarsydda verktyg för att stödja storskaliga datorsyn och autonomidatatabehov.

Han har en B.Sc. i datavetenskap och en bakgrund inom teknik och konstnärliga ämnen, vilket ger honom en tvärvetenskaplig synvinkel på att lösa svåra problem. Michael verkar i skärningspunkten mellan teknisk innovation, strategisk produktledning och verklig påverkan, och driver framåt den nästa fronten för autonoma system och intelligent automation.