Ajatusjohtajat
Uuden robotiikan kilpailun sisällä: Data, mallit ja valmistus

Innovointi harvoin syntyy eristyneisyydessä. Useammin se syntyy insinöörien, perustajien, tutkijoiden ja sijoittajien välisissä keskusteluissa, jotka yrittävät ymmärtää, mihin teknologia on menossa.
Yhden vuoden aikana osallistuin kymmeniin konferensseihin ympäri maailmaa. Liikematkat kestävät toisinaan kuukausia, ja tapaamiset kumppaneiden ja asiakkaiden kanssa tapahtuvat Aasiasta Pohjois-Amerikkaan. Yksi viimeisistä matkoistani Sveitsiin osoittautui erityisen kiinnostavaksi – suurelta osin ihmisten ja siellä tapahtuneiden keskustelujen vuoksi.
Zürich osoittautui yhdeksi paikoista, jossa robotiikan ja Physical AI:n tulevaisuutta käydään aktiivisesti läpi tänään. Ja mitä syvemmin nämä keskustelut etenevät, sitä ilmiselvemmäksi tulee, että oikea kilpailu robotiikassa keskittyy dataan.
Europen Silicon Valley
Zürich on perinteisesti ollut liitetty rahoitussektoriin, mutta viime vuosina se on yhä enenevissä määrin kutsuttu Euroopan Silicon Valleyksi. Suurin osa tästä maineesta liittyy ETH Zürichiin, yhteen Euroopan arvostetuimmista insinööritieteellisistä yliopistoista. Se houkuttelee tutkijoita, tohtorikoulutettavia, yrittäjiä ja insinöörejä ympäri maailmaa. Tämän seurauksena voimakas teknologinen ekosysteemi on muotoutunut yliopiston ympärille, jossa tutkimus, startup-yritykset ja teolliset projektit kehittyvät melkein samanaikaisesti.
Yksi matkani syistä oli saada syvempi ymmärrys siitä, mitä Introspector voi tarjota robotiikkamarkkinoille, joka on kokenut kasvua vuoden 2025 alusta lähtien. Se on ala, johon moni startup-yritys yrittää päästä, kun taas suurten teknologiayritysten teknologiset läpimurrot muokkaavat sitä aktiivisesti. Vaikka kaikessa tässä vauhdissa, ala herättää edelleen enemmän kysymyksiä kuin vastauksia.
Zürich on myös koti Lightly:lle, joka auttoi minua tutustumaan tutkijoihin, jotka työskentelevät robotiikan, tietokoneen näön ja tekoälynnä risteymässä. On yksi tärkeä teknologisen ekosysteemin näkökohta, jonka haluan korostaa: ihmiset täällä ovat poikkeuksellisen avoimia ja ystävällisiä. He eivät pelkää jakaa ideoitaan ja hypoteesejaan, puhua haasteista, joita yrittävät ratkaista, ja kokeista, joita suorittavat. Tämän seurauksena alat ymmärtää markkinoiden todellista kontekstia ja mihin ala on menossa nopeammin.
Ohimennen mainittakoon, kun ihmiset kysyvät minulta, miten eurooppalainen “Silicon Valley” eroaa amerikkalaisesta, vastaus usein yllättää heitä. Zürichissä työn ja elämän tasapaino tuntuu vahvemmalta: urheilu aamulla, keskittyvä työ päivällä rauhallisessa mutta tuottavassa rytmissä, ja iltaa vietetään vuorilla perheen kanssa tai vain rentoutumassa. San Franciscossa on usein sellainen tunne, että on jatkuvasti osoitettava, että työskentelet kovemmin kuin kukaan muu. Zürichissä tahti on erilainen – kestävämpi. Vaikka teknologisen ambition taso ei ole alempi täällä.
Parannettu data ennen parempia roboteja
Yksi matkani tärkeimmistä havainnoista oli melko yksinkertainen: moni haluaa tänään työskennellä robotiikassa. Mutta vaikka alaa kohtaa valtava kiinnostus, monet tiimit ovat edelleen tutkimusvaiheessa, yrittäen ymmärtää, minkä roolin he voivat pelata robotiikan ja Physical AI:n uudessa aallossa, ja mitä panosta he voivat tehdä.
Monet keskustelut lopulta supenevat samaan aiheeseen: data. Tänään ala kärsii datan puutteesta taitavissa tehtävissä, eli hienojen moottoristen taitojen alueella. Tässä alueessa robotien kyvyt ovat edelleen erittäin rajatut. Mitä ihmiset tekevät käsillään melkein automaattisesti – ottaa esineen, kääntää sen, asettaa sen huolellisesti jonnekin tai suorittaa pienen manipulaation – on yksi roboteille haasteellisimmista tehtävistä.
Edistysaskeleiden avain piilee ensisijaisesti suurissa, oikein kerätyissä tietokannoissa. Tänään ihmiset usein puhuvat egosentrisistä tietokannoista, jotka on tallennettu ensimmäisen persoonan näkökulmasta, jossa järjestelmä tallentaa ihmisten toimintaa niin kuin se itse suorittaisi niitä. Käytännössä kuitenkin osoittautuu, että “egosentrisen tietokannan” käsite voi merkitä eri asioita ja herättää useita teknisiä kysymyksiä. Mihin kamera tulisi sijoittaa? Otsaan, rintaan vai silmänkorkeuteen? Mitkä anturit tulisi käyttää videon tallennuksen yhteydessä? Jos tallennamme käden liikkeitä, tulisiko operoijan käyttää erityisiä hanskoja? Ja jos niin, tulisiko näihin hanskiin sisällyttää taktiilisia antureita, gyroskooppeja tai muita liiketunnistimia?
Entistä monimutkaisempi kysymys nousee esiin: miten tallentaa liikkeen syvyyttä oikein. On tärkeää ymmärtää, että ei ainoastaan käden sijainti kahdessa ulottuvuudessa, vaan myös miten se liikkuu kolmiulotteisessa avaruudessa – eteen, taakse, ylös tai alas.
Tähän mennessä ala ei ole saavuttanut yhtenäistä vastausta. Siksi monet tiimit kokeilevat tällä hetkellä eri anturikonfiguraatioita, tallennusmenetelmiä ja tietokantamuotoja.
Monimodaaliset järjestelmät
Hetkeäkään keskustellessa robotiikan datan keräämisestä toinen aihe nousee nopeasti esiin – lisäanturit ja monimodaliteetti, jotka mahdollistavat kehon liikkeiden, käden toimien ja esineiden vuorovaikutusten tallentamisen tarkemmin. Ne myös auttavat vähentämään virheitä datan keräämisen aikana.
Kun henkilö tallentaa toimintansa kameralla, on aina riski, että osa materiaalista on käyttökelvotonta. Kamera voi siirtyä hieman, kuvauskulma voi olla väärä, operoija voi vahingossa kääntyä väärään suuntaan tai suorittaa liikkeen liian nopeasti. Tämän seurauksena merkittävä osa tallennettua materiaalia hylätään. Yksinkertainen esimerkki: saadakseen yhden tunnin todella käyttökelpoista videomateriaalia, operoijan on usein tallennettava noin kaksi tuntia raakamateriaalia.
Lisäanturit auttavat korvaamaan joitakin näistä ongelmista. Vaikka kamera siirtyy hieman, anturidata voi silti mahdollistaa käden tai kehon sijainnin rekonstruoimisen avaruudessa. Tämän seurauksena sijasta kahden tunnin tallennuksesta, saadakseen saman määrän käyttökelpoista dataa, voi riittää noin tunti ja kaksikymmentä minuuttia. Tämä lisää datan keräämisen tehokkuutta ja vähentää tietokantojen luomisen kustannuksia.
Ei ole sattumaa, että monet tiimit huomaavat myös kasvavaa kiinnostusta monimodaaliseen datan annotointiin. Tämä on yksi näkyvimpiä trendeistä, joka liittyy suoraan robotiikan ja kehittyneen tekoälyn kehitykseen.
Seuraava kohta on tällaisen tietokannan annotointi. Olemme kohtaneet samanlaisia kysymyksiä Keymakr:ssa, kun työskentelemme asiakkaiden tietokantojen kanssa robotiikkaan liittyvissä tapauksissa: miltä tällainen annotointi tulisi näyttää käytännössä? Tulisiko se olla luurankomainen? Kaksulotteinen vai kolmiulotteinen? Tulisiko vahvistusoppimisen elementtejä sisällyttää putkiin? On kymmeniä tällaisia kysymyksiä. Insinöörit myöntävät itse, ettei kukaan voi vielä sanoa varmasti, mikä tietokonfiguraatio lopulta johtaa todelliseen teknologiseen läpimurtoon.
Nämä huolenaiheet ovat ymmärrettäviä. Monimutkaisten tietokantojen rakentaminen on kallista prosessia. Jokainen virhe tietorakenteessa voi maksaa tuhansia tai jopa miljoonia dollareita. On mahdollista kerätä “väärä” tietokanta tai tallentaa se olosuhteissa, jotka on vaikea toistaa todellisessa maailmassa, mikä lopulta heikentää koko projektia. Siksi tällä hetkellä yhä enemmän huomiota kiinnitetään sekä malleihin itsessään että datan laatuun ja arkkitehtuuriin, jolle nämä mallit koulutetaan.
Mitä roboteja markkina tarvitsee?
Perinteiset teollisuusrobotit, jotka ovat toimineet autotehtaiden kokoonpanolinjoilla vuosikymmeniä, tarvitsevat itse asiassa hyvin vähän tietokoneen näköä tai monimutkaisia tekoälymallisia. Heidän tehtävänsä on erittäin spesifinen: suorittaa tiukasti toistuvia liikkeitä – vasemmalle, oikealle, ylös, alas – korkealla tarkkuudella ja johdonmukaisuudella. Tässä alueessa he ovat jo ohittaneet ihmiset.
Täysin eri kategoria on humanoidirobotit. Nämä järjestelmät vaativat “aivoja”: kykyä navigoida avaruudessa, havainnoida ympäröivää ympäristöä, ymmärtää tilanteen kontekstia ja hallita manipulaattoreita ei ennalta määrättyjen polkujen kautta, vaan sopeutumalla todelliseen maailmaan.
Vaikka modernilla tehdasalueilla on korkea automaatio, monet tehtävät suoritetaan edelleen ihmisvoimin. Esineen siirtäminen, laatikon nostaminen, osien lajittelu, komponentin kiinnittäminen tai materiaalien järjestäminen – nämä ovat pieniä toimia, jotka vaativat joustavuutta ja koordinaatiota. Tämä ala on yhä yksi vaikeimmista automatisoida, ja juuri tässä humanoidijärjestelmät voivat löytää roolinsa.
Monet tiimeistä, joilla keskustin, käyttävät samanlaista liiketoimintamallia. He lähestyvät tehdasta ja ehdottavat ratkaisun tietyn tuotantotapauksen ratkaisemiseksi. Esimerkiksi työntekijä voi viettää koko päivän siirtäen laatikoita varastojen välillä. Insinöörit ehdottavat yksinkertaista kokeilua: varustaa työntekijä kameralla ja anturien joukolla, tallentaa tuhansia tunteja heidän toimiaan ja käyttää tätä dataa kouluttaakseen mallin, joka ohjaa humanoidirobottia. Tällä tavoin robotti oppii suorittamaan juuri ne tehtävät, joita ihmis työntekijä suorittaa.
Itse asiassa yritys ostaa humanoidialustan, kun taas kehitystiimi rakentaa mukautuvan mallin, joka replikoi tietyn operoijan käyttäytymisen. Tämä ei ole yleinen äly, joka pystyy ratkaisemaan mitä tahansa tehtävää. Sen sijaan se on tiettyjen taitojen joukko, joka on koulutettu tiettyyn skenaarioon tai tuotantotehtävien ryhmään. Monille insinööreille tämä lähestymistapa näyttää paljon realistisemmalta. Sen sijaan, että yritettäisiin luoda universaali robotti välittömästi, tiimit keskittyvät kapeisiin mutta taloudellisesti kannattaviin automaatiotilanteisiin.
Liiketoiminnan ulottuvuus
Jos tulevaisuus piilee mukautuvissa malleissa, on tärkeää ymmärtää, että taloudellisesta näkökulmasta tämä on melko pitkä kehitystie.
Jokainen teollisuus on itse asiassa oma maailmansa. Jokaisella tuotantoympäristöllä on omat prosessinsa, työnkulunsa ja poikkeuksensa. Robotti, joka on koulutettu toimimaan autotehtaalla, ei voi yksinkertaisesti siirtää elintarvikkeiden valmistukseen tai varastologistiikkaan. Jokaisessa tapauksessa järjestelmän on opittava uudelleen alusta lähtien.
Tämä johtaa seuraavaan loogiseen kysymykseen: kuka on tällaisen teknologian ensimmäisiä asiakkaita?
Tässä vaiheessa ensisijaiset käyttäjät ovat todennäköisesti suuret yritykset – ne, joilla on budjetit ja joille automaatio voi tuottaa merkittävän taloudellisen vaikutuksen. Tänään humanoidirobotti maksaa noin 60 000 – 90 000 dollaria pelkästään laitteiston osalta. Tämä on vain peruskonfiguraatio. Siihen lisätään ylläpitokustannukset, akut, latausasemat, infrastruktuuri ja ohjelmisto.
Tämän seurauksena yritykset, jotka voivat kokeilla tällaisia järjestelmiä, ovat suuret organisaatiot, autonvalmistajat, elintarvikekonsernit ja suuret teolliset yritykset.
Tietysti myös pienemmät sektorit voivat nähdä joitakin varhaisia käyttäjiä. Joitakin yrityksiä voi ostaa yhden tai kaksi robottia tiettyihin tehtäviin. Useimmissa tapauksissa nämä yritykset eivät kuitenkaan ole valmiita sijoittamaan satoja tuhansia euroja mukautettujen tietokantojen keräämiseen ja annotointiin, joita tarvitaan järjestelmien kouluttamiseen erittäin spesifejä toimintaskenaarioita varten. Heille ihmistyö on edelleen halvempi vaihtoehto.
Robotiikan innovaation pitkä peli
Päädyimme lopulta perustavaan taloudelliseen kysymykseen: mikä on tehokkaampaa – ihminen vai robotti? Jos tarkastelemme tänään olevaa taloutta, vastaus on ilmeinen: ihmistyö on halvempi, sopeutuu nopeammin uusiin olosuhteisiin eikä vaadi monimutkaisia infrastruktuureja.
Miksi ala sitten jatkaa sijoittamista robotiikkaan tänään? Vastaus on suurelta osin strateginen.
Monet yritykset ymmärtävät, että tietynlainen teknologinen johtajuuskilpailu on käynnissä. He kehittävät ratkaisuja jo nyt, huolimatta korkeista kustannuksista, ollakseen eturintamassa, kun robotiikan taloustilanne muuttuu.
Kun elektroniikka kehittyy, komponenttien kustannukset laskevat ja laskentatehokkuus paranee, robotiikka tulee väättämättä olemaan edullisempaa. Ja kun tämä tapahtuu, etu kuuluu yrityksille, jotka ovat jo kehittäneet mallit, keränneet dataa ja luoneet tarvittavan teknologisen infrastruktuurin.
Kuvitellaan esimerkiksi, että uudet säännökset sallivat humanoidirobotien laajan käytön valmistuksessa. Tai että hallitukset alkavat tukea teollisuuden robotiikkaa. Tällaisessa skenaariossa markkina voi kasvaa dramaattisesti vain muutamassa vuodessa. Ja ne, jotka valmistautuivat etukäteen, ne, joilla on olemassa olevia malleja, tutkimusta, tietokantoja ja valmiita teknologisia pinnoitoksia, ovat ne, jotka hyötyvät eniten.
Siksi kehitystyö jatkuu edelleen, vaikka liiketoiminnan taloustilanne ei välttämättä näytä vielä ihanteelliselta. Monille yrityksille se on sijoitus tulevaisuuteen – siihen hetkeen, jolloin teknologiat tulevat helpommaksi ja kysyntä kasvaa terävästi.
Ja tässä kilpailussa, kuten monissa teknologisissa vallankumouksissa, yksi tekijä usein osoittautuu ratkaisevaksi: kuka aloitti aikaisemmin. Tässä mielessä nykyinen robotiikka muistuttaa paljon varhaisia vaiheita tekoälyssä. Silloin oli myös enemmän kysymyksiä kuin vastauksia. Mutta se, mitä tiimit aloittivat aikaisemmin datan ja infrastruktuurin kanssa, lopulta määritteli koko alan suunnan.












