Ajatusjohtajat

Uuden robotiikkarallin sisÀpiirissÀ: Data, mallit ja valmistus

mm

Uudet innovaatiot syntyvät harvoin eristyneisyydessä. Useammin ne syntyvät insinöörien, perustajien, tutkijoiden ja sijoittajien välisissä keskusteluissa, joissa yritetään ymmärtää, mihin teknologia on menossa.

Olen viime vuoden aikana osallistunut kymmeniin konferensseihin ympäri maailmaa. Liikematkat kestävät usein kuukausia, ja tapaamiset kumppaneiden ja asiakkaiden kanssa järjestetään Aasiasta Pohjois-Amerikkaan. Yksi viimeisistä matkoistani Sveitsiin osoittautui kuitenkin erityisen kiinnostavaksi – suurelta osin juuri siellä tapahtuneiden keskustelujen ansiosta.

Zurich on osoittautunut yhdeksi paikoista, joissa robotiikan ja Physical AI:n tulevaisuutta käydään aktiivisesti läpi. Mitä syvemmin nämä keskustelut etenevät, sitä ilmeisemmäksi tulee, että robotiikan todellinen kilpailu on käynnissä datan ympärillä.

Europen piilopääkaupunki

Zurich on perinteisesti ollut rahoitussektorin keskus, mutta viime vuosina siitä on tullut yhä enemmän “Euroopan Piilaakso”. Suurin osa tästä maineesta liittyy ETH Zürich -yliopistoon, joka on yksi Euroopan arvostetuimmista insinööritieteellisistä yliopistoista. Se houkuttelee tutkijoita, tohtorikoulutettavia, yrittäjiä ja insinöörejä ympäri maailmaa. Tämän seurauksena yliopiston ympärille on muodostunut voimakas teknologinen ekosysteemi, jossa tutkimus, startup-yritykset ja teolliset projektit kehittyvät lähes samanaikaisesti.

Yksi matkani syistä oli saada syvempi ymmärrys siitä, mitä Introspector voi tarjota robotiikkamarkkinoille, joka on kasvanut voimakkaasti vuoden 2025 alusta lähtien. Tämä on ala, johon moni startup-yritys yrittää päästä, ja suurten teknologiayritysten teknologiset läpimurrot muokkaavat sitä jatkuvasti. Vaikka kaikessa tässä vauhdissa, ala herättää edelleen enemmän kysymyksiä kuin vastauksia.

Zurich on myös Lightly:n koti, joka auttoi minua tutustumaan alan ammattilaisiin, jotka työskentelevät robotiikan, tietokoneavusteisen näön ja tekoälyn risteymässä. On yksi tärkeä asia, jonka haluan korostaa paikallisen teknologia-ekosysteemin suhteen: ihmiset ovat täällä poikkeuksellisen avoimia ja ystävällisiä. He eivät pelkää jakaa ideoitaan ja hypoteesejaan, keskustella haasteista, joita yrittävät ratkaista, ja kokeista, joita suorittavat. Tämän seurauksena ymmärrät markkinoiden todellisen kontekstin ja sen, mihin ala on menossa, paljon nopeammin.

Matkani aikana, kun ihmiset kysyvät minulta, miten Euroopan “Piilaakso” eroaa amerikkalaisesta, vastaus usein yllättää heidät. Zurichissa työn ja elämän tasapaino tuntuu vahvemmalta: aamuisin urheilua, päivällä keskittyvää työtä rauhallisessa mutta tuottavassa tahdissa, ja iltaisin vuorilla perheen kanssa tai vain rentoutumassa. San Franciscossa on usein tunne, että on osoitettava, että työskentelet kovemmin kuin kukaan muu. Zurichissa tahti on erilainen – kestävämpi. Vaikka teknologisen vision taso ei ole alempi täällä, on ilmapiiri rennompi.

Parannettu data ennen parempia roboteja

Yksi matkani tärkeimmistä havainnoista oli melko yksinkertainen: moni haluaa tällä hetkellä työskennellä robotiikan parissa. Vaikka alaa kohtaa valtava kiinnostus, monet tiimit ovat edelleen tutkimusvaiheessa, yrittäen ymmärtää, minkälainen rooli heillä on uudessa robotiikan ja Physical AI:n aallossa, ja mitä he voivat panostaa.

Monet keskustelut lopulta supenevat yhteen aiheeseen: data. Tänään ala kärsii datan puutteesta hienomotoristen tehtävien suhteen, eli tarkkojen liikkeiden suorittamisen suhteen. Tässä alueessa robotien kyvyt ovat edelleen erittäin rajatut. Mitä ihmiset tekevät käsillään lähes automaattisesti – esineen nostaminen, kääntäminen, varovainen asettaminen jonnekin tai pienen manipuloinnin suorittaminen – on yksi robotiikan haasteellisimmista tehtävistä.

Edistysaskeleiden avain piilee ensisijaisesti suurissa, oikein kerätyissä tietokannoissa. Tänään ihmiset usein puhuvat egosentrisistä tietokannoista, jotka on tallennettu ensimmäisen persoonan näkökulmasta, jossa järjestelmä tallentaa ihmisen toimintaa kuin se itse suorittaisi niitä. Käytännössä kuitenkin ilmenee, että “egosentrisen tietokannan” käsite voi tarkoittaa monia eri asioita ja herättää useita teknisiä kysymyksiä. Mihin kamera tulisi sijoittaa? Otsaan, rintaan vai silmien tasolle? Mitkä anturit tulisi käyttää videon tallennuksen kanssa? Jos tallennamme käden liikkeitä, tulisiko operaattorien käyttää erityisiä hanskoja? Ja jos käytetään hanskoja, tulisiko niihin sisällyttää taktiilisia antureita, gyroskooppeja tai muita liiketunnistimia?

Todellinen haaste on, miten syvyyden liikkeen tulisi oikein tallentaa. On tärkeää ymmärtää, että käsien liikkeen sijainti ei ole ainoastaan kaksiulotteisessa tasossa, vaan myös siinä, miten ne liikkuvat kolmiulotteisessa avaruudessa – eteen, taakse, ylös tai alas.

Tähän asti ala ei ole saavuttanut yhtenäistä vastausta. Siksi monet tiimit kokeilevat eri anturien konfiguraatioita, tallennusmenetelmiä ja tietokantamuotoja.

Multimodaaliset järjestelmät

Saatuaan datan keräämisen robotiikkaan, toinen aihe nopeasti nousee esiin – lisäanturit ja multimodaalisuus, jotka mahdollistavat kehon liikkeiden, käden toimien ja esineiden vuorovaikutusten tallentamisen tarkemmin. Ne myös auttavat vähentämään virheitä tietokannan keräämisen aikana.

Kun henkilö tallentaa toimintansa kameran avulla, on aina riski, että osa materiaalista on käyttökelvotonta. Kamera voi siirtyä hieman, kuvauskulma voi olla väärä, operaattori voi vahingossa kääntyä väärään suuntaan tai suorittaa liikkeen liian nopeasti. Tämän seurauksena merkittävä osa tallennetusta materiaalista hylätään. Yksinkertainen esimerkki: saadakseen yhden tunnin todella käyttökelpoista videomateriaalia, operaattorin on usein tallennettava noin kaksi tuntia raakamateriaalia.

Lisäanturit auttavat korvaamaan joitakin näistä ongelmista. Vaikka kamera siirtyy hieman, anturidata voi silti mahdollistaa kätten tai kehon liikkeen jäljentämisen avaruudessa. Tämän seurauksena saadaan sama määrä käyttökelpoista dataa noin 1 tunnin ja 20 minuutin tallennusajalla, mikä merkitsee tallennuksen kustannusten laskua ja tehostuneisuuden lisääntymistä.

On siten ei sattumaa, että moni tiimi on myös huomannut kasvavan kiinnostuksen multimodaalisen datan annotoinnin suhteen. Tämä on yksi näkyvimpiä trendeistä, joka on suoraan kytköksissä robotiikan ja kehollisen tekoälyn kehitykseen.

Seuraava asia on tällaisen tietokannan merkintä. Olemme kohtaneet samanlaisia kysymyksiä Keymakr:ssa, kun olemme työskennelleet asiakkaiden tietokannoissa robotiikkaan liittyvissä tapauksissa: miltä tällainen annotaatio tulisi näyttää käytännössä? Tulisiko se olla luurankomainen? Kaksi- tai kolmiulotteinen? Tulisiko siihen sisällyttää vahvistusoppimisen elementtejä putkiin? On kymmeniä tällaisia kysymyksiä. Insinöörit myöntävät, ettei kukaan voi vielä sanoa varmasti, mikä tietokonfiguraatio lopulta johtaa todelliseen teknologiseen läpimurtoon.

Nämä huolenaiheet ovat ymmärrettäviä. Monimutkaisten tietokantojen rakentaminen on kallista prosessia. Jokainen virhe tietorakenteessa voi maksaa tuhansia tai jopa miljoonia euroja. On mahdollista kerätä “väärä” tietokanta tai tallentaa se olosuhteissa, jotka on vaikea toistaa todellisessa maailmassa, mikä lopulta heikentää koko projektiin. Siksi tällä hetkellä kiinnitetään yhä enemmän huomiota sekä malleihin itsessään että siihen dataan, jolla ne koulutetaan.

Mitä roboteja markkinat tarvitsevat?

Perinteiset teollisuusrobotit, jotka ovat toimineet autotehtaiden kokoonpanolinjoilla vuosikymmenien ajan, tarvitsevat vain vähän tietokoneavusteista näköaistia tai monimutkaisia tekoälymalleja. Heidän tehtävänsä on erittäin spesifinen: suorittaa tarkasti toistuvia liikkeitä – vasemmalle, oikealle, ylös, alas – korkealla tarkkuudella ja johdonmukaisuudella. Tässä alueessa he ovat jo ohittaneet ihmiset.

Täysin toinen kategoria on humanoidirobotit. Nämä järjestelmät tarvitsevat “aivopaneria”: kykyä navigoida avaruudessa, havainnoida ympäröivää ympäristöä, ymmärtää tilanteen kontekstia ja ohjata manipulaattoreita ei ennalta määrättyjen polkujen kautta vaan sopeutumalla todelliseen maailmaan.

Vaikka modernien tehtaiden automaatio on korkea, monet tehtävät suoritetaan edelleen ihmisvoimin. Esineen siirtäminen, laatikon nostaminen, osien lajittelu, komponentin kiinnittäminen tai materiaalien järjestäminen – nämä ovat pieniä toimia, jotka vaativat joustavuutta ja koordinaatiota. Tämä alue on yksi vaikeimmista automatisoida, ja juuri tässä humanoidijärjestelmät voivat löytää roolinsa.

Monet tiimistä, joilla keskustin, käyttävät samanlaista liiketoimintamallia. He lähestyvät tehdasta ja ehdottavat ratkaisua tiettyyn tuotantotapaukseen. Esimerkiksi työntekijä voi viettää koko päivän siirtämällä laatikoita varastojen välillä. Insinöörit ehdottavat yksinkertaista kokeilua: varustaa työntekijä kameralla ja antureilla, tallentaa tuhansia tunteja heidän toimintaansa ja käyttää tätä dataa kouluttaakseen mallin, joka ohjaisi humanoidirobotin. Tällä tavoin robotti oppii suorittamaan täsmälleen samat tehtävät, joita ihmis työntekijä suorittaa.

Itse asiassa yritys ostaa humanoidialustan, kun taas kehitystiimi rakentaa mukautuvan mallin, joka replikoi tietyn operaattorin käyttäytymisen. Tämä ei ole yleispätevä äly, joka pystyy ratkaisemaan minkä tahansa tehtävän, vaan tiettyjen taitojen kokoelma, joka on koulutettu tiettyyn skenaarioon tai tuotantotehtäviin. Monille insinööreille tämä lähestymistapa näyttää paljon realistisemmalta. Sen sijaan, että yritettäisiin luoda universaali robotti heti, tiimit keskittyvät kapeisiin, taloudellisesti kannattaviin automaatiotilanteisiin.

Liiketoiminnan ulottuvuus

Jos tulevaisuus piilee mukautuvissa malleissa, on tärkeää ymmärtää, että taloudellisesti tämä on melko pitkä kehitystie.

Jokainen toimiala on oma maailmansa. Jokaisella tuotantoympäristöllä on omat prosessinsa, työnkulunsa ja poikkeuksensa. Robotti, joka on koulutettu toimimaan autotehtaalla, ei voi yksinkertaisesti siirtää ruokaan valmistukseen tai varastologistiikkaan. Jokaisessa tapauksessa järjestelmän on opittava uudelleen alusta alkaen.

Tämä johtaa seuraavaan loogiseen kysymykseen: kuka on ensimmäisiä asiakkaita tällaiselle teknologialle?

Tässä vaiheessa ensisijaiset adoptoijat ovat todennäköisesti suuret yritykset – ne, joilla on budjetit ja joille automaatio voi tuottaa merkittävän taloudellisen vaikutuksen. Tänään humanoidirobotti maksaa noin 60 000 – 90 000 euroa pelkästään laitteiston osalta. Tämä on vain peruskonfiguraatio. Siihen lisätään ylläpito-, akku-, latausasema- ja infrastruktuurikustannukset sekä ohjelmisto.

Tuloksena yritykset, jotka voivat kokeilla tällaisia järjestelmiä, ovat suuret organisaatiot, autonvalmistajat, elintarvikekonsernit ja suuret teolliset yritykset.

Tietysti myös pienemmät sektorit voivat nähdä joitakin varhaisia adoptoijia. Joitakin yrityksiä voi ostaa yhden tai kaksi robottia tiettyihin tehtäviin. Useimmissa tapauksissa nämä yritykset eivät kuitenkaan ole valmiita panostamaan satoja tuhansia euroja mukautettujen tietokantojen keräämiseen ja annotointiin, jotka vaaditaan hyvin spesifisiin toimintaskenaarioihin. Heille ihmistyö on edelleen halvempi vaihtoehto.

Robotinnovaation pitkä peli

Päädyimme lopulta perustavaan taloudelliseen kysymykseen: mikä on tehokkaampaa – ihminen vai robotti? Jos tarkastelemme nykyistä taloutta, vastaus on ilmeinen: ihmistyö on halvempi, sopeutuu nopeammin uusiin olosuhteisiin eikä vaadi monimutkaisia infrastruktuureja.

Miksi alan yritykset jatkavat sijoittamista robotiikkaan tänään? Vastaus on suurelta osin strateginen.

Monet yritykset ymmärtävät, että teknologisen johtajuuden kilpailu on käynnissä. He kehittävät ratkaisuja jo nyt, vaikka kustannukset ovat korkeat, ollakseen eturintamassa, kun robotiikan taloustilanne muuttuu.

Kun elektroniikka kehittyy, komponenttien kustannukset laskevat ja laskentatehokkuus paranevat, robotiikka tulee väättämättä olemaan edullisempaa. Ja kun tämä tapahtuu, etu kuuluu niille yrityksille, jotka ovat jo kehittäneet mallit, keränneet dataa ja luoneet tarvittavan teknologisen infrastruktuurin.

Kuvitellaan esimerkiksi, että uudet säännökset sallivat laajamittaisen humanoidirobotien käytön valmistuksessa. Tai että hallitukset alkavat tukea teollisuuden robotiikkaa. Tällaisessa skenaariossa markkinat voivat kasvaa dramaattisesti vain muutamassa vuodessa. Ja ne, jotka valmistautuivat etukäteen, joilla on olemassa olevia malleja, tutkimusta, tietokantoja ja valmiita teknologisia pinnoitteita, ovat ne, jotka hyötyvät eniten.

Siksi kehitystyö jatkuu edelleen, vaikka liiketoiminnan taloustilanne ei välttämättä näytä vielä ihanteelliselta. Monille yrityksille tämä on sijoitus tulevaisuuteen – siihen hetkeen, jolloin teknologiat tulevat helpommaksi ja kysyntä kasvaa terävästi.

Ja tässä kilpailussa, kuten monissa teknologisissa vallankumouksissa, yksi tekijä usein osoittautuu ratkaisevaksi: kuka aloitti aiemmin. Tässä mielessä nykyinen robotiikka muistuttaa paljon tekoälyn varhaisia vaiheita. Silloin oli myös enemmän kysymyksiä kuin vastauksia. Mutta se, mitä tiimit aloittivat aiemmin työskentelemällä datan ja infrastruktuurin parissa, lopulta määritteli koko alan suunnan.

Michael Abramov on Introspectorin perustaja ja toimitusjohtaja, joka tuo yli 15 vuoden ohjelmistokehitys- ja tietokoneavusteisen nÀköjÀrjestelmÀn kokemuksen yritysasteisten merkintÀtyökalujen kehittÀmiseen.

Michael aloitti uransa ohjelmistosuunnittelijana ja tutkimus- ja kehitysjohtajana, luoden skaalautuvia tietojÀrjestelmiÀ ja johtaa monitoimisia insinööritiimejÀ. Vuoteen 2025 asti hÀn on toiminut Keymakrissa, datamerkintÀpalveluyrityksessÀ, toimitusjohtajana, jossa hÀn kehitti ihmisten ja koneiden yhteistyöhön perustuvia työprosesseja, edistyneitÀ laadunvalvontajÀrjestelmiÀ ja rÀÀtÀlöityjÀ työkaluja tukeakseen suurten tietokoneavusteisten ja autonomiatietojen tarpeita.

HÀnellÀ on tietojenkÀsittelytieteen tutkinto ja tausta insinööritieteessÀ ja luovissa taiteissa, tuoden monitieteisen nÀkökulman vaikeiden ongelmien ratkaisemiseen. Michael elÀÀ teknologisen innovaation, strategisen tuotejohtamisen ja todellisen vaikutuksen risteyksessÀ, ajamalla eteenpÀin autonomisen jÀrjestelmÀn ja ÀlykkÀÀn automaation seuraavaa etappia.