Tekoäly
Intelin naamioitu humanoidiohjain: uusi lähestymistapa fyysisesti realistiseen ja ohjattavaan ihmisen liikkeen luomiseen

Tutkijat Intel Labs, yhteistyössä akateemisten ja alan asiantuntijoiden kanssa, ovat ottaneet käyttöön uraauurtavan tekniikan realistisen ja ohjattavan ihmisen liikkeen luomiseksi harvasta multimodaalisesta syötöstä. Heidän työnsä, korostettu Tietokonenäköalan eurooppalainen konferenssi (ECCV 2024) keskittyy luonnollisten, fysikaalisesti perustuvien ihmiskäyttäytymisten luomiseen liittyvien haasteiden ratkaisemiseen korkeaulotteisissa humanoidihahmoissa. Tämä tutkimus on osa Intel Labsin laajempaa aloitetta konenäön ja koneoppimisen edistämiseksi.
Intel Labs ja sen kumppanit esittelivät äskettäin kuusi huippuluokan paperia ECCV 2024:ssä, järjestämä ensisijainen konferenssi European Computer Vision Association (ECVA).
Paperi Luo fyysisesti realistisia ja ohjattavia ihmisen liikkeitä multimodaalisista tuloista esitteli innovaatioita, mukaan lukien uudenlainen puolustusstrategia tekstistä kuvaksi -mallien suojaamiseksi pikapohjaisilta red teaming -hyökkäyksiltä ja laajamittaisen tietojoukon kehittäminen, joka on suunniteltu parantamaan näiden mallien tilan yhtenäisyyttä. Näistä panostuksista paperi korostaa Intelin omistautumista generatiivisen mallintamisen edistämiseen priorisoimalla vastuullinen tekoäly käytäntöjä.
Luodaan realistisia ihmisen liikkeitä käyttämällä multimodaalisia tuloja
Intelin Masked Humanoid Controller (MHC) on läpimurtojärjestelmä, joka on suunniteltu luomaan ihmisen kaltaista liikettä simuloiduissa fysiikan ympäristöissä. Toisin kuin perinteiset menetelmät, jotka luottavat voimakkaasti täysin yksityiskohtaisiin liikkeenkaappaustietoihin, MHC on rakennettu käsittelemään harvaa, epätäydellistä tai osittaista syöttödataa useista eri lähteistä. Näitä lähteitä voivat olla VR-ohjaimet, jotka voivat seurata vain käsien tai pään liikkeitä; ohjaussauvan tulot, jotka antavat vain korkean tason navigointikomentoja; videoseuranta, jossa tietyt kehon osat voivat olla tukossa; tai jopa tekstikehotteista johdettuja abstrakteja ohjeita.
Teknologian innovaatio on sen kyky tulkita ja täyttää aukot, joissa tiedot puuttuvat tai ovat epätäydellisiä. Se saavuttaa tämän Intelin termien avulla Ota kiinni, yhdistä ja suorita loppuun (CCC) ominaisuudet:
- Saavuttaa: Tämän ominaisuuden avulla MHC voi toipua ja synkronoida liikkeensä uudelleen, kun ilmenee häiriöitä, kuten kun järjestelmä käynnistyy epäonnistuneessa tilassa, kuten kaatunut humanoidihahmo. Järjestelmä voi nopeasti korjata liikkeensä ja palata luonnolliseen liikkeeseen ilman uudelleenkoulutusta tai manuaalisia säätöjä.
- Yhdistää: MHC voi sekoittaa eri liikesarjoja yhteen, kuten yhdistää ylävartalon liikkeitä yhdestä liikkeestä (esim. heiluttamisesta) toisesta alavartalon liikkeistä (esim. kävely). Tämä joustavuus mahdollistaa täysin uudenlaisen käyttäytymisen luomisen olemassa olevista liiketiedoista.
- Täydellinen: MHC voi älykkäästi päätellä ja generoida liikkeen puuttuvat osat, kun sille annetaan harvat syöttötiedot, kuten osittaiset kehon liiketiedot tai epämääräiset korkean tason käskyt. Jos esimerkiksi vain käsivarsien liikkeet on määritetty, MHC voi itsenäisesti generoida vastaavia jalkojen liikkeitä ylläpitääkseen fyysistä tasapainoa ja realismia.
Tuloksena on erittäin mukautuva liikkeenmuodostusjärjestelmä, joka voi luoda tasaisia, realistisia ja fyysisesti tarkkoja liikkeitä myös epätäydellisillä tai alimääritetyillä ohjeilla. Tämä tekee MHC:stä ihanteellisen sovelluksiin pelaamisessa, robotiikassa, virtuaalitodellisuudessa ja kaikissa skenaarioissa, joissa tarvitaan korkealaatuista ihmismäistä liikettä, mutta syöttötietoja on rajoitetusti.
MHC:n vaikutus generatiivisiin liikemalleihin
Masked Humanoid Controller (MHC) on osa laajempaa Intel Labsin ja sen yhteistyökumppaneiden pyrkimystä rakentaa vastuullisesti generatiivisia malleja, mukaan lukien ne, jotka ohjaavat tekstistä kuvaksi ja 3D sukupolvi tehtäviä. Kuten ECCV 2024:ssä keskusteltiin, tällä lähestymistavalla on merkittäviä vaikutuksia robotiikkaan, virtuaalitodellisuuteen, pelaamiseen ja simulointiin, joissa ihmisen realistisen liikkeen luominen on ratkaisevan tärkeää. Sisällyttämällä multimodaalisia tuloja ja mahdollistamalla ohjaimen saumattoman siirtymisen liikkeiden välillä, MHC pystyy käsittelemään todellisia olosuhteita, joissa anturitiedot voivat olla meluisia tai epätäydellisiä.
Tämä Intel Labsin työ seisoo muiden ECCV 2024:ssä esiteltyjen edistyneiden tutkimusten rinnalla, kuten niiden uudenlainen suojaus tekstistä kuvaksi -malleille ja tekniikoiden kehittäminen tilallisen yhtenäisyyden parantamiseksi kuvien luonnissa. Yhdessä nämä edistysaskeleet osoittavat Intelin johtavan aseman tietokonenäön alalla keskittyen turvallisten, skaalautuvien ja vastuullisten tekoälytekniikoiden kehittämiseen.
Yhteenveto
Intel Labsin ja akateemisten yhteistyökumppaneiden kehittämä Masked Humanoid Controller (MHC) on kriittinen askel eteenpäin ihmisen liikkeen luomisessa. Vastaamalla monimutkaiseen ohjausongelmaan, joka liittyy realististen liikkeiden luomiseen multimodaalisista tuloista, MHC tasoittaa tietä uusille sovelluksille VR:ssä, pelaamisessa, robotiikassa ja simulaatiossa. Tämä ECCV 2024 -tapahtumassa esitelty tutkimus osoittaa Intelin sitoutumisen vastuullisen tekoälyn ja generatiivisen mallintamisen edistämiseen, mikä edistää turvallisempia ja mukautuvaisempia teknologioita eri aloilla.