Tekoäly
Monimodaalinen oppiminen on tulossa merkittäväksi kehityssuunnaksi tekoälykehittäjien keskuudessa

Venture Beat (VB) omisti yhden viikoittaisista raporteistaan monimodaalisen oppimisen edulle tekoälyjärjestelmien kehittämisessä. Heidän aiheensa oli ABI Researchin raportti aiheesta.
Avainkäsite liittyy siihen, että ”datat ovat tekoälyjärjestelmien perusrakennusosia”, ja että ilman datatietoja ”malleja ei voi oppia suhteita, jotka ohjaavat niiden ennusteita.” ABI-raportti ennustaa, että ”vaikka asennettujen tekoälylaitteiden määrä kasvaa 2,69 miljardista vuonna 2019 4,47 miljardiin vuoteen 2024 mennessä, verrattain vähän niistä on toimintakykyisiä lyhyellä aikavälillä.”
Tämä voi edustaa merkittävää ajan, energian ja resurssien haaskaa, ”sen sijaan, että yhdistettäisiin gigatavuista dataa, joka virtaa niiden läpi, yhteen tekoälymalliin tai -kehykseen, ne toimisivat itsenäisesti ja heterogeenisesti ymmärtääkseen datan, jota ne saavat.”
Tätä voidaan voittaa ABI:n ehdottamalla monimodaalisella oppimisella, joka voisi konsolidoida datan ”erilaisista anturista ja syötteistä yhteen järjestelmään. Monimodaalinen oppiminen voi kantaa komplementaarista tietoa tai trendejä, jotka usein tulevat ilmi vasta, kun ne kaikki sisällytetään oppimisprosessiin.”
VB esittää toimivan esimerkin, jossa otetaan huomioon kuvat ja tekstin kuvaukset. ”Jos eri sanat on parittu samankaltaisten kuvien kanssa, nämä sanat ovat todennäköisesti käytetty kuvaamaan samoja asioita tai objekteja. Toisaalta, jos jotkut sanat ilmaantuvat eri kuvien rinnalla, tämä osoittaa, että nämä kuvat edustavat samaa objektia. Tästä syystä olisi mahdollista tekoälymallin ennustaa kuvien objekteja tekstin kuvauksista, ja tosiaan, akateeminen kirjallisuus on osoittanut tämän olevan tapahtumassa.”
Vaikka mahdollisista hyödyistä huolimatta, ABI toteaa, että jopa teknologiajätit kuten IBM, Microsoft, Amazon ja Google jatkavat pääasiassa yksimodaalisten järjestelmien kehittämistä. Yksi syy tähän on haaste, jonka tällainen muutos edustaisi.
Silti ABI-tutkijat ennustavat, että ”laiteiden toimitusmäärä kasvaa 3,94 miljoonasta vuonna 2017 514,12 miljoonaan vuoteen 2023, jota ohjaa robotti-, kuluttaja-, terveydenhuolto- ja media- ja viihde-segmenttien omaksuminen.” Esimerkkeinä yhtiöistä, jotka jo toteuttavat monimodaalista oppimista, he mainitsevat Waymon, joka käyttää tällaisia lähestymistapoja ”hyper-herkkien itseajavien ajoneuvojen” rakentamiseen, ja Intel Labsin, jossa yhtiön insinööritutkimusryhmä ”tutkii menetelmiä anturidatan kokoamiseksi todellisissa ympäristöissä.”
Intel Labsin pääinsinööri Omesh Tickoo selitti VB:lle, että ”Mitä me teimme, oli käyttää tekniikoita kontekstin määrittämiseen, kuten päivän aikaan, ja rakensimme järjestelmän, joka kertoo, kun anturin data ei ole korkealaatuista. Tämän luottamuksen arvon perusteella se painottaa eri antureita toisiinsa nähden eri väliajoin ja valitsee oikean seoksen antamaan meille vastauksen, jonka etsimme.”
VB toteaa, että yksimodaalinen oppiminen säilyy merkittävänä siellä, missä se on erittäin tehokasta – sovelluksissa kuten kuvatunnistuksessa ja luonnollisen kielen prosessoinnissa. Samalla se ennustaa, että ”kun elektroniikka tulee halvemmaksi ja laskenta skaalautuu, monimodaalinen oppiminen todennäköisesti kasvaa merkittävyydessään.”












