Connect with us

Tekoäly

Monimodaalinen oppiminen tulee yhä tunnetummaksi tekoälykehittäjien keskuudessa

mm

Venture Beat (VB) omisti yhden viikoittaisista raporteistaan monimodaalisen oppimisen hyötyihin tekoälyjen kehittämisessä. Heidän aiheensa oli raportti ABI Research:ilta aiheesta.

Avainkäsite liittyy siihen, että ”datat ovat tekoälyjärjestelmien perusrakennusosia”, ja että ilman datatietoja ”malleja ei voida opettaa tuntemaan suhteita, jotka vaikuttavat niiden ennusteisiin.” ABI-raportti ennustaa, että ”vaikka tekoälylaitteiden asennettu määrä kasvaa 2,69 miljardista vuonna 2019 4,47 miljardiin vuoteen 2024 mennessä, verrattain vähän niistä on toimintakykyisiä lyhyellä aikavälillä.”

Tämä voi edustaa merkittävää ajan, energian ja resurssien haaskaa, ”koska niiden sijaan, että yhdistäisivät gigatavuista petatavuun datavirtoja yhteen tekoälymalliin tai -kehykseen, ne toimivat itsenäisesti ja heterogeenisesti datan ymmärtämiseksi.”

Tätä voidaan voittaa ABI:n ehdottamalla monimodaalisella oppimisella, joka voi konsolidoida datan ”erilaisista anturista ja syötteistä yhteen järjestelmään. Monimodaalinen oppiminen voi kantaa komplementaarisia tietoja tai trendejä, jotka usein tulevat ilmi vasta, kun ne kaikki sisällytetään oppimisprosessiin.”

VB esittää toimivan esimerkin, jossa otetaan huomioon kuvat ja tekstikuvaukset. ”Jos eri sanat on parittu samankaltaisten kuvien kanssa, nämä sanat ovat todennäköisesti käytetty kuvaamaan samoja asioita tai objekteja. Toisaalta, jos jotkut sanat näkyvät eri kuvien vieressä, tämä osoittaa, että nämä kuvat edustavat samaa objektia. Tästä syystä on mahdollista, että tekoälymalli voi ennustaa kuvien objekteja tekstikuvauksista, ja tosiaan, akateeminen kirjallisuus on osoittanut tämän olevan tapahtunut.”

Vaikka mahdollisista hyödyistä, ABI toteaa, että jopa teknologiajätit kuten IBM, Microsoft, Amazon ja Google jatkavat pääasiassa yksimodaalisten järjestelmien kehittämistä. Yksi syy tähän on haaste, jonka tällainen muutos edustaisi.

Silti ABI-tutkijat odottavat, että ”laiteiden toimitusmäärä kasvaa 3,94 miljoonasta vuonna 2017 514,12 miljoonaan vuoteen 2023, jota ajaa robotti-, kuluttaja-, terveydenhuolto- ja media- ja viihdeosuuksien omaksuminen.” Esimerkkeinä yrityksistä, jotka jo toteuttavat monimodaalista oppimista, he mainitsevat Waymon, joka käyttää tällaisia lähestymistapoja ”hyper-herkkien itseajavien ajoneuvojen” rakentamiseen, ja Intel Labs, jossa yrityksen insinööritiimi ”tutkii tekniikoita anturidatan kokoamiseen todellisissa ympäristöissä.”

Intel Labsin pääinsinööri Omesh Tickoo selitti VB:lle, että ”Mitä me teimme, oli keinoja selvittää kontekstia, kuten päivän aikaa, ja rakensimme järjestelmän, joka kertoo, kun anturin dataa ei ole korkealaatuista. Tämän luottamuksen arvon perusteella se punnitsee eri antureita toisiinsa nähden eri välein ja valitsee oikean seoksen antaakseen meille vastauksen, jonka etsimme.”

VB toteaa, että yksimodaalinen oppiminen säilyy hallitsevana, missä se on erittäin tehokasta – sovelluksissa kuten kuvatunnistuksessa ja luonnollisen kielen prosessoinnissa. Samalla se ennustaa, että ”kun elektroniikka tulee halvemmaksi ja laskenta skaalautuu, monimodaalinen oppiminen todennäköisesti kasvaa merkittävyydessään.”

n kääntäjä, tällä hetkellä freelancer-toimittaja/kirjailija/tutkija, joka keskittyy moderniin teknologiaan, tekoälyyn ja moderniin kulttuuriin.