Seguici sui social

L'apprendimento multimodale sta diventando importante tra gli sviluppatori di intelligenza artificiale

Intelligenza Artificiale

L'apprendimento multimodale sta diventando importante tra gli sviluppatori di intelligenza artificiale

mm

Venture beat (VB) ha dedicato uno dei suoi rapporti settimanali ai vantaggi dell'apprendimento multimodale nello sviluppo dell'intelligenza artificiale. La loro richiesta era a rapporto by Ricerca ABI in merito.

Il concetto chiave sta nel fatto che “i set di dati sono elementi costitutivi fondamentali dei sistemi di intelligenza artificiale" e che senza set di dati "i modelli non possono apprendere le relazioni che informano le loro previsioni". Il rapporto ABI prevede che "mentre la base installata totale di dispositivi IA crescerà da 2.69 miliardi nel 2019 a 4.47 miliardi nel 2024, relativamente pochi saranno interoperabili a breve termine".

Questo potrebbe rappresentare un notevole dispendio di tempo, energie e risorse”piuttosto che combinare i gigabyte o i petabyte di dati che li attraversano in un unico modello o framework di intelligenza artificiale, lavoreranno in modo indipendente ed eterogeneo per dare un senso ai dati che ricevono".

Per ovviare a questo, ABI propone apprendimento multimodale, una metodologia che potrebbe consolidarsi dati “da vari sensori e ingressi in un unico sistema. L'apprendimento multimodale può portare informazioni o tendenze complementari, che spesso diventano evidenti solo quando sono tutte incluse nel processo di apprendimento".

VB presenta un esempio praticabile che considera immagini e didascalie di testo. “ Se parole diverse sono abbinate a immagini simili, queste parole sono probabilmente usate per descrivere le stesse cose o oggetti. Al contrario, se alcune parole compaiono accanto a immagini diverse, ciò implica che queste immagini rappresentano lo stesso oggetto. Detto questo, dovrebbe essere possibile per un modello di intelligenza artificiale prevedere oggetti immagine dalle descrizioni testuali e, in effetti, un corpo di letteratura accademica ha dimostrato che è così».

Nonostante i possibili vantaggi, ABI osserva che piace anche ai giganti della tecnologia  IBM, Microsoft, Amazon e Google continuano a concentrarsi prevalentemente sui sistemi unimodali. Uno dei motivi sono le sfide che un simile passaggio rappresenterebbe.

Eppure, i ricercatori ABI anticipano che “il numero totale di dispositivi spediti crescerà da 3.94 milioni nel 2017 a 514.12 milioni nel 2023, stimolato dall'adozione nei segmenti della robotica, dei consumatori, della sanità, dei media e dell'intrattenimento”. Tra gli esempi di aziende che stanno già implementando l'apprendimento multimodale citano Waymo che utilizza tali approcci per costruire "veicoli a guida autonoma iper-consapevoli" e Laboratori Intel, in cui il team di ingegneri dell'azienda sta "studiando le tecniche per la raccolta dei dati dei sensori in ambienti reali".

L'ingegnere capo di Intel Labs, Omesh Tickoo, lo ha spiegato a VB “Quello che abbiamo fatto è stato, utilizzando tecniche per capire il contesto come l'ora del giorno, abbiamo costruito un sistema che ti dice quando i dati di un sensore non sono della massima qualità. Dato quel valore di confidenza, pesa diversi sensori rispetto a ciascuno a intervalli diversi e sceglie il giusto mix per darci la risposta che stiamo cercando.

VB lo nota l’apprendimento unimodale rimarrà predominante laddove è altamente efficace – in applicazioni come il riconoscimento delle immagini e l’elaborazione del linguaggio naturale. Allo stesso tempo si prevede che “man mano che l’elettronica diventerà più economica e i computer saranno più scalabili, l’apprendimento multimodale probabilmente non potrà che aumentare di importanza”.

Ex diplomatico e traduttore per le Nazioni Unite, attualmente giornalista/scrittore/ricercatore freelance, specializzato in tecnologia moderna, intelligenza artificiale e cultura moderna.