mozzicone Ricky Costa, CEO di Quantum Stat - Serie di interviste - Unite.AI
Seguici sui social

interviste

Ricky Costa, CEO di Quantum Stat – Serie di interviste

mm
aggiornato on

Ricky Costa è l'amministratore delegato di Quantum Stat, una società che offre soluzioni aziendali per NLP e iniziative di intelligenza artificiale

Cosa ti ha inizialmente interessato all'intelligenza artificiale?

Casualità. Stavo leggendo un libro sulla probabilità quando mi sono imbattuto in un famoso teorema. A quel tempo, mi chiedevo ingenuamente se avrei potuto applicare questo teorema a un problema di linguaggio naturale che stavo tentando di risolvere sul lavoro. A quanto pare, l'algoritmo esisteva già a mia insaputa, si chiamava Naïve Bayes, un modello generativo molto famoso e semplice utilizzato nell'apprendimento automatico classico. Quel teorema era il teorema di Bayes. Ho sentito che questa coincidenza era un indizio e ho piantato un seme di curiosità per continuare a saperne di più.

 

Sei l'amministratore delegato di Quantum Stat, un'azienda che offre soluzioni per l'elaborazione del linguaggio naturale. Come ti sei trovato in questa posizione?

Quando c'è una rivoluzione in una nuova tecnologia, alcune aziende sono più titubanti di altre di fronte all'ignoto. Ho fondato la mia azienda perché inseguire l'ignoto è divertente per me. Ho anche sentito che era il momento giusto per avventurarmi nel campo della PNL, viste tutte le incredibili ricerche che sono arrivate negli ultimi 2 anni. La comunità della PNL ha ora la capacità di ottenere molto di più con molto meno, dato l'avvento di nuove tecniche di PNL che richiedono meno dati per scalare le prestazioni.

 

Per i lettori che potrebbero non avere familiarità con questo campo, potresti condividere con noi cosa fa Natural Language Processing?

La PNL è un sottocampo dell'intelligenza artificiale e dell'analisi che tenta di comprendere il linguaggio naturale nel testo, nel parlato o nell'apprendimento multimodale (testo e immagini/video) e di elaborarlo fino al punto in cui stai guidando la comprensione e/o fornendo un servizio prezioso. Il valore può arrivare da diverse angolazioni, dal recupero delle informazioni nel file system interno di un'azienda, alla classificazione del sentimento nelle notizie, o un Twitter bot GPT-2 che aiuta con il tuo social media marketing (come quello che abbiamo creato un paio di settimane fa).

 

Hai una laurea in psicologia sperimentale dell'Hunter College. Ritieni che la comprensione del cervello umano e della psicologia umana sia una risorsa quando si tratta di comprendere ed espandere il campo dell'elaborazione del linguaggio naturale?

Questo è contrarian, ma sfortunatamente no. L'analogia dei neuroni e delle reti neurali profonde è semplicemente per illustrare e instillare l'intuizione. Probabilmente si può imparare molto di più dalla scienza e dall'ingegneria della complessità. La difficoltà nel capire come funziona il cervello è che abbiamo a che fare con un sistema complesso. L'"intelligenza" è un fenomeno emergente dalla complessità del cervello che interagisce con il suo ambiente, ed è molto difficile da definire. La psicologia e le altre scienze sociali, che dipendono dal "riduzionismo" (dall'alto verso il basso) non funzionano sotto questo complesso paradigma. Ecco l'intuizione: immaginate qualcuno che tenti di ridurre la canzone dei Beatles “Let it Be” alla scala di do maggiore. Non c'è nulla in quella scala che preveda che "Let it Be" ne emergerà. Lo stesso segue con qualcuno che tenta di ridurre il comportamento all'attività neurale nel cervello.

 

Potresti condividere con noi perché i Big Data sono così importanti quando si tratta di Deep Learning e più specificamente di elaborazione del linguaggio naturale?

Allo stato attuale, poiché i modelli di deep learning interpolano i dati, più dati vengono inseriti nel modello, meno casi limite vedrà quando si effettua un'inferenza in natura. Questa architettura "incentiva" il calcolo di grandi set di dati da parte di modelli al fine di aumentare la precisione dell'output. Tuttavia, se vogliamo ottenere un comportamento più intelligente dai modelli di intelligenza artificiale, dobbiamo guardare oltre la quantità di dati che abbiamo e più verso come possiamo migliorare la capacità della capacità del modello di ragionare in modo più efficiente, che intuitivamente non dovrebbe richiedere molti dati. Dal punto di vista della complessità, gli esperimenti sugli automi cellulari condotti nel secolo scorso dai fisici John von Neumann e Stephen Wolfram mostrano che la complessità può emergere da semplici condizioni e regole iniziali. Quali dovrebbero essere queste condizioni/regole per quanto riguarda l'IA, è ciò che tutti cercano.

 

Di recente hai lanciato il 'Big Bad NLP Database'. Cos'è questo database e perché è importante per chi opera nel settore dell'intelligenza artificiale?

Questo database è stato creato per consentire agli sviluppatori di PNL di avere un accesso diretto a tutti i set di dati pertinenti del settore. Questo database aiuta a indicizzare i set di dati che ha un piacevole effetto secondario di poter essere interrogato dagli utenti. La pre-elaborazione dei dati richiede la maggior parte del tempo nella pipeline di distribuzione e questo database tenta di mitigare il problema il più possibile. Inoltre, è una piattaforma gratuita per chiunque, indipendentemente dal fatto che tu sia un ricercatore accademico, un professionista o un guru indipendente dell'IA, che desideri aggiornarsi sui dati della PNL. Link

 

Quantum Stat attualmente offre soluzioni end-end. Quali sono alcune di queste soluzioni?

Aiutiamo le aziende a facilitare la loro pipeline di modellazione PNL offrendo lo sviluppo in qualsiasi fase. Siamo in grado di coprire un'ampia gamma di servizi, dalla pulizia dei dati nella fase di pre-elaborazione fino all'implementazione del server modello in produzione (questi servizi sono evidenziati anche sulla nostra home page). Non tutti i progetti di intelligenza artificiale vengono realizzati a causa della natura sconosciuta di come la tua specifica architettura di dati/progetti funziona con un modello all'avanguardia. Data questa incertezza, i nostri servizi offrono alle aziende la possibilità di ripetere il proprio progetto a una frazione del costo dell'assunzione di un ingegnere ML a tempo pieno.

 

Quale recente progresso nell'IA trovi più interessante?

Il progresso più importante degli ultimi tempi è il modello del trasformatore, potresti averne sentito parlare: BERT, RoBERTa, ALBERT, T5 e così via. Questi modelli di trasformatore sono molto interessanti perché consentono al ricercatore di ottenere prestazioni all'avanguardia con set di dati più piccoli. Prima dei trasformatori, uno sviluppatore richiedeva un set di dati molto grande per addestrare un modello da zero. Poiché questi trasformatori vengono preaddestrati su miliardi di parole, consente un'iterazione più rapida dei progetti di intelligenza artificiale ed è ciò in cui siamo maggiormente coinvolti al momento.

 

C'è qualcos'altro che vorresti condividere su Quantum Stat?

Stiamo lavorando a un nuovo progetto che si occupa di analisi del sentiment dei mercati finanziari che verrà rilasciato a breve. Abbiamo sfruttato più trasformatori per fornire informazioni senza precedenti su come si svolgono le notizie finanziarie in tempo reale. Rimani sintonizzato!

Per saperne di più visita Quantum Stat o leggi il nostro articolo sul Big Bad Database PNL.

Socio fondatore di unite.AI e membro di Consiglio tecnologico di Forbes, Antonio è un futurista che è appassionato del futuro dell'intelligenza artificiale e della robotica.

È anche il Fondatore di Titoli.io, un sito web che si concentra sugli investimenti in tecnologie dirompenti.