interviste
Dr. Lingjia Tang, CTO e co-fondatore, Clinc – Serie di interviste

Dr. Lingjia Tang, CTO e co-fondatore di clinc, è professore di Informatica presso l'Università del Michigan. La ricerca del Dr. Tang nella costruzione di infrastrutture di produzione su larga scala per applicazioni intelligenti è ampiamente riconosciuta e rispettata nella comunità accademica. Oltre a lavorare sia in Microsoft che in Google, Lingjia ha conseguito il dottorato di ricerca in Informatica presso l'Università della Virginia. Lingjia ha recentemente ricevuto prestigiosi premi tra cui ISCA Hall of Fame, Facebook Research Awards e Google research Award.
Cosa ti ha attratto inizialmente dell'IA? Quando hai scoperto per la prima volta che volevi avviare un'attività di intelligenza artificiale?
A metà degli anni 2000 stavo conducendo ricerche su sistemi su larga scala che supportano varie applicazioni e su come progettare i server come sistemi software per eseguire tali applicazioni in modo più efficiente. All'epoca, stavamo passando dall'utilizzo di applicazioni web tradizionali a funzioni più basate sul machine learning. Fu allora che iniziai a prestare attenzione agli algoritmi associati all'intelligenza artificiale e mi interessai a comprendere a fondo il funzionamento delle applicazioni di intelligenza artificiale. Poco dopo, il team di ricerca con cui lavoravo decise di cambiare rotta e di sviluppare fondamentalmente le nostre applicazioni di intelligenza artificiale come benchmark da studiare, il che ci portò a pubblicare i nostri primi articoli di ricerca e a sviluppare il nostro primo prodotto, Sirius, un assistente personale vocale e visivo end-to-end aperto.
In quanto software open source, Sirius ha permesso alle persone di creare autonomamente assistenti virtuali conversazionali. A quel tempo, questa era una capacità molto limitata per il pubblico in generale ed era controllata solo dalle grandi aziende, come Google e Apple. Tuttavia, abbiamo visto che stavamo colmando una lacuna critica quando abbiamo rilasciato il software e abbiamo visto che aveva decine di migliaia di download nella prima settimana! Quello è stato il punto di svolta in cui sapevamo che c'era molta domanda di mercato per questo tipo di software.
Nel 2015, abbiamo lanciato Clinc con la mentalità che saremmo stati in grado di fornire a tutti - ogni sviluppatore, azienda, persona - che desidera essere in grado di creare un assistente virtuale con l'accesso alle competenze, agli strumenti e all'innovazione per poterlo fare .
Clinc offre soluzioni di intelligenza artificiale conversazionale senza fare affidamento su parole chiave o script. Potresti fornire alcuni dettagli su come raggiungere questo obiettivo? Quali sono alcune delle sfide dell’elaborazione del linguaggio naturale (PNL) che hanno dovuto essere superate?
Ciò che distingue davvero Clinc dalle altre piattaforme di intelligenza artificiale conversazionale sul mercato sono i suoi algoritmi di intelligenza artificiale sottostanti che consentono la sua esperienza "umana nella stanza", che comprende un linguaggio disordinato e senza copione. Ciò consente correzioni per tornare indietro e "guarire" gli errori commessi nella conversazione umana e consente flussi conversazionali complessi, conversazioni che un vero essere umano sarebbe in grado di comprendere. A differenza di un algoritmo di corrispondenza delle parole da discorso a testo, Clinc analizza dozzine di fattori dall'input dell'utente tra cui parole, sentimenti, intenzioni, tono della voce, ora del giorno, posizione e relazioni e utilizza questi fattori per fornire una risposta che rappresenta un insieme di conoscenze estratte dal suo cervello allenato. Ad esempio, se chiedo al mio assistente virtuale, "quanti soldi ho speso per un hamburger?" deve capire che sto chiedendo soldi e spese, che sto chiedendo specificamente di un hamburger e che un hamburger è un tipo di cibo e dovrebbe essere abbinato alla mia recente spesa in un ristorante.
Raggiungere questo livello di comprensione non è facile. In generale, suddivideremmo l'IA conversazionale in due componenti: comprensione del linguaggio naturale (NLU) e gestione dei dialoghi. Quindi, la sfida che dovevamo superare era capire come costruire un sistema in grado di estrarre accuratamente le informazioni chiave e di anticipare ciò che l'utente chiede.
Siamo in grado di farlo attraverso un NLU sofisticato, contestuale, dall'alto verso il basso, che è addestrato per essere di natura intuitiva per stare al passo con il flusso naturale della conversazione, comprendendo il gergo e il contesto. Questo è rispetto alle soluzioni della concorrenza che hanno un approccio dall'alto verso il basso, basato su regole all'elaborazione del linguaggio naturale (NLP) che non consente la guarigione conversazionale, il che significa che se il cliente commette un errore, le soluzioni della concorrenza lo fanno tornare al punto di partenza , facendo perdere tempo e solo frustrando l'utente. Utilizziamo anche il crowdsourcing per estrarre i nostri dati linguistici per creare un set di dati più ricco e diversificato che può essere immediatamente utilizzato per addestrare modelli di intelligenza artificiale.
Potresti discutere di come viene utilizzato il deep learning con il sistema Clinc AI?
Clinc sta utilizzando un approccio ibrido al deep learning in cui utilizziamo in una certa misura il modello tradizionale della vecchia scuola e sfruttiamo il deep learning dove necessario. In particolare, utilizziamo il deep learning per comprendere parole e lingue per determinare il flusso del dialogo. In generale, il nostro intero dialogo è una combinazione di apprendimento profondo e intelligenza artificiale simbolica. Non utilizziamo ancora il deep learning per la generazione del linguaggio perché, quando si tratta dei nostri clienti che sono principalmente nel settore bancario, ci sono molte normative che l'assistente virtuale deve seguire che dettano ciò che può e non può dire ai propri clienti . Quindi, c'è ancora molta incertezza sul fatto che il deep learning sarà in grado o meno di seguire le restrizioni linguistiche stabilite.
A partire da ora, non credo che la comunità dell'IA conversazionale sia completamente pronta ad adottare completamente il deep learning mentre la comunità accademica è al 100%, ma non vedo l'ora di vedere cosa possono fare i nuovi modelli.
Qual è il processo per un'azienda che desidera personalizzare le risposte dell'IA per rivolgersi a un pubblico specifico? Potresti fornire alcuni esempi di come Clinc è attualmente utilizzato dai clienti?
Consentiamo ai clienti di concedere in licenza una piattaforma su cui possono costruire come preferiscono, oppure prendere il nostro chatbot completamente costruito e addestrato, Finie, e personalizzarlo e integrarlo nelle loro app o servizi di messaggistica. Finie può gestire questioni relative a saldi, transazioni, cronologia delle spese, individuazione di un bancomat, esecuzione di un bonifico e altro ancora.
Il mio esempio preferito di come un cliente ha personalizzato l'intelligenza artificiale di Clinc per rivolgersi a un pubblico specifico è İşbank. In qualità di banca privata più grande della Turchia, si è rivolta a noi per sviluppare il suo assistente bancario digitale, Maxi, nel 2018. Per infondere a Maxi una personalità unica, İşbank ha tenuto 14 focus group per valutare quali tipi di tratti e competenze desiderassero i clienti della banca in una banca virtuale assistente. Hanno anche assunto una doppiatrice per recitare frasi in turco relative a compiti bancari. Il team bancario conversazionale di İşbank ha formulato queste frasi considerando il modo in cui le persone reali esprimerebbero i propri bisogni. Su nostra raccomandazione, il team ha pagato i partecipanti sui mercati di crowdsourcing come Amazon Mechanical Turk per fornire diversi modi in cui potevano esprimere le stesse domande, come una richiesta di visualizzare i loro saldi ("qual è il mio saldo", "quanti soldi ho nel mio conto", "mostrami i contanti nel mio conto") o pagare una bolletta ("pagare la mia bolletta", "pagamento delle bollette").
Questo esempio mostra davvero quanto İşbank sia investita nell'offrire un assistente bancario digitale per aiutare i propri clienti a navigare meglio nei propri conti. Con Clinc, İşbank ha lanciato Maxi a più di 7.5 milioni di persone, in turco. Dal suo lancio, İşbank ha registrato un'adozione diffusa da parte di oltre 5.5 milioni di utenti, con una media di 9.8 interazioni per utente. Negli ultimi mesi, con l'aumento dei casi di COVID-19 in Turchia, İşbank ha addestrato rapidamente Maxi a rispondere alle domande relative al COVID-19. Da marzo 2020, Maxi ha risposto a più di 1.2 milioni di domande dei clienti relative a COVID-19, con un aumento dell'utilizzo di oltre il 62%.
Cosa diresti alle donne che sono interessate a saperne di più sull'intelligenza artificiale ma sono riluttanti a farsi coinvolgere perché è un campo dominato dagli uomini?
A prima vista, non credo ci sia alcun motivo per cui l'IA sia considerata un campo dominato dagli uomini. Credo che ci siano molte donne pioniere nell'IA che stanno ottenendo ottimi risultati e stanno avendo un impatto significativo. Credo che l'IA, abbinata alle politiche sociali, sia un ambito unico che ha il potenziale per avere un impatto significativo sulla vita quotidiana delle persone. È qui che credo che una visione più diversificata a tutto campo potrebbe davvero giovarci, soprattutto perché ci sono molte discussioni sui pregiudizi dell'IA che riguardano razza e genere. Credo che avere una comunità mirata di sviluppatori di IA continuerà ad avere un impatto sproporzionato sulla società e sulle politiche.
Per le donne là fuori che sono interessate a entrare nel campo dell'IA, lo consiglio vivamente, soprattutto se sei interessata ad avere un impatto. L'intelligenza artificiale ha avuto così tanta crescita e innovazione nel corso degli anni ed è davvero un momento entusiasmante per farne parte.
C'è qualcos'altro che vorresti condividere su Clinc?
Clinc sta facendo passi da gigante in questo momento. Personalmente, ho appena assunto il nuovo ruolo di CTO di Clinc e sono davvero entusiasta di concentrarmi su come possiamo collaborare ulteriormente con sviluppatori e data scientist per ampliare la portata della nostra tecnologia. Guardando al futuro, vedo che la domanda di applicazioni basate sull'intelligenza artificiale si sta trasformando, consentendo anche a chi non ha anni di esperienza in data science e machine learning di utilizzarle. Ad esempio, non è necessario avere una laurea in graphic design per poter usare Photoshop. Credo che l'intelligenza artificiale si stia muovendo in quella direzione, dove gli sviluppatori senza formazione in intelligenza artificiale o machine learning saranno in grado di ottenere risultati e produrre applicazioni di alta qualità . Nel complesso, vogliamo ribadire che non ci dedichiamo solo all'utente finale, ma anche agli sviluppatori, a prescindere dal livello, che mostrano interesse per la nostra soluzione.
Grazie per l'ottima intervista, non vedo l'ora di seguire i tuoi progressi. Chiunque desideri saperne di più dovrebbe visitare Clinica.