Interviste
Phil Hall, Chief Growth Officer di LXT – Serie di Interviste

Il Chief Growth Officer di LXT Phil Hall è un ex esecutivo di Appen e membro del Forbes Technology Council. Nel suo ruolo di leadership in Appen, ha gestito una divisione di oltre 1.000 dipendenti e ha svolto un ruolo chiave nel raggiungere 17 anni consecutivi di crescita dei ricavi con una redditività costantemente solida. Nel suo attuale ruolo in LXT, sta lavorando con un team di esperti selezionati a mano per raggiungere ambiziosi obiettivi di crescita.
LXT è un leader emergente nel settore dei dati di addestramento AI per alimentare la tecnologia intelligente per le organizzazioni globali, tra cui le più grandi aziende tecnologiche del mondo. In partnership con una rete internazionale di contributori, LXT raccoglie e annota dati across multiple modalità con la velocità, la scala e l’agilità richieste dalle aziende. Hanno un’esperienza globale che copre oltre 115 paesi e 750 lingue. Fondata nel 2010, LXT ha sede a Toronto, Canada, con sedi negli Stati Uniti, in Australia, in Egitto, nel Regno Unito e in Turchia. La società serve clienti in Nord America, Europa, Asia Pacifico e Medio Oriente.
Quando hai scoperto per la prima volta che eri appassionato di lingua?
Sono stato affascinato dalla lingua fin da quanto posso ricordare, ma in termini di mio impegno diretto con la lingua e la linguistica, c’è stato un punto di svolta significativo per me. Ci siamo resi conto molto presto che una delle nostre figlie era dislessica, e quando abbiamo parlato con la sua scuola per ottenere ulteriore supporto, hanno detto che mentre c’erano programmi a cui potevano accedere, c’erano anche cose che potevo fare come volontario a scuola per aiutare nostra figlia e altri bambini. È andato bene, e da lì sono andato a studiare linguistica e mi sono trovato a insegnare in due università qui a Sydney.
Stavi insegnando linguistica prima di spostare la tua attenzione nello spazio dei dati vocali, cosa ti ha ispirato a cambiare il tuo focus?
Appen, con sede a Sydney, stava facendo la transizione da un’operazione gestita in una stanza di una casa a un’operazione commerciale a tutti gli effetti. Mi è stato detto che stavano cercando un linguista (forse più precisamente, un linguista!) e sono stato presentato ai fondatori Julie e Chris Vonwiller. La transizione è stata graduale e si è estesa su circa due anni. Ero riluttante a lasciare l’insegnamento – lavorare con studenti di alto livello era sia ispiratore che molto divertente. Ma soprattutto durante quegli anni pionieristici, stavo risolvendo problemi difficili insieme agli esperti di tecnologia linguistica di tutto il mondo, e i livelli di entusiasmo erano alti. Molte cose che vengono date per scontate oggi, erano molto impegnative a quel tempo.
Sei uscito dal pensionamento per unirti a LXT. Cosa ti ha motivato a farlo?
È una domanda interessante, poiché stavo godendomi la vita in pensione. In realtà, il nostro co-fondatore e CEO Mohammad Omar mi ha avvicinato mesi prima che rispondessi alla sua richiesta iniziale, poiché stavo vivendo uno stile di vita rilassato e non avevo realmente contemplato il ritorno al lavoro a tempo pieno. Dopo aver accettato di fare la prima telefonata in cui Mo mi ha chiesto della possibilità di unirmi a LXT, mi aspettavo solo di ascoltare educatamente e rifiutare.
Ma alla fine, l’opportunità era semplicemente troppo buona per essere respinta.
Mentre parlavo con Mohammad e gli altri membri del team di LXT, ho immediatamente riconosciuto una passione condivisa per la lingua. Il team che Mohammad aveva raccolto era composto da pensatori creativi con energia senza limiti che erano completamente impegnati nella missione della società.
Come ho appreso di più sull’opportunità con LXT, ho realizzato che era una possibilità che non volevo perdere. Ecco una società con un potenziale di crescita massiccio per espandersi e crescere in un’area di cui sono appassionato. E poiché il mercato dell’AI continua a crescere esponenzialmente, l’opportunità di aiutare più organizzazioni a passare dalla sperimentazione alla produzione è una possibilità emozionante di cui sono felice di far parte.
Quali sono alcune delle sfide attuali dietro l’acquisizione di dati su larga scala?
Le sfide sono variegate come le applicazioni che le guidano.
Da un punto di vista pratico, le sfide includono autenticità, affidabilità, precisione, sicurezza e assicurarsi che i dati siano adatti allo scopo – e questo senza considerare il crescente numero di sfide legali ed etiche innate nell’acquisizione dei dati.
Ad esempio, lo sviluppo di tecnologie a supporto di veicoli autonomi richiede la raccolta di enormi volumi di dati in una moltitudine di scenari in modo che l’auto possa capire come rispondere a situazioni del mondo reale. Ci sono innumerevoli casi limite che si possono incontrare mentre si guida, quindi gli algoritmi che alimentano quei veicoli hanno bisogno di set di dati che coprano tutto, dalle strade ai segnali di stop agli oggetti cadenti. E poi, se si moltiplica questo per il numero di eventi meteorologici che possono verificarsi, la quantità di dati di addestramento necessari aumenta esponenzialmente. Le aziende automobilistiche che si avventurano nello spazio autonomo devono stabilire una pipeline di dati affidabile, e farlo da sole richiederebbe una quantità massiccia di risorse.
Un altro caso d’uso è l’espansione di un prodotto di intelligenza artificiale vocale esistente in nuovi mercati per catturare quota di mercato e nuovi clienti. Ciò richiede inevitabilmente dati linguistici, e per raggiungere la precisione è fondamentale sorgere dati vocali da parlanti nativi in una varietà di profili demografici. Una volta raccolti i dati, i file vocali devono essere trascritti per addestrare gli algoritmi NLP del prodotto. Fare ciò per più lingue e ai volumi di dati necessari per essere efficaci è estremamente impegnativo per le aziende da sole, soprattutto se mancano di esperti interni in questo campo.
Questi sono solo due esempi delle molte sfide che esistono con la raccolta di dati per l’AI su larga scala, ma come puoi immaginare, l’automazione domestica, i dati dei dispositivi mobili e la raccolta di dati biometrici hanno ciascuno le proprie sfide specifiche.
Quali sono i metodi attuali con cui LXT sorgente e annota i dati?
In LXT, raccogliamo e annotiamo i dati in modo diverso per ogni cliente, poiché tutti i nostri impegni sono personalizzati per soddisfare le specifiche dei nostri clienti. Lavoriamo con una varietà di tipi di dati, tra cui audio, immagine, parlato, testo e video. Per la raccolta di dati, lavoriamo con una rete globale di contractor per raccogliere dati in queste diverse modalità. Le raccolte possono variare dall’acquisizione di dati in ambienti del mondo reale come case, uffici o in auto, a in-studio con ingegneri esperti nel caso di determinati progetti di raccolta di dati vocali.
Le nostre capacità di annotazione dei dati coprono anche molteplici modalità. La nostra esperienza è iniziata nello spazio vocale e negli ultimi 12 anni siamo cresciuti in oltre 115 paesi e più di 750 lingue. Ciò significa che le aziende di tutte le dimensioni possono fare affidamento su LXT per aiutarle a penetrare una vasta gamma di mercati e catturare nuovi segmenti di clienti. Più recentemente, ci siamo espansi in dati testuali, immagini e video, e la nostra piattaforma interna viene utilizzata per consegnare dati di alta qualità ai nostri clienti.
Un’altra area di crescita emozionante per noi è stata il nostro lavoro di annotazione sicura. Solo quest’anno, abbiamo espanso la nostra impronta di strutture sicure ISO 27001 da due a cinque sedi in tutto il mondo. Abbiamo sviluppato un playbook che ci consente di stabilire nuove strutture in pochi mesi. I servizi su cui ci concentriamo in queste strutture sicure sono attualmente annotazione e trascrizione di dati vocali, ma possono essere utilizzati per l’annotazione di molti tipi di dati.
Perché sorgere i dati in questo modo è un’alternativa superiore ai dati sintetici?
I dati sintetici sono uno sviluppo emozionante nel campo dell’AI e sono adatti a casi d’uso specifici, in particolare casi limite che sono difficili da catturare nel mondo reale. L’uso di dati sintetici è in aumento, in particolare nelle prime fasi della maturità dell’AI, poiché le aziende sono ancora in modalità sperimentale. Tuttavia, la nostra stessa ricerca mostra che poiché le organizzazioni maturano le loro strategie di AI e spingono più modelli in produzione, sono molto più propense a utilizzare metodi di apprendimento automatico supervisionato o semi-supervisionato che si basano su dati annotati da esseri umani.
Gli esseri umani sono semplicemente migliori dei computer nel comprendere le sfumature per creare i dati necessari per addestrare i modelli di ML a eseguire con alta precisione, e la supervisione umana è anche fondamentale per ridurre il pregiudizio.
Perché questi dati sono così importanti per il parlato e l’elaborazione del linguaggio naturale?
Perché gli algoritmi di parlato e di elaborazione del linguaggio naturale funzionino efficacemente nei mercati previsti, devono essere addestrati con grandi volumi di dati raccolti da parlanti nativi che hanno il contesto culturale degli utenti finali che rappresentano. Senza questi dati, l’adozione della voce AI avrà gravi limitazioni.
Inoltre, l’ambiente deve essere preso in considerazione quando si raccolgono dati vocali. Se la soluzione di intelligenza artificiale vocale che viene addestrata verrà utilizzata in un’auto, ad esempio, ci sono diverse condizioni stradali e meteorologiche che influenzano il parlato e devono essere prese in considerazione. Sono scenari complessi in cui un partner di dati esperto può aiutare.
C’è qualcos’altro che ti piacerebbe condividere su LXT?
Innanzitutto, voglio ringraziarti per l’opportunità di condividere la nostra storia! Vorrei sottolineare che la nostra società è impegnata ad aiutare le organizzazioni di tutte le dimensioni a avere successo con le loro iniziative di AI. Ci siamo concentrati nel consegnare dati di AI personalizzati alle aziende di tutto il mondo per oltre 12 anni e saremmo felici di connetterci con chiunque cerchi di creare una pipeline di dati affidabile per supportare i propri progetti di AI.
Grazie per la grande intervista, i lettori che desiderano saperne di più possono visitare LXT.












