taló Phil Hall, director de creixement de LXT - Sèrie d'entrevistes - Unite.AI
Connecteu-vos amb nosaltres

entrevistes

Phil Hall, director de creixement de LXT – Sèrie d'entrevistes

mm
actualitzat on

Director de creixement de LXT Phil Hall és un antic executiu d'Appen i Consell Tecnològic de Forbes membre. En el seu paper de lideratge a Appen, va dirigir una divisió de més de 1,000 empleats i va tenir un paper clau per aconseguir 17 anys consecutius de creixement dels ingressos amb una rendibilitat constantment sòlida. En el seu paper actual a LXT, està treballant amb un equip d'experts triats a mà per assolir objectius de creixement ambiciosos.

LXT és un líder emergent en dades de formació en IA per impulsar la tecnologia intel·ligent per a organitzacions globals, incloses les empreses tecnològiques més grans del món. En col·laboració amb una xarxa internacional de col·laboradors, LXT recopila i anota dades en múltiples modalitats amb la velocitat, l'escala i l'agilitat que requereix l'empresa. Tenen una experiència global que abasta més de 115 països i 750 idiomes locals. Fundada el 2010, LXT té la seu a Toronto, Canadà, amb presència als Estats Units, Austràlia, Egipte, Regne Unit i Turquia. La companyia dóna servei a clients a Amèrica del Nord, Europa, Àsia Pacífic i Orient Mitjà.

Quan vas descobrir inicialment que t'apassiona la llengua?

Des que tinc memòria m'ha intrigat la llengua, però pel que fa al meu compromís directe amb la llengua i la lingüística, hi va haver un únic punt d'inflexió significatiu per a mi. Ens vam adonar molt aviat que un dels nostres fills era dislèxic i, quan vam parlar amb la seva escola sobre suport addicional, ens van dir que, tot i que hi havia programes als quals podien accedir, també hi havia coses que podia fer com a voluntari a l'escola per ajudar els nostres filla i altres fills. Va anar bé, i a partir d'aquí vaig estudiar lingüística i em vaig trobar ensenyant a dues de les universitats d'aquí a Sydney.

Vau estar ensenyant lingüística abans de passar a l'espai de dades de parla, què us va inspirar a canviar el vostre focus?

Appen, amb seu a Sydney, acabava de fer la transició de ser una operació sense habitació de recanvi en una casa a ser una operació comercial de ple dret. Em van dir que buscaven lingüistes (potser més exactament, un lingüista!) i em van presentar els fundadors Julie i Chris Vonwiller. La transició va ser gradual i es va estendre durant uns dos anys. Em va mostrar reticent a abandonar l'ensenyament: treballar amb estudiants d'alt rendiment va ser alhora inspirador i molt divertit. Però sobretot durant aquells anys de pioner vaig estar resolent problemes difícils juntament amb els principals experts en tecnologia lingüística del món, i els nivells d'entusiasme eren alts. Molt del que avui es dóna per fet, era molt desafiant en aquell moment.

Vas sortir de la jubilació per unir-te a LXT. Què et va motivar a fer això?

Aquesta és una pregunta interessant, ja que definitivament m'estava gaudint de la jubilació. De fet, el nostre cofundador i conseller delegat, Mohammad Omar, es va acostar a mi mesos abans de respondre a la seva consulta inicial, ja que portava un estil de vida relaxat i realment no m'havia plantejat tornar a treballar a temps complet. Després d'acceptar atendre la primera trucada on Mo va preguntar sobre la possibilitat d'unir-me a LXT, m'esperava escoltar educadament i rebutjar.

Però al final, l'oportunitat era massa bona per resistir-se.

Mentre parlava amb Mohammad i els altres membres de l'equip LXT, vaig reconèixer immediatament una passió compartida per la llengua. L'equip que Mohammad havia reunit estava ple de pensadors creatius amb una energia il·limitada que estaven totalment compromesos amb la missió de l'empresa.

A mesura que vaig aprendre més sobre l'oportunitat amb LXT, em vaig adonar que era una oportunitat que no volia deixar passar. Aquí hi havia una empresa amb un gran potencial per expandir-se i créixer en una àrea que m'apassiona. I a mesura que el mercat de la IA continua creixent de manera exponencial, l'oportunitat d'ajudar més organitzacions a passar de l'experimentació a la producció és emocionant de la qual estic molt content de formar part.

Quins són alguns dels reptes actuals darrere de l'adquisició de dades a escala?

Els reptes són tan variats com les aplicacions que els impulsen.

Des d'una perspectiva pràctica, els reptes inclouen l'autenticitat, la fiabilitat, la precisió, la seguretat i la garantia que les dades s'adaptin al propòsit, i això sense tenir en compte el nombre creixent de reptes legals i ètics inherents a l'adquisició de dades.

Per exemple, el desenvolupament de tecnologia de suport als vehicles autònoms requereix la recollida de volums extremadament grans de dades en una multitud d'escenaris perquè el cotxe entengui com respondre a situacions del món real. Hi ha una infinitat de casos extrems que es poden trobar en conduir, de manera que els algorismes que alimenten aquests vehicles necessiten conjunts de dades que cobreixin tot, des dels carrers fins als senyals d'aturada fins a la caiguda d'objectes. I aleshores, si ho multipliqueu pel nombre d'esdeveniments meteorològics que es poden produir, la quantitat de dades d'entrenament necessàries augmenta de manera exponencial. Les empreses d'automoció que s'aventuren a l'espai autònom han d'establir una canalització de dades fiable, i fer-ho soles requeriria una quantitat massiva de recursos.

Un altre cas d'ús és l'expansió d'un producte d'IA de veu existent a nous mercats per capturar quota de mercat i nous clients. Això requereix, inevitablement, dades de l'idioma i, per aconseguir la precisió, és fonamental obtenir dades de parla de parlants nadius en diversos perfils demogràfics. Un cop recollides les dades, cal transcriure els fitxers de veu per entrenar els algorismes de PNL del producte. Fer-ho per a diversos idiomes i amb els volums de dades que es necessiten per ser efectius és extremadament difícil per a les empreses de fer-ho pel seu compte, sobretot si no tenen l'experiència interna en aquest camp.

Aquests són només dos exemples dels molts reptes que hi ha amb la recollida de dades per a la IA a escala, però com podeu imaginar, la domòtica, els dispositius mòbils i les recopilacions de dades biomètriques també tenen els seus reptes específics.

Quines són les maneres actuals en què LXT obté i anota dades?

A LXT, recollim i anotem dades de manera diferent per a cada client, ja que tots els nostres compromisos s'adapten a les especificacions dels nostres clients. Treballem amb diferents tipus de dades, com ara àudio, imatge, veu, text i vídeo. Per a la recollida de dades, treballem amb una xarxa global de contractistes per recollir dades en aquestes diferents modalitats. Les col·leccions poden anar des de l'adquisició de dades en entorns del món real, com ara cases, oficines o en cotxe, fins a l'estudi amb enginyers experimentats en el cas de determinats projectes de recollida de dades de parla.

Les nostres capacitats d'anotació de dades també abasten diverses modalitats. La nostra experiència va començar a l'espai de parla i durant els últims 12 anys ens hem expandit a més de 115 països i més de 750 idiomes locals. Això significa que les empreses de totes les mides poden dependre de LXT per ajudar-les a penetrar en una àmplia gamma de mercats i captar nous segments de clients. Més recentment, ens hem ampliat a dades de text, imatge i vídeo, i la nostra plataforma interna s'utilitza per oferir dades d'alta qualitat als nostres clients.

Una altra àrea de creixement emocionant per a nosaltres ha estat amb el nostre treball d'anotació segura. Aquest mateix any hem ampliat la nostra empremta d'instal·lacions segures ISO 27001 de dues a cinc ubicacions a tot el món. Ara hem desenvolupat un llibre de jugades que ens permet establir noves instal·lacions en qüestió de mesos. Els serveis en què ens centrem en aquestes instal·lacions segures són actualment l'anotació i la transcripció de dades de veu, però es poden utilitzar per a anotacions en molts tipus de dades.

Per què l'obtenció de dades d'aquesta manera és una alternativa superior a les dades sintètiques?

Les dades sintètiques són un desenvolupament apassionant en el camp de la IA i s'adapten molt bé a casos d'ús específics, especialment als casos extrems que són difícils de capturar al món real. L'ús de dades sintètiques està en augment, sobretot en les primeres etapes de maduresa de la IA, ja que les empreses encara es troben en mode d'experimentació. Tanmateix, la nostra investigació mostra que a mesura que les organitzacions maduren les seves estratègies d'IA i impulsen més models a la producció, és molt més probable que utilitzin mètodes d'aprenentatge automàtic supervisat o semisupervisat que es basen en dades anotades per humans.

Els humans són simplement millors que els ordinadors a l'hora d'entendre els matisos per crear les dades necessàries per entrenar els models de ML perquè funcionin amb una alta precisió, i la supervisió humana també és fonamental per reduir el biaix.

Per què aquestes dades són tan importants per al processament de la parla i del llenguatge natural?

Perquè els algorismes de processament de la parla i el llenguatge natural funcionin amb eficàcia als mercats previstos, han d'estar entrenats amb grans volums de dades procedents de parlants nadius que tinguin el context cultural dels usuaris finals que representen. Sense aquestes dades, l'adopció de la IA de veu tindrà greus limitacions.

A més, s'ha de tenir en compte l'entorn quan es recullen dades de parla. Si la solució d'IA de veu que s'està entrenant s'utilitzarà en un cotxe, per exemple, hi ha diferents condicions meteorològiques i de carreteres que afecten la parla i s'han de tenir en compte. Són escenaris complexos on un soci de dades experimentat pot ajudar.

Hi ha alguna cosa més que t'agradaria compartir sobre LXT?

En primer lloc, vull donar-vos les gràcies per l'oportunitat de compartir la nostra història! M'agradaria destacar que la nostra empresa està compromesa a ajudar les organitzacions de totes les mides a tenir èxit amb les seves iniciatives d'IA. Fa més de 12 anys que ens hem centrat a oferir dades d'IA altament personalitzades a empreses de tot el món i estarem encantats de connectar-nos amb qualsevol persona que vulgui crear una canalització de dades fiable per donar suport als seus projectes d'IA.

Gràcies per la gran entrevista, els lectors que vulguin aprendre més haurien de visitar LXT

Soci fundador de unit.AI i membre de la Consell Tecnològic de Forbes, Antoine és un futurista apassionat pel futur de la IA i la robòtica.

També és el fundador de Securities.io, un lloc web que se centra a invertir en tecnologia disruptiva.