taló Carolyn Harvey, directora d'operacions de LXT - Sèrie d'entrevistes - Unite.AI
Connecteu-vos amb nosaltres

entrevistes

Carolyn Harvey, directora d'operacions de LXT – Sèrie d'entrevistes

mm
actualitzat on

Carolyn Harvey té una àmplia experiència liderant i creixent operacions globals en el camp de rellevància de la cerca classificació i anotació de dades de ML. Carolyn és actualment la directora d'operacions (COO) de LXT on dirigeix ​​la divisió d'operacions globals de l'empresa, assegurant el lliurament coherent de tots els programes i projectes de dades d'IA. Se centra en dades d'alta qualitat a escala, generant eficiències en programes a llarg termini i escalant un gran nombre de localitzacions globals.

Com a COO de LXT, Carolyn aporta la seva gran experiència per desenvolupar una organització de la millor qualitat.

Pots descriure breument què fa LXT i el teu paper com a COO?

La intel·ligència artificial depèn de l'existència de les dades, i LXT és un líder emergent en el lliurament de dades precises i d'origen ètic que impulsen les innovacions en IA. Com a director d'operacions, la meva funció és supervisar, liderar i ampliar les nostres operacions globals mitjançant estratègies, estructura i processos que ens permetin oferir als nostres clients dades d'IA de la més alta qualitat. Asseguro que entreguem a temps en una àmplia gamma de casos d'ús, des de la IA generativa fins a la rellevància de la cerca i els cotxes autònoms, entre molts altres.

Com ha evolucionat la missió de LXT des dels seus inicis el 2010? 

La nostra missió és impulsar les tecnologies del futur mitjançant la generació i millora de dades en tots els idiomes, cultures i modalitats. El nostre objectiu és ajudar les empreses de totes les mides a aprofitar els increïbles avantatges que ofereix la IA potenciant els seus models amb dades d'alta qualitat. A mesura que la missió de l'empresa ha anat evolucionant, el nostre abast de serveis s'ha ampliat des de la transcripció lingüística i la recollida de veu per incloure una àmplia gamma de solucions, inclosa la recollida de dades i l'anotació de text, imatge i vídeo, serveis d'IA generativa i molt més. També hem ampliat la nostra empremta global d'instal·lacions amb certificació ISO 27001 per satisfer les creixents necessitats dels nostres clients de serveis de dades segurs.

Quins han estat els factors clau del seu creixement en el sector de dades de formació en IA?

La inversió contínua en IA d'organitzacions de totes les mides ha impulsat el nostre creixement. Les empreses ara saben que la intel·ligència artificial és un objectiu per continuar sent competitives i les dades impulsen la intel·ligència artificial. Però no totes les dades són iguals, i les empreses que tenen èxit en IA saben que les dades d'alta qualitat són fonamentals per crear una IA més precisa.

Ara amb la IA generativa a la ment de tothom, aquesta tendència ha obert encara més oportunitats de creixement per a LXT. Els humans són fonamentals per garantir que aquestes solucions siguin precises, ètiques i responsables. Oferim una gamma de serveis d'IA generativa en àrees com ara l'ajustament de grans models de llenguatge, la creació ràpida i molt més. Els nostres clients saben que per generar confiança amb els usuaris finals, el resultat dels seus productes d'IA generativa ha de ser real, representar un públic divers i estar lliure de llenguatge tòxic. Els podem ajudar a assolir aquests objectius amb els nostres serveis humans in the loop.

Com ha afectat LXT i els seus clients l'explosió de la IA generativa?

LXT ha vist una demanda creixent de les seves dades d'entrenament en IA a causa de la IA generativa, tant per a dades bàsiques orientades al llenguatge com per aspectes més nous relacionats amb l'anàlisi, la creativitat i el pensament crític. També estem observant un augment de la demanda de coneixements de domini i perfils especialitzats per als treballadors del projecte.

Les sol·licituds dels clients van més enllà de les entrades d'aprenentatge automàtic de micro tasques del passat cap als LLM i els conjunts de dades més complexos que requereixen aplicacions com ChatGPT, Gemini i les nombroses branques. Actualment estem involucrats en diversos projectes innovadors on estem escrivint indicacions destinades a confondre la IA generativa per veure com respon, i després crear la resposta correcta.

En el futur, això pot evolucionar encara més cap a la intel·ligència general artificial (AGI) on els conjunts de dades s'assignaran a accions encara més complicades i sofisticades.

Tens anys d'experiència treballant en cerca i personalització per ajudar a millorar aquests algorismes. Quines són algunes de les maneres en què les empreses líders milloren la seva rellevància de cerca per oferir una millor experiència d'usuari?

En un món on el temps és preciós i la informació és a tot arreu, millorar la rellevància de la cerca pot augmentar la fidelitat, augmentar les taxes de conversió i fer que els usuaris siguin més productius.

La rellevància de la cerca comença amb la neteja i l'organització de les dades dels nostres clients, eliminant qualsevol cosa que pugui generar falsos positius i crear camps de dades addicionals a través dels quals els motors de cerca i recomanacions poden buscar per generar resultats més precisos. Amb l'ajuda de l'aprenentatge automàtic i el processament del llenguatge natural, els clients poden habilitar el seu motor de cerca per determinar de manera més intuïtiva la intenció de l'usuari i conèixer les seves preferències al llarg del temps. El resultat és una experiència de cerca més ràpida que condueix a resultats més personalitzats.

Assolir aquest objectiu requereix grans volums de dades d'entrenament, amb un enfocament particular en els algorismes d'entrenament com reconèixer, classificar i retornar les entitats rellevants, i com gestionar errors d'ortografia, errors gramaticals i altres anomalies de dades. També recomanem un enfocament de reforç humà en el bucle (HITL) per garantir dades precises, reduir el biaix i oferir una millor experiència de cerca per a l'usuari final. Amb els avenços de ML durant els darrers 10 anys, HITL s'ha centrat més en els processos de revisió de la qualitat que impulsa la necessitat d'una experiència més profunda dels proveïdors de dades.

Podeu explicar l'enfocament de LXT per a l'anotació de dades i com garanteix la qualitat i la precisió de les dades d'entrenament d'IA?

Com a equip d'operacions, primer hem d'entendre com els clients utilitzen les dades que proporcionem en el desenvolupament dels seus productes i serveis per garantir que s'ajustin a les seves necessitats. Perquè això passi, hem de trobar experts tant en gestió de projectes com en anotació que tinguin experiència amb el tipus de dades requerides.

A partir d'aquí, es tracta en gran mesura de preparar i trobar els recursos adequats a l'inici de cada projecte. Això inclou l'alineació amb els clients sobre els factors d'èxit durant la fase d'abast, així com els processos de qualificació i verificació profunds per als anotadors de projectes que consideren detalls importants com ara els antecedents educatius, els interessos especials, la demografia i l'experiència. També desenvolupem materials detallats d'aprenentatge i de referència com a guia, personalitzats per a cada projecte. Apliquem una supervisió de gestió de processos i qualitat madura durant tots els cicles de vida del projecte. L'enfocament que utilitzem s'alinea amb les millors pràctiques de la indústria i les informa, garantint que els resultats compleixin les expectatives dels clients.

I totes aquestes metodologies estan al servei de la nostra promesa de qualitat de dades garantida.

Com gestiona LXT el repte d'anotar dades no estructurades, que inclou més del 80% de totes les dades?

LXT ha creat una plataforma d'anotació interna que automatitza moltes parts del procés d'anotació i proporciona estructura i una interfície d'usuari coherent per als treballadors. En l'etapa de preprocessament, ens centrem en la preparació de les dades, el format dels fitxers d'entrada i l'eliminació de duplicats, entre d'altres coses, i en el postprocessament, l'empaquetament d'adreces de les dades, la col·lecció i el format per a l'entrega al client.

Abans que comenci el projecte, creem directrius que es revisen amb el client i s'iterin al llarg del cicle de vida del projecte a mesura que les coses canvien. Podem desglossar el procés d'etiquetatge de dades en múltiples tasques per centrar-nos correctament en cada element del projecte. A més, s'implementen metodologies de control de qualitat per impulsar l'eliminació d'errors a escala.

Finalment, el nostre equip d'excel·lència operativa és responsable de la gestió avançada dels processos per garantir una alta eficiència i escalabilitat dels nostres projectes a tot el món.

Quins són alguns dels reptes més importants als quals s'enfronta LXT a l'hora de recopilar dades a escala global i com els supereu?

La diversitat i el biaix en els participants i en les recopilacions de dades resultants són sovint alguns dels reptes més grans als quals s'enfrontaran LXT i qualsevol proveïdor de dades de formació en IA. Altres reptes inclouen una demanda recent d'expertesa en domini i un panorama que canvia ràpidament amb el canvi a LLM i dades generatives d'IA.

Superem aquests reptes mitjançant un enfocament altament proactiu per trobar el nostre grup de candidats, on revisem l'experiència, l'experiència, els rols anteriors, els interessos i la demografia per formar la diversitat adequada entre els equips per gènere o altres aspectes, com ara el pensament analític o l'escriptura creativa. formació, entre d'altres.

Un cop hem trobat els candidats adequats, tenim molta cura de comprometre els treballadors de manera regular per crear una força de treball més experimentada, lleial i satisfeta a llarg termini.

Pel que fa a l'avaluació de la IA, com funciona LXT per mitigar el biaix i garantir resultats ètics en els sistemes d'IA que ajuda a entrenar?

Com s'ha esmentat anteriorment, garantir la diversitat és un repte que molts proveïdors de dades de formació en IA han de resoldre, i això contribuirà en gran mesura a mitigar els biaixos i garantir resultats ètics.

Tornaré a referir-me a les nostres millors pràctiques de participació, que inclouen trobar anotadors diversos i representatius i ser exhaustius amb les directrius i mesures de control de qualitat. Tenim una estratègia d'aprovisionament d'impacte que ens permet aportar feina a grups nous i diversos d'anotadors, com ara regions lingüístiques de cua llarga.

Apuntem a resultats ètics mitjançant l'ús de les millors pràctiques de la indústria, alineant-nos amb les expectatives dels nostres clients i impulsant estàndards més alts per als nostres gestors de projectes i anotadors. La comunicació és essencial, així com les auditories de compliment, l'anàlisi de biaix i el compromís amb la regulació de dades i els requisits de privadesa.

Quina és la visió a llarg termini de LXT i com veu l'evolució de l'empresa en els propers cinc anys?

 La nostra visió és proporcionar dades precises i d'origen ètic per ajudar a impulsar el desplegament de la IA i les tecnologies del futur que milloraran i milloraran l'experiència de les persones d'arreu del món.

Tot i que l'automatització i la tecnologia són importants en IA, també hi ha un component humà important que complementa la tecnologia. A mesura que passem de tasques simples automatitzades a grans models de llenguatge (LLM) i de la IA generativa a la intel·ligència artificial general (GAI), serà fonamental que els productes d'IA representin fidelment a les persones, tant les que generen les dades com les nostres comunitats globals. gran.

A LXT, ens esforcem per garantir que la IA s'utilitzi d'una manera positiva i transformadora que reflecteixi aquests valors.

Gràcies per la gran entrevista, els lectors que vulguin aprendre més haurien de visitar LXT.

Soci fundador de unit.AI i membre de la Consell Tecnològic de Forbes, Antoine és un futurista apassionat pel futur de la IA i la robòtica.

També és el fundador de Securities.io, un lloc web que se centra a invertir en tecnologia disruptiva.