Interviews

Carolyn Harvey, directrice des opérations chez LXT – Série d'entretiens

Le kit de préparation mis à jour on 27 février 2024

Carolyn Harvey possède une vaste expérience dans la direction et le développement d'opérations mondiales dans le domaine de pertinence de la recherche classement et annotation pour les données ML. Carolyn est actuellement directrice des opérations (COO) de LXT où elle dirige la division des opérations mondiales de l'entreprise, assurant la livraison cohérente de tous les programmes et projets de données d'IA. Elle se concentre sur des données de haute qualité à grande échelle, en renforçant l'efficacité des programmes à long terme et en s'étendant à un grand nombre de régions du monde.

En tant que COO de LXT, Carolyn met sa riche expérience au service du développement d'une organisation de premier ordre.

Pouvez-vous décrire brièvement ce que fait LXT et votre rôle en tant que COO ?

L’intelligence artificielle repose sur les données pour exister, et LXT est un leader émergent dans la fourniture de données précises et issues de sources éthiques qui alimentent les innovations en matière d’IA. En tant que directeur des opérations, mon rôle est de superviser, diriger et développer nos opérations mondiales grâce à des stratégies, une structure et des processus qui nous permettent de fournir des données d'IA de la plus haute qualité à nos clients. Je m'assure que nous livrons à temps dans un large éventail de cas d'utilisation, de l'IA générative à la pertinence des recherches et aux voitures autonomes, entre autres.

Comment la mission de LXT a-t-elle évolué depuis sa création en 2010 ?

Notre mission est de propulser les technologies du futur grâce à la génération et à l’amélioration de données dans toutes les langues, cultures et modalités. Notre objectif est d’aider les entreprises de toutes tailles à capitaliser sur les incroyables avantages qu’offre l’IA en alimentant leurs modèles avec des données de haute qualité. À mesure que la mission de l'entreprise a évolué, notre gamme de services s'est élargie de la transcription linguistique et de la collecte vocale à une large gamme de solutions, notamment la collecte de données et l'annotation de textes, d'images et de vidéos, les services d'IA générative, et bien plus encore. Nous avons également étendu notre présence mondiale d'installations certifiées ISO 27001 pour répondre aux besoins croissants de nos clients en matière de services de données sécurisés.

Quels ont été les principaux moteurs de sa croissance dans le secteur des données de formation en IA ?

Les investissements continus dans l’IA de la part d’organisations de toutes tailles ont alimenté notre croissance. Les entreprises savent désormais que l’IA est un enjeu majeur pour rester compétitives, et que les données alimentent l’IA. Mais toutes les données ne sont pas égales, et les entreprises qui réussissent dans le domaine de l’IA savent que des données de haute qualité sont essentielles pour créer une IA plus précise.

Désormais, avec l'IA générative dans toutes les têtes, cette tendance a ouvert encore plus d'opportunités de croissance pour LXT. Les humains sont essentiels pour garantir que ces solutions sont précises, éthiques et responsables. Nous proposons une gamme de services d'IA générative dans des domaines tels que le réglage fin de grands modèles de langage, la création d'invites, etc. Nos clients savent que pour instaurer la confiance avec les utilisateurs finaux, les résultats de leurs produits d'IA générative doivent être factuels, représenter un public diversifié et être exempts de langage toxique. Nous pouvons les aider à atteindre ces objectifs grâce à nos services humains en boucle.

Quel est l’impact de l’explosion de l’IA générative sur LXT et ses clients ?

LXT a constaté une demande croissante pour ses données de formation à l'IA en raison de l'IA générative, à la fois pour les données de base orientées langage ainsi que pour les nouveaux aspects liés à l'analyse, à la créativité et à la pensée critique. Nous constatons également une augmentation de la demande de connaissances du domaine et de profils spécialisés pour les travailleurs de projet.

Les demandes des clients vont de plus en plus au-delà du micro-tâches machine learning les entrées du passé vers les LLM et les ensembles de données plus complexes requis par des applications comme ChatGPT, Gemini et les nombreuses ramifications. Nous sommes actuellement impliqués dans plusieurs projets innovants dans lesquels nous rédigeons des invites visant à confondre l'IA générative pour voir comment elle réagit, puis à créer la bonne réponse.

À l’avenir, cela pourrait évoluer vers l’intelligence artificielle générale (AGI), où les ensembles de données seront mappés à des actions encore plus compliquées et sophistiquées.

Vous avez des années d'expérience dans la recherche et la personnalisation pour contribuer à améliorer ces algorithmes. De quelles manières les grandes entreprises améliorent-elles la pertinence de leurs recherches pour offrir une meilleure expérience utilisateur ?

Dans un monde où le temps est précieux et où l'information est partout, l'amélioration de la pertinence des recherches peut renforcer la fidélité, augmenter les taux de conversion et rendre les utilisateurs plus productifs.

La pertinence de la recherche commence par le nettoyage et l'organisation des données de nos clients, en éliminant tout ce qui pourrait générer des faux positifs et en créant des champs de données supplémentaires que les moteurs de recherche et de recommandation peuvent parcourir pour générer des résultats plus précis. Avec l'aide de l'apprentissage automatique et traitement du langage naturel, les clients peuvent permettre à leur moteur de recherche de déterminer de manière plus intuitive l'intention de l'utilisateur et de connaître leurs préférences au fil du temps. Le résultat est une expérience de recherche plus rapide qui conduit à des résultats plus personnalisés.

Atteindre cet objectif nécessite de grands volumes de données de formation, avec un accent particulier sur les algorithmes de formation sur la manière de reconnaître, classer et renvoyer les entités pertinentes, et sur la manière de gérer les fautes de frappe, les erreurs grammaticales et autres anomalies de données. Nous recommandons également une approche de renforcement Human-in-the-loop (HITL) pour garantir des données précises, réduire les biais et offrir une meilleure expérience de recherche à l'utilisateur final. Avec les progrès du ML au cours des 10 dernières années, HITL se concentre davantage sur les processus d'examen de la qualité, ce qui nécessite une expérience plus approfondie de la part des fournisseurs de données.

Pouvez-vous nous expliquer l'approche de LXT en matière d'annotation des données et la manière dont elle garantit la qualité et l'exactitude des données d'entraînement de l'IA ?

En tant qu'équipe opérationnelle, nous devons d'abord comprendre comment les clients utilisent les données que nous fournissons dans le développement de leurs produits et services afin de garantir qu'elles répondent à leurs besoins. Pour y parvenir, nous devons trouver des experts en gestion de projet et en annotation qui ont de l'expérience avec le type de données requis.

À partir de là, il s’agit en grande partie de préparation et de trouver les bonnes ressources au début de chaque projet. Cela comprend l'alignement avec les clients sur les facteurs de réussite pendant la phase de cadrage ainsi que des processus approfondis de qualification et de contrôle pour les annotateurs de projet qui prennent en compte des détails importants tels que la formation, les intérêts particuliers, les données démographiques et l'expérience. Nous développons également du matériel d’apprentissage et de référence détaillé sous forme de guide, personnalisé pour chaque projet. Nous appliquons une surveillance approfondie de la qualité et de la gestion des processus tout au long du cycle de vie du projet. L'approche que nous utilisons s'aligne et éclaire les meilleures pratiques de l'industrie, garantissant que les résultats répondent aux attentes des clients.

Et toutes ces méthodologies sont au service de notre promesse de garantie de qualité des données.

Comment LXT gère-t-il le défi de l'annotation données non structurées, qui représente plus de 80 % de toutes les données ?

LXT a construit une plate-forme d'annotation interne qui automatise de nombreuses parties du processus d'annotation et fournit une structure et une interface utilisateur cohérente pour les travailleurs. Lors de la phase de pré-traitement, nous nous concentrons, entre autres, sur la préparation des données, le formatage des fichiers d'entrée et la suppression des doublons, et lors du post-traitement, nous nous occupons du conditionnement des données, de la collecte et du formatage pour la livraison au client.

Avant le lancement du projet, nous créons des lignes directrices qui sont examinées avec le client et réitérées tout au long du cycle de vie du projet, à mesure que les choses évoluent. Nous pouvons diviser le processus d'étiquetage des données en plusieurs tâches pour nous concentrer correctement sur chaque élément du projet. De plus, des méthodologies de contrôle qualité sont mises en œuvre pour éliminer les erreurs à grande échelle.

Enfin, notre équipe d'excellence opérationnelle est responsable de la gestion avancée des processus afin de garantir une efficacité et une évolutivité élevées pour nos projets dans le monde entier.

Quels sont les plus grands défis auxquels LXT est confronté dans la collecte de données à grande échelle à l’échelle mondiale, et comment les surmontez-vous ?

La diversité et les préjugés parmi les participants et dans les collectes de données qui en résultent font souvent partie des plus grands défis auxquels LXT et tout fournisseur de données de formation en IA seront confrontés. D’autres défis incluent une demande récente d’expertise dans le domaine et un paysage en évolution rapide avec le passage aux LLM et aux données d’IA générative.

Nous surmontons ces défis grâce à une approche très proactive de recherche de notre vivier de candidats, où nous examinons l'expertise, l'expérience, les rôles antérieurs, les intérêts et les données démographiques pour former la bonne diversité parmi les équipes par sexe ou d'autres aspects, tels que la pensée analytique ou l'écriture créative. formations, entre autres.

Une fois que nous avons trouvé les bons candidats, nous prenons grand soin d’embaucher régulièrement des travailleurs afin de constituer une main-d’œuvre plus expérimentée, plus fidèle et plus satisfaite sur le long terme.

En termes d’évaluation de l’IA, comment LXT agit-il pour atténuer les préjugés et garantir des résultats éthiques dans les systèmes d’IA qu’il aide à former ?

Comme mentionné précédemment, garantir la diversité est un défi que de nombreux fournisseurs de données de formation en IA doivent relever, et cela contribuera grandement à atténuer les préjugés et à garantir des résultats éthiques.

Je ferai à nouveau référence à nos meilleures pratiques en matière d'engagement, qui incluent la recherche d'annotateurs diversifiés et représentatifs et la rigueur des lignes directrices et des mesures de contrôle qualité. Nous avons une stratégie de recherche d'impact qui nous permet d'apporter du travail à des groupes divers et nouveaux d'annotateurs, comme dans les régions linguistiques à longue traîne.

Nous ciblons des résultats éthiques en utilisant les meilleures pratiques de l'industrie, en nous alignant sur les attentes de nos clients et en imposant des normes plus élevées pour nos chefs de projet et nos annotateurs. La communication est essentielle, tout comme les audits de conformité, l'analyse des biais et l'engagement envers la réglementation des données et les exigences en matière de confidentialité.

Quelle est la vision à long terme de LXT et comment voyez-vous l’évolution de l’entreprise au cours des cinq prochaines années ?

Notre vision est de fournir des données précises et issues de sources éthiques pour contribuer au déploiement de l’IA et des technologies du futur qui amélioreront l’expérience des personnes du monde entier.

Si l’automatisation et la technologie sont importantes dans l’IA, il existe également une composante humaine importante qui complète la technologie. Alors que nous passons de simples tâches automatisées à de grands modèles de langage (LLM) et de l'IA générative à l'intelligence artificielle générale (GAI), il sera essentiel que les produits d'IA représentent fidèlement les personnes, à la fois celles qui génèrent les données et nos communautés mondiales. grand.

Chez LXT, nous nous efforçons de garantir que l’IA soit utilisée d’une manière positive et transformatrice qui reflète ces valeurs.

Merci pour cette excellente interview, les lecteurs qui souhaitent en savoir plus devraient visiter LXT.

Rubriques connexes:Interview LXT

Ne manquez pas

Yury Rudnitski, chef de produit de l'application ChatOn (groupe AIBY) – Série d'interviews

Antoine Tardif

Partenaire fondateur d'unite.AI et membre du Conseil technologique de Forbes, Antoine est un futuriste qui est passionné par l'avenir de l'IA et de la robotique.

Il est également le fondateur de Titres.io, un site Web axé sur l'investissement dans les technologies de rupture.

Unite.AI

Carolyn Harvey, directrice des opérations chez LXT – Série d'entretiens

Interviews

Carolyn Harvey, directrice des opérations chez LXT – Série d'entretiens

Table des matières

Derniers Articles

Unite.AI

Carolyn Harvey, directrice des opérations chez LXT – Série d'entretiens

Table des matières

Tu peux aimer

Derniers Articles