Entretiens
Carolyn Harvey, Directrice des OpĂ©rations chez LXT – SĂ©rie d’entretiens

Carolyn Harvey a une expérience étendue dans la direction et la croissance d’opérations mondiales dans le domaine du classement de pertinence de recherche et d’annotation pour les données ML. Carolyn est actuellement Directrice des Opérations (COO) de LXT où elle dirige la division des opérations mondiales de l’entreprise, assurant une livraison cohérente de tous les programmes et projets de données d’IA. Elle se concentre sur des données de haute qualité à grande échelle, en construisant des efficacités dans les programmes à long terme et en élargissant à un grand nombre de lieux mondiaux.
En tant que COO de LXT, Carolyn apporte son expérience considérable pour développer une organisation de classe mondiale.
Pouvez-vous décrire brièvement ce que fait LXT et votre rôle en tant que COO ?
L’intelligence artificielle repose sur les données pour exister, et LXT est un leader émergent dans la livraison de données précises, éthiquement sourcées, qui alimentent les innovations de l’IA. En tant que Directrice des Opérations, mon rôle est de superviser, de diriger et d’élargir nos opérations mondiales grâce à des stratégies, une structure et des processus qui nous permettent de livrer les données d’IA de la plus haute qualité à nos clients. Je m’assure que nous livrons à temps sur une large gamme de cas d’utilisation, de l’IA générative à la pertinence de recherche et aux voitures autonomes, entre autres.
Comment la mission de LXT a-t-elle évolué depuis sa création en 2010 ?
Notre mission est de faire fonctionner les technologies de l’avenir grâce à la génération et à l’amélioration des données dans toutes les langues, cultures et modalités. Notre objectif est d’aider les entreprises de toutes tailles à tirer parti des avantages incroyables que l’IA offre en alimentant leurs modèles avec des données de haute qualité. Au fur et à mesure que la mission de l’entreprise a évolué, notre gamme de services s’est élargie de la transcription de langage et de la collecte de discours à inclure une large gamme de solutions, notamment la collecte et l’annotation de données pour le texte, l’image et la vidéo, les services d’IA générative, et plus encore. Nous avons également élargi notre empreinte mondiale de sites certifiés ISO 27001 pour répondre aux besoins croissants de nos clients en matière de services de données sécurisés.
Quels ont été les principaux moteurs de sa croissance dans le secteur des données de formation d’IA ?
Les investissements continus dans l’IA de la part des organisations de toutes tailles ont alimenté notre croissance. Les entreprises savent maintenant que l’IA est essentielle pour rester compétitives, et les données alimentent l’IA. Mais toutes les données ne sont pas égales, et les entreprises qui réussissent dans l’IA savent que des données de haute qualité sont cruciales pour créer une IA plus précise.
Avec l’IA générative à l’esprit de tous, cette tendance a ouvert encore plus d’opportunités de croissance pour LXT. Les humains sont essentiels pour garantir que ces solutions sont précises, éthiques et responsables. Nous proposons une gamme de services d’IA générative dans des domaines tels que l’affinage de grands modèles de langage, la création de invites et plus encore. Nos clients savent que pour établir la confiance avec les utilisateurs finals, la sortie de leurs produits d’IA générative doit être factuelle, représenter un public diversifié et être exempte de langage toxique. Nous pouvons les aider à atteindre ces objectifs avec nos services avec un humain dans la boucle.
Comment l’explosion de l’IA générative a-t-elle impacté LXT et ses clients ?
LXT a vu une demande croissante pour ses données de formation d’IA en raison de l’IA générative, à la fois pour les données axées sur le langage et les aspects plus récents liés à l’analyse, à la créativité et à la pensée critique. Nous voyons également une augmentation de la demande pour des connaissances de domaine et des profils spécialisés pour les travailleurs de projet.
Les demandes des clients s’éloignent de plus en plus des tâches de micro-apprentissage des machines du passé vers les LLM, et les ensembles de données plus complexes nécessaires aux applications telles que ChatGPT, Gemini et les nombreuses ramifications. Nous sommes actuellement impliqués dans plusieurs projets innovants où nous écrivons des invites visant à confondre l’IA générative pour voir comment elle réagit, puis créons la bonne réponse.
À l’avenir, cela pourrait évoluer encore vers l’intelligence artificielle générale (IAG) où les ensembles de données correspondront à des actions encore plus complexes et sophistiquées.
Avec des années d’expérience dans la recherche et la personnalisation pour améliorer ces algorithmes, quels sont certains des moyens dont les entreprises leaders améliorent la pertinence de leur recherche pour offrir une meilleure expérience utilisateur ?
Dans un monde où le temps est précieux et l’information est partout, améliorer la pertinence de la recherche peut renforcer la loyauté, augmenter les taux de conversion et rendre les utilisateurs plus productifs.
La pertinence de la recherche commence par le nettoyage et l’organisation des données de nos clients, en éliminant tout ce qui pourrait générer de faux positifs, et en créant des champs de données supplémentaires que les moteurs de recherche et de recommandation peuvent parcourir pour générer des résultats plus précis. Avec l’aide de l’apprentissage automatique et du traitement du langage naturel, les clients peuvent habiliter leur moteur de recherche à mieux comprendre intuitivement l’intention de l’utilisateur et à apprendre à connaître leurs préférences au fil du temps. Le résultat est une expérience de recherche plus rapide qui conduit à des résultats plus personnalisés.
Atteindre cet objectif nécessite de grands volumes de données de formation, avec un accent particulier sur la formation des algorithmes pour qu’ils apprennent à reconnaître, à classer et à renvoyer des entités pertinentes, et à gérer les fautes de frappe, les erreurs grammaticales et autres anomalies de données. Nous recommandons également une approche de renforcement avec un humain dans la boucle (HITL) pour garantir des données précises, réduire les préjugés et offrir une meilleure expérience de recherche pour l’utilisateur final. Avec les progrès de l’apprentissage automatique au cours des 10 dernières années, HITL a mis l’accent sur les processus de révision de la qualité qui entraînent un besoin de plus d’expérience de la part des fournisseurs de données.
Pouvez-vous élaborer sur l’approche de LXT en matière d’annotation de données et sur la manière dont elle garantit la qualité et la précision des données de formation d’IA ?
En tant qu’équipe d’opérations, nous devons d’abord comprendre comment les clients utilisent les données que nous fournissons dans le développement de leurs produits et services pour nous assurer qu’elles répondent à leurs besoins. Pour que cela se produise, nous devons trouver des experts en gestion de projet et en annotation qui ont de l’expérience avec le type de données requis.
À partir de là, il s’agit essentiellement de préparation et de trouver les bonnes ressources au début de chaque projet. Cela inclut l’alignement avec les clients sur les facteurs de réussite pendant la phase de planification, ainsi que des processus de qualification et de vérification approfondis pour les annotateurs de projet qui prennent en compte des détails importants tels que les antécédents scolaires, les intérêts spéciaux, les caractéristiques démographiques et l’expérience. Nous élaborons également des documents d’apprentissage et de référence détaillés en tant que guide, personnalisés pour chaque projet. Nous appliquons une supervision mature de la gestion de la qualité et des processus tout au long de tous les cycles de vie des projets. L’approche que nous utilisons correspond aux meilleures pratiques de l’industrie et garantit que les résultats répondent aux attentes des clients.
Et toutes ces méthodes sont au service de notre promesse de qualité de données garantie.
Comment LXT gère-t-elle le défi de l’annotation des données non structurées, qui représentent plus de 80 % de toutes les données ?
LXT a construit une plate-forme d’annotation interne qui automatise de nombreuses parties du processus d’annotation et fournit une structure et une interface utilisateur cohérente pour les travailleurs. Dans la phase de prétraitement, nous nous concentrons sur la préparation des données, la mise en forme des fichiers d’entrée et la suppression des doublons, entre autres choses, et dans la phase de post-traitement, nous nous occupons de l’emballage des données, de la collecte et de la mise en forme pour la livraison au client.
Avant le lancement du projet, nous créons des directives qui sont examinées avec le client et itérées tout au long du cycle de vie du projet à mesure que les choses changent. Nous pouvons diviser le processus d’étiquetage des données en plusieurs tâches pour nous concentrer sur chaque élément du projet de manière appropriée. En outre, des méthodologies de contrôle de la qualité sont mises en œuvre pour éliminer les erreurs à grande échelle.
Enfin, notre équipe d’Excellence opérationnelle est responsable de la gestion avancée des processus pour garantir une grande efficacité et une scalabilité pour nos projets dans le monde entier.
Quels sont certains des plus grands défis auxquels LXT est confrontée pour collecter des données à grande échelle dans le monde, et comment les surmontez-vous ?
La diversité et les préjugés dans les participants et dans les collections de données sont souvent certains des plus grands défis auxquels LXT, et tout fournisseur de données de formation d’IA, seront confrontés. D’autres défis incluent une demande récente pour l’expertise de domaine et un paysage en constante évolution avec le passage à l’IA générative et aux données d’IA.
Nous surmontons ces défis grâce à une approche très proactive pour trouver notre bassin de candidats, où nous examinons l’expertise, l’expérience, les rôles précédents, les intérêts et les caractéristiques démographiques pour former la bonne diversité parmi les équipes, qu’il s’agisse de pensée analytique ou d’écriture créative, d’antécédents scolaires, entre autres.
Une fois que nous avons trouvé les bons candidats, nous prenons grand soin de nous engager régulièrement avec les travailleurs pour construire une main-d’œuvre plus expérimentée, loyale et satisfaite à long terme.
En termes d’évaluation de l’IA, comment LXT travaille-t-elle pour atténuer les préjugés et garantir des sorties éthiques dans les systèmes d’IA qu’elle aide à former ?
Comme mentionné précédemment, garantir la diversité est un défi que de nombreux fournisseurs de données de formation d’IA doivent résoudre, et cela ira loin pour atténuer les préjugés et garantir des sorties éthiques.
Je me référerai à nouveau à nos meilleures pratiques d’engagement qui incluent la recherche d’annotateurs divers et représentatifs et l’attention aux directives et aux mesures de contrôle de la qualité. Nous avons une stratégie d’approvisionnement d’impact qui nous permet d’apporter du travail à des groupes divers et nouveaux d’annotateurs, tels que dans les régions de langues de queue.
Nous visons des sorties éthiques grâce à l’utilisation des meilleures pratiques de l’industrie, à l’alignement sur les attentes avec nos clients et à la promotion de normes plus élevées pour nos gestionnaires de projet et nos annotateurs. La communication est essentielle, ainsi que les audits de conformité, l’analyse des préjugés et un engagement en faveur des exigences de réglementation et de confidentialité des données.
Quelle est la vision à long terme pour LXT et comment voyez-vous l’évolution de l’entreprise au cours des cinq prochaines années ?
Notre vision est de fournir des données précises, éthiquement sourcées, pour aider à déployer l’IA et les technologies de l’avenir qui amélioreront et amélioreront l’expérience des personnes dans le monde entier.
Alors que l’automatisation et la technologie sont importantes dans l’IA, il y a également un composant humain important qui complète la technologie. À mesure que nous passons des tâches automatisées simples aux grands modèles de langage (LLM), et de l’IA générative à l’intelligence artificielle générale (IAG), il sera essentiel que les produits d’IA représentent fidèlement les personnes, à la fois celles qui génèrent les données et nos communautés mondiales dans leur ensemble.
Chez LXT, nous nous efforçons de garantir que l’IA est utilisée d’une manière positive et transformatrice qui reflète ces valeurs.
Je vous remercie pour cette grande interview, les lecteurs qui souhaitent en savoir plus peuvent visiter LXT.












