Entretiens
Phil Hall, Directeur du développement chez LXT – Série d’entretiens

Le directeur du développement de LXT, Phil Hall, est un ancien dirigeant d’Appen et membre du Forbes Technology Council. Dans son rôle de direction chez Appen, il a dirigé une division de plus de 1 000 employés et a joué un rôle clé dans la réalisation de 17 années consécutives de croissance des revenus avec une rentabilité constamment forte. Dans son rôle actuel chez LXT, il travaille avec une équipe d’experts sélectionnés pour atteindre des objectifs de croissance ambitieux.
LXT est un leader émergent dans les données de formation d’IA pour alimenter les technologies intelligentes pour les organisations mondiales, y compris les plus grandes entreprises technologiques du monde. En partenariat avec un réseau international de contributeurs, LXT collecte et annoté des données sur plusieurs modalités avec la vitesse, l’échelle et l’agilité requises par l’entreprise. Ils ont une expertise mondiale qui s’étend à plus de 115 pays et 750 localisations linguistiques. Fondée en 2010, LXT a son siège social à Toronto, au Canada, avec des bureaux aux États-Unis, en Australie, en Égypte, au Royaume-Uni et en Turquie. L’entreprise sert des clients en Amérique du Nord, en Europe, en Asie-Pacifique et au Moyen-Orient.
Quand avez-vous découvert pour la première fois que vous étiez passionné par la langue ?
Je me suis intéressé à la langue depuis que je me souviens, mais en termes de mon engagement direct avec la langue et la linguistique, il y a eu un seul point de repère important pour moi. Nous avons réalisé très tôt que l’un de nos enfants était dyslexique, et lorsque nous avons parlé à son école à propos d’un soutien supplémentaire, ils ont dit qu’il y avait des programmes auxquels ils pouvaient accéder, mais qu’il y avait également des choses que je pouvais faire en tant que bénévole à l’école pour aider notre fille et d’autres enfants. Cela s’est bien passé, et à partir de là, j’ai poursuivi des études de linguistique et me suis retrouvé à enseigner dans deux universités ici à Sydney.
Vous enseigniez la linguistique avant de passer à l’espace des données de parole, qu’est-ce qui vous a inspiré à changer de direction ?
Appen, basé à Sydney, passait juste d’une opération gérée à partir d’une pièce de maison à une opération commerciale à part entière. On m’a dit qu’ils cherchaient des linguistes (peut-être plus précisément, un linguiste !) et j’ai été présenté aux fondateurs Julie et Chris Vonwiller. La transition a été progressive et s’est étalée sur environ deux ans. J’étais réticent à abandonner l’enseignement – travailler avec des étudiants de haut niveau était à la fois inspirant et amusant. Mais surtout pendant ces années de pionnier, je résolvais des problèmes difficiles aux côtés des principaux experts mondiaux en technologie linguistique, et les niveaux d’excitation étaient élevés. Beaucoup de choses qui sont considérées comme acquises aujourd’hui étaient très difficiles à l’époque.
Vous êtes sorti de la retraite pour rejoindre LXT. Qu’est-ce qui vous a motivé à le faire ?
C’est une question intéressante, car j’appréciais vraiment ma retraite. En fait, notre co-fondateur et PDG Mohammad Omar m’a abordé des mois avant que je réponde à sa première demande, car j’avais une vie relaxante et n’avais pas vraiment songé à revenir au travail à plein temps. Après avoir accepté de prendre le premier appel où Mo m’a demandé si je voulais rejoindre LXT, je m’attendais à simplement écouter poliment et à refuser.
Mais finalement, l’opportunité était simplement trop bonne pour être refusée.
Alors que je parlais avec Mohammad et les autres membres de l’équipe LXT, j’ai immédiatement reconnu une passion partagée pour la langue. L’équipe que Mohammad avait rassemblée était composée de penseurs créatifs avec une énergie sans limite qui étaient pleinement engagés dans la mission de l’entreprise.
Alors que j’en apprenais davantage sur l’opportunité avec LXT, j’ai réalisé que c’était une occasion que je ne voulais pas laisser passer. Voici une entreprise avec un potentiel massif pour s’étendre et grandir dans un domaine que j’apprécie. Et alors que le marché de l’IA continue de croître de manière exponentielle, l’opportunité d’aider davantage d’organisations à passer de l’expérimentation à la production est une perspective excitante dont je suis heureux de faire partie.
Quels sont les défis actuels de l’acquisition de données à grande échelle ?
Les défis sont aussi variés que les applications qui les alimentent.
D’un point de vue pratique, les défis incluent l’authenticité, la fiabilité, l’exactitude, la sécurité et la garantie que les données sont adaptées à leur objectif – et cela sans tenir compte du nombre croissant de défis juridiques et éthiques inhérents à l’acquisition de données.
Par exemple, le développement de la technologie pour soutenir les véhicules autonomes nécessite la collecte de volumes extrêmement importants de données sur une multitude de scénarios afin que la voiture puisse comprendre comment réagir à des situations du monde réel. Il y a un nombre infini de cas de bord que l’on peut rencontrer en conduisant, donc les algorithmes qui alimentent ces véhicules ont besoin de jeux de données qui couvrent tout, des rues aux panneaux stop, en passant par les objets qui tombent. Et puis si vous multipliez cela par le nombre d’événements météorologiques qui peuvent survenir, le volume de données de formation nécessaires augmente de manière exponentielle. Les entreprises du secteur automobile qui entrent dans l’espace autonome doivent établir un pipeline de données fiable, et le faire seules prendrait une quantité massive de ressources.
Un autre cas d’utilisation est l’expansion d’un produit de reconnaissance vocale existant vers de nouveaux marchés pour capter des parts de marché et de nouveaux clients. Cela nécessite inévitablement des données linguistiques, et pour atteindre une précision, il est essentiel de trouver des données de parole provenant de locuteurs natifs issus de divers profils démographiques. Une fois les données collectées, les fichiers audio doivent être transcrits pour former les algorithmes NLP du produit. Faire cela pour plusieurs langues et à des volumes de données nécessaires pour être efficace est extrêmement difficile pour les entreprises qui le font seules, en particulier si elles manquent d’expertise interne dans ce domaine.
Ce ne sont que deux exemples des nombreux défis qui existent avec la collecte de données pour l’IA à grande échelle, mais comme vous pouvez l’imaginer, l’automatisation de la maison, les appareils mobiles et la collecte de données biométriques ont chacun leurs propres défis spécifiques.
Quelles sont les méthodes actuelles de LXT pour sourcer et annoter des données ?
Chez LXT, nous collectons et annotons des données différemment pour chaque client, car tous nos engagements sont adaptés pour répondre aux spécifications de nos clients. Nous travaillons sur une variété de types de données, notamment l’audio, l’image, la parole, le texte et la vidéo. Pour les collections de données, nous travaillons avec un réseau mondial de contractants pour collecter des données dans ces différentes modalités. Les collections peuvent aller de l’acquisition de données dans des environnements du monde réel, tels que les maisons, les bureaux ou les voitures, à des studios avec des ingénieurs expérimentés dans le cas de certains projets de collecte de données de parole.
Nos capacités d’annotation de données s’étendent également à plusieurs modalités. Notre expérience a commencé dans l’espace de la parole et, au cours des 12 dernières années, nous nous sommes étendus à plus de 115 pays et plus de 750 localisations linguistiques. Cela signifie que les entreprises de toutes tailles peuvent compter sur LXT pour les aider à pénétrer un large éventail de marchés et à capter de nouveaux segments de clients. Plus récemment, nous nous sommes étendus à des données de texte, d’image et de vidéo, et notre plateforme interne est utilisée pour fournir des données de haute qualité à nos clients.
Un autre domaine d’expansion passionnant pour nous a été notre travail d’annotation sécurisé. Juste cette année, nous avons étendu notre empreinte d’installations sécurisées ISO 27001 de deux à cinq emplacements dans le monde. Nous avons maintenant développé un livre de jeu qui nous permet d’établir de nouvelles installations en quelques mois. Les services que nous proposons dans ces installations sécurisées sont actuellement l’annotation et la transcription de données de parole, mais elles peuvent être utilisées pour l’annotation de nombreux types de données.
Pourquoi la source de données de cette manière est-elle une alternative supérieure aux données synthétiques ?
Les données synthétiques sont un développement passionnant dans le domaine de l’IA et sont bien adaptées à des cas d’utilisation spécifiques, en particulier les cas de bord difficiles à capturer dans le monde réel. L’utilisation de données synthétiques est en augmentation, en particulier dans les premières étapes de la maturité de l’IA, car les entreprises sont encore en mode expérimental. Cependant, nos propres recherches montrent qu’à mesure que les organisations mûrissent leurs stratégies d’IA et déploient davantage de modèles en production, elles sont beaucoup plus susceptibles d’utiliser des méthodes d’apprentissage automatique supervisées ou semi-supervisées qui reposent sur des données annotées par l’homme.
Les humains sont simplement meilleurs que les ordinateurs pour comprendre les nuances pour créer les données nécessaires pour former les modèles ML à performer avec une grande précision, et la supervision humaine est également cruciale pour réduire les préjugés.
Pourquoi ces données sont-elles si importantes pour la parole et le traitement automatique des langues naturelles ?
Pour que les algorithmes de parole et de traitement automatique des langues naturelles fonctionnent efficacement sur leurs marchés ciblés, ils doivent être formés avec de grands volumes de données provenant de locuteurs natifs qui ont le contexte culturel des utilisateurs finals qu’ils représentent. Sans ces données, l’adoption de la voix IA aura des limites graves.
En outre, l’environnement doit être pris en compte lors de la collecte de données de parole. Si la solution d’IA vocale en formation sera utilisée dans une voiture, par exemple, il y a différentes conditions routières et météorologiques qui affectent la parole et doivent être prises en compte. Ce sont des scénarios complexes où un partenaire de données expérimenté peut aider.
Y a-t-il autre chose que vous aimeriez partager sur LXT ?
Tout d’abord, je tiens à vous remercier de l’opportunité de partager notre histoire ! Je voudrais souligner que notre entreprise est dédiée à aider les organisations de toutes tailles à réussir leurs initiatives d’IA. Nous nous sommes concentrés sur la fourniture de données d’IA hautement personnalisées aux entreprises du monde entier pendant plus de 12 ans et nous serions ravis de nous connecter avec quiconque cherchant à créer un pipeline de données fiable pour soutenir ses projets d’IA.
Je vous remercie pour cette grande interview, les lecteurs qui souhaitent en savoir plus peuvent visiter LXT.












