Interviews

Ryan Kolln, PDG d’Appen – Série d’entretiens

Published October 22, 2024

Updated April 3, 2026

Antoine Tardif, CEO & Founder of Unite.AI

Ryan Kolln est le directeur général et directeur général d’Appen. Ryan apporte plus de 20 ans d’expérience mondiale dans la technologie et les télécommunications, ainsi qu’une compréhension approfondie de l’activité d’Appen et de l’industrie de l’IA.

Sa carrière professionnelle a commencé en tant qu’ingénieur, avec un accent sur l’ingénierie des données de réseau mobile en Australie, en Asie et en Amérique du Nord. Après avoir obtenu un MBA de l’Université de New York, Ryan a rejoint The Boston Consulting Group (BCG) en 2011 en tant que consultant en stratégie. Pendant son séjour chez BCG, il s’est spécialisé dans la technologie et les télécommunications et a acquis une expertise approfondie en stratégie sur une variété de sujets de croissance et d’exploitation.

En rejoignant Appen AI en 2018 en tant que VP du développement corporatif, il a dirigé des acquisitions stratégiques comme Figure Eight et Quadrant, et a soutenu la création des divisions Chine et fédérale. Avant sa nomination au poste de PDG, il a occupé le poste de directeur des opérations, supervisant les opérations et la stratégie mondiales.

Avec plus de 20 ans d’expérience dans la technologie et les télécommunications, comment votre parcours professionnel a-t-il façonné votre approche pour diriger Appen à travers le paysage de l’IA en évolution rapide ?

Ma carrière a commencé en tant qu’ingénieur de télécommunications, où mon rôle était de construire et d’optimiser les réseaux et impliquait une énorme quantité de données, d’analyse et de recherche de solutions innovantes pour optimiser les performances du réseau et l’expérience client.

Après avoir obtenu mon MBA à NYU, cela s’est évolué en rôles de leadership dans la stratégie technologique et les fusions et acquisitions, où je me suis concentré sur des questions stratégiques plus larges, telles que les tendances émergentes, les opportunités d’investissement et les modèles économiques. Cette expérience m’a donné une compréhension approfondie des aspects techniques et commerciaux des technologies émergentes.

Chez Appen, nous travaillons à l’intersection de l’IA et des données, et mon expérience m’a permis de diriger l’entreprise et de naviguer dans les complexités de l’espace de l’IA en évolution rapide, en passant par des développements majeurs tels que la reconnaissance vocale, le NLP, les systèmes de recommandation et maintenant l’IA générative. Cette vision stratégique est cruciale alors que l’IA continue de transformer les industries à l’échelle mondiale.

Vous êtes chez Appen depuis 2018, en pilotant des acquisitions majeures comme Figure Eight et Quadrant. Comment ces mouvements stratégiques ont-ils positionné Appen en tant que leader dans les services de données d’IA, et qu’est-ce que vous voyez comme la prochaine grande opportunité pour l’entreprise ?

Les acquisitions de Figure Eight et Quadrant étaient essentielles pour élargir nos capacités de données d’IA, en particulier dans des domaines tels que l’annotation de données et l’intelligence géolocalisée. La plate-forme d’annotation de données de Figure Eight a été particulièrement impactante. La plate-forme est hautement personnalisable, et nous l’avons utilisée pour des travaux dans de nombreux domaines différents. Plus récemment, nous l’avons utilisée pour exécuter la plupart de nos flux de données d’IA générative.

En plus des acquisitions, il y a environ 5 ans, nous avons mis en place une opération en Chine appelée Appen Chine. Nous sommes maintenant la plus grande entreprise de données d’IA en Chine, avec un chiffre d’affaires presque double de celui de nos concurrents les plus proches.

En regardant vers l’avenir, l’accent est mis sur Appen pour soutenir le développement et l’adoption de l’IA générative. Il y a des opportunités de croissance majeures à la fois chez les constructeurs de modèles et les entreprises qui cherchent à adopter l’IA générative dans leurs produits et opérations. Nous pensons que nous sommes juste au début de la plus grande vague d’IA.

La qualité des données joue un rôle crucial dans le développement de modèles d’IA. Pouvez-vous partager comment Appen assure l’exactitude, la diversité et la pertinence de ses ensembles de données, en particulier avec la demande croissante de données de formation de LLM de haute qualité ?

La force d’Appen réside dans notre capacité à créer des données de haute qualité de manière cohérente et à grande échelle. Nous travaillons en étroite collaboration avec nos clients pour comprendre leurs objectifs de modèles d’IA et développer des données de haute qualité pour leurs besoins grâce à une approche à plusieurs niveaux qui combine des outils automatisés et des commentaires humains. Nous disposons d’une main-d’œuvre mondiale de plus de 1 million de personnes dans plus de 200 pays, ce qui nous permet de sélectionner un groupe de contributeurs qualifiés et divers. Grâce à des contrôles de qualité rigoureux et à des boucles de rétroaction, nous nous assurons que les données sont exactes, cohérentes et pertinentes, et peuvent être utilisées pour améliorer efficacement les performances des modèles d’IA. Cela permet aux systèmes d’IA de fonctionner efficacement dans des environnements du monde réel et peut également être utilisé pour améliorer la robustesse et réduire les préjugés, en particulier pour les LLM.

Les données synthétiques gagnent en popularité, et l’investissement d’Appen dans Mindtech met en évidence votre intérêt pour ce domaine. Pouvez-vous discuter des avantages et des inconvénients de l’utilisation de données synthétiques ou de données collectées sur le Web par rapport aux données collectées par la foule pour la formation de modèles d’IA, et comment vous voyez les données synthétiques compléter les données collectées par la foule pour lesquelles Appen est connu ?

Des données de haute qualité sont cruciales mais peuvent être coûteuses et prendre du temps à produire, c’est pourquoi les données synthétiques gagnent de l’attention. Elles fonctionnent bien pour les données structurées dans les tâches traditionnelles d’IA/ML, en particulier dans les industries avec des réglementations de confidentialité strictes comme les soins de santé et la finance, car elles évitent d’utiliser des informations personnelles.

Cependant, les données synthétiques manquent souvent de la profondeur et de la nuance des données du monde réel, en particulier pour les tâches d’IA générative complexes qui nécessitent de la diversité et une expertise approfondie. Elles peuvent également perpétuer des erreurs ou des préjugés à partir des données d’origine. Les données collectées sur le Web, couramment utilisées pour les LLM, présentent leurs propres défis avec un contenu de mauvaise qualité, des préjugés et des informations erronées, nécessitant une curation soigneuse.

Les données collectées par la foule, dans lesquelles Appen excelle, restent la “vérité fondamentale”. L’expertise humaine est essentielle pour générer les données diverses et complexes nécessaires pour améliorer la précision des modèles d’IA et garantir l’alignement avec les valeurs humaines.

Nous considérons les données synthétiques comme complémentaires à nos données annotées par l’homme. Même si les données synthétiques peuvent accélérer certaines parties du processus, les données étiquetées par l’homme garantissent que les modèles reflètent la diversité du monde réel. Ensemble, ils offrent une approche équilibrée pour créer des données de formation de haute qualité pour l’IA.

Le règlement de l’IA de l’UE et d’autres réglementations mondiales façonnent les normes éthiques autour du développement de l’IA. Comment voyez-vous ces réglementations influencer les opérations d’Appen et l’industrie de l’IA dans son ensemble à l’avenir ?

Le règlement de l’IA de l’UE et des réglementations mondiales similaires sont susceptibles d’influencer les opérations d’Appen en établissant de nouvelles normes éthiques pour le développement et les performances des modèles d’IA. Nous pouvons voir des changements dans la façon dont nous traitons les données, nous assurons de l’équité des modèles et nous traitons les considérations éthiques. Cela pourrait conduire à des processus plus rigoureux et à des ajustements potentiels dans notre approche de la formation et de la validation des modèles.

Plus largement, ces réglementations pousseront probablement l’industrie vers des normes éthiques plus élevées, augmenteront les coûts de conformité et pourraient potentiellement ralentir certains aspects de l’innovation. Cependant, elles pousseront également à une plus grande responsabilité et à une plus grande transparence, ce qui pourrait finalement conduire à un développement de l’IA plus responsable et plus durable.

Avec des préoccupations croissantes autour des préjugés dans l’IA, comment Appen travaille-t-il pour garantir que les ensembles de données utilisés pour former les modèles d’IA sont éthiquement sourcés et exempts de préjugés, en particulier dans des domaines sensibles comme le traitement du langage naturel et la vision par ordinateur ?

Nous travaillons activement pour réduire les préjugés en favorisant la diversité et l’inclusion dans nos projets. Il est encourageant de voir que de nombreux clients se concentrent sur la capture de démographiques larges dans la collecte de données et les tâches d’évaluation des modèles. Avoir une foule mondiale qui réside dans la plupart des pays nous permet de collecter des données à partir d’une large gamme de perspectives et d’expériences, ce qui est particulièrement important dans des domaines sensibles comme le traitement du langage naturel et la vision par ordinateur.

Depuis 2019, nous avons formalisé nos meilleures pratiques dans le Code de conduite de la foule, montrant notre engagement envers la diversité, l’équité et le bien-être de la foule. Cela inclut notre engagement en faveur d’une rémunération équitable, en veillant à ce que la voix de notre foule soit entendue et en maintenant des protections de confidentialité strictes. En respectant ces principes, nous visons à fournir des données de haute qualité, éthiquement sourcées, qui soutiennent un développement de l’IA responsable.

Alors que l’IA est de plus en plus intégrée dans des industries comme l’automobile, la publicité et la réalité augmentée/virtuelle, comment Appen se positionne-t-il pour répondre à la demande croissante de données de formation spécialisées dans ces secteurs ?

Au cours des 27 dernières années, nous avons fourni des données de formation spécialisées pour une gamme diversifiée d’industries et de cas d’utilisation, et nous continuons d’évoluer à mesure que les besoins de nos clients évoluent.

Par exemple, dans l’industrie automobile, nous avons travaillé avec des sociétés automobiles de premier plan et des fournisseurs de solutions de cabine pour construire des systèmes de parole à bord des véhicules. Maintenant, nous aidons nos clients dans de nouveaux domaines comme la collecte de données vidéo des conducteurs pour aider à la sécurité en surveillant la distraction des conducteurs.

Dans la publicité, nous avons aidé une plate-forme publicitaire mondiale de premier plan à améliorer la qualité et la précision des publicités pour la pertinence des utilisateurs sur un grand programme mondial de plusieurs années avec plus de 7 millions d’évaluations. Maintenant, alors que de nombreuses de ces plateformes adoptent des solutions d’IA générative, notre foule n’évalue pas seulement la pertinence des publicités, mais aide également à évaluer la qualité des publicités générées.

Nous avons pu le faire grâce à notre plate-forme d’annotation robuste qui peut être personnalisée pour prendre en charge des flux de travail complexes et diverses modalités de données, notamment le texte, l’audio, l’image, la vidéo et l’annotation multimodale. Mais en fin de compte, notre capacité à évoluer avec l’industrie en constante évolution repose sur notre expertise approfondie dans les données pour le développement de l’IA et notre solide partenariat avec nos clients.

Appen a été un leader dans la fourniture de données de haute qualité pour une variété d’applications d’IA. En regardant vers l’avenir, comment voyez-vous le rôle d’Appen évoluer alors que l’IA générative et les LLM continuent de se développer et d’influencer les marchés mondiaux ?

L’IA générative et les LLM transforment les industries, et nous allons continuer à jouer un rôle crucial dans la fourniture de données de haute qualité pour soutenir ces progrès. Lorsqu’il s’agit des marchés mondiaux, notre capacité à collecter des données dans plus de 200 pays et plus de 500 langues deviendra encore plus précieuse, et nous avons une solide histoire dans ce domaine, car nous avons aidé des entreprises comme Microsoft à lancer des modèles de traduction automatique pour plus de 110 langues.

Alors que le déploiement des applications LLM augmente, nous voyons une demande croissante pour l’alignement avec les utilisateurs finals humains, y compris les capacités de localisation pour garantir que les nuances linguistiques et culturelles sont abordées dans les différents marchés mondiaux. Nous sommes déterminés à aider les entreprises à développer des systèmes d’IA qui sont à la fois performants et responsables en garantissant que les données utilisées pour former ces modèles sont diverses, pertinentes et éthiquement sourcées.

Appen est connu pour alimenter certains des LLM les plus avancés au monde. Quelles sont certaines des innovations dans l’annotation et la collecte de données sur lesquelles Appen se concentre pour améliorer les performances de ces modèles ?

Nous innovons en permanence nos processus d’annotation et de collecte de données pour améliorer les performances des LLM. Un domaine sur lequel nous nous concentrons est l’amélioration de l’efficacité et de la précision de l’annotation de données grâce à des outils d’IA avancés, qui aident à rationaliser et à automatiser certaines parties du processus tout en maintenant des normes de qualité élevées.

Nous pouvons identifier les points de données qui nécessitent une contribution humaine supplémentaire, en garantissant que les efforts d’annotation sont ciblés là où ils auront le plus d’impact. Nous avons intégré des fonctionnalités dans notre plate-forme comme Model Mate qui peut être utilisée pour accélérer la production de données et améliorer la qualité des données. Nous nous concentrons également sur les meilleures pratiques de gestion des contributeurs, ce qui est important à mesure que la complexité des tâches augmente.

La capacité de comprendre les performances au niveau du contributeur et de fournir des commentaires pour améliorer continuellement la qualité de nos données générées par l’homme. Ces innovations nous permettent de fournir des données de haute qualité et à grande échelle nécessaires pour alimenter et affiner les LLM les plus avancés au monde.

Alors que vous prenez votre nouveau rôle de PDG, quels sont vos priorités absolues pour Appen au cours des prochaines années, et comment prévoyez-vous de stimuler la croissance de l’entreprise dans l’espace de l’IA très compétitif ?

Alors que je passe au rôle de PDG, mes priorités stratégiques sont conçues pour assurer le leadership d’Appen dans le paysage de l’IA compétitif :

Soutenir le développement de modèles d’IA générative : Au cours des 18 derniers mois, l’IA générative est devenue un élément clé de notre offre de services, avec 28 % du chiffre d’affaires du groupe provenant de projets liés à l’IA générative en juin 2024, contre 8 % en janvier. Nous voyons un potentiel important sur le marché de l’IA générative, qui devrait atteindre 1 300 milliards de dollars d’ici 2032, selon les prévisions de l’industrie.
Soutenir l’adoption de modèles d’IA générative : Nous voyons une croissance dans de nouveaux segments à mesure que les entreprises utilisent des solutions d’IA générative pour leurs cas d’utilisation. Même si le pourcentage de projets d’IA générative qui atteignent le déploiement est faible, nous anticipons que l’année financière 2024/25 sera une période de transition pendant laquelle les expériences passeront à la production et stimuleront la demande de données personnalisées et de haute qualité.
Optimiser et automatiser la façon dont nous préparons les données : En utilisant l’IA pour l’assurance qualité et en automatisant certaines étapes du processus de préparation des données. Cela nous permettra d’améliorer la qualité des données tout en améliorant l’efficacité opérationnelle, en améliorant nos marges brutes.
Évoluer l’expérience pour nos travailleurs de la foule : Notre nouvelle plate-forme CrowdGen nous permet de mettre à l’échelle des projets rapidement et de manière flexible en fonction des besoins de nos clients, en utilisant l’IA pour le filtrage automatisé et la correspondance de projet. Cela améliorera également l’expérience de nos contributeurs avec un soutien personnalisé. Appen a été un précurseur dans la promotion de la transparence, de la diversité et de l’équité dans notre approvisionnement en données, et nous restons engagés en faveur de notre Code de conduite de la foule.

Ces priorités positionneront Appen pour une croissance et une innovation soutenues dans le paysage de l’IA en évolution.

Je vous remercie pour cette excellente interview, nous encourageons les lecteurs qui souhaitent en savoir plus à visiter Appen.

Unite.AI

Ryan Kolln, PDG d’Appen – Série d’entretiens

You may like