Entretiens
Dr. Judith Bishop, Directrice senior des spécialistes de l’IA chez Appen – Série d’entretiens

Dr. Judith Bishop est directrice senior des spécialistes de l’IA pour la région APAC/US chez Appen. Elle dirige et développe une équipe de premier plan composée de linguistes hautement qualifiés et expérimentés, de linguistes computationnels et d’experts dans tous les modes de communication humaine (parole, écriture et geste), pour fournir des données de formation d’IA avec une combinaison inégalée de qualité et de rapidité.
Qu’est-ce qui vous a initialement attiré vers la linguistique ?
J’ai découvert la linguistique grâce à un professeur d’anglais préféré au lycée. J’étais l’un de ces enfants qui sont également attirés par les langues étrangères et les sciences humaines, ainsi que par les matières scientifiques. La linguistique est la science de la façon dont le langage fonctionne, elle a donc réuni ces intérêts pour moi. Comme beaucoup de gens, une fois que j’ai appris à connaître la linguistique, j’en suis devenue complètement accro. Qu’est-ce qui pourrait être plus fascinant que la façon dont nous communiquons nos pensées et nos sentiments les uns aux autres ? La linguistique explore les structures linguistiques qui, malgré les différences de sons et de systèmes d’écriture, sont souvent similaires en surface, puisqu’elles sont toutes le produit, en fin de compte, de notre existence humaine commune.
Pouvez-vous partager l’histoire de la façon dont vous avez trouvé votre place dans le domaine de l’IA ?
J’ai travaillé chez Appen depuis 2004 pour soutenir le développement de produits et services de technologie linguistique. Au cours de cette période, l’IA est émergée comme un cadre, une mission et une vision globaux pour la technologie visant à imiter et à étendre les capacités humaines de communication, de raisonnement et de perception. En 2019, mon équipe a rebaptisé son nom en spécialistes de l’IA, en reconnaissant que nos connaissances linguistiques et en langage sont essentielles à l’entreprise de l’IA. Nos données annotées fournissent un soutien essentiel au succès des interactions humaines avec les produits et services d’IA.
Vous travaillez dans le domaine de l’IA depuis plus de 16 ans, quels sont les plus grands changements que vous avez constatés ?
Le principal changement a été une diversification de l’accent mis sur le développement de la technologie de base vers la longue traîne des cas d’utilisation et des applications. Pendant la majeure partie de ma carrière, l’accent de l’IA basée sur le langage a été de développer et d’affiner un ensemble de modèles de base qui imitent la perception et la production du langage humain, à savoir la reconnaissance de la parole, la synthèse de la parole et le traitement automatique des langues. Les jeux de données conformaient généralement aux normes et conventions de balisage et d’échantillonnage de données, telles que celles développées par le consortium Speecon (Interfaces de parole pour les appareils grand public). Ces normes ont permis aux développeurs de technologie de base de benchmarker leurs performances sur des structures de données communes et ont soutenu l’évolution rapide de l’IA.
Cependant, l’expansion généralisée des cas d’utilisation de l’IA au cours des dernières années a conduit à la reconnaissance que les modèles d’IA génériques construits avec ces données ne fonctionnent pas de manière adéquate sur des types de données plus spécialisés sans un ajustement supplémentaire. De plus, ayant été développés à partir de données qui étaient délibérément propres et « standard », ces modèles doivent maintenant être formés ou mis à jour pour comprendre et répondre à toutes les diversités des entrées humaines : tous les dialectes, tous les accents, tous les groupes ethniques, tous les genres et toutes les autres dimensions de la différence humaine.
Pouvez-vous discuter de l’importance des données non biaisées dans l’apprentissage automatique ?
Les modèles d’apprentissage automatique, qu’ils soient supervisés, non supervisés ou de renforcement, reflèteront les biais présents dans les données sur lesquelles ils sont formés. Alyssa Simpson Rochwerger et Wilson Pang fournissent plusieurs exemples excellents de ce problème dans leur livre récent, Real World AI. Si les données de formation sont insuffisantes pour un segment de la population, le modèle d’IA sera moins précis pour ce segment.
Dans un autre cas courant, la représentation de la population peut suffire, mais si les données de formation contiennent des corrélations entre les points de données qui reflètent des conditions réelles, mais indésirables, dans le monde (comme un taux d’emploi complet plus faible pour les femmes, ou un taux d’incarcération plus élevé pour les Afro-Américains), les applications d’IA résultantes peuvent renforcer et perpétuer ces conditions.
Les associations présentes dans le langage en général peuvent créer des biais dans les applications de traitement automatique des langues, qui reposent sur des relations statistiques appelées embeddings de mots. Si « elle » et « infirmière » sont plus fréquemment associés dans les données de formation choisies que « ils » ou « il » et « infirmière », alors l’application résultante utilisera « elle » lorsqu’elle sera forcée de choisir un pronom singulier pour se référer à une infirmière. Pour résoudre ce problème spécifique, les chercheurs ont récemment développé une variante neutre en termes de genre d’un algorithme d’embedding de mots couramment utilisé, GN-GloVe.
Dans les applications sensibles, les problèmes de biais tels que ceux-ci peuvent avoir un impact dévastateur sur les utilisateurs et peuvent annuler l’investissement commercial. La bonne nouvelle est que, en plus du développement de nouveaux ensembles de données plus transparents et plus inclusifs, un nombre croissant d’applications de science des données sont développées pour vérifier la présence de biais dans les ensembles de données de formation existants et les applications d’IA.
Appen a récemment lancé de nouveaux ensembles de données de formation diversifiés pour les initiatives de traitement automatique des langues (NLP). Pouvez-vous partager quelques détails sur la façon dont ces ensembles de données permettront aux utilisateurs finals de recevoir la même expérience, quelle que soit la variété de langues, le dialecte, l’ethnolecte, l’accent, la race ou le genre ?
Pour les raisons mentionnées ci-dessus, des ensembles de données sont nécessaires pour corriger les biais existants dans les systèmes de production d’IA, en plus des ensembles de données plus inclusifs pour la formation des systèmes futurs. Les ensembles de données Appen que vous mentionnez soutiendront la correction des biais liés à l’ethnicité et aux ethnolectes associés, tels que l’anglais vernaculaire afro-américain. Ils fourniront des données de formation supplémentaires pour renforcer la représentation de cette population dans les modèles de langage d’IA.
L’ethnicité émerge comme une dimension démographique critique pour un étiquetage explicite dans les données d’IA. Les linguistes font référence aux variétés de langues associées à des ethnicités particulières en tant qu’« ethnolectes ». Les fournisseurs de données d’IA tels qu’Appen reconnaissent maintenant que, à moins que les populations clés et diverses ne soient représentées explicitement dans les ensembles de données de formation d’IA, nous ne pouvons pas garantir que les systèmes résultants fonctionnent également bien pour ces populations.
Une performance égale signifie que le système reconnaît avec une égale précision les mots et les intentions (leurs significations, ou les actions qu’ils veulent accomplir) de l’utilisateur et, dans certains cas, le sentiment ; et qu’il répond de manière à satisfaire également les besoins de l’utilisateur et ne produit pas d’impact négatif sur une population particulière d’utilisateurs, soit pratiquement, soit psychologiquement.
Une approche de collecte de données établie a consisté à se concentrer sur des échantillons géographiques et dialectaux représentatifs dans les bases de données – en supposant que cela garantirait que la technologie sera généralisable à l’ensemble de la population de locuteurs de langues. La performance relativement plus faible des technologies de langage récemment documentée pour les locuteurs de l’anglais vernaculaire afro-américain a montré que ce n’est pas le cas. Les populations qui sont diverses en termes d’ethnicité, de race, de genre et d’accent, entre autres dimensions, doivent être proactivement incluses dans les ensembles de données de formation pour garantir que leurs voix soient entendues et comprises par les produits et services d’IA. Les ensembles de données de formation d’IA diversifiés d’Appen répondent à ce besoin.
En dehors de l’IA, vous êtes également une poète dont plusieurs de vos poèmes ont remporté différents prix de l’industrie. Quels sont vos points de vue sur l’IA future qui exhibera ce type de créativité, y compris l’écriture de poésie ?
C’est une question fascinante. La poésie et d’autres formes de créativité humaine tirent parti de toutes nos ressources humaines de mémoire, de perception, de sensation et d’émotion, ainsi que des structures et des nuances du langage et de l’image, pour produire des idées qui résonnent avec les préoccupations contemporaines. Emily Dickinson a écrit : « Si je lis un livre et qu’il me fait tellement froid que aucun feu ne peut me réchauffer, je sais que c’est de la poésie. Si je me sens physiquement comme si le sommet de ma tête avait été enlevé, je sais que c’est de la poésie. » Il doit y avoir un élément de reconnaissance perceptive, sensorielle ou émotionnelle, mais également une véritable surprise.
Les modèles d’IA avancés tels que GPT-3 modélisent statistiquement la probabilité de mots apparaissant ensemble dans différents genres, y compris la poésie. Cela signifie qu’ils peuvent produire quelque chose que nous reconnaissons comme du « langage poétique », tel que l’utilisation d’un langage élevé, de la rime et de combinaisons inattendues ou surréalistes de mots. Mais ces modèles de langage génératifs manquent de la plupart des ressources mentionnées ci-dessus, qui sont nécessaires pour produire une œuvre d’art qui éclaire ce que signifie être humain à l’époque actuelle.
Ce que je trouve intéressant dans l’IA dans un contexte créatif, c’est son potentiel pour produire des idées entièrement nouvelles – des idées qui sont différentes en nature et au-delà de la portée de l’esprit humain, même le plus polyvalent ou le plus profondément lu et expérimenté. Une fois que l’IA aura un accès constant aux données sensorielles et perceptuelles pour l’analyse dans une large gamme de domaines humains (visuel, tactile, auditif, physiologique, émotionnel), il n’y a pas de savoir ce que nous allons apprendre sur nous-mêmes et le monde. Les capacités d’analyse de l’IA peuvent produire de nouveaux terrains fertiles pour l’exploration humaine créative.
Vous avez eu une carrière phénoménale jusqu’à présent, à votre avis, qu’est-ce qui empêche plus de femmes de rejoindre les STEM et plus spécifiquement l’IA ?
La lack de modèles de rôle peut être un facteur puissant (et un cercle vicieux). Il y a une véritable difficulté – culturelle, sociale et pratique – pour pénétrer dans des domaines où les femmes, et les personnes de genres divers, n’ont pas encore une présence profondément établie, et où le respect de ce qu’elles peuvent apporter est trop souvent absent. Mon expérience en tant que leader m’a montré à plusieurs reprises à quel point les équipes peuvent être résilientes, créatives et réussies lorsqu’elles sont inclusives d’expériences et d’orientations diverses. Les leaders doivent être aventureux dans leurs embauches et courageux dans leur confiance qu’ils peuvent gérer les défis à leur façon de penser que les perspectives diverses apportent, sachant que cette bravoure a également été montrée pour être fortement corrélée au succès financier et commercial.
Y a-t-il autre chose que vous aimeriez partager sur Appen ou l’IA en général ?
Les fournisseurs de données tels qu’Appen ont un potentiel puissant pour influencer les résultats de l’IA pour le mieux en fournissant des données de formation inclusives.
Cependant, atteindre l’objectif de l’IA inclusive nécessitera la participation de tous. Les acheteurs de données doivent également reconnaître leur responsabilité pour demander explicitement – et payer – les données inclusives qui garantiront les performances optimales de leurs systèmes pour tous les utilisateurs dans le monde réel. Et ceux qui fournissent leurs données pour le développement de l’IA doivent pouvoir faire confiance aux utilisations qui seront faites de leurs données. Établir cette confiance nécessitera une transparence et des pratiques éthiques solides de la part de tous ceux qui manipulent des données sensibles.
Je vous remercie pour cette excellente interview, j’ai apprécié en apprendre davantage sur vos points de vue sur l’IA et la linguistique. Les lecteurs qui souhaitent en savoir plus doivent visiter Appen.












