Éthique
Startup Unbiased vise à accroître la transparence des données via la blockchain et à lutter contre la partialité des données

Les effets des biais de données dans l'intelligence artificielle sont bien documentés, et à mesure que l'IA et les algorithmes d'apprentissage automatique pénètrent de plus en plus dans tous les recoins de la société, les entreprises d'IA recherchent de nouveaux moyens de garantir que les algorithmes qu'elles développent n'héritent pas de biais humains. L'un des nouveaux acteurs dans le domaine de l'IA et de l'apprentissage automatique, qui vise à réduire les biais de données, est la startup au nom transparent Unbiased. a lancé une nouvelle place de marché de données sur la plateforme blockchain active Telos, dans l'espoir de fournir aux clients des outils et des applications décentralisés et axés sur la confidentialité pour la science des données et l'IA.
Le marché mondial de l'IA devrait poursuivre sa croissance rapide au cours de la prochaine décennie, atteignant environ 266 milliards de dollars d'ici 2027. Au cours des quatre prochaines années, les dépenses mondiales en systèmes d'IA et composants associés devraient doubler, atteignant environ 110 milliards de dollars d'ici 2024 selon IDC. L'adoption rapide des algorithmes d'IA dans de plus en plus d'industries a suscité des inquiétudes croissantes concernant la transparence, la confidentialité, l'équité et la représentativité des systèmes d'IA.
Réduire les biais grâce à la transparence
D’après une rapport récent publié par CapGemini Research Institute, intitulé « L'IA et l'énigme éthique : comment les organisations peuvent construire des systèmes d'IA éthiquement robustes et gagner la confiance », l'utilisation éthique de l'IA est devenue une préoccupation majeure pour les responsables informatiques à tous les niveaux, la majorité d'entre eux exprimant désormais leur inquiétude quant à la mauvaise utilisation potentielle des systèmes d'IA. Environ 9 organisations informatiques sur 10 ont déclaré avoir eu connaissance d'au moins un incident où des problèmes éthiques ont été créés par l'application d'un système d'IA. Environ les deux tiers des responsables informatiques ont déclaré être conscients des biais discriminatoires potentiels dans les systèmes d'IA, et environ la moitié de toutes les organisations informatiques ont une charte éthique destinée à donner le développement de l'IA, contre seulement 2019% des entreprises informatiques en XNUMX.
Alors que les recherches sur la manière de rendre les algorithmes d'IA plus justes se poursuivent, de nombreux éthiciens et spécialistes de l'IA se concentrent sur les données utilisées pour former l'IA. À mesure que les algorithmes d'IA deviennent plus omniprésents et standardisés, l'accent est mis sur l'acquisition des données nécessaires pour former des modèles.
Il existe une multitude de façons de réduire le biais de données dans les algorithmes d'IA. Certaines techniques impliquent d'apporter des modifications au modèle ou aux données d'entraînement pendant que le modèle s'entraîne. Ces techniques sont des techniques de correction de biais « en cours de traitement ». Cela inclut l'utilisation de techniques d'entraînement contradictoires, où certaines caractéristiques/variables sensibles (telles que le sexe ou la race) sont contrôlées en pénalisant la capacité du modèle à faire des prédictions impliquant la caractéristique en question. Ceci est fait tout en essayant simultanément de minimiser l'erreur du modèle. En revanche, se concentrer sur la suppression des biais de l'ensemble de données est une technique de prétraitement. Les données de formation pour les modèles d'apprentissage automatique sont souvent étiquetées manuellement, et l'application de la blockchain pourrait aider les entreprises à suivre le processus d'étiquetage de leurs données pour s'assurer que leurs ensembles de données sont représentatifs.
Unbiased se tourne vers la blockchain pour engendrer une culture de transparence au sein des ensembles de données et des marchés de données. La plupart des outils utilisés pour générer des ensembles de données pour les systèmes d'IA et les algorithmes d'apprentissage automatique sont centralisés et, de ce fait, manquent souvent de transparence. Unbiased vise à tirer parti de la nature de la blockchain pour enregistrer les actions qui se déroulent sur leur marché de données, ce qui comprend l'échange de données, l'équation des tâches et des projets et les contributions des travailleurs. L'objectif est que la nature décentralisée de la blockchain Telos facilite la transparence, permettant aux utilisateurs d'obtenir des informations critiques concernant la nature de leur science des données. Les utilisateurs pourront valider leurs ensembles de données et déterminer si des annotations ont été effectuées au regard de certains principes éthiques, comme l'équité et la confidentialité.
Selon l'architecte en chef de Telos Blockchain, l'intersection de l'IA/apprentissage automatique avec la blockchain peut conduire à de nouvelles méthodes transformatrices de travail avec les données. Comme Horn a été cité par AIthority :
"Unbiased montrera à ces industries comment l'enregistrement de données sur une blockchain haute performance et gratuite comme Telos peut ajouter de la transparence, de l'immuabilité, des micropaiements et de la gouvernance à leurs produits au profit de toutes les parties prenantes."
Au-delà de la transparence des données de formation, certains scientifiques et chercheurs ont poussé pour plus de transparence dans les algorithmes, les modèles et le code. Une équipe internationale de scientifiques a appelé les revues scientifiques à obliger les chercheurs en informatique à respecter des normes de transparence plus élevées. Les chercheurs ont fait valoir qu'une plus grande transparence concernant les modèles et le code d'IA aiderait non seulement à la reproductibilité des études, mais aiderait également la collaboration entre les groupes de recherche. De nombreuses études scientifiques ne peuvent pas être reproduites, et c'est un problème encore plus important pour les études axées sur l'IA qui omettent des matériaux critiques. À l'avenir, la blockchain pourrait même être utilisée pour améliorer le suivi et l'évaluation de la recherche dans le domaine de l'IA.