Intelligence artificielle

Étude Datagen suggĂšre une adoption gĂ©nĂ©ralisĂ©e des donnĂ©es synthĂ©tiques

mm

Une nouvelle étude commandée par Datagen, un leader dans la génération de données synthétiques, a révélé de nombreuses découvertes éclairantes sur la façon dont les données synthétiques sont utilisées dans tout le domaine de la vision par ordinateur (CV) pour faire progresser les applications d’intelligence artificielle (AI) et d’apprentissage automatique (ML).

La nouvelle étude, qui a été menée par Wakefield Research et a exploré les données de formation dans le domaine de la vision par ordinateur, était intitulée « Données synthétiques : clé pour un AI prêt pour la production en 2022 ». Elle a interrogé 300 professionnels de la CV de 300 organisations uniques issues de différents secteurs. 

Convergence vers les données synthétiques

L’une des principales conclusions était que le domaine commence à converger vers les données synthétiques, en les utilisant pour résoudre les problèmes liés aux retards et aux annulations de projets. 

Un autre point important de l’étude était l’accent mis sur le fait que les données de formation sont devenues une source de complications pour les professionnels de la vision par ordinateur, ce qui ralentit les progrès de l’entreprise dans le domaine de la CV. 

Les problèmes les plus courants incluaient : le gaspillage de temps et/ou de ressources pour réentraîner le système ; une annotation de mauvaise qualité entraînant des problèmes de qualité ; une couverture de données insuffisante du domaine de l’application ; et un manque de quantité de données suffisante. 

De tels problèmes entravent les progrès d’un projet, et ils ont conduit la majorité des équipes de CV à subir des retards et des annulations de projets importants. Selon l’enquête, 99 % des répondants ont connu des annulations de projets, 80 % ont connu des retards de projet d’au moins 3 mois, et 33 % ont connu des retards de projet de 7 mois ou plus. 

Intérêt et adoption généralisés

L’étude a également révélé de nombreuses tendances qui indiquent un intérêt généralisé pour les données synthétiques. Plus précisément, 96 % des équipes de vision par ordinateur ont déclaré qu’elles utilisaient déjà des données synthétiques dans la formation et les tests de modèles de vision par ordinateur. 

Datagen a également demandé aux organisations quelles étaient leurs motivations principales pour utiliser des données synthétiques, et les équipes ont répondu que c’était pour les tests, la formation et la résolution de cas limites. 

Lorsqu’il s’agit des avantages des données synthétiques, les répondants ont déclaré que les plus importants étaient la réduction du temps de production, l’élimination des préoccupations de confidentialité, la réduction des biais, la diminution des erreurs d’annotation et d’étiquetage, et les améliorations de la modélisation prédictive. 

Ofir Chakon est le fondateur et PDG de Datagen. 

« Les données synthétiques sont l’avenir des données. C’est la nouvelle façon de contrôler et de consommer les données dont nos systèmes d’IA ont besoin », a déclaré Chakon. « À mesure que la simulation s’améliore avec le temps, avec tous ses avantages, elle prendra la place de la collecte de données manuelle laborieuse qui n’est plus scalable à la vitesse à laquelle le monde évolue. »

Vous pouvez lire le rapport complet de Datagen ici

Alex McFarland est un journaliste et écrivain en intelligence artificielle qui explore les derniers développements en intelligence artificielle. Il a collaboré avec de nombreuses startups et publications en intelligence artificielle dans le monde entier.