Suivez nous sur

La nouvelle technologie d'étiquetage automatique de Voxel51 promet de réduire les coûts d'annotation de 100,000 XNUMX fois

Intelligence Artificielle

La nouvelle technologie d'étiquetage automatique de Voxel51 promet de réduire les coûts d'annotation de 100,000 XNUMX fois

mm

Une nouvelle étude révolutionnaire d'une startup spécialisée dans la vision par ordinateur voxel51 suggère que le modèle traditionnel d'annotation des données est sur le point d'être bouleversé. Dans une étude publiée aujourd'hui, l'entreprise indique que son nouveau système d'étiquetage automatique atteint jusqu'à 95 % de précision comparable à celle d'un humain, tout en étant 5,000 1 fois plus rapide et jusqu'à XNUMX % plus rapide.00,000x moins cher que l'étiquetage manuel.

L'étude a comparé des modèles fondamentaux tels que YOLO-World et Grounding DINO à des ensembles de données reconnus, notamment COCO, LVIS, BDD100K et VOC. Il est remarquable de constater que, dans de nombreux scénarios réels, les modèles entraînés exclusivement sur des étiquettes générées par l'IA ont obtenu des performances comparables, voire supérieures, à celles des modèles entraînés sur des étiquettes humaines. Pour les entreprises qui construisent vision par ordinateur systèmes, les implications sont énormes : des millions de dollars en coûts d’annotation pourraient être économisés et les cycles de développement de modèles pourraient passer de semaines à quelques heures.

La nouvelle ère de l'annotation : du travail manuel aux pipelines pilotés par des modèles

Pendant des décennies, annotation de données a constitué un obstacle majeur au développement de l'IA. D'ImageNet aux jeux de données des véhicules autonomes, les équipes ont fait appel à de vastes armées de travailleurs humains pour dessiner des cadres de délimitation et segmenter les objets, un effort à la fois coûteux et lent.

La logique dominante était simple : plus de données étiquetées par des humains = meilleure IA. Mais les recherches de Voxel51 renversent cette hypothèse.

Leur approche s’appuie sur des modèles de base pré-entraînés, certains avec coup zéro Fonctionnalités – et les intègre dans un pipeline qui automatise l'étiquetage de routine tout en utilisant l'apprentissage actif pour signaler les cas incertains ou complexes à examiner par un humain. Cette méthode réduit considérablement les délais et les coûts.

Lors d'un test, l'étiquetage de 3.4 millions d'objets avec un GPU NVIDIA L40S a pris un peu plus d'une heure et a coûté 1.18 $. Effectuer la même opération manuellement avec AWS SageMaker aurait nécessité près de 7,000 124,000 heures et coûté plus de XNUMX XNUMX $. Dans les cas particulièrement complexes, comme l'identification de catégories rares dans les jeux de données COCO ou LVIS, il est arrivé que des modèles auto-étiquetés soient utilisés. surperformé leurs homologues étiquetés par les humains. Ce résultat surprenant pourrait provenir des schémas d'étiquetage cohérents des modèles fondamentaux et de leur entraînement sur des données Internet à grande échelle.

Au cœur de Voxel51 : l'équipe qui remodèle les workflows d'IA visuelle

Fondée en 2016 par Professeur Jason Corso et Brian Moore Fondée à l'Université du Michigan, Voxel51 était à l'origine un cabinet de conseil spécialisé dans l'analyse vidéo. Corso, expert en vision par ordinateur et en robotique, a publié plus de 150 articles scientifiques et contribue largement à la communauté de l'IA grâce à son code open source. Moore, ancien doctorant de Corso, en est le PDG.

Le tournant est survenu lorsque l'équipe a constaté que la plupart des goulots d'étranglement de l'IA ne résidaient pas dans la conception des modèles, mais dans les données. Cette constatation les a inspirés à créer Cinquante et un, une plateforme conçue pour permettre aux ingénieurs d'explorer, de gérer et d'optimiser les ensembles de données visuelles plus efficacement.

Au fil des années, l'entreprise a collecté plus de 45 M$, Y compris un 12.5 M $ Série A , l’aspect économique 30 M $ Série B Sous la direction de Bessemer Venture Partners, l'adoption par les entreprises a suivi, avec des clients majeurs comme LG Electronics, Bosch, Berkshire Grey, Precision Planting et RIOS intégrant les outils de Voxel51 à leurs flux de production d'IA.

De l'outil à la plateforme : le rôle croissant de FiftyOne

FiftyOne est passé d'un simple outil de visualisation de données à une plateforme d'IA complète et centrée sur les données. Elle prend en charge un large éventail de formats et de schémas d'étiquetage (COCO, Pascal VOC, LVIS, BDD100K, Open Images) et s'intègre parfaitement à des frameworks comme TensorFlow et PyTorch.

Plus qu'un simple outil de visualisation, FiftyOne permet des opérations avancées : recherche d'images en double, identification d'échantillons mal étiquetés, détection de valeurs aberrantes et mesure des modes de défaillance des modèles. Son écosystème de plugins prend en charge des modules personnalisés pour la reconnaissance optique de caractères, les questions-réponses vidéo et l'analyse par intégration.

La version Entreprise, FiftyOne Teams, propose des fonctionnalités collaboratives telles que le contrôle de version, les autorisations d'accès et l'intégration avec le stockage cloud (par exemple, S3), ainsi que des outils d'annotation comme Labelbox et CVAT. Voxel51 propose également en partenariat avec V7 Labs pour rationaliser le flux entre la conservation des ensembles de données et l'annotation manuelle.

Repenser l'industrie de l'annotation

Les recherches de Voxel51 sur l'étiquetage automatique remettent en question les hypothèses qui sous-tendent un secteur d'annotation de près d'un milliard de dollars. Dans les flux de travail traditionnels, chaque image doit être manipulée par un humain, un processus coûteux et souvent redondant. Voxel1 affirme qu'une grande partie de ce travail peut désormais être éliminée.

Grâce à leur système, la majorité des images sont étiquetées par l'IA, tandis que seuls les cas extrêmes sont transmis à l'humain. Cette stratégie hybride permet non seulement de réduire les coûts, mais aussi d'améliorer la qualité globale des données, l'intervention humaine étant réservée aux annotations les plus complexes ou les plus précieuses.

Cette évolution s’inscrit dans une tendance plus large dans le domaine de l’IA, IA centrée sur les données—une méthodologie qui se concentre sur l’optimisation des données de formation plutôt que sur le réglage sans fin des architectures de modèles.

Paysage concurrentiel et accueil de l'industrie

Les investisseurs comme Bessemer considèrent Voxel51 comme la « couche d’orchestration des données » pour l’IA, à l’instar de DevOps Les outils ont transformé le développement logiciel. Leur outil open source a été téléchargé des millions de fois et leur communauté compte des milliers de développeurs et d'équipes de machine learning dans le monde entier.

Alors que d'autres startups comme Snorkel AI, Roboflow et Activeloop se concentrent également sur les workflows de données, Voxel51 se distingue par son envergure, son éthique open source et son infrastructure de niveau entreprise. Plutôt que de concurrencer les fournisseurs d'annotation, la plateforme de Voxel51 les complète, améliorant l'efficacité des services existants grâce à une curation sélective.

Implications futures

Les implications à long terme sont profondes. Si elle est largement adoptée, voxel51La méthodologie de pourrait considérablement réduire la barrière à l'entrée de la vision par ordinateur, démocratisant ainsi le domaine pour les startups et les chercheurs qui manquent de vastes budgets d'étiquetage.

Au-delà des économies de coûts, cette approche pose également les bases de systèmes d'apprentissage continu, où les modèles en production signalent automatiquement les échecs, qui sont ensuite examinés, réétiquetés et réintégrés dans les données de formation, le tout au sein du même pipeline orchestré.

La vision globale de l'entreprise s'inscrit dans l'évolution de l'IA : non seulement des modèles plus intelligents, mais aussi des flux de travail plus performants. Dans cette vision, l'annotation n'est pas morte, mais elle n'est plus le domaine du travail forcé. Elle est stratégique, sélective et pilotée par l'automatisation.

Antoine est un leader visionnaire et partenaire fondateur d'Unite.AI, animé par une passion inébranlable pour façonner et promouvoir l'avenir de l'IA et de la robotique. Entrepreneur en série, il croit que l'IA sera aussi perturbatrice pour la société que l'électricité, et on le surprend souvent en train de s'extasier sur le potentiel des technologies disruptives et de l'AGI.

En futuriste, il se consacre à l'exploration de la manière dont ces innovations façonneront notre monde. En outre, il est le fondateur de Titres.io, une plateforme axée sur l’investissement dans les technologies de pointe qui redéfinissent l’avenir et remodèlent des secteurs entiers.