Kunstmatige intelligentie

Voxel51’s Nieuwe Auto-Labeling Tech Belooft Annotation Kosten te Verlagen met 100.000x

mm

Een baanbrekend nieuwe studie van computer vision startup Voxel51 suggereert dat het traditionele data annotatiemodel op het punt staat om te worden omvergeworpen. In onderzoek dat vandaag is gepubliceerd, meldt het bedrijf dat zijn nieuwe auto-labeling systeem tot 95% van het niveau van de menselijke precisie bereikt, terwijl het 5.000 keer sneller is en tot 100.000 keer goedkoper is dan handmatige labeling.

De studie heeft foundation modellen zoals YOLO-World en Grounding DINO getest op bekende datasets zoals COCO, LVIS, BDD100K en VOC. Opmerkelijk is dat in veel real-world scenario’s, modellen die uitsluitend zijn getraind op AI-gegenereerde labels, even goed of zelfs beter presteren dan modellen die zijn getraind op menselijke labels. Voor bedrijven die computer vision systemen ontwikkelen, zijn de implicaties enorm: miljoenen dollars aan annotatiekosten kunnen worden bespaard en modelontwikkelingscycli kunnen worden teruggebracht van weken tot uren.

Het Nieuwe Tijdperk van Annotatie: Van Handarbeid tot Model-Gestuurde Pipelines

Gedurende decennia is data annotatie een pijnlijke bottleneck in AI-ontwikkeling geweest. Van ImageNet tot autonome voertuig datasets, hebben teams vertrouwd op enorme legers van menselijke werknemers om begrenzingsvakken te tekenen en objecten te segmenteren – een inspanning die zowel duur als langzaam is.

De heersende logica was eenvoudig: meer menselijk gelabelde data = betere AI. Maar Voxel51’s onderzoek keert die veronderstelling om.

Hun benadering maakt gebruik van pre-getrainde foundation modellen – sommige met zero-shot mogelijkheden – en integreert ze in een pipeline die routine labeling automatiseert en active learning gebruikt om onzekere of complexe gevallen te markeren voor menselijke beoordeling. Deze methode vermindert zowel tijd als kosten aanzienlijk.

In één test duurde het labelen van 3,4 miljoen objecten met een NVIDIA L40S GPU slechts iets meer dan een uur en kostte $1,18. Handmatig doen met AWS SageMaker zou bijna 7.000 uur hebben geduurd en meer dan $124.000 hebben gekost. In bijzonder uitdagende gevallen – zoals het identificeren van zeldzame categorieën in de COCO of LVIS datasets – presteerden auto-gelabelde modellen soms beter dan hun menselijk gelabelde tegenhangers. Dit verrassende resultaat kan voortkomen uit de consistentie van de labeling patronen van de foundation modellen en hun training op grote internetgegevens.

Binnen Voxel51: Het Team dat Visuele AI Workflows Hertekent

Opgericht in 2016 door Professor Jason Corso en Brian Moore aan de Universiteit van Michigan, begon Voxel51 oorspronkelijk als een consultancy gericht op video analytics. Corso, een veteran in computer vision en robotica, heeft meer dan 150 academische papers gepubliceerd en draagt uitgebreide open-source code bij aan de AI-gemeenschap. Moore, een voormalig PhD-student van Corso, fungeert als CEO.

Het keerpunt kwam toen het team besefte dat de meeste AI-bottlenecks niet in modelontwerp zaten, maar in de gegevens. Die inzicht inspireerde hen om FiftyOne te creëren, een platform ontworpen om ingenieurs in staat te stellen visuele datasets meer efficiënt te onderzoeken, te cureren en te optimaliseren.

In de loop der jaren heeft het bedrijf meer dan $45 miljoen opgehaald, waaronder een $12,5 miljoen Series A en een $30 miljoen Series B geleid door Bessemer Venture Partners. Enterprise adoptie volgde, met grote klanten zoals LG Electronics, Bosch, Berkshire Grey, Precision Planting en RIOS die Voxel51’s tools integreerden in hun productie AI-workflows.

Van Tool tot Platform: FiftyOne’s Uitbreidende Rol

FiftyOne is gegroeid van een eenvoudig dataset visualisatie tool tot een uitgebreid, data-georiënteerd AI-platform. Het ondersteunt een breed scala aan formaten en labeling schema’s – COCO, Pascal VOC, LVIS, BDD100K, Open Images – en integreert naadloos met frameworks zoals TensorFlow en PyTorch.

Meer dan een visualisatie tool, FiftyOne biedt geavanceerde operaties: het vinden van dubbele afbeeldingen, het identificeren van verkeerd gelabelde monsters, het naar boven brengen van outliers en het meten van model falen modus. De plugin-ecosysteem ondersteunt aangepaste modules voor optische tekenherkenning, video Q&A en embedding-gebaseerde analyse.

De enterprise versie, FiftyOne Teams, introduceert collaboratieve functies zoals versiebeheer, toegangsrechten en integratie met cloudopslag (bijv. S3), evenals annotatie tools zoals Labelbox en CVAT. Opmerkelijk is dat Voxel51 ook samenwerkte met V7 Labs om de stroom tussen dataset curatie en handmatige annotatie te stroomlijnen.

Het herschrijven van de Annotatie Industrie

Voxel51’s auto-labeling onderzoek daagt de veronderstellingen uit die ten grondslag liggen aan een bijna $1 miljard annotatie industrie. In traditionele workflows moet elke afbeelding door een mens worden aangeraakt – een dure en vaak redundante procedure. Voxel51 stelt dat de meeste van deze arbeid nu kan worden geëlimineerd.

Met hun systeem worden de meeste afbeeldingen gelabeld door AI, terwijl alleen edge cases worden doorgestuurd naar mensen. Deze hybride strategie vermindert niet alleen kosten, maar zorgt ook voor een hogere overall gegevenskwaliteit, aangezien menselijke inspanning wordt gereserveerd voor de meest moeilijke of waardevolle annotaties.

Deze verschuiving parallelleert bredere trends in het AI-veld naar data-georiënteerde AI – een methode die zich richt op het optimaliseren van de trainingsgegevens in plaats van het eindeloos afstemmen van modelarchitecturen.

Concurrerend Landschap en Industriële Ontvangst

Investeerders zoals Bessemer zien Voxel51 als de “data-orkestratielaag” voor AI – vergelijkbaar met hoe DevOps tools softwareontwikkeling hebben getransformeerd. Hun open-source tool heeft miljoenen downloads gegenereerd en hun gemeenschap omvat duizenden ontwikkelaars en ML-teams wereldwijd.

Terwijl andere startups zoals Snorkel AI, Roboflow en Activeloop zich ook richten op data workflows, onderscheidt Voxel51 zich door zijn breedte, open-source ethos en enterprise-grade infrastructuur. In plaats van concurrerend te zijn met annotatie providers, complementeren Voxel51’s platform hen – bestaande diensten efficiënter maken door selectieve curatie.

Toekomstige Implicaties

De langetermijnimplicaties zijn diepgaand. Als het op grote schaal wordt geadopteerd, kan Voxel51’s methodologie de toegang tot computer vision voor startups en onderzoekers die geen enorme labeling budgetten hebben, aanzienlijk verlagen.

Naast het besparen van kosten, legt deze benadering ook de basis voor continue leer systemen, waarin modellen in productie automatisch falen markeren, die vervolgens worden beoordeeld, opnieuw gelabeld en teruggevoerd in de trainingsgegevens – allemaal binnen dezelfde georkesteerde pipeline.

Het bredere visie van het bedrijf sluit aan bij de manier waarop AI evolueert: niet alleen slimmere modellen, maar slimmere workflows. In die visie is annotatie niet dood, maar het is niet langer het domein van brute-force arbeid. Het is strategisch, selectief en gedreven door automatisering.

Antoine is een visionaire leider en oprichtend partner van Unite.AI, gedreven door een onwankelbare passie voor het vormgeven en promoten van de toekomst van AI en robotica. Een seriële ondernemer, hij gelooft dat AI net zo disruptief voor de samenleving zal zijn als elektriciteit, en wordt vaak betrapt op het enthousiast praten over het potentieel van disruptieve technologieën en AGI. Als een futurist, is hij toegewijd aan het onderzoeken van hoe deze innovaties onze wereld zullen vormgeven. Bovendien is hij de oprichter van Securities.io, een platform dat zich richt op investeren in cutting-edge technologieën die de toekomst opnieuw definiëren en hele sectoren herschappen.