Artificial Intelligence
De nieuwe autolabeltechnologie van Voxel51 belooft de kosten voor annotaties met een factor 100,000 te verlagen

Een baanbrekend nieuw onderzoek van een startup gespecialiseerd in computer vision Voxel 51 suggereert dat het traditionele model voor data-annotatie op zijn kop staat. In een vandaag gepubliceerd onderzoek meldt het bedrijf dat zijn nieuwe automatische labelsysteem tot 95% van de menselijke nauwkeurigheid bereikt, terwijl het 5,000 keer sneller is en tot 100,000x goedkoper dan handmatige etikettering.
De studie vergeleek basismodellen zoals YOLO-World en Grounding DINO met bekende datasets, waaronder COCO, LVIS, BDD100K en VOC. Opmerkelijk genoeg presteerden modellen die uitsluitend op AI-gegenereerde labels waren getraind in veel praktijkscenario's vergelijkbaar met – of zelfs beter dan – modellen die op menselijke labels waren getraind. Voor bedrijven die computer visie Als we de impact van modelontwikkelingssystemen zouden vergroten, zijn de gevolgen enorm: er zouden miljoenen dollars aan annotatiekosten bespaard kunnen worden en de ontwikkelingscyclus van modellen zou van weken tot uren kunnen worden teruggebracht.
Het nieuwe tijdperk van annotatie: van handwerk naar modelgestuurde pijplijnen
Al tientallen jaren, gegevens annotatie is een pijnlijke bottleneck in de ontwikkeling van AI. Van ImageNet tot datasets van autonome voertuigen, teams hebben vertrouwd op enorme legers menselijke werknemers om begrenzingskaders te tekenen en objecten te segmenteren – een kostbare en tijdrovende klus.
De heersende logica was simpel: meer door mensen gelabelde data = betere AI. Maar het onderzoek van Voxel51 zet die aanname op zijn kop.
Hun aanpak maakt gebruik van vooraf getrainde basismodellen, waarvan sommige nul-schot mogelijkheden – en integreert deze in een pijplijn die routinematige labeling automatiseert en tegelijkertijd actief leert om onzekere of complexe gevallen te markeren voor menselijke beoordeling. Deze methode bespaart zowel tijd als kosten aanzienlijk.
In één test duurde het labelen van 3.4 miljoen objecten met een NVIDIA L40S GPU iets meer dan een uur en kostte het $ 1.18. Handmatig hetzelfde doen met AWS SageMaker zou bijna 7,000 uur hebben gekost en meer dan $ 124,000. In bijzonder uitdagende gevallen – zoals het identificeren van zeldzame categorieën in de COCO- of LVIS-datasets – konden automatisch gelabelde modellen soms overtrof hun door mensen gelabelde tegenhangers. Dit verrassende resultaat kan voortkomen uit de consistente labelpatronen van de basismodellen en hun training op grootschalige internetdata.
Binnen Voxel51: Het team dat visuele AI-workflows opnieuw vormgeeft
Opgericht in 2016 door Professor Jason Corso en Brian Moore Voxel51, gevestigd aan de Universiteit van Michigan, begon oorspronkelijk als een adviesbureau gericht op videoanalyse. Corso, een veteraan in computer vision en robotica, heeft meer dan 150 wetenschappelijke artikelen gepubliceerd en levert uitgebreide open-source code aan de AI-community. Moore, een voormalig promovendus van Corso, is CEO.
Het keerpunt kwam toen het team besefte dat de meeste AI-knelpunten niet in het modelontwerp zaten, maar in de data. Dat inzicht inspireerde hen om Eenenvijftig, een platform waarmee engineers visuele datasets efficiënter kunnen verkennen, beheren en optimaliseren.
In de loop der jaren heeft het bedrijf meer dan $ 45M, Inclusief $ 12.5 miljoen serie A en $ 30 miljoen serie B Onder leiding van Bessemer Venture Partners volgde de adoptie binnen bedrijven, waarbij grote klanten zoals LG Electronics, Bosch, Berkshire Grey, Precision Planting en RIOS de tools van Voxel51 integreerden in hun AI-productieworkflows.
Van tool naar platform: de groeiende rol van FiftyOne
FiftyOne is uitgegroeid van een eenvoudige tool voor datasetvisualisatie tot een uitgebreid, datacentrisch AI-platform. Het ondersteunt een breed scala aan formaten en labelschema's – COCO, Pascal VOC, LVIS, BDD100K, Open Images – en integreert naadloos met frameworks zoals TensorFlow en PyTorch.
FiftyOne is meer dan een visualisatietool: het maakt geavanceerde bewerkingen mogelijk: het vinden van dubbele afbeeldingen, het identificeren van verkeerd gelabelde monsters, het detecteren van uitschieters en het meten van modelfalen. Het plug-in-ecosysteem ondersteunt aangepaste modules voor optische tekenherkenning, videovragen en -antwoorden en embedding-gebaseerde analyses.
De zakelijke versie, FiftyOne Teams, introduceert samenwerkingsfuncties zoals versiebeheer, toegangsrechten en integratie met cloudopslag (bijvoorbeeld S3), evenals annotatietools zoals Labelbox en CVAT. Voxel51 biedt ook in samenwerking met V7 Labs om de stroomlijning van datasets en handmatige annotatie te stroomlijnen.
Een nieuwe kijk op de annotatie-industrie
Het onderzoek van Voxel51 naar autolabeling zet vraagtekens bij de aannames die ten grondslag liggen aan een annotatie-industrie die bijna $ 1 miljard waard is. In traditionele workflows moet elke afbeelding door een mens worden bewerkt – een duur en vaak overbodig proces. Voxel51 stelt dat het grootste deel van deze arbeid nu kan worden geëlimineerd.
Met hun systeem worden de meeste afbeeldingen gelabeld door AI, terwijl alleen de meest extreme gevallen doorgestuurd worden naar menselijke input. Deze hybride strategie verlaagt niet alleen de kosten, maar zorgt ook voor een hogere algehele datakwaliteit, omdat menselijke inspanning is voorbehouden aan de moeilijkste of meest waardevolle annotaties.
Deze verschuiving loopt parallel met bredere trends op het gebied van AI richting datacentrische AI—een methodologie die zich richt op het optimaliseren van de trainingsdata in plaats van het eindeloos afstemmen van modelarchitecturen.
Concurrentielandschap en ontvangst door de industrie
Investeerders zoals Bessemer zien Voxel51 als de ‘data-orkestratielaag’ voor AI – vergelijkbaar met hoe DevOps Tools transformeerden de softwareontwikkeling. Hun open-sourcetool is miljoenen keren gedownload en hun community bestaat uit duizenden ontwikkelaars en ML-teams wereldwijd.
Terwijl andere startups zoals Snorkel AI, Roboflow en Activeloop zich ook richten op dataworkflows, onderscheidt Voxel51 zich door zijn breedte, open-source-ethos en infrastructuur op ondernemingsniveau. In plaats van te concurreren met annotatieproviders, vormt het platform van Voxel51 een aanvulling op hen en maakt het bestaande diensten efficiënter door selectieve curatie.
Toekomstige implicaties
De gevolgen op de lange termijn zijn ingrijpend. Als ze breed worden toegepast, Voxel 51De methodologie van zou de toetredingsdrempel voor computer vision drastisch kunnen verlagen en zo het vakgebied toegankelijker kunnen maken voor startups en onderzoekers die niet over een groot budget voor etikettering beschikken.
Naast het besparen van kosten legt deze aanpak ook de basis voor continue leersystemenwaarbij modellen in productie automatisch fouten markeren, die vervolgens worden beoordeeld, opnieuw worden gelabeld en worden teruggeplaatst in de trainingsgegevens. Dit alles binnen dezelfde georkestreerde pijplijn.
De bredere visie van het bedrijf sluit aan bij de ontwikkeling van AI: niet alleen slimmere modellen, maar ook slimmere workflows. In die visie is annotatie niet dood, maar het is ook niet langer het domein van brute kracht. Het is strategisch, selectief en wordt aangestuurd door automatisering.