Kunstig intelligens
Voxel51s nye teknologi for automatisk merking lover Ă„ redusere annoteringskostnadene med 100,000 XNUMX ganger

En banebrytende ny studie fra datasyn-oppstartsbedriften voxel51 antyder at den tradisjonelle dataannoteringsmodellen er i ferd med Ä bli snudd pÄ hodet. I en forskning som ble publisert i dag, rapporterer selskapet at det nye automatiske merkingssystemet deres oppnÄr opptil 95 % nÞyaktighet pÄ menneskelig nivÄ, samtidig som det er 5,000 ganger raskere og opptil 100,000 ganger billigere enn manuell merking.
Studien sammenlignet grunnleggende modeller som YOLO-World og Grounding DINO pĂ„ kjente datasett, inkludert COCO, LVIS, BDD100K og VOC. Bemerkelsesverdig nok presterte modeller som ble trent utelukkende pĂ„ AI-genererte etiketter i mange virkelige scenarier pĂ„ nivĂ„ med â eller til og med bedre enn â de som ble trent pĂ„ menneskelige etiketter. For selskaper som bygger datasyn systemer, er implikasjonene enorme: millioner av dollar i annoteringskostnader kan spares, og modellutviklingssykluser kan krympe fra uker til timer.
Den nye ĂŠraen for annotering: Fra manuelt arbeid til modellstyrte rĂžrledninger
I flere tiĂ„r, datanotering har vĂŠrt en smertefull flaskehals i AI-utvikling. Fra ImageNet til datasett for autonome kjĂžretĂžy har team vĂŠrt avhengige av enorme hĂŠrer av menneskelige arbeidere for Ă„ tegne avgrensningsbokser og segmentere objekter â en innsats som er bĂ„de kostbar og langsom.
Den rÄdende logikken var enkel: mer menneskemerkede data = bedre AI. Men Voxel51s forskning snur den antagelsen pÄ hodet.
TilnĂŠrmingen deres utnytter forhĂ„ndstrente grunnleggende modeller â noen med nullskudd funksjoner â og integrerer dem i en prosess som automatiserer rutinemessig merking samtidig som aktiv lĂŠring brukes til Ă„ flagge usikre eller komplekse saker for menneskelig gjennomgang. Denne metoden reduserer bĂ„de tid og kostnader dramatisk.
I Ă©n test tok det litt over en time Ă„ merke 3.4 millioner objekter med en NVIDIA L40S GPU og kostet 1.18 dollar. Ă gjĂžre det samme manuelt med AWS SageMaker ville ha tatt nesten 7,000 timer og kostet over 124,000 XNUMX dollar. I spesielt utfordrende tilfeller â som Ă„ identifisere sjeldne kategorier i COCO- eller LVIS-datasettene â ble modeller av og til automatisk merket. utkonkurrerte deres menneskemerkede motparter. Dette overraskende resultatet kan stamme fra grunnleggende modellers konsistente merkemĂžnstre og deres trening pĂ„ storskala internettdata.
Inne i Voxel51: Teamet som omformer visuelle AI-arbeidsflyter
Grunnlagt i 2016 av Professor Jason Corso og Brian Moore Voxel51 startet opprinnelig som et konsulentfirma med fokus pÄ videoanalyse ved University of Michigan. Corso, en veteran innen datasyn og robotikk, har publisert over 150 akademiske artikler og bidrar med omfattende Äpen kildekode til AI-miljÞet. Moore, en tidligere doktorgradsstudent ved Corso, er administrerende direktÞr.
Vendepunktet kom da teamet innsĂ„ at de fleste flaskehalsene i AI ikke lĂ„ i modelldesign â men i dataene. Denne innsikten inspirerte dem til Ă„ lage Femtien, en plattform utviklet for Ă„ gi ingeniĂžrer muligheten til Ă„ utforske, kuratere og optimalisere visuelle datasett mer effektivt.
Gjennom Ärene har selskapet samlet inn over $ 45M, Inkludert en $ 12.5 millioner serie A. og en $ 30 millioner serie B ledet av Bessemer Venture Partners. Bedriftsadopsjon fulgte, med store kunder som LG Electronics, Bosch, Berkshire Grey, Precision Planting og RIOS som integrerte Voxel51s verktÞy i sine produksjonsarbeidsflyter for kunstig intelligens.
Fra verktĂžy til plattform: FiftyOnes voksende rolle
FiftyOne har vokst fra et enkelt verktĂžy for datasettvisualisering til en omfattende, datasentrisk AI-plattform. Den stĂžtter et bredt spekter av formater og merkeskjemaer â COCO, Pascal VOC, LVIS, BDD100K, Open Images â og integreres sĂžmlĂžst med rammeverk som TensorFlow og PyTorch.
FiftyOne er mer enn bare et visualiseringsverktÞy, og muliggjÞr avanserte operasjoner: Ä finne dupliserte bilder, identifisere feilmerkede prÞver, avdekke avvikere og mÄle modellfeilmoduser. Plugin-Þkosystemet stÞtter tilpassede moduler for optisk tegngjenkjenning, videospÞrsmÄl og svar og innebyggingsbasert analyse.
Bedriftsversjonen, FiftyOne Teams, introduserer samarbeidsfunksjoner som versjonskontroll, tilgangstillatelser og integrasjon med skylagring (f.eks. S3), samt annoteringsverktÞy som Labelbox og CVAT. Det er verdt Ä merke seg at Voxel51 ogsÄ samarbeidet med V7 Labs for Ä effektivisere flyten mellom datasettkuratering og manuell annotering.
Ă tenke nytt om annotasjonsbransjen
Voxel51s forskning pĂ„ automatisk merking utfordrer antagelsene som ligger til grunn for en annoteringsindustri pĂ„ nesten 1 milliard dollar. I tradisjonelle arbeidsflyter mĂ„ hvert bilde berĂžres av et menneske â en kostbar og ofte overflĂždig prosess. Voxel51 hevder at mesteparten av dette arbeidet nĂ„ kan elimineres.
Med systemet deres blir de fleste bildene merket av AI, mens bare kantsaker eskaleres til mennesker. Denne hybridstrategien kutter ikke bare kostnader, men sikrer ogsÄ hÞyere generell datakvalitet, ettersom menneskelig innsats er reservert for de vanskeligste eller mest verdifulle annoteringene.
Dette skiftet gĂ„r parallelt med bredere trender innen AI-feltet mot datasentrisk AIâ en metode som fokuserer pĂ„ Ă„ optimalisere treningsdataene i stedet for Ă„ finjustere modellarkitekturer i det uendelige.
Konkurransedyktig landskap og bransjemottak
Investorer som Bessemer ser pĂ„ Voxel51 som «dataorkestreringslaget» for AI â i likhet med hvordan DevOps VerktĂžyene forvandlet programvareutviklingen. VerktĂžyet deres med Ă„pen kildekode har samlet millioner av nedlastinger, og fellesskapet deres inkluderer tusenvis av utviklere og ML-team over hele verden.
Mens andre oppstartsbedrifter som Snorkel AI, Roboflow og Activeloop ogsĂ„ fokuserer pĂ„ dataarbeidsflyter, skiller Voxel51 seg ut med sin bredde, Ă„pen kildekode-etos og infrastruktur i bedriftsklassen. I stedet for Ă„ konkurrere med annoteringsleverandĂžrer, komplementerer Voxel51s plattform dem â og gjĂžr eksisterende tjenester mer effektive gjennom selektiv kuratering.
Fremtidige implikasjoner
De langsiktige implikasjonene er betydelige. Hvis de blir bredt tatt i bruk, voxel51s metode kan redusere inngangsbarrieren for datasyn dramatisk, og demokratisere feltet for oppstartsbedrifter og forskere som mangler enorme merkingsbudsjetter.
I tillegg til Ă„ spare kostnader, legger denne tilnĂŠrmingen ogsĂ„ grunnlaget for kontinuerlige lĂŠringssystemer, der modeller i produksjon automatisk flagger feil, som deretter gjennomgĂ„s, ommerkes og brettes tilbake i treningsdataene â alt innenfor den samme orkestrerte pipelinen.
Selskapets bredere visjon er i trĂ„d med hvordan AI utvikler seg: ikke bare smartere modeller, men smartere arbeidsflyter. I den visjonen er ikke annotering dĂžd â men det er ikke lenger et domene for rĂ„styrkearbeid. Det er strategisk, selektivt og drevet av automatisering.