Umjetna inteligencija
Voxel51-ova nova tehnologija automatskog označavanja obećava smanjenje troškova anotacija za 100,000 puta

Revolucionarna nova studija startupa za računalni vid voxel51 sugerira da će tradicionalni model označavanja podataka biti preokrenut. U istraživanju objavljenom danas, tvrtka izvještava da njezin novi sustav automatskog označavanja postiže do 95% točnosti na ljudskoj razini, a istovremeno je 5,000 puta brži i do 100,000x jeftinije nego ručno označavanje.
Studija je usporedila temeljne modele poput YOLO-World i Grounding DINO s poznatim skupovima podataka, uključujući COCO, LVIS, BDD100K i VOC. Zanimljivo je da su se u mnogim scenarijima iz stvarnog svijeta modeli obučeni isključivo na oznakama generiranim umjetnom inteligencijom pokazali ravnopravnima - ili čak i boljima - od onih obučenih na ljudskim oznakama. Za tvrtke koje grade računalni vid sustava, implikacije su ogromne: mogli bi se uštedjeti milijuni dolara na troškovima anotacija, a ciklusi razvoja modela mogli bi se smanjiti s tjedana na sate.
Novo doba anotacije: Od ručnog rada do cjevovoda vođenih modelom
Desetljećima, bilješka podataka bio je bolno usko grlo u razvoju umjetne inteligencije. Od ImageNeta do skupova podataka o autonomnim vozilima, timovi su se oslanjali na ogromne vojske ljudskih radnika za crtanje okvira i segmentiranje objekata - što je bio i skup i spor napor.
Prevladavajuća logika bila je jednostavna: više podataka koje su označili ljudi = bolja umjetna inteligencija. Ali istraživanje Voxel51-a tu pretpostavku preokreće naglavačke.
Njihov pristup koristi prethodno obučene temeljne modele - neki s nulti hitac mogućnosti - i integrira ih u cjevovod koji automatizira rutinsko označavanje dok istovremeno koristi aktivno učenje za označavanje nesigurnih ili složenih slučajeva za ljudski pregled. Ova metoda dramatično smanjuje i vrijeme i troškove.
U jednom testu, označavanje 3.4 milijuna objekata pomoću NVIDIA L40S GPU-a trajalo je nešto više od sat vremena i koštalo 1.18 USD. Ručno označavanje istog s AWS SageMakerom trajalo bi gotovo 7,000 sati i koštalo preko 124,000 XNUMX USD. U posebno zahtjevnim slučajevima - poput identificiranja rijetkih kategorija u skupovima podataka COCO ili LVIS - automatski označeni modeli povremeno nadmašio njihovi ljudski označeni pandani. Ovaj iznenađujući rezultat može proizaći iz dosljednih obrazaca označavanja temeljnih modela i njihovog treniranja na velikim internetskim podacima.
Unutar Voxel51: Tim koji preoblikuje vizualne tijekove rada umjetne inteligencije
Osnovan 2016. u Profesor Jason Corso i Brian Moore Na Sveučilištu Michigan, Voxel51 je izvorno započeo kao konzultantska tvrtka usmjerena na video analitiku. Corso, veteran u računalnom vidu i robotici, objavio je preko 150 akademskih radova i doprinosi opsežnom otvorenom kodu AI zajednici. Moore, bivši doktorand Corsa, obnaša dužnost izvršnog direktora.
Prekretnica se dogodila kada je tim shvatio da većina uskih grla umjetne inteligencije nije u dizajnu modela, već u podacima. Taj uvid ih je inspirirao da stvore Pedeset i jedan, platforma osmišljena kako bi inženjerima omogućila učinkovitije istraživanje, obradu i optimizaciju vizualnih skupova podataka.
Tijekom godina, tvrtka je prikupila više od $ 45M, Uključujući Serija A od 12.5 milijuna dolara a Serija B s 30 milijuna dolara predvođen Bessemer Venture Partners. Uslijedilo je usvajanje u poduzećima, a veliki klijenti poput LG Electronics, Bosch, Berkshire Grey, Precision Planting i RIOS integrirali su Voxel51 alate u svoje proizvodne AI tijekove rada.
Od alata do platforme: FiftyOneova rastuća uloga
FiftyOne je izrastao iz jednostavnog alata za vizualizaciju skupa podataka u sveobuhvatnu, podatkovno-centričnu AI platformu. Podržava širok raspon formata i shema označavanja - COCO, Pascal VOC, LVIS, BDD100K, Open Images - i besprijekorno se integrira s okvirima poput TensorFlowa i PyTorcha.
Više od alata za vizualizaciju, FiftyOne omogućuje napredne operacije: pronalaženje dupliciranih slika, identificiranje pogrešno označenih uzoraka, prikazivanje outliera i mjerenje načina kvara modela. Njegov ekosustav dodataka podržava prilagođene module za optičko prepoznavanje znakova, video pitanja i odgovore te analizu temeljenu na ugrađivanju.
Poslovna verzija, FiftyOne Teams, uvodi značajke za suradnju kao što su kontrola verzija, dozvole pristupa i integracija s pohranom u oblaku (npr. S3), kao i alate za anotacije poput Labelboxa i CVAT-a. Važno je napomenuti da i Voxel51 u partnerstvu s V7 Labsima kako bi se pojednostavio tijek između kuriranja skupa podataka i ručnih anotacija.
Ponovno promišljanje industrije anotacija
Voxel51ovo istraživanje automatskog označavanja dovodi u pitanje pretpostavke koje podupiru industriju anotacija vrijednu gotovo milijardu dolara. U tradicionalnim tijekovima rada, svaku sliku mora dodirnuti čovjek - skup i često suvišan proces. Voxel1 tvrdi da se većina tog rada sada može eliminirati.
S njihovim sustavom, većinu slika označava umjetna inteligencija, dok se samo rubni slučajevi prosljeđuju ljudima. Ova hibridna strategija ne samo da smanjuje troškove, već i osigurava veću ukupnu kvalitetu podataka, jer je ljudski trud rezerviran za najteže ili najvrjednije anotacije.
Ovaj pomak prati šire trendove u području umjetne inteligencije prema AI usmjeren na podatke—metodologija koja se usredotočuje na optimizaciju podataka za obuku, a ne na beskrajno podešavanje arhitektura modela.
Konkurentsko okruženje i prijem u industriji
Investitori poput Bessemera smatraju Voxel51 „slojem orkestracije podataka“ za umjetnu inteligenciju – slično kao što DevOps alati su transformirali razvoj softvera. Njihov alat otvorenog koda prikupio je milijune preuzimanja, a njihova zajednica uključuje tisuće programera i ML timova diljem svijeta.
Dok se drugi startupi poput Snorkel AI-a, Roboflowa i Activeloopa također fokusiraju na tijekove rada s podacima, Voxel51 se ističe svojom širinom, etosom otvorenog koda i infrastrukturom poslovne klase. Umjesto da se natječe s pružateljima anotacija, Voxel51 platforma ih nadopunjuje - čineći postojeće usluge učinkovitijima kroz selektivno kuriranje.
Buduće implikacije
Dugoročne implikacije su duboke. Ako se široko prihvate, voxel51Metodologija bi mogla dramatično smanjiti prepreku za ulazak u područje računalnog vida, demokratizirajući područje za startupove i istraživače koji nemaju velike proračune za označavanje.
Osim uštede troškova, ovaj pristup također postavlja temelje za sustavi kontinuiranog učenja, gdje modeli u produkciji automatski označavaju kvarove, koji se zatim pregledavaju, ponovno označavaju i vraćaju u podatke za obuku - sve unutar istog orkestriranog cjevovoda.
Šira vizija tvrtke usklađena je s razvojem umjetne inteligencije: ne samo pametniji modeli, već i pametniji tijekovi rada. U toj viziji, anotacija nije mrtva - ali više nije domena grube sile. Ona je strateška, selektivna i vođena automatizacijom.