Spojte se s námi

Umělá inteligence

Nová technologie automatického označování od Voxel51 slibuje 100,000 XNUMXnásobné snížení nákladů na anotace

mm

Průlomová nová studie od startupu zabývajícího se počítačovým viděním voxel51 naznačuje, že tradiční model anotace dat se brzy převrátí. Ve výzkumu zveřejněném dnes společnost uvádí, že její nový systém automatického označování dosahuje až 95 % přesnosti na lidské úrovni a zároveň je 5,000 1krát rychlejší a až XNUMX00,000x levnější než ruční označování.

Studie porovnávala základní modely, jako jsou YOLO-World a Grounding DINO, se známými datovými sadami, včetně COCO, LVIS, BDD100K a VOC. Je pozoruhodné, že v mnoha reálných scénářích si modely trénované výhradně na štítcích generovaných umělou inteligencí vedly srovnatelně – nebo dokonce lépe – než modely trénované na lidských štítcích. Pro společnosti, které budují počítačového vidění systémy, důsledky jsou obrovské: mohly by se ušetřit miliony dolarů na nákladech na anotace a cykly vývoje modelů by se mohly zkrátit z týdnů na hodiny.

Nová éra anotací: Od manuální práce k modelově řízeným potrubím

Po desetiletí, anotace dat představuje bolestivé úzké hrdlo ve vývoji umělé inteligence. Od ImageNetu až po datové sady autonomních vozidel se týmy spoléhaly na obrovské armády lidských pracovníků, kteří kreslili ohraničující rámečky a segmentovali objekty – což byla nákladná i pomalá záležitost.

Převládající logika byla jednoduchá: více dat označených člověkem = lepší umělá inteligence. Výzkum Voxel51 však tento předpoklad převrací naruby.

Jejich přístup využívá předem natrénované základní modely – některé s nulový výstřel funkce – a integruje je do procesu, který automatizuje rutinní označování a zároveň využívá aktivní učení k označení nejistých nebo složitých případů k lidské kontrole. Tato metoda dramaticky snižuje čas i náklady.

V jednom testu trvalo označení 3.4 milionu objektů pomocí grafického procesoru NVIDIA L40S něco málo přes hodinu a stálo 1.18 dolaru. Ruční provedení stejného úkolu pomocí AWS SageMaker by trvalo téměř 7,000 124,000 hodin a stálo by přes XNUMX XNUMX dolarů. V obzvláště náročných případech – jako je identifikace vzácných kategorií v datových sadách COCO nebo LVIS – automaticky označené modely občas... překonal jejich lidsky značené protějšky. Tento překvapivý výsledek může pramenit z konzistentních vzorců označování základních modelů a jejich trénování na rozsáhlých internetových datech.

Uvnitř Voxel51: Tým, který přetváří pracovní postupy vizuální umělé inteligence

Společnost byla založena v 2016 podle Profesor Jason Corso si Brian Moore Na Michiganské univerzitě začínala společnost Voxel51 původně jako konzultační firma zaměřená na video analytiku. Corso, veterán v oblasti počítačového vidění a robotiky, publikoval přes 150 akademických prací a přispívá rozsáhlým open source kódem do komunity umělé inteligence. Moore, bývalý doktorand společnosti Corso, působí jako generální ředitel.

Zlom nastal, když si tým uvědomil, že většina úzkých míst umělé inteligence nebyla v návrhu modelu, ale v datech. Tento poznatek je inspiroval k vytvoření Padesát jedna, platforma navržená tak, aby inženýrům umožnila efektivněji prozkoumávat, spravovat a optimalizovat vizuální datové sady.

V průběhu let společnost získala více než $ 45M, Včetně 12.5 milionů dolarů série A a Série B s 30 miliony dolarů vedená společností Bessemer Venture Partners. Následovalo zavedení v podnicích, kde významní klienti jako LG Electronics, Bosch, Berkshire Grey, Precision Planting a RIOS integrovali nástroje Voxel51 do svých produkčních pracovních postupů s umělou inteligencí.

Od nástroje k platformě: Rostoucí role FiftyOne

FiftyOne se rozrostl z jednoduchého nástroje pro vizualizaci datových sad na komplexní platformu umělé inteligence zaměřenou na data. Podporuje širokou škálu formátů a schémat označování – COCO, Pascal VOC, LVIS, BDD100K, Open Images – a bezproblémově se integruje s frameworky jako TensorFlow a PyTorch.

FiftyOne není jen vizualizační nástroj, ale umožňuje pokročilé operace: vyhledávání duplicitních obrázků, identifikaci chybně označených vzorků, vyhledávání odlehlých hodnot a měření režimů selhání modelu. Jeho ekosystém pluginů podporuje vlastní moduly pro optické rozpoznávání znaků, video Q&A a analýzu založenou na vkládání dat.

Podniková verze FiftyOne Teams zavádí funkce pro spolupráci, jako je správa verzí, přístupová oprávnění a integrace s cloudovým úložištěm (např. S3), a také nástroje pro anotaci, jako jsou Labelbox a CVAT. Je pozoruhodné, že Voxel51 také ve spolupráci s V7 Labs zefektivnit tok mezi kurací datových sad a ruční anotací.

Přehodnocení anotačního průmyslu

Výzkum automatického označování společnosti Voxel51 zpochybňuje předpoklady, na kterých je založeno odvětví anotací s obratem téměř 1 miliardy dolarů. V tradičních pracovních postupech se musí každého obrázku dotknout člověk – což je drahý a často nadbytečný proces. Voxel51 tvrdí, že většinu této práce lze nyní eliminovat.

Díky jejich systému je většina obrázků označena umělou inteligencí, zatímco lidem jsou eskalovány pouze okrajové případy. Tato hybridní strategie nejen snižuje náklady, ale také zajišťuje vyšší celkovou kvalitu dat, protože lidské úsilí je vyhrazeno pro nejobtížnější nebo nejcennější anotace.

Tento posun je v souladu s širšími trendy v oblasti umělé inteligence směrem k datově orientovaná AI—metodologie, která se zaměřuje na optimalizaci trénovacích dat spíše než na nekonečné ladění architektur modelů.

Konkurenční prostředí a přijetí v odvětví

Investoři jako Bessemer vnímají Voxel51 jako „vrstvu orchestrace dat“ pro umělou inteligenci – podobnou tomu, jak… devops nástroje transformovaly vývoj softwaru. Jejich open-source nástroj si získal miliony stažení a jejich komunita zahrnuje tisíce vývojářů a týmů strojového učení po celém světě.

Zatímco se i jiné startupy jako Snorkel AI, Roboflow a Activeloop zaměřují na datové pracovní postupy, Voxel51 vyniká svou šíří záběru, étosem open-source a infrastrukturou podnikové úrovně. Platforma Voxel51 spíše než aby konkurovala poskytovatelům anotací, doplňuje je – zefektivňuje stávající služby prostřednictvím selektivní kurace.

Budoucí důsledky

Dlouhodobé důsledky jsou hluboké. Pokud bude široce přijato, voxel51Metodologie by mohla dramaticky snížit vstupní bariéru pro počítačové vidění a demokratizovat toto pole pro začínající firmy a výzkumníky, kteří nemají rozsáhlé rozpočty na označování.

Kromě úspory nákladů tento přístup také pokládá základy pro systémy kontinuálního učení, kde modely v produkčním prostředí automaticky označují selhání, která jsou následně zkontrolována, přejmenována a začleněna zpět do trénovacích dat – to vše v rámci stejného orchestrovaného kanálu.

Širší vize společnosti se shoduje s vývojem umělé inteligence: nejen chytřejší modely, ale i chytřejší pracovní postupy. V této vizi anotace není mrtvá – ale už není doménou hrubé síly. Je strategická, selektivní a řízená automatizací.

Antoine je vizionářský vůdce a zakládající partner Unite.AI, poháněný neochvějnou vášní pro utváření a prosazování budoucnosti umělé inteligence a robotiky. Je sériovým podnikatelem a věří, že umělá inteligence bude pro společnost stejně rušivá jako elektřina, a často je přistižen při blouznění o potenciálu převratných technologií a AGI.

Jako futurista, věnuje se zkoumání toho, jak tyto inovace utvářejí náš svět. Kromě toho je zakladatelem Cenné papíry.io, platforma zaměřená na investice do špičkových technologií, které nově definují budoucnost a přetvářejí celé sektory.