Conectează-te cu noi

Noua tehnologie de etichetare automată de la Voxel51 promite să reducă costurile de adnotare de 100,000 de ori

Inteligența artificială

Noua tehnologie de etichetare automată de la Voxel51 promite să reducă costurile de adnotare de 100,000 de ori

mm

Un nou studiu revoluționar de la un startup de viziune computerizată voxel51 sugerează că modelul tradițional de adnotare a datelor este pe cale să fie răsturnat. Într-un studiu publicat astăzi, compania raportează că noul său sistem de autoetichetare atinge o precizie de până la 95% din cea umană, fiind în același timp de 5,000 de ori mai rapid și de până la 1De 00,000 de ori mai ieftin decât etichetarea manuală.

Studiul a comparat modele fundamentale precum YOLO-World și Grounding DINO cu seturi de date cunoscute, inclusiv COCO, LVIS, BDD100K și VOC. În mod remarcabil, în multe scenarii din lumea reală, modelele antrenate exclusiv pe etichete generate de inteligență artificială au avut performanțe la egalitate cu - sau chiar mai bune decât - cele antrenate pe etichete umane. Pentru companiile care construiesc viziunea computerului În cazul sistemelor, implicațiile sunt enorme: s-ar putea economisi milioane de dolari în costuri de adnotare, iar ciclurile de dezvoltare a modelelor s-ar putea reduce de la săptămâni la ore.

Noua eră a adnotării: de la munca manuală la conductele conduse de modele

De zeci de ani, adnotarea datelor a reprezentat un blocaj dificil în dezvoltarea inteligenței artificiale. De la ImageNet la seturile de date pentru vehicule autonome, echipele s-au bazat pe armate vaste de lucrători umani pentru a desena cutii de delimitare și a segmenta obiecte - un efort atât costisitor, cât și lent.

Logica predominantă a fost simplă: mai multe date etichetate de oameni = o inteligență artificială mai bună. Însă cercetarea Voxel51 răstoarnă această presupunere.

Abordarea lor valorifică modele de fundație pre-antrenate - unele cu zero-shot capabilități - și le integrează într-un flux de lucru care automatizează etichetarea de rutină, utilizând în același timp învățarea activă pentru a semnala cazurile incerte sau complexe pentru revizuire umană. Această metodă reduce dramatic atât timpul, cât și costurile.

Într-un test, etichetarea a 3.4 milioane de obiecte folosind un GPU NVIDIA L40S a durat puțin peste o oră și a costat 1.18 dolari. Realizarea manuală a aceluiași lucru cu AWS SageMaker ar fi durat aproape 7,000 de ore și ar fi costat peste 124,000 de dolari. În cazuri deosebit de dificile - cum ar fi identificarea categoriilor rare în seturile de date COCO sau LVIS - modelele au etichetat automat ocazional. depășit omologii lor etichetați de oameni. Acest rezultat surprinzător ar putea proveni din tiparele de etichetare consecvente ale modelelor de bază și din antrenamentul lor pe date de internet la scară largă.

În interiorul Voxel51: Echipa care remodelează fluxurile de lucru ale inteligenței artificiale vizuale

Fondată în 2016 de Profesorul Jason Corso și Brian Moore La Universitatea din Michigan, Voxel51 a început inițial ca o firmă de consultanță axată pe analiza video. Corso, un veteran în viziunea computerizată și robotică, a publicat peste 150 de lucrări academice și contribuie cu o cantitate extinsă de cod open-source comunității de inteligență artificială. Moore, un fost doctorand al lui Corso, este CEO.

Punctul de cotitură a venit atunci când echipa a recunoscut că majoritatea blocajelor legate de inteligența artificială nu se aflau în proiectarea modelului, ci în date. Această perspectivă i-a inspirat să creeze Cincizeci si unu, o platformă concepută pentru a permite inginerilor să exploreze, să gestioneze și să optimizeze seturile de date vizuale mai eficient.

De-a lungul anilor, compania a strâns peste $ 45M, Inclusiv o Seria A de 12.5 milioane de dolari și 30 milioane USD Seria B condus de Bessemer Venture Partners. A urmat adoptarea la nivel de companie, clienți majori precum LG Electronics, Bosch, Berkshire Grey, Precision Planting și RIOS integrând instrumentele Voxel51 în fluxurile lor de lucru de inteligență artificială.

De la instrument la platformă: Rolul în expansiune al FiftyOne

FiftyOne a evoluat de la un simplu instrument de vizualizare a setului de date la o platformă de inteligență artificială cuprinzătoare, centrată pe date. Acesta acceptă o gamă largă de formate și scheme de etichetare - COCO, Pascal VOC, LVIS, BDD100K, Open Images - și se integrează perfect cu framework-uri precum TensorFlow și PyTorch.

Mai mult decât un instrument de vizualizare, FiftyOne permite operațiuni avansate: găsirea de imagini duplicate, identificarea eșantioanelor etichetate greșit, scoaterea la iveală a valorilor aberante și măsurarea modurilor de eroare ale modelului. Ecosistemul său de plugin-uri acceptă module personalizate pentru recunoașterea optică a caracterelor, sesiuni de întrebări și răspunsuri video și analiză bazată pe încorporare.

Versiunea pentru întreprinderi, FiftyOne Teams, introduce funcții de colaborare, cum ar fi controlul versiunilor, permisiunile de acces și integrarea cu stocarea în cloud (de exemplu, S3), precum și instrumente de adnotare precum Labelbox și CVAT. În special, Voxel51 introduce și... în parteneriat cu V7 Labs pentru a eficientiza fluxul dintre curarea setului de date și adnotarea manuală.

Regândirea industriei adnotărilor

Cercetarea Voxel51 privind autoetichetarea contestă presupunerile care stau la baza unei industrii de adnotare de aproape 1 miliard de dolari. În fluxurile de lucru tradiționale, fiecare imagine trebuie atinsă de o ființă umană - un proces costisitor și adesea redundant. Voxel51 susține că cea mai mare parte a acestei forțe de muncă poate fi acum eliminată.

Cu ajutorul sistemului lor, majoritatea imaginilor sunt etichetate de inteligența artificială, în timp ce doar cazurile limită sunt transmise către oameni. Această strategie hibridă nu numai că reduce costurile, dar asigură și o calitate generală mai bună a datelor, deoarece efortul uman este rezervat pentru cele mai dificile sau valoroase adnotări.

Această schimbare este paralelă cu tendințele mai largi din domeniul inteligenței artificiale către AI centrat pe date—o metodologie care se concentrează pe optimizarea datelor de antrenament, mai degrabă decât pe reglarea continuă a arhitecturilor modelelor.

Peisaj competitiv și recepție industrială

Investitorii precum Bessemer consideră Voxel51 drept „stratul de orchestrare a datelor” pentru inteligența artificială – similar cu modul în care DevOps Instrumentele au transformat dezvoltarea de software. Instrumentul lor open-source a acumulat milioane de descărcări, iar comunitatea lor include mii de dezvoltatori și echipe de ML din întreaga lume.

În timp ce alte startup-uri precum Snorkel AI, Roboflow și Activeloop se concentrează, de asemenea, pe fluxuri de lucru cu date, Voxel51 se remarcă prin amploarea sa, etosul open-source și infrastructura de nivel enterprise. În loc să concureze cu furnizorii de adnotări, platforma Voxel51 îi completează - făcând serviciile existente mai eficiente prin intermediul unei selecții selective.

Implicații viitoare

Implicațiile pe termen lung sunt profunde. Dacă sunt adoptate pe scară largă, voxel51Metodologia ar putea reduce dramatic bariera de acces pentru viziunea computerizată, democratizând domeniul pentru startup-uri și cercetători care nu dispun de bugete vaste pentru etichetare.

Pe lângă economisirea costurilor, această abordare pune și bazele pentru sisteme de învățare continuă, unde modelele din producție semnalează automat erorile, care sunt apoi revizuite, reetichetate și integrate din nou în datele de antrenament - totul în cadrul aceluiași proces orchestrat.

Viziunea mai amplă a companiei se aliniază cu modul în care IA evoluează: nu doar modele mai inteligente, ci și fluxuri de lucru mai inteligente. În această viziune, adnotarea nu este moartă - dar nu mai este domeniul muncii forțate. Este strategică, selectivă și condusă de automatizare.

Antoine este un lider vizionar și partener fondator al Unite.AI, condus de o pasiune neclintită pentru modelarea și promovarea viitorului AI și al roboticii. Un antreprenor în serie, el crede că AI va perturba societatea la fel de mult ca electricitatea și este adesea surprins încântător de potențialul tehnologiilor disruptive și AGI.

Ca futurist, el este dedicat explorării modului în care aceste inovații vor modela lumea noastră. În plus, el este fondatorul Securities.io, o platformă axată pe investiții în tehnologii de ultimă oră care redefinesc viitorul și remodelează sectoare întregi.