Yapay Zekâ

Voxel51’in Yeni Otomatik Etiketleme Teknolojisi, Etiketleme Maliyetlerini 100.000 Kat Azaltma Vaadi

mm

Bilgisayarlı görme startup şirketi Voxel51’den gelen yeni bir araştırma, geleneksel veri etiketleme modelinin değişime uğrayacağına işaret ediyor. Bugün yayınlanan araştırmada, şirketin yeni otomatik etiketleme sisteminin insan düzeyinde doğruluk oranının %95’ine ulaştığını, aynı zamanda 5.000 kat daha hızlı ve 100.000 kat daha ucuz olduğunu belirtiyor.

Araştırma, YOLO-World ve Grounding DINO gibi temel modelleri COCO, LVIS, BDD100K ve VOC gibi bilinen veri setlerinde test etti. Şaşırtıcı bir şekilde, birçok gerçek dünya senaryosunda, yalnızca AI tarafından oluşturulan etiketlerle eğitilen modeller, insan etiketleriyle eğitilen modellerle aynı performansları gösterdi veya hatta daha iyi performans gösterdi. Bilgisayarlı görme sistemleri geliştiren şirketler için bu durumun anlamı büyük: milyonlarca dolarlık etiketleme maliyetleri tasarruf edilebilir ve model geliştirme döngüleri haftalardan saatlere kısalabilir.

Yeni Etiketleme Çağı: Elle Çalışmadan Model Önderliğindeki İşlem Hatlarına

On yıllar boyunca, veri etiketleme AI geliştirme sürecinde zor bir engel olarak kaldı. ImageNet’ten otonom araç veri setlerine kadar, ekipler insan işgücüne güvenerek nesneleri segmente ediyor ve sınırlayıcı kutular çiziyordu – bu hem pahalı hem de yavaş bir süreçti.

Geçerli mantık basitti: daha fazla insan etiketli verisi = daha iyi AI. Ancak Voxel51’in araştırması bu varsayımı baştan aşağı değiştiriyor.

Onların yaklaşımı, bazıları sıfır atış yeteneklerine sahip önceden eğitilmiş temel modelleri kullanıyor ve bunları, rutin etiketlemeyi otomatikleştiren ve insan gözden geçirmesi için belirsiz veya karmaşık durumları işaretleyen bir işlem hattına entegre ediyor. Bu yöntem hem zaman hem de maliyeti dramatically azaltıyor.

Bir testte, 3,4 milyon nesneyi etiketlemek için bir NVIDIA L40S GPU kullanmak sadece bir saatten fazla sürdü ve 1,18 dolar maliyeti vardı. AWS SageMaker ile elle yapıldığında ise yaklaşık 7.000 saat sürer ve 124.000 dolar maliyeti olurdu. Özellikle zorlu durumlarda – örneğin COCO veya LVIS veri setlerindeki nadir kategorileri tanımlamak – otomatik etiketli modeller bazen insan etiketli modelleri geçersiz kıldı. Bu şaşırtıcı sonuç, temel modellerin tutarlı etiketleme kalıplarından ve büyük ölçekli internet verilerine dayalı eğitimlerinden kaynaklanıyor olabilir.

Voxel51 İçinde: Görsel AI İşlem Hatlarını Yeniden Şekillendiren Ekibi

2016 yılında Profesör Jason Corso ve Brian Moore tarafından Michigan Üniversitesi’nde kurulan Voxel51, başlangıçta video analitiğine odaklanan bir danışmanlık şirketi olarak kuruldu. Corso, bir bilgisayar görme ve robotik uzmanı olarak 150’den fazla akademik makale yayınladı ve AI topluluğuna geniş açık kaynak kodu katkıları yaptı. Moore, Corso’nun eski doktora öğrencisi ve şu anda CEO olarak görev yapıyor.

Dönüm noktası, ekibin çoğu AI engelinin model tasarımında değil, veride olduğunu fark ettiğinde geldi. Bu anlayış, FiftyOne platformunu oluşturmalarını sağladı – mühendislerin görsel veri setlerini daha verimli bir şekilde keşfetmelerine, küratelerine ve optimize etmelerine olanak tanıyan bir platform.

Yıllar içinde, şirket 45 milyon doların üzerinde fon topladı, bunlar arasında 12,5 milyon dolarlık A Serisi ve 30 milyon dolarlık B Serisi fonlar da bulunuyordu. Büyük müşteriler gibi LG Electronics, Bosch, Berkshire Grey, Precision Planting ve RIOS, Voxel51’in araçlarını üretim AI işlem hatlarına entegre etti.

Araçtan Platforma: FiftyOne’in Genişleyen Rolü

FiftyOne, basit bir veri seti görselleştirme aracından kapsamlı, veri odaklı bir AI platformuna dönüştü. COCO, Pascal VOC, LVIS, BDD100K, Open Images gibi çeşitli formatları ve etiketleme şemalarını destekler ve TensorFlow ve PyTorch gibi çerçevelerle sorunsuz bir şekilde entegre olur.

FiftyOne, yalnızca bir görselleştirme aracı değil, aynı zamanda gelişmiş işlemleri de destekler: yinelenen görüntüleri bulma, yanlış etiketlenmiş örnekleri tanımlama, dışlayıcıları belirleme ve model başarısızlık modlarını ölçme. Eklenti ekosistemi, optik karakter tanıma, video Q&A ve gömme tabanlı analiz için özel modülleri destekler.

Şirket versiyonu, FiftyOne Teams, işbirliği özellikleri sunar: sürüm kontrolü, erişim izinleri ve bulut depolama (örneğin S3) entegrasyonu ile birlikte etiketleme araçları gibi Labelbox ve CVAT. Voxel51 ayrıca V7 Labs ile veri seti kürasyonu ve elle etiketleme arasındaki akışı basitleştirmek için işbirliği yaptı.

Etiketleme Endüstrisini Yeniden Düşünmek

Voxel51’in otomatik etiketleme araştırması, yaklaşık 1 milyar dolarlık bir etiketleme endüstrisinin temelindeki varsayımları sorguluyor. Geleneksel işlem hatlarında her görüntü insan tarafından dokunmalıdır – pahalı ve souvent yinelenen bir süreç. Voxel51, bu emeğin çoğunun artık ortadan kaldırılabileceğini savunuyor.

Sistemlerinde, majority görüntüler AI tarafından etiketlenir, yalnızca kenar durumları insanlara yönlendirilir. Bu melez strateji, yalnızca maliyetleri azaltmakla kalmaz, aynı zamanda genel veri kalitesini de artırır, çünkü insan çabası en zor veya en değerli etiketlemeler için ayrılmıştır.

Bu değişim, veri odaklı AI’ye doğru daha geniş eğilimleri yansıtıyor – model mimarilerini sonsuza kadar ayarlamak yerine eğitim verilerini optimize etmeye odaklanan bir metodoloji.

Rekabetçi Manzara ve Endüstri Tepkisi

Yatırımcılar gibi Bessemer, Voxel51’i AI için “veri düzenleme katmanı” olarak görüyor – yazılım geliştirmeyi dönüştüren DevOps araçlarına benzer. Açık kaynaklı aracı milyonlarca indirme aldı ve topluluğu dünya çapında binlerce geliştirici ve ML ekibini içeriyor.

Diğer startups gibi Snorkel AI, Roboflow ve Activeloop da veri işlem hatlarına odaklansa da, Voxel51 genişlik, açık kaynaklı etosu ve şirket düzeyindeki altyapısı ile öne çıkıyor. Etiketleme sağlayıcıları ile rekabet etmek yerine, Voxel51’in platformu mevcut hizmetleri daha verimli hale getirerek onları tamamlıyor.

Gelecek İmpilikasyonları

Uzun vadeli.implications büyük. Voxel51’in metodolojisinin yaygın olarak benimsenmesi durumunda, bilgisayar görme alanını demokratikleştirebilir, büyük etiketleme bütçeleri olmayan startups ve araştırmacılara bu alanı açabilir.

Bunun yanı sıra, bu yaklaşım sürekli öğrenen sistemler için de temel oluşturur – üretimdeki modeller otomatik olarak hataları saptar, bunlar daha sonra gözden geçirilir, yeniden etiketlenir ve eğitim verilerine geri katılır – tüm bunlar aynı işlem hattında gerçekleşir.

Şirketin daha geniş vizyonu, AI’nin evrimiyle uyumlu: yalnızca daha akıllı modeller değil, daha akıllı işlem hatları. Bu vizyonda etiketleme ölmedi, ancak artık brute-force emeğinin alanı değil. Stratejik, seçici ve otomasyona dayalı.

Antoine bir vizyoner lider ve Unite.AI'in kurucu ortağıdır ve AI ve robotik geleceğini şekillendirmek ve tanıtmak için sarsılmaz bir tutkuyla hareket etmektedir. Bir seri girişimci olarak, toplum için elektrik kadar yıkıcı olacağına inandığı AI'nin potansiyeli hakkında sık sık konuşur ve coşkusunu dile getirir.
Bir futurist olarak, bu yeniliklerin dünyamızı nasıl şekillendireceğini keşfetmeye adanmıştır. Ayrıca, Securities.io kurucusudur, bu platform geleceği yeniden tanımlayan ve tüm sektörleri yeniden şekillendiren teknolojilere yatırım yapmaya odaklanmıştır.