Entre em contato

A nova tecnologia de etiquetagem automática da Voxel51 promete reduzir os custos de anotação em 100,000x

Inteligência artificial

A nova tecnologia de etiquetagem automática da Voxel51 promete reduzir os custos de anotação em 100,000x

mm

Um novo estudo inovador de uma startup de visão computacional voxel51 sugere que o modelo tradicional de anotação de dados está prestes a ser derrubado. Em pesquisa divulgada hoje, a empresa relata que seu novo sistema de rotulagem automática atinge até 95% de precisão de nível humano, sendo 5,000 vezes mais rápido e até 100,000x mais barato do que a etiquetagem manual.

O estudo comparou modelos de base como YOLO-World e Grounding DINO em conjuntos de dados conhecidos, incluindo COCO, LVIS, BDD100K e VOC. Notavelmente, em muitos cenários do mundo real, os modelos treinados exclusivamente em rótulos gerados por IA apresentaram desempenho equivalente — ou até melhor — àqueles treinados em rótulos humanos. Para empresas que estão construindo visão computacional sistemas, as implicações são enormes: milhões de dólares em custos de anotação poderiam ser economizados, e os ciclos de desenvolvimento de modelos poderiam diminuir de semanas para horas.

A Nova Era da Anotação: Do ​​Trabalho Manual aos Pipelines Orientados por Modelos

Por décadas, anotação de dados tem sido um gargalo doloroso no desenvolvimento de IA. Do ImageNet aos conjuntos de dados de veículos autônomos, as equipes têm contado com vastos exércitos de trabalhadores humanos para desenhar caixas delimitadoras e segmentar objetos — um esforço caro e lento.

A lógica predominante era simples: mais dados rotulados por humanos = melhor IA. Mas a pesquisa da Voxel51 inverte essa premissa.

A sua abordagem aproveita modelos de base pré-treinados - alguns com tiro zero capacidades — e as integra a um pipeline que automatiza a rotulagem de rotina, utilizando aprendizado ativo para sinalizar casos incertos ou complexos para revisão humana. Esse método reduz drasticamente o tempo e o custo.

Em um teste, rotular 3.4 milhões de objetos usando uma GPU NVIDIA L40S levou pouco mais de uma hora e custou US$ 1.18. Fazer o mesmo manualmente com o AWS SageMaker levaria quase 7,000 horas e custaria mais de US$ 124,000. Em casos particularmente desafiadores — como a identificação de categorias raras nos conjuntos de dados COCO ou LVIS — modelos rotulados automaticamente ocasionalmente superou suas contrapartes rotuladas por humanos. Este resultado surpreendente pode advir dos padrões consistentes de rotulagem dos modelos de base e de seu treinamento em dados de internet em larga escala.

Por dentro do Voxel51: A equipe que está remodelando os fluxos de trabalho da IA ​​visual

Fundada em 2016 por Professor Jason Corso e Brian Moore Na Universidade de Michigan, a Voxel51 começou como uma consultoria focada em análise de vídeo. Corso, um veterano em visão computacional e robótica, publicou mais de 150 artigos acadêmicos e contribui com um extenso código de código aberto para a comunidade de IA. Moore, ex-aluno de doutorado de Corso, atua como CEO.

O ponto de virada veio quando a equipe reconheceu que a maioria dos gargalos da IA ​​não estava no design do modelo, mas nos dados. Essa percepção os inspirou a criar Cinquenta e um, uma plataforma projetada para capacitar engenheiros a explorar, selecionar e otimizar conjuntos de dados visuais de forma mais eficiente.

Ao longo dos anos, a empresa arrecadou mais de $ 45M, Incluindo um $ 12.5M Série A e uma $ 30M Série B liderado pela Bessemer Venture Partners. A adoção empresarial seguiu, com grandes clientes como LG Electronics, Bosch, Berkshire Grey, Precision Planting e RIOS integrando as ferramentas da Voxel51 em seus fluxos de trabalho de IA de produção.

Da ferramenta à plataforma: o papel crescente da FiftyOne

O FiftyOne evoluiu de uma simples ferramenta de visualização de conjuntos de dados para uma plataforma de IA abrangente e centrada em dados. Ele suporta uma ampla gama de formatos e esquemas de rotulagem — COCO, Pascal VOC, LVIS, BDD100K, Open Images — e se integra perfeitamente a frameworks como TensorFlow e PyTorch.

Mais do que uma ferramenta de visualização, o FiftyOne permite operações avançadas: encontrar imagens duplicadas, identificar amostras com rótulos incorretos, identificar outliers e medir modos de falha do modelo. Seu ecossistema de plugins oferece suporte a módulos personalizados para reconhecimento óptico de caracteres, perguntas e respostas em vídeo e análise baseada em incorporação.

A versão corporativa, FiftyOne Teams, apresenta recursos colaborativos, como controle de versão, permissões de acesso e integração com armazenamento em nuvem (por exemplo, S3), além de ferramentas de anotação como Labelbox e CVAT. Notavelmente, o Voxel51 também em parceria com o V7 Labs para otimizar o fluxo entre a curadoria do conjunto de dados e a anotação manual.

Repensando a indústria de anotações

A pesquisa de autoetiquetagem da Voxel51 desafia as premissas que sustentam uma indústria de anotações de quase US$ 1 bilhão. Em fluxos de trabalho tradicionais, cada imagem precisa ser manipulada por um ser humano — um processo caro e frequentemente redundante. A Voxel51 argumenta que a maior parte desse trabalho agora pode ser eliminada.

Com o sistema, a maioria das imagens é rotulada por IA, enquanto apenas casos extremos são repassados ​​para humanos. Essa estratégia híbrida não só reduz custos como também garante maior qualidade geral dos dados, já que o esforço humano é reservado para as anotações mais difíceis ou valiosas.

Esta mudança acompanha tendências mais amplas no campo da IA ​​em direção a IA centrada em dados—uma metodologia que se concentra na otimização dos dados de treinamento em vez de ajustar infinitamente as arquiteturas do modelo.

Cenário competitivo e recepção da indústria

Investidores como Bessemer veem o Voxel51 como a “camada de orquestração de dados” para IA – semelhante a como DevOps As ferramentas transformaram o desenvolvimento de software. Sua ferramenta de código aberto já recebeu milhões de downloads, e sua comunidade inclui milhares de desenvolvedores e equipes de ML em todo o mundo.

Enquanto outras startups como Snorkel AI, Roboflow e Activeloop também se concentram em fluxos de trabalho de dados, a Voxel51 se destaca por sua abrangência, filosofia de código aberto e infraestrutura de nível empresarial. Em vez de competir com provedores de anotação, a plataforma da Voxel51 os complementa, tornando os serviços existentes mais eficientes por meio de curadoria seletiva.

Implicações Futuras

As implicações a longo prazo são profundas. Se amplamente adotadas, voxel51A metodologia da poderia reduzir drasticamente a barreira de entrada para a visão computacional, democratizando o campo para startups e pesquisadores que não têm grandes orçamentos para rotulagem.

Além de economizar custos, esta abordagem também estabelece as bases para sistemas de aprendizagem contínua, onde os modelos em produção sinalizam automaticamente falhas, que são então revisadas, reclassificadas e reinseridas nos dados de treinamento, tudo dentro do mesmo pipeline orquestrado.

A visão mais ampla da empresa se alinha à evolução da IA: não apenas modelos mais inteligentes, mas fluxos de trabalho mais inteligentes. Nessa visão, a anotação não está morta, mas não é mais domínio do trabalho forçado. Ela é estratégica, seletiva e impulsionada pela automação.

Antoine é um líder visionário e sócio fundador da Unite.AI, movido por uma paixão inabalável por moldar e promover o futuro da IA ​​e da robótica. Um empreendedor em série, ele acredita que a IA será tão disruptiva para a sociedade quanto a eletricidade, e é frequentemente pego delirando sobre o potencial das tecnologias disruptivas e da AGI.

Como um futurista, ele se dedica a explorar como essas inovações moldarão nosso mundo. Além disso, ele é o fundador da Valores Mobiliários.io, uma plataforma focada em investir em tecnologias de ponta que estão redefinindo o futuro e remodelando setores inteiros.