Inteligência artificial
A Nova Era da Anotação: Da Mão de Obra Manual para Pipelines Lideradas por Modelos da Voxel51
Um estudo inovador da startup de visão computacional Voxel51 sugere que o modelo tradicional de anotação de dados está prestes a ser revolucionado. Em uma pesquisa divulgada hoje, a empresa relata que seu novo sistema de auto-rotulagem atinge até 95% da precisão humana, enquanto é 5.000 vezes mais rápido e até 100.000 vezes mais barato do que a rotulagem manual.
O estudo utilizou modelos de base, como YOLO-World e Grounding DINO, em conjuntos de dados conhecidos, incluindo COCO, LVIS, BDD100K e VOC. Notavelmente, em muitos cenários do mundo real, os modelos treinados exclusivamente com rótulos gerados por IA performaram igual ou até melhor do que aqueles treinados com rótulos humanos. Para as empresas que constroem sistemas de visão computacional, as implicações são enormes: milhões de dólares em custos de anotação poderiam ser economizados, e os ciclos de desenvolvimento de modelos poderiam ser reduzidos de semanas para horas.
A Nova Era da Anotação: Da Mão de Obra Manual para Pipelines Lideradas por Modelos
Por décadas, a anotação de dados tem sido um gargalo doloroso no desenvolvimento de IA. Desde ImageNet até conjuntos de dados de veículos autônomos, as equipes confiaram em vastos exércitos de trabalhadores humanos para desenhar caixas delimitadoras e segmentar objetos – um esforço tanto caro quanto lento.
A lógica predominante era simples: mais dados rotulados por humanos = melhor IA. Mas a pesquisa da Voxel51 inverte essa suposição.
A abordagem da empresa aproveita modelos de base pré-treinados – alguns com capacidades de zero-shot – e os integra em uma pipeline que automatiza a rotulagem de rotina, enquanto usa o aprendizado ativo para sinalizar casos incertos ou complexos para revisão humana. Esse método reduz drasticamente tanto o tempo quanto o custo.
Em um teste, a rotulagem de 3,4 milhões de objetos usando um GPU NVIDIA L40S levou apenas mais de uma hora e custou $1,18. Fazer o mesmo manualmente com o AWS SageMaker teria levado quase 7.000 horas e custado mais de $124.000. Em casos particularmente desafiadores – como a identificação de categorias raras nos conjuntos de dados COCO ou LVIS – os modelos com rótulos automáticos ocasionalmente superaram seus equivalentes com rótulos humanos. Esse resultado surpreendente pode decorrer dos padrões de rotulagem consistentes dos modelos de base e de seu treinamento em grandes conjuntos de dados da internet.
Dentro da Voxel51: A Equipe que Está Redefinindo os Fluxos de Trabalho de IA Visual
Fundada em 2016 pelo Professor Jason Corso e Brian Moore na Universidade de Michigan, a Voxel51 originalmente começou como uma consultoria focada em análise de vídeo. Corso, um veterano em visão computacional e robótica, publicou mais de 150 artigos acadêmicos e contribuiu com código de fonte aberta para a comunidade de IA. Moore, um ex-aluno de doutorado de Corso, atua como CEO.
O ponto de inflexão ocorreu quando a equipe percebeu que a maioria dos gargalos de IA não estavam no design do modelo, mas nos dados. Essa percepção inspirou-os a criar a FiftyOne, uma plataforma projetada para permitir que os engenheiros explorem, curvem e otimizem conjuntos de dados visuais de forma mais eficiente.
Ao longo dos anos, a empresa levantou mais de $45 milhões, incluindo um financiamento série A de $12,5 milhões e um financiamento série B de $30 milhões liderado pela Bessemer Venture Partners. A adoção empresarial seguiu, com clientes importantes como LG Electronics, Bosch, Berkshire Grey, Precision Planting e RIOS integrando as ferramentas da Voxel51 em seus fluxos de trabalho de IA de produção.
De Ferramenta para Plataforma: O Papel Expansivo da FiftyOne
A FiftyOne cresceu de uma simples ferramenta de visualização de conjunto de dados para uma plataforma de IA abrangente e centrada em dados. Ela suporta uma ampla gama de formatos e esquemas de rotulagem – COCO, Pascal VOC, LVIS, BDD100K, Open Images – e se integra perfeitamente com frameworks como TensorFlow e PyTorch.
Além de ser uma ferramenta de visualização, a FiftyOne permite operações avançadas: encontrar imagens duplicadas, identificar amostras mal rotuladas, destacar outliers e medir modos de falha do modelo. Seu ecossistema de plugins suporta módulos personalizados para reconhecimento óptico de caracteres, Q&A de vídeo e análise baseada em embeddings.
A versão empresarial, FiftyOne Teams, introduz recursos colaborativos, como controle de versão, permissões de acesso e integração com armazenamento em nuvem (por exemplo, S3), bem como ferramentas de anotação como Labelbox e CVAT. Notavelmente, a Voxel51 também fez parceria com a V7 Labs para otimizar o fluxo entre a cura do conjunto de dados e a anotação manual.
Reavaliando a Indústria de Anotação
A pesquisa de auto-rotulagem da Voxel51 desafia as suposições que sustentam uma indústria de anotação de quase $1 bilhão. Nos fluxos de trabalho tradicionais, cada imagem deve ser tocada por um humano – um processo caro e frequentemente redundante. A Voxel51 argumenta que a maioria desse trabalho pode agora ser eliminada.
Com seu sistema, a maioria das imagens é rotulada por IA, enquanto apenas casos de borda são escalonados para revisão humana. Essa estratégia híbrida não apenas reduz custos, mas também garante uma qualidade de dados geralmente mais alta, pois o esforço humano é reservado para as anotações mais difíceis ou valiosas.
Essa mudança é paralela a tendências mais amplas no campo de IA em direção a uma abordagem de IA centrada em dados – uma metodologia que se concentra em otimizar os dados de treinamento em vez de ajustar constantemente as arquiteturas de modelo.
Paisagem Competitiva e Recepção da Indústria
Investidores como a Bessemer veem a Voxel51 como a “camada de orquestração de dados” para IA – semelhante à forma como as ferramentas de DevOps transformaram o desenvolvimento de software. Sua ferramenta de código aberto atraiu milhões de downloads, e sua comunidade inclui milhares de desenvolvedores e equipes de ML em todo o mundo.
Embora outras startups, como Snorkel AI, Roboflow e Activeloop, também se concentrem em fluxos de trabalho de dados, a Voxel51 se destaca por sua amplitude, ética de código aberto e infraestrutura de nível empresarial. Em vez de competir com os provedores de anotação, a plataforma da Voxel51 complementa-os, tornando os serviços existentes mais eficientes por meio da cura seletiva.
Implicações Futuras
As implicações de longo prazo são profundas. Se amplamente adotada, a metodologia da Voxel51 poderia reduzir drasticamente a barreira de entrada para a visão computacional, democratizando o campo para startups e pesquisadores que carecem de vastos orçamentos de rotulagem.
Além de economizar custos, essa abordagem também estabelece as bases para sistemas de aprendizado contínuo, onde os modelos em produção automaticamente sinalizam falhas, que são então revisadas, re-rotuladas e incorporadas de volta aos dados de treinamento – tudo dentro da mesma pipeline orquestrada.
A visão mais ampla da empresa alinha-se com a evolução da IA: não apenas modelos mais inteligentes, mas fluxos de trabalho mais inteligentes. Nessa visão, a anotação não está morta, mas não é mais o domínio do trabalho braçal. É estratégica, seletiva e impulsionada pela automação.












