Financiamento
Retab Levanta $3,5M e Lança Plataforma Impulsionada por IA para Transformar Documentos Desorganizados em Dados Estruturados

Para desenvolvedores que constroem ferramentas impulsionadas por IA em indústrias como logística, finanças e saúde, um desafio consistentemente se apresenta: obter que os grandes modelos de linguagem (LLMs) extraiam dados de documentos do mundo real de forma confiável. Invoices em PDF, relatórios de 200 páginas, formulários manuscritos e IDs digitalizados frequentemente atrapalham sistemas de IA que de outra forma seriam poderosos.
Retab, uma nova startup fundada por engenheiros que enfrentaram esse problema em primeira mão, acaba de ser lançada para resolver isso. Ao lado do lançamento público de sua plataforma, a empresa também anunciou $3,5 milhões em financiamento pré-semente liderado por VentureFriends, Kima Ventures, e K5 Global, com a participação de Eric Schmidt (via StemAI), Olivier Pomel (CEO, Datadog) e Florian Douetteau (CEO, Dataiku).
Em vez de ser mais um provedor de LLM, a Retab se situa uma camada acima – oferecendo uma plataforma de document AI para desenvolvedores que permite que os usuários definam exatamente quais dados desejam extrair, e então lida com todo o processo: rotulagem, avaliação, engenharia de prompts, benchmarking de modelos e roteamento.
“As pessoas continuam construindo demos de IA que parecem mágicas, mas desmoronam em produção,” disse Louis de Benoist, co-fundador e CEO da Retab. “Construímos a Retab porque estávamos cansados de conectar pipelines frágeis apenas para extrair alguns campos de um documento. Agora, os desenvolvedores podem se concentrar no esquema que desejam – nós lidamos com o resto.”
O que a Retab Realmente Faz
Em seu núcleo, a Retab transforma documentos não estruturados – PDFs, digitalizações, formulários – em saídas JSON limpas e estruturadas ou tabulares que os desenvolvedores podem inserir em sistemas de produção. Construída como um SDK e plataforma, ela abstrai toda a complexidade de construir fluxos de trabalho de extração de dados impulsionados por IA.
As empresas que usam a Retab simplesmente descrevem o esquema dos dados que desejam. A Retab então gera automaticamente conjuntos de dados rotulados, seleciona o LLM(s) ótimo, refina prompts e lida com detecção de erros e lógica de repetição. Ela garante a precisão de nível de produção por meio de três inovações principais:
- Esquemas de Auto-Otimização: A Retab usa um agente de IA interno para testar e refinar iterativamente as instruções de extração usando exemplos reais, eliminando a necessidade de ajustes manuais.
- Roteamento de Modelo Inteligente: A plataforma é agnóstica de modelo e marca automaticamente os LLMs (por exemplo, OpenAI, Anthropic, Google), roteando cada documento para o melhor modelo com base em requisitos de custo, velocidade e precisão. Isso permitiu que alguns usuários reduzissem os custos de processamento em até 100x.
- Consenso k-LLM e Raciocínio Orientado: Em vez de confiar na saída de um único modelo, a Retab impõe um raciocínio passo a passo (cadeia de pensamento) e executa vários modelos em paralelo para alcançar um consenso. Se a incerteza permanecer, é sinalizada ou recalculada, dando aos desenvolvedores confiança em cada resposta.
Essa camada de orquestração dá aos desenvolvedores o poder de transformar fluxos de documentos propensos a erros – como análise de contratos, verificação de identidade ou análise de faturas – em sistemas escaláveis e auto-corrigíveis.
De Logística para Infraestrutura
Os fundadores originalmente construíram a base da Retab enquanto automatizavam processos internos para operações intensivas em documentos na indústria de logística. Mas à medida que aprimoravam a ferramenta, perceberam que seu valor excedia qualquer caso de uso único. Hoje, a Retab já está sendo usada por dezenas de empresas em:
- Logística: Analisando notas de entrega, manifestos de alfândega e registros de entrega
- Finanças: Extrair fatores de risco e métricas financeiras de relatórios de longo prazo
- Saúde: Automatizando formulários de intake, reclamações e registros médicos
Uma empresa de caminhões usou a Retab para identificar a configuração de modelo mais pequena e rápida que atendesse ao requisito de 99% de precisão – reduzindo o custo de computação e latência sem sacrificar o desempenho. Uma empresa financeira cortou dias de análise trimestral usando a Retab para extrair indicadores de risco estruturados de documentos de investidores.
“A economia de IA depende de transformar documentos humanamente legíveis e desorganizados em dados verificáveis e estruturados,” disse Florian Douetteau, CEO da Dataiku. “A Retab é a plataforma que torna esse salto possível em escala.”
Olhando para o Futuro
A Retab agora está expandindo além de documentos: lançamentos futuros permitirão que os usuários extraiam dados de páginas da web e conteúdo dinâmico, abrindo a porta para casos de uso como análise competitiva, raspagem de conformidade e automação de integração. Integrações com ferramentas como Zapier, n8n e Dify também estão a caminho, permitindo que a Retab se encaixe em fluxos de trabalho existentes sem código personalizado.
A longo prazo, a Retab visa se tornar a camada de middleware entre os dados não estruturados do mundo e os agentes de IA que dependem deles – seja para busca empresarial, RPA ou copilotos de IA.
Apesar de ter apenas dez funcionários, a Retab já está sendo reconhecida como um bloco de construção fundamental para desenvolvedores que constroem produtos nativos de IA – não apenas mais um fornecedor, mas um conjunto de ferramentas para operacionalizar a realidade desorganizada dos dados do mundo real.












