Financiamento

Conntour levanta US$ 7 milhões para transformar câmeras de segurança em mecanismos de busca.

Publicado 26 de março de 2026

Antoine Tardif, CEO e fundador da Unite.AI

Contorno saiu do modo furtivo com uma rodada de investimento seed de US$ 7 milhões, apoiada por investidores, incluindo Catalisador Geral, Y Combinator, Anjo SV e Liquid 2 EmpreendimentosA empresa está se posicionando em torno de uma ideia simples, porém ambiciosa: as equipes de segurança devem ser capazes de pesquisar imagens de vídeo com a mesma facilidade com que pesquisam na internet.

A plataforma introduz consultas em linguagem natural em redes de câmeras, permitindo que os usuários descrevam o que estão procurando, em vez de depender de filtros ou categorias predefinidas.

De câmeras passivas à inteligência pesquisável

Os sistemas tradicionais de videovigilância são construídos com base em regras rígidas. Os operadores precisam definir antecipadamente o que detectar — objetos específicos, movimentos ou comportamentos. Essa abordagem frequentemente resulta em incidentes não detectados e horas de revisão manual quando algo inesperado acontece.

O Conntour substitui esse modelo por uma interface mais flexível. Em vez de configurar alertas antecipadamente, os usuários podem digitar consultas como "uma pessoa deixando uma bolsa sem vigilância" ou "uma van perto da doca de carga ontem", e o sistema recupera as imagens relevantes.

Isso marca uma mudança da monitorização para a consulta. O vídeo deixa de ser algo para ser assistido e passa a ser algo que pode ser explorado e analisado sob demanda.

Projetado para a complexidade do mundo real

Um dos principais desafios na vigilância é que as situações do mundo real raramente se encaixam em categorias definidas. O comportamento suspeito é frequentemente contextual, envolvendo sequências de ações em vez de um único objeto detectável.

O sistema da Conntour foi projetado para lidar com essa ambiguidade. Ele opera tanto com transmissões ao vivo quanto com gravações históricas, permitindo alertas em tempo real, bem como investigações rápidas após incidentes. A plataforma também funciona com a infraestrutura de câmeras existente e pode ser totalmente implantada localmente, o que é fundamental para ambientes onde os dados não podem sair de redes seguras.

A interface foi projetada para ser fácil de usar, permitindo que operadores sem conhecimento técnico interajam com sistemas complexos sem precisar configurar regras de detecção ou entender os modelos subjacentes.

Tração inicial em ambientes de alto risco

A empresa já está sendo utilizada em operações de segurança interna em Singapura, o que sugere uma adoção precoce em ambientes onde precisão e velocidade são cruciais.

A experiência da equipe fundadora em inteligência e sistemas de alta tecnologia parece influenciar o design do produto, particularmente seu foco na eficiência operacional. A plataforma afirma permitir que um único operador monitore milhares de câmeras, reduzindo drasticamente o tempo necessário para investigar incidentes.

Em comparação com os sistemas tradicionais de análise de vídeo, a plataforma apresenta melhorias operacionais significativas:

Redução de até 90% no tempo de revisão manual de vídeos.
Até 80% menos eventos perdidos
Redução de até 70% nos alarmes falsos
A capacidade de um único operador supervisionar milhares de câmeras.

Esses ganhos resultam da substituição de fluxos de trabalho baseados em regras por sistemas que interpretam o contexto e a intenção de forma mais dinâmica.

Para onde essa tecnologia pode nos levar

O que a Conntour está construindo aponta para uma mudança mais ampla na forma como os dados de vídeo são interpretados — não apenas uma análise mais rápida, mas um modelo de interação fundamentalmente diferente. Em vez de projetar sistemas em torno de regras de detecção predefinidas, o foco passa a ser a compreensão da intenção expressa em linguagem natural.

Essa mudança tem implicações que vão além da segurança. Se os sistemas conseguirem interpretar de forma confiável consultas abertas como "alguém deixando um objeto para trás" ou "movimento incomum perto de uma entrada", isso sugere uma tendência em direção à compreensão semântica de vídeo — onde o contexto, as relações e as sequências importam tanto quanto os objetos individuais.

Em grande escala, isso poderia remodelar a forma como as organizações utilizam arquivos de vídeo. As gravações se tornam um conjunto de dados indexado que pode ser consultado dinamicamente, em vez de armazenado passivamente. Em ambientes como centros de transporte, redes logísticas ou infraestrutura pública, isso poderia mudar a forma como os incidentes são reconstruídos, auditados e, potencialmente, previstos.

Por dentro do capô: da detecção à compreensão.

Os sistemas tradicionais dependem de modelos de detecção de objetos treinados para reconhecer categorias específicas, como pessoas ou veículos. Embora eficazes em cenários controlados, esses modelos apresentam dificuldades quando as consultas não se enquadram nos rótulos predefinidos.

A abordagem da Conntour provavelmente envolve a construção de representações visuais mais ricas — frequentemente chamadas de embeddings — que capturam não apenas objetos, mas também atributos, relacionamentos e mudanças ao longo do tempo. Consultas em linguagem natural podem então ser mapeadas para o mesmo espaço de representação, permitindo que o sistema associe a intenção aos dados visuais.

Outro desafio fundamental é raciocínio temporalMuitas consultas do mundo real envolvem sequências de eventos em vez de quadros isolados. Para dar suporte a isso, é necessário rastrear entidades ao longo do tempo e compreender as interações, e não apenas identificar objetos isoladamente.

Restrições e Conflitos

Apesar do seu potencial, este tipo de sistema introduz novos desafios. O processamento de grandes volumes de vídeo com modelos avançados exige grande poder computacional, especialmente em instalações locais onde os recursos são limitados.

A precisão é outra consideração importante. Consultas abertas introduzem ambiguidade, e os sistemas precisam equilibrar flexibilidade e precisão para evitar falsos positivos ou detecções perdidas. Ao contrário dos sistemas baseados em regras, os sistemas orientados por linguagem natural dependem muito da capacidade de generalização dos modelos para casos extremos.

Há também implicações de governança. A capacidade de pesquisar atributos ou comportamentos altamente específicos levanta questões sobre supervisão, controle de acesso e uso apropriado — particularmente em ambientes sensíveis ou públicos.

Contour's O lançamento destaca uma mudança de paradigma, afastando-se da vigilância rígida e baseada em regras em direção a sistemas capazes de interpretar intenções e contexto em tempo real.

Se esse modelo se mostrar confiável, poderá redefinir a forma como as organizações interagem com os dados de vídeo, passando do monitoramento passivo para uma inteligência dinâmica orientada por consultas.

Tópicos relacionados:Contorno financiamento

Antoine Tardif, CEO e fundador da Unite.AI

Antoine é um líder visionário e sócio fundador da Unite.AI, movido por uma paixão inabalável por moldar e promover o futuro da IA e da robótica. Um empreendedor em série, ele acredita que a IA será tão disruptiva para a sociedade quanto a eletricidade, e é frequentemente pego delirando sobre o potencial das tecnologias disruptivas e da AGI.

Como um futurista, ele se dedica a explorar como essas inovações moldarão nosso mundo. Além disso, ele é o fundador da Valores Mobiliários.io, uma plataforma focada em investir em tecnologias de ponta que estão redefinindo o futuro e remodelando setores inteiros.

Unir-se.AI