Financiación
Conntour recauda 7 millones de dólares para convertir cámaras de seguridad en motores de búsqueda.

Contorno ha salido del sigilo con una ronda de financiación inicial de 7 millones de dólares respaldada por inversores, entre ellos: Catalizador general, Y Combinator, SV ángel y Líquido 2 empresasLa empresa se está posicionando en torno a una idea simple pero ambiciosa: los equipos de seguridad deberían poder buscar grabaciones de vídeo con la misma facilidad con la que buscan en la web.
La plataforma introduce la consulta en lenguaje natural a través de redes de cámaras, lo que permite a los usuarios describir lo que buscan en lugar de depender de filtros o categorías predefinidas.
De cámaras pasivas a inteligencia con capacidad de búsqueda
Los sistemas de videovigilancia tradicionales se basan en reglas rígidas. Los operadores deben definir de antemano qué detectar: objetos, movimientos o comportamientos específicos. Este enfoque suele resultar en incidentes no detectados y horas de revisión manual cuando ocurre algo inesperado.
Conntour sustituye ese modelo por una interfaz más flexible. En lugar de configurar alertas con antelación, los usuarios pueden escribir consultas como "una persona dejó una bolsa sin vigilancia" o "una furgoneta cerca del muelle de carga ayer", y el sistema recupera las grabaciones relevantes.
Esto supone un cambio: de la monitorización a la consulta. El vídeo ya no es algo para ver, sino que se convierte en algo que se puede explorar y analizar a demanda.
Diseñado para la complejidad del mundo real.
Uno de los principales desafíos de la vigilancia es que las situaciones del mundo real rara vez se ajustan a categorías bien definidas. El comportamiento sospechoso suele ser contextual e implica secuencias de acciones en lugar de un único objeto detectable.
El sistema de Conntour está diseñado para gestionar esta ambigüedad. Funciona tanto con transmisiones en directo como con grabaciones históricas, lo que permite alertas en tiempo real y una rápida investigación posterior a los incidentes. La plataforma también es compatible con la infraestructura de cámaras existente y puede implementarse completamente en las instalaciones del cliente, lo cual es fundamental para entornos donde los datos no pueden salir de redes seguras.
La interfaz está diseñada para ser fácil de usar, lo que permite a los operadores no técnicos interactuar con sistemas complejos sin necesidad de configurar reglas de detección ni comprender los modelos subyacentes.
Primeros resultados positivos en entornos de alto riesgo
La empresa ya se está utilizando en operaciones de seguridad nacional en Singapur, lo que sugiere una pronta adopción en entornos donde la precisión y la velocidad son fundamentales.
La experiencia del equipo fundador en inteligencia y sistemas de alta tecnología parece influir en el diseño del producto, especialmente en su enfoque en la eficiencia operativa. La plataforma afirma permitir que un solo operador supervise miles de cámaras, reduciendo drásticamente el tiempo necesario para investigar incidentes.
En comparación con los sistemas de análisis de vídeo tradicionales, la plataforma reporta mejoras operativas significativas:
- Reducción de hasta un 90 % en el tiempo de revisión manual de vídeos.
- Hasta un 80% menos de eventos perdidos
- Reducción de hasta un 70% en las falsas alarmas.
- La capacidad de un solo operador para supervisar miles de cámaras.
Estas ventajas provienen de la sustitución de los flujos de trabajo basados en reglas por sistemas que interpretan el contexto y la intención de forma más dinámica.
Hacia dónde podría conducir esta tecnología.
Lo que Conntour está desarrollando apunta a un cambio más profundo en la forma en que se interpretan los datos de video: no solo un análisis más rápido, sino un modelo de interacción fundamentalmente diferente. En lugar de diseñar sistemas basados en reglas de detección predefinidas, la responsabilidad recae en comprender la intención expresada en lenguaje natural.
Este cambio tiene implicaciones que van más allá de la seguridad. Si los sistemas pueden interpretar de forma fiable consultas abiertas como "alguien que deja un objeto atrás" o "movimiento inusual cerca de una entrada", sugiere un avance hacia la comprensión semántica del vídeo, donde el contexto, las relaciones y las secuencias importan tanto como los objetos individuales.
A gran escala, esto podría transformar la forma en que las organizaciones utilizan los archivos de vídeo. Las grabaciones se convierten en un conjunto de datos indexados que se puede consultar dinámicamente en lugar de almacenarse pasivamente. En entornos como centros de transporte, redes logísticas o infraestructuras públicas, esto podría cambiar la forma en que se reconstruyen, auditan y, potencialmente, anticipan los incidentes.
Bajo el capó: De la detección a la comprensión
Los sistemas tradicionales se basan en modelos de detección de objetos entrenados para reconocer categorías específicas, como personas o vehículos. Si bien son eficaces en escenarios controlados, estos modelos presentan dificultades cuando las consultas no se ajustan a las etiquetas predefinidas.
El enfoque de Conntour probablemente implica la creación de representaciones visuales más ricas —a menudo denominadas incrustaciones— que capturan no solo objetos, sino también atributos, relaciones y cambios a lo largo del tiempo. Las consultas en lenguaje natural se pueden entonces mapear al mismo espacio de representación, lo que permite al sistema relacionar la intención con los datos visuales.
Otro desafío clave es razonamiento temporalMuchas consultas del mundo real implican secuencias de eventos en lugar de fotogramas individuales. Para ello, es necesario realizar un seguimiento de las entidades a lo largo del tiempo y comprender las interacciones, no solo identificar objetos de forma aislada.
Restricciones y compensaciones
A pesar de su potencial, este tipo de sistema plantea nuevos desafíos. El procesamiento de grandes volúmenes de vídeo con modelos avanzados requiere una gran capacidad de cálculo, especialmente en implementaciones locales donde los recursos son limitados.
La precisión es otro factor importante. Las consultas abiertas introducen ambigüedad, y los sistemas deben equilibrar la flexibilidad con la precisión para evitar falsos positivos o detecciones omitidas. A diferencia de los sistemas basados en reglas, los sistemas basados en lenguaje natural dependen en gran medida de la capacidad de generalización de los modelos a casos extremos.
También existen implicaciones para la gobernanza. La capacidad de buscar atributos o comportamientos muy específicos plantea interrogantes sobre la supervisión, el control de acceso y el uso apropiado, especialmente en entornos sensibles o públicos.
Conntour Este lanzamiento pone de manifiesto un cambio de enfoque, alejándose de la vigilancia rígida y basada en reglas para adoptar sistemas capaces de interpretar la intención y el contexto en tiempo real.
Si este modelo demuestra ser fiable, podría redefinir la forma en que las organizaciones interactúan con los datos de vídeo, pasando de la monitorización pasiva a la inteligencia dinámica basada en consultas.










