Finanziamenti
Conntour raccoglie 7 milioni di dollari per trasformare le telecamere di sicurezza in motori di ricerca

Conntour è emerso dalla fase di stealth con un round di seed di 7 milioni di dollari sostenuto da investitori tra cui General Catalyst, Y Combinator, SV Angel e Liquid 2 Ventures. La società si posiziona intorno a un’idea semplice ma ambiziosa: i team di sicurezza dovrebbero essere in grado di cercare i filmati delle telecamere con la stessa facilità con cui cercano sul web.
La piattaforma introduce la query in linguaggio naturale attraverso le reti di telecamere, consentendo agli utenti di descrivere ciò che stanno cercando invece di affidarsi a filtri o categorie predefiniti.
Dalle telecamere passive all’intelligenza ricercabile
I sistemi di sorveglianza video tradizionali sono costruiti su regole rigide. Gli operatori devono definire in anticipo cosa rilevare – oggetti specifici, movimenti o comportamenti. Questo approccio spesso si traduce in incidenti mancati e ore di revisione manuale quando si verifica qualcosa di inaspettato.
Conntour sostituisce questo modello con un’interfaccia più flessibile. Invece di configurare gli avvisi in anticipo, gli utenti possono digitare query come “una persona che lascia una borsa incustodita” o “un furgone vicino al molo di caricamento ieri”, e il sistema recupera i filmati rilevanti.
Questo segna un passaggio dalla sorveglianza alla query. Il video non è più qualcosa da guardare – diventa qualcosa che può essere esplorato e interrogato su richiesta.
Costruito per la complessità del mondo reale
Una delle sfide fondamentali nella sorveglianza è che le situazioni del mondo reale raramente si adattano a categorie nette. Il comportamento sospetto è spesso contestuale, coinvolgendo sequenze di azioni piuttosto che un singolo oggetto rilevabile.
Il sistema di Conntour è progettato per gestire questa ambiguità. Funziona sia sui flussi live che sui filmati storici, abilitando avvisi in tempo reale e rapide indagini post-incidente. La piattaforma funziona anche con l’infrastruttura di telecamere esistente e può essere distribuita interamente on-premises, il che è fondamentale per gli ambienti in cui i dati non possono lasciare le reti sicure.
L’interfaccia è costruita per l’usabilità, consentendo agli operatori non tecnici di interagire con sistemi complessi senza dover configurare regole di rilevamento o comprendere i modelli sottostanti.
Primi risultati in ambienti ad alto rischio
La società è già stata distribuita in operazioni di sicurezza nazionale a Singapore, suggerendo un’adozione precoce in ambienti in cui precisione e velocità sono critiche.
La formazione del team fondatore in intelligence e sistemi ad alta tecnologia sembra influenzare il design del prodotto, in particolare la sua attenzione all’efficienza operativa. La piattaforma afferma di consentire a un singolo operatore di monitorare migliaia di telecamere mentre riduce drasticamente il tempo necessario per indagare sugli incidenti.
In confronto ai sistemi di videoanalisi tradizionali, la piattaforma segnala miglioramenti operativi significativi:
- Riduzione del 90% del tempo di revisione manuale del video
- Riduzione dell’80% degli eventi mancati
- Riduzione del 70% delle false allarmi
- La capacità per un operatore di supervisionare migliaia di telecamere
Questi guadagni derivano dal sostituire i flussi di lavoro basati su regole con sistemi che interpretano il contesto e l’intento in modo più dinamico.
Dove questa tecnologia potrebbe condurre
Ciò che Conntour sta costruendo punta a un cambiamento più ampio di come i dati video vengono interpretati – non solo un’analisi più veloce, ma un modello di interazione fondamentalmente diverso. Invece di progettare sistemi intorno a regole di rilevamento predefinite, l’onere si sposta verso la comprensione dell’intento espresso in linguaggio naturale.
Questo cambiamento ha implicazioni che vanno oltre la sicurezza. Se i sistemi possono interpretare in modo affidabile query aperte come “qualcuno che lascia un oggetto dietro” o “movimento insolito vicino a un ingresso”, suggerisce un passaggio verso la comprensione semantica del video – dove il contesto, le relazioni e le sequenze contano tanto quanto gli oggetti individuali.
In scala, ciò potrebbe ridisegnare come le organizzazioni utilizzano gli archivi video. I filmati diventano un set di dati indicizzati che possono essere interrogati dinamicamente invece di essere archiviati passivamente. In ambienti come hub di trasporto, reti di logistica o infrastrutture pubbliche, ciò potrebbe cambiare come gli incidenti vengono ricostruiti, verificati e potenzialmente anticipati.
Sotto il cofano: dal rilevamento alla comprensione
I sistemi tradizionali si basano su modelli di rilevamento di oggetti addestrati a riconoscere categorie specifiche come persone o veicoli. Sebbene efficaci in scenari controllati, questi modelli lottano quando le query cadono al di fuori delle etichette predefinite.
L’approccio di Conntour probabilmente coinvolge la costruzione di rappresentazioni visive più ricche – spesso indicate come embedding – che catturano non solo oggetti, ma attributi, relazioni e cambiamenti nel tempo. Le query in linguaggio naturale possono quindi essere mappate nello stesso spazio di rappresentazione, consentendo al sistema di abbinare l’intento con i dati visivi.
Un’altra sfida chiave è il ragionamento temporale. Molte query del mondo reale coinvolgono sequenze di eventi piuttosto che singoli frame. Supportare ciò richiede il tracciamento di entità nel tempo e la comprensione delle interazioni, non solo l’identificazione di oggetti in isolamento.
Vincoli e compromessi
Nonostante il suo potenziale, questo tipo di sistema introduce nuove sfide. L’elaborazione di grandi volumi di video con modelli avanzati è computazionalmente intensiva, specialmente nelle distribuzioni on-premises dove le risorse sono limitate.
L’accuratezza è un’altra considerazione. Le query aperte introducono ambiguità, e i sistemi devono bilanciare flessibilità e precisione per evitare falsi positivi o rilevamenti mancati. A differenza dei sistemi basati su regole, i sistemi guidati da linguaggio naturale dipendono fortemente da quanto bene i modelli generalizzano ai casi limite.
Ci sono anche implicazioni di governance. La capacità di cercare attributi o comportamenti specifici solleva questioni di supervisione, controllo di accesso e utilizzo appropriato – in particolare in ambienti sensibili o pubblici.
Conntour lancia un cambiamento verso sistemi che possono interpretare l’intento e il contesto in tempo reale.
Se questo modello si dimostra affidabile, potrebbe ridefinire come le organizzazioni interagiscono con i dati video – spostandosi dalla sorveglianza passiva verso l’intelligenza guidata da query dinamiche.












