Entretiens
Mayank Kumar, Ingénieur en intelligence artificielle fondateur de DeepTempo – Série d’entretiens

Mayank Kumar est l’ingénieur en intelligence artificielle fondateur de DeepTempo, où il dirige la conception et le développement du modèle de langage de journal (LogLM) de l’entreprise. Avec une solide formation académique et une expérience de recherche en intelligence artificielle générative et multimodale, il apporte une expertise spécialisée pour construire des modèles spécifiques au domaine qui améliorent la détection et la réponse aux menaces dans les environnements de cybersécurité.
DeepTempo est une entreprise de cybersécurité construite autour de LogLM, un modèle de fondation d’intelligence artificielle formé sur des données de journal de sécurité à grande échelle. La plateforme excelle à identifier les menaces avancées et non encore vues, tout en minimisant les faux positifs. Conçue pour une intégration transparente dans les flux de travail de sécurité existants, DeepTempo prend en charge les déploiements sur des datalakes, Kubernetes et Snowflake, permettant ainsi une forensique plus rapide, une réduction des coûts d’ingestion de données et une défense automatisée et évolutivité pour les entreprises modernes.
Qu’est-ce qui vous a amené à co-fonder DeepTempo, et comment votre expérience de recherche académique et d’intelligence artificielle open-source a-t-elle contribué à l’orientation de l’entreprise ?
J’ai grandi dans une communauté solidaire où les relations étaient construites face à face, et non à travers les écrans. Mon père, un enseignant, m’a inculqué l’importance de donner en retour. Même si nous n’étions pas riches sur le plan matériel, nous étions riches en lien et en but. Dans ce type d’environnement, on apprend rapidement que résoudre des problèmes ne consiste pas seulement à avoir du talent individuel, mais également à avoir de la force collective. Cette mentalité est restée avec moi et m’a finalement conduit à m’intéresser à l’entrepreneuriat social pendant mes études d’ingénierie à l’IIT Ropar.
Le point de basculement est survenu lorsque le navigateur de mon père a été victime d’une attaque de rançongiciel. Ce n’était pas seulement une panne technique, cela a introduit la peur, la confusion et la vulnérabilité dans notre maison. Cette expérience m’a ouvert les yeux sur la fragilité du monde numérique, non seulement pour les individus, mais également pour les organisations constamment menacées. À cette époque, j’ai rencontré Evan, dont la vision pour construire une défense collective à l’échelle de l’Internet résonnait profondément avec moi. Cette mission partagée et mon désir d’appliquer la technologie au service des gens m’ont attiré vers DeepTempo.
À l’Université de Washington, mes recherches se sont concentrées sur deux domaines clés : l’apprentissage de représentation multimodale et l’intelligence artificielle centrée sur les données. Les deux se sont avérés critiques alors que nous construisions notre modèle de fondation vertical, LogLM. Contrairement au langage naturel, les journaux de sécurité sont désordonnés, structurés et fragmentés. Notre premier défi a été de construire un nouveau « langage » pour interpréter ces données, permettant à LogLM d’apprendre des représentations significatives à partir de ces séquences. Nous avons également investi beaucoup dans la façon dont nous évaluons les performances, car dans la sécurité, la précision n’est pas optionnelle et les hallucinations ne sont pas acceptables.
Mais au-delà de la technologie, notre étoile polaire a toujours été la défense collective. C’est pourquoi la collaboration open-source sera essentielle pour rendre cette mission réussie à grande échelle.
Le concept de « défense collective » est central à DeepTempo. Qu’est-ce que cela signifie dans la pratique, et comment diffère-t-il des approches traditionnelles de la cybersécurité ?
Dans la pratique, la défense collective signifie que lorsque l’instance LogLM d’un client identifie un nouveau comportement d’attaque, par exemple, une campagne de C2 et d’exfiltration mettant en œuvre un comportement de balise et un transfert de données anormaux, cette connaissance peut être distillée en une signature comportementale généralisée et partagée à travers l’écosystème. De manière cruciale, cela ne nécessite pas d’envoyer des journaux bruts ou des données client. Au lieu de cela, nous abstrayons des modèles comportementaux de haute confiance et les incorporons dans les poids du modèle grâce à des techniques d’apprentissage fédéré.
Ceci est en contraste frappant avec les systèmes hérités qui s’appuient sur des règles universelles ou des flux de renseignements sur les menaces statiques. Ces systèmes n’évoluent pas jusqu’à ce que de multiples victimes soient touchées. Avec la défense collective, le système de détection évolue avec chaque signal de haute qualité, même si la menace est hyper-spécifique à un environnement. Cela nous permet de détecter les menaces polymorphes et les flux d’attaque agentic renforcés par les modèles de langage avant qu’ils ne deviennent généralisés.
Quels sont les écarts spécifiques en matière de sécurité des entreprises qui ont conduit au développement de LogLM, et comment diffère-t-il fondamentalement des anciens systèmes de détection ?
Les équipes de sécurité des entreprises sont confrontées à trois problèmes majeurs : des rapports bruit/signal élevés, des détections fragiles qui ne sont pas transférables entre les environnements, et une adaptation lente aux menaces émergentes. LogLM a été créé pour résoudre ces trois problèmes.
La plupart des systèmes existants s’appuient sur des approches basées sur des règles ou des approches d’apprentissage automatique étroites qui nécessitent des semaines ou des mois de réglage pour comprendre un nouvel environnement. Ces approches échouent lorsque les attaquants modifient légèrement leurs tactiques, comme nous l’avons vu avec des groupes comme Scattered Spider ou Volt Typhoon. LogLM est formé sur de grandes quantités de télémétrie de sécurité, traitant ces données comme un type de langage structuré. Cela lui permet de reconnaître des séquences complexes, telles qu’une augmentation des requêtes DNS sortantes suivie d’une activité Okta anormale, non comme des anomalies isolées mais comme partie d’un récit de menace.
Contrairement aux outils hérités qui produisent des alertes non connectées, LogLM produit des détections interprétables au niveau des tactiques. Et comme il est construit entièrement à partir de zéro, au lieu d’être réutilisé ou adapté, il est conçu pour la sécurité dès le départ, permettant une adaptation rapide avec seulement quelques jours de journaux non étiquetés. Cela rend l’intégration rapide et la détection beaucoup plus résistante.
Qu’est-ce que les agents fantômes, et comment représentent-ils un risque pour les organisations qui opèrent sans surveillance centralisée ?
Les agents fantômes sont des outils autonomes d’intelligence artificielle, souvent construits sur des modèles de langage, qui opèrent au sein d’une entreprise sans autorisation explicite ou visibilité de l’équipe de sécurité. Un exemple récent est la vulnérabilité zero-click de Microsoft 365 Copilot, déclenchée simplement en demandant à l’agent de résumer des e-mails. La faille permet aux attaquants d’exfiltrer des données internes via le contexte RAG de l’agent, sans interaction utilisateur requise. Même si ces agents peuvent améliorer la productivité, ils contournent souvent la revue de sécurité et exposent des données sensibles à des couches d’inférence non contrôlées.
Nous avons vu des cas où un agent fantôme construit avec un modèle de langage public a été exposé à des journaux de système et a commencé à fuir des traces de pile contenant des informations d’identification codées en dur. Ces agents ne sont généralement pas instrumentés avec des contrôles DLP, ne suivent pas les politiques d’accès et ne sont pas auditées. Pire encore, comme ils peuvent prendre des décisions, telles que le transfert de sortie vers des systèmes externes, ils deviennent des surfaces d’attaque elles-mêmes. Dans le contexte d’injection de prompt ou de chaînage d’attaque, un seul agent peut être contraint de déclencher des actions en aval avec un impact réel.
Pourquoi l’injection de prompt et la manipulation de modèle deviennent-elles des menaces sérieuses, et pourquoi la plupart des systèmes actuels ne les détectent-elles pas ?
L’injection de prompt est dangereuse car elle exploite la fonctionnalité principale du modèle : l’interprétation du langage naturel. La plupart des systèmes d’entreprise traitent les sorties de modèle comme fiables, mais si le modèle reçoit des instructions cachées, intégrées dans un commentaire d’utilisateur, un appel d’API ou même un nom de fichier, il peut être trompé pour effectuer des actions non intentionnelles. Nous avons vu des adversaires utiliser cela pour extraire des informations d’identification à partir de l’historique des discussions, imiter des utilisateurs ou contourner la validation des entrées.
Le problème plus profond est que les modèles de langage sont optimisés pour la cohérence, et non pour la sécurité. Comme nous l’avons exploré dans notre réponse récente à l’étude de la Royal Society, les modèles tendent à privilégier la fluidité et la généralité plutôt que la prudence et la précision. Même les inciter à « être plus précis » peut avoir l’effet inverse, conduisant à des réponses plus confiantes mais toujours incorrectes. Et la manipulation de modèle adversative est une préoccupation à long terme. Les attaquants peuvent empoisonner les ensembles de données ou subtilement façonner les sorties en répétant des requêtes structurées au fil du temps, poussant progressivement le modèle vers un espace comportemental plus permissif. La détection nécessite une journalisation complète de la chaîne, une évaluation continue et un sandboxage de modèle, des techniques que la plupart des systèmes d’entreprise n’ont pas encore adoptées.
Comment Tempo utilise-t-il les mappings MITRE ATT&CK pour fournir une intelligence actionnable plutôt que de simples alertes ?
Tempo mappe ses détections aux tactiques et techniques ATT&CK à l’aide de classificateurs supervisés et de chaînes de comportement non supervisées. Lorsque le système voit une séquence telle qu’une exécution PowerShell suspecte, une modification de clé de registre et un trafic sortant anormal, il ne signale pas simplement chaque étape, mais il étiquette la séquence comme Exécution > Évasion de défense > Exfiltration, en correspondance avec les ID ATT&CK connus.
Cela permet aux défenseurs de comprendre immédiatement l’objectif de l’adversaire et où il se trouve dans la chaîne d’attaque. Nous fournissons également une enrichissement : les entités affectées, les journaux liés et les scores de confiance. Cette approche structurée réduit la charge cognitive pour les analystes SOC et accélère les flux de travail de réponse, les équipes savent quelle tactique a été utilisée, ce qui a conduit à celle-ci et quelle est la prochaine étape probable. C’est un grand pas en avant par rapport aux systèmes d’alerte de fatigue qui se déclenchent sur chaque anomalie sans contexte narratif.
Pourquoi DeepTempo opère-t-il en amont des systèmes de gestion de l’information et des événements de sécurité (SIEM), et comment cette position améliore-t-elle la détection des menaces et rationalise-t-elle les opérations pour les équipes de sécurité ?
Les SIEM tendent à normaliser et à filtrer les journaux pour réduire les coûts d’ingestion. Mais en faisant cela, ils perdent souvent du contexte précieux, tel que des horodatages précis, des pics de latence ou des comportements de session éphémères. DeepTempo opère en amont, ingérant la télémétrie brute avant cette transformation. Cela nous permet de modéliser des modèles de comportement plus riches, comme la réutilisation de jetons de service avec des variations de temporisation légères ou des séquences d’appels d’API rares qui ne feraient jamais partie des seuils SIEM.
Travailler en amont signifie également que nous pouvons réduire le bruit avant qu’il n’atteigne le SIEM. Au lieu de pousser des pétaoctets de lignes de journal par jour, nous transmettons 50 à 100 événements à haute contexte avec une enrichissement ATT&CK complet et un scoring basé sur le modèle. Les équipes passent moins de temps à trier et plus de temps à enquêter sur les menaces qui comptent. Cela réduit également les coûts de stockage et de calcul SIEM, qui peuvent être importants dans les grands environnements.
Qu’est-ce qui permet à Tempo de mettre à jour les modèles pour de nouveaux environnements si rapidement, et comment cela se compare-t-il aux flux de travail d’apprentissage automatique traditionnels ?
Les systèmes de machine learning traditionnels nécessitent souvent des semaines de données étiquetées et de réentraînement pour s’adapter à un nouvel environnement. Tempo adopte une approche fondamentalement différente. Au lieu de partir de zéro, il exploite un modèle préentraîné construit sur une télémétrie réseau à grande échelle, telle que les données de flux NetFlow et VPC. Cela lui donne une solide compréhension de la façon dont les flux de trafic et les comportements se présentent généralement dans divers environnements.
Lorsque Tempo est déployé dans un nouvel environnement, il n’a pas besoin de données étiquetées ou de longs cycles d’apprentissage. Il utilise simplement quelques jours d’activité réseau locale pour établir une ligne de base et se mettre à jour lui-même pour détecter des modèles spécifiques à cet environnement, tels que des accès inhabituels en dehors des heures de travail, des anomalies de communication service-to-service ou des mouvements de données inattendus. Cela se produit en quelques heures, et non en semaines.
Parce que le processus est auto-supervisé, il n’y a pas besoin pour les équipes de sécurité de marquer manuellement ou d’étiqueter des événements. Et pour rester à jour à mesure que les environnements évoluent, nous avons intégré des mécanismes de capture d’instantanés qui permettent au modèle de « oublier » les comportements obsolètes lorsque l’infrastructure ou les politiques changent. L’opération au niveau du réseau nous permet de détecter les menaces plus tôt et plus largement, ce qui nous distingue des outils de sécurité traditionnels centrés sur les points de terminaison ou les journaux.
Comment DeepTempo maintient-il une grande précision tout en minimisant les faux positifs, notamment dans les environnements cloud dynamiques ?
Nous combinons la modélisation temporelle avec l’analyse du comportement réseau sensible au contexte, construite directement sur les journaux de flux NetFlow et VPC. Notre approche de génération de séquences nobles combinée à l’entraînement préalable à grande échelle d’algorithmes d’apprentissage profond basés sur les transformateurs nous aide à comprendre comment les événements réseau se déroulent dans le temps. Nous ne signalons pas simplement une seule tentative de connexion échouée, mais nous signalons une tentative de connexion échouée suivie d’une connexion réussie à partir d’un nouveau périphérique, d’un mouvement latéral et d’un accès de données anormal. Ce contexte temporel couché filtre le bruit et met en évidence les menaces réelles et nouvelles.
Deuxièmement, nous profilons les comportements des utilisateurs et des services dans leur contexte. Un nœud Kubernetes redémarrant 12 fois est normal pendant les mises à jour, mais suspect à 2 heures du matin s’il est suivi d’un nouveau déploiement de conteneur à partir d’un registre inconnu. Tempo reconnaît cela car il examine la séquence, le timing et le contexte simultanément. De plus, notre pipeline d’apprentissage actif surveille activement et collecte des informations sur des styles de détection spécifiques. Si le pipeline détecte un décalage dans les performances ou les données, il utilisera les instantanés et les commentaires des analystes pour affiner un petit nombre de paramètres du modèle.
Nous construisons notre détection sur des métadonnées de réseau brutes et de haute fidélité, combinant l’intelligence temporelle avec le baseline de comportement pour fournir des alertes à haute confiance, même dans les environnements cloud qui changent à la vitesse de l’éclair.
Quel est le rôle de l’explicabilité dans votre système, et comment vous assurez-vous que les alertes viennent avec un contexte utilisable et interprétable ?
Chaque détection dans Tempo inclut un résumé, les preuves de journal sous-jacentes et la tactique inférée (par exemple, Accès aux informations d’identification via force brute). Nous fournissons également un graphique d’entités liées, d’utilisateurs, de points de terminaison, de ressources cloud, afin que les équipes SOC puissent visualiser l’incident. L’objectif est d’éliminer l’effet « boîte noire » qui caractérise de nombreux systèmes d’intelligence artificielle.
Nous avons emprunté à des outils d’explicabilité académiques comme LIME et SHAP dans les prototypes précoces, mais nous avons constaté qu’ils n’étaient pas intuitifs pour les analystes. Nous générons donc un récit en langage clair : ce qui s’est passé, quand, pourquoi c’est suspect et à quel point nous sommes confiants. Ce n’est pas seulement une question de clarté, mais de permettre aux analystes de niveau un de agir sans avoir à escalader chaque alerte.
Quels sont les risques à long terme des attaquants utilisant l’intelligence artificielle et les modèles de fondation eux-mêmes, et comment DeepTempo prévoit-il de rester en tête ?
Le paysage des menaces est en train d’entrer dans une phase où les attaquants peuvent déployer des agents d’intelligence artificielle qui s’auto-apprennent, mutent les charges utiles en temps réel et simulent un comportement d’utilisateur légitime. Ces agents peuvent fonctionner 24 heures sur 24, 7 jours sur 7, en quête de points faibles, en s’adaptant à chaque tentative infructueuse. C’est un changement fondamental ; il ne s’agit plus de vulnérabilités zero-day, mais de vitesse, d’itération et d’obfuscation.
Nous nous préparons en investissant dans la formation adversative, la détection en amont et la modélisation du comportement qui ne repose pas sur des indicateurs connus. Notre objectif est d’identifier la structure de comportement malveillant avant qu’il n’escalade. Nous explorons également des moyens pour identifier les trafics d’attaque générés par l’intelligence artificielle, tout comme nous avons autrefois identifié les botnets, afin que les défenseurs puissent signaler l’activité même lorsque les charges utiles changent constamment.
Merci pour cette grande interview, les lecteurs qui souhaitent en savoir plus peuvent visiter DeepTempo.












