Entrevistas
Mayank Kumar, Ingeniero de IA Fundador en DeepTempo – Serie de Entrevistas

Mayank Kumar es el Ingeniero de IA Fundador en DeepTempo, donde lidera el diseño y desarrollo del modelo de lenguaje de registro (LogLM) de la empresa. Con una sólida formación académica y de investigación en inteligencia artificial generativa y multimodal, aporta experiencia especializada en la creación de modelos específicos de dominio que mejoran la detección y respuesta a amenazas en entornos de ciberseguridad.
DeepTempo es una empresa de ciberseguridad construida alrededor de LogLM, un modelo de fundación de IA nativo entrenado en grandes cantidades de datos de registros de seguridad. La plataforma excela en la identificación de amenazas avanzadas y no vistas anteriormente, minimizando los falsos positivos. Diseñada para integrarse sin problemas en los flujos de trabajo de seguridad existentes, DeepTempo admite implementaciones en datalakes, Kubernetes y Snowflake, lo que permite una forensia más rápida, una reducción de los costos de ingesta de datos y una defensa automatizada escalable para empresas modernas.
¿Qué te llevó a cofundar DeepTempo, y cómo contribuyó tu experiencia en investigación académica y IA de código abierto a la dirección de la empresa?
Crecí en una comunidad unida donde las relaciones se construían cara a cara, no a través de pantallas. Mi padre, un maestro, me inculcó la importancia de devolver. Aunque no éramos ricos en términos materiales, éramos ricos en conexión y propósito. En ese tipo de entorno, aprendes rápidamente que resolver problemas no se trata solo de talento individual, sino de fuerza colectiva. Esa mentalidad se quedó conmigo y finalmente me llevó a interesarme en el emprendimiento social mientras estudiaba ingeniería en IIT Ropar.
El punto de inflexión llegó cuando el navegador de mi padre fue atacado por un ransomware. No fue solo un problema técnico, introdujo miedo, confusión y vulnerabilidad en nuestro hogar. Esa experiencia me abrió los ojos a la fragilidad del mundo digital, no solo para los individuos, sino también para las organizaciones que están constantemente bajo amenaza. Alrededor de ese tiempo, conocí a Evan, cuya visión para construir una defensa colectiva a escala de internet resonó profundamente conmigo. Esa misión compartida y mi impulso por aplicar la tecnología al servicio de las personas es lo que me llevó a DeepTempo.
En la Universidad de Washington, mi investigación se centró en dos áreas principales: aprendizaje de representación multimodal y IA centrada en los datos. Ambas resultaron fundamentales al construir nuestro modelo de fundación vertical, LogLM. A diferencia del lenguaje natural, los registros de ciberseguridad son desordenados, estructurados y fragmentados. Nuestro primer desafío fue construir un nuevo “lenguaje” para interpretar estos datos, lo que permitiría a LogLM aprender representaciones significativas a partir de estas secuencias. También hemos invertido mucho en cómo evaluamos el rendimiento, porque en seguridad, la precisión no es opcional y las alucinaciones no son aceptables.
Pero más allá de la tecnología, nuestra estrella polar siempre ha sido la defensa colectiva. Es por eso que la colaboración de código abierto será esencial para hacer que esta misión tenga éxito a escala.
¿Qué significa “defensa colectiva” en la práctica, y cómo difiere de los enfoques tradicionales de ciberseguridad?
En la práctica, la defensa colectiva significa que cuando una instancia de LogLM de un cliente identifica un comportamiento de ataque novel, digamos, una campaña de C2 y exfiltración con comportamiento de baliza seguido de una transferencia de datos anormal hacia el exterior, esa información puede ser destilada en una firma de comportamiento generalizada y compartida a través del ecosistema. Crucialmente, esto no implica enviar registros o datos de clientes sin procesar. En su lugar, abstractamos patrones de comportamiento de alta confianza e incorporamoslos en los pesos del modelo a través de técnicas de aprendizaje federado.
Esto es un contraste marcado con los sistemas heredados que confían en reglas de un tamaño único o en feeds de inteligencia de amenazas estáticos. Esos sistemas no evolucionan hasta que múltiples víctimas son afectadas. Con la defensa colectiva, el sistema de detección evoluciona con cada señal de alta calidad, incluso si la amenaza es hiperespecífica de un entorno. Esto nos permite detectar amenazas polimórficas y flujos de ataque agente mejorados por LLM antes de que se vuelvan generalizados.
¿Qué brechas específicas en la seguridad empresarial impulsaron el desarrollo de LogLM, y cómo difiere fundamentalmente de los sistemas de detección más antiguos?
Los equipos de seguridad empresarial enfrentan tres problemas principales: altas relaciones ruido-señal, detecciones frágiles que no se transfieren entre entornos y adaptación lenta a amenazas emergentes. LogLM fue creado para abordar los tres.
La mayoría de los sistemas existentes confían en enfoques basados en reglas o en aprendizaje automático estrecho que requieren semanas o meses de ajuste para comprender un nuevo entorno. Estos enfoques fallan cuando los atacantes cambian ligeramente sus tácticas, como hemos visto con grupos como Scattered Spider o Volt Typhoon. LogLM se entrena en grandes volúmenes de telemetría de seguridad, tratándola como una especie de lenguaje estructurado. Eso le permite reconocer secuencias complejas, como un pico en solicitudes de DNS salientes seguido de actividad de Okta inusual, no como anomalías aisladas, sino como parte de una narrativa de amenaza.
A diferencia de las herramientas heredadas que producen alertas desconectadas, LogLM produce detecciones interpretables a nivel de táctica. Y porque está construido desde cero, en lugar de ser repurposed o adaptado, está diseñado para la seguridad desde el principio, lo que permite una adaptación rápida con solo unos días de registros no etiquetados. Eso hace que la incorporación sea rápida y la detección mucho más resistente.
¿Qué son los agentes sombra, y cómo representan un riesgo para las organizaciones que operan sin supervisión centralizada?
Los agentes sombra son herramientas de IA autónomas, a menudo construidas sobre LLM, que operan dentro de una empresa sin autorización o visibilidad explícita del equipo de seguridad. Un ejemplo reciente es el CVE-2025-32711 de MITRE (“EchoLeak”), una vulnerabilidad de zero-click en Microsoft 365 Copilot desencadenada simplemente pidiendo que resuma correos electrónicos. La falla permite a los atacantes exfiltrar datos internos a través del contexto de RAG del agente, sin interacción del usuario. Aunque estos agentes pueden aumentar la productividad, a menudo evaden la revisión de seguridad y exponen datos sensibles a capas de inferencia no controladas.
Hemos visto casos en los que un agente sombra construido con un LLM público fue expuesto a registros del sistema y comenzó a filtrar trazas de pila que contenían credenciales codificadas. Estos agentes normalmente no están instrumentados con controles de DLP, no siguen políticas de acceso y no son auditados. Peor aún, porque pueden tomar decisiones, como reenviar la salida a sistemas externos, se convierten en superficies de ataque en sí mismos. En el contexto de inyección de comandos o encadenamiento adversario, un solo agente puede ser coaccionado para desencadenar acciones posteriores con impacto real.
¿Por qué la inyección de comandos y la manipulación de modelos se están convirtiendo en amenazas serias, y por qué la mayoría de los sistemas actuales no las detectan?
La inyección de comandos es peligrosa porque explota la función central del modelo: interpretar el lenguaje natural. La mayoría de los sistemas empresariales tratan las salidas del modelo como fiables, pero si el modelo recibe instrucciones ocultas, incrustadas en un comentario de usuario, una llamada a la API o incluso un nombre de archivo, puede ser engañado para realizar acciones no intencionadas. Hemos visto a los adversarios usar esto para extraer credenciales de historias de chat, impersonar a usuarios o eludir la validación de entrada.
El problema más profundo es que los LLM están optimizados para la coherencia, no para la seguridad. Como exploramos en nuestra respuesta reciente al estudio de la Royal Society, los modelos tienden a priorizar la fluidez y la generalidad sobre la precaución y la precisión. Incluso pedirles que “sean más precisos” puede tener consecuencias no deseadas, llevando a respuestas más confiadas pero aún incorrectas. Y la manipulación adversaria del modelo es una preocupación a largo plazo. Los atacantes pueden envenenar conjuntos de datos o sutilmente moldear la salida repitiendo consultas estructuradas con el tiempo, empujando gradualmente al modelo hacia un espacio de comportamiento más permisivo. La detección aquí requiere registro de cadena completa, evaluación continua y aislamiento de modelo en capas, técnicas que la mayoría de los sistemas empresariales aún no han adoptado.
¿Cómo utiliza Tempo los mapeos de MITRE ATT&CK para proporcionar inteligencia accionable en lugar de solo alertas crudas?
Tempo mapea sus detecciones a tácticas y técnicas de ATT&CK utilizando clasificadores supervisados y encadenamiento de comportamiento no supervisado. Cuando el sistema ve una secuencia como una ejecución sospechosa de PowerShell, modificación de claves de registro y tráfico saliente inusual, no solo alerta sobre cada paso, sino que etiqueta la secuencia como Ejecución > Evasión de defensa > Exfiltración, coincidiendo con IDs de ATT&CK conocidos.
Esto permite a los defensores comprender de inmediato el objetivo del adversario y dónde se encuentran en la cadena de ataque. También proporcionamos enriquecimiento: entidades afectadas, registros relacionados y puntuaciones de confianza. Este enfoque estructurado reduce la carga cognitiva para los analistas de SOC y acelera los flujos de respuesta, los equipos saben qué táctica se utilizó, qué la llevó a cabo y qué es probable que sea el próximo paso. Eso es un gran salto desde los sistemas de fatiga de alertas que disparan sobre cada anomalía sin contexto narrativo.
¿Por qué DeepTempo opera aguas arriba de los sistemas de gestión de información y eventos de seguridad (SIEM), y cómo esta posición mejora la detección de amenazas y optimiza las operaciones para los equipos de seguridad?
Los SIEM tienden a normalizar y filtrar los registros para reducir los costos de ingesta. Pero al hacerlo, a menudo pierden contexto valioso, como marcas de tiempo precisas, picos de latencia o comportamientos de sesión efímeros. DeepTempo opera aguas arriba, ingiriendo telemetría cruda antes de esta transformación. Esto nos permite modelar patrones de comportamiento más ricos, como el reuso de tokens de servicio con variaciones de tiempo ligeras o secuencias de llamadas a la API raras que nunca pasarían los umbrales de SIEM.
Trabajar aguas arriba también significa que podemos reducir el ruido antes de que llegue al SIEM. En lugar de empujar petabytes de líneas de registro al día, pasamos 50-100 eventos de alto contexto con enriquecimiento completo de ATT&CK y puntuación basada en modelo. Los equipos dedican menos tiempo a la triage y más tiempo a investigar amenazas que importan. Esto también reduce los costos de almacenamiento y cómputo de SIEM, que pueden ser significativos en entornos grandes.
¿Qué permite a Tempo afinar los modelos para nuevos entornos tan rápidamente, y cómo se compara esto con los flujos de trabajo de aprendizaje automático tradicionales?
Los sistemas de ML tradicionales a menudo requieren semanas de datos etiquetados y reentrenamiento para adaptarse a un nuevo entorno. Tempo toma un enfoque fundamentalmente diferente. En lugar de comenzar desde cero, aprovecha un modelo preentrenado construido en telemetría de red a gran escala, como datos de flujo de red y VPC. Esto le da una comprensión sólida de cómo fluyen el tráfico y los comportamientos típicamente en entornos diversos.
Cuando Tempo se despliega en un nuevo entorno, no necesita datos etiquetados ni ciclos de aprendizaje largos. Utiliza solo unos días de actividad de red local para establecer una línea de base y afinar el modelo para detectar patrones específicos de ese entorno, como acceso fuera de horas inusual, anomalías en la comunicación entre servicios o movimiento de datos inesperado. Esto sucede en horas, no en semanas.
Como el proceso es auto-supervisado, no hay necesidad de que los equipos de seguridad marquen o etiqueten eventos manualmente. Y para mantenerse actualizado a medida que los entornos evolucionan, hemos construido mecanismos de instantáneas que permiten al modelo “olvidar” comportamientos obsoletos cuando la infraestructura o las políticas cambian. Operar a nivel de red nos permite detectar amenazas más temprano y de manera más amplia, algo que distingue a Tempo de las herramientas de seguridad tradicionales centradas en puntos finales o registros.
¿Cómo mantiene DeepTempo una alta precisión mientras minimiza los falsos positivos, especialmente en entornos de nube dinámicos?
Combinamos modelado temporal con análisis de comportamiento de red consciente del contexto, construido directamente sobre registros de flujo de red y VPC. Nuestro enfoque de generación de secuencias nobles combinado con el preentrenamiento a gran escala de algoritmos de aprendizaje profundo basados en transformadores ayuda a comprender cómo se desarrollan los eventos de red con el tiempo. No señalamos un solo inicio de sesión fallido, pero sí señalamos un inicio de sesión fallido seguido de un inicio de sesión exitoso desde un nuevo dispositivo, movimiento lateral y acceso de datos inusual. Este contexto temporal en capas filtra el ruido y resalta amenazas reales y nuevas.
En segundo lugar, perfilamos los comportamientos de usuarios y servicios en contexto. Un nodo de Kubernetes que se reinicia 12 veces es normal durante las actualizaciones, pero es sospechoso a las 2 am si va seguido de una nueva implementación de contenedor desde un registro desconocido. Tempo reconoce esto porque examina la secuencia, el tiempo y el contexto simultáneamente. Además, nuestra canalización de aprendizaje activo monitorea y recopila información sobre estilos de detección específicos. Si la canalización detecta un desvío en el rendimiento o los datos, utilizará las instantáneas y los comentarios de los analistas para afinar un pequeño número de parámetros del modelo.
Construimos nuestra detección sobre metadatos de red de alta fidelidad, combinando inteligencia temporal con creación de perfiles de comportamiento para entregar alertas de alta confianza, incluso en entornos de nube que cambian en un abrir y cerrar de ojos.
¿Cuál es el papel de la explicabilidad en su sistema, y cómo garantiza que las alertas vengan con un contexto interpretable y utilizable?
Cada detección en Tempo incluye un resumen, la evidencia de registro subyacente y la táctica inferida (por ejemplo, Acceso a credenciales a través de fuerza bruta). También proporcionamos un gráfico de entidades relacionadas, usuarios, puntos finales, recursos de nube, para que los equipos de SOC puedan visualizar el incidente. El objetivo es eliminar el efecto de “caja negra” que aqueja a muchos sistemas de IA.
Nos inspiramos en herramientas de explicabilidad académicas como LIME y SHAP en prototipos tempranos, pero encontramos que no eran intuitivas para los analistas. Así que, en su lugar, generamos una narrativa en lenguaje plano: qué sucedió, cuándo, por qué es sospechoso y cuán seguros estamos. Esto no se trata solo de claridad, se trata de permitir que los analistas de nivel uno actúen sin escalar cada alerta.
¿Cuáles son los riesgos a largo plazo de que los atacantes utilicen la IA y los modelos de fundación ellos mismos, y cómo planea DeepTempo mantenerse por delante?
El panorama de amenazas está entrando en una fase en la que los atacantes pueden desplegar agentes de IA que se autoaprenden, mutan las cargas útiles en vuelo y simulan el comportamiento legítimo de los usuarios. Estos agentes pueden ejecutarse las 24 horas del día, los 7 días de la semana, sondeando puntos débiles, adaptándose con cada intento fallido. Eso es un cambio fundamental, ya no se trata de exploits de día cero, sino de velocidad, iteración y ofuscamiento.
Estamos preparándonos invirtiendo en entrenamiento adversario, detección aguas arriba y modelado de comportamiento que no depende de indicadores conocidos. Nuestro objetivo es identificar la estructura de comportamiento malicioso antes de que se intensifique. También estamos explorando formas de identificar el tráfico de atacantes generado por IA, al igual que una vez identificamos las botnets, para que los defensores puedan marcar la actividad incluso cuando las cargas útiles cambian constantemente.
Gracias por la gran entrevista, los lectores que deseen aprender más pueden visitar DeepTempo.












