Entrevistas
Saket Saurabh, CEO y Co-Fundador de Nexla – Serie de Entrevistas

Saket Saurabh, CEO y Co-Fundador de Nexla, es un empresario con una profunda pasión por los datos y la infraestructura. Está liderando el desarrollo de una plataforma de ingeniería de datos automatizada de próxima generación diseñada para aportar escala y velocidad a aquellos que trabajan con datos.
Anteriormente, Saurabh fundó una startup de móviles exitosa que logró hitos significativos, incluida la adquisición, la IPO y el crecimiento hasta convertirse en un negocio de varios millones de dólares. También contribuyó a múltiples productos y tecnologías innovadoras durante su período en Nvidia.
Nexla permite la automatización de la ingeniería de datos para que los datos estén listos para su uso. Logran esto a través de un enfoque único de Nexsets – productos de datos que facilitan a cualquiera integrar, transformar, entregar y monitorear datos.
¿Qué te inspiró a co-fundar Nexla, y cómo moldearon tus experiencias en ingeniería de datos tu visión para la empresa?
Antes de fundar Nexla, comencé mi viaje en ingeniería de datos en Nvidia construyendo tecnología de cómputo de alta gama y escalable. Después de eso, llevé a mi startup anterior a través de un viaje de adquisición y IPO en el espacio de publicidad móvil, donde grandes cantidades de datos y aprendizaje automático fueron una parte fundamental de nuestra oferta, procesando alrededor de 300 mil millones de registros de datos todos los días.
Al observar el panorama en 2015 después de que mi empresa anterior salió a bolsa, estaba buscando el próximo gran desafío que me emocionara. Viniendo de esas dos experiencias, estaba muy claro para mí que los desafíos de datos y cómputo estaban convergiendo a medida que la industria se movía hacia aplicaciones más avanzadas impulsadas por datos y IA.
Aunque no sabíamos en ese momento que la IA Generativa (GenAI) progresaría tan rápidamente como lo ha hecho, estaba obvio que el aprendizaje automático y la IA serían la base para aprovechar los datos. Así que comencé a pensar en qué tipo de infraestructura se necesita para que la gente tenga éxito al trabajar con datos, y cómo podemos hacer posible que cualquier persona, no solo ingenieros, pueda aprovechar los datos en su vida laboral diaria.
Eso llevó a la visión para Nexla – simplificar y automatizar la ingeniería detrás de los datos, ya que la ingeniería de datos era una solución muy personalizada dentro de la mayoría de las empresas, especialmente al tratar con problemas de datos complejos o a gran escala. El objetivo era hacer que los datos sean accesibles y asequibles para una gama más amplia de usuarios, no solo ingenieros de datos. Mis experiencias en la construcción de sistemas y aplicaciones de datos escalables alimentaron esta visión de democratizar el acceso a los datos a través de la automatización y la simplificación.
¿Cómo ejemplifican los Nexsets la misión de Nexla de hacer que los datos estén listos para su uso para todos, y por qué es esta innovación crucial para las empresas modernas?
Los Nexsets ejemplifican la misión de Nexla de hacer que los datos estén listos para su uso para todos al abordar el desafío central de los datos. Las 3V de los datos – volumen, velocidad y variedad – han sido un problema persistente. La industria ha hecho algún progreso en abordar los desafíos con el volumen y la velocidad. Sin embargo, la variedad de los datos ha seguido siendo un obstáculo significativo a medida que la proliferación de nuevos sistemas y aplicaciones ha llevado a una diversidad cada vez mayor en las estructuras y formatos de los datos.
El enfoque de Nexla es modelar y conectar automáticamente los datos de fuentes diversas en una entidad coherente y empaquetada, un producto de datos que llamamos Nexset. Esto permite a los usuarios acceder y trabajar con los datos sin tener que entender la complejidad subyacente de las diversas fuentes y estructuras de los datos. Un Nexset actúa como una puerta de enlace, proporcionando una interfaz simple y directa a los datos.
Esto es crucial para las empresas modernas porque permite que más personas, no solo ingenieros de datos, aprovechen los datos en su trabajo diario. Al abstraer la variedad y la complejidad de los datos, los Nexsets hacen posible que los usuarios comerciales, analistas y otros interactúen directamente con los datos que necesitan, sin requerir una amplia experiencia técnica.
También trabajamos en hacer que la integración sea fácil de usar para los consumidores de datos menos técnicos – desde la interfaz de usuario y cómo la gente colabora y gobierna los datos hasta cómo construyen transformaciones y flujos. Abstraer la complejidad de la variedad de los datos es clave para democratizar el acceso a los datos y empoderar a una gama más amplia de usuarios para derivar valor de sus activos de información. Esta es una capacidad crítica para las empresas modernas que buscan volverse más impulsadas por los datos y aprovechar las perspectivas impulsadas por los datos en toda la organización.
¿Qué hace que los datos estén “listos para GenAI”, y cómo aborda Nexla efectivamente estos requisitos?
La respuesta depende en parte de cómo se está utilizando la GenAI. La mayoría de las empresas están implementando la recuperación de GenAI mejorada (RAG). Esto requiere primero preparar y codificar los datos para cargarlos en una base de datos vectorial, y luego recuperar los datos a través de la búsqueda para agregarlos como contexto a una gran modelo de lenguaje (LLM) que no ha sido entrenado con estos datos. Así que los datos necesitan estar preparados de tal manera que funcionen bien tanto para las búsquedas vectoriales como para las LLM.
Independientemente de si se está utilizando RAG, Recuperación de Ajuste de GenAI (RAFT) o realizando un entrenamiento de modelo, hay algunos requisitos clave:
- Formato de datos: las LLM de GenAI a menudo funcionan mejor con datos en un formato específico. Los datos necesitan estar estructurados de una manera que los modelos puedan ingerir y procesar fácilmente. También deben estar “divididos” de una manera que ayude a la LLM a utilizar mejor los datos.
- Conectividad: las LLM de GenAI necesitan poder acceder dinámicamente a las fuentes de datos relevantes, en lugar de confiar en conjuntos de datos estáticos. Esto requiere una conectividad continua a los diversos sistemas y repositorios de datos empresariales.
- Seguridad y gobernanza: al utilizar datos empresariales sensibles, es fundamental tener controles de seguridad y gobernanza robustos. El acceso y el uso de los datos necesitan ser seguros y cumplir con las políticas organizacionales existentes. También es necesario gobernar los datos utilizados por las LLM para ayudar a prevenir violaciones de datos.
- Escalabilidad: las LLM de GenAI pueden ser intensivas en datos y cómputo, así que la infraestructura de datos subyacente necesita poder escalar para satisfacer las demandas de estos modelos.
Nexla aborda estos requisitos para hacer que los datos estén listos para GenAI de varias maneras clave:
- Acceso dinámico a los datos: la plataforma de integración de datos de Nexla proporciona una forma única de conectarse a cientos de fuentes y utiliza varios estilos de integración y velocidad de datos, junto con la orquestación, para proporcionar a las LLM de GenAI los datos más recientes que necesitan, cuando los necesitan, en lugar de confiar en conjuntos de datos estáticos.
- Preparación de datos: Nexla tiene la capacidad de extraer, transformar y preparar los datos en formatos optimizados para cada caso de uso de GenAI, incluida la división de datos integrada y el soporte para múltiples modelos de codificación.
- Auto-generación: la integración y la GenAI son ambas difíciles. Nexla auto-genera muchos de los pasos necesarios en función de las elecciones realizadas por el consumidor de datos – utilizando la IA y otras técnicas – para que los usuarios puedan realizar el trabajo por su cuenta.
- Gobernanza y seguridad: Nexla incorpora controles de seguridad y gobernanza robustos en todo, incluida la colaboración, para asegurar que los datos empresariales sensibles se accedan y utilicen de una manera segura y cumplida.
- Escalabilidad: la plataforma de Nexla está diseñada para escalar para manejar las cargas de trabajo de GenAI, proporcionando la potencia de cómputo y la escalabilidad elástica necesarias.
La integración convergente, la colaboración y la auto-generación necesitan estar construidas juntas para hacer posible la democratización de los datos.
¿Cómo contribuyen los tipos y fuentes de datos diversos al éxito de los modelos de GenAI, y qué papel juega Nexla en la simplificación del proceso de integración?
Los modelos de GenAI necesitan acceso a todo tipo de información para ofrecer las mejores perspectivas y generar resultados relevantes. Si no se proporciona esta información, no se deben esperar buenos resultados. Es lo mismo con las personas.
Los modelos de GenAI necesitan ser entrenados con una amplia gama de datos, desde bases de datos estructuradas hasta documentos no estructurados, para construir una comprensión integral del mundo. Diferentes fuentes de datos, como artículos de noticias, informes financieros y interacciones con clientes, proporcionan información contextual valiosa que estos modelos pueden aprovechar. La exposición a datos diversos también permite que los modelos de GenAI se vuelvan más flexibles y adaptables, lo que les permite manejar una gama más amplia de consultas y tareas.
Nexla abstrae la variedad de todos estos datos con Nexsets y facilita el acceso a casi cualquier fuente, luego extrae, transforma, orquesta y carga los datos para que los consumidores de datos se puedan centrar solo en los datos y en hacerlos listos para GenAI.
¿Qué tendencias están dando forma al ecosistema de datos en 2025 y más allá, particularmente con el auge de la GenAI?
Las empresas se han centrado principalmente en utilizar la GenAI para construir asistentes o copilotos para ayudar a las personas a encontrar respuestas y tomar mejores decisiones. La IA agente, agentes que automatizan tareas sin la participación de las personas, es definitivamente una tendencia en crecimiento a medida que nos movemos hacia 2025. Los agentes, al igual que los copilotos, necesitan integración para asegurar que los datos fluyan sin problemas, no solo en una dirección sino también en la habilitación de la IA para actuar sobre esos datos.
Otra tendencia importante para 2025 es la creciente complejidad de los sistemas de IA. Estos sistemas se están volviendo más sofisticados al combinar componentes de diferentes fuentes para crear soluciones coherentes. Es similar a cómo los humanos confían en diversas herramientas a lo largo del día para realizar tareas. Los sistemas de IA empoderados seguirán este enfoque, orquestando múltiples herramientas y componentes. Esta orquestación presenta un desafío significativo pero también un área clave de desarrollo.
Desde una perspectiva de tendencias, estamos viendo un impulso hacia la IA generativa que avanza más allá del simple reconocimiento de patrones hacia el razonamiento real. Hay mucho progreso tecnológico sucediendo en este espacio. Aunque estos avances pueden no traducirse completamente en valor comercial en 2025, representan la dirección hacia la que nos dirigimos.
Otra tendencia clave es la aplicación creciente de tecnologías aceleradas para la inferencia de IA, particularmente con empresas como Nvidia. Tradicionalmente, las GPU se han utilizado mucho para el entrenamiento de modelos de IA, pero la inferencia en tiempo de ejecución – el punto en el que el modelo se utiliza activamente – se está volviendo igualmente importante. Podemos esperar avances en la optimización de la inferencia, lo que la hará más eficiente y de mayor impacto.
Además, hay una comprensión de que los datos de entrenamiento disponibles han sido en gran medida maximizados. Esto significa que las mejoras adicionales en los modelos no vendrán de agregar más datos durante el entrenamiento, sino de cómo los modelos operan durante la inferencia. En tiempo de ejecución, aprovechar nueva información para mejorar los resultados del modelo se está convirtiendo en un enfoque crítico.
Aunque algunas tecnologías emocionantes comienzan a alcanzar sus límites, nuevos enfoques seguirán surgiendo, lo que en última instancia destaca la importancia de la agilidad para las organizaciones que adoptan la IA. Lo que funciona bien hoy puede volverse obsoleto dentro de seis meses a un año, así que es fundamental estar preparado para agregar o reemplazar fuentes de datos y cualquier componente de las tuberías de IA. Mantenerse adaptable y abierto al cambio es crucial para mantenerse al día con el panorama en constante evolución.
¿Qué estrategias pueden adoptar las organizaciones para romper los silos de datos y mejorar el flujo de datos a través de sus sistemas?
Primero, la gente necesita aceptar que los silos de datos siempre existirán. Esto siempre ha sido el caso. Muchas organizaciones intentan centralizar todos sus datos en un solo lugar, creyendo que crearán un entorno ideal y desbloquearán un valor significativo, pero esto resulta casi imposible. A menudo se convierte en una empresa larga y costosa que dura varios años, particularmente para las grandes empresas.
Así que la realidad es que los silos de datos están aquí para quedarse. Una vez que aceptamos eso, la pregunta se convierte en: ¿Cómo podemos trabajar con los silos de datos de manera más eficiente?
Una analogía útil es pensar en grandes empresas. Ninguna gran corporación opera desde una sola oficina donde todos trabajan juntos a nivel global. En cambio, se dividen en sede central y múltiples oficinas. El objetivo no es resistir esta división natural, sino asegurarse de que esas oficinas puedan colaborar de manera efectiva. Eso es por lo que invertimos en herramientas de productividad como Zoom o Slack – para conectar a las personas y habilitar flujos de trabajo sin problemas en varias ubicaciones.
De manera similar, los silos de datos son sistemas fragmentados que siempre existirán a través de equipos, divisiones u otros límites. El objetivo no es eliminarlos, sino hacer que funcionen juntos de manera suave. Sabiendo esto, podemos centrarnos en tecnologías que faciliten estas conexiones.
Por ejemplo, tecnologías como Nexsets proporcionan una interfaz común o una capa de abstracción que funciona en diversas fuentes de datos. Al actuar como una puerta de enlace a los silos de datos, simplifican el proceso de interoperar con los datos dispersos en varios silos. Esto crea eficiencias y minimiza los impactos negativos de los silos.
En esencia, la estrategia debe ser sobre la mejora de la colaboración entre los silos en lugar de tratar de luchar contra ellos. Muchas empresas cometen el error de intentar consolidar todo en un gran lago de datos. Pero, para ser honestos, esa es una batalla casi imposible de ganar.
¿Cómo manejan las plataformas de datos modernas desafíos como la velocidad y la escalabilidad, y qué distingue a Nexla al abordar estos problemas?
La forma en que lo veo, muchas herramientas dentro de la pila de datos moderna se diseñaron inicialmente con un enfoque en la facilidad de uso y la velocidad de desarrollo, lo que surgió al hacer que las herramientas fueran más accesibles – permitiendo que los analistas de marketing muevan sus datos desde una plataforma de marketing directamente a una herramienta de visualización, por ejemplo. La evolución de estas herramientas a menudo involucró el desarrollo de soluciones de punto, o herramientas diseñadas para resolver problemas específicos y estrechamente definidos.
Cuando hablamos de escalabilidad, la gente a menudo piensa en la escalabilidad en términos de manejar volúmenes de datos más grandes. Pero el desafío real de la escalabilidad proviene de dos factores principales: el número creciente de personas que necesitan trabajar con los datos y la creciente variedad de sistemas y tipos de datos que las organizaciones necesitan administrar.
Las herramientas modernas, al ser altamente especializadas, tienden a resolver solo un subconjunto de estos desafíos. Como resultado, las organizaciones terminan utilizando múltiples herramientas, cada una abordando un problema único, lo que eventualmente crea sus propios desafíos, como la sobrecarga de herramientas y la ineficiencia.
Nexla aborda este problema equilibrando cuidadosamente la facilidad de uso y la flexibilidad. Por un lado, proporcionamos simplicidad a través de características como plantillas y interfaces de usuario amigables. Por otro lado, ofrecemos capacidades flexibles y amigables para los desarrolladores que permiten a los equipos mejorar continuamente la plataforma. Los desarrolladores pueden agregar nuevas capacidades al sistema, pero estas mejoras permanecen accesibles como botones y clics simples para los usuarios no técnicos. Este enfoque evita la trampa de herramientas excesivamente especializadas mientras entrega una gama amplia de funcionalidades de nivel empresarial.
Lo que realmente distingue a Nexla es su capacidad para combinar la facilidad de uso con la escalabilidad y la amplitud requeridas por las organizaciones. Nuestra plataforma conecta estos dos mundos de manera fluida, permitiendo a los equipos trabajar de manera eficiente sin comprometer el poder o la flexibilidad.
Una de las principales fortalezas de Nexla radica en su arquitectura abstracta. Por ejemplo, mientras que los usuarios pueden diseñar visualmente una tubería de datos, la forma en que se ejecuta esa tubería es altamente adaptable. Dependiendo de los requisitos del usuario – como la fuente, el destino o si los datos necesitan ser en tiempo real – la plataforma asigna automáticamente la tubería a uno de los seis diferentes motores. Esto garantiza un rendimiento óptimo sin requerir que los usuarios administren estas complejidades manualmente.
La plataforma también está suelta, lo que significa que los sistemas de origen y destino están desconectados. Esto permite a los usuarios agregar fácilmente más destinos a fuentes existentes, agregar más fuentes a destinos existentes y habilitar integraciones bidireccionales entre sistemas.
Es importante que Nexla abstraiga el diseño de las tuberías para que los usuarios puedan manejar datos por lotes, datos de transmisión y datos en tiempo real sin cambiar sus flujos de trabajo o diseños. La plataforma se adapta automáticamente a estas necesidades, lo que facilita a los usuarios trabajar con los datos en cualquier formato o velocidad. Esto se trata más de un diseño reflexivo que de especificidades del lenguaje de programación, garantizando una experiencia fluida.
Todo esto ilustra que construimos Nexla con el consumidor final de los datos en mente. Muchas herramientas tradicionales se diseñaron para aquellos que producen datos o administran sistemas, pero nos centramos en las necesidades de los consumidores de datos que desean interfaces coherentes y directas para acceder a los datos, independientemente de su origen. Priorizar la experiencia del consumidor nos permitió diseñar una plataforma que simplifica el acceso a los datos mientras mantiene la flexibilidad necesaria para admitir diversos casos de uso.
¿Puede compartir ejemplos de cómo las características de código bajo y sin código han transformado la ingeniería de datos para sus clientes?
Las características de código bajo y sin código han transformado el proceso de ingeniería de datos en una experiencia verdaderamente colaborativa para los usuarios. Por ejemplo, en el pasado, el equipo de operaciones de cuenta de DoorDash, que administra los datos de los comerciantes, necesitaba proporcionar requisitos al equipo de ingeniería. Los ingenieros luego construirían soluciones, lo que llevaba a un proceso iterativo de ida y vuelta que consumía mucho tiempo.
Ahora, con herramientas de código bajo y sin código, esta dinámica ha cambiado. El equipo de operaciones diarias puede usar una interfaz de código bajo para manejar sus tareas directamente. Mientras tanto, el equipo de ingeniería puede agregar rápidamente nuevas características y capacidades a través de la misma plataforma de código bajo, lo que permite actualizaciones inmediatas. El equipo de operaciones puede utilizar estas características de inmediato sin retrasos.
Este cambio ha convertido el proceso en una colaboración en lugar de un cuello de botella creativo, lo que ha resultado en un ahorro de tiempo significativo. Los clientes han informado que las tareas que anteriormente tomaban dos o tres meses ahora se pueden completar en menos de dos semanas, una mejora de 5 a 10 veces en la velocidad.
¿Cómo está evolucionando el papel de la ingeniería de datos, particularmente con la creciente adopción de la IA?
La ingeniería de datos está evolucionando rápidamente, impulsada por la automatización y los avances como la GenAI. Muchos aspectos del campo, como la generación de código y la creación de conectores, se están volviendo más rápidos y eficientes. Por ejemplo, con la GenAI, el ritmo al que se pueden generar, probar y implementar conectores ha mejorado drásticamente. Sin embargo, este progreso también introduce nuevos desafíos, incluida la creciente complejidad, las preocupaciones de seguridad y la necesidad de una gobernanza robusta.
Una preocupación apremiante es el posible mal uso de los datos empresariales. Las empresas se preocupan por sus datos propietarios utilizados inadvertidamente para entrenar modelos de IA y perder su ventaja competitiva o experimentar una violación de datos a medida que los datos se filtran a otros. La creciente complejidad de los sistemas y la gran cantidad de datos requieren que los equipos de ingeniería de datos adopten una perspectiva más amplia, centrándose en problemas de sistemas más amplios como la seguridad, la gobernanza y garantizar la integridad de los datos. Estos desafíos no pueden resolverse simplemente con la IA.
Si bien la IA generativa puede automatizar tareas de bajo nivel, el papel de la ingeniería de datos se está desplazando hacia la orquestación del ecosistema más amplio. Los ingenieros de datos ahora actúan más como directores, administrando numerosos componentes y procesos interconectados, como establecer salvaguardias para prevenir errores o acceso no autorizado, garantizar el cumplimiento de los estándares de gobernanza y monitorear cómo se utilizan los resultados generados por la IA en las decisiones comerciales.
Los errores y los errores en estos sistemas pueden ser costosos. Por ejemplo, los sistemas de IA pueden extraer información de políticas obsoletas, lo que lleva a respuestas incorrectas, como prometer un reembolso a un cliente cuando no está permitido. Este tipo de problemas requiere una supervisión rigurosa y procesos bien definidos para detectar y abordar estos errores antes de que afecten el negocio.
Otra responsabilidad clave para los equipos de ingeniería de datos es adaptarse al cambio en la demografía de los usuarios. Las herramientas de IA ya no están limitadas a los analistas o usuarios técnicos que pueden cuestionar la validez de los informes y los datos. Estas herramientas ahora se utilizan por personas en los bordes de la organización, como los agentes de soporte al cliente, que pueden no tener la experiencia para desafiar los resultados incorrectos. Esta democratización más amplia de la tecnología aumenta la responsabilidad de los equipos de ingeniería de datos para garantizar la precisión y la confiabilidad de los datos.
¿Qué nuevas características o avances se pueden esperar de Nexla a medida que el campo de la ingeniería de datos continúa creciendo?
Estamos centrados en varios avances para abordar los desafíos y oportunidades emergentes a medida que la ingeniería de datos continúa evolucionando. Uno de estos es soluciones impulsadas por la IA para abordar la variedad de los datos. Uno de los principales desafíos en la ingeniería de datos es administrar la variedad de los datos de fuentes diversas, así que estamos aprovechando la IA para simplificar este proceso. Por ejemplo, al recibir datos de cientos de comerciantes diferentes, el sistema puede mapearlos automáticamente en una estructura estándar. Hoy en día, este proceso a menudo requiere una cantidad significativa de entrada humana, pero las capacidades impulsadas por la IA de Nexla apuntan a minimizar el esfuerzo manual y mejorar la eficiencia.
También estamos avanzando en nuestra tecnología de conectores para admitir la próxima generación de flujos de trabajo de datos, incluida la capacidad de generar fácilmente nuevos agentes. Estos agentes permiten conexiones sin problemas a nuevos sistemas y permiten a los usuarios realizar acciones específicas dentro de esos sistemas. Esto está dirigido particularmente a las crecientes necesidades de los usuarios de GenAI y facilita la integración y la interacción con una variedad de plataformas.
En tercer lugar, seguimos innovando en la mejora de la supervisión y la garantía de calidad. A medida que más usuarios consumen datos a través de varios sistemas, la importancia de la supervisión y la garantía de calidad de los datos ha crecido significativamente. Nuestro objetivo es proporcionar herramientas robustas para la supervisión del sistema y la garantía de calidad para que los datos sigan siendo confiables y utilizables incluso a medida que el uso se amplía.
Finalmente, Nexla también está tomando medidas para abrir algunas de nuestras capacidades centrales. La idea es que al compartir nuestra tecnología con la comunidad más amplia, podemos empoderar a más personas para aprovechar las herramientas y soluciones de ingeniería de datos avanzadas, lo que refleja nuestro compromiso de fomentar la innovación y la colaboración dentro del campo.
Gracias por las grandes respuestas, los lectores que deseen aprender más deben visitar Nexla.












