Entrevistas
Jeronimo De Leon, Gerente Senior de Producto de IA en Backblaze – Serie de Entrevistas

Jeronimo De Leon es un líder experimentado en gestión de productos con más de 10 años de experiencia impulsando la innovación basada en IA en entornos empresariales y de inicio. Actualmente, como Gerente Senior de Producto de IA en Backblaze, lidera el desarrollo de características de IA/ML, se centra en cómo Backblaze mejora el ciclo de vida de los datos de IA para las arquitecturas de MLOps de los clientes y implementa herramientas y agentes de IA para optimizar las operaciones internas.
Backblaze es una empresa de almacenamiento en la nube y respaldo que proporciona respaldos automáticos de computadora ilimitados para individuos y empresas, junto con soluciones de almacenamiento de objetos escalables para cargas de trabajo empresariales, de medios y de aplicaciones. Sus servicios se centran en la asequibilidad, la seguridad de los datos, la recuperación sencilla y la compatibilidad sin problemas con los sistemas existentes.
Con más de una década de experiencia en gestión de productos impulsados por IA, desde trabajar con LLM en Intelas y RAG en Welcome.AI hasta lanzar el chatbot de Bloomberg y ahora liderar los esfuerzos de IA en Backblaze, ¿cómo han moldeado estas experiencias su visión sobre el papel del almacenamiento en la nube en la escalabilidad de los flujos de trabajo de IA/ML?
Desde que comencé a trabajar en proyectos de IA en IBM Watson, he visto que el ritmo de la innovación se ha acelerado dramáticamente. Lo que antes llevaba años pasar de la investigación a la producción ahora sucede en meses. Sin embargo, los desafíos fundamentales de infraestructura siguen siendo los mismos: ¿dónde está el dato, dónde lo almacenamos y cómo lo accedemos de manera eficiente?
Antes, las limitaciones eran el cómputo y los modelos, pero ahora tenemos una abundancia de modelos preentrenados y hay muchos proveedores de cómputo. Sin embargo, cuando se inicia un proyecto, típicamente hay que comenzar con un proyecto de recolección y procesamiento de datos, y eso sigue siendo lo mismo hoy en día. Consistentemente veo que las organizaciones encuentran el mismo cuello de botella de consolidar datos de fuentes dispares. Las organizaciones que tienen éxito son aquellas que resuelven la accesibilidad de los datos temprano, creando una base que se escalona con su madurez en IA. Las decisiones de arquitectura de almacenamiento determinan cuán rápido puede llegar a la formación de modelos y innovar.
¿Dónde ve el almacenamiento en la nube desempeñando los roles más críticos a lo largo del ciclo de vida de la IA, desde la ingesta y el procesamiento de datos hasta la formación, el ajuste fino, la inferencia y el monitoreo?
El almacenamiento en la nube es fundamental en todo el ciclo de vida de la IA, con etapas clave en la agregación de datos, el procesamiento, la formación y la inferencia. Al principio, la consolidación sistemática, el catálogo y la seguridad de los archivos aceleran los nuevos proyectos y facilitan la prueba de modelos emergentes. Los datos limpios y bien procesados a menudo superan a los que simplemente tienen más datos, lo que hace que el almacenamiento sea central para la calidad y la escala. Una de mis frases favoritas de Backblaze es: “No es acaparamiento si es datos”. Nunca se sabe cuán valioso será, así que las organizaciones deben recopilar tanto como sea posible. Durante la formación, el almacenamiento escalable garantiza el rendimiento de grandes conjuntos de datos, y en la inferencia, la captura de salidas de predicción y la retroalimentación del usuario permiten la iteración continua. Al final, el almacenamiento es la base que determina cuán rápido puede innovar con la IA.
¿Cuáles son los obstáculos más grandes que enfrentan las organizaciones al escalar el almacenamiento para la IA, y cómo difieren estos desafíos entre las empresas emergentes más pequeñas y las grandes empresas?
Los obstáculos más grandes en la escalabilidad del almacenamiento para la IA son el costo, la gestión de los datos y la accesibilidad. Almacenar grandes volúmenes de datos es solo parte del desafío; también debe estar organizado, recuperable y gobernado con los controles adecuados. Los datos limpios y bien estructurados a menudo son más valiosos que simplemente tener más de ellos.
Para las empresas emergentes, el desafío inicial es adquirir suficientes datos para entrenar y refinar sus modelos. Una vez que los tienen, el costo y la arquitectura se convierten en las siguientes barreras.
Para las grandes empresas, el desafío es la complejidad. Sus datos son abundantes pero fragmentados a través de silos, sistemas heredados y regímenes de cumplimiento, lo que hace que la consolidación y la accesibilidad sean difíciles.
Las organizaciones que tienen éxito tratan el almacenamiento como un habilitador estratégico que se escalona en costo, rendimiento y accesibilidad junto con su madurez en IA.
Entre el costo, la latencia, la seguridad y el cumplimiento, ¿cuál ve como la barrera más apremiante para escalar la IA hoy en día, y cómo deberían priorizar las organizaciones para abordarla?
Entre el costo, la latencia, la seguridad y el cumplimiento, la latencia es una de las barreras más apremiantes. Impacta directamente tanto en la formación como en la inferencia, y la inferencia en particular da forma a la experiencia del usuario. Las organizaciones hacen todo lo posible para reducir la latencia en esta etapa, ya que los retrasos en la prestación de predicciones pueden socavar la adopción.
El costo sigue siendo un desafío constante a medida que crecen los volúmenes de datos, y el cumplimiento se vuelve más crítico a medida que las organizaciones crecen, especialmente en industrias reguladas. Las empresas emergentes a menudo se centran primero en el costo y la latencia, mientras que las empresas deben equilibrar la latencia con la gobernanza y las demandas regulatorias. La prioridad debería ser construir un almacenamiento que minimice la latencia para la formación y la inferencia, mientras sigue siendo rentable y cumple con los requisitos a medida que se expande la adopción de la IA.
Las empresas a menudo enfatizan la necesidad de flexibilidad y acceso fácil a los datos para impulsar la innovación en IA. Desde su perspectiva, ¿qué aspecto tiene la verdadera flexibilidad en el acceso a los datos, y por qué es tan esencial?
En una charla reciente que di, enfatizé la idea de archivo inteligente. La verdadera flexibilidad en el acceso a los datos comienza con la centralización de la información en un archivo estructurado y buscable. Eso significa unificar formatos diversos, normalizar y etiquetar para la coherencia, y permitir la indexación para futuras consultas. Este enfoque garantiza que los datos no solo se almacenan, sino que se hacen útiles.
Es esencial porque establece la base para el análisis y la modelización. Cuando los datos están estructurados y son buscables, los equipos pueden moverse más rápido, experimentar con más libertad y reducir la latencia tanto en la formación como en la inferencia. Sin este tipo de flexibilidad, el almacenamiento pronto se convierte en un cuello de botella en lugar de un habilitador para la innovación en IA.
¿Puede compartir casos de uso del mundo real, como con clientes como Decart AI o Wynd Labs, que demuestran cómo el enfoque correcto de almacenamiento en la nube puede habilitar directamente la innovación en IA?
Estos son dos ejemplos excelentes de cómo el enfoque correcto de almacenamiento en la nube puede habilitar directamente la innovación en IA. Decart se centró en la formación de modelos, donde mover datos al cómputo de manera eficiente era fundamental. Con Backblaze B2, escalaron a 16 PB en 90 días, entrenaron en múltiples clústeres de GPU con cero costo de salida y lograron diez veces la eficiencia de los competidores. Esa confiabilidad y eficiencia les permitió innovar más rápido.
Wynd Labs se centró en el acceso de los clientes a los datos. Ingerían petabytes diariamente y servían decenas de petabytes mensualmente. Con el rendimiento de alta velocidad y la salida gratuita de Backblaze, pudieron escalar para satisfacer la demanda empresarial y reinvertir recursos en el desarrollo de productos. Esa capacidad para entregar acceso a los datos a escala desbloqueó nuevas oportunidades para su plataforma.
En ambos casos, la estrategia de almacenamiento correcta transformó la infraestructura de una limitación en un habilitador, permitiendo a las empresas centrarse en innovar en IA en lugar de gestionar costos y complejidad.
¿Qué orientación daría a las organizaciones que intentan equilibrar el rendimiento de almacenamiento con la eficiencia de costo, a medida que los modelos y conjuntos de datos de IA crecen en complejidad?
Las organizaciones necesitan pensar en su uso de datos a largo plazo con su producto en mente. Recopilar, procesar, mover y ejecutar inferencia en los datos será fundamental para cómo evoluciona su producto y su organización. Si no tienen en cuenta eso ahora, los costos y los desafíos de almacenamiento solo se multiplicarán con el tiempo. Dado que la IA será una parte central de su producto y su organización, el almacenamiento debe diseñarse temprano para equilibrar el rendimiento con la eficiencia de costo, de modo que pueda escalarse suavemente a medida que crezcan.
La seguridad y el cumplimiento son especialmente apremiantes en las industrias reguladas. ¿Cómo ve evolucionar el almacenamiento en la nube para respaldar las necesidades de gobernanza, permitiendo a los equipos innovar rápidamente?
La gobernanza es una parte clave del almacenamiento. Simplificar el acceso con una base sólida para cómo se gestiona, se segura y se audita los datos es fundamental. Veo que el almacenamiento en la nube evoluciona con controles más fuertes integrados, como la cifrado por defecto, permisos granulares, registros de auditoría y opciones de residencia de datos. Igual de importante es la genealogía de los datos. En IA, saber de dónde vienen los datos, cómo se han procesado y cómo alimentan a los modelos es esencial tanto para el cumplimiento como para la confianza.
Al mismo tiempo, las plataformas de almacenamiento están mejorando la usabilidad para que los equipos puedan moverse rápidamente. Cuando la gobernanza, la genealogía y la accesibilidad trabajan juntas, las organizaciones pueden cumplir con los requisitos regulatorios mientras continúan innovando con la IA a velocidad.
Para las organizaciones que evalúan o migran a B2, ¿qué asesoramiento o orientación proporciona en términos de implementación, particularmente en cuanto a la migración de datos, la integración con las pilas de cómputo o MLOps existentes, o la optimización para el rendimiento y la salida?
Dado que B2 es compatible con S3, se integra directamente en las pilas de cómputo y MLOps existentes sin necesidad de re-arquitectura. A menudo trabajamos con clientes en un concepto de prueba para validar la migración, el rendimiento y la integración antes de escalar. A partir de ahí, el enfoque está en optimizar el rendimiento, el movimiento de datos y la orquestación de datos para que los equipos puedan entrenar en clústeres, ejecutar inferencia y iterar rápidamente sin ser frenados por cuellos de botella de infraestructura.
¿Cómo está evolucionando Backblaze sus ofertas de almacenamiento para satisfacer las necesidades emergentes, especialmente con tendencias alrededor de LLM, conjuntos de datos a escala de exabyte y estrategias híbridas o multi-nube?
En Backblaze, nos centramos no solo en cómo se utilizan los datos hoy, sino en cómo se orquestarán en el futuro. El almacenamiento ya no es solo un archivo, se está convirtiendo en una herramienta que permite el acceso rápido, el movimiento eficiente y la orquestación confiable de los datos en los entornos. Con LLM y conjuntos de datos a escala de exabyte, esta base de acceso fácil y alto rendimiento será fundamental no solo para la formación y la inferencia, sino también para la clase emergente de agentes de IA que dependen de los datos para hacer que los procesos sean más autónomos. El resultado es una base de almacenamiento que habilita la innovación ahora y prepara a las organizaciones para lo que viene a continuación.
Gracias por la excelente entrevista, los lectores que deseen aprender más pueden visitar Backblaze.












