Entrevistas

Dr. Yair Adato, CEO y fundador de Bria – Serie de entrevistas

mm

Dr. Yair Adato, CEO y fundador de Bria, es un experto en aprendizaje automático y visión por computadora reconocido por su capacidad para combinar tecnología avanzada con aplicaciones empresariales del mundo real. Antes de fundar Bria, se desempeñó como CTO de Trax Retail, donde jugó un papel central en la transformación de la empresa de una startup de 20 personas a un unicornio global con más de 850 empleados. A lo largo de su carrera, Yair también ha contribuido como asesor en varias empresas impulsadas por IA, incluyendo Sparx, Vicomi, Tasq, DataGen y Anima. Su liderazgo se caracteriza por un fuerte compromiso con la innovación responsable, la propiedad de datos y la democratización de la tecnología de IA.

Bria es una empresa pionera en el campo de la IA generativa visual responsable, fundada con la misión de crear una plataforma abierta y ética para la generación de imágenes. El enfoque único de la empresa recompensa a los propietarios de datos por sus contribuciones a través de un motor de atribución, garantizando la transparencia y la equidad en el ecosistema de IA. Al centrarse en la creatividad, la colaboración y el cumplimiento, Bria permite a las organizaciones integrar la IA generativa de manera segura en sus flujos de trabajo, estableciendo nuevos estándares para la rendición de cuentas y la confianza en la industria de contenido visual..

Fundaste Bria para crear una plataforma responsable y abierta para la IA generativa visual. ¿Qué te inspiró a iniciar la empresa y qué desafíos o conocimientos iniciales dieron forma a su dirección?

Vi a Goodfellow presentar el papel de GAN en 2014, y fue inmediatamente claro que la producción creativa iba a cambiar fundamentalmente. Al ver esa presentación, las implicaciones eran obvias: esto no era solo una mejora incremental, era un paradigma diferente para cómo las máquinas podían aprender a generar contenido visual.

Pero desde el principio, reconocí una brecha fundamental en cómo se estaban construyendo estos sistemas: no había rendición de cuentas por los datos de entrenamiento, no había marco para el despliegue responsable, no había consideración para los creadores cuyo trabajo hacía posible todo.

Los desafíos iniciales no eran técnicos, eran estructurales. ¿Cómo se construye una IA generativa que mejore el trabajo creativo sin socavar a las personas que crean? ¿Cómo se hace que estos sistemas sean utilizables en entornos de producción donde la certeza legal es tan importante como la calidad de la salida? Esas preguntas dieron forma a todo lo que construimos. Fundamos Bria sobre el principio de que la innovación y la responsabilidad no son fuerzas opuestas, deben avanzar juntas, o la tecnología falla a todos.

Tu formación académica en visión por computadora y tus más de 50 patentes conectan la investigación y la innovación del mundo real. ¿Cómo ha influido esa experiencia en la hoja de ruta técnica y la estrategia a largo plazo de Bria?

Mi experiencia en investigación me enseñó a pensar en sistemas, cómo diferentes capas de comprensión se conectan para formar significado. Muchas de mis patentes se centran en cómo las máquinas interpretan la estructura de la información visual, y esa mentalidad se tradujo naturalmente en el enfoque de Bria. Miramos la generación de imágenes como un proceso composicional, no aleatorio.

Pero las patentes no son solo sobre tecnología, son sobre conectar la tecnología con la realidad empresarial. Una parte significativa de nuestro portafolio de propiedad intelectual aborda la capa de sistemas: ¿cómo se crean marcos de atribución que conectan el contenido generado con sus fuentes de entrenamiento? ¿Cómo se construyen modelos económicos que compensan a los creadores a gran escala? Estos no son problemas puramente técnicos, son cuestiones de infraestructura, modelos de negocio y diseño de mercado.

Esa visión más amplia dio forma a nuestra estrategia a largo plazo. La innovación no es solo avanzar en los modelos subyacentes. Es crear nuevas estructuras económicas, nuevos marcos contractuales, nuevas formas para que la industria opere de manera sostenible. El objetivo no es solo producir mejores resultados, es entender cómo se forman esos resultados, quién contribuyó a ellos y cómo fluye el valor a través del sistema. Ese es el lugar donde la ciencia se encuentra con el pensamiento de producto y la arquitectura empresarial.

Bria acaba de anunciar FIBO, descrito como el primer modelo de fundamento visual determinista para la generación de IA profesional. ¿Qué hace que FIBO sea fundamentalmente diferente de los sistemas de IA visual existentes?

El nombre en sí mismo señala nuestro enfoque: FIBO se refiere a Fibonacci, la secuencia matemática famosa por sus propiedades estéticas inherentes. La proporción áurea, la relación entre números consecutivos en la secuencia de Fibonacci, emerge en lo que percibimos como proporciones visualmente agradables en matemáticas, arte visual, geometría y arquitectura. La vemos en las dimensiones del Panteón de Roma y la Casa Blanca, en el cuerpo humano y la cara ilustrados en el Hombre vitruviano de Leonardo da Vinci, y a lo largo de formas naturales. Esa conexión entre estructura matemática y belleza visual es exactamente lo que FIBO encarna: calidad estética a través de estructura formal.

FIBO cambia la relación entre intención y salida. La mayoría de los sistemas de IA visual insertan capas de interpretación entre lo que quieres y lo que obtienes, traduces un prompt, el modelo lo traduce a través de codificadores de lenguaje, lo difumina a través del ruido y esperas que el resultado coincida con tu visión. FIBO elimina esas capas por completo.

Hicimos que la IA visual funcione como el código, cada elemento creativo se vuelve editable y repetible. Ese es un avance para los profesionales que han estado atascados con el “ruleta de prompt”. Esto significa que cada elemento, dirección de iluminación, ángulo de cámara, paleta de colores, composición, estilo existe como una propiedad explícita y controlable. La estructura JSON permite modificar solo los parámetros que desees, mientras bloquea todos los demás. Puedes ajustar la intensidad de la iluminación sin afectar la composición o cambiar el ángulo de la cámara sin alterar la paleta de colores. El sistema hace exactamente lo que especificas, cada vez.

Estamos realizando hackatones con Fal y NVIDIA para mostrar a los desarrolladores cómo funciona la generación determinista en la práctica. La estructura JSON en sí abre la caja negra, puedes ver exactamente qué parámetros crearon una imagen, reproducirla y modificarla con precisión. Es un paradigma completamente diferente al de la ingeniería de prompt.

Los sistemas tradicionales de texto a imagen dependen de prompts cada vez más elaborados para lograr resultados específicos. ¿Cómo soluciona FIBO el problema de la complejidad del prompt?

Dos problemas necesitan ser abordados. Primero, los problemas de aleatoriedad de los prompts existen porque los modelos actuales están tratando de extraer la intención del usuario y agregar lo que el modelo “piensa” es estéticamente deseable a través de la mejora del prompt. Segundo, la falta de control sobre las propiedades profesionales.

FIBO invierte esto. El modelo se entrenó con más de 1.000 palabras de descripciones visuales por imagen que codifican explícitamente más de 100 atributos independientes en formato JSON. Esto no se procesó posteriormente ni se extrajo, fue el formato de entrenamiento nativo. Debido a que cada atributo se representa estructuralmente desde el principio, el modelo aprendió la composición visual como un conjunto de parámetros discretos y controlables, en lugar de como una interpretación difusa del texto.

Lo que esto significa en la práctica es que defines la intención estética a través de la estructura, no a través de “prompt y reza”. El nivel de alineación de texto a imagen es fundamentalmente más alto porque no hay capa de traducción. Estás hablando el lenguaje nativo del modelo. Y porque las propiedades son independientes, puedes iterar sobre la iluminación sin cambiar accidentalmente la composición, o ajustar la paleta de colores sin afectar el estilo. El control es quirúrgico.

FIBO introduce un flujo de trabajo de “refinado” que es diferente del generación iterativa típica. ¿Cómo cambia esto la forma en que los profesionales abordan la producción visual?

La mayoría de los flujos de trabajo generativos son iterativos de una manera frustrante, generas, evalúas, ajustas tu prompt, generas de nuevo, esperas que esté más cerca. Esta es la “prompt y reza”. Nunca estás completamente seguro de qué cambió o por qué.

Refine convierte la experimentación en diseño. No estás adivinando qué podría hacer un nuevo prompt, estás dirigiendo la imagen exactamente de la manera en que ajustarías la luz o el color en Photoshop. No necesitas trabajar directamente a nivel de JSON, un modelo de lenguaje y visión modifica el JSON para ti basado en instrucciones de lenguaje natural. Pero el JSON en sí te permite entender exactamente qué sucedió. Generas una imagen inicial, examinas su representación JSON, identificas qué propiedades necesitan ajuste, tal vez la intensidad de la iluminación es demasiado alta o el ángulo de la cámara necesita cambiar 15 grados, y modificas solo esos valores a través de instrucciones simples. Todo lo demás permanece bloqueado.

Esta estructura es perfecta para flujos de trabajo con agentes. Un agente de IA puede analizar el JSON, entender el estado completo de la imagen, hacer modificaciones dirigidas y explicar su razonamiento, todo porque los parámetros son explícitos e interpretables. El agente no está adivinando qué podría hacer un cambio de prompt, está haciendo ajustes precisos a propiedades conocidas.

Esto elimina la imprevisibilidad que ha mantenido a los profesionales escépticos sobre la IA generativa. Cuando puedes ver el conjunto completo de parámetros que crearon una imagen, entender qué controla cada propiedad y modificar atributos individuales con confianza de que nada más cambiará, ya no estás experimentando, estás diseñando. La visibilidad del JSON abre completamente la caja negra. Para flujos de trabajo de producción profesional donde la consistencia y el control son más importantes que la novedad, esta es la diferencia entre un juguete creativo y una herramienta de producción.

La ética de los datos y la seguridad de la marca se han convertido en centrales para la IA empresarial. ¿Cómo garantiza el uso de Bria de datos completamente licenciados y liberados de derechos tanto el cumplimiento como el respeto por la propiedad intelectual de los creadores?

Desde el primer día, decidimos que si la industria iba a crecer de manera responsable, tenía que comenzar con la integridad de los datos. Cada imagen que entrenó a FIBO proviene de fuentes licenciadas y liberadas de derechos a través de asociaciones con líderes de contenido como Getty Images y Envato. Esto garantiza que nuestros modelos son cumplidores y justos. Vemos el respeto por los creadores como parte de la cadena de valor, no como una restricción. Las empresas se benefician de esa integridad porque les da la certeza legal y ética que necesitan para escalar con confianza.

FIBO se entrenó para aprender el estilo y la identidad de marca únicos de cada empresa. ¿Cómo cambia esta capacidad la forma en que las marcas globales abordan la creación de contenido y la consistencia visual?

Las marcas tienen su propio ADN visual, una forma única de expresar emoción, confianza y propósito a través del diseño. FIBO puede aprender ese lenguaje. Una vez entrenado, genera visuales que reflejan la misma composición, tono y atmósfera que definen la identidad de una marca. Esto convierte a la IA en un activo de la marca. Ayuda a los equipos globales a crear con alineación, no con aproximación. El resultado es la consistencia a escala sin perder individualidad.

Con los primeros adoptantes que ya están utilizando FIBO para automatizar el diseño de embalaje, la imagen de productos y las campañas creativas, ¿qué resultados o comentarios han destacado para ti hasta ahora?

El cambio de mentalidad. Los equipos están comenzando a tratar a la IA como parte de su kit de herramientas operativas, no como una novedad. Una marca global está generando variantes regionales de embalaje mucho más rápidamente mientras mantiene la consistencia de la marca. Una agencia de publicidad líder ha acelerado el desarrollo de campañas diez veces a través de la iteración controlada. Pero la señal real viene de los directores creativos que nos dicen que se sienten más controlados, que el modelo entiende su intención visual. Ese es un punto de inflexión para la industria.

Bria se posiciona como líder en IA ética y controlable. ¿Cómo ves que esta filosofía da forma a futuras regulaciones o estándares de la industria para la IA visual?

Hemos llegado a un punto en el que la innovación y la gobernanza necesitan moverse juntas. La regulación no es un obstáculo, sino más bien la infraestructura para el crecimiento sostenible. Nuestro enfoque — datos transparentes, salidas deterministas, procedencia clara — se alinea estrechamente con lo que las políticas emergentes están solicitando. Creo que veremos nuevos estándares que prioricen la trazabilidad, la explicabilidad y la protección de derechos. La filosofía de Bria es ayudar a definir esos estándares a través de la práctica, no a través de declaraciones de política.

Mirando hacia adelante, ¿qué hay de nuevo para Bria después de FIBO? ¿Te imaginas expandiéndote a la IA multimodal que une la generación de imágenes, video y 3D bajo un marco controlable?

Sí. Los mismos principios que impulsan a FIBO — estructura, control, transparencia — se aplican en todos los dominios visuales. Ya estamos explorando extensiones a video y 3D, donde la determinismo puede traer la misma confiabilidad que las empresas ahora tienen con las imágenes. Nuestro objetivo es simple: hacer que la creatividad de la IA sea tan controlable y segura como escribir código, y extender eso a través de todos los medios visuales, desde la imagen hasta el video y el 3D.

Gracias por la gran entrevista, los lectores que deseen aprender más pueden visitar Bria.

Antoine es un líder visionario y socio fundador de Unite.AI, impulsado por una pasión inquebrantable por dar forma y promover el futuro de la IA y la robótica. Un empresario serial, cree que la IA será tan disruptiva para la sociedad como la electricidad, y a menudo se le escucha hablando con entusiasmo sobre el potencial de las tecnologías disruptivas y la AGI. Como un futurista, está dedicado a explorar cómo estas innovaciones darán forma a nuestro mundo. Además, es el fundador de Securities.io, una plataforma enfocada en invertir en tecnologías de vanguardia que están redefiniendo el futuro y remodelando sectores enteros.