Entretiens
Dr. Yair Adato, PDG et fondateur de Bria – SĂ©rie d’entretiens

Dr. Yair Adato, PDG et fondateur de Bria, est un expert en apprentissage automatique et en vision par ordinateur reconnu pour sa capacité à relier les technologies avancées aux applications commerciales du monde réel. Avant de fonder Bria, il a occupé le poste de directeur technique de Trax Retail, où il a joué un rôle central dans la transformation de l’entreprise d’une startup de 20 personnes en une entreprise mondiale avec plus de 850 employés. Tout au long de sa carrière, Yair a également contribué en tant que conseiller à plusieurs entreprises axées sur l’IA, notamment Sparx, Vicomi, Tasq, DataGen et Anima. Son leadership est marqué par un fort engagement en faveur de l’innovation responsable, de la propriété des données et de la démocratisation de la technologie de l’IA.
Bria est une entreprise pionnière dans le domaine de l’IA générative visuelle responsable, fondée avec pour mission de créer une plateforme ouverte et éthique pour la génération d’images. L’approche unique de l’entreprise récompense les propriétaires de données pour leurs contributions grâce à un moteur d’attribution, garantissant la transparence et l’équité dans l’écosystème de l’IA. En se concentrant sur la créativité, la collaboration et la conformité, Bria permet aux organisations d’intégrer en toute sécurité l’IA générative dans leurs flux de travail tout en établissant de nouvelles normes pour la responsabilité et la confiance dans l’industrie du contenu visuel.
Vous avez fondé Bria pour créer une plateforme responsable et ouverte pour l’IA générative visuelle. Qu’est-ce qui vous a inspiré pour créer l’entreprise, et quels défis ou enseignements précoces ont orienté sa direction ?
J’ai vu Goodfellow présenter le papier sur les GAN en 2014, et il était immédiatement clair que la production créative allait changer fondamentalement. En regardant cette présentation, les implications étaient évidentes – ce n’était pas seulement une amélioration incrémentale, c’était un nouveau paradigme pour la façon dont les machines pouvaient apprendre à générer du contenu visuel.
Mais dès le début, j’ai reconnu un fossé fondamental dans la façon dont ces systèmes étaient construits : aucune responsabilité pour les données de formation, aucun cadre pour un déploiement responsable, aucune considération pour les créateurs dont le travail rendait tout cela possible.
Les défis précoces n’étaient pas techniques – ils étaient structurels. Comment construire une IA générative qui améliore le travail créatif sans miner les personnes qui créent ? Comment rendre ces systèmes utilisables dans des environnements de production où la certitude juridique compte autant que la qualité de sortie ? Ces questions ont façonné tout ce que nous avons construit. Nous avons fondé Bria sur le principe que l’innovation et la responsabilité ne sont pas des forces opposées – elles doivent avancer ensemble, ou la technologie échoue pour tout le monde.
Votre formation universitaire en vision par ordinateur et vos 50 brevets plus font le pont entre la recherche et l’innovation du monde réel. Comment cette expérience a-t-elle influencé la feuille de route technique et la stratégie à long terme de Bria ?
Mon expérience de recherche m’a appris à penser en termes de systèmes – comment les différentes couches de compréhension se connectent pour former un sens. Beaucoup de mes brevets se concentrent sur la façon dont les machines interprètent la structure de l’information visuelle, et cette mentalité s’est naturellement traduite dans l’approche de Bria. Nous considérons la génération d’images comme un processus de composition, et non comme un processus aléatoire.
Mais les brevets ne concernent pas seulement la technologie – ils concernent le fait de relier la technologie à la réalité commerciale. Une partie importante de notre portefeuille de brevets s’adresse à la couche des systèmes : comment créer des cadres d’attribution qui relient le contenu généré à ses sources de formation ? Comment construire des modèles économiques qui rémunèrent les créateurs à grande échelle ? Ce ne sont pas des problèmes purement techniques – ce sont des questions d’infrastructure, de modèles commerciaux et de conception de marché.
Cette vision plus large a façonné notre stratégie à long terme. L’innovation ne consiste pas seulement à améliorer les modèles sous-jacents. C’est créer de nouvelles structures économiques, de nouveaux cadres contractuels, de nouvelles façons pour l’industrie de fonctionner de manière durable. L’objectif n’est pas seulement de produire de meilleurs résultats – c’est de comprendre comment ces résultats sont formés, qui y a contribué et comment la valeur s’écoule à travers le système. C’est là que la science rencontre la pensée produit et l’architecture commerciale.
Bria vient d’annoncer FIBO, décrit comme le premier modèle de fondation visuelle déterministe pour la génération d’IA de niveau professionnel. Qu’est-ce qui rend FIBO fondamentalement différent des systèmes d’IA visuelle existants ?
Le nom lui-même signale notre approche : FIBO est l’abréviation de Fibonacci, la séquence mathématique célèbre pour ses propriétés esthétiques inhérentes. Le rapport doré – le rapport entre les nombres consécutifs de la séquence de Fibonacci – émerge dans ce que nous percevons comme des proportions visuellement plaisantes à travers les mathématiques, l’art visuel, la géométrie et l’architecture. Vous le voyez dans les dimensions du Panthéon de Rome et de la Maison Blanche, dans le corps humain et le visage tel qu’illustré dans l’Homme de Vitruve de Léonard de Vinci, et à travers les formes naturelles. Ce lien entre la structure mathématique et la beauté visuelle est exactement ce que FIBO incarne : la qualité esthétique à travers la structure formelle.
FIBO change la relation entre l’intention et la sortie. La plupart des systèmes d’IA visuelle insèrent des couches d’interprétation entre ce que vous voulez et ce que vous obtenez – vous écrivez une invite, le modèle la traduit à travers les encodeurs de langage, la diffuse à travers le bruit, et vous espérez que le résultat correspond à votre vision. FIBO supprime ces couches entièrement.
Nous avons rendu l’IA visuelle fonctionnelle comme du code – chaque élément créatif devient éditable et reproductible. C’est une avancée pour les professionnels qui ont été coincés avec le « roulette de prompt ». Cela signifie que chaque élément, la direction de l’éclairage, l’angle de la caméra, la palette de couleurs, la composition, le style, existe comme une propriété explicite et contrôlable. La structure JSON permet de modifier uniquement les paramètres que vous souhaitez, tout en verrouillant les autres. Vous pouvez ajuster l’intensité de l’éclairage sans affecter la composition, ou déplacer l’angle de la caméra sans modifier la palette de couleurs. Le système fait exactement ce que vous spécifiez, chaque fois.
Nous organisons des hackathons avec Fal et NVIDIA pour montrer aux développeurs comment la génération déterministe fonctionne réellement dans la pratique. La structure JSON elle-même ouvre la boîte noire – vous pouvez voir exactement quels paramètres ont créé une image, la reproduire et la modifier avec précision. C’est un paradigme complètement différent de l’ingénierie de prompt.
Les systèmes d’IA visuelle traditionnels reposent de plus en plus sur des invites de plus en plus élaborées pour obtenir des résultats spécifiques. Comment l’approche de FIBO résout-elle le problème de complexité des invites ?
Deux problèmes doivent être abordés. Premièrement, les problèmes de hasard des invites existent parce que les modèles actuels tentent d’extraire l’intention de l’utilisateur et d’ajouter ce que le modèle « pense » être esthétique ou souhaitable via l’amélioration de l’invite. Deuxièmement, le manque de contrôle sur les propriétés professionnelles
FIBO inverse cela. Le modèle a été formé sur plus de 1 000 mots de descriptions visuelles par image qui codent explicitement plus de 100 attributs indépendants au format JSON. Cela n’a pas été post-traité ou extrait – c’était le format de formation natif. Parce que chaque attribut est représenté structurellement dès le début, le modèle a appris la composition visuelle comme un ensemble de paramètres discrets et contrôlables, plutôt que comme une interprétation floue du texte.
Cela signifie, en pratique, que vous définissez l’intention esthétique à travers la structure, et non à travers « invite et prie ». Le niveau d’alignement du texte sur l’image est fondamentalement plus élevé car il n’y a pas de couche de traduction. Vous parlez la langue native du modèle. Et parce que les propriétés sont indépendantes, vous pouvez itérer sur l’éclairage sans modifier accidentellement la composition, ou ajuster la palette de couleurs sans affecter le style. Le contrôle est chirurgical.
FIBO introduit un flux de travail « raffiner » qui diffère de la génération itérative typique. Comment cela change-t-il la façon dont les professionnels abordent la production visuelle ?
La plupart des flux de travail de génération sont itératifs d’une manière frustrante – vous générez, évaluez, ajustez votre invite, générez à nouveau, espérant que c’est plus proche. C’est le « invite et prie ». Vous n’êtes jamais tout à fait sûr de ce qui a changé ou pourquoi.
Refine transforme l’expérimentation en conception. Vous n’essayez pas de deviner ce qu’une nouvelle invite pourrait faire – vous dirigez l’image, exactement comme vous régleriez la lumière ou la couleur dans Photoshop. Vous n’avez pas besoin de travailler au niveau JSON directement – un modèle de langage et de vision modifie le JSON pour vous en fonction d’instructions en langage naturel. Mais le JSON lui-même vous permet de comprendre exactement ce qui s’est passé. Vous générez une image initiale, examinez sa représentation JSON, identifiez les propriétés qui nécessitent un ajustement – peut-être que l’intensité de l’éclairage est trop élevée, ou que l’angle de la caméra doit être déplacé de 15 degrés – et vous modifiez uniquement ces valeurs à l’aide d’instructions simples. Tout le reste reste verrouillé.
Cette structure est parfaite pour les flux de travail agents. Un agent IA peut analyser le JSON, comprendre l’état complet de l’image, apporter des modifications ciblées et expliquer sa logique – tout cela parce que les paramètres sont explicites et interprétables. L’agent n’est pas en train de deviner ce qu’un changement de prompt pourrait faire ; il fait des ajustements précis sur des propriétés connues.
Cela élimine l’imprévisibilité qui a tenu les professionnels sceptiques à l’égard de l’IA générative. Lorsque vous pouvez voir l’ensemble des paramètres qui ont créé une image, comprendre ce que chaque propriété contrôle et modifier des attributs individuels avec confiance que rien d’autre ne dérivera, vous n’expérimentez plus – vous concevez. La visibilité du JSON ouvre complètement la boîte noire. Pour les flux de travail de production professionnels où la cohérence et le contrôle comptent plus que la nouveauté, c’est la différence entre un jouet créatif et un outil de production.
Les considérations éthiques des données et la sécurité des marques sont devenues centrales pour l’IA d’entreprise. Comment l’utilisation par Bria de données entièrement licenciées et libres de droits assure-t-elle à la fois la conformité et le respect de la propriété intellectuelle des créateurs ?
Dès le premier jour, nous avons décidé que si l’industrie allait grandir de manière responsable, elle devait commencer par l’intégrité des données. Chaque image qui a formé FIBO provient de sources licenciées et libres de droits grâce à des partenariats avec des leaders de contenu tels que Getty Images et Envato. Cela garantit que nos modèles sont conformes et équitables. Nous considérons le respect des créateurs comme faisant partie de la chaîne de valeur, et non comme une contrainte. Les entreprises bénéficient de cette intégrité car elle leur donne la certitude juridique et éthique dont elles ont besoin pour se développer avec confiance.
FIBO a été formé pour apprendre le style et l’identité de marque unique de chaque entreprise. Comment cette capacité change-t-elle la façon dont les marques mondiales abordent la création de contenu et la cohérence visuelle ?
Les marques ont leur propre ADN visuel – une façon unique d’exprimer l’émotion, la confiance et le but à travers la conception. FIBO peut apprendre ce langage. Une fois formé, il génère des visuels qui reflètent la même composition, le même ton et la même atmosphère qui définissent l’identité d’une marque. Cela transforme l’IA en un atout pour la marque. Cela aide les équipes mondiales à créer avec alignement, et non avec approximation. Le résultat est une cohérence à grande échelle sans perdre d’individualité.
Avec les premiers utilisateurs qui utilisent déjà FIBO pour automatiser la conception d’emballages, les images de produits et les campagnes créatives, quels résultats ou commentaires vous ont le plus marqués jusqu’à présent ?
Le changement de mentalité. Les équipes commencent à traiter l’IA comme faisant partie de leur boîte à outils opérationnelle, et non comme une nouveauté. Une marque mondiale génère des variantes régionales d’emballages beaucoup plus rapidement tout en maintenant la cohérence de la marque. Un autre cabinet de créatifs de premier plan a accéléré le développement de campagnes de dix fois grâce à l’itération contrôlée. Mais le véritable signal vient des directeurs créatifs qui nous disent qu’ils se sentent plus en contrôle ; que le modèle comprend leur intention visuelle. C’est un tournant pour l’industrie.
Bria se positionne comme un leader en matière d’IA éthique et contrôlable. Comment voyez-vous cette philosophie façonnant les futures réglementations ou les normes industrielles pour l’IA visuelle ?
Nous sommes arrivés à un stade où l’innovation et la gouvernance doivent avancer ensemble. La réglementation n’est pas un obstacle, mais plutôt l’infrastructure pour une croissance durable. Notre approche – données transparentes, sorties déterministes, provenance claire – correspond étroitement à ce que les politiques émergentes demandent. Je crois que nous allons voir de nouvelles normes qui donnent la priorité à la traçabilité, à l’explicabilité et à la protection des droits. La philosophie de Bria est d’aider à définir ces normes à travers la pratique, et non à travers des déclarations de politique.
En regardant vers l’avenir, qu’est-ce qui vient ensuite pour Bria après FIBO ? Envisagez-vous d’étendre à l’IA multimodale qui unit la génération d’images, de vidéos et de 3D sous un cadre contrôlable unique ?
Oui. Les mêmes principes qui alimentent FIBO – structure, contrôle, transparence – s’appliquent à tous les domaines visuels. Nous explorons déjà les extensions dans la vidéo et le 3D, où la déterminisme peut apporter la même fiabilité que les entreprises ont actuellement avec les images. Notre objectif est simple : rendre la créativité de l’IA aussi contrôlable et sûre que l’écriture de code – et étendre cela à tous les médias visuels, de l’image à la vidéo en passant par le 3D.
Merci pour cette grande interview, les lecteurs qui souhaitent en savoir plus peuvent visiter Bria.












