Connect with us

Dr. Yair Adato, CEO e Fundador da Bria – Série de Entrevistas

Entrevistas

Dr. Yair Adato, CEO e Fundador da Bria – Série de Entrevistas

mm

Dr. Yair Adato, CEO e fundador da Bria, é um especialista em aprendizado de máquina e visão computacional reconhecido por sua capacidade de conectar tecnologia avançada com aplicações comerciais do mundo real. Antes de fundar a Bria, ele atuou como CTO da Trax Retail, onde desempenhou um papel central na transformação da empresa de uma startup com 20 pessoas em um unicórnio global com mais de 850 funcionários. Ao longo de sua carreira, Yair também contribuiu como consultor para várias empresas impulsionadas por IA, incluindo Sparx, Vicomi, Tasq, DataGen e Anima. Sua liderança é marcada por um forte compromisso com inovação responsável, propriedade de dados e democratização da tecnologia de IA.

Bria é uma empresa pioneira no campo de IA visual gerativa responsável, fundada com a missão de criar uma plataforma aberta e ética para geração de imagens. A abordagem única da empresa recompensa os proprietários de dados por suas contribuições por meio de um mecanismo de atribuição, garantindo transparência e justiça no ecossistema de IA. Ao se concentrar em criatividade, colaboração e conformidade, a Bria capacita as organizações a integrar a IA gerativa de forma segura em seus fluxos de trabalho, estabelecendo novos padrões de responsabilidade e confiança na indústria de conteúdo visual.

Você fundou a Bria para criar uma plataforma responsável e aberta para IA visual gerativa. O que o inspirou a iniciar a empresa, e quais desafios ou insights iniciais moldaram sua direção?

Eu vi Goodfellow apresentar o papel do GAN em 2014, e foi imediatamente claro que a produção criativa iria mudar fundamentalmente. Assistindo àquela apresentação, as implicações eram óbvias — isso não era apenas uma melhoria incremental, era um paradigma diferente para como as máquinas poderiam aprender a gerar conteúdo visual.

Mas desde o início, eu reconheci uma lacuna fundamental em como esses sistemas estavam sendo construídos: nenhuma responsabilidade pelos dados de treinamento, nenhum quadro para implantação responsável, nenhuma consideração para os criadores cujo trabalho tornou tudo possível.

Os desafios iniciais não eram técnicos — eram estruturais. Como você constrói IA gerativa que melhora o trabalho criativo sem minar as pessoas que criam? Como você torna esses sistemas utilizáveis em ambientes de produção onde a certeza jurídica importa tanto quanto a qualidade de saída? Essas perguntas moldaram tudo o que construímos. Fundamos a Bria no princípio de que inovação e responsabilidade não são forças opostas — elas devem avançar juntas, ou a tecnologia falha para todos.

Sua formação acadêmica em visão computacional e seus 50+ patentes conectam pesquisa e inovação do mundo real. Como essa experiência influenciou a estratégia técnica e a longa estratégia da Bria?

Minha formação em pesquisa me ensinou a pensar em sistemas — como diferentes camadas de compreensão se conectam para formar significado. Muitas de minhas patentes se concentram em como as máquinas interpretam a estrutura da informação visual, e essa mentalidade se traduz naturalmente na abordagem da Bria. Nós olhamos para a geração de imagens como um processo composicional, não aleatório.

Mas as patentes não são apenas sobre tecnologia — elas são sobre conectar tecnologia à realidade empresarial. Uma parte significativa de nosso portfólio de IP aborda a camada dos sistemas: como criar estruturas de atribuição que conectam o conteúdo gerado às suas fontes de treinamento? Como construir modelos econômicos que compensam os criadores em escala? Esses não são problemas puramente técnicos — são questões de infraestrutura, modelos de negócios e design de mercado.

Essa visão mais ampla moldou nossa estratégia de longo prazo. Inovação não é apenas sobre avançar os modelos subjacentes. É sobre criar novas estruturas econômicas, novos quadros contratuais, novas maneiras para a indústria operar de forma sustentável. O objetivo não é apenas produzir melhores resultados — é entender como esses resultados são formados, quem contribuiu para eles e como o valor flui pelo sistema. É onde a ciência encontra o pensamento de produto e a arquitetura de negócios.

A Bria acaba de anunciar o FIBO, descrito como o primeiro modelo de fundamento visual determinístico do mundo para geração de IA de nível profissional. O que torna o FIBO fundamentalmente diferente dos sistemas de IA visual existentes?

O próprio nome sinaliza nossa abordagem: FIBO significa Fibonacci, a sequência matemática famosa por suas propriedades estéticas inerentes. A razão áurea — a razão entre números consecutivos na sequência de Fibonacci — emerge no que percebemos como proporções visualmente agradáveis em matemática, arte visual, geometria e arquitetura. Você vê isso nas dimensões do Panteão Romano e da Casa Branca, no corpo humano e no rosto ilustrado no Homem Vitruviano de Leonardo da Vinci, e em formas naturais. Essa conexão entre estrutura matemática e beleza visual é exatamente o que o FIBO encarna: qualidade estética por meio de estrutura formal.

O FIBO muda a relação entre intenção e saída. A maioria dos sistemas de IA visual insere camadas de interpretação entre o que você quer e o que você obtém — você escreve um prompt, o modelo o traduz por meio de codificadores de linguagem, o difunde por meio de ruído, e você espera que o resultado corresponda à sua visão. O FIBO remove essas camadas completamente.

Nós fizemos a IA visual funcionar como código — cada elemento criativo se torna editável e repetível. Essa é uma quebra de paradigma para profissionais que estavam presos com o “roleta de prompt”. Isso significa que cada elemento, direção de iluminação, ângulo da câmera, paleta de cores, composição, estilo existe como uma propriedade explícita e controlável. A estrutura JSON permite que você modifique apenas os parâmetros que deseja, enquanto bloqueia todos os outros. Você pode ajustar a intensidade da iluminação sem afetar a composição, ou mudar o ângulo da câmera sem alterar a paleta de cores. O sistema faz exatamente o que você especifica, sempre.

Nós estamos realizando hackathons com a Fal e a NVIDIA para mostrar aos desenvolvedores como a geração determinística realmente funciona na prática. A própria estrutura JSON abre a caixa preta — você pode ver exatamente quais parâmetros criaram uma imagem, reproduzi-la e modificá-la com precisão. É um paradigma completamente diferente do engenharia de prompt.

Os sistemas tradicionais de texto-para-imagem dependem de prompts cada vez mais elaborados para alcançar resultados específicos. Como a abordagem do FIBO resolve o problema da complexidade do prompt?

Dois problemas precisam ser abordados. Primeiro, os problemas de aleatoriedade de prompt existem porque os modelos atuais estão tentando extrair a intenção do usuário e adicionar o que o modelo “pensa” é estético ou desejável por meio do prompt. Segundo, falta de controle sobre propriedades profissionais

O FIBO inverte isso. O modelo foi treinado com mais de 1.000 palavras de descrições visuais por imagem que codificam explicitamente mais de 100 atributos independentes no formato JSON. Isso não foi pós-processado ou extraído — foi o formato de treinamento nativo. Como cada atributo é representado estruturalmente desde o início, o modelo aprendeu a composição visual como um conjunto de parâmetros controláveis e discretos, e não como uma interpretação nebulosa de texto.

Isso significa, na prática, que você define a intenção estética por meio de estrutura, não por meio de “prompt e reza”. O nível de alinhamento texto-para-imagem é fundamentalmente mais alto porque não há uma camada de tradução. Você está falando a linguagem nativa do modelo. E porque as propriedades são independentes, você pode iterar sobre a iluminação sem acidentalmente mudar a composição, ou ajustar a paleta de cores sem afetar o estilo. O controle é cirúrgico.

O FIBO introduz um fluxo de trabalho “refinar” que é diferente do gerenciamento iterativo típico. Como isso muda a abordagem dos profissionais em relação à produção visual?

A maioria dos fluxos de trabalho gerativos é iterativa de uma maneira frustrante — você gera, avalia, ajusta o prompt, gera novamente, torce para que esteja mais perto. Essa é a “prompt e reza”. Você nunca tem certeza do que mudou ou por quê.

O Refine transforma a experimentação em design. Você não está adivinhando o que um novo prompt pode fazer — você está guiando a imagem exatamente como você ajustaria a luz ou a cor no Photoshop. Você não precisa trabalhar no nível JSON diretamente — um modelo de linguagem-visão modifica o JSON para você com base em instruções de linguagem natural. Mas o próprio JSON permite que você entenda exatamente o que aconteceu. Você gera uma imagem inicial, examina sua representação JSON, identifica quais propriedades precisam de ajuste — talvez a intensidade da iluminação esteja muito alta, ou o ângulo da câmera precise mudar 15 graus — e você modifica apenas esses valores por meio de instruções simples. Tudo o mais permanece bloqueado.

Essa estrutura é perfeita para fluxos de trabalho baseados em agentes. Um agente de IA pode analisar o JSON, entender o estado completo da imagem, fazer modificações direcionadas e explicar sua lógica — tudo porque os parâmetros são explícitos e interpretáveis. O agente não está adivinhando o que uma mudança de prompt pode fazer; está fazendo ajustes precisos em propriedades conhecidas.

Isso remove a imprevisibilidade que manteve os profissionais céticos em relação à IA gerativa. Quando você pode ver o conjunto completo de parâmetros que criou uma imagem, entender o que cada propriedade controla e modificar atributos individuais com confiança de que nada mais irá mudar, você não está mais experimentando — você está projetando. A visibilidade do JSON abre a caixa preta completamente. Para fluxos de trabalho de produção profissional onde a consistência e o controle importam mais do que a novidade, essa é a diferença entre um brinquedo criativo e uma ferramenta de produção.

A ética de dados e a segurança da marca se tornaram centrais para a IA empresarial. Como o uso da Bria de dados totalmente licenciados e liberados de direitos assegura tanto a conformidade quanto o respeito pela propriedade intelectual dos criadores?

Desde o dia um, decidimos que se a indústria iria crescer de forma responsável, ela tinha que começar com a integridade dos dados. Cada imagem que treinou o FIBO vem de fontes licenciadas e liberadas de direitos por meio de parcerias com líderes de conteúdo como Getty Images e Envato. Isso garante que nossos modelos sejam conformes e justos. Nós vemos o respeito pelos criadores como parte da cadeia de valor, não como uma restrição. As empresas se beneficiam dessa integridade porque lhes dá a certeza jurídica e ética de que precisam para escalar com confiança.

O FIBO foi treinado para aprender o estilo e a identidade de marca única de cada empresa. Como essa capacidade muda a abordagem das marcas globais em relação à criação de conteúdo e à consistência visual?

As marcas têm seu próprio DNA visual — uma maneira única de expressar emoção, confiança e propósito por meio do design. O FIBO pode aprender esse idioma. Uma vez treinado, ele gera visuais que refletem a mesma composição, tom e atmosfera que definem a identidade de uma marca. Isso transforma a IA de um assistente criativo em um ativo de marca. Ajuda equipes globais a criar com alinhamento, não com aproximação. O resultado é consistência em escala sem perder individualidade.

Com os primeiros adotantes já usando o FIBO para automatizar o design de embalagem, imagens de produtos e campanhas criativas, quais resultados ou feedbacks mais chamaram sua atenção até agora?

A mudança de mentalidade. As equipes estão começando a tratar a IA como parte de sua caixa de ferramentas operacionais, não como uma novidade. Uma marca global está gerando variantes regionais de embalagem muito mais rapidamente, mantendo a consistência da marca. Uma agência criativa líder acelerou o desenvolvimento de campanhas dez vezes por meio de iteração controlada. Mas o sinal real vem dos diretores criativos que nos dizem que se sentem mais no controle; que o modelo entende sua intenção visual. Essa é uma virada para a indústria.

A Bria se posiciona como líder em IA ética e controlável. Como você vê essa filosofia moldando futuras regulamentações ou padrões da indústria para IA visual?

Nós alcançamos um estágio em que inovação e governança precisam se mover juntas. Regulamentação não é um obstáculo, mas sim a infraestrutura para o crescimento sustentável. Nossa abordagem — dados transparentes, saídas determinísticas, provência clara — se alinha estreitamente com o que as políticas emergentes estão pedindo. Acredito que veremos novos padrões que priorizam rastreabilidade, explicabilidade e proteção de direitos. A filosofia da Bria é ajudar a definir esses padrões por meio da prática, não por meio de declarações de política.

Olhando para o futuro, o que vem a seguir para a Bria após o FIBO? Você vislumbra a expansão para IA multimodal que une imagem, vídeo e geração 3D sob um único quadro controlável?

Sim. Os mesmos princípios que impulsionam o FIBO — estrutura, controle, transparência — se aplicam a todos os domínios visuais. Nós já estamos explorando extensões para vídeo e 3D, onde a determinismo pode trazer a mesma confiabilidade que as empresas agora têm com imagens. Nosso objetivo é simples: tornar a criatividade da IA tão controlável e segura quanto escrever código — e estender isso por todos os meios visuais, desde imagem até vídeo e 3D.

Obrigado pela grande entrevista, leitores que desejam aprender mais devem visitar Bria.

Antoine é um líder visionário e sócio-fundador da Unite.AI, impulsionado por uma paixão inabalável em moldar e promover o futuro da IA e da robótica. Um empreendedor serial, ele acredita que a IA será tão disruptiva para a sociedade quanto a eletricidade, e é frequentemente pego falando sobre o potencial das tecnologias disruptivas e da AGI. Como um futurista, ele está dedicado a explorar como essas inovações moldarão nosso mundo. Além disso, ele é o fundador da Securities.io, uma plataforma focada em investir em tecnologias de ponta que estão redefinindo o futuro e remodelando setores inteiros.