Connect with us

访谈

Bria 首席执行官兼创始人 Yair Adato 博士 – 采访系列

mm

Yair Adato 博士,Bria 的首席执行官兼创始人,是一位机器学习和计算机视觉专家,以其将高级技术与实际商业应用相结合的能力而闻名。在创立 Bria 之前,他曾担任 Trax Retail 的首席技术官,在公司从 20 人的初创企业发展成为拥有 850 多名员工的全球独角兽企业的过程中发挥了核心作用。整个职业生涯中,Yair 还曾担任多家 AI 驱动型创业公司的顾问,包括 Sparx、Vicomi、Tasq、DataGen 和 Anima。他的领导风格以对负责创新、数据所有权和 AI 技术民主化的坚定承诺为标志。

Bria 是视觉生成 AI 领域的先驱公司,成立的使命是创建一个开放和道德的图像生成平台。该公司的独特方法通过归属引擎奖励数据所有者对其贡献的回报,确保 AI 生态系统中的透明度和公平性。通过关注创造力、协作和合规性,Bria 赋予组织将生成 AI 安全地集成到其工作流程中的能力,同时为视觉内容行业的问责制和信任度设定了新的标准。

您创立 Bria 是为了创建一个负责和开放的视觉生成 AI 平台。是什么启发您创立这家公司,早期的挑战或见解如何塑造了公司的方向?

我在 2014 年看到 Goodfellow 提出 GAN 论文,立刻意识到创作生产将从根本上改变。观看那次演讲,影响是显而易见的——这不仅仅是一个渐进的改进,而是一个机器可以学习生成视觉内容的不同范式。

但从一开始,我就认识到这些系统构建中存在一个基本缺口:没有对训练数据的问责制,没有负责部署的框架,也没有考虑到使其成为可能的创作者的工作。

早期的挑战并非技术挑战,而是结构挑战。如何构建能够增强创作工作而不破坏创作者的生成 AI?如何使这些系统在法律确定性与输出质量同样重要的生产环境中可用?这些问题塑造了我们所构建的一切。我们以创新和责任不是相互对立的力量——它们必须共同推进,否则技术将失败所有人——的原则创立了 Bria。

您的计算机视觉学术背景和 50 多项专利将研究与实际创新相结合。这种经验如何影响 Bria 的技术路线图和长期战略?

我的研究背景教会我思考系统——如何将不同层次的理解连接起来形成意义。我的许多专利都关注机器如何解释视觉信息的结构,这种思维方式自然地转化为 Bria 的方法。我们将图像生成视为一个组合过程,而不是随机过程。

但是,专利不仅仅是关于技术——它们是关于将技术与商业现实联系起来。我们知识产权投资组合中的一个重要部分解决了系统层面:如何创建归属框架将生成内容连接到其训练源?如何构建能够在规模上补偿创作者的经济模型?这些不是纯粹的技术问题——它们是基础设施、商业模式和市场设计的问题。

这种更广泛的视角塑造了我们的长期战略。创新不仅仅是关于推进底层模型的发展——它是关于创造新的经济结构、新合同框架和新的行业运营方式。目标不仅仅是产生更好的结果——它是关于理解这些结果如何形成、谁为其做出了贡献以及价值如何在系统中流动。这是科学、产品思维和商业架构相遇的地方。

Bria 刚刚宣布 FIBO,这是世界上第一个用于专业级 AI 生成的确定性视觉基础模型。FIBO 与现有的视觉 AI 系统有什么根本区别?

名称本身就表明了我们的方法:FIBO 代表斐波那契数列,以其固有的美学特性而闻名。黄金比例——斐波那契数列中连续数字的比率——出现在我们认为是视觉上令人愉悦的比例中,遍布数学、视觉艺术、几何和建筑。您可以在罗马万神庙和白宫的尺寸中看到它,在达芬奇的维特鲁威人中看到它,并且在自然形式中看到它。这种数学结构和视觉美之间的联系正是 FIBO 体现的内容:通过正式结构实现美学质量。

FIBO 改变了意图和输出之间的关系。大多数视觉 AI 系统在您想要的东西和您得到的东西之间插入了多个解释层——您编写一个提示,模型通过语言编码器将其翻译,通过噪音扩散,然后希望结果符合您的愿景。FIBO 完全消除了这些层。

我们使视觉 AI 的工作方式与代码相同——每个创意元素都变得可编辑和可重复。这对于那些被“提示轮盘”困住的专业人士来说是一个突破。每个元素、照明方向、相机角度、色彩调色板、构图、风格都存在作为一个显式的、可控的属性。JSON 结构允许您仅修改所需的参数,同时锁定所有其他参数。您可以在不影响构图的情况下调整照明强度,或在不改变色彩调色板的情况下将相机角度移动 15 度。系统将精确地执行您指定的操作,每次都如此。

我们正在与 Fal 和 NVIDIA 合作举办黑客马拉松,以向开发人员展示确定性生成在实践中的工作原理。JSON 结构本身打开了黑盒——您可以看到创建图像的确切参数、复制它并精确地修改它。这是一个与提示工程完全不同的范式。

传统的文本到图像系统依赖于越来越复杂的提示来实现特定的结果。FIBO 的方法如何解决提示复杂性问题?

两个问题需要解决。首先,提示随机性问题是因为当前模型正在尝试提取用户意图并通过提示增强添加模型认为是美观或理想的东西。其次,缺乏对专业属性的控制。

FIBO 反转了这种情况。该模型是在超过 1,000 个单词的视觉描述中训练的,每个图像都显式地编码了超过 100 个独立属性的 JSON 格式。这不是事后处理或提取的——这是本地训练格式。由于每个属性从一开始就结构化表示,模型将视觉组合学习为一组离散的、可控的参数,而不是对文本的模糊解释。

这在实践中意味着什么:您通过结构定义美学意图,而不是通过“提示和祈祷”。由于没有翻译层,文本到图像的对齐程度从根本上更高。您正在使用模型的本地语言说话。由于属性是独立的,您可以在不意外更改构图的情况下迭代照明,或在不影响风格的情况下调整色彩调色板。控制是外科手术般的。

FIBO 引入了一个与典型迭代生成不同的“精细”工作流程。这种变化如何改变专业人士对视觉生产的方法?

大多数生成工作流程都是以一种令人沮丧的方式迭代的——您生成、评估、调整提示、再次生成、希望它更接近。这种“提示和祈祷”方法。您从来不知道发生了什么变化或为什么会发生变化。

精细化将实验转变为设计。您不再猜测新的提示可能会做什么——您正在引导图像,就像您在 Photoshop 中调整光线或颜色一样。您不需要直接在 JSON 级别工作——一个视觉语言模型根据自然语言指令修改 JSON。但是,JSON 本身让您了解发生了什么。您生成一个初始图像,检查其 JSON 表示,确定需要调整哪些属性——也许照明强度太高,或者相机角度需要移动 15 度——然后您仅修改这些值。其他一切保持锁定状态。

这种结构对于代理工作流程是完美的。AI 代理可以分析 JSON,了解图像的完整状态,进行有针对性的修改,并解释其推理——所有这些都是因为参数是显式的和可解释的。代理不再猜测提示更改可能会产生什么效果;它正在对已知属性进行精确的调整。

这消除了专业人士一直持怀疑态度的不可预测性。 当您可以看到创建图像的完整参数集、了解每个属性的控制内容并可以自信地修改单个属性而不让其他内容漂移时,您不再进行实验——您正在设计。JSON 的可见性完全打开了黑盒。对于专业生产工作流程来说,控制和一致性比新颖性更重要,这是创造性玩具和生产工具之间的区别。

数据伦理和品牌安全已经成为企业 AI 的核心。Bria 如何使用完全许可、权利清除的数据来确保合规性和对创作者知识产权的尊重?

从第一天开始,我们就决定,如果行业要负责任地发展,它就必须从数据完整性开始。训练 FIBO 的每张图像都来自通过与 Getty Images 和 Envato 等内容领导者合作获得的许可和权利清除的来源。这确保了我们的模型是合规和公平的。我们将对创作者的尊重视为价值链的一部分,而不是限制。企业从中受益,因为它为他们提供了法律和道德上的确定性,使他们能够自信地扩大规模。

FIBO 被训练来学习每家公司独特的品牌风格和身份。这种能力如何改变全球品牌对内容创作和视觉一致性的方法?

品牌有自己的视觉 DNA——一种通过设计表达情感、信任和目的的独特方式。FIBO 可以学习这种语言。一旦训练完成,它就会生成反映相同构图、语气和氛围的视觉效果,这些构成了品牌的身份。这将 AI 从创意助手转变为品牌资产。它帮助全球团队保持一致性,而不会失去个性。结果是一致性和规模,而不会失去个性。

早期采用者已经开始使用 FIBO 自动化包装设计、产品图像和创意活动。到目前为止,您最引人注目的结果或反馈是什么?

思维方式的转变。团队开始将 AI 视为其运营工具包的一部分,而不是新奇事物。一个全球品牌现在可以更快速地生成区域包装变体,同时保持品牌一致性。另一家领先的创意代理机构已经通过受控迭代将活动开发速度提高了十倍。但真正的信号来自创意总监,他们告诉我们,他们感到更有控制力;模型理解他们的视觉意图。这是行业的一个转折点。

Bria 将自己定位为道德和可控 AI 的领导者。您如何看待这种理念对未来视觉 AI 的监管或行业标准的影响?

我们已经达到了创新和治理需要共同发展的阶段。监管不是障碍,而是可持续增长的基础设施。我们的方法——透明的数据、确定的输出、明确的来源——与新兴政策的要求密切对齐。我相信我们将看到优先考虑可追溯性、可解释性和权利保护的新标准。Bria 的理念是通过实践而不是政策声明来帮助定义这些标准。

展望未来,FIBO 之后 Bria 的下一步是什么?您是否设想将多模态 AI 融合到一个可控的框架中,涵盖图像、视频和 3D 生成?

是的。赋予 FIBO 的原则——结构、控制、透明度——适用于所有视觉领域。我们已经在探索扩展到视频和 3D 的可能性,在那里,确定性可以带来与图像相同的可靠性。我们的目标很简单:使 AI 的创造力与编写代码一样可控和安全——并将其扩展到每个视觉媒体,从图像到视频到 3D。

感谢这次精彩的采访,希望读者了解更多信息,请访问 Bria

安托万是一位具有远见的领导者和Unite.AI的创始合伙人,他被对塑造和推广AI和机器人人的未来充满不动摇的热情所驱动。作为一位连续创业者,他相信AI将对社会产生与电力一样的颠覆性影响,他经常被听到对颠覆性技术和AGI的潜力大加赞赏。

作为一位未来学家,他致力于探索这些创新将如何塑造我们的世界。另外,他也是Securities.io的创始人,这是一个专注于投资于重新定义未来和重塑整个行业的尖端技术的平台。