面试

Synthesis AI 首席执行官 Yashar Behzadi – 访谈系列

发布时间

2年前

2022 年 2 月 7 日

Yashar Behzadi 博士是合成人工智能。他是一位经验丰富的企业家，在人工智能、医疗技术和物联网市场建立了变革性业务。过去 14 年，他一直在硅谷建立和扩展以数据为中心的技术公司。 Yashar 拥有 30 多项专利和正在申请的专利，并拥有博士学位。来自加州大学圣地亚哥分校，专注于功能性脑成像的时空建模。

合成人工智能是一家深度学习和 CGI 交叉领域的初创公司，为计算机视觉模型开发创建了新范例。它们使客户能够以传统基于人工注释的方法的一小部分时间和成本开发更好的模型。

您最初是如何涉足计算机科学和人工智能的？

我获得了博士学位。 2006 年获得加州大学圣地亚哥分校博士学位，专注于计算机视觉以及脑成像数据的时空建模。接下来的 16 年里，我在硅谷从事传感器、数据和机器学习跨行业交叉领域的工作。我感到非常幸运，有机会研究一些卓越的技术，并且我拥有 30 多项已颁发或申请的专利，专注于信号处理、机器学习和数据科学。

您能分享一下 Synthesis AI 的起源故事吗？

在 2019 年创立 Synthesis AI 之前，我领导了一家全球人工智能服务公司，专注于为领先科技企业开发计算机视觉模型。无论公司规模如何，我发现我们都受到标记培训数据的质量和数量的极大限制。随着公司地域扩张、客户群扩大或开发新模型和新硬件，需要新的训练数据来确保模型充分运行。很明显，计算机视觉的未来不会在当今的人机循环注释范例中取得成功。自主、机器人和 AR/VR/元宇宙应用中的新兴计算机视觉应用需要人类无法标记的丰富的 3D 标签、深度信息、材料属性、详细分割等。需要一种新的范式来提供必要的丰富标签集来训练这些新模型。除了技术驱动因素之外，我们还看到消费者和监管机构对与模型偏差和消费者隐私相关的道德问题进行了越来越多的审查。

我创立了 Synthesis AI，旨在改变计算机视觉范式。该公司的合成数据生成平台能够通过一组扩展的 3D 像素完美标签按需生成逼真的图像数据。我们的使命是开拓合成数据技术，以道德方式开发更强大的模型。

对于不熟悉这个术语的读者，您能定义一下什么是合成数据吗？

合成数据是计算机生成的数据，可替代现实世界的数据。合成数据是在模拟数字世界中创建的，而不是从现实世界收集或测量的。 Synthesis AI 将视觉效果和 CGI 领域的工具与生成式 AI 模型相结合，使公司能够按需创建大量逼真的多样化数据来训练计算机视觉模型。该公司的数据生成平台在保护隐私的同时，将获取高质量图像数据的成本和速度降低了几个数量级。

您能讨论一下合成数据是如何生成的吗？

合成数据集是人为创建的，而不是通过现实世界的数据创建的。视觉效果行业的技术与生成神经网络相结合，可以创建大量、多样化且逼真的标记图像数据。合成数据可以以当前方法的一小部分成本和时间来创建训练数据。

利用合成数据如何创造竞争优势？

目前，大多数人工智能系统都利用“监督学习”，人类在图像中标记关键属性，然后训练人工智能算法来解释图像。这是一个资源和时间密集型的过程，并且受到人类可以准确标记的内容的限制。此外，对人工智能人口统计偏见和消费者隐私的担忧加剧，使得获取具有代表性的人类数据变得越来越困难。

我们的方法是创建合成复杂图像数据的逼真数字世界。自从我们生成数据以来，我们就知道有关场景的一切，包括以前从未获得过的有关对象 3D 位置及其与彼此和环境的复杂交互的信息。使用当前方法获取并标记如此大量的数据将需要数月甚至数年的时间。这种新模式将使效率和成本提高 100 倍，并推动新一类功能更强大的模型。

由于合成数据是人工生成的，这消除了传统上从现实世界收集数据集的许多偏见和隐私问题。

按需数据生成如何实现加速扩展？

捕获和准备模型训练的真实数据是一个漫长而乏味的过程。对于自动驾驶车辆、机器人或卫星图像等复杂的计算机视觉系统来说，部署必要的硬件可能非常昂贵。一旦捕获数据，人类就会标记和注释基本特征。此过程很容易出错，而且人类标记关键信息（例如许多应用所需的 3D 位置）的能力有限。

合成数据比传统的人工注释真实数据方法更快、更便宜几个数量级，并将加速跨行业部署新的、更强大的模型。

合成数据如何减少或防止人工智能偏见？

人工智能系统无处不在，但可能包含影响人群的固有偏见。数据集可能与某些类别的数据不平衡，并且人群的代表性过高或过低。建立以人为本的系统通常会导致性别、种族和年龄偏见。相比之下，设计生成的训练数据是适当平衡的并且缺乏人为偏见。

合成数据可能成为解决人工智能偏见问题的强大解决方案。合成数据是部分或完全人工生成的，而不是从现实世界的事件或现象中测量或提取的。如果数据集不够多样化或不够大，人工智能生成的数据可以填补漏洞并形成无偏差的数据集。最好的部分？手动创建这些数据集可能需要团队花费几个月或几年的时间才能完成。当使用合成数据进行设计时，可以在一夜之间完成。

除了计算机视觉之外，未来合成数据还有哪些其他潜在用例？

除了与消费产品、自主、机器人、AR/VR/元宇宙等相关的众多计算机视觉用例之外，合成数据还将影响其他数据模式。我们已经看到公司利用合成数据方法进行结构化表格数据、语音和自然语言处理。每种模态的底层技术和生成管道都不同，在不久的将来，我们预计会看到多模态系统（例如视频+语音）。

关于 Synthesis AI，您还有什么想分享的吗？

去年年底，我们发布了人文API，Synthesis AI 合成数据功能的显着扩展，能够以编程方式生成数百万个独特的高质量 3D 数字人类。这一公告是在 FaceAPI 合成数据即服务产品推出几个月后发布的，该产品已为领先的智能手机、电话会议、汽车和科技公司提供了超过 10 万张带标签的面部图像。 HumanAPI 是该公司支持先进计算机视觉人工智能 (AI) 应用程序的下一步。

HumanAPI 还为我们的客户带来了无数新的机会，包括智能 AI 助手、虚拟健身教练，当然还有元宇宙应用程序的世界。

通过创建现实世界的数字替身，元宇宙将支持新的应用程序，包括重新构想的社交网络、娱乐体验、电话会议、游戏等。计算机视觉人工智能对于如何在数字领域高保真地捕捉和重建现实世界至关重要。逼真、富有表现力和行为准确的人类将成为计算机视觉应用未来的重要组成部分。 HumanAPI 是第一个使公司能够按需创建大量完美标记的全身数据的产品，以构建更强大的人工智能模型，包括姿势估计、情绪识别、活动和行为特征描述、面部重建等。

感谢您的精彩采访，想要了解更多信息的读者可以访问合成人工智能.