访谈
Stephen Miller,Fyusion 联合创始人兼工程副总裁 – 采访系列

Stephen Miller 是 Fyusion 的联合创始人兼工程副总裁,Fyusion 是一家 3D 成像和计算机视觉公司,隶属于 Cox Automotive 集团。在联合创立 Fyusion 之前,他曾是斯坦福大学的博士生,研究计算机科学,并在加州大学伯克利分校的本科生涯中从事个人机器人领域的工作,例如折衣和外科结扎。他是 Google Hertz Fellow,SAP 斯坦福研究生 Fellow 和 NSF Fellow 校友。
您能解释一下 Fyusion 是什么以及它如何实现 3D 数据的轻松捕获和可视化吗?
Fyusion 是一家计算机视觉公司,提供 AI 驱动的 3D 客户体验。我们使人们能够通过在大多数 Android 和 iOS 设备上运行的简单智能手机应用程序捕获 3D 图像。该应用程序具有分步指南,旨在让任何人使用,无论其技术水平如何。捕获图像需要一两分钟。从那里,我们的 AI 引擎 ALIS 可以分析 3D 图像并将其转换为可行的信息。目前,我们专注于使用 3D 图像来诊断汽车的外部损坏。
您能解释一下算法如何使用 .fyuse 文件格式来使单摄像头智能手机能够创建 3D 图像吗?
我发现将 .fyuse 格式与照片和视频一起考虑很有帮助。照片捕捉一个时间点的瞬间,从一个固定的角度,而视频捕捉一系列这些瞬间的线性时间线。相比之下,.fyuse 图像捕捉我们喜欢称为“空间中的瞬间”的东西。查看者不仅限于一个角度或线性时间线:他们可以看到不仅仅是某事物的一侧,还可以看到它的周围。
要创建 .fyuse 图像,摄影师使用手机摄像头以一个方向围绕拍摄对象。或者,Fyusion 技术也与固定成像解决方案和非传统成像解决方案(如无人机)兼容。
我们的 .fyuse 文件格式使这些图像变得生动。它轻量级,能够实现复杂、多面性的交互性。它也完全兼容笔记本电脑、平板电脑和智能手机,这些设备每个用户都已经在使用。
您能讨论一下 Fyusion 捕获和分析的数据吗?
对于汽车,ALIS 识别出车辆的每个部分,然后可以确定损坏的位置、损坏的大小和严重程度,并消除潜在的假阳性,例如从道路上扬起的灰尘。我们开发和获得专利的技术可以解决其他问题,但这就是我们目前关注的重点。
您能讨论一下 AI 基础的光场信息套件(ALIS)吗?
ALIS 是 Fyusion 每个产品背后的引擎。它使轻量级 3D 成像和深度视觉理解成为可能。ALIS 由三个部分组成:捕获、引擎和查看器。在捕获模块中,移动应用程序包含内置教程和可自定义的工作流程,允许用户使用市场上大多数智能手机捕获高质量的 3D 图像。Fyusion 的图像捕获还支持 DSLR、无人机和其他设备。
在第二步,即引擎,ALIS 分析这些 3D 图像并将其转换为可行的信息,例如我们的客户所需的损坏类型。它还可以通过创建损坏的高分辨率 2D 图像来提供其发现的备份。
最后,查看器显示 .fyuse 文件格式。.fyuse 是专利的,轻量级的,并提供了沉浸式的 3D 体验,加载速度快。我们可以将各种体验附加到 .fyuse 中,包括音频、视频和 2D 图像。
Fyusion 既支持 AR 又支持 VR,您认为这些应用程序在未来会有多大的发展空间?
增强现实是一种价值十亿美元的产业,它变得更加主流,感谢强大的新移动设备和低延迟网络,捕捉周围环境的 3D 成像变得更加容易。随着这些技术进入主流,客户对在线体验的期望将会迅速提高。
尤其是在汽车行业,汽车购买越来越多地转向在线,在接下来的几年里,我们预计会出现对 AR、VR 和 3D 列表的兴趣激增。目标是将简单的车辆详细信息页面(VDP)转变为车辆体验页面(VEP),帮助大型和小型汽车经销商继续蓬勃发展。这可以是任何事情,从在列表中添加 3D 标志和丰富的媒体标签,到允许购物者虚拟地将一套高尔夫球杆放在汽车的后备箱中,以查看它们如何适合内部。
将会很令人兴奋地看到这些应用程序开始进入主流使用。我不认为这会等待很久。
您能讨论一下在电子商务中使用 3D 图像而不是 2D 图像的点击率和收入的改善吗?
我最熟悉批发和零售汽车销售。3D 图像为在线购物者创造了一个新的信任层次,这对于像汽车这样的大件商品尤为重要。
我们的内部数据表明,3D 图像增加了用户的参与度和在车辆详细信息页面上花费的时间,这反过来又被证明可以增加汽车销售。提供对车辆的生动 3D 体验也通过增加对供应商的信任来建立了积极的情绪。
其中一个选项是 Fyusion,可以在本地或云端处理数据,您能讨论一下每种方法的优点吗?
在本地,边缘 AI 强迫开发人员在可接受的约束范围内工作,特别是对于移动电话的使用情况。除了任何 AI 开发人员的标准问题外,还有一些实际问题设置了明确的上限。内存压力、电池耗尽、用户或操作系统可能将您的进程置于后台等等。并且这假设可比拟的 CPU 和 GPU 在边缘可用。即使对于旗舰设备,这种情况也很少见。
您需要为每种可能的情况做计划;而在云端,任何解决方案都可以被监控和微调。
但是,从整体上讲,边缘 AI 可以被认为是完美的“自动缩放”解决方案:对于每个新用户,您都有一个全新的机器在您的处置。 如果您已经将网络优化为完全在边缘运行,您可以轻松地为两个或两百万个客户提供服务。
虽然最强大的硬件始终存在于云端,但数据是最重要的。数据越多,越接近原始数据越好。边缘 AI 可以访问未处理的原始输入数据,没有任何限制。相比之下,云 AI 解决方案需要输入数据要么被处理(压缩、部分),要么非常庞大,此时带宽成为一个严重的问题。
由于边缘 AI 最接近用户,因此它开启了云 AI 不具备的各种可能性。如果它被优化为实时运行,它可以提供实时反馈。这意味着您可以构建不仅可以处理数据,还可以鼓励用户提供更好数据的解决方案。
5G 将如何使计算机视觉技术应用程序实现快速增长?
在更快的连接速度下,您可以将更多的处理移到云端,这为各种新的计算机视觉应用程序打开了可能性。然而,这确实取决于应用程序以及它将被如何广泛采用。
5G 可能会产生分裂的影响,并进一步扩大数字鸿沟,因为世界的一些地区拥有更快的连接速度,而其他地区将继续拥有缓慢的连接速度。专注于拥有 5G 的人的应用程序显然会受益。然而,更广泛采用的应用程序可能需要在为将基本上成为同一应用程序的两个版本投入时间和金钱之间做出选择,或者坚持使用一个版本,该版本不那么强大,但可以在几乎任何连接上运行。
Fyusion 正在采取什么步骤来利用未来的 5G 推出?
我想先说明,Fyusion 已经花费了大量时间来确保客户即使使用旧手机和带宽有限的连接也能访问我们的应用程序。仅与曼海姆合作,我们的技术就已经对超过一百万辆汽车进行了成像,我们不会仅凭借此来实现这一点。
话虽如此,我们对目前看到的东西感到非常兴奋——这是处理速度增加、5G 连接和相机手机革命的三重奏。把所有这些放在一起,你会得到一些新发展,我不幸的是无法与你分享。
您是否还有其他关于 Fyusion 的信息想要分享?
这是一个令人兴奋的时期,计算机视觉作为一个学科正在进入主流——在被认为是未来技术的多年之后。Fyusion 正在快速增长,我们正在从世界各地聘请计算机视觉科学家。我们的团队成员可以从任何地方工作,但他们始终受到我们波特雷罗山办公室的欢迎。
感谢这次精彩的采访,希望了解更多的读者应访问 Fyusion。












