人工智能

Unity 推出合成数据集以减少 AI 训练时间和预算

mm

Unity,一个实时 3D(RT3D)内容平台,宣布发布 Unity 计算机视觉数据集。这些数据集可能会影响各个行业,特别是制造业、零售业和安全领域。它们旨在降低开发计算机视觉应用的成本,同时提供一种更快地训练 AI 系统的方法。

按照严格的隐私和监管规定,计算机视觉解决方案提供商现在可以购买定制的数据集来训练 AI 系统。

合成数据的重要性

合成数据是在现有数据不满足 AI 系统的特定条件或需求时生成的。一些例子包括当隐私要求限制可用数据或其使用方式时。

合成数据通常用于测试尚未发布的产品,因为通常没有现有数据或尚不可用。此类数据对于机器学习算法也至关重要,常用于技术如自动驾驶汽车,因为获取实际数据的成本很高。

Unity 正在尝试通过提供更高质量的合成数据集来打破这一障碍,使用 Unity 计算机视觉数据集。

Danny Lange 博士是人工智能和机器学习的高级副总裁。

“通过创建合成版本的数据集,模拟验证的隐私规则并准确反映现实世界的数据,我们使这些开创性的数据集能够进入更多创新的手中,”Lange 说。

“本质上,这些数据集使公司能够计划和模拟它们尚未经历的场景,并且用户数据的增加模拟了它们在现实世界中随着时间的推移会发现的内容。因此,我们看到更智能的室内环境,例如无人收银的杂货店,以及更多我们的客户发现的新应用。”

https://www.youtube.com/watch?v=Cz7KWqAgZAw

域随机化

Unity 计算机视觉数据集使用的技术称为“域随机化”,它有助于开发多样化的数据集以提高质量和控制偏差。它通过输出对象的位置和方向的排列,包括光照变化、相机角度和可能的配置来工作。

Unity 的合成数据集还避免了由于使用来自互联网的真人和真实地点的图像或手动捕获的图像而产生的偏差问题。

注释通常会随着注释类型的复杂性增加而增加价格,但 Unity 提供了一种价格适用于所有标签类型,这意味着简单和复杂的行业标准标签类型将支付相同的价格。数据集基于分级定价模型,价格根据对更多合成图像的需求而降低。

“合成数据正在革新机器学习模型的训练,因为它克服了手动收集和标记的真实世界数据的许多缺点,”Lange 说。

“解释可能的内容,并将创作者与他们需要的负担得起的数据连接起来,以便他们做出正确的决定,这将继续推动 Unity 的发展,无论行业如何。这就是为什么我们的团队将为客户提供帮助,以确保生成的数据集满足他们的需求。”

Alex McFarland 是一名人工智能记者和作家,探索最新的人工智能发展。他曾与世界各地的众多人工智能初创公司和出版物合作。