研究人员开发新的控制人工智能图像生成的方法

发布于 2021年6月1日

更新于 2026年5月24日

作者

Alex McFarland

来自北卡罗来纳州立大学的研究人员开发了一种新的控制人工智能（AI）图像生成的方法，这种方法可以应用于自动驾驶汽车等领域。

条件图像生成是一项AI任务，涉及AI系统根据用户指定的条件创建图像。新的技术已经将其进一步发展，并将图像布局的条件纳入其中，允许用户指定特定位置的对象类型。

北卡罗来纳州立大学的研究人员开发了一种新的最先进的方法，建立在这些技术之上，并使用户能够对图像具有更多的控制权，同时保留一系列图像的某些特征。

田夫吴（Tianfu Wu）是研究论文的共同作者，也是北卡罗来纳州立大学计算机工程系的助理教授。

“我们的方法具有高度的可重构性，”吴说。“像以前的方法一样，我们的方法允许用户根据特定的条件生成图像。但我们的方法还允许用户保留图像并添加到它。例如，用户可以让AI创建一个山景，然后让系统在该景中添加滑雪者。”

使用这种新方法，用户还可以让AI操纵元素，使其在移动或更改的同时仍然可以识别。一个例子是AI创建一系列图像，其中滑雪者转向观众，同时在景观中移动。

“这种方法的一个应用是帮助自动驾驶机器人在开始任务之前‘想象’结果可能是什么样子，”吴说。“您也可以使用该系统生成AI训练图像。因此，您不需要从外部来源编译图像，而可以使用该系统创建用于训练其他AI系统的图像。”

该新方法使用COCO-Stuff数据集和Visual Genome数据集进行了测试，根据图像质量标准，它优于以前的最先进技术。

“我们的下一步是看看我们是否可以将这项工作扩展到视频和三维图像，”吴说。

为了训练这种新方法，研究人员不得不依赖于一个4-GPU工作站，因为需要大量的计算能力。尽管如此，部署该系统仍然具有较低的计算成本。

“我们发现，一块GPU几乎可以实现实时速度，”吴说。

“除了我们的论文，我们还在GitHub上提供了该方法的源代码。我们始终对与行业合作伙伴合作持开放态度。”

Alex McFarland

Alex McFarland 是一名人工智能记者和作家，探索最新的人工智能发展。他曾与世界各地的众多人工智能初创公司和出版物合作。

Unite.AI