人工智能

使用机器学习在视频中重塑面部

Published May 9, 2022

Updated April 28, 2026

Martin Anderson

中国和英国的研究合作开发了一种新的方法来重塑视频中的面部。这种技术可以实现令人信服的面部结构的加宽和变窄，具有高的一致性和没有伪影。

从YouTube视频中使用的源材料，女演员詹妮弗·劳伦斯出现在更为修长的个性（右）。请参阅文章底部嵌入的视频以获取更多示例和更好的分辨率。来源：https://www.youtube.com/watch?v=tA2BxvrKvjE

这种转换通常只可能通过传统的CGI方法来实现，这需要通过详细和昂贵的运动捕捉、骨骼绑定和纹理过程来完全重建面部。

相反，所使用的CGI技术被集成到一个神经管道中，作为参数化的3D面部信息，随后被用作机器学习工作流的基础。

传统的参数化面部越来越多地被用作使用AI而不是CGI的转换过程的指导。来源：https://arxiv.org/pdf/2205.02538.pdf

作者表示：

‘我们的目标是通过编辑面部的整体形状来生成高质量的肖像视频重塑结果，根据现实世界中的自然面部变形。这可以用于诸如美化的形状生成和视觉效果的面部夸张等应用。’

虽然2D面部扭曲和变形自Photoshop出现以来就已可供消费者使用（并导致了奇怪和往往不可接受的子文化的产生，例如面部变形和身体畸形），但在不使用CGI的情况下在视频中实现这一点是一件棘手的事情。

马克·扎克伯格的面部尺寸被中英技术扩大和缩小。

身体重塑目前是计算机视觉领域的一个热点，主要是由于其在时尚电子商务中的潜力，尽管使某人看起来更高或更具骨骼多样性目前是一个值得注意的挑战。

同样，在视频片段中以一致且令人信服的方式改变头部的形状一直是新论文研究人员之前工作的主题，尽管该实现遭受了伪影和其他限制。新的系统扩展了该先前研究的能力，从静态到视频输出。

新系统是在一台配备AMD Ryzen 9 3950X和32GB内存的台式电脑上训练的，使用OpenCV的光流算法来生成运动图，并使用StructureFlow框架进行平滑；面部对齐网络（FAN）组件用于特征点估计，也用于流行的深度伪造包；以及Ceres Solver来解决优化挑战。

新系统的面部加宽的极端示例。

论文题为《视频中肖像的参数化重塑》，由浙江大学的三位研究人员和巴斯大学的一位研究人员撰写。

关于面部

在新系统中，视频被提取成图像序列，并首先估计每个面部的刚性姿势。然后，构造一致的身份参数，用于整个图像序列（即视频帧）。

面部变形系统的架构流程。

之后，评估表情，产生一个重塑参数，通过线性回归实现。然后，一个新颖的有符号距离函数（SDF）方法构造了面部线条在重塑前后的密集2D映射。

最后，在输出视频上执行内容感知变形优化。

参数化面部

该过程使用3D可变形面部模型（3DMM），这是神经和GAN-based面部合成系统中越来越流行的辅助工具，也适用于深度伪造检测系统。

不是来自论文的，但这是一个3D可变形面部模型（3DMM）的示例——一个参数化的原型面部，用于新项目。顶部左侧，特征点应用于3DMM面部。顶部右侧，等值图的3D网格顶点。底部左侧显示特征点拟合；底部中间，提取面部纹理的等值图；底部右侧，结果拟合和形状。来源：http://www.ee.surrey.ac.uk/CVSSP/Publications/papers/Huber-VISAPP-2016.pdf

不是来自新论文的，但这是一个3D可变形面部模型（3DMM）的示例——一个参数化的原型面部，用于新项目。顶部左侧，特征点应用于3DMM面部。顶部右侧，等值图的3D网格顶点。底部左侧显示特征点拟合；底部中间，提取面部纹理的等值图；底部右侧，结果拟合和形状。来源：http://www.ee.surrey.ac.uk/CVSSP/Publications/papers/Huber-VISAPP-2016.pdf

新系统的工作流程必须考虑遮挡的情况，例如当主题看向别处时。这是深度伪造软件中最大的挑战之一，因为FAN特征点在这些情况下几乎没有容量，并且随着面部的转移或遮挡，质量会恶化。

新系统可以通过定义一种能够匹配3D面部（3DMM）和2D面部（由FAN特征点定义）边界的轮廓能量来避免这个陷阱。