关注我们.

人工智能

利用机器学习通过步行方式确定性别

mm

罗马尼亚的研究人员开发了一种机器学习系统,能够根据人的行走方式识别性别,无需分析面部成分(可能被隐藏或模糊),也无需依赖轮廓分析或其他身体佩戴方式性别线索(可以被其他性别的成员“欺骗”)。

相反,新系统使用基于这些短暂(且可变)信号的现有标签系统来识别区分男性和女性步态的核心特征,从而形成一个仅从一个人的“骨骼”运动中有效识别性别的系统步行。

实际上,这种新方法量化了男性和女性行走的不同方式,而无需求助于其他信号; 但由于它使用其他特征(例如面部信息)来最初标记步态风格,因此该研究留下了一个问题:哪些特定特征在行走时区分性别。

新方法从面部分析模型中得出性别身份,该模型在限制下运行(例如有限的可用角度以及数据集管理的需要)。 然后,系统将骨骼运动特征分配为男性或女性,并提取每个特征的行走特征,忽略面部、服装和其他不可靠的数据源。 资料来源:https://arxiv.org/pdf/2111.00538.pdf

新方法从面部分析模型中得出性别身份,该模型在限制下运行(例如有限的可用角度以及数据集管理的需要)。 然后,系统将骨骼运动特征分配为男性或女性,并提取每个特征的行走特征,忽略面部、服装和其他不可靠的数据源。 资料来源:https://arxiv.org/pdf/2111.00538.pdf

新的 标题为来自 面对面步态:从步行模式中弱监督学习性别信息,来自布加勒斯特理工大学的研究人员。

该系统的性能与面部分析模型相当,并且经常超出这些标准, F1分数 高达 91%,并对新场景提供高水平的泛化,包括通常会阻碍基于面部或类似性别识别系统有效性的各种观点和情况。 这些包括面部模糊的视点、非正面角度和低分辨率图像的非常典型的场景,或者对图像中远处的人的监视,其中只有运动风格仍然是潜在的可靠的性别指标。

性别差异

正如研究人员得出的结论,这样的系统对于人口统计框架具有巨大的潜力,而目前该框架不仅受到新冠疫情下口罩采用的阻碍,而且还受到服装和服装制造的怪异时尚和偶然事件的阻碍。 轮廓分析 从监控录像中识别性别的不可靠方法。

在监视方面,能够剔除所有不符合目标对象性别的潜在目标,可以将预处理以及对人类和机器注意力的需求减少一半——因为当前的识别系统通常难以正确分配被监视个体的性别。

来自新论文:性别识别系统失败的各种例子。 在上一行中,我们看到研究人员的新步态分析系统正确匹配图像的真实标签(M 或 F),而面部分析在同一实例中失败。 在下面的行中,我们看到研究人员使用的标签工具产生“嘈杂”(即不正确)性别标签的实例。 为了解决这个问题,研究人员使用了 PENCIL(“使用噪声标签学习的概率端到端噪声校正”)等方法。

来自新论文:性别识别系统失败的各种例子。 在上一行中,我们看到研究人员的新步态分析系统正确匹配图像的真实标签(M 或 F),而面部分析在同一实例中失败。 在下面的行中,我们看到研究人员使用的标签工具产生“嘈杂”(即不正确)性别标签的实例。 为了解决这个问题,研究人员使用 铅笔 (“使用噪声标签学习的概率端到端噪声校正”)等方法。

当然,通过步态分析进行可靠性别识别的可能性可能会增加 当前对步态欺骗方法的兴趣.

代理性别鉴定

理论上,通过对手工骨骼运动数据的严格分析,可以达到新项目所实现的相同功能。 如果做到了这一点,新项目可能会更深入地了解哪些运动特征最能定义性别。 然而,这种方法意味着大量的资源投入,研究人员转而使用现有的(弹性较差)系统来生成必要的标签。

这些“伪标签”无法完全洞察基于性别的步行特征,但可以以高度通用的方式按性别过滤步行模式,并且可以在资源限制下实现。

最初,研究人员使用 2019 前视步态 (FVG)数据集,它解决了从正面角度进行步态识别的挑战,它提供的线索比侧面视图少。 该数据集包含具有许多障碍的步行样本,例如不同的步行速度、杂乱的背景、不同的分辨率和服装差异。

从 2019 年的 FVG 论文中,GaitNet 根据前视镜头(面向公众的摄像机中常见的观看场景)自动从“行走视频”中学习基本的步态特征。 资料来源:https://arxiv.org/pdf/1904.04925.pdf

从 2019 年的 FVG 论文中,GaitNet 根据前视镜头(面向公众的摄像机中常见的观看场景)自动从“行走视频”中学习基本的步态特征。 资料来源:https://arxiv.org/pdf/1904.04925.pdf

由于 FVG 不面向性别识别,作者用性别信息手动注释了数据集中的 226 个受试者,以便为框架开发基本事实。

通过 MTCNN 促进面部检测,并通过 IMDB-WIKI 确定人口统计属性 数据集。 由于步态分析在长距离上可能比基于面部的推理更有效,因此最终标签是通过从面部边界框相对于框架尺寸的面积得出的性别置信度的加权平均值获得的。 骨骼被提取 阿尔法姿势,这消除了任何潜在的“赠品”,例如拍摄对象的客观高度(在临时公共摄像机场景中无法对其进行评估)。

测试

该系统经过测试 CASIA-B 步态数据库,对数据集中代表性过高的男性进行欠采样,以确保测试的平等性,数据分为 80% 的训练和 20% 的验证。

研究人员使用了他们自己之前的工作, 野生步态网络 (见下图),计算行走序列之间的相似度。 已经建立的性别 ID 现在已有效地进入框架流程的这一阶段。

WildGait 是一种时空图卷积网络,经过来自现实世界监控流的大量自动注释骨架序列的训练。 资料来源:https://arxiv.org/pdf/2105.05528.pdf

WildGait 是一种时空图卷积网络,经过来自现实世界监控流的大量自动注释骨架序列的训练。 资料来源:https://arxiv.org/pdf/2105.05528.pdf

最后,作者指出,该系统在确定性别的准确性方面与最先进的基于面部的系统相匹配。 由于源步行视频中可能出现多种可能的角度,因此结果分布在一系列可能的视点中:

 

 

机器学习作家,人体图像合成领域专家。曾任 Metaphysic.ai 研究内容主管。
个人网站: 马丁南德森.ai
联系我们 [电子邮件保护]
推特:@manders_ai