监控
CSET:中国计算机视觉监控研究领先世界

安全与新兴技术中心(CSET)的一份新报告发现,中国的研究部门对三项与人工智能相关的核心监控技术进行了“不成比例的研究”,而且中共对计算机视觉技术的更普遍的贡献正在增长以同样的速度,尤其是超过了西方的出版速度。

中国在计算机视觉研究更具争议性的子领域(主要与监控相关)的研究计划中处于明显领先地位。 资料来源:https://cset.georgetown.edu/wp-content/uploads/Surveillance-in-the-CV-Literature.pdf
中国拥有巨大领先优势的三个关键领域是人员重新识别(REID)、人群计数和欺骗检测(即旨在揭露颠覆识别技术企图的技术)。
此外,如上图所示,中国研究界发表的有关面向人类的计算机视觉任务的论文比例明显较高,该论文认为,这些任务代表了使用机器学习的更广泛监控解决方案的支持技术。这些任务包括情绪识别、面部识别和动作识别。
作者评论:
“这些算法通常用于良性的商业用途,例如在社交媒体照片中标记个人。 但计算机视觉的进步也可能使一些政府能够利用监视技术来达到镇压目的。
不那么险恶的一点是,作者发现与视觉监控相关的论文占研究期间进行的所有计算机视觉研究的不到 10%,而且更广泛的研究在各个国家之间分布相当均匀。
然而,研究人员认为,中国的主导地位是显而易见的*:
“计算机视觉和视觉监控研究领域超过三分之一的出版物是由中国机构的研究人员撰写的。
“这使得中国成为迄今为止在这两个领域最多产的国家。 中国研究人员在全球视觉监控研究中所占份额的增长速度与他们在计算机视觉研究中所占份额的增长速度相似。
新的 报告名为 人群视觉监控的人工智能研究趋势,代表自然语言处理 (NLP) 方法在涵盖 2015-2019 年已发表论文数据集上的应用,由 Ashwin Acharya、Max Langenkamp 和 James Dunham 撰写。
英语语言偏见
该论文的作者指出,他们的研究仅涉及英语科学论文,将其扩展到非英语出版物可能会揭示中国在这些领域的学术努力的更深层次的冰山。 此外,研究人员认为,利用专利数据、摄像头部署和相关政府政策等辅助信息来增强数据,可以增加这种统计领先优势。
当然,该论文承认,分析公共和公开发表的论文不能解释私人公司或国家研究以及分类研究,但在缺乏这些隐藏数据点的情况下,这是部门活动的可行指标。
架构和数据
作者通过训练获得核心数据 科学雷克斯 基于来自带有代码的论文的数据的文档级信息提取模型,该框架通过识别与计算机视觉相关的任务的引用,特别是以监视为中心的项目和举措来推导出论文的相关性。
然后,该模型被应用于 CSET 学术文献汇总体,其中包含六个学术数据集的 100 亿多篇个人出版物。 涉及的发布平台有 Dimensions、Web of Science、微软学术图谱、中国国家知识基础设施、arXiv 和 Papers With Code。
接受过 Arxiv 预印本培训, 科学伯特 然后分类器的任务是识别整个语料库中的计算机视觉论文。
事实上,SciREX 和 SciBERT 接受过英语文档培训,这使得研究人员无法将研究范围扩展到英语之外。 对此,研究人员评论道: “这意味着在国家比较中它低估了非英语的研究成果,特别是它可能低估了中国在世界研究中的份额。”
发现
研究发现,在视觉监控领域,人脸识别是最常见的任务,出现在 2019 年的一千多篇论文中。然而,作者指出,人群计数和人脸欺骗识别是“快速增长”的领域的追求。

从论文中,我们对研究年份中最常重复出现的任务进行了分类。 引用来源是 'CSET 合并语料库。 结果于 22 年 2021 月 XNUMX 日生成'
该论文的作者认为,即使是与监视相关的明显更“中立”且政治煽动性较小的计算机视觉追求也可能有助于镇压控制系统。 对于“动作识别”,他们观察到这可以用来识别拥挤的公共场所中的“异常行为”; 对于面部欺骗,他们评论 “虽然有时用于生物识别登录系统或防止欺诈,但它也可能阻止记者和活动人士隐藏自己的身份”; 关于情绪识别,论文评论说 “除了非安全导向和商业目的外,一些研究人员、公司和政府机构建议应用情绪识别来识别拥挤的公共区域的安全威胁”.
总的来说,调查结果似乎表明,与全球平均水平相比,中国对计算机视觉研究的兴趣高于平均水平。
作者总结:
“随着时间的推移,中国的计算机视觉和视觉监控份额不断增加。 美国及其盟友和合作伙伴在这些领域发表的研究数量与中国单独发表的研究数量相当。 然而,随着中国的增长,这些其他地区在全球监控研究中的份额保持稳定或下降。
*论文作者的大胆强调。
首次发布于 6 年 2022 月 XNUMX 日。