存根 仅基于图像的 AI 灵魂伴侣推荐系统 - Unite.AI
关注我们.

人工智能

一种仅基于图像的AI灵魂伴侣推荐系统

mm
更新 on

英国研究人员使用神经网络开发了一种完全基于图像的在线约会推荐系统,该系统仅考虑两个用户是否被彼此的照片所吸引(而不是诸如工作、年龄等个人资料信息)。 ),并且发现它在获得准确匹配方面优于不太“浅”的系统。

由此产生的系统称为基于时间图像的互惠推荐器 (TIRR),并使用递归神经网络 (RNN) 来解释用户在浏览潜在匹配时遇到的面孔的历史偏好。

的标题是——也许令人沮丧—— 照片是在线约会中相互推荐所需要的一切,来自布里斯托大学的两名研究人员,显着改进了类似的系统(称为 即时记录)由同一团队于 2020 年发布。

在测试中,该系统在预测能力方面获得了最先进的准确性 倒数 用户之间的匹配,不仅改进了研究人员 2020 年的工作,还改进了其他基于内容的约会互惠推荐系统,该系统考虑了约会资料中更详细的基于文本的信息。

真实世界约会数据集

TIRR 接受了一项未命名的“流行”在线约会服务提供的用户信息的培训,该服务拥有“数百万注册用户”,该服务仅允许用户在彼此“喜欢”对方的个人资料后才能相互交流。 使用的数据子集包括 200,000 名受试者,男女各占一半,以及所有约会资料中大约 800,000 个用户表达的偏好。

由于提供数据的匿名约会服务仅支持异性匹配,因此研究中仅涵盖男性/女性匹配。

TIRR 改进了该领域之前的互惠推荐系统 (RRS) 设计,仅根据个人资料图像直接计算两个个人资料之间的匹配概率。 先前的系统预测了两个单向偏好,然后将它们聚合以获得预测。

研究人员排除了已从约会服务中删除的用户(出于任何原因,包括自愿离开),并排除了不包含基于面部的照片的个人资料。

用户历史记录仅限于一年前,以避免约会网站随着时间的推移调整其算法而可能出现的潜在异常情况。 它们还被限制为最多 15 个用户偏好,因为这些偏好被证明足以证明模型设计,而更广泛地使用偏好会降低性能并增加训练时间。

此外,一些更热衷或长期的用户有使用过的历史 数千 的偏好,这可能会导致所获得的特征的权重发生偏差,并进一步延长训练时间。

连体网络

TIRR 的公式为 连体网络,通常用于 “一次性”学习.

模板 Siamese 网络,其中并行卷积神经网络 (CNN) 共享权重但不共享数据。 它们还共享从每个 CNN 输出导出的损失函数和地面实况标签。 资料来源:https://arxiv.org/pdf/2108.11714.pdf

模板 Siamese 网络,其中并行卷积神经网络 (CNN) 共享权重但不共享数据。 它们还共享从每个 CNN 输出导出的损失函数和地面实况标签。  资料来源:https://arxiv.org/pdf/2108.11714.pdf

该网络使用二元交叉熵进行训练,二元交叉熵是神经网络中的一种常见损失函数,研究人员发现与 对比损失。 后者在评估两个人脸之间的奇偶性的系统中最有效,但由于这不是 TIRR 的目标,因此这种方法在这种情况下表现不佳。

系统有必要保留和构建在训练对相同数据进行多次迭代时所开发的信息,并且 TIRR 中的 Siamese 网络使用 LSTM (长期短期记忆)网络来做出这些决策,并确保在框架构建其见解时不会临时丢弃被视为相关的功能。

TIRR 的特定 Siamese 网络架构。

TIRR 的特定 Siamese 网络架构。

研究人员发现,当输入所有数据时,网络训练速度非常慢,随后使用三个不同的数据子集将训练分为三个阶段。 这还有一些额外的优势,因为研究人员 2020 年的实验已经证明,分别训练男性和女性数据集可以提高互惠推荐系统的性能。

TIRR 暹罗网络单独培训课程的细分。

TIRR 暹罗网络单独培训课程的细分。

测试

为了评估 TIRR 的性能,研究人员将部分获得的数据保留在一侧,并通过全融合系统运行它。 然而,由于该系统相当新颖,因此没有可以与其直接类似的现有系统进行比较。

因此,研究人员首先建立了接收者操作特征曲线(ROC)在使用统一流形近似和投影进行降维之前,暹罗网络的基线(乌玛普)以简化 128 维向量以便于可视化,从而建立连贯的喜欢和不喜欢的流。

左边,Siamese 网络的 ROC 作为性能的基线指标; 在右侧,UMAP 可视化显示“喜欢”为红色,“不喜欢”为黑色。

左边,Siamese 网络的 ROC 作为性能的基线指标; 在右侧,UMAP 可视化显示“喜欢”为红色,“不喜欢”为黑色。

TIRR 针对具有类似范围的协作过滤和基于内容的系统进行了测试,包括研究人员之前的工作 ImRec(见上文),以及 侦察,2010 年的 RRS,以及协同过滤算法 循环碳纤维 (2015 年基于约会资料文本内容的约会 RRS)以及 低频RR (2019 年的类似项目)。

在所有情况下,TIRR 都能提供卓越的准确性,尽管与 LFRR 相比仅略有提高,这可能表明个人资料文本内容与受试者个人资料照片的吸引力感知水平之间存在相关因素。

基于图像的 TIRR 和更多基于文本的 LFRR 之间的接近同等性至少允许两种可能性:用户对视觉吸引力的感知受到配置文件文本内容的影响; 或者,如果相关图片不被认为具有吸引力,则文本内容会受到更多的关注和认可。

由于显而易见的原因,研究团队无法发布 TIRR 的数据集或源代码,但鼓励其他团队复制并确认他们的方法。

 

注:主要插图中使用的图像来自 thispersondoesnotexist.com。