人工智能
使用评论创建有效的推荐系统

如果您曾经在线购买产品,并对“相关商品”在购买和售后过程中的荒谬性和不相关性感到惊讶,您已经理解流行和主流的推荐系统在理解潜在购买之间的关系方面往往存在不足。
如果您购买了一件不太可能和不常见的商品,例如烤箱,其他烤箱的推荐可能是多余的,尽管最糟糕的推荐系统未能承认这一点。在2000年代,例如,TiVO的推荐系统在该领域制造了早期的争议,通过重新分配用户的感知性别,用户随后试图通过选择战争电影来“重新男性化”其用户配置文件——这是一个对算法修订的粗糙方法。
更糟糕的是,您不需要在(例如)亚马逊实际购买任何东西,或者在任何主要流媒体平台上开始观看您正在浏览的电影描述,以便信息匮乏的推荐算法开始错误地引导您;搜索、停留和点击“详细信息”页面足以让算法开始错误地引导您,这些信息可能会在平台上的未来浏览会话中被延续。
尝试让推荐系统忘记
有时可以进行干预:Netflix提供了“点赞/点踩”系统,理论上应该帮助其机器学习算法从您的推荐配置文件中删除某些嵌入的概念和单词(尽管其有效性被质疑,并且从头开始开发个性化推荐算法比删除不需要的本体更容易),而亚马逊允许您从您的客户历史记录中删除标题,这应该会降级任何不受欢迎的域名,这些域名可能已经渗透到您的推荐中。
Hulu有一个类似的功能,而HBO Max已经部分地从仅算法推荐系统中撤退,面对其当前的缺陷。
这些消费者级别的体验甚至没有涉及对“被动”广告平台推荐系统的广泛和日益增长的批评(其中由于公众愤怒而有值得注意的变化),或社交媒体AI推荐的易燃话题,网站如YouTube、Twitter和Facebook继续受到批评,指出其推荐不相关或甚至有害。
机器似乎不知道我们想要什么,除非我们想要在搜索结果中出现的相邻项目,即使该项目基本上是我们刚刚购买的项目的副本或替代品,而不是潜在的补充或附属购买。
使用评论数据实现准确推荐
中国和澳大利亚的新研究合作提出了一个新方法,利用外部用户评论来更好地理解购物会话中项目之间的真实关系。在测试中,该架构优于所有当前的最先进方法,提供了希望,实现推荐系统能够更好地理解项目之间的依赖关系:

RI-GNN在项目之间关系的准确性方面优于主要竞争对手,尤其是在会话中有五个以上项目时。该系统在2018年亚马逊评论数据的宠物用品和电影及电视数据集上进行了测试。 来源:https://arxiv.org/pdf/2201.12532.pdf
此外,该项目解决了在匿名会话中创建推荐的显著挑战,在这种情况下,推荐系统没有访问用户贡献的详细信息,例如购买历史或用户对先前购买的在线评论。
新论文称为重新思考会话推荐中的邻近依赖,来自中国的齐鲁工业大学和北京工业大学的研究人员,澳大利亚墨尔本的RMIT大学,以及悉尼科技大学的澳大利亚人工智能研究所。
架构和数据
正如新论文所述,类似的前期工作利用登录用户自己的评论历史来提供基本的映射。 DeepCONN和RNS都使用了这种方法。然而,这种方法忽略了用户可能没有写任何评论,或者没有写与特定项目相关的评论,尤其是当项目不在用户通常的购买习惯范围内时。另外,这是一种“白盒”方法,因为它假设用户已经足够参与该平台,以创建帐户并登录。
研究人员提出的扩展图神经网络(GNN)采用了更为先知式的方法,推导出真实依赖关系先验,因此,匿名和未登录的用户可以在最少的输入下体验更相关的推荐。
评论增强的系统被称为评论改进的项目图神经网络(RI-GNN)。研究人员已经将其与两个亚马逊数据集进行了测试,宠物用品和电影和电视。虽然这很好地解决了评论可用性的问题,但在野外实施中,需要找到并抓取适当的评论数据库。这种数据源可以是社交网络上的帖子、Quora上的答案,或者任何其他评论集合。
这种高级别的关系映射对于推荐系统以外的许多机器学习应用程序来说也是有价值的。许多当前的项目由于资金和范围的限制而受到限制,而真正知识渊博和众包的电子商务推荐系统的商业动力可能会填补这一空白。
指标和测试
作者将RI-GNN与每个数据集的两个版本进行了比较,每个版本都包含用户的购买历史和产品的通用评论。出现次数少于五次的项目被删除,用户历史被分成一周的单位。第一个数据集版本包含所有包含多个项目的会话,第二个版本包含所有包含五个以上项目的会话。
该项目使用P@K(精度)和MRR@K(平均倒数排名)作为其评估指标。测试的竞争对手架构包括:S-KNN;GRU4Rec;S-POP;STAMP;BERT4Rec;DHCN;GCE-GNN;SR-GNN;和NARM。
框架在Adam上以0.001的学习率训练,每批100,主题数量分别设置为24和20,用于宠物用品和电影和电视。
首次发布于2022年2月1日。
