Anderson 视角

使用评论创建一个有效的推荐系统

发布于 2022年2月1日

更新于 2026年5月24日

作者

Martin Anderson

如果您曾经在线购买过产品，并对推荐的“相关商品”感到惊讶，那么您已经理解了流行的推荐系统往往在理解潜在购买之间的关系方面存在不足。

如果您购买了一件不常见的商品，例如烤箱，推荐的其他烤箱可能是多余的，尽管最糟糕的推荐系统无法承认这一点。例如，TiVO的推荐系统在2000年代初期就引发了争议，因为它重新分配了用户的性别偏好，用户随后试图通过选择战争电影来“重新男性化”自己的用户资料——这是一个粗糙的算法修订方法。

更糟糕的是，您不需要实际购买任何商品（例如在亚马逊），或实际开始观看一部电影（在任何主要流媒体平台上），就足以让信息匮乏的推荐算法开始走错路；搜索、停留和点击“详细信息”页面就足够了，这些零碎的（可能是错误的）信息可能会在未来的浏览会话中被传播。

让推荐系统忘记

有时可以进行干预：Netflix提供了“点赞/点踩”系统，理论上可以帮助其机器学习算法从您的推荐配置文件中删除某些嵌入的概念和单词（尽管其有效性已经被质疑，并且从头开始创建个性化推荐算法比删除不需要的本体更容易），而亚马逊允许您从客户历史记录中删除标题，这应该会降低任何不受欢迎的域名的优先级，这些域名可能已经渗透到您的推荐中。

Hulu有一个类似的功能，而HBO Max已经部分放弃了仅依赖算法的推荐系统，转而采用人工策划的推荐系统，以应对当前的缺陷。

这些消费级体验甚至没有涉及被广泛批评的“被动”广告平台推荐系统（由于公众的愤怒，谷歌的FLoC和Topics API即将发生重大变化），或社交媒体AI推荐系统的热门话题，YouTube、Twitter和Facebook等网站继续受到批评，因为它们的推荐不相关或甚至有害。

机器似乎不知道我们想要什么，除非我们想要搜索结果中出现的相邻商品——即使该商品基本上是重复或替代品，而不是我们可能刚刚购买的商品的补充或附属品。

使用评论数据实现准确推荐

中国和澳大利亚的研究人员提出了一种新方法，利用外部用户评论来更好地理解购物会话中商品之间的关系。在测试中，该架构优于所有当前的最先进方法，提供了希望——推荐系统可以更好地理解商品之间的依赖关系。

该项目解决了创建即使在匿名会话中也能提供推荐的显著挑战，在匿名会话中，推荐系统无法访问用户贡献的详细信息，例如购买历史或用户对先前购买的评论。

该新论文称为《重新思考会话推荐中的邻近依赖性》，由中国的齐鲁工业大学和北京工业大学、澳大利亚墨尔本的皇家墨尔本理工大学以及悉尼科技大学的澳大利亚人工智能研究所的研究人员共同撰写。

接下来是什么？

会话推荐的核心任务是确定当前商品的“下一个”商品，基于其计算出的与当前商品的关系。在实践中，这可能表现为电子商务网站上商品页面中的“相关商品”列表。

如果您正在购买鸟笼，您可能还需要什么？好吧，至少您需要一只鸟来放入笼中——这是一个真正的依赖关系。然而，鸟笼属于“宠物用品”类别，里面没有出售鸟。相反，“猫粮”属于同一类别，推荐附带的猫食碗作为鸟笼产品的关联推荐是一种错误的依赖关系——一种错误的关联。

众所周知，机器学习架构中很难说服推荐系统相信一个“遥远”的实体（例如“鸟”根本不属于“宠物产品”类别）可能与某个商品有内在的重要关系，而同一类别中功能和核心概念非常接近的商品（例如“猫食碗”）可能与正在考虑的购买无关或直接相反。

唯一能创建这些“非邻近”实体之间的映射关系的方法是众包，因为所涉及的关系是人类经验的方面，不能通过编程推断出来，可能超出了传统数据标记方法的经济范围，例如亚马逊Mechanical Turk。

因此，研究人员采用了自然语言处理（NLP）机制来提取产品评论中的显著单词，并使用这些分析的频率来创建能够“匹配”看似遥远的商品的嵌入。

架构和数据

正如新论文所述，类似的前期工作利用了登录用户自己的评论历史来提供基本的映射关系。DeepCONN和RNS都使用了这种方法。然而，这种方法忽略了用户可能没有写过任何评论，或者没有写过与特定商品相关的评论，或者没有登录过账户。此外，这是一种“白盒”方法，因为它假设用户已经足够地与平台互动，创建了账户并登录了账户。

研究人员提出的扩展图神经网络（GNN）采用了更为先验的方法，推导出真正的依赖关系，因此，推测，匿名和未登录的用户可以在最少的输入下体验到更相关的推荐。

评论增强的系统被称为“评论改进的商品间图神经网络”（RI-GNN）。研究人员已经将其与两个来自亚马逊的数据集进行了测试：《宠物用品》和《电影和电视》。虽然这很好地解决了评论可用性的问题，但在实际应用中，需要找到并爬取一个合适的评论数据库。这样的数据源可以是社交网络上的帖子、Quora上的答案，或者其他任何内容。

这种高级别的关系映射对于众多机器学习应用程序来说是有价值的，除了推荐系统之外。许多当前项目由于资金和范围的限制而受到限制，缺乏领域间和领域内的映射关系，而真正的、众包的电子商务推荐系统的商业动力可能会填补这一空白。

指标和测试

作者将RI-GNN与每个数据集的两个版本进行了比较，每个版本都包括用户的购买历史和产品的通用评论。出现次数少于五次的商品被删除，用户历史被分成一周的单位。第一个数据集版本包括所有包含多个商品的会话，第二个数据集版本包括所有包含五个以上商品的会话。

该项目使用P@K（精度）和MRR@K（平均倒数排名）作为其评估指标。所测试的竞争对手架构包括：S-KNN；GRU4Rec；S-POP；STAMP；BERT4Rec；DHCN；GCE-GNN；SR-GNN；和NARM。

框架在Adam上以0.001的学习率训练，每批100个样本，主题数量分别设置为24和20，用于“宠物用品”和“电影和电视”数据集。

首次发布于2022年2月1日。