Anderson 视角

阿里巴巴开发了使用实时数据的搜索引擎模拟AI

mm

与中国学术研究人员合作,阿里巴巴开发了一个使用电子商务巨头的实时基础设施的实时数据的搜索引擎模拟AI,以开发新的排名模型,这些模型不受“历史”或过时信息的限制。

该引擎称为AESim,代表了本周内第二个重大公告,承认AI系统需要能够评估和纳入实时和当前数据,而不是仅仅抽象出模型训练时可用的数据。早些时候的公告来自Facebook,Facebook上周发布了BlenderBot 2.0语言模型,这是一个具有互联网搜索结果实时投票的NLP接口。

AESim项目的目标是为商业信息检索系统中的新学习排名(LTR)解决方案、算法和模型提供一个实验环境。在测试框架时,研究人员发现它在有用的和可行的参数内准确反映了在线性能。

该论文的作者,包括南京大学和阿里巴巴研究部门的四名代表,断言LTR模拟需要一个新方法,出于两个原因:最近在深度学习中创建可复制技术的类似计划的失败,引起了人们对算法的关注,但这些算法未能转化为可应用于实际系统的技术;以及在训练数据与新数据之间的性能转移性方面的缺乏,在系统最初更有效的案例中。

上线

该论文声称AESim是第一个基于实时用户和活动数据的电子商务模拟平台,它可以通过单方面使用实时数据来准确反映在线性能,为后续研究人员提供了一个蓝天训练场,以评估LTR方法和创新。

该模型采用了一种用于工业搜索引擎的典型模式的新方法:第一阶段是检索与用户查询相关的项目,这些项目最初不会呈现给用户,而是首先由加权LTR模型进行排序。然后,排序后的结果会通过一个考虑公司目标的过滤器传递,这些目标可能包括广告和多样性因素。

AESim的架构

在AESim中,查询被替换为类别索引,允许系统在将它们传递给可定制的重新排名器之前,从类别索引中检索项目,该重新排名器会生成最终列表。虽然该框架允许研究人员研究跨多个模型的联合排名的影响,但这一方面将被留到未来的工作中,当前实现会自动根据单个模型寻求理想的评估。

AESim的架构。来源:https://arxiv.org/pdf/2107.07693.pdf

AESim的架构。 来源:https://arxiv.org/pdf/2107.07693.pdf

AESim创建了封装“虚拟用户”和其查询的嵌入(机器学习架构中的虚拟表示),并利用了带有梯度惩罚的沃瑟斯坦生成对抗网络(WGAN-GP)方法。

该架构由以下组成:一个按类别排序的数百万可用项目数据库,一个可定制的排名系统,一个反馈模块和由GAN组件生成的合成数据集。反馈模块是工作流程的最后阶段,能够评估排名模型的最新迭代的性能。

生成对抗模仿学习

为了模拟“虚拟用户模块”的决策逻辑,反馈模块(提供最终结果)通过生成对抗模仿学习(GAIL)进行训练,这是一种由斯坦福研究人员在2016年提出的理论。GAIL是一种无模型的范式,允许系统直接从数据中通过模仿学习开发出政策。

AESim开发的训练集基本上与以前的监督学习模型中使用的静态历史数据集相同。AESim的不同之处在于,它不依赖静态数据集进行反馈,也不受编译(旧)训练数据时生成的项目顺序的限制。

AESim的生成方面集中在通过WGAN-GP创建虚拟用户,该方法输出“假”的用户和查询特征,然后尝试将其与实时网络提供的真实用户数据区分开来。

工业搜索引擎模拟中假用户和真实用户的云表示。

工业搜索引擎模拟中假用户和真实用户的云表示。

测试

研究人员通过将对、点和ListMLE实例部署到系统中进行了AESim的测试,每个实例都必须在重新排名器算法的背景下为搜索查询的非交叉随机片段提供服务。

此时,AESim面临着快速变化和多样化的实时数据的挑战,类似于Facebook的新语言模型可能面临的挑战。因此,结果被认为是在整体性能的背景下。

在为期十天的测试中,AESim在三个模型中表现出显著的一致性,尽管研究人员注意到,一个文档上下文语言模型(DLCM)模块在离线环境中表现不佳,但在实时环境中表现非常好,并承认该系统将根据正在测试的配置和模型的不同而表现出与其实时对应物之间的差距。

机器学习作家,人类图像合成领域专家。曾任 Metaphysic.ai 研究内容负责人。
个人网站: martinanderson.ai
联系: [email protected]
Twitter:@manders_ai