关注我们.

人工智能

阿里巴巴开发使用实时数据的搜索引擎模拟人工智能

mm

阿里巴巴与中国学术研究人员合作开发了一种搜索引擎模拟人工智能,该人工智能使用来自该电子商务巨头实时基础设施的真实世界数据来开发不受“历史”或过时信息束缚的新排名模型。

该发动机,称为 AES模拟,这是一周内的第二个重大公告,承认人工智能系统需要能够评估和合并实时数据,而不仅仅是抽象模型训练时可用的数据。 早些时候的公告来自 Facebook,上周 亮相 BlenderBot 2.0 语言模型,一种 NLP 界面,具有实时轮询互联网搜索结果以响应查询的功能。

AESim 项目的目标是为开发新的 Learning-To-Rank(LTR)商业信息检索系统中的解决方案、算法和模型。 在测试该框架时,研究人员发现它在有用且可操作的参数内准确地反映了在线性能。

该论文的作者包括南京大学和阿里巴巴研究部门的四名代表,他们断言,需要一种新的 LTR 模拟方法,原因有二:近期深度学习领域的类似举措未能创造出可重复的技术,并且出现了一系列引人注目的算法 无法翻译 融入适用的现实世界系统; 在系统最初更有效的情况下,就训练数据与新数据的性能而言,缺乏可转移性。

上线

论文称,AESim是第一个基于实时和当前用户和活动数据的电子商务模拟平台,可以通过单方面使用实时数据准确反映在线性能,为后来的研究人员提供了一个蓝天训练场评估 LTR 方法和创新。

该模型对工业搜索引擎的典型架构进行了全新的诠释:第一阶段是检索与用户查询相关的项目,这些项目并非直接呈现给用户,而是先通过加权 LTR 模型进行排序。然后,排序后的结果将经过筛选,筛选过程中会考虑公司提供结果的目标——这些目标可能包括广告和多样性因素。

AESim的架构

在 AESim 中,查询被类别索引取代,允许系统从类别索引中检索项目,然后将它们传递到生成最终列表的可定制重新排序器。 尽管该框架允许研究人员研究跨多个模型的联合排名的影响,但这方面将留待未来的工作,并且当前的实现会自动寻求基于单个模型的理想评估。

AESim 的架构。 资料来源:https://arxiv.org/pdf/2107.07693.pdf

AESim 的架构。 资料来源:https://arxiv.org/pdf/2107.07693.pdf

AESim 创建嵌入(机器学习架构中的虚拟表示),封装“虚拟用户”及其查询,并利用具有梯度惩罚的 Wasserstein 生成对抗网络(WGAN-GP) 方法。

该架构包括一个包含数百万个按类别排序的可用项目的数据库、一个可定制的排名系统、一个反馈模块以及由基于 GAN 的组件生成的合成数据集。 反馈模块是工作流程的最后阶段,能够评估排名模型最新迭代的性能。

生成对抗性模仿学习

为了模拟“虚拟用户模块”的决策逻辑,反馈模块(提供最终结果)通过生成对抗模仿学习进行训练(GAIL),该理论由斯坦福大学研究人员于 2016 年首次提出。GAIL 是一种无模型范式,允许系统开发 政策 直接从数据通过 模仿学习.

AESim 开发的训练集本质上与类似系统的先前监督学习模型中使用的静态历史数据集相同。 与 AESim 的区别在于,它不依赖静态数据集来获取反馈,并且不会受到编译(旧)训练数据时生成的项目订单的阻碍。

AESim 的生成方面集中在通过 WGAN-GP 创建虚拟用户,输出“虚假”用户和查询特征,然后尝试将这些虚假数据与 AESim 可以访问的实时网络提供的真实用户数据区分开来。

典型工业搜索引擎模拟中假用户和真实用户的云表示。

典型工业搜索引擎模拟中假用户和真实用户的云表示。

测试与验证

研究人员通过部署一个 成对的、逐点的列表MLE 实例进入系统,每个实例都必须在重新排序算法的上下文中提供不相交的随机搜索查询切片。

目前,AESim 面临着快速变化且多样化的实时数据的挑战,其挑战可能与 Facebook 的新语言模型面临的挑战类似。因此,本次测试结果是基于整体性能进行考量的。

经过十天的测试,AESim 在三个模型中表现出了显着的一致性,尽管研究人员指出,对文档上下文语言模型的额外测试(DLCM)模块在离线环境中表现不佳,但在实时环境中表现非常好,并承认系统将与实时对应的系统表现出差距,具体取决于所测试的配置和模型。

 

机器学习作家,人体图像合成领域专家。曾任 Metaphysic.ai 研究内容主管。
个人网站: 马丁南德森.ai
联系我们 [电子邮件保护]
推特:@manders_ai