人工智能
研究人员创建系统从COVID-19文章中提取信息

巴斯克大学的一组研究人员开发了VIGICOVID的原型,这是一个用于COVID-19科学文章的自动信息提取系统。该系统依赖于自然语言问题来获取有关COVID-19的答案。
涉及VIGICOVID的项目由UPV/EHU的HiTZ中心、UNED的NLP & IR小组和Elhuyar的人工智能和语言技术单位共同运行。
该研究发表在知识系统杂志上。
改变信息搜索范式
Eneko Agirre是UPV/EHU的HiTZ中心负责人。
“信息搜索范式正在由于人工智能而改变,”Agirre说。“到目前为止,当在互联网上搜索信息时,输入一个问题,然后必须在系统显示的文档中寻找答案。然而,按照新的范式,系统直接提供答案而无需阅读整个文档的系统变得越来越普遍。”
Xabier Saralegi是Elhuyar的研究人员。
“用户不使用关键字请求信息,而是直接提出问题。”
该系统依赖于两个独立的步骤来搜索答案。
“首先,它使用一种结合关键字和直接问题的技术来检索可能包含问题答案的文档。这就是为什么我们探索了神经网络架构,”Saralegi博士说。
深度神经网络架构
该团队依赖于用示例训练的深度神经网络架构。
“这意味着搜索模型和问题回答模型是通过深度机器学习训练的,”他继续说。
首先提取文档集,然后通过问题和答案系统重新处理,以获得特定的答案。
“我们构建了回答问题的引擎;当引擎给定一个问题和一个文档时,它能够检测答案是否在文档中,如果答案在文档中,它会告诉我们答案的确切位置,”Agirre博士说。
根据研究人员的说法,他们对自己的工作结果很满意。
“从我们在实验中分析的技术和评估中,我们选择了给原型带来最佳结果的技术,”Agirre博士继续说。“我们已经找到了一种新的搜索方式,当信息需要紧急使用时,这种方式可以促进信息使用过程。在研究层面,我们已经证明了所提出的技术是有效的,并且该系统提供了良好的结果。”
“我们的结果是一个基本研究项目的原型。它不是一个商业产品,”Saralegi补充说。
话虽如此,这种原型可以在短时间内被建模,这意味着可能不会太久就会有一个商业产品。
