人工智能
人工智能可以被训练为独立根据以前的知识进行科学预测

人工智能研究人员之间正在进行一场关于人工智能是否“将 能够开发出与人类相同的一般智能”的辩论,TheNext Web (TNW) 指出,有些人认为人工智能“很快就能”,而其他人则持反对意见。
但是,还有另一个领域的人工智能正在取得巨大的进步,那就是自然语言处理(NLP),它是机器学习的一个更大范畴的一部分,目的是“评估、提取和评估文本数据中的信息”。为此,TNW 指向了一篇最近在 Nature 上发表的论文,该论文报告称,一种人工智能已经“通过从研究出版物中提取有意义的数据来预测未来的科学发现”。
研究和理解一个特定的科学问题需要显而易见的步骤,即查阅书籍、专门的出版物、网页和其他相关来源。当然,这可能是一个非常耗时的练习,特别是如果我们有一个非常复杂的问题或问题。自然语言处理正是在这里发挥作用的。通过使用“复杂的方法和技术,计算机程序可以从大型文本数据集中识别概念、相互关系、一般主题和特定属性”。
如上述研究中所讨论的,“到目前为止,大多数现有的自动化 NLP 方法都是有监督的,需要人类的输入。尽管这比纯手动方法有所改进,但这仍然是一项劳动密集型的工作”。但是,准备这篇论文的研究人员能够创建一个可以“准确识别和提取信息的独立人工智能系统”。它使用基于统计和几何属性的数据的复杂技术来识别化学名称、概念和结构。这是基于约 150 万篇材料科学论文的摘要。
然后,这个机器学习程序“根据特定的特征(如“元素”、“能量学”和“粘结剂”)对数据中的单词进行分类”。例如,“热”被归类为“能量学”的一部分,而“气体”被归类为“元素”。这有助于将某些化合物与磁性类型和其他材料的相似性等联系起来,从而对单词之间的关系提供了洞察力,而无需人类干预。
这种方法使得人工智能能够“捕捉复杂的关系并识别不同层次的信息,这对于人类来说几乎是不可能的”。这使得人工智能能够提供比目前科学家能够做出的洞察力更为深入的见解。人工智能实际上推荐了“用于功能应用的材料”,这些材料是在几年后才被实际发现的。有五个这样的预测,都基于 2009 年之前发表的论文。例如,人工智能能够识别一种称为 CsAgGa2Se4 的物质为热电材料,科学家们直到 2012 年才发现它。如果人工智能在 2009 年就存在,它就能加速这一发现。”












