医疗健康

AI 算法从电子健康记录中读取和预测患者数据

mm

位于 Mount Sinai 的 Icahn 医学院的科学家们开发了一种新的、自动化的、基于人工智能 (AI) 的算法,可以从电子健康记录 (EHRs) 中读取和预测患者数据。

这种新方法被称为 Phe2vec,它可以准确地识别出患有某些疾病的患者。它被证明与最流行的传统方法一样准确,而传统方法需要更多的手动劳动来执行。

本杰明·S·格利克斯伯格 (Benjamin S. Glicksberg) 博士是遗传学和基因组科学助理教授。他也是 Mount Sinai 数字健康哈索·普拉特纳研究所 (HPIMS) 的成员,并且是该研究的高级作者。

“患者的医疗记录中存储的数据量和类型不断增加,解开这些复杂的数据网络可能非常耗时,从而减慢了临床研究的进展,”格利克斯伯格说。“在这项研究中,我们创建了一种新的方法,使用机器学习从电子健康记录中提取数据,这种方法比行业标准更快、更少人工劳动。我们希望这将成为一个有价值的工具,能够促进进一步、更少偏见的临床信息研究。”

该研究发表在《模式》杂志上,由杰西卡·K·德弗雷塔斯 (Jessica K. De Freitas) 领导,她是格利克斯伯格博士实验室的研究生。

当前行业标准

科学家目前依赖于成熟的计算机程序和算法来从医疗记录中提取新信息。一个叫做 Phenotype Knowledgebase (PheKB) 的系统开发和存储这些算法。该系统在正确识别患者诊断方面非常有效,但研究人员需要先浏览许多医疗记录并寻找数据,包括实验室测试和处方。

然后,算法被编程为指导计算机搜索具有特定疾病数据的患者,这被标记为“表型”。这使得系统能够创建患者列表,然后需要由研究人员手动检查。如果研究人员想要研究一种新疾病,他们需要从头开始这个过程。

新方法

使用新方法,研究人员使计算机能够自行学习如何识别疾病表型,这节省了研究人员的时间和工作。Phe2vec 方法基于团队之前进行的研究。

里卡尔多·米奥托 (Riccardo Miotto) 博士是 HPIMS 的前助理教授,也是该研究的高级作者。

“我们之前已经证明,无监督机器学习可以成为一种高效且有效的策略,用于从电子健康记录中提取数据,”米奥托说。“我们的方法的潜在优势在于,它从数据本身学习疾病的表示。因此,机器执行了专家通常执行的工作,以定义从健康记录中最好地描述特定疾病的数据元素的组合。”

计算机被编程为浏览数百万电子健康记录,并学习如何识别数据和疾病之间的联系。编程依赖于“嵌入”算法,这些算法也是由研究人员之前开发的。这些算法被用于研究各种语言中的词网络。

其中一个算法被称为 word2vec,特别有效。然后,计算机被编程为识别大约 200 万名患者的诊断结果,这些患者的数据存储在 Mount Sinai 健康系统中。

研究人员然后比较了新旧系统的有效性,并发现,对于测试的十种疾病中的九种,新的 Phe2vec 系统与当前的“金标准”表型化过程一样有效,或者略微更好,用于从电子健康记录中识别诊断结果。这些疾病可能包括痴呆症、多发性硬化症、镰状细胞贫血等。

“总体而言,我们的结果是令人鼓舞的,表明 Phe2vec 是一种有前途的技术,用于在电子健康记录数据中进行大规模的疾病表型化,”格利克斯伯格博士说。“经过进一步的测试和改进,我们希望它可以用来自动化临床信息研究的许多初始步骤,从而使科学家能够专注于下游分析,例如预测建模。”

Alex McFarland 是一名人工智能记者和作家,探索最新的人工智能发展。他曾与世界各地的众多人工智能初创公司和出版物合作。