存根 Netflix 等公司使用的算法可以破译神经退行性疾病的生物语言 - Unite.AI
关注我们.

健康防护

Netflix 等公司使用的算法可以破译神经退行性疾病的生物语言

发布时间

 on

Netflix、Facebook 和亚马逊等公司使用的强大算法可能会对医疗保健产生重大影响。 他们已经证明了预测癌症和其他神经退行性疾病(例如阿尔茨海默病)的生物语言的能力。

这项举措是由剑桥大学圣约翰学院的学者发起的,他们将几十年来产生的大数据输入到计算机语言模型中。 他们的目标是看看人工智能 (AI) 是否能够做出比人类更先进的发现,而他们的发现正是利用该技术破译生物语言的能力。

该研究发表在科学杂志上 PNAS, 题为“从序列决定因素和嵌入中学习蛋白质凝聚物的分子语法设立的区域办事处外,我们在美国也开设了办事处,以便我们为当地客户提供更多的支持。“ 专家称,它可以用来“纠正细胞内导致疾病的语法错误”。

托马斯·诺尔斯教授是该论文的主要作者,也是圣约翰学院的研究员。 

“将机器学习技术引入神经退行性疾病和癌症的研究绝对是游戏规则的改变者。 最终的目标是利用人工智能开发靶向药物,以显着缓解症状或预防痴呆症的发生。”

强大的算法

Netflix 和 Facebook 等公司使用的机器学习算法对消费者及其下一步将做什么做出了有根据的预测。 当 Netflix 推荐新电影或 Facebook 推荐新朋友时就会发生这种情况。 Alexa 和 Siri 等语音助手可以立即识别个人并做出响应。 

Kadi Liis Saar 博士是该论文的第一作者,也是圣约翰学院的研究员。 她使用类似的技术来训练大规模语言模型,旨在识别疾病期间蛋白质发生的情况。 

“人体是成千上万种蛋白质的家园,科学家们还不知道其中许多蛋白质的功能。 我们要求基于神经网络的语言模型来学习蛋白质的语言,”她说。

“我们特别要求该程序学习变形生物分子凝聚物(细胞中发现的蛋白质液滴)的语言,科学家们确实需要理解这种语言,以破解导致癌症和阿尔茨海默氏症等神经退行性疾病的生物功能和故障的语言。 我们发现它可以在不被明确告知的情况下学习科学家在数十年的研究中已经发现的有关蛋白质语言的内容。”

科学家认为有数百种神经退行性疾病,其中最常见的是阿尔茨海默病、帕金森病和亨廷顿病。 阿尔茨海默病影响着全球 50 万人,在患病期间,蛋白质会形成团块并杀死健康的神经细胞。 

蛋白质浓缩物和NLP技术

有了健康的大脑,这些大量的蛋白质就可以被有效地处理掉。 根据最近的发现,科学家们现在相信一些无序的蛋白质会形成冷凝物,即类似液体的蛋白质液滴。 它们没有膜,可以自由地相互融合,并且可以形成和重组。

“蛋白质凝聚体最近在科学界引起了广泛关注,因为它们控制着细胞中的关键事件,例如基因表达(我们的 DNA 如何转化为蛋白质)和蛋白质合成(细胞如何制造蛋白质),”Knowles 教授说。

“与这些蛋白质液滴相关的任何缺陷都可能导致癌症等疾病。这就是为什么如果我们希望能够纠正细胞内导致疾病的语法错误,那么将自然语言处理技术引入蛋白质功能障碍的分子起源研究至关重要,”他继续说道。

 “我们向算法提供了已知蛋白质的所有数据,这样它就可以学习和预测蛋白质的语言,就像这些模型学习人类语言以及 WhatsApp 知道如何建议您使用的单词一样,”博士说。萨尔说道。 

“然后我们就能够询问它仅导致某些蛋白质在细胞内形成凝聚物的特定语法。 这是一个非常具有挑战性的问题,解决这个问题将帮助我们了解疾病语言的规则,”萨尔博士继续说道。

这一技术进步背后的主要驱动力是可用数据量的增加、计算能力的提高和技术的进步。机器学习有潜力极大地改变这些领域的研究,从而实现无法预测的发现。 

萨尔博士表示:“机器学习可以摆脱研究人员认为的科学探索目标的限制,这意味着我们将发现我们尚未想象到的新联系。 这确实非常令人兴奋。”

新的 网络 世界各地的研究人员都可以使用,并且越来越多的科学家正在参与其中。 

 

Alex McFarland 是一位人工智能记者和作家,致力于探索人工智能的最新发展。他与全球众多人工智能初创公司和出版物合作。