超越生物界「AlphaGo」,MIT 新模型能预测蛋白质功能

栏目: 数据库 · 发布时间: 5年前

内容简介:而近日,来自 MIT 的研究人员开发了一个新的研究模型,蛋白质是维持生命所必需的庞大而复杂的物质。蛋白质具体能完成什么样的功能,主要取决于它独特的三维结构。因此了解蛋白质的结构,对于预测其对某些药物的反应来说,是一个非常重要的环节。

本文经授权转载自公众号「药明康德AI」,再转载请联系原出处。

By 超神经

场景描述:用分类的蛋白质结构机器对应氨基酸模型,对机器学习模型进行训练,然后 将随机的蛋白质结构对及其氨基酸序列输入机器学习模型 ,可准确预测蛋白质功能。

关键词:氨基酸序列 蛋白质结构 机器学习 嵌入

就在几个月前,DeepMind 推出了 AlphaFold 系统 ,被称为生物界「AlphaGo」系统,它能够预测并生成蛋白质 3D 折叠结构。

而近日,来自 MIT 的研究人员开发了一个新的研究模型, 直接通过氨基酸链片段,预测蛋白质分子的生物学功能。 这一发现可以帮助研究人员设计和测试新的蛋白质,从而用于药物研发和生物学研究。

蛋白质的研究难题

蛋白质是维持生命所必需的庞大而复杂的物质。蛋白质具体能完成什么样的功能,主要取决于它独特的三维结构。因此了解蛋白质的结构,对于预测其对某些药物的反应来说,是一个非常重要的环节。

超越生物界「AlphaGo」,MIT 新模型能预测蛋白质功能

每一个蛋白质都拥有错综复杂的三维结构(图片来源: 123RF)

然而,尽管有了数十年的研究和多种成像技术的辅助,我们仍然只了解到了无数蛋白质结构中的很小一部分, 还有很多未知结构的蛋白质功能尚未揭晓。

MIT 新方法,解码蛋白质

针对这一情况,来自 MIT 的研究人员开发出了一种方法,「学习」了 蛋白质序列中每个氨基酸位置上容易计算的表征。 随后,研究人员将这些表征输入机器学习模型,让模型直接预测单个氨基酸片段的功能,而无需任何蛋白质结构的数据。

首先,研究人员根据蛋白质结构分类数据库(SCOP),对数千类别 22,000 种蛋白质,按照结构和氨基酸序列的相似性进行分类,并对机器学习模型进行训练。对于每一对蛋白质,研究人员都会根据其 SCOP 类别计算出一个结构相似性评分。

然后,研究人员将随机的蛋白质结构对及其氨基酸序列输入机器学习模型,通过编码器将它们转换成数值表示出来,称为嵌入( embedding )。每个嵌入都包含了一对氨基酸序列的相似性信息。

超越生物界「AlphaGo」,MIT 新模型能预测蛋白质功能

▲该模型的示意图(图片来源:arxiv.org)

新模型为什么会奏效

该模型将两个嵌入对齐,然后计算出相似度评分,以预测其代表的蛋白质三维结构的相似性。然后,计算机会将这一评分与真实的 SCOP 相似性评分进行比较,并向编码器发送反馈信号。如果模型的预测分数与真实分数相差较远,则会进行一定的调整。

同时, 该模型预测了每次嵌入的「接触图」(contact map),即每个氨基酸与该蛋白质中其他氨基酸的距离, 并将其预测的接触图与来自SCOP的已知接触图进行比较,然后向编码器发送反馈信号。

这一步骤有助于模型更好地明确氨基酸在蛋白质结构中的确切位置,从而进一步了解每个氨基酸的功能。

对于某个氨基酸链,该模型可以为三维结构中的每个氨基酸位置生成一个嵌入。然后, 机器学习模型可以使用这些序列嵌入,根据其预测的三维结构接触图,来准确预测每个氨基酸的功能 。在一个应用实例中,研究人员使用该模型预测有哪些蛋白质可以通过细胞膜, 其预测结果比现有的先进模型还要更加准确。

未来前景

接下来,研究人员计划将该模型应用到更多的预测任务中,例如弄清楚哪些序列片段可以与小分子结合,这对于药物研发工作来说是至关重要的。

研究人员表示,这项研究最终将可以应用于人类健康和药物基因组学,因为它有助于检测破坏蛋白质结构的有害突变。

参考资料:

[1] Bepler, et al., (2019). Learning protein sequence embeddings using information from structure. ICLR 2019, arXiv:1902.08661

[2] MIT CSAIL’s AI predicts a protein’s function from chains of amino acids. Retrieved March 26, 2019, from https://venturebeat.com/2019/03/22/mit-csails-ai-predicts-a-proteins-function-from-chains-of-amino-acids/

[3] Model learns how individual amino acids determine protein function. Retrieved March 26, 2019, from http://news.mit.edu/2019/machine-learning-amino-acids-protein-function-0322

超越生物界「AlphaGo」,MIT 新模型能预测蛋白质功能

历史文章(点击图片阅读)

超越生物界「AlphaGo」,MIT 新模型能预测蛋白质功能

许你健康长寿,机器学习让制药智能化

超越生物界「AlphaGo」,MIT 新模型能预测蛋白质功能

脑机接口领域全新里程碑: 意念说话,机器解读

超越生物界「AlphaGo」,MIT 新模型能预测蛋白质功能

诊断儿童罕见病,多伦多大学 AI 辅助医生调整治疗方案

超越生物界「AlphaGo」,MIT 新模型能预测蛋白质功能

超越生物界「AlphaGo」,MIT 新模型能预测蛋白质功能

AI 百科

教程

数据集

商店

更多

http://hyper.ai


以上所述就是小编给大家介绍的《超越生物界「AlphaGo」,MIT 新模型能预测蛋白质功能》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

学习Web设计

学习Web设计

罗宾斯 / 靳志伟 / 机械工业出版社 / 2009-1 / 65.00元

《学习Web设计(第3版)》从说明网站和网页是如何工作开始,逐步深入。当你看完《学习Web设计(第3版)》时,你将掌握使用优化的图像文件来创建多列CSS布局的技术,而且你将知道如何创建网页。这一版经过了彻底的修订,它可以教你如何根据现代设计的实践经验和专业标准来创建网站。《学习Web设计(第3版)》包含了一些练习,可以帮助你学习各种技术,还有一些小测验可以确保你及时掌握重要的概念。如果你对网站设计......一起来看看 《学习Web设计》 这本书的介绍吧!

JSON 在线解析
JSON 在线解析

在线 JSON 格式化工具

html转js在线工具
html转js在线工具

html转js在线工具

正则表达式在线测试
正则表达式在线测试

正则表达式在线测试