超越生物界「AlphaGo」,MIT 新模型能预测蛋白质功能

栏目: 数据库 · 发布时间: 5年前

内容简介:而近日,来自 MIT 的研究人员开发了一个新的研究模型,蛋白质是维持生命所必需的庞大而复杂的物质。蛋白质具体能完成什么样的功能,主要取决于它独特的三维结构。因此了解蛋白质的结构,对于预测其对某些药物的反应来说,是一个非常重要的环节。

本文经授权转载自公众号「药明康德AI」,再转载请联系原出处。

By 超神经

场景描述:用分类的蛋白质结构机器对应氨基酸模型,对机器学习模型进行训练,然后 将随机的蛋白质结构对及其氨基酸序列输入机器学习模型 ,可准确预测蛋白质功能。

关键词:氨基酸序列 蛋白质结构 机器学习 嵌入

就在几个月前,DeepMind 推出了 AlphaFold 系统 ,被称为生物界「AlphaGo」系统,它能够预测并生成蛋白质 3D 折叠结构。

而近日,来自 MIT 的研究人员开发了一个新的研究模型, 直接通过氨基酸链片段,预测蛋白质分子的生物学功能。 这一发现可以帮助研究人员设计和测试新的蛋白质,从而用于药物研发和生物学研究。

蛋白质的研究难题

蛋白质是维持生命所必需的庞大而复杂的物质。蛋白质具体能完成什么样的功能,主要取决于它独特的三维结构。因此了解蛋白质的结构,对于预测其对某些药物的反应来说,是一个非常重要的环节。

超越生物界「AlphaGo」,MIT 新模型能预测蛋白质功能

每一个蛋白质都拥有错综复杂的三维结构(图片来源: 123RF)

然而,尽管有了数十年的研究和多种成像技术的辅助,我们仍然只了解到了无数蛋白质结构中的很小一部分, 还有很多未知结构的蛋白质功能尚未揭晓。

MIT 新方法,解码蛋白质

针对这一情况,来自 MIT 的研究人员开发出了一种方法,「学习」了 蛋白质序列中每个氨基酸位置上容易计算的表征。 随后,研究人员将这些表征输入机器学习模型,让模型直接预测单个氨基酸片段的功能,而无需任何蛋白质结构的数据。

首先,研究人员根据蛋白质结构分类数据库(SCOP),对数千类别 22,000 种蛋白质,按照结构和氨基酸序列的相似性进行分类,并对机器学习模型进行训练。对于每一对蛋白质,研究人员都会根据其 SCOP 类别计算出一个结构相似性评分。

然后,研究人员将随机的蛋白质结构对及其氨基酸序列输入机器学习模型,通过编码器将它们转换成数值表示出来,称为嵌入( embedding )。每个嵌入都包含了一对氨基酸序列的相似性信息。

超越生物界「AlphaGo」,MIT 新模型能预测蛋白质功能

▲该模型的示意图(图片来源:arxiv.org)

新模型为什么会奏效

该模型将两个嵌入对齐,然后计算出相似度评分,以预测其代表的蛋白质三维结构的相似性。然后,计算机会将这一评分与真实的 SCOP 相似性评分进行比较,并向编码器发送反馈信号。如果模型的预测分数与真实分数相差较远,则会进行一定的调整。

同时, 该模型预测了每次嵌入的「接触图」(contact map),即每个氨基酸与该蛋白质中其他氨基酸的距离, 并将其预测的接触图与来自SCOP的已知接触图进行比较,然后向编码器发送反馈信号。

这一步骤有助于模型更好地明确氨基酸在蛋白质结构中的确切位置,从而进一步了解每个氨基酸的功能。

对于某个氨基酸链,该模型可以为三维结构中的每个氨基酸位置生成一个嵌入。然后, 机器学习模型可以使用这些序列嵌入,根据其预测的三维结构接触图,来准确预测每个氨基酸的功能 。在一个应用实例中,研究人员使用该模型预测有哪些蛋白质可以通过细胞膜, 其预测结果比现有的先进模型还要更加准确。

未来前景

接下来,研究人员计划将该模型应用到更多的预测任务中,例如弄清楚哪些序列片段可以与小分子结合,这对于药物研发工作来说是至关重要的。

研究人员表示,这项研究最终将可以应用于人类健康和药物基因组学,因为它有助于检测破坏蛋白质结构的有害突变。

参考资料:

[1] Bepler, et al., (2019). Learning protein sequence embeddings using information from structure. ICLR 2019, arXiv:1902.08661

[2] MIT CSAIL’s AI predicts a protein’s function from chains of amino acids. Retrieved March 26, 2019, from https://venturebeat.com/2019/03/22/mit-csails-ai-predicts-a-proteins-function-from-chains-of-amino-acids/

[3] Model learns how individual amino acids determine protein function. Retrieved March 26, 2019, from http://news.mit.edu/2019/machine-learning-amino-acids-protein-function-0322

超越生物界「AlphaGo」,MIT 新模型能预测蛋白质功能

历史文章(点击图片阅读)

超越生物界「AlphaGo」,MIT 新模型能预测蛋白质功能

许你健康长寿,机器学习让制药智能化

超越生物界「AlphaGo」,MIT 新模型能预测蛋白质功能

脑机接口领域全新里程碑: 意念说话,机器解读

超越生物界「AlphaGo」,MIT 新模型能预测蛋白质功能

诊断儿童罕见病,多伦多大学 AI 辅助医生调整治疗方案

超越生物界「AlphaGo」,MIT 新模型能预测蛋白质功能

超越生物界「AlphaGo」,MIT 新模型能预测蛋白质功能

AI 百科

教程

数据集

商店

更多

http://hyper.ai


以上所述就是小编给大家介绍的《超越生物界「AlphaGo」,MIT 新模型能预测蛋白质功能》,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对 码农网 的支持!

查看所有标签

猜你喜欢:

本站部分资源来源于网络,本站转载出于传递更多信息之目的,版权归原作者或者来源机构所有,如转载稿涉及版权问题,请联系我们

Web Design Handbook

Web Design Handbook

Baeck, Philippe de 编 / 2009-12 / $ 22.54

This non-technical book brings together contemporary web design's latest and most original creative examples in the areas of services, media, blogs, contacts, links and jobs. It also traces the latest......一起来看看 《Web Design Handbook》 这本书的介绍吧!

Base64 编码/解码
Base64 编码/解码

Base64 编码/解码

HEX CMYK 转换工具
HEX CMYK 转换工具

HEX CMYK 互转工具

HEX HSV 转换工具
HEX HSV 转换工具

HEX HSV 互换工具