“蛋白质”Meta AI预测6亿蛋白质结构

2022-11-03 09:06:01来源：中国科学报

今天，很高兴为大家分享来自中国科学报的Meta AI预测6亿蛋白质结构，如果您对Meta AI预测6亿蛋白质结构感兴趣，请往下看。

ESM宏基因组图谱数据库包含6.17亿个蛋白质的结构预测。

本报讯英国人工智能（AI）公司DeepMind今年公布了2.2亿个蛋白质的预测结构，几乎涵盖了DNA数据库中已知生物的所有蛋白质。现在，另一个科技巨头正在填补蛋白质宇宙中的暗物质。

美国Meta公司（前身为Facebook）的研究人员使用人工智能预测了约6亿个蛋白质的结构，这些蛋白质来自细菌、病毒和其他尚未被表征的微生物。相关研究11月1日发表于预印本网站BioRxiv。

“这些是非常神秘的蛋白质，为深入了解生物学提供了可能性。”Meta人工智能蛋白质团队研究负责人Alexander Rives说。

该团队使用“大型语言模型”生成了这些预测。“大型语言模型”是一种人工智能，可作为通过几个字母或单词预测文本的工具的基础。

通常语言模型是在大量文本的基础上进行训练的。为了将其应用于蛋白质，Rives团队将已知蛋白质序列“喂”给它们，这些蛋白质由20个不同的氨基酸链表示，每个氨基酸链由一个字母表示。然后，该模型学会了在氨基酸比例模糊的情况下“自动补全”蛋白质。

Rives说，这种训练使模型对蛋白质序列有了直观的理解，蛋白质序列包含了蛋白质形状的信息。

第二步，受DeepMind开创性蛋白质结构人工智能算法AlphaFold的启发，模型将这种洞察力与已知蛋白质结构和序列之间关系的信息相结合，从蛋白质序列中生成预测结构。

今年夏天早些时候，Rives团队报告称，其模型算法名为ESMFold，虽准确性不如AlphaFold，但在预测结构方面要快60倍左右。“这意味着我们可以将结构预测扩展到更大的数据库中。”Rives说。

作为一个测试案例，研究团队决定将模型应用于大规模测序的“宏基因组”DNA数据库，这些DNA来自环境，包括土壤、海水、人类肠道、皮肤和其他微生物栖息地。绝大多数编码潜在蛋白质的DNA条目来自从未被培养过的生物，也不为科学家所知。

Meta团队总共预测了超过6.17亿个蛋白质的结构，这项工作只花了两周时间。Rives表示，预测是免费的，任何人都可以使用，就像模型的底层代码一样。

在这6.17亿个蛋白质结构中，该模型认为超过1/3的预测是高质量的，因此研究人员可以确信蛋白质的整体形状是正确的，在某些情况下，模型可以识别更精细的原子级细节。值得一提的是，其中数以百万计的结构都是全新的，与实验确定的蛋白质结构数据库，或从已知生物体预测的AlphaFold数据库中的结构都不同。

AlphaFold数据库的很大一部分是由几乎相同的结构组成，而宏基因组数据库则涵盖了以前从未见过的蛋白质宇宙的很大一部分。

哈佛大学进化生物学家Sergey Ovchinnikov对ESMFold做出的数亿个预测表示怀疑。他认为，有些蛋白质可能缺乏确定的结构，而另一些可能是非编码DNA，被误认为是蛋白质编码材料。

德国慕尼黑工业大学计算生物学家Burkhard Rost对Meta公司模型的速度和准确性的结合印象深刻。但他质疑，宏基因组数据库预测蛋白质是否真的比AlphaFold的精确度更高。基于语言模型的预测方法，更适合快速确定突变如何改变蛋白质结构，这是AlphaFold无法做到的。

据DeepMind的一位代表说，该公司目前没有在其数据库中进行宏基因组结构预测的计划，但不排除在未来这样做的可能性。

韩国首尔国立大学计算生物学家Martin Steinegger认为，利用这类工具的下一步，显然是研究生物学中的暗物质。“这些宏基因组结构的分析很快就会出现爆炸式增长。”（辛雨）

精彩推荐

“大桥”G3铜陵长江公铁大桥先导索过江

“某甲”父亲被羁押继母要离婚，未成年女儿谁来抚养？法官多方努

“亚马逊”哪些以色列芯片公司已被美国企业收购？

“装修”装修公司老板明知公司亏损仍吸引客户签合同，骗取上百人

“必胜客”必胜客最黑暗的料理来了

“运营商”运营商本周行业动态：电信年度优秀领导及上半年重点工

图文欣赏

“儿子”妈妈将50余万“读书钱”存儿子名下，19岁儿子取出转给女友，妈妈无奈起诉追回

“蛋白质”Meta AI预测6亿蛋白质结构

相关文章

精彩推荐

最新文章

“在我”忆来只把旧书读

“科博会”芜湖科博会集中展示大国重器

“诗人”带着大海散步的人

“宁德”宁德时代三季报：业绩增速放缓、海

“新材料”信金控股完成新一期人民币基金首

“同比增长”失守3000点后，A股市场的危与

“商务部”商务部：达成共识！

“基金”又一家基金公司换董事长，年内公募

图文欣赏

“儿子”妈妈将50余万“读书钱”存儿子名

“说了”云朵的话语，心灵的方剂 ——

“科幻”和成都和教育，一起遇见未来！两

“红星”梁静茹南京演唱会再现“柱子票”

热门文章

“来源”RNA分子功能研究获新成果：复旦团

“中国”全球化的极星，此刻真正开启中国元

“国家民委”北方民族大学教授靳治良当选欧

2019年十大软件开发故事

“中国电信”签约方是谁这么受重视？中国电

“国企”对“李鬼”央、国企，往死里打才能

“快递”618复盘|今年物流忙不忙，看京东快

“亿元”千亿芯片龙头韦尔股份业绩“爆雷”