人工智能助力破解蛋白质神奇结构密码
数十年前,预测蛋白质三维结构,以及设计全新蛋白质为人类所用,被认为是一个不可能实现的梦想。
“30年前,如果能用实验设备解析一种蛋白质结构就完全可以发表一篇博士论文,因为那是一件极为困难的事情,”诺贝尔化学委员会评委邹晓冬9日接受新华社记者采访时说,得益于今年诺贝尔化学奖获奖成果,人们现在可以设计蛋白质,还可通过人工智能预测蛋白质三维结构,“这是一个非常大的革命”。
曾经不可实现的梦想
蛋白质是维持生命的重要大分子。它们是构成骨骼、皮肤、头发等组织的基石,是驱动肌肉的马达,是读取、复制和修复脱氧核糖核酸的“机器”,是让大脑中神经元随时准备运转的“泵”,是促进机体免疫反应的抗体,是细胞向外界传递信息的传感器,是调节人体内所有细胞的激素。
蛋白质通常由20种不同的氨基酸组成。在蛋白质中,氨基酸以长链连接在一起,折叠起来形成独特的三维结构,这对蛋白质的功能至关重要。要了解生命如何运作,首先就需要了解蛋白质的形状和结构。
自19世纪以来,化学家就已了解蛋白质对生命过程的重要性。但直到20世纪50年代,随着研究工具精度的提高,研究人员才开始借助仪器解析蛋白质三维结构。到20世纪70年代,研究人员已经认识到,决定蛋白质如何折叠的相关信息蕴含在组成蛋白质的氨基酸序列中。从那时起,研究人员一直怀有一个梦想,即试图根据已知的氨基酸序列预测蛋白质三维结构,但这非常困难,甚至一度被认为是不可能实现的梦想。
“阿尔法围棋”设计者破解蛋白质结构之谜
然而,就在4年前,出现了一个惊人的突破。2020年,谷歌旗下“深层思维”公司的德米斯·哈萨比斯和约翰·江珀提出名为“阿尔法折叠2”的人工智能模型。
哈萨比斯是来自英国的神经学家和企业家,他是“深层思维”公司的联合创始人和首席执行官。他从4岁开始下国际象棋,2009年获得英国伦敦大学学院认知神经科学博士学位。他还曾领衔开发“深层思维”公司的“阿尔法围棋”程序,该程序在复杂的围棋游戏中击败世界冠军、韩国围棋选手李世石。
江珀则是“深层思维”公司高级研究科学家,早年在美国芝加哥大学获得理论化学博士学位,研究方向为使用机器学习模拟蛋白质折叠。2021年,《自然》杂志曾将他列入年度“十大科学人物”。
“阿尔法折叠2”模型曾赢得有着生物计算领域“奥运会”之称的“蛋白质结构预测关键评估”比赛,并成为第一个能准确预测蛋白质三维结构的机器学习模型。
“阿尔法折叠2”模型成功解决了科学家苦苦思索了数十年的难题——从氨基酸序列预测蛋白质结构,它能够预测几乎所有已知的2亿种蛋白质的结构。
自问世以来,“阿尔法折叠2”已被用于海量科学应用中,例如人们用它应对抗生素耐药性、寻找疟疾等疾病的新疗法等。“阿尔法折叠2”极大缩短了人工确定蛋白质结构的时间,展示了人工智能对于科学发现的影响。此外,这项研究将有助于人们更好地了解疾病,并能加速新靶向药物开发。到今年10月,已有来自大约190个国家的200多万人使用了“阿尔法折叠2”程序。
设计全新蛋白质开辟无限可能
自然界中的蛋白质种类有限,研究人员希望创建出新的蛋白质种类,使其执行诸如分解有害物质或作为化学制造业工具等功能。该领域自20世纪90年代末兴起,美国华盛顿大学西雅图分校教授戴维·贝克在该领域取得突破。他开发的名为Rosetta的软件成功构建出不是天然存在的全新蛋白质。
贝克的研究团队首先提出一个全新结构的蛋白质,然后利用Rosetta计算哪种氨基酸序列可以生成所需的蛋白质。为了验证该软件的成功率,贝克的研究小组将软件建议的氨基酸序列基因引入细菌,这些细菌生产了所需的蛋白质。然后,他们利用X射线晶体学确认了蛋白质结构与他们的设计几乎完全符合。该成果于2003年发表。
此后,他的研究小组不断创造出一个又一个具有新功能的蛋白质,可用于催生新的纳米材料、靶向药物、疫苗研发、微型传感器以及更环保的化学工业等,为实现人类福祉开辟了无限可能。
声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。