人工智能

诺贝尔化学奖是AI for Science 物理奖是Science for AI

字号+作者: 来源:茶饮消息 2024-10-10 08:43 评论(创建话题) 收藏成功收藏本文

2024年又一个诺贝尔奖给了AI!这次是化学奖!一半归华盛顿大学的戴维·贝克(DavidBaker),“因其在蛋白质计算设计方面的贡献”;另一半归谷歌DeepMind的戴米斯·'...

2024年又一个诺贝尔奖给了AI!这次是化学奖!一半归华盛顿大学的戴维·贝克(DavidBaker),“因其在蛋白质计算设计方面的贡献”;另一半归谷歌DeepMind的戴米斯·哈萨比斯(DemisHassabis)和约翰·M·江珀(JohnM.Jumper),“因其在蛋白质结构预测方面的贡献”。eEM品论天涯网

你相信昨天获奖的辛顿是物理学家,而今天获奖的哈萨比斯是化学家吗?eEM品论天涯网

确切地说,这次是关于蛋白质——生命中精巧的化学工具。贝克完成了一项几乎不可能的壮举:构建全新种类的蛋白质。哈萨比斯和江珀开发出了人工智能模型,解决了一个长达50年的难题:预测蛋白质的复杂结构。这些发现具有巨大潜力,应用前景无限广阔。eEM品论天涯网

生命的多样性证明了蛋白质作为化学工具的惊人能力。它们控制和驱动着构成生命基础的所有化学反应。蛋白质还可以作为激素、信号物质、抗体以及不同组织的构建块。eEM品论天涯网

“今年获得认可的发现之一涉及构建令人惊叹的蛋白质。另一个则是实现了一个50年的梦想:从氨基酸序列预测蛋白质结构。这两项发现都开启了广阔的可能性。”诺贝尔化学奖评委会主席海纳·林克说。eEM品论天涯网

蛋白质通常由20种不同的氨基酸组成,这些氨基酸可以被描述为生命的“乐高积木”。2003年,贝克成功利用这些构建块设计出了一种与其他蛋白质完全不同的新蛋白质。从那时起,他的研究团队不断创造出富有想象力的蛋白质,包括可用作药物、疫苗、纳米材料和微型传感器的蛋白质。eEM品论天涯网

第二项发现涉及蛋白质结构的预测。在蛋白质中,氨基酸以长链的形式连接在一起,并折叠形成三维结构,这种结构对蛋白质的功能起着决定性作用。自20世纪70年代以来,研究人员一直试图从氨基酸序列预测蛋白质结构,但这项工作出了名的困难。然而,四年前出现了一个惊人的突破。eEM品论天涯网

2020年,哈萨比斯和江珀推出了一个名为AlphaFold2的人工智能模型。借助该模型,他们能够预测研究人员已确定的近2亿种蛋白质的结构。自突破以来,来自190个国家的超过200万人使用了AlphaFold2。在众多科学应用中,研究人员现在可以更好地理解抗生素耐药性,并创建可以分解塑料的酶的图像。eEM品论天涯网

没有蛋白质,生命就无法存在。现在我们能够预测蛋白质结构并设计自己的蛋白质,这为人类带来了最大的福祉。eEM品论天涯网

继昨天诺贝尔物理奖颁发给为AI基础理论做出贡献的霍普菲尔德和辛顿之后,化学奖颁发给用AI设计和预测蛋白质结构的三位非典型的“化学家”。有人说物理学不存在了,也有人说化学在蹭AI的热点。这些都不对。它说明的是AI正在给科学发现带来的深刻变革:物理奖是ScienceforAI,而化学奖则是AIforScience,它们将引领科学前沿。eEM品论天涯网

下面,我们详细介绍下这次诺贝尔化学奖的奥秘:eEM品论天涯网

蛋白质可以由几十种氨基酸到几千种氨基酸组成eEM品论天涯网

eEM品论天涯网

这是一张教育性很强的示意图,清晰地展示了从基本构建块(氨基酸)到最终产物(蛋白质)的概念。eEM品论天涯网

左侧是一个环形排列,显示了20种基本氨基酸(AminoAcids)的名称:eEM品论天涯网

包括甘氨酸(Glycine);eEM品论天涯网

谷氨酸(Glutamicacid);eEM品论天涯网

谷氨酰胺(Glutamine);eEM品论天涯网

半胱氨酸(Cysteine);eEM品论天涯网

天冬氨酸(Asparticacid);eEM品论天涯网

等等......eEM品论天涯网

右侧展示了从氨基酸到蛋白质的形成过程:eEM品论天涯网

氨基酸首先以“串珠子”的方式连接成一条链(STRINGOFAMINOACIDS);eEM品论天涯网

这条氨基酸链最终会折叠成特定的三维结构,形成功能性蛋白质(PROTEIN);eEM品论天涯网

这张图很好地诠释了2024年诺贝尔化学奖的两个核心发现:eEM品论天涯网

如何利用这20种氨基酸设计新的蛋白质(DavidBaker的工作);eEM品论天涯网

如何预测氨基酸链最终会折叠成什么样的三维结构(Hassabis和Jumper的AlphaFold2的工作)。eEM品论天涯网

AlphaFold2如何工作?eEM品论天涯网

eEM品论天涯网

这张图很好地展示了AlphaFold2如何将生物学知识、进化信息和深度学习技术结合起来,解决了困扰科学界50年的蛋白质结构预测问题。eEM品论天涯网

首先,作为AlphaFold2开发的一部分,这个AI模型已经在所有已知的氨基酸序列和已确定的蛋白质结构上进行了训练。eEM品论天涯网

工作流程分为四个主要步骤:eEM品论天涯网

1.数据录入和数据库搜索eEM品论天涯网

将一个结构未知的氨基酸序列输入AlphaFold2。eEM品论天涯网

系统会搜索数据库中类似的氨基酸序列和蛋白质结构。eEM品论天涯网

2.序列分析eEM品论天涯网

AI模型会对比所有相似的氨基酸序列(通常来自不同物种)。eEM品论天涯网

研究在进化过程中哪些部分被保留下来。eEM品论天涯网

AlphaFold2探索氨基酸在三维蛋白质结构中如何相互作用:eEM品论天涯网

带电荷的氨基酸会相互吸引;eEM品论天涯网

疏水性氨基酸会聚集在一起。eEM品论天涯网

生成一个距离图,估计氨基酸之间在结构中的距离。eEM品论天涯网

3.AI分析eEM品论天涯网

使用迭代过程,AlphaFold2不断完善序列分析和距离图。eEM品论天涯网

AI模型使用称为转换器(transformers)的神经网络。eEM品论天涯网

这些网络能够识别重要元素并利用第一步获得的其他蛋白质数据。eEM品论天涯网

4.假设结构生成eEM品论天涯网

AlphaFold2将所有氨基酸拼接成一个整体。eEM品论天涯网

通过三个循环周期测试不同的路径。eEM品论天涯网

最终得出一个特定结构。eEM品论天涯网

AI模型计算这个结构不同部分与实际情况相符的概率。eEM品论天涯网

图中还展示了一些重要的可视化内容:eEM品论天涯网

序列分析中的共同进化模式。eEM品论天涯网

距离图显示氨基酸之间的空间关系。eEM品论天涯网

神经网络的示意图。eEM品论天涯网

多个循环周期如何逐步完善最终结构。eEM品论天涯网

第一种人类设计的蛋白质结构eEM品论天涯网

eEM品论天涯网

这个结构的独特性和历史意义在于:eEM品论天涯网

1.全新设计eEM品论天涯网

这是第一个完全从头设计(denovodesign)的蛋白质结构。eEM品论天涯网

不是基于任何现有自然蛋白质的修改或模仿。eEM品论天涯网

DavidBaker团队在2003年设计了这个结构,开创了人工蛋白质设计的新纪元。eEM品论天涯网

2.结构特点eEM品论天涯网

它包含了新颖的α螺旋和β折叠的组合方式,这种排列在自然界中从未被发现过。eEM品论天涯网

虽然使用了常见的二级结构元素(α螺旋和β折叠),但它们的三维空间排布是全新的。eEM品论天涯网

3.突破意义eEM品论天涯网

证明了我们可以设计出自然界中不存在的蛋白质结构。eEM品论天涯网

表明蛋白质设计不必局限于模仿自然蛋白质。eEM品论天涯网

开启了人工蛋白质设计的无限可能性。eEM品论天涯网

4.方法学意义eEM品论天涯网

验证了计算机辅助蛋白质设计的可行性。eEM品论天涯网

为后续更复杂的蛋白质设计奠定了基础。eEM品论天涯网

建立了从理论设计到实际合成的完整工作流程。eEM品论天涯网

这个成就相当于在蛋白质设计领域创造了第一个“人造元素”,就像门捷列夫周期表中的人工合成元素一样,展示了人类不仅能够理解自然,还能创造自然界中不存在的新事物。eEM品论天涯网

使用贝克的Rosetta程序开发的蛋白质eEM品论天涯网

eEM品论天涯网

这张图展示了DavidBaker团队在设计人工蛋白质方面的一些重要成果时间线:eEM品论天涯网

2016年:新型纳米材料eEM品论天涯网

展示了一个可以自发连接多达120个蛋白质的复杂结构。eEM品论天涯网

图中显示为一个大型球状结构,由紫色和浅绿色的蛋白质单元组成。eEM品论天涯网

2017年:芬太尼检测蛋白质eEM品论天涯网

设计出能够结合芬太尼(一种阿片类药物)的蛋白质。eEM品论天涯网

图中绿色为蛋白质主体,紫色部分为结合芬太尼的区域。eEM品论天涯网

这种蛋白质可用于环境中的芬太尼检测。eEM品论天涯网

2021年:流感疫苗纳米颗粒eEM品论天涯网

黄色核心部分是纳米颗粒。eEM品论天涯网

绿色外层是模仿流感病毒表面的蛋白质。eEM品论天涯网

在动物模型中已经证明可以作为流感疫苗使用。eEM品论天涯网

2022年:分子马达蛋白质eEM品论天涯网

设计出可以作为分子马达运转的蛋白质。eEM品论天涯网

图中显示为绿色的复杂结构。eEM品论天涯网

2024年:几何形状蛋白质eEM品论天涯网

设计出具有特定几何形状的蛋白质。eEM品论天涯网

这些蛋白质可以根据外部影响改变形状。eEM品论天涯网

可用于制造微型传感器。eEM品论天涯网

这张图很好地展示了人工设计蛋白质领域的快速发展,从相对简单的结构设计,到具有特定功能的蛋白质(如疫苗、传感器等),再到可以动态响应外界刺激的智能蛋白质。这些进展体现了DavidBaker在计算蛋白质设计领域的突出贡献。eEM品论天涯网

使用AlphaFold2预测的蛋白质结构eEM品论天涯网

eEM品论天涯网

这张图展示了使用AlphaFold2预测的三个重要蛋白质结构:eEM品论天涯网

2022年:核孔复合体部分结构eEM品论天涯网

图中显示为绿色环状结构。eEM品论天涯网

这是人体细胞中的一个巨大分子结构的一部分。eEM品论天涯网

超过一千个蛋白质共同组成了一个穿过细胞核膜的孔道。eEM品论天涯网

这个核孔对细胞核和细胞质之间的物质交换至关重要。eEM品论天涯网

2022年:分解塑料的天然酶eEM品论天涯网

图中显示为绿色的单个蛋白质结构。eEM品论天涯网

这种天然酶能够分解塑料。eEM品论天涯网

研究这种酶的结构目的是设计出可用于塑料回收的人工蛋白质。eEM品论天涯网

这对解决全球塑料污染问题具有重要意义。eEM品论天涯网

2023年:引起抗生素耐药性的细菌酶eEM品论天涯网

图中显示为一个复杂的多彩结构,包含多个不同颜色的蛋白质亚基。eEM品论天涯网

这是一种会导致细菌产生抗生素耐药性的酶。eEM品论天涯网

了解这种酶的结构对于寻找预防抗生素耐药性的方法非常重要。eEM品论天涯网

这对解决全球公共卫生面临的抗生素耐药性威胁具有重要意义。eEM品论天涯网

这张图很好地展示了AlphaFold2在预测复杂蛋白质结构方面的能力,以及这些结构预测对解决重要科学和社会问题的价值。从细胞基本生物学过程(核孔复合体),到环境问题(塑料降解),再到医学挑战(抗生素耐药性),都显示了蛋白质结构预测的广泛应用前景。eEM品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]