超越基因组:破译蛋白质
完成人类基因组计划仅仅是开始。现在,一项更大规模的科学介议的目标是通过破译驱动人体的所有蛋白质来加快发现新的药物
【英国《焦点》月刊4月号文章】题:超越基因组:破译蛋白质
生物学真正是21世纪的科学。科学家在2001年宣布,在花费了10年和24亿英镑之后,一项国际性的努力已经在产生一幅人类基因组草图方面获得成功。现在正在制订有关一项更大规模倡议的计划。已经创建了人类蛋白质组组织(HUPO),以协调人类蛋白质组的破译——即充分认识人体每个蛋白质的结构和功能。
蛋白质领域中的这个与人类基因组计划相当的计划对在分子水平上认识疾病和加快药物的发现速度是至关重要的。没有它,人类基因组计划所产生的一切数据就没有什么实际用途。虽然基因可能提供了生命的蓝图,但是根据这些信息产生行动并推动人体发挥功能的却是蛋白质。正如一位研究人员所说:“仅仅盯着脱氧核糖核酸,我们所了解的东西几乎为零。我们需要认识发动机本身,而不是发动机的蓝图。”
人类蛋白质组计划完成起来的复杂性将是人类基因组计划的1000倍。人类拥有大约3万个基因,但却被认为拥有起码是这一数字10倍的蛋白质。这些蛋白质能够以不同方式表达自己,具体情况要看它们是独自活动还是与其它蛋白质合作。此外,虽然人类基因组计划进行基因排序所依靠的不仅仅是一项基本技术,但是破译蛋白质组所要求的却将是许多项有待开发的新技术。
但破译人类蛋白质组所带来的实际应用将十分了不起,以致每个星期都有一家新的蛋白质组技术公司出现。HUPO的宗旨就是协调这一不断兴旺发展的产业,它注重合作的必要性,而不是自身利益。如果它获得成功,我们在今后20年内可能会看到生物学新的伟大科学突破的到来。
我们为什么需要认识蛋白质才能了解人类基因组计划的意义?我们距离做到这一点有多么接近?
生命的物质
什么在先,是蛋白质还是基因?正如英格兰作家萨缪尔·巴特勒所说:“蛋白质就是基因制造另一个基因的方式;基因就是蛋白质制造另一个蛋白质的方式。”基因包含生命的原始资料,但没有蛋白质来提供这条生命的一个结构和发动机,基因怎么才能复制和生存?同样道理,如果没有基因供一种生命形式传宗接代,拥有一个从蛋白质中构筑的生命形式又有什么用处呢?
人们曾经以为,基因是由蛋白质构成的。但在1953年,剑桥卡文迪什实验所的克里克和沃森弄清了脱氧核糖核酸的双螺旋结构以及它如何携带遗传信息。同年在同一地方,佩鲁茨和肯德鲁在经过20年的研究后宣布了两种蛋白质的三维结构:一种是血液中携带氧气的血红蛋白,另一种是肌肉中储存氧气的肌红蛋白。他们是利用X射线晶体学技术做到这一点的。
由于这些突破性成果,克里克和沃森获得了1962年的诺贝尔医学奖,佩鲁茨和肯德鲁获得了同年的诺贝尔化学奖。
在从那时以来的半个世纪里,科学家们构筑了一个由大约8000个人类蛋白质结构组成的知识基础,其中每个都代表了几个月或者几年的研究成果。
仅仅是开始
然而还有几十万个结构需要弄清。此外,了解蛋白质在三维上如何定向仅仅是这些生命攸关的化合物的部分情况。我们要想充分利用人类基因组计划所产生的数据,就需要了解驱动我们身体的三维蛋白质结构如何从这些数据中产生。只有到那时,我们才能真正把握疾病的分子基础和治疗所需的药物。
在与克里克一起发现双螺旋结构之后,沃森一心致力于认识基因如何转变成蛋白质,即他所说的“生命领域中像古埃及罗塞塔石碑的发现一样具有揭示意义的事件”。由于猜测一种与脱氧核糖核酸(DNA)关系密切的分子———核糖核酸(RNA)对这一过程具有核心重要性,他与同时代的其他几位著名科学家一起成立了一个俱乐部,称为“RNA领带俱乐部”,只吸收20名成员参加,每人负责构成蛋白质的氨基酸当中的一种。到1966年,多亏了俱乐部和另外一些科学家,也许尤其是克里克在知识上的孜孜以求,蛋白质如何从基因中制造得到了充分认识。
现在认为RNA的历史比基因和蛋白质还要悠久。它是参与蛋白质合成的关键材料。DNA由4个化学基——腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)——构成,而RNA则是由上述前3个化学基和称为尿嘧啶(U)的第4个构成。RNA的一种形式,称为信使核糖核酸(mRNA),能够进入细胞核(一种生命形式的DNA存在其中)并将自己制造成基因组任何部分的一个副本,然后离开细胞核并附着在一个核糖核蛋白体上。
在RNA中的4个化学字母当中的每3个字母的组合代表20个氨基酸之一。一个或更多的多肽包含组成一个蛋白体所需的所有氨基酸。但这些线性的排序仅仅标志着一个蛋白体的“初级结构”。蛋白体要想实现自己的功能和发挥作用,就必须采取其最终的三维形状。这种“折叠”可能会花费几微秒到几秒。这在生物化学世界里是很长时间。然后蛋白体被储存在内质网中供以后使用,被携带到戈尔吉体中以添加糖,或者被立即输送到其功能场所,不管是在细胞内部还是以外。
从表面上看,我们似乎知道有关基因如何被转变成蛋白质的一切。诚然,多亏了克里克和沃森等20世纪的伟大生物学家,我们对生命的罗塞塔石碑有了足够好的了解,以理解人类基因组数据。但不幸的是,这一过程中的一个成分所带来的蛋白质继续跟科学家们捉迷藏。这就是一个蛋白体折叠成其三维形状的方式。这一过程半个多世纪以来一直使生物学家们感到困惑。
生物学最大的问题
古希腊传说描述了一个叫做普罗透斯的古老海神,蛋白质(“普罗蒂恩”)一词就是从其中派生的。他生活在埃及近海的法罗斯岛上,像其他海神一样,通晓过去、现在和未来,能够呈现为不同的形状。人们经常前来求助于他的预言,但他厌恶合作。来访者为了获得答案,不得不出其不意,在他于岩石上午睡时把他捆绑起来。他千方百计变化形状以图逃跑。但人们最终牢牢地缚住他,获得了答案。尔后这位海神生气地一头扎进海里。
普罗透斯在古希腊被看作从中缔造了人类的所有物质的象征。今天,他的故事反映了生物学家们在寻求认识蛋白质的过程中所面临的核心问题。由于蛋白质储存着有关我们遥远过去的信息并且具有揭示我们未来健康状况详情的潜力,所以它们像普罗透斯一样,掌握着打开科学家们急于打开的有关我们生命的知识宝库的钥匙。但没有对人体几十万种蛋白质当中的每一个是如何根据氨基酸的线性排序呈现为其最终形状的认识,基本上是无法获得这一知识的。
蛋白质的折叠问题已经有50多年历史。伟大的化学家莱纳斯·波林演绎出了氨基酸自我折叠的两种简单但惯常的方式,称为阿尔法螺旋和贝塔薄片,从而获得了1954年的诺贝尔化学奖。它们只是蛋白质结构的两个基本要素,仅仅标志着这一折叠过程的第一阶段。为了达到其最后的造型——称为天然状态——一个蛋白体会多次地自我扭曲,以扭转、旋转、结状和环状将自己包裹成一团,然后逐渐以三维形状静止下来。这一形状将决定其功能。它复杂的折叠中的裂缝与沟纹使它得以附着在其它分子上面。
蛋白质的折叠对生命具有重要意义,被一些人称为“遗传密码的下半部分”。无怪乎当它出毛病时,生命受到威胁。最近的发现表明,一系列的彼此不相关的疾病都是由某些蛋白质的折叠失误所造成,这些疾病包括早老性痴呆、囊肿性纤维化、疯牛病以及与之相当的人类疾病CJD、一种遗传性的肺气肿、遗传性慢性舞蹈病和许多癌症。
在寻找治疗这些疾病方法的刺激下,科学家们加紧努力,以解决蛋白质折叠问题。但预测一条悬摆着的氨基酸链最终会呈现为何种三维形状绝非易事。它能够自我扭结几亿种方式——想想一条鞋带便知——但它最终所呈现的却是一种精确的、事先决定好的形状,这一形状是通过千百万年的进化所选择的完成这项任务的最佳形式。来自许多不同学科的科学家们正在利用一系列不同方法,从X射线驱散到原子力显微镜,来攻克这一课题:一个一维的排序怎么决定着一个三维的形状?
解决这一问题的一项普通做法涉及高速电脑的使用。加利福尼亚大学的一个研究小组利用一台格雷T3D和T3E超级电脑在水中用了一微秒追踪一个很小的蛋白体的折叠过程。这听起来可能不像是很大的成就,但考虑一下这些超级电脑花费了100天,动用了256台处理器,才弄清了在这一微秒时间里,所有该蛋白体的12000个原子与其周围环境之间的相互作用,这些相互作用在研究过程中每一飞秒(一纳秒的百万分之一)就必须重新计算。
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】