||
遗传信息如何从DNA传递到蛋白质?DNA的碱基序列如何决定蛋白质的氨基酸序列?在20世纪50年代末,这一问题是分子生物学最核心的谜题。它需要一种“密码”——将四种碱基的语言翻译成二十种氨基酸的语言。遗传密码概念的诞生,是抽象思维与实验科学完美结合的典范。从克里克的“序列假说”和“三联体猜想”,到尼伦伯格和科拉纳的体外破译,到密码子表的完成,再到揭示密码的通用性与简并性——遗传密码概念的历史,是一部人类如何读懂“生命天书”的壮丽篇章。
25.1 前史:信息流动的方向与“编码”问题
在遗传密码概念形成之前,两个关键前提已经确立。
中心法则的雏形:1958年,克里克提出中心法则,指出遗传信息从DNA流向RNA,再流向蛋白质。这一单向流动暗示了信息传递过程中存在“语言转换”——核酸的碱基序列如何对应蛋白质的氨基酸序列?这一问题被称为“编码问题”。
序列假说:克里克同时提出“序列假说”——蛋白质的氨基酸序列由DNA的碱基序列线性决定。这一假说并非自明,因为当时尚不能排除其他可能性(如蛋白质的折叠信息来自别处)。但它是密码破译的预设前提。
“共线性”的初步证据:1960年代初,通过比较噬菌体基因的遗传图谱与其编码蛋白质的氨基酸序列,科学家发现基因上的突变位点顺序与蛋白质中氨基酸置换的顺序一致。这支持了序列假说,并暗示DNA与蛋白质之间存在直接的线性对应。
25.2 概念诞生:三联体密码的提出
1954年,物理学家乔治·伽莫夫首先对编码问题进行了定量分析。
伽莫夫的无重叠三联体假说:DNA有4种碱基,蛋白质有20种氨基酸。如果1个碱基对应1个氨基酸,只能编码4种;2个碱基组合(16种)仍不够;3个碱基组合(64种)远超20种。伽莫夫推测:每三个碱基编码一个氨基酸(三联体密码),且密码子之间不重叠(即每个碱基只属于一个密码子)。他提出了一个具体的“钻石密码”模型,但该模型很快被实验否定。然而,他的三联体假说被保留下来。
克里克的移码突变实验:1961年,克里克、巴尼特和布伦纳等人用原黄素(一种嵌入剂)处理T4噬菌体,诱导了碱基的插入或缺失突变。他们发现:插入或缺失1个碱基会导致整个基因产物失活;插入或缺失2个碱基同样失活;但插入或缺失3个碱基时,部分功能得以恢复。这一结果证明:遗传密码是三联体,且阅读方式是非重叠的、从固定起点开始的(无逗号)。这是对三联体密码假说的决定性实验支持。
25.3 概念破译:无细胞系统与合成RNA
一旦确定密码子是三联体,下一个问题就是:哪个三联体对应哪个氨基酸?
尼伦伯格与马特伊的突破:1961年,美国生物化学家马歇尔·尼伦伯格和德国科学家海因里希·马特伊建立了一个无细胞蛋白质合成系统(来自大肠杆菌提取物,包含核糖体、tRNA、酶等,但不含完整的DNA或RNA)。他们加入外源RNA作为模板,然后检测被放射性标记的氨基酸是否掺入蛋白质。当他们加入由单一核苷酸(尿嘧啶)合成的多聚U(poly-U)时,发现只有苯丙氨酸被掺入。这是第一个被破译的密码子:UUU → 苯丙氨酸。
密码子表的扩展:1961-1964年,尼伦伯格和印度裔美国生物化学家哈尔·戈宾德·科拉纳等人利用化学合成的多聚核苷酸(已知序列的短链RNA,如UCUCUC...等重复序列),结合无细胞系统,系统测定了全部64个密码子的对应关系。科拉纳发展了酶法合成特定序列RNA的技术(使用多核苷酸磷酸化酶和化学合成寡核苷酸),使密码子破译成为可能。
三联体结合技术:尼伦伯格和莱德还发明了另一种方法:将放射性标记的氨基酸与tRNA结合,再与特定序列的三联体RNA(如UUC)混合。如果该三联体是密码子,则与tRNA上的反密码子互补,形成可被过滤器捕获的复合物。这一方法快速鉴定了许多密码子。
遗传密码表的完成:1966年,全部64个密码子的含义被确定。其中61个编码氨基酸,3个为终止密码子(UAA、UAG、UGA)。密码子具有简并性——大多数氨基酸由多个密码子编码。
25.4 概念深化:通用性、进化与摆动假说
遗传密码破译后,科学家进一步探究其性质和机制。
通用性:最初破译的密码子来自大肠杆菌系统。很快,研究者用蛙、豚鼠、人等的提取物重复实验,发现同样的密码子编码同样的氨基酸。遗传密码在所有已知生物中几乎完全通用(少数线粒体、原生生物有微小差异)。这一通用性是“生命统一性”的最有力证据,也暗示密码在地球生命诞生早期就已确立。
tRNA与反密码子:每个氨基酸被特定的tRNA携带,tRNA上的反密码子通过碱基配对识别mRNA上的密码子。1964年,霍利等人完成了丙氨酸tRNA的测序,揭示了其三叶草二级结构,并鉴定出反密码子位置。
摆动假说:1966年,克里克提出“摆动假说”:tRNA反密码子的第一个碱基(5’端)与mRNA密码子的第三个碱基(3’端)配对时具有一定灵活性(“摆动”),允许非标准配对(如G-U配对)。这解释了密码子简并性的机制——一种tRNA可以识别多个同义密码子。
遗传密码的起源:密码子表并非随机。结构相似的氨基酸往往拥有相似的密码子(如疏水氨基酸的密码子第一位多为U)。这表明密码子可能有进化起源——早期生命可能使用较简单的“原密码子”,后来逐渐演化出完整表。密码子的演化是生命起源研究的热点。
25.5 当代扩展:扩展密码、人工密码与合成生物学
21世纪,遗传密码概念被主动改造。
扩展遗传密码:自然界的遗传密码只有20种标准氨基酸。科学家通过改造tRNA和氨酰-tRNA合成酶,将非天然氨基酸(如光交联氨基酸、荧光氨基酸)引入蛋白质。这被称为“遗传密码扩展”。非天然氨基酸用于蛋白质功能研究、药物开发(如抗体-药物偶联物)和新型生物材料。
人工遗传密码:2014年,斯克里普斯研究所的罗梅斯伯格团队创造了一种含有非天然碱基对(d5SICS-dNaM)的大肠杆菌,该碱基对可在体内复制和转录。这是人类首次创造半合成的“人工遗传密码”。未来,扩展碱基对可用于存储更多信息、编码更多氨基酸。
重新分配密码子:某些密码子(如终止密码子)可以被重新分配为编码非天然氨基酸。通过敲除释放因子或工程化tRNA,使终止密码子被“读取”而非终止。这需要合成基因组的配合。
合成基因组的挑战:合成生物学试图从头设计最小基因组,其中可以重新分配密码子(如将某些冗余密码子全部替换,释放出新的密码子用于非天然氨基酸)。这引发了关于“人工生命”的伦理讨论。
25.6 概念史的启示
从伽莫夫的三联体猜想,到尼伦伯格的poly-U实验,到密码子表的完成,到人工扩展密码——遗传密码概念的演变跨越了半个多世纪。
这一演变给予我们几点启示:
第一,遗传密码概念的核心是“信息对应规则”。它不关心DNA或蛋白质的化学细节,而是关心两者的映射关系。这种“抽象规则”是分子生物学信息范式的巅峰体现。
第二,破译过程依赖“无细胞系统”和“合成RNA”两项关键技术。无细胞系统剥离了活的细胞,允许直接控制模板;合成RNA提供了序列明确的密码子。没有技术,就没有概念。
第三,遗传密码的通用性是“生命统一性”的最深刻证据。所有生物(从细菌到人类)使用同一套密码字典,表明它们来自同一个祖先。这一洞见是分子进化论的基石。
第四,遗传密码的简并性及摆动假说揭示了生物系统的“鲁棒性”——允许一定程度的错误配对而不导致灾难。同时,简并性也为密码子的进化重分配提供了可能。
第五,当代的密码扩展与人工密码正在从“解读”走向“重写”。人类不再仅仅读懂生命的天书,还在尝试修改字典本身。这既是合成生物学的机遇,也是安全与伦理的挑战。
今天,“遗传密码”已不仅是分子生物学的基础概念。它是基因工程中异源表达的前提(将人的胰岛素基因转入细菌,需使用相同的密码子表),是系统发育学中构建生命树的重要证据,是合成生物学中设计人工生命的基础,也是地外生命探索中判断“生命”的可能标准(如果发现基于不同密码子的生命,将改写我们对生命统一性的认识)。
遗传密码概念的历史告诉我们,生命的统一性不仅体现在细胞结构、代谢途径上,更体现在信息编码的底层规则上。从UUU到苯丙氨酸,从三联体到通用字典,人类用了几十年时间破译了生命使用了几十亿年的密码。而当我们能够重新编写这本字典时,我们也在重新定义生命的边界。正如生物化学家科拉纳所说:“遗传密码是生命的语言。学会阅读它,我们成了自然的见证者;开始改写它,我们成了自然的合作者。”
Archiver|手机版|科学网 ( 京ICP备07017567号-12 )
GMT+8, 2026-5-2 02:41
Powered by ScienceNet.cn
Copyright © 2007- 中国科学报社