- 分子病理学(第2版)
- 李玉林主编
- 13212字
- 2025-03-14 20:07:42
第三节 DNA复制、转录及翻译
DNA是储存和传递遗传信息的生物大分子,亲代的遗传信息通过DNA分子的复制,合成完全相同的两个拷贝,传递给子代,完成遗传信息的传递过程。在个体发育过程中,DNA分子的遗传信息通过转录,生成RNA,并翻译成蛋白质,体现特定的生物性状。遗传信息经DNA和RNA流向蛋白质的过程,称为遗传学的中心法则(central dogma),由Crick等于1958年最早提出。1970年,Temin提出反转录(reverse transcription)的概念,扩充了中心法则的范围(图1-13)。

图1-13 DNA、RNA和蛋白质的关系
引自龚守良.辐射细胞生物学,2014版。
一、DNA复制
以亲代DNA为模板合成子代DNA分子的过程称为DNA复制(DNA replication)。原核生物和真核生物都通过DNA复制完成基因组的复制。生物通过完整复制其基因组将遗传信息传给子代。DNA复制具有半保留复制(semiconservative replication)、双向复制(bidirectional replication)、半不连续复制(semidiscontinuous replication)和高保真性(high fidelity)的基本特征。
(一)DNA复制基本特征
DNA复制是酶促核苷酸聚合反应,底物是dATP、dGTP、dCTP和dTTP,总称dNTP。病毒或细菌基因组作为一个完整的复制单位进行复制,每一个复制单位称为复制子(replicon)。真核细胞含有多个DNA复制子,每个复制子具有控制复制起始的位点,称为复制起点(origin of replication,ori)。这些起点常富含AT,便于DNA解开。DNA复制时,亲代DNA分子在复制起点区域打开双链,以每条单链为模板,复制子代DNA分子。复制起点处呈现一“Y”形的复制叉(replication fork)(图1-14)。随着复制的进行,复制叉向前移动。
当复制叉沿着DNA移动复制DNA时,会遇到许多内源性DNA复制叉障碍点。这些障碍点大部分是由DNA二级结构形成的。Tomasetti等证实,存在停顿DNA复制叉是不稳定的,细胞周期检查点(cell cycle checkpoint)起到维持停顿复制叉稳定的调控作用。大数据统计表明,约66%的癌症是DNA复制错误产生的。DNA复制叉失能被认为是DNA复制错误的主要原因。

图1-14 DNA复制
图中显示DNA半保留复制的特点,前导链是连续合成的,后随链的合成是不连续的。
2019年,美国杨薇课题组利用冷冻电镜技术,研究了模式生物T7噬菌体的DNA复制机制,获得了第一个复制体(replisome)复制的DNA三维结构,揭示了DNA复制体的结构和工作原理。研究者发现,在复制体结构中DNA聚合酶、DNA促旋酶(DNA gyrase)和引发酶(primase)紧密地结合在“T形”的复制叉周围,形成一个多层紧密分子结构。前导链(leading strand)和后随链(lagging strand)分别被DNA聚合酶(DNA polymerase,DNA pol)和DNA促旋酶捕获,两个酶向相反的方向拉伸母链DNA,协同完成母链DNA的解旋。前导链直接被DNA聚合酶复制,而后随链穿过螺旋酶后,先后被后随链上的引发酶和DNA聚合酶捕获,作为复制模板被复制。他们甚至捕捉到了复制体,尤其是促旋酶在复制过程中的多个分子构象,揭示了DNA复制的动态过程。在这项研究中,第一次观察到真正的复制叉。有趣的是,它不是“Y”形,而是“T”形:下游DNA是“T”字的主干,顶上的两个分支是两条分开的前导链和后随链。对于这种复制体动态过程,在细菌和真核生物中均保守存在。这种复制体不仅参与了DNA复制过程,还能检测到DNA损伤和协同应激反应。对这种DNA复制体结构进行深入研究,为加深理解DNA复制、重组和修复等过程之间的协调作用关系提供了基础。
1.半保留复制
DNA复制时,DNA双链解开,每条单链作为模板(template),按碱基互补原则合成新的互补链(complementary strand)。新合成的两个DNA分子和亲代DNA分子完全一样。每个子代DNA分子中,一条单链来自亲代,另一条是新合成链,所以这种复制方式称为半保留复制。半保留复制保证遗传信息忠实地从亲代传给子代,使亲代与子代DNA之间碱基序列高度一致,这对于理解DNA的功能和物种的延续性具有重大意义。但是,在强调遗传保守性的同时,不应忽略遗传的变异性。
2.双向复制和半不连续复制
生物体内DNA聚合酶催化的DNA链合成方向是5’→3’。DNA双链是反向平行的,一条是5’→3’方向,另一条是3’→5’方向,两条链都能做模板。DNA聚合酶以3’→5’方向作为模板链时,可以连续合成新的互补链(前导链)。但是,5’→3’方向模板链的互补链不能沿着同一方向以同样的方式合成。该链的合成是通过不连续复制解决的,其特点是互补链合成虽然也是沿5’→3’方向进行,但不是连续的,而是合成许多片段,且其方向与复制叉的前进方向相反。这些片段称为冈崎片段(Okazaki fragment),在真核生物中这种片段的长度约为100~200nt。DNA连接酶(DNA ligase)将冈崎片段连接起来,形成后随链。因为前导链的合成是连续进行的,而后随链是不连续的,所以DNA的复制具有半不连续复制的特征。
3.高保真性
DNA复制具有高保真性,其错配概率约为10-10。这种高保真性是DNA聚合酶利用严格的碱基配对原则从而保证复制的真实性,复制叉的复杂结构提高了复制的准确性,DNA聚合酶的核酸内切酶活性和校读功能以及复制后修复系统对错配加以纠正,通过这些机制的协同作用,保证了复制的保真性。
(二)原核细胞DNA复制
DNA复制过程十分复杂,包括DNA双链解开、RNA引物合成、DNA链延伸、引物切除、缺口填补、相邻DNA片段的连接以及切除和修复错配碱基等过程。这些过程大致可以分为起始、延伸和终止三个阶段。复制过程需要多种蛋白质(包括酶)参与,如DNA聚合酶、解旋酶、单链DNA结合蛋白(single-strand DNA binding protein,SSB)和核酸外切酶等。
1.DNA复制的主要蛋白酶
(1)DNA聚合酶(DNA polymerase,DNA pol):
DNA pol的作用是催化DNA合成,发挥其催化活性需要Mg2+的存在。大肠杆菌有DNA polⅠ、DNA polⅡ和DNA polⅢ三种,其中DNA polⅢ是主要的DNA复制酶。DNA polⅢ全酶(holoenzyme)由10个不同的亚基组成。
(2)DNA解旋酶(DNA helicase):
DNA pol催化的DNA复制,需要部分DNA处于螺旋松弛及双链解开的状态。在这种状态下,碱基外露,新的DNA链才能按碱基互补原则进行复制。解旋酶、拓扑异构酶和单链结合蛋白等负责使DNA处于这种“解开”状态。
真核生物细胞的CMG解旋酶是由6个类似的亚基(Mcm2-7)形成一个杂六聚体环状结构,再通过紧密结合其它辅助因子(Cdc45,GINS)形成的蛋白质复合物。2017年,美国Georgescu等成功破解CMG解旋酶参与真核生物内DNA复制的结构过程,并观察其与DNA间的相互作用。研究者从酵母生物体内提纯CMG解旋酶,利用低温电子显微镜拍摄CMG解旋酶在DNA复制中的结构图像。对DNA双链解旋过程拍摄的图像显示,CMG解旋酶能像拉链一样将DNA双螺旋打开。过去认为,解旋酶中碳环优先于氮环与双链DNA作用,但这次解旋酶极性完全相反,氮链比碳链更先与双链DNA作用。这些结果将对高级生命如何繁殖获得更全面的信息,为了解DNA复制背后的核心驱动机制提供了原理图。此外,包括癌症和贫血等在内的40多种疾病与DNA复制失误有关,这有助于开发防治这些疾病的全新疗法。
(3)单链DNA结合蛋白(single-strand DNA binding protein,SSB):
SSB与解开的DNA单链紧密结合,维持单链状态;另外,还能与新合成的DNA单链结合,以防止核酸酶的水解作用而导致断裂。
(4)引发酶(primase):
DNA开始复制时,需要引物(primer),这是因为DNA pol不能催化dNTP单体聚合,只能在核苷酸链(如引物)的游离3’-OH加上一个核苷酸。DNA复制的引物常常是一小段新合成的与复制起始部位模板互补的RNA。原核细胞的RNA引物长约55~100nt,动物细胞的引物长约10nt。催化这种引物RNA合成的RNA pol,与转录过程中起作用的RNA pol不同,称为引发酶。
(5)DNA拓扑异构酶(DNA topoisomerase):
有Ⅰ型和Ⅱ型拓扑异构酶两类,前者使负超螺旋松弛,分子内张力释放,DNA解链旋转时不致缠结;DNA促旋酶(DNA gyrase)属于后者,可使超螺旋松弛或使已松弛的DNA分子转变为负超螺旋。
(6)DNA连接酶(DNA ligase):
催化后随链中冈崎片段最终的连接过程。DNA切除修复时出现的缺口,也由DNA连接酶进行连接。DNA连接酶的活性需要能量。
2.复制过程
(1)起始(initiation):
可以分为以下5个步骤。①起始复合物(initiation complex)与DNA结合:大肠杆菌的复制起点是oriC,起始蛋白DnaA形成20~30个分子的复合物,每个DnaA分子又分别与ATP结合,再与oriC中的4个9bp结合位点结合,促使oriC中3个富含AT的13bp重复序列局部解链。②形成引发体前体(preprimosome):oriC局部解链后,蛋白DnaB/DnaC进入局部解链区,形成引发体前体复合物。③解旋酶解链:DnaB是解旋酶,使双链DNA进一步解链,SSB结合到DNA单链上,保护单链模板。④合成引物:RNA引发酶加入,组合成引发体(primosome),引发酶以NTP(UTP、ATP、CTP和GTP)为原料,以解开的DNA链为模板,按5’→3’方向合成RNA引物,引物末端游离的3’-OH成为DNA合成的起点。⑤DNA polⅢ全酶:此酶组装到起始部位,新DNA链的合成和延伸开始。
(2)延伸(elongation):
在DNA polⅢ催化下,从引物的3’-OH端沿5’→3’方向逐个加入脱氧核苷酸,使DNA链延伸。复制叉前进时,前导链可以连续地延伸,后随链则分段合成。在后随链,DNA链延伸至下一个冈崎片段引物前方时,DNA pol的5’→3’外切酶活性切除引物,继续延伸DNA链,填满切除引物后留下的间隙。DNA连接酶最终将两个片段连接起来。
(3)终止(termination):
大肠杆菌的两个复制叉的汇合点一般位于环形染色体和oriC相对处,也就是其复制终点。汇合点两侧各有几个终止位点,都含有一个23bp的共有序列,能与Tus蛋白结合。Tus蛋白具有抑制解旋酶DnaB的活性,阻止复制叉的前进。每个复制叉必须越过另一个复制叉的终止位点才能到达自己的终止位点。
以上介绍的是以细菌为代表的原核细胞染色体DNA复制的基本特点。还有一些较特殊的复制形式,如噬菌体环状DNA的滚环复制(rolling circle replication)。
3.DNA复制的实时视频
美国Graham等以精密复杂的成像技术,观察到大肠杆菌的DNA复制过程,计算解旋酶作用机制并测量其在不同股DNA作用所需的时间。研制者第一次捕获大肠杆菌单个DNA分子复制的近距离镜头,是实时的,并表明这个特定的组成部分具有“随机性”。当解旋酶解开DNA并将其双螺旋解开成两股时,DNA复制发生;然后,引物酶将引物引入未分解的链,另一种聚合酶伴随该引物,并添加新的碱基以形成DNA的另一双螺旋,从而复制该链。这个过程涉及首先缠绕在双螺旋中的前导链,以及随后的后随链。在复制过程中,前导链和后随链行动相互协调。
(三)真核细胞DNA复制
真核细胞DNA复制在细胞分裂周期的S期进行。真核细胞DNA分子大,与组蛋白紧密结合形成结构复杂的染色质,复制叉移动速度缓慢(约每秒50bp)。因此,真核细胞染色体上有多个复制起点。
1.5种DNA pol
真核细胞有5种DNA pol,即DNA pol α、β、γ、δ及ε,均能催化核苷酸沿5’→3’方向聚合。α及δ(可能还有ε)参与核DNA的复制。δ及ε均具有3’→5’核酸外切酶活性,可能具有修复和校对功能。γ存在于线粒体中,参与线粒体DNA复制,也具有3’→5’核酸外切酶活性。DNA合成酶的合成能力对于保证DNA分子不间断的高效合成至关重要。在真核细胞,DNA合成酶与增殖细胞核抗原(proliferating cell nuclear antigen,PCNA)的结合,是保证其高效合成能力的重要因素。
2.存在末端复制问题
真核生物DNA为线性DNA,存在末端复制问题。线性DNA复制时,后随链DNA末端的引物去除后,不能由DNA polδ填补,因其不能进行3’→5’方向的合成;否则,会造成DNA后随链模板逐渐缩短。真核细胞通过端粒酶解决这一问题(见本章第二节)。
3.受到细胞周期调控
真核生物染色体的复制受到细胞周期调控机制的精确控制,在每个细胞周期中,只在S期进行一次完整的复制。全部复制完成之前,各起始位点不能再开始下一轮复制。真核细胞在复制时,还同步合成组蛋白,在复制叉后方,新合成的DNA双链与组蛋白形成核小体。
4.组蛋白变体H2A.Z对DNA复制起始位点的调控
2019年,我国李国红和朱明昭等揭示了组蛋白变体H2A.Z对DNA复制起始位点的调控机制。实验证实,含有H2A.Z的核小体能够通过直接结合甲基转移酶SUV420H1,促进核小体上的组蛋白H4第20位赖氨酸发生二甲基化修饰。而带有上述修饰的H2A.Z核小体,能够招募复制前体复合物中的复制起始识别复合体(origin recognition complex,ORC)蛋白,从而帮助染色质上复制起始位点的选择。至此,研究者确定了一个全新的DNA复制起始位点认证的调控通路:H2A.Z-SUV420H1-H4K20me2-ORC1。进一步实验发现,在小鼠T细胞中条件性敲除H2A.Z,会导致活化后的T细胞增殖变慢,复制信号显著降低。
5.端粒的作用
端粒在维持染色体的稳定性和DNA复制的完整性中起到重要的作用。在某些情况下,染色体可以断裂;这时,染色体断端之间会发生融合或断端被脱氧核糖核酸酶(deoxyribonuclease,DNase;简称DNA酶)降解。但正常染色体不会整体地互相融合,也不会在末端出现遗传信息的丢失,其原因是端粒酶参与解决染色体末端复制问题。
6.解决DNA双链的缠绕问题
2019年,美国Le等从拓扑学角度解决了DNA双螺旋中的两条链是如何在没有缠绕的情况下成功复制的问题。他们通过真核生物模型系统,发现染色质的内在机械性能决定染色质纤维的缠绕。这种拓扑结构对于成功分离新复制的DNA至关重要:如果染色质纤维缠绕得太紧太早,这些新复制的DNA分子在细胞分裂过程中将无法正确分离。在DNA复制过程,复制体(replisome)将两条DNA链分开并向前移动,DNA也必须绕双螺旋轴缠绕,这会使DNA承受很大的扭转应力(torsional stress),从而导致DNA发生额外的扭曲。问题在于,如果额外的扭曲仅发生在复制体的正面,那么两个子DNA分子将不会缠绕在一起,可以分开。但是,如果额外的扭曲发生在复制体的背面,那么两个子DNA分子将缠绕在一起,无法分开。研究者发现,一种能解开双螺旋DNA的酶(拓扑异构酶Ⅱ)偏爱正面的单条染色质纤维。染色质机械性能和拓扑异构酶活性似乎以协同方式,减少子DNA分子之间的缠绕。
7.线粒体DNA复制
真核生物线粒体DNA(mitochondrial DNA,mtDNA)为闭合环状双链结构,可独立编码线粒体中的一些蛋白质。人线粒体基因组全长16 569bp,共编码37个基因。mtDNA按D袢合成(D-loop synthesis)方式复制,需合成引物,第一个引物以内环为模板延伸;至第二个复制起点时,又合成另一个反向引物,以外环为模板进行反向的延伸,最后完成两个双链环状DNA的复制。mtDNA容易发生突变,损伤后修复较困难。近期,英国Chinnery的研究项目比较了成千上万人的线粒体和核DNA,发现mtDNA能够微量转移到细胞核内。当mtDNA向下传代时,会发生某种选择,允许一些突变传递,其他突变则被阻断。由于mtDNA具有比核DNA高得多的突变率,线粒体基因组突变很常见。研究表明,mtDNA的变化是由核DNA决定的。这一发现说明,细胞中的线粒体和细胞核之间存在某种微妙的关系。
二、转录
以DNA为模板合成与其互补的单链RNA分子的过程称为转录(transcription)。通过转录过程产生的RNA分子称为转录物(transcript)。转录是基因表达过程的第一步。大部分基因编码蛋白质,需要以RNA为模板。编码rRNA和tRNA等基因,则直接转录为相应的RNA分子发挥作用。
RNA也是以5’→3’方向合成,需要RNA pol催化,以4种NTP(UTP、ATP、CTP和GTP)为底物。与新合成的RNA序列一致的DNA链,称为编码链(coding strand),又称有义链(sense strand);与编码链互补的DNA链称为模板链(template strand),又称反义链(antisense strand)。RNA转录时,是以DNA为模板合成RNA。
(一)RNA聚合酶
大肠杆菌只有一种RNA聚合酶(RNA polymerase,RNA pol),由5个亚基(α、β、β’、ω和σ)组成全酶(αββ’ωσ),称为核心酶。每个亚基具有不同的功能。真核生物有三类RNA pol,即RNA polⅠ、RNA polⅡ和RNA polⅢ。RNA pol识别不同的启动子,负责不同基因的转录。
RNA polⅠ位于核仁,转录大部分rRNA基因。RNA polⅡ定位于核质,负责转录所有编码蛋白质的基因(转录产物是mRNA前体)以及一些snRNA基因。RNA polⅢ也位于核质,转录tRNA基因和5S rRNA基因以及其他一些小RNA基因。真核RNA pol结构复杂,均由10余个亚基组成的大分子复合物。每个RNA pol都含有两个在序列上具有同源性的较大亚基。
2018年,英国与德国的两支研究团队均使用冷冻电镜技术获得了RNA polⅢ与转录因子(TF)ⅢB形成的前起始复合体(preinitiation complex)结构,发现随着TFⅢB对DNA的完全环绕,RNA polⅢ的结构发生变化,即TFⅢB的Bdp1亚基引起RNA polⅢ特异亚基C37和C34重排,协助“打开”双链DNA;随后,松开的DNA链,直接结合RNA polⅢ的裂口,准备进行转录。另外,在DNA双螺旋尚未打开、已打开以及开始转录的多个阶段,TFⅢB与DNA启动子有多价的结合。此外,TFⅢB与RNA polⅢ的C37亚基能激活前起始复合体内类似于“转录因子”的活性,使双链DNA开始分离,以便转录进行。从拓扑学和运作机制上看,RNA polⅢ的复合体结构与RNA polⅡ的复合体结构很类似。
三种聚合酶都具有以NTP为底物催化5’→3’方向合成RNA的能力,这一合成过程不需要引物。与原核RNA pol不同,真核RNA pol还需要其他一些因子的参与才能与启动子结合并开始转录。线粒体中也含有RNA pol,催化线粒体中RNA的合成。
(二)转录过程
转录过程分为起始、延伸和终止3个阶段。
1.起始
真核生物转录起始时,必须有一些转录因子(transcription factor,TF)参与。TATA结合蛋白(TATA-binding protein,TBP)是一重要的转录因子,为单体,具有1个马鞍状结构,与DNA的小沟相互作用。鞍子的外部与其他蛋白质相互作用,其内部与启动子的TATA框(TATA box/Hogness box)结合,引起结合部位DNA弯曲和部分解开。
RNA polⅡ催化DNA转录,合成mRNA;与其一起作用的TF有多种,包括TFⅡA、TFⅡB和TFⅡD等。RNA polⅠ催化18S、5.8S和28S rRNA基因的转录,这些基因以rRNA前体转录单元的形式存在。RNA polⅢ催化tRNA和5S rRNA基因等的转录。
2.延伸
转录起始后,RNA pol按模板链的碱基序列,从5’→3’方向逐个加入核糖核苷酸。开头9个核苷酸加上后,σ因子脱落,留下RNA聚合酶、DNA和新生RNA的三元复合物。RNA pol沿着DNA链移动,保持部分DNA链的解开,形成“转录泡(transcription bubble)”。RNA pol离开启动子位点后,新的RNA pol全酶可以在启动子上立即开始新的转录过程。
2019年,我国张余等阐述一种特殊的不依赖DNA相互作用而激活转录的分子机制。基于研究数据,研究者提出了转录起始因子Crl特异结合转录起始因子σS,是协助σS实现基因表达程序快速转换的关键蛋白,稳定σS的活性构象,从而促进σS与RNA pol的组装以及σS与启动子DNA的结合,进而激活σSRNA pol介导的转录。该工作显示了一种新的转录因子与RNA pol的结合方式,揭示了一种新的细菌转录激活分子机制。
我国张余与美国学者合作发现,在细菌转录起始因子存在一个结构模块,即σ指(σ finger),深入到RNA pol的催化中心,在RNA pol解双链DNA时,能够稳定单链的转录泡结构。但是,该σ指的位置堵住了新生RNA的延伸路径。研究者解析了细菌转录起始阶段约20个复合物晶体结构,发现RNA的延长会逐渐挤压σ指,并最终将其推出RNA pol中心。研究者提出了启动子逃逸(promoter escape)分子机制,认为σ指相当于一个弹簧,RNA在刚开始延长的过程中不断地挤压这一弹簧,能够将核苷三磷酸(nucleoside triphosphate,NTP)水解的自由能不断转换成机械能,并积累到σ指的蛋白弹簧上,当这一弹簧被挤压到极限时,能够促发RNA pol与启动子DNA的解离,完成启动子逃逸。
3.终止
基因的3’末端存在反向重复序列,可以互补,导致转录的RNA形成发夹结构,构成RNA转录的终止子,阻止RNA pol继续向前移动。终止子的茎常富含GC,结构稳定。发夹结构的末端常跟随4个或者更多U,有助于RNA与模板DNA链的解离。有些基因转录的终止还需要一个Rho因子的蛋白质。RNA polⅠ转录到rRNA的3’末端后,继续转录,在辅助因子的协助下终止在一个18bp的终止序列处。RNA polⅢ的终止子与原核生物终止子相似,具有发夹结构和U串。
(三)RNA加工
RNA转录产物是成熟RNA的前体,多数需要经过RNA加工(RNA processing),包括由核酸酶去除一些核苷酸、在5’或3’末端加上某些核苷酸以及甲基化等。
1.rRNA前体(precursor rRNA,pre-rRNA)
真核细胞的pre-rRNA在核仁中合成并被加工为成熟rRNA,后者与核糖核蛋白形成核糖体。45S rRNA前体是含有18S、28S和5.8S rRNA各1个拷贝的长链分子,通过许多snoRNA的作用而进行加工。rRNA前体甲基化主要发生在核糖的2’-OH。甲基化位点在脊椎动物中高度保守。此外,rRNA前体中的一些尿嘧啶通过异构作用转变为假尿嘧啶(ψ)。5S rRNA转录产物由RNA polⅢ催化合成,基本无需加工。
2.mRNA前体(precursor mRNA,pre-mRNA)
原核细胞mRNA基本没有加工过程,甚至在转录结束之前即可开始翻译。真核细胞mRNA有比较复杂的加工过程,因其结构基因是断裂基因,基因转录时内含子和外显子一同被转录。这样,形成的mRNA前体需要经过剪接,以去除内含子序列,并将外显子序列连接起来,才能成为完整的编码蛋白序列的成熟mRNA。此外,真核生物mRNA还有5’末端加帽子和3’末端加poly(A)尾巴等加工过程。
2019年,美国科罗拉多大学(University of Colorado)Zhao等发现与pre-mRNA剪接相关的关键机制。在pre-mRNA剪接过程中,当出现异常剪接,至少会导致30%人类遗传疾病,以及许多其他疾病,如癌症。在所有真核生物中,剪接pre-mRNA对于基因表达是必不可少的,选择性剪接是真核生物基因表达调控的一种基本方法。另外,美国Jaganathan等对任意pre-mRNA序列剪接,可精确预测隐性剪接突变,从而改善对遗传疾病的诊断。
(1)5’末端加帽:
RNA链合成到链长约25个核苷酸时,在其5’末端加上一个m7G(N7-methyladenosine,7-甲基腺苷),形成5’末端帽子结构,与防止RNA链被核酸外切酶降解等有关。
(2)3’末端poly(A)尾巴:
真核细胞mRNA的3’末端有poly(A)尾巴,是转录后加上的,模板链上并无相应poly T序列。结构基因最后一个外显子的3’末端,常有一组共有序列5’-AATAAA-3’,称为多腺苷酸化信号(polyadenylation signal),其下游富含GT的序列。这些序列一起构成多腺苷酸化位点。mRNA前体在AAUAAA下游11~30个核苷酸处先被特异核酸内切酶切断,随后在多腺苷酸聚合酶(polyadenylate polymerase,poly(A)polymerase)催化下给3’末端加上poly(A)尾巴。真核细胞胞质中poly(A)长约200nt。poly(A)尾巴可与poly(A)结合蛋白结合,可能起到稳定mRNA的功能。加尾在核内进行,某些基因的转录产物(如组蛋白基因的转录产物)无poly(A)尾巴。
(3)mRNA前体的剪接:
真核细胞mRNA前体分子中的内含子被切除及外显子被连接起来的过程,称为mRNA的剪接(splicing)。剪接时,内含子大多以5’-GU-3’开始,以5’-AG-3’结束。5’末端起始序列GUAAGU形成5’剪接位点。3’末端末尾序列(Py)nNPyAG(Py指嘧啶,n约为10,N为任意碱基)构成3’剪接位点,其上游是一段富含嘧啶的序列。3’末端上游10~40nt处还有1个保守序列,称为分支点序列(branchpoint sequence)(图1-15)。

图1-15 信使RNA(mRNA)前体的剪接
内含子分支点中A的2’-OH对内含子5’-GU-3’处G前的共价键进行攻击;内含子5’末端的G与分支点A的2’-OH形成2’,5’-磷酸二酯键(套索RNA结构,lariat)。游离出来的外显子的3’-OH攻击内含子末端5’-AG-3’处G后的共价键,呈套索RNA结构的内含子脱离并最终降解,两个外显子以3’,5’-磷酸二酯键连接起来。
(4)甲基化(methylation):
真核生物mRNA分子内部,含有少量N6-甲基腺嘌呤(N6-methyladenosine,m6A),由特异的甲基转移酶甲基转移酶(methyltransferase)催化形成,其功能尚不清楚。
(5)替代加工(alternative processing):
mRNA前体可以通过加工过程产生不止一种成熟mRNA,称为替代加工。有几种方式可以产生这种结果。一种是通过在剪接过程中去掉某些外显子,或者保留某些内含子,即为替代剪接(alternative splicing)。有些mRNA前体分子含有不只1个多腺苷酸化信号,加工过程如果使用不同的多腺苷酸化位点,可以产生具有不同的3’末端成熟mRNA分子。这些替代加工途径在不同的细胞中出现,也具有细胞类型特异性,可能与不同细胞产生的一些能够特异地激活或抑制某些加工位点的因子有关。通过插入、删除或更换一些核苷酸的方式,对mRNA中的外显子进行替代加工,称为RNA编辑(RNA editing),是一种少见的加工形式。
3.tRNA前体(pre-tRNA)
真核细胞多数tRNA前体分子在5’末端或3’末端可有一些多余的核苷酸序列,需由核酸内切酶等去除。例如,酵母酪氨酸tRNA前体5’末端有一段15nt组成的先导序列,需要由核糖核酸酶P(RNase P)切除。在3’末端,有两个多余的U,切除后在tRNA核苷酰转移酶催化下,加上5’-CCA-3’序列。这是tRNA分子中统一的3’末端。真核细胞tRNA前体多数具有内含子,需由核酸内切酶将其切除,再由连接酶将其两侧的序列连接起来。成熟tRNA中约10%碱基为经过修饰的碱基,包括甲基嘌呤、二氢尿嘧啶和假尿嘧啶等。
三、逆转录
RNA病毒的基因组是RNA,其复制方式是逆转录,称为逆转录病毒(retrovirus),但不是所有的RNA病毒都是逆转录病毒。逆转录的信息流动方向(RNA→DNA)与转录过程(DNA→RNA)相反,是一种特殊的复制方式。
从单链RNA到双链DNA的生成分为三步。首先,逆转录酶以病毒基因组RNA(genomic RNA,gRNA)为模板,催化dNTP聚合生成DNA互补链,其产物是RNA/DNA杂化双链。然后,杂化双链中的RNA被逆转录酶中有RNase活性的组分水解,被感染细胞内的RNase H也可水解RNA链。RNA分解后剩下的单链DNA再用做模板,由逆转录酶催化合成第二条DNA互补链。合成反应按照5’→3’延长的规律。已发现,病毒自身的tRNA可用作复制引物。按照这种方式,RNA病毒在细胞内复制成双链DNA的原病毒(provirus)。原病毒保留了RNA病毒全部遗传信息,并可在细胞内独立繁殖。
逆转录酶和逆转录现象的发现是分子生物学研究中的重大事件。中心法则认为,DNA的功能兼有遗传信息的传代和表达,因此DNA处于生命活动的中心位置。逆转录现象说明,至少在某些生物,RNA同样兼有遗传信息传代功能,这是对传统的中心法则的挑战。特别是,从逆转录病毒发现了癌基因;在基因工程操作上,还可用逆转录酶制备互补DNA(complementary DNA,cDNA),从中获取目的基因。
四、翻译
mRNA是细胞合成蛋白质的模板,其序列决定了编码蛋白质的氨基酸序列。在核糖体、tRNA和多种蛋白质因子参与下,按照mRNA模板的序列,顺序连接编码的蛋白质中各个氨基酸,形成肽链的过程称为翻译(translation)。
(一)原核细胞蛋白质合成
1.蛋白质合成体系
(1)信使RNA(mRNA):
mRNA是蛋白质生物合成的模板(见本节第一部分)。在20种氨基酸中,色氨酸和甲硫氨酸各有1个密码子,其余18种氨基酸均有两个或多个密码子。1种氨基酸具有2个或多个密码子这一现象,称为密码子的简并性(degeneracy)或冗余度(redundancy)。编码同一个氨基酸的两个或多个密码子中,一般第三位的碱基不同。
从最简单的病毒直到复杂的人类细胞,都使用差不多同一套遗传密码,只有少数例外。例如,线粒体有其自己的基因组。通常编码精氨酸的AGA或者AGG,在一些线粒体中是终止密码;而通常作为终止密码的UGA,在线粒体中编码色氨酸。各种生物体基本使用同一套遗传密码,只有少量例外,说明遗传密码具有普遍性,这也是所有生物从同一祖细胞进化假说的重要佐证。
每个密码子的阅读方向是5’→3’,相邻密码子之间没有核苷酸间隔。翻译从起始密码子开始,按顺序连续阅读,直到终止密码子为止。编码区上游的核苷酸序列称为5’非翻译区(5’-untranslated region,5’-UTR);编码区下游的核苷酸序列称为3’非翻译区(3’-untranslated region,3’-UTR)。原核细胞mRNA在起始密码子上游8~13nt处,具有一段保守序列5’-AGGAGGU-3’(或其部分),与核糖体和mRNA的正确结合有关,称为核糖体结合位点(ribosome binding site,RBS),又称SD序列(Shine-Dalgarno sequence,SD sequence)。
(2)核糖体(ribosome):
核糖体是rRNA与多种蛋白质组成的大分子复合物。原核生物核糖体的沉降系数为70S,分子量为2 750kD,含有50S大亚基和30S小亚基。大亚基由30余种蛋白质与23S和5S RNA组成;小亚基由20余种蛋白质与16S RNA组成。真核生物核糖体的沉降系数为80S,分子量为4 500kD,含有60S大亚基和40S小亚基。大亚基由约50种蛋白质及28S、5.8S和5S RNA组成;小亚基由30余种蛋白质和18S RNA组成。
细胞内蛋白质的合成在核糖体上进行。翻译过程中核糖体结合tRNA的部位称为A位和P位。核糖体能够结合mRNA、氨酰tRNA、起始因子、延伸因子及终止因子等,参与蛋白质生物合成。核糖体的转肽酶活性催化肽键形成。
核糖体开始在mRNA链上进行翻译并移动约80nt的距离后,另一个核糖体可在起始处开始另一轮翻译。这样,同一mRNA链上可有多个核糖体同时在进行翻译,每个核糖体相距至少约80nt。同一mRNA链上的多个核糖体称为多聚核糖体,其上的核糖体数目可达数十个,因此能同时合成多条肽链,提高mRNA的利用率和蛋白质生物合成速度。真核生物的多聚核糖体呈环状,也与提高蛋白质合成速度有关。
(3)转运RNA(tRNA):
tRNA分子呈三叶草样结构,具有茎、D环、反密码子环和TψC环等。位于茎部尾端的3’末端具有CCA序列。茎部对侧的反密码环上有反密码子,能特异地识别mRNA上互补的密码子。按照mRNA的序列,tRNA将氨基酸逐个携带进入mRNA-核糖体复合物,合成肽链。tRNA在蛋白质生物合成过程中起着连接物(adaptor)的作用。细菌中约有30~40种tRNA。一种氨基酸可由数种tRNA负责转运。
tRNA的反密码子通过碱基互补原则识别mRNA的密码子。反密码子的第一位碱基与mRNA密码子的第三位碱基配对时,不完全遵照碱基互补规律,当它们不严格互补时也能配对,因此一种反密码子可能识别几个密码子。原核生物中的起始tRNA(initiator tRNA)是结合甲酰甲硫氨酸(formylmethionine,fMet)的tRNA(fMet-tRNAfMet),fMet-tRNAfMet是由对fMet专一的氨酰tRNA合成酶催化形成的,能识别起始密码子AUG。
(4)起始因子、延伸因子、释放因子及氨酰tRNA合成酶
1)起始因子(initiation factor,IF):
IF参与蛋白质起始复合物的形成。原核生物有三种IF:IF1促使核糖体大小亚基分离;IF3可与30S亚基结合,防止未与mRNA结合的大亚基与其结合形成无活性的核糖体;IF2与GTP形成复合物,然后与30S小亚基结合并促进fMet-tRNAMetf与30S小亚基结合。
2)延伸因子(elongation factor,EF):
大肠杆菌有3种EF:EF-Tu与氨酰tRNA和GTP结合形成复合物EF-Tu/GTP/aa-tRNA,将氨酰tRNA转入A位;EF-Ts使EF-Tu/GDP再转变为EF-Tu/GTP(反应由GTP供能);EF-G是核糖体依赖性GTP酶(GTPase),并具有转位酶作用。
3)释放因子(release factor,RF):
RF识别mRNA上的终止密码子,终止肽链合成,并释放新合成的肽链。原核生物RF1和RF2负责识别终止密码子。RF1识别UAA和UAG,RF2识别UAA和UGA,RF3协助RF1和RF2与核糖体的结合。
4)氨酰tRNA合成酶(aminoacyl tRNA synthetase):
这种酶催化氨基酸与转运该种氨基酸的tRNA结合。每种氨基酸至少有一种氨酰tRNA合成酶。在Mg2+存在时,氨酰tRNA合成酶催化氨基酸与ATP反应,生成氨酰AMP,氨基酸被活化,并转移到tRNA分子上。氨酰tRNA合成酶还有校对作用,当错误的氨酰tRNA形成时,可使其水解。
2.蛋白质合成过程
翻译过程中,mRNA上密码子的阅读沿5’→3’方向进行,多肽链合成自氨基端开始。翻译过程可分为起始、延伸和终止三个阶段。
(1)起始:
IF1促使核糖体大小亚基分离。翻译开始时,IF3与游离的30S小亚基结合并阻止大亚基的再结合。IF2-GTP与30S小亚基结合。30S小亚基与mRNA的RBS位点结合,使AUG密码子处于肽链合成的起始部位。fMet-tRNAMetf与游离的核糖体小亚基结合,定位于起始密码子,形成30S起始复合物(30S initiation complex)。
IF2水解GTP,各IF释放。然后,50S大亚基与30S小亚基结合,形成70S起始复合物,fMet-tRNAMetf转至P位。
(2)延伸:
70S起始复合物中的fMet-tRNAMetf转至P位后,空出A位。mRNA第2个密码子对应的氨酰tRNA进入,翻译进入延伸阶段。延伸阶段是一系列氨酰tRNA到位、肽键合成及转位的过程,这一系列过程反复进行,称为延伸循环(elongation cycle)。
A位密码子对应的氨酰tRNA进入A位,称为交付(delivery)。氨酰tRNA先与EF-Tu/GTP结合,形成氨酰tRNA/EF-Tu/GTP复合物,随后进入A位。然后,GTP水解,EF-Tu/GDP从核糖体释放。
氨酰tRNA交付后,在肽酰转移酶(peptidyl transferase)催化下,已在P位上的甲酰甲硫氨酰基的羧基与A位氨基酸的α-氨基形成肽键。肽键形成的能量来自与tRNA结合的活化氨基酸。肽酰转移酶活性存在于核糖体50S大亚基中,肽酰转移酶活性中心的23S rRNA在催化肽键形成中起重要作用。
延伸因子EF-G(转位酶)水解GTP,提供能量,使P位上的tRNA从P位释放,mRNA与核糖体相对移动1个密码子的距离,A位上的肽酰tRNA转至P位。空出的A位上为mRNA分子上的第三个密码子,对应的氨酰tRNA可以到位。上述三个步骤(到位、肽键合成和转位)反复进行,使肽链不断延伸。
(3)终止:
翻译进行到终点,mRNA的终止密码子处于核糖体A位,氨酰tRNA不能再进入A位。释放因子识别终止密码子并进入A位,肽酰转移酶将P位上的肽链转给水分子,肽链离开核糖体。随后,核糖体与mRNA和tRNA分离,解离成大小亚基。
(二)真核细胞蛋白质合成
与原核细胞相比,真核细胞蛋白质合成过程有些不同,但其基本过程相似,也包括起始、延伸和终止三个阶段。原核细胞与真核细胞在起始阶段差别较大,真核起始因子(eukaryotic cinitiation factor,eIF)有十余种。
真核细胞mRNA与多种蛋白质结合为核蛋白颗粒。翻译起始时,mRNA需要松解,并释放出多余的蛋白质。起始tRNA(tRNAMeti)结合的是甲硫氨酸(Met),两者结合形成Met-tRNAMeti。核糖体40S小亚基首先与Met-tRNAMeti结合,然后再与mRNA结合,形成80S Met-tRNAMeti-mRNA起始复合物(80S initiation complex)。由于真核生物mRNA没有SD序列那样的特殊RBS位点,起始复合物先结合在mRNA 5’末端帽子处,然后沿5’→3’方向移动扫描,寻找起始密码子AUG。第一个出现的AUG不一定就是起始位点,AUG及其上下游的核苷酸序列(Kozak序列,5’-ACCAUGG-3’)对于确定其是否起始位点很重要。当找到正确的起始位点且Met-tRNAMeti处于A位后,便形成了40S起始复合物。然后,核糖体60S大亚基与其结合,形成80S起始复合物。
真核生物肽链延伸过程与原核生物相似,但真核延伸因子(eukaryotic elongation factor,eEF)eEF与原核生物不同。真核生物eEF-1α相当于原核细胞的EF-Tu,eEf-1βγ相当于EF-Ts,eEF-2相当于EF-G。真核生物只有1种释放因子eRF,识别所有3种密码子(UAA、UAG与UGA)。真核生物的多聚核糖体呈环状,其5’和3’末端借poly(A)结合蛋白1(PABP1)、eIF4G和eIF4E连在一起。当一个核糖体到达终止位点,结束翻译后,离开mRNA的3’末端,解离为亚基,然后可以迅速集结到5’起始端,开始新一轮翻译。多聚核糖体的环状结构使核糖体快速再循环,保证蛋白质翻译的高效率。
2019年,我国肇涛澜等利用新型poly(A)尾巴高通量测序(high-throughput sequencing)技术,揭示了拟南芥poly(A)尾巴介导的全新转录后调控机制,即在poly(A)尾巴中散在分布的鸟苷酸(G)可通过抑制与poly(A)结合蛋白(PABP)的相互作用降低mRNA的翻译效率。
(三)蛋白质折叠和翻译后修饰
新合成的多肽链经过折叠(folding)形成特定的空间结构,以决定每种蛋白质的功能。蛋白质三维结构的信息存在其氨基酸序列中,但其折叠过程也有其他蛋白质参与,如分子伴侣(molecular chaperone)。每个蛋白质如何折叠成各自特有的三维结构,是一个十分复杂的问题,是蛋白质研究中的重大课题。
有些蛋白质翻译后在特定部位进行裂解(如一些无活性的酶原经有限蛋白酶解后激活为有活性的酶),或者在特定的氨基酸上进行翻译后修饰(post-translational modification),如糖基化、甲基化和乙酰基化等,然后才成为一个完整的功能蛋白质。胶原蛋白中的羟脯氨酸是通过脯氨酸羟基化形成的。有些蛋白质分子含有共价相连的脂质,如棕榈酰基、豆蔻酰基和法尼基等。