- 分子病理学(第2版)
- 李玉林主编
- 8495字
- 2025-03-14 20:07:41
第一节 生物体的遗传物质核酸
核酸(nucleic acid)是一切生物体的遗传物质。任何物种的生物学特性都是以遗传编码的方式贮存在核酸分子内。核酸分为脱氧核糖核酸(deoxyribonucleic acid,DNA)和核糖核酸(ribonucleic acid,RNA)两类。DNA主要存在于细胞核的染色质中,是贮存和复制全部遗传信息的分子;RNA主要分布于细胞质中,承担遗传信息的转录及蛋白质生物合成等重要的功能。
一、核苷酸
核苷酸(nucleotide,nt)是构成核酸的基本单位。但应指出,核苷酸还以其他衍生物的形式参与各种物质代谢的调控和蛋白质功能的调节。多个核苷酸组成核苷酸链,即核酸,后者又称为多聚核苷酸。所有的核苷酸均由3种基本成分组成,即碱基、戊糖和磷酸。
(一)碱基
碱基(base)分为嘌呤碱(purine base)和嘧啶碱(pyrimidine base)两种,为含氮杂环化合物。前者包括腺嘌呤(adenine,A)和鸟嘌呤(guanine,G)两种,为DNA和RNA共有;后者包括胞嘧啶(cytosine,C)、胸腺嘧啶(thymine,T)和尿嘧啶(uracil,U)三种,其中C为DNA和RNA共有,T只存在于DNA中,U只存在于RNA中。除此之外,少数噬菌体的DNA含有U,有的DNA还含有上述碱基的衍生物;某些RNA中含有T。
(二)戊糖
DNA和RNA所含的戊糖(pentose)分别为脱氧核糖(deoxyribose)和核糖(ribose)。RNA分子中的戊糖C-2上连接1个羟基(OH),易于自发水解,不及DNA分子稳定。
碱基与脱氧核糖或核糖通过糖苷键(glycosidic bond)连接形成脱氧核苷(deoxynucleoside)或核苷(nucleoside),其中嘌呤类(脱氧)核苷由嘌呤碱N-9与(脱氧)核糖C-1形成糖苷键,嘧啶类(脱氧)核苷由嘧啶碱N-1与(脱氧)核糖C-1形成糖苷键。有关核苷的命名法见表1-1。
(三)磷酸
磷酸(phosphoric acid)与核苷之中的戊糖羟基以酯键(ester bond)结合为核苷酸。核苷酸之间通过3’,5’-磷酸二酯键连接成为多核苷酸(图1-1),即为核酸。单核苷酸或脱氧单核苷酸分子中的磷酸主要连接在5’位上,按照所加的磷酸数目分别称为(脱氧)核苷一磷酸、(脱氧)核苷二磷酸和(脱氧)核苷三磷酸,并分别标记为α、β和γ。有关核苷、核苷酸命名法见表1-1。
表1-1 核苷和核苷酸组分命名


图1-1 DNA一级结构的多核苷酸链片段
A.核苷酸的连接方式;B.DNA的书写方式举例
二、DNA
1953年,Watson和Crick两位科学家发现DNA的反向平行双螺旋分子构象,从而开创了分子生物学的新纪元,使许多遗传现象从分子水平上得到充分和合理的解决。但是,随着科学技术的发展,人们又发现DNA双螺旋结构(double helix structure)并不是完全规整的,其构象随脱氧核苷酸序列的不同而在一定范围内发生变化,并且还存在其他的结构。DNA结构具有多样性,互相发生转变,处于动态中,这是发挥生物学功能所必需的。DNA是基因的载体,基因是具有特定生理功能的DNA序列。2001年初,人类基因组草图首次发表,令人吃惊的是人的基因组包含的35 000个基因只占不足2%的DNA。因此,进一步深入探讨DNA的其他序列及其相关DNA的结构和功能有其更重要的意义。
(一)DNA的一级结构
DNA的一级结构(primary structure)是指其分子中脱氧单核苷酸的连接方式和排列顺序。在DNA分子中,脱氧核糖和磷酸的组成相同,碱基不同,所以碱基的排列顺序就是DNA的一级结构。单链DNA(single-stranded DNA,ssDNA)的大小以碱基数量表示,双链DNA以碱基对(base pair,bp)数量表示。一般,真核生物DNA分子是线性的,而细菌和一些噬菌体DNA分子是环形的。组成DNA分子的4种脱氧核苷酸可任意排列,形成各种特异的DNA片段,或称DNA链。DNA链有两个不同的末端,戊糖5’位带有游离磷酸基端称5’末端,3’位带有游离羟基端称3’末端,其方向是以5’→3’为正向。对于每一物种,DNA分子有其特异的碱基组成。在真核细胞中,某些核苷酸序列大量重复出现,也称重复序列(repetitive sequence),在原核细胞中几乎不存在。
双螺旋结构(double helix structure)是DNA分子最多见的一种二级结构形式,也有其他形式的异常结构。一些小分子病毒DNA是单链环状结构。核酸分子中如出现二重对称性序列(碱基序列的反向重复),也就是回文序列(palindromic sequence),具有在核酸单链内形成茎-环结构(stem-loop structure),又称发夹结构(hairpin structure),或在双链中形成十字架结构(cruciform structure)的倾向。俄罗斯Cheloshkina和Poptsova二位研究者在真核细胞DNA复制、转录和重组的起始及调节区的许多位点发现有三股螺旋结构,即铰链DNA(hinged DNA,H-DNA)。利用机器学习技术鉴别出两种最常见的DNA茎-环结构和四联体(quadruplex),而这种基因突变可能会增加癌症风险。
美国Hoshika等将4种合成(脱氧)核苷酸与4种天然存在于核酸中的(脱氧)核苷酸相结合,构建出由8个(脱氧)核苷酸组成的DNA分子(Hachimoji分子),而且这些DNA分子都能够转录为RNA。这些Hachimoji分子的信息存储容量是天然核酸的2倍。研究者将已计算出的由8种新的嘌呤碱基/嘧啶碱基类型结构形成的总共4个额外的通过氢键连接在一起的碱基对成为可能,使整合到DNA中的(脱氧)核苷酸数量增加1倍,并且维持可预测的化学性质。
(二)DNA的二级结构
1950年,Chargaff发现来源于任何生物的DNA分子中存在一个普遍的规律,即腺嘌呤(A)与胸腺嘧啶(T)及鸟嘌呤(G)与胞嘧啶(C)数量相等,而且A+G=T+C。然而,美国生物合成领域专家Romesberg等首次合成X-Y碱基对和相应的氨基酸,创造了含ATGCXY六种碱基的生命体。这一成果超越自然法则,打破了自然界的碱基束缚,构成了自然界中不存在的全新生命体。
1953年,Watson和Crick根据前人的工作基础和DNA的X射线衍射图谱提出了DNA分子双螺旋结构模型(图1-2),即为DNA分子的二级结构(secondary structure)。

图1-2 DNA双螺旋结构示意图
1.DNA分子双螺旋结构特点
DNA分子由两条反向平行的多聚脱氧核苷酸链围绕同一中心轴相互缠绕形成右手螺旋结构;磷酸和脱氧核糖位于双螺旋外侧,碱基位于内侧,彼此通过3’,5’-磷酸二酯键连接,形成DNA分子主链,其碱平面相互平行叠加,与中心轴垂直。
DNA分子在不同环境中,尤其在不同湿度中形成不同的立体构象,即A型存在于低湿度(高盐)环境,B型存在于高湿度(低盐)环境,B型家族中还有C、D和E等亚型。Watson和Crick提出的DNA双螺旋结构为B-DNA,是DNA在溶液中最常见的构象。当环境的相对湿度降至75%时,B-DNA可转为A-DNA构象,也为右手螺旋。
1979年,Rich等通过X射线晶体衍射法发现一种左手双螺旋结构的DNA,其分子骨架呈锯齿形(zigzag),因而命名为Z-DNA,也是由两条反向平行的多聚脱氧核苷酸组成,呈左手螺旋。脱氧胞苷中的脱氧核糖是C2’内型,碱基为反式构象;脱氧鸟苷中的脱氧核糖是C3’内型,碱基为顺式构象。Z-DNA中的碱基对靠近螺旋的外表面,致使螺旋仅有一条小沟,较深,含有较高的负电荷密度。在高盐和高浓度乙醇中有利于Z-DNA构象的存在;嘌呤碱和嘧啶碱的交替序列,特别是GC,有利于Z-DNA形成;碱基侧链的修饰可促进Z-DNA生成和稳定存在。Z-DNA普遍存在于真核细胞和原核细胞基因组中,聚精氨酸有利于GC向Z-DNA转变(图1-3)。

图1-3 三种类型DNA双螺旋结构
2.凝缩蛋白相互作用将DNA折叠成
Z环结构2018年,荷兰的Kim等实时地揭示出凝缩蛋白(condensin)在DNA上挤压出一个环形结构。近期,Kim等发现了一种环形结构,证实凝缩蛋白彼此间相互作用,将DNA折叠成锯齿形结构,即Z环(Z loop),DNA折叠成字母Z的形式。凝缩蛋白所属的染色体结构维持蛋白(structural maintenance of chromosome,SMC),存在的功能缺陷与阿姆斯特丹型侏儒征[Cornelia de Lange syndrome,也称德朗热综合征(Cornelia de Lange syndrome)]等遗传性疾病有关。在细胞分裂过程中,凝缩蛋白在组装染色体的过程中也是至关重要的;这个过程中出现的错误会导致癌症。
3.DNA的G四联体和i-基元结构
就在Watson和Crick发现DNA双螺旋分子构象后不久,一些科学家发现了富含GC的DNA区域,具有G和G配对及C和C配对现象,前者形成了G四联体(G-quadruplex),后者构成了i-基元(i-motif)的“DNA扭结”。大多数情况下,i-基元形成于细胞周期的某个特定时刻,可能与基因的打开和关闭有关,而且还可能会影响基因是否被“读取”。根据DNA双螺旋结构的碱基互补配对原则,如果一条链能形成G四联体,只要条件合适,其对应链理论上可以形成i-基元。与人类基因组对比,发现在人体基因组内至少有30万个DNA片段可以形成G四联体和i-基元序列。其中,40%基因的调控区含有能形成G四联体和i-基元的DNA序列,癌基因的启动子区域尤甚。研究者证实,在特定的条件下,Rb、RET、VEGF、c-Myc和Bcl-2等癌基因的启动子区域可以形成G四联体和i-基元,导致癌症的形成或发展。此外,端粒DNA也有形成G四联体和i-基元的能力,这会阻碍端粒(telomere)的延长,加速细胞衰老。澳大利亚Dinger和Christ科研团队应用特异性结合i-基元的荧光抗体,观察到i-基元结构基本分布在人体的细胞核里,可能通过形成和展开而控制基因的开和关;他们首次在人体内观察到能够快速响应酸碱度变化的i-基元结构,也初步证明其分布于很多癌基因及端粒的调控区,暗示其结构与癌症和衰老有一定的联系,而且可能与细胞周围的酸碱性动态变化有关。
(三)DNA的超螺旋结构
双螺旋DNA链进一步扭曲盘旋形成超螺旋(supercoil)结构,也是DNA的三级结构(tertiary structure)。在原核生物小病毒和细菌质粒的DNA分子常呈环状,为一个密闭的结构。在真核生物细胞的DNA分子是线状的,但由于分子大,经过反复盘绕折叠,与蛋白质结合,使分子末端固定,形成许多相当于环状的结构,这些环状DNA是形成超螺旋结构的基础。值得注意的是,美国Koche等发现,染色体外环状DNA,可能会破坏遗传信息,促进癌症发生。DNA测序结果表明,从染色体中分离的特定DNA片段,在形成环状DNA的过程或发生于重新整合到染色体不同位置之前,如其诱发原始遗传信息序列被干扰,就可能会导致癌症发生。
根据DNA双螺旋的方向,超螺旋DNA分为负超螺旋(negative supercoil)和正超螺旋(positive supercoil)两种。DNA负超螺旋的方向与双螺旋方向相反,为左手超螺旋,是生物体中最常见的超螺旋形式,可使其分子通过调整双螺旋本身的结构减少张力,即减少每个碱基对的旋转,放松两条链的盘绕,也称为盘绕不足(underwound)DNA。DNA正超螺旋方向与双螺旋方向一致,为右手超螺旋,可使其螺旋更加紧密,也称为过分盘绕(overwound)DNA。
超螺旋DNA结构紧密,分子体积变小,有利于包装在细胞内。人类细胞核染色体含有大约3×109bp,其伸展长度为7mm,远非细胞核(人类细胞核平均直径为5μm)所能容纳的。但是,在染色体中线状DNA双链以组蛋白为核心盘绕形成核小体(nucleosome),许多核小体以串珠排列,再经过反复盘绕折叠等一系列的组装,通过2 000个左右大环将DNA浓缩30万倍于染色体中。超螺旋结构可影响双螺旋DNA的解旋能力,进一步影响DNA分子与其他分子之间的相互作用。超螺旋DNA可转变为松驰型DNA,即通过拓扑异构酶(topoisomerase)将双链中的一条链切开,使链的末端沿着松解超螺旋的方向旋转后,再接合接头,即成为松驰型DNA。
(四)DNA显微镜
美国Weinstein等开发的DNA显微镜是一种全新的细胞可视化技术,利用化学手段获取细胞内部信息,绘制的图像反映出细胞内生物分子的基因序列和相对位置的情况。
三、RNA
长期以来,RNA分子被认为是细胞内传递遗传信息的使者,其实远非如此。生物体内RNA分子种类繁多,其生物学功能复杂。现已发现,短链的RNA分子在生物体中的重要作用,其编码储存在DNA分子序列中;RNA分子还具有酶的催化作用,因而动摇了过去人们认为生命的最初形式是建立在蛋白质基础上的学说,RNA很可能要优先于蛋白质。
(一)RNA结构及其分类
1.RNA结构
RNA分子结构与DNA分子有许多类似之处,但也存在许多差别。RNA分子包含的戊糖是核糖(DNA包含脱氧核糖),即在戊糖的2’位上是羟基(—OH),易于水解。RNA分子的碱基主要包含腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和尿嘧啶(U),或存在少量的多种稀有碱基或核苷;DNA分子中由胸腺嘧啶(T)代替U,除个别DNA分子外一般不含有稀有碱基或核苷。RNA分子通常以单链的形式存在,不具有互补碱基的比例,即A与U或G与C的数目不相等。RNA分子的单链可存在部分折叠而形成局部双螺旋结构,其构象为A型双螺旋,这些区域除遵循A与U及G与C配对原则外,还存在G和U配对。RNA分子中的双链区主要起稳定结构的作用,而单链区在RNA与RNA或与蛋白质相互作用中起重要作用。RNA分子的二级结构是存在于同一平面的结构,在此基础上可形成立体的三级结构。
2.RNA分类
在原核和真核细胞中参与基因表达的RNA分子主要为信使RNA(messenger RNA,mRNA)、转运RNA(transfer RNA,tRNA)和核糖体RNA(ribosomal RNA,rRNA)三类,分别约占总RNA的5%、15%和80%。在真核生物中,这三类RNA在其细胞核内转录成各自前体,再加工成为相应成熟的RNA,进入细胞质参与遗传信息的传递和表达。mRNA是蛋白质生物合成的模板,tRNA在蛋白质合成中作为氨基酸的转运工具,rRNA是蛋白质合成场所核糖体的重要组成部分。这些RNA分工合作,精细地完成蛋白质的生物合成。
另外,具有调节作用的反义RNA(antisense RNA)在生命科学中有重要的作用。在真核的细胞中还有少量其他的RNA,为细胞核RNA(nuclear RNA,nRNA)。其中,核内异质RNA(heterogeneous nuclear RNA,hnRNA;又称核内不均一RNA)和45S RNA分别是mRNA和某些rRNA、tRNA的前体。
在真核细胞转录产物中,除了编码RNA(coding RNA),即mRNA外,还有一类非编码RNA(non-coding RNA,ncRNA)。人类基因组序列约5%~10%被稳定转录,其中绝大多数为非编码转录物,分为组成性非编码RNA(constitutive non-coding RNA,cncRNA)和调控性非编码RNA(regulatory non-coding RNA,rncRNA)。
对于cncRNA,其丰度基本恒定,包括tRNA、rRNA、核酶(ribozyme;又称催化小RNA)、端粒RNA(telomere RNA;在保护端粒的过程中起重要作用)和端粒酶RNA(telomerase RNA,人端粒酶由450nt组成,向染色体末端添加TTAGGG序列,维持端粒的长度)、核小RNA(small nuclear RNA,snRNA)、核仁小RNA(small nucleolar RNA,snoRNA)及胞质小RNA(small cytoplasmic RNA,scRNA)。
rncRNA的丰度随外界环境和细胞形状而发生变化,在基因表达过程中发挥重要的调控作用,包括小非编码RNA(small non-coding RNA,sncRNA)、长非编码RNA(long non-coding RNA,lncRNA)和环状RNA(circular RNA,circRNA),sncRNA包括干扰小RNA(small interfering RNA,siRNA)、微RNA(microRNA,miRNA)和Piwi相互作用RNA(Piwi-interacting RNA,piRNA)等。
(二)信使RNA(mRNA)
细胞内mRNA含量较少,但其种类繁多,哺乳动物细胞中可达几万种。mRNA分子量大小相差悬殊,一般为几百至几万核苷酸连接的长链,分子量约为100~2 000kD,沉降系数约为8~30S。mRNA除了含有4种基本的核苷酸外,在原核细胞不含有稀少的核苷酸,在真核细胞中也含量甚微。mRNA代谢快,不稳定。
1.帽子结构
真核和原核细胞mRNA的一级结构有相当大的区别(图1-4)。真核细胞mRNA多聚核苷酸链具有与原核细胞mRNA不同的独特结构,即5’末端有一个以7-甲基鸟嘌呤核苷5’,5’-三磷酸为主体的“帽子”结构(m7G5’ppp5’Nm),3’末端大多有一个由30~300个腺苷酸连续的多腺苷酸[polyadenylic acid,poly(A)]尾巴。在帽子和尾巴之间依次为5’非翻译区(5’-untranslated region,5’-UTR)、翻译区(也称编码区)和3’非翻译区(3’-untranslated region,3’-UTR)。

图1-4 (上图)原核mRNA(噬菌体MS2)和(下图)真核mRNA(哺乳动物)一级结构模式
帽子结构是转录开始后不久(<15nt)由mRNA鸟苷酰转移酶在hnRNA 5’末端加G,使5’末端与5’末端对接,中间有3个磷酸基团;5’末端加G后经过一系列甲基化(methylation)形成帽子结构(图1-5)。帽子结构具有保护5’末端mRNA免受核酸酶的降解,并能够被蛋白质的起始因子所识别,从而促进蛋白质合成。在poly(A)尾巴结合一特定的蛋白质,称为poly(A)结合蛋白[Poly(A)-binding protein,PABP],每10~20个碱基结合1个PABP。PABP具有保护mRNA的作用,防止其降解。poly(A)与PABP还可共同对mRNA翻译的起始产生影响。因此,poly(A)尾巴是mRNA由细胞核进入细胞质所必需的序列,并且提高了mRNA在细胞质中的稳定性。

图1-5 真核细胞mRNA的帽子结构
2.poly(A)尾巴
RNA poly(A)尾巴是成熟的mRNA和lncRNA的重要组成部分,对RNA稳定性和翻译起着重要的调控作用。2019年,我国Liu等建立了一种PAIso-seq(poly(A)inclusive RNA isoform sequencing)的高灵敏度高准确度的RNA poly(A)尾巴检测技术。通过PAIso-seq发现,转录组中存在数千碱基(kilobase,kb)长的poly(A)尾巴。全长RNA信息可以探索RNA可变剪切与poly(A)尾巴两种重要RNA转录后调控之间的关联。更有意义的是,通过PAIso-seq发现,小鼠生发泡(germinal vesicle,GV)期卵中有超过17%的mRNA poly(A)尾巴主体区域存在广泛的U、G和C碱基的掺入。另外,在拟南芥、线虫和人细胞系中也发现了poly(A)尾巴的主体中含有非A碱基。
3.mRNA释放区
原核和真核细胞mRNA的释放区是蛋白质生物合成模板的作用部位。原核细胞mRNA都是多顺反子(polycistron)或多作用子型信使模板,即1个mRNA分子带有几种蛋白质的遗传信息,可为几种蛋白质编码的操纵子(operon)的转录产物或自身复制品,合成几种蛋白质。真核细胞mRNA与此相反,都是单顺反子(monocistron)或单作用子型信使模板,即1个mRNA分子只能合成一种蛋白质。在原核细胞中,mRNA与相应的基因是共线的(co-linear),转录与翻译在同一空间进行,并且两者偶联。在真核细胞中,mRNA与相应的基因不是共线的,其转录产物是hnRNA,经核内剪接后成为成熟的mRNA,再转运到细胞质中进行翻译。
4.遗传密码(genetic code)
mRNA作为蛋白质生物合成的模板,可将DNA分子中以核苷酸序列形式存在的遗传信息翻译为蛋白质生物合成时氨基酸排列顺序,使生物遗传性状得到表达。mRNA根据碱基互补规律从DNA分子中拷贝遗传信息,再根据三联体密码将遗传信息传递给正在合成的蛋白质。三联体密码即为mRNA分子中每3个核苷酸组成为1个信息单位,称为密码子(codon),代表一种特定的氨基酸。Nirenberg在20世纪60年代经过数年潜心的研究,编制一套适用于所有生物体的遗传密码表(表1-2)。表中的64个密码子中的61个对应20种氨基酸,每个密码子代表1种氨基酸,但1种氨基酸被1个或几个(最多为6个)密码子所代表。能够代表1种氨基酸的多个密码子称为同义密码子(synonymous codon),或称为简并密码子(degenerate codon)。在真核细胞mRNA中,密码子AUG在5’末端起始处既可代表甲硫氨酸,又可作为起始密码子(initiation codon),起到蛋白质合成的起始信号作用。在原核细胞mRNA中,密码子AUG和GUG在5’末端起始处只作为起始密码子,起到蛋白质合成的起始信号作用,不代表甲硫氨酸和缬氨酸,而代表甲酰甲硫氨酸。UAA、UAG和UGA不作为任何氨基酸编码,而是作为翻译的终止符号,称为终止密码子(termination codon)或无义密码子(nonsense codon)。在某些生物中,一些mRNA密码子不起终止密码子的作用或不代表某种氨基酸。另外,真核细胞hnRNA的释放区内含有一段或数段无编码或翻译功能的核苷酸序列,这些片段称为内含子(intron),经过加工剪接内含子被去除,使成熟mRNA翻译区只含有外显子(exon)。
表1-2 遗传密码表

长期以来,内含子的非编码DNA片段通常被认为是垃圾片段而在转录和翻译之间从它们的原始mRNA转录物序列中被移除。2019年,美国Morgan等和Parenteau等均揭示很多内含子(至少在酵母中)在剪接后长时间地停留在细胞中,并且在应激条件下调节细胞生长。
另外,值得注意的是,捷克Žihala和Eliáš二位研究者对藻类和植物的两项研究结果发现了遗传密码的大量“变异”现象,因此有必要对整个生命进化历程中遗传密码的差异建立更深的认识。否则,从DNA序列推断蛋白质序列时若出现编码不正确的情况,可能会导致蛋白质序列预测结果的不准确。
所有原核细胞和真核细胞mRNA分子中都存在无编码的非翻译区。这些非翻译区的起始处都是终止密码子,可以保证蛋白质在翻译过程中按时停止,也可与核糖体的小亚基结合而构成mRNA上的启动部位,并有许多种核苷酸序列已被确定。真核细胞mRNA 5’末端的帽子和3’末端poly(A)尾巴也包括在非翻译区之中。mRNA的二级结构有许多处通过碱基配对自身折叠,形成发夹式结构,但不规律,在转录和翻译中起到调节作用。mRNA的二级结构可进一步折叠或卷曲,使其某些部位生成许多新的氢键,产生更多的空间联系,形成更加紧密和更加稳定的三级结构。
(三)核糖体RNA(rRNA)
rRNA是细胞内含量最多的一种RNA。各种rRNA分子的链长相差非常大。rRNA分子结构较为稳定,碱基修饰成分少。在细胞质中,rRNA与多种小蛋白质分子结合为核糖体并在蛋白质生物合成中执行“装配机”的功能。在原核和真核细胞中核糖体数量差别较大。各种来源的核糖体都由大亚基和小亚基构成,小亚基负责对序列特异的识别,大亚基负责对氨基酸及tRNA的携带。每种亚基都含有1~3种rRNA分子和多种小蛋白质分子,其含量rRNA组分高于蛋白质,特别是原核细胞rRNA是蛋白质的2倍。大小亚基可根据功能的需要随时相互结合或解离,但Mg2+存在与否是两个亚基相互结合或解离的重要条件。在蛋白质合成过程中,多个核糖体可与1个分子mRNA串联成为多聚核糖体(polyribosome)。
在rRNA的一级结构中,其修饰碱基的含量比tRNA少得多,而且原核细胞rRNA分子链的修饰度又远低于真核细胞rRNA分子链,但存在甲基化核苷,有时可出现在相当保守的区域内。rRNA中有非配对的单链区和配对的双链区相间排列,组成茎-环、突环、内部环、多分支环及假结等二级结构(图1-6),也无规律性。各种大小的rRNA可在特定的位点与蛋白质结合,这些位点都有一定的二级结构,通常是一些带有碱基突出部分的发夹结构,并且rRNA的构象决定某些蛋白质的结合位点是否存在。核糖体组装开始于一组蛋白质与rRNA发生反应,使rRNA结构折叠,然后允许另一组蛋白质继续加入。在大肠杆菌5S rRNA中,除参与形成二级结构的氢键外,还有维持三级结构的氢键,将整个分子折叠成“Y”型。对于rRNA的构象,不是固定不变的,可在蛋白质合成过程中随mRNA或tRNA的结合及大小亚基组装而发生变化。

图1-6 16S核糖体RNA(rRNA)的二级结构
图中小圆点代表自5’→3’的200个核苷酸,3’末端的黑块代表与mRNA中SD序列相结合的部位。
rRNA具有催化活性。某些低等真核生物的细胞核和线粒体rRNA前体在成熟过程中能自我剪接,不需蛋白酶的参与。rRNA在翻译过程中,16S rRNA 3’末端一段富含嘧啶碱基的保守序列,与mRNA起始密码ACG之前的一段富含嘌呤碱序列可直接互补;16S rRNA的另一特定区域,在核糖体的氨酰位(aminoacyl site,A site;简称A位)和肽酰位(peptidyl site,P site;简称P位)点上均可与tRNA分子的反密码子(anticodon,即mRNA密码子识别位点的3个氨基酸序列)区域发生直接作用。核糖体的大小亚基间的相互作用也与16S和23S rRNA有关。大亚基rRNA具有肽酰转移酶活性,而其蛋白质组分具有增强rRNA活性及维持核糖体结构的作用。
(四)转运RNA(tRNA)
tRNA分子量较小,约为23~31kD,沉降系数约为4S,又称为4S tRNA。通常,tRNA以游离形式或与氨基酸结合为氨酰tRNA形式存在,含稀有碱基或稀有核苷较多,其量可高达5%~20%。tRNA种类较多,如包括起始tRNA(特异地识别mRNA模板上起始密码子)、延伸tRNA(除了特异地识别起始密码子以外的密码子)、同工tRNA(代表一种氨基酸的多个tRNA)和校正tRNA(分为保留校正及无义突变和错义突变校正)等。tRNA能够形成严紧的二级和三级结构,其分子较为稳定。
tRNA在细胞核内生成无活性的前体,经加工修饰为成熟的tRNA,进入细胞质发挥其功能。在蛋白质生物合成中,tRNA能够特异地将细胞质中的氨基酸转运到与mRNA结合的核糖体或多聚核糖体上,并与mRNA分子中的密码子互补结合,从而准确地供应蛋白质生成所需的各种氨基酸原料。在这一过程中,首先tRNA分子的氨基酸连接位点,即3’末端的戊糖3’-OH通过酯键与氨基酸的羧基端连接;然后,tRNA上的反密码子与mRNA分子上的密码子互补配对,使氨基酸与mRNA所携带的遗传信息相对应。tRNA还有其他的生物学功能,如作为病毒逆转录引物参与许多物质的合成、校正mRNA的突变、转移氨基酸的非核糖体及调节某些酶促反应等。
tRNA一级结构的核苷酸链较短,在73~94nt范围内。tRNA 3’末端有一CpCpAOH顺序,活化的氨基酸连接于其中腺苷酸的3’-OH上;5’末端是1个被磷酸化(phosphorylation)的残基,通常为磷酸鸟嘌呤(pG)。一般,同工tRNA的核苷酸顺序较接近,而非同工tRNA的核苷酸顺序相差较大。tRNA分子中的许多核苷酸保守,其中一些恒定不变;另一些为半恒定,即限定在嘌呤碱或嘧啶碱范围内。tRNA有60多种修饰类型,在所有RNA分子中修饰度最高,广泛地发生在分子的各个部分,从单纯的甲基化到嘌呤环的重建。这些修饰增加了tRNA结构的多样性,可执行不同种生物学功能。在tRNA中,约50%的碱基可自身折叠而形成局部双螺旋臂样结构,以及由单链形成的环。绝大多数tRNA的二级结构是三叶草形(图1-7),含有4条臂和4个环。
tRNA的三级结构是一个倒置的“L”字母形状(图1-8),两个端点分别是氨基酸接受臂的3’接收端和反密码子环,转角处由D臂、DHU环和TψC环构成。在L型三级结构中,几乎所有的tRNA立体构象出现碱基堆积或部分堆积,并且二级结构中某些原单链的核苷酸之间通过三级氢键形成多个碱基对或碱基三联体,这些均对三级结构的生成和稳定起重要的作用。

图1-7 酵母转运RNA(tRNA)三叶草形二级结构

图1-8 转运RNA(tRNA)的三级结构
(五)反义RNA
20世纪80年代,在原核生物中发现一些调节基因,能够与特异的mRNA序列互补配对,阻断翻译过程,并能选择性关闭基因。这种在DNA复制、mRNA转录和蛋白质翻译中起到调节作用的RNA称为反义RNA,或称为调节RNA和mRNA干扰互补RNA(mRNA interfering complementary RNA,micRNA)。
反义RNA为单链RNA,分子量不大,由一个或多个稳定的茎和环结构组成。这种特殊的、类似发夹的结构易与mRNA形成互补,并且茎结构对环结构起到稳定和微调作用。环结构是mRNA靶序列发生作用的功能区,易于突变,这对反义RNA的调节作用具有十分重要的意义。反义RNA与调控蛋白质不同,无别构性,不会受到其他小分子的影响而改变其自身对mRNA靶序列的识别能力。
反义RNA可与引物RNA互补,抑制DNA的复制;也可与mRNA 5’末端互补,阻断RNA转录。在翻译水平上,反义RNA可与mRNA的某些部位互补,抑制蛋白质翻译;另外,与mRNA非翻译区互补,改变mRNA构象,阻止与核糖体结合,间接抑制蛋白质翻译。反义RNA与mRNA结合,可发生在胞核及胞质中。在胞核中,反义RNA会干扰mRNA的加帽和加poly(A)及剪接和加工过程,并与mRNA形成的杂交体不能从胞核向胞质中转运。在胞质中,反义RNA与mRNA形成的杂交体,抑制翻译过程,但其杂交体不稳定,易被核酸酶降解。
在真核细胞中,反义RNA调节基因表达,并且可用化学法或酶法人工合成反义RNA,或用重组DNA技术从反义表达载体中产生反义RNA。反义RNA现已作为调节翻译过程和基因表达的有效手段和方法。
(六)核酶
20世纪80年代,Cech等发现原生动物四膜虫(tetrahymena)26S rRNA前体在成熟过程中通过剪接反应除去自身分子间插序列(intervening sequence,IVS)。与此同时,Altman等发现核糖核酸酶P(ribonuclease P,RNase P)中的RNA组分(M1 RNA)能够单独催化tRNA 5’前导序列的切除。由此,证实RNA具有催化活性,Cech将其命名为ribozyme,即核酶,或称酶RNA和催化小RNA等。
核酶(ribozyme)有几十种,其分子量相差较大,含有十几个到数百个核苷酸,在其中存在催化活性序列或活性中心。核酶的催化作用是特异的,但催化效率较蛋白酶低,又不稳定。核酶可进行自体催化和异体催化,前者以自身RNA为作用底物进行自我催化,包括许多RNA前体的加工、成熟;后者是以其他化合物为作用底物对异体RNA或多糖、DNA及氨基酸酶等进行催化。根据核酶的作用机制不同,可分为剪切型(cleavage)和剪接型(splicing)两类,前者相当于核酸内切酶的作用,后者具有核酸内切酶和连接酶的活性。
剪切型核酶又分为两类,其中之一是剪切反应发生在RNA前体的成熟过程中,另一类是剪切反应发生在某些小环状病原体RNA的复制过程中。剪接型核酶发生的剪接反应,包括剪切反应和连接反应,首先是5’剪接位点的切开,然后是3’剪接位点切开;并且,在剪接点附近都含有保守的碱基序列。
(七)三种小分子RNA
在真核细胞的胞核和胞质中有许多小于300nt的小分子RNA,包括核小RNA(snRNA)和胞质小RNA(scRNA),性质十分稳定,一般以结合蛋白质形成核糖核蛋白颗粒(ribonucleoprotein particle)的形式存在。
1.snRNA
有10余种snRNA,其中有多种富含尿苷酸,称为U-snRNA。snRNA序列高度保守,也有类似tRNA的茎-环状二级结构。除了U6-snRNA的5’末端为γ-甲基三磷酸,其余U-snRNA的5’末端均有帽子结构。细胞内的snRNA是真核生物转录后加工过程中RNA剪接体(spliceosome)的主要成分,其长度在哺乳动物中约为100~215nt。snRNA一直存在于细胞核中,与40种左右的核蛋白共同组成RNA剪接体,在RNA转录后加工及组蛋白mRNA 3’末端的成熟过程中起重要作用。
2.scRNA
scRNA序列也相当保守,在分泌蛋白和膜蛋白跨膜转运中起重要作用。7S RNA(有305个碱基)和6个分子蛋白质组成的scRNA为信号识别颗粒,可与新合成的分泌蛋白的前导肽结合,同时与内质网膜上的受体蛋白结合。这样,7S RNA引导新合成的蛋白质进行加工,并通过高尔基体分泌出细胞。
3.snoRNA
snoRNA定位于核仁,其长度在60~300nt不等,能与核仁核糖核蛋白结合形成核仁小核糖核蛋白(small nucleolar ribonucleoprotein,snoRNP,snoRNP)复合物。在脊椎动物中编码snoRNA的基因主要存在于蛋白编码基因或非蛋白编码基因的内含子区域,经过进一步的转录后加工处理形成为成熟的snoRNA。snoRNA参与的生物学过程主要有rRNA的加工处理、RNA剪接和翻译过程的调控以及氧化应激反应,还参与遗传性疾病、人类的变异、造血、代谢以及癌症的过程中。
(八)调控性非编码RNA
1.干扰小RNA(siRNA)
siRNA有时称干扰短RNA(short interfering RNA)或沉默RNA(silencing RNA),是长20~25核苷酸的双链RNA。
(1)siRNA结构及其特性:
在各种生物中,双链RNA(double-stranded RNA,dsRNA)可通过不同途径被分割成siRNA。因此,siRNA具有独特的双链结构,是RNA干扰(RNA interference,RNAi)作用的重要部分。siRNA序列与所作用的靶mRNA序列具有同源性,双链两端各有2个突出非配对的3’碱基及两条单链5’末端磷酸和3’末端羟基。siRNA的反义链和正义链对介导RNAi均是必要的。外源性siRNA可导入细胞内;内源性siRNA来自胞核内,可自身折叠成发夹RNA,被酶剪切成21~23核苷酸后,释放入胞质,可抵御转座子、转基因和病毒等侵袭。siRNA是dsRNA,干扰mRNA翻译的效率比单纯反义或正义RNA的抑制效率提高上百倍。
(2)siRNA生成:
如图1-9所示,dsRNA进入细胞后,被细胞内核糖核酸酶(ribonuclease,RNase)家族中的dsRNA特异性核酸内切酶(dsRNA specific endonuclease,Dicer)识别结合,先将dsRNA解旋,然后将dsRNA降解成长度为21~23核苷酸的3’末端带有2~3核苷酸末端突出的双链RNA分子,即siRNA。siRNA与argonaute2(Ago2)等一些特定的蛋白结合形成RNA诱导沉默复合体(RNA-induced silencing complex,RISC),RISC中含siRNA、核酸内切酶(endonucleases)、核酸外切酶(exonuclease)及解旋酶(helicase)等,其中的siRNA解链为单链,由其中的反义链识别与其同源的靶mRNA,并与靶mRNA配对结合,在mRNA的近中点位置切割靶mRNA,并由RISC中的酶降解,以阻断mRNA传递遗传信息的功能。这种基因能正常转录成mRNA,但后者因被降解而阻断基因功能。

图1-9 siRNA(右)和miRNA(左)作用机制
引自龚守良.辐射细胞生物学,2014版。
(3)siRNA特异性:
siRNA的特异性强,除正义链3’末端突出的2个碱基在序列识别中不起主要作用外,其他单个碱基的改变均可使RNAi效应大大减弱。另外,siRNA诱发的RNAi效应强度随其浓度的增高而增强,并具有时间效应;在哺乳动物细胞中一般只能维持一段时间,2~3d效果最佳。
(4)siRNA应用:
在哺乳动物细胞中,由siRNA介导的RNAi能够启动特异基因序列沉默,可为疾病治疗提供新的方法。siRNA通过RNAi可以发挥抵抗病毒入侵、抑制转座子活动及防止自私基因(selfish gene)序列过量增殖等作用,但在将其应用于基因治疗方面还存在一些问题,需要进一步研究解决。
2.微RNA(miRNA)
(1)miRNA及其合成:
miRNA于1993年Lee等在研究秀丽新小杆线虫(Caenorhabditis elegans)发育缺陷时发现,是指长为21~25核苷酸的单链RNA(single-stranded RNA,ssRNA),位于基因组的非编码区,在许多动植物生物体内广泛表达,可在翻译水平对基因表达进行调节的RNA家族。miRNA是一种对大多真核生物基因组进行转录后调控的信号分子,可调控许多含有同源结构域(homology domain)的基因(同时也是转录因子),miRNA-mRNA互补程度决定其调控机制。另外,miRNA分子作为序列特异性调控因子是RNAi途径,也是一种细胞内存在dsRNA的进化保守现象。miRNA基因在人类基因组中占约1%,并已找到逾千个miRNA,在胚胎发育、细胞增殖、分化、代谢、死亡和肿瘤发生中发挥重要的调节作用。miRNA基因本身不具有开放阅读框(open reading frame,ORF),其表达具有高度保守性、时序性和组织特异性,在基因组中多以单拷贝、多拷贝或基因簇等多种形式存在,且大部分落于基因间区(intergenic region,IGR)。
(2)miRNA生成过程中的分子机制:
具有功能的miRNA是由包含一个颈环结构的更长转录物(又称pri-miRNA)经过两步切割反应而产生的。第一步切割反应在细胞核内进行,由Drosha/DGCR8复合物催化完成,其中Drosha为Ⅲ型RNA切割酶,DGCR8为双链RNA结合蛋白(RNA-binding protein),负责招募pri-miRNA底物。核内切割产生长度约60~70个碱基的miRNA前体,然后miRNA前体出核,在胞质由Dicer酶完成第二步切割。我国许瑞明和王宏伟等利用单颗粒冷冻电镜方法解析,Drosha的PAZ、MB helix和dsRBD结构域在pri-miRNA识别和协同完成切割位点定位中发挥重要的作用。其中,PAZ结构域在RNA结合前后出现了明显的构象变化,与MB helix一起,结合在pri-miRNA的单、双链交界区两侧,形成pri-miRNA关键特性识别的独特模式。
(3)miRNA介导的RNAi沉默机制:
由miRNA介导的RNAi沉默机制有多处与siRNA重叠,即两者的长度大致相当,同是Dicer切割产物,其生成均需Ago家族蛋白存在,同是RISC组分,都有优势结合及等式结合的两种方式。但同时也有许多不同之处:①siRNA是在RNAi过程中形成的中间体,miRNA是细胞内RNA的固有组分之一;②siRNA来源于转座子、转基因或病毒RNA,miRNA来源于内源转录物;③siRNA由长dsRNA经酶切获得,miRNA由发夹结构miRNA前体(pre-miRNA)经酶切获得;④siRNA主要以双链形式存在,miRNA主要以单链形式存在;⑤siRNA与靶mRNA完全互补、配对结合,特异性强,miRNA与靶RNA并不完全互补,存在错配现象,特异性较siRNA差;⑥siRNA主要在转录后发生作用,miRNA只在蛋白质转录水平发挥作用(图1-9)。
(4)miRNA基因组结构:
miRNA以多顺反子方式转录。miRNA基因常以基因簇的形式在基因组上串联排列,这些miRNA前体大约有1/3位于113个基因簇中,在人类基因组每一基因簇通常≤51kb,这些miRNA基因簇的表达数据来源于多种组织和细胞获得的miRNA表达谱数据。
(5)miRNA调节靶基因:
目前,很难精确地鉴定miRNA所调节的靶基因,因其通常是在不完全互补的情况下结合其靶基因。然而,生物信息学手段开始利用同一家族的成熟miRNA在5’末端具有高度的同源性这一特点,对其进入RISC中保持稳定,这是非常重要的;而且,这一末端对于其生物学功能也相当关键。因此,大多数生物信息学分析方法使用miRNA“种子”(miRNA seed)区域,包含了成熟miRNA序列的第2~8位核苷酸来寻找全部表达基因在3’-UTR区域的互补序列。这些研究结果显示,一个单链miRNA可能会结合多达200个靶基因,且这些靶基因行使各种各样的功能,包括转录因子(transcriptional factor,TF)、分泌蛋白、受体和转运蛋白。因此,miRNA可能控制大约1/3人类mRNA的表达。
美国McGeary等利用高分辨率数据严格地验证miRNA与mRNA靶位点结合的强度是miRNA降解mRNA效果的主要决定因素,其位点亲和力和靶向功效(即miRNA能够抑制特定mRNA的成功率)之间的关联是创建miRNA靶向作用的生化模型,该模型使用大量的亲和力测量值来预测抑制细胞中每种mRNA的功效,明显优于现有的所有miRNA靶向作用模型。
3.Piwi相互作用RNA(piRNA)
与Piwi蛋白相互作用的RNA称为piRNA,发现于2006年。在生殖细胞中,piRNA富集现象和Miwi突变导致的男性不育表明,piRNA在配子形成的过程中起作用。Piwi蛋白为Ago蛋白家族中的一个成员在果蝇中首先发现,具有调节生殖干细胞的作用。Ago是一类庞大的蛋白质家族,是组成RNA诱导沉默复合体(RNA-induced silencing complex,RISC)的主要成员,不同的Ago蛋白有着不同的生物学功能。piRNA与Ago家族蛋白结合,调控mRNA的稳定性、蛋白质的合成及染色质组织和基因组的结构。
2020年,日本Izumi等揭示了piRNA产生机制,在对完全基因修饰的家蚕卵巢细胞研究中,发现一种Zucchini蛋白将较长的piRNA未成熟形式加工成较短的中间形式,即piRNA前体(pre-piRNA)。随后,pre-piRNA在另一种Trimmer蛋白的作用下成熟为功能性形式的piRNA。
piRNA长度为24~33nt,绝大多数在29~30nt,5’末端也具有强烈的尿嘧啶倾向性(约86%);主要存在于基因间区,很少存在于基因区和重复序列区。piRNA在小鼠染色体上的分布很不均匀,主要分布在2、4、5和17号染色体,很少分布于1、3、16、19和X染色体,基本不分布于Y染色体。人类piRNA的分布相对均匀,但在13、20、21和性染色体分布较少。piRNA的另一个特点是,成熟piRNA 3’末端的2’氧被甲基化修饰。在果蝇中,这个反应是由Hen1 RNA甲基转移酶催化。甲基化修饰具有重要的生物学意义,增加piRNA的稳定性。
研究表明,piRNA主要存在于哺乳动物的生殖细胞和干细胞中,对于维持生殖系DNA完整、抑制转座子转录、抑制翻译、参与异染色质(heterochromatin)的形成、执行表观遗传调控以及生殖细胞发生等均有重要作用。通过与Piwi亚家族蛋白结合形成piRNA复合物(piRNA complex,piRC),调控基因沉默途径。对Piwi亚家族蛋白的遗传分析及piRNA积累的时间特性研究发现,piRC在配子发生过程中起着十分重要的作用。只有17%~20%的哺乳动物piRNA对应于标记的重复序列,包括转座子和逆转录转座子。因此,piRNA从后生程序化和抑制转录到转录后调控可能会有不同的功能。
4.长非编码RNA(lncRNA)
(1)lncRNA的生物学特性:
人类基因组中,lncRNA>200nt,其编码基因可能位于编码mRNA基因的外显子和内含子中,或编码mRNA基因之间的序列。lncRNA具有局部高度保守的序列元件、特定的空间二级结构、组织和细胞特异性表达及明确的亚细胞定位,位于细胞核或细胞质中。很多lncRNA来自具有染色质特征信号的基因位点,其转录受到动态的调节,具有明显的细胞特异性,部分lncRNA具有5’帽子和poly(A)尾巴,通过剪接而成熟。有些lncRNA在不同的物种间相当保守,可能调节不同物种间共有的信号通路,使这些物种具有某些保守的重要生物学功能;有些非保守的lncRNA功能具有种系特异性,可能受限于不同种系的环境选择压力和表型分离相关的进化。
(2)lncRNA的分类:
lncRNA大致分为5类,即同义lncRNA(与同一链上另一转录物的1个或多个外显子相重叠)、反义lncRNA(与另一条反义链上的转录物外显子相重叠)、双向lncRNA(其表达起始位点与其互补链上相邻编码转录物的表达起始位点十分接近)、基因内lncRNA(即内含子lncRNA,来源于另一转录物)和基因间lncRNA(位于两个基因间的间隔中)。
(3)lncRNA的产生:
对于lncRNA的产生有许多看法,主要包括:编码蛋白质的基因结构发生一次框插入,转变成有功能的lncRNA;染色质重组后,即两个未转录的基因分隔很远的序列区并排重组而产生多个外显子的lncRNA;非编码基因通过反转录转座作用复制,产生有功能的非编码逆基因或无功能的非编码反转录假基因;在ncRNA内部相邻的串联复制子产生lncRNA;基因组中插入一个转座成分而产生有功能的lncRNA。
(4)lncRNA的基因表达调控:
lncRNA可以作用于转录激活因子或转录抑制因子,并作用于RNA聚合酶Ⅱ(RNA polymeraseⅡ,RNA polⅡ)的不同组分,也可以直接与DNA双螺旋相互作用,从不同方面影响基因转录表达。因此,在真核细胞中,存在由lncRNA参与构成的复杂而重要的基因表达调控网络,精细地调节基因表达。
1)转录水平调控:
lncRNA是重要的基因转录表达的调控元件,而且调控基因表达方式具有多样性,主要依赖其基因与所调节的靶基因在基因组中的相对位置或序列特性。lncRNA激活转录因子,促进靶基因表达。lncRNA与转录因子形成复合体,引发蛋白质的表达。lncRNA转录对邻近基因具有干扰沉默的功能。穿过下游蛋白质编码基因启动子区域的lncRNA,直接干扰转录因子与启动子的结合,并阻止蛋白质编码基因的表达。
2)转录后水平调控:
lncRNA介导的转录后调控,包括剪切、转运、翻译和降解等,主要以自身序列与靶mRNA序列互补配对,形成RNA二聚物,以掩蔽mRNA分子上与转录加工过程相关因子的作用位点,达到调控mRNA转录后加工的目的。
3)表观修饰水平调控:
lncRNA的启动子位于各种甲基化印迹控制区域内,该区域位于蛋白质编码基因的序列内。因此,lncRNA可作为表观遗传的调节因子,尤其是特异地调控同源和等位基因。lncRNA可引起组蛋白修饰,抑制重叠基因起始转录,从而阻止假基因的转录。lncRNA对基因的表观遗传调节在诱导多能性干细胞(induced pluripotent stem cells,iPSCs)和胚胎干细胞(embryonic stem cells,ESCs)的诱导分化和细胞周期调节中起关键作用。lncRNA不仅通过表观遗传方式改变染色质结构,也可通过结合DNA,成为染色质的组成成分,影响染色质的构象。lncRNA可特异地与miRNA结合,影响后者表观遗传修饰作用。
4)对细胞核仁功能的调控:
2017年,我国陈玲玲等揭示了lncRNA SLERT在细胞核仁功能和RNA聚合酶Ⅰ(RNA polymeraseⅠ,RNA polⅠ)转录过程中的作用机制。通过不含poly(A)尾巴RNA的全转录组测序和分析,发现一条来源于人蛋白编码基因TBRG4内含子区域的lncRNA,其分子两端含有snoRNA结构,并促进rRNA前体(pre-rRNA)转录,命名为SLERT(snoRNA-ended lncRNA enhances pre-ribosomal RNA transcription)。研究发现,SLERT来自于转化生长因子β调节子4(transforming growth factor β regulator 4,TBRG4)pre-mRNA的可变剪切,定位于细胞核仁中。利用CRISPR/Cas9技术对SLERT进行精确敲除,发现SLERT的缺失导致RNA polⅠ转录活性的降低。进一步研究发现,SLERT可与RNA解旋酶DDX21结合;并发现DDX21在细胞核仁中围绕RNA polⅠ复合体,形成直径约为400nm的环状结构;这一环状结构的形成与RNA polⅠ转录偶联,抑制RNA polⅠ转录。研究表明,SLERT与DDX21的结合可改变DDX21蛋白构象,从而调整DDX21环在细胞核仁中的规则排布,最终通过解除DDX21环对RNA polⅠ的抑制作用,起到正调控RNA polⅠ转录的功能。另外,发现SLERT的敲除可以抑制小鼠体外成瘤作用,也为针对pre-rRNA转录的肿瘤靶向治疗提供了新的靶标。
(5)最新进展:
国际著名的ncRNA数据库NONCODE显示,2019年6月人类和小鼠的lncRNA基因的数目分别为56 018和46 475个。多数lncRNA虽然不直接参与基因编码和蛋白质合成,但在基因组印记、染色质修饰、基因转录后调控、剪切和修饰等过程中发挥重要的功能,与疾病的发生发展、诊断治疗密切相关。另外,lncRNA的亚细胞位置也呈多样化,在细胞核、细胞质和细胞器均有分布,甚至某些lncRNA具有独特的亚细胞位置,有可能是全新的亚细胞构成。
德国Sarropoulos等分析了来自7个物种(人类、恒河猴、小鼠、大鼠、兔子、负鼠和鸡)的主要器官在不同的发育时间点(从早期的器官发生到成年时)的lncRNA表达模式。他们在每种物种中鉴定出大约15 000~35 000个候选lncRNA,其中大多数显示出物种特异性,发现许多随着时间的推移具有动态表达模式lncRNA而表现出功能丰富的特征;在发育期间,广泛表达的和保守的lncRNA向越来越多的谱系和器官特异性的lncRNA转变。
2020年,陈玲玲等指出基因组来源相同的lncRNA在不同物种细胞内的“坐标”定位和功能都存在显著不同,揭示了lncRNA物种差异“加工”机制决定功能多样化。研究者通过系统的分析发现,lncRNA的加工、定位及其功能,在人、猴和鼠来源的ESCs内存在着明显的差异。这一发现阐明了lncRNA物种差异加工和定位导致的功能进化演变过程。
5.环状RNA(circRNA)
20世纪90年代,发现circRNA是一类特殊的ncRNA分子;与传统的线性RNA不同,其分子呈封闭环状结构,不受RNA外切酶影响,表达更稳定,不易降解,大量存在于真核转录组中。大部分circRNA是由外显子序列构成,在不同的物种中具有保守性,同时存在组织及不同发育阶段的表达特异性。大部分circRNA在细胞质中富集,其丰度有时甚至比相应的线性mRNA高10余倍,这可能是由于circRNA比线性RNA更稳定造成的。circRNA对核酸酶具有高耐受性,因此比线性RNA更为稳定。
我国李响等阐述,外显子反向剪接来源的circRNA是一类不具有5’末端帽子和3’末端poly(A)尾巴,却以共价键形成闭环结构的RNA分子,主要由RNA polⅡ转录产生的RNA前体,通过反向剪接产生,受到严格的调控,并发生在多个水平,包括转录速度、多顺反子基因位点的转录通读、剪接复合体的构成、顺式作用元件(cis-acting element)和/或反式作用因子(trans-acting factor)调控等。一些circRNA可以通过不同的分子机制参与细胞或个体正常的生命活动中,影响RNA转录和干扰RNA前体的正常剪接,甚至可以通过翻译产生多肽等。circRNA分子富含miRNA结合位点,在细胞中起到miRNA海绵(miRNA sponge)作用,进而解除miRNA对其靶基因的抑制作用,增加靶基因的表达水平;这一作用机制被称为竞争性内源RNA(competitive endogenous RNA,ceRNA)机制。通过与疾病关联的miRNA相互作用,circRNA在疾病中发挥重要的调控作用。
近来研究显示,在哺乳动物细胞中存在多种circRNA,对miRNA行使功能性调控。研究表明,在猪出生后0~30d,circRNA主要调控骨骼肌的生长发育和肌纤维类型转换;30~240d时,主要调控骨骼肌糖代谢和钙离子信号。另外,circRNA与大脑功能存在关联,有时发挥基因调节的作用。美国Vo等在前列腺癌组织中发现circRNA,可在尿液中检测到,未来将探究这些circRNA作为尿液或血液中的癌症生物标志物。