- 分子病理学(第2版)
- 李玉林主编
- 11692字
- 2025-03-14 20:07:42
第四节 基因表达的调控
一、基因表达调控的基本规律
原核和真核生物体系在基因组和细胞结构上的差异使其基因表达方式有所不同。原核细胞无胞核,遗传信息的转录和翻译发生在同一空间,并以偶联的方式进行。真核细胞有胞核,其基因转录和翻译具有空间分布和时间特异性。但是,原核和真核生物体系的基因表达有如下共同的基本规律。
(一)产生有功能的蛋白质和RNA
基因表达是基因转录和翻译的过程,也是基因所携带的遗传信息表现为表型的过程,包括基因转录成互补的RNA序列;对于蛋白质编码基因,mRNA继而翻译成多肽链,并装配加工成最终的蛋白质产物。在一定调节机制控制下,基因表达通常经历转录和翻译过程,产生具有特异生物学功能的蛋白质分子,赋予细胞或个体一定的功能或形态表型。但是,并非所有的基因表达过程都产生蛋白质。rRNA和tRNA编码基因转录产生RNA的过程也属于基因表达。
(二)具有时空特异性
所有生物的基因表达都具有严格的规律性,即表现时空特异性,这是由特异的基因启动子(序列)和/或调节序列与调节蛋白相互作用所决定的。
1.时间特异性(temporal specificity)
按功能需要,某一特定基因表达严格地按一定的时间顺序发生,这就是基因表达的时间特异性。如噬菌体、病毒或细菌侵入宿主后,表现一定的感染阶段。随感染阶段发展及生长环境变化,这些病原体及宿主的基因表达均可发生改变,即有些基因开启,有些基因关闭。
多细胞生物从受精卵发育为一个成熟个体,经历很多不同的发育阶段。在每个不同的发育阶段,都会有不同的基因严格地按照自己特定的时间顺序开启或关闭,表现为与分化、发育阶段一致的时间性。因此,多细胞生物基因表达的时间特异性又称阶段特异性(stage specificity)。
2.空间特异性(spatial specificity)
在多细胞生物个体某一发育、生长阶段,同一基因产物在不同的细胞、组织和器官表达水平可能不同。因此,同一个体内不同细胞、组织和器官出现差异性,这种差异性基础是特异的基因表达或称为差异基因表达(differential gene expression)。在个体发育、生长过程中,一种基因产物在个体的不同组织、器官表达,即在个体的不同空间出现,这就是基因表达的空间特异性。
(三)表达方式多样性
不同种类的生物遗传背景不同,同种生物不同个体生活环境不完全相同,不同的基因功能和性质也不相同。因此,不同的基因对生物体内、外环境信号刺激的反应性不同,受基因表达的调控。有些基因在生命全过程中持续表达,有些基因的表达则受环境的影响。
有些基因产物对生命全过程是必需的或必不可少的。这类基因在一个生命个体几乎所有的细胞中持续表达,不易受环境条件的影响,或称为基本表达,属于管家基因(house-keeping gene)。另有一些基因属于诱导基因(inducible gene),易受环境变化的影响,在特定环境信号刺激下,相应的基因被激活,基因表达产物增加。还有一种抑制基因(suppressor gene)对环境信号应答时受抑,使基因表达产物降低,这类基因的调控序列通常含有针对特异刺激的反应元件。
(四)不同基因协调表达
在生物体,通过不同基因协调表达,以适应环境变化,维持其生长和增殖。生物体这种适应环境的能力,与某些蛋白质分子的功能有关,并由编码这些蛋白分子的基因表达情况所决定。通过一定的程序,调控基因的表达,使生物体合成出合适的蛋白质分子,以便更好地适应环境,维持机体的内稳态,促进其协调生长。原核生物、单细胞生物调节基因的表达是其适应环境、维持生长和细胞分裂的需要。高等生物也普遍存在这种适应性表达方式;但在多细胞生物,基因表达调控还维持细胞分化和个体发育。
(五)具有基因表达的调控序列
一个生物体的基因组中,既有携带遗传信息的基因编码序列,也有能够影响基因表达的调控序列。一般,调控序列与被调控的编码序列位于同一条DNA链上,称为顺式作用元件或顺式调节元件。还有一些调控基因远离被调控的编码序列,即其他分子的编码基因,只能通过其表达产物(调节蛋白)而发挥作用。这些调节蛋白分子称为反式作用因子,对处于同一条或不在一条DNA链上的结构基因表达进行调控。这些反式作用因子以特定的方式识别和结合在顺式作用元件上,实施精确的基因表达调控。还有一类调控基因产物为调节RNA,以不同的作用方式对基因表达进行精细调节。
无论是原核生物还是真核生物,基因表达调控体现在基因表达的全过程中,包括RNA转录合成和蛋白质翻译两个阶段。因此,基因表达的调控是多层次的复杂过程。遗传信息是以基因的形式储存于DNA分子中,基因拷贝数越多,其表达产物越多,故基因组DNA的部分扩增(amplification)可影响基因表达。为适应某种特定需要而进行的DNA重排(DNA rearrangement)及DNA甲基化(DNA methylation)等均可在遗传信息水平影响基因表达。另外,遗传信息经转录由DNA传递给RNA的过程,是基因表达调控最重要、最复杂的一个层次;对于真核细胞,初始转录产物需经转录后加工修饰而成为有功能的成熟RNA。以miRNA为代表的ncRNA对基因表达调控的作用,可在新的层面上理解基因表达调控。蛋白质翻译是基因表达的最后一步,影响蛋白质合成的因素也能调节基因表达。并且,翻译与翻译后加工可直接、快速地改变蛋白质的结构与功能,因而对此过程的调控是细胞对外环境变化和某些特异刺激应答时的快速翻译机制。
一旦DNA被转录为RNA,RNA转录物在其翻译成蛋白质之前被加工、剪接,内含子被移除,外显子区域被保留。然而,美国Fiszbein等提出一种反演理论,即RNA剪接过程会影响DNA的转录。这种新理论,即“外显子介导的转录激活启动(exon-mediated activation of transcription starts,EMATs)”,与新外显子相关的剪接可激活附近启动子的转录过程。研究者认为,EMATs会在进化过程中增强基因组的复杂性,也可能产生物种的特殊差异,并有助于产生新的启动子,从而引起调节性改变,同时还会诱发相同有机体不同组织之间表达的差异。因此,EMATs为基因表达的调节增加了一层新的复杂性,能够赋予基因组更具灵活性,并潜在改变所产生的RNA水平和功能。
二、原核细胞基因表达的调控
对于复杂的多细胞生物,可依靠细胞群体中不同细胞发挥各自功能来适应变化的环境,具有一套比较固定的代谢途径。因此,就某一单个细胞,无需对外界环境变化做出直接的反应。原核生物是单细胞生物,其生存必须具有快速适应环境及有效利用能源的能力。所以,单细胞生物当底物不存在时,不合成与该底物相关的酶类;一旦底物出现,马上合成所需的酶。这种推论从逻辑上解释了原核生物所应有的基因表达调控规律。
(一)转录水平的调控
原核细胞的基因表达调控主要是使其自身能够根据外界环境的变化,调整自身的基因表达,以达到生长和繁殖的最佳状态。这就需要其具有对外界环境变化做出迅速反应的能力。这种迅速反应能力的生物学基础是转录与翻译过程的偶联性。
原核细胞基因多以操纵子(operon)的形式存在。操纵子由调控区和信息区组成,上游是调控区,包括启动子和操纵基因(operator);下游是信息区,为一组结构基因。启动子是同RNA酶结合并启动转录的特异性DNA序列。操纵基因是特异性的阻遏蛋白结合区。结构基因是能特异性编码蛋白的基因。
在结构基因中,遗传信息位于双链DNA的一条链上,这条链称为信息链(message strand)。mRNA是以信息链的互补链为模板合成的,因此其核苷酸序列与信息链基本相同(只是DNA中的T变成mRNA中的U)。1个基因的DNA双链碱基对(bp)的顺序数,是按信息链的上游和下游方向确定的。信息链上与mRNA链上的第一个核苷酸对应的碱基标记为+1,由此碱基向信息链上游(5’末端)数的碱基顺序记为负数(-1、-2等)。向下游(3’末端)数的碱基顺序为正数(+2、+3等)。
1.启动子(promoter)
启动子长约50~60bp,至少包括3个功能区:一是起始位点(initiation site),即+1区;二是结合位点(binding site),是RNA pol与启动子结合的位点,位于-10bp处(TATA框);三是识别位点(recognition site),位于-35bp处。基因转录时,δ因子识别-35区,RNA pol结合于-10区,全酶结合DNA后覆盖区域是-40~+20区。转录开始后,RNA pol沿着信息链的5’→3’方向移动,以互补链为模板合成RNA。可见,转录方向是由启动子决定的。
2.δ因子与启动子相互作用调节转录起始
原核生物在转录起始时,RNA pol依赖δ因子识别被转录基因的启动子序列,二者相互作用启动转录。δ因子与RNA pol结合紧密,转录启动后,大约合成至8nt时δ因子解离。游离的δ因子本身不直接结合特定的DNA,而是竞争结合RNA pol。
3.阻遏蛋白(repressor)
阻遏蛋白是一类在转录水平对基因表达产生负调控的蛋白质,在一定条件下与DNA结合,主要有诱导(induction)型和阻遏(repression)型两种。这两种阻遏蛋白均可与特定的信息分子结合而产生变构。不同构象的阻遏蛋白可与DNA解离或结合。诱导型阻遏蛋白在结合信息分子后,与DNA解离,解除对转录的抑制作用;阻遏型阻遏蛋白在结合信息分子后,与DNA结合,抑制转录。通过阻遏蛋白结合DNA,抑制其转录的基因表达调控方式称负调控(negative control)。
4.调控蛋白(control protein)
调控蛋白结合于特异DNA序列后促进基因转录的基因表达调控方式称为正调控(positive control)。正调控对一些本身结合RNA pol能力很弱的弱启动子非常重要。转录的激活是通过一种激活蛋白结合于邻近的特异DNA序列,该蛋白可作用于RNA pol,促进转录启动,称为正调控蛋白。
5.衰减子(attenuator)
细菌中的mRNA转录和蛋白翻译是偶联的。这一特点使细菌的一些操纵子中出现一段能减弱转录的序列,称为衰减子或弱化子,常位于一些操纵子中的第一个结构基因之前。原核细胞基因转录负调控的最典型模式是乳糖操纵子(lactose operon),也称Monod-Jacob模式。乳糖操纵子由3种结构基因、启动子、操纵基因和控制结构基因表达的调控元件(control element)构成。
(二)翻译水平的调控
1.RNA pol活性调节
与操纵子调节相比,RNA pol活性调节仅是一种粗调。氨基酸缺乏时,游离核苷酸和空载tRNA增加。如ATP存在,可产生鸟苷五磷酸(pppGpp)和鸟苷四磷酸(ppGpp),后者与RNA pol形成ppGpp-RNA pol复合体。构象改变的RNA pol活性减低,使rRNA和tRNA合成减低或停止。氨基酸充足时,则与上述情况相反,RNA pol活性增加,rRNA和tRNA合成增多。这种现象称为严紧反应(stringent response),以保证翻译的需求。
2.位点特异性倒位(site specific inversion)
位点特异性倒位调节依赖于倒位蛋白的存在。倒位蛋白是一种位点特异性重组酶(site-specific recombination enzyme)。对沙门菌H1和H2的两种蛋白编码基因表达,可揭示倒位蛋白调节基因表达的机制。
3.小分子RNA调节作用
小分子RNA调节作用发现于大肠杆菌渗透压调节基因的调节方式。大肠杆菌渗透压调节基因ompR的产物OMPR蛋白在低渗环境下对渗透压蛋白ompF基因表达起正调控作用,使其转录并翻译出OMRF蛋白。相反,在高渗条件下,OMPR蛋白发生构型改变,促进另一种渗透压蛋白ompC基因表达,转录翻译出OMPC蛋白,同时抑制OMPF蛋白的产生。
4.mRNA的稳定性
原核生物mRNA是不稳定的,其降解速度对蛋白质的翻译具有调控作用。细菌蛋白质的合成速度不仅取决于mRNA的合成和蛋白翻译偶联的速度,也取决于细菌mRNA的降解速度。mRNA降解产生的游离核苷酸,磷酸化后成为高能磷酸盐,用于新的mRNA分子合成。因此,许多用于蛋白质翻译的模板仅在几分钟内就会被全部替换,这意味着基因表达的诱导因素一旦消失,翻译会马上停止。正是由于mRNA能迅速合成或降解,细菌得以通过直接的翻译水平调控对环境变化做出快速反应。因此,mRNA的降解速度是翻译水平基因表达调控的重要机制。
生理状态与环境因素影响mRNA的降解速度。mRNA的一级及二级结构对mRNA的稳定性有一定的影响。如5’或3’末端的发夹结构可保护mRNA不被外切酶水解。mRNA的5’末端与核糖结合,其稳定性提高。不同操纵子转录出的mRNA序列及结构不同,稳定性也不相同。例如,RNA聚合酶Ⅲ能识别一种特殊发夹结构,并将其降解,使失去此发夹结构的RNA能被其他的RNA酶水解。如果这种发夹结构不被破坏,RNA也就不能被降解。因此,如能保护这一发夹结构,mRNA的寿命就会延长。一些调控蛋白可与这种发夹结构结合,保持mRNA的稳定性。
三、真核细胞基因表达的调控
真核生物的生理功能远较原核生物复杂的多。多细胞生物主要通过细胞集体的分工合作适应外环境,其基因表达的调控非常复杂。单细胞真核生物和易受外环境影响的高等动物的细胞,同原核生物细胞一样,采取在转录水平可逆的诱导与阻遏的方式调控。
多细胞生物体内的大多数细胞一般能免受外环境变化的直接影响,在相当长的一段时间内处于相对恒定的环境中。因此,真核生物体内只有少数基因的表达调控与外环境变化直接相关,而绝大多数基因的表达调控与生物体的发育、分化及内环境变化相关。真核生物在发育和分化过程中的每一步一般是不可逆的,都要受到机体内其他细胞及内环境发出的信号调控。真核细胞的转录主要在核内进行,而翻译则在细胞质中进行。翻译产物的分布、定位及功能活性调节也都十分严谨。这里仅讨论真核细胞不同水平基因表达调控的一些特点。
由于细胞类型的不同,人类基因组编码指令及基因表达的调控存在差异,因而产生具有不同功能的多样化组织,在不同个体中也存在差异。驱动这些差异产生的序列,一般处于基因组的非编码区域,它们决定基因表达的方式和时间。
(一)细胞外信号对基因表达的调控
1.激素和蛋白质因子对基因表达的调控
激素(hormone)是由内分泌细胞产生的化学物质,通过血液循环或直接同靶细胞的受体结合,调节细胞的生理状态。激素在同受体结合后激发细胞内不同的信号转导系统,影响细胞的功能。所激发的各种功能改变都要通过基因表达调控来完成。除激素外,还有很多生长因子(growth factor)和细胞因子(cytokine)也参加真核细胞基因表达的调控。细胞间的接触也会影响细胞基因表达的调控。例如,原始内胚层细胞与中胚层的间叶细胞接触后才能发育,分化为唾液腺、肺及肝等。虽然细胞间接触对基因的调控有时依赖于某些生长因子,但多数还是靠细胞间的直接接触或通过细胞外基质来完成调节作用。参与细胞间直接接触的细胞表面分子和细胞外基质成分多种多样,包括多种细胞间黏附分子(intercelluar adhesion molecule,ICAM)。这些分子通过量的变化调控基因表达,其表达异常与恶性肿瘤细胞的浸润和转移能力有关。
2.外界环境因素对基因表达的影响
尽管真核细胞对外界信号的反应能力远比原核细胞弱,但比较低等的真核生物细胞也能接受外界环境因素变化信号的直接调控。例如,外界营养条件的变化会诱导酵母菌产生参与糖代谢的酶类;一些真核生物细胞可接受特定的物理因素作为基因表达调控的信号,如热能可诱导热休克蛋白基因的表达等。
高等真核生物的某些基因能对营养条件的变化发生反应,但这部分基因在基因组中所占的比例很小,且有时难以形成完整的反应体系。体外培养的哺乳动物细胞自身能合成嘌呤和嘧啶,但在培养基中加入腺嘌呤,细胞就不再合成嘌呤,因为此时合成嘌呤的关键酶,即烟酰胺磷酸核糖转移酶的基因表达受到了抑制;而加入尿嘧啶则不能抑制合成嘧啶所需酶的基因表达。另外,体外培养的哺乳动物细胞在含有丝氨酸和甘氨酸的培养基中能继续合成这两种氨基酸。可见,哺乳动物细胞在通常条件下基因表达不受其产物的阻遏。体外培养的动物细胞对营养应激(nutritional stress)也不发生相应酶类反应。如在不含半胱氨酸的条件下,内源性的半胱氨酸的合成并不增加。高等动物体内的多数细胞对某种因素的反应经常是一致的。如在温度升高时,几乎所有的细胞都可以产生热休克蛋白。虽然高等动物的绝大多数细胞存在于相对恒定的内环境中,对外界环境变化通常不发生反应;但也有例外,如肝细胞,这是因为肝细胞必须时刻处理肠道吸收的营养及毒素物质。肝细胞解毒作用的分子生物学基础是肝细胞在毒性物质的刺激下,表达与解毒相关的基因,进而表达相关的酶类。高等动物肿瘤细胞在化疗药物的刺激下则可表达对化疗药物有解毒作用的多药耐药基因(multidrug resistance gene),也是一个很好的佐证。
(二)DNA水平的基因表达调控
DNA水平的调控主要有以下几种方式:
1.染色质丢失
染色质丢失是一种不可逆的调控,如高等动物红细胞在发育成熟过程中的染色质丢失。
2.染色质结构对基因表达的调控
真核细胞的染色质或染色体是由DNA与组蛋白、非组蛋白和少量RNA及其他成分构成,具有核小体结构。组蛋白与DNA结合,可保护DNA免受损伤,维持基因组稳定性,同时抑制基因的表达。去除组蛋白后,基因的转录活性增高。非组蛋白和组蛋白可与DNA竞争性结合,解除组蛋白对基因表达的抑制。
3.基因扩增
细胞在发育或所处环境改变时,对某种基因产物的需要量增多,仅靠调节该基因表达活性不足以满足需要。只有增加这种基因的拷贝数,即基因扩增(gene amplification),才能满足需求。基因扩增是基因表达上调的一种有效方式。肿瘤细胞中某些原癌基因扩增,致使该基因表达产物增多,细胞持续增生、癌变。
4.基因重排
基因重排(gene rearrangement)是指某些基因片段改变原来的存在顺序,通过调节有关基因片段的衔接顺序,重排形成一个完整的转录单位。编码免疫球蛋白(immunoglobulin,Ig)分子的许多基因片段进行重排和原始转录物的拼接加工,奠定了免疫球蛋白多样性的分子学基础。因此,基因重排是DNA水平调控的重要方式。
5.DNA甲基化
DNA甲基化(DNA methylation)在真核细胞基因表达调控中起着重要作用。DNA甲基化程度常与该基因表达呈负相关,即甲基化程度越高,基因表达越低;相反,DNA去甲基化(DNA demethylation)可使基因表达增加。管家基因等持续表达的基因多呈低甲基化状态,而组织中不表达的基因则多呈高甲基化状态。不同的致癌物质可通过抑癌基因甲基化或原癌基因去甲基化,导致细胞恶性转化。
甲基化可以通过直接和间接作用影响基因表达。①直接作用:甲基化使基因构型发生变化,影响转录因子(TF)与DNA特定部位的结合,使基因不能转录。②间接作用:基因在5’末端调控序列发生甲基化后与核内甲基-CpG结合蛋白(methyl-CpG binding protein,MeCP)结合,阻止TF与基因形成转录复合物。
(三)转录水平的调控
初始转录水平的调控是基因表达最为关键的调控机制。
1.基因的活化
无转录活性的染色质称异染色质,通常密度高,与组蛋白结合紧密,DNA甲基化程度高。有转录活性的染色质称常染色质(euchromatin),较松散,与组蛋白结合疏松,DNA甲基化程度相对较低。特别是在基因启动子区域,该区域实际上是DNA开放的松散结构。这种结构的疏松使其容易与参加转录起始的RNA pol及蛋白因子接近。许多实验证明,异染色质对于DNA聚合酶Ⅰ(DNA polⅠ)有较大的耐受性,而常染色质对DNA pol酶Ⅰ较敏感。这些对DNA polⅠ敏感的区域被称为DNA polⅠ高敏感区。
2.顺式作用元件及反式作用因子
真核细胞基因可转录rRNA、tRNA和mRNA,其各自基因转录分别对应于三种不同的RNA pol,调控方式也不相同。rRNA与tRNA结构较单一,在正常情况下均为组成型表达,调控机制也相对比较简单。种类繁多的mRNA,由于编码蛋白质,与细胞分化、发育、功能和恶变等各种生命活动及疾病发生相关,已成为转录调控研究的热点。下面简要介绍mRNA的转录调控机制。
所有真核细胞中都存在三种不同的RNA pol,分别合成不同类型的RNA。RNA polⅠ转录rRNA,RNA polⅡ转录mRNA,RNA polⅢ转录tRNA和5S RNA。纯化的RNA polⅡ在体外能按DNA模板合成一条RNA链,延长RNA链的速度为每分钟60~600nt。但此酶并不能在DNA链上选择适当的起始位点,只有在其他TF的协同作用下,才能找到恰当的位置,起始基因转录。
基因活化为顺式作用元件、RNA pol及反式作用因子提供了可以互相趋近的空间。同原核细胞一样,存在于DNA中的特异性调控序列称为顺式作用元件;可溶性转录调控蛋白因子称为反式作用因子。顺式作用元件与反式作用因子之间的特异性结合是真核细胞基因组织特异性表达的基础。
(1)顺式作用元件:顺式作用元件由启动子、增强子或沉默子(silencer)及反应元件等构成。
1)启动子及其上游近侧序列:启动子是与基因转录启动有关的核苷酸序列,位于基因转录起始位点5’末端,是转录的最基本信号结构,只能近距离作用(一般在-100bp以内),具有方向性,空间位置较恒定。启动子包括TATA框(TATA box/Hogness box)、上游启动子元件(upstream promotor element)、诱导型启动子(inducing promotor)和组织特异性启动子(tissue specific promotor)。高等动物的TATA框的核心为TATAT/AAT/A,位于转录起始位点上游-30bp附近。TATA框决定基因转录的精确起始,即RNA转录起始点。上游启动子元件包括CAAT框(CAAT box)与GC框(GC box)。CAAT框和GC框与TATA框一样,均为普通启动元件,它们协同作用决定基因的基础转录效率。然而,启动子并非都同时含有3种元件。cAMP反应元件(cAMP response element,CRE)能介导来自环磷酸腺苷(cyclic adenosine monophosphate,cAMP)及生长因子等诱导信号的反应,是一种诱导型启动子反应元件。组织特异性启动子元件一般位于分化细胞的特异基因调控区,仅调控特异基因的转录。启动子及其近侧的保守序列元件按其对RNA pol的影响可分为两类:一类是位于较上游的元件,能较强地影响转录起始频率,这类元件不与RNA pol直接发生作用,但能使RNA pol趋近转录起始位点,它的存在与否决定RNA pol能否在启动子作用下有效启动转录;另一类就是TATA框,具有控制并稳定选择起始位点的作用,如果缺少TATA框,转录起始位点的位置将不稳定,甚至可能出现多个位置不同的起始位点。可以说,TATA框的功能是促使RNA pol进入恰当的位置,启动转录。因此,TATA框的位置一般是恒定的。
2)增强子:增强子能与反式作用因子结合,大大增加基因转录活性的顺式作用元件,其本身不具有启动子活性。
增强子作用主要的方式有:①改变DNA模板的结构,影响染色质的DNA-蛋白质结构,改变DNA超螺旋结构的密度;②提供一个能使DNA模板局限于某个特定空间的微环境;③为RNA聚合酶和其他蛋白因子提供一种与DNA及染色质相关的联系结构,这种结构是RNA聚合酶所必需的。增强子通过与RNA聚合酶相互作用而发挥功能。从增强子的发现以及对其给出的定义来看,增强子对基因转录仅具有促进作用。然而,现已发现负增强子元件的基因,如小鼠IgH基因、大鼠胰岛素样生长因子1基因、人视网膜结合蛋白1基因及人IFN-α基因等多种。有人称这种负调控元件为沉默子。因此,有人将增强子称为调节子(modulator)。
3)反应元件(response element):真核细胞处于某一特定环境时,对其出现反应的基因所具有的相同顺式作用元件,称为反应元件。例如,热激应答元件(heat shock element,HSE)、金属反应元件(metal response element,MRE)和血清反应元件(serum response element,SRE)等。这些反应元件存在于启动子或增强子内,具有较短的保守序列,与转录起始位点的距离不固定,一般在200bp内。有些反应元件能被在某些特殊条件下表达的反式作用因子所识别。
(2)反式作用因子:反式作用因子(简称反式因子)是一类胞核内的蛋白质因子。因为这种因子是在基因外合成后转移回DNA所在的位置,所以称为反式因子。由于它们大多存在于胞核内,故又称细胞核因子。反式因子能识别启动子、启动子近侧元件和增强子等顺式作用元件中的特异靶序列,并与其结合,改变DNA的构象,进而影响基因的转录。反式因子对基因表达的调控分正向和负向,即激活和抑制基因表达。反式因子具有与相应DNA顺式作用元件结合的结构域(structural domain)。根据结构域的不同反式因子分为4种,其中最常见的是螺旋-转角-螺旋(helix-turn-helix),另外3种是锌指(zinc finger)结构、亮氨酸拉链(leucine zipper)和两亲螺旋-环-螺旋(amphipathic helix-loop-helix)。
(3)在基因转录的起始过程中,涉及反式因子及其与顺式作用元件之间的相互作用,而且不同基因的表达受不同组合反式因子协同调控,其过程十分复杂。因此,探讨反式因子的作用特点与规律对研究真核生物细胞基因表达调控意义重大。一般认为,反式因子的作用存在以下特点和规律:①一种反式因子能与一种以上的顺式作用元件结合。一些反式因子甚至可以与同源性很小的顺式作用元件结合,如糖皮质激素受体(glucocorticoid receptor,GR)既能与受控于该激素的不同基因特异DNA序列结合,又能与不同病毒基因组的特异DNA序列结合。②多种反式因子可结合同一种顺式作用元件,如多种反式因子能同CAAT框结合。③反式因子的二聚体或多聚体可以与顺式作用元件作用,如Fos/Jun二聚体能识别TGACTCA等。④有些反式因子的活性可通过不同RNA水平的剪接和翻译后的修饰而受到调节,如热休克蛋白转录因子只有在磷酸化后才能激活基因转录的功能。⑤反式因子之间的相互作用对它们功能的发挥是必需的。结合在不同部位的反式因子通过它们之间的DNA形成环状结构。DNA环状结构形成后,反式因子之间的距离趋近,形成能相互作用的构象。值得注意的是,最终发挥基因表达调控作用的是位于DNA环不同位点上的反式因子,而不是DNA环本身。
(四)转录后水平调控
真核细胞基因转录的mRNA,必须经过一系列加工才能成为成熟的mRNA。因此,对这一过程的调节也是基因表达调控的一个重要内容。
1.5’末端戴帽和3’末端加尾
戴帽和加尾有关内容见本章第一节。戴帽与加尾的作用是:①保护RNA免受核酸外切酶的消化,即防止mRNA降解,延长mRNA寿命;②有利于RNA由细胞核运至细胞质;③有助于细胞质中的核糖体识别mRNA,即与小亚基结合;④为翻译起始因子提供信号;⑤便于RNA剪接。
2.mRNA内含子剪接及对基因表达的调控
转录是将基因的外显子和内含子转换成RNA序列,这个原始的RNA转录体为核内异质RNA(hnRNA)。其中,外显子和内含子相间排列。将内含子序列切掉,外显子序列拼接,这一剪接过程见本章第一节。
在mRNA的剪接过程中,参与拼接的外显子可以不按其在基因组中的线形分布秩序拼接,内含子也可以保留,即一个外显子或内含子是否出现在成熟的mRNA中是可以选择的,称为选择剪接。选择剪接的方式有以下几种。
(1)外显子选择(optional exon):
也称外显子跳跃,指在不同的剪接方式中,某一外显子或几个外显子可以在成熟的mRNA中保留,也可以通过剪接过程被去掉;其结果至少有两种,一种是外显子全部保留,另一种是删去一个或几个外显子。
(2)内含子选择(optional intron):
是指在不同的剪接方式中,内含子可以被完全地去掉,也可以有一个内含子被保留在成熟的mRNA中。也有两种剪接方式,一种是内含子全部被删除,另一种是保留某一内含子。
(3)互斥外显子(mutually exclusive exon):
是指一对外显子在一种剪接方式中只能保留其中的一个,而在另一种剪接方式中保留另一个,两个外显子不能同时出现在同一个成熟的mRNA中。
(4)内部剪接位点(internal splice site):
这是指通过对外显子或内含子内部5’末端剪接供点或3’末端剪接受点的选择,保留全部外显子或剪掉某一外显子的部分序列,或去掉全部内含子或保留某一内含子的部分序列。
3.mRNA运输的控制
RNA的转录初始物平均长度为6 000nt,成熟的mRNA平均为1 500nt,大部分在核内被降解,仅有20%进入胞质,留在核内的RNA约在1h内降解成小片段。mRNA是通过主动运输过程进入细胞质,核糖体则在核内组装,再运到胞质中。
(五)翻译水平调控
翻译过程主要涉及mRNA、tRNA、核糖体及可溶性蛋白因子四大类装置,它们的协调作用完成了蛋白质的合成。细胞正是通过它们调控蛋白质的翻译。
1.阻遏蛋白的调控作用
不是所有进入细胞质的mRNA分子都可以与核糖体结合,翻译出蛋白质。有些特定的蛋白质可以结合到mRNA的5’末端,抑制翻译,如铁蛋白(ferritin),其mRNA 5’末端非编码区有一个约30nt折叠成的茎-环结构称为铁反应元件。未结合铁的铁调节蛋白可以与铁反应元件结合,抑制翻译。结合铁后,则该蛋白与铁反应元件解离,mRNA的翻译效率将大大提高。
2.mRNA稳定性调节
mRNA是翻译蛋白质的模板,其量的多少可直接影响蛋白质合成的量。所以,mRNA的稳定性是影响翻译的重要因素之一。mRNA越稳定,半衰期越长,其翻译效率越高,在细胞内合成蛋白质的量也就越多。真核细胞内的mRNA稳定性差别很大,半衰期可以从几分钟到数十小时不等。不稳定mRNA多是编码调节蛋白质,如一些生长因子。这些蛋白为适应细胞调节功能的需要,必须随细胞状态改变而变化,在细胞中其mRNA的含量也需迅速变化,以适合调节翻译蛋白变化的需要。不稳定mRNA的3’末端非编码区都含有一段富含A和U的序列,认为这可能是引起mRNA不稳定的原因。
3.mRNA结构对蛋白质翻译调控的影响
除mRNA 5’末端帽子及3’末端的poly(A)尾巴影响翻译效率外,mRNA本身结构对其翻译效率也有调节作用。
(1)起始密码AUG的位置及其旁侧序列:
真核细胞mRNA的翻译起始于最靠近结构基因的第一个AUG密码。当mRNA的5’非翻译区中存在1个以上的AUG密码时,仅有1个AUG为ORF的翻译起始位点,而存在于该AUG位点上游的其他AUG密码被称为“上游AUG密码”,这些“上游AUG密码”常会抑制其下游ORF的翻译。原癌基因的“上游AUG密码”能抑制原癌基因的表达,“上游AUG密码”的缺失可使原癌基因出现翻译启动。因此,“上游AUG密码”丢失可能是肿瘤细胞恶性转化的原因之一。AUG的旁侧序列与翻译起始关系密切,其-3位的A与+4位的G有促进AUG起始识别的作用。
(2)编码区及二级结构对翻译的影响:
5’-非翻译区(5’-UTR)中存在的碱基可相互配对,形成环状二级结构。这一结构会阻遏核糖体40S亚基单位的迁移,对翻译起始具有抑制作用,其强弱取决于环状结构的稳定性及其在5’-UTR中的位置。
第一个AUG密码子与5’末端帽结构间的距离影响翻译起始效率和翻译起始的准确性。二者距离太近时,AUG密码子不易被40S亚基识别;当二者距离在12nt以内时,有一半以上的40S亚基会滑过第一个AUG。5’末端非编码区的长度在17~80nt时,体外翻译效率与其长度成正比。
一个长度适当,无高级结构及“上游AUG密码”的5’-UTR对mRNA的有效翻译是必需的,而一个结构复杂、富含“上游AUG密码”的5’-UTR区,不论其长度如何,都不利于翻译的起始。
4.可溶性蛋白因子的修饰
蛋白在被磷酸化等化学方式修饰后,其性质及功能可发生改变,如肽链起始因子序列被磷酸化修饰后,蛋白质合成受到抑制。
(六)翻译后水平的调控
生物体内的多数成熟蛋白与直接从mRNA翻译的蛋白质结构并不完全一样。例如,某些蛋白质以新合成的前体(原体)形式储存,然后经蛋白酶水解成不同形状的肽链,修饰后的肽链才能完成各自的功能。这些修饰包括肽链的解离、新生肽链的水解及肽链中氨基酸的共价修饰等。合成的蛋白质输送到胞核及各种细胞器,其功能也受到调控,未及时运输的蛋白质就会被迅速降解,这也是控制蛋白功能的一种方式。
综上所述,真核细胞在经过转录、翻译及肽链剪接等复杂而有序的生化过程之后,将遗传信息转变为具有功能的蛋白质。不同分化及发育的细胞所表达的基因并不相同。