第二节 蛋白质的组成、结构和功能

蛋白质(protein)是基因活化的产物,是一切细胞的重要组成部分,是生命活动的主要物质基础。蛋白质种类繁多,功能复杂,涉及机体生长、发育、繁殖及遗传等所有生命过程。

一、组成蛋白质的氨基酸

氨基酸(amino acid)广泛分布于生物界,有数百种,其中仅有20种是构成蛋白质的基本成分。由于组成蛋白质的氨基酸种类、数量和排列顺序不同,产生了结构和性质不同的蛋白质。

(一)氨基酸的分子结构

组成蛋白质的氨基酸均属于L型α-氨基酸,其分子结构的通式如下表示:

除脯氨酸外,在与羧基相连的α-碳原子上有一个氨基(—NH2)。除甘氨酸外,α-碳原子均为不对称碳原子,有的含有两个或两个以上不对称碳原子,因此具有旋光性。组成蛋白质的氨基酸各有不同的侧链基团R。由于R基团的结构不同,带来氨基酸的不同性质。

按R基因的化学结构,组成蛋白质的氨基酸分为脂肪族氨基酸、芳香族氨基酸及杂环族氨基酸3类(表1-3)。按R基团的极性,分为非极性氨基酸(包括丙氨酸、缬氨酸、亮氨酸、异亮氨酸、苯丙氨酸、色氨酸、甲硫氨酸和脯氨酸)、不带电荷的极性氨基酸(包括丝氨酸、苏氨酸、酪氨酸、天冬酰胺、谷氨酰胺、半胱氨酸和甘氨酸)、带正电荷的碱性氨基酸(包括赖氨酸、精氨酸和组氨酸)及带负电荷的酸性氨基酸(包括天冬氨酸和谷氨酸)4类。

表1-3 组成蛋白质的氨基酸

(二)氨基酸的化学修饰

在蛋白质多肽链翻译过程中,某些氨基酸残基经化学修饰而成为修饰氨基酸。脯氨酸和赖氨酸残基分别被羟化为4-羟脯氨酸和5-羟赖氨酸,是胶原蛋白的重要结构成分。一些氨基酸残基分别被甲基化、乙酰化(acetylation)或磷酸化为3-甲基组氨酸、ω-N-甲基精氨酸、ε-N-乙酰赖氨酸、N-乙酰丝氨酸和O-磷酸丝氨酸等,是构成核糖蛋白体和染色体组蛋白的重要成分。5-甲基赖氨酸为肌球蛋白的组成部分,行使肌肉的收缩功能。谷氨酸残基经羧基化为γ-羧基谷氨酸,是构成凝血酶原和结合Ca2+蛋白质的重要成分。酪氨酸残基被碘化,构成甲状腺球蛋白的重要成分,这种球蛋白降解为甲状腺素(thyroxine,T4)和三碘甲状腺原氨酸(triiodothyronine,T3)发挥生理作用。由4个赖氨酸组成的吡啶环,称为锁链素(desmosine)是弹性蛋白的重要结构成分。丝氨酸残基被修饰为硒代半胱氨酸(selenocysteine),是构成硒蛋白的重要成分。

另外,除了参与蛋白质组成的氨基酸外,还有许多非蛋白质氨基酸,常以游离的形式或与其他有机化合物结合发挥生物学功能。大多非蛋白质氨基酸是L型α-氨基酸的衍生物,也有一些是β、γ或δ-氨基酸;有些是D型氨基酸,如组成细菌细胞壁肽聚糖的D-谷氨酸和D-丙氨酸。在非蛋白质氨基酸中,有的参与细胞信息传递和物质代谢调节或物质代谢过程的中间产物及前体,如γ-氨基丁酸(γ-aminobutyric acid,GABA)、鸟氨酸、瓜氨酸、同型半胱氨酸、S-腺苷基甲硫氨酸(S-adenosylmethionine,SAM)和β-丙氨酸等。

(三)氨基酸的理化特性

氨基酸具有L型和D型旋光异构体(optical isomer),具有旋光性(optical rotation)。从蛋白质温和水解得到的α-氨基酸都属于L型。氨基酸旋光大小与其R基团性质有关,也与测定时溶液的pH值有关,因为不同的pH值氨基和羧基解离的状态不同。

组成蛋白质的氨基酸在可见光区域无光的吸收,而酪氨酸、苯丙氨酸和色氨酸的侧链基团含有苯环共轭(conjugation)双键结构,因此在220~300nm的紫外光区域有光吸收。蛋白质由于含有这一类氨基酸,也具有紫外光吸收能力,其最大光吸收峰在280nm波长处。利用特定波长的紫外吸收性质,可定量分析蛋白质。但不同蛋白质中这类氨基酸的含量不同,其消光系数(extinction coefficient,又称吸收系数)也不完全相同。因此,根据蛋白质溶液在260nm和280nm获得的吸光度(absorbance,A)值换算成蛋白质浓度只是一个近似值。

氨基酸具有两性解离的性质,在溶液中其羧基和氨基在生理pH情况下可两性解离。如一种氨基酸处在相对酸的条件下,带正电荷;处在相对碱的条件下,带负电荷;在溶液的pH达到某一特定值时,呈现电中性。电中性时,溶液的pH称为等电点(isoelectric point,pI)。由于中性氨基酸中羧基的解离度大于氨基,pI略偏酸性。

氨基酸可参加许多化学反应。因其分子的氨基和羧基分别具有胺和羧酸的基本反应性质,并且互相影响,出现一些特殊反应。氨基酸侧链的某些功能基团也可与多种试剂发生反应。例如,氨基酸与茚三酮反应(ninhydrin reaction)生成蓝紫色化合物。所有这些氨基酸反应是多肽和蛋白质人工合成、蛋白质化学修饰和氨基酸定量分析的基础,具有重要的实际应用价值。

二、蛋白质结构

(一)蛋白质一级结构

1.一级结构

蛋白质一级结构是多肽链(polypeptide chain)中氨基酸的排列顺序,是由遗传密码的排列顺序所决定的。不同的氨基酸组成和不同的排列顺序形成不同的蛋白质。一级结构可决定蛋白质的三维结构,而三维结构是实现其生物学功能的基础。

肽键(peptide bond)是由1个分子氨基酸的α-羧基与另1个分子氨基酸α-氨基脱水缩合形成的共价键,即酰胺键(amide bond,—CO—NH—)。许多α-氨基酸借助肽键彼此连接形成的化合物称为多肽或肽链。肽键原子及其相连的两个α-碳原子称为肽单元(peptide unit)。由于肽链是一个共振杂化体(resonance hybrid),C—N键具有双键性质,其中C和N原子不易绕键旋转,因此肽单元处于刚性平面,称肽平面(peptide plane)。肽平面在肽键折叠成三维构象过程中起到重要作用。

在肽链中,形成肽键的前后相连的每一氨基酸分子均少2个氢原子和1个氧原子,故称为氨基酸残基(amino acid residue)。多肽链结构不对称,有1个游离的α-NH2端,即氨基端(amino terminal),或称N端(N-terminal),位于多肽链的左侧;另有1个游离的α-COOH端,即羧基端(carboxyl terminal),或称C端(C-terminal),位于多肽链的右侧。多肽链的方向是从N端到C端,故表示蛋白质的一级结构是从左到右,或从上到下,也即N→C。

值得注意的是,英国Canavelli等发现,氨基酸的前体分子氨基腈(aminonitrile)具有反应活性,无需先转变为氨基酸,就可以直接形成多肽。也就是说,研究者找到了一种不需要氨基酸,就可以合成多肽的方法。

多肽链是构成蛋白质分子的基础,但在生物体内存在一些游离的肽,并且有不同的生物学活性,称为活性肽(bioactive peptide)。例如,一些神经肽(催产素、什压素、血管升压素、下丘脑释放素或抑制素、阿片肽和脑肠肽等)及谷胱甘肽等在机体内起到重要的生物学功能。

2.一级结构功能

蛋白质发挥生物学功能,主要取决于一级结构。存在于不同生物体内,具有相同功能的蛋白质称为同源蛋白质(homologous protein)。不同种属的同源蛋白质,其一级结构存在差别,这种差别引起种属差异(species difference)。研究同源蛋白质的结构在种属间的差异,有助于了解物种的分子进化。

蛋白质的一级结构与某些分子病(molecular disease)有关。由于遗传基因的突变,导致蛋白质分子结构的改变或某种蛋白质的缺失,可引起分子病。例如,镰状细胞贫血(sickle cell anemia)是由于血红蛋白574个氨基酸残基中β亚基上的一个氨基酸残基发生改变而引起的。

(二)二级结构

多肽链的肽键是维系蛋白质一级结构的主键,但完成蛋白质特有的三维结构(空间结构)必须借助于次级键的作用,包括范德瓦耳斯力(van der Waals force)、氢键、离子键(盐键)、疏水作用及二硫键等。另外,肽键相连的6个原子所形成的肽单元处在同一个刚性的肽平面上,其两侧的Cα—C和Cα—N键是可以自由旋转的单键。因此,肽平面可围绕α-碳原子旋转,使多肽链形成各种形式的主链构象和侧链构象,即为蛋白质的空间结构。蛋白质的二级结构是指多肽链盘绕或折叠,借氢键连接而形成的α螺旋、β折叠、β转角或无规则卷曲等的构象。

(三)超二级结构和结构域

1.超二级结构

在大多球状蛋白质中,二级结构单位(α螺旋和β折叠)互相聚集,形成更高一级有规则的二级结构组合体,即为超二级结构(super-secondary structure)。超二级结构是蛋白质从二级结构延伸到三级结构的一个新的空间层次,主要有α螺旋组合(αα)、β折叠组合(ββ)和α螺旋β折叠组合(βαβ)三种。

2.结构域

超二级结构可形成紧密、稳定的,并在蛋白质分子构象上明显可分的区域,称为结构域(structural domain)。结构域一般由50~400个氨基酸残基组成,是多肽链的独立折叠单位。不同的结构域具有蛋白质分子的不同功能,是整个蛋白质分子中一些生物学功能的实体。不同的蛋白质分子含有结构类似的结构域,同一蛋白质分子可由结构相似的几个结构域组成。结构域不仅是一定功能的结构单位,也是1个遗传单位,某些蛋白质中的结构域与其编码基因中的外显子精确对应,如IgG的1个外显子编码1个结构域。

(四)三级结构

蛋白质的三级结构是指其多肽链在二级结构基础上,进一步通过盘绕、折叠,形成以次级键维系的紧密球状构象。另外,三级结构也指蛋白质分子或亚基内所有原子的空间排布,但不包括分子间或亚基间的空间排列关系。

维系蛋白质的三级结构,除了借助于主链氢键作用,主要借助于侧链基团之间的次级键作用(图1-10)。例如,多肽链的侧链形成的氢键和主链的肽链原子与侧链基团形成的氢键,非极性侧链基团产生的疏水作用,侧链基团很近时产生的范德瓦耳斯力,酸性与碱性侧链之间产生的离子键,以及部分蛋白质半胱氨酸巯基之间形成的二硫键。这些次级键的键能虽较弱,但其数量多,灵活性大,足以维系蛋白质构象的紧密和稳定。三级结构的构象与蛋白质的生物学功能相关,其构象发生改变,蛋白质功能也发生相应改变或遭到破坏。

图1-10 维持蛋白质三级结构的各种作用力

(五)四级结构

蛋白质四级结构(quaternary structure)是指各亚基在寡聚蛋白质(oligomeric protein)中的空间排布及亚基间的相互作用。亚基是独立的结构单位,但不是独立的功能单位。另外,寡聚蛋白质是由少数亚基聚合的蛋白质;严格地说,也应包括多聚蛋白(polyprotein),即由几十个,甚至几千个亚基聚合的蛋白质。

构成蛋白质四级结构的亚基可以是相同的,即为均一的四级结构;也可以是不同的,即为非均一的四级结构。亚基的空间排布主要分为线性排布、螺旋排布及点群排布等。亚基之间借助非共价键相互作用结合在一起,其相互作用的界面在形状和极性基配对上均呈高度互补性。

(六)空间结构功能

蛋白质具有特定的生物学功能,必须具有特定的三维空间结构;空间结构稍有破坏,即可引起生物活性降低,甚至丧失活性。生物体内很多蛋白质往往存在多种天然构象,但只有一种构象显示出正常的功能活性。因此,常可通过调节构象的变化来影响蛋白质的活性,从而调控物质代谢或相应的生理功能。

当某种小分子物质特异地与某种蛋白质结合后,能够引起该蛋白质的构象发生微小而规律的变化,从而使其活性发生变化,这种现象称为别构效应(allosteric effect)。通过别构效应,蛋白质的活性得到不断的调整,使生物机体适应千变万化的内外环境。

血红蛋白(hemoglobin,Hb)是一种具有别构效应的蛋白质,在结构和功能方面研究比较深入的蛋白质,其功能是运输O2和CO2。另外,蛋白质相互作用在生命活动中起到非常重要的作用,有助于阐明特定生命过程,为相关疾病的治疗提供理论基础;肌肉蛋白的相互作用引起肌肉收缩,是蛋白质结构相关分子功能的一个较为明确的例子。

1.血红蛋白的输氧功能

人类Hb分子按发育阶段分为不同种类,Hb A为成年最多见的一种。Hb A有两个α亚基和两个β亚基(α2β2),每一个多肽链(亚基)以一定特征方式盘绕、折叠而成为一种复杂的三维结构。Hb的每个亚基连接一个辅基血红素(heme)。4个血红素基团在中心形成带有铁原子的卟啉环。在由4个亚基组成的三维结构中,血红素位于由亚基形成的空穴。血红素通过铁原子和亚基组氨酸残基之间的配价键与亚基结合在一起。

血红蛋白β亚基三级结构(图1-11A):Hb分子中具有别构效应(或称变构效应),即Hb的1个亚基与氧结合,促进其他亚基与氧的结合。Hb还可通过分子特殊部分的运动行使其功能。氧与Hb分子结合引起血红素-血红素相互作用,起因于三级和四级构象的可逆转变,其生理学意义在于使氧分离和减少排到组织的氧量。血红素-血红素反应包括血红素拉力的变化,通过两种交替的四级结构的转换引起的。在四级氧合构象(图1-11B)中,血红素结构松弛,引起高氧亲合性;在脱氧构象中通过亚基之间的接触血红素结构紧缩,引起低氧亲合性。血红素在紧缩状态,铁高度自旋;在松弛状态,铁自旋低。

2.肌肉蛋白(mytolin,muscle protein)的协同作用

肌肉蛋白的相互作用引起肌肉收缩,这是分子相互作用的最佳例子。由4种主要肌肉蛋白协同作用引起肌肉收缩:肌球蛋白(myosin)、肌动蛋白(actin)、原肌球蛋白(tropomyosin,TPM)和肌钙蛋白(troponin)。这几种蛋白质的功能依赖于它们在肌肉细胞内形成的高度有序的结构和协调的生物化学作用。

图1-12显示形成粗肌丝(thick filament)和细肌丝(thin filament)的有序高分辨的电子显微结构图。在肌肉收缩期间,肌肉纤维并未缩短,而是蛋白纤丝的相互替代。在松弛的肌肉中所有肌球蛋白头部垂直于肌球蛋白丝的轴,而在收缩期间向这些蛋白纤丝的轴倾斜。因此,通过肌球蛋白头部在垂直位置与肌动蛋白细丝(actin filament)的结合后引起肌肉收缩;并且,由于肌球蛋白头部的铰链区运动,替代肌动蛋白丝,引起整个肌肉的缩短,即肌肉收缩。在这种运动的后期,肌球蛋白头部与肌动蛋白分子之间连接发生分离,肌肉复原到松弛状态,并开始产生1个新的肌肉收缩周期。引起这些运动的能量由腺苷三磷酸(adenosine triphosphate,ATP)降解提供。肌肉开始收缩时钙离子起到决定性作用。

图1-11 血红蛋白的三级和四级结构

A.血红蛋白β亚基三级结构;B.血红蛋白的四级结构。

图1-12 肌纤维的超微结构图

(七)从生物信息学阐述蛋白质结构与功能的关系

生物信息学(bioinformatics)以获取、加工、储存、分配、分析和释读生物信息为手段,综合运用数学、计算机科学和生物学工具,以达到理解数据中的生物学含义的目的。生物信息学的发展为组学研究提供了重要方法。对于蛋白质结构和功能,尽管可以通过实验的方法来实现,但由于目前的蛋白质检测技术水平还远远跟不上涌现如潮的新基因数量,因此利用生物信息学工具快速预测蛋白结构与功能特性,对研究蛋白质组,尤其是对那些通过实验难以测定结构的蛋白质分析则具有更大的理论意义与实用价值。

1.通过生物信息学预测蛋白质结构

预测蛋白质结构,就是如何从蛋白质的氨基酸序列预测出其空间结构。由于蛋白质的生物学功能在很大程度上依赖于其空间结构,因而进行蛋白质的结构预测,对了解未知蛋白生物学功能具有重要意义。当得到一个未知的全新序列时,可以利用生物信息学技术,先从其中的部分问题着手,如比较未知蛋白是否与已知蛋白结构相似,比较未知序列是否含有特殊蛋白质家族或功能的保守残基等来判定其功能。此外,蛋白质的一些其他性质,如信号肽、跨膜螺旋和卷曲螺旋等,可通过网络软件直接由序列计算得到。

2.蛋白质结构分析

对于已知蛋白质结构进行分析、总结结构规律是各种结构预测方法的基础。蛋白质分子结构的一个显著特征是其结构的层次性。一般,用一至五级结构表示蛋白分子的不同结构层次。其中,五级结构是指由独立的生物大分子相互作用而成的聚集体,如蛋白质-核酸聚集体。蛋白质二级结构预测是蛋白质结构预测的关键步骤,在实际工作中有着广泛的用途:①可用于全新蛋白质的设计或蛋白质突变的设计;②有助于确定蛋白质空间结构与功能的关系;③有助于多维磁共振中二级结构的指认以及晶体结构的解析。