锌指是一种常出现在DNA结合蛋白质中的一种结构基元。锌螯合在氨基酸链中形成锌的指状结构。 锌是某些酶的活性辅助因子,也是某些蛋白质,包括RNA聚合酶的转录因子,如TFIIIA(transcription factor III,Asubtype)、类固醇受体等能结合脱氧核糖核酸(DNA)的蛋白质亦含有锌。以TFIIIA为例,锌以四个配价键和四个半胱氨酸(Cys;C)残基或半胱氨酸、组氨酸残基(His,H各两个相结合),形成的结构象个手指状。每个“指”含12~13个其他氨基酸。整个蛋白质分子可有2~9个这样的锌指重复单位。一个单位又以其指部伸入DNA双螺旋的深沟,接触5个核苷酸。此结构的功能就是为了适用于生物大分子之间相互结合或吻合的蛋白分子上局部结构形式,即基元(motif)之一,是配合生物的基因转录和调控的结构上保证因素之一。
锌指蛋白是一类,对基因调控起重要的作用。根据其保守结构域的不同,可将锌指蛋白主要分为C2H2型、C4型和C6型。锌指通过与靶分子DNA、RNA、DNA-RNA的序列特异性结合,以及与自身或其他锌指蛋白的结合,在转录和翻译水平上调控基因的表达、细胞分化以及胚胎发育。
DNA结合结构域转录因子的DNA结合结构域是DNA结合蛋白发挥其转录调控功能所必须的一个结合区,目前已发现的有以下几种DNA结合结构域类型。
①锌指结构域
锌指结构域(zinc finger motif)是指由少数保守的氨基酸短肽链围绕Zn2+离子折叠形成的一指状结构。而含有锌指结构的蛋白质称为锌指蛋白。锌指结构首先是在DNA结合区发现的,但在非DNA结合蛋白中也存在。目前已确认的锌指结构有3种。
第一种类型为C2H2锌指结构。其一致序列为Cys-X2~4-Cys-X3-Phe-X5-Leu-X2-His-X3-His(X代表任意氨基酸);两个Cys和两个His通过与Zn2+结合而形成稳定的指状结构,指状突出区分布着几个碱性氨基酸和保守疏水性氨基酸残基,在Cys和His之间约有12个氨基酸。这一类锌指结构是真核生物的转录因子中最常见的DNA结合基元,通常在调节蛋白的多肽链中串联重复出现,例如果蝇调节因子ADR1含有2个锌指,形成一个小的结构域;SP1的DNA结合区含有3个锌指;TFⅢA含有9个锌指,几乎占据了整个蛋白质,每个锌指的C端部分形成α螺旋,插入到DNA的大沟中,与DNA结合;N端部分形成β片层。
第二种类型为C4锌指结构。其一致序列为Cys-X12-Cys-X13-Cys-X2-Cys-X14~15-Cys-X5-Cys-X9-Cys-X2-Cys;在此类锌指结构中,每4个Cys通过配位方式结合一个Zn2+,共可结合2个Zn2+,形成2个锌指。C2H2锌指蛋白一般含有3个或更多的重复单位,能够以单体的形式与DNA结合;而C4锌指蛋白往往只有一个单位,因而需要以同或杂二聚体形式与DNA结合。C4锌指蛋白与细菌阻遏蛋白类似,它的同二聚体所识别的DNA序列为反向重复序列,而杂二聚体识别一段同向重复的DNA序列。例如,类固醇-肾上腺受体家族(属于核内转录因子)就具有C4锌指结构。在这些受体蛋白中,2个锌指形成α螺旋,进一步折叠形成球状结构区,受体蛋白二聚体结合于DNA相邻两个大沟中。研究结果表明,单体中的2个锌指,从N端开始的第一个锌指的C端部分负责与DNA结合,另一个锌指的N端的一侧负责二聚化反应。
第三种类型为C6锌指结构。其一序列为Cys-X2-Cys-X6-Cys-X5-6-Cys-X2-Cys-X6-Cys;6个相间排列并且十分保守的Cys通过配位键的作用,与2个Zn2+共同形成一个核心,并进一步形成折叠紧密的球状结构域,负责与DNA的结合。
②同源结构域
同源结构域(homeodomain,HD)是指同源盒基因家族中各基因间相同的保守序列。这种结构域约有60个氨基酸组成,其一级结构与原核生物抑制因子(repressor)的螺旋-转角-螺旋(helix-turn-helix,HTH)结构相类似。因此,又称为螺旋-转角-螺旋结构域。其主要特点是被β转角分离开的2个α螺旋中一个负责识别DNA大沟,另一个与DNA主链骨架非特异性结合。这类HTH蛋白往往以二聚体的形式与DNA结合。
在真核生物中,HD结构首先发现在果蝇胚胎发育的调节蛋白中。控制果蝇体节发育的调节基因antp、ftz、ubx等含有同源盒基因所编码的蛋白都有HTH结构并通常以二聚体形式结合于相邻的2个主沟中。现在脊椎动物中也发现了此结构。例如,哺乳动物八聚体结合因子Oct-1、Oct-2,脑垂体特异性结合因子Pit-1等。编码含有HD结构蛋白的基因组成一同源盒基因家族,其主要功能是参与生物有机体的发育分化过程的调控。
③亮氨酸拉链结构域
亮氨酸拉链结构域(leucine zipper dimerization domain)大约由35个氨基酸组成,它们是高度保守的,形成α螺旋结构,疏水基团位于螺旋一侧而亲水基团位于另一侧。按每间隔6个氨基酸就有一个亮氨酸残基的规律排列,这就导致了第7个亮氨酸残基都在螺旋的同一个方向出现。由于这类蛋白质都以二聚体形式与DNA结合,2个分子α螺旋的亮氨酸一侧是形成二聚体的结构基础,形同一条拉链被拉合,并因此得名。转录因子AP1、Fos、Jun、C/EBP、 GCN4、CREB等均具有这一结构,如Jun的2个亚基可形成同源二聚体,也可与Fos 的一个亚基共同形成异源二聚体。二聚体的形成是2个亚基中紧紧靠近的α螺旋中的亮氨酸重复区域通过疏水引力相互作用的结果。与亮氨酸拉链结构相邻近的碱性区域可能与结合DNA的功能有关,但对于二聚体的形成并不是所必需的。另一些蛋白质如Myc、Oct-2等也含有亮氨酸的重复结构,但不具备C/EBP类因子的保守碱性氨基酸区域。
④螺旋-环-螺旋结构域
螺旋-环-螺旋(helix-loop-helix,HLH)结构域可见于原癌基因产物Myc、肌肉细胞定向分化的调控因子MyoD-1家族、免疫球蛋白k轻链基因的增强子结合蛋白E12和E47等转录因子的结构中。其结构与上述的亮氨酸拉链结构非常相似,只是在2个α螺旋结构之间增加了一段非螺旋链结区(环),故称为螺旋-环-螺旋结构。HLH通过α螺旋疏水区形成二聚体,多数HLH蛋白还含有一个结合DNA所需要的碱性氨基酸区域。