顺式作用元件
提问 添加摘要
顺式作用元件(cis-actingelement)存在于基因旁侧序列中能影响基因表达的序列。顺式作用元件包括启动子、增强子、调控序列和可诱导元件等,它们的作用是参与基因表达的调控。顺式作用元件本身不编码任何蛋白质,仅仅提供一个作用位点,要与反式作用因子相互作用而起作用。
顺式作用元件-简介
顺式作用元件是指与结构基因串联的特定DNA序列,是转录因子的结合位点,它们通过与转录因子结合而调控基因转录的精确起始和转录效率。
顺式作用元件在分子遗传学领域,相对同一染色体或DNA分子而言为“顺式”(cis);对不同染色体或DNA分子而言为“反式”(trans)。
顺式作用元件是同一DNA分子中具有转录调节功能的特异DNA序列。按功能特性,真核基因顺式作用元件分为启动子、增强子及沉默子。
1、启动子──是原核操纵子中启动序列的同义语。真核基因启动子是RNA聚合酶结合位点周围的一组转录控制组件,每一组件含7~20bp的DNA序列。启动子包括至少一个转录起始点以及一个以上的机能组件。在这些机能组件中最具典型意义的就是TATA盒,它的共有序列是TATAAAA。TATA盒通常位于转录起始点上游-25~-30bp,控制转录起始的准确性及频率。TATA盒是基本转录因子TFIID结合位点。除TATA盒外,GC盒(GGGCGG)和CAAT盒(GCCAAT)也是很多基因常见的,它们通常位于转录起始点上游-30~-110bp区域。此外,还发现很多其它类型的机能组件。由TATA盒及转录起始点即可构成最简单的启动子。
2、增强子──就是远离转录起始点(1~30kb)、决定基因的时间、空间特异性表达、增强启动子转录活性的DNA序列,其发挥作用的方式通常与方向、距离无关。增强子也是由若干机能组件组成,有些机能组件既可在增强子、也可在启动子中出现。这些机能组件是特异转录因子结合DNA的核心序列。从机能上讲,没有增强子存在,启动子通常不能表现活性;没有启动子时,增强子也无法发挥作用。有时,对结构密切联系而无法区分的启动子、增强子样结构统称启动子。通常描述的、具有独立的转录活性和决定基因时间、空间特异性表达能力的启动子就是这类定义的启动子。在酵母基因,有一种类似高等真核增强子样作用的序列,称为上游激活序列(UASs),其在转录激活中的作用类似。
3、沉默子──某些基因含有的一种负性调节元件,当其结合特异蛋白因子时,对基因转录起阻遏作用。
顺式作用元件-基本信息
顺式作用元件是转录调节因子的结合位点,包括启动子、增强子和沉默子。真核基因启动子是原核启动序列的同义语。真核启动子是指RNA聚合酶及转录起始点周围的一组转录控制组件,每个启动子包括至少一个转录起始点以及一个以上的功能组件,转录调节因子即通过这些机能组件对转录起始发挥作用。在这些调节组件中最具典型意义的就是TATA盒子,它的共有序列是TATAAA。TATA盒子通常位于转录起始点上游-25至-30区域,控制转录的准确性和频率。TATA盒子是基本转录因子TFⅡD结合位点;TFⅡD则是RNA聚合酶结合DNA必不可少的。除TATA盒子外,GC盒子(GGGCGG)和CAAT盒子(GCCAAT)也是很多基因中常见的,它们位于起始点上游-30至-110bp区域。
所谓增强子就是远离转录起始点、决定组织特异性表达、增强启动子转录活性的特异DNA序列,其发挥作用的方式与方向、距离无关。增强子与启动子非常相似:都是由若干组件组成,有些组件既可在增强子、又可在启动子出现。从功能方面讲,没有增强子存在,启动子通常不能表现活性;没有启动子,增强子也无法发挥作用。增强子和启动子有时分隔很远,有时连续或交错覆盖。
某些基因有负性调节元件棗抑制子(沉默子)存在。有些DNA序列既可作为正性、又可作为负性调节元件发挥顺式调节作用,这取决于不同类型细胞中DNA结合因子的性质。
顺式作用元件-增强子
增强子是远离转录起始点、决定基因的时间、空间特异性表达、增强启动子转录活性的DNA序列,其发挥作用的方式通常与方向、距离无关,可位于转录起始点的上游或下游。从功能上讲,没有增强子存在,启动子通常不能表现活性;没有启动子时,增强子也无法发挥作用。
增强子最早是在SV40病毒中发现的长约200bp的一段DNA,可使旁侧的基因转录效率提高100倍,其后在多种真核生物,甚至在原核生物中都发现了增强子。增强子的长度通常为100~200bp,和启动子一样由若干组件构成,基本核心组件常为8~12bp,可以单拷贝或多拷贝串联形式存在。
增强子的特点
(1)增强子可提高同一条DNA链上基因转录效率,可以远距离作用,通常距离l~4kb,个别情况下离开所调控的基因30kb仍能发挥作用,而且在基因的上游或下游都能起作用。
(2)增强子作用与其序列的正反方向无关,将增强子方向倒置依然能起作用。而将启动子倒置就不能起作用,可见增强子与启动子是很不相同的。
(3)增强子要有启动子才能发挥作用,没有启动子存在,增强子不能表现其活性。但增强子对启动子没有严格的专一性,同一增强子可以影响不同类型启动子的转录。
(4)增强子必须与特定的蛋白质因子结合后才能发挥增强转录的作用。增强子一般具有组织或细胞特异性,许多增强子只在某些细胞或组织中表现活性,是由这些细胞或组织中具有的特异性蛋白质因子所决定的。例如,人类胰岛素基因5’端上游约250个核苷酸处有一组织特异性增强子。在胰岛素p细胞中有一种特异性蛋白因子,可以作用于这个区域,以增强胰岛素基因的转录。在其他组织细胞中没有这种蛋白因子,所以也就没有此作用。这就是为什么胰岛素基因只有在胰岛素p细胞中才能很好表达的重要原因。
(5)大多为重复序列,一般长约50bp,适合与某些蛋白因子结合。其内部常含有一个核心序列,即(G)TGGA/TA/TA/T(G),是产生增强效应时所必需的。
(6)增强效应十分明显,一般能使基因转录频率增加10—200倍。经人巨大细胞病毒增强子增强后的珠蛋白基因表达频率比该基因正常转录高600~1000倍。
(7)许多增强子还受外部信号的调控,如金属硫蛋白的基因启动区上游所带的增强子,就可以对环境中的锌、镉浓度做出反应。
(8)增强子的功能是可以累加的。SV40增强子序列可以被分为两半,每一半序列本身作为增强子功能很弱,但合在一起,即使其中间插入一些别的序列,仍然是一个有效的增强子。因此,要使一个增强子失活必须在多个位点上造成突变。对SV40增强子而言,没有任何单个的突变可以使其活力降低10倍。
增强子的作用原理:一种观点认为,增强子为转录因子提供进入启动子区的位点。另一种认为,增强子能改变染色质的构象。因为增强子区域容易发生从B—DNA到Z—DNA的构象变化。
顺式作用元件-作用
顺式作用元件是同一DNA分子中具有特殊功能的转录因子DNA结合位点和其它调控基序,在基因转录起始调控中起重要作用;按功能特性分为通用调节元件如启动子、增强子及沉默子和专一性元件如激素反应元件,cAMP反应元件;确定顺式作用元件的试验方法主要有:DNA结构分析、序列分析和基因删除或替换等,软件预测是确定顺式作用元件的另一种方法,但不同软件预测结果差异较大,将试验方法与软件预测相结合能够提高顺式作用元件预测的准确性。
多细胞有机体在生长、分化和发育过程中需要整合不同组织的、发育的、环境的信号调节基因表达,转录起始的调节是其中的重要一环。顺式作用(cisacting)元件是同一DNA分子中具有转录调节功能的特异DNA序列,即具有特殊功能的转录因子DNA结合位点和其他调控基序(motif)。
顺式作用元件-与反式作用因子关系
反式作用因子(trans-acting factor)
顺式作用元件:真核生物中没有操纵子,调节基因中调控序列有许多能结合动中调控蛋白的元件叫顺式作用元件,它们往往与结构基因保持一定的距离。
反式作用因子:指和顺式作用元件结合的可扩散性蛋白,包括基础因子,上游因子,诱导因子。
真核生物的转录调控是调控的最重要的途经,大多是通过顺式作用元件和反式作用因子复杂的相互作用而实现的。顺式作用元件(cis-actingelement)存在于基因旁侧序列中能影响基因表达的序列,它们的作用是参与基因表达的调控,本身不编码任何蛋白质,仅仅提供一个作用位点,要与反式作用因子相互作用而起作用。启动子存在着很多顺式元件,可分为以下四种类型:①核心启动子成分,如TATA框;②上游启动子成分,如CAAT框,GC框,ATF结合位点;③远上游元件:如增强子,沉默子等;④特殊启动子成分:如淋巴细胞中的Oct(octamer)和κB。这些元件都为不同的转录因子及蛋白质识别和结合来调节转录。
反式作用因子(trans-actingfactor)通过以下不同的途经发挥调控作用:蛋白质和DNA相互作用;蛋白质和配基结合;蛋白质之间的相互作用以及蛋白质的修饰。参与基因表达调控的因子,它们与特异的靶基因的顺式元件结合起作用。编码反式作用因子的基因与被反式作用因子调控的靶序列(基因)不在同一染色体上。反式作用因子有两个重要的功能结构域:DNA结合结构域和转录活化结构域,它们是其发挥转录调控功能的必需结构。反式作用因子可被诱导合成,其活性也受多种因素的调节。同一类序列特异性的反式作用因子由多基因家族所编码。
与转录水平调节的反式作用因子通常可分为四大类(RobertG.Roeder,2004):①RNA聚合酶;②和RNA聚合酶相联系的普遍性转录因子(generaltranscriptionfactor,GTFs)它们结合在靶基因的启动子上,形成前起始复合物(pre-initiationcomplex,PIC),启动基因的转录;③特异性转录因子(gene-specific(DNA-binding)regulatoryfactors)(如激活因子和抑制因子),一类与靶基因启动子和增强子(或沉默子)特异结合的转录因子,具有细胞及基因特异性,可以增强或抑制靶基因的转录;④种类多样的协调因子(coregulatoryfactors),要么改变局部染色质的构像(如组蛋白酰基转移酶和甲基转移酶),对基因转录的起始具有推动作用,要么直接在转录因子和前起始复合物之间发挥桥梁作用(如中介因子(Mediator)),推动前起始复合物(PIC)形成和发挥作用。包括:
1、螺旋转角螺旋(Helix-turn-helix):有3个螺旋,螺旋3是识别和DNA结合,一般结合于大沟;螺旋1和2和其它蛋白质结合。
2、锌指结构:锌指(zincfimger)这个名称来源于它的结构,它由一小组保守的氨基酸和锌离子结合,在蛋白质中形成了相对独立的功能域,像一根根手指伸向DNA的大沟。两种类型的DNA结合蛋白具有这种结构,一类是锌指蛋白,另一类是甾类受体。
3、亮氨酸拉链(Leucineziipper)两个蛋白之间相互作用共同建立一个转录复合体,在一系列转录因子中发现的一种模体涉及两个相同和不同的部分构成。亮氨酸拉链是一种富含亮氨酸的蛋白链形成的二聚体模体。它本身形成二聚体同时还可以识到特殊的DNA序列。一个亲水的α-螺旋在其表面的一侧有疏水基因(包括亮氨酸),另一侧表面带有电荷。
4、螺旋一环一螺旋(HLH)
5、同源异形结构域(Homeodomains,HD):同源异形盒(hoomeobox)是一种编码60aa的序列,长180bp,几乎存在于所有真核生物中。
真核生物转录的调控也是调控的最重要的途经,其启动子存在着很多顺式元件(见12章)可分为以下四种类型
(1) 核心启动子成分,如TATA框;
(2) 上游启动子成分,如CAAT框,GC框,八聚体(octamet),ATF结合位点;
(3) 远上游顺序:如增强子,酵母中的UAS(upstream activaator seguences)减弱子、静息子等。
(4) 特殊细胞中的启动子成分:如淋巴细胞中的Oct(octamer)和κB。这些元件都为不同的转录因子及蛋白质识别和结合来调节转录。
在真核细胞中鉴别出大量的转录因子,有的结合在增强子区,如甾类-受体复合物;另一些结合在启动子的顺式-作用元件上,与RNA polⅡ结合成前起始复合体,使RNA polⅡ起始转录。
根据靶位点的特点反式作用因子可以分为3类;
(1) 通用反式作用因子,在一般细胞中普遍存在,主要识别一些启动子的核心启动成
分TATA框,如TBP;上游启动子成分CAAT框,如CTF/NF-1;GC框如SP1;识别八聚体核苷酸的Oct-1等;
(2)特殊组织与细胞中的反式作用因子,如淋巴细胞中的Oct-2;
(3)和反应性元件(response elenents)相结合的反式作用因子。反应性元件如HSE(热休克反应元件,heat shock response element),GRE(糖皮质激素反应元件glucocorticoid response element);MRE(金属反应元件,metal response element);TRE(肿瘤诱导剂反应元件,tumorgenic agent response element);SRE(血清反应元件serum response element)。
反应元件是启动子或增强子的上游元件,它们含有短的保守顺序。在不同的基因中反应元件的顺序密切相关,但并不一定相同,离起始点的距离并不固定,一般位于上游小于200bp处,有的也可以位于启动子或增强子中。
反式作用因子通过以下不同的途经发挥调控作用:蛋白质和DNA相互作用;蛋白质和配基结合;蛋白质之间的相互作用以及蛋白质的修饰。
一)蛋白质直接和DNA结合
1. 螺旋转角螺旋(Helix-turn-helix):
在很多细菌的调节蛋白中有这种相同的模体存在,如λ的CI蛋白,cro蛋白(见17章),在酵母中涉及交配型的a1和a2蛋白也是以这种形式和DNA结合的。在高等真核中的Oct-1和Oct-2也属于此类型;在果蝇早期胚胎发育中决定体节的一些基因如bicoid编 码的蛋白称为同源异形蛋白(homeotic proteins)也含有相似的DNA结合功能域。此序列称为同源异形盒(homeotic box)和原核的HTH有一些差别。螺旋转角旋有3个螺旋,螺旋3是识别和DNA结合,一般结合于大沟;螺旋1和2和其它蛋白质结合。
2. 锌指结构
锌指(zinc fimger)这个名称来源于它的结构,它由一小组保守的氨基酸和锌离子结合,在蛋白质中形成了相对独立的功能域,像一根根手指伸向DNA的大沟。两种类 型的DNA结合蛋白具有这种结构,一类是锌指蛋白,另一类是甾类受体。典型的锌指蛋白有一组锌指,单个的锌指的保守序列是:Cys-X2-4-Cys-X3-Phe-X5-Leu-X2-His-X2-His,根据锌结合位点的氨基酸又把锌指分成为2Cys/2His和2cys/2cys两类,前者为Ⅰ型,后者为Ⅱ型锌指,Ⅰ型结构“指”的本身由23aa组成,“指”与“指”之间通常由7-8aa连接。
转录因子TF ⅢA(RNA pol Ⅲ转录5S RNA gene 时所需)的锌指结构组有9个“指”组成串联重复。在转录因子SPI中只有3个“指”;它和用RNA pol Ⅱ的很多启动子的起始有关。还有其它的一些DNA结合蛋白都属于此类锌指蛋白。2Cys在反向平行的β-折叠中,而2His在α螺旋中,I型锌指属于较原始的类型。
Ⅱ型锌指的保守序列为:Cys-X2-Cys-X1-3-Cy3-X2-Cys 带有此类锌指结构的调节蛋白如表18-9所示。这类蛋白常有非重复的指,此和I型锌指结构不同。此类锌指的 DNA的结合位点是短的回文序列。突变分析表明调节蛋白和DNA结合的 区域包括锌指模体。两型锌指是有差别的,用甾类受体做实验。表明如经突变将后两个Cys变成His的活。这种受体就不能激活靶基因。因此这两类锌指是不能 互相转变的。
糖皮质激素和雌激素受体都有两个“指”,每个指在Cys四分体的中央带有一个锌原子。两个指形成α-螺旋,彼此折叠成一个大的球状功能域。α-螺旋的芳香族和与螺旋相连的β折叠一道形成一个疏水中心。N-端螺旋的一侧和DNA的大沟接触,两个糖皮质激素受体形成二聚体和DNA结合,每个受体负责和连续的大沟接触。每个“指”控制着受体的重要特点。在第一个“指”的右侧控制受DNA的结合,在第二指的左侧控制着形成二聚体的能力。
直接的证据表明第一锌指的DNA结合区是通过“特异的交换”实验获得的,即雌激素受体的锌指被缺失,而以糖皮质激素受体取而代之。这个新的蛋白可识别GRE序列(平常是糖皮质激素的靶序列),而不识别ERE序列(雌激素的靶序列)。GRE和ERE的序列有些相似,进一步交换实验表明二者的第一个锌指基部的2个氨基酸残基有差别。
3. 亮氨酸拉链(Leucine ziipper)
两个蛋白之间相互作用共同建立一个转录复合体,在一系列转录因子中发现的一种模体涉及两个相同和不同的部分构成。亮氨酸拉链是一种富含亮氨酸的蛋白链形成的二聚体模体。它本身形成二聚体同时还可以识到特殊的DNA序列。
一个亲水的α-螺旋在其表面的一侧有疏水基因(包括亮氨酸),另一侧表面带有电荷。
亮氨酸拉链蛋白通过疏水界面上的亮氨酸形成二聚体。在肽链上两Leu之间相融7个氨酸,这样使它们在α-螺旋中排列成一条直线。亮氨酸拉链的侧翼是DNA结合功能区含有很多的Lys和Arg。二聚体的形成对于DNA的结合是必要的。大量地原癌基因,例如c-jun 和c-fos都 编码亮氨酸拉链蛋白,它们本身相互作用,形成同二聚体(honwdimers)或异二聚体(hefercdimers)。C-Jun和C-Fos蛋白的异 二聚体的结合比它们同二聚体更为坚固。Myc,C/EBP(结合CAAT box和SV40核心增强子的一种因子),AP1蛋白(异二聚体,结合于SV40的增强子)等都具有亮氨酸拉链结构。过去认为二聚体之间亮氨酸与亮氨酸是 交错连接,像“拉链”一样。而现在认为亮氨酸与亮氨酸是相对连接的。
4. 螺旋一环一螺旋(HLH)
螺旋一环一螺旋(HLH,helix-loop-helix)蛋白具有共同类型的模体:有一条含有两个亲水的α-螺旋,链长为40~50 aa,两个α- 螺旋由很长的连接区(环)相连,螺旋的一侧有疏水氨基酸,两条链依赖疏水氨基酸的相互作用形成同二聚体或异二聚体,此螺旋区长约15~16aa,含有各种 保守的残基,连接环的长度不等,一般为12-28aa。与DNA结合的是碱性区,长为15 aa,其中有6aa为碱性。在HLH中带有碱性区的肽链称为 碱性HLH(bHLH,proteim)。bHLH又分为两类。A类是可以广泛表达的蛋白,包括哺乳动物的E12/E47(可和免疫球蛋基因增强子中的元 件结合)和果蝇da(daughterless,性别控制的总开关基因)的产物;B类是组织特异性表达的蛋白,包括哺乳 动物的MyoD(肌浆蛋白(myogen)基因的转录因子)和果蝇的AC-S(achaete-scute 无刚无基因的产物)这种bHLH可能是一种转录调控蛋白,大部分以异二聚体形式存在。
5.同源异形结构域(Homeodomains,HD)
同源异形盒(hoomeobox) 是一种编码60aa的序列,长180bp,几乎存在于所有真核生物中,它的名字是来源于最初在果蝇中鉴别出的同源异形座位(homeotic loci)。它存在于很多控制果蝇早期发育基因中(见23章),在高等生物中也发现了相关基序。HD的C-端区域和原核阻遏蛋白的HTH同源,但也有几点 不同:(1)HD的C端由3个α-螺旋构成,螺旋3结合于大沟,长17aa;而阻遏蛋白由5个α-螺旋构成,螺旋3长仅9个 aa;(2)原核的HTH的以二聚体形式与DNA结合,靶序列是回文结构,而HD是以单体形式与DNA结合,靶序列不是回文结构;(3)HD N-端的臂位于小沟,而HTH螺旋1的末端与DNA的背面接触。
二)蛋白质和配基的结合
有的调节蛋白并不直接与DNA 接触,而先和配基结合被活化,如甾类受体蛋白等,当甾类激素等配基进入细胞后,在细胞质中受体与之结合,结合后受体构象发生改变,形成二聚体,成为活化状 态,然后进入细胞核。受体识别特殊的保守顺序GRE并与之结合,从而活化了其下游的启动子,使糖皮质激素调节基因开始转录。诱导产生各种相应的蛋白。甾类 受体蛋白一般都具有3个不同的功能区:(1)N-端区是激活转录所需的区域,不同受体之间此区的同一性仅小于15%;(2)DNA结合及转录活化区,同一 性较高为94-42%;(3)C-端的激素结合和二聚体形成区,同一性为57-15%。
(三)蛋白质之间的相互作用
反式的作用因子的另一种调控的形式是以蛋白质与蛋白质之间的相互作用,酵母半乳糖代谢中GAL80和GAL4的相互作用就是很好的例子。酵母半乳糖代谢调控和原核生物gal操纵中的调控形式是完全不同的:(1)被调节的基因绝大部分都是位于不同的染色体上,不连锁;(2)起负调节作用的蛋白GAL80不直接和DNA结合,而是通过和作为转录激活因子的GAL4蛋白结合,占据其功能域来阻遏转录的;(3)作为正调节因子不仅需要半乳糖作为诱导物,还需要GAL4蛋白作为转录因子,它不是像原核中的正调节蛋白仅和操纵子中的操纵基因结合,使整个基因簇得以转录,而是分别和各个被调节基因上游元件UAS结合,促进转录。
GAL4蛋白和λ的阻遏蛋白相似有DNA结合功能域,又具有转录活功能域,它以二聚体的形式结合于被调节基因上游特殊序列UASG (upstream activator sequence-galactose)上。UASG由4个相同的17bp序列构成,每个序列都呈两侧对称,和一个二聚体结合,那么转录激活是低水平的,若4个序列都和GAL4结合的话,表达达到最高水平。
GAL4的结构是利用功能区转换(domain-swapping)实验获得的。其768~881氨基酸区域为转录激活功能区,或以和转录因子相结合,这个区域中的851~881区域又可特异地和GAL80蛋白相结合。当半乳糖缺乏时GAL80就在此区域和GAL4相结合,占据了其转录激活功能区,而无法和转录因子结合,虽此时的GAL4仍可和UASG结合,但失去了转录激活能力,因此gal基因不转录;当半乳糖存在时它可以和GAL80结合,可能使其构象发生改变,从GAL4上解离下来,这样GAL4又可以和转录因子相结合,恢复了转录活性的功能。
TFⅡD和TFⅡB的相互作用也属于蛋白质之间的相互作用调节转录的例子。
评论