l 转录水平调控
1. 启动子
能在E.coli中发挥作用的启动子很多。这些启动子必须具有适合高水平蛋白质合成的某些特性。首先启动子的作用要强,待表达基因的产物要占或超过菌体总蛋白的的10-30%;第二,它必须表现最低水平的基础转录活性。若要求大量的基因表达,最好选用高密度培养细胞和表现最低活性的可诱导和非抑制启动子。如果所表达的蛋白具有毒性或限制宿主细胞的生长,选用可抑制的启动子则至关重要[27,28]。例如,轮状病毒的VP7蛋白能有效地杀死细胞,因此必须在严格控制的条件下表达[29]。但在某些情况下,启动子的严格性并不合理,因为即使最小量的基因产物也能由于其毒性而杀死细胞。如能灭活核糖体或破坏膜渗透压的分子对细胞来说是致死性的[30]。对宿主的毒性并不仅限于外源基因,某种自身蛋白的过量表达也能造成同样的结果。如编码外膜磷脂蛋白的traT基因[31]。另外,不完全抑制的表达系统会造成质粒的不稳定,细胞生长速度的下降和重组蛋白产量的降低[32,33]。Lanzer和Bujard曾对常用的lac启动子-操纵子系统进行了广泛的研究,证明操纵子放在启动子序列的不同位置会造成70倍差异的抑制。将17bp的操纵子置于-10和-35六聚体区之间所形成的抑制比将其放在-35区的上游或-10区的下游要高50-70倍[34]。启动子的第三个特性是其简便和廉价的可诱导性。大量生产蛋白质最常用的启动子是热诱导(λPL)和化学诱导(trp)启动子。异丙基硫代-β-D-半乳糖苷(IPTG)诱导的杂交启动子tac[35]或trc[36]都是强启动子,在基础研究中应用很广。但在大量生产人用治疗性蛋白时用IPTG做诱导剂是不可取的,因为IPTG具有毒性而且价格昂贵[37]。IPTG的这些不足至今仍限制tac或trc强启动子在大量生产人用治疗性蛋白中的应用。编码热敏lac阻遏蛋白[38]的突变lacI(Ts)基因的出现使得目前能够对这些启动子进行热诱导[39,40]。另外,还出现了一些新型载体,它们允许在30℃对trc启动子进行严紧调节。最近还报道了两种不同的lac阻遏蛋白突变体,能够同时允许热诱导和IPTG诱导[41,42]。尽管野生型lacI基因也能热诱导,但不能对其进行严紧型调节,且不能用于lacIq 菌株,因为温度的变化不能遏制由lac阻遏蛋白的过量表达所造成的严紧性抑制[43]。因此,该系统只能用用于生产对宿主菌无害的一些蛋白。
冷反应启动子尽管不象其他启动子那样得到广泛的研究,但已经被证明能在低温条件下进行有效的基因表达。噬菌体λPL启动子的活性在20℃时最高,随着温度的升高,其活性逐渐降低[44]。PL启动子的冷反应由E.coli整合宿主因子,一种与DNA结合的序列特异性多功能蛋白来正调控[45,46]。主要冷应激基因cspA启动子同样也被证明在低温具有活性[47]。对cspA和PL启动子进行分子剖析,鉴定了在较低温度下参与增强转录的特异性DNA区域。从而开发了一系列在20℃低温具有高活性的PL衍生启动子[48]。选用冷反应启动子的基本原理是在15-20℃的条件下,蛋白质的折叠速度只受到轻微的影响,而作为生物化学反应,转录和翻译的速度将被充分降低。这就为蛋白质折叠、产生有活性的蛋白和避免非活性蛋白聚合体即包涵体的形成提供了充足的时间,而目的蛋白的最终产量并未减少。最近新报道的一些启动子具有诸多诱人之处,为选择新的高效表达系统提供了方便。如非常强的pH启动子[49,50],重组蛋白的产量可达总蛋白的40-50%[51]。但表达的水平会因不同的基因而有差异。因为蛋白质的合成不仅依赖于启动子的强弱,而且有赖于转录的效率。
人们通常只考虑E.coli启动子的核心区域,即-10和-35六核苷酸区和一15-19bp的间隔序列。但有人提出核心序列以外的元件也能刺激启动子的活性[52]。许多研究也已证明,核心启动子上游的序列能够在体内提高转录起始的效率[53,54,55]。Gourse等证明,位于E.coli rRNA启动子rrnB P1 -35区上游的DNA序列即UP元件,能够在体内和体外提高转录效率30倍[56]。UP元件是作为一个独立的启动子组件发挥作用的,因为将其融合到其他启动子如lacUV5中也能刺激转录[57,58]。UP元件与其他启动子融合所表现的这种转录增强子效应,使其有望通用于高效表达系统。尽管已经证明rRNA启动子P1、P2的超强能力[59],但它们仍未被用于E.coli进行高水平表达,其主要原因是难以对其进行调控。rRNA的体内合成从属于细胞增殖速度的控制。在细胞快速增殖期,P1和P2是活化的,当细胞处于生长的静息期,则P1、P2被负调节。因此,rRNA启动子在前诱导期将持续活化。在体内快速增殖的细胞中,P2的活性很弱,而且可诱导性差,但若与P1分开,P2启动子的活性明显升高(达到P1的70%),且对应激反应敏感。这表明在天然的串联体中,P2是部分关闭的[60]。Brosius和Holy[61]将lac操纵子序列插入到rrnB rRNA P2启动子的下游,在带有lacIq基因的菌株中成功地抑制了P2的活性。转录活性是以氯霉素乙酰转移酶的产生和4.5s RNA的表达为标准的。然而,P2构建体的活性只相当于tac启动子活性的1/2,而且当rrnB P1启动子被置于P2启动子下游时,不能完全抑制转录。有人试图利用反转启动子的方向来严格调控rRNA启动子。将rRNA启动子克隆于目的基因的上游,但转录方向相反。利用λ整合位点和可调控的λ整合酶来实现启动子的反转,从而达到进行诱导的目的,而且,在高度活化的启动子上游有一强转录终止子将避免在前诱导期可能出现的载体的不稳定性。
2. 转录终止子
在原核生物中,转录终止有两种不同的机制。一种是依赖六聚体蛋白rho的rho依赖性转录终止,rho蛋白能使新生RNA转录本从模板解离。另一种是rho非依赖性转录终止,它特异性依赖于模板上编码的信号,即在新生RNA中形成发卡结构的一回文序列区,和位于该回文序列下游4-9bp处的dA、dT富含区[62,63]。虽然转录终止子在表达质粒的构建过程中常被忽略,但有效的转录终止子是表达载体必不可少的元件,因为它们具有极其重要的作用。贯穿启动子的转录将抑制启动子的功能,造成所谓的启动子封堵[64]。这种效应可以通过在编码序列下游的适当位置放置一转录终止子,阻止转录贯穿别的启动子来避免。同样地,在启动目的基因的启动子上游放置一转录终止子,将最大限度地减小背景转录[65]。另有资料证明,由强启动子启动的转录会使转录通读到复制区,造成控制质粒拷贝数的ROP蛋白的过量表达,从而导致质粒的不稳定[66]。另外,转录终止增强mRNA的稳定性[67],从而提高蛋白质的表达水平。如果来源于E.coli rrB rRNA操纵子的两个转录终止子T1和T2串联,则效果更好[68]。但其他的许多转录终止子通常情况下都是十分有效的。
3.转录抗终止子
细菌中许多参与氨基酸生物合成的操纵子在其第一个结构基因的5'端含有转录衰减子。衰减子由特定操纵子的氨基酸产物调节。这样关联的带电荷tRNA的存在就会在核糖体剪切之后引导初始转录本中二级结构的形成。如果没有关联的带电荷tRNA,则会形成抗终止子结构,从而抑制终止子中发卡结构的形成和转录的终止[69]。抗终止元件能使RNA 多聚酶越过核糖体RNA操纵子中的rho依赖性终止子即boxA[70,71]。转录抗终止是有一个极其复杂的过程,其中包含许多已知和未知因子。有关这方面的知识已有详尽的综述。在此我们主要讨论抗终止元件在E.coli中表达外源基因的应用。
在E.coli表达系统中作用比较强、应用较广的一个启动子是噬菌体T7晚期启动子[72,73]。该系统的活性依赖于提供T7 RNA多聚酶的转录单元。RNA多聚酶的严格阻遏对防止T7启动子的渗漏是必需的。有许多用于调节T7多聚酶表达的途径,但每一种方法都有其各自的缺陷。Merten等通过构建一基于λPL调节的反转衰减T7 RNA多聚酶表达盒阐明了这一问题。可以通过在启动子和编码T7多聚酶的基因之间插入三个串联排列的转录终止子来削弱T7多聚酶的基础表达水平。在诱导的情况下,噬菌体λ来源的nutL依赖的抗终止功能也可以协同来阻止转录终止[74]。来源于E.colirrnB rRNA操纵子的转录抗终止区已被用于某些表达载体如pSE420。该载体应用trc启动子[75]。其基本原理是使得转录通过重度二级结构区,从而减少宿主RNA 多聚酶引起的转录提前终止的可能性。但是rrnB抗终止子在这种情况下似乎并不十分有效。
4.严紧型调节表达系统
可严紧调节的启动子的优点使得我们能够设计许多巧妙、可高度抑制的表达系统。这在表达那些产物对宿主的生长不利的基因时尤其有用。所用的策略包括“铺平板”法[76];提高抑制基因和操纵基因的比例[77];用突变的噬菌体感染诱导[28 ];致弱高拷贝数载体上的启动子活性[78];利用转录终止子和抗终止子[79];在拷贝数可控的质粒中使用可诱导的启动子[80];使用“交叉调节”系统[81];共转导使用SP6 RNA多聚酶的质粒[82];利用与克隆基因mRNA互补的反义RNA[31]。最后一个巧妙的方法是反转启动子:在启动子两侧为两个λ整合位点,启动子的方向与基因的表达方向相反,而且只通过由λ整合酶介导的诱导位点特意性遗传重组来完成反转[83,84]。
上述这些系统也各有其优缺点。即依赖固体培养基的方法不适用于大批量表达,高水平抑制系统常造成蛋白质产量的下降[85],这就有必要优化抑制基因和操纵基因的比例[86]。由λ噬菌体介导的诱导更增加了系统的复杂性,利用反转启动子迂回方法又引入了复杂的载体结构。尽管这些表达系统大多数尚未用于蛋白质的大规模、高产量生产,但是它们为基因表达提供了重要的工具。