密码子的使用
原核和真核生物的基因对同义密码子的使用均表现非随机性[171,172]。对E.coli中密码子的使用频率进行系统分析得到以下结论[173]:(1)对于绝大多数的简并密码子中的一个或两个具有偏好;(2)某些密码子对所有不同的基因都是最常用的,无论蛋白质的含量多少,例如CCG是脯氨酸最常用的密码子;(3)高度表达的基因比低表达的基因表现更大程度的密码子偏好;(4)同义密码子的使用频率与相应的tRNA含量有高度相关性。这些结果暗示,富含E.coli不常用密码子(表1)的外源基因有可能在E.coli中得不到有效表达。已经证明[174],微精氨酸tRNAArg(AGG/AGA)是多种哺乳动物基因在细菌中表达的限制因子。因为AGA和AGG在E.coli中不常用。如果共表达编码tRNAArg(AGG/AGA)的argU(dnaY)基因,就会高水平表达目的蛋白[174]。但利用同方法所进行的另外几项研究的结果却不一致[175,176]。其他的研究表明,通过用常用密码子替换稀有密码子或与“稀有”tRNA基因共表达可以提高外源基因在E.coli中的表达水平[177,178]。许多研究者对有关密码子使用模式的进化意义和密码子使用效果的机制进行了研究,但至今尚未找到协调密码子的使用和转录本翻译的精确规则。似乎在转录本5’末端附近存在稀有密码子将会影响翻译效率。另外,基因5’编码区中GC含量似乎也影响其表达。这在人胸苷酸激酶(TS)中已经得到证明[179]。在不改变所编码蛋白的前提下,将TS cDNA的第三、四、五密码子的嘌呤碱基变成胸腺嘧啶,使得TS基因的表达占到E.coli中总蛋白量的25-30%。综上所述,有许多可变因素可能影响实验结果,如位置效应、稀有密码子的群集和mRNA的二级结构等等。
表1 E.coli中不常用的密码子
密码子 氨基酸 |
AGA,AGG,CGA,CGG Arg
UGU,UGC Cys
AUA Ile
CUA,CUC Leu
CCC,CCU,CCA Pro
UCA,AGU,UCG,UCC Ser
ACA Thr |
l 蛋白质的蛋白酶解
蛋白酶解是一个选择性的、高度调节的过程,该过程参与许多代谢活动。E.coli在细胞质、细胞外周质、内膜和外膜有许多蛋白酶[180,181]。这些蛋白酶参与宿主的代谢活动,如选择性地清除异常和错误折叠的蛋白。到目前为止,蛋白酶解的机制尚未完全明了,但已有一些策略和方法以减少E.coli中异源蛋白的降解。虽然使得蛋白质不稳定的精确结构特点还不清楚,但是通过系统研究已经明确了一些蛋白不稳定的决定因素。蛋白酶解途径的“N-末端规则”在E.coli中能够发挥作用,即蛋白质的稳定性与其氨基端的残基有关[182]。在E.coli中,N-末端Arg、Lys、Leu、Phe、Tyr和Trp的半衰期为2分钟,而除脯氨酸外的其他氨基酸的半衰期均超过10小时。有研究表明,在多肽的第二位带有较小侧链的氨基酸有利于甲硫氨酸氨肽酶催化的N-末端甲硫氨酸的去除,从而暴露出位于第二位的亮氨酸,使得该蛋白不稳定[183]。蛋白质的第二个决定因素是位于近氨基端的特异性内源赖氨酸残基[142,143]。该残基是多遍在蛋白链的受体,多遍在蛋白链在真核细胞中有利于遍在蛋白依赖的蛋白酶对蛋白质的降解。有趣的是在一个多遍在蛋白中,它的两个决定簇可以位于不同的亚基上,却能靶向同一个蛋白进行加工[184]。 氨基酸成分和蛋白质不稳定性的另一个关系体现在PEST假说中[185]。根据对短寿命真核蛋白的统计分析,蛋白质如果富含Pro、Glu、Ser和Thr的区域,且在该区域附近有某些特定的氨基酸,则该蛋白就会不稳定。这些PEST结构域的磷酸化导致钙的结合能力提高,从而利于钙依赖性蛋白酶对蛋白质的降解。这提示可以在缺乏PEST蛋白裂解系统的E.coli中表达PEST富含蛋白。
减少E.coli中重组蛋白裂解的策略有以下几种:(1)将蛋白质靶向细胞周质或培养基[145,186];(2)在较低的温度下培养细菌[187];(3)选用蛋白酶缺陷的菌株[188];(4)构建N-末端或C-末端融合蛋白[186];(5)将目的基因多拷贝串联[188];(6)与分子伴侣共表达[189];(7)与T4 pin基因共表达[190];(8)替换特定的氨基酸残基以消除蛋白酶裂解位点[191];(9)改善蛋白质的亲水性[192];(10)优化培养条件[193]
融合蛋白表达
在E.coli中表达外源蛋白,尤其是真核蛋白时,蛋白质的稳定性是经常遇到的问题。最近几年,众多巧妙的蛋白质——融合系统的发展,为E.coli中高效表达和纯化重组蛋白提供了极大方便。融合表达具有多方面的优点:如防止包涵体的形成,促进蛋白质的正确折叠,限制蛋白酶解和利于纯化[159,194]。
Uhlen和其同事[195]利用葡萄球菌A蛋白和合成的结构域(Z)开发了一种多功能的融合伴侣,除了能够作为纯化标记外,A蛋白组分还作为一种可溶性伴侣促进蛋白质的折叠,A蛋白信号肽的存在可使表达蛋白分泌到培养基中。另一个融合伴侣是链球菌G蛋白(SPG),它是一种细菌胞壁蛋白,在其氨基端具有分离的白蛋白结合区,在OH端具有免疫球蛋白IgG结合区[196]。最小的白蛋白结合区由来源于SPG的46个氨基酸残基组成,作为亲和纯化标记纯化cDNA编码的蛋白。如果将A蛋白和SPG结构域联合组成三联融合蛋白,则为纯化提供了更为广泛的选择,可以更进一步防止蛋白酶解。SPG-白蛋白的一个重要应用是其能够稳定哺乳动物外周循环中的短寿命蛋白,这一效应是通过SPG结构域与一种长寿命蛋白——血清白蛋白的结合来介导的[197]。
最近又建立了一种更为复杂和巧妙的亲和系统[198]。这种多元系统利用了七种不同的亲和标记,从而允许使用多种结合和洗脱条件,为重组蛋白的生产、检测和纯化提供了一个有力的工具。
使用基因融合表达系统在E.coli中表达外源基因已经越来越受欢迎。这在很大程度上归因于融合系统能够产生大量的可溶性的融合蛋白。谷胱甘肽S-转移酶(GST)、麦芽糖结合蛋白(MBP)以及硫氧还蛋白(Trx)均已经被证实能非常成功地生产正确折叠、有生物活性的蛋白质,能明显提高在E.coli细胞质中产生的融合蛋白的可溶性,并能抑制包涵体的形成[159,194]。其中每一种都备有方便的纯化方法,可将融合蛋白与细胞污染物分开。已经建立了多种对融合蛋白进行位点特异性裂解的方法,方法的选择通常由特定蛋白的组成、序列及物理性质决定[199]。可采用诸如溴化氰(Met↓)、羟胺(Asn↓Gly)、等试剂或低pH(Asp↓Pro)来进行融合蛋白的化学裂解。化学裂解的方法较便宜而且有效,甚至常常可以在变性的条件下裂解非变性不能溶解的蛋白质。但有时目的蛋白中存在裂解位点,或因发生副反应而导致对蛋白质进行不必要的修饰,从而阻碍了它们的应用。作为一个备选方案,酶解的方法相对来说其反映条件较温和,更重要的是,普遍用于此用途的蛋白酶都具有高度的特异性。其中常用的酶有:Xa因子、凝血酶、肠激酶、凝乳酶和胶原酶。所有这些酶都具有较长的底物识别序列,从而降低了蛋白质中其他无关部位发生断裂的可能性。在上述提及的各种酶中,Xa因子和肠激酶应用最多,因为它们切割各自的识别序列的羧基端,使带有天然氨基酸的被融合部分得以释放。