包含RAMP功能的通用蛋白质过表达标记及其应用

申请号 CN201480014969.2 申请日 2014-02-27 公开(公告)号 CN105143464B 公开(公告)日 2017-06-30
申请人 全南大学校产学协力团; 发明人 金根重; 朴愿筫; 刘成焕; 李镇永; 李恩槟; 闵思荣;
摘要 本 发明 涉及一种RAMP标记(ramp tag),其能够解决使重组 蛋白质 在大肠菌(E.coli)中表达时因外源基因中的密码子(codon)与宿主的相容性差而发生的翻译速度的不 稳定性 。与解决稀有密码子(rare codon)的问题的以往的密码子优化(codon optimization)或密码子去优化(codon deoptimization)方法不同,本发明不更换原来的密码子序列,而仅通过使RAMP标记与目标基因融合或独立地表达,再使用tRNA,从而增加目标蛋白质的表达效率。由此,本发明作为与人工合成DNA序列的密码子优化方法相比能够减少 费用 和时间并增加重组蛋白质表达的新方法,被期待可利用于附加价值高的医药品或工业用酶的生产。
权利要求

1.一种翻译速度调节用RAMP标记的制造方法,其包括:制作与宿主细胞相应的稀有密码子表的步骤;将目标基因的DNA序列转换为密码子的步骤;分析所述制作的稀有密码子表中的稀有密码子在目标基因ORF即开放读码框中出现的频率位置的步骤;以及收集稀有密码子并进行配置的步骤,
其中所述RAMP标记选自序列号1至序列号42。
2.根据权利要求1所述的方法,其中所述稀有密码子的收集通过分析密码子的频率和同工受体tRNA基因数而实现。
3.根据权利要求2所述的方法,其中密码子的频率为0.5~3%,同工受体tRNA基因数为
0~2个。
4.根据权利要求1所述的方法,其中所述稀有密码子的配置是按照在ORF中出现的顺序进行配置。
5.根据权利要求1所述的方法,其中在所述稀有密码子之间配置偏爱密码子。
6.根据权利要求1所述的方法,其中宿主细胞选自大肠菌、酵母、中国仓鼠卵巢细胞、人类细胞及植物细胞。
7.根据权利要求6所述的方法,其中宿主细胞选自大肠菌K-12、酿酒酵母、CHO-K1、HEK 
293t及326-GFP。
8.根据权利要求1所述的方法,其特征在于,目标基因是编码不表达和难表达之蛋白质的基因。
9.根据权利要求8所述的方法,其特征在于,基因编码酯酶、β-葡萄糖苷酶、溶细胞素A即ClyA、重组抗体单链Fv即scFv、天冬酰胺酶B、四-细胞粘附分子即T-CAM、B3(Fv)PE38、氯霉素乙酰基转移酶即CAT、新普鲁兰酶、白细胞介素-1、白细胞介素-32、抗B淋巴细胞抗原CD20即抗-CD20抗体、和抗肿瘤坏死因子α即抗-TNFα。
10.一种翻译速度调节用RAMP标记,其利用权利要求1~8中任一项所述的制造方法来制造,其中所述RAMP标记选自序列号1至序列号42。
11.一种增加在宿主细胞中不表达和难表达之蛋白质的表达效率的方法,其包括:在宿主细胞中收集稀有密码子的步骤;构成针对目标基因的RAMP标记的步骤;制造包含RAMP标记和目标基因的表达载体的步骤;用表达载体对宿主细胞进行转化的步骤;将在适合表达蛋白质的培养基中转化的宿主细胞进行培养的步骤,
其中所述RAMP标记选自序列号1至序列号42。
12.根据权利要求11所述的方法,其中所述稀有密码子的收集通过分析密码子的频率和同工受体tRNA基因数而实现。
13.根据权利要求12所述的方法,其中密码子的频率为0.5~3%,同工受体tRNA基因数为0~2个。
14.根据权利要求11所述的方法,其中所述RAMP标记构成是按照稀有密码子在目标基因中出现的顺序来实现。
15.根据权利要求11所述的方法,其中在所述稀有密码子之间配置偏爱密码子。
16.根据权利要求11所述的方法,其中所述宿主细胞选自大肠菌K-12、酿酒酵母、CHO-K1、HEK 293t及326-GFP。
17.根据权利要求11所述的方法,其中目标基因是编码不表达和难表达之蛋白质的基因。
18.根据权利要求17所述的方法,其中所述基因编码酯酶、β-葡萄糖苷酶、溶细胞素A即ClyA、重组抗体单链Fv即scFv、天冬酰胺酶B、四-细胞粘附分子即T-CAM、B3(Fv)PE38、氯霉素乙酰转移酶即CAT、新普鲁兰酶、白细胞介素-1、白细胞介素-32、抗B淋巴细胞抗原CD20即抗-CD20抗体、抗肿瘤坏死因子α即抗-TNFα。
19.根据权利要求11所述的方法,其中RAMP标记配置成融合于目标基因的5'或3',或者配置成导入到目标基因的内部,或者配置成独立地进行翻译。
20.根据权利要求11所述的方法,其中RAMP标记进一步与其它标记或融合蛋白质一起使用。
21.根据权利要求20所述的方法,其中所述其它标记为选自His标记、T7标记、S-标记、Flag-标记、HA-标记、V5表位、PelB及Xpress表位中的1种以上。
22.根据权利要求20所述的方法,其中所述融合蛋白质为选自GST、MBP、NusA、CBP、GFP、硫还蛋白、Mistic、Sumo及DSB中的1种以上。
23.一种目标蛋白质的分离方法,其包括使能与亲和层析结合的稀有密码子嫁接到权利要求10所述的RAMP标记从而纯化过表达的目标蛋白质的步骤。
24.根据权利要求23所述的目标蛋白质的分离方法,其中所述方法包括使能与亲和层析结合的组酸稀有密码子嫁接到权利要求10所述的RAMP标记从而通过Ni-NTA树脂纯化过表达的目标蛋白质的步骤。
25.一种从蛋白质中去除RAMP标记的方法,其包括将权利要求10所述的RAMP标记与信号序列或者RAMP标记与蛋白质切割位点融合的步骤。
26.根据权利要求25所述的方法,其中所述切割位点是IgA-蛋白酶、粒酶B、Tev蛋白酶、预切割蛋白酶、凝血酶、Xa因子或肠激酶所识别的肽序列。
27.一种使用RAMP标记的方法,其包括将权利要求10所述的RAMP标记与诱导型启动子、Kozak序列、mRNA剪接信号、多腺苷酸化信号或夏因-达尔加诺序列一起使用的步骤。
28.一种多基因表达方法,其包括将权利要求10的RAMP标记与多个酶的簇或操纵子过表达的步骤。
29.根据权利要求28所述的方法,其中所述多个酶是1-脱氧-D-木糖-5-磷酸合酶(dxs)和IPP异构酶(idi)。
30.一种基因表达方法,其包括增加权利要求10所述的RAMP标记和目标酶的酶活性的步骤。
31.根据权利要求30所述的方法,其中所述目标酶是β-内酰胺酶。

说明书全文

包含RAMP功能的通用蛋白质过表达标记及其应用

技术领域

[0001] 本发明涉及在细胞中能够改善重组蛋白质的难表达/不表达问题的合成标记。更具体地说,通过使标记(tag)在转录或翻译阶段中、在目标基因的内/外部一起行动(通过tRNA的选择诱导 和再使用提供而调节翻译速度),从而改善杂合基因中存在宿主的稀有密码子(rare codon)时成为问题的翻译速度阻碍以及非均匀的蛋白质表达问题,稳定地诱导蛋白质的功能性过表达。

背景技术

[0002] 有用蛋白质通常可以大致分为诸如免疫调节剂、酶抑制剂激素之类的医药及诸如研究用蛋白质和诊断用蛋白质或反应添加酶之类的工业用蛋白质。在大量生产这样的蛋白质的过程中,务必需要基因表达、培养、纯化技术。特别是表达技术在生产工艺技术过程中占据最重要的部分,是判断经济性的核心指标,因此其是提高附加价值和效用性的主要工艺。以往为了获得特定蛋白质,使用了如下方法:筛选出生产性高的细菌或动物细胞株,由此生产所需的蛋白质,并进行分离纯化。但是,就这样的方法而言,收率有限,且在应用于其它蛋白质的情况下,不仅无法确保相等的生产性,而且在获得优质(形态/结构/功能上相同的蛋白质)的产品方面上存在很多问题。目前,随着基因重组(遗传工程学)技术的发达,普遍使用如下方法:将有用基因转化到大肠菌或动植物细胞株等中,容易获得大量的所需蛋白质。特别是生产性与费用有关,因此利用具有能够在价格比较低的培养基中快速且以高浓度培养的优点的生物(大肠菌、酵母或放线菌等单细胞)的重组蛋白质的大量生产在商业方面具有很大的优点是已为人所知的。此外,就这些宿主而言,已经查明了生理/遗传学特性,且用于操作重组基因的有效方法和技术的发展良好。因此,由于具有能够高效获得目标杂合有用蛋白质的优点,成功地生产了胰岛素等医/药用蛋白质和工业用酶等。已知,在具有相对复杂的生理/遗传现象和调节机制的动植物宿主的情况下,需要很难的基因操作/调节过程,因此实际情况是,对于适用于生物体的医药用蛋白质以外的外源基因表达,利用频率相对低。但是在利用通用的表达调节机制的情况下,能够克服这样的缺点,因此对于能够同样应用于包括原核细胞株的所有真核细胞株的表达调节法的开发或改良,正在进行大量研究。
[0003] 用于生产重组蛋白质的表达系统在载体、宿主、ORF(开放读码框(open reading frame))平上试图接近工程方法,与此关联开发的技术的原型(prototype)较为人所熟知的(Marino,M.H.,Biopharm.2(1989)18-33;Goeddel,D.V.et al.,Methods Enzymol.185(1990)3-7;Wurm,F.and Bernard,A.,Curr.Opin.Biotechnol.10(1999)156-159)。通过以这种原型技术为基础的各种策略和技术变形,报道了很多外源基因的成功表达,但实际情况是,由于泛化逻辑的缺乏,通常要求根据特定基因重优化表达系统构成要素的一部分或者全部的过程。在这样的过程中,利用通过强启动子和调节因子的组合而诱导转录物量增加的策略和以转录物的二级结构、热稳定性增加为主的表达策略。但是已知,这样的策略缺乏可应用于所有蛋白质的泛化逻辑,更重要的是,仍存在与转录物和翻译的蛋白质量没有明显的相关关系的情况频繁发生的问题。最近,作为解决这样的问题的对策,与蛋白质翻译效率增加或者速度调节有关的新的表达策略被已知为可泛化的潜在逻辑。
[0004] 在翻译阶段发生的低表达效率起因于外源基因的编码序列(codon),所述外源基因具有表现出与宿主细胞中表达良好的固有(innate)基因的蛋白质编码序列不同的模式的密码子使用(codon usage)频率。由于与基因组编码位点的密码子配对而进化(coevolution)的宿主的tRNA池内的密码子偏爱性(codon preference)很偏向,因此每个细胞由偏向的密码子翻译各基酸是公知的事实。此外熟知,密码子利用过程中的偏向性可以使肽链伸长率(peptide elongation rate)发生变化( M.A.et al.,1993)。由此,对于最有效的重组蛋白质的生产而言,随着为了提高转录效率而考虑的载体序列(启动子和操纵基因)和考虑了与其相互作用的因子的在转录模水平上的改良,考虑到宿主的密码子使用,需要变更或调节外源基因密码子。作为用于解决这样的蛋白质翻译抑制问题的多种方法的一环,开发了密码子优化技术(codon optimization technique)。
作为用于提高翻译时低效的蛋白质编码位点的翻译速度的尝试,通常利用将宿主细胞中几乎不使用或者很少使用的密码子(稀有密码子)置换为偏爱密码子(preferred codon)的策略。
[0005] 密码子优化,是指通过减少野生型基因中的稀有密码子比率而增加翻译速度的方法来提高重组蛋白质的表达量,其以宿主特异性的密码子使用表为基础在电脑上容易实现。如果输入目标基因的序列,并输入利用于表达的宿主的密码子表(codon table),则会置换成显示出最高频率(frequency)的密码子,按照评分(score)高的顺序生成结果。但是,需要人工合成将野生型ORF基序列更换成编码同种氨基酸的其它序列(同义密码子(synonymous codon))的DNA,因此在费用方面负担大。此外,根据密码子分类基准或方法,需要进行合成多种基因的实验,与预料的相反,频繁地发现不显示与野生型基因相比提高了的表达量的情况。更极端地,还报道了在非密码子优化的密码子去优化(codon de-optimization)(应用与优化相反的逻辑,将偏爱密码子更换成稀有密码子的策略)过程中,表达率反而增加的结果。作为根据密码子使用差异的重组蛋白质表达效率的间接解决方案,还尝试了补充针对相应密码子(稀有密码子)的tRNA量的方法(Lee,Su Jeong,其他3人,2006)。在该过程中,尝试了将编码宿主细胞中不足的特定tRNA的质粒追加加入宿主细胞的方法。但上述方法也存在需要同时提供包含目标基因的载体和编码特定tRNA的质粒的问题。此外,需要解决的难题是双载体表达(dual vector-expression)的根本性问题、即细胞内稳定性和伴随此的难以导出具有再现性的结果的问题。
[0006] 在本发明中,作为能够提高翻译效率的新的方法,提出包含RAMP(ramp)功能的通用蛋白质过表达标记。如果利用RAMP标记(ramp tag)增加翻译效率,则与密码子优化不同,可以不更换原来的ORF序列,因此蛋白质固有活性没有变化,不需要与密码子置换相关的DNA人工合成,从而节省费用。此外,就所谓标记(tag)的概念而言,不仅能够最大地确保序列的流动性,而且能够担保可与其它功能性标记嫁接使用的嫁接优势。由此,能够以低费用设计迅速增加翻译效率的标记(tag)的技术具有重要的经济工业意义。特别是,这样的通用表达逻辑将会显著提高被已知为具有相对复杂的调节机制而使用有限制的动植物细胞株中的外源蛋白质生产可能性。

发明内容

[0007] 本发明的目的在于提供新方式的重组蛋白质的过表达方法,该方法与需要变更基因的碱基序列的以往的密码子优化不同,通过开发出包含能够调节翻译速度的RAMP标记(ramp tag)功能的1-20个密码子构成的标记(tag)并融合于所希望的基因的内/外部的方式,能够减少基因合成所需的费用、快速且能够实现多种应用。
[0008] 此外,本发明的目的在于,提供构建密码子表(codon table)的生物体中构成标记的稀有密码子的筛选基准,并提供该密码子的排列方式。
[0009] 此外,本发明的目的在于,制作并提供能够应用于各种重组蛋白质的通用RAMP标记(universal ramp tag),进而提供用作表达盒的方法。
[0010] 此外,本发明的目的在于,利用适合于上述宿主和重组蛋白质的标记的制作方法,提供能够应用的基因表达调节方法。
[0011] 本发明为了实现上述目的,提供在各宿主细胞中收集稀有密码子(rare codon)的方式和构成包含针对目标基因的RAMP功能的标记(tag)的方法、以及在增加翻译效率时标记所贡献的工作原理。
[0012] 由此,本发明涉及一种翻译速度调节用RAMP标记(ramp tag)的制造方法,其包括:制作与宿主细胞相应的稀有密码子表(rare codon table)的步骤;将目标基因的DNA序列转换为密码子的步骤;分析上述制作的稀有密码子表中的稀有密码子在目标基因ORF(开放读码框(open reading frame))中出现的频率和位置的步骤;以及收集出现频率为3次以下的稀有密码子并进行配置的步骤。优选在收集上述稀有密码子时,分析密码子的频率为0.5~3%、同工受体(isoacceptor)tRNA基因数为0~2个者,制造RAMP标记。在配置上述稀有密码子时,考虑ORF中出现的频率和位置而进行配置。优选可以按照ORF中出现的频率为0.5~
2%、位置在前半部的顺序进行配置。宿主细胞选自原核(细菌、古菌)和真核(酵母、菌类、昆虫、植物、动物、人类)细胞。优选选自大肠菌、酵母、中国仓鼠卵巢细胞(Chinese Hamster cell line)和人类细胞(Homo sapiens cell line)、植物细胞(拟南芥(Arabidopsis thaliana))等。更优选选自大肠菌(E.coli)K-12、酿酒酵母(Saccharomyces cerevisiae)、CHO-K1和HEK293t等。RAMP标记(ramp tag)可以由1-20个密码子构成。优选可以由在稀有密码子(rare codon)之间包含偏爱密码子(preferred codon)的1-20个密码子构成。更优选可以由在稀有密码子(rare codon)之间包含ORF中出现的频率为0.5~2%的宿主偏爱密码子(preferred codon)的1-20个密码子构成。在制作更多目标标记时,使通常使用的His-标记的稀有密码子排列在标记中,构成在使蛋白质过表达的同时可纯分离的多目标RAMP标记。目标基因是编码难表达蛋白质的基因,更优选基因将酯酶(esterase)、β-葡萄糖苷酶(β-glucosidase)、溶细胞素(cytolysin A)、氯霉素乙酰转移酶(chloramphenicol acetyltransferase)、新普鲁兰酶(neopullulanase)、白细胞介素-1(interleukin-1)、白细胞介素-32(interleukin-32)、重组抗体(单链Fv(single chain Fv),scFv)、天冬酰胺酶B(asparaginaseB)、四-细胞粘附分子(T-CAM)、B3(Fv)PE38、抗-CD20(抗-B淋巴细胞抗体CD20(anti-B-lymphocyte antigen CD20))、抗-TNFα(抗肿瘤坏死因子α(anti-tumour necrosis factorα))进行编码。
[0013] 此外,本发明涉及通过根据本发明的制造方法制造的翻译速度调节用RAMP标记(ramp tag)。优选上述RAMP标记可以选自序列号1至序列号42。
[0014] 此外,本发明涉及增加蛋白质的表达/纯化效率的方法,该方法在宿主细中增加难表达蛋白质的表达效率,其特征在于,包括:在宿主细胞中收集稀有密码子(rare codon)的步骤;构成针对目标基因的RAMP标记(ramp tag)的步骤;制造包含RAMP标记和目标基因的表达载体的步骤;用表达载体对宿主细胞进行转化的步骤;将在适合使蛋白质表达的培养基中转化的宿主细胞培养的步骤;以及利用组氨酸稀有密码子进行过表达的同时纯化的步骤。上述稀有密码子的收集可以通过分析密码子的频率为0.5~2%、同工受体(isoacceptor)tRNA基因数为0~2个者来实现。上述RAMP标记(ramp tag)稀有密码子可以考虑在目标基因中出现的频率和位置而进行配置。优选可以按照ORF中出现的频率为0.5~
2%、位置在前半部的顺序构成。此外可以组合RAMP标记的密码子顺序而进行配置。
[0015] 宿主细胞选自原核(细菌、古菌)和真核(酵母、菌类、昆虫、植物、动物、人类)细胞。优选选自大肠菌、酵母、中国仓鼠卵巢细胞(Chinese Hamster cell line)和人类细胞(Homo sapiens cell line)、植物细胞(拟南芥(Arabidopsis thaliana))等。更优选选自大肠菌(E.coli)K-12、酿酒酵母(Saccharomyces cerevisiae)、CHO-K1和HEK293t等。RAMP标记(ramp tag)可以由1-20个密码子构成。优选可以在稀有密码子(rare codon)之间包含偏爱密码子(preferred codon)。更优选可以在稀有密码子(rare codon)之间包含ORF中出现的频率为0.5~2%的宿主偏爱密码子(preferred codon)。此外,目标基因是编码难表达蛋白质的基因,更优选基因将酯酶(esterase)、β-葡萄糖苷酶(β-glucosidase)、溶细胞素(cytolysin A,ClyA)、氯霉素乙酰转移酶(chloramphenicol acetyltransferase,CAT)、新普鲁兰酶(neopullulanase)、白细胞介素-1(interleukin-1)、白细胞介素-32
(interleukin-32)、重组抗体(单链Fv,scFv)、天冬酰胺酶B(asparaginaseB)、四细胞粘附分子(T-CAM)、B3(Fv)PE38、抗-CD20(抗-B淋巴细胞抗体CD20(anti-B-lymphocyte antigen CD20))、抗-TNFα(抗肿瘤坏死因子α(anti-tumour Necrosis Factor Alpha))进行编码。
RAMP标记可以融合于目标基因的5′或3′,或者导入到目标基因的内部,或者配置成独立地进行翻译。RAMP标记可以进一步与其它标记或融合蛋白质一起使用,其它标记可以为选自His、T7、S、Flag、HA、V5表位、Strep、Nano、SBP、c-myc、PelB及Xpress表位标记中的1种以上。
融合蛋白质可以选自GST、MBP、NusA、CBP、GFP、硫还蛋白、Mistic、Sumo及DSB等。此外,上述RAMP标记可以具备信号序列或成熟蛋白质或多肽的5′-末端的特异的切割位点。筛选出的杂合信号序列通常在宿主细胞中被识别并被处理(例如,借助于信号肽酶的切割)。这种信号序列可以选自IgA-蛋白酶、粒酶(granzyme)B、Tev蛋白酶、预切割(prescission)蛋白酶、凝血酶、Xa因子(factor Xa)、碱性磷酸酶(alkaline phosphatase)、青霉素酶(penicillinase)、lpp、肠激酶或热稳定肠毒素II型前导(heat-stable enterotoxin II leaders)等。
[0016] 上述RAMP标记可以与提高重组蛋白质表达的表达系统一起使用。通常,蛋白质表达质粒的要素是包含一个以上的用于表达原核生物复制起点和原核生物筛选标记(marker)、真核生物筛选标记(marker)、以及目标基因表达模块(各个基因包括启动子、核糖体识别位点、5′-UTR、结构基因和包含3′-UTR信号的转录终止因子)的表达的表达盒的质粒构成单元。源自质粒pBR3222的复制起点适合于大多数革兰氏阴性杆菌,2μ质粒起点适合于酵母,各种病毒起点(SV40、多瘤病毒(polyoma)、腺病毒(adenovirus)、VSV或BPV)在哺乳动物细胞中有效作为表达载体。表达载体通常含有被宿主器官识别的启动子,适合用于原核宿主的启动子是araBAD启动子、phoA启动子、β-内酰胺酶(beta-lactamase)及乳糖(lactose)启动子系统、碱性磷酸酶(alkaline phosphatase)、色氨酸(trp)启动子系统及tac启动子等杂合(hybrid)启动子。但是其它已知的细菌启动子(革兰阳性或广谱范围(broad spectrum rang)启动子)也适合。此外,为了优化的翻译,还可以使在mRNA的起始密码子之前出现的夏因-达尔加诺序列(Shine Dalgarno Sequence、或RBS)或其变异体包含于5′非翻译区。真核细胞的启动子序列是广为人知的。适合用于酵母宿主的启动子序列包含3-磷酸甘油酸激酶(phosphoglycerate kinase)或烯醇化酶(enolase)、甘油-3-磷酸脱氢酶(glyceraldehyde-3-phosphate dehydrogenase)、己糖激酶(hexokinase)、丙酸脱羧酶(pyruvate decarboxylase)、磷酸果糖激酶(phospho-fructokinase)、葡萄糖-6-磷酸异构酶(glucose-6-phosphate isomerase)、3-磷酸甘油酸变位酶(3-phosphoglycerate mutase)、丙酮酸激酶(pyruvate  kinase)、磷酸丙糖异构酶(triosephosphate isomerase)、磷酸葡萄糖异构酶(phosphoglucose isomerase)和葡萄糖激酶(glucokinase)等用于糖酵解(glycolytic)酶的启动子。在具备进一步具有根据生长条件控制转录的优点的诱导型启动子的其它酵母启动子中,存在用于醇脱氢酶2(alcohol dehydrogenase 2)、异细胞色素C(isocytochrome C)、酸性磷酸酶(acidphosphatase)的启动子部分,且存在如下酶的启动子部分:与氮代谢有关的降解酶,参与金属硫蛋白(metallothionein)、甘油醛-3-磷酸脱氢酶(glyceraldehyde-3-
phosphatedehydrogenase)、麦芽糖(maltose)和半乳糖(galactose)的利用的酶。适合用于酵母表达的载体和启动子记载于EP第73,657号。此外,酵母增强子与酵母启动子一起被有效利用。从哺乳动物宿主细胞中存在的载体进行的转录被由如下病毒的基因组得到的启动子控制:多瘤病毒(polyoma virus)、禽痘病毒(fowlpox virus)、腺病毒2(adeno virus 
2)、乳头状瘤病毒(bovine papilloma virus)、禽类肉瘤病毒(avian sarcoma virus)、巨细胞病毒(cytomegalo virus)、逆转录病毒(retro virus)、乙型肝炎病毒(hepatitis-B virus)、最优选的猿猴病毒40(simian virus 40:SV40),也被从杂合哺乳动物启动子(肌动蛋白(actin)启动子、免疫球蛋白质(immunoglobulin)启动子等)和热休克(heat-shock)启动子得到的启动子控制,这样的启动子提供与宿主细胞体系的相容性。为了优化的翻译,也可以使Kozak序列包含于5′非翻译区。此外,利用于真核宿主细胞(酵母、菌类、昆虫、植物、动物、人类细胞)的表达载体包含转录终止及mRNA稳定所需的序列。在mRNA加工过程、特别是mRNA剪接及加工的情况下,根据结构基因的特性(外显子/内含子比率、长度等),不仅可以包含mRNA剪接信号,而且可以包含多腺苷酸化及加工信号。
[0017] 上述发明提供由图2所示的密码子序列构成的翻译速度改善用RAMP标记(ramp tag)与目标基因融合而发挥功能的策略和独立地表达的策略。
[0018] 根据本发明的RAMP标记即使融合于目标基因的5′或3′,或者导入到目标基因的内部,或者配置成独立地进行翻译,也增加目标蛋白质的表达效率,可以观察到与对照组相比总蛋白质量增加约2.5~7.5倍以上。
[0019] 本发明作为制作与被已知为报告蛋白(reporter protein)的荧光蛋白质基因匹配的RAMP标记(ramp tag)并测定蛋白质表达量增加的方法,包括证明标记的建模。
[0020] 本发明作为利用上述表达标记制作与被已知为难表达的基因匹配的RAMP标记(ramp tag)并测定蛋白质表达量增加的方法,包括证明标记的功能性。
[0021] 此外,本发明作为使纯化目的的组氨酸稀有密码子间断排列在上述表达标记内,以制作不仅能够诱导过表达而且能够通过单一过程将目标蛋白质纯分离的RAMP标记(ramp tag)为目的的方法,包括证明标记的多功能性。
[0022] 在本发明中,以附加价值高但难表达的工业用酶和药物蛋白质即酯酶(esterase)、β-葡萄糖苷酶(β-glucosidase)、溶细胞素(cytolysin A)、氯霉素乙酰转移酶(chloramphenicol acetyltransferase)、新普鲁兰酶(neopullulanase)、天冬酰胺酶B(asparaginaseB)为对象制作与它们匹配的RAMP标记,利用大肠菌和真核细胞作为宿主,测定这些蛋白质的表达量时,确认到与对照组相比显著增加表达和活性。
[0023] 在本发明中,以用于医学、研究的价值大的细胞因子和激素即白细胞介素-1(interleukin-1)、白细胞介素-32(interleukin-32)为对象制作与它们匹配的RAMP标记,利用大肠菌和真核细胞作为宿主,测定这些蛋白质的表达量时,确认到与对照组相比显著增加蛋白质量和活性。
[0024] 在本发明中,以用作诊断或治疗用抗体的重组抗体(单链Fv,scFv),四-细胞粘附分子(T-CAM)、B3(Fv)PE38、抗-CD20(抗-B淋巴细胞抗体CD20(anti-B-lymphocyte antigen CD20))、抗-TNFα(抗肿瘤坏死因子α(anti-tumour Necrosis Factor Alpha))为对象制作与它们匹配的RAMP标记,利用真核细胞作为宿主,测定这些蛋白质的表达量时,确认到与对照组相比显著增加抗体和活性。
[0025] 此外,本发明提供将RAMP标记(ramp tag)与已商品化的其它标记或融合伴侣(fusion partner)融合而使用的方法。
[0026] 在将根据本发明的RAMP标记与His-标记、T7-标记、HA-标记等标记和GST、GFP、MBP等融合蛋白质一起使用时,也可以确认到在不阻碍它们的功能的同时增加目标蛋白质的表达量。
[0027] 此外,本发明提供通过使能与亲和层析结合的稀有密码子间断嫁接到RAMP标记而能够进行过表达的同时容易分离目标蛋白质的方法。
[0028] 在制作根据本发明的RAMP标记时,间断嫁接可应用的组氨酸稀有密码子而使用的情况下,确认到目标蛋白质的表达量增加,可以确认到通过单一过程的纯化能够进行目标蛋白质的纯分离。
[0029] 此外,提供从将根据本发明的RAMP标记与信号序列或特异的切割位点融合而表达的蛋白质中去除RAMP标记的方法。上述切割位点虽然没有限制,但是可以存在于IgA-蛋白酶、粒酶(granzyme)B、Tev蛋白酶、预切割(prescission)蛋白酶、凝血酶、Xa因子或肠激酶识别的序列上。
[0030] 即使在为了将根据本发明的RAMP标记与目标蛋白质分离而一起使用信号序列或特异的切割位点的情况下,也确认到在不阻碍它们的功能的同时增加蛋白质的表达量,即使在去除RAMP标记后,也可以确认到目标蛋白质的活性或稳定性没有变化。
[0031] 此外,本发明提供与以往已知的表达系统一起使用的方法。
[0032] 在将根据本发明的RAMP标记与诱导型启动子、Kozak序列、mRNA剪接信号、多腺苷酸化信号、夏因-达尔加诺序列(Shine-Dalgarno-Sequence)等一起使用的情况下,也可以确认到在不阻碍它们的功能的同时与单独存在表达系统时相比蛋白质的表达量增加。
[0033] 此外,本发明提供使用RAMP标记(ramp tag)的适当的密码子长度的方法。
[0034] 在缩小RAMP标记的序列并用于根据本发明的目标蛋白质的情况下,确认到目标蛋白质的表达量增加,即使在增加RAMP标记的序列的情况下,也可以确认到目标蛋白质的表达增加。
[0035] 此外,本发明提供组合RAMP标记的密码子顺序而进行配置的方法。
[0036] 在更换根据本发明的RAMP标记的密码子顺序后使用的情况下,可以确认到与借助于以往的RAMP标记而增加的目标蛋白质的表达量的差异变化不大。
[0037] 此外,本发明提供载体内的多基因表达方法。
[0038] 即使在使应用根据本发明的RAMP标记的目标基因在一个载体中表达的情况下,也确认到与对照组相比各蛋白质量增加,即使在将其应用于其它载体的情况下,也可以确认到目标蛋白质的表达增加。
[0039] 此外,本发明还公开了RAMP标记不仅能够在原核生物而且能够在真核生物中利用于目标基因的过表达。
[0040] 即使在使根据本发明的RAMP标记在除了大肠菌之外的微生物和真核生物中表达的情况下,也可以确认到目标蛋白质的表达增加。
[0041] 此外,本发明提供增加目标蛋白质的可溶性(Solubility)的RAMP标记的使用方法。
[0042] 在将根据本发明的RAMP标记使用于目标蛋白质的情况下,可以确认到蛋白质的表达和可溶性增加。
[0043] 此外,本发明提供增加目标蛋白质的稳定性(stability)的RAMP标记的使用方法。
[0044] 在将根据本发明的RAMP标记使用于目标蛋白质的情况下,可以确认到蛋白质的表达和稳定性增加。
[0045] 此外,本发明提供增加目标蛋白质的酶活性(enzymic activity)的RAMP标记的使用方法。
[0046] 在将根据本发明的RAMP标记使用于目标蛋白质的情况下,可以确认到蛋白质的表达和酶活性增加。
[0047] 本发明作为在分析收集稀有密码子并制作RAMP标记(ramp tag)来制造重组蛋白质的过程中能够提高翻译效率的新的方法,其与密码子优化或密码子去优化方法不同,具有即使不更换原来的ORF序列也能够增加翻译效率的优点。
[0048] 由此,不需要用于置换密码子的基因水平的DNA人工合成,从而能够节省费用,能够根据目的而有机调节RAMP标记的密码子的长度和配置顺序,可以进行通用RAMP标记(universal ramp tag)的设计而能够针对各种蛋白质快速增加翻译效率。此外提供在标记中排列能与亲和层析结合的稀有密码子的情况下可以同时实现过表达和纯分离的方法。
[0049] 本发明显示如下效果:即使将RAMP标记配置在相对于目标蛋白质的RAMP标记的多种融合位置(导入N-末端、C-末端或基因内部),而且即使将RAMP标记配置成RAMP标记被翻译为独立的肽,也能够增加目标蛋白质的表达量,并且即使与多种标记或融合蛋白质一起使用,也显示出在照样发挥标记或融合蛋白质的作用的同时增加目标蛋白质的表达量的效果。
[0050] 此外,在与用于使目标蛋白质过表达的质粒水平的表达系统一起使用的情况下,显示出在不阻碍它们的功能的同时与单独存在表达系统时相比增加表达量的效果。这样的效果能够改善外源基因与宿主细胞的密码子使用相容性问题而调节蛋白质的量,因此能够解决将大肠菌以及酵母或动植物细胞作为宿主时的目标蛋白质难表达问题。
[0051] 这样的方法能够进行与药物蛋白质即ClyA、scFV、天冬酰胺酶(ansB)、T-CAM、B3(Fv)PE38匹配的RAMP标记的设计,从而具有能够直接利用于医药品或工业用酶的大量生产的优点,通过从将根据本发明的RAMP标记与信号序列或特异的切割位点融合而表达的蛋白质中去除RAMP标记,能够获得完整的目标蛋白质,能够确认到原来的蛋白质结构和活性。
[0052] 此外,因目标蛋白质的可溶性增加、无活性包涵体(inclusion body)形成受阻等而消除了不溶性蛋白质的再水化工序的必要性,在为了工业生产而扩大规模(scale-up)时具有经济性高的优点。除此之外,能够使蛋白质的酶活性和稳定性持续而高收获目标产物,从而能够大量供应生命工程学和医药领域中所需的活性蛋白质。附图说明
[0053] 图1是说明翻译过程中的稀有密码子(rare codon)的影响(A)和用RAMP标记(ramp tag)解决的原理(B)的示意图。
[0054] 图2是显示出翻译速度改善用RAMP标记(ramp tag)融合于目标基因而发挥功能(A)以及进行表达(B)的策略的示意图。
[0055] 图3是利用SDS-PAGE分析包含本发明的RAMP标记(ramp tag)的荧光蛋白质DsRed(A)、GFPuv(B)、mBFP(C)的表达量的图。在图中,以R表示的是融合有标记的蛋白质(泳道NC:pTrc99A,T:全体蛋白质,S:可溶性蛋白质)。
[0056] 图4是利用SDS-PAGE分析核糖体结合位点(RBS)导入以及包含本发明的RAMP标记(ramp tag)的荧光蛋白质mBFP的表达量的图。以R表示的是融合标记的蛋白质(泳道1:pTrc99A,2:pTrc99A-mBFP,3:导入RBS的pTrc99A-mBFP,4:pTrc99A-R1-mBFP,5:导入RBS的pTrc99A-R1-mBFP,6:导入RBS的pTrc99A-R2-mBFP)。
[0057] 图5是通过RT-PCR分析包含本发明的RAMP标记(ramp tag)的荧光蛋白质mBFP的转录物(mRNA)量的图(条带1:pTrc99A-mBFP,2:导入RBS的pTrc99A-mBFP,3:pTrc99A-R1-mBFP,4:导入RBS的pTrc99A-R1-mBFP,5:导入RBS的pTrc99A-R2-mBFP)。
[0058] 图6是分析用包含本发明的RAMP标记(ramp tag)的荧光蛋白质mBFP转化的大肠菌宿主的生理影响的生长曲线。以R表示的是融合标记的蛋白质(符号A:pTrc99A,符号B:pTrc99A-mBFP,符号C:pTrc99A-R-mBFP)。
[0059] 图7是分析包含本发明的RAMP标记(ramp tag)的酯酶(1767)和新普鲁兰酶(BCN)的表达量的图。以R表示的是融合标记的蛋白质(T:全体蛋白质,S:可溶性蛋白质)。
[0060] 图8是分析包含本发明的RAMP标记(ramp tag)的氯霉素乙酰转移酶(CAT)的表达量(A)和酶活性(B)的图。酶活性利用MIC测定法进行测定,以R表示的是融合标记的蛋白质(T:全体蛋白质,S:可溶性蛋白质,w/o:无IPTG,w/:有IPTG)。
[0061] 图9是分析包含本发明的RAMP标记(ramp tag)的天冬酰胺酶B(ansB)的表达量(A)和酶活性(B)的图。酶活性利用酶谱(zymogram)法进行测定(泳道1:pBAD,泳道2:pBAD-R1-ansB,泳道3:pBAD-R2-ansB,泳道4:pBAD-ansB)。
[0062] 图10是确认根据时间的包含本发明的RAMP标记(ramp tag)的天冬酰胺酶B(ansB)在生物体内的稳定性的结果。以R表示的是融合标记的蛋白质,稳定性是通过在诱导蛋白质表达后,对于随时间经过的试样利用蛋白质印迹法(western blot)进行确认。
[0063] 图11是将本发明的RAMP标记融合于氯霉素乙酰转移酶(CAT)的C-末端并分析表达量的SDS-PAGE结果。以R表示的是融合标记的蛋白质,所表示的位置是融合于末端的位置。
[0064] 图12是分析包含本发明的RAMP标记(ramp tag)的人类(A)和小鼠(B)来源的白细胞介素-1的表达量的图。以R表示的是融合标记的蛋白质,小写h是人类来源的基因,m是小鼠来源的基因,s是密码子优化合成基因(T:全体蛋白质,S:可溶性蛋白质,I:IPTG诱导表达蛋白质)。
[0065] 图13是分析包含本发明的RAMP标记(ramp tag)的白细胞介素-32的全体蛋白质(A)和可溶性蛋白质(B)的表达量的图。以R表示的是融合标记的蛋白质,表达量通过蛋白质印迹进行确认(泳道1:pTrc99A-IL32β,2:pTrc99A-R-IL32β,3:pTrc99A-IL32γ,4:pTrc99A-R1-IL32γ,5:pTrc99A-R2-IL32γ)。
[0066] 图14是组合本发明的RAMP标记(ramp tag)稀有密码子顺序后分析白细胞介素-32的表达量的图。以R表示的是融合标记的蛋白质,表达量通过蛋白质印迹进行确认(泳道1:pTrc99A-IL32β,2:pTrc99A-R-IL32β,3:pTrc99A-R1-IL32β,4:pTrc99A-R2-IL32β,5:
pTrc99A-R3-IL32β)。
[0067] 图15是分析包含本发明的RAMP标记(ramp tag)和切割位点序列的溶细胞素(ClyA)的表达量的图。以R表示的是融合标记的蛋白质,表达量通过蛋白质印迹进行确认(泳道1:pET,2:pET-ClyA,3:pET-R1-ClyA,4:pET-R2-ClyA,5:pET-R3-ClyA,6:pET-R1-ClyA,7:pET-R2-ClyA,8:pET-R3-ClyA;w/o:无蛋白酶,w/:有蛋白酶)。
[0068] 图16是分析包含本发明的RAMP标记的1-脱氧-D-木酮糖-5-磷酸合酶(dxs)和IPP异构酶(idi)的表达量(A)和番茄红素生成量(B)的图。以R表示的是融合标记的蛋白质,生成量通过HPLC进行确认(泳道1:pTrc99A,2:pTrc99A-dxs-idi,3:pTrc99A-R-dxs-R-idi,WT:pTrc99A-dxs-idi,RT:pTrc99A-R-dxs-R-idi)。
[0069] 图17是分析在酵母中包含本发明的RAMP标记(ramp tag)的酯酶(1767)的表达量的图。以R表示的是融合标记的蛋白质,表达量通过蛋白质印迹进行确认(1767:pYES2-1767,RY-1767:pYES2-RY-1767,T:全体蛋白质,S:可溶性蛋白质,I:不溶性蛋白质)。
[0070] 图18是分析在中国仓鼠卵巢细胞(CHO cell)中包含本发明的RAMP标记(ramp tag)的B3(Fv)PE38基因的表达量的图。以R表示的是融合标记的蛋白质,s是密码子优化合成基因。表达量通过蛋白质印迹进行确认(泳道1:pCMV,2:pCMV-B3Fv,3:pCMV-sB3Fv,4:pCMV-RC-B3Fv)。
[0071] 图19是分析在小鼠胚胎纤维细胞(NIH 3T3 cell)中包含本发明的RAMP标记(ramp tag)的B3(Fv)PE38基因的表达量的图。以R表示的是融合标记的蛋白质,s是密码子优化合成基因。表达量通过蛋白质印迹进行确认(泳道1:pCMV,2:pCMV-B3Fv,3:pCMV-sMB3Fv,4:pCMV-RM-B3Fv)。
[0072] 图20是分析在人类细胞(HEK 293t cell)中包含本发明的RAMP标记(ramp tag)的天冬酰胺酶B(ansB)的表达量的图。以R表示的是融合标记的蛋白质,表达量通过蛋白质印迹进行确认(ansB:pCMV-ansB,RH-ansB:pCMV-RH-ansB,T:全体蛋白质,S:可溶性蛋白质,I:诱导表达蛋白质)。
[0073] 图21是在LB培养基(A)和M9培养基(B、C)中分析包含本发明的RAMP标记(ramp tag)的β-内酰胺酶(beta-lactamase VIM2)的抗生素敏感性检查的图(w/o:无Zn2+,w/:有Zn2+)。
[0074] 图22是分析在本发明的RAMP标记(ramp tag)中包含同时赋予了蛋白质纯化和表达诱导功能的组氨酸稀有密码子而增加的蛋白质(mBFP)表达量(A)和利用亲和层析分离的纯度(B)的图(泳道1:pTrc99A,2:pTrc99A-mBFP,3:pTrc99A-RH1-mBFP,4:pTrc99A-RH2-mBFP)。

具体实施方式

[0075] 下面,根据具体实施例更详细说明本发明。但本发明并不限定于下述实施例。在本发明的思想和范围内可以进行多种变形或修正对于本领域技术人员来说是显而易见的。
[0076] 此时,所使用的技术术语和科学术语中,如果没有其它定义,则具有本发明所属技术领域的普通技术人员通常理解的含义。此外,省略对于与以往相同的技术构成和作用的反复说明。
[0077] 本发明构成在各宿主中收集稀有密码子的方式。在此,所谓的稀有密码子除了指通常已知的稀有密码子的概念之外,还指在下面说明的过程中收集的密码子。在解码密码子时,对翻译速度影响最大的是,以多快的速度供应处于结合氨基酸的状态的aa-tRNA。由此,在细胞内充分存在相应aa-tRNA的量的密码子中翻译速度快,相反,aa-tRNA的不足使翻译效率降低。因此,tRNA的基因拷贝(gene copy)可以用作能够类推细胞内相应tRNA的浓度的第一尺度。众所周知,典型的密码子优化方法反映密码子频率(codon frequency),这是因为,已知密码子频率与相应tRNA拷贝数成比例。下表1显示出在大肠菌K-12中与各氨基酸(AA)对应的密码子频率(100%基准)和tRNA基因拷贝(http://gtrnadb.ucsc.edu/)。
[0078] 表1.大肠菌K-12菌株的密码子使用的构成
[0079]
[0080] 观察上述表的密码子频率可知,与tRNA基因不成比例的氨基酸很多。而且,即使密码子频率高,也可见没有tRNA基因,可以如下说明发生该现象的原因:tRNA的反密码子(anticodon)可以通过摇摆(wobble)现象(在第三个位点,非沃森-克里克(non-Watson-Crick)互补结合)识别其它密码子(表2)。将这样能够识读两个以上的密码子的tRNA称为同工受体tRNA。例如,识读苯丙氨酸(phenylalanine)的UUC的tRNA(反密码子GAA)也能识读UUU。在大肠菌K-12中具有反密码子G和U的tRNA解码大部分的U、C、A、G密码子。
[0081] 表2.反密码子通过摇摆现象能够解码的密码子
[0082]
[0083] 在选定考虑到tRNA的不足的稀有密码子时,应考虑同工受体tRNA,选定在ORF中需要再使用(reuse)tRNA的密码子。例如,ORF中可编码丝氨酸(serine)的密码子中显示出低频率的UCU密码子虽然能够阻碍翻译速度,但是如果在UCU密码子的前面出现UCC,则UCC所使用的tRNA能够再使用于解码UCU,因此UCU无法阻碍翻译速度。由此,密码子频率(codon frequency)是将同工受体tRNA识读的两个密码子频率加算而在下述分析过程中以一个进行计算。苯丙氨酸(phenylalanine)的密码子频率为两个密码子的合计即3.87%,在Ser的情况下,如表1所示,分别分成两个密码子,使共3种密码子的频率为1.66%、1.60%、2.47%,与此相应的tRNA基因拷贝也将两个密码子加算而视为2、2、1个。在密码子使用中,如果说明另一个特征的话,具有密码子偏性(codon bia)为3个以上的同义密码子(synonymous codon)的氨基酸中表现出更加强烈(表1)。例如,甘氨酸(glycine)显示
5.45%和1.90%的频率而显示出差距。同样地,精氨酸(arginine)的密码子频率显示出
4.29%、0.89%、0.31%这样大的差距。相反,在大肠菌中由2个密码子编码的氨基酸即酪胺酸(tyrosine)、组氨酸(histidine)、谷氨酰胺(glutamine)、天冬氨酸(aspartate)、赖氨酸(lysine)、天冬酰胺(asparagine)被解码为一个同工受体tRNA而仅具有一种tRNA基因,大多数的2个密码子均显示出2-5%程度的高频率,可见密码子偏性弱。
[0084] [实施例1]大肠菌中稀有密码子(rare codon)的新的定义和收集基准
[0085] 两个以上的同工受体tRNA参与由3个以上的密码子(根据密码子数,分别表示为3、4、6盒(box))编码的氨基酸丝氨酸(serine)、亮氨酸(leucine)、缬氨酸(valine)、脯氨酸(proline)、苏氨酸(threonine)、丙氨酸(alanine)、精氨酸(arginine)、甘氨酸(glycine)的翻译,考虑此的密码子对(将同工受体tRNA看作一个)也是2个以上的情况居多,因此频率差距大的可能性高。可以认为密码子稀有性是在如果在ORF中不具有多个密码子则难以充分确保tRNA的3-6盒中大。由此可知,再使用tRNA确保充分的翻译效率的策略是在同工受体tRNA不足的3-6盒密码子中必需的。为了获得这样的效果,本发明的策略是在收集利用频率低的密码子序列而构成标记后,配置于表达目标基因之前,预先聚集对基因的表达效率诱发严重问题的稀有密码子tRNA而再使用(图1)。由于以所构成的标记所选用的tRNA的再使用为目的,因此在本发明中没有考虑由基于标记的tRNA的绝对使用次数增加引起的生物体内氨基酸浓度减少。
[0086] 然后,考虑上述密码子使用,公开收集稀有密码子的条件。作为针对以往典型的方法的补充措施,混用了考虑各密码子频率的方法和考虑同工受体tRNA的基因拷贝数的方法。以密码子频率为基准,稀有密码子收集条件如下:1.各氨基酸中密码子对频率为1.0%以下者(该阈值是可收集总密码子个数的下位34.4%(21个)的水准);2.针对一个氨基酸最多收集3个密码子。
[0087] 上述条件的临界值需要参考大肠菌的全体密码子如何分布,因此参考将密码子频率和tRNA基因数作为轴的分布(表3)。.
[0088] 表3.密码子频率和tRNA基因数的分布
[0089]
[0090] *tRNA,**密码子频率(Codon fre.),***有效摇摆(Infficient wobble)[0091] 编码大部分的氨基酸的密码子显示出分布于0-2个tRNA基因和0.5-3%以上密码子频率的模式。在此,为了收集稀有密码子而应用了与上述括号相同的基准,其中,作为实验结果,包含确定为稀有密码子的9个密码子。这样选择了同时考虑密码子频率和同工受体tRNA的方式。表4是最终收集的大肠菌K-12菌株的稀有密码子表。
[0092] 表4.大肠菌K-12菌株的收集的稀有密码子
[0093]
[0094] 基于此,本发明提供构成RAMP标记(ramp tag)的方法并说明发挥功能的原理。RAMP标记中排列着约1-20个密码子。这样的构成和排列方式根据与RAMP标记融合的基因而不同。此外,根据目标基因的长度和基因内部的稀有密码子的分布程度,可以将标记的长度构成为20个以上,但在利用转录偶联(transcriptional coupling)技术的情况下,由于与目标基因分开表达的标记而存在氨基酸不足(标记表达中所使用的氨基酸比率增加)的可能性,因此需要限制长度。
[0095] [实施例2]将与各基因融合的RAMP标记的序列和结构体(construct)的构成[0096] 参考图2A,通过下述过程,构成RAMP标记(ramp tag):1.制作基于宿主的稀有、偏爱密码子表;2.将目标基因的DNA序列更换为密码子进行准备;3.分析所制作的密码子表中的密码子在目标基因ORF中出现的频率和位置;4.将分析的密码子组合并排列在RAMP标记中;5.在目标基因的N-或C-末端内外部(与标记长度对应的1-20个密码子)融合或置换标记而诱导表达。
[0097] 这样的标记构成为:在核糖体解码标记时,首先引入ORF翻译中所需的tRNA后在ORF中可再使用。图1B描述这样的翻译过程,说明RAMP标记(ramp tag)的工作原理和策略。为了使RAMP标记准确地工作,需要在蛋白质翻译中所利用的tRNA在核糖体中再使用之前借助于氨酰-tRNA合成酶与氨基酸结合(补给(recharging))。由此,本发明的驱动条件是用过一次的tRNA在进行翻译过程的期间不会扩散到远处以便容易被再使用,并与氨基酸再结合。
[0098] 标记的密码子配置考虑ORF中出现的频率和位置。为了增加翻译过程中的借助于RAMP标记的tRNA的再使用效果,在稀有密码子中筛选出如下密码子:ORF中出现的频率少而迟延翻译过程,且分布的位置接近N-末端侧或者在ORF内部周期性出现。即,在稀有密码子中,按照ORF中出现的频率少的顺序分析稀有密码子后,优先配置分析的密码子在ORF中位于前半部的情况。已知,在构成RAMP标记时,如果仅将稀有密码子组合使用,则翻译过程(translation)受阻,减少蛋白质生产。即报道了,在大肠菌的情况下,即使仅使用1个连续的稀有密码子,也阻碍部分翻译(She P.等,2006)。由此,为了通过稀有密码子和偏爱密码子的组合,解决连续的稀有密码子的翻译过程中的问题,利用上述分析方法将偏爱密码子分类并组合。就密码子之间的组合而言,在稀有密码子之间配置偏爱密码子,但根据目标蛋白质的不同而偏爱密码子数、RAMP标记中先配置的顺序和相同密码子的重复性不同。
[0099] 本发明为了提供针对蛋白质过表达(或难表达)的RAMP标记密码子,确认了以与目标基因的内外部融合的形态建模的可能性。以荧光蛋白质即DsReD、GFP、mBFP为对象,设计了与它们匹配的标记和融合有标记的基因结构体。观察图2B,标记以位于基因的N-末端(或5′末端)外部的方式进行融合或者以独立的形态进行表达。但并不限于此,可以用引物(primer)设计RAMP序列而通过PCR简单地导入基因N-末端内部,以使野生型蛋白质的氨基酸不发生变化。下述实施例中标示了针对各基因的标记的DNA序列。首先,在前述的3个基因上融合与其匹配的标记,在可诱发tRNA的不足现象的诱导表达载体(induct ion vector)中尝试进行表达。作为另一个实验对照组,利用不需要诱导体的组成型过表达载体[0100] [实施例3]在荧光蛋白质DsReD、GFP、mBFP中分析借助于RAMP标记融合的表达量[0101] 下表5中罗列了针对各基因的RAMP标记的密码子序列。RAMP标记通过如图2所示的过程而收集,使其配置于基因的前端,与蛋白质融合而诱导表达。借助于RAMP标记的过表达效果利用作为组成型表达载体的pBEM3、pRCEMT和作为诱导表达载体的pET22b(+)来确认。
对于各载体,先克隆基因后,以添加了ATG的正向引物(forward primer)形态合成表5(基因特异性RAMP标记(ramp tag)序列)的标记序列,以各基因为模板(template)进行PCR,得到连接RAMP标记的基因片段。之后,将多克隆位点(multi-cloning site)的限制酶识别位点切割并克隆,转化到大肠菌XL1-blue和BL21。上述重组基因稳定地维持具有荧光蛋白质的载体,也可以用于能够测定荧光的公知的任何宿主细胞。例如,也可以利用E.coli JM109或RR1、LE392或W3110等以及作为真核细胞的酿酒酵母(Saccharomyces)或毕赤酵母(Phichia)等作为宿主。
[0102] 关于将具有上述本发明的RAMP标记的载体搬运到宿主细胞内的方法,在宿主细胞为原核细胞的情况下,可以通过CaCl2方法、FSB溶液处理法或电击法等实施。此外,在宿主细胞为真核细胞的情况下,可以通过电穿孔法或脂质体-介导转化法等,将具有上述重组基因的载体注入宿主细胞。
[0103] 将上述转化的单一菌落接种于5ml液体培养基(LB+50mg/ml氨苄青霉素),以37℃、200rpm的条件预培养12小时。当上述培养液的吸光度(OD600)值达到2.0时,接种于200ml的液体培养基(LB+50mg/ml氨苄青霉素),在相同的条件下进行培养后,当吸光度(OD600)值为
0.5时,利用0.1mM异丙基-β-D-1-硫代半乳糖苷(IPTG)诱导通过Ptac启动子的表达。3小时后,将培养液取样,根据吸光度(OD600)值测定细胞密度。将细胞密度调整为OD600=2.0,在7,
000rpm下将1ml的分样量离心分离5分钟后,去除上澄液,利用SDS-PAGE分析蛋白质表达量。
[0104] 表5.基因特异性的RAMP标记(ramp tag)序列
[0105]
[0106] 结果是,在诱导表达载体中添加IPTG后,利用SDS-PAGE,与对照组比较蛋白质表达量时,在融合有标记的DsRed(R-DsRed)中观察到总蛋白质量增加3.7-5.8倍以上(图3A)。该结果表示,通过标记的融合赋予tRNA的选择和再使用功能,由此蛋白质表达量增加。同样地分析针对GFPuv和mBFP的RAMP标记的效果,结果可以确认到,与对照组(GFPuv、BFP)相比,融合有RAMP标记的GFPuv(R-GFP)、mBFP(R-BFP)的总蛋白质量也分别增加5.4倍、2.6倍以上(图3B、C)。在上述条件下不添加表达诱导剂(IPTG)而进行培养时,与利用诱导剂诱导过表达的表达量类似或表达量增加了其以上(3.5-7.8倍)。
[0107] [实施例4]以往的表达要素和借助于RAMP标记融合的表达量分析
[0108] 在本实施例中,提供将RAMP标记与典型的重组蛋白质表达增强要素一起使用的方法。作为以往的大肠菌(E.coli)表达质粒的构成要素,使用了诱导型启动子,为了优化的翻译,在mRNA的起始密码子之前导入核糖体结合位点(Ribosome Binding Site,RBS)。此外,使转录物二级结构优化要素包含于5′非翻译区(untranslated region,UTR)。在哺乳动物细胞的情况下,包含哺乳动物复制起点SV40起点作为质粒构成要素,使用诱导型启动子。为了优化的翻译,使Kozak序列包含于5′非翻译区。加入降低mRNA二级结构形成可能性的要素和剪接信号,融合RAMP标记(ramp tag),分析了蛋白质的表达。其结果是,不妨碍对稳定性或有效的转录/翻译诱导发挥特别功能的表达系统的作用,并且在原核宿主(大肠菌)中可以确认到借助于RAMP标记(ramp tag)的表达量增加(图4)。关于功能评价,在质粒中分别组装诱导型启动子Ptrc、核糖体结合位点和强制转录终止位点(转录终止信号T1和T2)后,使RAMP标记融合于荧光蛋白质mBFP后进行。此时使用的RAMP标记如表6所示。在上述过程中利用真核作为宿主与以往表达要素嫁接的实验中,也验证了同样的效果,从而确认到能够容易将RAMP标记嫁接到以往系统。
[0109] 表6.基因特异性的RAMP标记(ramp tag)序列
[0110]
[0111] [实施例5]在转录阶段测定借助于RAMP标记序列的基因的表达水平
[0112] 通过上面实施的实施例,确认到RAMP标记序列使蛋白质的表达量增加的事实。由此,本发明人为了确认由RAMP标记序列差异所引起的蛋白质的表达量增加除了影响翻译(translation)阶段之外是否还影响由各个DNA转录到信使RNA(mRNA)的遗传信息(转录物(transcript))量,分析了荧光蛋白质mBFP的转录阶段和翻译阶段中的基因表达水平。利用与上述实施例3的方法相同的方法,准备载体后并使其表达,进行SDS-PAGE电泳后,在翻译阶段分析蛋白质表达量,获得相同的结果。之后,为了确认准备的上述试样的mBFP转录物量,进行了RT-PCR。首先使用Trizol试剂(Invitrogen,Cat no.15596-026)方法,从用上述载体转化的大肠菌细胞提取全体RNA。在利用提取的RNA作为模板的逆转录反应中,利用分离的RNA 0.2和SuperscriptTM II逆转录酶(Invitrogen,Cat.No.18064-022)合成cDNA。然后,利用ExTaq(TaKaRa,Cat no.RR001A)进行聚合酶链反应(PCR)。此时,作为对照组,使用GAPDH基因。用于确认mBFP的转录量的引物示于表7,关于PCR条件,将退火温度固定在55℃而进行。其结果可以确认到,与没有标记的对照组相比,导入了pTrc99A-R1-BFP等RBS的R1-BFP和R2-BFP的测定转录量高1.7-2.4倍程度(图5)。
[0113] 由此通过上述结果,本发明人可以获知,借助于RAMP标记的蛋白质表达量差异除了具有由于在翻译阶段赋予tRNA的选择和再使用功能而增加表达的主要效果之外,还具有增加从DNA转录到信使RNA的遗传信息的稳定性而提高蛋白质的表达量的附随效果。产生该结果的原因被推测为,借助于RAMP标记良好地调节与转录物结合的核糖体的速度,从而暴露于核酸内切酶的转录物的比率相对少,有效诱导核糖体的再循环。
[0114] 表7.RT-PCR引物序列
[0115]引物名称 序列
BFP-RT-F ATCGCGTTCACCTATGTCAG(序列7)
BFP-RT-R TTCATCGTGCGTTCGTAGAG(序列8)
gapART-F TGATCCGGCTAACCTGAA(序列9)
gapRT-R GCGGTGATGTGTTTACGA(序列10)
[0116] [实施例6]带有RAMP标记融合基因的宿主生长影响分析
[0117] 在本实施例中,为了确认RAMP标记是否对宿主生长诱发应激,分析了带有融合有标记的荧光蛋白质mBFP的宿主(大肠菌)的细胞生长曲线和由此获得的蛋白质表达水平。与上述实施例3的方法同样地准备载体后,培养转化的宿主,将由0.1mM异丙基-β-D-1-硫代半乳糖苷(IPTG)诱导表达的细胞随时间取样,根据吸光度(OD600)值测定细胞浓度。与此同时,对于相同的试样,通过SDS-PAGE电泳测定了蛋白质表达量。其结果如图6所示,融合有RAMP标记的菌株与对照组相比没有生长差异,表达诱导时间点以后,可以确认到与对照组相比蛋白质量明显增加。由此,通过上述结果可知,RAMP标记不会对菌株的细胞生长诱发应激,并且使蛋白质过表达。
[0118] [实施例7]针对难表达工业/医药用蛋白质的RAMP标记效果
[0119] 将前述的RAMP标记的效能应用于附加价值高的难表达工业酶和药物蛋白质。药物蛋白质溶细胞素(cytolysin A,ClyA)和天冬酰胺酶B(asparaginase B,AnsB)、作为工业用酶的酯酶(esterase,1767)和β-葡萄糖苷酶(β-glucosidase,SmGlu)、新普鲁兰酶(neopullulanase,BCN)、氯霉素乙酰转移酶(chloramphenicol acetyltransferase,CAT)虽然应用可能性很大,但是存在大量生产困难的缺点。针对这样的蛋白质,也制作RAMP标记,利用实施例3的方法调查表达量时,可以确认到与对照组相比,蛋白质量显著增加(2.1-4.8倍)(图7)。为了确认过表达的蛋白质是否具有功能性,利用纸片扩散法(disc diffusion assay)和酶谱法(zymography)分别测定氯霉素乙酰转移酶(CAT)和天冬酰胺酶B(AnsB)的酶活性。纸片扩散法通过如下过程进行。将大肠菌在固体培养基中培养后,取单一菌落接种于10ml液体培养基,进行3次传代培养。利用倾注平板法将培养的菌株以5×10细胞/ml接种于1%琼脂培养基后,滴加氯霉素(30μg/ml)10μl,将在常温干燥5分钟后的6mm纸片放置于板中央并进行培养。培养后,测定从纸片形成的生长抑制圈的大小,以mm单位表示。结果确认到,具有与SDS-PAGE表达状态成比例的特性的功能性蛋白质得以过表达(图
8)。
[0120] 对于作为代表性的治疗癌症药物的天冬酰胺酶B的功能性表达与否,利用活性测定法进行测定,所述活性测定法中,根据指示剂(indicator dye)的颜色变化,检测出由作为基质的天冬酰胺酶的水解产物即天冬氨酸引起的pH变化与否。用于此的酶谱法(zymography)是将细胞培养液离心分离而分成细胞层(团块)和上层液,破碎,利用非变性-PAGE凝胶进行电泳后,对活性条带用基质溶液层(覆盖的琼脂(overlaid agar))进行检测的方法。活性检测基质溶液层通过在0.2M三磷酸盐(tris-phosphate)、40mM L-天冬酰胺(L-asparagine)、10mM四苯钠(sodium tetraphenylborate)、1%琼脂(agar)中添加0.1%酚红(phenol red)而制作,在37℃下实施2小时的活性染色反应。结果确认到,具有与SDS-PAGE表达状态成比例的特性的功能性蛋白质得以过表达(图9)。由此确认到,RAMP标记不仅诱导蛋白质的过表达,而且不阻碍酶活性。通过利用借助于抗体的蛋白质印迹和检测试剂盒(assay kit)的比较实验,再次验证上述结果。在本实施例中用于蛋白质表达诱导的RAMP标记的序列如表8所示。
[0121] 表8.工业、医学用蛋白质基因表达用RAMP标记序列
[0122]
[0123] 上述结果显示,本发明在利用设计成与目标基因匹配的RAMP标记的情况下,能够直接利用于确保功能性的医药品或工业用酶的生产。
[0124] [实施例8]RAMP标记融合重组蛋白质稳定性分析
[0125] 在本实施例中,对于由RAMP标记引起的蛋白质稳定性影响和附带稳定性增加效果的标记的功能进行评价。就蛋白质稳定性而言,在药物或酶蛋白质的情况下,赋予更加稳定地维持在生物体内的特性,从而能够起到倍增效果的作用。纵所周知,在蛋白质的N-末端可以存在与结构、功能和稳定性有关的信号序列,因此融合可起到追加或保护具有这些特性的序列的功能的RAMP标记来确认蛋白质的稳定性。此时,使用的目标蛋白质是作为抗癌药物蛋白质的天冬酰胺酶B(asparaginaseB),使在实施例7中利用的RAMP标记位于N-末端,诱导充分的蛋白质的表达后,添加放线菌酮(Cycloheximide)(10/ml),阻断新蛋白质的表达,并确认已表达的蛋白质在生物体内存在的时间。作为蛋白质生物合成抑制剂,有氯霉素(Chloramphenicol)、四环素类抗生素(四霉素(Tetramycin)、金霉素(aureomycin))、大环内酯类抗生素(红霉素(Erythromycin)、白霉素(Leukomycin))、氨基糖苷类抗生素(链霉素(Streptomycin)、卡那霉素(Kanamycin)、庆大霉素(Gentamycin)、新霉素(Neomycin)、阿米卡星(Amikacin))、林可酰胺类抗生素(林可霉素(Lincomycin)、克林霉素(Clindamycin))等,但并不限于此。其结果观察到,与对照组相比,带有RAMP标记的重组蛋白质在生物体维持时间更长(图10)。结果可知,RAMP标记在使目标蛋白质的表达增加的同时赋予稳定性,从而诱导能够长时间发挥功能的特性。这样的特性是由如下效果引起的现象:与转录物天生具有的寿命(半衰期(half-life))有关的固有二级结构因RAMP标记而发生变化,从而调节机制丧失的效果;以及用于翻译的核糖体的接近变得更加容易进行,从而防止受到核酸水解酶影响的效果。
[0126] [实施例9]RAMP标记的C-末端融合
[0127] 在上述所有实施例中,RAMP标记位于目标蛋白质的N-末端。在包括真核细胞在内的大多数生物的翻译过程中,经过一次编码mRNA的核糖体(ribosome)具有利用诱导了环状绳套形态 的mRNA的特性,以便容易再次编码该mRNA,将这样的现象称为核糖体再循环(recycling)。因此,RAMP标记即使位于目标蛋白质的尾部即C-末端(或转录物的3′末端),也可以通过核糖体的再循环而具有tRNA的再使用效果。根据这样的事实,通过将RAMP标记融合于C-末端进行表达或者使用翻译偶联技术(translational coupling)来确认蛋白质量的增加与否。此时使用的目标蛋白质是氯霉素乙酰转移酶(chloramphenicol acetyltransferase,CAT),使实施例7中利用的RAMP标记位于目标基因的C-末端(CAT-R)来验证效果。结果是,与未融合标记的对照组相比,表达量增加4.7-6.5倍以上。由此确认到,RAMP标记在C-末端与N-末端同样地具有相同的蛋白质过表达诱导能力(图11)。
[0128] [实施例10]位于基因内侧的RAMP标记(ramp tag)的制作和效果
[0129] 在本实施例中,设计了可以通过目标基因中(N-末端)的密码子置换而将RAMP标记的功能导入基因内部来获得效果的方法并进行实验。上述实施例中所述的RAMP标记是位于目标基因的前面或后面而诱导tRNA的再使用的方式。但预测到,在没有另外的标记的帮助的情况下,即使利用将目标基因的前面或后面的密码子置换成稀有密码子的方法,tRNA的再使用也显示出相同的效果。这是因为可以预测到,特别是在稀有密码子聚集于基因ORF的中间或后面的情况下,出现在前面的密码子与出现在后面的密码子虽然确定同种氨基酸,但是如果置换成稀有密码子,则远离融合于N-末端的RAMP标记而补偿效果减少的结果。根据这样的假说,将最初出现的同义密码子(synonymous codon)置换成最后出现的稀有密码子。例如可观察到,在酯酶1767的情况下,在起始密码子ATG之后,基因的稀有密码子的同义密码子(synonymous codon)(以下划线表示)间断出现。如果将这样的密码子ATT、GGT、CTT、CGT分别置换成ATA、GGA、CTA、CGA,则在氨基酸没有发生变化的同时本身能够作为RAMP标记发挥作用。
[0130] 例)ATG GTG CAG ATT CAG GGT CAT TAC GAA CTT CAG TTC GAA GCGGTA CGT(序列4)
[0131] 实验结果证明,关于RAMP标记的功能,不仅在采用配置于ORF的前面或后面的方法时有效果,而且在将基因内部前后8-12个序列更换为出现于基因中下端部的稀有密码子的同义密码子(synonymous codon)而使用时也有效果。作为通过与SDS-PAGE进行活性比较的定量结果,确认到表达量增加2.8-4.7倍程度。
[0132] [实施例11]对于细胞因子或激素蛋白质的RAMP标记效果
[0133] 本实施例中,将RAMP标记的功能性应用于附加价值高的难表达细胞因子蛋白质。细胞因子蛋白质白细胞介素-1(interleukin-1)和白细胞介素-32(interleukin-32)虽然作为免疫反应和治疗癌候选物质应用可能性很大,但是表达本身不进行,或者即使诱导了表达,也因形成了包涵体(inclusion body)而难以大量生产确保功能性的蛋白质。包涵体(IB)是指由宿主细胞中表达的外源蛋白质的集聚现象引起的不溶性蛋白质聚集体,其在蛋白质没有正确折叠(folding)时生成。这样的IB不仅使酶活性减少,而且对细胞生长诱发应激,因此减少IB的形成来提高可溶性(soluble)蛋白质的生成比率在重组蛋白质实际生产中会成为重要的指标。在本实施例中,对表达率和可溶性低的细胞因子蛋白质应用RAMP标记后确认了效果。通过蛋白质印迹验证了由于表达率低于相对一般的过表达蛋白质而难以区分的目标条带的区分和表达量差异。这些蛋白质的表达诱导中所利用的RAMP标记的序列如下表9所示。白细胞介素-1基因使用了人类来源的基因(hIL-1β)和小鼠来源的基因(mIL1β),使用了应用以往蛋白质过表达逻辑的密码子优化的合成基因(sIL1β和smIL1β,市场上订购合成)作为对照组。在白细胞介素-32基因的情况下,由于稀有密码子大量存在,因此制作了2个RAMP标记。
[0134] 表9.细胞因子蛋白质基因表达用RAMP标记序列
[0135]
[0136] 结果观察到,利用SDS-PAGE将白细胞介素-1的蛋白质表达量与对照组进行比较时,融合有标记的IL-1(R-hIL-1β、R-sIL1β、R-mIL1β、R-smIL1β)的总蛋白质量增加3.7-6.7倍以上(图12)。如图所示,未检测出应用了以往过表达逻辑的密码子优化基因的表达。通过蛋白质印迹,分析应用了RAMP标记的白细胞介素-32(interleukin-32)的表达率,结果可以确认到,与对照组相比,融合有RAMP标记的IL-32(R-IL32β、R1-IL32γ、R2-IL32γ)的总蛋白质量增加2.4-5.5倍以上。可溶性蛋白质量也增加2.3-3.8倍以上(图13)。此外,应用于一个目标基因的两个RAMP标记均确认到蛋白质过表达,从而本发明提供针对目标蛋白质的RAMP标记的多种融合方法,由此显示可以将RAMP标记序列以多种顺序组合而利用。
[0137] 由上述结果所示,判断出在将能够以特定基因的过表达逻辑充分利用的RAMP标记向通用性大的通用标记(universal tag)扩展功能时,需要调节标记序列的位置或长度,并为了获得更有效的结果,需要翻译偶联技术(translational coupling),即需要在一个转录物中标记与基因不融合而独立地进行翻译。由此,在RAMP标记与基因之间,插入终止密码子(stop codon)或者终止密码子(stop codon)和核糖体结合位点(RBS),尝试如下翻译偶联技术。
[0138] [实施例12]进行翻译偶联(translational coupling)的标记的功能性分析[0139] 为了不以RAMP标记(ramp tag)和重组蛋白质融合的形态翻译而仅使标记翻译成独立的肽,在RAMP标记末端连接终止密码子和核糖体结合位点(RBS)而制作引物。此时,如果仅用1-2个碱基连接RAMP标记与目标基因之间距离,则可以在不导入核糖体结合位点的情况下也独立地诱导翻译。如图2所示那样制作结构体,并在诱导表达载体中分析表达量。此时使用的目标蛋白质是难表达酯酶(esterase,1767)和β-葡萄糖苷酶(β-glucosidase,SmGlu),利用实施例7中使用的RAMP标记,并验证效果。其结果与如图8所示的结果类似地可以确认到,在嫁接标记的1767的情况下,尽管诱导翻译偶联,但维持高的蛋白质量。然而在SmGlu的情况下,蛋白质表达量相对减少而效果显著,但用于诱导具有更加一致性的结果的标记的独立表达策略还有改善余地。这样的问题与如下问题有关:翻译标记的核糖体直接参与目标基因的表达的效率低或者发生相互冲突(翻译标记的核糖体与翻译基因的核糖体之间的干扰)。即,通过对照组实验,确认到并非是标记的效能性问题。
[0140] [实施例13]同时使用商业化标记和RAMP标记的效果分析
[0141] 在本实施例中,提供将RAMP标记与其它目的的多种标记或融合蛋白质一起使用的方法。作为标记,将His-标记、T7-标记、S-标记、Flag-标记、HA-标记、V5表位,Strep-标记、Nano-标记、SBP-标记、c-myc-标记、PelB,Xpress表位与RAMP标记(ramp tag)一起同时融合,并使蛋白质表达。此外,将RAMP标记(ramp tag)与通常使用的融合蛋白质GST、MBP、NusA、CBP、GFP、硫氧还蛋白、Mistic、Sumo、DSB一起使用,分析蛋白质表达。其结果可以确认到,在不侵害对可溶性(solubility)、检测(detection)、定位(localization)发挥特别功能的融合标记或融合蛋白质(fusion protein)的作用的同时,增加借助于RAMP标记(ramp tag)的表达量。在难表达蛋白质β-葡萄糖苷酶(β-glucosidase,SmGlu)中分别配置His-标记和PelB后,使RAMP标记融合,并进行功能评价。此时使用的RAMP标记与实施例7中的相同。
[0142] [实施例14]RAMP标记的序列组合效果分析
[0143] 在本实施例中,提供能够将针对目标蛋白质的RAMP标记的序列以各种顺序组合而利用的方法。在上述实施例11中,应用于相同的目标蛋白质的2个RAMP标记中均确认到蛋白质过表达,由此预测到能够将RAMP标记序列以各种顺序组合而利用。根据这样的结果,以表10所示那样组合确认到过表达的RAMP标记的序列,确认是否增加蛋白质量。此时使用的目标蛋白质以难表达白细胞介素-32(interleukin-32)验证组合效果。与未融合标记的对照组相比,表达量均增加2.2-3.6倍以上(图14)。
[0144] 结果是,观察到与对照组相比表达量显著增加,从而确认即使更换RAMP标记序列顺序也维持增加翻译效率的效果。这是显示出序列组合可能性的结果,所述序列不仅可以作为特定蛋白质优化标记起作用,而且可根据情况作为通用标记起作用。
[0145] 表10.基因表达用RAMP标记序列
[0146]
[0147] [实施例15]RAMP标记的序列长度效果分析
[0148] 在本实施例中,提供调节RAMP标记的序列而诱导过表达的方法和效果。由于每个目标蛋白质所包含的稀有密码子的种类和出现频率不同,因此匹配型RAMP标记的序列长度可能被有机地改变。例如,在目标蛋白质中所包含的稀有密码子的出现频率多的情况下,应用的RAMP密码子变多而序列长度增加。此外,在上述实施例11和14中,组合RAMP标记的序列顺序时,表达量也增加,由此预测到,可以将RAMP标记的序列长度调节成与目标蛋白质匹配。根据这样的结果,将确认到过表达的RAMP标记的序列如表11所示那样以密码子单位缩小或扩大序列长度,并确认是否增加蛋白质量。此时使用的目标蛋白质是新普鲁兰酶(neopullulanase BCN),通过活性测定和SDS-PAGE验证效果。结果是,与未融合标记的对照组相比,表达量均增加1.6-2.7倍以上。由此确认到,即使调节RAMP标记序列长度,也维持增加翻译效率的效果。
[0149] 表11.基因表达用RAMP标记序列
[0150]
[0151] [实施例16]用于分离融合的RAMP标记(ramp tag)的蛋白酶(protease)识别位点应用效果
[0152] 在本实施例中,提供从借助于RAMP标记表达的目标蛋白质中去除标记的方法。作为切割位点,将IgA-蛋白酶、粒酶(granzyme)B、Tev蛋白酶、预切割(prescission)蛋白酶、凝血酶、Xa因子和肠激酶识别/切割(recognition and cleavage site)位点与RAMP标记一起融合,并分析蛋白质表达。在难表达溶细胞素(cytolysin A,ClyA)中分别配置预切割(prescission)蛋白酶、凝血酶(thrombin)、Xa因子(Factor Xa)的切割位点序列后,使RAMP标记融合,并进行功能评价。此时为了通过蛋白质印迹并利用纯分离的蛋白质来确认蛋白质表达和标记切割与否,在ClyA基因的C-末端附着His-标记。此时使用的切割位点序列如表12所示,RAMP标记与实施例7相同。其结果可以确认到,维持借助于RAMP标记(ramp tag)的表达量增加,观察到可以借助于切割位点有效去除RAMP标记(图15)。
[0153] 表12.与RAMP标记融合的蛋白质水解酶切割位点序列
[0154]
[0155] a蛋白酶切割位点
[0156] [实施例17]借助于RAMP标记的多基因同时表达效果
[0157] 在本实施例中,提供在细胞内使多种目标酶多重(操纵子或簇形态)过表达而从宿主细胞高效生产特定产物的方法中利用RAMP标记的方法。在多数情况下,很多工业发酵(fermentation)或生物转化(biotransformation)产物是在生产工序中通过两种以上的酶活性而获得。为了在这样的生物工程系统中大量获得产物,通常利用使代谢途径中的一部分或全部酶多重过表达的方法。在本实施例中,将RAMP标记融合于用于这样的目的的2个代谢途径代谢酶后确认目标产物的生物合成效率。此时使用的多重表达代谢酶是生物合成类异戊二烯的1-脱氧-D-木酮糖-5-磷酸合酶(dxs)和IPP异构酶(idi),根据实施例1和2的原理制作RAMP标记,并验证效果。结果是,与未融合标记的对照组相比,制作的各个重组酶表达量均增加2.2-3.7倍以上(图16A)。如下方法测定这样的RAMP标记的过表达诱导效果引起目标产物的生产量增加的番茄红素含量来进行验证。
[0158] 细胞干燥重量(dry cell weight)如下进行计算:将大肠菌培养液以7,000rpm离心分离3分钟并收集后,用PBS缓冲液洗涤一次,再次以7,000rpm离心分离3分钟,获得细胞团块(pellet),利用该细胞团块进行计算。为此,在105℃,将细胞团块干燥一晚后,测定重量。为了确定细胞的番茄红素含量,将大肠菌细胞以13,000rpm离心分离3分钟并收集后,用PBS缓冲液洗涤一次。将准备的细胞悬浮于丙酮(200ml)中,以暗反应条件在55℃诱导反应15分钟。再次将试样以13,000rpm离心分离10分钟,将包含番茄红素的丙酮上澄液移至干净的管中。关于提取物的番茄红素含量,使用分光光度计(岛津),在470nm处测定吸光度后,与番茄红素标准试样(Sigma)比较而进行定量。标准偏差在测定值的±5.7%的范围内。计算收率的结果是,与未融合标记的对照组相比均增加2.7倍以上(图16B)。
[0159] 结果是,确认到与对照组相比显示出表达量显著增加的蛋白质表达量和配置其的重组菌株中的番茄红素产物收率增加,表示借助于RAMP标记的多基因表达也是有效的。由此可知,在有效的代谢物生产或构建人工代谢途径 时,能够广泛地利用本发明的RAMP标记。
[0160] [实施例18]针对酯酶(esterase 1767)基因的RAMP标记在酵母中的表达诱导效果[0161] 在本发明中,提供将RAMP标记不仅可以在原核生物中而且可以在真核生物中利用于目标基因过表达。作为宿主细胞选择酿酒酵母,作为目标基因选择难表达酯酶(esterase 1767)。酵母的密码子使用中收集稀有密码子的方法与实施例1相同。其结果获得如表13所示的结果。通过实施例2中所述的方法,构成针对酯酶1767的RAMP标记,生成如下的序列(表
14)。以此为基础,以包含起始密码子ATG并沿着正向包含RAMP标记的方式制作引物,配置于酯酶(esterase 1767)基因的N-末端,通过PCR扩增基因,然后用限制酶进行处理,插入到具有GAL2启动子的穿梭载体pYES2。通过电穿孔法(electroporation),将准备的重组载体转化到宿主后,在尿嘧啶缺乏培养基中进行培养。为了确认目标基因的表达量,用2%(v/v)的半乳糖诱导表达,然后实施蛋白质印迹。其结果确认到,与难表达的对照组相比,融合有RAMP标记的1767(RY-1767)得以过表达(图17)。这样的结果表明,RAMP标记可以使工业上有用的酯酶在真核生物中进行过表达,存在能够应用于人体适用中重要的药物蛋白质的大量生产的可能性。
[0162] 表13.酵母中收集的稀有密码子
[0163]
[0164] 表14.酵母宿主中的1767基因表达用RAMP标记序列
[0165]
[0166] [实施例19]中国仓鼠卵巢细胞(Chinese hamster ovary cell,CHO cell)中对B3(Fv)PE38基因的RAMP标记效果
[0167] 本发明证明了可以将RAMP标记在动物细胞中用于目标基因的过表达诱导。为了分析稀有密码子,以黑线仓鼠(Cricetulus griseus)为对象检索出密码子使用并利用,为此的tRNA基因分析利用中国仓鼠卵巢细胞系(C.griseus cell line)CHO-K1。收集稀有密码子的方法与实施例1相同。其结果获得如表16所示的结果。通过实施例2中所述的方式,构成针对B3(Fv)PE38的RAMP标记,生成如下的序列(表15)。利用p3xFlag-CMV-7.1作为表达载体,并利用添加了起始密码子ATG的RAMP标记引物,通过PCR方法以位于CMV启动子后面的方式克隆基因。此时作为用于与RAMP标记比较表达诱导效果的对照组,利用野生型基因和密码子优化(sB3Fv)的合成基因。为了将质粒转化到宿主细胞CHO-K1,实施磷酸介导的转染(calcium phosphate mediated transfection)。培养基使用Gibco公司的CD CHO培养基和10%胎牛血清,使用青霉素-链霉素作为选择性标记(marker)。以悬浮培养条件将细胞培养至5x105细胞/ml后回收,利用对FLAG特异性的抗体,实施蛋白质印迹。其结果确认到,通过一般逻辑难以检测出密码子优化(sB3Fv)的基因的表达,与对照组相比,在N-末端融合有RAMP标记的B3(Fv)PE38的蛋白质量增加约1.5-2.1倍以上(图18)。此时蛋白质表达标记(marker)利用β-肌动蛋白(beta-actin)。
[0168] 表15.动物细胞黑线仓鼠(C.Griseus)中收集的稀有密码子
[0169]
[0170] 表16.黑线仓鼠(C.Griseus)宿主中的B3(Fv)PE38基因表达用RAMP标记序列[0171]
[0172] [实施例20]针对B3(Fv)PE38基因的RAMP标记在小鼠胚胎成纤维细胞(Mouse embryonic fibroblast cell,NIH 3T3 cell)中的效果
[0173] 本发明证明了可以将RAMP标记在动物细胞(小鼠细胞系(mouse cell line))中用于目标基因的过表达诱导。关于导入标记的稀有密码子分析,利用熟知遗传信息的相关细胞株黑线仓鼠(Cricetulus griseus),类推密码子使用(codon usage),对于tRNA基因分析也应用相同的策略。此外,有机地整合已经报道的NIH 3TS细胞信息并利用。收集稀有密码子的方法与实施例19相同。根据上述策略,获得与表15非常类似的稀有密码子分析结果。通过实施例2中所述的方式,构成针对B3(Fv)PE38的RAMP标记,生成如下的序列(表17)。利用p3xFlag-CMV-7.1作为表达载体,并利用添加了ATG的RAMP标记引物,通过与实施例19相同的方法以位于CMV启动子后面的方式克隆重组基因。作为对照组,利用野生型基因和通过典型的方法合成的密码子优化基因(sMB3Fv)。为了将质粒转化到宿主细胞NIH 3T3,利用磷酸钙介导的转染法,然后在添加了Gibco公司的10%胎牛血清和青霉素-链霉素的培养基中进行培养。以悬浮培养条件将细胞培养至5x105细胞/ml后回收,利用对FLAG特异性的抗体,实施蛋白质印迹。其结果确认到,与实施例19的结果类似,密码子优化(sMB3Fv)的基因难表达,在N-末端融合有RAMP标记的B3(Fv)PE38的蛋白质量增加约2.6倍以上(图19)。
[0174] 表17.中国仓鼠(C.griseus)宿主中的B3(Fv)PE38基因表达用RAMP标记序列[0175]
[0176] [实施例21]针对天冬酰胺酶(ansB)基因的RAMP标记在人类细胞(Human cell)中的效果
[0177] 在本实施例中,提供将RAMP标记在人类细胞中用于目标基因的过表达诱导的方法。为了分析稀有密码子,以人类(Homo sapiens)(hg18-NCBI Build 36.1Mar 2006)为对象分析了密码子使用和tRNA基因。收集稀有密码子的方法与实施例1相同。其结果获得如表18所示的稀有密码子分析结果。通过实施例2中所述的方式,构成针对ansB的RAMP标记,生成如表19所示的序列。利用p3xFlag-CMV-7.1作为重组基因表达载体,并利用添加了起始密码子ATG的RAMP标记引物,通过PCR方法以位于CMV启动子后面的方式克隆基因。作为用于蛋白质表达的人类细胞株利用HEK 293t,培养基是在Hyclone公司的DMEM(杜尔贝科改良伊格尔培养基(Dulbecco′s modified eagle medium))中添加10%胎牛血清后使用,并利用青霉素-链霉素作为选择性标记(marker)。以悬浮培养条件将细胞培养至5x105细胞/ml后回收,利用对ansB特异性的抗体,实施蛋白质印迹。其结果确认到,与显示极低的表达率的对照组相比,融合有RAMP标记的ansB(RH-ansB)的蛋白质得以过表达(7.2-10.5倍以上)(图
20)。在评价蛋白质表达时,利用使用对β-肌动蛋白特异性的抗体实施蛋白质印迹而进行比较的方法。同时,对非常难以在真核中进行表达的荧光蛋白质mBFP也利用相同的策略,在相同的细胞株中诱导表达,结果确认到能够进行过表达。此时,表达量增加1.7-3.5倍以上,定量评价过程中利用对mBFP特异性的抗体,利用肌动蛋白基因和蛋白质作为对照组而进行比较。
[0178] 表18.人类细胞中收集的稀有密码子
[0179]
[0180] 表19.人类(H.sapiens)宿主中的ansB基因表达用RAMP标记序列
[0181]
[0182] [实施例22]针对新普鲁兰酶(neopullulanase,BCN)基因的RAMP标记在植物细胞(plant cell)中的效果
[0183] 本发明公开可以将RAMP标记在植物细胞中用于目标基因的过表达诱导。为了分析用于目标基因表达的RAMP标记用稀有密码子,以拟南芥(Arabidopsis thaliana)(参照GenBank序列)为对象,进行密码子使用和tRNA基因分析。收集稀有密码子的方法与实施例1相同。其结果获得如表20所示的稀有密码子分析结果。通过实施例2中所述的方法,构成针对BCN的RAMP标记,生成如下表21所示的序列。利用326-GFP(ABRC,Ohio State University,USA)作为表达载体,并利用添加了起始密码子ATG的RAMP标记引物,通过PCR方法以位于35S启动子后面的方式进行克隆。为了将质粒转化到宿主细胞,利用PEG-介导的转化方法(PEG-mediated transformation),将转化的细胞在23℃的人工环境室中培养24小时。之后,在原生质体中添加蛋白质提取溶液(10mM HEPES、pH 7.5、10mM NaCl、3mM MgCl2、5mM DTT、5mM EDTA、0.2%TritonX-100),在4℃诱导反应1小时,然后,在4℃、13,000rpm下离心分离10分钟,从而将沉淀物与上澄液分离。之后,将上澄液的蛋白质提取物通过SDS-PAGE展开后,利用抗-GFP抗体(单克隆抗-GFP抗体(monoclonal anti-GFP antibody),Clontech),实施蛋白质印迹。同时,通过BCN的典型活性测定法计算功能性表达量。其结果确认到,与对照组相比,在N-末端融合有RAMP标记的BCN蛋白质量增加约2.4-3.1倍以上。由上述结果确认到,RAMP标记也可以有效利用于使用细菌、酵母和动物细胞以及植物细胞作为宿主的蛋白质表达系统中。
[0184] 表20.植物拟南芥(A.Thaliana)中收集的稀有密码子
[0185]
[0186] 表21.植物宿主中的BCN基因表达用RAMP标记序列
[0187]
[0188] [实施例23]针对抗体蛋白质的RAMP标记的表达诱导效果
[0189] 将前述的RAMP标记效能应用于医学用附加价值高的抗体蛋白质。抗体蛋白质抗-CD20(抗-B淋巴细胞抗原(anti-B-lymphocyte antigen)CD20)和抗-TNFα(抗肿瘤坏死因子α(anti-tumour necrosis factor alpha))作为非霍奇金淋巴瘤和类湿关节炎等医学治疗候选物质应用可能性很大,但是存在通过典型的方法难以大量生产的缺点。对这样的蛋白质也制作下述的RAMP标记并将动物细胞作为宿主而调查表达量时,可以确认到与对照组相比,显著增加蛋白质量和活性。通过根据公知的文献(US 8/599,226;US 60/223,360)合成的方法制作抗体基因,根据典型的方法确认抗体的表达和活性。对于纯化的抗-CD20,利用SDS-PAGE凝胶进行电泳而确认纯度,对于抗体的亲和性和特异性,将2B8作为对照组进行比较。将通过直接及竞争结合分析进行试验的抗-CD20抗体与小鼠抗-CD20单克隆抗体2B8比较时,证实与大量CD20阳性B细胞株相当的亲和性和特异性(未显示数据)。抗体的表观亲和性常数(Kap)根据以I125进行放射线标记的标记的抗CD20的直接结合进行测定,并与利用相同的方法标记的2B8进行比较。由CHO生产的抗-CD20的Kap理论值为4.2x10-9M,由SP2/0生产的抗体14/59的Kap理论值为6.7x10-9M。2B8的Kap理论值为3.5x10-9。利用借助于放射线免疫分析法的直接竞争法,与2B8比较可有效竞争的能力,从而确认抗体的特异性和免疫反应性。此外,借助于抗-人类IgG Fc ELISA,检测出抗-TNF的存在量。简单地说,将细胞上澄液的多种稀释液在涂覆有多克隆山羊抗-人类IgG Fc片段的96-孔EIA板中培养后,使用碱性磷酸酶结合 的山羊抗-人类IgG(H+L)和合适的彩色基质(color substrates),检测结合的人类IgG。使上澄液中人类IgG包含于各EIA板上,以便能够利用使用在细胞上澄液中测定的相同的纯化mAb作为标准而得的标准曲线。此时利用于蛋白质的表达诱导的RAMP标记的序列如下表22所示。
[0190] 表22.抗体蛋白质基因表达用RAMP标记序列
[0191]
[0192] 由上述结果显示,本发明的RAMP标记设计成与目标基因匹配,从而能够直接利用于抗体生产。
[0193] [实施例24]RAMP标记对于基质与蛋白质相互作用的效果
[0194] 在本实施例中,提供利用RAMP标记增加基质与蛋白质之间的结合力而提高活性的方法,例如,如果调整本发明的RAMP标记氨基酸序列的电荷值(编码碱性或酸性氨基酸的稀有密码子的集中排列)来提高金属亲和性,则可以期待如下效果:作为辅酶或结构稳定剂起作用的金属离子的供应变得顺利,提高金属依赖性酶(metallo-enzyme)的活性。根据这样的假说,进行了利用抗生素抗性蛋白质β-内酰胺酶(beta-lactamase)是否能够提高菌株的抗生素耐性的实验。β-内酰胺酶中金属-β-内酰胺酶(MBL)系列是对酶活性需要Zn2+的青霉烯酶(carbapenemase)。以此为对象,利用负电荷组的氨基酸或咪唑组的氨基酸制作RAMP标记,并验证效果。选定为对象的MBL是将绿假单胞菌(Pseudomonas aeruginosa)的VIM2基因克隆到pET载体中而进行准备。将pET-VIM2导入大肠菌BL21(DE3)后,利用IPTG诱导表达,然后以不同浓度添加亚胺培南(imipenem),并确认抗生素抗性。对于在具有5X M9盐溶液(48mM Na2HPO4-7H2O、22.0mM KH2PO4、8.6mM NaCl、18.7mM NH4Cl)和2mM MgSO4、0.1mM 2+
CaCl2的组成的最低营养培养基(M9)中添加或不添加Zn 而表现出的抗性程度进行比较,从而分析借助于配置于RAMP标记的带电荷的稀有密码子的酶活性是否发生变化。此时使用的RAMP标记的序列如下表23所示。其结果可以确认到,与对照组(VIM2)相比,融合有RAMP标记的VIM2(RN1-VIM2、RN2-VIM2)的蛋白质表达和活性增加2.6~4.2倍以上,在最低营养培养
2+ 2+
基中不添加Zn 时,与对照组相比没有大的差异,但在添加5mM Zn 时,与具有正电荷的RAMP标记(RP1-VIM2、RP2-VIM2)相比,具有负电荷的RAMP标记(RN1-VIM2、RN2-VIM2)的抗生素抗性活性增加1.8~2.4倍以上。结果是,观察到与对照组相比表达和活性显著增加,从而确认到可以应用具有螯合效应的RAMP标记(图21)。由此显示,借助于RAMP标记增加在细胞中与特定基质结合所需的亲和度,能够提高催化剂反应机遇。此外,如果通过模拟(mimic)对相互作用所需的特定肽的方法来设计RAMP标记,则对蛋白质之间的结合力产生影响,可以调节相互作用。
[0195] 表23.基因表达用RAMP标记序列
[0196]
[0197] [实施例25]排列有组氨酸稀有密码子的RAMP标记的过表达诱导和分离纯化效果[0198] 在本实施例中,提供借助于RAMP标记能够同时实现目标蛋白质表达和高效纯化的方法。就收集稀有密码子的方法而言,如上述实施例1所述,组氨酸包含能够改善目标蛋白质的难表达的稀有密码子(CAC),结构上具有咪唑环而具备金属离子亲和能力。由此,如果在RAMP标记中配置这样的密码子,则不仅能够解决难表达蛋白质的表达问题,而且能够实现利用亲和层析的纯化。根据这样的假设,在构成RAMP标记的序列结构体(construct)时,如表24所示那样组合组氨酸稀有密码子序列,并确认过表达以及纯分离效果。此时使用的目标蛋白质是蓝色荧光蛋白质(mBFP),利用Ni-NTA,通过如下方法,进行分离纯化。将利用本实施例中制作的重组载体通过与实施例3相同的方法转化而得到的单一菌落培养后,将回收的细胞悬浮于50ml结合缓冲液(20mM Tris-HCl、500mM NaCl、pH 7.5)。之后,利用声波粉碎机,将在低温施加超声波10秒、静置30秒的过程反复10次,从而粉碎细胞。将上述破碎的细胞以高速离心分离(15,000rpm、10min)而去除不溶性沉淀物后,回收包含可溶性蛋白质的上澄液。在每20ml的残留于上述回收的上澄液的染色体和多糖类等巨大分子中,添加1g的CDR(cell debris remover)而诱导反应,然后通过上述方法进行离心分离或者利用0.45μm的注射器过滤器(syringe filter)去除杂质。在去除杂质的上澄液中添加10倍体积的结合缓冲液进行稀释。将用于亲和层析的Ni-NTA树脂用50ml的结合缓冲液充分洗涤,以使其达到平衡。在达到平衡的树脂中,将蛋白质溶液以2ml/min的流速诱导附着后,使100ml的清洗缓冲液(20mM Tris-HCl、500mM NaCl、10mM咪唑、pH 7.5)以3ml/min的流速流过,去除未结合的蛋白质和非特异性地弱结合的杂质。使洗脱缓冲液(20mM Tris-HCl、500mM NaCl、250mM咪唑、pH 7.5)以5ml/min流过,进行蛋白质的洗脱。通过荧光灵敏度分析,确认荧光蛋白质被回收的划分区间,去除为了减少与咪唑(imidazole)的非特异性蛋白质相互作用而添加到洗脱缓冲液的氯化钠时,利用截止尺寸(cut-off size)为10kDa的过滤器。通过SDS-PAGE确认蛋白质的结果是,与未融合标记的对照组相比,表达量增加2.2-3.7倍以上,由图22B也可确认,借助于RAMP标记中规律性地排列的组氨酸,通过单一过程能够回收具有90%以上纯度的蛋白质。此外确认到,不论是否存在标记,荧光能力测定值均相似,重组蛋白质的活性也没有问题。
[0199] 表24.包含组氨酸稀有密码子的基因过表达和纯化用RAMP标记序列
[0200]
[0201] 结果是,观察到与对照组相比表达量显著增加,确认到不会对蛋白质活性产生影响,且能够利用RAMP标记以高纯度进行纯化。由此确认到,通过将RAMP标记中所包含的氨基酸有机组合而能够诱导根据目的的亲和性结合。
[0202] 序列表自定义文本
[0203] 序列表1:SmGlu的Ramp标记。
[0204] 序列表2:R-SmPE的Ramp标记。
[0205] 序列表3:R1-1767的Ramp标记。
[0206] 序列表4:R2-1767的Ramp标记。
[0207] 序列表5:R-GFPuv的Ramp标记。
[0208] 序列表6:ClyA的Ramp标记。
[0209] 序列表7:scFv的Ramp标记。
[0210] 序列表8:酯酶1767的Ramp标记。
[0211] 序列表9:C-CAM的Ramp标记。
[0212] 序列表10:B3(Fv)PE38的Ramp标记。
[0213] 序列表11:ansB的Ramp标记。
QQ群二维码
意见反馈