大量分泌的蛋白的筛选和它们作为融合配偶体在重组蛋白制备中应用

申请号 CN200880132268.3 申请日 2008-12-05 公开(公告)号 CN102239183B 公开(公告)日 2017-06-30
申请人 韩国生命工学研究院; 发明人 孙廷薰; 裴贞勋; 金炫辰; 林光默;
摘要 本 发明 涉及鉴定用于超量分泌制备重组 蛋白质 的合适的分泌融合配偶体(SFP)的方法。SFP可通过分泌蛋白质组分析获得。重组蛋白可与分泌融合配偶体(SFP)一起以融合蛋白形式制备得到,并通过体外蛋白酶处理与SFP相分离。本发明的SFP极大地提高了目标蛋白和肽的分泌 水 平,所述目标蛋白和肽对于 生物 制药和生物产业很有价值。
权利要求

1.一种从分离自酵母的分泌蛋白质组鉴定分泌融合配偶体而未使用报告蛋白的方法,所述方法由以下步骤组成:
(i)用可操作地连接有编码分泌多肽的多核苷酸的异源启动子转化第一宿主细胞;
(ii)与所述分泌多肽的天然启动子连接到所述编码分泌多肽的多核苷酸时测得的所述多肽的分泌平相比,确定所述第一宿主细胞是否过量分泌所述分泌多肽;
(iii)用包含编码毒蜥外泌肽-4的第一多核苷酸和编码步骤(ii)中确定为过量分泌的多肽的第二多核苷酸的构建体转化第二宿主细胞,其中,在所述异源启动子的控制下,所述第一多核苷酸和所述第二多核苷酸相对于彼此以任何顺序位于相同的表达盒内;
(iv)在培养条件下培养所述第二宿主细胞,其中所述构建体表达所述分泌融合配偶体-4和所述过量分泌多肽的融合多肽;和
(v)确定所述融合多肽是否分泌到培养基中;从而鉴定所述过量分泌多肽是否为分泌融合配偶体,
其中所述分泌融合配偶体选自下组:SEQ ID NO:80表示的BGL2、SEQ ID NO:81表示的GAS3、SEQ ID NO:82表示的GAS5、SEQ ID NO:83表示的PST1、SEQ ID NO:85表示的SCW10、SEQ ID NO:86表示的SIMI、SEQ ID NO:87表示的UTH1、SEQ ID NO:88表示的YGP1、SEQ ID NO:89表示的YPS1和SEQ ID NO:90表示的ZPS1。
2.一种从分离自酵母的分泌蛋白质组鉴定分泌融合配偶体而未使用报告蛋白的方法,所述方法由以下步骤组成:
(i)用可操作地连接有编码分泌多肽的多核苷酸的异源启动子转化第一宿主细胞;
(ii)与所述分泌多肽的天然启动子连接到所述编码分泌多肽的多核苷酸时测得的所述多肽的分泌水平相比,确定所述第一宿主细胞是否过量分泌所述分泌多肽;
(iii)用包含编码分泌融合配偶体-4的第一多核苷酸和编码步骤(ii)中确定为过量分泌的多肽的第二多核苷酸的构建体转化第二宿主细胞,其中,在所述异源启动子的控制下,所述第一多核苷酸和所述第二多核苷酸相对于彼此以任何顺序位于相同的表达盒内;
(iv)在培养条件下培养所述第二宿主细胞,其中所述构建体表达所述分泌融合配偶体-4和所述过量分泌多肽的融合多肽;
(v)确定所述融合多肽是否分泌到培养基中;从而鉴定所述过量分泌多肽是否为分泌融合配偶体,和
(vi)确定用于分泌所述融合多肽的所述分泌融合配偶体的最佳大小,
其中所述分泌融合配偶体选自下组:SEQ ID NO:80表示的BGL2、SEQ ID NO:81表示的GAS3、SEQ ID NO:82表示的GAS5、SEQ ID NO:83表示的PST1、SEQ ID NO:85表示的SCW10、SEQ ID NO:86表示的SIMI、SEQ ID NO:87表示的UTH1、SEQ ID NO:88表示的YGP1、SEQ ID NO:89表示的YPS1和SEQ ID NO:90表示的ZPS1。
3.如权利要求2所述的方法,其中所述最佳大小通过所述分泌融合配偶体的缺失分析而确定。
4.如权利要求1所述的方法,其中所述异源启动子为原核、真核或病毒的启动子。
5.如权利要求4所述的方法,其中所述异源启动子选自下组:λ噬菌体PR启动子、λ噬菌体PL启动子、λII、大肠杆菌trp启动子、大肠杆菌recA启动子、大肠杆菌热休克启动子、大肠杆菌lacZ启动子、SV40早期启动子、酵母GAPDH启动子、PGK启动子、ADH启动子、PHO5启动子、TEF启动子、GAL1启动子、GAL10启动子、鼠乳腺瘤病毒启动子、人免疫缺陷病毒长末端重复启动子、maloney病毒启动子、巨细胞病毒即刻早期启动子、Epstein Barr病毒启动子、劳斯氏肉瘤病毒启动子、人肌动蛋白启动子、人肌球蛋白启动子、人血红蛋白启动子、人肌酸启动子和人金属硫蛋白启动子。
6.如权利要求5所述的方法,其中所述异源启动子为GAL10。
7.如权利要求1所述的方法,其中所述分泌多肽为糖基化的分泌多肽。
8.如权利要求1所述的方法,其中所述第一宿主细胞选自植物、细菌、真菌、酵母或动物细胞。
9.如权利要求8所述的方法,其中所述第一宿主细胞为酵母细胞。
10.如权利要求9所述的方法,其中所述第一宿主细胞选自下组:念珠菌属、德巴利酵母属、汉森酵母属、克鲁维酵母属、毕赤酵母属、裂殖酵母属、耶罗威亚酵母属、酵母菌属、许旺酵母属和Arxula。
11.如权利要求10所述的方法,其中所述第一宿主细胞选自下组:产朊假丝酵母、博伊丁假丝酵母、白色念珠菌、产乳糖酶酵母、巴斯德毕赤酵母、树干毕赤酵母、粟酒裂殖酵母、酿酒酵母、多形汉森酵母、解脂耶氏酵母、西方许旺酵母和Arxula adeninivorans。
12.如权利要求1所述的方法,其中所述第二宿主细胞选自植物、细菌、真菌、酵母或动物细胞。
13.如权利要求12所述的方法,其中所述第二宿主细胞为酵母细胞。
14.如权利要求13所述的方法,其中所述第二宿主细胞选自下组:念珠菌属、德巴利酵母属、汉森酵母属、克鲁维酵母属、毕赤酵母属、裂殖酵母属、耶罗威亚酵母属、酵母菌属、许旺酵母属和Arxula。
15.如权利要求14所述的方法,其中所述第二宿主细胞选自下组:产朊假丝酵母、博伊丁假丝酵母、白色念珠菌、产乳糖酶酵母、巴斯德毕赤酵母、树干毕赤酵母、粟酒裂殖酵母、酿酒酵母、多形汉森酵母、解脂耶氏酵母、西方许旺酵母和Arxula adeninivorans。

说明书全文

大量分泌的蛋白的筛选和它们作为融合配偶体在重组蛋白制

备中应用

技术领域

[0001] 本发明属于重组蛋白质表达领域。特别是,本发明涉及分泌融合配偶体和筛选合适的分泌融合配偶体(SFP)的技术。本发明公开了用于实现高平分泌目标多肽的最佳SFP。本发明的SFP可诱导超量分泌制备重组蛋白质。

背景技术

[0002] 目标蛋白质的重组表达是广泛用来生产大量用于研究目的或治疗和其它商业用途的蛋白质的方法。本领域已知有多种重组表达系统,包括细菌、酵母哺乳动物宿主细胞系统,并且许多不同蛋白质已在这些系统中成功生产。然而,使用现有表达系统还有许多蛋白质很难生产,导致很少或没有蛋白质表达和分泌。提高重组表达蛋白质分泌的方法,例如过量表达分子伴侣和折叠酶(Hackel等人,Pharm Res 23:790(2006);Poewer和Robinson,Biotechnol Prog 23:364(2007);Shusta等人,Nat Biotechnol 16:773(1998))、过量表达与分泌途径相关的基因((Carla Fama等人,Biochim Biophys Acta 1773:232(2007);Wentz和Shusta等人,Appl Environ Microbiol 73:1189(1998))、对前导序列进行操作(Clements等人,Gene 106:267(1991);Kjaerulff和Jensen,Biochem Biophys Res Commun 
336:974(2005);Sagiya等人,Microbiol.Biotechnol 42:358(1994);Li等人,Bitechnol Prog 18:831(2002))已在特定的目标蛋白上取得一定成功。
[0003] 提高蛋白质生产能的另一种方法是将目标蛋白连接到融合配偶体上。作为融合配偶体使用的分泌蛋白包括人血清白蛋白(Kang等人,Protein Expr Purif 53:331(2007);Huang等人,J.Pept.Sci 14:588(2008))、α-乳白蛋白(WO1995027782A1)、红素还蛋白(WO2000039310A1)、人胰高血糖素(WO2000053777A1)、八目鳗抗菌肽相关肽(WO2005019242A2)、磷酸糖激酶(US6500647B1)、蛋白质二硫键异构酶(Kajino等人,Appl Environ Microbiol 66:638(2000)、葡萄球菌A蛋白(Moreno等人,Protein Expr Purif 18:242(2000)、Hsp150蛋白(Sievi等人,Biotechnol.Prog.19:1368(2003)、纤维素结合域(Ahn等人,Appl  Microbiol  Biotechnol.64:833(2004))和金结合肽
(US20050106625A1)已在特定的目标蛋白上取得一定成功。
[0004] 为了鉴定分泌蛋白和新信号序列,已开发了数个信号序列捕获系统。美国专利No.6,228,590描述了一种筛选哺乳动物信号序列的技术,其使用含有哺乳动物编码序列且与报告蛋白融合的核酸转化报告蛋白缺乏的酵母,并检测分泌报告蛋白的细胞。一种使用缺乏转化酶的酵母和转化酶报告蛋白的类似系统公开于欧洲专利EP0907727中。基于酵母的信号序列捕获已用于鉴定来自人DNA(Klein等人,Proc.Natl.Acad.Sci.USA 93:7108(1996);Jacobs等人,Gene 198:289(1997))、鼠DNA(Gallicioti等人,J.Membrane Biol.183:175(2001))、斑鱼DNA(Crosier等人,Dev.Dynamics 222:637(2001))、拟南芥DNA(Goo等人,Plant Mol.Biol.41:415(1999))、马铃薯DNA(Surpili等人,Anais de Academia Brasileira de Ciencias 74:599(2002))和白色念珠菌DNA(Monteoliva等人,Eukaryotic Cell 1:514(2002))的分泌蛋白。已开发了使用哺乳动物宿主细胞(Gallicioti等人,J.Membrane Biol.183:175(2001))和细菌宿主细胞(Ferguson等人,Cancer Res.65:8209(2000)的类似捕获系统。已用于信号序列捕获的报告蛋白包括转化酶(Klein等人,Proc.Natl.Acad.Sci.USA 93:7108(1996))、α-淀粉酶(U.S.Patent No.6,
228,590)、酸性磷酸酯酶(PHO5)(Surpili等人,Anais de Academia Brasileira de Ciencias 74:599(2002))和β-内酰胺酶(Ferguson等人,Cancer Res.65:8209(2000))。
[0005] 鉴定对目标蛋白分泌有用的翻译融合配偶体(TFPs)的方法公开于WO 2005/068658中。该方法包含:(i)制备多个宿主细胞,所述的宿主细胞用包含核酸片段的文库和与编码报告蛋白的核苷酸序列融合的编码目标蛋白的核苷酸序列的多种载体进行转化;其中所述的宿主细胞缺乏报告蛋白;和(ii)从宿主细胞中鉴定出TFP文库,其中该TFP文库包含单独诱导目标蛋白分泌的核酸片段。
[0006] 在酵母中分泌制备极少分泌型蛋白的翻译融合配偶体(TFP)技术描述于WO 2007/015178。在从酵母基因组中筛选TFP的过程中,发现了YGR106C(Voa1p)基因。目前鉴定出Voa1p蛋白在ER膜上的细胞定位(Ryan等人,Mol.Biol.Cell,Epub ahead of print,Sep 
17,2008)。Voa1p被认为是5个用于液泡ATP酶的V0装配因子中的一个。
[0007] 因此本领域仍亟需能提高蛋白表达的其它序列,以及鉴定这些序列的方法。

发明内容

[0008] 技术问题
[0009] 本发明涉及使用分泌融合配偶体(SFP)超量分泌制备和有效纯化各种重组蛋白质,所述的分泌融合配偶体可通过分泌蛋白质组分析获得。重组蛋白质以含有分泌融合配偶体的融合体形式在胞外制备,并且可通过体外蛋白酶处理从SFP上分离出来。本发明所述SFP极大地提高了目标蛋白的分泌水平并改良了对生物制药和生物产业有价值的多肽。还描述了选择/筛选SFP的方法。尽管可以确定甚至可以预测是否分泌出特定的蛋白质,但不可能预测出分泌的蛋白质是否具有SFP的功能。本发明的选择/筛选方法使得可能选择出具有SFP功能的蛋白质和该蛋白质的片段或衍生物。用本发明的选择/筛选方法选择出的SFP提高了可用于生物制药和生物产业的蛋白质的重组制备。本发明还包括鉴定出的SFP及其片段和衍生物。
[0010] 技术方案
[0011] 因此,本发明的一个目的在于提供鉴定分泌融合配偶体(SFP)的方法,所述的方法包括:
[0012] (i)用可操作地连接有异源启动子的编码分泌多肽的多核苷酸转化第一宿主细胞;
[0013] (ii)与所述分泌多肽的天然启动子连接到所述的编码分泌多肽的多核苷酸时测得的所述多肽的分泌水平相比,确定所述的第一宿主细胞是否过量分泌所述的分泌多肽;
[0014] (iii)用包含第一编码目标多肽的多核苷酸和第二编码步骤(ii)中确定的过量分泌的多肽的多核苷酸的构建体转化第二宿主细胞,其中,所述的第一和第二多核苷酸相对于彼此以任何顺序位于相同的表达盒内;
[0015] (iv)在培养条件下培养所述的第二宿主细胞,其中所述的构建体表达所述目标多肽和所述过量分泌多肽的融合多肽;和
[0016] (v)确定所述的融合多肽是否分泌到培养基中;从而鉴定所述的过量分泌多肽是否为SFP。
[0017] 本发明的另一个目的在于提供一种分离的融合多肽,其包括:(i)上述的SFP或其片段或衍生物;和(ii)目标多肽。
[0018] 本发明另一个目的还在于提供一种分离的融合多肽,其包括:(i)包括含有SEQ ID NO:1的176-213位基酸的亲水(HL)结构域的SFP或其片段或衍生物,其中所述SFP没有跨膜结构域(TM);和(ii)目标多肽。
[0019] 本发明另一个目的还在于提供一种构建体,其包括:(i)启动子;(ii)编码SEQ ID NO:1的176-213位的氨基酸或其片段或衍生物的第一多核苷酸,其中所述SFP无跨膜结构域(TM);和(iii)编码目标多肽或其衍生物的第二多核苷酸。
[0020] 本发明的另一个目的还在于提供一种包含上述构建体的宿主细胞。
[0021] 本发明的另一个目的还在于提供一种重组制备目标多肽的方法,其包括:(i)用编码SFP的多核苷酸和编码目标多肽的多核苷酸转化宿主细胞;(ii)在培养条件下培养所述的宿主细胞,其中从所述的宿主细胞中制备并分泌出包含融合到所述目标多肽的所述SFP的融合多肽;和
[0022] (iii)分离所述的融合多肽。
[0023] 本发明的另一个目的还在于提供一种用上述方法重组制备的目标多肽。附图说明
[0024] 从下述的详细说明并结合所附的附图,将更加清楚地理解本发明上述及其它目的、特征和优点。
[0025] 图1所示为(A)预测的氨基酸序列和SFP1蛋白的结构域;(B)表达连续缺失的SFP1基因的载体示意图;(C)SDS-PAGE分析SFP1蛋白的相对表达水平。10%Tris-Tricine SDS-PAGE分析用0.4mL丙酮浓缩的0.6mL的肉汤培养物。泳道1:用YGaT91载体转化的2805株的培养物;2:用YGaT92载体转化的2805株的培养物;3:用YGaT93载体转化的2805株的肉汤培养物;4:用YGaT94载体转化的2805株的肉汤培养物;5:用YGaT95载体转化的2805株的肉汤培养物;6:用YGaT96载体转化的2805株的肉汤培养物;7:用YGaT97载体转化的2805株的肉汤培养物;泳道M:预染色的蛋白质大小标记(Invitrogen)。
[0026] 图2所示为(A)表达SFP1-IL2融合蛋白的载体示意图;(B)SDS-PAGE分析SFP1-IL2融合蛋白表达水平。10%Tris-Tricine SDS-PAGE分析用0.4mL丙酮浓缩的0.6mL的肉汤培养物。泳道1:用YGaT92-IL2载体转化的2805株的肉汤培养物;泳道2:用YGaT93-IL2载体转化的2805株的肉汤培养物;泳道3:用YGaT94-IL2载体转化的2805株的肉汤培养物;泳道M:预染色的蛋白质大小标记(Invitrogen)
[0027] 图3为含有YGaT92-EXD4的重组酵母株分批补料发酵的曲线图和根据发酵时间SDS-PAGE分析分泌到培养基中的蛋白质的结果。
[0028] 图4所示为SDS-PAGE分析用不同浓度的肠激酶(Invitrogen,USA)消化纯化后的SFP1-EXD4融合蛋白的结果。泳道1:纯化后的SFP1-EXD4融合蛋白;泳道2:用0.1μl肠激酶37℃消化1小时后纯化的SFP1-EXD4融合蛋白;泳道3:用0.2μl肠激酶37℃消化1小时后纯化的SFP1-EXD4融合蛋白;泳道4:用0.3μl肠激酶37℃消1小时后化纯化的SFP1-EXD4融合蛋白;泳道M:预染色的蛋白质大小标记(Invitrogen)。
[0029] 图5所示为(A)HPLC分析肠激酶消化的SFP1-EXD4融合蛋白;(B)SDS-PAGE分析HPLC片段。凝胶上的数字表述HPLC片段的编号。
[0030] 图6所示为MALDI-TOF分析纯化的EXD4蛋白。
[0031] 图7所示为(A)表达SFP1突变体-EXD4融合蛋白的载体示意图;(B)SDS-PAGE分析SFP1突变体-EXD4融合蛋白表达水平。10%Tris-Tricine SDS-PAGE分析用0.4mL丙酮浓缩的0.6mL的肉汤培养物。泳道1:用YGaT92-EXD4载体转化的2805株的肉汤培养物;泳道2:用YGaT921-EXD4载体转化的2805株的肉汤培养物;泳道3:用YGaT922-EXD4载体转化的2805株的肉汤培养物;泳道4:用YGaT923-EXD4载体转化的2805株的肉汤培养物;泳道M:预染色的蛋白质大小标记(Invitrogen)。
[0032] 图8所示为含有YGaMKH-EXD4的重组酵母株在指定发酵时间的分批补料发酵的SDS-PAGE分析。
[0033] 图9为含有YGaST6-EXD4-HL的重组酵母株分批补料发酵的曲线图和根据发酵时间SDS-PAGE分析分泌到培养基中的蛋白质的结果。
[0034] 图10所示为含有YGaMKH-EGF的重组酵母株分批补料发酵的曲线图和根据发酵时间SDS-PAGE分析分泌到培养基中的蛋白质的结果。
[0035] 图11所示为(A)HL-EGF融合蛋白的Ni-NTA亲和层析结果。拼上去的图是指定片段的SDS-PAGE分析和(B)用肠激酶消化后的HL-EGF融合蛋白的Ni-NTA亲和层析结果。拼上去的图是指定片段的SDS-PAGE分析。
[0036] 图12为含有YGaMKH-PTH的重组酵母株分批补料发酵的曲线图和根据发酵时间SDS-PAGE分析分泌到培养基中的蛋白质的结果。
[0037] 图13所示为SDS-PAGE分析用分泌形式的重组子Kex2p(JH Sohn,KRIBB)和肠激酶(Invitrogen,USA)消化后纯化的HL-PTH融合蛋白。泳道1:纯化后的HL-PTH融合蛋白;泳道2:用Kex2p于37℃消化1小时后纯化的HL-PTH融合蛋白;泳道3:用肠激酶37℃消化1小时后纯化的HL-PTH融合蛋白;泳道M:预染色的蛋白质大小标记(Invitrogen)。
[0038] 图14所示为(A)2805株的生长曲线,箭头所指是取样点;(B)样品细胞经荧光染料hochest染色后的共焦激光扫描显微镜结果。
[0039] 图15所示为样品M2的双向凝胶电泳结果。
[0040] 图16所示为1-DE/MudPIT的SDS-PAGE分析1-DE/MudPIT(多维蛋白质鉴定技术,Multidimensional Protein Identification Technology)。
[0041] 图17所示为(A)表达19个选自分泌蛋白质组分析的基因的Y2805转化株培养物上清液的SDS-PAGE分析。10%Tris-Tricine SDS-PAGE分析用0.4mL丙酮浓缩的0.6mL的肉汤培养物。泳道1:过量表达BGL2基因的2805株的肉汤培养物;泳道2:过量表达CIS3基因的2805株的肉汤培养物;泳道3:过量表达CRH1基因的2805株的肉汤培养物;泳道4:过量表达CWP1基因的2805株的肉汤培养物;泳道5:过量表达DSE4基因的2805株的肉汤培养物;泳道
7:过量表达EGT2基因的2805株的肉汤培养物;泳道8:过量表达EXG1基因的2805株的肉汤培养物;泳道9:过量表达GAS1基因的2805株的肉汤培养物;泳道10:过量表达GAS3基因的2805株的肉汤培养物;泳道11:过量表达GAS5基因的2805株的肉汤培养物;泳道12:过量表达PST1基因的2805株的肉汤培养物;泳道13:过量表达SCW4基因的2805株的肉汤培养物;泳道
15:过量表达SIM1基因的2805株的肉汤培养物;泳道16:过量表达TOS1基因的2805株的肉汤培养物;泳道17:过量表达UTH1基因的2805株的肉汤培养物;泳道18:过量表达YGP1基因的
2805株的肉汤培养物;泳道19:过量表达YPS1基因的2805株的肉汤培养物;泳道20:过量表达ZPS1基因的2805株的肉汤培养物;泳道M:预染色的蛋白质大小标记(Invitrogen)。SDS-PAGE分析用Endo-H处理后的培养物上清液(B)。
[0042] 图18所示为SDS-PAGE分析表达出分别与EXD4融合的11个基因的Y2805转化株培养物上清液。10%Tris-Tricine SDS-PAGE分析用0.4mL丙酮浓缩的0.6mL的肉汤培养物。泳道1:过量表达BGL2-EXD4基因的2805株的肉汤培养物;泳道2:过量表达GAS3-EXD4基因的2805株的肉汤培养物;泳道3:过量表达GAS5-EXD4基因的2805株的肉汤培养物;泳道4:过量表达PST1-EXD4基因的2805株的肉汤培养物;泳道5:过量表达SCW4-EXD4基因的2805株的肉汤培养物;泳道6:过量表达SCW10-EXD4基因的2805株的肉汤培养物;泳道7:过量表达SIM1-EXD4基因的2805株的肉汤培养物;泳道8:过量表达UTH1-EXD4基因的2805株的肉汤培养物;泳道
9:过量表达YGP1-EXD4基因的2805株的肉汤培养物;泳道10:过量表达YPS1-EXD4基因的
2805株的肉汤培养物;泳道11:过量表达ZPS1-EXD4基因的2805株的肉汤培养物;泳道M:预染色的蛋白质大小标记(Invitrogen)。
[0043] 图19所示为(A)Kyte-Doolittle亲水性分析和SCW4和EXD4融合体的缺失片段的示意图;(B)SDS-PAGE分析含有逐渐缺失的SCW4-EXD4融合片段的各个转化体培养物上清液。
[0044] 图20所示为分析分别含有YGa-SCW4-1-EXD4和YGa-SCW4-3-EXD4的重组酵母株2805在分批补料发酵过程中分泌到培养液中的蛋白质的SDS-PAGE结果。
[0045] 图21所示为分析用肠激酶处理前后分泌的融合蛋白、SCW4-1-EXD4和SCW4-3-EXD4的SDS-PAGE结果。
[0046] 图22所示为(A)分泌到培养基中的SCW4-hGH的SDS-PAGE结果,肉汤培养10μL含有各自载体的细胞;(B)用肠激酶处理前后的样品。
[0047] 图23所示为根据发酵时间,分析含有YGa-SCW4-2-hGH的重组酵母株分批补料发酵过程中分泌到培养基中的蛋白质的SDS-PAGE结果。
[0048] 图24为IL-2表达载体pYGaT92-IL2的载体图。
[0049] 图25为毒蜥外泌肽-4表达载体pYGaT923-EXD4的载体图。
[0050] 图26为毒蜥外泌肽-4表达载体pYGaMKH-EXD4的载体图。
[0051] 图27为毒蜥外泌肽-4表达载体pYGaST6-EXD-HL的载体图。
[0052] 图28为EGF表达载体pYGaMKH-EGF的载体图。
[0053] 图29为PTH表达载体pYGaMKH-PTH的载体图。
[0054] 图30为毒蜥外泌肽-4表达载体pYGaSCW4-1-EXD4的载体图。
[0055] 图31为毒蜥外泌肽-4表达载体pYGaSCW4-3-EXD4的载体图。
[0056] 图32为hGH表达载体pYGaSCW4-2-hGH的载体图。

具体实施方式

[0057] 本发明满足了高水平地分泌目标多肽和快速、有效地筛选可用于获得高水平分泌的目标多肽的SFP鉴定技术。本发明有助于优化任何蛋白的重组表达,尤其有助于因在已知表达系统中表达水平低而不能大规模和/或低成本制备的蛋白质制备。优化后的SFP可获得高水平的目标多肽的分泌。
[0058] 定义:
[0059] 应当注意,术语“一”或“一个”个体是指一个或多个体;如“一个载体”应当理解为一个或多个载体。同样,术语“一”(或“一个”)、“一个或多个”和“至少一个”在本申请中可以互换使用。
[0060] 本发明中,术语“多肽”包括单个的“多肽”以及多个“多肽”,是指通过酰胺键(也称肽键)线性连接的单体(氨基酸)组成的分子。术语“多肽”是指两个或多个氨基酸的任何链,不是指产物具体的长度。因此,肽、二肽、三肽、寡肽、“蛋白质”、“氨基酸链”或其它用于指代两个或多个氨基酸的链的任何术语都包括在“多肽”的定义内,而且术语“多肽”用这些中的任何一个替代或可互换使用。术语“多肽”还指多肽表达后修饰的产物,包括但不限于:糖基化、酰基化、磷酸化、酰胺化、用已知的保护/保卫基团衍生物、蛋白水解裂解或用非天然的氨基酸修饰。多肽可来源于天然的生物或通过重组技术制备,但不一定翻译自特定的核酸序列。其可以用任何方法生成,包括化学合成。
[0061] “分离的多肽”或其片段、变体或衍生物是指不在其天然环境下的多肽。不需要特别的纯化程度。例如,分离的多肽可移取自其原生的和天然的环境。为本发明目的,在宿主细胞中重组制备的多肽和蛋白被看做进行了分离,其被认为是已经被任何合适的技术分开、分离、部分或基本纯化的原生或重组的多肽。
[0062] 本发明的多肽还包括前述多肽的片段、衍生物、类似物或变体和其任意组合。当术语“片段”、“变体”、“衍生物”和“类似物”是指本发明的多肽时,包括至少保留一些相应原始多肽的生物学、抗原或免疫的特性。本发明的多肽片段包括蛋白水解片段以及缺失片段,此外还包括其它本申请其它地方描述的特定片段。本发明多肽的变体包括如上所述的片段,还包括由于氨基酸取代、缺失或插入导致氨基酸序列改变的多肽。变体可自然发生或非自然发生。非自然发生的变体可通过使用本领域公知的诱变技术进行制备。多肽变体可包括保守的或非保守的氨基酸取代、缺失或增加。本发明多肽的衍生物包括为具有原始多肽所不具有的额外特性而已经发生改变的多肽。多肽变体在本申请中还指“多肽类似物”。本申请中,多肽的“衍生物”指具有通过功能侧基反应后化学衍生出的一个或多个残基的主体多肽(subject polypeptide)。“衍生物”还包括含有20个基本氨基酸的一个或多个天然氨基酸衍生物的肽。例如,4-羟基脯氨酸可用来取代脯氨酸;5-羟基赖氨酸可用来取代赖氨酸;3-甲基组氨酸可用来取代组氨酸;高丝氨酸可用来取代丝氨酸以及氨酸可用来取代赖氨酸。
[0063] “参考氨基酸序列”是指没有任何引入任何氨基酸取代的特异序列。作为本领域技术人员应当理解,如果没有发生取代,本发明“分离的多肽”包括与参考氨基酸序列相同的氨基酸序列。
[0064] 本发明所述的多肽可具有多种改变,如取代、缺失或插入。可在多肽中取代的典型的氨基酸包括具有侧链如(如赖氨酸、精氨酸、组氨酸)、酸性侧链(如冬氨酸、谷氨酸)、不带电荷极性侧链(如甘氨酸、天冬酰胺、谷氨酸胶、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链(如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、β-支链侧链(如苏氨酸、缬氨酸、异亮氨酸)和芳香侧链(如酪氨酸、苯丙氨酸、色氨酸、组氨酸)的氨基酸。
[0065] 还包括与本申请所述的多肽和参考多肽具有至少70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致性的相应多肽片段。
[0066] 序列一致性的计算是通过比较两个在比较区域进行最佳排列的序列,确定相同氨基酸残基或核苷酸在两个序列中所处位置的数目以获得匹配位置的数目,用比较区域(例如窗口大小)的位置总数目除以匹配位置的数目并将其结果乘以100来获得序列一致性的百分数。一方面;当长度为100个氨基酸或核苷酸的四个空位可被引入以使比对最大化时,一致性百分比的计算是指两个序列中的较小序列氨基酸残基或核苷酸的百分数,其中所述的两个序列与被比序列中的相同氨基酸残基或核苷酸比对(Dayhoff,in  Atlas of ProteinSequence and Structure(蛋白质序列和结构地图集),Vol.5,p.124,National Biochemical Research Foundation(全国生化研究基金会),Washington,D.C.(1972),作为引文并入本申请)。一致性的确定通常通过本领域已知的计算机同源性程序进行。典型程序为Gap程序(Wisconsin Sequenc Analysis Package(Wisconsin序列分析软件包),Version 8 for UNIX,Genetics Computer Group,University Research Park,Madison,WI),使用默认设置,应用Smith和Waterman的算法(Adv.Appl.Math.,1981,2:482-489,其以引文形式整体并入本申请)。
[0067] 优选的,任何取代为保守氨基酸的取代。“保守氨基酸取代”是指氨基酸残基用具有相似侧链的氨基酸残基替代。具有相似侧链的氨基酸残基家族在本领域内已有定义。这些家族包括具有碱性侧链如(如赖氨酸、精氨酸、组氨酸)、酸性侧链(如冬氨酸、谷氨酸)、不带电荷极性侧链(如甘氨酸、天门冬酰胺、谷氨酸胶、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链(如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、β-支链侧链(如苏氨酸、缬氨酸、异亮氨酸)和芳香侧链(如酪氨酸、苯丙氨酸、色氨酸、组氨酸)的氨基酸。
[0068] 在一个实施方案中,本发明涉及一种鉴定分泌融合配偶体(SFP)的方法,所述的方法包括:(i)用可操作地与编码分泌多肽的多核苷酸连接的异源启动子转化第一宿主细胞;(ii)与所述分泌多肽的天然启动子连接到所述的编码分泌多肽的多核苷酸时测得的所述多肽的分泌水平相比,确定所述第一宿主细胞是否过量分泌所述的分泌多肽;(iii)用包含第一编码目标多肽的多核苷酸和第二编码步骤(ii)中确定的过量分泌的多肽的多核苷酸的构建体转化第二宿主细胞,其中,所述的第一和第二多核苷酸相对于彼此以任何顺序位于相同的表达盒内;(iv)在培养条件下培养所述的第二宿主细胞,其中所述的构建体表达所述目标多肽和所述过量分泌多肽的融合多肽;和(v)确定所述的融合多肽是否分泌到培养基中;从而鉴定所述的过量分泌多肽是否为SFP。
[0069] 在本发明的方法中,可从“分泌蛋白质组”或“总分泌多肽”中鉴定SFP。分泌蛋白质组包括分泌到胞外培养基并从胞外培养基中收集的多肽。任何真核或原核生物的DNA可编码分泌蛋白质组,包括细菌、真菌(如酵母)、植物和动物(如哺乳动物)。适合的细菌包括但不限于:埃希氏杆菌属和芽孢杆菌属。适合的酵母包括但不限于:念珠菌属、德巴利酵母属、汉森酵母属、克鲁维酵母属、毕赤酵母属、裂殖酵母属、耶罗威亚酵母属、酵母菌属、许旺酵母属和Arxula。具体的物种实例包括:产朊假丝酵母、博伊丁假丝酵母、白色念珠菌、产乳糖酶酵母、巴斯德毕赤酵母、树干毕赤酵母、粟酒裂殖酵母、酿酒酵母、多形汉森酵母、解脂耶氏酵母、西方许旺酵母和Arxula adeninivorans。其它可作为DNA来源的真菌包括但不限于:曲霉属、青霉属、根霉属和木霉属。可作为DNA来源的植物包括但不限于:拟南芥、玉米、烟草和马铃薯。适合的动物细胞包括但不限于:人、鼠、白鼠、兔子、狗、猫和猴子。在一个实施方案中,分泌蛋白质组可源自酵母、细菌、植物或动物。
[0070] 可使用本领域可获得的技术分析分泌蛋白质组用于筛选大量分泌的多肽。例如,从浓缩的培养物上清液中分离出的总分泌多肽可通过双向凝胶电泳和/或多维蛋白质鉴定技术(1-DE/MudPIT)进行分析。可通过任何一种蛋白质纯化柱从分泌蛋白质组分析多肽,如离子交换柱、疏水交互作用柱、凝胶过滤柱、亲和层析柱和反相柱。
[0071] 在一个实施方案中,分析正常的酵母细胞生长过程中制备的总分泌多肽(酵母分泌蛋白质组)。正常的细胞生长是指细胞培养于基本培养基(如0.67%无氨基酸的酵母含氮碱基、0.5%酪蛋白水解物、2%葡萄糖和0.002%尿嘧啶)。可使用改变的条件,所述条件可包括用不同的源替代葡萄糖,如半乳糖、木糖、果糖、甘露糖、蔗糖子糖和纤维二糖。改变的条件还可包括限制培养基中任何组分的水平,如氮或磷。
[0072] 术语“大量分泌”是指分泌多肽的水平达到至少40%、45%、50%、55%、60%、65%或70%的分泌蛋白质组。大量分泌多肽可通过PAI(蛋白丰富指数,protein abundance index)确定(Rappsilber等人,Genome Res.12:1231-45(2002)),其可与分泌蛋白质的量成正比。大量分泌的蛋白的实例列于表1中。
[0073] 术语“过量分泌”被定义为宿主细胞的多肽分泌水平至少超过用天然启动子表达的多肽分泌水平的5X、6X、7X、8X、9X或10X。还可通过与野生型蛋白分泌水平和大量分泌的多肽分泌水平相比,确定过量分泌。例如,野生型酵母在正常细胞生产过程中,分泌的蛋白不超过20mg/L的分泌水平,然而连接到一个强异源启动子后,一些这样的蛋白就过量分泌,分泌水平超过了20mg/L。
[0074] 在一个实施方案中,本发明的方法还包括确定用于分泌融合多肽的SFP的最佳大小。SFP的最佳大小可通过缺失分析所述SFP进行确定,其中,比较各自含有不同SFP的缺失构建体的融合多肽的分泌水平。一些SFP可能具有最佳的大小,从而使其融合多肽的表达水平可能甚至高于最初鉴定的SFP的表达水平。与目标多肽融合到次优的SFP上时目标多肽的分泌水平相比,最佳大小的SFP可增加目标多肽的分泌水平。SFP的最佳大小可随目标多肽而变,但只要SFP被首次鉴定后,就可使用本申请的方法或本领域公知的方法进行确定。
[0075] 在一个实施方案中,选择以亲水序列结束的SFP缺失片段。蛋白的亲水结构域通常定位于蛋白表面的附近。因此,SFP和目标多肽的结合点连接可轻易地暴露于两个多肽之间,使得蛋白酶更易在体外切割连接点而释放目标多肽。
[0076] 术语“其片段”,如SFP所使用的,是指含有任意部分的SFP的氨基酸序列的多肽,其中该片段基本保留了诱导与其融合的目标多肽分泌的能力。
[0077] 本申请中所用的术语“基本上保留诱导与其融合的目标多肽分泌的能力”是指保留原始SFP的诱导与其融合的目标多肽分泌的能力至少50%的片段或其衍生物。在一些实施方案。至少保留60、65、70、75、80、85、90或95%诱导与其融合的目标蛋白分泌的能力。诱导目标多肽分泌的能力可通过本领域公知和前述的常规技术来确定。
[0078] 术语“其衍生物”,如SFP所使用的,是指由与SFP的氨基酸序列至少70%相同的氨基酸序列组成的多肽,其中该多肽基本上保留诱导与其融合的目标多肽分泌的能力。在一些实施方案中,该衍生物包含与SFP的氨基酸序列至少75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致性的氨基酸序列。该衍生物还可包含对SFP氨基酸序列的增加、删除、取代或其组合。衍生物可包括用1、2、3、4、
5、6、7、8、9、10、11-15、16-20、21-25、26-30增加、取代或缺失的突变多肽。增加或取代还包括使用非天然产生的氨基酸。
[0079] SFP的衍生物的实例包括但不限于:缺失突变(如单向突变缺失)、增加功能序列(如糖基化位点、限制性酶切位点)和缺失或增加(如交换)SFP中鉴定的前导序列或前序列。本领域技术人员可使用常规的诱变技术,如文所引的参考文献中所述,制备SFP的衍生物或编码SFP的核酸的衍生物,并且鉴定基本保留诱导与其融合的目标多肽的分泌能力的衍生物。
[0080] 在一个实施方案中,用本发明的方法鉴定SFP或其衍生物或片段。在另一个实施方案中,编码SFP的核苷酸序列选自下述:BGL2(SEQ ID NO:62)、GAS3(SEQ ID NO:63)、GAS5(SEQ ID NO:64)、PST1(SEQ ID NO:65)、SCW4(SEQ ID NO:66)、SCW10(SEQ ID NO:67)、SIMI(SEQ ID NO:68)、UTH1(SEQ ID NO:69)、YGP1(SEQ ID NO:70)、YPS1(SEQ ID NO:71)和ZPS1(SEQ ID NO:72)。在另一个实施方案中,SFP选自下述:BGL2(SEQ ID NO:80)、GAS3(SEQ ID NO:81)、GAS5(SEQ ID NO:82)、PST1(SEQ ID NO:83)、SCW4(SEQ ID NO:84)、SCW10(SEQ ID NO:85)、SIMI(SEQ ID NO:86)、UTH1(SEQ ID NO:87)、YGP1(SEQ ID NO:88)、YPS 1(SEQ ID NO:89)和ZPS1(SEQ ID NO:90)。
[0081] 本发明的方法可使用术语“目标多肽”或其衍生物,它们为被期望有高水平重组表达的多肽。术语“其衍生物”如所用于“目标多肽”,是指由与多肽的氨基酸序列至少70%相同的氨基酸序列组成的多肽,其中该多肽基本上保留诱导与其融合的目标多肽分泌的能力。在一些实施方案中,该衍生物包含与目标多肽的氨基酸序列至少75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同的氨基酸序列。该衍生物还可包含对目标多肽的氨基酸序列的增加、缺失、取代或其组合。衍生物可包括用1、2、3、4、5、6、7、8、9、10、11-15、16-20、21-25、26-30增加、取代或缺失的突变多肽。增加或取代还包括使用非天然产生的氨基酸。
[0082] 目标蛋白或目标多肽的衍生物的实例包括但不限于:缺失突变(如单向突变缺失)、增加功能序列(如糖基化位点、限制性酶切位点)和缺失或增加(如交换)目标多肽中鉴定的前导序列或前序列。本领域技术人员可使用常规的诱变技术,如本文所引的参考文献中所述,制备目标多肽的衍生物或编码目标多肽的核酸的衍生物,并且鉴定基本保留诱导与其融合的目标多肽的分泌能力的衍生物。
[0083] 如目标多肽融合到SFP,目标多肽和SFP就不是同样的天然存在蛋白的多肽。目标多肽可为正以研究目的而研究的多肽或正以商业为目的如制药和产业用途而生产的多肽。目标多肽可来自于任何植物、动物或微生物,只要它可以被核酸编码,可以是天然发生的或经过修饰的。在一个实施方案中,目标多肽为人类蛋白。在另一个实施方案中,目标多肽为细胞因子、血清蛋白、集落刺激因子、生长因子、激素或酶。
[0084] 例如,目标多肽可选自下述:白细胞介素、凝结因子、干扰素-α、-β或-γ、粒细胞集落刺激因子、粒细胞巨噬细胞集落刺激因子、组织生长因子、上皮生长因子、TGFα、TGFβ、表皮生长因子、血小板衍生生长因子、成纤维细胞生长因子、促卵泡激素、促甲状腺激素、抗利尿激素、色素性激素、甲状旁腺激素、促黄体生成激素释放激素、碳水化合物特异性酶、蛋白水解酶、脂肪酶、氧化还原酶、转移酶、水解酶、裂解酶、异构酶、连接酶、免疫球蛋白、细胞因子受体、乳蛋白、磷脂酶A2激活蛋白、胰岛素、胖瘤坏死因子、降素、降钙素基因相关肽、脑啡肽、生长调节素、促红细胞生成素、下丘脑释放因子、催乳素、绒毛膜促性腺激素、组织纤溶酶原激活物、生长激素释放肽、胸腺体液因子、抗癌肽或抗菌肽。具体实例包括但不限于:人白细胞介素-2(hIL-2)、毒蜥外泌肽-3、毒蜥外泌肽-4(EXD4)、胰高血糖素样肽-1(GLP-1)、甲状腺激素(PTH)、人白细胞介素-1β、人白细胞介素-6、人白细胞介素-32α、-32β或32γ、VII因子、VIII因子、IX因子、人血清白蛋白、人干扰素-α、-β或-γ、人粒细胞集落刺激因子、人粒细胞巨噬细胞集落刺激因子、人生长激素(hGH)、人血小板衍生生长因子、人碱性成纤维细胞生长因子、人表皮生长因子(EGF)、人胰岛素样生长因子、人神经生长因子、人转化生长因子β-1、人促卵泡激素、葡萄糖氧化酶、葡聚糖苷酶、半乳糖苷酶、葡糖脑苷脂酶、萄糖酸酶、天冬酰胺酶、精氨酸酶、精氨酸脱氨基酶、过氧化物歧化酶、内毒素酶、过氧化氢酶、糜蛋白酶、尿酸酶、腺苷二磷酸酶、酪氨酸酶、胆红素氧化酶、半乳糖-1-磷酸尿苷酸转移酶、水母绿色荧光蛋白、南极假丝酵母脂肪酶B、假丝酵母脂肪酶、真菌氯过氧化物酶、β-半乳糖苷酶、解离酶、α-半乳糖苷酶、β-葡萄糖苷酶、海藻糖合酶、环糊精糖基转移酶、木聚糖酶、植酸酶、人乳铁蛋白、人促红细胞生成素、人对氧磷酶、人生长分化因子15、人半乳凝素-3结合蛋白、人丝氨酸蛋白酶抑制剂、Kunitz 2型、人Janus激酶2、人FMS样酪氨酸激酶3配体、人YM1 & 2、人CEMI、人二酰基甘油酰基转移酶、人瘦蛋白、人mL259、人蛋白水解酶3、人溶菌酶、人DEAD盒蛋白41、人依托泊苷诱导蛋白24、小鼠半胱天冬酶1、牛血管生成因子和蚯蚓蚓激酶。
[0085] 在一个实施方案中,目标多肽为很难用常规的重组制备方法制备的多肽,也即不能制备或仅以很低的水平进行制备。在另一个实施方案中,目标多肽为易于用已知的表达系统进行制备的多肽,但期望其获得更高水平的表达。
[0086] 在一个实施方案中,本发明的融合多肽是指包含分泌多肽以任何顺序融合到目标多肽而形成的多肽。在另一个实施方案中,本发明涉及包含融合到目标多肽的本发明SFP的分离融合多肽。
[0087] 术语“融合的”在本申请中是指重组制备的融合多肽。在一个实施方案中,融合多肽包含融合到目标多肽的分泌多肽,其中分泌多肽和目标多肽以任何顺序进行融合。在另一个实施方案中,SFP在目标多肽的N-末端或C-末端进行融合。SFP和目标多肽可使用或不使用插入的氨基酸如由连接DNA编码的氨基酸进行融合。在一些实施方案中,SFP和目标多肽的距离可为0~10;0~20;0~30;0~40个或更多氨基酸。在一些实施方案中,融合多肽包含蛋白酶识别序列和或亲和标签。
[0088] 在一个实施方案中,分离的融合多肽包括含有SEQ ID NO:1的176-213位氨基酸的亲水(HL)结构域的SFP或其片段或衍生物和目标多肽。在一个实施方案中,修饰的HL结构域由SEQ ID NO:45编码。
[0089] 本发明还涉及使用本发明的SFP重组制备目标蛋白的方法。在一个实施方案中,该方法包括:制备构建体,所述构建体包含编码目标蛋白的核苷酸序列,该核苷酸序列可操作性地连接至编码SFP或其衍生物或片段的核苷酸序列;用所述构建体转化宿主细胞;在宿主细胞生成和分泌目标蛋白的条件下培养宿主细胞;再从所述的目标多肽中分离出SFP。
[0090] 目标蛋白可使用任何本领域已知表达系统重组制备。优选地,目标蛋白在例如细菌、酵母或哺乳动物细胞培养物中重组表达。重组表达包括:制备包含编码目标蛋白的多核苷酸的载体,运送载体至宿主细胞,在目标蛋白表达条件下培养宿主细胞,以及分离目标蛋白。制备重组载体和使用同样的载体转化宿主细胞、在宿主细胞中复制载体和表达生物活性外源多肽和蛋白质的方法和材料在前面讨论且描述于Sambrook等人,Molecular Cloning《( 分子克隆》),第三版,Cold Spring Harbor Laboratory(冷泉港实验室),2001和Ausubel等人,Current Protocols in Molecular Biology(《现代分子生物学教程》),John Wiley & Sons,New York第三版(2000),均以参阅的方式纳入本申请。
[0091] 目标蛋白可从宿主细胞生长的培养基中分离出来,通过本领域已知的纯化方法例如常规色谱方法包括免疫亲和层析法、受体亲和层析法、流水作用色谱法、凝集素亲和层析法、尺寸排阻过滤法、阳离子或阴离子交换色谱法、高效液相色谱法(HPLC)、反相HPLC等。其它纯化方法还包括那些预期多肽作为融合多肽被表达和纯化的方法,其中所述的融合多肽具有特定的亲和肽、标签、标记或被特定结合配偶体或试剂识别的螫合部分。经纯化的蛋白质可断裂以获得预期蛋白,或可作为完整的融合蛋白被保存。作为断裂过程的结果,亲和标签组分的断裂可生成具有其它氨基酸残基的预期蛋白质形式。在一个实施方案中,亲和标签为GST、MBP、NusA、硫氧还蛋白、泛素、FLAG、BAP、6HIS、STREP、CBP、CBD、S-标签或其组合。
[0092] 本发明的目标多肽与分泌融合配偶体以融合形式在胞外制备,并可通过体外蛋白酶处理从SFP中分离出来。如果被分离的目标蛋白在采用分离操作后没有生物活性,可使用多种方法使多肽发生“重折叠”或转化成其三级结构并生成二硫键使之恢复生物活性。本领域普通技术人员已知的方法包括在特定浓度的离液剂存在下将溶解的多肽的pH调节至通常大于7。离液剂的选择类似于包涵体增溶作用的选择,但是通常浓度较低且不必要和增溶作用使用同种离液剂。可能需要使用还原剂或特定比例的还原剂和其氧化形式,以得到特定的氧化还原电位使蛋白质的半脱氨酸桥形成中可发生二硫键的转移。一些常用的氧化还原对包括半脱氨酸/胱胺、谷胱苷肽(GSH)/二硫代谷胱甘肽、氯化、二硫苏糖醇(DTT)/二噻烷DTT、2-巯基乙醇(bME)/二硫代-b(ME)。为了增加重折叠效率,可能有必要使用助溶剂,例如甘油、多种分子量的聚乙二醇和精氨酸。
[0093] 术语“多核苷酸”包括单个核酸以及多个核酸,是指分离的核酸分子或构建体,如信使RNA(mRNA)、病毒来源的RNA或质粒DNA(pDNA)。多核苷酸可包括常规的磷酸二酯键或非常规的键(如酰胺键,例如发现于肽核酸中(PNA))。术语“核酸”是存在于多核苷酸的指任何一种或多种核酸片段,如DNA或RNA片段。“分离的”核酸或多核苷酸是指从它的原始环境中移取的核酸分子,DNA或RNA。例如,载体中所含的编码治疗用多肽的重组多核苷酸被认为是为本发明目的的分离的重组多核苷酸。分离的多核苷酸的进一步的实例包括异源宿主细胞中维持的重组多核苷酸或溶液中的(部分地或大体上地)纯化的多核苷酸。分离的RNA分子包括本发明体内或体外的RNA转录本以及本申请公开的瘟病毒载体的正链和负链形式和双链形式。
[0094] 本发明分离的多核苷酸或核酸包括该合成制备的分子。此外,多核苷酸或核酸可为或可包括调控元件,如启动子、核糖体结合位点或转录终止子。
[0095] 本申请使用的“编码区域”为含有翻译成氨基酸的密码子的核酸的一部分。尽管“终止子”(TAG、TGA或TAA)不翻译成氨基酸,但它被认为是编码区域的一部分,但如果存在任何侧翼序列,如启动子、核糖体结合位点、转录终止子、内含子、5′和3′非编码区等则不是编码区的一部分。本发明的两个或多个编码区可存在于单个的多核苷酸构建体如在单个载体中,或分别存在于多核苷酸构建体如分别(不同)的载体中。此外,任何载体可含有单个编码区或可包含两个或多个编码区,如本发明的载体可编码一个或多个多肽,其通过蛋白酶裂解翻译后或共翻译分离出最终的多肽。此外,本发明的载体、多核苷酸、或核酸可编码异源编码区,可以融合或不融合到本发明的第一或第二编码区或其变体或衍生物。异源编码区包括不受限的特殊的元件或基序,如分泌的信号肽或异源功能域。
[0096] 在某些实施方案中,多核苷酸或核酸为DNA。对于DNA,多核苷酸包括核酸,其通常编码包括启动子和/或其它转录或翻译控制元件可操作地与一个或多个编码区相连的多肽。当基因产物,如多肽的编码区可操作地与一个或多个调节序列连接时,这样在调控序列的影响或控制下进行基因产物的表达。如果启动子功能的诱导导致了编码所期望的基因产物的mRNA的诱导,如果两个DNA片段之间的自然的连接没有干扰表达调节序列直接表达基因产物的能力,或没有干扰的表达或转录DNA模板的能力,那么两个DNA片段(如多肽编码区和与之相连的启动子)是“可操作性地连接”的,因此,如果启动子可影响核酸的转录,那么启动子区是可操作性地与编码多肽的核酸相连。启动子可以为细胞特异性启动子,其基本上只在预定的细胞内的指导DNA的大量转录。除启动子外的其它的转录控制元件,如增强子、操作子、抑制子和转录终止信号可与多核苷酸可操作性地相连,以指导细胞特异性转录。本申请公开了合适的启动子和其它转录控制区域。
[0097] 各种转录转录控制区域是本领域技术人员公知的。它们包括但不限于:在脊椎动物中发挥功能的转录控制区域,例如不限于巨细胞病毒的启动子和增强元件(如与内含子A相连的即刻早期启动子)、猴病毒40(如早期启动子)和逆转录病毒(如劳氏肉瘤病毒)。其它转录控制区域包括来自于脊椎动物基因,如肌动蛋白、热激蛋白、牛生长激素和兔β-球蛋白的启动子以及其它可在真核生物细胞中控制基因表达的序列。此外合适的转录控制区域包括组织特异性启动子和增强子以及淋巴因子可诱导启动子(如可被干扰素或白细胞介素诱导的启动子)。
[0098] 同样的,各种翻译控制元件是本领域技术人员公知的。它们包括但不限于:核糖体结合位点、翻译起始和终止密码子和源自病毒系统的元件(特别为内部核糖体进入位点,或IRES,也被称为CITE序列)。
[0099] 本发明的多核苷酸可包括RNA,如信使RNA(mRNA)形式的。本发明的RNA可以是单链或双链的。
[0100] 本发明的多核苷酸和核酸编码区域可与其它的编码分泌或信号多肽的编码区域相关,其指导本发明多核苷酸编码的多肽分泌。根据信号假说,哺乳动物细胞分泌的蛋白具有信号肽或分泌前导序列,其在穿越粗面内质网的生长中蛋白链开始输出时裂解自成熟蛋白。本领域技术人员应当了解,通过脊椎动物的细胞分泌的多肽通常具有融合到多肽N-末端的信号肽,其裂解自全部或“全长”多肽中而产生分泌的或“成熟”形式的多肽。在某些实施方案中,使用了天然的信号肽如免疫球蛋白的重链或轻链信号肽,或使用与多肽可操作性相连、保留指导多肽分泌能力的序列的功能性衍生物。或者,可使用异源哺乳动物信号肽或其功能性衍生物。例如,野生型前导序列可被人组织型纤维蛋白溶酶原激活剂(TPA)或鼠β-葡糖酸醛酶的前导序列取代。
[0101] 术语“构建体”是指非天然存在的核酸分子。构建体是编码融合多肽的多核苷酸。在一个实施方案中,构建体编码含有SFP或候选的SFP和目标多肽的融合多肽。构建体可进一步包括环状或线性载体,并可与其它多核苷酸组合,如进行同源重组。
[0102] 如本申请所使用的,术语“载体”是指能够转运与其相连的另一个核酸的核酸分子。一种载体是“质粒”,它是指能连接其它DNA片段的环状双链DNA环。另一种载体是病毒载体,其中其它DNA片段可连接到该病毒基因组中。某些载体能够在其引入的宿主细胞中自主复制(例如具有细菌的复制起始区的细菌载体和附加型哺乳动物载体)。其它载体(例如非附加型哺乳动物载体)一旦引入至宿主细胞后就整合至宿主细胞的基因组中从而随着宿主基因组复制。本发明的载体能够指导编码与它们可操作性连接的目标蛋白基因的表达。这些载体在本文中称为“表达载体”。一般而言,在重组DNA技术中有用的表达载体通常是质粒的形式。在本说明书中,“质粒”和“载体”可互换使用,因为质粒是载体的最常用形式。但是,本发明也包括具有相同功能的其它形式的表达载体,例如病毒载体(例如复制缺陷的逆转录病毒、腺病毒和腺伴随病毒)。
[0103] 载体DNA可通过常规的转化或转染技术导入到原核或真核细胞内。如本申请所使用的,术语“转化”和“转染”是指各种本领域公知的将外源核酸(如DNA)引入到宿主DNA的技术,包括磷酸钙或氯化钙共沉淀法、DEAE-dextran介导的转染法、脂质体转染法或电转法。适合转化或转染宿主细胞的方法可见Sambrook等人的(MOLECULAR CLONING:A LABORATORY MANUAL.2nd ed.,Cold Spring Harbor Laboratory,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,1989)和其它实验室手册。
[0104] 已知的是,哺乳动物细胞的稳定转染取决于表达载体和所用的转染技术,仅有一小部分的细胞可将外源DNA整合到其基因组中。为鉴定和选择这些整合体,通常将编码选择标记(如抗抗生素)的基因随目标基因一起导入到宿主细胞内。各种选择标记包括那些抗药标记,如G418、潮霉素和甲胺嘌呤。可将编码选择标记的基因和编码目标多肽的基因在同一个载体或在各自的载体上导入宿主细胞。用导入的核酸稳定地转染过的细胞可通过药物选择、营养缺陷型的选择、基质组合物、碳源选择或其它本领域公知的方法(如含有选择标记基因的成活,而其它细胞死亡)鉴别
[0105] 在一个实施方案中,编码本发明的方法中所使用的多肽或其片段或衍生物的核苷酸序列还可在5′端和3′端包含用于与本发明的线性载体进行体内同源重组的DNA。当5′端和3′端DNA共转化到宿主细胞内时,它们能提供足够的序列以允许编码多肽或其片段或衍生物的核苷酸序列和线性载体之间进行体内重组。在一个实施方案中,5′端和3′端DNA各自包含至少20个与线性载体序列重叠的碱基对,如至少30个或40个碱基对。可使用常规的重组技术添加5′和3′DNA,如PCR和/或限制性内切酶消化和连接。
[0106] 本发明的多核苷酸还可编码亲和标签,如GST、MBP、NusA、硫氧还蛋白、泛素、FLAG、BAP、6HIS、STREP、CBP、CBD、或S-标签。亲和标签可由连接DNA编码或由本发明其它部分的多核苷酸编码,如融合蛋白编码区域的5′或3′部分。
[0107] 本发明的多核苷酸还可包括连接DNA。在一个实施方案中,连接DNA编码连接肽。
[0108] 本发明的连接DNA可足够长,并与线性载体的核苷酸序列部分具有足够的一致性,从而在它们共转化到宿主细胞内后,允许编码多肽的核苷酸序列和线性载体之间发生体内重组。在一个实施方案中,连接DNA的长度至少为20个碱基对,或至少长度为30个或40个碱基对。在进一步的实施方案中,连接DNA至少与相应的线性载体的序列具有80%的一致性,例如至少85%、90%、95%或99%的一致性。
[0109] 在一个实施方案中,连接DNA编码蛋白酶识别序列,从而允许在SFP和目标多肽的连接点发生裂解。例如,连接DNA可编码酵母kex2p-或Kex2样蛋白酶识别序列(如含有Lys-Arg、Arg-Arg或Leu-Asp-Lys-Arg(SEQ ID NO:74)的氨基酸)、哺乳动物弗林蛋白酶识别序列(如含有Arg-X-X-Arg的氨基酸序列)、因子Xa-识别序列(如含有Ile-Glu-Gly-Arg(SEQ ID NO:75)的氨基酸序列)、肠激酶-识别序列(如含有Asp-Asp-Lys的氨基酸序列)、枯草杆菌蛋白酶-识别序列(如含有Ala-Ala-His-Tyr(SEQ ID NO:76)的氨基酸序列)、烟草蚀刻病毒蛋白酶-识别序列(如含有Glu-Asn-Leu-Tyr-Phe-Gln-Gly(SEQ ID NO:77)的氨基酸),泛素水解酶-识别序列(如含有Arg-Gly-Gly的氨基酸)或凝血酶-识别序列(如含有Arg-Gly-Pro-Arg(SEQ ID NO:78)的氨基酸)。
[0110] 在连接子的蛋白酶位点内或在分泌多肽或目标多肽内,优选通过内源宿主蛋白酶避免融合多肽的不想要的裂解。同样,在目标多肽或分泌多肽或SFP或其片段或衍生物内,优选通过用于从目标多肽中裂解分泌多肽的蛋白酶避免裂解。因此,如果作为编码融合多肽的多核苷酸一部分,编码蛋白酶识别序列的连接DNA被转化入宿主细胞时,则所述宿主细胞优选不表达识别连接子内蛋白酶序列的蛋白酶。宿主细胞既可以天然地不表达蛋白酶,或宿主细胞也可以经过修饰而不表达蛋白酶(如kex2突变体宿主细胞、Kex2样蛋白酶突变体宿主细胞和弗林蛋白酶突变体宿主细胞)。如果融合多肽包含分泌多肽和目标多肽,则分泌多肽或SFP或其片段或衍生物和/或目标多肽可天然不包含宿主蛋白酶识别序列,或分泌多肽或SFP或其片段和衍生物和/或目标多肽可以经过修饰而不含有被宿主蛋白酶识别的序列。如果融合多肽包含分泌多肽或SFP或其片段或衍生物、目标多肽和含有蛋白酶识别序列的肽连接子,则分泌序列或SFP或其片段或衍生物和/或目标多肽可天然地不含有蛋白酶识别序列,或分泌多肽或SFP或其片段或衍生物和/或目标多肽可以经过修饰而不含有被肽连接子的蛋白酶识别的序列识别的序列。
[0111] 在另一个实施方案中,连接DNA编码亲和标签,如GST、MBP、NusA、硫氧还蛋白、泛素、FLAG、BAP、6HIS、STREP、CBP、CBD或S-tag.
[0112] 在进一步的实施方案中,连接DNA编码限制性内切酶识别位点和蛋白酶识别序列(如kex2p样蛋白酶或kex-2p-识别序列)。
[0113] 原核生物中多肽表达的实施,可使用含有指导目标蛋白-报告蛋白融合的表达的组成型或诱导型启动子的载体。适合的大肠杆菌表达载体的实例包括pTrc(Amrann等,Gene 69:301-315(1988))和pET(Studier等,GENE EXPRES SION TECHNOLOGY:METHODS IN ENZYMOLOGY 185,Academic Press,San Diego,Calif.(1990)60-89)。
[0114] 为了在酵母细胞中表达,合适的酵母表达载体包括,但不限于pYepSecl(Baldari等,EMBO J.6:229-234(1987)),pMFa(Kurjan等,细胞30:933-943(1982))、pJRY88(Schultz等,Gene 54:113-123(1987)),pYES2(Invitrogen Corporation,San Diego,Calif.)和picZ(Invitrogen Corp,San Diego,Cal.)。
[0115] 为了在昆虫细胞中表达,可使用杆状病毒表达载体。可用于在培养的昆虫细胞(例如SF9细胞)中表达蛋白质的杆状病毒载体包括pAc系列(Smith等,Mol.Cell.Biol.3:2156-2165(1983))和pVL系列(Lucklow等,Virology 170:31-39(1989))。
[0116] 在另一个实施方案中,宿主细胞是哺乳动物细胞而载体是哺乳动物表达载体。哺乳动物表达载体的实例包括pCDM8(Seed,Nature 329:840(1987))和pMT2PC(Kaufman等,EMBO J.6:187-195(1987))。当用于哺乳动物细胞时,表达载体的调控功能常常由病毒调控元件提供。例如,通常使用的启动子来源于多瘤腺病毒2、巨细胞病毒和猿猴病毒40。其它适合的用于原核和真核细胞两者的表达系统参见例如Sambrook等人,MOLECULAR CLONING:A LABORATORY MANUAL.2nd ed.,Cold Spring Harbor Laboratory,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,1989。
[0117] 优选的载体包括但不限于:质粒、噬菌体、粘粒、游离基因、病毒颗粒或病毒和整合的DNA片段(例如通过同源重组可整合至宿主基因组的片段)。优选的病毒颗粒包括但不限于腺病毒、杆状病毒、细小病毒、疱疹病毒、痘病毒、腺相关病毒、塞姆利基森林病毒、痘苗病毒和逆转录病毒。优选的表达载体包括但不限于:pcDNA3(Invitrogen)和pSVL(Pharmacia Biotech)。其它表达载体包括但不限于:pSPORTTM载体、pGEMTM载体(Promega)、pPROEX载体TM(LTI、Besda、MD)、BluescriptTM载体(Strata基因)、pQETM载体(Qiagen)、pSE420TM(Invitrogen)和pYES2TM(Invitrogen)。
[0118] 在一个实施方案中,表达载体是复制型DNA构建体,其中编码目标多肽的DNA序列可操作性地连接或结合至能够影响目标多肽在合适宿主中表达的合适调控序列中。当它们的功能彼此相关时,DNA区域可操作性地连接或结合。例如,如果启动子能调控该编码序列的转录,则将该启动子可操作性地连接或结合于编码序列。扩增载体不需要表达调控域,而相反,仅需要由复制起始区赋予的在宿主中进行复制的能力和帮助识别转化体的选择基因。表达载体对调控序列的需要取决于选择的宿主和选择的转化方法。一般来说,调控序列包括但不限于:转录启动子、增强子、控制转录的可选操纵子序列、多腺苷酸化信号、编码适合的结合核糖体的mRNA的序列和调控转录和翻译终止的序列。这些调控序列描述于例如,Goeddel,GENR EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY 185,Academic Press,San Diego,Calif.(1990)。调控序列包括那些在多种类型的宿主细胞中指导核苷酸序列的组成型表达和那些仅在特定宿主细胞中指导核苷酸序列表达(如组织特异性调控序列)的调控序列。本领域技术人员应当理解表达载体的设计取决于所选择的要转化的宿主细胞、预期的蛋白质表达的水平等等这些因素。
[0119] 本发明的表达载体可导入宿主细胞从而制备蛋白质或肽,包括本文描述的由核酸编码的融合蛋白或肽。优选载体含有可被宿主生物体识别的启动子。
[0120] 在一个实施方案中,本发明的启动子是强异源启动子,其用于重组制备外源多肽。异源启动子可以是诱导型或组成型启动子。优选异源启动子为那些用于常规制备蛋白质的启动子,如上文所述的那些。本发明的异源启动子可分为天然或野生型SFP启动子。
[0121] 本发明的启动子序列可以是原核、真核或病毒的序列。合适的原核序列实例包括λ噬菌体的PR和PL启动子(The bacteriophage Lambda,Hershey,A.D.,Ed.,Cold Spring Harbor Press,Cold Spring Harbor,NY(1973)其以参阅的方式全文并入本申请;λII,Hendrix,R.W.,Ed.,Cold Spring Harbor Press,Cold Spring Harbor,NY(1980),其以参阅的方式全文并入本申请);大肠杆菌的trp、recA、热休克和lacZ启动子以及SV40早期启动子(Benoist等,Nature,290:304-310(1981),其以参阅的方式全文并入本申请)。对于酵母,合适的启动子的实例包括但不限于:GAPDH、PGK、ADH、PHOS、GALI和GAL10。其它启动子包括但不限于:小鼠乳腺瘤病毒、人免疫缺陷症病毒长末端复制、maloney病毒、巨细胞病毒立即早期启动子、EB病毒(Epstein Bar virus)、劳氏肉瘤病毒、人肌动蛋白、人肌球蛋白、人血红蛋白、人肌酸和人金属硫蛋白。
[0122] 其它调控序列也可包括在优选的载体中。合适的调控序列的实例以噬菌体MS-2的复制酶基因和λ噬菌体的cII基因的夏因-达尔加诺序列为代表。
[0123] 此外,合适的表达载体可包括允许筛选转化的宿主细胞的适当标记。所选宿主的转化使用本领域技术人员公知和先前Sambrook等人描述的各种技术中的任意一种来进行。
[0124] 复制起始区还可通过构建载体以包括外源的起始区来提供或通过宿主细胞染色体复制机制提供,如果将载体整合入宿主细胞染色体,后者就足够了。或者,相比使用含有病毒复制起始区的载体,本领域技术人员可使用用选择性标记和目标蛋白DNA共转化的方法来转化哺乳动物细胞。合适标记的一个实例是二氢叶酸还原酶(DHFR)或胸苷激酶(参见美国专利4,399,216)。
[0125] 编码目标蛋白的核苷酸序列可用载体DNA利用常规技术重组,包括平末端或粘末端(staggered)连接、限制性酶消化来提供适当的末端、适当补平粘性末端、碱性磷酸酶处理以避免非预期的连接以及用适当的连接酶连接。这些操作的技术先前由Sambrook等人公开且在本领域内公知。构建哺乳动物表达载体的方法公开于例如Okayama等人,Mol.Cell.Biol.3:280(1983),Cosman等,Mol.Immunol.23:935(1986),Cosman等,Nature 
312:768(1984)、EP-A-0367566和WO 91/18982,它们各自均以参阅的方式全文并入本申请。
[0126] 本发明所用的宿主细胞可以是本领域技术人员公知的任何宿主细胞。合适的宿主细胞包括细菌、真菌、(例如酵母)、植物或动物(例如哺乳动物或昆虫)细胞。合适的酵母细胞包括念珠菌属、德巴利酵母属、汉森酵母属、克鲁维酵母属、毕赤酵母属、裂殖酵母属、耶罗威亚酵母属、酵母菌属、许旺酵母属和Arxula。具体实例包括产朊假丝酵母、博伊丁假丝酵母、白色念珠菌、产乳糖酶酵母、巴斯德毕赤酵母、树干毕赤酵母、粟酒裂殖酵母、酿酒酵母、多形汉森酵母、解脂耶氏酵母、西方许旺酵母和Arxula adeninivorans。其它合适的真菌包括曲霉属、青霉属、根霉属和木霉属。可用作宿主细胞的细菌包括埃希氏杆菌属、假单胞菌属和杆菌属。合适的植物宿主细胞包括拟南芥、玉米、烟草和马铃薯。动物细胞包括人、小鼠、大鼠、兔、狗、猫、猴和昆虫。实例包括CHO、COS1、COS 7、BSC1、BSC40、BMT 10和Sf9细胞。在一个具体的实施方案中,宿主细胞为酵母细胞。
[0127] 本发明的多核苷酸可导入宿主细胞作为环状质粒的部分或作为包含分离蛋白质编码区域的线性DNA或病毒载体。本领域公知且常规进行的将DNA导入宿主细胞的方法包括转化、转染、电穿孔法、核注射或与载体如脂质体、胶束、血影细胞和原生质体融合。
[0128] 任何可快速有效检测的报告蛋白可用于本发明。在一个实施方案中,为了使筛选过程自动化,报告蛋白具有可被积极选择的活性。在另一个实施方案中,报告蛋白是分泌至细胞外间隙的蛋白质,例如转化酶、蔗糖酶、纤维素酶、木聚糖酶、麦芽糖酶、淀粉酶、葡萄糖淀粉酶、半乳糖苷酶(例如α-半乳糖苷酶、β-半乳糖苷酶、蜜二糖酶)、磷酸酶(例如PHO5)、β-内酰胺酶、脂肪酶或蛋白酶。在一个具体的实施方案中,分泌蛋白允许细胞在特定底物上生长。作为哺乳动物细胞中报告基因系统的实例,CD2/新霉素-磷酸转移酶(Ceo)基因可用作含有抗生素G418的培养基中的分泌报告基因以捕获在小鼠胚胎干细胞中的分泌通路基因(De-Zolt等,Nucleic Acid Res.34:e25(2006))。
[0129] 在一个实施方案中,宿主细胞是酵母,报告蛋白是转化酶,转化的酵母细胞根据它们在蔗糖或蜜三糖上生长的能力来选择。在另一个实施方案中,宿主细胞是酵母,报告蛋白是蜜二糖酶;转化的酵母细胞根据它们在蜜二糖上生长的能力来选择。在另一个实施方案中,宿主细胞是酵母,报告蛋白是淀粉酶(例如内淀粉酶、外淀粉酶、β-淀粉酶或葡萄糖淀粉酶),酵母细胞是非淀粉分解的,转化的细胞根据它们降解淀粉的能力来筛选。在另一个实施方案中,鉴定具有报告蛋白活性的细胞的步骤通过使用具有生长抑制因子抗性的报告蛋白来进行,例如抗生素。在另一个实施方案中,报告蛋白是能够目测的蛋白质,例如绿色荧光蛋白或荧光素酶。在一个实施方案中,鉴定显示报告蛋白活性的细胞的步骤通过使用两个或多个报告蛋白例如脂肪酶和转化酶来进行。
[0130] 本发明的宿主细胞不显示报告蛋白活性。在一个实施方案中,宿主细胞不天然表达报告蛋白。在其它实施方案中,编码报告蛋白的基因已被全部或部分缺失或已突变以使得报告蛋白不表达或以无活性形式表达。使一个细胞缺乏一种特定蛋白质的方法在本领域内公知;并且任何此种方法可用来制备本发明的宿主细胞(前述Sambrook等人)。对于酵母来说,报告蛋白缺乏可使用公知的基因置换技术来引入(Rothstein,Meth.Enzymol.194:281(1991))。
[0131] 可使用本领域技术公知的技术从任何来源获得编码目标多肽的核酸,包括从基因组或cDNA中分离、通过PCR扩增或化学合成。
[0132] 可从任何形式的DNA,包括基因组DNA、cDNA、合成的DNA和重组DNA获得核酸或其片段的文库。除DNA外,还可使用核酸,包括RNA和非天然存在的核酸。可通过多样化预先鉴定核酸片段,如单一缺失、突变、功能性序列的增加(如糖基化位点)或核酸片段之间的前和后信号序列的交换获得预先选定的核酸片段文库。在一个实施方案中,核酸片段大小小于1000碱基对,如小于700、500或300个碱基对。核酸片段的文库可通过DNA酶切割、DNA合成或重组DNA技术(如单一缺失、突变)构建。
[0133] 核酸片段可源自生物的整个基因组,如整个基因组或cDNA文库。片段还可源自整个基因组的子集,如扣除文库或一定大小的文库(sized library)。
[0134] 下列实施例用于说明而非限制本发明的方法和组合物。其它对在临床治疗中经常遇到的各种条件和参数的合适的修饰和调节对本领域技术人员显而易见的,也在本发明的精神和范围内。
[0135] 实施例
[0136] 实施例1确定胞外分泌用YGR106C基因的最佳大小
[0137] 本实施例阐释了胞外分泌所需的YGR106的最佳区域。如图1A所示,YGR106C(下称分泌融合配偶体1,SFP1)蛋白(SEQ ID NO:1)由包含信号肽的256个氨基酸残基、三个糖基化位点、一个亲水性结构域(HL)和一个跨膜结构域组成。
[0138] 在GAL10启动子的调控下过量表达完整的YGR106C基因在培养基中没有产生YGR106C蛋白。然而,在酵母GAL10启动子的调控下,使用C-末端截短形式的YGR106C,在培养基中高水平地分泌出截短的SFP1(SEQ ID NO:1的氨基酸1-213)。
[0139] 确定用于分泌的SFP1基因最佳区域进一步鉴定。通过Kyte-Doolittle亲水性分析(图1A)确定几种SFP1蛋白的功能结构域,如分泌信号(SEQ ID NO:1的氨基酸1-19)、亲水结构域(HL)(SEQ ID NO:1的氨基酸176-213)和跨膜结构域(TM)(SEQ ID NO:1的氨基酸220-247)。
[0140] 构建含有具有连续缺失的SFP1基因的不同载体的重组酿酒酵母(Saccharomyces cerevisiae)2805菌株(Mat a ura3 INV2 pep4::HIS3 can1)并比较各个载体分泌的SFP1相关蛋白(图1B)。起初,为表达完整的SFP1蛋白,用PCR引物、含有BamHI位点的正向引物T9F(SEQ ID NO:2)和含有SalI位点的反向引物H159(SEQ ID NO:3),从酿酒酵母2805基因组DNA扩增出SFP1的开放阅读框(ORF)。用Pfu聚合酶(Stratagene,USA)或Ex-Taq DNA聚合酶(TaKaRa Korea Biomedical Inc.,韩国首尔)进行PCR扩增。PCR条件包括:94℃变性5min,94℃进行25个扩增循环30sec,55℃30sec和72℃1min,最后72℃延伸7min。扩增出的SFP1ORF用BamHI-SalI酶切,再亚克隆到YEGα-HIR525的BamHI-SalI位点(Sohn等,Process Biochem.30:653(1995)),生成的质粒命名为YGaT91。
[0141] 为表达C末端缺失TM结构域的截短SFP1蛋白,用正向引物T9F(SEQ ID NO:2)和反向引物H160(SEQ ID NO:4),从YGaT91载体中扩增出SFP1的基因片段。按照构建YGaT91的相同的方法将扩增出的SFP1的基因片段克隆到YEGα-HIR525,生成的质粒命名为YGaT92。
[0142] 为表达C末端缺失一半HL结构域的截短的SFP1蛋白,用正向引物T9F(SEQ ID NO:2)和反向引物H161(SEQ ID NO:5),从YGaT91载体中扩增出SFP1的基因片段。按照构建YGaT91的相同的方法将扩增出的SFP1的基因片段克隆到YEGα-HIR525,生成的质粒命名为YGaT93。
[0143] 为表达C末端缺失HL结构域的截短的SFP1蛋白,用正向引物T9F(SEQ ID NO:2)和反向引物H162(SEQ ID NO:6),从YGaT91载体中扩增出SFP1的基因片段。按照构建YGaT91的相同的方法将扩增出的SFP1的基因片段克隆到YEGα-HIR525,生成的质粒命名为YGaT94。
[0144] 为表达C末端缺失第三个糖基化位点的截短的SFP1蛋白,用正向引物T9F(SEQ ID NO:2)和反向引物H205(SEQ ID NO:7),从YGaT91载体中扩增出SFP1的基因片段。按照构建YGaT91的相同的方法将扩增出的SFP1的基因片段克隆到YEGα-HIR525,生成的质粒命名为YGaT95。
[0145] 为表达C末端缺失第二个糖基化位点的截短的SFP1蛋白,用正向引物T9F(SEQ ID NO:2)和反向引物H204(SEQ ID NO:8),从YGaT91载体中扩增出SFP1的基因片段。按照构建YGaT91的相同的方法将扩增出的SFP1的基因片段克隆到YEGα-HIR525,生成的质粒命名为YGaT96。
[0146] 为表达C末端缺失第一个糖基化位点的截短的SFP1蛋白,用正向引物T9F(SEQ ID NO:2)和反向引物H203(SEQ ID NO:9),从YGaT91载体中扩增出SFP1的基因片段。按照构建YGaT91的相同的方法将扩增出的SFP1的基因片段克隆到YEGα-HIR525,生成的质粒命名为YGaT97。
[0147] 用构建的载体(YGaT91、YGaT92、YGaT93、YGaT94、YGaT95、YGaT96和YGaT97)转化酿酒酵母2805菌株。从UD平板(0.67%无氨基酸酵母氮源、0.77g/l氨基酸混合物、2%葡萄糖和2%琼脂)上选择的单菌落于YPDG肉汤培养基(1%酵母提取物、2%细菌蛋白胨、1%葡萄糖、1%半乳糖)中30℃培养40小时。每个0.6mL的肉汤培养基中分泌的蛋白用0.4mL丙酮浓缩,并通过SDS-PAGE分离。如图1C所示,只在携带YGaT92、YGaT93和YGaT94的细胞中检测到SFP1相关蛋白(分别为泳道2、3和4)。在所有的三个阳性菌株中均检测到两条带,一条为糖基化形式,另一条为非糖基化形式。但其它细胞,YGaT91、YGaT95、YGaT96和YGaT97没有这些条带(分别为泳道1、5、6和7)。该结果表明去除TM结构域并保留所含的所有三个糖基化位点使SFP1可进行胞外分泌。
[0148] 实施例2确定作为融合配偶体用于分泌目标蛋白的SFP1基因的最佳大小
[0149] 本实施例阐释了SFP1衍生物作为融合配偶体的应用。为测试SFP1衍生物作为融合配偶体用于示例性目标蛋白人白介素-2(hIL-2)的分泌,分别用YGaT92、YGaT93和YGaT94的三个SFP1衍生物(SFP1-92(SEQ ID NO:39)、SFP1-93(SEQ ID NO:40)和SFP1-94(SEQ ID NO:41)),构建了三个载体以表达融合蛋白hIL-2(图2A)。还生成了hIL-2和SFP1-91(SEQ ID NO:38)的融合蛋白,数据未示出。为了用YGaT92的SFP1-92融合hIL2基因,用识别GAL10启动子的正向引物GAL100(SEQ ID NO:10)和反向引物H121(SEQ ID NO:11)从YGaT92载体扩增出SFP1基因片段。为方便与hIL2基因融合从而诱导酵母二肽蛋白酶Kex2p体内裂解hIL2融合蛋白(Mizuno K等,Biochem.Biophys.Res.Commun.156:246(1988)),设计了H121引物(SEQ ID NO:11)以含有Kex2p裂解序列和N-末端hIL2序列。用含有与H121引物(SEQ ID NO:11)互补的部分SFP1序列的正向引物IL2F(SEQ ID NO:12)和反向引物IL2R(SEQ ID NO:13)扩增人IL-2基因。IL2R引物含有部分GAL7终止子序列。使用GAL100和GT50R(SEQ ID NO:14)引物,使扩增得到的含有SFP1-92和hIL-2基因的PCR片段通过重叠-衍生PCR进行融合。
GT50R引物为识别GAL7终止子的反向引物。生成的PCR产物含有100bp的GAL10启动子和50bp的GAL7终止子侧翼序列。酿酒酵母作为表达宿主的一个优点在于可以使用有效和正确的同源重组策略。本领域公知的是线性化载体和在片段末端每一侧共有DNA序列重叠的的DNA片段可进行重组,恢复质粒的环状拓扑(Kunes等,Genetics.115:73(1987))。酿酒酵母的这一特性被用来构建表达宿主系统。
[0150] 为使用YGaT92载体作为体内重组的骨架,将YGaT92载体用BamHI/SalI酶切。用凝胶回收试剂盒(Bioneer,韩国)从琼脂糖凝胶中回收线性化载体。用GAL100/GT50R引物扩增获得的PCR产物与线性化载体有50个共有的核苷酸。体内重组最小的要求为约30个核苷酸的重叠(Oldenberg等,Nucleic Acids Res.25:451(1997)。50个核苷酸的重叠足以在酿酒酵母中进行质粒的重新构建。通过共转化上述的PCR产物和载体片段直接构建酿酒酵母2805的重组子。通过重组构建的质粒命名为YGaT92-IL2(图24)。为构建转化YGaT93-IL2载体的酿酒酵母2805菌株,除了使用(SEQ ID NO:15)代替H121引物(SEQ ID NO:11),我们使用与YGaT92-IL2质粒构建中相同的方法。H120引物为识别YGaT93载体的SFP1基因的3’末端并含有Kex2p裂解序列和hIL2的N-末端序列的反向引物。为用YGaT94-IL2载体转化酿酒酵母2805株,除了使用H119引物(SEQ ID NO:16)代替H121引物(SEQ ID NO:11),使用如YGaT92-IL2质粒构建中相同的方法。H119引物为识别YGaT9载体的SFP1基因的3’末端并含有hIL2的N-末端序列的反向引物。
[0151] 从UD平板(0.67%无氨基酸酵母氮源、0.77g/l氨基酸混合物、2%葡萄糖和2%琼脂)上选择的单菌落于YPDG肉汤培养基(1%酵母提取物、2%细菌蛋白胨、1%葡萄糖、1%半乳糖)中30℃培养40小时。每个0.6mL的肉汤培养基中分泌的蛋白用0.4mL丙酮浓缩,并通过SDS-PAGE分离。如图2B所示,携带有YGaT92-IL2(SEQ ID NO:58)和YGaT93-IL2的细胞分泌出SFP1衍生蛋白和hIL2(分别为泳道1和2),但携带YGaT94-IL2的细胞没有分泌(泳道3)。结果表明以融合形式表达时,HL结构域对于SFP1衍生蛋白的分泌是非常重要的。
[0152] 实施例3融合有SFP1衍生物的目标蛋白的表达
[0153] 实施例2中从YGaT92构建的SFP1-92(SEQ ID NO:39)用于分泌制备Exendin-4(EXD4),一种胰高糖素样肽1(GLP1)的39个氨基酸的肽类似物。为简单和有效地纯化完整的EXD4蛋白,将6-组氨酸标签和肠激酶裂解位点(DDDDK(SEQ ID NO:79),D:天冬氨酸,K:赖氨酸)加入到SFP1的C-末端。因而,N-末端至C-末端的融合蛋白包括SFP1片段、6-组氨酸标签、肠激酶裂解位点和EXD4序列。为构建表达SFP1-92EXD4融合蛋白的YGaT92-EXD4载体,用GAL100引物(SEQ ID NO:10)和反向引物HDK-R(SEQ ID NO:17)从YGaT92载体扩增出SFP1-92基因,所述的反向引物HDK-R识别HL序列并含有6个组氨酸密码子。用含有18个与HDK-R引物和DDDDK密码子互补的正向引物HDK-F(SEQ ID NO:18)和含有18个GT50R(SEQ ID NO:14)引物序列的反向引物EXD-R(SEQ ID NO:19)扩增出EXD4基因。扩增出的SFP1-92和EXD4基因用GAL100/GT50R引物对通过重叠-延伸PCR进行融合。如实施例2所述,通过共转化融合的片段和BamHI/SalI酶切的YGaT92载体片段在体内重组直接构建携带YGaT92-EXD4载体的酿酒酵母2805菌株的重组子。
[0154] 将用YGaT92-EXD4转化的重组酵母通过分批补料培养的方式培养于5L的发酵罐,评价其诱导分泌制备SFP1-92-EXD4融合蛋白的能力。使用种子培养基(6.7%不含氨基酸的酵母氮源、0.5%酪蛋白水解物和2%葡萄糖)在摇瓶中培养待接种于发酵罐的种子培养物。当使用发酵培养基(4%酵母提取物、1%蛋白胨、2%葡萄糖)作为初始发酵培养物OD600达到约15时,根据细胞生长速率提供不同用量的补料培养基(15%酵母提取物、30%葡萄糖、
30%半乳糖)。培养48小时后,培养物OD600达到约160。在指定的时间点收集10μl的培养液并通过SDS-PAGE评价分泌蛋白(图3A-B)。与标准蛋白条带相比,分泌的SFP1-EXD4估算约为
500mg/L。离心去除酵母细胞,收集上清液,浓缩并超滤脱盐(Quickstand,Amersham)。
[0155] 融合蛋白,SFP1-92-EXD4用Ni-NTA亲和层析柱(QIAGEN,USA)纯化(图4,泳道1)。为了从SFP1-92融合蛋白中回收EXD-4,纯化的融合蛋白用不同浓度的肠激酶(Invitrogen,USA)进行消化。将样品溶于肠激酶缓冲液[20mM Tris-HCl(pH8.0)、50mM NaCl、2mM CaCl2]中。将等量的蛋白样品用0.1、0.2和0.3μl的肠激酶于37℃消化1小时。生成的蛋白用SDS-PAGE进行分析(图4,分别为泳道2、3和4)。
[0156] 产生了数条小的蛋白条带,而不是两个条带。那些小的片段有可能是肠激酶非特异性消化SFP1的结果。SFP1蛋白含有DDK(第137个氨基酸)和EDK(第168个氨基酸)残基,其有可能是肠激酶的底物。
[0157] 为进一步分析从SFP1-92-EXD4分离的EXD-4,通过HPLC分离肠激酶处理后的样品(图4,泳道3)(图5A)。HPLC谱图中检测到的蛋白峰用SDS-PAGE进行分析(图5B)。HPLC流分号41显示出预期为EXD-4的单个条带。通过MALDI-TOF(Korea Basic Science Institute,Daejeon,韩国)(图6)进一步分析该蛋白用于确定其分子量(MW)。从SFP1-92融合蛋白中制备的EXD-4的MW为4187.8Da,这与通过其氨基酸序列计算得到的MW相符。
[0158] 为构建抗肠激酶的强SFP1-92融合配偶体,将DDK和EDK残基分别变为DGK和EGK残基(图7A)。为将DDK残基变成DGK残基,用GAL100引物(SEQ ID NO:8)和含有甘氨酸密码子而不是DDK残基的天冬氨酸密码子的反向突变引物H307(SEQ ID NO:20),从YGaT92-EXD4中扩增5’SFP1-92片段。用与H307(SEQ ID NO:20)互补的正向引物H306(SEQ ID NO:21)和GT50R引物(SEQ ID NO:14),从YGaT92-EXD4载体中扩增3’SFP1-92-EXD4片段。用GAL100/GT50R引物对通过重叠延伸PCR融合这些片段。用BamHI/SalI消化后,将这些融合片段克隆到YGaT92-EXD4载体的BamHI/SalI位点处。确认所生成质粒的核苷酸序列,并命名为含有SFP1-921的YGaT921-EXD4(SEQ ID NO:42)。
[0159] 为将EDK残基变成EGK残基,用GAL100引物(SEQ ID NO:10)和含有甘氨酸密码子而不是EDK的天冬氨酸密码子的反向突变引物H309(SEQ ID NO:22),从YGaT92-EXD4中扩增5’SFP1片段。用与H309(SEQ ID NO:22)互补的正向引物H308(SEQ ID NO:23)和GT50R引物(SEQ ID NO:14),从YGaT92-EXD4中扩增3’SFP1-92-EXD4片段。用GAL100/GT50R引物对进行重叠延伸PCR融合这些片段。用BamHI/SalI消化后,将这些融合片段克隆到YGaT92-EXD4载体的BamHI/SalI位点处。确认所生成质粒的核苷酸序列,并命名为含有SFP 1-922的YGaT922-EXD4(SEQ ID NO:43)。
[0160] 为了分别将DDK和EDK残基都变成DGK和EGK,用GAL100引物(SEQ ID NO:10)和含有甘氨酸密码子而不是EDK的天冬氨酸密码子的反向突变引物H309(SEQ ID NO:22),从YGaT91-EXD4中扩增5’SFP1片段。用与H309(SEQ ID NO:22)互补的正向引物H308(SEQ ID NO:23)和GT50R引物(SEQ ID NO:14),从YGaT92-EXD4中扩增3’SFP1-EXD4片段。用GAL100/GT50R引物对通过重叠延伸PCR融合这些片段。用BamHI/SalI消化后,将这些融合片段克隆到YGaT92-EXD4载体的BamHI/SalI位点处。确认所生成质粒的核苷酸序列,并命名为含有SFP1-923的YGaT922-EXD4(图25)(SEQ ID NO:44)。
[0161] 用载体YGaT92-EXD4、YGaT921-EXD4、YGaT922-EXD4和YGaT923-EXD4转化酿酒酵母2805菌株。从UD平板(0.67%无氨基酸酵母氮源、0.77g/l氨基酸混合物、2%葡萄糖和2%琼脂)上选择的单菌落于YPDG肉汤培养基(1%酵母提取物、2%细菌蛋白胨、1%葡萄糖、1%半乳糖)中30℃培养40小时。用0.4mL的丙酮沉淀含有蛋白的0.6mL培养物上清液,并溶于肠激酶缓冲液[20mM Tris-HCl(pH8.0)、50mM NaCl、2mM CaCl2]中。将等量的蛋白样品用0.1μl的肠激酶37℃消化1小时,并用SDS-PAGE进行分离。
[0162] 如图7B所示,由YGaT92-EXD4转化子制备的SFP1被消化成大约15kDa的片段(图7B,泳道1),但由YGaT921-EXD4和YGaT922-EXD4转化子制备的SFP1(图7B,分别为泳道2和3)比来自于YGaT92-EXD4的SFP1更抗内源肠激酶的消化。最终,由YGaT923-EXD4(SEQ ID NO:59)转化子制备的绝大多数的SFP1片段是完整的(图7B,泳道4)。因此,结果表明,YGaT923-EXD4的SFP1变体可成功应用于表达和纯化目标蛋白。
[0163] 实施例4与SFP1的HL结构域融合的目标蛋白的分泌
[0164] 如实施例2所示,HL结构域在目标蛋白的分泌中发挥着重要作用。HL在目标蛋白分泌中的功能可能是由于HL结构域内带电荷的酸性氨基酸,因为蛋白的可溶性与蛋白的净电荷紧密相关。为研究HL结构域作为融合配偶体的功能,我们使用HL结构域用于EXD4的分泌。
[0165] HL结构域融合到目标蛋白的N-末端。用H221(SEQ ID NO:24)/GT50R(SEQ ID NO:14)引物对从YGaT923-EXD4载体中扩增HL-EXD4基因,并用GAL100/LNK-R(SEQ ID NO:25)引物对扩增交配因子α(MFα)的pre-pro前导肽。由于H221和LNK-R引物(SEQ ID NO:25)含有互补的连接序列,这两个片段用GAL100(SEQ ID NO:8)/GT50R(SEQ ID NO:14)引物对通过重叠延伸PCR方法进行融合。通过共转化所述的融合片段和实施例2所述的BamHI/SalI消化的YGaT92载体片段直接构建YGaMKH-EXD4(图26)转化子。YGaMKH-EXD4质粒在MFα的pre-pro前导肽和HL肽之间含有连接肽(AASASAGLALDKR),用于体内被Kex2p加工。用YGaMKH-EXD4转化的重组酵母通过分批补料培养的方式培养于5L的发酵罐,用于测定诱导分泌制备SFP1-92-EXD4融合蛋白的能力。使用种子培养基(6.7%不含氨基酸的酵母氮源、0.5%酪蛋白水解物和2%葡萄糖e)在摇瓶中培养待接种于发酵罐的种子培养物。当使用发酵培养基(4%酵母提取物、1%蛋白胨、2%葡萄糖)作为初始发酵培养物OD600达到约15时,根据细胞生长速率使用不同用量的补料培养基(15%酵母提取物、30%葡萄糖、30%半乳糖)。培养48小时后,培养物OD600达到约150。在指定的时间点收集10μl的培养液并通过SDS-PAGE评价分泌蛋白(图8)。与标准蛋白条带相比,分泌的HL-EXD4经估算约为200mg/L。
[0166] 为测试HL肽的C-末端融合到目标蛋白的效果,构建质粒YGaST6-EXD-HL(图27)。用正向引物H412(SEQ ID NO:26)和反向引物H413(SEQ ID NO:27)从YGaMKH-EXD4中扩增出EXD4基因,并用HL-F(SEQ ID NO:28)和HL-GT50R(SEQ ID NO:29)从YGaMKH-EXD4中扩增出HL肽。由于H413引物(SEQ ID NO:27)含有与HL-F引物互补的序列,因此这两个片段用H412(SEQ ID NO:26)/GT50R引物对通过段重叠延伸PCR的方法进行融合。H412引物(SEQ ID NO:26)含有连接序列,并可以通过GAL100(SEQ ID NO:10)/LNK-R(SEQ ID NO:25)引物对融合到MFα的pre-pro前导肽中。每个扩增的片段以MFα的pre-pro前导序列、EXD4和HL结构域基因的顺序用GAL100/GT50R引物通过重叠延伸PCR进行融合。通过共转化所述的融合片段和实施例2所述的BamHI/SalI消化的YGaT92载体片段直接构建YGaST6-EXD-HL转化子。用YGaST6-EXD4-HL转化的重组酵母株通过分批补料培养的方式培养于5L的发酵罐,用于测定诱导分泌制备EXD4-HL融合蛋白的能力。培养48小时后,培养物OD600达到约160。在指定的时间点收集10μl的培养液并通过SDS-PAGE评价分泌蛋白(图9A和B)。与标准蛋白条带相比,分泌的EXD4-HL估算约为500mg/L。在HL融合到EXD4这种情况下,C-末端融合表现出比N-末端融合更高的EXD4分泌水平。因此,结果表明HL结构域无论是在目标蛋白的N-末端还是C-末端均有助于融合蛋白的分泌。然而,C-末端表现出更高的目标蛋白的分泌。
[0167] 为进一步测试作为融合配偶体的HL结构域,将HL结构域用于表达人表皮生长因子(hEGF)。构建YGaMKH-EGF质粒(图28)。在YGaMKH-EGF中,HL结构域融合到hEGF的N-末端,用GAL100(SEQ ID NO:10)/DDK-R(SEQ ID NO:30)引物对从YGaMKH-EXD4载体中扩增MFα pre-pro肽-HL融合肽基因,并用含有与DDK-R引物互补的序列的正向引物H410(SEQ ID NO:31)和含有与GT50R(SEQ ID NO:14)相同的序列的反向引物H411(SEQ ID NO:32)扩增hEGF基因。每个扩增片段用GAL100/GT50R引物对通过重叠延伸PCR进行融合。用所述的融合片段和实施例2所述的BamHI/SalI消化的YGaT92载体片段共转化YGaMKH-EGF转化子。
[0168] 用YGaMKH-EGF转化的重组酵母株通过分批补料培养的方式培养于5L的发酵罐,用于测定诱导分泌制备HL-EGF融合蛋白的能力。培养48小时后,培养物OD600达到约155。在指定的时间点收集10μl的培养液并通过SDS-PAGE评价分泌蛋白(图10A和B)。与标准蛋白条带相比,分泌的HL-EGF估算约为400mg/L。
[0169] 通过Ni-NTA亲和层析对HL-hEGF融合蛋白直接进行纯化(图11A)。为分离hEGF和HL肽,纯化后的融合蛋白用肠激酶进行消化,产生的片段再次用Ni-NTA亲和层析进行分离。如图11B所示,完整的纯hEGF(6kD)被有效地纯化出来。
[0170] HL结构域还用于分泌制备人甲状旁腺素(hPTH)。通过将HL结构域融合到hPTH的N-末端构建YGaMKH-PTH载体(图29)。用含有与DDK-R引物(SEQ ID NO:30)互补的序列的正向引物H310(SEQ ID NO:33)和含有与GT50R(SEQ ID NO:14)相同的序列的反向引物H311(SEQ ID NO:34)扩增hPTH基因。用GAL100(SEQ ID NO:10)/GT50R(SEQ ID NO:14)引物对通过重叠延伸PCR将这个片段和MFαpre-pro肽-HL融合肽基因进行融合。通过共转化所述的融合片段和实施例2所述的BamHI/SalI消化的YGaT92载体片段直接构建YGaMKH-PTH转化子。用YGaMKH-PTH转化的重组酵母菌株通过分批补料培养的方式培养于5L的发酵罐,用于测定诱导分泌制备HL-PTH融合蛋白的能力。培养48小时后,培养物OD600达到约120。在指定的时间点收集10μl的培养液并通过SDS-PAGE评价分泌蛋白(图12A和B)。与标准蛋白条带相比,分泌的HL-PTH估算约为400mg/L。检测到与HL-PTH相关的两条主要的条带。大部分的hPTH是以60kD的MFαpro-HL-PTH融合形式被检测到,这是由于其在体内被Kex2p不完全裂解。也同样检测到了显示Kex2p裂解的HL-PTH条带。与PTH相关的所有分泌蛋白估计大于500mg/L。发酵液上清液中的His标记蛋白通过Ni-NTA亲和层析直接进行纯化。纯化的蛋白在SDS-PAGE中分离出预期的两种条带(图13,泳道1)。比较大的条带(Pro-HL-PTH)通过体外Kex2p加工后消失了(图13,泳道2)。通过肠激酶的消化,融合蛋白(HL-PTH)被正确分离成HL肽和hPTH肽(泳道3)。
[0171] 实施例1-4表明鉴定和修饰YGR106C基因的最佳区域导致了衍生自SFP1的有效多功能融合配偶体的构建,用于重组蛋白分泌制备和分离。
[0172] 实施例5从酵母分泌蛋白质组中筛选分泌融合配偶体
[0173] 本实施例阐明了用于鉴定作为融合配偶体的大量分泌蛋白的技术。
[0174] 首先,分析正常酵母生长过程中,制备的总酵母分泌蛋白(酵母分泌蛋白质组)。为分离酵母分泌蛋白质组,将酿酒酵母2805菌株培养于基本培养基中(0.67%不含氨基酸的酵母氮源、0.5%酪蛋白水解物、2%葡萄糖和0.002%尿嘧啶)20小时(M1)和40小时(M2)。500mL的培养物上清液通过膜过滤进行浓缩,获得总分泌蛋白。用荧光染料hochest将酵母细胞染色后,用共焦激光扫描显微镜证实酵母细胞的完整性(图14A和B)。
[0175] M2分泌蛋白质组样品通过双向凝胶电泳进行分析(图15)。除了用于去除总蛋白样品中的核糖核酸污染而加入的RNaseA,分泌蛋白质组的大多数蛋白在酸性区进行鉴定。如图15所示,双向凝胶电泳不足以鉴定所有M2样品中存在的分泌蛋白。因此,还使用1-DE/MudPIT(多维蛋白质鉴定技术)方法来更加完整地鉴定酵母的分泌蛋白质组(图16)。结果表明,分别从M1和M2中鉴定出57个和83个蛋白。综合起来,鉴定出98个特异的蛋白。这中间,有42个蛋白是M1和M2样品中普遍检测到的。为证实该蛋白最有可能是分泌蛋白,使用两个程序WoLF PSORT和pTARGET进行蛋白的定位预测和信号预测。在42个蛋白中,预测有35个蛋白(80%)为分泌蛋白(表1)。
[0176] 表1通过酵母分泌蛋白质组分析鉴定出的35个基因以及通过MASS分析确定的其蛋白丰富指数(PAI)。
[0177]  Gi编号   标准命名   系统命名   PAI
  1   6320260   PST1   YDR055W   15.4
  2   6323331   EXG1   YLR300W   9.9
  3   6321718   SCW4   YGR279C   9.1
  4   6324169   YGP1   YNL160W   7.2
  5   6321721   BGL2   YGR282C\   5.8
  6   6324419   ZPS1   YOL154W   5.1
  7   6319552   ECM33   YBR078W   4.2
  8   6323964   SCW10   YMR305C   3.4
  9   6323871   GAS3   YMR215W   3.4
  10   6323967   GAS1   YMR307W   2.8
  11   6322895   UTH1   YKR042W   2.5
  12   6323150   YPS3   YLR121C   2.2
  13   6319638   TOS1   YBR162C   2.2
  14   6321628   CRH1   YGR189C   2.2
  15   6322754   CWP1   YKL096W   1.5
  16   6324002   EGT2   YNL327W   1.5
  17   6324395   DSE4   YNR067C   1.5
  18   6322303   CIS3   YJL158C   1.5
  19   6322068   SIM1   YIL123W   1.2
  20   6324543   GAS5   YOL030W   1.0
  21   6323014   BPT1   YLL015W   1.0
  22   6322864   PRY2   YKR013W   0.7
  23   6319568   PHO3   YBR092C   0.7
  24   6321906   BZZ1   YHR114W   0.7
  25   6323288   HSP60   YLR259C   0.7
  26   6323139   CCW12   YLR110C   0.6
  27   6323423   CCW14   YLR390W-A   0.6
  28   6323009   KNS1   YLL019C   0.6
  29   6321410   SCW11   YGL028C   0.5
[0178]  30   6322290   N/A   YJL171C   0.5
  31   6322287   KRE9   YJL174W   0.3
  32   6322684   PIR1   YKL164C   0.3
  33   6324263   SUN4   YNL066W   0.2
  34   6321496   SPR3   YGR059W   0.2
  35   6322753   CWP2   YKL096W-A   0.2
[0179] 许多分泌蛋白被鉴定为细胞壁蛋白和GPI(糖基化磷脂酰肌醇)锚定蛋白。通过与分泌蛋白的数量成正比的PAI(蛋白丰富指数)确定大量分泌的蛋白(Rappsilber等,Genome Res.12:1231-45(2002))。基于这种分析,筛选出20个大量分泌蛋白。
[0180] 用19条不同的正向引物(SEQ ID NO:35)和反向引物(SEQ ID NO:36)从基因组DNA中扩增19个大量分泌蛋白的基因。扩增的DNA片段的5′和3′端分别含有一段与部分的GAL10启动子和GAL7终止子同源的序列,如上所述,用于和EcoRI-SalI消化的YEGα-HIR525进行体内重组。通过转化线性化载体和PCR片段,经过体内重组易于获得酵母转化子。从19个不同的PCR片段中获得的20个不同的转化子培养于YPDG培养基中(1%酵母提取物、2%蛋白胨、1%葡萄糖和1%半乳糖)。300μL的各个培养物上清液用丙酮浓缩。每个丙酮浓缩的培养物上清液用SDS-PAGE分析,结果如图17A所示。
[0181] 为了将优良的候选SFP与较差的候选区别开来,通过与野生型蛋白分泌水平相比,确定强启动子下的大量分泌蛋白的分泌水平。与图17A中的泳道WT所示的野生型蛋白分泌水平相比,用强启动子表达出的受试蛋白的子集(11个)的条带特别强,表明蛋白过量分泌到培养物上清液中。糖苷酶、Endo-H处理每个样品产生了与从各蛋白的氨基酸序列中预期一致的合适蛋白大小(图17B),表明绝大多数的过量分泌蛋白是糖基化的。将19个选择出的大量分泌蛋白中的11个即BGL2(SEQ ID NO:80)、GAS3(SEQ ID NO:81)、GAS5(SEQ ID NO:82)、PST1(SEQ ID NO:83)、SCW4(SEQ ID NO:84)、SCW10(SEQ ID NO:85)、SIMI(SEQ ID NO:
86)、UTH1(SEQ ID NO:87)、YGP1(SEQ ID NO:88)、YPS1(SEQ ID NO:89)和ZPS1(SEQ ID NO:
90),作为用于异源蛋白分泌的候选SFP进行测试。这11个蛋白由下述的多核苷酸编码:BGL2(SEQ ID NO:62)、GAS3(SEQ ID NO:63)、GAS5(SEQ ID NO:64)、PST1(SEQ ID NO:65)、SCW4(SEQ ID NO:66)、SCW10(SEQ ID NO:67)、SIM1(SEQ ID NO:68)、UTH1(SEQ ID NO:69)、YGP1(SEQ ID NO:70)、YPS1(SEQ ID NO:71)和ZPS1(SEQ ID NO:72)。
[0182] 使用编码各自融合到EXD4的11个过量表达蛋白的多核苷酸的开放阅读框构建融合蛋白的载体。检测11个融合蛋白分泌到培养物上清液中的水平。如图17中从产生各蛋白的各个转化子中获得YGa-ORF载体。为了构建各个融合蛋白的表达载体,用引物GAL100(SEQ ID NO:10)和11条不同的反向引物(SEQ ID NO:37)从11个含有不同ORF的YGa-ORF载体中扩增11个PCR片段。扩增的DNA片段的5′和3′端分别含有一段与GAL10启动子和毒蜥外泌肽(exendin)-4同源的序列。该11个PCR片段和用引物EXD-F(SEQ ID NO:46)和GT50R(SEQ ID NO:14)从YGaT92-EXD4扩增的毒蜥外泌肽-4作为模板进行11个不同的重叠延伸PCR,所用引物分别为GAL100(SEQ ID NO:10)和GT50R(SEQ ID NO:14)。将每个延伸的PCR片段和EcoRI-SalI消化的YEGα-HIR525按如上方式进行转化。每个转化中的两个转化子培养于YPDG培养基(1%酵母提取物、2%蛋白胨、1%葡萄糖和1%半乳糖)中40小时。0.6mL的上清液样品用0.4mL的丙酮浓缩并用SDS-PAGE分析,结果如图18所示。发现6个融合蛋白(GAS3-EXD4、GAS5-EXD4、PST1-EXD4、SCW4-EXD4、YGP1-EXD4和YPS1-EXD4)被有效地分泌到胞外的培养基中。
[0183] 实施例5表明,从酵母分泌蛋白质组中筛选出的大量分泌蛋白可有效作为分泌融合配偶体用于重组蛋白的分泌制备。尽管实施例5使用的是酵母分泌蛋白,但可使用如本申请说明书中所述的任何生物体的分泌多肽。如本实施例所示,本发明的筛选方法是鉴定SFP的有效方法,因为它将可能的候选SFP从35个分泌蛋白缩小到了11个,而其中的6个被证实是有效的SFP。
[0184] 实施例6确定作为融合配偶体的SCW4基因的最佳大小
[0185] 本实施例阐明了作为融合配偶体用于分泌目标蛋白如毒蜥外泌肽-4的SCW4最佳大小的确定。基于Kyte-Doolittle亲水性分析,构建了8个SCW4缺失克隆(图19A)。用GAL100(SEQ ID NO:10)和8个各自含有6个组氨酸序列的不同的反向引物H453-H460(SEQ ID NOs:47-54)扩增8个SCW4片段。分别使用引物GAL100(SEQ ID NO:10)和GT50R(SEQ ID NO:14),通过重叠延伸PCR将扩增片段和用正向引物(SEQ ID NO:55)和GT50R(SEQ ID NO:14)从YGaT92-EXD4扩增出的EXD4基因进行融合。每个延伸的PCR片段和EcoRI-SalI消化的YEGα-HIR525按上述实施例中所述的方法进行转化。8个不同转化子的三个克隆培养于YPDG培养基(1%酵母提取物、2%蛋白胨、1%葡萄糖和1%半乳糖)中。对每个样品的10μL肉汤培养物(不经浓缩)直接用SDS-PAGE分析。结果如图19B所示,含有不同SCW4的C-末端片段的SCW4-
1、SCW4-2、SCW4-3和SCW4-4作为融合配偶体表现出分泌EXD4的强活性。作为融合配偶体用于分泌EXD4的最佳SCW4大小为小于整个SCW4蛋白(380个氨基酸)的169个氨基酸。
[0186] 用YGaSCW4-1-EXD4(图30)和YGaSCW4-3-EXD4(图31)转化的重组酵母株通过分批补料培养的方式培养于5L的发酵罐,用于测定诱导分泌制备融合蛋白的能力。培养48小时后,培养物OD600达到约130。在指定的时间点收集10μl的培养液并通过SDS-PAGE评价分泌蛋白(图20)。与标准蛋白条带相比,分泌的SCW4-1-EXD4(SEQ ID NO:60)和SCW4-3-EXD4(SEQ ID NO:61)估算约为3g/L以上。
[0187] 为测试SCW4蛋白对肠激酶的抗性,发酵液不经纯化用肠激酶37℃消化1小时。融合蛋白被正确分离成SCW4蛋白和毒蜥外泌肽-4肽,结果如图21所示。因此,这些结果表明修饰的SCW4融合配偶体显著地提高了毒蜥外泌肽-4蛋白的产量并简化了纯化方法。
[0188] 测试了SCW4作为一般的融合配偶体用于分泌其它蛋白的有效性。使用SCW4-1、SCW4-2、SCW4-3和SCW4-4来分泌制备人生长激素(hGH)。用正向引物(SEQ ID NO:56)和反向引物(SEQ ID NO:57)扩增hGH基因。该片段侧接于一段6个组氨酸和GAL7终止子序列。分别使用GAL100(SEQ ID NO:10)和GT50R(SEQ ID NO:14)引物通过重叠延伸PCR,将PCR扩增得到的SCW4-1、-2、-3和-4片段和hGH基因进行融合。每个延伸的PCR片段和EcoRI-SalI消化的YEGα-HIR525按上述方法进行转化。4个不同转化子的2个克隆培养于YPDG培养基(1%酵母提取物、2%蛋白胨、1%葡萄糖和1%半乳糖)中。每个样品的10μL肉汤培养物(不经浓缩)直接用SDS-PAGE分析。结果如图22A所示,每个样品检测到不同大小的SCW4-hGH融合蛋白条带。为确认融合蛋白,培养液上清液用肠激酶37℃消化1小时,用于裂解融合蛋白。从SCW4-1-hGH、SCW4-2-hGH和SCW4-4-hGH重新获得了hGH正确的大小(图22B)。因此,SCW4的N-末端片段作为融合配偶体在分泌hGH以及EXD4方面表现出强活性。
[0189] 用YGaSCW4-2-hGH(图32)转化的重组酵母菌株通过分批补料培养的方式培养于5L的发酵罐,用于测定诱导分泌制备融合蛋白的能力。培养48小时后,在指定的时间点收集10μl的培养液并通过SDS-PAGE评价分泌蛋白(图23)。与标准蛋白条带相比,分泌的SCW4-2-hGH(SEQ ID NO:73)估算约为3g/L以上。
[0190] 因此,实施例6的结果表明,SCW4和其片段作为融合配偶体可有效用于目标蛋白的重组表达,并可用于目标蛋白的大量制备。
[0192] 本发明提供使用分泌融合配偶体超量分泌制备和有效纯化各种重组蛋白的方法,所述的分泌融合配偶体可通过分析分泌蛋白质组获得。重组蛋白与分泌融合配偶体以融合蛋白的形式在细胞外制备,并可通过体外的蛋白酶处理分离重组蛋白。本申请所述的SFP极大地提高了目标蛋白和多肽的分泌水平,有助于生物制药和生物产业。本发明的选择/筛选方法使得可对作为SFP的蛋白和该蛋白的片段和衍生物进行选择。通过本发明的选择/筛选方法选择出的SFP提高了用于生物制药和生物产业的蛋白重组制备。本发明还包括已经鉴定出的SFP和其片段和衍生物。
[0193] 虽然已对本发明做出了完整的说明,但本领域技术人员应当理解,在不影响本发明范围或其任何实施方案下,在条件、制备和其它参数的较宽和等同范围内,同样可以实施。本申请中所引用的所有专利、专利申请和出版物均以引文形式全文并入本申请。
QQ群二维码
意见反馈