首页 / 专利库 / 生物学 / 酿酒酵母 / 用于蛋白质生产的酵母菌株

用于蛋白质生产的酵母菌株

阅读:574发布:2023-02-12

专利汇可以提供用于蛋白质生产的酵母菌株专利检索,专利查询,专利分析的服务。并且公开了用于基于 酵母 和 真菌 ,包括巴斯德毕赤酵母的ade1和ade2营养 缺陷 型菌株的表达系统的方法和系统。该表达系统可用于增加转化的细胞系的细胞生产 力 和用于以产业规模生产重组糖蛋白。,下面是用于蛋白质生产的酵母菌株专利的具体信息内容。

1.一种表达系统,其包括:
(a)其中编码营养缺陷可选择标记蛋白的内源基因已从宿主细胞基因组移除的宿主细胞;和
(b)整合载体,其包括:
(1)具有编码与编码所述营养缺陷可选择标记蛋白的内源基因的功能互补的功能且与弱启动子、减弱内源或异源启动子、隐藏的启动子、截短的内源或异源启动子或无启动子可操作连接的开放阅读框(ORF)的核酸;
(2)具有用于插入一个或更多个包括编码感兴趣的肽、蛋白质和/或功能核酸的核酸的表达盒的插入位点的核酸,以及
(3)引导所述整合载体通过同源重组插入所述宿主细胞基因组特定位点的靶向核酸。
2.根据权利要求2所述的表达系统,其中所述营养缺陷可选择标记蛋白由选自ADE,URA,和LYS的基因编码。
3.根据权利要求2所述的表达系统,其中所述营养缺陷可选择标记蛋白由ADE1基因编码。
4.根据权利要求2所述的表达系统,其中所述营养缺陷可选择标记蛋白由ADE2基因编码。
5.根据权利要求2所述的表达系统,其中所述整合载体包括用于插入一个或更多个编码所述一个或更多个异源肽或蛋白质的表达盒的多个插入位点。
6.根据权利要求2所述的表达系统,其中所述整合载体包括多于一个的表达盒。
7.根据权利要求6所述的表达系统,其中所述整合载体在表达盒之间包含很少的或无同源DNA序列。
8.根据权利要求6所述的表达系统,其中所述整合载体包括编码单克隆抗体轻链的第一表达盒以及编码单克隆抗体重链的第二表达盒。
9.根据权利要求2所述的表达系统,其中所述宿主细胞是低等真核生物
10.根据权利要求9所述的表达系统,其中所述宿主细胞来自选自以下的物种:巴斯德毕赤酵母,Pichia finlandica,Pichia trehalophila,Pichia koclamae,膜醭毕赤酵母,Pichiaminuta(Ogataea minuta,Pichialindneri),Pichia opuntiae,Pichia thermotolerans,Pichia salictaria,Pichia guercuum,Pichia pijperi,Pichia stiptis,甲醇毕赤酵母,毕赤酵母属物种,酿酒酵母,酵母属物种,多形汉逊酵母,克鲁维酵母属物种,乳酸克鲁维酵母,白假丝酵母,构巢曲霉,黑曲霉,米曲霉,里氏木霉,Chrysosporium lucknowense,镰孢菌属物种,Fusariumgramineum,Fusarium venenatum,小立碗藓,和粗糙链孢霉.
11.根据权利要求2所述的表达系统,其中所述宿主细胞为巴斯德毕赤酵母。
12.根据权利要求11的表达系统,其中所述巴斯德毕赤酵母细胞经修饰可产生具有杂合型或复合型N-聚糖的糖蛋白。
13.一种用于在宿主细胞中表达感兴趣的重组肽、蛋白质和/或核酸的方法,其包括:
(a)提供其中编码营养缺陷可选择标记蛋白的内源基因已从宿主细胞的基因组移除的宿主细胞;以及
(a)用整合载体转化该宿主细胞,该整合载体包括:
(1)具有编码与编码所述营养缺陷可选择标记蛋白的内源基因的功能互补的功能且与弱启动子、减弱内源或异源启动子、隐藏的启动子、截短的内源或异源启动子或无启动子可操作连接的开放阅读框(ORF)的核酸;
(2)具有一个或更多个包括编码感兴趣的肽、蛋白质和/或功能核酸的核酸的表达盒的核酸,以及
(3)引导所述整合载体通过同源重组插入所述宿主细胞基因组特定位点的靶向核酸,
其中所述转化的宿主细胞产生所述感兴趣的重组肽、蛋白质和/或核酸。
14.根据权利要求14所述的方法,其中所述营养缺陷标记由选自ADE,URA,和LYS的基因编码。
15.根据权利要求14所述的方法,其中所述营养缺陷标记蛋白由ADE1基因编码。
16.根据权利要求14所述的方法,其中所述营养缺陷标记蛋白由ADE2基因编码。
17.根据权利要求13所述的方法,其中所述重组载体包括用于插入一个或更多个编码所述一个或更多个异源肽或蛋白质的表达盒的多个插入位点。
18.根据权利要求13所述的方法,其中所述重组载体包括多于一个的表达盒。
19.根据权利要求18所述的方法,其中所述重组载体在表达盒之间包含很少的或无同源DNA序列。
20.根据权利要求18所述的方法,其中所述重组载体包括编码单克隆抗体轻链的第一表达盒以及编码单克隆抗体重链的第二表达盒。
21.根据权利要求13所述的方法,其中所述宿主细胞为低等真核生物。
22.根据权利要求21所述的方法,其中所述宿主细胞来自选自以下的物种:巴斯德毕赤酵母,Pichia finlandica,Pichia trehalophila,Pichia koclamae,膜醭毕赤酵母,Pichia minuta(Ogataea minuta,Pichialindneri),Pichia opuntiae,Pichia thermotolerans,Pichia salictaria,Pichia guercuum,Pichia pijperi,Pichia stiptis,甲醇毕赤酵母,毕赤酵母属物种,酿酒酵母,酵母属物种,多形汉逊酵母,克鲁维酵母属物种,乳酸克鲁维酵母,白假丝酵母,构巢曲霉,黑曲霉,米曲霉,里氏木霉,Chrysosporium lucknowense,镰孢菌属物种,Fusariumgramineum,Fusarium venenatum,小立碗藓,和粗糙链孢霉。
23.根据权利要求13所述的方法,其中所述宿主细胞为巴斯德毕赤酵母。
24.根据权利要求23的方法,其中所述巴斯德毕赤酵母细胞经修饰可产生具有杂合型或复合型N-聚糖的糖蛋白。
25.一种分离核酸,其包括巴斯德毕赤酵母的ADE2基因。
26.根据权利要求25所述的核酸,其中所述核酸包括编码Ade2p蛋白的开放阅读框。
27.根据权利要求26所述的核酸,其中所述核酸具有与SEQ IDNO:60从核苷酸127至核苷酸1815所示的核酸序列具有95%同一性的核苷酸序列。
28.一种载体,其包括权利要求27的核酸。
29.一种巴斯德毕赤酵母细胞,其包括内源ADE2基因的缺失或破坏,或任何其他修饰,使得ADE2基因或Ade2p无功能。
30.根据权利要求29的巴斯德毕赤酵母,其中包括ADE2开放阅读框的载体被整合入巴斯德毕赤酵母基因组的除了内源ADE2基因所位于的位点之外的位点。
31.一种分离的多肽,其包括与SEQ ID NO:61所示基酸序列具有95%同一性的氨基酸序列。
32.一种表达系统,其包括:
(a)其中编码Ade2p的内源ADE2基因已从宿主细胞的基因组移除的巴斯德毕赤酵母宿主细胞;以及
(b)整合载体,其包括:
(1)编码Ade2p的核酸;
(2)具有用于插入一个或更多个包括编码一个或更多个感兴趣的异源肽、蛋白质和/或功能核酸的核酸的表达盒的插入位点的核酸,以及
(3)引导所述整合载体通过同源重组插入所述宿主细胞基因组特定位点的靶向核酸。
33.用于产生表达感兴趣的异源肽、蛋白质和/或核酸的重组巴斯德毕赤酵母宿主细胞的方法,其包括:
(a)提供其中编码Ade2p的内源ADE2基因已从宿主细胞的基因组移除的宿主细胞;以及
(a)用整合载体转化该宿主细胞,该整合载体包括:
(1)编码Ade2p的核酸;
(2)具有一个或更多个包括编码一个或更多个感兴趣的异源肽、蛋白质和/或功能核酸的核酸的表达盒的核酸,以及
(3)引导所述整合载体通过同源重组插入所述宿主细胞基因组特定位点的靶向核酸,
其中所述转化的宿主细胞产生所述感兴趣的重组肽、蛋白质和/或核酸。

说明书全文

(1)发明领域

本发明涉及分子生物学领域,特别是,本发明涉及用于提高从已转化表达系统的蛋白质生产的新颖选择基因。

(2)背景技术

近年来,芽殖酵母巴斯德毕赤酵母已成为用于学术和商业目的异源蛋白质表达的普遍使用的生物体(Cereghino et al.,Curr.Opin.Biotechnol.4:329-332(2002);Cereghino and Cregg,FEMS Microbiol.Rev.24:45-66(2000))。近期显示可基因修饰巴斯德毕赤酵母的糖基化机制并表达被复合型人类聚糖修饰的异源糖蛋白(Choi et al.,Proc.Natl.Acad.Sci.100:5022-5027(2003);Hamilton et al.,Science 301:1244-1246(2003);Bobrowicz et al.,Glycobiology 14:757-766(2004);Hamilton,Science,313:1441-1443(2006))。然而,仍然需要在已转化细胞系例如已转化的巴斯德酵母细胞系中达到更高的细胞生产的方法和材料。

多年来,已研发了许多营养缺陷和显性可选择标记(Higgins et al.,Methods Mol.Biol.103:41-53(1998);Lin Cereghino et al.,Gene 263:159-169(2001);Nett and Gerngross,Yeast 20:1279-1290(2003);Nett etal.,Yeast 22:295-304(2005)并用于构建用于各种应用的蛋白质表达载体。通常用在标记基因,在该质粒上的另一同源区或在AOX1启动子片段中被线性化的质粒将感兴趣的基因整合入巴斯德毕赤酵母基因组中并转化至合适的营养缺陷型突变体中。游离DNA末端的同源重组接着得到整合入这些基因座的单交换整合。绝大多数的巴斯德毕赤酵母转化子将包含单拷贝的表达载体,但是对于获得表达高平感兴趣的蛋白质的转化子通常需要筛选多拷贝整合子。使用包含药物抗性基因如例如KanR或ZeoR的选择标记,可通过增加用于筛选的药物水平增加包含多拷贝表达载体的转化子的数量。单交换型整合的一个显著缺陷在于多个整合的拷贝可通过同源重组瓦解回单个拷贝。在发酵中表达反应的放大中这可能尤其成问题如果感兴趣的蛋白质对细胞具有毒性或表达质粒若干拷贝的逐出(eviction)对细胞具有其他生长益处。

美国专利第5,584,039号涉及分离自甲醇毕赤酵母的可选择标记基因ADE2。Piontek等,Appl Microbiol.Biotechnol.50:331-338(1998)涉及Schwanniomyces occidentalis和Pichia stipitis中的新颖基因表达系统,该系统利用包含ADE2标记的载体和推定的复制序列。然而,之前并未从巴斯德酵母中分离出对应的基因,且之前并未鉴定用ADE2在巴斯德酵母中的转化效果。

因此,存在用巴斯德毕赤酵母作为宿主表达系统改进异源基因的转化、筛选和表达的方法的需要。

发明概述

本发明提供将低级真核细胞例如酵母和丝状真菌作为表达重组蛋白的表达系统的方法和材料。

在一个方面,本发明基于构建低级真核生物细胞较缓慢生长的ade2营养缺陷性菌株并使用可整合入该ade2营养缺陷性菌株的基因组并包含编码与启动子可操作连接的ADE2标记基因或开放阅读框(ORF)和重组蛋白的核酸的整合载体,其中整合载体整合入ade2营养缺陷性菌株的基因组,ADE2使得该营养缺陷性菌株为腺嘌呤原养型,且表达该重组蛋白。

因此,本发明提供一种表达系统,其包括(a)巴斯德毕赤酵母宿主细胞,其中编码Ade2p的内源ADE2基因已从宿主细胞的基因组中移除;和(b)整合载体,其包括(1)编码Ade2p的核酸;(2)具有用于插入一个或更多个表达盒的插入位点的核酸,该表达盒包括编码一个或更多个感兴趣的异源肽、蛋白质和/或功能核酸的核酸,以及(3)引导所述整合载体通过同源重组插入所述宿主细胞特定位点的靶向核酸。

而且,本发明提供用于产生表达异源蛋白或肽的重组巴斯德毕赤酵母宿主细胞的方法,其包括(a)提供宿主细胞,其中编码Ade2p的内源ADE2基因已从宿主细胞的基因组中移除;和(a)用整合载体转化该宿主细胞,所述整合载体包括(1)编码Ade2p的核酸;(2)具有一个或更多个表达盒的核酸,所述表达盒包含编码一个或更多个感兴趣的异源肽、蛋白质和/或功能核酸的核酸,以及(3)引导所述整合载体通过同源重组插入所述宿主细胞基因组特定位点的靶向核酸,其中该转化的宿主细胞产生该重组蛋白。

本发明进一步提供包含巴斯德毕赤酵母的ADE2基因的分离核酸。在具体方面,核酸包含编码Ade2p蛋白的开放阅读框或核酸具有与SEQ ID NO:60中从核苷酸127至核苷酸1815显示的核酸序列具有95%的同一性的核苷酸序列。本发明进一步提供包含与SEQ ID NO:61所示基酸序列具有95%同一性的氨基酸序列的分离多肽。

申请人进一步发现将营养缺陷标记基因或ORF与整合载体中的最小启动子(即具有低转录活性的启动子)可操作地连接使得可产生包含足够数量拷贝的整合入营养缺陷型宿主细胞基因组中的整合载体的重组宿主细胞,使得该细胞为原养型并使得该细胞可产生大于仅包含单个拷贝的整合入基因组的整合载体的细胞所产生的量的感兴趣的重组蛋白或功能核酸。

因此,本发明提供一种方法,其中获得或构建低级真核生物细胞的营养缺陷型菌株并提供可整合入营养缺陷性菌株的基因组的整合载体,且其包含编码补充营养缺陷并与弱启动子、减弱的内源或异源启动子、隐藏的启动子或截短的内源或异源启动子可操作地连接的标记基因或ORF和重组蛋白的核酸。其中许多整合载体被整合入基因组以补充宿主细胞的营养缺陷的宿主细胞筛选自缺乏补充营养缺陷的代谢物的培养基并通过在缺乏补充营养缺陷的代谢物的培养基中或在包含该代谢物的培养基中(因为在该情况下,逐出了含标记质粒的细胞生长得更慢)增殖该宿主细胞以保存。

在进一步的实施方案中,本发明提供一种表达系统,其包括(a)宿主细胞,其中编码营养缺陷型可选择标记蛋白的内源基因从宿主细胞的基因组中移除;和(b)整合载体,其包括(1)包括编码与编码所述营养缺陷可选择标记蛋白的内源基因的功能互补的功能,并与弱启动子、减弱的内源或异源启动子、隐藏的启动子、截短的内源或异源启动子或无启动子可操作地连接的开放阅读框(ORF)的核酸;(2)具有用于插入一个或更多个表达盒的插入位点的核酸,所述表达盒包含编码一个或更多个感兴趣的异源肽、蛋白和/或功能核酸的核酸,以及(3)引导所述整合载体通过同源重组插入所述宿主细胞基因组的特定位点的靶向核酸。

在又进一步的实施方案中,提供了在宿主细胞中表达重组蛋白的方法,其包括(a)提供宿主细胞,其中从宿主细胞的基因组中移除编码营养缺陷可选择标记蛋白的内源基因;和(a)用整合载体转化宿主细胞,该整合载体包括(1)包括编码与编码所述营养缺陷可选择标记蛋白的内源基因的功能互补的功能,并与弱启动子、减弱的内源或异源启动子、隐藏的启动子、截短的内源或异源启动子或无启动子可操作地连接的开放阅读框(ORF)的核酸;(2)具有一个或更多个表达盒的核酸,所述表达盒包含编码一个或更多个感兴趣的异源肽、蛋白和/或功能核酸的核酸,以及(3)引导所述整合载体通过同源重组插入所述宿主细胞基因组的特定位点的靶向核酸,其中该转化的宿主细胞产生该重组蛋白。

在上述实施方案的进一步方面,所述营养缺陷可选择标记蛋白由选自ADE,URA和LYS的基因编码。在又进一步方面,所述营养缺陷可选择标记蛋白由ADE1基因或ADE2基因编码。

在又进一步方面,所述整合载体包括用于插入一个或更多个编码一个或更多个感兴趣的异源肽、蛋白质和/或功能核酸的多个插入位点。在又进一步方面,所述整合载体包括多于一个的表达盒。在又进一步方面,所述整合载体在表达盒之间包括很少或无同源DNA序列。在又进一步方面,所述整合载体包括编码单克隆抗体轻链的第一表达盒和编码单克隆抗体重链的第二表达盒。

在又进一步方面,所述宿主细胞为低级真核生物。在又进一步方面,所述宿主细胞来自选自以下的物种:巴斯德毕赤酵母(Pichiapastoris),Pichia finlandica,Pichia trehalophila,Pichia koclamae,膜醭毕赤酵母(Pichia membranaefaciens),Pichia minuta (Ogataea minuta,Pichialindneri),Pichiaopuntiae,Pichia thermotolerans,Pichiasalictaria,Pichia guercuum,Pichia pijperi,Pichia stiptis,甲醇毕赤酵母(Pichia methanolica),毕赤酵母属物种(Pichiasp.),酿酒酵母(Saccharomyces cerevisiae),酵母属物种(Saccharomyces sp.),多形汉逊酵母(Hansenula polymorpha),克鲁维酵母属物种(Kluyveromyces sp.),乳酸克鲁维酵母(Kluyveromyces lactis),白假丝酵母(Candida albicans),构巢曲霉(Aspergillus nidulans),黑曲霉(Aspergillus niger),米曲霉(Aspergillus oryzae),里氏木霉(Trichoderma reesei),Chrysosporium lucknowense,镰孢菌属物种(Fusarium sp.),Fusarium gramineum,Fusarium venenatum,小立碗藓(Physcomitrella patens),和粗糙链孢霉(Neurospora crassa)。在又进一步方面,权利要求1的表达系统,其中所述宿主细胞为经修饰可产生具有杂合型或复合型N-聚糖的糖蛋白的巴斯德毕赤酵母或巴斯德毕赤酵母细胞。

定义

除非另外指明,与本发明相关使用的科学和技术术语及短语应具有本领域技术人员通常理解的含义。另外,除非上下文所需,单数术语应包括复数且复数术语应包括单数。一般地,与本文所述生物化学、酶学、分子和细胞生物学、微生物学、遗传学和以及蛋白质和核酸化学和杂交相关使用的命名和技术为本领域熟知和常用的那些。除非另外指明,本发明方法和技术通常根据本领域已知的常规方法和如本说明书中通篇引用和讨论的各种一般和更具体的参考文献所述实施。参见,例如,Sambrook et al.Molecular Cloning:A Laboratory Manual,2ded.,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(1989);Ausubel et al.,Current Protocols in Molecular Biology,GreenePublishing Associates(1992,and Supplements to 2002);Harlow andLane,Antibodies:A Laboratory Manual,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,N.Y.(1990);Taylor and Drickamer,Introduction to Glycobiology,Oxford Univ.Press(2003);WorthingtonEnzyme Manual,Worthington Biochemical Corp.,Freehold,NJ;Handbook of Biochemistry:Section A Proteins,VoI I,CRC Press(1976);Handbook of Biochemistry:Section A Proteins,VoI II,CRC Press(1976);Essentials of Glycobiology,Cold Spring Harbor Laboratory Press(1999)。本文提及的所有的出版物、专利和其他参考文献以其完整内容通过引用并于本文。

本文中使用命名酵母染色体基因的遗传命名法。各基因、等位基因或基因座由三个斜体字母表示。显性等位基因通过用基因标志的所有字母的大写字母表示,例如ADE2用于表示腺嘌呤2基因,而小写字母表示隐性等位基因,例如,腺嘌呤2的营养缺陷标记,ade2。野生型基因用上标″+″表示而突变体用″-″上标表示。标志Δ可表示部分或完全缺失。基因的插入遵循细菌命名法,使用标志″∷″,例如,trp2∷ARG2表示在TRP2基因座插入ARG2基因,其中ARG2为显性(且有功能的)且trp2为隐性(和缺陷的)。由基因编码的蛋白质由相关的基因标志(非斜体的)提及,该标志具有起始的大写字母且通常具有后缀″p″,例如由ADE2编码的腺嘌呤2蛋白为Ade2p。表型由对应于基因标志的非斜体三字母缩写表示,起始字母为大写。野生型菌株由″+″上标表示而突变体由″-″上标表示。例如,Ade2+为野生型表型而Ade2-为营养缺陷型表型(需要腺嘌呤)。

本文所用术语“载体”意指可转运与其连接的另一核酸的核酸分子。一种载体类型为“质粒”,其指可向其中连接另外的DNA区段的环状双链DNA环。其他载体包括粘粒、细菌人工染色体(BAC)和酵母人工染色体(YAC)。另一载体类型病毒载体,其中另外的DNA区段可连接入病毒基因组中(下文中详细讨论)。某些载体可在它们被引入的宿主细胞中自主复制(例如,具有在宿主细胞中发挥功能的复制起点的载体)。其他载体可在引入宿主细胞后整合入宿主细胞的基因组中并藉此随着宿主基因组复制。而且,某些优选的载体可引导它们可操作连接的基因的表达。该类载体在本文中称作“重组表达载体”(或简单称作“表达载体”)。

术语“整合载体”指可整合入宿主细胞并携带选择标记基因或开放阅读框(ORF)、靶向核酸、一种或更多种感兴趣的基因或核酸以及功能为微生物自主DNA复制起始位点(下文中称作DNA复制起点,例如细菌的ORI)的核酸序列的载体。整合载体仅可在宿主细胞中复制,如果其通过DNA重组方法例如将线性DNA片段整合入宿主细胞基因组特定基因座的同源重组整合入宿主细胞基因组。举例而言,靶向核酸将整合载体靶向基因组中的对应区域,在那里其可接着通过同源重组整合入基因组。

术语“可选择标记基因”、“选择标记基因”、“可选择标记序列”等指携带于载体上并就不含标记基因的宿主而言赋予已转化宿主遗传优势的基因或核酸序列。举例而言,巴斯德毕赤酵母URA5基因为可选择标记基因因为它的存在可通过包含该基因的细胞在没有尿嘧啶下生长的能力而被选择。它的存在也可通过包含该基因的细胞不能在5-FOA存在下生长被选择。可选择标记基因或序列不一定需要显示阳性和阴性可选择性二者。来自巴斯德毕赤酵母的标记序列或基因的非限制性实例包括ADE1,ADE2ARG4,HIS4,LYS2,URA 5和URA3。一般而言,如如本文公开的表达系统使用的可选择标记基因编码补充宿主营养缺陷突变的基因产物。营养缺陷突变或营养缺陷型为生物体不能合成特定的其生长需要的有机化合物或代谢物(如IUPAC定义)。营养缺陷体为显示这一特性的生物体;营养缺陷的是对应的形容词。营养缺陷型与原养型相对。

术语“靶向核酸”指携带于载体质粒上引导载体整合质粒通过同源重组插入宿主中被称作“靶基因座”的特定同源基因座的核酸。

术语“感兴趣的序列”或“感兴趣的基因”或“感兴趣的核酸”指通常编码蛋白质或功能RNA的核酸序列,其通常不产生于宿主细胞中。本文公开的方法使得可有效表达稳定整合入宿主细胞基因组的一个或更多个感兴趣的序列或感兴趣的基因。感兴趣的序列的非限制性实例包括编码一个或更多个具有酶活性的多肽,例如影响宿主中N-聚糖合成的酶,例如甘露糖转移酶、N-乙酰氨基葡萄糖转移酶、UDP-N-乙酰葡萄糖胺转运蛋白、半乳糖转移酶、UDP-N-乙酰基半乳糖转移酶、唾液酸转移酶、岩藻糖转移酶、促红细胞生成素、细胞因子例如干扰素-α、干扰素-β、干扰素-γ、干扰素-ω以及粒细胞-CSF、凝血因子例如因子VIII、因子IX以及人蛋白质C、可溶性IgE受体α-链、IgG、IgM、尿激酶、糜蛋白酶、尿胰蛋白酶抑制剂、IGF-结合蛋白、表皮生长因子、生长激素释放因子、膜联蛋白V融合蛋白、制管张素、血管内皮生长因子-2、骨髓祖细胞抑制因子-1以及骨保护素。

术语“可操作地连接”指一种连接,其中表达控制序列邻接感兴趣的基因或序列或可选择标记基因或序列以控制该基因或序列表达的基因,以及反向或远距离作用以控制感兴趣基因的表达控制序列。

本文所用术语“表达控制序列”指影响与它们可操作地连接的编码序列表达必需的多聚核苷酸序列。表达控制序列为控制转录、转录后事件以及核酸序列翻译的序列。表达控制序列包括合适的转录起始、终止、启动子和增强子序列;有效的RNA处理信号例如剪接和多腺苷酸化信号;稳定化胞质mRNA的序列;增强翻译效率的序列(例如核糖体结合位点);增强蛋白质稳定性的序列;以及需要时增强蛋白质分泌的序列。该类控制序列的性质随宿主生物体而不同;在原核生物中,该类控制序列一般包括启动子、核糖体结合位点和转录终止序列。术语“控制序列”预期最少包括其存在对于表达是必需的所有组分,且也可包括其存在是有利的另外的组分,例如引导序列和融合伴侣序列。

本文所用术语“重组宿主细胞”(“表达宿主细胞”、“表达宿主系统”、“表达系统”或简单的“宿主细胞”)意指其中引入了重组载体的细胞。应理解的是该类术语预期不仅指具体的受试者细胞还指该细胞的子代。因为由于突变或环境影响在后续世代中可能发生某些修饰,所以该子代事实上可能与母细胞不同,但是仍然包含于本文所用术语“宿主细胞”的范围内。重组宿主细胞可为分离的细胞或生长于培养物中的细胞系或可为位于活组织或生物体的细胞。

术语“真核的”指有核的细胞或生物体,且包括昆虫细胞、植物细胞、哺乳动物细胞、动物细胞以及低级真核细胞。

术语“低级真核细胞”包括酵母、单细胞和多细胞或丝状真菌、酵母和真菌包括但不限于巴斯德毕赤酵母,Pichia fmlandica,Pichiatrehalophila,Pichia koclamae,膜醭毕赤酵母,Pichia minuta(Ogataeaminuta,Pichialindneri),Pichiaopuntiae,Pichia thermotolerans,Pichiasalictaria,Pichiaguercuum,Pichia pijperi,Pichia stiptis,甲醇毕赤酵母,毕赤酵母属物种,酿酒酵母,酵母属物种,多形汉逊酵母,克鲁维酵母属物种,乳酸克鲁维酵母,白假丝酵母,构巢曲霉,黑曲霉,米曲霉,里氏木霉,Chrysosporium lucknowense,镰孢菌属物种,Fusariumgramineum,Fusarium venenatum,小立碗藓,和粗糙链孢霉.

本文所用术语“肽”指短的多肽,例如通常小于50个氨基酸长度且更通常小于30个氨基酸长度的短多肽。本文所用该术语涵盖类似物、衍生物以及模拟结构并因此模拟多肽和蛋白质生物功能的模拟物。

术语“多肽”涵盖天然存在和非天然存在蛋白质二者,及其片段、突变体、衍生物和类似物。多肽可为单体的或多聚体的。而且,多肽可包括许多不同的结构域,其各具有一种或更多种不同的活性。

术语“融合蛋白”指包括与异源氨基酸序列偶联的多肽或片段的多肽。融合蛋白是可用的因为它们可经构建包含两种或更多种来自两种或更多种不同蛋白的所需功能元件。融合蛋白包含来自感兴趣的多肽的至少10个连续的氨基酸,更优选至少20或30个氨基酸,甚至更优选至少40、50或60个氨基酸,又更优选至少75、100或125个氨基酸。包括本发明蛋白质全部的融合物具有特定的应用。包括于本发明融合蛋白的异源多肽为至少6个氨基酸长度,通常至少8个氨基酸长度,且经常至少15、20和25个氨基酸长度。融合物也包括较大的多肽或甚至完整的蛋白,例如含绿色荧光蛋白(GFP)发色团蛋白具有特别的应用。融合蛋白可通过构建与编码不同蛋白或肽的核酸序列在框内的编码多肽或其片段的核酸序列,并接着表达融合蛋白来重组地产生。或者,融合蛋白可通过交联多肽或其片段与另一蛋白经化学方法产生。

术语“功能核酸”指在引入宿主细胞或表达于宿主细胞后特异干扰蛋白质表达的核酸分子。一般而言,功能核酸分子具有通过直接与编码该蛋白的转录物相互作用减少蛋白质表达的能力。核酶、反义核酸和包括shRNA分子、短RNAs(长度通常小于400个基),和micro-RNAs(miRNAs)在内的siRNA分子组成了示例性功能核酸。

除非另外指明,本文使用的所有技术和科学术语具有与本发明所属领域普通技术人员所理解相同的含义。示例性方法和材料描述于下文,尽管与本文描述的那些相似或等同的方法和材料也可用于实施本发明并对本领域技术人员而言是显而易见的。本文提及的所有出版物和其他参考文献以他们的完整内容通过引用并于本文。在有矛盾之处,以包括定义在内的本说明书为准。材料、方法和实施例仅为说明性且不具有限制性。

附图简述

图1显示了巴斯德毕赤酵母Ade2p氨基酸序列(SEQ ID NO:61)与酿酒酵母Ade2p氨基酸序列(SEQ ID NO:62)的比对。

图2A显示了质粒pGLY1065的图。

图2B显示了质粒pGLY2057的图。

图2C显示了质粒pGLY225的图。

图2D显示了质粒pGLY1083的图。

图2E显示了质粒pGLY2092的图。

图2F显示了质粒pGLY2094的图。

图3显示了用表达葡糖脑苷脂酶、单链抗-HER2抗体或人CD40胞外结构域的整合载体转化的ade1营养缺陷型酵母菌株产生的蛋白质的蛋白质印迹和考斯凝胶。A栏显示了用编码与GAPDH启动子可操作的连接的单链抗-HER2抗体和与其天然启动子可操作连接的ADE1 ORF的pJ903转化的YGLY563 ade1-细胞的七个克隆产生的单链抗-HER2抗体,以及用编码与GAPDH启动子可操作的连接的单链抗-HER2抗体和未与启动子可操作连接的ADE1ORF的pJ904转化的YGLY563 ade1-细胞的七个克隆产生的单链抗-HER2抗体。B栏显示了用编码与GAPDH启动子可操作连接的GBA和与其天然启动子可操作连接的ADE1ORF的pGly1084转化的YGLY564 ade1-细胞的七个克隆产生的葡糖脑苷脂酶(GBA),以及用编码与GAPDH启动子可操作连接的GBA和未与启动子可操作连接的ADE1 ORF的pGLY1085转化的YGLY564ade1-细胞的七个克隆产生的GBA。C栏显示了用编码与AOX1启动子可操作连接的人CD40胞外结构域和与其天然启动子可操作连接的ADE1ORF的pGLY1073转化的YGLY563 ade1-细胞的六个克隆产生的人CD40胞外结构域,以及用编码与GAPDH启动子可操作连接的人CD40胞外结构域和未与启动子可操作连接的ADE1 ORF的pGLY1074转化的YGLY563 ade1-细胞的六个克隆产生的人CD40胞外结构域的考马斯凝胶。D栏显示了用编码与AOX1启动子可操作连接的人CD40胞外结构域和与其天然启动子可操作连接的ADE1 ORF的pGLY1073转化的YGLY564 ade-1细胞的六个克隆产生的人CD40胞外结构域,以及用编码与AOX1启动子可操作连接的人CD40胞外结构域和未与启动子可操作连接的ADE1 ORF的pGLY1074转化的YGLY564 ade-细胞的六个克隆产生的人CD40胞外结构域。

图4显示了用编码促红细胞生成素(EPO)的整合载体转化的ade2营养缺陷型酵母菌株产生的蛋白质的蛋白质印迹。A栏显示了用编码与AOX1启动子可操作连接的EPO和与其天然启动子可操作连接的ADE1 ORF的pGly2663转化的YGLY1215 ade2-细胞的六个克隆产生的EPO,以及用编码与AOX1启动子可操作连接的EPO和未与启动子可操作连接的ADE2 ORF的pGly2664转化的YGLY1215 ade2-细胞的六个克隆产生的EPO。B栏显示了用编码与AOX1启动子可操作连接的EPO和与其天然启动子可操作连接的ADE1 ORF的pGly2663转化的YGLY1216 ade2-细胞的六个克隆产生的EPO,以及用编码与AOX1启动子可操作连接的EPO和未与启动子可操作连接的ADE2ORF的pGly2664转化的YGLY1216 ade2-细胞的六个克隆产生的EPO。

发明详述

本发明提供利用低等真核细胞例如酵母或丝状真菌作为表达系统用于表达重组肽、蛋白质或功能核酸的方法和材料。一方面,该方法提供用于表达重组蛋白质的方法,其包括获得或构建低等真核细胞的较缓慢生长的ade2营养缺陷型菌株并向该细胞中引入可整合入ade2营养缺陷型菌株基因组中且包括编码与启动子可操作连接的ADE2标记基因或开放阅读框(ORF)的核酸以及表达感兴趣的重组蛋白或功能核酸的核酸的整合载体,其中所述整合载体整合入ade2营养缺陷型菌株的基因组中,ADE2使得该营养缺陷菌株对于腺嘌呤是原养型的且使得重组肽、蛋白质或功能核酸被表达。重组宿主细胞在缺乏代谢物腺嘌呤的培养基中筛选但是可在缺乏代谢物腺嘌呤的培养基中或在包括代谢物腺嘌呤的培养基中维持。一般而言,这些可能丢失了ADE2标记的重组宿主细胞(回复体)将生长更加缓慢并随着重组细胞的生长而丢失。回复体随时间的丢失将发生无论重组宿主细胞生长在包括代谢物腺嘌呤的培养基中或在缺乏代谢物腺嘌呤的培养基中。

在研究上述发明时,申请人发现当用于向对于特定标记基因营养缺陷的低等真核宿主细胞引入重组蛋白的整合载体在该整合载体中包括编码补充的标记基因或ORF的核酸但是其中该标记基因或ORF与降低启动子的天然活性至低于天然启动子的水平的弱的、减弱的、隐藏的、截短的启动子或无启动子可操作连接时,宿主细胞的营养缺陷可被补充,只要多于一个拷贝的整合载体整合入宿主细胞的基因组。因为重组宿主细胞包含多于一个拷贝的整合载体且各拷贝的整合载体具有转录活性,所以该重组宿主细胞可产生足够量的标记基因或ORF使得宿主细胞对于营养缺陷标记为原养型并因此可在缺乏补充营养缺陷的代谢物的培养基中生长。与补充的标记基因或ORF连接的启动子越弱,需要越多拷贝的整合入宿主细胞基因组的整合载体以使得宿主细胞对于该营养缺陷标记为原养型。在缺乏可补充营养缺陷的代谢物的培养基中的细胞生长或传代过程中丢失整合入宿主基因组的整合载体拷贝的宿主细胞重新变得对该标记基因营养缺陷。这些新营养缺陷宿主细胞为培养基中处于选择不利且一般而言会随着剩余原养型宿主细胞继续生长和复制而被丢失。重要的是,因为整合载体包含表达一个或更多个感兴趣的重组蛋白或功能核酸的表达盒,包含一个或更多个拷贝整合载体的宿主细胞将比仅包含单一拷贝整合载体的宿主细胞产生更多的重组蛋白。

因此,本发明提供了尤其可用于产生可产生大量重组蛋白(包括肽)或功能核酸的重组宿主细胞的方法、材料和系统。因此,本发明提供一种方法,其中获得或构建低等真核生物细胞的营养缺陷型菌株且提供可整合入营养缺陷型菌株基因组并包括编码补充营养缺陷的标记基因或ORF(与弱的、隐藏的、减弱的或截短的启动子或无启动子可操作连接)和重组蛋白的核酸的整合载体。其中许多整合载体整合入基因组以补充宿主细胞营养缺陷的宿主细胞在缺乏补充营养缺陷的代谢物的培养基中筛选并通过在缺乏补充营养缺陷的代谢物或包括补充营养缺陷的代谢物的培养基中增殖宿主细胞而维持。一般而言,那些可能丢失营养缺陷型标记的重组宿主细胞(回复体)将生长更缓慢且将随着重组细胞的生长而被丢失。回复体随时间的丢失将发生,无论重组宿主细胞生长在包括代谢物的培养基中或在缺乏该代谢物的培养基中。这一现象至少在营养缺陷型标记ADE,URA,或LYS中观察到且目前认为至少部分归因于该代谢物从培养基至重组宿主细胞内的运输差。

在一般性方面,通过移除或缺失编码对于产生该有机化合物或产生该有机化合物或代谢物的中间体必需的基因产物的基因或基因座使得重组宿主细胞变得对特定有机化合物营养缺陷。接着用整合载体转化该营养缺陷宿主细胞,所述载体包括(1)包括编码可选择标记基因或补充营养缺陷的其他核酸的开放阅读框(ORF)的核酸;(2)编码一个或更多个ORFs的核酸,所述ORFs编码异源的或重组的蛋白质或肽或表达感兴趣的功能核酸;以及(3)包括引导整合载体通过同源重组插入宿主细胞基因组特定靶位点或基因座的靶向序列的核酸。

质粒中的靶向序列可包括宿主细胞基因组中的任何序列,例如宿主细胞基因、宿主细胞启动子或终止子序列,或已知功能序列。对于整合入宿主细胞启动子或终止序列,表达盒中用于调控一个或更多个编码异源或重组蛋白或肽或表达感兴趣的功能核酸的ORFs的表达的启动子和/或终止子序列也可用作将整合载体靶向靶位点的靶向序列。举例而言,上文中的(1)或(2)的核酸可与用于与整合载体靶向的启动子相邻的宿主细胞基因的宿主细胞启动子可操作地连接。载体通过卷入单交换同源重组整合入启动子引起启动子序列的复制。因此,整合后,表达盒仍然与包括靶向序列的启动子可操作地连接且与该启动子(其为靶向序列)相邻的宿主细胞基因仍然是可操作的。因此,在重组宿主细胞中,可实现异源蛋白、肽或功能核酸的表达而不破坏与靶位点相邻的宿主细胞基因的表达。

为了通过卷入单交换同源重组将整合载体整合入宿主细胞的基因组中,通过在靶向序列中的位点裂解整合载体使载体线性化从而产生线性核酸分子,其中靶向序列位于分子的末端。单交换事件导致基因组基因座的复制并产生直接的重复。尽管这些直接重复显示高重组率并可在重组宿主细胞增殖的过程中引起标记和表达盒的丢失,但是该标记与弱的、隐藏的、减弱的或截短的启动子或无启动子可操作连接的本文公开的方法确保了只有在增殖过程中维持足以使宿主细胞对该标记为原养型的拷贝数的整合载体的宿主细胞。在优选的方面,该整合载体在在靶向序列中仅出现一次的限制性酶切位点被线性化。接着该载体通过卷入单交换同源重组整合入靶位点。卷入单交换同源重组使得整合载体整合入基因组而不破坏靶位点处基因的表达。卷入单交换同源重组已描述于Nett等,Yeast 22:295-304(2005)。

整合载体的一个重要特征为编码可选择标记基因或其他核酸的ORF未与其内源全长启动子或异源全长启动子可操作连接,而与弱启动子、减弱的内源或异源启动子、隐藏的启动子或截短的内源或异源启动子(其中该截短使得启动子的转录活性低于原始启动子)连接。在具体的实施方案中,减弱的或截短的启动子具有不多于50%全长启动子活性的转录活性。在进一步的实施方案中,该减弱的或截短的启动子具有不多于10%全长启动子活性的转录活性。在进一步的实施方案中,该减弱的或截短的启动子具有不多于1%全长启动子活性的转录活性。尽管不愿受到任何理论的束缚,我们认为一般而言,与编码可选择标记基因的ORF相邻的核酸序列将包含所谓的隐藏的启动子,其使得可选择标记基因能够低水平表达。隐藏的启动子使得有足够量的与ORF相邻的假转录起始足以产生少量的可选择标记。由于可选择标记基因的表达低于完全补充营养缺陷所需要的水平,整合载体多次整合入宿主细胞内的靶序列对于完全补充营养缺陷是必需的。因为多拷贝的整合载体必需整合入宿主细胞的基因组中以补充营养缺陷,所以存在编码感兴趣的蛋白或肽或功能核酸的多个拷贝的ORF,其全部表达。因此,该宿主细胞可比只包括单一拷贝的整合入其基因组中的整合载体的宿主细胞编码更多的感兴趣的蛋白质或肽或功能核酸。

在实施该方法中,优选在营养缺陷的宿主细胞中没有任何可与用于整合的靶向序列竞争的可选择标记基因序列。因此,在进一步的实施方案中,或者编码标记的完整基因(包括上游和下游区域)缺失或从基因组中移除,或者至少编码标记基因的开放阅读框缺失或从基因组中移除。其中的整合载体整合入靶基因座的稳定的重组宿主细胞通过在缺乏特定有机化合物(代谢物)的培养基中培养已转化宿主细胞筛选。因为可选择标记基因或ORF未与内源性或异源全长启动子而与弱的、减弱的、隐藏的启动子或截短启动子(或在具体方面,无启动子)可操作地连接,该重组的已转化宿主细胞(仅包含插入靶基因座的单拷贝整合载体)不导致对所述有机化合物或代谢物为原养型。对于导致对所述有机化合物或代谢物为原养型的已转化宿主细胞,必须将多拷贝的整合载体整合入宿主细胞的靶基因座,此外,因为多拷贝的整合载体必需整合入靶基因座,也产生了大量的由感兴趣的基因或序列编码的蛋白质或肽。

优选低等真核生物例如酵母用于蛋白质的表达,因为它们可被经济地培养、得到高产率并当被适当修饰时可进行适当的糖基化。酵母尤其提供已建立的遗传学使得可快速转化、检测蛋白质定位策略和容易的基因敲除技术。需要时,合适的载体具有表达控制序列,例如启动子,包括3-磷酸甘油酸激酶或其他糖酵解酶,以及复制起点、终止序列等。

通常优选各种酵母例如乳酸克鲁维酵母,巴斯德毕赤酵母,甲醇毕赤酵母,和多形汉逊酵母用于细胞培养因为它们可以生长至高细胞浓度并分泌大量的重组蛋白。相似的,丝状真菌例如黑曲霉,镰孢菌属物种,粗糙链孢霉和其他可用于工业化规模产生本发明的糖蛋白。可用作本发明宿主细胞的其他细胞包括原核细胞例如大肠杆菌和包括低等真核生物细胞在内的细胞培养物中的真核宿主细胞、植物细胞和哺乳动物细胞,例如中国仓鼠卵巢(CHO)细胞。

低等真核生物特别是酵母可经遗传修饰使得它们表达其中的糖基化类型为人样或人源化的糖蛋白。这可通过去除经选择的内源糖基化酶和/或提供外源酶实现,如Gerngross et al.,US 2004/0018590所述,其通过引用并于本文。举例而言,宿主细胞可经筛选或经工程化缺失1,6-甘露糖转移酶活性,其否则可将甘露糖残基添加至糖蛋白的N-聚糖上。

美国公开申请第20070072262号公开了4RG1,ARG2,ARG3,HIS1,HIS2,HIS5,和HIS6基因以及使用这些基因稳定遗传整合入酵母的方法,且美国公布申请第20040229306号公开了巴斯德毕赤酵母URA5基因及其在遗传稳定整合入酵母中的用途。尤其可用于实施本文方法和系统中的可选择标记基因包括但不限于URA3,URA5,HIS3,LEU2,TRP1,LYS2,ADE1和ADE2基因座。其中的特定营养缺陷使得该细胞更不能与对应的原养型竞争或生长更加缓慢的营养缺陷型宿主细胞和可选择标记基因是可用的。因此,尤其可用的可选择标记基因为可选择标记基因ADE1,ADE2.LYS2,URA3和URA5。

已从各酵母和真菌种克隆了ADE1基因,包括酿酒酵母(Myasnikov等,Gene,109:143-147(1991);乳酸克鲁维酵母(Zonneveld和van der Zanden,等,Yeast,11:823-827(1995),巴斯德毕赤酵母(Cereghino et al.,Gene 263:159-169(2001))。ADE1基因编码N-琥珀酰基-5-氨基咪唑-4-氨甲酰核糖核苷酸(SAICAR)合成酶,其为从头嘌呤核苷酸生物合成所必需。红色素积累于丧失了腺嘌呤的突变细胞中。

已从各酵母和真菌种克隆了ADE2基因,包括酿酒酵母(Jones和Fink,″Regulation of amino acid and nucleotide biosynthesis in yeast″pp.181-299in The Molecular Biology of the YeastSaccharomyces:Metabolism and Gene Expression,Strathern等,(编辑)Cold Spring Harbor,NY:Cold Spring Harbor Laboratory Press);白假丝酵母(Kurtz et al,Mol.Cell.Biol.,6:142-149(1986));米曲霉,(Jin等,Biosci Biotechnol Biochem.68:656-62(2004),和巴斯德毕赤酵母(本文)。ADE2基因编码磷酸核糖基氨基咪唑羧化酶,其催化从头嘌呤核苷酸生物合成途径中的一步。红色素积累于丧失了腺嘌呤的突变细胞中。

在另一实施方案中,可用置换或敲除一种或更多种营养缺陷基因的载体转化细胞系,例如敲除或置换ADE1或ADE2基因使得细胞对于腺嘌呤营养缺陷,例如具有Ade1-或Ade2-表型的细胞。因此,本发明包括用于遗传工程化细胞系使得它们包含阻碍细胞生长的营养缺陷突变的方法。这些包含营养缺陷突变的细胞系可接着作为如本文所教导用于筛选的宿主细胞,其中用编码一个或更多个所需糖蛋白和补充营养缺陷突变的基因的整合载体转化该宿主细胞使得表达所需蛋白的细胞也携带补充营养缺陷突变并提供易于鉴别和筛选的表型的基因。

本文公开的使用ADE1或ADE2标记以及ade1或ade2营养缺陷宿主细胞的方法尤其可用于制备重组巴斯德毕赤酵母宿主细胞因为它解决了可用于多拷贝筛选的巴斯德毕赤酵母的合适标记缺乏的问题。至今为止,主要显性标记例如Zeocin被用于这一目的。然而,显性标记具有明显的缺点。例如,在发酵时,时常不适合加入抗生素以确定所有整合的异源基因拷贝保持整合。但是,如果本文公开的构建体被逐出,细胞将变得不能产生腺嘌呤并将显示较慢生长和粉红色的可选择表型。因此,在发酵中被逐出的异源构建体因为这一较慢生长易于筛选。

所公开系统的优点为通过颜色筛选具有多拷贝标记和用于在宿主细胞中整合入基因组中表达的所需基因的转化子的能力,以及由于ade1或ade2细胞的缓慢生长稳定保留具有整合入基因组的一个或更多个拷贝的转化子。一方面,该系统利用ade/ADE菌株的粉/白颜色筛选的差异表型联合具有Ade1-或Ade2-表型菌株的缓慢生长以及包括与启动子可操作连接的ADE1或ADE2开放阅读框(ORF)的拷贝和用于宿主细胞内表达的所需基因的质粒的整合以提供比依赖于显性Zeocin筛选用于制备重组宿主细胞的现有系统有所改进的系统。另一方面,本系统利用ade/ADE菌株的粉/白颜色筛选的差异表型联合具有Ade1-或Ade2-表型的菌株的缓慢生长以及包括与弱的、减弱的或隐藏的启动子可操作连接的或ADE1或ADE2 ORF的拷贝和用于宿主细胞表达的所需基因的质粒的强迫多整合以提供比依赖于显性Zeocin筛选用于制备重组宿主细胞的现有系统有所改进的系统。因此,该方法和材料可用于异源蛋白的稳定高水平表达。

因此,在具体的实施方案中,该方法和系统包括重组宿主细胞、非人真核生物宿主细胞,特别是低等真核生物宿主细胞例如酵母和丝状真菌宿主细胞,具有重组蛋白(当使用可生产具有杂合或复合型N-聚糖的糖蛋白的宿主细胞时包括糖蛋白)生产的提高的生产力。通过减少或消除至少一种编码营养缺陷标记基因例如ADE1或ADE2的内源基因的功能修饰所述重组宿主细胞。具有导致腺嘌呤缺陷的突变的细胞生长非常缓慢,并积累红色素,其引起粉色菌落的产生(那是具有Ade1-或Ade2-表型的细胞)。当用分别包括与用于ADE1或ADE2ORF表达的启动子可操作连接的ADE1或ADE2ORF的质粒转化具有Ade1-或Ade2-表型的细胞时,Ade1或Ade2突变被补充且使得细胞对腺嘌呤为原养型,即使得细胞具有Ade1+或Ade2+表型。这些被补充的重组细胞显示白色和大菌落尺寸,其可促进重组细胞的鉴别和筛选。或者,当分别用包括未与用于表达ADE1或ADE2ORF的启动子可操作连接的ADE1或ADE2ORF的质粒转化具有Ade1-或Ade2-表型的细胞时,Ade1或Ade2突变仅在包含多于一个拷贝整合入基因组的ADE1或ADE2基因的重组细胞中被补充。

在其他实施方案中,提供整合载体用于在应用显示Ade1-或Ade2-表型的宿主细胞例如上文所述的宿主细胞的表达系统中异源基因的可选择表达。该整合载体包括包含被克隆位点分离并与其可操作连接的启动子序列和转录终止序列的核酸。使用标准的连接技术以通过启动子表达的正确方向将编码一个或更多个感兴趣的所需异源蛋白或肽或功能核酸的核酸序列插入克隆位点。该整合载体优选包括至少一个启动子,其在宿主细胞中为功能性的,之后为至少一个限制性位点,优选多克隆位点,之后为在宿主细胞内具有功能性的转录终止序列。使用合适的已知技术,可将编码所需蛋白或多肽的核苷酸片段连接至整合载体的克隆位点的限制性位点中。该整合载体也包括至少一个拷贝的选自ADE1和ADE2的可选择标记ORF,其可受控于在宿主细胞内具有功能性的合适的转录终止终止子序列。在一些实施方案中,ORF可操作地连接至全长同源或异源启动子,且在其他实施方案中,该ORF可操作的连接至隐藏的启动子、弱启动子、减弱启动子或与全长启动子相比转录活性减低的截短同源或异源启动子。

在另一实施方案中,提供了用于构建表达异源或重组蛋白和肽的重组宿主细胞的的方法、材料和系统,其中ADE1基因被移除或缺失使得宿主细胞对于腺嘌呤营养缺陷,例如使得细胞ade1。接着用整合载体转化该ade1宿主细胞,所述载体包括(1)与弱启动子、减弱内源或异源启动子、隐藏的启动子、截短的内源或异源启动子或无启动子可操作连接的编码Ade1p或Ade1p活性的核酸;(2)一个或更多个编码感兴趣的基因或功能核酸的核酸以异位产生异源或重组蛋白或肽或功能核酸;以及(3)引导整合载体通过同源重组插入宿主细胞基因组基因座特定靶位点的靶向核酸序列。其中整合载体被整合入靶基因座的稳定重组宿主细胞通过在缺乏腺嘌呤的培养基中培养已转化宿主细胞筛选。因为编码Ade1p活性的核酸与弱的、减弱的、隐藏的启动子或截短启动子可操作连接,所以仅包含单拷贝的插入靶基因座的整合载体的重组已转化宿主细胞未导致为对腺嘌呤为原养型。对于要使其为原养型的已转化宿主细胞,必须有多拷贝的整合载体整合入宿主细胞的靶基因座。此外,因为必须有多拷贝整合载体整合入靶基因座,所以产生了大量的由感兴趣的基因或序列编码的蛋白质或肽。

在另一实施方案中,提供了构建用于表达异源或重组蛋白质和肽的重组宿主细胞的方法、材料和系统,其中ADE2基因已被移除或缺失以导致宿主细胞对腺嘌呤为营养缺陷型。接着用整合载体转化ade2宿主细胞,所述载体包括(1)与弱启动子、减弱内源或异源启动子、隐藏的启动子、截短的内源或异源启动子或无启动子可操作连接的编码Ade2p或Ade2p活性的核酸;(2)一个或更多个编码感兴趣的基因或功能核酸的核酸以异位产生异源或重组蛋白或肽或功能核酸;以及(3)引导整合载体通过同源重组插入宿主细胞基因组特定靶位点或基因座的靶向核酸序列。其中整合载体被整合入靶基因座的稳定重组宿主细胞通过在缺乏腺嘌呤的培养基中培养已转化宿主细胞筛选。因为编码Ade2p活性的核酸与弱的、减弱的、或隐藏的启动子可操作连接,所以仅包含单拷贝的插入靶基因座的整合载体的重组已转化宿主细胞未被导致对腺嘌呤为原养型。对于要使其对腺嘌呤为原养型的已转化宿主细胞,必须有多于一个拷贝的整合载体整合入宿主细胞的靶基因座。此外,因为必须有多拷贝整合载体整合入靶基因座,所以产生了大量的由感兴趣的基因或序列编码的蛋白质或肽。

在上述两个实施方案中,ade1或ade2营养缺陷型比原养型(例如,分别为ADE1或ADE2)或通过多拷贝整合载体整合入基因组使变得原养型的细胞生长得更加缓慢。在培养物中,回复体和丢失插入靶基因座的多拷贝整合载体的已转化细胞将生长更加缓慢并被保持了整合入靶基因座的多拷贝整合载体的那些细胞竞争出局(out-complete)。此外,在具体的生物体例如酵母中,ade1或ade2营养缺陷型为红色或粉色而原养型或通过多于一个拷贝的整合载体整合入基因组而变得原养型的细胞为白色。因此,包含插入靶序列的多拷贝整合载体的重组细胞的筛选可基于筛选白色菌落。

本文方法和系统可在可制成营养缺陷型突变例如ade1或ade2且其补充可产生本文的可选择表型的任何生物体中实施。该方法涉及用包括编码补充的Ade1p或Ade2p蛋白的核苷酸序列的整合载体转化显示ade1或ade2负表型的宿主细胞,这样当用编码所需分泌型糖蛋白的整合载体转化宿主细胞时,Ade1-和/或Ade2-表型的补充导致编码所需糖蛋白的基因的稳定整合,并有助于提高已转化重组宿主细胞的质量,特别是增加所需重组糖蛋白的产率。

在另一实施方案中,本发明宿主细胞在它们的基因组中携带其他遗传操作,这样该宿主细胞和/或从其产生的蛋白质或肽显示所需性质。举例而言,可根据例如美国专利第7,029,872号、美国公开申请第2004/0018590号以及Hamilton等,Science,313:1441-1443(2006)所述方法操作宿主细胞;这样宿主细胞可以一种或更多种所需糖形式的高同源水平产生重组糖蛋白。在其他实施方案中,可通过缺失一个或更多个编码分子伴侣蛋白的内源基因和/或用一个或更多个编码来自要产生的异源蛋白或多肽的物种的分子伴侣基因的异源基因转化宿主细胞修饰宿主细胞。例如,毕赤酵母属种的宿主细胞可通过消除内源蛋白PDI和/或BiP而被修饰,并被一个或更多个编码哺乳动物PDI,BiP和/或GRP94基因的质粒转化。参见Choi等,同上文,其公开内容通过引用并于本文。

在又其他实施方案中,提供了用于增加非人真核生物宿主细胞、低等真核生物宿主细胞或酵母或丝状真菌宿主细胞中重组人或哺乳动物糖蛋白生产力的方法。该方法包括用包括编码ADE1或ADE2ORF的核酸以及编码感兴趣的糖蛋白的核酸的载体转化为ade1或ade2且可产生具有杂合型或复合型N-聚糖的糖蛋白的宿主细胞。

以下实施例预期促进对本发明的进一步理解。

实施例1

如下进行巴斯德毕赤酵母ADE1和ADE2基因的克隆。

之前已发表了巴斯德毕赤酵母ADE1基因的克隆(Cereghino等,同上)。使用获自Integrated Genomics,Chicago,IL的部分巴斯德毕赤酵母基因组序列获得另外的5′-和3′-序列。包括启动子和转录终止序列在内的巴斯德毕赤酵母ADE1开放阅读框(ORF)的核苷酸序列显示于SEQ ID NO:56。巴斯德毕赤酵母ADE1的氨基酸序列显示于SEQID NO:57。用酿酒酵母ADE2ORF查询所述的基因组序列,使用程序BLAST鉴定巴斯德毕赤酵母ADE2同源物(563个氨基酸具有69%同一性)(Altschul等,J.Mol.Biol.215:403-410(1990))。包括启动子和转录终止序列在内的编码巴斯德毕赤酵母ADE2ORF的核苷酸序列显示于SEQ ID NO:60。ADE2ORF由SEQ ID NO:60所示的核苷酸序列的核苷酸127至1815编码且具有SEQ ID NO:61中所示氨基酸序列。巴斯德毕赤酵母ADE2氨基酸序列(SEQ ID NO:61)与酿酒酵母ADE2氨基酸序列(SEQ ID NO:62)的比对显示于图1。

实施例2

如下进行ADE1和ADE2敲除载体和菌株的构建。在质粒构建的第一步中,我们构建了包含以下DNA区域的通用敲除质粒:(a)巴斯德毕赤酵母的ARG3基因(Nett等,2005,同上)作为要敲除基因的5′和3′区的空间支持物(space holders)。(b)巴斯德毕赤酵母URA5-blaster(Nett and Gerngross,Yeast 20:1279-1290(2003)作为营养缺陷标记;以及(c)具有用于插入外源基因的多克隆位点的表达盒。

为了构建与通用敲除质粒的结构相容的URA5-blaster盒,将lacZ的SacI-PvuII片段克隆至pUC19的SacI-SmaI位点。所得质粒用HincII消化且用T4DNA聚合酶末端钝化的lacZ的SacI-PvuII片段以头至尾的方向被插入这一质粒得到pGLY8。用引物Ura5comp5(SEQ ID NO:1)和Ura5comp3(SEQ ID NO:2)以及酵母菌株NRRL Y-11430基因组DNA作为模板扩增巴斯德毕赤酵母URA5基因的1.0kb DNA片段并克隆至pGLY8的BamHI-XbaI位点以生成pGLY10。为了移除内部的SacI和XhoI位点,使用pGLY10作为模板和分别使用引物对URA5MUT1(SEQ ID NO:3)和URA5MUT2(SEQ ID NO:4),URA5MUT3(SEQ ID NO:5)和URA5MUT4(SEQ ID NO:6),以及URA5MUT5(SEQ ID NO:7)和URA5MUT6(SEQ ID NO:8)扩增三个重叠的URA5片段。所得PCR产物经凝胶纯化、混合并作为使用URA5MUT1(SEQ ID NO:3)和URA5MUT6(SEQ ID NO:8)为引物的融合PCR的模板。所得PCR产物接着克隆至载体pCR2.1用ClaI和BssHII再次去除并克隆至也经ClaI和BssHII消化的pGLY10得到pGLY12。为了去除SacI和BamHI位点,首先用SacI剪切pGLY12,用T4DNA聚合酶钝化末端并再连接得到pGLY13a,并然后用BamHI切割,末端钝化和再连接产生pGLY13b。在两种情况下,可通过用EcoRI和SphI消化释放lacZ-URA5盒。

通过PCR使用引物ARG355DIS(SEQ ID NO:9)和ARG353-2(SEQ ID NO:10),以巴斯德毕赤酵母基因组DNA作为模板扩增ARG3-5’区域的1.1kb DNA片段并克隆至pUC19的SacI-SalI位点。用BamHI和SalI剪切所得质粒并将用引物ARG335-2(SEQ ID NO:11)和ARG333(SEQ ID NO:12)扩增的ARG3-3′区的0.7kb DNA片段克隆至开放位点得到pGLY21。用BamHI剪切质粒,T4DNA聚合酶钝化末端,且插入经EcoRI和SphI剪切和钝化的来自pGLY 13a或pGLY13b的lacZ-URA5盒分别得到质粒pGLY22b和pGLY23。质粒pGLY22b构成不含另外表达盒的通用敲除质粒,而pGLY23进一步经修饰也包含用于异源基因的另外表达的盒。

为了构建具有NotI和PacI克隆位点的表达盒,用引物GAP5CLEAN(SEQ ID NO:13)和GAP3CLEAN(SEQ ID NO:14)以及巴斯德毕赤酵母基因组DNA作为模板扩增包含巴斯德毕赤酵母GAPDH启动子的0.5kb DNA片段,并克隆至pUC 19的BamHI-SphI位点。用SpeI和SphI剪切所得质粒并将用引物CYC5CLEAN(SEQ IDNO:15)和CYC3CLEAN(SEQ ID NO:16)且用酿酒酵母基因组DNA作为模板扩增的并用NheI和SphI剪切的包含酿酒酵母CYC 1转录终止子区域的0.3kb片段克隆至开放位点得到pGLY17。通过BamHI消化释放表达盒并克隆至pGLY23以得到pGLY24。

以以下方法从pGLY22b构建ADE1敲除质粒。用引物ADE 155L(SEQ ID NO:17)和ADE153L(SEQ ID NO:18)扩增的ADE1-5′区域的1.8kb片段经SacI和PmeI剪切并克隆至pGLY22b得到pGLY1064。接着用SwaI和SphI剪切用引物ADE1KO35(SEQ ID NO:19)和ADE133L(SEQ ID NO:20)扩增的ADE1-3’区的1.5kb片段并克隆至pGLY1064产生ADE1敲除的质粒pGLY1065(图1A)。

以以下方法从pGLY24构建ADE2敲除质粒。用引物RCD534(SEQ ID NO:21)和RCD535(SEQ ID NO:22)以及巴斯德毕赤酵母基因组DNA作为模板PCR扩增巴斯德毕赤酵母ALG3转录终止子,用EcoRV和AflII剪切并克隆至pGLY24的PmeI-AflII位点以产生pGLY566。这一修饰与下文的ADE2敲除质粒无关,但是可用于构建用于另一不同方案的质粒。用SwaI和SalI剪切用引物ADE235(SEQID NO:25)和ADE233(SEQ ID NO:26)扩增的ADE2-3′区的1.7kb片段并克隆至pGLY566得到pGLY1079。接着用SacI和FseI剪切用引物ADE255KO(SEQ ID NO:23)和ADE253KO(SEQ ID NO:24)扩增的ADE2-5′区的1.0kb片段并克隆至pGLY1079得到ADE2敲除质粒pGLY2057(图IB)。

按照以下方法构建ADE1和ADE2敲除菌株。用pGLY 1065转化使用之前所述方法(Nett and Gerngross,Yeast 20:1279-1290(2003);Choi et al.,Proc.Natl.Acad.Sci.100:5022-5027(2003);Hamilton et al.,Science 301:1244-1246(2003))构建的菌株YGLY24-3[ura5Δ∷MET16,och1Δ∷lacZ,bmt2Δ∷lacZ/K1MNN2-2,mnn4L1Δ∷lacZ/MmSLC35A3,pno1Δmnn4Δ∷lacZ,met16Δ∷lacZ]且将两个粉色的转化子命名为YGLY563和YGLY564。通过它们不能在缺乏腺嘌呤的培养基上生长确认它们的Ade1表型。这些菌株可产生主要具有Man5GlcNAc2N-聚糖的糖蛋白。

用pGLY2057转化菌株YGLY227和YGLY228(用URA5标记的里氏木霉1,2甘露糖苷酶表达质粒转化的YGLY24-3的直接子代,并在不相关的试验中的5-FOA上反筛选)并对于各菌株分离一株粉色的转化子分别生成菌株YGLY 1215和YGLY1216。也通过它们不能在缺乏腺嘌呤的培养基上生长验证它们的ade2表型(结果未显示)。如预期(Cereghino等,同上文),ade1和ade2菌株二者甚至在添加腺嘌呤的培养基上显示缓慢生长表型。这些菌株可产生主要具有Man5GlcNAc2N-聚糖的糖蛋白。

实施例3

ADE1和ADE2标记的整合载体的构建如下。

通过用EcoRI和HindIII剪切pUC19并插入复性的oligos EXMCS1(SEQ ID NO:27)和EXMCS2(SEQ ID NO:28)构建包含用于BglII,EcoRI,KpnI,SwaI,BamHI,NotI,PacI,AscI和SfiI的位点的更合适的多克隆位点的载体,产生pGLY192。用BamHI和SwaI剪切用引物CYCTT5(SEQ ID NO:29)和CYCTT3(SEQ ID NO:30)并以酿酒酵母基因组DNA作为模板扩增的包含酿酒酵母CYC 1转录终止子区域的0.3kb DNA片段并克隆至pGLY192得到pGLY213。接着用oligosAOX1P-5(SEQ ID NO:31)和AOX1P-3(SEQ ID NO:32)从基因组DNA扩增巴斯德毕赤酵母AOX1启动子,用BglII和EcoRI剪切并连接至pGLY213以产生pGLY214。因为两个ade敲除质粒均经设计以移除完整的ORF,引入作为启动子区替代物的用于质粒整合的区域。为了这一目的,使用oligos TRP2-5(SEQ ID NO:33)和TRP2-3修订的(SEQ ID NO:34)从基因组DNA扩增包含巴斯德毕赤酵母TRP2基因的1.8kb片段,用SfiI剪切并克隆至pGLY214以得到pGLY215。这一质粒包含用于加入感兴趣的基因的EcoRI,KpnI,SwaI位点以及用于加入截短ADE标记的BamHI,NotI,PacI,AscI位点。

如下构建包含与其天然启动子或与天然启动子的各种截短物可操作连接的ADE1 ORF的ADE1标记盒。用oligo ADE1-3(SEQ IDNO:35)作为3′-oligo和ADE1-5C-BAM(SEQ ID NO:36),ADE 1-5-100(SEQ ID NO:37),ADE 1-5-186(SEQ ID NO:38),ADE 1-5-295(SEQ IDNO:39),ADE1-5-325(SEQ ID NO:40),和ADE1-5ORF(SEQ ID NO:41)作为5′-oligos PCR扩增具有全长或截短启动子的ADE1标记,得到分别具有370,276,191,82,50和0个核苷酸的启动子区域的片段。用NotI和AscI剪切前五个片段并用PacI和AscI剪切最后一个片段,且将所有片段克隆至pGLY215以分别生成ADE1标记的整合质粒pGLY220至pGLY225(见图1C的pGLY225质粒图谱)。为产生用于组成型蛋白表达的质粒,去除pGLY220和pGLY225中的AOX1启动子并用经用引物GAPDHP-5(SEQ ID NO:42)和GAPDHP-3(SEQID NO:43)扩增的GAPDH启动子置换,分别得到质粒pGLY1082和pGLY 1083(见图1D的pGLY 1083质粒图谱)。

如下构建包含与其天然启动子或与天然启动子的各种截短物可操作连接的ADE2ORF的ADE2标记盒。基本以与上文相同的方法构建等同于pGLY215用于ADE2标记盒的未标记整合质粒。这一称作pGFI4的质粒与pGLY215之间的主要差异在于它包含如上文扩增的GAPDH启动子以及用于添加用oligos 5oligoERSSKFS(SEQ ID NO:44)和3oligoSFSSRF(SEQ ID NO:45)扩增以包含限制性位点EcoRI,RsrII,SphI,StuI,KpnI,FseI和SwaI的感兴趣的基因的多克隆位点。用oligoADE23(SEQ ID NO:46)作为3′-oligo和oligos ADE25NotI-l(SEQ IDNO:47),ADE25NotI-2(SEQ ID NO:48),ADE25NotI-3(SEQ ID NO:49),ADE25NotI-4(SEQ IDNO:50),和ADE25′PacInew(SEQ ID NO:51)作为5′-oligos扩增截短ADE2标记,分别得到具有126,82,51,13和0个核苷酸的启动子区域的片段。用NotI和AscI剪切前4个DNA片段并用PacI和AscI剪切最后一个DNA片段,并将所有的片段克隆至pGFI4以分别生成ADE2标记的整合质粒pGLY2077至pGLY2081。除了多克隆位点中的EcoRI位点,这些质粒也包含ADE2 ORF中的EcoRI位点。

在pGLY2077和pGLY2081中,因此通过定点突变移除ORF中的EcoRI位点分别产生pGLY2091和pGLY2092。(见图IE的pGLY2092质粒图谱)。为了产生用于诱导型蛋白质表达的质粒,这两个最后构建体的GAPDH启动子被移除并用经使用上文的引物AOX1P-5(SEQID NO:52)和AOX1P-3(SEQ ID NO:53)扩增的AOX1启动子置换,分别得到质粒pGLY2093和pGLY2094(见图IF的pGLY2094质粒图谱)。

为了检测截短标记对蛋白质表达的作用,构建若干表达各种感兴趣的蛋白质的载体。

将人葡糖脑苷脂酶(GBA)与人血清白蛋白(HSA)信号序列融合并克隆至pGLY1082和pGLY1083的EcoRI/KpnI位点以分别产生GAPDH驱动且ADE1标记的整合载体pGLY1084和pGLY1085。单链形式的抗-HER2单克隆抗体(美国专利申请号20060252096)融合至酿酒酵母α交配因子前序列并克隆至pGLY 1082和pGLY1083的EcoRI/SwaI位点以分别产生GAPDH驱动且ADE1标记的整合载体pJN904和pJN905。将人CD40胞外结构域(氨基酸20至192,R.J.Noelle惠赠;Lu,L.et al,J.Biol.Chem.278:45414-45418(2003)与酿酒酵母α交配因子前序列原融合并克隆至pGLY 220和pGLY225的EcoKI/KpnI位点以分别产生AOX 1驱动的且ADE1标记的整合载体pGLY1073和pGLY1074。将人EPO与酿酒酵母α交配因子前序列融合并克隆至pGLY2093和pGLY2094的EcoRI/KpnI位点以分别产生AOX1驱动的且ADE2标记的整合载体pGLY2663和pGLY2664。

实施例4

测定ADE标记启动子长对拷贝数和蛋白质表达的作用

为了检测各种ADE标记启动子截短物对拷贝数和蛋白质表达的作用,我们考虑了以下假设:1)因为所有的整合质粒整合入相同的基因组基因座(TRP2),不预期标记启动子长度的减少将导致质粒整合子自身拷贝数的增加;2)如果标记启动子长度下降至低于某一阈值,预计仅整合单质粒拷贝的克隆将以比整合多个拷贝质粒的克隆更慢的速度生长,归因于ade负表型的缓慢生长表型。这应伴随低拷贝克隆中粉色的出现;3)因此标记启动子强度的逐渐下降应导致快速生长的白色克隆数量的减少以及缓慢生长的粉色克隆数量的相对基础增加;以及,4)为了消除异源蛋白质表达可能对转化子生长的任何作用,应一开始检测空表达质粒。

用等量的(0.2μg)整合质粒pGLY220至pGLY225(用BspEI在TRP2整合区域线性化并涂布在基本培养基本上)转化营养缺陷型ade1菌株YGLY563和YGLY564。于23℃孵育五天后,检测转化平板的菌落数量。令人惊奇的是,整合质粒pGLY220至pGLY224均得到大约相同的菌落数量。但是用pGLY225转化的两种酵母菌株均得到小于10%的白色转化子数量,背景中存在大量的勉强可见的粉色转化子(见表1)。预计具有启动子截短物的质粒将引起随着启动子长度减小更小数量的菌落,仅包含ORF的最短的一个未产生菌落。然而这些结果表明标记前的CYC1终止子区域和多克隆位点包含使得存在背景转录水平的隐藏的启动子活性,藉此引起一些情况下的ADE1基因产物的水平足以补充ade1营养缺陷型表型。

当用整合质粒pGLY2077至pGLY2081转化ade2营养缺陷菌株YGLY 1215和YGLY1216时,获得有些相似的图。在截短ADE2标记的情况下,观察到伴随较短启动子的菌落数量的逐渐减少。如ADE1的情况,仅含ADE2ORF根本不含任何天然启动子序列的载体比具有全长启动子序列的构建体得到小于10%的白色转化子数量。(见表1)。

为了检测这一预期的多拷贝整合如何影响蛋白质表达水平,将表达GBA、单链抗-HER2抗体、人CD40胞外结构域或人EPO的质粒转化至ade1或ade2营养缺陷酵母菌株(见表2)。转化子生长于96孔深孔板中,用适当的源诱导表达并通过Western印迹或考马斯凝胶检测蛋白质水平(见图3和4)。对于绝大多数使用无启动子的ADE2ORF作为标记的转化子,如预期观察到非常低数量的白色转化子(5至20)。然而这些克隆的表达水平一般显著高于使用完整ADE2基因作为标记转化获得的克隆,其通常产生数百的转化子(见图3和4)。尤其惊人的是在图3D中用星形标记的泳道中显示的克隆所产生的蛋白质的量。

材料和方法

大肠杆菌菌株DH5α用于重组DNA操作。野生型巴斯德毕赤酵母菌株NRRL-Y 11430用于构建酵母菌株(ATCC#76273)。PCR反应根据厂商建议使用EXTAQ(TaKaRa)、Taq Poly(Promega)或Pfu(Stratagene,La Jolla,CA)进行。限制性和修饰酶购自NewEngland Biolabs(Beverly,MA)。酵母菌株生长于YPD(1%酵母提取物、2%蛋白胨、2%右旋糖和1.5%琼脂)或适当时补充的合成的确定成分培养基(1.4%酵母氮基质,2%右旋糖、4x10-5%生物素和1.5%琼脂)中。如(Nett等,2005)中所述通过电穿孔进行酵母转化。根据生产商的说明使用4-20%precast TRIS-SDS凝胶和购自Biorad的MiniPROTEAN 3细胞进行考马斯凝胶和Western印迹。用于检测的一抗为:购自Pierce的山羊抗-人IgG(Fc)#314131∶10000稀释用于Herceptin;购自Santa Cruz Biotechnology的1∶500稀释的抗人EPO#sc7956;购自Rockland Immunochemicals,Inc.的1∶500稀释的抗-GBA兔多克隆(定做)。

尽管通过参考所说明的实施方案描述本发明,应理解的是本发明并不受限于此。具有本领域的普通技术并获得本文教导的那些人将认识到其范围内的其他修改和实施方案。因此,本发明仅受限于附加于本文的权利要求。

发明背景

序列表简述








序列表
<110>NETT,Juergen
 
<120>用于蛋白质生产的酵母菌株
 
<130>GFI-BIO-0030
 
<150>61/008,242
<151>2007-12-19
 
<160>62
 
<170>FastSEQ for Windows Version 4.0
 
<210>1
<211>35
<212>DNA
<213>人工序列
 
<220>
<223>Ura5comp5引物
 
<400>1
gctctagagg gacttatctg ggtccagacg atgtg    35
 
<210>2
<211>35
<212>DNA
<213>人工序列
 
<220>
<223>Ura5comp3引物
 
<400>2
cgggatccgc cgccgtgccc aaagctccga aacag    35
 
<210>3
<211>31
<212>DNA
<213>人工序列
<220>
<223>URA5MUT1引物
 
<400>3
gcagtcatca catcatcgat aatcagtact c   31
 
<210>4
<211>29
<212>DNA
<213>人工序列
 
<220>
<223>URA5MUT2引物
 
<400>4
ccgtgttgaa gttgtacgag ctgggcggc      29
 
<210>5
<211>29
<212>DNA
<213>人工序列
 
<220>
<223>URA5MUT3引物
 
<400>5
gccgcccagc tcgtacaact tcaacacgg      29
 
<210>6
<211>29
<212>DNA
<213>人工序列
 
<220>
<223>URA5MUT4引物
 
<400>6
cacattgaag atgtcactgg aggggtacc      29
 
<210>7
<211>29
<212>DNA
<213>人工序列
<220>
<223>URA5MUT5引物
 
<400>7
ggtacccctc cagtgacatc ttcaatgtg                                   29
 
<210>8
<211>30
<212>DNA
<213>人工序列
 
<220>
<223>URA5MUT6引物
 
<400>8
gctggctcgc gcgcagtgtt tttcgtgctc                                  30
 
<210>9
<211>46
<212>DNA
<213>人工序列
 
<220>
<223>ARG355DIS引物
 
<400>9
gagctcggcc agcttggccg ctaacagtaa caaaaactac cgccag                46
 
<210>10
<211>55
<212>DNA
<213>人工序列
 
<220>
<223>ARG353-2引物
 
<400>10
gtcgacggat ccgtttaaac gacagccttc tttgggtcat gagtaacttc caaac      55
 
<210>11
<211>56
<212>DNA
<213>人工序列
<220>
<223>ARG335-2引物
 
<400>11
ggatccacta gtatttaaat cacggattta tgcttgatca catgaccaat cataac   56
 
<210>12
<211>43
<212>DNA
<213>人工序列
 
<220>
<223>ARG333引物
 
<400>12
gtcgacggcc gatggggccc gcattcttct tgcttaataa acc                 43
 
<210>13
<211>48
<212>DNA
<213>人工序列
 
<220>
<223>GAP5CLEAN引物
 
<400>13
ggatccctcg agagatcttt tttgtagaaa tgtcttggtg tcctcgtc            48
 
<210>14
<211>54
<212>DNA
<213>人工序列
 
<220>
<223>GAP3CLEAN引物
 
<400>14
gcatgcacta gtgcggccgc tgtgttttga tagttgttca attgattgaa atag     54
 
<210>15
<211>44
<212>DNA
<213>人工序列
<220>
<223>CYC5CLEAN引物
 
<400>15
gctagcttaa ttaaacaggc cccttttcct ttgtcgatat catg                   44
 
<210>16
<211>54
<212>DNA
<213>人工序列
 
<220>
<223>CYC3CLEAN引物
 
<400>16
gcatgcggat cccttaagag ccggcagctt gcaaattaaa gccttcgagc gtcc        54
 
<210>17
<211>64
<212>DNA
<213>人工序列
 
<220>
<223>ADE155L引物
 
<400>17
ccaccgagct cggccaactc ggcctttttc aagttgatgc tatcttttat ggatattaag  60
ccag                                                               64
 
<210>18
<211>44
<212>DNA
<213>人工序列
 
<220>
<223>ADE153L引物
 
<400>18
ccaccgttta aacctccatg ccacccatct aatgttgatc aacg                   44
 
<210>19
<211>39
<212>DNA
<213>人工序列
<220>
<223>ADE1KO35引物
 
<400>19
atttaaatat gattagtacc ctcctcgcct ttttcagac                           39
 
<210>20
<211>54
<212>DNA
<213>人工序列
 
<220>
<223>ADE133L引物
 
<400>20
ccaccgcatg cggccatgtt ggcccctctt ttaagcaact ctcttggtcc ttgg          54
 
<210>21
<211>40
<212>DNA
<213>人工序列
 
<220>
<223>RCD534引物
 
<400>21
gatatcggcc ggccatttac aattagtaat attaaggtgg                          40
 
<210>22
<211>45
<212>DNA
<213>人工序列
 
<220>
<223>RCD535引物
 
<400>22
cttaagcgga ccggtttaaa cctactaagc gacgaaaacg ggagc                    45
 
<210>23
<211>53
<212>DNA
<213>人工序列
<220>
<223>ADE255KO引物
 
<400>23
ggatgagctc ggccagttgg gcccttaaaa tcatctgcct caccccaccg acc    53
 
<210>24
<211>52
<212>DNA
<213>人工序列
 
<220>
<223>ADE253KO引物
 
<400>24
ggatggccgg ccgacttgct aacctggctc tgccatagtt gaaaatacgt cg     52
 
<210>25
<211>56
<212>DNA
<213>人工序列
 
<220>
<223>ADE235引物
 
<400>25
ggacgattta aatatttagt attgtttttt aatagatgta tatataatag tacacg 56
 
<210>26
<211>45
<212>DNA
<213>人工序列
 
<220>
<223>ADE233引物
 
<400>26
ggacggtcga cggccatact ggcctgagat ggatttgaaa tgctc             45
 
<210>27
<211>76
<212>DNA
<213>人工序列
<220>
<223>EXMCS1引物
 
<400>27
aattgagatc tgaattcggt accatttaaa tggatccgcg gccgcttaat taaggcgcgc 60
caggccataa tggcct                                                 76
 
<210>28
<211>76
<212>DNA
<213>人工序列
 
<220>
<223>EXMCS2引物
 
<400>28
agctaggcca ttatggcctg gcgcgcctta attaagcggc cgcggatcca tttaaatggt 60
accgaattca gatctc                                                 76
 
<210>29
<211>44
<212>DNA
<213>人工序列
 
<220>
<223>CYCTT5引物
 
<400>29
gcaaggattt aaatacaggc cccttttcct ttgtcgatat catg                  44
 
<210>30
<211>35
<212>DNA
<213>人工序列
 
<220>
<223>CYCTT3引物
 
<400>30
ggatccagct tgcaaattaa agccttcgag cgtcc                            35
 
<210>31
<211>37
<212>DNA
<213>人工序列
 
<220>
<223>AOX1P-5引物
 
<400>31
agatctaaca tccaaagacg aaaggttgaa tgaaacc              37
 
<210>32
<211>38
<212>DNA
<213>人工序列
 
<220>
<223>AOX1P-3引物
 
<400>32
gaattccgtt tcgaataatt agttgttttt tgatcttc             38
 
<210>33
<211>45
<212>DNA
<213>人工序列
 
<220>
<223>TRP2-5引物
 
<400>33
ggccataatg gccaaacggt ttctcaatta ctatatacta ctaac     45
 
<210>34
<211>42
<212>DNA
<213>人工序列
 
<220>
<223>TRP2-3修订的引物
 
<400>34
ggccattatg gccaaaccat aaattcctac ttacgtcctc cg        42
 
<210>35
<211>37
<212>DNA
<213>人工序列
 
<220>
<223>ADE1-3引物
 
<400>35
ggcgcgccct gagccaaaag accccctgcc aatgagc      37
 
<210>36
<211>39
<212>DNA
<213>人工序列
 
<220>
<223>ADE1-5C-BAM引物
 
<400>36
gcggccgcgg gtgctatcgt tttgtgcaat ttggtttgc    39
 
<210>37
<211>38
<212>DNA
<213>人工序列
 
<220>
<223>ADE1-5-100引物
 
<400>37
gcggccgcac ttttaccaat aatcgtttat gaatacgg     38
 
<210>38
<211>34
<212>DNA
<213>人工序列
 
<220>
<223>ADE1-5-186引物
 
<400>38
gcggccgctc cacttgaacg attcattatt caga         34
 
<210>39
<211>39
<212>DNA
<213>人工序列
 
<220>
<223>ADE1-5-295引物
 
<400>39
gcggccgccc aatatactac tctaggaaac tcgaaaaac    39
 
<210>40
<211>38
<212>DNA
<213>人工序列
 
<220>
<223>ADE1-5-325引物
 
<400>40
gcggccgccc tttccatgtg tcatcgcttc caacacac     38
 
<210>41
<211>39
<212>DNA
<213>人工序列
 
<220>
<223>ADE1-5-ORF引物
 
<400>41
ttaattaaat gtccattgtg aacactgatc tggacggaa    39
 
<210>42
<211>37
<212>DNA
<213>人工序列
 
<220>
<223>GAPDHP-5引物
 
<400>42
agatcttttt tgtagaaatg tcttggtgtc ctcgtcc      37
 
<210>43
<211>34
<212>DNA
<213>人工序列
 
<220>
<223>GAPDHP-3引物
 
<400>43
gaattctgtg ttttgatagt tgttcaattg attg                34
 
<210>44
<211>42
<212>DNA
<213>人工序列
 
<220>
<223>5oligoERSSKFS引物
 
<400>44
aattccggac cggcatgcag gcctggtacc ggccggccat tt       42
 
<210>45
<211>38
<212>DNA
<213>人工序列
 
<220>
<223>3oligoSFSSRF引物
 
<400>45
aaatggccgg ccggtaccag gcctgcatgc cggtccgg            38
 
<210>46
<211>44
<212>DNA
<213>人工序列
 
<220>
<223>ADE23AscI引物
 
<400>46
ggatggcgcg ccgcacatga ggctctttgc aaagttcctc cagg     44
 
<210>47
<211>44
<212>DNA
<213>人工序列
 
<220>
<223>ADE25NotI-1引物
 
<400>47
ggatgcggcc gcgtcaaagc cgtatactcg gtagtgtgct cgcc      44
 
<210>48
<211>45
<212>DNA
<213>人工序列
 
<220>
<223>ADE25NotI-2引物
 
<400>48
ggatgcggcc gcgacttgac tcttcactag cctatgcaaa taagg     45
 
<210>49
<211>44
<212>DNA
<213>人工序列
 
<220>
<223>ADE25NotI-3引物
 
<400>49
ggatgcggcc gcggttacct tttccaagaa tcgtagaaac gatt      44
 
<210>50
<211>44
<212>DNA
<213>人工序列
 
<220>
<223>ADE25NotI-4引物
 
<400>50
ggatgcggcc gccttccaaa ctctcatgga ttctcaggta atag      44
 
<210>51
<211>59
<212>DNA
<213>人工序列
 
<220>
<223>ADE2-5’PacInew引物
 
<400>51
ggccttaatt aaatggattc tcaggtaata ggtattctag gaggaggcca gctaggccg  59
 
<210>52
<211>37
<212>DNA
<213>人工序列
 
<220>
<223>AOX1P-5引物
 
<400>52
agatctaaca tccaaagacg aaaggttgaa tgaaacc                          37
 
<210>53
<211>38
<212>DNA
<213>人工序列
 
<220>
<223>AOX1P-3引物
 
<400>53
gaattccgtt tcgaataatt agttgttttt tgatcttc                         38
 
<210>54
<211>1831
<212>DNA
<213>人工序列
 
<220>
<223>用于敲除的ADE 15’seq
 
<400>54
tttttcaagt tgatgctatc ttttatggat attaagccag tgaaacttag agttagcagt 60
atcttatcaa gagtgaaaaa gttgtgtttc ttttcatttg aattgtgctt ggtcattgat 120
gaaatcagag tcattctcaa gatgtataac catatcgatc tataagtcgc agttgcttcc 180
aagtttgact cttgctcaat atccagatct atggaatctt gagcaggtct tttggaataa 240
aatgcgacta aaaacccaga aagtagccca attatatgca gtctgaacat gagtggtact 300
ttggtgagtg acctccatat ccatgacatg gatggatttc gcccttttct tgtgtaatat 360
gacatcaaca acgacgtgga tgacacagta acaacagtca aggagagttt gagactttct 420
tttacgcttt ttatgactat ctgtttgtaa tacttccatt tgctagccgc tttcagctgt 480
tccaattctt ccgtgctaag tctcaagttc ataaagaaga aaaatggaaa gaggtattca 540
aggactaccg tgtattttct tggcaaatat cgcaacagaa agtttctcag atcaaatgca 600
aatcgatttt tcatgctatt cttaccaatt atgctttcca gttcatagaa agatttgacc 660
atatcaccag atgaaaccat gcgagaagtt cctcttttga ctaataggcc ttcacccata 720
aagtttaaga tgttcctgaa atatactgga cagttctcgt aatccatgat aaacgacttg 780
aaaatctgcg agtaacataa tgggaataga taccatgaac gtaagagttt gtctctcttt 840
ggaacacttt ttagcgcttt gagcctacga atgaaacaac tattttctgg ttgatcttcg 900
aattcagcgt tgtctgtgtc tttcatatca gaatccttga taacgtatat agaggatgtc 960
tctttggaaa attggtcggg gtaaacctgt tccaagaact tatagccata ctctaccatt 1020
aataccgtaa aatatattga tgcataattc ttttggtaat atattttact gggatacagg 1080
gcaaatgaca ccactgatgt gaatagactg gaaacgactg aattgaaaag aaacttttgc 1140
ttctcagtga cttttaaata gctctctgcg aaaatgtcaa gaatcttgtt gaacaatggt 1200
ttaactgaaa ataagagacc cagtgatgta gaaaatttta gcaaattcac ccgatcattg 1260
aacattaaat ttcttctaga atttgcaata ttcaactttc ttaagatctt aaatattacg 1320
cccaacgatc caaacaacaa tagaaaccat ctgttgaagt ttctagctgc ctttatggtg 1380
acttttagta ttcctgttgt gtcgttctca taaaatgact gttctacagt cgataataag 1440
ccactcatct tccacaactt caactgcact tcctccaatg caactagatc atgcttttca 1500
agctgcttga gattgatctt cagtaattct ttaacttcat cgtgtgatgt gagcaagacg 1560
agtaaatact tgagttttgt caagttatta ctgcccttgt ttgacatgga ttgctgtatt 1620
tgagaagaaa aatgaacgta aacttgaatc tccccaggtg aacttggcgt gtatcttatc 1680
taccccagct ctaaagttta cccgatgagg taattcttag ggataatttg gtgtatggat 1740
ttgactaaat tgccggagtt gattcaatga cagagaagct tacatgcaag gaacatgatt 1800
cgttgatcaa cattagatgg gtggcatgga g                                1831
 
<210>55
<211>1444
<212>DNA
<213>人工序列
 
<220>
<223>用于敲除的ADE 1 3’seq
 
<400>55
atgattagta ccctcctcgc ctttttcaga catctgaaat ttcccttatt cttccaattc 60
catataaaat cctatttagg taattagtaa acaatgatca taaagtgaaa tcattcaagt 120
aaccattccg tttatcgttg atttaaaatc aataacgaat gaatgtcggt ctgagtagtc 180
aatttgttgc cttggagctc attggcaggg ggtcttttgg ctcagtatgg aaggttgaaa 240
ggaaaacaga tggaaagtgg ttcgtcagaa aagaggtatc ctacatgaag atgaatgcca 300
aagagatatc tcaagtgata gctgagttca gaattcttag tgagttaagc catcccaaca 360
ttgtgaagta ccttcatcac gaacatattt ctgagaataa aactgtcaat ttatacatgg 420
aatactgtga tggtggagat ctctccaagc tgattcgaac acatagaagg aacaaagagt 480
acatttcaga agaaaaaata tggagtattt ttacgcaggt tttattagca ttgtatcgtt 540
gtcattatgg aactgatttc acggcttcaa aggagtttga atcgctcaat aaaggtaata 600
gacgaaccca gaatccttcg tgggtagact cgacaagagt tattattcac agggatataa 660
aacccgacaa catctttctg atgaacaatt caaaccttgt caaactggga gattttggat 720
tagcaaaaat tctggaccaa gaaaacgatt ttgccaaaac atacgtcggt acgccgtatt 780
acatgtctcc tgaagtgctg ttggaccaac cctactcacc attatgtgat atatggtctc 840
ttgggtgcgt catgtatgag ctatgtgcat tgaggcctcc ttttcaagcc actacacatt 900
tacaattaca acaaaagatc caagaaggga cattccctcc acttccggac gtattttcac 960
cccggttaag atctctgatc aatgcttgca taaccataga cctgaaccaa cgaccatcta 1020
ctcacgaact tcttcaggaa agttgcttca atgtgtatat caaggaggtt aatttagaga 1080
taagggagga cagattgaat gagcgtgaac gcaaactgaa aatacgagag aacaagttaa 1140
tcttgagcga agagggaata gtgaaacaac tgaatgaaga actggaattt caaagaaagt 1200
tgcttgaaca agaagtagag gaaataagga agtcatacaa gaacgaattt cagttcgtac 1260
tggaacaaca ggtgcaacag gcattgagca aaattctagg tccccaatac aatcaaaagc 1320
cattgaacag gaatcagcaa caaaaacaaa tacaacaaat ttacagcaga caggatccgc 1380
aattatcaag cccaaagtca caacaagctc agatccaagg accaagagag ttgcttaaaa 1440
gagg                                                              1444
 
<210>56
<211>1510
<212>DNA
<213>巴斯德毕赤酵母
 
<400>56
gggtgctatc gttttgtgca atttggtttg ctggagagtc gaccaagaga tgataactgt 60
tactaagctt ctccgtaatt agtggtattt tgtaactttt accaataatc gtttatgaat 120
acggatattt ttcgacctta tccagtgcca aatcacgtaa cttaatcatg gtttaaatac 180
tccacttgaa cgattcatta ttcagaaaaa agtcaggttg gcagaaacac ttgggcgctt 240
tgaagagtat aagagtatta agcattaaac atctgaactt tcaccgcccc aatatactac 300
tctaggaaac tcgaaaaatt cctttccatg tgtcatcgct tccaacacac tttgctgtat 360
ccttccaagt atgtccattg tgaacactga tctggacgga atcctacctt taatcgccaa 420
aggaaaggtt agagacattt atgcagtcga tgagaacaac ttgctgttcg tcgcaactga 480
ccgtatctcc gcttacgatg tgattatgac aaacggtatt cctgataagg gaaagatttt 540
gactcagctc tcagttttct ggtttgattt tttggcaccc tacataaaga atcatttggt 600
tgcttctaat gacaaggaag tctttgcttt actaccatca aaactgtctg aagaaaaata 660
caaatctcaa ttagagggac gatccttgat agtaaaaaag cacagactga tacctttgga 720
agccattgtc agaggttaca tcactggaag tgcatggaaa gagtacaaga actcaaaaac 780
tgtccatgga gtcaaggttg aaaacgagaa ccttcaagag agcgacgcct ttccaactcc 840
gattttcaca ccttcaacga aagctgaaca gggtgaacac gatgaaaaca tctctattga 900
acaagctgct gagattgtag gtaaagacat ttgtgagaag gtcgctgtca aggcggtcga 960
gttgtattct gctgcaaaaa acttcgccct tttgaagggg atcattattg ctgatacgaa 1020
attcgaattt ggactggacg aaaacaatga attggtacta gtagatgaag ttttaactcc 1080
agattcttct agattttgga atcaaaagac ttaccaagtg ggtaaatcgc aagagagtta 1140
cgataagcag tttctcagag attggttgac ggccaacgga ttgaatggca aagagggcgt 1200
agccatggat gcagaaattg ctatcaagag taaagaaaag tatattgaag cttatgaagc 1260
aattactggc aagaaatggg cttgaatgat tagtaccctc ctcgcctttt tcagacatct 1320
gaaatttccc ttattcttcc aattccatat aaaatcctat ttaggtaatt agtaaacaat 1380
gatcataaag tgaaatcatt caagtaacca ttccgtttat cgttgattta aaatcaataa 1440
cgaatgaatg tcggtctgag tagtcaattt gttgccttgg agctcattgg cagggggtct 1500
tttggctcag                                                        1510
 
<210>57
<211>304
<212>PRT
<213>巴斯德毕赤酵母
 
<400>57
Met Ser Ile Val Asn Thr Asp Leu Asp Gly Ile Leu Pro Leu Ile Ala
 1               5                  10                  15
Lys Gly Lys Val Arg Asp Ile Tyr Ala Val Asp Glu Asn Asn Leu Leu
            20                  25                  30
Phe Val Ala Thr Asp Arg Ile Ser Ala Tyr Asp Val Ile Met Thr Asn
        35                  40                  45
Gly Ile Pro Asp Lys Gly Lys Ile Leu Thr Gln Leu Ser Val Phe Trp
    50                  55                  60
Phe Asp Phe Leu Ala Pro Tyr Ile Lys Asn His Leu Val Ala Ser Asn
65                  70                  75                  80
Asp Lys Glu Val Phe Ala Leu Leu Pro Ser Lys Leu Ser Glu Glu Lys
                85                  90                  95
Tyr Lys Ser Gln Leu Glu Gly Arg Ser Leu Ile Val Lys Lys His Arg
            100                 105                 110
Leu Ile Pro Leu Glu Ala Ile Val Arg Gly Tyr Ile Thr Gly Ser Ala
        115                 120                 125
Trp Lys Glu Tyr Lys Asn Ser Lys Thr Val His Gly Val Lys Val Glu
    130                 135                 140
Asn Glu Asn Leu Gln Glu Ser Asp Ala Phe Pro Thr Pro Ile Phe Thr
145                 150                 155                 160
Pro Ser Thr Lys Ala Glu Gln Gly Glu His Asp Glu Asn Ile Ser Ile
                165                 170                 175
Glu Gln Ala Ala Glu Ile Val Gly Lys Asp Ile Cys Glu Lys Val Ala
            180                 185                 190
Val Lys Ala Val Glu Leu Tyr Ser Ala Ala Lys Asn Phe Ala Leu Leu
        195                 200                 205
Lys Gly Ile Ile Ile Ala Asp Thr Lys Phe Glu Phe Gly Leu Asp Glu
    210                 215                 220
Asn Asn Glu Leu Val Leu Val Asp Glu Val Leu Thr Pro Asp Ser Ser
225                 230                 235                 240
Arg Phe Trp Asn Gln Lys Thr Tyr Gln Val Gly Lys Ser Gln Glu Ser
                245                 250                 255
Tyr Asp Lys Gln Phe Leu Arg Asp Trp Leu Thr Ala Asn Gly Leu Asn
            260                 265                 270
Gly Lys Glu Gly Val Ala Met Asp Ala Glu Ile Ala Ile Lys Ser Lys
        275                 280                 285
Glu Lys Tyr Ile Glu Ala Tyr Glu Ala Ile Thr Gly Lys Lys Trp Ala
    290                 295                 300
 
<210>58
<211>1016
<212>DNA
<213>人工序列
 
<220>
<223>用于敲除的ADE 2 5’seq
 
<400>58
agttgggccc ttaaaatcat ctgcctcacc ccaccgacca atgggaattc tagaaacaat 60
ttcattgctc ttcttctcgt taccataaga atcggctgtc atgtttgact taacgaaccc 120
tggaacaagg gaattcacgg taataccttt tggagcaagt tcaaccgata gagccttcat 180
taatgagttg attgcacctt tggtggtcgc atataccgat tgattcgggt aggtcacttc 240
gaaactgtac agggaggcag taaagatgat cctaccctta atctggttct taataaagtg 300
tttagtgact agctgtgtca atctaaatgg aaaatcgaca tttacctttt ggatagccgc 360
gtaatctttc tccgtaaaac ttgtaaactc agatttaatg gcaatggcag cgttgttgat 420
taaaatgtca atctttccag tggaactctt ctccaccgca ggactcgtta cggtctcttc 480
cagctttgca agatcggcat ccactagatc caactcaatt gtatgtatgg aggcaccatc 540
ggcatttgac attctcacct cttcaatgaa agccgttggg tctgtagaag gtctatggat 600
aagaataagt tctgcacctg cttcataaag tcctcgaact attccttggc ctaatccgct 660
ggtaccaccg gtgatcaagg cgaccttacc attcaaagaa aacaaatcag cggacattag 720
cgacttgaat agggaatggg ttagacaaat gaaagccgac gagccagcac tttatagtaa 780
gtgcaggtga gtcaataaga ataaatgtat ggcttgctgt ccctatcgcg taagaagctt 840
actaagatcg cctaaattga aaagttgaac aaatcagttc tagctggcct ccatcagcat 900
ttcgttctcc tctgatcatc tttgccaatc gctagcatgc cctcagcgtg caaggaaaag 960
cacgcttctt tcttatcgac gtattttcaa ctatggcaga gccaggttag caagtc    1016
 
<210>59
<211>1676
<212>DNA
<213>人工序列
 
<220>
<223>用于敲除的ADE 2 3’seq
<400>59
atttagtatt gttttttaat agatgtatat ataatagtac acgtaactta tctattccat 60
tcataatttt attttaaagg ttcggtagaa atttgtcctc caaaaagttg gttagagcct 120
ggcagttttg ataggcatta ttatagattg ggtaatattt accctgcacc tggaggaact 180
ttgcaaagag cctcatgtgc tctaaaagga tgtcagaatt ccaacatttc aaaattatat 240
ctgcatgcgt ctgtaatact ggaactgtta tttttctggt caggatttca ccgctcttgt 300
cgtcatgttt ctcgtcgtct gaaagtaaac tgactttcct ctttccataa acacaaaaat 360
cgattgcaac ttggttattc ttgagattga aatttgctgt gtcttcagtg cttagctgaa 420
tatcaacaaa cttacttagt actaataacg aagcactatg gtaagtggca taacatagtg 480
gtattgaagc gaacagtgga tattgaaccc aagcattggc aacatctggc tctgttgata 540
ctgatccgga tcgtttggca ccaattcctg aaacggcgta gtgccaccaa ggtttcgatt 600
tgagaacagg ttcatcatca gagtcaacca ccccaatgtc aatggcaggc tccaacgaag 660
taggtccaac aacaacagga agtatttgac cttgaagatc tgttccttta tgatccacca 720
caccttgccc caattccaat aactttacca gtcccgatgc agacatgata actggtacta 780
atgatctcca ttgattttcg tcggcactac gtaaagcctc caaaaatgaa ttcagaatat 840
cttctgaaac tagattctgc ttctgtgatt caagcattgc tttatgtaga catctcttga 900
ataaaagcaa ttctccacat attggtgtgt gtaagataga tctggaaaga tgtatctgga 960
atagtccagt caacgttgtg caattgatta gcattacctt actgtgaaca tctctatcta 1020
caacaacaga ctcaattcga tagacgttcc gggaaagttt ttcaagcgca ttcagtttgc 1080
tgttgaacaa agtgactttg ctttccaatg tgcaaatacc cctgtatatc aagtccatca 1140
catcactcaa gaccttggtg gaaaagaatg aaacagctgg agcataattt tcgaatgaat 1200
taggtaaggt cacttcatcc ttatctgttg taatgctata atcaatagcg gaactaacat 1260
cttcccatgt aacaggtttc ttgatctctg aatctgaatc tttatttgaa aaagaattga 1320
aaaaagactc atcactcatt gggaattcaa ggtcattagg gtattccatt gttagttctg 1380
gtctaggttt aaagggatca ccttcgttaa gacgatggaa aatagctaat ctgtacaata 1440
accagatact tctaacgaag ctctctctat ccatcagttg acgtgttgag gatatctgaa 1500
ctagctcttt ccactgcgaa tcaggcatgc tcgtatagct ggcaagcatg ttattcagct 1560
ttaccaagtt agaagccctt tggaaaccat ctatagattc ccgaaaaaac ttatacccac 1620
tgagggtttc actgagcata gtcagtgaca tcaaagagca tttcaaatcc atctca     1676
 
<210>60
<211>2018
<212>DNA
<213>巴斯德毕赤酵母
 
<400>60
gtcaaagccg tatactcggt agtgtgctcg ccaaaaataa atttgacttg actcttcact 60
agcctatgca aataaggtta ccttttccaa gaatcgtaga aacgattaaa aaacttccaa 120
actctcatgg attctcaggt aataggtatt ctaggaggag gccagctagg ccgaatgatt 180
gttgaggccg ctagcaggct caatatcaag accgtgattc ttgatgatgg tttttcacct 240
gctaagcaca ttaatgctgc gcaagaccac atcgacggat cattcaaaga tgaggaggct 300
atcgccaagt tagctgccaa atgtgatgtt ctcactgtag agattgagca tgtcaacaca 360
gatgctctaa agagagttca agacagaact ggaatcaaga tatatccttt accagagaca 420
atcgaactaa tcaaggataa gtacttgcaa aaggaacatt tgatcaagca caacatttcg 480
gtgacaaagt ctcagggtat agaatctaat gaaaaggcgc tgcttttgtt tggagaagag 540
aatggatttc catatctgtt gaagtcccgg actatggctt atgatggaag aggcaatttt 600
gtagtggagt ctaaagagga catcagtaag gcattagaat tcttgaaaga tcgtccattg 660
tatgccgaga agtttgctcc ttttgttaaa gaattagcgg taatggttgt gagatcactg 720
gaaggcgaag tattctccta cccaaccgta gaaactgtgc acaaggacaa tatctgtcat 780
attgtgtatg ctccggccag agttaatgac accatccaaa agaaagctca aatattagct 840
gaaaacactg tgaagacttt cccaggcgct ggaatcttcg gagttgagat gttcctattg 900
tctgatggag aacttcttgt aaatgagatt gctccaaggc cccacaattc tggtcactat 960
acaatcgatg catgtgtaac atctcagttc gaagcacatg taagagccat aactggtctg 1020
ccaatgccac tagatttcac caaactatct acttccaaca ccaacgctat tatgctcaat 1080
gttttgggtg ctgaaaaatc tcacggggaa ttagagtttt gtagaagagc cttagaaaca 1140
cccggtgctt ctgtatatct gtacggaaag accacccgat tggctcgtaa gatgggtcat 1200
atcaacataa taggatcttc catgttggaa gcagaacaaa agttagagta cattctagaa 1260
gaatcaaccc acttaccatc cagtactgta tcagctgaca ctaaaccgtt ggttggagtt 1320
atcatgggtt cagactctga tctacctgtg atttcgaaag gttgcgatat tttaaaacag 1380
tttggtgttc cattcgaagt tactattgtc tctgctcata gaacaccaca gagaatgacc 1440
agatatgcct ttgaagccgc tagtagaggt atcaaggcta tcattgcagg tgctggtggt 1500
gctgctcatc ttccaggaat ggttgctgcc atgactccgt tgccagtcat tggtgttcct 1560
gtcaagggct ctacgttgga tggtgtagac tcgctacact cgattgtcca aatgcctaga 1620
ggtgttcctg tggctacggt tgctatcaac aacgccacca atgccgctct gttggccatc 1680
aggattttag gtacaattga ccacaaatgg caaaaggaaa tgtccaagta tatgaatgca 1740
atggagaccg aagtgttggg gaaggcatcc aacttggaat ctgaagggta tgaatcctat 1800
ttgaagaatc gtctttgaat ttagtattgt tttttaatag atgtatatat aatagtacac 1860
gtaacttatc tattccattc ataattttat tttaaaggtt cggtagaaat ttgtcctcca 1920
aaaagttggt tagagcctgg cagttttgat aggcattatt atagattggg taatatttac 1980
cctgcacctg gaggaacttt gcaaagagcc tcatgtgc                         2018
 
<210>61
<211>563
<212>PRT
<213>巴斯德毕赤酵母
 
<400>61
Met Asp Ser Gln Val Ile Gly Ile Leu Gly Gly Gly Gln Leu Gly Arg
 1               5                  10                  15
Met Ile Val Glu Ala Ala Ser Arg Leu Asn Ile Lys Thr Val Ile Leu
            20                  25                  30
Asp Asp Gly Phe Ser Pro Ala Lys His Ile Asn Ala Ala Gln Asp His
        35                  40                  45
Ile Asp Gly Ser Phe Lys Asp Glu Glu Ala Ile Ala Lys Leu Ala Ala
    50                  55                  60
Lys Cys Asp Val Leu Thr Val Glu Ile Glu His Val Asn Thr Asp Ala
65                  70                  75                  80
Leu Lys Arg Val Gln Asp Arg Thr Gly Ile Lys Ile Tyr Pro Leu Pro
                85                  90                  95
Glu Thr Ile Glu Leu Ile Lys Asp Lys Tyr Leu Gln Lys Glu His Leu
            100                 105                 110
Ile Lys His Asn Ile Ser Val Thr Lys Ser Gln Gly Ile Glu Ser Asn
        115                 120                 125
Glu Lys Ala Leu Leu Leu Phe Gly Glu Glu Asn Gly Phe Pro Tyr Leu
    130                 135                 140
Leu Lys Ser Arg Thr Met Ala Tyr Asp Gly Arg Gly Asn Phe Val Val
145                 150                 155                 160
Glu Ser Lys Glu Asp Ile Ser Lys Ala Leu Glu Phe Leu Lys Asp Arg
                165                 170                 175
Pro Leu Tyr Ala Glu Lys Phe Ala Pro Phe Val Lys Glu Leu Ala Val
            180                 185                 190
Met Val Val Arg Ser Leu Glu Gly Glu Val Phe Ser Tyr Pro Thr Val
        195                 200                 205
Glu Thr Val His Lys Asp Asn Ile Cys His Ile Val Tyr Ala Pro Ala
    210                 215                 220
Arg Val Asn Asp Thr Ile Gln Lys Lys Ala Gln Ile Leu Ala Glu Asn
225                 230                 235                 240
Thr Val Lys Thr Phe Pro Gly Ala Gly Ile Phe Gly Val Glu Met Phe
                245                 250                 255
Leu Leu Ser Asp Gly Glu Leu Leu Val Asn Glu Ile Ala Pro Arg Pro
            260                 265                 270
His Asn Ser Gly His Tyr Thr Ile Asp Ala Cys Val Thr Ser Gln Phe
        275                 280                 285
Glu Ala His Val Arg Ala Ile Thr Gly Leu Pro Met Pro Leu Asp Phe
    290                 295                 300
Thr Lys Leu Ser Thr Ser Asn Thr Asn Ala Ile Met Leu Asn Val Leu
305                 310                 315                 320
Gly Ala Glu Lys Ser His Gly Glu Leu Glu Phe Cys Arg Arg Ala Leu
                325                 330                 335
Glu Thr Pro Gly Ala Ser Val Tyr Leu Tyr Gly Lys Thr Thr Arg Leu
            340                 345                 350
Ala Arg Lys Met Gly His Ile Asn Ile Ile Gly Ser Ser Met Leu Glu
        355                 360                 365
Ala Glu Gln Lys Leu Glu Tyr Ile Leu Glu Glu Ser Thr His Leu Pro
    370                 375                 380
Ser Ser Thr Val Ser Ala Asp Thr Lys Pro Leu Val Gly Val Ile Met
385                 390                 395                 400
Gly Ser Asp Ser Asp Leu Pro Val Ile Ser Lys Gly Cys Asp Ile Leu
                405                 410                 415
Lys Gln Phe Gly Val Pro Phe Glu Val Thr Ile Val Ser Ala His Arg
            420                 425                 430
Thr Pro Gln Arg Met Thr Arg Tyr Ala Phe Glu Ala Ala Ser Arg Gly
        435                 440                 445
Ile Lys Ala Ile Ile Ala Gly Ala Gly Gly Ala Ala His Leu Pro Gly
    450                 455                 460
Met Val Ala Ala Met Thr Pro Leu Pro Val Ile Gly Val Pro Val Lys
465                 470                 475                 480
Gly Ser Thr Leu Asp Gly Val Asp Ser Leu His Ser Ile Val Gln Met
                485                 490                 495
Pro Arg Gly Val Pro Val Ala Thr Val Ala Ile Asn Asn Ala Thr Asn
            500                 505                 510
Ala Ala Leu Leu Ala Ile Arg Ile Leu Gly Thr Ile Asp His Lys Trp
        515                 520                 525
Gln Lys Glu Met Ser Lys Tyr Met Asn Ala Met Glu Thr Glu Val Leu
    530                 535                 540
Gly Lys Ala Ser Asn Leu Glu Ser Glu Gly Tyr Glu Ser Tyr Leu Lys
545                 550                 555                 560
Asn Arg Leu
 
<210>62
<211>571
<212>PRT
<213>酿酒酵母
 
<400>62
Met Asp Ser Arg Thr Val Gly Ile Leu Gly Gly Gly Gln Leu Gly Arg
 1               5                  10                  15
Met Ile Val Glu Ala Ala Asn Arg Leu Asn Ile Lys Thr Val Ile Leu
            20                  25                  30
Asp Ala Glu Asn Ser Pro Ala Lys Gln Ile Ser Asn Ser Asn Asp His
        35                  40                  45
Val Asn Gly Ser Phe Ser Asn Pro Leu Asp Ile Glu Lys Leu Ala Glu
    50                  55                  60
Lys Cys Asp Val Leu Thr Ile Glu Ile Glu His Val Asp Val Pro Thr
65                  70                  75                  80
Leu Lys Asn Leu Gln Val Lys His Pro Lys Leu Lys Ile Tyr Pro Ser
                85                  90                  95
Pro Glu Thr Ile Arg Leu Ile Gln Asp Lys Tyr Ile Gln Lys Glu His
            100                 105                 110
Leu Ile Lys Asn Gly Ile Ala Val Thr Gln Ser Val Pro Val Glu Gln
        115                 120                 125
Ala Ser Glu Thr Ser Leu Leu Asn Val Gly Arg Asp Leu Gly Phe Pro
    130                 135                 140
Phe Val Leu Lys Ser Arg Thr Leu Ala Tyr Asp Gly Arg Gly Asn Phe
145                 150                 155                 160
Val Val Lys Asn Lys Glu Met Ile Pro Glu Ala Leu Glu Val Leu Lys
                165                 170                 175
Asp Arg Pro Leu Tyr Ala Glu Lys Trp Ala Pro Phe Thr Lys Glu Leu
            180                 185                 190
Ala Val Met Ile Val Arg Ser Val Asn Gly Leu Val Phe Ser Tyr Pro
        195                 200                 205
Ile Val Glu Thr Ile His Lys Asp Asn Ile Cys Asp Leu Cys Tyr Ala
    210                 215                 220
Pro Ala Arg Val Pro Asp Ser Val Gln Leu Lys Ala Lys Leu Leu Ala
225                 230                 235                 240
Glu Asn Ala Ile Lys Ser Phe Pro Gly Cys Gly Ile Phe Gly Val Glu
                245                 250                 255
Met Phe Tyr Leu Glu Thr Gly Glu Leu Leu Ile Asn Glu Ile Ala Pro
            260                 265                 270
Arg Pro His Asn Ser Gly His Tyr Thr Ile Asp Ala Cys Val Thr Ser
        275                 280                 285
Gln Phe Glu Ala His Leu Arg Ser Ile Leu Asp Leu Pro Met Pro Lys
    290                 295                 300
Asn Phe Thr Ser Phe Ser Thr Ile Thr Thr Asn Ala Ile Met Leu Asn
305                 310                 315                 320
Val Leu Gly Asp Lys His Thr Lys Asp Lys Glu Leu Glu Thr Cys Glu
                325                 330                 335
Arg Ala Leu Ala Thr Pro Gly Ser Ser Val Tyr Leu Tyr Gly Lys Glu
            340                 345                 350
Ser Arg Pro Asn Arg Lys Val Gly His Ile Asn Ile Ile Ala Ser Ser
        355                 360                 365
Met Ala Glu Cys Glu Gln Arg Leu Asn Tyr Ile Thr Gly Arg Thr Asp
    370                 375                 380
Ile Pro Ile Lys Ile Ser Val Ala Gln Lys Leu Asp Leu Glu Ala Met
385                 390                 395                 400
Val Lys Pro Leu Val Gly Ile Ile Met Gly Ser Asp Ser Asp Leu Pro
                405                 410                 415
Val Met Ser Ala Ala Cys Ala Val Leu Lys Asp Phe Gly Val Pro Phe
            420                 425                 430
Glu Val Thr Ile Val Ser Ala His Arg Thr Pro His Arg Met Ser Ala
        435                 440                 445
Tyr Ala Ile Ser Ala Ser Lys Arg Gly Ile Lys Thr Ile Ile Ala Gly
    450                 455                 460
Ala Gly Gly Ala Ala His Leu Pro Gly Met Val Ala Ala Met Thr Pro
465                 470                 475                 480
Leu Pro Val Ile Gly Val Pro Val Lys Gly Ser Cys Leu Asp Gly Val
                485                 490                 495
Asp Ser Leu His Ser Ile Val Gln Met Pro Arg Gly Val Pro Val Ala
            500                 505                 510
Thr Val Ala Ile Asn Asn Ser Thr Asn Ala Ala Leu Leu Ala Val Arg
        515                 520                 525
Leu Leu Gly Ala Tyr Asp Ser Ser Tyr Thr Thr Lys Met Glu Gln Phe
    530                 535                 540
Leu Leu Lys Gln Glu Glu Glu Val Leu Val Lys Ala Gln Lys Leu Glu
545                 550                 555                 560
Thr Val Gly Tyr Glu Ala Tyr Leu Glu Asn Lys
                565                 570
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈