首页 / 专利库 / 农用化学品和农药 / 杀菌剂 / 抗真菌多肽 / 丝状真菌宿主领域的转化系统

丝状真菌宿主领域的转化系统

阅读:189发布:2021-04-14

专利汇可以提供丝状真菌宿主领域的转化系统专利检索,专利查询,专利分析的服务。并且本 发明 描述了用于表达和分泌异源蛋白或多肽的丝状 真菌 宿主领域的一种新的转化系统。本发明也包括以一种非常经济的方式大量制备多肽或蛋白的方法。本发明的系统包括金孢子菌属,特别是Chrysosporium lucknowense的转化的或 转染 的真菌菌株和其突变体或衍 生物 。本发明也包括含有金孢子菌属真菌编码序列以及金孢子菌属真菌基因表达调节序列的转化体。,下面是丝状真菌宿主领域的转化系统专利的具体信息内容。

1.一种含有编码感兴趣多肽的核酸序列的金孢子菌属突变株, 所述的核酸序列与一表达调控区和任选地一分泌信号序列可操作连 接,所述的突变株在同等条件下表达所述的感兴趣多肽的平高于 非突变株的表达水平。
2.如权利要求1的金孢子菌属突变株,所述的突变株通过重组 方法而获得,所述重组方法包括稳定引入选自编码异源多肽的核酸 序列、异源信号序列和异源表达调控序列的至少一种异源核酸序列。
3.如权利要求2的金孢子菌属突变株,其中所述的感兴趣多肽 是植物、动物(包括人)、藻类、细菌、古细菌或真菌起源的异源多 肽。
4.如权利要求1或2的金孢子菌属突变株,其中所述的感兴趣 多肽是在同等条件下表达水平比相应的非突变株高的同源多肽。
5.如权利要求1至4任一项的金孢子菌属突变株,其中所述的 感兴趣多肽选自水化合物降解酶、蛋白酶、脂酶、酯酶、其它水 解酶、化还原酶和转移酶。
6.如权利要求1至4任一项的金孢子菌属突变株,其中所述的 感兴趣多肽选自允许初级代谢物包括有机酸和次级代谢物包括抗生 素(过量)产生的真菌酶。
7.如权利要求1至6任一项的金孢子菌属突变株,其中所述的 感兴趣多肽在pH低于5,特别是在pH低于6时是失活的。
8.如权利要求1至7任一项的金孢子菌属突变株,其中所述的 感兴趣多肽在pH高于6时显示其最佳活性和/或稳定性,和/或在pH 高于6时具有至少70%的活性和/或稳定性。
9.如权利要求1至8任一项的金孢子菌属突变株,含有一异源 信号序列,优选为真菌如子囊菌的信号序列。
10.如权利要求9的金孢子菌属突变株,其中真菌信号序列是纤 维素酶、β-半乳糖苷酶、木聚糖酶、果胶酶、酯酶、蛋白酶、淀粉 酶、多聚半乳糖酸酶、或疏水蛋白的信号序列。
11.如前述任一项权利要求的金孢子菌属突变株,进一步含有一 个选择标记,例如赋予抗药性或解除营养缺陷的标记。
12.如前述任一项权利要求的金孢子菌属突变株,包含一异源 表达调控区,优选真菌的异源表达调控序列。
13.如权利要求12的金孢子菌属突变株,其中表达调控区包含 一个诱导型启动子。
14.如权利要求12或13的金孢子菌属突变株,其中表达调控区 包含一个高表达的启动子。
15.如权利要求1的金孢子菌属突变株,所述的突变株是通过包 括紫外线照射和化学诱变中的至少一种的诱变步骤获得的,优选包 含一个首次紫外线照射步骤,一个N-甲基-N’-硝基-N-亚硝基胍处 理步骤和一个二次紫外线照射步骤。
16.如前述任一项权利要求的金孢子菌属突变株,所述的突变 株来自Chrysosporium lucknowense,特别是来自Clucknowense C1 菌株(VKM F-3500 D)。
17.如权利要求16的金孢子菌属突变株,所述的突变株对应于 或来自Chrysosporium lucknowense突变株UV13-6(VKM F-3632 D)、 NG7C-19(VKM F-3633 D)和UV18-25(VKM F-3631 D)之一。
18.如前述任一项权利要求的金孢子菌属突变株,所述的菌株 生物量少于T.reesei生物量的一半,所述的木霉在同等的最佳条件 下培养时其粘度值为200-600厘泊。
19.如前述任一项权利要求的金孢子菌属突变株,所述的菌株 所产生的纤维素酶的量至少等同于由Chrysosporium lucknowense突 变株C1(VKMF-3500D)、UV13-6(VKMF-3632D)、NG7C-19(VKM F-3633 D)和UV18-25(VKM F-3631 D)的任何之一所产生的纤维 素酶的量。
20.如前述任一项权利要求的金孢子菌属突变株,所述的菌株 所产生的蛋白酶少于由Chrysosporium lucknowense菌株C1(VKM F-3500 D)所产生的蛋白酶,优选少于所述C1菌株所产生的蛋白酶 数量的一半。
21.一种核酸构建体,包含与一编码多肽的核酸序列可操作连 接的来自金孢子菌属真菌,优选来自Chrysosporium lucknowense, 更优选来自Chrysosporium lucknowense C1(VKM F-3500 D)或 UV18-25(VKM F-3631 D)的核酸表达调控区。
22.如权利要求21的核酸构建体,所述的表达调控区包括一个 与纤维素酶表达或木聚糖酶表达有关的启动子序列,优选一个纤维 二糖水解酶(CBH1)启动子序列。
23.重组微生物菌株,优选真菌菌株,其含有权利要求21或22 的核酸构建体并且能够表达由该编码核酸序列编码的多肽。
24.一种生产感兴趣多肽的方法,所述的方法包括在允许蛋白 或多肽表达和优选地分泌的条件下培养权利要求1-20和23-24任一 项的菌株,并回收随后产生的感兴趣多肽。
25.如权利要求24的方法,进一步包括将所述的多肽前体裂解 为多肽或感兴趣前体的裂解步骤,优选用Kex-2样蛋白酶,任何基酸成对的蛋白酶或Kex-2裂解。
26.如权利要求24或25的方法,其中在pH6-9和/或温度25-43 ℃的范围内培养。
27.一种用于产生权利要求1-20任一项的金孢子菌属突变株的 方法,包括向金孢子菌属真菌稳定引入编码异源或同源多肽的核酸 序列,所述的核酸序列与一表达调控区可操作连接,所述的引入以 转化丝状真菌的公知方式引入。
28.如权利要求27的方法,其中转化方法是原生质体转化方法。
29.木聚糖酶F家族的金孢子菌属木聚糖酶,其等电点为9.1, SDS PAGE分子量为30kD,并且与SEQ ID NO.5中所列出的氨基酸 序列在一段120个氨基酸的序列上具有至少75%的氨基酸相同性。

说明书全文

发明涉及一种用于表达和分泌异源蛋白或多肽的丝状真菌宿 主领域的新的转化系统。本发明也包括以一种非常经济的方式大量 制备多肽或蛋白的方法。本发明的系统包括金孢子菌属,特别是 Chrysporium lucknowense的转化的或转染的真菌菌株和其突变体 或衍生物。本发明也包括含有金孢子菌属真菌编码序列的转化体。 还公开了新的突变金孢子菌属菌株以及由其衍生的新的酶。

本发明背景

现有技术已经公开了许多用于基因表达的宿主和转化方法。经 常提到细菌如大肠杆菌。但是大肠杆菌不能分泌许多种蛋白质或多 肽,因此要在工业平上生产蛋白质和多肽它是一种的不合需要的 宿主细胞。大肠杆菌的另外一个同样适用于普通细菌的缺点是原核 生物不能提供对于众多所生成的真核蛋白质或多肽活性形式所必需 的另外的修饰。确保产生活性形式的蛋白或多肽必需的加工有如蛋 白质的糖基化和蛋白质的正确折叠。为确保这样的加工人们有时也 可以使用哺乳动物细胞;但是,这些细胞的不利之处在于细胞很难 维持并且培养基非常昂贵。因此要在工业水平上生产蛋白质或多肽 这样的转化系统是不合实际的。它们可被有效用于生产需求量相对 较低但价格昂贵的药物化合物,但当然不能用于工业上生产酶。

已经发展了许多真菌表达系统,如黑曲霉、泡盛曲霉、构巢曲 霉、T.reesei等。此外也提出了一些其它的真菌表达系统,但由于各 种不同的原因位被广泛接受或使用。一般而言,理想的宿主必须符 合以下标准的大部分:

—理想的宿主必须易于发酵并且使用价格低廉的培养基。

—理想的宿主必须有效使用培养基。

—理想的宿主必须高产量地生产蛋白质或多肽,即必须表现出 高的蛋白质/生物量比。

—理想的宿主应该能够有效分泌蛋白质或多肽。

—理想的宿主必须保证所需要的蛋白质或多肽易于分离和纯 化。

—理想的宿主必须对所需要的蛋白质或多肽进行加工,以使它 们以不需要另外活化或修饰步骤的活性形式被生产出来。

—理想的宿主应该易于被转化。

—理想的宿主应该使用广泛范围的表达调控因子从而确保易于 运用和多功能性。

—理想的宿主应该使用易于选择并且用起来很便宜的标记。

—理想的宿主应该产生稳定的转化体。

—理想的宿主应该允许在对所表达出的蛋白质或多肽无害的条 件下培养,如低粘性、低剪切等。

Berka等人在美国专利5578463中提出的但至今仍未被广泛使用 的真菌系统有链孢霉属、柄孢壳属、内座壳属、毛霉菌属、旋孢腔 菌属和梨孢霉属以及曲霉属和木霉属。但是只有曲霉属和木霉属提 供了转化和表达的例证,其它一些被提出的宿主未提供任何详细资 料。

WO 96/02563以及Novo Nordisk的美国专利5602004、5604129 和5695985叙述了曲霉属和木霉属真菌系统的缺陷,并且提出其它 真菌的培养条件或许会更适于大规模生产蛋白质。任何一种转化的 培养唯一的例子是嗜热毁丝霉、阿拉巴支顶孢、土生梭孢霉和 cellulophilum侧孢霉。据报道侧孢霉属菌株在对其它菌株不造成同 样结果的发酵条件下裂解并且产生绿色素。也描述了土生梭孢霉的 一种由于形态学而被选择的不形成孢子的突变体。但是也表明梭孢 霉属和支顶孢属(由此所使用的支顶孢属菌株是所使用的梭孢霉属 菌株的未完成体)的原生质体效率很低并且潮霉素不是一种有用的 选择标记。许多其它真菌也凭借其形态而被认为是潜在有用的但未 叙述它们的转化情况。这些真菌菌株是Corynascus、嗜热子囊菌属、 毛壳属、节霉属、柱顶孢霉和Talaromyces。转化的宿主因为所引入 的Humicola木聚糖酶产量很低而被提及,梭孢霉属的产量最低;但 是,这些信息不很明确并且实际上能够推断梭孢霉属是最佳的实施 方案。对这些参考菌株的命名是基于1994年ATCC对工业真菌命名 的基础之上的。因而很明显未能获得高程度的异源表达并且实际上 在假定的形态学和表达程度之间不存在正相关。根据1996年的ATCC 真菌分类,嗜热侧孢霉ATCC 20493是一种嗜热毁丝霉菌株。现在 这个菌株仍然被鉴定为嗜热毁丝霉。从这些最近的说明中可以看出 本技术领域的不可预知性是明显的。

通过使用醋酸锂方法和Humicola酶编码序列,Allison等人(现 代遗传学21:225-229,1992)也叙述了对Humicola grisea突变体 thermoidae的转化,但未提供这一菌株表达异源蛋白的报道。

1997年,夏威夷生物技术研究小组被授予了一项用转化的链孢 霉属真菌表达哺乳动物肽如凝乳酶的专利。营养缺陷的粗糙脉孢霉 的转化是和原生质体一起发生的。引入内源性的转录调控区并实施 共转化。并未提供其它宿主和其它转化方案。关于表达水平此说明 并不明确。由于免疫学技术(用于检测少量蛋白质)是所使用的证 明蛋白质存在的唯一技术,表达水平是否高是难以预料的。并未透 漏是否在事实上分离出了此种蛋白质。

Novo Nordisk的专利WO 97/26330提出了一种获得用于生产异 源多肽的具有改进特征的丝状真菌亲本细胞突变体的方法。此方法 包含首先发现一个特定的形态学改变,然后评价转化体是否比亲本 菌株生产出更多的异源多肽。仅就链孢属A3/5菌株和米曲霉举例说 明了此方法。此方法可适用于曲霉、木霉、梭孢霉、镰孢霉、链孢 霉、支顶孢属、Tolyplocadium、Humicola、柱顶孢属、毁丝霉属或 毛霉属的真菌。如上所述,由于本技术领域的不可预知性以及所引 用的方法的不可预知性,并未提出一种带有合理的成功预期的普遍 适用的方法。

本发明的详细描述

我们现在叙述了仅仅使用上面提及的曲霉和木霉就可满足上面 要求的另外的真菌表达系统。在本领域尚未提出或教授此新的表达 系统。与经常使用的T.reesei系统相比,本发明的新系统具有转化 率较高的额外优点。此外,培养条件有利于所表达的多肽。在本详 细说明及附录的权利要求中“多肽”或“感兴趣的多肽”是指本发 明表达系统的产物,此术语也包括蛋白质,即具有特定功能和/或二 级结构和/或三级结构的多肽。

培养基的酸度可以是中性或碱性的,这样所产生的蛋白质或 多肽就不再经受侵害性的和可能导致失活的酸性pH。当产生的蛋白 质或多肽更适于酸性环境时,也可能在酸性pH例如pH4中培养。 适于培养的pH范围是4.0—10.0之间。但是,当宿主菌株在中性或 碱性的pH范围内生长较好时,则有限考虑此pH范围,例如pH6 到pH9。在某些情况下,在pH8以上甚至是pH10的碱性环境下生 长也是一种好的选择。同样,这些宿主菌株的培养温度对于某些类 型的所产生的多肽的稳定性也是有利的。合适的培养温度在25—43 ℃之间。有利的适用温度范围是从40℃到23或30℃。很明显,对 于生产哺乳动物多肽来说这样的条件是尤其让人感兴趣的。所选择 的温度取决于培养的成本效率和多肽或培养菌株的密度。这些条件 将由本领域熟练技术人员决定。

也已经确定生物量与粘性之间的关系并且所产生的蛋白量对于 本发明宿主也是非常有利的。已经将Trichoderma longibrachiatum(以 前认为是T.reesei)和黑曲霉进行了比较。在它们各自优化条件下, Trichoderma longibrachiatum的生物量是2.5—5克/升,黑曲霉的生物 量是5—10克/升并且根据本发明宿主的生物量是0.5—1克/升,因 此,商业上所用的菌株的生物量提高了5—10倍。这些商业菌株在 本领域中本身就被认为是高蛋白产量的并且它们已经被成功用于商 业生产蛋白质。它们已经被在各自最佳条件下培养、发展并且成功 地进行了大规模商业发酵。相同的菌株被用于举例说明本发明宿主 培养物粘度值的极大改进,在发酵过程的末尾阶段Trichoderma longibrachiatum的粘度值为200—600cP(厘泊),黑曲霉的粘度值为 1500—2000cP,而本发明宿主的粘度值低达10cP。因此本发明宿主 提供了比商业菌株的粘度值至少改进了20—200倍。另外一个非常 令人惊奇的特点是本发明的宿主细胞的蛋白水平要比商业菌株曲霉 和T.reesei高得多,即使它们具有上面所提到的令人惊奇的低生物 量和粘度值。总之,本发明引入了一个培养条件改进了的、易于使 用的、多用途的改良的转化系统和表达系统。本发明的菌株在改进 的条件下令人惊奇地高水平生产蛋白质,并且它们的发酵时间更短。

本发明涉及包含一段编码异源蛋白或多肽的核酸序列的金孢子 菌突变株,上述的核酸片段与表达调控区连接并且任选地与编码分 泌信号的序列和/或编码载体蛋白的序列可操作连接。本发明优选的 重组菌株将分泌感兴趣的多肽。这就避免了为分离感兴趣的多肽而 破碎细胞的必要,并且降低了宿主细胞其它组分降解表达产物的危 险性。

可根据由Burgess出版公司1972年出版的Barnett和Hunter所 著的《举例说明的缺陷真菌属》(第三版)一书中的形态学知识对金 孢子菌属真菌进行准确地描述。其它提供关于金孢子菌属真菌分类 的详细资料的来源有例如Sutton分类法(Van Oorschot,C.A.N(1980) “金孢子菌属及相关属的修订版”,荷兰Baam CBS的真菌学研究 第20期1—36页)。CBS是布达佩斯条约的菌种保藏机构之一。根 据这些教科书,金孢子菌属真菌是属于丝孢目丛梗孢科的一种。所 用的标准如下:

1.丝孢目的迹象

分生孢子直接产生在菌丝体、单独的造孢细胞和不同的分生孢 子梗上。

2.丛梗孢科的迹象

分生孢子和分生孢子梗(如果有的话)都是无色透明的或亮色 的;分生孢子梗是单个的或松散成簇。

3.金孢子Corda1833属的迹象

菌落呈扩散状生长,白色,有时呈奶油色、淡褐色或黄色;毡 状或粉末状。菌丝通常是无色透明和表面光滑的,不规则,或多或 少带有直生分枝。可繁殖的菌丝显示出很少差别或几乎没有差别。 分生孢子是顶孢子、侧生孢子和产孢孢子,遍布于菌丝之上,无梗 或位于短突或侧枝上,近于无色或淡黄色,薄壁或厚壁,近球形、 棍棒状、梨形或倒卵形,单细胞,很少呈双细胞,以截短形式存在。 有时有居间分生孢子,呈单生,偶尔成串,近于无色或淡黄色,比 支持菌丝要宽,通常是单细胞的,两端截短。偶尔也有厚垣孢子存 在。

另外一个提供真菌命名信息的来源是ATCC(美国),它的网址 是http://www.atcc.org。CBS也有一个提供相关信息的网址 (http://www.cbs.knaw.n1)。位于莫斯科的VKM也是一个提供这些 信息的可靠来源,VKM的网址是 http://www.bdt.org.br.bdt.msdn.vkm/general。另外一个来源是 http://NT.ars-grin.gov/fungaldatabases。所有这些机构都能提供区分金 孢子菌属真菌特征的教导。

根据本发明的定义,已经明确为嗜热毁丝霉的菌株不再属于金 孢子菌属。过去在一些毁丝霉属菌株的命名上一直存在相当大的混 淆。本发明所优选的金孢子菌属菌株是可以明显分辨出的,并且不 会与毁丝霉属、侧孢霉属或Phanerochaete chrysosporium混淆。

下列的菌株被界定为金孢子菌属菌株,但金孢子菌属的定义并 不局限于这些菌株:C.botryoides,C.carmichaelii,C.crassitunicatum, C.europae,C.evolceannui,C.farinicola,C.fastidium,C.filiforme, C.georgiae,C.globiferum,C.globiferum var.articulatum,C.globiferum var.nivenum,C.hirundo,C.hispanicum,C.holmmii,C.indicum,C.inops, C.keratinophilum,C.kreiselii,C.kuzurovianum,C.lignoium,C.lobatum, C.lucknowense,C.lucknowense Grag 27K,C.medium,C.medium var. spissescens,C.mephiticum,C.merdarium,C.merdarium var.roseum, C.minor,C.pannicola,C.parvum,C.parvum var.crescens,C.pilosum, C.pesudomerdarium,C.pyriformis,C.queenslandicum,C.sigleri, C.sulfureum,C.synchronum,C.tropicum,C.undulatum,C.vallenarense, C.vespertilium,C.zonatum。

C.lucknowense构成了金孢子菌属的一个种,由于它天然高产纤 维素酶蛋白(WO 98/15633和相关的美国专利5811381),所以我们 对其尤其感兴趣。Chrysosporium lucknowense的特征如下:

在沙氏葡萄糖琼脂培养基上生长14天后菌落直径达到55毫米, 呈奶油色,毡状蓬松;中心致密并且3到5毫米厚;边缘清晰、规 则并且有伞缘;颜色从淡黄色到奶油色。菌丝是无色透明和表面光 滑的并且薄壁,很少分枝。气生菌丝通常是能育的并且密集分隔, 大约1到3.5毫米宽;水下菌丝是不能育的,大约1到4.5毫米宽, 最薄的菌丝通常被扭曲。分生孢子通常是顶孢子和侧生孢子,大多 数是无梗的或位于短的频繁出现的圆锥形突起上或短侧枝上。分生 孢子是单生的但相互之间靠得很近;在一个菌丝细胞上生有1到4 个分生孢子,近于无色,薄壁或厚壁,大多数近球形,也有棍棒状 和倒卵形的,单细胞,2.5×11×1.5-6毫米大小,带有较宽的基板芽 痕(1-2毫米)。无居间分生孢子,也无厚垣孢子存在。Chrysosporium lucknowense菌株的例子有ATCC44006,CBS251.72,CBS143.77和 CBS272.77等,在WO 98/15633和相关的美国专利5811381中提供 了其它的例子。

从此菌种中分离得到了一株具有更高的产纤维素酶能的菌 株。内部命名为C1菌株,此菌株根据布达佩斯条约于1996年8月 29日保藏于位于莫斯科Bakrushina街8号邮编为113184的俄罗斯 微生物保藏中心,其保藏编号为VKM F-3500D。此菌株被命名为 Chrysosporium lucknowense Garg 27K。C1菌株的特征如下:

铃薯葡萄糖琼脂培养基上生长7天菌落直径达到大约55-66 毫米;乳白色,毡状。中心厚度为2-3毫米厚,边缘清晰,规则并 且有伞缘;菌落颜色从淡色到奶油色;菌丝是无色透明和表面光滑 的,薄壁或厚壁,很少分枝。气生菌丝是能育的,分隔,大约2-3 毫米宽;水下菌丝是不能育的。分生孢子是顶孢子或侧生孢子;无 梗或位于短侧枝上。分生孢子是单生的但相互之间靠得很近;近于 无色,薄壁切光滑,近球形,棍棒状或倒卵形,单细胞,4-10毫米 大小。无厚垣孢子,也无居间分生孢子存在。

在WO 98/15633和相关的美国专利5811381中描述了分离C1 菌株的方法。具有以上形态学特征的菌株被包括在本发明的金孢子 菌属的定义之内。那些来源于金孢子菌属前体菌株包括已经自然诱 变或人工诱变的菌株也在金孢子菌属的范围之内。奔发明尤其包括 那些通过引入诱变,特别是通过组合辐射诱变和化学诱变而获得的 金孢子菌属突变株。

例如C1菌株经紫外线照射产生了UV13-6菌株,UV13-6菌株 进一步经N-甲基-N’-硝基-亚硝基胍的诱变产生了NG7c-19菌株。 NG7c-19菌株经紫外线照射突变导致生成UV18-25菌株。突变过程 中在液体培养基中或培养皿上以及显微镜下培养物的形态学特征变 化很大。随着连续诱变,作为金孢子菌属特征的在培养皿上菌落呈 绒毛状或毡状生长的形态学特征逐渐丧失,最后得到一个扁平的无 光泽的菌落。野生型菌株在某些培养基中产生棕色色素的现象在突 变株中也不是很明显。显著的是UV18-25突变株在液体培养基中的 粘性要比野生型C1菌株和UV13-6和NG7c-19突变株低得多。在 所有菌株都维持金孢子菌属总显微特征的情况下,经连续突变后菌 丝体变窄,并且UV18-25菌株可以明显观察到断裂菌丝。菌丝体断 裂可能是引起UV18-25菌株相关的低粘度的原因。每个诱变步骤之 后菌株形成孢子的能力降低。以上表明金孢子菌属的每一菌株与上 面的形态学定义都有一定的偏差。此外,每一突变步骤之后纤维素 酶和细胞外蛋白的产量增加了,但一些突变导致蛋白酶表达降低。 真菌分类学标准可以从例如CBS、VKMF和ATCC处得到。

现已发现金孢子菌属菌株无性型尤其适于本发明的生产应用。 无性型的代谢使之特别适合于大量表达。由于有性型及无性型的遗 传组成是相同的,有性型也适于应用。无性型与有性型之间的区别 在于一个是无性状态而另一个是有性状态。两种状态显示出在某些 条件下的不同形态学特征。

优选使用本领域已知的一些无毒性的金孢子菌属菌株,这可以 降低大规模生产对环境造成的危害并且简化了生产程序同时节约了 成本。

表达调控区是用于表达的金孢子菌属菌株所识别的一段DNA 序列。它含有一段与编码待表达的多肽的核酸序列可操作连接的启 动子序列。启动子的连接使得待表达序列起始密码子的相对位置可 以表达。密码子序列可以是组成型的或诱导型的。任何能够允许金 孢子菌属菌株多肽表达的表达调控序列或其组合形式均包括在本发 明中。表达调控序列优选是真菌表达调控区例如子囊菌调控区。合 适的真菌表达调控区来自于下列真菌菌属任何之一表达调控区:曲 霉、木霉、金孢子菌属、汉逊酵母、毛霉、毕赤酵母、链孢霉、 Tolyplocadium、根毛霉、镰孢霉、青霉、酵母属、Talaromyces或其 另外的有性形式如裸壳孢属、Hypocrea等,例如来自木霉的纤维二 糖水解酶启动子,来自曲霉的葡糖淀粉酶启动子、甘油磷酸脱氢 酶启动子、醇脱氢酶A和醇脱氢酶R启动子、TAKA淀粉酶启动子, 来自链孢霉的磷酸甘油酸和交叉旁路控制启动子,来自曼赫根毛霉 的天冬酸蛋白激酶启动子、脂酶启动子和来自变灰青霉的β-半乳 糖苷酶启动子。来自与宿主菌株同属的表达调控序列尤其适合,这 是因为它很可能特别适应特定的宿主。因此,优选的表达调控序列 是来自金孢子菌属真菌的表达调控序列。

我们已经发现以极大量表达蛋白质的特别的金孢子菌属真菌菌 株,这些菌株的天然表达调控序列是我们尤其感兴趣的。这些菌株 被内部命名为金孢子菌属C1菌株,UV13-6菌株,NG7C-19菌株 和UV18-25菌株。已经根据布达佩斯条约将它们保藏在莫斯科的俄 罗斯微生物保藏中心(VKM)中。根据布达佩斯条约,野生型C1 菌株的保藏号为VKM F-3500D,保藏日期是1996年8月29日;C1 UV13-6突变株的保藏号为VKM F-3632D,保藏日期是1998年9月 2日;C1 NG7c-19突变株的保藏号为VKM F-3633D,保藏日期是1998 年9月2日;C1 UV18-25突变株的保藏号为VKM F-3631D,保藏 日期是1998年9月2日。

优选应用能在选择的宿主内高表达的表达调控区。这也可以是 一个来自于异源宿主的高表达调控区,如本领域众所周知的。因此 要大量表达的蛋白质和为本发明提供合适的表达调控序列的特定的 例子不仅仅局限于疏水蛋白、蛋白酶、淀粉酶、木聚糖酶、果胶酶、 酯酶、β-半乳糖苷酶、纤维素酶(例如内切葡聚糖酶;纤维二糖水 解酶)和多聚半乳糖醛酸酶。已经明确在固体状态下以及水下发酵 条件下都可以高表达。评价这些蛋白质产生和产量的方法是本领域 所众所周知的,例如Sigma和Megazyme公司的产品目录里有无数 的例子。Megezyme公司位于爱尔兰Wicklow县的Bray商业区内。 Sigma公司在全世界范围内有许多分支机构例如密苏里州圣路易丝 市的14508信箱。对于纤维素酶的分析我们使用商用分析方法如羧 甲基纤维素酶分析法、内粘度计分析法、微晶纤维素酶分析法、β- 葡萄糖酶分析法、RBB羧甲基纤维素酶分析法、Cellazyme C分析 法。另外的方法是本领域熟练技术人员众所周知的并且可以从关于 这个主题的一般文献中查到,这些信息引入本文做参考。我们参考 “酶学方法1995第一卷直至1998第297-299卷”作为例子。为确 保宿主能够很好地识别我们应用了金孢子菌属真菌的启动子序列。

我们已经发现在金孢子菌属真菌中异源表达调控序列像天然的 金孢子菌属真菌序列一样有效地工作。这就允许众所周知的构建物 和载体被用于转化金孢子菌属真菌以及为在这种新的表达和分泌宿 主中构建高表达的载体提供众多其他的可能性。例如可以使用如 Christiansen等在Bio/Technol 6:1419-1422(1998)中所描述的标准 的曲霉转化技术。其它文献例如美国专利4816405,5198345, 5503991,5364770和5578463,EP-B-215.594(也用于木霉)中提 供了曲霉转化载体的详细资料,这些文献以及它们的内容引入本文 做参考。由于已经明确金孢子菌属真菌可以以极高水平表达纤维素 酶,所以这些蛋白的表达调控区是优选的。我们把前面提到的保藏 的金孢子菌属真菌作为特定的例子。

与含有和待表达的多肽可操作连接的核酸表达调控区的金孢子 菌属突变株一样,含有来自金孢子菌属真菌,优选来自Chrysosporium lucknowense的核酸表达调控区或其衍生物的核酸构建体组成了本发 明的一个单独的实施方案。这样的合适的核酸构建体是与纤维素酶 或木聚糖酶表达,优选与纤维二糖水解酶,特别是55kD纤维二糖 水解酶表达有关的金孢子菌属真菌的表达调控区。作为实施例提供 了金孢子菌属真菌25kDa(C1-EG5)内切葡聚糖酶和43kDa(C1- EG6)内切葡聚糖酶的启动子序列,其中分子量是根据SDS-PAGE 电泳确定的(根据氨基酸序列数据分子量为21.9-39.5kDa)。因此, 金孢子菌属真菌的疏水蛋白、蛋白酶、淀粉酶、木聚糖酶、酯酶、 果胶酶、β-半乳糖苷酶、纤维素酶(例如内切葡聚糖酶;纤维二糖 水解酶)和多聚半乳糖醛酸酶的启动子序列也被认为在本发明的范 围之内。在表A或B中任何一种酶表达的启动子或调控区都适于应 用。本发明的核酸序列可从本发明的金孢子菌属真菌中得到。确定 启动子序列的方式有很多种,并且是本领域众所周知的。在相关基 因ATG起始密码子上游区进行核酸缺失实验可以提供这样的序列。 例如分析一致序列也可以发现感兴趣的基因。本领域熟练技术人员 使用杂交或扩增技术可以很容易地得到相应的启动子序列。

通过克隆相应基因这种方式鉴定了C1内切葡聚糖酶的启动子 序列,分别见SEQ ID NO.2(EG5)和SEQ ID NO.1(EG6)。本发 明的其它优选的启动子是55kDa的纤维二糖水解酶(CBH1)启动 子和30kDa的木聚糖酶(XylF)启动子,因为这些酶通过它们自己 的启动子高水平地表达。利用分别在SEQ ID NO:4(为CBH1)和 SEQ ID NO:5(为XylF)中提供的部分信息,通过如下所述的直 接克隆内切葡聚糖酶的方式可以鉴定相应的启动子序列。金孢子菌 属真菌的水化合物降解酶启动子特别是C1启动子可被优选用于 在宿主有机体特别是真菌或其它微生物宿主机体内表达想要的多 肽。与SEQ ID NO.1和2,或与金孢子菌属真菌其它基因序列具有 至少60%,优选至少70%,最优选至少80%核苷酸序列相同性的启 动子序列也是本发明的一部分。

我们把本发明的重组菌株和核酸序列的特别的实施方案作为例 子。我们也利用重组菌株叙述本领域高表达的启动子序列特别是那 些在真菌例如曲霉和木霉中提供高表达的启动子序列。本领域提供 了许多可用于曲霉的表达调控区,如Novo的美国专利5252726和 Unilever的美国专利5705358。这些内容引入文中做参考。

疏水蛋白基因是一个高表达的真菌基因。因此提议疏水蛋白基 因,优选来自金孢子菌属真菌的疏水蛋白基因的启动子序列可能适 合于在本发明合适的实施方案中用做表达调控序列。本领域已经公 开了Trichoderma reesei和Trichoderma harzianum疏水蛋白的基因序 列以及烟曲霉和构巢曲霉的基因序列,相关的序列信息引入文中做 参考(Munoz等,现代遗传学1997,32(3):225-230;Nakari-Setala T等,欧洲生物化学杂志1996,15:235(1-2):248-255;M.Parta 等,传染免疫学1994 62(10):4389-4395和Stringer MA.等,分 子微生物学1995,16(1):33-44)。利用这些序列信息,本领域熟 练技术人员使用上面已经提到的标准技术就可以很容易地得到金孢 子菌属真菌疏水蛋白基因的表达调控序列。本发明的金孢子菌属重 组菌株包含与编码感兴趣的多肽的序列可操作连接的疏水蛋白调控 区。

表达调控序列也可以另外包含增强子或沉默子。这些也是本领 域众所周知的并且它们通常都位于离启动子有一段距离的地方。表 达调控序列也可以包含带有激活剂结合位点和阻遏蛋白结合位点的 启动子。在一些情况下也可以修饰这些位点以消除这种类型的调控。 已经描述了带有creA位点的丝状真菌启动子。可以突变这样的creA 位点确保阻抑葡萄糖,通常情况下去除未突变的creA位点可导致这 种结果。Gist Brocades的WO 94/13820举例说明了这种原理。使用 这样的启动子可以使由核酸序列所编码的多肽的表达能够在葡萄糖 存在的情况下受此启动子调节。WO 97/09438中也说明了此原理。 带有或不带有creA位点的这些启动子都可以使用。creA位点已经被 突变的突变株可被用做本发明的重组菌株的表达调控序列,这样它 所调节的核酸序列就可以在葡萄糖存在的情况下表达。这些金孢子 菌属真菌启动子可以以WO 97/09438中所例证的类似方式脱阻抑。 creA位点的鉴定是本领域众所周知的。另外,可以在阻遏系统带有 突变例如creA基因本身突变的宿主菌株中应用带有creA结合位点 的启动子,因此尽管此菌株带有creA结合位点,它仍然可以在有葡 萄糖存在的情况下产生蛋白质或多肽。

终止子序列也是表达调控序列,它们与待表达基因的3’端可 操作连接。任何真菌终止子在本发明的金孢子菌属真菌中都是有功 能的,例如构巢曲霉trpC终止子(1),构巢曲霉α-葡糖苷酶(2)、 构巢曲霉葡糖淀粉酶(3)、曼赫氏毛霉羧基蛋白酶(美国专利 5578463)和T.reesei纤维二糖水解酶终止子。天然的终止子序列如 EG6终止子在金孢子菌属真菌中也是有功能的并且是相配的。

本发明的合适的金孢子菌属真菌重组株的待表达的核酸序列与 编码信号序列氨基酸序列的核酸序列可操作连接。信号序列是与待 表达多肽的氨基酸序列可操作连接从而使之分泌到宿主真菌外的氨 基酸序列。这样的信号序列可以是与异源多肽有关的,也可以是宿 主本身的。它也可以对宿主和多肽来说都是异源的。编码信号序列 的核酸序列必须位于读码框内以允许信号序列和异源多肽的翻译。 我们设想了任何一种能够使金孢子菌属真菌分泌多肽的信号序列。 合适的这样的序列是真菌的信号序列,优选子囊菌信号序列。

合适的信号序列的例子可以来自普通酵母或下列特定的真菌菌 属的任何之一:曲霉、木霉、金孢子菌属、毕赤酵母、链孢霉、根 毛霉、Humicola、汉逊酵母、毛霉、Tolyplocadium、镰孢霉、青霉、 酵母属、Talaromyces或其另外的有性形式如裸壳孢属、Hypocrea等。 特别有用的信号序列通常与下列蛋白质天然有关:纤维二糖水解酶、 内切葡聚糖酶、β-半乳糖苷酶、木聚糖酶、果胶酶、酯酶、疏水蛋 白、蛋白酶或淀粉酶。例如曲霉或Humicola的淀粉酶(4)、米曲霉 的TAKA淀粉酶、黑曲霉的α淀粉酶、毛霉的羧基肽酶(美国专利 5578463)、曼赫氏根毛霉的脂酶、木霉的纤维二糖水解酶(5)、变 灰青霉的β-半乳糖苷酶以及酵母的α交配因子。

或者,信号序列可以来自于芽孢杆菌的淀粉酶或枯草蛋白酶基 因。来自与宿主菌株同属的信号序列是最合适的,这是因为它很可 能特异性适应宿主菌株,因此优选的信号序列是金孢子菌属真菌的 信号序列。我们已经发现以极大量分泌蛋白质的特别的金孢子菌属 真菌菌株,这些菌株的天然信号序列是我们尤其感兴趣的。这些菌 株被内部命名为金孢子菌属C1菌株,UV13-6菌株,NG7C-19菌 株和UV18-25菌株。如本文其它地方所描述的一样这些菌株也已经 根据布达佩斯条约被保藏。来自于丝状真菌、酵母和细菌的信号序 列也是有用的。非真菌来源的信号序列也是有用的,特别是来自于 细菌、植物和哺乳动物的信号序列。

根据本发明任何一个实施方案重组的金孢子菌属真菌可另外包 含一个选择标记。这样的选择标记将允许易于挑选转化的或转染的 细胞。选择标记通常编码一种基因产物,此基因产物对未转化的菌 株提供了一种异源的特定类型的抗性。这可以是对重金属、抗生素 和杀虫剂的抗性。原养型对于非抗生素品种来说也是一种有用的选 择标记。当着眼于这种产物更快或较不复杂的调控将感兴趣的蛋白 质或多肽用于食品或药物中时,优选非抗生素选择标记。GRAS指 标常常用于这样的标记。本领域熟练技术人员可用许多这样的标记。 例如FDA提供了一系列这样的标记。最常用的选择标记来自于赋予 抗药性或减轻营养缺陷的amdS(乙酰胺酶)、hph(潮霉素磷酸转移 酶)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)、trpC(色氨酸合酶)、argB( 氨酸氨甲酰基转移酶)、sC(硫酸腺嘌呤转移酶)、bar(膦丝菌素乙酰 转移酶)、glufosinate抗性、niaD(硝酸还原酶)、博来霉素抗性基因, 更特别的是Sh ble、磺酰脲抗性如乙酰乳酸合成酶ilv1突变。也可 以通过共转化选择,其中选择标记在另一个载体上或与编码感兴趣 的多肽的多肽编码序列在同一个核酸片段上。

本文中所用的术语异源多肽是通常情况下不被本发明用于表达 的金孢子菌属真菌表达和分泌的蛋白质或多肽。多肽可以是植物或 动物(脊椎动物或无脊椎动物)起源的例如哺乳动物、鱼、昆虫或 微生物起源的,但限制条件是此多肽不能出现在宿主菌株中。哺乳 动物包括人。微生物包含病毒、细菌、古细菌和真菌即丝状真菌和 酵母。伯杰氏细菌鉴定手册提供了许多系列的细菌和古细菌。为药 物应用的目的优先选择人体蛋白,因此构成本发明优选的实施方案 的重组宿主是其中带有人体起源的多肽的宿主。为例如食品生产的 目的,合适的异源多肽是动物、植物或藻类起源的。因此,这些实 施方案也考虑到本发明合适的实施例。其他有用的实施方案也包括 细菌、酵母、病毒、古细菌和真菌任何之一起源的异源多肽。真菌 起源的多肽是最优选的。

本发明的合适的实施方案包含带有合适的密码子使用的异源核 酸序列。这样的序列编码其所起源的宿主的天然的氨基酸序列,但 具有不同核酸序列,即某些密码子已经被其他编码相同氨基酸的密 码子替换以使之更易于被用于表达的宿主菌株所使用的核酸序列。 这可导致异源核酸序列的更好地表达。对于本领域熟练技术人员来 说这是很普通的。这种合适的密码子可以在已知的真菌密码子使用 对应于非真菌的密码子使用的基础上得到。它也可以更特异地适应 于金孢子菌属真菌本身的密码子使用。相似之处是所观察到的木霉、 Humicola和曲霉的密码子使用可以在不改变密码子的情况下进行这 些有机体之间的序列交换。关于这些真菌密码子使用的详细资料是 本领域熟练技术人员可利用的,并且引入本文做参考。

本发明不仅仅局限于上面所提到的金孢子菌属真菌菌株,也包 括含有编码金孢子菌属真菌菌株同源多肽的核酸片段的重组菌株, 上述的核酸片段与一表达调控区可操作连接并且上述的重组菌株比 相应的非重组菌株在同样的条件下产生更多的上述的蛋白。所感兴 趣的同源多肽优选是中性或碱性酶如在本文其它地方已经描述的水 解酶、蛋白酶或碳水化合物降解酶。多肽也可以是酸性的。优选的 重组菌株比非重组菌株表达更多量的多肽。所有提到的关于异源多 肽的评论也同样适用于同源多肽纤维素酶。

因此,本发明也包括金孢子菌属真菌基因工程菌株,其中所引 入的序列是金孢子菌属起源的。但是,由于以下原因例如用于转化 或转染金孢子菌属真菌存在于核酸序列中的异源序列,由于存在编 码所感兴趣的多肽的核酸序列的多重拷贝这个事实或由于在同等条 件下所表达的多肽的量多于非工程菌这个事实或由于在通常不表达 的条件下发生表达这个事实,工程菌可以与原始自然菌株区分开来。 后一情况可能是在与非重组菌相反的条件下诱导型启动子调节所感 兴趣的序列或着是另外的因子诱导表达的结果。正如在前述的实施 方案中所定义的本发明不包括天然金孢子菌属真菌。本发明旨在通 过使用经典的基因工程或基因工程方法而获得的菌株。

本发明所有的重组菌株都含有一段编码选自下列物质的核酸片 段:碳水化合物降解酶(纤维素酶、木聚糖酶、甘露聚糖酶、甘露 糖酶、果胶酶、淀粉酶例如葡糖淀粉酶、α淀粉酶、α和β半乳糖 苷酶、α和β葡(萄)糖苷酶、β葡聚糖酶、几丁质酶、聚N-乙酰葡 糖胺酶)、蛋白酶(内切蛋白酶、氨基蛋白酶、氨基和羧基肽酶)、 其它水解酶(脂酶、酯酶、植酸酶)、化还原酶(过氧化氢酶、葡 萄糖氧化酶)和转移酶(转谷氨酰胺酶、转糖基酶、异构酶和转化 酶)。

表A:酶保持活性和/或稳定性的pH范围     样品 保持酶活性大于50% 的pH范围 保持酶活性大于70% 的pH范围 最大稳 定性% (20小时 50℃) 羧甲基 纤维素 酶 RBB羧 甲基纤 维素酶 其它 底物 羧甲基 纤维素 酶 RBB羧 甲基纤 维素酶 其它 底物 PH7.5/8  30kD 蛋白酶(碱性)  30kD Xyl(碱性)  51kD Xyl  60kD Xvl  45kD endo  55kD endo  25kD(21.8kD*)endo  43kD(39.6kD*)endo  45kD α,β-Gal/β-Gluc  48kD CBH,带痕量β-Glue  55kD CBH  65kD PGU  90kD蛋白酶 100kD酯酶     -     -     -     -     7.0     8.0     7.5     8.0     -     5.2     8.0     -     -     -     -     -     -     -     8.0     8.0     10.0     8.0     -     7.5     9.0     -     -     -     12.5     10.0     8.0     9.5     -     -     -     -     6.8     8.0     -     8.0     9.0     9.0     -     -     -     -     6.5     7.0     6.5     7.2     -     5.0     7.4     -     -     -     -     -     -     -     7.0     7.0     9.0     7.2     -     6.8     8.5     -     -     -     12.0     8.5     7.5     9.0     -     -     -     -     5.7     -     -     7.3     9.0     9.0     -     80     -     85     75     55     80     -     -     -     70     -     -     - *分子量(MALDI方法) 注:*所有其它分子量都是用SDS-PAGE方法得到的

*酶都具有相等的蛋白质含量

*xyl指木聚糖酶

*endo指内切葡聚糖酶

*gal指半乳糖苷酶

*gluc指葡糖苷酶

*CBH指纤维二糖水解酶

*PGU指多聚半乳糖醛酸酶

表B从18-25菌株超滤液分离的酶对不同底物的酶活性(pH5),单位/毫克蛋白质 样品   pI CMC RBB- CMC CMC- 41 FP CMC (visc) b-葡 聚糖 PNP-a G pNP-b G 纤维 二糖 微晶 纤维 素 MUF- 纤维 二糖 苷 MUF- 乳糖 苷 MUF- 木糖 苷 乳糖 木聚 糖 多聚 半乳 糖醛 酸 MUF- 葡糖 苷 半乳 甘露 聚糖 pNP-a 半乳 糖苷 pNP-b 半乳 糖苷 染色 的酪 蛋白 pNP 丁酸 酯   50℃   40℃   40℃   50℃   40℃   50℃ 40℃   40℃   40℃   40℃   40℃   40℃ 40℃   40℃   50℃   50℃  40℃   50℃   40℃   40℃   50℃  60℃ 30kD蛋白酶  8.9    0    0    0    0    0    0   -    0    0    0    0    0    0    0    0    0   0    0    0    0    0.4   0 30kDXyl  9.1    0.1    2    0.1    0.16    0.1    0   -    0    -    0    0    0    0    -    25    0   0    0    0    -    0   0 51kDXyl  8.7    0.1    4.2    -    0.19    -    0   -    0    -    0    0    0    0    -    19    0   0    0    0    -    0   0 60kDXyl  4.7    0    -    -    0    -    0   -    0    -    0    0.14    0.02    0.04    -    16.3    0   0    0    0    0    0   0 45kD endo   6    51    86    7.6    0.2    47    36   -    0    -    0.5    0    0    0    -    1    -   0    1.8    0    -    0   0 55kD endo  4.9    47    94    7.7    0.3    39    25   -    0    -    0.5    0    0    0    -    0    -   0    0.4    0    -    0   0 25kD(21.8kD*)endo  4.1    19    15    3.9    0.3    11    3.8   -    0    0    005    0    0    -    0    0.03    0   -    0    0    0    0   0 43kD(39.6kD*)endo  4.2    0.43    0.2    0.1    0    0.2    0.2   -    0    0    0    0    0    -    0    0    0   -    0    0    0    0   0 45kDa,b-Gal/b-Gluc  4.2    0    0    0    0    0.01    0.01   0    0.4    0.06    0    0    0    -    0.01    0    0.1   0.1    0.2    0.2    0.3    0   1.7 带痕量β-Gluc的 48kD CBH+葡糖酸- d-内酯  4.4    0.67    1.3    1.2    0.4    0.8    0.77   0    1.7    0.08    0    0.2    0.36    -     0    0    0.1   0.4    0    0    0    0   2.3    0    0.36 带痕量β-Gluc的 55kD CBH+葡糖酸- d-内酯  4.4    0.7    0.16   0.27    0.4    0.1    0.1    -    0.05    0.08    0.46    0.2    0.7    -     0    0.1    0   -    0    0    0    0   0    0    0.14    0.6 65kD PGU  4.4    0    0    0    0    0    0    -    0    0    0    0    0    -  0  0  1   -    0    0    0    0   0 90kD蛋白酶  4.2    -    -    -    -    -    -    -    -    -    -    -    -    -    -     -     -   -    -    -    -    0.91   - 100kD酯酶  4.5    0    0    0    0    0    0    -    0     0     0    0    0    -    0    0    0   0    0    0    0    0   0.8

*分子量(MALDI法)

**对染色的酪蛋白的活性以任意单位/毫克表示

本发明所要表达的最令人感兴趣的产品是纤维素酶、木聚糖酶、 果胶酶和蛋白酶。其中纤维素酶和果胶酶带有β-1,4-键,纤维素 酶包含内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。在本领域已 知的各种不同的工业过程中这些蛋白质是非常有用的。特别是纤维 素酶我们参考了叙述纤维二糖水解酶和内切葡聚糖酶使用的WO 98/15633。上述应用的内容引入文中做参考。我们也参阅了进一步 提供金孢子菌属蛋白质详细资料的表A和表B。

根据本发明发现可以制备蛋白酶表达量降低的金孢子菌属突变 株,从而使之更适于生产蛋白质产物,特别是对蛋白酶敏感的蛋白 质产物。因此本发明也包括与未突变菌株例如C.lucknowense C1菌 株(VKM F-3500D)相比蛋白质没产量降低的金孢子菌属突变株。 特别是这些菌株的蛋白酶活性小于C1菌株蛋白酶活性的一半,甚至 小于30%。可以用已知的方法测量降低的蛋白酶活性如通过测量在 脱脂乳平板上所形成的晕的大小或通过BSA降解。

本发明尤其感兴趣的一个实施方案是本模仿的重组金孢子菌属 真菌,其中编码感兴趣多肽的核酸序列编码一种在酸性pH下即pH 低于6,甚至pH低于5.0,更适合甚至pH低于5和甚至pH4或低 于pH4的情况下失活或不稳定的蛋白质或多肽。这是一个特别令人 感兴趣的实施方案,因为这个真菌表达系统并不是在中性到碱性的 条件下培养而是在酸性条件下培养的。因此,本发明的这个系统提 供了一种表达在酸性pH下易于失活或不稳定的蛋白质或多肽的安 全的真菌表达系统。

正如在本发明任一实施方案中所详细说明的那样,一个更为特 别的重组菌株被认为是本发明的一个优选的实施方案,其中编码感 兴趣多肽的核酸序列编码一种在pH5以上,优选中性或碱性pH(即 大于7)和/或在pH大于6的情况下具有最佳活性和/或稳定性的蛋白 质或多肽。在这样的pH值下最佳活性大于50%,大于70%甚至大 于90%被认为是特别有用的实施方案。在培养条件下所表达的多肽 在此条件下没有必要必须有活性,由于其活性形式可能对宿主有损 害,所以实际上在其失活的条件下培养对它也是有利的。例如蛋白 酶就是这种情况。但是,蛋白质或多肽在此培养条件下必须稳定。 稳定可以是热稳定。它也可以是针对某些组合物或化学制品的稳定, 例如存在于组合物中或生产过程中或在所感兴趣的蛋白质或多肽的 应用中。在含有纤维素酶或脂酶的去垢剂组合物中的LAS等是通常 对蛋白质有损害的化学制品的例子。在应用中使用时间可能从短到 长不等,因此对于每次应用来说稳定性的时间长短可能不同。熟练 技术人员在各种情况的基础上将能够确保正确的条件。我们可以使 用商用分析方法来确定不同的酶产物的最佳活性。例如Sigma和 Megazyme公司的产品目录上有这些分析方法。在本叙述的其它地方 也都提到了特定的实施例。制造商提供了应用指导。

我们惊奇地发现能适合被所要表达的感兴趣的序列转化或转染 的金孢子菌属真菌菌株其生物量相当低。我们已经发现当培养至发 酵的末尾阶段粘度值为200-600cP时金孢子菌属真菌菌株的生物量 比T.reesei低2-3倍,当在相应条件下培养至粘度值为1500-2000cP 时其生物量比黑曲霉低10-20倍,即它们各自最佳的培养条件能够 提供高水平的表达。表达水平极大地超过了两个商用菌株并且其生 物量和粘度值相当低。这意味着这个金孢子菌属真菌菌株的表达产 量要比黑曲霉和T.reesei稍微高一些。这样的一株转化的或转染的 金孢子菌属真菌菌株构成了本发明的一个合适的实施方案。

我们发现在上面所叙述的条件下金孢子菌属C1菌株(18-25) 的生物量是0.5-1.0克/升,而T.reesei的生物量是2.5-5.0克/升,黑 曲霉的生物量是5-10克/升。在实施例中我们提供了这个过程的详细 资料。

在本发明的一个合适的实施方案中本发明的金孢子菌属真菌重 组菌株所产生的蛋白质或多肽的量至少应该等同于由UV13-6或C-19 菌株所产生的摩尔每升纤维素酶的量,最优选的情况是至少应该等 同于或高于由UV18-25菌株在相应条件或相同条件即在它们各自最 佳的培养条件下产生的纤维素酶的量。

所未预料到的是,我们也发现当使用显示UV18-25菌丝体形态 的金孢子菌属菌株即短的菌丝体片段时表达和分泌率非常高。因此 本发明的重组菌株优选显示这样的形态。但是本发明也包括显示这 种新的和创造性特征的非重组菌株或其它金孢子菌属真菌的工程菌 株。本发明也包括在本发明任一实施方案中所描述的与C1菌株相比 进一步表现出在相同的发酵条件下产生孢子能力降低,优选低于 UV13-6菌株产孢能力,优选低于NG7C-19菌株产孢能力,优选低 于UV18-25菌株产孢能力的金孢子菌属真菌重组菌株。本发明也包 括在本发明任一实施方案中所描述的与C1菌株相比,优选在相同的 发酵条件下与UV13-6,NG7C-19和UV18-25菌株相比显示出至少 蛋白质产量与生物量比的金孢子菌属真菌重组菌株。但是,本发明 同样也包括或与其它任一实施方案结合显示这种新的和创造性特征 的非重组菌株或其它金孢子菌属真菌的工程菌株。

本发明的另一个吸引人的实施方案也包括在相应或等同的发酵 条件下显示出粘度值比NG7C-19菌株低,优选比UV18-25菌株的金 孢子菌属真菌重组菌株。但是,本发明同样也包括显示一种或几种 新的和创造性特征的非重组菌株或其它金孢子菌属真菌的工程菌 株。我们已经确定在它们各自的最佳培养条件下发酵过程的末期阶 段UV18-25培养物的粘度值为10cP,而T.reesei的粘度值为200- 600cP,黑曲霉的粘度值为1500-2000cP。在实施例中提供了这些测 量过程。

在许多情况下粘度值可以通过视觉监测。物质的流动性变化程 度很大,它可以呈近乎固体状、酱状或液体状。粘性也很容易通过 使用运动粘性管的Brookfield旋转粘度计、降珠粘度计或杯形粘度 计确定。这样的低粘度值培养物每个时间单位和每个细胞的产量比 已知的高粘度值的商业培养物要高。

对本发明的这些低粘度的培养物进行处理是有利的,特别是测 量培养物时。低粘度的金孢子菌属真菌目标菌株在体积大至150000 升的培养物中表现得非常好。因此任何一个体积至150000升的培养 都是本发明的有用的实施方案。使用本发明的菌株任何其它传统体 积大小的发酵也应该能够很好地实施。其后的原因是在大规模生产 中出现的问题随着聚集物的形成菌丝体太致密和/或不均匀分布。其 结果是培养基在培养过程中不能被有效利用,因此导致生产过程低 效,特别是在大规模发酵即体积大于150000升的情况下。通气或混 合导致了氧气和营养饥饿因此降低了产物生物量的浓度和减少了培 养过程中的多肽产量和/或导致发酵时间延长。此外,在商业发酵过 程中高粘度和高剪切是我们所不希望发生的,并且在现在的商业发 酵过程中它们是生产限制因素。从这一点上来说使用本发明的金孢 子菌属真菌菌株可以克服所有这些负面特征,因为此菌株比商用T reesei、黑曲霉和米曲霉显示出更好的特征即蛋白质生产水平较高、 更好的粘度特征和生物量数值。

选自C1、UV13-6、NG7C-19和UV18-25的金孢子菌属真菌菌 株非常好地显示出各种不同的特征。但是,本发明也包括来自这四 种保藏的菌株的也显示出任何一种新的和创造性特征或几种特征的 金孢子菌属重组菌株和工程菌株。这些菌株的保藏数据在本文各处 随处可见。本发明的金孢子菌属菌株也包含一种在相应的培养条件 下显示生物量低于T.reesei生物量至少2倍,合适的甚至低于T. reesei,特别是在实施例条件下显示粘度为200-600cP的T.reesei的 生物量超过5倍的菌株。本发明的金孢子菌属菌株也包含在相应或 等同条件下产生多肽的量至少是C1、UV13-6、NG7C-19或UV18-25 所产生的摩尔每升纤维素酶的数量。

如果本发明的金孢子菌属真菌在中性至碱性pH和25-43℃温度 范围内显示出最佳的生长条件,那么此菌株是进一步优选的。优选 的菌株能在中性甚至碱性pH下存在。这样的条件对于许多蛋白质 和多肽有利,特别是那些易于受到酸性pH侵害或在低温度下失活 或不稳定的多肽和蛋白。但是,本发明的一个实施方案也包括在酸 性pH下培养金孢子菌属真菌,因为这对于某些蛋白质和多肽来说 是有用的。合适的酸性pH值是7以下,低于6.5的酸性pH被视作 本发明的一个好的实施方案。PH在5.0-7.0之间的也是合适的实施 方案。中性pH可以是7或7左右如6.5-7.5。正如在本文其他地方 所表明的感兴趣的最佳pH值取决于许多因素,这些因素对于本领 域熟练技术人员来说是显而易见的。大于7.5的pH值是碱性的,可 以利用的合适的碱性pH值是7.5-9.0之间。

当比较本发明菌株以及其它具有最佳条件的菌株(如曲霉或木 霉)的测量粘度值时,也应该使用相关的最佳条件下的相关菌株进 行生物量和蛋白质产量的比较。这对于本领域熟练技术人员是明显 的。

根据本发明的任何一个上面提到的实施方案,金孢子菌属菌株 被认为是本发明最有用的实施方案,上述的菌株生产上面所提到的 选自碳水化合物降解酶、蛋白酶、其它水解酶、氧化还原酶和转移 酶的一种或多种真菌酶。特别是纤维素酶、木聚糖酶、果胶酶、脂 酶和蛋白酶是最令人感兴趣的产品。但是作为本发明的实施方案, 生产一种或多种在中性或碱性优选碱性条件下显示出最佳活性和/或 稳定性的真菌酶的金孢子菌属菌株也是有用的,上述的酶选自碳水 化合物降解酶、水解酶和蛋白酶,优选水解酶和碳水化合物降解酶。 在非重组金孢子菌属菌株中,像WO 98/15633所公开的那样这些酶 是除纤维素酶以外的其它合适的酶。我们所特别感兴趣的酶是木聚 糖酶、蛋白酶、酯酶、α半乳糖苷酶、β半乳糖苷酶、β葡聚糖酶 和果胶酶。这些酶不仅仅限于上面所提到的酶。本文中关于稳定性 和活性的讨论也同样用于此处。

本发明也包括生产所感兴趣的多肽的方法,上述的方法包含培 养本发明任一实施方案中所表达和优选分泌感兴趣的多肽的金孢子 菌属菌株,并随后回收产生的多肽。

当提到蛋白质或多肽时,天然蛋白质的变种或突变体例如替换、 插入或确实突变体被包括在显示非突变体活性的蛋白或多肽中。相 应的核酸序列也是如此。通过基因改组、蛋白质工程和定向进化定 点突变和随机突变等方法可以得到这样的多肽、变种或突变体。美 国专利5223409、5780279和5770356提供了定向进化的方法。利用 这些方法例如通过易错聚合酶链反应进行基因改组可在任何细胞类 型中产生随机突变的基因序列库。每一基因都带有分泌区和一固定 区,从而使产物蛋白分泌出来并且固着在宿主表面。随后创造此特 定蛋白生物活性所必须的条件。经过许多循环之后最终导致具有所 希望特征的终基因产生。换一句话说一个加速的定向进化过程。美 国专利5763192也叙述了通过合成的多聚核苷酸偶联随机产生序 列,将其引入宿主中随后选择具有预先设定特点的宿主细胞而获得 DNA、RNA、肽、多肽或蛋白质的方法。

使用标准的克隆技术和蛋白质或多肽分离技术以取得所需要的 序列信息。部分已知的序列可用做探针分离其它属或株的同源序列。 编码特定酶活性的核酸序列可用于筛选例如金孢子菌属序列库。本 领域熟练技术人员知道合适的杂交条件。纽约冷泉港Plainview出版 的萨姆布鲁克等(编者)(1998)的“分子克隆实验指南”一书以及 纽约约翰威利父子公司出版的奥斯伯(编者)的“现代分子生物学 实验技术”一书叙述了传统的核酸杂交文库的构建和克隆技术。相 关的信息也可以从后者的手册和专利以及本领域的各种商用试剂盒 中得到。

在另外的一个实施方案中,上述的方法包含在允许蛋白质或多 肽或其前体表达和优选分泌的条件下培养菌株,随后分离所产生的 多肽并且任选将前体经过另外的分离和纯化步骤以得到所感兴趣的 多肽。这样的方法可能包含将前体裂解为感兴趣的多肽或前体的合 适的步骤。当一分泌的蛋白质载体和感兴趣的多肽由一个蛋白酶位 点连接时,可使用Kex-2样蛋白酶、任一基本氨基酸配对的蛋白酶 或Kex-2蛋白酶裂解。本领域熟练技术人员能够很容易地找到Kex- 2样蛋白酶序列,因为现有一致序列的详细资料可以利用并且已经 公开了许多其它的序列如弗林蛋白酶。

根据本发明任一实施方案生产多肽的方法,培养的合适pH值 大于5,优选5-10,更优选6-9。在此方法中合适的培养温度是25-43 ℃,优选30-40℃。在此方法中所使用的本发明的金孢子菌属真菌菌 株是本发明任一实施方案所公开的非常适合的重组金孢子菌属菌 株。本发明的这种方法可进一步以制备本发明的重组金孢子菌属菌 株为前提。合适条件的选择取决于待表达的多肽的性质,并且在本 领域熟练技术人员的正常工作之内。

生产本发明重组金孢子菌属菌株的方法也是本发明的一部分。 此方法包含向金孢子菌属菌株稳定引入一段编码异源或同源多肽的 核酸片段,上述的核酸片段与一表达调控区可操作连接,上述的引 入已一种已知的转化丝状真菌的形式发生。如上所述有其无数的参 考文献可以利用,本文只引用了其中一小部分。所提供的信息足够 使本领域熟练技术人员毫不费力地施行此方法。此方法包含引入一 段或几段在本发明重组金孢子菌属真菌的各种不同的实施方案中所 描述的任一核酸片段。

实施例中核酸片段的引入是通过原生质体转化的方法实现的。 在实施例中详细叙述了此方法。正如在本领域其它丝状真菌中所描 述的那样,也可以使用另外的原生质体或球芽转化技术。这些方法 的详细细节可在许多引用的参考文献中找到,因此这些文献引入本 文做参考。本发明合适的方法包含使用本发明的非重组金孢子菌属 真菌作为引入所希望的编码感兴趣多肽的核酸序列的起始材料。

本发明也包括生产金孢子菌属真菌酶的方法,上述的方法包含 在pH值大于5,优选5-10,更优选6-9,6-7.5,7.5-9是合适的中性 和碱性pH范围的培养基中培养本发明的在上面任一实施方案中所 描述的金孢子菌属真菌菌株。

通常来说,本发明进一步包含生产表现出中性或碱性最佳活性 和/或稳定性,优选碱性最佳活性和/或稳定性的酶的方法。在本文的 其它地方已经提供了优选的pH范围和相应的最佳活性以及测量活 性的分析方法。如上所述,酶应选自碳水化合物降解酶、蛋白酶、 其它水解酶、氧化还原酶和转移酶,上述的方法包含培养用编码相 应的酶的核酸片段转化或转染的宿主细胞。金孢子菌属真菌酶是这 样的合适的酶。合适的类似的方法包含生产特别是如纤维素酶、木 聚糖酶、果胶酶、脂酶和蛋白酶,其中纤维素酶和木聚糖酶带有β- 1,4-键,并且纤维素酶包含内切葡聚糖酶、纤维二糖水解酶和β- 葡糖苷酶。本发明的方法可包含培养本发明的含有编码上述的这些 酶的核酸片段的金孢子菌属真菌宿主。本发明的合适的非重组金孢 子菌属菌株主要生产碳水化合物降解酶、水解酶和蛋白酶。在这种 情况下合适的酶是除纤维素酶以外的其它酶。在表A和表B中列出 了要生产的合适的产品的实施例。分离方法等同于在WO 98/15633 中所叙述的方法,此方法引入本文做参考。

本发明也包括由本发明的金孢子菌属真菌菌株所产生的酶。正 如可从本发明的非重组金孢子菌属菌株中分离的酶一样,本发明也 包括金孢子菌属真菌起源的酶。它们表现出前述的稳定性、活性特 点。合适的是它们在LAS存在时也很稳定。需要特别声称的是具有 前述活性稳定性特征的等电点为4-9.5,分子量为25-95kD的蛋白酶; 等电点为4.0-9.5,分子量为25-65kD的木聚糖酶;等电点为3.5-6.5, 分子量为25-55kD的内切葡聚糖酶;等电点为4-4.5,分子量为45-50 kD的β-葡糖苷酶和α、β-半乳糖苷酶;等电点为4-5,分子量为 45-60kD的纤维二糖水解酶例如等电点为4.5,分子量为55kD;等 电点为4.0-5.0,分子量为60-70kD如65kD的多聚半乳糖醛酸酶; 等电点为4-5,分子量为95-105kD的酯酶。分子量是通过SDS-PAGE 电泳确定的。如在WO 98/15633中所公开的那样,非重组酶即天然 的酶是除纤维素酶以外的其它酶。在WO 98/15633中所公开的酶被 排除在外。上面所提到的组合等电点和分子量的酶也包括在内。

本发明也考虑到由本发明的突变(重组)菌株所(过量)产生 的非蛋白质产物。这样的非蛋白质产物包括基础代谢产物如有机酸、 氨基酸和次级代谢产物如抗生素,例如青霉素和头孢菌素。这些产 物是组合几种生化途径的结果,涉及一些目的真菌基因。真菌的基 础和次级代谢产物和在真菌中产生这些代谢产物的过程是本领域众 所周知的。Mattey M在有机酸的产生,现代生物技术评论12,87-132 (1992)一文中描述了基础代谢产物产生的实施例。Penalva等在真 菌中青霉素生物合成的优化,生物技术趋势16,483-489(1998) 一文中描述了次级代谢产物产生的实施例。

实施例

测定生物量和粘度的实施例

已经使用了三种不同的真菌鉴定了用于真菌发酵的操作参数数 据范围。所比较的三种真菌为:Trichoderma longibrachiatum(以前的 T.reesei)、黑曲霉和Chrysosporium lucknowense(UV18-25)。

粘度

粘度是使用小的样品适配器和31号转轴在Brookfield LVF粘度 计上测量的。

在使用粘度计前5分钟打开循环水以平衡水夹套层。水浴温 度应为30℃。

收获10毫升新鲜的发酵培养液并将此发酵培养液置于小的样品 转轴上。选择转轴速度使其读数范围在10-80内。等待4分钟后读 取粘度测量值。读数乘以下面所给出的系数就得到了以厘泊(cP) 为单位的粘度值。

转轴速度 系数

    6     50

    12    25

    30    10

    60    5

使用上面的方法对特定的真菌所测量的发酵的粘度值范围如 下:

                         粘度值(cP)

T.longibrachiatum         200-600

黑曲霉                    1500-2000

C.lucknowense(UV18—25)    低至10

生物量

生物量是通过下列方法测定的:

称量盘上对直径为5.5厘米的滤纸(沃特曼54)预先称重。

在布氏漏斗上过滤5.0毫升全培养液,用10毫升去离子水冲洗 滤饼,将洗过的饼和滤器置于平底称量盘上60℃过夜干燥。最后100 ℃干燥1小时,然后置于干燥器中冷却。

称量干物质的重量。总生物量(克/升)等于两次称量值之差再 乘以200得到的数值。

使用上面的方法对特定的真菌所测量的发酵的生物量范围如 下:

                        生物量(克/升)

T.longibrachiatum           2.5-5

黑曲霉                      5-10

C.lucknowense(UV18—25)     0.5-1

蛋白质

蛋白质水平是利用Sigma公司的伯乐分析方法测定的。金孢子 菌属真菌的蛋白质水平最高。

上面的数值代表发酵过程开始48小时以后直至发酵结束的测量 值;曲霉和木霉的所有数值都是来自商业相关的真菌并且反映了真 实的商业数据。

真菌菌株C.lucknowense(UV18-25)具有低粘度的特点,从而 允许在发酵中使用低功率输入和/或剪切以迎合在一些由于物理损伤 产物分子因而剪切压力对产量具有致命性损害的情况下的氧需求。 在高蛋白质产量时的低生物量显示了一种更有效的将发酵培养液转 化为产物的有机体。因此,金孢子菌属真菌在提供至少同样多蛋白 质的同时提供了更好的生物量和粘度数据,实际上比所用的优于通 常所保藏的曲霉和T.reesei的两个商业真菌表达系统产生的蛋白质 多得多。

由C.lucknowense(UV18-25)所产生的高蛋白质产量低生物量 浓度可能允许在发酵条件达到极限之前发展具有更高生物量的发酵 条件以生产目的产物,如果增加生物量导致产量提高的话。

由于现有的生物量和粘度水平已经接近实际的极限发酵条件, 由T.longibrachiatum和黑曲霉所产生的现有的高水平的生物量和粘 度水平限制了生物量的提高。

金孢子菌属真菌、木霉和Tolypocladium转化比较的实施例

在两种培养基(pH6.8的GS培养基和pH6.8的Pridham琼脂 (PA)培养基)上测试了两株未转化的金孢子菌属C1菌株和一株T. reesei参考菌株。在培养了7天的PDA培养皿上收获孢子以检测其 抗生素抗性水平。所选择的培养皿置于32℃孵育并于第2、4和5 天后测量其数值。发现C1菌株NG7C-19和UV18-25很明显对腐草 霉素和潮霉素的基础抗性水平很低。这个抗性水平等同于常用的T. reesei实验室参考菌株的抗性水平。因此,很明显这两种标准的真菌 选择标记可以很好地应用于金孢子菌属真菌菌株。其它标准的真菌 选择标记所带来的问题应该不会出现。

在50毫克/毫升时成功地选择出了Sh ble(腐草霉素抗性)转化 的金孢子菌属真菌菌株。这也是用于T.reesei的选择水平,因此表 明在金孢子菌属真菌中可以很容易地达到差示选择。150毫克/毫升 时,上面的讨论同样适用于带有潮霉素抗性的转化菌株。

表C Gs培养基pH6.8 Pridham琼脂培养基pH6.8 NG7C-19 UV18-25 T.r.11D5 NG7C-19 UV18-25 T.r.11D5 腐草霉素 潮霉素 7.5μg/ml 7.5-10μg/ml 10μg/ml 10μg/ml 5-7.5μg/ml 10μg/ml 2.5μg/ml 15μg/ml 10μg/ml 25μg/ml 2.5μg/ml 15μg/ml

在普遍使用的真菌转化技术的基础上原生质体转化技术被用于 金孢子菌属真菌。在一个直径为55毫米的PDA培养皿上所有的孢 子被收获到8毫升的IC1培养液中并转移入带有50毫升IC1培养液 的摇瓶中,35℃200转/分钟孵育15小时。然后对培养物离心,沉淀 用MnP溶液洗涤,然后重悬于10毫升MnP和10毫克/毫升的C3 Caylase的溶液中并于35℃振荡(150转/分钟)孵育30分钟。

过滤溶液,滤液3500转/分钟离心10分钟。用10毫升的MnPCa2+溶液洗涤沉淀。然后于25℃再离心10分钟后加入50微升预冷的PMC 溶液。混合物置于浴30分钟后加入2.5毫升PMC溶液。室温15 分钟后处理的原生质体与3毫升软MnR混合并立即涂布于含有选择 因子腐草霉素或潮霉素的MnR培养皿上。30℃孵育5天后分析转化 体(48小时以后肉眼可见克隆),使用10微克pAN8-1参考质粒来 测定转化效率。结果见下表D。

表D:转化效率(使用10微克pAN8-1参考质粒) T.reesei  NG7C-19 UV18-25 成活力 106/200微升  5×106/200微升 5×106/200微升 每200微升的转化体数 2500  104 104 每106活细胞的转化体数 2500  2000 2000

结果表明金孢子菌属真菌的转化体成活力优于木霉的转化体成 活力。菌株的转化能力是等同的,因此在一个实验中金孢子菌属真 菌所得到的转化体数目是T.reesei的4倍。所以金孢子菌属真菌转 化系统不但等同于常用的T.reesei系统,而且甚至要优于T.reesei系 统。这种提高对转化效率比pAN8-1低的载体是非常有用的。这些 低效转化载体的实施例如通常产生少于此10倍转化体的用于生产非 真菌蛋白质的载体蛋白质载体。

用同源的金孢子菌属真菌蛋白质编码序列,也用异源蛋白质编 码序列构建了许多其它的转化和表达载体,以用于金孢子菌属真菌 转化实验。在图6-11中提供了载体图谱。

待表达的同源蛋白质选自由金孢子菌属真菌产生的由属于家族 6(分子量43kDa)的内切葡聚糖酶6组成的纤维素酶,异源蛋白是 由青霉产生的属于家族12(分子量25kDa)的内切葡聚糖酶3。

PF6g包含与内切葡聚糖酶6信号序列连接的金孢子菌属真菌内 切葡聚糖酶6启动子片段,框内与内切葡聚糖酶6开放读码框连接, 其后是内切葡聚糖酶6的终止子序列。通过与选择载体共转化来挑 选转化体。

PUT1150包含与内切葡聚糖酶6信号序列连接的T.reesei纤维 二糖水解酶启动子,框内与内切葡聚糖酶开放读码框连接,其后是 T.reesei纤维二糖水解酶的终止子序列。此外,此载体携带带有选择 标记即腐草霉素抗性基因(Sh ble基因)的第二表达盒。

PUT1152包含与内切葡聚糖酶6信号序列连接的构巢曲霉甘油 醛-3-磷酸脱氢酶启动子,框内与内切葡聚糖酶6开放读码框连接, 其后是构巢曲霉色氨酸合酶(trpC)的终止子序列。此外,此载体 携带带有选择标记即腐草霉素抗性基因(Sh ble基因)的第二表达盒。

PUT1155包含与T.reesei纤维二糖水解酶信号序列连接的构巢 曲霉甘油醛-3-磷酸脱氢酶A启动子,框内与连接至内切葡聚糖酶6 开放读码框的Sh ble载体蛋白连接,其后是构巢曲霉色氨酸合酶 (trpC)的终止子序列。这个载体使用了将载体蛋白融合至目的蛋 白的技术,这大大增加了我们所感兴趣的蛋白的分泌。

PUT1160包含与T.reesei纤维二糖水解酶信号序列连接的构巢 曲霉甘油醛-3-磷酸脱氢酶A启动子,框内与连接至青霉的内切葡聚 糖酶3开放读码框的Sh ble载体蛋白连接,其后是构巢曲霉色氨酸 合酶(trpC)的终止子序列。

PUT1162包含与内切葡聚糖酶3信号序列连接的T.reesei纤维 二糖水解酶启动子,框内与青霉的内切葡聚糖酶3开放读码框连接, 其后是T.reesei纤维二糖水解酶的终止子序列。此外,此载体携带 带有选择标记即腐草霉素抗性基因(Sh ble基因)的第二表达盒。

表E:比较转化 载体 菌株 转化 转化体数目 在液体培养中 测定的数目 pUT1150 pUT1152 pF6g pUT1162  UV18-25  T.geodes  UV18-25  T.geodes  UV18-25  T.geodes  UV18-25  T.geodes 腐草霉素选择 腐草霉素选择 pAN8.1共转化 pAN8.1共转化 pAN8.1共转化 pAN8.1共转化 腐草霉素选择 未做  285  144  398  45  252  127 >400  5  5  5  4  6  5

表E显示了转化金孢子菌属真菌UV18-25和Tolypocladium geodes菌株的结果。所用的转化方法见异源转化那一节。

金孢子菌属真菌菌株异源和同源表达的实施例

已经测定了C1菌株(NG7C-19和/或UV18-25)分泌各种异源 蛋白的能力:细菌蛋白(Streptoalloteichus hindustanus腐草霉素抗性 蛋白,Sh ble)、真菌蛋白(T.reesei木聚糖酶II,XYN2)和人体蛋 白(人溶菌酶,HLZ)。

此方法的详细细节如下:

[1]C1菌株分泌Streptoalloteichus hindustanus腐草霉素抗性蛋白 (Sh ble)

已经用pUT720质粒1转化C1菌株NG7C-19和UV18-25。此质 粒带有以下真菌表达盒:

—构巢曲霉甘油醛-3-磷酸脱氢酶A(gpdA)启动子2

—合成的T. reesei纤维二糖水解酶I(cbhl)信号序列1.3

—Streptoalloteichus hindustanus腐草霉素抗性基因Sh ble4

—构巢曲霉色氨酸合酶(trpC)终止子5

此载体也包含β-内酰胺酶基因(bla)和来自pUC18质粒6的大 肠杆菌复制起点。图2中提供了详细的质粒图谱。

根据Durand等7的方法转化C1原生质体。适应C1菌株(培养 基和溶液到处有售):收获一个直径为90毫米的PDA培养皿上未转 化C1菌株的所有孢子至8毫升的IC1培养液中,并转移入带有50 毫升IC1培养液的摇瓶中,35℃150转/分钟孵育15小时。然后对培 养物离心,用MnP溶液洗涤沉淀,重悬于10毫升MnP和10毫克/ 毫升的C3 Caylase的溶液中并于35℃振荡(150转/分钟)孵育30 分钟。过滤溶液,滤液3500转/分钟离心10分钟。用10毫升的MnPCa2+溶液洗涤沉淀。然后3500转/分钟再离心10分钟,沉淀溶于1毫升 的MnPCa2+溶液中。向200微升原生质体溶液中加入10微克pUT720 DNA室温(约20(℃)孵育10分钟。然后加入50微升预冷的PMC 溶液。混合物置于冰浴30分钟后加入2.5毫升PMC溶液。室温15 分钟后500微升处理的原生质体与3毫升软MnR混合并立即涂布于 含有选择因子腐草霉素(pH6.5时50微克/毫升)的MnR培养皿上。 30℃孵育5天后分析转化体(48小时以后形成肉眼可见克隆)。

用下列方法分析C1转化体(腐草霉素抗性克隆)所产生的Sh ble:牙签挑取基本转化体接种至含有腐草霉素(5微克/毫升)的GS 平板上,32℃培养5天以确定其抗性。每一经过确认的抗性克隆被 亚克隆到GS平板上。为了获得用于液体培养的孢子,将每个转化 体的两个亚克隆接种至PDA平板上。在IC1液体培养液中27℃生长 5天(200转/分钟摇动)。然后,对培养物离心(5000g,10分钟), 收集500微升上清夜。用TCA使这些样品中的蛋白质沉淀下来并且 重悬于样品缓冲液中至总蛋白浓度为4毫克/毫升(LowIy方法8)。10 微升样品(约40微克总蛋白)上样至12%丙烯酰胺/SDS凝胶上然 后电泳(伯乐微型电转印迹系统)。蛋白印迹是根据伯乐的说明 (Schleicher和Schull 0.2微米膜)使用兔抗Sh ble抗血清作为一抗 进行的。

图1和表F显示了实验结果。

表F:C1菌株中估测的Shble表达水平 蛋白印迹中所估测的 Sh ble的数量 生产培养基中估测的 Sh ble的浓度 未转化的NG7C-19  未测出 NG7C-19∷720克隆4-1  25纳克 0.25毫克/升 NG7C-19∷720克隆5-1  25纳克 0.25毫克/升 NG7C-19∷720克隆2-2  250纳克 2.5毫克/升 未转化的UV18-25  未测出 UV18-25∷720克隆1-2  500纳克 5毫克/升 UV18-25∷720克隆3-1  250纳克 2.5毫克/升

这些数据表明

1)来自pUT720的异源转录/翻译信号在金孢子菌属真菌中也是 起作用的。

2)pUT720的异源信号序列在金孢子菌属真菌中也是起作用的。

3)金孢子菌属真菌可以用做分泌异源细菌蛋白的宿主。

[2]C1菌株分泌人溶菌酶(HLZ)

已经用pUT970G9质粒转化了C1菌株NG7C-19和UV18-25。 此载体带有以下真菌表达盒:

—构巢曲霉甘油醛-3-磷酸脱氢酶A(gpdA)启动子2

—合成的T reesei纤维二糖水解酶I(cbh1)信号序列1.3

—用做载体蛋白10的Streptoalloteichus hindustanus腐草霉素抗 性基因Shble4

—克隆自pAN56-2质粒的黑曲霉葡糖淀粉酶(glaA2)铰链区11.12

—具有KEX2样蛋白酶裂解位点的连接肽(LGERK)1

—合成的人溶菌酶基因(hlz)10

—构巢曲霉色氨酸合酶(trpC)终止子5

此载体也包含β-内酰胺酶基因(bla)和来自pUC18质粒6的大 肠杆菌复制起点。图3中提供了详细的质粒图谱。

遵循已经在实施例1中描述的相同方法用pUT970G质粒转化C1 原生质体。融合蛋白(Sh ble∷GAM铰链HLZ)是具有腐草霉素抗 性的,因此可以很容易地选择C1转化体。而且,腐草霉素抗性水平 与hlz表达水平密切相关。

用如下的溶菌酶活性分析方法来分析由C1转化体(腐草霉素抗 性克隆)所产生的HLZ:牙签挑取基本转化体接种至含有腐草霉素 (5微克/毫升)的GS平板(抗性确认)和LYSO平板(通过条带 显色清除来检测HLZ活性1.10)上。将平板置于32℃培养5天。每 一经过确认的抗性克隆被亚克隆到LYSO平板上。为了获得用于液 体培养用的孢子,将每个转化体的两个亚克隆接种至PDA平板上。 在IC1液体培养液中27℃生长5天(180转/分钟摇动)。然后,对培 养物离心(5000g,10分钟)。根据Morsky等13的方法测量了这些 样品的溶菌酶活性。

表G:C1菌株产生的活性HLZ水平 培养基中的活性HLZ浓度 未转化的NG7C-19  0毫克/升 NG7C-19∷970G克隆4  4毫克/升 NG7C-19∷970G克隆5  11毫克/升 未转化的UV18-25  0毫克/升 UV18-25∷970G克隆1  8毫克/升 UV18-25∷970G克隆2  4毫克/升 UV18-25∷970G克隆3  2毫克/升 UV18-25∷970G克隆2  2.5毫克/升

这些数据表明:

1)证实了实施例1中的第一点和第二点

2)    Sh ble可以用做金孢子菌属真菌的抗性标志

3)    Sh ble可以用做金孢子菌属真菌的载体蛋白

4)    在金孢子菌属真菌中存在活性的KEX2样蛋白酶裂解 位点(否则HLZ无活性)

5)金孢子菌属真菌可以用做分泌异源哺乳动物蛋白的宿主

[3]C1菌株分泌T.reesei木聚糖酶II(XYN2)

已经用pUT1064和pUT1065质粒转化了C1菌株UV18-25。

pUT1064质粒具有以下真菌表达盒:

第一个表达盒用于选择腐草霉素抗性转化体:

—粗糙脉孢霉交叉旁路控制基因(cpc-1)启动子14

—Streptoalloteichus hindustanus腐草霉素抗性基因Sh ble4

—构巢曲霉色氨酸合酶(trpC)终止子5

第二个表达盒是木聚糖酶产生表达盒:

—T.reeseiTR2株cbh1启动子15

—T.reeseiTR2株xyn2基因(包括其信号序列)16

—T.reeseiTR2株cbh1终止子15

此载体也携带来自pUC19质粒6的大肠杆菌复制起点。图4中 提供了详细的质粒图谱。

pUT1065质粒具有以下真菌表达盒:

—构巢曲霉甘油醛-3-磷酸脱氢酶(gpdA)启动子2

—合成的T.reesei纤维二糖水解酶I(cbh1)信号序列1.3

—用做载体蛋白10的Streptoalloteichus hindustanus腐草霉素抗 性基因Sh ble4

—具有KEX2样蛋白酶裂解位点的连接肽(LGERK)1

—T.reeseiTR2株xyn2基因(无信号序列)16

—构巢曲霉色氨酸合酶(trpC)终止子5

此载体也包含β-内酰胺酶基因(bla)和来自pUC18质粒6的大 肠杆菌复制起点。图2中提供了详细的质粒图谱。

遵循已经在实施例1中描述的相同方法用pUT1064和pUT1065 质粒转化C1原生质体。pUT1065质粒中的融合蛋白(Shble∷XYN2) 是具有腐草霉素抗性的,因此可以很容易地选择C1转化体。而且, 腐草霉素抗性水平与xyn2表达水平密切相关。带有自己信号序列的 xyn2被克隆到pUT1064质粒中。

用如下的木聚糖酶活性分析方法来分析由C1转化体(腐草霉素 抗性克隆)所产生的木聚糖酶:牙签挑取基本转化体接种至含有腐 草霉素(5微克/毫升)的GS平板(抗性确认)和XYLAN平板(通 过观察透明区带来检测木聚糖酶活性17)上。将平板置于32℃培养 5天。每一经过确认的抗性克隆被亚克隆到XYLAN平板上。为了获 得用于液体培养用的孢子,将每个转化体的两个亚克隆接种至PDA 平板上。在含有5克/升Kphtalate的IC1液体培养液中27℃培养5 天(180转/分钟摇动)。然后,对培养物离心(5000g,10分钟)。 根据Miller等18的方法,我们使用DNS技术测量了这些样品的木聚糖 酶活性。

表H:C1菌株(最佳产量菌株)的活性XYN2生产水平 培养基中活性木 聚糖酶II的浓度 培养基中木聚糖酶II 的比活性 未转化的UV18-25  3.9单位/毫升 3.8单位/毫克总蛋白 UV18-25∷1064克隆7-1  4.7单位/毫升 4.7单位/毫克总蛋白 UV18-25∷1064克隆7-2  4.4单位/毫升 4.3单位/毫克总蛋白 UV18-25∷1065克隆1-1  29.7单位/毫升 25.6单位/毫克总蛋白 UV18-25∷1065克隆1-2  30.8单位/毫升 39.4单位/毫克总蛋白

这些数据表明:

1)证实了实施例2中的第一至第四点。

2)C1菌株可以用做分泌异源真菌蛋白的宿主。

[4]我们也列出了转化的UV18-25菌株的表达数据,其中表I显 示了用于转化的质粒和结果。这个表说明不但用异源表达调控序列 和信号序列可以得到内切葡聚糖酶和纤维二糖水解酶很高水平的表 达,而且用同源表达调控序列和信号序列也可以。各种质粒的详细 资料可在本文其它各处的叙述及图中找到。生产条件是35℃和碱性 pH下。

表I:转化的UV18-25菌株的表达数据 培养 总蛋白 羧甲基纤维素酶 β-葡聚糖酶 PH值 mg/ml  u/ml  u/mg  u/ml  u/mg *UV18-25  1150-23      -30  1152-3      -4  1160-2      -4      -1  1162-1      -11  F6g-20      -25 100% 94% 96% 94% 100% 69% 73% 92% 102% 112% 104% - 100% 105% 105% 112% 105% 81% 72% 95% 105% 109% 102% - 100% 111% 110% 120% 105% 118% 98% 103% 103% 98% 98% - 100% 140% 145% 147% 132% 90% 83% 120% 145% 115% 130% - 100% 149% 151% 156% 132% 131% 114% 130% 142% 103% 125% - 7.90 7.90 8.10 7.85 7.90 7.90 8.35 8.45 8.20 8.20 7.90 - 培养条件(摇瓶):88小时,35℃,230转/分钟。 *所有以上数据都是相对于亲本UV18-25菌株的百分数。

实施例附录:培养基

转化培养基:

Mandels碱:                MnP培养基:

KH2PO4       2.0克/升    Mandels碱加

(NH4)2SO4   1.4克/升    肽胨1克/升

MgSO4.7H2O   0.3克/升    MES 2克/升

CaCl2         0.3克/升    蔗糖100克/升

微量元素       1.0毫升/升  调pH值至5

 MnR:                     MnP Ca2+:

MnP+蔗糖      130克/升    MnP培养基+

酵母提取物     2.5克/升    CaCl2.2H2O50mM

葡萄糖         2.5克/升    调pH值至6.5

琼脂           15克/升

软MnR:只加7.5克/升琼脂

MPC:

CaCl2     50mM         pH5.8

MOPS       10mM

PEG        40% 用于选择和培养:

GS:

葡萄糖     10克/升

Biosoyase  5克/升      [Merieux]

琼脂       15克/升     调pH值至6.8

PDA:

马铃薯葡萄糖琼脂    39克/升    [Difco]

                               调pH值至5.5

MPG:

Mandels碱加

K.Phtalate    5克/升

葡萄糖        30克/升

酵母提取物    5克/升

加入50微克/毫升腐草霉素或100-150微克/毫升潮霉素的再生 培养基(MnR)被用于选择转化体。加入5微克/毫升腐草霉素的GS 培养基被用于证实抗生素抗性。

PDA是用于快速生长和产生孢子的完全培养基。用1/20的孢子 悬液(在一个90毫米PDA平板上所有孢子收获到5毫升0.1%吐温 中)接种液体培养基。在摇瓶中(200转)27℃培养。

C1蛋白的分离和鉴定

获得各种不同的蛋白质的方法被认为是蛋白质的许多特征。表 A、B和J中提供了纯化方案和纯化过程的详细资料。使用与WO 98/15633描述的方法,此方法引入本文做参考,类似的方法用 DEAE-Toyotearl离子交换层析从金孢子菌属真菌培养物中分离蛋白 质。从此层析中得到的非附着蛋白部分(F60-31 CF)在平衡至pH7.6 后用大量制备物离子交换层析纯化。收集非附着蛋白部分(NBNB), 附着蛋白被洗脱至0.1M NaCl梯度中。NBNB部分提供了19、30、 35和46kD的主要蛋白质和51kD的次要蛋白质。蛋白质峰从各个不 同的部分被洗脱到0.1M NaCl梯度中。39-41部分包括28、36和60kD 蛋白;44-48包括28、45和66kD主要蛋白带和33、36、55、60和 67kD蛋白;49-51部分包括30、36、56和68kD蛋白;52-59部分包 括33和55kD主要蛋白和28、36kD次要蛋白。收集的NBNB部分 经Phenyl superose疏水层析进一步纯化。用pH7.0含有1.2M (NH4)2SO4的0.03M磷酸钠缓冲液平衡NBNB部分,然后上柱。吸附蛋白被洗 脱至1.2M-0.6M(NH4)2SO4梯度溶液中。因此如同等电点为8.9的 30kD的蛋白酶一样,就得到了分子量分别为30kD和51kD、等电点 分别为9.1和8.7的同源木聚糖酶。

此木聚糖酶无MUF纤维二糖酶活性,因此是真正的木聚糖酶。 30kD的碱性(等电点为9.1)木聚糖酶在一个非常宽的pH范围即 pH5-8内具有高活性,在pH9-10时仍然维持65%的最大活性;它是 木聚糖酶F家族中的一员:在SEQ ID NO.5中列出了其部分核苷酸 和氨基酸序列。所描述的部分氨基酸序列对应于成熟蛋白N末端大 约50-170位氨基酸位置。本发明的木聚糖酶与SEQ ID NO.5部分氨 基酸序列具有至少60%,优选至少70%,最优选至少80%的序列相 同性。可用SEQ ID NO.5的部分核苷酸序列鉴定相应的作为本发明 优选实施方案的木聚糖酶启动子。51kD的木聚糖酶(等电点为8.7) 在pH6时具有最大活性,在pH7.5时保持70%的活性,在pH8.0时 保持至少50%的活性。它非常不稳定在pH5.5时只具有15%的活性, 在pH7.5时只具有4%的活性。30kD木聚糖酶对桦木聚糖的Michaelis 常数为4.2克/升,51kD木聚糖酶对桦木聚糖的Michaelis常数为3.4 克/升。最适温度较高,两种木聚糖酶都达到了70℃。

30kD蛋白酶在50℃ pH7时对NBNB部分蛋白的活性似乎等于 0.4×10-3单位/毫升。此部分对染色的酪蛋白的活性为0.4单位/毫克 (pH7)。加入尿素作为离液剂导致蛋白酶活性增加2-3倍。蛋白酶 对木聚糖酶的效应是显著的。在pH10.3 50℃孵育30分钟后只保持 了30%的木聚糖酶活性。在pH8时保持了95%的木聚糖酶活性。加 入LAS导致木聚糖酶活性急剧降低,在pH8和pH10.3时孵育10分 钟,无论有无蛋白酶抑制剂PMSF,只有50%的木聚糖酶活性保留 下来。30kD的蛋白酶是碱性蛋白,其最适pH为pH10-11。其活性 受到苯甲基磺酰氟(PMSF)而不是碘乙酸、胃蛋白酶抑制剂和EDTA 所抑制说明它是丝氨酸类型的蛋白酶。在无离液剂、50℃中性pH 条件下,蛋白酶对C1蛋白无活性。增加pH值和加入离液剂如LAS、 SDS和尿素显著增加了蛋白酶解作用。

39-41部分是用Phenyl superose疏水层析纯化的。用pH7.2含有 1.5M(NH4)2SO4的0.03M磷酸钠缓冲液平衡此部分,然后上柱。 吸附蛋白被洗脱至1.5M-0 M(NH4)2SO4梯度溶液中。因此得到了 等电点为4.7的60kD同源木聚糖酶。此木聚糖酶对木聚糖、MUF- 纤维二糖、MUF-木糖苷和MUF-乳糖苷具有活性。此木聚糖酶可能 属于家族10(家族F)。此酶在pH5到8的范围内很稳定,50℃孵 育24小时后其活性仍然大于80%。在pH5到7的范围内60℃孵育 其保持70%的活性。在pH9时50℃孵育5小时仍然保持80%活性, 24小时后保持35%活性。在pH10时50℃孵育0.5小时后保持60% 活性。在pH8时60℃孵育5小时后发现其活性为45%,24小时后降 为0。其最适pH范围为pH6-7,在pH9时保留70%活性,在pH9.5 时保留50%活性。对桦木聚糖酶的Michaelis常数为0.5克/升。最适 温度很高,达到了80℃。

44-48部分是用Mono P.A层析聚焦纯化的,7.63-5.96的pH梯 度被用于洗脱蛋白。结果是得到了等电点为6的45kD内切葡聚糖 酶。此45kD的内切酶在pH5时对羧甲基纤维素具有最大活性,在 pH5-7时对RBB羧甲基纤维素具有最大活性。在pH6.5时此内切酶 对羧甲基纤维素保持70%的最大活性,pH7.0时对RBB羧甲基纤维 素保持70%的最大活性;在pH7时对羧甲基纤维素具有50%的最大 活性,pH8时对RBB羧甲基纤维素具有50%的最大活性。对羧甲基 纤维素的Michaelis常数为4.8克/升。最适温度很高,达到了80℃。 其它28、33、36、55、60和65kD的蛋白也被混在一起洗脱下来。

52-58部分也是用Mono P.A层析聚焦纯化的,7.6-4.5的pH梯 度被用于洗脱蛋白。得到了等电点为4.9的55kD内切葡聚糖酶。此 55kD的内切酶是中性的。其最适pH值是4.5-6,在pH7.0时对羧甲 基纤维素和RBB羧甲基纤维素均保持70%活性,在pH8时对羧甲 基纤维素和RBB羧甲基纤维素均保持50%活性。对羧甲基纤维素的 Michaelis常数为1克/升。最适温度很高,达到了80℃。许多部分也 含有分子量为28、33和36kD的蛋白质。

使用Macro Prep Q层析从50-53部分得到了金孢子菌属真菌培 养物的F 60-8 UF部分,然后从吸附在DEAEToyopearl上的F60-8UF 中分离得到了45、48和100kD蛋白。

用0.03M pH5.57的吲哚盐酸缓冲液平衡50-53部分,然后上柱。 吸附蛋白被洗脱至0.1-0.25M NaCl梯度溶液中,置于梯度溶液中4 小时。其结果是分离出了均质的45kD(等电点4.2)、48kD(等电 点4.4)和100kD(等电点4.5)蛋白。

根据45kD蛋白对对硝基苯基-α-半乳糖苷和硝基苯基-β-半乳 糖苷的活性推测它是一种α、β半乳糖苷酶。最适pH是4.5,在pH5.7 时具有70%活性,在pH6.8时保留50%活性,最适温度为60℃。

48kD蛋白是对对硝基苯基-β-半乳糖苷有高活性和对MUF纤维 二糖苷、MUF乳糖苷和对硝基苯基丁酸酯有活性的纤维二糖水解 酶。48kD蛋白对CMC的最适pH为5,对RBB-CMC的最适pH 为5-6。

等电点为4.5的100kD蛋白酶只对对硝基苯基丁酸酯具有活性。 它可能是一种酯酶但不是阿魏酸酯酶,因为它对阿魏酸的甲基酯无 活性。其最适pH为中性/碱性(pH8-9),最适温度为55-60℃。

等电点为4.2的90kD蛋白酶分离自结合蛋白部分,50℃ pH7 时所测量的其对NBNB部分蛋白的活性似乎等于12×10-3单位/毫 升。此部分对染色的酪蛋白的活性为0.01单位/毫克(pH7)。在pH7 和pH9(50℃)时加入尿素作为离液剂导致蛋白酶活性增加2-3倍。 加入LAS也导致如此效果。90kD蛋白酶是中性的,其最适pH为8。 其活性受苯甲基磺酰氟(PMSF),而不是碘乙酸、胃蛋白酶抑制剂 和EDTA所抑制说明它是丝氨酸类型的蛋白酶。

等电点为4.2的43kD内切葡聚糖酶(33-37部分)、等电点为4.1 的25kD内切葡聚糖酶(39-43部分)、等电点为4.9的55kD纤维二 糖水解酶(39-43部分)和等电点为4.4的65kD多聚半乳糖醛酸酶 (39-43部分)也从结合的蛋白部分分离出来。内切葡聚糖酶对微晶 纤维素或MUF-纤维二糖苷并无活性,但对甲基纤维素、RBB羧甲 基纤维素、羧甲基纤维素41、β-葡聚糖酶和内切葡聚糖酶具有较高 活性。25kD内切葡聚糖酶不从羧甲基纤维素中产生葡萄糖,而43kD 内切葡聚糖酶则从中产生。从微晶纤维素中不形成葡萄糖。43kD内 切葡聚糖酶的最适pH是4.5,在pH7.2时具有70%最大活性,在pH8 时只保留50%最大活性。在pH5和6时孵育25小时后43kD内切葡 聚糖酶保留70%活性。在pH7孵育同样时间它只保留10%活性。25kD 内切葡聚糖酶对羧甲基纤维素的活性最适pH为5,对RBB羧甲基 纤维素活性最适pH较宽,在pH9时具有90%最大活性,在pH10时 保留50%最大活性。在pH5和6时孵育120小时后保持100%活性, 在pH7、8、8.6和9.6孵育同样时间它仍保留80%活性。25kD内切 葡聚糖酶的活性最适温度为70℃。43kD内切葡聚糖酶的活性最适 温度为60℃。对羧甲基纤维素的Michaelis常数分别是25kD内切葡 聚糖酶62克/升,43kD内切葡聚糖酶12.7克/升。多聚半乳糖醛酸酶 是一种果胶酶。对PDA的Michaelis常数为3.8克/升。PGU活性的 最适pH范围为pH5-7,最适温度为50-65℃。

编码金孢子菌属真菌蛋白的基因可以用PCR技术得到并通过序 列分析鉴定。相应的全基因是通过用分离出的PCR片段筛选(部分) 基因库而获得的。已经克隆、测序和分析了C1菌株的43kD内切葡 聚糖酶(EG6,家族6)的全基因(包括2.5kb启动子区和0.5kb终 止子区)。在SEQ ID NO.1中列出了其核苷酸和氨基酸序列。预测成 熟蛋白的分子量为39427道尔顿,等电点为4.53,与实际测量值很 接近。与6.2家族的其它糖基水解酶的蛋白质序列比较分析表明C1- EG6并不包括纤维素结合结构域(CBD)。使用SwissPort SAMBA 软件(史密斯和沃特曼公式,Gap penalty 12/2,alignment 10,blosum62 matrix)进行的同源分析表明C1-EG6与Oxysporum镰孢霉(多于376 个氨基酸)具有51.6%的相同性,与Agaricus bispoma CBH3(多于 353个氨基酸)具有51.0%的相同性,与T.reeseiCBH2(多于367个 氨基酸)具有50.7%的相同性。推测从第1位蛋氨酸到第28位精氨 酸为信号序列。启动子具有几个潜在的CreA结合位点,所以启动子 很可能在一个CreA调控的真菌菌株中受到葡萄糖抑制。

同样的,已经克隆、测序和分析了C1菌株的25kD内切葡聚糖 酶(EG5,家族5)的全基因(包括3.3kb启动子区和0.7kb终止子 区)。在SEQ ID NO.2中列出了其核苷酸和氨基酸序列。预测成熟蛋 白的分子量为21858道尔顿,等电点为4.66,与实际测量值很接近。 这是目前已知的最小的真菌内切葡聚糖酶。与家族45的其它糖基水 解酶的蛋白质序列比较分析表明C1-EG5既不包括纤维素结合结构 域(CBD),也不包括Cohesin/dockerin结构域。使用NCBI-BLASTP2 软件(Gap penalty 11/1,alignment 10,blosum62 matrix)进行的同源分 析表明与C1-EG5最接近的蛋白是Oxysporum镰孢霉,具有63%的 相同性。推测从第1位蛋氨酸到第18位丙氨酸为信号序列。启动子 具有许多潜在的CreA结合位点,所以启动子很可能在一个CreA调 控的真菌菌株中受到葡萄糖抑制。

而且,在纤维素酶家族12同源分析的基础上通过PCR技术发 现了另外一个内切葡聚糖酶。在SEQ ID NO.3中列出此内切葡聚糖 酶(EG3,家族12)的部分核苷酸和氨基酸序列。

55kD蛋白是对MUF-纤维二糖苷、MUF-乳糖苷、FP和微晶纤 维素具有活性,也对对硝基苯-β-葡糖苷、纤维二糖和对硝基苯乳 糖苷有活性的纤维二糖水解酶(本文参做CBH1)。其对MUF-纤维 二糖苷的活性受到纤维二糖抑制。抑制常数为0.4mM。对MUF-纤 维二糖苷的Michaelis常数为0.14 mM,对MUF-乳糖苷的Michaelis 常数为4mM,对羧甲基纤维素为3.6克/升。最适pH相当宽,从pH4.5 到7皆可。在pH8时对羧甲基纤维素具有50%最大活性,对RBB羧 甲基纤维素具有80%活性。在pH5-8时孵育25小时后保持70-80% 活性。最适温度为60-70℃。CBH1可能是纤维二糖水解酶家族7的 一员;在SEQ ID NO.4中列出了其部分核苷酸和氨基酸序列。所类 出的部分氨基酸序列对应于成熟蛋白N末端300-450位氨基酸位置。 本发明的纤维二糖水解酶具有SEQ ID NO.4部分氨基酸序列至少 60%,优选至少70%,最优选至少80%的序列相同性。可用SEQ ID NO.4中的部分核苷酸序列鉴定相应的作为本发明优选实施方案的 CBH启动子。在微晶纤维素水解过程中观察到了25kD内切葡聚糖 酶和55kD CBH之间的协同效应。在25kD内切葡聚糖酶与55kD CBH 的比例为80∶20时协同效应最大。Ksyn最大值为1.3。

                    表J                   纯化方案

通过RNA印迹分析研究了金孢子菌属真菌的5个主要基因的表 达水平。在33℃时各种不同的C.lucknowense菌株生长于含有 pharmedia纤维二糖和乳糖的丰富培养基(培养基1)和含有pharmedia 和葡萄糖的丰富培养基(培养基2)中。48小时后,收获菌丝体分 离RNA。用5种不同的探针EG5、EG6、EG3、XylF和CBH与RNA 杂交。爆光后剥离RNA印迹,与作为印迹中mRNA数量对照的核 酶L3探针再次杂交。在培养基1中生长的许多菌株表现出对CBH 很高的反应和对XylF的高反应。在培养基2中生长的半数菌株对所 有基因都表现出高反应性,剩下的一半反应较低。从这些数据推断 表达强度的顺序为CBH>XylF>EG5>EG3>EG6。

表A、B和J中显示了以上的详细数据。

图的说明:

图1是实施例中所描述的蛋白印迹。

图2是pUT720图谱。

图3是pUT970G图谱。

图4是pUT1064图谱。

图5是pUT1065图谱。

图6是pF6g图谱。

图7是pUT1150图谱。

图8是pUT1152图谱。

图9是pUT1155图谱。

图10是pUT1160图谱。

图11是pUT1162图谱。

图12:DEAE-Toyopearl纯化F 60-31 CF样品后对NB部分进行 Macro Prep Q离子交换层析。

图13:30kD(等电点8.9)和90kD(等电点4.2)蛋白酶对C1 蛋白的活性pH过程(50℃,孵育30分钟)。

图14:50℃时30kD(等电点8.9)“碱性”蛋白酶对F 60-31 CF 的NBNB部分(Macro Prep Q)木聚糖酶活性的影响。

图15:50℃时90kD(等电点4.2)中性蛋白酶对F60-8UF-conc 样品的附着部分44-45(DEAE-Toyopearl)蛋白羧甲基纤维素活性的 影响。

图16:65kD多聚半乳糖醛酸酶(等电点4.4)完全水解多聚半 乳糖醛酸:50℃,pH4.5,PGA浓度为5克/升,蛋白浓度为0.1克/ 升。

图17:F 60-43 UF-conc多聚半乳糖醛酸酶活性的pH和温度依 赖。

图18:纤维二糖抑制55kD CBH(等电点4.4)对MUF-纤维二 糖苷的活性:pH4.5,40℃。

图19:25kD内切葡聚糖酶(等电点4.1)和55kD CBH(等电 点4.4)对微晶纤维素的协同效应(40℃,pH5,25分钟)。

图20:从F 60-8 UF-conc样品的附着部分分离出的酶对羧甲基 纤维素(a)和微晶纤维素(b)的完全水解(50℃,pH5):羧甲基 纤维素和微晶纤维素浓度为5克/升,25kD内切葡聚糖酶浓度为0.01 克/升,43kD内切葡聚糖酶浓度为0.02克/升;1代表25kD内切葡聚 糖酶(等电点4.1),2代表43kD内切葡聚糖酶(等电点4.2)。

图21:无(a)或有(b)δ葡糖酸内酯时55kD CBH(等电点 4.4)对羧甲基纤维素(1)和微晶纤维素(2)的完全水解(50℃, pH4.5):羧甲基纤维素和微晶纤维素浓度为5克/升,蛋白浓度为0.1 克/升,δ葡糖酸内酯浓度为5克/升。

图22:从F 60-8 UF-conc样品中分离出的酶对羧甲基纤维素和 RBB羧甲基纤维素酶活性的pH依赖:1代表25kD内切葡聚糖酶(等 电点4.1),2代表43kD内切葡聚糖酶(等电点4.2)。

图23:55kD CBH(等电点4.4)的羧甲基纤维素酶和RBB羧 甲基纤维素酶活性的pH依赖。

图24:从F 60-8 UF-conc样品的附着部分分离出的酶羧甲基纤 维素酶活性(pH4.5)的温度依赖:1代表55kD CBH(等电点4.4), 2代表25kD内切葡聚糖酶(等电点4.1),3代表43kD内切葡聚糖 酶(等电点4.2)。

图25:从F 60-8 UF-conc样品的附着部分分离出的酶的pH稳 定性:1代表55kD CBH(等电点4.4),2代表25kD内切葡聚糖酶 (等电点4.1),3代表43kD内切葡聚糖酶(等电点4.2)。

图26:从F 60-8 UF-conc样品的附着部分分离出的酶的吸附。

发明摘述

参考文献(内容引入本文做参考):

1.Calmels T.P.,Martin F.,Durand H.,和Tiraby G.(1991)在真菌中 对分泌蛋白处理过程中发生的蛋白酶解作用。生物工艺学杂志17

(1):51-66。

2.Punt P.J.,Dingemanse M.A.,Jacobs-Meijsing B.J.,Pouwels P.H., 和Van den Hondel C.A.(1988)构巢曲霉甘油醛-3-磷酸脱氢酶基因的 分离和鉴定。基因69(1):49-57。

3.Shoemaker S.,Schweickart V.,Ladner M.,Gelfand D.,Kwok S.,Myambo K.,和Innis M.(1983)来自T.reesei的异源纤维二糖水解 酶的分子克隆。Bio/Technology 10:691-696。

4.Drocourt D.,Calmels T.,Reynes J.p.,Baron M.,和Tiraby G.(1990) 用于转化具有较打或较高腐草霉素抗性真核生物的 Streptoalloteichus hindustanus ble基因表达盒。核酸研究18(13): 4009。

5.Mullaney E.J.,Hamer J.E.,Roberti K.A.,Yelton M.M.,和 Timberlake W.E.(1985)构巢曲霉trpC基因的一级结构。Mol Gen Genet 1999(1):37-45。

6.Yanisch-Perron C.,Vieira J.和Messing J.(1 987)改进的M13噬 菌体克隆载体和宿主菌株:M13mp18和pUC19载体的核酸序列。 基因33:103-119。

7.Durand H.,Baron M.,Calmels T.和Tiraby G.(1988)经典遗传学 和分子遗传学用于选择具有改进的纤维素分解活性的T.reesei工业 菌株,纤维素酶降解的生物化学和遗传学,J.P.Aubert,编者。Academic Press135-151。

8.Lowry O.H.,Rosebrough N.J.,Farr A.L.,和Randall R.J.(1951)用 氟林酚试剂测量蛋白质。生命的化学杂志193,265-275。

9.Parriche M.,Bousson J.C.,Baron M.,和Tiraby G.在丝状真菌中 发展异源蛋白分泌系统,第3届欧洲真菌遗传学会议,1996。慕斯 特,德国。

10.Baron M.,Tiraby G.,Calmels T.,Parriche M.和Durand H.(1992)Tolypocladium真菌有效分泌与Sh ble腐草霉素抗性蛋白融 合的人溶菌酶。生物工艺学杂志24(3):253-266 。

11.Jeenes D.J.,Marczinke B.,MacKenzie D.A.,和Archer D.B.(1.993) 一个用于黑曲霉分泌异源蛋白的截短的葡糖淀粉酶融合。FEMS Microbio1.Lett.107(2-3):267-271。

12.Stone RJ.,Makoff A.J.,Parish J.H.,和Radford A.(1993)粗糙脉 孢霉的葡糖淀粉酶基因的克隆和序列分析。现代遗传学24(3): 205-211。

13.Morsky P.(1983)用Lysodeikticus微球菌细胞比浊法测量溶 菌酶:对反应条件的再检查。分析生物化学128:77-85。

14.Paluh J.L.,Orbach M.J.,Legerton T.L.,和Yanofsky C.(1988)粗 糙脉孢霉交叉旁路控制基因cpc-1编码与酵母GCN4相似的蛋白和 癌基因v-jun编码的蛋白的DNA结合结构域。ProcNatlAcadSciUSA 85(11):3728-32。

15.Nakari T.,Onnela M.L.,Ilmen M.,Nevalainen K.和Penttila M.(1994)葡萄糖存在时有活性的真核启动子。专利WO 94/04673, Alko。

16.Torronen A.,Mach R.L.,Messner R.,Gonzalez R.,Kalkkinen N.,Harkki A.和Kubicek C.P.(1992)T.reesei的两种主要的木聚糖酶: 两种酶和基因的鉴定。生物工艺学(NY)10(11):1461-5。

17.Farkas V.(1985)检测产生纤维素酶和木聚糖酶的微生物的新 的培养基。FEMS Microbiol.Letters 28:137-140。

18.Miller G.L.(1959)使用二硝基水杨酸试剂测定还原糖。分析 化学31:426-428。

19.Punt P.J.,Mattem I.E.,van den Hondel CA.M.J.J.(1988)一种带 有腐草霉素抗性的曲霉转化载体。真菌遗传学通讯35,25-30。 金孢-子-菌序列 SEQ ID No.1: C1-EG6″43kD″(家族6)是基于“43kD Endo”蛋白测序及家族6纤维素酶同源性分析而经PCR获得。 -2508       GGATCCACACCTACCATACCGGATAGTATGCTACCCAAGTGACATAGG      -2461 GTTGGTAAAGTAATACGAGAACTCAGAGAGCACTGCCCATATGGCTCGCCAATGACCTCA      -2401 AGTGCCAGGTCAGCTTTGCGAGACAGACCTGAGCGCGTCGGATGTGTGACATGGAACGCG      -2341 CCGGATCGCCTTGTTGATTAATTATAGGGAAGTAGCGAGGAAGGTTTCAGCAATTGACGT      -2281 GAGCGTACATTAAAAGCTGTATGATTTCAGGAAGACGAGCCATGGACCAGGTTTCAAGGC      -2221 TGAATGGCTTGACGACTTAAGCACCGAACGAGGAATGAAAGAATGAAAAGTGGGGGATCA      -2161 creA TTCTGGCCCCTCCTCGTATGTCGAGTGTTAAAGAAGGCGGTTCTACGGAGGACCTAAAGA      -2101 GCTCCAATTTGCTCTGTTGAGCTTAAGCCACATATCTCAAGATGAATACATGTCAGGCAT      -2041 AGTCACCCTGATCTTGTTCATCAGTCCACACACTTTTCAGTTCAGCATGTTGATTCCTCA      -1981 TCCATATCACTTTCCATTACTATCTCTTTATGTCCTTGGTCAAGACTCCAAGGAACCGAT      -1921 AGGTGAGCATCGGTGAGGCTCCCTCAAGGTACCAAAGTAGCCATCATCACCGAGGTCTGG      -1861 GAATGGCGCCGTGCCCGATCTGAGTCCTCCAACTCCACGGTACGACGACAGCACGTCACA      -1801 TTGACGCACCACGGTTGAACAAGCAGAGAGGGACACGTCTTGCTACGCGAATCCTGGCAC      -1741 TGGATGGAGACGCGTGTGAGCAGGTTTCCGGAACCATGACGGCCTGGTCCGGCTTCTCGA      -1681 ACAAAGAAGTGGAACACAAAAAGAACCGAAACGGAAACGCAGGCACGGCATCGACGACCG      -1621 GATTGTCCCACGGGGACCTCGGCCAGTCAAGCGTTGCCCTGGCCGTCAGCTCCCTGGCGA      -1561 CGGGGATTCAGCACATCTCACGTTATAGGCGACCTCATCCCCCTTCCGTCTTGTGCGGTC      -1501 GTTGCTCCGTGCCGAGTACCCAGGCGTGCCGGGGCCTTTAGCCGGGGCGGAATCAGAGTC      -1441 creA AAAGATGCGGCCGAATTGGACGGCAGACGAAGTTTCGTAGAGGGTCATGTCGGCACTGAC      -1381 GACACCCACCCCTGCGTGATCCCGTGGCCCTGGGCTGGGAATTGCCGGCTAATAATCTAC      -1321 GGCTTAATAGATATGCACTTTGCACGCGGTGCAGATAAATAAGCTGTGGTTTCAAACACT      -1261 GGCCTCCGTACTTTACCCACCAACTGCCGCTTAGCGCCGGGACCTGAGTCTTGGGAGTGC      -1201 GCGGAGCGGCAGCCACCTCGGGTTAGCGTACACACGACCTGCAGTGGCGGGGATGCCGCG      -1141 creA TGCATGGCTTCATAGTGTACGACAGACCGTCAAGTCCAAATCTGGGTGATGCTTGATGAG      -1081 creA ATGACAGCGAGCCCCGTCGGCGGCACCCCGGCTATGCATCGCGAATTGACAACACTCTCA      -1021 GCTCTATTGCGACCCATCGGATAAAAGAAGAAGAAAAAAATGGACCTTGAGTACGGGCGT      -961 CAGAAACCAAAAAAAAACTCCGGAACCAAATATGTCGGGCATGGCCGGGGTGAACGACCG      -901 CTACTCCCCGTTCCCTTCTTCGCAAACAGAACGCFACAGAGGGTTTTCTGGTTTGTCAAA      -841 GAGTTCGGAGGTCCTCTGCTCCGCGAATGCGTGGTGAACCCACCAGCAGCCATTGTTCTT      -781 GCATGCGTGGCGGACCGTTAGCCGCTGATCGACATGGCGAGCTTCCCACCTCAGACCTGG      -721  creA AGCAGACGGTTGCGAGGAGCAAGGGGCTGCCCTCCCCCTGACGGTCGGACCCCAATGACT      -661 TCCCCAAACGGGGACATCGAGGGTCGTGCATGATGGTGGAAAGTAGTTGCAGTATGGGAA      -601 GTACCCCGGGTTGCCAGGAACCGTTGTTCGGCCCCCCACATTTTCTCTCTGCCATGTCAA      -541 CTGTGTGTCGTTCGAGAGTTCCTGGCTCCGGCCCCCCGTCCAATTCCCTAACGGGACCGC      -481  creA GGGGCATCGCCTGTAACTAACTTCCAAATGAAGCCGGATATGAGGGAGGGAGATTGGATC      -421 TGGCAAGCCAGCCATTCGCTGCGATCGGCACTCGTCCGTCAGCCCCGCAGTCCATATCCC      -361   areA CAAAGGCAACTGCTCGGCGCGGCTCAAGTCTrCTTCGGAACGTCCAGCCCGAAGGCGCGC      -301 GCCAGCACCGGCCCTATGTTCCTGATTGCGATCCTCGATCTCCAGAGACGGGTCACCTCG      -241 CCTCGAGGACGGTGCAGGGGCATCGGCTTCGCTTCCTAGAGCTCCGGGCTGTGTGTGGTC      -181 AAGGGGAGAAGGCGGCGGCGCCAAGGTGCGTCTCGGCGCACTdACCCATCGCCTTTACCC      -121 CCCTCCCCCCCAGTATATAAAAGATGGCCATCGTCTCCTCGTCTGCTTGGGAAGAAAGGA      -61 TCTCTCGACCATGCACCACAGCCTAGCTCTAACCCAGCTTGTCGTGTGTTGTTGCCCAGC      -1转录起始 ATGAAGTTCGTGCAGTCCGCCACCCTGGCGTTCGCCGCCACGGCCCTcGCTGCGCCCTCG      +60推测的信号序列  M  K  F  V  Q  S  A  T  L  A  F  A  A  T  A  L  A  A  p  S        20 CGCACGACTCCCCAGAAGCCCCGCCAGGCCTCGGCGGGCTGCGCGTCGGCCGTGACGCTC      +120  R  T  T  P  O  K  P  R  Q  A  S  A  G  C  A  S  A  V  T  L        40 GATGCCAGCACCAACGTGTTCCAGCAGTACACGCTGCACCCCAACAACTTCTACCGTGCC      +180  D  A  S  T  N  V  F  Q  Q  Y  T  L  H  P  N  N  F  Y  R  A        60 GAGGTCGAGGCTGCCGCCGAGGCCATCTCCGACTCGGCGCTGGCCGAGAAGGCCCGCAAG      +240  E  V  E  A  A  A  E  A  I  S  D  S  A  L  A  E  K  A  R  K        80 GTCGCCGACGTCGGTACCTTCCTGTGGCTCGACACCATCGAGAACATTGGCCGGCTGGAG      +300  V  A  D  V  G  T  F  L  W  L  D  T  I  E  N  I  G  R  L  E        100 CCCGCGCTCGAGGACGTGCCCTGCGAGAACATCGTGGGTCTCGTCATCTACGACCTCCCG      +360  P  A  L  E  D  V  P  C  E  N  I  V  G  L  V  I  Y  D  L  P        120 GGCCGTGACTGCGCGGCCAAGGCCTCCAACGGCGAGCTCAAGGTCGGCGAGCTCGACAGG      +420  G  R  D  C  A  A  K  A  S  N  G  E  L  K  V  G  E  L  D  R        140 TACAAGACCGAGTACATCGACAgtgagttaaccctttgtggccccttcttttcccccgag      +480内含子1  Y  K  T  E  Y  I  D                                               147 agagcgtctggttgagtggggttgtgagagagaaaatggggcgagcttaaagactgacgt      +540 gttggctcgcagAGATCGCCGAGATCCTCAAGGCCCACTCCAACACGGCCTTCGCCCTCG      +600

        K  I  A  E  I  L  K  A  H  S  N  T  A  F  A  L         163 TCATCGAGCCCGACTCGCTCCCCAACCTGGTCACCAATAGCGACCTGCAGACGTGCCAGC      +660 V  I  E  P  D  S  L  P  N  L  V  T  N  S  D  L  Q  T  C  Q         183 AGAGCGCTTCCGGCTACCGCGAGGGTGTCGCCTATGCCCTCAAGCAGCTCAACCTCCCCA       +720 Q  S  A  S  G  Y  R  E  G  V  A  Y  A  L  K  Q  L  N  L  P          203 ACGTGGTCATGTACATCGATGCCGGCCACGGTGGCTGGCTCGGCTGCGACGCCAACCTCA       +780 N  V  V  M  Y  I  D  A  G  H  G  G  W  L  G  W  D  A  N  L          223 AGCCCGGCGCCCAGGAGCTCGCCAGCGTCTACAAGTCTGCTGGTTCGCCCTCGCAAGTCC       +840 K  P  G  A  Q  E  L  A  S  V  Y  K  S  A  G  S  P  S  Q  V          243 GCGGTATCTCCACCAACGTGGCTGGTTGGAACGCCTGgtaagacactctatgtccccctc       +900内含子2 R  G  I  S  T  N  V  A  G  W  N  A  W                               256 gtcggtcaatggcgagcggaatggcgtgaaatgcatggtgctgacctttgatcttttccc       +960 cctcctatagGGACCAGGAGCCCGGTGAGTTCTCGGACGCCTCGGATGCCCAGTACAACA       +1020

        D  Q  E  P  G  E  F  S  D  A  S  D  A  Q  Y  N          272 AGTGCCAGAACGAGAAGATCTACATCAACACCTTTGGCGCTGAGCTCAAGTCTGCCGGCA       +1080 K  C  Q  N  E  K  I  Y  I  N  T  F  G  A  E  L  K  S  A  G          292 TGCCCAACCACGCCATCATCGACACTGGCCGCAACGGTGTCACCGGTCTCCGCGACGAGT       +1140 M  P  N  H  A  I  I  D  T  G  R  N  G  V  T  G  L  R  D  E          312 GGGGTGACTGGTGCAACGTCAACGGCGCCGGCTTCGGTGTGCGCCCGACTGCCAACACTG       +1200 W  G  D  W  C  N  V  N  G  A  G  F  G  V  R  P  T  A  N  T          332 GCGACGAGCTCGCCGACGCCTTCGTGTGGGTCAAGCCCGGTGGCGAGTCCGACGGCACCA       +1260 G  D  E  L  A  D  A  F  V  W  V  K  P  G  G  E  S  D  G  T          352 GCGACTCGTCGGCGGCGCGCTACGACAGCTTCTGCGGCAAGCCCGACGCCTTCAAGCCCA       +1320 S  D  S  S  A  A  R  Y  D  S  F  C  G  K  P  D  A  F  K  P          372 GCCCCGAGGCCGGTACCTGGAACCAGGCCTACTTCGAGATGCTCCTCAAGAACGCCAACC       +1380 S  P  E  A  G  T  W  N  Q  A  Y  F  E  M  L  L  K  N  A  N          392 CGTCCTTCTAAGCTCCTCGACGGCTTCTTGCTGTCAGTCGCTCTGACGGTGGTGTGCTGG       +1440  t49 P   S   F   *                                                                                        395 TGGTGCCCCTGCTCCTGCTGCTGCTGCTCCGCGGGGAGGGGAGGCAACGAAAATGAAGTC       +1500  t109 CTGCTTCAAAACAAAACAGAAACAAGCGAGGCGCGGTGCAATGGTCGTGCGTTCGTCTTT      +1560 t169 TTTCATGTTCCCTTCTAGTGTAGTAGTTTGATAGTCGTACATAAGGGGTTTCAGAACCGT      +1620 t229 CTCTCTGTCTCGGTCTTTTTGCGAGTTGTTGCGACTCGTGATTATGGCCTTTGTTGCTCG      +1680 t289 TTGCGGCAGAGTAGAACCACAGCGTGTTGGGGTAGCAGCTTGCTCCGTAGGACGTAGGGA      +1740 t349 AACAACCTGAGACTCTGGAATTGCAGTCAGCCTGCGTCGCCCCTCTAGGAAACGAAGGGG      +1800 t409 AGAACCAGTAGTGGCTGCAGCTTACAAACGCGAGCATGGTGAACATCTCCGAGAAAAGGG      +1860 t469 AGGGATCC                                                          +1868 t477    BamH I SEQ ID No.2: C1-EG5″25kD″(家族45)基因,其是基于“25kD Endo”蛋白测序和家族45同源性分析而经PCR获得。 -3309                                              GCTTAGGAG      -3301 AATCACGAGAAGCTAATTGGGCTCTATAGTATCCGACAAGATGACCCAGAGCGAGATTGA      -3241 GGATCTCGAGGGAACCCTGAAGCAGAGCAGCAACAACGACACCAGCCTCCTCCGCGACCT      -3181 GCTCGACAAGATTCCCGATGGCCTCCTCGGCGGCAACAACAAATCCAAGCTGGACGATAT      -3121 CCAGAGCAACGCGCAGGCCGCGCAGATGGAGAACCTGAGCGTCTCGCCGCGGGAACCCGA      -3061 GGAGCTGACCAGATACGTCCAGGAAGTGTTCCGTCAGATCATGCCCGCCATCAAGTTCCA      -3001 TGACCAGCTTCTCCAGGACATCTCGGAGGCCATCGACAAGATCCCGGTGCTGCCCAAGAT      -2941 TGTGGAGCAGCTGGAGGAGCAGATGTCCATCTTTGTATTCCAGATCATGGCCCCGTTCGT      -2881    creA GGTTCCGCTTATCGAGCAGATCAAGAACGAGCTCGCGACTGGCTCCAGCGAGATCATCCA      -2821 GAGCAGCAGGGCTGAGCAGCACAACGTCTTTGAGGACGACAACGCCACCGACCCGACTCA      -2761 CTCGATGTTGGCCAAGGACCACTTTAGTAACGTAAAGCCGACCCTAATCAGAAGCTCGCA      -2701 TGTAGAATTGAGTTAGACTGACGCGACTTGTTTCCCGTCTCTGTAGATCCTCAACGAGAT      -2641 CGGCGGTCGCGCCGCCTCCAAGGTCGTCTCCTGGGTCGTCCCGCAGCTCATGGAGGCCTG      -2581 GGACGATGACAGCGTCGACGTGGACCGCCTGCTTGACAAGATCATTTACGGAGTGTTCCA      -2521 CCATCCCGCGCAGCGCACCATGGGCCCTGAGGGGGCGTCCGAGGGCCGGGAGCTCATCTT      -2461 CAACATGGTGCGCGAGTGGTGGGAGGACATGAGCGACGGGCAGCGCGACGAGTACCGGGG      -2401   creA CAAGCTGAGCCGCGAGGGAGTCGAGAGAGGCGACAACCACCGCGAGGGCCAGCACGACTG      -2341 CGGCCACGGCTGCGGGGGCAAGCTCAAGATGCACAAGAACTTCCGGAACGAGGCGCCCCA      -2281   creA GACGGTAGAGGACCAGATCGCGGGCGCCGCCGCGGAGGCCATCATGGGAGGCGTCAAGCA      -2221   creA GGGCCTGTCGCAGGCCGTGCAGAACGCCGCCGGCCGCCAGGAGTCGTCGGAGAGCAGCGG      -2161 CCTGGGTGGGTTCATCAGCAGCGTCGCGGGCGGCCTCCTGGGCGGCGCCCTCAAGAGGGA      -2101 CGAGACAGAGTCGTACCAGGCCGGCGGCCGCACCGAGGACGGCGGGTACACGCAGACCAC      -2041 GACCGAGTACGGCTACTCCGGAGGCCGCTACGGCCAGGCCCAGTACACGGAGACGCAGTA  -1981 CGGCGGCGGCGGCGGCGGCCGCAGCGAGTACCGCCGCTACGAGCAGCGCGAGGATGATGA  -1921 CGGCCGGGTCCAGAGCTACGGATACACGGAACAGCGCACCGAGACGCGCTACGACAGCTA  -1861 CTCGGGTGGCTATGGCGGCCGCGAGGAGACCAGCAGCTATGGCGGCGGCGGCAGCGCGAG  -1801 CGAATACATTCGTAGCTCCCAGCAGAGTAGCTACGGTGGCAGCGGCTATGGCAGTGGGTA  -1741 CGGTCGTCGTGATGAAGAAGAGAGCAGCGGCTATGGAAGTGGTTACGGTCGTCGTGATGA  -1681 AGAGGAGAGTGGTGGTTATGGTGGCGGCTATGGCCGCCGTCAGGAAGAAGAGAGTAGCAG  -1621 CTATGGAAGCGGTTATGGTCGTCGTCGTGATGAAGAAGAGAGCGGCGGTTATGGTGGTGG  -1561 CTACGGCCGCCGTCAGGAAGAAGAGAGTAGCGGCTATGGAAGTGGTTACGGTCGTCGTGA  -1501 TGAAGAAGGGAGCGGCGGTTATGGTGGTGGCTACGGCCGCCGTCATGAGGAAGAGAGCAG  -1441 TGGTTACGGCAGCGGCTATGGTCGTCGCCATGAAGAGGAGGGCGGTGGCTACGGCAGTGG  -1381 TTACGGCCGCCGGCGCAACGACGAGGAGGAAGAGGAGGATGGCGGACGCCGGAGGTGGGG  -1321  creA TTACTAGGGTGAACTCTTCCGGCCGGTCTCTTGTTGTGAACCTTGCTGTTGCATGGGCAG  -1261 GACCGGTGCATCATGAACAGGACGGTGCGCTGTGTTTTTTTTTTCTCGGGGTCTTGATTG  -1201 TTTGTTGAATCTCCCTTTTCGAGGATAC6AGCTCTCTCGGGGACGAATAGATGAAGGCAA  -1141 TCTGACAGATTTGCTCTCAAAAAAAGACTGATATCTCTTCCACCATGCACTGTATGTACA  -1081  nit2 TTACATACATTATCCCCCTCCACTGGATTCGCACAACGGAAAGCAATGGCGCGCTGATTC  -1021 AAGAACCATCAGGGCTGTCATTGGCTTGTTTTGTGCCGTGGCCGCGGTGACGCCCACTAT  -961 GACTCTCTGGGCAGGCGGCAACTGGGTGCCAGATATATTAATCCGGGGCATAGCGCATAT  -901   creA CTTCCTTGATTTGTAGAGTACTAGTACACTAACCCCCTTCTCCACATGGGGCCACTGTTC  -841   nit2 GGTAGATCTGCCCGAAGTGCAAGTGCGGGGGGGGCCAAACTAGGTAATATCCTCCCGCTC  -781   creA TCCCGAGTGCGCGGACTAACCGTCATTGCTCCCAGAGGCTTGCACTCTATCGCAGGCCTT  -721   nit2 TTCCAATAAGGATGGGGCGTTCGGCGGTGATGATGCCGGTCGTGCGGGGCATACGGGGAG  -661   creA GGTAGATAGAAAATAACGACGCTGGTGTTTGGAGAGGGGAGGGGGGACTATTAGGGGAGG  -601   creA  nit2 GAAATACAGGGGCAGGGGGTGAGACGGGTGACGTTCCGGCGGAACCTCGCGCTTGTCAAA  -541 CAAGCAGC CCTGTTAGGTTGCTCTAGACTGTGTACATACATACATATGTACATACTGTA  -481 TGTACTGCACATACTTTAACTTGGTGCTTCCCTGTGAGCCGCCAGGAACATCACAACTGC  -421 AAGCGGAAAAGGCCCCATATACGGGGCGGCTTGTCGGGATGGCTCCCCCCTTCGGAACGG  -361 GTCTGACTTCCGAGGATTTTACCTGCTTCATTTGGGTATTCTGCGATGGCCTGTTCAACC  -301 CTTCCCCTGGCCGAACCGTTTCTTGGCTCGATCCTAGTGTACACTACACTACTCGTAGAC  -241 TGCCTGCCCGACGATCCGCGGGAACGGGCCAGGAGTGTGGAGTGGAGACGGGCGGCGGTG  -181   creA ATGTCGTGTAATTAAATATATAAGrGAGAGTGTTTTTTGACTGCCCCGGGTTCTGGTAGT  -121   TATA盒 AGAAGGGAAGTTCGATGCTCTCTGCTGTCGTCGCTCTCGTCGCTCTCGTCGGCATCCTCC  -61 ATCCGTCCGCCTTTGATAACCCGCTCCCCGACTCAGTCAAGACGACGCATACTTGGCACC  -1 ATGCATCTCTCCGCCACCACCGGGTTCCTCGCCCTCCCGGCCCTGGCCCTGGCCCAGCTC  +60推测的信号序列  M  H  L  S  A  T  T  G  F  L  A  L  P  A  L  A  L  A  O  L    20 TCGGGCAGCGGCCAGACGACCCGGTACTGGGACrGCTGCAAGCCGAGCTGCGCCrGGCCC  +120  S  G  S  G  Q  T  T  R  Y  W  D  C  C  K  P  S  C  A  W  P    40 GGCAAGGGCCCCTCGTCTCCGGTGCAGGCCTGCGACAAGAACGACAACCCGCTCAACGAC    +180  G  K  G  P  S  S  P  V  Q  A  C  D  K  N  D  N  P  L  N  D      60 GGCGGCTCCACCCGGTCCGGCTGCGACGCGGGCGGCAGCGCCTACATGTGCTCCTCCCAG    +240  G  G  S  T  R  S  G  C  D  A  G  G  S  A  Y  M  C  S  S  Q      80 AGCCCCTGGGCCGTCAGCGACGAGCTGTCGTACGGCTGGGCGGCCGTCAAGCTCGCCGGC    +300  S  P  W  A  V  S  D  E  L  S  Y  G  W  A  A  V  K  L  A  G      100 AGCTCCGAGTCGCAGTGGTGCTGCGCCTGCTACGAGCTGACCTTCACCAGCGGGCCGGTC    +360  S  S  E  S  Q  W  C  C  A  C  Y  E  L  T  F  T  S  G  P  V      120 GCGGGCAAGAAGATGATTGTGCAGGCGACCAACACCGGTGGCGACCTGGGCGACAACCAC    +420  A  G  K  K  M  I  V  Q  A  T  N  T  G  G  D  L  G  D  N  H      140 TTTGACCTGGCCgtgagttgcctccccttctccccggaccgctcagattagatgagatta    +480内含子1  F  D  L  A                                                      144 gactttgctcgtaaatcggtccaagattcccttgactgaccaacaaacatcatacgggca    +540 gATCCCCGGTGGCGGTGTCGGTATTTTCAACGgtaagctggtgcccccggacccctcccc    +600内含子2   I  P  G  G  G  V  G  I  F  N                                   154 ggacccctcccccttttcctccagcgagccgagttgggatcgccgagatcgagaactcac    +660 acaacttctctctcgacagCCTGCACCGACCAGTACGGCGCTCCCCCGAACGGCTGGGGC    +720

               A  C  T  D  Q  Y  G  A  P  P  N  G  W  G      168 GACCGCTACGGCGGCATCCATTCCAAGGAAGAGTGCGAATCCTTCCCGGAGGCCCTCAAG    +780  D  R  Y  G  G  I  H  S  K  E  E  C  E  S  F  P  E  A  L  K      188 CCCGGCTGCAACTGGCGCTTCGACTGgtacgttgctttgacataccggaacccaattcct    +840内含子3  P  G  C  N  W  R  F  D  W                                       197 ccaacccccccccttttctcccccaactccgggggtagtcggaatgtcgcgactgaccct    +900 atttcagGTTCCAAAACGCCGACAACCCGTCGGTCACCTTCCAGGAGGTGGCCTGCCCGT    +960

     F  Q  N  A  D  N  P  S  V  T  F  Q   E  V  A  C  P      214 CGGAGCTCACGTCCAAGAGCGGCTGCTCCCGTTAAGAGGGAAGAGAGGGGGCTGGAAGGA   +1020  t25 S  E  L  T  S  K  S  G  C  S  R  *                              225 CCGAAAGATTCAACCTCTGCTCCTGCTGGGGAAGCTCGGGCGCGAGTGTGAAACTGGTGT   +1080  t85 AAATATTGTGGCACACACAAGCTACTACAGTCCGTCTCGCCGTCCGGCTAACTAGCCTTG   +1140  t145 CTGCGGATCTGTCCATCTTCGGTCCGAACTGTCCGTTGCTGTTTTGGCTCGGTGCCTCAT   +1200  t205 CTTCTCCCAACCTAGTCAAGAATGAATCGTGAGAGAGGCTGAGAGAGATAAGATCGACTT   +1260  t265 CAGAAATCCAGGGrTGAAAGAATAAAAAAAATTCCTGTGGGGATGAATATCTCGTGATGC   +1320  polyA位点 AACGACCCTCCTAGGAAACCTTGACGAAATTTGCTGACGGCAAATTCIACAAAGACTCTT   +1380  t385 TAACCGGTCGCCCGTAGTGGTCCTGTTGCCCCAATCCGTTTGTGTTGAAATGACATTGCG   +1440  t445 CGTAACGCCGGACTCATATCAACTGCGTACCGAAAGCCAATCCCTCCCCAAACACGCCCT   +1500  t505 CTCTAATAAG CTCTCCCAAACAAGACCTCTTGAGACAGAAAATACGCCCAGATGCTGGG   +1560  t565 ACTTGACAAGCCGGGGGGGGGGGGGGGCTTGTCAAGYHVSSSSSCTTGCCCATTTCATGC   +1620  t625 TGGTATCAAAAAAACAAAAAAAAAAAAAAACATTTCAAGTCGCGGATGCCCCATTTACAT   +1680  t685 TGCTTGCGTGCGCCAATAGAAACTTGCAACACGTCAGTGTCATCTTGCACGCCTTGG      +1737  t742 SEQ ID No.3: C1-EG3(家族12)基因片段,其基于家族12纤维素酶同源性分析而经PCR获得。 GAATTCGGGGATTACGAGCTAATGATCTGgtcagttttttttttcttttttcttttcttcncttttcttttcttttcctttctcctgttttattttctta  100

   g  d  y  e  l  m  i  w tccattgcttcgccctctttccttaaccctgctgactctctcttcttgtcaatgatactgtaatagGCTGGCGAGATTCGGCGACGTCTACCCCATCGGC  200

                                                                L  A  R  F  G  D  V  Y  P  I  G TCGTCCCAGGGCCACGTCAACGTGGCCGGCCAGGACTGGGAGCTGTGGACGGGCTTCAANGGNAACATGCGGGTCTACAGCTTCGTAGCGCCCANCCCC   299  S  S  Q  G  H  V  N  V  A  G  Q  D  W  E  L  W  T  G  F  X  G  N  M  R  V  Y  S  F  V  A  P  X  P CGCAACAGNTTCAGCGCCAACGTCAAGGACTTCTTCAACTATCTCCAGTCCAACCAGGGCTTCCCGGCCAGCAGCCAATACCTTCTCAAgtaaggagacga 400  r  n  x  f  s  a  n  v  k  d  f  f  n  y  1  q  s  n  q  g  f  p  a  s  s  q  y  1  1  n? gatctcgaacagcataccatatatgcgtgcggtacaagtgcactaaccccctttttttcccgttcgcagtCTTCCAGTTCGGCACTG               487

                                                           ? ? ? SERQ ID No.4: 金孢子菌纤维二糖水解酶CBHI

   TTTNGGGCGCCGTCTTACTCCTACCTTGCACCGTGATCGGCCAGTCGCGCTGCGAGGGCG

1     ? G  A  V  L  L  L  P  C  T  V  I  G  Q  S  R  C  E  G

   ACTCGTGCGGCGGTACCTACAGCACCGACCGCTATGCCGGCATCTGCGACCCCGACGGAT    61  D  S  C  G  G  T  Y  S  T  D  R  Y  A  G  I  C  D  P  D  G

   GCGACTTCAACTCGTACCGCCAGGGCAACAAGACCTTCTACGGCAAGGGCATGACGGTCG   121  C  D  F  N  S  Y  R  Q  G  N  K  T  F  Y  G  K  G  M  T  V

   ACACGACCAAGAAGATCACGGTCGTCACCCAGTTCCTCAAGAACTCGGCCGGCGAGCTCT   181  D  T  T  K  K  I  T  V  V  T  Q  F  L  K  N  S  A  G  E  L

   CCGAGATCAAGCGGTTCTACGTCCAGAACGGCAAGGTCATCCCCAACTCCGAGTCCACCA   241  S  E  I  K  R  F  Y  V  Q  N  G  K  V  I  P  N  S  E  S  T

   TCCCGGGCGTCGAGGGCAACTCCATCACCCAGGACTGGTGCGACCGCCAGAAGGCCGCCT   301  I  P  G  V  E  G  N  S  I  T  Q  D  W  C  D  R  Q  K  A  A

   TCGGCGACGTGACCGACTTCCAGGACAAGGGCGGCATGGTCCAGATGGGCAAGGCCCTCG   361  F  G  D  V  T  D  F  Q  D  K  G  G  M  V  Q  M  G  K  A  L

   CGGGGCCCATGGTCCTCGTCATGTCCATATGGGACGACCACGCCAGTNAACA   421  A  G  P  M  V  L  V  M  S  I  W  D  D  H  A  S  ? SEQ ID No.5: 金孢子菌木聚糖酶F

    TGACCTTCTCCTCCTTCTCCCGAACAATAATAGATAATTACGAGCCGGTTCGAGGCTGAC   1

    ATTGCGCGATTCTAGCGAGCCGCAATCAATTCAACTTTGCCAACGCCGACGCGGTTGTC  61

                      S  R  N  Q  F  N  F  A  N  A  D  A  V  V

   AACTTTGCCCAGGCCAACGGCAAGCTCATCCGCGGCCACACCCTCCTCTGGCACTCTCAG 120

    N  F  A  Q  A  N  G  K  L  I  R  G  H  T  L  L  W  H  S  Q

   CTGCCGCAGTGGGTGCAGAACATCAACGACCGCAACACCTTGACCCAGGTCATCGAGAAC 180

   L  P  Q  W  V  Q  N  I  N  D  R  N  T  L  T  Q  V  I  E  N

  CACGTCACCACCCTTGTCACTCGCTACAAGGGCAAGATCCTCCACTGGGACGTCGTTAAC 240

   H  V  T  T  L  V  T  R  Y  K  G  K  I  L  H  W  D  V  V  N

  GAGATCTTTGCCGAGGACGGCTCGCTCCGCGACAGCGTCTTCAGCCGCGTCCTCGGCGAG 300

   E  I  F  A  E  D  G  S  L  R  D  S  V  F  S  R  V  L  G  E

  GACTTTGTCGGCATCGCCTTCCGCGCCGCCCGCGCCGCCGATCCCAACGCCAAGCTCTAC 360

   D  F  V  G  I  A  F  R  A  A  R  A  A  D  P  N  A  K  L  Y

  ATCAACGACTACAGGTCGACA 420

   I  N  D  Y  R  S  T

高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈