首页 / 国际专利分类库 / 化学;冶金 / 组合化学 / 组合化学;化合物库,如化学库、虚拟库 / 用DNA文库转化和表达筛选丝状真菌细胞的方法

用DNA文库转化和表达筛选丝状真菌细胞的方法

申请号 CN200580025551.2 申请日 2005-05-26 公开(公告)号 CN1993475A 公开(公告)日 2007-07-04
申请人 诺维信股份有限公司; 发明人 萨拉·泰特; 迈克尔·拉姆萨; 乔尔·切里; 康尼·沃德;
摘要 本 发明 涉及表达筛选丝状 真菌 转化体的方法,包括:(a)分离被引入大肠杆菌的DNA文库的单一集落转化体;(b)从每个单一集落的大肠杆菌转化体制备DNA;(c)将步骤(b)制备的每一个DNA样品插入到分离的丝状真菌原生质体悬浮液中以获取丝状真菌转化体,其中每个转化体包含来源于DNA文库的个体多核苷酸的一个或多个拷贝;(d)在选择性生长培养基上生长步骤(c)的个体丝状真菌转化体,该培养基允许丝状真菌转化体生长,同时抑制未转化丝状真菌的生长;和(e)测量个体多核苷酸编码的每个多肽的活性或特性。
权利要求

1.表达筛选丝状真菌转化体的方法,包括:
(a)分离被引入大肠杆菌的DNA文库的单一集落转化体;
(b)从每个单一集落的大肠杆菌转化体制备DNA;
(c)将步骤(b)每一个DNA制备物的样品导入到分离的丝状真菌原 生质体悬浮液中以获取丝状真菌转化体,其中每个转化体包含来源于DNA 文库的个体多核苷酸的一个或多个拷贝;
(d)在选择性生长培养基上生长步骤(c)的个体丝状真菌转化体,从 而允许丝状真菌转化体生长,同时抑制未转化丝状真菌的生长;和
(e)测量由个体多核苷酸编码的每个多肽的活性或特性。
2.权利要求1的方法,其中DNA文库是基因突变体文库。
3.权利要求1的方法,其中突变基因编码多肽变体。
4.权利要求1的方法,其中由多核苷酸编码的多肽是抗体抗原、酶、 激素或报告分子。
5.权利要求4的方法,其中酶选自:肽酶、淀粉酶、糖酶、羧肽酶、 过化氢酶、纤维素酶、壳多糖酶、质酶、环糊精糖基转移酶、脱氧核 糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、 β-葡糖苷酶、卤素过氧化物酶(haloperoxidase)、转化酶、漆酶、脂肪酶、 甘露糖苷酶、氧化酶、果胶酶、肽谷氨酰胺酶、过氧化物酶、肌醇六磷酸 酶、多酚氧化酶、蛋白酶、核糖核酸酶、转谷氨酰胺酶和木聚糖酶。
6.权利要求1的方法,其中多肽是变体。
7.权利要求1所述的方法,其中丝状真菌选自枝顶孢霉属、曲霉属、镰 孢属、腐质霉属、毛霉属、毁丝霉属、脉孢菌属、青霉属、梭孢壳属、 Tolypocladium或木霉属。
8.权利要求1所述的方法,更进一步地包含(g)分离来源于DNA文库 的多核苷酸,其中多核苷酸编码目的多肽。
9.权利要求1所述的方法,其中一个或多个步骤被自动化。
10.权利要求1所述的方法,其中每个步骤都被自动化。
11.通过权利要求8的方法获得的编码目的多肽的分离的多核苷酸。
12.包含权利要求11的多核苷酸的核酸构建体。
13.包含权利要求11的多核苷酸的重组表达载体。
14.包含权利要求11的多核苷酸的重组宿主细胞。
15.一种生产多肽的方法,包括(a)在有助于生产该多肽的培养基中 培养权利要求14的重组宿主细胞;和(b)从培养基回收多肽。
16.权利要求15的方法,其中多肽是抗体、抗原、酶、激素或报告分 子。
17.权利要求16的方法,其中酶选自氨肽酶、淀粉酶、糖酶、羧肽酶、 过氧化氢酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核 糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、 β-葡糖苷酶、卤素过氧化物酶(haloperoxidase)、转化酶、漆酶、脂肪酶、 甘露糖苷酶、氧化酶、果胶酶、肽谷氨酰胺酶、过氧化物酶、肌醇六磷酸 酶、多酚氧化酶、蛋白酶、核糖核酸酶、转谷氨酰胺酶和木聚糖酶。
18.权利要求15的方法,其中多肽是变体。

说明书全文

发明领域

本发明涉及表达筛选用DNA文库转化的丝状真菌细胞的方法。

相关技术的描述

蛋白质的大规模生产经常依赖于使用重组的表达宿主细胞。在大规模 生产之前,针对选择和/或改进目的蛋白质的研究和开发也涉及使用这种重 组宿主细胞。筛选工程,例如筛选具体基因的突变体编码的蛋白质变体, 或从基因组或cDNA文库中筛选基因库经常局限于丝状真菌以外的宿主。 使用最频繁的宿主是非常适合于筛选所需要的高通量方法的酵母和细菌。 典型地,将几千到几十万多核苷酸片段转化到宿主中,然后在培养基中培 养这些转化体,并筛选培养物以鉴定目的蛋白质。其目标经常是鉴定或设 计具有改进的特性的蛋白质,例如,具有改变的随温度而变的活性谱、热 稳定性、pH活性、pH稳定性、底物特异性、产物特异性和化学稳定性的蛋 白质。

但是,利用细菌和酵母宿主进行表达筛选涉及许多限制;在有些情况 下,重组蛋白质以非活性构象存在,而在其它情况下,该蛋白质是不稳定 的或者不是简单地在第一位置合成。来源于哺乳动物来源的目的蛋白质在 这些宿主中的表达常常很贫乏,因为表达的蛋白质以非活性构象存在,或 者根本不表达该蛋白质。通常,来源于真核生物的蛋白质在原核生物系统 中表达贫乏。在这些生物体中的重组蛋白质的二级修饰可能完全不同于发 生在天然宿主中的修饰。在细菌中表达的来自真核生物的蛋白质不能被正 确糖基化,因为这种修饰发生在分泌路径中,而细菌中不存在分泌路径。 最经常使用的酵母菌株—酿酒酵母(saccharomyces cerevisiae)常常会过度糖 基化蛋白质,这会导致非活性蛋白质的表达,其中非活性蛋白质是与蛋白 质的天然状态相比较而言的。

使用细菌或酵母宿主进行酶筛选的另一个复杂因素是筛选宿主通常不 同于工业上最后生产使用的宿主。而转换宿主时会涉及重要的时间和技术 考虑。即使酶在两种宿主中都能成功表达,当从筛选转移到生产时,仍然 必须再加工设计表达构建体。更重要地,通过影响宿主特异方式中的折叠 和/或修饰,可以使那些已经经受定向进化的蛋白质,即经受随机诱变、重 组和通过多代筛选选择出有改进特性的蛋白质进化发展以获得筛选宿主特 异的改进特性。

酶筛选的另一个考虑是表达蛋白质的产量。细菌常常产生很高产量的 重组原核生物蛋白质,但当真核蛋白质在原核生物中表达时,经常观察到 产量很低的可溶性活性蛋白质。酵母宿主通常不能支持高平的重组蛋白 质表达。筛选期间的生物活性测定必须对检测极低水平的蛋白质足够敏感。 检测常常是不可能的,特别是当目的蛋白质具有较弱的比活性(specific activity)更是如此。而且,以足够水平表达蛋白质常常是有利的,因为这样 对蛋白质活性的检测可以很容易地与宿主菌株内的低水平的内源竞争性生 物活性区别开。这些分析解释了经常选择丝状真菌宿主来生产真核基因的 原因,因为这些生物体常常能支持高水平的蛋白质的表达。通常使用的酵 母和细菌宿主中获取的产量低经常会削弱筛选。

丝状真菌宿主具有与细菌和酵母宿主相比明显的优点,由于真菌形态 特征而使丝状真菌培养物的高通量表达筛选复杂化(complicated)。例如:菌 丝倾向于阻塞液体处理机(handlers)的移液管尖端,菌丝丛使它难以进入培 养物的液相,将单个丝状真菌转化体自动挑取和接种到琼脂平板上不象挑 取和接种酵母和细菌集落那样常规。

当筛选新的或改进的特性时,产生表达单一类型多肽的转化体是合乎 需要的。单一类型多肽的表达允许检测蛋白质性能的小变化。与此相反, 对共表达一种以上单一类型多肽的转化生物体进行的工作在技术上具有挑 战性,因为筛选的敏感性必须足以检测存在于具有不同特性的蛋白质背景 中的蛋白质的独特特性。具有单一类型多核苷酸片段被引入每个单一转化 体的表达筛选宿主通常是一个优点。

将单一类型多核苷酸引入细菌或酵母的过程为本领域所熟知。在细菌 中,质粒复制子可用于防止两个不同的质粒在相同的细菌细胞中共存 (Davidson,1984 Gene 28:1-15)。被筛选的库经常包含异源质粒群体,每 个群体包含能被转化到细菌或酵母感受态细胞池(pool)中的相同复制子。当 包含外来基因的质粒被引入细菌细胞时,该群体的随后生长会导致质粒分 离,因此每个细胞仅包含单一类型质粒。在经过几代细菌繁殖过程后,少 数质粒被完全消除,原始细胞的后代包含一个质粒或另一个质粒,而不是 包含两个质粒。因此携带相同复制子的质粒据说属于相同的不相容组(Datta, 1979,in Plasmids of Medical,Environmental,and Commercial Importance, Timmis and Puhler,eds.Elsevier,Amsterdam)。

因此用异源质粒群体库转化细菌导致限制每个转化体包含单一类型质 粒。另一方面,当用包含质粒异源群体的DNA文库转化时,将单一种类多 核苷酸插入到丝状真菌表达宿主中的过程不是如此简单。当通过引入外来 多核苷酸序列从遗传上加工设计丝状真菌菌株时,通常会使用两种不同类 型的方法。一个方法允许将DNA整合到真菌宿主染色体中。通常引入一个 以上的单一多核苷酸片段(Alesenko,1994,Curr Genet 26:352-358)。另一 个导入外来DNA的方式是使用自主复制质粒。在两种转化中,单一宿主包 含一个以上来自用于转化的库的不同多核苷酸片段是可能的。丝状真菌经 常是多细胞和多核的。为了尝试分离被引入个体宿主中的独特的多核苷酸 片段而利用孢子纯化在本领域是很常见的。但这一过程耗时,而且难以自 动化,因为集落挑取自动机不容易挑取接种到液体培养基或再排列进行固 相培养的丝状真菌集落。

限制遗传物质使个体转化体仅包含单一种类多核苷酸片段可能是筛选 丝状真菌表达库领域的优点。特别地,有可利用的高通量转化丝状真菌的 方法可能是有利的,因为这样表达比较高,可以快速和容易地从筛选鉴定 出的那些转化体回收基因。

除来自DNA文库的个体DNA片段在个体丝状真菌转化体中表达赋予 的优点外,具有从筛选鉴定的转化体中回收外来多核苷酸的容易方法也是 有利的。典型地,DNA拯救方法用于质粒转化体(例如包含AMA1和ANS1 的载体),其中从转化体中制备DNA制备物(preparation),然后用制备物转 化大肠杆菌以制备用于序列分析的适量质粒。为了回收DNA已经整合到宿 主染色体中的丝状真菌转化体中的转化DNA,利用PCR扩增外源基因和从 转化体制备基因组DNA是通常使用的方法。或者可以在重组基因被表达的 条件下从转化体制备RNA,并从来源于RNA的核酸扩增外来多核苷酸。所 有这些核苷酸回收方法的共同特征是他们都是耗时的步骤。具有快速和容 易的从分离的丝状真菌转化体回收核苷酸材料的步骤将是有利的,其中分 离的丝状真菌转化体来源于库表达筛选。

WO 00/24883公开了利用AMA质粒在丝状真菌细胞中构建和筛选 cDNA文库的一般方法。

Lamsa and Bloebaum,1990,J.Ind.Microbiol.5:229-238描述了高通量筛 选丝状真菌培养物的例子。

提供单孔转化(single-well transformation)和表达筛选的方法是本发明的 目标。

发明概述

本发明涉及表达筛选丝状真菌转化体的方法,包括:

(a)分离被引入大肠杆菌的DNA文库的单一集落转化体;

(b)从每个单一集落的大肠杆菌转化体制备DNA;

(c)将步骤(b)制备的每一个DNA制备物导入到分离的丝状真菌原 生质体悬浮液中以获取丝状真菌转化体,其中每个转化体包含来源于DNA 文库的个体多核苷酸(individual polynucleotide)的一个或多个拷贝;

(d)在选择性生长培养基上生长步骤(c)的个体丝状真菌转化体,该 培养基允许丝状真菌转化体生长,同时抑制未转化丝状真菌的生长;和

(e)测量个体多核苷酸编码的每个多肽的活性或特性。

在优选方案中,通过收集在步骤(b)中制备的已经存档和储存的对应 DNA可以完成从筛选鉴定的转化体中回收编码目的多肽的多核苷酸的过 程。

在另一个优选方案中,本发明的方法是手工完成的。在更优选的方案 中,本发明的方法是自动化的高通量表达筛选方法。

在另一个优选方案中,DNA文库是其中突变基因编码多肽变体的基因 突变体库。

在另一个优选方案中,该方法更进一步地包括从一个或多个个体大肠 杆菌转化体分离来源于DNA文库的多核苷酸,其中多核苷酸编码目的多肽。

在另一个优选方案中,该方法更进一步地包括从一个或多个个体丝状 真菌转化体分离来源于DNA文库的多核苷酸,其中多核苷酸编码目的多肽。

本发明也涉及通过这种方法获取的编码目的多肽的分离的多核苷酸、 核酸构建体、表达载体,包含该分离的多核苷酸的重组宿主细胞、以及产 生分离的多核苷酸编码的多肽的方法。

附图简述

图1显示pAlLo1的限制性酶切图谱。

图2显示pBANe10的限制性酶切图谱。

图3显示pAlLo2的限制性酶切图谱。

图4显示pCW026的限制性酶切图谱。

图5显示pENI2229的限制性酶切图谱。

图6显示pCW013的限制性酶切图谱。

定义

表达筛选:术语″表达筛选″定义为在选择的宿主中表达DNA文库的 DNA片段编码的多肽和测定表达多肽的特性。该方法必然伴有转化适当表 达载体中的库片段到选择的表达宿主中,以便从开放阅读框架自己的启动 子或者从克隆载体中的启动子转录DNA文库的开放阅读框。

突变体:术语″突变体″在这里限定为编码包含一个或多个改变,例如与 亲代多肽相比在一个或多个特殊位置存在一个或多个具体基酸残基取 代、插入、缺失和/或截断的多肽的突变的多核苷酸。

变体:术语″变体″在这里限定为包含一个或多个改变,例如在多肽的一 个或多个特殊位置存在一个或多个特异的氨基酸残基取代、插入、缺失、 融合和/或截断的(truncation)多肽。

野生型多肽:术语″野生型多肽″表示天然存在的微生物表达的多肽。

亲代多肽:这里使用的术语″亲代多肽″指进行一种或多种修饰,例如替 换、插入、缺失和/或截断用来产生多肽变体的多肽。该术语也指用来比较 和排列对比的变体的多肽。亲代多肽可以是天然存在(野生型)的多肽, 或者亲代蛋白质可以是通过任何合适的方法制备的氨基酸序列已经被修饰 或改变的天然存在多肽的变体。亲代多肽也可能是占据相同染色体位点的 两个或更多个可选择的基因形式中的任何一个编码的多肽的等位变体。

修饰:术语″修饰″在这里指多肽的任何化学修饰以及DNA的遗传操 纵。修饰可以是一个或多个氨基酸的取代、缺失和/或插入,以及一个或多 个氨基酸侧链的替换。

选择性培养基:术语″选择性培养基″在这里限定为允许转化的微生物 生长,但不允许未转化细胞生长的包含营养素的液体或固体混合物。可以 通过培养基中包含对未转化生物体有毒的物质来实现选择,这样当包含选 择性标记的表达载体存在于转化的微生物中时,标记表达会使毒素解毒或 者会提供对毒素的抗性。还可以通过利用在缺乏补充营养素时不能生长的 微生物来实现选择。例如:让营养突变体经受转化,通过在缺乏需要的代 谢物的条件下进行筛选来提供选择,其中需要的代谢物只能由包含表达载 体序列的菌株合成,表达载体序列提供了合成代谢物需要的多核苷酸序列。

改组(shuffling):术语″改组″指在两个或多个同源多核苷酸之间重组 至少一个核苷酸序列产生与多核苷酸的起始核苷酸序列相比,具有许多被 交换的核苷酸的重组核苷酸序列(即已经经受混合周期的核苷酸序列)。

DNA文库:术语″DNA文库″在这里限定为包含来自单一基因组、两个 或更多基因组、突变DNA、改组DNA等等的插入物(DNA片段)的重组 表达载体或质粒的集合。载体可以是线性质粒或闭合环状质粒。插入DNA 的来源可以是基因组、cDNA、半合成来源,合成来源或他们的任何组合。

随机化的库或变体库:术语″随机化的库″或″变体库″在这里限定突变 多核苷酸的库。通过在DNA三联水平诱变编码变体的基因可以在变体库中 产生多样性,这样可以使个体密码子多样化,例如通过在PCR反应中使用 序列部分随机化的引物可以实现这一点。已经描述几种技术,利用这些技 术通过使基因中的几个核苷酸位置多样化,以及当这些位置分隔太远以至 于不能被单个(spiked或doped)寡核苷酸引物覆盖时对他们进行重组可以 产生变化多的组合库。″Spiked诱变″是定位诱变的一种形式,其中已经在一 个或多个位置利用寡核苷酸混合物合成使用的引物。这些技术包括使用如 WO 97/07205中描述的单个多样化基因片段的体内重组。也包括使用DNA 改组技术产生全长基因库,其中组合几个基因片段,每个片段可以通过例 如spiked诱变多样化(Stemmer,1994,Nature 370:389-391;美国专利 No.5,811,238;美国专利5,605,793和美国专利No.5,830,721)。可以参照WO 98/41623和WO 98/41622中的描述使用编码蛋白质″骨架(野生型亲代多肽) ″的基因作为模板多核苷酸,并将该基因与一个或多个单链或双链寡核苷酸 组合。在合成期间可以部分随机化单链寡核苷酸。双链寡核苷酸可以是在 特定区域掺入了多样性的PCR产物。在两种情况下,为了限制导入的变化 的平均数,可以用编码骨架蛋白质序列的对应片段冲淡多样性。

重组:术语″重组″在这里限定为将核酸在同源区彼此联合,导致在那些 序列之间产生链间DNA交换的过程。对本发明来说,依照Paques and Haber, 1999,Microbiology and Molecular Biology Reviews 63:349-404概括的方法来 确定同源重组。″同源重组″在这里限定为相对于输入的核苷酸序列,在同源 区内核苷酸序列没有发生变化的重组。为了进行完全的同源重组,区域应 该包含足够数量的核苷酸,例如15-10,000个基对,优选100-10,000个碱 基对,更优选400-10,000个碱基对,最优选800-10,000个碱基对,其中核 苷酸与对应的核苷酸序列高度同源以增加同源重组的概率。也可以通过非 同源重组进行重组。″非同源重组″在这里限定为DNA修复掺入的链交换的 任何方式会导致核苷酸序列不同于任何重组序列的重组。

改进的特性:术语″改进的特性″在这里限定为与亲代多肽,例如酶相 比,与变体多肽相关联的被改进的特性。这种改进的特性包括,但不限于 改变的随温度而变的活性谱、热稳定性、pH活性、pH稳定性、底物特异性、 产物特异性和化学稳定性。

改进的热活性:术语″改进的热活性″在这里限定为相对于亲代多肽的 随温度而变的活性谱,具有生物活性的变体多肽,例如,酶在特定温度显 示出改变的随温度而变的活性谱。例如:对于酶,在超过一定的温度范围 内实施催化反应,例如水解时,热活性值提供了对酶效的测量。酶具有 特定的温度范围,在该温度范围内蛋白质是稳定的,而且保留了酶活性, 但是增加温度酶的稳定性和活性都会降低。而且,通过增加温度可以加快 酶催化反应的初始速率,其中通过确定变体的热活性来测定温度。热活性 更高的变体将导致反应速度增加,会降低需要的时间和/或需要的酶浓度。 换句话说,具有降低的热活性的变体催化反应的温度低于亲代酶的最适温 度,其中最适温度是通过亲代酶的随温度依赖性的活性谱来定义的。

改进的热稳定性:术语″改进的热稳定性″在这里限定为相对于亲代多 肽,在升高的温度下孵育一段间之后,具有生物活性的变体多肽显示出保 留的生物活性。相对于亲代,这种变体可能显示或不显示改变的热活性谱, 例如相对于亲代,在高温孵育后它可能具有改进的再折叠能力。

改进的产物特异性:术语″改进的产物特异性″在这里限定为相对于亲 代多肽,具有生物活性的变体多肽显示出改变的产物谱,其中相对于亲代, 改变的产物谱改进了变体在某个应用中的性能。术语″产物谱″在这里限定为 由生物活性,例如酶活性产生的反应产物的化学成分(composition)。

改进的化学稳定性:术语″改进的化学稳定性″在这里限定为存在化学 制剂时,天然发生的或合成的变体多肽孵育一段时间之后仍显示保留生物 活性,其中化学制剂会降低亲代多肽的生物活性。在存在这种化学制剂时, 改进的化学稳定性也可以产生能更好地完成他们的生物活性,例如催化酶 反应的变体。

分离的多肽:这里使用的术语″分离的多肽″指通过SDS-PAGE确定时, 纯度为至少20%,优选至少40%,更优选至少60%,甚至更加优选至少80%, 最优选至少90%,甚至最优选至少95%的多肽。

基本上纯的多肽:术语″基本上纯的多肽″在这里表示多肽制备物,其按 重量计算包含最多10%、优选最多8%、更优选最多6%、更优选最多5%、 更优选最多4%、更优选最多3%、更加优选最多2%、最优选最多1%,甚 至最优选最多0.5%的与多肽天然联合的(associated)其他多肽原料。因此基 本上纯的多肽优选是按照制备物中存在的总多肽物质重量计,纯度为至少 92%,优选至少94%,更优选至少95%,更优选至少96%,更优选至少96%, 更优选至少97%,更优选至少98%、甚至更加优选至少99%,最优选至少 99.5%,甚至最优选100%的多肽。

本发明的多肽优选是基本上纯的形式。特别优选″基本上纯的形式 ″(essentially pure form)的多肽,即基本上不含与多肽天然联合的其他多肽原 料的多肽标本。例如,通过利用众所周知的重组方法或典型的提纯法制备 多肽可以实现这一目的。

在这里,术语″基本上纯的多肽″与术语″分离的多肽″和″分离形式的多 肽″同义。

多肽片段:术语″多肽片段″在这里限定为具有一个或多个从多肽的氨 基和/或羧基末端被缺失的氨基酸的多肽,其中该片段保留有生物活性。

分离的多核苷酸:这里使用的术语″分离的多核苷酸″指通过琼脂糖电 泳确定时,纯度为至少20%,优选至少40%,更优选至少60%,甚至更加 优选至少80%,最优选至少90%,甚至最优选至少95%的多核苷酸。

基本上纯的多核苷酸:在这里使用的术语″基本上纯的多核苷酸″指不 含其他外来核苷酸或不需要的核苷酸,以适合于在遗传工程蛋白质生产系 统中使用的形式存在的多核苷酸制备物。因此,基本上纯的多核苷酸按重 量计算包含最多10%、优选最多8%、更优选最多6%、更优选最多5%、更 优选最多4%、更优选最多3%、更加优选最多2%、最优选表最多1%,甚 至最优选最多0.5%的与多核苷酸天然联合的其他多核苷酸原料。但是,基 本上纯的多核苷酸可以包括天然发生的5′和3′非翻译区,例如启动子和终止 子。基本上纯的多核苷酸优选是按重量计纯度为至少90%,优选为至少92%, 更优选至少94%,更优选至少95%,更优选至少96%,更优选至少97%, 更加优选至少98%、最优选至少99%,甚至最优选至少99.5%的多核苷酸。 本发明的多核苷酸优选是基本上纯的形式。特别优选在这里公开的多核苷 酸是″基本上纯的形式″,即基本上不含与多核苷酸天然联合的其他多核苷酸 原料的多核苷酸制备物。在这里,术语″基本上纯的多核苷酸″与术语″分离 的多核苷酸″和″分离形式的多核苷酸″同义。多核苷酸可以是基因组、cDNA、 RNA、半合成来源,合成来源或他们的任何组合。

子序列:术语″子序列″在这里限定为具有一个或多个从分离的多核苷 酸的5′和/或3′末端被缺失的核苷酸的核苷酸序列,其中子序列编码具有生 物活性的多肽片段。

cDNA:术语″cDNA″在这里限定为可以从获自真核细胞的成熟的经过 拼接的mRNA分子反转录制备的DNA分子。cDNA缺乏通常存在于对应基 因组DNA中的内含子序列。初始的基本RNA转录产物是在表现为成熟的 拼接mRNA之前经过一系列步骤处理的mRNA前体。这些步骤包括通过称 为拼接的过程除去内含子序列。因此来源于mRNA的cDNA缺乏任何内含 子序列。

核酸构建体:这里使用的术语″核酸构建体″指分离自天然发生基因或 以不存在于自然界的方式修饰的包含核酸片段的单链或双链核酸分子。当 核酸构建体包含表达本发明的编码序列需要的控制序列时,术语核酸构建 体与术语″表达盒″同义。

控制序列:术语″控制序列″在这里限定为包括表达编码目的多肽的多 核苷酸必需的或对表达有利的所有组件。每个控制序列可能是编码多肽的 核苷酸序列与生俱来的或与编码多肽的核苷酸序列异源,或者每个控制序 列彼此之间是与生俱来的或异源的。这种控制序列包括,但不局限于前导 序列,多腺苷酸化序列,前肽序列,启动子,信号肽序列和转录终止子。 控制序列至少包括启动子,转录和翻译终止信号。可以用接头来提供控制 序列,这样可以导入有助于将控制序列与编码多肽的核苷酸序列的编码区 连接的特异的限制性内切位点。

操作性连接:术语″操作性连接″在这里表示控制序列位于多核苷酸序 列的编码序列的相对适当的位置使控制序列指导多肽编码序列表达的构 型。

编码序列:在这里使用的术语″编码序列″指直接规定它的蛋白质产物 的氨基酸序列的核苷酸序列。通常通过开放阅读框确定编码序列的界线, 通常开始于ATG起始密码子或选择的起始密码子,例如GTG和TTG,终 止于终止密码子,例如TAA、TAG和TGA。编码序列可以是DNA、cDNA 或重组核苷酸序列。

表达:术语″表达″包括涉及多肽生产的任何步骤,包括但不限于转录、 转录后修饰、翻译、翻译后修饰和分泌。

表达载体/质粒:术语″表达载体″或″表达质粒″在这里限定为包含编码 本发明的多肽的多核苷酸的线性或环状DNA分子,其中多核苷酸操作性地 与供其表达的附加核苷酸连接。

宿主细胞:这里使用的术语″宿主细胞″包括对包含编码目的多肽的多 核苷酸的核酸构建体或表达载体的转化、转染、转导等等敏感的任何细胞 类型。

转化体:在这里使用的″转化体″指通过引入多核苷酸片段,已经被遗传 修饰的微生物。导入DNA的过程,例如转化、转染、转导等等产生转化体 可以伴有来源于宿主以外的不同生物体的DNA,或者可以伴有使用来源于 相同物种的DNA。

发明详述

本发明涉及表达筛选丝状真菌转化体的方法,包括:(a)分离被引入 大肠杆菌的DNA文库的单一集落转化体;(b)从每个单一集落的大肠杆菌 转化体制备DNA;(c)将步骤(b)制备的每一个DNA样品导入到分离的 丝状真菌原生质体悬浮液中以获取丝状真菌转化体,其中每个转化体包含 来源于DNA文库的个体多核苷酸的一个或多个拷贝;(d)在选择性生长培 养基上生长步骤(c)的个体丝状真菌转化体,该培养基允许丝状真菌转化 体生长,同时抑制未转化丝状真菌的生长;和(e)测量个体多核苷酸编码 的每个多肽的活性或特性。

本发明允许回收在筛选中鉴定的那些表达具有想要的活性或特性的多 肽的转化体中的DNA原料。或者也可以利用来自步骤(b)的存档DNA样 品来代替设法从大肠杆菌或丝状真菌转化体回收、扩增或拯救外源基因。 一个人可以简单地确定哪一个个体DNA制备物被用来产生特定的转化体, 而且可以取回在原有转化中使用的已经储存存档的DNA的一部分。

可以手动或通过自动化来实施本发明的方法中的步骤。为了进行高通 量表达筛选,优选将本发明的方法自动化。在一个优选方案中,一个或多 个步骤被自动化。在更优选的方案中,每个步骤都被自动化。

在实验室中使用自动机及其他自动化装置在本领域中很常见,而且经 常用他们来操作细菌和酵母培养物(Reichman et al.,1996,Lab.Robot.and Automat.8:267-276;Olsen et al.,2000,Curr.Opin.Biotech.11;331-337; Zhao and Arnold,1997,Curr.Opin.Struct.Biol.7:480-485;Berg et al.,2000,J. of Biomolecular Screening,5:71-76;Evans et al.,2002,J.of Biomolecular Screening,7:359-366;Cherry et al.,1999,Nature Biotechnol.17:379-384)。但 是使用自动机操作活的丝状真菌是很少见(Arhoun,et al.,1999,Lab Robot and Automat 11:121-126)。本发明优选使用多孔板(也称为微量滴定板)来 操作微生物、DNA、多肽及其他分子。但是,商业系统通常可以用于操作 与标准96孔板具有相同足迹的任何孔板结构;12.8厘米×8.6厘米。大多 数系统允许用户在这些尺寸内装配定制的板。几乎可以使用在特殊自动机 上能够固定在支架的一些入口中的任何格的标准塑料管或玻璃管。多数 情况下,管支架是标准的微量滴定板足迹。实际上,一些系统具有他们自 己的支架以适合宽的试管阵列。通常使用的自动机包括三个基本类型。一 种自动机用来从固体培养基上的培养物中挑取微生物,并将这些具体的生 物体转移到液相生长培养基或固体培养基中。另一种自动机是液体操作自 动机,可以将液体从一处移动到另一处,例如从试管移动到多孔板。第三 种自动机移动消耗物品,例如试剂容器、多孔板或移液管尖端。其他的自 动化装置可以适合这些类别中的一种以上类别,或者可以超出这些一般分 类法的范围。

DNA文库

用于DNA文库的载体/质粒

DNA文库为包含来自单一基因组、两个或更多基因组、突变DNA、改 组DNA等等的插入物(DNA片段)的重组表达载体的集合。插入DNA的 来源可以是基因组、cDNA、半合成来源,合成来源或他们的任何组合。

每个插入物包含编码具有生物活性的目的多肽或其保留生物活性的片 段的核苷酸序列。

多肽可以是具有目的生物活性的任何多肽。多肽可以是筛选中使用的 丝状真菌细胞与生俱来的多肽,或者是与丝状真菌细胞异源的多肽。而且, 多肽可以是亲代多肽的变体。术语″多肽″在这里并不涉及编码产物的具体长 度,因此它包括肽、寡肽和蛋白质。术语″多肽″也包括多肽的天然发生的等 位基因变体或经过设计的变体。

在优选方案中,多肽是抗体抗原、抗菌肽、酶、生长因子、激素、 免疫增强剂(immunodilator)、神经递质、受体、报告蛋白质、结构蛋白质、 转录因子和转运蛋白体(transporter)。

在更优选的方案中,多肽是化还原酶、转移酶、水解酶、裂解酶、 异构酶或连接酶。在更优选的方案中,多肽是α-葡糖苷酶、氨肽酶、淀粉 酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、壳多糖酶(chitinase)、质酶 (cutinase)、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β- 半乳糖苷酶、葡糖淀粉酶、葡糖脑苷脂酶、α-葡糖苷酶、β-葡糖苷酶、转化 酶、漆酶、脂肪酶、甘露糖苷酶、mutanase、氧化酶、果胶分解酶(pectinolytic enzyme)、过氧化物酶、磷脂酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、 核糖核酸酶、转谷氨酰胺酶、尿激酶或木聚糖酶(xylanase)。

在另一个更优选的方式中,多肽是胶原或明胶。

使用的载体可以是能经受连接或导入插入物的重组DNA过程的任何质 粒(或载体)。质粒应该是在大肠杆菌中能够维持和复制,因此能够用来转 化丝状真菌宿主的穿梭质粒。

在优选方案中,质粒库优选包含允许质粒在细胞中不依赖基因组自主 复制或者允许将载体整合到宿主细胞基因组中的元件。

为了自主复制,质粒可以更进一步地包含使质粒能够在正研究的宿主 细胞中自主复制的复制起点。复制起点可以是在细胞中起作用,调节自主 复制的任何质粒复制基因(replicator)。术语″复制起点″或″质粒复制基因″在 这里限定为使质粒能够在体内复制的核苷酸序列。

质粒复制基因可以是在细胞中起作用,调节自主复制的任何质粒复制 基因。细菌复制起点的例子有允许在大肠杆菌中复制的质粒pBR322、 pUC19、pACYC177和pACYC184的复制起点。在丝状真菌细胞有用的质 粒复制基因的例子有AMA1和ANS1(Gems et al.,1991,Gene 98:61-67; Cullen et al.,1987,Nucleic Acids Research 15:9163-9175;WO 00/24883)。依 照WO 00/24883中公开的方法可以实现分离AMA1基因和构建包含该基因 的质粒或载体。

为了整合到宿主细胞基因组中,质粒可以依靠编码多肽的多核苷酸序 列或质粒的任何其他元件通过同源重组或非同源重组整合到基因组中。换 句话说,质粒可以包含指导通过同源重组在染色体的精确位置整合到宿主 细胞的基因组中的附加核苷酸序列。为了增加在精确位置整合的可能性, 整合元件应该优选包含足够数量的核酸,例如100-10,000个碱基对,优选 400-10,000个碱基对,最优选800-10,000个碱基对,其中核酸与对应的目标 序列具有高度的同一性以增加同源重组的概率。整合元件可以是与宿主细 胞基因组中的目标序列同源的任何序列。而且,整合元件可以是非编码或 编码核苷酸序列。另一方面,可以通过非同源重组将质粒整合到宿主细胞 的基因组中。因为可以将基因的多个拷贝整合到染色体中,因此通过提高 基因拷贝数可以促进高水平表达。本发明的一个优点是将外来插入物整合 到细丝状宿主中时,可以确信只有单一类型的插入物被插入。

在一些情况下,质粒的线性化可以提高整合到真菌染色体中的频率。 质粒的线性化可以针对质粒内的任何位点。通过本领域已知的任何适当的 方法,例如用一种或多种限制性内切酶消化可以使质粒线性化。

为了促进筛选过程,优选其中插入物操作性地与一个或多个控制序列 连接的质粒表达载体,其中控制序列指导插入物中的编码序列在控制序列 相容的条件下在适当的丝状真菌宿主细胞中表达。在这里描述了细菌和真 菌的控制序列。

质粒优选包含这里描述的一个或多个允许容易选择转化细胞的可选择 标记。

通常,表达载体源自于质粒、粘粒或噬菌体,或者可以包含这些元件 中的任何元件或全部元件。对本发明来说,术语″质粒″和″载体″可交换使用。

库的DNA片段来源

可以通过许多方法制备包含在库质粒内的DNA片段(或插入物)。例 如,可以依照美国专利No.4,683,202或Saiki et al.,1988,Science 239: 487-491中的描述,利用具体的引物通过PCR扩增制备DNA片段。或者可 以通过已经确定的标准方法,例如Beaucage and Caruthers,1981,Tetrahedron Letters 22:1859-1869描述的亚磷酰胺法(phosphoamidite),或者Matthes et al., (1984),EMBO Journal 3:801-805描述的方法来合成制备库DNA片段。

DNA片段也可以是依照标准技术,通过连接合成的片段、基因组来源 的片段或者cDNA来源的片段、相当于全部核苷酸序列的各个部分的片段 而制备的合成片段和基因组来源片段的混合物、合成片段和cDNA来源片 段的混合物或基因组来源片段和cDNA来源片段的混合物。而且,通过PCR 扩增包括DNA、cDNA和RNA的核酸并利用本领域已知的标准方法分离可 以制备DNA片段。例如:利用标准方法,可以从分离自生物体细胞的总多 腺苷酸化mRNA获取cDNA探针,并将他们反转录成总cDNA。

可以从任何生物体中获取DNA文库,包括但不限于微生物、植物和哺 乳动物。对本发明来说,这里使用的与约定的来源有关的术语″从…处获得 ″(obtained from)指通过该来源或已经插入该来源的多核苷酸序列的菌株产 生的多核苷酸序列。

在优选方案中,DNA文库是从细菌,例如革兰氏阳性细菌中获得的。

在更优选方案中,DNA文库是从芽胞杆菌属(Bacillus)、假单胞菌属 (Pseudomonas)、链霉菌属(Streptomyces)或大肠杆菌菌株中获得的。

在最优选的方案中,DNA文库是从嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽胞杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌 (Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、凝结芽孢杆菌(Bacillus coagulans)、灿烂芽胞杆菌(Bacillus lautus)、迟缓芽胞杆菌(Bacillus lentus)、 地衣芽孢杆菌(Bacillus licheniformis)、巨大芽孢杆菌(Bacillus megaterium)、 嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)或苏金芽孢杆菌(Bacillus thuringiensis)、Streptomyces lividans 或Streptomyces murinus中获得的。

在另一个优选方案中,DNA文库是从酵母,例如念珠菌属(Candida)、 克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、裂殖酵母属 (Saccharomyces)或Yarrowia菌株;或者丝状真菌,例如枝顶孢霉属 (Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、隐球 菌属(Cryptococcus)、Filibasidium、镰孢属(Fusarium)、腐质霉属(Humicola)、 Magnaporthe、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、Neocallimastix、 脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、 Piromyces、裂褶菌属(Schizophyllum)、Talaromyces、嗜热子囊菌 (Thermoascus)、梭孢壳属(Thielavia)、Tolypocladium或木霉属 (Trichoderma)菌株中获得的;

在更优选的的方案中,DNA文库是从卡尔酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母 (Saccharomyces diastaticus)、Saccharomyces douglasii、克鲁弗酵母 (Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)或 Saccharomyces oviformis中获得的。

在另一个更优选的的方案中,DNA文库从棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、烟曲霉(Aspergillus fumigatus)、 臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillus japonicus)、构巢曲霉 (Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)、杆孢状链孢(Fusarium bactridioides)、Fusarium cerealis、Fusarium crookwellense、大刀镰孢(Fusarium culmorum)、禾本科镰孢(Fusarium graminearum)、Fusarium graminum、异孢镰孢(Fusarium heterosporum)、 Fusarium negundi、尖镰孢(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、Fusarium sulphureum、Fusarium torulosum、Fusarium trichothecioides、Fusarium venenatum、Humicola insolens、Humicola lanuginosa、米黑毛霉(Mucor miehei)、Myceliophthora thermophila、粗糙 脉孢菌(Neurospora crassa)、产紫青霉(Penicillium purpurogenum)、 Trichoderma harzianum、康宁木霉(Trichoderma koningii)、Trichoderma longibrachiatum、Trichoderma reesei或绿色木霉(Trichoderma viride)中获 得的。

应理解无论物种已知的种类名称是什么,本发明都既包括上述物种的 完美状态,也包括他们的不完美状态,而且包括其他的分类同等物,例如, 无性型。本领域熟练技术人员能很容易识别适当同等物的同一性。

公众很容易从许多的菌种保藏单位,例如美国典型培养物保藏中心 (American Type Culture Collection)(ATCC),德意志微生物和细胞培养物保藏 中心(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH) (DSM),真菌菌种保藏中心(Centraalbureau Voor Schimmelcultures)(CBS)和 农业研究机构保藏中心(Agricultural Research Service Patent Culture Collection,Northern Regional Research Regional Research Center)(NRRL)获 得这些种的菌株。

也可以从取自给定环境位置的没有经过培养的生物体集合中获得DNA 文库(Liles et al.,2003,Appl.Environ.Microbiol.69:2684-2691;Beja et al., 2000,Science 289:1902-1906;Tyson et al.,2004,Nature 428:37-43;Venter et al.,2004,Science 304:66-74,美国专利No.6,723,504)。

在另一个方案中,DNA库是从直接纯化自环境样品或由环境样品扩增 的核苷酸原料中分离得到的,环境样品包括未经过培养的生物体的集合, 例如来自土样、淡水样品、海水样品、昆虫肠(gut)、动物胃、废水、淤泥 或沉积物的未经过培养的生物体的集合。

编码变体多肽的突变基因库

本发明的方法还可以用于表达筛选亲代多肽的变体。这种变体可以包 含修饰亲代多肽,例如在亲代多肽的一个或多个位置出现取代、插入和/或 缺失,或者还可以包含杂交多肽或蛋白质融合。

可以通过本领域已知的操作,例如PCR或易出错PCR导入突变。PCR 扩增可以与利用适当的物理或化学诱变处理剂,例如,导致转换(transition)、 颠换(transversion)、倒位(inversion)、颠倒(scrambling)、替换、缺失和/或插 入的诱变处理剂的诱变步骤结合。本发明的优选方案在产生低、中等或高 随机诱变频率的条件下制备DNA片段。为了获取低诱变频率,可以通过标 准的PCR扩增方法制备核苷酸序列(包含DNA片段)(美国专利 No.4,683,202或Saiki et al.,1988,Science 239:487-491)。通过在降低热稳定 聚合酶的复制保真度和增加核苷酸错误参入的条件下进行PCR扩增可以获 得中等或高的诱变频率,例如Deshler,1992,GATA 9:103-106;Leung et al., 1989,BioTechniques 1:11-15中已描述这一点。

产生突变基因库的其他方法,例如寡核苷酸定向诱变、组合PCR (assembly PCR)、体内诱变、定点诱变、区指导诱变(region-directed mutagenesis)和寡核苷酸盒诱变(Reidhaar-Olson and Sauer,1988,Science 241: 53-57;Bowie and Sauer,1989,Proc.Natl.Acad.Sci.USA 86:2152-2156;WO 95/17413;WO 95/22625;Lowman et al.,1991,Biochem.30:10832-10837;美 国专利No.5,223,409;WO 92/06204;Derbyshire et al.,1986,Gene 46:145; Ner et al.,1988,DNA 7:127)本领域已经已知。

也可以通过如体内和体外改组的过程插入和重组突变。在线性化的质 粒中通过体内重组(Cherry et al.,Nat.Biotechnol.17:379-384)或通过随机 片段化和聚合酶链反应(PCR)重新组合的体外改组(Stemmer et al.,1994, Nature 370:389-91;美国专利申请No.20030054390),可以将DNA片段库 与同源区随机组合(或″shuffled″)。可以在一个转化中组合许多突变体或同 源基因,这样可以从同源基因中高效地产生基因嵌合体。编码改进的变体 或野生型基因的这些基因的改组产生可以表达的嵌合体,随后通过筛选鉴 定那些具有有益突变最优组合的嵌合体。与仅仅使用随机诱变(参见综述, Kuchner and Arnold,1997,TIBTech 15:523-530)的过程相比,该过程可以使 获得的更进一步地改进变体的数目增加多倍。

随机诱变将突变插入到靶核苷酸序列中,产生有害突变的机会比产生 有益突变更加频繁。在这种诱变的迭代循回中,有害突变的累积比有益突 变更快,这样能有效掩蔽筛选期间对有益突变的鉴定。在核苷酸序列中包 含多样单核苷酸变化的两个或更多个同源核苷酸序列之间的随机重组可能 允许彼此分离包含在一个突变体中的所有核苷酸变化,并改为与存在于其 他突变体上的任何突变进行随机组合。突变的改组提供了一种将来自不同 亲代序列的突变彼此随机组合以增加在单一核苷酸序列中组合核苷酸变化 的概率的方式。至少一个改组循环是与最初使用的DNA片段的回交循环是 优选的,其中DNA片段可能是野生型DNA片段。这样就消除了不需要的 突变。也可以通过使用野生型DNA片段作为最初使用的输入DNA原料来 消除不需要的突变(non-essential)。

使用体内重组的方法高效重组多个重叠片段是从突变体或同源基因产 生嵌合体的方式。小至15bp的重叠足够进行重组,而且甚至可以用于非常 容易地对相距远的有关基因进行域改组。在域改组中,通过在大非同源 DNA的末端延伸同源性的方式使他们随机组合。使用重叠片段是有用的通 过在来自不同域的DNA片段之间产生小的重叠并筛选最好的组合来进行域 改组的方法。

诱变/改组方法可以与本发明的高通量自动筛选方法组合以检测宿主 细胞表达的诱变处理克隆多肽的活性。可以从存档的大肠杆菌转化体或者 从真菌细胞回收编码活性变体多肽的诱变处理的DNA分子,并使用本领域 的标准方法进行快速测序。这些方法允许快速确定单个氨基酸残基在目的 多肽中的重要性,并且可以用于结构未知的多肽。

大肠杆菌宿主

在本发明的方法中,可以使用任何大肠杆菌菌株来分离被引入该大肠 杆菌菌株中的DNA文库的单个集落转化体。对实施本发明有用的大肠杆菌 菌株的例子包括,但不局限于DH5αTM(Invitrogen,Carlsbad,CA)[F- 80dlacZΔM15Δ(lacZYA-argF)U169 recA1 endA1 hsdR17(rk -,mk +)phoA supE44λ-thi-1 gyrA96 relA1];One ShotINValphaF′(Invitrogen,Carlsbad,CA) [F-endA1 recA1 hsdR17(rk-,mk+)supE44 thi-1 gyrA96 relA1 80lacZ.M15.(lacZYA-argF)U169λ-];Top10(InVitrogen,Carlsbad,CA)F- mcrAΔ(mrr-hsdRMS-mcrBC)δ80lacZΔM15ΔlacX74 recA1 araΔ139 Δ(ara-leu)7697 galU galK rpsL(StrR)endA1 nupG。

通过使用化学感受态或电穿孔感受态大肠杆菌细胞可以实现将DNA文 库导入大肠杆菌。例如:用SURE电穿孔感受态细胞(SURE Electroporation-Competent Cells)(Stratagene,La Jolla,CA,美国专利Nos. 6,338,965,6,040,184,6,017,748和5,552,314和同等的国外专利)、XL1-蓝 电穿孔感受态细胞(XL1-Blue Electroporation-Competent Cells)(Stratagene, La Jolla,CA,美国专利6,338,965和6,040,184)、XL10-金超感受态细胞 (XL10-GoldUltracompetent Cells)(Stratagene,La Jolla,CA,美国专利 Nos.5,512,468和5,707,841),和SURE感受态细胞(SURE Competent Cells) (Stratagene,La Jolla,CA,美国专利Nos.6,017,748、5,707,841、5,552,314和 5,512,468;美国专利Nos.6,017,748和5,552,314;美国专利Nos.6,338,965、 6,040,184、6,017,748和5,552,314)可以实现导入DNA文库。

可以手动或使用集落挑取设备(colony-picking device)完成DNA文库的 单个大肠杆菌转化体集落的分离。可以使用任何市场上可买到的装置。这 种装置包括,但不限于Genetix QPix(Genetix Limited,Hampshire,UK); VersArray Colony Picker and Arrayer System(BioRad,Hercules,CA,USA)。

步骤(a)的单个大肠杆菌转化体集落可以转移到多孔板的单个孔中, 可以如上所述手动或使用集落挑取设备完成这一步骤。

来自大肠杆菌转化体的DNA的分离

在本发明的方法中,可以以本领域已知的任何形式完成从来自每个单 独的大肠杆菌转化体集落中制备DNA的步骤。优选在多孔板的单个孔中完 成制备DNA的步骤。使用本领域已知的任何方法可以完成DNA的制备。 例如:参见Sambrook,et al.,1989,Molecular Cloning:a Laboratory Manual Cold Spring Harbor Laboratory Press,2nd Ed.,pp 1.21-1.49中的煮沸,SDS和 碱溶解,用如氯化铯梯度的方法进行纯化的方法。可以使用Utterback等 (1995,Genome Sci.Technol.1:1-8)修饰的进步基因技术公司(Advanced Genetic Technologies Corporation)(Gaithersburg,MD)的96孔小量制备试 剂盒(Miniprep Kit)操作规程分离DNA。另外,可以用滚环扩增从单个大 肠杆菌转化体集落制备DNA(Nelson et al.,2002,Biotechniques,June,Suppl: 44-47)。

在优选方案中,制备DNA的步骤是自动化的。例如:可以利用机器人 装置,例如仿生自动机9600(BioRobot 9600)(QIAGEN Inc.,Valencia,CA) 从大肠杆菌菌株制备质粒DNA。还可以遵循厂家的说明,利用QIAGEN Qiabot Miniprep Station(QIAGEN Inc.,Valencia,CA)从培养物中分离质粒 DNA。另一个装置是AutoGenprep 960工具(AutoGen,Inc.,Holliston,MA), 该装置是以96孔模式进行DNA提取的完全自动化的高通量工具。

在另一个优选方案中,将从单个大肠杆菌转化体集落制备的总DNA的 部分或等分用于转化丝状真菌,并将剩余部分储存起来。用于转化的DNA 文库的存档允许很容易地回收通过表达筛选继续鉴定的那些转化体中的核 苷酸材料。

丝状真菌宿主的转化

在本发明的方法中,利用本领域已知的任何形式可以将步骤(b)的每 一种DNA制备物引入丝状真菌细胞的原生质体分离悬浮液中以获取其转化 体。每个转化体包含来自DNA文库的个体多核苷酸的一个或多个拷贝。优 选在多孔板的单个孔中进行丝状真菌原生质体的转化。原生质体的制备不 必自动化,但可以大批量进行,这样可以在机器人转化方法中自动化吸移 该试剂。

丝状真菌细胞可以是适合表达目的多肽的任何丝状真菌细胞。″丝状真 菌″包括真菌亚和Oomycota(如Hawksworth et al.,1995在上文中的定义) 的所有丝状体。丝状真菌通常以由壳多糖、纤维素、葡聚糖、壳聚糖、甘 露聚糖及其他复合多糖组成的菌丝壁为特征。通过菌丝延伸进行生长,而 且分解代谢是专性耗氧型的。与此相反,酵母,例如酿酒酵母是通过单 细胞菌体出芽进行生长,而且碳分解代谢可能是发酵性的。

在优选方案中,丝状真菌细胞是枝顶孢霉属、曲霉属、短梗霉属 (Aureobasidium)、Bjerkandera、Ceriporiopsis、鬼伞属(Coprinus)、革盖 菌属(Coriolus)、隐球菌属(Cryptococcus)、Filibasidium、镰孢属(Fusarium)、 腐质霉属、Magnaporthe、毛霉属、毁丝霉属、Neocallimastix、脉孢菌属、 拟青霉属、青霉属、Phanerochaete、Phlebia、Piromyces、侧属(Pleurotus)、 裂褶菌属、Talaromyces、嗜热子囊菌、梭孢壳属、Tolypocladium、Trametes 或木霉属细胞。

在更优选方案中,丝状真菌细胞是泡盛曲霉、烟曲霉、臭曲霉、日本 曲霉、构巢曲霉、黑曲霉或米曲霉细胞。在另一个更优选的方案中,丝状 真菌细胞是杆孢状链孢、Fusarium cerealis、Fusarium crookwellense、大刀 镰孢(Fusarium culmorum)、禾本科镰孢菌、Fusarium graminum、异孢镰孢、 Fusarium negundi、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、 拟分枝孢镰孢、Fusarium sulphureum、Fusarium torulosum、Fusarium trichothecioides或Fusarium venenatum细胞。在另一个更优选的方案中,丝 状真菌细胞是Trichoderma harzianum、康宁木霉、Trichoderma longibrachiatum、Trichoderma reesei或绿色木霉细胞。在另一个更优选的方 案中,丝状真菌细胞是无烟管菌(Bjerkandera adusta)、Ceriporiopsis aneirina、Ceriporiopsis aneirina、Ceriporiopsis caregiea、Ceriporiopsis gilvescens、Ceriporiopsis pannocinta、Ceriporiopsis rivulosa、Ceriporiopsis subrufa、Ceriporiopsis subvermispora、灰盖鬼伞(Coprinus cinereus)、毛革 盖菌(Coriolus hirsutus)、Humicola insolensHumicola insolens、Humicola lanuginosa、米黑毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthora thermophila)、粗糙脉孢菌(Neurospora crassa)、产紫青霉(Penicillium purpurogenum)、Phanerochaete chrysosporium、射脉菌(Phlebia radiata)、 Pleurotus eryngii、土生梭孢霉(Thielavia terrestris)、Trametes villosa或 Trametes versicolor细胞。

在最优选方案中,丝状真菌细胞是米曲霉或Trichoderma reesei真菌细 胞。

通常以本身已知的方式通过涉及原生质体形成、原生质体转化和细胞 壁再生的过程来转化丝状真菌细胞。在EP238 023和Yelton et al.,1984, Proceedings of the National Academy of Sciences USA 81:1470-1474中描述了 转化曲霉属和木霉属宿主细胞的适当方法。Malardier et al.,1989,Gene 78: 147-156和WO 96/00787描述了转化镰孢属的适当方法。

在本发明的方法中,每个包含来自单一大肠杆菌集落的DNA的孔中含 有同源的质粒群体。因此,单个孔中DNA转化产生的每个真菌转化体包含 来自DNA文库的单个多核苷酸。本领域已经已知,将DNA文库转化到大 肠杆菌里会导致经过几代细菌生长后,独特质粒在复制和细胞通过随机过 程分裂到子细胞期间分隔开。

丝状真菌转化体的生长和表达或特性测量

在本发明的方法中,步骤(c)的个体丝状真菌转化体生长在选择性培 养基上。可以将选择性生长培养基添加给包含在多孔板的单个孔中的每个 转化体。或者可以将步骤(c)的转化体转入包含选择性生长培养基的另一 个多孔板中。而且,步骤(c)的转化体可以转入到包含在多孔板的单个孔 中的固相选择性培养基中。但是,可以使用本领域已知的任何形式。选择 性培养基中的营养素和/或有毒成分能保证转化的真菌细胞与未转化的细胞 相比,生长更优先。生长培养基优选由诱导目的多肽表达的成分组成。可 以从市场供应商获得适当的培养基,或者可以依照公开的组成制备适当的 培养基(例如,美国典型菌种保藏的目录)。

可以手动完成选择性培养基的添加,或者转化体的转移,但优选通过 自动化方式完成。可以从商业上获得自动化装置,例如Beckman BiomekFx Robot的Span-8移液工具(Beckman Coulter,Inc.,Fullerton,CA),液体操作 机器人的96孔移液头,或再排列工具,如在QBot上发现的那些再排列工 具。

在本发明的方法中利用本领域已知的特异性针对目的多肽的方法来完 成测量个体多核苷酸编码的每个多肽的活性或特性的步骤。这些检测方法 包括,但不限于使用具体的抗体、形成酶产物或酶底物消失。特性包括, 但不局限于改变的温度依赖性的活性谱、热稳定性、pH活性、pH稳定性、 底物特异性、产物特异性和化学稳定性。可以手动或自动完成对单个多核 苷酸编码的多肽表达或多肽特性的测量。

在优选方案中,活性或特性的测量被自动化。可以使用允许自动化的 任何装置,例如,机器人装置。市场上可买到的装置包括,但是不局限于 BiomekFx液体操作机器人(Beckman Coulter,Inc.,Fullerton,CA),Beckman Sagian ORCA板操作机器臂(Beckman Coulter,Inc.,Fullerton,CA),Caliper SciClone ALH300工作站(Caliper Life Sciences,Hopkinton,MA)和QBot (Genetix Limited,Hampshire,UK)。为了增加在给定时间内完成的个体活性 测定的数量,可以在高通量筛选系统中使用多孔板方便地测定活性。多孔 板包括,但不局限于96孔MJ Research Hard-Shell微板(96-well MJ Research Hard-Shellmicroplates)(MJ Research,Waltham,MA),Costar-3370 96孔澄 清的聚苯乙烯板(Costar-3370 96-well clear polystyrene plate)(Corning,Acton, MA),聚丙烯超硬深孔板(Polypropylene Ultra Rigid Deep-Well Plate) (ABgene,Rochester,NY),Costar-3950 1536孔测定板(Costar-3950 1536-well assay plates)(Corning,Acton,MA),Costar-3706 384孔底板澄清的聚苯乙烯 板(Costar-3706 384-well clear bottom polystyrene plates)(Corning,Acton, MA)和Costar 24孔细胞培养群集器(Costar 24-well cell culture cluste) (Corning,Acton,MA)。这种筛选技术在本领域为大家所熟知,例如,参见 Taylor et al.,2002,J.Biomolec.Screening 7:554-569;Decker et al.,2003,Appl. Biochem.Biotech.105-108:689-703;Dove,1999,Nature Biotech.17:859-863 和Kell,1999,Trends in Biotechnology 17:89-91。

多核苷酸本发明的方法更进一步地包括从一个或多个个体转化体中 分离来源于DNA文库的多核苷酸,其中多核苷酸编码目的多肽。或者可以 从存档的DNA文库中重新得到多核苷酸。

用于分离或克隆编码多肽的多核苷酸的技术在本领域已经已知,该技 术包括从基因组DNA分离、从cDNA制备或他们的组合。例如,通过利用 众所周知的聚合酶链反应(PCR)或检测具有共用结构特点的克隆的DNA 片段的表达库的抗体筛选可以实现从这种基因组DNA中克隆多核苷酸。例 如:参见Innis et al.,1990,PCR:A Guide to Methods and Application,Academic Press,New York。可以使用其他核酸扩增方法,例如连接酶链反应(LCR)、 连接活化转录(LAT)和核苷酸序列依赖的扩增(NASBA)。

多核苷酸也可以是一个或多个核苷酸从分离的多核苷酸的5′和/或3′ 末端被缺失的子序列,其中子序列编码具有生物活性的多肽片段。

核酸构建体

本发明也涉及包含插入物或操作性地与一个或多个控制序列相连的分 离的多核苷酸的核酸构建体,其中控制序列指导编码序列在控制序列相容 的条件下在适当的宿主细胞中表达。

可以用多种方式操作编码目的多肽的分离的多核苷酸(或插入物),为 多肽表达作准备。将多核苷酸序列插入到载体之前操纵多核苷酸序列可能 是合乎需要的或必需的,这取决于表达载体。利用重组DNA方法修饰多核 苷酸序列的技术为本领域熟知。

控制序列可以是被表达多核苷酸的丝状真菌宿主细胞辨别的适当的启 动子序列,其中多核苷酸编码本发明的多肽。启动子序列包含介导多肽表 达的转录控制序列。启动子可以是在选择的宿主细胞中显示出转录活性的 任何核苷酸序列,包括突变的、截短的和杂种启动子,从编码宿主细胞同 源或异源的编码细胞外或细胞内多肽的基因中可以获得启动子。

用于指导本发明核酸构建体转录,尤其是在细菌宿主细胞中转录的适当 启动子的实例,有从大肠杆菌lac操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂酶基因(dagA)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地 衣芽孢杆菌(Bacillus licheniformis)α-淀粉酶基因(amyL)、嗜热脂肪芽孢 杆菌(Bacillus stearothermophilus)生麦芽糖淀粉酶基因(amyM)、解淀粉芽 孢杆菌(Bacillus amyloliquefaciens)α-淀粉酶基因(amyQ)、地衣芽孢杆菌 青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因、和原核生物的β-内 酰胺酶基因(Villa-Kamaroff等人,1978,Proceedings of the National Academy of Sciences USA 75:3727-3731)中获得的启动子,以及tac启动子(DeBoer 等人,1983,Proceedings of the National Academy of Sciences USA 80:21-25)。 还有“Useful proteins from recombinant bacteria”,Scientific American,1980, 242:74-94及Sambrook等人,1989,同上中描述的其它启动子。

用于在丝状真菌宿主细胞中指导本发明核酸构建体转录的适当启动子 的实例有从米曲霉(Aspergillus oryzae)TAKA淀粉酶、米赫根毛霉 (Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α- 淀粉酶、黑曲霉酸稳定α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori) 葡糖淀粉酶(glaA)、米赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙 糖异构酶、构巢曲霉(Aspergillus nidulans)乙酰胺酶,Fusarium venenatum 淀粉葡糖苷酶(WO 00/56900)、Fusarium venenatum Daria(WO 00/ 56900)、Fusarium venenatum Quinn(WO 00/56900)、尖镰孢胰蛋白酶样 蛋白酶(WO 96/00787)、Trichoderma reeseiβ-葡糖苷酶、Trichoderma reesei 纤维二糖水解酶(cellobiohydrolase)I、Trichoderma reesei纤维二糖水解酶 (cellobiohydrolase)II、Trichoderma reesei内切葡聚糖酶I、Trichoderma reesei 内切葡聚糖酶II、Trichoderma reesei内切葡聚糖酶III、Trichoderma reesei 内切葡聚糖酶IV、Trichoderma reesei内切葡聚糖酶V、Trichoderma reesei 木聚糖酶(xylanase)I、Trichoderma reesei木聚糖酶II、Trichoderma reeseiβ- 木糖苷酶基因中获得的启动子和NA2-tpi启动子(来自黑曲霉中性α-淀粉酶 和米曲霉磷酸丙糖异构酶基因的启动子的杂合体);以及突变的、截短的和 他们的杂合启动子。

在酵母宿主中,有用的启动子是从酿酒酵母烯醇化酶(ENO-1)、酿酒 酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油-3-磷酸脱氢酶 (ADH1、ADH2/GAP)、酿酒酵母磷酸丙糖异构酶(TPI)、酿酒酵母 metallothionine(CUP1)和酿酒酵母3磷酸甘油酸激酶基因中获得的。 Romanos et al.,1992,Yeast 8:423-488中描述了适合于酵母宿主细胞的其他 有用的启动子。

控制序列也可以是适当的被丝状真菌宿主细胞辨别后能终止转录的转 录终止序列。终止序列操作性地与编码多肽的核苷酸序列的3′末端相连。 在选择的宿主细胞中有功能的任何终止子都可以用于本发明。

适合于丝状真菌宿主细胞的终止子优选是从米曲霉TAKA淀粉酶、黑 曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸(anthranilate)合酶、黑曲霉α-葡糖 苷酶和尖镰孢胰蛋白酶样蛋白酶基因中获得的。

适合于酵母宿主细胞的终止子优选是从酿酒酵母烯醇化酶、酿酒酵母 细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶基因中获得的。上文 的Romanos et al.,1992中描述了适合于酵母宿主细胞的其他有用的终止子。

控制序列也可以是适当的前导序列,前导序列是对丝状真菌宿主细胞 进行的翻译很重要的mRNA非翻译区。前导序列操作性地与编码多肽的核 苷酸序列的5′末端相连。在选择的宿主细胞中有功能的任何前导序列都可以 用于本发明。

适合于丝状真菌宿主细胞的前导序列是从米曲霉TAKA淀粉酶和构巢 曲霉磷酸丙糖异构酶基因中获得的。

适合于酵母宿主细胞的适当的前导序列是从酿酒酵母烯醇化酶(ENO- 1)、酿酒酵母3磷酸甘油酸激酶、酿酒酵母α-因子和酿酒酵母醇脱氢酶/ 甘油醛-3-磷酸脱氢酶(ADH2/GAP)基因中获得的。

控制序列也可以是操作性地与核苷酸序列的3′末端相连的多腺苷酸化 序列,转录时,该序列会作为添加多聚腺苷残基到转录的mRNA上的信号 被宿主细胞识别。在选择的宿主细胞中有功能的任何多腺苷酸化序列都可 以用于本发明。

适合于丝状真菌宿主细胞的多腺苷酸化序列优选是从米曲霉TAKA淀 粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶 样蛋白酶和黑曲霉α-葡糖苷酶基因中获得的。

Guo and Sherman,1995,Molecular Cellular Biology 15:5983-5990中描述 了适合于酵母宿主细胞的有用的多腺苷酸化序列。

控制序列也可以是编码与多肽的氨基末端有连接的氨基酸序列和指导 编码的多肽进入细胞分泌路径的信号肽编码区。核苷酸序列的编码序列的 5′端可以固有地包含在翻译阅读框中天然地与编码分泌多肽的编码区的片 段连接的信号肽编码区。或者,编码序列的5′末端可以包含与编码序列异 源的信号肽编码区。当编码序列天然地不包含信号肽编码区时,可能需要 外来的信号肽编码区。或者,外来的信号肽编码区可以简单地替换天然的 信号肽编码区以增加多肽的分泌。但是,在本发明中可以使用指导表达的 多肽进入选择的宿主细胞的分泌路径的任何信号肽编码区。

适合于细菌宿主细胞的有效的信号肽编码区是从芽胞杆菌属 NCIB11837生麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌 枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白 酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA基因中获得的信号肽编码区。 Simonen and Palva,1993,Microbiological Reviews 57:109-137中描述了更进 一步的信号肽。

适合于丝状真菌宿主细胞的有效的信号肽编码区是从米曲霉TAKA淀 粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米赫根毛霉天冬氨酸蛋白 酶、Humicola insolens纤维素酶、Humicola insolens内切葡聚糖酶V和 Humicola lanuginosa脂肪酶基因中获得的信号肽编码区。

适合于酵母宿主细胞的有用的信号肽是从酿酒酵母α-因子和酿酒酵母 转化酶基因中获得的。上文的Romanos et al.,1992中描述了其他有用的信号 肽编码区。

控制序列也可以是编码位于多肽氨基末端的氨基酸序列的前肽编码 区。得到的多肽被称为前酶或前肽(或有时称为酶原)。前肽通常是非活性 的,通过从前多肽上催化切割或自身催化切割除去前肽,可以将前多肽转 变为成熟的有活性的多肽。前肽编码区可以是从米赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶和Myceliophthora thermophila漆酶(WO95/33836) 基因中获得的。

当信号肽和前肽区都存在于多肽的氨基末端时,前肽区相邻着多肽的 氨基末端,信号肽区相邻着前肽的氨基末端。

添加允许相对于宿主细胞的生长调节多肽表达的调节序列也可能是合 乎需要的。调节系统的实例是那些使基因响应化学或物理刺激开始或停止 表达的调节系统,包括存在调节化合物。原核生物系统中的调节系统包括 lac、tac和trp操纵基因系统。在酵母中可以使用ADH2系统或GAL1系统。 在丝状真菌中,TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉 葡糖淀粉酶启动子可以用作调节序列。调节序列的其他实例是那些允许基 因扩增的序列。在真核系统中,这些序列包括在存在甲氨蝶呤的情况下被 扩增的二氢叶酸还原酶基因和用重金属进行扩增的金属硫蛋白基因。在这 些情况下,编码多肽的核苷酸序列操作性地与调节序列连接。

表达载体

本发明也涉及包含分离的多核苷酸或插入物、启动子,以及转录和翻 译终止信号的重组表达载体。可以将如上所述的各种核酸和控制序列连接 在一起产生包含一个或多个方便的限制性内切位点的重组表达载体,其中 限制性内切位点允许在该位点插入或取代编码多肽的核苷酸序列。或者, 通过将核苷酸序列或包含该序列的核酸构建体插入到适当的表达载体中可 以表达该核苷酸序列。构建表达载体时,编码序列位于载体中以便使编码 序列操作性地与适当的表达控制序列连接。

重组表达载体可以是能方便地经受重组DNA过程和使核苷酸序列表达 的任何载体(例如,质粒或病毒)。典型地,载体的选择取决于载体与载体 被导入其中的宿主细胞的相容性。载体可以是线性质粒或闭合环状质粒。

载体可以是自主复制载体,即作为染色体外实体,例如质粒,染色体 外元件,微型染色体或人工染色体存在的载体,它的复制不依赖染色体复 制。载体可以包含任何保证自我复制的工具。或者载体可以是被引入宿主 细胞时,能被整合到基因组中,并和已经整合它的染色体一起复制的载体。 而且,可以使用单个载体或质粒,或者使用共同包含被引入宿主细胞基因 组的总DNA的两个或更多个载体或质粒。

本发明的载体优选包含一个或多个允许容易选择转化细胞的可选择标 记。可选择标记是其产物提供生物杀伤剂(biocide)抗性或病毒抗性,重金属 抗性和营养缺陷型到原养型等等的基因。

细菌的可选择标记的实例有来自枯草芽孢杆菌或地衣芽孢杆菌的dal 基因,或者是赋予抗生素抗性,例如氨苄青霉素、卡那霉素、氯霉素或四 环素抗性的标记。适合于酵母宿主细胞的合适的标记有ADE2、HIS3、LEU2、 LYS2、MET3、TRP1和URA3。供丝状真菌宿主细胞用的可选择标记包括, 但是不局限于amdS(乙酰胺酶)、argB(氨酸氨甲酰基转移酶)、bar(膦 丝菌素(phosphinothricin)乙酰转化酶)、hph(潮霉素磷酸转移酶)、niaD(硝 酸还原酶)、pyrG(乳清苷-5′-磷酸脱羧酶)、sC(sulfate adenyltransferase) 和trpc(邻氨基苯甲酸合酶),以及他们的等同物。供曲霉属细胞用的标记 优选是构巢曲霉或米曲霉的amdS和pyrG基因,以及吸水链霉菌 (Streptomyces hygroscopicus)的bar基因。

在这里描述的载体优选包含允许载体整合到宿主细胞基因组中或者允 许载体在细胞中不依赖基因组自主复制的元件。

在这里描述了对细菌或丝状真菌细胞有用的复制起点的实例。供酵母 宿主细胞用的复制起点的实例有复制的2微米起点、ARS1、ARS4、ARS1 和CEN3的组合,以及ARS4和CEN6的组合。

可以将一个拷贝以上的多核苷酸插入宿主细胞以增加基因产物的生 产。通过将序列的至少一个附加拷贝整合到宿主细胞基因组中,或者通过 用包含扩增拷贝的可选择标记基因的细胞中的多核苷酸包括可扩增的可选 择标记基因可以实现多核苷酸复制数的增加,这样通过在存在适当的可选 择试剂的情况下培养细胞可以选择出多核苷酸的附加拷贝。

用来连接如上所述的元件以构建本发明重组表达载体的过程为本领域 熟练技术人员所熟知(例如,参见Sambrook et al.,1989,上文)。

宿主细胞

本发明也涉及包含依照本发明分离的多核苷酸或插入物的重组宿主细 胞,在重组生产目的多肽时可以方便地使用这些重组宿主细胞。包含分离 的多核苷酸或插入物的载体被引入宿主细胞,这样就可以按照以前的描述 将载体作为染色体的组成部分或自我复制的染色体外载体来维持。术语″宿 主细胞″包括亲代细胞的任何由于复制期间发生的突变而不同于亲代细胞的 子代。宿主细胞的选择很大程度上取决于编码该多肽的基因和它的来源。

宿主细胞可以是单细胞微生物,例如原核生物,或非单细胞微生物, 例如真核生物。

有用的单细胞微生物是细菌细胞,例如包括,但不限于芽胞杆菌属细 胞,例如嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽胞杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状杆菌(Bacillus circulans)、Bacillus clausii、凝结芽孢杆菌(Bacillus coagulans)、灿烂芽胞 杆菌(Bacillus lautus)、迟缓芽胞杆菌(Bacillus lentus)、地衣芽孢杆菌 (Bacillus licheniformis)、巨大芽孢杆菌(Bacillus megaterium)、嗜热脂肪 芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis) 和苏云金芽孢杆菌细胞(Bacillus thuringiensis);或者链霉菌属细胞,例如 浅青紫链霉菌(Streptomyces lividans)或鼠灰链霉菌(Streptomyces murinus) 的革兰氏阳性细菌;或革兰氏阴性细菌,例如大肠杆菌或假单胞菌 (Pseudomonas sp.)。在个优选方式中,细菌宿主细胞是迟缓芽胞杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacillus licheniformis)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)或枯草杆菌(Bacillus subtilis)细胞。在另一个优选方 式中,芽胞杆菌细胞是嗜碱(alkalophilic)芽胞杆菌。

例如,可以通过原生质体转化(例如,参见Chang and Cohen,1979, Molecular General Genetics 168:111-115)、使用感受态细胞(例如,参见 Young and Spizizen,1961,Journal of Bacteriology 81:823-829或Dubnau and Davidoff-Abelson,1971,Journal of Molecular Biology 56:209-221)、电穿孔 (例如,参见Shigekawa and Dower,1988,Biotechniques 6:742-751)、或接 合作用(例如,参见Koehler and Thorne,1987,Journal of Bacteriology 169: 5771-5278)将载体导入细菌宿主细胞中。

宿主细胞也可以是真核生物,例如哺乳动物、昆虫、植物或真菌细胞。

在优选方案中,宿主细胞是真菌细胞。在这里使用的″真菌″包括子囊菌 门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)、 和接合菌门(Zygomycota)(正如Hawksworth等在Ainsworth and Bisby′s Dictionary of The Fungi,8th edition,1995,CAB International,University Press, Cambridge,UK中所定义的那样),以及卵菌门(Oomycota)(在上文 Hawksworth等,1995的171页引用)和所有的有丝分裂孢子真菌类 (mitosporic fungi)(上文Hawksworth et al.,1995)。

在更优选的方案中,真菌宿主细胞是酵母细胞。在这里使用的″酵母″ 包括产子囊酵母(ascosporogenous yeast)(Endomycetales)(内孢霉目)、产 担子孢子囊酵母(basidiosporogenous yeast)和属于半知菌类(Fungi Imperfecti)的酵母(芽生菌纲)(Blastomycetes)。因为酵母的分类在将来可 能发生变化,为了实现本发明的目的,应该按照Biology and Activities of Yeast中的描述(Skinner,F.A.,Passmore,S.M.,and Davenport,R.R.,eds,Soc. App.Bacteriol.Symposium Series No.9,1980)定义酵母。

在一个更加优选的方案中,酵母宿主细胞是假丝酵母属(Candida)、汉 逊(氏)酵母属(Hansenula)、克鲁维氏酵母属(Kluyveromyces)、毕赤氏酵 母属(Pichia)、糖酵母属(Saccharomyces)、裂殖糖酵母属 (Schizosaccharomyces)或Yarrowia细胞

在最优选的方案中,酵母宿主细胞是卡尔斯伯糖酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化糖酵母 (Saccharomyces diastaticus)、Saccharomyces douglasii、克鲁弗糖酵母 (Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)或卵形糖酵 母(Saccharomyces oviformis)细胞。在另一个最优选的方案中,酵母宿主 细胞是乳克鲁维氏酵母(Kluyveromyces lactis)。在另一个最优选的方案中, 酵母宿主细胞是Yarrowia lipolytica细胞。

在另一个更优选的方案中,真菌宿主细胞是这里描述的丝状真菌细胞。

以本身已知的方式通过涉及原生质体形成、原生质体转化和细胞壁再 生的过程可以转化真菌细胞。在EP238 023和Yelton et al.,1984,Proceedings of the National Academy of Sciences USA 81:1470-1474中描述了转化曲霉属 和木霉属宿主细胞的适当方法。Malardier et al.,1989,Gene 78:147-156和 WO 96/00787描述了转化镰孢属的适当方法。可以用Becker and Guarente,In Abelson,J.N.and Simon,M.I.,editors,Guide to Yeast Genetics and Molecular Biology,Methods in Enzymology,Volume 194,pp 182-187,Academic Press, Inc.,New York;Ito et al.,1983,Journal of Bacteriology 153:163和Hinnen et al., 1978,Proceedings of the National Academy of Sciences USA 75:1920中描述的 方法转化酵母。

生产方法

本发明也涉及生产本发明的多肽的方法,包含(a)在有助于生产多肽 的条件下培养这里描述的宿主细胞;和(b)回收多肽。

在本发明的生产方法中,使用本领域众所周知的生产方法在适合于生 产多肽的营养培养基中培养宿主细胞。例如:可以通过摇瓶培养,以及在 允许表达多肽和/或分离多肽的条件下,在实验室或工业发酵罐中完成的在 适当的培养基上的小规模或大规模发酵(连续不断的发酵、分批发酵、分 级-分批发酵或固态发酵)培养细胞。使用本领域已知的方法,在包含碳源, 氮源和无机盐的合适的营养培养基中可以进行培养。可以从市场供应商获 得适当的培养基,或者可以依照公开的组成制备适当的培养基(例如,美 国典型菌种保藏的目录)。如果多肽被分泌到该营养培养基中,就可以直接 从培养基中回收多肽。如果多肽没有被分泌,可以从细胞溶解产物中回收 多肽。

可以利用本领域已知的特异性针对多肽的方法检测多肽。这些检测方 法可以包括使用具体的抗体、形成酶产物或酶底物消失。例如:可以用酶 测定来确定这里描述的多肽的活性。

可以利用本领域已知的方法回收产生的多肽。例如,通过包括但不限 于离心、过滤、抽提、喷雾干燥蒸发或沉淀的常规程序可以从营养培养 基中回收多肽。

然后通过本领域已知的多种方法,包括但不限于色谱法(例如离子交 换、亲合、疏水性、色谱聚焦和大小排阻层析)、电泳方法(例如,制备性 的等电聚焦)、差别可溶性(differential solubility)(例如,硫酸铵沉淀)、 SDS-PAGE或抽提(例如,参见Protein Purification,J.-C.Janson and Lars Ryden,editors,VCH Publishers,New York,1989)可以更进一步地纯化本发明 的多肽。

下列实施例更进一步地描述了本发明,不应认为实施例是限制本发明 的范围。

实施例

材料

用作缓冲液和底物的化学制剂至少是试剂等级的商品。

菌株

利用Trichoderma reesei菌株RutC30菌株(ATCC56765)作为纤维二糖 水解酶I(cellobiohydrolase I)(Cel7a)基因的来源。

利用米曲霉Jal250(WO99/61651)来表达Trichoderma reesei纤维二 糖水解酶I(cellobiohydrolase I)(cel7a)。

培养基和溶液

YT培养基由每升5g NaCl、8g胰蛋白胨和5g酵母抽提物和组成。

YT琼脂平板由每升10g琼脂、5g NaCl、8g胰蛋白胨和5g酵母抽提 物组成。

2XYT培养基由每升16g胰蛋白胨,10g酵母抽提物和5g氯化钠组成。

2XYT琼脂培养基由每升16g胰蛋白胨、10g酵母抽提物、5g氯化钠 和15g Bacto琼脂组成。

YP培养基由每升10g酵母抽提物和20g Bacto蛋白胨组成。

STC由0.8M山梨糖醇、25mM pH 8的Tris和25mM CaCl2组成。

M400培养基由每升50g麦芽糖糊精、2g MgSO4·7H2O、2gKH2PO4、 4g柠檬酸、8g酵母抽提物、2g尿素、0.5g CaCl2和0.5ml AMG微量金属 溶液组成。

AMG微量金属溶液由每升14.3g ZnSO4·7H2O、2.5g CuSO4·5H2O、 0.5g NiCl2·6H2O、13.8g FeSO4·7H2O、8.5g MnSO2·H2O和3g柠檬酸 组成。

LB培养基由每升10g胰蛋白胨,5g酵母抽提物和5g NaCl组成。

STC由1M山梨糖醇、10mM CaCl2和10mM Tris-Cl组成。

TAE缓冲液由每升4.84g Tris Base、1.14ml醋酸和2ml 0.5M pH 8.0 的EDTA组成。

实施例1:发酵和菌丝组织

依照现有技术的描述(Mandels and Weber,1969,Adv.Chem.Ser.95: 391-413)在纤维素诱导的标准条件下生长Trichoderma reesei RutC30。通过 过滤通过瓦特曼纸(Whatman paper)和在液氮中速冻收获菌丝样品。将样 品储存在-80℃,直到破坏他们用于提取RNA。

实施例2:已表达序列标签(EST)cDNA文库构建

依照Timberlake和Barnard(1981,Cell 26:29-37)的方法从实施例1 描述的菌丝样品中提取总细胞RNA,在从1%的甲醛琼脂糖凝胶获得印迹之 后通过Northern杂交来分析RNA样品(Davis et al.,1986,Basic Methods in Molecular Biology,Elsevier Science Publishing Co.,Inc.,New York)。依照厂家 的说明用mRNA分离试剂盒(mRNA Separator KitTM)(Clontech Laboratories, Inc.,Palo Alto,CA)从总RNA中分离多(聚)腺苷酸化的mRNA部分。除Not I-(dT)18引物(Pharmacia Biotech,Inc.,Piscataway,NJ)被用来启动第一链合 成外,依照Gubler和Hoffman(1983,Gene 25:263-269)的方法利用大约 5μg多聚(A)+mRNA合成双链cDNA。用绿豆核酸酶(Boehringer Mannheim Corporation,Indianapolis,IN)处理cDNA,用T4DNA聚合酶(New England Biolabs,Beverly,MA)使末端变钝。

Bam HI/Eco RI接头被连接到cDNA/变钝的末端。在用Not I消化后, 利用TAE缓冲液通过0.7%琼脂糖凝胶电泳选择cDNA大小(大约0.7-4.5 kb),并与被Not I加Bam HI切割和小肠碱性磷酸酶脱去磷酸的pYES2 (Invitrogen Corporation,Carlsbad,CA)连接。连接的混合物用来转化感受 态大肠杆菌TOP10细胞(Invitrogen Corporation,Carlsbad,CA)。在补充有 最终浓度为50μg/ml的氨苄青霉素的2YT琼脂平板上选择转化体(Miller, 1992,A Short Course in Bacterial Genetics.A Laboratory Manual and Handbook for Escherichia coli and Related Bacteria,Cold Spring Harbor Press,Cold Spring Harbor.New York)。

实施例3:模板制备和cDNA克隆的核苷酸测序

对实施例2描述的cDNA文库进行的实验中大约有7000个转化体集落 被直接从转化板挑取到96孔微量滴定板中,其中微量滴定板的每个孔包含 100ul的每毫升补充有50ug氨苄青霉素的2YT肉汤。在37℃以200rpm的 速度摇振,孵育孔板过夜。在孵育以后,每孔加入100ul的50%的无菌甘 油。将转化体复制到每孔包含1ml丰富肉汤(broth)(Magnificent BrothTM) (MacConnell Research,San Diego,CA)的次级深孔(secondary deep well)96 孔板中(Advanced Genetic Technologies Corporation,Gaithersburg MD),其 中每毫升肉汤补充有50ug氨苄青霉素。初级微量滴定板储存在-80℃。37℃ 在旋转振荡器上,剧烈搅动(300rpm)孵育次级深孔板过夜。为了防止溢 出和交叉污染,同时允许充分通风,用聚丙烯衬垫(Advanced Genetic Technologies Corporation,Gaithersburg,MD)和塑料微量滴定板盖盖住每个 次级培养平板。

可以使用Utterback等(1995,Genome Sci.Technol.1:1-8)修饰的进步 基因技术公司(Advanced Genetic Technologies Corporation)(Gaithersburg, MD)的96孔小量制备试剂盒(Miniprep Kit)操作规程从每个孔分离DNA。 利用染料终止化学作用(Giesecke et al.,1992,Journal of Virology Methods 38: 47-60)和T7测序引物,用Perkin-Elmer Applied Biosystems Model 377 XL Automated DNA Sequencer(Perkin-Elmer/Applied Biosystems,Inc.,Foster City, CA)完成一次通过(single-pass)的DNA测序:

T7:5′-TAATACGACTCACTATAGGG-3′(SEQ ID NO:1)

实施例4:cDNA克隆的DNA序列数据分析

为了控制质量,对核苷酸序列数据进行了细检,整理了载体序列和DNA 序列末端不明确的碱基,借助于PHRED/PHRAP软件(University of Washington,Seattle,WA)的帮助将所有序列进行了相互比较。在六个框架 中翻译了得到的毗连(序列)群(contig)和单独序列(singletons),并利用 GeneMatcheTMr软件(Paracel,Inc.,Pasadena,CA)用修饰的Smith Waterman 算术,利用BLOSUM 62矩阵在公众可获得的蛋白质数据库中对他们进行检 索。

实施例5:编码家族7纤维二糖水解酶I(Family 7 cellobiohydrolase I)(Cel7A)的cDNA克隆的鉴定

通过将推断的组合ESTs的氨基酸序列与存放在公众可获得的数据库, 例如Swissprot、Genpept和PIR中的蛋白质序列进行比较,来鉴定编码家族 7纤维二糖水解酶I(Family 7 cellobiohydrolase I)(Cel7A)的公认的cDNA 克隆。选择出一个克隆--Trichoderma reesei EST Tr0221进行核苷酸序列分 析,分析显示1821bp的pYES2插入物包含SEQ ID NO:2所示的1452bp 的开放阅读框和SEQ ID NO:3所示的推断的氨基酸序列。包含Trichoderma reesei Cel7A纤维二糖水解酶I基因的质粒被命名为pTr0221。包含在大肠杆 菌NRRL B-30683中的质粒pAJO52也可以用作该基因的来源。

实施例6:pAlLo2表达载体的构建

表达载体pAlLo1是通过修饰pBANe6(美国专利No.6,461,837)构建 的,其中pBANe6包含来自黑曲霉中性α-淀粉酶和米曲霉磷酸丙糖异构酶 启动子的杂种(NA2-tpi启动子)、黑曲霉淀粉葡萄糖苷酶终止序列(AMG 终止子)和构巢曲霉乙酰胺酶基因(amdS)。利用描述的Big染料TM终止剂 的化学作用,通过测序来证实所有诱变步骤。通过定位诱变首先从amdS选 择标记上的位置2051、2722和3397bp处消除三个Nco I限制性内切位点 完成对pBANe6的修饰。全部变化被设计成不改变amdS基因产物的实际蛋 白质序列的″沉默型″。依照厂家的说明,利用下列引物(加下划线的核苷酸 代表变化的碱基),用GeneEditorTM体外定位诱变试剂盒(GeneEditorTM in vitro Site-Directed Mutagenesis)(Promega,Madison,WI)同时除去这三个位 点:

AMDS3NcoMut(2050):5′-GTGCCCCATG ATACGCCTCCGG-3′(SEQ ID NO:4)

AMDS2NcoMut(2721):5′-GAGTCGTATTTCCA AGGCTCCTGACC-3′ (SEQ ID NO:5)

AMDS1NcoMut(3396):6′-GGAGGCCATG AAGTGGACCAACGG-3′ (SEQ ID NO:6)

然后利用QuickChangeTM定位诱变试剂盒(Stratagene,La Jolla,CA)让 包含全部三个预期序列变化的质粒经受定位诱变,以消除在AMG终止子末 端位置1643处的Nco I限制性内切位点。下列引物(加下划线的核苷酸代 表变化的碱基)用于诱变:

诱变处理AMG终止序列的上游引物:

5′- CACCGTGAAAGCCATG CTCTTTCCTTCGTGTAGAAGACCAGACAG-3′ (SEQ ID NO:7)

诱变处理AMG终止序列的下游引物:

5′- CTGGTCTTCTACACGAAGGAAAGA GCATGGCTTTCACGGTGTCTG-3′ (SEQ ID NO:8)

修饰pBANe6的最后步骤是利用QuickChangeTM定位诱变试剂盒和下列 引物(加下划线的核苷酸代表变化的碱基),在聚合接头起始处添加新的 Nco I限制性内切位点得到pAlLo1(图1)。

诱变处理NA2-tpi启动子的上游引物:

5′-CTATATACACAACTGGATTTA CCATGGGCCCGCGGCCGCAGATC- 3′(SEQ ID NO:9)

诱变处理NA2-tpi启动子的下游引物:

5′- GATCTGCGGCCGCGGGCCCATGGTAAATCCAGTTGTGTATATAG-3′(SEQ ID NO:10)

pAlLo1的amdS基因同构巢曲霉pyrG基因交换。质粒pBANe10(图2) 被用作选择标记pyrG基因的来源。pBANe10的序列分析显示pyrG标记包 含在Nsi I限制性片断中,它既不包含Nco I限制性内切位点,也不包含Pac I限制性内切位点。因为amdS也与Nsi I限制性内切位点侧接,因此切换选 择标记的策略是单纯替换Nsi I限制性片断。用限制性内切酶Nsi I消化来自 pAlLo1和pBANe10的质粒DNA,并用琼脂糖凝胶电泳纯化产物。包含pyrG 基因的pBANe10的Nsi I片段连接到pAlLo1的骨架上以替换原有的包含 amdS基因的NsiI DNA片段。通过限制性内切酶消化分析重组克隆以决定 他们具有正确的插入物,以及正确的插入方向。具有逆时针方向转录的pyrG 基因的克隆被选中。新的质粒被命名为pAlLo2(图3)。

实施例7:pCW026的构建

通过设计允许克隆到Nco I和Pac I位点的两个显示如下的引物可以实 现将Cel7A纤维二糖水解酶基因亚克隆到pAlLo2中。引物cTR0221.7将与 pAlLo2中的Nco I位点相容的BspLU II位点整合到了Cel7A纤维二糖水解 酶I基因的5′端。引物cTR0221.7a在Cel7A纤维二糖水解酶I基因的3′端 整合了Bsp LUII位点。

引物cTR0221.7:5′-gcaacatgtatcggaagttggc-3′(SEQ ID NO:11)

引物cTR0221.7a:5′-aattaattttacaggcactgag-3′(SEQ ID NO:12)

利用1X Tgo聚合酶反应缓冲液(Boehringer Mannheim Co,Indianapolis, IN)、25ng pTR0221、dATP、dGTP、dCTP和dTTP各0.2mM、每个引物 (cTR0221.7和cTR0221.7a)各50pmole和1单位Tgo聚合酶(Boehringer Mannheim Co,Indianapolis,IN)完成Cel7A纤维二糖水解酶I基因的扩增。 利用MJ Research Thermocycler(MJ Research,Inc.,Boston,MA)孵育反应物, MJ Research Thermocycler的程序设计为95℃5分钟一个循环,接下来 94℃60秒,55℃45秒和72℃2分钟,35个循环。然后在72℃孵育反应物, 延伸5分钟。利用TAE缓冲液在0.7%琼脂糖凝胶上电泳等分的每个PCR 产物,产生大约1545bp的预期条带。

利用Zero BluntTOPOPCR克隆试剂盒(Invitrogen,Carlsbad,CA)亚 克隆1545bp的PCR产物。用Bsp LUII和Pac I消化产生的质粒,并利用 TAE缓冲液在琼脂糖凝胶上分级,产生预期1.5kb的编码序列,然后切下 该序列,并利用AmiconUltra-free DA柱(Millipore,Billerica,MA)从凝胶 中纯化该序列。产生的片段随后被连接到被类似消化的pAlLo2中,产生包 含Trichoderma reesei Cel7A纤维二糖水解酶I基因的被命名为pCW026(图 4)的表达载体。

实施例8:质粒pENi2229的构建

为了改进目的基因在表达质粒上的表达,降低用于选择的基因标记的 表达是合乎需要的,在这里用pyrG基因来例示基因标记。通过在正常的选 择压力下,培养含有包含表达已经降低的选择基因的表达质粒的宿主细胞 会导致选择出具有增加的质粒拷贝数的宿主细胞,因此能实现存活必需的 选择基因的总的表达水平。但是,更高的质粒拷贝数也会导致目的基因表 达增加。

降低选择基因表达水平的一种方式是通过使用差的转录启动子或降低 mRNA的功能半衰期来降低mRNA水平。另一个方法是降低mRNA的翻译 效率。这样做的一种方法是使Kozak区发生突变(Kozak,1999,Gene 234: 187-208)。这是正好位于起始密码子(ATG)上游的区,起始密码子对翻译 起始很重要。下面的部分描述包含现有技术启动子和终止子元件,以及选 择基因上游的破坏的Kozak区的表达载体的构建过程。

pMT2188。质粒pMT2188以曲霉表达质粒pCaHj483(WO 98/00529) 为基础,pCaHj483由以融合到构巢曲霉磷酸丙糖异构酶非翻译前导序 (NA2-tpi)的黑曲霉中性淀粉酶II启动子和黑曲霉淀粉糖苷酶终止子 (AMG)为基础的表达盒组成。pCaHj483上也存在来自构巢曲霉的使曲霉 能够在以乙酰胺作为唯一氮源的培养基上生长的曲霉选择性标记amdS。这 些元件被克隆到大肠杆菌载体pUC19中(New England Biolabs,Beverly, MA)。用在大肠杆菌中能补助pyrF突变的酿酒酵母的URA3标记替换在大 肠杆菌的pUC19中允许进行选择的氨苄青霉素抗性标记;依照如下所述完 成替换。

用显示如下的引物从pCaHj483 PCR扩增pUC19复制的起点:

142779:

5′-TTGAATTGAAAATAGATTGATTTAAAACTTC-3′(SEQ ID NO:13)

142780:

5′-TTGCATGCGTAATCATGGTCATAGC-3′(SEQ ID NO:14)

引物142780在PCR片段中引入Bbu I位点。用ExpandTM PCR系统 (Roche Molecular Biochemicals,Basel,Switzerland)进行扩增,遵循厂家的 说明进行该扩增和随后的PCR扩增。使用引物从一般的酿酒酵母克隆载体 pYES2(Invitrogen corporation,Carlsbad,CA,USA)中扩增URA3基因:

140288:

5′-TTGAATTCATGGGTAATAACTGATAT-3′(SEQ ID NO:15)

142778:

5′-AAATCAATCTATTTTCAATTCAATTCATCATT-3′(SEQ ID NO:16)

引物140288在PCR片段中引入Eco RI位点。通过混合这两个PCR片 段和使用引物142780和140288(SEQ ID NO:15)扩增他们使他们通过重 叠法在拼接中发生融合。

用Eco RI和Bbu I消化产生的片段,并将他们连接到用相同的酶消化 的pCaHj483的最大片段上。用连接的混合物转化通过Mandel和Higa的方 法(1970 J.Mol.Biol.45:154)使其处于感受态的pyrF-大肠杆菌菌株 DB6507(ATCC 35673)。在补充有1g/l酪蛋白氨基酸、500ug/l硫胺和10mg/l 卡那霉素的固体M9培养基(Sambrook et al.,1989,Molecular Cloning,a Laboratory Manual,2nd edition,Cold Spring Harbor Laboratory Press)上选择 转化体。

来自选择出的转化体的质粒被称为pCaHj527。通过单纯的PCR方法使 存在于pCaHj527上的NA2-tpi启动子经受定位诱变。使用诱变引物141223 (SEQ ID NO:17)将核苷酸134-144从GTACTAAAACC变成 CCGTTAAATTT。使用诱变引物141222(SEQ ID NO:17)将核苷酸423-436 从ATGCAATTTAAACT变成CGGCAATTTAACGG。产生的质粒被称为 pMT2188。

141223:

5′- GGATGCTGTTGACTCCGGAAATTTAACGGTTTGGTCTTGCATCCC-3′ (SEQ ID NO:17)

141222:

5′- GGTATTGTCCTGCAGACGGCAATTTAACGGCTTCTGCGAATCGC-3′(SEQ ID NO:18)

pENI1849。制备了质粒pENI1849,其目的是为了截短pyrG基因消除 pyrG表达不需要的序列以降低质粒的大小,为实现最佳的转化频率作准备。 使用pENI1299(WO 00/24883)作为模板和下面的引物制备了PCR片段(大 约1800bp)。遵循厂家的说明用Expand PCR系统进行扩增。

270999J8:5′-TCTGTGAGGCCTATGGATCTCAGAAC-3′(SEQ ID NO: 19)

270999J9:5′-GATGCTGCATGCACAACTGCACCTCAG-3′(SEQ ID NO:20)

用限制性内切酶Stu I和Sph I消化PCR片段,并将其克隆到也用Stu I 和Sph I消化的pENI1298(公开在WO 00/24883)中。通过测序来验证克隆。

pENI1861。构建包括现有技术的曲霉属启动子和许多供克隆的独特的 限制性内切位点的质粒pENI1861。用下面的引物,使用质粒pMT2188作为 模板扩增PCR片段(大约620bp)。遵循厂家的说明用ExpandTM PCR系统 进行扩增。

051199J1:

5′- CCTCTAGATCTCGAGCTCGGTCACCGGTGGCCTCCGCGGCCGCTGGAT CCCCAGTTGTG-3′(SEQ ID NO:21)

1298-TAKA:

5′-GCAAGCGCGCGCAATACATGGTGTTTTGATCAT-3′(SEQ ID NO: 22)

用BssH II和Bgl II消化片段,并将其克隆到也用BssH II和Bgl II消化 的pENI1849中。通过测序验证克隆。

pENI2151。用Hind III分别消化质粒pENI1902(描述在WO2002/ 059331中)和pENI1861。使用TAE缓冲液,从凝胶中切除和遵循厂家的 说明使用QIAquick凝胶提取试剂盒(QIAquickGel Extraction Kit)进行 纯化,从1.0%的琼脂糖凝胶中纯化来自pENI1861的2408bp的片段和消化 载体pENI1902。

遵循厂家的说明,使用T4DNA连接酶(Roche Molecular Biochemicals, Basel,Switzerland)连接该片段和载体,并将他们转化到大肠杆菌菌株 DH10BTM中(Invitrogen,Carlsbad,CA)。使用QiaprepMiniprep试剂盒从 一个转化体分离出质粒,并将该质粒命名为pENI2151。

pENI21555。构建质粒pENI2155破坏pyrG基因上游的Kozak区。使用 pENI1861作为模板,进行两个PCR反应。在一个PCR反应中使用引物 141200J1和270999J9,在另一个PCR反应中使用引物141200J2和290999J8。

141200J1:

5′-ATCGGTTTTATGTCTTCCAAGTCGCAATTG-3′(SEQ ID NO:23)

141200J2:

5′-CTTGGAAGACATAAAACCGATGGAGGGGTAGCG-3′(SEQ ID NO: 24)

遵循厂家的说明用ExpandTM PCR系统进行扩增。使用TAE缓冲液,从 凝胶中切除和遵循包括在试剂盒中的说明使用QIAquick凝胶提取试剂盒 (QIAquickGel Extraction Kit)进行纯化,在1.0%的琼脂糖凝胶中分辨产 生的片段。

使用上述的片段作为模板,连同引物270999J8和270999J9一起进行另 一个PCR反应。遵循厂家的说明用ExpandPCR系统进行扩增。使用TAE 缓冲液,从凝胶中切除和遵循厂家的说明使用QIAquick凝胶提取试剂盒 (QIAquickGel Extraction Kit)进行纯化,在1.0%的琼脂糖凝胶中分辨从 此反应产生的PCR片段。

用Stu I和Sph I消化片段和pENI1849。按照如上所述从1.0%的琼脂糖 凝胶中纯化产生的片段。使用T4 DNA连接酶连接纯化的片段,并依照厂 家的说明将他们转化到大肠杆菌菌株DH10BTM(Invitrogen,Carlsbad,CA) 中。使用QiaprepMiniprep试剂盒从一个转化体分离质粒DNA,测序证实 该质粒引入了显示如下的突变的Kozak区:

5′-GGTTTTATG-3′(SEQ ID NO:25)

已经被替换的野生型Kokak显示如下:

5′-GCCAACATG-3′(SEQ ID NO:26)

该质粒被命名为pENI2155。

pENI2207。用Stu I和Sph I消化质粒pENI2151和pENI2155。使用TAE 缓冲液,从凝胶中切除和遵循厂家的说明使用QIAquick凝胶提取试剂盒 (QIAquickGel Extraction Kit)进行纯化,从1.0%的琼脂糖凝胶中纯化来 自pENI2155的2004bp的片段和消化的载体pENI2151。

连接片段和载体,并依照厂家的说明将他们转化到大肠杆菌菌株 DH10BTM中。使用Qiaprep Miniprep试剂盒从一个转化体分离出质粒,并将 该质粒命名为pENI2207。

pENI2229。遵循厂家的说明使用pENI2151作为模板和PWO聚合酶 (Roche Applied Science,Indianapolis),用引物2120201J1和1298-TAKA完 成PCR反应。

1298-TAKA:

5′-GCAAGCGCGCGCAATACATGGTGTTTTGATCAT-3′(SEQ ID NO: 27)

2120201J1:

5′- GCCTCTAGATCTCCCGGGCGCCGGCACATGTACCAGGTCTTAAGCTCG AGCTCGGTCACCGGTGGCC-3′(SEQ ID NO:28)

从凝胶中切除产生的650bp的PCR片段并遵循厂家的说明使用 QIAquick凝胶提取试剂盒(QIAquickGel Extraction Kit)进行纯化,从 1.0%的琼脂糖凝胶中纯化出产生的650bp的PCR片段。

用Bss HII和Bgl II消化PCR片段(650bp)和pENI2207。遵循厂家的 说明使用QIAGENTM离心柱从1.0%的琼脂糖凝胶中纯化载体和PCR片 段。使用T4DNA连接酶连接PCR片段和消化的载体,并依照厂家的说明 将他们转化到大肠杆菌菌株DH10BTM(Invitrogen,Carlsbad,CA)中。使用 QiaprepMiniprep试剂盒从一个转化体分离出质粒,通过DNA测序验证对 该质粒进行验证,并将该质粒命名为pENI2229(图5)。

实施例9:pCW013的构建

根据pENi2229构建质粒pCW013以获得在米曲霉中表达Humicola insolens纤维二糖水解酶I。按照Dalboge and Heldt-Hansen,1994,Mol.Gen. Gene 243:253-260中的描述通过PCR从pHD459b扩增Humicola insolens纤 维二糖水解酶I的编码序列。

包含全长纤维二糖水解酶I基因的PCR片段被亚克隆到pENi2229中作 为Bam HI Xma I片段。按照如下所述完成pCW013的构建。

使用下列引物用纤维二糖水解酶I基因5′末端的Bam HI位点和3′末端 的Xma I位点延长PCR片段。

引物1:5′-CGCGGATCCACCATGCGTACCGCCAAGTTCGCC-3′(SEQ ID NO:29)

引物2:5′-GCCCCGGGTTACAGGCACTGAGAGTACCAG-3′(SEQ ID NO:30)

扩增反应(50ul)包含下列成分:0.3ug pHD459b、1单位PWO聚合酶、 1xPWO聚合酶缓冲液、0.2mM dNTPs、50pmol的引物1和50pmol的引物 2。在Eppendorf Mastercycler(Eppendorf,Westbury,New York)中孵育反 应物,反应程序设计为95℃30秒,55℃30秒和72℃1分钟,共30个循环。

然后使用TAE缓冲液在0.8%的琼脂糖凝胶上分辨反应产物,从凝胶中 切除1605bp产物的条带,并依照制造商的说明使用Amicon UltrafreeDA Centrifugal Unit(Millipore,Bedford,MA)进行纯化。然后连接纯化的产物, 并遵循厂家的说明用Zero BluntTOPOPCR克隆试剂盒(Invitrogen, Carlsbad,CA)进行转化。将转化物铺在每升补充有100μg氨苄青霉素的 2XYT琼脂培养板上,在37℃生长过夜。

将白色集落挑到每升补充有100ug氨苄青霉素的3ml的2XYT培养基 中,在37℃生长过夜。还可以遵循厂家的说明,利用QIAGENQiabot Miniprep Station(QIAGEN Inc.,Valencia,CA)从培养物中分离质粒DNA。 通过用Bam HI和Xma I进行的限制性内切酶图谱分析质粒DNA以鉴定插 入了纤维二糖水解酶基因的阳性克隆。一旦确认成功插入了纤维二糖水解 酶基因的克隆,就利用BigDye Terminator Version 3对克隆进行测序以保证 精确度,并依照厂家的说明利用ABI PRISM3700DNA分析器(Foster City, CA)进行分析。

用Bam HI和Xma I消化包含纤维二糖水解酶I基因的大肠杆菌TOPO 克隆,然后利用TAE缓冲液在0.8%的琼脂糖凝胶上分辨片段,切除1605bp 的片段并遵循厂家的说明利用Amicon Ultrafree DA Centrifugal Unit(Amicon, Beverly,MA)进行纯化。

用Bam HI和Xma I以相同的方式消化质粒pENi2229以产生与1605bp 的纤维二糖水解酶I片段相匹配的末端。利用TAE缓冲液在0.8%的琼脂糖 凝胶上分辨pENi2229消化产物,切除8810bp的片段并遵循厂家的说明利 用Amicon UltrafreeDA Centrifugal Unit进行纯化。

遵循厂家的说明利用快速DNA连接试剂盒(Rapid DNA Ligation Kit) (Roche,Indianapolis,IN)将Bam HI/Xma I纤维二糖水解酶I基因片段连 接到Bam HI/Xma I消化的pENi2229中。然后遵循厂家的说明用连接物转 化大肠杆菌Sure细胞(Stratagene,La Jolla,CA)。选择和培养集落,按照 如上所述制备质粒。通过利用Bam HI和Xma I进行的限制性内切酶图谱分 析质粒DNA以鉴定插入了纤维二糖水解酶I基因的阳性克隆。从阳性集落 分离的一个质粒被命名为pCW013(图6)。

实施例10:伴有在相同的管中选择转化体的质粒DNA的小量转化

通过将大约2-5×107个孢子第一次接种到100ml补充有2%葡萄糖的 YP培养基中来制备米曲霉Jal250的原生质体。通过34℃在补充有2%葡萄 糖和10mM尿嘧啶核苷的YP培养基上以140rpm生长米曲霉Jal250 16-18 小时来制备孢子。利用无菌的真空过滤器除去培养基收集菌丝体。通过用 100ml的0.7M的KCl再悬浮菌丝丛和真空过滤洗涤菌丝丛3次。最后, 将菌丝丛再悬浮在20ml原生质体溶液中,并将其转入125ml的细颈瓶中, 在34℃以80rpm孵育细颈瓶。原生质体溶液由5mg/ml Glucanex(Novozymes A/S,Bagsvrd,Denmark)、0.5mg/ml壳多糖酶(Sigma,St.Louis,MO)和0.7M KCl组成。原生质体在30和90分钟之间开始释放。让原生质体过滤通过衬 砌有微孔布(MiraclothTM)(Calbiochem,La Jolla,CA)到50ml聚丙烯管中 的无菌漏斗,然后在室温下利用Sorvall RT 6000D离心机(E.I.DuPont De Nemours and Co.,Wilmington,DE)以600xg离心10分钟。然后将沉淀小丸 再悬浮在STC中,用20ml STC洗涤两次,并依照上面的描述以2000rpm 离心10分钟使原生质体成球状。利用血球计对原生质体进行计数,并将其 再悬浮在STC中使最后浓度为2×107原生质体/毫升。在Nalgene5100 Cryo 1℃冷冻箱″Mr.Frosty″(Nalgene5100 Cryo 1 Freezing Container,″Mr. Frosty″)(VWR Scientific,Inc.,San Francisco,CA)中进行控速冷冻之后将 原生质体储存在-80℃。

使用下列方法,用原生质体进行单孔转化。首先,15微升的米曲霉Jal250 原生质体和1ug的环状pCW026DNA被等分分配到96孔深孔板(QIAGEN Inc.,Valencia,CA)的48个孔中。在该实验中也使用了两个对照。八个包含 原生质体但不包含DNA的孔作为对照以确定未转化的原生质体不能该 M400培养基中生长,而且该对照也允许检测来自成功转化体的可能的交叉 污染。另外,八个包含pCW013的孔作为转化的阳性对照。已经已知AMA 质粒的转化效率比整合质粒高大约100倍(Osheroy and May,2000,Genetics 155:647-656)。添加DNA到原生质体中之后,将50ul 60%的PEG、10mM Tris和10mM CaCl2添加到每个孔中,用QIAGEN气孔带层(QIAGEN Airpore Tape Sheet)(QIAGEN Inc.,Valencia,CA)密封孔板,将孔板放入拉 链小包中,在37℃孵育25分钟。在孵育后,向每孔中加入400ulM400培养 基。再一次用QIAGEN气孔带层(QIAGENAirpore Tape Sheet)(QIAGEN Inc.,Valencia,CA)密封孔板,将孔板放入拉链小包中,在34℃孵育6天。

在孵育后,以转化体在作为转化体的选择性培养基的M400培养基上生 长的能力为基础选择阳性转化体。阳性转化体具有生产尿嘧啶核苷的能力, 尿嘧啶核苷允许他们在选择性培养基上生长。如上所述,将400μl M400培 养基直接添加到进行转化的每个孔中。通过形成菌丝丛来检测阳性转化体。 然后除去那些生长呈阳性的孔中的液体培养基,并测定纤维二糖水解酶I 的表达。

实施例11:高通量测定纤维二糖水解酶I转基因的表达

从实施例10的96孔深孔板的96个转化孔中直接抽取液体培养基样品 到标准的96孔板中。测定来自每个孔的液体培养基对纤维二糖水解酶I的 底物4-甲基-β-D-伞形乳糖苷(umbelliferyl lactoside)(MUL)的活性。当乳 糖部分被纤维二糖水解酶切去时,甲基伞形基团会发荧光。使用了来自用 空克隆载体产生的米曲霉转化体的液体培养基作为对照。另外,从纤维二 糖水解酶I的转化体的摇瓶培养物中获得的包含纤维二糖水解酶I的液体培 养基作为附加的阳性对照。

通过添加存在于100mM,pH 5.0的琥珀酸盐和0.01%Tween-20中的 30μl的0.25mg/ml的MUL测定三十微升的米曲霉液体培养基。在50℃测 定重复的反应。反应进行45分钟,然后通过添加pH 9.5的1.5M Tris-Cl进 行淬灭。利用BMG FLUOStar Galaxy荧光计(Offenburg,Germany)测量荧 光(激发光360nm,发射光460nm)。从测试孔的活性中减去来自仅有载 体的转化体的液体培养基的活性。

在第6天,在转化反应中包含整合质粒pCW026的65%(48个孔中有 31个孔)的孔包含真菌丛。在这31个转化体中,只有四个到第6天产生了 看得见的孢子。没有添加DNA的八个控制孔到第6天没有真菌丛。具有 AMA质粒的八个转化到第6天全部出现了真菌丛。

当用MUL测定时,用整合质粒进行单孔转化产生的31个转化体中有 四个显示出纤维二糖水解酶I活性。表达纤维二糖水解酶I的四个转化体是 到第6天已经生长充分的产生孢子的四个相同的集落。

实施例12:来自生长在96孔V形底滴定板中的真菌培养物的液体培 养基的自动化取样

为了进行小量测定,可以在具有V形底板的96孔滴定板(例如,Costar Thermowellseries titer plates,Corning,Acton,MA或MJ Research Hard-Shell? microplates,MJ Research,Waltham,MA)中生长培养物(120ml液体培养基)。 34℃在M400培养基中生长米曲霉JaL250培养物5-10天。利用BiomekFx 自动机的96孔移液工具(Beckman Coulter,Inc,Fullerton,CA)可以在孔中 压低(depresss)菌丝孔(well)。孔的V形形状导致菌丝体粘在板的底部。液体 培养基转移到孔的顶端。然后可以在菌丝不阻塞移液管尖端的情况下从这 些孔中除去液体培养基。

实施例13:来自96孔板中的孢子在24孔板中的自动化接种

利用BiomekFx自动机Span-8移液管工具(Beckman Coulter,Inc, Fullerton,CA)完成从96孔多孔板接种24孔多孔板的孔(Costar 24 well cell culture cluster,Corning,Acton,MA)。将一百和二十微升无菌水储存在如实施 例10描写的生长在96孔多孔板(100μl体积,在34℃生长5-14天)中的 米曲霉JaL250菌丝丛表面。通过移液管分散存在于生长的菌丝丛顶端的孢 子完成混合。来自每个孔的一百微升孢子被转入包含1.5ml新鲜M400培养 基的24孔板的孔中。在34℃孵育24孔板4-10天。

实施例14:来自生长在24孔模式中的真菌培养物的液体培养基的自 动取样

利用BiomekFx自动机(Beckman Coulter,Inc,Fullerton,CA)从实施 例13的24孔培养平板的每个孔中除去200ml液体培养基,200ml样品被 转入96孔板中(Hard-Shell96-well multiwell plates,MJ Research,Waltham, MA)。利用BeckmanBiomek Fx自动机的Span-8移液工具将生长在液体 培养基表面上的真菌丛移到旁边。简单来说就是移液管的尖端将菌丝丛拖 到孔的一边以便除去液体培养基。

发现该方法能够安全地转移菌丝丛,这样可以准确地从孔中移出液体 培养基而不会发生菌丝丛阻塞移液管尖端的情况。可以丛这些培养物中除 去合计达1ml的液体培养基。

生物材料的保藏

下列生物材料已经按照布达佩斯条约保藏在61604伊利诺斯州的Peoria 的大学街1815号的农业科研局专利菌种保藏北方区域研究中心 (Agricultural Research Service Patent Culture Collection,Northern Regional Research Center)并给出了下列登录号:

保藏物            登录号                 保藏日期

大肠杆菌pAJO52    NRRL B-30683           2003年7月29日

菌株已经在保证该专利申请在待审期间,专利商标委员依据37C.F.R. §1.14和35U.S.C.§122确定的人能够获得培养物的条件下保藏。保藏代 表基本上纯的保藏菌株培养物。按照国外专利法律规定保藏在提出本主题 申请的副本或其子代申请的国度是有效的。但是,应理解保藏物的可获得 性不构成实践本发明主题的许可而破坏政府行为授与专利权证。

本发明在这里描述和要求保护的内容并不限于这里公开的特定方案, 因为这些方案只是用于解释说明本发明的几个方案。规定任何等价方案都 在本发明的范围内。实际上,在上述内容的基础上,这里显示和描述的方 案之外的各种修饰对本领域熟练技术人员来说是很明显的。这种修饰也在 附加的权利要求的范围内。在发生冲突的情况下,本发明中包含定义的公 开内容将起控制作用。

这里引用的各种参考文献的公开内容全部引入作为参考。

在联邦政府资助的研究和开发下完成的发明的权利的声明

本发明是在能源部门授予NREL转包合同(subcontract)No. ZCO-30017-02,主要合同(prime contract)DE-AC36-98GO10337的条件下通 过政府的支持作出的。政府在本发明中具有某些权利。

发明背景

                    序列表
<110>诺维信股份有限公司(NOVOZYMES,INC.)
<120>用DNA文库转化和表达筛选丝状真菌细胞的方法
<130>10636.204-WO
<150>60/575,600
<151>2004-05-27
<160>30
<170>PatentIn version 3.2
<210>1
<211>20
<212>DNA
<213>大肠杆菌(Escherichia coli)
<400>1
taatacgact cactataggg                                               20
<210>2
<211>1545
<212>DNA
<213>Trichoderma reesei
<220>
<221>CDS
<222>(1)..(1539)
<220>
<221>sig_peptide
<222>(1)..(51)
<220>
<221>mat_peptide
<222>(52)..()
<400>2
atg tat cgg aag ttg gcc gtc atc tcg gcc ttc ttg gcc aca gct cgt     48
Met Tyr Arg Lys Leu Ala Val Ile Ser Ala Phe Leu Ala Thr Ala Arg
        -15                 -10                 -5
gct cag tcg gcc tgc act ctc caa tcg gag act cac ccg cct ctg aca     96
Ala Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr
-1  1               5                   10                  15
tgg cag aaa tgc tcg tct ggt ggc acg tgc act caa cag aca ggc tcc     144
Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser
                20                  25                  30
gtg gtc atc gac gcc aac tgg cgc tgg act cac gct acg aac agc agc     192
Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser
            35                  40                  45
acg aac tgc tac gat ggc aac act tgg agc tcg acc cta tgt cct gac    240
Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp
        50                  55                  60
aac gag acc tgc gcg aag aac tgc tgt ctg gac ggt gcc gcc tac gcg    288
Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala
    65                  70                  75
tcc acg tac gga gtt acc acg agc ggt aac agc ctc tcc att ggc ttt    336
Ser Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile Gly Phe
80                  85                  90                  95
gtc acc cag tct gcg cag aag aac gtt ggc gct cgc ctt tac ctt atg    384
Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met
                100                 105                 110
gcg agc gac acg acc tac cag gaa ttc acc ctg ctt ggc aac gag ttc    432
Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe
            115                 120                 125
tct ttc gat gtt gat gtt tcg cag ctg ccg tgc ggc ttg aac gga gct    480
Ser Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala
        130                 135                 140
ctc tac ttc gtg tcc atg gac gcg gat ggt ggc gtg agc aag tat ccc    528
Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro
    145                 150                 155
acc aac acc gct ggc gcc aag tac ggc acg ggg tac tgt gac agc cag    576
Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln
160                 165                 170                 175
tgt ccc cgc gat ctg aag ttc atc aat ggc cag gcc aac gtt gag ggc    624
Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly
                180                 185                 190
tgg gag ccg tca tcc aac aac gcg aac acg ggc att gga gga cac gga    672
Trp Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly
            195                 200                 205
agc tgc tgc tct gag atg gat atc tgg gag gcc aac tcc atc tcc gag    720
Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu
        210                 215                 220
gct ctt acc ccc cac cct tgc acg act gtc ggc cag gag atc tgc gag    768
Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Glu
    225                 230                 235
ggt gat ggg tgc ggc gga act tac tcc gat aac aga tat ggc ggc act    816
Gly Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg Tyr Gly Gly Thr
240                 245                 250                 255
tgc gat ccc gat ggc tgc gac tgg aac cca tac cgc ctg ggc aac acc    864
Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr
                260                 265                 270
agc ttc tac ggc cct ggc tca agc ttt acc ctc gat acc acc aag aaa    912
Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys
            275                 280                 285
ttg acc gtt gtc acc cag ttc gag acg tcg ggt gcc atc aac cga tac    960
Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr
        290                 295                 300
tat gtc cag aat ggc gtc act ttc cag cag ccc aac gcc gag ctt ggt    1008
Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly
    305                 310                 315
agt tac tct ggc aac gag ctc aac gat gat tac tgc aca gct gag gag    1056
Ser Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu
320                 325                 330                 335
gca gaa ttc ggc gga tcc tct ttc tca gac aag ggc ggc ctg act cag    1104
Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln
                340                 345                 350
ttc aag aag gct acc tct ggc ggc atg gtt ctg gtc atg agt ctg tgg    1152
Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp
            355                 360                 365
gat gat tac tac gcc aac atg ctg tgg ctg gac tcc acc tac ccg aca    1200
Asp Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr
        370                 375                 380
aac gag acc tcc tcc aca ccc ggt gcc gtg cgc gga agc tgc tcc acc    1248
Asn Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr
    385                 390                 395
agc tcc ggt gtc cct gct cag gtc gaa tct cag tct ccc aac gcc aag    1296
Ser Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn Ala Lys
400                 405                 410                 415
gtc acc ttc tcc aac atc aag ttc gga ccc att ggc agc acc ggc aac    1344
Val Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn
                420                 425                 430
cct agc ggc ggc aac cct ccc ggc gga aac ccg cct ggc acc acc acc    1392
Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr
            435                 440                 445
acc cgc cgc cca gcc act acc act gga agc tct ccc gga cct acc cag    1440
Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln
        450                 455                 460
tct cac tac ggc cag tgc ggc ggt att ggc tac agc ggc ccc acg gtc    1488
Ser His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val
    465                 470                 475
tgc gcc agc ggc aca act tgc cag gtc ctg aac cct tac tac tct cag    1536
Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln
480                 485                 490                 495
tgc ctgtaa                                                         1545
Cys
<210>3
<211>513
<212>PRT
<213>Trichoderma reesei
<400>3
Met Tyr Arg Lys Leu Ala Val Ile Ser Ala Phe Leu Ala Thr Ala Arg
        -15                 -10                 -5
Ala Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr
-1  1               5                   10                  15
Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser
                20                  25                  30
Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser
            35                  40                  45
Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp
        50                  55                  60
Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala
    65                  70                  75
Ser Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile Gly Phe
80                  85                  90                  95
Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met
                100                 105                 110
Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe
            115                 120                 125
Ser Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala
        130                 135                 140
Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro
    145                 150                 155
Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln
160                 165                 170                 175
Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly
                180                 185                 190
Trp Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly
            195                 200                 205
Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu
        210                 215                 220
Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Glu
    225                 230                 235
Gly Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg Tyr Gly Gly Thr
240                 245                 250                 255
Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr
                260                 265                 270
Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys
            275                 280                 285
Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr
        290                 295                 300
Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly
    305                 310                 315
Ser Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu
320                 325                 330                 335
Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln
                340                 345                 350
Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp
            355                 360                 365
Asp Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr
        370                 375                 380
Asn Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr
    385                 390                 395
Ser Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn Ala Lys
400                 405                 410                 415
Val Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn
                420                 425                 430
Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr
            435                 440                 445
Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln
        450                 455                 460
Ser His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val
    465                 470                 475
Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln
480                 485                 490                 495
Cys
<210>4
<211>22
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>4
gtgccccatg atacgcctcc gg                                            22
<210>5
<211>26
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>5
gagtcgtatt tccaaggctcct gacc                                        26
<210>6
<211>24
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>6
ggaggccatg aagtggacca acgg                                          24
<210>7
<211>45
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>7
caccgtgaaa gccatgctct ttccttcgtg tagaagacca gacag                   45
<210>8
<211>45
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>8
ctggtcttct acacgaagga aagagcatgg ctttcacggt gtctg                   45
<210>9
<211>44
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>9
ctatatacac aactggattt accatgggcc cgcggccgca gatc                    44
<210>10
<211>44
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>10
gatctgcggc cgcgggccca tggtaaatcc agttgtgtat atag                    44
<210>11
<211>22
<212>DNA
<213>Trichoderma reesei
<400>11
gcaacatgtat cggaagttg gc                                            22
<210>12
<211>22
<212>DNA
<213>Trichoderma reesei
<400>12
aattaatttt acaggcactg ag                                            22
<210>13
<211>31
<212>DNA
<213>酿酒酵母(Saccharomyces cerevisiae)
<400>13
ttgaattgaa aatagattga tttaaaactt c                                  31
<210>14
<211>25
<212>DNA
<213>酿酒酵母(Saccharomyces cerevisiae)
<400>14
ttgcatgcgt aatcatggtc atagc                                         25
<210>15
<211>26
<212>DNA
<213>酿酒酵母(Saccharomyces cerevisiae)
<400>15
ttgaattcat gggtaataac tgatat                                        26
<210>16
<211>32
<212>DNA
<213>酿酒酵母(Saccharomyces cerevisiae)
<400>16
aaatcaatct attttcaatt caattcatca tt                                 32
<210>17
<211>45
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>17
ggatgctgtt gactccggaa atttaacggt ttggtcttgc atccc                   45
<210>18
<211>44
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>18
ggtattgtcc tgcagacggc aatttaacgg cttctgcgaa tcgc                    44
<210>19
<211>26
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>19
tctgtgaggc ctatggatct cagaac                                        26
<210>20
<211>27
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>20
gatgctgcat gcacaactgc acctcag                                       27
<210>21
<211>59
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>21
cctctagatc tcgagctcgg tcaccggtgg cctccgcggc cgctggatcc ccagttgtg    59
<210>22
<211>33
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>22
gcaagcgcgc gcaatacatg gtgttttgat cat                                33
<210>23
<211>30
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>23
atcggtttta tgtcttccaa gtcgcaattg                                    30
<210>24
<211>33
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>24
cttggaagac ataaaaccga tggaggggta gcg                                33
<210>25
<211>9
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>25
ggttttatg                                                           9
<210>26
<211>9
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>26
gccaacatg                                                           9
<210>27
<211>33
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>27
gcaagcgcgc gcaatacatg gtgttttgat cat                                33
<210>28
<211>67
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>28
gcctctagat ctcccgggcg ccggcacatg taccaggtct taagctcgag ctcggtcacc   60
ggtggcc                                                             67
<210>29
<211>33
<212>DNA
<213>Humicola insolens
<400>29
cgcggatcca ccatgcgtac cgccaagttc gcc                                33
<210>30
<211>30
<212>DNA
<213>Humicola insolens
<400>30
gccccgggtt acaggcactg agagtaccag                                    30
QQ群二维码
意见反馈