通过移行RNA干扰来降低或消除丝状真菌菌株中的基因表达的方法 |
|||||||
申请号 | CN200780051262.9 | 申请日 | 2007-12-20 | 公开(公告)号 | CN101652479A | 公开(公告)日 | 2010-02-17 |
申请人 | 诺维信股份有限公司; | 发明人 | 霍华德·布罗迪; 唐娜·莫耶; 阿曼达·费希尔; | ||||
摘要 | 本 发明 涉及通过移行RNA干扰来降低或消除丝状 真菌 菌株中的靶基因表达的方法。 | ||||||
权利要求 | 1.用于降低或消除丝状真菌菌株中编码生物学物质的靶基因的表达的 方法,其包括: |
||||||
说明书全文 | 对序列表的提述本申请含有计算机可读形式的序列表。通过提述,将该计算机可读形式 收入本文。 发明领域 本发明涉及降低或消除丝状真菌菌株中的基因表达的方法。 发明背景丝状真菌菌株被广泛用于具有商业价值的生物学物质的生产。然而,具 有生物学物质表达和分泌增加的期望性状的丝状真菌菌株可能未必具有成 功发酵最期望的特性。生物学物质的生成可以伴有降解该生物学物质或与该 生物学物质共纯化的其它物质(例如酶)的生成,这能使生物学物质的回收和 纯化变得复杂。 这些问题的一个解决方案是灭活非期望物质的生成中所牵涉的基因。灭 活可通过使用本领域公知方法删除或破坏基因来实现。然而,在有些情况中, 由于对基因组同源区的靶向差,基因的灭活可能是困难的。灭活也可通过随 机诱变来实现,随机诱变并非总是对预定靶基因特异性的,而且常常将其它 突变引入宿主生物体中。在其它情形中,基因及其产物可能是丝状真菌菌株 的存活所要求的。在要通过删除或破坏来灭活多种基因的情况中,任务会是 非常麻烦且费时的。在存在基因家族的高度同源成员的情况中,删除或破坏 所有成员会是极端冗长且困难的。 近年来,记载了多种形式的外成性(epigenetic)基因调节(Selker,1997, Trends Genet.13:296-301;Matzke和Matzke,1998,Cell.Mol.Life.Sci.54: 94-103)。这些过程经由微RNA(Morel等,2000,Curr.Biol.10:1591-1594; Bailis和Forsburg,2002,Genome Biol.3,综述1035;Grewal和Moazed,2003, Science 301:798-802)通过调控信使RNA水平来影响基因表达(Hammond和 Baulcombe,1996,Plant Mol.Biol.32:79-88;Xi-song Ke等,2003,Current Opinion in Chemical Biology 7:516-523)。 基于果蝇(Drosophila)和秀丽线虫(Caenorhabditis elegans)的遗传研究, RNA干扰(RNAi),也称作转录后基因沉默(在植物中),理解为牵涉通过装配 将同源RNA靶向降解的蛋白质-RNA效应器核酸酶复合物来使基因表达沉默 (Hannon,2002,Nature 418:244-251)。将双链RNA(dsRNA)加工成小干扰 RNA(siRNA)通过称作Dicer的酶家族来实现(Bernstein等,2001,Nature 409: 363)。Dicer,特异性切割dsRNA的内切核酸酶的RNA酶III家族的成员,负责 将dsRNA消化成范围为20-25个核苷酸的siRNA(Elbashir等,2001,Nature 411:494)。然后,这些siRNA与RNA诱导的沉默复合物(RISC)结合(Elbashir 等,2001,Genes and Dev.15:188;NyKanen等,2001,Cell 197:300;Hammond 等,2001,Science 293:1146)。虽然没有完全理解,RISC靶向衍生反义片 段的mRNA,接着是对mRNA的内切和外切核酸酶消化,高效地使该基因的 表达沉默。已经在植物、线虫、昆虫、哺乳动物、和丝状真菌中证明了RNAi (Matzke和Matzke,1998,见上文;Kennerdell等,2000,Nat.Biotechnol.18: 896-8;Bosher等,1999,Genetics 153:1245-56;Voorhoeve和Agami,2003, Trends Biotechnol.21:2-4;McCaffrey等,2003,Nat.Biotechnol.21:639-44; WO 03/050288;WO 01/49844;WO 98/53083;和WO 05/056772)。 移行RNAi(transitive RNAi),也称作铺展(spreading),指沉默信号在特定 基因之外(beyond)移动。在植物中,已经发现移行沉默存在于双链RNA的基 因沉默所靶向的mRNA的上游和下游二者(Fabian等,2002,Plant Cell 14: 857-867;Garcia-Perez等,2004,The Plant Journal 38:594-602;Vaistij等, 2002,The Plant Cell 14:857-867;Van Houdt等,2003,Plant Physiol.131: 245-253)。在秀丽线虫中,已经将移行RNAi描述为靶dsRNA上游的转录物的 沉默(Alder等,2003,RNA J.9:25-32;Hannon,2002,Nature 418:244-251; Sijen等,2001,Cell 107:465-476)。在秀丽线虫中,移行RNAi的描述指示 了在衍生自dsRNA靶的siRNA之外,生成了与5’侧翼序列共享同源性的第二 siRNA,推测是RNA依赖性RNA聚合酶(RdRP)和Dicer活性的结果(Bleys等, 2006,RNA J.12:1633-1639;Petersen等,2005,Plant Molecular Biology 58: 575-583)。移行RNAi在昆虫和哺乳动物中不是普遍存在的(Chi等,2003,Proc. Natl.Acad.Sci.USA 100:6343-6346;Hoa等,2003,Insect Biochemistry and Molecular Biology 33:949-957;Roignamt等,2003,RNA J.9:299-308)。 移行RNAi与常规RNAi在数个方面不同。虽然双链RNA充当RNAi和移行 RNAi二者的诱导物,但是移行RNAi表现出需要RdRP,而单独的RNAi则不 然。因此,在展现移行RNAi的生物体中,基因沉默不受双链RNA的边界的 限制,而且基因沉默能延伸入侧翼序列。然而,在缺乏移行RNAi的生物体 中,基因沉默局限在双链区域内。 为了丝状真菌菌株的菌株开发和改善、功能基因组学、和途径工程,本 领域具有降低或消除一个或多个基因的表达的备选方法会是有利的。 本发明涉及降低或消除丝状真菌菌株中的一个或多个基因的表达的方法。 发明概述 本发明涉及降低或消除丝状真菌菌株中编码生物学物质的靶基因的表 达的方法,其包括: (a)向丝状真菌菌株的基因组中插入双链可转录核酸构建体,该构建体 包含与第一多核苷酸和第二多核苷酸可操作相连接的启动子,所述第一多核 苷酸包含与编码所述生物学物质的靶基因具有同源性的第一可转录区,所述 第二多核苷酸包含与靶基因没有有效同源性的第二可转录区,其中所述第二 可转录区包含两个彼此反向互补的区段且所述第一和第二可转录区被转录 成单一mRNA分子;和 (b)通过在如下条件下培养所述丝状真菌菌株来诱导包含要通过移行 RNAi的方法沉默的靶基因的序列的短干扰RNA(siRNA)的生成,所述条件容 许生成所述双链可转录核酸构建体的RNA转录物,其然后被转变成与靶基因 的RNA转录物相互作用的siRNA,以降低或消除编码所述生物学物质的靶基 因的表达。 本发明还涉及包含双链可转录核酸构建体的丝状真菌菌株,该构建体包 含与第一多核苷酸和第二多核苷酸可操作相连接的启动子,所述第一多核苷 酸包含与编码生物学物质的靶基因具有同源性的第一可转录区,所述第二多 核苷酸包含与靶基因没有有效同源性的第二可转录区,其中所述第二可转录 区包含两个彼此反向互补的区段且其中所述第一和第二可转录区被转录成 单一mRNA分子,其中通过在如下条件下培养所述丝状真菌菌株来诱导包含 要通过移行RNAi的方法沉默的靶基因的序列的短干扰RNA(siRNA)的生成, 所述条件容许生成双链可转录核酸构建体的RNA转录物,其然后被转变成与 靶基因的RNA转录物相互作用的siRNA,以降低或消除编码生物学物质的靶 基因的表达。 本发明进一步涉及生成感兴趣的生物学物质的方法,其包括: (a)在有益于生成感兴趣的生物学物质的条件下培养丝状真菌菌株,其 中该丝状真菌菌株包含双链可转录核酸构建体,该构建体包含与第一多核苷 酸和第二多核苷酸可操作相连接的启动子,所述第一多核苷酸包含与编码不 想要的生物学物质的靶基因具有同源性的第一可转录区,所述第二多核苷酸 包含与靶基因没有有效同源性的第二可转录区,其中所述第二可转录区包含 两个彼此反向互补的区段且其中所述第一和第二可转录区被转录成单一 mRNA分子,其中通过培养丝状真菌菌株来生成双链可转录核酸构建体的 RNA转录物,它然后被转变成包含要通过移行RNAi的方法沉默的靶基因的 序列的短干扰RNA(siRNA),其与靶基因的RNA转录物相互作用以降低或消 除编码不想要的生物学物质的靶基因的表达;且其中所述丝状真菌菌株包含 编码所述生物学物质的第三多核苷酸;和 (b)自培养液回收所述生物学物质。 附图简述 图1显示了丝状真菌中移行RNA干扰的示意图。 图2显示了pCW098的限制图(restriction map)。 图3显示了pCW099的限制图。 图4显示了pEFer14的限制图。 图5显示了pDM261的限制图。 图6显示了pDM266的限制图。 图7显示了pAmFs031的限制图。 图8显示了pAL01的限制图。 图9显示了pAL02的限制图。 定义 移行RNA干扰:术语“移行RNA干扰”或“移行RNAi”在本文中定义 为沉默信号在特定基因之外(beyond a particular gene)的移动。在移行RNAi 中,双链RNA(dsRNA)能充当新dsRNA的合成的模板,由此与靶序列共享同 源性的siRNA导致沿着mRNA的新序列的沉默的延伸或铺展。 短干扰RNA:术语“短干扰RNA”或“siRNA”在本文中定义为长20-25 个核苷酸的RNA片段,即Dicer介导的对双链RNA的消化的产物。 没有有效同源性:术语“没有有效同源性”在本文中定义为有义链和反 向互补链上的对应核苷酸包含优选少于20个、更优选少于15个、甚至更优选 少于10个、和最优选少于5个与靶基因序列相同的连续核苷酸。 两个彼此反向互补的区段:短语“两个彼此反向互补的区段”在本文中 定义为数段或数条DNA之一,它与其它的DNA配合以构成整体且能够进行 Watson-Crick碱基配对。 移行沉默的靶序列:短语“移行沉默靶序列”在本文中定义为为基因沉 默打上标记的(earmarked)dsRNA序列,其中该dsRNA序列是来自邻接序列 (adjoining sequence)的siRNA延伸的结果。 同一性:两种氨基酸序列之间或两种核苷酸序列之间的相关性以参数 “同一性”来描述。 就本发明而言,两种氨基酸序列之间的同一性程度使用 Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453) 来测定,正如EMBOSS包(EMBOSS:The European Molecular Biology Open Software Suite,Rice等,2000,Trends in Genetics 16:276-277)(优选3.0.0版 或更晚的)中的Needle程序中所执行的。所使用的任选参数是缺口打开罚分为 10,缺口延伸罚分为0.5,及EBLOSUM62(EMBOSS版的BLOSUM62)替代矩 阵。使用Needle标记的“最长同一性”(使用-nobrief选项获得的)的输出作为 百分比同一性,而且是如下计算的: (相同残基x100)/(比对长度-比对中的缺口总数) 就本发明而言,两种脱氧核糖核苷酸序列之间的同一性程度使用 Needleman-Wunsch算法(Needleman和Wunsch,1970,见上文)来测定,正如 EMBOSS包(EMBOSS:The European Molecular Biology Open Software Suite, Rice等,2000,见上文)(优选3.0.0版或更晚的)中的Needle程序中所执行的。 所使用的任选参数是缺口打开罚分为10,缺口延伸罚分为0.5,及EDNAFULL (EMBOSS版的NCBI NUC4.4)替代矩阵。使用Needle标记的“最长同一性”(使 用-nobrief选项获得的)的输出作为百分比同一性,而且是如下计算的: (相同脱氧核糖核苷酸x100)/(比对长度-比对中的缺口总数) cDNA:术语“cDNA”在本文中定义为可通过逆转录自从真核细胞获得 的成熟的、经过剪接的mRNA分子制备的DNA分子(Sambrook,J.,Fritsch, E.F.,和Maniatis,T,1989,Molecular Cloning:A Laboratory Manual。第2版, Cold Spring Harbor Laboratory,Cold Spring Harbor,NY)。cDNA缺少在基因 组DNA中存在的内含子序列。最初的初级RNA转录物是前体分子,其通过一 系列加工步骤之后作为成熟的、经过剪接的mRNA出现。这些步骤包括通过 称作剪接的过程消除内含子序列。因此,自mRNA衍生的cDNA缺少任何内 含子序列。 核酸构建体:术语“核酸构建体”如本文中所使用的指从天然存在基因 分离的,或经修饰而以在其它情况中不会在自然界中存在的方式含有核酸区 段的,或人工合成的,单链或双链核酸分子。当核酸构建体含有编码序列的 表达所需要的控制序列时,术语核酸构建体与术语“表达盒”同义。 控制序列:术语“控制序列”在本文中定义成包括编码本发明多肽的多 核苷酸的表达所必需的所有构件。每一种控制序列对于编码多肽的核苷酸序 列可以是天然的或外来的,或者对于彼此是天然的或外来的。此类控制序列 包括,但不限于,前导序列、聚腺苷酸化序列、前肽序列(propeptide sequence)、 启动子、信号肽序列和转录终止子。最小限度,控制序列包括启动子及转录 和翻译终止信号。控制序列可以与接头一起提供,接头用于引入特异性限制 性位点以便于控制序列与编码多肽的核苷酸序列的编码区的连接。 启动子:术语“启动子”在本文中定义为结合RNA聚合酶并将聚合酶引 导至编码生物学物质的核酸序列的正确的下游转录起始位点以启动转录的 DNA序列。RNA聚合酶高效催化与编码区的适宜DNA链互补的信使RNA的 装配。术语“启动子”还会理解为包括5′非编码区(介于启动子和翻译起点之 间)(用于转录成mRNA之后的翻译)、顺式作用转录控制元件诸如增强子、和 其它能够与转录因子相互作用的核苷酸序列。 突变型启动子:术语“突变型启动子”在本文中定义为具有亲本启动子 的包含一个或多个核苷酸的替代、删除和/或插入的核苷酸序列的启动子,其 中突变型启动子具有比相应的亲本启动子或高或低的启动子活性。术语“突 变型启动子”还涵盖天然突变体和使用本领域公知方法(诸如经典诱变、定 点诱变、和DNA改组)获得的体外生成的突变体。 杂合启动子:术语“杂合启动子”在本文中定义为两个或更多个启动子 的部分融合在一起,以生成作为所述两个或更多个启动子的融合物的序列, 当与编码序列可操作相连接时,它介导编码序列转录成mRNA。 串联启动子:术语“串联启动子”在本文中定义为与编码序列可操作相 连接以介导编码序列转录成mRNA的,以串联排列的两个或更多个启动子序 列。 可操作相连接:术语“可操作相连接”在本文中指其中控制序列被置于 相对于多核苷酸序列的编码序列的适宜位置使得控制序列指导多肽的编码 序列表达的构造(configuration)。 编码序列:在本文中使用时,术语“编码序列”指直接规定其蛋白质产 物的氨基酸序列的核苷酸序列。编码序列的边界一般由开读框来决定,开读 框通常以ATG起始密码子或可选起始密码子诸如GTG和TTG开始,并以终止 密码子诸如TAA、TAG、和TGA结束。编码序列可以是基因组DNA、cDNA、 合成DNA、或重组核苷酸序列。 表达:术语“表达”包括多肽的生成中所牵涉的任何步骤,包括,但不 限于,转录、转录后修饰、翻译、翻译后修饰和分泌。 表达载体:术语“表达载体”在本文中定义为包含编码多肽的多核苷酸 且与支持其表达的别的核苷酸可操作相连接的线性或环状DNA分子。 宿主细胞:术语“宿主细胞”,如本文中所使用的,包括易于用包含本 发明的多核苷酸的核酸构建体或表达载体转化、转染、转导等等的任何细胞 类型。 发明详述 本发明涉及降低或消除丝状真菌菌株中编码生物学物质的靶基因的表 达的方法,其包括:(a)向丝状真菌菌株的基因组中插入双链可转录核酸构建 体,该构建体包含与第一多核苷酸和第二多核苷酸可操作相连接的启动子, 所述第一多核苷酸包含与编码所述生物学物质的靶基因具有同源性的第一 可转录区,所述第二多核苷酸包含与靶基因没有有效同源性的第二可转录 区,其中所述第二可转录区包含两个彼此反向互补的区段且所述第一和第二 可转录区被转录成单一mRNA分子;和(b)通过在如下条件下培养所述丝状真 菌菌株来诱导包含要通过移行RNAi的方法沉默的靶基因的序列的短干扰 RNA(siRNA)的生成,所述条件容许生成所述双链可转录核酸构建体的RNA 转录物,其然后被转变成与靶基因的RNA转录物相互作用的siRNA,以降低 或消除编码所述生物学物质的靶基因的表达。 图1显示了移行RNA干扰。转化子生成转录产物,该转录产物由3’侧翼 为与靶基因没有同源性的反向重复序列(IR)的靶区段构成。通过IR的折叠和 退火生成的双链RNA(dsRNA)被Dicer加工,生成与IR共享同源性的siRNA。 使用转录物作为模板,一部分siRNA被RNA依赖性RNA聚合酶(RdRP)延伸超 出5′IR边界,渗入(infiltrating)靶序列。继续延伸生成由靶物编码的dsRNA, 启动RNAi。 本发明的方法提供了用于丝状真菌菌株中的菌株开发和改善、功能基因 组学、和途径工程的新机会。例如,依靠基因操作和途径工程,本方法可用 作丝状真菌宿主菌株开发的工具,或用作基因敲除(一种费时且成功率易变的 办法)的替代方法。基因可能对通过本领域已知的标准方法灭活(诸如基因敲除) 有抗性。本发明的方法提供了用于降低或消除这样的基因的表达的解决方案。 基因敲除依赖于位点特异性基因置换。在真菌中,此方法的效率受到染色体 基因座、置换构建体与基因组共享的DNA序列、和/或共享同源性的长度的影 响。所描述的移行基因沉默的实现唯一地依赖于将靶序列的部分克隆到由反 向重复构成的第二序列上游。对于降低或消除在特定丝状真菌菌株中高度表 达的基因(这在例如开发作为生产宿主的生物体中可能是非常重要的),该方法 也是特别有用和高效的。这种能力证明了本发明方法的力量。对于降低或消 除彼此高度同源的多个基因的表达,尤其是相同家族的基因或生物合成途径 或代谢途径中的同源基因,该方法也是有用的。可以操作这种方法来引起生 物学物质表达的可变减少,因此该方法进一步有用。这种可变性在编码生物 学物质的基因的完全敲除对于特定丝状真菌菌株会是致命的情况中,诸如在 流入(feed into)感兴趣生物合成途径的第二途径中,尤其重要。 在本发明的方法中,第一多核苷酸包含与靶基因具有同源性的第一可转 录区。第二多核苷酸包含与靶基因没有有效同源性的第二可转录区,其中第 二可转录区包含两个彼此反向互补的区段。 包含第一可转录区的第一多核苷酸(所述第一可转录区与编码生物学物 质的靶基因具有同源性)和包含第二可转录区的第二多核苷酸(所述第二可转 录区与靶基因没有有效同源性)可以是或不是由多核苷酸间插序列 (intervening sequence)分隔开的,所述多核苷酸间插序列是双链可转录核酸构 建体中与所述第一和第二多核苷酸有很少同源性或没有同源性的核苷酸序 列。双链可转录核酸构建体的多核苷酸序列可以是基因组、cDNA、RNA、 半合成、合成起源的,或其任意组合。 在一个优选的方面,第一和第二多核苷酸由多核苷酸间插序列分隔开。 间插序列优选由少于150个核苷酸、更优选少于100个核苷酸、更优选少于60 个核苷酸、更优选少于40个核苷酸、甚至更优选少于20个核苷酸、和最优选 少于10个核苷酸组成。 在一个更优选的方面,第一和第二多核苷酸不是由多核苷酸间插序列分 隔开的。 间插序列可以是任何与第一或第二多核苷酸没有同源性的核苷酸序列, 而且优选与丝状真菌菌株的基因组中的序列有很少的同源性或没有同源性, 以最小化不想要的靶向/重组。 启动子 启动子序列对于第一同源可转录区可以是天然的或外来的(异源的),而 且对于丝状真菌菌株可以是天然的或外来的。在本发明的方法中,启动子可 以是天然启动子、异源启动子、突变型启动子、杂合启动子、或串联启动子。 在本发明的方法中有用的启动子的例子包括从以下酶的基因获得的启 动子:米曲霉(Aspergillus oryzae)TAKA淀粉酶、米赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳 定性α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡糖淀粉酶(glaA)、米 赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、构巢曲霉 (Aspergillus nidulans)乙酰胺酶、镶片镰孢(Fusarium venenatum)淀粉葡糖苷酶 (WO 00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢Quinn(WO 00/56900)、尖镰孢(Fusarium oxysporum)胰蛋白酶样蛋白酶(WO 96/00787)、 里氏木霉(Trichoderma reesei)β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏 木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、 里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖 酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶、以及 NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉丙糖磷酸异构酶基因 的启动子的杂合体);和它们的突变的、截短的和杂合的启动子。 在一个优选的方面,启动子是NA2-tpi启动子。在另一个优选的方面, 启动子是TAKA/NA2-tpi前导杂合启动子。 同源可转录区 术语“与靶基因具有同源性的可转录区”在本文中定义为与靶基因的开 读框或其部分同源,且在被置于适宜调节序列的控制下时被转录成RNA(例 如ncRNA(非编码RNA)、tRNA(转运RNA)、rRNA(核糖体RNA)、miRNA(微 RNA)、或mRNA(信使RNA))(该RNA可以是或不是被翻译成生物学物质(例 如多肽))的核苷酸序列。可转录区的边界一般由mRNA 5′端恰位于开读框上 游的转录起始位点和mRNA 3′端恰位于开读框下游的转录终止序列决定。同 源可转录区可包括但不限于基因组DNA、cDNA、半合成的、合成的、和重 组的核酸序列。 在本发明的方法中,与靶基因同源的可转录区与靶基因的对应区域可以 是同样的,或者可以是它的同系物。 实现靶基因表达的降低或灭活所需要的同系物与靶基因对应区域之间 的同一性程度很可能会取决于靶基因。同系物的核苷酸序列相对于完整靶基 因越小,序列间的同一性程度应当优选非常高或相同。同系物的核苷酸序列 相对于完整靶基因越大,序列间的同一性程度很可能可以越低。 在本发明的方法中,同系物的核苷酸序列与靶基因的对应区域的同一性 程度为至少65%、优选至少70%、更优选至少75%、更优选至少80%、更优选 至少85%、更优选至少90%、甚至更优选至少95%、且最优选至少97%。就本 发明而言,两种核酸序列之间的同一性程度是如本文中所定义的来确定的。 或者,同系物与靶基因对应区域在各种严格条件下杂交的能力也能提供 靶基因表达降低或灭活所需要的相关性程度的指标。然而,应当认识到,同 系物与靶基因对于区域之间实现杂交所需要的严格条件越低(例如低严格 性),靶基因表达降低或灭活很可能会效率越低。 在一个优选的方面,同系物与靶基因对应区域在低严格条件下杂交。在 一个更优选的方面,同系物与靶基因对应区域在中等严格条件下杂交。在一 个甚至更优选的方面,同系物与靶基因对应区域在中等-高严格条件下杂交。 在一个最优选的方面,同系物与靶基因对应区域在高严格条件下杂交。在一 个甚至最优选的方面,同系物与靶基因对应区域在很高严格条件下杂交。 对于长度为至少100个核苷酸的探针,很低的至很高的严格条件定义为 遵循标准的Southern印迹方法,在42℃,在5X SSPE,0.3%SDS,200μg/ml经 剪切和变性的鲑精DNA,和25%甲酰胺(用于很低的和低的严格性)、35%甲酰 胺(用于中等和中等-高的严格性)、或50%甲酰胺(用于高的和很高的严格性) 中进行预杂交和杂交,最佳为12-24小时。 对于长度为至少100个核苷酸的探针,将载体材料最终优选在至少45℃ (很低的严格性)、更优选在至少50℃(低的严格性)、更优选在至少55℃(中等 严格性)、更优选在至少60℃(中等-高的严格性)、甚至更优选在至少65℃(高 的严格性)、和最优选在至少70℃(很高的严格性)使用2X SSC,0.2%SDS清洗 三次各15分钟。 对于长度为约15个核苷酸至约70个核苷酸的探针,严格条件定义为遵循 标准的Southern印迹方法在比使用根据Bolton和McCarthy(1962,Proceedings of the National Academy of Sciences USA 48:1390)的算法得出的计算Tm低约 5℃到约10℃的温度在0.9M NaCl,0.09M Tris-HCl pH 7.6,6mM EDTA,0.5% NP-40,1X Denhardt氏溶液,1mM焦磷酸钠,1mM磷酸二氢钠,0.1mM ATP, 和0.2mg/ml酵母RNA中进行预杂交、杂交和杂交后清洗,最佳为12-24小时。 对于长度为约15个核苷酸至约70个核苷酸的探针,将载体材料在比计算 Tm低5℃到10℃的温度在6X SCC加0.1%SDS中清洗一次15分钟和使用6X SSC清洗两次各15分钟。 第一同源区优选由至少19个核苷酸、更优选至少40个核苷酸、更优选至 少60个核苷酸、更优选至少80个核苷酸、甚至更优选至少100个核苷酸、且 最优选至少200个核苷酸组成。第一同源区也可以由基因的整个开读框或其 同系物组成。 非同源可转录区 双链可转录核酸构建体还包含与靶基因或宿主基因组没有有效同源性 的第二可转录区,其中所述第二可转录区包含两个彼此反向互补的区段。 在一个优选的方面,第二可转录区是任何基因的任何可转录部分,诸如 基因的5′-非翻译区、编码序列、或3′-非翻译区,其与靶基因或宿主基因组没 有有效同源性。 在一个更优选的方面,第二可转录区对应于与靶基因或宿主基因组没有 有效同源性的基因的编码序列。 在另一个更优选的方面,第二可转录区对应用于与靶基因或宿主基因组 没有有效同源性的基因的5′-非翻译区。 在另一个更优选的方面,第二可转录区对应于与靶基因或宿主基因组没 有有效同源性的基因的3′-非翻译区。 在一个最优选的方面,第二可转录区是与靶基因或宿主生物体没有同源 性的非内源基因(例如大肠杆菌的潮霉素抗性基因)的一部分。 第二可转录区优选由至少19个核苷酸、更优选至少40个核苷酸、更优选 至少60个核苷酸、更优选至少80个核苷酸、更优选至少100个核苷酸、更优 选至少250个核苷酸、甚至更优选至少500个核苷酸、最优选至少750个核苷 酸、和甚至最优选至少1000个核苷酸组成。 两个彼此反向互补的区段可以由多核苷酸接头分隔开。接头优选由至少 4个核苷酸、更优选至少20个核苷酸、更优选至少40个核苷酸、更优选至少 60个核苷酸、更优选至少80个核苷酸、甚至更优选至少100个核苷酸、最优 选至少250个核苷酸、和甚至最优选至少500个核苷酸组成。 靶基因 靶基因可以是任何编码具有生物学活性的物质的基因或任何编码具有 代谢物(以下的“生物学物质”)生物合成所牵涉的生物学活性的多肽的基因。 生物学物质可以是RNA(例如,ncRNA、rRNA、tRNA、miRNA或mRNA)。 生物学物质也可以是具有生物学活性的多肽。生物学物质还可以是代谢物。 具有生物学活性的物质对于丝状真菌菌株可以是天然的,或者对于菌株可以 是外来的或异源的。外来的或异源的物质指对于细胞不是天然的物质;或如 下的天然物质,即已经对该天然物质进行了结构修饰以改变该天然物质。 在一个优选的方面,生物学物质是具有生物学活性的多肽。多肽可以是 任何具有生物学活性的多肽。术语“多肽”在本文中并非意图指特定长度的 编码产物,因此,涵盖肽、寡肽、多肽和蛋白质。术语“多肽”还涵盖组合 在一起以形成编码产物的两种或多种多肽。多肽还包括杂合多肽,其包含自 至少两种不同多肽(其中一个或多个多肽对于丝状真菌细胞可以是异源的)获 得的部分或完整多肽序列的组合。多肽进一步包括上文所述多肽和杂合多肽 的天然存在的等位变异和工程化改造的变异。 在一个优选的方面,多肽是抗体、抗原、抗微生物肽、酶、生长因子、 激素、免疫扩张剂(immunodilator)、神经递质、受体、报道蛋白、结构蛋白、 和转录因子。 在一个更优选的方面,多肽是氧化还原酶、转移酶、水解酶、裂合酶、 异构酶或连接酶。在一个最优选的方面,多肽是乙酰木聚糖酯酶、氨肽酶、 淀粉酶、碳水化合物酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质 酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、阿魏酸酯酶、α-半乳糖苷 酶、β-半乳糖苷酶、葡糖淀粉酶、葡糖脑苷酯酶、α-葡萄糖苷酶、β-葡萄糖 苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变位酶(mutanase)、氧化酶、果 胶水解酶、过氧化物酶、磷脂酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、 核糖核酸酶、转谷氨酰胺酶、尿激酶或木聚糖酶。 在另一个优选的方面,多肽是白蛋白、胶原、原弹性蛋白、弹性蛋白、 或明胶;或其变体或杂合体。 生物学物质也可以是选择标志的产物。选择标志指其产物提供杀生物剂 抗性或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等的基因。合适的标志包括,但不限于,amdS(乙酰胺酶)、argB (鸟氨酸氨甲酰基转移酶)、bar(膦丝菌素(phosphinothricin)乙酰转移酶)、hygB (潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitrate reductase)、pyrG(乳清酸核 苷-5’-磷酸脱羧酶)(orotidine-5’-phosphate decarboxylase)、sC(硫酸腺苷酰转 移酶)、trpC(邻氨基苯甲酸合酶(anthranilate synthase)),以及它们的等同物。 在本发明的实践中可能必须分离靶基因。用于分离或克隆基因的技术是 本领域已知的,包括自基因组DNA分离、自cDNA制备、或其组合。自此类 基因组DNA克隆基因可通过例如使用公知的聚合酶链式反应(PCR)来实现。 参见,例如,Innis等,1990,PCR Protocols:A Guide to Method and Application, Academic Press,New York。克隆方法可牵涉切出并分离包含编码生物学物 质的基因的期望核酸片段,将该片段插入载体分子中,并将该重组载体掺入 丝状真菌细胞,其中会复制得到该核酸序列的多个拷贝或克隆。核酸序列可 以是基因组、cDNA、RNA、半合成、合成起源的,或其任意组合。 在一个优选的方面,靶基因的表达降低了至少20%、优选至少30%、更 优选至少40%、更优选至少50%、更优选至少60%、更优选至少70%、甚至 更优选至少80%、最优选至少90%、和甚至最优选100%。 在期望使用5′非翻译区或3′非翻译区内的靶序列的情况中,用这些区域 之任一内的反向重复序列构建的基因沉默载体可另外能够实现与沉默载体 中存在的编码序列同源的基因的沉默。因此,在期望沉默生物体内的基因同 系物的情况中,构建含有移行表达的靶序列(该靶序列在5′非翻译区、编码序 列或3′非翻译区内具有同源性)的沉默载体可容许消除或降低一个或多个展 现出对构建体内编码序列的序列同源性的基因的表达。术语“同源性”和“同 源的”通常指那些有一些共同的祖传结构且展现出活性区的高度序列相似性 的序列。 在一个优选的方面,干扰RNA与靶基因的一个或多个同系物的RNA转录 物相互作用,以降低或消除靶基因的一个或多个同系物的表达。 在一个更优选的方面,靶基因的一个或多个同系物的表达降低了至少 20%、优选至少30%、更优选至少40%、更优选至少50%、更优选至少60%、 更优选至少70%、甚至更优选至少80%、最优选至少90%、和甚至最优选100%。 丝状真菌菌株 本发明还涉及包含双链可转录核酸构建体的丝状真菌菌株,该构建体包 含与第一多核苷酸和第二多核苷酸可操作相连接的启动子,所述第一多核苷 酸包含与编码生物学物质的靶基因具有同源性的第一可转录区,所述第二多 核苷酸包含与靶基因没有有效同源性的第二可转录区,其中所述第二可转录 区包含两个彼此反向互补的区段且所述第一和第二可转录区被转录成单一 mRNA分子,其中通过在如下条件下培养所述丝状真菌菌株来诱导包含要通 过移行RNAi的方法沉默的靶基因的序列的短干扰RNA(siRNA)的生成,所述 条件容许生成双链可转录核酸构建体的RNA转录物,其然后被转变成与靶基 因的RNA转录物相互作用的siRNA,以降低或消除编码生物学物质的靶基因 的表达。 丝状真菌菌株可以是任何在本发明的方法中有用的丝状真菌菌株。“丝 状真菌”包括真菌门(Eumycota)和卵菌门(Oomycota)的亚门(如Hawksworth 等,于Ainsworth and Bisby’s Dictionary of The Fungi,第8版,1995,CAB International,University Press,Cambridge,UK中所定义的)的所有丝状形式。 丝状真菌的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、 甘露聚糖和其它复杂多糖构成的菌丝体壁。通过菌丝延伸进行营养性生长, 而碳分解代谢是专性需氧的。相反,酵母如酿酒酵母的营养性生长通过单细 胞菌体的出芽(budding)进行,而碳分解代谢可以是发酵的。 在一个优选的方面,丝状真菌菌株是枝顶孢霉属(Acremonium)、曲霉属 (Aspergillus)、短梗霉属(Aureobasidium)、烟管霉属(Bjerkandera)、拟蜡菌属 (Ceriporiopsis)、金孢子菌属(Chrysosporium)、鬼伞属(Coprinus)、革盖菌属 (Coriolus)、隐球菌属(Cryptococcus)、Filibasidium、镰孢属(Fusarium)、腐质 霉属(Humicola)、梨孢菌属(Magnaporthe)、毛霉属(Mucor)、毁丝霉属 (Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟 青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、射脉 菌属(Phlebia)、瘤胃壶菌属(Piromyces)、侧耳属(Pleurotus)、裂褶菌属 (Schizophyllum)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢 壳属(Thielavia)、弯颈霉属(Tolypocladium)、栓菌属(Trametes)或木霉属 (Trichoderma)菌株。 在一个更优选的方面,丝状真菌菌株是泡盛曲霉(Aspergillus awamori)、 烟曲霉(Aspergillus fumigatus)、臭曲霉(Aspergillus foetidus)、日本曲霉 (Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、或米曲霉(Aspergillus oryzae)菌株。在另一个最优选的方面,丝状真 菌菌株是杆孢状镰孢(Fusarium bactridioides)、禾谷镰孢(Fusarium cerealis)、 库威镰孢(Fusarium crookwellense)、大刀镰孢(Fusarium culmorum)、禾本科 镰孢(Fusarium graminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢 (Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖镰孢(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、 接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分 枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰 孢(Fusarium torulosum)、拟丝孢镰孢(Fusarium trichothecioides)、或镶片镰孢 (Fusarium venenatum)菌株。在另一个最优选的方面,丝状真菌菌株是黑刺烟 管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsis aneirina)、干拟蜡菌 (Ceriporiopsis aneirina)、Ceriporiopsis caregiea、Ceriporiopsis gilvescens、 Ceriporiopsis pannocinta、Ceriporiopsis rivulosa、Ceriporiopsis subrufa、虫拟 蜡菌(Ceriporiopsis subvermispora)、嗜角质金孢子菌(Chrysosporium keratinophilum)、Chrysosporium lucknowense、热带金孢子菌(Chrysosporium tropicum)、Chrysosporium merdarium、Chrysosporium inops、毡金孢子菌 (Chrysosporium pannicola)、Chrysosporium queenslandicum、Chrysosporium zonatum、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolus hirsutus)、特异腐 质霉(Humicola insolens)、疏棉状腐质霉(Humicola lanuginosa)、米赫毛霉 (Mucor miehei)、嗜热毁丝霉(Myceliophthora thermophila)、粗糙脉孢菌 (Neurospora crassa)、产紫青霉(Penicillium purpurogenum)、黄孢平革菌 (Phanerochaete chrysosporium)、辐射射脉菌(Phlebia radiata)、刺芹侧耳 (Pleurotus eryngii)、土生梭孢霉(Thielavia terrestris)、长绒毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉(Trichoderma harzianum)、 康宁木霉(Trichoderma koningii)、长枝木霉(Trichoderma longibrachiatum)、里 氏木霉(Trichoderma reesei)、或绿色木霉(Trichoderma viride)菌株。 在一个最优选的方面,米曲霉菌株是保藏号为IFO 4177的米曲霉菌株。 在另一个最优选的方面,镶片镰孢菌株是镶片镰孢A3/5,其最初是作为禾本 科镰孢ATCC 20334保藏的,最近由Yoder和Christianson,1998,Fungal Genetics and Biology 23:62-80及O′Donnell等,1998,Fungal Genetics and Biology 23: 57-67重新归为镶片镰孢;以及镶片镰孢的分类学等同物,不管它们当前知道 的物种名称。在另一个最优选的方面,镶片镰孢菌株是镶片镰孢A3/5或镶片 镰孢ATCC 20334的形态学突变体,如WO 97/26330中所披露的。在另一个最 优选的方面,里氏木霉菌株是里氏木霉ATCC 56765。在另一个最优选的方面, 黑曲霉菌株是黑曲霉Bo-1(DSM 12665)。在另一个最优选的方面,黑曲霉菌 株是黑曲霉Bo-1(DSM 12665)的突变体,如WO 2004/090155中所披露的。 可以通过牵涉原生质体形成、原生质体转化、和细胞壁重建的方法以本 身已知的方式来转化丝状真菌菌株。用于转化曲霉属和木霉属菌株的合适方 法记载于EP 238 023及Yelton等,1984,Proceedings of the National Academy of Sciences USA 81:1470-1474。用于转化镰孢属物种的合适方法记载于 Malardier等,1989,Gene 78:147-156及WO 96/00787。可以使用由如下文献记 载的方法来转化酵母:Becker和Guarente,于Abelson,J.N.和Simon,M.I.,编, Guide to Yeast Genetics and Molecular Biology,Methods in Enzymology,卷194, pp 182-187,Academic Press,Inc.,New York;Ito等,1983,Journal of Bacteriology 153:163;及Hinnen等,1978,Proceedings of the National Academy of Sciences USA 75:1920。 编码不想要的生物学物质的靶基因的表达的消除或降低可使用本领域 已知的、对所靶定的生物学物质特异性的方法来检测。这些检测方法可以包 括特异性抗体的使用、高效液相层析、毛细管电泳、酶产物的形成、酶底物 的消失、SDS-PAGE、或表型(例如孢子颜色)的消失或出现。例如,可以使 用酶测定法(enzyme assay)来测定所述酶的活性。用于测定酶活性的方法,对 于许多酶是本领域已知的(参见例如D.Schomburg和M.Salzmann(编), Enzyme Handbook,Springer-Verlag,New York,1990)。 生产方法 本发明还涉及感兴趣生物学物质的生产方法,其包括:(a)在有益于感兴 趣生物学物质生成的条件下培养丝状真菌菌株,其中所述丝状真菌菌株包含 双链可转录核酸构建体,该构建体包含与第一多核苷酸和第二多核苷酸可操 作相连接的启动子,所述第一多核苷酸包含与编码不想要的生物学物质的靶 基因具有同源性的第一可转录区,所述第二多核苷酸包含与靶基因没有有效 同源性的第二可转录区,其中所述第二可转录区包含两个彼此反向互补的区 段且所述第一和第二可转录区被转录成单一mRNA分子,其中通过在如下条 件下培养丝状真菌菌株来生成双链可转录核酸构建体的RNA转录物,所述条 件容许生成所述RNA转录物,它然后被转变成包含要通过移行RNAi的方法 沉默的靶基因的序列的短干扰RNA(siRNA),其与靶基因的RNA转录物相互 作用以降低或消除编码不想要的生物学物质的靶基因的表达;且其中所述丝 状真菌菌株包含编码感兴趣生物学物质的第三多核苷酸;和(b)自培养液回收 感兴趣生物学物质。 感兴趣的生物学物质可以是任何如本文中所描述的生物学物质。在一个 优选的方面,感兴趣的生物学物质是具有生物学活性的多肽。它对于丝状真 菌菌株可以是天然的或外来的。编码不想要的生物学物质的靶基因的表达的 降低或消除可导致另一种感兴趣的生物学物质的表达增加。不想要的生物学 物质能直接影响感兴趣的生物学物质的生成或表达。例如,不想要的生物学 物质可以是攻击感兴趣的生物学物质,由此降低所生成的感兴趣的生物学物 质的量的蛋白酶。通过降低或消除蛋白酶的表达,会表达和生成更多的感兴 趣的生物学物质。或者,不想要的生物学物质可以与感兴趣的生物学物质共 享一个或多个细胞过程,例如,转录因子或分泌途径,由此降低所生成的感 兴趣的生物学物质的量。通过降低或消除不想要的生物学物质的表达,更多 的一个或多个细胞过程会是感兴趣的生物学物质可利用的,例如,限制表达 的转录元件,由此提高所表达的和所生成的感兴趣的生物学物质的量。此外, 不想要的生物学物质可以是污染感兴趣的生物学物质,阻止感兴趣的生物学 物质在特定应用中(例如,酶在食品加工中)使用的毒素。 在本发明的生产方法中,使用本领域已知方法在适合于感兴趣的生物学 物质生成的营养培养基中培养丝状真菌菌株。例如,可以通过在合适培养基 中和在允许生物学物质表达和/或分离的条件下进行的摇瓶培养和实验室或 工业发酵罐中的小规模或大规模发酵(包括连续的、分批的、补料分批的或 固态的发酵)来培养菌株。使用本领域已知的方法在合适的营养培养基中进 行培养,所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商 业供应商获得或可以根据公开的组成制备(例如,在美国典型培养物保藏中 心的目录中)。如果生物学物质被分泌入营养培养基中,那么可以自培养基 直接回收它。如果生物学物质不被分泌,那么可以自细胞裂解物回收它。 可以使用本领域已知的、对于生物学物质是特异性的方法来检测感兴趣 的生物学物质。这些检测方法可以包括特异性抗体的使用、高效液相层析、 毛细管层析、酶产物的形成、酶底物的消失或SDS-PAGE。例如,可以使用酶 测定法来测定酶的活性。用于测定酶活性的方法,对于许多酶是本领域已知 的(参见例如D.Schomburg和M.Salzmann(编),Enzyme Handbook, Springer-Verlag,New York,1990)。 所得感兴趣的多肽可以使用本领域已知方法来分离。例如,可以通过常 规方法自培养基回收感兴趣的多肽,所述常规方法包括但不限于离心、过滤、 提取、喷雾干燥、蒸发或沉淀。然后,分离得到的多肽可以通过本领域已知 的多种方法来进一步纯化,所述方法包括但不限于层析(例如离子交换、亲和、 疏水、层析聚焦、和大小排阻)、电泳方法(例如制备型等电聚焦(IEF))、差别 溶解度(例如硫酸铵沉淀)、或提取(参见例如Protein Purification,J.-C.Janson和 Lars Ryden编,VCH Publishers,New York,1989)。可以通过例如提取、沉淀、 或差别溶解度或本领域已知的任何方法自培养基分离感兴趣的代谢物。然后, 分离得到的代谢物可使用适合于代谢物的方法进一步纯化。 编码生物学物质的多核苷酸 编码感兴趣的生物学物质的分离的多核苷酸序列可以自任何原核的、真 核的或其它来源获得。就本发明而言,术语“自...获得”或“得自”,如本 文中与给定来源一起使用的,应当意味着该生物学物质是由该来源或其中已 经插入了来自该来源的基因的细胞生成的。 用于分离或克隆编码感兴趣生物学物质的多核苷酸的技术是本领域已知 的,包括自基因组DNA分离、自cDNA制备、或其组合。自此类基因组DNA克 隆多核苷酸可以通过例如使用众所周知的聚合酶链式反应(PCR)来实现。参见 例如Innis等,1990,PCR Protocols:A Guide to Methods and Application,Academic Press,New York。克隆步骤可以涉及切出和分离包含编码生物学物质的多核苷 酸的期望核酸片段,将该片段插入载体分子,并将该重组载体掺入突变体丝状 真菌细胞,其中将会复制多个拷贝或克隆的所述核酸序列。所述多核苷酸可以 是基因组、cDNA、RNA、半合成、合成来源的,或其任意组合。 核酸构建体 编码感兴趣生物学物质的分离的多核苷酸可以包含在丝状真菌菌株中 的核酸构建体中。核酸构建体包含编码感兴趣生物学物质的核苷酸序列,其 与至少一种启动子和一个或多个控制序列可操作相连接,它们指导所述核苷 酸序列在丝状真菌菌株中在与所述控制序列相容的条件下表达。表达应当理 解为包括感兴趣的生物学物质的生成所涉及的任何步骤,包括但不限于转 录、转录后修饰、翻译、翻译后修饰和分泌。 可以以多种方式进一步操作编码感兴趣生物学物质的分离的多核苷酸, 从而为生物学物质的表达作准备。取决于表达载体,在将核苷酸序列插入载 体前对其进行操作可能是想要的或必要的。利用重组DNA方法修饰核苷酸序 列的技术是本领域众所周知的。 在本发明的方法中,多核苷酸可以包含一个或多个天然控制序列,或者 可以将一个或多个天然控制序列用对核苷酸序列而言是外来的一个或多个 控制序列替换,从而改进编码序列在宿主细胞中的表达。此类控制序列包括 但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列、和 转录终止子。最低限度,控制序列包括启动子、及转录和翻译终止信号。为 了导入特定限制性位点以促进控制序列与编码感兴趣生物学物质的核苷酸序 列的编码区的连接,控制序列可以与接头一起提供。 控制序列可以是适当的启动子序列,即受到用于表达编码生物学物质的 多核苷酸的宿主细胞识别的核苷酸序列。启动子序列包含介导生物学物质表 达的转录控制序列。启动子可以是在所选择的宿主细胞中显示出转录活性的 任何核苷酸序列,包括突变的、截短的和杂合的启动子,而且可以从编码对 于宿主细胞而言是同源的或异源的胞外或胞内多肽的基因获得。 用于指导核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例 是从下列酶的基因获得的启动子:米曲霉TAKA淀粉酶、米赫根毛霉天冬氨 酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛 曲霉葡糖淀粉酶(glaA)、米赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉丙 糖磷酸异构酶、构巢曲霉乙酰胺酶、镶片镰孢淀粉葡糖苷酶(WO 00/56900)、 镶片镰孢Daria(WO 00/56900)、镶片镰孢Quinn(WO 00/56900)、尖镰孢胰蛋 白酶样蛋白酶(WO 96/00787)、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解 酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切 葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木 霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β- 木糖苷酶、以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉丙糖 磷酸异构酶基因的启动子的杂合体);和它们的突变的、截短的和杂合的启 动子。 控制序列可以是合适的转录终止子序列,即被宿主细胞识别以终止转录 的序列。终止子序列可操作连接至编码生物学物质的核酸序列的3’端。可以 将在所选择的丝状真菌菌株中有功能的任何终止子用于本发明。 对于丝状真菌菌株优选的终止子从如下酶的基因获得:米曲霉TAKA淀 粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶 和尖镰孢胰蛋白酶样蛋白酶。 控制序列还可以是合适的前导序列,即对于丝状真菌菌株进行的翻译而 言是重要的mRNA非翻译区。前导序列可操作连接至编码生物学物质的核酸 序列的5’端。可以将在所选择的丝状真菌菌株中有功能的任何前导序列用于 本发明。 对于丝状真菌菌株优选的前导序列从如下酶的基因获得:米曲霉TAKA 淀粉酶、构巢曲霉丙糖磷酸异构酶、镶片镰孢胰蛋白酶、和镶片镰孢葡糖淀 粉酶。 控制序列也可以是聚腺苷酸化序列,即可操作连接至核酸序列的3’端, 在转录时被宿主细胞识别为向转录的mRNA添加聚腺苷残基的信号的序列。 可以将在所选的丝状真菌菌株中有功能的任何聚腺苷酸化序列用于本发明。 对于丝状真菌菌株优选的聚腺苷酸化序列从如下酶的基因获得:米曲霉 TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰 蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶。 控制序列还可以是信号肽编码区,其编码与多肽的氨基末端相连接并指 导编码的多肽进入细胞分泌途径的氨基酸序列。核酸序列编码序列的5’端可 固有地包含信号肽编码区,其与编码分泌多肽的编码区片段一起天然地连接 在翻译阅读框中。可供选择的是,编码序列5’端可含有对于所述编码序列外 来的信号肽编码区。外来信号肽编码区在编码序列不天然地含有信号肽编码 区时可为必需的。或者,外来信号肽编码区可以简单地取代天然信号肽编码 区以增强多肽的分泌。然而,指导表达的多肽进入所选真菌宿主细胞的分泌 途径的任何信号肽编码区可在本发明中使用。 对于丝状真菌菌株有效的信号肽编码区是从如下酶的基因获得的信号 肽编码区:米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、 米赫根毛霉天冬氨酸蛋白酶、特异腐质霉纤维素酶、和疏棉状腐质霉脂肪酶。 控制序列还可以是前肽编码区,其编码位于多肽氨基末端的氨基酸序 列。所得多肽称为酶原(proenzyme)或多肽原(或在某些情况下为酶原 (zymogen))。多肽原一般是没有活性的,而且可以通过催化性地或自身催化 性地自多肽原切割掉前肽而转变成成熟的、有活性的多肽。可以从如下酶的 基因获得前肽编码区:酿酒酵母α-因子、米赫根毛霉天冬氨酸蛋白酶、和嗜 热毁丝霉(Myceliophthora thermophila)漆酶(WO 95/33836)。 若多肽的氨基末端存在有信号肽区和前肽区两者时,则前肽区连接至多 肽的氨基末端,而信号肽区连接至前肽区的氨基末端。 可能还期望添加调节序列,其允许相对于丝状真菌菌株的生长来调节生 物学物质的表达。调节系统的例子是那些引起基因表达响应化学或物理刺激 (包括调节性化合物的存在)而开启或关闭的系统。在丝状真菌中,可以使用 TAKA α-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子、米曲霉葡糖淀粉酶启动 子、和镶片镰孢葡糖淀粉酶启动子作为调节序列。调节序列的其它实例是那 些允许基因扩增的序列。在真核系统中,这些序列包括在氨甲蝶呤 (methotrexate)存在下扩增的二氢叶酸还原酶基因,和以重金属(with heavy metal)扩增的金属硫蛋白基因。在这些情况中,编码感兴趣生物学物质的核 苷酸序列会与调节序列可操作相连接。 表达载体 编码感兴趣生物学物质的多核苷酸可以包含在重组表达载体中,该重组 表达载体包含启动子、编码生物学物质的核苷酸序列、及转录和翻译终止信 号。本文所述各种核酸和控制序列可以结合在一起以产生重组表达载体,其 可以包含一个或多个(数个)方便的限制性位点以允许在这些位点插入或取代 编码多肽的核苷酸序列。或者,可以通过在用于表达的适当载体中插入核苷 酸序列或包含所述序列的核酸构建体来表达多核苷酸序列。在创建表达载体 时,将编码序列置于载体中,使得编码序列与用于表达的适当的控制序列可 操作相连接。 重组表达载体可以是任何载体(例如质粒或病毒),其能方便地进行重组 DNA步骤,而且能产生核苷酸序列的表达。载体的选择将通常取决于载体与其 中待引入该载体的宿主细胞的相容性。载体可以是线状的或闭合环状的质粒。 载体可以是自主复制载体,即作为染色体外实体(entity)存在的载体,其复 制独立于染色体复制,例如质粒、染色体外元件、微型染色体(minichromosome)、 或人工染色体。载体可以包含任何用于确保自复制的手段(means)。或者,载体 可以是一种当被导入宿主细胞时,整合到基因组中并且与整合了该载体的染色 体一起复制的载体。此外,可以使用单一的载体或质粒或者两个或更多个载体 或质粒,其一起含有待导入宿主细胞基因组的总DNA(total DNA),或者可以使 用转座子。 载体优选包含一个或多个(数个)选择标志,其允许简单选择经转化、转 染、转导等等的细胞。选择标志是其产物提供杀生物剂抗性或病毒抗性、对 重金属的抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等的基因。 用于丝状真菌宿主细胞的选择标志包括但不限于amdS(乙酰胺酶)、argB(鸟 氨酸氨甲酰基转移酶)、bar(膦丝菌素(phosphinothricin)乙酰转移酶)、hph(潮 霉素磷酸转移酶)、niaD(硝酸还原酶)(nitrate reductase)、pyrG(乳清酸核苷 -5’-磷酸脱羧酶)(orotidine-5’-phosphate decarboxylase)、sC(硫酸腺苷酰转移 酶)、和trpC(邻氨基苯甲酸合酶(anthranilate synthase)),以及它们的等效物。 优选用在曲霉属细胞中的是构巢曲霉或米曲霉的amdS和pyrG基因和吸水链 霉菌(Streptomyces hygroscopicus)的bar基因。 载体优选包含允许载体整合入宿主细胞基因组或允许载体在细胞中独立 于基因组自主复制的元件。 为了整合入宿主细胞基因组,载体可以依赖编码多肽的多核苷酸序列或 用于通过同源或非同源重组整合入基因组的任何其它载体元件。或者,载体 可以包含额外的核苷酸序列,用于指导通过同源重组在染色体中的精确位置 整合入宿主细胞基因组中。为了增加在精确位置处整合的可能性,整合元件 应优选包含足够数目的核酸,如100-10,000碱基对、优选400-10,000碱基对和 最优选800-10,000碱基对,其与相应的靶序列具有高的同一性程度以增强同 源重组的概率。整合元件可以是与宿主细胞基因组中的靶序列同源的任何序 列。此外,整合元件可以是非编码的或编码的核苷酸序列。另一方面,可以 将载体通过非同源重组整合到宿主细胞的基因组中。 为了自主复制,载体可以进一步包含复制起点,其使载体能够在所讨论 的宿主细胞中自主复制。复制起点可以是在细胞中发挥功能的、介导自主复 制的任何质粒复制子(replicator)。术语“复制起点”或“质粒复制子”在本 申请中定义为使质粒或载体能够在体内复制的核苷酸序列。 在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等, 1991,Gene 98:61-67;Cullen等,1987,Nucleic Acids Research 15:9163-9175; WO 00/24883)。分离AMA1基因和构建包含该基因的质粒或载体可以依照 WO 00/24883中披露的方法来进行。 可以将多于一个拷贝的多核苷酸插入宿主细胞以增加基因产物的产生。多 核苷酸拷贝数的增加可通过如下方法获得:将至少一个额外拷贝的序列整合入 宿主细胞基因组,或将可扩增的选择标志基因包括在多核苷酸内,其中可通过 在适当选择剂(selectable agent)存在下培养细胞来选择含有选择标志基因的扩 增拷贝并由此含有多核苷酸的额外拷贝的细胞。 用于连接上文所述元件以构建重组表达载体的方法是本领域技术人员 熟知的(参见例如Sambrook等,1989,见上文)。 通过下文实施例来进一步描述本发明,所述实施例不应解释为限制本发 明的范围。 实施例 培养基和溶液 amdS覆盖琼脂每升由20ml COVE盐溶液,273.8g蔗糖,8g Noble琼脂, 10mM乙酰胺,和15mM CsCl,pH 5.0构成。 AMG痕量金属溶液每升由14.3g ZnSO4·7H2O,2.5g CuSO4·5H2O,0.5g NiCl2·6H2O,13.8g FeSO4·7H2O,8.5g MnSO4·H2O,和3.0g柠檬酸构成。 纤维素酶诱导培养基每升由20g Arbocel-天然纤维素纤维(J.Rettenmaier USA LP),10g玉米浆固体(corn steep solids,Sigma Chemical Co.,St.Louis, MO,USA),1.45g(NH4)2SO4,2.08g KH2PO4,0.28g CaCl2,0.42g MgSO4·7H2O, 0.42ml里氏木霉痕量金属溶液,和2滴Pluronic酸构成。在高压灭菌前将pH用 10N NaOH调节至6.0。 COVE选择板每升由342.3g蔗糖,20ml COVE盐溶液,10mM乙酰胺, 15mM CsCl2,和25g或30g Noble琼脂构成。 COVE2板每升由30g蔗糖,20ml COVE盐溶液,10mM乙酰胺,和25g 或30g Noble琼脂构成。 COVE盐溶液每升由26g KCl,26g MgSO4·7H2O,76g KH2PO4,和50ml COVE痕量金属溶液构成。 COVE痕量金属溶液每升由0.04g NaB4O7·10H2O,0.4g CuSO4·5H2O,1.2g FeSO4·7H2O,0.7g或1g MnSO4·H2O,0.8g Na2MoO2·2H2O,和10g ZnSO4·7H2O 构成。 COVE A盐溶液每升由26g KCl,26g MgSO4,76g KH2PO4,和50ml COVE A痕量元素溶液。 COVE A痕量元素溶液每升由0.04g NaB4O7·10H2O,0.4g CuSO4·5H2O, 0.8g FeSO4·7H2O,0.8g MnSO4·H2O,0.8g Na2MoO2·2H2O,10g ZnSO4·7H2O, 和10g柠檬酸构成。 COVE A减尿素加乙酰胺选择板每升由20ml COVE A盐溶液,220g山梨 醇,10g葡萄糖,10mM乙酰胺,和30g细菌用琼脂(Bacto agar),pH 5.2构成。 M410每升由50g麦芽糖,50g葡萄糖,2g MgSO4·7H2O,2g KH2PO4, 4g柠檬酸,8g酵母提取物,2g尿素,0.5ml AMG痕量金属溶液,和0.5g CaCl2,pH 6.0构成。 基本培养基每升由6g NaNO3,0.52g KCl,1.52g KH2PO4,1ml COVE痕 量元素溶液,10g葡萄糖,0.5g MgSO4·7H2O,和0.004g D-生物素构成。 基本培养基琼脂每升由6g NaNO3,0.52g KCl,1.52g KH2PO4,1ml COVE 痕量元素溶液,20g Noble琼脂,10g葡萄糖,0.5g MgSO4·7H2O,和0.004g D- 生物素构成。 PDA板每升由39g DIFCOTM马铃薯右旋糖糖(Becton Dickinson and Co., Sparks,MD,USA)构成。 PEG由60%PEG 4000(Polysciences,Inc.,Warrington,PA,USA),10mM CaCl2,和10mM Tris-HCl,pH 6.5构成,过滤除菌。 SPC由40%PEG 4000,50mM CaCl2,和0.8M山梨醇,pH 4.5-5.5构成, 过滤除菌。 20X SSC每升由175.3g NaCl和88.2g柠檬酸钠pH 7.0构成。 0.5X SSC每升由4.38g NaCl和2.2g柠檬酸钠pH 7.0构成。 STC由1M山梨醇,10mM CaCl2,和10mM Tris-HCl,pH 6.5构成,过滤 除菌。 里氏木霉痕量金属溶液每升由216g FeCl3·6H2O,58g ZnSO4·7H2O,27g MnSO4·H2O,10g CuSO4·5H2O,2.4g H3BO3,和336g柠檬酸构成。 YPG每升由10g酵母提取物(Fisher Scientific,Fair Lawn,NJ,USA), 20g BACTOTM蛋白胨(Becton Dickinson and Co.,Sparks,MD,USA),和20g 葡萄糖构成。 实施例1:质粒pCW098的构建 质粒pCW098构建成含有TAKA/NA2-tpi前导杂合启动子(美国专利No. 6,461,837)、自大肠杆菌潮霉素抗性基因(Kaster等,1983,Nucleic Acids Res. 11:6895-6911)的部分制备的反向重复序列(hyg IR)、黑曲霉淀粉葡萄糖苷酶 (AMG)终止子(Hata等,1991,Agric.Biol.Chem.55:941-949)、和作为选择 标志的构巢曲霉pyrG基因(Ballance和Turner,1985,Gene 36:321-331)。 为了表达自大肠杆菌aph(4)(hygB)基因(Kaster等,1983,见上文)衍生的 双链RNA(dsRNA),使用下文所示拥有Not I限制性位点的有义链引物和拥有 5′Sma I或Xma I限制性位点的反义引物自aph(4)基因开读框内PCR扩增反向 重复序列的一半,即199个碱基对。 引物cwhygnot.1(有义): 5’-gcggccgcGCGATGTTCGGGGATTCCCAATACGAGGTC-3’(SEQ ID NO:1) 引物cwhygsma.1A(反义): 5’-cccgggGCATCATCGAAATTGCCGTCAACCAAGCTC-3’(SEQ ID NO:2) hygB编码序列的部分以大写字母显示。 扩增反应(50μl)由1X THERMOPOLTM反应缓冲液(New England Biolabs, Beverly,MA,USA),0.4mM dNTP,100ng pSMai155(WO 05/074647),50 pmole有义引物,50pmole反义引物,和5个单位Taq DNA聚合酶(New England Biolabs,Beverly,MA,USA)构成。将反应在 5333(Eppendorf AG,Hamburg,Germany)中温育,编程 为30个循环,每个循环94℃30秒、55℃30秒、和72℃1分钟(最后延伸7分钟)。 214bp的PCR产物通过TAE缓冲液(每升4.84g Tris碱,1.14ml冰醋酸,和2ml 0.5M EDTA pH 8.0)中的1%琼脂糖凝胶电泳来纯化,并使用凝胶 提取试剂盒(QIAGEN Inc.,Valencia,CA,USA)进一步纯化。使用TA 克隆试剂盒连接214bp PCR产物与pCR2.1-并依照制造商的指示 (Invitrogen Corporation,Carlsbad,CA,USA)转化入TOP10化学 感受态大肠杆菌细胞。使用9600(QIAGEN Inc.,Valencia,CA, USA)纯化来自数个转化子的质粒DNA,并通过DNA测序来分析以鉴定含有期 望的hygB插入物的那些。将具有预期DNA序列的一个质粒命名为MP#3。 使用下文所示拥有5’Pac I限制性位点的有义链引物和拥有5′Sma I或 Xma I限制性位点的反义引物扩增反向重复序列的另一半(包括100个碱基对 的间隔物(spacer));hygB序列以大写字母显示。 引物cwhygpac.2(有义): 5’-ttaattaaGCGATGTTCGGGGATTCCCAATACGAGGTC-3’(SEQ ID NO:3) 引物cwhygsma.2a(反义): 5’-cccgggATCGGTCCAGACGGCCGCGCTTCTGCGGGC-3’(SEQ ID NO:4) 扩增反应(50μl)由1X THERMOPOLTM反应缓冲液,0.4mM dNTP,100ng pSMai155,50pmole有义引物,50pmole反义引物,和5个单位Taq DNA聚合 酶构成。将反应在5333中温育,编程为 30个循环,每个循环94℃30秒、55℃30秒、和72℃1分钟(最后延伸7分钟)。 314bp的PCR产物通过TAE缓冲液中的1%琼脂糖凝胶电泳来纯化,并使 用凝胶提取试剂盒进一步纯化。使用TA克隆试剂盒连 接314bp PCR产物与pCR2.1-并依照制造商的指示转化入ONE TOP10化学感受态大肠杆菌细胞。使用9600纯化来自 数个转化子的质粒DNA,并通过DNA测序来分析以鉴定含有期望的hygB插 入物的那些。将具有预期DNA序列的一个质粒命名为MP#9。 用Not I和Xma I消化MP#3。用Pac I和Xma I消化MP#9。通过TAE缓冲液 中的1%琼脂糖凝胶电泳纯化这两种hygB DNA片段,并使用凝 胶提取试剂盒提取。将片段连接至经Not I/Pac I消化的载体pAlLo2(WO 05/056772,实施例21)以创建pCW098(图2)。 实施例2:质粒pCW099的构建 质粒pCW099构建成含有TAKA/NA2-tpi前导杂合启动子、来自米曲霉wA 基因(全长基因组DNA序列为SEQ ID NO:5,推导氨基酸序列为SEQ ID NO: 6)的片段、大肠杆菌hygB反向重复序列(hyg IR)、黑曲霉淀粉葡萄糖苷酶 (AMG)终止子、和作为选择标志的构巢曲霉pyrG基因。 使用下文所示引物cwwanco.1corr(有义)和cwwanot.1A(反义)自从米曲 霉菌株P2-5.1(WO 05/056772,实施例27和28)挽救的质粒加wA侧翼序列PCR 扩增米曲霉wA基因(DNA序列为SEQ ID NO:7,其推导氨基酸序列为SEQ ID NO:8)的176bp片段。有义引物工程化改造成在5’末端具有Nco I位点,而反 义引物工程化改造成在5’末端具有Not I位点。 引物cwwanco.1corr(有义): 5’-ccatggAGCACTTCGATTGCATTAG-3’(SEQ ID NO:9) 引物cwwanot.1A(反义): 5’-gcggccgcAGAACGAACGCAGGTTTTATAC-3’(SEQ ID NO:10) wA序列以大写字母显示。 扩增反应(50μl)由1X THERMOPOLTM反应缓冲液,0.4mM dNTP,100ng 米曲霉P2-5.1 DNA(WO 05/056772),50pmole引物cwwanco.1corr,50pmole 引物cwwanot.1a,和5个单位Taq DNA聚合酶构成。将反应在 5333中温育,编程为30个循环,每个循环94℃30秒、55℃ 30秒、和72℃1分钟(最后延伸7分钟)。 188bp的PCR产物通过TAE缓冲液中的1%琼脂糖凝胶电泳来纯化,并使 用凝胶提取试剂盒进一步纯化。使用TA克隆试剂盒连 接188bp PCR产物与pCR2.1-并依照制造商的指示转化入ONE TOP10化学感受态大肠杆菌细胞。使用9600纯化来自 数个转化子的质粒DNA,并通过DNA测序来分析以鉴定含有期望的wA插入 物的那些。将具有预期DNA序列的一个质粒命名为MP#10。 将MP#10 DNA用Nco I和Not I消化,并通过TAE缓冲液中的1%琼脂糖凝 胶电泳来纯化。使用凝胶提取试剂盒提取wA片段。将纯化的片 段连接至经Nco I/Not I消化的pCW098以创建pCW099(图3)。 实施例3:质粒pEFer14的构建 质粒pEFer14构建成含有TAKA/NA2-tpi前导杂合启动子、米曲霉wA基因 的176bp片段、大肠杆菌hygB反向重复序列(hyg IR)、黑曲霉淀粉葡萄糖苷酶 (AMG)终止子、和作为选择标志的全长构巢曲霉amdS基因。 通过TAE缓冲液中的1%琼脂糖凝胶电泳来纯化经Nco I和Pac I消化的质 粒pCW099。使用-DA柱(Millipore,Billerica,MA,USA)依 照制造商的指示提取含有176bp wA片段和hygB反向重复序列的698bp片段。 将纯化的片段连接至经Nco I/Pac I消化的pAlLo1(WO 05/056772,实施例1) 以创建pEFer14(图4)。 实施例4:质粒pDM261的构建 质粒pDM261构建成含有TAKA/NA2-tpi前导杂合启动子、大肠杆菌hygB 反向重复序列(hyg IR)、黑曲霉淀粉葡萄糖苷酶(AMG)终止子、和作为选择 标志的全长构巢曲霉amdS基因。 通过TAE缓冲液中的1%琼脂糖凝胶电泳来纯化经Nco I和Pac I消化的质 粒pCW098。使用-DA柱提取含有hygB反向重复序列的527bp 片段。将纯化的片段连接至经Nco I/Pac I消化的pAlLo1以创建pDM261(图5)。 实施例5:质粒pDM266的构建 质粒pDM266构建成含有TAKA/NA2-tpi前导杂合启动子、米曲霉wA基因 的499bp片段、大肠杆菌hygB反向重复序列(hyg IR)、黑曲霉淀粉葡萄糖苷酶 (AMG)终止子、和作为选择标志的全长构巢曲霉amdS基因。 使用下文所示引物wA500FWD(有义)和wA500REV(反义)自米曲霉菌 株A1560(IFO 4177)基因组DNA扩增wA基因的499bp片段。有义引物工程化 改造成在5’末端具有Nco I位点,而反义引物工程化改造成在5’末端具有Not I 位点。使用植物Maxi试剂盒(QIAGEN Inc.,Valencia,CA,USA) 依照制造商的指示制备米曲霉菌株A1560(IFO 4177)基因组DNA。 引物wA500FWD(有义): 5’-ccatggGCGCTCAAAAACAACATCAAC-3’(SEQ ID NO:11) 引物wAREV(反义): 5’-gcggccgcAGAACGAACGCAGGTTTTAT-3’(SEQ ID NO:12) wA序列以大写字母显示。 扩增反应(50μl)由1X THERMOPOLTM反应缓冲液,0.2mM dNTP,100ng 米曲霉菌株A1560基因组DNA,50pmole引物wA500FWD,50pmole引物 wA500REV,和2.5个单位Taq DNA聚合酶构成。将反应在 5333中温育,编程为30个循环,每个循环94℃30秒、55℃ 30秒、和72℃30秒(最后延伸10分钟)。 513bp的PCR产物通过TAE缓冲液中的1%琼脂糖凝胶电泳来纯化,并使 用-DA柱进一步纯化。使用TA克隆试剂盒连接wA片 段与pCR2.1-并依照制造商的指示转化入ONETOP10化学 感受态大肠杆菌细胞。使用9600纯化来自数个转化子的质粒 DNA,并通过DNA测序来分析以鉴定含有期望的wA插入物的那些。将具有 预期DNA序列的一个质粒命名为MP#8。 将MP#8 DNA用Nco I和Not I消化,并通过TAE缓冲液中的1%琼脂糖凝胶 电泳来纯化。使用凝胶提取试剂盒提取wA片段。将纯化的片段 连接至经Nco I/Not I消化的pDM261以创建pDM266(图6)。 pDM266中的499bp wA片段(wA基因的碱基对2607-3106)与pCW099和 pEFer14中的176bp wA片段具有相同的3’末端。 实施例6:米曲霉的转化和转化子的分析 将米曲霉菌株JaL250(WO 98/11203)在补充有20mM尿苷(uridine)的PDA 板上于34℃培养7天。通过如下收集孢子:添加5ml 0.01%80(Fisher Scientific,Fair Lawn,NJ,USA),使用无菌接种环刮板的表面,并用5ml移 液器收集孢子悬浮液。将大约2-5×107个孢子添加至500ml烧瓶中的100ml YPG培养基,并于30-34℃和140rpm温育16-18小时。使用无菌0.2μm 500ml 过滤单元(Millipore,Billerica,MA,USA)收集菌丝体。自生长培 养基中过滤出菌丝体,然后用100ml 0.7M KCl清洗两次。将菌丝体重悬于20ml 原生质体化溶液(protoplasting solution)[0.7M KCl中5mg/ml (Novozymes A/S,Denmark)加0.5mg/ml几丁质酶(Sigma Chemical Co.,St.Louis,MO,USA)]。将菌丝体转移至125ml摇瓶,并于34℃,80rpm 温育30-90分钟。将原生质体经衬有MIRACLOTHTM(Calbiochem,San Diego, CA,USA)的无菌漏斗倾倒入无菌50ml聚丙烯管。将原生质体在Sorvall RT6000D离心机中以1,303x g于室温离心20分钟。丢弃上清液,并将原生质体 重悬于20ml STC。将原生质体如上所述离心并重悬于20ml STC。取出20μl等 分试样并用STC稀释。使用血球计对原生质体计数。将原生质体如上所述离 心并重悬于适当体积的STC以产生2×107个原生质体/ml。 将5μg pEFer14、pDM261、或pDM266 DNA添加至100μl米曲霉JaL250 原生质体。于室温温育30分钟后,将原生质体/DNA混合物用STC调节至9ml, 分成3份等份,并涂布到3块补充有20mM尿苷和1%麦芽糖的150mm COVE 板上。然后将板于34℃温育。在乙酰胺上生长要求每一种表达质粒上所存在 的amdS基因的表达。 温育4天后,在成熟孢子着色变得明显前,将25或30个使用质粒pEFer14、 pDM261、和pDM266获得的初级转化子在补充有20mM尿苷和1%麦芽糖的 COVE2板上划线。所有自pDM261转化子衍生的菌落一律为深绿色。相反, 自pEFer14或pDM266转化子获得的菌落孢子颜色变化范围为浅黄色至深绿 色。如下纯化转化子,即将孢子在补充有20mM尿苷和1%麦芽糖的COVE2 板上划线,然后挑取分离的菌落至相同培养基的板。将所有板于34℃温育。 结果显示于表1。30个孢子纯化的pDM266(499bp wA)转化子中有40%显 示出比野生型浅的孢子着色。30个孢子纯化的pEFer14(176bp wA)转化子中 有30%显示出比野生型浅的孢子着色。25个孢子纯化的pDM261(无wA)转化 子中100%显示出野生型孢子着色。 表1 质粒 可转录区 %着色浅 %野生型 #筛选 pEFer14 176bp wA,hyg IR 30 70 30 pDM266 499bp wA,hyg IR 40 60 30 pDM261 hyg IR 0 100 25 显示pDM266和pEFer14转化子孢子着色浅的结果指明了与移行RNAi对 wA基因的抑制一致的表型。 实施例7:wA基因沉默的米曲霉转化子的Southern印迹分析 实施了Southern印迹分析来验证6个来自实施例6的选定转化子(如下文 表2中所列举的)的不同孢子着色不是基因破坏的结果。突变型米曲霉P2-5.1 (WO 2005/056772)含有wA基因的破坏。 表2 菌株名称 孢子颜色 JaL250(未转化) 野生型 DLM1610-45-pDM261#2 野生型 P2-5.1 白色 DLM1641-74-pEFer14#3 浅色 DLM1641-74-pDM266#17 白色 DLM1641-74-pDM266#24 浅色 DLM1641-74-pDM266#29 白色 使用植物Maxi试剂盒依照制造商的指示自上文每一种米曲 霉菌株制备基因组DNA。将2μg每种基因组DNA用Sap I和Cla I于37℃消化过 夜。将经过消化的基因组DNA通过TAE缓冲液中的0.7%琼脂糖凝胶电泳分级 17小时,并使用TURBOBLOTTER(Schleicher & Schuell BioScience,Keene, NH,USA)遵循制造商的推荐印迹到SuPerCharged膜(Schleicher & Schuell BioScience,Keene,NH,USA)上14-16小时。 将膜首先与463bp异羟基洋地黄毒苷配基(digoxigenin)标记的米曲霉wA 探针杂交,该探针是通过使用下文所示引物wA5primeFWD(有义)和引物 wA5primeREV(反义)的PCR掺入异羟基洋地黄毒苷配基-11-dUTP来合成的: 引物wA5primeFWD(有义): 5’-TACTACGGAGACCTTGGAAA-3’(SEQ ID NO:13) 引物wA5primeREV(反义): 5’-GCTCTTAGACAGCCTAGAAT-3’(SEQ ID NO:14) 扩增反应(50μl)由1X THERMOPOLTM反应缓冲液,5μl PCR DIG标记混 合物(Roche Applied Science,Indianapolis,IN,USA)、10ng米曲霉JaL250 基因组DNA(使用植物Maxi试剂盒制备)、10pmol引物 wA5primeFWD、10pmol引物wA5primeREV、和2.5个单位Taq DNA聚合酶构 成。将反应在中温育,编程为30个循环, 每个循环95℃30秒、52℃30秒、和72℃1分钟(最后延伸7分钟)。将PCR反应 通过TAE缓冲液中的0.8%琼脂糖凝胶电泳来纯化,其中异羟基洋地黄毒苷配 基的掺入通过分子量的增加来指示。自凝胶切出463bp产物条带,并使用 凝胶提取试剂盒(QIAGEN Inc.,Valencia,CA,USA)依照制造 商的指示来纯化。 在DIG Easy Hyb缓冲液(Roche Applied Science,Indianapolis,IN,USA) 中于42℃实施杂交15-17小时。然后将膜在高严格条件下在2X SSC加0.1% SDS中于室温清洗两次5分钟,接着在0.5X SSC加0.1%SDS中于65℃清洗2次 15分钟。通过化学发光测定法(Roche Applied Science,Indianapolis,IN,USA) 遵循制造商的指示检测探针-靶物杂合物。 对转化子实施的Southern印迹分析揭示了,所有转化子的杂交条带与含 有全长wA基因的米曲霉宿主菌株JaL250的杂交条带大小相同,比较而言, P2-5.1的杂交条带显著较小。结果证明了非野生型孢子颜色不是基因破坏的 结果。 实施例8:自米曲霉转化子提取RNA 将6个展现出不同孢子颜色的米曲霉转化子(实施例6)涂布在补充有 20mM尿苷和1%麦芽糖的COVE2板上,并于34℃培养7天。将未转化的米 曲霉JaL250的孢子涂布在补充有20mM尿苷的PDA板上,并于34℃培养7天。 在添加5ml 0.01%80后,通过使用无菌的一次性使用的涂布器 (Arben Bioscience,Rochester,NY,USA)刮板的表面来收集每种菌株的孢子。 将每份孢子悬浮液吸入无菌5ml血清学移液管,添加至500ml摇瓶中75ml补充 有10mM尿苷和1%麦芽糖的基本培养基(pH 6.5),并于34℃和65rpm培养 22-24小时。将47mm硝酸纤维素滤器(Whatman Inc.,Florham Park,NJ,USA) 置于无菌0.2μm 250ml MF75过滤单元(Nalgene,Rochester,NY,USA)中滤 膜的上部。将25-75ml每种全培养液置于分开的硝酸纤维素滤器上,并进行 真空过滤,用以在滤器上生成菌丝体薄层。将硝酸纤维素滤器加菌丝体转移 至装有补充有10mM尿苷和1%麦芽糖的基本培养基琼脂(pH 6.5)的60mm 皮氏皿。将琼脂板置于塑料袋中,密封,并于37℃温育。 当米曲霉JaL250对照中开始出现有色的分生孢子梗时(42-48小时),使用 刮勺(spatula)自每个滤器刮取120mg菌丝体,并每个转移至装有1ml RNAPROTM溶液(Q-Biogene,Irvine,CA,USA)的裂解基质C管(Q-Biogene, Irvine,CA,USA)。给裂解基质C管盖紧盖以防止均质化期间的渗漏。将样 品管在FP120仪器(Q-Biogene,Irvine,CA,USA)中以速度6处 理40秒,然后在冰上放置2分钟。再次将样品管以速度6处理40秒,然后在冰 上放置2分钟。将样品在5415D微量离心机中以13,400x g于 4℃离心5分钟。将所得上清液转移至1.7ml微量离心管,然后于室温温育5分 钟。将300μl氯仿添加至样品管,并旋涡震动10秒钟。于室温温育5分钟后, 将样品在5415D微量离心机中以13,400x g于4℃离心5分钟。 将每份样品的上层相(upper phase)转移至新的1.7ml微量离心管,然后于室温 温育5分钟。再次,将300μl氯仿添加至样品,并旋涡震动10秒钟。将样品于 室温温育5分钟,接着在5415D微量离心机中以13,400x g于 4℃离心5分钟。将上层相转移至新的1.7ml微量离心管。将500μl冰冷的乙醇 添加至样品管,并于-20℃温育30分钟。将样品在5415D微量 离心机中以13,400x g于4℃离心20分钟。除去所得上清液,并用75%乙醇清 洗沉淀物。除去乙醇,并让沉淀物于室温风干5分钟。将沉淀物重悬于100μl 焦碳酸二乙酯(DEPC)处理的水,接着添加50μl 8M氯化锂(VWR,West Chester,PA,USA)。将样品于-20℃温育1小时。温育后,将样品在 5415D微量离心机中以13,400x g于4℃离心25分钟。自样品管 除去上清液,并用70%乙醇冲洗RNA沉淀物。除去乙醇,并将RNA沉淀物重 悬于25-40μl无DNA酶、RNA酶的水(Sigma-Aldrich,St.Louis,MO,USA)。 使用1000分光光度计(Nanodrop Technologies,Wilmington, DE,USA)对RNA浓度定量。 实施例9:用DNA酶处理米曲霉RNA 使用TURBO无DNATM试剂盒(Ambion,Austin,TX,USA)自米曲霉RNA 样品(实施例8)除去污染性基因组DNA。将3μg提取的RNA与1X TURBO DNA 酶缓冲液(Ambion,Austin,TX,USA)组合,并用无DNA酶、RNA酶的水调 节至10μl体积。将1个单位的TURBO DNA酶(Ambion,Austin,TX,USA) 添加至样品,并于37℃温育30分钟。再添加1个单位的TURBO DNA酶,并 将样品于37℃温育1小时。添加2μl DNA酶灭活试剂(Ambion,Austin,TX, USA)。将样品管的内容物于室温在2分钟温育期期间混合3次,以再分散DNA 酶灭活试剂。通过在5415D微量离心机中以9,300x g离心2分 钟来沉淀DNA酶灭活试剂。将9μl每份上清液转移至0.65ml微量离心管。使 用1000分光光度计测量1μl经DNA酶处理的RNA,以确定 RNA浓度。 实施例10:自米曲霉总RNA样品合成cDNA第一链 使用Transcriptor cDNA第一链合成试剂盒(Roche Applied Science, Indianapolis,IN,USA)自每份提取的米曲霉RNA样品(实施例9)合成cDNA 第一链。将1μg经DNA酶处理的RNA与1.2nmol随机六聚物引物(Roche Applied Science,Indianapolis,IN,USA)组合,并用DEPC处理的水调节至 13μl体积。将样品于65℃温育10分钟,然后放置在冰上。将13μl样品与1X Transcriptor RT反应缓冲液(Roche Applied Science,Indianapolis,IN,USA)、 20个单位Protector RNA酶抑制剂(Roche Applied Science,Indianapolis,IN, USA)、10mM脱氧核苷酸混合物、和10个单位Transcriptor逆转录酶(Roche Applied Science,Indianapolis,IN,USA)在20μl终体积中组合。将反应混合 物于25℃温育10分钟、于50℃温育60分钟、和于85℃温育5分钟。合成后, 将样品放置在冰上。 为了验证清除了污染性基因组DNA和检查cDNA的完整性,用下文所示 跨越内含子的wA和肌动蛋白引物组PCR扩增样品。 引物2wAFWD(有义): 5’-ATGCCTCGCAGCTTATAGGA-3’(SEQ ID NO:15) 引物2wAREV(反义): 5’-CGCACTGATATACGGTTTGG-3’(SEQ ID NO:16) 引物2actinFWD(有义): 5’-GGATCTCTACGGTAACATCGTCA-3’(SEQ ID NO:17) 引物2actinREV(反义): 5’-GATCGGAGATGCCAGGGTA-3’(SEQ ID NO:18) 扩增反应(50μl)由1X THERMOPOLTM反应缓冲液、0.4mM dNTP、2μl模 板cDNA样品、50pmol引物2wAFWD、50pmol引物2wAREV、和2.5个单位 Taq DNA聚合酶构成。对照扩增反应(50μl)由1X THERMOPOLTM反应缓冲 液、0.4mM dNTP、10ng米曲霉JaL250基因组DNA(使用植物Maxi 试剂盒制备、50pmol引物2wAFWD、50pmol引物2wAREV、和2.5个单位Taq DNA聚合酶构成。将反应在MASTERCYCLERTM中温育,编 程为30个循环,每个循环95℃30秒、50℃30秒、和72℃1分钟(最后延伸7分 钟)。通过TAE缓冲液中的0.8%琼脂糖凝胶电泳来纯化PCR产物。结果显示了 使用cDNA模板的PCR反应生成了比使用基因组DNA作为模板的对照PCR反 应要小的扩增子。自基因组DNA生成的PCR扩增子会比自cDNA生成的对应 扩增子要大。因此,cDNA制备物不含有可检测量的基因组DNA。 实施例11:通过实时PCR(RT-PCR)检测稳态wA mRNA米曲霉 使用RT-PCR实现了转化子中米曲霉wA表达水平的测定。使用如实施例 10中所述自每个转化子合成的互补DNA(cDNA)作为RT-PCR反应的模板。wA 基因充当靶DNA序列,而米曲霉肌动蛋白基因(DNA序列为SEQ ID NO:19, 而推导氨基酸序列为SEQ ID NO:20)充当内源对照,以及参比DNA序列。依 照通用探针文库测定法设计软件指南(Universal ProbeLibrary Assay Design Software Guide,Roche Applied Science,Indianapolis,IN,USA)选择和设计 引物及其相应的单色水解探针。首先基于外显子-外显子剪接连接点附近的 期望转录物DNA序列来选择探针。然后设计引物组来扩增跨越该外显子-外 显子剪接连接点或内含子的靶物。选择了如下探针: 通用探针文库探针#131(肌动蛋白-参比) 5’-CTGGTGGT-3’ 通用探针文库探针#134(wA-靶物) 5’-CCTCCTTC-3’ 使用了以下引物: 引物2wAFWD(有义): 5’-ATGCCTCGCAGCTTATAGGA-3’(SEQ ID NO:21) 引物2wAREV(反义): 5’-CGCACTGATATACGGTTTGG-3’(SEQ ID NO:22) 引物2actinFWD(有义): 5’-GGATCTCTACGGTAACATCGTCA-3’(SEQ ID NO:23) 引物2actinREV(反义): 5’-GATCGGAGATGCCAGGGTA-3’(SEQ ID NO:24) 使用480系统(Roche Applied Science,Indianapolis,IN, USA)实施了相对定量实时PCR测定法。每份RT-PCR反应(20μl)由1X 480探针Master混合物(Roche Applied Science, Indianapolis,IN,USA)、200nM有义引物、200nM反义引物、100nM探针、 和不同稀释度(即,未稀释的、1∶10、1∶100、1∶1000)的cDNA模板构成。在 480系统中实施RT-PCR反应,编程为45个循环,每个循环 95℃变性10秒及对于扩增产物的定量和延伸均为60℃30秒。使用384孔板 (Roche Applied Science,Indianapolis,IN,USA)一式三份地制备每份样品。 在测试的每块384孔板上运行阴性对照(其中用PCR级的水替换模板cDNA)以 揭示假定的假阳性结果。 使用480相对定量软件(Roche Applied Science, Indianapolis,IN,USA)分析自480系统获得的数据。在相 对定量方法中,通过计算靶基因浓度相对于不受调节的参比基因,对每份样 品校准由初始样品浓度的差异、样品加载中的变异、移液误差、或cDNA合 成效率的差异引起的质量和数量差异。不仅测定了靶基因/参比基因比,而且 通过校准靶物和参比基因的PCR效率的任何差异的校准物(calibrator)进行了 标准化。相对定量分析结果表述为标准化的比,其中将样品中靶DNA序列对 参比DNA序列的比除以标准样品或校准物中这两种序列的比。 首先使用未转化的米曲霉JaL250作为标准样品为靶物和参比物生成了 标准曲线。标准曲线分别为靶物和参比物生成了0.996和0.995的R2值。由 Roche480相对定量软件为靶物和参比物计算得出的PCR 效率值分别为1.757(误差0.0449)和1.907(误差0.0287)。为了比较实施例7中 所列出的所有菌株间的mRNA的相对表达水平,如上所述实施了实时PCR反 应。使用480相对定量软件收集和分析数据,并与先前依 照Roche480相对定量软件手册(Roche Applied Science, Indianapolis,IN,USA)生成的标准曲线进行比较。使用相对定量分析,米 曲霉DLM1610-45-pDM261#2(即具有野生型孢子颜色的转化子)中的wA mRNA表达水平与未转化的米曲霉JaL250菌株相当。米曲霉 DLM1641-74-pEFer14#3和米曲霉DLM1641-74-pDM266#24(即具有浅色孢 子的转化子)中的wA mRNA相对表达水平分别显示出与具有野生型孢子颜色 的菌株中的wA mRNA水平相比的67%和62%降低。米曲霉 DLM1641-74-pDM266#17和米曲霉DLM1641-74-pDM266#29(即具有白色孢 子的菌株)显示出与具有野生型孢子颜色的菌株中的wA mRNA相比的73%和 81%降低。 实施例12:质粒pAmFs031的构建 为了抑制黑曲霉ATCC 1015聚酮化合物合酶基因(cDNA序列为SEQ ID NO:25,推导氨基酸序列为SEQ ID NO:26)的表达,构建了移行RNAi表达载 体。 质粒pAmFs031构建成含有TAKA/NA2-tpi前导杂合启动子、黑曲霉聚酮 化合物合酶基因的开读框的片段、大肠杆菌hygB反向重复序列(hyg IR)、黑 曲霉淀粉葡萄糖苷酶终止子、和作为选择标志的全长构巢曲霉amdS基因 (Kelly和Hynes,1985,EMBO J.4:475-479)。选择黑曲霉聚酮化合物合酶 基因作为沉默靶物,因为它与丝状真菌中分生孢子色素生物合成所牵涉的其 它聚酮化合物合酶具有序列同一性。 使用下文所示拥有5’Nco I限制性位点的有义链引物和拥有5′Not I限制 性位点的反义引物自分离自黑曲霉菌株MBin120(WO 2004/090155)的基因 组DNA扩增黑曲霉聚酮化合物合酶开读框(DNA序列为SEQ ID NO:27,推导 氨基酸序列为SEQ ID NO:28)内的502bp片段。 引物56896F(有义): 5’-ggggccatggTCAGCGCGGTAAGCTCTAAT-3’(SEQ ID NO:29) 引物56896R(反义): 5’-gggggcggccgcGTAAGGTTCCGCATTTCTGG-3’(SEQ ID NO:30) 聚酮化合物合酶编码序列以大写字母显示。 扩增反应(50μl)由1X反应缓冲液(Stratagene,La Jolla, CA,USA)、0.2mM dNTP、128ng黑曲霉MBin120基因组DNA(使用 植物Maxi试剂盒制备)、20pmole有义引物、20pmole反义引物、 和2.5个单位HERCULASE Hotstart DNA聚合酶(Stratagene,La Jolla,CA, USA)构成。将反应在5333中温育,编程 为30个循环,每个循环94℃30秒、55℃30秒、和72℃1分钟(最后延伸7分钟)。 将所得502bp PCR产物和pDM261用Nco I和Not I消化,通过TAE缓冲液 中的0.75%琼脂糖凝胶电泳来纯化,并使用试剂盒进一步纯化 PCR产物或使用凝胶提取试剂盒进一步纯化质粒。使用 FAST-LINKTM DNA连接试剂盒(Epicentre Biotechnologies,Madison,WI, USA)连接PCR产物与pDM261质粒片段,并依照制造商的指示(Stratagene, La Jolla,CA,USA)转化入SURETM II化学感受态大肠杆菌细胞。使用 9600纯化来自数个转化子的质粒DNA,并通过DNA测序来分 析以鉴定含有期望的聚酮化合物合酶插入物的那些。将具有预期DNA序列的 一个质粒命名为pAmFs031(图7)。 实施例13:黑曲霉的转化和转化子的分析 将黑曲霉菌株MBin120在PDA板上于34℃培养14天。如下收集孢子,即 添加7ml 0.01%20(Fisher Scientific,Fair Lawn,NJ,USA),使用 无菌接种环刮板的表面,并用5ml移液器收集孢子悬浮液。给装有25ml补充 有1M蔗糖的YPG培养基的500ml玻璃摇瓶接种2.6×108个孢子,并于28℃和 150rpm温育15小时。使用无菌0.2μm 500ml过滤单元(Millipore, Billerica,MA,USA)收集菌丝体。自生长培养基中过滤出菌丝体,然后用 150ml 1M山梨醇清洗两次。将菌丝体重悬于30ml含有20mg 和0.4mg几丁质酶每ml 1M山梨醇的原生质体化溶液。将菌丝体转移至 125ml玻璃摇瓶,并于34℃,100rpm温育45分钟。将原生质体经衬有 MIRACLOTHTM的无菌漏斗倾倒入无菌50ml聚丙烯管。然后给管注满冰冷的 1M山梨醇。将原生质体在Sorvall RT6000D离心机中以1,303x g于室温离心5 分钟。丢弃上清液,并将原生质体重悬于50ml 1M山梨醇。将原生质体在 Sorvall RT6000D离心机中离心,并重悬于10ml STC。取出20μl等分试样并用 STC稀释。使用血球计对原生质体计数。将原生质体在Sorvall RT6000D离心 机中离心,并重悬于适当体积的PEG 4000(Polysciences,Inc.,Warrington, PA,USA)以产生2×107个原生质体/ml。 将5μg pAmFs031或pDM261 DNA添加至100μl黑曲霉MBin120原生质 体。于冰上温育30分钟后,将1ml SPC添加至原生质体/DNA溶液,并温和混 匀。将溶液于室温温育30分钟。然后,将10ml冷却至50℃的溶解的amdS覆盖 琼脂添加至转化混合物,并散布到150mm COVE板上。然后将板于34℃温育。 在乙酰胺上生长要求每一种表达质粒中所存在的amdS基因的表达。 温育4天后,为pAmFs031和pDM261每一种获得10个初级转化子。将转 化子在补充有1%麦芽糖的COVE A减尿素加乙酰胺板上划线。所有自 pDM261衍生的菌落一律为深黑色。相反,自pAmFs031转化子获得的菌落孢 子颜色变化范围为白色至深褐色。如下纯化转化子,即将孢子在补充有1% 麦芽糖的COVE A减尿素加乙酰胺板上划线,然后挑取分离的菌落至相同培 养基的板。菌株纯化总共重复四次。将所有板于34℃温育。 10个孢子纯化的pAmFs031转化子中有3个展现出比野生型浅的孢子着 色。10个孢子纯化的pDM261“空载体”转化子都显示出野生型孢子着色。 显示pAmFs031转化子孢子着色浅的这些结果指明了与对聚酮化合物合酶基 因的移行RNAi相关抑制一致的表型。 实施例14:聚酮化合物合酶沉默的和对照黑曲霉菌株的生长和RNA提取 将以下黑曲霉菌株在补充有1%麦芽糖的COVE A减尿素加乙酰胺板上 于34℃培养7天:2个具有白色孢子的黑曲霉pAmFs031菌株(称作 pAmFs031-W1和pAmFs031-W2),1个具有黑色孢子的黑曲霉pAmFs031菌株 (称作pAmFs031-B1),和1个用pDM261转化的黑曲霉菌株。在PDA板上培养 未转化的对照菌株黑曲霉MBin120。如下为每一个菌株收集孢子,即添加5ml 0.01%20,用无菌接种环刮板的表面,并用10ml移液器收集孢子 悬浮液。将40μl孢子悬浮液与10ml M410培养基混合,并将1ml此混合物添加 至24孔聚苯乙烯微量滴定板(Corning Incorporated,Corning,NY,USA)的每 个孔。在分开的微量滴定板中培养每一个菌株以避免交叉污染。将板在湿度 控制室中于34℃温育4天,此时,对于所有菌株,真菌在孔间形成菌丝体生 长的连续垫,而且存在有色的分生孢子梗。 使用RNAPROTM Pro Red试剂盒(Q-Biogene,Irvine,CA,USA)在菌丝 体垫提取总RNA。自孔中取出垫,并置于纸巾上以吸收任何多余的培养基。 将总共200mg每种菌丝体垫组织转移至装有1ml RNAPROTM溶液 (Q-Biogene,Irvine,CA,USA)的ProRed管。使用 FP120仪器将菌丝体以速度6均质化40秒。将每份样品在Sorvall MC12V微量 离心机中以13,400x g于4℃离心5分钟。将水相转移至1.7ml微量离心管。将 样品于室温温育5分钟。添加300μl氯仿,并将样品旋涡震动10秒钟,然后于 室温温育5分钟。将样品在Sorvall MC12V微量离心机中以13,400x g于4℃离 心5分钟。将上层相转移至新的1.7ml微量离心管。再次如上所述用氯仿提取 样品。添加500μl冰冷的乙醇,并将样品于-20℃保存1小时。将样品在Sorvall MC12V微量离心机中以13,400x g于4℃离心20分钟。除去乙醇,并用75%乙 醇清洗沉淀物。除去乙醇,并让沉淀物风干5分钟。将RNA样品重悬于100μl DEPC处理的水。添加50μl 8M LiCl,并将样品于-20℃保存1小时。将样品在 Sorvall MC12V微量离心机中以13,400x g于4℃离心25分钟。除去LiCl,并将 500μl 75%乙醇添加至沉淀物,然后除去。让沉淀的样品风干5分钟。将RNA 样品重悬于30μl DEPC处理的水。使用1000分光光度计测量 RNA浓度。将样品保存于-80℃。 实施例15:合成cDNA第一链 使用TURBO DNA酶试剂盒(Ambion,Inc.,Austin,TX,USA)的试剂, 用DNA酶处理来自实施例14中所描述的每一种黑曲霉菌株的RNA样品以清 除基因组DNA。将3μg RNA与1μl TURBO DNA酶缓冲液(Ambion,Inc., Austin,TX,USA)组合,并用DEPC处理的水调节至10μl体积。添加TURBO DNA酶(Ambion,Inc.,Austin,TX,USA)的0.5μl等分试样,并将样品于37℃ 温育30分钟。添加TURBO DNA酶的第二个0.5μl等分试样,并再次将样品于 37℃温育30分钟。添加2μl灭活试剂(Ambion,Inc.,Austin,TX,USA),并 将样品于室温在2分钟温育期期间混合3次。将样品在5415D 微量离心机中以9,300x g离心2分钟。将9μl上清液转移至0.6ml微量离心管。 使用1000分光光度计测量RNA浓度。将样品保存于-80℃。 使用Transcriptor逆转录酶cDNA第一链合成试剂盒(Roche Applied Science,Indianapolis,IN,USA)合成cDNA第一链。为实施例14中所描述的 5种黑曲霉菌株中的每一个制备4个文库,其中使用不同量的经DNA酶处理的 RNA:将1-2μl体积中的300ng、600ng、900ng、和1.2μg经DNA酶处理的RNA 与2μl随机六聚物引物(Roche Applied Science,Indianapolis,IN,USA)组合, 并用DEPC处理的水调节至13μl体积。将样品于65℃温育10分钟,然后放置 在冰上。将Transcriptor逆转录酶Master混合物的6.5μl等分试样(4μl Transcriptor逆转录酶缓冲液,0.5μl Protector RNA酶抑制剂,和2μl dNTP混合 物)添加至管,接着添加Transcriptor逆转录酶的0.5μl等分试样。自冰中取出 样品,并转移至5333,编程为25℃10分 钟、55℃60分钟、和85℃5分钟。将样品保存于-80℃。 实施例16:通过实时PCR检测黑曲霉聚酮化合物合酶mRNA 通过RT-PCR对实施例14中所描述的黑曲霉菌株中黑曲霉聚酮化合物合 酶mRNA的相对表达水平进行定量。如实施例15中所描述的,自每一种菌株 提取总RNA,充当cDNA第一链合成的模板。cDNA第一链充当RT-PCR的模 板。使用黑曲霉肌动蛋白基因作为参比标准(即,内部对照)。使用Roche通用 探针文库设计中心软件(Universal ProbeLibrary Design Center Software,Roche Applied Science,Indianapolis,IN,USA)设计探针和引物。使用了如下引物 和探针对: 黑曲霉聚酮化合物合酶正向引物(62488): 5’-tcgtgaatcaggtcctagcc-3’(SEQ ID NO:31) 黑曲霉聚酮化合物合酶反向引物(62489): 5’-aaacaacccaattggtagatgc-3’(SEQ ID NO:32) Roche通用探针文库探针#80(04689038001): 5’-cctggaga-3’ 黑曲霉肌动蛋白正向引物(62520): 5’-atctgtacggcaacattgtca-3’(SEQ ID NO:33) 黑曲霉肌动蛋白反向引物(62521): 5’-ttctgcatacggtcggagat-3’(SEQ ID NO:34) Roche通用探针文库探针#131(04694155001): 5’-ctggtggt-3’ 使用480系统和上文Roche通用探针文库探针实施了 RT-PCR试验,所述探针预先在5’末端标记荧光素,在3’末端附近标记深色淬 灭剂(quencher)染料。每个反应混合物含有10μl480探针 Master混合物、0.1μM Roche通用探针文库探针、0.2μM正向引物、0.2μM反 向引物、和2μl cDNA第一链(如实施例15中所描述的,自不同量的总RNA生 成),总体积20μl。所有RT-PCR反应都在384孔板(Roche Applied Science, Indianapolis,IN,USA)中进行。RT-PCR反应在480系统中 实施,编程为1个循环的95℃预温育10分钟(4.8℃/s);45个循环使用定量分析 模式的扩增,95℃10秒(4.8℃/s),55℃15秒(2.5℃/s),72℃1秒(4.8℃/s)(以获 取模式Single);和1个循环的40℃冷却10秒(2℃/s)。为了对靶物(聚酮化合物 合酶基因)和参比物(肌动蛋白基因)生成标准曲线和PCR效率值,自2个cDNA 文库创建4个连续稀释。在分开的反应中用靶物和参比物的探针/引物组一式 四份地测定这些连续稀释的每一个。标准曲线分别对靶物和参比物生成了 0.996和0.998的R2值。由480相对定量软件为靶物和参比物 计算得出的PCR效率值分别为1.950(误差0.0266)和1.854(误差0.0181)。为了 比较所有5种黑曲霉菌株间的聚酮化合物合酶mRNA的相对水平,对每一种 cDNA文库一式三份地测定3个稀释度。在对于每个稀释度和每次重复的单独 反应中使用靶物和参比物的探针/引物组实施了RT-PCR反应。使用 480相对定量软件依照制造商将这些数据与标准曲线进行 比较。使用这种分析方法,相对于未处理的对照样品计算经处理样品的表达 量。由标准曲线除以未处理对照样品的量来确定经处理样品的量。如此,将 未处理样品称作1X样品,而将所有其它的量表述为相对于未处理样品的n倍 差异。然后,将经处理样品的量相对于内源对照肌动蛋白进行标准化,以解 决(account for)添加至每个反应的总RNA量的差异。 使用相对定量分析,测定出,菌株pAmFs031-W1和pAmFs031-W2中的 黑曲霉聚酮化合物合酶mRNA的相对表达水平显著低于菌株黑曲霉MBin120 pAmFs031-B1、黑曲霉MBin120 pDM261、或未转化的黑曲霉MBin120,这 与孢子着色中观察到的变化相关联。黑曲霉MBin120 pAmFs031-W1和黑曲 霉MBin120 pAmFs031-W2菌株显示出与“空载体”对照菌株相比聚酮化合 物合酶mRNA的68%和82%降低。如实施例17中所述,对相同菌株实施了 Southern印迹以证实完整聚酮化合物合酶基因的存在,并消除转录物的降低 是由于聚酮化合物合酶基因自身破坏的可能性。 实施例17:通过Southern印迹检测黑曲霉聚酮化合物合酶基因 使用植物Maxi试剂盒自以下黑曲霉菌株(实施例16中所描述 的)提取基因组DNA:未转化的黑曲霉MBin120,黑曲霉MBin120 pAmFs031-W1,黑曲霉MBin120 pAmFs031-W2,黑曲霉MBin120 pAmFs031-B1,和黑曲霉MBin120 pDM261。将每种菌株的总共2μg基因组 DNA用Hind III于37℃消化17小时。将经过消化的基因组DNA和DIG标记的 DNA分子量标志物II(Roche Applied Science,Indianapolis,IN,USA)加载到 TAE缓冲液中的0.7%琼脂糖凝胶上,并施加22V电流17小时。使用20X SSC 转移缓冲液将DNA自凝胶转移到SuPerCharged膜上18小时。使用 紫外线照射将DNA交联至膜,然后在DIG Easy Hyb溶液(Roche Applied Science,Indianapolis,IN,USA)中于42℃平衡30分钟。将膜用20μl重悬于 DIG Easy Hyb溶液(Roche Applied Science,Indianapolis,IN,USA)的DIG标 记的434bp PCR产物于42℃探查(probe)18小时。434bp DIG标记的DNA探针 是使用PCR DIG探针合成试剂盒(Roche Applied Science,Indianapolis,IN, USA)和下文所示引物合成的。 黑曲霉聚酮化合物合酶Southern正向引物(062849): 5’-ttaattaatcggtcaatcgccgttgtcaga-3’(SEQ ID NO:35) 黑曲霉聚酮化合物合酶Southern反向引物(062850): 5’-aatttccaaacagggtaactccac-3’(SEQ ID NO:36) 扩增反应(50μl)由1X PCR缓冲液、5μl PCR DIG探针合成混合物、50μM 有义引物、50μM反义引物、2.6个单位Expand高保真聚合酶、和50ng黑曲霉 MBin120基因组DNA(如上所述纯化)构成。将反应在 MASTERCYCLERTM 5333中温育,编程为30个循环,每个循环94℃30秒、55℃ 30秒、和72℃30秒(最后延伸7分钟)。探针序列与黑曲霉聚酮化合物合酶基因 (其序列包含在8.8kb Hind III基因组DNA片段内)的启动子(5’非翻译区)互补。 探查膜后,将膜用2X SSC加0.1%SDS低严格性缓冲液于室温清洗5分 钟,接着用0.5X SSC加0.1%SDS于65℃进行两次高严格性清洗,每次15分钟。 然后使用DIG发光检测试剂盒(Roche Applied Science,Indianapolis,IN,USA) 遵循制造商的说明书显现发生了杂交的DIG标记的探针和分子量标志物。将 印迹对Biomax XAR胶片(Sigma Aldrich,St.Louis,MO,USA)曝光,并使用 Konica SRX-101A胶片处理器(Konica Minolta Medical Imaging USA Inc., Wayne,NJ,USA)显影以显现被标记的DNA。结果证明了所有菌株展现出 预期的8.8kb条带,证明了整个基因在所有测试的菌株中保持完整。 实施例18:里氏木霉移行RNAi表达载体pAL02的构建 为了抑制里氏木霉β-木糖苷酶基因(DNA序列为SEQ ID NO:37,推导氨 基酸序列为SEQ ID NO:38)的表达,构建了移行RNAi表达载体。 用Pac I和MluI消化移行RNAi质粒pEvFz-14,以分离潮霉素反向重复序 列。通过TAE缓冲液中的1.0%琼脂糖凝胶电泳解析527bp片段,然后从凝胶 中切下。使用凝胶提取试剂盒依照制造商的指示纯化片段。然 后使用快速连接试剂盒(Roche Applied Science,Indianapolis,IN,USA)将经 过纯化的片段连接至经Pac I和Mlu I消化的pMJ09(WO 2005/056772)。依照制 造商的指示(Stratagene,La Jolla,CA,USA)使用2μl连接混合物来转化 SURETM化学感受态大肠杆菌细胞。使用9600纯化来自数个转 化子的质粒DNA,并通过用Pac I和Mlu I消化来分析。通过TAE缓冲液中的 1.0%琼脂糖凝胶电泳来解析限制性消化的产物。通过DNA序列分析证实了一 个转化子拥有527bp潮霉素反向重复序列,并命名为pAL01(图8)。 采用PCR来扩增包含里氏木霉β-木糖苷酶编码区(DNA序列为SEQ ID NO:39,推导氨基酸序列为SEQ ID NO:40)的部分的500bp片段,利用来自里 氏木霉RutC30(WO 2005/056772)的基因组DNA充当模板。来自里氏木霉 RutC30的基因组DNA是使用植物Maxi试剂盒依照制造商的指示 分离的。如下所示,有义引物设计成在5’末端掺入Nco I位点,而反向引物设 计成在5’位点掺入Mlu I位点。 有义引物: 5’-CCATGGTACGAGTTTGGCAGTGGTCT-3’(SEQ ID NO:41) 反义引物: 5’-ACGCGTTTATGCGTCAGGTGTAGCAT-3’(SEQ ID NO:42) 扩增反应(50μl)由10X HERCULASETM反应缓冲液(Stratagene,La Jolla, CA,USA)、0.8mM dNTP、200ng如实施例7中所述制备的里氏木霉RutC30 基因组DNA、1ng引物、和2.5个单位HERCULASE HOTSTARTTM聚合酶 (Stratagene,La Jolla,CA,USA)构成。将反应在 5333中温育,编程为1个循环的92℃2分钟;30个循环, 每个循环92℃30秒,58℃30秒,和68℃1分钟;和10分钟最终延伸。通过TAE 缓冲液中的1.0%琼脂糖凝胶电泳来分离反应产物,其中自凝胶中切出500bp 条带并使用凝胶提取试剂盒依照制造商的指示纯化。用Nco I和 Mlu I消化经过纯化的PCR片段,并使用快速连接试剂盒连接入经Nco I和Mlu I消化的pAL01中。依照制造商的指示使用连接混合物来转化SURETM化学感 受态大肠杆菌细胞。然后通过菌落PCR来筛选转化子,以鉴定含有期望的β- 木糖苷酶插入物的那些。反应(20μl)由2μl 10X THERMOPOLTM反应缓冲液、 0.4μl 10mM dNTP、1μl悬浮于50μl去离子水的大肠杆菌转化子菌落、和1 pmol β-木糖苷酶扩增引物构成。将反应在 5333中温育,编程为1个循环的94℃2分钟;17个循环, 每个循环94℃30秒,55℃30秒,和72℃30秒;和5分钟的最后延伸。通过TAE 缓冲液中的1.0%琼脂糖凝胶电泳来分离扩增产物。使用9600 纯化来自数个含有500bp β-木糖苷酶扩增产物的的转化子的质粒DNA,并通 过DNA测序来分析。一个含有500bp β-木糖苷酶扩增产物的质粒的DNA序列 分析证实了预期的插入物,并命名为pAL02(图9)。 实施例19:里氏木霉中里氏木霉β-木糖苷酶基因的移行RNAi的转化和测 定 使用5μg pAL02来转化里氏木霉SaMe13,一种cbh1被删除的菌株(WO 2005/030926)。如下收获里氏木霉SaMe13孢子,即将20ml 0.01%80 倾倒到成熟里氏木霉SaMe13的COVE2板上并用皮氏皿涂布器刮下孢子。将 孢子混合液吸入20ml移液器。将大约2-5×107个孢子接种入100ml补充有2% 葡萄糖和10mM尿苷的YP培养基中,并于27℃和90rpm温育16小时。使用 500ml STERICUPTM过滤单元(Millipore,Burlington,MA,USA)收集菌丝体, 并用100ml去离子水清洗两次。然后将菌丝体用250ml 1.2M山梨醇清洗两次。 将清洗后的菌丝体重悬于20ml 1.2M山梨醇、5mg/ml和 0.5mg/ml几丁质酶。将混合物于34℃和90rpm温育15-25分钟。将烧瓶在冰 上放置5分钟,接着通过MIRACLOTHTM过滤。将含有原生质体的滤器置于 50ml FALCONTM管(VWR International,West Chester,PA,USA)中。将管在 Sorvall RT6000D离心机中以370x g离心10分钟。丢弃上清液,将原生质体沉 淀物重悬于25ml 1.2M山梨醇并在Sorvall RT6000D离心机中以370x g离心10 分钟。丢弃上清液,并将沉淀物重悬于25ml 1.2M山梨醇。取出10μl,并如 上所述将管离心,同时在血球计中对原生质体计数。丢弃上清液,并将沉淀 物以1×108个原生质体/ml STC的浓度重悬。 将由100μl原生质体悬浮液、1-10μg 10μl STC中的质粒DNA、和250μl 聚乙二醇组成的转化混合物温和混匀。将混合物于室温温育30分钟。添加3ml STC,混匀,并倾倒到150mm COVE板上。将板于28℃温育10-14天。 选择了20个转化子(即AL02-1到AL02-20)和4个含有pAL01的对照转化 子,将来自单菌落的孢子在COVE板上划线,并于28℃温育5天。将来自这些 板的孢子接种入装有25ml纤维素酶诱导培养基的125ml带挡板的摇瓶中,并 于28℃和200rpm培养5天。接种后5天,取出1ml培养液样品,在 离心机5415D中以6,000x g离心10分钟,并将上清液转移至新的 管。使用培养液样品的复制品测定β-木糖苷酶活性和β-葡萄糖 苷酶活性。 使用Coulter Biomek 3000,Biomek NX,和ORCA机械臂(Beckman Coulter,Inc,Fullerton,CA,USA),对上文上清液测定β-木糖苷酶活性。 将培养物上清液在0.1M琥珀酸盐、0.01%Triton X-100pH 5.0(样品缓冲液) 中适当稀释,接着连续稀释,从稀释样品的0倍到1/3倍到1/9倍。将每个稀释 度总共20μl转移至96孔平底板。将200μl底物溶液(每ml 0.1M琥珀酸盐pH 5.0 含有1mg对硝基苯基-β-D-吡喃木糖苷)添加至每个孔,然后于环境温度温育 45分钟。温育期完成时,将50μl 1M TRIS缓冲液pH 9添加至每个孔,以终止 反应。在405nm光密度对96孔板测量终点。 使用Coulter Biomek 3000,Biomek NX,和ORCA机械臂,对上文上清 液测定β-葡萄糖苷酶活性。将培养物上清液在0.1M琥珀酸盐、0.01%Triton X-100pH 5.0(样品缓冲液)中适当稀释,接着连续稀释,从稀释样品的0倍到 1/3倍到1/9倍。将每个稀释度总共20μl转移至96孔平底板。将200μl底物溶液 (每ml 0.1M琥珀酸盐pH 5.0含有1mg对硝基苯基-β-D-吡喃葡萄糖苷)添加 至每个孔,然后于环境温度温育45分钟。温育期完成时,将50μl 1M TRIS缓 冲液pH 9添加至每个孔,以终止反应。在405nm光密度对96孔板测量终点。 使用以下方程来测定样品活性: [({OD405/消光系数}X1×106)/温育时间]/样品体积 其中消光系数=17,749,温育时间=45,而样品体积=0.02。 计算自β-木糖苷酶活性测定法获得的OD与自β-葡萄糖苷酶测定法确定 的活性之间的比值,并报告为BX/BG。由于β-葡萄糖苷酶是天然存在的,因 此使用它的活性作为对各转化子间生长差异进行标准化的手段。结果显示于 表3。 表3 样品 β-木糖苷酶1 β-葡萄糖苷酶2 蛋白质3 BX/BG比4 AL02 1 5.53±1.10 965.63±107.02 3.51±0.48 0.006±0.001 AL02 2 10.13±2.38 857.73±40.30 4.23±0.51 0.012±0.004 AL02 3 9.89±1.60 1139.06±37.99 2.54±0.31 0.009±0.002 AL02 4 2.94±0.25 174.90±45.20 1.38±0.25 0.017±0.007 AL02 5 15.67±2.55 919.14±39.01 3.56±0.03 0.017±0.004 AL02 6 15.04±7.12 725.61±225.20 4.58±1.96 0.021±0.004 AL02 7 4.78±0.44 494.99±69.17 3.29±0.17 0.010±0.003 AL02 8 3.87±0.22 507.37±262.44 3.25±0.09 0.008±0.005 AL02 9 9.70±3.52 771.72±35.46 4.25±0.43 0.013±0.005 AL02 10 3.25±1.61 576.40±202.08 2.45±1.04 0.006±0.001 AL02 11 3.47±2.19 667.39±159.68 2.21±0.76 0.005±0.003 AL02 13 7.27±2.44 521.00±66.65 3.40±0.74 0.014±0.004 AL02 14 5.75±2.54 834.19±414.42 4.54±1.58 0.007±0.000 AL02 15 10.58±0.64 625.86±427.59 5.51±2.95 0.017±0.015 AL02 16 1.80±0.60 309.91±39.37 4.51±1.76 0.006±0.002 AL02 17 7.31±6.48 477.29±370.17 6.75±2.44 0.015±0.003 AL02 18 6.04±3.83 556.43±143.08 4.69±1.81 0.011±0.005 AL02 19 1.64±0.42 226.67±24.94 2.49±0.12 0.007±0.001 AL02 20 3.55±1.78 410.71±261.33 3.91±1.97 0.009±0.001 AL03 ev 3.59±0.78 320.76±92.52 3.60±1.36 0.011±0.003 1β-木糖苷酶活性是使用对硝基苯基-β-D-吡喃木糖苷作为底物测量的。数值表述为吸光度 单位±标准偏差(n=2,除了n=4的样品AL03 ev)。 2β-葡萄糖苷酶活性是使用对硝基苯基-β-吡喃葡萄糖苷作为底物测量的。数值表述为μmol 被水解的底物每分钟每ml培养液±标准偏差(n=2,除了n=4的样品AL03 ev)。 3蛋白质浓度是使用BCA测定试剂测定的。数值表述为mg/ml培养液±标准偏差(n=2, 除了n=4的样品AL03 ev)。 4β-木糖苷酶和β-葡萄糖苷酶活性比±标准偏差(n=2,除了n=4的样品AL03 ev)。 大约5/20的转化子表现出以对照的36%至55%的值表达BX/BG。这些结 果证明了移行RNAi能用于成功敲低里氏木霉中的基因表达。 本申请描述和要求保护的本发明并不受限于本申请所公开的具体方面 的范围,因为这些方面意欲作为本发明几个方面的说明。任何等价的方面意 欲在本发明的范围之内。实际上,从前面的说明中,除本申请所显示和描述 的之外,本发明的多种修改对于本领域的技术人员来说是显而易见的。这些 修改也意欲落入所附的权利要求的范围内。在冲突的情况下,将以包括定义 的本公开为准 本申请引用了多篇参考文献,其公开的内容通过提述以其整体并入。 序列表 <110>诺维信股份有限公司(Novozymes,Inc.) <120>通过移行RNA干扰来降低或消除丝状真菌菌株中的基因表达的方法 <130>10918.204-WO <150>60/876,895 <151>2006-12-21 <160>42 <170>PatentIn version 3.5 <210>1 <211>38 <212>DNA <213>大肠杆菌(Escherichia coli) <400>1 gcggccgcgc gatgttcggg gattcccaat acgaggtc 38 <210>2 <211>36 <212>DNA <213>大肠杆菌(Escherichia coli) <400>2 cccggggcat catcgaaatt gccgtcaacc aagctc 36 <210>3 <211>38 <212>DNA <213>大肠杆菌(Escherichia coli) <400>3 ttaattaagc gatgttcggg gattcccaat acgaggtc 38 <210>4 <211>36 <212>DNA <213>大肠杆菌(Escherichia coli) <400>4 cccgggatcg gtccagacgg ccgcgcttct gcgggc 36 <210>5 <211>6651 <212>DNA <213>米曲霉(Aspergillus oryzae) <400>5 atggaggggc cacgcggcgt ctatctcttc ggagaccaga caagtgattt cgacgccggc 60 ttacgtcgcc tcctacaagt aaagaataac acaattgttg catcgttctt ccagagatgc 120 tttcacgctt tgcgccaaga gatcgcgagg ctttcaccat ctgaacggaa gatcttcccc 180 cggtttacga gcatagtgga tctactggcg cgtcaccggg agtcagaccc taatccggct 240 ctggagagtg cgttgacctg tatctatcaa ttgggatgct ttataaagta cgtgtaactg 300 cagatcctga cccgtttgaa cgagcctaac ctgagatagc tactacggag accttggaaa 360 cgtgtaccca tctgcttcag actgccatat agttggcctg tgcgcgggtc ttcttagttc 420 tgcagctgta agctgttcga acaatgttgg agaattgctc cccgctgcgg ttgaagcggt 480 ggtggtagct ctccgacttg gtctatgcgt ccttaaagtt cgagagctgg tgagctctga 540 ccaagcgtcg tcaacaagct ggtcagtctt gatttcaggg attagcgaga aagatgcctc 600 gcagcttata ggagaattca ctgctgaacg ggtaagtcaa ttgatctgaa atagtttgca 660 ggacagaatg ttctaaccac tggataaagg caattcctcc ttcatccaaa ccgtatatca 720 gtgcggtggg atataacagt ataaccatca gcgcaccgcc taaggtcctt gatgatttaa 780 ttgattctag gctgtctaag agccataagc cggtgagggc gcaaatccat ggtccttacc 840 atgcagcaca tctgtactat ggccgagatg tcgacaggat catcgaaagc tgccataatg 900 aggtcgtttc aaactacaca ccccgtatcc ccgtactatc aagtactacg ggacagccga 960 tagaggccaa acacatgaaa gatctactta aggccgccct tgaagagatt ctactacgtc 1020 aactatgctg ggagaaagtg accgatgcct gctattccat attaaaaact gctcgtcatc 1080 aaccatgcaa gttgttccca atttcaagca ctgcgacaca aagcttgttt acagctctta 1140 cgaaagccgg gataaccgac atcgaagtgg aaaatgggct cggagatgtt cccacgaacc 1200 cgaaggacaa ccttaacatc agcggcaggg cggactgctc caagatagct atcattggca 1260 tgtctggacg attcccagaa gctgatggca cagagagttt ctgggacctt ctgtataatg 1320 gcctcgatgt acaccggaag gtgcctgcag agcgttggga tgttgatgcc cacgttgatc 1380 ctaccggaac aaaacggaac accagcaagg ttccatacgg atgctggata aacgaaccgg 1440 ggttatttga cccccgcttc ttcaatatgt cgccacgcga agccctccag gcagatcccg 1500 ctcaaagact tgcattgctc acggcctatg aagctcttga aatggccggc tttatccccg 1560 acagcacccc ttctacacag agggatcgag tcggcctctt ctatggaatg actagcgatg 1620 actatcggga gataaatagt ggtcaagata ttgatactta ctttatccct ggtgggaatc 1680 gtgctttcac acctggccgg ataaactact atttcaagtt cagtgggccc agcgtcagcg 1740 ttgatacagc ttgttcttca agtcttgcgg ctattcatat ggcttgcaat tcgatctgga 1800 gaaatgattg cgatgctgct attgctggag gtgtcaatat attgacaaac cctgataacc 1860 atgccggtct tgaccgtggc catttcctgt ccagaaccgg gaattgcaac acatttgacg 1920 atggtgctga tggctactgt agagcagatg gagtgggtac aatcattctc aagcggctgg 1980 aagacgctca ggcggacaac gatccaatcc tcggtgtgat caatggagcc tataccaatc 2040 attcggcaga agcagtctcg attacccgcc ctcatgttgg cgcacaagcg tttatcttta 2100 ataagctatt gaacgatgcc aatatcgacc ctaaggacgt cagctacgtt gaaatgcatg 2160 gaactggtac tcaagctggg gatgcggtgg aaatgcaatc ggtcttggat acgtttgctc 2220 ccgactaccg ccgtggacca ggacagtctc tccatcttgg ttccgccaaa gcaaatgttg 2280 ggcatggaga gtcagcatct ggtgtaactg cacttgtgaa agtgctgcta atgatgaaga 2340 agaataccat accccctcat tgtggtataa agactaagat caaccacaac ttccccacgg 2400 atctcgcgca acgaaatgtc cacattgcct ttcaacctac cccttggaac agaccggctt 2460 ccggaaagcg gcagtgcttc attaacaact tttcggcggc tggtggaaat accgctcttt 2520 tgatggaaga cgctccaatc gctgaggtta aggggcagga cactcgacct gttcacgttg 2580 tgtctgtatc ggcacgatcc cagagtgcgc tcaaaaacaa catcaactct ctcgtaaaat 2640 acatcgacga acaaggaagg tcattcaatg tgaacgaggc agactttatc ccaagcttgg 2700 catacaccac cacagcacgg cgtatccatc acccattccg tgtcacagct atcgggtcta 2760 gtttgcagga gctgcgtgac tcacttaaca acagctctcg tctggaaagc tttacccctg 2820 tccctgcgac ggcccctggc gtagggttcg tgttcgctgg ccaaggagct cagcacaccg 2880 gaatgggaag gcaactatac gaaaaatgct ctcaattccg ggcaacaatg cagcacttcg 2940 attgcattag tcaaaaccaa gggtttcctt cgatccttcc cttggttgac ggaagcgtgc 3000 ccgtggagga gctgggccct atcgtgacac agctcggcac cacatgtctt cagatggctt 3060 tggtcaacta ttggggttca ctaggtataa aacctgcgtt cgttcttggg catagtctcg 3120 gggagtttgc tgctttgaat accgcaggag tattatcgac ttccgatacc atctaccttt 3180 gtggccgtcg ggctaccctc cttacagaat actgccaggt tgggacacac gccatgctgg 3240 ctgtcaaggc ttcctacccc caggtcaagc agttactgaa agaaggtgtg gatgaagttg 3300 cctgtgtcaa ctcacccagt gagacagtcg tcagtggcct caccgctgat attgatgact 3360 tggctcaaag gtgttccact gaaggttgga agtccactaa actaagggta ccgttcgctt 3420 tccattctgc ccaagttact ccaattcttg aacggtttca agaagaggcc cagggtgtca 3480 cgttccgtaa gccgtcgtta ccgtttgttt cctcactcct tggggaagtc atcaccgaat 3540 ctaattacga tgtcctggga gctcaatata tggtgaagca gtgccggaag tcggtgaact 3600 tccttggtgc tcttgaggcc accagatatg cgaaattgat gactgataag actgtctggc 3660 tggaagttgg tgcccatacc atttgctctg gtatgatcaa agcaacattc ggtccccagg 3720 ttaccactgt ggcatctctt cgccgagagg agaatgcatg gaaggtcctc tccaatagtc 3780 tatcggccct tcatttggct ggcattgata ttaattggaa agaatatcat caagacttca 3840 gctccagcca ccaggtgctc ccacttcctt cttacaagtg ggatctcaag aactactgga 3900 taccctacac taacaatttc tgccttacga agggtgctcc ccaaactgca attcaagctg 3960 caccacaaac tacattcctg accactgctg cgcaaaaggt tgttgagagt cgcgacgacg 4020 gtacaacagc gactgtcgtg gtgcaaaatg acatcgctga tcctgagttg aaccgtgtta 4080 tccaaggtca caaggtcaat ggagccgcac tttgcccatc ggtaagtatt gcatgcattg 4140 ccagactatc ttgtgttata attcggctac ttacgtattg cctagtcact ctacgcagat 4200 attgcccaga cacttggaga gtatcttatt gagaaataca aacccgagtt caaagatctt 4260 ggtctcgatg tgtgtgacat ggtcgtaccg aagccactca tcgcgaaggg aggagagcag 4320 ctctttagag tctctgctat tgctaattgg gctgagaaga aggcttcagt tcaagtatac 4380 gccgttaatg ctgacggcaa aaagaccgtg gatcatgcgt attgtacggt gaagttcttt 4440 gataccaatg cctccgagct cgagtggaag agaatctcgt acctggtcaa gagaagcatc 4500 gacagtcttc accagaatgc ggagacaggg gaggctcacc gtatccagcg aggaatggtc 4560 tataaacttt tcagcgcgtt ggtcgattat gatgaaaatt tcaagtcgat tcgcgaggtt 4620 atcctggaca gcgacaataa tgaggccacc gctcgtgtca aattccaagc accgccagga 4680 aatttccacc gaaacccatt ctggattgac agtttcggtc acttgtccgg attcattatg 4740 aatgcgagcg acgcgaccga ctctaagaac caagtatttg ttaaccatgg atgggattcg 4800 atgcgttgcc tgaagaagtt ctcgcctgat gtcacttatc gcacttatgt gaggatgcag 4860 ccatggcaaa acaacatttg ggctggagat gtttatatct ttgagggcga cgatattatt 4920 gctgtcttcg gaggtgtgaa ggtgggtacc tcactactga ttttggttcc tgcttactga 4980 catgataatt agttccaagc actggcacgc aagatacttg acactgttct tccccctgtt 5040 ggcggttcaa aggcaccaat tacagcgaaa tcaccacctc cagctcgcac tcagaaggcc 5100 aacaccggcg ccaagacccg tcctaaagca cctgttcctt ccaagtcgtt caccaaatct 5160 tctgggccga gtgttgtcgt acgcgcactc agcattctgg cctcagaagt tggcctggca 5220 gagtctgaaa tctcagacga catggtgttt gcggactacg gtgtagactc actcctctcc 5280 cttacagtta ctggcaggta tcgtgaagag ttgaacctcg atttggactc ctctgtgttt 5340 accgatcatc caactgtcaa cgacttcaag cggctcatcg cccaagtgag tccttcagag 5400 agccatgatg gttcctccag tgaacaagag tcgaatttct ctttcaacgg tggcgagtcc 5460 tcaagcgcaa gcacacctga cataacgtca ccgccgaatg agaaggtagc tcaagtcgag 5520 caaaacggca ccatgaagga aatccgtaac atcatggcgg aggagatcgg tgtacccgca 5580 gaagagatcg accctgacga gaacttggga gagatgggta tggactcgct tctctccctt 5640 actgttcttg gaagaatacg ggagactttg gacatggacc tgccaggaga gttcttcatc 5700 gaaaaccaga ccctcaatga tatagaggtg gctttggacc taaaacccaa gactacctct 5760 gctccaattc ctatgccaga gccagtgaaa ttccctgaag ctatccacga cctccagcca 5820 aagcttgctc aacatcccaa ggccacatcc atcctgttac aaggaaaccc caggacagca 5880 acaaagacgt tattcttgtt tcctgacggc tctggctcag ctacatctta cgctaccatc 5940 cccggactct ctcctgacgt ctgcgtttac gggttgaatt gcccatatat gaagacacct 6000 gagaagctca aatgcagcct agatgaactc actgcgccct atgtagcaga gattcgtcgt 6060 cggcaaccca agggtcctta cagcttcggt ggctggtcag caggagggat ctgtgcatat 6120 gatgcggcac gccatctaat gtttgaggaa ggtgaacaag tcgaccgctt gcttctcctt 6180 gataccccct tccccatcgg cctcgagaag ctgccgcaga gattgtacgg cttcttcaac 6240 tctatcggtc tcttcggtga aggtaaaacg gcaccaccct cctggctcct accccacttc 6300 ctagccttta tcgacgctct cgacgcatac aaggccgcgc cccttccatt caaagacgag 6360 aaatgggcca agaaactgcc caagacttat atcatctggg ccaaggacgg tgtttgcggt 6420 aagccgggag atccccggcc tgatcccccg acagacggtt ccaaggatcc caaggagatg 6480 gtctggcttc ttaatgaccg gaccgatctg ggacctaaca agtgggatac attggttgga 6540 cctgagaata ttggtggaat cacagtaatg gaagatgcta atcattttac gatgacgaag 6600 ggcgaaaaag cgaaagagtt gtctacattt atggctaacg ccatggctta a 6651 <210>6 <211>2141 <212>PRT <213>米曲霉(Aspergillus oryzae) <400>6 Met Glu Gly Pro Arg Gly Val Tyr Leu Phe Gly Asp Gln Thr Ser Asp 1 5 10 15 Phe Asp Ala Gly Leu Arg Arg Leu Leu Gln Val Lys Asn Asn Thr Ile 20 25 30 Val Ala Ser Phe Phe Gln Arg Cys Phe His Ala Leu Arg Gln Glu Ile 35 40 45 Ala Arg Leu Ser Pro Ser Glu Arg Lys Ile Phe Pro Arg Phe Thr Ser 50 55 60 Ile Val Asp Leu Leu Ala Arg His Arg Glu Ser Asp Pro Asn Pro Ala 65 70 75 80 Leu Glu Ser Ala Leu Thr Cys Ile Tyr Gln Leu Gly Cys Phe Ile Asn 85 90 95 Tyr Tyr Gly Asp Leu Gly Asn Val Tyr Pro Ser Ala Ser Asp Cys His 100 105 110 Ile Val Gly Leu Cys Ala Gly Leu Leu Ser Ser Ala Ala Val Ser Cys 115 120 125 Ser Asn Asn Val Gly Glu Leu Leu Pro Ala Ala Val Glu Ala Val Val 130 135 140 Val Ala Leu Arg Leu Gly Leu Cys Val Leu Lys Val Arg Glu Leu Val 145 150 155 160 Ser Ser Asp Gln Ala Ser Ser Thr Ser Trp Ser Val Leu Ile Ser Gly 165 170 175 Ile Ser Glu Lys Asp Ala Ser Gln Leu Ile Gly Glu Phe Thr Ala Glu 180 185 190 Arg Ala Ile Pro Pro Ser Ser Lys Pro Tyr Ile Ser Ala Val Gly Tyr 195 200 205 Asn Ser Ile Thr Ile Ser Ala Pro Pro Lys Val Leu Asp Asp Leu Ile 210 215 220 Asp Ser Arg Leu Ser Lys Ser His Lys Pro Val Arg Ala Gln Ile His 225 230 235 240 Gly Pro Tyr His Ala Ala His Leu Tyr Tyr Gly Arg Asp Val Asp Arg 245 250 255 Ile Ile Glu Ser Cys His Asn Glu Val Val Ser Asn Tyr Thr Pro Arg 260 265 270 Ile Pro Val Leu Ser Ser Thr Thr Gly Gln Pro Ile Glu Ala Lys His 275 280 285 Met Lys Asp Leu Leu Lys Ala Ala Leu Glu Glu Ile Leu Leu Arg Gln 290 295 300 Leu Cys Trp Glu Lys Val Thr Asp Ala Cys Tyr Ser Ile Leu Lys Thr 305 310 315 320 Ala Arg His Gln Pro Cys Lys Leu Phe Pro Ile Ser Ser Thr Ala Thr 325 330 335 Gln Ser Leu Phe Thr Ala Leu Thr Lys Ala Gly Ile Thr Asp Ile Glu 340 345 350 Val Glu Asn Gly Leu Gly Asp Val Pro Thr Asn Pro Lys Asp Asn Leu 355 360 365 Asn Ile Ser Gly Arg Ala Asp Cys Ser Lys Ile Ala Ile Ile Gly Met 370 375 380 Ser Gly Arg Phe Pro Glu Ala Asp Gly Thr Glu Ser Phe Trp Asp Leu 385 390 395 400 Leu Tyr Asn Gly Leu Asp Val His Arg Lys Val Pro Ala Glu Arg Trp 405 410 415 Asp Val Asp Ala His Val Asp Pro Thr Gly Thr Lys Arg Asn Thr Ser 420 425 430 Lys Val Pro Tyr Gly Cys Trp Ile Asn Glu Pro Gly Leu Phe Asp Pro 435 440 445 Arg Phe Phe Asn Met Ser Pro Arg Glu Ala Leu Gln Ala Asp Pro Ala 450 455 460 Gln Arg Leu Ala Leu Leu Thr Ala Tyr Glu Ala Leu Glu Met Ala Gly 465 470 475 480 Phe Ile Pro Asp Ser Thr Pro Ser Thr Gln Arg Asp Arg Val Gly Leu 485 490 495 Phe Tyr Gly Met Thr Ser Asp Asp Tyr Arg Glu Ile Asn Ser Gly Gln 500 505 510 Asp Ile Asp Thr Tyr Phe Ile Pro Gly Gly Asn Arg Ala Phe Thr Pro 515 520 525 Gly Arg Ile Asn Tyr Tyr Phe Lys Phe Ser Gly Pro Ser Val Ser Val 530 535 540 Asp Thr Ala Cys Ser Ser Ser Leu Ala Ala Ile His Met Ala Cys Asn 545 550 555 560 Ser Ile Trp Arg Asn Asp Cys Asp Ala Ala Ile Ala Gly Gly Val Asn 565 570 575 Ile Leu Thr Asn Pro Asp Asn His Ala Gly Leu Asp Arg Gly His Phe 580 585 590 Leu Ser Arg Thr Gly Asn Cys Asn Thr Phe Asp Asp Gly Ala Asp Gly 595 600 605 Tyr Cys Arg Ala Asp Gly Val Gly Thr Ile Ile Leu Lys Arg Leu Glu 610 615 620 Asp Ala Gln Ala Asp Asn Asp Pro Ile Leu Gly Val Ile Asn Gly Ala 625 630 635 640 Tyr Thr Asn His Ser Ala Glu Ala Val Ser Ile Thr Arg Pro His Val 645 650 655 Gly Ala Gln Ala Phe Ile Phe Asn Lys Leu Leu Asn Asp Ala Asn Ile 660 665 670 Asp Pro Lys Asp Val Ser Tyr Val Glu Met His Gly Thr Gly Thr Gln 675 680 685 Ala Gly Asp Ala Val Glu Met Gln Ser Val Leu Asp Thr Phe Ala Pro 690 695 700 Asp Tyr Arg Arg Gly Pro Gly Gln Ser Leu His Leu Gly Ser Ala Lys 705 710 715 720 Ala Asn Val Gly His Gly Glu Ser Ala Ser Gly Val Thr Ala Leu Val 725 730 735 Lys Val Leu Leu Met Met Lys Lys Asn Thr Ile Pro Pro His Cys Gly 740 745 750 Ile Lys Thr Lys Ile Asn His Asn Phe Pro Thr Asp Leu Ala Gln Arg 755 760 765 Asn Val His Ile Ala Phe Gln Pro Thr Pro Trp Asn Arg Pro Ala Ser 770 775 780 Gly Lys Arg Gln Cys Phe Ile Asn Asn Phe Ser Ala Ala Gly Gly Asn 785 790 795 800 Thr Ala Leu Leu Met Glu Asp Ala Pro Ile Ala Glu Val Lys Gly Gln 805 810 815 Asp Thr Arg Pro Val His Val Val Ser Val Ser Ala Arg Ser Gln Ser 820 825 830 Ala Leu Lys Asn Asn Ile Asn Ser Leu Val Lys Tyr Ile Asp Glu Gln 835 840 845 Gly Arg Ser Phe Asn Val Asn Glu Ala Asp Phe Ile Pro Ser Leu Ala 850 855 860 Tyr Thr Thr Thr Ala Arg Arg Ile His His Pro Phe Arg Val Thr Ala 865 870 875 880 Ile Gly Ser Ser Leu Gln Glu Leu Arg Asp Ser Leu Asn Asn Ser Ser 885 890 895 Arg Leu Glu Ser Phe Thr Pro Val Pro Ala Thr Ala Pro Gly Val Gly 900 905 910 Phe Val Phe Ala Gly Gln Gly Ala Gln His Thr Gly Met Gly Arg Gln 915 920 925 Leu Tyr Glu Lys Cys Ser Gln Phe Arg Ala Thr Met Gln His Phe Asp 930 935 940 Cys Ile Ser Gln Asn Gln Gly Phe Pro Ser Ile Leu Pro Leu Val Asp 945 950 955 960 Gly Ser Val Pro Val Glu Glu Leu Gly Pro Ile Val Thr Gln Leu Gly 965 970 975 Thr Thr Cys Leu Gln Met Ala Leu Val Asn Tyr Trp Gly Ser Leu Gly 980 985 990 Ile Lys Pro Ala Phe Val Leu Gly His Ser Leu Gly Glu Phe Ala Ala 995 1000 1005 Leu Asn Thr Ala Gly Val Leu Ser Thr Ser Asp Thr Ile Tyr Leu 1010 1015 1020 Cys Gly Arg Arg Ala Thr Leu Leu Thr Glu Tyr Cys Gln Val Gly 1025 1030 1035 Thr His Ala Met Leu Ala Val Lys Ala Ser Tyr Pro Gln Val Lys 1040 1045 1050 Gln Leu Leu Lys Glu Gly Val Asp Glu Val Ala Cys Val Asn Ser 1055 1060 1065 Pro Ser Glu Thr Val Val Ser Gly Leu Thr Ala Asp Ile Asp Asp 1070 1075 1080 Leu Ala Gln Arg Cys Ser Thr Glu Gly Trp Lys Ser Thr Lys Leu 1085 1090 1095 Arg Val Pro Phe Ala Phe His Ser Ala Gln Val Thr Pro Ile Leu 1100 1105 1110 Glu Arg Phe Gln Glu Glu Ala Gln Gly Val Thr Phe Arg Lys Pro 1115 1120 1125 Ser Leu Pro Phe Val Ser Ser Leu Leu Gly Glu Val Ile Thr Glu 1130 1135 1140 Ser Asn Tyr Asp Val Leu Gly Ala Gln Tyr Met Val Lys Gln Cys 1145 1150 1155 Arg Lys Ser Val Asn Phe Leu Gly Ala Leu Glu Ala Thr Arg Tyr 1160 1165 1170 Ala Lys Leu Met Thr Asp Lys Thr Val Trp Leu Glu Val Gly Ala 1175 1180 1185 His Thr Ile Cys Ser Gly Met Ile Lys Ala Thr Phe Gly Pro Gln 1190 1195 1200 Val Thr Thr Val Ala Ser Leu Arg Arg Glu Glu Asn Ala Trp Lys 1205 1210 1215 Val Leu Ser Asn Ser Leu Ser Ala Leu His Leu Ala Gly Ile Asp 1220 1225 1230 Ile Asn Trp Lys Glu Tyr His Gln Asp Phe Ser Ser Ser His Gln 1235 1240 1245 Val Leu Pro Leu Pro Ser Tyr Lys Trp Asp Leu Lys Asn Tyr Trp 1250 1255 1260 Ile Pro Tyr Thr Asn Asn Phe Cys Leu Thr Lys Gly Ala Pro Gln 1265 1270 1275 Thr Ala Ile Gln Ala Ala Pro Gln Thr Thr Phe Leu Thr Thr Ala 1280 1285 1290 Ala Gln Lys Val Val Glu Ser Arg Asp Asp Gly Thr Thr Ala Thr 1295 1300 1305 Val Val Val Gln Asn Asp Ile Ala Asp Pro Glu Leu Asn Arg Val 1310 1315 1320 Ile Gln Gly His Lys Val Asn Gly Ala Ala Leu Cys Pro Ser Ser 1325 1330 1335 Leu Tyr Ala Asp Ile Ala Gln Thr Leu Gly Glu Tyr Leu Ile Glu 1340 1345 1350 Lys Tyr Lys Pro Glu Phe Lys Asp Leu Gly Leu Asp Val Cys Asp 1355 1360 1365 Met Val Val Pro Lys Pro Leu Ile Ala Lys Gly Gly Glu Gln Leu 1370 1375 1380 Phe Arg Val Ser Ala Ile Ala Asn Trp Ala Glu Lys Lys Ala Ser 1385 1390 1395 Val Gln Val Tyr Ala Val Asn Ala Asp Gly Lys Lys Thr Val Asp 1400 1405 1410 His Ala Tyr Cys Thr Val Lys Phe Phe Asp Thr Asn Ala Ser Glu 1415 1420 1425 Leu Glu Trp Lys Arg Ile Ser Tyr Leu Val Lys Arg Ser Ile Asp 1430 1435 1440 Ser Leu His Gln Asn Ala Glu Thr Gly Glu Ala His Arg Ile Gln 1445 1450 1455 Arg Gly Met Val Tyr Lys Leu Phe Ser Ala Leu Val Asp Tyr Asp 1460 1465 1470 Glu Asn Phe Lys Ser Ile Arg Glu Val Ile Leu Asp Ser Asp Asn 1475 1480 1485 Asn Glu Ala Thr Ala Arg Val Lys Phe Gln Ala Pro Pro Gly Asn 1490 1495 1500 Phe His Arg Asn Pro Phe Trp Ile Asp Ser Phe Gly His Leu Ser 1505 1510 1515 Gly Phe Ile Met Asn Ala Ser Asp Ala Thr Asp Ser Lys Asn Gln 1520 1525 1530 Val Phe Val Asn His Gly Trp Asp Ser Met Arg Cys Leu Lys Lys 1535 1540 1545 Phe Ser Pro Asp Val Thr Tyr Arg Thr Tyr Val Arg Met Gln Pro 1550 1555 1560 Trp Gln Asn Asn Ile Trp Ala Gly Asp Val Tyr Ile Phe Glu Gly 1565 1570 1575 Asp Asp Ile Ile Ala Val Phe Gly Gly Val Lys Phe Gln Ala Leu 1580 1585 1590 Ala Arg Lys Ile Leu Asp Thr Val Leu Pro Pro Val Gly Gly Ser 1595 1600 1605 Lys Ala Pro Ile Thr Ala Lys Ser Pro Pro Pro Ala Arg Thr Gln 1610 1615 1620 Lys Ala Asn Thr Gly Ala Lys Thr Arg Pro Lys Ala Pro Val Pro 1625 1630 1635 Ser Lys Ser Phe Thr Lys Ser Ser Gly Pro Ser Val Val Val Arg 1640 1645 1650 Ala Leu Ser Ile Leu Ala Ser Glu Val Gly Leu Ala Glu Ser Glu 1655 1660 1665 Ile Ser Asp Asp Met Val Phe Ala Asp Tyr Gly Val Asp Ser Leu 1670 1675 1680 Leu Ser Leu Thr Val Thr Gly Arg Tyr Arg Glu Glu Leu Asn Leu 1685 1690 1695 Asp Leu Asp Ser Ser Val Phe Thr Asp His Pro Thr Val Asn Asp 1700 1705 1710 Phe Lys Arg Leu Ile Ala Gln Val Ser Pro Ser Glu Ser His Asp 1715 1720 1725 Gly Ser Ser Ser Glu Gln Glu Ser Asn Phe Ser Phe Asn Gly Gly 1730 1735 1740 Glu Ser Ser Ser Ala Ser Thr Pro Asp Ile Thr Ser Pro Pro Asn 1745 1750 1755 Glu Lys Val Ala Gln Val Glu Gln Asn Gly Thr Met Lys Glu Ile 1760 1765 1770 Arg Asn Ile Met Ala Glu Glu Ile Gly Val Pro Ala Glu Glu Ile 1775 1780 1785 Asp Pro Asp Glu Asn Leu Gly Glu Met Gly Met Asp Ser Leu Leu 1790 1795 1800 Ser Leu Thr Val Leu Gly Arg Ile Arg Glu Thr Leu Asp Met Asp 1805 1810 1815 Leu Pro Gly Glu Phe Phe Ile Glu Asn Gln Thr Leu Asn Asp Ile 1820 1825 1830 Glu Val Ala Leu Asp Leu Lys Pro Lys Thr Thr Ser Ala Pro Ile 1835 1840 1845 Pro Met Pro Glu Pro Val Lys Phe Pro Glu Ala Ile His Asp Leu 1850 1855 1860 Gln Pro Lys Leu Ala Gln His Pro Lys Ala Thr Ser Ile Leu Leu 1865 1870 1875 Gln Gly Asn Pro Arg Thr Ala Thr Lys Thr Leu Phe Leu Phe Pro 1880 1885 1890 Asp Gly Ser Gly Ser Ala Thr Ser Tyr Ala Thr Ile Pro Gly Leu 1895 1900 1905 Ser Pro Asp Val Cys Val Tyr Gly Leu Asn Cys Pro Tyr Met Lys 1910 1915 1920 Thr Pro Glu Lys Leu Lys Cys Ser Leu Asp Glu Leu Thr Ala Pro 1925 1930 1935 Tyr Val Ala Glu Ile Arg Arg Arg Gln Pro Lys Gly Pro Tyr Ser 1940 1945 1950 Phe Gly Gly Trp Ser Ala Gly Gly Ile Cys Ala Tyr Asp Ala Ala 1955 1960 1965 Arg His Leu Met Phe Glu Glu Gly Glu Gln Val Asp Arg Leu Leu 1970 1975 1980 Leu Leu Asp Thr Pro Phe Pro Ile Gly Leu Glu Lys Leu Pro Gln 1985 1990 1995 Arg Leu Tyr Gly Phe Phe Asn Ser Ile Gly Leu Phe Gly Glu Gly 2000 2005 2010 Lys Thr Ala Pro Pro Ser Trp Leu Leu Pro His Phe Leu Ala Phe 2015 2020 2025 Ile Asp Ala Leu Asp Ala Tyr Lys Ala Ala Pro Leu Pro Phe Lys 2030 2035 2040 Asp Glu Lys Trp Ala Lys Lys Leu Pro Lys Thr Tyr Ile Ile Trp 2045 2050 2055 Ala Lys Asp Gly Val Cys Gly Lys Pro Gly Asp Pro Arg Pro Asp 2060 2065 2070 Pro Pro Thr Asp Gly Ser Lys Asp Pro Lys Glu Met Val Trp Leu 2075 2080 2085 Leu Asn Asp Arg Thr Asp Leu Gly Pro Asn Lys Trp Asp Thr Leu 2090 2095 2100 Val Gly Pro Glu Asn Ile Gly Gly Ile Thr Val Met Glu Asp Ala 2105 2110 2115 Asn His Phe Thr Met Thr Lys Gly Glu Lys Ala Lys Glu Leu Ser 2120 2125 2130 Thr Phe Met Ala Asn Ala Met Ala 2135 2140 <210>7 <211>176 <212>DNA <213>米曲霉(Aspergillus oryzae) <400>7 cagcacttcg attgcattag tcaaaaccaa gggtttcctt cgatccttcc cttggttgac 60 ggaagcgtgc ccgtggagga gctgggccct atcgtgacac agctcggcac cacatgtctt 120 cagatggctt tggtcaacta ttggggttca ctaggtataa aacctgcgtt cgttct 176 <210>8 <211>59 <212>PRT <213>米曲霉(Aspergillus oryzae) <400>8 Gln His Phe Asp Cys Ile Ser Gln Asn Gln Gly Phe Pro Ser Ile Leu 1 5 10 15 Pro Leu Val Asp Gly Ser Val Pro Val Glu Glu Leu Gly Pro Ile Val 20 25 30 Thr Gln Leu Gly Thr Thr Cys Leu Gln Met Ala Leu Val Asn Tyr Trp 35 40 45 Gly Ser Leu Gly Ile Lys Pro Ala Phe Val Leu 50 55 <210>9 <211>25 <212>DNA <213>米曲霉(Aspergillus oryzae) <400>9 ccatggagca cttcgattgc attag 25 <210>10 <211>30 <212>DNA <213>米曲霉(Aspergillus oryzae) <400>10 gcggccgcag aacgaacgca ggttttatac 30 <210>11 <211>27 <212>DNA <213>米曲霉(Aspergillus oryzae) <400>11 ccatgggcgc tcaaaaacaa catcaac 27 <210>12 <211>28 <212>DNA <213>米曲霉(Aspergillus oryzae) <400>12 gcggccgcag aacgaacgca ggttttat 28 <210>13 <211>20 <212>DNA <213>米曲霉(Aspergillus oryzae) <400>13 tactacggag accttggaaa 20 <210>14 <211>20 <212>DNA <213>米曲霉(Aspergillus oryzae) <400>14 gctcttagac agcctagaat 20 <210>15 <211>20 <212>DNA <213>米曲霉(Aspergillus oryzae) <400>15 atgcctcgca gcttatagga 20 <210>16 <211>20 <212>DNA <213>米曲霉(Aspergillus oryzae) <400>16 cgcactgata tacggtttgg 20 <210>17 <211>23 <212>DNA <213>米曲霉(Aspergillus oryzae) <400>17 ggatctctac ggtaacatcg tca 23 <210>18 <211>19 <212>DNA <213>米曲霉(Aspergillus oryzae) <400>18 gatcggagat gccagggta 19 <210>19 <211>1128 <212>DNA <213>米曲霉(Aspergillus oryzae) <400>19 atggaagagg aagttgctgc tctcgtcatt gacaatggtt cgggtatgtg caaggccggt 60 ttcgccggtg acgatgctcc ccgtgccgtc ttcccctcca ttgtcggtcg tccccgtcac 120 catggtatca tgattggtat gggtcagaag gactcctacg tcggtgatga ggcacagtcc 180 aagcgtggta tcctcaccct cagatacccc attgagcacg gtgtcgtcac gaactgggat 240 gacatggaga agatctggca ccacaccttc tacaatgaac tccgtgtcgc tcctgaggag 300 caccccgtcc tcttgaccga agcccccatc aaccccaagt ccaaccgtga gaagatgacc 360 cagatcgtct tcgagacctt caacgccccc gccttctacg tctccatcca ggccgtcctg 420 tccctgtacg cctccggtcg taccaccggt atcgttctgg actctggtga cggtgtcacc 480 cacgttgtcc ccatctacga gggtttcgcc cttccccacg ccatctcccg tgtcgacatg 540 gctggtcgtg acctgacgga ttacctcatg aagatcctgg ccgagcgtgg ttacactttc 600 tccactaccg ctgagcgtga aattgtccgt gacatcaagg agaagctctg ctacgtcgct 660 ctcgacttcg agcaggagat ccagaccgct tcccagagct ccagcctcga gaagtcctac 720 gagcttcccg acggtcaggt catcaccatc ggcaacgagc gtttccgtgc tcctgaggct 780 ctgttcgctc ctagcgtcct gggtctggag agcggtggta tccacgagac caccttcaac 840 tccatcatga agtgtgatgt tgatgtccgt aaggatctgt acggcaacat tgtcatgtct 900 ggtggtacta ccatgtaccc cggtatctcc gaccgtatgc agaaggagat cactgctctt 960 gctccttctt ccatgaaggt caagatcatt gctcctcccg agcgcaagta ctccgtctgg 1020 atcggtggtt ccatcctggc ctccctgtcc accttccagc agatgtggat ctccaagcag 1080 gagtacgacg agagcggtcc ctcgatcgtc caccgcaagt gcttctaa 1128 <210>20 <211>375 <212>PRT <213>米曲霉(Aspergillus oryzae) <400>20 Met Glu Glu Glu Val Ala Ala Leu Val Ile Asp Asn Gly Ser Gly Met 1 5 10 15 Cys Lys Ala Gly Phe Ala Gly Asp Asp Ala Pro Arg Ala Val Phe Pro 20 25 30 Ser Ile Val Gly Arg Pro Arg His His Gly Ile Met Ile Gly Met Gly 35 40 45 Gln Lys Asp Ser Tyr Val Gly Asp Glu Ala Gln Ser Lys Arg Gly Ile 50 55 60 Leu Thr Leu Arg Tyr Pro Ile Glu His Gly Val Val Thr Asn Trp Asp 65 70 75 80 Asp Met Glu Lys Ile Trp His His Thr Phe Tyr Asn Glu Leu Arg Val 85 90 95 Ala Pro Glu Glu His Pro Val Leu Leu Thr Glu Ala Pro Ile Asn Pro 100 105 110 Lys Ser Asn Arg Glu Lys Met Thr Gln Ile Val Phe Glu Thr Phe Asn 115 120 125 Ala Pro Ala Phe Tyr Val Ser Ile Gln Ala Val Leu Ser Leu Tyr Ala 130 135 140 Ser Gly Arg Thr Thr Gly Ile Val Leu Asp Ser Gly Asp Gly Val Thr 145 150 155 160 His Val Val Pro Ile Tyr Glu Gly Phe Ala Leu Pro His Ala Ile Ser 165 170 175 Arg Val Asp Met Ala Gly Arg Asp Leu Thr Asp Tyr Leu Met Lys Ile 180 185 190 Leu Ala Glu Arg Gly Tyr Thr Phe Ser Thr Thr Ala Glu Arg Glu Ile 195 200 205 Val Arg Asp Ile Lys Glu Lys Leu Cys Tyr Val Ala Leu Asp Phe Glu 210 215 220 Gln Glu Ile Gln Thr Ala Ser Gln Ser Ser Ser Leu Glu Lys Ser Tyr 225 230 235 240 Glu Leu Pro Asp Gly Gln Val Ile Thr Ile Gly Asn Glu Arg Phe Arg 245 250 255 Ala Pro Glu Ala Leu Phe Ala Pro Ser Val Leu Gly Leu Glu Ser Gly 260 265 270 Gly Ile His Glu Thr Thr Phe Asn Ser Ile Met Lys Cys Asp Val Asp 275 280 285 Val Arg Lys Asp Leu Tyr Gly Asn Ile Val Met Ser Gly Gly Thr Thr 290 295 300 Met Tyr Pro Gly Ile Ser Asp Arg Met Gln Lys Glu Ile Thr Ala Leu 305 310 315 320 Ala Pro Ser Ser Met Lys Val Lys Ile Ile Ala Pro Pro Glu Arg Lys 325 330 335 Tyr Ser Val Trp Ile Gly Gly Ser Ile Leu Ala Ser Leu Ser Thr Phe 340 345 350 Gln Gln Met Trp Ile Ser Lys Gln Glu Tyr Asp Glu Ser Gly Pro Ser 355 360 365 Ile Val His Arg Lys Cys Phe 370 375 <210>21 <211>20 <212>DNA <213>米曲霉(Aspergillus oryzae) <400>21 atgcctcgca gcttatagga 20 <210>22 <211>20 <212>DNA <213>米曲霉(Aspergillus oryzae) <400>22 cgcactgata tacggtttgg 20 <210>23 <211>23 <212>DNA <213>米曲霉(Aspergillus oryzae) <400>23 ggatctctac ggtaacatcg tca 23 <210>24 <211>19 <212>DNA <213>米曲霉(Aspergillus oryzae) <400>24 gatcggagat gccagggta 19 <210>25 <211>6387 <212>DNA <213>黑曲霉(Aspergillus niger) <400>25 atggagggtc catctcgtgt gtaccttttt ggagaecaga ccagcgacat cgaagctggc 60 ctgcgccgtc tgctccaagc gaagaatagt accattgtcc agtccttttt ccagcaatgc 120 ttccatgcaa ttcgtcaaga gatcgcgaag ctcccgccgt ctcatcggaa gctcttccca 180 cgcttcacga gcatcgttga tctcctttcc aggagtcgtg aatcaggtcc tagccctgtc 240 ctggagagtg cattgacatg catctaccaa ttgggttgtt tcattcactt ttacggggat 300 cttggacatg actaccctac accctccaac agccatcttg ttggcctgtg cactggtgtt 360 ctgagctgca cggctgtaag ttgcgccaga aatgttggag agcttattcc agctgcagtg 420 gaatcggttg taattgcact gcgactggga atctgcgttt ttcgagttcg agaactggtg 480 gactccgccg attccgagtc aacatgctgg tcagcgttgg tttctggaat cagtgaagca 540 gaggctagcc acctgatcga cgagtacagt agtaagaagg ctactccgcc ttcttcgaaa 600 ccgtatatca gcgcggtaag ctctaatggc gttactgtca gcgcaccacc tacggtactt 660 gatgaattcg tcgagacctg catttccaag aattacaagc cagtgaaggc ccctattcat 720 ggcccgtacc atgcgccaca tctgtatgat gataaggata tcgaccgcat cctgcagcag 780 tcctctgctc tagaaggact gaccggctgt tcacccgtta ttcccatcat ctccagtaac 840 actggaaagc cgatcaaggc caagtccatc aaagatctct tcaaggtcgc actggaggag 900 atactcctac gacgactatg ctgggacaag gtcacggagt cctgcacatc agtctgcaag 960 accggcacaa accactcttg caaattgttt ccgatctcga gtagcgccac tcaaagtttg 1020 ttcacagtcc tcaagaaggc cggtgtgagc atcagcttgg agactggggt aggagagatc 1080 gcgacgaacc cagaaatgcg gaaccttact ggcaaggcag aaaattcaaa gattgctatc 1140 attggtatgt ctggaagatt tcctgactcg gatggtacgg agagcttctg gaacctcctg 1200 tacaaaggac tcgacgtaca tcgcaaagtc cccgcagacc gttgggacgt tgatgcccac 1260 gtcgacatga ccgggtcaaa gagaaacaca agcaaagtgg cttacggttg ctggatcaac 1320 gaacccggcc tgtttgaccc ccgattcttc aacatgtcgc ctcgggaagc actccaagca 1380 gatcctgcac aacgtcttgc gttgcttaca gcgtacgagg ctctcgagat ggctggcttc 1440 atcccggata gctctccatc gacgcagagg gaccgtgtgg gtattttcta cggaatgacc 1500 agtgacgact accgtgagat caacagcggc caggacattg atacctattt catccctggc 1560 ggtaaccgag catttacgcc gggtcggata aactactact tcaaatttag cggccccagt 1620 gtgagcgttg acacagcgtg ctcgtctagt cttgctgcta tccacatggc ttgcaattcg 1680 atctggagaa atgactgcga tgccgccatc actggaggtg tgaacattct gaccaaccct 1740 gacaaccacg ccggtctgga tcggggccat ttcctgtcca ccactggcaa ctgtaacacc 1800 tttgatgacg gcgccgacgg ctactgtaga gcggacggag ttggaagcat cgttttgaag 1860 cggcttgaag atgccgaggc cgacaacgac ccgatcctgg ccgtcatcaa cggtgcttac 1920 accaaccact cggcggaggc cgtgtcaatc actcgtcccc atgttggcgc gcaagcattc 1980 atcttcaaca agctgctcaa tgatgcgaat atcgacccta aggacgtgag ctacgtggaa 2040 atgcatggca ctggaactca agcaggtgat gcagtcgaaa tgcagtccgt tcttgacgtc 2100 ttcgcaccag actaccgccg gggtcccggt caatcgcttc atatcggttc tgccaaggca 2160 aacattggac acggtgaatc cgcatcagga gtgactgctc ttgtcaaggt cctcctaatg 2220 atgagagaga acatgattec tcctcattgt ggtatcaaga ccaagatcaa ttccaatttc 2280 ccgacagact tggcgaagcg caatgttcat atcgccttcc aacccactcc ctggaatcgg 2340 ccagcttcag gaaagcggcg aactttcgtc aacaactttt ctgctgctgg tggtaacact 2400 gctcttctac tggaagatgc tcccataccg gaacgccaag ggcaggaccc caggtcgttc 2460 catttggtct ccgtgtcagc aagatcccag tctgcattga agaacaacgt cgaagctctg 2520 gtgaagtaca ttgactctca gggcaagtcc tttggtgtga aagagactga attccttcca 2580 aacctggcgt acacgaccac cgcacgccgt atccaccatc ccttccgtgt cactgcggtt 2640 ggagcgaacc tacaatcact gcgtgactcg ctgcatggtg ctttgcaccg tgagacatat 2700 accccagttc cctcaacggc tcctggtatt ggtttcgtct tcaccggcca aggagcccaa 2760 tactccggaa tgggcaagga actctaccgc agttgtttcc aattccgaac caccattgag 2820 cattttgact gcatcgcaag aagccagggc cttccttcta tccttcctct tgtcgatgga 2880 agcgtggctg tcgaagaact tagccctgtc gtggtacaag tgggaactac ctgtgtacaa 2940 atggctctag taaattactg gactgctctg ggtgtgaagc cggcctttat catcggacac 3000 agtcttggag actatgcagc ccttaacacg gccggtgttc tatccaccag cgatacaatc 3060 tatctttgtg gccggcgtgc tcagttgctg acgaaggaat gcaagattgg gacacattcg 3120 atgctggcca tcaaggcgtc cctggcagag gtcaaacatt tcctcagaga cgagctccac 3180 gaagtctctt gtgttaacgc acctgcggag accgtcgtca gcggccttgt cgctgatatc 3240 gacgagttgg ctcagaaatg ctccacagag ggtttgaagt caaccaagct caaggttcct 3300 tacgcgttcc attcctctca ggttgatcct atcttggagg ccttcgaaga tattgcccaa 3360 ggtgtcacct tccacaagcc gacaacacct ttcgtctcag ccctgttcgg ggaagtgatc 3420 accgatgcta actgggagtg tctcggcccc aagtacctgc gcgatcattg cagaaagacg 3480 gtcaacttcc ttggcggcgt ggaggctacg aggcatgcga agctgaccaa tgacaagact 3540 ctgtgggttg agatcggctc acataccatt tgctctggaa tgatcaaagc aactcttgga 3600 ccgcaagtta caacggttgc atctctacgc cgcgaagaag atacctggaa ggtcctttcg 3660 aacagtcttg cgagccttca tctggcgggt attgatatca actggaagca atatcaccag 3720 gactttagct cctctctcca ggtcctccgc ctcccagcct acaagtggga tctcaagaac 3780 tactggattc cctataccaa caacttctgc ctgagcaagg gcgctccagt tgcgacagta 3840 gcggcagggc cacagcatga gtacctgaca accgcggctc agaaggtcat tgagactcga 3900 agtgatggag caacagctac agtcgtgata gagaacgaca ttgctgatcc cgagctcaac 3960 cgcgtcattc aaggccataa ggtcaacggt actgctttgt gtccctcatc actatatgcc 4020 gacatctctc aaacgcttgc agagtatctc atcaaaaagt acaagcctga gtacgacgga 4080 cttggactgg atgtgtgtga ggtcacagtg ccacgaccac tgattgcgaa aggcggacag 4140 cagctcttta gagtatctgc gacagcggat tgggcggaga agaagacaac ccttcagata 4200 tattcagtca ctgcggaggg gaagaagacg gctgaccacg caacttgcac tgtccgattc 4260 tttgactgcg ctgctgcgga ggcggaatgg aaacgagttt cctaccttgt caagaggagc 4320 attgaccgac tgcatgatat cgccgaaaat ggtgacgctc accgtcttgg tagaggcatg 4380 gtttacaaac tcttcgctgc cttggttgat tatgacgaca acttcaagtc cattcgcgag 4440 gttattcttg acagtgaaca gcacgaagcg actgcacgcg tcaagttcca agcaccacaa 4500 ggcaatttcc accgaaaccc gttctggatt gacagttttg gacacctgtc tgggttcatc 4560 atgaacgcaa gcgatgcaac cgactccaag aaccaggtct ttgtcaatca cggatgggac 4620 tccatgcgtt gtttgaagaa gttctcgcct gatgtcacct acaggactta tgttagaatg 4680 cagccttgga aagactccat ctgggctggt gatgtctacg ttttcgatgg ggatgatatc 4740 gttgcggtgt atggtgcagt caagttccaa gccttatcac gcaagattct cgatacggtc 4800 ctacctccaa gtcgtgctag cgccccggcc ccggcgaagc ctgctgctaa gcccagcgcc 4860 ccaagcttgg tcaaacgggc acttaccatc ctcgcagagg aagtgggtct gtctgaatcc 4920 gagattacgg atgatctggt cttcgcagac tacggtgtgg actcccttct ttcgttgacg 4980 gtcacgggca ggtatcgtga agagctggat atcgatctcg aatcctccat cttcatcgac 5040 cagccgaccg tgaaagactt caagcagttc ttggccccaa tgagccaggg agaagccagc 5100 gatgggtcca ccagtgaccc agagtctagt agctccttca atggtggctc ttcaacagac 5160 gagtccagtg ctgggtcccc tgtcagctca ccaccaaatg agaaggttac gcaggtcgag 5220 cagcatgcta cgataaagga gattcgcgcc attttggccg atgagattgg tgttacggag 5280 gaggagctga aggacgatga gaacttggga gagatgggga tggactctct gctttcgctt 5340 acggtgcttg gtaggatccg tgagacattg gatctggatc taccgggcga gttcttcatc 5400 gagaatcaaa ctctgaatga cgtggaggat gcattgggcc tcaaacccaa ggcagctcct 5460 gcgcctgcgc ctgcgcctgc tcccgtaccc gcacccgtgt ccgcgcccat attgaaggag 5520 cctgtcccca acgcaaactc taccatcatg gcccgggcga gcccgcaccc tcgatcaacc 5580 tccattctgt tgcaaggaaa cccgaaaacc gcgaccaaga ccctgttcct gttccctgat 5640 gggtctggct ccgcaacatc gtatgcaacc attcccggag tgtccccgga cgtgtgtgtc 5700 tacggattga actgcccgta catgaagact ccagagaagc tcaagtatcc ccttgctgag 5760 atgacattcc cctatctggc cgagatccgc cgcagacagc ccaagggccc gtacaacttc 5820 ggtggatggt ctgcaggtgg tatttgcgcc tatgatgccg ctcgctacct aatccttgaa 5880 gagggcgaac aggttgaccg attgcttctt cttgactcgc ccttccccat tggcttagag 5940 aagttgccca ctcggctgta cggcttcatc aactcaatgg gtctctttgg tgaaggcaac 6000 aaggctcccc cggcctggtt gctccctcat ttcctggcct tcattgattc cctcgatacc 6060 tacaaggccg tccccctccc ctttgacgat ccgaagtggg ccaagaagat gcccaagaca 6120 ttcatggtct gggccaagga cggtatctgc agcaagccgg atgacccgtg gcccgagccg 6180 gacccggacg gcaagccgga cacgagagag atggtctggc tcctcaagaa ccggaccgac 6240 atgggaccca acaagtggga cacactcgtc gggccccaaa acgtcggtgg aatcactgtg 6300 atagagggtg cgaatcattt caccatgact ttgggaccca aggctaaaga attgggctcg 6360 ttcattggca acgccatggc caattaa 6387 <210>26 <211>2128 <212>PRT <213>黑曲霉(Aspergillus niger) <400>26 Met Glu Gly Pro Ser Arg Val Tyr Leu Phe Gly Asp Gln Thr Ser Asp 1 5 10 15 Ile Glu Ala Gly Leu Arg Arg Leu Leu Gln Ala Lys Asn Ser Thr Ile 20 25 30 Val Gln Ser Phe Phe Gln Gln Cys Phe His Ala Ile Arg Gln Glu Ile 35 40 45 Ala Lys Leu Pro Pro Ser His Arg Lys Leu Phe Pro Arg Phe Thr Ser 50 55 60 Ile Val Asp Leu Leu Ser Arg Ser Arg Glu Ser Gly Pro Ser Pro Val 65 70 75 80 Leu Glu Ser Ala Leu Thr Cys Ile Tyr Gln Leu Gly Cys Phe Ile His 85 90 95 Phe Tyr Gly Asp Leu Gly His Asp Tyr Pro Thr Pro Ser Asn Ser His 100 105 110 Leu Val Gly Leu Cys Thr Gly Val Leu Ser Cys Thr Ala Val Ser Cys 115 120 125 Ala Arg Asn Val Gly Glu Leu Ile Pro Ala Ala Val Glu Ser Val Val 130 135 140 Ile Ala Leu Arg Leu Gly Ile Cys Val Phe Arg Val Arg Glu Leu Val 145 150 155 160 Asp Ser Ala Asp Ser Glu Ser Thr Cys Trp Ser Ala Leu Val Ser Gly 165 170 175 Ile Ser Glu Ala Glu Ala Ser His Leu Ile Asp Glu Tyr Ser Ser Lys 180 185 190 Lys Ala Thr Pro Pro Ser Ser Lys Pro Tyr Ile Ser Ala Val Ser Ser 195 200 205 Asn Gly Val Thr Val Ser Ala Pro Pro Thr Val Leu Asp Glu Phe Val 210 215 220 Glu Thr Cys Ile Ser Lys Asn Tyr Lys Pro Val Lys Ala Pro Ile His 225 230 235 240 Gly Pro Tyr His Ala Pro His Leu Tyr Asp Asp Lys Asp Ile Asp Arg 245 250 255 Ile Leu Gln Gln Ser Ser Ala Leu Glu Gly Leu Thr Gly Cys Ser Pro 260 265 270 Val Ile Pro Ile Ile Ser Ser Asn Thr Gly Lys Pro Ile Lys Ala Lys 275 280 285 Ser Ile Lys Asp Leu Phe Lys Val Ala Leu Glu Glu Ile Leu Leu Arg 290 295 300 Arg Leu Cys Trp Asp Lys Val Thr Glu Ser Cys Thr Ser Val Cys Lys 305 310 315 320 Thr Gly Thr Asn His Ser Cys Lys Leu Phe Pro Ile Ser Ser Ser Ala 325 330 335 Thr Gln Ser Leu Phe Thr Val Leu Lys Lys Ala Gly Val Ser Ile Ser 340 345 350 Leu Glu Thr Gly Val Gly Glu Ile Ala Thr Asn Pro Glu Met Arg Asn 355 360 365 Leu Thr Gly Lys Ala Glu Asn Ser Lys Ile Ala Ile Ile Gly Met Ser 370 375 380 Gly Arg Phe Pro Asp Ser Asp Gly Thr Glu Ser Phe Trp Asn Leu Leu 385 390 395 400 Tyr Lys Gly Leu Asp Val His Arg Lys Val Pro Ala Asp Arg Trp Asp 405 410 415 Val Asp Ala His Val Asp Met Thr Gly Ser Lys Arg Asn Thr Ser Lys 420 425 430 Val Ala Tyr Gly Cys Trp Ile Asn Glu Pro Gly Leu Phe Asp Pro Arg 435 440 445 Phe Phe Asn Met Ser Pro Arg Glu Ala Leu Gln Ala Asp Pro Ala Gln 450 455 460 Arg Leu Ala Leu Leu Thr Ala Tyr Glu Ala Leu Glu Met Ala Gly Phe 465 470 475 480 Ile Pro Asp Ser Ser Pro Ser Thr Gln Arg Asp Arg Val Gly Ile Phe 485 490 495 Tyr Gly Met Thr Ser Asp Asp Tyr Arg Glu Ile Asn Ser Gly Gln Asp 500 505 510 Ile Asp Thr Tyr Phe Ile Pro Gly Gly Asn Arg Ala Phe Thr Pro Gly 515 520 525 Arg Ile Asn Tyr Tyr Phe Lys Phe Ser Gly Pro Ser Val Ser Val Asp 530 535 540 Thr Ala Cys Ser Ser Ser Leu Ala Ala Ile His Met Ala Cys Asn Ser 545 550 555 560 Ile Trp Arg Asn Asp Cys Asp Ala Ala Ile Thr Gly Gly Val Asn Ile 565 570 575 Leu Thr Asn Pro Asp Asn His Ala Gly Leu Asp Arg Gly His Phe Leu 580 585 590 Ser Thr Thr Gly Asn Cys Asn Thr Phe Asp Asp Gly Ala Asp Gly Tyr 595 600 605 Cys Arg Ala Asp Gly Val Gly Ser Ile Val Leu Lys Arg Leu Glu Asp 610 615 620 Ala Glu Ala Asp Asn Asp Pro Ile Leu Ala Val Ile Asn Gly Ala Tyr 625 630 635 640 Thr Asn His Ser Ala Glu Ala Val Ser Ile Thr Arg Pro His Val Gly 645 650 655 Ala Gln Ala Phe Ile Phe Asn Lys Leu Leu Asn Asp Ala Asn Ile Asp 660 665 670 Pro Lys Asp Val Ser Tyr Val Glu Met His Gly Thr Gly Thr Gln Ala 675 680 685 Gly Asp Ala Val Glu Met Gln Ser Val Leu Asp Val Phe Ala Pro Asp 690 695 700 Tyr Arg Arg Gly Pro Gly Gln Ser Leu His Ile Gly Ser Ala Lys Ala 705 710 715 720 Asn Ile Gly His Gly Glu Ser Ala Ser Gly Val Thr Ala Leu Val Lys 725 730 735 Val Leu Leu Met Met Arg Glu Asn Met Ile Pro Pro His Cys Gly Ile 740 745 750 Lys Thr Lys Ile Asn Ser Asn Phe Pro Thr Asp Leu Ala Lys Arg Asn 755 760 765 Val His Ile Ala Phe Gln Pro Thr Pro Trp Asn Arg Pro Ala Ser Gly 770 775 780 Lys Arg Arg Thr Phe Val Asn Asn Phe Ser Ala Ala Gly Gly Asn Thr 785 790 795 800 Ala Leu Leu Leu Glu Asp Ala Pro Ile Pro Glu Arg Gln Gly Gln Asp 805 810 815 Pro Arg Ser Phe His Leu Val Ser Val Ser Ala Arg Ser Gln Ser Ala 820 825 830 Leu Lys Asn Asn Val Glu Ala Leu Val Lys Tyr Ile Asp Ser Gln Gly 835 840 845 Lys Ser Phe Gly Val Lys Glu Thr Glu Phe Leu Pro Asn Leu Ala Tyr 850 855 860 Thr Thr Thr Ala Arg Arg Ile His His Pro Phe Arg Val Thr Ala Val 865 870 875 880 Gly Ala Asn Leu Gln Ser Leu Arg Asp Ser Leu His Gly Ala Leu His 885 890 895 Arg Glu Thr Tyr Thr Pro Val Pro Ser Thr Ala Pro Gly Ile Gly Phe 900 905 910 Val Phe Thr Gly Gln Gly Ala Gln Tyr Ser Gly Met Gly Lys Glu Leu 915 920 925 Tyr Arg Ser Cys Phe Gln Phe Arg Thr Thr Ile Glu His Phe Asp Cys 930 935 940 Ile Ala Arg Ser Gln Gly Leu Pro Ser Ile Leu Pro Leu Val Asp Gly 945 950 955 960 Ser Val Ala Val Glu Glu Leu Ser Pro Val Val Val Gln Val Gly Thr 965 970 975 Thr Cys Val Gln Met Ala Leu Val Asn Tyr Trp Thr Ala Leu Gly Val 980 985 990 Lys Pro Ala Phe Ile Ile Gly His Ser Leu Gly Asp Tyr Ala Ala Leu 995 1000 1005 Asn Thr Ala Gly Val Leu Ser Thr Ser Asp Thr Ile Tyr Leu Cys 1010 1015 1020 Gly Arg Arg Ala Gln Leu Leu Thr Lys Glu Cys Lys Ile Gly Thr 1025 1030 1035 His Ser Met Leu Ala Ile Lys Ala Ser Leu Ala Glu Val Lys His 1040 1045 1050 Phe Leu Arg Asp Glu Leu His Glu Val Ser Cys Val Asn Ala Pro 1055 1060 1065 Ala Glu Thr Val Val Ser Gly Leu Val Ala Asp Ile Asp Glu Leu 1070 1075 1080 Ala Gln Lys Cys Ser Thr Glu Gly Leu Lys Ser Thr Lys Leu Lys 1085 1090 1095 Val Pro Tyr Ala Phe His Ser Ser Gln Val Asp Pro Ile Leu Glu 1100 1105 1110 Ala Phe Glu Asp Ile Ala Gln Gly Val Thr Phe His Lys Pro Thr 1115 1120 1125 Thr Pro Phe Val Ser Ala Leu Phe Gly Glu Val Ile Thr Asp Ala 1130 1135 1140 Asn Trp Glu Cys Leu Gly Pro Lys Tyr Leu Arg Asp His Cys Arg 1145 1150 1155 Lys Thr Val Asn Phe Leu Gly Gly Val Glu Ala Thr Arg His Ala 1160 1165 1170 Lys Leu Thr Asn Asp Lys Thr Leu Trp Val Glu Ile Gly Ser His 1175 1180 1185 Thr Ile Cys Ser Gly Met Ile Lys Ala Thr Leu Gly Pro Gln Val 1190 1195 1200 Thr Thr Val Ala Ser Leu Arg Arg Glu Glu Asp Thr Trp Lys Val 1205 1210 1215 Leu Ser Asn Ser Leu Ala Ser Leu His Leu Ala Gly Ile Asp Ile 1220 1225 1230 Asn Trp Lys Gln Tyr His Gln Asp Phe Ser Ser Ser Leu Gln Val 1235 1240 1245 Leu Arg Leu Pro Ala Tyr Lys Trp Asp Leu Lys Asn Tyr Trp Ile 1250 1255 1260 Pro Tyr Thr Asn Asn Phe Cys Leu Ser Lys Gly Ala Pro Val Ala 1265 1270 1275 Thr Val Ala Ala Gly Pro Gln His Glu Tyr Leu Thr Thr Ala Ala 1280 1285 1290 Gln Lys Val Ile Glu Thr Arg Ser Asp Gly Ala Thr Ala Thr Val 1295 1300 1305 Val Ile Glu Asn Asp Ile Ala Asp Pro Glu Leu Asn Arg Val Ile 1310 1315 1320 Gln Gly His Lys Val Asn Gly Thr Ala Leu Cys Pro Ser Ser Leu 1325 1330 1335 Tyr Ala Asp Ile Ser Gln Thr Leu Ala Glu Tyr Leu Ile Lys Lys 1340 1345 1350 Tyr Lys Pro Glu Tyr Asp Gly Leu Gly Leu Asp Val Cys Glu Val 1355 1360 1365 Thr Val Pro Arg Pro Leu Ile Ala Lys Gly Gly Gln Gln Leu Phe 1370 1375 1380 Arg Val Ser Ala Thr Ala Asp Trp Ala Glu Lys Lys Thr Thr Leu 1385 1390 1395 Gln Ile Tyr Ser Val Thr Ala Glu Gly Lys Lys Thr Ala Asp His 1400 1405 1410 Ala Thr Cys Thr Val Arg Phe Phe Asp Cys Ala Ala Ala Glu Ala 1415 1420 1425 Glu Trp Lys Arg Val Ser Tyr Leu Val Lys Arg Ser Ile Asp Arg 1430 1435 1440 Leu His Asp Ile Ala Glu Asn Gly Asp Ala His Arg Leu Gly Arg 1445 1450 1455 Gly Met Val Tyr Lys Leu Phe Ala Ala Leu Val Asp Tyr Asp Asp 1460 1465 1470 Asn Phe Lys Ser Ile Arg Glu Val Ile Leu Asp Ser Glu Gln His 1475 1480 1485 Glu Ala Thr Ala Arg Val Lys Phe Gln Ala Pro Gln Gly Asn Phe 1490 1495 1500 His Arg Asn Pro Phe Trp Ile Asp Ser Phe Gly His Leu Ser Gly 1505 1510 1515 Phe Ile Met Asn Ala Ser Asp Ala Thr Asp Ser Lys Asn Gln Val 1520 1525 1530 Phe Val Asn His Gly Trp Asp Ser Met Arg Cys Leu Lys Lys Phe 1535 1540 1545 Ser Pro Asp Val Thr Tyr Arg Thr Tyr Val Arg Met Gln Pro Trp 1550 1555 1560 Lys Asp Ser Ile Trp Ala Gly Asp Val Tyr Val Phe Asp Gly Asp 1565 1570 1575 Asp Ile Val Ala Val Tyr Gly Ala Val Lys Phe Gln Ala Leu Ser 1580 1585 1590 Arg Lys Ile Leu Asp Thr Val Leu Pro Pro Ser Arg Ala Ser Ala 1595 1600 1605 Pro Ala Pro Ala Lys Pro Ala Ala Lys Pro Ser Ala Pro Ser Leu 1610 1615 1620 Val Lys Arg Ala Leu Thr Ile Leu Ala Glu Glu Val Gly Leu Ser 1625 1630 1635 Glu Ser Glu Ile Thr Asp Asp Leu Val Phe Ala Asp Tyr Gly Val 1640 1645 1650 Asp Ser Leu Leu Ser Leu Thr Val Thr Gly Arg Tyr Arg Glu Glu 1655 1660 1665 Leu Asp Ile Asp Leu Glu Ser Ser Ile Phe Ile Asp Gln Pro Thr 1670 1675 1680 Val Lys Asp Phe Lys Gln Phe Leu Ala Pro Met Ser Gln Gly Glu 1685 1690 1695 Ala Ser Asp Gly Ser Thr Ser Asp Pro Glu Ser Ser Ser Ser Phe 1700 1705 1710 Asn Gly Gly Ser Ser Thr Asp Glu Ser Ser Ala Gly Ser Pro Val 1715 1720 1725 Ser Ser Pro Pro Asn Glu Lys Val Thr Gln Val Glu Gln His Ala 1730 1735 1740 Thr Ile Lys Glu Ile Arg Ala Ile Leu Ala Asp Glu Ile Gly Val 1745 1750 1755 Thr Glu Glu Glu Leu Lys Asp Asp Glu Asn Leu Gly Glu Met Gly 1760 1765 1770 Met Asp Ser Leu Leu Ser Leu Thr Val Leu Gly Arg Ile Arg Glu 1775 1780 1785 Thr Leu Asp Leu Asp Leu Pro Gly Glu Phe Phe Ile Glu Asn Gln 1790 1795 1800 Thr Leu Asn Asp Val Glu Asp Ala Leu Gly Leu Lys Pro Lys Ala 1805 1810 1815 Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro Val Pro Ala Pro Val 1820 1825 1830 Ser Ala Pro Ile Leu Lys Glu Pro Val Pro Asn Ala Asn Ser Thr 1835 1840 1845 Ile Met Ala Arg Ala Ser Pro His Pro Arg Ser Thr Ser Ile Leu 1850 1855 1860 Leu Gln Gly Asn Pro Lys Thr Ala Thr Lys Thr Leu Phe Leu Phe 1865 1870 1875 Pro Asp Gly Ser Gly Ser Ala Thr Ser Tyr Ala Thr Ile Pro Gly 1880 1885 1890 Val Ser Pro Asp Val Cys Val Tyr Gly Leu Asn Cys Pro Tyr Met 1895 1900 1905 Lys Thr Pro Glu Lys Leu Lys Tyr Pro Leu Ala Glu Met Thr Phe 1910 1915 1920 Pro Tyr Leu Ala Glu Ile Arg Arg Arg Gln Pro Lys Gly Pro Tyr 1925 1930 1935 Asn Phe Gly Gly Trp Ser Ala Gly Gly Ile Cys Ala Tyr Asp Ala 1940 1945 1950 Ala Arg Tyr Leu Ile Leu Glu Glu Gly Glu Gln Val Asp Arg Leu 1955 1960 1965 Leu Leu Leu Asp Ser Pro Phe Pro Ile Gly Leu Glu Lys Leu Pro 1970 1975 1980 Thr Arg Leu Tyr Gly Phe Ile Asn Ser Met Gly Leu Phe Gly Glu 1985 1990 1995 Gly Asn Lys Ala Pro Pro Ala Trp Leu Leu Pro His Phe Leu Ala 2000 2005 2010 Phe Ile Asp Ser Leu Asp Thr Tyr Lys Ala Val Pro Leu Pro Phe 2015 2020 2025 Asp Asp Pro Lys Trp Ala Lys Lys Met Pro Lys Thr Phe Met Val 2030 2035 2040 Trp Ala Lys Asp Gly Ile Cys Ser Lys Pro Asp Asp Pro Trp Pro 2045 2050 2055 Glu Pro Asp Pro Asp Gly Lys Pro Asp Thr Arg Glu Met Val Trp 2060 2065 2070 Leu Leu Lys Asn Arg Thr Asp Met Gly Pro Asn Lys Trp Asp Thr 2075 2080 2085 Leu Val Gly Pro Gln Asn Val Gly Gly Ile Thr Val Ile Glu Gly 2090 2095 2100 Ala Asn His Phe Thr Met Thr Leu Gly Pro Lys Ala Lys Glu Leu 2105 2110 2115 Gly Ser Phe Ile Gly Asn Ala Met Ala Asn 2120 2125 <210>27 <211>502 <212>DNA <213>黑曲霉(Aspergillus niger) <400>27 tcagcgcggt aagctctaat ggcgttactg tcagcgcacc acctacggta cttgatgaat 60 tcgtcgagac ctgcatttcc aagaattaca agccagtgaa ggcccctatt catggcccgt 120 accatgcgcc acatctgtat gatgataagg atatcgaccg catcctgcag cagtcctctg 180 ctctagaagg actgaccggc tgttcacccg ttattcccat catctccagt aacactggaa 240 agccgatcaa ggccaagtcc atcaaagatc tcttcaaggt cgcactggag gagatactcc 300 tacgacgact atgctgggac aaggtcacgg agtcctgcac atcagtctgc aagaccggca 360 caaaccactc ttgcaaattg tttccgatct cgagtagcgc cactcaaagt ttgttcacag 420 tcctcaagaa ggccggtgtg agcatcagct tggagactgg ggtaggagag atcgcgacga 480 acccagaaat gcggaacctt ac 502 <210>28 <211>166 <212>PRT <213>黑曲霉(Aspergillus niger) <400>28 Ser Ala Val Ser Ser Asn Gly Val Thr Val Ser Ala Pro Pro Thr Val 1 5 10 15 Leu Asp Glu Phe Val Glu Thr Cys Ile Ser Lys Asn Tyr Lys Pro Val 20 25 30 Lys Ala Pro Ile His Gly Pro Tyr His Ala Pro His Leu Tyr Asp Asp 35 40 45 Lys Asp Ile Asp Arg Ile Leu Gln Gln Ser Ser Ala Leu Glu Gly Leu 50 55 60 Thr Gly Cys Ser Pro Val Ile Pro Ile Ile Ser Ser Asn Thr Gly Lys 65 70 75 80 Pro Ile Lys Ala Lys Ser Ile Lys Asp Leu Phe Lys Val Ala Leu Glu 85 90 95 Glu Ile Leu Leu Arg Arg Leu Cys Trp Asp Lys Val Thr Glu Ser Cys 100 105 110 Thr Ser Val Cys Lys Thr Gly Thr Asn His Ser Cys Lys Leu Phe Pro 115 120 125 Ile Ser Ser Ser Ala Thr Gln Ser Leu Phe Thr Val Leu Lys Lys Ala 130 135 140 Gly Val Ser Ile Ser Leu Glu Thr Gly Val Gly Glu Ile Ala Thr Asn 145 150 155 160 Pro Glu Met Arg Asn Leu 165 <210>29 <211>30 <212>DNA <213>黑曲霉(Aspergillus niger) <400>29 ggggccatgg tcagcgcggt aagctctaat 30 <210>30 <211>32 <212>DNA <213>黑曲霉(Aspergillus niger) <400>30 gggggcggcc gcgtaaggtt ccgcatttct gg 32 <210>31 <211>20 <212>DNA <213>黑曲霉(Aspergillus niger) <400>31 tcgtgaatca ggtcctagcc 20 <210>32 <211>22 <212>DNA <213>黑曲霉(Aspergillus niger) <400>32 aaacaaccca attggtagat gc 22 <210>33 <211>21 <212>DNA <213>黑曲霉(Aspergillus niger) <400>33 atctgtacgg caacattgtc a 21 <210>34 <211>20 <212>DNA <213>黑曲霉(Aspergillus niger) <400>34 ttctgcatac ggtcggagat 20 <210>35 <211>30 <212>DNA <213>黑曲霉(Aspergillus niger) <400>35 ttaattaatc ggtcaatcgc cgttgtcaga 30 <210>36 <211>24 <212>DNA <213>黑曲霉(Aspergillus niger) <400>36 aatttccaaa cagggtaact ccac 24 <210>37 <211>2564 <212>DNA <213>里氏木霉(Trichoderma reesei) <400>37 ggacagccgg acgcaatggt gaataacgca gctcttctcg ccgccctgtc ggctctcctg 60 cccacggccc tggcgcagaa caatcaaaca tacgccaact actctgctca gggccagcct 120 gatctctacc ccgagacact tgccacgctc acactctcgt tccccgactg cgaacatggc 180 cccctcaaga acaatctcgt ctgtgactca tcggccggct atgtagagcg agcccaggcc 240 ctcatctcgc tcttcaccct cgaggagctc attctcaaca cgcaaaactc gggccccggc 300 gtgcctcgcc tgggtcttcc gaactaccaa gtctggaatg aggctctgca cggcttggac 360 cgcgccaact tcgccaccaa gggcggccag ttcgaatggg cgacctcgtt ccccatgccc 420 atcctcacta cggcggccct caaccgcaca ttgatccacc agattgccga catcatctcg 480 acccaagctc gagcattcag caacagcggc cgttacggtc tcgacgtcta tgcgccaaac 540 gtcaatggct tccgaagccc cctctggggc cgtggccagg agacgcccgg cgaagacgcc 600 tttttcctca gctccgccta tacttacgag tacatcacgg gcatccaggg tggcgtcgac 660 cctgagcacc tcaaggttgc cgccacggtg aagcactttg ccggatacga cctcgagaac 720 tggaacaacc agtcccgtct cggtttcgac gccatcataa ctcagcagga cctctccgaa 780 tactacactc cccagttcct cgctgcggcc cgttatgcaa agtcacgcag cttgatgtgc 840 gcatacaact ccgtcaacgg cgtgcccagc tgtgccaaca gcttcttcct gcagacgctt 900 ttgcgcgaga gctggggctt ccccgaatgg ggatacgtct cgtccgattg cgatgccgtc 960 tacaacgttt tcaaccctca tgactacgcc agcaaccagt cgtcagccgc cgccagctca 1020 ctgcgagccg gcaccgatat cgactgcggt cagacttacc cgtggcacct caacgagtcc 1080 tttgtggccg gcgaagtctc ccgcggcgag atcgagcggt ccgtcacccg tctgtacgcc 1140 aacctcgtcc gtctcggata cttcgacaag aagaaccagt accgctcgct cggttggaag 1200 gatgtcgtca agactgatgc ctggaacatc tcgtacgagg ctgctgttga gggcatcgtc 1260 ctgctcaaga acgatggcac tctccctctg tccaagaagg tgcgcagcat tgctctgatc 1320 ggaccatggg ccaatgccac aacccaaatg caaggcaact actatggccc tgccccatac 1380 ctcatcagcc ctctggaagc tgctaagaag gccggctatc acgtcaactt tgaactcggc 1440 acagagatcg ccggcaacag caccactggc tttgccaagg ccattgctgc cgccaagaag 1500 tcggatgcca tcatctacct cggtggaatt gacaacacca ttgaacagga gggcgctgac 1560 cgcacggaca ttgcttggcc cggtaatcag ctggatctca tcaagcagct cagcgaggtc 1620 ggcaaacccc ttgtcgtcct gcaaatgggc ggtggtcagg tagactcatc ctcgctcaag 1680 agcaacaaga aggtcaactc cctcgtctgg ggcggatatc ccggccagtc gggaggcgtt 1740 gccctcttcg acattctctc tggcaagcgt gctcctgccg gccgactggt caccactcag 1800 tacccggctg agtatgttca ccaattcccc cagaatgaca tgaacctccg acccgatgga 1860 aagtcaaacc ctggacagac ttacatctgg tacaccggca aacccgtcta cgagtttggc 1920 agtggtctct tctacaccac cttcaaggag actctcgcca gccaccccaa gagcctcaag 1980 ttcaacacct catcgatcct ctctgctcct caccccggat acacttacag cgagcagatt 2040 cccgtcttca ccttcgaggc caacatcaag aactcgggca agacggagtc cccatatacg 2100 gccatgctgt ttgttcgcac aagcaacgct ggcccagccc cgtacccgaa caagtggctc 2160 gtcggattcg accgacttgc cgacatcaag cctggtcact cttccaagct cagcatcccc 2220 atccctgtca gtgctctcgc ccgtgttgat tctcacggaa accggattgt ataccccggc 2280 aagtatgagc tagccttgaa caccgacgag tctgtgaagc ttgagtttga gttggtggga 2340 gaagaggtaa cgattgagaa ctggccgttg gaggagcaac agatcaagga tgctacacct 2400 gacgcataag ggttttaatg atgttgttat gacaaacggg tagagtagtt aatgatggaa 2460 taggaagagg ccatagtttt ctgtttgcaa accatttttg ccattgcgaa aaaaaaaaaa 2520 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaa 2564 <210>38 <211>797 <212>PRT <213>里氏木霉(Trichoderma reesei) <400>38 Met Val Asn Asn Ala Ala Leu Leu Ala Ala Leu Ser Ala Leu Leu Pro 1 5 10 15 Thr Ala Leu Ala Gln Asn Asn Gln Thr Tyr Ala Asn Tyr Ser Ala Gln 20 25 30 Gly Gln Pro Asp Leu Tyr Pro Glu Thr Leu Ala Thr Leu Thr Leu Ser 35 40 45 Phe Pro Asp Cys Glu His Gly Pro Leu Lys Asn Asn Leu Val Cys Asp 50 55 60 Ser Ser Ala Gly Tyr Val Glu Arg Ala Gln Ala Leu Ile Ser Leu Phe 65 70 75 80 Thr Leu Glu Glu Leu Ile Leu Asn Thr Gln Asn Ser Gly Pro Gly Val 85 90 95 Pro Arg Leu Gly Leu Pro Asn Tyr Gln Val Trp Asn Glu Ala Leu His 100 105 110 Gly Leu Asp Arg Ala Asn Phe Ala Thr Lys Gly Gly Gln Phe Glu Trp 115 120 125 Ala Thr Ser Phe Pro Met Pro Ile Leu Thr Thr Ala Ala Leu Asn Arg 130 135 140 Thr Leu Ile His Gln Ile Ala Asp Ile Ile Ser Thr Gln Ala Arg Ala 145 150 155 160 Phe Ser Asn Ser Gly Arg Tyr Gly Leu Asp Val Tyr Ala Pro Asn Val 165 170 175 Asn Gly Phe Arg Ser Pro Leu Trp Gly Arg Gly Gln Glu Thr Pro Gly 180 185 190 Glu Asp Ala Phe Phe Leu Ser Ser Ala Tyr Thr Tyr Glu Tyr Ile Thr 195 200 205 Gly Ile Gln Gly Gly Val Asp Pro Glu His Leu Lys Val Ala Ala Thr 210 215 220 Val Lys His Phe Ala Gly Tyr Asp Leu Glu Asn Trp Asn Asn Gln Ser 225 230 235 240 Arg Leu Gly Phe Asp Ala Ile Ile Thr Gln Gln Asp Leu Ser Glu Tyr 245 250 255 Tyr Thr Pro Gln Phe Leu Ala Ala Ala Arg Tyr Ala Lys Ser Arg Ser 260 265 270 Leu Met Cys Ala Tyr Asn Ser Val Asn Gly Val Pro Ser Cys Ala Asn 275 280 285 Ser Phe Phe Leu Gln Thr Leu Leu Arg Glu Ser Trp Gly Phe Pro Glu 290 295 300 Trp Gly Tyr Val Ser Ser Asp Cys Asp Ala Val Tyr Asn Val Phe Asn 305 310 315 320 Pro His Asp Tyr Ala Ser Asn Gln Ser Ser Ala Ala Ala Ser Ser Leu 325 330 335 Arg Ala Gly Thr Asp Ile Asp Cys Gly Gln Thr Tyr Pro Trp His Leu 340 345 350 Asn Glu Ser Phe Val Ala Gly Glu Val Ser Arg Gly Glu Ile Glu Arg 355 360 365 Ser Val Thr Arg Leu Tyr Ala Asn Leu Val Arg Leu Gly Tyr Phe Asp 370 375 380 Lys Lys Asn Gln Tyr Arg Ser Leu Gly Trp Lys Asp Val Val Lys Thr 385 390 395 400 Asp Ala Trp Asn Ile Ser Tyr Glu Ala Ala Val Glu Gly Ile Val Leu 405 410 415 Leu Lys Asn Asp Gly Thr Leu Pro Leu Ser Lys Lys Val Arg Ser Ile 420 425 430 Ala Leu Ile Gly Pro Trp Ala Asn Ala Thr Thr Gln Met Gln Gly Asn 435 440 445 Tyr Tyr Gly Pro Ala Pro Tyr Leu Ile Ser Pro Leu Glu Ala Ala Lys 450 455 460 Lys Ala Gly Tyr His Val Asn Phe Glu Leu Gly Thr Glu Ile Ala Gly 465 470 475 480 Asn Ser Thr Thr Gly Phe Ala Lys Ala Ile Ala Ala Ala Lys Lys Ser 485 490 495 Asp Ala Ile Ile Tyr Leu Gly Gly Ile Asp Asn Thr Ile Glu Gln Glu 500 505 510 Gly Ala Asp Arg Thr Asp Ile Ala Trp Pro Gly Asn Gln Leu Asp Leu 515 520 525 Ile Lys Gln Leu Ser Glu Val Gly Lys Pro Leu Val Val Leu Gln Met 530 535 540 Gly Gly Gly Gln Val Asp Ser Ser Ser Leu Lys Ser Asn Lys Lys Val 545 550 555 560 Asn Ser Leu Val Trp Gly Gly Tyr Pro Gly Gln Ser Gly Gly Val Ala 565 570 575 Leu Phe Asp Ile Leu Ser Gly Lys Arg Ala Pro Ala Gly Arg Leu Val 580 585 590 Thr Thr Gln Tyr Pro Ala Glu Tyr Val His Gln Phe Pro Gln Asn Asp 595 600 605 Met Asn Leu Arg Pro Asp Gly Lys Ser Asn Pro Gly Gln Thr Tyr Ile 610 615 620 Trp Tyr Thr Gly Lys Pro Val Tyr Glu Phe Gly Ser Gly Leu Phe Tyr 625 630 635 640 Thr Thr Phe Lys Glu Thr Leu Ala Ser His Pro Lys Ser Leu Lys Phe 645 650 655 Asn Thr Ser Ser Ile Leu Ser Ala Pro His Pro Gly Tyr Thr Tyr Ser 660 665 670 Glu Gln Ile Pro Val Phe Thr Phe Glu Ala Asn Ile Lys Asn Ser Gly 675 680 685 Lys Thr Glu Ser Pro Tyr Thr Ala Met Leu Phe Val Arg Thr Ser Asn 690 695 700 Ala Gly Pro Ala Pro Tyr Pro Asn Lys Trp Leu Val Gly Phe Asp Arg 705 710 715 720 Leu Ala Asp Ile Lys Pro Gly His Ser Ser Lys Leu Ser Ile Pro Ile 725 730 735 Pro Val Ser Ala Leu Ala Arg Val Asp Ser His Gly Asn Arg Ile Val 740 745 750 Tyr Pro Gly Lys Tyr Glu Leu Ala Leu Asn Thr Asp Glu Ser Val Lys 755 760 765 Leu Glu Phe Glu Leu Val Gly Glu Glu Val Thr Ile Glu Asn Trp Pro 770 775 780 Leu Glu Glu Gln Gln Ile Lys Asp Ala Thr Pro Asp Ala 785 790 795 <210>39 <211>500 <212>DNA <213>里氏木霉(Trichoderma reesei) <400>39 acgagtttgg cagtggtctc ttctacacca ccttcaagga gactctcgcc agccacccca 60 agagcctcaa gttcaacacc tcatcgatcc tctctgctcc tcaccccgga tacacttaca 120 gcgagcagat tcccgtcttc accttcgagg ccaacatcaa gaactcgggc aagacggagt 180 ccccatatac ggccatgctg tttgttcgca caagcaacgc tggcccagcc ccgtacccga 240 acaagtggct cgtcggattc gaccgacttg ccgacatcaa gcctggtcac tcttccaagc 300 tcagcatccc catccctgtc agtgctctcg cccgtgttga ttctcacgga aaccggattg 360 tataccccgg caagtatgag ctagccttga acaccgacga gtctgtgaag cttgagtttg 420 agttggtggg agaagaggta acgattgaga actggccgtt ggaggagcaa cagatcaagg 480 atgctacacc tgacgcataa 500 <210>40 <211>166 <212>PRT <213>里氏木霉(Trichoderma reesei) <400>40 Tyr Glu Phe Gly Ser Gly Leu Phe Tyr Thr Thr Phe Lys Glu Thr Leu 1 5 10 15 Ala Ser His Pro Lys Ser Leu Lys Phe Asn Thr Ser Ser Ile Leu Ser 20 25 30 Ala Pro His Pro Gly Tyr Thr Tyr Ser Glu Gln Ile Pro Val Phe Thr 35 40 45 Phe Glu Ala Asn Ile Lys Asn Ser Gly Lys Thr Glu Ser Pro Tyr Thr 50 55 60 Ala Met Leu Phe Val Arg Thr Ser Asn Ala Gly Pro Ala Pro Tyr Pro 65 70 75 80 Asn Lys Trp Leu Val Gly Phe Asp Arg Leu Ala Asp Ile Lys Pro Gly 85 90 95 His Ser Ser Lys Leu Ser Ile Pro Ile Pro Val Ser Ala Leu Ala Arg 100 105 110 Val Asp Ser His Gly Asn Arg Ile Val Tyr Pro Gly Lys Tyr Glu Leu 115 120 125 Ala Leu Asn Thr Asp Glu Ser Val Lys Leu Glu Phe Glu Leu Val Gly 130 135 140 Glu Glu Val Thr Ile Glu Asn Trp Pro Leu Glu Glu Gln Gln Ile Lys 145 150 155 160 Asp Ala Thr Pro Asp Ala 165 <210>41 <211>26 <212>DNA <213>里氏木霉(Trichoderma reesei) <400>41 ccatggtacg agtttggcag tggtct 26 <210>42 <211>26 <212>DNA <213>里氏木霉(Trichoderma reesei) <400>42 acgcgtttat gcgtcaggtg tagcat 26 |