通过移行RNA干扰来降低或消除丝状真菌菌株中的基因表达的方法

申请号 CN200780051262.9 申请日 2007-12-20 公开(公告)号 CN101652479A 公开(公告)日 2010-02-17
申请人 诺维信股份有限公司; 发明人 霍华德·布罗迪; 唐娜·莫耶; 阿曼达·费希尔;
摘要 本 发明 涉及通过移行RNA干扰来降低或消除丝状 真菌 菌株中的靶基因表达的方法。
权利要求

1.用于降低或消除丝状真菌菌株中编码生物学物质的靶基因的表达的 方法,其包括:
(a)向丝状真菌菌株的基因组中插入双链可转录核酸构建体,该构建体 包含与第一多核苷酸和第二多核苷酸可操作相连接的启动子,所述第一多核 苷酸包含与编码所述生物学物质的靶基因具有同源性的第一可转录区,所述 第二多核苷酸包含与靶基因没有有效同源性的第二可转录区,其中所述第二 可转录区包含两个彼此反向互补的区段且所述第一和第二可转录区被转录 成单一mRNA分子;和
(b)通过在如下条件下培养所述丝状真菌菌株来诱导包含要通过移行 RNAi的方法沉默的靶基因的序列的短干扰RNA(siRNA)的生成,所述条件容 许生成所述双链可转录核酸构建体的RNA转录物,其然后被转变成与靶基因 的RNA转录物相互作用的siRNA,以降低或消除编码所述生物学物质的靶基 因的表达。
2.权利要求1的方法,其中所述与靶基因具有同源性的第一可转录区包 含靶基因的至少19个核苷酸。
3.权利要求1的方法,其中所述与靶基因没有有效同源性的第二可转录 区包含至少19个核苷酸。
4.权利要求1的方法,其中所述第一和第二多核苷酸由间插序列分隔开。
5.权利要求1的方法,其中所述两个彼此反向互补的区段由连接序列分 隔开。
6.权利要求1的方法,其中靶基因的表达降低了至少20%、优选至少 30%、更优选至少40%、更优选至少50%、更优选至少60%、更优选至少70%、 甚至更优选至少80%、最优选至少90%、和甚至最优选100%。
7.权利要求1的方法,其中所述短干扰RNA与靶基因的一个或多个同系 物的RNA转录物相互作用以降低或消除靶基因的一个或多个同系物的表达。
8.权利要求7的方法,其中靶基因的一个或多个同系物的表达降低了至 少20%、优选至少30%、更优选至少40%、更优选至少50%、更优选至少60%、 更优选至少70%、甚至更优选至少80%、最优选至少90%、和甚至最优选 100%。
9.包含双链可转录核酸构建体的丝状真菌菌株,该构建体包含与第一多核 苷酸和第二多核苷酸可操作相连接的启动子,所述第一多核苷酸包含与编码生 物学物质的靶基因具有同源性的第一可转录区,所述第二多核苷酸包含与靶基 因没有有效同源性的第二可转录区,其中所述第二可转录区包含两个彼此反向 互补的区段且其中所述第一和第二可转录区被转录成单一mRNA分子,其中通 过在如下条件下培养所述丝状真菌菌株来诱导包含要通过移行RNAi的方法沉 默的靶基因的序列的短干扰RNA(siRNA)的生成,所述条件容许生成双链可转 录核酸构建体的RNA转录物,其然后被转变成与靶基因的RNA转录物相互作用 的siRNA,以降低或消除编码生物学物质的靶基因的表达。
10.权利要求9的丝状真菌菌株,其中所述第一同源区包含靶基因的至少 19个核苷酸。
11.权利要求9的丝状真菌菌株,其中所述与靶基因没有有效同源性的第 二可转录区包含至少19个核苷酸。
12.权利要求9的丝状真菌菌株,其中所述第一和第二多核苷酸由间插序 列分隔开。
13.权利要求12的丝状真菌菌株,其中所述两个彼此反向互补的区段由 连接序列分隔开。
14.权利要求12的丝状真菌菌株,其中靶基因的表达降低了至少20%、 优选至少30%、更优选至少40%、更优选至少50%、更优选至少60%、更优 选至少70%、甚至更优选至少80%、最优选至少90%、和甚至最优选100%。
15.权利要求12的丝状真菌菌株,其中所述短干扰RNA与靶基因的一个 或多个同系物的RNA转录物相互作用以降低或消除靶基因的一个或多个同 系物的表达。
16.权利要求15的丝状真菌菌株,其中靶基因的一个或多个同系物的表 达降低了至少20%、优选至少30%、更优选至少40%、更优选至少50%、更 优选至少60%、更优选至少70%、甚至更优选至少80%、最优选至少90%、 和甚至最优选100%。
17.用于生成生物学物质的方法,其包括:
(a)在有益于生成感兴趣的生物学物质的条件下培养丝状真菌菌株,其 中该丝状真菌菌株包含双链可转录核酸构建体,该构建体包含与第一多核苷 酸和第二多核苷酸可操作相连接的启动子,所述第一多核苷酸包含与编码不 想要的生物学物质的靶基因具有同源性的第一可转录区,所述第二多核苷酸 包含与靶基因没有有效同源性的第二可转录区,其中所述第二可转录区包含 两个彼此反向互补的区段且其中所述第一和第二可转录区被转录成单一 mRNA分子,其中通过在如下条件下培养丝状真菌菌株来生成双链可转录的 核酸构建体的RNA转录物,所述条件容许生成所述RNA转录物,然后其被转 变成包含要通过移行RNAi的方法沉默的靶基因的序列的短干扰RNA (siRNA),其与靶基因的RNA转录物相互作用以降低或消除编码不想要的生 物学物质的靶基因的表达;且其中所述丝状真菌菌株包含编码所述感兴趣的 生物学物质的第三多核苷酸;和
(b)自培养基回收所述感兴趣的生物学物质。
18.权利要求19的方法,其中所述与靶基因具有同源性的第一可转录区 包含靶基因的至少19个核苷酸。
19.权利要求19的方法,其中所述与靶基因没有有效同源性的第二可转 录区包含至少19个核苷酸。
20.权利要求19的方法,其中所述第一和第二多核苷酸由间插序列分隔 开。
21.权利要求19的方法,其中所述两个彼此反向互补的区段由连接序列 分隔开。
22.权利要求19的方法,其中靶基因的表达降低了至少20%、优选至少 30%、更优选至少40%、更优选至少50%、更优选至少60%、更优选至少70%、 甚至更优选至少80%、最优选至少90%、和甚至最优选100%。
23.权利要求19的方法,其中所述干扰RNA与靶基因的一个或多个同系 物的RNA转录物相互作用以降低或消除靶基因的一个或多个同系物的表达。
24.权利要求23的方法,其中靶基因的一个或多个同系物的表达降低了 至少20%、优选至少30%、更优选至少40%、更优选至少50%、更优选至少 60%、更优选至少70%、甚至更优选至少80%、最优选至少90%、和甚至最 优选100%。

说明书全文

序列表的提述

申请含有计算机可读形式的序列表。通过提述,将该计算机可读形式 收入本文。

发明领域

本发明涉及降低或消除丝状真菌菌株中的基因表达的方法。

发明背景

丝状真菌菌株被广泛用于具有商业价值的生物学物质的生产。然而,具 有生物学物质表达和分泌增加的期望性状的丝状真菌菌株可能未必具有成 功发酵最期望的特性。生物学物质的生成可以伴有降解该生物学物质或与该 生物学物质共纯化的其它物质(例如酶)的生成,这能使生物学物质的回收和 纯化变得复杂。
这些问题的一个解决方案是灭活非期望物质的生成中所牵涉的基因。灭 活可通过使用本领域公知方法删除或破坏基因来实现。然而,在有些情况中, 由于对基因组同源区的靶向差,基因的灭活可能是困难的。灭活也可通过随 机诱变来实现,随机诱变并非总是对预定靶基因特异性的,而且常常将其它 突变引入宿主生物体中。在其它情形中,基因及其产物可能是丝状真菌菌株 的存活所要求的。在要通过删除或破坏来灭活多种基因的情况中,任务会是 非常麻烦且费时的。在存在基因家族的高度同源成员的情况中,删除或破坏 所有成员会是极端冗长且困难的。
近年来,记载了多种形式的外成性(epigenetic)基因调节(Selker,1997, Trends Genet.13:296-301;Matzke和Matzke,1998,Cell.Mol.Life.Sci.54: 94-103)。这些过程经由微RNA(Morel等,2000,Curr.Biol.10:1591-1594; Bailis和Forsburg,2002,Genome Biol.3,综述1035;Grewal和Moazed,2003, Science 301:798-802)通过调控信使RNA平来影响基因表达(Hammond和 Baulcombe,1996,Plant Mol.Biol.32:79-88;Xi-song Ke等,2003,Current Opinion in Chemical Biology 7:516-523)。
基于果蝇(Drosophila)和秀丽线虫(Caenorhabditis elegans)的遗传研究, RNA干扰(RNAi),也称作转录后基因沉默(在植物中),理解为牵涉通过装配 将同源RNA靶向降解的蛋白质-RNA效应器核酸酶复合物来使基因表达沉默 (Hannon,2002,Nature 418:244-251)。将双链RNA(dsRNA)加工成小干扰 RNA(siRNA)通过称作Dicer的酶家族来实现(Bernstein等,2001,Nature 409: 363)。Dicer,特异性切割dsRNA的内切核酸酶的RNA酶III家族的成员,负责 将dsRNA消化成范围为20-25个核苷酸的siRNA(Elbashir等,2001,Nature 411:494)。然后,这些siRNA与RNA诱导的沉默复合物(RISC)结合(Elbashir 等,2001,Genes and Dev.15:188;NyKanen等,2001,Cell 197:300;Hammond 等,2001,Science 293:1146)。虽然没有完全理解,RISC靶向衍生反义片 段的mRNA,接着是对mRNA的内切和外切核酸酶消化,高效地使该基因的 表达沉默。已经在植物、线虫、昆虫、哺乳动物、和丝状真菌中证明了RNAi (Matzke和Matzke,1998,见上文;Kennerdell等,2000,Nat.Biotechnol.18: 896-8;Bosher等,1999,Genetics 153:1245-56;Voorhoeve和Agami,2003, Trends Biotechnol.21:2-4;McCaffrey等,2003,Nat.Biotechnol.21:639-44; WO 03/050288;WO 01/49844;WO 98/53083;和WO 05/056772)。
移行RNAi(transitive RNAi),也称作铺展(spreading),指沉默信号在特定 基因之外(beyond)移动。在植物中,已经发现移行沉默存在于双链RNA的基 因沉默所靶向的mRNA的上游和下游二者(Fabian等,2002,Plant Cell 14: 857-867;Garcia-Perez等,2004,The Plant Journal 38:594-602;Vaistij等, 2002,The Plant Cell 14:857-867;Van Houdt等,2003,Plant Physiol.131: 245-253)。在秀丽线虫中,已经将移行RNAi描述为靶dsRNA上游的转录物的 沉默(Alder等,2003,RNA J.9:25-32;Hannon,2002,Nature 418:244-251; Sijen等,2001,Cell 107:465-476)。在秀丽线虫中,移行RNAi的描述指示 了在衍生自dsRNA靶的siRNA之外,生成了与5’侧翼序列共享同源性的第二 siRNA,推测是RNA依赖性RNA聚合酶(RdRP)和Dicer活性的结果(Bleys等, 2006,RNA J.12:1633-1639;Petersen等,2005,Plant Molecular Biology 58: 575-583)。移行RNAi在昆虫和哺乳动物中不是普遍存在的(Chi等,2003,Proc. Natl.Acad.Sci.USA 100:6343-6346;Hoa等,2003,Insect Biochemistry and Molecular Biology 33:949-957;Roignamt等,2003,RNA J.9:299-308)。
移行RNAi与常规RNAi在数个方面不同。虽然双链RNA充当RNAi和移行 RNAi二者的诱导物,但是移行RNAi表现出需要RdRP,而单独的RNAi则不 然。因此,在展现移行RNAi的生物体中,基因沉默不受双链RNA的边界的 限制,而且基因沉默能延伸入侧翼序列。然而,在缺乏移行RNAi的生物体 中,基因沉默局限在双链区域内。
为了丝状真菌菌株的菌株开发和改善、功能基因组学、和途径工程,本 领域具有降低或消除一个或多个基因的表达的备选方法会是有利的。
本发明涉及降低或消除丝状真菌菌株中的一个或多个基因的表达的方法。
发明概述
本发明涉及降低或消除丝状真菌菌株中编码生物学物质的靶基因的表 达的方法,其包括:
(a)向丝状真菌菌株的基因组中插入双链可转录核酸构建体,该构建体 包含与第一多核苷酸和第二多核苷酸可操作相连接的启动子,所述第一多核 苷酸包含与编码所述生物学物质的靶基因具有同源性的第一可转录区,所述 第二多核苷酸包含与靶基因没有有效同源性的第二可转录区,其中所述第二 可转录区包含两个彼此反向互补的区段且所述第一和第二可转录区被转录 成单一mRNA分子;和
(b)通过在如下条件下培养所述丝状真菌菌株来诱导包含要通过移行 RNAi的方法沉默的靶基因的序列的短干扰RNA(siRNA)的生成,所述条件容 许生成所述双链可转录核酸构建体的RNA转录物,其然后被转变成与靶基因 的RNA转录物相互作用的siRNA,以降低或消除编码所述生物学物质的靶基 因的表达。
本发明还涉及包含双链可转录核酸构建体的丝状真菌菌株,该构建体包 含与第一多核苷酸和第二多核苷酸可操作相连接的启动子,所述第一多核苷 酸包含与编码生物学物质的靶基因具有同源性的第一可转录区,所述第二多 核苷酸包含与靶基因没有有效同源性的第二可转录区,其中所述第二可转录 区包含两个彼此反向互补的区段且其中所述第一和第二可转录区被转录成 单一mRNA分子,其中通过在如下条件下培养所述丝状真菌菌株来诱导包含 要通过移行RNAi的方法沉默的靶基因的序列的短干扰RNA(siRNA)的生成, 所述条件容许生成双链可转录核酸构建体的RNA转录物,其然后被转变成与 靶基因的RNA转录物相互作用的siRNA,以降低或消除编码生物学物质的靶 基因的表达。
本发明进一步涉及生成感兴趣的生物学物质的方法,其包括:
(a)在有益于生成感兴趣的生物学物质的条件下培养丝状真菌菌株,其 中该丝状真菌菌株包含双链可转录核酸构建体,该构建体包含与第一多核苷 酸和第二多核苷酸可操作相连接的启动子,所述第一多核苷酸包含与编码不 想要的生物学物质的靶基因具有同源性的第一可转录区,所述第二多核苷酸 包含与靶基因没有有效同源性的第二可转录区,其中所述第二可转录区包含 两个彼此反向互补的区段且其中所述第一和第二可转录区被转录成单一 mRNA分子,其中通过培养丝状真菌菌株来生成双链可转录核酸构建体的 RNA转录物,它然后被转变成包含要通过移行RNAi的方法沉默的靶基因的 序列的短干扰RNA(siRNA),其与靶基因的RNA转录物相互作用以降低或消 除编码不想要的生物学物质的靶基因的表达;且其中所述丝状真菌菌株包含 编码所述生物学物质的第三多核苷酸;和
(b)自培养液回收所述生物学物质。
附图简述
图1显示了丝状真菌中移行RNA干扰的示意图。
图2显示了pCW098的限制图(restriction map)。
图3显示了pCW099的限制图。
图4显示了pEFer14的限制图。
图5显示了pDM261的限制图。
图6显示了pDM266的限制图。
图7显示了pAmFs031的限制图。
图8显示了pAL01的限制图。
图9显示了pAL02的限制图。
定义
移行RNA干扰:术语“移行RNA干扰”或“移行RNAi”在本文中定义 为沉默信号在特定基因之外(beyond a particular gene)的移动。在移行RNAi 中,双链RNA(dsRNA)能充当新dsRNA的合成的模板,由此与靶序列共享同 源性的siRNA导致沿着mRNA的新序列的沉默的延伸或铺展。
短干扰RNA:术语“短干扰RNA”或“siRNA”在本文中定义为长20-25 个核苷酸的RNA片段,即Dicer介导的对双链RNA的消化的产物。
没有有效同源性:术语“没有有效同源性”在本文中定义为有义链和反 向互补链上的对应核苷酸包含优选少于20个、更优选少于15个、甚至更优选 少于10个、和最优选少于5个与靶基因序列相同的连续核苷酸。
两个彼此反向互补的区段:短语“两个彼此反向互补的区段”在本文中 定义为数段或数条DNA之一,它与其它的DNA配合以构成整体且能够进行 Watson-Crick配对
移行沉默的靶序列:短语“移行沉默靶序列”在本文中定义为为基因沉 默打上标记的(earmarked)dsRNA序列,其中该dsRNA序列是来自邻接序列 (adjoining sequence)的siRNA延伸的结果。
同一性:两种基酸序列之间或两种核苷酸序列之间的相关性以参数 “同一性”来描述。
就本发明而言,两种氨基酸序列之间的同一性程度使用 Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453) 来测定,正如EMBOSS包(EMBOSS:The European Molecular Biology Open Software Suite,Rice等,2000,Trends in Genetics 16:276-277)(优选3.0.0版 或更晚的)中的Needle程序中所执行的。所使用的任选参数是缺口打开罚分为 10,缺口延伸罚分为0.5,及EBLOSUM62(EMBOSS版的BLOSUM62)替代矩 阵。使用Needle标记的“最长同一性”(使用-nobrief选项获得的)的输出作为 百分比同一性,而且是如下计算的:
(相同残基x100)/(比对长度-比对中的缺口总数)
就本发明而言,两种脱核糖核苷酸序列之间的同一性程度使用 Needleman-Wunsch算法(Needleman和Wunsch,1970,见上文)来测定,正如 EMBOSS包(EMBOSS:The European Molecular Biology Open Software Suite, Rice等,2000,见上文)(优选3.0.0版或更晚的)中的Needle程序中所执行的。 所使用的任选参数是缺口打开罚分为10,缺口延伸罚分为0.5,及EDNAFULL (EMBOSS版的NCBI NUC4.4)替代矩阵。使用Needle标记的“最长同一性”(使 用-nobrief选项获得的)的输出作为百分比同一性,而且是如下计算的:
(相同脱氧核糖核苷酸x100)/(比对长度-比对中的缺口总数)
cDNA:术语“cDNA”在本文中定义为可通过逆转录自从真核细胞获得 的成熟的、经过剪接的mRNA分子制备的DNA分子(Sambrook,J.,Fritsch, E.F.,和Maniatis,T,1989,Molecular Cloning:A Laboratory Manual。第2版, Cold Spring Harbor Laboratory,Cold Spring Harbor,NY)。cDNA缺少在基因 组DNA中存在的内含子序列。最初的初级RNA转录物是前体分子,其通过一 系列加工步骤之后作为成熟的、经过剪接的mRNA出现。这些步骤包括通过 称作剪接的过程消除内含子序列。因此,自mRNA衍生的cDNA缺少任何内 含子序列。
核酸构建体:术语“核酸构建体”如本文中所使用的指从天然存在基因 分离的,或经修饰而以在其它情况中不会在自然界中存在的方式含有核酸区 段的,或人工合成的,单链或双链核酸分子。当核酸构建体含有编码序列的 表达所需要的控制序列时,术语核酸构建体与术语“表达盒”同义。
控制序列:术语“控制序列”在本文中定义成包括编码本发明多肽的多 核苷酸的表达所必需的所有构件。每一种控制序列对于编码多肽的核苷酸序 列可以是天然的或外来的,或者对于彼此是天然的或外来的。此类控制序列 包括,但不限于,前导序列、聚腺苷酸化序列、前肽序列(propeptide sequence)、 启动子、信号肽序列和转录终止子。最小限度,控制序列包括启动子及转录 和翻译终止信号。控制序列可以与接头一起提供,接头用于引入特异性限制 性位点以便于控制序列与编码多肽的核苷酸序列的编码区的连接。
启动子:术语“启动子”在本文中定义为结合RNA聚合酶并将聚合酶引 导至编码生物学物质的核酸序列的正确的下游转录起始位点以启动转录的 DNA序列。RNA聚合酶高效催化与编码区的适宜DNA链互补的信使RNA的 装配。术语“启动子”还会理解为包括5′非编码区(介于启动子和翻译起点之 间)(用于转录成mRNA之后的翻译)、顺式作用转录控制元件诸如增强子、和 其它能够与转录因子相互作用的核苷酸序列。
突变型启动子:术语“突变型启动子”在本文中定义为具有亲本启动子 的包含一个或多个核苷酸的替代、删除和/或插入的核苷酸序列的启动子,其 中突变型启动子具有比相应的亲本启动子或高或低的启动子活性。术语“突 变型启动子”还涵盖天然突变体和使用本领域公知方法(诸如经典诱变、定 点诱变、和DNA改组)获得的体外生成的突变体。
杂合启动子:术语“杂合启动子”在本文中定义为两个或更多个启动子 的部分融合在一起,以生成作为所述两个或更多个启动子的融合物的序列, 当与编码序列可操作相连接时,它介导编码序列转录成mRNA。
串联启动子:术语“串联启动子”在本文中定义为与编码序列可操作相 连接以介导编码序列转录成mRNA的,以串联排列的两个或更多个启动子序 列。
可操作相连接:术语“可操作相连接”在本文中指其中控制序列被置于 相对于多核苷酸序列的编码序列的适宜位置使得控制序列指导多肽的编码 序列表达的构造(configuration)。
编码序列:在本文中使用时,术语“编码序列”指直接规定其蛋白质产 物的氨基酸序列的核苷酸序列。编码序列的边界一般由开读框来决定,开读 框通常以ATG起始密码子或可选起始密码子诸如GTG和TTG开始,并以终止 密码子诸如TAA、TAG、和TGA结束。编码序列可以是基因组DNA、cDNA、 合成DNA、或重组核苷酸序列。
表达:术语“表达”包括多肽的生成中所牵涉的任何步骤,包括,但不 限于,转录、转录后修饰、翻译、翻译后修饰和分泌。
表达载体:术语“表达载体”在本文中定义为包含编码多肽的多核苷酸 且与支持其表达的别的核苷酸可操作相连接的线性或环状DNA分子。
宿主细胞:术语“宿主细胞”,如本文中所使用的,包括易于用包含本 发明的多核苷酸的核酸构建体或表达载体转化、转染、转导等等的任何细胞 类型。
发明详述
本发明涉及降低或消除丝状真菌菌株中编码生物学物质的靶基因的表 达的方法,其包括:(a)向丝状真菌菌株的基因组中插入双链可转录核酸构建 体,该构建体包含与第一多核苷酸和第二多核苷酸可操作相连接的启动子, 所述第一多核苷酸包含与编码所述生物学物质的靶基因具有同源性的第一 可转录区,所述第二多核苷酸包含与靶基因没有有效同源性的第二可转录 区,其中所述第二可转录区包含两个彼此反向互补的区段且所述第一和第二 可转录区被转录成单一mRNA分子;和(b)通过在如下条件下培养所述丝状真 菌菌株来诱导包含要通过移行RNAi的方法沉默的靶基因的序列的短干扰 RNA(siRNA)的生成,所述条件容许生成所述双链可转录核酸构建体的RNA 转录物,其然后被转变成与靶基因的RNA转录物相互作用的siRNA,以降低 或消除编码所述生物学物质的靶基因的表达。
图1显示了移行RNA干扰。转化子生成转录产物,该转录产物由3’侧翼 为与靶基因没有同源性的反向重复序列(IR)的靶区段构成。通过IR的折叠和 退火生成的双链RNA(dsRNA)被Dicer加工,生成与IR共享同源性的siRNA。 使用转录物作为模板,一部分siRNA被RNA依赖性RNA聚合酶(RdRP)延伸超 出5′IR边界,渗入(infiltrating)靶序列。继续延伸生成由靶物编码的dsRNA, 启动RNAi。
本发明的方法提供了用于丝状真菌菌株中的菌株开发和改善、功能基因 组学、和途径工程的新机会。例如,依靠基因操作和途径工程,本方法可用 作丝状真菌宿主菌株开发的工具,或用作基因敲除(一种费时且成功率易变的 办法)的替代方法。基因可能对通过本领域已知的标准方法灭活(诸如基因敲除) 有抗性。本发明的方法提供了用于降低或消除这样的基因的表达的解决方案。 基因敲除依赖于位点特异性基因置换。在真菌中,此方法的效率受到染色体 基因座、置换构建体与基因组共享的DNA序列、和/或共享同源性的长度的影 响。所描述的移行基因沉默的实现唯一地依赖于将靶序列的部分克隆到由反 向重复构成的第二序列上游。对于降低或消除在特定丝状真菌菌株中高度表 达的基因(这在例如开发作为生产宿主的生物体中可能是非常重要的),该方法 也是特别有用和高效的。这种能证明了本发明方法的力量。对于降低或消 除彼此高度同源的多个基因的表达,尤其是相同家族的基因或生物合成途径 或代谢途径中的同源基因,该方法也是有用的。可以操作这种方法来引起生 物学物质表达的可变减少,因此该方法进一步有用。这种可变性在编码生物 学物质的基因的完全敲除对于特定丝状真菌菌株会是致命的情况中,诸如在 流入(feed into)感兴趣生物合成途径的第二途径中,尤其重要。
在本发明的方法中,第一多核苷酸包含与靶基因具有同源性的第一可转 录区。第二多核苷酸包含与靶基因没有有效同源性的第二可转录区,其中第 二可转录区包含两个彼此反向互补的区段。
包含第一可转录区的第一多核苷酸(所述第一可转录区与编码生物学物 质的靶基因具有同源性)和包含第二可转录区的第二多核苷酸(所述第二可转 录区与靶基因没有有效同源性)可以是或不是由多核苷酸间插序列 (intervening sequence)分隔开的,所述多核苷酸间插序列是双链可转录核酸构 建体中与所述第一和第二多核苷酸有很少同源性或没有同源性的核苷酸序 列。双链可转录核酸构建体的多核苷酸序列可以是基因组、cDNA、RNA、 半合成、合成起源的,或其任意组合。
在一个优选的方面,第一和第二多核苷酸由多核苷酸间插序列分隔开。 间插序列优选由少于150个核苷酸、更优选少于100个核苷酸、更优选少于60 个核苷酸、更优选少于40个核苷酸、甚至更优选少于20个核苷酸、和最优选 少于10个核苷酸组成。
在一个更优选的方面,第一和第二多核苷酸不是由多核苷酸间插序列分 隔开的。
间插序列可以是任何与第一或第二多核苷酸没有同源性的核苷酸序列, 而且优选与丝状真菌菌株的基因组中的序列有很少的同源性或没有同源性, 以最小化不想要的靶向/重组。
启动子
启动子序列对于第一同源可转录区可以是天然的或外来的(异源的),而 且对于丝状真菌菌株可以是天然的或外来的。在本发明的方法中,启动子可 以是天然启动子、异源启动子、突变型启动子、杂合启动子、或串联启动子。
在本发明的方法中有用的启动子的例子包括从以下酶的基因获得的启 动子:米曲霉(Aspergillus oryzae)TAKA淀粉酶、米赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳 定性α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡糖淀粉酶(glaA)、米 赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、构巢曲霉 (Aspergillus nidulans)乙酰胺酶、镶片镰孢(Fusarium venenatum)淀粉葡糖苷酶 (WO 00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢Quinn(WO 00/56900)、尖镰孢(Fusarium oxysporum)胰蛋白酶样蛋白酶(WO 96/00787)、 里氏木霉(Trichoderma reesei)β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏 木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、 里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖 酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶、以及 NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉丙糖磷酸异构酶基因 的启动子的杂合体);和它们的突变的、截短的和杂合的启动子。
在一个优选的方面,启动子是NA2-tpi启动子。在另一个优选的方面, 启动子是TAKA/NA2-tpi前导杂合启动子。
同源可转录区
术语“与靶基因具有同源性的可转录区”在本文中定义为与靶基因的开 读框或其部分同源,且在被置于适宜调节序列的控制下时被转录成RNA(例 如ncRNA(非编码RNA)、tRNA(转运RNA)、rRNA(核糖体RNA)、miRNA(微 RNA)、或mRNA(信使RNA))(该RNA可以是或不是被翻译成生物学物质(例 如多肽))的核苷酸序列。可转录区的边界一般由mRNA 5′端恰位于开读框上 游的转录起始位点和mRNA 3′端恰位于开读框下游的转录终止序列决定。同 源可转录区可包括但不限于基因组DNA、cDNA、半合成的、合成的、和重 组的核酸序列。
在本发明的方法中,与靶基因同源的可转录区与靶基因的对应区域可以 是同样的,或者可以是它的同系物。
实现靶基因表达的降低或灭活所需要的同系物与靶基因对应区域之间 的同一性程度很可能会取决于靶基因。同系物的核苷酸序列相对于完整靶基 因越小,序列间的同一性程度应当优选非常高或相同。同系物的核苷酸序列 相对于完整靶基因越大,序列间的同一性程度很可能可以越低。
在本发明的方法中,同系物的核苷酸序列与靶基因的对应区域的同一性 程度为至少65%、优选至少70%、更优选至少75%、更优选至少80%、更优选 至少85%、更优选至少90%、甚至更优选至少95%、且最优选至少97%。就本 发明而言,两种核酸序列之间的同一性程度是如本文中所定义的来确定的。
或者,同系物与靶基因对应区域在各种严格条件下杂交的能力也能提供 靶基因表达降低或灭活所需要的相关性程度的指标。然而,应当认识到,同 系物与靶基因对于区域之间实现杂交所需要的严格条件越低(例如低严格 性),靶基因表达降低或灭活很可能会效率越低。
在一个优选的方面,同系物与靶基因对应区域在低严格条件下杂交。在 一个更优选的方面,同系物与靶基因对应区域在中等严格条件下杂交。在一 个甚至更优选的方面,同系物与靶基因对应区域在中等-高严格条件下杂交。 在一个最优选的方面,同系物与靶基因对应区域在高严格条件下杂交。在一 个甚至最优选的方面,同系物与靶基因对应区域在很高严格条件下杂交。
对于长度为至少100个核苷酸的探针,很低的至很高的严格条件定义为 遵循标准的Southern印迹方法,在42℃,在5X SSPE,0.3%SDS,200μg/ml经 剪切和变性的鲑精DNA,和25%甲酰胺(用于很低的和低的严格性)、35%甲酰 胺(用于中等和中等-高的严格性)、或50%甲酰胺(用于高的和很高的严格性) 中进行预杂交和杂交,最佳为12-24小时。
对于长度为至少100个核苷酸的探针,将载体材料最终优选在至少45℃ (很低的严格性)、更优选在至少50℃(低的严格性)、更优选在至少55℃(中等 严格性)、更优选在至少60℃(中等-高的严格性)、甚至更优选在至少65℃(高 的严格性)、和最优选在至少70℃(很高的严格性)使用2X SSC,0.2%SDS清洗 三次各15分钟。
对于长度为约15个核苷酸至约70个核苷酸的探针,严格条件定义为遵循 标准的Southern印迹方法在比使用根据Bolton和McCarthy(1962,Proceedings of the National Academy of Sciences USA 48:1390)的算法得出的计算Tm低约 5℃到约10℃的温度在0.9M NaCl,0.09M Tris-HCl pH 7.6,6mM EDTA,0.5% NP-40,1X Denhardt氏溶液,1mM焦磷酸钠,1mM磷酸二氢钠,0.1mM ATP, 和0.2mg/ml酵母RNA中进行预杂交、杂交和杂交后清洗,最佳为12-24小时。
对于长度为约15个核苷酸至约70个核苷酸的探针,将载体材料在比计算 Tm低5℃到10℃的温度在6X SCC加0.1%SDS中清洗一次15分钟和使用6X SSC清洗两次各15分钟。
第一同源区优选由至少19个核苷酸、更优选至少40个核苷酸、更优选至 少60个核苷酸、更优选至少80个核苷酸、甚至更优选至少100个核苷酸、且 最优选至少200个核苷酸组成。第一同源区也可以由基因的整个开读框或其 同系物组成。
非同源可转录区
双链可转录核酸构建体还包含与靶基因或宿主基因组没有有效同源性 的第二可转录区,其中所述第二可转录区包含两个彼此反向互补的区段。
在一个优选的方面,第二可转录区是任何基因的任何可转录部分,诸如 基因的5′-非翻译区、编码序列、或3′-非翻译区,其与靶基因或宿主基因组没 有有效同源性。
在一个更优选的方面,第二可转录区对应于与靶基因或宿主基因组没有 有效同源性的基因的编码序列。
在另一个更优选的方面,第二可转录区对应用于与靶基因或宿主基因组 没有有效同源性的基因的5′-非翻译区。
在另一个更优选的方面,第二可转录区对应于与靶基因或宿主基因组没 有有效同源性的基因的3′-非翻译区。
在一个最优选的方面,第二可转录区是与靶基因或宿主生物体没有同源 性的非内源基因(例如大肠杆菌的潮霉素抗性基因)的一部分。
第二可转录区优选由至少19个核苷酸、更优选至少40个核苷酸、更优选 至少60个核苷酸、更优选至少80个核苷酸、更优选至少100个核苷酸、更优 选至少250个核苷酸、甚至更优选至少500个核苷酸、最优选至少750个核苷 酸、和甚至最优选至少1000个核苷酸组成。
两个彼此反向互补的区段可以由多核苷酸接头分隔开。接头优选由至少 4个核苷酸、更优选至少20个核苷酸、更优选至少40个核苷酸、更优选至少 60个核苷酸、更优选至少80个核苷酸、甚至更优选至少100个核苷酸、最优 选至少250个核苷酸、和甚至最优选至少500个核苷酸组成。
靶基因
靶基因可以是任何编码具有生物学活性的物质的基因或任何编码具有 代谢物(以下的“生物学物质”)生物合成所牵涉的生物学活性的多肽的基因。 生物学物质可以是RNA(例如,ncRNA、rRNA、tRNA、miRNA或mRNA)。 生物学物质也可以是具有生物学活性的多肽。生物学物质还可以是代谢物。 具有生物学活性的物质对于丝状真菌菌株可以是天然的,或者对于菌株可以 是外来的或异源的。外来的或异源的物质指对于细胞不是天然的物质;或如 下的天然物质,即已经对该天然物质进行了结构修饰以改变该天然物质。
在一个优选的方面,生物学物质是具有生物学活性的多肽。多肽可以是 任何具有生物学活性的多肽。术语“多肽”在本文中并非意图指特定长度的 编码产物,因此,涵盖肽、寡肽、多肽和蛋白质。术语“多肽”还涵盖组合 在一起以形成编码产物的两种或多种多肽。多肽还包括杂合多肽,其包含自 至少两种不同多肽(其中一个或多个多肽对于丝状真菌细胞可以是异源的)获 得的部分或完整多肽序列的组合。多肽进一步包括上文所述多肽和杂合多肽 的天然存在的等位变异和工程化改造的变异。
在一个优选的方面,多肽是抗体抗原、抗微生物肽、酶、生长因子、 激素、免疫扩张剂(immunodilator)、神经递质、受体、报道蛋白、结构蛋白、 和转录因子。
在一个更优选的方面,多肽是氧化还原酶、转移酶、水解酶、裂合酶、 异构酶或连接酶。在一个最优选的方面,多肽是乙酰木聚糖酯酶、氨肽酶、 淀粉酶、水化合物酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、质 酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、阿魏酸酯酶、α-半乳糖苷 酶、β-半乳糖苷酶、葡糖淀粉酶、葡糖脑苷酯酶、α-葡萄糖苷酶、β-葡萄糖 苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变位酶(mutanase)、氧化酶、果 胶水解酶、过氧化物酶、磷脂酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、 核糖核酸酶、转谷氨酰胺酶、尿激酶或木聚糖酶。
在另一个优选的方面,多肽是白蛋白、胶原、原弹性蛋白、弹性蛋白、 或明胶;或其变体或杂合体。
生物学物质也可以是选择标志的产物。选择标志指其产物提供杀生物剂 抗性或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等的基因。合适的标志包括,但不限于,amdS(乙酰胺酶)、argB (氨酸氨甲酰基转移酶)、bar(膦丝菌素(phosphinothricin)乙酰转移酶)、hygB (潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitrate reductase)、pyrG(乳清酸核 苷-5’-磷酸脱羧酶)(orotidine-5’-phosphate decarboxylase)、sC(硫酸腺苷酰转 移酶)、trpC(邻氨基苯甲酸合酶(anthranilate synthase)),以及它们的等同物。
在本发明的实践中可能必须分离靶基因。用于分离或克隆基因的技术是 本领域已知的,包括自基因组DNA分离、自cDNA制备、或其组合。自此类 基因组DNA克隆基因可通过例如使用公知的聚合酶链式反应(PCR)来实现。 参见,例如,Innis等,1990,PCR Protocols:A Guide to Method and Application, Academic Press,New York。克隆方法可牵涉切出并分离包含编码生物学物 质的基因的期望核酸片段,将该片段插入载体分子中,并将该重组载体掺入 丝状真菌细胞,其中会复制得到该核酸序列的多个拷贝或克隆。核酸序列可 以是基因组、cDNA、RNA、半合成、合成起源的,或其任意组合。
在一个优选的方面,靶基因的表达降低了至少20%、优选至少30%、更 优选至少40%、更优选至少50%、更优选至少60%、更优选至少70%、甚至 更优选至少80%、最优选至少90%、和甚至最优选100%。
在期望使用5′非翻译区或3′非翻译区内的靶序列的情况中,用这些区域 之任一内的反向重复序列构建的基因沉默载体可另外能够实现与沉默载体 中存在的编码序列同源的基因的沉默。因此,在期望沉默生物体内的基因同 系物的情况中,构建含有移行表达的靶序列(该靶序列在5′非翻译区、编码序 列或3′非翻译区内具有同源性)的沉默载体可容许消除或降低一个或多个展 现出对构建体内编码序列的序列同源性的基因的表达。术语“同源性”和“同 源的”通常指那些有一些共同的祖传结构且展现出活性区的高度序列相似性 的序列。
在一个优选的方面,干扰RNA与靶基因的一个或多个同系物的RNA转录 物相互作用,以降低或消除靶基因的一个或多个同系物的表达。
在一个更优选的方面,靶基因的一个或多个同系物的表达降低了至少 20%、优选至少30%、更优选至少40%、更优选至少50%、更优选至少60%、 更优选至少70%、甚至更优选至少80%、最优选至少90%、和甚至最优选100%。
丝状真菌菌株
本发明还涉及包含双链可转录核酸构建体的丝状真菌菌株,该构建体包 含与第一多核苷酸和第二多核苷酸可操作相连接的启动子,所述第一多核苷 酸包含与编码生物学物质的靶基因具有同源性的第一可转录区,所述第二多 核苷酸包含与靶基因没有有效同源性的第二可转录区,其中所述第二可转录 区包含两个彼此反向互补的区段且所述第一和第二可转录区被转录成单一 mRNA分子,其中通过在如下条件下培养所述丝状真菌菌株来诱导包含要通 过移行RNAi的方法沉默的靶基因的序列的短干扰RNA(siRNA)的生成,所述 条件容许生成双链可转录核酸构建体的RNA转录物,其然后被转变成与靶基 因的RNA转录物相互作用的siRNA,以降低或消除编码生物学物质的靶基因 的表达。
丝状真菌菌株可以是任何在本发明的方法中有用的丝状真菌菌株。“丝 状真菌”包括真菌(Eumycota)和卵菌门(Oomycota)的亚门(如Hawksworth 等,于Ainsworth and Bisby’s Dictionary of The Fungi,第8版,1995,CAB International,University Press,Cambridge,UK中所定义的)的所有丝状形式。 丝状真菌的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、 甘露聚糖和其它复杂多糖构成的菌丝体壁。通过菌丝延伸进行营养性生长, 而碳分解代谢是专性需氧的。相反,酵母如酿酒酵母的营养性生长通过单细 胞菌体的出芽(budding)进行,而碳分解代谢可以是发酵的。
在一个优选的方面,丝状真菌菌株是枝顶孢霉属(Acremonium)、曲霉属 (Aspergillus)、短梗霉属(Aureobasidium)、烟管霉属(Bjerkandera)、拟蜡菌属 (Ceriporiopsis)、金孢子菌属(Chrysosporium)、鬼伞属(Coprinus)、革盖菌属 (Coriolus)、隐球菌属(Cryptococcus)、Filibasidium、镰孢属(Fusarium)、腐质 霉属(Humicola)、梨孢菌属(Magnaporthe)、毛霉属(Mucor)、毁丝霉属 (Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟 青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、射脉 菌属(Phlebia)、瘤胃壶菌属(Piromyces)、侧属(Pleurotus)、裂褶菌属 (Schizophyllum)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢 壳属(Thielavia)、弯颈霉属(Tolypocladium)、栓菌属(Trametes)或木霉属 (Trichoderma)菌株。
在一个更优选的方面,丝状真菌菌株是泡盛曲霉(Aspergillus awamori)、 烟曲霉(Aspergillus fumigatus)、臭曲霉(Aspergillus foetidus)、日本曲霉 (Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、或米曲霉(Aspergillus oryzae)菌株。在另一个最优选的方面,丝状真 菌菌株是杆孢状镰孢(Fusarium bactridioides)、禾谷镰孢(Fusarium cerealis)、 库威镰孢(Fusarium crookwellense)、大刀镰孢(Fusarium culmorum)、禾本科 镰孢(Fusarium graminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢 (Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖镰孢(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、 接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分 枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰 孢(Fusarium torulosum)、拟丝孢镰孢(Fusarium trichothecioides)、或镶片镰孢 (Fusarium venenatum)菌株。在另一个最优选的方面,丝状真菌菌株是黑刺烟 管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsis aneirina)、干拟蜡菌 (Ceriporiopsis aneirina)、Ceriporiopsis caregiea、Ceriporiopsis gilvescens、 Ceriporiopsis pannocinta、Ceriporiopsis rivulosa、Ceriporiopsis subrufa、虫拟 蜡菌(Ceriporiopsis subvermispora)、嗜角质金孢子菌(Chrysosporium keratinophilum)、Chrysosporium lucknowense、热带金孢子菌(Chrysosporium tropicum)、Chrysosporium merdarium、Chrysosporium inops、毡金孢子菌 (Chrysosporium pannicola)、Chrysosporium queenslandicum、Chrysosporium zonatum、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolus hirsutus)、特异腐 质霉(Humicola insolens)、疏状腐质霉(Humicola lanuginosa)、米赫毛霉 (Mucor miehei)、嗜热毁丝霉(Myceliophthora thermophila)、粗糙脉孢菌 (Neurospora crassa)、产紫青霉(Penicillium purpurogenum)、黄孢平革菌 (Phanerochaete chrysosporium)、辐射射脉菌(Phlebia radiata)、刺芹侧耳 (Pleurotus eryngii)、土生梭孢霉(Thielavia terrestris)、长绒毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉(Trichoderma harzianum)、 康宁木霉(Trichoderma koningii)、长枝木霉(Trichoderma longibrachiatum)、里 氏木霉(Trichoderma reesei)、或绿色木霉(Trichoderma viride)菌株。
在一个最优选的方面,米曲霉菌株是保藏号为IFO 4177的米曲霉菌株。 在另一个最优选的方面,镶片镰孢菌株是镶片镰孢A3/5,其最初是作为禾本 科镰孢ATCC 20334保藏的,最近由Yoder和Christianson,1998,Fungal Genetics and Biology 23:62-80及O′Donnell等,1998,Fungal Genetics and Biology 23: 57-67重新归为镶片镰孢;以及镶片镰孢的分类学等同物,不管它们当前知道 的物种名称。在另一个最优选的方面,镶片镰孢菌株是镶片镰孢A3/5或镶片 镰孢ATCC 20334的形态学突变体,如WO 97/26330中所披露的。在另一个最 优选的方面,里氏木霉菌株是里氏木霉ATCC 56765。在另一个最优选的方面, 黑曲霉菌株是黑曲霉Bo-1(DSM 12665)。在另一个最优选的方面,黑曲霉菌 株是黑曲霉Bo-1(DSM 12665)的突变体,如WO 2004/090155中所披露的。
可以通过牵涉原生质体形成、原生质体转化、和细胞壁重建的方法以本 身已知的方式来转化丝状真菌菌株。用于转化曲霉属和木霉属菌株的合适方 法记载于EP 238 023及Yelton等,1984,Proceedings of the National Academy of Sciences USA 81:1470-1474。用于转化镰孢属物种的合适方法记载于 Malardier等,1989,Gene 78:147-156及WO 96/00787。可以使用由如下文献记 载的方法来转化酵母:Becker和Guarente,于Abelson,J.N.和Simon,M.I.,编, Guide to Yeast Genetics and Molecular Biology,Methods in Enzymology,卷194, pp 182-187,Academic Press,Inc.,New York;Ito等,1983,Journal of Bacteriology 153:163;及Hinnen等,1978,Proceedings of the National Academy of Sciences USA 75:1920。
编码不想要的生物学物质的靶基因的表达的消除或降低可使用本领域 已知的、对所靶定的生物学物质特异性的方法来检测。这些检测方法可以包 括特异性抗体的使用、高效液相层析、毛细管电泳、酶产物的形成、酶底物 的消失、SDS-PAGE、或表型(例如孢子颜色)的消失或出现。例如,可以使 用酶测定法(enzyme assay)来测定所述酶的活性。用于测定酶活性的方法,对 于许多酶是本领域已知的(参见例如D.Schomburg和M.Salzmann(编), Enzyme Handbook,Springer-Verlag,New York,1990)。
生产方法
本发明还涉及感兴趣生物学物质的生产方法,其包括:(a)在有益于感兴 趣生物学物质生成的条件下培养丝状真菌菌株,其中所述丝状真菌菌株包含 双链可转录核酸构建体,该构建体包含与第一多核苷酸和第二多核苷酸可操 作相连接的启动子,所述第一多核苷酸包含与编码不想要的生物学物质的靶 基因具有同源性的第一可转录区,所述第二多核苷酸包含与靶基因没有有效 同源性的第二可转录区,其中所述第二可转录区包含两个彼此反向互补的区 段且所述第一和第二可转录区被转录成单一mRNA分子,其中通过在如下条 件下培养丝状真菌菌株来生成双链可转录核酸构建体的RNA转录物,所述条 件容许生成所述RNA转录物,它然后被转变成包含要通过移行RNAi的方法 沉默的靶基因的序列的短干扰RNA(siRNA),其与靶基因的RNA转录物相互 作用以降低或消除编码不想要的生物学物质的靶基因的表达;且其中所述丝 状真菌菌株包含编码感兴趣生物学物质的第三多核苷酸;和(b)自培养液回收 感兴趣生物学物质。
感兴趣的生物学物质可以是任何如本文中所描述的生物学物质。在一个 优选的方面,感兴趣的生物学物质是具有生物学活性的多肽。它对于丝状真 菌菌株可以是天然的或外来的。编码不想要的生物学物质的靶基因的表达的 降低或消除可导致另一种感兴趣的生物学物质的表达增加。不想要的生物学 物质能直接影响感兴趣的生物学物质的生成或表达。例如,不想要的生物学 物质可以是攻击感兴趣的生物学物质,由此降低所生成的感兴趣的生物学物 质的量的蛋白酶。通过降低或消除蛋白酶的表达,会表达和生成更多的感兴 趣的生物学物质。或者,不想要的生物学物质可以与感兴趣的生物学物质共 享一个或多个细胞过程,例如,转录因子或分泌途径,由此降低所生成的感 兴趣的生物学物质的量。通过降低或消除不想要的生物学物质的表达,更多 的一个或多个细胞过程会是感兴趣的生物学物质可利用的,例如,限制表达 的转录元件,由此提高所表达的和所生成的感兴趣的生物学物质的量。此外, 不想要的生物学物质可以是污染感兴趣的生物学物质,阻止感兴趣的生物学 物质在特定应用中(例如,酶在食品加工中)使用的毒素。
在本发明的生产方法中,使用本领域已知方法在适合于感兴趣的生物学 物质生成的营养培养基中培养丝状真菌菌株。例如,可以通过在合适培养基 中和在允许生物学物质表达和/或分离的条件下进行的摇瓶培养和实验室或 工业发酵罐中的小规模或大规模发酵(包括连续的、分批的、补料分批的或 固态的发酵)来培养菌株。使用本领域已知的方法在合适的营养培养基中进 行培养,所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商 业供应商获得或可以根据公开的组成制备(例如,在美国典型培养物保藏中 心的目录中)。如果生物学物质被分泌入营养培养基中,那么可以自培养基 直接回收它。如果生物学物质不被分泌,那么可以自细胞裂解物回收它。
可以使用本领域已知的、对于生物学物质是特异性的方法来检测感兴趣 的生物学物质。这些检测方法可以包括特异性抗体的使用、高效液相层析、 毛细管层析、酶产物的形成、酶底物的消失或SDS-PAGE。例如,可以使用酶 测定法来测定酶的活性。用于测定酶活性的方法,对于许多酶是本领域已知 的(参见例如D.Schomburg和M.Salzmann(编),Enzyme Handbook, Springer-Verlag,New York,1990)。
所得感兴趣的多肽可以使用本领域已知方法来分离。例如,可以通过常 规方法自培养基回收感兴趣的多肽,所述常规方法包括但不限于离心、过滤、 提取、喷雾干燥蒸发或沉淀。然后,分离得到的多肽可以通过本领域已知 的多种方法来进一步纯化,所述方法包括但不限于层析(例如离子交换、亲和、 疏水、层析聚焦、和大小排阻)、电泳方法(例如制备型等电聚焦(IEF))、差别 溶解度(例如硫酸铵沉淀)、或提取(参见例如Protein Purification,J.-C.Janson和 Lars Ryden编,VCH Publishers,New York,1989)。可以通过例如提取、沉淀、 或差别溶解度或本领域已知的任何方法自培养基分离感兴趣的代谢物。然后, 分离得到的代谢物可使用适合于代谢物的方法进一步纯化。
编码生物学物质的多核苷酸
编码感兴趣的生物学物质的分离的多核苷酸序列可以自任何原核的、真 核的或其它来源获得。就本发明而言,术语“自...获得”或“得自”,如本 文中与给定来源一起使用的,应当意味着该生物学物质是由该来源或其中已 经插入了来自该来源的基因的细胞生成的。
用于分离或克隆编码感兴趣生物学物质的多核苷酸的技术是本领域已知 的,包括自基因组DNA分离、自cDNA制备、或其组合。自此类基因组DNA克 隆多核苷酸可以通过例如使用众所周知的聚合酶链式反应(PCR)来实现。参见 例如Innis等,1990,PCR Protocols:A Guide to Methods and Application,Academic Press,New York。克隆步骤可以涉及切出和分离包含编码生物学物质的多核苷 酸的期望核酸片段,将该片段插入载体分子,并将该重组载体掺入突变体丝状 真菌细胞,其中将会复制多个拷贝或克隆的所述核酸序列。所述多核苷酸可以 是基因组、cDNA、RNA、半合成、合成来源的,或其任意组合。
核酸构建体
编码感兴趣生物学物质的分离的多核苷酸可以包含在丝状真菌菌株中 的核酸构建体中。核酸构建体包含编码感兴趣生物学物质的核苷酸序列,其 与至少一种启动子和一个或多个控制序列可操作相连接,它们指导所述核苷 酸序列在丝状真菌菌株中在与所述控制序列相容的条件下表达。表达应当理 解为包括感兴趣的生物学物质的生成所涉及的任何步骤,包括但不限于转 录、转录后修饰、翻译、翻译后修饰和分泌。
可以以多种方式进一步操作编码感兴趣生物学物质的分离的多核苷酸, 从而为生物学物质的表达作准备。取决于表达载体,在将核苷酸序列插入载 体前对其进行操作可能是想要的或必要的。利用重组DNA方法修饰核苷酸序 列的技术是本领域众所周知的。
在本发明的方法中,多核苷酸可以包含一个或多个天然控制序列,或者 可以将一个或多个天然控制序列用对核苷酸序列而言是外来的一个或多个 控制序列替换,从而改进编码序列在宿主细胞中的表达。此类控制序列包括 但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列、和 转录终止子。最低限度,控制序列包括启动子、及转录和翻译终止信号。为 了导入特定限制性位点以促进控制序列与编码感兴趣生物学物质的核苷酸序 列的编码区的连接,控制序列可以与接头一起提供。
控制序列可以是适当的启动子序列,即受到用于表达编码生物学物质的 多核苷酸的宿主细胞识别的核苷酸序列。启动子序列包含介导生物学物质表 达的转录控制序列。启动子可以是在所选择的宿主细胞中显示出转录活性的 任何核苷酸序列,包括突变的、截短的和杂合的启动子,而且可以从编码对 于宿主细胞而言是同源的或异源的胞外或胞内多肽的基因获得。
用于指导核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例 是从下列酶的基因获得的启动子:米曲霉TAKA淀粉酶、米赫根毛霉天冬氨 酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛 曲霉葡糖淀粉酶(glaA)、米赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉丙 糖磷酸异构酶、构巢曲霉乙酰胺酶、镶片镰孢淀粉葡糖苷酶(WO 00/56900)、 镶片镰孢Daria(WO 00/56900)、镶片镰孢Quinn(WO 00/56900)、尖镰孢胰蛋 白酶样蛋白酶(WO 96/00787)、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解 酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切 葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木 霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β- 木糖苷酶、以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉丙糖 磷酸异构酶基因的启动子的杂合体);和它们的突变的、截短的和杂合的启 动子。
控制序列可以是合适的转录终止子序列,即被宿主细胞识别以终止转录 的序列。终止子序列可操作连接至编码生物学物质的核酸序列的3’端。可以 将在所选择的丝状真菌菌株中有功能的任何终止子用于本发明。
对于丝状真菌菌株优选的终止子从如下酶的基因获得:米曲霉TAKA淀 粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶 和尖镰孢胰蛋白酶样蛋白酶。
控制序列还可以是合适的前导序列,即对于丝状真菌菌株进行的翻译而 言是重要的mRNA非翻译区。前导序列可操作连接至编码生物学物质的核酸 序列的5’端。可以将在所选择的丝状真菌菌株中有功能的任何前导序列用于 本发明。
对于丝状真菌菌株优选的前导序列从如下酶的基因获得:米曲霉TAKA 淀粉酶、构巢曲霉丙糖磷酸异构酶、镶片镰孢胰蛋白酶、和镶片镰孢葡糖淀 粉酶。
控制序列也可以是聚腺苷酸化序列,即可操作连接至核酸序列的3’端, 在转录时被宿主细胞识别为向转录的mRNA添加聚腺苷残基的信号的序列。 可以将在所选的丝状真菌菌株中有功能的任何聚腺苷酸化序列用于本发明。
对于丝状真菌菌株优选的聚腺苷酸化序列从如下酶的基因获得:米曲霉 TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰 蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶。
控制序列还可以是信号肽编码区,其编码与多肽的氨基末端相连接并指 导编码的多肽进入细胞分泌途径的氨基酸序列。核酸序列编码序列的5’端可 固有地包含信号肽编码区,其与编码分泌多肽的编码区片段一起天然地连接 在翻译阅读框中。可供选择的是,编码序列5’端可含有对于所述编码序列外 来的信号肽编码区。外来信号肽编码区在编码序列不天然地含有信号肽编码 区时可为必需的。或者,外来信号肽编码区可以简单地取代天然信号肽编码 区以增强多肽的分泌。然而,指导表达的多肽进入所选真菌宿主细胞的分泌 途径的任何信号肽编码区可在本发明中使用。
对于丝状真菌菌株有效的信号肽编码区是从如下酶的基因获得的信号 肽编码区:米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、 米赫根毛霉天冬氨酸蛋白酶、特异腐质霉纤维素酶、和疏棉状腐质霉脂肪酶。
控制序列还可以是前肽编码区,其编码位于多肽氨基末端的氨基酸序 列。所得多肽称为酶原(proenzyme)或多肽原(或在某些情况下为酶原 (zymogen))。多肽原一般是没有活性的,而且可以通过催化性地或自身催化 性地自多肽原切割掉前肽而转变成成熟的、有活性的多肽。可以从如下酶的 基因获得前肽编码区:酿酒酵母α-因子、米赫根毛霉天冬氨酸蛋白酶、和嗜 热毁丝霉(Myceliophthora thermophila)漆酶(WO 95/33836)。
若多肽的氨基末端存在有信号肽区和前肽区两者时,则前肽区连接至多 肽的氨基末端,而信号肽区连接至前肽区的氨基末端。
可能还期望添加调节序列,其允许相对于丝状真菌菌株的生长来调节生 物学物质的表达。调节系统的例子是那些引起基因表达响应化学或物理刺激 (包括调节性化合物的存在)而开启或关闭的系统。在丝状真菌中,可以使用 TAKA α-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子、米曲霉葡糖淀粉酶启动 子、和镶片镰孢葡糖淀粉酶启动子作为调节序列。调节序列的其它实例是那 些允许基因扩增的序列。在真核系统中,这些序列包括在氨甲蝶呤 (methotrexate)存在下扩增的二氢叶酸还原酶基因,和以重金属(with heavy metal)扩增的金属硫蛋白基因。在这些情况中,编码感兴趣生物学物质的核 苷酸序列会与调节序列可操作相连接。
表达载体
编码感兴趣生物学物质的多核苷酸可以包含在重组表达载体中,该重组 表达载体包含启动子、编码生物学物质的核苷酸序列、及转录和翻译终止信 号。本文所述各种核酸和控制序列可以结合在一起以产生重组表达载体,其 可以包含一个或多个(数个)方便的限制性位点以允许在这些位点插入或取代 编码多肽的核苷酸序列。或者,可以通过在用于表达的适当载体中插入核苷 酸序列或包含所述序列的核酸构建体来表达多核苷酸序列。在创建表达载体 时,将编码序列置于载体中,使得编码序列与用于表达的适当的控制序列可 操作相连接。
重组表达载体可以是任何载体(例如质粒或病毒),其能方便地进行重组 DNA步骤,而且能产生核苷酸序列的表达。载体的选择将通常取决于载体与其 中待引入该载体的宿主细胞的相容性。载体可以是线状的或闭合环状的质粒。
载体可以是自主复制载体,即作为染色体外实体(entity)存在的载体,其复 制独立于染色体复制,例如质粒、染色体外元件、微型染色体(minichromosome)、 或人工染色体。载体可以包含任何用于确保自复制的手段(means)。或者,载体 可以是一种当被导入宿主细胞时,整合到基因组中并且与整合了该载体的染色 体一起复制的载体。此外,可以使用单一的载体或质粒或者两个或更多个载体 或质粒,其一起含有待导入宿主细胞基因组的总DNA(total DNA),或者可以使 用转座子。
载体优选包含一个或多个(数个)选择标志,其允许简单选择经转化、转 染、转导等等的细胞。选择标志是其产物提供杀生物剂抗性或病毒抗性、对 重金属的抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等的基因。 用于丝状真菌宿主细胞的选择标志包括但不限于amdS(乙酰胺酶)、argB(鸟 氨酸氨甲酰基转移酶)、bar(膦丝菌素(phosphinothricin)乙酰转移酶)、hph(潮 霉素磷酸转移酶)、niaD(硝酸还原酶)(nitrate reductase)、pyrG(乳清酸核苷 -5’-磷酸脱羧酶)(orotidine-5’-phosphate decarboxylase)、sC(硫酸腺苷酰转移 酶)、和trpC(邻氨基苯甲酸合酶(anthranilate synthase)),以及它们的等效物。 优选用在曲霉属细胞中的是构巢曲霉或米曲霉的amdS和pyrG基因和吸水链 霉菌(Streptomyces hygroscopicus)的bar基因。
载体优选包含允许载体整合入宿主细胞基因组或允许载体在细胞中独立 于基因组自主复制的元件。
为了整合入宿主细胞基因组,载体可以依赖编码多肽的多核苷酸序列或 用于通过同源或非同源重组整合入基因组的任何其它载体元件。或者,载体 可以包含额外的核苷酸序列,用于指导通过同源重组在染色体中的精确位置 整合入宿主细胞基因组中。为了增加在精确位置处整合的可能性,整合元件 应优选包含足够数目的核酸,如100-10,000碱基对、优选400-10,000碱基对和 最优选800-10,000碱基对,其与相应的靶序列具有高的同一性程度以增强同 源重组的概率。整合元件可以是与宿主细胞基因组中的靶序列同源的任何序 列。此外,整合元件可以是非编码的或编码的核苷酸序列。另一方面,可以 将载体通过非同源重组整合到宿主细胞的基因组中。
为了自主复制,载体可以进一步包含复制起点,其使载体能够在所讨论 的宿主细胞中自主复制。复制起点可以是在细胞中发挥功能的、介导自主复 制的任何质粒复制子(replicator)。术语“复制起点”或“质粒复制子”在本 申请中定义为使质粒或载体能够在体内复制的核苷酸序列。
在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等, 1991,Gene 98:61-67;Cullen等,1987,Nucleic Acids Research 15:9163-9175; WO 00/24883)。分离AMA1基因和构建包含该基因的质粒或载体可以依照 WO 00/24883中披露的方法来进行。
可以将多于一个拷贝的多核苷酸插入宿主细胞以增加基因产物的产生。多 核苷酸拷贝数的增加可通过如下方法获得:将至少一个额外拷贝的序列整合入 宿主细胞基因组,或将可扩增的选择标志基因包括在多核苷酸内,其中可通过 在适当选择剂(selectable agent)存在下培养细胞来选择含有选择标志基因的扩 增拷贝并由此含有多核苷酸的额外拷贝的细胞。
用于连接上文所述元件以构建重组表达载体的方法是本领域技术人员 熟知的(参见例如Sambrook等,1989,见上文)。
通过下文实施例来进一步描述本发明,所述实施例不应解释为限制本发 明的范围。
实施例
培养基和溶液
amdS覆盖琼脂每升由20ml COVE盐溶液,273.8g蔗糖,8g Noble琼脂, 10mM乙酰胺,和15mM CsCl,pH 5.0构成。
AMG痕量金属溶液每升由14.3g ZnSO4·7H2O,2.5g CuSO4·5H2O,0.5g NiCl2·6H2O,13.8g FeSO4·7H2O,8.5g MnSO4·H2O,和3.0g柠檬酸构成。
纤维素酶诱导培养基每升由20g Arbocel-天然纤维素纤维(J.Rettenmaier USA LP),10g玉米浆固体(corn steep solids,Sigma Chemical Co.,St.Louis, MO,USA),1.45g(NH4)2SO4,2.08g KH2PO4,0.28g CaCl2,0.42g MgSO4·7H2O, 0.42ml里氏木霉痕量金属溶液,和2滴Pluronic酸构成。在高压灭菌前将pH用 10N NaOH调节至6.0。
COVE选择板每升由342.3g蔗糖,20ml COVE盐溶液,10mM乙酰胺, 15mM CsCl2,和25g或30g Noble琼脂构成。
COVE2板每升由30g蔗糖,20ml COVE盐溶液,10mM乙酰胺,和25g 或30g Noble琼脂构成。
COVE盐溶液每升由26g KCl,26g MgSO4·7H2O,76g KH2PO4,和50ml COVE痕量金属溶液构成。
COVE痕量金属溶液每升由0.04g NaB4O7·10H2O,0.4g CuSO4·5H2O,1.2g FeSO4·7H2O,0.7g或1g MnSO4·H2O,0.8g Na2MoO2·2H2O,和10g ZnSO4·7H2O 构成。
COVE A盐溶液每升由26g KCl,26g MgSO4,76g KH2PO4,和50ml COVE A痕量元素溶液。
COVE A痕量元素溶液每升由0.04g NaB4O7·10H2O,0.4g CuSO4·5H2O, 0.8g FeSO4·7H2O,0.8g MnSO4·H2O,0.8g Na2MoO2·2H2O,10g ZnSO4·7H2O, 和10g柠檬酸构成。
COVE A减尿素加乙酰胺选择板每升由20ml COVE A盐溶液,220g山梨 醇,10g葡萄糖,10mM乙酰胺,和30g细菌用琼脂(Bacto agar),pH 5.2构成。
M410每升由50g麦芽糖,50g葡萄糖,2g MgSO4·7H2O,2g KH2PO4, 4g柠檬酸,8g酵母提取物,2g尿素,0.5ml AMG痕量金属溶液,和0.5g CaCl2,pH 6.0构成。
基本培养基每升由6g NaNO3,0.52g KCl,1.52g KH2PO4,1ml COVE痕 量元素溶液,10g葡萄糖,0.5g MgSO4·7H2O,和0.004g D-生物素构成。
基本培养基琼脂每升由6g NaNO3,0.52g KCl,1.52g KH2PO4,1ml COVE 痕量元素溶液,20g Noble琼脂,10g葡萄糖,0.5g MgSO4·7H2O,和0.004g D- 生物素构成。
PDA板每升由39g DIFCOTM铃薯右旋糖糖(Becton Dickinson and Co., Sparks,MD,USA)构成。
PEG由60%PEG 4000(Polysciences,Inc.,Warrington,PA,USA),10mM CaCl2,和10mM Tris-HCl,pH 6.5构成,过滤除菌。
SPC由40%PEG 4000,50mM CaCl2,和0.8M山梨醇,pH 4.5-5.5构成, 过滤除菌。
20X SSC每升由175.3g NaCl和88.2g柠檬酸钠pH 7.0构成。
0.5X SSC每升由4.38g NaCl和2.2g柠檬酸钠pH 7.0构成。
STC由1M山梨醇,10mM CaCl2,和10mM Tris-HCl,pH 6.5构成,过滤 除菌。
里氏木霉痕量金属溶液每升由216g FeCl3·6H2O,58g ZnSO4·7H2O,27g MnSO4·H2O,10g CuSO4·5H2O,2.4g H3BO3,和336g柠檬酸构成。
YPG每升由10g酵母提取物(Fisher Scientific,Fair Lawn,NJ,USA), 20g BACTOTM蛋白胨(Becton Dickinson and Co.,Sparks,MD,USA),和20g 葡萄糖构成。
实施例1:质粒pCW098的构建
质粒pCW098构建成含有TAKA/NA2-tpi前导杂合启动子(美国专利No. 6,461,837)、自大肠杆菌潮霉素抗性基因(Kaster等,1983,Nucleic Acids Res. 11:6895-6911)的部分制备的反向重复序列(hyg IR)、黑曲霉淀粉葡萄糖苷酶 (AMG)终止子(Hata等,1991,Agric.Biol.Chem.55:941-949)、和作为选择 标志的构巢曲霉pyrG基因(Ballance和Turner,1985,Gene 36:321-331)。
为了表达自大肠杆菌aph(4)(hygB)基因(Kaster等,1983,见上文)衍生的 双链RNA(dsRNA),使用下文所示拥有Not I限制性位点的有义链引物和拥有 5′Sma I或Xma I限制性位点的反义引物自aph(4)基因开读框内PCR扩增反向 重复序列的一半,即199个碱基对。
引物cwhygnot.1(有义):
5’-gcggccgcGCGATGTTCGGGGATTCCCAATACGAGGTC-3’(SEQ ID NO:1)
引物cwhygsma.1A(反义):
5’-cccgggGCATCATCGAAATTGCCGTCAACCAAGCTC-3’(SEQ ID NO:2)
hygB编码序列的部分以大写字母显示。
扩增反应(50μl)由1X THERMOPOLTM反应缓冲液(New England Biolabs, Beverly,MA,USA),0.4mM dNTP,100ng pSMai155(WO 05/074647),50 pmole有义引物,50pmole反义引物,和5个单位Taq DNA聚合酶(New England Biolabs,Beverly,MA,USA)构成。将反应在 5333(Eppendorf AG,Hamburg,Germany)中温育,编程 为30个循环,每个循环94℃30秒、55℃30秒、和72℃1分钟(最后延伸7分钟)。
214bp的PCR产物通过TAE缓冲液(每升4.84g Tris碱,1.14ml醋酸,和2ml 0.5M EDTA pH 8.0)中的1%琼脂糖凝胶电泳来纯化,并使用凝胶 提取试剂盒(QIAGEN Inc.,Valencia,CA,USA)进一步纯化。使用TA 克隆试剂盒连接214bp PCR产物与pCR2.1-并依照制造商的指示 (Invitrogen Corporation,Carlsbad,CA,USA)转化入TOP10化学 感受态大肠杆菌细胞。使用9600(QIAGEN Inc.,Valencia,CA, USA)纯化来自数个转化子的质粒DNA,并通过DNA测序来分析以鉴定含有期 望的hygB插入物的那些。将具有预期DNA序列的一个质粒命名为MP#3。
使用下文所示拥有5’Pac I限制性位点的有义链引物和拥有5′Sma I或 Xma I限制性位点的反义引物扩增反向重复序列的另一半(包括100个碱基对 的间隔物(spacer));hygB序列以大写字母显示。
引物cwhygpac.2(有义):
5’-ttaattaaGCGATGTTCGGGGATTCCCAATACGAGGTC-3’(SEQ ID NO:3)
引物cwhygsma.2a(反义):
5’-cccgggATCGGTCCAGACGGCCGCGCTTCTGCGGGC-3’(SEQ ID NO:4)
扩增反应(50μl)由1X THERMOPOLTM反应缓冲液,0.4mM dNTP,100ng pSMai155,50pmole有义引物,50pmole反义引物,和5个单位Taq DNA聚合 酶构成。将反应在5333中温育,编程为 30个循环,每个循环94℃30秒、55℃30秒、和72℃1分钟(最后延伸7分钟)。
314bp的PCR产物通过TAE缓冲液中的1%琼脂糖凝胶电泳来纯化,并使 用凝胶提取试剂盒进一步纯化。使用TA克隆试剂盒连 接314bp PCR产物与pCR2.1-并依照制造商的指示转化入ONE TOP10化学感受态大肠杆菌细胞。使用9600纯化来自 数个转化子的质粒DNA,并通过DNA测序来分析以鉴定含有期望的hygB插 入物的那些。将具有预期DNA序列的一个质粒命名为MP#9。
用Not I和Xma I消化MP#3。用Pac I和Xma I消化MP#9。通过TAE缓冲液 中的1%琼脂糖凝胶电泳纯化这两种hygB DNA片段,并使用凝 胶提取试剂盒提取。将片段连接至经Not I/Pac I消化的载体pAlLo2(WO 05/056772,实施例21)以创建pCW098(图2)。
实施例2:质粒pCW099的构建
质粒pCW099构建成含有TAKA/NA2-tpi前导杂合启动子、来自米曲霉wA 基因(全长基因组DNA序列为SEQ ID NO:5,推导氨基酸序列为SEQ ID NO: 6)的片段、大肠杆菌hygB反向重复序列(hyg IR)、黑曲霉淀粉葡萄糖苷酶 (AMG)终止子、和作为选择标志的构巢曲霉pyrG基因。
使用下文所示引物cwwanco.1corr(有义)和cwwanot.1A(反义)自从米曲 霉菌株P2-5.1(WO 05/056772,实施例27和28)挽救的质粒加wA侧翼序列PCR 扩增米曲霉wA基因(DNA序列为SEQ ID NO:7,其推导氨基酸序列为SEQ ID NO:8)的176bp片段。有义引物工程化改造成在5’末端具有Nco I位点,而反 义引物工程化改造成在5’末端具有Not I位点。
引物cwwanco.1corr(有义):
5’-ccatggAGCACTTCGATTGCATTAG-3’(SEQ ID NO:9)
引物cwwanot.1A(反义):
5’-gcggccgcAGAACGAACGCAGGTTTTATAC-3’(SEQ ID NO:10)
wA序列以大写字母显示。
扩增反应(50μl)由1X THERMOPOLTM反应缓冲液,0.4mM dNTP,100ng 米曲霉P2-5.1 DNA(WO 05/056772),50pmole引物cwwanco.1corr,50pmole 引物cwwanot.1a,和5个单位Taq DNA聚合酶构成。将反应在 5333中温育,编程为30个循环,每个循环94℃30秒、55℃ 30秒、和72℃1分钟(最后延伸7分钟)。
188bp的PCR产物通过TAE缓冲液中的1%琼脂糖凝胶电泳来纯化,并使 用凝胶提取试剂盒进一步纯化。使用TA克隆试剂盒连 接188bp PCR产物与pCR2.1-并依照制造商的指示转化入ONE TOP10化学感受态大肠杆菌细胞。使用9600纯化来自 数个转化子的质粒DNA,并通过DNA测序来分析以鉴定含有期望的wA插入 物的那些。将具有预期DNA序列的一个质粒命名为MP#10。
将MP#10 DNA用Nco I和Not I消化,并通过TAE缓冲液中的1%琼脂糖凝 胶电泳来纯化。使用凝胶提取试剂盒提取wA片段。将纯化的片 段连接至经Nco I/Not I消化的pCW098以创建pCW099(图3)。
实施例3:质粒pEFer14的构建
质粒pEFer14构建成含有TAKA/NA2-tpi前导杂合启动子、米曲霉wA基因 的176bp片段、大肠杆菌hygB反向重复序列(hyg IR)、黑曲霉淀粉葡萄糖苷酶 (AMG)终止子、和作为选择标志的全长构巢曲霉amdS基因。
通过TAE缓冲液中的1%琼脂糖凝胶电泳来纯化经Nco I和Pac I消化的质 粒pCW099。使用-DA柱(Millipore,Billerica,MA,USA)依 照制造商的指示提取含有176bp wA片段和hygB反向重复序列的698bp片段。 将纯化的片段连接至经Nco I/Pac I消化的pAlLo1(WO 05/056772,实施例1) 以创建pEFer14(图4)。
实施例4:质粒pDM261的构建
质粒pDM261构建成含有TAKA/NA2-tpi前导杂合启动子、大肠杆菌hygB 反向重复序列(hyg IR)、黑曲霉淀粉葡萄糖苷酶(AMG)终止子、和作为选择 标志的全长构巢曲霉amdS基因。
通过TAE缓冲液中的1%琼脂糖凝胶电泳来纯化经Nco I和Pac I消化的质 粒pCW098。使用-DA柱提取含有hygB反向重复序列的527bp 片段。将纯化的片段连接至经Nco I/Pac I消化的pAlLo1以创建pDM261(图5)。
实施例5:质粒pDM266的构建
质粒pDM266构建成含有TAKA/NA2-tpi前导杂合启动子、米曲霉wA基因 的499bp片段、大肠杆菌hygB反向重复序列(hyg IR)、黑曲霉淀粉葡萄糖苷酶 (AMG)终止子、和作为选择标志的全长构巢曲霉amdS基因。
使用下文所示引物wA500FWD(有义)和wA500REV(反义)自米曲霉菌 株A1560(IFO 4177)基因组DNA扩增wA基因的499bp片段。有义引物工程化 改造成在5’末端具有Nco I位点,而反义引物工程化改造成在5’末端具有Not I 位点。使用植物Maxi试剂盒(QIAGEN Inc.,Valencia,CA,USA) 依照制造商的指示制备米曲霉菌株A1560(IFO 4177)基因组DNA。
引物wA500FWD(有义):
5’-ccatggGCGCTCAAAAACAACATCAAC-3’(SEQ ID NO:11)
引物wAREV(反义):
5’-gcggccgcAGAACGAACGCAGGTTTTAT-3’(SEQ ID NO:12)
wA序列以大写字母显示。
扩增反应(50μl)由1X THERMOPOLTM反应缓冲液,0.2mM dNTP,100ng 米曲霉菌株A1560基因组DNA,50pmole引物wA500FWD,50pmole引物 wA500REV,和2.5个单位Taq DNA聚合酶构成。将反应在 5333中温育,编程为30个循环,每个循环94℃30秒、55℃ 30秒、和72℃30秒(最后延伸10分钟)。
513bp的PCR产物通过TAE缓冲液中的1%琼脂糖凝胶电泳来纯化,并使 用-DA柱进一步纯化。使用TA克隆试剂盒连接wA片 段与pCR2.1-并依照制造商的指示转化入ONETOP10化学 感受态大肠杆菌细胞。使用9600纯化来自数个转化子的质粒 DNA,并通过DNA测序来分析以鉴定含有期望的wA插入物的那些。将具有 预期DNA序列的一个质粒命名为MP#8。
将MP#8 DNA用Nco I和Not I消化,并通过TAE缓冲液中的1%琼脂糖凝胶 电泳来纯化。使用凝胶提取试剂盒提取wA片段。将纯化的片段 连接至经Nco I/Not I消化的pDM261以创建pDM266(图6)。
pDM266中的499bp wA片段(wA基因的碱基对2607-3106)与pCW099和 pEFer14中的176bp wA片段具有相同的3’末端。
实施例6:米曲霉的转化和转化子的分析
将米曲霉菌株JaL250(WO 98/11203)在补充有20mM尿苷(uridine)的PDA 板上于34℃培养7天。通过如下收集孢子:添加5ml 0.01%80(Fisher Scientific,Fair Lawn,NJ,USA),使用无菌接种环刮板的表面,并用5ml移 液器收集孢子悬浮液。将大约2-5×107个孢子添加至500ml烧瓶中的100ml YPG培养基,并于30-34℃和140rpm温育16-18小时。使用无菌0.2μm 500ml 过滤单元(Millipore,Billerica,MA,USA)收集菌丝体。自生长培 养基中过滤出菌丝体,然后用100ml 0.7M KCl清洗两次。将菌丝体重悬于20ml 原生质体化溶液(protoplasting solution)[0.7M KCl中5mg/ml (Novozymes A/S,Denmark)加0.5mg/ml几丁质酶(Sigma Chemical Co.,St.Louis,MO,USA)]。将菌丝体转移至125ml摇瓶,并于34℃,80rpm 温育30-90分钟。将原生质体经衬有MIRACLOTHTM(Calbiochem,San Diego, CA,USA)的无菌漏斗倾倒入无菌50ml聚丙烯管。将原生质体在Sorvall RT6000D离心机中以1,303x g于室温离心20分钟。丢弃上清液,并将原生质体 重悬于20ml STC。将原生质体如上所述离心并重悬于20ml STC。取出20μl等 分试样并用STC稀释。使用血球计对原生质体计数。将原生质体如上所述离 心并重悬于适当体积的STC以产生2×107个原生质体/ml。
将5μg pEFer14、pDM261、或pDM266 DNA添加至100μl米曲霉JaL250 原生质体。于室温温育30分钟后,将原生质体/DNA混合物用STC调节至9ml, 分成3份等份,并涂布到3补充有20mM尿苷和1%麦芽糖的150mm COVE 板上。然后将板于34℃温育。在乙酰胺上生长要求每一种表达质粒上所存在 的amdS基因的表达。
温育4天后,在成熟孢子着色变得明显前,将25或30个使用质粒pEFer14、 pDM261、和pDM266获得的初级转化子在补充有20mM尿苷和1%麦芽糖的 COVE2板上划线。所有自pDM261转化子衍生的菌落一律为深绿色。相反, 自pEFer14或pDM266转化子获得的菌落孢子颜色变化范围为浅黄色至深绿 色。如下纯化转化子,即将孢子在补充有20mM尿苷和1%麦芽糖的COVE2 板上划线,然后挑取分离的菌落至相同培养基的板。将所有板于34℃温育。
结果显示于表1。30个孢子纯化的pDM266(499bp wA)转化子中有40%显 示出比野生型浅的孢子着色。30个孢子纯化的pEFer14(176bp wA)转化子中 有30%显示出比野生型浅的孢子着色。25个孢子纯化的pDM261(无wA)转化 子中100%显示出野生型孢子着色。
表1
 质粒   可转录区   %着色浅   %野生型  #筛选  pEFer14   176bp wA,hyg IR   30   70   30  pDM266   499bp wA,hyg IR   40   60   30  pDM261   hyg IR   0   100   25
显示pDM266和pEFer14转化子孢子着色浅的结果指明了与移行RNAi对 wA基因的抑制一致的表型。
实施例7:wA基因沉默的米曲霉转化子的Southern印迹分析
实施了Southern印迹分析来验证6个来自实施例6的选定转化子(如下文 表2中所列举的)的不同孢子着色不是基因破坏的结果。突变型米曲霉P2-5.1 (WO 2005/056772)含有wA基因的破坏。
表2
  菌株名称   孢子颜色   JaL250(未转化)   野生型   DLM1610-45-pDM261#2   野生型   P2-5.1   白色   DLM1641-74-pEFer14#3   浅色   DLM1641-74-pDM266#17   白色   DLM1641-74-pDM266#24   浅色   DLM1641-74-pDM266#29   白色
使用植物Maxi试剂盒依照制造商的指示自上文每一种米曲 霉菌株制备基因组DNA。将2μg每种基因组DNA用Sap I和Cla I于37℃消化过 夜。将经过消化的基因组DNA通过TAE缓冲液中的0.7%琼脂糖凝胶电泳分级 17小时,并使用TURBOBLOTTER(Schleicher & Schuell BioScience,Keene, NH,USA)遵循制造商的推荐印迹到SuPerCharged膜(Schleicher & Schuell BioScience,Keene,NH,USA)上14-16小时。
将膜首先与463bp异羟基洋地黄毒苷配基(digoxigenin)标记的米曲霉wA 探针杂交,该探针是通过使用下文所示引物wA5primeFWD(有义)和引物 wA5primeREV(反义)的PCR掺入异羟基洋地黄毒苷配基-11-dUTP来合成的:
引物wA5primeFWD(有义):
5’-TACTACGGAGACCTTGGAAA-3’(SEQ ID NO:13)
引物wA5primeREV(反义):
5’-GCTCTTAGACAGCCTAGAAT-3’(SEQ ID NO:14)
扩增反应(50μl)由1X THERMOPOLTM反应缓冲液,5μl PCR DIG标记混 合物(Roche Applied Science,Indianapolis,IN,USA)、10ng米曲霉JaL250 基因组DNA(使用植物Maxi试剂盒制备)、10pmol引物 wA5primeFWD、10pmol引物wA5primeREV、和2.5个单位Taq DNA聚合酶构 成。将反应在中温育,编程为30个循环, 每个循环95℃30秒、52℃30秒、和72℃1分钟(最后延伸7分钟)。将PCR反应 通过TAE缓冲液中的0.8%琼脂糖凝胶电泳来纯化,其中异羟基洋地黄毒苷配 基的掺入通过分子量的增加来指示。自凝胶切出463bp产物条带,并使用 凝胶提取试剂盒(QIAGEN Inc.,Valencia,CA,USA)依照制造 商的指示来纯化。
在DIG Easy Hyb缓冲液(Roche Applied Science,Indianapolis,IN,USA) 中于42℃实施杂交15-17小时。然后将膜在高严格条件下在2X SSC加0.1% SDS中于室温清洗两次5分钟,接着在0.5X SSC加0.1%SDS中于65℃清洗2次 15分钟。通过化学发光测定法(Roche Applied Science,Indianapolis,IN,USA) 遵循制造商的指示检测探针-靶物杂合物。
对转化子实施的Southern印迹分析揭示了,所有转化子的杂交条带与含 有全长wA基因的米曲霉宿主菌株JaL250的杂交条带大小相同,比较而言, P2-5.1的杂交条带显著较小。结果证明了非野生型孢子颜色不是基因破坏的 结果。
实施例8:自米曲霉转化子提取RNA
将6个展现出不同孢子颜色的米曲霉转化子(实施例6)涂布在补充有 20mM尿苷和1%麦芽糖的COVE2板上,并于34℃培养7天。将未转化的米 曲霉JaL250的孢子涂布在补充有20mM尿苷的PDA板上,并于34℃培养7天。
在添加5ml 0.01%80后,通过使用无菌的一次性使用的涂布器 (Arben Bioscience,Rochester,NY,USA)刮板的表面来收集每种菌株的孢子。 将每份孢子悬浮液吸入无菌5ml血清学移液管,添加至500ml摇瓶中75ml补充 有10mM尿苷和1%麦芽糖的基本培养基(pH 6.5),并于34℃和65rpm培养 22-24小时。将47mm硝酸纤维素滤器(Whatman Inc.,Florham Park,NJ,USA) 置于无菌0.2μm 250ml MF75过滤单元(Nalgene,Rochester,NY,USA)中滤 膜的上部。将25-75ml每种全培养液置于分开的硝酸纤维素滤器上,并进行 真空过滤,用以在滤器上生成菌丝体薄层。将硝酸纤维素滤器加菌丝体转移 至装有补充有10mM尿苷和1%麦芽糖的基本培养基琼脂(pH 6.5)的60mm 皮氏皿。将琼脂板置于塑料袋中,密封,并于37℃温育。
当米曲霉JaL250对照中开始出现有色的分生孢子梗时(42-48小时),使用 刮勺(spatula)自每个滤器刮取120mg菌丝体,并每个转移至装有1ml RNAPROTM溶液(Q-Biogene,Irvine,CA,USA)的裂解基质C管(Q-Biogene, Irvine,CA,USA)。给裂解基质C管盖紧盖以防止均质化期间的渗漏。将样 品管在FP120仪器(Q-Biogene,Irvine,CA,USA)中以速度6处 理40秒,然后在冰上放置2分钟。再次将样品管以速度6处理40秒,然后在冰 上放置2分钟。将样品在5415D微量离心机中以13,400x g于 4℃离心5分钟。将所得上清液转移至1.7ml微量离心管,然后于室温温育5分 钟。将300μl氯仿添加至样品管,并旋涡震动10秒钟。于室温温育5分钟后, 将样品在5415D微量离心机中以13,400x g于4℃离心5分钟。 将每份样品的上层相(upper phase)转移至新的1.7ml微量离心管,然后于室温 温育5分钟。再次,将300μl氯仿添加至样品,并旋涡震动10秒钟。将样品于 室温温育5分钟,接着在5415D微量离心机中以13,400x g于 4℃离心5分钟。将上层相转移至新的1.7ml微量离心管。将500μl冰冷的乙醇 添加至样品管,并于-20℃温育30分钟。将样品在5415D微量 离心机中以13,400x g于4℃离心20分钟。除去所得上清液,并用75%乙醇清 洗沉淀物。除去乙醇,并让沉淀物于室温干5分钟。将沉淀物重悬于100μl 焦碳酸二乙酯(DEPC)处理的水,接着添加50μl 8M氯化锂(VWR,West Chester,PA,USA)。将样品于-20℃温育1小时。温育后,将样品在 5415D微量离心机中以13,400x g于4℃离心25分钟。自样品管 除去上清液,并用70%乙醇冲洗RNA沉淀物。除去乙醇,并将RNA沉淀物重 悬于25-40μl无DNA酶、RNA酶的水(Sigma-Aldrich,St.Louis,MO,USA)。 使用1000分光光度计(Nanodrop Technologies,Wilmington, DE,USA)对RNA浓度定量。
实施例9:用DNA酶处理米曲霉RNA
使用TURBO无DNATM试剂盒(Ambion,Austin,TX,USA)自米曲霉RNA 样品(实施例8)除去污染性基因组DNA。将3μg提取的RNA与1X TURBO DNA 酶缓冲液(Ambion,Austin,TX,USA)组合,并用无DNA酶、RNA酶的水调 节至10μl体积。将1个单位的TURBO DNA酶(Ambion,Austin,TX,USA) 添加至样品,并于37℃温育30分钟。再添加1个单位的TURBO DNA酶,并 将样品于37℃温育1小时。添加2μl DNA酶灭活试剂(Ambion,Austin,TX, USA)。将样品管的内容物于室温在2分钟温育期期间混合3次,以再分散DNA 酶灭活试剂。通过在5415D微量离心机中以9,300x g离心2分 钟来沉淀DNA酶灭活试剂。将9μl每份上清液转移至0.65ml微量离心管。使 用1000分光光度计测量1μl经DNA酶处理的RNA,以确定 RNA浓度。
实施例10:自米曲霉总RNA样品合成cDNA第一链
使用Transcriptor cDNA第一链合成试剂盒(Roche Applied Science, Indianapolis,IN,USA)自每份提取的米曲霉RNA样品(实施例9)合成cDNA 第一链。将1μg经DNA酶处理的RNA与1.2nmol随机六聚物引物(Roche Applied Science,Indianapolis,IN,USA)组合,并用DEPC处理的水调节至 13μl体积。将样品于65℃温育10分钟,然后放置在冰上。将13μl样品与1X Transcriptor RT反应缓冲液(Roche Applied Science,Indianapolis,IN,USA)、 20个单位Protector RNA酶抑制剂(Roche Applied Science,Indianapolis,IN, USA)、10mM脱氧核苷酸混合物、和10个单位Transcriptor逆转录酶(Roche Applied Science,Indianapolis,IN,USA)在20μl终体积中组合。将反应混合 物于25℃温育10分钟、于50℃温育60分钟、和于85℃温育5分钟。合成后, 将样品放置在冰上。
为了验证清除了污染性基因组DNA和检查cDNA的完整性,用下文所示 跨越内含子的wA和肌动蛋白引物组PCR扩增样品。
引物2wAFWD(有义):
5’-ATGCCTCGCAGCTTATAGGA-3’(SEQ ID NO:15)
引物2wAREV(反义):
5’-CGCACTGATATACGGTTTGG-3’(SEQ ID NO:16)
引物2actinFWD(有义):
5’-GGATCTCTACGGTAACATCGTCA-3’(SEQ ID NO:17)
引物2actinREV(反义):
5’-GATCGGAGATGCCAGGGTA-3’(SEQ ID NO:18)
扩增反应(50μl)由1X THERMOPOLTM反应缓冲液、0.4mM dNTP、2μl模 板cDNA样品、50pmol引物2wAFWD、50pmol引物2wAREV、和2.5个单位 Taq DNA聚合酶构成。对照扩增反应(50μl)由1X THERMOPOLTM反应缓冲 液、0.4mM dNTP、10ng米曲霉JaL250基因组DNA(使用植物Maxi 试剂盒制备、50pmol引物2wAFWD、50pmol引物2wAREV、和2.5个单位Taq DNA聚合酶构成。将反应在MASTERCYCLERTM中温育,编 程为30个循环,每个循环95℃30秒、50℃30秒、和72℃1分钟(最后延伸7分 钟)。通过TAE缓冲液中的0.8%琼脂糖凝胶电泳来纯化PCR产物。结果显示了 使用cDNA模板的PCR反应生成了比使用基因组DNA作为模板的对照PCR反 应要小的扩增子。自基因组DNA生成的PCR扩增子会比自cDNA生成的对应 扩增子要大。因此,cDNA制备物不含有可检测量的基因组DNA。
实施例11:通过实时PCR(RT-PCR)检测稳态wA mRNA米曲霉
使用RT-PCR实现了转化子中米曲霉wA表达水平的测定。使用如实施例 10中所述自每个转化子合成的互补DNA(cDNA)作为RT-PCR反应的模板。wA 基因充当靶DNA序列,而米曲霉肌动蛋白基因(DNA序列为SEQ ID NO:19, 而推导氨基酸序列为SEQ ID NO:20)充当内源对照,以及参比DNA序列。依 照通用探针文库测定法设计软件指南(Universal ProbeLibrary Assay Design Software Guide,Roche Applied Science,Indianapolis,IN,USA)选择和设计 引物及其相应的单色水解探针。首先基于外显子-外显子剪接连接点附近的 期望转录物DNA序列来选择探针。然后设计引物组来扩增跨越该外显子-外 显子剪接连接点或内含子的靶物。选择了如下探针:
通用探针文库探针#131(肌动蛋白-参比)
5’-CTGGTGGT-3’
通用探针文库探针#134(wA-靶物)
5’-CCTCCTTC-3’
使用了以下引物:
引物2wAFWD(有义):
5’-ATGCCTCGCAGCTTATAGGA-3’(SEQ ID NO:21)
引物2wAREV(反义):
5’-CGCACTGATATACGGTTTGG-3’(SEQ ID NO:22)
引物2actinFWD(有义):
5’-GGATCTCTACGGTAACATCGTCA-3’(SEQ ID NO:23)
引物2actinREV(反义):
5’-GATCGGAGATGCCAGGGTA-3’(SEQ ID NO:24)
使用480系统(Roche Applied Science,Indianapolis,IN, USA)实施了相对定量实时PCR测定法。每份RT-PCR反应(20μl)由1X 480探针Master混合物(Roche Applied Science, Indianapolis,IN,USA)、200nM有义引物、200nM反义引物、100nM探针、 和不同稀释度(即,未稀释的、1∶10、1∶100、1∶1000)的cDNA模板构成。在 480系统中实施RT-PCR反应,编程为45个循环,每个循环 95℃变性10秒及对于扩增产物的定量和延伸均为60℃30秒。使用384孔板 (Roche Applied Science,Indianapolis,IN,USA)一式三份地制备每份样品。 在测试的每块384孔板上运行阴性对照(其中用PCR级的水替换模板cDNA)以 揭示假定的假阳性结果。
使用480相对定量软件(Roche Applied Science, Indianapolis,IN,USA)分析自480系统获得的数据。在相 对定量方法中,通过计算靶基因浓度相对于不受调节的参比基因,对每份样 品校准由初始样品浓度的差异、样品加载中的变异、移液误差、或cDNA合 成效率的差异引起的质量和数量差异。不仅测定了靶基因/参比基因比,而且 通过校准靶物和参比基因的PCR效率的任何差异的校准物(calibrator)进行了 标准化。相对定量分析结果表述为标准化的比,其中将样品中靶DNA序列对 参比DNA序列的比除以标准样品或校准物中这两种序列的比。
首先使用未转化的米曲霉JaL250作为标准样品为靶物和参比物生成了 标准曲线。标准曲线分别为靶物和参比物生成了0.996和0.995的R2值。由 Roche480相对定量软件为靶物和参比物计算得出的PCR 效率值分别为1.757(误差0.0449)和1.907(误差0.0287)。为了比较实施例7中 所列出的所有菌株间的mRNA的相对表达水平,如上所述实施了实时PCR反 应。使用480相对定量软件收集和分析数据,并与先前依 照Roche480相对定量软件手册(Roche Applied Science, Indianapolis,IN,USA)生成的标准曲线进行比较。使用相对定量分析,米 曲霉DLM1610-45-pDM261#2(即具有野生型孢子颜色的转化子)中的wA mRNA表达水平与未转化的米曲霉JaL250菌株相当。米曲霉 DLM1641-74-pEFer14#3和米曲霉DLM1641-74-pDM266#24(即具有浅色孢 子的转化子)中的wA mRNA相对表达水平分别显示出与具有野生型孢子颜色 的菌株中的wA mRNA水平相比的67%和62%降低。米曲霉 DLM1641-74-pDM266#17和米曲霉DLM1641-74-pDM266#29(即具有白色孢 子的菌株)显示出与具有野生型孢子颜色的菌株中的wA mRNA相比的73%和 81%降低。
实施例12:质粒pAmFs031的构建
为了抑制黑曲霉ATCC 1015聚化合物合酶基因(cDNA序列为SEQ ID NO:25,推导氨基酸序列为SEQ ID NO:26)的表达,构建了移行RNAi表达载 体。
质粒pAmFs031构建成含有TAKA/NA2-tpi前导杂合启动子、黑曲霉聚酮 化合物合酶基因的开读框的片段、大肠杆菌hygB反向重复序列(hyg IR)、黑 曲霉淀粉葡萄糖苷酶终止子、和作为选择标志的全长构巢曲霉amdS基因 (Kelly和Hynes,1985,EMBO J.4:475-479)。选择黑曲霉聚酮化合物合酶 基因作为沉默靶物,因为它与丝状真菌中分生孢子色素生物合成所牵涉的其 它聚酮化合物合酶具有序列同一性。
使用下文所示拥有5’Nco I限制性位点的有义链引物和拥有5′Not I限制 性位点的反义引物自分离自黑曲霉菌株MBin120(WO 2004/090155)的基因 组DNA扩增黑曲霉聚酮化合物合酶开读框(DNA序列为SEQ ID NO:27,推导 氨基酸序列为SEQ ID NO:28)内的502bp片段。
引物56896F(有义):
5’-ggggccatggTCAGCGCGGTAAGCTCTAAT-3’(SEQ ID NO:29)
引物56896R(反义):
5’-gggggcggccgcGTAAGGTTCCGCATTTCTGG-3’(SEQ ID NO:30)
聚酮化合物合酶编码序列以大写字母显示。
扩增反应(50μl)由1X反应缓冲液(Stratagene,La Jolla, CA,USA)、0.2mM dNTP、128ng黑曲霉MBin120基因组DNA(使用 植物Maxi试剂盒制备)、20pmole有义引物、20pmole反义引物、 和2.5个单位HERCULASE Hotstart DNA聚合酶(Stratagene,La Jolla,CA, USA)构成。将反应在5333中温育,编程 为30个循环,每个循环94℃30秒、55℃30秒、和72℃1分钟(最后延伸7分钟)。
将所得502bp PCR产物和pDM261用Nco I和Not I消化,通过TAE缓冲液 中的0.75%琼脂糖凝胶电泳来纯化,并使用试剂盒进一步纯化 PCR产物或使用凝胶提取试剂盒进一步纯化质粒。使用 FAST-LINKTM DNA连接试剂盒(Epicentre Biotechnologies,Madison,WI, USA)连接PCR产物与pDM261质粒片段,并依照制造商的指示(Stratagene, La Jolla,CA,USA)转化入SURETM II化学感受态大肠杆菌细胞。使用 9600纯化来自数个转化子的质粒DNA,并通过DNA测序来分 析以鉴定含有期望的聚酮化合物合酶插入物的那些。将具有预期DNA序列的 一个质粒命名为pAmFs031(图7)。
实施例13:黑曲霉的转化和转化子的分析
将黑曲霉菌株MBin120在PDA板上于34℃培养14天。如下收集孢子,即 添加7ml 0.01%20(Fisher Scientific,Fair Lawn,NJ,USA),使用 无菌接种环刮板的表面,并用5ml移液器收集孢子悬浮液。给装有25ml补充 有1M蔗糖的YPG培养基的500ml玻璃摇瓶接种2.6×108个孢子,并于28℃和 150rpm温育15小时。使用无菌0.2μm 500ml过滤单元(Millipore, Billerica,MA,USA)收集菌丝体。自生长培养基中过滤出菌丝体,然后用 150ml 1M山梨醇清洗两次。将菌丝体重悬于30ml含有20mg 和0.4mg几丁质酶每ml 1M山梨醇的原生质体化溶液。将菌丝体转移至 125ml玻璃摇瓶,并于34℃,100rpm温育45分钟。将原生质体经衬有 MIRACLOTHTM的无菌漏斗倾倒入无菌50ml聚丙烯管。然后给管注满冰冷的 1M山梨醇。将原生质体在Sorvall RT6000D离心机中以1,303x g于室温离心5 分钟。丢弃上清液,并将原生质体重悬于50ml 1M山梨醇。将原生质体在 Sorvall RT6000D离心机中离心,并重悬于10ml STC。取出20μl等分试样并用 STC稀释。使用血球计对原生质体计数。将原生质体在Sorvall RT6000D离心 机中离心,并重悬于适当体积的PEG 4000(Polysciences,Inc.,Warrington, PA,USA)以产生2×107个原生质体/ml。
将5μg pAmFs031或pDM261 DNA添加至100μl黑曲霉MBin120原生质 体。于冰上温育30分钟后,将1ml SPC添加至原生质体/DNA溶液,并温和混 匀。将溶液于室温温育30分钟。然后,将10ml冷却至50℃的溶解的amdS覆盖 琼脂添加至转化混合物,并散布到150mm COVE板上。然后将板于34℃温育。 在乙酰胺上生长要求每一种表达质粒中所存在的amdS基因的表达。
温育4天后,为pAmFs031和pDM261每一种获得10个初级转化子。将转 化子在补充有1%麦芽糖的COVE A减尿素加乙酰胺板上划线。所有自 pDM261衍生的菌落一律为深黑色。相反,自pAmFs031转化子获得的菌落孢 子颜色变化范围为白色至深褐色。如下纯化转化子,即将孢子在补充有1% 麦芽糖的COVE A减尿素加乙酰胺板上划线,然后挑取分离的菌落至相同培 养基的板。菌株纯化总共重复四次。将所有板于34℃温育。
10个孢子纯化的pAmFs031转化子中有3个展现出比野生型浅的孢子着 色。10个孢子纯化的pDM261“空载体”转化子都显示出野生型孢子着色。 显示pAmFs031转化子孢子着色浅的这些结果指明了与对聚酮化合物合酶基 因的移行RNAi相关抑制一致的表型。
实施例14:聚酮化合物合酶沉默的和对照黑曲霉菌株的生长和RNA提取
将以下黑曲霉菌株在补充有1%麦芽糖的COVE A减尿素加乙酰胺板上 于34℃培养7天:2个具有白色孢子的黑曲霉pAmFs031菌株(称作 pAmFs031-W1和pAmFs031-W2),1个具有黑色孢子的黑曲霉pAmFs031菌株 (称作pAmFs031-B1),和1个用pDM261转化的黑曲霉菌株。在PDA板上培养 未转化的对照菌株黑曲霉MBin120。如下为每一个菌株收集孢子,即添加5ml 0.01%20,用无菌接种环刮板的表面,并用10ml移液器收集孢子 悬浮液。将40μl孢子悬浮液与10ml M410培养基混合,并将1ml此混合物添加 至24孔聚苯乙烯微量滴定板(Corning Incorporated,Corning,NY,USA)的每 个孔。在分开的微量滴定板中培养每一个菌株以避免交叉污染。将板在湿度 控制室中于34℃温育4天,此时,对于所有菌株,真菌在孔间形成菌丝体生 长的连续垫,而且存在有色的分生孢子梗。
使用RNAPROTM Pro Red试剂盒(Q-Biogene,Irvine,CA,USA)在菌丝 体垫提取总RNA。自孔中取出垫,并置于纸巾上以吸收任何多余的培养基。 将总共200mg每种菌丝体垫组织转移至装有1ml RNAPROTM溶液 (Q-Biogene,Irvine,CA,USA)的ProRed管。使用 FP120仪器将菌丝体以速度6均质化40秒。将每份样品在Sorvall MC12V微量 离心机中以13,400x g于4℃离心5分钟。将水相转移至1.7ml微量离心管。将 样品于室温温育5分钟。添加300μl氯仿,并将样品旋涡震动10秒钟,然后于 室温温育5分钟。将样品在Sorvall MC12V微量离心机中以13,400x g于4℃离 心5分钟。将上层相转移至新的1.7ml微量离心管。再次如上所述用氯仿提取 样品。添加500μl冰冷的乙醇,并将样品于-20℃保存1小时。将样品在Sorvall MC12V微量离心机中以13,400x g于4℃离心20分钟。除去乙醇,并用75%乙 醇清洗沉淀物。除去乙醇,并让沉淀物风干5分钟。将RNA样品重悬于100μl DEPC处理的水。添加50μl 8M LiCl,并将样品于-20℃保存1小时。将样品在 Sorvall MC12V微量离心机中以13,400x g于4℃离心25分钟。除去LiCl,并将 500μl 75%乙醇添加至沉淀物,然后除去。让沉淀的样品风干5分钟。将RNA 样品重悬于30μl DEPC处理的水。使用1000分光光度计测量 RNA浓度。将样品保存于-80℃。
实施例15:合成cDNA第一链
使用TURBO DNA酶试剂盒(Ambion,Inc.,Austin,TX,USA)的试剂, 用DNA酶处理来自实施例14中所描述的每一种黑曲霉菌株的RNA样品以清 除基因组DNA。将3μg RNA与1μl TURBO DNA酶缓冲液(Ambion,Inc., Austin,TX,USA)组合,并用DEPC处理的水调节至10μl体积。添加TURBO DNA酶(Ambion,Inc.,Austin,TX,USA)的0.5μl等分试样,并将样品于37℃ 温育30分钟。添加TURBO DNA酶的第二个0.5μl等分试样,并再次将样品于 37℃温育30分钟。添加2μl灭活试剂(Ambion,Inc.,Austin,TX,USA),并 将样品于室温在2分钟温育期期间混合3次。将样品在5415D 微量离心机中以9,300x g离心2分钟。将9μl上清液转移至0.6ml微量离心管。 使用1000分光光度计测量RNA浓度。将样品保存于-80℃。
使用Transcriptor逆转录酶cDNA第一链合成试剂盒(Roche Applied Science,Indianapolis,IN,USA)合成cDNA第一链。为实施例14中所描述的 5种黑曲霉菌株中的每一个制备4个文库,其中使用不同量的经DNA酶处理的 RNA:将1-2μl体积中的300ng、600ng、900ng、和1.2μg经DNA酶处理的RNA 与2μl随机六聚物引物(Roche Applied Science,Indianapolis,IN,USA)组合, 并用DEPC处理的水调节至13μl体积。将样品于65℃温育10分钟,然后放置 在冰上。将Transcriptor逆转录酶Master混合物的6.5μl等分试样(4μl Transcriptor逆转录酶缓冲液,0.5μl Protector RNA酶抑制剂,和2μl dNTP混合 物)添加至管,接着添加Transcriptor逆转录酶的0.5μl等分试样。自冰中取出 样品,并转移至5333,编程为25℃10分 钟、55℃60分钟、和85℃5分钟。将样品保存于-80℃。
实施例16:通过实时PCR检测黑曲霉聚酮化合物合酶mRNA
通过RT-PCR对实施例14中所描述的黑曲霉菌株中黑曲霉聚酮化合物合 酶mRNA的相对表达水平进行定量。如实施例15中所描述的,自每一种菌株 提取总RNA,充当cDNA第一链合成的模板。cDNA第一链充当RT-PCR的模 板。使用黑曲霉肌动蛋白基因作为参比标准(即,内部对照)。使用Roche通用 探针文库设计中心软件(Universal ProbeLibrary Design Center Software,Roche Applied Science,Indianapolis,IN,USA)设计探针和引物。使用了如下引物 和探针对:
黑曲霉聚酮化合物合酶正向引物(62488):
5’-tcgtgaatcaggtcctagcc-3’(SEQ ID NO:31)
黑曲霉聚酮化合物合酶反向引物(62489):
5’-aaacaacccaattggtagatgc-3’(SEQ ID NO:32)
Roche通用探针文库探针#80(04689038001):
5’-cctggaga-3’
黑曲霉肌动蛋白正向引物(62520):
5’-atctgtacggcaacattgtca-3’(SEQ ID NO:33)
黑曲霉肌动蛋白反向引物(62521):
5’-ttctgcatacggtcggagat-3’(SEQ ID NO:34)
Roche通用探针文库探针#131(04694155001):
5’-ctggtggt-3’
使用480系统和上文Roche通用探针文库探针实施了 RT-PCR试验,所述探针预先在5’末端标记荧光素,在3’末端附近标记深色淬 灭剂(quencher)染料。每个反应混合物含有10μl480探针 Master混合物、0.1μM Roche通用探针文库探针、0.2μM正向引物、0.2μM反 向引物、和2μl cDNA第一链(如实施例15中所描述的,自不同量的总RNA生 成),总体积20μl。所有RT-PCR反应都在384孔板(Roche Applied Science, Indianapolis,IN,USA)中进行。RT-PCR反应在480系统中 实施,编程为1个循环的95℃预温育10分钟(4.8℃/s);45个循环使用定量分析 模式的扩增,95℃10秒(4.8℃/s),55℃15秒(2.5℃/s),72℃1秒(4.8℃/s)(以获 取模式Single);和1个循环的40℃冷却10秒(2℃/s)。为了对靶物(聚酮化合物 合酶基因)和参比物(肌动蛋白基因)生成标准曲线和PCR效率值,自2个cDNA 文库创建4个连续稀释。在分开的反应中用靶物和参比物的探针/引物组一式 四份地测定这些连续稀释的每一个。标准曲线分别对靶物和参比物生成了 0.996和0.998的R2值。由480相对定量软件为靶物和参比物 计算得出的PCR效率值分别为1.950(误差0.0266)和1.854(误差0.0181)。为了 比较所有5种黑曲霉菌株间的聚酮化合物合酶mRNA的相对水平,对每一种 cDNA文库一式三份地测定3个稀释度。在对于每个稀释度和每次重复的单独 反应中使用靶物和参比物的探针/引物组实施了RT-PCR反应。使用 480相对定量软件依照制造商将这些数据与标准曲线进行 比较。使用这种分析方法,相对于未处理的对照样品计算经处理样品的表达 量。由标准曲线除以未处理对照样品的量来确定经处理样品的量。如此,将 未处理样品称作1X样品,而将所有其它的量表述为相对于未处理样品的n倍 差异。然后,将经处理样品的量相对于内源对照肌动蛋白进行标准化,以解 决(account for)添加至每个反应的总RNA量的差异。
使用相对定量分析,测定出,菌株pAmFs031-W1和pAmFs031-W2中的 黑曲霉聚酮化合物合酶mRNA的相对表达水平显著低于菌株黑曲霉MBin120 pAmFs031-B1、黑曲霉MBin120 pDM261、或未转化的黑曲霉MBin120,这 与孢子着色中观察到的变化相关联。黑曲霉MBin120 pAmFs031-W1和黑曲 霉MBin120 pAmFs031-W2菌株显示出与“空载体”对照菌株相比聚酮化合 物合酶mRNA的68%和82%降低。如实施例17中所述,对相同菌株实施了 Southern印迹以证实完整聚酮化合物合酶基因的存在,并消除转录物的降低 是由于聚酮化合物合酶基因自身破坏的可能性。
实施例17:通过Southern印迹检测黑曲霉聚酮化合物合酶基因
使用植物Maxi试剂盒自以下黑曲霉菌株(实施例16中所描述 的)提取基因组DNA:未转化的黑曲霉MBin120,黑曲霉MBin120 pAmFs031-W1,黑曲霉MBin120 pAmFs031-W2,黑曲霉MBin120 pAmFs031-B1,和黑曲霉MBin120 pDM261。将每种菌株的总共2μg基因组 DNA用Hind III于37℃消化17小时。将经过消化的基因组DNA和DIG标记的 DNA分子量标志物II(Roche Applied Science,Indianapolis,IN,USA)加载到 TAE缓冲液中的0.7%琼脂糖凝胶上,并施加22V电流17小时。使用20X SSC 转移缓冲液将DNA自凝胶转移到SuPerCharged膜上18小时。使用 紫外线照射将DNA交联至膜,然后在DIG Easy Hyb溶液(Roche Applied Science,Indianapolis,IN,USA)中于42℃平衡30分钟。将膜用20μl重悬于 DIG Easy Hyb溶液(Roche Applied Science,Indianapolis,IN,USA)的DIG标 记的434bp PCR产物于42℃探查(probe)18小时。434bp DIG标记的DNA探针 是使用PCR DIG探针合成试剂盒(Roche Applied Science,Indianapolis,IN, USA)和下文所示引物合成的。
黑曲霉聚酮化合物合酶Southern正向引物(062849):
5’-ttaattaatcggtcaatcgccgttgtcaga-3’(SEQ ID NO:35)
黑曲霉聚酮化合物合酶Southern反向引物(062850):
5’-aatttccaaacagggtaactccac-3’(SEQ ID NO:36)
扩增反应(50μl)由1X PCR缓冲液、5μl PCR DIG探针合成混合物、50μM 有义引物、50μM反义引物、2.6个单位Expand高保真聚合酶、和50ng黑曲霉 MBin120基因组DNA(如上所述纯化)构成。将反应在 MASTERCYCLERTM 5333中温育,编程为30个循环,每个循环94℃30秒、55℃ 30秒、和72℃30秒(最后延伸7分钟)。探针序列与黑曲霉聚酮化合物合酶基因 (其序列包含在8.8kb Hind III基因组DNA片段内)的启动子(5’非翻译区)互补。
探查膜后,将膜用2X SSC加0.1%SDS低严格性缓冲液于室温清洗5分 钟,接着用0.5X SSC加0.1%SDS于65℃进行两次高严格性清洗,每次15分钟。 然后使用DIG发光检测试剂盒(Roche Applied Science,Indianapolis,IN,USA) 遵循制造商的说明书显现发生了杂交的DIG标记的探针和分子量标志物。将 印迹对Biomax XAR胶片(Sigma Aldrich,St.Louis,MO,USA)曝光,并使用 Konica SRX-101A胶片处理器(Konica Minolta Medical Imaging USA Inc., Wayne,NJ,USA)显影以显现被标记的DNA。结果证明了所有菌株展现出 预期的8.8kb条带,证明了整个基因在所有测试的菌株中保持完整。
实施例18:里氏木霉移行RNAi表达载体pAL02的构建
为了抑制里氏木霉β-木糖苷酶基因(DNA序列为SEQ ID NO:37,推导氨 基酸序列为SEQ ID NO:38)的表达,构建了移行RNAi表达载体。
用Pac I和MluI消化移行RNAi质粒pEvFz-14,以分离潮霉素反向重复序 列。通过TAE缓冲液中的1.0%琼脂糖凝胶电泳解析527bp片段,然后从凝胶 中切下。使用凝胶提取试剂盒依照制造商的指示纯化片段。然 后使用快速连接试剂盒(Roche Applied Science,Indianapolis,IN,USA)将经 过纯化的片段连接至经Pac I和Mlu I消化的pMJ09(WO 2005/056772)。依照制 造商的指示(Stratagene,La Jolla,CA,USA)使用2μl连接混合物来转化 SURETM化学感受态大肠杆菌细胞。使用9600纯化来自数个转 化子的质粒DNA,并通过用Pac I和Mlu I消化来分析。通过TAE缓冲液中的 1.0%琼脂糖凝胶电泳来解析限制性消化的产物。通过DNA序列分析证实了一 个转化子拥有527bp潮霉素反向重复序列,并命名为pAL01(图8)。
采用PCR来扩增包含里氏木霉β-木糖苷酶编码区(DNA序列为SEQ ID NO:39,推导氨基酸序列为SEQ ID NO:40)的部分的500bp片段,利用来自里 氏木霉RutC30(WO 2005/056772)的基因组DNA充当模板。来自里氏木霉 RutC30的基因组DNA是使用植物Maxi试剂盒依照制造商的指示 分离的。如下所示,有义引物设计成在5’末端掺入Nco I位点,而反向引物设 计成在5’位点掺入Mlu I位点。
有义引物:
5’-CCATGGTACGAGTTTGGCAGTGGTCT-3’(SEQ ID NO:41)
反义引物:
5’-ACGCGTTTATGCGTCAGGTGTAGCAT-3’(SEQ ID NO:42)
扩增反应(50μl)由10X HERCULASETM反应缓冲液(Stratagene,La Jolla, CA,USA)、0.8mM dNTP、200ng如实施例7中所述制备的里氏木霉RutC30 基因组DNA、1ng引物、和2.5个单位HERCULASE HOTSTARTTM聚合酶 (Stratagene,La Jolla,CA,USA)构成。将反应在 5333中温育,编程为1个循环的92℃2分钟;30个循环, 每个循环92℃30秒,58℃30秒,和68℃1分钟;和10分钟最终延伸。通过TAE 缓冲液中的1.0%琼脂糖凝胶电泳来分离反应产物,其中自凝胶中切出500bp 条带并使用凝胶提取试剂盒依照制造商的指示纯化。用Nco I和 Mlu I消化经过纯化的PCR片段,并使用快速连接试剂盒连接入经Nco I和Mlu I消化的pAL01中。依照制造商的指示使用连接混合物来转化SURETM化学感 受态大肠杆菌细胞。然后通过菌落PCR来筛选转化子,以鉴定含有期望的β- 木糖苷酶插入物的那些。反应(20μl)由2μl 10X THERMOPOLTM反应缓冲液、 0.4μl 10mM dNTP、1μl悬浮于50μl去离子水的大肠杆菌转化子菌落、和1 pmol β-木糖苷酶扩增引物构成。将反应在 5333中温育,编程为1个循环的94℃2分钟;17个循环, 每个循环94℃30秒,55℃30秒,和72℃30秒;和5分钟的最后延伸。通过TAE 缓冲液中的1.0%琼脂糖凝胶电泳来分离扩增产物。使用9600 纯化来自数个含有500bp β-木糖苷酶扩增产物的的转化子的质粒DNA,并通 过DNA测序来分析。一个含有500bp β-木糖苷酶扩增产物的质粒的DNA序列 分析证实了预期的插入物,并命名为pAL02(图9)。
实施例19:里氏木霉中里氏木霉β-木糖苷酶基因的移行RNAi的转化和测 定
使用5μg pAL02来转化里氏木霉SaMe13,一种cbh1被删除的菌株(WO 2005/030926)。如下收获里氏木霉SaMe13孢子,即将20ml 0.01%80 倾倒到成熟里氏木霉SaMe13的COVE2板上并用皮氏皿涂布器刮下孢子。将 孢子混合液吸入20ml移液器。将大约2-5×107个孢子接种入100ml补充有2% 葡萄糖和10mM尿苷的YP培养基中,并于27℃和90rpm温育16小时。使用 500ml STERICUPTM过滤单元(Millipore,Burlington,MA,USA)收集菌丝体, 并用100ml去离子水清洗两次。然后将菌丝体用250ml 1.2M山梨醇清洗两次。 将清洗后的菌丝体重悬于20ml 1.2M山梨醇、5mg/ml和 0.5mg/ml几丁质酶。将混合物于34℃和90rpm温育15-25分钟。将烧瓶在冰 上放置5分钟,接着通过MIRACLOTHTM过滤。将含有原生质体的滤器置于 50ml FALCONTM管(VWR International,West Chester,PA,USA)中。将管在 Sorvall RT6000D离心机中以370x g离心10分钟。丢弃上清液,将原生质体沉 淀物重悬于25ml 1.2M山梨醇并在Sorvall RT6000D离心机中以370x g离心10 分钟。丢弃上清液,并将沉淀物重悬于25ml 1.2M山梨醇。取出10μl,并如 上所述将管离心,同时在血球计中对原生质体计数。丢弃上清液,并将沉淀 物以1×108个原生质体/ml STC的浓度重悬。
将由100μl原生质体悬浮液、1-10μg 10μl STC中的质粒DNA、和250μl 聚乙二醇组成的转化混合物温和混匀。将混合物于室温温育30分钟。添加3ml STC,混匀,并倾倒到150mm COVE板上。将板于28℃温育10-14天。
选择了20个转化子(即AL02-1到AL02-20)和4个含有pAL01的对照转化 子,将来自单菌落的孢子在COVE板上划线,并于28℃温育5天。将来自这些 板的孢子接种入装有25ml纤维素酶诱导培养基的125ml带挡板的摇瓶中,并 于28℃和200rpm培养5天。接种后5天,取出1ml培养液样品,在 离心机5415D中以6,000x g离心10分钟,并将上清液转移至新的 管。使用培养液样品的复制品测定β-木糖苷酶活性和β-葡萄糖 苷酶活性。
使用Coulter Biomek 3000,Biomek NX,和ORCA机械臂(Beckman Coulter,Inc,Fullerton,CA,USA),对上文上清液测定β-木糖苷酶活性。 将培养物上清液在0.1M琥珀酸盐、0.01%Triton X-100pH 5.0(样品缓冲液) 中适当稀释,接着连续稀释,从稀释样品的0倍到1/3倍到1/9倍。将每个稀释 度总共20μl转移至96孔平底板。将200μl底物溶液(每ml 0.1M琥珀酸盐pH 5.0 含有1mg对硝基苯基-β-D-吡喃木糖苷)添加至每个孔,然后于环境温度温育 45分钟。温育期完成时,将50μl 1M TRIS缓冲液pH 9添加至每个孔,以终止 反应。在405nm光密度对96孔板测量终点。
使用Coulter Biomek 3000,Biomek NX,和ORCA机械臂,对上文上清 液测定β-葡萄糖苷酶活性。将培养物上清液在0.1M琥珀酸盐、0.01%Triton X-100pH 5.0(样品缓冲液)中适当稀释,接着连续稀释,从稀释样品的0倍到 1/3倍到1/9倍。将每个稀释度总共20μl转移至96孔平底板。将200μl底物溶液 (每ml 0.1M琥珀酸盐pH 5.0含有1mg对硝基苯基-β-D-吡喃葡萄糖苷)添加 至每个孔,然后于环境温度温育45分钟。温育期完成时,将50μl 1M TRIS缓 冲液pH 9添加至每个孔,以终止反应。在405nm光密度对96孔板测量终点。 使用以下方程来测定样品活性:
[({OD405/消光系数}X1×106)/温育时间]/样品体积
其中消光系数=17,749,温育时间=45,而样品体积=0.02。
计算自β-木糖苷酶活性测定法获得的OD与自β-葡萄糖苷酶测定法确定 的活性之间的比值,并报告为BX/BG。由于β-葡萄糖苷酶是天然存在的,因 此使用它的活性作为对各转化子间生长差异进行标准化的手段。结果显示于 表3。
表3
  样品   β-木糖苷酶1   β-葡萄糖苷酶2   蛋白质3   BX/BG比4   AL02 1   5.53±1.10   965.63±107.02   3.51±0.48   0.006±0.001   AL02 2   10.13±2.38   857.73±40.30   4.23±0.51   0.012±0.004   AL02 3   9.89±1.60   1139.06±37.99   2.54±0.31   0.009±0.002   AL02 4   2.94±0.25   174.90±45.20   1.38±0.25   0.017±0.007   AL02 5   15.67±2.55   919.14±39.01   3.56±0.03   0.017±0.004   AL02 6   15.04±7.12   725.61±225.20   4.58±1.96   0.021±0.004   AL02 7   4.78±0.44   494.99±69.17   3.29±0.17   0.010±0.003   AL02 8   3.87±0.22   507.37±262.44   3.25±0.09   0.008±0.005   AL02 9   9.70±3.52   771.72±35.46   4.25±0.43   0.013±0.005   AL02 10   3.25±1.61   576.40±202.08   2.45±1.04   0.006±0.001   AL02 11   3.47±2.19   667.39±159.68   2.21±0.76   0.005±0.003   AL02 13   7.27±2.44   521.00±66.65   3.40±0.74   0.014±0.004   AL02 14   5.75±2.54   834.19±414.42   4.54±1.58   0.007±0.000   AL02 15   10.58±0.64   625.86±427.59   5.51±2.95   0.017±0.015   AL02 16   1.80±0.60   309.91±39.37   4.51±1.76   0.006±0.002   AL02 17   7.31±6.48   477.29±370.17   6.75±2.44   0.015±0.003   AL02 18   6.04±3.83   556.43±143.08   4.69±1.81   0.011±0.005   AL02 19   1.64±0.42   226.67±24.94   2.49±0.12   0.007±0.001   AL02 20   3.55±1.78   410.71±261.33   3.91±1.97   0.009±0.001   AL03 ev   3.59±0.78   320.76±92.52   3.60±1.36   0.011±0.003
1β-木糖苷酶活性是使用对硝基苯基-β-D-吡喃木糖苷作为底物测量的。数值表述为吸光度 单位±标准偏差(n=2,除了n=4的样品AL03 ev)。
2β-葡萄糖苷酶活性是使用对硝基苯基-β-吡喃葡萄糖苷作为底物测量的。数值表述为μmol 被水解的底物每分钟每ml培养液±标准偏差(n=2,除了n=4的样品AL03 ev)。
3蛋白质浓度是使用BCA测定试剂测定的。数值表述为mg/ml培养液±标准偏差(n=2, 除了n=4的样品AL03 ev)。
4β-木糖苷酶和β-葡萄糖苷酶活性比±标准偏差(n=2,除了n=4的样品AL03 ev)。
大约5/20的转化子表现出以对照的36%至55%的值表达BX/BG。这些结 果证明了移行RNAi能用于成功敲低里氏木霉中的基因表达。
本申请描述和要求保护的本发明并不受限于本申请所公开的具体方面 的范围,因为这些方面意欲作为本发明几个方面的说明。任何等价的方面意 欲在本发明的范围之内。实际上,从前面的说明中,除本申请所显示和描述 的之外,本发明的多种修改对于本领域的技术人员来说是显而易见的。这些 修改也意欲落入所附的权利要求的范围内。在冲突的情况下,将以包括定义 的本公开为准
本申请引用了多篇参考文献,其公开的内容通过提述以其整体并入。
序列表
<110>诺维信股份有限公司(Novozymes,Inc.)
<120>通过移行RNA干扰来降低或消除丝状真菌菌株中的基因表达的方法
<130>10918.204-WO
<150>60/876,895
<151>2006-12-21
<160>42
<170>PatentIn version 3.5
<210>1
<211>38
<212>DNA
<213>大肠杆菌(Escherichia coli)
<400>1
gcggccgcgc gatgttcggg gattcccaat acgaggtc                             38
<210>2
<211>36
<212>DNA
<213>大肠杆菌(Escherichia coli)
<400>2
cccggggcat catcgaaatt gccgtcaacc aagctc                               36
<210>3
<211>38
<212>DNA
<213>大肠杆菌(Escherichia coli)
<400>3
ttaattaagc gatgttcggg gattcccaat acgaggtc                             38
<210>4
<211>36
<212>DNA
<213>大肠杆菌(Escherichia coli)
<400>4
cccgggatcg gtccagacgg ccgcgcttct gcgggc                               36
<210>5
<211>6651
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>5
atggaggggc cacgcggcgt ctatctcttc ggagaccaga caagtgattt cgacgccggc     60
ttacgtcgcc tcctacaagt aaagaataac acaattgttg catcgttctt ccagagatgc    120
tttcacgctt tgcgccaaga gatcgcgagg ctttcaccat ctgaacggaa gatcttcccc    180
cggtttacga gcatagtgga tctactggcg cgtcaccggg agtcagaccc taatccggct    240
ctggagagtg cgttgacctg tatctatcaa ttgggatgct ttataaagta cgtgtaactg    300
cagatcctga cccgtttgaa cgagcctaac ctgagatagc tactacggag accttggaaa    360
cgtgtaccca tctgcttcag actgccatat agttggcctg tgcgcgggtc ttcttagttc    420
tgcagctgta agctgttcga acaatgttgg agaattgctc cccgctgcgg ttgaagcggt    480
ggtggtagct ctccgacttg gtctatgcgt ccttaaagtt cgagagctgg tgagctctga     540
ccaagcgtcg tcaacaagct ggtcagtctt gatttcaggg attagcgaga aagatgcctc     600
gcagcttata ggagaattca ctgctgaacg ggtaagtcaa ttgatctgaa atagtttgca     660
ggacagaatg ttctaaccac tggataaagg caattcctcc ttcatccaaa ccgtatatca     720
gtgcggtggg atataacagt ataaccatca gcgcaccgcc taaggtcctt gatgatttaa     780
ttgattctag gctgtctaag agccataagc cggtgagggc gcaaatccat ggtccttacc     840
atgcagcaca tctgtactat ggccgagatg tcgacaggat catcgaaagc tgccataatg     900
aggtcgtttc aaactacaca ccccgtatcc ccgtactatc aagtactacg ggacagccga     960
tagaggccaa acacatgaaa gatctactta aggccgccct tgaagagatt ctactacgtc    1020
aactatgctg ggagaaagtg accgatgcct gctattccat attaaaaact gctcgtcatc    1080
aaccatgcaa gttgttccca atttcaagca ctgcgacaca aagcttgttt acagctctta    1140
cgaaagccgg gataaccgac atcgaagtgg aaaatgggct cggagatgtt cccacgaacc    1200
cgaaggacaa ccttaacatc agcggcaggg cggactgctc caagatagct atcattggca    1260
tgtctggacg attcccagaa gctgatggca cagagagttt ctgggacctt ctgtataatg    1320
gcctcgatgt acaccggaag gtgcctgcag agcgttggga tgttgatgcc cacgttgatc    1380
ctaccggaac aaaacggaac accagcaagg ttccatacgg atgctggata aacgaaccgg    1440
ggttatttga cccccgcttc ttcaatatgt cgccacgcga agccctccag gcagatcccg    1500
ctcaaagact tgcattgctc acggcctatg aagctcttga aatggccggc tttatccccg    1560
acagcacccc ttctacacag agggatcgag tcggcctctt ctatggaatg actagcgatg    1620
actatcggga gataaatagt ggtcaagata ttgatactta ctttatccct ggtgggaatc    1680
gtgctttcac acctggccgg ataaactact atttcaagtt cagtgggccc agcgtcagcg    1740
ttgatacagc ttgttcttca agtcttgcgg ctattcatat ggcttgcaat tcgatctgga    1800
gaaatgattg cgatgctgct attgctggag gtgtcaatat attgacaaac cctgataacc    1860
atgccggtct tgaccgtggc catttcctgt ccagaaccgg gaattgcaac acatttgacg    1920
atggtgctga tggctactgt agagcagatg gagtgggtac aatcattctc aagcggctgg    1980
aagacgctca ggcggacaac gatccaatcc tcggtgtgat caatggagcc tataccaatc    2040
attcggcaga agcagtctcg attacccgcc ctcatgttgg cgcacaagcg tttatcttta    2100
ataagctatt gaacgatgcc aatatcgacc ctaaggacgt cagctacgtt gaaatgcatg    2160
gaactggtac tcaagctggg gatgcggtgg aaatgcaatc ggtcttggat acgtttgctc    2220
ccgactaccg ccgtggacca ggacagtctc tccatcttgg ttccgccaaa gcaaatgttg    2280
ggcatggaga gtcagcatct ggtgtaactg cacttgtgaa agtgctgcta atgatgaaga    2340
agaataccat accccctcat tgtggtataa agactaagat caaccacaac ttccccacgg    2400
atctcgcgca acgaaatgtc cacattgcct ttcaacctac cccttggaac agaccggctt    2460
ccggaaagcg gcagtgcttc attaacaact tttcggcggc tggtggaaat accgctcttt    2520
tgatggaaga cgctccaatc gctgaggtta aggggcagga cactcgacct gttcacgttg    2580
tgtctgtatc ggcacgatcc cagagtgcgc tcaaaaacaa catcaactct ctcgtaaaat    2640
acatcgacga acaaggaagg tcattcaatg tgaacgaggc agactttatc ccaagcttgg    2700
catacaccac cacagcacgg cgtatccatc acccattccg tgtcacagct atcgggtcta    2760
gtttgcagga gctgcgtgac tcacttaaca acagctctcg tctggaaagc tttacccctg    2820
tccctgcgac ggcccctggc gtagggttcg tgttcgctgg ccaaggagct cagcacaccg    2880
gaatgggaag gcaactatac gaaaaatgct ctcaattccg ggcaacaatg cagcacttcg    2940
attgcattag tcaaaaccaa gggtttcctt cgatccttcc cttggttgac ggaagcgtgc    3000
ccgtggagga gctgggccct atcgtgacac agctcggcac cacatgtctt cagatggctt    3060
tggtcaacta ttggggttca ctaggtataa aacctgcgtt cgttcttggg catagtctcg    3120
gggagtttgc tgctttgaat accgcaggag tattatcgac ttccgatacc atctaccttt    3180
gtggccgtcg ggctaccctc cttacagaat actgccaggt tgggacacac gccatgctgg    3240
ctgtcaaggc ttcctacccc caggtcaagc agttactgaa agaaggtgtg gatgaagttg    3300
cctgtgtcaa ctcacccagt gagacagtcg tcagtggcct caccgctgat attgatgact    3360
tggctcaaag gtgttccact gaaggttgga agtccactaa actaagggta ccgttcgctt    3420
tccattctgc ccaagttact ccaattcttg aacggtttca agaagaggcc cagggtgtca    3480
cgttccgtaa gccgtcgtta ccgtttgttt cctcactcct tggggaagtc atcaccgaat    3540
ctaattacga tgtcctggga gctcaatata tggtgaagca gtgccggaag tcggtgaact    3600
tccttggtgc tcttgaggcc accagatatg cgaaattgat gactgataag actgtctggc    3660
tggaagttgg tgcccatacc atttgctctg gtatgatcaa agcaacattc ggtccccagg    3720
ttaccactgt ggcatctctt cgccgagagg agaatgcatg gaaggtcctc tccaatagtc    3780
tatcggccct tcatttggct ggcattgata ttaattggaa agaatatcat caagacttca    3840
gctccagcca ccaggtgctc ccacttcctt cttacaagtg ggatctcaag aactactgga    3900
taccctacac taacaatttc tgccttacga agggtgctcc ccaaactgca attcaagctg    3960
caccacaaac tacattcctg accactgctg cgcaaaaggt tgttgagagt cgcgacgacg    4020
gtacaacagc gactgtcgtg gtgcaaaatg acatcgctga tcctgagttg aaccgtgtta    4080
tccaaggtca caaggtcaat ggagccgcac tttgcccatc ggtaagtatt gcatgcattg    4140
ccagactatc ttgtgttata attcggctac ttacgtattg cctagtcact ctacgcagat    4200
attgcccaga cacttggaga gtatcttatt gagaaataca aacccgagtt caaagatctt    4260
ggtctcgatg tgtgtgacat ggtcgtaccg aagccactca tcgcgaaggg aggagagcag    4320
ctctttagag tctctgctat tgctaattgg gctgagaaga aggcttcagt tcaagtatac    4380
gccgttaatg ctgacggcaa aaagaccgtg gatcatgcgt attgtacggt gaagttcttt    4440
gataccaatg cctccgagct cgagtggaag agaatctcgt acctggtcaa gagaagcatc    4500
gacagtcttc accagaatgc ggagacaggg gaggctcacc gtatccagcg aggaatggtc    4560
tataaacttt tcagcgcgtt ggtcgattat gatgaaaatt tcaagtcgat tcgcgaggtt    4620
atcctggaca gcgacaataa tgaggccacc gctcgtgtca aattccaagc accgccagga    4680
aatttccacc gaaacccatt ctggattgac agtttcggtc acttgtccgg attcattatg    4740
aatgcgagcg acgcgaccga ctctaagaac caagtatttg ttaaccatgg atgggattcg    4800
atgcgttgcc tgaagaagtt ctcgcctgat gtcacttatc gcacttatgt gaggatgcag    4860
ccatggcaaa acaacatttg ggctggagat gtttatatct ttgagggcga cgatattatt    4920
gctgtcttcg gaggtgtgaa ggtgggtacc tcactactga ttttggttcc tgcttactga    4980
catgataatt agttccaagc actggcacgc aagatacttg acactgttct tccccctgtt    5040
ggcggttcaa aggcaccaat tacagcgaaa tcaccacctc cagctcgcac tcagaaggcc    5100
aacaccggcg ccaagacccg tcctaaagca cctgttcctt ccaagtcgtt caccaaatct    5160
tctgggccga gtgttgtcgt acgcgcactc agcattctgg cctcagaagt tggcctggca    5220
gagtctgaaa tctcagacga catggtgttt gcggactacg gtgtagactc actcctctcc    5280
cttacagtta ctggcaggta tcgtgaagag ttgaacctcg atttggactc ctctgtgttt    5340
accgatcatc caactgtcaa cgacttcaag cggctcatcg cccaagtgag tccttcagag    5400
agccatgatg gttcctccag tgaacaagag tcgaatttct ctttcaacgg tggcgagtcc    5460
tcaagcgcaa gcacacctga cataacgtca ccgccgaatg agaaggtagc tcaagtcgag    5520
caaaacggca ccatgaagga aatccgtaac atcatggcgg aggagatcgg tgtacccgca    5580
gaagagatcg accctgacga gaacttggga gagatgggta tggactcgct tctctccctt    5640
actgttcttg gaagaatacg ggagactttg gacatggacc tgccaggaga gttcttcatc    5700
gaaaaccaga ccctcaatga tatagaggtg gctttggacc taaaacccaa gactacctct    5760
gctccaattc ctatgccaga gccagtgaaa ttccctgaag ctatccacga cctccagcca    5820
aagcttgctc aacatcccaa ggccacatcc atcctgttac aaggaaaccc caggacagca    5880
acaaagacgt tattcttgtt tcctgacggc tctggctcag ctacatctta cgctaccatc    5940
cccggactct ctcctgacgt ctgcgtttac gggttgaatt gcccatatat gaagacacct    6000
gagaagctca aatgcagcct agatgaactc actgcgccct atgtagcaga gattcgtcgt    6060
cggcaaccca agggtcctta cagcttcggt ggctggtcag caggagggat ctgtgcatat    6120
gatgcggcac gccatctaat gtttgaggaa ggtgaacaag tcgaccgctt gcttctcctt    6180
gataccccct tccccatcgg cctcgagaag ctgccgcaga gattgtacgg cttcttcaac    6240
tctatcggtc tcttcggtga aggtaaaacg gcaccaccct cctggctcct accccacttc    6300
ctagccttta tcgacgctct cgacgcatac aaggccgcgc cccttccatt caaagacgag    6360
aaatgggcca agaaactgcc caagacttat atcatctggg ccaaggacgg tgtttgcggt    6420
aagccgggag atccccggcc tgatcccccg acagacggtt ccaaggatcc caaggagatg    6480
gtctggcttc ttaatgaccg gaccgatctg ggacctaaca agtgggatac attggttgga    6540
cctgagaata ttggtggaat cacagtaatg gaagatgcta atcattttac gatgacgaag    6600
ggcgaaaaag cgaaagagtt gtctacattt atggctaacg ccatggctta a             6651
<210>6
<211>2141
<212>PRT
<213>米曲霉(Aspergillus oryzae)
<400>6
Met Glu Gly Pro Arg Gly Val Tyr Leu Phe Gly Asp Gln Thr Ser Asp
1               5                   10                  15
Phe Asp Ala Gly Leu Arg Arg Leu Leu Gln Val Lys Asn Asn Thr Ile
            20                  25                  30
Val Ala Ser Phe Phe Gln Arg Cys Phe His Ala Leu Arg Gln Glu Ile
        35                  40                  45
Ala Arg Leu Ser Pro Ser Glu Arg Lys Ile Phe Pro Arg Phe Thr Ser
    50                  55                  60
Ile Val Asp Leu Leu Ala Arg His Arg Glu Ser Asp Pro Asn Pro Ala
65                  70                  75                  80
Leu Glu Ser Ala Leu Thr Cys Ile Tyr Gln Leu Gly Cys Phe Ile Asn
                85                  90                  95
Tyr Tyr Gly Asp Leu Gly Asn Val Tyr Pro Ser Ala Ser Asp Cys His
            100                 105                 110
Ile Val Gly Leu Cys Ala Gly Leu Leu Ser Ser Ala Ala Val Ser Cys
        115                 120                 125
Ser Asn Asn Val Gly Glu Leu Leu Pro Ala Ala Val Glu Ala Val Val
    130                 135                 140
Val Ala Leu Arg Leu Gly Leu Cys Val Leu Lys Val Arg Glu Leu Val
145                 150                 155                 160
Ser Ser Asp Gln Ala Ser Ser Thr Ser Trp Ser Val Leu Ile Ser Gly
                165                 170                 175
Ile Ser Glu Lys Asp Ala Ser Gln Leu Ile Gly Glu Phe Thr Ala Glu
            180                 185                 190
Arg Ala Ile Pro Pro Ser Ser Lys Pro Tyr Ile Ser Ala Val Gly Tyr
        195                 200                 205
Asn Ser Ile Thr Ile Ser Ala Pro Pro Lys Val Leu Asp Asp Leu Ile
    210                 215                 220
Asp Ser Arg Leu Ser Lys Ser His Lys Pro Val Arg Ala Gln Ile His
225                 230                 235                 240
Gly Pro Tyr His Ala Ala His Leu Tyr Tyr Gly Arg Asp Val Asp Arg
                245                 250                 255
Ile Ile Glu Ser Cys His Asn Glu Val Val Ser Asn Tyr Thr Pro Arg
            260                 265                 270
Ile Pro Val Leu Ser Ser Thr Thr Gly Gln Pro Ile Glu Ala Lys His
        275                 280                 285
Met Lys Asp Leu Leu Lys Ala Ala Leu Glu Glu Ile Leu Leu Arg Gln
    290                 295                 300
Leu Cys Trp Glu Lys Val Thr Asp Ala Cys Tyr Ser Ile Leu Lys Thr
305                 310                 315                 320
Ala Arg His Gln Pro Cys Lys Leu Phe Pro Ile Ser Ser Thr Ala Thr
                325                 330                 335
Gln Ser Leu Phe Thr Ala Leu Thr Lys Ala Gly Ile Thr Asp Ile Glu
            340                 345                 350
Val Glu Asn Gly Leu Gly Asp Val Pro Thr Asn Pro Lys Asp Asn Leu
        355                 360                 365
Asn Ile Ser Gly Arg Ala Asp Cys Ser Lys Ile Ala Ile Ile Gly Met
    370                 375                 380
Ser Gly Arg Phe Pro Glu Ala Asp Gly Thr Glu Ser Phe Trp Asp Leu
385                 390                 395                 400
Leu Tyr Asn Gly Leu Asp Val His Arg Lys Val Pro Ala Glu Arg Trp
                405                 410                 415
Asp Val Asp Ala His Val Asp Pro Thr Gly Thr Lys Arg Asn Thr Ser
            420                 425                 430
Lys Val Pro Tyr Gly Cys Trp Ile Asn Glu Pro Gly Leu Phe Asp Pro
        435                 440                 445
Arg Phe Phe Asn Met Ser Pro Arg Glu Ala Leu Gln Ala Asp Pro Ala
    450                 455                 460
Gln Arg Leu Ala Leu Leu Thr Ala Tyr Glu Ala Leu Glu Met Ala Gly
465                 470                 475                 480
Phe Ile Pro Asp Ser Thr Pro Ser Thr Gln Arg Asp Arg Val Gly Leu
                485                 490                 495
Phe Tyr Gly Met Thr Ser Asp Asp Tyr Arg Glu Ile Asn Ser Gly Gln
            500                 505                 510
Asp Ile Asp Thr Tyr Phe Ile Pro Gly Gly Asn Arg Ala Phe Thr Pro
        515                 520                 525
Gly Arg Ile Asn Tyr Tyr Phe Lys Phe Ser Gly Pro Ser Val Ser Val
    530                 535                 540
Asp Thr Ala Cys Ser Ser Ser Leu Ala Ala Ile His Met Ala Cys Asn
545                 550                 555                 560
Ser Ile Trp Arg Asn Asp Cys Asp Ala Ala Ile Ala Gly Gly Val Asn
                565                 570                 575
Ile Leu Thr Asn Pro Asp Asn His Ala Gly Leu Asp Arg Gly His Phe
            580                 585                 590
Leu Ser Arg Thr Gly Asn Cys Asn Thr Phe Asp Asp Gly Ala Asp Gly
        595                 600                 605
Tyr Cys Arg Ala Asp Gly Val Gly Thr Ile Ile Leu Lys Arg Leu Glu
    610                 615                 620
Asp Ala Gln Ala Asp Asn Asp Pro Ile Leu Gly Val Ile Asn Gly Ala
625                 630                 635                 640
Tyr Thr Asn His Ser Ala Glu Ala Val Ser Ile Thr Arg Pro His Val
                645                 650                 655
Gly Ala Gln Ala Phe Ile Phe Asn Lys Leu Leu Asn Asp Ala Asn Ile
            660                 665                 670
Asp Pro Lys Asp Val Ser Tyr Val Glu Met His Gly Thr Gly Thr Gln
        675                 680                 685
Ala Gly Asp Ala Val Glu Met Gln Ser Val Leu Asp Thr Phe Ala Pro
    690                 695                 700
Asp Tyr Arg Arg Gly Pro Gly Gln Ser Leu His Leu Gly Ser Ala Lys
705                 710                 715                 720
Ala Asn Val Gly His Gly Glu Ser Ala Ser Gly Val Thr Ala Leu Val
                725                 730                 735
Lys Val Leu Leu Met Met Lys Lys Asn Thr Ile Pro Pro His Cys Gly
            740                 745                 750
Ile Lys Thr Lys Ile Asn His Asn Phe Pro Thr Asp Leu Ala Gln Arg
        755                 760                 765
Asn Val His Ile Ala Phe Gln Pro Thr Pro Trp Asn Arg Pro Ala Ser
    770                 775                 780
Gly Lys Arg Gln Cys Phe Ile Asn Asn Phe Ser Ala Ala Gly Gly Asn
785                 790                 795                 800
Thr Ala Leu Leu Met Glu Asp Ala Pro Ile Ala Glu Val Lys Gly Gln
                805                 810                 815
Asp Thr Arg Pro Val His Val Val Ser Val Ser Ala Arg Ser Gln Ser
            820                 825                 830
Ala Leu Lys Asn Asn Ile Asn Ser Leu Val Lys Tyr Ile Asp Glu Gln
        835                 840                 845
Gly Arg Ser Phe Asn Val Asn Glu Ala Asp Phe Ile Pro Ser Leu Ala
    850                 855                 860
Tyr Thr Thr Thr Ala Arg Arg Ile His His Pro Phe Arg Val Thr Ala
865                 870                 875                 880
Ile Gly Ser Ser Leu Gln Glu Leu Arg Asp Ser Leu Asn Asn Ser Ser
                885                 890                 895
Arg Leu Glu Ser Phe Thr Pro Val Pro Ala Thr Ala Pro Gly Val Gly
            900                 905                 910
Phe Val Phe Ala Gly Gln Gly Ala Gln His Thr Gly Met Gly Arg Gln
        915                 920                 925
Leu Tyr Glu Lys Cys Ser Gln Phe Arg Ala Thr Met Gln His Phe Asp
    930                 935                 940
Cys Ile Ser Gln Asn Gln Gly Phe Pro Ser Ile Leu Pro Leu Val Asp
945                 950                 955                 960
Gly Ser Val Pro Val Glu Glu Leu Gly Pro Ile Val Thr Gln Leu Gly
                965                 970                 975
Thr Thr Cys Leu Gln Met Ala Leu Val Asn Tyr Trp Gly Ser Leu Gly
            980                 985                 990
Ile Lys Pro Ala Phe Val Leu Gly His Ser Leu Gly Glu Phe Ala Ala
        995                 1000                1005
Leu Asn Thr Ala Gly Val Leu Ser Thr Ser Asp Thr Ile Tyr Leu
    1010                1015                1020
Cys Gly Arg Arg Ala Thr Leu Leu Thr Glu Tyr Cys Gln Val Gly
    1025                1030                1035
Thr His Ala Met Leu Ala Val Lys Ala Ser Tyr Pro Gln Val Lys
    1040                1045                1050
Gln Leu Leu Lys Glu Gly Val Asp Glu Val Ala Cys Val Asn Ser
    1055                1060                1065
Pro Ser Glu Thr Val Val Ser Gly Leu Thr Ala Asp Ile Asp Asp
    1070                1075                1080
Leu Ala Gln Arg Cys Ser Thr Glu Gly Trp Lys Ser Thr Lys Leu
    1085                1090                1095
Arg Val Pro Phe Ala Phe His Ser Ala Gln Val Thr Pro Ile Leu
    1100                1105                1110
Glu Arg Phe Gln Glu Glu Ala Gln Gly Val Thr Phe Arg Lys Pro
    1115                1120                1125
Ser Leu Pro Phe Val Ser Ser Leu Leu Gly Glu Val Ile Thr Glu
    1130                1135                1140
Ser Asn Tyr Asp Val Leu Gly Ala Gln Tyr Met Val Lys Gln Cys
    1145                1150                1155
Arg Lys Ser Val Asn Phe Leu Gly Ala Leu Glu Ala Thr Arg Tyr
    1160                1165                1170
Ala Lys Leu Met Thr Asp Lys Thr Val Trp Leu Glu Val Gly Ala
    1175                1180                1185
His Thr Ile Cys Ser Gly Met Ile Lys Ala Thr Phe Gly Pro Gln
    1190                1195                1200
Val Thr Thr Val Ala Ser Leu Arg Arg Glu Glu Asn Ala Trp Lys
    1205                1210                1215
Val Leu Ser Asn Ser Leu Ser Ala Leu His Leu Ala Gly Ile Asp
    1220                1225                1230
Ile Asn Trp Lys Glu Tyr His Gln Asp Phe Ser Ser Ser His Gln
    1235                1240                1245
Val Leu Pro Leu Pro Ser Tyr Lys Trp Asp Leu Lys Asn Tyr Trp
    1250                1255                1260
Ile Pro Tyr Thr Asn Asn Phe Cys Leu Thr Lys Gly Ala Pro Gln
    1265                1270                1275
Thr Ala Ile Gln Ala Ala Pro Gln Thr Thr Phe Leu Thr Thr Ala
    1280                1285                1290
Ala Gln Lys Val Val Glu Ser Arg Asp Asp Gly Thr Thr Ala Thr
    1295                1300                1305
Val Val Val Gln Asn Asp Ile Ala Asp Pro Glu Leu Asn Arg Val
    1310                1315                1320
Ile Gln Gly His Lys Val Asn Gly Ala Ala Leu Cys Pro Ser Ser
    1325                1330                1335
Leu Tyr Ala Asp Ile Ala Gln Thr Leu Gly Glu Tyr Leu Ile Glu
    1340                1345                1350
Lys Tyr Lys Pro Glu Phe Lys Asp Leu Gly Leu Asp Val Cys Asp
    1355                1360                1365
Met Val Val Pro Lys Pro Leu Ile Ala Lys Gly Gly Glu Gln Leu
    1370                1375                1380
Phe Arg Val Ser Ala Ile Ala Asn Trp Ala Glu Lys Lys Ala Ser
    1385                1390                1395
Val Gln Val Tyr Ala Val Asn Ala Asp Gly Lys Lys Thr Val Asp
    1400                1405                1410
His Ala Tyr Cys Thr Val Lys Phe Phe Asp Thr Asn Ala Ser Glu
    1415                1420                1425
Leu Glu Trp Lys Arg Ile Ser Tyr Leu Val Lys Arg Ser Ile Asp
    1430                1435                1440
Ser Leu His Gln Asn Ala Glu Thr Gly Glu Ala His Arg Ile Gln
    1445                1450                1455
Arg Gly Met Val Tyr Lys Leu Phe Ser Ala Leu Val Asp Tyr Asp
    1460                1465                1470
Glu Asn Phe Lys Ser Ile Arg Glu Val Ile Leu Asp Ser Asp Asn
    1475                1480                1485
Asn Glu Ala Thr Ala Arg Val Lys Phe Gln Ala Pro Pro Gly Asn
    1490                1495                1500
Phe His Arg Asn Pro Phe Trp Ile Asp Ser Phe Gly His Leu Ser
    1505                1510                1515
Gly Phe Ile Met Asn Ala Ser Asp Ala Thr Asp Ser Lys Asn Gln
    1520                1525                1530
Val Phe Val Asn His Gly Trp Asp Ser Met Arg Cys Leu Lys Lys
    1535                1540                1545
Phe Ser Pro Asp Val Thr Tyr Arg Thr Tyr Val Arg Met Gln Pro
    1550                1555                1560
Trp Gln Asn Asn Ile Trp Ala Gly Asp Val Tyr Ile Phe Glu Gly
    1565                1570                1575
Asp Asp Ile Ile Ala Val Phe Gly Gly Val Lys Phe Gln Ala Leu
    1580                1585                1590
Ala Arg Lys Ile Leu Asp Thr Val Leu Pro Pro Val Gly Gly Ser
    1595                1600                1605
Lys Ala Pro Ile Thr Ala Lys Ser Pro Pro Pro Ala Arg Thr Gln
    1610                1615                1620
Lys Ala Asn Thr Gly Ala Lys Thr Arg Pro Lys Ala Pro Val Pro
    1625                1630                1635
Ser Lys Ser Phe Thr Lys Ser Ser Gly Pro Ser Val Val Val Arg
    1640                1645                1650
Ala Leu Ser Ile Leu Ala Ser Glu Val Gly Leu Ala Glu Ser Glu
    1655                1660                1665
Ile Ser Asp Asp Met Val Phe Ala Asp Tyr Gly Val Asp Ser Leu
    1670                1675                1680
Leu Ser Leu Thr Val Thr Gly Arg Tyr Arg Glu Glu Leu Asn Leu
    1685                1690                1695
Asp Leu Asp Ser Ser Val Phe Thr Asp His Pro Thr Val Asn Asp
    1700                1705                1710
Phe Lys Arg Leu Ile Ala Gln Val Ser Pro Ser Glu Ser His Asp
    1715                1720                1725
Gly Ser Ser Ser Glu Gln Glu Ser Asn Phe Ser Phe Asn Gly Gly
    1730                1735                1740
Glu Ser Ser Ser Ala Ser Thr Pro Asp Ile Thr Ser Pro Pro Asn
    1745                1750                1755
Glu Lys Val Ala Gln Val Glu Gln Asn Gly Thr Met Lys Glu Ile
    1760                1765                1770
Arg Asn Ile Met Ala Glu Glu Ile Gly Val Pro Ala Glu Glu Ile
    1775                1780                1785
Asp Pro Asp Glu Asn Leu Gly Glu Met Gly Met Asp Ser Leu Leu
    1790                1795                1800
Ser Leu Thr Val Leu Gly Arg Ile Arg Glu Thr Leu Asp Met Asp
    1805                1810                1815
Leu Pro Gly Glu Phe Phe Ile Glu Asn Gln Thr Leu Asn Asp Ile
    1820                1825                1830
Glu Val Ala Leu Asp Leu Lys Pro Lys Thr Thr Ser Ala Pro Ile
    1835                1840                1845
Pro Met Pro Glu Pro Val Lys Phe Pro Glu Ala Ile His Asp Leu
    1850                1855                1860
Gln Pro Lys Leu Ala Gln His Pro Lys Ala Thr Ser Ile Leu Leu
    1865                1870                1875
Gln Gly Asn Pro Arg Thr Ala Thr Lys Thr Leu Phe Leu Phe Pro
    1880                1885                1890
Asp Gly Ser Gly Ser Ala Thr Ser Tyr Ala Thr Ile Pro Gly Leu
    1895                1900                1905
Ser Pro Asp Val Cys Val Tyr Gly Leu Asn Cys Pro Tyr Met Lys
    1910                1915                1920
Thr Pro Glu Lys Leu Lys Cys Ser Leu Asp Glu Leu Thr Ala Pro
    1925                1930                1935
Tyr Val Ala Glu Ile Arg Arg Arg Gln Pro Lys Gly Pro Tyr Ser
    1940                1945                1950
Phe Gly Gly Trp Ser Ala Gly Gly Ile Cys Ala Tyr Asp Ala Ala
    1955                1960                1965
Arg His Leu Met Phe Glu Glu Gly Glu Gln Val Asp Arg Leu Leu
    1970                1975                1980
Leu Leu Asp Thr Pro Phe Pro Ile Gly Leu Glu Lys Leu Pro Gln
    1985                1990                1995
Arg Leu Tyr Gly Phe Phe Asn Ser Ile Gly Leu Phe Gly Glu Gly
    2000                2005                2010
Lys Thr Ala Pro Pro Ser Trp Leu Leu Pro His Phe Leu Ala Phe
    2015                2020                2025
Ile Asp Ala Leu Asp Ala Tyr Lys Ala Ala Pro Leu Pro Phe Lys
    2030                2035                2040
Asp Glu Lys Trp Ala Lys Lys Leu Pro Lys Thr Tyr Ile Ile Trp
    2045                2050                2055
Ala Lys Asp Gly Val Cys Gly Lys Pro Gly Asp Pro Arg Pro Asp
    2060                2065                2070
Pro Pro Thr Asp Gly Ser Lys Asp Pro Lys Glu Met Val Trp Leu
    2075                2080                2085
Leu Asn Asp Arg Thr Asp Leu Gly Pro Asn Lys Trp Asp Thr Leu
    2090                2095                2100
Val Gly Pro Glu Asn Ile Gly Gly Ile Thr Val Met Glu Asp Ala
    2105                2110                2115
Asn His Phe Thr Met Thr Lys Gly Glu Lys Ala Lys Glu Leu Ser
    2120                2125                2130
Thr Phe Met Ala Asn Ala Met Ala
    2135                2140
<210>7
<211>176
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>7
cagcacttcg attgcattag tcaaaaccaa gggtttcctt cgatccttcc cttggttgac     60
ggaagcgtgc ccgtggagga gctgggccct atcgtgacac agctcggcac cacatgtctt    120
cagatggctt tggtcaacta ttggggttca ctaggtataa aacctgcgtt cgttct        176
<210>8
<211>59
<212>PRT
<213>米曲霉(Aspergillus oryzae)
<400>8
Gln His Phe Asp Cys Ile Ser Gln Asn Gln Gly Phe Pro Ser Ile Leu
1               5                   10                  15
Pro Leu Val Asp Gly Ser Val Pro Val Glu Glu Leu Gly Pro Ile Val
            20                  25                  30
Thr Gln Leu Gly Thr Thr Cys Leu Gln Met Ala Leu Val Asn Tyr Trp
        35                  40                  45
Gly Ser Leu Gly Ile Lys Pro Ala Phe Val Leu
    50                  55
<210>9
<211>25
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>9
ccatggagca cttcgattgc attag                                 25
<210>10
<211>30
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>10
gcggccgcag aacgaacgca ggttttatac                            30
<210>11
<211>27
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>11
ccatgggcgc tcaaaaacaa catcaac                               27
<210>12
<211>28
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>12
gcggccgcag aacgaacgca ggttttat                              28
<210>13
<211>20
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>13
tactacggag accttggaaa                                       20
<210>14
<211>20
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>14
gctcttagac agcctagaat                                       20
<210>15
<211>20
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>15
atgcctcgca gcttatagga                                       20
<210>16
<211>20
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>16
cgcactgata tacggtttgg                                                  20
<210>17
<211>23
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>17
ggatctctac ggtaacatcg tca                                              23
<210>18
<211>19
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>18
gatcggagat gccagggta                                                   19
<210>19
<211>1128
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>19
atggaagagg aagttgctgc tctcgtcatt gacaatggtt cgggtatgtg caaggccggt      60
ttcgccggtg acgatgctcc ccgtgccgtc ttcccctcca ttgtcggtcg tccccgtcac     120
catggtatca tgattggtat gggtcagaag gactcctacg tcggtgatga ggcacagtcc     180
aagcgtggta tcctcaccct cagatacccc attgagcacg gtgtcgtcac gaactgggat     240
gacatggaga agatctggca ccacaccttc tacaatgaac tccgtgtcgc tcctgaggag     300
caccccgtcc tcttgaccga agcccccatc aaccccaagt ccaaccgtga gaagatgacc     360
cagatcgtct tcgagacctt caacgccccc gccttctacg tctccatcca ggccgtcctg     420
tccctgtacg cctccggtcg taccaccggt atcgttctgg actctggtga cggtgtcacc     480
cacgttgtcc ccatctacga gggtttcgcc cttccccacg ccatctcccg tgtcgacatg     540
gctggtcgtg acctgacgga ttacctcatg aagatcctgg ccgagcgtgg ttacactttc     600
tccactaccg ctgagcgtga aattgtccgt gacatcaagg agaagctctg ctacgtcgct     660
ctcgacttcg agcaggagat ccagaccgct tcccagagct ccagcctcga gaagtcctac     720
gagcttcccg acggtcaggt catcaccatc ggcaacgagc gtttccgtgc tcctgaggct     780
ctgttcgctc ctagcgtcct gggtctggag agcggtggta tccacgagac caccttcaac     840
tccatcatga agtgtgatgt tgatgtccgt aaggatctgt acggcaacat tgtcatgtct     900
ggtggtacta ccatgtaccc cggtatctcc gaccgtatgc agaaggagat cactgctctt     960
gctccttctt ccatgaaggt caagatcatt gctcctcccg agcgcaagta ctccgtctgg    1020
atcggtggtt ccatcctggc ctccctgtcc accttccagc agatgtggat ctccaagcag    1080
gagtacgacg agagcggtcc ctcgatcgtc caccgcaagt gcttctaa                 1128
<210>20
<211>375
<212>PRT
<213>米曲霉(Aspergillus oryzae)
<400>20
Met Glu Glu Glu Val Ala Ala Leu Val Ile Asp Asn Gly Ser Gly Met
1               5                   10                  15
Cys Lys Ala Gly Phe Ala Gly Asp Asp Ala Pro Arg Ala Val Phe Pro
            20                  25                  30
Ser Ile Val Gly Arg Pro Arg His His Gly Ile Met Ile Gly Met Gly
        35                  40                  45
Gln Lys Asp Ser Tyr Val Gly Asp Glu Ala Gln Ser Lys Arg Gly Ile
    50                  55                  60
Leu Thr Leu Arg Tyr Pro Ile Glu His Gly Val Val Thr Asn Trp Asp
65                  70                  75                  80
Asp Met Glu Lys Ile Trp His His Thr Phe Tyr Asn Glu Leu Arg Val
                85                  90                  95
Ala Pro Glu Glu His Pro Val Leu Leu Thr Glu Ala Pro Ile Asn Pro
            100                 105                 110
Lys Ser Asn Arg Glu Lys Met Thr Gln Ile Val Phe Glu Thr Phe Asn
        115                 120                 125
Ala Pro Ala Phe Tyr Val Ser Ile Gln Ala Val Leu Ser Leu Tyr Ala
    130                 135                 140
Ser Gly Arg Thr Thr Gly Ile Val Leu Asp Ser Gly Asp Gly Val Thr
145                 150                 155                 160
His Val Val Pro Ile Tyr Glu Gly Phe Ala Leu Pro His Ala Ile Ser
                165                 170                 175
Arg Val Asp Met Ala Gly Arg Asp Leu Thr Asp Tyr Leu Met Lys Ile
            180                 185                 190
Leu Ala Glu Arg Gly Tyr Thr Phe Ser Thr Thr Ala Glu Arg Glu Ile
        195                 200                 205
Val Arg Asp Ile Lys Glu Lys Leu Cys Tyr Val Ala Leu Asp Phe Glu
    210                 215                 220
Gln Glu Ile Gln Thr Ala Ser Gln Ser Ser Ser Leu Glu Lys Ser Tyr
225                 230                 235                 240
Glu Leu Pro Asp Gly Gln Val Ile Thr Ile Gly Asn Glu Arg Phe Arg
                245                 250                 255
Ala Pro Glu Ala Leu Phe Ala Pro Ser Val Leu Gly Leu Glu Ser Gly
            260                 265                 270
Gly Ile His Glu Thr Thr Phe Asn Ser Ile Met Lys Cys Asp Val Asp
        275                 280                 285
Val Arg Lys Asp Leu Tyr Gly Asn Ile Val Met Ser Gly Gly Thr Thr
    290                 295                 300
Met Tyr Pro Gly Ile Ser Asp Arg Met Gln Lys Glu Ile Thr Ala Leu
305                 310                 315                 320
Ala Pro Ser Ser Met Lys Val Lys Ile Ile Ala Pro Pro Glu Arg Lys
                325                 330                 335
Tyr Ser Val Trp Ile Gly Gly Ser Ile Leu Ala Ser Leu Ser Thr Phe
            340                 345                 350
Gln Gln Met Trp Ile Ser Lys Gln Glu Tyr Asp Glu Ser Gly Pro Ser
        355                 360                 365
Ile Val His Arg Lys Cys Phe
    370                 375
<210>21
<211>20
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>21
atgcctcgca gcttatagga                                                 20
<210>22
<211>20
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>22
cgcactgata tacggtttgg                                                 20
<210>23
<211>23
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>23
ggatctctac ggtaacatcg tca                                             23
<210>24
<211>19
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>24
gatcggagat gccagggta                                                  19
<210>25
<211>6387
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>25
atggagggtc catctcgtgt gtaccttttt ggagaecaga ccagcgacat cgaagctggc     60
ctgcgccgtc tgctccaagc gaagaatagt accattgtcc agtccttttt ccagcaatgc    120
ttccatgcaa ttcgtcaaga gatcgcgaag ctcccgccgt ctcatcggaa gctcttccca    180
cgcttcacga gcatcgttga tctcctttcc aggagtcgtg aatcaggtcc tagccctgtc    240
ctggagagtg cattgacatg catctaccaa ttgggttgtt tcattcactt ttacggggat    300
cttggacatg actaccctac accctccaac agccatcttg ttggcctgtg cactggtgtt    360
ctgagctgca cggctgtaag ttgcgccaga aatgttggag agcttattcc agctgcagtg    420
gaatcggttg taattgcact gcgactggga atctgcgttt ttcgagttcg agaactggtg    480
gactccgccg attccgagtc aacatgctgg tcagcgttgg tttctggaat cagtgaagca    540
gaggctagcc acctgatcga cgagtacagt agtaagaagg ctactccgcc ttcttcgaaa    600
ccgtatatca gcgcggtaag ctctaatggc gttactgtca gcgcaccacc tacggtactt    660
gatgaattcg tcgagacctg catttccaag aattacaagc cagtgaaggc ccctattcat    720
ggcccgtacc atgcgccaca tctgtatgat gataaggata tcgaccgcat cctgcagcag    780
tcctctgctc tagaaggact gaccggctgt tcacccgtta ttcccatcat ctccagtaac    840
actggaaagc cgatcaaggc caagtccatc aaagatctct tcaaggtcgc actggaggag     900
atactcctac gacgactatg ctgggacaag gtcacggagt cctgcacatc agtctgcaag     960
accggcacaa accactcttg caaattgttt ccgatctcga gtagcgccac tcaaagtttg    1020
ttcacagtcc tcaagaaggc cggtgtgagc atcagcttgg agactggggt aggagagatc    1080
gcgacgaacc cagaaatgcg gaaccttact ggcaaggcag aaaattcaaa gattgctatc    1140
attggtatgt ctggaagatt tcctgactcg gatggtacgg agagcttctg gaacctcctg    1200
tacaaaggac tcgacgtaca tcgcaaagtc cccgcagacc gttgggacgt tgatgcccac    1260
gtcgacatga ccgggtcaaa gagaaacaca agcaaagtgg cttacggttg ctggatcaac    1320
gaacccggcc tgtttgaccc ccgattcttc aacatgtcgc ctcgggaagc actccaagca    1380
gatcctgcac aacgtcttgc gttgcttaca gcgtacgagg ctctcgagat ggctggcttc    1440
atcccggata gctctccatc gacgcagagg gaccgtgtgg gtattttcta cggaatgacc    1500
agtgacgact accgtgagat caacagcggc caggacattg atacctattt catccctggc    1560
ggtaaccgag catttacgcc gggtcggata aactactact tcaaatttag cggccccagt    1620
gtgagcgttg acacagcgtg ctcgtctagt cttgctgcta tccacatggc ttgcaattcg    1680
atctggagaa atgactgcga tgccgccatc actggaggtg tgaacattct gaccaaccct    1740
gacaaccacg ccggtctgga tcggggccat ttcctgtcca ccactggcaa ctgtaacacc    1800
tttgatgacg gcgccgacgg ctactgtaga gcggacggag ttggaagcat cgttttgaag    1860
cggcttgaag atgccgaggc cgacaacgac ccgatcctgg ccgtcatcaa cggtgcttac    1920
accaaccact cggcggaggc cgtgtcaatc actcgtcccc atgttggcgc gcaagcattc    1980
atcttcaaca agctgctcaa tgatgcgaat atcgacccta aggacgtgag ctacgtggaa    2040
atgcatggca ctggaactca agcaggtgat gcagtcgaaa tgcagtccgt tcttgacgtc    2100
ttcgcaccag actaccgccg gggtcccggt caatcgcttc atatcggttc tgccaaggca    2160
aacattggac acggtgaatc cgcatcagga gtgactgctc ttgtcaaggt cctcctaatg    2220
atgagagaga acatgattec tcctcattgt ggtatcaaga ccaagatcaa ttccaatttc    2280
ccgacagact tggcgaagcg caatgttcat atcgccttcc aacccactcc ctggaatcgg    2340
ccagcttcag gaaagcggcg aactttcgtc aacaactttt ctgctgctgg tggtaacact    2400
gctcttctac tggaagatgc tcccataccg gaacgccaag ggcaggaccc caggtcgttc    2460
catttggtct ccgtgtcagc aagatcccag tctgcattga agaacaacgt cgaagctctg    2520
gtgaagtaca ttgactctca gggcaagtcc tttggtgtga aagagactga attccttcca    2580
aacctggcgt acacgaccac cgcacgccgt atccaccatc ccttccgtgt cactgcggtt    2640
ggagcgaacc tacaatcact gcgtgactcg ctgcatggtg ctttgcaccg tgagacatat    2700
accccagttc cctcaacggc tcctggtatt ggtttcgtct tcaccggcca aggagcccaa    2760
tactccggaa tgggcaagga actctaccgc agttgtttcc aattccgaac caccattgag    2820
cattttgact gcatcgcaag aagccagggc cttccttcta tccttcctct tgtcgatgga    2880
agcgtggctg tcgaagaact tagccctgtc gtggtacaag tgggaactac ctgtgtacaa    2940
atggctctag taaattactg gactgctctg ggtgtgaagc cggcctttat catcggacac    3000
agtcttggag actatgcagc ccttaacacg gccggtgttc tatccaccag cgatacaatc    3060
tatctttgtg gccggcgtgc tcagttgctg acgaaggaat gcaagattgg gacacattcg    3120
atgctggcca tcaaggcgtc cctggcagag gtcaaacatt tcctcagaga cgagctccac    3180
gaagtctctt gtgttaacgc acctgcggag accgtcgtca gcggccttgt cgctgatatc    3240
gacgagttgg ctcagaaatg ctccacagag ggtttgaagt caaccaagct caaggttcct    3300
tacgcgttcc attcctctca ggttgatcct atcttggagg ccttcgaaga tattgcccaa    3360
ggtgtcacct tccacaagcc gacaacacct ttcgtctcag ccctgttcgg ggaagtgatc    3420
accgatgcta actgggagtg tctcggcccc aagtacctgc gcgatcattg cagaaagacg    3480
gtcaacttcc ttggcggcgt ggaggctacg aggcatgcga agctgaccaa tgacaagact    3540
ctgtgggttg agatcggctc acataccatt tgctctggaa tgatcaaagc aactcttgga    3600
ccgcaagtta caacggttgc atctctacgc cgcgaagaag atacctggaa ggtcctttcg    3660
aacagtcttg cgagccttca tctggcgggt attgatatca actggaagca atatcaccag    3720
gactttagct cctctctcca ggtcctccgc ctcccagcct acaagtggga tctcaagaac    3780
tactggattc cctataccaa caacttctgc ctgagcaagg gcgctccagt tgcgacagta    3840
gcggcagggc cacagcatga gtacctgaca accgcggctc agaaggtcat tgagactcga    3900
agtgatggag caacagctac agtcgtgata gagaacgaca ttgctgatcc cgagctcaac    3960
cgcgtcattc aaggccataa ggtcaacggt actgctttgt gtccctcatc actatatgcc    4020
gacatctctc aaacgcttgc agagtatctc atcaaaaagt acaagcctga gtacgacgga    4080
cttggactgg atgtgtgtga ggtcacagtg ccacgaccac tgattgcgaa aggcggacag    4140
cagctcttta gagtatctgc gacagcggat tgggcggaga agaagacaac ccttcagata    4200
tattcagtca ctgcggaggg gaagaagacg gctgaccacg caacttgcac tgtccgattc    4260
tttgactgcg ctgctgcgga ggcggaatgg aaacgagttt cctaccttgt caagaggagc    4320
attgaccgac tgcatgatat cgccgaaaat ggtgacgctc accgtcttgg tagaggcatg    4380
gtttacaaac tcttcgctgc cttggttgat tatgacgaca acttcaagtc cattcgcgag    4440
gttattcttg acagtgaaca gcacgaagcg actgcacgcg tcaagttcca agcaccacaa    4500
ggcaatttcc accgaaaccc gttctggatt gacagttttg gacacctgtc tgggttcatc    4560
atgaacgcaa gcgatgcaac cgactccaag aaccaggtct ttgtcaatca cggatgggac    4620
tccatgcgtt gtttgaagaa gttctcgcct gatgtcacct acaggactta tgttagaatg    4680
cagccttgga aagactccat ctgggctggt gatgtctacg ttttcgatgg ggatgatatc    4740
gttgcggtgt atggtgcagt caagttccaa gccttatcac gcaagattct cgatacggtc    4800
ctacctccaa gtcgtgctag cgccccggcc ccggcgaagc ctgctgctaa gcccagcgcc    4860
ccaagcttgg tcaaacgggc acttaccatc ctcgcagagg aagtgggtct gtctgaatcc    4920
gagattacgg atgatctggt cttcgcagac tacggtgtgg actcccttct ttcgttgacg    4980
gtcacgggca ggtatcgtga agagctggat atcgatctcg aatcctccat cttcatcgac    5040
cagccgaccg tgaaagactt caagcagttc ttggccccaa tgagccaggg agaagccagc    5100
gatgggtcca ccagtgaccc agagtctagt agctccttca atggtggctc ttcaacagac    5160
gagtccagtg ctgggtcccc tgtcagctca ccaccaaatg agaaggttac gcaggtcgag    5220
cagcatgcta cgataaagga gattcgcgcc attttggccg atgagattgg tgttacggag    5280
gaggagctga aggacgatga gaacttggga gagatgggga tggactctct gctttcgctt    5340
acggtgcttg gtaggatccg tgagacattg gatctggatc taccgggcga gttcttcatc    5400
gagaatcaaa ctctgaatga cgtggaggat gcattgggcc tcaaacccaa ggcagctcct    5460
gcgcctgcgc ctgcgcctgc tcccgtaccc gcacccgtgt ccgcgcccat attgaaggag    5520
cctgtcccca acgcaaactc taccatcatg gcccgggcga gcccgcaccc tcgatcaacc    5580
tccattctgt tgcaaggaaa cccgaaaacc gcgaccaaga ccctgttcct gttccctgat    5640
gggtctggct ccgcaacatc gtatgcaacc attcccggag tgtccccgga cgtgtgtgtc    5700
tacggattga actgcccgta catgaagact ccagagaagc tcaagtatcc ccttgctgag    5760
atgacattcc cctatctggc cgagatccgc cgcagacagc ccaagggccc gtacaacttc    5820
ggtggatggt ctgcaggtgg tatttgcgcc tatgatgccg ctcgctacct aatccttgaa    5880
gagggcgaac aggttgaccg attgcttctt cttgactcgc ccttccccat tggcttagag    5940
aagttgccca ctcggctgta cggcttcatc aactcaatgg gtctctttgg tgaaggcaac    6000
aaggctcccc cggcctggtt gctccctcat ttcctggcct tcattgattc cctcgatacc    6060
tacaaggccg tccccctccc ctttgacgat ccgaagtggg ccaagaagat gcccaagaca    6120
ttcatggtct gggccaagga cggtatctgc agcaagccgg atgacccgtg gcccgagccg    6180
gacccggacg gcaagccgga cacgagagag atggtctggc tcctcaagaa ccggaccgac    6240
atgggaccca acaagtggga cacactcgtc gggccccaaa acgtcggtgg aatcactgtg    6300
atagagggtg cgaatcattt caccatgact ttgggaccca aggctaaaga attgggctcg    6360
ttcattggca acgccatggc caattaa                                        6387
<210>26
<211>2128
<212>PRT
<213>黑曲霉(Aspergillus niger)
<400>26
Met Glu Gly Pro Ser Arg Val Tyr Leu Phe Gly Asp Gln Thr Ser Asp
1               5                   10                  15
Ile Glu Ala Gly Leu Arg Arg Leu Leu Gln Ala Lys Asn Ser Thr Ile
            20                  25                  30
Val Gln Ser Phe Phe Gln Gln Cys Phe His Ala Ile Arg Gln Glu Ile
        35                  40                  45
Ala Lys Leu Pro Pro Ser His Arg Lys Leu Phe Pro Arg Phe Thr Ser
    50                  55                  60
Ile Val Asp Leu Leu Ser Arg Ser Arg Glu Ser Gly Pro Ser Pro Val
65                  70                  75                  80
Leu Glu Ser Ala Leu Thr Cys Ile Tyr Gln Leu Gly Cys Phe Ile His
                85                  90                  95
Phe Tyr Gly Asp Leu Gly His Asp Tyr Pro Thr Pro Ser Asn Ser His
            100                 105                 110
Leu Val Gly Leu Cys Thr Gly Val Leu Ser Cys Thr Ala Val Ser Cys
        115                 120                 125
Ala Arg Asn Val Gly Glu Leu Ile Pro Ala Ala Val Glu Ser Val Val
    130                 135                 140
Ile Ala Leu Arg Leu Gly Ile Cys Val Phe Arg Val Arg Glu Leu Val
145                 150                 155                 160
Asp Ser Ala Asp Ser Glu Ser Thr Cys Trp Ser Ala Leu Val Ser Gly
                165                 170                 175
Ile Ser Glu Ala Glu Ala Ser His Leu Ile Asp Glu Tyr Ser Ser Lys
            180                 185                 190
Lys Ala Thr Pro Pro Ser Ser Lys Pro Tyr Ile Ser Ala Val Ser Ser
        195                 200                 205
Asn Gly Val Thr Val Ser Ala Pro Pro Thr Val Leu Asp Glu Phe Val
    210                 215                 220
Glu Thr Cys Ile Ser Lys Asn Tyr Lys Pro Val Lys Ala Pro Ile His
225                 230                 235                 240
Gly Pro Tyr His Ala Pro His Leu Tyr Asp Asp Lys Asp Ile Asp Arg
                245                 250                 255
Ile Leu Gln Gln Ser Ser Ala Leu Glu Gly Leu Thr Gly Cys Ser Pro
            260                 265                 270
Val Ile Pro Ile Ile Ser Ser Asn Thr Gly Lys Pro Ile Lys Ala Lys
        275                 280                 285
Ser Ile Lys Asp Leu Phe Lys Val Ala Leu Glu Glu Ile Leu Leu Arg
    290                 295                 300
Arg Leu Cys Trp Asp Lys Val Thr Glu Ser Cys Thr Ser Val Cys Lys
305                 310                 315                 320
Thr Gly Thr Asn His Ser Cys Lys Leu Phe Pro Ile Ser Ser Ser Ala
                325                 330                 335
Thr Gln Ser Leu Phe Thr Val Leu Lys Lys Ala Gly Val Ser Ile Ser
            340                 345                 350
Leu Glu Thr Gly Val Gly Glu Ile Ala Thr Asn Pro Glu Met Arg Asn
        355                 360                 365
Leu Thr Gly Lys Ala Glu Asn Ser Lys Ile Ala Ile Ile Gly Met Ser
    370                 375                 380
Gly Arg Phe Pro Asp Ser Asp Gly Thr Glu Ser Phe Trp Asn Leu Leu
385                 390                 395                 400
Tyr Lys Gly Leu Asp Val His Arg Lys Val Pro Ala Asp Arg Trp Asp
                405                 410                 415
Val Asp Ala His Val Asp Met Thr Gly Ser Lys Arg Asn Thr Ser Lys
            420                 425                 430
Val Ala Tyr Gly Cys Trp Ile Asn Glu Pro Gly Leu Phe Asp Pro Arg
        435                 440                 445
Phe Phe Asn Met Ser Pro Arg Glu Ala Leu Gln Ala Asp Pro Ala Gln
    450                 455                 460
Arg Leu Ala Leu Leu Thr Ala Tyr Glu Ala Leu Glu Met Ala Gly Phe
465                 470                 475                 480
Ile Pro Asp Ser Ser Pro Ser Thr Gln Arg Asp Arg Val Gly Ile Phe
                485                 490                 495
Tyr Gly Met Thr Ser Asp Asp Tyr Arg Glu Ile Asn Ser Gly Gln Asp
            500                 505                 510
Ile Asp Thr Tyr Phe Ile Pro Gly Gly Asn Arg Ala Phe Thr Pro Gly
        515                 520                 525
Arg Ile Asn Tyr Tyr Phe Lys Phe Ser Gly Pro Ser Val Ser Val Asp
    530                 535                 540
Thr Ala Cys Ser Ser Ser Leu Ala Ala Ile His Met Ala Cys Asn Ser
545                 550                 555                 560
Ile Trp Arg Asn Asp Cys Asp Ala Ala Ile Thr Gly Gly Val Asn Ile
                565                 570                 575
Leu Thr Asn Pro Asp Asn His Ala Gly Leu Asp Arg Gly His Phe Leu
            580                 585                 590
Ser Thr Thr Gly Asn Cys Asn Thr Phe Asp Asp Gly Ala Asp Gly Tyr
        595                 600                 605
Cys Arg Ala Asp Gly Val Gly Ser Ile Val Leu Lys Arg Leu Glu Asp
    610                 615                 620
Ala Glu Ala Asp Asn Asp Pro Ile Leu Ala Val Ile Asn Gly Ala Tyr
625                 630                 635                 640
Thr Asn His Ser Ala Glu Ala Val Ser Ile Thr Arg Pro His Val Gly
                645                 650                 655
Ala Gln Ala Phe Ile Phe Asn Lys Leu Leu Asn Asp Ala Asn Ile Asp
            660                 665                 670
Pro Lys Asp Val Ser Tyr Val Glu Met His Gly Thr Gly Thr Gln Ala
        675                 680                 685
Gly Asp Ala Val Glu Met Gln Ser Val Leu Asp Val Phe Ala Pro Asp
    690                 695                 700
Tyr Arg Arg Gly Pro Gly Gln Ser Leu His Ile Gly Ser Ala Lys Ala
705                 710                 715                 720
Asn Ile Gly His Gly Glu Ser Ala Ser Gly Val Thr Ala Leu Val Lys
                725                 730                 735
Val Leu Leu Met Met Arg Glu Asn Met Ile Pro Pro His Cys Gly Ile
            740                 745                 750
Lys Thr Lys Ile Asn Ser Asn Phe Pro Thr Asp Leu Ala Lys Arg Asn
        755                 760                 765
Val His Ile Ala Phe Gln Pro Thr Pro Trp Asn Arg Pro Ala Ser Gly
    770                 775                 780
Lys Arg Arg Thr Phe Val Asn Asn Phe Ser Ala Ala Gly Gly Asn Thr
785                 790                 795                 800
Ala Leu Leu Leu Glu Asp Ala Pro Ile Pro Glu Arg Gln Gly Gln Asp
                805                 810                 815
Pro Arg Ser Phe His Leu Val Ser Val Ser Ala Arg Ser Gln Ser Ala
            820                 825                 830
Leu Lys Asn Asn Val Glu Ala Leu Val Lys Tyr Ile Asp Ser Gln Gly
        835                 840                 845
Lys Ser Phe Gly Val Lys Glu Thr Glu Phe Leu Pro Asn Leu Ala Tyr
    850                 855                 860
Thr Thr Thr Ala Arg Arg Ile His His Pro Phe Arg Val Thr Ala Val
865                 870                 875                 880
Gly Ala Asn Leu Gln Ser Leu Arg Asp Ser Leu His Gly Ala Leu His
                885                 890                 895
Arg Glu Thr Tyr Thr Pro Val Pro Ser Thr Ala Pro Gly Ile Gly Phe
            900                 905                 910
Val Phe Thr Gly Gln Gly Ala Gln Tyr Ser Gly Met Gly Lys Glu Leu
        915                 920                 925
Tyr Arg Ser Cys Phe Gln Phe Arg Thr Thr Ile Glu His Phe Asp Cys
    930                 935                 940
Ile Ala Arg Ser Gln Gly Leu Pro Ser Ile Leu Pro Leu Val Asp Gly
945                 950                 955                 960
Ser Val Ala Val Glu Glu Leu Ser Pro Val Val Val Gln Val Gly Thr
                965                 970                 975
Thr Cys Val Gln Met Ala Leu Val Asn Tyr Trp Thr Ala Leu Gly Val
            980                 985                 990
Lys Pro Ala Phe Ile Ile Gly His Ser Leu Gly Asp Tyr Ala Ala Leu
        995                 1000                1005
Asn Thr Ala Gly Val Leu Ser Thr Ser Asp Thr Ile Tyr Leu Cys
    1010                1015                1020
Gly Arg Arg Ala Gln Leu Leu Thr Lys Glu Cys Lys Ile Gly Thr
    1025                1030                1035
His Ser Met Leu Ala Ile Lys Ala Ser Leu Ala Glu Val Lys His
    1040                1045                1050
Phe Leu Arg Asp Glu Leu His Glu Val Ser Cys Val Asn Ala Pro
    1055                1060                1065
Ala Glu Thr Val Val Ser Gly Leu Val Ala Asp Ile Asp Glu Leu
    1070                1075                1080
Ala Gln Lys Cys Ser Thr Glu Gly Leu Lys Ser Thr Lys Leu Lys
    1085                1090                1095
Val Pro Tyr Ala Phe His Ser Ser Gln Val Asp Pro Ile Leu Glu
    1100                1105                1110
Ala Phe Glu Asp Ile Ala Gln Gly Val Thr Phe His Lys Pro Thr
    1115                1120                1125
Thr Pro Phe Val Ser Ala Leu Phe Gly Glu Val Ile Thr Asp Ala
    1130                1135                1140
Asn Trp Glu Cys Leu Gly Pro Lys Tyr Leu Arg Asp His Cys Arg
    1145                1150                1155
Lys Thr Val Asn Phe Leu Gly Gly Val Glu Ala Thr Arg His Ala
    1160                1165                1170
Lys Leu Thr Asn Asp Lys Thr Leu Trp Val Glu Ile Gly Ser His
    1175                1180                1185
Thr Ile Cys Ser Gly Met Ile Lys Ala Thr Leu Gly Pro Gln Val
    1190                1195                1200
Thr Thr Val Ala Ser Leu Arg Arg Glu Glu Asp Thr Trp Lys Val
    1205                1210                1215
Leu Ser Asn Ser Leu Ala Ser Leu His Leu Ala Gly Ile Asp Ile
    1220                1225                1230
Asn Trp Lys Gln Tyr His Gln Asp Phe Ser Ser Ser Leu Gln Val
    1235                1240                1245
Leu Arg Leu Pro Ala Tyr Lys Trp Asp Leu Lys Asn Tyr Trp Ile
    1250                1255                1260
Pro Tyr Thr Asn Asn Phe Cys Leu Ser Lys Gly Ala Pro Val Ala
    1265                1270                1275
Thr Val Ala Ala Gly Pro Gln His Glu Tyr Leu Thr Thr Ala Ala
    1280                1285                1290
Gln Lys Val Ile Glu Thr Arg Ser Asp Gly Ala Thr Ala Thr Val
    1295                1300                1305
Val Ile Glu Asn Asp Ile Ala Asp Pro Glu Leu Asn Arg Val Ile
    1310                1315                1320
Gln Gly His Lys Val Asn Gly Thr Ala Leu Cys Pro Ser Ser Leu
    1325                1330                1335
Tyr Ala Asp Ile Ser Gln Thr Leu Ala Glu Tyr Leu Ile Lys Lys
    1340                1345                1350
Tyr Lys Pro Glu Tyr Asp Gly Leu Gly Leu Asp Val Cys Glu Val
    1355                1360                1365
Thr Val Pro Arg Pro Leu Ile Ala Lys Gly Gly Gln Gln Leu Phe
    1370                1375                1380
Arg Val Ser Ala Thr Ala Asp Trp Ala Glu Lys Lys Thr Thr Leu
    1385                1390                1395
Gln Ile Tyr Ser Val Thr Ala Glu Gly Lys Lys Thr Ala Asp His
    1400                1405                1410
Ala Thr Cys Thr Val Arg Phe Phe Asp Cys Ala Ala Ala Glu Ala
    1415                1420                1425
Glu Trp Lys Arg Val Ser Tyr Leu Val Lys Arg Ser Ile Asp Arg
    1430                1435                1440
Leu His Asp Ile Ala Glu Asn Gly Asp Ala His Arg Leu Gly Arg
    1445                1450                1455
Gly Met Val Tyr Lys Leu Phe Ala Ala Leu Val Asp Tyr Asp Asp
    1460                1465                1470
Asn Phe Lys Ser Ile Arg Glu Val Ile Leu Asp Ser Glu Gln His
    1475                1480                1485
Glu Ala Thr Ala Arg Val Lys Phe Gln Ala Pro Gln Gly Asn Phe
    1490                1495                1500
His Arg Asn Pro Phe Trp Ile Asp Ser Phe Gly His Leu Ser Gly
    1505                1510                1515
Phe Ile Met Asn Ala Ser Asp Ala Thr Asp Ser Lys Asn Gln Val
    1520                1525                1530
Phe Val Asn His Gly Trp Asp Ser Met Arg Cys Leu Lys Lys Phe
    1535                1540                1545
Ser Pro Asp Val Thr Tyr Arg Thr Tyr Val Arg Met Gln Pro Trp
    1550                1555                1560
Lys Asp Ser Ile Trp Ala Gly Asp Val Tyr Val Phe Asp Gly Asp
    1565                1570                1575
Asp Ile Val Ala Val Tyr Gly Ala Val Lys Phe Gln Ala Leu Ser
    1580                1585                1590
Arg Lys Ile Leu Asp Thr Val Leu Pro Pro Ser Arg Ala Ser Ala
    1595                1600                1605
Pro Ala Pro Ala Lys Pro Ala Ala Lys Pro Ser Ala Pro Ser Leu
    1610                1615                1620
Val Lys Arg Ala Leu Thr Ile Leu Ala Glu Glu Val Gly Leu Ser
    1625                1630                1635
Glu Ser Glu Ile Thr Asp Asp Leu Val Phe Ala Asp Tyr Gly Val
    1640                1645                1650
Asp Ser Leu Leu Ser Leu Thr Val Thr Gly Arg Tyr Arg Glu Glu
    1655                1660                1665
Leu Asp Ile Asp Leu Glu Ser Ser Ile Phe Ile Asp Gln Pro Thr
    1670                1675                1680
Val Lys Asp Phe Lys Gln Phe Leu Ala Pro Met Ser Gln Gly Glu
    1685                1690                1695
Ala Ser Asp Gly Ser Thr Ser Asp Pro Glu Ser Ser Ser Ser Phe
    1700                1705                1710
Asn Gly Gly Ser Ser Thr Asp Glu Ser Ser Ala Gly Ser Pro Val
    1715                1720                1725
Ser Ser Pro Pro Asn Glu Lys Val Thr Gln Val Glu Gln His Ala
    1730                1735                1740
Thr Ile Lys Glu Ile Arg Ala Ile Leu Ala Asp Glu Ile Gly Val
    1745                1750                1755
Thr Glu Glu Glu Leu Lys Asp Asp Glu Asn Leu Gly Glu Met Gly
    1760                1765                1770
Met Asp Ser Leu Leu Ser Leu Thr Val Leu Gly Arg Ile Arg Glu
    1775                1780                1785
Thr Leu Asp Leu Asp Leu Pro Gly Glu Phe Phe Ile Glu Asn Gln
    1790                1795                1800
Thr Leu Asn Asp Val Glu Asp Ala Leu Gly Leu Lys Pro Lys Ala
    1805                1810                1815
Ala Pro Ala Pro Ala Pro Ala Pro Ala Pro Val Pro Ala Pro Val
    1820                1825                1830
Ser Ala Pro Ile Leu Lys Glu Pro Val Pro Asn Ala Asn Ser Thr
    1835                1840                1845
Ile Met Ala Arg Ala Ser Pro His Pro Arg Ser Thr Ser Ile Leu
    1850                1855                1860
Leu Gln Gly Asn Pro Lys Thr Ala Thr Lys Thr Leu Phe Leu Phe
    1865                1870                1875
Pro Asp Gly Ser Gly Ser Ala Thr Ser Tyr Ala Thr Ile Pro Gly
    1880                1885                1890
Val Ser Pro Asp Val Cys Val Tyr Gly Leu Asn Cys Pro Tyr Met
    1895                1900                1905
Lys Thr Pro Glu Lys Leu Lys Tyr Pro Leu Ala Glu Met Thr Phe
    1910                1915                1920
Pro Tyr Leu Ala Glu Ile Arg Arg Arg Gln Pro Lys Gly Pro Tyr
    1925                1930                1935
Asn Phe Gly Gly Trp Ser Ala Gly Gly Ile Cys Ala Tyr Asp Ala
    1940                1945                1950
Ala Arg Tyr Leu Ile Leu Glu Glu Gly Glu Gln Val Asp Arg Leu
    1955                1960                1965
Leu Leu Leu Asp Ser Pro Phe Pro Ile Gly Leu Glu Lys Leu Pro
    1970                1975                1980
Thr Arg Leu Tyr Gly Phe Ile Asn Ser Met Gly Leu Phe Gly Glu
    1985                1990                1995
Gly Asn Lys Ala Pro Pro Ala Trp Leu Leu Pro His Phe Leu Ala
    2000                2005                2010
Phe Ile Asp Ser Leu Asp Thr Tyr Lys Ala Val Pro Leu Pro Phe
    2015                2020                2025
Asp Asp Pro Lys Trp Ala Lys Lys Met Pro Lys Thr Phe Met Val
    2030                2035                2040
Trp Ala Lys Asp Gly Ile Cys Ser Lys Pro Asp Asp Pro Trp Pro
    2045                2050                2055
Glu Pro Asp Pro Asp Gly Lys Pro Asp Thr Arg Glu Met Val Trp
    2060                2065                2070
Leu Leu Lys Asn Arg Thr Asp Met Gly Pro Asn Lys Trp Asp Thr
    2075                2080                2085
Leu Val Gly Pro Gln Asn Val Gly Gly Ile Thr Val Ile Glu Gly
    2090                2095                2100
Ala Asn His Phe Thr Met Thr Leu Gly Pro Lys Ala Lys Glu Leu
    2105                2110                2115
Gly Ser Phe Ile Gly Asn Ala Met Ala Asn
    2120                2125
<210>27
<211>502
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>27
tcagcgcggt aagctctaat ggcgttactg tcagcgcacc acctacggta cttgatgaat     60
tcgtcgagac ctgcatttcc aagaattaca agccagtgaa ggcccctatt catggcccgt    120
accatgcgcc acatctgtat gatgataagg atatcgaccg catcctgcag cagtcctctg    180
ctctagaagg actgaccggc tgttcacccg ttattcccat catctccagt aacactggaa    240
agccgatcaa ggccaagtcc atcaaagatc tcttcaaggt cgcactggag gagatactcc    300
tacgacgact atgctgggac aaggtcacgg agtcctgcac atcagtctgc aagaccggca    360
caaaccactc ttgcaaattg tttccgatct cgagtagcgc cactcaaagt ttgttcacag    420
tcctcaagaa ggccggtgtg agcatcagct tggagactgg ggtaggagag atcgcgacga    480
acccagaaat gcggaacctt ac                                             502
<210>28
<211>166
<212>PRT
<213>黑曲霉(Aspergillus niger)
<400>28
Ser Ala Val Ser Ser Asn Gly Val Thr Val Ser Ala Pro Pro Thr Val
1               5                   10                  15
Leu Asp Glu Phe Val Glu Thr Cys Ile Ser Lys Asn Tyr Lys Pro Val
            20                  25                  30
Lys Ala Pro Ile His Gly Pro Tyr His Ala Pro His Leu Tyr Asp Asp
        35                  40                  45
Lys Asp Ile Asp Arg Ile Leu Gln Gln Ser Ser Ala Leu Glu Gly Leu
    50                  55                  60
Thr Gly Cys Ser Pro Val Ile Pro Ile Ile Ser Ser Asn Thr Gly Lys
65                  70                  75                  80
Pro Ile Lys Ala Lys Ser Ile Lys Asp Leu Phe Lys Val Ala Leu Glu
                85                  90                  95
Glu Ile Leu Leu Arg Arg Leu Cys Trp Asp Lys Val Thr Glu Ser Cys
            100                 105                 110
Thr Ser Val Cys Lys Thr Gly Thr Asn His Ser Cys Lys Leu Phe Pro
        115                 120                 125
Ile Ser Ser Ser Ala Thr Gln Ser Leu Phe Thr Val Leu Lys Lys Ala
    130                 135                 140
Gly Val Ser Ile Ser Leu Glu Thr Gly Val Gly Glu Ile Ala Thr Asn
145                 150                 155                 160
Pro Glu Met Arg Asn Leu
                165
<210>29
<211>30
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>29
ggggccatgg tcagcgcggt aagctctaat                                   30
<210>30
<211>32
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>30
gggggcggcc gcgtaaggtt ccgcatttct gg                                32
<210>31
<211>20
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>31
tcgtgaatca ggtcctagcc                                              20
<210>32
<211>22
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>32
aaacaaccca attggtagat gc                                           22
<210>33
<211>21
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>33
atctgtacgg caacattgtc a                                            21
<210>34
<211>20
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>34
ttctgcatac ggtcggagat                                              20
<210>35
<211>30
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>35
ttaattaatc ggtcaatcgc cgttgtcaga                                      30
<210>36
<211>24
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>36
aatttccaaa cagggtaact ccac                                            24
<210>37
<211>2564
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>37
ggacagccgg acgcaatggt gaataacgca gctcttctcg ccgccctgtc ggctctcctg      60
cccacggccc tggcgcagaa caatcaaaca tacgccaact actctgctca gggccagcct     120
gatctctacc ccgagacact tgccacgctc acactctcgt tccccgactg cgaacatggc     180
cccctcaaga acaatctcgt ctgtgactca tcggccggct atgtagagcg agcccaggcc     240
ctcatctcgc tcttcaccct cgaggagctc attctcaaca cgcaaaactc gggccccggc     300
gtgcctcgcc tgggtcttcc gaactaccaa gtctggaatg aggctctgca cggcttggac     360
cgcgccaact tcgccaccaa gggcggccag ttcgaatggg cgacctcgtt ccccatgccc     420
atcctcacta cggcggccct caaccgcaca ttgatccacc agattgccga catcatctcg     480
acccaagctc gagcattcag caacagcggc cgttacggtc tcgacgtcta tgcgccaaac     540
gtcaatggct tccgaagccc cctctggggc cgtggccagg agacgcccgg cgaagacgcc     600
tttttcctca gctccgccta tacttacgag tacatcacgg gcatccaggg tggcgtcgac     660
cctgagcacc tcaaggttgc cgccacggtg aagcactttg ccggatacga cctcgagaac     720
tggaacaacc agtcccgtct cggtttcgac gccatcataa ctcagcagga cctctccgaa     780
tactacactc cccagttcct cgctgcggcc cgttatgcaa agtcacgcag cttgatgtgc     840
gcatacaact ccgtcaacgg cgtgcccagc tgtgccaaca gcttcttcct gcagacgctt     900
ttgcgcgaga gctggggctt ccccgaatgg ggatacgtct cgtccgattg cgatgccgtc     960
tacaacgttt tcaaccctca tgactacgcc agcaaccagt cgtcagccgc cgccagctca    1020
ctgcgagccg gcaccgatat cgactgcggt cagacttacc cgtggcacct caacgagtcc    1080
tttgtggccg gcgaagtctc ccgcggcgag atcgagcggt ccgtcacccg tctgtacgcc    1140
aacctcgtcc gtctcggata cttcgacaag aagaaccagt accgctcgct cggttggaag    1200
gatgtcgtca agactgatgc ctggaacatc tcgtacgagg ctgctgttga gggcatcgtc    1260
ctgctcaaga acgatggcac tctccctctg tccaagaagg tgcgcagcat tgctctgatc    1320
ggaccatggg ccaatgccac aacccaaatg caaggcaact actatggccc tgccccatac    1380
ctcatcagcc ctctggaagc tgctaagaag gccggctatc acgtcaactt tgaactcggc    1440
acagagatcg ccggcaacag caccactggc tttgccaagg ccattgctgc cgccaagaag    1500
tcggatgcca tcatctacct cggtggaatt gacaacacca ttgaacagga gggcgctgac    1560
cgcacggaca ttgcttggcc cggtaatcag ctggatctca tcaagcagct cagcgaggtc    1620
ggcaaacccc ttgtcgtcct gcaaatgggc ggtggtcagg tagactcatc ctcgctcaag    1680
agcaacaaga aggtcaactc cctcgtctgg ggcggatatc ccggccagtc gggaggcgtt    1740
gccctcttcg acattctctc tggcaagcgt gctcctgccg gccgactggt caccactcag    1800
tacccggctg agtatgttca ccaattcccc cagaatgaca tgaacctccg acccgatgga    1860
aagtcaaacc ctggacagac ttacatctgg tacaccggca aacccgtcta cgagtttggc    1920
agtggtctct tctacaccac cttcaaggag actctcgcca gccaccccaa gagcctcaag    1980
ttcaacacct catcgatcct ctctgctcct caccccggat acacttacag cgagcagatt    2040
cccgtcttca ccttcgaggc caacatcaag aactcgggca agacggagtc cccatatacg    2100
gccatgctgt ttgttcgcac aagcaacgct ggcccagccc cgtacccgaa caagtggctc    2160
gtcggattcg accgacttgc cgacatcaag cctggtcact cttccaagct cagcatcccc    2220
atccctgtca gtgctctcgc ccgtgttgat tctcacggaa accggattgt ataccccggc    2280
aagtatgagc tagccttgaa caccgacgag tctgtgaagc ttgagtttga gttggtggga    2340
gaagaggtaa cgattgagaa ctggccgttg gaggagcaac agatcaagga tgctacacct    2400
gacgcataag ggttttaatg atgttgttat gacaaacggg tagagtagtt aatgatggaa    2460
taggaagagg ccatagtttt ctgtttgcaa accatttttg ccattgcgaa aaaaaaaaaa    2520
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaa                     2564
<210>38
<211>797
<212>PRT
<213>里氏木霉(Trichoderma reesei)
<400>38
Met Val Asn Asn Ala Ala Leu Leu Ala Ala Leu Ser Ala Leu Leu Pro
1               5                   10                  15
Thr Ala Leu Ala Gln Asn Asn Gln Thr Tyr Ala Asn Tyr Ser Ala Gln
            20                  25                  30
Gly Gln Pro Asp Leu Tyr Pro Glu Thr Leu Ala Thr Leu Thr Leu Ser
        35                  40                  45
Phe Pro Asp Cys Glu His Gly Pro Leu Lys Asn Asn Leu Val Cys Asp
    50                  55                  60
Ser Ser Ala Gly Tyr Val Glu Arg Ala Gln Ala Leu Ile Ser Leu Phe
65                  70                  75                  80
Thr Leu Glu Glu Leu Ile Leu Asn Thr Gln Asn Ser Gly Pro Gly Val
                85                  90                  95
Pro Arg Leu Gly Leu Pro Asn Tyr Gln Val Trp Asn Glu Ala Leu His
            100                 105                 110
Gly Leu Asp Arg Ala Asn Phe Ala Thr Lys Gly Gly Gln Phe Glu Trp
        115                 120                 125
Ala Thr Ser Phe Pro Met Pro Ile Leu Thr Thr Ala Ala Leu Asn Arg
    130                 135                 140
Thr Leu Ile His Gln Ile Ala Asp Ile Ile Ser Thr Gln Ala Arg Ala
145                 150                 155                 160
Phe Ser Asn Ser Gly Arg Tyr Gly Leu Asp Val Tyr Ala Pro Asn Val
                165                 170                 175
Asn Gly Phe Arg Ser Pro Leu Trp Gly Arg Gly Gln Glu Thr Pro Gly
            180                 185                 190
Glu Asp Ala Phe Phe Leu Ser Ser Ala Tyr Thr Tyr Glu Tyr Ile Thr
        195                 200                 205
Gly Ile Gln Gly Gly Val Asp Pro Glu His Leu Lys Val Ala Ala Thr
    210                 215                 220
Val Lys His Phe Ala Gly Tyr Asp Leu Glu Asn Trp Asn Asn Gln Ser
225                 230                 235                 240
Arg Leu Gly Phe Asp Ala Ile Ile Thr Gln Gln Asp Leu Ser Glu Tyr
                245                 250                 255
Tyr Thr Pro Gln Phe Leu Ala Ala Ala Arg Tyr Ala Lys Ser Arg Ser
            260                 265                 270
Leu Met Cys Ala Tyr Asn Ser Val Asn Gly Val Pro Ser Cys Ala Asn
        275                 280                 285
Ser Phe Phe Leu Gln Thr Leu Leu Arg Glu Ser Trp Gly Phe Pro Glu
    290                 295                 300
Trp Gly Tyr Val Ser Ser Asp Cys Asp Ala Val Tyr Asn Val Phe Asn
305                 310                 315                 320
Pro His Asp Tyr Ala Ser Asn Gln Ser Ser Ala Ala Ala Ser Ser Leu
                325                 330                 335
Arg Ala Gly Thr Asp Ile Asp Cys Gly Gln Thr Tyr Pro Trp His Leu
            340                 345                 350
Asn Glu Ser Phe Val Ala Gly Glu Val Ser Arg Gly Glu Ile Glu Arg
        355                 360                 365
Ser Val Thr Arg Leu Tyr Ala Asn Leu Val Arg Leu Gly Tyr Phe Asp
    370                 375                 380
Lys Lys Asn Gln Tyr Arg Ser Leu Gly Trp Lys Asp Val Val Lys Thr
385                 390                 395                 400
Asp Ala Trp Asn Ile Ser Tyr Glu Ala Ala Val Glu Gly Ile Val Leu
                405                 410                 415
Leu Lys Asn Asp Gly Thr Leu Pro Leu Ser Lys Lys Val Arg Ser Ile
            420                 425                 430
Ala Leu Ile Gly Pro Trp Ala Asn Ala Thr Thr Gln Met Gln Gly Asn
        435                 440                 445
Tyr Tyr Gly Pro Ala Pro Tyr Leu Ile Ser Pro Leu Glu Ala Ala Lys
    450                 455                 460
Lys Ala Gly Tyr His Val Asn Phe Glu Leu Gly Thr Glu Ile Ala Gly
465                 470                 475                 480
Asn Ser Thr Thr Gly Phe Ala Lys Ala Ile Ala Ala Ala Lys Lys Ser
                485                 490                 495
Asp Ala Ile Ile Tyr Leu Gly Gly Ile Asp Asn Thr Ile Glu Gln Glu
            500                 505                 510
Gly Ala Asp Arg Thr Asp Ile Ala Trp Pro Gly Asn Gln Leu Asp Leu
        515                 520                 525
Ile Lys Gln Leu Ser Glu Val Gly Lys Pro Leu Val Val Leu Gln Met
    530                 535                 540
Gly Gly Gly Gln Val Asp Ser Ser Ser Leu Lys Ser Asn Lys Lys Val
545                 550                 555                 560
Asn Ser Leu Val Trp Gly Gly Tyr Pro Gly Gln Ser Gly Gly Val Ala
                565                 570                 575
Leu Phe Asp Ile Leu Ser Gly Lys Arg Ala Pro Ala Gly Arg Leu Val
            580                 585                 590
Thr Thr Gln Tyr Pro Ala Glu Tyr Val His Gln Phe Pro Gln Asn Asp
        595                 600                 605
Met Asn Leu Arg Pro Asp Gly Lys Ser Asn Pro Gly Gln Thr Tyr Ile
    610                 615                 620
Trp Tyr Thr Gly Lys Pro Val Tyr Glu Phe Gly Ser Gly Leu Phe Tyr
625                 630                 635                 640
Thr Thr Phe Lys Glu Thr Leu Ala Ser His Pro Lys Ser Leu Lys Phe
                645                 650                 655
Asn Thr Ser Ser Ile Leu Ser Ala Pro His Pro Gly Tyr Thr Tyr Ser
            660                 665                 670
Glu Gln Ile Pro Val Phe Thr Phe Glu Ala Asn Ile Lys Asn Ser Gly
        675                 680                 685
Lys Thr Glu Ser Pro Tyr Thr Ala Met Leu Phe Val Arg Thr Ser Asn
    690                 695                 700
Ala Gly Pro Ala Pro Tyr Pro Asn Lys Trp Leu Val Gly Phe Asp Arg
705                 710                 715                 720
Leu Ala Asp Ile Lys Pro Gly His Ser Ser Lys Leu Ser Ile Pro Ile
                725                 730                 735
Pro Val Ser Ala Leu Ala Arg Val Asp Ser His Gly Asn Arg Ile Val
            740                 745                 750
Tyr Pro Gly Lys Tyr Glu Leu Ala Leu Asn Thr Asp Glu Ser Val Lys
        755                 760                 765
Leu Glu Phe Glu Leu Val Gly Glu Glu Val Thr Ile Glu Asn Trp Pro
    770                 775                 780
Leu Glu Glu Gln Gln Ile Lys Asp Ala Thr Pro Asp Ala
785                 790                 795
<210>39
<211>500
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>39
acgagtttgg cagtggtctc ttctacacca ccttcaagga gactctcgcc agccacccca     60
agagcctcaa gttcaacacc tcatcgatcc tctctgctcc tcaccccgga tacacttaca    120
gcgagcagat tcccgtcttc accttcgagg ccaacatcaa gaactcgggc aagacggagt    180
ccccatatac ggccatgctg tttgttcgca caagcaacgc tggcccagcc ccgtacccga    240
acaagtggct cgtcggattc gaccgacttg ccgacatcaa gcctggtcac tcttccaagc    300
tcagcatccc catccctgtc agtgctctcg cccgtgttga ttctcacgga aaccggattg    360
tataccccgg caagtatgag ctagccttga acaccgacga gtctgtgaag cttgagtttg    420
agttggtggg agaagaggta acgattgaga actggccgtt ggaggagcaa cagatcaagg    480
atgctacacc tgacgcataa                                                500
<210>40
<211>166
<212>PRT
<213>里氏木霉(Trichoderma reesei)
<400>40
Tyr Glu Phe Gly Ser Gly Leu Phe Tyr Thr Thr Phe Lys Glu Thr Leu
1               5                   10                  15
Ala Ser His Pro Lys Ser Leu Lys Phe Asn Thr Ser Ser Ile Leu Ser
            20                  25                  30
Ala Pro His Pro Gly Tyr Thr Tyr Ser Glu Gln Ile Pro Val Phe Thr
        35                  40                  45
Phe Glu Ala Asn Ile Lys Asn Ser Gly Lys Thr Glu Ser Pro Tyr Thr
    50                  55                  60
Ala Met Leu Phe Val Arg Thr Ser Asn Ala Gly Pro Ala Pro Tyr Pro
65                  70                  75                  80
Asn Lys Trp Leu Val Gly Phe Asp Arg Leu Ala Asp Ile Lys Pro Gly
                85                  90                  95
His Ser Ser Lys Leu Ser Ile Pro Ile Pro Val Ser Ala Leu Ala Arg
            100                 105                 110
Val Asp Ser His Gly Asn Arg Ile Val Tyr Pro Gly Lys Tyr Glu Leu
        115                 120                 125
Ala Leu Asn Thr Asp Glu Ser Val Lys Leu Glu Phe Glu Leu Val Gly
    130                 135                 140
Glu Glu Val Thr Ile Glu Asn Trp Pro Leu Glu Glu Gln Gln Ile Lys
145                 150                 155                 160
Asp Ala Thr Pro Asp Ala
                165
<210>41
<211>26
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>41
ccatggtacg agtttggcag tggtct                                    26
<210>42
<211>26
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>42
acgcgtttat gcgtcaggtg tagcat                                    26
QQ群二维码
意见反馈