具有α-葡糖苷酶活性的多肽类和编码它们的多核苷酸

申请号 CN200580029848.6 申请日 2005-07-06 公开(公告)号 CN101010331A 公开(公告)日 2007-08-01
申请人 诺维信股份有限公司; 发明人 戴比·亚弗; 贾宁·林; 亚历山大·布林科夫斯基; 金伯利·布朗; 迈克尔·雷伊;
摘要 本 发明 涉及具有α-葡糖苷酶活性的分离的多肽类和编码这些多肽类的分离的多核苷酸。本发明还涉及包括所述多核苷酸的核酸构建体、载体和宿主细胞以及生产和使用所述多肽类的方法。
权利要求

1.具有α-葡糖苷酶活性的分离的多肽,选自下列多肽组成的组:
(a)带有与SEQ ID NO:2的21-960位基酸具有至少85%的同一性 的氨基酸序列的多肽;
(b)由多核苷酸编码的多肽,所述的多核苷酸在至少高度严格条件下 与如下成分杂交:(i)SEQ ID NO:1的61-2880位核苷酸;(ii)包括SEQ ID NO:1的61-2880位核苷酸的基因组DNA序列;或(iii)(i)或(ii)的互补链; 和
(c)包括SEQ ID NO:2的21-960位氨基酸中的一个或多个氨基酸的 保守取代、缺失和/或插入的变体。
2.权利要求1所述的多肽,带有与SEQ ID NO:2的21-960位氨基酸具 有至少85%同一性的氨基酸序列。
3.权利要求2所述的多肽,带有与SEQ ID NO:2的21-960位氨基酸具 有至少90%同一性的氨基酸序列。
4.权利要求3所述的多肽,带有与SEQ ID NO:2的21-960位氨基酸具 有至少95%同一性的氨基酸序列。
5.权利要求4所述的多肽,带有与SEQ ID NO:2的21-960位氨基酸具 有至少97%同一性的氨基酸序列。
6.权利要求1-5中任一项所述的多肽,包括SEQ ID NO:2的氨基酸序列。
7.权利要求1-6中任一项所述的多肽,由SEQ ID NO:2或其具有α-葡糖 苷酶活性的片段组成。
8.权利要求7所述的多肽,由SEQ ID NO:2组成。
9.权利要求7所述的多肽,由SEQ ID NO:2的21-960位氨基酸组成。
10.权利要求1所述的多肽,由多核苷酸编码,该多核苷酸在至少高度 严格条件下与如下成分杂交:(i)SEQ ID NO:1的61-2880位核苷酸;(ii)包 括SEQ ID NO:1的61-2880位核苷酸的基因组DNA序列;或(iii)(i)或(ii)的互 补链。
11.权利要求1所述的多肽,其中所述的多核苷酸为包括SEQ ID NO:2 的21-960位氨基酸中的一个或多个氨基酸的保守取代、缺失和/或插入的变 体。
12.权利要求1所述的多肽,由包含在质粒pFD11F2中的多核苷酸编码, 所述的质粒包含在大肠杆菌NRRL B-30753中。
13.分离的多核苷酸,包括编码权利要求1-12中任一项所述的多肽的核 苷酸序列。
14.权利要求13的分离的多核苷酸,具有在SEQ ID NO:1的成熟多肽编 码序列中的至少一种突变,其中突变的核苷酸序列编码SEQ ID NO:2的21 -960位氨基酸组成的多肽。
15.包括权利要求13或14所述多核苷酸的核酸构建体,所述的多核苷 酸可操作地与在表达宿主中指导产生所述多肽的一种或多种控制序列连 接。
16.包括权利要求15所述核酸构建体的重组表达载体。
17.包括权利要求15所述核酸构建体的重组宿主细胞。
18.用于生产权利要求1-12中任一项所述多肽的方法,包括:(a)在有 助于产生所述多肽的条件下,培养野生型形式下能够产生所述多肽的细胞; 和(b)回收所述多肽。
19.用于生产权利要求1-12中任一项所述多肽的方法,包括:(a)在有 助于产生所述多肽的条件下,培养包括核酸构建体的宿主细胞,所述的核 酸构建体包括编码所述多肽的核苷酸序列;和(b)回收所述多肽。
20.用于生产亲代细胞突变体的方法,包括破坏或缺失编码权利要求 1-12中任一项所述多肽的核苷酸序列,导致突变体产生的多肽少于亲代细胞 产生的多肽。
21.通过权利要求20所述方法生产的突变细胞。
22.权利要求21所述的突变细胞,进一步包括编码天然或异源蛋白的 基因。
23.用于生产蛋白质的方法,包括:(a)在有助于产生所述蛋白质的条 件下培养权利要求22所述的突变细胞;和(b)回收所述的蛋白质。
24.通过下列步骤获得的分离的多核苷酸:(a)使DNA群体在至少高度 严格条件下与如下成分杂交:(i)SEQ ID NO:1的61-2880位核苷酸;(ii)包 括SEQ ID NO:1的61-2880位核苷酸的基因组DNA序列;或(iii)(i)或(ii)的互 补链;和(b)分离杂交的多核苷酸,该多核苷酸编码具有α-葡糖苷酶活性的 多肽。
25.用于生产具有突变核苷酸序列的多核苷酸的方法,包括:(a)将至 少一种突变引入SEQ ID NO:1的成熟多肽编码序列,其中所述的突变核苷酸 序列编码由SEQ ID NO:2的21-960位氨基酸组成的多肽;和(b)回收包括 所述突变核苷酸序列的多核苷酸。
26.通过权利要求25所述方法生产的突变体多核苷酸。
27.用于生产多肽的方法,包括:(a)在有助于产生所述多肽的条件下 培养包括权利要求26所述的编码所述多肽的突变体多核苷酸的细胞;和(b) 回收所述的多肽。
28.包括编码蛋白质的基因的核酸构建体,所述基因可操作地与编码 由SEQ ID NO:1的1-60位核苷酸组成的信号肽的核苷酸序列连接,其中所 述的基因对所述的核苷酸序列而言为外源性的。
29.包括权利要求29所述核酸构建体的重组表达载体。
30.包括权利要求29所述核酸构建体的重组宿主细胞。
31.用于生产蛋白质的方法,包括:(a)在有助于产生所述蛋白质的条 件下培养权利要求30所述的重组宿主细胞;和(b)回收所述的蛋白质。
32.用于生产权利要求1-12中任一项所述多肽的方法,包括:(a)在有 助于产生所述多肽的条件下培养转基因植物或植物细胞,所述的转基因植 物或植物细胞包括编码本发明具有α-葡糖苷酶活性的多肽的多核苷酸;和 (b)回收所述的多肽。
33.转基因植物、植物部分或植物细胞,已经用编码权利要求1-12中任 一项所述多肽的多核苷酸转化。
34.用于生产发酵麦芽饮料的方法,其中在为生产发酵麦芽饮料而进 行的麦芽汁生产过程中的麦芽汁热处理前加入权利要求1-12中任一项的具 有α-葡糖苷酶活性的多肽。
35.用于生产啤酒的方法,其中向啤酒酿造中的发酵过程中加入权利要 求1-12中任一项的具有α-葡糖苷酶活性的多肽。

说明书全文

发明领域

本发明涉及具有α-葡糖苷酶活性的分离的多肽类和编码这些多肽类的 分离的多核苷酸。本发明还涉及包括所述多核苷酸的核酸构建体、载体和 宿主细胞以及生产和使用所述多肽类的方法。

相关领域的描述

几种酶涉及淀粉的降解。这些酶包括α-淀粉酶、β-淀粉酶、淀粉葡糖苷 酶、支链淀粉酶、异淀粉酶、α-葡糖苷酶和环糊精(cylcodextrin)糖基转移 酶。

α-葡糖苷酶(EC 3.2.1.20)解各种底物中的末端非还原α-1,4-连接的葡 萄糖残基,从而释放葡萄糖。它们快速降解二糖类和寡糖类,而多糖类则 缓慢受到攻击,即使不是全部(if at all)。麦芽糖、麦芽糖衍生物蔗糖、芳 基-α-糖苷类和烷基-α-糖苷类可以作为底物起作用。

据报导其它丝状真菌可产生α-葡糖苷酶,诸如烟曲霉(Aspergillus fumigatus)(Rudick和Elbein,1974,Archives of Biochemistry and Biophysics 1611:281-290)、黄曲霉(Aspergillus fiavus)(Olutiola,1981,Mycologia 73: 1130)、构巢曲霉(Aspergillus nidulans)(Kato等,2002,Appl.Environ. Microbiol.68:1250-1256)、黑曲霉(Aspergillus niger)(Rudick等,1979, Archives of Biochemistry和Biophysics 193:509)、米曲霉(Aspergillus oryzae) (Leibowitz和Mechlinski,1926,Hoppe-Seyler’s Zeitschrift f r Physiologische Chemie 154:64)、葱状被孢霉(Mortierella alliacea)(Tanaka等,2002,Biosci. Biotechnol.Biochem.66:2415-2423)、爪哇毛霉(Mucor javanicus)(Yamasaki 等,l978,Berichte des Ohara Instituts f r Landwirtschaftliche Biologie 17: 123)、鲁克氏毛霉(Mucor rouxii)(Flores-Carreon和Ruiz-Herrera,1972, Biochemica et Biophysica Acta 258:496)、产紫青霉(Penicillium pupurogenum)(Yamasaki等,1976,Agricultural and Biological Chemistry 40: 669)和草酸青霉(Penicillium oxalicum)(Yamasaki等,1977,Agricultural and Biological Chemistry 41:1451)。

α-葡糖苷酶可以与其它淀粉降解酶,例如α-淀粉酶联用以便在需要转化 成可发酵糖类的工业化应用中实现对淀粉的完全水解。因此,在本领域中 对具有改善的特性,诸如最佳pH、最佳温度和热稳定性的可选α-葡糖苷酶 存在需求。

本发明的一个目的在于提供具有α-葡糖苷酶活性的多肽类和编码这些 多肽类的多核苷酸。

发明概述

本发明涉及具有α-葡糖苷酶活性的分离的多肽类,它选自下列多肽组成 的组:

(a)具有与SEQ ID NO:2的21-960位基酸具有至少85%的同一性 的氨基酸序列的多肽;

(b)由核苷酸序列编码的多肽,所述的核苷酸序列在至少高度严格条 件下与如下成分杂交:(i)SEQ ID NO:1的61-2880位核苷酸;(ii)包括SEQ ID NO:1的61-2880位核苷酸的基因组DNA序列;或(iii)(i)或(ii)的互补链; 和

(c)包括SEQ ID NO:2的21-960位氨基酸中的一个或多个氨基酸的 保守取代、缺失和/或插入的变体。

本发明还涉及具有α-葡糖苷酶活性的分离的多核苷酸,它选自下列多核 苷酸组成的组:

(a)编码与SEQ ID NO:2的21-960位氨基酸具有至少85%的同一性 的氨基酸序列的多核苷酸;

(b)与SEQ ID NO:1的61-2880位核苷酸具有至少85%的同一性的多 核苷酸;和

(c)在至少高度严格条件下与如下杂交的多核苷酸:(i)SEQ ID NO:1 的61-2880位核苷酸;(ii)包括SEQ ID NO:1的61-2880位核苷酸的基 因组DNA序列;或(iii)(i)或(ii)的互补链。

本发明还涉及包括所述的多核苷酸的核酸构建体、重组表达载体和 重组宿主细胞。

本发明还涉及用于生产具有α-葡糖苷酶活性的这类多肽类的方法,包 括:(a)在有助于产生所述多肽的条件下培养包括核酸构建体的重组宿主细 胞,所述的核酸构建体包括编码所述多肽的多核苷酸;和(b)回收所述的多 肽。

本发明还涉及使用所述多肽类的方法。

本发明进一步涉及包括编码蛋白质的基因的核酸构建体,其中所述的 基因可操作地与编码由SEQ ID NO:1的1-60位核苷酸组成的信号肽的核 苷酸序列连接,其中该基因对第一和第二核苷酸序列而言是外源性的。

附图简述

附图1A、1B和1C表示Fusarium venenatumα-葡糖苷酶的cDNA序列 和推定的氨基酸序列(分别为SEQ ID NOs:1和2)。

附图2表示pEJG61的限制图。

附图3表示pJLin163的限制图。

附图4表示在37℃下纯化的Fusarium venenatumα-葡糖苷酶对50mM 乙酸钠-50mM磷酸中pH的依赖性。

附图5表示纯化的Fusarium venenatumα-葡糖苷酶在不同温度下在pH 5.0的50mM乙酸钠下温育5分钟后的热稳定性

定义

α-葡糖苷酶活性:本文定义的术语“α-葡糖苷酶活性”为α-D-糖苷葡糖 水解酶活性(E.C.3.2.1.20),它催化末端非还原1,4-连接的α-D-葡萄糖残基的 外切水解(exohydrolysis),从而释放α-D-葡萄糖。该酶活性的天然底物包 括:例如麦芽糖、麦芽三糖、麦芽四糖、麦芽五糖(maltopentaose)、淀粉(可 溶性)、直链淀粉、支链淀粉、异麦芽糖、曲二糖(Kojibiose)、蔗糖、黑曲 霉糖(nigerose)、松二糖(turanose)、松三糖(melizitose)和糖原。就本发明的目 的而言,在25℃下和pH4.3的0.1M乙酸钠缓冲液中使用麦芽糖作为底物 测定α-葡糖苷酶活性。将1个单位的α-葡糖苷酶活性定义为在25℃,pH4.3 下在乙酸钠缓冲液中从作为底物的麦芽糖中每分钟产生的1.0μmole葡萄 糖。

本发明的多肽类具有至少20%,优选至少40%,更优选至少50%,更 优选至少60%,更优选至少70%,更优选至少80%,甚至更优选至少90%, 最优选至少95%且甚至最优选至少100%的多肽的α-葡糖苷酶活性,该多肽 由如SEQ ID NO:2的21-960位氨基酸所示的氨基酸序列组成。

分离的多肽:本文所用的术语“分离的多肽”意旨如通过SDS-PAGE测 定的为至少20%纯,优选至少40%纯,更优选至少60%纯,甚至更优选至 少80%纯,最优选至少90%纯且甚至最优选至少95%纯的多肽。

基本上纯的多肽:术语“基本上纯的多肽”在本文中表示多肽制品,它含 有至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多 4%,更优选至多3%,甚至更优选至多2%,最优选至多1%且甚至最优选 至多0.5%重量的与之天然或重组结合的其它多肽物质。因此,优选基本上 纯的多肽为至少92%纯,优选至少94%纯,更优选至少95%纯,更优选至 少96%纯,更优选至少96%纯,更优选至少97%纯,更优选至少98%纯, 甚至更优选至少99%,最优选至少99.5%纯且甚至最优选100%纯的重量的 存在于所述制品中的总多肽物质。

本发明的多肽类优选为基本上纯的形式。特别地,优选所述的多肽类 为“实质上纯的形式”,即该多肽制品实质上不含与之天然或重组结合的其它 多肽物质。例如,可以通过用众所周知的重组方法或传统的纯化方法制备 多肽来实现这一目的。

本文中的术语“基本上纯的多肽”与术语“分离的多肽”和“分离形式的多 肽”为同义词。

同一性:将两种氨基酸序列之间或两种核苷酸序列之间的相关性描述 为参数“同一性”。

就本发明的目的而言,通过Clustal方法(Higgins,1989,CABIOS 5: 151-153),使用LASERGENETM MEGALIGNTM软件(DNASTAR,Inc.,Madison, WI)与同一性表和如下多重序列对比参数测定两种氨基酸序列之间的同一 性程度:空位罚分为10和空位长度罚分为10。配对序列对比参数为 Ktuple=1,空位罚分=3,窗格=5,和对线=5。

就本发明的目的而言,通过Wilbur-Lipman方法(Wilbur和Lipman,1983, Proceedings of the National Academy of Science USA 80:726-730),使用 LASERGENETM MEGALIGNTM软件(DNASTAR,Inc.,Madison,WI)与同一性 表和如下多重序列对比参数测定两种核苷酸序列之间的同一性程度:空位 罚分(gap penalty)为10和空位长度罚分(gap length penalty)为10。配对 (pairwise)序列对比参数为Ktuple=3,空位罚分=3,和窗格(windows)=20。

多肽片段:本文种将术语“多肽片段”定义为具有从SEQ ID NO:2的氨 基和/或羧基末端缺失的一个或多个氨基酸的多肽或其同源序列,其中该片 段具有α-葡糖苷酶活性。优选片段含有SEQ ID NO:2的至少790个氨基酸 残基,更优选至少其840个氨基酸残基且最优选至少其890个氨基酸残基。

等位基因变体:术语“等位基因变体”在本文中表示占有相同染色体基 因座的基因的两种或多种可变形式中的任意种。等位基因变异通过突变天 然产生,并且可以在群体内产生多态性。基因突变可以为沉默的(编码的多 肽中无改变)或可以编码具有改变的氨基酸序列的多肽类。多肽的等位基因 变体为由基因的等位基因变体编码的多肽。

基本上纯多核苷酸:本文所用的术语“基本上纯的多核苷酸”意旨多核 苷酸制品,它不含其它外来或不想要的核苷酸并且为适用于遗传改造的蛋 白质生产系统的形式。因此,基本上纯的多核苷酸含有至多10%,优选至 多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%, 甚至更优选至多2%,最优选至多1%且甚至最优选至多0.5%重量的与之天 然或重组结合的其它多核苷酸物质。不过,基本上纯的多核苷酸包括天然 存在的5’和3’未翻译区,诸如启动子和终止子。优选基本上纯的多核苷酸 按重量计为至少90%纯,优选至少92%纯,更优选至少94%纯,更优选至 少95%纯,更优选至少96%纯,更优选至少97%纯,甚至更优选至少98% 纯,最优选至少99%且甚至最优选至少99.5%纯。本发明的多核苷酸优选为 基本上纯的形式。特别地,优选本文披露的多核苷酸为“实质上纯的形式”, 即该多核苷酸制品实质上不含与之天然或重组结合的其它多核苷酸物质。 本文的术语“基本上纯的多核苷酸”与术语“分离的多核苷酸”和“分离形式的 多核苷酸”。多核苷酸可以来源于基因组、cDNA、RNA、半合成、合成来 源或其任意组合。

亚序列:将术语“亚序列”在本文中定义为具有从SEQ ID NO:1的5′和/ 或3′端缺失的一个或多个核苷酸的核苷酸序列或其同源序列,其中该亚序列 编码具有α-葡糖苷酶活性的多肽片段。优选亚序列含有至少2370个核苷酸, 更优选至少2520个核苷酸且最优选至少2670个核苷酸。

cDNA:将术语″cDNA″在本文中定义为可以通过从获自真核细胞的成 熟剪接的mRNA分子逆转录制备的DNA分子。cDNA缺乏通常存在于相应 基因组DNA中的内含子序列。最初的初级RNA转录物为在作为成熟剪接 的mRNA出现前通过一系列步骤加工的mRNA的前体。这些步骤包括通过 称作剪接的过程除去内含子序列。来源于mRNA的cDNA由此缺乏任何内 含子序列。

核酸构建体:本文所用的术语″核酸构建体″意旨单链或双链核酸分子, 它分离自天然存在的基因或被修饰以便含有非天然存在形式的核酸片段。 术语核酸构建体在该核酸构建体含有表达本发明编码序列所需的控制序列 时与术语“表达盒”为同义词。

控制序列:将术语“控制序列”在本文中定义为包括为表达编码本发明 多肽的多核苷酸而必需或有利的所有成分。每种控制序列对编码所述多肽 的核苷酸序列而言均可以为天然或外源性的或彼此为天然或外源性的。这 类控制序列包括,但不限于前导区、聚腺苷酸化序列、前肽序列、启动子、 信号肽序列和转录终止子。在最低限度上,控制序列包括启动子以及转录 和翻译终止信号。可以给控制序列装配接头,目的在于将有利于连接该控 制序列的特异性限制位点引入编码多肽的核苷酸序列的编码区。

可操作地连接:术语“可操作地连接”在本文中表示一种构型,其中将控 制序列置于相对于多核苷酸序列的编码序列而言适当的位置上,以便该控 制序列指导多肽编码序列的表达。

编码序列:当本文所用的术语“编码序列”意旨核苷酸序列时,它直接特 别指定了其蛋白质产物的氨基酸序列。编码序列的边界一般由可读框确定, 通常从ATG起始密码子或选择性起始密码子,诸如GTG和TTG开始。编 码序列可以DNA、cDNA或重组核苷酸序列。

表达:术语“表达”包括生产多肽中涉及的任意步骤,包括,但不限于转 录、转录后修饰、翻译、翻译后修饰和分泌。

表达载体:将术语“表达载体”在本文中定义为线性或环状DNA分子, 它包括编码本发明多肽的多核苷酸,并且可操作地与提供其表达的额外核 苷酸连接。

宿主细胞:本文所用的术语″宿主细胞″包括对使用包括本发明多核苷 酸的核酸构建体转化、转染、转导等敏感的任意细胞类型。

修饰:术语“修饰”意旨由SEQ ID NO:2的21-960位氨基酸组成的多 肽或其同源序列的任意化学修饰以及编码该多肽的DNA的遗传操作。修饰 可以为一种或多种氨基酸的取代、缺失和/或插入以及一种或多种氨基酸侧 链的取代。

人工变体:术语“人工变体”在本文中使用时意旨具有由表达SEQ ID NO:1的修饰的核苷酸序列的生物体产生的α-葡糖苷酶活性的多肽。通过经 修饰SEQ ID NO:1中披露的核苷酸序列进行人工介入获得修饰的核苷酸序 列。

发明详述

具有α-葡糖苷酶活性的多肽类

在第一个方面中,本发明涉及分离的多肽类,它们具有与SEQ ID NO: 2(即成熟多肽)的21-960位氨基酸具有至少85%,优选至少90%,更优选 至少95%且最优选至少97%同一性程度的氨基酸序列,这些多肽类具有α- 葡糖苷酶活性(下文的″同源多肽类″)。在一个优选的方面中,所述的同源多 肽类具有氨基酸序列,它与SEQ ID NO:2的21-960位氨基酸相差10个氨 基酸,优选相差5个氨基酸,更优选相差4个氨基酸,甚至更优选相差3 个氨基酸,最优选相差2个氨基酸且甚至最优选相差1个氨基酸。

本发明的多肽优选包括SEQ ID NO:2的氨基酸序列或其等位变体;或 其具有α-葡糖苷酶活性的片段。在一个优选的方面中,多肽包括SEQ ID NO: 2的氨基酸序列。在另一个优选的方面中,多肽包括SEQ ID NO:2的21- 960位氨基酸或其等位变体;或其具有α-葡糖苷酶活性的片段。在另一个优 选的方面中,多肽包括SEQ ID NO:2的21-960位氨基酸序列。在另一个 优选的方面中,多肽由SEQ ID NO:2的氨基酸序列或其等位变体;或其具 有α-葡糖苷酶活性的片段组成。在另一个优选的方面中,多肽由SEQ ID NO: 2的氨基酸序列组成。在另一个优选的方面中,多肽由SEQ ID NO:2的21 -960位氨基酸或其等位变体;或其具有α-葡糖苷酶活性的片段组成。在另 一个优选的方面中,多肽由SEQ ID NO:2的21-960位氨基酸组成。

在第二个方面中,本发明涉及具有α-葡糖苷酶活性的分离的多肽类,它 们由多核苷酸编码,所述的多核苷酸在极低严格条件,优选低严格条件, 更优选中等严格条件,更优选中-高严格条件,甚至更优选高度严格条件且 最优选极高严格条件下与如下成分杂交:(i)SEQ ID NO:1的61-2880位核 苷酸;(ii)包括SEQ ID NO:1的61-2880位核苷酸的基因组DNA序列; (iii)(i)或(ii)的亚序列;或(iv)(i)、(ii)或(iii)的互补链(J.Sambrook,E.F.Fritsch, 和T.Maniatus,1989,Molecular Cloning,A Laboratory Manual,2d edition,Cold Spring Harbor,New York)。SEQ ID NO:1的亚序列含有至少100个连续的核 苷酸或优选至少200个连续的核苷酸。此外,该亚序列可以编码具有α-葡 糖苷酶活性的多肽片段。

SEQ ID NO:1的核苷酸序列或其亚序列以及SEQ ID NO:2的氨基酸序 列或其片段可以用于按照本领域众所周知的方法设计鉴定和克隆编码多肽 类的DNA的核酸探针,所述的多肽类具有来自不同属或种的菌株的α-葡糖 苷酶活性。特别地,这类探针可以用于按照标准DNA印迹操作步骤与有兴 趣的属或种的基因组DNA或cDNA杂交,以便鉴定和分离其中相应的基因。 这类探针可以明显比完整序列短,但应为至少14,优选至少25,更优选至 少35且最优选至少70个核苷酸长度。然而,优选该核酸探针为至少100 个核苷酸长度。例如,该核酸探针可以为至少200个核苷酸,优选至少300 个核苷酸,更优选至少400个核苷酸或最优选至少500个核苷酸长度。可 以使用甚至更长的探针,例如,为至少600个核苷酸,至少优选至少700 个核苷酸,更优选至少800个核苷酸或最优选至少900个核苷酸长度的核 酸探针。可以使用DNA和RNA探针。一般标记探针以便检测相应的基因 (例如,使用32P、3H、35S、生物素或抗生物素蛋白)。这类探针包括在本发 明中。

因此,可以对由这类其它生物体制备的基因组DNA或cDNA文库筛选 与上述探针杂交并且编码具有α-葡糖苷酶活性的多肽的DNA。可以通过琼 脂糖或聚丙烯酰胺凝胶电泳或其它分离技术从这类其它生物体中分离基因 组或其它DNA。可以将来自所述文库的DNA或分离的DNA转移至或固定 在硝化纤维或其它合适的载体物质上。为了鉴定SEQ ID NO:1或其亚序列 同源的克隆或DNA,将载体物质用于Southern印迹。

就本发明的目的而言,杂交表示核苷酸序列与相当于SEQ ID NO:1中 所示核苷酸序列、其互补链或其亚序列的标记的核酸探针在极低到极高严 格条件下杂交。例如,可以使用X光片检测核酸探针在这些条件下杂交的 分子。

在一个优选的方面中,核酸探针为编码SEQ ID NO:2的多肽的多核苷 酸序列或其亚序列。在另一个优选的方面中,核酸探针为SEQ ID NO:1。 在另一个优选的方面中,核酸探针为SEQ ID NO:1的成熟多肽编码区。在 另一个优选的方面中,核酸探针为包含在质粒pFD11F2中的多核苷酸序列, 所述的质粒pFD11F2包含在大肠杆菌(E.coli)NRRL B-30753中,其中其 多核苷酸序列编码具有α-葡糖苷酶活性的多肽。在另一个优选的方面中, 核酸探针为包含在质粒pFD11F2中的成熟多肽编码区,所述的质粒 pFD11F2包含在大肠杆菌NRRL B-30753中。

就至少100个核苷酸长度的长探针而言,将极低到极高严格条件定义 为在42℃下和5X SSPE、0.3%SDS、200μg/ml剪切和变性的鲑精DNA中 预杂交和杂交,并且对极低和低严格性而言预杂交和杂交中还有25%甲酰 胺,对中等和中-高严格性而言预为35%甲酰胺中,或就高度和极高严格性 而言为50%甲酰胺,最佳的情况是按照标准DNA印迹操作步骤进行12- 24小时。

就至少100个核苷酸长度的长探针而言,最终使用2X SSC,0.2%SDS, 优选至少在45℃(极低严格性),更优选至少在50℃(低严格性),更优选至少 在55℃(中等严格性),更优选至少在60℃(中-高严格性),甚至更优选至少 在65℃(高度严格性)且最优选至少在70℃(极高严格性)将载体物质洗涤3 次,每次15分钟。

就约15个核苷酸-约70个核苷酸长度的短探针而言,将严格条件定 义为在约5℃-约10℃条件下预杂交、杂交和杂交后洗涤,所述的温度低 于使用按照Bolton和McCarthy的计算法(1962,Proceedings of the National Academy of Sciences USA 48:1390)计算的Tm,上述步骤在0.9M NaCl、0.09 M Tris-HCl pH7.6、6mM EDTA、0.5%NP-40、1X Denhardt′s溶液、1mM 焦磷酸钠、1mM磷酸一氢钠(sodium monobasic phosphate)、0.1mM ATP 和0.2mg酵母RNA/ml中进行,最佳的情况是按照标准DNA印迹操作步骤 进行12-24小时。

就约15个核苷酸-约70个核苷酸长度的短探针而言,在低于计算的 Tm的5℃-10℃条件下,将载体物质在6X SCC+0.1%SDS中洗涤一次, 15分钟,并且使用6X SSC洗涤两次,每次15分钟。

在第三个方面中,本发明涉及具有α-葡糖苷酶活性的具有如下物化特性 的分离的多肽类:在37℃和在50mM乙酸钠缓冲液/50mM磷酸钾缓冲液 中,约4.5-约6.0,优选约4.7-约5.7,更优选约4.8-约5.5,最优选约 5.0-约5.3的最佳pH范围且甚至最优选在pH5.0;和在50mM pH5.0乙 酸钠中约达65℃的热稳定性(约77%残余活性),持续5分钟。

在第四个方面中,本发明涉及包括SEQ ID NO:2的一个或多个氨基酸 的保守取代、缺失和/或插入的人工变体或其成熟多肽。优选氨基酸改变自 身为最小程度的,即不会显著影响蛋白质折叠和/或活性的保守氨基酸取代 或插入;小的缺失,一般为1-约30个氨基酸;小的氨基-或羧基-末端延伸, 诸如氨基-末端甲硫氨酸残基;约达20-25个残基的小接头肽;或通过改变 净电荷或另一种功能有利于纯化的小的延伸,诸如聚-组氨酸束、抗原表位 或结合结构域。

保守取代的实例为性氨基酸(精氨酸、赖氨酸和组氨酸)、酸性氨基酸 (谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮 氨酸、异亮氨酸和缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸和酪氨酸)和 小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)的组中。本领域中 已知一般不会改变特异性活性的氨基酸取代并且例如由H.Neurath和R.L. Hill在1979The Proteins,Academic Press,New York中描述。最常发生的交换 为Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、 Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu 和Asp/Gly。

除20种标准氨基酸外,非标准氨基酸(诸如4-羟基脯氨酸、6-N-甲基赖 氨酸、2-氨基异丁酸、异缬氨酸和α-甲基丝氨酸)可以取代野生型多肽的氨 基酸残基。有限数量的非保守氨基酸、由并非由遗传密码编码的氨基酸和 非天然氨基酸可以取代氨基酸残基。“非天然氨基酸”在蛋白质合成后被修饰 和/或在其侧链上具有不同于标准氨基酸的化学结构。非天然氨基酸可以通 过化学方式合成,并且优选为商购的,并且包括哌可酸、噻唑烷甲酸、去 氢脯氨酸、3-和4-甲基脯氨酸和3,3-二甲基脯氨酸。

或者,所述的氨基酸改变具有这类性质,即多肽类的物化特性得到改 变。例如,氨基酸改变可以改善多肽的热稳定性,改变底物特异性,改变 最佳pH等。

可以按照本领域公知的操作步骤,诸如定点诱变或丙氨酸-扫描诱变鉴 定亲代多肽中的必需氨基酸(Cunningham和Wells,1989,Science244: 1081-1085)。在后一种技术中,在分子的每个残基上引入单一丙氨酸突变, 并且测试所得突变分子的生物活性(即α-葡糖苷酶活性)以便鉴定对分子活 性而言关键的氨基酸残基。另外,参见Hilton等,1996,J.Biol.Chem.271: 4699-4708。还可以通过对如用诸如核磁共振、晶体学、电子衍射或光亲和 标记这类技术测定的结构进行物理分析并且结合推定接触位点氨基酸的突 变来测定酶的活性位点或其它生物相互作用。例如,参见de Vos等,1992, Science 255:306-312:Smith等,1992,J.Mol.Biol.224:899-904:Wlodaver 等,1992,FEBS Lett.309:59-64。还可以从使用与本发明多肽相关的多肽类 的同一性的分析推断必需氨基酸的同一性。

可以使用已知的一般、重组和/或改组方法,随后使用相关的筛选操作 步骤进行和测试单或多氨基酸取代,诸如披露在下列文献中的那些方法: Reidhaar-Olson和Sauer,1988,Science 241:53-57:Bowie和Sauer, 1989,Proc. Natl.Acad.Sci.USA 86:2152-2156:WO95/17413;或WO95/22625。可以 使用的其它方法包括易错PCR、噬菌体展示(例如Lowman等,1991,Biochem. 30:10832-10837:美国专利US 5,223,409:WO 92/06204)和区域定向诱变 (Derbyshire等,1986,基因46:145:Ner等,1988,DNA7:127)。

可以将诱变/该组方法与高流通量自动化筛选方法合并以便检测由宿主 细胞表达的克隆的诱变的多肽类的活性。可以从宿主细胞中回收编码活性 多肽类的诱变的DNA分子并且使用本领域中的标准方法快速测序。这些方 法允许快速确定所关注多肽中各氨基酸残基的重要性并且可以应用于未知 结构的多肽类。

SEQ ID NO:2的21-960位氨基酸的氨基酸取代、缺失和/或缺失总数 为10,优选9,更优选8,更优选7,更优选至多6,更优选至多5,更优 选4,甚至更优选3,最优选2且甚至最优选1。

具有α-葡糖苷酶活性的多肽类的来源

本发明的多肽可以获自任意属的微生物。就本发明的目的而言,本文 所用的术语“获自”与指定来源联用时应指由核苷酸序列编码的多肽由该来 源或由该来源中已经插入了所述核苷酸序列的细胞产生。在一个优选的方 面中,获自指定来源的多肽在胞外分泌。

本发明的多肽可以为细菌多肽。例如,该多肽可以为革兰氏阳性菌多 肽,诸如芽胞杆菌属(Bacillus)多肽,例如嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌 (Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、凝结芽孢杆菌(Bacillus coagulans)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、 地衣芽孢杆菌(Bacillus licheniformis)、巨大芽孢杆菌(Bacillus megaterium)、 嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)或苏芸金芽孢杆菌(Bacillus thuringiensis)多肽类;或链霉菌属 (Streptomyces)多肽类,例如浅青紫链霉菌(Streptomyces lividans)或鼠 灰链霉菌(Streptomyces murinus)多肽类;或革兰氏阴性菌多肽类,例如大 肠杆菌或假单胞菌属(Pseudomonas)多肽类。

本发明的多肽类还可以为真菌多肽类,并且更优选酵母多肽类,诸如 假丝酵母属(Candida)、克鲁维氏酵母属(Kluyveromyces)、毕赤氏酵母属 (Pichia)、糖酵母属(Saccharomyces)、裂殖糖酵母属(Schizosaccharomyces) 或Yarrowia多肽类;或更优选丝状真菌多肽类,诸如支顶孢属 (Acremonium)、曲霉属(Aspergillus)、短柄霉属(Aureobasidium)、隐球 菌属(Cryptococcus)、Filibasidium、镰孢属(Fusarium)、腐质霉属(Humicola)、 Magnaporthe、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、Neocallimastix、 链孢霉属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、 Piromyces、裂褶菌属(Schizophyllum)、踝节菌属(Talaromyces)、热子囊 菌属(Thermoascus)、草根霉属(Thielavia)、Tolypocladium或木霉属 (Trichoderma)多肽类。

在一个优选的方面中,所述的多肽类为具有α-葡糖苷酶活性的卡尔斯伯 糖酵母(Saccharomyces carlsbergensis)、啤酒糖酵母(Saccharomyces cerevisiae)、糖化糖酵母(Saccharomyces diastaticus)、Saccharomyces douglasii、Saccharomyces kluyveri、Saccharomyces norbensis或卵形糖酵母 (Saccharomyces oviformis)多肽类。

在另一个优选的方面中,所述的多肽类为具有α-葡糖苷酶活性的棘孢曲 霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、烟曲霉 (Aspergillus fumigatus),臭曲霉(Aspergillus foetidus)、日本曲霉 (Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans),黑曲霉 (Aspergillus niger)、米曲霉(Aspergillus oryzae)、Humicola insolens、 Humicola lanuginosa、米赫毛霉(Mucor miehei)、Myceliophthora thermophila、 粗糙链孢霉(Neurospora crassa)、产紫青霉(Penicillium pupurogenum)、 Trichoderma harzianum、康宁氏木霉(Trichoderma koningii)、Trichoderma longibrachiatum、Trichoderma reesei或绿色木霉(Trichoderma viride)多肽 类。

在另一个优选的方面中,所述的多肽类为具有α-葡糖苷酶活性的杆孢状 镰孢(Fusarium bactridioides)、Fusarium cerealis、Fusarium crookwellense、 大刀镰孢(Fusarium culmorum)、禾谷镰孢(Fusarium graminearum)、禾赤 镰孢(Fusarium graminum)、异孢镰孢(Fusarium graminum)、合欢木镰孢 (Fusarium negundi)、尖孢镰孢(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、玫瑰色镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、Fusarium torulosum、 Fusarium trichothecioides、Fusarium venenatum多肽类。

在一个更优选的方面中,所述的多肽类为Fusarium venenatum多肽类且 最优选Fusarium venenatum NRRL30747多肽类,例如SEQ ID NO:2的多肽 类或SEQ ID NO:2的21-960位氨基酸。

应理解就上述种类而言,本发明包括完全阶段和不完全阶段(perfect and imperfect states)和其它分类等同阶段,例如无性型,与它们所称作的种类 名称无关。本领域技术人员用于识别适当等同阶段的特性。

这些种类的菌株对公众而言易于在许多培养物保藏所获得,诸如美国 典型培养物保藏中心(American Type Culture Collection(ATCC));德意志微生 物保藏中心(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH(DSM));Centraalbureau Voor Schimmelcultures(CBS);和农业研究机 构保藏中心(Agricultural Research Service Patent Culture Collection,Northern Regional Research Center(NRRL))。

此外,可以使用上述探针鉴定并且从其它来源,包括分离自天然(例如 土壤、堆肥、水等)的微生物获得这类多肽类。用于从天然栖息地分离微生 物的技术为本领域众所周知的。然后可以通过类似地筛选另一种微生物的 基因组DNA或cDNA文库获得多核苷酸。一旦使用探针检测了编码多肽类 的多核苷酸序列,就可以通过本领域技术人员众所周知的技术分离或克隆 所述的多核苷酸(例如,参见Sambrook等,1989,文献同上)。

本发明的多肽类还包括融合的多肽类或可裂解的融合多肽类,其中另 一种多肽融合在所述多肽或其片段的N-末端或C-末端。通过将编码另一种 多肽的核苷酸序列(或其部分)与本发明的核苷酸序列(或其部分)融合而产生 融合多肽。用于生产融合多肽类的技术为本领域中公知的并且包括连接编 码所述多肽类的编码序列,使得它们符合读框并且融合多肽的表达处于相 同启动子和终止子的控制下。

多核苷酸

本发明还涉及具有编码本发明多肽的核苷酸序列的分离的多核苷酸。 在一个优选的方面中,所述的核苷酸序列如SEQ ID NO:1中所示。在另一 个更优选的方面中,所述的核苷酸序列为包含在质粒pFD11F2中的序列, 所述的质粒pFD11F2包含在大肠杆菌NRRL B-30753中。在另一个优选的 方面中,所述的核苷酸序列为SEQ ID NO:1的成熟多肽的编码区。在另一 个更优选的方面中,所述的核苷酸序列为包含在质粒pFD11F2中的成熟多 肽编码区,所述的质粒pFD11F2包含在大肠杆菌NRRL B-30753中。本发 明还包括编码具有SEQ ID NO:2的氨基酸序列的多肽的核苷酸序列或其成 熟多肽,它们与SEQ ID NO:1的差别在于遗传密码简并。本发明还涉及SEQ ID NO:1的亚序列,它们编码具有α-葡糖苷酶活性的SEQ ID NO:2的片段。

本发明还涉及突变多核苷酸,它们包括在SEQ ID NO:1的成熟多肽编 码序列中的至少一种突变,其中突变核苷酸序列编码由SEQ ID NO:2的21 -960位氨基酸组成的多肽。

用于分离或克隆编码多肽的多核苷酸的技术为本领域中公知的并且包 括从基因组DNA中分离,由cDNA制备或其组合。例如,可以通过使用众 所周知的聚合酶链反应(PCR)或表达文库的抗体筛选从这类基因组DNA中 克隆本发明的多核苷酸,以便检测克隆的具有共有结构特征的DNA片段。 例如,参见Innis等,1990,PCR:A Guide to Methods和Application,Academic Press,New York。可以使用其它核酸扩增操作步骤,诸如连接酶链反应 (LCR)、连接的活化转录(LAT)和基于核苷酸序列的扩增(NASBA)。可以从 曲霉属细胞或另一种或相关微生物中克隆多核苷酸且由此,例如它们可以 为所述核苷酸序列的多肽编码区的等位或种类变体。

本发明还涉及具有核苷酸序列的多核苷酸,所述的核苷酸序列与SEQ ID NO:1的成熟多肽编码序列(即142-2943位核苷酸)具有至少85%,优选 至少90%,更优选至少95%且最优选至少97%同一性的同一性程度,这些 核苷酸序列编码活性多肽。

编码本发明多肽的核苷酸序列的修饰对合成基本上与所述多肽类似的 多肽类而言可能是必不可少的。术语与所述多肽“基本上类似”意旨多肽的非 天然存在形式。这些多肽类在一定改造形式中可以不同于分离自其天然来 源的多肽,例如在特异性活性(比活性)、热稳定性、最佳pH等方面不同。 可以基于作为SEQ ID NO:1的多肽编码区存在的核苷酸序列构建变体序 列,例如其亚序列,和/或通过下列步骤实现构建:引入核苷酸取代,这些 取代不会产生由核苷酸序列编码的多肽的另一种氨基酸序列,但相当于用 于生产酶的宿主生物体的密码子选择,或通过引入可以产生不同氨基酸序 列的核苷酸取代。就核苷酸取代的一般性描述而言,例如,参见Ford等,1991, Protein Expression and Purification 2:95-107。

可以在对分子功能而言为关键的区外进行这类取代并且仍然可以产生 活性多肽,这对本领域技术人员显而易见。可以按照本领域公知的操作步 骤,诸如定点诱变或丙氨酸-扫描诱变鉴定对由本发明分离的多核苷酸编码 的多肽的活性而言必不可少的氨基酸残基,并且由此优选不进行取代(例如, 参见Cunningham和Wells,1989,Science244:1081-1085)。在后一种技术中, 可以在分子中每个带正电荷的残基上引入突变并且测试所得突变分子的α- 葡糖苷酶活性,以便鉴定对分子活性而言关键的氨基酸残基。还可以通过 分析用诸如核磁共振分析、晶体学或光亲和标记法这类技术测定的三维结 构来确定底物-酶相互作用位点例如,参见de Vos等,1992,Science 255: 306-312:Smith等,1992,Journal of Molecular Biology224:899-904:Wlodaver 等,1992,FEBS Letters309:59-64)。

本发明还涉及编码本发明多肽的分离的多核苷酸,所述的多核苷酸在 极低严格条件,优选低严格条件,更优选中等严格条件,更优选中-高严格 条件,甚至更优选高度严格条件且最优选极高严格条件下与如下成分杂交: (i)SEQ ID NO:1的61-2880位核苷酸;(ii)包括SEQ ID NO:1的61-2880 位核苷酸的基因组DNA序列;(iii)(i)或(ii)的互补链;或如本文等位变体及 其亚序列(J.Sambrook,E.F.Fritsch,和T.Maniatus,1989,Molecular Cloning,A Laboratory Manual,2d edition,Cold Spring Harbor,New York)。SEQ ID NO:1 的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。 此外,该亚序列可以编码具有α-葡糖苷酶活性的多肽片段。

本发明还涉及通过下列步骤获得的分离的多核苷酸:(a)使DNA群体 在极低、低、中等、中-高或极高严格条件下与如下成分杂交:(i)SEQ ID NO: 1的61-2880位核苷酸;(ii)包括SEQ ID NO:1的61-2880位核苷酸的基 因组DNA序列;或(iii)(i)或(ii)的互补链;和(b)分离杂交的多核苷酸,它 编码具有α-葡糖苷酶活性的多肽。

核酸构建体

本发明还涉及包括本发明分离的多核苷酸的核苷酸构建体,所述的多 核苷酸可操作地与一种或多种控制序列连接,这些控制序列在与该控制序 列相容的条件下指导合适的宿主细胞中编码序列的表达。

可以按照各种方式操作编码本发明多肽的分离的多核苷酸以便提供多 肽的表达。将多核苷酸序列在其插入载体前操作可能是理想或必需的,这 取决于表达载体。使用重组DNA方法修饰多核苷酸序列的技术为本领域众 所周知的。

控制序列可以为适当的启动子序列,即由表达编码部分多肽的多核苷 酸的宿主细胞识别的核苷酸序列。启动子序列含有介导多肽表达的转录控 制序列。启动子可以为在选择的宿主细胞中表现出转录活性的任意核苷酸 序列,包括突变、截短和杂合启动子,并且可以获自编码对宿主细胞而言 为同源或异源的胞外或胞内多肽类的基因。

尤其是在细菌宿主细胞中用于指导本发明核苷酸构建体转录的合适的 启动子的实例为获自如下的启动子:大肠杆菌lac操纵子、天蓝色链霉菌 (Streptomyces coelicolor)琼脂糖酶基因(dagA)、枯草芽孢杆菌果聚糖蔗糖 酶基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyL),嗜热脂肪芽孢杆菌产麦 芽糖(maltogenic)淀粉酶基因(amyM)、解淀粉芽孢杆菌α-淀粉酶基因 (amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基 因和原核β-内酰胺酶基因(Villa-Kamaroff等,1978,Proceedings of the National Academy of Sciences USA 75:3727-3731)以及tac启动子(DeBoer等, 1983,Proceedings of the National Academy of Sciences USA 80:21-25)。其它 启动子描述在下列文献中:″来自重组细菌的有用蛋白质″(useful proteins from recombinant bacteria)-Scientific American,1980,242:74-94;和 Sambrook等,1989,文献同上。

用于在丝状真菌宿主细胞中指导本发明核苷酸构建体转录的合适的启 动子的实例为获自米曲霉TAKA淀粉酶、米赫根毛霉(Rhizomucor miehei) 天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉 或泡盛曲霉葡糖淀粉酶(glaA)、米赫根毛霉脂酶、米曲霉碱性蛋白酶、米曲 霉丙糖磷酸异构酶、构巢曲霉乙酰胺酶、Fusarium venenatum淀粉葡糖苷酶 (WO 00/56900)、Fusarium venenatum Daria(WO 00/56900)、Fusarium venenatum Quinn(WO 00/56900)、尖孢镰孢胰蛋白酶样蛋白酶(WO 96/00787)、Trichoderma reeseiβ-葡糖苷酶、Trichoderma reesei纤维二糖水解 酶I、Trichoderma reesei内切葡聚糖酶I、Trichoderma reesei内切葡聚糖酶 II、Trichoderma reesei内切葡聚糖酶III、Trichoderma reesei内切葡聚糖酶IV、 Trichoderma reesei内切葡聚糖酶V、Trichoderma reesei木聚糖酶I、 Trichoderma reesei木聚糖酶II、Trichoderma reeseiβ-木糖苷酶的基因的启 动子以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶和米曲霉丙糖磷酸异构 酶的基因的启动子杂种);及其突变、截短和杂合启动子。

在酵母宿主中,有用的启动子获自啤酒糖酵母烯醇化酶(ENO-1)、啤酒 糖酵母半乳糖激酶(GAL1)、啤酒糖酵母乙醇脱氢酶/甘油-3-磷酸脱氢酶 (ADH1,ADH2/GAP)、啤酒糖酵母丙糖磷酸异构酶(TPI)、啤酒糖酵母金属硫 蛋白(metallothionine)(CUP1)和啤酒糖酵母3-磷酸甘油酸激酶的基因。用 于酵母宿主的其它有用的启动子描述在Romanos等,1992,Yeast 8:423-488 中。

控制序列还可以为合适的转录终止子序列,即由宿主细胞识别的终止 转录的序列。该终止子序列可操作地与编码多肽的核苷酸序列的3’末端连 接。在所选择的宿主细胞中具有功能性的任意终止子可以用于本发明。

用于丝状真菌宿主细胞的优选终止子获自米曲霉TAKA淀粉酶、黑曲 霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑色曲霉α-葡糖苷酶和尖孢 镰孢胰蛋白酶样蛋白酶的基因。

用于酵母宿主细胞的优选终止子获自啤酒糖酵母烯醇化酶、啤酒糖酵 母细胞色素C(CYC1)和啤酒糖酵母甘油醛-3-磷酸脱氢酶的基因。用于酵母 宿主细胞的其它有用的终止子描述在Romanos等,1992,文献同上中。

控制序列还可以为合适的转录前导序列,即对宿主细胞翻译而言重要 的mRNA的未翻译区。该前导序列可操作地与编码多肽的核苷酸序列的5’ 末端连接。在所选择的宿主细胞中具有功能性的任意前导序列可以用于本 发明。

用于丝状真菌宿主细胞的优选前导区获自米曲霉TAKA淀粉酶和构巢 曲霉丙糖磷酸异构酶的基因。

用于酵母宿主细胞的合适的前导区获自啤酒糖酵母烯醇化酶(ENO-1)、 啤酒糖酵母3-磷酸甘油酸激酶、啤酒糖酵母α-因子和啤酒糖酵母乙醇脱氢 酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)的基因。

控制序列还可以为合适的聚腺苷酸化序列,即可操作地与核苷酸序列 的3’末端连接并且在转录时由宿主细胞识别为添加聚腺苷残基以便转录 mRNA的序列。在所选择的宿主细胞中具有功能性的任意聚腺苷酸化序列 可以用于本发明。

用于丝状真菌宿主细胞的优选聚腺苷酸化序列获自米曲霉TAKA淀粉 酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖孢镰孢胰蛋白酶 样蛋白酶和黑曲霉α-葡糖苷酶的基因。

用于酵母宿主细胞的有用的聚腺苷酸化序列描述在Guo和Sherman, 1995,Molecular Cellular Biology15:5983-5990中。

控制序列还可以为信号肽编码区,该编码区编码与多肽的氨基末端连 接的氨基酸序列并且使编码的多肽定向于细胞分泌途径。核苷酸序列的编 码序列的5’端本身可以含有天然连接在翻译读框中的信号肽编码区,所述 的读框带有编码分泌的多肽的编码区的片段。或者,编码序列的5’端对该 编码序列而言为外源性的信号肽编码区。如果编码序列天然不含信号肽编 码区,那么外源信号肽编码区域可能是需要的。或者,外源信号肽编码区 可以简单地取代天然信号肽编码区以便增强多肽的分泌。不过,将表达的 多肽定向于宿主细胞分泌途径的任意信号肽编码区可以用于本发明。

用于细菌宿主细胞的有效信号肽编码区为获自芽胞杆菌属NCIB11837 产麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草蛋白酶、 地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM) 和枯草芽孢杆菌prsA的基因。其它的信号肽类描述在Simonen和Palva,1993, Microbiological Reviews 57:109-137中。

用于丝状真菌宿主细胞的有效信号肽编码区为获自米曲霉TAKA淀粉 酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米赫根毛霉天冬氨酸蛋白酶、 Humicola insolens纤维素酶和Humicola lanuginosa脂酶的基因

在一个优选的方面中,所述的信号肽编码区为SEQ ID NO:1的1-141 位核苷酸,它们编码SEQ ID NO:2的1-20位氨基酸。

用于酵母宿主细胞的有用的信号肽类获自啤酒糖酵母α-因子和啤酒糖 酵母转化酶的基因。其它有用的信号肽编码区描述在Romanos等,1992,文 献同上中。

控制序列还可以为编码位于多肽的氨基末端上的氨基酸序列的前肽编 码区。所得多肽称作酶原(proenzyme)或前多肽(或在某些情况中的酶原 (zymogen))。前多肽一般无活性并且可以通过催化或自动催化前肽从前 多肽裂解被转化成成熟的活性多肽。前肽编码区可以获自枯草芽孢杆菌碱 性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、啤酒糖酵母α-因子、米 赫根毛霉天冬氨酸蛋白酶和Myceliophthora thermophila漆酶的基因(WO 95/33836)。

如果信号肽和前肽区存在于多肽的氨基末端上,那么前多肽区紧邻多 肽的氨基末端定位并且信号肽区紧邻前肽区的氨基末端定位。

还需要添加允许调节与宿主细胞生长相对应的多肽表达的调节序列。 调节序列的实例为那些导致基因表达启动或终止作为对化学或物理刺激物 起反应的调节序列,包括存在的调节化合物。原核系统中的调节系统包括 lac、tac和trp操纵子系统。在酵母中,可以使用ADH2系统或GAL1系统。 在丝状真菌中,TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉 葡糖淀粉酶启动子可以用作调节序列。调节序列的其它实例为那些允许基 因扩增的调节序列。在真核系统中,它们包括在有氨甲蝶呤存在下扩增的 二氢叶酸还原酶基因和使用重金属扩增的金属硫蛋白基因。在这些情况中, 编码多肽的核苷酸序列可操作地与调节序列连接。

表达载体

本发明还涉及包括本发明多核苷酸序列、启动子和转录和翻译终止信 号的重组表达载体。上述各种核酸和控制序列可以彼此连接而产生重组表 达载体,它可以包括一种或多种便利的限制位点以便允许在这类位点上插 入或取代编码多肽的核苷酸序列。或者,可以通过将核苷酸序列或包括该 序列的核酸构建体插入用于表达的合适的载体来表达本发明的核苷酸序 列。在生成表达载体的过程中,编码序列位于载体中,使得该编码序列可 操作地与用于表达的合适的控制序列连接。

重组表达载体可以为任意的载体(例如质粒或病毒),它可以便利地进行 重组DNA操作步骤并且可以进行核苷酸序列的表达。载体的选择一般取决 于载体与导入该载体的宿主细胞的相容性。载体可以为线性或闭合环状的 质粒。

载体可以为自主复制载体,即作为染色体外实体存在的载体,其复制 不依赖于染色体复制,例如质粒、染色体外元件、微型染色体或人工染色 体。载体可以含有确保自我复制的任意方式。或者,载体可以为在导入宿 主细胞时被整合入基因组并且与它被整合入的染色体一起复制的载体。此 外,可以使用单一载体或质粒或共同含有导入宿主细胞基因组的总DNA或 转座子的两种或多种载体或质粒。

本发明的载体优选含有一种或多种允许便利选择转化细胞的选择标 记。选择标记为基因,其产物可提供杀生物剂或病毒抗性、重金属耐受性、 营养缺陷型的原养型(prototrophy to auxotrophs)等。

细菌选择标记的实例为来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因 或提供抗生素抗性,诸如氨苄西林、卡那霉素、氯霉素或四环素抗性的标 记。用于酵母宿主细胞的合适的标记为ADE2、HIS3、LEU2、LYS2、MET3、 TRP1和URA3。用于丝状真菌宿主细胞的选择标记包括,但不限于amdS(乙 酰胺酶)、argB(氨酸氨甲酰转移酶)、bar(膦丝菌素乙酰转移酶)、hph(潮霉 磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)、sC(硫 酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合酶)及其等效物。优选用于曲霉属 细胞的为构巢曲霉或米曲霉的amdS和pyrG基因和吸水链霉菌 (Streptomyces hygroscopicus)的基因。

本发明的载体优选含有允许将该载体整合入宿主细胞基因组或使该载 体在的细胞中不依赖于基因组自主复制的元件。

为了整合入宿主细胞基因组,载体可以依赖于编码多肽的多核苷酸序 列或通过同源或非同源重组整合入基因组的载体的任意其它元件。或者, 载体可以含有额外的核苷酸序列,它们通过同源重组使得整合定向于宿主 细胞基因组的染色体中的确切位置。为了增加在确切位置上整合的可能性, 整合元件应优选含有足量的核酸,诸如100-10,000个碱基对,优选400- 10,000个碱基对,且最优选800-10,000个碱基对,它们与相应的靶序列具 有高度的同一性,以便强化同源重组的可能性。整合元件可以为与宿主细 胞基因组中的靶序列同源的任意序列。此外,整合元件可以为非编码或编 码的核苷酸序列。另一方面,可以通过非同源重组将载体整合入宿主细胞 基因组。

为了进行自主复制,载体可以进一步包括能够使该载体在所述宿主细 胞中自主复制的复制起点。该复制起点可以为介导在细胞中起作用的自主 复制的任意质粒复制区。将术语“复制起点”或“质粒复制区”(plasmid replicator)在本文中定义为能够使质粒或载体在体内复制的核苷酸序列。

细菌复制起点的实例为允许在大肠杆菌中复制的质粒pBR322、pUC19、 pACYC177和pACYC184的复制起点和允许在芽胞杆菌属中复制的 pUB110、pE194、pTA1060和pAMβ1。

用于酵母宿主细胞的复制起点的实例为2微米复制起点、ARS1、ARS4、 ARS1和CEN3的组合和ARS4和CEN6的组合。

用于丝状真菌细胞的复制起点的实例为AMA1和ANS1(Gems等,1991, 基因98:61-67:Cullen等,1987,Nucleic Acids Research15:9163-9175:WO 00/24883)。可以按照WO 00/24883中披露的方法进行AMA1基因的分离和 包括该基因的质粒或载体的构建。

可以将本发明多核苷酸的一种以上拷贝插入宿主细胞以便增加基因产 物的产量。可以通过将至少一种额外的序列拷贝整合入宿主细胞基因组或 通过包括含有多核苷酸的可扩增选择标记基因获得多核苷酸拷贝数的增 加,其中可以通过在有适当选择剂存在下培养细胞选择含有选择标记的扩 增拷贝和由此额外的多核苷酸拷贝的细胞。

用于连接上述元件以便构建本发明重组表达载体的操作步骤为本领域 技术人员众所周知(例如,参见Sambrook等,1989,文献同上)。

宿主细胞

本发明还涉及包括本发明多核苷酸的重组宿主细胞,它们可以有利地 用于多肽类的重组生产。将包括本发明多核苷酸的载体导入宿主细胞,以 便将该载体维持为染色体整合体或如上所述的自主复制染色体外载体。术 语″宿主细胞″包括因在复制过程中发生突变而与亲代细胞不同的亲代细胞 的任意子代。宿主细胞的选择在很大程度上取决于编码多肽的基因及其来 源。

宿主细胞可以为单细胞微生物,例如原核细胞,或非单细胞的微生物, 例如真核细胞。

有用的单细胞微生物为细菌细胞,诸如革兰氏阳性菌,包括,但不限 于:芽孢杆菌属细胞,例如嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、 环状芽孢杆菌、Bacillus clausii、凝结芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢 杆菌、地衣芽孢杆菌、巨大芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌 和苏芸金芽孢杆菌;或链霉菌属细胞,例如浅青紫链霉菌和鼠灰链霉菌; 或革兰氏阴性菌,诸如大肠杆菌和假单胞细菌属。在一个优选的方面中, 细菌宿主细胞为迟缓芽孢杆菌、地衣芽孢杆菌、嗜热脂肪芽孢杆菌或枯草 芽孢杆菌细胞。在另一个优选的方面中,芽孢杆菌属细胞为嗜碱性芽孢杆 菌(alkalophilic Bacillus)。

例如,可以通过原生质体转化(例如,参见Chang和Cohen,1979, Molecular General Genetics 168:111-115),使用感受态细胞(例如,参见Young 和Spizizin,1961,Journal of Bacteriology 81:823-829,或Dubnau和 Davidoff-Abelson,1971,Journal of Molecular Biology 56:209-221)、电穿孔(例 如,参见Shigekawa和Dower,1988,Biotechniques 6:742-751)或接合(例如, 参见Koehler和Thorne,1987,Journal of Bacteriology 169:5771-5278)将载体 导入细菌宿主细胞。

宿主细胞可以为真核细胞,诸如哺乳动物、昆虫、植物或真菌细胞。

在一个优选的方面中,宿主细胞为真菌细胞。本文所用的“真菌”包括 phyla Ascomycota、Basidiomycota、Chytridiomycota和Zygomycota(如 Hawksworth等在Ainsworth and Bisby’s Dictionary of The Fungi,8th edition, 1995,CAB International,University Press,Cambridge,UK中定义)以及 Oomycota(如Hawksworth等,1995,文献同上,171页上所述)和所有的有丝 分裂孢子(mitosporic)真菌(Hawksworth等,1995,文献同上)。

在另一个具体的实施方案中,真菌宿主细胞是酵母细胞。在此使用的“酵 母”包括产子囊酵母(ascosporogenous)(内孢霉目(Endomycetales))、产担子孢 子囊酵母(basidiosporogenous)和属于半知菌(芽孢纲(Blastomycetes))的酵 母。由于酵母的分类将来可能会有所变化,对本发明而言,应按照Biology and Activities of Yeast(Skinner,F.A.,Passmore,S.M.,和Davenport,R.R., 编,Soc.App.Bacteriol.Symposium Series No.9,1980)中所述的定义酵母。

在甚至更优选的方面中,酵母宿主细胞可以是念珠菌属(假丝酵母属) (Candida)、汉逊酵母属(Hansenula)、克鲁维酵母属(Kluyveromyces)、毕赤酵 母属(Pichia)、糖酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、 或Yarrowia细胞。

在甚至更优选的方面中,酵母宿主细胞为假丝酵母属、汉逊氏酵母属 (Hansenula)、克鲁维氏酵母属、毕赤氏酵母属、糖酵母属、裂殖糖酵母属 或Yarrowia细胞。

在一个最优选的方面中,酵母宿主细胞为卡尔斯伯糖酵母、啤酒糖酵 母、糖化糖酵母、Saccharomyces douglasii、Saccharomyces kluyveri、 Saccharomyces norbensis或卵形糖酵母细胞。在另一个最优选的方面中,酵 母宿主细胞为乳克鲁维氏酵母(Kluyveromyces lactis)细胞。在另一个最优 选的方面中,酵母宿主细胞为Yarrowia lipolytica细胞。

在另一个更优选的方面中,真菌宿主细胞可以是丝状真菌细胞。“丝状 真菌”包括真菌(Eumycota)和卵菌门(Oomycota)(如Hawksworth等,1995, 文献同上所定义的)所有丝状形式的亚类。丝状真菌特征在于由几丁质、纤 维素、葡聚糖、脱乙酰壳多糖、甘露聚糖、以及其它复合多糖组成的菌丝 体壁。营养生长依靠菌丝延长,且分解代谢是专性需的。相反,诸如 啤酒酵母的酵母的营养生长通过单细胞原植体的芽殖进行,且碳分解代谢 可以是发酵的。

在一个甚至更优选的方面中,宿主真菌宿主细胞为支顶孢属、曲霉属、 短柄霉属、烟管菌属(Bjerkandera)、Ceriporiopsis、鬼伞属、Coriolus、隐 球菌属、Filibasidium、镰孢霉属、腐质霉属、Magnaporthe、,毛霉属、毁丝 霉属(Myceliophthora)、Neocallimastix、链孢霉属(Neurospora)、拟青霉 属(Paecilomyces)、青霉属(Penicillium)、Phanerochaete、射脉菌属(Phlebia)、 Piromyces、灰侧菌属(Pleurotus)、裂褶菌属(Schizophyllum)、踝节菌 属(Talaromyces)、热子囊菌属(Thermoascus)、草根霉属(Thielavia)、 Tolypocladium或木霉属细胞。在一个最优选的方面中,丝状真菌宿主细胞 为泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉细 胞。在另一个最优选的方面中,丝状真菌宿主细胞为杆孢状镰孢、Fusarium cerealis、Fusarium crookwellense、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰 孢、合欢木镰孢、尖孢镰孢、多枝镰孢、玫瑰色镰孢、接骨木镰孢、肤色 镰孢、拟分枝孢镰孢、硫色镰孢、Fusarium torulosum、Fusarium trichothecioides 或Fusarium venenatum细胞。在另一个最优选的方面中,丝状真菌宿主细胞 为黑刺烟管菌(Bjerkandera adusta)、Ceriporiopsis aneirina、Ceriporiopsis aneirina、Ceriporiopsis caregiea、Ceriporiopsis gilvescens、Ceriporiopsis pannocinta、Ceriporiopsis rivulosa、Ceriporiopsis subrufa、Ceriporiopsis subvermispora、Coprinus cinereus,Coriolus hirsutus、Humicola insolens、 Humicola lanuginosa、米赫毛霉、Myceliophthora thermophila、粗糙链孢霉、 产紫青霉、Phanerochaete chrysosporium、辐射射脉菌(Phlebia radiata)、 Pleurotus eryngii、Thielavia terrestris、Trametes villosa、Trametes versicolor、 Trichoderma harzianum、康宁氏木霉、Trichoderma longibrachiatum、 Trichoderma reesei或绿色木霉细胞。

可以通过本身公知方式的包括原生质体形成、原生质体转化和细胞壁 再生的方法转化真菌细胞。用于曲霉属和木霉属宿主细胞转化的合适的操 作步骤描述在EP 238 023和Yelton等,1984,Proceedings of the National Academy of Sciences USA 81:1470-1474中。用于转化镰孢属种类的合适的 方法描述在Malardier等,1989,基因78:147-156,和WO 96/00787中。可以使 用下列文献中所述的操作步骤转化酵母:Becker和Guarente,Abelson,J.N. 和Simon,M.I.,editors,Guide to Yeast Genetics and Molecular Biology, Methods in Enzymology,Volume194,pp 182-187,Academic Press,Inc.,New York:Ito等,1983,Journal of Bacteriology 153:163;和Hinnen等,1978, Proceedings of the National Academy of Sciences USA 75:1920。

生产方法

本发明还涉及生产本发明多肽的方法,包括(a)在有助于产生多肽的条 件下培养细胞,其野生型形式能够产生所述多肽;和(b)回收所述的多肽。 优选细胞为镰孢属且更优选Fusarium venenatum的细胞。

本发明还涉及生产本发明多肽的方法,包括:(a)在有助于产生所述多 肽的条件下培养宿主细胞;和(b)回收所述的多肽。

本发明还涉及生产本发明多肽的方法,包括:(a)在有助于产生所述多 肽的条件下培养宿主细胞,其中该宿主细胞包括具有在SEQ ID NO:1的成 熟多肽编码区中的至少一种突变的突变核苷酸序列,其中所述的突变核苷 酸序列编码由SEQ ID NO:2的21-960位氨基酸组成的多肽;和(b)回收 所述的多肽。

在本发明的生产方法中,使用本领域众所周知的方法在适合于生产所 述多肽的营养培养基中培养细胞。例如,可以通过摇瓶培养和在合适的培 养基中和允许表达和/或分离所述多肽的条件下进行的在实验室或工业化发 酵罐中小规模或大规模发酵(包括连续、批量、补料分批或固态发酵)来培养 细胞。使用本领域公知的操作步骤在包括碳和氮源以及无机盐的合适的营 养培养基中进行培养。合适的培养基购自商品供应商或可以按照公布的组 成(例如在American Type Culture Collection的产品目录中)制备。如果使多肽 分泌入营养培养基,那么可以从该培养基中直接回收多肽。如果多肽未分 泌,那么可以从细胞裂解物中回收它。

可以使用本领域公知对多肽类具有特异性的方法检测多肽类。这些检 测方法可以包括使用特异性抗体,形成酶产物或使酶底物消失。例如,酶 试验可以用于测定如本文所述的多肽活性。

可以使用本领域公知的方法回收所得的多肽。例如,可以通过常规操 作步骤,包括,但不限于离心、过滤、提取、喷雾干燥蒸发或沉淀回收 多肽。

可以通过本领域公知的各种操作步骤纯化本发明的多肽,包括,但不 限于色谱法(例如离子交换、疏水、色谱聚焦和大小排阻)、电泳操作步骤(例 如制备型等电位焦距)、差别溶解(例如硫酸铵沉淀)、SDS-PAGE或提取(例 如,参见Protein Purification,J.-C.Janson和Lars Ryden,editors,VCH Publishers,New York,1989)。

植物

本发明还涉及用编码本发明具有α-葡糖苷酶活性的多肽的核苷酸序列 转化的转基因植物、植物部分或植物细胞,以便表达和以可回收量生产多 肽。可以从植物或植物部分中回收多肽。或者,含有重组多肽的植物或植 物部分照此可以用于改善食品或饲料质量,例如改善营养价值、适口性 和流变性或破坏抗营养因子

转基因植物可以为双子叶的(双子叶植物)或单子叶的(单子叶植物)。单 子叶植物的实例为草类,诸如草地草(早熟禾,早熟禾属(Poa));饲料草, 诸如羊茅属(Festuca)、黑麦草属(Lolium);温带草,诸如翦股颖属(Agrostis); 和谷类,例如小麦、燕麦、黑麦、大麦、稻米、高梁和玉米(maize)(玉米 (corn))。

双子叶植物的实例为:烟草;豆类,诸如羽扇豆、铃薯、甜菜、豌 豆、扁豆(bean)和大豆;和十字花科植物(芸苔科(Brassicaceae)),诸如 花椰菜、菜子和极为相关的模型生物拟南芥。

植物部分的实例为茎、愈伤组织、叶、根、果实、种子和根茎类以及 包括这些部分的各组织,例如表皮、叶肉、实质、维管组织、分生组织。 将具体的植物细胞小室,诸如叶绿体、质外体、线粒体、液泡、过氧化物 酶体和细胞质也认为是植物部分。此外,任意的植物细胞,无论是否为组 织来源,均被认为是植物部分。同样,也认为诸如分离以有利于本发明应 用的具体组织和细胞是植物部分,例如胚、胚乳、糊粉和种皮。

本发明范围内还包括这类植物、植物部分和植物细胞的子代。

可以按照本领域公知的方法构建表达本发明多肽的转基因植物或植物 细胞。简言之,通过将编码本发明多肽的一种或多种表达构建体掺入植物 宿主基因组并且使所得修饰的植物或植物细胞繁殖成转基因植物或植物细 胞来构建植物或植物细胞。

表达构建体便利地为包括编码本发明多肽的多核苷酸的核酸构建体, 所述的多核苷酸可操作地与表达所选择的植物或植物部分中的核苷酸序列 所需的合适的调节序列连接。此外,该表达构建体可以包括用于鉴定已经 整合入了所述表达构建体的宿主细胞的选择标记和将该构建体导入所述植 物所必需的DNA序列(后者依赖于使用的DNA导入方法)。

例如,基于当需要、如果需要表达和需要如何表达来确定调节序列的 选择,诸如启动子和终止子序列和任选的信号或转运序列。例如,编码本 发明多肽的基因表达可以为组成型或诱导型的,或可以为发育、阶段或组 织特异性的,并且基因产物可以定向于具体组织或植物部分,诸如种子或 叶。例如,调节序列描述在Tague等,1988,Plant Physiology86:506中。

为了进行组成型表达,可以使用35S-CaMV、玉米泛蛋白1和稻肌动蛋 白1启动子(Franck等,1980,Cell 21:285-294,Christensen等,1992,Plant Mo. Biol.18:675-689:Zhang等,1991,Plant Cell 3:1155-1165)。例如,器官-特 异性启动子可以为来自贮存库组织,诸如种子、马铃薯根茎类和果实 (Edwards&Coruzzi,1990,Ann.Rev.Genet.24:275-303)或来自代谢库组织, 诸如分生组织(Ito等,1994,Plant Mol.Biol.24:863-878)的启动子;种子特异 性启动子,诸如来自稻的谷蛋白、醇溶蛋白、球蛋白或清蛋白启动子(Wu 等,1998,Plant and Cell Physiology 39:885-889);来自豆球蛋白B4和来自蚕 豆(Vicia faba)的未知种子蛋白基因的蚕豆启动子(Conrad等,1998,Journal of Plant Physiology 152:708-711);来自种子油体蛋白的启动子(Chen等,1998, Plant and Cell Physiology 39:935-941);来自欧洲油菜(Brassica napus)的储存 蛋白napA启动子或任意其它本领域中公知的,例如如WO 91/14772中所述 的种子特异性启动子。此外,启动子可以为叶特异性启动子,诸如来自稻 米或番茄的rbcs启动子(Kyozuka等,1993,Plant Physiology 102:991-1000; 小球藻病毒腺嘌呤甲基转移酶基因启动子(Mitra和Higgins,1994,Plant Molecular Biology 26:85-93)或来自水稻的aldP基因启动子(Kagaya等,1995, Molecular和General Genetics 248:668-674);或伤口诱导型启动子,诸如马 铃薯pin2启动子(Xu等,1993,Plant Molecular Biology 22:573-588)。同样, 启动子可以通过非生物性处理,诸如温度、干旱或盐浓度改变而成为诱导 型的或通过活化启动子的外部施用的物质诱导,所述的外部施用的物质例 如为乙醇、雌激素、植物激素,诸如乙烯、脱落酸和赤霉酸和重金属。

启动子增强子元件也可以用于本发明多肽在植物中的高度表达。例如, 启动子增强子元件可以为置于启动子与编码本发明多肽的核苷酸序列之间 的内含子。例如,Xu等,1993,文献同上中披露了第一内含子在强化表达的 水稻肌动蛋白1基因中的应用。

表达构建体的选择标记基因和任意其它部分可以选自本领域中可利用 的那些部分。

按照本领域中公知的常规技术,包括土壤杆菌属(Agrobacterium)-介 导的转化、病毒-介导的转化、显微注射、粒子轰击、生物射弹转化和电穿 孔将核酸构建体掺入植物基因组(Gasser等,1990,Science 244:1293: Potrykus,1990,Bio/Technology 8:535:Shimamoto等,1989,Nature 338:274)。

目前,根癌土壤杆菌(Agrobacterium tumefaciens)-介导的基因转移为 用于生产转基因双子叶植物而的选择方法(就综述而言,参见Hooykas和 Schilperoort,1992,Plant Molecular Biology 19:15-38)并且还可以用于转化单 子叶植物,不过,其它转化方法通常用于这些植物。目前,为生产转基因 单子叶植物而选择的方法为对胚愈伤组织或发育的胚进行粒子轰击(用转化 的DNA包被的微观金或钨粒子)(Christou,1992,Plant Journal 2:275-281: Shimamoto,1994,Current Opinion Biotechnology 5:158-162:Vasil等,1992, Bio/Technology 10:667-674)。用于单子叶植物转化的备选方法基于如 Omirulleh等在1993,Plant Molecular Biology 21:415-428中所述的原生质体 转化。

在转化后,选择掺入了所述表达载体的转化体并且按照本领域众所周 知的方法将其再生成完整植物。通常设计转化操作步骤以便通过使用例如 与两种单独的T-DNA构建体共转化或用特异性重组酶对选择基因进行位点 特异性切除在再生过程中或在以下的子代中对选择基因进行选择性淘汰。

本发明还涉及用于生产本发明多肽的方法,包括:(a)在有助于产生所 述多肽的条件下培养转基因植物或植物细胞,其包括编码本发明具有α-葡 糖苷酶活性的多肽的多核苷酸;和(b)回收所述的多肽。

α-葡糖苷酶活性的除去或降低。

本发明还涉及用于生产亲代细胞突变体的方法,该方法包括破坏或缺 失编码本发明多肽的多核苷酸序列或其部分,从而在相同条件下培养时产 生比亲代细胞产生的所述多肽少的突变细胞。

可以通过使用本领域众所周知的方法,例如插入、破坏、取代或缺失 减少或消除编码本发明多肽的核苷酸序列的表达来构建突变细胞。例如, 修饰或失活的核苷酸序列可以为活性所必需的编码区或其部分或表达该编 码区所需的调节元件。这类调节或控制序列的实例可以为启动子序列或其 功能部分,即足以影响核苷酸序列表达的部分。能够进行修饰的其它控制 序列包括,但不限于前导区、聚腺苷酸化序列、前肽序列、信号肽序列、 转录终止子和转录激活物。

可以通过使亲代细胞进行诱变并且选择核苷酸序列表达已经减少或消 除的突变细胞对核苷酸序列进行修饰或使其失活。例如,可以通过使用回 收的物理或化学诱变剂,通过使用合适的寡核苷酸或通过使DNA序列进行 PCR产生的诱变来进行可以为特异性的或随机的诱变。此外,可以通过使 用这些诱变剂的任意组合进行诱变。

适合于本发明目的的物理或化学诱变剂的实例包括紫外线(UV)照射、 羟基胺、N-甲基-N′-硝基-N-亚硝基胍(MNNG)、O-甲基羟基胺、亚硝酸、甲 磺酸乙酯(EMS)、亚硫酸氢钠,甲酸,和核苷酸类似物。

当使用这类试剂时,一般通过将所诱变的亲代细胞在有选择的诱变剂 存在下和适当条件下孵育和/或筛选表现出基因表达减少或无基因表达的突 变细胞进行诱变。

可以通过导入、取代或除去转录或翻译中所需基因或调节元件中的一 种或多种核苷酸进行核苷酸序列的修饰或使其失活。例如,可以插入或除 去核苷酸以便导入终止密码子,除去起始密码子或使可读框改变。可以按 照本领域公知的方法通过定点诱变或PCR产生的诱变进行这类修饰或失 活。不过,一般而言,可以在体内,即直接对表达修饰的核苷酸序列的细 胞进行修饰,优选以如下为典型在体外进行修饰。

由细胞消除或减少核苷酸序列表达的便利方式的实例基于基因取代、 基因缺失或基因破坏的技术。例如,在基因破坏方法中,在体外诱变相当 于内源性核苷酸序列的核酸序列,以便产生缺陷型核酸序列,然后将其转 化成可产生缺陷型基因的亲代细胞。通过同源重组,缺陷型核酸序列取代 了内源性核苷酸序列。需要缺陷型核苷酸序列也编码可以用于转化体选择 的标记,其中核苷酸序列已经被修饰或破坏。在一个特别优选的实施方案 中,使用选择标记,诸如本文所述的那些选择标记破坏核苷酸序列。

或者,可以通过建立的反义技术,使用与核苷酸序列互补的序列对核 苷酸序列进行修饰或使其失活。更具体地说,可以通过导入与可在细胞中 转录并且能够与细胞中产生的mRNA杂交的核苷酸序列互补的序列来减少 或消除细胞对核苷酸序列的表达。在允许互补反义核苷酸与mRNA杂交的 条件下,由此减少或消除了翻译的蛋白质的量。

本发明进一步涉及取代细胞突变细胞,它包括编码所述多肽的核苷酸 序列或其控制序列,从而产生比亲代细胞产生的多肽少的突变细胞。

由此生成的多肽-缺陷型突变细胞特别用作表达同源和/或异源多肽类 的宿主细胞。因此,本发明进一步涉及用于生产同源或异源多肽的方法, 包括:(a)在有助于产生所述多肽的条件下培养突变细胞;和(b)回收所述 的多肽。将术语″异源多肽类″在本文中定义为对宿主细胞而言并非天然的多 肽类,即已经进行了修饰以改变天然序列的天然蛋白或作为通过重组DNA 技术操作宿主细胞结果的表达定量改变的天然蛋白质。

在另一个方面中,本发明涉及用于生产实质上不含α-葡糖苷酶活性的蛋 白质产物的方法,通过发酵产生本发明多肽的细胞和通过下列步骤产生所 关注的蛋白质产物来进行:在完成发酵前、过程中或之后向发酵肉汤中添 加有效量的能够抑制α-葡糖苷酶活性的活性剂,从发酵肉汤中回收所关注 的产物并且任选对回收的产物进行进一步纯化。

在另一个方面中,本发明涉及用于生产实质上(essentially)不含α-葡 糖苷酶活性的蛋白质产物,通过下列步骤进行:在允许表达所述产物的条 件下培养细胞,使所得培养肉汤进行组合的pH和温度处理以便技术降低α- 葡糖苷酶活性并且从培养肉汤中回收产物。或者,对从培养肉汤中回收的 酶制品进行合并的pH和温度处理。可以任选将合并的pH和温度处理与使 用α-葡糖苷酶抑制剂处理联用。

按照本发明的该方面,能够除去至少60%,优选至少75%,更优选至 少85%,更优选至少95%且最优选至少99%的α-葡糖苷酶活性。可以通过 使用该方法获得对α-葡糖苷酶活性的完全除去。

组合的pH和温度处理优选在4-5的pH范围和70-80℃的温度范围进 行进行足以获得所需作用的时间期限,其中一般为30-60分钟就足够。

可以通过本领域中公知的方法实施用于培养和纯化所各种产物的方 法。

用于产生实质上不含α-葡糖苷酶活性的本发明方法特别关注生产α-葡 糖苷酶活性的多肽类,特别是真菌蛋白质,诸如酶。例如,酶可以选自淀 粉分解酶、脂肪分解酶、蛋白水解酶、细胞裂解酶、氧化还原酶、或植物 细胞壁降解酶。这种酶的实例包括氨肽酶、淀粉酶、淀粉葡萄糖苷酶、糖 酶、羧肽酶、过氧化氢酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转 移酶、脱氧核糖核酸酶、酯酶、半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、 葡萄糖氧化酶、葡糖苷酶、卤素过氧化物酶、半纤维素酶、转化酶、异构 酶、漆酶、连接酶、脂肪酶、裂解酶、甘露糖苷酶、氧化酶,果胶裂解酶、 过氧化物酶、肌醇六磷酸酶、酚氧化酶、多酚氧化酶、蛋白酶、核糖核酸 酶、转移酶、转谷氨酰胺酶、或木聚糖酶。α-葡糖苷酶有缺陷的细胞也可用 于表达有药物学重要性的异源蛋白质,例如激素、生长因素、受体等等。

应理解术语″真核多肽类″不仅包括天然多肽类,而且包括例如酶这类已 经通过氨基酸取代、缺失或添加或其它这类修饰而修饰的多肽类,以便增 强活性、热稳定性、pH耐受性等。

在另一个方面中,本发明涉及基本上不含α-葡糖苷酶活性的通过本发明 方法产生的蛋白质产物。

组合物

本发明还涉及包括部分多肽的组合物。优选该组合物富含这类多肽。 术语″富含的″表示组合物的α-葡糖苷酶活性已经得到增加,例如具有1.1的 富集系数。

组合物可包括作为主要酶促成分的本发明多肽,例如单组分组合物。 备选地,组合物可包括多种酶促活性,例如氨肽酶、淀粉酶、糖酶、羧肽 酶、过氧化氢酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱 氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖 苷酶、β-葡糖苷酶、卤素过氧化酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、 氧化酶、果胶裂解酶、肽谷氨酰胺酶、过氧化物酶、肌醇六磷酸酶、多酚 氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、或木聚糖酶。附加的 酶可由属于曲霉属,优选棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉、烟曲 霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、或米曲霉;镰孢属,优选杆 孢状镰孢、Fusarium cerealis,Fusarium crookwellense,大刀镰孢、禾谷镰孢、 禾赤镰孢、异孢镰孢、合欢木镰孢、尖孢镰孢、多枝镰孢、玫瑰色镰孢、 接骨木镰孢、肤色镰孢、硫色镰孢、Fusarium toruloseum,Fusarium trichothecioides,或Fusarium venenatum;腐殖霉属,优选Humicola insolens 或Humicola lanuginosa;或木霉属,优选Trichoderma harzianum、康宁氏木 霉、Trichoderma longibrachiatum、Trichoderma reesei或绿色木霉。

Trichoderma harzianum、康宁氏木霉、Trichoderma longibrachiatum、 Trichoderma reesei或绿色木霉。

这些多肽组合物可以按照本领域中公知的方法制备并且可以为液体或 干组合物形式。例如,这些多肽组合物可以为颗粒或微粒形式。可以按照 本领域中公知的方法使组合物中包括的多肽稳定。

下文给出了本发明多肽组合物的优选应用的实例。可以基于本领域公 知的方法测定本发明多肽组合物的剂量和该组合物使用的其它条件。

应用

本发明还涉及使用具有α-葡糖苷酶活性的多肽类的方法。

本发明的多肽类可以用于按照DE 2944483由谷物生产酒精。

本发明的多肽类还可以用于按照WO 2002/55652(美国专利申请公开号 20040101591)生产发酵麦芽饮料,例如(低卡)啤酒。可以通过添加具有α-葡 糖苷酶活性的多肽,此后在生产发酵麦芽饮料过程中的麦芽汁生产中进行 热处理来生产具有强化的令人满足的味道和丰富口感的发酵麦芽饮料。可 以生产低卡啤酒,其中在啤酒酿造中的发酵过程中添加具有α-葡糖苷酶活 性的多肽。可以通过在高比重啤酒酿造中的发酵过程中添加具有α-葡糖苷 酶活性的多肽来减少乙酸的产生。

在生产啤酒的过程中,通过水解酶(例如α-淀粉酶、β-淀粉酶)和可发酵 糖类,诸如葡萄糖、麦芽糖和麦芽三糖水解来源于包括麦芽的组分的淀粉, 其中所述的酿酒酵母可以代谢大于麦芽四糖的寡糖类并且产生糊精。然后 可发酵糖类被酿酒酵母(或其它酵母)代谢并且被转化成啤酒的各种成分,诸 如酒精。大于麦芽四糖和糊精的寡糖类仍然可以保留在啤酒中而不被代谢 并且可以参与饮料的令人满足的味道和丰富口感。

在一个优选的方面中,该方法涉及生产发酵麦芽饮料,其中在生产发 酵麦芽饮料过程中的麦芽汁生产中对麦芽进行热处理前添加本发明具有α- 葡糖苷酶活性的多肽。在另一个更优选的方面中,所用的具有α-葡糖苷酶 活性的多肽的量为50-400ppm/麦芽的量。在另一个优选的方面中,与研磨 麦芽的同时添加具有α-葡糖苷酶活性的多肽。在另一个优选的方面中,在 麦芽汁生产过程的热处理前向麦芽浆中添加具有α-葡糖苷酶活性的多肽。 在另一个优选的方面中,在麦芽处理过程中添加具有α-葡糖苷酶活性的多 肽。在另一个优选的方面中,仅将麦芽用作组分。在另一个优选的方面中, 将麦芽和添加剂用作糖组分。

在另一个优选的方面中,所述的方法涉及生产啤酒的方法,其中在啤 酒酿造中的发酵过程中添加具有α-葡糖苷酶活性的多肽。在一个更优选的 方面中,所述的啤酒为低卡(low-calorie)或轻淡啤酒(light beer)。在另一 个优选的方面中,添加具有α-葡糖苷酶活性的多肽可减少乙酸的产生。在 另一个更优选的方面中,麦芽汁原始提取物的浓度高于10,但不超过30重 量%。在另一个更优选的方面中,所用的具有α-葡糖苷酶活性的多肽的量为 50-400ppm/麦芽的量。

信号肽

本发明还涉及核酸构建体,它们包括编码可操作地与核苷酸序列连接 的蛋白质的基因,所述的核苷酸序列由编码由SEQ ID NO:2的1-20位氨 基酸组成的信号肽的SEQ ID NO:1的61-2880位核苷酸组成,其中所述的 基因对所述的核苷酸序列而言为外源性的。

本发明还涉及包括这类核酸构建体的重组表达载体和细胞。

本发明还涉及用于生产蛋白质的方法,包括:(a)在适合于产生所述蛋 白质的条件下培养这类重组宿主细胞;和(b)回收所述的蛋白质。

所述的蛋白质对宿主细胞而言可以为天然的或异源的。术语“蛋白质” 在本文中并非意旨具体长度的编码产物,且由此包括肽类、寡肽类和蛋白 质。术语“蛋白质”还包括合并成编码产物的两种或多种多肽类。所述的蛋白 质还包括杂种多肽类,这些多肽包括获自两种不同蛋白质的部分或完整多 肽序列的组合,其中一种或多种对宿主细胞而言可以为异源性的或天然的。 蛋白质还包括上述蛋白质和杂种蛋白的天然存在的等位和改造的变化形 式。

优选所述的蛋白质为激素或其变体、酶、受体或其部分、抗体或其部 分或报道分子。在一个更优选的方面中,所述的蛋白质为氧化还原酶、转 移酶、水解酶、裂解酶、异构酶、或连接酶。在更优选的方面,蛋白质是 氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、壳多糖酶、角 质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳 糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂肪酶、 甘露糖苷酶、mutanase、氧化酶、果胶裂解酶、过氧化物酶、肌醇六磷酸酶、 多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。

基因可以获自任意的原核、真核或其它来源。

通过下列实施例来进一步描述本发明,但它们不应用来限定本发明的 范围。

实施例

材料

用作缓冲液和底物的化学物质为至少试剂级的商购产品。

真菌菌株

Fusarium venenatum菌株WTY842-1-11(Δtri5,amdS+)用于表达Fusarium venenatum GH31α-葡糖苷酶基因。

培养基和溶液

RA孢子形成培养基由每升1g葡萄糖、50g琥珀酸、12.1g NaNO3和 20ml 50X Vogel盐(无C,无N)构成。

50X Vogel盐(无C,无N)由每升250g of KH2PO4、10g MgSO4.7H2O、5g CaCl2.2H2O、2.5ml生物素溶液和5ml Vogel微量元素构成。

50X Vogel微量元素溶液由每升50g柠檬酸、50g ZnSO4·7H2O、10g Fe(NH4)2(SO4)2·6H2O、2.5g CuSO4·5H2O、0.5g MnSO4·H2O、0.5g H3BO3和 0.5g Na2MoO4·2H2O构成。

YPG培养基由每升1%酵母提取物、2%细菌用蛋白胨和5%葡萄糖构成。

Vogel NO3再生低熔点培养基由每升20ml 50X含有25mM NaNO3储备 溶液的Vogels溶液、0.8M蔗糖和1.5%低熔点琼脂糖(Sigma Chemical Company,St.Louis,MO)构成。

50X含有25mM NaNO3储备溶液的Vogels溶液由每升125g柠檬酸钠、 250g KH2PO4、106.25g NaNO3、10g MgSO4.7H2O、5g CaCl2.2H2O、2.5g 生物素溶液和5ml 50X Vogels微量元素溶液构成。

Vogel’s NO3+BASTA(6mg/ml)培养基由每升25g蔗糖、25g诺布尔 (Noble)琼脂、含有25mM NaNO3储备溶液的20ml 50X Vogel盐和6g BASTA/升构成。

M400培养基由每升50g麦芽糖糊精、2g MgSO4·7H2O、2g KH2PO4、 4g柠檬酸、8g酵母提取物、2g脲、0.5g CaCl和0.5ml AMG微量金属溶 液构成。

AMG微量金属溶液由每升14.3g ZnSO4·7H2O、2.5g CuSO4·5H2O、0.5g NiCl2·6H2O、13.8g FeSO4·7H2O、8.5g MnSO4·H2O和3g柠檬酸构成。

50X Vogel盐溶液由每升125g柠檬酸钠、250g KH2PO4、10g MgSO4·7H2O、5g CaCl2·2H2O、2.5ml生物素储备溶液和5ml 200X AMG微 量元素溶液构成。

生物素储备溶液由在100ml50%乙醇中的5mg生物素组成。

200X AMG微量金属由每升3g柠檬酸、14.3g ZnSO4·7H2O、2.5g CuSO4·5H2O、13.8g FeSO4·7H2O和8.5g MnSO4·H2O组成。

Vogel盐培养基由每升20ml无菌过滤的(0.2μm直径孔径,Fisher Millipore)50X Vogel盐溶液、16.5g磷酸氢铵(monobasic ammonium phosphate)和50g蔗糖构成,使用5N NaOH将其pH缓冲至6.50,此后进行 高压灭菌25分钟。在接种前,当溶液冷却时,加入来自无菌过滤的250mg/ml 储备溶液的2.5ml BASTA,终浓度为6mg/ml。

SY50培养基由每升50g蔗糖、2g MgSO4·7H2O、10g KH2PO4、2g K2SO4、2g柠檬酸·H2O、10g酵母提取物、2g脲、0.5g CaCl2·2H2O和0.5ml 200X AMG微量金属溶液构成;使用5N NaOH将其pH调节至6.50,此后 进行高压灭菌25分钟。

STC由0.8M山梨醇、50mM CaCl2和25mM Tris-Cl,pH8组成。

SPTC由0.8M山梨醇、25mM Tris-HCl,pH8、50mM CaCl2和40%PEG 4000组成。

TBE缓冲液由50mM Tris碱、50mM酸和1mM EDTA二钠组成。

实施例1:Fusarium venenatum菌丝体组织的生产

使用补料分批发酵方案与作为碳源的NUTRIOSETM(Roquette Freres, S.A.,Beinheim,France)和酵母提取物,使Fusarium venenatum CC1-3,镰孢 属菌株的形态突变体(NRRL 30747或ATCC 20334)(Wiebe等,1991, Mycological Research 95:1284-1288)生长在2升实验室规模的发酵罐中。在 进料中提供磷酸铵。将pH维持在6-6.5并且将温度保持在30℃使用正溶 解氧的环境中。

在接种后4天收集菌丝体样品并且迅速冷冻在液氮中。将样品贮存在 -80℃下,直到为进行RNA提取将它们破坏为止。

实施例2:cDNA文库构建

按照Timberlake和Bamard(1981,Cell 26:29-37)的方法从实施例1中所 述的菌丝体样品中提取总细胞RNA并且在从1%甲醛-琼脂糖凝胶中印迹后 通过Northern印迹杂交分析RNA样品(Davis等,1986,Basic Methods in Molecular Biology,Elsevier Science Publishing Co.,Inc.,New York)。使用 mRNA Separator KitTM(Clontech Laboratories,Inc.,Palo Alto,CA),按照制造 商的说明从总RNA中分离聚腺苷酸化mRNA级分。使用约5μg聚(A)+ mRNA,按照Gubler和Hoffman(1983,Gene 25:263-269)的方法合成双链 cDNA,但将Not I-(dT)18引物(Pharmacia Biotech,Inc.,Piscataway,NJ)用于启 动第一链合成。用绿豆核酸酶(Boehringer Mannheim Corporation,Indianapolis, IN)处理cDNA并且使用T4DNA聚合酶(New England Biolabs,Beverly,MA) 使末端钝端化。

用Not I消化cDNA,通过琼脂糖凝胶电泳进行大小选择(约0.7-4.5kb) 并且与已经用Not I+Eco RV切割的pZErO-2.1(Invitrogen,Carlsbad,CA)连 接,且使用肠碱性磷酸酶(Boehringer Mannheim Corporation,Indianapolis, IN)脱磷酸化。将该连接混合物用于转化感受态大肠杆菌TOP10细胞 (Invitrogen,Carlsbad,CA)。在含有终浓度为50μg/ml的卡那霉素的2YT琼 脂平板(Miller,1992,A Short Course in Bacterial Genetics.A Laboratory Manual and Handbook for Escherichia coli and Related Bacteria,Cold Spring Harbor Press,Cold Spring Harbor,New York)上选择转化体。

使用质粒克隆载体pZErO-2.1构建定向cDNA文库。使用来自在4天时 收集的菌丝体的mRNA制备文库D并且扩增cDNA文库。将该文库铺板, 滴定并且通过DNA测序分析独立的克隆。

文库D由扩增前约7.5×104个独立的克隆组成。从每个文库中的40个 克隆中分离小量制备的DNA并且检查cDNA插入片段的存在和大小。在该 分析中,来自文库D的40个菌落中的39个(97.5%)含有范围在600bp-2200 bp(平均值=1050bp)大小的插入片段。

实施例3:模板制备和核苷酸测序

从实施例2中所述的cDNA文库中可以看出,从转化平板中直接挑选 1152个转化体菌落放入含有2YT肉汤(Miller,1992,文献同上)与50μg/ml 卡那霉素的96-孔微量滴定皿。将平板在37℃和不进行振摇的条件下温育 过夜。在温育后,向各孔中加入100μl无菌50%甘油。使转化体复制入含 有1ml Magnificent BrothTM(MacConnell Research,San Diego,CA)的在各孔 中补充了50μg卡那霉素/ml的二次深皿96-孔微量培养平板(Advanced Genetic Technologies Corporation,Gaithersburg,MD)。将该初级微量滴定平板 冷冻储存在-80℃下。将二次深-皿平板在37℃下和剧烈搅拌(300rpm)的同 时在旋转振荡器上温育过夜。为了防止溢出和交叉污染,并且允许进行足 够的通气,用聚丙烯垫(Advanced Genetic Technologies Corporation, Gaithersburg,MD)和塑料微量滴定皿覆盖物覆盖每个二次培养平板。

使用如通过Utterback等(1995,Genome Sci.Technol.1:1-8)改进的 Advanced Genetic Technologies Corporation(Gaithersburg,MD)的96-孔小量制 备试剂盒方案从每个孔中分离DNA。使用Perkin-Elmer Applied Biosystems Model 377 XL Automatic DNA Sequencer(Perkin-Elmer Applied Biosystems, Inc.,Foster City,CA),使用染料-终止剂化学(Giesecke等,1992,Journal of Virology Methods 38:47-60)和反向lac测序引物进行单程DNA测序。

实施例4:DNA序列数据的分析

为质量而仔细检查核苷酸序列数据并且除去产生小于或等于9.2的不 适当间距或错读水平超过3%的样品或重新举行试验。借助于FACTURATM 软件(Perkin-Elmer Applied Biosystems,Inc.,Foster City,CA)调整载体序列。 此外,在不确定碱基名称增加时,在每一药品的末端截短序列。使用TIGR Assembler软件(Sutton,GG等,1995,Genome Science和Technology 1:9019) 将所有序列彼此与进行比较以便构建重叠群,从而确定在每一文库中代表 的各种cDNA种类的多样性。最后,在三种读框中翻译所有的序列并且使 用GeneAssistTM软件(Perkin-Elmer Applied Biosystems,Inc.,Foster City,CA) 与改进的Smith-Waterman算法,应用具有70阈值评分的BLOSUM62矩阵 对非重复(non-redundant)的数据库(NRDB)进行检索。由Genpept,Swiss-Prot 和PIR数据库组装NRDB。

实施例5:α-葡糖苷酶cDNA克隆的鉴定

通过使用Applied Biosystems Model 377 XL Automated DNA Sequencer, 按照制造商的说明对随机cDNA克隆举行部分测序来鉴定推定的α-葡糖苷 酶克隆并且将推定的氨基酸序列与如实施例4中所述的NRDB中的序列进 行比较。从分析的1152 cDNA序列中可以看出,来自文库D的11个克隆 表现出与来自其它真菌和酵母的α-葡糖苷酶蛋白的氨基酸序列同源性。在 以这种方式发现的几种α-葡糖苷酶cDNA克隆中,基于其与粗糙链孢霉 (SWALL登录号Q872B7)和构巢曲霉(SWALL登录号Q9C1S7)α-葡糖苷酶氨 基酸序列和使用信号-P计算机程序(Nielsen,等,1997,Protein Engineering 10: 1-6)检测的存在的可能的信号肽的序列对比评估2个为全长的(编码完整的 蛋白质)。选择含有质粒pFD11F2的命名为大肠杆菌FD11F2的克隆用于在 Fusarium venenatum中的表达(参见实施例7)。将含有质粒pFD11F2的大肠 杆菌FD11F2保藏在农业研究机构保藏中心(Agricultural Research Service Patent Culture Collection),Northern Regional Research Center,1815 University Street,Peoria,Illinois,61604,给予其保藏号为NRRL B-30753,保藏日为 2004年7月1日。

实施例6:编码Fusarium venenatumα-葡糖苷酶的cDNA片段的分离、 核苷酸测序和表征

使用Applied Biosystems Model 3700 Automated DNA Sequencer,应用染 料-终止剂化学对在pFD11F2中克隆的插入片段进行DNA测序。使用引物 步行策略产生连续的序列并且使用phred/phrap/consed(University of Washington)装配。将pFD11F2中的插入序列测序至每10,000个碱基至的评 价错误率低于1个碱基。

通过将cDNA序列数据与α-葡糖苷酶cDNA序列的重叠群举行比较确 定编码α-葡糖苷酶的Fusarium venenatum cDNA片段含有编码960个氨基酸 的多肽的2880bp的可读框。核苷酸序列(SEQ ID NO:1)和推定的氨基酸序 列(SEQ ID NO:2)如附图1中所示。SEQ ID NO:1的G+C含量为52.3%和 SEQ ID NO:1的61-2880位核苷酸的G+C含量为52.1%。使用SignalP 2.0 版程序(Nielsen等,1997,Protein Engineering 10:1-6)预测19个残基的信号 肽。预测的成熟蛋白质含有900?氨基酸,具有的分子量为?KDa。

使用Clustal方法(Higgins,1989,CABIOS 5:151-153),应用 LASERGENETM MEGALIGNTM软件(DNASTAR,Inc.,Madison,WI)与同一性 表和如下多个序列对比参数进行真菌α-葡糖苷酶蛋白质序列的对比排序: 空位罚分为10且空位长度罚分为10。配对序列对比参数为Ktuple=1,空位 罚分=3,窗格=5,和对角线=5。序列对比表明Fusarium venenatumα-葡糖 苷酶与下列来自其它真菌的α-葡糖苷酶共有同一性(圆括号内的相同残基 百分比):构巢曲霉保藏号Q9C1S7(77%);粗糙链孢霉登录号Q872B7(53%); Acremonium implicatum登录号BAD08418(51%);爪哇毛霉登录号 Q92442(37%);和黑曲霉登录号P56526(31%)。

实施例7:pEJG61的构建

通过修饰pSheB1(美国专利US6,090,604)产生Fusarium venenatum表达 载体pEJG61。修饰包括:(a)通过定点诱变改变pSheB1中的单一Bsp LU11I 位点;(b)用Fusarium venenaum葡糖淀粉酶启动子的2.1千碱基取代930bp 尖孢镰孢胰蛋白酶启动子;和(c)在Fusarium venenatum葡糖淀粉酶启动子 后导入Bsp LU11I位点。

使用QuikChangeTM定点诱变试剂盒(Stratagene Cloning Systems,La Jolla, CA),按照制造商的说明与下列诱变引物对在pSheB1序列中除去Bsp LU11I 位点:

5′-GCAGGAAAGAACAAGTGAGCAAAAGGC-3′(SEQ ID NO:3)

5′-GCCTTTTGCTCACTTGTTCTTTCCTGC-3′(SEQ ID NO:4)

该步骤生成pSheB 1中间体1。

通过下列步骤除去930bp的尖孢镰孢胰蛋白酶启动子:用Stu I和Pac I 消化pSheB1中间体1(6,971bp),在100伏特下使用TBE缓冲液使消化物在 1%琼脂糖凝胶上进行电泳1小时,切下6,040bp载体片段,并且用Qiaquick Gel Purification Kit(QIAGEN Inc.,Valencia,CA)纯化切下的片段。为了导入新 的Bsp LU11I位点,使用下列引物生成接头:

5′-dCCT ACATGTTTAAT-3’(SEQ ID NO:5)

Bsp Lu11I

5′-dTAA ACATGTAGG-3′(SEQ ID NO:6)

将每个引物(各2μg)加热至70℃下10分钟且然后在1小时内冷却至室 温。将该接头连入Stu I-Pac I消化的pSheB1中间体1载体片段,从而产 生pSheBI中间体2。

通过对质粒pFAMG(WO 00/56900)进行PCR分离葡糖淀粉酶编码区(葡 糖淀粉酶启动子)的Fusarium venenatum基因组DNA5引物(prime)的2.1 千碱基片段,所述的质粒pFAMG含有编码Fusarium venenatum葡糖淀粉酶 和3,950bp上游序列的完整编码区的Fusarium venenatum基因组DNA。用 于PCR的引物如下:

5’-AGGCCTCACCCATCTCAACAC-3’(SEQ ID NO:7)

5’-ACATGTTGGTGATAGCAGTGA-3’(SEQ ID NO:8)

PCR反应(50μl)由200ng pFAMG、200μM dNTPs、1μM上述引物、 1X反应缓冲液和2.6个单位的Expand High Fidelity酶混合物组成。使用MJ Research Thermocycler(MJ Research,Inc.,Boston,MA)温育反应体系,所述仪 器的程序为:94℃下2分钟的1个循环;在94℃下15秒、60℃下30秒和 72℃下2分15秒的个10个循环;在94℃下15秒、60℃下30秒和72℃ 下2分15秒的个15个循环与对每一连续的循环而言5秒的循环延长;和 在72℃下7分钟的1个循环。

使PCR产物在100伏特下使用TBE缓冲液在1%琼脂糖凝胶上进行电 泳1小时,产生预计的2,108bp的带。从琼脂糖凝胶上切下2,108bp PCR 产物并且使用Qiaquick Gel Purification Kit(QIAGEN Inc.,Valencia,CA)纯化。 用Stu I和Bsp LU11I切割该片段,用Qiaquick Purification Kit(QIAGEN Inc., Valencia,CA)纯化并且连入Stu I-Bsp LU11I消化的pSheBI中间体2而产生 EJG61(附图2)。

实施例8:Fusarium venenatumα-葡糖苷酶表达载体的构建

将InFusion Cloning Kit(BD Biosciences,Palo Alto,CA)用于将含有α-葡 糖苷酶基因的PCR片段直接克隆入表达载体pEJG61,无需进行限制消化和 连接。使用如下所示的基因特异性正向和反向引物对cDNA克隆进行PCR 扩增。粗体的字母代表编码序列,而下划线的字母代表分别在α-葡糖苷酶 基因的5’和3’端添加的Bsp LU11I和Pac I位点。剩余的序列与pEJG61的 插入位点同源。

引物997154(5’BspLU11I Fv a-GS):

5’-CACTGCTATCACCA ACATGTTCTTCAAGAAGCTGCT-3’(SEQ ID NO:9)

引物997155(3’PacI Fv a-GS):

5’-CCAACAAGGTAT TTAATTAATCAGAAGAGATCCAC-3’(SEQ  ID NO:10)

Expand High Fidelity PCR系统(Roche,Indianapolis,IN),按照制造商的 说明进行PCR扩增。PCR反应各自(50μl)由200ng cDNA克隆模版、200μM dNTPs、1μM正向和反向引物、1X反应缓冲液和2.6个单位的Expand High Fidelity酶混合物组成。使用MJ Research Thermocycler温育反应体系,所述 仪器的程序为:94℃下2分钟的1个循环;在94℃下15秒、60℃下30 秒和72℃下2分15秒的各10个循环;在94℃下15秒、60℃下30秒和 72℃下2分15秒的各15个循环与对每一连续的循环而言5秒的循环延长; 和在72℃下7分钟的1个循环。使用TBE缓冲液使各PCR产物的等分部 分运行在0.7%琼脂糖凝胶上,从而产生预计的约3bp的带。

使用QIAquick Gel Extraction Kit(Qiagen Inc.,Valencia,CA)对PCR严物 进行凝胶纯化且然后使用InFusion Cloning Kit(BD Biosciences,Palo Alto, CA)克隆入pEJG61表达载体,得到质粒pJLin163(附图3)。InFusion Cloning 反应(50μl)由1X InFusion缓冲液(BD Biosciences,Palo Alto,CA)、1X BSA(BD Biosciences,Palo Alto,CA)、1μlInfusion酶(按1∶10稀释)、用Bsp LU11I和Pac I消化的100ng pEJG61和含有α-葡糖苷酶基因的50ng纯化的 PCR产物组成。在室温下将该反应体系温育30分钟。将2μls反应体系用 于按照制造商的说明转化大肠杆菌Solopac Gold超感受态细胞(Stratagene, La Jolla,CA)。分离含有pJLin163质粒的大肠杆菌转化体并且通过序列分析, 使用Applied Biosystems Model 377 Sequencer XL标签使用染料-终止剂化学 进行证实。

实施例9:pJLin163转化入Fusarium venenatum WTY842-1-11

通过下列步骤产生Fusarium venenatum菌株WTY842-1-11(Δtrichodiene 合酶,amdS+),即镰孢属菌株A3/5突变体(NRRL 30747或ATCC 20334)(Wiebe等,1992,Mycological Research 96:555-562:Wiebe等,1991, Mycological Research 95:1284-1288:Wiebe等,1991,Mycological Research 96: 555-562)的孢子:在含有100ml RA孢子形成培养基的烧瓶中接种来自琼脂 平板的8plugs并且在27℃下以150rpm孵育24小时,然后在22℃下以 150rpm孵育24小时。通过经Miracloth在Nalgene 0.2μm滤膜上过滤培养 物收集孢子。用无菌蒸馏水将孢子洗涤2次,重新悬浮于小体积水中且然 后使用血细胞计数器计数。

通过给100ml YPG培养基接种2×108个Fusarium venenatum WTY842-1-11的孢子并且在18℃和150rpm下孵育15小时制备原生质体。 将培养物通过Miracloth过滤,用无菌蒸馏水洗涤1次并且用1M MgSO4再 洗涤1次且重新悬浮于40ml在1M MgSO4中的5mg/ml NOVOZYME234TM 中。将培养物在29℃和90rpm下孵育至原生质体形成。将体积为30ml的 1M山梨醇加入到原生质体消化物中并且以1500rpm将该混合物离心10分 钟。重新悬浮沉淀,用1M山梨醇洗涤2次并且以1500rpm离心10分钟以 便沉淀原生质体。使用血细胞计数器对原生质体进行计数并且将其重新悬 浮于8∶2∶0.1的STC∶SPTC∶DMSO溶液中至终浓度为5×107个原生质体/ml。 在Nalgene Cryo 1℃ Freezing Container中以受控速率冷冻后将原生质体储 存在-80℃下。

将2ml原生质体混悬液加入到50ml Falcon管中的100μg pJLin163环 状质粒和250μg肝素中,混合并且在上孵育30分钟。将200μl SPTC缓 慢混入原生质体混悬液标签在室温下持续孵育10分钟。将20ml SPTC缓慢 混入原生质体混悬液标签在室温下持续孵育10分钟。将350ml体积的熔化 Vogel’s NO3再生低-熔点培养基(冷却至50℃)与原生质体混合且然后将35 ml在含有35ml相同培养基+12mg BASTATM/ml的100mm培养平板上铺 板。在室温下持续孵育10-14天。12天后,21种转化体为明显的。将来 自每种转化体边缘的菌丝体片段转入含有Vogel’s NO3再生低-熔点培养基 +BASTA(6mg/ml)培养基的平板。用塑料袋密封该平板以便维持湿度并且在 室温下孵育约1周。

使Fusarium venenatum WTY842-1-11的转化体生长在125ml摇瓶中的 25ml M400培养基中。在28℃和200rpm下孵育培养物。在第2、4和6 天时,收集培养物上清液并且检测α-葡糖苷酶活性。在pH4.3的0.1M乙 酸钠缓冲液中将培养物上清液系列稀释0-倍-1/3-倍-1/9-倍。使用2-倍的 步骤稀释获自Novozymes A/S,Bagsvaerd,Denmark的AMG标准品,在pH4.3 的0.1M乙酸钠缓冲液中的起始浓度为0.033AGU/ml且终止浓度为0.0042 AGU/ml。将总计100μl的包括标准品的各稀释液转入96-孔平底平板。将 50微升的20mg/ml麦芽糖溶液加入到各孔中,然后在25℃下温育180分 钟。在温育步骤完成时,向各孔中加入100μl的0.06N NaOH溶液以使反 应猝灭。从各孔中转移总计30μl并且铺板入新的96-孔平板,随后向各孔 中添加200μl液体葡萄糖(氧化酶)试剂(Pointe Scientific,Inc,Lincoln Park, Michigan,USA)并且在环境温度下温育8分钟。在温育完成时,使用Spectra Max349(Molecular Devices,Sunnyvale,CA)对96-孔平板测定490nm处的吸 收度。从产生的标准曲线中外推测定药品浓度。通过用未添加麦芽糖的液 体葡萄糖试剂独立地测定样品肉汤中的葡萄糖校准培养基中存在的葡萄糖 含量。从来自添加麦芽糖底物的试剂的值中扣除吸收度。

全部20个转化体表达α-葡糖苷酶。产量最高的转化体为转化体 13.1.G24。在第6天表达达到峰值(附图)。未转化的菌株Fusarium venenatum WTY842-1-11没有可检测到的活性。将转化体13.1.G24菌株重新命名为 Fusarium venenatum JLin725。

实施例10:Fusarium venenatum JLin725的发酵

通过发酵评价Fusarium venenatum JLin725产生α-葡糖苷酶的能

所有的发酵均在2-阶段液体接种中开始。第一步在500ml不带挡板的 用橡胶海绵塞封盖的摇瓶中的100ml Vogel Salts培养基中进行。该培养 基由每升20ml无菌过滤(0.2μm直径孔径,Fisher Millipore)Vogel盐储备溶 液(以50X终浓度制备)、16.5g磷酸氢铵和50g蔗糖组成,使用5N NaOH 将其pH缓冲至6.50,此后高压灭菌25分钟。在高压灭菌前,当溶液冷却 时,加入来自无菌过滤的250mg/ml储备溶液中的2.5ml BASTA至终浓度 为6mg/ml。

然后给摇瓶中接种从新鲜的7日龄琼脂培养平板上切下的约1cm2孢 塞。然后将摇瓶在200rpm和28℃下孵育72小时。

另外使用100ml SY50培养基在加有硅橡胶海绵塞的500ml摇瓶中制 备第二阶段接种物。给第二阶段接种物中接种0.3ml来自第一阶段接种物 的培养物。然后将这些接种物在28℃,200rpm下孵育约48小时。

将补料分批发酵罐设立在Applikon 3L加套的玻璃生物反应器中。由自 来水制成的培养基由每升20g蔗糖、2g MgSO4·7H2O、2g KH2PO4、2g柠 檬酸、5.6g(NH4)2HPO4、0.5ml、200X AMG微量金属、0.5g CaCl2·2H2O 和30ml维生素储备溶液(在去离子水中的0.15g硫胺HCl、0.08g核黄素、 0.4g烟酸、0.5g泛酸、0.005g生物素、0.05g叶酸、0.1g吡哆醛-HCl, 在加热过程中混合并且通过0.45μm滤膜(Millipore,Bedford,MA)过滤)组 成。用5N NaOH将该批量混合物调节至pH6.50。

在填充1800ml培养基前向各罐中分别加入总计20g大豆浓缩物。然 后松弛地安装磁头板并且开始中度搅拌以便充分混合且湿润大豆粉。此时 还加入约0.9ml pluronic acid以便将发泡减少到最低限度。

在2升塑料瓶中制成由495g麦芽糖和自来水组成的进料以使最终质量 达1500g。在混合前加入Pluronic acid(1ml)。

使用15%NH4OH溶液和5N H3PO4在紧密加盖的瓶中将pH控制在6.25 +/-0.25。以1200rpm搅拌和1vvm气流与29℃+/-1℃下的温度操作罐。 从第二阶段接种物中的接种使用无菌转入注入罐的60ml注射器的50ml培 养物进行。

在pH降至控制带的基础值后且然后再次升至控制带的最高值后,在约 19小时后开始进料,因为这表明批量营养物耗尽。进料以3.78g/L-小时的 恒定值持续发酵期间。将DO浓度维持高于30%。

实施例11:Fusarium venenatumα-葡糖苷酶的纯化和表征

使用麦芽糖作为底物测定α-葡糖苷酶活性。将25μl样品与375μl在pH 5.0的50mM乙酸盐中的1.1%麦芽糖溶液混合。将该混合物在37℃下温育 10分钟。然后加入100μl的1M Tris并且将所得溶液的部分转入Eppendorf 管并且放入沸水中3-4分钟以使麦芽糖的酶促水解猝灭。为了测定释放的葡 萄糖,将20μl的等分部分转入96-孔微量滴定板的孔并且与200μl葡糖氧 化酶-辣根过氧化物酶-2,2’-连氮基-双(3-乙基苯并噻唑啉-6-磺酸)二铵盐溶 液(在pH7.0的100mM磷酸钠中的0.6g/l葡糖氧化酶、0.02g/l辣根过氧化 物酶和1.0g/l2,2’-连氮基-双(3-乙基苯并噻唑啉-6-磺酸)二铵盐)混合。在室 温下温育30分钟后,使用Spectra Max 349(Molecular Devices,Sunnyvale,CA) 测定420nm处的吸收度。

使用BCA Protein Assay Reagent(Pierce,Rockford,IL),按照制造商的说 明测定蛋白质浓度。

从通过如实施例10中所述培养Fusarium venenatum菌株 WTY842-1-11(Atri5,amdS+)产生的发酵肉汤上清液中纯化Fusarium venenatumα-葡糖苷酶。

通过离心完整发酵肉汤制备培养肉汤上清液(约0.45升)且然后使用安 装了0.22mm滤器的Nalgene Filterware过滤,用100mM Tris-HCl pH8.0缓 冲液稀释并且使用安装了PM10超滤性膜的Amicon Spiral Ultrafiltration System浓缩。最终制品具有8.0的pH和7.2mS的电导率。使其上含有用 100mM Tris-HCl pH8.0缓冲液预平衡的约200ml Q-Sepharose,Big Beads(Pharmacia Biotech AB,Uppsala,Sweden)的24×390mm柱上。使用在 50100mM Tris-HCl pH8.0缓冲液中0-0.8M NaCl的700ml梯度洗脱具有 α-葡糖苷酶活性的蛋白质。收集具有α-葡糖苷酶活性的级分,使用PM10 膜脱盐并且使用100mM Tris-HCl pH8.0缓冲液平衡。

然后将收集的溶液上用100mM Tris-HCl pH8.0缓冲液预平衡的20ml Pharmacia MonoQ Beads柱。收集具有α-葡糖苷酶活性的级分,浓缩并且使 用100mM Tris-HCl pH8.0,1.7M(NH4)2SO4缓冲液平衡。

最终,将浓缩样品上用含有1.7M(NH4)2SO4的100mM Tris-HCl pH8.0 缓冲液预平衡的Pharmacia Phenyl Superose5/5预填充的7×50mm柱 (Pharmacia Biotech AB,Uppsala,Sweden)。使用在100mM Tris-HCl pH8.0缓 冲液中1.7-0M(NH4)2SO4的300ml梯度洗脱具有α-葡糖苷酶活性的蛋白 质。通过标准SDS-PAGE和天然凝胶分析含有α-葡糖苷酶活性的级分并且 收集。

表1概括了α-葡糖苷酶的纯化。

表1.α-葡糖苷酶纯化的概括

  体积   (ml)   蛋白质   (mg)   %总活性1   最初上清液   775   891   100   在Q-琼脂糖上乙酸盐洗涤(除   去色素)   250   95   82.3   Q-琼脂糖柱色谱法   264   32   82.3   MonoQ柱色谱法   90   15   51.9   Phenyl Superose柱色谱法   21   9   41.0

使用麦芽糖作为底物在pH5.0下测定1α-葡糖苷酶活性(AMG活性-试验 方案。将麦芽糖溶液预加热至37℃。在室温下与酶进行温育)。

运行天然凝胶(BioRad Precast Polyacrylamide Gel,Bio-Rad Laboratories, Inc.,Hercules,CA)以便测定α-淀粉酶是否由几种亚单位组成。样品缓冲液为 4.0ml 0.5M Tris-HCl pH8.8、0.5ml 0.1%溴酚蓝、2.0ml甘油和蒸馏水至10.0 ml。试验缓冲液由调节至pH8.3的每升2.9g Tris碱和14.4g甘氨酸组成。 使凝胶在200V下运行1小时并且如实施例9中所述染色。天然凝胶仅显示 出具有约140kDa分子量的1个带,提示该酶并不由亚单位组成。

最佳pH.使用上述活性试验在不同pH值和37℃下和50mM乙酸盐缓 冲液/50mM磷酸盐缓冲液中测定纯化的Fusarium venenatumα-葡糖苷酶的 特异性活性。

Fusarium venenatumα-葡糖苷酶在约4.5-约6.0,优选约4.7-约5.7, 更优选约4.8-约5.5,最优选约5.0-约5.3且甚至最优选在pH5.0的最佳 pH下具有如附图4中所示的活性。

热稳定性.通过在下列温度下的pH5.0的50mM乙酸钠中将α-葡糖苷酶 温育5分钟测定纯化的Fusarium venenatumα-葡糖苷酶的热稳定性:35、45、 50、55、60、65、71和100。在37℃下和水浴中将作为底物的麦芽糖(1.1%: 375μl)温育5分钟。将酶样品的等分部分与底物混合并且在37℃下测定特 异性活性。

Fusarium venenatumα-葡糖苷酶如附图5中所示具有约达65℃良好的热 稳定性(约77%残留)。该酶在该温度下和pH5.0的50mM乙酸盐缓冲液中 5分钟后仅失去了23%的活性,而在100℃下失去了全部的活性。

动力学参数.测定用纯化的Fusarium venenatumα-葡糖苷酶对麦芽糖进 行特异性水解的动力学参数。

将安装了CarboPac PA10 4×250mm柱和ED50电化学检测器 (Sunnyvale,CA)的Dionex BioLC HPLC装置用于定量检测来自麦芽糖水解 的葡萄糖。将氢氧化钠溶液(200mM)用作液相。该方法提供了在约0.01mM 葡萄糖水平下的精确测定。校准曲线在0mM-1.2mM葡萄糖之间为线性。

温育混合物在37℃下含有10ml0.17-5.7mM范围的麦芽糖溶液。通过 添加10μlα-葡糖苷酶溶液启动酶促反应。通过将1ml等分部分放入沸水中 2.5分钟且然后放入冰中至少30分钟终止该酶促反应。

使用105.8kDa的分子量计算kcat值。

常用于测定动力学参数的倒数(reciprocal)图对该酶而言并非线性的。 在升高的麦芽糖浓度下,水解反应的速度(葡萄糖蓄积)显著下降。

在α-葡糖苷酶-催化的麦芽糖水解中观察到的速度下降可能是因底物抑 制所致(Segel,I.H.Enzyme Kinetics.Behavior和Analysis of Rapid Equilibrium和Steady-State Enzyme Systems.1975,John Wiley&Sons)或可能 是转糖基化反应中葡萄糖利用的结果。当麦芽糖浓度增加时,它成为葡萄 糖分子的受体。葡萄糖与麦芽糖之间的转糖基化反应产生潘糖(6-O-α-D-糖 基麦芽糖)。产生麦芽糖和异麦芽糖的两个葡萄糖分子之间相互作用的可能 性较低,这是因为麦芽糖在“起始速率”方案中的浓度低。CarboPac PA10柱 允许从寡糖类中分离葡萄糖,但无法分离麦芽糖和潘糖。

从图中估计Fusarium venenatumα-葡糖苷酶的动力学参数。在pH5.0 和37℃下,Fusarium venenatumα-葡糖苷酶的Km为0.13mM且kcat为17 s-1(底物间距0.17mM-1.0mM)。

如上所述,底物间距并非始终是最佳的。同时,检测限不允许施用较 低的底物浓度。Fusarium venenatumα-葡糖苷酶表现出可能归因于转糖基化 活性的强“底物抑制”。

生物材料的寄存

已经根据布达佩斯条约的规定将下列生物材料保藏在农业研究机构保 藏中心(Agricultural Research Service Patent Culture Collection),Northern Regional Research Center,1815 University Street,Peoria,Illinois,61604,并且 给予如下的保藏号:

保藏物                保藏号            保藏日期

大肠杆菌pFD11F2       NRRL B-30753      2004年7月1日

该菌株于下述条件下保藏:确保在本专利申请未决期间,由专利与商 标委员依据37C.F.R.§1.14和35U.S.C.§122授权的人能够获得该培养物。 该保藏物为所保藏菌株的基本上纯的培养物。在提交了该申请的副本,或 其后续文本的国家,依据该外国专利法律的要求,可以获得该保藏物。然 而,应当理解,保藏物的获得并不构成对实施本发明的许可,实施本发明 是对政府行为所授予的专利权的侵犯。

本文所描述和要求保护的发明并不限于由本文公开的具体方面的范 围,因为这些方面旨在例证说明本发明的若干方面。任何等同的实施方案 都将在本发明的范围之内。事实上,除了本文所显示和描述的那些之外, 由在前描述对于本领域技术人员来说本发明的各种改进将是显而易见的。 这些改进也将落入随附的权利要求的范围之内。在出现抵触的情况下,以 包括定义的本说明书的公开来调控。

本文引用了多种参考文献,将其全部内容并入作为参考。

发明背景

  申请人代理人档案号 国际申请号  PCT/US2005/023987
关于微生物保藏的说明
(细则13之二)
  A.对说明书第 48页,第 4行所述的微生物的说明。   B.保藏事项                                                                    其它保藏在补充页中□   保藏单位名称   农业研究机构保藏中心Agricultural Research Service Patent Culture Collection(NRRL)   保藏单位地址   (包括邮政编码和国名)   美国  伊利诺斯州  皮奥里亚市   大学街1815号  北方区域研究中心   邮政编码:61604   Northern Regional Research Center,1815 University Street,Peoria,IL 61604,US   保藏日期    2004年07月01日   保藏编号    B-30753   C.补充说明(必要时)                                                              本栏内容有补充页□   在专利申请期间,关于欧洲和澳大利亚专利申请的指定,所保藏的微生物的样品只向由要求此样品的人所指定的独立   专家提供(Rule 28(4)EPC/Regulation 3.25 of Australia Statutory Rule 1991 No.71)。   D.本说明是为下列指定国作的(如果说明不是为所有指定国而作的)   E.补充说明(必要时)   下列说明将随后向国际局提供(写出说明的类别,例如:“保藏的编号”)

序列表
<110>诺维信股份有限公司(Novozymes,Inc.)
<120>具有α-葡糖苷酶活性的多肽类和编码它们的多核苷酸
<130>10661.204-WO
<150>60/586,103
<151>2004-07-06
<160>10
<170>PatentIn version 3.2
<210>1
<211>2883
<212>DNA
<213>Fusarium venenatum
<400>1
atgttcttca agaagctgct cacttccgct gcagccctca caggcactgc gcttgcccag     60
agcaaggcag gcgtcgaaga cctcgacaag ccccgcagag accttttcga aaaggacctc    120
tccaagtgtc ccggctacaa agccacaaag cactgggaga cccgatctgg cttttacgct    180
gacctttccc tcgcgggtca ggcctgtgat gtctacggaa tcgatctgcc tgagctgaaa    240
cttgaggttg aatatcagac cgaagaccga ctgcatgtca agatcttgga tacgaacaac    300
actgtttacc aagtcccaga tgacgttttc cctcgtcctg ggctcggaca gtgggcttca    360
cccaaaaact cgaggctcaa gtttgacttc aaggcggatc ctttctcctt caccgtttcc    420
aggagggata ccgatgaagt gctttttgat acctcgggca gcgatcttgt ctttgagagt    480
cagtacgtct atctcaagac caagcttccc gatcgccctc atctctacgg tctcggcgag    540
catagcgatc ctttcatgct gaactcgacc aactacaccc gcactatcta cacccgcgac    600
tcatatggta cacccaaggg tcaaaacctc tatggagctc atcccatcta cttcgatcat    660
cgggagaagg gcactcacgg tgttttcctt ctcaactcca acggcatgga cgttttcatc    720
gataagaaga atggccagca gtttttggag tataatatta ttggcggtgt tctcgacttt    780
tacttcgttg ctgggccatc gcctcgtgat gtcgcgaagc agtacgccga gattaccact    840
ctacccctca tgacgcctta ctggggtctc ggttttcacc agtgccgata cggctaccgt    900
gatgtttatg aggttgctgc tgttgtagcc aactattccg ctgctggaat cccactcgag    960
acgatgtgga cagatattga ctacatggac cgtcgacgca tcttcaccat tgatccagag   1020
cgcttccctg cagacaagta caaggacctt gttgatacga tccatgcacg agaccagaag   1080
tacatcgtca tggttgaccc agccgtatat gacatggaat ctaatccggc ccttgattca   1140
ggcctcgagt acgacacttt catgaaagag cccaacggct ccgactaccg aggtgttgtg       1200
tgggctggac ccagtgtctt ccctgactgg ttcaacccca actcacaaaa gtactggaac       1260
gagctctttg ccaatttctt cgatggcgag aacggtcctg atatcgatgg tctctggatt       1320
gatatgaatg agcctgcaaa cttcttcaac cgtccttacc ctggcaacaa caccactcct       1380
gagaagttcg cagagattga tggtgatccc cccaagccgc ctcccgtccg tgatggtcct       1440
cctgctccta tccctggctt ccccgacagt ctacagcctg catcttctcg tcttaacacg       1500
cgtgagtctg tttccatcgc caagaccacc atccacaagc gctccatggc agcccgcaca       1560
acatcccaca gccgtggcgt tggacagtgg gctaccaaga agcactgggg acagaacaag       1620
tacggccgcc ctggctccag ctggccaaat ggcaagaaga ccggatctgg ttgtggcccg       1680
aatgagtgca agggtcttcc caatcgagag ctcatccagc ctccctacat gatccagaac       1740
ggcgcgggac cgacgcttgc tgacggcact accgataccg atcttgtgca gagcggagat       1800
tacctccagt atgacacaca caacttgtac ggcgctcaga tgtcaacaca ttcgcacaat       1860
gccatgcgtg ctcgacgtcc cgacaagcgc gctcttgtta tcacgcgtag cacctttgct       1920
ggttctggca aggatgtctc gcattggctt ggtgacaacc tctcgatctg ggatcagtac       1980
cgctttagca ttggtcagct tctccaattt gcatccatct accaaattcc tgttgttggt       2040
gccgatgtct gtggtttcgg cggtaacgtc actgagactc tatgcgctag atgggctacg       2100
cttggaagtt tctacacttt cttccgtaac cacaacgaga tcactgctgc atcacaagaa       2160
ttctaccgct ggcccaaggt cgccgaggca gcccgtactg gtatcgccat tcgttacaag       2220
ctcctcgatt acatctacac tgccatttac aagcagaacc agacaggcac ccctactctc       2280
aaccctctgt tcttcaacta ccccaacgac aagaacacat actccatcga ccttcagttc       2340
ttttatggtg atggcatcct cgtcagccct gttacaaagg agaacagtac tgagttggaa       2400
tattacctcc ctgatgacat tttctacgag tggtccaccg gaaagcctgt tcgtggtact       2460
ggttcatatg agtctgcaga ggttgagctc actgatatca tggttcatta caagggtggc       2520
atcatctacc cccagcgtgt cgacagtgcc aacactacca ccgctctccg caagaagggt       2580
ttcaaccttg ttattgcacc cggtctgaac ggtaaggctt ctggatcttt gtacctcgac       2640
gatggagagt ctgtcgtcca ggacgctgta tccgagattg acttcactta caccaagggc       2700
aagctgagta tgggtggaag ctttgagtac gatgccggtg tcaagattga gacgatcacc       2760
attcttggtg ttgaaaagca gcccaagggc accgatcatg cagagtatga ctctgagaac       2820
aagaagctga tctttgcggc ggatgtacct ttgacgaaga agtgttatgt ggatctcttc       2880
tga                                                                     2883
<210>2
<211>960
<212>PRT
<213>Fusarium venenatum
<400>2
Met Phe Phe Lys Lys Leu Leu Thr Ser Ala Ala Ala Leu Thr Gly Thr
1               5                   10                  15
Ala Leu Ala Gln Ser Lys Ala Gly Val Glu Asp Leu Asp Lys Pro Arg
            20                  25                  30
Arg Asp Leu Phe Glu Lys Asp Leu Ser Lys Cys Pro Gly Tyr Lys Ala
        35                  40                  45
Thr Lys His Trp Glu Thr Arg Ser Gly Phe Tyr Ala Asp Leu Ser Leu
    50                  55                  60
Ala Gly Gln Ala Cys Asp Val Tyr Gly Ile Asp Leu Pro Glu Leu Lys
65                  70                  75                  80
Leu Glu Val Glu Tyr Gln Thr Glu Asp Arg Leu His Val Lys Ile Leu
                85                  90                  95
Asp Thr Asn Asn Thr Val Tyr Gln Val Pro Asp Asp Val Phe Pro Arg
            100                 105                 110
Pro Gly Leu Gly Gln Trp Ala Ser Pro Lys Asn Ser Arg Leu Lys Phe
        115                 120                 125
Asp Phe Lys Ala Asp Pro Phe Ser Phe Thr Val Ser Arg Arg Asp Thr
    130                 135                 140
Asp Glu Val Leu Phe Asp Thr Ser Gly Ser Asp Leu Val Phe Glu Ser
145                150                  155                 160
Gln Tyr Val Tyr Leu Lys Thr Lys Leu Pro Asp Arg Pro His Leu Tyr
                165                 170                 175
Gly Leu Gly Glu His Ser Asp Pro Phe Met Leu Asn Ser Thr Asn Tyr
            180                 185                 190
Thr Arg Thr Ile Tyr Thr Arg Asp Ser Tyr Gly Thr Pro Lys Gly Gln
        195                 200                 205
Asn Leu Tyr Gly Ala His Pro Ile Tyr Phe Asp His Arg Glu Lys Gly
    210                 215                 220
Thr His Gly Val Phe Leu Leu Asn Ser Asn Gly Met Asp Val Phe Ile
225                 230                 235                 240
Asp Lys Lys Asn Gly Gln Gln Phe Leu Glu Tyr Asn Ile Ile Gly Gly
                245                 250                 255
Val Leu Asp Phe Tyr Phe Val Ala Gly Pro Ser Pro Arg Asp Val Ala
            260                 265                 270
Lys Gln Tyr Ala Glu Ile Thr Thr Leu Pro Leu Met Thr Pro Tyr Trp
        275                  280                285
Gly Leu Gly Phe His Gln Cys Arg Tyr Gly Tyr Arg Asp Val Tyr Glu
    290                 295                 300
Val Ala Ala Val Val Ala Asn Tyr Ser Ala Ala Gly Ile Pro Leu Glu
305                 310                 315                 320
Thr Met Trp Thr Asp Ile Asp Tyr Met Asp Arg Arg Arg Ile Phe Thr
                325                 330                 335
Ile Asp Pro Glu Arg Phe Pro Ala Asp Lys Tyr Lys Asp Leu Val Asp
            340                 345                 350
Thr Ile His Ala Arg Asp Gln Lys Tyr Ile Val Met Val Asp Pro Ala
        355                 360                 365
Val Tyr Asp Met Glu Ser Asn Pro Ala Leu Asp Ser Gly Leu Glu Tyr
    370                 375                 380
Asp Thr Phe Met Lys Glu Pro Asn Gly Ser Asp Tyr Arg Gly Val Val
385                 390                 395                 400
Trp Ala Gly Pro Ser Val Phe Pro Asp Trp Phe Asn Pro Asn Ser Gln
                405                 410                 415
Lys Tyr Trp Asn Glu Leu Phe Ala Asn Phe Phe Asp Gly Glu Asn Gly
            420                 425                 430
Pro Asp Ile Asp Gly Leu Trp Ile Asp Met Asn Glu Pro Ala Asn Phe
        435                 440                 445
Phe Asn Arg Pro Tyr Pro Gly Asn Asn Thr Thr Pro Glu Lys Phe Ala
    450                 455                 460
Glu Ile Asp Gly Asp Pro Pro Lys Pro Pro Pro Val Arg Asp Gly Pro
465                 470                 475                 480
Pro Ala Pro Ile Pro Gly Phe Pro Asp Ser Leu Gln Pro Ala Ser Ser
                485                 490                 495
Arg Leu Asn Thr Arg Glu Ser Val Ser Ile Ala Lys Thr Thr Ile His
            500                 505                 510
Lys Arg Ser Met Ala Ala Arg Thr Thr Ser His Ser Arg Gly Val Gly
        515                 520                 525
Gln Trp Ala Thr Lys Lys His Trp Gly Gln Asn Lys Tyr Gly Arg Pro
    530                 535                 540
Gly Ser Ser Trp Pro Asn Gly Lys Lys Thr Gly Ser Gly Cys Gly Pro
545                 550                 555                 560
Asn Glu Cys Lys Gly Leu Pro Asn Arg Glu Leu Ile Gln Pro Pro Tyr
                565                 570                 575
Met Ile Gln Asn Gly Ala Gly Pro Thr Leu Ala Asp Gly Thr Thr Asp
            580                 585                 590
Thr Asp Leu Val Gln Ser Gly Asp Tyr Leu Gln Tyr Asp Thr His Asn
        595                 600                 605
Leu Tyr Gly Ala Gln Met Ser Thr His Ser His Asn Ala Met Arg Ala
    610                 615                 620
Arg Arg Pro Asp Lys Arg Ala Leu Val Ile Thr Arg Ser Thr Phe Ala
625                 630                 635                 640
Gly Ser Gly Lys Asp Val Ser His Trp Leu Gly Asp Asn Leu Ser Ile
                645                 650                 655
Trp Asp Gln Tyr Arg Phe Ser Ile Gly Gln Leu Leu Gln Phe Ala Ser
            660                 665                 670
Ile Tyr Gln Ile Pro Val Val Gly Ala Asp Val Cys Gly Phe Gly Gly
        675                 680                 685
Asn Val Thr Glu Thr Leu Cys Ala Arg Trp Ala Thr Leu Gly Ser Phe
    690                 695                 700
Tyr Thr Phe Phe Arg Asn His Asn Glu Ile Thr Ala Ala Ser Gln Glu
705                 710                 715                 720
Phe Tyr Arg Trp Pro Lys Val Ala Glu Ala Ala Arg Thr Gly Ile Ala
                725                 730                 735
Ile Arg Tyr Lys Leu Leu Asp Tyr Ile Tyr Thr Ala Ile Tyr Lys Gln
            740                 745                 750
Asn Gln Thr Gly Thr Pro Thr Leu Asn Pro Leu Phe Phe Asn Tyr Pro
        755                 760                 765
Asn Asp Lys Asn Thr Tyr Ser Ile Asp Leu Gln Phe Phe Tyr Gly Asp
    770                 775                 780
Gly Ile Leu Val Ser Pro Val Thr Lys Glu Asn Ser Thr Glu Leu Glu
785                 790                 795                 800
Tyr Tyr Leu Pro Asp Asp Ile Phe Tyr Glu Trp Ser Thr Gly Lys Pro
                805                 810                 815
Val Arg Gly Thr Gly Ser Tyr Glu Ser Ala Glu Val Glu Leu Thr Asp
            820                 825                 830
Ile Met Val His Tyr Lys Gly Gly Ile Ile Tyr Pro Gln Arg Val Asp
        835                 840                 845
Ser Ala Asn Thr Thr Thr Ala Leu Arg Lys Lys Gly Phe Asn Leu Val
    850                 855                 860
Ile Ala Pro Gly Leu Asn Gly Lys Ala Ser Gly Ser Leu Tyr Leu Asp
865                 870                 875                 880
Asp Gly Glu Ser Val Val Gln Asp Ala Val Ser Glu Ile Asp Phe Thr
                885                 890                 895
Tyr Thr Lys Gly Lys Leu Ser Met Gly Gly Ser Phe Glu Tyr Asp Ala
            900                 905                 910
Gly Val Lys Ile Glu Thr Ile Thr Ile Leu Gly Val Glu Lys Gln Pro
        915                 920                 925
Lys Gly Thr Asp His Ala Glu Tyr Asp Ser Glu Asn Lys Lys Leu Ile
    930                 935                 940
Phe Ala Ala Asp Val Pro Leu Thr Lys Lys Cys Tyr Val Asp Leu Phe
945                 950                 955                 960
<210>3
<211>27
<212>DNA
<213>Fusarium venenatum
<400>3
gcaggaaaga acaagtgagc aaaaggc                               27
<210>4
<211>27
<212>DNA
<213>Fusarium venenatum
<400>4
gccttttgct cacttgttct ttcctgc                               27
<210>5
<211>15
<212>DNA
<213>Fusarium venenatum
<400>5
dcctacatgt ttaat                                            15
<210>6
<211>13
<212>DNA
<213>Fusarium venenatum
<400>6
dtaaacatgt agg                                              13
<210>7
<211>21
<212>DNA
<213>Fusarium venenatum
<400>7
aggcctcacc catctcaaca c                                     21
<210>8
<211>21
<212>DNA
<213>Fusarium venenatum
<400>8
acatgttggt gatagcagtg a                                    21
<210>9
<211>36
<212>DNA
<213>Fusarium venenatum
<400>9
cactgctatc accaacatgt tcttcaagaa gctgct                    36
<210>10
<211>35
<212>DNA
<213>Fusarium venenatum
<400>10
ccaacaaggt atttaattaa tcagaagaga tccac                     35
QQ群二维码
意见反馈