首页 / 专利库 / 植物学 / 植物 / 纤维二糖水解酶变体和编码它们的多核苷酸

纤维二糖解酶变体和编码它们的多核苷酸

阅读:264发布:2021-12-02

专利汇可以提供纤维二糖解酶变体和编码它们的多核苷酸专利检索,专利查询,专利分析的服务。并且本 发明 涉及 纤维 二糖 水 解 酶变体和编码它们的多核苷酸。本发明还涉及编码这些变体的多核苷酸;包括这些多核苷酸的核酸构建体、载体以及宿主细胞;以及使用这些变体的方法。,下面是纤维二糖解酶变体和编码它们的多核苷酸专利的具体信息内容。

1.一种亲本纤维二糖解酶的变体,该变体在对应于SEQ ID NO:2的成熟多肽的位置
199的位置处进行了缺失,或在对应于SEQ ID NO:2的成熟多肽的位置198的位置处进行了取代,其中所述在对应于位置198的位置处的取代是用Ala进行的,其中该变体具有纤维二糖水解酶活性,并且其中该变体与亲本纤维二糖水解酶的成熟多肽具有至少99%,但小于
100%序列一致性,并且其中所述亲本纤维二糖水解酶选自下组:
(a)多肽,该多肽与SEQ ID NO:2、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22或SEQ ID NO:73的成熟多肽具有至少99%序列一致性;和
(b)SEQ ID NO:2、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22或SEQ ID NO:73的成熟多肽。
2.权利要求1所述的变体,该变体还在对应于SEQ ID NO:2的成熟多肽的位置197的位置处进行了取代,其中所述在对应于位置197的位置处的取代是用Ala进行的。
3.权利要求1所述的变体,该变体还在对应于SEQ ID NO:2的成熟多肽的位置200的位置处进行了取代,其中所述在对应于位置200的位置处的取代是用Ala、Gly或Trp进行的。
4.权利要求1-3中任一项所述的变体,其中该亲本是杂合或嵌合多肽,其中该亲本的水化合物结合结构域被不同的碳水化合物结合结构域或其中异源碳水化合物结合结构域融合至该亲本的融合蛋白替换。
5.权利要求1-4中任一项所述的变体,该变体相对于该亲本具有增加的比性能。
6.一种分离的多核苷酸,其编码权利要求1-5中任一项所述的变体。
7.一种产生纤维二糖水解酶变体的方法,该方法包括:(a)在适于该变体表达的条件下培养包含权利要求6所述的多核苷酸的宿主细胞,和任选地(b)回收该变体。
8.一种产生权利要求1-5中任一项的变体的方法,该方法包括:(a)在有助于该变体产生的条件下培养包含多核苷酸的转基因植物或植物细胞,所述多核苷酸编码该变体;和任选地(b)回收该变体。
9.一种用于获得纤维二糖水解酶变体的方法,该方法包括:(a)向亲本纤维二糖水解酶在对应于SEQ ID NO:2的成熟多肽的位置199的位置处中引入缺失,或在对应于SEQ ID NO:
2的成熟多肽的位置198的位置处引入取代,其中所述在对应于位置198的位置处的取代是用Ala进行的,而且其中该变体具有纤维二糖水解酶活性,和任选地(b)回收该变体,并且其中所述亲本纤维二糖水解酶选自下组:
(a)多肽,该多肽与SEQ ID NO:2、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22或SEQ ID NO:73的成熟多肽具有至少99%序列一致性;和
(b)SEQ ID NO:2、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22或SEQ ID NO:73的成熟多肽。
10.权利要求9所述的方法,还对亲本纤维二糖水解酶在对应于SEQ ID NO:2的成熟多肽的位置197的位置处进行了取代,其中所述在对应于位置197的位置处的取代是用Ala进行的。
11.权利要求9所述的方法,还对亲本纤维二糖水解酶在对应于SEQ ID NO:2的成熟多肽的位置200的位置处进行了取代,其中所述在对应于位置200的位置处的取代是用Ala、Gly或Trp进行的。
12.一种组合物、全培养液配制品或细胞培养组合物,其包含权利要求1-5中任一项所述的变体。
13.一种用于降解纤维素材料的方法,该方法包括:在权利要求1-5中任一项所述的变体的存在下,用酶组合物处理该纤维素材料。
14.一种用于生产发酵产物的方法,该方法包括:
(a)在权利要求1-5中任一项所述的变体的存在下,用酶组合物糖化纤维素材料;
(b)用一种或多种发酵生物对糖化的纤维素材料进行发酵,以产生发酵产物;并且(c)从发酵中回收该发酵产物。
15.一种发酵纤维素材料的方法,该方法包括:用一种或多种发酵微生物发酵该纤维素材料,其中该纤维素材料是在权利要求1-5中任一项所述的变体的存在下用酶组合物糖化的。

说明书全文

纤维二糖解酶变体和编码它们的多核苷酸

[0001] 本发明申请是基于申请日为2014年03月07日,申请号为201480011264.5(国际申请号为PCT/US2014/022068)、名称为“纤维二糖水解酶变体和编码它们的多核苷酸”的发明专利申请的分案申请。
[0002] 对序列表的引用
[0003] 本申请包含一个计算机可读形式的序列表,将其通过引用结合在此。
[0004] 发明背景发明领域
[0005] 本发明涉及纤维二糖水解酶变体、编码这些变体的多核苷酸以及产生和使用这些变体的方法。
[0006] 相关技术说明
[0007] 纤维素是单糖葡萄糖通过β-1,4-键共价连接的一种聚合物。许多生物产生水解β-连接的葡聚糖的酶。这些酶包括内切葡聚糖酶、纤维二糖水解酶、以及β-葡糖苷酶。内切葡聚糖酶在任意位置消化纤维素聚合物,使其打开而被纤维二糖水解酶攻击。纤维二糖水解酶从纤维素聚合物的末端顺序地释放纤维二糖分子。纤维二糖是葡萄糖的一种水溶性β-1,4-连接二聚体。β-葡糖苷酶将纤维二糖水解成葡萄糖。
[0008] 将木质纤维素原料转化成乙醇具有如下优点,即易于获得大量原料、避免燃烧或填埋材料的期望性、以及乙醇燃料的清洁性。现在认为木材、农业废弃物、草本作物、和城市固体废物是生产乙醇的原料。这些材料主要由纤维素、半纤维素和木质素组成。一旦将木质纤维素转化成可发酵糖,例如葡萄糖,那么这些可发酵糖就可以容易地被酵母发酵成乙醇。
[0009] WO 2011/050037披露了具有改进的热稳定性的土生梭孢壳霉(Thielavia terrestris)纤维二糖水解酶变体。WO 2011/050037披露了具有改进的热稳定性的烟曲霉(Aspergillus fumigatus)纤维二糖水解酶变体。WO 2005/028636披露了红褐肉座菌Cel7A纤维二糖水解酶I的变体。WO 2005/001065披露了灰腐质霉Cel7A纤维二糖水解酶I、红褐肉座菌纤维二糖水解酶I和嗜热革节孢(Scytalidium thermophilium)纤维二糖水解酶I的变体。WO 2004/016760披露了红褐肉座菌Cel7A纤维二糖水解酶I的变体。美国专利号7,375,
197披露了里氏木霉纤维二糖水解酶I的变体。
[0010] 本领域需要具有改进的特性的纤维二糖水解酶变体以增加木质纤维素原料的糖化效率。
[0011] 本发明提供了具有增加的比性能的纤维二糖水解酶变体、编码这些变体的多核苷酸以及产生和使用这些变体的方法。
[0012] 发明概述
[0013] 本发明涉及分离的纤维二糖水解酶变体,这些变体在对应于SEQ ID NO:2的成熟多肽的位置197、198、199及200的一个或多个位置处包括一个改变,其中对应于位置197、198和200的一个或多个位置处的改变是一个取代并且对应于位置199的位置处的改变是一个缺失,并且其中这些变体具有纤维二糖水解酶活性。
[0014] 本发明还涉及编码这些变体的分离的多核苷酸;包含这些多核苷酸的核酸构建体、载体和宿主细胞;以及产生这些变体的方法。
[0015] 本发明还涉及用于降解纤维素材料的方法,这些方法包括:在本发明的纤维二糖水解酶变体的存在下,用一种酶组合物处理该纤维素材料。在一个方面中,这些方法进一步包括回收该降解的纤维素材料。
[0016] 本发明还涉及产生发酵产物的方法,这些方法包括:(a)在本发明的纤维二糖水解酶变体的存在下,用一种酶组合物糖化一种纤维素材料;(b)用一种或多种(例如,若干种)发酵微生物发酵该糖化的纤维素材料,以产生该发酵产物;并且(c)从发酵中回收该发酵产物。
[0017] 本发明还涉及发酵纤维素材料的方法,这些方法包括:用一种或多种(例如,若干种)发酵微生物发酵该纤维素材料,其中在本发明的纤维二糖水解酶变体的存在下,用一种酶组合物糖化该纤维素材料。在一个方面中,发酵纤维素材料产生发酵产物。在另一个方面中,这些方法进一步包括从发酵中回收该发酵产物。
[0018] 具体地,本发明涉及如下各项:
[0019] 1.一种纤维二糖水解酶变体,该变体在对应于SEQ ID NO:2的成熟多肽的位置197、198、199及200的一个或多个位置处包括一个改变,其中对应于位置197、198和200的一个或多个位置处的改变是一个取代并且对应于位置199的位置处的改变是一个缺失,其中该变体具有纤维二糖水解酶活性,并且其中该变体与亲本纤维二糖水解酶的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少95%、至少
96%、至少97%、至少98%或至少99%,但小于100%序列一致性。
[0020] 2.如项1所述的变体,其中该亲本纤维二糖水解酶选自下组,该组由以下各项组成:
[0021] (a)一种多肽,该多肽与SEQ ID NO:2、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、或SEQ ID NO:22的成熟多肽具有至少60%序列一致性;
[0022] (b)一种由以下多核苷酸编码的多肽,该多核苷酸在低严格条件下与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、或SEQ ID NO:21的成熟多肽编码序列或其全长互补体杂交;
[0023] (c)一种由以下多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、或SEQ ID NO:21的成熟多肽编码序列具有至少60%一致性;
[0024] (d)SEQ ID NO:2、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、或SEQ ID NO:22的成熟多肽;以及
[0025] (e)SEQ ID NO:2、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、或SEQ ID NO:22的成熟多肽的一个片段,该片段具有纤维二糖水解酶活性。
[0026] 3.如项1或2所述的变体,该变体在对应于位置197的位置处包括一个取代。
[0027] 4.如项3所述的变体,其中该取代是用Ala进行的。
[0028] 5.如项1-4中任一项所述的变体,该变体在对应于位置198的位置处包括一个取代。
[0029] 6.如项5所述的变体,其中该取代是用Ala进行的。
[0030] 7.如项1-6中任一项所述的变体,该变体在对应于位置200的位置处包括一个取代。
[0031] 8.如项7所述的变体,其中该取代是用Ala、Gly或Trp进行的。
[0032] 9.如项1-8中任一项所述的变体,该变体在对应于位置197的位置处包括一个缺失。
[0033] 10.如项1-9中任一项所述的变体,该变体在对应于SEQ ID NO:2的成熟多肽的位置处包括选自下组的一个或多个改变,该组由以下各项组成:N197A、N198A、A199*以及N200A,G,W。
[0034] 11.如项1-10中任一项所述的变体,其中该亲本是一种杂合或嵌合多肽,其中该亲本的水化合物结合结构域被一个不同的碳水化合物结合结构域或一种融合蛋白替换,其中一个异源碳水化合物结合结构域融合至该亲本。
[0035] 12.如项1-11中任一项所述的变体,该变体相对于该亲本具有增加的比性能。
[0036] 13.一种编码如项1-12中任一项所述的变体的分离的多核苷酸。
[0037] 14.一种产生纤维二糖水解酶变体的方法,该方法包括:(a)在适于该变体表达的条件下培养包含如项13所述的多核苷酸的宿主细胞,并且任选地(b)回收该变体。
[0038] 15.一种用如项13所述的多核苷酸转化的转基因植物、植物部分或植物细胞。
[0039] 16.一种产生如项1-12中任一项所述的变体的方法,该方法包括:(a)在有助于该变体产生的条件下培养包含编码该变体的多核苷酸的转基因植物或植物细胞;并且任选地(b)回收该变体。
[0040] 17.一种用于获得一种纤维二糖水解酶变体的方法,该方法包括:(a)在对应于SEQ ID NO:2的成熟多肽的位置197、198、199及200的一个或多个位置处向一种亲本纤维二糖水解酶中引入一个改变,其中对应于位置197、198和200的一个或多个位置处的改变是一个取代并且对应于位置199的位置处的改变是一个缺失,并且其中该变体具有纤维二糖水解酶活性,并且任选地(b)回收该变体。
[0041] 18.一种包含如项1-12中任一项所述的变体的组合物、全培养液配制品或细胞培养组合物。
[0042] 19.一种用于降解纤维素材料的方法,该方法包括:在如项1-12中任一项所述的变体的存在下,用一种酶组合物处理该纤维素材料。
[0043] 20.一种用于生产发酵产物的方法,该方法包括:
[0044] (a)在如项1-12中任一项所述的变体的存在下,用一种酶组合物糖化纤维素材料;
[0045] (b)用一种或多种发酵微生物对糖化的纤维素材料进行发酵,以产生发酵产物;并且
[0046] (c)从发酵中回收该发酵产物。
[0047] 21.一种发酵纤维素材料的方法,该方法包括:用一种或多种发酵微生物发酵该纤维素材料,其中在如项1-12中任一项所述的变体的存在下,用一种酶组合物糖化该纤维素材料。
[0048] 附图简要说明
[0049] 图1示出了在pH 5和25℃下5小时后,通过里氏木霉野生型纤维二糖水解酶I及其纤维二糖水解酶I M6变体从微晶纤维素产生糖。将结果针对在对照样品中确定的背景糖加以校正。
[0050] 图2示出了里氏木霉纤维二糖水解酶I M6变体和里氏木霉野生型纤维二糖水解酶I对纤维素分解酶组合物将碾磨的未洗涤的PCS水解24小时的影响。
[0051] 图3示出了里氏木霉纤维二糖水解酶I M6变体和里氏木霉野生型纤维二糖水解酶I对纤维素分解酶组合物将碾磨的未洗涤的预处理的玉米秸杆(PCS)水解48小时的影响。
[0052] 图4示出了里氏木霉纤维二糖水解酶I M6变体和里氏木霉野生型纤维二糖水解酶I对纤维素分解酶组合物将碾磨的未洗涤的PCS水解72小时的影响。
[0053] 图5示出了里氏木霉野生型纤维二糖水解酶I以及里氏木霉纤维二糖水解酶I A199*、N198A、N200G及N200W变体对微晶纤维素的水解。以mM计的值示出了在pH 5下、在25℃下并且在1100rpm下1小时后释放的纤维二糖。
[0054] 图6示出了Rasamsonia emersonii野生型纤维二糖水解酶I和R.emersonii纤维二糖水解酶I PC1-146变体对微晶纤维素的水解。以mM计的值示出了在pH 5下、在50℃下并且在1100rpm下1小时后释放的纤维二糖。
[0055] 图7示出了R.emersonii纤维二糖水解酶I变体和R.emersonii野生型纤维二糖水解酶I对纤维素酶组合物水解未洗涤的PCS(8%总固体)的影响的比较。
[0056] 图8示出了R.emersonii纤维二糖水解酶I PC1-146变体和R.emersonii野生型纤维二糖水解酶I对纤维素酶组合物水解未洗涤的PCS(20%总固体)的影响的比较。
[0057] 图9示出了水解过程中R.emersonii纤维二糖水解酶I  PC1-146变体与R.emersonii野生型纤维二糖水解酶I的比较。
[0058] 图10示出了同时糖化和发酵(SSF)过程中R.emersonii纤维二糖水解酶I PC1-146变体与Rasamsonia emersonii野生型纤维二糖水解酶I的比较。
[0059] 图11示出了R.emersonii野生型纤维二糖水解酶I、R.emersonii PC1-147融合纤维二糖水解酶I和R.emersonii纤维二糖水解酶I PC1-378变体对微晶纤维素的水解的比较。
[0060] 定义
[0061] 乙酰木聚糖酯酶:术语“乙酰木聚糖酯酶”意指一种羧酸酯酶(EC 3.1.1.72),其催化乙酰基自聚合木聚糖、乙酰化木糖、乙酰化葡萄糖、α-基乙酸酯以及对硝基苯基乙酸酯的水解。出于本发明的目的,在含有0.01%TWEENTM 20(聚乙烯脱水山梨醇单月桂酸酯)的50mM乙酸钠(pH 5.0)中使用0.5mM乙酸对硝基苯酯作为底物来测定乙酰木聚糖酯酶活性。
一个单位的乙酰木聚糖酯酶定义为能够在pH 5、25℃下每分钟释放1微摩尔的对硝基苯酚阴离子的酶的量。
[0062] 等位基因变体:术语“等位基因变体”意指占据同一染色体基因座的基因的两种或更多种可替代形式中的任一种。等位基因变异由突变天然产生,并且可以导致群体内的多态性。基因突变可以是沉默的(在所编码的多肽中没有改变)或可编码具有改变的基酸序列的多肽。多肽的等位基因变体是由基因的等位基因变体编码的多肽。
[0063] α-L-阿拉伯呋喃糖苷酶:术语“α-L-阿拉伯呋喃糖苷酶”意指一种α-L-阿拉伯呋喃糖苷阿拉伯呋喃水解酶(EC 3.2.1.55),其催化α-L-阿拉伯糖苷中的末端非还原性α-L-阿拉伯呋喃糖苷残基的水解。该酶对α-L-阿拉伯呋喃糖苷、含有(1,3)-和/或(1,5)-键的α-L-阿拉伯聚糖、阿拉伯糖基木聚糖、以及阿拉伯半乳聚糖起作用。α-L-阿拉伯呋喃糖苷酶还被称为阿拉伯糖苷酶、α-阿拉伯糖苷酶、α-L-阿拉伯糖苷酶、α-阿拉伯呋喃糖苷酶、多糖α-L-阿拉伯呋喃糖苷酶、α-L-阿拉伯呋喃糖苷水解酶、L-阿拉伯糖苷酶、或α-L-阿拉伯聚糖酶。出于本发明的目的,使用每ml的100mM乙酸钠(pH 5)中5mg的中等粘度小麦阿拉伯糖基木聚糖(麦格酶国际爱尔兰股份有限公司(Megazyme International Ireland,Ltd.),爱尔兰威克洛郡布瑞公司(Bray,Co.Wicklow,Ireland)以总体积200μl在40℃下持续30分钟,接着通过 HPX-87H柱色谱(伯乐实验室有限公司(Bio-Rad Laboratories,Inc.),赫拉
克勒斯,加州,美国)进行阿拉伯糖分析来测定α-L-阿拉伯呋喃糖苷酶活性。
[0064] α-葡糖酸糖苷酶:术语“α-葡糖醛酸糖苷酶”是指可催化α-D-葡萄糖苷酸水解成为D-葡萄糖醛酸酯和醇的一种α-D-葡萄糖苷酸葡萄糖醛酸水解酶(EC 3.2.1.139)。出于本发明的目的,根据德弗里斯(de Vries),1998,细菌学杂志(J.Bacteriol.)180:243-249来测定α-葡糖醛酸糖苷酶活性。一个单位的α-葡糖醛酸糖苷酶等于能够在pH 5、40℃下每分钟释放1微摩尔的葡糖醛酸或4-O-甲基葡糖醛酸的酶的量。
[0065] β-葡糖苷酶:术语“β-葡糖苷酶”意指一种β-D-葡糖苷葡糖水解酶(E.C.3.2.1.21),其催化末端非还原性β-D-葡萄糖残基的水解,并释放β-D-葡萄糖。出于本发明的目的,根据文丘里(Venturi)等人,2002,基础微生物学杂志(J.Basic Microbiol.)
42:55-66的程序使用对硝基苯基-β-D-吡喃葡萄糖苷作为底物来测定β-葡糖苷酶活性。一个单位的β-葡糖苷酶定义为在25℃、pH 4.8下,在含有0.01% 20的50mM柠檬酸
钠中从作为底物的1mM对硝基苯基-β-D-吡喃葡萄糖苷每分钟产生1.0微摩尔的对硝基苯酚阴离子。
[0066] β-木糖苷酶:术语“β-木糖苷酶”意指一种β-D-木糖苷木糖水解酶(E.C.3.2.1.37),其催化短β(1→4)-木寡糖的外水解,以从非还原性末端去除连续的D-木糖残基。出于本发明的目的,用1mM对硝基苯基-β-D-木糖苷作为底物,在含有0.01%TWEENTM 
20的100mM柠檬酸钠(pH 5,40℃)中,对β-木糖苷酶的活性进行测定。将一个单位的β-木糖苷酶定义为在40℃、pH 5下,在含有0.01% 20的100mM柠檬酸钠中从作为底物的
1mM对硝基苯基-β-D-木糖苷每分钟产生1.0微摩尔的对硝基酚根阴离子。
[0067] 碳水化合物结合模:术语“碳水化合物结合模块”意指提供碳水化合物结合活性的碳水化合物活性酶内的一个结构域(布拉斯顿(Boraston)等人,2004,生物化学杂志(Biochem.J.)383:769-781)。大多数已知的碳水化物结合模块(CBM)是具有离散折叠的连续氨基酸序列。碳水化合物结合模块(CBM)典型地发现于酶的N-末端处或C-末端的端点处。术语“碳水化合物结合模块”在此也与术语“碳水化合物结合结构域”互换使用。
[0068] 催化结构域:术语“催化结构域”意指一种酶的包含该酶的催化机器的区域。在一个方面中,催化结构域是SEQ ID NO:2的氨基酸1至429。在另一个方面中,催化结构域是SEQ ID NO:8的氨基酸1至437。在另一个方面中,催化结构域是SEQ ID NO:10的氨基酸1至440。在另一个方面中,催化结构域是SEQ ID NO:12的氨基酸1至437。在另一个方面中,催化结构域是SEQ ID NO:14的氨基酸1至437。在另一个方面中,催化结构域是SEQ ID NO:16的氨基酸1至438。在另一个方面中,催化结构域是SEQ ID NO:18的氨基酸1至437。在另一个方面中,催化结构域是SEQ ID NO:20的氨基酸1至430。在另一个方面中,催化结构域是SEQ ID NO:22的氨基酸1至433。
[0069] 催化结构域编码序列:术语“催化结构域编码序列”意指一种编码催化纤维二糖水解酶活性的结构域的多核苷酸。在一个方面中,催化结构域编码序列是SEQ ID NO:1的核苷酸52至1469。在另一个方面中,催化结构域编码序列是SEQ ID NO:3的核苷酸52至1389。在另一个方面中,催化结构域编码序列是SEQ ID NO:4的核苷酸52至1389。在另一个方面中,催化结构域编码序列是SEQ ID NO:7的核苷酸79至1389。在另一个方面中,催化结构域编码序列是SEQ ID NO:9的核苷酸52至1371。在另一个方面中,催化结构域编码序列是SEQ ID NO:11的核苷酸55至1482。在另一个方面中,催化结构域编码序列是SEQ ID NO:13的核苷酸76至1386。在另一个方面中,催化结构域是SEQ ID NO:15的核苷酸76至1386。在另一个方面中,催化结构域编码序列是SEQ ID NO:17的核苷酸55至1504。在另一个方面中,催化结构域编码序列是SEQ ID NO:19的核苷酸61至1350。在另一个方面中,催化结构域编码序列是SEQ ID NO:21的核苷酸55至1353。
[0070] cDNA:术语“cDNA”是指可以通过从得自真核或原核细胞的成熟的、剪接的mRNA分子进行反转录而制备的DNA分子。cDNA缺乏可以存在于对应基因组DNA中的内含子序列。早先的初始RNA转录本是mRNA的前体,其在呈现为成熟的剪接的mRNA之前要经一系列的步骤进行加工,包括剪接。
[0071] 纤维二糖水解酶:术语“纤维二糖水解酶”意指一种1,4-β-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91和E.C.3.2.1.176),其催化纤维素、纤维寡糖、或任何含有β-1,4-连接葡萄糖的聚合物中的1,4-β-D-糖苷键的水解,从而从链的还原性末端(纤维二糖水解酶I)或非还原性末端(纤维二糖水解酶II)释放纤维二糖(泰里(Teeri),1997,生物技术趋势(Trends in Biotechnology)15:160-167;泰里等人,1998,生物化学学会会刊(Biochem.Soc.Trans.)26:173-178)。根据里弗(Lever)等人,1972,分析生物化学(Anal.Biochem.)47:273-279;范·帝伯赫(van Tilbeurgh)等人,1982,欧洲生化学会联合会快报(FEBS Letters),149:152-156;范·帝伯赫和克莱森斯(Claeyssens),1985,欧洲生化学会联合会快报,187:283-288;以及汤美(Tomme)等人,1988,欧洲生物化学杂志(Eur.J.Biochem.)170:575-581所描述的程序来测定纤维二糖水解酶活性。在本发明中,优选地根据在此的实例8和9测定纤维二糖水解酶活性。
[0072] 纤维素分解酶或纤维素酶:术语“纤维素分解酶”或“纤维素酶”意指一种或多种(例如,若干种)水解纤维素材料的酶。这类酶包括一种或多种内切葡聚糖酶、一种或多种纤维二糖水解酶、一种或多种β-葡糖苷酶、或其组合。用于测量纤维素分解酶活性的两种基本方法包括:(1)测定总纤维素分解酶活性,以及(2)测定个体纤维素分解酶活性(内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶),如在张(Zhang)等人,2006,生物技术进展(Biotechnology Advances)24:452-481中所综述的。通常使用不溶性底物,包括沃特曼(Whatman)№1滤纸、微晶纤维素、细菌纤维素、藻类纤维素、花、预处理的木质纤维素等,测量总纤维素分解活性。最常用的总纤维素分解活性测定是使用沃特曼№1滤纸作为底物的滤纸测定。该测定法是由国际纯粹与应用化学联合会(IUPAC)建立的(高斯(Ghose),1987,纯粹与应用化学(Pure Appl.Chem.)59:257-68)。
[0073] 出于本发明的目的,纤维素分解酶活性通过测量在以下条件下与未添加纤维素分解酶蛋白的对照水解相比较,由一种或多种纤维素分解酶进行的纤维素材料水解的增加来测定:1-50mg的纤维素分解酶蛋白/g于PCS中的纤维素(或其他预处理的纤维素材料)在合适的温度(如25℃-80℃,例如30℃、35℃、40℃、45℃、50℃、55℃、60℃、65℃或70℃)以及合适的pH(如4-9,例如,5.0、5.5、6.0、6.5或7.0)下持续3-7日。典型条件为:1ml反应,洗涤或未洗涤的PCS,5%不溶性固体(干重),50mM乙酸钠(pH 5),1mM MnSO4,50℃、55℃或60℃,72小时,通过 HPX-87H柱色谱(伯乐实验室有限公司,赫拉克勒斯,加州,美国)进行糖分析。
[0074] 纤维素材料:术语“纤维素材料”意指含有纤维素的任何材料。生物质的初生细胞壁中的主要多糖是纤维素,第二丰富的是半纤维素,而第三丰富的是果胶。细胞停止生长后产生的次生细胞壁也包含多糖,并且它通过与半纤维素共价交联的聚合木质素得到强化。纤维素是脱水纤维二糖的均聚物,因此是一种线性β-(1-4)-D-葡聚糖,而半纤维素包括多种化合物,如具有一系列取代基以复杂支链结构存在的木聚糖、木葡聚糖、阿拉伯糖基木聚糖、以及甘露聚糖。尽管纤维素一般为多态的,但发现其在植物组织中主要以平行葡聚糖链的不溶性晶体基质存在。半纤维素通常氢键合至纤维素以及其他半纤维素,这有助于稳定细胞壁基质。
[0075] 纤维素通常见于例如植物的茎、叶、壳、皮、以及穗轴,或树的叶、枝、以及木材中。纤维素材料可以是但不限于农业废弃物、草本材料(包括能源作物)、城市固体废物、纸浆和造纸厂废弃物、废纸、和木材(包括林业废弃物)(参见例如维塞劳格尔(Wiselogel)等人,
1995,生物乙醇手册(Handbook on Bioethanol)(查尔斯E.怀曼(Charles E.Wyman),编著),pp.105-118,泰勒-弗朗西斯出版集团(Taylor&Francis),华盛顿特区;怀曼(Wyman),
1994,生物资源技术(Bioresource Technology)50:3-16;林德(Lynd),1990,应用生物化学与生物技术(Applied Biochemistry and Biotechnology)24/25:695-719;塞尔(Mosier)等人,1999,“木质纤维素的生物转化的最近进展”,生物化学工程/生物技术进展(Advances in Biochemical Engineering/Biotechnology),斯卡皮尔(T.Scheper),总编辑,第65卷,第23-40页,施普林格出版公司(Springer-Verlag),纽约)。在此应该理解的是,纤维素可以处于木素纤维素,在混合基质中包含木质素、纤维素、和半纤维素的植物细胞壁材料的形式。在一个方面中,该纤维素材料是任何生物质材料。在另一个方面中,该纤维素材料是木质纤维素,该木质纤维素包括纤维素、半纤维素和木质素。
[0076] 在一个实施例中,该纤维素材料是农业废弃物、草本材料(包括能源作物)、城市固体废物、纸浆和造纸厂废弃物、废纸或木材(包括林业废弃物)。
[0077] 在另一个实施例中,该纤维素材料是芦竹、甘蔗渣、竹子、玉米芯、玉米纤维、玉米秸秆、芒属、稻秸、柳枝稷或麦秸。
[0078] 在另一个实施例中,该纤维素材料是山杨、桉树、冷杉、松树、白杨、杉或柳树。
[0079] 在另一个实施例中,该纤维素材料是海藻纤维素、细菌纤维素、棉短绒、滤纸、微晶纤维素(例如, )、或经磷酸处理的纤维素。
[0080] 在另一个实施例中,该纤维素材料是一种水生生物质。如在此所用的,术语“水生生物质(aquatic biomass)”意指在水生环境中通过光合作用过程产生的生物质。水生生物质可以是藻类、挺水植物、浮叶植物、或沉水植物。
[0081] 纤维素材料可以按原样使用或可以使用本领域已知的常规方法进行预处理,如在此所描述。在一个优选方面中,该纤维素材料进行了预处理。
[0082] 编码序列:术语“编码序列”意指直接指明变体的氨基酸序列的多核苷酸。编码序列的边界一般由一个开放阅读框架决定,该开放阅读框架从一个起始密码子(如ATG、GTG或TTG)开始并且以一个终止密码子(如TAA、TAG或TGA)结束。编码序列可以是一种基因组DNA、cDNA、合成DNA或其组合。
[0083] 控制序列:术语“控制序列”意指对于表达编码本发明的变体的多核苷酸所必需的核酸序列。每个控制序列对于编码该变体的多核苷酸来说可以是原生(native)的(即,来自相同基因)或外源的(即,来自不同基因),或相对于彼此是原生的或外源的。此类控制序列包括但不限于前导子、聚腺苷酸化序列、前肽序列、启动子、信号肽序列、以及转录终止子。至少,控制序列包括启动子,以及转录和翻译终止信号。出于引入有利于将这些控制序列与编码一种变体的多核苷酸的编码区连接的特异性限制酶切位点的目的,这些控制序列可以提供有多个接头。
[0084] 内切葡聚糖酶:术语“内切葡聚糖酶”意指一种4-(1,3;1,4)-β-D-葡聚糖4-葡聚糖水解酶(E.C.3.2.1.4),其催化纤维素、纤维素衍生物(如羧甲基纤维素和羟乙基纤维素)、地衣多糖中的1,4-β-D-糖苷键和混合β-1,3-1,4葡聚糖如谷类β-D-葡聚糖或木葡聚糖以及含有纤维素组分的其他植物材料中的β-1,4键的内切水解。可以通过测量底物粘度的降低或通过还原糖测定所确定的还原性末端的增加来确定内切葡聚糖酶活性(张(Zhang)等人,2006,生物技术进展(Biotechnology Advances)24:452-481)。出于本发明的目的,根据高斯(Ghose),1987,纯粹与应用化学(Pure and Appl.Chem.)59:257-268的程序,在pH 5、40℃下,使用羧甲基纤维素(CMC)作为底物测定内切葡聚糖酶活性。
[0085] 表达:术语“表达”包括涉及变体产生的任何步骤,包括但不限于,转录、转录后修饰、翻译、翻译后修饰以及分泌。
[0086] 表达载体:术语“表达载体”意指线性或环状DNA分子,该分子包括编码变体的多核苷酸并且该多核苷酸可操作地与提供用于其表达的控制序列相连接。
[0087] 家族61糖苷水解酶:术语“家族61糖苷水解酶”或“家族GH61”或“GH61”意指根据亨利萨塔(Henrissat),1991,生物化学杂志(Biochem.J.)280:309-316,以及亨利萨塔和巴洛赫(Bairoch),1996,生物化学杂志316:695-696,属于糖苷水解酶家族61的一种多肽。最近已经将GH61多肽归类为溶解性多糖单加氧酶(lytic polysaccharide monooxygenase)(昆兰(Quinlan)等人,2011,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)208:15079-15084;菲利普斯(Phillips)等人,2011,ACS化学生物学(ACS Chem.Biol.)6:1399-1406;林(Lin)等人,2012,结构(Structure)20:1051-1061)并被指定为“辅助活性(Auxiliary Activity)9”或“AA9”多肽。
[0088] 阿魏酸酯酶:术语“阿魏酸酯酶”意指一种4-羟基-3-甲氧基肉桂酰基-糖水解酶(EC 3.1.1.73),其催化4-羟基-3-甲氧基肉桂酰基(阿魏酰基)基团从酯化的糖(其在天然生物质底物中通常为阿拉伯糖)的水解,以产生阿魏酸酯(4-羟基-3-甲氧基肉桂酸酯)。阿魏酸酯酶(FAE)也被称为阿魏酸酯酶(ferulic acid esterase)、羟基肉桂酰基酯酶、FAE-III、肉桂酸酯水解酶、FAEA、cinnAE、FAE-I、或FAE-II。出于本发明的目的,在50mM乙酸钠(pH 5.0)中使用0.5mM阿魏酸对硝基苯酯作为底物来确定阿魏酸酯酶活性。一个单位的阿魏酸酯酶等于能够在pH 5、25℃下每分钟释放1微摩尔的对硝基苯酚阴离子的酶的量。
[0089] 片段:术语“片段”意指从成熟多肽的氨基和/或羧基末端缺失一个或多个(例如,若干个)氨基酸的多肽;其中该片段具有纤维二糖水解酶活性。在一个方面中,一个片段包含SEQ ID NO:2的成熟多肽或其变体的至少420个氨基酸残基,例如,至少445个氨基酸残基或至少470个氨基酸残基。在另一个方面中,一个片段包含SEQ ID NO:8的成熟多肽或其变体的至少430个氨基酸残基,例如,至少455个氨基酸残基或至少480个氨基酸残基。在另一个方面中,一个片段包含SEQ ID NO:10的成熟多肽或其变体的至少380个氨基酸残基,例如,至少400个氨基酸残基或至少420个氨基酸残基。在另一个方面中,一个片段包含SEQ ID NO:12的成熟多肽或其变体的至少380个氨基酸残基,例如,至少400个氨基酸残基或至少420个氨基酸残基。在另一个方面中,一个片段包含SEQ ID NO:14的成熟多肽或其变体的至少430个氨基酸残基,例如,至少455个氨基酸残基或至少480个氨基酸残基。在另一个方面中,一个片段包含SEQ ID NO:16的成熟多肽或其变体的至少430个氨基酸残基,例如,至少
455个氨基酸残基或至少480个氨基酸残基。在另一个方面中,一个片段包含SEQ ID NO:18的成熟多肽或其变体的至少380个氨基酸残基,例如,至少400个氨基酸残基或至少420个氨基酸残基。在另一个方面中,一个片段包含SEQ ID NO:20的成熟多肽或其变体的至少370个氨基酸残基,例如,至少390个氨基酸残基或至少410个氨基酸残基。在另一个方面中,一个片段包含SEQ ID NO:22的成熟多肽或其变体的至少435个氨基酸残基,例如,至少460个氨基酸残基或至少485个氨基酸残基。
[0090] 半纤维素分解酶或半纤维素酶:术语“半纤维素分解酶”或“半纤维素酶”意指水解半纤维素材料的一种或多种(例如,若干种)酶。参见例如,沙鲁姆(Shallom)和沙哈姆(Shoham),2003,微生物学当前观点(Current Opinion In Microbiology)6(3):219-228)。半纤维素酶是在植物生物质的降解中的关键组分。半纤维素酶的实例包括但不限于,乙酰基甘露聚糖酯酶、乙酰基木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶以及木糖苷酶。这些酶的底物——半纤维素——是支链和直链多糖的异质性组,其可通过氢键与植物细胞壁中的纤维素微纤维相结合,交联成坚固的网络。半纤维素还共价附接至木质素,从而与纤维素一起形成高度复杂的结构。半纤维素的可变结构和组织要求许多酶的协同作用以使其完全降解。半纤维素酶的催化模块是水解糖苷键的糖苷水解酶(GH),或是水解乙酸或阿魏酸侧基的酯键的碳水化合物酯酶(CE)。这些催化模块基于它们一级序列的同源性,可以被分配到GH和CE家族中。具有总体相似的折叠的一些家族可以进一步被分组为以字母标记的氏族(例如,GH-A)。这些和其他碳水化合物活性酶的最具信息性和最新的分类可在碳水化合物活性酶(Carbohydrate-Active Enzymes)(CAZy)数据库中获得。可以根据高斯(Ghose)和比赛亚(Bisaria),1987,纯粹与应用化学(Pure&AppI.Chem.)59:
1739-1752,在合适的温度(如40℃-80℃,例如,50℃、55℃、60℃、65℃或70℃)以及合适的pH(如4-9,例如,5.0、5.5、6.0、6.5或7.0)下测量半纤维素分解酶活性。
[0091] 高严格条件:术语“高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和50%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在65℃下洗涤三次,每次15分钟。
[0092] 宿主细胞:术语“宿主细胞”意指易于用包括本发明的多核苷酸的核酸构建体或表达载体转化、转染、转导等的任何细胞类型。术语“宿主细胞”涵盖由于复制期间发生的突变而与亲本细胞不同的亲本细胞的任何后代。
[0093] 改进的特性:术语“改进的特性”意指与变体相关的与亲本相比得到改进的特征。这样的一种改进的特性优选是增加的比性能。
[0094] 增加的比性能:术语本发明变体的“增加的比性能”意指与亲本进行的相同程度的转化相比纤维素材料至产物的改进的转化。确定每单位蛋白(例如,mg蛋白或微摩尔蛋白)的增加的比性能。可以例如在pH、温度和底物浓度中的一个或多个(例如,若干个)条件下评估变体相对于亲本的增加的比性能。在一个方面中,产物是葡萄糖。在另一个方面中,产物是纤维二糖。在另一个方面中,产物是葡萄糖+纤维二糖。
[0095] 在一个方面中,条件是pH。例如,pH可以是3至7范围内的任何pH,例如3.0、3.5、4.0、4.5、5.0、5.5、6.0、6.5、或7.0(或其之间)。可以使用达到希望的pH的任何合适的缓冲液。
[0096] 在另一个方面中,条件是温度。例如,温度可以是25℃至90℃范围内的任何温度,例如25℃、30℃、35℃、40℃、45℃、50℃、55℃、60℃、65℃、70℃、75℃、80℃、85℃、或90℃(或其之间)。
[0097] 在另一个方面中,条件是底物浓度。可以将在此定义的任何纤维素材料用作底物。在一个方面中,将底物浓度测量为干固体含量。干固体含量优选地处于约1wt%至约
50wt%,例如,约5wt%至约45wt%、约10wt%至约40wt%或约20wt%至约30wt%的范围内。
在另一个方面中,将底物浓度测量为不溶性葡聚糖含量。不溶性葡聚糖含量优选地处于约
2.5wt%至约25wt%,例如,约5wt%至约20wt%或约10wt%至约15wt%的范围内。
[0098] 在另一个方面中,使用以上条件中的两个或更多个(例如,若干个)的组合来测定变体相对于亲本的增加的比性能,如25℃至90℃范围内的任何温度,例如,25℃、30℃、35℃、40℃、45℃、50℃、55℃、60℃、65℃、70℃、75℃、80℃、85℃或90℃(或其之间),在3至7范围内的pH,例如3.0、3.5、4.0、4.5、5.0、5.5、6.0、6.5或7.0(或其之间)下。
[0099] 可以使用本领域已知的用于纤维二糖水解酶的任何酶测定来确定变体相对于亲本的增加的比性能,如在此所描述。可替代地,可以使用在实例8和9中描述的测定来确定变体相对于亲本的增加的比性能。
[0100] 在另一个方面中,变体的比性能比亲本的比性能高至少1.01倍,例如,至少1.02倍、至少1.03倍、至少1.04倍、至少1.05倍、至少1.06倍、至少1.07倍、至少1.08倍、至少1.09倍、至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少5倍、至少10倍、至少15倍、至少20倍、至少25倍以及至少50倍。
[0101] 分离的:术语“分离的”意指处于自然界中不存在的形式或环境中的一种物质。分离的物质的非限制性实例包括:(1)任何非天然存在的物质;(2)至少部分地从与其天然相关联的一种或多种或所有天然存在的成分中去除的任何物质,包括但不限于任何酶、变体、核酸、蛋白质、肽或辅因子;(3)相对于在自然界中发现的那种物质通过人工修饰的任何物质;或(4)通过相对于与其天然相关联的其他组分增加该物质的量(例如,宿主细胞中的重组体产量;编码该物质的基因的多个拷贝;以及比与编码该物质的基因天然相关联的启动子更强的启动子的使用)而修饰的任何物质。
[0102] 低严格条件:术语“低严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和25%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在50℃下洗涤三次,每次15分钟。
[0103] 成熟多肽:术语“成熟多肽”意指呈其在翻译以及任何翻译后修饰之后的最终形式的多肽,所述修饰如N-末端加工、C-末端截短、糖基化、磷酸化等。在一个方面中,基于预测SEQ ID NO:2的氨基酸-1至-17是信号肽的SignalP 3.0程序(本特森(Bendtsen)等人,2004,分子生物学杂志(J.Mol.Biol.)340:783-795),成熟多肽是SEQ ID NO:2的氨基酸1至
497。在另一个方面中,基于预测SEQ ID NO:8的氨基酸-1至-26是信号肽的SignalP 3.0程序,成熟多肽是SEQ ID NO:8(P3EX)的氨基酸1至506。在另一个方面中,基于预测SEQ ID NO:10的氨基酸-1至-17是信号肽的SignalP 3.0程序,成熟多肽是SEQ ID NO:10(P57J)的氨基酸1至440。在另一个方面中,基于预测SEQ ID NO:12的氨基酸-1至-18是信号肽的SignalP 3.0程序,成熟多肽是SEQ ID NO:12(P82PH)的氨基酸1至437。在另一个方面中,基于预测SEQ ID NO:14的氨基酸-1至-25是信号肽的SignalP 3.0程序,成熟多肽是SEQ ID NO:14(P23YSY)的氨基酸1至507。在另一个方面中,基于预测SEQ ID NO:16的氨基酸-1至-
25是信号肽的SignalP 3.0程序,成熟多肽是SEQ ID NO:16(P23YSX)的氨基酸1至507。在另一个方面中,基于预测SEQ ID NO:18的氨基酸-1至-18是信号肽的SignalP 3.0程序,成熟多肽是SEQ ID NO:18(P247B5)的氨基酸1至437。在另一个方面中,基于预测SEQ ID NO:20的氨基酸-1至-20是信号肽的SignalP 3.0程序,成熟多肽是SEQ ID NO:20(P66Z)的氨基酸
1至430。在另一个方面中,基于预测SEQ ID NO:22的氨基酸-1至-18是信号肽的SignalP 
3.0程序,成熟多肽是SEQ ID NO:22(P57G)的氨基酸1至511。在本领域中已知的是,宿主细胞可以产生由相同多核苷酸表达的两种或更多种不同的成熟多肽(即,具有不同的C-末端和/或N-末端氨基酸)的混合物。在本领域中还已知的是,不同的宿主细胞可以不同地加工多肽,并且因此一个表达一种多核苷酸的宿主细胞当与另一个表达相同多核苷酸的宿主细胞相比时可以产生一种不同的成熟多肽(例如,具有一个不同的C-末端和/或N-末端氨基酸)。
[0104] 成熟多肽编码序列:术语“成熟多肽编码序列”意指编码具有纤维二糖水解酶活性的成熟多肽的一种多核苷酸。在一个方面中,基于预测SEQ ID NO:1的核苷酸1至51编码信号肽的SignalP 3.0程序(本特森(Bendtsen)等人,2004,见上文),成熟多肽编码序列是SEQ ID NO:1的核苷酸52至1673(无终止密码子)。在另一个方面中,基于预测SEQ ID NO:3的核苷酸1至51编码信号肽的SignalP 3.0程序,成熟多肽编码序列是SEQ ID NO:3的核苷酸52至1542(无终止密码子)。在另一个方面中,基于预测SEQ ID NO:4的核苷酸1至51编码信号肽的SignalP 3.0程序,成熟多肽编码序列是SEQ ID NO:4的核苷酸52至1542(无终止密码子)。在另一个方面中,基于预测SEQ ID NO:7的核苷酸1至78编码信号肽的SignalP 3.0程序,成熟多肽编码序列是SEQ ID NO:7(D1R9)的核苷酸79至1596(无终止密码子)。在另一个方面中,基于预测SEQ ID NO:9的核苷酸1至51编码信号肽的SignalP 3.0程序,成熟多肽编码序列是SEQ ID NO:9(D3FQ)的核苷酸52至1371(无终止密码子)。在另一个方面中,基于预测SEQ ID NO:11的核苷酸1至54编码信号肽的SignalP 3.0程序,成熟多肽编码序列是SEQ ID NO:11(D23Y2)的核苷酸55至1482(无终止密码子)。在另一个方面中,基于预测SEQ ID NO:13的核苷酸1至75编码信号肽的SignalP 3.0程序,成熟多肽编码序列是SEQ ID NO:13(D72PP3)的核苷酸76至1596(无终止密码子)。在另一个方面中,基于预测SEQ ID NO:15的核苷酸1至75编码信号肽的SignalP 3.0程序,成熟多肽编码序列是SEQ ID NO:15(D72PP2)的核苷酸76至1596(无终止密码子)。在另一个方面中,基于预测SEQ ID NO:17的核苷酸1至54编码信号肽的SignalP 3.0程序,成熟多肽编码序列是SEQ ID NO:17(D82ACF)的核苷酸
55至1504(无终止密码子)。在另一个方面中,基于预测SEQ ID NO:19的核苷酸1至60编码信号肽的SignalP 3.0程序,成熟多肽编码序列是SEQ ID NO:19(D6CT)的核苷酸61至1350(无终止密码子)。在另一个方面中,基于预测SEQ ID NO:21的核苷酸1至54编码信号肽的SignalP 3.0程序,成熟多肽编码序列是SEQ ID NO:21(D3FP)的核苷酸55至1587(无终止密码子)。
[0105] 中严格条件:术语“中严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和35%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在55℃下洗涤三次,每次15分钟。
[0106] 中-高严格条件:术语“中-高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和35%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在60℃下洗涤三次,每次15分钟。
[0107] 突变体:术语“突变体”意指编码一种变体的多核苷酸。
[0108] 核酸构建体:术语“核酸构建体”意指单链或双链的一种核酸分子,该核酸分子是从天然存在的基因中分离的,或者以一种本来不存在于自然界中的方式被修饰成含有核酸的区段,或者是合成的,该核酸分子包含一个或多个控制序列。
[0109] 可操作地连接:术语“可操作地连接”意指如下的构造,其中,控制序列相对于多核苷酸的编码序列安置在适当位置处,从而使得该控制序列指导该编码序列的表达。
[0110] 亲本或亲本纤维二糖水解酶:术语“亲本”或“亲本纤维二糖水解酶”意指一种具有纤维二糖水解酶活性的多肽,在一个或多个(例如,若干个)位置对其进行改变,即取代、插入和/或缺失,以产生本发明的酶变体。亲本可以是天然存在的(野生型)多肽或其变体或片段。
[0111] 具有纤维素分解增强活性的多肽:术语“具有纤维素分解增强活性的多肽”意指通过具有纤维素分解活性的酶(即,纤维素酶)催化纤维素材料的增强的水解的GH61多肽或其变体。出于本发明的目的,纤维素分解增强活性通过测量来自由纤维素分解酶在以下条件下水解纤维素材料的还原糖的增加或纤维二糖与葡萄糖总量的增加来测定:1-50mg总蛋白质/g于预处理的玉米秸秆(PCS)中的纤维素,其中总蛋白质由50-99.5%w/w纤维素分解酶蛋白以及0.5%-50%w/w GH61多肽或其变体的蛋白质组成,在合适的温度(如25℃-80℃,例如,30℃、35℃、40℃、45℃、50℃、55℃、60℃、65℃或70℃)以及合适的pH(如4-9,例如,4.5、5.0、5.5、6.0、6.5、7.0、7.5、8.0或8.5)下持续1-7天,与用相等的总蛋白质负载量而无纤维素分解增强活性(1-50mg纤维素分解蛋白/g于PCS中的纤维素)的对照水解相比较。在一个方面中,GH61多肽增强活性使用以下来确定:使用在总蛋白质重量的2%-3%的米曲霉β-葡糖苷酶(根据WO 02/095014在米曲霉中重组产生)或总蛋白质重量的2%-3%的烟曲霉β-葡糖苷酶(如WO 02/095014中所描述在米曲霉中重组产生)的纤维素酶蛋白负载量存在的情况下 1.5L(诺维信公司(Novozymes  A/S),巴格斯瓦尔德
丹麦)的混合物作为纤维素分解活性的来源。
[0112] 用于测定GH61多肽或其变体的纤维素分解增强活性的另一种测定是在40℃下将GH61多肽或变体与0.5%磷酸溶胀纤维素(PASC)、100mM乙酸钠(pH 5)、1mM MnSO4、0.1%没食子酸、0.025mg/ml的烟曲霉β-葡糖苷酶以及0.01% X100(4-(1,1,3,3-四甲基丁基)苯基-聚乙二醇)一起孵育24-96小时,然后测定从PASC释放的葡萄糖。
[0113] 具有纤维素分解增强活性的GH61多肽或其变体通过将达到相同的水解程度所需要的纤维素分解酶的量降低优选至少1.01倍,例如,至少1.05倍、至少1.10倍、至少1.25倍、至少1.5倍、至少2倍、至少3倍、至少4倍、至少5倍、至少10倍、或至少20倍,来增强由具有纤维素分解活性的酶催化的纤维素材料的水解。
[0114] 预处理的玉米秸杆:术语“预处理的玉米秸杆”或“PCS”意指通过热和稀硫酸处理、预处理、中性预处理、或本领域已知的任何预处理从玉米秸杆得到的纤维素材料。
[0115] 序列一致性:两个氨基酸序列之间或者两个核苷酸序列之间的关联度通过参数“序列一致性”来描述。
[0116] 出于本发明的目的,使用如在EMBOSS包(EMBOSS:欧洲分子生物学开放软件套件(The European Molecular Biology Open Software Suite),赖斯(Rice)等人,2000,遗传学趋势(Trends Genet.)16:276-277)(优选5.0.0版或更新版本)的尼德尔(Needle)程序中所实施的尼德尔曼-翁施(Needleman-Wunsch)算法(Needleman(尼德尔曼)和Wunsch(翁施),1970,分子生物学杂志(J.Mol.Biol.)48:443-453)来确定两个氨基酸序列之间的序列一致性。使用的参数是空位开放罚分10、空位扩展罚分0.5以及EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。尼德尔标注的“最长的一致性”的输出(使用-非简化选项获得)被用作百分比一致性,并且如下计算:
[0117] (一致的残基X 100)/(比对长度-比对中的空位总数)
[0118] 出于本发明的目的,使用如在EMBOSS包(EMBOSS:欧洲分子生物学开放软件套件,赖斯(Rice)等人,2000,见上文)(优选5.0.0版或更新版本)的尼德尔程序中所实施的尼德尔曼-翁施算法(尼德尔曼(Needleman)和翁施(Wunsch),1970,见上文)来确定两个脱氧核糖核苷酸序列之间的序列一致性。使用的参数是空位开放罚分10、空位扩展罚分0.5,以及EDNAFULL(NCBI NUC4.4的EMBOSS版本)取代矩阵。尼德尔标注的“最长的一致性”的输出(使用-非简化选项获得)被用作百分比一致性,并且如下计算:
[0119] (一致的脱氧核糖核苷酸X 100)/(比对长度-比对中的空位总数)
[0120] 子序列:术语“子序列”意指缺失成熟多肽编码序列的5'和/或3'端的一个或多个(例如,若干个)核苷酸的多核苷酸;其中该子序列编码具有纤维二糖水解酶活性的片段。在一个方面中,一个子序列包含SEQ ID NO:1的成熟多肽编码序列或其突变体的至少1400个核苷酸,例如,至少1475个核苷酸或至少1550个核苷酸。在另一个方面中,一个子序列包含SEQ ID NO:3的成熟多肽编码序列或其突变体的至少1260个核苷酸,例如,至少1335个核苷酸或至少1410个核苷酸。在另一个方面中,一个子序列包含SEQ ID NO:4的成熟多肽编码序列或其突变体的至少1260个核苷酸,例如,至少1335个核苷酸或至少1410个核苷酸。在另一个方面中,一个片段包含SEQ ID NO:7的成熟多肽或其突变体的至少1290个核苷酸,例如,至少1365个核苷酸或至少1440个核苷酸。在另一个方面中,一个片段包含SEQ ID NO:9的成熟多肽或其突变体的至少1140个核苷酸,例如,至少1200个核苷酸或至少1260个核苷酸。在另一个方面中,一个片段包含SEQ ID NO:11的成熟多肽或其突变体的至少1140个核苷酸,例如,至少1200个核苷酸或至少1260个核苷酸。在另一个方面中,一个片段包含SEQ ID NO:13的成熟多肽或其突变体的至少1290个核苷酸,例如,至少1365个核苷酸或至少1440个核苷酸。在另一个方面中,一个片段包含SEQ ID NO:15的成熟多肽或其突变体的至少1290个核苷酸,例如,至少1365个核苷酸或至少1440个核苷酸。在另一个方面中,一个片段包含SEQ ID NO:17的成熟多肽或其突变体的至少1140个核苷酸,例如,至少1200个核苷酸或至少
1260个核苷酸。在另一个方面中,一个片段包含SEQ ID NO:19的成熟多肽或其突变体的至少1110个核苷酸,例如,至少1170个核苷酸或至少1230个核苷酸。在另一个方面中,一个片段包含SEQ ID NO:21的成熟多肽或其突变体的至少1305个核苷酸,例如,至少1380个核苷酸或至少1455个核苷酸。
[0121] 变体:术语“变体”意指在一个或多个(例如,若干个)位置处包括改变(即,取代、插入和/或缺失)的具有纤维二糖水解酶活性的一个多肽。取代意指占据一个位置的氨基酸替换不同的氨基酸;缺失意指去除占据一个位置的氨基酸;并且插入意指在邻接并且紧随占据一个位置的氨基酸之后添加一个氨基酸。本发明的变体具有比亲本的比性能高至少1.01倍的比性能。
[0122] 非常高严格条件:术语“非常高严格条件”是指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和50%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在70℃下洗涤三次,每次15分钟。
[0123] 非常低严格条件:术语“非常低严格条件”是指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和25%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在45℃下洗涤三次,每次15分钟。
[0124] 野生型纤维二糖水解酶:术语“野生型”纤维二糖水解酶意指由微生物(如在自然界中发现的细菌、酵母或丝状真菌)天然地产生的纤维二糖水解酶。
[0125] 含有木聚糖的材料:术语“含有木聚糖的材料”意指包含含有β-(1-4)-连接的木糖残基主链的植物细胞壁多糖的任何材料。陆生植物的木聚糖是具有β-(1-4)-D-吡喃木糖主链的杂聚物,其通过短的碳水化合物链分支。它们包括D-葡糖醛酸或其4-O-甲基醚、L-阿拉伯糖、和/或不同的低聚糖,这些低聚糖由D-木糖、L-阿拉伯糖、D-或L-半乳糖、以及D-葡萄糖构成。可以将木聚糖类型的多糖分成同源木聚糖(homoxylan)和异源木聚糖(heteroxylan),包括葡糖醛酸木聚糖、(阿拉伯糖)葡糖醛酸木聚糖、(葡糖醛酸)阿拉伯糖基木聚糖、阿拉伯糖基木聚糖、以及复杂的异源木聚糖。参见,例如,埃伯林格罗瓦(Ebringerova)等人,2005,聚合物科学进展(Adv.Polym.Sci.)186:1-67。
[0126] 在本发明的方法中,可以使用含有木聚糖的任何材料。在一个优选方面中,含有木聚糖的材料是木质纤维素。
[0127] 木聚糖降解活性或木聚糖分解活性:术语“木聚糖降解活性”或“木聚糖分解活性”意指水解含有木聚糖的材料的生物活性。用于测量木聚糖分解活性的两种基本方法包括:(1)测量总木聚糖分解活性,和(2)测量单独的木聚糖分解活性(例如内切木聚糖酶、β-木糖苷酶、阿拉伯呋喃糖苷酶、α-葡糖醛酸糖苷酶、乙酰木聚糖酯酶、阿魏酸酯酶、以及α-葡糖醛酸酯酶)。木聚糖分解酶的测定的最近进展总结于若干出版物中,这些出版物包括别雷(Biely)和普查德(Puchard),2006,食品与农业科学杂志(Journal of the Science of Food and Agriculture)86(11):1636-1647;斯帕尼克娃(Spanikova)和别雷,2006,欧洲生化学会联合会快报(FEBS Letters)580(19):4597-4601;赫尔曼(Herrimann)等人,1997,生物化学杂志(Biochemical Journal)321:375-381。
[0128] 总木聚糖降解活性可以通过测定由不同类型的木聚糖(包括例如燕麦(oat spelt)木聚糖、山毛榉木木聚糖以及落叶松木木聚糖)形成的还原糖,或通过光度法测定从不同共价染色的木聚糖释放的染色的木聚糖片段来测量。一种常见的总木聚糖分解活性测定是基于由聚合4-O-甲基葡糖醛酸木聚糖产生还原糖,如描述于别雷(Bailey)等人,1992,用于木聚糖酶活性测定的多个实验室测试方法(Interlaboratory testing of methods for assay of xylanase activity),生物技术杂志(Journal of Biotechnology)23(3):257-270中。木聚糖酶活性还可以在37℃下在0.01% X-100和200mM磷酸钠(pH 
6)中用0.2%AZCL-阿拉伯糖基木聚糖作为底物来测定。将一个单位的木聚糖酶活性定义为在37℃、pH 6下,在200mM磷酸钠(pH 6)中从作为底物的0.2%AZCL-阿拉伯糖基木聚糖每分钟产生1.0微摩尔天青蛋白。
[0129] 出于本发明的目的,木聚糖降解活性通过测量由一种或多种木聚糖降解酶在以下典型条件下造成的桦木木聚糖(西格玛化学有限公司(Sigma Chemical Co.,Inc.),圣路易斯,密苏里州,美国)水解的增加来测定:1ml反应、5mg/ml底物(总固体),5mg木聚糖分解蛋白质/g底物、50mM乙酸钠(pH 5)、50℃、24小时,如里弗(Lever),1972,分析生物化学(Anal.Biochem)47:273-279所述使用对羟基苯甲酸酰肼(PHBAH)测定进行糖分析。
[0130] 木聚糖酶:术语“木聚糖酶”意指1,4-β-D-木聚糖-木糖水解酶(E.C.3.2.1.8),其催化木聚糖中的1,4-β-D-木糖苷键的内切水解。出于本发明的目的,在37℃下在0.01%X-100和200mM磷酸钠(pH 6)中用0.2%AZCL-阿拉伯糖基木聚糖作为底物来测定木聚糖酶活性。一个单位的木聚糖酶活性定义为在37℃、pH 6下在200mM磷酸钠(pH 6)中从作为底物的0.2%AZCL-阿拉伯糖基木聚糖每分钟产生1.0微摩尔天青蛋白。
[0131] 变体命名惯例
[0132] 出于本发明的目的,在SEQ ID NO:2中披露的成熟多肽用于确定另一种纤维二糖水解酶中相对应的氨基酸残基。将另一种纤维二糖水解酶的氨基酸序列与SEQ ID NO:2中披露的成熟多肽进行比对,并且基于该比对,使用如在EMBOSS包(EMBOSS:欧洲分子生物学开放软件套件,赖斯(Rice)等人,2000,遗传学趋势(Trends Genet.)16:276-277)(优选5.0.0版或更新版本)的尼德尔程序中所实施的尼德尔曼-翁施算法(尼德尔曼(Needleman)和翁施(Wunsch),1970,分子生物学杂志(J.Mol.Biol.)48:443-453)来确定与SEQ ID NO:2中所披露的成熟多肽中的任何氨基酸残基相对应的氨基酸位置编号。使用的参数是空位开放罚分10、空位扩展罚分0.5以及EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。氨基酸位置的编号是基于SEQ ID NO:2的全长多肽(例如,包括信号肽),其中位置-17是信号肽的第一个氨基酸(即,Met)并且位置1是SEQ ID NO:2的Gln。例如,对应于里氏木霉纤维二糖水解酶I(SEQ ID NO:2)的位置197的位置是Rasamsonia emersonii纤维二糖水解酶I的位置
194,并且里氏木霉纤维二糖水解酶I的位置200是Rasamsonia emersonii纤维二糖水解酶I的位置197。
[0133] 另一种纤维二糖水解酶中对应的氨基酸残基的鉴别可以通过使用若干计算机程序使用其对应的缺省参数比对多个多肽序列来确定,这些计算机程序包括但不限于MUSCLE(通过对数期望值的多序列比较;3.5版或更新版本;埃德加(Edgar),2004,核酸研究(Nucleic Acids Research)32:1792-1797);MAFFT(6.857版或更新版本;加藤(Katoh)和库玛(Kuma),2002,核酸研究30:3059-3066;加藤等人,2005,核酸研究33:511-518;加藤和朝都(Toh),2007,生物信息学(Bioinformatics)23:372-374;加藤等人,2009,分子生物学中的方法(Methods in Molecular Biology)537:39-64;加藤和朝都,2010,生物信息学26:1899-1900);以及采用ClustalW的EMBOSS EMMA(1.83版或更新版本;汤普森(Thompson)等人,1994,核酸研究22:4673-4680)。
[0134] 当另一个纤维二糖水解酶与SEQ ID NO:2的成熟多肽歧异使得传统的基于序列的比较无法检测出它们的关系时(林达尔(Lindahl)和埃洛氟松(Elofsson),2000,分子生物学杂志(J.Mol.Biol.)295:613-615)时,可以使用其他配对序列比较算法。在基于序列的搜索中的更大灵敏度可以使用搜索程序来获得,这些搜索程序利用多肽家族的概率表示(谱(profile))来搜索数据库。例如,PSI-BLAST程序通过迭代数据库搜索过程来产生多个谱,并且能够检测远距离同源物(阿特休尔(Atschul)等人,1997,核酸研究(Nucleic Acids Res.)25:3389-3402)。如果多肽的家族或超家族在蛋白结构数据库中具有一个或多个代表,则可以实现甚至更大的灵敏度。程序如GenTHREADER(琼斯(Jones),1999,分子生物学杂志(J.Mol.Biol.)287:797-815;麦古芬(McGuffin)和琼斯,2003,生物信息学(Bioinformatics)19:874-881)利用来自不同来源(PSI-BLAST、二级结构预测、结构比对谱以及溶剂化势)的信息作为预测查询序列的结构折叠的神经网络的输入。类似地,高夫(Gough)等人,2000,分子生物学杂志(J.Mol.Biol.)313:903-919的方法可以用于比对未知结构的序列与存在于SCOP数据库中的超家族模型。这些比对进而可以用于产生多肽的同源性模型,并且使用出于该目的而开发的多种工具可以评定这类模型的准确度。
[0135] 对于已知结构的蛋白,若干工具和资源可用于检索并产生结构比对。例如,蛋白的SCOP超家族已经在结构上进行比对,并且那些比对是可访问的并且可下载的。可以使用多种算法如距离比对矩阵(奥尔姆(Holm)和桑德(Sander),1998,蛋白质(Proteins)33:88-96)或者组合延伸(Shindyalov和伯恩(Bourne),1998,《蛋白质工程》11:739-747)比对两种或更多种蛋白质结构,并且这些算法的实施可以另外用于查询具有感兴趣结构的结构数据库,以便发现可能的结构同源物(例如,奥尔姆和帕克(Park),2000,《生物信息学》16:566-
567)。
[0136] 在描述本发明的纤维二糖水解酶变体中,以下所描述的命名法适于方便参考。采用已接受的IUPAC单字母或三字母氨基酸缩写。
[0137] 取代。对于氨基酸取代,使用以下命名法:初始氨基酸、位置、取代氨基酸。因此,在位置226处的苏氨酸被丙氨酸取代表示为“Thr226Ala”或者“T226A”。多个突变由加号(“+”)分开,例如“Gly205Arg+Ser411Phe”或“G205R+S411F”代表分别在位置205和位置411处甘氨酸(G)被精氨酸(R)取代,并且丝氨酸(S)被苯丙氨酸(F)取代。
[0138] 缺失。对于氨基酸缺失,使用以下命名法:初始氨基酸、位置、*。因此,在位置195处的甘氨酸缺失表示为“Gly195*”或者“G195*”。多重缺失通过加号(“+”)分开,例如,“Gly195*+Ser411*”或“G195*+S411*”。
[0139] 插入。对于氨基酸插入,使用以下命名法:初始氨基酸、位置、初始氨基酸、插入氨基酸。因此,在位置195处的甘氨酸之后插入赖氨酸被表示为“Gly195GlyLys”或者“G195GK”。多个氨基酸的插入被表示为[原始氨基酸、位置、原始氨基酸、插入的氨基酸#1、插入的氨基酸#2;等]。例如,在位置195处的甘氨酸之后插入赖氨酸和丙氨酸被表示为“Glyl95GlyLysAla”或“G195GKA”。
[0140] 在这类情况下,通过将小写字母添加至在所插入的一个或多个氨基酸残基之前的氨基酸残基的位置编号中来对所插入的一个或多个氨基酸残基进行编号。在以上实例中,该序列因此将是:
[0141]亲本: 变体:
195 195195a 195b
G G-K-A
[0142] 多种改变。包含多种改变的变体由加号(“+”)分开,例如“Arg170Tyr+Gly195Glu”或者“R170Y+G195E”代表在位置170和位置195处的精氨酸和甘氨酸分别被酪氨酸和谷氨酸取代。
[0143] 不同改变。可以在一个位置上引入不同的改变时,这些不同的改变由一个逗号分开,例如“Arg170Tyr,Glu”代表在位置170上的精氨酸被酪氨酸或谷氨酸取代。因此,“Tyr167Gly,Ala+Arg170Gly,Ala”表示以下变体:“Tyr167Gly+Arg170Gly”、“Tyr167Gly+Arg170Ala”、“Tyr167Ala+Arg170Gly”以及“Tyr167Ala+Arg170Ala”。
[0144] 发明详细说明
[0145] 本发明涉及分离的纤维二糖水解酶变体,这些变体在对应于SEQ ID NO:2的成熟多肽的位置197、198、199及200的一个或多个位置处包括一个改变,其中对应于位置197、198和200的一个或多个位置处的改变是一个取代并且对应于位置199的位置处的改变是一个缺失,并且其中这些变体具有纤维二糖水解酶活性。
[0146] 变体
[0147] 在一个实施例中,该变体与亲本纤维二糖水解酶或其成熟多肽具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%的序列一致性。
[0148] 在另一个实施例中,该变体与SEQ ID NO:2的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少
94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
[0149] 在另一个实施例中,该变体与SEQ ID NO:8的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少
94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
[0150] 在另一个实施例中,该变体与SEQ ID NO:10的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少
94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
[0151] 在另一个实施例中,该变体与SEQ ID NO:12的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少
94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
[0152] 在另一个实施例中,该变体与SEQ ID NO:14的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少
94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
[0153] 在另一个实施例中,该变体与SEQ ID NO:16的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少
94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
[0154] 在另一个实施例中,该变体与SEQ ID NO:18的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少
94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
[0155] 在另一个实施例中,该变体与SEQ ID NO:20的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少
94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
[0156] 在另一个实施例中,该变体与SEQ ID NO:22的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少
94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
[0157] 在一个方面中,本发明的变体中改变的数目是1-4个,例如,1、2、3或4个改变。在另一个方面中,本发明的变体中取代的数目是1-3个,例如,1、2或3个取代。在另一个方面中,本发明的变体中缺失的数目是1个缺失。
[0158] 在另一个方面中,一种变体在对应于SEQ ID NO:2的成熟多肽的位置197、198、199及200的一个或多个位置处包括一个改变,其中对应于位置197、198和200的一个或多个位置处的改变是一个取代并且对应于位置199的位置处的改变是一个缺失。在另一个方面中,一种变体在对应于SEQ ID NO:2的成熟多肽的位置197、198、199及200中的任何位置的两个位置处包括一个改变,其中对应于位置197、198和200的一个或多个位置处的改变是一个取代并且对应于位置199的位置处的改变是一个缺失。在另一个方面中,一种变体在对应于SEQ ID NO:2的成熟多肽的位置197、198、199及200中的任何位置的三个位置处包括一个改变,其中对应于位置197、198和200的一个或多个位置处的改变是一个取代并且对应于位置199的位置处的改变是一个缺失。在另一个方面中,一种变体在对应于位置197、198和200的每个位置处都包括一个取代并且在对应于位置199的位置处包括一个缺失。
[0159] 在另一个方面中,该变体在对应于位置197的位置处包括一个取代或由其组成。在另一个方面中,对应于位置197的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val取代,优选被Ala取代。在另一个方面中,该变体包括SEQ ID NO:2的成熟多肽的取代N197A或由其组成。
[0160] 在另一个方面中,该变体在对应于位置198的位置处包括一个取代或由其组成。在另一个方面中,对应于位置198的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val取代,优选被Ala取代。在另一个方面中,该变体包括SEQ ID NO:2的成熟多肽的取代N198A或由其组成。
[0161] 在另一个方面中,该变体在对应于位置199的位置处包括一个缺失或由其组成。在另一个方面中,对应于位置199的位置处的氨基酸是Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val,优选是Ala。在另一个方面中,该变体包括SEQ ID NO:2的成熟多肽的缺失A199*或由其组成。
[0162] 在另一个方面中,该变体在对应于位置200的位置处包括一个取代或由其组成。在另一个方面中,对应于位置200的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val取代,优选被Ala、Gly或Trp取代。在另一个方面中,该变体包括SEQ ID NO:2的成熟多肽的取代N200A,G,W或由其组成。
[0163] 在另一个方面中,该变体在对应于位置197和198的位置处包括一个改变或由其组成,如上文描述的那些。
[0164] 在另一个方面中,该变体在对应于位置197和199的位置处包括改变或由其组成,如上文描述的那些。
[0165] 在另一个方面中,该变体在对应于位置197和200的位置处包括改变或由其组成,如上文描述的那些。
[0166] 在另一个方面中,该变体在对应于位置198和199的位置处包括改变或由其组成,如上文描述的那些。
[0167] 在另一个方面中,该变体在对应于位置198和200的位置处包括改变或由其组成,如上文描述的那些。
[0168] 在另一个方面中,该变体在对应于位置199和200的位置处包括改变或由其组成,如上文描述的那些。
[0169] 在另一个方面中,该变体在对应于位置197、198和199的位置处包括改变或由其组成,如上文描述的那些。
[0170] 在另一个方面中,该变体在对应于位置197、198和200的位置处包括改变或由其组成,如上文描述的那些。
[0171] 在另一个方面中,该变体在对应于位置197、199和200的位置处包括改变或由其组成,如上文描述的那些。
[0172] 在另一个方面中,该变体在对应于位置198、199和200的位置处包括改变或由其组成,如上文描述的那些。
[0173] 在另一个方面中,该变体在对应于位置197、198、199及200的位置处包括改变或由其组成,如上文描述的那些。
[0174] 在另一个方面中,该变体包括选自下组的一种或多种改变或由其组成,该组由以下各项组成:N197A、N198A、A199*以及N200A,G,W。
[0175] 在另一个方面中,该变体包括SEQ ID NO:2的成熟多肽的改变N197A+N198A或由其组成。
[0176] 在另一个方面中,该变体包括SEQ ID NO:2的成熟多肽的改变N197A+A199*或由其组成。
[0177] 在另一个方面中,该变体包括SEQ ID NO:2的成熟多肽的改变N197A+N200A,G,W或由其组成。
[0178] 在另一个方面中,该变体包括SEQ ID NO:2的成熟多肽的改变N198A+A199*或由其组成。
[0179] 在另一个方面中,该变体包括SEQ ID NO:2的成熟多肽的改变N198A+N200A,G,W或由其组成。
[0180] 在另一个方面中,该变体包括SEQ ID NO:2的成熟多肽的改变A199*+N200A,G,W或由其组成。
[0181] 在另一个方面中,该变体包括SEQ ID NO:2的成熟多肽的改变N197A+N198A+A199*或由其组成。
[0182] 在另一个方面中,该变体包括SEQ ID NO:2的成熟多肽的改变N197A+N198A+N200A,G,W或由其组成。
[0183] 在另一个方面中,该变体包括SEQ ID NO:2的成熟多肽的改变N197A+A199*+N200A,G,W或由其组成。
[0184] 在另一个方面中,该变体包括SEQ ID NO:2的成熟多肽的改变N198A+A199*+N200A,G,W或由其组成。
[0185] 在另一个方面中,该变体包括SEQ ID NO:2的成熟多肽的改变N197A+N198A+A199*+N200A,G,W或由其组成。
[0186] 在一个实施例中,该变体包括SEQ ID NO:6或其成熟多肽或由其组成。
[0187] 在另一实施例中,该变体包括SEQ ID NO:45或其成熟多肽或由其组成。
[0188] 在另一实施例中,该变体包括SEQ ID NO:47或其成熟多肽或由其组成。
[0189] 在另一实施例中,该变体包括SEQ ID NO:49或其成熟多肽或由其组成。
[0190] 在另一实施例中,该变体包括SEQ ID NO:51或其成熟多肽或由其组成。
[0191] 在另一实施例中,该变体包括SEQ ID NO:66或其成熟多肽或由其组成。
[0192] 在另一实施例中,该变体包括SEQ ID NO:76或其成熟多肽或由其组成。
[0193] 这些变体可以进一步在一个或多个(例如,若干个)其他位置处包括一个或多个另外的改变,例如,取代、插入或缺失。
[0194] 这些氨基酸变化可以具有微小性质,即,不会显著地影响蛋白质的折叠和/或活性的保守氨基酸取代或插入;典型地1-30个氨基酸的小缺失;小的氨基-或羧基-末端延伸,如氨基末端的甲硫氨酸残基;多达20-25个残基的小接头肽;或便于通过改变净电荷或另一种功能来纯化的小延伸,如聚组氨酸段(tract)、抗原表位或结合结构域。
[0195] 保守取代的实例是在下组的范围内:碱性氨基酸(精氨酸、赖氨酸及组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、异亮氨酸及缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸及酪氨酸)及小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸及甲硫氨酸)。一般不会改变特异性活性的氨基酸取代是本领域已知的并且例如由H.诺伊拉特(H.Neurath)和R.L.希尔(R.L.Hill),1979,在蛋白质(The Proteins),学术出版社(Academic Press),纽约中描述。常见取代是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu以及Asp/Gly。
[0196] 可替代地,氨基酸改变具有这样一种性质:改变多肽的物理化学特性。例如,氨基酸改变可以提高多肽的热稳定性、改变底物特异性、改变最适pH,等等。
[0197] 这些变体可以进一步或甚至进一步在对应于披露在WO 2011/050037、WO 2011/050037、WO 2005/02863、WO 2005/001065、WO 2004/016760以及美国专利号7,375,197中的位置的位置处包括一个或多个(例如,若干个)取代,将其以其全部内容结合在此。
[0198] 可以根据本领域中已知的程序,如定点诱变或丙氨酸扫描诱变(坎宁汉(Cunningham)和威尔斯(Wells),1989,科学(Science)244:1081-1085)来鉴定多肽中的必需氨基酸。在后一种技术中,在分子中的每个残基处引入单一丙氨酸突变,并且测试所得突变分子的纤维二糖水解酶活性以鉴定对该分子的活性至关重要的氨基酸残基。还参见,希尔顿(Hilton)等人,1996,生物化学杂志(J.Biol.Chem.)271:4699-4708。也可结合假定接触位点氨基酸的突变,如通过以下技术例如核磁共振、结晶学、电子衍射、或光亲和标记进行确定的对结构进行物理学分析,从而确定酶的活性位点或其他生物学相互作用。参见,例如,德弗斯(de Vos)等人,1992,科学(Science)255:306-312;史密斯(Smith)等人,1992,分子生物学杂志(J.Mol.Biol.)224:899-904;乌乐达维尔(Wlodaver)等人,1992,欧洲生化学会联合会快报(FEBS Lett.)309:59-64。还可以从与相关多肽的比对来推断鉴别必需氨基酸。
[0199] 这些变体可以由370至507个氨基酸,例如370至380、380至390、390至400、400至410、410至420、420至430、430至440、450至460、460至470、470至480、480至490、490至500、或500至507个氨基酸组成。
[0200] 在以上描述的实施例的每个实施例中,本发明的变体可以是一种杂合多肽(嵌合体),其中该变体的一个区域被另一种多肽的一个区域替换。在一个方面中,该区域是一个碳水化合物结合结构域。变体的碳水化合物结合结构域可以被另一个(异源)碳水化合物结合结构域替换。
[0201] 在以上描述的实施例的每个实施例中,本发明的变体可以是一种融合多肽或可切割的融合多肽,其中另一个多肽融合在该变体的N-末端或C-末端处。在一个方面中,另一种多肽是一个碳水化合物结合结构域。可以将无碳水化合物结合结构域的本发明的变体的催化结构域融合至一个碳水化合物结合结构域。通过将编码另一多肽的多核苷酸融合至编码本发明的变体的多核苷酸而产生融合多肽。用于产生融合多肽的技术在本领域是已知的,并且包括连接编码多肽的编码序列,这样使得它们在框内并且融合多肽的表达处于相同的一个或多个启动子和终止子的控制下。融合多肽还可以使用内含肽技术来构建,其中融合多肽在翻译后产生(库珀(Cooper)等人,1993,欧洲分子生物学学会杂志(EMBO J.)12:2575-2583;道森(Dawson)等人,1994,科学(Science)266:776-779)。
[0202] 融合多肽可在两个多肽之间进一步包括一个切割位点。在融合蛋白分泌之时,该位点被切割,从而释放出这两个多肽。切割位点的实例包括但不限于在以下文献中披露的位 点 :马 丁 ( Ma r t i n ) 等 人 ,2 0 0 3 ,工 业 微 生 物 与 生 物 技 术 杂 志(J.Ind.Microbiol.Biotechnol.)3:568-576;斯维特娜(Svetina)等人,2000,生物技术杂志(J.Biotechnol.)76:245-251;拉斯穆森-威尔逊(Rasmussen-Wilson)等人,1997,应用与环境微生物学(Appl.Environ.Microbiol.)63:3488-3493;沃德(Ward)等人,1995,生物技术(Biotechnology)13:498-503;以及孔特雷拉斯(Contreras)等人,1991,生物技术9:378-381;伊顿(Eaton)等人,1986,生物化学(Biochemistry)25:505-512;柯林斯-拉西(Collins-Racie)等人,1995,《生物技术》13:982-987;卡特(Carter)等人,1989,蛋白质:结构、功能以及遗传学(Proteins:Structure,Function,and Genetics)6:240-248;以及史蒂文斯(Stevens),2003,药物发现世界(Drug Discovery World)4:35-48。
[0203] 在一个实施例中,该变体是一种杂合或嵌合多肽,其中该变体的碳水化合物结合结构域被一个不同的碳水化合物结合结构域替换。在另一个实施例中,该变体是一种融合蛋白,其中一个异源碳水化合物结合结构域融合至该变体。在一个方面中,该碳水化合物结合结构域被融合至该变体的N-末端。在另一个方面中,该碳水化合物结合结构域被融合至该变体的C-末端。
[0204] 在一个实施例中,与亲本酶相比,该变体具有增加的比性能。
[0205] 亲本纤维二糖水解酶
[0206] 该亲本纤维二糖水解酶可以是任何纤维二糖水解酶I。
[0207] 在一个实施例中,该亲本纤维二糖水解酶可以是(a)一种与SEQ ID NO:2的成熟多肽具有至少60%序列一致性的多肽;(b)一种由以下多核苷酸编码的多肽,该多核苷酸在低严格条件下与SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:4的成熟多肽编码序列或其全长互补体杂交;或(c)一种由以下多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:4的成熟多肽编码序列具有至少60%序列一致性。
[0208] 在另一个实施例中,该亲本纤维二糖水解酶还可以是(a)一种与SEQ ID NO:8的成熟多肽具有至少60%序列一致性的多肽;(b)一种由以下多核苷酸编码的多肽,该多核苷酸在低严格条件下与SEQ ID NO:7的成熟多肽编码序列或其全长互补体杂交;或(c)一种由以下多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:7的成熟多肽编码序列具有至少60%序列一致性。
[0209] 在另一个实施例中,该亲本纤维二糖水解酶还可以是(a)一种与SEQ ID NO:10的成熟多肽具有至少60%序列一致性的多肽;(b)一种由以下多核苷酸编码的多肽,该多核苷酸在低严格条件下与SEQ ID NO:9的成熟多肽编码序列或其全长互补体杂交;或(c)一种由以下多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:9的成熟多肽编码序列具有至少60%序列一致性。
[0210] 在另一个实施例中,该亲本纤维二糖水解酶还可以是(a)一种与SEQ ID NO:12的成熟多肽具有至少60%序列一致性的多肽;(b)一种由以下多核苷酸编码的多肽,该多核苷酸在低严格条件下与SEQ ID NO:11的成熟多肽编码序列或其全长互补体杂交;或(c)一种由以下多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:11的成熟多肽编码序列具有至少60%序列一致性。
[0211] 在另一个实施例中,该亲本纤维二糖水解酶还可以是(a)一种与SEQ ID NO:14的成熟多肽具有至少60%序列一致性的多肽;(b)一种由以下多核苷酸编码的多肽,该多核苷酸在低严格条件下与SEQ ID NO:13的成熟多肽编码序列或其全长互补体杂交;或(c)一种由以下多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:13的成熟多肽编码序列具有至少60%序列一致性。
[0212] 在另一个实施例中,该亲本纤维二糖水解酶还可以是(a)一种与SEQ ID NO:16的成熟多肽具有至少60%序列一致性的多肽;(b)一种由以下多核苷酸编码的多肽,该多核苷酸在低严格条件下与SEQ ID NO:15的成熟多肽编码序列或其全长互补体杂交;或(c)一种由以下多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:15的成熟多肽编码序列具有至少60%序列一致性。
[0213] 在另一个实施例中,该亲本纤维二糖水解酶还可以是(a)一种与SEQ ID NO:18的成熟多肽具有至少60%序列一致性的多肽;(b)一种由以下多核苷酸编码的多肽,该多核苷酸在低严格条件下与SEQ ID NO:17的成熟多肽编码序列或其全长互补体杂交;或(c)一种由以下多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:17的成熟多肽编码序列具有至少60%序列一致性。
[0214] 在另一个实施例中,该亲本纤维二糖水解酶还可以是(a)一种与SEQ ID NO:20的成熟多肽具有至少60%序列一致性的多肽;(b)一种由以下多核苷酸编码的多肽,该多核苷酸在低严格条件下与SEQ ID NO:19的成熟多肽编码序列或其全长互补体杂交;或(c)一种由以下多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:19的成熟多肽编码序列具有至少60%序列一致性。
[0215] 在另一个实施例中,该亲本纤维二糖水解酶还可以是(a)一种与SEQ ID NO:22的成熟多肽具有至少60%序列一致性的多肽;(b)一种由以下多核苷酸编码的多肽,该多核苷酸在低严格条件下与SEQ ID NO:21的成熟多肽编码序列或其全长互补体杂交;或(c)一种由以下多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:21的成熟多肽编码序列具有至少60%序列一致性。
[0216] 在一个方面中,该亲本与SEQ ID NO:2的成熟多肽具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性,该成熟多肽具有纤维二糖水解酶活性。在另一个方面中,该亲本的氨基酸序列与SEQ ID NO:2的成熟多肽相差多达10个氨基酸,例如1、2、3、4、5、6、7、8、9或10个。
[0217] 在另一个方面中,该亲本与SEQ ID NO:8的成熟多肽具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少
94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性,该成熟多肽具有纤维二糖水解酶活性。在另一个方面中,该亲本的氨基酸序列与SEQ ID NO:8的成熟多肽相差多达10个氨基酸,例如1、2、3、4、5、6、7、8、9或10个。
[0218] 在另一个方面中,该亲本与SEQ ID NO:10的成熟多肽具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少
94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性,该成熟多肽具有纤维二糖水解酶活性。在另一个方面中,该亲本的氨基酸序列与SEQ ID NO:10的成熟多肽相差多达10个氨基酸,例如1、2、3、4、5、6、7、8、9或10个。
[0219] 在另一个方面中,该亲本与SEQ ID NO:12的成熟多肽具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少
94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性,该成熟多肽具有纤维二糖水解酶活性。在另一个方面中,该亲本的氨基酸序列与SEQ ID NO:12的成熟多肽相差多达10个氨基酸,例如1、2、3、4、5、6、7、8、9或10个。
[0220] 在另一个方面中,该亲本与SEQ ID NO:14的成熟多肽具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少
94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性,该成熟多肽具有纤维二糖水解酶活性。在另一个方面中,该亲本的氨基酸序列与SEQ ID NO:14的成熟多肽相差多达10个氨基酸,例如1、2、3、4、5、6、7、8、9或10个。
[0221] 在另一个方面中,该亲本与SEQ ID NO:16的成熟多肽具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少
94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性,该成熟多肽具有纤维二糖水解酶活性。在另一个方面中,该亲本的氨基酸序列与SEQ ID NO:16的成熟多肽相差多达10个氨基酸,例如1、2、3、4、5、6、7、8、9或10个。
[0222] 在另一个方面中,该亲本与SEQ ID NO:18的成熟多肽具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少
94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性,该成熟多肽具有纤维二糖水解酶活性。在另一个方面中,该亲本的氨基酸序列与SEQ ID NO:18的成熟多肽相差多达10个氨基酸,例如1、2、3、4、5、6、7、8、9或10个。
[0223] 在另一个方面中,该亲本与SEQ ID NO:20的成熟多肽具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少
94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性,该成熟多肽具有纤维二糖水解酶活性。在另一个方面中,该亲本的氨基酸序列与SEQ ID NO:20的成熟多肽相差多达10个氨基酸,例如1、2、3、4、5、6、7、8、9或10个。
[0224] 在另一个方面中,该亲本与SEQ ID NO:22的成熟多肽具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少
94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性,该成熟多肽具有纤维二糖水解酶活性。在另一个方面中,该亲本的氨基酸序列与SEQ ID NO:22的成熟多肽相差多达10个氨基酸,例如1、2、3、4、5、6、7、8、9或10个。
[0225] 在另一个方面中,该亲本包括SEQ ID NO:2的氨基酸序列或由其组成。在另一个方面中,该亲本包括SEQ ID NO:2的成熟多肽或由其组成。在另一个方面中,该亲本包括SEQ ID NO:2的氨基酸1至497或由其组成。
[0226] 在另一个方面中,该亲本包括SEQ ID NO:8的氨基酸序列或由其组成。在另一个方面中,该亲本包括SEQ ID NO:8的成熟多肽或由其组成。在另一个方面中,该亲本包括SEQ ID NO:8的氨基酸1至506或由其组成。
[0227] 在另一个方面中,该亲本包括SEQ ID NO:10的氨基酸序列或由其组成。在另一个方面中,该亲本包括SEQ ID NO:10的成熟多肽或由其组成。在另一个方面中,该亲本包括SEQ ID NO:10的氨基酸1至437或由其组成。
[0228] 在另一个方面中,该亲本包括SEQ ID NO:12的氨基酸序列或由其组成。在另一个方面中,该亲本包括SEQ ID NO:12的成熟多肽或由其组成。在另一个方面中,该亲本包括SEQ ID NO:12的氨基酸1至437或由其组成。
[0229] 在另一个方面中,该亲本包括SEQ ID NO:14的氨基酸序列或由其组成。在另一个方面中,该亲本包括SEQ ID NO:14的成熟多肽或由其组成。在另一个方面中,该亲本包括SEQ ID NO:14的氨基酸1至507或由其组成。
[0230] 在另一个方面中,该亲本包括SEQ ID NO:16的氨基酸序列或由其组成。在另一个方面中,该亲本包括SEQ ID NO:16的成熟多肽或由其组成。在另一个方面中,该亲本包括SEQ ID NO:16的氨基酸1至507或由其组成。
[0231] 在另一个方面中,该亲本包括SEQ ID NO:18的氨基酸序列或由其组成。在另一个方面中,该亲本包括SEQ ID NO:18的成熟多肽或由其组成。在另一个方面中,该亲本包括SEQ ID NO:18的氨基酸1至437或由其组成。
[0232] 在另一个方面中,该亲本包括SEQ ID NO:20的氨基酸序列或由其组成。在另一个方面中,该亲本包括SEQ ID NO:20的成熟多肽或由其组成。在另一个方面中,该亲本包括SEQ ID NO:20的氨基酸1至430或由其组成。
[0233] 在另一个方面中,该亲本包括SEQ ID NO:22的氨基酸序列或由其组成。在另一个方面中,该亲本包括SEQ ID NO:22的成熟多肽或由其组成。在另一个方面中,该亲本包括SEQ ID NO:22的氨基酸1至511或由其组成。
[0234] 在另一个方面中,该亲本是SEQ ID NO:2的成熟多肽的一个片段,该片段含有至少420个氨基酸残基,例如至少445个氨基酸残基或至少470个氨基酸残基。
[0235] 在另一个方面中,该亲本是SEQ ID NO:8的成熟多肽的一个片段,该片段含有至少430个氨基酸残基,例如至少455个氨基酸残基或至少480个氨基酸残基。
[0236] 在另一个方面中,该亲本是SEQ ID NO:10的成熟多肽的一个片段,该片段含有至少380个氨基酸残基,例如至少400个氨基酸残基或至少420个氨基酸残基。
[0237] 在另一个方面中,该亲本是SEQ ID NO:12的成熟多肽的一个片段,该片段含有至少380个氨基酸残基,例如至少400个氨基酸残基或至少420个氨基酸残基。
[0238] 在另一个方面中,该亲本是SEQ ID NO:14的成熟多肽的一个片段,该片段含有至少430个氨基酸残基,例如至少455个氨基酸残基或至少480个氨基酸残基。
[0239] 在另一个方面中,该亲本是SEQ ID NO:16的成熟多肽的一个片段,该片段含有至少430个氨基酸残基,例如至少455个氨基酸残基或至少480个氨基酸残基。
[0240] 在另一个方面中,该亲本是SEQ ID NO:18的成熟多肽的一个片段,该片段含有至少380个氨基酸残基,例如至少400个氨基酸残基或至少420个氨基酸残基。
[0241] 在另一个方面中,该亲本是SEQ ID NO:20的成熟多肽的一个片段,该片段含有至少370个氨基酸残基,例如至少390个氨基酸残基或至少410个氨基酸残基。
[0242] 在另一个方面中,该亲本是SEQ ID NO:22的成熟多肽的一个片段,该片段含有至少435个氨基酸残基,例如至少460个氨基酸残基或至少485个氨基酸残基。
[0243] 在另一个方面中,该亲本由以下多核苷酸编码,该多核苷酸在非常低严格条件、低严格条件、中严格条件、中-高严格条件、高严格条件或非常高严格条件下与SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:4的成熟多肽编码序列;或其全长互补体杂交(萨拉布鲁克(Sambrook)等人,1989,分子克隆:实验室手册(Molecular Cloning:A Laboratory Manual),第二版,冷泉港(Cold Spring Harbor),纽约)。
[0244] 在另一个方面中,该亲本由以下多核苷酸编码,该多核苷酸在低严格条件、中严格条件、中-高严格条件、高严格条件或非常高严格条件下与SEQ ID NO:7的成熟多肽编码序列;或其全长互补体杂交(萨拉布鲁克(Sambrook)等人,1989,见上文)。
[0245] 在另一个方面中,该亲本由以下多核苷酸编码,该多核苷酸在低严格条件、中严格条件、中-高严格条件、高严格条件或非常高严格条件下与SEQ ID NO:9的成熟多肽编码序列;或其全长互补体杂交(萨拉布鲁克(Sambrook)等人,1989,见上文)。
[0246] 在另一个方面中,该亲本由以下多核苷酸编码,该多核苷酸在低严格条件、中严格条件、中-高严格条件、高严格条件或非常高严格条件下与SEQ ID NO:11的成熟多肽编码序列;或其全长互补体杂交(萨拉布鲁克(Sambrook)等人,1989,见上文)。
[0247] 在另一个方面中,该亲本由以下多核苷酸编码,该多核苷酸在低严格条件、中严格条件、中-高严格条件、高严格条件或非常高严格条件下与SEQ ID NO:13的成熟多肽编码序列;或其全长互补体杂交(萨拉布鲁克(Sambrook)等人,1989,见上文)。
[0248] 在另一个方面中,该亲本由以下多核苷酸编码,该多核苷酸在低严格条件、中严格条件、中-高严格条件、高严格条件或非常高严格条件下与SEQ ID NO:15的成熟多肽编码序列;或其全长互补体杂交(萨拉布鲁克(Sambrook)等人,1989,见上文)。
[0249] 在另一个方面中,该亲本由以下多核苷酸编码,该多核苷酸在低严格条件、中严格条件、中-高严格条件、高严格条件或非常高严格条件下与SEQ ID NO:17的成熟多肽编码序列;或其全长互补体杂交(萨拉布鲁克(Sambrook)等人,1989,见上文)。
[0250] 在另一个方面中,该亲本由以下多核苷酸编码,该多核苷酸在低严格条件、中严格条件、中-高严格条件、高严格条件或非常高严格条件下与SEQ ID NO:19的成熟多肽编码序列;或其全长互补体杂交(萨拉布鲁克(Sambrook)等人,1989,见上文)。
[0251] 在另一个方面中,该亲本由以下多核苷酸编码,该多核苷酸在低严格条件、中严格条件、中-高严格条件、高严格条件或非常高严格条件下与SEQ ID NO:21的成熟多肽编码序列;或其全长互补体杂交(萨拉布鲁克(Sambrook)等人,1989,见上文)。
[0252] 可以使用SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、或SEQ ID NO:21的多核苷酸或其子序列,以及SEQ ID NO:2、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、或SEQ ID NO:22的多肽或其片段来设计核酸探针,以便根据本领域熟知的方法鉴定和克隆编码来自不同属或种的菌株的亲本的DNA。具体而言,可以根据标准DNA印迹程序,使用这类探针与感兴趣的细胞的基因组DNA或cDNA杂交,以便鉴定和分离其中的对应基因。这类探针可以明显短于完整序列,但是长度应为至少15,例如至少25、至少35、或至少70个核苷酸。优选地,该核酸探针的长度为至少100个核苷酸,例如长度为至少200个核苷酸、至少300个核苷酸、至少400个核苷酸、至少500个核苷酸、至少600个核苷酸、至少700个核苷酸、至少800个核苷酸或至少900个核苷酸。DNA和RNA探针两者都可使用。典型地将探针进行标记(例如,用32P、3H、35S、生物素、或抗生物素蛋白),以检测相应的基因。本发明涵盖此类探针。
[0253] 可以针对与上文所述的探针杂交并编码一个亲本的DNA来筛选由这类其他菌株制备的基因组DNA或cDNA文库。来自这类其他菌株的基因组DNA或其他DNA可以通过琼脂糖或聚丙烯酰胺凝胶电泳,或其他分离技术来分离。来自文库的DNA或分离的DNA可转移到并固定在硝酸纤维素或其他适合的载体材料上。为了鉴定与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、或SEQ ID NO:21或其子序列杂交的克隆或DNA,在DNA印迹中使用载体材料。
[0254] 出于本发明的目的,杂交指示该多核苷酸在非常低至非常高严格条件下与对应于以下各项的标记的核酸探针杂交:(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、或SEQ ID NO:21;(ii)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、或SEQ ID NO:21的成熟多肽编码序列;(iii)其全长互补体;或(iv)其子序列。在这些条件下与该核酸探针杂交的分子可以使用例X射线薄膜或本领域中已知的任何其他检测手段进行检测。
[0255] 在一个方面中,该核酸探针是SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、或SEQ ID NO:21的成熟多肽编码序列。在另一个方面中,该核酸探针是SEQ ID NO:1的核苷酸52至1673、SEQ ID NO:3的核苷酸52至1542、SEQ ID NO:4的核苷酸52至1542、SEQ ID NO:7的核苷酸79至1596、SEQ ID NO:9的核苷酸52至1371、SEQ ID NO:11的核苷酸55至1482、SEQ ID NO:13的核苷酸76至1596、SEQ ID NO:15的核苷酸76至1596、SEQ ID NO:17的核苷酸55至1504、SEQ ID NO:19的核苷酸61至1350、或SEQ ID NO:21的核苷酸55至1587。在另一个方面中,该核酸探针是编码SEQ ID NO:2、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:
12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、或SEQ ID NO:22的多肽;
其成熟多肽;或其片段的多核苷酸。在另一个方面中,该核酸探针是SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:
15、SEQ ID NO:17、SEQ ID NO:19、或SEQ ID NO:21。
[0256] 在另一个方面中,该亲本由以下多核苷酸编码,该多核苷酸与SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:4的成熟多肽编码序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少
96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0257] 在另一个方面中,该亲本由以下多核苷酸编码,该多核苷酸与SEQ ID NO:7的成熟多肽编码序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0258] 在另一个方面中,该亲本由以下多核苷酸编码,该多核苷酸与SEQ ID NO:9的成熟多肽编码序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0259] 在另一个方面中,该亲本由以下多核苷酸编码,该多核苷酸与SEQ ID NO:11的成熟多肽编码序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0260] 在另一个方面中,该亲本由以下多核苷酸编码,该多核苷酸与SEQ ID NO:13的成熟多肽编码序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0261] 在另一个方面中,该亲本由以下多核苷酸编码,该多核苷酸与SEQ ID NO:15的成熟多肽编码序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0262] 在另一个方面中,该亲本由以下多核苷酸编码,该多核苷酸与SEQ ID NO:17的成熟多肽编码序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0263] 在另一个方面中,该亲本由以下多核苷酸编码,该多核苷酸与SEQ ID NO:19的成熟多肽编码序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0264] 在另一个方面中,该亲本由以下多核苷酸编码,该多核苷酸与SEQ ID NO:21的成熟多肽编码序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0265] 在另一个实施例中,该亲本是SEQ ID NO:2、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20或SEQ ID NO:22的成熟多肽的等位基因变体。
[0266] 该亲本还可以是一种杂合或嵌合多肽,其中亲本的一个区域被另一个多肽的区域替换。在一个方面中,该区域是一个碳水化合物结合结构域。亲本的碳水化合物结合结构域可以被另一个(异源)碳水化合物结合结构域替换。
[0267] 该亲本还可以是一种融合多肽或可切割的融合多肽,其中另一个多肽融合在该亲本的N-末端或C-末端处。在一个方面中,另一种多肽是一个碳水化合物结合结构域。可以将无碳水化合物结合结构域的亲本的催化结构域融合至一个碳水化合物结合结构域。通过将编码另一多肽的多核苷酸融合至编码亲本的多核苷酸而产生融合多肽。用于产生融合多肽的技术见上文所描述。融合多肽可以在两个多肽之间进一步包括一个切割位点,如见上文所描述。
[0268] 在一个实施例中,该亲本是一种杂合多肽,其中该亲本的碳水化合物结合结构域被一个不同的碳水化合物结合结构域替换。在另一个实施例中,该亲本是一种融合蛋白,其中一个异源碳水化合物结合结构域融合至无碳水化合物结合结构域的该亲本。在一个方面中,该碳水化合物结合结构域被融合至该亲本的N-末端。在另一个方面中,该碳水化合物结合结构域被融合至该亲本的C-末端。在另一个方面中,该融合蛋白包括SEQ ID NO:73或其成熟多肽或由其组成。SEQ ID NO:73由SEQ ID NO:72编码。
[0269] 该亲本可以获自任何属的微生物。出于本发明的目的,如在此结合一种给定的来源使用的术语“从...中获得”应意指由多核苷酸编码的亲本是由该来源或者由其中已经插入来自该来源的多核苷酸的一种菌株产生的。在一个方面中,该亲本是胞外分泌的。
[0270] 该亲本可以是一种丝状真菌纤维二糖水解酶。例如,该亲本可以是一种丝状真菌纤维二糖水解酶,如曲霉属、毛壳菌属、金孢子菌属、毁丝霉属、青霉属、踝节菌属、嗜热子嚢菌属或木霉属纤维二糖水解酶。
[0271] 在一个方面中,该亲本是棘孢曲霉、泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、嗜热毛壳菌、狭边金孢子菌(Chrysosporium inops)、嗜质金孢子菌(Chrysosporium keratinophilum)、卢克诺文思金孢子菌(Chrysosporium lucknowense)、莫达瑞姆金孢子菌(Chrysosporium merdarium)、租金孢子菌(Chrysosporium pannicola)、昆士兰金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌
(Chrysosporium tropicum)、带纹金孢子菌(Chrysosporium zonatum)、嗜热毁丝霉、埃默森青霉、绳状青霉菌、产紫青霉菌、丝衣霉状篮状菌(Talaromyces byssochlamydoides)、埃默森篮状菌、Talaromyces leycettanus、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉纤维二糖水解酶。
[0272] 在另一个方面中,该亲本是里氏木霉纤维二糖水解酶,例如SEQ ID NO:2或其成熟多肽的纤维二糖水解酶。
[0273] 在另一个方面中,该亲本是烟曲霉纤维二糖水解酶,例如SEQ ID NO:8或其成熟多肽的纤维二糖水解酶。
[0274] 在另一个方面中,该亲本是金黄色嗜热子囊菌纤维二糖水解酶,例如SEQ ID NO:10或其成熟多肽的纤维二糖水解酶。
[0275] 在另一个方面中,该亲本是埃默森青霉(Penicillium emersonii或Rasamsonia emersonii)纤维二糖水解酶,例如,SEQ ID NO:12的纤维二糖水解酶或其成熟多肽。
[0276] 在另一个方面中,该亲本是Talaromyces leycettanus纤维二糖水解酶,例如SEQ ID NO:14或其成熟多肽的纤维二糖水解酶。
[0277] 在另一个方面中,该亲本是另一种Talaromyces leycettanus纤维二糖水解酶,例如SEQ ID NO:16或其成熟多肽的纤维二糖水解酶。
[0278] 在另一个方面中,该亲本是丝衣霉状篮状菌纤维二糖水解酶,例如SEQ ID NO:18或其成熟多肽的纤维二糖水解酶。
[0279] 在另一个方面中,该亲本是另一种嗜热毁丝霉纤维二糖水解酶,例如SEQ ID NO:20或其成熟多肽的纤维二糖水解酶。
[0280] 在另一个方面中,该亲本是另一种嗜热毛壳菌纤维二糖水解酶,例如SEQ ID NO:22或其成熟多肽的纤维二糖水解酶。
[0281] 将理解的是,对于以上提到的物种而言,本发明涵盖完全状态和不完全状态(perfect and imperfect states)二者、以及其他分类学等效物,例如无性型,而不管它们已知的物种名称是什么。本领域的普通技术人员将容易地识别适当等效物的身份。
[0282] 这些物种的菌株可以容易地在许多培养物保藏中心为公众所获得,如美国典型培养物保藏中心(ATCC)、德国微生物菌种保藏中心(Deutsche  Sammlung  von Mikroorganismen und Zellkulturen GmbH,DSMZ)、荷兰菌种保藏中心(Centraalbureau Voor Schimmelcultures,CBS)以及美国农业研究菌种保藏中心北方地区研究中心(NRRL)。
[0283] 可以使用以上提到的探针从其他来源,包括从自然界(例如,土壤、堆肥、水等等)分离的微生物或直接从自然材料(例如,土壤、堆肥、水等等)获得的DNA样品鉴定和获得该亲本。用于从自然生活环境中直接分离微生物和DNA的技术是本领域熟知的。然后可通过在另一种微生物或混合DNA样本的基因组DNA或cDNA文库中类似地进行筛选来获得编码亲本的多核苷酸。一旦用一种或多种探针检测到编码亲本的多核苷酸,就可以通过使用本领域普通技术人员已知的技术分离或克隆该多核苷酸(参见,例如,萨姆布鲁克等人,1989,见上文)。
[0284] 变体的制备
[0285] 本发明还涉及用于获得一种纤维二糖水解酶变体的方法,这些方法包括:(a)在对应于SEQ ID NO:2的成熟多肽位置197、198、199及200的一个或多个位置处向一种亲本纤维二糖水解酶中引入一个改变,其中对应于位置197、198和200的一个或多个位置处的改变是一个取代并且对应于位置199的位置处的改变是一个缺失,并且其中该变体具有纤维二糖水解酶活性;并且任选地(b)回收该变体。
[0286] 可以使用本领域已知的任何诱变程序来制备这些变体,例如定点诱变、合成基因构建、半合成基因构建、随机诱变、改组等。
[0287] 定点诱变是在编码该亲本的多核苷酸中的一个或多个限定位点处引入一个或多个(例如,若干个)突变的技术。在本发明中可以使用任何定点诱变程序。存在可用于制备变体的很多可商购的试剂盒。
[0288] 通过使用涉及含有所希望的突变的寡核苷酸引物的PCR可以体外实现定点诱变。也可以通过盒式诱变进行体外定点诱变,所述盒式诱变涉及由限制性酶在包含编码亲本的多核苷酸的质粒中的位点处切割并且随后将含有突变的寡核苷酸连接在多核苷酸中。通常,消化该质粒与该寡核苷酸的限制性内切酶是相同的,以允许该质粒的粘性末端以及插入片段彼此连接。参见,例如,谢勒(Scherer)和戴维斯(Davis),1979,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)76:4949-4955;以及巴顿(Barton)等人,1990,核酸研究(Nucleic Acids Res.)18:7349-4966。
[0289] 还可以通过本领域已知的方法体内实现定点诱变。参见例如,美国专利申请公开号2004/0171154;斯道瑞希(Storici)等人,2001,自然生物技术(Nature Biotechnol.)19:773-776;卡伦(Kren)等人,1998,自然医学(Nat.Med.)4:285-290;以及凯利萨诺(Calissano)和马奇诺(Macino),1996,真菌遗传学简讯(Fungal Genet.Newslett.)43:15-
16。
[0290] 位点饱和诱变在一个或多个(例如,若干个)特定位置处将多肽编码序列系统性地替代为编码全部19个氨基酸的序列(帕里克(Parikh)和松村(Matsumura),2005,分子生物学杂志(J.Mol.Biol.)352:621-628)。
[0291] 合成基因构建需要体外合成一种设计的多核苷酸分子以编码一种所感兴趣的多肽。基因合成可以利用多种技术来进行,如由田(Tian)等人(2004,自然(Nature)432:1050-1054)所描述的基于多路微芯片的技术、以及其中在光可编程的微流芯片上合成并组装寡核苷酸的类似技术。
[0292] 可以做出单个或多个氨基酸取代、缺失和/或插入并且使用诱变、重组和/或改组的已知方法进行测试,随后进行相关筛选程序,如由里德哈尔-奥尔森(Reidhaar-Olson)和萨奥尔(Sauer),1988,科学(Science)241:53-57;博维(Bowie)和萨奥尔,1989,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)86:2152-2156;WO 95/17413;或WO 95/22625所披露的那些。可以使用的其他方法包括易错PCR、噬菌体展示(例如,洛曼(Lowman)等人,1991,生物化学(Biochemistry)30:10832-10837;美国专利号5,223,409;WO 92/06204)以及区域定向诱变(德比什尔(Derbyshire)等人,1986,基因(Gene)46:145;内尔(Ner)等人,1988,DNA 7:127)。
[0293] 可以结合诱变/改组方法与高通量自动化筛选方法来检测由宿主细胞表达的克隆的、诱变的多肽的活性(内斯(Ness)等人,1999,自然生物技术(Nature Biotechnology)17:893-896)。编码活性多肽的诱变的DNA分子可以回收自宿主细胞,并且使用本领域的标准方法对其进行迅速测序。这些方法允许迅速确定多肽中单个氨基酸残基的重要性。
[0294] 通过组合合成基因构建、和/或定点诱变、和/或随机诱变、和/或改组的多个方面来实现半合成基因构建。半合成构建典型地是,利用合成的多核苷酸片段的一个过程结合PCR技术。因此,基因的限定的区域可以从头合成,而其他区域可以使用位点特异性诱变引物来扩增,而还有其他区域可以经受易错PCR或非易错PCR扩增。然后可以对多核苷酸子序列进行改组。
[0295] 多核苷酸
[0296] 本发明还涉及编码本发明的变体的分离的多核苷酸。
[0297] 核酸构建体
[0298] 本发明还涉及包括编码本发明的一种变体的、可操作地连接至一个或多个控制序列上的一种多核苷酸的核酸构建体,该一个或多个控制序列在与控制序列相容的条件下指导编码序列在一种适合的宿主细胞中的表达。
[0299] 可以按多种方式来操纵该多核苷酸以提供一种变体的表达。取决于表达载体,在其插入载体以前操纵多核苷酸可以是希望的或必需的。用于利用重组DNA方法修饰多核苷酸的技术是本领域熟知的。
[0300] 该控制序列可以是一个启动子,即,被宿主细胞识别以对编码本发明的变体的多核苷酸进行表达的一种多核苷酸。启动子包含介导该变体的表达的转录控制序列。该启动子可以是在宿主细胞中显示出转录活性的任何多核苷酸,包括突变型、截短型及杂合型启动子,并且可以是由编码与该宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。
[0301] 用于在细菌宿主细胞中指导本发明的核酸构建体的转录的合适启动子的实例是从以下基因中获得的启动子:解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌α-淀粉酶基因(amyL)、地衣芽孢杆菌青霉素酶基因(penP)、嗜热脂肪芽孢杆菌麦芽糖淀粉酶基因(amyM)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌xylA和xylB基因、苏云金芽孢杆菌cryIIIA基因(阿盖塞(Agaisse)和勒尔克吕(Lereclus),1994,分子微生物学(Molecular Microbiology)13:97-107)、大肠杆菌lac操纵子、大肠杆菌trc启动子(埃贡(Egon)等人,1988,基因(Gene)69:301-315)、天蓝链霉菌琼脂水解酶基因(dagA)、以及原核β-内酰胺酶基因(维拉-卡马洛夫(Villa-Kamaroff)等人,1978,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)75:3727-3731)、以及tac启动子(德波尔(DeBoer)等人,1983,美国国家科学院院刊80:21-25)。其他启动子描述在吉尔伯特(Gilbert)等人,1980,科学美国人(Scientific American)242:74-94的“来自重组细菌的有用蛋白质(Useful proteins from recombinant bacteria)”;以及在萨姆布鲁克(Sambrook)等人,1989,见上文。串联启动子的实例披露在WO 99/43835中。
[0302] 用于指导本发明的核酸构建体在丝状真菌宿主细胞中的转录的合适启动子的实例是从以下各项的基因获得的启动子:构巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖镰孢胰蛋白酶样蛋白酶(WO 96/00787)、镶片镰孢淀粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢Quinn(WO 00/56900)、米黑根毛霉(Rhizomucor miehei)脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶、以及里氏木霉翻译延长因子,以及NA2-tpi启动子(一种修饰的启动子,其来自曲霉属中性α-淀粉酶基因,其中未翻译的前导序列由曲霉属丙糖磷酸异构酶基因的未翻译的前导序列替代;非限制性实例包括修饰的启动子,其来自黑曲霉中性α-淀粉酶的基因,其中未翻译的前导序列由构巢曲霉或米曲霉丙糖磷酸异构酶基因的未翻译的前导序列替代);以及其突变型启动子、截短型启动子、以及杂合型启动子。其他启动子描述于美国专利号6,011,147中。
[0303] 在酵母宿主中,有用的启动子是从以下各项的基因获得:酿酒酵母烯醇酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3--磷酸脱氢酶(ADH1、ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)以及酿酒酵母3-磷酸甘油酸激酶。罗马诺斯(Romanos)等人,1992,酵母(Yeast)8:423-488描述了酵母宿主细胞的其他有用的启动子。
[0304] 控制序列还可以是由宿主细胞识别以终止转录的一种转录终止子。该终止子可操作地连接至编码该变体的多核苷酸的3'-末端。在该宿主细胞中起作用的任何终止子都可以用于本发明中。
[0305] 用于细菌宿主细胞的优选终止子是从克劳氏芽孢杆菌碱性蛋白酶(aprH)、地衣芽孢杆菌α-淀粉酶(amyL)以及大肠杆菌核糖体RNA(rrnB)的基因获得。
[0306] 用于丝状真菌宿主细胞的优选终止子是从以下各项的基因获得:构巢曲霉乙酰胺酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖镰孢胰蛋白酶样蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶以及里氏木霉翻译延长因子。
[0307] 用于酵母宿主细胞的优选终止子是从以下各项的基因获得:酿酒酵母烯醇酶、酿酒酵母细胞色素C(CYC1)以及酿酒酵母甘油醛-3-磷酸脱氢酶。用于酵母宿主细胞的其他有用的终止子由罗马努斯等人,1992,见上文描述。
[0308] 控制序列还可以是启动子下游和基因的编码序列上游的mRNA稳定子区,其增加该基因的表达。
[0309] 适合的mRNA稳定区的实例是从以下获得的:苏云金芽孢杆菌cryIIIA基因(WO 94/25612)和枯草芽孢杆菌SP82基因(化(Hue)等人,1995,细菌学杂志(Journal of 
Bacteriology)177:3465-3471)。
[0310] 该控制序列还可以是一个前导序列,一种对宿主细胞翻译很重要的非翻译mRNA区域。该前导序列可操作地连接至编码该变体的多核苷酸的5'-末端。可以使用在宿主细胞中具有功能的任何前导序列。
[0311] 用于丝状真菌宿主细胞的优选前导序列是从米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因获得。
[0312] 适用于酵母宿主细胞的前导序列从以下各项的基因获得:酿酒酵母烯醇酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子、以及酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
[0313] 控制序列还可以是一种聚腺苷酸化序列,可操作地连接至该多核苷酸的3’端并且当转录时由宿主细胞识别为将聚腺苷酸残基添加至所转录的mRNA的信号的序列。可以使用在宿主细胞中起作用的任何多腺苷酸化序列。
[0314] 用于丝状真菌宿主细胞的优选聚腺苷酸化序列是从以下各项的基因获得:构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶以及尖镰孢胰蛋白酶样蛋白酶。
[0315] 有用于酵母宿主细胞的多腺苷酸化序列在郭(Guo)和谢尔曼(Sherman),1995,分子细胞生物学(Mol.Cellular Biol.)15:5983-5990中描述。
[0316] 控制序列还可以是编码连接至一个变体的N-末端上的一个信号肽并指导该变体进入细胞的分泌途径的一个信号肽编码区域。多核苷酸的编码序列的5’末端可以固有地含有信号肽编码序列,该信号肽编码序列与编码该变体的编码序列的区段一起天然地连接在翻译阅读框中。可替代地,编码序列5’末端可以包括对于该编码序列是外源的信号肽编码序列。在编码序列不天然地包含信号肽编码序列的情况下,可能需要外源信号肽编码序列。可替代地,外源信号肽编码序列可以简单地置换天然信号肽编码序列,以便增加变体的分泌。然而,可以使用指导表达的变体进入宿主细胞的分泌途径的任何信号肽编码序列。
[0317] 用于细菌宿主细胞的有效信号肽编码序列是从以下各项的基因获得的信号肽编码序列:芽孢杆菌属NCIB 11837产麦芽糖淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌α-淀粉酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)以及枯草芽孢杆菌prsA。西蒙纳(Simonen)和帕尔瓦(Palva),1993,微生物学评论(Microbiological Reviews)57:109-137描述了另外的信号肽。
[0318] 用于丝状真菌宿主细胞的有效信号肽编码序列是获得自以下项的基因的信号肽编码序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、柔毛腐质霉脂肪酶以及米黑根毛霉天冬氨酸蛋白酶。
[0319] 对于酵母宿主细胞有用的信号肽获得自以下项的基因:酿酒酵母α-因子和酿酒酵母转化酶。见上文,罗马诺斯(Romanos)等人(1992)描述了其他有用的信号肽编码序列。
[0320] 该控制序列还可以是编码位于变体的N-末端处的前肽的一个前肽编码序列。生成的多肽被称为前体酶(proenzyme)或多肽原(或者在一些情况下被称为酶原(zymogen))。多肽原通常是无活性的并且可以通过从该多肽原上催化切割或自动催化切割前肽而被转化成一种活性变体。前肽编码序列可以从以下各项的基因获得:枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(WO 95/33836)、米黑根毛霉天冬氨酸蛋白酶、以及酿酒酵母α因子。
[0321] 当信号肽和前肽序列同时存在时,前肽序列的位置紧邻于变体的N-末端,且信号肽序列的位置紧邻于前肽序列的-末端。
[0322] 还令人希望的可以是添加相对于宿主细胞的生长来调节该变体的表达的调节序列。调节序列的实例是使得基因的表达响应于化学或物理刺激(包括调控化合物的存在)而开启或关闭的那些序列。原核系统中的调控序列包括lac、tac以及trp操纵子系统。在酵母中,可以使用ADH2系统或GAL1系统。在丝状真菌中,可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKAα-淀粉酶启动子和米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶I启动子以及里氏木霉纤维二糖水解酶II启动子。调节序列的其他实例是允许基因扩增的那些。在真核系统中,这些调节序列包括在甲氨蝶呤存在下被扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况下,编码该变体的多核苷酸将可操作地连接至该调节序列。
[0323] 表达载体
[0324] 本发明还涉及包含编码本发明的变体的多核苷酸、启动子、以及转录和翻译终止信号的重组表达载体。不同的核苷酸和控制序列可以连接在一起以产生一个重组表达载体,这一重组表达载体可以包括一个或多个便利的限制酶切位点以允许在这些位点处插入或取代编码该变体的多核苷酸。可替代地,该多核苷酸可以通过将该多核苷酸或包括该多核苷酸的核酸构建体插入用于表达的适当载体中来表达。在产生该表达载体时,该编码序列是位于该载体中,这样使得该编码序列与该供表达的适当控制序列可操作地连接。
[0325] 重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA程序,并且能够引起多核苷酸的表达。载体的选择将典型地取决于该载体与有待引入该载体的宿主细胞的相容性。该载体可以是一种线性的或闭合的环状质粒。
[0326] 载体可以是自主复制载体,即,作为染色体外实体存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微染色体或人工染色体。该载体可以包含用于确保自我复制的任何装置。可替代地,该载体可以是这样一种载体,当它被引入该宿主细胞中时,被整合到基因组中并且与其中已整合了它的一个或多个染色体一起复制。此外,可以使用单一载体或质粒或两个或更多个载体或质粒(这些载体或质粒共同含有待引入到宿主细胞的基因组中的总DNA)或转座子。
[0327] 该载体优选包含允许容易选择转化细胞、转染细胞、转导细胞或类似细胞的一个或多个选择性标记。选择性标记是一种基因,该基因的产物提供了杀生物剂抗性或病毒抗性、重金属抗性、营养缺陷型的原养型、等。
[0328] 细菌性选择性标记的实例是地衣芽孢杆菌或枯草芽孢杆菌dal基因,或赋予抗生素抗性(例如氨苄青霉素、氯霉素、卡那霉素、新霉素、大观霉素或四环素抗性)的标记。用于酵母宿主细胞的适合的标记包括但不限于ADE2、HIS3、LEU2、LYS2、MET3、TRP1、以及URA3。用于在丝状真菌宿主细胞中使用的选择性标记包括但不限于:adeA(磷酸核糖氨基咪唑-琥珀甲酰胺合酶)、adeB(磷酸核糖-氨基咪唑合酶)、amdS(乙酰胺酶)、argB(氨酸氨甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)、sC(硫酸腺苷基转移酶)、以及trpC(邻氨基苯甲酸合酶)、以及其等效物。优选在曲霉属细胞中使用的是构巢曲霉或米曲霉amdS和pyrG基因以及吸水链霉菌(Streptomyces hygroscopicus)bar基因。优选在木霉属细胞中使用的是adeA、adeB、amdS、hph以及pyrG基因。
[0329] 选择性标记可以是在W0 2010/039889中描述的双选择性标记系统。在一个方面中,双选择性标记是hph-tk双选择性标记系统。
[0330] 载体优选含有允许载体整合到宿主细胞的基因组中或载体在细胞中独立于基因组自主复制的一个或多个元件。
[0331] 对于整合到该宿主细胞基因组中,该载体可以依靠编码该变体的多核苷酸序列或者用于通过同源或非同源重组整合到该基因组中的该载体的任何其他元件。可替代地,该载体可以包含用于指导通过同源重组而整合到宿主细胞基因组中的一个或多个染色体中的一个或多个精确位置处的另外的多核苷酸。为了增加在精确位置处整合的可能性,这些整合的元件应包含足够数量的核酸,例如100至10,000个碱基对、400至10,000个碱基对、以及800至10,000个碱基对,这些碱基对与对应的靶序列具有高度的序列一致性以提高同源重组的可能性。这些整合元件可以是与宿主细胞的基因组内的靶序列同源的任何序列。此外,这些整合元件可以是非编码多核苷酸或编码多核苷酸。另一方面,该载体可以通过非同源重组整合到宿主细胞的基因组中。
[0332] 对于自主复制,载体可以进一步包括使该载体能够在所讨论的宿主细胞中自主复制的复制起点。复制起点可以是在细胞中起作用的介导自主复制的任何质粒复制子。术语“复制起点”或“质粒复制子”意指使质粒或载体能够在体内复制的多核苷酸。
[0333] 细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177、以及pACYC184的复制起点,以及允许在芽孢杆菌中复制的质粒pUB110、pE194、pTA1060、以及pAMβ1的复制起点。
[0334] 用于在酵母宿主细胞中使用的复制起点的实例是2微米复制起点ARS1、ARS4、ARS1与CEN3的组合以及ARS4与CEN6的组合。
[0335] 在丝状真菌细胞内有用的复制起点的实例是AMA1和ANS1(格姆斯(Gems)等人,1991,基因(Gene)98:61-67;卡伦(Cullen)等人,1987,核酸研究(Nucleic Acids Res.)15:
9163-9175;WO 00/24883)。AMA1基因的分离和包括该基因的质粒或载体的构建可根据WO 
00/24883披露的方法完成。
[0336] 可以将本发明的多核苷酸的多于一个的拷贝插入到一个宿主细胞中以增加变体的产生。通过将序列的至少一个另外的拷贝整合到宿主细胞基因组中或者通过包含一个与该多核苷酸一起的可扩增的选择性标记基因可以获得多核苷酸的增加的拷贝数目,其中通过在适当的选择性试剂的存在下培养细胞可以选择包含选择性标记基因的经扩增的拷贝的细胞、以及由此该多核苷酸的另外的拷贝。
[0337] 用于连接以上所描述的元件以构建本发明的重组表达载体的程序是本领域的普通技术人员熟知的(参见,例如,萨姆布鲁克(Sambrook)等人,1989,见上文)。
[0338] 宿主细胞
[0339] 本发明还涉及重组宿主细胞,这些重组宿主细胞包含编码本发明的变体的、可操作地连接至一个或多个控制序列的一种多核苷酸,该一个或多个控制序列指导本发明的变体的产生。将包含多核苷酸的构建体或载体引入到宿主细胞中,这样使得该构建体或载体被维持作为染色体整合体或作为自主复制的染色体外载体,如早前所描述。术语“宿主细胞”涵盖由于复制期间发生的突变与亲本细胞不同的亲本细胞的任何后代。宿主细胞的选择在很大程度上将取决于编码该变体的基因及其来源。
[0340] 宿主细胞可以是在重组产生一个变体中有用的任何细胞,例如一个原核细胞或一个真核细胞。
[0341] 原核宿主细胞可以是任何革兰氏阳性或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于:芽孢杆菌属、梭菌属、肠球菌属、土芽孢杆菌属、乳杆菌属、乳球菌属、海洋芽孢杆菌属、葡萄球菌属、链球菌属以及链霉菌属。革兰氏阴性细菌包括但不限于:弯曲杆菌属、大肠杆菌、黄杆菌菌、梭杆菌菌、螺杆菌属、泥杆菌属、奈瑟氏菌属、假单胞菌属、沙氏菌属以及脲原体属。
[0342] 细菌宿主细胞可以是任何芽孢杆菌细胞,包括但不限于:嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌以及苏云金芽孢杆菌细胞。
[0343] 细菌宿主细胞还可以是任何链球菌细胞,包括但不限于:似马链球菌、酿脓链球菌、乳房链球菌以及马链球菌兽瘟亚种细胞。
[0344] 细菌宿主细胞还可以是任何链霉菌属细胞,包括但不限于:不产色链霉菌、除虫链霉菌、天蓝链霉菌、灰色链霉菌以及浅青紫链霉菌细胞。
[0345] 将DNA引入芽孢杆菌属细胞中可通过以下来实现:原生质体转化(参见例如,张(Chang)和科恩(Cohen),1979,分子遗传学与基因组学(Mol.Gen.Genet.)168:111-115)、感受态细胞转化(参见,例如,杨格(Young)和斯皮宰曾(Spizizen),1961,细菌学杂志(J.Bacteriol.)81:823-829;或杜拜努(Dubnau)以及大卫杜夫-阿贝尔森(Davidoff-Abelson),1971,分子生物学杂志(J.Mol.Biol.)56:209-221)、电穿孔(参见,例如,茂川(Shigekawa)和道尔(Dower),1988,生物技术(Biotechniques)6:742-751)、或者接合(参见,例如克勒(Koehler)和索恩(Thorne),1987,细菌学杂志169:5271-5278)。将DNA引入大肠杆菌细胞中可通过以下来实现:原生质体转化(参见例如,哈纳汗(Hanahan),1983,分子生物学杂志(J.Mol.Biol.)166:557-580)或电穿孔(参见例如,道尔(Dower)等人,1988,核酸研究(Nucleic Acids Res.)16:6127-6145)。将DNA引入链霉菌属细胞中可通过以下来实现:原生质体转化、电穿孔(参见例如,贡(Gong)等人,2004,叶线形微生物学(Folia Microbiol.)(Praha(布拉格))49:399-405)、接合(参见例如,马佐迪耶(Mazodier)等人,1989,细菌学杂志(J.Bacteriol.)171:3583-3585)、或转导(参见例如,伯克(Burke)等人,
2001,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)98:6289-6294)。将DNA引入假单孢菌属细胞中可通过以下来实现:电穿孔(参见例如,蔡(Choi)等人,2006,微生物学方法杂志(J.Microbiol.Methods)64:391-397)或接合(参见例如,皮内多(Pinedo)和斯梅茨(Smets),2005,应用与环境微生物学(Appl.Environ.Microbiol.)71:51-57)。将DNA引入链球菌属细胞中可通过以下来实现:天然感受态(参见例如,佩里(Perry)和藏满
(Kuramitsu),1981,感染与免疫(Infect.Immun.)32:1295-1297)、原生质体转化(参见,例如,凯特(Catt)和乔克(Jollick),1991,微生物学(Microbios)68:189-207)、电穿孔(参见,例如,巴克利(Buckley)等人,1999,应用与环境微生物学(Appl.Environ.Microbiol.)
65:3800-3804)、或者接合(参见,例如,克莱威尔(Clewell),1981,微生物学评论(Microbiol.Rev.)45:409-436)。然而,可以使用本领域已知的用于将DNA引入宿主细胞中的任何方法。
[0346] 宿主细胞还可以是真核细胞,如哺乳动物、昆虫、植物、或真菌细胞。
[0347] 宿主细胞可以是真菌细胞。如在此使用的“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)、以及接合菌门(Zygomycota)、连同卵菌门(Oomycota)和全部有丝分裂孢子真菌(如由霍克斯沃思(Hawksworth)等人在安斯沃思和拜斯比真菌词典(Ainsworth and Bisby’s Dictionary of The Fungi),第8版,1995,国际应用生物科学中心(CAB International),大学出版社(University Press),英国剑桥(Cambridge,UK)中进行定义的)。
[0348] 该真菌宿主细胞可为酵母细胞。如在此使用的“酵母”包括产子嚢酵母(内孢霉目)、产担子酵母和属于半知菌类(芽孢纲)的酵母。由于酵母的分类在未来可能改变,因此出于本发明的目的,酵母应如酵母的生物学和活性(Biology and Activities of Yeast)(斯金纳(Skinner)、帕斯莫尔(Passmore)、以及达文波特(Davenport)编辑,应用细菌学学会讨论会系列号9(Soc.App.Bacteriol.Symposium Series No.9),1980)中所描述来定义。
[0349] 酵母宿主细胞可以是假丝酵母属、汉逊酵母属、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属、或耶氏酵母属细胞,如乳酸克鲁维酵母(Kluyveromyces lactis)、卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、卵形酵母或解脂耶氏酵母(Yarrowia lipolytica)细胞。
[0350] 真菌宿主细胞可以是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由霍克斯沃思等人,1995,见上文所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖、纤维素、葡聚糖、壳聚糖、甘露聚糖、以及其他复杂多糖构成的菌丝体壁。营养生长是通过菌丝延长,而碳分解代谢是专性需氧的。相反,酵母(如酿酒酵母)的营养生长是通过单细胞菌体的出芽(budding),而碳分解代谢可以是发酵的。
[0351] 丝状真菌宿主细胞可以是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属(Coriolus)、隐球菌属、线黑粉菌科(Filibasidium)、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧属(Pleurotus)、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。
[0352] 例如,丝状真菌宿主细胞可以是泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsis aneirina)、卡内基拟蜡菌(Ceriporiopsis caregiea)、浅黄拟蜡孔菌(Ceriporiopsis gilvescens)、潘诺希塔拟蜡菌(Ceriporiopsis pannocinta)、环带拟蜡菌(Ceriporiopsis rivulosa)、微红拟蜡菌(Ceriporiopsis  subrufa)、虫拟蜡菌(Ceriporiopsis subvermispora)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌、卢克诺文思金孢子菌(Chrysosporium lucknowense)、粪状金孢子菌(Chrysosporium merdarium)、租金孢子菌、女王杜香金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌、褐薄金孢子菌(Chrysosporium zonatum)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolus hirsutus)、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、产紫青霉、黄孢平革菌(Phanerochaete chrysosporium)、射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、埃默森篮状菌、土生梭孢霉、长域毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。
[0353] 可以将真菌细胞通过涉及原生质体形成、原生质体转化、以及细胞壁再生的方法以本身已知的方式转化。用于转化曲霉属和木霉属宿主细胞的适合程序描述于EP 238023、约尔顿(Yelton)等人,1984,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)81:1470-1474以及克里斯滕森(Christensen)等人,1988,生物/技术(Bio/Technology)6:1419-1422中。用于转化镰孢属物种的适合方法由马拉迪尔(Malardier)等人,1989,基因(Gene)78:
147-156和WO 96/00787描述。可以使用由如以下文献描述的程序转化酵母:贝克尔(Becker)和瓜伦特(Guarente),在阿贝尔森(Abelson),J.N.和西蒙(Simon),M.I.编,酵母遗传学与分子生物学指南,酶学方法(Guide to Yeast Genetics and Molecular Biology,Methods in Enzymology),第194卷,第182-187页,学术出版社有限公司(Academic Press,Inc.),纽约;伊藤(Ito)等人,1983,细菌学杂志(J.Bacteriol.)153:
163;以及哈尼恩(Hinnen)等人,1978,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)75:
1920。
[0354] 产生方法
[0355] 本发明还涉及产生变体的方法,这些方法包括(a)在有助于该变体的产生的条件下培养本发明的重组宿主细胞;并且任选地(b)回收该变体。
[0356] 使用本领域已知的方法在适合于产生该变体的一种营养培养基中培养这些宿主细胞。例如,可以通过在一种合适培养基中并且在允许该变体表达和/或分离的条件下进行摇瓶培养,或在实验室或工业发酵罐中进行小规模或大规模发酵(包括连续发酵、分批发酵、进料分批发酵或固态发酵)来培养细胞。该培养是使用本领域中已知的程序,在一种适合营养培养基中发生,该培养基包括碳和氮来源及无机盐。适合的培养基可从商业供应商获得或可以根据公开的组成(例如,在美国典型培养物保藏中心的目录中)制备。如果该变体被分泌到该营养培养基中,则该变体可直接从该培养基中回收。如果该变体没有分泌,则它可从细胞裂解液中回收。
[0357] 可以使用本领域已知的对这些变体特异的方法检测这些变体。这些检测方法包括但不限于,特异性抗体的使用、酶产物的形成或酶底物的消失。例如,可以使用一种酶测定来确定该变体的活性。
[0358] 可以使用本领域已知的方法来回收该变体。例如,可以通过多种常规程序从该营养培养基中回收该变体,这些常规程序包括但不局限于收集、离心、过滤、萃取、喷雾干燥蒸发、或沉淀。在一个方面中,回收了包含本发明的变体的全发酵液。
[0359] 可以通过本领域中已知的多种程序来纯化变体以获得基本上纯的变体,这些程序包括但不限于:色谱法(例如,离子交换色谱、亲和色谱、疏水作用色谱、色谱聚焦以及尺寸排阻色谱)、电泳程序(例如,制备型等电点聚焦)、差别溶解度(例如,硫酸铵沉淀)、SDS-PAGE、或萃取(参见,例如,蛋白质纯化(Protein Purification),詹森(Janson)和赖登(Ryden)编辑,VCH出版社(VCH Publishers),纽约,1989)。
[0360] 发酵液配制品或细胞组合物
[0361] 本发明还涉及包含本发明的变体的一种发酵液配制品或一种细胞组合物。发酵液产物进一步包括在发酵过程中使用的另外的成分,例如像,细胞(包括含有编码本发明的变体的基因的宿主细胞,这些宿主细胞被用于产生该变体)、细胞碎片、生物质、发酵介质和/或发酵产物。在一些实施例中,该组合物是含有一种或多种有机酸、杀死的细胞和/或细胞碎片以及培养基的细胞杀灭的全培养液。
[0362] 如在此使用的术语“发酵液”是指由细胞发酵产生、不经历或经历最低限的回收和/或纯化的制剂。例如,当微生物培养物生长至饱和,在碳限制条件下孵育以允许蛋白质合成(例如,由宿主细胞表达酶)并且分泌到细胞培养基中时,产生发酵液。发酵液可以包含在发酵结束时得到的发酵材料的未分级的或分级的内容物。典型地,发酵液是未分级的并且包括用过的培养基以及例如通过离心去除微生物细胞(例如,丝状真菌细胞)之后存在的细胞碎片。在一些实施例中,发酵液包含用过的细胞培养基、胞外酶以及有活力的和/或无活力的微生物细胞。
[0363] 在一个实施例中,该发酵液配制品和细胞组合物包括一种第一有机酸组分(包括至少一种1-5碳的有机酸和/或其盐)以及一种第二有机酸组分(包括至少一种6碳或更多碳的有机酸和/或其盐)。在一个具体实施例中,该第一有机酸组分是乙酸、甲酸、丙酸、其盐,或前述酸中的两种或更多种的混合物;并且该第二有机酸组分是苯甲酸、环己烷羧酸、4-甲基戊酸、苯乙酸、其盐,或前述酸中的两种或更多种的混合物。
[0364] 在一个方面中,该组合物包含一种或多种有机酸,并且任选地进一步包含杀死的细胞和/或细胞碎片。在一个实施例中,从细胞杀灭的全培养液中去除这些杀死的细胞和/或细胞碎片,以提供不含这些组分的组合物。
[0365] 这些发酵液配制品或细胞组合物可以进一步包含一种防腐剂和/或抗微生物(例如抑菌)剂,包括但不限于山梨醇、氯化钠、山梨酸、以及本领域中已知的其他试剂。
[0366] 这些发酵液配制品或细胞组合物可以进一步包含多种酶活性,如选自由以下各项组成的组的一种或多种(例如,若干种)酶:纤维素酶、半纤维素酶、过氧化氢酶、酯酶、棒曲霉素、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶以及膨胀蛋白。这些发酵液配制品或细胞组合物还可以包括选自下组的一种或多种(例如,若干种)酶,该组由以下各项组成:水解酶、异构酶、连接酶、裂解酶、氧化还原酶或转移酶,例如,α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精葡萄糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变位酶、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白分解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。
[0367] 该细胞杀灭的全培养液或组合物可以包含在发酵终止时得到的发酵物质的未分级的内容物。典型地,该细胞杀灭的全培养液或组合物包含用过的培养基以及在微生物细胞(例如,丝状真菌细胞)生长至饱和、在碳限制条件下孵育以允许蛋白质合成(例如,纤维素酶和/或一种或多种葡糖苷酶的表达)之后存在的细胞碎片。在一些实施例中,细胞杀灭的全培养液或组合物含有耗尽的细胞培养基、胞外酶、和杀死的丝状真菌细胞。在一些实施例中,可以使用本领域已知方法来使细胞杀灭的全培养液或组合物中存在的微生物细胞透性化和/或裂解。
[0368] 在此描述的全培养液或细胞组合物典型地是液体,但是可以含有不溶组分,例如杀死的细胞、细胞碎片、培养基组分、和或一种或多种不溶性酶。在一些实施例中,可以除去不溶性组分以提供澄清的液体组合物。
[0369] 可以通过WO 90/15861或WO 2010/096673所述的方法产生本发明的全培养液配制品和细胞组合物。
[0370] 下文中给出本发明的组合物的优选用途的实例。可以基于本领域已知的方法来确定组合物的剂量和使用该组合物的其他条件。
[0371] 酶组合物
[0372] 本发明还涉及包含本发明的一种变体的组合物。优选地,这些组合物富含这种变体。术语“富含”指示该组合物的纤维二糖水解酶活性已经增加,例如,富集因子为至少1.1。
[0373] 这些组合物可以包括本发明的一种变体作为主要酶组分,例如一种单组分组合物。可替代地,这些组合物可以包括多种酶活性,例如选自下组的一种或多种(如,若干种)酶,该组由以下各项组成:纤维素酶、半纤维素酶、具有增强纤维素分解活性的GH61多肽、过氧化氢酶、酯酶、棒曲霉素、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶以及膨胀蛋白。这些组合物还可以包括选自下组的一种或多种(例如,若干种)酶,该组由以下各项组成:水解酶、异构酶、连接酶、裂解酶、氧化还原酶或转移酶,例如,α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精葡萄糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变位酶、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白分解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。这些组合物可根据本领域已知的方法制备并且可以是液体或干燥组合物的形式。可以根据本领域中已知的方法稳定这些组合物。
[0374] 下文中给出本发明的组合物的优选用途的实例。可以基于本领域已知的方法来确定组合物的剂量和使用该组合物的其他条件。
[0375] 用途
[0376] 本发明还针对使用本发明的具有纤维二糖水解酶I活性的变体或其组合物的以下方法。
[0377] 本发明还涉及用于降解纤维素材料的方法,这些方法包括:在本发明的纤维二糖水解酶变体的存在下,用一种酶组合物处理该纤维素材料。在一个方面中,这些方法进一步包括回收该降解的纤维素材料。可以使用本领域已知的方法将该纤维素材料的降解的可溶性产物与不溶性纤维素材料分开,这些方法是例如像离心、过滤或重力沉降。
[0378] 本发明还涉及产生发酵产物的方法,这些方法包括:(a)在本发明的纤维二糖水解酶变体的存在下,用一种酶组合物糖化一种纤维素材料;(b)用一种或多种(例如,若干种)发酵微生物发酵该糖化的纤维素材料,以产生该发酵产物;并且(c)从发酵中回收该发酵产物。
[0379] 本发明还涉及发酵纤维素材料的方法,这些方法包括:用一种或多种(例如,若干种)发酵微生物发酵该纤维素材料,其中在本发明的纤维二糖水解酶变体的存在下,用一种酶组合物糖化该纤维素材料。在一个方面中,发酵纤维素材料产生发酵产物。在另一个方面中,这些方法进一步包括从发酵中回收该发酵产物。
[0380] 本发明的方法可以用于将纤维素材料糖化为可发酵糖,并且将可发酵糖转化为多种有用的发酵产物,例如燃料(乙醇、正丁醇、异丁醇、生物柴油、喷气燃料)和/或平台化合物(例如酸、醇、、气体、油等)。由该纤维素材料产生所希望的发酵产物典型地涉及预处理、酶水解(糖化)、以及发酵。
[0381] 根据本发明的纤维素材料的加工可以使用本领域常规的方法来完成。此外,本发明的方法可以使用被配置成根据本发明来操作的任何常规生物质加工设备来实施。
[0382] 分开或同时的水解(糖化)和发酵包括但不限于:分开水解和发酵(SHF)、同时糖化和发酵(SSF)、同时糖化和共发酵(SSCF)、杂合的水解和发酵(HHF)、分开水解和共发酵(SHCF)、杂合的水解和共发酵(HHCF),以及直接微生物转化(DMC),有时还被称为合并的生物加工(CBP)。SHF使用分开的处理步骤,以首先将纤维素材料酶促水解为可发酵糖(例如,葡萄糖、纤维二糖、以及戊糖单体),并且然后将可发酵糖发酵为乙醇。在SSF中,纤维素材料的酶水解和糖发酵成乙醇被组合在一个步骤中(菲利皮迪斯·G.P.(Philippidis,G.P.),1996,纤维素生物转化技术(Cellulose bioconversion technology),生物乙醇手册:生产和利用(Handbook on Bioethanol:Production and Utilization),怀曼·C.E(Wyman,C.E.)编辑,泰勒-弗朗西斯出版集团(Taylor&Francis),华盛顿特区(Washington,DC),
179-212))。SSCF涉及多种糖的共发酵(希恩(Sheehan)和希默尔(Himmel),1999,生物技术进展(Biotechnol.Prog.)15:817-827)。HHF涉及一个分开的水解步骤,并且另外涉及一个同时糖化和水解步骤,这些步骤可以在同一反应器中进行。HHF过程中的步骤可以在不同的温度下进行,即高温酶糖化,接着在发酵菌株能够耐受的更低温度下进行SSF。DMC在一个或多个(例如,若干个)步骤中合并了所有的三个过程(酶生产、水解、和发酵),其中使用相同的生物生产用于将纤维素材料转化为可发酵糖的酶并且用于将可发酵糖转化为终产物的酶(林德(Lynd)等人,2002,微生物学与分子生物学评论(Microbiol.Mol.Biol.Reviews)
66:506-577)。在此应理解的是,本领域中已知的包括预处理、酶水解(糖化)、发酵、或其组合的任何方法,可以用于实施本发明的方法。
[0383] 常规的装置可以包括一个分批补料搅拌反应器、一个批式搅拌反应器、一个具有超滤作用的连续流搅拌反应器、和/或一个连续活塞流柱式反应器(continuous plug-flow column reactor)(德卡斯特胡斯克拉兹(de Castilhos Corazza)等人,2003,技术学报(Acta Scientiarum.Technology)25:33-38;古萨考瓦(Gusakov)和斯尼特森(Sinitsyn),1985,酶学与微生物学技术(Enz.Microb.Technol.)7:346-352)、一个碾磨反应器(刘(Ryu)和李(Lee),1983,生物技术与生物工程(Biotechnol.Bioeng.)25:53-65)。另外的反应器类型包括:用于水解和/或发酵的流化床反应器、升流层(upflow blanket)反应器、固定化反应器、以及挤出机型反应器。
[0384] 预处理。在实践本发明的方法中,可以使用本领域中已知的任何预处理工艺来破坏纤维素材料的植物细胞壁组分(钱德拉(Chandra)等人,2007,生化工程/生物技术进展(Adv.Biochem.Engin./Biotechnol.)108:67-93;盖尔贝(Galbe)和赛琪(Zacchi),2007,生化工程/生物技术进展,108:41-65;亨德里克斯(Hendriks)和塞曼(Zeeman),2009,生物资源技术(Bioresource Technol.)100:10-18;马塞尔(Mosier)等人,2005,生物资源技术96:673-686;泰和拉德(Taherzadeh)和卡里米(Karimi),2008,分子科学国际杂志(Int.J.of Mol.Sci.)9:1621-1651;杨(Yang)和怀曼(Wyman),2008,生物燃料,生物产品和生物精制Biofpr.(Biofuels Bioproducts and Biorefining-Biofpr.)2:26-40)。
[0385] 纤维素材料也可以在预处理之前使用本领域中已知的方法进行粒度减小、筛分、预浸泡、润湿、洗涤和/或调理。
[0386] 常规预处理包括但不限于:蒸汽预处理(伴随或不伴随爆炸)、稀酸预处理、热水预处理、碱预处理、石灰预处理、湿氧化、湿爆炸、氨纤维爆炸、有机溶剂预处理、以及生物预处理。另外的预处理包括氨渗滤、超声、电穿孔、微波、超临界CO2、超临界H2O、臭氧、离子液体以及γ辐射预处理。
[0387] 可以在水解和/或发酵之前对纤维素材料进行预处理。优选在水解前进行预处理。可替代地,可以同时用酶水解进行预处理,以释放可发酵糖,例如葡萄糖、木糖、和/或纤维二糖。在多数情况下,预处理步骤自身导致将生物质转化为可发酵糖(即使在没有酶的情况下)。
[0388] 蒸汽预处理。在蒸汽预处理中,加热纤维素材料以破坏植物细胞壁成分,包括木质素、半纤维素、以及纤维素,以使纤维素和其他级分,例如,半纤维素可接近酶。纤维素材料经过或穿过反应容器,将蒸汽注入该反应容器以增加温度至所需温度和压力,并且将蒸汽保持在其中持续希望的反应时间。优选在140℃-250℃,例如160℃-200℃或170℃-190℃进行蒸汽预处理,其中最佳温度范围取决于化学催化剂的任选添加。蒸汽预处理的停留时间优选是1-60分钟,例如1-30分钟、1-20分钟、3-12分钟、或4-10分钟,其中最适停留时间取决于温度和化学催化剂的任选添加。蒸汽预处理允许相对较高的固体加载量,这样使得纤维素材料在预处理过程中通常仅变得潮湿。蒸汽预处理经常与预处理后的材料的爆炸放料组合,这被称为蒸汽爆炸,即,快速闪变至大气压和材料湍流,以通过破碎增加可及的表面积(达夫(Duff)和默里(Murray),1996,生物资源技术(Bioresource Technology)855:1-33;盖博(Galbe) 和小林(Zacchi) ,20 02,应用微生物学与生物技 术
(Appl.Microbiol.Biotechnol.)59:618-628;美国专利申请号2002/0164730)。在蒸汽预处理过程中,半纤维素乙酰基被裂解,并且所得到的酸自催化半纤维素部分水解成单糖和寡糖。仅在有限的程度上去除木质素。
[0389] 化学预处理:术语“化学处理”是指促进纤维素、半纤维素和/或木质素的分离和/或释放的任何化学预处理。这种预处理可以将结晶纤维素转化为无定形纤维素。适合的化学预处理工艺的实例包括例如稀酸预处理、石灰预处理、湿法氧化、氨纤维/冷冻膨胀(AFEX)、氨渗滤(APR)、离子液体、以及有机溶剂预处理。
[0390] 有时在蒸汽预处理之前添加一种化学催化剂(例如H2SO4或SO2)(典型地是0.3至5%w/w),该催化剂减少时间并降低温度、增加回收率、并改进酶水解(巴列斯特罗斯(Ballesteros)等人,2006,应用生物化学与生物技术(Appl.Biochem.Biotechnol.)129-
132:496-508;瓦尔加(Varga)等人,2004,应用生物化学与生物技术113-116:509-523;塞斯尼尔(Sassner)等人,2006,酶与微生物技术(Enzyme Microb.Technol.)39:756-762)。在稀酸预处理中,纤维素材料与稀酸(典型地是H2SO4)和水混合,以形成浆料,由蒸汽加热至希望的温度,并且在停留时间后闪变至大气压。可采用多种反应器设计来进行稀酸预处理,例如活塞流反应器、逆流反应器或连续逆流收缩床反应器(达夫(Duff)和默里(Murray),1996,见上文;谢尔(Schell)等人,2004,生物资源技术(Bioresource Technology)91:179-188;
李(Lee)等人,1999,生物化学工程/生物技术进展(Adv.Biochem.Eng.Biotechnol.)65:93-
115)。
[0391] 还可以使用在碱性条件下的若干种预处理方法。这些碱性预处理包括但不限于:氢氧化钠、石灰、湿氧化、氨渗滤(APR)、以及氨纤维/冷冻膨胀(AFEX)预处理。
[0392] 用氧化或氢氧化钙,在85℃-150℃的温度下进行石灰预处理,并且停留时间为从1小时到几天(怀曼(Wyman)等人,2005,生物资源技术(Bioresource Technol.)96:1959-1966;马塞尔(Mosier)等人,2005,生物资源技术96:673-686)。WO 2006/110891、WO 2006/
110899、WO 2006/110900以及WO 2006/110901披露了使用氨的预处理方法。
[0393] 湿氧化是一种热预处理,其典型地在添加氧化剂(如过氧化氢或过压氧)的情况下在180℃-200℃下持续5-15分钟进行(施密特(Schmidt)和汤姆森(Thomsen),1998,生物资源技术(Bioresource Technol.)64:139-151;帕罗内(Palonen)等人,2004,应用生物化学与生物技术(Appl.Biochem.Biotechnol.)117:1-17;瓦尔加等人,2004,生物技术与生物工程(Biotechnol.Bioeng.)88:567-574;马丁(Martin)等人,2006,化学技术与生物技术杂志(J.Chem.Technol.Biotechnol.)81:1669-1677)。优选在1%-40%干物质,例如2%-30%干物质或5%-20%干物质进行预处理,并且通常通过添加碱,例如碳酸钠提高初始pH。
[0394] 被称为湿爆炸(湿氧化和蒸汽爆炸的组合)的湿氧化预处理方法的修改方案能够处理高达30%的干物质。在湿爆炸中,在某一停留时间后,在预处理期间引入氧化剂(oxidizing agent)。然后通过急骤蒸发至大气压结束预处理(WO 2006/03228)。
[0395] 氨纤维膨胀(AFEX)涉及在如90℃-150℃的中等温度和如17至20巴的高压下,用液体或气态氨处理纤维素材料5至10分钟,其中干物质含量可以高达60%(格拉帕里(Gollapalli)等人,2002,应用生物化学与生物技术(Appl.Biochem.Biotechnol.)98:23-
35;俊达瓦特(Chundawat)等人,2007,生物技术与生物工程(Biotechnol.Bioeng.)96:219-
231;阿里扎德(Alizadeh)等人,2005,应用生物化学与生物技术121:1133-1141;泰莫里(Teymouri)等人,2005,生物资源技术(Bioresource Technology)96:2014-2018)。在AFEX预处理过程中,纤维素和半纤维素保持相对完整。木质素-碳水化合物复合物被裂解。
[0396] 有机溶剂预处理通过使用含水乙醇(40%-60%乙醇)在160℃-200℃下萃取30-60分钟而将纤维素材料脱木质素(潘(Pan)等人,2005,生物技术与生物工程(Biotechnol.Bioeng.)90:473-481;潘等人,2006,生物技术与生物工程94:851-861;库拉比(Kurabi)等人,2005,应用生物化学与生物技术(Appl.Biochem.Biotechnol.)121:219-
230)。通常加入硫酸作为催化剂。在有机溶剂预处理中,大部分半纤维素和木质素被去除。
[0397] 适合的预处理方法的其他实例由谢尔(Schell)等人,2003,应用生物化学与生物技术(Appl.Biochem.Biotechnol.)105-108:69-85,和马塞尔(Mosier)等人,2005,生物资源技术(Bioresource Technology)96:673-686,以及美国专利申请2002/0164730进行描述。
[0398] 在一个方面中,化学预处理优选作为稀酸处理,并且更优选作为连续稀酸处理进行。酸通常是硫酸,但也可以使用其他酸,如乙酸、柠檬酸、硝酸、磷酸、酒石酸琥珀酸、氯化氢、或其混合物。弱酸处理优选在1至5,例如1至4或1至2.5的pH范围中进行。在一个方面中,酸浓度优选处于从0.01wt.%至10wt.%酸,例如0.05wt.%至5wt.%酸或0.1wt.%至2wt.%酸的范围内。使酸与纤维素材料相接触,并且保持在优选140℃-200℃,例如165℃-
190℃范围内的温度下,持续从1至60分钟范围内的时间。
[0399] 在另一个方面中,预处理在水性浆料中进行。在优选方面中,在预处理过程中纤维素材料以优选在10wt%-80wt%之间,如20wt%-70wt%或30wt%-60wt%,如大约40wt%的量存在。预处理的纤维素材料可以不洗涤或使用本领域已知的任何方法洗涤,例如,用水洗涤。
[0400] 机械预处理或物理预处理:术语“机械预处理”或“物理预处理”是指促进颗粒粒度减小的任何预处理。例如,这种预处理可以涉及各种类型的研磨或碾磨(例如,干磨、湿磨、或振动球磨)。
[0401] 纤维素材料可以物理地(机械地)且化学地预处理。机械或物理预处理可以与以下相结合:蒸汽/蒸汽爆炸、水热解(hydrothermolysis)、稀酸或弱酸处理、高温、高压处理、辐射(例如微波福射)或其组合。在一个方面中,高压意指在优选约100至约400psi,例如约150至约250psi范围中的压力。在另一个方面中,高温意指在约100℃至约300℃,例如约140℃至约200℃范围内的温度。在一个优选方面中,机械或物理预处理在分批过程中使用蒸汽枪水解器系统,例如从顺智公司(Sunds Defibrator AB),瑞典可获得的顺智水解器(Sunds Hydrolyzer)来进行,该系统使用如上所定义的高压和高温。这些物理预处理和化学预处理可以根据需要顺序地进行或同时进行。
[0402] 因此,在一个优选方面中,使纤维素材料经受物理(机械)或化学预处理、或其任何组合,以促进纤维素、半纤维素和/或木质素的分离和/或释放。
[0403] 生物预处理:术语“生物预处理”是指促进纤维素、半纤维素、和/或木质素从纤维素材料中分离和/或释放的任何生物预处理。生物预处理技术可以涉及应用溶解木质素的微生物和/或酶(参见,例如,舒·T.-A.(Hsu,T.-A.),1996,生物质的预处理(Pretreatment of biomass),生物乙醇手册:生产和利用(Handbook on Bioethanol:Production and Utilization),怀曼C.E.(Wyman,C.E.)编辑,泰勒-弗朗西斯出版集团,华盛顿特区,179-212;高希(Ghosh)和辛格(Singh),1993,应用微生物学进展(Adv.Appl.Microbiol.)39:
295-333;麦克米兰·J.D.(McMillan,J.D.),1994,预处理木质纤维素生物质:综述(Pretreating lignocellulosic biomass:a review),用于燃料生产的生物质的酶转化(Enzymatic Conversion of Biomass for Fuels Production),希默尔·M.E.(Himmel,M.E.)、贝克·J.O.(Baker,J.O.)、以及奥弗伦·R.P.(Overend,R.P.)编辑,美国化学学会讨论会系列566(ACS Symposium Series 566),美国化学学会(American Chemical Society),华盛顿特区,第15章;贡·C.S.(Gong,C.S.)、卡奥·N.J.(Cao,N.J.)、杜·J.(Du,J.)、以及曹·G.T.(Tsao,G.T.),1999,由可再生资源生产乙醇(Ethanol production from renewable resources),生物化学工程/生物技术的进展(Advances in Biochemical Engineering/Biotechnology),舍佩尔·T.(Scheper,T.)编辑,施普林格出版社
(Springer-Verlag),柏林,海德堡,德国,65:207-241);奥尔森(Olsson)和哈恩-哈格达尔(Hahn-Hagerdal),1996,酶与微生物技术(Enz.Microb.Tech.)18:312-331;以及瓦蓝德(Vallander)和埃里克松(Eriksson),1990,生物化学工程/生物技术的进展42:63-95)。
[0404] 糖化。在水解步骤(还称为糖化)中,将(例如预处理的)纤维素材料水解,以将纤维素和/或半纤维素分解成可发酵糖,如葡萄糖、纤维二糖、木糖、木酮糖、阿拉伯糖、甘露糖、半乳糖和/或可溶性寡糖。水解由酶组合物在本发明的纤维二糖水解酶变体的存在下酶促进行。这些组合物的酶可以同时或依次添加。
[0405] 酶水解优选在易于由本领域技术人员确定的条件下,在合适的含水环境中执行。在一个方面中,水解在适合于一种或多种酶的活性,即对于该一种或多种酶来说最佳的条件下进行。水解可以作为进料分批过程或连续过程进行,其中将纤维素材料逐渐进料至例如含酶的水解溶液中。
[0406] 糖化通常在受控的pH、温度以及混合条件下在搅拌釜反应器或发酵罐中进行。适合的处理时间、温度以及pH条件可以由本领域技术人员容易地确定。例如,糖化可以持续长达200小时,但是典型地进行优选约12至约120小时,例如约16至约72小时或约24至约48小时。温度优选在约25℃至约70℃,例如约30℃至约65℃、约40℃至约60℃、或约50℃至55℃的范围内。pH优选在约3至约8,例如约3.5至约7、约4至约6、或约4.5至约5.5的范围内。干固体含量优选在约5wt%至约50wt%,例如约10wt%至约40wt%或约20wt%至约30wt%的范围内。
[0407] 这些酶组合物可以包含有用于降解纤维素材料的任何蛋白。
[0408] 在一个方面中,该酶组合物包括或进一步包括选自下组的一种或多种(如,若干种)蛋白质,该组由以下各项组成:纤维素酶、具有纤维素分解增强活性的GH61多肽、半纤维素酶、酯酶、棒曲霉素、木质素分解酶、氧化还原酶、果胶酶、蛋白酶以及膨胀蛋白。在另一方面中,该纤维素酶优选是选自下组的一种或多种(例如,若干种)酶,该组由以下各项组成:内切葡聚糖酶、纤维二糖水解酶以及β-葡糖苷酶。在另一个方面中,该半纤维素酶优选是选自下组的一种或多种(例如,若干种)酶,该组由以下各项组成:乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶以及木糖苷酶。在另一个方面中,该氧化还原酶优选是选自下组的一种或多种(例如,若干种)酶,该组由以下各项组成:过氧化氢酶、漆酶以及过氧化物酶。
[0409] 在另一个方面中,该酶组合物包括一种或多种(例如,若干种)纤维素分解酶。在另一个方面中,该酶组合物包括或进一步包括一种或多种(例如,若干种)半纤维素分解酶。在另一个方面中,该酶组合物包括一种或多种(例如,若干种)纤维素分解酶和一种或多种(例如,若干种)半纤维素分解酶。在另一个方面中,该酶组合物包括选自纤维素分解酶和半纤维素分解酶的组的一种或多种(例如,若干种)酶。在另一个方面中,该酶组合物包括一种内切葡聚糖酶。在另一个方面中,该酶组合物包括一种纤维二糖水解酶。在另一个方面中,该酶组合物包括一种β-葡糖苷酶。在另一个方面中,该酶组合物包括一种具有纤维素分解增强活性的GH61多肽。在另一个方面中,该酶组合物包括一种内切葡聚糖酶和一种具有纤维素分解增强活性的GH61多肽。在另一个方面中,该酶组合物包括一种纤维二糖水解酶和一种具有纤维素分解增强活性的GH61多肽。在另一个方面中,该酶组合物包括一种β-葡糖苷酶和一种具有纤维素分解增强活性的GH61多肽。在另一个方面中,该酶组合物包括一种内切葡聚糖酶和一种纤维二糖水解酶。在另一个方面中,该酶组合物包括一种内切葡聚糖酶和一种纤维二糖水解酶I、一种纤维二糖水解酶II、或纤维二糖水解酶I和纤维二糖水解酶II的组合。在另一个方面中,该酶组合物包括一种内切葡聚糖酶和一种β-葡糖苷酶。在另一个方面中,该酶组合物包括一种β-葡糖苷酶和一种纤维二糖水解酶。在另一个方面中,该酶组合物包括一种β-葡糖苷酶和一种纤维二糖水解酶I、一种纤维二糖水解酶II、或纤维二糖水解酶I和纤维二糖水解酶II的组合。在另一个方面中,该酶组合物包括一种内切葡聚糖酶、一种具有纤维素分解增强活性的GH61多肽以及一种纤维二糖水解酶。在另一个方面中,该酶组合物包括一种内切葡聚糖酶、一种具有纤维素分解增强活性的GH61多肽、以及一种纤维二糖水解酶I、一种纤维二糖水解酶II、或纤维二糖水解酶I和纤维二糖水解酶II的组合。在另一个方面中,该酶组合物包括一种内切葡聚糖酶、一种β-葡糖苷酶、以及一种具有纤维素分解增强活性的GH61多肽。在另一个方面中,该酶组合物包括一种β-葡糖苷酶、一种具有纤维素分解增强活性的GH61多肽、以及一种纤维二糖水解酶。在另一个方面中,该酶组合物包括一种β-葡糖苷酶、一种具有纤维素分解增强活性的GH61多肽、以及一种纤维二糖水解酶I、一种纤维二糖水解酶II、或纤维二糖水解酶I和纤维二糖水解酶II的组合。在另一个方面中,该酶组合物包括一种内切葡聚糖酶、一种β-葡糖苷酶、以及一种纤维二糖水解酶。在另一个方面中,该酶组合物包括一种内切葡聚糖酶、一种β-葡糖苷酶、以及一种纤维二糖水解酶I、一种纤维二糖水解酶II、或纤维二糖水解酶I和纤维二糖水解酶II的组合。在另一个方面中,该酶组合物包括一种内切葡聚糖酶、一种纤维二糖水解酶、一种β-葡糖苷酶、以及一种具有纤维素分解增强活性的GH61多肽。在另一个方面中,该酶组合物包括一种内切葡聚糖酶、一种β-葡糖苷酶、一种具有纤维素分解增强活性的GH61多肽、以及一种纤维二糖水解酶I、一种纤维二糖水解酶II、或纤维二糖水解酶I和纤维二糖水解酶II的组合。
[0410] 在另一个方面中,该酶组合物包括一种乙酰甘露聚糖酯酶。在另一个方面中,该酶组合物包括一种乙酰木聚糖酯酶。在另一个方面中,该酶组合物包括一种阿拉伯聚糖酶(例如,α-L-阿拉伯聚糖酶)。在另一个方面中,该酶组合物包括一种阿拉伯呋喃糖苷酶(例如,α-L-阿拉伯呋喃糖苷酶)。在另一个方面中,该酶组合物包括一种香豆酸酯酶。在另一个方面中,该酶组合物包括一种阿魏酸酯酶。在另一个方面中,该酶组合物包括一种半乳糖苷酶(例如,α-半乳糖苷酶和/或β-半乳糖苷酶)。在另一个方面中,该酶组合物包括一种葡糖醛酸糖苷酶(例如,α-D-葡糖醛酸糖苷酶)。在另一个方面中,该酶组合物包括一种葡萄糖醛酸酯酶。在另一个方面中,该酶组合物包括一种甘露聚糖酶。在另一个方面中,该酶组合物包括一种甘露糖苷酶(例如,β-甘露糖苷酶)。在另一个方面中,该酶组合物包括一种木聚糖酶。在一个优选方面中,该木聚糖酶是一种家族10木聚糖酶。在另一个优选方面中,该木聚糖酶是一种家族11木聚糖酶。在另一个方面中,该酶组合物包括一种木糖苷酶(例如β-木糖苷酶)。
[0411] 在另一个方面中,该酶组合物包括一种酯酶。在另一个方面中,该酶组合物包括一种棒曲霉素。在另一个方面中,该酶组合物包括一种木质素分解酶。在一个优选方面中,该木质素分解酶是一种锰过氧化物酶。在另一个优选方面中,该木质素分解酶是一种木质素过氧化物酶。在另一个优选方面中,该木质素分解酶是一种H2O2产生酶。在另一个方面中,该酶组合物包括一种果胶酶。在另一个方面中,该酶组合物包括一种氧化还原酶。在另一个优选方面中,该氧化还原酶是一种过氧化氢酶。在另一个优选方面中,该氧化还原酶是一种漆酶。在另一个优选方面中,该氧化还原酶是一种过氧化物酶。在另一个方面中,该酶组合物包括一种蛋白酶。在另一个方面中,该酶组合物包括一种膨胀蛋白。
[0412] 在本发明的方法中,可以在糖化、糖化和发酵、或发酵之前或期间添加该一种或多种酶。
[0413] 该酶组合物的一种或多种(例如,若干种)组分可以是天然蛋白、重组蛋白或天然蛋白与重组蛋白的组合。例如,一种或多种(例如,若干种)组分可以是用作宿主细胞以重组表达该酶组合物的一种或多种(例如,若干种)其他组分的细胞的天然蛋白。在此应理解的是,重组蛋白对于宿主细胞可以是异源的(例如,外源的)以及原生的。可以作为单组分生成酶组合物的一种或多种(例如若干种)组分,然后将它们组合以形成酶组合物。酶组合物可以是多组分和单组分蛋白制剂的组合。
[0414] 在本发明的方法中使用的酶可以是以任何适于使用的形式存在的,例如像发酵液配制品或细胞组合物、具有或不具有细胞碎片的细胞裂解物、半纯化或纯化的酶制剂、或作为酶的来源的宿主细胞。该酶组合物可以是干粉或颗粒、非尘颗粒、液体、稳定化的液体或稳定化的受保护的酶。可以根据已建立的方法例如通过添加稳定剂(如糖、糖醇或其他多元醇)、和/或乳酸或另一种有机酸,对液体酶制剂进行稳定化。
[0415] 酶和纤维二糖水解酶变体的最佳量取决于若干因素,包括但不限于:纤维素分解酶和/或半纤维素分解酶组分的混合物、纤维素材料、纤维素材料的浓度、纤维素材料的一种或多种预处理、温度、时间、pH以及发酵生物(例如,用于同时糖化和发酵)的纳入。
[0416] 在一个方面中,纤维素分解酶或半纤维素分解酶对纤维素材料的有效量是约0.5至约50mg,例如,约0.5至约40mg、约0.5至约25mg、约0.75至约20mg、约0.75至约15mg、约0.5至约10mg、或约2.5至约10mg/g纤维素材料。
[0417] 在另一个方面中,纤维二糖水解酶变体对纤维素材料的有效量是约0.01至约50.0mg,例如,约0.01至约40mg、约0.01至约30mg、约0.01至约20mg、约0.01至约10mg、约
0.01至约5mg、约0.025至约1.5mg、约0.05至约1.25mg、约0.075至约1.25mg、约0.1至约
1.25mg、约0.15至约1.25mg、或约0.25至约1.0mg/g纤维素材料。
[0418] 在另一个方面中,纤维二糖水解酶变体对纤维素分解酶或半纤维素分解酶的有效量是约0.005至约1.0g,例如,约0.01至约1.0g、约0.15至约0.75g、约0.15至约0.5g、约0.1至约0.5g、约0.1至约0.25g、或约0.05至约0.2g/g纤维素分解酶或半纤维素分解酶。
[0419] 具有纤维素分解酶活性或半纤维素分解酶活性的多肽,以及适用于纤维素材料的降解的其他蛋白质/多肽,例如具有纤维素分解增强活性的GH61多肽(在下文统称为“具有酶活性的多肽”)可以源自或获自任何合适的来源,包括古细菌、细菌、真菌、酵母、植物或动物来源。术语“获得的”在此还意指该酶可能已在宿主生物中采用在此所描的方法重组产生,其中重组产生的酶对于宿主生物是原生的或外源的,或具有修饰的氨基酸序列,例如,具有一个或多个(例如,若干个)缺失、插入和/或取代的氨基酸,即重组产生的酶为天然氨基酸序列的突变体和/或片段,或通过本领域已知的核酸改组方法产生的酶。原生酶的含义中涵盖天然变体,而外源酶的含义中涵盖如通过定点诱变或改组获得的变体。
[0420] 具有酶活性的多肽可以是一种细菌多肽。例如,该多肽可以是具有酶活性的革兰氏阳性细菌多肽,例如芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳酸杆菌属、乳球菌属、梭菌属、土芽孢杆菌属、热解纤维素菌属、热酸菌属、热裂菌属(Thermobifidia)、或海洋芽孢杆菌属多肽,或具有酶活性的革兰氏阴性细菌多肽,例如大肠杆菌、假单孢菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏菌属、或脲原体属多肽。
[0421] 在一个方面中,该多肽是具有酶活性的嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚硬芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、或苏云金芽孢杆菌多肽。
[0422] 在另一个方面中,该多肽是具有酶活性的似马链球菌、酿脓链球菌、乳房链球菌、或马链球菌兽疫亚种多肽。
[0423] 在另一个方面中,该多肽是具有酶活性的不产色链霉菌、除虫链霉菌、天蓝链霉菌、灰色链霉菌、或浅青紫链霉菌多肽。
[0424] 具有酶活性的多肽还可以是真菌多肽,并且更优选地是一种具有酶活性的酵母多肽,如假丝酵母属、克鲁维酵母属、毕赤酵母属、酵母菌属、裂殖酵母属、或耶氏酵母属多肽;或更优选地是一种具有酶活性的丝状真菌多肽,如枝顶孢霉属、伞菌属、链格孢属、曲霉属、短梗霉属、Botryospaeria、拟蜡菌属、毛喙壳属、金孢子菌属、麦角菌属、旋孢腔菌属、鬼伞属、乳白蚁属、棒囊壳属、隐丛赤壳菌属、隐球菌属、色二孢属、黑耳属、线黑粉酵母属、镰孢属、赤霉属、全鞭毛虫属、腐质霉属、耙齿菌属、蘑燕属、小腔球菌属、梨孢菌属、黑果菌属(Melanocarpus)、多孔菌属、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉菌属、平革菌属、瘤胃壶菌属、Poitrasia、假黑盘菌属、假披发虫属(Pseudotrichonympha)、根毛霉菌属、裂褶菌属、柱顶孢属、踝节菌属、嗜热子囊菌属、梭孢壳霉属、弯颈霉属、木霉属、长毛盘菌属、轮枝孢属、小包脚菇属、或炭角菌属多肽。
[0425] 在一个方面中,该多肽是具有酶活性的卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酶母、或卵形酵母多肽。
[0426] 在另一个方面中,该多肽是具有酶活性的解纤维枝顶孢霉、棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、嗜角质金孢子菌、卢克诺文思金孢子菌、热带金孢子菌、莫达瑞姆金孢子菌、狭边金孢子菌、租金孢子菌、昆士兰金孢子菌、带纹金孢子菌、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、灰腐质霉、特异腐质霉、柔毛腐质霉、白耙齿菌、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、绳状青霉菌、产紫青霉菌、黄孢平革菌、无色梭孢壳菌(Thielavia achromatica)、阿波梭孢壳菌(Thielavia albomyces)、白毛梭孢壳菌(Thielavia albopilosa)、澳洲梭孢壳霉、菲美蒂梭孢壳菌(Thielavia fimeti)、小孢梭孢壳霉、卵孢梭孢壳霉、秘鲁梭孢壳霉(Thielavia peruviana)、瘤孢梭孢壳霉、毛梭孢壳霉、亚嗜热梭孢壳菌(Thielavia subthermophila)、土生梭孢霉、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、绿色木霉、或褐孢长毛盘菌多肽。
[0427] 还可以使用具有酶活性的多肽的化学修饰的或蛋白工程化的突变体。
[0428] 该酶组合物的一种或多种(例如,若干种)组分可以是重组组分,即,通过克隆编码该单一组分的DNA序列并且随后用该DNA序列转化细胞并且在宿主中表达产生(参见例如,WO 91/17243和WO 91/17244)。该宿主可以是异源宿主(酶对于宿主来说是外源的),但该宿主在某些条件下也可以是同源宿主(酶对于宿主来说是原生的)。还可以通过纯化来自发酵液的这样一种蛋白来制备单组分纤维素分解蛋白。
[0429] 在一个方面中,该一种或多种(例如,若干种)纤维素分解酶包括商业纤维素分解酶制剂。适用于本发明的商业纤维素分解酶制剂的实例包括例如: CTec(诺维信公司)、 CTec2(诺维信公司)、 CTec3(诺维信公司)、CELLUCLASTTM(诺
维信公司)、NOVOZYMTM 188(诺维信公司)、SPEZYMETM CP(杰能科国际(Genencor Int.))、TM
ACCELLERASE   TRIO(杜邦公司(DuPont))、 NL(DSM公司);
S/L 100(DSM公司)、ROHAMENTTM 7069W(罗姆公司( GmbH))、或
CMAX3TM(Dyadic国际有限公司(Dyadic International,Inc.))。以
从约0.001wt.%至约5.0wt.%的固体,例如0.025wt.%至约4.0wt.%的固体、或约
0.005wt.%至约2.0wt.%的固体的有效量添加纤维素分解酶制剂。
[0430] 可在本发明的方法中使用的细菌内切葡聚糖酶的实例包括但不限于:解纤维热酸菌(Acidothermus cellulolyticus)内切葡聚糖酶(WO 91/05039;WO 93/15186;美国专利申请号5,275,944;WO 96/02551;美国专利申请号5,536,655,WO 00/70031,WO 05/093050)、胡萝卜软腐欧文氏菌(Erwinia carotovara)内切葡聚糖酶(萨里拉赫蒂
(Saarilahti)等人,1990,基因(Gene)90:9-14)、褐色嗜热裂孢菌(Thermobifida fusca)内切葡聚糖酶III(WO 05/093050)、以及褐色嗜热裂孢菌内切葡聚糖酶V(WO 05/093050)。
[0431] 可以用于本发明的真菌内切葡聚糖酶的实例包括但不限于:里氏木霉内切葡聚糖酶I(彭蒂莱(Penttila)等人,1986,基因(Gene)45:253-263,里氏木霉Cel7B内切葡聚糖酶I(GenBank:M15665)、里氏木霉内切葡聚糖酶II(萨洛黑莫(Saloheimo)等人,1988,基因63:11-22),里氏木霉Cel5A内切葡聚糖酶II(GenBank:M19373)、里氏木霉内切葡聚糖酶III(奥卡达(Okada)等人,1988,应用与环境微生物学(Appl.Environ.Microbiol.)64:555-563,GenBank:AB003694)、里氏木霉内切葡聚糖酶V(萨洛黑莫等人,1994,分子微生物学(Molecular Microbiology)13:219-228,GenBank:Z33381)、棘孢曲霉内切葡聚糖酶(黄(Ooi)等人,1990,核酸研究(Nucleic Acids Research)18:5884)、白曲霉内切葡聚糖酶(坂元(Sakamoto)等人,1995,当代遗传学(Current Genetics)27:435-439)、尖镰孢内切葡聚糖酶(GenBank:L29381)、灰腐质霉高温变种(Humicola grisea var.thermoidea)内切葡聚糖酶(GenBank:AB003107)、热白丝菌(Melanocarpus albomyces)内切葡聚糖酶(GenBank:
MAL515703)、粗糙脉孢菌内切葡聚糖酶(GenBank:XM_324477)、特异腐质霉内切葡聚糖酶V、嗜热毁丝霉CBS 117.65内切葡聚糖酶、金黄色嗜热子囊菌内切葡聚糖酶I(GenBank:
AF487830)、里氏木霉菌株号VTT-D-80133内切葡聚糖酶(GenBank:M15665)、以及嗜松青霉内切葡聚糖酶(WO 2012/062220)。
[0432] 可用在本发明中的纤维二糖水解酶的实例包括但不限于:棘孢曲霉纤维二糖水解酶II(WO 2011/059740)、烟曲霉纤维二糖水解酶I(WO 2013/028928)、烟曲霉纤维二糖水解酶II(WO 2013/028928)、嗜热毛壳菌纤维二糖水解酶I、嗜热毛壳菌纤维二糖水解酶II、特异腐质霉纤维二糖水解酶I、嗜热毁丝霉纤维二糖水解酶II(WO 2009/042871)、奥斯塔尼青霉(Penicillium occitanis)纤维二糖水解酶I(GenBank:AY690482)、埃默森篮状菌纤维二糖水解酶I(GenBank:AF439936)、赫卡尼亚梭孢壳霉(Thielavia hyrcanie)纤维二糖水解酶II(WO 2010/141325)、土生梭孢霉纤维二糖水解酶II(CEL6A,WO 2006/074435)、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、以及褐孢长毛盘菌纤维二糖水解酶II(WO 2010/057086)。
[0433] 可用在本发明中的β-葡糖苷酶的实例包括但不限于来自以下各项的β-葡糖苷酶:棘孢曲霉(川口(Kawaguchi)等人,1996,基因(Gene)173:287-288)、烟曲霉(WO 2005/
047499)、黑曲霉(丹(Dan)等人,2000,生物化学杂志(J.Biol.Chem.)275:4973-4980)、米曲霉(WO 02/095014)、巴西青霉菌IBT 20888(WO 2007/019442和WO 2010/088387)、土生梭孢霉(WO 2011/035029)、以及褐孢长毛盘菌(WO 2007/019442)。
[0434] 该β-葡糖苷酶可以是一种融合蛋白。在一个方面中,该β-葡糖苷酶是米曲霉β-葡糖苷酶变体BG融合蛋白(WO 2008/057637)或米曲霉β-葡糖苷酶融合蛋白(WO 2008/057637)。
[0435] 其他有用的内切葡聚糖酶、纤维二糖水解酶、以及β-葡糖苷酶披露于使用根据以下的分类的许多糖基水解酶家族中:亨利萨特(Henrissat),1991,生物化学杂志(Biochem.J.)280:309-316;以及亨利萨特和贝洛赫(Bairoch),1996,生物化学杂志316:695-696。
[0436] 可以在本发明中使用的其他纤维素分解酶描述于WO 98/13465、WO 98/015619、WO 98/015633、WO 99/06574、WO 99/10481、WO 99/025847、WO 99/031255、WO 2002/101078、WO 
2003/027306、WO 2003/052054、WO 2003/052055、WO 2003/052056、WO 2003/052057、WO 
2003/052118、WO 2004/016760、WO 2004/043980、WO 2004/048592、WO 2005/001065、WO 
2005/028636、WO 2005/093050、WO 2005/093073、WO 2006/074005、WO 2006/117432、WO 
2007/071818、WO 2007/071820、WO 2008/008070、WO 2008/008793、美国专利号5,457,046、美国专利号5,648,263、以及美国专利号5,686,593中。
[0437] 在本发明的方法中,具有纤维素分解增强活性的任何GH61多肽都可以用作酶组合物的组分。
[0438] 在本发明的方法中有用的GH61多肽的实例包括但不限于来自于以下各项的GH61多肽:土生梭孢霉(WO 2005/074647、WO 2008/148131和WO 2011/035027)、金黄色嗜热子囊菌(WO 2005/074656和WO 2010/065830)、里氏木霉(WO 2007/089290和WO 2012/149344)、嗜热毁丝霉(WO 2009/085935、WO 2009/085859、WO 2009/085864、WO 2009/085868及WO 2009/033071)、烟曲霉(WO 2010/138754)、嗜松青霉(WO 2011/005867)、嗜热子嚢菌属(WO 
2011/039319)、青霉属(埃默森青霉)(WO 2011/041397和WO 2012/000892)、甲壳嗜热子囊菌(Thermoascus crustaceous)(WO 2011/041504)、棘孢曲霉(WO 2012/125925)、疏棉状嗜热丝孢菌(WO 2012/113340、WO 2012/129699、WO 2012/130964及WO 2012/129699)、Aurantiporus alborubescens(WO 2012/122477)、褐孢长毛盘菌(WO 2012/122477)、托姆青霉(WO 2012/122477)、柄篮状菌(WO 2012/135659)、特异腐质霉(WO 2012/146171)、樟绒枝霉(WO 2012/101206)、Talaromyces leycettanus(WO 2012/101206)、以及嗜热毛壳菌(WO 2012/101206)和嗜热篮状菌(Talaromyces thermophilus)(WO 2012/129697和WO 
2012/130950)。
[0439] 在一个方面中,具有纤维素分解增强活性的GH61多肽在根据WO 2008/151043的可溶性活化二价金属阳离子(例如锰或)的存在下使用。
[0440] 在另一个方面中,具有纤维素分解增强活性的GH61多肽在二氧化合物、二环化合物、杂环化合物、含氮化合物、醌化合物、含硫化合物、或从预处理的纤维素材料(如预处理的玉米秸杆)获得的液体的存在下使用(WO 2012/021394、WO 2012/021395、WO 2012/021396、WO 2012/021399、WO 2012/021400、WO 2012/021401、WO 2012/021408、以及WO 
2012/021410)。
[0441] 二氧基化合物可以包括包含两个或更多个氧原子的任何适合化合物。在一些方面中,二氧基化合物包含一个如在此所述的被取代的芳基部分。二氧基化合物可以包括一个或多个(例如,若干个)羟基和/或羟基衍生物,而且还包括缺乏羟基和羟基衍生物的取代的芳基部分。二氧基化合物的非限制性实例包括邻苯二酚或儿茶酚;咖啡酸;3,4-二羟基苯甲酸;4-叔丁基-5-甲氧基-1,2-苯二醇;连苯三酚;没食子酸;3,4,5-三羟基苯甲酸甲酯;2,3,4-三羟基二苯甲酮;2,6-二甲氧基苯酚;芥子酸;3,5-二羟基苯甲酸;4-氯-1,2-苯二醇;4-硝基-1,2-苯二醇;丹宁酸;没食子酸乙酯;羟乙酸甲酯;二羟基富马酸;2-丁炔-1,4-二醇;
酮酸;1,3-丙二醇;酒石酸;2,4-戊二醇;3-乙氧基-1,2-丙二醇;2,4,4'-三羟基二苯甲酮;顺-2-丁烯-1,4-二醇;3,4-二羟基-3-环丁烯-1,2-二酮;二羟基丙酮;丙烯醛缩醛;4-羟基苯甲酸甲酯;4-羟基苯甲酸;以及3,5-二甲氧基-4-羟基苯甲酸甲酯;或其盐或溶剂化物
[0442] 双环化合物可以包括如在此所描述的任何适合的取代的稠合环系统。这些化合物可以包含一个或多个(例如,若干个)另外的环,并且除非另外说明,否则不限于具体数目的环。在一个方面中,双环化合物是一种类黄酮。在另一方面中,双环化合物是一种任选取代的异类黄酮。在另一个方面中,双环化合物是一种任选取代的花色离子(flavylium ion),如一种任选取代的花色素或任选取代的花色素苷、或其衍生物。双环化合物的非限制性实例包括:表儿茶素、槲皮素、杨梅黄酮、紫衫叶素、堪非醇、桑色素、刺槐素、柚皮素、异鼠李素、芹黄素、矢车菊素、矢车菊素苷、黑豆多酚、花青素鼠李葡糖苷、或其盐或溶剂合物。
[0443] 杂环化合物可以是如在此所描述的任何适合的化合物,如包含一个杂原子的一种任选取代的芳香族或非芳香族环。在一个方面中,杂环是包含一个任选地被取代的杂环烷基部分或一个任选地被取代的杂芳基部分的一种化合物。在另一个方面中,任选地被取代的杂环烷基部分或任选地被取代的杂芳基部分是一个任选地被取代的5元杂环烷基或一个任选地被取代的5元杂芳基部分。在另一个方面中,任选地被取代的杂环烷基或任选地被取代的杂芳基部分是一个选自以下的任选地被取代的部分:吡唑基、呋喃基、咪唑基、异噁唑基、噁二唑基、噁唑基、吡咯基、吡啶基、嘧啶基、哒嗪基、噻唑基、三唑基、噻吩基、二氢噻吩并吡唑基、硫茚基、咔唑基、苯并咪唑基、苯并噻吩基、苯并呋喃基、吲哚基、喹啉基、苯并三唑基、苯并噻唑基、苯并噁唑基、苯并咪唑基、异喹啉基、异吲哚基、吖啶基、苯并异唑基、二甲基乙内酰脲、吡嗪基、四氢呋喃基、吡咯啉基、吡咯烷基、吗啉基、吲哚基、二氮杂卓基、氮杂卓基、硫杂卓基、哌啶基以及氧杂卓基。在另一个方面中,任选地被取代的杂环烷基部分或任选地被取代的杂芳基部分是一个任选地被取代的呋喃基。杂环化合物的非限制性实例包括(1,2-二羟基乙基)-3,4-二羟基呋喃-2(5H)-酮;4-羟基-5-甲基-3-呋喃酮;5-羟基-2(5H)-呋喃酮;[1,2-二羟基乙基]呋喃-2,3,4(5H)-三酮;α-羟基-γ-丁内酯;核糖酸γ-内酯;己糖醛酸(aldohexuronicaldohexuronic acid)γ-内酯;葡萄糖酸δ-内酯;4-羟基香豆素;二氢苯并呋喃;5-(羟基甲基)糠醛;联糠醛;2(5H)-呋喃酮;5,6-二氢-2H-吡喃-2-酮;以及5,6-二氢-4-羟基-6-甲基-2H-吡喃-2-酮;或其盐或溶剂化物。
[0444] 含氮化合物可以是具有一个或多个氮原子的任何适合化合物。在一个方面中,含氮化合物包含一个胺、亚胺、羟胺或氮氧化物部分。含氮化合物的非限制性实例包括丙酮肟;紫尿酸;吡啶-2-醛肟;2-氨基苯酚;1,2-苯二胺;2,2,6,6-四甲基-1-哌啶基氧基;5,6,7,8-四氢生物蝶呤;6,7-二甲基-5,6,7,8-四氢蝶呤;以及顺丁烯酰胺酸;或其盐或溶剂化物。
[0445] 醌化合物可以是如在此所描述的包含一个醌部分的任何适合的化合物。醌化合物的非限制性实例包括:1,4-苯醌、1,4-萘醌、2-羟基-1,4-萘醌、2,3-二甲氧基-5-甲基-1,4-苯醌或辅酶Q0、2,3,5,6-四甲基-1,4-苯醌或杜醌、1,4-二羟基蒽醌、3-羟基-1-甲基-5,6-二氢吲哚二酮或肾上腺素红、4-叔丁基-5-甲氧基-1,2-苯醌、吡咯并喹啉醌、或其盐或溶剂化物。
[0446] 含硫化合物可以是包含一个或多个硫原子的任何适合的化合物。在一个方面中,含硫化合物包含一个选自以下各项的部分:亚硫酰基、硫醚、亚磺酰基、磺酰基、硫酰胺、磺酰胺、磺酸以及磺酸酯。含硫化合物的非限制性实例包括乙硫醇;2-丙硫醇;2-丙烯-1-硫醇;2-巯基乙磺酸;苯硫酚;苯-1,2-二硫酚;半胱氨酸;蛋氨酸;谷胱甘肽;胱氨酸;或其盐或溶剂化物。
[0447] 在一个方面中,以上述这样一种化合物对纤维素的葡糖基单元的以下摩尔比将有效量的该化合物添加至纤维素材料中:约10-6至约10,例如,约10-6至约7.5、约10-6至约5、约10-6至约2.5、约10-6至约1、约10-5至约1、约10-5至约10-1、约10-4至约10-1、约10-3至约10-1、或-3 -2
约10 至约10 。在另一个方面中,这样一种化合物的有效量是约0.1μM至约1M,例如约0.5μM至约0.75M、约0.75μM至约0.5M、约1μM至约0.25M、约1μM至约0.1M、约5μM至约50mM、约10μM至约25mM、约50μM至约25mM、约10μM至约10mM、约5μM至约5mM、或约0.1mM至约1mM。
[0448] 术语“液体(liquor)”意指在如描述于WO 2012/021401中的条件下,由处理浆料中的木质纤维素和/或半纤维素材料、或其单糖(例如,木糖、阿拉伯糖、甘露糖等)所产生的溶液相(水相、有机相或其组合)、及其可溶性内容物。用于GH61多肽的纤维素分解增强的液剂可以通过,任选在催化剂(例如酸)的存在下、任选在有机溶剂的存在下、并且任选与物理破坏一种木质纤维素或半纤维素材料(或原料)组合,通过施加热和/或压力来对该材料进行处理,并且然后将溶液与残余固体分离来产生。在由纤维素分解酶制剂对纤维素底物的水解过程中,从液体与GH61多肽的组合中可得到纤维素分解增强的程度是由这类条件决定的。可以使用本领域的标准方法,如过滤、沉淀或离心,而将液剂与经过处理的材料进行分离。
[0449] 在一个方面中,该液体对纤维素的有效量是约10-6至约10g/g的纤维素,例如约10-6至约7.5g、约10-6至约5g、约10-6至约2.5g、约10-6至约1g、约10-5至约1g、约10-5至约10-1g、-4 -1 -3 -1 -3 -2约10 至约10 g、约10 至约10 g、或约10 至约10 g/g的纤维素。
[0450] 在一个方面中,该一种或多种(例如,若干种)半纤维素分解酶包含商业半纤维素分解酶制剂。适于在本发明中使用的商业化半纤维素分解酶制剂的实例包括例如SHEARZYMETM(诺维信公司)、 HTec(诺维信公司)、 HTec2(诺维信公
司)、 HTec3(诺维信公司)、 (诺维信公司)、
(诺维信公司)、 HC(诺维信公司)、 木聚糖酶(杰能科公
司)、 XY(杰能科公司)、 XC(杰能科公司)、
TX-200A(AB酶公司(AB Enzymes))、HSP 6000木聚糖酶(DSM)、DEPOLTM 333P
(生物催化剂有限公司(Biocatalysts Limit),威尔士,英国)、DEPOLTM 740L(生物催化剂有限公司,威尔士,英国)以及DEPOLTM 762P(生物催化剂有限公司,威尔士,英国)、ALTERNA FUEL 100P(Dyadic公司)和ALTERNA FUEL 200P(Dyadic公司)。
[0451] 在本发明的方法中有用的木聚糖酶的实例包括但不限于来自以下各项的木聚糖酶:棘孢曲霉(GeneSeqP:AAR63790;WO 94/21785)、烟曲霉(WO 2006/078256)、嗜松青霉(WO 2011/041405)、青霉属(WO 2010/126772)、疏棉状嗜热丝孢菌(GeneSeqP:BAA22485)、嗜热篮状菌(GeneSeqP:BAA22834)、土生梭孢霉NRRL 8126(WO 2009/079210)、以及褐孢长毛盘菌(WO 2011/057083)。
[0452] 在本发明的方法中有用的β-木糖苷酶包括但不限于来自以下各项的β-木糖苷酶:粗糙脉孢菌(SwissProt:Q7SOW4)、里氏木霉(UniProtKB/TrEMBL:Q92458)、埃默森篮状菌(SwissProt:Q8X212)、以及嗜热篮状菌(GeneSeqP:BAA22816)。
[0453] 在本发明的方法中有用的乙酰木聚糖酯酶的实例包括但不限于来自以下各项的乙酰木聚糖酯酶:棘孢曲霉(WO 2010/108918),球毛壳菌(UniProt:Q2GWX4),细丽毛壳(Chaetomium gracile)(GeneSeqP:AAB82124),特异腐质霉DSM 1800(WO 2009/073709),红褐肉座菌(WO 2005/001036),嗜热毁丝菌(Myceliophtera thermophila)(WO 2010/014880),粗糙脉孢菌(UniProt:q7s259),颖枯壳针孢(Phaeosphaeria nodorum)(UniProt:
Q0UHJ1),以及土生梭孢霉NRRL 8126(WO 2009/042846)。
[0454] 在本发明的方法中有用的阿魏酸酯酶(feruloyl esterase,ferulic acid esterase)的实例包括但不限于来自以下的阿魏酸酯酶:特异腐质霉DSM 1800(WO 2009/076122),费希新萨托菌(Neosartorya fischeri)(UniProt:A1D9T4),粗糙脉孢菌(UniProt:Q9HGR3),黄灰青霉(Penicillium aurantiogriseum)(WO 2009/127729),以及土生梭孢霉(WO 2010/053838和WO 2010/065448)。
[0455] 在本发明的方法中有用的阿拉伯呋喃糖苷酶的实例包括但不限于来自以下的阿拉伯呋喃糖苷酶:黑曲霉(GeneSeqP:AAR94170)、特异腐质霉DSM 1800(WO 2006/114094和WO 2009/073383)、以及大型亚灰树花菌(M.giganteus)(WO 2006/114094)。
[0456] 在本发明的方法中有用的α-葡糖醛酸糖苷酶的实例包括但不限于来自以下的α-葡糖醛酸糖苷酶:棒曲霉(UniProt:alcc12)、烟曲霉(SwissProt:Q4WW45)、黑曲霉(UniProt:Q96WX9)、土曲霉(SwissProt:Q0CJP9)、特异腐质霉(WO 2010/014706)、黄灰青霉(WO 2009/068565)、埃默森篮状菌(UniProt:Q8X211)、以及里氏木霉(UniProt:Q99024)。
[0457] 在本发明的方法中有用的氧化还原酶的实例包括但不限于:烟曲霉过氧化氢酶、Aspergillus lentilus过氧化氢酶、黑曲霉过氧化氢酶、米曲霉过氧化氢酶、特异腐质霉过氧化氢酶、粗糙脉孢菌过氧化氢酶、埃默森青霉过氧化氢酶、嗜热色串孢(Scytalidium thermophilum)过氧化氢酶、柄篮状菌过氧化氢酶、金黄色嗜热子囊菌过氧化氢酶、灰盖鬼伞(Coprinus cinereus)漆酶、嗜热毁丝霉漆酶、Polyporus pinsitus漆酶、鲜红密孔菌(Pycnoporus cinnabarinus)漆酶、立枯丝核菌(Rhizoctonia solani)漆酶、天蓝链霉菌(Streptomyces coelicolor)漆酶、灰盖鬼伞过氧化物酶、大豆过氧化物酶、以及王棕(Royal palm)过氧化物酶。
[0458] 用于本发明的方法中的具有酶活性的多肽可以通过在含有适合碳源和氮源以及无机盐的营养培养基上,使用本领域中已知的程序发酵上述微生物菌株来产生(参见,例如,班尼特,J.W.(Bennett,J.W.)和拉热,L.(LaSure,L.)(编辑),真菌中的更多基因操纵(More Gene Manipulations in Fungi),学术出版社,加州,1991)。适合的培养基可从商业供应商获得或可以根据公开的组成(例如,在美国典型培养物保藏中心的目录中)制备。适合于生长和酶产生的温度范围和其他条件在本领域中是已知的(参见,例如,贝利·J.E.(Bailey,J.E.)和奥利斯·D.F.(Ollis,D.F.),生物化学工程基础(Biochemical Engineering Fundamentals),麦格劳-希尔图书公司(McGraw-Hill Book Company),纽约,
1986)。
[0459] 发酵可以是导致酶或蛋白质的表达或分离的培养细胞的任何方法。所以,可以将发酵理解为包括摇瓶培养,或者在一种适合的培养基中并且在允许表达或分离该酶的条件下在实验室或工业发酵罐中进行小规模或大规模发酵(包括连续发酵、分批发酵、分批补料发酵或固态发酵)。通过上述方法产生的所得酶可以从发酵培养基回收并且通过常规程序纯化。
[0460] 发酵。可以通过能够将糖直接或间接发酵成所希望的发酵产物的一种或多种(例如,若干种)发酵微生物发酵从水解的纤维素材料获得的可发酵糖。“发酵”或“发酵过程”是指任何发酵过程或包括发酵步骤的任何过程。发酵方法还包括用于消费性醇工业(例如啤酒和葡萄酒)、乳品工业(例如发酵的乳制品)、皮革工业和烟草工业的发酵方法。发酵条件取决于所希望的发酵产物和发酵生物,并且可以由本领域的普通技术人员容易地确定。
[0461] 在发酵步骤中,预处理和酶水解步骤所导致的从纤维素材料释放的糖由发酵生物(如酵母)发酵成一种产物,例如,乙醇。水解(糖化)和发酵可以是分开的或同时的。
[0462] 在实践本发明的发酵步骤中可以使用任何适合的水解的纤维素材料。该材料一般是基于经济学,即,每当量糖势的成本,以及对酶致转变的难降解性而进行选择。
[0463] 术语“发酵培养基”在此可理解为指在添加一种或多种发酵微生物之前的培养基,如,由糖化过程产生的培养基,以及在同时糖化和发酵过程(SSF)中使用的培养基。
[0464] “发酵微生物”是指适用于所希望的发酵方法以产生发酵产物的任何微生物,包括细菌和真菌生物。发酵生物可以是己糖和/或戊糖发酵生物、或其组合。己糖和戊糖发酵生物二者均是本领域中所熟知的。适合的发酵微生物能够将糖(如葡萄糖、木糖、木酮糖、阿拉伯糖、麦芽糖、甘露糖、半乳糖、和/或寡糖)直接或间接地发酵(即,转化)成所希望的发酵产物。产生乙醇的细菌和真菌发酵生物的实例由琳(Lin)等人,2006,应用微生物学与生物技术(Appl.Microbiol.Biotechnol.)69:627-642描述。
[0465] 能够发酵己糖的发酵微生物的实例包括细菌生物和真菌生物,如酵母。酵母包括以下各项的菌株:假丝酵母属、克鲁维酵母属、以及酵母菌属,例如萨纳瑞西斯假丝酵母(Candida sonorensis)、马克斯克鲁维酵母、以及酿酒酵母。
[0466] 可以发酵处于其原生状态的戊糖的发酵微生物的实例包括细菌和真菌生物,如某一种酵母。发酵木糖的酵母包括假丝酵母属的菌株,优选是休哈塔假丝酵母(C.sheatae)或萨纳瑞西斯假丝酵母(C.sonorensis);以及毕赤酵母属的菌株,例如是树干毕赤酵母,像树干毕赤酵母CBS 5773。发酵戊糖的酵母包括管囊酵母属的菌株,优选是嗜鞣管囊酵母(P.tannophilus)。不能发酵戊糖(如木糖和阿拉伯糖)的生物可以通过本领域已知方法来进行遗传修饰而发酵戊糖。
[0467] 能够有效地将己糖和戊糖发酵成乙醇的细菌的实例包括,例如,凝结芽孢杆菌、丙酮丁醇梭菌(Clostridium acetobutylicum)、热纤维梭菌(Clostridium thermocellum)、发酵植物多糖梭菌(Clostridium phytofermentans)、土芽孢杆菌属、解糖热厌氧杆菌(Thermoanaerobacter saccharolyticum)、以及运动发酵单胞菌(Zymomonas mobilis)(菲利皮迪斯,G.P.(Philippidis,G.P.),1996,纤维素生物转化技术(Cellulose bioconversion technology),生物乙醇手册:生产和利用(Handbook on Bioethanol:
Production and Utilization),怀曼,C.E(Wyman,C.E.)编辑,泰勒-弗朗西斯出版集团(Taylor&Francis),华盛顿特区(Washington,DC),179-212)。
[0468] 其他发酵生物包括以下各项的菌株:芽孢杆菌属,如凝结芽孢杆菌;假丝酵母属,如萨纳瑞西斯假丝酵母、甲醇山梨糖假丝酵母(C.methanosorbosa)、迪丹斯假丝酵母(C.diddensiae)、近平滑假丝酵母(Candida parapsilosis)、C.naedodendra、布朗克假丝酵母(C.blankii)、嗜虫假丝酵母(C.entomophilia)、芸薹假丝酵母(C.brassicae)、假热带假丝酵母(C.pseudotropicalis)、博伊丁假丝酵母(C.boidinii)、产朊假丝酵母(C.utilis)、以及休哈塔假丝酵母;梭菌属,如丙酮丁醇梭菌、热纤维梭菌、以及发酵植物多糖梭菌;大肠杆菌,特别是已被遗传修饰以改善乙醇产率的大肠杆菌菌株;土芽孢杆菌属种;汉逊酵母属,如异常汉逊酵母(Hansenula anomala);克雷伯氏菌属(Klebsiella),如产酸克雷伯氏菌(K.oxytoca);克鲁维酵母属,如马克斯克鲁维酵母(K.marxianus)、乳酸克鲁维酵母(K.lactis)、耐热克鲁维酵母(K.thermotolerans)、以及脆壁克鲁维酵母
(K.fragilis);裂殖酵母属,如粟酒裂殖酵母(S.pombe);热厌氧杆菌属
(Thermoanaerobacter),如解糖热厌氧杆菌、以及发酵单胞菌属(Zymomonas),如运动发酵单胞菌。
[0469] 适用于乙醇产生的可商购的酵母包括例如,BIOFERMTM AFT和XR(NABC-北美生物产品基团(North American Bioproducts Corporation),佐治亚州,美国)、ETHANOL REDTM酵母(弗曼迪斯/乐斯福(Fermentis/Lesaffre),美国)、FALITM(菲氏酵母(Fleischmann’s Yeast),美国)、FERMIOLTM(帝斯曼配料部(DSM Specialties))、GERT STRANDTM(Gert Strand AB,瑞典)、以及SUPERSTARTTM和THERMOSACCTM新鲜酵母(乙醇技术(Ethanol Technology),威斯康辛州,美国)。
[0470] 在一个方面中,发酵微生物已经经过遗传修饰,以提供发酵戊糖的能力,如利用木糖的微生物、利用阿拉伯糖的微生物、以及共同利用木糖和阿拉伯糖的微生物。
[0471] 将异源基因克隆到多种发酵微生物中已经构建出能够将己糖和戊糖转化成乙醇(共发酵)的生物(陈(Chen)和霍(Ho) ,1993,应用生物化学与生物技术(Appl.Biochem.Biotechnol.)39-40:135-147;霍等人,1998,应用与环境微生物学(Appl.Environ.Microbiol.)64:1852-1859;科特(Kotter)和西拉塞(Ciriacy),1993,应用微生物学与生物技术(Appl.Microbiol.Biotechnol.)38:776-783;维尔福森
(Walfridsson)等人,1995,应用与环境微生物学61:4184-4190;凯珀(Kuyper)等人,2004,欧洲微生物学会联合会酵母研究(FEMS Yeast Research)4:655-664;比尔(Beall)等人,
1991,生物技术与生物工程(Biotech.Bioeng.)38:296-303;英格拉姆(Ingram)等人,1998,生物技术与生物工程58:204-214;张(Zhang)等人,1995,科学(Science)267:240-243;狄安妲(Deanda)等人,1996,应用与环境微生物学62:4465-4470;WO 2003/062430)。
[0472] 在一个方面中,该发酵生物包括编码本发明的变体的多核苷酸。
[0473] 在另一个方面中,该发酵生物包括编码在此描述的一种或多种纤维素分解酶、半纤维素分解酶和辅助酶的一个或多个多核苷酸。
[0474] 本领域中熟知的是,以上所描述的生物还可以用于产生其他物质,如在此所描述的。
[0475] 典型地向降解的纤维素材料或水解物中添加发酵微生物,并且进行发酵持续约8至约96小时,例如约24至约60小时。温度典型地在约26℃至约60℃之间,例如约32℃或50℃,并且pH为约pH 3至约pH 8,例如pH 4至5、6或7。
[0476] 在一个方面中,应用酵母和/或另一种微生物至降解的纤维素材料并且进行发酵,持续约12至约96小时,例如典型地24-60小时。在另一个方面中,温度优选在约20℃至约60℃之间,例如约25℃至约50℃、约32℃至约50℃、或约32℃至约50℃,并且pH通常为约pH 3至约pH 7,例如约pH 4至约pH 7。然而,一些发酵生物(例如细菌)具有更高的最适发酵温度。酵母或另一种微生物优选以每ml发酵液大约105至1012,优选从大约107至1010,特别是大约2×108个活细胞计数的量施用。关于使用酵母进行发酵的进一步指南可以见于例如“醇教材”(“The Alcohol Textbook”)(K·雅克(K.Jacques)、T.P.里昂(T.P.Lyons)以及D.R.凯尔索尔(D.R.Kelsall)编辑,诺丁汉大学出版社(Nottingham University Press),英国(United Kingdom)1999),将其通过引用结合在此。
[0477] 发酵刺激剂可以与在此所描述的任何方法组合使用,以进一步改进发酵方法,特别是改进发酵微生物的性能,如,提高速度和乙醇产率。“发酵刺激剂”是指用于发酵微生物(特别是酵母)生长的刺激剂。用于生长的优选发酵刺激剂包括维生素和矿物质。维生素的实例包括多种维生素、生物素、泛酸、烟酸、内消旋肌醇、硫胺素、吡哆醇、对氨基苯酸、叶酸、核黄素、以及维生素A、B、C、D和E。例如参见阿尔弗雷多(Alfenore)等人,通过在进料分批方法过程中的一种维生素进料策略改进乙醇产生和酿酒酵母的存活力(Improving ethanol production and viability of Saccharomyces cerevisia by a vitamin feeding strategy during fed-batch process),施普林格(2002),其通过引用结合在此。矿物质的实例包括可以供应包含P、K、Mg、S、Ca、Fe、Zn、Mn和Cu营养素的矿物质和矿物盐。
[0478] 发酵产品:发酵产品可以是由发酵得到的任何物质。发酵产物可以是而不限于:醇(例如,阿拉伯糖醇、正丁醇、异丁醇、乙醇、甘油、甲醇、乙二醇、1,3-丙二醇(丙二醇)、丁二醇、丙三醇、山梨醇、以及木糖醇);烷(例如戊烷、己烷、庚烷、辛烷、壬烷、癸烷、十一烷、以及十二烷);环烷烃(例如,环戊烷、环己烷、环庚烷、以及环辛烷);烯烃(例如,戊烯、己烯、庚烯、以及辛烯);氨基酸(例如,天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸、以及苏氨酸);气体(例如,甲烷、氢气(H2)、二氧化碳(CO2)、以及一氧化碳(CO));异戊二烯;酮(例如,丙酮);有机酸(例如,乙酸、醋酮酸、己二酸抗坏血酸、柠檬酸、2,5-二酮-D-葡糖酸、甲酸、富马酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸草酸、草酰乙酸、丙酸、琥珀酸、以及木糖酸);以及聚酮化合物。
[0479] 在一个方面中,该发酵产物是一种醇。术语“醇”涵盖包含一个或多个羟基部分的物质。醇可以是而不限于:正丁醇、异丁醇、乙醇、甲醇、阿拉伯糖醇、丁二醇、乙二醇、甘油(glycerin)、丙三醇(glycerol)、1,3-丙二醇、山梨醇、木糖醇。参见例如,宫(Gong)等人,1999,由可再生资源生产乙醇(Ethanol production from renewable resources),在生化工程/生物技术进展(Advances in Biochemical Engineering/Biotechnology)中,舍佩尔,T.(Scheper,T.)编辑,施普林格出版社,柏林,海德堡,德国,65:207-241;西尔维拉(Silveira) 和乔纳斯 (Jonas) ,2002 ,应用微生物学与生物技术
(Appl.Microbiol.Biotechnol.)59:400-408;尼加姆(Nigam)和辛格,1995,加工生物化学(Process Biochemistry)30(2):117-124;埃塞吉(Ezeji)等人,2003,微生物与生物技术世界杂志(World Journal of Microbiology and Biotechnology)19(6):595-603。
[0480] 在另一个方面中,该发酵产物是一种烷烃。该烷烃可以是非支链或支链烷烃。烷烃可以是而不限于:戊烷、己烷、庚烷、辛烷、壬烷、癸烷、十一烷、或十二烷。
[0481] 在另一个方面中,该发酵产物是一种环烷烃。环烷烃可以是而不限于:环戊烷、环己烷、环庚烷或环辛烷。
[0482] 在另一个方面中,该发酵产物是一种烯烃。该烯烃可以是非支链或支链烯烃。烯烃可以是而不限于:戊烯、己烯、庚烯或辛烯。
[0483] 在另一个方面中,该发酵产物是一种氨基酸。有机酸可以是而不限于:天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸、或苏氨酸。参见例如理查德(Richard)和马加里蒂(Margaritis),2004,生物技术和生物工程(Biotechnology and Bioengineering)87(4):501-515。
[0484] 在另一个方面中,该发酵产物是一种气体。气体可以是而不限于:甲烷、H2、CO2、或CO。参见例如,片冈(Kataoka)等人,1997,水科学与技术(Water Science and Technology)36(6-7):41-47;以及古纳森兰(Gunaseelan),1997,生物质与生物能源(Biomass and Bioenergy)13(1-2):83-114。
[0485] 在另一个方面中,该发酵产物是异戊二烯。
[0486] 在另一个方面中,该发酵产物是一种酮。术语“酮”涵盖包含一个或多个酮部分的物质。酮可以是而不限于:丙酮。
[0487] 在另一个方面中,发酵产品是一种有机酸。有机酸可以是而不限于:乙酸、醋酮酸、己二酸、抗坏血酸、柠檬酸、2,5-二酮-D-葡糖酸、甲酸、富马酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、丙酸、琥珀酸、或木糖酸)。参见,例如,陈(Chen)和李(Lee),1997,生物化学与生物技术(Biochem.Biotechnol.)63-65:435-448。
[0488] 在另一个方面中,该发酵产物是聚酮化合物。
[0489] 回收。可以使用本领域中已知的任何方法可任选地从发酵培养基回收一种或多种发酵产物,这些方法包括但不限于,色谱法、电泳程序、差别溶解度、蒸馏、或萃取。例如,通过常规蒸馏方法从发酵的纤维素材料中分离和纯化醇。可以获得具有高达约96vol.%的纯度的乙醇,这可以用作例如燃料乙醇、饮用乙醇,即可饮用的中性烈酒、或工业乙醇。
[0490] 植物
[0491] 本发明还涉及分离的植物,例如,转基因植物、植物部分或植物细胞,这些植物包括本发明的多核苷酸,以便以可回收的量表达和产生纤维二糖水解酶变体。该变体可以从植物或植物部分回收。可替代地,可以按原样将含有该变体的植物或植物部分用于改善食品或饲料质量,例如,改善营养价值、可口性、以及流变性质,或用以破坏抗营养因子
[0492] 转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草,如草甸草(蓝草,早熟禾属);饲草,如羊茅属(Festuca)、黑麦草属(Lolium);温带草,如翦股颖属(Agrostis);以及谷类,例如小麦、燕麦、黑麦、大麦、稻、高粱、以及玉蜀黍(玉米)。
[0493] 双子叶植物的实例是烟草、豆类(如羽扇豆(lupins)、马铃薯、糖甜菜(sugar beet)、豌豆、豆(bean)和大豆(soybean))、以及十字花科植物(十字花科(family Brassicaceae))(如花椰菜、油菜籽、以及紧密相关的模式生物拟南芥)。
[0494] 植物部分的实例是茎、愈伤组织、叶、根、果实、种子、以及块茎、以及包括这些部分的独立组织,例如,表皮、叶肉、薄壁组织(parenchyme)、维管组织、分生组织。特定植物细胞区室,如叶绿体、质外体(apoplast)、线粒体、液泡、过氧化物酶体以及细胞质也被认为是植物部分。此外,任何植物细胞,无论是何种组织来源,都被认为是植物部分。同样地,植物部分,如分离以有助于本发明的利用的特定组织和细胞也被认为是植物部分,例如胚、胚乳、糊粉和种皮。
[0495] 同样包含于本发明范围内的是这类植物、植物部分以及植物细胞的子代。
[0496] 表达变体的转基因植物或植物细胞可以根据本领域已知的方法来构建。简而言之,通过如下方法构建该植物或植物细胞:将编码变体的一个或多个表达构建体并入到植物宿主基因组或叶绿体基因组中,并且使所得的修饰植物或植物细胞繁殖为转基因植物或植物细胞。
[0497] 表达构建体宜为包括编码变体的多核苷酸的核酸构建体,该多核苷酸与在选择的植物或植物部分中表达该多核苷酸所需的适当的调节序列可操作地连接。而且,表达构建体可包含用于鉴别整合了此表达构建体的植物细胞的选择性标记,和将此构建体引入所讨论的植物所必需的DNA序列(后者取决于所用的引入DNA的方法)。
[0498] 例如,基于希望在何时、何处、以及如何表达该变体来确定对调节序列如启动子和终止子序列和任选的信号或转运序列的选择(斯蒂科林(Sticklen),2008,自然综述(Nature Reviews)9:433-443)。例如,编码变体的基因的表达可以是组成型的或诱导型的,或可以是发育、阶段或组织特异性的,并且可以使基因产物靶向特定组织或植物部分,如种子或叶。调节序列由例如塔格(Tague)等人,1988,植物生理学(Plant Physiology)86:506描述。
[0499] 对于组成型表达,可以使用35S-CaMV、玉米泛素1、或稻肌动蛋白1启动子(弗兰克(Franck)等人,1980,细胞(Cell)21:285-294;克里斯滕森(Christensen)等人,1992,植物分子生物学(Plant Mol.Biol.)18:675-689;张(Zhang)等人,1991,植物细胞(Plant Cell)3:1155-1165)。器官特异性启动子可以是以下各项的启动子,例如来自贮藏库组织(例如种子、马铃薯块茎、和果实)(爱德华兹(Edwards)和科鲁兹(Coruzzi),1990,遗传学年鉴(Ann.Rev.Genet.)24:275-303),或来自代谢库组织(例如分生组织)(伊藤(Ito)等人,
1994,植物分子生物学(Plant Mol.Biol.)24:863-878),种子特异性启动子,例如来自水稻的谷蛋白、醇溶谷蛋白、球蛋白或白蛋白启动子(吴(Wu)等人,1998,植物与细胞生理学(Plant Cell Physiol.)39:885-889),来自豆球蛋白B4的蚕豆启动子和来自蚕豆的未知种子蛋白基因(康拉德(Conrad)等人,1998,植物生理学杂志(J.Plant Physiol.)152:708-
711),来自种子油体蛋白的启动子(陈(Chen)等人,1998,植物与细胞生理学(Plant Cell Physiol.)39:935-941),来自欧洲油菜的贮藏蛋白napA启动子,或本领域已知的任何其他种子特异性启动子,例如,如在WO 91/14772中所述的。此外,启动子可以是叶特异性启动子,如来自稻或番茄的rbcs启动子(京冢(Kyozuka)等人,1993,植物生理学(Plant Physiol.)102:991-1000)、小球藻病毒腺嘌呤甲基转移酶基因启动子(麦卓(Mitra)和希金斯(Higgins),1994,植物分子生物学(Plant Mol.Biol.)26:85-93)、来自稻的aldP基因启动子(加贺屋(Kagaya)等人,1995,分子遗传学与基因组学(Mol.Gen.Genet.)248:668-
674)、或伤口诱导型启动子(如马铃薯pin2启动子)(许(Xu)等人,1993,植物分子生物学22:
573-588)。同样地,启动子可以通过非生物处理来诱导,如温度、干旱、或盐度变化,或通过外源施加的激活该启动子的物质来诱导,例如乙醇、雌激素、植物激素(如乙烯、脱落酸和赤霉酸)、以及重金属。
[0500] 启动子增强子元件也可以用于实现变体在植物中的较高表达。例如,启动子增强子元件可以是置于启动子与编码变体的多核苷酸之间的内含子。例如,许等人,1993,见上文,披露了使用稻肌动蛋白1基因的第一内含子以增强表达。
[0501] 该选择性标记基因及该表达构建体的任何其他部分可以选自本领域中可用的那些。
[0502] 可以根据本领域中已知的常规技术将核酸构建体结合到植物基因组中,这些常规技术包括土壤杆菌介导的转化、病毒介导的转化、微注射、粒子轰击、生物射弹转化、以及电穿孔(加塞尔(Gasser)等人,1990,科学244:1293;波特里库斯(Potrykus),1990,生物/技术8:535;岛本(Shimamoto)等人,1989,自然338:274)。
[0503] 目前根癌土壤杆菌介导的基因转移是一种用于产生转基因双子叶植物(关于综述,请参见霍伊卡(Hooykas)和施尔伯鲁特(Schilperoort),1992,植物分子生物学(Plant Mol.Biol.)19:15-38)并且用于转化单子叶植物的方法,但对于这些植物还常常使用其他的转化方法。用于产生转基因单子叶植物的方法是粒子(涂覆有转化DNA的微观金或钨粒子)轰击胚愈伤组织或发育中的胚(克里斯托(Christou),1992,植物杂志(Plant J.)2:275-281;岛本,1994,生物技术当前述评(Curr.Opin.Biotechnol.)5:158-162;瓦西尔(Vasil)等人,1992,生物/技术(Bio/Technology)10:667-674)。用于转化单子叶植物的替代方法是基于原生质体转化,如由奥米儒勒(Omirulleh)等人,1993,植物分子生物学(Plant Mol.Biol.)21:415-428所描述。另外的转化方法包括美国专利号6,395,966和7,
151,204(两者都通过引用以其全文结合于此)中所描述的那些。
[0504] 在转化后,根据本领域熟知的方法选出已并入了表达构建体的转化体,并使其再生成为完整植物。通常设计转化程序用于通过如下方法在再生期间或在后续世代中选择性消除选择基因:例如,使用带有两个独立的T-DNA构建体的共转化或利用特异性重组酶位点特异性地切除选择基因。
[0505] 除用本发明的构建体直接转化特定植物基因型外,还可以通过使具有该构建体的植物与缺乏该构建体的第二植物进行杂交来产生转基因植物。例如,可以通过杂交将编码变体的构建体引入特定植物品种中,无需总是直接地转化该给定品种的植物。因此,本发明不仅涵盖了从根据本发明已经转化的细胞直接再生的植物,而且还涵盖了这类植物的后代。如在此使用的,后代可以是指根据本发明制备的亲本植物的任何代的后代。此类后代可以包含根据本发明制备的DNA构建体。杂交导致通过供体植物系与起始系交叉授粉,将转基因引入植物系。此类步骤的非限制性实例描述于美国专利号7,151,204中。
[0506] 植物可以通过回交转化方法生成。例如,植物包含被称为回交转化的基因型、种系、近交体、或杂交体的植物。
[0507] 可以使用遗传标记以协助本发明的一种或多种转基因从一个遗传背景渗入到另一个。标记协助的选择提供了相对于常规育种的优势,在于其可以用于避免由表型变异导致的错误。另外,遗传标记可以在具体杂交的个别后代中提供有关良种种质相对程度的数据。例如,当具有所希望性状并且另外具有非农艺学所希望的遗传背景的植物与良种亲本杂交时,可以使用遗传标记来选择不仅具有感兴趣的性状,还具有相对较大比例所希望种质的后代。以此方式,使一种或多种性状渗入特定遗传背景所需的世代数得以最小化。
[0508] 本发明还涉及产生本发明的变体的方法,包括:(a)在有助于产生该变体的条件下培养包含编码该变体的多核苷酸的转基因植物或植物细胞;并且(b)回收该变体。
[0509] 通过以下实例进一步描述本发明,这些实例不应当解释为限制本发明的范围。
[0510] 实例
[0511] 菌株
[0512] 将米曲霉菌株MT3568用作表达编码纤维二糖水解酶I及其变体的里氏木霉基因的宿主。米曲霉MT3568是米曲霉JaL355的amdS(乙酰胺酶)破坏的基因衍生物(WO 2002/40694),其中通过破坏米曲霉乙酰胺酶(amdS)基因修复pyrG营养缺陷型。
[0513] 培养基和溶液
[0514] COVE蔗糖板或斜面由342g的蔗糖、20g的琼脂粉、20ml的COVE盐溶液、以及补足至1升的去离子水构成。该培养基通过在15psi下高压杀菌15分钟来进行灭菌(细菌学分析手册(Bacteriological Analytical Manual),第8版,修订A,1998)。将该培养基冷却至60℃并且然后添加10mM乙酰胺、15mM CsCl以及 X-100(50μl/500ml)。
[0515] COVE盐溶液由26g的MgSO4·7H2O、26g的KCl、26g的KH2PO4、50ml的COVE痕量金属溶液、以及补足至1升的去离子水构成。
[0516] COVE痕量金属溶液由0.04g的Na2B4O7·10H2O、0.4g的CuSO4·5H2O、1.2g的FeSO4·7H2O、0.7g的MnSO4·H2O、0.8g的Na2MoO4·2H2O、10g的ZnSO4·7H2O、以及补足至1升的去离子水构成。
[0517] DAP-4C培养基由20g的右旋糖、10g的麦芽糖、11g的MgSO4·7H2O、1g的KH2PO4、2g的柠檬酸、5.2g的K3PO4·H2O、0.5g的酵母提取物(Difco)、1ml的消泡剂、0.5ml的KU6痕量金属溶液、2.5g的CaCO3、以及补足至1升的去离子水构成。该培养基通过在15psi下高压杀菌15分钟来进行灭菌(细菌学分析手册(Bacteriological Analytical Manual),第8版,修订A,1998)。在使用之前,每150ml的培养基添加3.5ml的无菌的50%(NH4)2HPO4和5ml的无菌的
20%乳酸。
[0518] G2-Gly培养基由18g的酵母提取物、24g的甘油(86%-88%)、1ml消泡剂、以及补足至1升的去离子水构成。
[0519] KU6痕量金属溶液由0.13g的NiCl2、2.5g的CuSO4·5H2O、13.9g的FeSO4·7H2O、8.45g的MnSO4·H2O、6.8g的ZnCl2、3g的柠檬酸、以及补足至1升的去离子水构成。
[0520] LB培养基由10g的细菌用胰蛋白胨(Bacto-Tryptone)、5g的酵母提取物、10g的氯化钠,以及补足至1升的去离子水构成。
[0521] LB板由10g的细菌用胰蛋白胨、5g的酵母提取物、10g的氯化钠、15g的细菌用琼脂,以及补足至1升的去离子水构成。
[0522] PDA板由马铃薯浸出液(马铃薯浸出液是通过将300g切片的(经过洗涤但未削皮)的马铃薯在水中煮沸30分钟,并且然后将该培养液倾析或滤过粗滤布而制成)构成。然后,添加蒸馏水,直到悬浮液的总体积为1升。然后,添加20g的右旋糖和20g的琼脂粉。该培养基通过在15psi下高压杀菌15分钟来进行灭菌(细菌学分析手册(Bacteriological Analytical Manual),第8版,修订A,1998)。
[0523] TAE缓冲液由40mM Tris碱、20mM乙酸钠、以及1mM EDTA二钠构成。
[0524] YP+2%葡萄糖培养基由去离子水中的1%酵母提取物、2%蛋白胨、以及2%葡萄糖构成。
[0525] YP+2%麦芽糖培养基由10g的酵母提取物、20g的蛋白胨、20g的麦芽糖、以及补足至1升的去离子水构成。
[0526] 实例1:里氏木霉纤维二糖水解酶I的DNA序列信息的来源
[0527] 里氏木霉GH7纤维二糖水解酶I基因的基因组DNA序列和推导的氨基酸序列分别示于SEQ ID NO:1和SEQ ID NO:2中。基因组序列信息由美国能源部联合基因组研究所(JGI)生成并且由马丁内斯(Martinez)等人,2008,自然生物技术(Nature Biotechnology)26(5):553-560公布。全长纤维二糖水解酶I的氨基酸序列可公开地获自国家生物技术信息中心(NCBI)并且被注释为GenBank:EGR44817.1(SEQ ID NO:2)。里氏木霉纤维二糖水解酶I基因的cDNA序列和推导的氨基酸序列分别示于SEQ ID NO:3和SEQ ID NO:2中。
[0528] 基于可公开获得的氨基酸序列,产生编码全长纤维二糖水解酶I的密码子优化的合成基因,用于米曲霉表达,基于由古斯塔夫松(Gustafsson)等人,2004,生物技术趋势(Trends in Biotechnology)22(7):346-353研发的算法。通过 基因合成服务(生命科技公司(Life Technologies Corp.),圣地亚哥,加州,美国)用5’Bam HI限制酶切位点、3’Hind III限制酶切位点和位于起始密码子和Bam HI限制酶切位点之间的Kozac共有序列(CACC)合成密码子优化的编码序列(SEQ ID NO:4)。
[0529] 实例2:里氏木霉纤维二糖水解酶I的定点诱变
[0530] 将编码里氏木霉纤维二糖水解酶I的密码子优化的合成基因提供于非指定卡那霉素抗性大肠杆菌克隆载体中。为了产生里氏木霉纤维二糖水解酶I M6变体(SEQ ID NO:5用于突变体DNA序列,并且SEQ ID NO:6用于变体),将AAC密码子(N197)替换为GCC密码子(197A)并且将AAC密码子(N200)替换为GCC密码子(200A)。使用 引物设计(安捷伦科技公司(Agilent Technologies,Inc.),威明顿,特拉华州,美国)在线工具如下所示设计两个用于定点诱变的合成引物,以引入将AAC密码子(N197)变为GCC密码子(197A)并将AAC密码子(N200)变为GCC密码子(200A)的定点突变。
[0531] 使用下述引物和程序,通过由 基因合成提供的卡那霉素抗性大肠杆菌克隆载体的两次PCR扩增帮助编码野生型里氏木霉纤维二糖水解酶的合成基因的定点诱变:
[0532] 引物F-N197A:
[0533] 5’-GGGAACCCTCGTCGGCCAACGCCAACACCG-3’(SEQ ID NO:23)
[0534] 引物R-N197A:
[0535] 5’-CGGTGTTGGCGTTGGCCGACGAGGGTTCCC-3’(SEQ ID NO:24)
[0536] 引物F-N200A:
[0537] 5’-TCGTCGGCCAACGCCGCCACCGGCATTGGAGG-3’(SEQ ID NO:25)引物R-N200A:
[0538] 5’-CCTCCAATGCCGGTGGCGGCGTTGGCCGACGA-3’(SEQ ID NO:26)
[0539] 使用 高保真PCR试剂盒(Finnzymes Oy公司,斯堡,芬兰)通过PCR连续地引入两个突变。PCR溶液由10μl的5X HF缓冲液(FINNZYMES Oy公司,艾斯堡,芬兰)、1μl的dNTP(10mM)、0.5μl的 DNA聚合酶(0.2单位/μl)(FINNZYMES Oy公司,艾斯堡,芬兰)、2.5μl的引物F-N197A(10μM)、2.5μl的引物R-N197A(10μM)、1μl的模板DNA(载体,10ng/μl)以及32.5μl的去离子水构成,总体积为50μl。使用PTC-
200DNA引擎(MJ研究公司(MJ Research Inc.),沃尔瑟姆,马萨诸塞州,美国)进行PCR,编程为1个循环,在98℃下持续30秒;和16个循环,每个循环在98℃下持续30秒,在55℃下持续1分钟,以及在72℃下持续4分钟。然后将PCR溶液保持在15℃,直至从PCR仪中移出。
[0540] PCR后,将10个单位的Dpn I直接添加至PCR溶液中并在37℃下孵育1小时。然后,根据厂商的方案将1μl的Dpn I处理的PCR溶液转化进ONE TOP10F′化学感受态大肠杆菌细胞(英杰公司(Invitrogen),卡尔斯巴德,加州,美国)中,并且将其分散在补充有0.05mg卡那霉素/ml的LB板上。在37℃下孵育过夜后,观察到转化体在LB卡那霉素板上在选择下生长。将两个转化体在补充有0.05mg卡那霉素/ml的LB培养基中进行培养并且使用Spin Miniprep试剂盒(凯杰公司(QIAGEN Inc.),巴伦西亚,加州,美国)分离
质粒。
[0541] 使用应用生物系统3730xl DNA分析仪(Applied Biosystems 3730xl DNA Analyzer)(应用生物系统公司(Applied Biosystems),福斯特城,加州,美国),用以下所示的载体引物和里氏木霉纤维二糖水解酶I基因特异性引物(R-Central公司)对分离的质粒测序,以便确定不含PCR错误并且含有AAC至GCC突变的代表性质粒。
[0542] 引物F-载体:
[0543] 5’-CGTTGTAAAACGACGGCC-3’(SEQ ID NO:27)
[0544] 引物R-载体:
[0545] 5’-TGTTAATGCAGCTGGCAC-3’(SEQ ID NO:28)
[0546] 引物R-Central:
[0547] 5’-CTTGTCGGAGAACGACGA-3’(SEQ ID NO:29)
[0548] 选择一个不含PCR错误并且含有AAC(N197)至GCC(197A)突变的质粒克隆并且将其指定为质粒pN197A。
[0549] 进行第二轮PCR,以使用 高保真PCR试剂盒通过PCR引入N200A突变。PCR溶液由10μl的5X HF缓冲液、1μl的dNTP(10mM)、0.5μl的 DNA聚合酶(0.2单位/μl)、2.5μl的引物F-N200A(10μM)、2.5μl的引物R-N200A(10μM)、1μl的模板DNA(pN197A,
10ng/μl)以及32.5μl的去离子水构成,总体积为50μl。使用PTC-200DNA引擎进行PCR,编程为1个循环,在98℃下持续30秒;和16个循环,每个循环在98℃下持续30秒,在55℃下持续1分钟,以及在72℃下持续4分钟。然后将PCR溶液保持在15℃,直至从PCR仪中移出。
[0550] PCR后,将10个单位的Dpn I直接添加至PCR溶液中并在37℃下孵育1小时。然后,根据厂商的方案将1μl的Dpn I处理的PCR溶液转化进ONE TOP10F′化学感受态大肠杆菌细胞中,并且将其分散在补充有0.05mg卡那霉素/ml的LB板上。在37℃下孵育过夜后,观察到转化体在LB卡那霉素板上在选择下生长。将两个转化体在补充有0.05mg卡那霉素/ml的LB培养基中进行培养并且使用 Spin Miniprep试剂盒分离质粒。
[0551] 使用应用生物系统3730xl DNA分析仪,用以上所示的引物F-载体、R-载体和R-Central对分离的质粒测序,以便确定不含PCR错误并且含有AAC至GCC突变的代表性质粒。
[0552] 选择一个不含PCR错误并且含有AAC(N197)至GCC(197A)和ACC(N200)至GCC(200A)突变的质粒克隆并且将其指定为质粒pM6。在此将该变体指定为“M6变体”。
[0553] 实例3:包含编码纤维二糖水解酶I的里氏木霉cDNA序列的米曲霉表达载体的构建[0554] 根据厂商的说明书,用Fast Digest  Bam  HI和Hind  III(菲门特斯公司(Fermentas Inc.),格伦伯尼,马里兰州,美国)消化由 基因合成提供的编码里氏木霉纤维二糖水解酶I(SEQ ID NO:4)的卡那霉素抗性大肠杆菌克隆载体。使用TAE缓冲液,通过1.0%琼脂糖凝胶电泳分离反应产物,其中从凝胶切下1552bp产物带,并且使用ILLUSTRATM GFXTM DNA纯化试剂盒(GE医疗集团生命科学部(GE Healthcare Life Sciences),布隆德比,丹麦)进行纯化。
[0555] 然后,使用T4 DNA连接酶(新英格兰生物实验室(New England Biolabs),伊普斯威奇,马萨诸塞州,美国)将1552bp片段克隆进用Bam HI和Hind III消化的pDau109(WO 2005/042735)中。将Bam HI-Hind III消化的pDau109和含有里氏木霉纤维二糖水解酶I编码序列的Bam HI/Hind III片段以1:3的摩尔比混合(即,质量比大约2.5:1或20ng:50ng)并且根据厂商的说明书,在具有1mM ATP的1X T4 DNA连接酶缓冲液(新英格兰生物实验室,伊普斯威奇,马萨诸塞州,美国)中,在16℃下,用50单位的T4 DNA连接酶连接过夜。将里氏木霉纤维二糖水解酶I基因克隆进Bam HI-Hind III消化的pDau109中,导致里氏木霉纤维二糖水解酶I基因在NA2-tpi双启动子的控制下进行转录。NA2-tpi启动子是来自编码黑曲霉中性α-淀粉酶的基因的修饰的启动子,其中已经用来自编码构巢曲霉磷酸丙糖异构酶的基因的未翻译的前导序列替换了未翻译的前导序列。
[0556] 根据厂商的方案,将连接混合物转化进ONE TOP10F′化学感受态大肠杆菌细胞中,并且将其分散在补充有0.1mg氨比西林/ml的LB板上。在37℃下孵育过夜后,观察到菌落在LB氨比西林板上在选择下生长。
[0557] 使用以下引物,如下所述,在菌落上通过PCR验证里氏木霉纤维二糖水解酶I基因插入进pDau109中。
[0558] 引物F-pDau109
[0559] 5’-CCCTTGTCGATGCGATGTATC-3’(SEQ ID NO:30)
[0560] 引物R-pDau109
[0561] 5’-ATCCTCAATTCCGTCGGTCGA-3’(SEQ ID NO:31)
[0562] 将1.1X 预混合液(赛默飞世尔科技公司(Thermo Fisher Scientific),罗斯基勒,丹麦)用于PCR。PCR溶液由10μl的1.1X 预混合液、
0.5μl的引物F-pDau109(10μM)和0.5μl的引物R-pDau109(10μM)构成。使用牙签将少量的细胞转移至PCR溶液中。使用PTC-200DNA引擎进行PCR,编程为1个循环,在94℃下持续3分钟;
30个循环,每个循环在94℃下持续30秒,在50℃下持续1分钟,以及在72℃下持续2分钟;以及1个循环,在72℃下持续1分钟。然后将PCR溶液保持在15℃,直至从PCR仪中移出。
[0563] 使用TAE缓冲液,通过1.0%琼脂糖凝胶电泳分析PCR产物,其中观察到一个1860bp PCR产物带,从而证实里氏木霉纤维二糖水解酶I编码序列插入进pDau109中。
[0564] 将含有里氏木霉纤维二糖水解酶I质粒构建体的大肠杆菌转化体在补充有0.1mg的氨比西林/ml的LB培养基中进行培养并且使用 Spin Miniprep试剂盒分离质粒DNA。将该质粒指定为pKHJN0036。
[0565] 实例4:包含编码纤维二糖水解酶I M6变体的里氏木霉cDNA序列的米曲霉表达载体的构建
[0566] 根据厂商的说明书,用Fast Digest Bam HI和Hind III消化编码里氏木霉纤维二糖水解酶I M6变体的质粒pM6。使用TAE缓冲液,通过1.0%琼脂糖凝胶电泳分离反应产物,其中从凝胶切下1552bp产物带,并且使用ILLUSTRATM GFXTM DNA纯化试剂盒进行纯化。
[0567] 然后,使用T4 DNA连接酶将1552bp片段克隆进用Bam HI和Hind III消化的pDau109中。将Bam HI-Hind III消化的pDau109和含有里氏木霉纤维二糖水解酶I M6变体编码序列的Bam HI/Hind III片段以1:3的摩尔比混合(即,质量比大约2.5:1或20ng:50ng)并且在具有1mM ATP的1X T4DNA连接酶缓冲液中,在16℃下,用50单位的T4 DNA连接酶连接过夜。将里氏木霉纤维二糖水解酶I M6变体基因克隆进Bam HI-Hind III消化的pDau109中,导致里氏木霉纤维二糖水解酶I M6变体基因在上述NA2-tpi双启动子的控制下进行转录。
[0568] 根据厂商的方案,将连接混合物转化进ONE  TOP10F′化学感受态大肠杆菌细胞中,并且将其分散在补充有0.1mg氨比西林/ml的LB板上。在37℃下孵育过夜后,观察到菌落在LB氨比西林板上在选择下生长。
[0569] 使用以下所示的引物F-pDau109和R-pDau109(实例3),如下所述,在菌落上通过PCR验证里氏木霉纤维二糖水解酶I M6变体基因插入进pDau109中。
[0570] 引物F-pDau109
[0571] 5’-CCCTTGTCGATGCGATGTATC-3’(SEQ ID NO:30)
[0572] 引物R-pDau109
[0573] 5’-ATCCTCAATTCCGTCGGTCGA-3’(SEQ ID NO:31)
[0574] 将1.1X 预混合液用于PCR。PCR溶液由10μl的1.1X预混合液、0.5μl的引物F-pDau109(10μM)和0.5μl的引物R-pDau109(10μM)构成。使用牙签将少量的细胞转移至PCR溶液中。使用PTC-200DNA引擎进行PCR,编程为1个循环,在94℃下持续3分钟;30个循环,每个循环在94℃下持续30秒,在50℃下持续1分钟,以及在72℃下持续2分钟;以及1个循环,在72℃下持续1分钟。然后将PCR溶液保持在15℃,直至从PCR仪中移出。
[0575] 使用TAE缓冲液,通过1.0%琼脂糖凝胶电泳分析PCR反应产物,其中观察到一个1860bp PCR产物带,从而证实里氏木霉纤维二糖水解酶I M6变体编码序列插入进pDau109中。
[0576] 将含有里氏木霉纤维二糖水解酶I M6变体质粒构建体的大肠杆菌转化体在补充有0.1mg的氨比西林/ml的LB培养基中进行培养并且使用 Spin Miniprep试剂盒分离质粒。将该质粒指定为pKHJN0059。
[0577] 实例5:野生型里氏木霉纤维二糖水解酶I的表达
[0578] 根据克里斯滕森(Christensen)等人,1988,生物技术(Biotechnology)6,1419-1422和WO 2004/032648,将表达质粒pKHJN0036转化进米曲霉MT3568原生质体中。根据EP 
0238023B1,第14-15页的方法制备米曲霉MT3568原生质体。
[0579] 在使转化体在PDA板上形成孢子之前,在COVE蔗糖板上通过单一的分生孢子纯化转化体。将转化体的孢子接种进包含0.75ml的YP+2%葡萄糖培养基的96深孔板中并且在30℃下静止孵育4天。从96深孔培养的培养上清液分析转化体的里氏木霉纤维二糖水解酶I的产生。使用E-Page 8%SDS-PAGE 48孔凝胶(英杰公司,卡尔斯巴德,加州,美国)和考马斯亮蓝染色通过SDS-PAGE分析验证表达。基于由SDS-PAGE给出的表达水平,选择一个转化体并且将其指定为米曲霉CBH I。
[0580] 对于较大规模的生产,将米曲霉CBH I孢子分散到COVE蔗糖斜面上并且在37℃下孵育五天。用5ml的0.01% 20将融合的孢子斜面洗涤两次,以使收集的孢子的数目最大化。然后,使用孢子悬浮液接种七个包含150ml的DAP-4C培养基的500ml烧瓶。将培养株在30℃下进行孵育,同时以100rpm进行恒定振荡。在接种后第四天,经由瓶盖MF75 Supor MachV 0.2μm PES过滤器(bottle top MF75 MachV 0.2μm PES filter)(赛默飞
世尔科技公司,罗斯基勒,丹麦)通过过滤收集培养液。使用E-Page 8%SDS-PAGE 48孔凝胶和考马斯亮蓝染色通过SDS-PAGE分析验证表达。来自米曲霉CBH I的培养液产生了里氏木霉纤维二糖水解酶I的大约80kDa的带。
[0581] 实例6:里氏木霉纤维二糖水解酶I M6变体的表达
[0582] 根据克里斯滕森(Christensen)等人,1988,见上文和WO 2004/032648,将表达质粒pKHJN0059转化进米曲霉MT3568原生质体中。根据欧洲专利EP 0238023,第14-15页的方法制备米曲霉MT3568原生质体。
[0583] 在使转化体在PDA板上形成孢子之前,在COVE蔗糖板上通过单一的分生孢子纯化转化体。将转化体的孢子接种进包含0.75ml的YP+2%葡萄糖培养基的96深孔板中并且在30℃下静止孵育4天。从96深孔培养的培养上清液分析转化体的里氏木霉纤维二糖水解酶I M6变体的产生。使用E-Page 8%SDS-PAGE 48孔凝胶和考马斯亮蓝染色通过SDS-PAGE分析验证表达。基于由SDS-PAGE给出的表达水平,选择一个转化体用于进一步工作并且将其指定为米曲霉M6。
[0584] 对于较大规模的生产,将米曲霉M6孢子分散到COVE蔗糖斜面上并且在37℃下孵育五天。用5ml的0.01% 20将融合的孢子斜面洗涤两次,以使收集的孢子的数目最大化。然后,使用孢子悬浮液接种七个包含150ml的DAP-4C培养基的500ml烧瓶。将培养株在
30℃下进行孵育,同时以100rpm进行恒定振荡。在接种后第四天,经由瓶盖MF75 Supor MachV 0.2μm PES过滤器通过过滤收集培养液。使用E-Page 8%SDS-PAGE 48孔凝胶和考马斯亮蓝染色通过SDS-PAGE分析验证表达。来自米曲霉M6的培养液产生了里氏木霉纤维二糖水解酶I M6变体的大约80kDa的带。
[0585] 实例7:里氏木霉野生型纤维二糖水解酶I和纤维二糖水解酶I M6变体的纯化[0586] 将米曲霉CBH I(实例5)和米曲霉M6(实例6)的过滤的培养液调节至pH 7.0并使用0.22μm PES过滤器(Nalge Nunc国际集团,罗契斯特,纽约,美国)过滤。然后,将硫酸铵添加至每一滤液中,至浓度为1.8M。
[0587] 根据以下程序纯化每一滤液。将滤液装载在用1.8M硫酸铵,25mM HEPES(pH 7.0)平衡的Phenyl 6Fast Flow柱(高分辨率(high sub))(通用电气医疗集团(GE Healthcare),英国)上。用0.54M硫酸铵洗涤后,将结合的蛋白用25mM HEPES(pH 7.0)分批洗脱。收集级分并且使用12-孔 4%-12%Bis-Tris凝胶(通用电气医疗集
团,皮斯卡特维,新泽西州,美国)通过SDS-PAGE进行分析。基于如上所述的SDS-PAGE,将这些级分合并并且将其施加至用25mM MES(pH 6.0)平衡的SEPHADEXTM G-25(中)柱(通用电气医疗集团,英国)上。收集级分,通过如上所述的SDS-PAGE进行分析,并合并。将合并的级分TM
施加至用25mM MES(pH 6.0)平衡的6ml RESOURCE  15Q柱(通用电气医疗集团,英国)上,并且针对野生型纤维二糖水解酶用线性0-300mM氯化钠梯度(12个柱体积)或针对变体用线性
0-350mM氯化钠梯度(14个柱体积)洗脱结合的蛋白。收集级分并且使用4-硝基苯基-β-D-吡喃葡萄糖苷(西格玛化学有限公司(Sigma Chemical Co.),圣路易斯,密苏里州,美国)和4-硝基苯基-β-D-吡喃乳糖苷(lactopyranoside)(西格玛化学有限公司,圣路易斯,密苏里州,美国)作为底物通过SDS-PAGE、A280和活性测量值进行分析。在96孔Nunc微量滴定板(赛默科技公司(Thermo Scientific),森尼韦尔,加州,美国)中进行测定。测定缓冲液为50mM伯瑞坦-罗宾森(Britton-Robinson)缓冲液(50mM H3PO4、50mM CH3COOH、50mM H3BO3)与50mM KCl、1mM CaCl2、0.01% X-100,用NaOH将pH调节至6.0。将20μl的蛋白溶液样品吸移进每个孔中并且添加测定缓冲液中的120μl的1mM底物。使用底物4-硝基苯基-β-D-吡喃葡萄糖苷确定β-葡糖苷酶活性并且使用4-硝基苯基-β-D-吡喃乳糖苷确定纤维二糖水解酶I和纤维二糖水解酶变体活性。通过用20μl的4-硝基酚盐标准品(0、0.05、0.075、0.1、
0.2、0.3、0.4、0.5mM)替换蛋白溶液来生成标准曲线。必要的话,将样品稀释于测定缓冲液中,以产生在标准曲线范围内的吸收。将板密封并且在750rpm振荡下在恒温混匀仪(thermomixer)中于37℃下孵育15分钟。孵育后,立即通过添加100μl的0.5M甘氨酸-2mM EDTA(pH 10)而终止反应并且在405nm下测量吸收。记录每个样品的“空白”(其中在终止溶液后添加蛋白)的吸收并且将其从结果中减掉,以获得释放的4-硝基酚盐的吸收。
[0588] 基于SDS-PAGE、A280和活性测量值,将级分合并为终产物。
[0589] 将里氏木霉野生型纤维二糖水解酶I和纤维二糖水解酶I M6变体分别纯化至浓度为57μM和38μM,如分别使用计算的摩尔消光系数84810M-1·cm-1和84810M-1·cm-1通过A280所测量的。
[0590] 实例8:在微晶纤维素上测量里氏木霉纤维二糖水解酶M6变体的活性
[0591] 使用微晶纤维素( PH101;西格玛-奥德里奇(Sigma-Aldrich),圣路易斯,密苏里州,美国)作为底物,将纯化的纤维二糖水解酶I M6变体(实例7)的活性与纯化的里氏木霉野生型纤维二糖水解酶I(实例7)进行比较。将微晶纤维素以60g/升的作为测定缓冲液的2mM CaCl2-50mM乙酸钠(pH 5)悬浮。
[0592] 在连接至Julabo F12水浴器(布赫&霍尔姆公司(Buch&Holm A/S),海莱乌,丹麦)的水套玻璃比色槽中测量里氏木霉野生型纤维二糖水解酶I和纤维二糖水解酶I M6变体的活性。每个反应室都填充有5ml的微晶纤维素悬浮液并在600rpm下进行磁力搅拌。使用具有Fusion 100注射(Chemyx公司,斯坦福,得克萨斯州,美国)的250μl玻璃注射器(汉密尔顿有限公司(Hamilton Co.),波士顿,马萨诸塞州,美国)将酶经1秒的注射时间(野生型:8.8μl,528μl/分钟;M6变体:13.16μl,789μl/分钟)注射进比色槽中,至终浓度为100nM(5μg/ml)。在用80μl的1M NaOH淬灭之前,允许反应在25℃下进行5小时。
[0593] 从每个反应中移出2个2ml的样品并且用0.2μM亲水性 NML针筒式滤器(赛多利斯斯泰迪生物技术公司(Sartorius Stedim Biotech S.A.),哥廷根,德国)过滤。将滤液以1:10用milliQ水稀释(未稀释地测量对照)并且使用配备有4mm x 25cm CARBOPACTM PA10柱(赛默科技公司,森尼韦尔,加州,美国)、Dionex GP40梯度泵(赛默科技公司,森尼韦尔,加州,美国)和具有金工作电极(标准碳水化合物环境)的Dionex ED40电化学检测器(赛默科技公司,森尼韦尔,加州,美国)的Dionex ICS-5000DC高效液相色谱(HPLC)系统(赛默科技公司,森尼韦尔,加州,美国)分析葡萄糖、纤维二糖和纤维三糖含量。
使用以下梯度程序以1ml/分钟的流速将寡糖在CARBOPACTM PA10柱上分离:用50mM氢氧化钠等度洗脱0-4分钟;4-28分钟,线性梯度,至90mM氢氧化钠中的100mM乙酸钠;28-29分钟,线性梯度,至200mM氢氧化钠中的450mM乙酸钠;29-30分钟,线性梯度,至100mM氢氧化钠;30-
31分钟,线性梯度,至50mM氢氧化钠;以及31-35分钟,在初始条件下重新平衡。合并的外部标准品为([葡萄糖]/[纤维二糖]/[纤维三糖]):1μM/2μM/0.5μM、2μM/4μM/1μM、3μM/6μM/
1.5μM、4μM/8μM/2μM以及5μM/10μM/2.5μM。使用 7色谱数据系统(赛默
飞世尔科技公司,罗斯基勒,丹麦)进行色谱图峰积分、标准曲线和浓度测定。
[0594] 如示于图1和表1中的结果证明,与野生型纤维二糖水解酶相比,纤维二糖水解酶I M6变体针对微晶纤维素的活性增加大约65%。
[0595] 表1:在pH 5和25℃下5小时后,通过里氏木霉野生型纤维二糖水解酶I及其纤维二糖水解酶I M6变体由微晶纤维素产生的糖。
[0596]   [葡萄糖](μM) [纤维二糖](μM) [纤维三糖](μM)对照 15.9 1.6 2.5
野生型 22.9±0.3 121.4±4.3 5.4±4x 10-3
M6变体 29.1±10-3 201.7±0.5 8.1±0.04
[0597] 实例9:预处理的玉米秸杆水解测定
[0598] 在美国能源部国家可再生能源实验室(NREL)使用1.4wt%硫酸在165℃和107psi下对玉米秸秆预处理8分钟。预处理的玉米秸秆(PCS)中的水不溶性固形物含有56.5%纤维素、4.6%半纤维素、以及28.4%木质素。纤维素和半纤维素通过两段硫酸水解、以及随后通过使用NREL标准分析程序#002的高效液相色谱法的分析进行测定。在用硫酸水解纤维素和半纤维素级分后,使用NREL标准分析程序#003通过重量分析法测定木质素。
[0599] 通过在剧烈混合下添加10M NaOH将PCS的pH调节至5.0,并且然后在120℃下高压杀菌20分钟来制备未碾磨、未洗涤PCS(全浆料PCS)。全浆料PCS的干重是29%。通过在Cosmos ICMG 40多效用湿研磨机(EssEmm公司,泰米尔纳德邦,印度)中碾磨全浆料PCS来制备碾磨的未洗涤的PCS(干重32.35%)。
[0600] PCS的水解使用2.2ml深孔平板(爱思进(Axygen),联合市(Union City),加州,美国)在1.0ml的总反应体积中进行。用50mg的不溶性PCS固形物/ml的含有1mM硫酸锰和不同酶组合物的不同蛋白负载量(表示为mg蛋白质/克纤维素)的50mM乙酸钠(pH 5.0)缓冲液进行水解。制备酶组合物并且然后将其以从50μl至200μl的范围的体积同时添加至所有的孔中,在每个反应中的终体积为1ml。然后使用ALPS-300TM板式热封机(ALPS-300TM plate heat sealer)(阿博基因公司(Abgene),埃普索姆,英国)将板密封,充分混合,并且在特定温度下孵育72小时。一式三份地重复所有报道的实验。
[0601] 在水解后,使用0.45μm 96孔过滤器板(密理博(Millipore),贝德福德,马萨诸塞州,美国)过滤样品并且如以下所描述分析滤液的糖含量。在不立即使用时,将过滤的等分部分冷冻在-20℃下。通过以下方式测量稀释于0.005M H2SO4中的样品的糖浓度:使用4.6X 250mm HPX-87H柱(伯乐实验室有限公司,赫拉克勒斯,加
州,美国),通过用0.05%w/w苯甲酸-0.005M H2SO4在65℃、0.6ml/分钟的流速下洗脱,并且通过整合来自由纯糖样品标定的折射指数检测(
1100HPLC,安捷伦科技(Agilent Technologies),圣克拉拉,加州,美国)的葡萄糖、纤维二糖、以及木糖信号进行定量。使用所得葡萄糖和纤维二糖等效量来计算各反应的纤维素转化的百分比。
[0602] 单独测量葡萄糖和纤维二糖。针对适当稀释因子来调节所测量的糖浓度。通过针对在零时间点时,未洗涤PCS中的对应的背景糖浓度调节所测量的糖浓度来测定由未洗涤PCS酶促地产生的糖的净浓度。使用MICROSOFT EXCELTM软件(微软,里奇兰,华盛顿,美国)来进行所有HPLC数据处理
[0603] 使用以下等式来计算纤维素转化成葡萄糖的程度:%纤维素转化=[葡萄糖浓度+(1.053x纤维二糖浓度)]/[限制消化物中的(葡萄糖浓度+(1.053x纤维二糖浓度)]X 100。为了计算%纤维素转化,基于纤维素酶对照(100mg的里氏木霉纤维素酶/克纤维素)设置
100%转化点。将三份数据点取平均值并且计算标准差。
[0604] 实例10:不具有纤维二糖水解酶I的酶组合物的制备
[0605] 如WO 2011/057140中所描述在米曲霉中重组制备烟曲霉GH6A纤维二糖水解酶II(SEQ ID NO:32[DNA序列]和SEQ ID NO:33[推导的氨基酸序列])。将烟曲霉纤维二糖水解酶II的过滤的培养液使用400ml SEPHADEXTM G-25柱缓冲液交换进50mM乙酸钠(pH 5.0)中。合并级分。
[0606] 将米曲霉用作宿主,根据WO 2011/057140重组地制备里氏木霉GH5内切葡聚糖酶II(SEQ ID NO:34[DNA序列]和SEQ ID NO:35[推导的氨基酸序列])。将里氏木霉内切葡聚糖酶II的过滤的培养液脱盐并且使用切向流(10K膜,颇尔公司(Pall Corporation))缓冲液交换进20mM Tris(pH 8.0)中。
[0607] 将里氏木霉用作宿主,根据WO 2011/041397重组地制备青霉属(埃默森青)GH61A多肽(SEQ ID NO:36[DNA序列]和SEQ ID NO:37[推导的氨基酸序列])。为了纯化埃默森青霉GH61A多肽,使用配备有5kDa聚醚砜膜(颇尔滤清器公司(Pall Filtron),诺斯伯勒,麻萨诸塞州,美国)的切向流动浓缩器(颇尔滤清器公司,诺斯伯勒,麻萨诸塞州,美国)将发酵培养基脱盐进20mM Tris-HCl(pH 8.5)中。将缓冲液交换的样品装载在用20mM Tris-HCl,(pH 8.0)预平衡的Q Fast Flow柱(通用电气医疗集团,皮斯卡特维,新泽西州,
美国)上,用20mM Tris-HCl(pH 8.0)和1M NaCl洗脱。合并所选级分,加入0.85M硫酸铵,并装载在用20mM Tris-HCl(pH 7.5)和0.85M硫酸铵预平衡的苯基 Fast 
Flow柱上,用20mM Tris-HCl(pH 7.5)洗脱。合并级分,并且使用配备有5kDa聚醚砜膜的切向流动浓缩器(颇尔滤清器公司,诺斯伯勒,麻萨诸塞州,美国)脱盐进50mM乙酸钠(pH 5.0)中。
[0608] 将米曲霉BECh2(WO 2000/39322)用作宿主,根据WO 2006/078256重组地制备烟曲霉GH10木聚糖酶(xyn3)(SEQ ID NO:38[DNA序列]和SEQ ID NO:39[推导的氨基酸序列])。使用 26/10脱盐柱(通用电气医疗集团,皮斯卡特维,新泽西州,美国)将烟曲霉
木聚糖酶的过滤的培养液脱盐并缓冲液交换进50mM乙酸钠pH 5.0中。
[0609] 根据WO 2012/044915重组地制备烟曲霉Cel3Aβ-葡糖苷酶4M突变体(SEQ ID NO:40[DNA序列]和SEQ ID NO:41[推导的氨基酸序列])。使用配备有10kDa聚醚砜膜(颇尔滤清器公司,诺斯伯勒,马萨诸塞州,美国)的切向流浓缩器(颇尔滤清器公司,诺斯伯勒,马萨诸塞州,美国)浓缩烟曲霉Cel3Aβ-葡糖苷酶4M的过滤培养液并与包含100mM氯化钠的50mM乙酸钠(pH 5.0)进行缓冲液交换。
[0610] 将米曲霉JaL355用作宿主(WO 2003/070956),根据拉斯穆森(Rasmussen)等人,2006,生物技术与生物工程(Biotechnology and Bioengineering)94:869-876重组地制备埃默森篮状菌CBS 393.64β-木糖苷酶(SEQ ID NO:42[DNA序列]和SEQ ID NO:43[推导的氨基酸序列])。将过滤的培养液浓缩并且使用配备有10kDa聚醚砜膜的切向流浓缩器脱盐进
50mM乙酸钠(pH 5.0)中。
[0611] 使用微板BCATM蛋白测定试剂盒(Microplate BCATM Protein Assay Kit)(赛默飞世尔科技,沃尔瑟姆,马萨诸塞州,美国)确定上述每种单组分的蛋白浓度,在该试剂盒中将血清白蛋白用作蛋白标准品。制备一种酶组合物,其由如下各单组分构成:39.7%烟曲霉Cel6A纤维二糖水解酶II、15.9%里氏木霉GH5内切葡聚糖酶II、23.8%青霉属(埃默森青霉)GH61A多肽、7.9%烟曲霉GH10木聚糖酶、7.9%烟曲霉β-葡糖苷酶以及4.8%埃默森篮状菌β-木糖苷酶。在此将该酶组合物指定为“不具有纤维二糖水解酶I的纤维素分解酶组合物”。
[0612] 实例11:里氏木霉纤维二糖水解酶I M6变体和里氏木霉野生型纤维二糖水解酶I在纤维素酶组合物对碾磨的未洗涤PCS的水解中的作用的比较
[0613] 使用碾磨的未洗涤PCS作为底物,在40℃下,向不具有纤维二糖水解酶I的纤维素分解酶组合物(实例10)中添加里氏木霉纤维二糖水解酶I M6变体和里氏木霉野生型纤维二糖水解酶I。单独地以0.8633、1.295和1.9425mg酶蛋白/g纤维素向不具有纤维二糖水解酶I的纤维素酶组合物的2.205mg酶蛋白/g纤维素中添加每种纤维二糖水解酶I。
[0614] 如在实例9中所描述进行该测定。将具有碾磨的未洗涤的PCS(5%不溶性固形物)的1ml反应在含有1mM硫酸锰的50mM乙酸钠(pH 5.0)缓冲液中进行24、48和72小时。所有反应一式三份地进行并且涉及在水解开始时的单一混合。
[0615] 示于图2、3和4中的结果证明,在第24、48和72小时,包括里氏木霉纤维二糖水解酶I M6变体的纤维素酶组合物具有显著高于包括里氏木霉野生型纤维二糖水解酶I的纤维素酶组合物的纤维素转化。
[0616] 实例12:通过里氏木霉纤维二糖水解酶I M6变体和里氏木霉野生型纤维二糖水解酶I的差示扫描量热法测定Td
[0617] 使用VP-毛细管差示扫描量热仪(微量热公司(MicroCal Inc.),皮斯卡特维,新泽西州,美国)通过差示扫描量热法(DSC)测定里氏木霉野生型纤维二糖水解酶I和纤维二糖水解酶I M6变体的热稳定性。在200K/小时的恒定的程序化加热速率下,加热在50mM乙酸钠(pH 5.0)中的酶溶液(大约1mg/ml)后获得的热分析图(Cp对T)中,将热变性温度Td(℃)当作变性峰(主要的吸热峰)的顶端。
[0618] 将样品和参比溶液(大约0.2ml)从10℃下的储存条件装载到量热仪中(参比:不具有酶的缓冲液),并且在20℃下热预平衡20分钟,随后从20℃到100℃进行DSC扫描。以大约+/-1℃的精确度确定变性温度。
[0619] 结果证明,与其纤维二糖水解酶I M6变体的68℃相比,里氏木霉野生型纤维二糖水解酶I的Td为69℃。
[0620] 实例13:野生型里氏木霉纤维二糖水解酶I的定点诱变
[0621] 使用编码野生型里氏木霉纤维二糖水解酶I的密码子优化的合成基因(实例1)产生里氏木霉纤维二糖水解酶I TC1-111变体(SEQ ID NO:44用于突变体DNA序列;并且SEQ ID NO:45用于变体),将AAC密码子(N198)替换为GCA密码子(198A)。
[0622] 为了产生里氏木霉纤维二糖水解酶I TC1-116变体(SEQ ID NO:46用于突变体DNA序列;并且SEQ ID NO:47用于变体),将GCC密码子(A199)缺失(A199*)。
[0623] 为了产生里氏木霉纤维二糖水解酶I TC1-61变体(SEQ ID NO:48用于突变体DNA序列;并且SEQ ID NO:49用于变体),将AAC密码子(N200)替换为TGG密码子(200W)。
[0624] 为了产生里氏木霉纤维二糖水解酶I TC1-103变体(SEQ ID NO:50用于突变体DNA序列;并且SEQ ID NO:51用于变体),将AAC密码子(N200)替换为GGA密码子(200G)。
[0625] 使用SOE引物设计工具,如下所示,为每个定点诱变设计两个合成引物。引入的定点突变将AAC密码子(N198)变为GCA密码子(198A),将AAC密码子(N200)变为TGG密码子(200W),并且将AAC密码子(N200)变为GGA密码子(200G),并且将GCC密码子(A199)缺失。
[0626] 引物F-N198A:
[0627] 5’-GCTGGGAACCCTCGTCGAACGCAGCCAACACCGGCATTGGA-3’(SEQ ID NO:52)
[0628] 引物R-N198A:
[0629] 5’-GTTCGACGAGGGTTCCCAGCCTTCGACGTTTG-3’(SEQ ID NO:53)
[0630] 引物F-ΔA199:
[0631] 5’-TGGGAACCCTCGTCGAACAACAACACCGGCATTGGAGGCCAT-3’(SEQ ID NO:54)[0632] 引物R-ΔA199:
[0633] 5’-GTTGTTCGACGAGGGTTCCCAGCCTTCGACG-3’(SEQ ID NO:55)
[0634] 引物F-N200W:
[0635] 5’-GAACCCTCGTCGAACAACGCCTGGACCGGCATTGGAGGCCATGG-3’(SEQ ID NO:56)[0636] 引物R-N200W:
[0637] 5’-GGCGTTGTTCGACGAGGGTTCCCAGCCTTCG-3’(SEQ ID NO:57)
[0638] 引物F-N200G:
[0639] 5’-GAACCCTCGTCGAACAACGCCGGAACCGGCATTGGAGGCCAT-3’(SEQ ID NO:58)[0640] 引物R-N200G:
[0641] 5’-GGCGTTGTTCGACGAGGGTTCCCAGCCTTCG-3’(SEQ ID NO:59)
[0642] 通过包含里氏木霉纤维二糖水解酶I基因的pDau109载体的PCR扩增帮助编码野生型里氏木霉纤维二糖水解酶的合成基因的定点诱变:先前将里氏木霉纤维二糖水解酶I基因克隆进Bam HI-Hind III消化的pDau109中,导致里氏木霉纤维二糖水解酶I基因在NA2-tpi双启动子的控制下进行转录。
[0643] 使用 高保真PCR试剂盒通过PCR引入突变。PCR溶液由10μl的5X HF缓冲液、1μl的dNTP(10mM)、0.5μl的 DNA聚合酶(0.2单位/μl)、2.5μl的引物F-N198A(10μM)、2.5μl的引物R-N198A(10μM)、10μl的模板DNA(pDAu222-里氏木霉纤维二糖水解酶I,1ng/μl)以及23.5μl的去离子水构成,总体积为50μl。对于GCC缺失(A199*变体),使用2.5μl的引物F-ΔA199(10μM)、2.5μl的引物R-ΔA199(10μM)。对于ACC至TGG突变(N200W变体),使用2.5μl引物-F-N200W(10μM)和2.5μl引物R-N200W(10μM)。对于ACC至GGA突变(N200G变体),使用2.5μl引物-F-N200G(10μM)和2.5μl引物R-N200G(10μM)。
[0644] 使用 PCR System 9700(应用生物系统公司,福斯特城,加州,美国)进行PCR,编程为1个循环,在98℃下持续30秒;和19个循环,每个循环在98℃下持续30秒,在
55℃下持续1分钟,以及在72℃下持续4分钟。然后将PCR溶液保持在15℃,直至从PCR仪中移出。
[0645] PCR后,将10个单位的Dpn I直接添加至PCR溶液中并在37℃下孵育1小时。然后,根据厂商的方案将1μl的Dpn I处理的PCR溶液转化进ONE TOP10F′化学感受态大肠杆菌细胞中,并且将其分散在补充有0.15mg氨比西林/ml的LB板上。在37℃下孵育过夜后,观察到转化体在LB氨比西林板上在选择下生长。将两个转化体在补充有0.15mg氨比西林/ml的LB培养基中进行培养并且使用 Spin Miniprep试剂盒分离质粒。
[0646] 使用应用生物系统3730xl DNA分析仪,用以下所示的载体引物和里氏木霉纤维二糖水解酶I基因特异性引物对分离的质粒测序,以便确定不含PCR错误并且含有所希望的突变的代表性质粒。
[0647] 引物F-pDau109
[0648] 5’-CCCTTGTCGATGCGATGTATC-3’(SEQ ID NO:30)
[0649] 引物F-Central1
[0650] 5’-CATGTATCGTAAGCTCGCAGTCATCTCC-3’(SEQ ID NO:60)
[0651] 引物F-Central2
[0652] 5’-CTTCGTGTCGATGGACGCGG-3’(SEQ ID NO:61)
[0653] 引物R-Central3
[0654] 5’-GAACACGAGCCCCTCACTGC-3’(SEQ ID NO:62)
[0655] 引物R-pDau109
[0656] 5’-ATCCTCAATTCCGTCGGTCGA-3’(SEQ ID NO:31)
[0657] 选择一个不含PCR错误并且含有AAC(N198)至GCA(198A)突变的质粒克隆并且将其指定为质粒pN198A。
[0658] 选择一个不含PCR错误并且含有GCC密码子(A199)至(A199*)缺失突变的质粒克隆并且将其指定为质粒pΔA199。
[0659] 选择一个不含PCR错误并且含有AAC(N200)至TGG(200W)突变的质粒克隆并且将其指定为质粒pN200W。
[0660] 选择一个不含PCR错误并且含有AAC(N200)至GGA(200G)突变的质粒克隆并且将其指定为质粒pN200G。
[0661] 使用引物F-Central1、F-Central2、R-Central3以及R-pDau109对pN198A测序。使用引物F-pDau109、F-Central1、F-Central2、R-Central3以及R-pDau109对pΔA199测序。使用引物F-Central1、F-Central2以及R-pDau109对pN200W测序。使用引物F-Central1、F-Central2以及R-pDau109对pN200G测序。
[0662] 实例14:里氏木霉纤维二糖水解酶I TC1-111、TC1-116、TC1-61以及TC1-103变体的表达
[0663] 根据描述于实例6中的方案在米曲霉MT3568中表达质粒pN198A、pΔA199、pN200W以及pN200G。
[0664] 使用E-Page 8%SDS-PAGE 48孔凝胶和考马斯亮蓝染色通过SDS-PAGE分析验证表达。基于由SDS-PAGE给出的表达水平,为质粒pN198A、pΔA199、pN200W以及pN200G各自选择一个转化体并且将其分别指定为米曲霉ΔA199、N200G、N197A以及N200W。
[0665] 对于较大规模的生产,将每种米曲霉菌株的孢子分散到COVE蔗糖斜面上并且在37℃下孵育五天。用5ml的0.01% 20将每个融合的孢子斜面洗涤两次,以使收集的孢子的数目最大化。然后,使用每种孢子悬浮液接种七个包含150ml的DAP-4C培养基的
500ml烧瓶。将培养株在30℃下进行孵育,同时以100rpm进行恒定振荡。在接种后第四天,经由瓶盖MF75 Supor MachV 0.2μm PES过滤器通过过滤收集培养液。使用E-Page8%SDS-PAGE 48孔凝胶和考马斯亮蓝染色通过SDS-PAGE分析验证表达。来自每种米曲霉菌株的培养液都产生了里氏木霉A199*、N200G、N197A以及N200W纤维二糖水解酶变体的大约80kDa的带。
[0666] 实例16:里氏木霉纤维二糖水解酶I TC1-111、TC1-116、TC1-61以及TC1-103变体的纯化
[0667] 将发酵液通过具有0.22μm截留的PES瓶顶过滤器(赛默飞世尔科技公司,罗斯基勒,丹麦)进行过滤。向过滤的发酵液中添加硫酸铵,以制备1.8M溶液。
[0668] 通过HIC/亲和色谱、随后是IEX/亲和色谱纯化发酵液。
[0669] 在HIC/亲和色谱步骤中,将发酵液施加至用1.8M硫酸铵、25mM HEPES(pH 7.0)平衡的200ml苯基 6Fast Flow柱(高分辨率)上。施加样品后,将该柱用2个柱体积的1.8M硫酸铵,随后是1个柱体积的0.54M硫酸铵洗涤。将结合的蛋白用25mM HEPES(pH 
7.0)分批洗脱。
[0670] 在280nm下监测蛋白的洗脱。使用12孔 4%-12%Bis-Tris凝胶通过SDS-PAGE分析具有280nm高吸光度的级分的纤维二糖水解酶含量。将具有高含量的此蛋白的级分合并并收集,用于进一步纯化。将合并的级分在用25mM MES(pH 6.0)平衡的SEPHADEXTM G-25(中)柱上脱盐。在280nm下监测蛋白的洗脱并且选择在280nm下具有高吸光度的级分用于第二色谱步骤。
[0671] 将合并的级分施加至用25mM MES(pH 6.0)平衡的60ml RESOURCETM 15Q柱上并且用线性50-300mM氯化钠梯度将结合的蛋白洗脱3个柱体积。在280nm下监测蛋白的洗脱并且在SDS-PAGE上分析在280nm下具有高吸光度的级分。
[0672] 合并具有高含量的纤维二糖水解酶I的级分。
[0673] 实例17:在微晶纤维素上测量里氏木霉纤维二糖水解酶I TC1-111、TC1-116、TC1-61以及TC1-103变体的活性
[0674] 使用洗涤的微晶纤维素( PH101;西格玛-奥德里奇,圣路易斯,密苏里州,美国)作为底物,将纯化的里氏木霉纤维二糖水解酶I TC1-111、TC1-116、TC1-61以及TC1-103变体的活性与纯化的里氏木霉野生型纤维二糖水解酶I进行比较。
[0675] 通过向离心瓶(1L)中施加180g的微晶纤维素和大约400ml的0.22μm过滤水并混合(手动)而制备洗涤的微晶纤维素。将离心瓶在18℃下以4000rpm离心5分钟(Sorvall Hereaus Thermoscientific Sorvall Evolution RC超速离心机)。除去上清液并且再次添加400ml的MQ水。将其重复4次。在第4次重复时,在离心之前,将沉淀物与0.22μm过滤水在“Rocker”o/n(IKA KS 130basic)上混合。除去上清液并且将沉淀物用50mM乙酸钠、2mM CaCl2pH 5缓冲液重悬至终浓度为90g/L。
[0676] 将纯化的纤维二糖水解酶变体在50mM乙酸钠、2mM CaCl2(pH 5)中稀释至浓度为9μM。然后,将100μl的稀释的纤维二糖水解酶I变体添加至微量滴定板的每个孔中,随后以90g/升向每个孔中添加200μl的洗涤的微晶纤维素。将微量滴定板迅速转移至恒温混匀仪中并在1100rpm和25℃下孵育1小时。通过使用 3s-r离心
机(赛默飞世尔科技公司,罗斯基勒,丹麦)在5℃下以3500rpm离心3分钟而终止反应。将五十μl的上清液转移至PCR样品管(0.2ml无裙边96孔PCR板;赛默飞世尔科技公司,罗斯基勒,丹麦)中。将PAHBAH(4-羟基-苯甲酰肼)溶解于缓冲液(0.18M酒石酸钾钠和0.5M NaOH)中,以制备15mg/ml溶液。将七十五μl的PAHBAH溶液添加至PCR样品管中的上清液中。
[0677] 将PCR样品管放于帕尔帖(Peltier)热循环仪中并在95℃下孵育10分钟并且在20℃下孵育5分钟。孵育后,将100μl转移至96孔微量滴定板中并在410nm下测量吸光度。对于每个运行都包括一个标准品。使用的标准品是在50mM乙酸钠、2mM CaCl2(pH 5)中稀释至浓度为0.008、0.016、0.0312、0.0625、0.125、0.25、0.5以及1mM的纤维二糖。除标准品之外,每个运行还包括一个空白(不具有纤维二糖水解酶)。对于所有测量值,减去空白测量值。使用这些标准品将吸光度数据标准化为纤维二糖浓度。
[0678] 如示于图5中的结果证明,与野生型纤维二糖水解酶I相比,纤维二糖水解酶A199*变体针对微晶纤维素的活性增加大约56%。与野生型纤维二糖水解酶I相比,N200G变体的活性增加40%,N198A增加23%并且N200W增加3%。
[0679] 实例18:预处理的玉米秸杆水解测定
[0680] 如实例9中所述,在美国能源部国家可再生能源实验室(NREL)预处理玉米秸秆。
[0681] 通过在剧烈混合下添加10M NaOH将PCS的pH调节至5.0,并且然后在120℃下高压杀菌20分钟来制备未碾磨、未洗涤PCS(全浆料PCS)。全浆料PCS的干重是29%。
[0682] 通过将具有96个锥形孔的深度1/4英寸的特氟隆板的上表面加工为直径1/4英寸并且将下表面加工为直径1/8英寸而产生一个96孔板。每个孔的中心都在标准96孔微量滴定板的对应孔的中心的等效位置处,在中心上大约23/64英寸。每个孔的所得体积大约是135μl。在下文中,将此96孔板称为“填充(fill)板”。通过将适合体积的PCS施加至该板的上表面,然后使用刮刀将该材料铺在表面上并进入洞中,将pH调节的碾磨的未洗涤的PCS用于填充该填充板中的洞。当PCS被挤压通过底表面中的洞时,洞被认为足够满,从而形成面条样管。使用与该填充板表面保持垂直的 列装载刮刀(
Column Loader Scraper)(密理博,比勒利卡,马萨诸塞州,美国)将过
量的PCS从该填充板的顶表面和底表面刮下,使得每个孔中的PCS的表面都与该填充板的表面平齐。然后,将该填充板放在2.2ml深孔板(爱思进,联合市,加州,美国)的顶部,顶表面与该孔板的开口端(例如,该孔板的顶部)相邻,并且将这些孔与该填充板中的PCS填充孔对齐。将该填充板固定在此位置,并且将该装配在Sorvall Legend RT+(赛默科技(Thermo Scientific),沃尔瑟姆,马萨诸塞州,美国)中于2500rpm(1350x g)下离心5分钟。离心后,PCS已经被转移至该深孔板。将3mm玻璃珠(飞世尔科技(Fisher Scientific),沃尔瑟姆,马萨诸塞州,美国)放置于每个孔中供混合。
[0683] 在共0.2ml的反应体积中进行PCS的水解。用50mg的不溶性PCS固形物,包含含有1mM硫酸锰和不同酶组合物的不同蛋白负载量(表示为mg蛋白质/克纤维素)的50mM乙酸钠(pH 5.0)缓冲液进行水解。制备酶组合物并且然后将其以从20μl至50μl的范围的体积同时添加至所有的孔中,在每个反应中的终体积为0.2-0.50ml。然后使用ALPS-300TM板式热封机将板密封,充分混合,并且在特定温度下孵育72小时。一式三份地重复所有报道的实验。
[0684] 在水解后,使用0.45μm 96孔过滤器板过滤样品并且如实例9所述分析滤液的糖含量。
[0685] 对葡萄糖进行测定。针对适当稀释因子来调节所测量的葡萄糖浓度。通过针对零时间点时未碾磨的未洗涤的PCS中的相应背景葡萄糖浓度调节所测量的葡萄糖浓度来确定从未洗涤的PCS酶促产生的葡萄糖的净浓度。使用MICROSOFT EXCELTM软件来进行所有HPLC数据处理。
[0686] 使用以下等式来计算葡萄糖转化成葡萄糖的程度:%葡萄糖转化=(葡萄糖浓度)/(限制消化物中的葡萄糖浓度)X 100。为了计算%葡萄糖转化,基于纤维素酶对照(100mg的里氏木霉纤维素酶/克纤维素)设置100%转化点。将三份数据点取平均值并且计算标准差。
[0687] 实例19:不具有纤维二糖水解酶I的酶组合物#2的制备
[0688] 如在WO 2011/123450中所述,在米曲霉中重组地制备烟曲霉GH6A纤维二糖水解酶II变体(GENESEQP:AZN71803)。将米曲霉纤维二糖水解酶II的过滤的培养液脱盐并且使用切向流(10K膜,颇尔公司)缓冲液交换进包含100mM氯化钠的50mM乙酸钠(pH 5.0)中。
[0689] 将米曲霉用作宿主,根据WO 2011/057140重组地制备金黄色嗜热子囊菌GH5内切葡聚糖酶II(GENESEQP:AZI04862)。使用切向流(5K膜,颇尔公司)浓缩金黄色嗜热子囊菌内切葡聚糖酶II的过滤的培养液。使用400ml SEPHADEXTM G-25柱将浓缩的蛋白脱盐进20mM Tris(pH 8.0)中。
[0690] 如实例10中所披露制备青霉菌属(埃默森青霉)GH61A多肽。
[0691] 如实例10中所披露制备烟曲霉GH10木聚糖酶(xyn3)。
[0692] 如实例10所述制备烟曲霉Cel3Aβ-葡糖苷酶4M突变体。使用微板BCATM蛋白测定试剂盒(赛默飞世尔科技,沃尔瑟姆,马萨诸塞州,美国)确定蛋白浓度,在该试剂盒中将牛血清白蛋白用作蛋白标准品。
[0693] 如实例10所述制备埃默森篮状菌CBS 393.64β-木糖苷酶。
[0694] 使用微板BCATM蛋白测定试剂盒确定上述每种单组分的蛋白浓度,在该试剂盒中将牛血清白蛋白用作蛋白标准品,青霉菌属(埃默森青霉)GH61A多肽除外,使用理论摩尔消光系数在41730M-1·cm-1下对其进行测定。制备一种酶组合物,其由如下各单组分构成:39.7%烟曲霉Cel6A变体纤维二糖水解酶II、15.9%里氏木霉GH5内切葡聚糖酶II、23.8%青霉属(埃默森青霉)GH61A多肽、7.9%烟曲霉GH10木聚糖酶、7.9%烟曲霉β-葡糖苷酶以及
4.8%埃默森篮状菌β-木糖苷酶。在此将该酶组合物指定为“不具有纤维二糖水解酶I的纤维素分解酶组合物#2”。
[0695] 实例20:Rasamsonia emersonii纤维二糖水解酶I的DNA序列信息的来源
[0696] 野生型Rasamsonia emersonii GH7纤维二糖水解酶I基因的基因组DNA序列和推导的氨基酸序列分别示于SEQ ID NO:11和SEQ ID NO:12中。该基因序列与Genbank条目AF439935.4具有99%一致性。Rasamsonia emersonii纤维二糖水解酶I基因的cDNA序列和推导的氨基酸序列分别示于SEQ ID NO:63和SEQ ID NO:12中。
[0697] 基于Rasamsonia emersonii纤维二糖水解酶I的cDNA序列,产生编码全长纤维二糖水解酶I的密码子优化的合成基因,用于米曲霉表达,基于由古斯塔夫松(Gustafsson)等人,2004,生物技术趋势(Trends in Biotechnology)22(7):346-353研发的算法。通过基因合成服务(生命科技公司,圣地亚哥,加州,美国)用5’Bam HI限制酶切位点、3’Hind III限制酶切位点和位于起始密码子和Bam HI限制酶切位点之间的Kozac共有序列(CACC)合成密码子优化的编码序列(SEQ ID NO:64)。
[0698] 实例21:野生型Rasamsonia emersonii纤维二糖水解酶I的定点诱变
[0699] 将编码野生型Rasamsonia emersonii纤维二糖水解酶I的密码子优化的合成基因提供于非指定卡那霉素抗性大肠杆菌克隆载体中。
[0700] 为了产生R.emersonii纤维二糖水解酶I PC1-146变体(SEQ ID NO:65用于突变体DNA序列;并且SEQ ID NO:66用于变体),将AAC密码子(N194)替换为GCA密码子(194A)并且将AAC密码子(N197)替换为GCA密码子(197A)。
[0701] 使用SOE引物设计工具,如下所示,为定点诱变设计两个合成引物。引入的定点突变将AAC密码子(N194)变为GCA密码子(194A)并且将AAC密码子(N197)变为GCA密码子(197A)。
[0702] 引物F-N194A N197A:
[0703] 5’-AAGGATGGCAGCCCTCGTCCGCAAACGCGGCAACTGGCATCGGTGATCAC-3’(SEQ ID NO:67)
[0704] 引物R-N194A N197A:
[0705] 5’-GGACGAGGGCTGCCATCCTTCCACGTTCGC-3’(SEQ ID NO:68)
[0706] 通过包含被指定为pDau222-R.emersonii纤维二糖水解酶I的R.emersonii纤维二糖水解酶I基因的pDau109载体的PCR扩增帮助编码野生型R.emersonii纤维二糖水解酶I的合成基因的定点诱变。先前将R.emersonii纤维二糖水解酶I基因克隆进Bam HI-Hind III消化的pDau109中,导致R.emersonii纤维二糖水解酶I基因在NA2-tpi双启动子的控制下进行转录。
[0707] 使用 高保真PCR试剂盒通过PCR引入突变。PCR溶液由10μl的5X HF缓冲液、1μl的dNTP(10mM)、0.5μl的 DNA聚合酶(0.2单位/μl)、0.25μl的引物F-N194A N197A(100μM)、0.25μl的引物R-N194A N197A(100μM)、10μl的模板DNA(pDau222-R.emersonii纤维二糖水解酶I,1ng/μl)以及28μl的去离子水构成,总体积为50μl。使用PCR System 9700(应用生物系统公司,福斯特城,加州,美国)进行PCR,编程
为1个循环,在98℃下持续30秒;和19个循环,每个循环在98℃下持续30秒,在55℃下持续1分钟,以及在72℃下持续4分钟。然后将PCR溶液保持在8℃,直至从PCR仪中移出。
[0708] PCR后,将10个单位的Dpn I直接添加至PCR溶液中并在37℃下孵育1小时。然后,根据厂商的方案将1μl的Dpn I处理的PCR溶液转化进ONE TOP10F′化学感受态大肠杆菌细胞中,并且将其分散在补充有0.15mg氨比西林/ml的LB板上。在37℃下孵育过夜后,观察到转化体在LB氨比西林板上在选择下生长。将四个转化体在补充有0.15mg氨比西林/ml的LB培养基中进行培养并且使用 Spin Miniprep试剂盒分离质粒。
[0709] 使用应用生物系统3730xl DNA分析仪,用以下所示的载体引物和R.emersonii纤维二糖水解酶I基因特异性引物对分离的质粒测序,以便确定不含PCR错误并且含有所希望的突变的代表性质粒。
[0710] 引物F-pDau109
[0711] 5’-CCACACTTCTCTTCCTTCCTCAATCCTC-3’(SEQ ID NO:69)
[0712] 引物F-Central1
[0713] 5’-GTGAGGCGAACGTGGAAGGATG-3’(SEQ ID NO:70)
[0714] 引物R-Central2
[0715] 5’-gtacctgtgtccgtgccgtcatctg-3’(SEQ ID NO:71)
[0716] 引物R-pDau109
[0717] 5’-ATCCTCAATTCCGTCGGTCGA-3’(SEQ ID NO:31)
[0718] 选择一个不含PCR错误并且含有AAC(N194)至GCA(194A)突变和AAC(N197)至GCA(197A)突变的质粒克隆并且将其指定为质粒pE146。在此将该变体指定为PC1-146。
[0719] 实例22:包含编码纤维二糖水解酶I的Rasamsonia emersoniic DNA序列的米曲霉表达载体的构建
[0720] 根据厂商的说明书,用Fast Digest Bam HI和Hind III(菲门特斯公司,格伦伯尼,马里兰州,美国)消化由 基因合成提供的编码Rasamsonia emersonii纤维二糖水解酶I的卡那霉素抗性大肠杆菌克隆载体。使用TAE缓冲液,通过1.0%琼脂糖凝胶电泳分离反应产物,其中从凝胶切下1375bp产物带,并且使用ILLUSTRATM GFXTM DNA纯化试剂盒进行纯化。
[0721] 然后,使用T4 DNA连接酶将1375bp片段克隆进用Bam HI和Hind III消化的pDau109中。将Bam HI-Hind III消化的pDau109和含有里氏木霉纤维二糖水解酶I编码序列的Bam HI/Hind III片段以1:3的摩尔比混合(即,质量比大约2.5:1或20ng:50ng)并且根据厂商的说明书,在具有1mM ATP的1X T4 DNA连接酶缓冲液中,在16℃下,用50单位的T4 DNA连接酶连接过夜。将Rasamsonia emersonii纤维二糖水解酶I基因克隆进Bam HI-Hind III消化的pDau109中导致Rasamsonia emersonii纤维二糖水解酶I基因在NA2-tpi双启动子的控制下进行转录。
[0722] 根据厂商的方案,将连接混合物转化进ONE TOP10F′化学感受态大肠杆菌细胞中,并且将其分散在补充有0.1mg氨比西林/ml的LB板上。在37℃下孵育过夜后,观察到转化体在LB氨比西林板上在选择下生长。使用引物F-pDau109和R-pDau109,如下所述,在转化体上通过PCR验证Rasamsonia emersonii纤维二糖水解酶I基因插入进pDau109中。
[0723] 将1.1X 预混合液(赛默飞世尔科技公司(Thermo Fisher Scientific),罗斯基勒,丹麦)用于PCR。PCR溶液由10μl的1.1X 预混合液、
0.5μl的引物F-pDau109(10μM)和0.5μl的引物R-pDau109(10μM)构成。使用牙签将少量的细胞转移至PCR溶液中。使用PTC-200DNA引擎进行PCR,编程为1个循环,在94℃下持续3分钟;
30个循环,每个循环在94℃下持续30秒,在50℃下持续1分钟,以及在72℃下持续2分钟;以及1个循环,在72℃下持续1分钟。然后将PCR溶液保持在15℃,直至从PCR仪中移出。
[0724] 使用TAE缓冲液,通过1.0%琼脂糖凝胶电泳分析PCR产物,其中观察到一个1600bp PCR产物带,从而证实Rasamsonia emersonii纤维二糖水解酶I编码序列插入进pDau109中。
[0725] 将含有Rasamsonia emersonii纤维二糖水解酶I质粒构建体的大肠杆菌转化体在补充有0.1mg的氨比西林/ml的LB培养基中进行培养并且使用 Spin Miniprep试剂盒分离质粒DNA。将该质粒指定为pKHJN0135。
[0726] 实例23:野生型Rasamsonia emersonii纤维二糖水解酶I的表达
[0727] 根据克里斯滕森(Christensen)等人,1988,见上文和WO 2004/032648,将表达质粒pKHJN0135转化进米曲霉MT3568原生质体中。根据EP 0238023B1,第14-15页的方法制备米曲霉MT3568原生质体。
[0728] 在使转化体在PDA板上形成孢子之前,在COVE蔗糖板上通过单一的分生孢子纯化转化体。将转化体的孢子接种进包含0.75ml的YP+2%葡萄糖培养基的96深孔板中并且在30℃下静止孵育4天。从96深孔培养的培养上清液分析转化体的Rasamsonia emersonii纤维二糖水解酶I的产生。使用E-Page8%SDS-PAGE 48孔凝胶和考马斯亮蓝染色通过SDS-PAGE分析验证表达。基于由SDS-PAGE给出的表达水平,选择一个转化体用于进一步工作并且将其指定为米曲霉ReCBH I。
[0729] 用于较大规模的生产,将米曲霉ReCBH I孢子分散到COVE蔗糖斜面上并且在37℃下孵育五天。用5ml的0.01% 20将融合的孢子斜面洗涤两次,以使收集的孢子的数目最大化。然后,使用孢子悬浮液接种七个包含150ml的DAP-4C培养基的500ml烧瓶。将培养株在30℃下进行孵育,同时以100rpm进行恒定振荡。在接种后第四天,经由瓶盖MF75 Supor MachV 0.2μm PES过滤器通过过滤收集培养液。使用E-Page 8%SDS-PAGE48孔凝胶和考马斯亮蓝染色通过SDS-PAGE分析验证表达。来自米曲霉ReCBH I的培养液产生了Rasamsonia emersonii纤维二糖水解酶I的大约60kDa的带。
[0730] 对于较大规模的生产,将米曲霉ReCBH I孢子分散到COVE蔗糖斜面上并且在37℃下孵育五天。用5ml G2-Gly培养基将融合的孢子斜面洗涤两次。然后,使用孢子悬浮液接种包含150ml的G2-Gly培养基的500ml烧瓶。将预培养物在30℃下进行孵育,同时以150rpm进行恒定振荡。一天后,使用每种预培养物接种四个包含150ml DAP4C-1培养基的500ml烧瓶。在接种后第四天,经由瓶盖MF75 Supor MachV 0.2μm PES过滤器通过过滤收集培养液。
[0731] 实例24:Rasamsonia emersonii纤维二糖水解酶I PC1-146变体的表达
[0732] 根据克里斯滕森(Christensen)等人,1988,见上文和WO 2004/032648,将表达质粒pE146转化进米曲霉MT3568原生质体中。根据EP 0238023B1,第14-15页的方法制备米曲霉MT3568原生质体。
[0733] 在不具有CsCl的COVE蔗糖板上通过单一的分生孢子纯化转化体。将转化体的孢子接种进包含0.50ml的YP+2%麦芽糖培养基的96深孔板中并且在34℃下静止孵育6天。从96深孔培养的培养上清液分析转化体的R.emersonii纤维二糖水解酶I PC1-146变体的产生。通过测量由微晶纤维素的水解释放的还原糖验证表达。在25℃和1100rpm下,在96孔微量滴定板(NUNC赛默飞世尔科技公司,罗斯基勒,丹麦)中进行水解。每种水解反应混合物都包含
50mM乙酸钠(pH 5.0)中的90g/升的167μl的微晶纤维素、0.01% X-100、20μl的培养上清液以及63μl的50mM乙酸钠(pH 5.0)、0.01% X-100。将板用胶带密封。
通过将板以3500rpm旋转3分钟而终止水解反应。然后,向96孔PCR板(赛默飞世尔科技公司,罗斯基勒,丹麦)中的75μl终止溶液中添加50μl的反应上清液。终止溶液由2%(w/v)NaOH中的15mg/ml 4-羟基苯甲酰肼(西格玛化学有限公司,圣路易斯,密苏里州,美国)、50mg/ml酒石酸钾钠(西格玛化学有限公司,圣路易斯,密苏里州,美国)构成。将板用盖密封并且将混合物在95℃下孵育10分钟并且在20℃下孵育5分钟。然后,将100μl转移至微量滴定板中并且使用 Plus 384(分子设备公司(Molecular Devices),森尼韦尔,加
州,美国)测量410nm下的吸光度。还原糖的浓度与氧化的4-羟基苯甲酰肼在410nm下的吸光度成比例。通过向96孔PCR板中的75μl的终止溶液和46μl的milliQ水的混合物中添加4μl的培养上清液而测量培养上清液中的还原糖含量。将板用盖密封并且将混合物在95℃下孵育
10分钟并且在20℃下孵育5分钟。然后,将100μl转移至微量滴定板中并在410nm下测量吸光度。从410nm下的水解反应的吸光度中减去来自细胞培养上清液的410nm下的吸光度,以测量由这些酶释放的还原糖的量。
[0734] 基于微晶纤维素的水解程度,选择一个转化体并且将其指定为米曲霉PC1-146。
[0735] 对于较大规模的生产,将米曲霉PC1-146孢子分散到COVE蔗糖斜面上并且在37℃下孵育五天。用5ml的G2-Gly培养基将融合的孢子斜面洗涤两次。然后,使用孢子悬浮液接种包含150ml的G2-Gly培养基的500ml烧瓶。将预培养物在30℃下进行孵育,同时以150rpm进行恒定振荡。一天后,使用每种预培养物接种四个包含150ml的DAP-4C培养基的500ml烧瓶。在接种后第四天,经由瓶盖MF75 Supor MachV 0.2μm PES过滤器通过过滤收集培养液。
[0736] 实例25:Rasamsonia emersonii野生型纤维二糖水解酶I和R.emersonii纤维二糖水解酶I PC1-146变体的纯化
[0737] 将发酵液通过具有0.22μm截留的PES瓶顶过滤器进行过滤。向过滤的发酵液中添加硫酸铵至浓度为1.8M。通过HIC/亲和色谱、随后是IEX/亲和色谱纯化发酵液。
[0738] 在HIC/亲和色谱步骤中,将发酵液施加至用1.8M硫酸铵、25mM HEPES(pH 7.0)平衡的200ml苯基 6Fast Flow柱(高分辨率)上。施加样品后,将该柱用2个柱体积的1.8M硫酸铵,随后是1个柱体积的0.54M硫酸铵洗涤。将结合的蛋白用25mM HEPES(pH 
7.0)分批洗脱。
[0739] 在280nm下监测蛋白的洗脱。使用12孔 4%-12%Bis-Tris凝胶通过SDS-PAGE分析具有280nm高吸光度的级分的纤维二糖水解酶含量。将具有高含量的蛋白的级分合并并收集,用于进一步纯化。将合并的级分在用25mM MES(pH 6.0)平衡的SEPHADEXTM G-25(中)柱上脱盐。在280nm下监测蛋白的洗脱并且选择在280nm下具有高吸光度的级分用于第二色谱步骤。
[0740] 将合并的级分施加至用25mM MES(pH 6.0)平衡的60ml RESOURCETM 15Q柱上,并且用1.5个柱体积的线性100-200mM氯化钠梯度、随后是1.5个柱体积的300mM氯化钠并且随后是1.5个柱体积的1M氯化钠洗脱结合的蛋白。在280nm下监测蛋白的洗脱并且在SDS-PAGE上分析在280nm下具有高吸光度的级分。合并具有高含量的纤维二糖水解酶I的级分。
[0741] 实例26:在微晶纤维素上测量Rasamsonia emersonii纤维二糖水解酶I PC1-146变体的活性
[0742] 使用洗涤的微晶纤维素( PH101;西格玛-奥德里奇,圣路易斯,密苏里州,美国)作为底物,将纯化的R.emersonii纤维二糖水解酶I PC1-146变体的活性与纯化的里氏木霉野生型纤维二糖水解酶I进行比较。
[0743] 将纯化的纤维二糖水解酶变体在50mM乙酸钠、2mM CaCl2(pH 5)中稀释至浓度为0.4μM。然后,将50μl的稀释的纤维二糖水解酶I变体添加至微量滴定板的每个孔中,随后以
90g/升向每个孔中添加200μl的洗涤的微晶纤维素。将微量滴定板迅速转移至恒温混匀仪中并在1100rpm和50℃下孵育1小时。通过使用 3s-r离心
机在5℃下以3500rpm离心3分钟而终止反应。将五十μl的上清液转移至PCR样品管(0.2ml无裙边96孔PCR板)中。将PAHBAH(4-羟基-苯甲酰肼)溶解于缓冲液(0.18M酒石酸钾钠和0.5M NaOH)中,以制备15mg/ml溶液。将七十五μl的PAHBAH溶液添加至PCR样品管中的上清液中。
[0744] 将PCR样品管放于帕尔帖热循环仪中并在95℃下孵育10分钟并且在20℃下孵育5分钟。孵育后,将100μl转移至96孔微量滴定板中并在410nm下测量吸光度。对于每个运行都包括一个标准品。使用的标准品是在50mM乙酸钠、2mM CaCl2(pH 5)中稀释至浓度为0.008、0.016、0.0312、0.0625、0.125、0.25、0.5以及1mM的纤维二糖。除标准品之外,每个运行还包括一个空白(不具有纤维二糖水解酶)。对于所有测量值,减去空白测量值。使用这些标准品将吸光度数据标准化为纤维二糖浓度。
[0745] 如示于图6中的结果证明,与R.emersonii野生型纤维二糖水解酶I相比,R.emersonii纤维二糖水解酶I PC1-146变体对微晶纤维素的活性增加大约17%。
[0746] 实例27:通过差示扫描量热法测定Rasamsonia emersonii纤维二糖水解酶I PC1-146变体的Td。
[0747] 如实例12所述,使用VP-毛细管差示扫描量热仪通过差示扫描量热法(DSC)测定R.emersonii纤维二糖水解酶I PC1-146变体的热稳定性。
[0748] 结果证明,与其R.emersonii纤维二糖水解酶I PC1-146变体的78℃相比,R.emersonii野生型纤维二糖水解酶I的Td为78℃。
[0749] 实例28:Rasamsonia emersonii纤维二糖水解酶I PC1-146变体和Rasamsonia emersonii野生型纤维二糖水解酶I对纤维素酶组合物水解未洗涤的PCS的影响的比较[0750] 使用未碾磨的未洗涤PCS作为底物,在25℃下,向不具有纤维二糖水解酶I的纤维素分解酶组合物#2(实例19)中添加R.emersonii纤维二糖水解酶I PC1-146变体和R.emersonii野生型纤维二糖水解酶I。对于处于8%总固形物的水解而言,单独地以2.22mg酶蛋白/g纤维素向不具有纤维二糖水解酶I的纤维素酶组合物#2的3.78mg酶蛋白/g纤维素中添加每种纤维二糖水解酶I。对于处于20%总固形物的水解而言,单独地以4.44mg酶蛋白/g纤维素向不具有纤维二糖水解酶I的纤维素酶组合物#2的7.56mg酶蛋白/g纤维素中添加每种纤维二糖水解酶I。
[0751] 如在实例18中所描述进行该测定。将具有未碾磨的未洗涤的PCS(8%和20%总固形物)的反应在含有1mM硫酸锰的50mM乙酸钠(pH 5.0)缓冲液中进行24、48和72小时。一式四份地进行所有反应并且贯穿整个水解在200rpm下进行振荡。
[0752] 示于图7(8%总固形物)和图8(20%总固形物)中的结果证明,在第24、48和72小时,包括R.emersonii纤维二糖水解酶I PC1-146变体的纤维素酶组合物具有显著高于包括R.emersonii野生型纤维二糖水解酶I的纤维素酶组合物的纤维素转化。
[0753] 实例29:水解过程中Rasamsonia emersonii纤维二糖水解酶I PC1-146变体与Rasamsonia emersonii野生型纤维二糖水解酶I的比较
[0754] 在20%TS的未碾磨的未洗涤的PCS上对R.emersonii纤维二糖水解酶I PC1-146变体和R.emersonii野生型纤维二糖水解酶I进行评估。酶基质设计示于下表1中。HTec3获得自诺维信公司,巴格斯瓦尔德,丹麦。在32℃下进行酶水解3天和5天。通过HPLC(1200系列LC系统,安捷伦科技公司(Agilent Technologies Inc.),帕洛阿尔托,加州,美国)分析释放的糖,该HPLC配备有一个Rezex ROA-有机酸H+柱(8%)(7.8x 300mm)(菲罗门公司(Phenomenex Inc.),托伦斯,加州,美国)、0.2mm线内过滤器、一个自动取样器、一个梯度泵以及一个屈光指数检测器。使用的流动相是处于0.9ml/min的流速的5mM硫酸。将不同浓度的葡萄糖用作标准品。
[0755] 如示于图9中的结果证明,R.emersonii纤维二糖水解酶I PC1-146变体表现好于野生型R.emersonii纤维二糖水解酶I。
[0756] 表1
[0757]
[0758] 实例30:同时糖化和发酵(SSF)过程中Rasamsonia emersonii纤维二糖水解酶I PC1-146变体与Rasamsonia emersonii野生型纤维二糖水解酶I的比较
[0759] 实验设计与实例29所示相同,除了在水解开始时与酶一起添加1g/升的红星(RED)酵母和2g/升的尿素之外。使用描述于实例29中的系统通过HPLC分析乙醇释放。将不同浓度的乙醇用作标准品。
[0760] 如示于图10中的结果证明,在SSF过程中,R.emersonii纤维二糖水解酶I PC1-146变体表现好于野生型R.emersonii纤维二糖水解酶I。
[0761] 实例31:用来自里氏木霉纤维二糖水解酶I的接头和碳水化合物结合模块构建Rasamsonia emersonii融合纤维二糖水解酶I
[0762] 编码里氏木霉(红褐肉座菌)纤维二糖水解酶I的密码子优化的合成基因描述于实例1中。
[0763] 编码R.emersonii纤维二糖水解酶I的密码子优化的合成基因描述于实例20中。
[0764] 为了用来自里氏木霉纤维二糖水解酶I的接头和碳水化合物结合模块(CBM)产生编码R.emersonii融合纤维二糖水解酶I的基因(SEQ ID NO:72用于融合蛋白DNA序列;并且SEQ ID NO:73用于融合蛋白),使用剪接重叠延伸(SOE)PCR将编码里氏木霉纤维二糖水解酶I接头和CBM的DNA片段装配到编码R.emersonii纤维二糖水解酶I的基因的3’-端。
[0765] 使用下示引物F-SOE和引物R-pDau109扩增编码里氏木霉纤维二糖水解酶I接头和CBM的DNA片段。
[0766] 引物F-SOE
[0767] 5’-
[0768] GGTCCCATCAACTCGACATTCACAGCCTCGGGTGGAAACCCTCCTGGCGGAAACCCTC-3’SE(Q ID NO:74)
[0769] 引物R-pDau109
[0770] 5’-ATCCTCAATTCCGTCGGTCGA-3’(SEQ ID NO:31)
[0771] 引物F-pDau109
[0772] 5’-CCACACTTCTCTTCCTTCCTCAATCCTC-3’(SEQ ID NO:69)
[0773] 使用 高保真PCR试剂盒扩增编码里氏木霉纤维二糖水解酶1接头和CBM的DNA片段。PCR溶液由10μl的5X HF缓冲液、1μl的dNTP(10mM)、0.5μl的
DNA聚合酶(0.2单位/μl)、0.25μl的引物F-SOE(100μM)、0.25μl的引物R-pDau109(100μM)、
10μl的模板DNA(pDAu222-里氏木霉纤维二糖水解酶I,1ng/μl)以及28μl的去离子水构成,总体积为50μl。使用 PCR系统9700进行PCR,编程为1个循环,在98℃下持续30
秒;和30个循环,每个循环在98℃下持续10秒,在55℃下持续30秒,以及在72℃下持续1分钟。然后将PCR溶液保持在8℃,直至从PCR仪中移出。
[0774] 使用TAE缓冲液使PCR溶液经受1%琼脂糖凝胶电泳,其中从凝胶上切下编码里氏木霉接头和CBM的405bp PCR片段并使用MinElute凝胶提取试剂盒(凯杰公司,巴伦西亚,加州,美国)进行纯化。
[0775] 使用以上引物F-pDau109和引物R-pDau109扩增编码R.emersonii纤维二糖水解酶I的DNA片段。
[0776] 使用 高保真PCR试剂盒扩增编码R.emersonii野生型纤维二糖水解酶1的DNA片段。PCR溶液由10μl的5X HF缓冲液、1μl的dNTP(10mM)、0.5μl的
DNA聚合酶(0.2单位/μl)、0.25μl的引物F-pDAu109(100μM)、0.25μl的引物R-pDau109(100μM)、10μl的模板DNA(pDAu222-R.emersonii纤维二糖水解酶I,1ng/μl)以及28μl的去离子水构成,总体积为50μl。使用 PCR系统9700进行PCR,编程为1个循环,在98℃下持续30秒;和30个循环,每个循环在98℃下持续10秒,在55℃下持续30秒,以及在72℃下持续1分钟。然后将PCR溶液保持在8℃,直至从PCR仪中移出。
[0777] 使用TAE缓冲液使PCR溶液经受1%琼脂糖凝胶电泳,其中从凝胶上切下编码R.emersonii野生型纤维二糖水解酶I的1600bp片段并使用MinElute凝胶提取试剂盒进行纯化。
[0778] 使用SOE PCR和 高保真PCR试剂盒装配两个纯化的DNA片段。PCR溶液由10μl的5X HF缓冲液、1μl的dNTP(10mM)、0.5μl的 DNA聚合酶(0.2单位/μl)、
0.25μl的引物F-pDAu109(100μM)、10μl的编码里氏木霉纤维二糖水解酶1接头和CBM的凝胶纯化的片段、2μl的编码R.emersonii纤维二糖水解酶I的DNA片段以及26μl的去离子水构成,总体积为50μl。使用 PCR系统9700进行PCR,编程为1个循环,在98℃下持续
30秒;和30个循环,每个循环在98℃下持续20秒,在55℃下持续30秒,以及在72℃下持续1分钟。然后将PCR溶液保持在8℃,直至从PCR仪中移出。
[0779] 然后,如下用Bam HI(新英格兰生物实验室,伊普斯威奇,马萨诸塞州,美国)和Hind III(新英格兰生物实验室,伊普斯威奇,马萨诸塞州,美国)消化PCR产生的DNA片段。将四十μl的PCR产物与5μl缓冲液2(新英格兰生物实验室,伊普斯威奇,马萨诸塞州,美国)、
1μl的Bam HI和1μl的Hind III混合并在37℃下孵育4小时。使用TAE缓冲液,使所得PCR产物经受1%琼脂糖凝胶电泳。从凝胶切下大约1567bp的带并使用MinElute凝胶提取试剂盒进行纯化。
[0780] 使用T4 DNA连接酶将编码具有来自里氏木霉纤维二糖水解酶I的接头和碳水化合物结合模块(CBM)的R.emersonii纤维二糖水解酶I的纯化的1567bp片段克隆进用Bam HI和Hind III消化的pDAu109中。将Bam HI-Hind III消化的pDau109和包含具有来自里氏木霉纤维二糖水解酶I编码序列的接头和碳水化合物结合模块(CBM)的R.emersonii纤维二糖水解酶I的Bam HI/Hind III片段以1:3的摩尔比混合(即,等体积的凝胶纯化的产物)并且在具有1mM ATP的1X T4 DNA连接酶缓冲液中用50单位的T4 DNA连接酶连接并在22℃下孵育10分钟。
[0781] 根据厂商的方案,将连接混合物转化进ONE TOP10F′化学感受态大肠杆菌细胞中,并且将其分散在补充有0.1mg氨比西林/ml的LB板上。在37℃下孵育过夜后,观察到转化体在LB氨比西林板上在选择下生长。将两个转化体在补充有0.15mg氨比西林/ml的LB培养基中进行培养并且使用 Spin Miniprep试剂盒分离质粒。
[0782] 通过测序验证编码具有来自里氏木霉纤维二糖水解酶I的接头和碳水化合物结合模块(CBM)的R.emersonii纤维二糖水解酶I的DNA片段插入pDAu109中。使用应用生物系统3730xl DNA分析仪,用载体引物F-pDau109和R-pDau109对分离的质粒测序,以便确定不含PCR错误并且含有正确插入的代表性质粒。
[0783] 选择一个不含PCR错误并且含有编码具有来自里氏木霉纤维二糖水解酶I的接头和碳水化合物结合模块(CBM)的R.emersonii纤维二糖水解酶I的DNA片段的质粒克隆并将其指定为质粒pE147。在此将该融合纤维二糖水解酶I指定为PC1-147。
[0784] 实例32:Rasamsonia emersonii PC1-147融合纤维二糖水解酶I的定点诱变[0785] 将编码R.emersonii PC1-147融合纤维二糖水解酶I的融合蛋白基因提供于pE147中。
[0786] 为了产生R.emersonii PC1-147融合纤维二糖水解酶I的变体(SEQ ID NO:75用于突变体DNA序列;并且SEQ ID NO:76用于变体),将编码R.emersonii PC1-147融合纤维二糖水解酶I的基因中的AAC密码子(N194)替换为GCA密码子(194A)并且将AAC密码子(N197)替换为GCA密码子(197A)。
[0787] 使用SOE引物设计工具,如下所示,为定点诱变设计两个合成引物。引入的定点突变将AAC密码子(N194)变为GCA密码子(194A)并且将AAC密码子(N197)变为GCA密码子(197A)。
[0788] 引物F-N194A N197A:
[0789] 5’-AAGGATGGCAGCCCTCGTCCGCAAACGCGGCAACTGGCATCGGTGATCAC-3’(SEQ ID NO:67)
[0790] 引物R-N194A N197A:
[0791] 5’-GGACGAGGGCTGCCATCCTTCCACGTTCGC-3’(SEQ ID NO:68)
[0792] 通过含有R.emersonii PC1-147融合纤维二糖水解酶I基因的pDau109载体的PCR扩增帮助R.emersonii PC1-147融合纤维二糖水解酶I基因的定点诱变。先前将R.emersonii PC1-147融合纤维二糖水解酶I基因克隆进Bam HI-Hind III消化的pDau109中,导致R.emersonii PC1-147融合纤维二糖水解酶I基因在NA2-tpi双启动子的控制下进行转录。
[0793] 使用 高保真PCR试剂盒通过PCR引入突变。PCR溶液由10μl的5X HF缓冲液、1μl的dNTP(10mM)、0.5μl的 DNA聚合酶(0.2单位/μl)、0.25μl的引物F-N194A N197A(100μM)、0.25μl的引物R-N194A N197A(100μM)、10μl的质粒pE147DNA(1ng/μl)以及28μl的去离子水构成,总体积为50μl。使用 PCR系统9700进行PCR,编程为1个循环,在98℃下持续30秒;和19个循环,每个循环在98℃下持续30秒,在55℃下持续1分钟,以及在72℃下持续4分钟。然后将PCR溶液保持在8℃,直至从PCR仪中移出。
[0794] PCR后,将10个单位的Dpn I直接添加至PCR溶液中并在37℃下孵育1小时。然后,根据厂商的方案将1μl的Dpn I处理的PCR溶液转化进ONE TOP10F′化学感受态大肠杆菌细胞中,并且将其分散在补充有0.15mg氨比西林/ml的LB板上。在37℃下孵育过夜后,观察到转化体在LB氨比西林板上在选择下生长。将四个转化体在补充有0.15mg氨比西林/ml的LB培养基中进行培养并且使用 Spin Miniprep试剂盒分离质粒。
[0795] 使用应用生物系统3730xl DNA分析仪,用引物F-pDau109、F-Central1、R-Central2以及R-pDau109对分离的质粒测序,以便确定不含PCR错误并且含有所希望的突变的代表性质粒。
[0796] 引物F-pDau109
[0797] 5’-CCACACTTCTCTTCCTTCCTCAATCCTC-3’(SEQ ID NO:69)
[0798] 引物F-Central1
[0799] 5’-GTGAGGCGAACGTGGAAGGATG-3’(SEQ ID NO:70)
[0800] 引物R-Central2
[0801] 5’-gtacctgtgtccgtgccgtcatctg-3’(SEQ ID NO:71)
[0802] 引物R-pDau109
[0803] 5’-ATCCTCAATTCCGTCGGTCGA-3’(SEQ ID NO:31)
[0804] 选择一个不含PCR错误并且含有AAC(N194)至GCA(194A)突变和AAC(N197)至GCA(197A)突变的质粒克隆并且将其指定为质粒pE378。在此将该变体指定为PC1-378。
[0805] 实例33:Rasamsonia emersonii PC1-147融合纤维二糖水解酶I和R.emersonii纤维二糖水解酶I PC1-378变体的表达
[0806] 根据克里斯滕森(Christensen)等人,1988,见上文和WO 2004/032648,将表达质粒pE147和pE378转化进米曲霉MT3568原生质体中。根据EP 0238023B1,第14-15页的方法制备米曲霉MT3568原生质体。
[0807] 在不具有CsCl的COVE蔗糖板上通过单一的分生孢子纯化转化体。将转化体的孢子接种进包含0.50ml YP+2%麦芽糖+0.5%葡萄糖培养基的96深孔板中并且在34℃下静止孵育6天。从96深孔培养的培养上清液分析转化体的R.emersonii PC1-147融合纤维二糖水解酶I和R.emersonii纤维二糖水解酶I PC1-378变体的产生。根据描述于实例24中的程序,通过测量由微晶纤维素的水解释放的还原糖而验证表达。
[0808] 基于微晶纤维素的水解程度,为R.emersonii PC1-147融合纤维二糖水解酶I和R.emersonii纤维二糖水解酶I PC1-378变体选择一个转化体并将其分别指定为米曲霉PC1-147和米曲霉PC1-378。
[0809] 对于较大规模的生产,将米曲霉PC1-147或米曲霉PC1-378孢子分散到COVE蔗糖斜面上并且在37℃下孵育五天。用5ml的G2-Gly培养基将融合的孢子斜面洗涤两次。然后,使用孢子悬浮液接种包含150ml的G2-Gly培养基的500ml烧瓶。将预培养物在30℃下进行孵育,同时以150rpm进行恒定振荡。一天后,使用每种预培养物接种四个包含150ml的DAP-4C培养基的500ml烧瓶。在接种后第四天,经由瓶盖MF75 Supor MachV 0.2μm PES过滤器通过过滤收集培养液。
[0810] 实例34:Rasamsonia emersonii PC1-147融合纤维二糖水解酶I和R.emersonii纤维二糖水解酶I PC1-378变体的纯化
[0811] 将发酵液通过具有0.22μm截留的PES瓶顶过滤器进行过滤。向过滤的发酵液中添加硫酸铵至浓度为1.8M。
[0812] 通过HIC/亲和色谱、随后是IEX/亲和色谱纯化发酵液。
[0813] 在HIC/亲和色谱步骤中,将发酵液施加至已经用1.8M硫酸铵、25mM HEPES(pH 7.0)预平衡的200ml苯基 6Fast Flow柱(高分辨率)上。施加样品后,将该
柱用2个柱体积的1.8M硫酸铵,随后是1个柱体积的0.54M硫酸铵洗涤。将结合的蛋白用25mM HEPES(pH 7.0)分批洗脱。
[0814] 在280nm下监测蛋白的洗脱。使用12孔 4%-12%Bis-Tris凝胶在SDS-PAGE上分析具有280nm高吸光度的级分的纤维二糖水解酶I含量。将具有高含量的此蛋白的级分合并并收集,用于进一步纯化。将合并的级分在用25mM MES(pH 6.0)平衡的SEPHADEXTM G-25(中)柱上脱盐。在280nm下监测蛋白的洗脱并且选择在280nm下具有高吸光度的级分用于第二色谱步骤。
[0815] 将合并的级分施加至用25mM MES(pH 6.0)平衡的60ml RESOURCETM 15Q柱上,并且用1.5柱体积的线性100-200mM氯化钠梯度、随后是1.5柱体积的300mM氯化钠,随后是1.5柱体积的1M氯化钠洗脱结合的蛋白。在280nm下监测蛋白的洗脱并且在SDS-PAGE上分析在280nm下具有高吸光度的级分。
[0816] 合并具有高含量的纤维二糖水解酶I的级分。
[0817] 实例35:在微晶纤维素上测量Rasamsonia emersonii PC1-147融合纤维二糖水解酶I和R.emersonii纤维二糖水解酶I PC1-378变体的活性
[0818] 根据实例26,将洗涤的微晶纤维素用作底物,将纯化的R.emersonii PC1-147融合纤维二糖水解酶I和R.emersonii纤维二糖水解酶I PC1-378变体(实例34)的活性与纯化的野生型R.emersonii纤维二糖水解酶I(实例25)进行比较。将值以相对活性示出,其中100%被设置为R.emersonii野生型纤维二糖水解酶I的活性。测定条件为在pH 5、50℃和1100rpm下孵育24小时。
[0819] 如示于图11中的结果证明,与R.emersonii野生型纤维二糖水解酶I相比,R.emersonii PC1-147融合纤维二糖水解酶I和R.emersonii纤维二糖水解酶I PC1-378变体对微晶纤维素的活性分别增加大约22%和44%。
[0820] 通过以下编号的段落进一步描述本发明:
[0821] [1]一种纤维二糖水解酶变体,该变体在对应于SEQ ID NO:2的成熟多肽的位置197、198、199及200的一个或多个位置处包括一个改变,其中对应于位置197、198和200的一个或多个位置处的改变是一个取代并且对应于位置199的位置处的改变是一个缺失,其中该变体具有纤维二糖水解酶活性,并且其中该变体与亲本纤维二糖水解酶的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少95%、至少
96%、至少97%、至少98%或至少99%,但小于100%序列一致性。
[0822] [2]如段落1所述的变体,其中该亲本纤维二糖水解酶选自下组,该组由以下各项组成:(a)一种与SEQ ID NO:2、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20或SEQ ID NO:22的成熟多肽具有至少60%序列一致性的多肽;(b)一种由以下多核苷酸编码的多肽,该多核苷酸在低严格条件下与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19或SEQ ID NO:21的成熟多肽编码序列或其全长互补体杂交;(c)一种由以下多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19或SEQ ID NO:21的成熟多肽编码序列具有至少60%一致性;以及(d)SEQ ID NO:2、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20或SEQ ID NO:22的成熟多肽的一个片段,该片段具有纤维二糖水解酶活性。
[0823] [3]如段落2所述的变体,其中该亲本纤维二糖水解酶与SEQ ID NO:2、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:
20、或SEQ ID NO:22的成熟多肽具有至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少
89%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0824] [4]如段落2或3所述的变体,其中该亲本纤维二糖水解酶由以下多核苷酸编码,该多核苷酸在低严格条件、中严格条件、中-高严格条件、高严格条件、或非常高严格条件下与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、或SEQ ID NO:21的成熟多肽编码序列;或其全长互补体杂交。
[0825] [5]如段落2-4中任一项所述的变体,其中该亲本纤维二糖水解酶由以下多核苷酸编码,该多核苷酸与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、或SEQ ID NO:21的成熟多肽编码序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少
81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0826] [6]如段落2-5中任一项所述的变体,其中该亲本纤维二糖水解酶包括SEQ ID NO:2、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:
18、SEQ ID NO:20、或SEQ ID NO:22的成熟多肽或由其组成。
[0827] [7]如段落2-6中任一项所述的变体,其中该亲本纤维二糖水解酶是SEQ ID NO:2、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、或SEQ ID NO:22的成熟多肽的一个片段,其中该片段具有纤维二糖水解酶活性。
[0828] [8]如段落1-7中任一项所述的变体,该变体与该亲本纤维二糖水解酶或其成熟多肽的氨基酸序列具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少95%一致性、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
[0829] [9]如段落1-8中任一项所述的变体,其中这些改变的数目是1-4个,例如,1、2、3以及4个改变。
[0830] [10]如段落1-9中任一项所述的变体,该变体在对应于位置197的位置处包括一个取代。
[0831] [11]如段落10所述的变体,其中该取代是用Ala进行的。
[0832] [12]如段落1-11中任一项所述的变体,该变体在对应于位置198的位置处包括一个取代。
[0833] [13]如段落12所述的变体,其中该取代是用Ala进行的。
[0834] [14]如段落1-13中任一项所述的变体,该变体在对应于位置200的位置处包括一个取代。
[0835] [15]如段落14所述的变体,其中该取代是用Ala、Gly或Trp进行的。
[0836] [16]如段落1-15中任一项所述的变体,该变体在对应于位置197的位置处包括一个缺失。
[0837] [17]如段落1-16中任一项所述的变体,该变体在对应于位置197、198、199及200的任意位置的两个位置处包括一个改变。
[0838] [18]如段落1-16中任一项所述的变体,该变体在对应于位置197、198、199及200的任意位置的三个位置处包括一个改变。
[0839] [19]如段落1-16中任一项所述的变体,该变体在对应于位置197、198、199及200的每个位置处都包括一个改变。
[0840] [20]如段落1-19中任一项所述的变体,该变体在对应于SEQ ID NO:2的成熟多肽的位置处包括选自下组的一个或多个改变,该组由以下各项组成:N197A、N198A、A199*以及N200A,G,W。
[0841] [21]如段落1-19中任一项所述的变体,该变体在对应于SEQ ID NO:2的成熟多肽的位置处包括改变N197A+N198A。
[0842] [22]如段落1-19中任一项所述的变体,该变体在对应于SEQ ID NO:2的成熟多肽的位置处包括改变N197A+A199*。
[0843] [23]如段落1-19中任一项所述的变体,该变体在对应于SEQ ID NO:2的成熟多肽的位置处包括改变N197A+N200A,G,W。
[0844] [24]如段落1-19中任一项所述的变体,该变体在对应于SEQ ID NO:2的成熟多肽的位置处包括改变N198A+A199*。
[0845] [25]如段落1-19中任一项所述的变体,该变体在对应于SEQ ID NO:2的成熟多肽的位置处包括改变N198A+N200A,G,W。
[0846] [26]如段落1-19中任一项所述的变体,该变体在对应于SEQ ID NO:2的成熟多肽的位置处包括改变A199*+N200A,G,W。
[0847] [27]如段落1-19中任一项所述的变体,该变体在对应于SEQ ID NO:2的成熟多肽的位置处包括改变N197A+N198A+A199*。
[0848] [28]如段落1-19中任一项所述的变体,该变体在对应于SEQ ID NO:2的成熟多肽的位置处包括改变N197A+N198A+N200A,G,W。
[0849] [29]如段落1-19中任一项所述的变体,该变体在对应于SEQ ID NO:2的成熟多肽的位置处包括改变N197A+A199*+N200A,G,W。
[0850] [30]如段落1-19中任一项所述的变体,该变体在对应于SEQ ID NO:2的成熟多肽的位置处包括改变N198A+A199*+N200A,G,W。
[0851] [31]如段落1-19中任一项所述的变体,该变体在对应于SEQ ID NO:2的成熟多肽的位置处包括改变N197A+N198A+A199*+N200A,G,W。
[0852] [32]如段落1-31中任一项所述的变体,该变体包括SEQ ID NO:6或其成熟多肽或由其组成。
[0853] [33]如段落1-31中任一项所述的变体,该变体包括SEQ ID NO:45或其成熟多肽或由其组成。
[0854] [34]如段落1-31中任一项所述的变体,该变体包括SEQ ID NO:47或其成熟多肽或由其组成。
[0855] [35]如段落1-31中任一项所述的变体,该变体包括SEQ ID NO:49或其成熟多肽或由其组成。
[0856] [36]如段落1-31中任一项所述的变体,该变体包括SEQ ID NO:51或其成熟多肽或由其组成。
[0857] [37]如段落1-31中任一项所述的变体,该变体包括SEQ ID NO:66或其成熟多肽或由其组成。
[0858] [38]如段落1-31中任一项所述的变体,其中该亲本是一种杂合或嵌合多肽,其中该亲本的碳水化合物结合结构域被一个不同的碳水化合物结合结构域替换。
[0859] [39]如段落1-31中任一项所述的变体,该变体是一种杂合或嵌合多肽,其中该变体的碳水化合物结合结构域被一个不同的碳水化合物结合结构域替换。
[0860] [40]如段落1-31中任一项所述的变体,其中该亲本是一种融合蛋白,其中将一个异源碳水化合物结合结构域融合至该亲本。
[0861] [41]如段落40所述的变体,其中该碳水化合物结合结构域融合至该亲本的N-末端或C-末端。
[0862] [42]如段落40或41所述的变体,其中该融合蛋白包括SEQ ID NO:73或其成熟多肽或由其组成。
[0863] [43]如段落1-31中任一项所述的变体,该变体是一种融合蛋白,其中将一个异源碳水化合物结合结构域融合至该变体。
[0864] [44]如段落43所述的变体,其中该碳水化合物结合结构域融合至该变体的N-末端或C-末端。
[0865] [45]如段落43或44所述的变体,该变体包括SEQ ID NO:76或其成熟多肽或由其组成。
[0866] [46]如段落1-45中任一项所述的变体,该变体相对于该亲本具有增加的比性能。
[0867] [47]一种编码如段落1-46中任一项所述的变体的分离的多核苷酸。
[0868] [48]一种包含如段落47所述的多核苷酸的核酸构建体或表达载体。
[0869] [49]一种包含如段落47所述的多核苷酸的宿主细胞。
[0870] [50]一种产生纤维二糖水解酶变体的方法,该方法包括:在适合于该变体表达的条件下培养如段落49所述的宿主细胞。
[0871] [51]如段落50所述的方法,进一步包括回收该变体。
[0872] [52]一种用如段落47所述的多核苷酸转化的转基因植物、植物部分或植物细胞。
[0873] [53]一种产生如段落1-46中任一项所述的变体的方法,该方法包括:在有助于该变体产生的条件下培养包括编码该变体的多核苷酸的转基因植物或植物细胞。
[0874] [54]如段落53所述的方法,进一步包括回收该变体。
[0875] [55]一种用于获得纤维二糖水解酶变体的方法,该方法包括在对应于SEQ ID NO:2的成熟多肽的位置197、198、199及200的一个或多个位置处向一种亲本纤维二糖水解酶中引入一个改变,其中对应于位置197、198和200的一个或多个位置处的改变是一个取代并且对应于位置199的位置处的改变是一个缺失,并且其中该变体具有纤维二糖水解酶活性。
[0876] [56]如段落55所述的方法,进一步包括回收该变体。
[0877] [57]一种包含如段落1-46中任一项所述的变体的组合物。
[0878] [58]一种包含如段落1-46中任一项所述的变体的全培养液配制品或细胞培养物组合物。
[0879] [59]一种用于降解纤维素材料的方法,该方法包括:在如段落1-46中任一项所述的变体的存在下,用一种酶组合物处理该纤维素材料。
[0880] [60]如段落59所述的方法,其中对该纤维素材料进行了预处理。
[0881] [61]如段落59或60所述的方法,其中该酶组合物包括选自下组的一种或多种酶,该组由以下各项组成:纤维素酶、具有纤维素分解增强活性的GH61多肽、半纤维素酶、过氧化氢酶、酯酶、棒曲霉素、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶以及膨胀蛋白。
[0882] [62]如段落61所述的方法,其中该纤维素酶是选自下组的一种或多种酶,该组由以下各项组成:内切葡聚糖酶、纤维二糖水解酶、以及β-葡糖苷酶。
[0883] [63]如段落61所述的方法,其中该半纤维素酶是选自下组的一种或多种酶,该组由以下各项组成:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶、以及葡糖醛酸糖苷酶。
[0884] [64]如段落59-63中任一项所述的方法,进一步包括回收该降解的纤维素材料。
[0885] [65]如段落64所述的方法,其中该降解的纤维素材料是一种糖。
[0886] [66]如段落65所述的方法,其中该糖选自下组,该组由以下各项组成:葡萄糖、木糖、甘露糖、半乳糖、以及阿拉伯糖。
[0887] [67]一种用于产生发酵产物的方法,该方法包括:(a)在如段落1-46中任一项所述的变体的存在下,用一种酶组合物糖化纤维素材料;(b)用一种或多种发酵微生物发酵该糖化的纤维素材料,以产生该发酵产物;并且(c)从发酵中回收该发酵产物。
[0888] [68]如段落67所述的方法,其中对该纤维素材料进行了预处理。
[0889] [69]如段落67或68所述的方法,其中该酶组合物包括选自下组的一种或多种酶,该组由以下各项组成:纤维素酶、具有纤维素分解增强活性的GH61多肽、半纤维素酶、过氧化氢酶、酯酶、棒曲霉素、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶以及膨胀蛋白。
[0890] [70]如段落69所述的方法,其中该纤维素酶是选自下组的一种或多种酶,该组由以下各项组成:内切葡聚糖酶、纤维二糖水解酶、以及β-葡糖苷酶。
[0891] [71]如段落69所述的方法,其中该半纤维素酶是选自下组的一种或多种酶,该组由以下各项组成:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶、以及葡糖醛酸糖苷酶。
[0892] [72]如段落67-71中任一项所述的方法,其中步骤(a)和(b)是在同时糖化和发酵中同时执行。
[0893] [73]如段落67-72中任一项所述的方法,其中该发酵产物是醇、烷烃、环烷烃、烯烃、氨基酸、气体、异戊二烯、酮、有机酸、或聚酮化合物。
[0894] [74]一种发酵纤维素材料的方法,该方法包括:用一种或多种发酵微生物发酵该纤维素材料,其中在如段落1-46中任一项所述的变体的存在下,用一种酶组合物糖化该纤维素材料。
[0895] [75]如段落74所述的方法,其中发酵该纤维素材料产生一种发酵产物。
[0896] [76]如段落75所述的方法,进一步包括从发酵中回收该发酵产物。
[0897] [77]如段落75或76所述的方法,其中该发酵产物是醇、烷烃、环烷烃、烯烃、氨基酸、气体、异戊二烯、酮、有机酸、或聚酮化合物。
[0898] [78]如段落74-77中任一项所述的方法,其中在糖化之前,对该纤维素材料进行预处理。
[0899] [79]如段落74-78中任一项所述的方法,其中该酶组合物包括选自下组的一种或多种酶,该组由以下各项组成:纤维素酶、具有纤维素分解增强活性的GH61多肽、半纤维素酶、过氧化氢酶、酯酶、棒曲霉素、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶以及膨胀蛋白。
[0900] [80]如段落79所述的方法,其中该纤维素酶是选自下组的一种或多种酶,该组由以下各项组成:内切葡聚糖酶、纤维二糖水解酶、以及β-葡糖苷酶。
[0901] [81]如段落80所述的方法,其中该半纤维素酶是选自下组的一种或多种酶,该组由以下各项组成:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶、以及葡糖醛酸糖苷酶。
[0902] 在此描述并且要求的这些发明不限于在此披露的具体方面的范围,因为这些方面旨在作为这些发明若干方面的说明。预期任何等效方面都处于这些发明的范围内。实际上,除在此所示和描述的那些之外,对于本领域普通技术人员而言这些发明的不同修改将从前述描述变得清楚。这类修改也旨在落入所附权利要求书的范围内。在有冲突的情况下,以包括定义的本披露为准。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈