首页 / 专利库 / 林业机械与工程 / 城市林业 / 具有分解纤维增强活性的多肽及其编码多核苷酸

具有分解纤维增强活性的多肽及其编码多核苷酸

阅读:1087发布:2020-06-22

专利汇可以提供具有分解纤维增强活性的多肽及其编码多核苷酸专利检索,专利查询,专利分析的服务。并且本 发明 涉及具有分解 纤维 增强活性的分离多肽和编码该多肽的分离多核苷酸。本发明也涉及包括该多核苷酸的核酸构建体、载体、和宿主细胞以及生产和使用该多肽的方法。,下面是具有分解纤维增强活性的多肽及其编码多核苷酸专利的具体信息内容。

1.具有纤维素分解增强活性的分离多肽,其基酸序列为SEQ ID NO:2或SEQ ID NO:
2的第20至326位氨基酸。
2.权利要求1的多肽,其中所述多肽为Thielavia terrestris NRRL 8126多肽。
3.权利要求1的多肽,其由SEQ ID NO:2组成。
4.权利要求1的多肽,由SEQ ID NO:2的第20至326位氨基酸组成。
5.权利要求1的多肽,其由在包含于大肠杆菌NRRL B-30699中的质粒pEJG120中的多核苷酸编码。
6.包括编码权利要求1-5中任一项的多肽的核苷酸序列的分离多核苷酸。
7.核酸构建体,其包括与指导所述多肽在表达宿主中产生的一个或多个调控序列可操作连接的权利要求6所述的多核苷酸。
8.包括权利要求7的核酸构建体的重组表达载体。
9.包括权利要求7的核酸构建体的重组宿主细胞。
10.用于生产权利要求1-5中任一项的多肽的方法,包括(a)在有助于生产该多肽的条件下培养其野生型能够生产该多肽的细胞;以及(b)回收该多肽。
11.用于生产权利要求1-5中任一项的多肽的方法,包括(a)在有助于生产该多肽的条件下培养包括含有编码该多肽的核苷酸序列的核酸构建体的宿主细胞;以及(b)回收该多肽。
12.用于生产权利要求1-5中任一项的多肽的方法,包括(a)在有助于生产该多肽的条件下培养转基因植物或植物细胞,其包括编码本发明的具有纤维素分解增强活性的多肽的多核苷酸;以及(b)回收该多肽。
13.转基因植物部分或植物细胞,其已经用编码权利要求1-5中任一项的多肽的多核苷酸转化,所述转基因植物部分或植物细胞不属于植物品种。
14.包括权利要求1-5中任一项的具有纤维素分解增强活性的多肽、具有纤维素分解活性的多肽和表面活性剂的清洁剂组合物。
15.用于降解或转换纤维素物质的方法,其包括:在存在有效量的权利要求1-5中任一项的具有纤维素分解增强活性的多肽时,用有效量的纤维素分解蛋白质处理纤维素物质,其中存在该具有纤维素分解增强活性的多肽与缺少该具有纤维素分解增强活性的多肽相比增加了纤维素物质的降解。
16.权利要求15的方法,其中该纤维素物质选自草本物质、农业残余物、林业残余物、城市固体废物、废纸、以及纸浆和造纸厂残余物。
17.权利要求15或16的方法,其中该纤维素分解蛋白质选自纤维素酶、葡聚糖内切酶、纤维二糖解酶、和β-葡糖苷酶。
18.权利要求15或16的方法,进一步包括用选自半纤维素酶、酯酶、蛋白酶、漆酶、过化物酶、或其混合物的有效量的一种或多种酶处理纤维素物质。
19.权利要求15或16的方法,其中该方法是预处理过程、同时糖化发酵过程(SSF)中的步骤、或混合水解和发酵过程(HHF)中的步骤。
20.权利要求15或16的方法,进一步包括回收降解的纤维素物质。
21.权利要求20的方法,其中该降解的纤维素物质是糖。
22.权利要求15的方法,其中该纤维素分解蛋白质和/或具有纤维素分解增强活性的多肽以含有或不含有细胞的发酵液形式存在。
23.用于生产发酵产品的方法,包括:
(a)在存在有效量的权利要求1-5中任一项具有纤维素分解增强活性的多肽时,用有效量的纤维素分解蛋白质糖化纤维素物质,其中存在该具有纤维素分解增强活性的多肽与缺少该具有纤维素分解增强活性的多肽相比增加了纤维素物质的降解;
(b)用一种或多种发酵生物发酵糖化的纤维素物质以产生发酵产品;以及(c)从该发酵物回收发酵产品。
24.权利要求23的方法,其中该纤维素物质选自草本物质、农业残余物、林业残余物、城市固体废物、废纸、以及纸浆和造纸厂残余物。
25.权利要求23或24的方法,其中所述的纤维素分解蛋白质选自纤维素酶、葡聚糖内切酶、纤维二糖水解酶、和β-葡糖苷酶。
26.权利要求23或24的方法,进一步包括用选自半纤维素酶、酯酶、蛋白酶、漆酶、过氧化物酶、或其混合物的有效量的一种或多种酶处理纤维素物质。
27.权利要求26的方法,其中该酯酶是脂肪酶、磷脂酶、质酶或其混合物。
28.权利要求23或24的方法,其中在同时糖化和发酵中同时进行步骤(a)和(b)。
29.权利要求23的方法,其中该纤维素分解蛋白质和/或具有纤维素分解增强活性的多肽以含有或不含有细胞的发酵液形式存在。

说明书全文

具有分解纤维增强活性的多肽及其编码多核苷酸

[0001] 关于在联邦政府资助的研究和开发下所产生的发明权利的声明
[0002] 本发明是在能源部授予的主要合同DE-AC36-98GO10337,NREL副合同号ZCO-30017-02的政府支持下产生的。政府具有本发明的某些权利。
[0003] 发明背景发明领域
[0004] 本发明涉及具有纤维素分解(cellulolytic)增强活性的分离多肽和编码该多肽的分离多核苷酸。本发明也涉及包括该多核苷酸的核酸构建体、载体、和宿主细胞以及生产和使用该多肽的方法。
[0005] 相关技术的说明
[0006] 纤维素是通过β-1,4-键共价结合的单糖葡萄糖聚合物。许多生物生产解β-连接的葡聚糖的酶。这些酶包括内切葡聚糖酶、纤维二糖水解酶和β-葡萄糖苷酶。内切葡聚糖酶在随机的位置消化纤维素聚合物,使其打开而受到纤维二糖水解酶的攻击。继而纤维二糖水解酶从该纤维素聚合物的末端释放纤维二糖分子。纤维二糖是葡萄糖的水溶性β-1,4-连接的二聚物。β-葡萄糖苷酶水解纤维二糖为葡萄糖。
[0007] 纤维素原料(feedstock)转化成乙醇的好处是准备好可利用的大量原料、可以避免燃烧或掩埋该材料,并且乙醇燃料非常洁净。木材、农业废物、草本作物、和城市固体废物已经被认为是乙醇生产的原料。这些材料主要由纤维素、半纤维素和木质素组成。一旦纤维素被转化为葡萄糖,该葡萄糖通过酵母被轻易地发酵成为乙醇。
[0008] 这在改善纤维素原料转化的技术中是非常有益的。
[0009] 本发明的目的是提供具有分解纤维增强活性纤维素分解增强活性的分离多肽和编码该多肽的分离核酸序列来改善纤维素原料的转化。
[0010] 发明概述
[0011] 本发明涉及具有分解纤维增强活性纤维素分解增强活性的分离多肽,选自:
[0012] (a)具有与SEQ ID NO:2的第20至326位基酸、SEQ ID NO:4的第18至240位氨基酸、SEQ ID NO:6的第20至258位氨基酸、SEQ ID NO:8的第19至226位氨基酸、或SEQ ID NO:10的第20至304位氨基酸有至少75%同一性的氨基酸序列的多肽;
[0013] (b)由至少在中等严谨条件下与(i)SEQ ID NO:1的第388至1332位核苷酸、SEQ ID NO:3的第98至821位核苷酸、SEQ ID NO:5的第126至978位核苷酸、SEQ ID NO:7的第55至678位核苷酸、或SEQ ID NO:9的第58至912位核苷酸,(ii)包含于SEQ ID NO:1的第388至1332位核苷酸、SEQ ID NO:3的第98至821位核苷酸、或SEQ ID NO:5的第
126至978位核苷酸中的cDNA序列、或包括SEQ ID NO:7的第55至678位核苷酸或SEQ ID NO:9的第58至912位核苷酸的基因组DNA序列,或(iii)(i)或(ii)的互补链杂交的核苷酸序列编码的多肽;以及
[0014] (c)包括SEQ ID NO:2的第20至326位氨基酸、SEQ ID NO:4的第18至240位氨基酸、SEQ ID NO:6的第20至258位氨基酸、SEQ ID NO:8的第19至226位氨基酸、或SEQ ID NO:10的第20至304位氨基酸中一个或多个氨基酸的保守取代、缺失、和/或插入的变体。
[0015] 本发明也涉及编码具有纤维素分解增强活性多肽的分离多核苷酸,选自:
[0016] (a)编码具有与SEQ ID NO:2的第20至326位氨基酸、SEQ ID NO:4的第18至240位氨基酸、SEQ ID NO:6的第20至258位氨基酸、SEQ ID NO:8的第19至226位氨基酸、或SEQ ID NO:10的第20至304位氨基酸、SEQ ID NO:4的第18至240位氨基酸、SEQ ID NO:6的第20至258位氨基酸、SEQ ID NO:8的第19至226位氨基酸、或SEQ ID NO:10的第20至304位氨基酸有至少75%同一性的氨基酸序列的多肽的多核苷酸;
[0017] (b)与SEQ ID NO:1的第388至1332位核苷酸、SEQ ID NO:3的第98至821位核苷酸、SEQ ID NO:5的第126至978位核苷酸、SEQ ID NO:7的第55至678位核苷酸、或SEQ ID NO:9的第58至912位核苷酸有至少75%同一性的多核苷酸;以及
[0018] (c)由至少在中等严谨条件下与(i)SEQ ID NO:1的第388至1332位核苷酸、SEQ ID NO:3的第98至821位核苷酸、SEQ ID NO:5的第126至978位核苷酸、SEQ ID NO:7的第55至678位核苷酸、或SEQ ID NO:9 的第58至912位核苷酸,(ii)包含于SEQ ID NO:1的第388至1332位核苷酸、SEQ ID NO:3的第98至821位核苷酸、或SEQ ID NO:5的第
126至978位核苷酸中的cDNA序列、或包括SEQ ID NO:7的第55至678位核苷酸或SEQ ID NO:9的第58至912位核苷酸的基因组DNA序列,或(iii)(i)或(ii)的互补链杂交的多核苷酸。
[0019] 本发明也涉及包括该多核苷酸的核酸构建体、重组表达载体、和重组宿主细胞。
[0020] 本发明还涉及用于生产这种具有纤维素分解增强活性的多肽的方法,包括(a)在有助于生产该多肽的条件下培养包括包含编码该多肽的多核苷酸的核酸构建体的重组宿主细胞;以及(b)回收该多肽。
[0021] 本发明也涉及包括编码蛋白质的基因的核酸构建体,其中该基因可操作地连接由SEQ ID NO:1的第330至387位核苷酸、SEQ ID NO:3的第47至97位核苷酸、SEQ ID NO:5的第69至125位核苷酸、SEQ ID NO:7的第1至54位核苷酸、或SEQ ID NO:9的第1至
57位核苷酸组成的编码信号肽的核苷酸序列,其中该基因与该核苷酸序列是异源的。
[0022] 本发明也涉及用于降解或转换纤维素物质(cellulosic material)的方法,包括:在存在有效量的具有纤维素分解增强活性的多肽时,用有效量的纤维素分解蛋白质处理纤维素物质,其中该具有纤维素分解增强活性的多肽的存在与缺少具有纤维素分解增强活性的多肽相比增加了纤维素物质的降解。
[0023] 本发明进一步涉及用于生产有机物质的方法,包括:
[0024] (a)在存在有效量的具有纤维素分解增强活性的多肽时,用有效量的纤维素分解蛋白质糖化纤维素物质,其中存在具有纤维素分解增强活性的多肽与缺少该具有纤维素分解增强活性的多肽相比增加了纤维素物质的降解;
[0025] (b)用一种或多种发酵微生物发酵步骤(a)的糖化的纤维素物质;以及
[0026] (c)从该发酵物回收有机物质。
[0027] 附图简述
[0028] 图1A和1B显示具有纤维素分解增强活性的Thielavia terrestris NRRL8126 GH61B多肽的基因组DNA序列和推导的氨基酸序列(分别为SEQ ID NOs:1和2)。预测的内含子用斜体字印刷。预测的信号肽加下划线。
[0029] 图2显示具有纤维素分解增强活性的Thielavia terrestris NRRL 8126GH61C多肽的基因组DNA序列和推导的氨基酸序列(分别为SEQ ID NOs:3和4)。预测的内含子用斜体字印刷。预测的信号肽加下划线。
[0030] 图3显示具有纤维素分解增强活性的Thielavia terrestris NRRL 8126GH61D多肽的基因组DNA序列和推导的氨基酸序列(分别为SEQ ID NOs:5和6)。预测的内含子用斜体字印刷。预测的信号肽加下划线。
[0031] 图4显示具有纤维素分解增强活性的Thielavia terrestris NRRL 8126GH61E多肽的cDNA序列和推导的氨基酸序列(分别为SEQ ID NOs:7和8)。预测的信号肽加下划线。
[0032] 图5显示具有纤维素分解增强活性的Thielavia terrestris NRRL 8126GH61G多肽的cDNA序列和推导的氨基酸序列(分别为SEQ ID NOs:9和10)。预测的信号肽加下划线。
[0033] 图6显示pAlLo1的限制性图谱。
[0034] 图7显示pBANe10的限制性图谱。
[0035] 图8显示pAlLo2的限制性图谱。
[0036] 图9显示pPH27的限制性图谱。
[0037] 图10显示pPH29的限制性图谱。
[0038] 图11显示pPH28的限制性图谱。
[0039] 图12显示pEJG120的限制性图谱。
[0040] 图13显示pEJG111的限制性图谱。
[0041] 图14显示pEJG112的限制性图谱。
[0042] 图15显示pTter61C的限制性图谱。
[0043] 图16显示pTter61D的限制性图谱。
[0044] 图17显示pTter61E的限制性图谱。
[0045] 图18显示pTter61G的限制性图谱。
[0046] 图19显示pEJG108的限制性图谱。
[0047] 图20显示pAlLo24的限制性图谱。
[0048] 图21显示pAlLo28的限制性图谱。
[0049] 图22显示pMJ04的限制性图谱。
[0050] 图23显示pMJ06的限制性图谱。
[0051] 图24显示pMJ09的限制性图谱。
[0052] 图25显示pEmY10的限制性图谱。
[0053] 图26显示pSMAI155的限制性图谱。
[0054] 图27显示pEJG110的限制性图谱。
[0055] 图28显示pEJG114的限制性图谱。
[0056] 图29显示pCW076的限制性图谱。
[0057] 图30显示pCW078的限制性图谱。
[0058] 图31显示pEJG97的限制性图谱。
[0059] 图32A和32B显示烟曲霉(Aspergillus fumigatus)β-葡糖苷酶的基因组DNA序列和推导的氨基酸序列(分别为SEQ ID NOs:75和76)。预测的信号肽加下划线且预测的内含子用斜体字印刷。
[0060] 图33显示pEJG107的限制性图谱
[0061] 图34显示在50-60℃,具有纤维素分解增强活性的Thielavia terrestris GH61B多肽(1mg/g PCS)通过表达分解纤维活性的里氏木霉(Trichoderma reesei)的发酵肉汤和烟曲霉β-葡糖苷酶(5mg/g PCS)对PCS(1%w/v)水解的作用。
[0062] 图35显示在50℃,具有纤维素分解增强活性的Thielavia terrestris GH61B多肽(1mg/g PCS)通过表达分解纤维活性的里氏木霉的发酵肉汤和烟曲霉β-葡糖苷酶(5mg/g PCS)对PCS(1% w/v)水解的作用。
[0063] 图36显示单独的Tr/AoBG或补充有具有分解纤维活性的Thielavia terrestris GH61多肽的Tr/AoBG在50℃,pH 5.0进行115小时的纤维素转化。
[0064] 定义
[0065] 术语”纤维素分解增强活性”(cellulolytic enhancing activity)在此定义为增强具有纤维素分解活性的蛋白质对纤维素物质的水解的生物活性。为了本发明的目的,通过在下列条件下测量来自被分解纤维的蛋白质水解的纤维素物质的还原糖增加来确定纤维素分解增强活性:与具有相等总蛋白质加载(loading)但没有纤维素分解增强活性的对照水解(5.01-7.5mg分解纤维的蛋白质/g PCS中的纤维素(protein/g of cellulose in PCS))相比较,在存在和缺少每g PCS中的纤维素0.01-2.5mg纤维素分解增强活性时,于50℃5-7天,5.0mg分解纤维的蛋白质/g PCS中的纤维素。在优选的方面,使用存在纤维素酶蛋白质加载的3%米曲霉(Aspergillus oryzae)β-葡糖苷酶(根据WO 02/095014在米曲霉中重组生产)或3%烟曲霉β-葡糖苷酶(根据实施例22在米曲霉中重组生产)的 1.5L样品(Novozymes A/S, 丹麦)的混合物作为分解纤维活性的来源。
[0066] 术语“分解纤维活性”在此定义为水解纤维素物质的生物活性。为了本发明的目的,通过测量在下列条件下被分解纤维的混合物水解的纤维素物质 增加来确定分解纤维的活性:与没有加入分解纤维的蛋白质的对照水解相比较于50℃5-7天,1-10mg分解纤维的蛋白质/g PCS中的纤维素。在优选的方面,使用存在纤维素酶蛋白质加载的3%米曲霉β-葡糖苷酶(根据WO 02/095014在米曲霉中重组生产)或3%烟曲霉β-葡糖苷酶(根据实施例22在米曲霉中重组生产)的 1.5L样品(Novozymes A/S,丹麦)的混合物作为分解纤维活性的来源。
[0067] 术语“PCS”或“预处理的玉米秸”在此定义为用加热和稀酸处理而来源于玉米秸(或谷物秸)(corn stover)的纤维素物质。为了本发明的目的,通过实施例24中描述的方法,或变化其时间、温度和酸量来制备PCS。
[0068] 术语“家族61糖苷水解酶”或“家族GH61”在此定义为属于Henrissat B.,1991,A classification of glycosyl hydrolases based on amino-acid sequence similarities,Biochem.J.280:309-316,and Henrissat B.,and Bairoch A.,1996,Updating the sequence-based classification of glycosyl hydrolases,Biochem.J.316:695-696所述的糖苷水解酶家族61的多肽。目前,Henrissat列出了未分类的GH61家族,表明属于这个家族的多肽的性质,例如机制、催化亲核基团/基、催化质子供体、和3-D结构尚未知晓。
[0069] 纤维素物质可以是包含纤维素的任何材料。纤维素一般存在于例如,植物的茎、叶、荚壳、果壳和穗轴或树木的叶、枝和木料。纤维素物质还可以是但不限于,草本材料、农业废物、林业残渣、城市固体废物、废纸、以及纸浆和造纸厂残渣。在此可理解纤维素可以是木质纤维素的形式、包含木质素、纤维素和半纤维素混合基质的植物细胞壁材料。
[0070] 在优选的实施方案中,纤维素物质是玉米秸。在另一个优选的实施方案中,纤维素物质是玉米纤维。在另一个优选的实施方案中,纤维素物质是稻草。在另一个优选的实施方案中,纤维素物质是纸和纸浆加工废料。在另一个优选的实施方案中,纤维素物质是木本或草本植物。在另一个优选的实施方案中,纤维素物质是甘蔗渣(bagasse)。
[0071] 纤维素物质可利用本领域已知的传统方法经受预处理或以被预处理的形式加以使用。例如,物理的预处理技术可包括各种型式的碾压、照射、蒸汽/蒸汽喷发、和水热解作用;化学预处理技术可包括稀酸、碱、有机溶剂、氨、二化硫、二氧化、和pH-控制的水热解作用;以及生物预处理技术可涉及应用木质素-溶解的微生物(参见例如,Hsu,T.-A.,1996,Pretreatment of biomass,in Handbook on Bioethanol:Production and Utilization,Wyman,C.E.,ed.,Taylor & Francis,Washington,DC,179-212;Ghosh,P.,and Singh,A.,1993,Physicochemical and biological treatments for enzymatic/microbial conversion of lignocellulosic biomass,Adv.Appl.Microbiol.39:295-333;McMillan,J.D.,1994,Pretreating lignocellulosic biomass:a review,in Enzymatic Conversion of Biomass for Fuels Production,Himmel,M.E.,Baker,J.O.,and Overend,R.P.,eds.,ACS Symposium Series 566,American Chemical Society,Washington,DC,chapter 15;Gong,C.S.,Cao,N.J.,Du,J.,and Tsao,G.T.,1999,Ethanol production from renewable resources,in Advances in Biochemical Engineering/Biotechnology,Scheper,T.,ed.,Springer-Verlag Berlin Heidelberg,Germany,65:207-241;Olsson,L.,and Hahn-Hagerdal,B.,1996,Fermentation of lignocellulosic hydrolysates for ethanol production,Enz.Microb.Tech.18:312-331;and Vallander,L.,and Eriksson,K.-E.L.,1990,Production of ethanol from lignocellulosic materials:State of the art,Adv.Biochem.Eng./Biotechnol.42:63-95)。
[0072] 本发明的多肽具有的纤维素分解增强活性是由如SEQ ID NO:2的第20至326位氨基酸、SEQ ID NO:4的第18至240位氨基酸、SEQ ID NO:6的第20至258位氨基酸、SEQ ID NO:8的第19至226位氨基酸、或SEQ ID NO:10的第20至304位氨基酸所示氨基酸序列组成的多肽的至少20%、优选至少40%、更优选至少50%、更优选至少60%、更优选至少70%、更优选至少80%、更优选至少90%、最优选至少95%、以及最优选至少100%。
[0073] 分离的多肽:术语“分离的多肽”如在此使用的,是指如通过SDS-PAGE所测定的,为至少20%纯、优选至少40%纯、更优选至少60%纯、更优选至少80%纯、最优选至少90%纯、以及最优选至少95%纯的多肽。
[0074] 基本上纯的多肽:术语“基本上纯的多肽”在此表示按重量计算包含至多10%、优选至多8%、更优选至多6%、更优选至多5%、更优选至多4%、更优选至多3%、更优选至多2%、最优选至多1%、以及最优选至多0.5%的与其天然缔合的其他多肽物质的多肽制品。
因此,优选基本上纯的多肽按重量计算是存在于该制品中的总的多肽的至少92%纯、至少
93%纯、优选至少94%纯、更优选至少95%纯、更优选至少96%纯、更优选至少96%纯、更优选至少97%纯、更优选至少98%纯、更优选至少99%、最优选至少99.5%纯、以及最优选
100%纯。
[0075] 本发明的多肽优选是基本上纯的形式。特别地,优选多肽是“本质上纯的形式”,即,该多肽制品本质上不含与其天然缔合的其他多肽物质。这可例如通过众所周知的重组法方式或通过经典的纯化方法来制备该多肽而实现。
[0076] 在此,术语“基本上纯的多肽”和术语“分离的多肽”以及“分离形式的多肽”同义。
[0077] 同一性:通过参数“同一性”描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。
[0078] 为了本发明的目的,两个氨基酸序列之间同一性的程度可通过利用LASERGENETM TMMEGALIGN 软件(DNASTAR,Inc.,Madison,WI)的Clustal方法(Higgins,1989,CABIOS
5:151-153)来确定,其具有同一性表格和下列多重排列参数:缺口罚分为10,缺口长度罚分为10。成对地排列参数是Ktuple=1,缺口罚分=3,窗口(window)=5,以及对线(diagonals)=5。两个氨基酸序列之间同一性的程度也可通过Smith-Waterman算法确定(Waterman et al.,1976,Adv.Math.20:367),其中缺口开放罚分(gap open penalty)为
11,缺口延伸(extension)罚分为1,且具有BLOSUM62矩阵。
[0079] 为了本发明的目的,两个核苷酸序列之间的同一性程度通过利用LASERGENETM TMMEGALIGN 软件(DNASTAR,Inc.,Madison,WI)的Wilbur-Lipman方法来确定(Wilbur and Lipman,1983,Proceedings of the National Academy of Science USA 80:726-730),其具有同一性表格和下列多重排列参数:缺口罚分为10,缺口长度罚分为10。成对地排列参数是Ktuple=3,缺口罚分=3,以及窗口=20。
[0080] 多肽片段:术语“多肽片段”在此定义为具有从SEQ ID NO:2的第20至326位氨基酸、SEQ ID NO:4的第18至240位氨基酸、SEQ ID NO:6的第20至258位氨基酸、SEQ ID NO:8的第19至226位氨基酸、或SEQ ID NO:10的第20至304位氨基酸;或其同源序列的氨基和/或羧基末端缺失一个或多个氨基酸的多肽,其中该片段具有纤维素分解增强活性。优选地,SEQ ID NO:2的第20至326位氨基酸的片段包含至少277个氨基酸残基,更优选至少287个氨基酸残基,以及最优选至少297个氨基酸残基。优选地,SEQ ID NO:4的第18至240位氨基酸的片段包含至少185个氨基酸残基,更优选至少195个氨基酸残基,以及最优选至少205个氨基酸残基。优选地,SEQ ID NO:6的第20至258位氨基酸的片段包含至少200个氨基 酸残基,更优选至少212个氨基酸残基,以及最优选至少224个氨基酸残基。优选地,SEQ ID NO:8的第19至226位氨基酸的片段包含至少175个氨基酸残基,更优选至少185个氨基酸残基,以及最优选至少195个氨基酸残基。优选地,SEQ ID NO:10的第20至304位氨基酸的片段包含至少240个氨基酸残基,更优选至少255个氨基酸残基,以及最优选至少270个氨基酸残基。
[0081] 亚序列:术语“亚序列”在此定义为从SEQ ID NO:1的第388至1332位核苷酸、SEQ ID NO:3的第98至821位核苷酸、SEQ ID NO:5的第126至978位核苷酸、SEQ ID NO:7的第55至678位核苷酸、或SEQ ID NO:9的第58至912位核苷酸;或其同源序列的5′和/或3′末端缺失一个或多个核苷酸的核苷酸序列,其中该亚序列编码具有分解纤维增加活性的多肽片段。优选地,SEQ ID NO:1的第388至1332位核苷酸的亚序列包含至少831个核苷酸,更优选至少861个核苷酸,以及最优选至少891个核苷酸。优选地,SEQ ID NO:3的第98至821位核苷酸的亚序列包含至少555个核苷酸,更优选至少585个核苷酸,以及最优选至少615个核苷酸。优选地,SEQ ID NO:5的第126至978位核苷酸的亚序列包含至少600个核苷酸,更优选至少636个核苷酸,以及最优选至少672个核苷酸。优选地,SEQ ID NO:7的第55至678位核苷酸的亚序列包含至少525个核苷酸,更优选至少555个核苷酸,以及最优选至少585个核苷酸。优选地,SEQ ID NO:9的第58至912位核苷酸的亚序列包含至少720个核苷酸,更优选至少765个核苷酸,以及最优选至少810个核苷酸。
[0082] 等位变体:术语“等位变体”在此表示占据相同染色体位点的基因的两种或多种备选形式中的任何一种。等位变化通过突变天然发生,并且可导致群体内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。
[0083] 分离的多核苷酸:术语“分离的多核苷酸”如在此使用的,是指如通过琼脂糖电泳所测定的,为至少20%纯、优选至少40%纯、更优选至少60%纯、更优选至少80%纯、最优选至少90%纯、以及最优选至少95%纯的多核苷酸。
[0084] 基本上纯的多核苷酸:术语“基本上纯的多核苷酸”如在此使用的,是指不含其他外来或不需要的核苷酸,并且为适用于遗传工程化的蛋白质生 产系统内形式的多核苷酸制品。因此,基本上纯的多核苷酸按重量计算包含至多10%、优选至多8%、更优选至多6%、更优选至多5%、更优选至多4%、更优选至多3%、更优选至多2%、最优选至多1%、以及最优选至多0.5%的与其天然缔合的其他多核苷酸物质。然而基本上纯的多核苷酸可能包括天然存在的5’和3’非翻译区,例如启动子和终止子。优选基本上纯的多核苷酸是按重量计算为至少90%纯、优选至少92%纯、更优选至少94%纯、更优选至少95%纯、更优选至少96%纯、更优选至少97%纯、更优选至少98%纯、最优选至少99%、以及最优选至少
99.5%纯的。本发明的多核苷酸优选是基本上纯的形式。特别地,优选在此公开的多核苷酸是“本质上纯的形式”,即,该多核苷酸制品本质上不含与其天然缔合的其他多核苷酸物质。在此,术语“基本上纯的多核苷酸”和术语“分离的多核苷酸”以及“分离形式的多核苷酸”同义。多核苷酸可以是基因组、cDNA、RNA、半合成的、合成起源,或其任何组合。
[0085] cDNA:术语“cDNA”在此定义为可通从获得自真核细胞的成熟拼接的mRNA分子逆转录制备的DNA分子。cDNA缺乏通常存在于相应基因组DNA中的内含子序列。起始的初级RNA转录本是在作为成熟拼接的mRNA出现前通过一系列步骤被加工的mRNA前体。这些步骤包括通过称为拼接的过程除去内含子序列。因此来源于mRNA的cDNA缺乏任何内含子序列。
[0086] 核酸构建体:术语“核酸构建体”如在此使用的,是指从天然存在的基因分离,或被改变以否则不会天然存在的方式包含核酸节段的单-或双链的核酸分子。当核酸构建体包含为表达本发明的编码序列所需要的调控序列时,术语核酸构建体和术语“表达盒”同义。
[0087] 调控序列:术语“调控序列”在此定义为包括为表达编码本发明多肽的多核苷酸所必需的或有益的所有成分。各个调控序列可以是与编码该多肽的核苷酸序列同源或异源的或相互之间是同源或异源的。这种调控序列包括但不限于,前导序列、多腺苷酸化序列、前肽序列、启动子、信号肽序列、和转录终止子。至少,该调控序列包括启动子、和转录及翻译终止信号。为了引入促进该调控序列与编码多肽的核苷酸序列的编码区连接的特异性限制酶切位点,该调控序列可具有接头。
[0088] 可操作地连接:术语“可操作地连接”在此表示其中调控序列相对于多核苷酸序列的编码序列被置于适当的位置以使得该调控序列指导多肽的编码序列表达的构型。
[0089] 编码序列:当在此使用时,术语“编码序列”是指直接确定其蛋白质产品的氨基酸序列的核苷酸序列。编码序列的边界一般通过开放阅读框确定,通常从ATG起始密码子或例如GTG和TTG的备选起始密码子开始,并且以例如TAA、TAG和TGA的终止密码子结束。编码序列可以是DNA、cDNA或重组核苷酸序列。
[0090] 表达:术语“表达”包括涉及生产多肽的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰、和分泌。
[0091] 表达载体:术语“表达载体”在此定义为线性或环状的DNA分子,其包括编码本发明多肽的多核苷酸,并且其可操作地连接提供用于其表达的附加核苷酸。
[0092] 宿主细胞:术语“宿主细胞”,如在此使用的,包括对用包括本发明多核苷酸的核酸构建体或表达载体转化、转染、转导等敏感的任何细胞类型。
[0093] 修饰:术语“修饰”在此是指包括或由SEQ ID NO:2的第20至326位氨基酸、SEQ ID NO:4的第18至240位氨基酸、SEQ ID NO:6的第20至258位氨基酸、SEQ ID NO:8的第19至226位氨基酸、或SEQ ID NO:10的第20至304位氨基酸组成的多肽;或其同源序列的任何化学修饰,以及编码该多肽的DNA的遗传操作。修饰可以是一个或多个氨基酸的取代、缺失和/或插入,以及一个或多个氨基酸侧链的替换。
[0094] 人工变体:当在此使用时,术语“人工变体”是指通过表达SEQ ID NO:1、3、5、7、或9;或其同源序列、或其成熟编码区的改变核苷酸序列的生物体而生产的具有纤维素分解增强活性的多肽。改变的(modified)核苷酸序列是通过在SEQ ID NO:1、3、5、7、或9中公开的核苷酸序列;或其同源序列、或其成熟编码区的修饰而获得的。
[0095] 发明详述
[0096] 具有纤维素分解增强活性的多肽
[0097] 在第一个方面,本发明涉及包括下列基序的具有纤维素分解增强活性的分离多肽:
[0098] [ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ] 和[FW]-[TF]-K-[AIV],
[0099] 其中X是任何氨基酸,X(4,5)是在4或5个连续位置的任何氨基酸,以及X(4)是在4个连续位置的任何氨基酸。
[0100] 包括上文记录的基序的分离多肽可进一步包括:
[0101] H-X(1,2)-G-P-X(3)-[YW]-[AILMV],
[0102] [EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],或
[0103] H-X(1,2)-G-P-X(3)-[YW]-[AILMV]和 [EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],
[0104] 其中X是任何氨基酸,X(1,2)是在1个位置或2个连续位置的任何氨基酸X(3)是在3个连续位置的任何氨基酸,以及X(2)是在2个连续位置的任何氨基酸。在上述基序中,使用已接受的IUPAC单字母氨基酸缩写。
[0105] 在优选的实施方案中,具有纤维素分解增强活性的分离多肽进一步包括H-X(1,2)-G-P-X(3)-[YW]-[AILMV]。在另一个优选的实施方案中,具有纤维素分解增强活性的分离多肽进一步包括[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]。在另一个优选的实施方案中,具有纤维素分解增强活性的分离多肽进一步包括H-X(1,2)-G-P-X(3)-[YW]-[AILMV] 和[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]。
[0106] 在第二个方面,本发明涉及具有与SEQ ID NO:2的第20至326位氨基酸、SEQ ID NO:4的第18至240位氨基酸、SEQ ID NO:6的第20至258位氨基酸、SEQ ID NO:8的第19至226位氨基酸、或SEQ ID NO:10的第20至304位氨基酸(即,成熟多肽)的同一性程度为至少75%、优选至少80%、更优选至少85%、更优选至少90%、最优选至少95%、以及最优选至少97%、98%、或99%的氨基酸序列,且具有纤维素分解增强活性的分离多肽(在下文中为″同源多肽″)。在优选的方面,该同源多肽具有与SEQ ID NO:2的第20至326位氨基酸、SEQ ID NO:4的第18至240位氨基酸、SEQ ID NO:6的第20至258位氨基酸、SEQ ID NO:8的第19至226位氨基酸、或SEQ ID NO:10的第20至304位氨基酸相差10个氨基酸,优选5个氨基酸,更优选4个氨基酸,更优选3个氨基酸,最优选2个氨基酸,以及最优选1个氨基酸的氨基酸序列。
[0107] 本发明的多肽优选包括SEQ ID NO:2或其等位变体的氨基酸序列;或具有纤维素分解增强活性的其片段。在优选的方面,多肽包括SEQ ID NO:2的氨基酸序列。在另一个优选的方面,多肽包括SEQ ID NO:2的第20至326位氨基酸或其等位变体;或具有纤维素分解增强活性的其片段。在另一个优选的方面,多肽包括SEQ ID NO:2的第20至326位氨基酸。在另一个优选的方面,多肽由SEQ ID NO:2的第20至326位氨基酸或其等 位变体的氨基酸序列;或具有纤维素分解增强活性的其片段组成。在另一个优选的方面,多肽由SEQ ID NO:2的氨基酸序列组成。在另一个优选的方面,多肽由SEQ ID NO:2的第20至326位氨基酸或其等位变体;或具有纤维素分解增强活性的其片段组成。在另一个优选的方面,多肽由SEQ ID NO:2的第20至326位氨基酸组成。
[0108] 本发明的多肽优选包括SEQ ID NO:4或其等位变体的氨基酸序列;或具有纤维素分解增强活性的其片段。在优选的方面,多肽包括SEQ ID NO:4的氨基酸序列。在另一个优选的方面,多肽包括SEQ ID NO:4的第18至240位氨基酸或其等位变体;或具有纤维素分解增强活性的其片段。在另一个优选的方面,多肽包括SEQ ID NO:4的第18至240位氨基酸。在另一个优选的方面,多肽由SEQ ID NO:4或其等位变体的氨基酸序列;或具有纤维素分解增强活性的其片段组成。在另一个优选的方面,多肽由SEQ ID NO:4的氨基酸序列组成。在另一个优选的方面,多肽由SEQ ID NO:4的第18至240位氨基酸或其等位变体;或具有纤维素分解增强活性的其片段组成。在另一个优选的方面,多肽由SEQ ID NO:4的第18至240位氨基酸组成。
[0109] 本发明的多肽优选包括SEQ ID NO:6或其等位变体的氨基酸序列;或具有纤维素分解增强活性的其片段。在优选的方面,多肽包括SEQ ID NO:6的氨基酸序列。在另一个优选的方面,多肽包括SEQ ID NO:6的第20至258位氨基酸或其等位变体;或具有纤维素分解增强活性的其片段。在另一个优选的方面,多肽包括SEQ ID NO:6的第20至258位氨基酸。在另一个优选的方面,多肽由SEQ ID NO:6或其等位变体的氨基酸序列;或具有纤维素分解增强活性的其片段组成。在另一个优选的方面,多肽由SEQ ID NO:6的氨基酸序列组成。在另一个优选的方面,多肽由SEQ ID NO:6的第20至258位氨基酸或其等位变体;或具有纤维素分解增强活性的其片段组成。在另一个优选的方面,多肽由SEQ ID NO:6的第20至258位氨基酸组成。
[0110] 本发明的多肽优选包括SEQ ID NO:8或其等位变体的氨基酸序列;或具有纤维素分解增强活性的其片段。在优选的方面,多肽包括SEQ ID NO:8的氨基酸序列。在另一个优选的方面,多肽包括SEQ ID NO:8的第19至226位氨基酸或其等位变体;或具有纤维素分解增强活性的其片段。在另一个优选的方面,多肽包括SEQ ID NO:8的第19至226位氨基酸。在另一个优选的方面,多肽由SEQ ID NO:8或其等位变体的氨基酸序列;或具有纤维素分解增强活性的其片段组成。在另一个优选的方面,多肽由SEQ ID NO:8的氨基酸 序列组成。在另一个优选的方面,多肽由SEQ ID NO:8的第19至226位氨基酸或其等位变体;或具有纤维素分解增强活性的其片段组成。在另一个优选的方面,多肽由SEQ ID NO:8的第19至226位氨基酸组成。
[0111] 本发明的多肽优选包括SEQ ID NO:10或其等位变体的氨基酸序列;或具有纤维素分解增强活性的其片段。在优选的方面,多肽包括SEQ ID NO:10的氨基酸序列。在另一个优选的方面,多肽包括SEQ ID NO:10的第20至304位氨基酸或其等位变体;或具有纤维素分解增强活性的其片段。在另一个优选的方面,多肽包括SEQ ID NO:10的第20至304位氨基酸。在另一个优选的方面,多肽由SEQ ID NO:10或其等位变体的氨基酸序列;或具有纤维素分解增强活性的其片段组成。在另一个优选的方面,多肽由SEQ ID NO:10的氨基酸序列组成。在另一个优选的方面,多肽由SEQ ID NO:10的第20至304位氨基酸或其等位变体;或具有纤维素分解增强活性的其片段组成。在另一个优选的方面,多肽由SEQ ID NO:10的第20至304位氨基酸组成。
[0112] 在第三个方面,本发明涉及由至少在极低严谨条件,优选低严谨条件,更优选中等严谨条件,更优选中等-高严谨条件,更优选高严谨条件,以及最优选极高严谨条件下,与(i)SEQ ID NO:1的第388至1332位核苷酸、SEQ ID NO:3的第98至821位核苷酸、SEQ ID NO:5的第126至978位核苷酸、SEQ ID NO:7的第55至678位核苷酸、SEQ ID NO:9的第58至912位核苷酸,(ii)包含于SEQ ID NO:1的第388至1332位核苷酸、SEQ ID NO:3的第98至821位核苷酸、或SEQ ID NO:5的第126至978位核苷酸中的cDNA序列、或包括SEQ ID NO:7的第55至678位核苷酸或SEQ ID NO:9的第58至912位核苷酸的基因组DNA序列,(iii)(i)或(ii)的亚序列,或(iv)(i)、(ii),或(iii)的互补链杂交的多核苷酸编码的、具有纤维素分解增强活性的分离多肽(J.Sambrook,E.F.Fritsch,and T.Maniatus,
1989,Molecular Cloning,A Laboratory Manual,2d edition,Cold Spring Harbor,New York)。SEQ ID NO:1、3、5、7、或9的亚序列包含至少100个连续的核苷酸或优选至少200个连续核苷酸。此外,该亚序列可编码具有纤维素分解增强活性的多肽片段。
[0113] SEQ ID NO:1、3、5、7、或9的核苷酸序列;或其亚序列;以及SEQ ID NO:2、4、6、8、或10的氨基酸序列;或其片段,可用于设计核酸探针来根据本领域众所周知的方法从不同种属的菌株鉴定和克隆编码具有 纤维素分解增强活性的多肽的DNA。特别地,这种探针可用于按照标准的Southern印迹方法与感兴趣种属的基因组或cDNA杂交,以鉴定和分离其相应的基因。这种探针比起全部的序列来可以是相当短的,但长度应该是至少14个、优选至少25个、更优选至少35个、以及最优选至少70个核苷酸。然而优选该核酸探针是至少100个核苷酸长度。例如,该核酸探针可以是至少200个核苷酸、优选至少300个核苷酸、更优选至少400个核苷酸、或最优选至少500个核苷酸长度。可使用更长的探针,例如,至少600个核苷酸、优选至少700个核苷酸、更优选至少800个核苷酸、或最优选至少900个核苷酸长度的核酸探针。DNA和RNA探针都可使用。生物素、或抗生物素蛋白)。这种探针被包括在本发明内。
[0114] 因此从这种其他生物体制备的基因组DNA或cDNA文库可用于筛选与上述探针杂交且编码具有纤维素分解增强活性的多肽的DNA。可通过琼脂糖或聚丙烯酰胺凝胶电泳,或其他分离技术来分离来自这种其他生物体的基因组或其他DNA。来自文库的DNA或分离的DNA可被转移至和固定至硝化纤维或其他的合适载体材料上。为了鉴定与SEQ ID NO:1、3、5、7、或9或其亚序列同源的克隆或DNA,该载体材料被用于Southern印迹。
[0115] 为了本发明的目的,杂交表明该核苷酸序列与相应于SEQ ID NO:1、3、5、7、或9所示的核苷酸序列、包含于SEQ ID NO:1、3、或5的cDNA序列、或包括SEQ ID NO:7或9的基因组序列、其互补链、或其亚序列的标记核酸探针在极低至极高的严谨条件下杂交。可利用X射线胶片检测在这些条件下与该核酸探针杂交的分子。
[0116] 在优选的实施方案中,该核酸探针是编码SEQ ID NO:2、或其亚序列的多肽的核酸序列。在另一个优选的实施方案中,该核酸探针是SEQ ID NO:1。在另一个优选的实施方案中,该核酸探针是SEQ ID NO:1的成熟多肽编码区。在另一个优选的实施方案中,该核酸探针是在包含于大肠杆菌NRRL B-30699的质粒pEJG120中的核酸序列,其中该核酸序列编码具有纤维素分解增强活性的多肽。在另一个优选的实施方案中,该核酸探针是在包含于大肠杆菌NRRL B-30699的质粒pEJG120中的成熟多肽编码区。
[0117] 在另一个优选的实施方案中,该核酸探针是编码SEQ ID NO:4、或其亚序列的多肽的核酸序列。在另一个优选的实施方案中,该核酸探针是SEQ ID NO:3。在另一个优选的实施方案中,该核酸探针是SEQ ID NO:3的成熟多肽编码区。在另一个优选的实施方案中,该核酸探针是在包含于大肠杆菌 NRRL B-30813的质粒pTter61C中的核酸序列,其中该核酸序列编码具有纤维素分解增强活性的多肽。在另一个优选的实施方案中,该核酸探针是在包含于大肠杆菌NRRL B-30813的质粒pTter61C中的成熟多肽编码区。
[0118] 在另一个优选的实施方案中,该核酸探针是编码SEQ ID NO:6、或其亚序列的多肽的核酸序列。在另一个优选的实施方案中,该核酸探针是SEQ ID NO:5。在另一个优选的实施方案中,该核酸探针是SEQ ID NO:5的成熟多肽编码区。在另一个优选的实施方案中,该核酸探针是在包含于大肠杆菌NRRL B-30812的质粒pTter61D中的核酸序列,其中该核酸序列编码具有纤维素分解增强活性的多肽。在另一个优选的实施方案中,该核酸探针是在包含于大肠杆菌NRRL B-30812的质粒pTter61D中的成熟多肽编码区。
[0119] 在另一个优选的实施方案中,该核酸探针是编码SEQ ID NO:8、或其亚序列的多肽的核酸序列。在另一个优选的实施方案中,该核酸探针是SEQ ID NO:7。在另一个优选的实施方案中,该核酸探针是SEQ ID NO:7的成熟多肽编码区。在另一个优选的实施方案中,该核酸探针是在包含于大肠杆菌NRRL B-30814的质粒pTter61E中的核酸序列,其中该核酸序列编码具有纤维素分解增强活性的多肽。在另一个优选的实施方案中,该核酸探针是在包含于大肠杆菌NRRL B-30814的质粒pTter61E中的成熟多肽编码区。
[0120] 在另一个优选的实施方案中,该核酸探针是编码SEQ ID NO:10、或其亚序列的多肽的核酸序列。在另一个优选的实施方案中,该核酸探针是SEQ ID NO:9。在另一个优选的实施方案中,该核酸探针是SEQ ID NO:9的成熟多肽编码区。在另一个优选的实施方案中,该核酸探针是在包含于大肠杆菌NRRL B-30811的质粒pTter61G中的核酸序列,其中该核酸序列编码具有纤维素分解增强活性的多肽。在另一个优选的实施方案中,该核酸探针是在包含于大肠杆菌NRRL B-30811的质粒pTter61G中的成熟多肽编码区。
[0121] 对于至少100个核苷酸长度的长探针,极低至极高的严谨条件定义为在42℃,在5X SSPE,0.3% SDS,200μg/ml剪切和变性的鲑精DNA中,以及对于极低和低严谨为25%甲酰胺,对于中等和中等-高严谨为35%甲酰胺或对于高和极高严谨为50%甲酰胺,按照标准的Southern印迹方法最佳地预杂交和杂交12至24小时。
[0122] 对于至少100个核苷酸长度的长探针,利用2X SSC,0.2% SDS,优选至少在45℃(极低严谨),更优选在至少50℃(低严谨),更优选在至少55℃(中等严谨),更优选在至少60℃(中等-高严谨),更优选在至少65℃(高严 谨),以及最优选在至少70℃(极高严谨)最终洗涤载体材料3次,每次15分钟。
[0123] 对于大约15个核苷酸至大约70个核苷酸长度的短探针,严谨条件定义为在低于利用Bolton和McCarthy所述的计算法(1962,Proceedings of the National Academy of Sciences USA 48:1390)计算的Tm大约5℃至大约10℃,在0.9M NaCl,0.09M Tris-HCl pH7.6,6mM EDTA,0.5% NP-40,1X Denhardt′s溶液,1mM焦磷酸钠,1mM一元磷酸钠(sodium monobasic phosphate),0.1mM ATP,和每ml 0.2mg的酵母RNA,按照标准的Southern印迹方法最佳地预杂交、杂交、和杂交后洗涤12至24小时。
[0124] 对于大约15个核苷酸至大约70个核苷酸长度的短探针,在低于计算的Tm5℃至10℃,在6X SCC加0.1% SDS中洗涤载体材料15分钟一次,以及利用6X SSC洗涤2次,每次15分钟。
[0125] 在第四个方面,本发明包括SEQ ID NO:2或其同源序列;或其成熟多肽中保守取代、缺失、和/或插入一个或多个氨基酸的人工变体。优选地,氨基酸变化具有不重要(minor)的特性,其是不显著影响蛋白质的折叠和/或活性的保守的氨基酸取代或插入;一般为一个至大约30个氨基酸的小的缺失;氨基或羧基末端的小的延伸,例如氨基末端的甲硫氨酸残基;达到大约20-25个残基的小的接头肽;或通过改变净电荷或另一个功能,例如多组氨酸段、抗原表位或结合结构域而促进纯化的小的延伸。
[0126] 保守取代的实例在碱性氨基酸(精氨酸、赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水氨基酸(亮氨酸、异亮氨酸和缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸和酪氨酸)、和小的氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)组的范围之内。一般不改变特异活性的氨基酸取代是本领域已知的,并且在例如H.Neurath and R.L.Hill,1979,In,The Proteins,Academic Press,New York中有描述。最通常发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu、和Asp/Gly。
[0127] 除20种标准氨基酸之外,非标准氨基酸(例如4-羟脯氨酸、6-N-甲基赖氨酸、2-氨基异丁酸、异缬氨酸、和α-甲基丝氨酸)可被野生型多肽的氨基酸残基替代。有限数目的非保守的氨基酸、不由遗传密码编码的氨基酸、和非天然的氨基酸可被氨基酸残基替代。蛋白质合成后“非天然的氨基 酸”已经被改变,和/或在其侧链中具有不同于标准氨基酸的化学结构。可化学合成非天然的氨基酸,并且优选地,可商业购买非天然的氨基酸,并且包括哌啶酸(pipecolic acid)、四氢噻唑羧酸、脱氢脯氨酸、3-和4-甲基脯氨酸、和3,
3-二甲基脯氨酸。
[0128] 备选地,该氨基酸变化具有的这种特性是该多肽的理化性质被改变。例如,氨基酸变化可改善该多肽的热稳定性,改变底物特异性、变化最适的pH等。
[0129] 可根据本领域已知的方法,例如定点诱变或丙氨酸-扫描诱变来鉴定亲本多肽中的必需氨基酸(Cunningham and Wells,1989,Science 244:1081-1085)。在后者的技术中,在分子中的每个残基导入单丙氨酸突变,并且测试所得到的突变分子的生物活性(即,分解纤维的增强活性)来鉴定决定该分子活性的氨基酸残基。也参见,Hilton et al.,1996,J.Biol.Chem.271:4699-4708。也可通过结构的物理分析来确定酶的活性位点或其他的生物学相互作用,例如通过核磁共振、晶体学、电子衍射、或光亲合标记、结合推定的接触位点氨基酸突变这些技术来加以确定。参见例如,de Vos et al.,1992,Science 255:306-312;Smith et al.,1992,J.Mol.Biol.224:899-904;Wlodaver et al.,1992,FEBS Lett.309:
59-64。也可从与本发明所述多肽相关的多肽的同一性分析推测必需氨基酸的同一性。
[0130] 可利用诱变、重组、和/或改组,然后是相关筛选步骤的已知方法产生和测试单个或多个氨基酸取代,所述方法例如在Reidhaar-Olson and Sauer,1988,Science 241:53-57;Bowie and Sauer,1989,Proc.Natl.Acad.Sci.USA 86:2152-2156;WO 95/17413;
或WO 95/22625中有公开。可使用的其他方法包括易错PCR,噬菌体显示(display)(例如,Lowman et al.,1991,Biochem.30:10832-10837;美国专利号5,223,409;WO 92/06204),和定区域诱变(Derbyshire et al.,1986,Gene 46:145;Ner et al.,1988,DNA 7:127)。
[0131] 诱变/改组方法可与高通量、自动筛选方法组合以检测由宿主细胞表达的克隆、诱变处理多肽的活性(Ness et al.,1999,Nature Biotechnology 17:893-896)。编码活性多肽的诱变处理的DNA分子可从宿主细胞回收并利用本领域的标准方法快速测序。这些方法提供感兴趣多肽中单独氨基酸残基重要性的快速测定,并且可被用于未知结构的多肽。
[0132] SEQ ID NO:2的第20至326位氨基酸、SEQ ID NO:4的第18至240位氨基酸、SEQ ID NO:6的第20至258位氨基酸、SEQ ID NO:8的第19 至226位氨基酸、或SEQ ID NO:10的第20至304位氨基酸的氨基酸取代、缺失和/或插入的总数是10个、优选9个、更优选8个、更优选7个、更优选最多6个、更优选5个、更优选4个、更优选3个、更优选2个、以及最优选1个。
[0133] 具有纤维素分解增强活性的多肽的来源
[0134] 本发明的多肽可从任何属的微生物获得。为了本发明的目的,术语“获得自”如在此使用的与给定来源结合,是指由核苷酸序列编码的多肽是通过该来源或通过其中已经插入了来自该来源的核苷酸序列的菌株而生产的。在优选的方面,获得自给定来源的多肽是细胞外分泌的。
[0135] 本发明的多肽可以是细菌多肽。例如,该多肽可以是革兰氏阳性细菌多肽,例如杆菌多肽,例如,嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状杆菌(Bacillus circulans)、凝结芽孢杆菌(Bacillus coagulans)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacillus licheniformis)、巨大芽孢杆菌(Bacillus megaterium)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)、或苏金杆菌(Bacillus thuringiensis)多肽;或链霉菌属(Streptomyces)多肽,例如,浅青紫链霉菌(Streptomyces lividans)或鼠灰链霉菌(Streptomyces murinus)多肽;或革兰氏阴性细菌多肽,例如,大肠杆菌(E.coli)或假单胞菌(Pseudomonas)种属多肽。
[0136] 本发明的多肽也可以是真菌多肽,且更优选地是酵母多肽例如,假丝酵母属(Candida)、克鲁维氏酵母属(Kluyveromyces)、毕赤氏酵母属(Pichia)、糖酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、或耶氏酵母(Yarrowia)多肽;或更优选丝状真菌多肽,例如支顶孢属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、隐球酵母属(Cryptococcus)、Filibasidium、镰 刀菌属(Fusarium)、腐殖菌属(Humicola)、稻瘟霉属(Magnaporthe)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、瘤胃真菌(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、瘤胃真菌(Piromyces)、裂褶菌属(Schizophyllum)、踝节菌属(Talaromyces)、热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉(Tolypocladium)、或木霉属(Trichoderma)多肽。
[0137] 在优选的方面,该多肽是卡尔酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉斯糖酵母(Saccharomyces douglasii)、克鲁弗糖酵母(Saccharomyces kluyveri)、诺地糖酵母(Saccharomyces norbensis)、或卵形糖酵母(Saccharomyces oviformis)的具有纤维素分解增强活性的多肽。
[0138] 在另一个优选的方面,该多肽是棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、烟曲霉(Aspergillus fumigatus)、臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)、灰盖鬼伞(Coprinus cinereus)、Diplodia gossyppina、杆孢状镰孢(Fusarium bactridioides)、Fusarium cerealis、Fusarium crookwellense、大刀镰孢(Fusarium culmorum)、禾谷镰孢(Fusarium graminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖孢镰孢(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、Fusarium torulosum、Fusarium trichothecioides、Fusarium venenatum、Humicola insolens、Humicola lanuginosa、Magnaporthe grisea、米赫毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthora thermophila)、粗糙链孢霉(Neurospora crassa)、产紫青霉(Penicillium purpurogenum)、Phanerochaete chrysosporium、淡黑假黑盘菌(Pseudoplectania nigrella)、Thermoascus aurantiacus、哈茨木霉(Trichoderma harzianum)、康氏木霉(Trichoderma koningii)、Trichoderma longibrachiatum、里氏木霉(Trichoderma reesei)、绿色木霉(Trichoderma viride)、或Trichophaea saccata多肽。
[0139] 在更优选的方面,该多肽是Thielavia terrestris多肽。在最优选的实施方案中,该多肽是Thielavia terrestris NRRL 8126多肽,例如具有SEQ ID NO:2、4、6、8、或10的氨基酸序列的多肽,或其片段,例如成熟蛋白质。
[0140] 可理解对于上述的种属,本发明包括完全的和不完全的状态,和其它分类学的同等物,例如,无性型,不管其已知的种属名称。本领域的技术人员可容易地识别适当同等物的同一性。
[0141] 这些种属的菌株以其菌种保藏号对于公众来说是易得到的,例如美国典型培养物保藏中心(ATCC)、德国微生物保藏中心(DSM)、真菌菌种保藏中心(CBS)、和农业研究机构培养物保藏中心(NRRL)。
[0142] 此外,这种多肽可从其他来源被鉴定和获得,包括利用上述探针从自然界(例如,土壤、堆肥、水等)分离的微生物。用于从天然生境分离微生物的技术是本领域已知的。可通过类似地筛选这种微生物的基因组或cDNA文库获得该多核苷酸。一旦已经用探针检测到编码多肽的多核苷酸序列,可利用本领域普通技术人员公知的技术分离或克隆该多核苷酸(参见例如,Sambrook et al.,1989,同上).
[0143] 本发明的多肽也包括融合的多肽或可切割的融合多肽,其中另一个多肽融合在该多肽或其片段的N-末端或C-末端。通过将编码另一个多肽的核苷酸序列(或其部分)融合至本发明的核苷酸序列(或其部分)来生产融合的多肽。用于生产融合多肽的技术是本领域已知的,包括连接编码该多肽的编码序列以使得其处于框内并且使该融合多肽的表达处于相同启动子和终止子的调控之下。
[0144] 多核苷酸
[0145] 本发明也涉及具有编码本发明多肽的核苷酸序列的分离多核苷酸。
[0146] 在优选的方面,该核苷酸序列如SEQ ID NO:1所示。在另一个更优选的方面,该核苷酸序列是在包含于大肠杆菌NRRL B-30699的质粒pEJG120中的序列。在另一个优选的方面,该核苷酸序列是SEQ ID NO:1的成熟多肽编码区。在另一个更优选的方面,该核苷酸序列是在包含于大肠杆菌NRRL B-30699的质粒pEJG120中的成熟多肽编码区。本发明也包括编码具有SEQ ID NO:2的氨基酸序列的多肽或由于遗传密码简并性而不同于SEQ ID NO:1的其成熟多肽的核苷酸序列。本发明也涉及编码具有纤维素分解增强活性的SEQ ID NO:2片段的SEQ ID NO:1的亚序列。
[0147] 在另一个优选的方面,该核苷酸序列如SEQ ID NO:3所示。在另一个更优选的方面,该核苷酸序列是在包含于大肠杆菌NRRL B-30813的质粒pTter61C中的序列。在另一个优选的方面,该核苷酸序列是SEQ ID NO:3的成熟多肽编码区。在另一个更优选的方面,该核苷酸序列是在包含于大肠杆菌NRRL B-30813的质粒pTter61C中的成熟多肽编码区。本发明也包括编码具有SEQ ID NO:4的氨基酸序列的多肽或由于遗传密码简并性而不 同于SEQ ID NO:3的其成熟多肽的核苷酸序列。本发明也涉及编码具有纤维素分解增强活性的SEQ ID NO:4片段的SEQ ID NO:3的亚序列。
[0148] 在另一个优选的方面,该核苷酸序列如SEQ ID NO:5所示。在另一个更优选的方面,该核苷酸序列是在包含于大肠杆菌NRRL B-30812的质粒pTter61D中的序列。在另一个优选的方面,该核苷酸序列是SEQ ID NO:5的成熟多肽编码区。在另一个更优选的方面,该核苷酸序列是在包含于大肠杆菌NRRL B-30812的质粒pTter61D中的成熟多肽编码区。本发明也包括编码具有SEQ ID NO:6的氨基酸序列的多肽或由于遗传密码简并性而不同于SEQ ID NO:5的其成熟多肽的核苷酸序列。本发明也涉及编码具有纤维素分解增强活性的SEQ ID NO:6片段的SEQ ID NO:5的亚序列。
[0149] 在另一个优选的方面,该核苷酸序列如SEQ ID NO:7所示。在另一个更优选的方面,该核苷酸序列是在包含于大肠杆菌NRRL B-30814的质粒pTter61B中的序列。在另一个优选的方面,该核苷酸序列是SEQ ID NO:7的成熟多肽编码区。在另一个更优选的方面,该核苷酸序列是在包含于大肠杆菌NRRL B-30814的质粒pTter61E中的成熟多肽编码区。本发明也包括编码具有SEQ ID NO:8的氨基酸序列的多肽或由于遗传密码简并性而不同于SEQ ID NO:7的其成熟多肽的核苷酸序列。本发明也涉及编码具有纤维素分解增强活性的SEQ ID NO:8片段的SEQ ID NO:7的亚序列。
[0150] 在另一个优选的方面,该核苷酸序列如SEQ ID NO:9所示。在另一个更优选的方面,该核苷酸序列是在包含于大肠杆菌NRRL B-30811的质粒pTter61G中的序列。在另一个优选的方面,该核苷酸序列是SEQ ID NO:9的成熟多肽编码区。在另一个更优选的方面,该核苷酸序列是在包含于大肠杆菌NRRL B-30811的质粒pTter61G中的成熟多肽编码区。本发明也包括编码具有SEQ ID NO:10的氨基酸序列的多肽或由于遗传密码简并性而不同于SEQ ID NO:9的其成熟多肽的核苷酸序列。本发明也涉及编码具有纤维素分解增强活性的SEQ ID NO:10片段的SEQ ID NO:9的亚序列。
[0151] 本发明也涉及在SEQ ID NO:1、3、5、7、或9的成熟多肽编码序列中具有至少一个突变的突变多核苷酸,其中该突变的核苷酸序列分别编码由SEQ ID NO:2的第20至326位氨基酸、SEQ ID NO:4的第18至240位氨基酸、SEQ ID NO:6的第20至258位氨基酸、SEQ ID NO:8的第19至226位氨基酸、或SEQ ID NO:10的第20至304位氨基酸组成的多肽。
[0152] 用于分离或克隆编码多肽的多核苷酸的技术是本领域已知的,包括来自基因组DNA的分离物、来自cDNA的制品、或其组合。从这种基因组DNA克隆本发明的多核苷酸可受到例如,利用众所周知的聚合酶链式反应(PCR)或表达文库的抗体筛选来检测具有共用结构特征的克隆DNA片段的影响。参见例如,Innis et al.,1990,PCR:A Guide to Methods and Application,Academic Press,New York。可使用其他的核酸扩增方法,例如连接酶链式反应(LCR)、连接活化转录(LAT)和基于核苷酸序列的扩增(NASBA)。该多核苷酸可克隆自Thielavia的菌株、或另一种或相关的生物体,因此例如可以是核苷酸序列的多肽编码区的等位或种属变体。
[0153] 本发明也涉及具有与SEQ ID NO:1(即,第388至1332位核苷酸)的成熟多肽编码序列有至少75%、优选至少80%、更优选至少85%、更优选至少90%、最优选至少95%、以及最优选至少97%同一性程度,且编码活化多肽的核苷酸序列的多核苷酸。
[0154] 本发明也涉及具有与SEQ ID NO:3(即,第98至821位核苷酸)的成熟多肽编码序列有至少75%、优选至少80%、更优选至少85%、更优选至少90%、最优选至少95%、以及最优选至少97%同一性程度,且编码活化多肽的核苷酸序列的多核苷酸。
[0155] 本发明也涉及具有与SEQ ID NO:5(即,第126至978位核苷酸)的成熟多肽编码序列有至少75%、优选至少80%、更优选至少85%、更优选至少90%、最优选至少95%、以及最优选至少97%同一性程度,且编码活化多肽的核苷酸序列的多核苷酸。
[0156] 本发明也涉及具有与SEQ ID NO:7(即,第55至678位核苷酸)的成熟多肽编码序列有至少75%、优选至少80%、更优选至少85%、更优选至少90%、最优选至少95%、以及最优选至少97%同一性程度,且编码活化多肽的核苷酸序列的多核苷酸。
[0157] 本发明也涉及具有与SEQ ID NO:9(即,第58至912位核苷酸)的成熟多肽编码序列有至少95%、优选至少80%、更优选至少85%、更优选至少90%、最优选至少95%、以及最优选至少97%同一性程度,且编码活化多肽的核苷酸序列的多核苷酸。
[0158] 编码本发明多肽的核苷酸序列的修饰可能是为合成基本上类似于该多肽的多肽所必需的。术语“基本上类似”于该多肽是指非天然存在形式的多肽。这些多肽可能在一些工程化方式方面不同于分离自其天然来源的多肽, 例如在特异活性、热稳定性、最适pH等方面不同的人工变体。可根据如SEQ ID NO:1、3、5、7、或9的多肽编码区所示的核苷酸序列,例如其亚序列,和/或通过导入不会产生另一种由该核苷酸序列编码的氨基酸序列多肽,但相应于设计用于酶生产的宿主生物体的密码子利用率的核苷酸取代,或通过导入可能产生不同氨基酸序列的核苷酸取代来构建该变体序列。对于核苷酸取代的概述,参见例如,Ford et al.,1991,Protein Expression and Purification 2:95-107。
[0159] 对本领域技术人员显而易见的是可在决定分子功能且仍然产生活化多肽的区域外侧产生这种取代。对由本发明的分离多核苷酸编码的多肽的活性重要、且因此优选不被取代的氨基酸残基可根据本领域已知的方法加以鉴定,例如定点诱变或丙氨酸-扫描诱变(参见例如,Cunningham and Wells,1989,Science 244:1081-1085)。在后者的技术中,在分子中的每个带阳电的残基导入突变,并且测试所得到的突变分子的纤维素分解增强活性来鉴定决定该分子活性的氨基酸残基。底物酶相互作用的位点还可通过三维结构分析确定,例如通过核磁共振分析、晶体学或光亲合标记的这种技术进行测定(参见例如,de Vos et al.,1992,Science 255:306-312;Smith et al.,1992,Journal of Molecular Biology224:899-904;Wlodaver et al.,1992,FEBS Letters 309:59-64)。
[0160] 本发明也涉及编码本发明多肽的分离多核苷酸,如在此所定义的,其至少在极低严谨条件,优选低严谨条件,更优选中等严谨条件,更优选中等-高严谨条件,更优选高严谨条件,以及最优选极高严谨条件下,与(i)SEQ ID NO:1的第388至1332位核苷酸、SEQ ID NO:3的第98至821位核苷酸、SEQ ID NO:5的第126至978位核苷酸、SEQ ID NO:7的第55至678位核苷酸、或SEQ ID NO:9的第58至912位核苷酸,(ii)包含于SEQ ID NO:1的第388至1332位核苷酸、SEQ ID NO:3的第98至821位核苷酸、或SEQ ID NO:5的第
126至978位核苷酸中的cDNA序列、或包括SEQ ID NO:7的第55至678位核苷酸或SEQ ID NO:9的第58至912位核苷酸的基因组DNA序列,(iii)(i)或(ii)的互补链;或其等位变体和亚序列(Sambrook et al.,1989,同上)。
[0161] 本发明也涉及分离的多核苷酸,其通过(a)在极低、低、中等、中等-高、高、或极高的严谨条件下,使DNA群与(i)SEQ ID NO:1的第388至1332位核苷酸、SEQ ID NO:3的第98至821位核苷酸、SEQ ID NO:5 的第126至978位核苷酸、SEQ ID NO:7的第55至678位核苷酸、或SEQ ID NO:9的第58至912位核苷酸,(ii)包含于SEQ ID NO:1的第388至
1332位核苷酸、SEQ ID NO:3的第98至82l位核苷酸、或SEQ ID NO:5的第126至978位核苷酸中的cDNA序列、或包括SEQ ID NO:7的第55至678位核苷酸或SEQ ID NO:9的第
58至912位核苷酸的基因组DNA序列,或(iii)(i)或(ii)的互补链杂交;以及(b)分离该编码具有纤维素分解增强活性的多肽的杂交多核苷酸来获得。
[0162] 核酸构建体:
[0163] 本发明也涉及包括本发明分离多核苷酸的核酸构建体,其中该分离多核苷酸可操作地连接指导该编码序列在合适的宿主细胞中,在与该调控序列相兼容的条件下表达的一种或多种调控序列。
[0164] 编码本发明多肽的分离多核苷酸可以保证该多肽表达的各种方式被操作。在其插入载体之前该多核苷酸序列的操作可能根据表达载体是合乎需要或必需的。利用重组DNA方法改变多核苷酸序列的技术是本领域已知的。
[0165] 该调控序列可以是合适的启动子序列,由用于表达编码本发明多肽的多核苷酸的宿主细胞识别的核苷酸序列。该启动子序列包含介导该多肽表达的转录调控序列。启动子可以是在所选择的宿主细胞中显示转录活性的任何核苷酸序列,包括突变的、截短的、和杂交的(hybrid)启动子,并且可从编码与该宿主细胞同源或异源的细胞外或胞内多肽的基因获得。
[0166] 用于指导本发明的核酸构建体转录,特别是在细菌宿主细胞中转录的合适启动子的实例是从大肠杆菌乳糖操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂水解酶基因(dagA)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌生麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因、和原核的β-内酰胺酶基因获得的启动子(Villa-Kamaroff et al.,1978,Proceedings of the National Academy of Sciences USA 75:3727-3731),以及tac启动子(DeBoer et al.,1983,Proceedings of the National Academy of Sciences USA 80:21-25)。进一步的启动子在″Useful proteins from recombinant bacteria″in Scientific American,1980,
242:74-94;和Sambrook et al.,1989,supra中有描述。
[0167] 用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从米曲霉TAKA淀粉酶、米黑根毛霉天冬氨酸蛋白酶、黑曲霉 中性α-淀粉酶、黑曲霉酸稳定的α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米黑根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉乙酰胺酶、Fusarium venenatum淀粉葡萄糖苷酶(WO00/56900)、Fusarium venenatum Daria(WO00/56900)、Fusarium venenatum Quinn (WO00/56900)、尖孢镰孢胰蛋白酶样蛋白酶(WO96/00787)、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉葡聚糖内切酶I、里氏木霉葡聚糖内切酶II、里氏木霉葡聚糖内切酶III、里氏木霉葡聚糖内切酶IV、里氏木霉葡聚糖内切酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶的基因获得的启动子,以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶和米曲霉磷酸丙糖异构酶基因的启动子的杂合体);以及其突变的、截短的、和杂合的启动子。
[0168] 在酵母宿主中,有用的启动子是从酿酒酵母烯醇酶(ENO 1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母乙醇脱氢酶/甘油-3-磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母磷酸丙糖异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)、和酿酒酵母3-磷酸甘油酸激酶的基因获得的。用于酵母宿主细胞的其他有用的启动子在Romanos et al.,1992,Yeast 8:423-488中有描述。
[0169] 调控序列也可以是合适的转录终止子序列,由宿主细胞识别来终止转录的序列。终止子序列可操作地连接编码该多肽的核苷酸序列的3’末端。在所选择的宿主细胞中起作用的任何终止子都可用于本发明。
[0170] 优选用于丝状真菌宿主细胞的终止子是从米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸酯合酶、黑曲霉α-葡糖苷酶、和尖孢镰孢胰蛋白酶样蛋白酶的基因获得的。
[0171] 优选用于酵母宿主细胞的终止子是从酿酒酵母烯醇酶、酿酒酵母细胞色素C(CYC1)、和酿酒酵母甘油醛-3-磷酸脱氢酶的基因获得的。用于酵母宿主细胞的其他有用的终止子在Romanos et al.,1992,supra中有描述。
[0172] 调控序列也可以是合适的前导序列,对宿主细胞的翻译重要的mRNA的非翻译区域。前导序列可操作地连接编码该多肽的核苷酸序列的5’末端。在所选择的宿主细胞中起作用的任何前导序列都可用于本发明。
[0173] 用于丝状真菌宿主细胞的优选前导序列是从米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶的基因获得的。
[0174] 用于酵母宿主细胞的合适前导序列是从酿酒酵母烯醇酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子、和酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)的基因获得的。
[0175] 调控序列也可以是多腺苷酸化序列,可操作连接核苷酸序列3’末端的序列,当其转录时,被宿主细胞识别为向转录的mRNA添加多聚腺苷酸残基的信号。在所选择的宿主细胞中起作用的任何多腺苷酸化序列都可用于本发明。
[0176] 用于丝状真菌宿主细胞的优选多腺苷酸化序列是从米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸酯合酶、尖孢镰孢胰蛋白酶样蛋白酶、和黑曲霉α-葡糖苷酶的基因获得的。
[0177] 用于酵母宿主细胞的有用的多腺苷酸化序列在Guo and Sherman,1995,Molecular Cellular Biology 15:5983-5990中有描述。
[0178] 调控序列也可以是编码氨基酸序列的、与多肽氨基末端连接的信号肽编码区,并且指导该编码的多肽进入细胞分泌途径。核苷酸序列的编码序列的5’端可固有地包含与编码分泌多肽的编码区段天然连接在翻译阅读框中的信号肽编码区。备选地,编码序列的5’端可包含与编码序列异源的信号肽编码区。当该编码序列非天然包含信号肽编码区时,该外源的信号肽编码区可能是必需的。备选地,该外源的信号肽编码区可完全替换天然的信号肽编码区以增加该多肽的分泌。然而,指导该表达的多肽进入所选择的宿主细胞的分泌途径,即分泌进入培养基的任何信号肽编码区可用于本发明。
[0179] 用于细菌宿主细胞的有效的信号肽编码区是从芽胞杆菌NCIB 11837生麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)、和枯草芽孢杆菌prsA的基因获得的信号肽编码区。进一步的信号肽在Simonen and Palva,1993,Microbiological Reviews 57:109-137中有描述。
[0180] 用于丝状真菌宿主细胞的有效的信号肽编码区是从米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米黑根毛霉天冬氨酸蛋白酶、Humicola insolens纤维素酶、Humicola insolens葡聚糖内切酶V、和Humicola lanuginosa脂肪酶的基因获得的信号肽编码区。
[0181] 在优选的方面,信号肽编码区是编码SEQ ID NO:2的第1至19位氨基酸的SEQ ID NO:1的第330至387位核苷酸。
[0182] 在优选的方面,信号肽编码区是编码SEQ ID NO:4的第1至17位氨基酸的SEQ ID NO:3的第47至97位核苷酸。
[0183] 在优选的方面,信号肽编码区是编码SEQ ID NO:6的第1至19位氨基酸的SEQ ID NO:5的第69至125位核苷酸。
[0184] 在优选的方面,信号肽编码区是编码SEQ ID NO:8的第1至18位氨基酸的SEQ ID NO:7的第1至54位核苷酸。
[0185] 在优选的方面,信号肽编码区是编码SEQ ID NO:10的第1至19位氨基酸的SEQ ID NO:9的第1至57位核苷酸。
[0186] 用于酵母宿主细胞的有用的信号肽是从酿酒酵母α-因子和酿酒酵母转化酶的基因获得的。其他有用的信号肽编码区在Romanos et al.,1992,supra中有描述。
[0187] 调控序列也可以是编码位于多肽氨基末端的氨基酸序列的前肽编码区。所得到的多肽被称为原酶或前多肽(或有时候为酶原)。前多肽一般是非活性的并且可通过从前多肽催化或自催化切割为前肽而被转变为成熟活化的多肽。前肽编码区可从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α-因子、米黑根毛霉天冬氨酸蛋白酶、和嗜热毁丝霉漆酶(WO 95/33836)的基因获得。
[0188] 当信号肽和前肽区都存在于多肽的氨基末端时,前肽区的位置紧靠多肽的氨基末端,而信号肽区的位置紧靠前肽区的氨基末端。
[0189] 也可能需要添加容许调节该多肽相对于宿主细胞生长而表达的调节序列。调节系统的实例是响应于化学或物理刺激,包括调节化合物的存在而导致打开或关闭基因表达的调节系统。原核系统中的调节系统包括lac、tac、和trp操纵子系统。在酵母中,可使用ADH2系统或GAL1系统。在丝状真菌中,TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子、和米曲霉葡糖淀粉酶启动子可用作调节序列。调节序列的其他实例是容许基因扩增的调节序列。在真核系统中,这些包括在存在氨甲蝶呤时被扩增的二氢叶酸还原酶基因、和由于重金属被扩增的金属硫蛋白基因。在这些情况中,编码该多肽的核苷酸序列被可操作地连接该调节序列。
[0190] 表达载体
[0191] 本发明也涉及包括本发明多核苷酸、启动子、和转录和翻译终止信号的重组表达载体。在此描述的各种核酸和调控序列可被连接在一起以产生可包括容许编码该多肽的核苷酸序列在这些位点插入或取代的一个或多个适当的限制酶切位点的重组表达载体。备选地,本发明的核苷酸序列可通过将该核苷酸序列或包括该序列的核酸构建体插入用于表达的合适载体而被表达。为了产生该表达载体,编码序列位于载体中以使得该编码序列可操作地连接用于表达的合适的调控序列。
[0192] 该重组表达载体可以是能够方便地经受重组DNA方法并且能够导致该核苷酸序列表达的任何载体(例如,质粒或病毒)。载体的选择一般取决于载体与将被导入该载体的宿主细胞的相容性。载体可以是线性的或封闭环形质粒。
[0193] 载体可以是自主复制的载体,即作为染色体外实体存在的载体,其复制与染色体的复制无关,例如质粒,染色体外的元件、微型染色体、或人工染色体。载体可包含用于确保自我复制的任何方式。备选的,载体可以是当被导入宿主细胞时,整合到基因组中并与其已经整合的染色体一起复制的载体。此外,可使用单个载体或质粒或一起包含将被导入宿主细胞基因组的总DNA的两个或多个载体或质粒、或转座子。
[0194] 本发明的载体优选包含容许容易选择转化、转染、转导等细胞的一个或多个可选择的标记。可选择的标记是提供抗微生物或病毒抗性、对重金属的耐受性、原养型至营养缺陷型等的基因产物。
[0195] 细菌可选择标记的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因、或赋予抗生素抗性,例如氨苄青霉素、卡那霉素、氯霉素、或四环素抗性的标记。用于酵母宿主细胞的合适标记是ADE2、HIS3、LEU2、LYS2、MET3、TRP1、和URA3。用于丝状真菌宿主细胞的选择标记包括但不限于,amdS(乙酰胺酶)、argB(氨酸氨甲酰基转移酶)、bar(膦丝菌素乙酰基转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清苷-5’-磷酸酯(orotidine-5’-phosphate)脱羧酶)、sC(硫酸腺苷转移酶)、和trpC(邻氨基苯甲酸合酶),及其等同物。优选用于曲霉属细胞的是构巢曲霉或米曲霉的amdS和pyrG基因以及吸水链霉菌(Streptomyces hygroscopicus)的bar基因。
[0196] 本发明的载体优选包含容许该载体整合进入宿主细胞基因组或容许该载体在细胞中不依赖于基因组而自主复制的元件。
[0197] 为了整合进入宿主细胞基因组,该载体可依赖于编码多肽的多核苷酸序列或通过同源或非同源重组整合进入基因组的载体的任何其他元件。备选地,该载体可包含指导通过同源重组在染色体的准确位置整合进入宿主细胞基因组的附加核苷酸序列。为了增加在准确位置整合的可能性,该整合元件应优选包含足够数目的核酸,例如100至10,000个碱基对,优选400至10,000个碱基对,以及最优选800至10,000个碱基对,其与相应的靶序列具有高度的同一性以增强同源重组的可能性。该整合元件可以是与宿主细胞基因组中的靶序列同源的任何序列。此外,整合元件可以是非编码或编码的核苷酸序列。另一方面,载体可通过非同源重组被整合到宿主细胞的基因组中。
[0198] 为了自主复制,载体可进一步包括能够使该载体在所述的宿主细胞中自主复制的复制原点。复制原点可以是在细胞中有功能的调节自主复制的任何质粒复制子。术语“复制原点”或“质粒复制子”在此定义为能够使质粒或载体体内复制的核苷酸序列。
[0199] 细菌复制原点的实例是容许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177、和pACYC184,以及容许在芽孢杆菌中复制的pUB110、pE194、pTA1060、和pAMβ1的复制原点。
[0200] 用于酵母宿主细胞的复制原点的实例是2个微粒复制原点,ARS1、ARS4,ARS1和CEN3的组合,以及ARS4和CEN6的组合。
[0201] 用于丝状真菌细胞的复制原点的实例是AMA1和ANS1(Gems et al.,1991,Gene98:61-67;Cullen et al.,1987,Nucleic Acids Research 15:9163-9175;WO 00/24883)。
AMA1基因的分离和包括该基因的质粒或载体的构建可根据WO 00/24883中公开的方法来实现。
[0202] 多于一个拷贝的本发明多核苷酸可被插入宿主细胞以增加基因产物的生产。多核苷酸拷贝数的增加可通过将至少一个附加拷贝的序列整合进入宿主细胞基因组或通过伴随该多核苷酸包括可扩增的选择标记基因来获得,其中可通过在存在合适的选择试剂时培养该细胞来选择包含扩增拷贝的选择标记基因和附加拷贝的多核苷酸的细胞。
[0203] 用于连接上述元件以构建本发明的重组表达载体的方法对本领域的技术人员来说是众所周知的(参见例如,Sambrook et al.,1989,同上)。
[0204] 宿主细胞
[0205] 本发明也涉及包括本发明多核苷酸的重组宿主细胞,其可被有利地用于多肽的重组生产。包括本发明多核苷酸的载体被导入宿主细胞以使得该载体保持为如早先所描述的染色体整合物或自我复制的染色体外的载体。术语″宿主细胞″包括由于在复制期间发生突变而不同于亲本细胞的亲本细胞的任何子代。宿主细胞的选择在很大程度上取决于编码该多肽的基因及其来源。
[0206] 宿主细胞可以是单细胞微生物,例如原核生物,或非单细胞微生物,例如真核生物。
[0207] 有用的单细胞微生物是细菌细胞,例如革兰氏阳性细菌,包括但不限于芽胞杆菌属细胞,例如,嗜碱芽胞杆菌、解淀粉芽胞杆菌、短芽孢杆菌、环状杆菌、Bacillus clausii、凝结芽孢杆菌、灿烂芽胞杆菌、迟缓芽胞杆菌、地衣芽孢杆菌、巨大芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、和苏云金杆菌细胞;或链霉菌属细胞,例如,浅青紫链霉菌和鼠灰链霉菌,或革兰氏阴性细菌,例如大肠杆菌和假单胞菌属。在优选的方面,细菌宿主细胞是迟缓芽胞杆菌、地衣芽孢杆菌、嗜热脂肪芽孢杆菌、或枯草芽孢杆菌细胞。在另一个优选的方面,芽胞杆菌属细胞是嗜碱的芽胞杆菌属。
[0208] 载体进入细菌宿主细胞的导入可能受到例如原生质体转化(参见例如,Chang and Cohen,1979,Molecular General Genetics 168:111-115)、利用感受态细胞(参见例如,Young and Spizizin,1961,Journal of Bacteriology 81:823-829,or Dubnau and Davidoff-Abelson,1971,Journal of Molecular Biology56:209-221)、电穿孔(参见例如,Shigekawa and Dower,1988,Biotechniques 6:742-751)、或接合作用(参见例如,Koehler and Thorne,1987,Journal of Bacteriology 169:5771-5278)的影响。
[0209] 宿主细胞也可以是真核生物,例如哺乳动物、昆虫、植物、或真菌细胞。
[0210] 在优选的方面,宿主细胞是真菌细胞。如在此使用的“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)、和接合菌门(Zygomycota)(如由Hawksworth et al.,In,Ainsworth and Bisby’s Dictionary of The Fungi,8th edition,1995,CAB International,University Press,Cambridge,UK所定义的)以及卵菌门(Oomycota)(如Hawksworth et al.,1995,supra,page 171所引用的)和所有的分生孢子(mitosporic)真菌(Hawksworth et al.,1995,supra)。
[0211] 在更优选的方面,真菌宿主细胞是酵母细胞。如在此使用的“酵母”包括产子囊酵母(内孢霉目(Endomycetales))、产生担子孢子(basidiosporogenous)的酵母、和属于半知菌类(Fungi Imperfecti)的酵母(芽生菌目(Blastomycetes))。由于今后酵母的分类可能会有变化,为了本发明的目的,酵母应被定义为如在Biology and Activities of Yeast(Skinner,F.A.,Passmore,S.M.,and Davenport,R.R.,eds,Soc.App.Bacteriol.Symposium Series No.9,1980)中所描述的。
[0212] 在更优选的方面,酵母宿主细胞是假丝酵母属、汉逊氏酵母属(Hansenula)、克鲁维氏酵母属、毕赤氏酵母属、糖酵母属、裂殖酵母属、或耶氏酵母属(Yarrowia)。
[0213] 在最优选的方面,酵母宿主细胞是卡尔酵母、酿酒酵母、糖化酵母、道格拉斯糖酵母、克鲁弗糖酵母、诺地糖酵母、或卵形糖酵母细胞。在另一个最优选的方面,酵母宿主细胞是乳酸克鲁维氏酵母(Kluyveromyces lactis)细胞。在另一个最优选的方面,酵母宿主细胞是Yarrowia lipolytica细胞。
[0214] 在另一个更优选的方面,真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌亚门(Eumycota)和卵菌亚门(Oomycota)的全部丝状体形式(如Hawksworth et al.,1995,supra所定义的)。丝状真菌的一般特征为由壳多糖、纤维素、葡聚糖、脱乙酰几丁质、甘露聚糖、和其他复合多糖组成的菌丝体壁。营养生长是通过菌丝的伸长,而碳分解代谢是专性需氧的。相比之下,通过酵母,例如酿酒酵母的营养生长是通过单细胞叶状体的出芽,而碳分解代谢可能是发酵性的。
[0215] 在更优选的方面,丝状真菌宿主细胞是支顶孢属、曲霉属、短梗霉属、Bjerkandera、Ceriporiopsis、鬼伞属(Coprinus)、采绒革盖菌(Coriolus)、隐球酵母属、Filibasidium、镰刀菌属、腐殖菌属、稻瘟霉属、毛霉属、毁丝霉属、瘤胃真菌、脉孢菌属、拟青霉属、青霉属、Phanerochaete、Phlebia、瘤胃真菌(Piromyces)、Pleurotus、裂褶菌属、踝节菌属、热子囊菌属、梭孢壳属、弯颈霉属、Trametes、或木霉属细胞。
[0216] 在最优选的方面,丝状真菌宿主细胞是泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉细胞。在另一个最优选的方面,丝状真菌宿主细胞是杆孢状镰孢、Fusarium cerealis、Fusarium crookwellense、大刀镰孢、、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖孢镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、 Fusarium torulosum、Fusarium trichothecioides、或Fusarium venenatum细胞。在另一个最优选的方面,丝状真菌宿主细胞是Bjerkandera adusta、Ceriporiopsis aneirina、Ceriporiopsis aneirina、Ceriporiopsis caregiea、Ceriporiopsis gilvescens、Ceriporiopsis pannocinta、Ceriporiopsis rivulosa、Ceriporiopsis subrufa、Ceriporiopsis subvermispora、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolus hirsutus)、Humicola insolens、Humicola lanuginosa、米赫毛霉、嗜热毁丝霉、粗糙链孢霉、产紫青霉、Phanerochaete chrysosporium、Phlebia radiata、Pleurotus eryngii、Thielavia terrestris、Trametes villosa、Trametes versicolor、哈茨木霉、康宁氏木霉(Trichoderma koningii)、Trichoderma longibrachiatum、里氏木霉、或绿色木霉细胞。
[0217] 真菌细胞可通过涉及本来已知方式的原生质体形成、原生质体转化、和细胞壁再生的过程被转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP 238 023和Yelton et al.,1984,Proceedings of the National Academy of Sciences USA 81:1470-1474中有描述。用于转化镰孢种属的合适方法在Malardier et al.,1989,Gene 78:147-156和WO96/00787中有描述。酵母可利用Becker and Guarente,In Abelson,J.N.and Simon,M.I.,editors,Guide to Yeast Genetics and Molecular Biology,Methods in Enzymology,Volume 194,pp182-187,Academic Press,Inc.,New York;Ito et al.,1983,Journal of Bacteriology 153:163;and Hinnen et al.,1978,Proceedings of the National Academy of Sciences USA 75:1920描述的方法被转化。
[0218] 生产方法
[0219] 本发明也涉及用于生产本发明多肽的方法,包括(a)在有助于生产该多肽的条件下培养其野生型能够生产该多肽的细胞;以及(b)回收该多肽。优选地,该细胞属于Thielavia属,以及更优选地为Thielavia terrestris。
[0220] 本发明也涉及用于生产本发明多肽的方法,包括(a)在有助于生产该多肽的条件下培养宿主细胞;以及(b)回收该多肽。
[0221] 本发明也涉及生产本发明多肽的方法,包括(a)在有助于生产该多肽的条件下培养宿主细胞,其中该宿主细胞包括在SEQ ID NO:1的成熟多肽编码区中具有至少一个突变的突变核苷酸序列,其中该突变的核苷酸序列编码由SEQ ID NO:2的第20至326位氨基酸、SEQ ID NO:4的第18至240位氨基酸、SEQ ID NO:6的第20至258位氨基酸、SEQ ID NO:8的第 19至226位氨基酸、或SEQ ID NO:10的第20至304位氨基酸组成的多肽,以及(b)回收该多肽。
[0222] 在本发明的生产方法中,在适于利用本领域众所周知的方法生产该多肽的培养基中培养该细胞。例如,该细胞可通过在实验室或工业发酵罐,在合适的培养基中和在容许该多肽表达和/或分离的条件下进行摇瓶培养法、和小规模或大规模的发酵(包括连续的、分批、分批饲养、或固态发酵)来培养。该培养法利用本领域已知的方法发生在包括碳和氮源和无机盐的合适营养培养基中。合适的培养基可从商品供应商获得或可根据公开的组合物制备(例如,美国典型培养物保藏中心的目录)。如果该多肽分泌进入营养培养基,可从培养基直接回收该多肽。如果该多肽不分泌进入培养基,其可从细胞裂解物回收。
[0223] 利用在此描述的方法检测具有纤维素分解增强活性的多肽。
[0224] 可利用本领域已知的方法回收所得到的多肽。例如,该多肽可从营养培养基通过常规方法回收,包括但不限于离心、过滤、萃取、喷雾干燥蒸发、或沉淀。
[0225] 本发明的多肽可通过本领域已知的各种方法纯化,包括但不限于色谱法(例如,离子交换、亲合的、疏水的、色谱聚焦、和大小排阻)、电泳方法(例如,预备性等电点聚焦)、差异溶解度(例如,硫酸铵沉淀)、SDS-PAGE、或萃取(参见例如,Protein Purification,J.-C.Janson and Lars Ryden,editors,VCH Publishers,New York,1989)来获得基本上纯的多肽。
[0226] 植物
[0227] 本发明也涉及已经用编码本发明具有纤维素分解增强活性的多肽的核苷酸序列转化,以使得表达和生产可回收数量的多肽的转基因植物、植物部分、或植物细胞。多肽可从植物或植物部分回收。备选地,包含重组多肽的植物或植物部分可用于改善食物或饲料质量,例如,提高营养价值、可口性、和流变性,或破坏抗营养因子
[0228] 转基因的植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草,例如草地早熟禾(meadow grass)(蓝草(blue grass),早熟禾属(Poa))、饲用牧草,例如羊茅属(Festuca)、黑麦草属(Lolium)、寒地型牧草(temperate grass),例如剪股颖属(Agrostis),和谷类,例如,小麦、燕麦、黑麦、大麦、稻、高粱,和玉蜀黍(玉米)。
[0229] 双子叶植物的实例是烟草、豆类,例如羽扇豆,铃薯、糖用甜菜、豌豆、菜豆和大豆,以及十字花科植物(十字花科家族),例如花椰菜、油菜籽(rape seed)、和紧密相关的模式生物体拟南芥。
[0230] 植物部分的实例是茎、愈伤组织、叶、根、果实、种子、和茎以及包括这些部分的单独组织,例如,表皮、叶肉、薄壁组织、维管组织、分生组织。特异的植物细胞隔室,例如叶绿体、非原质体、线粒体、液泡、过氧物酶体和细胞质也被认为是植物部分。此外,任何植物细胞,无论其组织起源,都被认为是植物部分。同样,植物部分,例如特异组织和被分离以促进本发明应用的细胞,也被认为是植物部分,例如,胚芽、胚乳、糊粉(aleurone)和种皮。
[0231] 也包括在本发明范围内的是这种植物、植物部分和植物细胞的子代。
[0232] 表达本发明多肽的转基因植物或植物细胞可根据本领域已知的方法构建。简而言之,植物或植物细胞通过将编码本发明多肽的一个或多个表达构建体整合到植物宿主基因组或叶绿体基因组中来构建并且使所得到的改进植物或植物细胞繁殖成为转基因的植物或植物细胞。
[0233] 表达构建体便利地是包括编码本发明多肽、可操作地连接为该核苷酸序列在所选择的植物或植物部分中表达所需要的合适调节序列的多核苷酸的核酸构建体。此外,该表达构建体可包括用于鉴定其中已经被整合入表达构建体和为将该构建体导入所述植物所必需的DNA序列的宿主细胞的选择标记(后者取决于所使用的DNA导入方法)。
[0234] 调节序列,例如启动子和终止子序列以及任选地信号或转运序列的选择是例如根据何时、何处以及怎样需要表达该多肽来确定的。例如,编码本发明多肽的基因的表达可以是组成性的或可诱导的,或可以是发育、阶段或组织特异的,并且该基因产物可靶向于特异的组织或植物部分,例如种子或叶子。调节序列在例如Tague et al.,1988,Plant Physiology 86:506中有描述。
[0235] 对于组成性的表达,可使用35S-CaMV,玉米泛素1、和水稻肌动蛋白1启动子(Franck et al.,1980,Cell 21:285-294,Christensen et al.,1992,Plant Mo.Biol.18:675-689;Zhang et al.,1991,Plant Cell 3:1155-1165)。器官特异性启动子可以是例如,来自贮存库组织,例如种子、马铃薯决茎和果实(Edwards & Coruzzi,1990,Ann.Rev.Genet.24:275-303),或来自代谢库组织,例如分生组织(Ito et al.,1994,Plant Mol.Biol.24:863-878)的启动子,种子特 异的启动子,例如来自水稻的谷蛋白、醇溶谷蛋白(prolamin)、球蛋白、或白蛋白的启动子(Wu et al.,1998,Plant and Cell Physiology
39:885-889),来自豆球蛋白(legumin)B4和蚕豆(Vicia faba)的未知种子蛋白基因的蚕豆启动子(Conrad et al.,1998,Journal of Plant Physiology 152:708-711),来自种子油体蛋白质的启动子(Chen et al.,1998,Plant and Cell Physiology 39:935-941),来自欧洲油菜(Brassica napus)的贮藏蛋白napA启动子,或本领域已知的任何其他的种子特异性启动子,例如在WO 91/14772中有描述。此外,启动子可以是叶子特异的启动子,例如来自水稻或番茄的rbcs启动子(Kyozuka et al.,1993,Plant Physiology 102:
991-1000、小球藻病毒腺嘌呤甲基转移酶基因启动子(Mitra and Higgins,1994,Plant Molecular Biology 26:85-93)、或来自水稻的aldP基因启动子(Kagaya et al.,1995,Molecular and General Genetics 248:668-674)、或创伤可诱导的启动子,例如马铃薯pin2启动子(Xu et al.,1993,Plant Molecular Biology 22:573-588)。同样,可通过非生物的处理诱导启动子,例如温度、干旱、或盐度改变,或通过外源地施加活化该启动子的物质来进行诱导,例如,乙醇、雌激素、植物激素,例如乙烯、脱落酸、和赤霉酸,以及重金属。
[0236] 也可使用启动子增强元件来实现本发明多肽在植物中的更高表达。例如,启动子增强元件可以是位于启动子和编码本发明多肽的核苷酸序列之间的内含子。例如Xu et al.,1993,同上公开了利用水稻肌动蛋白1基因的第一个内含子来增强表达。
[0237] 可从本领域可获得的选择该表达构建体的选择标记基因和任何其他部分。
[0238] 核酸构建体根据本领域已知的传统方法被整合到植物基因组中,包括土壤杆菌-介导的转化、病毒-介导的转化、微注射、粒子轰击、生物射弹转化、和电穿孔(Gasser et al.,1990,Science 244:1293;Potrykus,1990,Bio/Technology 8:535;Shimamoto et al.,1989,Nature 338:274)。
[0239] 目前,根瘤土壤杆菌-介导的基因转移是选择用于产生转基因双子叶植物的方法(关于综述,参见Hooykas and Schilperoort,1992,Plant Molecular Biology 19:15-38)并且也可用于转化单子叶植物,尽管对于这些植物经常使用其他的转化方法。目前,选择用于产生转基因单子叶植物的方法是胚芽愈伤组织或发育胚芽的粒子轰击(涂有转化DNA的显微的金或钨颗粒)(Christou,1992,Plant Journal 2:275-281;Shimamoto,1994,Current Opinion Biotechnology 5:158-162;Vasil et al.,1992,Bio/Technology10:667-674)。用于转化单子叶植物的备选方法是以由Omirulleh et al.,1993,Plant Molecular Biology 21:415-428描述的原生质体转化为基础的。
[0240] 转化后,根据本领域已知的方法选择具有整合的表达构建体的转化体,并使其再生成为完整的植株。该转化过程经常被设计用于在再生或随后的世代期间,通过利用例如共同转化两个分开的T-DNA构建体或通过特异重组酶的位点特异切除选择基因来选择性地消除选择基因。
[0241] 本发明也涉及用于生产本发明多肽的方法,包括(a)在有助于生产该多肽的条件下培养包括编码本发明具有纤维素分解增强活性的多肽的多核苷酸的转基因植物或植物细胞;以及(b)回收该多肽。
[0242] 除去或减少纤维素分解增强活性
[0243] 本发明也涉及生产亲本细胞突变体的方法,其包括断裂或缺失编码本发明多肽的多核苷酸序列、或其部分,其结果形成当在相同条件下比亲本细胞生产更少多肽的突变细胞。
[0244] 突变细胞可通过利用本领域已知的方法,例如插入、破坏、替换或缺失减少或消除编码本发明多肽的核苷酸序列的表达来构建。在优选的方面,该核苷酸序列是非活化的。被改变或失活的核苷酸序列可以是例如为活性所必需的编码区或其部分,或为表达该编码区所需要的调节元件。这种调节或调控序列的实例可以是启动子序列或其功能部分,即足够影响该核苷酸序列表达的部分。用于可能改变的其他调控序列包括但不限于,前导序列、多腺苷酸化序列、前肽序列、信号肽序列、转录终止子、和转录活化子。
[0245] 核苷酸序列的改变或失活可通过使亲本细胞经受诱变并且选择其中该核苷酸序列的表达已经被减少或消除的突变细胞来进行。可以是特异的或随机的诱变可通过例如使用合适的物理或化学诱变剂,利用合适的寡核苷酸,或通过使DNA序列经受产生诱变的PCR来进行。此外,诱变可通过使用这些诱变剂的任何组合来进行。
[0246] 适于本目的的物理或化学诱变剂的实例包括紫外线(UV)照射、羟胺、N-甲基-N′-硝基-N-亚硝基胍(MNNG)、O-甲基羟胺、亚硝酸、乙基甲烷磺酸盐(EMS)、亚硫酸氢钠、甲酸、和核苷酸类似物。
[0247] 当使用这种试剂时,一般通过在适宜条件下,在存在所选择的诱变剂时培养待诱变的亲本细胞来进行诱变,并且筛选和/或选择显示减少或没有该基因表达的突变细胞。
[0248] 核苷酸序列的改变或失活可通过导入、取代、或除去基因或为其转录或翻译所需要的调节元件中的一个或多个核苷酸来实现。例如,核苷酸可被插入或除去以使得产生终止密码子的导入、起始密码子的去除、或开放阅读框的变化。这种改变或失活可根据本领域已知的方法通过定点诱变或产生诱变的PCR来实现。虽然原则上可在体内,即直接在表达待改变的核苷酸序列的细胞上进行改变,优选如下列举例说明的在体外进行改变。
[0249] 消除或减少细胞表达核苷酸序列的便利方法的实例是以基因替换、基因缺失、或基因破坏的技术为基础的。例如,在基因破坏方法中,在体外诱变处理相当于内源核苷酸序列的核酸序列以产生然后被转变成亲本细胞的缺陷性核酸序列以生产缺陷性基因。通过同源重组,缺陷性核酸序列替换内源的核苷酸序列。可能需要缺陷性核苷酸序列也编码可用来选择其中该核苷酸序列已经被改变或破坏的转化体的标记物。在特别优选的实施方案中,用例如在此所描述的选择性标记断裂该核苷酸序列。
[0250] 备选地,核苷酸序列的改变或失活可通过已建立的利用与该核苷酸序列互补的序列的反义或RNAi技术进行。更具体地,通过细胞的核苷酸序列的表达可通过导入与可在细胞中转录并能够与细胞中产生的mRNA杂交的基因核苷酸序列互补的序列来减少或消除。在容许互补的反义核苷酸序列与mRNA杂交的条件下,由此翻译的蛋白质的数量被减少或消除。
[0251] 本发明进一步涉及包括断裂或缺失编码本发明多肽的多核苷酸序列、或其调控序列的亲本细胞的突变细胞,其结果形成比该亲本细胞生产更少多肽的突变细胞。
[0252] 如此产生的缺陷多肽的突变细胞特别可用作表达天然和/或异源蛋白质的宿主细胞。因此,本发明进一步涉及用于生产天然或异源蛋白质的方法,包括(a)在有助于生产该蛋白质的条件下培养突变细胞;以及(b)回收该多肽。术语″异源蛋白质″在此定义为与宿主细胞非天然的蛋白质,其中已经产生修饰以改变该天然序列的天然蛋白质,或由于重组DNA技术操作宿主细胞的结果其表达被定量地改变的天然蛋白质。
[0253] 在进一步的方面,本发明涉及通过使生产本发明多肽的细胞发酵以及通过在发酵已经完成前、期间或之后向发酵液添加能够抑制纤维素分解增 强活性的有效量试剂来生产感兴趣的蛋白质产品,从发酵液回收感兴趣的产品,和任选地使该回收产品经受进一步的纯化来生产基本上无纤维素分解增强活性的蛋白质产物的方法。
[0254] 在进一步的方面,本发明涉及通过在容许表达该产品的条件下培养细胞,使所得到的培养肉汤经受组合的pH和温度处理使得基本上减少纤维素分解增强活性,并从培养肉汤回收该产品来生产基本上无纤维素分解增强活性的蛋白质产品。备选地,组合的pH和温度处理可在从培养肉汤回收的酶制剂上进行。组合的pH和温度处理可任选地与分解纤维增强抑制剂的处理组合使用。
[0255] 根据本发明的这个方面,可能除去至少60%、优选至少75%、更优选至少85%、更优选至少95%、以及最优选至少99%的纤维素分解增强活性。可利用这个方法实现纤维素分解增强活性的完全去除。
[0256] 组合的pH和温度处理优选在pH 4-5和温度为80-90℃进行足够的时段以达到所需要的效果。
[0257] 用于培养和纯化感兴趣的产品的方法可通过本领域已知的方法进行。
[0258] 本发明的用于生产基本上无纤维素分解增强的产物的方法对于生产真核多肽,特别是例如酶的真菌蛋白质有特别的重要性。该酶可选自,例如,淀粉分解酶、脂肪分解酶、蛋白水解酶、溶细胞酶、氧化还原酶、或植物细胞壁降解酶。这些酶的实例包括氨肽酶、淀粉酶、淀粉葡萄糖苷酶、碳水化合物分解酶、羧肽酶、过氧化氢酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、葡萄糖氧化酶、葡糖苷酶、盐过氧化物酶(haloperoxidase)、半纤维素酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、裂合酶、甘露糖苷酶、氧化酶、果胶分解酶、过氧化物酶、肌醇六磷酸酶、酚氧化酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转移酶、转谷氨酰胺酶、或木聚糖酶。分解纤维增强-欠缺的细胞也可用于表达药物学上感兴趣的异源蛋白质,例如激素、生长因子、受体等。
[0259] 可理解的是术语″真核多肽″不仅包括天然多肽,而且包括例如已经通过氨基酸取代、缺失或添加、或其他这种修饰以增强活性、热稳定性、pH耐受性等而改变的酶的多肽。
[0260] 在进一步的方面,本发明涉及通过本发明的方法生产的基本上无纤维素分解增强活性的蛋白质产品。
[0261] 组合物
[0262] 本发明也涉及包括本发明多肽的组合物。优选地,该组合物富集这种多肽。术语″富集″表明该组合物的纤维素分解增强活性已经增加,例如,其富集系数为至少1.1。
[0263] 该组合物可包括本发明的多肽作为主要成分,例如,单组分组合物。备选地,该组合物可进一步包括一种或多种酶促活性,例如氨肽酶、淀粉酶、碳水化合物分解酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、盐过氧化物酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果胶分解酶、肽谷氨酰胺酶(peptidoglutaminase)、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、或木聚糖酶。可例如通过属于下列属的微生物生产另外的酶,曲霉属、优选棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、或米曲霉;镰孢属,优选杆孢状镰孢、Fusarium cerealis、Fusarium crookwellense、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖孢镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、硫色镰孢、Fusarium toruloseum、Fusarium trichothecioides、或Fusarium venenatum;腐殖菌属、优选Humicola insolens或Humicola lanuginosa;或木霉属、优选哈茨木霉属、康宁氏木霉、Trichoderma longibrachiatum、里氏木霉、或绿色木霉。
[0264] 该多肽组合物可根据本领域已知的方法来制备并且可以是液体或干组合物的形式。例如,该多肽组合物可以是粒化或微粒化的形式。包括在该组合物中的多肽可根据本领域已知的方法被稳定化。
[0265] 如下给出优选使用本发明多肽组合物的实例。本发明多肽组合物的剂量和使用该组合物的条件可根据本领域已知的方法确定。
[0266] 降解或转化生物质为单糖、二糖、和多糖
[0267] 本发明也涉及用于降解或转换纤维素物质的方法,包括:在存在有效量的具有纤维素分解增强活性的多肽时,用有效量的分解纤维蛋白质处理纤维素物质,其中该具有纤维素分解增强活性的多肽的存在与缺少具有纤维素分解增强活性的多肽相比增加了纤维素物质的降解。
[0268] 本发明的多肽和宿主细胞可用于生产单糖、二糖、和多糖作为用于生产乙醇、塑料、其他产品或中间物的来自生物质的化合物或发酵原料。特 别地,本发明的多肽和宿主细胞可用于通过纤维素或半纤维素的部分或完全的溶解作用增加工艺残渣(干燥的蒸馏谷类物、来自酿造酒糟(spent grain)、甘蔗渣(bagasse)等)的价值。在通过分解纤维素物质为葡萄糖、木糖、甘露糖、半乳糖、和阿拉伯糖的分解纤维蛋白质促进该过程中,它们的聚合物、或产品如下所述来源于它们。该多肽可以是有或没有细胞的粗制发酵液形式,或是半纯化或纯化酶制剂的形式。纤维素分解增强的蛋白质可以是单组分制品,例如家族61蛋白质,多组分的蛋白质制品,例如许多家族61蛋白质或多组分和单组分蛋白质制品的组合。纤维素分解增强的蛋白质可在酸性、中性、或碱性pH-范围中促进分解纤维蛋白质的活性。备选地,本发明的宿主细胞可用作生物质发酵过程中多肽的来源。宿主细胞也可包含编码分解纤维蛋白质以及其他用于生物质加工的其他酶的天然或异源基因。
[0269] 生物质可包括但不限于,木材资源、城市固体废物、废纸、农作物、和作物残渣(参见,例如,Wiselogel et al.,1995,in Handbook on Bioethanol (Charles E.Wyman,editor),PP.105-118,Taylor & Francis,Washington D.C.;Wyman,1994,Bioresource Technology 50:3-16;Lynd,1990,Applied Biochemistry and Biotechnology24/25:695-719;Mosier et al.,1999,Recent Progress in Bioconversion of Lignocellulosics,in Advances in Biochemical Engineering/Biotechnology,T.Scheper,managing editor,Volume 65,pp.23-40,Springer-Verlag,New York)。
[0270] 生物质初生细胞壁中的主要多糖是纤维素,第二最充足的是半纤维素,而第三位的是果胶。在细胞已经停止生长后产生的次生胞壁也包含多糖,并且通过共价交联于半纤维素的聚合木质素被加强。纤维素是脱水纤维二糖的同聚物,并且因此是线性的β-(1-4)-D-葡聚糖,而半纤维素包括具有广谱取代的复杂分支结构的各种化合物,例如木聚糖、木糖葡萄糖、阿拉伯糖基木聚糖、和甘露聚糖。虽然一般是多形态的,纤维素在植物组织中主要作为平行葡聚糖链的不溶结晶基体存在。半纤维素通常以氢键连接纤维素,以及其他的半纤维素,其帮助稳定该细胞壁基质。
[0271] 在本发明的方法中,分解纤维的蛋白质可以是涉及纤维素物质至葡萄糖、或半纤维素至木糖、甘露糖、半乳糖、和阿拉伯糖、其聚合物、如下所述来源于其的产物的过程的任何蛋白质。分解纤维的蛋白质可以是如下定义的单组分制品,例如纤维素酶,多组分的制品,例如,葡聚糖内切酶、 纤维二糖水解酶、葡萄糖水解酶、β-葡糖苷酶或多组分和单组分蛋白质制品的组合。分解纤维的蛋白质可具有活性,即在酸性、中性或碱性pH-范围内水解纤维素的活性。
[0272] 分解纤维的蛋白质可以是真菌或细菌起源,其可从已知能够生产纤维素分解酶的微生物获得或分离和纯化,例如,芽胞杆菌属、假单胞菌属、腐殖菌属、鬼伞属、梭孢壳属、镰孢属、毁丝霉属、支顶孢属、头孢属、柱霉属(Scytalidium)、青霉属或曲霉属(参见例如,EP 458162)的种属,特别是通过选自Humicola insolens(二级分类为嗜热柱霉(Scytalidium thermophilum),参见例如美国专利号4,435,307)灰盖鬼伞、尖孢镰孢、嗜热毁丝霉、Meripilus giganteus、Thielavia terrestris、支顶孢种属、Acremonium persicinum、Acremonium acremonium、Acremonium brachypenium、Acremonium dichromosporum、Acremonium obclavatum、Acremonium pinkertoniae、Acremonium roseogriseum、Acremonium incoloratum、和Acremonium furatum的菌株生产的;优选来自种属Humicola insolens DSM 1800、尖孢镰孢DSM2672、嗜热毁丝霉CBS 117.65、头孢种属RYM-202、支顶孢种属CBS478.94、支顶孢属CBS 265.95、Acremonium persicinum CBS169.65、Acremonium acremonium AHU 9519、头孢属CBS 535.71、Acremonium brachypenium CBS 866.73、Acremonium dichromosporum CBS 683.73、Acremonium obclavatum CBS
311.74、Acremonium pinkertoniae CBS 157.70、Acremonium roseogriseum CBS 134.56、Acremonium incoloratum CBS146.62、和Acremonium furatum CBS 299.70H。分解纤维的蛋白质也可获得自木霉属(特别是绿色木霉、里氏木霉、和康宁氏木霉)、嗜碱芽胞杆菌(参见例如,美国专利号3,844,890和EP 458162)、和链霉菌属(参见例如,EP458162)。包括化学改变的或蛋白质工程化的突变体。
[0273] 特别合适的分解纤维的蛋白质是碱性或中性的纤维素酶。这种纤维素酶的实例是在EP 495,257、EP 531,372、WO 96/11262、WO 96/29397、WO98/08940中描述的纤维素酶。其他的实例是在例如WO 94/07998、EP531,315、美国专利号4,435,307、美国专利号5,457,046、美国专利号5,648,263、美国专利号5,686,593、美国专利号5,691,178、美国专利号5,763,254、美国专利号5,776,757、WO 89/09259、WO 95/24471、WO 98/12307和PCT/DK98/00299中描述的纤维素酶变体。
[0274] 用于本发明方法的分解纤维的蛋白质和纤维素分解增强的蛋白质可通过在包含合适碳和氮源和无机盐的营养培养基上,利用本领域已知的方法发酵上述记录的微生物菌株生产(参见例如,Bennett,J.W.and LaSure,L.(eds.),More Gene Manipulations in Fungi,Academic Press,CA,1991)。合适的培养基可从商品供应商获得或可根据公开的组合物制备(例如,美国典型培养物保藏中心的目录)。适于生长和分解纤维蛋白质生产的温度范围及其他条件是本领域已知的(参见例如,Bailey,J.E.,and Ollis,D.F.,Biochemical Engineering Fundamentals,McGraw-Hill Book Company,NY,1986)。
[0275] 该发酵可以是导致表达或分离分解纤维蛋白质或分解纤维增强蛋白质的细胞培养的任何方法。因此发酵可理解为包括在实验室或工业发酵罐中,在合适的培养基和容许分解纤维蛋白质或分解纤维增强蛋白质表达或分离的条件下进行摇瓶培养法、小-或大规模的发酵(包括连续的、分批的、分批饲养、或固态发酵)。
[0276] 通过上述方法生产所得到的分解纤维蛋白质或纤维素分解增强的蛋白质可通过常规方法从发酵培养基中回收,包括但不限于离心、过滤、喷雾干燥、蒸发或沉淀。回收的蛋白质可进一步通过各种色谱分析方法纯化,例如离子交换色谱法、凝胶过滤色谱法、亲和色谱法等。
[0277] 分解纤维的蛋白质可水解或羧甲基纤维素(CMC),由此降低培养混合物的粘性。所得到的粘性降低可通过振动粘度计测定(例如,来自Sofraser,法国的MIVI 3000)。按术语纤维素酶粘度单位(CEVU)计量的纤维素酶活性的测定通过测量该样品降低羧甲基纤维素(CMC)溶液粘度来定量存在于样品中的催化活性数量。在适于分解纤维蛋白质和底TM
物的温度和pH进行该分析。对于Celluclast (Novozymes A/S, Denmark),
该分析在40℃,0.1M磷酸盐pH 9.0缓冲液中,以CMC作为底物(33.3g/L羧甲基纤维素Hercules 7LFD)和酶浓度为大约3.3-4.2CEVU/ml进行30分钟。相对于发表的酶标准例TM
如CELLUZYME 标准17-1194(获得自Novozymes A/S, Denmark)计算CEVU活
性。
[0278] 适用于本发明的分解纤维制品的实例包括例如,CELLUCLASTTM(获得自Novozymes TMA/S)和NOVOZYM 188(获得自Novozymes A/S)。包括可使用的纤维素酶的其他商业上TM TM TM TM
可购买的制剂包括CELLUZYME 、CEREFLO 和ULTRAFLO (Novozymes A/S)、LAMINEX 和SPEZYMETM CP(Genencor Int.)、以及ROHAMENTTM 7069 W 纤维素酶以固体
的大约0.001%至大约5.0% wt.,更优选固体的大约0.025%至大约4.0% wt.,以及最优选固体的大约0.005%至大约2.0% wt.的有效量添加。
[0279] 如上所述,用于本发明方法的分解纤维蛋白质或纤维素分解增强的蛋白质可以是单组分制剂,即基本上无其他分解纤维组分的成分。单组分可以是重组的成分,即通过克隆编码该单组分的DNA序列,随后用该DNA序列转化细胞并且在宿主中表达来生产的成分(参见例如,WO 91/17243和WO 91/17244)。单组分分解纤维蛋白质的其他实例包括但不限于在JP-07203960-A和WO-9206209中公开的那些。宿主优选是异源的宿主(酶对于宿主是外来的),但在一定条件下该宿主也可以是同源的宿主(酶对于宿主是天然的)。单组分分解纤维的蛋白质也可通过从发酵液纯化这种蛋白质来制备。
[0280] 用于实现本发明方法的单组分分解纤维蛋白质的实例包括但不限于葡聚糖内切酶、纤维二糖水解酶、葡萄糖水解酶、和β-葡糖苷酶。
[0281] 术语“葡聚糖内切酶”在此定义为内-1,4-(1,3;1,4)-β-D-葡聚糖4-葡聚糖水解酶(E.C.No.3.2.1.4),其催化纤维素、纤维素衍生物(例如羧甲基纤维素和羟乙基纤维素)、地衣淀粉(lichenin)、混合β-1,3的β-1,4键葡聚糖,例如谷物β-D-葡聚糖或木糖葡萄糖、及包含纤维素成分的其他植物材料中1,4-β-D-糖苷键的内水解。为了本发明的目的,葡聚糖内切酶活性利用羧甲基纤维素(CMC)水解根据Ghose,1987,Pure and Appl.Chem.59:257-268的方法来确定。
[0282] 外-1,4-β-D-葡聚糖酶包括纤维二糖水解酶和葡萄糖水解酶。
[0283] 术语“纤维二糖水解酶”在此定义为1,4-β-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91),其催化纤维素、纤维寡糖、或包含从还原或非还原的链末端释放纤维二糖的聚合物的任何β-1,4-连接的葡萄糖中1,4-β-D-糖苷键的水解。为了本发明的目的,纤维二糖水解酶活性根据Lever et al.,1972,Anal.Biochem.47:273-279和van Tilbeurgh et al.,1982,FEBS Letters 149:152-156;van Tilbeurgh and Claeyssens,1985,FEBS Letters 187:283-288描述的方法确定。在本发明中,Lever et al.方法用来评估玉米秸中纤维素的水解,而van Tilbeurgh et al.的方法用来确定纤维二糖水解酶对荧光二糖衍生物的活性。
[0284] 术语“葡萄糖水解酶”在此定义为1,4-β-D-葡聚糖葡萄糖水解酶(E.C.3.2.1.74),其催化1,4-β-D-葡聚糖中1,4-键(O-糖基键)的水解以使得移除 连续的葡萄糖单体。为了本发明的目的,外葡聚糖酶活性根据Himmel et al.,1986,J.Biol.Chem.261:12948-12955描述的方法确定。
[0285] 术语“β-葡糖苷酶”在此定义为β-D-糖苷葡萄糖水解酶(E.C.3.2.1.21),其催化伴随有β-D-葡萄糖释放的末端非还原的β-D-葡萄糖残基的水解。为了本发明的目的,β-葡糖苷酶活性根据Venturi et al.,2002,J.Basic Microbiol.42:55-66描述的基本方法确定,除了使用如在此描述的不同条件。一单位的β-葡糖苷酶活性定义为在50℃,pH5,在100mM柠檬酸钠,0.01%Tween-20中,从4mM p-硝基酚基-β-D-glucopyranoside底物每分钟生产的1.0μ摩尔的p-硝基酚。
[0286] 本发明的多肽用于连接分解纤维的蛋白质以降解生物质底物的纤维素成分,(参见例如,Brigham et al.,1995,in Handbook on Bioethanol(Charles E.Wyman,editor),PP.119-141,Taylor & Francis,Washington D.C.;Lee,1997,Journal of Biotechnology56:1-24)。
[0287] 具有纤维素分解增强活性的多肽和分解纤维蛋白质的最适宜数量取决于几个因素,包括但不限于,构成分解纤维蛋白质的混合物、纤维素底物、纤维素底物的浓度、纤维素底物的预处理、温度、时间、pH、和包含的发酵生物(例如,用于同时糖化和发酵的酵母)。术语“分解纤维的蛋白质”在此定义为显示能够在测试条件下水解或转化或降解纤维素的蛋白质或蛋白质混合物。它们的数量通常通过常见的分析来测量,例如BCA(bicinchoninic acid,P.K.Smith et al.,1985,Anal.Biochem.150:76),并且优选添加的数量与待水解的生物质的数量成比例。
[0288] 在优选的方面,每g纤维素物质中具有纤维素分解增强活性的多肽的数量是每g纤维素物质大约0.01至大约2.0mg,优选大约0.025至大约1.5mg,更优选大约0.05至大约1.25mg,更优选大约0.075至大约1.25mg,更优选大约0.1至大约1.25mg,更优选大约0.15至大约1.25mg,以及最优选大约0.25至大约1.0mg。
[0289] 在另一个优选的方面,每g纤维素物质中分解纤维蛋白质的数量是每g纤维素物质大约0.5至大约50mg,优选大约0.5至大约40mg,更优选大约0.5至大约25mg,更优选大约0.75至大约20mg,更优选大约0.75至大约15mg,更优选大约0.5至大约10mg,以及最优选大约2.5至大约10mg。
[0290] 在优选的方面,每g分解纤维的蛋白质中具有纤维素分解增强活性的多肽的数量是每g分解纤维的蛋白质大约0.005至大约1.0g,优选大约0.01 至大约1.0g,更优选大约0.15至大约0.75g,更优选大约0.15至大约0.5g,更优选大约0.1至大约0.5g,更优选大约0.1至大约0.5g,以及最优选大约0.05至大约0.2g。
[0291] 本发明的方法可用于加工纤维素物质成为许多有用的有机产品、化学品和燃料。除乙醇之外,可从纤维素生产的一些商品和特殊化学品包括木糖、丙、乙酸酯、甘氨酸、赖氨酸、有机酸(例如,乳酸)、1,3-丙二醇、丁二醇、甘油、乙二醇、糠醛、polyhydroxyalkanoates、cis、顺式己二烯二酸、和动物饲料(Lynd,L.R.,Wyman,C.E.,and Gerngross,T.U.,1999,Biocommodity Engineering,Biotechnol.Prog.,15:777-793;Philippidis,G.P.,1996,Cellulose bioconversion technology,in Handbook on Bioethanol:Production and Utilization,Wyman,C.E.,ed.,Taylor & Francis,Washington,DC,179-212;and Ryu,D.D.Y.,and Mandels,M.,1980,Cellulases:
biosynthesis and applications,Enz.Microb.Technol.,2:91-102)。潜在的共生产利益延伸超过来自发酵性碳水化合物的多种有机产品的合成。生物过程后剩余的富含木质素的残渣可被转化为木质素衍生的化学品,或用于电生产。
[0292] 根据本发明的方法,用于加工纤维素物质的常用方法是本领域技术人员充分了解的。本发明的方法可利用根据本发明操作而配置的任何传统的生物质加工设备来实施。
[0293] 这种设备可包括分批搅拌的反应器、具有超滤作用的连续流动搅拌的反应器、连续推流柱(plug-flow)的反应器(Gusakov,A.V.,and Sinitsyn,A.P.,1985,Kinetics of the enzymatic hydrolysis of cellulose:1.A mathematical model for a batch reactor process,Enz.Microb.Technol.7:346-352)、摩擦反应器(Ryu,S.K.,and Lee,J.M.,1983,Bioconversion of waste cellulose by using an attrition bioreactor,Biotechnol.Bioeng.25:53-65)、或具有通过电磁场感应诱导的密集搅拌的反应器(Gusakov,A.V.,Sinitsyn,A.P.,Davydkin,I.Y.,Davydkin,V.Y.,Protas,O.V.,1996,Enhancement of enzymatic cellulose hydrolysis using a novel type of bioreactor with intensive stirring induced by electromagnetic field,Appl.Biochem.Biotechnol.56:141-153)。
[0294] 传统方法包括但不限于,糖化、发酵、分开的水解和发酵(SHF)、同时的糖化和发酵(SSF)、同时的糖化和共同发酵(SSCF)、混合的水解和发酵(HHF)、和直接的微生物转化(DMC)。
[0295] SHF使用分开的加工步骤,首先酶促水解纤维素至葡萄糖,然后发酵葡萄糖至乙醇。在SSF中,纤维素的酶促水解和葡萄糖发酵至乙醇被组合为一个步骤(Philippidis,G.P.,1996,Cellulose bioconversion technology,in Handbook on Bioethanol:Production and Utilization,Wyman,C.E.,ed.,Taylor & Francis,Washington,DC,
179-212)。SSCF包括多种糖的共同发酵(Sheehan,J.,and Himmel,M.,1999,Enzymes,energy and the environment:A strategic perspective on the U.S.Department of Energy’s research and development activities for bioethanol,Biotechnol.Prog.15:817-827)。HHF包括在相同反应器中但在不同温度下进行的两个分开的步骤,即高温酶促糖化,然后是在发酵菌株可忍受的较低温度下的SSF。DMC将全部3个过程(纤维素酶生产、纤维素水解、和发酵)合而为一个步骤(Lynd,L.R.,Weimer,P.J.,van Zyl,W.H.,and Pretorius,I.S.,2002,Microbial cellulose utilization:Fundamentals and biotechnology,Microbiol.Mol.Biol.Reviews 66:506-577)。
[0296] “发酵”或“发酵过程”是指任何发酵过程或包括发酵步骤的任何过程。发酵过程不加限制地包括,用于生产发酵产品的发酵过程,包括醇类(例如,阿拉伯糖醇、丁醇、乙醇、甘油、甲醇、1,3-丙二醇、山梨糖醇、和木糖醇);有机酸(例如,乙酸、醋酮酸己二酸抗坏血酸、柠檬酸、2,5-二酮-D-葡糖酸、甲酸、富马酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、甲叉丁二酸(衣康酸)、乳酸、苹果酸、丙二酸草酸、丙酸、丁二酸、和木糖酸);
酮类(例如,丙酮);氨基酸(例如,天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸,和苏氨酸);
气体(例如,甲烷、氢气(H2)、二氧化碳(CO2),和一氧化碳(CO))。发酵过程也包括用于可消费醇类工业(例如,啤酒和葡萄酒)、乳品工业(例如,发酵乳制品)、皮革工业、和烟草工业的发酵过程。
[0297] 本发明进一步涉及生产有机物质的方法,包括:(a)在存在有效量的具有纤维素分解增强活性的多肽时用有效量的分解纤维蛋白质糖化纤维素物质,其中具有纤维素分解增强活性的多肽的存在与缺少具有纤维素分解增强活性的多肽相比增加纤维素物质的降解;(b)用一种或多种发酵微生物发酵步骤(a)中糖化的纤维素物质;和(c)从发酵物回收有机物质。该具有纤维素分解增强活性的多肽可以是有或没有细胞的粗制发酵液形式,或是半纯化或纯化的酶制剂形式。纤维素分解增强的蛋白质可以是单组分制品,例如家族61蛋白质,多组分的蛋白质制品,例如许多家族61蛋白质或多组 分和单组分蛋白质制品的组合。
[0298] 有机物质可以是来源于发酵物的任何物质。在优选的实施方案中,该有机物质是醇类。可理解术语“醇类”包括包含一个或多个羟基部分的有机物质。在更优选的实施方案中,该醇类是阿拉伯糖醇。在另一个更优选的实施方案中,醇类是丁醇。在另一个更优选的实施方案中,醇类是乙醇。在另一个更优选的实施方案中,醇类是甘油。在另一个更优选的实施方案中,醇类是甲醇。在另一个更优选的实施方案中,醇类是1,3-丙二醇。在另一个更优选的实施方案中,醇类是山梨糖醇。在另一个更优选的实施方案中,醇类是木糖醇。参见例如,Gong,C.S.,Cao,N.J.,Du,J.,and Tsao,G.T.,1999,Ethanol production from renewable resources,in Advances in Biochemical Engineering/Biotechnology,Scheper,T.,ed.,Springer-Verlag Berlin Heidelberg,Germany,65:207-241;Silveira,M.M.,and Jonas,R.,2002,The biotechnological production of sorbitol,Appl.Microbiol.Biotechnol.59:400-408;Nigam,P.,and Singh,D.,1995,Processes for fermentative production of xylitol-a sugar substitute,Process Biochemistry30(2):117-124;Ezeji,T.C.,Qureshi,N.and Blaschek,H.P.,2003,Production of acetone,butanol and ethanol by Clostridium beijerinckii BA101 and in situ recovery by gas stripping,World Journal of Microbiology and Biotechnology
19(6):595-603。
[0299] 在另一个优选的实施方案中,有机物质是有机酸。在另一个更优选的实施方案中,有机酸是乙酸。在另一个更优选的实施方案中,有机酸是醋酮酸。在另一个更优选的实施方案中,有机酸是己二酸。在另一个更优选的实施方案中,有机酸是抗坏血酸。在另一个更优选的实施方案中,有机酸是柠檬酸。在另一个更优选的实施方案中,有机酸是2,5--二酮-D-葡糖酸。在另一个更优选的实施方案中,有机酸是甲酸。在另一个更优选的实施方案中,有机酸是富马酸(延胡索酸)。在另一个更优选的实施方案中,有机酸是葡糖二酸。在另一个更优选的实施方案中,有机酸是葡糖酸。在另一个更优选的实施方案中,有机酸是葡糖醛酸。在另一个更优选的实施方案中,有机酸是戊二酸。在另一个更优选的实施方案中,有机酸是3-羟基丙酸。在另一个更优选的实施方案中,有机酸是甲叉丁二酸。在另一个更优选的实施方案中,有机酸是乳酸。在另一个更优选的实施方案中,有机酸是苹果酸。在另一个更优选的实施方案中,有机酸是丙二酸。在另一个更优选的实施方案中,有机酸是草酸。在另一个更优选的实施方案中,有机 酸是丙酸。在另一个更优选的实施方案中,有机酸是琥珀酸。在另一个更优选的实施方案中,有机酸是木糖酸。参见例如,Chen,R.,and Lee,Y.Y.,1997,Membrane-mediated extractive fermentation for lactic acid production from cellulosic biomass,Appl.Biochem.Biotechnol.63-65:435-448。
[0300] 在另一个优选的实施方案中,有机物质是酮类。可理解术语“酮类”包括包含一个或多个酮类部分的有机物质。在另一个更优选的实施方案中,酮类是丙酮。参见例如,Qureshi and Blaschek,2003,supra.
[0301] 在另一个优选的实施方案中,有机物质是氨基酸。在另一个更优选的实施方案中,有机酸是天冬氨酸。在另一个更优选的实施方案中,氨基酸是谷氨酸。在另一个更优选的实施方案中,氨基酸是甘氨酸。在另一个更优选的实施方案中,氨基酸是赖氨酸。在另一个更优选的实施方案中,氨基酸是丝氨酸。在另一个更优选的实施方案中,氨基酸是苏氨酸。参见例如,Richard,A.,and Margaritis,A.,2004,Empirical modeling of batch fermentation kinetics for poly(glutamic acid)production and other microbial biopolymers,Biotechnology and Bioengineering 87(4):501-515。
[0302] 在另一个优选的实施方案中,有机物质是气体。在另一个更优选的实施方案中,气体是甲烷。在另一个更优选的实施方案中,气体是H2。在另一个更优选的实施方案中,气体是CO2。在另一个更优选的实施方案中,气体是CO。参见例如,Kataoka,N.,A.Miya,and K.Kiriyama,1997,Studies on hydrogen production by continuous culture system of hydrogen-producing anaerobic bacteria,Water Science and Technology 36(6-7):41-47;and Gunaseelan V.N.in Biomass and Bioenergy,Vol.13(1-2),pp.83-114,1997,Anaerobic digestion of biomass for methane production:A review。
[0303] 从纤维素物质生产有机物质一般需要四个主要步骤。这四个步骤是预处理、酶促水解、发酵和回收。下列的例证是用于生产乙醇的方法,但可理解相似的方法可用于生产其他的有机物质,例如如上所述的物质。
[0304] 预处理 在预处理或预水解步骤中,纤维素物质受热断裂木质素和碳水化合物结构,大部分半纤维素溶解,并产生可接近纤维素分解酶的纤维素部分。用蒸汽直接进行加热或在也可向材料加入催化剂以加速反应的浆液中进行加热。催化剂包括强酸,例如硫酸和SO2,或碱,例如氢氧化钠。预处理阶段的目的是促进酶和微生物的渗透。纤维素生物质也可经受水热蒸汽喷发预处理(参见美国专利申请号20020164730)。
[0305] 糖化 在酶促水解,亦称为糖化的步骤中,在此描述的酶被加入预先处理的材料以使纤维素部分转化为葡萄糖和/或其他的糖。糖化一般在搅拌罐式反应器或发酵罐中,在控制的pH、温度、和混合条件下进行。糖化步骤最后可达到200小时。糖化也可在大约30℃至大约65℃,特别是大约50℃的温度,以及在pH范围为大约4和大约5之间,特别是大约pH 4.5进行。为了生产可被酵母代谢的葡萄糖,一般在存在β-葡糖苷酶时进行水解。
[0306] 发酵 在发酵步骤中,由于预处理和酶促水解步骤从纤维素物质释放的糖通过发酵生物,例如酵母被发酵为乙醇。发酵还可与酶促水解在相同的容器中,也在控制的pH、温度、和混合条件下同时进行。当糖化和发酵在相同容器中同时进行时,该过程一般定义为同时的糖化和发酵或SSF。
[0307] 任何合适的纤维素底物或原料可用于本发明的发酵过程。一般根据所需要的发酵产品,即将从发酵获得的有机物质,和如本领域已知的使用的方法来选择底物。适用于本发明方法的底物的实例,包括包含纤维素的材料,例如从可被发酵微生物代谢的加工的纤维素物质获得的木材或植物残余物或低分子糖DP1-3,并且其可通过直接加入发酵培养基来供给。
[0308] 术语“发酵培养基”可理解为是指在加入发酵微生物前的培养基,例如,由糖化过程产生的培养基,以及在同时的糖化和发酵过程(SSF)中使用的培养基。
[0309] “发酵微生物”是指适用于所需要发酵过程的任何微生物。本发明所述的合适发酵微生物能够发酵,即直接或间接地转化糖,例如葡萄糖、木糖、阿拉伯糖、甘露糖、半乳糖、或低聚糖成为所需要的发酵产品。发酵微生物的实例包括真菌生物体,例如酵母。优选的酵母包括酵母属的菌株,以及特别是酿酒酵母。可商业购买的酵母包括,例如,Red TM/ /Lesaffre Ethanol Red(可从Red Star/Lesaffre,USA商业购买)FALI(可
从Fleischmann’s Yeast,a division of Bums Philp Food Inc.,USA商业购买)、SUPERSTART(可从Alltech商业购买)、GERT STRAND(可从Gert Strand AB,Sweden商业购买)和FERMIOL(可从DSM Specialties商业购买)。
[0310] 在优选的实施方案中,酵母是酵母种属。在更优选的实施方案中,酵母是酿酒酵母。在另一个更优选的实施方案中,酵母是糖化糖酵母(Saccharomyces distaticus)。在另一个更优选的实施方案中,酵母是葡萄汁酵母(Saccharomyces uvarum)。在另一个更优选的实施方案中,酵母是克鲁维 氏酵母(Kluyveromyces)。在另一个更优选的实施方案中,酵母是Kluyveromyces marxianus。在另一个更优选的实施方案中,酵母是脆壁克鲁维氏酵母(Kluyveromyces fragilis)。在另一个优选的实施方案中,酵母是假丝酵母。在另一个更优选的实施方案中,酵母是Candida pseudotropicalis。在另一个更优选的实施方案中,酵母是Candida brassicae。在另一个优选的实施方案中,酵母是Clavispora。在另一个更优选的实施方案中,酵母是Clavispora lusitaniae。在另一个更优选的实施方案中,酵母是Clavispora opuntiae。在另一个优选的实施方案中,酵母是Pachysolen。
在另一个更优选的实施方案中,酵母是Pachysolen tannophilus。在另一个优选的实施方案中,酵母是Bretannomyces。在另一个更优选的实施方案中,酵母是Bretannomyces clausenii(Philippidis,G.P.,1996,Cellulose bioconversion technology,in Handbook on Bioethanol:Production and Utilization,Wyman,C.E.,ed.,Taylor & Francis,Washington,DC,179-212)。
[0311] 可有效发酵葡萄糖为乙醇的细菌包括例如,Zymomonas mobilis和Clostridium thermocellum(Philippidis,1996,supra)。
[0312] 本领域已知如上所述的生物体也可用于生产如在此所描述的其他有机物质。
[0313] 酿酒酵母(Chen,Z.,Ho,N.W.Y.,1993,Cloning and improving the expression of Pichia stipitis xylose reductase gene in Saccharomyces cerevisiae,Appl.Biochem.Biotechnol.39-40:135-147;Ho,N.W.Y.,Chen,Z,Brainard,A.P.,1998,Genetically engineered Saccharomyces yeast capable of effectively cofermenting glucose and xylose,Appl.Environ.Microbiol.64:1852-1859)、或例如大肠杆菌的细菌(Beall,D.S.,Ohta,K.,Ingram,L.O.,1991,Parametric studies of ethanol production from xylose and other sugars by recombinant Escherichia coli,Biotech.Bioeng.38:296-303)、Klebsiella oxytoca(Ingram,L.O.,Gomes,P.F.,Lai,X.,Moniruzzaman,M.,Wood,B.E.,Yomano,L.P.,York,S.W.,1998,Metabolic engineering of bacteria for ethanol production,Biotechnol.Bioeng.58:204-214)、和Zymomonas mobilis(Zhang,M.,Eddy,C.,Deanda,K.,Finkelstein,M.,and Picataggio,S.,1995,Metabolic engineering of a pentose metabolism pathway in ethanologenic Zymomonas mobilis,Science267:240-243;Deanda,K.,Zhang,M.,Eddy,C.,and Picataggio,S.,1996,Development of an arabinose-fermenting Zymomonas mobilis strain by metabolic pathway engineering,Appl.Environ.Microbiol.62:4465-4470)中异源基因的克隆已经导致构建能够转化己糖和戊糖为乙醇(共同发酵)的生物体。
[0314] 酵母或另一种微生物一般被加入降解纤维素或水解物,并且进行发酵大约24至大约96小时,例如大约35至大约60小时。温度一般为大约26℃至大约40℃之间,特别是在大约32℃,以及在大约pH 3至大约pH 6,特别是在大约pH 4-5。
[0315] 在优选的实施方案中,酵母或另一种微生物一般被施用于降解纤维素或水解物,并且进行发酵大约24至大约96小时,例如一般为35-60小时。在优选的实施方案中,温度一般是大约26至大约40℃之间,特别是在大约32℃,并且pH一般是大约pH 3至大约pH5 12 7
6,优选大约pH 4-5。酵母或另一种微生物优选施用的数量为大约10 至10 ,优选大约10
10 7
至10 ,特别是每ml发酵液大约5x10 活菌计数。在乙醇生产阶段期间,酵母细胞计数优选
7 10 8
应处于大约10 至10 的范围中,特别是大约2x10。关于利用酵母进行发酵的进一步的指导可在例如“The Alcohol Textbook”(Editors K.Jacques,T.P.Lyons and D.R.Kelsall,Nottingham University Press,United Kingdom 1999)中找到,其在此引入作为参考。
[0316] 本领域中最广泛使用的方法是同时的糖化和发酵(SSF)方法,其中没有糖化保持阶段,意味着酵母和酶被一起加入。
[0317] 对于乙醇生产,发酵后,蒸馏糊状物以提取乙醇。根据本发明方法获得的乙醇可用作例如,燃料乙醇;饮料乙醇,即,可饮用的高纯中性酒精(spirit)、或工业酒精。
[0318] 可与在此描述的任何酶促方法组合使用发酵刺激物以进一步改善发酵过程,以及特别是发酵微生物的特性,例如增加速率和乙醇产量。“发酵刺激物”是指用于发酵微生物,特别是酵母的生长的刺激物。用于生长的优选发酵刺激物包括维生素和矿物质。维生素的实例包括多种维生素、生物素、泛酸酯(pantothenate)、烟酸、内消旋(meso)肌醇、硫胺、吡哆醇、对氨基苯甲酸、叶酸、核黄素、和维生素A、B、C、D、和E。参见例如,Alfenore et al.,Improving ethanol production and viability of Saccharomyces cerevisiae by a vitamin feeding strategy during fed-batch process,Springer-Verlag(2002),其在此引入作为参考。矿物质的实例包括可补充营养的矿物质和无机盐,包括P、K、Mg、S、Ca、Fe、Zn、Mn和Cu。
[0319] 回收 从发酵的纤维素物质分离醇类并通过蒸馏的传统方法纯化。可获得纯度达到大约96vol.%乙醇的乙醇,其可用作例如燃料乙醇、饮料乙醇,即可饮用的高纯中性酒精、或工业乙醇。
[0320] 对于其他的有机物质,可使用本领域已知的任何方法,包括但不限于色谱法(例如,离子交换、亲合的、疏水的、色谱聚焦、和大小排阻)、电泳方法(例如,预备性的等电点聚焦)、差异溶解度(例如,硫酸铵沉淀)、SDS-PAGE、蒸馏、或萃取法。
[0321] 在本发明的方法中,分解纤维的蛋白质和纤维素分解增强的多肽可通过一种或多种附加的酶活性补充以增加纤维素物质的降解。优选附加的酶是半纤维素酶、酯酶(例如,脂肪酶、磷脂酶、和/或角质酶)、蛋白酶、漆酶、过氧化物酶、或其混合物。
[0322] 在本发明的方法中,附加的酶可在发酵之前或发酵期间加入,包括在发酵微生物的繁殖期间或之后加入。
[0323] 在此参考的酶可从任何合适的起源,包括细菌、真菌、酵母或哺乳动物起源衍生或得到。术语“获得的”在此是指该酶已经从天然生产该酶作为天然酶的生物体分离。术语“获得的”在此也指该酶可能已经在宿主生物体中重组生产,其中重组生产的酶对于该宿主生物体是天然的或外来的或具有改变的氨基酸序列、例如,具有被缺失、插入和/或取代的一个或多个氨基酸,即重组生产的酶其是突变体和/或天然氨基酸序列的片段或通过本领域已知的核酸改组方法生产的酶。包括在天然酶的含义之内的是天然的变体,并且外来酶含义内的是重组获得,例如通过定点诱变或改组获得的变体。
[0324] 酶也可以是纯化的。术语″纯化的″如在此使用的,涵盖了无来自衍生其的生物体的其他成分的酶。术语″纯化的″也涵盖了无来自获得其的天然生物体的其他成分的酶。该酶可以是纯化的,只伴随存在次要数量的其他蛋白质。措词“其他蛋白质”特别涉及其他的酶。术语″纯化的″如在此使用的,也是指除去其他的成分,特别是其他的蛋白质以及最特别地是存在于本发明酶起源的细胞中的其他酶。酶可以是″基本上纯的″,也就是说无来自生产其的生物体,例如用于重组生产酶的宿主生物体的其他成分。在优选的实施方案中,酶是至少75%(w/w)、优选至少80%、更优选至少85%、更优选至少90%、更优选至少95%、更优选至少96%、更优选至少97%、更优选至少98%、或最优选至少99%纯的。在另一个优选的实施方案中,酶是100%纯的。
[0325] 用于本发明的酶可以是适用于在此所描述的方法的任何形式,例如有或没有细胞的粗制发酵物、干燥粉末或颗粒、无粉尘的颗粒、液体、稳定的液体、或被保护的酶。颗粒可例如,如在美国专利号4,106,991和4,661,452中公开的生产,并且可任选地通过本领域已知的方法被包被。液体酶制剂可例如,根据已建立的方法通过添加稳定剂,例如糖、糖醇或另一种多元醇、和/或乳酸或另一种有机酸而被稳定化。被保护的酶可根据EP 238,216中公开的方法制备。
[0326] 半纤维素酶
[0327] 半纤维素酶的酶促水解可通过多种真菌和细菌进行。与纤维素降解相似,半纤维素水解需要许多酶的协同作用。半纤维素酶可被分为三个总的种类:攻击多糖链内的内在键的内部起作用的酶,从多糖链的还原或非还原末端渐进作用的外部起作用的酶,和水解木质素糖苷键的辅助酶、乙酰酯酶和酯酶,例如香豆酸(coumaric acid)酯酶和阿魏酸酯酶(Wong,K.K.Y.,Tan,L.U.L.,and Saddler,J.N.,1988,Multiplicity of β-1,4-xylanase in microorganisms:Functions and applications,Microbiol.Rev.52:
305-317;Tenkanen,M.,and Poutanen,K.,1992,Significance of esterases in the degradation of xylans,in Xylans and Xylanases,Visser,J.,Beldman,G.,Kuster-van Someren,M.A.,and Voragen,A.G.J.,eds.,Elsevier,New York,NY,203-212;Coughlan,M.P.,and Hazlewood,G.P.,1993,Hemicellulose and hemicellulases,Portland,London,UK;Brigham,J.S.,Adney,W.S.,and Himmel,M.E.,1996,Hemicellulases:Diversity and applications,in Handbook on Bioethanol:Production and Utilization,Wyman,C.E.,ed.,Taylor & Francis,Washington,DC,119-141)。
[0328] 半纤维素酶包括木聚糖酶、阿拉伯呋喃糖酶、乙酰基木聚糖酯酶、葡糖苷酸酶、内半乳聚糖酶、甘露聚糖酶、内或外阿拉伯糖酶、外半乳聚糖酶、及其混合物。内部起作用的半纤维素酶和辅助酶的实例包括内阿拉伯糖酶、内阿拉伯糖半乳聚糖酶、葡聚糖内切酶、甘露聚糖内切酶、木聚糖内切酶、和feraxan木聚糖内切酶。外部起作用的半纤维素酶和辅助酶的实例包括α-L-阿拉伯糖苷酶、β-L-阿拉伯糖苷酶、α-1,2-L-岩藻糖苷酶、α-D-半乳糖苷酶、β-D-半乳糖苷酶、β-D-葡糖苷酶、β-D-葡糖醛酸酶、β-D-甘露糖苷酶、β-D-木糖苷酶、糖苷外切酶、外纤维二糖酶、外甘露二糖水解酶、外甘露聚糖酶、外木聚糖酶、木聚糖α-葡糖醛酸酶、和松柏苷β-葡糖苷酶。 酯酶的实例包括乙酰基酯酶(乙酰基半乳聚糖酯酶、乙酰基甘露聚糖、和乙酰基木聚糖酯酶)和芳基酯酶(香豆酸酯酶和阿魏酸酯酶)。
[0329] 优选地,半纤维素酶是外部起作用的半纤维素酶,以及更优选地,外部起作用的半纤维素酶,其具有在低于pH 7的酸性条件下水解半纤维素的能力。适用于本发明的半纤维TM素酶的实例包括VISCOZYME (可从Novozymes A/S,Denmark商业购买)。半纤维素酶的加入有效量是固体的大约0.001%至大约5.0% wt.,更优选固体的大约0.025%至大约4.0%,以及最优选固体的大约0.005%至大约2.0% wt.。
[0330] 木聚糖酶(E.C.3.2.1.8)可从任何合适的来源获得,包括真菌和细菌生物体,例如曲霉属、Disporotrichum、青霉属、脉孢菌属、镰孢属、木霉属、腐殖菌属、Thermomyces、和芽胞杆菌属。包括木聚糖酶的优选可商品购买的制剂包括
BIOFEED BIO-FEED L、
PENTOPAN BG、 和
HC(Novozymes A/S);和 和 CP(Genencor Int.)。
[0331] 酯酶
[0332] 可用于生物转化纤维素的酯酶包括乙酰基酯酶,例如乙酰基半乳聚糖、乙酰基甘露聚糖酯酶、和乙酰基木聚糖酯酶、和水解木质素糖苷键的酯酶,例如香豆酸酯酶和阿魏酸酯酶。
[0333] 如在此使用的,“酯酶”亦称为羧酸酯水解酶,是指作用于酯键的酶,并且包括根据酶命名法分类在EC 3.1.1羧酸酯水解酶中的酶(Enzyme Nomenclature,1992,Academic Press,San Diego,California,with Supplement 1(1993),Supplement 2(1994),Supplement 3(1995),Supplement 4(1997)and Supplement 5,in Eur.J.Biochem.223:1-5,1994;Eur.J.Biochem.232:1-6,1995;Eur.J.Biochem.237:1-5,1996;Eur.J.Biochem.250:1-6,1997,and Eur.J.Biochem.264:610-650,1999;respectively)。 酯酶的非限制性的实例包括芳基酯酶、三酰基甘油酯酶、乙酰酯酶、乙酰胆碱酯酶、胆碱酯酶、托品酯酶(tropinesterase)、果胶酯酶、固醇酯酶、叶绿素酶、L-阿拉伯糖内酯酶、葡糖酸内酯酶、尿内酯酶、鞣酸酶(tannase)、视黄基棕榈酸酯酶(retinyl-palmitate esterase)、羟基丁酸酯-二聚物水解酶、甘油酯脂肪酶、3-含氧己二酸烯醇-内酯酶、1,
4-内酯酶、半乳糖脂酶、4-吡哆醇内酯酶、酰基肉毒碱水解酶、氨酰基-tRNA水解酶、D-阿拉伯糖内酯酶、6-磷酸葡萄 糖酸内酯酶、磷脂酶A1、6-乙酰基葡萄糖脱乙酰基酶、脂蛋白脂肪酶、二氢香豆素脂肪酶、柠檬苦素-D-环-内酯酶、类固醇-内酯酶、三乙酸酯-内酯酶,放线菌素内酯酶、苔色酸缩酚酸水解酶(orsellinate-depside hydrolase)、头孢菌素-C脱乙酰基酶、氯原酸水解酶(chlorogenate hydrolase)、α-氨基酸酯酶、4-甲基草酰乙酸酯酶、羧基次甲基丁烯羟酸内酯酶(carboxymethylenebutenolidase)、脱氧柠檬酸A-环-内酯酶、2-乙酰基-1-烷基甘油磷酸胆碱酯酶、镰孢氨酸-C鸟氨酸酯酶、芥子碱酯酶、蜡-酯水解酶、佛波醇-二酯水解酶、磷脂酰肌醇脱酰基酶、唾液酸O-乙酰酯酶、乙酰氧基丁酰基二噻吩脱乙酰基酶、乙酰水杨酸脱乙酰基酶、甲基伞形基-乙酸酯脱乙酰基酶(methylumbelliferyl-acetate deacetylase)、2-吡喃酮-4,6-乙基酯内酯酶(2-pyrone-4,6-dicarboxylate lactonase)、N-乙酰基半乳糖单聚糖脱乙酰基酶(N-acetylgalactosaminoglycan deacetylase)、青少年激素酯酶、bis(2-乙基己基)邻苯二甲酸酯酶(bis(2-ethylhexyl)phthalate esterase)、蛋白质-谷氨酸甲基酯酶、11-顺式-视黄基-棕榈酸水解酶、全-反式-视黄基-棕榈酸水解酶、L-鼠李糖-1,4-内酯酶(L-rhamnono-1,4-1actonase)、5-(3,4-二乙酰氧基丁-1-基)-2,2′-联噻吩脱乙酰基酶(5-(3,4-diacetoxybut-l-ynyl)-2,2′-bithiophene deacetylase)、脂肪-酰基-乙基-酯合酶(fatty-acyl-ethyl-ester synthase)、木聚糖-1,4-内酯酶、N-乙酰基葡萄糖胺基磷脂酰肌醇脱乙酰酶(N-acetylglucosaminylphosphatidylinositol deacetylase)、二甲苯西曲酸酯酶(cetraxate benzylesterase)、乙酰基烷基甘油乙酰基水解酶、和乙酰基木聚糖酯酶。
[0334] 用于本发明的优选酯酶是脂肪分解酶,例如脂肪酶(被分类为EC3.1.1.3、EC3.1.1.23、和/或EC 3.1.1.26)和磷酸酯酶(被分类为EC 3.1.1.4和/或EC 3.1.1.32,包括被分类为EC 3.1.1.5的溶血磷脂酶)。其他优选的酯酶是角质酶(被分类为EC
3.1.1.74)。
[0335] 酯酶可以获得改善发酵微生物特性的所需要益处的有效量被加入,例如改变发酵微生物内部和/或外部或发酵微生物细胞膜中的脂类组成/浓度,导致在发酵期间改善溶解物进入和/或离开发酵微生物的移动,和/或提供更多的可代谢能量来源(例如通过转化成分,例如来自玉米底物的油类成为对发酵微生物有用的成分,例如,不饱和脂肪酸和甘油),以增加乙醇产量。有效量酯酶的实例是大约0.01至大约400LU/g DS(干物质)。优选地,酯酶的使用量为大约0.1至大约100LU/g DS,更优选大约0.5至大约 50LU/g DS,以及更优选大约1至大约20LU/g DS。此后酯酶数量的进一步优化可利用本领域已知的标准方法获得。
[0336] 一个脂肪酶单位(LU)是以三丁酸甘油酯作为底物和以阿拉伯树胶作为乳化剂在30摄氏度,pH 7.0(磷酸盐缓冲液)每分钟解放1.0μmol的可滴定脂肪酸的酶量。
[0337] 在优选的实施方案中,酯酶是脂肪分解酶、更优选是脂肪酶。如在此使用的,“脂肪分解酶”是指脂肪酶和磷脂酶(包括溶-磷脂酶)。脂肪分解酶优选是微生物起源的,特别是细菌、真菌或酵母起源。所使用的脂肪分解酶可来源于任何来源,包括例如,腐化米霉菌(Absidia)的菌株,特别是Absidia blakesleena和Absidia corymbifera,无色杆菌属(Achromobacter)的菌株,特别是Achromobacter iophagus,产气单孢菌属(Aeromonas)的菌株,链格孢属(Alternaria)的菌株,特别是Alternaria brassiciola,曲霉属的菌株,特别是黑曲霉、米曲霉、烟曲霉、和黄曲霉(Aspergillus flavus)、无色杆菌属的菌株,特别是Achromobacter iophagus,短梗霉属(Aureobasidium)的菌株,特别是出芽短梗霉(Aureobasidium pullulans),芽胞杆菌属的菌株,特别是短小芽胞杆菌(Bacillus pumilus)、嗜热脂肪芽孢杆菌、和枯草芽孢杆菌,Beauveria的菌株,Brochothrix的菌株,特别是Brochothrix thermosohata,假丝酵母的菌株,特别是Candida cylindracea(皱褶假丝酵母)、Candida paralipolytica、和南极假丝酵母(Candida Antarctica),Chromobacter的菌株,特别是Chromobacter viscosum,鬼伞属(Coprinus)的菌株,特别是灰盖鬼伞(Coprinus cinereus),镰孢属的菌株,特别是禾谷镰孢、尖孢镰孢、腐皮镰孢(Fusarium solani)、豌豆腐皮镰孢(Fusarium solani pisi)、Fusarium roseum culmorum、和Fusarium venenatum,Geotricum的菌株、特别是Geotricum penicillatum,汉逊氏酵母属(Hansenula)的菌株,特别是异常汉逊氏酵母(Hansenula anomala),腐殖菌属(Humicola)的菌株,特别是Humicola brevispora、Humicola brevis var.thermoidea,和Humicola insolens,Hyphozyma的菌株,乳杆菌属(Lactobacillus)的菌株,特别是Lactobacillus curvatus,Metarhizium的菌株,毛霉属的菌株,拟青霉属(Paecilomyces)的菌株,青霉属(Penicillium)的菌株,特别是圆弧青霉(Penicillium cyclopium)、Penicillium crustosum和扩展青霉(Penicillium expansum),假单胞菌属(Pseudomonas)的菌株,特别是绿脓假单胞菌(Pseudomonas aeruginosa)、产碱假单胞菌(Pseudomonas alcaligenes)、洋葱假单胞菌(Pseudomonas cepacia)(同义为,Burkholderia cepacia)、荧 光 假 单 胞 菌 (Pseudomonas fluorescens)、Pseudomonas fragi、Pseudomonas maltophilia、门多萨假单胞菌(Pseudomonas mendocina)、Pseudomonas mephitica lipolytica、产碱假单胞菌、Pseudomonas plantari、类产碱假单胞菌(Pseudomonas pseudoalcaligenes)、恶臭假单胞菌(pseudomonas putida)、施氏假单胞菌(Pseudomonas stutzeri)、和Pseudomonas wisconsinensis,Rhizooctonia的菌株,特别是Rhizooctonia solani,根毛霉属(Rhizomucor)的菌株,特别是米黑根毛霉(Rhizomucor miehei),根霉属(Rhizopus)的菌株,特别是Rhizopus japonicus、小孢根霉(Rhizopus microsporus)、和结节根霉(Rhizopus nodosus),红冬孢酵母属(Rhodosporidium)的菌株,特别是念珠状红冬孢酵母(Rhodosporidium toruloides)、红酵母属(Rhodotorula)的菌株,特别是粘红酵母(Rhodotorula glutinis),掷孢酵母属(Sporobolomyces)的菌株,特别是Sporobolomyces shibatanus,Thermomyces的菌株,特别是Thermomyces lanuginosus(以前为Humicola lanuginosa)、Thiarosporella的菌株,特别是Thiarosporella phaseolina,木霉属的菌株,特别是哈茨木霉和里氏木霉,和/或轮枝孢菌属(Verticillium)的菌株。
[0338] 在优选的实施方案中,脂肪分解酶来源于曲霉属、无色杆菌属、芽胞杆菌属、假丝酵母属、Chromobacter、镰孢属、腐殖菌属、Hyphozyma、假单胞菌属、根毛霉、根霉,或Thermomyces的菌株。
[0339] 在更优选的实施方案中,脂肪分解酶是脂肪酶。在此脂肪酶可由于其能改变发酵培养基(包括发酵酵母)中,例如由玉米底物产生的甘油三酸酯油类和脂肪的结构和组成的能力而被应用。脂肪酶催化不同类型的甘油三酸酯转化,例如水解、酯化作用和酯基转移作用。如本领域众所周知的,合适的脂肪酶包括酸性、中性、和碱性的脂肪酶,尽管酸性的脂肪酶(例如,可从Amano商业购买的脂肪酶GAMANO 50)在更低浓度的脂肪酶时与中性或碱性脂肪酶相比似乎是更有效的。用于本发明的优选脂肪酶包括Candida antarcitca脂肪酶和Candida cylindracea脂肪酶更优选的脂肪酶是纯化的脂肪酶,例如Candida antarcitca脂肪酶(脂肪酶A)、Candida antarcitca脂肪酶(脂肪酶B)、Candida cylindracea脂肪酶、和Penicillium camembertii脂肪酶。
[0340] 脂肪酶可以是在EP 258,068-A中公开的脂肪酶,或可以是脂肪酶变体,例如在WO00/60063或WO 00/32758中公开的变体,其在此引入作为参考。优选的可商业购买的脂肪TM TM TM
酶包括LECITASE 、LIPOLASE 、和LIPEX (可从Novozymes A/S,Denmark商业购买)和G TM
AMLANO 50(可从Amano商业购买)。
[0341] 优选地脂肪酶的使用量为大约1至大约400LU/g DS,优选大约1至大约10LU/g DS,以及更优选大约1至大约5LU/g DS。
[0342] 在本发明另一个优选的实施方案中,酯酶是角质酶。角质酶是能够降解角质的酶。角质酶可来源于任何来源。在优选的实施方案中,角质酶来源于曲霉属的菌株,特别是米曲霉,链格孢属的菌株,特别是Alternaria brassiciola,镰孢属的菌株,特别是腐皮镰孢、豌豆腐皮镰孢、Fusarium roseum culmorum、或Fusarium roseum sambucium,Helminthosporum的菌株,特别是Helminthosporum sativum,腐殖菌属的菌株,特别是Humicola insolens,假单胞菌属的菌株,特别是门多萨假单胞菌或恶臭假单胞菌,Rhizooctonia的菌株,特别是Rhizooctonia solani,链霉菌属的菌株,特别是疮痂病链霉菌(Streptomyces scabies),或Ulocladium的菌株,特别是Ulocladium consortiale。在最优选的实施方案中,角质酶来源于Humicola insolens的菌株,特别是菌株Humicola insolens DSM 1800。Humicola insolens角质酶在WO 96/13580中有描述,其在此引入作为参考。角质酶可以是变体,例如在WO 00/34450和WO 01/92502中公开的变体之一,其在此引入作为参考。优选的角质酶变体包括在WO 01/92502的实施例2中列出的变体,其在此具体地引入作为参考。酯酶的有效量为大约0.01至大约400LU/g DS,优选大约0.1至大约100LU/g DS,以及更优选大约1至大约50LU/g DS。此后角质酶数量的进一步优化可利用本领域已知的标准方法获得。
[0343] 在另一个优选的实施方案中,酯酶是磷脂酶。如在此使用的,术语“磷脂酶”是对磷脂具有活性,例如水解活性的酶。磷脂,例如卵磷脂或磷脂酰胆碱,由在外部(sn-1)和中间(sn-2)位置用两个脂肪酸酯化和在第三位用磷酸酯化的甘油组成。磷酸可被酯化为氨基醇。可鉴别几种类型的磷脂酶活性,包括水解一个脂酰基(分别在sn-1和sn-2位)以形成溶血磷脂的磷脂酶A1和A2;和水解溶血磷脂中保留的脂酰基的溶血磷脂酶(或磷脂酶B)。磷脂酶C和磷脂酶D(磷酸二酯酶)分别释放二酰基甘油或磷脂酸。
[0344] 术语“磷脂酶”包括具有磷脂酶活性,例如磷脂酶A(A1或A2),磷脂酶B活性,磷脂酶C活性,或磷脂酶D活性的酶。术语“磷脂酶A”如在此使用的,是指涵盖具有磷脂酶A1和/或磷脂酶A2活性的酶。磷脂酶活性可由同时具有其他活性的酶,例如具有磷脂酶活性的脂肪酶来提供。磷脂酶 活性可例如来自于具有磷脂酶副活性的脂肪酶。在其他的实施方案中,磷脂酶的酶活性由基本上只具有磷脂酶活性,并且其中该磷脂酶的酶活性不是副活性的酶提供。
[0345] 磷脂酶可以是任何起源的,例如动物来源(例如哺乳动物,例如或猪的胰腺),或蛇毒或蜂毒起源。备选地,磷脂酶可以是微生物起源的,例如来自丝状真菌、酵母或细菌,例如曲霉属,例如泡盛曲霉、臭曲霉、日本曲霉、黑曲霉或米曲霉,Dictyostelium,例如,D.discoideum;镰孢属,例如,大刀镰孢、禾谷镰孢、异孢镰孢、腐皮镰孢、尖孢镰孢、或F.venenatum;毛霉属,例如M.javanicus,M.mucedo、或M.subtilissimus;链孢霉属,例如,粗糙链孢霉;根毛霉属,例如R.pusillus;根霉属,例如,R.arrhizus,R.japonicus、或 R.stolonifer;Sclerotinia,例 如 S.libertiana;Trichophyton,例 如,T.rubrum;Whetzelinia,例如,W.sclerotiorum;芽孢杆菌属,例如,巨大芽孢杆菌或枯草芽孢杆菌;柠檬酸细菌属(Citrobacter),例如,C.freundii;肠道杆菌属,例如,产气肠杆菌(E.aerogenes)或E.cloacae;爱德华氏菌属(Edwardsiella),E.tarda;Erwinia,例如,E.herbicola;埃希氏杆菌属,例如,大肠杆菌;克雷伯氏杆菌属(Klebsiella),例如,炎克雷伯氏杆菌(Klebsiella pneumoniae);变形杆菌(Proteus),例如,P.vulgaris;
Providencia,例如,P.stuartii;沙门氏菌属(Salmonella),例如,S.typhimurium;沙雷氏菌属(Serratia),例如,S.liquefasciens,S.marcescens;志贺氏杆菌属(Shigella),例如,S.flexneri;链霉菌属,例如,S.violeceoruber;或耶尔森氏(Yersinia)菌属,例如,Y.enterocolitica。
[0346] 优选的可商业购买的磷脂酶包括LECITASETM和LECITASETM ULTRA(可从Novozymes A/S,Denmark商业购买)。
[0347] 磷脂酶的有效量为大约0.01至大约400LU/g DS,优选大约0.1至大约100LU/g DS,以及更优选大约1至大约50LU/g DS。此后磷脂酶数量的进一步优化可利用本领域已知的标准方法获得。
[0348] 蛋白酶
[0349] 在本发明的另一个优选实施方案中,产生酶的至少一种表面活性剂和至少一种碳水化合物与至少一种蛋白酶组合使用。可使用该蛋白酶例如,消化蛋白质来生产游离的氨基氮(FAN)。这种游离的氨基酸起酵母营养物的作用,由此增加酵母的生长并且因此增加乙醇的生产。
[0350] 用于发酵过程的发酵微生物可通过在存在至少一种蛋白酶时繁殖发酵 微生物来生产。尽管不限于任何一个操作原理,认为当该发酵微生物随后被用于发酵方法时,伴随有效量的至少一种蛋白酶的发酵微生物的繁殖与在相同条件下没有加入该蛋白酶而繁殖的发酵微生物相比减少了发酵微生物的延迟时间。增长过程中蛋白酶的作用被认为直接或间接地导致分别在发酵期间对发酵微生物有害或有益的基因的抑制或表达,由此减少延迟时间并产生更快速的发酵循环。
[0351] 蛋白酶是本领域已知的,并且是指催化肽键断裂的酶。合适的蛋白酶包括真菌和细菌蛋白酶。优选的蛋白酶是酸性蛋白酶,即,特征在于在低于pH 7的酸性条件下能够水解蛋白质的蛋白酶。合适的酸性真菌蛋白酶包括,来源于曲霉属、毛霉属、根霉属、假丝酵母属、采绒革盖菌(Coriolus)、Endothia、Enthomophtra、Irpex、青霉属、Sclerotium、和球拟酵母属(Torulopsis)的真菌蛋白酶。特别关注的是来源于黑曲霉(参见例如,Koaze et al.,1964,Agr.Biol.Chem.Japan 28:216)、Aspergillus saitoi(参见例如,Yoshida,1954,J.Agr.Chem.Soc.Japan 28:66)、泡盛曲霉(Hayashida et al.,1977,Agric.Biol.Chem.42:927-933、棘孢曲霉(WO 95/02044)、或米曲霉的蛋白酶;和来自Mucor pusillus或米赫毛霉(Mucor miehei)的酸性蛋白酶。
[0352] 不是酸性蛋白酶的细菌蛋白酶包括可商业购买的产品ALCALASETM和TM
NEUTRASE (可从Novozymes A/S获得)。其他的蛋白酶包括来自Genencor International,TM
Inc.,USA的GC106和来自Novozymes A/S的NOVOZYM 50006。
[0353] 优选地,蛋白酶是天冬氨酸蛋白酶,如在例如Handbook of Proteolytic Enzymes,Edited by A.J.Barrett,N.D.Rawlings and J.F.Woessner,Academic Press,San Diego,1998,Chapter 270)中所描述的。天冬氨酸蛋白酶的合适实例包括例如,由Berka et al.,1990,Gene 96:313;Berka et al.,1993,Gene 125:195-198;and Gomi et al.,1993,Biosci.Biotech.Biochem.57:1095-1100中所公开的。
[0354] 过氧化物酶
[0355] 具有过氧化物酶活性的其他化合物可以是任何过氧化物酶(EC1.11.1.7),或由此衍生的具有过氧化物酶活性,显示过氧化物酶活性的任何片段。
[0356] 优选地,过氧化物酶由植物(例如,辣根或大豆过氧化物酶)或例如真菌或细菌的微生物生产。
[0357] 一些优选的真菌包括属于半知菌亚门(subdivision Deuteromycotina)、丝孢菌纲(class Hyphomycetes)的菌株,例如镰孢属、腐殖菌属、Tricoderma、漆斑菌属(Myrothecium)、Verticillum、Arthromyces、Caldariomyces、Ulocladium、Embellisia、芽枝霉属(Cladosporium)、或Dreschlera,特别是尖孢镰孢(DSM 2672)、Humicola insolens、里氏木霉、Myrothecium verrucaria(IFO 6113)、Verticillum alboatrum、Verticillum dahlie、Arthromyces ramosus(FERM P-7754)、Caldariomyces fumago、Ulocladium chartarum、Embellisia alli、或Dreschlera halodes。
[0358] 其他优选的真菌包括属于担子菌亚门(Basidiomycotina),担子菌纲(Basidiomycetes)的菌株,例如,鬼伞属(Coprinus)、Phanerochaete、采绒革盖菌、或Trametes,特别是 灰盖鬼 伞f.microsporus(IFO 8371)、Coprinus macrorhizus、Phanerochaete chrysosporium(例如NA-12)、或Trametes(先前称为多孔菌),例如T.versicolor(例如,PR428-A)。
[0359] 进一步优选的真菌包括属于接合菌亚门(Zygomycotina),Mycoraceae纲的菌株的菌株,例如根霉属或毛霉属,特别是Mucor hiemalis。
[0360] 一些优选的细菌包括放线菌目(order Actinomycetales)的菌株,例如球状链霉菌(Streptomyces sphereoides)(ATTC 23965)、Streptomyces thermoviolaceus(IFO12382)、或Streptoverticillum verticillium ssp.verticillium。
[0361] 其他优选的细菌包括Rhodobacter sphaeroides、Rhodomonas palustri、乳链球菌(Streptococcus lactis)、Pseudomonas purrocinia(ATCC 15958)、荧光假单胞菌(NRRL B-11)、和芽胞杆菌属菌株,例如,短小芽胞杆菌(ATCC12905)和嗜热脂肪芽孢杆菌。
[0362] 进一步优选的细菌包括属于粘球菌属(Myxococcus)的菌株,例如,M.virescens。
[0363] 过氧化物酶也可以是通过包括在培养基中,在容许过氧化物酶表达的条件下培养用携带编码过氧化物酶的DNA序列以及用于表达编码过氧化物酶的DNA序列的DNA序列的重组DNA载体转化的宿主细胞和从该培养物回收过氧化物酶的方法生产的。
[0364] 在优选的实施方案中,重组生产的过氧化物酶是根据WO 92/16634来源于鬼伞属,特别是C.macrorhizus或灰盖鬼伞的过氧化物酶。
[0365] 在本发明中,具有过氧化物酶活性的化合物包括过氧化物酶和来源于 细胞色素、血红蛋白、或过氧化物酶的过氧化物酶活性片段。
[0366] 一个过氧化物酶单位(POXU)是在下列条件下,于30℃,在0.1M磷酸盐缓冲液pH 7.0,0.88mM过氧化氢,和1.67mM 2,2’-连氮基-bis(3-乙基苯并噻吩
(ethylbenzothiazoline)-6-磺酸酯(sulfonate))(ABTS)中每分钟催化1μmole过氧化氢转化的酶量。追踪反应60秒(混合后15秒),在418nm处吸光率变化应在0.15至0.30的范围内。为了计算活性使用氧化的ABTS为36mM-1 cm-1的吸收系数和每2μmole ABTS氧化有1μmole H2O2转化的化学当量(stochiometry)。
[0367] 漆酶
[0368] 在本发明中,漆酶和漆酶相关的酶包括被分类为EC 1.10.3.2的任何漆酶、被分类为EC 1.10.3.1的任何儿茶酚氧化酶、被分类为EC 1.3.3.5的任何胆红素氧化酶、或被分类为EC 1.14.18.1的任何单酚单加氧酶。
[0369] 上述的酶可以是微生物的,即从细菌或真菌(包括丝状真菌和酵母)获得的,或它们可来源于植物。
[0370] 来自真菌的合适实例包括从曲霉属、脉孢菌属,例如,N.crassa,Podospora,Botrytis,Collybia,Fomes,Lentinus,Pleurotus,Trametes,例 如,T.villosa 和 T. versicolor,Rhizooctonia,例如,R.solani,Coprinus,例如,C.cinereus,C.comatus,C.friesii,和 C.plicatilis,Psathyrella,例 如,P.condelleana,Panaeolus, 例如,P.papilionaceus,Myceliophthora,例 如,M.thermophila,Schytalidium,例 如,S.thermophilum,Polyporus,例 如,P.pinsitus,Pycnoporus,例 如,P.cinnabarinus,Phlebia,例如,P.radita(WO 92/01046),或采绒革盖菌,例如,毛革盖菌(JP 2-238885)的菌株获得的漆酶。
[0371] 来自细菌的合适实例包括从芽胞杆菌属菌株获得的漆酶。
[0372] 获 得 自Coprinus、Myceliophthora、Polyporus、Pycnoporus、Scytalidium 或Rhizoctonia的漆酶是优选的;特别是获得自灰盖鬼伞,Myceliophthora thermophila,Polyporus pinsitus,Pycnoporus cinnabarinus,Scytalidium thermophilum、 或Rhizoctonia solani的漆酶。
[0373] 可商业购买的漆酶是NS51001(Polyporus pinsitius漆酶,获得自Novozymes A/S,Denmark)和NS51002(Myceliopthora thermophila的漆酶,获得自Novozymes A/S,Denmark)。
[0374] 漆酶或漆酶相关的酶也可以是通过包括在培养基中,在容许漆酶表达的条件下培养用携带编码漆酶的DNA序列以及用于表达编码漆酶的DNA 序列的DNA序列的重组DNA载体转化的宿主细胞,和从该培养物回收漆酶的方法生产的。
[0375] 漆酶活性(LACU)是在好气条件下,在pH 5.5从syringaldazin的氧化测定的。产生的紫色在530nm处以分光计计量。分析条件是19mM syringaldazin,23mM乙酸酯缓冲液,pH 5.5,30℃,1分钟反应时间。一个漆酶单位(LACU)是在上述条件下每分钟催化
1.0μmole syringaldazin转化的酶量。
[0376] 漆酶活性(LACU)是在好气条件下,在pH 7.5从syringaldazin的氧化测定的。产生的紫色在530nm处以分光计计量。分析条件是19mM syringaldazin,23mM Tris/马来酸酯pH 7.5,30℃,1分钟反应时间。一个漆酶单位(LACU)是在上述条件下每分钟催化
1.0μmole syringaldazin转化的酶量。
[0377] 本发明的多肽可用于结合上述记录的酶或分解纤维素的蛋白质以进一步降解生物质底物的纤维素成分,(参见例如,Brigham et al.,1995,in Handbook on Bioethanol(Charles E.Wyman,editor),pp.119-141,Taylor &Francis,Washington D.C.;Lee,1997,Journal of Biotechnology 56:1-24)。
[0378] 本发明的多肽可用于结合上述记录的酶和/或分解纤维素的蛋白质以进一步降解生物质底物的纤维素成分,(参见例如,Brigham et al.,1995,in Handbook on Bioethanol(Charles E.Wyman,editor),pp.119-141,Taylor &Francis,Washington D.C.;Lee,1997,Journal of Biotechnology 56:1-24)。
[0379] 具有纤维素分解增强活性的多肽和分解纤维蛋白质的最适宜数量取决于几个因素,包括但不限于,组成酶的混合物、纤维素底物、纤维素底物的浓度、纤维素底物的预处理、温度、时间、pH、和包含的发酵生物(例如,用于SSF的酵母)。
[0380] 在优选的方面,对纤维素物质具有纤维素分解增强活性的多肽的有效量是每g纤维素物质大约0.01至大约2.0mg,优选大约0.025至大约1.5mg,更优选大约0.05至大约1.25mg,更优选大约0.075至大约1.25mg,更优选大约0.1至大约1.25mg,更优选大约0.15至大约1.25mg,以及最优选大约0.25至大约1.0mg。
[0381] 在另一个优选的方面,对纤维素物质的分解纤维蛋白质的有效量是每g纤维素物质大约0.5至大约50mg,优选大约0.5至大约40mg,更优选大 约0.5至大约25mg,更优选大约0.75至大约20mg,更优选大约0.75至大约15mg,更优选大约0.5至大约10mg,以及最优选大约2.5至大约10mg。
[0382] 在优选的方面,对分解纤维蛋白质具有纤维素分解增强活性的多肽的有效量是每g分解纤维的蛋白质大约0.005至大约1.0g,优选大约0.01至大约1.0g,更优选大约0.15至大约0.75g,更优选大约0.15至大约0.5g,更优选大约0.1至大约0.5g,更优选大约0.1至大约0.5g,以及最优选大约0.05至大约0.2g。
[0383] 清洁剂组合物
[0384] 本发明具有分解纤维增加活性的多肽可被加入清洁剂组合物并因此成为清洁剂组合物的组分。
[0385] 本发明的清洁剂组合物可配制为例如手洗或机洗的洗衣店清洁剂组合物,其包括适于染色织物的洗涤添加剂组合物和漂洗添加的织物软化剂组合物,或配制为用于普通家庭坚硬表面清洗操作的清洁剂组合物,或配制用于手洗或机器洗涤的操作。
[0386] 在特定的方面,本发明提供包括本发明多肽的去垢添加剂。去垢添加剂以及清洁剂组合物可包括一种或多种酶,例如蛋白酶、脂肪酶、角质酶、淀粉酶、碳水化合物分解酶、纤维素酶、果胶酶、甘露聚糖酶、阿拉伯糖酶、半乳聚糖酶、木聚糖酶、氧化酶,例如漆酶、和/或过氧化物酶。
[0387] 一般说来,所选择的酶的特性应与所选择的清洁剂相适合,(即,最适pH、与其他酶促和非酶促成分的相容性等),并且该酶应以有效量存在。
[0388] 纤维素酶:合适的纤维素酶包括细菌或真菌起源的纤维素酶。也包括化学改变的或蛋白质工程化的突变体。合适的纤维素酶包括来自芽胞杆菌属、假单胞菌属、腐殖菌属、镰孢属、Thielavia、支顶孢属的纤维素酶,例如,在US 4,435,307、US 5,648,263、US5,691,178、US 5,776,757和WO89/09259中公开的从Humicola insolens、Myceliophthora thermophila和尖孢镰孢产生的真菌纤维素酶。
[0389] 特别合适的纤维素酶是具有颜色关注好处的碱性或中性的纤维素酶。这种纤维素酶的实例是在EP 0495257、EP 0531372、WO 96/11262、WO96/29397、WO 98/08940中描述的纤维素酶。其他的实例是例如在WO94/07998、EP 0531315、US 5,457,046、US 5,686,593、US 5,763,254、WO95/24471、WO 98/12307和PCT/DK98/00299中描述的纤维素酶变体。
[0390] 可商业购买的纤维素酶包括CelluzymeTM、和CarezymeTM(Novozymes A/S)、TM TM TMClazinase 、和 Puradax HA (Genencor International Inc.)、和 KAC-500(B) (Kao Corporation)。
[0391] 蛋白酶:合适的蛋白酶包括动物、植物或微生物起源的蛋白酶。微生物起源是优选的。也包括化学改变的或蛋白质工程化的突变体。蛋白酶可以是丝氨酸蛋白酶或金属蛋白酶,优选碱性的微生物蛋白酶或胰蛋白酶-样蛋白酶。碱性蛋白酶的实例是枯草杆菌蛋白酶,特别是来源于芽孢杆菌,例如,枯草杆菌蛋白酶Novo、枯草杆菌蛋白酶Carlsberg、枯草杆菌蛋白酶309、枯草杆菌蛋白酶147和枯草杆菌蛋白酶168(在WO 89/06279中有描述)。胰蛋白酶-样蛋白酶的实例是胰蛋白酶(例如,猪或牛起源的)以及在WO 89/06270和WO
94/25583中描述的镰孢属蛋白酶。
[0392] 有用蛋白酶的实例是在WO 92/19729、WO 98/20115、WO 98/20116、和WO98/34946中描述的变体,特别是在下列的一个或多个位置具有取代的变体:27、36、57、76、
87、97、101、104、120、123、167、170、194、206、218、222、224、235、和274。
[0393] 优选的可商业购买的蛋白酶包括AlcalaseTM、SavinaseTM、PrimaseTM、DuralaseTM、TM TM TM TM TM TMEsperase 、和Kannase (Novozymes A/S)、Maxatase 、Maxacal 、Maxapem 、Properase 、TM TM TM TM
Purafect 、Purafect OxP 、FN2 、和FN3 (Genencor International Inc.)。
[0394] 脂肪酶:合适的脂肪酶包括细菌或真菌起源的脂肪酶。也包括化学改变的或蛋白质工程化的突变体。有用脂肪酶的实例包括来自腐殖菌属(同义于Thermomyces)的脂肪酶,例如,如在EP 258 068中描述的来自H.lanuginosa(T.lanuginosus),或如在WO96/13580中描述的来自H.insolens,例如来自P.alcaligenes或P.pseudoalcaligenes(EP
218 272)、P.cepacia(EP331 376)、P.stutzeri(GB 1,372,034)、P.fluorescens、Pseudomonas sp. 菌 株 SD 705(WO 95/06720 和 WO 96/27002)、P.wisconsinensis(WO
96/12012)、芽孢杆菌脂肪酶,例如,来自枯草芽孢杆菌(Dartois et al.,1993,Biochemica et Biophysica Acta,1131:253-360)、嗜热脂肪芽孢杆菌(JP 64/744992)或B.pumilus(WO 91/16422)。
[0395] 其他的实例是在例如WO 92/05249,WO 94/01541,EP 407 225,EP 260105,WO 95/35381,WO 96/00292,WO 95/30744,WO 94/25578,WO 95/14783,WO 95/22615,WO97/04079和WO 97/07202中描述的脂肪酶变体。
[0396] 优选的可商业购买的脂肪酶包括LipolaseTM和Lipolase UltraTM(Novozymes A/S)。
[0397] 淀粉酶:合适的淀粉酶(α和/或β)包括细菌或真菌起源的淀粉酶。也包括化学改变的或蛋白质工程化的突变体。淀粉酶包括,例如,从芽孢杆菌获得的α-淀粉酶,例如在GB 1,296,839中详细描述的地衣芽孢杆菌的特定菌株。
[0398] 有用淀粉酶的实例是在WO 94/02597、WO 94/18314、WO 96/23873、和WO97/43424中描述的变体,特别是在下列位置具有一个或多个取代的变体:15、23、105、106、
124、128、133、154、156、181、188、190、197、202、208、209、243、264、304、305、391、408 和
444。
[0399] 可商业购买的淀粉酶是DuramylTM、TermamylTM、FungamylTM和BANTM(Novozymes A/TM TMS)、Rapidase 和Purastar (来自Genencor International Inc.)。
[0400] 过氧化物酶/氧化酶:合适的过氧化物酶/氧化酶包括植物、细菌或真菌起源的酶。也包括化学改变的或蛋白质工程化的突变体。有用的过氧化物酶的实例包括来自鬼伞属,例如,来自灰盖鬼伞的过氧化物酶,以及如在WO 93/24618、WO 95/10602、和WO98/15257中描述的其变体。
[0401] 可商业购买的过氧化物酶包括GuardzymeTM(Novozymes A/S)。
[0402] 清洁剂酶可通过添加包含一种或多种酶的单独的添加剂,或通过添加包括所有这些酶的组合添加剂而包括在清洁剂组合物内。本发明的去垢添加剂,即,单独的添加剂或组合添加剂,可配制为例如颗粒、液体、浆液等。优选的去垢添加剂制剂是颗粒,特别是无粉尘的颗粒、液体,特别是稳定的液体或浆液。
[0403] 可例如,如在US 4,106,991和4,661,452中所公开的来生产无粉尘的颗粒,并且可任选地通过本领域已知的方法包被。蜡状包被材料的实例是平均摩尔重量为1000至20000的聚(环氧乙烷)产品(聚乙二醇,PEG);具有16至50个环氧乙烷单位的乙氧基壬基酚;其中醇类包含12至20个碳原子并且其中存在15至80个环氧乙烷单位的乙氧基脂肪醇;脂肪醇;脂肪酸;以及脂肪酸的单-和二-和甘油三酸酯。适用于通过流化床技术应用的成膜包被材料的实例在GB 1483591中给出。液体酶制剂可例如,根据已建立的方法 通过添加多元醇,例如丙二醇、糖或糖醇,乳酸或酸而被稳定化。被保护的酶可根据EP
238,216中公开的方法制备。
[0404] 本发明的清洁剂组合物可以是任何便利的形式,例如条状、片剂、粉剂、颗粒、糊剂或液体。液体洗涤剂可以是含水的,一般包含达到70%的水和0-30%的有机溶剂,或是无水的。
[0405] 清洁剂组合物包括一种或多种表面活性剂,其可以是非离子的,包括半极性的和/或阴离子的和/或阳离子的和/或两性离子的。表面活性剂一般按重量计算以0.1%至60%的水平存在。
[0406] 当包括在其中时,清洁剂通常包含大约1%至大约40%的阴离子表面活性剂,例如线性的烷基苯磺酸酯、α-烯磺酸酯、烷基硫酸酯(脂肪醇硫酸酯)、脂肪醇乙氧基硫酸酯、次级烷基磺酸盐(secondary alkanesulfonate)、α-磺基脂肪酸甲酯、烷基或烯基琥珀酸、或肥皂。
[0407] 当包括在其中时,清洁剂通常包含大约0.2%至大约40%的非离子型表面活性剂,例如脂肪醇乙氧基化合物、羟乙基壬基酚酯、烷基多糖苷、烷基二甲基胺氧化物、乙氧基脂肪酸单乙醇胺(monoethanolamide)、脂肪酸乙醇胺、多羟基烷基脂肪酸酰胺、或葡糖胺的N-酰基N-烷基衍生物(“葡萄糖胺”)。
[0408] 清洁剂可包含0-65%的洗涤剂增效助剂或络合剂,例如沸石、二磷酸酯(盐)、三磷酸酯(盐)、磷酸酯(盐)、碳酸酯(盐)、柠檬酸酯(盐)、次氮基三乙酸、乙二胺四乙酸、二亚乙基三胺五乙酸、烷基-或烯基琥珀酸、可溶性酸盐、或分层(layered)的硅酸盐(例如,来自Hoechst的SKS-6)。
[0409] 清洁剂可包括一种或多种聚合物。实例是羧甲基纤维素、聚(乙烯基吡硌烷酮)、聚(乙二醇)、聚(乙烯醇)、聚(乙烯吡啶-N-氧化物)、聚(乙烯基咪唑)、聚羧化物,例如聚丙烯酸酯、马来酸/丙烯酸酯类(acrylic acid)共聚物、和甲基丙烯酸月桂酯/丙烯酸酯类共聚物。
[0410] 清洁剂(detergent)可包含可能包括例如过硼酸盐或过碳酸盐的H2O2来源的漂白系统,其可与形成过酸的漂白活化剂,例如四乙酰基乙二胺或壬酰基苯酚磺酸酯相组合。备选地,该漂白系统可包括例如酰胺、酰亚胺、或砜类型的过氧酸。
[0411] 本发明的清洁剂组合物的酶可利用传统的稳定剂被稳定,例如,多元醇,例如丙二醇或丙三醇,糖或糖醇,乳酸,硼酸,或硼酸衍生物,例如,芳香族硼酸酯,或苯基硼酸衍生物,例如4-甲酰苯基硼酸,而且该组合物可如例如WO 92/19709和WO 92/19708中所描述的配制。
[0412] 该清洁剂也可包含其他传统的清洁剂成分,例如织物调节剂,包括粘土、发泡剂、抑泡剂(subs suppressors)、抗腐蚀剂、污垢悬浮剂、抗污垢再沉积试剂、染料、杀菌剂、光增白剂(optical brighteners)、水溶助长剂(hydrotropes)、晦暗抑制剂(tamish inhibitor)、或芳香剂。
[0413] 在清洁剂组合物中,任何酶可以相当于每升洗涤液0.01-100mg酶蛋白,优选每升洗液0.05-5mg酶蛋白,特别是每升洗液0.1-1mg酶蛋白的数量添加。
[0414] 在清洁剂组合物中,本发明的具有分解纤维增加活性的多肽可以相当于每升洗涤液0.001-100mg蛋白质,优选0.005-50mg蛋白质,更优选0.01-25mg蛋白质,更优选0.05-10mg蛋白质,最优选0.05-5mg蛋白质,以及最优选0.01-1mg蛋白质的数量添加。
[0415] 本发明具有分解纤维增加活性的多肽也可被掺入WO 97/07202中公开的清洁剂配方,其在此引入作为参考。
[0416] 其他用途
[0417] 一般说来,任何植物细胞壁材料的处理可通过补充本发明的具有分解纤维增加活性的多肽来增强。
[0418] 信号肽
[0419] 本发明也涉及包括编码蛋白质的基因的核酸构建体,其中该基因可操作地连接编码由SEQ ID NO:2的第1至19位氨基酸组成的信号肽的由SEQ ID NO:1的第241至1331位核苷酸组成的核酸序列、编码由SEQ ID NO:4的第1至17位氨基酸组成的信号肽的SEQ ID NO:3的第47至97位核苷酸、编码由SEQ ID NO:6的第1至19位氨基酸组成的信号肽的SEQ ID NO:5的第69至125位核苷酸、编码由SEQ ID NO:8的第1至18位氨基酸组成的信号肽的SEQ ID NO:7的第1至54位核苷酸、或编码由SEQ ID NO:10的第1至19位氨基酸组成的信号肽的SEQ ID NO:9的第1至57位核苷酸核酸序列,其容许蛋白质分泌进入培养基,其中该基因对于核酸序列是外源的。
[0420] 本发明也涉及包括这种核酸构建体的重组表达载体和重组宿主细胞。
[0421] 本发明也涉及用于生产蛋白质的方法,包括(a)在适于生产该蛋白质的条件下培养这种重组宿主细胞;以及(b)回收该蛋白质。
[0422] 蛋白质对于宿主细胞可以是天然的或异源的。术语“蛋白质”在此不是意味着是指特定长度的编码产物,并且因此包括肽、寡肽、和蛋白质。术语“蛋 白质”也包括组合形成编码产物的两个或多个多肽。该蛋白质也包括杂合的多肽,其包括从至少两个不同的蛋白质获得的部分或完全的多肽序列的组合,其中一个或多个蛋白质对于宿主细胞可以是异源的或天然的。蛋白质进一步包括上述蛋白质和杂合蛋白的天然存在的等位的和工程化的变异。
[0423] 优选地,蛋白质是激素或其变体、酶、受体或其部分、抗体或其部分、或报告子。在更优选的方面,蛋白质是氧化还原酶、转移酶、水解酶、裂解酶、异构酶或连接酶。在更优选的方面,蛋白质是氨肽酶、淀粉酶、碳水化物分解酶、羧肽酶、过氧化氢酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变位酶、氧化酶、果胶分解酶、过氧化物酶,肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。
[0424] 基因可从任何原核的、真核的、或其他的来源获得。
[0425] 本发明通过下列不应被认为限制本发明范围的实施例来进一步加以描述。实施例
[0426] 材料
[0427] 用作缓冲液和底物的化学品是至少为试剂级的商业化产品。
[0428] 菌株
[0429] Thielavia terrestris NRRL 8126被用作具有纤维素分解增强活性的家族61多肽的来源。米曲霉JaL250菌株(WO 99/61651)和里氏木霉RutC30(ATCC 56765;
Montenecourt and Eveleigh,1979,Adv.Chem.Ser.181:289-301)用于表达具有纤维素分解增强活性的家族61多肽。
[0430] 培养基
[0431] YEG培养基的组成为每升0.5%的酵母提取物和2%的葡萄糖。
[0432] 马铃薯葡萄糖培养基的组成为每升39克的马铃薯葡萄糖(Difco)。
[0433] PDA平板的组成为每升39克的马铃薯葡萄糖琼脂。
[0434] MDU2BP培养基的组成为每升45g麦芽糖,1g MgSO4·7H2O,1g NaCl,2g K2SO4,12g KH2PO4,7g酵母提取物,2g尿素,和0.5ml AMG痕量金属溶液,pH为5.0。
[0435] AMG痕量金属溶液的组成为每升14.3g ZnSO4·7H2O,2.5g CuSO4·5H2O,0.5g NiCl2·6H2O,13.8g FeSO4·7H2O,8.5g MnSO4·H2O,和3g柠檬酸。
[0436] COVE平板的组成为每升342.3g蔗糖,20ml of COVE盐溶液,10ml1M乙酰胺,10ml1.5M CsCl2,和25g Noble琼脂。
[0437] COVE盐溶液的组成为每升26g KCl,26g MgSO4·7H2O,76g KH2PO4,和50ml COVE痕量金属溶液。
[0438] COVE痕量金属溶液的组成为每升0.04g Na2B4O7·10H2O,0.4g CuSO4·5H2O,1.2g FeSO4·7H2O,0.7g MnSO4·H2O,0.8g Na2MoO2·2H2O,和10g ZnSO4·7H2O。
[0439] CIM培养基的组成为每升20g纤维素,10g玉米浸泡固体,1.45g(NH4)2SO4,2.08g KH2PO4,0.28g CaCl2,0.42g MgSO4·7H2O,和0.42ml痕量金属溶液,pH到6.0。
[0440] 痕量金属溶液的组成为每升41.2mg FeCl3·6H2O,11.6mg ZnSO4·7H2O,5.4mg MnSO4·H2O,2.0mg CuSO4·5H2O,0.48mg H3BO3,和67.2mg柠檬酸。
[0441] NNCYP培养基的组成为每升5.0g NH4NO3,0.5g MgSO4·7H2O,0.3g CaCl2,2.5g柠檬酸,1.0g Bacto蛋白胨,5.0g酵母抽提物,COVE痕量金属溶液,和足够的K2HPO4以达到最终pH为大约5.4。
[0442] NNCYPmod培养基的组成为每升1.0g NaCl,5.0g NH4NO3,0.2g MgSO4·7H2O,0.2g CaCl2,2.0g柠檬酸,1.0g Bacto蛋白胨,5.0g酵母提取物,COVE痕量金属溶液,和足够的K2HPO4以达到pH为大约5.4。
[0443] LB平板的组成为每升10g胰蛋白胨,5g酵母提取物,5g氯化钠,和15g Bacto琼脂。
[0444] SOC培养基由2%胰蛋白胨,0.5%酵母提取物,10mM NaCl,2.5mM KCl,10mM MgCl2,和10mM MgSO4组成,并且高压灭菌后加入过滤杀菌的葡萄糖至20mM。
[0445] 冷冻培养基由60%的SOC和40%的丙三醇组成。
[0446] 2X YT培养基的组成为每升16g胰蛋白胨,10g酵母提取物,5g NaCl,和15g Bacto琼脂。
[0447] 实施例1:鉴定来自Thielavia terrestris NRRL 8126的具有纤维素分解增强活性的多肽
[0448] 来自生长在补充有1% Sigmacell(Sigma Chemical Co.,St.Louis,MO)的NNCYPmod培养基上的Thielavia terrestris NRRL 8126新鲜平板的琼脂糖栓(plug)被接种入补充有1%葡萄糖的50ml NNCYPmod培养基中并且在45℃,200rpm培养25小时。使用2-ml的这种培养物接种入15x 100ml(500ml培养瓶)和2x 50ml(250ml培养瓶)补充有
2% Sigmacell-20的NNCYPmod培养基,并且在45℃,200rpm培养4天。汇集的培养物在
3000x g离心10分钟,并且上清液过滤通过Nalgene 281-5000玻璃纤维预过滤器(Nalge Nunc Int’l.,Rochester,NY)。过滤物冷却至4℃保藏。
[0449] 二维的聚丙烯酰胺凝胶电泳.通过在4℃加入100μl的饱和三氯乙酸(TCA),并且在上孵育10分钟,然后加入9ml冰冷的丙酮,进一步在冰上孵育20分钟来沉淀1ml的滤出液。沉淀的溶液于4℃,在10,000x g离心10分钟,弃去上清液,并且用冰冷的丙酮漂洗沉淀颗粒两次并空气干燥。干燥的沉淀颗粒溶解在0.2ml等电聚焦(IEF)样品缓冲液(9.0M尿素,3.1%(wt/v)3-[(3-胆氨基丙基)二甲基-铵基]-1-磺化丙烷(CHAPS,Pierce Chemical Co.Rockford,IL),1%(v/v)pH 4-7两性电解质,50mM二硫苏糖醇(DTT),和在水中稀释的0.005%溴酚蓝)中。利用来自BioRad Laboratories(Hercules,CA)的AG501-X8(D),20-5-目,混合床树脂,使尿素原液去离子化。去离子化的溶液储存在-20℃。以TM
在LabQuake 振荡器上(Lab Industries,Berkeley,CA)轻柔混合使得所得到的混合物溶解几小时。200μl的各个IEF样品缓冲液蛋白质混合物被施加到在IPG再水化盘(Amersham Biosciences,Piscataway,NJ)中的11cm IPG条(BioRad Laboratories,Hercules,CA)上。750μl等分的干条覆盖液体(Amersham Biosciences,Piscataway,NJ)被铺覆在IPG条上以防止蒸发,并利用IPGPhor等电聚焦装置(Amersham Biosciences,Piscataway,NJ)在20℃,施加30伏特容许再水合化12小时。IPGPhor装置被程序设置为恒定电压但每条的最大电流为50μA。再水合作用12小时后,等电聚焦条件如下:在200伏特1小时,在500伏特1小时,以及在1000伏特1小时。然后施加的梯度是1000伏特至8000伏特30分钟,并且等电聚焦被程序设置为在8000伏特泳动,当达到>30,000伏特小时,完成泳动。在二维分析前通过在每10ml SDS-平衡缓冲液(50mM Tris HCl pH 8.8,6.0M尿素,2%(w/v)十二烷基磺酸钠(SDS),30%丙三醇,和0.002%(w/v)溴酚蓝)100mg二硫苏糖醇中首先还原15分钟,然后于黑暗中,在每10ml平衡缓冲液250mg碘乙酰胺中烷 基化15分钟,使IPG凝胶条还原和烷基化。IPG条在SDS-PAGE电泳缓冲液(Invitrogen/Novex,Carlsbad,CA)中快速漂洗,并置于11cm,1孔8-16%Tris-甘氨酸SDS-PAGE凝胶(BioRad Laboratories,Hercules,CA)上,利用标准电泳装置(BioRad Laboratories,Hercules,CA)在50伏特电泳直到样品进入凝胶,然后电压增加至200伏特,再电泳直到溴酚蓝染料到达凝胶底部。
[0450] 多肽检测。用荧光SYPRO橙色蛋白质染色剂(Molecular Probes,Eugene,OR)染色该二维凝胶。从Malone et al.,2001,Electrophoresis,22,919-932优化和改变荧光染色方法。SDS-PAGE凝胶固定在平台摇摆器上的40%乙醇,2%乙酸,和0.0005% SDS中1小时至过夜。除去固定溶液,并且用重复三次的洗涤步骤替代,每次步骤由2%乙酸和0.0005% SDS,30分钟组成。凝胶在黑暗中用2%乙酸,0.0005% SDS,和0.02% SYPRO橙色蛋白质染色剂染色1.5小时至过夜。进一步优化染色和脱色以增加在Hoefer Processor Plus染色装置(Amersham Biosciences,Piscataway,NJ)上的可重复性和自动化程度。利用蓝色荧光和200μm像素(pixel)大小,以及800V的光电倍增管增益,通过在Molecular Dynamics STORM 860成像系统(Amersham Biosciences,Piscataway,NJ)上扫描获得荧光染色的SDS-PAGE凝胶的图像。利用ImageQuant 5.0版(Amersham Biosciences,Piscataway,NJ)观察和调整图像。在具有橙色滤光镜的Dark Reader Blue透照镜(Clare Chemical Co,Denver,CO)上进一步观察凝胶。利用2mm Acu-Punch Biopsy Punch(Acuderm Inc.,Ft.Lauderdale,FL)切下观察到的蛋白质凝胶斑点,并保存在用在60%乙腈中的0.1%三氟乙酸(TFA)预洗涤,然后用HPLC级的水附加洗涤两次的96孔平板中。染色的二维凝胶斑点于-20℃保存在预洗涤平板中的25-50μl水中直到被消化。
[0451] 用于肽测序的多肽的凝胶中消化。使用 II Liquid HandlingRobot(PerkinElmer Life and Analytical Sciences,Boston,MA)进行凝胶中消化。含有感兴趣多肽的二维凝胶斑点用在100mM碳酸氢铵pH 8.0中的50μl 10mM DTT还原30分钟。还原后,凝胶块用在100mM碳酸氢铵pH 8.0缓冲液中的50μl 55mM碘乙酰胺烷基化
20分钟。容许干凝胶块于室温下,在胰蛋白酶消化溶液中膨胀(在50mM碳酸氢铵pH 8缓冲液中的6ng/μl测序级胰蛋白酶(Promega,Madison,WI))30分钟,然后在40℃消化8小时。所描述的各个反应步骤后按照制造商的标准方案用适当的溶液进行多次洗涤和预洗涤。反应之间使用50μl乙腈使凝胶脱水,并且步骤 之间凝胶块被空气干燥。用在HPLC级水中的1%甲酸/2%乙腈提取肽两次,每次30分钟。肽提取溶液被转移至已经被冷却至
10-15℃,并且用96-孔平板盖(PerkinElmer Life and Analytical Sciences,Boston,MA)覆盖以防止蒸发的96孔带边的PCR型平板(ABGene,Rochester,NY)中。平板被进一步保存在4℃直到可以进行质谱分析。
[0452] 通过串联质谱分析法的肽测序。对于通过串联质谱分析法的肽测序,Q-Tof microTM混合的正交四极飞行时间质谱仪(Waters MS Technologies,Milford,MA)被用于LC-MS/MS分析。Q-Tof microTM质谱仪备有UltimateTM毛细管和纳流HPLC系统(Dionex,Sunnyvale,CA),其已经偶连有FAMOS微自动取样器(Dionex,Sunnyvale,CA)和Switchos II柱转换装置(Dionex,Sunnyvale,CA)用于浓缩和使样品脱盐。样品被加载到固定在注射环中的保卫柱(300μm ID X 5cm,C18 PepMapTM)(Dionex,Sunnyvale,CA)上,并用在水中的0.1%甲酸,利用Switchos II(Dionex,Sunnyvale,TM
CA),以40μl/分钟洗涤2分钟。肽在75μm ID x 15cm,C18,3μm, PepMap 纳流融合的毛细管柱(Dionex,Sunnyvale,CA)上,利用NAN-75校准器(Dionex,Sunnyvale,CA)以来自175μl/分钟分流的175nl/分钟流速分离。线性洗提梯度是在45分钟期间,在施加的0.1%甲酸中5%至60%的乙腈。在215nm处监测柱洗脱液,并且通过装备有纳喷射TM TM TM
接口的电喷射离子源被导入Q-Tof micro 质谱仪。Q-Tof micro 质谱仪利用MassLynx软件3.5版(Waters MS Technologies,Milford,MA)被完全地为处理控制。
以查勘扫描方式获得数据并且随着MS至MS/MS的转换准则质量范围为50至2000m/z,以包括大于10.0计数/秒的离子强度和+2、+3、和+4的电荷状态。可获得达到4个共同洗提种类,具有1.9秒扫描时间和0.1秒内扫描时间的分析谱。一般使用65伏特的锥形电压,跃迁能源被程序设计为根据被洗提肽的质量和电荷状态而变化并且在10-60伏特范围内。所获得的谱是混合的、平滑的、并且以自动化方式定中心而产生峰值列表。相对于所选择的数据库利用ProteinLynxTM Global Server1.1软件(Waters MS Technologies,
Milford,MA)搜索产生的峰值列表。评估来自ProteinLynxTM搜索的结果,通过评估感兴趣的各个离子的MS/MS谱以及通过鉴定y和b离子系列和与适当氨基酸的相配质量差异确定的开头(de novo)序列来进一步分析未鉴定的蛋白质。
[0453] 从大约40kDa多肽凝胶斑点的若干倍增电荷的离子获得来自质谱从头测序的Thielavia terrestris GH61B的肽序列。878.422m/z序列的成两倍电荷的胰蛋白酶肽离子被确定为是
[0454] [Ile或 Leu]-Pro-Ala-Ser-Asn-Ser-Pro-Val-Thr-Asn-Val-Ala-Ser-Asp-Asp-[Ile或Leu]-Arg(SEQ ID NO:11)。765.460的第二个成两倍电荷的胰蛋白酶肽离子被确定为是[Ile或Leu]-Pro-Glu-Asp-[Ile或Leu]-Glu-Pro-Gly-Asp-Tyr-[Ile或Leu]-[Ile或Leu]-Arg(SEQ ID NO:12)。
[0455] 在实施例24中描述的苯基琼脂糖凝胶纯化步骤后,20μl含有最高分解纤维增加活性的汇集部分与具有50mM DTT的20μl 2X SDS-PAGE加样缓冲液混合,并煮沸4分钟。40μl通过SDS-PAGE,利用11cm 8-16% Tris-甘氨酸SDS-PAGE梯度凝胶(BioRad Laboratories,Hercules,CA)和Tris-甘氨酸电泳缓冲液(Invitrogen,Carlsbad,CA)分离。SDS-PAGE在还原条件和制造商推荐的方案下电泳(BioRad Laboratories,Hercules,CA)。从盒中移出凝胶,用水漂洗3次,每次至少5分钟,并用Bio-Safe考马斯染色剂(BioRad Laboratories,Hercules,CA)染色1小时,然后用双蒸水脱色超过30分钟。如上所述用胰蛋白酶凝胶内消化明显在大约27kDa处的蛋白条带。如上所述使从消化回收的肽经受串联质谱分析法的肽测序。903.895m/z的成两倍电荷的胰蛋白酶肽离子被确定为具有Cys-Pro-Gly-Ser-Phe-Ser-Ser-Cys-Asp-Gly-Ser-Gly-Ala-Gly-Trp-Phe-Lys(SEQ ID NO:13,家族GH61D)的序列。415.553m/z的三倍电荷的胰蛋白酶肽离子被确定为是[Ile或Leu]-Asp-Glu-Ala-Gly-Phe-His-Gly-Asp-Gly-Val-Lys(SEQ ID NO:14,家族GH61D)。另一个
565.857m/z的成两倍电荷的胰蛋白酶肽离子被确定为是X-X-Ala-Pro-Gly-Asn-Tyr-[Ile或Leu]-[Ile或Leu]-Arg(SEQ ID NO:15,家族GH61C)。这些肽序列用来设计用于克隆的引物。
[0456] 实施例2:Thielavia terrestris基因组DNA提取
[0457] Thielavia terrestris NRRL 8126于37℃,以250rpm在25ml YEG培养基中生长24小时。然后通过MiraclothTM(Calbiochem,La Jolla,CA)过滤收集菌丝体,并用25ml10mM Tris-1mM EDTA(TE)缓冲液洗涤一次。从随后被冷冻在液氮中的菌丝体制品排干过量的缓冲液。冷冻的菌丝体制品在电动咖啡磨碎机中被磨碎成精细粉末,并且该粉末被加入含有20ml TE缓冲液和5ml 20% w/v十二烷基磺酸钠(SDS)的一次性塑料离心管中。混合物 被轻轻地翻转几次以确保混匀,用等体积的苯酚∶氯仿∶异戊醇(25∶24∶1v/v/v)提取两次。乙酸钠(3M溶液)被加入提取的样品至终浓度为0.3M,然后加入2.5体积的冰冷乙醇以沉淀DNA。试管在15,000x g离心30分钟以沉淀DNA。在重悬在0.5ml TE缓冲液中之前,使DNA沉淀空气干燥30分钟。无DNA酶的核糖核酸酶A被加入重悬的DNA沉淀至浓度为每ml 100μg,然后该混合物在37℃孵育30分钟。加入蛋白酶K(200μg/ml),在37℃孵育该试管附加的1小时。最后,样品在12,000x g离心15分钟,上清液被施加于Qiaprep
8 manifold(QIAGEN Inc.,Valencia,CA)。柱子用1ml PB(QIAGEN Inc.,Valencia,CA)和
1ml PE(QIAGEN Inc.,Valencia,CA)在真空下洗涤两次。分离的DNA用100μl TE洗涤,用乙醇沉淀,用70%乙醇洗涤,在真空下干燥,重悬在TE缓冲液中,并于4℃保存。
[0458] 为了产生用于PCR扩增的基因组DNA,Thielavia terrestris于42℃,在含有补充有1%葡萄糖的50ml NNCYP培养基的带挡板摇瓶中,以200rpm生长24小时。通过过滤收获菌丝体,在TE(10mM Tris-1mM EDTA)中洗涤两次,并冷冻在液氮中。豌豆大小的冷冻菌丝体块被悬浮在0.7ml含1%十二烷基硫酸锂的TE中,通过与等体积的0.1mm氧化锆/硅石珠(Biospec Products,Inc.,Bartlesville,OK)在FastPrep FP 120(ThermoSavant,Holbrook,NY)中搅拌45秒而破裂。通过在13,000x g离心10分钟除去碎片,使澄清的上清液加入2.5M乙酸铵,并在冰上孵育20分钟。孵育期后,通过加入2体积乙醇沉淀核酸。于4℃在微离心机中离心15分钟后,沉淀用70%乙醇洗涤并空气干燥。DNA重悬在120μl
0.1X TE中,与1μl无DNA酶的RNase A在37℃孵育20分钟。乙酸铵被加至2.5M,用2体积的乙醇沉淀DNA。在70%乙醇中洗涤沉淀,空气干燥,并重悬在TE缓冲液中。
[0459] 实施例3:pAlLo2表达载体的构建
[0460] 通过改变包括来自黑曲霉中性α-淀粉酶和米曲霉磷酸丙糖异构酶(NA2-tpi启动子)基因的启动子杂合体、黑曲霉淀粉葡萄糖苷酶终止子序列(AMG终止子)、和构巢曲霉乙酰胺酶基因(amdS)的pBANe6(U.S.专利号6,461,837)构建表达载体pAlLo1。利用TMBig-Dye 终止剂化学(Applied Biosystems,Inc.,Foster City,CA)的测序验证全部的诱变步骤。首先通过定点诱变消除从amdS选择标记在第2051、2722、和3397bp位置的3个Nco I限制酶切位点来进行pBANe6的改变。所有的变化被设计为是“沉默的”,使得amdS基因产物的实际蛋白质序列没有变化。根据制造商的指导利用下列引 物(加下划线的核苷TM
酸表示变化的碱基),用GeneEditor 体外定点诱变试剂盒(Promega,Madison,WI)同时除去这3个位点:
[0461] AMDS3NcoMut(2050):
[0462] 5’-GTGCCCCATGATACGCCTCCGG-3’(SEQ ID NO:16)
[0463] AMDS2NcoMut(2721):
[0464] 5’-GAGTCGTATTTCCAAGGCTCCTGACC-3’(SEQ ID NO:17)
[0465] AMDS1NcoMut(3396):
[0466] 5’-GGAGGCCATGAAGTGGACCAACGG-3’(SEQ ID NO:18)
[0467] 然后利用QuickChangeTM定点诱变试剂盒(Stratagene,La Jolla,CA)使包括全部3个预期序列变化的质粒经受定点诱变,以消除在第1643位的AMG终止子末端的Nco I限制酶切位点。下列引物(加下划线的核苷酸表示变化的碱基)用于诱变:
[0468] 诱变AMG终止子序列的上游引物:
[0469] 5’-CACCGTGAAAGCCATGCTCTTTCCTTCGTGTAGAAGACCAGACAG-3’(SEQ ID NO:19)[0470] 诱变AMG终止子序列的下游引物:
[0471] 5’-CTGGTCTTCTACACGAAGGAAAGAGCATGGCTTTCACGGTGTCTG-3’(SEQ ID NO:20)[0472] pBANe6改变中最后的步骤是在多接头的开始利用QuickChangeTM定点诱变试剂盒和下列引物(加下划线的核苷酸表示变化的碱基)加入新的NcoI限制酶切位点以产生pAlLo1(图6)。
[0473] 诱变NA2-tpi启动子的上游引物:
[0474] 5’-CTATATACACAACTGGATTTACCATGGGCCCGCGGCCGCAGATC-3’(SEQ ID NO:21)[0475] 诱变NA2-tpi启动子的下游引物:
[0476] 5’-GATCTGCGGCCGCGGGCCCATGGTAAATCCAGTTGTGTATATAG-3’(SEQ ID NO:22)[0477] 用构巢曲霉pyrG基因替换pAlLo1的amdS基因。质粒pBANe10(图7)被用作作为选择标记的pyrG基因的来源。pBANe10的序列分析显示pyrG标记包含在Nsi I限制片段内,并且不包含Nco I或Pac I限制酶切位点。由于amdS也侧接Nsi I限制酶切位点,开关选择标记的策略是简单替换Nsi I限制片段。来自pAlLo1和pBANe10的质粒DNA用限制酶Nsi I消 化,产物通过琼脂糖凝胶电泳纯化。来自包含pyrG基因的pBANe10的Nsi I片段被连接至pAlLo1骨架以替换包含amdS基因的原始Nsi I DNA片段。通过限制酶消化分析重组的克隆以确定其具有正确的插入及其方向。选择具有以逆时针方向转录的pyrG基因的克隆。新的质粒被命名为pAlLo2(图8)。
[0478] 实施例4:从Thielavia terrestris NRRL 8126基因组DNA PCR扩增GH61B基因片段
[0479] 基于如实施例1所描述的通过串联质谱分析法获得的肽序列设计引物。特定的肽序列如下:
[0480] [L,I]PASNSPVTNVASDD[L,I]R(SEQ ID NO:23)
[0481] [L,I]PED[L,I]EPGDY[L,I][L,I]R(SEQ ID NO:24)
[0482] 选择以粗体显示的序列区用于DNA引物设计。在该序列中邻近氨基酸是丙氨酸的假设之下(以同系物中的序列保守性为基础)工程化第二个序列的更长5’延伸。引物是:
[0483] 正义引物:
[0484] 5’-CCTCCAACTCCCCCGTCACNAAYGTNGC-3’(SEQ ID NO:25)
[0485] 反义引物:
[0486] 5’-GGCGCGGAGGAGGTARTCNCCNGGYTC-3’(SEQ ID NO:26)
[0487] PCR扩增以包含1X AmpliTaq缓冲液(Applied Biosystems,Foster City,CA),2.5单位AmpliTaq DNA聚合酶(Applied Biosystems,Foster City,CA),1μM各个有义和反义引物,和大约1μg来自Thielavia terrestris NRRL 8126的基因组DNA的50μl体积进行。扩增在Robocycler(Stratagene,La Jolla,CA)中,利用循环参数为3分钟,
96℃和3分钟,72℃(其中加入DNA聚合酶),35个循环的45秒,94℃;45秒,58℃;和1分钟,72℃;然后是7分钟,72℃的最终延伸。反应产物在3%琼脂糖凝胶上利用40mM Tris base-20mM乙酸钠-1mM二钠EDTA(TAE)缓冲液分级,切下大约450bp的条带,利用QIAEX II凝胶提取试剂盒(QIAGEN Inc.,Valencia,CA)纯化,并利用TOPO TA试剂盒(Invitrogen,Carlsbad,CA)亚克隆。测序来自一个大肠杆菌转化体的质粒,并且发现包含编码家族61蛋白质(GH61B)的452bp的插入。该质粒被命名为pPH27(图9)。
[0488] 实施例5:从基因组DNA PCR扩增GH61C和GH61D基因片段
[0489] 基于如实施例1所描述的通过串联质谱分析法获得的肽序列设计引物,除了多肽的来源是从一维SDS-PAGE凝胶(Novex 4-12% Bis-Tris,Invitrogen,Carlsbad,CA)切下的大约27kDa条带,然后如实施例24所描述的通过Q琼脂糖凝胶部分纯化。GH61C和GH61D多肽的相似分子质量导致了用于质谱分析法的凝胶切下部分中多肽的交叉污染,因此在质谱分析期间确定的肽序列来源于两个多肽。一个引物设计为两个可能相邻的胰蛋白酶肽序列与序列SGAGWFKIDEAGFHGD(SEQ ID NO:27)组合。这变为是GH6lD的正确序列,然而设计的引物充分接近于GH61C序列(GDGWFKIDE)以同时扩增该基因。反义引物是基于质谱来源的序列APGNY[I,L][I,L]R(SEQ ID NO:28)。这根据对APGNYLIRHEL(SEQ ID NO:29)的多重序列排列中的保守性被延伸和精炼。这变为是GH61C的正确序列,但充分接近于GH61D序列(APGNYLVRHEL,SEQ ID NO:30)以扩增该基因。用于引物设计的特定肽序列如下:
[0490] GAGWFKIDE(SEQ ID NO:31)
[0491] APGNYLIRHEL(SEQ ID NO:29)
[0492] 引物是:
[0493] 正义引物:
[0494] 5’-CGGCGCGGGCTGGTTTAARATHGAYGA-3’(SEQ ID NO:32)
[0495] 反义引物:
[0496] 5’AGTTCATGGCGAATCAGATARTTNCCNGGNGC-3’(SEQ ID NO:33)
[0497] PCR扩增以包含1X AmpliTaq缓冲液,2.5单位的AmpliTaq DNA聚合酶,1μM各个正义和反义引物,和大约1μg来自Thielavia terrestris NRRL8126的基因组DNA的50μl体积进行。扩增在Stratagene Robocycler中,利用循环参数为3分钟,96℃和3分钟,72℃(其中加入DNA聚合酶),35个循环的45秒,94℃;45秒,53、56、或59℃和1分钟,72℃,然后是7分钟,72℃的最后延伸。反应产物在3%琼脂糖凝胶上分级,切下大约
150-200bp的两个条带,利用QIAEX II凝胶提取试剂盒(QIAGEN Inc.,Valencia,CA)纯化,利用Topo TA试剂盒(Invitrogen,Carlsbad,CA)一起亚克隆。测序来自一个大肠杆菌转化子的质粒,发现包含编码家族61蛋白质(GH61C)的156bp的插入。这个质粒被命名为pPH29(图10)。测序来自另一个大肠杆菌转化子的质粒,发现包含编码另一个家族61蛋白质(GH61D)的180bp的插入。这个质粒被命名为pPH28(图11)。
[0498] 实施例6:基因组DNA文库构建
[0499] 利用噬菌体克隆载体λZipLox(Life Technologies,Gaithersburg,MD)与作为用于培养和纯化重组噬菌体宿主的大肠杆菌Y1090ZL细胞(Life Technologies,Gaithersburg,MD)和用于切除包含GH61B基因的单独pZL1克隆的大肠杆菌DH10Bzip(Life Technologies,Gaithersburg,MD)来构建基因组DNA文库。
[0500] Thielavia terrestris NRRL 8126基因组DNA用Tsp 509I部分消化,并利用TAE缓冲液在1%琼脂糖凝胶上进行大小-分级。切下以大小范围3-7kb迁移的DNA片段并利用Prep-a-Gene试剂(BioRad Laboratories,Hercules,CA)从凝胶洗提。洗提的DNA片段与Eco RI-切割且脱去磷酸的λZipLox载体臂(Life Technologies,Gaithersburg,MD)连接,利用商业包装的提取物(Stratagene,La Jolla,CA)包装该连接混合物。接种包装的6
DNA文库,并在大肠杆菌Y1090ZL细胞中扩增。未扩增的基因组DNA文库包含3.1X 10pfu/
4
ml(没有DNA的背景滴度是2.0X 10pfu/ml)。
[0501] 实施例7:Thielavia terrestris GH61B、GH61C和GH61D克隆的鉴定
[0502] 利用与TOPO载体同源的引物和Herculase DNA聚合酶(Stratagene,La Jolla,CA)分别从pPH27、pPH29和pPH28扩增Thielavia terrestris GH61B、GH61C、和GH61D探针片段,如下所示:
[0503] 5′-CTTGGTACCGAGCTCGGATCCACTA-3′(SEQ ID NO:34)
[0504] 5′-ATAGGGCGAATTGGGCCCTCTAGAT-3′(SEQ ID NO:35)
[0505] 50皮摩尔的各个引物用于PCR反应,其中包含10pPH27、pPH28、或pPH29,1X Herculase扩增缓冲液(Stratagene,La Jolla,CA),1μl 10mM dATP、dTTP、dGTP、和dCTP混合物,和2.5单位的Herculase DNA聚合酶,终体积为50μl。扩增条件是一个循环的94℃,1分钟,20个循环的94℃,30秒;55℃,30秒;和72℃,1分钟。然后加热块达到4℃保温(soak)循环。反应产物在1.0%琼脂糖凝胶上利用TAE缓冲液分离,其中从凝胶切下3个<500bp的产物条带,根据制造商的指导利用QIAquick凝胶提取试剂盒(QIAGEN Inc.,
32
Valencia,CA)纯化。用 P,利用Prime It II试剂盒(Stratagene,La Jolla,CA)放射性标记25ng的各个片段。
[0506] 利用3个标记的PCR片段作为探针的噬菌斑-杂交筛选来自实施例6中描述文库的大约90,000个噬菌斑。利用UV Stratalinker(Stratagene,La Jolla,CA),DNA被交联到膜(Hybond N+,Amersham,Arlington Heights,IL)上。通 过加入氢氧化钠至终浓32
度为0.1M使各个 P-放射性标记的基因片段变性,并且加入每ml杂交溶液包含6X SSPE,
6
7% SDS,活性为大约1x 10cpm的杂交溶液。各个混合物于55℃在摇动的水浴中培养过夜。培养后,于65℃在具有0.1% SDS的0.2X SSC中洗涤膜3次,每次15分钟。膜在吸滤TM
纸上干燥15分钟,包裹在SaranWrap 中,和增感屏(intensifying screen)一起(Kodak,Rochester,NY)于70℃对X-光胶片曝光过夜。
[0507] 根据与如上所述的GH61探针产生强烈的杂交信号,选择几个噬菌斑作进一步研究。在大肠杆菌Y1090ZL细胞中纯化噬菌斑两次,随后通过感染大肠杆菌DH10BZL细菌(Life Technologies,Gaithersburg,MD)利用体内切除从作为pZL1-衍生物的λZipLox载体(D’Alessio et al.,1992, 14:76)切下插入的基因和pZL1质粒。菌落被接种入3ml的LB加50μg/ml氨苄青霉素的培养基并于37℃生长过夜。利用BioRobot9600(QIAGEN Inc.,Valencia,CA)从这些培养物中的每一个制备小提的DNA。通过DNA测序显示克隆pEJG120(图12)包含GH61B的全长基因组基因。
[0508] 以如对于GH61B所描述的相同方法分离GH61C和GH61D的全长基因组基因。
[0509] 包含质粒pEJG120的E.coli pEJG120以NRRL B-30699保藏在农业研究机构培养物保藏中心,1815 University Street,Peoria,Illinois,61604,保藏日期为2003年12月19日。
[0510] 对于保藏物,用下文所示的引物从其表达构建体pEJG111(参见实施例13,图13)PCR扩增Tter61C基因。
[0511] 融合内的正向引物:
[0512] 5’-ACAACTGGATTTACCATGCGGTTCGACGCCTC-3’(SEQ ID NO:36)
[0513] 融合内的反向引物:
[0514] 5’-GTCAGTCACCTCTAGTTACTAAAACTCGAAGCC-3’(SEQ ID NO:37)
[0515] 粗体字表示编码序列。剩余的序列包含与pAlLo2的插入位点的序列同一性。
[0516] 50皮摩尔的上述各个引物用于PCR反应,其中包含50ng pEJG111 DNA,1X Pfx扩增缓冲液(Invitrogen,Carlsbad,CA),6μl 10mM dATP、dTTP、dGTP、和dCTP的混合物,1μl 50mM MgSO4,5μl 10X pCRx增强溶液 (Invitrogen,Carlsbad,CA),和2.5单位的Platinum Pfx DNA聚合酶(Invitrogen,Carlsbad,CA),终体积为50μl。使用Eppendorf Mastercycler 5333(Eppendorf Scientific,Inc.,Westbury,NY)扩增DNA片段,程序设置为一个循环的98℃,2分钟;和35个循环的94℃,30秒,60℃,30秒,和68℃,1分钟。35个循环后,反应物在68℃孵育10分钟,然后冷却至10℃直到进一步的处理。大约800bp的PCR反应产物在0.8% GTG-琼脂糖凝胶(Cambrex Bioproducts,East Rutherford,NJ)TM
上,利用TAE缓冲液和每ml0.1μg的溴化乙锭分离。通过Dark Reader (Clare Chemical Research,Dolores,CO)的帮助观察DNA条带以避免UV-诱导的突变。用一次性刀片切下
800bp DNA条带并用Ultrafree-DA Spin Cup(Millipore,Billerica,MA)根据制造商的指导纯化。
[0517] 根据制造商的指导将纯化的DNA条带克隆到pCR4-Blunt TOPO载体(InVitrogen,Carlsbad,CA)中。根据制造商的指导将2μl的TOPO-反应物转化入E.coli TOP10细胞(Invitrogen,Carlsbad,CA)中。将转化的细胞接种到补充有每ml 100μg氨苄青霉素的2X YT琼脂平板上,于37℃培养过夜。
[0518] 随机选择8个克隆用于质粒DNA制备。各个克隆在补充有每ml 100μg氨苄青霉素的3ml LB上生长过夜。从这些培养物,使用10μl接种于补充有每ml 100μg氨苄青霉素的2X YT琼脂堂平板,以具有各个克隆的细菌原种。其余的培养物用于以QIAGEN BioRobot9600制备质粒DNA。通过Eco RI限制酶消化分析克隆。8个克隆具有预期的限制消化模TM
式。从这些克隆,3个如上所述用Big-Dye 终止剂化学,利用标准的M13正反向引物测序。
全部3个克隆显示具有Tter61E基因的正确序列。克隆#7被重命名为pTter61C(图15),其细菌原种再划线接种到补充有每ml 100μg氨苄青霉素的新鲜2XYT平板上,于37℃培养过夜。从这个平板,将细胞用于接种2个包含补充有每ml 100μg氨苄青霉素的大约1.5ml TM
LB琼脂糖的1.8ml冷冻小管。小管用PetriSeal (Diversified Biotech,Boston MA)密封,并保藏在农业研究机构培养物保藏中心,1815 University Street,Peoria,Illinois,
61604,保藏号为pTter61G NRRL B-30811,保藏日期为2005年1月21日。
[0519] 对于保藏物,用下列引物从其表达构建体pEJG112(参见实施例13,图14)PCR扩增Tter61D基因。
[0520] 正向引物:
[0521] 5’-CATGCCATGGATGCTTCTCAC-3’(SEQ ID NO:38)
[0522] 反向引物:
[0523] 5’-CCTTAATTAATCAGGCGGTGAAGTC-3’(SEQ ID NO:39)
[0524] 粗体字表示编码序列。剩余序列包含用于将来克隆实验的独特的限制酶切位点。
[0525] 除用pEJG112外,如上所述进行PCR反应。在0.8% GTG-琼脂糖凝胶上利用TAETM缓冲液和每ml 0.1μg溴化乙锭分离大约1kb的PCR反应产物。借助于Dark Reader 观察DNA条带以避免UV-诱导的突变。用一次性刀片切下1kb DNA条带,根据制造商的指导用QIAquick PCR纯化试剂盒(QIAGEN Inc.,Valencia,CA)纯化。根据制造商的指导将纯化的DNA条带克隆到pCR4-Blunt TOPO载体中,如上所述分离E.coli TOP10细胞的转化体。
[0526] 随机选择10个克隆用于质粒DNA制备。各个克隆在补充有每ml 100μg氨苄青霉素的3ml LB上生长过夜,并用于以QIAGEN BioRobot 9600制备质粒DNA。通过Eco RI限制酶消化分析克隆以证实存在克隆的插入。全部10个克隆具有预期的限制消化模式。TM
从这些克隆,随后如上所述用Big-Dye 终止剂化学,利用标准的M13正反向引物测序5个。
这些克隆中的一个显示具有Tter61D基因的正确序列。这个克隆被重命名为pTter61D(图
16),并如上所述再转化E.coli TOP10细胞。从单个菌落划线,将细胞用于接种2个包含补充有每ml 100μg/ml氨苄青霉素的大约1.5ml LB琼脂糖的1.8ml冷冻小管。小管TM
用PetriSeal 密封,并保藏在农业研究机构培养物保藏中心,1815 University Street,Peoria,Illinois,61604,保藏号为pTter61DNRRL B-30812,保藏日期为2005年1月21日。
[0527] 实施例8:表达序列标签(EST)cDNA文库构建
[0528] 使用2ml等分来自Thielavia terrestris NRRL 8126的24-小时液体培养物(250ml培养瓶中补充有1%葡萄糖的50ml NNCYPmod培养基,45℃,200rpm)接种包含补充有2% Sigmacell-20的100ml NNCYPmod培养基的500ml培养瓶。培养物在45℃,200rpm培养3天。通过具有玻璃纤维预过滤器的一次性过滤装置(Nalgene,Rochester NY)过滤收获菌丝体,用10mM Tris-HCl-1mM EDTA pH 8(TE)洗涤两次,在液氮中快速冷冻。
[0529] 利用下列方法分离总RNA。Thielavia terrestris NRRL 8126的冷冻菌丝体在电动咖啡磨碎机中磨碎。磨碎的材料在50ml Falcon试管中与20ml Fenazol(Ambion,Inc.,Austin,TX)以1∶1v/v混合。一旦菌丝体悬浮,用氯仿提取它们,并且用苯酚-氯仿-异戊醇的25∶24∶1v/v/v混合物提取3次。从所 得到的水相,通过加入1/10体积的3M乙酸钠pH 5.2和1.25体积的异丙醇来沉淀RNA。通过于4℃在12,000x g离心30分钟来回收沉淀的RNA。最终的沉淀用冷的70%乙醇洗涤,空气干燥,并重悬在500ml焦碳酸二乙酯(diethylpyrocarbonate)-处理的水(DEPC-水)中。
[0530] 纯化RNA的数量和质量用Agilent Bioanalyzer 2100(Agilent Technologies,Inc.,Palo Alto,CA)评估。根据制造商的指导,借助于Poly(A)Purist Magnetic试剂盒(Ambion,Inc.,Austin,TX),从360μg总RNA分离多聚腺苷酸化的mRNA。
[0531] 为了产生cDNA文库,使用CloneMinerTM使用(Invitrogen,Carlsbad,CA)构建不需要利用限制酶克隆的定向文库,由此降低嵌合克隆的数目和大小偏移。
[0532] 为 了确 保 cDNA的 成 功合 成,用2 个不 同 浓 度 的mRNA(2.2和 4.4μg poly(A)+mRNA)平行进行2个反应。将mRNA样品与Biotin-attB2-Oligo(dt)引物TM
(CloneMiner Kit,Invitrogen,Carlsbad,CA),1X第一链缓冲液(Invitrogen,Carlsbad,CA),2μl 0.1M DTT,10mM各个dNTP混合,分别加水至终体积为18和16μl。
[0533] 仔细混合反应混合物,然后加入2和4μl SuperScriptTM逆转录酶(Invitrogen,Carlsbad,CA),45℃孵育60分钟以合成第一互补链。对于第二链的合成,向各个第一链反应物加入30μl 5X第二链缓冲液(Invitrogen,Carlsbad,CA),3μl 10mM各个dNTP,10单位的E.coli DNA连接酶(Invitrogen,Carlsbad,CA),40单位的E.coli DNA聚合酶I(Invitrogen,Carlsbad,CA),以及2单位的E.coli RNase H(Invitrogen,Carlsbad,CA),总体积为150μl。然后使混合物在16℃孵育2小时。2小时孵育后,向各个反应物加入2μl T4 DNA聚合酶(Invitrogen,Carlsbad,CA),在16℃孵育5分钟以产生钝末端的cDNA。用苯酚-氯仿-异戊醇的25∶24∶1v/v/v混合物提取cDNA反应物,在存在20μg糖原,120μl
5M乙酸铵,和660μl乙醇时沉淀。在12,000x g,4℃离心30分钟后,用冷的70%乙醇洗涤cDNA沉淀,真空下干燥2-3分钟,重悬在18μl DEPC-水中。向各个重悬的cDNA样品加入10μl 5X连接缓冲液(Invitrogen,Carlsbad,CA),10μg attB1连接物(Invitrogen,Carlsbad,CA),7μl 0.1M DTT,和5单位的T4 DNA连接酶(Invitrogen,Carlsbad,CA)。
[0534] 5′-TCGTCGGGGACAACTTTGTACAAAAAAGTTGG-3′(SEQ ID NO:40)
[0535] 3′-CCCCTGTTGAAACATGTTTTTTCAACCp-5′(SEQ ID NO:41)
[0536] 连接反应在16℃孵育过夜。通过用1ml SephacrylTM S-500HR树脂(Amersham TMBiosciences,Piscataway,NJ)的大小排阻色谱法除去过量的连接物。根据CloneMiner试剂盒的指导收集柱形级分,用Agilent Bioanalyzer分析级分3至14以确定在哪个级分attB1连接物开始洗提。分析显示连接物在级分10或11附近开始洗提。对于第一个文库,汇集级分6至11,对于第二文库,汇集级分4-11。
[0537] 根 据 Gateway 系 统 方 案 (Invitrogen,Carlsbad,CA), 利 用 BP TMClonase (Invitrogen,Carlsbad,CA)作为重组酶,通 过同源DNA重组进行 cDNATM
的克隆。各个BP Clonase 重 组反应包含大 约70ng attB-flanked-cDNA,250ng TM TM
pDONR 222(Invitrogen,Carlsbad,CA),2μl 5X BP Clonase 缓 冲 液 (Invitrogen,TM
Carlsbad,CA),2μl TE,和3μl BP Clonase 。重组反应物在25℃孵育过夜。
[0538] 将热-失活的BP重组反应物分为6等分,利用BioRad Gene Pulser II(BioRad,TMHercules,CA)电穿孔进入ElectroMax DH10B电感受态细胞(Invitrogen,Carlsbad,CA),其中使用下列参数:2.0kV,200Ω,和25μF。电穿孔的细胞重悬在1ml SOC中,并在37℃伴随恒定振荡(200rpm)培养60分钟。培养期后,汇集转化的细胞,与冷冻培养基以1∶1混合。移出200μl等分用于文库滴定,余下的各个文库等分进入1.8ml冷冻小管(Wheaton Science Products,Millville,NJ),并冷冻储存在-80℃。
[0539] 制备各个文库4个连续稀释度:1/100、1/1000、1/104、1/105。从各个稀释度,将100μl接种到补充有每ml 50μg卡那霉素的150mm LB平板上,在37℃培养过夜。计数各个稀释度平板上的菌落数目,并用于计算各个文库中转化体的总数。
[0540] 第一个文库显示具有5,400,000个独立克隆,第二个文库显示具有9,000,000个独立克隆。
[0541] 实施例9:cDNA克隆的模板和核苷酸测序
[0542] 混合来自两个文库的等分样品并接种在补充有每ml 50μg卡那霉素的25x 25cm LB平板上。借助于Genetix QPix robot(Genetix Inc.,Boston,MA)将单独的菌落排列在含有补充有每ml 50μg卡那霉素的100μl LB培养基的 96-孔平板上。对于总的4320个单独克隆获得45个96-孔平板。使平板在37℃以200rpm振荡培养过夜。培养后,向每个孔加入100μl无菌的50%甘油。借助于96-针工具(Boekel,Feasterville,PA)复制转TM化体进入每个孔含有补充有每ml 50μg卡那霉素的1ml Magnificent Broth (MacConnell Research,San Diego,CA)的第二代的、深碟96-孔微培养平板(Advanced Genetic Technologies Corporation,Gaithersburg,MD)。第一个微量滴定板冷冻储存在-80℃。
第二个深碟平板在旋转的振荡器上以剧烈搅动(300rpm)于37℃培养过夜。为了防止溢出和交叉污染,并容许足够的通气,各个第二代培养平板用聚丙烯缓冲垫(Advanced Genetic Technologies Corporation,Gaithersburg,MD)和塑料的微滴定碟盖覆盖。质粒DNA用MWG Robot-Smart 384(MWG Biotech Inc.,High Point,NC)和Montage Plasmid Miniprep Kits(Millipore,Billerica,MA)制备。
[0543] 利用Big-DyeTM终止剂化学(Giesecke et al.,1992,Journal of Virology Methods 38:47-60)和M13正向(-20)测序引物:5’-GTAAAACGACGGCCAG-3’(SEQ ID NO:42)进行测序反应。
[0544] 测序以384-孔规格用Robot-Smart 384(MWG Biotech Inc.,High Point,NC)进 行。 用 Millipore MultiScreen Seq384 Sequencing Clean-up Kits(Millipore,Billerica,MA)进行终端除去。反应包含6μl质粒DNA和4μl包含1μl 5X测序缓冲液TM(Millipore,Billerica,MA),1μl Big-Dye 终止剂(Applied Biosystems,Inc.,Foster City,CA)、1.6皮摩尔M13正向引物和1μl水的测序标准混合物。用ABI PRISM Automated DNA Sequencer Model 3700(Applied Biosystems,Foster city,CA)进行单通脱氧测序。
[0545] 实施例10:cDNA克隆DNA序列数据的分析
[0546] 借助于PHRED/PHRAP软件(University of Washington,Seattle,WA)进行碱基召集、性质赋值、和向量修整。用Parcel Transcript Assembler v.2.6.2.(Paracel,Inc.,Pasadena,CA)进行ESTs的聚簇分析。EST簇的分析表明存在395个独立的簇。
[0547] 在 利 用 BLOSUM 62 矩 阵 (Henikoff,1992,Proc.Natl.Acad.Sci.USA 89:10915-10919)的32-节点Linux cluster(Paracel,Inc.,Pasadena,CA)上,用Blastx程序(Altschul et.al.,1990,J.Mol.Biol.215:403-410)进行集合EST序列针对PIR数据库的序列同源性分析。从395个簇,246个与公共蛋白质数据库中的已知基因具有显著同一性,而149个相对于这个数据库没有显著的 同一性。在这246个簇当中,13个击中已很好表征的糖基水解酶基因同系物。
[0548] 实施例11:鉴定编码具有纤维素分解增强活性的两个家族61多肽(GH61E和GH61G)的cDNA克隆
[0549] 最初通过其与来自Volvariella volvacea(GenPept g49333361)的家族61蛋白质的同一性鉴定出编码具有纤维素分解增强活性的家族61多肽(GH61E和GH61G)的两个cDNA克隆。这个分析表明该蛋白质在289氨基酸延伸(867bp)的蛋白质水平与V.volvacea分别是41%和38%相同。初始鉴定后,从其最初的冷冻原种平板挽救EST克隆Tter39E1和Tter39H8,并且划线接种在补充有每ml 50μg卡那霉素的LB平板上。平板在37℃培养过夜,并且次日来自各个平板的单个克隆被用于接种入补充有每ml 50μg卡那霉素的3ml LB中。液体培养物在37℃培养过夜,用QIAGEN BioRobot 9600制备质粒DNA。如上所述用TMBig-Dye 终止剂化学再次测序来自各个EST克隆的质粒DNA,利用下列所示的M13正向和Poly-T引物测序该克隆的3’端。
[0550] 5′-TTTTTTTTTTTTTTTTTTTTTTTVN-3′(SEQ ID NO:43)
[0551] 其中V=G、A、或C,以及N=G、A、C、或T
[0552] 克隆Tter39E1的序列分析表明这个克隆不是全长,并且缺失5’端的一些核苷酸,因为它不具有起始密码子“ATG”。为了获得全长克隆,设计一对引物从用于构建该文库的最初cDNA库来扩增这个基因的5’端。
[0553] 设计正向或正义引物与构建cDNA文库期间所使用的attB1连接物相匹配,设计反向引物从截短的5’端的大约350bp扩增,引物如下所示。
[0554] attB1引物::
[0555] 5’-GGGGACAACTTTGTACAAAAAAGTTGG-3’(SEQ ID NO:44)
[0556] 反向引物:
[0557] 5’-AAAGGTAGGATGGTCCTCGTACACCTT-3’(SEQ ID NO:45)
[0558] 50皮摩尔的上述每一引物用于PCR反应,其中含有1μl汇集的cDNA,1X Taq扩增缓冲液(New England BioLabs,Beverly,MA),6μl 10mM dATP、dTTP、dGTP、和dCTP混合物,和2.5单位的Taq DNA聚合酶(New England BioLabs,Beverly,MA),最终体积为50μl。使用Eppendorf Mastercycler 5333来扩增片段,程序为一个循环的98℃,2分钟;5个循环的96℃,30秒,55℃,30秒,和68℃,1分钟;以及35个循环的96℃, 30秒,61℃,30分钟,和68℃,1分钟。35个循环后,反应物在68℃孵育10分钟,然后冷却至10℃直到进一步的处理。
[0559] PCR反应产物(大约400bp)利用TAE缓冲液和每ml 0.1μg溴化乙锭在0.8% TMGTG-琼脂糖凝胶上分离。借助于Dark Reader 观察DNA条带以避免UV-诱导的突变。用一次性刀片切下400bp的DNA条带并根据制造商的指导用Ultrafree-DA Spin Cup纯化。
根据制造商的指导(Invitrogen,Carlsbad,CA)将纯化的DNA条带克隆到pCR2.1 TA-TOPO载体中。根据制造商的指导将2微升的TA-反应物转化进入E.coli TOP10细胞。将转化的细胞接种到补充有100μg/ml氨苄青霉素的2X YT琼脂平板上,并于37℃培养过夜。随机选择8个克隆用于质粒DNA制备。各个克隆在补充有每ml 100μg氨苄青霉素的3ml LB培养基中生长过夜,并利用QIAGEN BioRobot 9600从各个克隆制备质粒DNA。通过Eco RI限制酶消化分析克隆。全部8个克隆具有预期的限制消化模式。然后如上所述,从这些克TM
隆取3个利用标准的M13反向引物,用Big-Dye 终止剂化学测序。序列分析表明全部的3个克隆具有完全的5’端,并且最初的EST克隆pTter39E1只在5’端缺失5个核苷酸。
[0560] 从Tter61E基因的全长序列设计如下所示的融合中的PCR引物来扩增截断的基因,用于克隆进入表达载体pAlLo2,同时在其5’端加入缺失的5个核苷酸。
[0561] 融合中的正向引物:
[0562] 5’-ACTGGATTACCATGCTCGCAAACGGTGCCATCGTCT-3’(SEQ ID NO:46)
[0563] 融合中的反向引物:
[0564] 5’-TCACCTCTAGTTAATTAATCAGCAGCTGAAGACGGCCG-3’(SEQ ID NO:47)
[0565] 粗体字表示编码序列。粗体和加下划线的字母表示如上所述基因5’端的缺失的5个核苷酸。剩余的序列包含与pAlLo2插入位点相同的序列。
[0566] 除了使用pTter39El之外,如实施例7所描述的进行PCR反应。大约700bp的PCR反应产物利用TAE缓冲液和每ml 0.1μg的溴化乙锭在0.8%GTG-琼脂糖凝胶上分离。借TM助于Dark Reader 观察DNA条带以避免UV-诱导的突变。用一次性刀片切下700bp的DNA条带并根据制造商的指导用Ultrafree-DA Spin Cup纯化。
[0567] 纯化的DNA条带根据制造商的指导被克隆进入pCR4-Blunt TOPO载体,如实施例7中所描述的分离E.coli TOP10细胞的转化体。随机选择8个克隆用于质粒DNA制备。各个克隆在补充有每ml 100μg氨苄青霉素的3ml LB中生长过夜,并用于以QIAGEN BioRobot9600制备质粒DNA。通过Pac I/Pst I限制酶消化分析克隆。8个克隆中有7个具有预期TM
的限制消化模式。然后如上所述,从这些克隆中取3个用Big-Dye 终止剂化学,利用标准的M13正反向引物测序。全部3个克隆显示具有Tter61E基因的正确序列。克隆#2被重命名为pTter61E(图17),并如上所述再被转化进入E.coli TOP10细胞。从单个菌落划线,将细胞用于接种2个包含补充有每ml 100μg/m氨苄青霉素的大约1.5ml LB琼脂糖的TM
1.8ml冷冻小管。小瓶用PetriSeal 密封,并保藏在农业研究机构培养物保藏中心,1815 University Street,Peoria,Illinois,61604,保藏号pTter61E NRRL B-30814,保藏日期为2005年1月21日。
[0568] 一旦证实克隆Tter39H8的身份,该质粒被重命名为pTter61G(图18)。将0.5μl等分来自这个克隆的质粒DNA转染进入E.coli TOP10细胞小瓶,轻轻混合,并且在冰上培养10分钟。然后细胞在42℃热休克30秒并且再次在冰上孵育2分钟。使细胞重悬在250μl SOC中,并在37℃以恒定摇动(200rpm)培养60分钟。培养期后,将2个30μl等分接种到补充有每ml 50μg卡那霉素的LB平板上,并在37℃培养过夜。次日挑出单个克隆并划线接种到补充有每ml 50μg卡那霉素的新鲜2XYT平板上,并在37℃培养过夜。从这个平板,将细胞用于接种2个包含补充有每ml 50μg卡那霉素的大约1.5ml LB琼脂糖TM
的1.8ml冷冻小管中。小瓶用PetriSeal 密封,并保藏在农业研究机构培养物保藏中心,
1815 University Street,Peoria,Illinois,61604,保藏号pTter61G NRRL B-30811,保藏日期为2005年1月21日。
[0569] 实施例12:编码具有分解纤维增加活性的家族GH61B、GH61C和GH61D多肽的Thielavia terrestris基因组序列和编码具有分解纤维增加活性的家族GH61E和GH61G多肽的cDNA序列的表征
[0570] 用Applied Biosystems Model 3700 Automated DNA Sequencer,利用3.1版TMBigDye 终止剂化学和dGTP化学(Applied Biosystems,Inc.,Foster City,CA)和引物步行策略进行Thielavia terrestris GH61B基因组克隆(克隆15)和多重叠的GH61C和GH61D基因组克隆的DNA测序。核对核苷 酸序列数据的性质,并且全部的序列借助于PHRED/PHRAP软件(University of Washington,Seattle,WA)相互比较。
[0571] 根据 来自Diplodia gossypina、Trichophaea saccata、和 Pseudoplectania nigrella的同源基因的相似性,构建Thielavia terrestris GH61B、GH61C、和GH61D基因组DNA序列的基因模型。
[0572] Thielavia terrestris GH61B基因的核苷酸序列(SEQ ID NO:1)和推导的氨基酸序列(SEQ ID NO:2)显示在图1A和1B中。编码序列是包括终止密码子的1104bp,并被60和63bp的内含子间断。编码的预测蛋白质是326个氨基酸。编码区是65.8% G+C。利用SignalP程序(Nielsen et al.,1997,Protein Engineering 10:1-6)预测19个残基的信号肽。预测的成熟蛋白质包含分子量为31.3kDa的307个氨基酸。
[0573] 使用Interproscan程序(Zdobnov and Apweiler,2001,Bioinformatics 17:847-848)的GH61B基因的推导氨基酸序列分析显示GH61B基因包含真菌纤维素结合结构域的序列标记。称为Prosite模式PS00562的这个序列标记(Sigrist et al.,2002,Brief Bioinform.3:265-274)被发现是成熟多肽的大约第271至307位残基。
[0574] 氨基酸序列的比较排列利用Smith-Waterman算法(Waterman et al.,1976,Adv.Math.20:367)确定,其中缺口开放罚分为11,缺口延伸罚分为1,且使用BLOSUM62矩阵。该排列显示编码具有纤维素分解增强活性的家族GH61B多肽的Thielavia terrestris基因的推导氨基酸序列与来自Neurospora crassa(登录号EAA26873和EAA36262)的两个家族61蛋白质的推导氨基酸序列共享70%和64%的同一性(包括缺口)。
[0575] Thielavia terrestris GH6lC基因的核苷酸序列(SEQ ID NO:3)和推导的氨基酸序列(SEQ ID NO:4)显示在图2中。编码序列是包括终止密码子的778bp,并被58bp的一个内含子间断。编码的预测蛋白质是240个氨基酸。编码区是66.2% G+C。利用SignalP程序,预测17个残基的信号肽。预测的成熟蛋白质包含分子量为24.1kDa的223个氨基酸。
[0576] 氨基酸序列的比较排列利用Smith-Waterman算法(Waterman et al.,1976,Adv.Math.20:367)确定,其中缺口开放罚分为11,缺口延伸罚分为1,并且使用BLOSUM62矩阵。该排列显示编码具有纤维素分解增强活性的家族GH61C多肽的Thielavia terrestris基因的推导氨基酸序列与来自Neurospora crassa(分别为登录号Q9P3R7和Q7RV41)的两个家族61蛋白质的推导氨基酸序列共享76%和72%同一性。
[0577] Thielavia terrestris GH61D基因的核苷酸序列(SEQ ID NO:5)和推导的氨基酸序列(SEQ ID NO:6)显示在图3中。编码序列是包括终止密码子的913bp,并被70和66bp的内含子间断。编码的预测蛋白质是258个氨基酸。编码区是63.1% G+C。利用SignalP程序,预测19个残基的信号肽。预测的成熟蛋白质包含分子量为25.7kDa的239个氨基酸。
[0578] 氨基酸序列的比较排列利用Smith-Waterman算法(Waterman et al.,1976,Adv.Math.20:367)确定,其中缺口开放罚分为11,缺口延伸罚分为1,并且使用BLOSUM62矩阵。该排列显示编码具有纤维素分解增强活性的家族GH61D多肽的Thielavia terrestris基因的推导氨基酸序列与来自Neurospora crassa(分别为登录号Q9P3R7和Q7RV41)的两个家族61蛋白质的推导氨基酸序列共享53%和53%同一性。
[0579] Thielavia terrestris GH61E基因的cDNA序列(SEQ ID NO:7)和推导的氨基酸序列(SEQ ID NO:8)显示在图4中。编码序列是包括终止密码子的681bp。编码的预测蛋白质是226个氨基酸。GH61E cDNA克隆的%G+C含量是65.6%,而成熟蛋白质编码区(SEQ ID NO:7的第55至681位核苷酸)的%G+C含量是65.4%。利用SignalP程序,预测18个残基的信号肽。预测的成熟蛋白质包含分子量为22.3kDa的208个氨基酸。
[0580] 氨基酸序列的比较排列利用Smith-Waterman算法(Waterman et al.,1976,Adv.Math.20:367)确定,其中缺口开放罚分为11,缺口延伸罚分为1,且使用BLOSUM62矩阵。该排列显示编码具有纤维素分解增强活性的家族GH61E多肽的Thielavia terrestris基因的推导氨基酸序列与来自Neurospora crassa(登录号Q873G1)和另一个来自Magnaporthe grisea(登录号EAA54517)的家族61蛋白质的推导氨基酸序列分别共享73%和53%同一性。
[0581] Thielavia terrestris GH61G基因的核苷酸序列(SEQ ID NO:9)和推导的氨基酸序列(SEQ ID NO:10)显示在图5中。编码序列是包括终止密码子的915bp。编码的预测蛋白质是304个氨基酸。GH61G cDNA克隆的%G+C含量是64.5%,而成熟蛋白质编码区(SEQ ID NO:9的第58至912位核苷酸)的%G+C含量是64.4%。利用SignalP程序,预测19个残基的信号肽。预测的成熟蛋白质包含分子量为30.0kDa的285个氨基酸。
[0582] 使用Interproscan程序的GH61G基因的推导氨基酸序列分析显示GH61G基因包含真菌纤维素结合结构域的序列标记。这个序列标记存在于成熟多肽的大约第271至304位残基。
[0583] 氨基酸序列的比较排列利用Smith-Waterman算法(Waterman et al.,1976,Adv.Math.20:367)确定,缺口开放罚分为11,缺口延伸罚分为1,且使用BLOSUM62矩阵。该排列显示编码具有纤维素分解增强活性的家族GH61G多肽的Thielavia terrestris基因的推导氨基酸序列与来自Neurospora crassa(登录号Q7SCJ5)和另一个来自Gibberella zeae(登录号EAA72972)的家族61蛋白质的推导氨基酸序列分别共享61%和61%同一性。
[0584] 来自Thielavia terrestris NRRL 8126的家族61序列的比较排列利用迭代加工(iterative refinement)和缺省参数的MAFFT NW方法确定(Katoh et al.,2002,Nucleic TM TMAcids Research 30:3059)。利用LASERGENE MEGALIGN 软件(DNASTAR,Inc.,Madison,WI)计算同一性矩阵。排列结果如表1所示。
[0585] 表1.Thielavia terrestris GH61多肽序列的序列对比
[0586] 同一性百分数
[0587]
[0588] 实施例13:构建Thielavia terrestris家族GH61B、GH61C、Gh61D、GH61E、和GH61G基因的米曲霉表达载体
[0589] 设计如下所示的2个合成寡核苷酸引物来从基因组克隆PCR扩增Thielavia terrestris家族GH61B基因。使用InFusion Cloning Kit(BD Biosciences,Palo Alto,CA)将该片段直接克隆进入表达载体,pAILo2,而不需要限制消化和连接。
[0590] 正向引物:
[0591] 5’-ACTGGATTTACCATGAAGTCGTTCACCATTG-3’(SEQ ID NO:48)
[0592] 反向引物:
[0593] 5’-AGTCACCTCTAGTTAGAGGCACTGCGAGTAG-3’(SEQ ID NO:49)
[0594] 粗体字表示编码序列。剩余的序列与pAlLo2的插入位点相同。
[0595] 50皮摩尔的上述各个引物用于PCR反应,其中包含100ng Thielavia terrestris基因组克隆15DNA(如实施例2中描述的制备),1X Pfx扩增缓冲液,1.5μl 10mM dATP、dTTP、dGTP、和dCTP的混合物,2.5单位的Platinum Pfx DNA聚合酶,1μl 50mM MgS04和5μl 10X pCRx增强溶液,最终体积为50μl。扩增条件是一个循环的94℃,2分钟;和30个循环的94℃,15秒,55℃,30秒,和68℃,3分钟。然后加热块达到4℃保温循环。
[0596] 反应产物利用TAE缓冲液在1.0%琼脂糖凝胶上分离,其中从凝胶切下3kb的产物条带并利用QIAquick Gel Extraction Kit根据制造商的指导进行纯化。
[0597] 利用InFusion Cloning Kit将片段克隆进入pAlLo2表达载体。载体用限制内切核酸酶Nco I和Pac I消化(利用制造商说明的条件)。片段通过凝胶电泳和QIAquick凝胶纯化进行纯化。将基因片段和消化的载体在产生表达质粒pEJG108(图19)的反应中连接在一起,其中家族GH61B基因的转录是在NA2-tpi启动子的调控之下。连接反应(20μl)由1X InFusion缓冲液(BD Biosciences,Palo Alto,CA),1X BSA(BD Biosciences,Palo Alto,CA),1μl InFusion酶(1∶10稀释)(BD Biosciences,Palo Alto,CA),100ng用Nco I和Pac I消化的pAlLo2,和100ng Thielavia terrestris GH61B纯化的PCR产物组成。反应在室温下孵育30分钟。使用1μl反应物转化E.coli XL10 Solopac Gold细胞(Stratagene,La Jolla,CA)。通过限制酶消化检测含有pEJG108(GH61B基因)的E.coli转化子,且利用QIAGEN BioRobot 9600制备质粒DNA。
[0598] 以与上述相同的方式,利用下列引物产生Thielavia terrestris家族GH61C和GH61D基因。
[0599] 对于Tter61C:
[0600] 融合中的正向引物
[0601] 5’-ACAACTGGATTTACCATGCGGTTCGACGCCTC-3’(SEQ ID NO:50)
[0602] 融合中的反向引物:
[0603] 5’-GTCAGTCACCTCTAGTTACTAAAACTCGAAGCC-3’(SEQ ID NO:51)
[0604] 对于Tter61D
[0605] 融合中的正向引物
[0606] 5′-ACTGGATTACCATGCTTCTCACATCAG-3′(SEQ ID NO:52)
[0607] 融合中的反向引物:
[0608] 5′-AGTCACCTCTAGTTATCAGGCGGTGAAGTC-3′(SEQ ID NO:53)
[0609] 粗体字表示编码序列。剩余的序列与pAlLo2的插入位点相同。
[0610] 通过限制酶消化分析鉴定包含正确重组表达构建体pEJG111(GH61C基因)和pEJG112(GH61D基因)的E.coli转化体,且利用QIAGEN BioRobot 9600制备质粒DNA。
[0611] 设计如下所示的2个合成寡核苷酸引物来从编码家族GH61G基因的Thielavia terrestris EST pTter61G PCR扩增全长的开放阅读框。使用In-Fusion Cloning Kit(BD Biosciences,Palo Alto,CA)将片段直接克隆进入pAILo2。
[0612] 融合中的正向引物:
[0613] 5’-ACTGGATTACCATGAAGGGACTTTTCAGTGC-3’(SEQ ID NO:54)
[0614] 融合中的反向引物:
[0615] 5’-TCACCTCTAGTTAATTAATTACAAGCACTGCGAGTAGT-3’(SEQ ID NO:55)
[0616] 粗体字表示编码序列。剩余的序列包含与pAlLo2的插入位点相同的序列。
[0617] 50皮摩尔的上述各个引物用于PCR反应,其中包含50ng pTter61G DNA,1X Pfx扩增缓冲液,6μl 10mM dATP、dTTP、dGTP、和dCTP的 混合物,2.5单位的Platinum Pfx DNA聚合酶,1μl 50mM MgSO4,和5μl10X pCRx增强溶液,最终体积为50μl。使用Eppendorf Mastercycler 5333扩增片段,程序为一个循环的98℃,2分钟;和35个循环的94℃,30秒,65℃,30秒,和68℃,1.5分钟。35个循环后,反应物在68℃孵育10分钟,然后冷却至10℃直到进一步的处理。1kb的PCR反应产物利用TAE缓冲液和每ml 0.1μg的溴化乙锭在TM
0.8% GTG-琼脂糖凝胶上分离。借助于Dark Reader 观察DNA条带以避免UV--诱导的突变。用一次性刀片切下1kb的DNA条带并用Ultrafree-DA Spin Cup根据制造商的指导纯化。
[0618] 通过用Nco I和Pac I消化使载体pAlLo2线性化。如上所述通过凝胶电泳和超滤作用纯化片段。用InFusion Cloning Kit将纯化的PCR片段克隆进入线性化且纯化的pAlLo2载体。该反应(20μl)包含1X InFusion缓冲液,lX BSA,1μl InFusion酶(1∶10稀释),100ng用Nco I和Pac I消化的pAlLo2,和50ng Thielavia terrestris GH61G纯化的PCR产物。反应在室温下孵育30分钟。根据制造商的指导使用2微升的反应物转化E.coli XL10 Gold细胞(Stratagene,La Jolla,CA)。恢复期后,将来自转化反应的两个100μl等分接种到补充有每ml 100μg氨苄青霉素的150mm 2X YT平板上。平板在37℃培养过夜。从选择平板随机选择6个推定的重组克隆,并利用QIAGEN BioRobot9600从各个克隆制备质粒DNA。通过Pst I限制酶消化分析克隆。6个克隆中的5个具有预期的限制消化模式,然后测序2个克隆以证实在克隆的插入物中没有突变。选择克隆#1并命名为pAlLo24(图20)。
[0619] 如实施例11中所描述的,用设计为在其5’端添加缺失的5个核苷酸的融合中特异引物来PCR扩增截短的Tter61E基因。然后如上所述将凝胶纯化的条带克隆进入pAlLo2。根据制造商的指导将2微升的TOPO反应物转化E.coli TOP10细胞。将转化的细胞接种到补充有100μg/ml氨苄青霉素的2xYT琼脂平板上,并在37℃培养过夜。随机选择8个克隆,如上所述制备质粒DNA。通过Sac I限制酶消化分析克隆。8个克隆中的7个具有预期的限制消化模式,然后测序4个克隆以证实在克隆的插入物中没有突变。选择克隆#5并命名为pAlLo28(图21)。
[0620] 实施例14:在米曲霉JaL250中表达编码具有纤维素分解增强活性的家族GH61B、GH61C、GH61D、GH61E、和GH61G多肽的Thielavia terrestris基因
[0621] 根据Christensen et al.,1988,Bio/Technology 6:1419-1422的方法制备米曲霉JaL250原生质体。使用5μg pEJG108(以及pAlLo2作为载体对照)转化米曲霉JaL250。
[0622] 用pEJG108(GH61B基因)转化米曲霉JaL250产生大约100个转化体。分离10个转化体至单独的PDA平板。
[0623] 用5ml 0.01% Tween 80洗涤全部转化体的汇合的PDA平板,分别接种到125ml玻璃摇瓶中的25ml MDU2BP培养基中,在34℃,200rpm培养。培养后5天,根据制造商的指导,利用8-16% Tris-Glycine SDS-PAGE凝胶(Invitrogen,Carlsbad,CA)分析来自各个培养物的5μl上清液。培养物的SDS-PAGE分布显示10个转化体中的9个具有大约42kDa的新的主要条带。
[0624] 用10ml 0.01% Tween 20洗涤转化体10(生长在PDA上)的汇合平板,接种到含有500ml MDU2BP培养基的2升Fernbach中以产生用于表征酶的发酵液。在第5天收获培养瓶,利用0.22μm GP Express plus Membrane (Millipore,Bedford,MA)过滤。
[0625] 利用如上所述相同的方案,质粒pEJG111(GH61C基因)和pEJG112(GH61D基因)在米曲霉JaL250中表达。
[0626] 根据Christensen et al.,1988,同上文的方法制备米曲霉Jal250(WO99/61651)原生质体。使用5微克的pAlLo24和pAlLo28(以及pAlLo2作为载体对照)转化米曲霉JaL250原生质体。
[0627] 米曲霉Jal250的转化每个表达构建体产生大约50个转化体。从各个转化分离8个转化体至单独的PDA平板并且在34℃培养5天。
[0628] 用3ml 0.01% Tween 80洗涤汇合的孢子平板,使用孢子悬液接种到125ml玻璃摇瓶中的25ml MDU2BP培养基中。转化体培养物在34℃,以200rpm的恒定摇动培养。接种后第5天,培养物在6000x g离心,并收集其上清液。将5微升的各个上清液与等体积的2X加样缓冲液(10% β-巯基乙醇)混合,并加载到1.5mm 8%-16% Tris-甘氨酸SDS-PAGE凝胶上,用Simply Blue SafeStain(Invitrogen,Carlsbad,CA)染色。培养发酵液的SDS-PAGE分布显示8个pAlLo24转化体中的7个具有大约45kDa的新的蛋白质条带。这个新的蛋白质在SDS-聚丙烯酰胺凝胶上电泳为粗大的拖尾而不是界限分明的条带,暗示或许由于例如糖基化的翻译后修饰而存在多重形式。修饰的这个类型可解释T.terrestris GH61G的推导分子量-33.7kDa-和这些转化 体中新出现的蛋白质的表观分子量之间的差异。选择克隆#3用于进一步的研究。在pAlLo28转化体的情况下,8个pAlLo28转化体中的6个具有非常接近于22.5kDa成熟蛋白质计算重量的大约25kDa的新的蛋白质条带。
[0629] 实施例15:pMJ09的构建
[0630] 载体pMJ04通过从里氏木霉RutC30基因组DNA,利用下列所示的引物993429(反义)和993428(正义),PCR扩增里氏木霉Cel7A纤维二糖水解酶1基因(cbh1)终止子来构建。反义引物被工程化而在5’-端具有Pac I位点,在正义引物的5’-端具有Spe I位点。
[0631] 引物993429(反义):
[0632] 5’-AACGTTAATTAAGGAATCGTTTTGTGTTT-3’(SEQ ID NO:56)
[0633] 引物993428(正义):
[0634] 5’-AGTACTAGTAGCTCCGTGGCGAAAGCCTG-3’(SEQ ID NO:57)
[0635] 扩增反应(50μl)由1X ThermoPol反应缓冲液(New England BioLabs,Beverly,MA),0.3mM dNTPs,100ng里氏木霉RutC30基因组DNA(其利用DNeasy Plant Maxi Kit,QIAGEN Inc.,Valencia,CA分离),0.3μM引物993429,0.3μM引物993428,和2单位的Vent聚合酶(New England BioLabs,Beverly,MA)组成。反应物孵育在Eppendorf Mastercycler 5333中,程序如下:30个循环的94℃,30秒,55℃,30秒,和72℃,30秒(15分钟的最终延伸)。
[0636] 反应产物利用TAE缓冲液,在1.0%琼脂糖凝胶上分离,其中从凝胶切下229bp的产物条带并根据制造商的指导利用QIAGEN QIAquick Gel Extraction Kit纯化。
[0637] 所得到的PCR片段用Pac I和Spe I消化,并且利用快速连接试剂盒(Roche,Indianapolis,IN)连接进入用相同限制酶消化的pAlLo1以产生pMJ04(图22)。
[0638] 载体pMJ06通过从里氏木霉RutC30基因组DNA,利用下列所示的引物993696(反义)和993695(正义),PCR扩增里氏木霉Cel7A纤维二糖水解酶1基因(cbh1)启动子来构建。反义引物被工程化以在正义引物的5’-端具有Sal I位点,而在反义引物的5’-端具有Nco I位点。
[0639] 引物993695(正义):
[0640] 5’-ACTAGTCGACCGAATGTAGGATTGTT-3’(SEQ ID NO:58)
[0641] 引物993696(反义):
[0642] 5’-TGACCATGGTGCGCAGTCC-3’(SEQ ID NO:59)
[0643] 扩增反应(50μl)由1X ThermoPol反应缓冲液,0.3mM dNTPs,100ng里氏木霉RutC30基因组DNA(其利用QIAGEN DNeasy Plant Maxi Kit制备),0.3μM引物993696,0.3μM引物993695,和2单位的Vent聚合酶组成。反应物孵育在Eppendorf Mastercycler
5333中,程序如下:30个循环的94℃,30秒,55℃,30秒,和72℃,60秒(15分钟的最终延伸)。
[0644] 反应产物利用TAE缓冲液,在1.0%琼脂糖凝胶上分离,其中从凝胶切下988bp的产物条带并利用QIAGEN QIAquick Gel Extraction Kit,根据制造商的指导纯化。
[0645] 所得到的PCR片段用Nco I和Sal I消化,并利用快速连接试剂盒连接进入用相同限制酶消化的pMJ04以产生pMJ06(图23)。
[0646] 表达载体pMJ09通过从里氏木霉RutC30基因组DNA,利用下列所示的引物993843(反义)和99344(正义),PCR扩增里氏木霉Cel7A纤维二糖水解酶1基因(cbh1)终止子来构建。反义引物被工程化以在5’-端具有Pac I和Spe I位点,而在正义引物的
5’-端具有Pvu I位点。
[0647] 引物993844(正义):
[0648] 5’-CGATCGTCTCCCTATGGGTCATTACC-3’(SEQ ID NO:60)
[0649] 引物993843(反义):
[0650] 5’-ACTAGTTAATTAAGCTCCGTGGCGAAAG-3’(SEQ ID NO:61)
[0651] 扩增反应(50μl)由1X ThermoPol反应缓冲液,0.3mM dNTPs,100ng里氏木霉RutC30基因组DNA(其利用QIAGEN DNeasy Plant MaXi Kit提取),0.3μM引物993844,0.3μM引物993843,和2单位的Vent聚合酶组成。反应物孵育在Eppendorf Mastercycler
5333中,程序如下:30个循环的94℃,30秒,55℃,30秒,和72℃,60秒(15分钟的最终延伸)。
[0652] 反应产物利用TAE缓冲液,在1.0%琼脂糖凝胶上分离,其中从凝胶切下473bp的产物条带并利用QIAGEN QIAquick Gel Extraction Kit,根据制造商的指导纯化。
[0653] 所得到的PCR片段用Pvu I和Spe I消化并且利用快速连接试剂盒连接进入用Pac I和Spe I消化的pMJ06以产生pMJ09(图24)。
[0654] 实施例16:表达载体pSMAi155的构建
[0655] 根据存在于质粒pPHTI中的E.coli hpt基因(Cummings et al.,1999,Current Genetics 36:371-82),设计下列引物用于扩增:
[0656] 正向(993863):
[0657] 5’-GGGttcgaaTTCATTTAAACGGCT-3’(SEQ ID NO:62)
[0658] Bst BI
[0659] 反向(993864):
[0660] 5’-GGGagcgctCAATATTCATCTCTC-3’(SEQ ID NO:63)
[0661] Eco 47III
[0662] 使用 DNA聚合酶系统(New England BioLabs,Inc.,Beverly,MA)来利用Robocycler Gradient 40(Stratagene,La Jolla,CA)在下列梯度热循环条件下扩增感兴趣的基因:一个循环的95℃,2分钟;25个循环的95℃,1分钟,51℃-65℃,1分钟,和72℃,2分钟;以及1个循环的72℃,7分钟。所得到的1.8kb片段在51℃退火温度被成功扩增并利用QIAquick Gel Extraction Kit凝胶纯化。然后凝胶纯化的片段被克隆进入pCR-BluntII-TOPO(Invitrogen,Carlsbad,CA)而产生pEmY10(图25)。
[0663] 质粒pMJ09用Nsi I消化以移出amdS标记基因。消化物在利用TAE缓冲液的0.7%琼脂糖凝胶上分离,切下3.9kb条带,利用QIAquick Gel Extraction Kit根据制造商建议的方案纯化。根据制造商的方案,该载体利用虾碱性磷酸酶(Roche Diagnostics Corporation,Indianapolis,IN)脱去磷酸。通过用Nsi I消化从质粒pEmY10移出潮霉素抗性基因且如上所述纯化2.0kb片段。这个片段与来自pMJ09的3.9kb片段连接。连接混合物被转化进入E.coli SURE细胞(Stratagene,La Jolla,CA),通过限制分析和DNA测序筛选8个所得到的克隆的正确连接。一个检验的克隆被命名为pSMai149。利用Quickchange Site-Directed Mutagenesis Kit(Stratagene,La Jolla,CA),根据制造商的方案,从pSMai149移出潮霉素抗性基因中的Nco I位点。突变/扩增引物具有下列序列,其中加下划线的G表示突变的位点。
[0664] 5’-GGTCGCGGAGGCGATGGATGCGATCG-3’(SEQ ID NO:64)
[0665] 5’-CGATCGCATCCATCGCCTCCGCGACC-3’(SEQ ID NO:65)
[0666] 通过用Nco I消化筛选8个随机选择的克隆,并且其中之一,显示丢失Nco I位点的标明的克隆7通过DNA测序进一步加以验证并且命名为pSMai155(图26)。
[0667] 实施例17:在里氏木霉中表达编码具有纤维素分解增强活性的家族GH61B、GH61C、GH61D、GH61E和GH61G多肽的Thielavia terrestris基因
[0668] 设计如下所示的2个合成寡核苷酸引物从基因组克隆PCR扩增编码推定的家族GH61B的Thielavia terrestris基因。使用InFusion Cloning Kit使片段直接克隆表达载体,pSMAI155,而不需要限制消化和连接。
[0669] 正向引物:
[0670] 5’-cgcggactgcgcaccATGAAGTCGTTCACCATTG-3’(SEQ ID NO:66)
[0671] 反向引物:
[0672] 5’-tcgccacggagcttaGAGGCACTGCGAGTAG-3’(SEQ ID NO:67)
[0673] 粗体字表示编码序列。剩余的序列与pSMAI155克隆7的插入位点相同。
[0674] 50皮摩尔的上述各个引物用于PCR反应,其中含有10ng Thielavia terrestris基因组克隆15DNA,1X Pfx扩增缓冲液,1.5μl 10mM blend of dATP、dTTP、dGTP、和dCTP的混合物,2.5单位的Platinum Pfx DNA聚合酶,1μl 50mM MgSO4和5μl 10X pCRx增强溶液,最终体积为50μl。扩增条件是一个循环的94℃,2分钟;和30个循环的94℃,15秒,55℃,30秒,和68℃,3分钟。然后加热块达到4℃保温循环。
[0675] 反应产物利用TAE缓冲液,在1.0%琼脂糖凝胶上分离,其中从凝胶切下3kb的产物条带并利用QIAquick Gel Extraction Kit,根据制造商的指导纯化。
[0676] 利用InFusion Cloning Kit将片段克隆进入pSMAI155表达载体。载体用限制内切核酸酶Nco I和Pac I消化。片段通过凝胶电泳和QIAquick纯化而被纯化。在产生表达质粒pEJG110(图27)的反应中将基因片段和消化的载体连接在一起,其中家族GH61B基因的转录里氏木霉CBHI启动子和终止子的调控之下。连接反应物(20μl)由1X InFusion缓冲液,1X BSA(BD Biosciences,Palo Alto,CA),lμl InFusion酶(1∶10稀释),用Nco I和Pac I消化的100ng pSma155,和100ng Thielavia terrestris GH61B纯化的PCR产物组成。反应在室温下孵育30分钟。使用1μl反应物转化E.coli XL10Solopac Gold细胞(Stratagene,La Jolla,CA)。通过限制酶消化检测含有pEJG110质粒的E.coli转化体,利用QIAGEN BioRobot 9600制备质粒DNA。
[0677] 用Applied Biosystems Model 3700 Automated DNA Sequencer,利用3.0版TMBig-Dye 终止剂(Applied Biosystems,Inc.,Foster City,CA)和引物步行策略进行pEJG110的DNA测序。核对核苷酸序列数据的性质全部的序 列借助于PHRED/PHRAP软件(University of Washington,Seattle,WA)相互比较。
[0678] 为了在里氏木霉中表达,从其表达构建体pAlLo28利用下列引物PCR扩增Tter61E基因。
[0679] 正向引物:
[0680] 5’-GCCCATGGACCATGCTCGCAAAC-3’(SEQ ID NO:68)
[0681] 反向引物:
[0682] 5’-CCTCTAGTTAATTAATCAGCAGC-3’(SEQ ID NO:69)
[0683] 同样从其表达构建体pAlLo24利用下列引物PCR扩增Tter61G基因。
[0684] 正向引物:
[0685] 5’-GCCCATGGACCATGAAGGGACTT-3’(SEQ ID NO:70)
[0686] 反向引物:
[0687] 5’-CCTCTAGTTAATTAATTACAAGC-3’(SEQ ID NO:71)
[0688] 如下进行两个实验:
[0689] 50皮摩尔的上述各个引物用于PCR反应,其中含有50ng pAlLo28DNA,1μl10mM dATP、dTTP、dGTP、和dCTP的混合物,5μl 10X DNA聚合酶缓冲液
I(Perkin-Elmer/Applied Biosystems,Inc.,Foster City,CA),和5单位的
DNA聚合酶(Perkin-Elmer/Applied Biosystems,Inc.,Foster City,CA),最终体积为
50μl。使用Eppendorf Mastercycler 5333扩增DNA片段,程序为1个循环的95℃,3分钟;
和25循环的95℃,45秒,55℃,60秒,以及72℃,1分30秒。25个循环后,反应物在72℃孵育10分钟,然后冷却至4℃直到进一步的处理。大约681个碱基的PCR反应产物利用TAE缓冲液和每ml 0.1μg溴化乙锭,在0.8%GTG-琼脂糖凝胶上分离。借助于Dark ReaderTM观察DNA条带以避免UV-诱导的突变。用一次性刀片切下合适的DNA条带,用QIAquick PCR Purification Kit根据制造商的指导纯化。根据制造商的指导(Invitrogen,Carlsbad,CA)将纯化的DNA条带克隆到pCR2.1-TOPO载体中。根据制造商的指导将2微升TOPO-反应物转化进入E.coli TOP10细胞。将转化的细胞接种到补充有100μg/ml氨苄青霉素的2XYT琼脂平板,并于37℃培养过夜。随机选择8个克隆用于质粒DNA制备。各个克隆在补充有每ml 100μg氨苄青霉素的3ml LB培养基中生长过夜,并用于以QIAGEN BioRobot 9600制备质粒DNA。通过限制图谱分析质粒DNA以利用限制内切核酸酶Pac I 和Nco I鉴定GH61E或GH61G阳性插入的克隆。一旦确认克隆具有GH61E或GH61G基因的成功插入,该克隆利用BigDye Terminator Version 3测序保真度,并利用ABI 3700 DNA Analyzer(Foster City,CA)根据制造商的指导进行分析。
[0690] 含有证实的GH61E或GH61G序列的E.coli TOPO克隆DNA用Pac I和Nco I消化,然后反应产物在0.8%琼脂糖凝胶上分辨。用一次性刀片切下合适的DNA条带,用QIAquick PCR Purification Kit根据制造商的指导纯化。
[0691] 质粒pSMai155以相同的方式用Pac I和Nco I消化以产生与GH61片段相容的末端。消化产物在0.8%琼脂糖凝胶上分辨,切下线性的质粒,并用QIAquick PCR Purification Kit根据制造商的指导纯化。
[0692] 根据制造商的指导,利用快速DNA连接试剂盒(Roche,Indianapolis,IN),Pac I/Nco I GH61E或GH61G基因片段被连接进入Pac I/Nco I消化的pSMai155质粒。这个连接物根据制造商的指导用于转化E.coli SURE细胞。选择、培养克隆,如上所述制备质粒。通过限制图谱分析质粒DNA以利用Pac I和Nco I鉴定GH61E或GH61G插入阳性的克隆。具有GH61E基因的正确限制性图谱的克隆之一被命名为pCW095,而具有GH61G基因的正确限制性图谱的一个克隆被命名为pCW096。
[0693] 产生表达载体,pCW076,以利用里氏木霉CBHII启动子用于基因表达。表达载体pSMai155用限制内切核酸酶SalI和Nco I消化以移出CBHI启动子片段。表达构建体pEJG114(图28)也用Sal I和Nco I消化以分离CBHII启动子用于连接进入Sal I/Nco I消化的pSMai155质粒。
[0694] 利用快速DNA连接试剂盒根据制造商的指导,Sal I/Nco I CBHII被连接进入Sal I/Nco I消化的pSMai155。根据制造商的指导,这个连接物用于转化E.coli SURE细胞。选择、培养克隆,如上所述制备质粒。通过限制酶消化分析质粒DNA以利用Sal I和Nco I鉴定CBHII启动子插入阳性的克隆。然后利用下列所示的引物TrCBH2PrSeqF1测序这些克隆以证实CBHII启动子的存在。具有正确序列的克隆之一被命名为pCW076(图29)。
[0695] TrCBH2PrSeqF1:
[0696] 5′-GGATGAAGCTCATTAGCCG-3′(SEQ ID NO:72)
[0697] 为了在里氏木霉中表达,从pTter61D分离Tter61D基因(如实施例7中所描述的,使用限制内切核酸酶Pac I和Nco I)。质粒pCW076以相同的 方式用Pac I和Nco I消化以产生与GH61D片段相容的末端。消化产物利用TAE缓冲液,在0.8%琼脂糖凝胶上分辨,切下线性的片段并利用QIAquick PCR Purification Kit根据制造商的指导纯化。
[0698] Pac I/Nco I GH61D基因片段利用快速DNA连接试剂盒根据制造商的指导被连接进入Pac I/Nco I消化的pCW076。1微升的连接反应物根据制造商的指导用于转化E.coli SURE细胞。选择、培养克隆,如上所述制备质粒。通过限制酶消化分析质粒DNA以利用Pac I和Nco I鉴定GH61D插入阳性的克隆。具有正确限制性图谱的克隆之一被命名为pCW078(图30)。
[0699] 根据Christensen et al.,1988,同上文的方法制备里氏木霉RutC30原生质体。5μg pEJG110、pCW095、pCW096、或pCW078用于转化里氏木霉RutC30。各个单独的转化产生大约100个转化体。从各个转化分离60个转化体至单独的Cove/10mM尿嘧啶平板,并在
28℃培养7天。
[0700] 一次8个一批地分析转化体菌株。用无菌环从8个单独的平板收集孢子,分别接种进入125ml玻璃摇瓶中的25ml CIM培养基中,并在28℃,250rpm培养。接种后5天,利用7.5% Tris SDS-PAGE凝胶(BioRad,Hercules,CA),根据制造商的指导分析来自各个培养物的0.5μl上清液。培养物的SDS-PAGE图谱显示20%至50%的转化体生产相应于新导入基因的新的蛋白质条带。从各个表达构建体选择合适的转化体用于进一步的研究。
[0701] 实施例18:鉴定烟曲霉基因组序列中β-葡糖苷酶家族GH3A基因
[0702] 烟曲霉的部分基因组序列(The Institute for Genomic Research,Rockville,MD)的Blast搜索(Altschul et al.,1997,Nucleic Acids Res.25:3389-3402)利用查询来自棘孢曲霉的β-葡糖苷酶蛋白质序列(登录号P48825)来进行。基于与询问序列在氨基酸水平的高度相似性,几个基因被鉴定为推定的家族GH3A同系物。选择与询问序列在氨基酸水平具有大于70%同一性的大约3000bp的一个基因组区用于进一步的研究。
[0703] 实施例19:烟曲霉基因组DNA提取
[0704] 烟曲霉于37℃和240rpm生长在带有挡板的摇瓶中的250ml马铃薯右旋糖培养基中。通过过滤收获菌丝体,在TE(10mM Tris-1mM EDTA)中洗涤两次,并在液氮下冷冻。通过研钵和研棒磨碎冷冻的菌丝体至精细粉末,将其重悬在含有10mM Tris,100mM EDTA,1% Triton X-100,0.5M胍-HCl,和200mM NaCl的pH 8.0缓冲液中。将无Dnase的RNase A以20mg/升的浓度加入,且裂解物在37℃孵育30分钟。通过离心除去细胞碎片, 利用Maxi
500柱(QIAGEN Inc.,Valencia,CA)分离DNA。该柱在用30ml QC洗涤的10ml QBT中平衡,并用15ml QF(全部缓冲液来自QIAGEN Inc.,Valencia,CA)洗提。DNA在异丙醇中沉淀,在70%乙醇中洗涤,并通过离心回收。DNA重悬在TE缓冲液。
[0705] 实施例20:家族GH3A β-葡糖苷酶基因的克隆和米曲霉表达载体的构建
[0706] 设计如下所示的2个合成寡核苷酸引物从实施例19中制备的基因组DNA来PCR扩增编码家族GH3A β-葡糖苷酶的烟曲霉基因。使用InFusion Cloning Kit将片段直接克隆进入表达载体,pAILo2,而不需要限制消化和连接。
[0707] 正向引物:
[0708] 5’-ACTGGATTTACCATGAGATTCGGTTGGCTCG-3’(SEQ ID NO:73)
[0709] 反向引物:
[0710] 5’-AGTCACCTCTAGTTACTAGTAGACACGGGGC-3’(SEQ ID NO:74)
[0711] 粗体字表示编码序列。剩余的序列与pAlLo2的插入位点相同。
[0712] 50皮摩尔的上述各个引物用于PCR反应,其中含有100ng烟曲霉基因组DNA,1X Pfx扩增缓冲液,1.5μl 10mM dATP、dTTP、dGTP、和dCTP的混合物,2.5单位的Platinum Pfx DNA聚合酶,1μl 50mM MgSO4,和2.5μl 10X pCRx增强溶液,最终体积为50μl。扩增条件是一个循环的94℃,2分钟;和30个循环的94℃,15秒,55℃,30秒,和68℃,3分钟。然后加热块达到4℃保温循环。
[0713] 反应产物利用TAE缓冲液,在1.0%琼脂糖凝胶上分离,其中从凝胶切下3kb的产物条带并利用QIAquick凝胶提取试剂盒根据制造商的指导纯化。
[0714] 然后利用InFusion Cloning Kit将片段克隆进入pAlLo2表达载体。载体用限制内切核酸酶Nco I和Pac I(利用制造商说明的条件)消化。片段通过凝胶电泳和QIAquick凝胶纯化来进行纯化。在产生表达质粒pEJG97(图31)的反应中将基因片段和消化的载体连接在一起,其中家族GH3A β-葡糖苷酶基因的转录在NA2-tpi启动子调控之下。连接反应物(20μl)由1X InFusion缓冲液,1X BSA(BD Biosciences,Palo Alto,CA),1μl InFusion酶(1∶10稀释), 用Nco I和Pac I消化的150ng pAlLo2,和50ng烟曲霉β-葡糖苷酶纯化的PCR产物组成。反应在室温下孵育30分钟。使用1μl反应物转化E.coli XL10Solopac Gold细胞(Stratagene,La Jolla,CA)。通过限制酶消化检测含有pEJG97质粒的E.coli转化体,利用QIAGEN BioRobot 9600制备质粒DNA。
[0715] 实施例21:编码家族GH3A β-葡糖苷酶的烟曲霉基因组序列的表征
[0716] 来自pEJG97的烟曲霉β-葡糖苷酶基因的DNA测序用Perkin-Elmer Applied Biosystems Model 377 XL Automated DNA Sequencer(Perkin-Elmer/AppliedBiosystems,Inc.,Foster City,CA),利用染料-终止剂化学(Giesecke et al.,1992,Journal of Virology Methods 38:47-60)和引物步行策略进行。核对核苷酸序列数据的性质,全部的序列借助于PHRED/PHRAP软件(University of Washington,Seattle,WA)相互比较。
[0717] 根据与来自棘孢曲霉、黑曲霉、和Aspergillus kawachii的同源基因的相似性构建烟曲霉序列的基因模型。核苷酸序列(SEQ ID NO:75)和推导的氨基酸序列(SEQ ID NO:76)显示在图32A和32B中。该基因组片段编码由62、55、58、63、58、58、63和51个bp的8个内含子间隔的863个氨基酸的多肽。该基因的%G+C含量是54.3%。利用SignalP软件程序(Nielsen et al.,1997,同上文),预测19个残基的信号肽。预测的成熟蛋白质包含分子量为91.7kDa的844个氨基酸。
[0718] 利用Clustal W方法(Higgins,1989,CABIOS 5:151-153),利用LASERGENETM TMMEGALIGN 软件(DNASTAR,Inc.,Madison,WI)确定β-葡糖苷酶序列的比较排列,其中使用同一性表格和下列多个排列参数:缺口罚分为10,缺口长度罚分为10。成对排列参数是Ktuple=1,缺口罚分=3,窗口=5,以及对角线=5。排列对比显示烟曲霉β-葡糖苷酶基因的推导氨基酸序列与棘孢曲霉(登录号P48825)、黑曲霉(O00089)、和Aspergillus kawachii(P87076)β-葡糖苷酶的推导氨基酸序列共享78%、76%、和76%的同一性。
[0719] 实施例22:烟曲霉家族GH3A β-葡糖苷酶基因在米曲霉JaL250中的表达
[0720] 米曲霉JaL250原生质体根据Christensen et al.,1988,同上文的方法制备。使用5μg pEJG97(以及pAlLo2作为载体对照)转化米曲霉JaL250。
[0721] 用pEJG97转化米曲霉JaL250产生大约100个转化体。分离10个转化体至单独的PDA平板。
[0722] 10个转化体中取5个汇合的PDA平板用5ml 0.01% Tween 80洗涤,分别接种到125ml玻璃摇瓶中的25ml MDU2BP培养基中,于34℃,200rpm培养。培养后5天,利用8-16% Tris-甘氨酸SDS-PAGE凝胶(Invitrogen,Carlsbad,CA)根据制造商的指导分析来自各个培养物的0.5μl上清液。培养物的SDS-PAGE分布图显示转化体中的一个(命名为转化体
1)具有大约130kDa的主要条带。
[0723] 转化体1(生长在PDA上)的汇合平板用10ml 0.01% Tween 20洗涤,接种进入含有400ml MDU2BP培养基的2升Fembach以产生用于表征该酶的发酵液。在第5天收获培养瓶,利用0.22μm GP Express plus Membrane(Millipore,Bedford,MA)过滤。
[0724] 实施例23:烟曲霉家族GH3A β-葡糖苷酶基因在里氏木霉中的表达
[0725] 设计如下所示的2个合成寡核苷酸引物来从实施例20中描述的pEJG97PCR扩增烟曲霉β-葡糖苷酶。使用InFusion Cloning Kit将该片段直接克隆进入表达载体,pMJ09,而不需要限制消化和连接。
[0726] 正向引物:
[0727] 5’-GGACTGCGCACCATGAGATTCGGTTGGCTC-3’(SEQ ID NO:77)
[0728] 反向引物:
[0729] 5’-TCGCCACGGAGCTTACTAGTAGACACGGGG-3’(SEQ ID NO:78)
[0730] 粗体字表示编码序列。剩余的序列与pMJ09的插入位点相同。
[0731] 50皮摩尔的上述各个引物用于PCR反应(50μl),其中包含100ng pEJG97DNA,1X Pfx扩增缓冲液,1.5μl 10mM dATP、dTTP、dGTP、和dCTP的混合物,2.5单位的Platinum Pfx DNA聚合酶,1μl 50mM MgSO4,和2.5μl 10X pCRx增强溶液。扩增条件是一个循环的94℃,2分钟;和30个循环的94℃,15秒,55℃,30秒,和68℃,3分钟。然后加热块达到4℃保温循环。
[0732] 反应产物利用TAE缓冲液,在1.0%琼脂糖凝胶上分离,其中从凝胶切下3kb的产物条带并利用QIAGEN QIAquick凝胶提取试剂盒根据制造商的指导纯化。
[0733] 然后纯化的3kb片段利用InFusion Cloning Kit被克隆进入pMJ09。载体用Nco I和Pac I消化。如上所述片段通过凝胶电泳和QIAquick凝胶纯化 来进行纯化。在产生表达质粒pEJG107(图33)的反应中将基因片段和消化的载体连接在一起,其中家族GH3A β-葡糖苷酶基因的转录在里氏木霉cbhI启动子的调控之下。连接物(50μl)由1X InFusion缓冲液,1X BSA,1μl InFusion酶(1∶10稀释),100ng用Nco I和Pac I消化的pMJ09,和100ng烟曲霉β-葡糖苷酶纯化的PCR产物组成。反应在室温下孵育30分钟。使用1μl反应物转化E.coli电感受态的SURE细胞(Stratagene,La Jolla,CA)。通过限制酶消化检测含有pEJG107质粒的E.coli转化体,利用QIAGEN BioRobot 9600制备质粒DNA。
[0734] 利用染料终止剂化学(Giesecke et al.,1992,Journal of Virology Methods38:47-60)和引物步行策略,用Perkin-Elmer Applied Biosystems Model 377XL Automated DNA Sequencer(Perkin-Elmer/Applied Biosystems,Inc.,Foster City,CA)进行来自pEJG107的烟曲霉β-葡糖苷酶基因的DNA测序。核对核苷酸序列数据的性质,全部的序列借助于PHRED/PHRAP软件(University of Washington,Seattle,WA)相互比较。
[0735] 根据Christensen et al.,1988,同上文的方法制备里氏木霉RutC30原生质体。使用5μg pEJG107转化里氏木霉RutC30。该转化产生大约100个转化题。分离60个转化体至单独的COVE/10mM尿嘧啶平板并于28℃培养。
[0736] 从用无菌环将60个转化体中的8个击打3次的平板收集孢子,分别接种进入125ml玻璃摇瓶中的25ml CIM培养基中并在28℃,250rpm培养。培养后5天,利用7.5% Tris SDS-PAGE凝胶(Biorad,Hercules,CA),根据制造商的指导分析来自各个培养物的
0.5μl上清液。培养物的SDS-PAGE分布图显示转化体之一(命名为转化体1)具有大约
130kDa的新的主要条带。
[0737] 实施例24:具有纤维素分解增强活性的Thielavia terrestris多肽的纯化和表征
[0738] Thielavia terrestris NRRL 8126摇瓶培养物生长于44℃,175rpm在500ml带有挡板的摇瓶中的100ml NNCYPmod培养基中。培养瓶用来自相同培养基的新鲜琼脂平板的栓塞(大约2平方cm)接种,在收获前容许生长大约3-5天。通过在9500x g离心培养物大约10分钟获得未加工的发酵液样品以除去细胞物质和任何残余碳源。然后如上所述再次离心所得到的上清液。使用上清液作为生化分析的原材料,当不用时储存在4℃。
[0739] 通过将Thielavia terrestris培养在具有每升52g纤维素的NNCYP培养基上,使Thielavia terrestris发酵罐培养物生长,其在42℃发酵期间分批(没 有附加的碳源)并保持在pH 5.0。容许发酵流动直到分批的纤维素已经耗尽(一般为大约40小时)时收获发酵液,并如上所述离心除去菌丝体。
[0740] 在进行蛋白质纯化实验前,通过利用Centricon Plus 20(Millipore,Bedford,MA)过滤装置,在浮桶式转头离心机上(Sorvall,RC3B Plus)浓缩澄清的上清液样品来制备Thielavia terrestris发酵液的小规模制品。将大约3ml各个浓缩物加载到10DG Econo PAC (BioRad,Hercules,CA)用50mM乙酸钠pH 5.0平衡的脱盐柱上,利用4ml 50mM乙酸钠pH 5.0洗提样品。对于Thielavia terrestris发酵液(大约0.5升至10升)的大规模制备,利用如下所述的方案。通过在9500x g.离心培养物大约20分钟来清除未加工发酵液样品的细胞碎片。然后过滤(GP Express membrane,聚醚砜,0.22μm,Millipore,Bedford,MA)澄清的发酵液样品,缓冲交换50mM乙酸钠pH 5.0(Pall Filtron,North Borough,MA,10kDa聚醚砜膜,大约10-20psi),利用Amicon超滤装置(Millipore,Bedford,MA,10kDa膜,40psi,4℃)浓缩。利用其中牛血清白蛋白用作蛋白质标准的BCA蛋白质分析试剂盒(Pierce,Rockford,IL)来确定蛋白质浓度。一般在其中包括精确分子量标准(BioRad,Hercules,CA)的8-16% SDS-PAGE凝胶(Invitrogen,Carlsbad,CA;200V,1小时)上检验来自脱盐步骤的等分样品。利用Biosafe考马斯染色剂(BioRad,Hercules,CA)染色凝胶的蛋白质,并用去离子的H2O脱色。
[0741] 将Thielavia terrestris上清液加载到用20mM Tris-HCl pH 8.2平衡的Q Sepharose Big Bead柱(Amersham Pharmacia,Uppsala Sweden)上。收集流过的物质并储存在4℃备用。在洗提前,柱子用5个柱体积的起始缓冲液洗涤。结合材料用20mM Tris-HCl pH 8.2缓冲液中线性梯度为0至0.40M的NaCl(15个柱体积;10ml级分)洗提。根据UV图谱(A280nm),汇集表示可分辨蛋白质峰的单独级分用于表征,并且缓冲交换50mM乙酸钠pH5.0(Ultrafree Biomax 10kDa NMWL膜,Millipore,Bedford,MA)。
[0742] 然后利用Phenyl Superose柱(HR 16/10 Pharmacia Biotech,Uppsala Sweden),利用如下所述的方案进一步分离标明为Thielavia terrestris Q Sepharose Big Bead的级分。将固体硫酸铵加入待分离的样品产生最后浓度为1.7M的(NH4)2SO4。然后离心和过滤(10分钟,5,000x g,RT;0.22μm GP Express membrane,Millipore,Bedford,MA)样品,以在加载到用含1.7M(NH4)2SO4的20mM Tris-HCl pH 8.2平衡的Phenyl Superose柱上之前除去颗粒物质。利用20mM Tris-HCl pH 8.2中递减线性梯度(利用去离子的H2O, 15个柱体积)为1.7M的(NH4)2SO4实现结合物质的洗提。根据A280nm吸光率汇集级分以富集可分辨峰的面积。利用Amicon超滤装置(聚醚砜膜,5kDa NMWL,Bedford,MA),汇集物被缓冲交换进入50mM乙酸钠pH 5.0。利用BCA蛋白质分析试剂盒确定蛋白质浓度,如实施例1中所描述的在8-16%Tris-甘氨酸SDS-PAGE凝胶上分析。
[0743] 玉米秸在美国能源部国家可更新能源实验室(NREL)利用稀硫酸预处理。下列条件用于预处理:1.4wt%硫酸,在165℃和107psi,8分钟。根据NREL,预处理的玉米秸(PCS)中不溶于水的固体包含56.5%纤维素、4.6%半纤维素和28.4%木质素。纤维素和半纤维素利用NREL标准分析方法#002,通过两步的硫酸水解,以及随后通过高效液相色谱法分析糖而测定。木质素利用NREL标准分析方法#003,在用硫酸水解纤维素和半纤维素级分后重量分析测定。在酶促水解前,PCS用大体积的DDI水在玻璃滤器上洗涤;发现水洗PCS的干重是24.54%。碾磨的PCS(干重32.35%)通过在咖啡-研磨机中碾磨,以及随后用去离子水在22μm Millipore过滤器(6P Express Membrane,Stericup,Millipore,Bedford,MA)上洗涤从水洗PCS制备。
[0744] 利用1.1ml Immunoware微试管(Pierce,Rockford,IL),利用1.0ml的总反应体积进行PCS的水解。在这个方案中,在存在纤维素酶蛋白质加样的3%米曲霉β-葡糖苷酶(根据WO 02/095014在米曲霉中重组生产)或3%烟曲霉β-葡糖苷酶(根据实施例22在米曲霉中重组生产)时,利用Thielavia terrestris发酵液的不同蛋白质加样(表示为每克PCS的mg酶)或 1.5L样品(Novozymes A/S, Denmark)进行PCS的水解(10mg/ml,在50mM乙酸钠pH 5.0缓冲液中)。Thielavia terrestris蛋白质级分的PCS水解能力的筛选在50℃进行(Isotemp 102S水浴或TS Autoflow CO2Jacketed Incubator)。一般地,反应以一式四份进行,在水解过程中取等分样品。PCS水解反应通过混合20μl等分量的各个水解产物和180μl 0.11M NaOH(停止反应剂)而停止。对于各个样品产生合适的连续稀释,利用下列所述适合96孔微平板规格的对羟基苯甲酸酰肼(PHBAH,Sigma,St.Louis,MO)分析来测定还原糖含量。简要地,将90μl等分量的适当稀释样品置于96孔锥形底微平板中。反应通过向各个孔加入在2% NaOH中的60μl 1.5%(w/v)PHBAH起始。平板在95℃无盖加热10分钟。容许平板冷却至室温(RT),向各个孔加入50μl蒸馏的H2O。从各个孔取100μl等量转移至平底的96孔平板,利用SpectraMax Microplate Reader (Molecular Devices, Sunnyvale,CA)测量在A410nm处的吸光率。使用葡萄糖标准(用0.4%氢氧化钠稀释为0.1-0.0125mg/ml)制备标准曲线以转化所得到的A410nm值为葡萄糖当量。使用所得到的当量计算各个反应中PCS纤维素转化的百分比。
[0745] 利用下列等式计算纤维素转化至还原糖的程度(转化率,%):
[0746] 转化率(%)=RS(mg/ml)*100*162/(纤维素(mg/ml)*180)=
[0747] =RS(mg/ml)*100/(纤维素(mg/ml)*1.111)
[0748] 在这个等式中,RS是按葡萄糖当量计量的溶液中还原糖的浓度(mg/ml),而因子1.111反映转化纤维素至葡萄糖中的重量增加。
[0749] 为了重新构成最初Thielavia terrestris发酵液PCS水解活性,来自QSepharose Big Bead柱的选择汇集物(汇集物A到F)以相等的比率混合,并且检验其PCS水解活性。最接近起始原材料PCS活性的混合物(Thielavia terrestris发酵液,5mg酶加载=77% PCS纤维素转化)是由汇集物A+B+C+E组成的混合物(5mg酶加载=83% PCS纤维素转化)。
[0750] 其中Thielavia terrestris Q Sepharose Big Bead汇集物(流过物质)在Phenyl Superose柱上分离的FPLC流动(AKTA Design,Amersham Pharmacia Biotech,Uppsala Sweden)产生随后被汇集的多个级分,且如先前所述进行缓冲交换。根据各个汇集样品的蛋白质浓度(BCA蛋白质分析试剂盒),从这个分级分离步骤回收总蛋白质加载的大约43%。
[0751] 为了筛选能够增强 性能的Thielavia terrestris样品,进行PCS水解反应(1.0ml方案,每升10g PCS,50℃,通过添加3%的总加载的米曲霉β-葡糖苷酶补充),其中2.5mg酶加载 1.5L与2.5mg酶加载的各个汇集的样品(每个
反应5mg酶加载的总蛋白)混合。 1.5L对照反应由分别产生86%、75%和
53%的PCS纤维素转化值的10mg酶加载、5mg酶加载和2.5mg酶加载组成。所得到的PCS水解的分析显示一个汇集的样品当以50∶50的蛋白质比率加入 1.5L时,5mg
酶的总加载超过5mg酶加载的 1.5L对照反应(79%对75%)。当在8-16%
丙烯酰胺梯度凝胶上分析时,这个样品显示包括大约42kDa的主要蛋白质条带。
[0752] 实施例25:通过表达烟曲霉β-葡糖苷酶里氏木霉发酵肉汤Thielaviaterrestris GH61B对预处理玉米秸水解的影响
[0753] 使Thielavia terrestris GH61B(如实施例12中所描述的在米曲霉中重组表达)脱盐并在水解实验前利用具有Biomax-5膜(5000 NMWL;Millipore, Bedford,MA)的Centricon Plus-20离心滤器交换至50mM乙酸钠pH 5.0。表达烟曲霉β-葡糖苷酶(参见实施例23)的无细胞里氏木霉发酵肉汤用于水解试验而没有脱盐或缓冲交换。
[0754] 酶样品中的蛋白质浓度通过如BCA蛋白质分析反应剂试剂盒(Pierce Chemical Co.,Rockford,IL)的指导所描述的BCA微平板分析确定。表达烟曲霉β-葡糖苷酶(参见实施例23)的无细胞里氏木霉发酵肉汤另外在测定蛋白质浓度之前根据制造商的指导通过Bio Spin 6柱(Bio-Rad Laboratories,Hercules,CA)而脱盐。
[0755] 在各个实验前从储存在-20℃的酶储液新鲜制备酶稀释物。
[0756] 还原糖(RS)利用被改进和适应于96-孔微平板规格的p-羟基苯甲酸酰肼(PHBAH)分析(Lever,M.,1972,A new reaction for colorimetric determination of carbohydrates,Anal.Biochem.,47:273-279)测定。
[0757] 将90-μl等分量的稀释样品置于96-孔锥形底微平板(Corning Inc.,Acton,MA,Costar,clear polycarbonate)的各个孔中。分析通过向各个孔加入60μl在2%氢氧化钠中的1.25% PHBAH而开始。无盖的平板在定制的加热块上于95℃加热10分钟。微平板冷却至室温后,向各个孔加入35μl去离子水。从各个孔移出100-μl等分,转移至平底的96-孔平板(Corning Inc.,Acton,MA,Costar,结合培养基的聚苯乙烯)。利用SpectraMAX微平板读取仪(Molecular Devices,Sunnyvale,CA)测量在410nm(A410)处的吸光率。利用标准曲线将A410值转化成为葡萄糖当量。
[0758] 由6个与样品相似处理的葡萄糖标准(0.005、0.010、0.025、0.050、0.075、和0.100mg/ml)获得标准曲线。通过用去离子水稀释10mg/ml的葡萄糖储液制备葡萄糖标准。
[0759] 利用实施例24中描述的相同等式计算纤维素转化为还原糖的程度(转化率,%)。
[0760] 碾磨的PCS(按干重为1% w/v)通过以每g PCS 2.5、5、10、和20mg蛋白质表达烟曲霉β-葡糖苷酶的无细胞里氏木霉发酵肉汤(见实施例23)的水解在用Deepwell Mats96(Brinkmann,Westbury,NY)覆盖的Deepwell Plates96(1.2ml,Brinkmann,Westbury,NY)中进行。初始体积为1ml的全部反应物在50mM乙酸钠pH 5.0中泳动,其中在50℃、55℃、和60℃间歇搅拌。
[0761] 每g PCS 5mg的包含里氏木霉发酵肉汤的反应物用每g PCS 1mg(20%纤维素酶蛋白质加载)的Thielavia terrestris GH61B(如在此描述的在米曲霉中重组生产)补充,并且该结果与未补充的反应物相比较。
[0762] 利用8-道移液器在特定的时间点从PCS水解反应物移出20μl等分,并加入MultiScreen HV 96-孔过滤平板(Millipore,Bedford,MA)中的180μl碱性混合物(102mM Na2CO3和58mM NaHCO3)以终止反应。样品被真空过滤进入另一个平底微平板以除去PCS残余物。适当稀释后,利用PHBAH分析如实施例24中所描述的分析滤出液的RS。
[0763] 如图34和35所示的结果表明补充表达烟曲霉β-葡糖苷酶(参见实施例23)的里氏木霉发酵肉汤,其中Thielavia terrestris GH61B蛋白质与未补充的肉汤相比提高94小时的水解产量16-30%并且降低酶加载的需要量。在50℃和55℃,94小时的相同纤维素转化率(conversion)可利用总蛋白质加载为每g PCS 6mg的补充的发酵肉汤和每g PCS10mg的总蛋白质加载的非补充发酵肉汤获得。
[0764] 实施例26:用在米曲霉中重组表达的Thielavia terrestris GH61B水解预处理的玉米秸(PCS)
[0765] 表达Thielavia terrestris GH61B的米曲霉转化体如下生长在摇瓶(SF)培养物中。用5毫升0.01% Tween 80的含水溶液收集孢子,用MDU2BP洗涤一次或两次以上以最大化收集孢子的数目。孢子悬浮液用于接种到2升Fernbach培养瓶中的500毫升MDU2BP培养基中。转化体培养物在34℃以恒定振荡(200rpm)培养。接种后5天,通过在具有孔径大小为0.45μm的500毫升,75mm尼龙过滤装置上过滤来收集培养肉汤。通过SDS-PAGE分析5μl发酵液样品。含有rGH61B的发酵液包含一个大约42,000MW的主要条带。
[0766] 在通过在搅拌细胞中加压超滤(Amicon,PM10 membrane with 10kD MWCO)浓缩至大约15X浓缩,然后利用Econo-Pac 10DG柱(BioRad)脱盐/缓冲交换成为柠檬酸缓冲液(50mM,pH 5.0)前,该发酵液储存在-20℃。通过BCA蛋白质分析试剂盒分析蛋白质浓度后,酶原液储存在-20℃。蛋白质没有进一步纯化,根据测量的总蛋白质,原液被加入反应混合物。
[0767] PCS的水解利用1.1ml Immunoware微试管或1ml深孔块(VWR),利用1.0ml的总反应体积进行。PCS的水解(在50mM乙酸钠pH 5.0缓冲液中为10mg/ml)利用有或没有加入 1.5L的重组Thielavia terrestris GH61B蛋白质的不同蛋白质加载(表示为每克PCS mg酶),在存在3%烟曲霉β-葡糖苷酶(BG,3%纤维素酶蛋白质加载)时进行。水解混合物的孵育在50℃进行(Isotemp 102S水浴或具有增湿作用的TS Autoflow CO2Jacketed培养箱)。一般地,反应以一式三份进行,在水解过程中取等分样品。报道的数据是三份的平均数。PCS水解反应通过混合20μl等分的各个水解产物和180μl PCS终止缓冲液(0.102M Na2CO3,0.058M NaHCO3,pH~10)停止。立即分析样品或冷冻储存在-20℃。
还原糖含量利用适应于96孔微平板规格的p-对羟基苯甲酸酰肼(PHBAH)分析测定。简要地,将100μl等分适当稀释的样品置于96孔锥形底微平板中。反应通过向各个孔添加在
2% NaOH中的50μl 1.5%(w/v)PHBAH而起始。平板在95℃无盖加热10分钟。容许平板冷却至RT并向各个孔加入50ul ddH2O。将来自各个孔的100μl等分转移至平底的96孔平板,并利用SpectraMax微平板读取仪(Molecular Devices)测量在A410nm处的吸光率。
使用葡萄糖标准(用0.4%氢氧化钠稀释为0.1-0.0125mg/ml)制备标准曲线以转化所得到的A410值成为葡萄糖当量(基于从理论上纤维素至葡萄糖的完全转化率预期的产量)。使用所得到的当量计算各个反应中PCS纤维素转化的百分比。以葡萄糖当量(转化百分比)对总蛋白质加载(mg酶/g PCS)对结果进行作图。
[0768] 为了检验Thielavia terrestris GH61B蛋白质增强 1.5L活性的能力,利用1.0ml PCS微方案,测试2.5mg 1.5L加每g PCS 0.078至1.25mg的
GH61B蛋白质混合物的剂量依赖的PCS水解。为了比较的目的,对于没有加入GH61B蛋白质的 1.5L进行相似的总蛋白质加载。全部样品具有3%总纤维素酶加载的补
充的烟曲霉β-葡糖苷酶。
[0769] 表2中所示的结果证明加入不同量的Thielavia terrestris GH61B蛋白质至所得到的总酶加载为2.578至3.75mg/g PCS的2.5mg/g PCS 1.5L,增加葡萄糖转化率超过通过没有GH61B蛋白质的 1.5L,在2.5或3.75mg/g PCS酶加
载水平所得到的转化率。将仅仅0.078mg GH61B蛋白质加入2.5mg 1.5L提
高PCS水解超过没有GH61B蛋白质的3.75mg 1.5L所测得的数量。因此,将
GH61B蛋白质加入含有 1.5L的溶液,当水解酸预处理的玉米秸(PCS)时,增
加还原糖(主要为葡萄糖和残余纤维二糖)的产量。产量增加高于通过添加等于或少于
1.5L数量所获得的产量,导致降低酶加载的需要量并且增加酶的效率。
[0770] 表2. 和GH61B值是mg酶/g PCS,而葡萄糖是理论产量的百分比。全部混合物包含3% w/w加入的β-葡糖苷酶以增加纤维二糖至葡萄糖的转化率。葡萄糖转化率显示为通过PCS水解可得到的理论上葡萄糖的百分比。
[0771]
[0772] 实施例27:用在米曲霉中重组生产的GH61B、GH61E和GH61G多肽水解预处理的玉米秸(PCS)
[0773] 以如实施例24和25中描述的相同系列的PCS水解反应来测试3个家族61多肽,包括Thielavia terrestris GH61B、GH61E、和GH61G。全部的家族61多肽如实施例14中所描述的在米曲霉中表达,利用装有PM10膜,10kDa截留(Millipore,Billerica,MA)的Amicon stirred cell浓缩发酵液,并利用Econo-Pac 10DG柱(BioRad Laboratories,Hercules,CA)脱盐。通过BCA(Pierce,BSA用作标准)分析蛋白质浓度后,这些酶原液储存在-20℃。蛋白质没有进一步纯化,根据测量的总蛋白质,原液被加入反应混合物。
[0774] PCS的水解(在50mM乙酸钠pH 5.0缓冲液中为10mg/ml)利用总反应体积为1.0ml的1.1ml Immunoware微试管(Pierce,Rockford,IL)进行。测试家族61多肽增强来源于表达米曲霉β-葡糖苷酶(WO 02/095014)的里氏木霉发酵液的纤维酶制剂水解性能的能力,该酶制剂在此称为Tr/AoBG,获得自Novozymes A/S, Denmark。PCS
的水解利用补充有每克PCS 0.2mg GH61多肽的每克PCS 2.5mgTr/AoBG进行。PCS水解在
50℃(TS Autoflow CO2 Jacketed培养箱)进行。重复进行反应,在水解过程中取等分 样品。PCS水解反应通过混合20μl等分的各个水解产物和180μl 0.11M NaOH(终止试剂)来停止。对于各个样品产生适当的连续稀释,还原糖含量如下所述利用适应于96孔微平板规格的对羟基苯甲酸酰肼(PHBAH,Sigma,St.Louis,MO)分析来测定。简要地,将90μl等分适当稀释的样品置于96孔锥形底微平板中。反应通过向各个孔添加在2% NaOH中的60μl 1.5%(w/v)PHBAH起始。平板在95℃无盖加热10分钟。容许平板冷却至室温(RT),向各个孔加入50μl蒸馏H2O。从各个孔取100μl等分转移至平底的96孔平板,利用SpectraMax微平板读取仪(Molecular Devices,Sunnyvale,CA)测量A410nm处的吸光率。
使用葡萄糖标准(用0.4%氢氧化钠稀释为0.1-0.0125mg/ml)制备标准曲线以转化所获得的A410nm值为葡萄糖当量。使用所得到的当量计算各个反应中PCS纤维素转化的百分比。
[0775] 利用实施例24中描述的相同等式计算纤维素转化为还原糖的程度(转化率,%)。
[0776] 经单独的Tr/AoBG(2.5mg/g PCS)或各自补充有3个GH61多肽(0.2mg/g PCS)之一的纤维素转化率概括在表3和图36中。.
[0777] 表3.经单独的Tr/AoBG或在115h,50℃,pH 5.0补充GH61多肽的Tr/AoBG的纤维素转化率。
[0778]
[0779] 表3和图36显示全部的3个GH61多肽增加Tr/AoBG对PCS的活性。向2.5mg Tr/AoBG补充0.2mg T.t.GH61B、T.t.GH61E、或T.t.GH61G产生接近或高于经3.5mg Tr/AoBG的转化水平,表明Tr/AoBG对PCS的活性受到3个GH61多肽的促进。
[0780] 在单独的试验中利用2.5mg/g PCS Tr/AoBG和0.125mg/g PCS T.t.GH61C,孵育120小时来评估Thielavia terrestris GH61C。对于单独的Tr/AoBG,转化率是63.1%,而加入T.t.GH61C,转化率是66.2%。
[0781] 实施例28:用在米曲霉中重组生产的GH61D多肽水解预处理的玉米秸(PCS)[0782] 如实施例14中所描述的,Thielavia terrestris GH61D多肽在米曲霉中表达,如实施例27浓缩和脱盐发酵液。PCS的水解利用1ml深孔块(VWR),利用1.0ml的总反应体积进行。PCS的水解(10mg/ml,在50mM乙酸钠pH5.0缓冲液中)利用有或没有加入1.5L的重组Thielavia terrestris蛋白质的不同蛋白质加载(表示为每克
PCS mg酶),在存在3%烟曲霉β-葡糖苷酶(BG,3%的纤维素酶蛋白质加载)时进行。水解混合物的孵育在50℃(具有增湿作用的TS Autoflow CO2 Jacketed培养箱)进行。一般地,反应以一式三份进行,在水解过程中取等分样品。报道的数据是三份的平均数。PCS水解反应通过混合20μl等分各个水解物和180μl PCS终止缓冲液(0.102M Na2Co3,0.058M NaHCO3,pH~10)停止。立即分析样品或冷冻储存在-20℃。还原糖含量利用适应于96孔微平板规格的p-对羟基苯甲酸酰肼(PHBAH)分析来测定。简要地,将100μl等分适当稀释的样品置于96孔锥形底平板。反应通过向各个孔添加在2% NaOH中的50μl 1.5%(w/v)PHBAH起始。平板在95℃无盖加热10分钟。容许平板冷却至RT并向各个孔加入50μl ddH2O。从各个孔取100μl等分转移至平底的96孔平板,利用SpectraMax微平板读取仪(Molecular Devices)测量A410nm处的吸光率。使用葡萄糖标准(用0.4%氢氧化钠稀释为
0.1-0.0125mg/ml)制备标准曲线以转化所获得的A410值为葡萄糖当量(基于从理论上纤维素至葡萄糖的完全转化率预期的产量)。使用所得到的当量计算各个反应中PCS纤维素转化的百分比。以葡萄糖当量(转化百分比)对总蛋白质加载(loading)(mg酶/g PCS)对结果进行作图。为了检验GH61D增强 1.5L活性的能力,利用1.0ml PCS微方
案来测试2.5mg 加0.1至0.8mg GH61D/g PCS混合物的PCS水解剂量依赖性。
为了比较的目的,也对没有加入GH61D的 1.5L进行相似的总蛋白质加载。全
部的样品具有以3%总纤维素酶加载补充的烟曲霉β-葡糖苷酶。
[0783] 向2.5mg/g PCS 加入不同数量的GH61D,得到总酶加载为2.6至3.3mg/g PCS使葡萄糖转化率增加超过通过酶加载水平为3.4mg/g PCS而没有GH61D的 所获得的转化率(表4)。
[0784] 表4.通过单独的 或补充GH61D的 的纤维素转化率
[0785]
[0786] 生物材料的保藏
[0787] 下列生物材料已经按照布达佩斯条约的规定保藏在农业研究机构培养物保藏中心,1815 University Street,Peoria,Illinois,61604,并给出下列保藏号:
[0788]
[0789] 该菌株于下述条件下保藏:确保在本专利申请未决期间,由专利与商标委员依据37C.F.R.§1.14和35 U.S.C.§122授权的人能够获得该培养物。所述保藏物为所保藏菌株的基本上纯的培养物。在提交了该主题申请的副本,或其后续文本的国家,依据该外国专利法律的要求,可以获得该保藏物。然而,应当理解,保藏物的获得并不构成对实施本发明的许可,实施本发明是对政府行为所授予的专利权的侵犯。
[0790] 在此描述并要求的本发明不局限于本文公开的具体方面的范围内, 因为这些方面旨在作为本发明的某些方面的说明。任何等同的方面确定地包含在本发明的范围内。实际上,除去在这里显示和描述的那些之外,对本发明前述的说明书的各种更改,对于本领域的那些技术人员是显而易见的。这样的更改也确定地落在所附权利要求的范围内。在有冲突的情况下,以包含定义的本公开为准。
[0791] 在 此 引 用 各 种 参 考 文 献,其 公 开 整 体 地 并 入 作 为 参 考。
[0792]
[0793]
[0794]
[0795]
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈