首页 / 专利库 / 废物处理与管理 / 废物处理 / 厌氧消化 / 水解 / 在丝状真菌宿主细胞中产生多种重组多肽的方法

在丝状真菌宿主细胞中产生多种重组多肽的方法

阅读:10发布:2024-01-14

专利汇可以提供在丝状真菌宿主细胞中产生多种重组多肽的方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及构建用于产生具有 生物 活性的多种重组多肽的丝状 真菌 菌株的方法。本发明还涉及在丝状真菌菌株中产生具有生物活性的多种重组多肽的方法。本发明还涉及表达具有生物活性的多种重组多肽的丝状真菌菌株。,下面是在丝状真菌宿主细胞中产生多种重组多肽的方法专利的具体信息内容。

1.一种构建用于产生具有生物活性的多种重组多肽的丝状真菌菌株的方法,其包括:
(a)通过向丝状真菌菌株中导入第一串联构建体,通过靶向整合取代内源性第一基因,所述第一串联构建体包含(i)所述第一基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)所述第一基因的同源3’区、其同源侧翼区或其组合;
(b)通过向所述丝状真菌菌株中导入第二串联构建体,通过靶向整合取代内源性第二基因,所述第二串联构建体包含(i)所述第二基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第二可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)所述第二基因的同源3’区、其同源侧翼区或其组合;或
(c)(a)和(b)的组合。
2.根据权利要求1所述的方法,其中所述第一基因是编码选自以下的纤维二糖解酶I的纤维二糖水解酶I基因:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I,(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少
91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的基酸序列的纤维二糖水解酶I,(iii)由包含与SEQ ID NO:1的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少
93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I;
并且其中所述第二基因是编码选自以下的纤维二糖水解酶II的纤维二糖水解酶II基因:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II,(ii)包含与SEQ ID NO:4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少
93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II,(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少
70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少
86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
3.根据权利要求1或2所述的方法,其中一个或多个串联构建体还包含一个或多个可选择性标记物的5’侧翼的第一同源重复和所述一个或多个可选择性标记物的3’侧翼的第二同源重复,其中所述第一同源重复和所述第二同源重复进行同源重组,以切除所述一个或多个可选择性标记物。
4.一种丝状真菌菌株,其包含:
(a)通过靶向整合用第一串联构建体取代的内源性第一基因,所述第一串联构建体包含(i)所述第一基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)所述第一基因的同源3’区、其同源侧翼区或其组合;
(b)通过靶向整合用第二串联构建体取代的内源性第二基因,所述第二串联构建体包含(i)所述第二基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)所述第二基因的同源3’区、其同源侧翼区或其组合;或(c)(a)和(b)的组合。
5.根据权利要求4所述的丝状真菌菌株,其中所述第一基因是编码选自以下的纤维二糖水解酶I的纤维二糖水解酶I基因:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I,(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少
90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I,(iii)由包含与SEQ ID NO:1的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少
83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I;
并且其中所述第二基因是编码选自以下的纤维二糖水解酶II的纤维二糖水解酶II基因:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II,(ii)包含与SEQ ID NO:4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少
93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II,(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少
70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少
86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
6.根据权利要求4或5所述的丝状真菌菌株,其中一个或多个串联构建体还包含所述一个或多个可选择性标记物的5’侧翼的第一同源重复和所述一个或多个可选择性标记物的
3’侧翼的第二同源重复,其中所述第一同源重复和所述第二同源重复进行同源重组,以切除所述一个或多个可选择性标记物。
7.一种在丝状真菌菌株中产生具有生物活性的多种重组多肽的方法,其包括:在有益于产生多肽的条件下培养丝状真菌宿主细胞,其中所述丝状真菌宿主细胞包含:
(a)通过靶向整合用第一串联构建体取代的内源性第一基因,所述第一串联构建体包含(i)所述第一基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)所述第一基因的同源3’区、其同源侧翼区或其组合;
(b)通过靶向整合用第二串联构建体取代的内源性第二基因,所述第二串联构建体包含(i)所述第二基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)所述第二基因的同源3’区、其同源侧翼区或其组合;或(c)(a)和(b)的组合。
8.根据权利要求7所述的方法,其还包括回收所述多种重组多肽。
9.根据权利要求7或8所述的方法,其中所述第一基因是编码选自以下的纤维二糖水解酶I的纤维二糖水解酶I基因:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I,(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少
82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少
99%序列同一性的氨基酸序列的纤维二糖水解酶I,(iii)由包含与SEQ ID NO:1的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少
84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I;
并且其中所述第二基因是编码选自以下的纤维二糖水解酶II的纤维二糖水解酶II基因:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II,(ii)包含与SEQ ID NO:4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少
93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II,(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少
70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少
86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
10.根据权利要求7~9中任一项所述的方法,其中一个或多个串联构建体还包含所述一个或多个可选择性标记物的5’侧翼的第一同源重复和所述一个或多个可选择性标记物的3’侧翼的第二同源重复,其中所述第一同源重复和所述第二同源重复进行同源重组,以切除所述一个或多个可选择性标记物。
11.一种串联构建体,其包含:(i)基因的同源5’区、其同源侧翼区或其组合;(ii)一个或多个第一可选择性标记物;(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(v)所述基因的同源3’区、其同源侧翼区或其组合。
12.根据权利要求11所述的串联构建体,其中所述基因是编码选自以下的纤维二糖水解酶I的纤维二糖水解酶I基因:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I,(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少
82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少
99%序列同一性的氨基酸序列的纤维二糖水解酶I,(iii)由包含与SEQ ID NO:1的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少
84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I;
或其中所述基因是编码选自以下的纤维二糖水解酶II的纤维二糖水解酶II基因:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II,(ii)包含与SEQ ID NO:4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少
85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II,(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少
95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
13.一种构建用于产生具有生物活性的多种重组多肽的丝状真菌菌株的方法,其包括:
(a)通过靶向整合向内源性第一基因座中插入第一串联构建体,所述第一串联构建体包含(i)所述第一基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)所述第一基因座的同源3’区、其同源侧翼区或其组合;
(b)通过靶向整合向内源性第二基因座中插入第二串联构建体,所述第二串联构建体包含(i)所述第二基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第二可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)所述第二基因座的同源3’区、其同源侧翼区或其组合;或(c)(a)和(b)的组合。
14.根据权利要求13所述的方法,其中所述第一基因座是编码选自以下的纤维二糖水解酶I的纤维二糖水解酶I基因:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I,(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少
82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少
99%序列同一性的氨基酸序列的纤维二糖水解酶I,(iii)由包含与SEQ ID NO:1的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少
84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I;
并且其中所述第二基因座是编码选自以下的纤维二糖水解酶II的纤维二糖水解酶II基因:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II,(ii)包含与SEQ ID NO:4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少
93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II,(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少
70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少
86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
15.根据权利要求13或14所述的方法,其中一个或多个串联构建体还包含一个或多个可选择性标记物的5’侧翼的第一同源重复和所述一个或多个可选择性标记物的3’侧翼的第二同源重复,其中所述第一同源重复和所述第二同源重复进行同源重组,以切除所述一个或多个可选择性标记物。
16.一种丝状真菌菌株,其包含:
(a)通过靶向整合经插入第一串联构建体而修饰的内源性第一基因座,所述第一串联构建体包含(i)所述第一基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)所述第一基因座的同源3’区、其同源侧翼区或其组合;
(b)通过靶向整合经插入第二串联构建体而修饰的内源性第二基因座,所述第二串联构建体包含(i)所述第二基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个可选择性标记物;(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)所述第二基因座的同源3’区、其同源侧翼区或其组合;或(c)(a)和(b)的组合。
17.根据权利要求16所述的丝状真菌菌株,其中所述第一基因座是编码选自以下的纤维二糖水解酶I的纤维二糖水解酶I基因:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I,(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少
81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少
98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I,(iii)由包含与SEQ ID NO:
1的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少
83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I;
并且其中所述第二基因座是编码选自以下的纤维二糖水解酶II的纤维二糖水解酶II基因:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II,(ii)包含与SEQ ID NO:4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少
93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II,(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少
70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少
86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
18.根据权利要求16或17所述的丝状真菌菌株,其中一个或多个串联构建体还包含所述一个或多个可选择性标记物的5’侧翼的第一同源重复和所述一个或多个可选择性标记物的3’侧翼的第二同源重复,其中所述第一同源重复和所述第二同源重复进行同源重组,以切除所述一个或多个可选择性标记物。
19.一种在丝状真菌菌株中产生具有生物活性的多种重组多肽的方法,其包括:在有益于产生多肽的条件下培养丝状真菌宿主细胞,其中所述丝状真菌宿主细胞包含:
(a)通过靶向整合经插入第一串联构建体而修饰的内源性第一基因座,所述第一串联构建体包含(i)所述第一基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)所述第一基因座的同源3’区、其同源侧翼区或其组合;
(b)通过靶向整合经插入第二串联构建体而修饰的内源性第二基因座,所述第二串联构建体包含(i)所述第二基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个可选择性标记物;(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)所述第二基因座的同源3’区、其同源侧翼区或其组合;或(c)(a)和(b)的组合。
20.根据权利要求19所述的方法,其还包括回收所述多种重组多肽。
21.根据权利要求19或20所述的方法,其中所述第一基因座是编码选自以下的纤维二糖水解酶I的纤维二糖水解酶I基因:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I,(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少
90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I,(iii)由包含与SEQ ID NO:1的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少
83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I;
并且其中所述第二基因座是编码选自以下的纤维二糖水解酶II的纤维二糖水解酶II基因:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II,(ii)包含与SEQ ID NO:4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少
93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II,(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少
70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少
86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
22.根据权利要求19~21中任一项所述的方法,其中一个或多个串联构建体还包含所述一个或多个可选择性标记物的5’侧翼的第一同源重复和所述一个或多个可选择性标记物的3’侧翼的第二同源重复,其中所述第一同源重复和所述第二同源重复进行同源重组,以切除所述一个或多个可选择性标记物。
23.一种串联构建体,其包含:(i)基因座的同源5’区、其同源侧翼区或其组合;(ii)一个或多个第一可选择性标记物;(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(v)所述基因座的同源3’区、其同源侧翼区或其组合。
24.根据权利要求23所述的串联构建体,所述基因座是编码选自以下的纤维二糖水解酶I的纤维二糖水解酶I基因:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I,(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少
82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少
99%序列同一性的氨基酸序列的纤维二糖水解酶I,(iii)由包含与SEQ ID NO:1的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少
84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I;
或其中所述基因座是编码选自以下的纤维二糖水解酶II的纤维二糖水解酶II基因:
(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II,(ii)包含与SEQ ID NO:4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少
85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II,(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少
95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II,和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。

说明书全文

在丝状真菌宿主细胞中产生多种重组多肽的方法

[0001] 本申请是2014年4月24日提交到中华人民共和国国家知识产权局的发明名称为“在丝状真菌宿主细胞中产生多种重组多肽的方法”、申请号为“201280052277.8”的发明专利申请的分案申请。
[0002] 序列表的引用
[0003] 本申请含有计算机可读形式的序列表,其通过引用的方式合并入本文。发明领域
[0004] 本发明涉及在丝状真菌宿主细胞中产生多种重组多肽的方法。

背景技术

[0005] 在丝状真菌宿主细胞中重组产生多肽可以为生产商业相关量的多肽提供更为合意的载体。多肽的重组产生通常通过构建表达盒来实现,其中在表达盒中,将编码多肽的DNA置于来自调控基因的启动子的表达控制下。通常通过质粒介导的转化将表达盒导入到宿主细胞中。然后通过在表达盒中含有的启动子适当发挥作用所必需的诱导性条件下培养所转化的宿主细胞来实现多肽的生产。
[0006] 可以通过涉及原生质体形成、原生质体的转化和细胞壁的再生的方法以本身已知的方式用载体转化丝状真菌细胞。用两种或更多种载体单独或一起(共转化)转化丝状真菌宿主细胞的效率是非常低的,并受到可用的可选择性标记物的可得性的限制。
[0007] 本领域需要一些方法,通过将串联表达构建体定向至一个或多个 (例如几个)特定基因组基因座来构建能够表达多种重组多肽的丝状真菌菌株,从而实现所需表达量的所有目标多肽。
[0008] 本发明提供在丝状真菌宿主细胞中产生多种重组多肽的改进方法。

发明内容

[0009] 本发明涉及构建用于产生具有生物活性的多种重组多肽的丝状真菌菌株的方法,包括:
[0010] (a)通过向丝状真菌菌株中导入第一串联构建体,通过靶向整合 (targeted integration)来取代内源性第一基因,该第一串联构建体包含: (i)第一基因的同源5’区、其同源侧翼区或其组合;(ii)一个或多个 (例如,几个)第一可选择性标记物;(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv) 与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(v)第一基因的同源3’区、其同源侧翼区或其组合;
[0011] (b)通过向丝状真菌菌株中导入第二串联构建体,通过靶向整合来取代内源性第二基因,该第二串联构建体包含:(i)第二基因的同源 5’区、其同源侧翼区或其组合;(ii)一个或多个(例如,几个)第二可选择性标记物;(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸;(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸;和(v)第二基因的同源3’区、其同源侧翼区或其组合;或
[0012] (c)(a)和(b)的组合。
[0013] 本发明还涉及丝状真菌菌株,其包含:
[0014] (a)通过向丝状真菌菌株中导入第一串联构建体经靶向整合被取代的内源性第一基因,该第一串联构建体包含:(i)第一基因的同源5’区、其同源侧翼区或其组合;(ii)一个或多个(例如,几个)第一可选择性标记物;(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和 (v)第一基因的同源3’区、其同源侧翼区或其组合;
[0015] (b)通过向丝状真菌菌株中导入第二串联构建体经靶向整合被取代的内源性第二基因,该第二串联构建体包含:(i)第二基因的同源5’区、其同源侧翼区或其组合;(ii)一个或多个(例如,几个)第二可选择性标记物;(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸;(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸;和 (v)第二基因的同源3’区、其同源侧翼区或其组合;或
[0016] (c)(a)和(b)的组合。
[0017] 本发明还涉及在丝状真菌菌株中产生具有生物活性的多种重组多肽的方法,其包括:
[0018] (A)在有益于产生多肽的条件下培养丝状真菌宿主细胞,其中该丝状真菌宿主细胞包含:(a)通过靶向整合用第一串联构建体取代的内源性第一基因,该第一串联构建体包含(i)第一基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个(例如,几个)第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v) 第一基因的同源3’区、其同源侧翼区或其组合;(b)通过靶向整合用第二串联构建体取代的内源性第二基因,该第二串联构建体包含(i) 第二基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个(例如,几个)第二可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)第二基因的同源3’区、其同源侧翼区或其组合;或(c)(a)和(b)的组合;以及任选地
[0019] (B)回收多种重组多肽。
[0020] 本发明还涉及串联构建体,其包含:(i)基因的同源5’区、其同源侧翼区或其组合;(ii)一个或多个(例如,几个)可选择性标记物;(iii) 与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(v)基因的同源3’区、其同源侧翼区或其组合。
[0021] 本发明还涉及构建用于产生具有生物活性的多种重组多肽的丝状真菌菌株的方法,其包括:
[0022] (a)通过靶向整合向内源性第一基因座中插入第一串联构建体,该第一串联构建体包含:(i)第一基因座的同源5’区、其同源侧翼区或其组合;(ii)一个或多个第一可选择性标记物;(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(v)第一基因座的同源3’区、其同源侧翼区或其组合;
[0023] (b)通过靶向整合向内源性第二基因座中插入第二串联构建体,该第二串联构建体包含:(i)第二基因座的同源5’区、其同源侧翼区或其组合;(ii)一个或多个第二可选择性标记物;(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸;(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸;和(v)第二基因座的同源3’区、其同源侧翼区或其组合;或[0024] (c)(a)和(b)的组合。
[0025] 本发明还涉及丝状真菌菌株,其包含:(a)通过靶向整合经插入第一串联构建体而修饰的内源性第一基因座,该第一串联构建体包含 (i)第一基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)第一基因座的同源3’区、其同源侧翼区或其组合;(b) 通过靶向整合经插入第二串联构建体而修饰的内源性第二基因座,该第二串联构建体包含(i)第二基因座的同源5’区、其同源侧翼区或其组合;
(ii)一个或多个第二可选择性标记物;(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)第二基因座的同源3’区、其同源侧翼区或其组合;或(c)(a)和(b)的组合。
[0026] 本发明还涉及在丝状真菌菌株中产生具有生物活性的多种重组多肽的方法,其包括:
[0027] (A)在有益于产生多肽的条件下培养丝状真菌宿主细胞,其中该丝状真菌宿主细胞包含:(a)通过靶向整合经插入第一串联构建体而修饰的内源性第一基因座,该第一串联构建体包含(i)第一基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)第一基因座的同源3’区、其同源侧翼区或其组合;(b)通过靶向整合经插入第二串联构建体而修饰的内源性第二基因座,该第二串联构建体包含(i)第二基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第二可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)第二基因座的同源3’区、其同源侧翼区或其组合;或 (c)(a)和(b)的组合;以及
[0028] (B)回收多种重组多肽。
[0029] 本发明还涉及串联构建体,其包含:(i)基因座的同源5’区、其同源侧翼区或其组合;(ii)一个或多个可选择性标记物;(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(v)基因座的同源3’区、其同源侧翼区或其组合。附图说明
[0030] 图1示出质粒pAG43的限制性酶切图谱。
[0031] 图2示出质粒pSMai214的限制性酶切图谱。
[0032] 图3示出质粒pDM287的限制性酶切图谱。
[0033] 图4示出阳性转化体对于β-葡糖苷酶活性的比较:pDM287的45 个转化子与pEJG107+pSMai214的45个转化子之间。
[0034] 图5示出质粒pDM286的限制性酶切图谱。
[0035] 图6示出质粒pDM290的限制性酶切图谱。
[0036] 图7示出质粒pJfyS142的限制性酶切图谱。
[0037] 图8示出质粒pJfyS144的限制性酶切图谱。
[0038] 图9示出质粒pJfyS139的限制性酶切图谱。
[0039] 图10示出质粒pQM18的限制性酶切图谱。
[0040] 图11示出质粒pQM21的限制性酶切图谱。
[0041] 图12示出质粒pAG121的限制性酶切图谱。
[0042] 图13示出质粒pRRAB01的限制性酶切图谱。
[0043] 图14示出质粒pDFng113-3的限制性酶切图谱。
[0044] 图15示出质粒pAmFs074的限制性酶切图谱。
[0045] 图16示出质粒pQM22的限制性酶切图谱。

具体实施方式

[0046] 定义
[0047] 乙酰木聚糖酯酶:术语“乙酰木聚糖酯酶”是指催化乙酰基从聚合木聚糖、乙酰化木糖、乙酰化葡萄糖、乙酸α-酯和乙酸对硝基苯酯解的羧酸酯酶(E.C.3.1.1.72)。出于本发明的目的,乙酰木聚糖酯酶的活性是使用在含0.01%TWEENTM 20(聚乙烯失水山梨醇单月桂酸酯)的50mM乙酸钠pH 5.0中的0.5mM乙酸对硝基苯酯作为底物而确定的。一个单位的乙酰木聚糖酯酶被定义为能够在pH 5、25℃下每分钟释放1微摩尔(μmole)对硝基苯酚阴离子的酶量。
[0048] 等位变体(allelic variant):术语“等位变体”是指占据同一染色体基因座的基因的两种或更多种(例如,几种)可选形式中的任意种。等位变化通过突变而自然发生,并可能引起种群内的多态性。基因突变可以是沉默的(在所编码的多肽中没有变化)或可以编码具有改变的基酸序列的多肽。多肽的等位变体是由基因的等位变体所编码的多肽。
[0049] α-L-阿拉伯呋喃糖苷酶:术语“α-L-阿拉伯呋喃糖苷酶”是指催化α-L-阿拉伯糖苷中末端非还原性α-L-阿拉伯呋喃糖苷残基的水解的α-L-阿拉伯呋喃糖苷阿拉伯呋喃水解酶(alpha-L-arabinofuranoside arabinofuranohydrolase)(E.C.3.2.1.55)。该酶作用于α-L-阿拉伯呋喃糖苷、含有(1,3)-和/或(1,5)-键的α-L-阿拉伯聚糖、阿拉伯木聚糖、和阿拉伯半乳聚糖。α-L-阿拉伯呋喃糖苷酶也称为阿拉伯糖苷酶、α-阿拉伯糖苷酶、α-L-阿拉伯糖苷酶、α-阿拉伯呋喃糖苷酶、多糖α-L-阿拉伯呋喃糖苷酶、α-L-阿拉伯呋喃糖苷水解酶、L-阿拉伯糖苷酶、或α-L-阿拉伯聚糖酶。出于本发明的目的,α-L-阿拉伯呋喃糖苷酶的活性是使用总体积200μl的100mM乙酸钠pH 5中的每ml 5mg中等粘度小麦阿拉伯木聚糖(Megazyme International Ireland,Ltd.,Bray,Co.Wicklow,爱尔兰)在40℃下30分钟,随后通过 HPX-87H柱层析 (Bio-Rad Laboratories,Inc.,Hercules,CA,美国)的阿拉伯糖分析而确定的。
[0050] α-葡糖酸糖苷酶:术语“α-葡糖醛酸糖苷酶”是指催化α-D-葡糖苷酸水解为D-葡糖醛酸和醇的α-D-葡糖苷酸葡糖醛酸水解酶  (alpha-D-glucosiduronate glucuronohydrolase)(E.C.3.2.1.139)。出于本发明的目的,α-葡糖醛酸糖苷酶活性是根据de Vries,1998,J. Bacteriol.180:243-249而确定的。一个单位的α-葡糖醛酸糖苷酶等于能够在pH 5、40℃下每分钟释放1微摩尔的葡糖醛酸或4-O-甲基葡糖醛酸的酶量。
[0051] 天冬氨酸蛋白酶:术语“天冬氨酸蛋白酶”是指使用天冬氨酸残基来催化肽和蛋白中肽键的水解的蛋白酶。天冬氨酸蛋白酶是使用天冬氨酸残基来催化它们的肽底物的水解的蛋白酶家族。一般情况下,它们在活性位点中具有两个高度保守的天冬氨酸盐(酯),且在酸性pH 下活性最佳(Szecsi,1992,Scand.J.Clin.Lab.In vest.Suppl.210:5–22)。出于本发明的目的,天冬氨酸蛋白酶活性根据Aikawa等人、2001,J. Biochem.129:791-794描述的过程来确定。
[0052] β-葡糖苷酶:术语“β-葡糖苷酶”是指催化末端非还原性β-D-葡萄糖残基的水解并释放β-D-葡萄糖的β-D-葡糖苷葡糖水解酶 (beta-D-glucoside glucohydrolase)(E.C.3.2.1.21)。出于本发明的目的,β-葡糖苷酶活性是根据Venturi等人,2002,Extracellular  beta-D-glucosidase  from Chaetomium  thermophilum var.coprophilum: production,purification and some biochemical properties,J.Basic Microbiol.42:55-66的过程使用对硝基苯基-β-D-吡喃葡糖苷作为底物而确定的。一个单位的β-葡糖苷酶被定义为在25℃、pH 4.8下在含 0.01% 20的50mM柠檬酸钠中从作为底物的1mM对硝基苯基-β-D-吡喃葡糖苷中每分钟生产1.0微摩尔对硝基苯酚阴离子。
[0053] β-木糖苷酶:术语“β-木糖苷酶”是指催化短β-(4)-低聚木糖的外水解以从非还原性末端去除连续的D-木糖残基的β-D-木糖苷木糖水解酶(EC 3.2.1.37)。出于本发明的目的,一个单位的β-木糖苷酶被定义为在40℃、pH 5下在含0.01% 20的100mM柠檬酸钠中从作为底物的1mM对硝基苯基-β-D-木糖苷中每分钟生产1.0微摩尔对硝基苯酚阴离子。
[0054] cDNA:术语“cDNA”是指可以通过反转录从成熟的、剪接的从真核或原核细胞获得的mRNA分子制备而来的DNA分子。cDNA缺少可以存在于对应基因组DNA中的内含子序列。最初的初级RNA转录体是在呈现为成熟剪接的mRNA前的经由一系列步骤包括剪接而加工的mRNA的前体。
[0055] 纤维二糖水解酶:术语“纤维二糖水解酶”是指催化纤维素、纤维寡糖、或任何含有β-1,4-连接的葡萄糖的聚合物中1,4-β-D-糖苷键的水解以从链的还原末端或非还原末端释放纤维二糖的1,4-β-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91和E.C.3.2.1.176)(Teeri,1997,Crystalline cellulose degradation:New insight into the function of cellobiohydrolases, Trends in Biotechnology 15:160-167;Teeri等人,1998,Trichoderma reesei cellobiohydrolases:why so efficient on crystalline cellulose? Biochem.Soc.Trans.26:173-178)。纤维二糖水解酶活性根据Lever等人, 1972,Anal.Biochem.47:273-279;van Tilbeurgh等人,1982,FEBS Letters, 149:152-
156;van Tilbeurgh and Claeyssens,1985,FEBS Letters,187: 283-288;以及Tomme等人,1988,Eur.J.Biochem.170:575-581描述的过程来确定。在本发明中,Tomme等人的方法可被用于确定纤维二糖水解酶的活性。
[0056] 纤维分解酶或纤维素酶:术语“纤维分解酶”或“纤维素酶”是指一种或多种(例如,几种)水解纤维素材料的酶。这样的酶包括内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶或其组合。测量纤维分解活性的两种基本方法包括:(1)测量总纤维分解活性,和(2)测量单独的纤维分解活性(内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶),如 Zhang等人,Outlook for cellulase  improvement:Screening and selection strategies,2006,Biotechnology Advances 24:452-481所综述的。总纤维分解活性通常是使用不溶性底物来测量的,该底物包括Whatman№1 滤纸、微晶纤维素、细菌纤维素、藻类纤维素、花、经预处理的木质纤维素等。最常见的总纤维分解活性检定是使用Whatman№1滤纸作为底物的滤纸检定。该检定是由国际纯粹与应用化学联合会 (International Union of Pure and Applied Chemistry,IUPAC)确立的 (Ghose,1987,Measurement of cellulase activities,Pure Appl.Chem.59: 257-68)。
[0057] 出于本发明的目的,纤维分解酶活性通过测量在下述条件下由纤维素分解酶进行的纤维素材料的水解的增加而加以确定:l~50mg纤维分解酶蛋白/g PCS中纤维素(或其他经预处理的纤维素材料),在合适的温度例如50℃、55℃或60℃下3~7天,与未添加纤维分解酶蛋白的对照水解相比较。通常条件为:1ml反应物,经洗涤或未洗涤的PCS, 5%不溶性固体,50mM乙酸钠pH 5,1mM MnSO4,50℃、55℃或 60℃,72小时,通过 HPX-87H柱(Bio-Rad Laboratories,Inc., Hercules,CA,美国)进行糖分析。
[0058] 纤维素材料:术语“纤维素材料”是指包含纤维素的任何材料。在生物质的初生细胞壁中的主要多糖是纤维素,其次丰富的是半纤维素,而第三是果胶。在细胞停止生长后产生的次生细胞壁也含有多糖,且次生细胞壁通过与半纤维素共价交联的聚合木质素而进行加强。纤维素是脱水纤维二糖的均聚物,并且因此是直链β-(l-4)-D-葡聚糖;而半纤维素包括多种化合物,例如木聚糖、木葡聚糖(xyloglucan)、阿拉伯木聚糖和甘露聚糖,处于具有系列取代基的复杂分支结构。尽管通常是多晶形的,存在于植物组织中的纤维素主要是平行葡聚糖链的不溶晶体基质。半纤维素通常与纤维素以及其他半纤维素以氢键相连,这帮助稳定细胞壁基质。
[0059] 纤维素通常见于例如植物的茎、叶、壳、皮和穗轴,或树的叶、枝和木材。纤维素材料可以是,但不限于,农业残余物、草本材料(包括能量作物)、城市固体废物、纸浆与造纸厂残余物、废纸和木材(包括林业残余物)(参见,例如,Wiselogel等,1995,于Handbook on Bioethanol(Charles E.Wyman编辑),pp.105-118,Taylor&Francis, Washington D.C.;Wyman,1994,Bioresource Technology 50:3-16;Lynd, 1990,Applied Biochemistry and Biotechnology 24/25:695-719;Mosier等人,1999,Recent Progress in Bioconversion of Lignocellulosics,于 Advances in Biochemical Engineering/Biotechnology,T.Scheper主编, Volume 65,pp.23-40,Springer-Verlag,New York)。在本文中应理解的是,纤维素可以是木质纤维素的形式,即在混合基质中包含木质素、纤维素和半纤维素的植物细胞壁材料。在优选的方面,纤维素材料是任何生物质材料。在另一个优选的方面,纤维素材料是木质纤维素,其包含纤维素、半纤维素和木质素。
[0060] 在一个方面,纤维素材料是农业残余物。在另一个方面,纤维素材料是草本材料(包括能量作物)。在另一个方面,纤维素材料是城市固体废物。在另一个方面,纤维素材料是纸浆和造纸厂残余物。在另一个方面,纤维素材料是废纸。在另一个方面,纤维素材料是木材(包括林业残余物)。
[0061] 在另一个方面,纤维素材料是芦竹。在另一个方面,纤维素材料是甘蔗渣。在另一个方面,纤维素材料是竹。在另一个方面,纤维素材料是玉米穗轴。在另一个方面,纤维素材料是玉米纤维。在另一个方面,纤维素材料是玉米秸秆。在另一个方面,纤维素材料是芒草。在另一个方面,纤维素材料是橘皮。在另一个方面,纤维素材料是稻杆。在另一个方面,纤维素材料是柳枝稷。在另一个方面,纤维素材料是麦杆。
[0062] 在另一个方面,纤维素材料是山杨。在另一个方面,纤维素材料是桉树。在另一个方面,纤维素材料是冷杉。在另一个方面,纤维素材料是松树。在另一个方面,纤维素材料是白杨。在另一个方面,纤维素材料是杉。在另一个方面,纤维素材料是柳树。
[0063] 在另一个方面,纤维素材料是藻类纤维素。在另一个方面,纤维素材料是细菌纤维素。在另一个方面,纤维素材料是棉绒。在另一个方面,纤维素材料是滤纸。在另一个方面,纤维素材料是微晶纤维素。在另一个方面,纤维素材料是磷酸处理的纤维素。
[0064] 在另一个方面,纤维素材料是水生生物质。如本文所使用的,术语“水生生物质”是指在水生环境中由光合作用过程产生的生物质。水生生物质可以为藻类、挺水植物、浮叶植物或沉水植物。
[0065] 如本文所述,纤维素材料可以使用本领域已知的常规方法按原样使用或进行预处理。在优选的方面,纤维素材料被预处理。
[0066] 编码序列:术语“编码序列”是指直接指定多肽的氨基酸序列的多核苷酸。编码序列的边界一般由开放阅读框确定,开放阅读框以起始密码子如ATG、GTG或TTG开始并以终止密码子如TAA、TAG或 TGA结束。编码序列可以是基因组DNA、cDNA、合成DNA或其组合。
[0067] 控制序列:术语“控制序列”是指编码多肽的多核苷酸在表达时所必需的核酸序列。各个控制序列对于编码多肽的多核苷酸可以是内生的(即,来自相同基因)或外来的(即,来自不同基因)或彼此为内生或外来的。这些控制序列包括但不限于前导序列、多腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。在最低限度,控制序列包括启动子、以及转录和翻译终止信号。控制序列可以设有接头,以用于导入特定的促进控制序列与编码多肽的多核苷酸编码区进行连接的限制性酶切位点。
[0068] 异位整合:术语“异位整合”是指向微生物的基因组在非靶位点或除其通常的染色体基因座以外的位点插入核酸,即,随机整合。
[0069] 内切葡聚糖酶:术语“内切葡聚糖酶”是指催化纤维素、纤维素衍生物(例如羧甲基纤维素和羟乙基纤维素)、地衣多糖中的1,4-β-D- 糖苷键的内水解(endohydrolysis),催化混合的β-1,3-葡聚糖例如谷类β-D-葡聚糖或木葡聚糖以及含有纤维素组分的其他植物材料中的β-1,4 键的内水解的内切-1,4-(1,3;1,4)-β-D-葡聚糖4-葡聚糖水解酶 (endo-1,4-(1,3;1,4)-beta-D-glucan 4-glucanohydrolase)(E.C.3.2.1.4)。内切葡聚糖酶的活性可以通过测量底物粘度的减少或由还原糖检定 (Zhang等人,2006,Biotechnology Advances 24:452-481)确定的还原端的增加来确定。出于本发明的目的,内切葡聚糖酶的活性根据Ghose, 1987,Pure and Appl.Chem.59:257-268的方法,在pH 5、40℃下使用羧甲基纤维素(CMC)作为底物而确定。
[0070] 表达:术语“表达”包括在多肽生产中涉及的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。
[0071] 表达载体:术语“表达载体”是指包含编码多肽的多核苷酸并与提供用于其表达的控制序列可操作地连接的线性或环状DNA分子。
[0072] 糖苷水解酶61家族:术语“糖苷水解酶61家族”或“GH61家族”或“GH61”是指根据Henrissat B.,1991,A classification of glycosyl hydrolases based on amino-acid sequence similarities,Biochem.J.280: 309-316及Henrissat B.和Bairoch A.,1996,Updating the sequence-based classification of glycosyl hydrolases,Biochem.J.316:695-696而落入糖苷水解酶61家族的多肽。原先,该家族中的酶基于一个家族成员中测量的非常弱的内切-1,4-β-D-葡聚糖酶活性而归类为糖苷水解酶家族。这些酶的结构和作用模式是非公认的,且它们无法被视为真正的糖苷酶。然而,基于它们在与纤维素酶或纤维素酶的混合物一同使用时增强木质纤维素分解的能,它们被保留在CAZy分类中。
[0073] 阿魏酸酯酶:术语“阿魏酸酯酶”是指催化4-羟基-3-甲氧基肉桂酰(阿魏酰)基团从酯化的糖(在天然生物质底物中通常为阿拉伯糖) 中水解以产生阿魏酸酯(盐)(4-羟基-3-甲氧基肉桂酸酯(盐))的4- 羟基-3-甲氧基肉桂酰-糖水解酶(EC 3.1.1.73)。阿魏酸酯酶也被称为阿魏酸酯酶、羟基肉桂酰基酯酶、FAE-III、肉桂酸酯水解酶、FAEA、 cinnAE、FAE-I或FAE-II。出于本发明的目的,阿魏酸酯酶的活性是使用50mM乙酸钠pH 5.0中的
0.5mM阿魏酸对硝基苯酯作为底物而确定的。一个单位的阿魏酸酯酶等于能够在pH 5、25℃下每分钟释放1 微摩尔对硝基苯酚阴离子的酶量。
[0074] 侧翼:术语“侧翼”是指在特定DNA序列、基因座或基因的任一侧延伸的DNA序列。侧翼DNA紧邻将要整合到丝状真菌细胞的基因组中的另一DNA序列、基因座或基因。
[0075] 片段:术语“片段”是指在成熟多肽域的氨基端和/或羧基端缺少一个或多个(如,几个)氨基酸的多肽;其中该片段具有酶活性。在一方面,片段含有酶的成熟多肽的至少85%,例如至少90%或至少95%的氨基酸残基。
[0076] 半纤维素分解酶或半纤维素酶:术语“半纤维素分解酶”或“半纤维素酶”是指一种或多种(例如,几种)水解半纤维素材料的酶。参见,例如Shallom,D.和Shoham,Y.Microbial hemicellulases.Current Opinion In Microbiology,2003,6(3):219-228)。半纤维素酶是植物生物质降解中的关键组分。半纤维素酶的实例包括,但不限于,乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖苷酸酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶和木糖苷酶。这些酶的底物,半纤维素,是支链和直链多糖的混杂群,它们通过氢键键合于植物细胞壁中的纤维素微纤维,将其交联为稳定网路。半纤维素亦共价地附于木质素,与纤维素一同形成高度复杂的结构。半纤维素的可变结构和组织需要许多酶的协同作用来使其完全降解。半纤维素酶的催化单元为水解糖苷键的糖苷水解酶(GH),或水解乙酸酯或阿魏酸侧基的酯键的糖酯酶(CE)。这些催化单元,基于其一级序列的同源性,可分类到GH和CE家族。具有总体上类似的折叠的一些家族还可以归类为宗族,按字母顺序标记(例如,GH-A)。这些和其他糖类活性酶的最具信息性和最新的分类可以在糖类活性酶(CAZy)数据库中获得。半纤维素分解酶活性可以根据Ghose和Bisaria,1987,Pure&Appl.Chem. 59:1739-1752在合适的温度例如50℃、55℃或60℃以及pH例如5.0 或5.5下进行测量。
[0077] 高等严格条件:术语“高等严格条件”是指至少100个核苷酸长度的探针于42℃在5×SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和50%甲酰胺中预杂交和杂交,遵循标准DNA印迹程序进行12至24小时。载体材料最后使用2×SSC、0.2%SDS在65℃洗涤三次,每次15分钟。
[0078] 同源3’或5’区:术语“同源3’区”是指以下DNA片段,其与基因组中区域的序列相同或者序列同一性为至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%,并且当与同源5’区结合时可以通过同源重组将一条DNA靶向整合至基因组中的特定位点。术语“同源
5’区”是指以下DNA片段,其与基因组中区域的序列相同,并且当与同源3’区结合时可以通过同源重组将一条DNA靶向整合至基因组中的特定位点。同源5’和3’区必须连接在基因组中,这意味着它们处于同一染色体中,彼此在至少200kb内。
[0079] 同源侧翼区:术语“同源侧翼区”是指以下DNA片段,其与基因组中区域的序列相同或者序列同一性为至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%,并且紧邻基因组中的细胞外DNA靶向整合入的特定位点的上游或下游。
[0080] 同源重复:术语“同源重复”是指在导入宿主细胞的重组DNA中重复至少两次且可以通过同源重组而促进DNA(即,插在两个同源重复之间的可选择性标记物)的丢失的DNA片段。
[0081] 宿主细胞:术语“宿主细胞”是指对具有含编码多肽的多核苷酸的核酸构建体或表达载体的转化、转染、转导等敏感的任何细胞类型。术语“宿主细胞”包括由于复制过程中发生的突变而不与亲本细胞相同的任何亲本细胞后代。
[0082] 分离的:术语“分离的”是指,处于非天然发生的形式或环境中的物质。分离的物质的非限制性实例包括(1)任何非天然发生的物质; (2)包括但不限于任何酶、变体、核酸、蛋白、肽或辅助因子的任何物质,其至少部分地从与其天然相关联的一种或多种或所有天然发生成分中移出;(3)相对于天然发现的物质,经人工修饰的任何物质;或者(4)通过增加物质相对于与其天然相关的其他组分的含量而修饰的任意物质(例如,宿主细胞中的重组生产;多个拷贝的物质编码基因;相比于与编码物质的基因天然相关的启动子,使用更强的启动子)。
[0083] 低等严格条件:术语“低等严格条件”是指,长度为至少100个核苷酸的探针,在42℃下,在5×SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和25%甲酰胺中预杂交并杂交,遵循标准DNA 印迹过程进行12~24个小时。载体材料最终使用2×SSC、0.2%SDS在 50℃下洗涤三次,每次15分钟。
[0084] 成熟多肽:术语“成熟多肽”是指翻译和任何翻译后修饰例如N- 端加工、C-端截短、糖基化、磷酸化等之后的最终形式的多肽。在一方面,基于预测SEQ ID NO:2的氨基酸1~17是信号肽的SignalP程序 (Nielsen等人,1997,Protein Engineering 10:1-6),里氏木霉(T.Reesei) 纤维二糖水解酶I的成熟多肽是SEQ ID NO:2的氨基酸18~514。另一方面,基于预测SEQ ID NO:4的氨基酸1~18是信号肽的SignalP程序,里氏木霉纤维二糖水解酶II的成熟多肽是SEQ ID NO:4的氨基酸 19~471。另一方面,基于预测SEQ ID NO:6的氨基酸1~22是信号肽的SignalP程序,里氏木霉内切葡聚糖酶I的成熟多肽是SEQ ID NO:6 的氨基酸23~459。另一方面,基于预测SEQ ID NO:8的氨基酸1~21 是信号肽的SignalP程序,里氏木霉内切葡聚糖酶II的成熟多肽是SEQ ID NO:8的氨基酸22~418。另一方面,基于预测SEQ ID NO:10的氨基酸1~19是信号肽的SignalP程序,里氏木霉β-葡糖苷酶的成熟多肽是SEQ ID NO:10的氨基酸20~744。另一方面,基于预测SEQ ID NO: 12的氨基酸1~19是信号肽的SignalP程序,里氏木霉木聚糖酶I的成熟多肽是SEQ ID NO:12的氨基酸20~229。另一方面,基于预测SEQ ID NO:14的氨基酸1~19是信号肽的SignalP程序,里氏木霉木聚糖酶II 的成熟多肽是SEQ ID NO:14的氨基酸20~223。另一方面,基于预测 SEQ ID NO:16的氨基酸1~16是信号肽的SignalP程序,里氏木霉木聚糖酶III的成熟多肽是SEQ ID NO:
16的氨基酸17~347。另一方面,基于预测SEQ ID NO:18的氨基酸1~20是信号肽的SignalP程序,里氏木霉β-木糖苷酶的成熟多肽是SEQ ID NO:18的氨基酸21~797。另一方面,基于预测SEQ ID NO:20的氨基酸1~18是信号肽的SignalP程序,里氏木霉膨胀因子的成熟多肽是SEQ ID NO:20的氨基酸19~493。另一方面,基于预测SEQ ID NO:22的氨基酸1~19是信号肽的SignalP 程序,里氏木霉的枯草杆菌蛋白酶样丝氨酸蛋白酶的成熟多肽是SEQ ID NO:22的氨基酸20~882。另一方面,基于预测SEQ ID NO:24的氨基酸1~20是信号肽的SignalP程序,里氏木霉天冬氨酸蛋白酶的成熟多肽是SEQ ID NO:24的氨基酸21~407。另一方面,基于预测SEQ ID NO:26的氨基酸1~19是信号肽的SignalP程序,里氏木霉胰蛋白酶样丝氨酸蛋白酶的成熟多肽是SEQ ID NO:26的氨基酸20~259。另一方面,基于预测SEQ ID NO:28的氨基酸1~15是信号肽的SignalP程序,另一种里氏木霉枯草杆菌蛋白酶样丝氨酸蛋白酶的成熟多肽是SEQ ID NO:28的氨基酸16~540。另一方面,基于预测SEQ ID NO:30的氨基酸1~17是信号肽的SignalP程序,另一种里氏木霉天冬氨酸蛋白酶的成熟多肽是SEQ ID NO:30的氨基酸18~395。在本领域已知宿主细胞可以产生由同一多核苷酸表达的两种或更多种不同成熟多肽(例如,具有不同的C-端和/或N-端氨基酸)的混合物。
[0085] 成熟多肽编码序列:术语“成熟多肽编码序列”是指编码具有酶活性的成熟多肽的多核苷酸。在一方面,基于预测SEQ ID NO:1的核苷酸1~51编码信号肽的SignalP程序,里氏木霉纤维二糖水解酶I的成熟多肽编码序列是SEQ ID NO:1的核苷酸52~1545或其cDNA序列。另一方面,基于预测SEQ ID NO:3的核苷酸1~54编码信号肽的SignalP 程序,里氏木霉纤维二糖水解酶II的成熟多肽编码序列是SEQ ID NO: 3的核苷酸55~1608或其cDNA序列。另一方面,基于预测SEQ ID NO: 5的核苷酸1~66编码信号肽的SignalP程序,里氏木霉内切葡聚糖酶I 的成熟多肽编码序列是SEQ ID NO:5的核苷酸67~1374或其cDNA序列。另一方面,基于预测SEQ ID NO:7的核苷酸1~63编码信号肽的 SignalP程序,里氏木霉内切葡聚糖酶II的成熟多肽编码序列是SEQ ID NO:7的核苷酸64~1254或其cDNA序列。另一方面,基于预测SEQ ID NO:9的核苷酸1~57编码信号肽的SignalP程序,里氏木霉β-葡糖苷酶的成熟多肽编码序列是SEQ ID NO:9的核苷酸58~2612或其cDNA 序列。另一方面,基于预测SEQ ID NO:11的核苷酸1~57编码信号肽的SignalP程序,里氏木霉木聚糖酶I的成熟多肽编码序列是SEQ ID NO:11的核苷酸58~749或其cDNA序列。另一方面,基于预测SEQ ID NO:13的核苷酸1~57编码信号肽的SignalP程序,里氏木霉木聚糖酶 II的成熟多肽编码序列是SEQ ID NO:13的核苷酸58~778或其cDNA 序列。另一方面,基于预测SEQ ID NO:15的核苷酸1~48编码信号肽的SignalP程序,里氏木霉木聚糖酶III的成熟多肽编码序列是SEQ ID NO:15的核苷酸49~1349或其cDNA序列。另一方面,基于预测SEQ ID NO:17的核苷酸1~60编码信号肽的SignalP程序,里氏木霉β-木糖苷酶的成熟多肽编码序列是SEQ ID NO:17的核苷酸61~2391或其 cDNA序列。另一方面,基于预测SEQ ID NO:19的核苷酸1~54编码信号肽的SignalP程序,里氏木霉膨胀因子的成熟多肽编码序列是SEQ ID NO:19的核苷酸
55~2776或其cDNA序列。另一方面,基于预测 SEQ ID NO:21的核苷酸1~57编码信号肽的SignalP程序,里氏木霉枯草杆菌蛋白酶样丝氨酸蛋白酶的成熟多肽编码序列是SEQ ID NO:21 的核苷酸58~2774。另一方面,基于预测SEQ ID NO:23的核苷酸1~60 编码信号肽的SignalP程序,里氏木霉天冬氨酸蛋白酶的成熟多肽编码序列是SEQ ID NO:23的核苷酸
61~1299。另一方面,基于预测SEQ ID NO:25的核苷酸1~57编码信号肽的SignalP程序,里氏木霉胰蛋白酶样蛋白酶的成熟多肽编码序列是SEQ ID NO:25的核苷酸58~930。另一方面,基于预测SEQ ID NO:27的核苷酸1~45编码信号肽的SignalP 程序,另一种里氏木霉枯草杆菌蛋白酶样丝氨酸蛋白酶的成熟多肽编码序列是SEQ ID NO:27的核苷酸46~1681。另一方面,基于预测SEQ ID NO:29的核苷酸1~51编码信号肽的SignalP程序,另一种里氏木霉天冬氨酸蛋白酶的成熟多肽编码序列是SEQ ID NO:29的核苷酸 52~1339。
[0086] 中等严格条件:术语“中等严格条件”是指,长度为至少100个核苷酸的探针,在42℃下,在5×SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和35%甲酰胺中预杂交并杂交,按照标准DNA 印迹过程进行12~24个小时。载体材料最终使用2×SSC、0.2%SDS在 55℃下洗涤三次,每次15分钟。
[0087] 中到高等严格条件:术语“中到高等严格条件”是指,长度为至少100个核苷酸的探针,在42℃下,在5×SSPE、0.3%SDS、200微克 /ml剪切并变性的鲑鱼精子DNA和35%甲酰胺中预杂交并杂交,按照标准DNA印迹过程进行12~24个小时。载体材料最终使用2×SSC、 0.2%SDS在60℃下洗涤三次,每次15分钟。
[0088] 核酸构建体:术语“核酸构建体”是指单链或双链的核酸分子,其从天然存在的基因中分离出或以自然中不会出现或是合成的方式修饰成包含核酸片段,其包含一个或多个(例如,几个)控制序列。
[0089] 可操作地连接:术语“可操作地连接”是指一种构造,其中控制序列位于相对于多核苷酸的编码序列为合适的位置,从而使控制序列引导编码序列的表达。
[0090] 具有纤维素分解增强活性的多肽:术语“具有纤维素分解增强活性的多肽”是指通过具有纤维素分解活性的酶来催化纤维素材料水解的增强的GH61多肽。出于本发明的目的,通过测量由纤维素分解酶在下述条件下水解纤维素材料而来的还原糖的增加或纤维二糖与葡萄糖总量的增加来确定纤维素分解增强活性:PCS中的l~50mg总蛋白/g 纤维素,其中总蛋白包含50~99.5%w/w的纤维素分解酶蛋白和 0.5~50%w/w的具有纤维素分解增强活性的GH61多肽的蛋白,在合适的温度例如50℃、55℃或60℃以及pH例如5.0或5.5下1~7天,与用等量的无纤维素分解增强活性的总蛋白加载量(PCS中的l~50mg纤维素分解蛋白/g纤维素)所进行的对照水解相比。在优选的方面,在 2~3%总蛋白质重量的米曲霉(Aspergillus oryzae)β-葡糖苷酶(根据 WO 02/095014在米曲霉中重组产生)或2~3%总蛋白质重量的烟曲霉 (Aspergillus fumigatus)β-葡糖苷酶(根据WO 2002/095014在米曲霉中重组产生)的纤维素酶蛋白质加载量的存在下将  1.5L(Novozymes 
A/S, Denmark)的混合物用作纤维素分解活性的来源。
[0091] 具有纤维素分解增强活性的GH61多肽通过降低达到相同水解程度所需的纤维素分解酶的量来增强由具有纤维素分解活性的酶催化的纤维素材料的水解,优选降低至少1.01倍,例如至少1.05倍、至少1.10 倍、至少1.25倍、至少1.5倍、至少2倍、至少3倍、至少4倍、至少5倍、至少10倍或至少20倍。
[0092] 经预处理的玉米秸秆:术语“PCS”或“经预处理的玉米秸秆”是指通过用热和稀硫酸处理、预处理或中性预处理而得自玉米秸秆的纤维素材料。
[0093] 序列同一性:两个氨基酸序列之间或两个核苷酸序列之间的关联性通过参数“序列同一性”来描述。
[0094] 出于本发明的目的,使用在EMBOSS软件包(EMBOSS:The European Molecular Biology Open Software Suite(欧洲分子生物学开放软件包),Rice等人,2000,Trends Genet.16:276-277)(优选5.0.0或更新版本)的Needle程序中执行的Needleman-Wunsch算法(Needleman and Wunsch,1970,J.Mol.Biol.48:443-453),来确定两个氨基酸序列之间的序列同一性。所使用的参数是,空位开放罚分为10,空位扩展罚分为0.5,以及EBLOSUM62(BLOSUM62的EMBOSS版本)替换矩阵。Needle标记的“最长同一性”的输出(使用-nobrief选项得到的) 被用作百分比同一性并计算如下:
[0095] (相同残基×100)/(比对长度-比对中的空位总数)。
[0096] 出于本发明的目的,使用在EMBOSS软件包(EMBOSS:The European Molecular Biology Open Software Suite(欧洲分子生物学开放软件包),Rice等人,2000,同上)(优选5.0.0或更新版本)的Needle 程序中执行的Needleman-Wunsch算法(Needleman and Wunsch,1970,同上),来确定两个脱氧核糖核苷酸序列之间的序列同一性。所使用的参数是,空位开放罚分为10,空位扩展罚分为0.5,以及EDNAFULL (NCBI NUC4.4的EMBOSS版本)替换矩阵。Needle标记的“最长同一性”的输出(使用-nobrief选项得到的)被用作百分比同一性并计算如下:
[0097] (相同的脱氧核糖核苷酸×100)/(比对长度-比对中的空位总数)。
[0098] 子序列:术语“子序列”是指从成熟多肽编码序列的5'和/或3'端缺失一个或多个(例如,几个)核苷酸的多核苷酸;其中子序列编码具有酶活性的片段。在一个方面,子序列含有酶的成熟多肽编码序列的至少85%,例如,至少90%或至少95%的核苷酸。
[0099] 枯草杆菌蛋白酶样丝氨酸蛋白酶:术语“枯草杆菌蛋白酶样丝氨酸蛋白酶”是指底物特异性类似于枯草杆菌蛋白酶的蛋白酶,枯草杆菌蛋白酶使用丝氨酸残基来催化肽和蛋白中肽键的水解。枯草杆菌蛋白酶样蛋白酶(枯草杆菌酶)为丝氨酸蛋白酶,其特征在于三个氨基酸天冬氨酸、组氨酸和丝氨酸的催化三联体(catalytic triad)。这些催化残基的排布为来自地衣芽孢杆菌(Bacillus licheniformis)的原型枯草杆菌蛋白酶所共有(Siezen和Leunissen,1997,Protein Science 6:501-523)。枯草杆菌蛋白酶样丝氨酸蛋白酶的活性可以使用合成的底物N-琥珀酰-L-Ala-L-Ala-L-Pro-L-Phe-对硝基酰苯胺(AAPF)(Bachem AG,Bubendorf,瑞士)于100mM NaCl-100mM MOPS pH 7.0中在50℃下3小时并接着测量在405nm处吸光度而确定。
[0100] 靶向整合:术语“靶向整合”是指细胞外DNA在指定的基因组基因座处的稳定整合。
[0101] 转化体:术语“转化体”是指已接纳胞外DNA(外来的、人工的或修饰的)并表达包含其中的基因的细胞。
[0102] 转化:术语“转化”是指将胞外DNA导入细胞,即,由从其周围直接摄入、整合并表达外来遗传物质(外来DNA)以及经细胞膜接收而引起的细胞的遗传改变。
[0103] 转化效率:术语“转化效率”是指细胞能够摄入胞外DNA并表达其中所含的基因的效率,转化效率通过将表达基因的阳性转化体的数目除以转化过程中使用的DNA量来计算。
[0104] 胰蛋白酶样丝氨酸蛋白酶:术语“胰蛋白酶样丝氨酸蛋白酶”是指底物特异性类似于胰蛋白酶的蛋白酶,胰蛋白酶使用丝氨酸残基来催化肽和蛋白中肽键的水解。出于本发明的目的,胰蛋白酶样丝氨酸蛋白酶的活性是根据Dienes等人,2007,Enzyme and Microbial Technology 40:1087-1094所述的方法而确定的。
[0105] 变体:术语“变体”是指,在一个或多个(例如,几个)位置上包含改变(即替换、插入和/或缺失)的具有酶活性的多肽。替换是指用不同的氨基酸取代占据位置的氨基酸;缺失是指去除占据位置的氨基酸;而插入是指将氨基酸添加至紧邻占据位置的氨基酸。
[0106] 极高等严格条件:术语“极高等严格条件”是指,长度为至少100 个核苷酸的探针,在42℃下,在5×SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和50%甲酰胺中预杂交并杂交,按照标准 DNA印迹过程进行12至24个小时。载体材料最终使用2×SSC、 0.2%SDS在70℃下洗涤三次,每次15分钟。
[0107] 极低等严格条件:术语“极低等严格条件”是指,长度为至少100 个核苷酸的探针,在42℃下,在5×SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和25%甲酰胺中预杂交并杂交,按照标准 DNA印迹过程进行12至24个小时。载体材料最终使用2×SSC、 0.2%SDS在45℃下洗涤三次,每次15分钟。
[0108] 含木聚糖的材料:术语“含木聚糖的材料”是指任何包含植物细胞壁多糖的材料,植物细胞壁多糖含有β-(1-4)-连接的木糖残基的骨架。陆生植物的木聚糖是具有β-(1-4)-D-吡喃木糖骨架的杂聚物,其由短的糖链分支。它们包含D-葡糖醛酸或其4-O-甲基醚、L-阿拉伯糖和/或多种由D-木糖、L-阿拉伯糖、D-或L-半乳糖和D-葡萄糖构成的寡糖。木聚糖类的多糖可以分为均木聚糖(homoxylan)和杂木聚糖 (heteroxylan),包括葡糖醛酸木聚糖、(阿拉伯)葡糖醛酸木聚糖、(葡糖醛酸)阿拉伯木聚糖、阿拉伯木聚糖和复合杂木聚糖。参见,例如 Ebringerova等人,2005,Adv.Polym.Sci.186:1-67。
[0109] 在本发明的方法中,可以使用任何含有木聚糖的材料。在优选的方面,含木聚糖的材料为木质纤维素。
[0110] 木聚糖降解活性或木聚糖分解活性:术语“木聚糖降解活性”或“木聚糖分解活性”是指水解含木聚糖的材料的生物学活性。两种基础的测量木聚糖分解活性的方法包括:(1)测量总木聚糖分解活性,和(2)测量单个的木聚糖分解活性(例如,内切木聚糖酶、β-木糖苷酶、阿拉伯呋喃糖苷酶、α-葡糖醛酸酶、乙酰木聚糖酯酶、阿魏酸酯酶和α-葡糖醛酸酯酶(alpha-glucuronyl esterase))。木聚糖分解酶检定的最新进展被总结于几个公开文献中,包括Biely and Puchard,Recent progress in the assays of xylanolytic enzymes,2006,Journal of the Science of Food and Agriculture 86(11):1636-1647;Spanikova and Biely,2006, Glucuronoyl esterase-Novel carbohydrate esterase produced by Schizophyllum commune,FEBS Letters 580(19):4597-4601;Herrmann, Vrsanska,Jurickova,Hirsch,Biely and Kubicek,1997,The beta-D-xylosidase of Trichoderma reesei is a multifunctional beta-D-xylan xylohydrolase,Biochemical Journal 321:375-381。
[0111] 总木聚糖降解活性可以通过确定由多种类型的木聚糖形成的还原糖来测量,木聚糖包括,例如,燕麦(oat spelt)、山毛榉材和落叶松材木聚糖,或可以通过光度法确定从多种共价染色的木聚糖中释放出的染色木聚糖片段而测量。最常见的总木聚糖分解活性检定基于由多聚 4-O-甲基葡糖醛酸木聚糖生产还原糖,如Bailey,Biely,Poutanen,1992, Interlaboratory testing of methods for assay of xylanase activity、Journal of Biotechnology 23(3):257-270中所述。木聚糖酶活性亦可以用0.2% AZCL-阿拉伯木聚糖作为底物在37℃下于0.01% X-100 (4-(1,1,3,3-四甲基丁基)苯基-聚乙二醇)和200mM磷酸钠缓冲液pH 6 中加以确定。一个单位的木聚糖酶活性定义为在37℃、pH 6下在200 mM磷酸钠pH 6缓冲液中从作为底物的0.2%AZCL-阿拉伯木聚糖中每分钟产生1.0微摩尔可可碱醋酸钠(azurine)。
[0112] 出于本发明的目的,木聚糖降解活性是通过在以下通常条件下测量由木聚糖降解酶引起的白桦木聚糖(Sigma Chemical Co.,Inc.,St. Louis,MO,美国)水解的增加而确定的:1ml反应,5mg/ml底物(总固体),5mg木聚糖分解蛋白/g底物,50mM乙酸钠pH 5,50℃,24 小时,如Lever,1972,A  new reaction for  colorimetric determination of carbohydrates,Anal.Biochem 47:273-279所述的使用对羟基苯甲酸酰肼 (PHBAH)检定的糖分析。
[0113] 木聚糖酶:术语“木聚糖酶”是指催化木聚糖中1,4-β-D-木糖苷键的内水解的1,4-β-D-木聚糖-木糖水解酶 (1,4-beta-D-xylan-xylohydrolase)(E.C.3.2.1.8)。出于本发明的目的,木聚糖酶活性是用0.2%AZCL-阿拉伯木聚糖作为底物在37℃下于 0.01%X-100和200mM磷酸钠缓冲液pH 6中加以确定的。一个单位的木聚糖酶活性定义为在37℃、pH 6下于200mM磷酸钠pH 6缓冲液中从作为底物的0.2%AZCL-阿拉伯木聚糖中每分钟产生1.0 微摩尔可可碱醋酸钠。
[0114] 发明详述
[0115] 本发明涉及构建用于产生具有生物活性的多种重组多肽的丝状真菌菌株的方法,包括:(a)通过向丝状真菌菌株中导入第一串联构建体,通过靶向整合取代内源性第一基因,该第一串联构建体包含(i) 第一基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个(例如,几个)第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)第一基因的同源3’区、其同源侧翼区或其组合;(b)通过向丝状真菌菌株中导入第二串联构建体,通过靶向整合取代内源性第二基因,该第二串联构建体包含(i)第二基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个(例如,几个)第二可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和 (v)第二基因的同源3’区、其同源侧翼区或其组合;或(c)(a)和 (b)的组合。
[0116] 本发明还涉及串联构建体,其包含:(i)基因的同源5’区、其同源侧翼区或其组合;(ii)一个或多个(例如,几个)可选择性标记物; (iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(v)基因的同源 3’区、其同源侧翼区或其组合。
[0117] 本发明还涉及构建用于产生具有生物活性的多种重组多肽的丝状真菌菌株的方法,其包括:(a)通过向丝状真菌菌株中导入第一串联构建体,通过靶向整合插入到内源性第一基因座中,该第一串联构建体包含(i)第一基因座的同源5’区、其同源侧翼区或其组合,(ii) 一个或多个第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)第一基因座的同源3’区、其同源侧翼区或其组合;(b)通过向丝状真菌菌株中导入第二串联构建体,通过靶向整合插入到内源性第二基因座中,该第二串联构建体包含(i)第二基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第二可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v) 第二基因座的同源3’区、其同源侧翼区或其组合;或(c)(a)和(b) 的组合。
[0118] 本发明还涉及串联构建体,其包含:(i)基因座的同源5’区、其同源侧翼区或其组合;(ii)一个或多个第一可选择性标记物;(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(v)基因座的同源3’区、其同源侧翼区或其组合。
[0119] 在本发明的方法中,各个串联构建体均通过双同源重组整合至丝状真菌菌株染色体中的目标位点。在一方面,第一基因或第一基因座的同源5’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp 或至少2000bp。另一方面,第一基因或第一基因座的同源3’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。另一方面,第二基因或第二基因座的同源5’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少 800bp、至少1000bp、至少1500bp或至少2000bp。另一方面,第二基因或第二基因座的同源3’区、其同源侧翼区或其组合为至少
50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000 bp、至少1500bp或至少2000bp。
[0120] 本发明的方法还可以包括将一个或多个(例如,几个)其他内源性基因各自通过靶向整合用针对各个基因的对应串联构建体取代,串联构建体包含:(i)基因的同源5’区、其同源侧翼区或其组合;(ii) 一个或多个(例如,几个)可选择性标记物;(iii)与启动子可操作连接的编码具有生物活性的多肽的多核苷酸;(iv)与另一启动子可操作连接的编码具有生物活性的另一多肽的另一多核苷酸;和(v)基因的同源3’区、其同源侧翼区或其组合。
[0121] 本发明的方法还可以包括向一个或多个(例如,几个)其他内源性基因座中各自通过靶向整合插入针对各个基因座的对应串联构建体,该串联构建体包含:(i)基因座的同源5’区、其同源侧翼区或其组合;(ii)一个或多个(例如,几个)可选择性标记物;(iii)与启动子和终止子可操作连接的编码具有生物活性的多肽的多核苷酸;(iv) 与另一启动子和另一终止子可操作连接的编码具有生物活性的另一多肽的另一多核苷酸;和(v)基因座的同源3’区、其同源侧翼区或其组合。
[0122] 在本发明的方法中,丝状真菌宿主细胞还可以用串联构建体进行转化,该串联构建体包含:(i)一个或多个(例如,几个)可选择性标记物;(ii)与第五启动子和第五终止子可操作连接的编码具有生物活性的第五多肽的第五多核苷酸;和(iii)与第六启动子和第六终止子可操作连接的编码具有生物活性的第六多肽的第六多核苷酸,其中串联构建体通过异位整合来整合。
[0123] 本发明提供几项优势,包括在丝状真菌宿主中产生多种重组多肽的改良方法;使得一个或多个导入到丝状真菌菌株中的重组多肽可以简单地得以取代和/或缺失的方法(如果一个或多个重组多肽在单个基因座处导入,该一个或多个重组多肽可以在单一步骤中被取代和/或缺失,而不是在多个步骤中);以及使得丝状真菌宿主中存在的一个或多个重组多肽可以简单地得以修饰(如果一个或多个重组多肽在单个基因座处导入,一个或多个这些重组多肽的变体/突变体可以很容易地在单一步骤中加以修饰,而不是在多个步骤中)。本发明构建的丝状真菌菌株的其他优势是可以诱变菌株并选择收率提高的突变体。然后可以将这些突变体的串联构建体用表达新的多种重组多肽的新的串联构建体取代,从而利用作为宿主细胞的突变体的提高的收率生产率。
[0124] 内源性基因
[0125] 在本发明的方法中,任何对于丝状真菌菌株来说为内源性的的基因可以被取代,或者可以是基因座。基因对于丝状真菌菌株来说可以是内生的或外来的。术语“内源性基因”或其变型,例如,“内源性第一基因”或“内源性第二基因”将理解成包括一个或多个(例如,几个)基因。当多于一个基因被取代时,基因优选是邻接的。这样的多个基因可以是,例如,代谢通路或其一部分。
[0126] 内源性基因可以编码选自抗体抗原、抗微生物肽、酶、生长因子、激素、免疫增强剂(immunodilator)、神经递质、受体、报告蛋白质、结构蛋白或转录因子的多肽。
[0127] 在一方面,酶选自氧化还原酶、转移酶、水解酶、裂解酶、异构酶和连接酶。另一方面,酶选自乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、氨基肽酶、α-淀粉酶、α-半乳糖苷酶、α-葡糖苷酶、α-1,6-葡糖苷转移酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、几丁质酶、香豆酸酯酶、环糊精糖基转移酶、质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、阿魏酸酯酶、具有纤维素分解促进活性的GH61多肽、葡糖脑苷脂酶、葡萄糖氧化酶、葡糖醛酸酶、葡糖醛酸酯酶、卤过氧化物酶(haloperoxidase)、半纤维素酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、甘露聚糖酶、甘露糖苷酶、变聚糖酶(mutanase)、氧化酶、果胶酶、过氧化物酶、磷脂酶、植酸酶、酚氧化酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、尿激酶和木聚糖酶。
[0128] 另一方面,一个或多个(例如,几个)内源性蛋白酶基因是失活的。另一方面,一个或多个(例如,几个)内源性蛋白酶基因是枯草杆菌蛋白酶样丝氨酸蛋白酶、天冬氨酸蛋白酶和胰蛋白酶样丝氨酸蛋白酶基因,如WO 2011/075677中所述,其通过引用的方式全部并入本文。
[0129] 另一方面,酶是枯草杆菌蛋白酶样丝氨酸蛋白酶。另一方面,酶是天冬氨酸蛋白酶。另一方面,酶是胰蛋白酶样丝氨酸蛋白酶。
[0130] 另一方面,酶是内切葡聚糖酶。另一方面,酶是纤维二糖水解酶。另一方面,酶是β-葡糖苷酶。另一方面,酶是具有纤维素分解增强活性的GH61多肽。另一方面,酶是木聚糖酶。另一方面,酶是β-木糖苷酶。另一方面,酶是膨胀因子。另一方面,酶是乙酰木聚糖酯酶。另一方面,酶是阿魏酸酯酶。另一方面,酶是阿拉伯呋喃糖苷酶。另一方面,酶是葡糖醛酸酶。
另一方面,酶是乙酰甘露聚糖酯酶。另一方面,酶是阿拉伯聚糖酶。另一方面,酶是香豆酸酯酶。另一方面,酶是半乳糖苷酶。另一方面,酶是葡糖醛酸酯酶。另一方面,酶是甘露聚糖酶。
另一方面,酶是甘露糖苷酶。
[0131] 另一方面,内源性基因可以是纤维二糖水解酶I基因。另一方面,纤维二糖水解酶I基因编码选自以下的纤维二糖水解酶I:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I;(ii)包含与SEQ ID NO:2 的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少
98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I;(iii)由包含与SEQ ID NO:
1 的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少
83%、至少84%、至少85%、至少86%、至少 87%、至少88%、至少89%、至少90%、至少
91%、至少92%、至少 93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少 
99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO: 1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I。
[0132] 另一方面,内源性基因可以是纤维二糖水解酶II基因。另一方面,纤维二糖水解酶II基因编码选自以下的纤维二糖水解酶II:(i)包含 SEQ ID NO:4的成熟多肽的纤维二糖水解酶II;(ii)包含与SEQ ID NO: 4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II;(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少
82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少
99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II;和(iv)由在至少高等严格条件,例如非常高等严格条件下与 SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
[0133] 另一方面,内源性基因可以是内切葡聚糖酶I基因。另一方面,内切葡聚糖酶I基因编码选自以下的内切葡聚糖酶I:(i)包含SEQ ID NO: 6的成熟多肽的内切葡聚糖酶I;(ii)包含与SEQ ID NO:6的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少
99%序列同一性的氨基酸序列的内切葡聚糖酶I;(iii)由包含与SEQ ID NO:5的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少 82%、至少83%、至少
84%、至少85%、至少86%、至少87%、至少 88%、至少89%、至少90%、至少91%、至少
92%、至少93%、至少 94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的内切葡聚糖酶I;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO:5的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的内切葡聚糖酶 I。
[0134] 另一方面,内源性基因可以是内切葡聚糖酶II基因。另一方面,内切葡聚糖酶II基因编码选自以下的内切葡聚糖酶II:(i)包含SEQ ID NO:8的成熟多肽的内切葡聚糖酶II;(ii)包含与SEQ ID NO:8的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少
90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的内切葡聚糖酶II;(iii)由包含与SEQ ID NO:7的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少
92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的内切葡聚糖酶II;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO:7的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的内切葡聚糖酶II。
[0135] 另一方面,内源性基因可以是β-葡糖苷酶基因。另一方面,β-葡糖苷酶基因编码选自以下的β-葡糖苷酶:(i)包含SEQ ID NO:10的成熟多肽的β-葡糖苷酶;(ii)包含与SEQ ID NO:10的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的β-葡糖苷酶;(iii)由包含与SEQ ID NO:9的成熟多肽编码序列具有至少
70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少
86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的β-葡糖苷酶;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO:9的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的β-葡糖苷酶。
[0136] 另一方面,内源性基因可以是木聚糖酶I基因。另一方面,木聚糖酶I基因编码选自以下的木聚糖酶I:(i)包含SEQ ID NO:12的成熟多肽的木聚糖酶I;(ii)包含与SEQ ID NO:12的成熟多肽具有至少 70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少
92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的木聚糖酶I;(iii)由包含与SEQ ID NO:11的成熟多肽编码序列具有至少
70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少
86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的木聚糖酶I;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO:11的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的木聚糖酶I。
[0137] 另一方面,内源性基因可以是木聚糖酶II基因。另一方面,木聚糖酶II基因编码选自以下的木聚糖酶II:(i)包含SEQ ID NO:14的成熟多肽的木聚糖酶II;(ii)包含与SEQ ID NO:14的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的木聚糖酶II;(iii)由包含与SEQ ID NO:13的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少 83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少 89%、至少90%、至少91%、至少92%、至少93%、至少
94%、至少 95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的木聚糖酶II;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO:13的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的木聚糖酶II。
[0138] 另一方面,内源性基因可以是木聚糖酶III基因。另一方面,木聚糖酶III基因编码选自以下的木聚糖酶III:(i)包含SEQ ID NO:16的成熟多肽的木聚糖酶III;(ii)包含与SEQ ID NO:16的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的木聚糖酶III;(iii)由包含与SEQ ID NO:15的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少 83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少 89%、至少90%、至少91%、至少92%、至少
93%、至少94%、至少 95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的木聚糖酶III;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO:15的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的木聚糖酶III。
[0139] 另一方面,内源性基因可以是β-木糖苷酶基因。另一方面,β-木糖苷酶基因编码选自以下的β-木糖苷酶:(i)包含SEQ ID NO:18的成熟多肽的β-木糖苷酶;(ii)包含与SEQ ID NO:18的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的β-木糖苷酶;(iii)由包含与SEQ ID NO:17的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少 89%、至少90%、至少91%、至少92%、至少93%、至少
94%、至少 95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的β-木糖苷酶;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO:17的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的β-木糖苷酶。
[0140] 另一方面,内源性基因可以是膨胀因子基因。另一方面,膨胀因子基因编码选自以下的膨胀因子:(i)包含SEQ ID NO:20的成熟多肽的膨胀因子;(ii)包含与SEQ ID NO:20的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的膨胀因子; (iii)由包含与SEQ ID NO:19的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少
95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的膨胀因子;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO:19的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的膨胀因子。
[0141] 另一方面,内源性基因可以是枯草杆菌蛋白酶样丝氨酸蛋白酶基因。另一方面,枯草杆菌蛋白酶样丝氨酸蛋白酶基因编码选自以下的枯草杆菌蛋白酶样丝氨酸蛋白酶:(i)包含SEQ ID NO:22的成熟多肽的枯草杆菌蛋白酶样丝氨酸蛋白酶;(ii)包含与SEQ ID NO:22的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少
92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的枯草杆菌蛋白酶样丝氨酸蛋白酶;(iii)由包含与SEQ ID NO:21的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少
92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的枯草杆菌蛋白酶样丝氨酸蛋白酶;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO:21的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的枯草杆菌蛋白酶样丝氨酸蛋白酶。
[0142] 另一方面,内源性基因可以是天冬氨酸蛋白酶基因。另一方面,天冬氨酸蛋白酶基因编码选自以下的天冬氨酸蛋白酶:(i)包含SEQ ID NO:24的成熟多肽的天冬氨酸蛋白酶;(ii)包含与SEQ ID NO:24的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少 82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少 88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少 94%、至少95%、至少96%、至少97%、至少
98%或至少99%序列同一性的氨基酸序列的天冬氨酸蛋白酶;(iii)由包含与SEQ ID NO:
23 的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少 87%、至少88%、至少89%、至少90%、至少
91%、至少92%、至少 93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少 
99%序列同一性的核苷酸序列的多核苷酸所编码的天冬氨酸蛋白酶;和 (iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO: 23的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的天冬氨酸蛋白酶。
[0143] 另一方面,内源性基因可以是胰蛋白酶样丝氨酸蛋白酶基因。另一方面,胰蛋白酶样丝氨酸蛋白酶基因编码选自以下的胰蛋白酶样丝氨酸蛋白酶:(i)包含SEQ ID NO:26的成熟多肽的胰蛋白酶样丝氨酸蛋白酶;(ii)包含与SEQ ID NO:26的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少
86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的胰蛋白酶样丝氨酸蛋白酶;(iii)由包含与SEQ ID NO:25的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少
87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的胰蛋白酶样丝氨酸蛋白酶;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO:25的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的胰蛋白酶样丝氨酸蛋白酶。
[0144] 另一方面,内源性基因可以是枯草杆菌蛋白酶样丝氨酸蛋白酶基因。另一方面,枯草杆菌蛋白酶样丝氨酸蛋白酶基因编码选自以下的枯草杆菌蛋白酶样丝氨酸蛋白酶:(i)包含SEQ ID NO:28的成熟多肽的枯草杆菌蛋白酶样丝氨酸蛋白酶;(ii)包含与SEQ ID NO:28的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少
92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的枯草杆菌蛋白酶样丝氨酸蛋白酶;(iii)由包含与SEQ ID NO:27的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少
92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的枯草杆菌蛋白酶样丝氨酸蛋白酶;和(iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO:27的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的枯草杆菌蛋白酶样丝氨酸蛋白酶。
[0145] 另一方面,内源性基因可以是天冬氨酸蛋白酶基因。另一方面,天冬氨酸蛋白酶基因编码选自以下的天冬氨酸蛋白酶:(i)包含SEQ ID NO:30的成熟多肽的天冬氨酸蛋白酶;(ii)包含与SEQ ID NO:30的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少 82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少
90%、至少91%、至少92%、至少93%、至少 94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的天冬氨酸蛋白酶;(iii)由包含与SEQ ID NO:29 的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少 81%、至少82%、至少
83%、至少84%、至少85%、至少86%、至少 87%、至少88%、至少89%、至少90%、至少
91%、至少92%、至少 93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少 
99%序列同一性的核苷酸序列的多核苷酸所编码的天冬氨酸蛋白酶;和 (iv)由在至少高等严格条件,例如非常高等严格条件下与SEQ ID NO: 29的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的天冬氨酸蛋白酶。
[0146] 串联构建体
[0147] 本发明还涉及串联构建体,其包含:(i)基因的同源5’区、其同源侧翼区或其组合;(ii)一个或多个(例如,几个)可选择性标记物; (iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(v)基因的同源 3’区、其同源侧翼区或其组合。
[0148] 本发明还涉及串联构建体,其包含:(i)基因座的同源5’区、其同源侧翼区或其组合;(ii)一个或多个第一可选择性标记物;(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(v)基因座的同源3’区、其同源侧翼区或其组合。
[0149] 串联构建体可以通过使一个或多个(例如,几个)控制基因与构建体的各个多核苷酸可操作连接而构建,从而在与控制序列相容的条件下引导编码序列在丝状真菌宿主细胞中的表达。取决于表达载体,在插入到载体之前对各个多核苷酸进行操纵可能是合意的或必需的。使用重组DNA方法修饰多核苷酸的技术是本领域公知的。
[0150] 控制序列可以是启动子,即被宿主细胞识别用于编码多肽的多核苷酸的表达的多核苷酸。启动子含有介导多肽表达的转录控制序列。启动子可以是任何在宿主细胞中表现出转录活性的多核苷酸,包括突变的、截短的和杂合的启动子,并且可以得自与宿主细胞同源或异源的编码胞外或胞内多肽的基因。
[0151] 一方面,启动子是不同的启动子。另一方面,两个或更多个(例如,几个)启动子是相同的启动子。
[0152] 用于在丝状真菌宿主细胞中引导构建体的转录的适当启动子的实例是从构巢曲霉(Aspergillus nidulans)乙酰胺酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉 (Aspergillus awamori)葡糖淀粉酶(glaA)、米曲霉(Aspergillus oryzae) TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、尖孢镰孢(Fusarium oxysporum)胰蛋白酶样蛋白酶(WO 96/00787)、镶片镰孢(Fusarium venenatum)淀粉葡糖苷酶(WO 00/56900)、镶片镰孢 (Fusarium venenatum)Daria(WO 00/56900)、镶片镰孢Quinn(WO 00/56900)、米黑根毛霉(Rhizomucor miehei)脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶、和里氏木霉翻译延伸因子的基因中获得的启动子,以及NA2-tpi启动子(得自曲霉中性α-淀粉酶基因的修饰启动子,其中非翻译前导已被曲霉磷酸丙糖异构酶基因的非翻译前导替换;非限制性实例包括黑曲霉中性α-淀粉酶基因的修饰启动子,其中非翻译前导已被构巢曲霉或米曲霉磷酸丙糖异构酶基因的非翻译前导替换);以及其突变的、截短的和杂合的启动子。其他启动子在美国专利第 6,011,147中描述,其整体并入本文。
[0153] 控制序列也可以是转录终止子,其由宿主细胞识别来终止转录。终止子与编码多肽的多核苷酸的3’端可操作地连接。可以在宿主细胞中起作用的任何终止子可以用在本发明中。
[0154] 在一个方面,终止子是不同的终止子。在另一个方面,两个或更多个(例如,几个)终止子是相同的终止子。
[0155] 用于丝状真菌宿主细胞的优选终止子得自构巢曲霉邻氨基苯甲酸合酶、构巢曲霉乙酰胺酶(amdS)、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖孢镰孢胰蛋白酶样蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶、和里氏木霉翻译延伸因子的基因。
[0156] 控制序列还可以是前导序列,即,对由宿主细胞的翻译较为重要的mRNA非翻译区。前导序列可操作地连接到编码多肽的多核苷酸的 5’端。任何在宿主细胞中起作用的前导序列均可以使用。
[0157] 用于丝状真菌宿主细胞的优选前导序列得自米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶的基因。
[0158] 控制序列也可以是多腺苷酸化序列,即可操作地连接至多核苷酸的3’端的序列,在转录时被宿主细胞识别为向所转录的mRNA添加多腺苷残基的信号。在宿主细胞中起作用的任何多腺苷酸化序列均可以使用。
[0159] 用于丝状真菌宿主细胞的优选多腺苷酸化序列得自构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA 淀粉酶、尖孢镰孢胰蛋白酶样蛋白酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、和里氏木霉内切葡聚糖酶V的基因。
[0160] 控制序列也可以是编码与多肽N端连接的信号肽并引导多肽进入细胞分泌通路的信号肽编码区。多核苷酸的编码序列的5’端可以固有地包含在翻译阅读框中与编码多肽的编码序列片段自然连接的信号肽编码序列。或者,编码序列的5’端可以包含对于编码序列为外来的信号肽编码序列。在编码序列不天然包含信号肽编码序列时,外来信号肽编码序列可能是需要的。或者,为增强多肽的分泌,外来信号肽编码序列可以简单地取代天然信号肽编码序列。然而,任何引导所表达的多肽进入宿主细胞的分泌通路的信号肽编码序列均可以使用。
[0161] 用于丝状真菌宿主细胞的有效信号肽编码序列是得自黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉 (Humicola insolens)纤维素酶、特异腐质霉内切葡聚糖酶V、柔毛腐质霉(Humicola lanuginosa)脂肪酶、米黑根毛霉(Rhizomucor miehei) 天冬氨酸蛋白酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、和里氏木霉切葡聚糖酶V的基因的信号肽编码序列。
[0162] 控制序列也可以是编码位于多肽N端的前肽的前肽编码序列。得到的多肽称为酶原或前多肽(或在一些情况下为酵素原)。前多肽一般是失活的且可以通过从前多肽到前肽的催化或自催化切割而转化为活性多肽。前肽编码序列可以得自嗜热毁丝菌(Myceliophthora thermophila)漆酶(WO 95/33836)和米黑根毛霉天冬氨酸蛋白酶的基因。
[0163] 在信号肽和前肽序列均存在时,前肽序列紧邻多肽的N端且信号肽序列紧邻前肽序列的N端。
[0164] 也可能需要添加调控多肽相对于宿主细胞生长的表达的调控序列。调控序列的实例是响应于化学或物理刺激(包括调控化合物的存在)引起基因表达的开启和关闭的那些。丝状真菌中的调控序列包括黑曲霉葡糖淀粉酶启动子、米曲霉TAKA α-淀粉酶启动子、米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶I启动子和里氏木霉纤维二糖水解酶II启动子。调控序列的其他实例是使得基因扩增的那些。在这些情况下,编码多肽的多核苷酸将与调控序列可操作地连接。
[0165] 本发明的串联构建体优选包含一个或多个(例如,几个)允许方便地选择所转化细胞的可选择性标记物。可选择性标记物是基因,其产物提供对生物灭杀剂的抗性或病毒抗性、重金属抗性、相对于营养缺陷型的原养型等。用于丝状真菌宿主细胞的可选择性标记物的 实例包括 ,但不限于 ,ad eA (磷酸 核糖基氨基咪唑 -琥珀羧胺合 酶 (phosphoribosylaminoimidazole-succinocarboxamide synthase))、adeB (磷酸核糖基氨基咪唑合酶(phosphoribosylaminoimidazole synthase))、 amdS(乙酰胺酶)、argB(氨酸氨甲酰基转移酶)、bar(膦丝菌素乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5'-磷酸脱羧酶)、sC(硫酸腺苷酰转移酶)、和trpC(邻氨基苯甲酸合成酶)、以及其等价物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉amdS和pyrG基因以及吸水链霉菌(Streptomyces hygroscopicus)bar基因。优选用在木霉属细胞中的是adeA、adeB、amdS、 hph和pyrG基因。细菌可选择性标记物的实例是赋予抗生素抗性的标记物,例如氨苄青霉素、氯霉素、卡那霉素、新霉素、壮观霉素、或四环素抗性。
[0166] 一个或多个(例如,几个)可选择性标记物可以是如WO 2010/039889 A2(通过引用的方式全部合并入本文)中所述的双选择标记物体系。在一个方面,一个或多个可选择性标记物是hph-tk双选择标记物体系。
[0167] 在本发明的各串联构建体中,一个或多个(例如,几个)可选择性标记物是不同的标记物,除非如本文所述重复使用可选择性标记物。
[0168] 一个或多个(例如,几个)可选择性标记物可以再用于将针对各个基因或基因座的对应串联构建体各自通过靶向整合来取代一个或多个(例如,几个)其他内源性基因或插入到一个或多个其他内源性基因座中。一个或多个串联构建体还可以包含一个或多个可选择性标记物的5’侧翼的第一同源重复以及一个或多个可选择性标记物的3’侧翼的第二同源重复,其中,第一同源重复和第二同源重复进行同源重组以切除一个或多个可选择性标记物。在切除一个或多个可选择性标记物时,一个或多个可选择性标记物可以再用于将针对各个基因或基因座的对应串联构建体各自通过靶向整合来取代一个或多个其他内源性基因或插入到一个或多个其他内源性基因座中。
[0169] 在一个方面,第一和第二同源重复是相同的。在另一个方面,第一和第二同源重复彼此具有至少70%,例如,至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列同一性。在另一个方面,第一和第二同源重复各自为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800 bp、至少1000bp、至少1500bp、或至少2000bp。包含一个重复的片段可以比含有另一重复的片段长。
[0170] 本发明的串联构建体还可以包含一个或多个(例如,几个)编码其他具有生物活性的多肽的其他多核苷酸。例如,串联构建体可以含有一个其他多核苷酸、两个其他多核苷酸、三个其他多核苷酸等。
[0171] 具有生物活性的多肽
[0172] 多肽可以是具有目标生物活性的任何多肽。在本文中,术语“多肽”不是指特定长度的所编码产物,因此涵盖肽、寡肽和蛋白。术语“多肽”还涵盖组合形成所编码产物的两个或更多个(例如,几个) 多肽。多肽也包括融合多肽,其包含得自至少两个不同多肽的部分或完整多肽序列的组合,其中一个或多个(例如,几个)多肽可以对丝状真菌宿主细胞为异源。多肽还可以包括下述多肽的天然存在的等位变化和遗传工程变化以及杂合多肽。
[0173] 在一个方面,多肽选自抗体、抗原、抗微生物肽、酶、生长因子、激素、免疫增强剂、神经递质、受体、报告蛋白、结构蛋白、或转录因子。
[0174] 另一方面,酶选自氧化还原酶、转移酶、水解酶、裂解酶、异构酶和连接酶。在另一个方面,酶选自乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、氨基肽酶、α-淀粉酶、α-半乳糖苷酶、α-葡糖苷酶、α-1,6-葡糖苷转移酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、几丁质酶、香豆酸酯酶、环糊精糖基转移酶、角质酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、阿魏酸酯酶、具有纤维素分解增强活性的GH61多肽、葡糖脑苷脂酶、葡糖氧化酶、葡糖醛酸酶、葡糖醛酸酯酶、卤过氧化物酶、半纤维素酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、甘露聚糖酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、磷脂酶、植酸酶、酚氧化酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、尿激酶和木聚糖酶
[0175] 另一方面,多肽选自白蛋白胶原蛋白、弹性蛋白原、弹性蛋白、和明胶。
[0176] 另一方面,具有生物活性的多肽可以是不同的多肽。另一方面,具有生物活性的两个或更多个(例如,几个)多肽是相同的多肽。
[0177] 另一方面,多肽包含选自纤维素酶、cip 1蛋白、具有纤维素分解增强活性的GH61、半纤维素酶、酯酶、膨胀素、漆酶、木质素降解酶、果胶酶、过氧化物酶、蛋白酶、和膨胀因子的一种或多种酶。在另一方面,纤维素酶是选自内切葡聚糖酶、纤维二糖水解酶、和β-葡糖苷酶的一种或多种酶。在另一方面,半纤维素酶是选自木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶和葡糖醛酸酶的一种或多种酶。
[0178] 在另一方面,多肽之一是纤维素酶。在另一方面,多肽之一是内切葡聚糖酶。在另一方面,多肽之一是纤维二糖水解酶。在另一方面,多肽之一是β-葡糖苷酶。在另一方面,多肽之一是具有纤维素分解增强活性的GH61多肽。在另一方面,多肽之一是膨胀因子蛋白。在另一方面,多肽之一是cip 1蛋白。在另一方面,多肽之一是酯酶。在另一方面,多肽之一是膨胀素。在另一方面,多肽之一是漆酶。在另一方面,多肽之一是木质素降解酶。在另一方面,多肽之一是果胶酶。在另一方面,多肽之一是过氧化物酶。在另一方面,多肽之一是蛋白酶。在另一方面,多肽之一是膨胀因子。
[0179] 在另一方面,多肽之一是半纤维素酶。在另一方面,多肽之一是木聚糖酶。在另一方面,多肽之一是β-木糖苷酶。在另一方面,多肽之一是乙酰木聚糖酯酶。在另一方面,多肽之一是阿魏酸酯酶。在另一方面,多肽之一是阿拉伯呋喃糖苷酶。在另一方面,多肽之一是葡糖醛酸酶。在另一方面,多肽之一是乙酰甘露聚糖酯酶。在另一方面,多肽之一是阿拉伯聚糖酶。在另一方面,多肽之一是香豆酸酯酶。在另一方面,多肽之一是半乳糖苷酶。在另一方面,多肽之一是葡糖醛酸酯酶。在另一方面,多肽之一是甘露聚糖酶。在另一方面,多肽之一是甘露糖苷酶。
[0180] 作为具有生物活性的多肽的内切葡聚糖酶的实例包括,但不限于,里氏木霉内切葡聚糖酶I(Penttila等人,1986,Gene 45:253-263)、里氏木霉Cel7B内切葡聚糖酶I(GENBANKTM登录号M15665)、里氏木霉内切葡聚糖酶II(Saloheimo等人,1988,Gene 63:11-22)、里氏木霉Cel5A 内切葡聚糖酶II(GENBANKTM登录号M19373)、里氏木霉内切葡聚糖酶III(Okada等人,1988,Appl.Environ.Microbiol.64:555-563; GENBANKTM登录号AB003694)、里氏木霉内切葡聚糖酶V(Saloheimo 等人,1994,Molecular Microbiology 
13:219-228,GENBANKTM登录号 Z33381)、棘孢曲霉(Aspergillus aculeatus)内切葡聚糖酶(Ooi等人,1990,Nucleic Acids Research 18:5884)、白曲霉(Aspergillus kawachii) 内切葡聚糖酶(Sakamoto等人,1995,Current Genetics 27:435-439)、软腐欧氏杆菌(Erwinia carotovara)内切葡聚糖酶(Saarilahti等人, 1990,Gene 90:9-14)、尖孢镰孢内切葡聚糖酶(GENBANKTM登录号 L29381)、灰腐质霉高温变种(Humicola grisea var.thermoidea)内切葡聚糖酶(GENBANKTM登录号AB003107)、热白丝菌(Melanocarpus albomyces)内切葡聚糖酶(GENBANKTM登录号MAL515703)、粗糙脉孢菌(Neurospora crassa)TM
内切葡聚糖酶(GENBANK 登录号 XM_324477)、特异腐质霉内切葡聚糖酶V、嗜热毁丝菌CBS 
117.65 内切葡聚糖酶、担子菌(basidiomycete)CBS 495.95内切葡聚糖酶、担子菌CBS 
494.95内切葡聚糖酶、太瑞斯梭孢壳(Thielavia terrestris) NRRL 8126CEL6B内切葡聚糖酶、太瑞斯梭孢壳NRRL 8126CEL6C 内切葡聚糖酶、太瑞斯梭孢壳NRRL 8126CEL7C内切葡聚糖酶、太瑞斯梭孢壳NRRL 8126CEL7E内切葡聚糖酶、太瑞斯梭孢壳NRRL 8126 CEL7F内切葡聚糖酶、多生枝鼻菌(Cladorrhinum foecundissimum) ATCC 62373CEL7A内切葡聚糖酶、和里氏木霉菌株No.VTT-D-80133 内切葡聚糖酶(GENBANKTM登录号M15665)。
[0181] 作为具有生物活性的多肽的纤维二糖水解酶的实例包括,但不限于,棘孢曲霉纤维二糖水解酶II(WO 2011/059740)、嗜热毛壳菌 (Chaetomium thermophilum)纤维二糖水解酶I、嗜热毛壳菌纤维二糖水解酶II、特异腐质霉纤维二糖水解酶I、嗜热毁丝菌纤维二糖水解酶 II(WO 2009/042871)、Thielavia hyrcanie纤维二糖水解酶II(WO 2010/141325)、太瑞斯梭孢壳纤维二糖水解酶II(CEL6A,WO 2006/074435)、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶 II和囊状长毛盘菌(Trichophaea saccata)纤维二糖水解酶II(WO 2010/057086)。
[0182] 作为具有生物活性的多肽的β-葡糖苷酶的实例包括,但不限于,来自棘孢曲霉(Kawaguchi等人,1996,Gene 173:287-288)、烟曲霉(WO 2005/047499)、黑曲霉(Dan等人,2000,J.Biol.Chem.275:4973-4980)、米曲霉(WO 2002/095014)、巴西青霉(Penicillium brasilianum)IBT 20888(WO 2007/019442和WO 2010/088387)、太瑞斯梭孢壳(WO 2011/
035029)和囊状长毛盘菌(WO 2007/019442)的β-葡糖苷酶。
[0183] β-葡糖苷酶还可以是融合蛋白。在一个方面,β-葡糖苷酶是米曲霉β-葡糖苷酶变体BG融合蛋白(WO 2008/057637)或米曲霉β-葡糖苷酶融合蛋白(WO 2008/057637)。
[0184] 使用根据Henrissat B.,1991,A classification of glycosyl hydrolases based on amino-acid sequence similarities,Biochem.J.280:309-316、及 Henrissat B.and Bairoch A.,1996,Updating the sequence-based classification of glycosyl hydrolases,Biochem.J.316:695-696所述的分类,其他内切葡聚糖酶、纤维二糖水解酶、和β-葡糖苷酶的实例在众多的糖基水解酶家族中公开。
[0185] 可以用于本发明的其他纤维素分解酶在WO 98/13465、WO 98/015619、WO 98/015633、WO 99/06574、WO 99/10481、WO 99/025847、WO 99/031255、WO 2002/101078、WO 
2003/027306、WO 2003/052054、WO 2003/052055、WO 2003/052056、WO 2003/052057、 WO 
2003/052118、WO 2004/016760、WO 2004/043980、WO 2004/048592、WO 2005/001065、WO 
2005/028636、WO 2005/093050、 WO 2005/093073、WO 2006/074005、WO 2006/117432、WO 
2007/071818、WO 2007/071820、WO 2008/008070、WO 2008/008793、美国专利第5,457,046号、美国专利第5,648,263号和美国专利第 5,686,593号中有过记载。
[0186] 作为具有生物活性的多肽的具有纤维素分解增强活性的GH61多肽的实例包括,但不限于,来自太瑞斯梭孢壳(WO 2005/074647、WO 2008/148131、和WO 2011/035027)、嗜热子囊菌(Thermoascus aurantiacus)(WO 2005/074656和WO 2010/065830)、里氏木霉(WO 2007/089290)、嗜热毁丝菌(WO 2009/085935、WO 2009/085859、WO 2009/085864、WO 2009/
085868)、烟曲霉(WO 2010/138754)的GH61  多肽,来自嗜松青霉(Penicillium pinopuilum)(WO 2011/005867)、嗜热子囊菌(WO 2011/039319)、青霉(WO 2011/041397)、和甲壳嗜热子囊菌(Thermoascus crustaceous)(WO 2011/041504)的GH61多肽。
[0187] 作为具有生物活性的多肽的木聚糖酶的实例包括,但不限于,来自棘孢曲霉(GeneSeqP:AAR63790;WO 94/21785)、烟曲霉(WO 2006/078256)、嗜松青霉(WO 2011/041405)、青霉(WO 2010/126772)、太瑞斯梭孢壳NRRL 8126(WO 2009/079210)、以及囊状长毛盘菌GH10 (WO 2011/057083)的木聚糖酶。
[0188] 作为具有生物活性的多肽的β-木糖苷酶的实例包括,但不限于,来自粗糙脉孢菌(SwissProt登录号Q7SOW4)、里氏木霉 (UniProtKB/TrEMBL登录号Q92458)、和埃默森篮状菌(Talaromyces emersonii)(SwissProt登录号Q8X212)的β-木糖苷酶。
[0189] 作为具有生物活性的多肽的乙酰木聚糖酯酶的实例包括,但不限于,来自棘孢曲霉(WO 2010/108918)、球毛壳菌(Chaetomium globosum)(UniProt登录号Q2GWX4)、细丽毛壳菌(Chaetomium gracile)(GeneSeqP登录号AAB82124)、特异腐质霉DSM 1800(WO 2009/073709)、红褐肉座菌(Hypocrea jecorina)(WO 2005/001036)、嗜热毁丝菌(WO 2010/
014880)、粗糙脉孢菌(UniProt登录号q7s259)、颖枯壳针孢(Phaeosphaeria nodorum)(UniProt登录号Q0UHJ1)、和太瑞斯梭孢壳NRRL 8126(WO 2009/042846)的乙酰木聚糖酯酶。
[0190] 作为具有生物活性的多肽的阿魏酸酯酶的实例包括,但不限于,来自特异腐质霉DSM 1800(WO 2009/076122)、费希新萨托菌 (Neosartorya fischeri)(UniProt登录号A1D9T4)、粗糙脉孢菌(UniProt  登录号Q9HGR3)、橘灰青霉(Penicillium aurantiogriseum)(WO 2009/127729)、和太瑞斯梭孢壳(WO 2010/053838和WO 2010/
065448) 的阿魏酸酯酶。
[0191] 作为具有生物活性的多肽的阿拉伯呋喃糖苷酶的实例包括,但不限于,来自黑曲霉(GeneSeqP登录号AAR94170)、特异腐质霉DSM 1800(WO 2006/114094和WO 2009/073383)、和大型亚灰树花菌(M. giganteus)(WO 2006/114094)的阿拉伯呋喃糖苷酶。
[0192] 作为具有生物活性的多肽的α-葡糖醛酸酶的实例包括,但不限于,来自棒曲霉(Aspergillus clavatus)(UniProt登录号alcc12)、烟曲霉 (SwissProt登录号Q4WW45)、黑曲霉(UniProt登录号Q96WX9)、土曲霉(Aspergillus terreus)(SwissProt登录号Q0CJP9)、特异腐质霉 (WO 2010/014706)、橘灰青霉(WO 2009/068565)、埃默森篮状菌 (UniProt登录号Q8X211)、和里氏木霉(UniProt登录号Q99024)的α-葡糖醛酸酶。
[0193] 登录号通过引用的方式整体并入本文。
[0194] 表达载体
[0195] 本发明还涉及包含本发明的串联构建体的表达载体。串联构建体可以插入到载体中或者串联构建体的多个组分可以结合在一起以产生重组表达载体。载体可以包含一个或多个(例如,几个)方便的限制性酶切位点以使得在这些位点插入多核苷酸。在表达载体的创建中,将编码序列置于载体中,从而将编码序列与适当的用于表达的控制序列可操作地连接。
[0196] 重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA步骤,并且能够产生多核苷酸的表达。载体的选择将通常依赖于载体与将导入载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。
[0197] 载体优选地含有一个或多个(例如,几个)可选择性标记物,其使得可以方便选择所转化的细胞。用于丝状真菌宿主细胞的可选择性标记物的实例包括,但不限于,adeA(磷酸核糖基氨基咪唑-琥珀羧胺合酶)、adeB(磷酸核糖基氨基咪唑合酶)、amdS(乙酰胺酶)、argB (鸟氨酸氨甲酰基转移酶)、bar(膦丝菌素乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5'-磷酸脱羧酶)、sC(硫酸腺苷酰转移酶)、和trpC(邻氨基苯甲酸合成酶)、以及其等价物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉amdS和pyrG 基因以及吸水链霉菌bar基因。优选用在木霉属细胞中的是adeA、 adeB、amdS、hph和pyrG基因。细菌可选择性标记物的实例是赋予抗生素抗性的标记物,例如氨苄青霉素、氯霉素、卡那霉素、新霉素、壮观霉素、或四环素抗性。
[0198] 用于连接上述元件以构建重组表达载体的方法为本领域技术人员公知(参见,例如,Sambrook等人,1989,同上)。
[0199] 丝状真菌宿主细胞
[0200] 本发明还涉及丝状真菌菌株,其包含:(a)通过靶向整合用第一串联构建体取代的内源性第一基因,该第一串联构建体包含(i)第一基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个(例如,几个)第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)第一基因的同源3’区、其同源侧翼区或其组合; (b)通过靶向整合用第二串联构建体取代的内源性第二基因,该第二串联构建体包含(i)第二基因的同源5’区、其同源侧翼区或其组合, (ii)一个或多个(例如,几个)第二可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)第二基因的同源3’区、其同源侧翼区或其组合;或(c)(a)和(b)的组合。
[0201] 本发明还涉及丝状真菌菌株,其包含:(a)通过靶向整合经插入第一串联构建体而修饰的内源性第一基因座,该第一串联构建体包含 (i)第一基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)第一基因座的同源3’区、其同源侧翼区或其组合; (b)通过靶向整合通过经插入第二串联构建体而修饰的内源性第二基因座,该第二串联构建体包含(i)第二基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第二可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)第二基因座的同源3’区、其同源侧翼区或其组合;或(c)(a)和(b)的组合。
[0202] 术语“宿主细胞”包括由于在复制过程中发生突变而与亲本细胞不同的亲本细胞的任何子代。宿主细胞的选择将在很大程度上取决于编码多肽的基因及其来源。
[0203] 宿主细胞可以是在多肽的重组生产中有用的任何丝状真菌细胞。“丝状真菌”包括真菌和卵菌门的的亚门(如由Hawksworth等人, 1995,同上,所定义)的所有丝状形式。丝状真菌通常的特征在于由壳质、纤维素、葡聚糖、壳聚糖、甘露聚糖和其他复合多糖组成的菌丝体壁。营养生长是通过菌丝伸长,分解代谢必须是需氧的。相反,酵母例如酿酒酵母(Saccharomyces cerevisiae)的营养生长是通过单细胞菌体的出芽,且碳分解可以是发酵性的。
[0204] 丝状真菌宿主细胞可以是枝顶孢属(Acremonium)、曲霉属 (Aspergillus)、短梗霉属(Aureobasidium)、黑管菌属(Bjerkandera)、拟蜡霉属(Ceriporiopsis)、金孢属(Chrysosporium)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属(Cryptococcus)、线黑粉酵母属 (Filibasidium)、镰孢菌属(Fusarium)、腐质霉属(Humicola)、巨座壳属(Magnaporthe)、毛霉属(Mucor)、毁丝菌属(Myceliophthora)、新美鞭菌属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属  (Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、白腐菌属(Phlebia)、梨囊鞭菌属(Piromyces)、侧属(Pleurotus)、裂褶菌属(Schizophyllum)、篮状菌属(Talaromyces)、嗜热子囊菌属 (Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、栓菌属(Trametes)或木霉属(Trichoderma)细胞。
[0205] 例如,丝状真菌宿主细胞可以是泡盛曲霉(Aspergillus awamori)、臭曲霉(Aspergillus foetidus)、烟曲霉、日本曲霉(Aspergillus japonicus)、构巢曲霉、黑曲霉、米曲霉、烟管菌(Bjerkandera adusta)、干拟蜡菌 (Ceriporiopsis aneirina)、Ceriporiopsis caregiea、浅黄拟蜡菌 (Ceriporiopsis gilvescens)、Ceriporiopsis pannocinta、Ceriporiopsis rivulosa、Ceriporiopsis subrufa、虫拟蜡菌(Ceriporiopsis subvermispora)、 Chrysosporium inops、嗜毛金色孢(Chrysosporium keratinophilum)、 Chrysosporium lucknowense、粪状金孢(Chrysosporium merdarium)、 Chrysosporium pannicola、Chrysosporium  queenslandicum、热带金孢菌 (Chrysosporium tropicum)、Chrysosporium zonatum、灰盖鬼伞 (Coprinus cinereus)、粗毛云芝(Coriolus hirsutus)、杆孢状镰孢 (Fusarium bactridioides)、谷类镰孢(Fusarium cerealis)、克鲁克威尔镰孢菌(Fusarium crookwellense)、黄色镰孢菌(Fusarium culmorum)、禾谷镰孢菌(Fusarium graminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖孢镰孢、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟枝孢镰孢菌(Fusarium sporotrichioides)、硫色镰孢 (Fusarium sulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢 (Fusarium trichothecioides)、镶片镰孢、特异腐质霉、柔毛腐质霉 (Humicola lanuginosa)、米赫毛霉(Mucor miehei)、嗜热毁丝霉、粗糙脉胞菌、产紫青霉(Penicillium purpurogenum)、黄孢原毛平革菌 (Phanerochaete chrysosporium)、脉射菌(Phlebia radiata)、刺芹侧耳  (Pleurotus eryngii)、太瑞斯梭孢壳、长绒毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉(Trichoderma harzianum)、康氏木霉(Trichoderma  koningii)、长梗木霉(Trichoderma longibrachiatum)、里氏木霉或绿色木霉(Trichoderma viride)细胞。
[0206] 在一个方面,丝状真菌宿主细胞是米曲霉。在另一方面,丝状真菌宿主细胞是黑曲霉。在另一方面,丝状真菌宿主细胞是镶片镰孢。在另一方面,丝状真菌宿主细胞是里氏木霉。在另一方面,丝状真菌宿主细胞是长梗木霉。
[0207] 在另一方面,丝状真菌宿主细胞是里氏木霉RutC30。在另一方面,丝状真菌宿主细胞是里氏木霉TV10。在另一方面,丝状真菌宿主细胞是里氏木霉RutC30的突变体。在另一方面,丝状真菌宿主细胞是里氏木霉TV10的突变体。在另一方面,丝状真菌宿主细胞是里氏木霉的形态突变体。参见,例如,WO 97/26330,其通过引用的方式整体并入本文。
[0208] 在另一方面,丝状真菌宿主细胞是包含一个或多个(例如,几个) 选自第一枯草杆菌蛋白酶样丝氨酸蛋白酶基因、第一天冬氨酸蛋白酶基因、胰蛋白酶样丝氨酸蛋白酶基因、第二枯草杆菌蛋白酶样丝氨酸蛋白酶基因、和第二天冬氨酸蛋白酶基因的基因的木霉属菌株,其中一个或多个(例如,几个)基因修饰成使突变体菌株当在相同条件下培养时,相对于亲本木霉属菌株,分别在一种或多种(例如,几种) 选自第一枯草杆菌蛋白酶样丝氨酸蛋白酶、第一天冬氨酸蛋白酶、胰蛋白酶样丝氨酸蛋白酶、第二枯草杆菌蛋白酶样丝氨酸蛋白酶、和第二天冬氨酸蛋白酶的酶的产生方面有缺陷,如WO 2011/075677中所述,其通过引用的方式整体并入本文。
[0209] 可以将丝状真菌细胞通过涉及原生质体形成、原生质体转化、和细胞壁再生的方法以本身已知的方式进行转化。用于转化曲霉属和木霉属宿主细胞的适当方法在EP 238023、Yelton等人,1984,Proc.Natl. Acad.Sci.USA 81:1470-1474以及Christensen等人,1988,Bio/Technology 6:1419-1422中有过记载。用于转化镰孢属的种的适当方法由Malardier 等人,1989,Gene 78:147-156和WO 1996/00787记载。
[0210] 产生的方法
[0211] 本发明还涉及在丝状真菌菌株中产生具有生物活性的多种重组多肽的方法,其包括:
[0212] (A)在有益于产生多肽的条件下培养丝状真菌宿主细胞,其中该丝状真菌宿主细胞包含:(a)通过靶向整合用第一串联构建体取代的内源性第一基因,该第一串联构建体包含(i)第一基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个(例如,几个)第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v) 第一基因的同源3’区、其同源侧翼区或其组合;(b)通过靶向整合用第二串联构建体取代的内源性第二基因,该第二串联构建体包含(i) 第二基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个(例如,几个)第二可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)第二基因的同源3’区、其同源侧翼区或其组合;或(c)(a)和(b)的组合;以及任选地
[0213] (B)回收多种重组多肽。
[0214] 本发明还涉及在丝状真菌菌株中产生具有生物活性的多种重组多肽的方法,其包括:
[0215] (A)在有益于产生多肽的条件下培养丝状真菌宿主细胞,其中该丝状真菌宿主细胞包含:(a)通过靶向整合经插入第一串联构建体而修饰的内源性第一基因座,该第一串联构建体包含(i)第一基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)第一基因座的同源3’区、其同源侧翼区或其组合;(b)通过靶向整合经插入第二串联构建体而修饰的内源性第二基因座,该第二串联构建体包含(i)第二基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第二可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)第二基因座的同源3’区、其同源侧翼区或其组合;或 (c)(a)和(b)的组合;以及任选地
[0216] (B)回收多种重组多肽。
[0217] 使用本领域已知的方法,在适于产生多肽的营养介质中培养丝状真菌宿主细胞。例如,细胞可以通过在合适的介质中并在使得多肽进行表达和/或分离的条件下进行摇瓶培养或在实验室或工业发酵罐中进行小规模或大规模发酵(包括连续发酵、分批发酵、分批补料发酵或固态发酵)来培养。使用本领域已知的步骤,培养在包含碳源和氮源以及无机盐的合适营养介质中进行。合适的介质可以从商业供应商获得或可以根据公开的组成(例如,在美国典型培养物保藏中心的目录中)来制备。如果多肽被分泌到营养介质中,则可以直接从介质中回收多肽。如果多肽未被分泌,则可以从细胞裂解物中回收。
[0218] 多肽可以使用领域内已知的特定用于多肽的方法来检测。这些检测方法包括但不限于特异性抗体的使用、酶产物的形成、或酶底物的消失。例如,酶检定可以用来判定多肽的活性。
[0219] 多肽可以使用本领域已知的方法来回收。例如,多肽可以通过常规步骤从营养介质中回收,这些常规步骤包括但不限于收集、离心、过滤、萃取、喷雾干燥蒸发或沉淀。在一个方面,回收整个发酵液。
[0220] 多肽可以通过本领域已知的多种方法进行纯化,以获得基本纯的多肽,方法包括但不限于层析法(例如,离子交换层析、亲和层析、疏水性层析、聚焦层析、和尺寸排阻层析)、电泳法(例如,制备式等电聚焦)、差别溶解度(例如,硫酸铵沉淀)、SDS-PAGE、或萃取(参见例如,Protein Purification,Janson和Ryden编,VCH Publishers,New York,1989)。
[0221] 本发明通过以下实施例进一步加以说明,这些实施例不应理解成对本发明的范围加以限定。
[0222] 实施例
[0223] 菌株
[0224] 里氏木霉菌株981-O-8(D4)是里氏木霉RutC30(ATCC 56765;Montenecourt and Eveleigh,1979,Adv.Chem.Ser.181:289-301)的诱变菌株。
[0225] 里氏木霉菌株AgJg115-104-7B1(PCT/US2010/061105、WO 2011/075677)是里氏木霉菌株981-O-8(D4)的ku70-衍生体。
[0226] 培养基和缓冲溶液
[0227] LB平板由10g胰蛋白胨、5g酵母提取物、5g NaCl、15g Bacto 琼脂和加至1升的去离子水组成。
[0228] 2XYT+氨苄青霉素平板由16g胰蛋白胨、10g酵母提取物、5g 氯化钠、15g Bacto琼脂和加至1升去离子水组成。在高压灭菌的培养基冷却至55℃之后,加入1ml 100mg/ml的氨苄青霉素溶液。
[0229] SOC培养基由20g Bacto-胰蛋白胨、5g Bacto酵母提取物、0.5g NaCl、2.5ml 1M KCl和加至1升的去离子水组成。在高压灭菌之前,用10N NaOH将pH调节至7.0。然后在临用前加入20ml的无菌1M 葡萄糖。
[0230] COVE盐溶液由26g KCl、26g MgSO4·7H2O、76g KH2PO4、50ml COVE痕量金属溶液和加至1升的去离子水组成。
[0231] COVE痕量金属溶液由0.04g NaB4O7·10H2O、0.4g CuSO4·5H2O、 1.2g FeSO4·7H2O、0.7g MnSO4·H2O、0.8g Na2MoO2·2H2O、10g ZnSO4·7H2O和加至1升的去离子水组成。
[0232] COVE平板由342.3g蔗糖、20ml COVE盐溶液、10ml 1M乙酰胺、10ml 1.5M CsCl、25g Noble琼脂(Difco)和加至1升的去离子水组成。
[0233] COVE2平板由30g蔗糖、20ml COVE盐溶液、10ml 1M乙酰胺、25g Noble琼脂(Difco)和加至1升的去离子水组成。
[0234] 木霉属痕量金属溶液由216g FeCl3·6H2O、58g ZnSO4·7H2O、27g MnSO4·H2O、10g CuSO4·5H2O、2.4g H3BO3、336g柠檬酸和加至1 升的去离子水组成。
[0235] CIM培养基由20g纤维素、10g玉米浆冻干粉、1.45g(NH4)2SO4、 2.08g KH2PO4、0.28g CaCl2、0.42g MgSO4·7H2O、0.42ml木霉属痕量金属溶液、1~2滴消泡剂和加至1升的去离子水组成;pH调节至 6.0。
[0236] YP培养基由10g酵母提取物、20g Bacto蛋白胨和加至1升的去离子水组成。
[0237] YPG培养基由4g酵母提取物、1g K2HPO4、0.5g MgSO4、15.0g 葡萄糖和加至1升的去离子水组成(pH 6.0)。
[0238] PEG缓冲液由500g聚乙二醇4000(PEG 4000)、10mM CaCl2、 10mM Tris-HCl pH 7.5和加至1升的去离子水组成;过滤除菌。
[0239] PDA平板由39g土豆右旋糖琼脂(Difco)和加至1升的去离子水组成。
[0240] PDA覆层培养基由39g土豆右旋糖琼脂(Difco)、2.44g尿苷和加至1升的去离子水组成。使用之前,将高压灭菌的培养基在微波中融化,然后冷却至55℃。
[0241] STC由1M山梨糖醇、10mM mM CaCl2和10mM Tris-HCl,pH 7.5 组成;过滤除菌。
[0242] TE缓冲液由1M Tris pH 8.0和0.5M EDTApH 8.0组成。
[0243] 变性溶液由0.5M NaOH和1.5M NaCl组成。
[0244] 中和溶液由1M Tris pH 8.0和1.5M NaCl组成。
[0245] 20X SSC由175.3g NaCl、88.2g柠檬酸钠和加至1升的去离子水组成。
[0246] TrMM-G培养基由20ml COVE盐溶液、6g(NH4)2SO4、0.6g CaCl2、25g Nobel琼脂(Difco)、20g葡萄糖和加至1升的去离子水组成。
[0247] NZY+培养基由5g NaCl、3g MgSO4·7H2O、5g酵母提取物、10g NZ胺、1.2g MgCl2、4g葡萄糖和加至1升的去离子水组成。
[0248] 实施例1:烟曲霉GH61B多肽基因的克隆
[0249] 烟曲霉部分基因组序列(The Institute for Genomic Research, Rockville,MD,USA)的tblastn搜索(Altschul等人,1997,Nucleic Acids Res.25:3389-3402)使用几种已知的GH61多肽(包括嗜热子囊菌 GH61A多肽(GeneSeqP登录号AEC05922))作为查询序列来进行。基于在氨基酸水平上与查询序列的高度类似性,数个基因被识别为推定的家族GH61同源物。选择一个约850bp的与嗜热子囊菌GH61A多肽序列在氨基酸水平具有高于70%序列同一性的基因组区域进行进一步研究。
[0250] 烟曲霉NN051616如美国专利第7,244,605号中所述生长并收获。将冷冻的菌丝体用研钵和研杵研磨成细粉末,并使用 植物大量提取试剂盒(Plant Maxi Kit)(QIAGEN Inc.,Valencia, CA,USA)根据生产商的说明来分离基因组DNA。
[0251] 设计以下示出的两个合成的寡核苷酸引物,以从基因组DNA中 PCR扩增出烟曲霉GH61B多肽编码序列。使用 克隆试剂盒(Clontech Laboratories,Inc.,Mountain View,CA,USA)将片段直接克隆入表达载体pAlLo2(WO 2004/099228),而无需进行限制性酶切消化和连接。
[0252] 正向引物:
[0253] 5'-ACTGGATTTACCATGACTTTGTCCAAGATCACTTCCA-3' (SEQ ID NO:31)
[0254] 反向引物:
[0255] 5'-TCACCTCTAGTTAATTAAGCGTTGAACAGTGCAGGACCA G-3'(SEQ ID NO:32)[0256] 粗体字母代表编码序列。剩余序列与pAlLo2的插入位点同源。
[0257] 将五十皮摩尔的各个上述引物用于PCR反应中,反应由204ng的烟曲霉基因组DNA,1×Pfx扩增缓冲液(Invitrogen,Carlsbad,CA, USA),1.5μl的dATP、dTTP、dGTP和dCTP的
10mM混合物,2.5 个单位的 Pfx DNA聚合酶(Invitrogen Corp.,Carlsbad,
CA ,  USA) ,和1μl的50mM  MgSO4构成 ,终体积为50μl。扩增使用
5333epgradient S(Eppendorf Scientific,
Inc.,Westbury,NY,USA)进行,程序为:94℃3分钟,1个循环;和每循环94℃30秒、56℃30秒、和72℃1分钟,30个循环。然后将加热维持在72℃15分钟,接着进行4℃浸泡循环。反应产物通过使用40mM Tris碱、20mM乙酸钠、1mM EDTA二钠盐(TAE) 缓冲液的1.0%琼脂糖凝胶电泳进行分离,其中将约850bp的产物条带从凝胶中切出,并使用 凝胶提取
试剂盒(QIAGEN Inc., Valencia,CA,USA)根据生产商的说明进行纯化。
[0258] 然后使用 克隆试剂盒将850bp片段克隆入pAlLo2。将质粒pAlLo2用Nco I和Pac I消化。将质粒片段通过如上的凝胶电泳和 凝胶纯化试剂盒
(QIAGEN Inc.,Valencia,CA,USA) 进行纯化。将基因片段和消化的载体在后述的反应中合并在一起,得到表达质粒pAG43(图1),其中烟曲霉GH61B多肽编码序列的转录处于NA2-tpi启动子的调控之下。NA2-tpi启动子是来自黑曲霉中性α- 淀粉酶基因的修饰启动子,其中非翻译的前导序列被来自构巢曲霉磷酸丙糖异构酶基因的非翻译前导序列替代。重组反应(20μl)由 1× 反应缓冲液(Clontech Laboratories,Inc.,Mountain 
View, CA,USA)、1×BSA(Clontech Laboratories,Inc.,Mountain View,CA, USA)、1μl的酶(稀释1:10)(Clontech Laboratories,Inc., Mountain View,CA,USA)、
166ng的用Nco I和Pac I消化的pAlLo2、和110ng的烟曲霉GH61B多肽的纯化PCR产物构成。
将反应在37℃下孵育15分钟,接着在50℃孵育15分钟。将反应物用40μl的10mM Tris-0.1M EDTA缓冲液稀释,并根据生产商的说明将2.5μl的稀释反应物用来转化大肠杆菌(E.coli)XL10 Gold感受态细胞(Stratagene,La Jolla,CA,USA)。含有pAG43(GH61B
多肽编码序列)的大肠杆菌转化体通过限制性酶切消化进行鉴定,并使用
9600(QIAGEN Inc.,Valencia,CA,USA)制备质粒DNA。
[0259] 862bp PCR片段的DNA测序用Applied Biosystems Model 377XL 自动DNA测序仪(Applied Biosystems,Carlsbad,CA,USA)使用染料- 终止子化学法(Giesecke等人,1992,Journal of Virology Methods 38:47-60)和引物步移策略进行。使用下述的载体特异性引物进行测序:
[0260] pAllo2 5Seq:
[0261] 5'-TGTCCCTTGTCGATGCG 3'(SEQ ID NO:33)
[0262] pAllo23Seq:
[0263] 5'-CACATGACTTGGCTTCC 3'(SEQ ID NO:34)
[0264] 仔细检查核苷酸序列数据的质量,并将所有序列经  PHRED/PHRAP软件(University of Washington,Seattle,WA,USA)的协助而进行彼此比较。
[0265] 基于所编码的蛋白与嗜热子囊菌GH61A蛋白(GeneSeqP登录号 AEC05922)的相似性来构建用于烟曲霉序列的基因模型。烟曲霉 GH61B多肽编码序列的核苷酸序列和推导的氨基酸序列分别示于SEQ ID NO:35和SEQ ID NO:36。基因组片段编码250个氨基酸的多肽,被2个53和56bp的内含子打断。编码序列和成熟编码序列的G+C含量百分比分别为53.9%和57%。使用SignalP软件程序(Nielsen等人, 1997,Protein Engineering 10:1-6),预测21个残基的信号肽。预测的成熟蛋白含有221个氨基酸,其具有23.39kDa的预测分子量。
[0266] 实施例2:用于表达烟曲霉GH61B多肽的pSMai214的构建
[0267] 使用如下所示的基因特异性的正向和反向引物从质粒pAG43(实施例1)中扩增烟曲霉GH61B多肽编码序列。斜体的区域表示与 反应的插入位点的载体同源性。
[0268] 正向引物:
[0269] 5'-GGACTGCGCACCATGACTTTGTCCAAGATCACTTCCA-3' (SEQ ID NO:37)
[0270] 反向引物:
[0271] 5'-GCCACGGAGCTTAATTAATTAAGCGTTGAACAGTGCAG-3' (SEQ ID NO:38)
[0272] 将五十皮摩尔的各上述引物用于PCR反应中,该反应由10ng的 pAG43DNA,1×Pfx扩增缓冲液,1.5μl的dATP、dTTP、dGTP和dCTP 的10mM混合物,2.5个单位的Pfx DNA聚合酶,和1μl 的50mM MgSO4构成,最终体积为50μl。扩增使用5333epgradient S进行,其程序为:98℃3分钟,1 个循环;和每循
环98℃30秒、56℃30秒、和72℃1分钟,30个循环。然后将加热块维持在72℃15分钟。PCR产物通过使用TAE缓冲液的1%琼脂糖凝胶电泳进行分离,其中将约0.9kb的片段从凝胶切出,并使用 凝胶提取试剂盒根据生产商的操作指南进行提取。
[0273] 将质粒pMJ09(WO 2005/047499)用Nco I和Pac I消化,通过在 1mM EDTA二钠盐-50mM Tris碱-50mM酸(TBE)缓冲液中的1.0%琼脂糖凝胶电泳来分离,从凝胶中切出,并根据生产商的说明使用 凝胶提取试剂盒(QIAGEN Inc.,Valencia,CA,USA)
提取。
[0274] 根据生产商的操作指南,使用 PCR克隆试剂盒将0.9 kb的PCR产物插入到凝胶纯化的经Nco  I/Pac  I消化的pMJ09中。 反应由1X
反应缓冲液、100ng的凝胶纯化的经Nco I/Pac I消化的pMJ09、37ng的
0.9kb PCR产物、2μl的500 μg/ml BSA、和1μl的 酶构成,反应体积为20μl。
将反应在37℃孵育15分钟并在50℃孵育15分钟。在孵育期后,将30μl 的TE缓冲液加入反应中。根据制造商的操作指南,将2.5μl等份用于转化 Gold超级感受态细胞
(Agilent Technologies,Inc., Cedar Creek,TX,USA)。通过测序来筛选转化体,鉴定出含有无PCR 错误的插入的一个克隆并将其定名为pSMai214(图2)。可以用Pme I 消化质粒pSMai214,以产生用于里氏木霉转化的约5.4kb的片段。该 5.4kb的片段包含由里氏木霉Cel7A纤维二糖水解酶I基因启动子、烟曲霉GH61B多肽编码序列、里氏木霉Cel7A纤维二糖水解酶I基因终止子、和构巢曲霉乙酰胺酶(amdS)基因组成的表达盒。
[0275] 实施例3:用于表达烟曲霉CEL3Aβ-葡糖苷酶和烟曲霉GH61B多肽两者的串联构建体pDM287的构建
[0276] 使用如下所示的基因特异性的正向和反向引物从质粒pSMai214 中扩增烟曲霉GH61B多肽表达盒。斜体的区域表示与 反应的插入位点的载体同源性。
[0277] 正向引物:
[0278] 5'-CGCGGTAGTGGCGCGGTCGACCGAATGTAGGATTGTT-3' (SEQ ID NO:39)
[0279] 反向引物:
[0280] 5'-TTACCAATTGGCGCGCCACTACCGCGTTCGAGAAGA-3'(SEQ ID NO:40)
[0281] 将五十皮摩尔的各上述引物用于PCR反应中,该反应由25ng的 pSMai214DNA,1X PHUSIONTM高保真热启动DNA聚合酶缓冲液 (Finnzymes Oy,Espoo,Finland),1μl的dATP、dTTP、dGTP和dCTP 的10mM混合物,以及1个单位的PHUSIONTM高保真热启动DNA聚合酶(Finnzymes  Oy,Espoo ,Finland)构成,最终体积为50μl。扩增使用5333epgradient S进行,其程序为:98℃30秒,1
个循环;每循环98℃10秒、60℃30秒、和72℃1 分30秒,35个循环;和72℃10分钟,1个循环。
PCR产物通过使用 TAE缓冲液的0.8%琼脂糖凝胶电泳进行分离,其中将约2.3kb的片段从凝胶中切出,并使用 提取II试剂盒(Macherey-Nagel, Inc.,
Bethlehem,PA,USA)根据生产商的操作指南进行提取。
[0282] 将约2.3kb的PCR产物使用 Advantage PCR克隆试剂盒(Clontech Laboratories,Inc.,Mountain View,CA,USA)根据生产商的操作指南而插入至经Asc I消化的pEJG107(WO 2005/047499)。质粒pEJG107包含烟曲霉CEL3Aβ-葡糖苷酶编码序列(SEQ ID NO: 53[DNA序列]和SEQ ID NO:54[推导的氨基酸序列])。该 反应由1X
反应缓冲液、125ng的经Asc I消化的 pEJG107、90ng的2.33kb的PCR产物、
和1μl 酶组成,反应体积为10μl。将反应在37℃孵育15分钟,接着在50℃孵育15 分钟。在孵育期后,将40μl的TE加入反应中。根据制造商的操作指南,将2μl等份用于转化ONE TOP10感受态细胞(Invitrogen, Carlsbad,CA,USA)。将大肠杆菌转化反应物铺在2XYT+氨苄青霉素平板上。通过测序来筛选转化体,鉴定出含有无PCR错误的插入的一个克隆并将其命名为pDM287(图3)。可以用Pme I消化质粒pDM287,产生用于里氏木霉转化的约9.9kb的片段。该9.9kb的片段包含由(1) 里氏木霉Cel7A纤维二糖水解酶I基因启动子、烟曲霉CEL3A β-葡糖苷酶编码序列、和里氏木霉Cel7A纤维二糖水解酶I基因终止子;
以及(2)里氏木霉Cel7A纤维二糖水解酶I基因启动子、烟曲霉GH61B 多肽编码序列、和里氏木霉Cel7A纤维二糖水解酶I基因终止子组成的两个表达盒。该9.9kb的片段也包含构巢曲霉乙酰胺酶(amdS)基因。
[0283] 实施例4:里氏木霉原生质体的产生和转化
[0284] 原生质体的制备和转化使用Penttila等人,1987,Gene 61:155-164 的修改操作指南来进行。简要地,在27℃下于25ml的补充有2%(w/v) 葡萄糖和10mM尿苷的YP培养基中在90rpm的轻柔振荡下培养里氏木霉菌株981-O-8(D4)17小时。菌丝体使用真空驱动的一次性过滤系统(Millipore,Bedford,MA,USA)通过过滤来收集,并用去离子水洗涤两次和用1.2M山梨糖醇洗涤两次。通过在34℃下于20ml的1.2 M山梨糖醇中以90rpm的轻柔振荡来悬浮所洗涤的菌丝体15~25分钟,从而产生原生质体,该20ml的1.2M山梨糖醇含有每ml 15mg 的 200G(Novozymes A/S,Bagsvaerd,Denmark)和每 ml 0.36个单位的几
丁质酶(Sigma Chemical Co.,St.Louis,MO,USA)。原生质体通过在400×g下离心7分钟而收集,用冷的1.2M山梨糖醇洗涤两次。将原生质体用血球计数器来计数,并在STC中再悬浮
8
至 1×10原生质体/ml的最终浓度。将过量的原生质体储存在-80℃的Cryo 1℃冷冻容器(Nalgene,Rochester,NY,USA)中。
[0285] 用Pme I消化约100μg的转化质粒(pSMai214、pDM287或 pEJG107)。消化反应物通过使用TAE缓冲液的0.8%琼脂糖凝胶电泳进行纯化。将含有pSMai214、pDM287或pEJG107的表达盒以及构巢曲霉乙酰胺酶(amdS)基因的DNA条带从凝胶中切出,并根据制造商建议的操作指南使用 提取II试剂盒进行提取。
[0286] 将所得的纯化的DNA[1μg的9.9kb的经Pme I消化的pDM287 (串联转化)或1μg的7.6kb的经Pme I消化的pEJG107加1μg的 5.4kb的经Pme I消化的pSMai214(共转化)]加至
100μl的原生质体溶液中并轻柔地混合。加入PEG缓冲液(250μl),将反应物混合并在 34℃下孵育30分钟。然后加入STC(3ml),并将反应物混合,然后涂布在用于amdS选择的COVE平板上。将平板在28℃下孵育6~11天。
[0287] 实施例5:对表达烟曲霉CEL3Aβ-葡糖苷酶和烟曲霉GH61B多肽的里氏木霉转化体的评价
[0288] 使用接种环将里氏木霉转化体(实施例4)从COVE转化平板转移至补充了10mM尿苷的COVE2平板,并在28℃下孵育5~7天。用接种环收集孢子,并将其转移至125ml塑料摇瓶中的25ml CIM培养基中。将摇瓶培养物在28℃、200rpm下孵育5天。将各个培养物的1 ml等份在微量离心机中以13,400×g离心,并回收培养物上清液。根据制造商的说明通过使用8~16%Tris-HCl凝胶(Bio-Rad Laboratories,Hercules,CA,USA)的
SDS-PAGE对5μl的各个培养物上清液进行分析。将所得凝胶用BIO-SAFETM考斯(Bio-Rad Laboratories, Hercules,CA,USA)染色。45个pDM287转化体(串联构建体)和45 个pEJG107+pSMai214转化体(共转化)的SDS-PAGE图谱示出,转化体产生对应于烟曲霉CEL3Aβ-葡糖苷酶的约130kDa以及对应于烟曲霉GH61B多肽的约24kDa的主要蛋白条带。由未转化的里氏木霉菌株981-O-8(D4)培养物上清液构成的阴性对照样本,未示出约130 kDa和约24kDa的显著条带。
[0289] 以下所示的结果表明,串联构建体pDM287的转化比pEJG107和 pSMai214的共转化得到更多的生产烟曲霉β-葡糖苷酶和烟曲霉 GH61B多肽的阳性转化体。
[0290]
[0291] 实施例6:表达烟曲霉CEL3Aβ-葡糖苷酶和烟曲霉GH61B多肽的里氏木霉转化体的β-葡糖苷酶检定
[0292] 使用 3000、 NX、和 机械臂 (Beckman Coulter,Inc,Fullerton,CA,USA)对实施例5的培养物上清液检定β-葡糖苷酶活性。培养物上清液在
0.1M琥珀酸盐、0.01% X-100(4-(1,1,3,3-四甲基丁基)苯基-聚乙二醇)缓冲液pH 5.0 (样本缓冲液)中适当稀释,接着进行稀释样本的0倍到1/3倍再到 1/9倍的一系列稀释。将共20μl的各个稀释液转移至96孔平底板。将两百微升的对硝基苯基-β-D-吡喃葡糖苷底物溶液(每ml的0.1M琥珀酸盐pH 5.0中,1mg的对硝基苯基-β-D-吡喃葡糖苷)加至各个孔中,然后在环境温度下孵育45分钟。孵育期结束后,将50μl的淬灭缓冲液(1M Tris缓冲液pH 9)加至各个孔中。在405nm的光密度测量96 孔板的端点。
[0293] 在图4中示出的结果证实了实施例5的SDS-PAGE结果,即用串联构建体pDM287转化比用pEJG107和pSMai214共转化得到更多的生产烟曲霉β-葡糖苷酶和烟曲霉GH61B多肽的阳性转化体。
[0294] 实施例7:构建表达青霉GH61A多肽的pDM286
[0295] 使用以下所示的基因特异性正向和反向引物由质粒pGH61D23Y4  (WO 2011/041397)扩增青霉(Penicillium emersonii)GH61A多肽编码序列(SEQ ID NO:43[DNA序列]和SEQ ID NO:44[推导的氨基酸序列])。斜体区表示与 反应的插入位点的
载体同源性。
[0296] 正向引物:
[0297] 5’-CGGACTGCGCACCATGCTGTCTTCGACGACTCGCAC-3' (SEQ ID NO:45)
[0298] 反向引物:
[0299] 5’-TCGCCACGGAGCTTATCGACTTCTTCTAGAACGTC-3'(SEQ ID NO:46)
[0300] 扩增反应物由30ng pGH61D23Y4DNA,50皮摩尔的各上述引物, 1μl的dATP、dTTP、dGTP和dCTP的10mM混合物,1X PHUSIONTM高保真热启动DNA聚合酶缓冲液和1个单位的PHUSIONTM高保真热启动DNA聚合酶组成,最终体积为50μl。在5333epgradient S中孵育扩增反应物,程序为: 98℃30秒,1个循
环;每循环98℃10秒、60℃30秒和72℃30秒,35 个循环;以及72℃10分钟,1个循环。通过使用TAE缓冲液的1%琼脂糖凝胶电泳分离PCR产物,其中将约0.9kb片段从凝胶中切出,并使用 凝胶提取试剂盒根据制造商的操作指南提取。
[0301] 将质粒pMJ09(WO 2005/047499)用Nco I和Pac I消化,使用 TBE缓冲液通过1.0%琼脂糖凝胶电泳分离,从凝胶中切出,并使用 凝胶提取试剂盒根据制造商的说明进行提取。
[0302] 使用 Advantage PCR克隆试剂盒根据制造商的操作指南将0.9kb PCR产物插入到凝胶纯化的Nco I/Pac I消化的pMJ09中。 IN-FUSIONTM反应由1X IN-FUSIONTM反应缓冲液、180ng凝胶纯化的 Nco I/Pac I消化的pMJ09、108ng 0.9kb PCR产物和1μl IN-FUSIONTM酶组成,反应体积为10μl。将反应物在37℃下孵育15分钟,然后在 50℃下孵育15分钟。孵育期之后,将40μl TE加入到反应中。根据制造商的操作指南使用2μl等份来转化ONE TOP10感受态细胞。将大肠杆菌转化反应物铺在2XYT+氨苄青霉素平板上。通过测序来筛选转化体,识别出含有没有PCR错误的插入的一个克隆,并命名为pDM286(图5)。质粒pDM286可以用Pme I消化,产生约5.4kb 片段以用于里氏木霉转化。5.4kb片段含有由里氏木霉Cel7A纤维二糖水解酶I基因启动子、P.emersonii GH61A多肽编码序列和里氏木霉 Cel7A纤维二糖水解酶I基因终止子组成的表达盒。5.4kb片段还含有构巢曲霉乙酰胺酶(amdS)基因。
[0303] 实施例8:用于表达Penicillium emersonii GH61A多肽和烟曲霉CEL3Aβ-葡糖苷酶两者的串联构建体pDM290的构建
[0304] 使用以下示出的基因特异性正向和反向引物从质粒pEJG107扩增烟曲霉CEL3A β-葡糖苷酶表达盒。斜体区表示与 反应的插入位点的载体同源性。
[0305] 正向引物:
[0306] 5'-CGCGGTAGTGGCGCGGTCGACCGAATGTAGGATTGTT-3' (SEQ ID NO:47)
[0307] 反向引物:
[0308] 5'-TTACCAATTGGCGCGCCACTACCGCGTTCGAGAAGA-3'(SEQ ID NO:48)
[0309] 在最终体积50μl的PCR反应中使用50皮摩尔的以上各引物,该 PCR反应由25ng pEJG107DNA,1X PHUSIONTM高保真热启动DNA 聚合酶缓冲液,1μl的dATP、dTTP、dGTP和dCTPTM的10mM混合物和1个单位的PHUSION 高保真热启动DNA聚合酶组成。在
5333epgradient S中进行扩增,程序设定如下:
98℃30秒,1个循环;每循环98℃10秒、60℃30秒和 72℃2分钟30秒,35个循环;以及72℃10分钟,1个循环。
[0310] 使用TAE缓冲液通过0.8%琼脂糖凝胶电泳来分离PCR产物,其中将约4.5kb片段从凝胶中切出,并使用 Extract II试剂盒根据制造商的操作指南进行提取。
[0311] 使用IN-FUSIONTMAdvantage PCR克隆试剂盒根据制造商的操作指南将4.5kb PCR产物插入到Asc I消化的pDM286中。IN-FUSIONTM反应由1X IN-FUSIONTM反应缓冲液、125ng Asc I消化的pDM286、100 ng 4.5kb PCR产物和1μl的IN-FUSIONTM酶组成,反应体积为10μl。将反应物在37℃下孵育15分钟,然后在50℃下孵育15分钟。孵育期之后,将40μl TE加入到反应中。使用2μl等份根据制造商的操作指南转化ONE TOP10感受态细胞。将大肠杆菌转化反应物铺在 2XYT+氨苄青霉素平板上。通过测序来筛选转化体,识别出包含没有 PCR错误的插入的一个克隆,并命名为pDM290(图6)。质粒pDM290 可以用Pme I消化,产生约
9.9kb片段,以用于里氏木霉转化。9.9kb 片段包含两种表达盒:(1)里氏木霉Cel7A纤维二糖水解酶I基因启动子、P.emersonii GH61A多肽编码序列和里氏木霉Cel7A纤维二糖水解酶I基因终止子;和(2)里氏木霉Cel7A纤维二糖水解酶I基因启动子、烟曲霉CEL3Aβ-葡糖苷酶编码序列和里氏木霉Cel7A纤维二糖水解酶I基因终止子。9.9kb片段还含有构巢曲霉乙酰胺酶(amdS) 基因。
[0312] 实施例9:空的里氏木霉cbhII取代构建体pJfyS142的构建
[0313] 为产生构建体,以将里氏木霉cbhII基因(SEQ ID NO:3[DNA序列]和SEQ ID NO:4[推导的氨基酸序列])用烟曲霉cbhII编码序列 (SEQ ID NO:49[DNA序列]和SEQ ID NO:50[推导的氨基酸序列]) 取代,首先使用以下示出的基因特异性正向和反向引物从里氏木霉 RutC30基因组DNA扩增出里氏木霉cbhII启动子。斜体区表示与 反应的插入位点的载体同源性。
[0314] 正向引物:
[0315] 5’-acgaattgtttaaacgtcgacCCAAGTATCCAGAGGTGTATGGAAATA TCAGAT-3’(SEQ ID NO:51)
[0316] 反向引物:
[0317] 5’-cgcgtagatctgcggccatGGTGCAATACACAGAGGGTGATCTT-3’ (SEQ ID NO:52)[0318] 将里氏木霉RutC30在28℃下在250ml带挡板的摇瓶中在200rpm 振荡下在50ml补充有2%葡萄糖(w/v)的YP培养基中生长2天。使用 (Calbiochem,La Jolla,CA,USA)通过过滤收获菌丝体,并将其用去离子水洗涤两次,并在液氮下冷冻。通过研钵及研杵将冷冻的菌丝体研磨成细粉,并使用 Plant Maxi试剂盒分离基因组DNA,其中裂解孵育延长至2小时。
[0319] 扩增反应由20ng里氏木霉RutC30基因组DNA、200μM dNTP、 0.4μM引物、1X反应缓冲液(Stratagene,La Jolla,CA, USA)和1.875个单位的热启动高保真DNA聚合酶 (Stratagene,La Jolla,CA,USA)组成,最终体
积为50μl。在 5333epgradient S中孵育扩增反应
物,程序设定为:95℃2分钟,1个循环;每循环95℃30秒、55℃30 秒和72℃1分30秒,25个循环;以及72℃7分钟,1个循环。使用TAE 缓冲液通过1%琼脂糖凝胶电泳来分离PCR产物,其中将1.6kb片段从凝胶中切出,并使用 凝胶提取试剂盒进行提取。
[0320] 使用 Advantage PCR克隆试剂盒根据制造商的操作指南将1.6kb PCR产物插入到Nco I/Sal I消化的pSMai155(WO 05/074647)中。 反应物由
1X 反应缓冲液、 125ng Nco I/Sal I消化的pSMai155、100ng 1.6kb PCR产
物和1μl  酶组成,反应体积为10μl。将反应物在37℃下孵育15 分钟,然后在50℃下孵育15分钟。孵育期之后,将40μl TE加入到反应中。根据制造商的操作指南,使用
2μl等份来转化ONE  TOP10感受态细胞。将大肠杆菌转化反应物铺在2XYT+氨苄青霉素平板上。通过使用Pci I的限制性酶切分析来筛选所得的转化体,对阳性克隆进行测序,以确保不存在PCR错误。识别出包含没有PCR错误的插入的一个克隆,并命名为pJfyS142-A。质粒pJfyS142-A用于里氏木霉cbhII终止子的插入。
[0321] 使用以下示出的基因特异性正向和反向引物从里氏木霉RutC30基因组DNA扩增cbhII终止子。斜体区表示与 反应的插入位点的载体同源性。
[0322] 正向引物:
[0323] 5’-atctacgcgtactagttaattaaGGCTTTCGTGACCGGGCTTCAAACA- 3’(SEQ ID NO:53)[0324] 反向引物:
[0325] 5’-gcggccgttactagtggatccACTCGGAGTTGTTATACGCTACTCG-3’ (SEQ ID NO:54)[0326] 扩增反应由150ng里氏木霉RutC30基因组DNA、200μM dNTP、 0.4μM引物、1X 反应缓冲液和1.875个单位的 热启动高保真DNA聚合酶组成,最终体积为50μl。在 5333epgradient S中
孵育扩增反应物,程序设定为:95℃2分钟,1个循环;每循环95℃30秒、54℃30 秒和72℃50秒,25个循环;以及72℃7分钟,1个循环。使用TAE 缓冲液通过1%琼脂糖凝胶电泳来分离PCR产物,其中将0.3kb片段从凝胶中切出,并使用 凝胶提取试剂盒进行提
取。
[0327] 使用 Advantage PCR克隆试剂盒根据制造商的操作指南将0.3kb PCR产物插入到Pac  I/Bam  HI消化的pJfyS142-A中。 反应由1X 
反应缓冲液、150ng PacI/Bam HI 消化的pJfyS142-A、50ng 0.3kb PCR产
物和1μl  酶组成,反应体积为10μl。将反应物在37℃下孵育15分钟,然后在
50℃下孵育15分钟。孵育期之后,将40μl TE加入到反应中。根据制造商的操作指南,使用2μl等份来转化ONE  TOP10感受态细胞。将细胞在42℃下热击30秒,加入250μl SOC培养基。将试管在37℃、200 rpm下孵育1小时,并将250μl铺在直径150mm的2XYT+氨苄青霉素平板上,在37℃下孵育过夜。通过序列分析来筛选转化体,以识别阳性克隆,并确保不存在PCR错误。识别出包含没有PCR错误的插入的一个克隆,并命名为pJfyS142-B。质粒pJfyS142-B用于单纯疱疹 (Herpes simplex)tk基因的插入。
[0328] 通过将质粒用Bgl II和Bam HI消化,将单纯疱疹tk基因从 pJfyS1579-8-6(WO 2010/039840)中释放。使用TAE缓冲液对消化物进行1%琼脂糖凝胶电泳,其中将2.3kb条带从凝胶中切出,并使用 凝胶提取试剂盒进行提取。使用QUICK LIGATIONTM试剂盒根据制造商的操作指南将tk盒插入到Bam HI消化的小肠磷酸酶 -去磷酸化的pJfyS142-B中。连接反应物由50ng Bam HI消化的牛小肠磷酸酶-去磷酸化的pJfyS142-B、
50ng 2.3kb tk基因插入物、1X QUICK LIGATIONTM缓冲液和5个单位的QUICK LIGASETM组成,连接体积为 20μl。将反应物在室温下孵育5分钟,并根据制造商的操作指南使用2 μl反应物来转化ONE  TOP10感受态细胞。将细胞在42℃下热击30秒,加入250μl SOC培养基。将试管在37℃、200rpm下孵育1 小时,并将250μl铺在直径150mm的2XYT+氨苄青霉素平板上,在 37℃下孵育过夜。通过使用Xma I和Bam HI的限制性酶切分析来筛选筛选所得的转化体,以确定插入物的存在和方向,并识别出含有该插入物的克隆,将其命名为pJfyS142-C。质粒pJfyS142-C用于里氏木霉 3’cbhII基因侧翼序列的插入。
[0329] 使用以下示出的正向和反向引物从里氏木霉RutC30基因组DNA 扩增3’cbhII基因侧翼序列。斜体区表示与 反应的插入位点的载体同源性。
[0330] 正向引物:
[0331] 5’-atccatcacactggcggccgcGCTTCAAACAATGATGTGCGATGGT-3’ (SEQ ID NO:55)[0332] 反向引物:
[0333] 5’-gatgcatgctcgagcggccgcCTACCTTGGCAGCCCTACGAGAGAG- 3’(SEQ ID NO:56)[0334] 扩增反应由150ng里氏木霉RutC30基因组DNA、200μM dNTP、 0.4μM引物、1X 反应缓冲液和1.875个单位的 热启动高保真DNA聚合酶组成,最终体积为50μl。在 5333epgradient S
中孵育扩增反应物,程序设定为:95℃2分钟,1个循环;每循环95℃30秒、56℃30 秒和72℃下1分50秒,30个循环;以及72℃7分钟,1个循环。使用 TAE缓冲液,PCR反应物进行1%琼脂糖凝胶电泳,其中将1.5kb条带从凝胶中切出,并使用 凝胶提取试剂盒进行
提取。使用 Advantage PCR克隆试剂盒根据制造商的操作指南将3’ cbhII
基因侧翼序列插入到Not  I线性化的pJfyS142-C中。 反应由1X 
反应缓冲液、150ng Not I线性化的 pJfyS142-C、80ng 1.5kb PCR产物和1
μl IN-FUSIONTM酶组成,反应体积为10μl。将反应物在37℃下孵育15分钟,然后在50℃下孵育15 分钟。孵育期之后,将40μl TE加入到反应中。根据制造商的操作指南,使用2μl等份来转化ONE  TOP10感受态细胞。将细胞在 42℃下热击30秒,并加入250μl SOC培养基。将试管在37℃、200rpm 下孵育1小时,并将250μl铺在直径150mm的2XYT+氨苄青霉素平板上,在37℃下孵育过夜。通过使用Bgl II的限制性酶切分析来筛选所得的转化体,并对阳性克隆进行测序,以确保不存在PCR错误。识别出包含没有PCR错误的插入的一个克隆,并命名为pJfyS142(图7)。质粒pJfyS142用于烟曲霉cbhII编码序列的插入。
[0335] 实施例10:里氏木霉cbhII-烟曲霉cbhII取代构建体pJfyS144的构建
[0336] 使用以下示出的正向和反向引物从pAlLo33(WO 2011/057140) 扩增烟曲霉cbhII编码序列。斜体区表示与 反应的插入位点的载体同源性。
[0337] 正向引物:
[0338] 5’-ctctgtgtattgcaccATGAAGCACCTTGCATCTTCCATCG-3’(SEQ ID NO:57)[0339] 反向引物:
[0340] 5’-ccggtcacgaaagccTTAATTAAAAGGACGGGTTAGCGTT-3’(SEQ ID NO:58)[0341] 扩增反应由20ng pAlLo33、200μm dNTP、0.4μM引物、1mM  反应缓冲液和1.875个单位的 热启动高保真DNA聚合酶组成,最终体积为50μ
l。在 5333epgradient S中孵育扩增反应物,程序
设定为:95℃2分钟,1个循环;每循环95℃30秒、55℃30秒和72℃2分钟,30个循环;以及72℃
7分钟,1个循环。
[0342] 使用TAE缓冲液,PCR反应物进行1%琼脂糖凝胶电泳,其中将 1.7kb条带从凝胶中切出,并使用 凝胶提取试剂盒提取。使用 Advantage PCR克隆试剂盒根据制造商的操作指南将1.7kb PCR产物插入到Nco I/Pac I消化的pJfyS142(实施例9)中。 反应由1X  反应缓冲液、120ng Nco I/Pac I 消
化的pJfyS142、70ng 1.7kb PCR产物和1μl  酶组成,反应体积为10μl。将反应物在37℃下孵育15分钟,然后在50℃下孵育15分钟。孵育期之后,将40μl TE加入到反应中。根据制造商的操作指南,使用2μl等份来转化ONE  TOP10感受态细胞。将细胞在
42℃下热击30秒,并加入250μl SOC培养基。将试管在37℃、 200rpm下孵育1小时,并将250μl铺在直径150mm的2XYT+氨苄青霉素平板上,在37℃下孵育过夜。将所得的转化体进行测序,以确保不存在PCR错误,并确定插入物的存在。识别出序列没有错误的一个克隆,并命名为pJfyS144(图8)。
[0343] 实施例11:里氏木霉cbhI-烟曲霉cbhI取代构建体pJfyS139的构建
[0344] 使用以下的基因特异性正向和反向引物从pEJG93(WO 2011/057140)扩增烟曲霉纤维二糖水解酶I(cbhI)编码序列(SEQ ID NO:59[DNA序列]和SEQ ID NO:60[推导的氨基酸序列])。斜体区表示与 反应的插入位点的载体同源性,划线部分是导入的 Pac I位点。
[0345] 正向引物:
[0346] 5’-cgcggactgcgcaccATGCTGGCCTCCACCTTCTCCTACC-3’(SEQ ID NO:61)[0347] 反向引物:
[0348] 5’-ctttcgccacggagcttaattaaCTACAGGCACTGAGAGTAATAATCA-3’ (SEQ ID NO:62)[0349] 扩增反应由20ng pEJG93、200μM dNTP、0.4μM引物、1X  反应缓冲液和1.875个单位的 热启动高保真DNA聚合酶组成,最终体积为50μl。
在 5333epgradient S中孵育扩增反应物,程序设
定为:95℃2分钟,1个循环;每循环95℃30秒、55℃30秒和72℃1分钟,30个循环;以及72℃7分钟,1个循环。使用TAE缓冲液通过1%琼脂糖凝胶电泳来分离PCR产物,其中将1.6kb片段从凝胶中切出,并使用 凝胶提取试剂盒根据制造商的操作指南进行提取。
[0350] 使用 Advantage PCR克隆试剂盒根据制造商的操作指南将1.6kb PCR产物插入到Nco I/Pac I消化的pSMai155(WO 05/074647)中。 反应由1X 
反应缓冲液、125 ng Nco I/Pac I消化的pSMai155、100ng 1.6kb PCR产物
和1μl IN-FUSIONTM酶组成,反应体积为10μl。将反应物在37℃下孵育15 分钟,然后在50℃下孵育15分钟。孵育期之后,将40μl TE缓冲液加入到反应中。根据制造商的操作指南使用2μl等份来转化ONE   TOP10感受态细胞。将大肠杆菌转化反应物铺在2XYT+氨苄青霉素平板上。通过测序筛选所得的转化体,并识别出包含没有PCR错误的插入的一个克隆,将其命名为pJfyS139-A。质粒pJfyS139-A用于单纯疱疹病毒胸苷激酶(tk)基因的插入。
[0351] 通过将质粒用Bgl II和Bam HI消化,将单纯疱疹病毒tk编码序列 (SEQ ID NO:63[DNA序列]和SEQ ID NO:64[推导的氨基酸序列]) 从pJfyS1579-8-6(WO 2010/039840)中释放。使用TAE缓冲液,消化物进行1%琼脂糖凝胶电泳,其中将2.3kb条带从凝胶中切出,并TM使用 凝胶提取试剂盒进行提取。使用QUICK LIGATION 试剂盒根据制造商
的操作指南将tk基因盒插入到Bam HI消化的牛小肠磷酸酶处理的pJfyS139-A中。连接反应物由50ng Bam HI消化的牛小肠磷酸酶处理的pJfyS139-A、50ng 2.3kb tk基因插入物、1X QUICK LIGATIONTM缓冲液和5个单位的QUICK LIGASETM组成,最终体积为 20μl。将反应物在室温下孵育5分钟,并根据制造商的操作指南使用2 μl反应物来转化ONE  TOP10感受态细胞。将细胞在42℃下热击30秒,加入250μl的SOC培养基。将试管在37℃、200rpm下孵育1小时,并将250μl铺在直径150mm的2XYT+氨苄青霉素平板上,在37℃下孵育过夜。通过使用Xma I的限制性酶切分析来筛选所得的转化体,以确定插入物的存在和方向,并识别出含有插入物的克隆,将其命名为pJfyS139-B。质粒pJfyS139-B用于里氏木霉3’cbhI基因侧翼序列的插入。
[0352] 使用以下示出的正向和反向引物从里氏木霉RutC30基因组DNA (实施例9)扩增3’cbhI基因侧翼序列。划线部分表示引入的用于克隆的Not I位点。
[0353] 正向引物:
[0354] 5’-ttagactgcggccgcGTGGCGAAAGCCTGACGCACCGGTAGAT-3’ (SEQ ID NO:65)[0355] 反向引物:
[0356] 5’-agtagttagcggccgcACGGCACGGTTAAGCAGGGTCTTGC-3’ (SEQ ID NO:66)[0357] 扩增反应由150ng里氏木霉RutC30基因组DNA、200μM dNTP、 0.4μM引物、1X 反应缓冲液和1.875个单位的 热启动高保真DNA聚合酶组成,最终体积为50μl。在 5333epgradient S
中孵育扩增反应物,程序设定为:95℃2分钟,1个循环;每循环95℃30秒、60℃30 秒和72℃下1分30秒,30个循环;以及72℃7分钟,1个循环。
[0358] 根据制造商的操作指南,对PCR反应物使用 核苷酸去除试剂盒(QIAGEN Inc.,Valencia,CA,USA)。将所得的PCR混合物用Not I消化,使用TAE缓冲液通过
1%琼脂糖凝胶电泳分离消化的PCR 产物。将含有3’cbhI基因侧翼序列的1.3kb片段从凝胶TM
中切出,并使用 凝胶提取试剂盒进行提取。使用QUICK LIGATION 试剂盒将
1.3kb片段插入到Not I线性化的牛小肠磷酸酶处理过的 pJfyS139-B中。QUICK LIGATIONTM反应由100ng Not I线性化的牛小肠磷酸酶处理过的pJfyS139-B、20ng 1.3kb片段、1X QUICK LIGATIONTM缓冲液和5个单位的QUICK LIGASETM组成,最终体积为 20μl。将反应物在室温下孵育5分钟,并根据制造商的操作指南使用2 μl反应物来转化ONE  TOP10感受态细胞。将细胞在42℃下热击30秒,加入250μl SOC培养基。将试管在37℃、200rpm下孵育
1 小时,并将250μl铺在直径150mm的2XYT+氨苄青霉素平板上,在 37℃下孵育过夜。通过使用Xma I的限制性酶切分析来筛选所得的转化体,以确定插入物的存在和方向,并对阳性克隆进行测序。包含没有PCR错误的3’cbhI基因侧翼序列的克隆被命名为pJfyS139(图9)。
[0359] 实施例12:用于取代里氏木霉cbhI基因的烟曲霉cbhI-烟曲霉cbhII串联表达载体的构建
[0360] 构建串联取代载体pQM21,用表达两种重组蛋白的串联表达盒来取代里氏木霉中的内生里氏木霉cbhI基因。质粒pQM21含有里氏木霉cbhI 5’侧翼序列、里氏木霉Cel7A纤维二糖水解酶I基因启动子、烟曲霉Cel7A纤维二糖水解酶I编码序列、里氏木霉Cel7A纤维二糖水解酶I基因终止子、里氏木霉Cel6A纤维二糖水解酶II基因启动子、烟曲霉Cel6A纤维二糖水解酶II编码序列、里氏木霉Cel6A纤维二糖水解酶II基因终止子、里氏木霉Cel7A纤维二糖水解酶I基因终止子重复序列、单纯疱疹病毒胸苷激酶(tk)基因、大肠杆菌潮霉素磷酸转移酶(hpt/hygR)选择性标记物、里氏木霉cbhI 3’侧翼序列和氨苄青霉素抗性标记物基因。
[0361] 使用以下示出的基因特异性正向和反向引物从pJfyS144(实施例 10)扩增烟曲霉纤维二糖水解酶II表达盒。斜体区表示与 反应的插入位点的序列同源性,划线部分分别是是引入的Bam HI位点和Nhe I位点。
[0362] 正向引物:
[0363] 5’-tcaagcttggtaccgagctcggatCCAAGTATCCAGAGGTGTATGGAAA T-3’(SEQ ID NO:67)
[0364] 反向引物:
[0365] 5’-ctggcggccgttactagtgctagcACTCGGAGTTGTTATACGCTAC-3’ (SEQ ID NO:68)[0366] 扩增反应由164ng pJfyS144、1μM引物、1X  ACCUPRIMETMPfx 反应缓冲液TM(Invitrogen,Carlsbad,CA,USA)和2.5个单位的 ACCUPRIME Pfx DNA聚合酶(Invitrogen,Carlsbad,CA,USA)组成,最终体积为50μl。在
5333 epgradient S中孵育扩增反应物,程序设定为:95℃2分钟,1个循环;每循环95℃15秒、58℃30秒和68℃5分钟,35个循环。使用TAE缓冲液,通过1%琼脂糖凝胶电泳来分离PCR产物,其中将约3.5kb的片段从凝胶中切出,并使用 凝胶提取试剂盒根据制
造商的操作指南进行提取。
[0367] 使用IN-FUSIONTMAdvantage PCR克隆试剂盒根据制造商建议的操作指南将3.5kb PCR产物插入到Bam HI消化的pJfyS139(实施例 11)中。IN-FUSIONTM反应由1X IN-FUSIONTM反应缓冲液、103ng Bam HI消化的pJfyS139、62ng 3.5kb PCR产物和1μl IN-FUSIONTM酶组成,反应体积为10μl。将反应物在37℃下孵育15分钟,然后在50℃下孵育15分钟。孵育期之后,向反应中加入15μl TE。根据制造商的操作指南,使用2μl等份来转化Gold超级感受态细胞。将大肠杆菌转化反应物铺在2XYT+氨苄青霉素平板上。通过测序来筛选转化体,并识别出包含没有PCR错误的插入的一个克隆,将其命名为 pQM18(图10)。质粒pQM18用于在串联表达盒后插入来自里氏木霉 3’cbhI基因侧翼区的同源重复片段,并修饰里氏木霉3’cbhII基因侧翼区。
[0368] 使用以下的正向和反向引物从pJfyS139扩增来自里氏木霉3’cbhI 基因侧翼区的同源重复片段。斜体区表示与 反应的插入位点的序列同源性,划线部分是引入的用于克隆的Nhe I位点和Xba I 位点。
[0369] 正向引物:
[0370] 5’-gagtagcgtataacaactccgagtgctagcTTTAAGATAACGGAATAGAA GAA AG-3’(SEQ ID NO:69)
[0371] 反向引物:
[0372] 5’-ctggcggccgttactagtctagaCGCGCCACTACCGCGTTCG-3’(SEQ ID NO:70)[0373] 使用以下的正向和反向引物从pJfyS139扩增里氏木霉3’cbhI基因侧翼序列。斜体区表示与 反应的插入位点的载体同源性,划线部分是引入的用于克隆的Not I位点。
[0374] 正向引物:
[0375] 5’-tctgcagatatccatcacactggcggccgcTTTAAGATAACGGAATAGAAG AAAG-3’(SEQ ID NO:71)
[0376] 反向引物:
[0377] 5’-aaactctaggatgcatgctcgagcggccgcACGGCACGGTTAAGCAGGGT -3’(SEQ ID NO:72)
[0378] 扩增反应由350ng pJfyS139、1μM引物、1X ACCUPRIMETMPfx 反应缓冲液和2.5个单位的ACCUPRIMETMPfx DNA聚合酶组成,最终体积为50μl。在5333epgradient S中孵育扩增反应物,程序设定为:95℃2分钟,1个循环;以及每循环95℃
15秒、58℃30秒和68℃5分钟,35个循环。使用TAE缓冲液通过1%琼脂糖凝胶电泳纯化PCR产物,其中将约1.1kb的片段和约260bp的片段从凝胶中切出,并使用 凝胶提
取试剂盒根据制造商的操作指南进行提取。
[0379] 通过将质粒用Nhe I和Not I消化,将含有tk基因和hpt(潮霉素磷酸转移酶)选择性标记物的DNA片段从pQM18中释放。使用TAE 缓冲液通过1%琼脂糖凝胶电泳对消化物进行分析,其中将约4.4kb的条带从凝胶中切出,并使用 凝胶提取试剂盒根据制造商的操作指南进行提取。
[0380] 使用TAE缓冲液通过1%琼脂糖凝胶电泳来分离来自Nhe I和Not I 消化的pQM18中的约9kb DNA片段。将9kb片段从凝胶中切出,并使用 凝胶提取试剂盒根据制造商的操作指南进行提取。
[0381] IN-FUSIONTM反应由1X IN-FUSIONTM反应缓冲液、158ng的9kb Nhe I和Not I消化的pQM18、13ng的260bp来自里氏木霉cbhI 3’侧翼区的同源重复片段、39ng的1.1kb 3’cbhI侧翼、56ng的4.4kb tk-hpt 片段和1μl IN-FUSIONTM酶组成,反应体积为10μl。将反应物在37℃下孵育15分钟,并在50℃下孵育15分钟。孵育期之后,向反应中加入40μl TE。根据制造商的操作指南,使用2.5μl等份来转化 Gold超级感受态细胞。将大肠杆菌转化反应物铺在 2XYT+氨苄青霉素平板上,并在37℃下孵育过夜。通过测序来筛选转化体,并识别出包含没有PCR错误的插入的一个克隆,将其命名为 pQM21(图11)。质粒pQM21用作取代cbhI基因的载体。
[0382] 实施例13:用烟曲霉纤维二糖水解酶I和烟曲霉纤维二糖水解酶II串联表达盒取代内生里氏木霉cbhI基因
[0383] 如实施例4所述,进行里氏木霉菌株AgJg115-104-7B1的原生质体制备和转化。
[0384] 为将内生cbhI基因用烟曲霉cbhI-cbhII串联表达盒取代,将约137 μg的pQM21(实施例12)用Pme I消化。使用TAE缓冲液通过1%琼脂糖凝胶电泳来纯化消化反应物,其中从凝胶中切出含有用于靶向里氏木霉cbhI基因座的烟曲霉CBHI-CBHII串联表达盒的约12kb DNA 条带,并使用 Extract II纯化试剂盒进行提取。将约1~3 μg的纯化的所得12kb DNA加入到100μl里氏木霉ku70-菌株 AgJg115-104-7B1原生质体溶液中,并轻柔混合。加入PEG缓冲液(250 μl),混合,并在34℃下孵育30分钟。然后加入STC(3ml),混合,并铺在各个补充有1M蔗糖的PDA平板上。在28℃下孵育16小时后,向各个板中加入20ml补充有35μg潮霉素B/ml的覆层PDA培养基。将平板在28℃下孵育4~7天。
[0385] 得到7个转化体,挑出每一个,并转移至PDA平板,在28℃下孵育7天。采用使用下述操作指南的真菌孢子PCR法来筛选携带取代物的转化体,使用以下所示的对整合的cbhI 5’侧翼区的上游区进行退火的正向引物以及以下所示的对tk区中的区域进行退火的反向引物。
[0386] 正向引物:
[0387] 5’-CAAGCAAAGCGTTCCGTCGCAGTAGCAGGC-3’(SEQ ID NO: 73)
[0388] 反向引物:
[0389] 5’-CAGTGGCGCTTATTACTCAG-3’(SEQ ID NO:74)
[0390] 只有当在cbhII基因座处发生精确的基因取代时,才会产生约7kb 的PCR产物。如果盒已经整合在基因组中的别处,则不会得到扩增物。
[0391] 将来自各转化体的少量孢子悬浮在25μl的TE缓冲液中,并在微波炉中高温加热1分钟。使用各个微波过的孢子悬浮液作为PCR反应中的模板。反应由2μl微波过的孢子悬浮液、200μM dNTP、1μM引物、1X  Taq反应缓冲液(New England Biolabs,Inc,Ipswich, MA,USA)和2个单位的 Taq DNA聚合酶(New England Biolabs,Inc,Ipswich,MA,USA)组成,最终体积为20μl。在
5333epgradient S中孵育反应物,程序设定为:
95℃4分钟,1个循环;每循环95℃15秒、50℃30秒和 68℃7分钟,35个循环;以及68℃15分钟,1个循环。使用TAE缓冲液通过1%琼脂糖凝胶电泳对PCR反应物进行分析。孢子PCR表明,
7 个转化体中的5个在cbhI基因座处含有取代盒。
[0392] 根据实施例9中所述的过程,从4个阳性转化体中分离出基因组 DNA,并对其进行DNA印迹分析,以确认取代盒是单个拷贝。
[0393] 对于DNA印迹分析,将2μg基因组DNA在20μl反应体积中用10个单位的Bam HI消化,并使用TAE缓冲液对其进行0.7%琼脂糖电泳。将凝胶中的DNA在0.25N HCl中脱嘌呤15分钟,在变性溶液中变性两次,每次15分钟,在中和溶液中中和10~30分钟,并使用 TURBOBLOTTERTM系统(Whatman,Inc.,Florham Park,NJ,USA)根据制造商的操作指南转移至Supercharge膜(Whatman,Inc., Florham  Park,NJ,USA)。使用STRATALINKERTMUV交联剂 (Stratagene,La Jolla,CA,USA)将DNA经UV交联在膜上,并在
20ml DIG Easy Hyb(Roche Diagnostics Corporation,Indianapolis,IN,USA) 中在42℃下预杂交1小时。
[0394] 使用PCR  Dig探针合成试剂盒(Roche  Diagnostics  Corporation, Indianapolis,IN,USA)根据制造商说明书,用如下所示的正向和反向引物生成与cbhI基因的3’侧翼区杂交的探针。PCR反应由具有MgCl2的1X  高保真PCR缓冲液(Roche Diagnostics Corporation, Indianapolis,IN,USA)、1X PCR DIG探针合成混合物(Roche Diagnostics Corporation,Indianapolis,IN,USA)、1μM各引物、100pg的1.1kb 3’ cbhI侧翼区和2.625个单位的 高保真酶混合物(Roche Diagnostics Corporation,Indianapolis,IN,USA)组成。在 5333epgradient 
S中进行PCR,程序设定为:95℃ 2分钟,1个循环;每循环95℃30秒、60℃30秒和72℃40秒,10个循环;每个循环为95℃30秒、60℃30秒和72℃40秒且对于各个连续循环额外有20秒,20个循环;以及72℃7分钟,1个循环。
[0395] 正向引物:
[0396] 5’-GAGAACACAGTGAGACCATAGC-3’(SEQ ID NO:75)
[0397] 反向引物:
[0398] 5’-TCTCAACCCAATCAGCAACATG-3’(SEQ ID NO:76)
[0399] 使用TAE缓冲液通过1%琼脂糖凝胶电泳来纯化探针,其中将与探针对应的720bp条带从凝胶中切出,并使用 Extract II纯化试剂盒进行提取。将探针煮沸5分钟,在上冷却2分钟,然后加入到10ml DIG Easy Hyb中,产生杂交溶液。杂交在42℃下进行 15~17小时。然后在室温下将膜在低等严格条件下在2X SSC+0.1% SDS中洗涤5分钟,然后,在65℃下在0.5X SSC+0.1%SDS中进行两次高等严格洗涤,每次15分钟。使用化学发光检定(Roche Diagnostics, Indianapolis,IN,USA)根据制造商说明书来检测探针-靶标杂交。DNA 印迹分析表明,命名为里氏木霉QMJi029-A5的一个转化体在cbhI基因座处含有取代盒,并选择其用于消除tk和hpt标记物。
[0400] 使用无菌涂布器,在5ml 0.01% 20中收集在28℃下生长的七日龄PDA平板上的里氏木霉QMJi029-A5的孢子。使用血球计数器确定孢子的浓度,将104和/或105孢子铺在150mm平板上,该平板含有补充有1μM 5-氟-2'-脱氧尿苷(FdU)的TrMM-G培养基。
[0401] 挑选10个FdU抗性的孢子分离株,如上所述从3个孢子分离株中提取基因组DNA。如上所述对分离株进行DNA印迹分析,结果表明所有的孢子分离株已经切除在取代盒的同源重复序列之间的hpt/tk区。选择命名为里氏木霉QMJi030-A5.6的一个菌株用于取代cbhII基因。
[0402] 用10μl接种环,收集在28℃下生长的七日龄PDA平板上的里氏木霉QMJi029-A5和里氏木霉QMJi030-A5.6的孢子,并将其转移至125 ml塑料摇瓶中的25ml CIM培养基中。将摇瓶培养物在28℃、200rpm 下孵育5天。将各培养物的1ml等份在微型离心机中于13,400x g离心,回收培养上清液。使用 8~16%Tris-HCl凝胶根据制造商说明书经由SDS-PAGE对5μl的各培养上清液进行分析。将所得的凝胶用BIO-SAFETMCoomassie(考马斯)染色。培养物的SDS-PAGE 图谱表明,转化体产生50与70kDa之间的两个主要蛋白条带,其分别与烟曲霉纤维二糖水解酶I和烟曲霉纤维二糖水解酶II对应。烟曲霉纤维二糖水解酶I和烟曲霉纤维二糖水解酶II的表达通过质谱分析加以确认(实施例14)。
[0403] 实施例14:用于肽测序的多肽的凝胶内消化
[0404] 使用 II液体处理机械臂(PerkinElmer Life and Analytical Sciences,Boston,MA,USA)进行凝胶内消化。将实施例13 中所述的SDS-PAGE凝胶的一部分切出,其在50和70kDa MW标记物之间含有目标蛋白。将凝胶片在100mM碳酸氢铵pH 8.0中用
50μl 10mM二硫苏糖醇(DTT)还原30分钟。还原之后,将凝胶片在100mM 碳酸氢铵pH 8.0中用50μl 55mM碘乙酰胺烷基化20分钟。使干燥的凝胶条在室温下在含有6ng测序级胰蛋白酶(Promega,Madison,WI, USA)/μl 50mM碳酸氢铵pH 8的25μl胰蛋白酶消化液中膨胀30分钟,然后在40℃下消化8小时。上述各个反应步骤之后为,均遵照制造商的标准操作指南用适当的溶液进行多次洗涤和预洗涤。在反应之间使用50μl乙腈来使凝胶片脱水,并在步骤之间将凝胶片空气干燥。将肽用HPLC级水中的1%甲酸/2%乙腈提取30分钟,进行两次。将肽提取液转移至已经冷却至10~15℃的96孔有边缘PCR型板(ABGene, Rochester,NY,USA),并用96孔板盖(PerkinElmer Life and Analytical Sciences,Boston,MA,USA)盖上,以防止蒸发。将板在4℃下进一步储存,直至可以进行质谱分析。
[0405] 蛋白鉴定.对于通过串联质谱法进行肽的从头测序,使用混合正交四极杆飞行时间质谱仪SYNAPTTMMS(Waters Corp.,Milford,MA, USA)进行LC/MS/MS分析。SYNAPTTMMS完全是微处理器控制的,其使用 软件4.1版(Waters Corp.,Milford,MA,USA)。 SYNAPTTMMS装有用于使样本浓缩并脱盐的NANOACQUITY  (Waters Corp,Milford,MA,USA)。将样本装载在上样环中安装的捕获柱(180μm ID  X 20mm,5μm C18)(Waters Corp,Milford,MA,USA)上,并使用二元溶剂控制以15μl/
分钟用水中的0.1%甲酸洗涤1分钟。在100μm ID x 100mm,C18,1.7μm, BEH130TMC18纳流融合毛细管柱(Waters Corp,Milford,MA,USA) 上以400nl/分钟的流量分离肽。在30分钟时间间隔中,施用0.1%甲酸中1%~85%乙腈的阶梯洗脱梯度。柱洗提液在214nm下监测,并通过装有纳米喷雾接口的电喷雾离子源引入到SYNAPTTMMS。
[0406] 以全元素扫描模式从m/z 250~1900的质量范围获取数据,使用 MS到MS/MS的切换标准,以包括大于10.0计数/秒的离子强度和+2、 +3和+4的电荷状态。可以获得扫描时间为2.0秒的6个共洗脱种的分析谱图。通常使用45伏的锥孔电压,并将碰撞能量设定为根据洗脱的肽的质量和电荷状态而变化,且在10~60伏的范围内。将得到的谱图以自动的方式合并、平滑化并集中,生成峰列表。使用PROTEINLYNX GLOBAL  2.4软件(Waters Corp,Milford,MA,USA)和 v.2.2(Matrix Sciences Ltd.,London,UK),针对选择的数据库对峰列表进行搜索。对PROTEINLYNX GLOBAL  和 搜
索的结果进行评价,肽的鉴定基于与所预期蛋白序列的肽质量指纹图谱匹配。
[0407] 肽质量指纹图谱证实,里氏木霉QMJi029-A5和里氏木霉 QMJI030A5.6的SDS-PAGE样本含有烟曲霉Cel7A纤维二糖水解酶I、烟曲霉Cel6A纤维二糖水解酶II、里氏木霉纤维二糖水解酶II和其他少量里氏木霉宿主背景蛋白。
[0408] 实施例15:编码Penicillium emersonii GH61A多肽和烟曲霉Cel3Aβ-葡糖苷酶的串联基因表达质粒pRRAB01的生成
[0409] 使用以下所示的基因特异性正向和反向引物从质粒pAG121(图 12;SEQ ID NO:77;来自核苷酸6位至核苷酸620位,参见pAG121 的限制性酶切图谱和序列)扩增里氏木霉纤维二糖水解酶II(cbhII) 基因启动子。正向引物中的斜体区表示与pDM286载体骨架的序列同源性,反向引物中的斜体区表示与用于 反应的下一个插入物即烟曲霉
β-葡糖苷酶编码序列的序列同源性。
[0410] 正向引物:
[0411] 5’-cgaacgcggtagtggGAATTCTAGGCTAGGTATGC-3’(SEQ ID NO: 78)
[0412] 反向引物:
[0413] 5’-ccaaccgaatctcatGGTGCAATACACAGAGGGTG-3’(SEQ ID NO: 79)
[0414] 扩增反应由1ng的pAG121DNA、100皮摩尔的各上述引物、1μl 的dATP、dTTP、dGTP和dCTP的10mM混合物、1X PHUSIONTM高保真热启动DNA聚合酶缓冲液和1个单位的PHUSIONTM高保真热启动DNA聚合酶组成,最终体积为50μl。在5333epgradient S中孵育扩增反应物,程序设定为:98℃下30秒,1个循环;每循环98℃10秒和72℃20秒,35个循环;以及72℃10分钟,1个循环。使用TAE缓冲液通过1%琼脂糖凝胶电泳分离PCR产物,其中将约640bp片段从凝胶中切出,并使用 凝胶提取试剂盒根据制造商的操作指南进行提取。
[0415] 使用以下所示的基因特异性正向和反向引物从质粒pDM290扩增烟曲霉β-葡糖苷酶编码序列。正向引物中的斜体区表示与之前插入物即里氏木霉纤维二糖水解酶II编码基因的序列同源性,反向引物中的斜体区表示与 反应的下一个插入物即里氏木霉纤维二糖水解酶II基因终止子的序列同源性。
[0416] 正向引物:
[0417] 5’-tctgtgtattgcaccATGAGATTCGGTTGGCTCGA-3’(SEQ ID NO: 80)
[0418] 反向引物:
[0419] 5’-ccggtcacgaaagccCTAGTAGACACGGGGCAGAG-3’(SEQ ID NO:81)
[0420] 扩增反应由1ng的pDM290DNA、100皮摩尔的各上述引物、1μl 的dATP、dTTP、dGTP和dCTP的10mM混合物、1X PHUSIONTM高保真热启动DNA聚合酶缓冲液和1个单位的PHUSIONTM高保真热启动DNA聚合酶组成,最终体积为50μl。在5333epgradient S中孵育扩增反应物,程序设定为:98℃30秒,1个循环;每循环98℃10秒、
65℃30秒和72℃1:35 秒,35个循环;以及72℃10分钟,1个循环。使用TAE缓冲液通过 1%琼脂糖凝胶电泳分离PCR产物,其中将约3.1kb片段从凝胶中切出,并使用 凝胶提取试剂盒根据制造商的操作指南进行提取。
[0421] 使用以下所示的基因特异性正向和反向引物从质粒pJfyS144扩增里氏木霉纤维二糖水解酶II基因终止子。正向引物中的斜体区表示与烟曲霉β-葡糖苷酶编码序列的序列同源性,反向引物中的斜体区表示与用于 反应的pDM286骨架的序列同源性。
[0422] 正向引物:
[0423] 5’-ccccgtgtctactagGGCTTTCGTGACCGGGCTTC-3’(SEQ ID NO: 82)
[0424] 反向引物:
[0425] 5’-gtcattaccaattggACTCGGAGTTGTTATACGCT-3’(SEQ ID NO: 83)
[0426] 扩增反应由1ng的pJfyS144DNA,100皮摩尔的各上述引物,1μl 的dATP、dTTP、dGTP和dCTP的10mM混合物,1X PHUSIONTM高保真热启动DNA聚合酶缓冲液和1个单位PHUSIONTM高保真热启动 DNA聚合酶组成,最终体积为50μl。在5333epgradient S中孵育扩增反应物,程序设定为:98℃30秒,1个循环;每循环98℃10秒和
72℃10秒,35个循环;以及72℃10分钟,1个循环。使用TAE缓冲液通过1%琼脂糖凝胶电泳分离PCR产物,其中将330bp片段从凝胶中切出,并使用 凝胶提取试剂盒根据制造商的操作指南进行提取。
[0427] 使用以下所示的基因特异性正向和反向引物,将里氏木霉纤维二糖水解酶II基因启动子、烟曲霉β-葡糖苷酶编码序列和里氏木霉纤维二糖水解酶II基因终止子在重叠延伸(SOE)PCR反应中结合。斜体区表示与用于 反应的pDM286中的插入位点的序列同源性。
[0428] 正向引物:
[0429] 5’-cgaacgcggtagtggGAATTCTAGGCTAGGTATGC-3’(SEQ ID NO: 84)
[0430] 反向引物:
[0431] 5’-gtcattaccaattggACTCGGAGTTGTTATACGCT-3’(SEQ ID NO: 85)
[0432] SOE PCR反应由48ng扩增自pAG121的640bp里氏木霉cbhII启动子,228ng扩增自pDM290的3.1kb烟曲霉β-葡糖苷酶基因片段, 24ng扩增自pJfyS144的330bp里氏木霉cbhII终止子,100皮摩尔的各上述引物,1μl的dATP、dTTP、dGTP和dCTP的10mM混合物, 1X PHUSIONTM高保真热启动DNA聚合酶缓冲液和1个单位的 PHUSIONTM高保真热启动DNA聚合酶组成,最终体积为50μl。在 5333epgradient S中孵育扩增反应物,程序设定为:98℃30秒,1个循环;每循环98℃10秒和72℃2分5 秒,35个循环;和72℃10分钟,1个循环。使用TAE缓冲液通过1%琼脂糖凝胶电泳分离PCR产物,其中将约4.1kb片段从凝胶中切出,并使用 凝胶提取试剂盒根据制造商的操作指南进行提取。
[0433] 将质粒pDM286用Asc I消化,并使用TAE缓冲液通过1%琼脂糖凝胶电泳分离经Asc I消化的pDM286,其中将约8kb的片段从凝胶中切出,并使用 凝胶提取试剂盒根据制造商的操作指南进行提取。
[0434] 使用IN-FUSIONTMAdvantage PCR克隆试剂盒根据制造商的操作指南将4.1kb的PCR产物插入到Asc I消化的pDM286中。IN-FUSIONTM反应由1X IN-FUSIONTM反应缓冲液、200ng约8kb凝胶纯化的Asc I 消化的pDM286、203.1ng的4.1kb PCR产物和1μl IN-FUSIONTM酶组成,反应体积为10μl。将反应物在37℃下孵育15分钟,并在50℃下孵育15分钟。孵育期之后,向反应物中加入40μl TE。根据制造商的操作指南,使用2μl等份来转化ONE  TOP10感受态细胞。将大肠杆菌转化反应物铺在2XYT+氨苄青霉素平板上。通过测序来筛选转化体,并识别出包含没有PCR错误的插入的一个克隆,将其命名为 pRRAB01(图13)。
[0435] 实施例16:编码烟曲霉β-葡糖苷酶(Cel3A)突变基因的里氏木霉表达载体的生成[0436] 使用 多点定点诱变试剂盒(Stratagene,La Jolla, CA,USA)通过在pEJG97(WO 2005/074647)上进行定点诱变,构建含有替换G142S、Q183R、H266Q和D703G的烟曲霉家族3A β-葡糖苷酶的变体。用于定点诱变的寡核苷酸的概要示于表1中。
[0437] 使用 9600准备所得的变异质粒pDFng128-6。使用 Applied Biosystems 3130xl基因分析仪(Applied Biosystems,Foster City, CA,USA)对变异质粒构建体进行测序,以确认变化。
[0438] 表1
[0439]
[0440] 设计以下所示的两种合成寡核苷酸引物,从质粒pDFng128-6中 PCR扩增烟曲霉β-葡糖苷酶变体编码序列。使用IN-FUSIONTM克隆试剂盒将片段直接克隆到表达载体pMJ09中。粗体字母表示编码序列。其余序列与pMJ09的插入位点同源。
[0441] 正向引物:
[0442] 5’-CGGACTGCGCACCATGAGATTCGGTTGGCTCGA-3’(SEQ ID NO:90)
[0443] 反向引物:
[0444] 5’-TCGCCACGGAGCTTACTAGTAGACACGGGGCAGAG-3’ (SEQ ID NO:91)
[0445] 将50皮摩尔的各上述引物用于PCR反应中,该PCR反应由50ng 的pDFng128-6,具有MgCl2的1X  高保真PCR缓冲液,各 0.25mM的dATP、dTTP、dGTP和dCTP,和2.6个单位的 高保真酶混合物组成,最终体积为50μl。在5333epgradient S中进行扩增,程序设定为:94℃ 2分钟,1个循
环;每循环94℃15秒、65℃30秒和68℃1分钟,30个循环;以及68℃下最终延长7分钟。然后将加热块转至4℃浸泡循环。使用TBE缓冲液通过0.7%琼脂糖凝胶电泳分离反应产物,其中将约 3.1kb的产物条带从凝胶中切出,并使用 凝胶提取试剂盒根据制造商说
明书进行提取。
[0446] 将质粒pMJ09用Nco I和Pac I消化,使用TBE缓冲液通过1.0%琼脂糖凝胶电泳分离,从凝胶中切出,并使用 凝胶提取试剂盒根据制造商说明书进行提取。
[0447] 将3.1kb的基因片段和消化的载体使用IN-FUSIONTM克隆试剂盒连接在一起,得到pDFng113-3(图14),其中β-葡糖苷酶变体编码序列的转录处于来自里氏木霉cbhI基因的启动子的控制下。连接反应(20 μl)由1X IN-FUSIONTM反应缓冲液、1X BSA、1μl IN-FUSIONTM酶 (1:10稀释)、200ng凝胶纯化的Nco I/Pac I消化的pMJ09以及172.2 ng纯化的3.1kb PCR产物组成。将反应物在37℃下孵育15分钟,然后在50℃下孵育15分钟。使用2μl反应物来转化大肠杆菌XL10  Gold超级感受态细胞。将大肠杆菌转化反应物铺在2XYT+氨苄青霉素平板上。使用 9600来准备含有 pDFng133-3的大肠杆菌转
化体。通过DNA测序来确认pDFng133-3中的烟曲霉β-葡糖苷酶变体插入物。
[0448] 实施例17:编码Penicillium emersonii GH61A多肽和烟曲霉Cel3A β-葡糖苷酶变体的串联表达载体pAmFs074的构建
[0449] 通过将来自pRRAB01和pDFNG133-3的限制性酶切片段组合来生成串联表达载体pAmFs074,以产生用于表达Penicillium emersonii GH61A多肽和烟曲霉Cel3A β-葡糖苷酶变体的单一载体。
[0450] 将1微克经质粒中量试剂盒(QIAGEN Inc.,Valencia,CA,USA) 纯化的质粒pRRAB01(实施例15)与最终体积20μl中的20个单位 Xho I(New England Biolabs Inc,Ipswich,MA,USA)、1X NEB缓冲液4 (New England Biolabs Inc,Ipswich,MA,USA)和1X BSA混合。反应物在37℃下孵育3小时,并然后与4μl的5X DNA上样染料(QIAGEN Inc.,Valencia,CA,USA)结合。使用TBE缓冲液通过1%琼脂糖凝胶电泳分离限制性酶切消化反应产物,其中将约9.4kb的片段从凝胶中切出,并使用 Extract II试剂盒根据制造商的操作指南进行提取。9.4kb的片段含有里氏木霉Cel7A纤维二糖水解酶I基因启动子、P.emersonii GH61A多肽编码序列、里氏木霉Cel7A纤维二糖水解酶I基因终止子、里氏木霉Cel6A纤维二糖水解酶II基因启动子、烟曲霉β-葡糖苷酶Cel3A β-葡糖苷酶编码序列的3’端487bp部分和5’端 16bp部分、里氏木霉Cel6A纤维二糖水解酶II基因终止子、构巢曲霉乙酰胺酶(amdS)基因和氨苄青霉素抗性标记物基因。
[0451] 将1微克经质粒中量试剂盒纯化的质粒pDFNG133-3(实施例16) 与最终体积20μl中的20个单位限制性内切酶Xho I、1X NEB缓冲液 4和1X BSA混合。将反应物在37℃下孵育3小时,然后与4μl 5X DNA 上样染料混结合。使用TBE缓冲液通过1%琼脂糖凝胶电泳分离限制性酶切消化反应产物,其中将约2.6kb的片段从凝胶中切出,并使用
Extract II试剂盒根据制造商的操作指南进行提取。2.6 kb的片段含
有烟曲霉β-葡糖苷酶Cel3A β-葡糖苷酶突变基因的1940bp 部分。
[0452] 将纯化的9.4kb pRRAB01Xho I限制性酶切片段和纯化的2.6kb pDFNG133-3Xho I限制性酶切片段使用QUICK LIGATIONTM试剂盒根据制造商的操作指南连接在一起。将50ng等份的9.4kb pRRAB01片段和50ng等份的2.6kb pDFNG133-3片段混合,用无菌水将体积调节至10μl。然后加入10μl 2X QUICK LIGATIONTM缓冲液和1μl QUICK LIGASETM,并彻底混合。将反应在25℃下进行5分钟,然后置于冰上。根据制造商的操作指南,使用2μl等份的连接反应物来转化ONE  TOP10感受态细胞。将大肠杆菌转化反应物铺在2XYT+氨苄青霉素平板上。通过限制性酶切图谱和测序来筛选转化体。识别出包含没有序列错误并方向正确的插入的一个克隆,将其命名为pAmFs074(图 15)。
[0453] 质粒pAmFs074可以用Pme I消化,以产生用于里氏木霉转化的约 9.35kb片段。9.35kb的片段含有由以下组成的表达盒:(1)里氏木霉 Cel7A纤维二糖水解酶I基因启动子、P.emersonii GH61A多肽编码序列和里氏木霉Cel7A纤维二糖水解酶I基因终止子,和(2)里氏木霉 Cel6A纤维二糖水解酶II基因启动子、烟曲霉β-葡糖苷酶Cel3A β-葡糖苷酶突变体编码序列和里氏木霉Cel6A纤维二糖水解酶II基因终止子。9.35kb的片段还含有构巢曲霉乙酰胺酶(amdS)基因。
[0454] 实施例18:用于取代里氏木霉cbhII的Penicillium emersonii GH61A多肽和烟曲霉Cel3A变异β-葡糖苷酶串联表达载体的产生
[0455] 构建串联取代载体pQM22,用于将里氏木霉中的里氏木霉cbhII 基因用串联表达盒取代,以表达除真菌选择性标记物之外的两种重组蛋白。载体pQM22含有里氏木霉cbhII 5’侧翼区、里氏木霉Cel7A纤维二糖水解酶I基因启动子、P.emersonii GH61A多肽编码序列、里氏木霉Cel7A纤维二糖水解酶I基因终止子、里氏木霉Cel6A纤维二糖水解酶II基因启动子、烟曲霉β-葡糖苷酶Cel3A β-葡糖苷酶突变体编码序列、里氏木霉Cel6A纤维二糖水解酶II基因终止子、单纯疱疹病毒胸苷激酶(tk)基因、大肠杆菌潮霉素磷酸转移酶(hpt/hygR)选择性标记物、里氏木霉cbhII 3’侧翼区和氨苄青霉素抗性标记物基因。
[0456] 通过将释放自pAmFs074的约6.4kb串联表达盒和扩增自里氏木霉菌株AgJg115-104-7B1基因组DNA(根据实施例9分离)的约1.5kb 里氏木霉cbhII 5’侧翼区插入到经Sap I和Pac I消化的pJfyS142(实施例9)的约8.7kb载体片段中,制得载体pQM22。
[0457] 通过将质粒用Pme I和Eco RV消化,从pAmFs074中释放用于P. emersonii GH61A多肽和烟曲霉β-葡糖苷酶变体的6.4kb串联表达盒。对消化物进行使用TAE缓冲液的1%琼脂糖凝胶电泳,其中将约6.4kb 条带从凝胶中切出,并使用 Extract II纯化试剂盒根据制造商的操作指南进行提取。
[0458] 使用以下的正向和反向引物,从里氏木霉菌株QMJi030-A5.6基因组DNA扩增5’里氏木霉cbhII侧翼序列。斜体区表示与用于 反应的插入位点的序列同源性,划线部分表示引入的用于克隆的Pac I和Psi I位点。
[0459] 正向引物:
[0460] 5’-gcgagtcagtgagcgaggaagcggaagagcttaattaaTCTTGAGTGGATGTC TGATCTAG-3’(SEQ ID NO:92)
[0461] 反向引物:
[0462] 5’-gttcggataacaatcctacattcggtcgacttataaGGATGTATCAATGGGTTAT ACG-3’(SEQ ID NO:93)
[0463] 扩增反应由约150ng的里氏木霉QMJi030-A5.6(实施例13)基因组DNA、1μM引物、200μM  dNTP(Appiled Biosystems, Foster City,USA)、1X PHUSIONTM高保真TM
热启动DNA聚合酶缓冲液和 1个单位的PHUSION 高保真热启动DNA聚合酶组成,最终体积为 
50μl。在 5333epgradient S中孵育扩增反应物,
程序设定为:98℃2分钟,1个循环;每循环98℃15秒、 60℃30秒和72℃1分钟,35个循环;和在72℃10分钟,1个循环。使用TAE缓冲液通过1%琼脂糖凝胶电泳分离PCR产物,其中将约
1.5kb 条带从凝胶中切出,并使用 Extract II纯化试剂盒根据制造商
的操作指南进行提取。
[0464] 将约36μg的pJfyS142用Sap I和Pac I消化。使用TAE缓冲液通过1%琼脂糖凝胶电泳分离消化反应物,其中将约8.7kb的条带从凝胶中切出,并使用Extract II纯化试剂盒根据制造商的操作指南进行提取。
[0465] IN-FUSIONTM反应由1X IN-FUSIONTM反应缓冲液、138ng用Sap I 和Pac I消化的8.7kb pJfyS142片段、205ng来自pAmFs074的6.4kb 片段、49ng里氏木霉cbhII 5’侧翼区的
1.5kb片段和1μl IN-FUSIONTM酶组成,反应体积为10μl。将反应物在37℃下孵育15分钟,在
50℃下孵育15分钟。孵育期之后,向反应中加入40μl TE。根据制造商的操作指南,使用2.5μl等份来转化ONE  TOP10感受态细胞。将大肠杆菌转化反应物铺在2XYT+氨苄青霉素平板上。通过测序来筛选转化体,并识别出包含没有PCR错误的插入的一个克隆,将其命名为 pQM22(图16)。质粒pQM22用作取代里氏木霉cbhII基因的载体。
[0466] 实施例19:用Penicillium emersonii GH61A多肽和烟曲霉β-葡糖苷酶突变串联表达盒取代内生里氏木霉cbhII基因
[0467] 为将内生里氏木霉cbhII基因用P.emersonii GH61多肽-烟曲霉β- 葡糖苷酶突变串联表达盒取代,将里氏木霉QMJi030-A5.6(实施例13) 用6.3μg Pme I线性化的pQM22(实施例18)转化。得到31个转化体,挑取每一个并转移至PDA平板,在28℃下孵育7天。使用实施例13 中所述的真菌孢子PCR法用以下所示的引物组A筛选出含有完整cbhII 基因基因座的转化体之后,根据实施例9的过程从8个转化体中分离出基因组DNA,并使用以下所示的引物组B、与整合的cbhII 5’侧翼区的上游区进行退火的正向引物、烟曲霉β-葡糖苷酶突变区之后的tk区中的反向引物-1和里氏木霉cbhII 3’侧翼区下游的另一反向引物-2经 PCR加以分析。
[0468] 引物组A正向引物:
[0469] 5’-TCAACCAGCTTCTTTATTGG-3’(SEQ ID NO:94)
[0470] 引物组A反向引物:
[0471] 5’-GATCGCCATAGGCTCATGCTCCGCA-3’(SEQ ID NO:95)
[0472] 引物组B正向引物:
[0473] 5’-GCGGCATCAAACACGAACCTG-3’(SEQ ID NO:96)
[0474] 引物组B反向-1引物:
[0475] 5’-CAGTGGCGCTTATTACTCAG-3’(SEQ ID NO:97)
[0476] 引物组B反向-2引物:
[0477] 5’-GATCGCCATAGGCTCATGCTCCGCA-3’(SEQ ID NO:98)
[0478] 反应由2μl孢子悬浮液、200μM dNTP、1μM引物、1X  Taq反应缓冲液和2个单位的 Taq  DNA聚合酶组成,最终体积为20μl。在 5333epgradient S中孵育反应物,程序设定
为:95℃4分钟,1个循环;每循环95℃15秒、55℃30秒、68℃11分钟,35个循环;以及68℃15 分钟,1个循环。使用TAE缓冲液通过1%琼脂糖凝胶电泳对PCR反应物进行分析。PCR结果表明,一个转化体在靶向的cbhII基因座处含有取代盒。如下文所述进行DNA印迹分析,以确认取代盒是P. emersonii GH61A多肽序列和烟曲霉β-葡糖苷酶突变编码序列的单一拷贝。
[0479] 根据实施例9中所述的过程从转化体中分离出基因组DNA,并对各转化体进行DNA印迹分析。对于DNA印迹分析,在70μl反应体积中用10个单位的Cla I和/或含有5个单位Stu I和5个单位Sex AI 的限制性内切酶混合物消化6μg基因组DNA。将消化的DNA反应物与14μl的5X DNA上样染料混合,并使用TAE缓冲液使25μl的各混合物进行1%琼脂糖电泳。将凝胶中的DNA在0.25N HCl中脱嘌呤15 分钟,在变性溶液中变性两次,每次15分钟,在中和溶液中中和10~30 分钟,并转移至 Supercharge膜。使用STRATALINKERTM UV交联剂将DNA UV交联到膜上,并在20ml DIG Easy Hyb中在42℃下预杂交1小时。
[0480] 将约1μg的pQM22用Stu I和Xba I消化。使用TAE缓冲液通过 1%琼脂糖凝胶电泳分离消化反应物,其中将来自P.emersonii GH61A 多肽编码序列的约800bp条带从凝胶中切出,并使用 凝胶提取试剂盒根据制造商的操作指南进行提取。
[0481] 将约1μg的pQM22用Xho I和Nru I消化。使用TAE缓冲液通过 1%琼脂糖凝胶电泳分离消化反应物,其中将来自烟曲霉Cel3A β-葡糖苷酶突变体编码序列的约1kb条带从凝胶中切出,并使用 凝胶提取试剂盒根据制造商的操作指南进行提取。
[0482] 将约1μg的pQM22用Not I和Pvu I消化。使用TAE缓冲液通过 1%琼脂糖凝胶电泳分离消化反应物,其中将来自hpt基因的约1.1kb  条带从凝胶中切出,并使用凝胶提取试剂盒根据制造商的操作指南进行提取。
[0483] 将266ng的800bp片段、168ng的1kb片段和240ng的1.1kb 片段量各自混合在16μl的最终体积中,以使用DIG-High Prime  DNA 标记试剂盒(Roche Diagnostics Corporation,Indianapolis,IN,USA)根据制造商说明书生成探针。将DNA混合物煮沸10分钟,然后迅速在冰上冷却,之后加入4μl的DIG-High引物混合物(Roche Diagnostics Corporation,Indianapolis,IN,USA)。将反应物在37℃下孵育约20小时,之后加入2μl的0.2M EDTA,然后在65℃下加热10分钟,以使反应停止。
[0484] 使用 凝胶提取试剂盒根据制造商的操作指南纯化探针。将探针煮沸5分钟,在冰上冷却2分钟,然后加入到10ml的 DIG Easy Hyb中,产生杂交溶液。杂交在42℃下进行约17小时。然后在室温下将膜在低等严格条件下在2X SSC+0.1%SDS中洗涤5分钟,然后在65℃下在0.5X SSC+0.1%SDS中进行两次高等严格洗涤,每次15分钟。探针-靶标杂交物通过化学发光检定(Roche Diagnostics, Indianapolis,IN,USA)根据制造商说明书进行检测。DNA印迹分析表明,转化体在靶向的cbhII基因座处含有P.emersonii GH61A多肽编码序列和烟曲霉β-葡糖苷酶(Cel3A)突变体编码序列的单一拷贝。该转化体命名为里氏木霉QMJi033。
[0485] 实施例20:里氏木霉原生质体的生成和转化
[0486] 原生质体的制备和转化使用Penttila等人,1987,Gene 61:155-164 的改良操作指南进行。简言之,将里氏木霉菌株AgJg115-104-7B1 (PCT/US2010/061105;WO 2011/075677)在25ml补充有2%(w/v) 葡萄糖和10mM尿苷的YP培养基中在27℃下在90rpm轻缓震荡下培养17小时。使用真空驱动的一次性过滤系统通过过滤来收集菌丝体,并用去离子水洗涤两次,再用1.2M山梨糖醇洗涤两次。通过将洗涤的菌丝体在含有15mg 
200G/ml和0.36个单位的几丁质酶/ml的20ml 1.2M山梨糖醇中,在34℃下
在90rpm轻缓震荡下悬浮15~25分钟,生成原生质体。通过在400x g下离心7分钟收集原生质体,并将其用冷的1.2M山梨糖醇洗涤两次。将原生质体用血球计数器计数,并在STC中再悬浮至1x108原生质体/ml的最终浓度。将多余的原生质体在-80℃下储存在Cryo 1℃冷冻容器中。
[0487] 将约100μg在以下实施例中描述的转化质粒用Pme I消化。使用 TAE缓冲液通过1%琼脂糖凝胶电泳纯化消化反应物。将DNA条带从凝胶中切出,并使用 凝胶提取试剂盒进行提取。将所得的纯化DNA加入到100μl原生质体溶液中,并轻缓混合。加入PEG 缓冲液(250μl),混合,并在34℃下孵育30分钟。然后加入STC(3 ml),混合,并铺在补充有1M蔗糖的PDA平板上。在28℃下孵育16 小时之后,向各个板加入20ml补充有35μg潮霉素B/ml的覆层PDA 培养基。将平板在28℃下孵育4~7天。
[0488] 实施例21:用烟曲霉cbhI基因取代内生里氏木霉cbhI基因
[0489] 为将里氏木霉内生cbhI基因(SEQ ID NO:1[DNA序列]和SEQ ID NO:2[推导的氨基酸序列])用烟曲霉cbhI编码序列(SEQ ID NO:57 [DNA序列]和SEQ ID NO:58[推导的氨基酸序列])取代,根据实施例 20中所述的过程将里氏木霉ku70-菌株AgJg115-104-7B1 (PCT/US2010/061105;WO 2011/075677)用4x 2μg Pme I线性化的 pJfyS139(实施例11)转化。得到7个转化体,挑取每一种并转移至 PDA平板,在28℃下孵育7天。根据实施例9中所述的过程,从转化体中分离基因组DNA,并使各转化体进行DNA印迹分析。
[0490] 对于DNA印迹分析,将2μg基因组DNA在50μl反应体积中用 33个单位的Bgl II消化,并使用TAE缓冲液进行1%琼脂糖电泳。将凝胶中的DNA在0.25N HCl中经一次10分钟洗涤而脱嘌呤,在0.5N NaOH-1.5M NaCl中经两次15分钟洗涤而变性,在1M Tris pH 8-1.5M NaCl经一次30分钟洗涤而中和,并在20X SSC中孵育5分钟。使用 TURBOBLOTTERTM系统根据制造商的操作指南将DNA转移至 Supercharge膜。使用STRATALINKERTMUV交联剂将DNA UV交联到膜上,并在20ml DIG Easy Hyb中在42℃下预杂交1小时。
[0491] 使用PCR Dig探针合成试剂盒根据制造商说明书用以下所示的正向和反向引物生成与3’cbhI基因侧翼序列杂交的探针。PCR反应由1X  反应缓冲液、400nM各引物、200μM DIG标记的含有  dUTP的dNTP、20ng  pJfyS139和1.5个单位的热启动高保真DNA聚合酶组成。在
5333 epgradient S中孵育扩增反应物,程序设
定为:95℃2分钟,1个循环;每循环95℃30秒、55℃30秒和72℃40秒,25个循环;以及在72℃7 分钟,1个循环。
[0492] 正向引物:
[0493] 5’-AAAAAACAAACATCCCGTTCATAAC-3’(SEQ ID NO:99)
[0494] 反向引物:
[0495] 5’-AACAAGGTTTACCGGTTTCGAAAAG-3’(SEQ ID NO:100)
[0496] 使用TAE缓冲液通过1%琼脂糖凝胶电泳纯化探针,其中将与探针对应的0.5kb条带从凝胶中切出,并使用 凝胶提取试剂盒进行提取。将探针煮沸5分钟,在冰上冷却2分钟,然后加入到 10ml DIG Easy Hyb中,产生杂交溶液。杂交在42℃下进行15~17小时。然后在室温下将膜在低等严格条件下在2X SSC+0.1%SDS中洗涤5分钟,然后在
65℃下在0.5X SSC+0.1%SDS中进行两次高等严格洗涤,每次15分钟。探针-靶标杂交物通过化学发光检定(Roche Diagnostics,Indianapolis,IN,USA)根据制造商说明书进行检测。DNA 印迹分析表明,7个转化体中的3个在cbhI基因座处含有取代盒,选择一个转化体里氏木霉JfyS139-8用于消除hpt和tk标记物。
[0497] 通过将在28℃下生长的七日龄PDA平板的孢子转移至PDA平板,并在28℃下孵育7天,生成新鲜的孢子平板。使用无菌涂布器将孢子收集在10ml 0.01% 20中。使用血球计数器测定孢子浓度,将105孢子铺在含有补充有1μM 5-氟-2'-脱氧尿苷(FdU)的TrMM-G 培养基的150mm板上。
[0498] 得到300个FDU抗性的孢子分离株,如上所述从2个孢子分离株中提取DNA。如上所述将分离株进行DNA印迹分析,结果表明两个孢子分离株均已切除在取代盒的同源重复序列之间的hpt/tk区。选择命名为里氏木霉JfyS139-8A的一个菌株用于取代cbhII基因。
[0499] 实施例22:用烟曲霉cbhII基因取代内生里氏木霉cbhII基因
[0500] 为将里氏木霉天然cbhII基因用烟曲霉cbhII编码序列取代,根据实施例20中所述的过程将里氏木霉JfyS139-8A(实施例21)用2μg Pme I线性化并经凝胶纯化的pJfyS144(实施例10)转化。得到7个转化体,挑取每一个并转移至PDA平板,在28℃下孵育7天。使用下文所述的真菌孢子PCR法来筛选携带基因取代的转化体,使用以下所示的与整合区外的5’cbhII基因侧翼序列的上游区进行退火的正向引物,以及以下所示的用于烟曲霉cbhII编码序列的反向引物。
[0501] 正向引物:
[0502] 5’-AGCCACATGCCGCATATTGACAAAG-3’(SEQ ID NO:101)
[0503] 反向引物:
[0504] 5’-AGGGATTCAGTGTGCTACAGGCTGC-3’(SEQ ID NO:102)
[0505] 只有当在cbhII基因座处发生精确基因取代时,才会产生大约1.8 kb的PCR产物。如果盒已经整合在基因组中的别处,则不会发生扩增。
[0506] 将来自各转化体的少量孢子悬浮在25μl TE缓冲液中,并在微波炉中高温加热1分钟。使用各个微波过的孢子悬浮液作为PCR反应中的模板。反应由1μl微波过的孢子悬浮液、1μl的10mM dNTP、12.5 μl的2X  GC-Melt LA悬浮液(Clontech,Mountain 
View, CA,USA)、25pmol正向引物、25pmol反向引物、1.25个单位的 GC 
Genomic LA聚合酶混合物(Clontech,Mountain View,CA,USA)和9.25μl水组成。在
5333epgradient S中孵育反应物,程序设定为: 
95℃10分钟,1个循环;每循环95℃30秒、56℃30秒和72℃1分40 秒,35个循环;以及72℃7分钟,1个循环;以及保持在4℃。使用 TAE缓冲液使PCR反应物进行1%琼脂糖凝胶电泳。孢子PCR表明, 7个转化体中的4个在靶向的基因座处含有取代盒,对其中的3个进行 DNA印迹分析,以确认取代盒是单个拷贝。
[0507] 根据实施例9中所述的过程,从3个转化体中分离基因组DNA,并对各个转化体进行DNA印迹分析。对于DNA印迹分析,将2μg基因组DNA在50μl反应体积中用50个单位的Dra I消化,并使用TAE 缓冲液使其进行1%琼脂糖电泳。将凝胶中的DNA在0.25N HCl中以一次10分钟洗涤进行脱嘌呤,在0.5N NaOH-1.5M NaCl中以两次15 分钟洗涤进行变性,在1M Tris pH 8-1.5M NaCl中以1次30分钟洗涤进行中和,并在20X SSC中孵育5分钟。将DNA转移至 Supercharge膜。使用STRATALINKERTMUV交联剂将DNA UV交联到膜上,并在
20ml DIG Easy Hyb中在42℃下预杂交1小时。
[0508] 使用PCR Dig探针合成试剂盒根据制造商说明书,用以下示出的正向和反向引物生成与3’cbhII基因侧翼序列杂交的探针。PCR反应由 1X  反应缓冲液、400nM各引物、200μM DIG标记的含有dUTP的dNTP、150ng里氏木霉RutC30基因组DNA和1.5个单位的 热启动高保真DNA聚合酶组成。在
5333epgradient S中孵育反应物,程序设定为: 95℃2分钟,1个循
环;每循环95℃30秒、51℃30秒和72℃40秒,30 个循环;以及72℃7分钟,1个循环。
[0509] 正向引物:
[0510] 5’-AAAAAACAAACATCCCGTTCATAAC-3’(SEQ ID NO:103)
[0511] 反向引物:
[0512] 5’-AACAAGGTTTACCGGTTTCGAAAAG-3’(SEQ ID NO:104)
[0513] 使用TAE缓冲液通过1%琼脂糖凝胶电泳纯化探针,其中将与探针对应的0.5kb条带从凝胶中切出,并使用 凝胶提取试剂盒进行提取。将探针煮沸5分钟,在冰上冷却2分钟,并加入到10ml DIG Easy Hyb中,产生杂交溶液。杂交在42℃下进行约17小时。然后在室温下将膜在低等严格条件下在2X SSC+0.1%SDS中洗涤5分钟,然后在65℃下在0.5X SSC+0.1%SDS中进行两次高等严格洗涤,每次15分钟。探针-靶标杂交物通过化学发光检定(Roche Diagnostics, Indianapolis,IN,USA)根据制造商说明书进行检测。DNA印迹分析表明,3个转化体在cbhII基因座处含有取代盒,选择所有三个(命名为 JfyS139/
144-5、-6和-10)用于消除hpt和tk标记物。
[0514] 通过将在28℃下在PDA平板上生长的七日龄培养物的塞子转移至新的PDA平板,并在28℃下孵育7天,生成新鲜的孢子平板。使用无菌涂布器将孢子收集在10ml 0.01%20中。使用血球计数器测定孢子浓度,将105和104孢子铺在含有补充有1μM FdU的 TrMM-G培养基的150mm平板上。
[0515] 从含有105孢子的平板中得到各个转化体的约500个FdU抗性的孢子分离株,从含有104孢子的平板中针对各转化体分离约100个FdU 抗性的孢子分离株。对于菌株JfyS139/144-5和-6,挑取8个孢子分离株,对于菌株JfyS139/144-10,挑取4个。将来自初级转化体5的各分离株1~8命名为JfyS139/144-5A至-5H。将来自初级转化体6的分离株 1~8命名为JfyS139/144-6A至-6H。将来自初级转化体10的分离株1~4 命名为JfyS139/144-10A至-
10D。使用以下所示的正向和反向引物如上所述进行孢子PCR,以确认hpt和tk标记物已经被正确切除。
[0516] 正向引物:
[0517] 5’-GTTAAGCATACAATTGAACGAGAATGG-3’(SEQ ID NO: 105)
[0518] 反向引物:
[0519] 5’-GATGATATAATGGAGCAAATAAGGG-3’(SEQ ID NO:106)
[0520] 如上所述用以下循环参数进行PCR反应:95℃2分钟,1个循环;每个循环为95℃30秒、55℃30秒和72℃6分钟,30个循环;以及72℃ 7分钟,1个循环。
[0521] 引物与用于cbhII基因取代的5’(正向)和3’(反向)侧翼序列进行退火。已经将hpt/tk盒正确切除的菌株将会显示3.5kb片段,而标记物完整的那些则显示8kb片段。PCR筛选表明,所有的孢子分离株均已正确切除hpt/tk盒。
[0522] 从各初级转化体的A和B孢子分离株提取DNA,并如上所述对其进行DNA印迹分析。DNA印迹分析证实,各个孢子分离株均已正确切除了hpt/tk盒。选择孢子分离株里氏木霉JfyS139/144-10B来代表含有里氏木霉cbhI和cbhII基因二者均分别被烟曲霉同源物取代的菌株。
[0523] 实施例23:里氏木霉ku70基因修复质粒pTH239的生成
[0524] 使用 Advantage PCR克隆试剂盒将4个DNA片段结合,以生成用内生里氏木霉ku70编码序列(SEQ ID NO:107[DNA序列]和SEQ ID NO:108[推导的氨基酸序列])取代被破坏的里氏木霉 ku70编码序列的构建体。使用以下所示的序列特异性正向和反向引物 (SEQ ID NO:109和110)从pJfyS139-B(实施例11)扩增包含原核复制原点的氨苄青霉素抗性标记物区。使用以下所示的序列特异性正向和反向引物(SEQ ID NO:111和112)从里氏木霉981-O-8基因组 DNA扩增里氏木霉ku70基因上游序列(由来自ku70编码序列上游的 989bp和ku70编码序列的前1010bp组成)。使用以下所示的序列特异性正向和反向引物(SEQ ID NO:113和114)从里氏木霉981-O-8基因组DNA扩增里氏木霉ku70基因下游序列(由从在上游PCR产物中扩增的ku70编码序列的1010 bp片段3’端重复出的500 bp片段、含有ku70 编码序列其余部分的1067 bp片段和来自ku70编码序列下游的461 bp 组成)。根据实施例9中所述的过程来制备里氏木霉981-O-8基因组 DNA。
[0525] 正向引物:
[0526] 5’-GTGTGCGGCCGCTCGAGCATGCATGTTTAAACAGCTTGGC ACTGGCCGTCGTTTT-3’(SEQ ID NO:109)
[0527] 反向引物:
[0528] 5’-ATCAGCCCCGAGACGGCGCCGCGTTTAAACAATTCGTAAT CATGGTCATAGCTGT-3’(SEQ ID NO:110)
[0529] 正向引物:
[0530] 5’-CATGATTACGAATTGTTTAAACGCGGCGCCGTCTCGGGGC TGATCTTGTCGAGGA-3’(SEQ ID NO:111)
[0531] 反向引物:
[0532] 5’-GGCGGCCGTTACTAGTGGATCCAGCCCTTGACAGTGATCT TGAGTCCAGGTGCAA-3’(SEQ ID NO:112)
[0533] 正向引物:
[0534] 5’-TGCAGATATCCATCACACTGGCGGCCGCAGTTTCCATGTCC AACGTGTTGTTTTGCGC-3’(SEQ ID NO:113)
[0535] 反向引物:
[0536] 5’-GCCAGTGCCAAGCTGTTTAAACATGCATGCTCGAGCGGCC GCACACGCCCTCTCCTCG-3’(SEQ ID NO:114)
[0537] 对于氨苄青霉素抗性标记物和原核复制原点区的扩增,反应由100 ng里氏木霉981-O-8基因组DNA、200μM dNTP、1μM各引物(SEQ ID NO:109和110)、1X  高保真热启动DNA聚合酶缓冲液和1.0个单位的 高保真热启动DNA聚合酶组成,最
终体积为50μl。在 5333 epgradient S中孵育扩
增反应物,程序设定为:98℃30秒,1个循环;每循环98℃10 秒,55℃30秒和72℃1分30秒,30个循环;以及72℃7分钟,1个循环。使用TAE缓冲液通过1%琼脂糖凝胶电泳分离PCR产物,其中将 2.692 kb片段从凝胶中切出,并使用 凝胶提取试剂盒进行提取。
[0538] 对于ku70基因上游序列和下游序列的扩增,反应由100ng pJfyS139-B、200μM dNTP、1μM各引物(SEQ ID NO:111和112或者113和114)、1X  高保真热启动DNA聚合酶缓冲液和1.0 个单位的 高保真热启动DNA聚合酶组成,最终体积为50 μl。在 5333epgradient S中孵育扩增反应物,程序设定为:98℃30秒,1个循环;每循环98℃10秒,55℃ 30秒和72℃1分30秒,30个循环;以及
72℃7分钟,1个循环。使用 TAE缓冲液通过1%琼脂糖凝胶电泳分离PCR产物,其中分别将
1.999 kb和2.028kb的片段从凝胶中切出,并使用 凝胶提取试剂盒进行提
取。
[0539] 从使用Not I和Bam HI的pJfyS139-B的限制性内切酶消化中产生第4个DNA片段。反应由5μg pJfyS139-B、10个单位的Not I、20个单位的Bam HI和20μl限制性内切酶缓冲液
2(New England Biolabs, Inc.,Ipswich,MA,USA)组成,总体积为50μl。将反应物在37℃下孵育1小时,然后使用TAE缓冲液通过1%琼脂糖凝胶电泳分离,其中将4.400kb片段从凝胶中切出,并使用 凝胶提取试剂盒进行提取。
[0540] 使用 Advantage PCR克隆试剂盒根据制造商的操作指南将2,028bp、1,999bp和2,692bp的三种PCR产物插入到Not I和 Bam HI消化的pJfyS139-B中。
反应由1X  反应缓冲液、50ng  Not I/Bam  HI消化的
pJfyS139-B、50ng 1.999kb ku70 基因上游PCR产物、50ng 2.028kb ku70基因下游PCR产物、50ng 2.692 kb氨苄青霉素抗性标记物和原核复制原点PCR产物和1μl 
酶组成,反应体积为10μl。反应物在37℃下孵育15分钟,然后在50℃下孵育15分钟。孵育期之后,向反应物中加入40μl TE。使用3μl等份根据制造商的操作指南来转化大肠杆菌XL10感受态细胞(Stratagene,La Jolla,CA,USA)。将细胞在42℃下热击30秒,然后加入500μl预热至42℃的NZY+培养基。将管在37℃下以200rpm 震摇孵育40分钟,然后铺在直径150mm的2XYT+氨苄青霉素平板上,在37℃下孵育过夜。通过用Hind III和Xba I进行限制性酶切消化分析,筛选所得的转化体,并对阳性克隆进行测序,以确保不存在PCR错误。识别出包含没有PCR错误的插入的一个克隆,并将其命名为pTH239。
[0541] 实施例24:烟曲霉cbh1和cbh2取代菌株JfyS139/144-10B中ku70基因的修复[0542] 在菌株里氏木霉JfyS139/144-10B(实施例22)中对内生里氏木霉 ku70基因进行修复,以促进需要ku70基因在非同源性末端结合中的功能的菌株操纵步骤。根据实施例4中所述的过程,将里氏木霉 JfyS129/144-10B用23x 2μg Pme I线性化的pTH239(实施例23)进行转化。得到19个转化体,将各个分别转移至PDA平板,并在28℃下孵育7天。
[0543] 通过PCR来筛选所有19个转化体,以确认pTH239Pme I片段在破坏的ku70基因基因座处的同源整合。对于各个转化体,使用无菌接种环从7日龄PDA平板中收集孢子。将孢子转移至含有25μl 1mM EDTA-10mM Tris缓冲液的试管,并用高功率微波处理1分钟。将1μl 等份的微波处理过的孢子混合物直接加入到PCR反应中作为模板 DNA。设计以下所示的一组PCR引物,以跨越ku70编码序列的破坏区进行扩增,从而区分具有ku70编码序列中的破坏的宿主基因组(848 bp)与pTH239靶向目标菌株(606bp)。PCR反应由1X   Genomic LA聚合酶反应缓冲液(Clontech,Mountain View,CA,USA)、 400nM各引物、200μM dNTP、1μl微波处理过的TE-孢子混合物(如上所述)和1.0个单位的
Genomic  LA聚合酶(Clontech,  Mountain  View,CA ,USA)组成。在
 5333epgradient S中孵育扩增反应物,程序设
定为:95℃10分钟,1个循环;每循环95℃30秒,55℃30秒和72℃60秒,30个循环;以及72℃ 7分钟,1个循环。
[0544] 正向引物:
[0545] 5’-CAATGACGATCCGCACGCGT-3’(SEQ ID NO:115)
[0546] 反向引物:
[0547] 5’-CAATGACGATCCGCACGCGT-3’(SEQ ID NO:116)
[0548] 仅19个转化体中的1个(#19)对于606bp PCR产物为阳性且对 848bp PCR产物为阴性,表明为包含同源整合在ku70基因座处的pTH239PmeI片段的菌株。
[0549] 使用无菌涂布器,将来自转化体#19的七日龄PDA平板的孢子收集在10ml 0.01%20中。使用血球计数器确定孢子浓度,将 106孢子铺在含有补充有1μM 5-氟-
2'-脱氧尿苷(FdU)的TrMM-G培养基的150mm平板上,并在28℃下培养5天。得到22个FdU抗性的孢子分离株,将其转化至PDA平板,并在28℃下培养5天。
[0550] 针对存在于修复盒内的在ku70编码序列的同源重复之间的hpt/tk 标记物区的切除,通过PCR筛选所有22个孢子分离株(#19A-V)。对于各个孢子分离株,使用无菌接种环从7日龄PDA平板中收集孢子。将孢子转移至含有25μl 1mM EDTA-10mM Tris缓冲液的试管,并用高功率微波处理1分钟。将1μl等份的孢子混合物直接加入到PCR反应中作为模板基因组DNA。设计以下所示的一组PCR引物,以跨越 hpt/tk区进行扩增,以区分hpt/tk区的存在(6kb)或不存在(1.1kb)。 PCR反应由1X  Genomic LA聚合酶反应缓冲液、400 nM各引物(以下所示)、200μM dNTP、1μl微波处理过的TE-孢子混合物(如上所述)和1.0个单位的 Genomic LA聚合酶组成。在
5333epgradient S中孵育扩增反应物,程序设定
为:95℃10分钟,1个循环;每循环95℃30秒, 50℃30秒和72℃6分钟,30个循环;以及72℃7分钟,1个循环。
[0551] 正向引物:
[0552] 5’-GACACTCTTTTCTCCCATCT-3’(SEQ ID NO:117)
[0553] 反向引物:
[0554] 5’-GAGGAGCAGAAGAAGCTCCG-3’(SEQ ID NO:118)
[0555] 所有22个孢子分离株对于与hpt/tk标记物区对应的6kb PCR产物均为阴性。
[0556] 使用无菌涂布器,将来自分离株#19A和#19L的七日龄PDA平板的孢子收集在10ml 0.01% 20中。使用血球计数器确定孢子浓度,将103、102和101孢子铺在含有1M蔗糖的150mm PDA平板上,在28℃下培养3天。从菌株#19A和#19L的PDA平板选择10个孢子分离株,并转移至新鲜PDA平板,置于28℃下。
[0557] 根据实施例9中所述的过程从#19L和#19A的6个孢子分离株中提取基因组DNA,并对其进行DNA印迹分析。
[0558] 对于DNA印迹分析,将2μg基因组DNA在50μl反应体积中用 (1)分别5个单位和10个单位的Asc I和Xho I或(2)分别5个单位和25个单位的Asc I和Apa I消化,并使用TAE缓冲液进行1%琼脂糖电泳。将凝胶中的DNA在0.25N HCl以一次10分钟洗涤进行脱嘌呤,在0.5N NaOH-1.5M NaCl中以两次15分钟洗涤进行变性,在1M Tris pH 8-1.5M NaCl中以一次30分钟洗涤进行中和,并在20X SSC中孵育5分钟。使用TURBOBLOTTERTM系统根据制造商的操作指TM南将 DNA转移至 Supercharge膜。使用STRATALINKER UV 交联剂将DNA经UV交联到膜上,并在20ml DIG Easy Hyb中在42℃下预杂交1小时。
[0559] 使用PCR Dig探针合成试剂盒根据制造商说明书用以下所示的正向和反向引物生成与ku70编码序列的3’端杂交的探针。为生成纯的用于探针PCR反应的模板,从里氏木霉981-O-8基因组DNA扩增ku70 编码序列的3’端。PCR反应由1X  高保真热启动DNA聚合酶缓冲液、1μM各引物、200μM dNTP、165ng里氏木霉981-O-8基因组DNA和1.0个单位的 高保真热启动DNA聚合酶组成。在
5333epgradient S中孵育扩增反应物,程序设定
为:98℃30秒,1个循环;每循环98℃10秒、60℃30 秒和72℃15秒,35个循环;以及72℃10分钟,1个循环。
[0560] 正向引物:
[0561] 5’-gcatatataacccactcaagta-3’(SEQ ID NO:119)
[0562] 反向引物:
[0563] 5’-attatcttggaccggccgcagg-3’(SEQ ID NO:120)
[0564] 使用TAE缓冲液通过1%琼脂糖凝胶电泳纯化0.5kb探针模板,并将其从凝胶中切出,使用 凝胶提取试剂盒进行提取。使用上述的引物和扩增条件,如制造商说明书所述,使用纯化的PCR 产物生成DIG标记的探针。使用TAE缓冲液通过1%琼脂糖凝胶电泳纯化0.5kb DIG标记的探针,并将其从凝胶中切出,使用 凝胶提取试剂盒进行提取。将探针煮沸5分钟,在冰上冷却2分钟,并加入到10ml DIG Easy Hyb中,产生杂交溶液。杂交在42℃下进行15~17小时。然后在室温下将膜在低等严格条件下在2X SSC+
0.1% SDS中洗涤5分钟,然后在65℃下在0.5X SSC+0.1%SDS中进行两次高等严格洗涤,每次15分钟。探针-靶标杂交物通过化学发光检定 (Roche Diagnostics,Indianapolis,IN,USA)根据制造商说明书进行检测。DNA印迹分析表明,所有孢子分离株均在ku70基因座处含有修复 /取代盒,并消除了hpt和tk标记物。选择命名为里氏木霉 981-O-8.5#10B+Ku70#
19L3的一个菌株,用于进一步的转化。
[0565] 实施例25:里氏木霉981-O-8.5#10B+Ku70#19L3原生质体的生成和转化[0566] 原生质体的制备和转化使用Penttila等人,1987,Gene 61:155-164 的改良方案进行。简言之,将里氏木霉菌株981-O-8.5#10B+Ku70#19L3 在25ml补充有2%(w/v)葡萄糖和10mM尿苷的YP培养基中在27℃下在90rpm轻缓震荡下培养17小时。使用真空驱动的一次性过滤系统通过过滤收集菌丝体,并用去离子水洗涤两次,用1.2M山梨糖醇洗涤两次。通过将洗涤过的菌丝体在含有15mg  200G/ml 和0.36个单位的几丁质酶/ml的20ml 1.2M山梨糖醇中在34℃下随90 rpm轻缓震荡悬浮15~25分钟。通过在400x g离心7分钟收集原生质体,并将其用冷的1.2M山梨糖醇洗涤两次。将原生质体用血球计数器计数,并再悬浮在STC中至最终浓度为1x108原生质体/ml。将过量的原生质体在-80℃下储存在Cryo 
1℃冷冻容器中。
[0567] 将约100μg质粒pAmFs074用Pme I消化。使用TAE缓冲液通过 0.8%琼脂糖凝胶电泳纯化消化反应物。将含有表达盒的约9.4kb DNA 条带从凝胶中切出,上述表达盒包含Penicillium emersonii GH61A多肽编码序列、烟曲霉β-葡糖苷酶突变体编码序列和amdS标记物,并使用 凝胶提取试剂盒根据制造商建议的操作指南进行提取。
[0568] 将所得的9.4kb片段(5x 2μg或2x 3.5μg的9.4kb Pme I消化的 pAmFs074)加入到100μl原生质体溶液中,并轻缓混合。加入PEG 缓冲液(250μl),将反应物混合,并在34℃下孵育30分钟。然后加入 STC(3ml),将反应物混合,然后铺在用于amdS选择的COVE平板上。将平板在28℃下孵育6~11天。
[0569] 实施例26:对摇瓶中里氏木霉转化体进行Penicillium emersonii GH61A多肽和烟曲霉β-葡糖苷酶变体的表达的评价
[0570] 使用接种环将112个里氏木霉981-O-8.5#10B+Ku70#19L3转化体从COVE转化平板转移至补充有10mM尿苷的COVE2平板,并在28℃下孵育5~7天。用接种环收集孢子,并将其转移至125ml塑料摇瓶中的25ml CIM培养基中。将摇瓶培养物在28℃、200rpm下孵育5天。将约14~15ml的各培养物倒入15ml试管中。将试管在863x g下离心 20分钟。将上清液倾倒到新的试管中。使用 3000、  NX和 机械臂(Beckman Coulter,Inc,Fullerton,CA,USA)对上清液进行β-葡糖苷酶活性的检定。将上清液适当稀释于0.1M琥珀酸盐、0.01% X-100(4-(1,1,3,3-四甲基丁基)苯基-聚乙二醇) 缓冲液pH 5.0(样本缓冲液)中,然后将稀释的样本连续稀释0倍至 1/3倍至1/9倍。将共20μl的各稀释液共计转移至96孔平底板。向各孔中加入200微升于0.1M琥珀酸盐pH 5.0缓冲液中的1mg/ml对硝基苯基-β-D-吡喃葡糖苷底物,然后在环境温度下孵育45分钟。孵育期一结束,向各孔中加入50μl的淬灭缓冲液(1M Tris pH 9)。对于96 孔板,在405nm的光密度处测量终点。通过SDS-PAGE对33个示出大于16,000μM/min/ml的活性的样本进行分析,以确定GH61多肽的表达。
[0571] 使用 8~16%Tris-HCl凝胶根据制造商说明书经 SDS-PAGE对10μTM
l的各培养上清液进行分析。将所得的凝胶用 BIO-SAFE 考马斯染色。培养物的SDS-PAGE图谱示出,转化体产生与烟曲霉β-葡糖苷酶变体对应的约130kDa、以及与Penicillium emersonii GH61A GH61A多肽对应的约27kDa的主要蛋白条带。基于 SDS-PAGE图谱上GH61A多肽的表达,选择21个转化体,用于进一步的孢子纯化和分析。
[0572] 孢子纯化的进行是通过用1μl接种环接触孢子平板,之后将环浸在1ml 0.01%20中,然后进行涡旋。将1微升和10微升的该孢子混合物与100μl 0.01%
20混合,并铺在大的COVE 平板上。将平板在28℃下孵育,直至在板上出现单个的孢子分离株。
[0573] 将所有21个候选物的单个孢子分离株均转移至COVE2+10mM 尿苷平板,并在28℃下孵育约1周,之后接种至含有25ml CIM培养基的125ml塑料摇瓶。如上所述通过SDS-PAGE对所得的摇瓶培养物进行分析,并与初级转化体的摇瓶培养物进行比较。选择6个孢子纯化的转化体,即597A、676D、679C、680A、683A和686C,用于2 升发酵,以测定收率。
[0574] 实施例27:发酵
[0575] 将前6个孢子纯化的里氏木霉981-O-8.5#10B+Ku70#19L3转化体 (597A、676D、679C、680A、683A和686C)和里氏木霉QMJi033 在28℃下在PDA平板上培养约1周。
[0576] 摇瓶培养基由20g右旋糖、10g玉米浆冻干粉、1.45g(NH4)2SO4、 2.08g KH2PO4、0.36g CaCl2、0.42g MgSO4·7H2O和0.42ml痕量金属溶液组成。痕量金属溶液由216g FeCl3·6H2O、58g ZnSO4·7H2O、27g MnSO4·H2O、10g CuSO4·5H2O、2.4g H3BO3、336g柠檬酸和加至1 升的去离子水组成。
[0577] 将100ml摇瓶培养基加入到500ml摇瓶中。用两个塞子从固体平板培养物接种摇瓶,并在28℃下在定轨摇床上在200rpm下孵育48小时。使用50ml摇瓶肉汤来接种2升的发酵容器
[0578] 分批发酵培养基每升由30g纤维素、4g右旋糖、10g玉米浆冻干粉、3.8g(NH4)2SO4、2.8g KH2PO4、2.64g CaCl2、1.63g MgSO4.7H2O、 1.8ml消泡剂和0.66ml痕量金属溶液组成。
痕量金属溶液每升由216g FeCl3·6H2O、58g ZnSO4·7H2O、27g MnSO4·H2O、10g CuSO4·
5H2O、 2.4g H3BO3和336g柠檬酸组成。发酵进料培养基由右旋糖组成。
[0579] 将共1.8升的分批发酵培养基加入到 3升玻璃夹套发酵罐(Applikon Biotechnology Inc.,Foster City CA USA)中。将发酵进料培养基以0~4g/l/hr的速率给予185小时的时间段。将发酵容器保持在28℃温度下,使用 1030
控制系统(Applikon Biotechnology Inc.,Foster City CA USA)将pH控制在4.5+/-0.1的设定点。以1vvm的速率将空气加入至容器中,通过以1100~1300rpm转动的Rushton桨搅动肉汤。发酵结束时,从容器中收获全部肉汤,并在 3000x g下离心,以除去生物质。将上清液无菌过滤,并在5~10℃下储存。
[0580] 实施例28:对2升发酵肉汤中的里氏木霉转化体进行Penicillium emersonii GH61A多肽和烟曲霉β-葡糖苷酶变体在2升发酵肉汤中表达的评价
[0581] 通过SDS-PAGE对前6个孢子纯化的里氏木霉 981-O-8.5#10B+Ku70#19L3转化体(597A、676D、679C、680A、683A 和686C)和里氏木霉QMJi033的发酵肉汤进行分析,以评价Penicillium emersonii GH61A多肽和烟曲霉β-葡糖苷酶变体的表达水平。将0.5μl 体积的各菌株的发酵肉汤上清液与25μl去离子水以及25μl含有5%2- 巯基乙醇的Laemmli染料(Bio-Rad Laboratories,Hercules,CA,USA) 混合。将混合物在95℃加热5分钟,将10μl(相当于0.1μl发酵肉汤) 根据制造商说明书装载在不含染料的 8~16%Tris-HCl凝胶(Bio-Rad Laboratories,Hercules,CA,USA)上。将凝胶在200伏特下跑大约55分钟,然后通过Gel DocTMEZ成像器(Bio-Rad Laboratories, Hercules,CA,USA)分析。发酵肉汤上清液的SDS-PAGE图谱示出,里氏木霉QMJi033中Penicillium emersonii GH61A多肽和烟曲霉β-葡糖苷酶变体的表达与前6个里氏木霉981-O-8.5#10B+Ku70#19L3转化体(597A、
676D、679C、680A、683A和686C)是相当的。
[0582] 通过以下编号的段落对本发明进行进一步的说明:
[0583] [1]一种构建用于产生具有生物活性的多种重组多肽的丝状真菌菌株的方法,其包括:(a)通过向丝状真菌菌株中导入第一串联构建体,通过靶向整合取代内源性第一基因,该第一串联构建体包含(i) 第一基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)第一基因的同源3’区、其同源侧翼区或其组合;(b)通过向丝状真菌菌株中导入第二串联构建体,通过靶向整合取代内源性第二基因,该第二串联构建体包含(i)第二基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第二可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)第二基因的同源3’区、其同源侧翼区或其组合;或(c)(a)和(b)的组合。
[0584] [2]段落1的方法,其中第一基因是纤维二糖水解酶I基因。
[0585] [3]段落2的方法,其中纤维二糖水解酶I基因编码选自以下的纤维二糖水解酶I:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶 I;(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少
85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I; (iii)由包含与SEQ ID NO:1的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少
95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I;和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I。
[0586] [4]段落1的方法,其中第二基因是纤维二糖水解酶II基因。
[0587] [5]段落4的方法,其中纤维二糖水解酶II基因编码选自以下的纤维二糖水解酶II:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II;(ii)包含与SEQ ID NO:4的成熟多肽具有至少70%,例如至少 75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少 85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少 91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少 97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II;(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少
86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II;和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
[0588] [6]段落1~5中任一段的方法,其中各个串联构建体通过同源重组整合到丝状真菌菌株的染色体中。
[0589] [7]段落1~6中任一段的方法,其中第一基因的同源5’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[0590] [8]段落1~7中任一段的方法,其中第一基因的同源3’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[0591] [9]段落1~8中任一段的方法,其中第二基因的同源5’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[0592] [10]段落1~9中任一段的方法,其中第二基因的同源3’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[0593] [11]段落1~10中任一段的方法,其还包括通过向丝状真菌菌株中导入针对各个基因的对应串联构建体各自经靶向整合取代一个或多个其他内源性基因,该串联构建体包含:(i)基因的同源5’区、其同源侧翼区或其组合;(ii)一个或多个可选择性标记物;(iii)与启动子和终止子可操作连接的编码具有生物活性的多肽的多核苷酸;(iv)与另一启动子和另一终止子可操作连接的编码具有生物活性的另一多肽的另一多核苷酸;和(v)基因的同源3’区、其同源侧翼区或其组合。
[0594] [12]段落1~11中任一段的方法,其中一个或多个串联构建体还包含一个或多个可选择性标记物的5’侧翼的第一同源重复和一个或多个可选择性标记物的3’侧翼的第二同源重复,其中第一同源重复和第二同源重复进行同源重组,以切除一个或多个可选择性标记物。
[0595] [13]段落12的方法,其中第一和第二同源重复是相同的,或者彼此具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的的序列同一性。
[0596] [14]段落12或13的方法,其中第一和第二同源重复各自为至少 50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[0597] [15]段落12~14中任一段的方法,其中在切除一个或多个可选择性标记物时,一个或多个可选择性标记物可以再用于将针对各个基因的对应串联构建体各自通过靶向整合来取代一个或多个其他内源性基因。
[0598] [16]段落1~15中任一段的方法,其还包括将丝状真菌宿主细胞用串联构建体转化,该串联构建体包含:(i)一个或多个可选择性标记物; (ii)与第五启动子和第五终止子可操作连接的编码具有生物活性的第五多肽的第五多核苷酸;和(iii)与第六启动子和第六终止子可操作连接的编码具有生物活性的第六多肽的第六多核苷酸,其中该串联构建体通过异位整合而整合。
[0599] [17]段落1~16中任一段的方法,其中具有生物活性的多肽是不同的多肽。
[0600] [18]段落1~16中任一段的方法,其中两个或更多个具有生物活性的多肽是相同的多肽。
[0601] [19]段落1~18中任一段的方法,其中启动子是不同的启动子。
[0602] [20]段落1~18中任一段的方法,其中两个或更多个启动子是相同的启动子。
[0603] [21]段落1~20中任一段的方法,其中终止子是不同的终止子。
[0604] [22]段落1~20中任一段的方法,其中两个或更多个终止子是相同的终止子。
[0605] [23]段落1~22中任一段的方法,其中一个或多个串联构建体包含在表达载体中。
[0606] [24]段落1~23中任一段的方法,其中丝状真菌菌株是枝顶孢属、曲霉属、短梗霉属、黑管菌属、拟蜡霉属、金孢属、鬼伞属、革盖菌属、隐球菌属、线黑粉酵母属、镰孢菌属、腐质霉属、巨座壳属、毛霉属、毁丝菌属、新美鞭菌属、脉孢菌属、拟青霉属、青霉属、平革菌属、白腐菌属、梨囊鞭菌属、侧耳属、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属或木霉属菌株。
[0607] [25]段落24的方法,其中木霉属菌株选自哈茨木霉、康氏木霉、长梗木霉、里氏木霉或绿色木霉。
[0608] [26]段落24的方法,其中木霉属菌株是里氏木霉。
[0609] [27]一种丝状真菌菌株,根据段落1~26中任一段的方法得到。
[0610] [28]一种丝状真菌菌株,其包含:(a)通过靶向整合用第一串联构建体取代的内源性第一基因,该第一串联构建体包含(i)第一基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)第一基因的同源3’区、其同源侧翼区或其组合;(b)通过靶向整合用第二串联构建体取代的内源性第二基因,该第二串联构建体包含(i)第二基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)第二基因的同源3’区、其同源侧翼区或其组合;或(c)(a)和(b)的组合。
[0611] [29]段落28的丝状真菌菌株,其中第一基因是纤维二糖水解酶I 基因。
[0612] [30]段落29的丝状真菌菌株,其中纤维二糖水解酶I基因编码选自以下的纤维二糖水解酶I:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I;(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I;(iii)由包含与SEQ ID NO:1的成熟多肽编码序列具有至少 
70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少
86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I;和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I。
[0613] [31]段落28的丝状真菌菌株,其中第二基因是纤维二糖水解酶II 基因。
[0614] [32]段落31的丝状真菌菌株,其中纤维二糖水解酶II基因编码选自以下的纤维二糖水解酶II:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II;(ii)包含与SEQ ID NO:4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II;(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少 70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少
85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II;和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
[0615] [33]段落28~32中任一段的丝状真菌菌株,其中各个串联构建体通过同源重组整合到丝状真菌菌株的染色体中。
[0616] [34]段落28~33中任一段的丝状真菌菌株,其中第一串联构建体的第一基因的同源5’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[0617] [35]段落28~34中任一段的丝状真菌菌株,其中第一串联构建体的第一基因的同源3’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[0618] [36]段落28~35中任一段的丝状真菌菌株,其中第二串联构建体的第二基因的同源5’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[0619] [37]段落28~36中任一段的丝状真菌菌株,其中第二串联构建体的第二基因的同源3’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[0620] [38]段落28~37中任一段的丝状真菌菌株,其还包含一个或多个各自通过靶向整合用针对各基因的对应串联构建体取代的其他内源性基因,该串联构建体包含:(i)基因的同源5’区、其同源侧翼区或其组合;(ii)一个或多个可选择性标记物;(iii)与启动子和终止子可操作连接的编码具有生物活性的多肽的多核苷酸;(iv)与另一启动子和另一终止子可操作连接的编码具有生物活性的另一多肽的另一多核苷酸;和(v)基因的同源3’区、其同源侧翼区或其组合。
[0621] [39]段落28~38中任一段的丝状真菌菌株,其中一个或多个串联构建体还包含一个或多个可选择性标记物的5’侧翼的第一同源重复和一个或多个可选择性标记物的3’侧翼的第二同源重复,其中第一同源重复和第二同源重复进行同源重组,以切除一个或多个可选择性标记物。
[0622] [40]段落39的丝状真菌菌株,其中第一和第二同源重复是相同的,或者彼此具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的的序列同一性。
[0623] [41]段落39或40的丝状真菌菌株,其中第一和第二同源重复各自为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少 800bp、至少1000bp、至少1500bp或至少2000bp。
[0624] [42]段落39~41中任一段的丝状真菌菌株,其中在切除一个或多个可选择性标记物时,一个或多个可选择性标记物可以再用于将针对各个基因的对应串联构建体各自通过靶向整合来取代一个或多个其他内源性基因。
[0625] [43]段落28~42中任一段的丝状真菌菌株,其还包含串联构建体,该串联构建体包含:(i)一个或多个可选择性标记物;(ii)与第五启动子和第五终止子可操作连接的编码具有生物活性的第五多肽的第五多核苷酸;和(iii)与第六启动子和第六终止子可操作连接的编码具有生物活性的第六多肽的第六多核苷酸,其中该串联构建体通过异位整合而整合。
[0626] [44]段落28~43中任一段的丝状真菌菌株,其中具有生物活性的多肽是不同的多肽。
[0627] [45]段落28~43中任一段的丝状真菌菌株,其中两个或更多个具有生物活性的多肽是相同的多肽。
[0628] [46]段落28~45中任一段的丝状真菌菌株,其中启动子是不同的启动子。
[0629] [47]段落28~45中任一段的丝状真菌菌株,其中两个或更多个启动子是相同的启动子。
[0630] [48]段落28~47中任一段的丝状真菌菌株,其中终止子是不同的终止子。
[0631] [49]段落28~47中任一段的丝状真菌菌株,其中两个或更多个终止子是相同的终止子。
[0632] [50]段落28~49中任一段的丝状真菌菌株,其中一个或多个串联构建体包含在表达载体中。
[0633] [51]段落28~50中任一段的丝状真菌菌株,其中丝状真菌菌株是枝顶孢属、曲霉属、短梗霉属、黑管菌属、拟蜡霉属、金孢属、鬼伞属、革盖菌属、隐球菌属、线黑粉酵母属、镰孢菌属、腐质霉属、巨座壳属、毛霉属、毁丝菌属、新美鞭菌属、脉孢菌属、拟青霉属、青霉属、平革菌属、白腐菌属、梨囊鞭菌属、侧耳属、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属或木霉属菌株。
[0634] [52]段落51的丝状真菌菌株,其中木霉属菌株选自哈茨木霉、康氏木霉、长梗木霉、里氏木霉或绿色木霉。
[0635] [53]段落51的丝状真菌菌株,其中木霉属菌株是里氏木霉。
[0636] [54]一种在丝状真菌菌株中产生具有生物活性的多种重组多肽的方法,其包括在有益于产生多肽的条件下培养丝状真菌宿主细胞,其中丝状真菌宿主细胞包含:(a)通过靶向整合用第一串联构建体取代的内源性第一基因,该第一串联构建体包含(i)第一基因的同源5’区、其同源侧翼区或其组合,(ii)一个或多个可选择性标记物,(iii) 与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)第一基因的同源 3’区、其同源侧翼区或其组合;(b)通过靶向整合用第二串联构建体取代的内源性第二基因,该第二串联构建体包含(i)第二基因的同源 5’区、其同源侧翼区或其组合,(ii)一个或多个可选择性标记物,(iii) 与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)第二基因的同源 3’区、其同源侧翼区或其组合;或(c)(a)和(b)的组合。
[0637] [55]权利要求54的方法,其还包括回收多种重组多肽。
[0638] [56]段落54或55的方法,其中第一基因是纤维二糖水解酶I基因。
[0639] [57]段落56的方法,其中纤维二糖水解酶I基因编码选自以下的纤维二糖水解酶I:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I;(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少 75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少 85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少 91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少 97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I;(iii)由包含与SEQ ID NO:1的成熟多肽编码序列具有至少
70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少
86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I;和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I。
[0640] [58]段落54或55的方法,其中第二基因是纤维二糖水解酶II基因。
[0641] [59]段落58的方法,其中纤维二糖水解酶II基因编码选自以下的纤维二糖水解酶II:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II;(ii)包含与SEQ ID NO:4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II;(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少 
70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少
86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II;和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
[0642] [60]段落54~59中任一段的方法,其中第一串联构建体的第一基因的同源5’区、其同源侧翼区或其组合为至少50bp,例如,至少100 bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500 bp或至少2000bp。
[0643] [61]段落54~60中任一段的方法,其中第一串联构建体的第一基因的同源3’区、其同源侧翼区或其组合为至少50bp,例如,至少100 bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500 bp或至少2000bp。
[0644] [62]段落54~61中任一段的方法,其中第二串联构建体的第二基因的同源5’区、其同源侧翼区或其组合为至少50bp,例如,至少100 bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500 bp或至少2000bp。
[0645] [63]段落54~62中任一段的方法,其中第二串联构建体的第二基因的同源3’区、其同源侧翼区或其组合为至少50bp,例如,至少100 bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500 bp或至少2000bp。
[0646] [64]段落54~63中任一段的方法,其中丝状真菌宿主细胞还包含一个或多个各自通过靶向整合用针对各个基因的对应串联构建体取代的其他内源性基因,该串联构建体包含:(i)基因的同源5’区、其同源侧翼区或其组合;(ii)一个或多个可选择性标记物;(iii)与启动子和终止子可操作连接的编码具有生物活性的多肽的多核苷酸;(iv)与另一启动子和另一终止子可操作连接的编码具有生物活性的另一多肽的另一多核苷酸;和(v)基因的同源3’区、其同源侧翼区或其组合。
[0647] [65]段落54~64中任一段的方法,其中一个或多个串联构建体还包含一个或多个可选择性标记物的5’侧翼的第一同源重复和一个或多个可选择性标记物的3’侧翼的第二同源重复,其中第一同源重复和第二同源重复进行同源重组,以切除一个或多个可选择性标记物。
[0648] [66]段落65的方法,其中第一和第二同源重复是相同的,或者彼此具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的的序列同一性。
[0649] [67]段落65或66的方法,其中第一和第二同源重复各自为至少 50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[0650] [68]段落65~67中任一段的方法,其中在切除一个或多个可选择性标记物时,一个或多个可选择性标记物可以再用于将针对各个基因的对应串联构建体各自通过靶向整合来取代一个或多个其他内源性基因。
[0651] [69]段落54~68中任一段的方法,其中丝状真菌宿主细胞还包含串联构建体,该串联构建体包含:(i)一个或多个可选择性标记物;(ii) 与第五启动子和第五终止子可操作连接的编码具有生物活性的第五多肽的第五多核苷酸;和(iii)与第六启动子和第六终止子可操作连接的编码具有生物活性的第六多肽的第六多核苷酸,其中该串联构建体通过异位整合而整合。
[0652] [70]段落54~69中任一段的方法,其中具有生物活性的多肽是不同的多肽。
[0653] [71]段落54~69中任一段的方法,其中两个或更多个具有生物活性的多肽是相同的多肽。
[0654] [72]段落54~71中任一段的方法,其中启动子是不同的启动子。
[0655] [73]段落54~71中任一段的方法,其中两个或更多个启动子是相同的启动子。
[0656] [74]段落54~73中任一段的方法,其中终止子是不同的终止子。
[0657] [75]段落54~73中任一段的方法,其中两个或更多个终止子是相同的终止子。
[0658] [76]段落54~75中任一段的方法,其中一个或多个串联构建体包含在表达载体中。
[0659] [77]段落54~76中任一段的方法,其中丝状真菌菌株是枝顶孢属、曲霉属、短梗霉属、黑管菌属、拟蜡霉属、金孢属、鬼伞属、革盖菌属、隐球菌属、线黑粉酵母属、镰孢菌属、腐质霉属、巨座壳属、毛霉属、毁丝菌属、新美鞭菌属、脉孢菌属、拟青霉属、青霉属、平革菌属、白腐菌属、梨囊鞭菌属、侧耳属、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属或木霉属菌株。
[0660] [78]段落77的方法,其中木霉属菌株选自哈茨木霉、康氏木霉、长梗木霉、里氏木霉和绿色木霉。
[0661] [79]段落77的方法,其中木霉属菌株是里氏木霉。
[0662] [80]一种串联构建体,其包含:(i)基因的同源5’区、其同源侧翼区或其组合;(ii)一个或多个第一可选择性标记物;(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(v)基因的同源3’区、其同源侧翼区或其组合。
[0663] [81]段落80的串联构建体,其中基因是纤维二糖水解酶I基因。
[0664] [82]段落81的串联构建体,其中纤维二糖水解酶I基因编码选自以下的纤维二糖水解酶I:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I;(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I;(iii)由包含与SEQ ID NO:1的成熟多肽编码序列具有至少 
70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少
86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I;和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I。
[0665] [83]段落80的串联构建体,其中基因是纤维二糖水解酶II基因。
[0666] [84]段落83的串联构建体,其中纤维二糖水解酶II基因编码选自以下的纤维二糖水解酶II:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II;(ii)包含与SEQ ID NO:4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II;(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少 
70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少
86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II;和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
[0667] [85]段落80~84中任一段的串联构建体,其中基因的同源5’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[0668] [86]段落80~85中任一段的串联构建体,其中基因的同源3’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[0669] [87]段落80~86中任一段的串联构建体,其中具有生物活性的多肽是不同的多肽。
[0670] [88]段落80~86中任一段的串联构建体,其中两个或更多个具有生物活性的多肽是相同的多肽。
[0671] [89]段落80~88中任一段的串联构建体,其中启动子是不同的启动子。
[0672] [90]段落80~88中任一段的串联构建体,其中两个或更多个启动子是相同的启动子。
[0673] [91]段落80~90中任一段的串联构建体,其中终止子是不同的终止子。
[0674] [92]段落80~90中任一段的串联构建体,其中两个或更多个终止子是相同的终止子。
[0675] [93]一种表达载体,其包含段落80~92中任一段的串联构建体。
[0676] [94]一种构建用于产生具有生物活性的多种重组多肽的丝状真菌菌株的方法,其包括:(a)通过靶向整合向内源性第一基因座中插入第一串联构建体,该第一串联构建体包含(i)第一基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第一可选择性标记物,(iii) 与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)第一基因座的同源3’区、其同源侧翼区或其组合;(b)通过靶向整合向内源性第二基因座中插入第二串联构建体,该第二串联构建体包含(i)第二基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第二可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)第二基因座的同源3’区、其同源侧翼区或其组合;或(c)(a)和(b) 的组合。
[0677] [95]段落94的方法,其中第一基因座是纤维二糖水解酶I基因。
[0678] [96]段落95的方法,其中纤维二糖水解酶I基因编码选自以下的纤维二糖水解酶I:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I;(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少 75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少 85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少 91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少 97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I;(iii)由包含与SEQ ID NO:1的成熟多肽编码序列具有至少
70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少
86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I;和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I。
[0679] [97]段落94的方法,其中第二基因座是纤维二糖水解酶II基因。
[0680] [98]段落97的方法,其中纤维二糖水解酶II基因编码选自以下的纤维二糖水解酶II:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II;(ii)包含与SEQ ID NO:4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II;(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少 
70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少
86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II;和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
[0681] [99]段落94~98中任一段的方法,其中各个串联构建体通过同源重组整合到丝状真菌菌株的染色体中。
[0682] [100]段落94~99中任一段的方法,其中第一基因座的同源5’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[0683] [101]段落94~100中任一段的方法,其中第一基因座的同源3’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200 bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000 bp。
[0684] [102]段落94~101中任一段的方法,其中第二基因座的同源5’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200 bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000 bp。
[0685] [103]段落94~102中任一段的方法,其中第二基因座的同源3’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200 bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000 bp。
[0686] [104]段落94~103中任一段的方法,其还包括各自通过靶向整合向一个或多个其他内源性基因座中插入针对各个基因座的对应串联构建体,该串联构建体包含:(i)基因座的同源5’区、其同源侧翼区或其组合;(ii)一个或多个可选择性标记物;(iii)与启动子和终止子可操作连接的编码具有生物活性的多肽的多核苷酸;(iv)与另一启动子和另一终止子可操作连接的编码具有生物活性的另一多肽的另一多核苷酸;和(v)基因座的同源3’区、其同源侧翼区或其组合。
[0687] [105]段落94~104中任一段的方法,其中一个或多个串联构建体还包含一个或多个可选择性标记物的5’侧翼的第一同源重复和一个或多个可选择性标记物的3’侧翼的第二同源重复,其中第一同源重复和第二同源重复进行同源重组,以切除一个或多个可选择性标记物。
[0688] [106]段落105的方法,其中第一和第二同源重复是相同的,或者彼此具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少
86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的的序列同一性。
[0689] [107]段落105或106的方法,其中第一和第二同源重复各自为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[0690] [108]段落105~107中任一段的方法,其中在切除一个或多个可选择性标记物时,一个或多个可选择性标记物可以再用于将针对各个基因的对应串联构建体各自通过靶向整合经插入来修饰一个或多个其他内源性基因座。
[0691] [109]段落94~108中任一段的方法,其还包括用串联构建体转化丝状真菌宿主细胞,该串联构建体包含:(i)一个或多个可选择性标记物;(ii)与第五启动子和第五终止子可操作连接的编码具有生物活性的第五多肽的第五多核苷酸;和(iii)与第六启动子和第六终止子可操作连接的编码具有生物活性的第六多肽的第六多核苷酸,其中该串联构建体通过异位整合而整合。
[0692] [110]段落94~109中任一段的方法,其中具有生物活性的多肽是不同的多肽。
[0693] [111]段落94~109中任一段的方法,其中两个或更多个具有生物活性的多肽是相同的多肽。
[0694] [112]段落94~111中任一段的方法,其中启动子是不同的启动子。
[0695] [113]段落94~111中任一段的方法,其中两个或更多个启动子是相同的启动子。
[0696] [114]段落94~113中任一段的方法,其中终止子是不同的终止子。
[0697] [115]段落94~113中任一段的方法,其中两个或更多个终止子是相同的终止子。
[0698] [116]段落94~115中任一段的方法,其中一个或多个串联构建体包含在表达载体中。
[0699] [117]段落94~116中任一段的方法,其中丝状真菌菌株是枝顶孢属、曲霉属、短梗霉属、黑管菌属、拟蜡霉属、金孢属、鬼伞属、革盖菌属、隐球菌属、线黑粉酵母属、镰孢菌属、腐质霉属、巨座壳属、毛霉属、毁丝菌属、新美鞭菌属、脉孢菌属、拟青霉属、青霉属、平革菌属、白腐菌属、梨囊鞭菌属、侧耳属、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属或木霉属菌株。
[0700] [118]段落117的方法,其中木霉属菌株选自哈茨木霉、康氏木霉、长梗木霉、里氏木霉和绿色木霉。
[0701] [119]段落117的方法,其中木霉属菌株是里氏木霉。
[0702] [120]一种丝状真菌菌株,由段落94~119中任一段的方法得到。
[0703] [121]一种丝状真菌菌株,其包含:(a)通过靶向整合经插入第一串联构建体而修饰的内源性第一基因座,该第一串联构建体包含(i) 第一基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v)第一基因座的同源3’区、其同源侧翼区或其组合;(b) 通过靶向整合经插入第二串联构建体而修饰的内源性第二基因座,该第二串联构建体包含(i)第二基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸, (iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)第二基因座的同源3’区、其同源侧翼区或其组合;或(c)(a)和(b)的组合。
[0704] [122]段落121的丝状真菌菌株,其中第一基因座是纤维二糖水解酶I基因。
[0705] [123]段落122的丝状真菌菌株,其中纤维二糖水解酶I基因编码选自以下的纤维二糖水解酶I:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I;(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I;(iii)由包含与SEQ ID NO:1的成熟多肽编码序列具有至少 70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少
85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I;和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I。
[0706] [124]段落121的丝状真菌菌株,其中第二基因座是纤维二糖水解酶II基因。
[0707] [125]段落124的丝状真菌菌株,其中纤维二糖水解酶II基因编码选自以下的纤维二糖水解酶II:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II;(ii)包含与SEQ ID NO:4的成熟多肽具有至少 70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II;(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少
85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II;和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
[0708] [126]段落121~125中任一段的丝状真菌菌株,其中各个串联构建体通过同源重组整合到丝状真菌菌株的染色体中。
[0709] [127]段落121~126中任一段的丝状真菌菌株,其中第一串联构建体的第一基因座的同源5’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000 bp、至少1500bp或至少2000bp。
[0710] [128]段落121~127中任一段的丝状真菌菌株,其中第一串联构建体的第一基因座的同源3’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000 bp、至少1500bp或至少2000bp。
[0711] [129]段落121~128中任一段的丝状真菌菌株,其中第二串联构建体的第二基因座的同源5’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000 bp、至少1500bp或至少2000bp。
[0712] [130]段落121~129中任一段的丝状真菌菌株,其中第二串联构建体的第二基因座的同源3’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000 bp、至少1500bp或至少2000bp。
[0713] [131]段落121~130中任一段的丝状真菌菌株,其还包含一个或多个各自通过靶向整合用针对各个基因座的对应串联构建体经插入而修饰的其他内源基因座,该串联构建体包含:(i)基因座的同源5’区、其同源侧翼区或其组合;(ii)一个或多个可选择性标记物;(iii)与启动子和终止子可操作连接的编码具有生物活性的多肽的多核苷酸;(iv) 与另一启动子和另一终止子可操作连接的编码具有生物活性的另一多肽的另一多核苷酸;和(v)基因座的同源3’区、其同源侧翼区或其组合。
[0714] [132]段落121~131中任一段的丝状真菌菌株,其中一个或多个串联构建体还包含一个或多个可选择性标记物的5’侧翼的第一同源重复和一个或多个可选择性标记物的3’侧翼的第二同源重复,其中第一同源重复和第二同源重复进行同源重组,以切除一个或多个可选择性标记物。
[0715] [133]段落132的丝状真菌菌株,其中第一和第二同源重复是相同的,或者彼此具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的的序列同一性。
[0716] [134]段落132或133的丝状真菌菌株,其中第一和第二同源重复各自为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[0717] [135]段落132~134中任一段的丝状真菌菌株,其中在切除一个或多个可选择性标记物时,一个或多个可选择性标记物可以再用于各自通过靶向整合向一个或多个其他内源性基因座插入针对各个基因座的对应串联构建体。
[0718] [136]段落121~135中任一段的丝状真菌菌株,其还包含串联构建体,该串联构建体包含:(i)一个或多个可选择性标记物;(ii)与第五启动子和第五终止子可操作连接的编码具有生物活性的第五多肽的第五多核苷酸;和(iii)与第六启动子和第六终止子可操作连接的编码具有生物活性的第六多肽的第六多核苷酸,其中该串联构建体通过异位整合而整合。
[0719] [137]段落121~136中任一段的丝状真菌菌株,其中具有生物活性的多肽是不同的多肽。
[0720] [138]段落121~136中任一段的丝状真菌菌株,其中两个或更多个具有生物活性的多肽是相同的多肽。
[0721] [139]段落121~138中任一段的丝状真菌菌株,其中启动子是不同的启动子。
[0722] [140]段落121~138中任一段的丝状真菌菌株,其中两个或更多个启动子是相同的启动子。
[0723] [141]段落121~140中任一段的丝状真菌菌株,其中终止子是不同的终止子。
[0724] [142]段落121~140中任一段的丝状真菌菌株,其中两个或更多个终止子是相同的终止子。
[0725] [143]段落121~142中任一段的丝状真菌菌株,其中一个或多个串联构建体包含在表达载体中。
[0726] [144]段落121~143中任一段的丝状真菌菌株,其中丝状真菌菌株是枝顶孢属、曲霉属、短梗霉属、黑管菌属、拟蜡霉属、金孢属、鬼伞属、革盖菌属、隐球菌属、线黑粉酵母属、镰孢菌属、腐质霉属、巨座壳属、毛霉属、毁丝菌属、新美鞭菌属、脉孢菌属、拟青霉属、青霉属、平革菌属、白腐菌属、梨囊鞭菌属、侧耳属、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属或木霉属菌株。
[0727] [145]段落144的丝状真菌菌株,其中木霉属菌株选自哈茨木霉、康氏木霉、长梗木霉、里氏木霉和绿色木霉。
[0728] [146]段落144的丝状真菌菌株,其中木霉属菌株是里氏木霉。
[0729] [147]一种在丝状真菌菌株中产生具有生物活性的多种重组多肽的方法,其包括:在有益于产生多肽的条件下培养丝状真菌宿主细胞,其中丝状真菌宿主细胞包含:(a)通过靶向整合经插入第一串联构建体而修饰的内源性第一基因座,该第一串联构建体包含(i)第一基因座的同源5’区、其同源侧翼区或其组合,(ii)一个或多个第一可选择性标记物,(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸,(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸,和(v) 第一基因座的同源3’区、其同源侧翼区或其组合;(b)通过靶向整合经插入第二串联构建体而修饰的内源性第二基因座,该第二串联构建体包含(i)第二基因座的同源5’区、其同源侧翼区或其组合,(ii) 一个或多个可选择性标记物,(iii)与第三启动子和第三终止子可操作连接的编码具有生物活性的第三多肽的第三多核苷酸,(iv)与第四启动子和第四终止子可操作连接的编码具有生物活性的第四多肽的第四多核苷酸,和(v)第二基因座的同源3’区、其同源侧翼区或其组合;或(c)(a)和(b)的组合。
[0730] [148]段落147的方法,其还包括回收多种重组多肽。
[0731] [149]段落147或148的方法,其中第一基因座是纤维二糖水解酶 I基因。
[0732] [150]段落149的方法,其中纤维二糖水解酶I基因编码选自以下的纤维二糖水解酶I:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I;(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I;(iii)由包含与SEQ ID NO:1的成熟多肽编码序列具有至少 
70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少
86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I;和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I。
[0733] [151]段落147或148的方法,其中第二基因座是纤维二糖水解酶 II基因。
[0734] [152]段落151的方法,其中纤维二糖水解酶II基因编码选自以下的纤维二糖水解酶II:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II;(ii)包含与SEQ ID NO:4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II;(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少 
70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少
86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II;和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
[0735] [153]段落147~152中任一段的方法,其中第一串联构建体的第一基因座的同源5’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少
800bp、至少1000bp、至少1500bp或至少2000bp。
[0736] [154]段落147~153中任一段的方法,其中第一串联构建体的第一基因座的同源3’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少
800bp、至少1000bp、至少1500bp或至少2000bp。
[0737] [155]段落147~154中任一段的方法,其中第二串联构建体的第二基因座的同源5’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少
800bp、至少1000bp、至少1500bp或至少2000bp。
[0738] [156]段落147~155中任一段的方法,其中第二串联构建体的第二基因座的同源3’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少
800bp、至少1000bp、至少1500bp或至少2000bp。
[0739] [157]段落147~156中任一段的方法,其中丝状真菌宿主细胞还包含一个或多个各自通过靶向整合用针对各个基因座的对应串联构建体经插入而修饰的其他内源性基因座,该串联构建体包含:(i)基因座的同源5’区、其同源侧翼区或其组合;(ii)一个或多个可选择性标记物; (iii)与启动子和终止子可操作连接的编码具有生物活性的多肽的多核苷酸;(iv)与另一启动子和另一终止子可操作连接的编码具有生物活性的另一多肽的另一多核苷酸;和(v)基因座的同源3’区、其同源侧翼区或其组合。
[0740] [158]段落147~157中任一段的方法,其中一个或多个串联构建体还包含一个或多个可选择性标记物的5’侧翼的第一同源重复和一个或多个可选择性标记物的3’侧翼的第二同源重复,其中第一同源重复和第二同源重复进行同源重组,以切除一个或多个可选择性标记物。
[0741] [159]段落158的方法,其中第一和第二同源重复是相同的,或者彼此具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少
86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的的序列同一性。
[0742] [160]段落158或159的方法,其中第一和第二同源重复各自为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[0743] [161]段落158~160中任一段的方法,其中在切除一个或多个可选择性标记物时,一个或多个可选择性标记物可以再用于将针对各个基因的对应串联构建体各自通过靶向整合经插入来修饰一个或多个其他内源性基因座。
[0744] [162]段落147~161中任一段的方法,其中丝状真菌宿主细胞还包含串联构建体,该串联构建体包含:(i)一个或多个可选择性标记物; (ii)与第五启动子和第五终止子可操作连接的编码具有生物活性的第五多肽的第五多核苷酸;和(iii)与第六启动子和第六终止子可操作连接的编码具有生物活性的第六多肽的第六多核苷酸,其中该串联构建体通过异位整合而整合。
[0745] [163]段落147~162中任一段的方法,其中具有生物活性的多肽是不同的多肽。
[0746] [164]段落147~162中任一段的方法,其中两个或更多个具有生物活性的多肽是相同的多肽。
[0747] [165]段落147~164中任一段的方法,其中启动子是不同的启动子。
[0748] [166]段落147~164中任一段的方法,其中两个或更多个启动子是相同的启动子。
[0749] [167]段落147~166中任一段的方法,其中终止子是不同的终止子。
[0750] [168]段落147~166中任一段的方法,其中两个或更多个终止子是相同的终止子。
[0751] [169]段落147~168中任一段的方法,其中一个或多个串联构建体包含在表达载体中。
[0752] [170]段落147~169中任一段的方法,其中丝状真菌菌株是枝顶孢属、曲霉属、短梗霉属、黑管菌属、拟蜡霉属、金孢属、鬼伞属、革盖菌属、隐球菌属、线黑粉酵母属、镰孢菌属、腐质霉属、巨座壳属、毛霉属、毁丝菌属、新美鞭菌属、脉孢菌属、拟青霉属、青霉属、平革菌属、白腐菌属、梨囊鞭菌属、侧耳属、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属或木霉属菌株。
[0753] [171]段落170的方法,其中木霉属菌株选自哈茨木霉、康氏木霉、长梗木霉、里氏木霉和绿色木霉。
[0754] [172]段落170的方法,其中木霉属菌株是里氏木霉。
[0755] [173]一种串联构建体,其包含:(i)基因座的同源5’区、其同源侧翼区或其组合;(ii)一个或多个第一可选择性标记物;(iii)与第一启动子和第一终止子可操作连接的编码具有生物活性的第一多肽的第一多核苷酸;(iv)与第二启动子和第二终止子可操作连接的编码具有生物活性的第二多肽的第二多核苷酸;和(v)基因座的同源3’区、其同源侧翼区或其组合。
[0756] [174]段落173的串联构建体,其中基因座是纤维二糖水解酶I基因。
[0757] [175]段落174的串联构建体,其中纤维二糖水解酶I基因编码选自以下的纤维二糖水解酶I:(i)包含SEQ ID NO:2的成熟多肽的纤维二糖水解酶I;(ii)包含与SEQ ID NO:2的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶I;(iii)由包含与SEQ ID NO:1的成熟多肽编码序列具有至少 
70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少
86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶I;和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:1的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶I。
[0758] [176]段落173的串联构建体,其中基因座是纤维二糖水解酶II 基因。
[0759] [177]段落176的串联构建体,其中纤维二糖水解酶II基因编码选自以下的纤维二糖水解酶II:(i)包含SEQ ID NO:4的成熟多肽的纤维二糖水解酶II;(ii)包含与SEQ ID NO:4的成熟多肽具有至少70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列的纤维二糖水解酶II;(iii)由包含与SEQ ID NO:3的成熟多肽编码序列具有至少 70%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少
85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的核苷酸序列的多核苷酸所编码的纤维二糖水解酶II;和(iv)由在至少高等严格条件例如非常高等严格条件下与SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交的多核苷酸所编码的纤维二糖水解酶II。
[0760] [178]段落173~177中任一段的串联构建体,其中基因座的同源 5’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[0761] [179]段落173~178中任一段的串联构建体,其中基因座的同源 3’区、其同源侧翼区或其组合为至少50bp,例如,至少100bp、至少200bp、至少400bp、至少800bp、至少1000bp、至少1500bp或至少2000bp。
[0762] [180]段落173~179中任一段的串联构建体,其中具有生物活性的多肽是不同的多肽。
[0763] [181]段落173~179中任一段的串联构建体,其中两个或更多个具有生物活性的多肽是相同的多肽。
[0764] [182]段落173~181中任一段的串联构建体,其中启动子是不同的启动子。
[0765] [183]段落173~181中任一段的串联构建体,其中两个或更多个启动子是相同的启动子。
[0766] [184]段落173~183中任一段的串联构建体,其中终止子是不同的终止子。
[0767] [185]段落173~183中任一段的串联构建体,其中两个或更多个终止子是相同的终止子。
[0768] [186]一种表达载体,其包含段落173~185中任一段的串联构建体。
[0769] 本文所说明并要求保护的发明在范围上并不受本文所述的具体方面的限定,因为这些方面意在作为本发明多个方面的示例。任何等同方面均意在包含于本发明的范围内。确实,除本文示出并说明的那些以外,基于以上的描述,本发明的多种修改对本领域技术人员来说将会是显而易见的。这些修改也意在落入所附权利要求的范围之内。在冲突的情况下,包括定义在内的当前公开内容将做出控制。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈