具有改进的转化效率的细菌突变体

申请号 CN201480039140.8 申请日 2014-06-18 公开(公告)号 CN105378061A 公开(公告)日 2016-03-02
申请人 诺维信公司; 发明人 B·谢里; R·贝尔卡;
摘要 在此提供了具有改进的转化效率的芽孢杆菌属突变体,这些突变体包含内源epsA-O操纵子的破坏。还描述了用于产生这些突变体的方法,使用这些突变体产生转化体的方法,以及使用这些突变体产生多肽或 发酵 产物的方法。
权利要求

1.一种突变体芽孢杆菌属菌株,其包含内源epsA-O操纵子的破坏。
2.如权利要求1所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子(a)编码至少一种多肽,该多肽与SEQ ID NO:46-90中任一个具有至少60%,例如至少70%、至少
75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少
99%、或100%序列一致性;(b)包含至少一种编码序列,该编码序列在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:1-45中任一个的全长互补链杂交;或(c)包含至少一种编码序列,该编码序列与SEQ ID NO:1-45中任一个具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少
99%、或100%序列一致性。
3.如权利要求1或2所述的突变体芽孢杆菌属菌株,其中当在相同条件下培养时,与缺乏对该内源epsA-O操纵子的破坏的亲本芽孢杆菌属菌株相比,该突变体产生少至少25%(例如,少至少50%、少至少60%、少至少70%、少至少80%、少至少90%、或少100%)的由该内源epsA、epsB、epsC、epsD、epsE、epsF、epsG、epsH、epsI、epsJ、epsK、epsL、epsM、epsN、或epsO编码序列编码的多肽。
4.如权利要求1-3中任一项所述的突变体芽孢杆菌属菌株,其中使该内源epsA、epsB、epsC、epsD、epsE、epsF、epsG、epsH、epsI、epsJ、epsK、epsL、epsM、epsN、或epsO编码序列失活。
5.如权利要求1-4中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏包括epsA-O操纵子编码序列中的至少两种(例如,三种、四种、五种、六种等)的破坏。
6.如权利要求1-5中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏包括epsA-O操纵子编码序列中的至少两种(例如,三种、四种、五种、六种等)的失活。
7.如权利要求1-6中任一项所述的突变体芽孢杆菌属菌株,其中当在相同条件下培养时,与缺乏对该内源epsA-O操纵子的破坏的亲本芽孢杆菌属菌株相比,该突变体具有改进的转化效率。
8.如权利要求1-7中任一项所述的突变体芽孢杆菌属菌株,其中当在相同条件下培养时,与缺乏对该内源epsA-O操纵子的破坏的亲本芽孢杆菌属菌株相比,该突变体能够产生多至少10倍(例如,至少100倍、至少1000倍、至少10000倍、或至少100000倍)的转化体。
9.如权利要求1-8中任一项所述的突变体芽孢杆菌属菌株,其中该亲本芽孢杆菌属菌株选自嗜芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、或苏芸金芽孢杆菌。
10.如权利要求1-9中任一项所述的突变体芽孢杆菌属菌株,其进一步包含编码多肽的多核苷酸。
11.如权利要求1-9中任一项所述的突变体芽孢杆菌属菌株,其进一步包含一种或多种多核苷酸,该一种或多种多核苷酸编码用于产生发酵产物的发酵途径的一种或多种多核苷酸。
12.一种用于获得如权利要求1-11中任一项所述的芽孢杆菌属突变体菌株的方法,该方法包括
(a)破坏亲本芽孢杆菌属菌株中的内源epsA-O操纵子;并且
(b)分离从(a)所得的该芽孢杆菌属突变体菌株。
13.一种产生多肽的方法,该方法包括在有益于产生该多肽的条件下,培养如权利要求
10所述的芽孢杆菌属突变体菌株。
14.如权利要求13所述的方法,该方法进一步包括回收该多肽。
15.一种产生发酵产物的方法,该方法包括在有益于产生该发酵产物的条件下,培养如权利要求11所述的芽孢杆菌属突变体菌株。
16.如权利要求15所述的方法,该方法进一步包括回收该发酵产物。

说明书全文

具有改进的转化效率的细菌突变体

[0001] 对序列表的引用
[0002] 本申请含有一个计算机可读形式的序列表,将该序列表通过引用结合在此。
[0003] 背景
[0004] 遗传感受态是一种外源DNA可以被内化,从而引起转化事件的生理状态(贝尔卡(Berka)等人,2002,分子生物学(Mol.Microbiol.)43:1331-1345),但是不同于涉及电穿孔、原生质体和热激或CaCl2处理的人工转化。已经在革兰氏阳性和革兰氏阴性细菌两者的物种中观察到天然感受态(杜布诺(Dubnau),1999,微生物学年评(Annual Rev.Microbiol.)53:217-244),并且该过程需要超过一些其表达针对每个生物体的需求被精确精心设计的蛋白质
[0005] 已经就天然感受态的目的提议了若干假说,并且可以将它们总结为用于食物的DNA、用于修复的DNA和用于遗传多样性的DNA(杜布诺(Dubnau),1999,见上文)。用于食物的DNA假说由以下观察现象支持,感受态是当细胞的营养素被限制时出现的静止期现象,并且通常,一种强有的无特异性核酸酶与转化特异性蛋白共表达。第二种假说的证据来自以下事实,编码DNA修复酶的基因与编码DNA转运蛋白的基因协同地表达。最后,针对遗传多样性的DNA假说提议到,感受态是一种用于经由平基因转移而探索适合度景观(fitness landscape)的机制。感受态由群体感应机制调控和它是一种双稳状态的观察现象(弗里(Avery),2005,微生物学趋势(Trends Microbiol.)13:459-462)支持这一假说。
[0006] 公共数据库现在包含众多的完整的细菌基因组,包括来自相同物种的不同菌株的若干基因组。使用成对全基因组比对,最近的分析已经显示相同物种的不同菌株在基因含量方面可能在实质上具有差异。例如,大肠杆菌菌株CFT073、EDL933和MG1655的基因组比较揭示到,仅仅其蛋白(基因产物)的组合组的39.2%为所有三种菌株所共有,从而突出了相同物种的菌株之中的惊人多样性(布拉特纳(Blattner)等人,1997,科学(Science)277:1453-1474;林(Hayashi)等人,2006,分子系统生物学(Mol.Syst.Biol.)doi:10.1038:msb4100049;佩纳(Perna)等人,2001,自然(Nature)409:529-533;韦尔奇(Welch)等人,2002,美国国家科学院院刊(Proc.Natl.Acad Sci.USA)99:17020-17024)。此外,大肠杆菌菌株CFT073的基因组序列揭示了1,623个菌株特异性基因(21.2%)。
自此类型的比较,可以清楚地看到细菌基因组被分段为共有的保守骨架和菌株特异性序列。典型地,就在所有菌株之中保守的保守“骨架”基因和可能为水平转移所需的非保守基因的分布而言,一个物种内的给定菌株的基因组显示出一种镶嵌结构(布鲁斯科维克兹(Brzuszkiewicz)等人,2006,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)103:12879-12884;韦尔奇(Welch)等人,2002,见上文)。
[0007] 就实用性而言,经由天然感受态的转化是一种用于构建细菌菌株(例如,芽孢杆菌属)的极其有用的工具,这些细菌菌株可以包含染色体基因的改变的等位基因或经由重组DNA方法组装的质粒。尽管可以经由如以上所指出人工手段(例如,电穿孔、原生质体和热激或CaCl2处理)实现用质粒和染色体DNA转化某些物种,但是通过天然感受态引入DNA提供简单、方便、快速及有效的明显优势。
[0008] 在枯草芽孢杆菌中,经由涉及群体感应、信号转导和基因表达级联的过程,群体中仅仅5%-10%的细胞分化为感受态状态(称为K-状态)(艾弗里(Avery),2005,见上文)。已知在感受态中直接涉及至少50个基因,并且多达165个基因由中心转录因子ComK(直接或间接)调控(贝尔卡(Berka)等人,2002,见上文)。枯草芽孢杆菌中的感受态级联由两个被分子开关打断的调控模组成(图1),该级联涉及ComS结合至衔接分子MecA,从而干扰ClpC/ClpP蛋白酶降解转录因子ComK(图尔加伊(Turgay)等人,1998,欧洲分子生物学学会杂志(EMBO J.)17:6730-6738)。
[0009] 在枯草芽孢杆菌中,已经显示mecA失活适度地提高转化效率,这归因于ComK的增加的可用性(哈恩(Hahn)等人,1995,分子微生物学(Mol.Microbiol.),18:755-767)。一项最近的研究表明,根据示于图2中的mecA与eps和tasA调节子之间的调控关系,枯草芽孢杆菌mecA缺失引起eps和tasA操纵子的表达增加(普利皮克(Prepiak)等人,2011,分子微生物学(Mol.Microbiol.),80:1014-1030)。
[0010] 除comP和comS之外,地衣芽孢杆菌赋予实现天然感受态所必需的基因的直系同源物。表面上,不能获得天然感受态地衣芽孢杆菌细胞,这归因于缺乏功能性comS基因,从而引起ComK被MecA连续螯合并且被ClpC/P/MecA复合物蛋白水解地降解。申请人已经显示,ComS和ComK在地衣芽孢杆菌中的表达可以改进感受态(US 2010/0028944)。
[0011] 据报导,缺乏胞外多糖合成的黄色粘 球菌(Myxococcus xanthus)突变体具 有增 加的转 化效 率(王(Wang)等人,2011,细菌 学杂志 (Journal of Bacteriology)193:2122-2132)。然而,胞外多糖生产缺陷型的格氏链球菌突变体显示出降低的感受态(郑(Zheng)等人,2011,分子口腔微生物学(Molecular Oral Microbiology)27:83-94)。因而,胞外多糖的作用似乎根据宿主变动。胞外(exopolymeric)物质(EPS)改变芽孢杆菌属细胞中转化感受态的程度在很大程度上仍然是未知的。
[0012] 因为芽孢杆菌属物种为多种工业相关过程(例如代谢工程和生化生产)提供了关键平台,表现改进的感受态的工程化菌株对于构建新的且改进的生产菌株而言是高度令人希望的。用于改进芽孢杆菌属菌株中的感受态的全包(turn-key)方法的可用性将改进随其可以引入染色体标记/等位基因和表达载体的速度与效率。本发明满足这些以及其他需求。
[0013] 概述
[0014] 在此描述了具有改进的转化效率的芽孢杆菌属突变体。诸位申请人已经出人意料地发现,与野生型亲本相比,芽孢杆菌属宿主细胞中内源epsA-O操纵子的破坏显示出显著改进的转化效率。
[0015] 一个方面是亲本芽孢杆菌属菌株的分离的突变体,该突变体包括内源epsA-O操纵子的破坏,其中当在相同条件下培养时,与缺乏对该内源epsA-O操纵子的破坏的亲本芽孢杆菌属菌株相比,该突变体具有改进的转化效率。在一些方面中,该芽孢杆菌属突变体是一种解淀粉芽孢杆菌突变体、地衣芽孢杆菌突变体或枯草芽孢杆菌突变体。
[0016] 还描述了用于获得该芽孢杆菌属突变体的方法,该方法包括破坏亲本芽孢杆菌属菌株中的内源epsA-O操纵子。
[0017] 还描述了用于获得一种芽孢杆菌属转化体的方法,这些方法包括将异源多核苷酸转化进芽孢杆菌属突变体中,其中该突变体包括内源epsA-O操纵子的破坏。
[0018] 还描述了获得多肽的方法,该方法包括:(a)培养在此描述的包括编码该多肽的异源多核苷酸的芽孢杆菌属转化体;并且(b)回收该多肽。
[0019] 还描述了获得发酵产物的方法,该方法包括:(a)培养在此描述的包括编码发酵途径的多肽的异源多核苷酸的芽孢杆菌属转化体;并且(b)回收该发酵产物。
[0020] 附图简要说明
[0021] 图1示出了枯草芽孢杆菌的感受态调控级联。模块1涉及经由磷酸化机制检测感受态信息素CSF和信号转导,该机制导致合成ComS肽。ComS经由结合至MecA而干扰转录因子ComK的蛋白水解降解,该MecA激活编码后期感受态功能的模块2,该模块编码DNA转运机构。
[0022] 图2示出了枯草芽孢杆菌中的mecA与eps和asA调节子之间的调控关系。
[0023] 图3示出了使用两微克的转化质粒DNA,与无破坏的亲本菌株相比,包括epsA-O操纵子的破坏的芽孢杆菌属菌株BaC0171的相对转化效率。
[0024] 图4示出了使用两微克的转化质粒DNA,与无破坏的亲本菌株相比,包括epsA-O操纵子的破坏的芽孢杆菌属菌株BaC0171的相对转化效率。
[0025] 图5示出了包括mecA基因破坏的芽孢杆菌属菌株TaHy9的转化效率。
[0026] 定义
[0027] 编码序列:术语“编码序列”意指明确一种多肽的基酸序列的多核苷酸序列。编码序列的边界一般由开放阅读框架决定,该开放阅读框架通常以ATG起始密码子或替代性起始密码子(例如GTG和TTG)开始,并且以终止密码子(例如TAA、TAG、和TGA)结束。编码序列可以是基因组DNA、cDNA、合成的多核苷酸、和/或重组多核苷酸的一个序列。
[0028] 破坏:术语“破坏”意指参照基因的编码区和/或控制序列被部分或完全修饰(例如通过缺失、插入和/或取代一个或多个核苷酸),从而使得编码的多肽的表达不存在(失活)或降低,和/或编码的多肽的酶活性不存在或降低。可以使用本领域已知的技术测量破坏效果,如使用来自在此参照的无细胞提取物测量值检测酶活性的不存在或降低;或通过对应的mRNA的不存在或降低(例如,至少25%降低、至少50%降低、至少60%降低、至少70%降低、至少80%降低或至少90%降低);具有酶活性的对应多肽的量的不存在或降低(例如,至少25%降低、至少50%降低、至少60%降低、至少70%降低、至少80%降低或至少90%降低);或具有酶活性的对应多肽的比活性的不存在或降低(例如,至少25%降低、至少50%降低、至少60%降低、至少70%降低、至少80%降低或至少90%降低)。可以通过本领域已知的方法破坏感兴趣的具体基因,例如通过直接同源重组(参见酵母遗传学方法(Methods in Yeast Genetics)(1997版),亚当斯(Adams),戈特斯科林(Gottschling),凯泽(Kaiser)及施特姆斯(Stems),冷泉港出版社(Cold Spring Harbor Press)(1998))。
在此描述了用于破坏芽孢杆菌属基因的技术并且已经在本领域中证实(参见斯特尔(Stahl)&法拉利(Ferrari),1984,细菌学杂志(J.Bacteriol.)158:411-418)。
[0029] epsA-O操纵子:术语“epsA-O操纵子”意指芽孢杆菌属细胞中一种已知的十五-基因操纵子,该操纵子涉及胞外(exopolymeric)物质(EPS)生物合成、修饰、输出(布兰达(Branda)等人,2001,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)98:11621-11626)。H
该epsA-O操纵子(也称为ybeK-T yvfA-F)受Spo0A和σ两者的控制。
[0030] 术语“内源epsA-O操纵子的破坏”意指一种破坏,其导致该epsA-O操纵子的至少一种编码序列的表达不存在或降低,和/或该epsA-O操纵子的至少一种编码的多肽的酶活性不存在或降低。内源epsA-O操纵子的破坏的非限制性实例包括操纵子启动子的破坏,和/或epsA-O操纵子编码序列中的一种或多种(例如,两种、三种、四种、五种、六种等)的破坏。
[0031] 改进的转化效率:术语“改进的转化效率”意指当在相同条件下转化和培养时,与亲本芽孢杆菌属菌株相比,参照芽孢杆菌属突变体菌株能够产生增加数目的转化体。例如可以使用描述于以下实例中的转化方法,通过产生增加数目的转化体证实改进的转化效率。还可以使用先前描述的方法证实改进的转化效率(例如,阿纳格诺斯托普洛斯(Anagnostopoulos)和斯皮宰曾(Spizizen),1961,细菌学杂志(J.Bacteriol.)81:741-746)。在一些方面中,当在相同条件下培养时,与亲本芽孢杆菌属菌株相比,芽孢杆菌属突变体菌株能够产生多至少2倍,例如至少5倍、至少10倍、至少20倍、至少50倍、至少100倍、至少200倍、至少500倍、至少1000倍、至少2000倍、至少5000倍、至少10000倍、至少20000倍、至少50000倍或至少100000倍的转化体。
[0032] 突变体:术语“突变体”意指对亲本芽孢杆菌属菌株做出一个或多个破坏后的所得芽孢杆菌属菌株。
[0033] 亲本:术语“亲本”或“亲本芽孢杆菌属菌株”意指对其进行破坏以产生在此描述的突变芽孢杆菌属菌株的芽孢杆菌属菌株。亲本可以是一种天然发生的(野生型)或先前修饰的芽孢杆菌属菌株。
[0034] 序列一致性:两个氨基酸序列之间或两个核苷酸序列之间的相关性由参数“序列一致性”描述。
[0035] 出于在此所述的目的,两个氨基酸序列之间的序列一致性的程度使用尼德曼-翁施(Needleman-Wunsch)算法(尼德曼和翁施,1970,《分子生物学杂志》(J.Mol.Biol.)48:443-453)测定,如在EMBOSS包的尼德尔(Needle)程序(EMBOSS:欧洲分子生物学开放软件包(The European Molecular Biology Open Software Suite),莱斯(Rice)等人,2000,《遗传学趋势》(Trends Genet.)16:276-277),优选地3.0.0版或更高版本中所实施。所使用的这些任选参数是空位开放罚分10、空位延伸罚分0.5,及EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。尼德尔标注的“最长的一致性”的输出(使用-非简化选项获得)被用作百分比一致性,并且如下计算:
[0036] (一致的残基x 100)/(比对长度-比对中的空位总数)
[0037] 出于在此所述的目的,使用尼德曼-翁施算法(尼德曼(Needleman)和翁施(Wunsch),1970,见上文)来确定两个脱核糖核苷酸序列之间的序列一致性程度,该算法是如在EMBOSS软件包(EMBOSS:欧洲分子生物学开放软件套件,赖斯(Rice)等人,2000,见上文)(优选3.0.0版或更新版本)的尼德尔程序中所实施的。所使用的这些任选参数是空位开放罚分10、空位延伸罚分0.5,及EDNAFULL(NCBI NUC4.4的EMBOSS版本)取代矩阵。尼德尔标注的“最长的一致性”的输出(使用-非简化选项获得)被用作百分比一致性,并且如下计算:
[0038] (一致的脱氧核糖核苷酸X 100)/(比对长度-比对中的空位总数)
[0039] 杂交条件:术语“非常低严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和25%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在45℃下洗涤三次,每次15分钟。
[0040] 术语“低严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和25%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在50℃下洗涤三次,每次15分钟。
[0041] 术语“中严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和35%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在55℃下洗涤三次,每次15分钟。
[0042] 术语“中-高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/毫升剪切并变性的鲑鱼精子DNA以及35%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在60℃下洗涤三次,每次15分钟。
[0043] 术语“高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和50%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在65℃下洗涤三次,每次15分钟。
[0044] 术语“非常高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和50%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在70℃下洗涤三次,每次15分钟。
[0045] 异源多核苷酸:在此将术语“异源多核苷酸”定义为以下多核苷酸:对该宿主细胞而言不是天然的多核苷酸;已经对编码区做出一种或多种(例如,两种,若干种)结构修饰的天然多核苷酸;由于通过重组DNA技术对DNA的操作而定量改变其表达的天然多核苷酸,例如,将一种不同的(外源的)启动子连接至该多核苷酸;或通过向该宿主细胞中引入该多核苷酸的一个或多个另外的拷贝而定量改变其表达的天然多核苷酸。
[0046] 分离的:术语“分离的”意指处于非天然存在的形式或环境中的物质。分离的物质的非限制性实例包括(1)任何非天然存在的物质,(2)任何物质,包括(但不限于)从与其性质上相关的一种或多种或所有天然存在的组分至少部分除去的任何宿主细胞、酶、变体、核酸、蛋白质、肽或辅因子;(3)相对于自然中发现的物质,由人工修饰的任何物质;或(4)通过相对于与其天然相关的其他组分,增加物质的量而修饰的任何物质。
[0047] 内源:参见基因/操纵子/编码序列,术语“内源”意指在任何破坏之前该参比多核苷酸对亲本芽孢杆菌属菌株而言是天然的。
[0048] 核酸构建体:术语“核酸构建体”意指一种包括一个或多个(例如,两个、若干个)控制序列的多核苷酸。多核苷酸可以是单链的或双链的,并且可以分离自天然存在的基因、可以被修饰成以另外的不会在自然界中存在的方式包含核酸的区段,或可以是合成的。
[0049] 控制序列:术语“控制序列”意指多肽表达所必需的核酸序列。控制序列对于编码多肽的多核苷酸可以是天然的或外源的,并且彼此可以是天然的或外源的。此类控制序列包括但不限于,前导子序列、多聚腺苷酸化序列、前肽序列、启动子序列、信号肽序列及转录终止子序列。出于引入有利于将这些控制序列与编码一种多肽的多核苷酸的编码区连接的特异性限制酶切位点的目的,这些控制序列可以提供有多个接头。
[0050] 可操作地连接:术语“可操作地连接”意指一种配置,其中一个控制序列相对于一种多核苷酸的编码序列放置在一个适当位置处,以使得控制序列指引编码序列的表达。
[0051] 表达:术语“表达”包括在多肽的产生中涉及的任何步骤,包括但不限于,转录、转录后修饰、翻译、翻译后修饰、以及分泌。可以对表达进行测量—例如,来检测增加的表达—通过本领域已知的技术,例如测量mRNA和/或翻译的多肽的水平。
[0052] 表达载体:术语“表达载体”意指一种线性或环形的DNA分子,该分子包括编码一种多肽的多核苷酸并且被可操作地连接至控制序列,其中这些控制序列提供编码该多肽的多核苷酸的表达。最低限度上,该表达载体包括启动子序列,以及转录和翻译终止信号序列。
[0053] 宿主细胞:术语“宿主细胞”意指对用核酸构建体或表达载体进行的转化、转染、转导等是易感的任何细胞类型。术语“宿主细胞”涵盖由于复制期间发生的突变而与亲本细胞不同的亲本细胞的任何后代。
[0054] 转化:术语“转化”意指将异源多核苷酸引入进芽孢杆菌属细胞中,这样使得该DNA被保持为染色体整合体或保持为自主复制的染色体外载体。在此将转化后所得的芽孢杆菌属细胞描述为“转化体”。
[0055] 等位基因变体:术语“等位基因变体”意指占用同一染色体位点的一种基因的两个或更多个替代形式中的任一者。等位基因变异由突变天然产生,并且可以导致群体内的多态性。基因突变可以是沉默的(在所编码的多肽中没有改变)或可编码具有改变的氨基酸序列的多肽。多肽的等位基因变体是由基因的等位基因变体编码的多肽。
[0056] 在此提及“约”一个数值或参数包括指向那个数值或参数本身的方面。例如,提及“约X”的描述包括方面“X”。当与测量值组合使用时,“约”包括涵盖至少与测量该具体数值的方法相关的不确定性的范围,并且可以包括在给定的数值附近正或负两个标准差的范围。
[0057] 如在此和所附权利要求书中所使用,单数形式“一种/个”、“或”以及“该”包括复数指示物,除非上下文以另外的方式清楚表明。应该理解的是在此描述的这些方面包括“由……方面组成”和/或“基本由……方面组成”。
[0058] 除非由上下文以另外的方式定义或清楚表明,在此使用的所有技术术语和科学术语具有如本领域的普通技术人员所通常理解的相同的含义。
[0059] 详细说明
[0060] 芽孢杆菌属突变体
[0061] 在此描述的尤其是亲本芽孢杆菌属菌株的分离的突变体,这些突变体包括内源epsA-O操纵子的破坏,该破坏提供了改进的转化效率。不拘于理论,该epsA-O操纵子的靶向破坏可以减少胞外(exopolymeric)物质(EPS)-一种似乎抑制芽孢杆菌中转化效率的物理屏障-的生产。
[0062] 这些突变体及相关方法的亲本菌株可以是任何芽孢杆菌属菌株,例如野生型芽孢杆菌属或其突变体。在一些方面中,该亲本芽孢杆菌属菌株是嗜芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、或苏芸金芽孢杆菌菌株。在一些方面中,这些芽孢杆菌属突变体选自解淀粉芽孢杆菌、地衣芽孢杆菌、以及枯草芽孢杆菌。
[0063] 该破坏的epsA-O操纵子可以是任何适合的内源芽孢杆菌属epsA-O操纵子,例如,包括具有表1所示的SEQ ID NO:1-45的编码序列中的一个或多个(例如,两个或若干个)的内源epsA-O操纵子,这些编码序列编码具有表2所示的SEQ ID NO:46-90的对应的多肽。
[0064] 表1
[0065]
[0066]
[0067] 表2
[0068]
[0069] 在一个方面中,该分离的突变体芽孢杆菌属菌株的内源epsA-O操纵子(a)编码至少一种多肽,该多肽与SEQ ID NO:46-90中任一个具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少
99%、或100%序列一致性;(b)包含至少一种编码序列,该编码序列在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:1-45中任一个的全长互补链杂交;或(c)包含至少一种编码序列,该编码序列与SEQ ID NO:1-45中任一个具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少
99%、或100%序列一致性。
[0070] 在一些方面中,该内源epsA-O操纵子编码至少一种多肽,该多肽与SEQ ID NO:46-90中任一个具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些方面中,该内源epsA-O操纵子编码至少一种多肽,该多肽具有的序列与SEQ ID NO:46-90中任一个的差异不多于十个氨基酸,例如不多于五个氨基酸、不多于四个氨基酸、不多于三个氨基酸、不多于两个氨基酸或一个氨基酸。在一些方面中,该内源epsA-O操纵子编码至少一种多肽,该多肽包括SEQ ID NO:46-90中的任何或由其组成。
[0071] 在一些方面中,该内源epsA-O操纵子包含至少一种编码序列,该编码序列与SEQ ID NO:1-45中任一个具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些方面中,该内源epsA-O操纵子包含至少一种编码序列,该编码序列包括SEQ ID NO:1-45中的任何或由其组成。
[0072] 在一些方面中,该内源epsA-O操纵子包含至少一种编码序列,该编码序列在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:1-45中任一个的全长互补链杂交。
[0073] 该内源epsA-O操纵子的破坏可以发生在控制序列(例如,启动子)和/或epsA、epsB、epsC、epsD、epsE、epsF、epsG、epsH、epsI、epsJ、epsK、epsL、epsM、epsN、或epsO编码序列中的一个或多个(例如,两个、若干个)上。
[0074] 在一个方面中,该分离的突变体芽孢杆菌属菌株包括该内源epsA-O操纵子的启动子序列的破坏。
[0075] 在一些方面中,该内源epsA-O操纵子的破坏包括epsA-O操纵子编码序列中的至少两种(例如,至少三种、四种、五种、六种等)的破坏。
[0076] 在一些方面中,当在相同条件下培养时,与缺乏对该内源epsA-O操纵子的破坏的亲本芽孢杆菌属菌株相比,这些突变体具有改进的转化效率。在一些实施例中,当在相同条件下培养时,与缺乏对该内源epsA-O操纵子的破坏的亲本芽孢杆菌属菌株相比,这些突变体能够产生多至少10倍(例如,至少100倍、至少1000倍、至少10000倍、或至少100000倍)转化体。
[0077] epsA
[0078] 在一些方面中,该内源epsA-O操纵子的破坏发生在内源epsA编码序列中。在一个方面中,使该内源epsA编码序列失活。
[0079] 内源芽孢杆菌属epsA编码序列的实例包括SEQ ID NO:1的解淀粉芽孢杆菌epsA编码序列(其编码SEQ ID NO:46的多肽)、SEQ ID NO:2的地衣芽孢杆菌epsA编码序列(其编码SEQ ID NO:47的多肽)、以及SEQ ID NO:3的枯草芽孢杆菌epsA编码序列(其编码SEQ ID NO:48的多肽)。
[0080] 在一些实施例中,该内源epsA编码序列(a)编码一种多肽,该多肽与SEQ ID NO:46、47、或48具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:1、2、或3的全长互补链杂交;或(c)与SEQ ID NO:1、2、或3具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0081] 在一些实施例中,该内源epsA编码序列编码一种多肽,该多肽与SEQ ID NO:46、47、或48具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少
95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些实施例中,该内源epsA编码序列编码一种多肽,该多肽具有的序列与SEQ ID NO:46、47、或48中任一个的差异不多于十个氨基酸,例如不多于五个氨基酸、不多于四个氨基酸、不多于三个氨基酸、不多于两个氨基酸或一个氨基酸。在一些实施例中,该内源epsA编码序列编码一种多肽,该多肽包括SEQ ID NO:46、47、或48或由其组成。
[0082] 在一些实施例中,该内源epsA编码序列在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:1、2、或3的全长互补链杂交。
[0083] 在一些实施例中,该内源epsA编码序列与SEQ ID NO:1、2、或3具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些实施例中,该内源epsA编码序列包括SEQ ID NO:1、2、或3或由其组成。
[0084] 在一些方面中,当在相同条件下培养时,与缺乏对该内源epsA-O操纵子的破坏的亲本芽孢杆菌属菌株相比,该突变体产生少至少25%(例如,少至少50%、少至少60%、少至少70%、少至少80%、少至少90%、或少100%)的由该内源epsA编码序列编码的多肽。
[0085] epsB
[0086] 在一些方面中,该内源epsA-O操纵子的破坏发生在epsB编码序列中。在一个方面中,该内源epsB编码序列是失活的。
[0087] 内源芽孢杆菌属epsB编码序列的实例包括SEQ ID NO:4的解淀粉芽孢杆菌epsB编码序列(其编码SEQ ID NO:49的多肽)、SEQ ID NO:5的地衣芽孢杆菌epsB编码序列(其编码SEQ ID NO:50的多肽)、以及SEQ ID NO:6的枯草芽孢杆菌epsB编码序列(其编码SEQ ID NO:51的多肽)。
[0088] 在一些实施例中,该内源epsB编码序列(a)编码一种多肽,该多肽与SEQ ID NO:49、50、或51具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:4、5、或6的全长互补链杂交;或(c)与SEQ ID NO:4、5、或6具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0089] 在一些实施例中,该内源epsB编码序列编码一种多肽,该多肽与SEQ ID NO:49、50、或51具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少
95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些实施例中,该内源epsB编码序列编码一种多肽,该多肽具有的序列与SEQ ID NO:49、50、或51中任一个的差异不多于十个氨基酸,例如不多于五个氨基酸、不多于四个氨基酸、不多于三个氨基酸、不多于两个氨基酸或一个氨基酸。在一些实施例中,该内源epsB编码序列编码一种多肽,该多肽包括SEQ ID NO:49、50、或51或由其组成。
[0090] 在一些实施例中,该内源epsB编码序列在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:4、5、或6的全长互补链杂交。
[0091] 在一些实施例中,该内源epsB编码序列与SEQ ID NO:4、5、或6具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些实施例中,该内源epsB编码序列包括SEQ ID NO:4、5、或6或由其组成。
[0092] 在一些方面中,当在相同条件下培养时,与缺乏对该内源epsA-O操纵子的破坏的亲本芽孢杆菌属菌株相比,该突变体产生少至少25%(例如,少至少50%、少至少60%、少至少70%、少至少80%、少至少90%、或少100%)的由该内源epsB编码序列编码的多肽。
[0093] epsC
[0094] 在一些方面中,该内源epsA-O操纵子的破坏发生在内源epsC编码序列中。在一个方面中,该内源epsC编码序列是失活的。
[0095] 内源芽孢杆菌属epsC编码序列的实例包括SEQ ID NO:7的解淀粉芽孢杆菌epsC编码序列(其编码SEQ ID NO:52的多肽)、SEQ ID NO:8的地衣芽孢杆菌epsC编码序列(其编码SEQ ID NO:53的多肽)、以及SEQ ID NO:9的枯草芽孢杆菌epsC编码序列(其编码SEQ ID NO:54的多肽)。
[0096] 在一些实施例中,该内源epsC编码序列(a)编码一种多肽,该多肽与SEQ ID NO:52、53、或54具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:7、8、或9的全长互补链杂交;或(c)与SEQ ID NO:7、8、或9具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0097] 在一些实施例中,该内源epsC编码序列编码一种多肽,该多肽与SEQ ID NO:52、53、或54具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少
95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些实施例中,该内源epsC编码序列编码一种多肽,该多肽具有的序列与SEQ ID NO:52、53、或54中任一个的差异不多于十个氨基酸,例如不多于五个氨基酸、不多于四个氨基酸、不多于三个氨基酸、不多于两个氨基酸或一个氨基酸。在一些实施例中,该内源epsC编码序列编码一种多肽,该多肽包括SEQ ID NO:52、53、或54或由其组成。
[0098] 在一些实施例中,该内源epsC编码序列在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:7、8、或9的全长互补链杂交。
[0099] 在一些实施例中,该内源epsC编码序列与SEQ ID NO:7、8、或9具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些实施例中,该内源epsC编码序列包括SEQ ID NO:7、8、或9或由其组成。
[0100] 在一些方面中,当在相同条件下培养时,与缺乏对该内源epsA-O操纵子的破坏的亲本芽孢杆菌属菌株相比,该突变体产生少至少25%(例如,少至少50%、少至少60%、少至少70%、少至少80%、少至少90%、或少100%)的由该内源epsC编码序列编码的多肽。
[0101] epsD
[0102] 在一些方面中,该内源epsA-O操纵子的破坏发生在内源epsD编码序列中。在一个方面中,该内源epsD编码序列是失活的。
[0103] 内源芽孢杆菌属epsD编码序列的实例包括SEQ ID NO:10的解淀粉芽孢杆菌epsD编码序列(其编码SEQ ID NO:55的多肽)、SEQ ID NO:11的地衣芽孢杆菌epsD编码序列(其编码SEQ ID NO:56的多肽)、以及SEQ ID NO:12的枯草芽孢杆菌epsD编码序列(其编码SEQ ID NO:57的多肽)。
[0104] 在一些实施例中,该内源epsD编码序列(a)编码一种多肽,该多肽与SEQ ID NO:55、56、或57具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:10、11、或12的全长互补链杂交;或(c)与SEQ ID NO:10、11、或12具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0105] 在一些实施例中,该内源epsD编码序列编码一种多肽,该多肽与SEQ ID NO:55、56、或57具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少
95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些实施例中,该内源epsD编码序列编码一种多肽,该多肽具有的序列与SEQ ID NO:55、56、或57中任一个的差异不多于十个氨基酸,例如不多于五个氨基酸、不多于四个氨基酸、不多于三个氨基酸、不多于两个氨基酸或一个氨基酸。在一些实施例中,该内源epsD编码序列编码一种多肽,该多肽包括SEQ ID NO:55、56、或57或由其组成。
[0106] 在一些实施例中,该内源epsD编码序列在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:10、11、或12的全长互补链杂交。
[0107] 在一些实施例中,该内源epsD编码序列与SEQ ID NO:10、11、或12具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些实施例中,该内源epsD编码序列包括SEQ ID NO:10、11、或12或由其组成。
[0108] 在一些方面中,当在相同条件下培养时,与缺乏对该内源epsA-O操纵子的破坏的亲本芽孢杆菌属菌株相比,该突变体产生少至少25%(例如,少至少50%、少至少60%、少至少70%、少至少80%、少至少90%、或少100%)的由该内源epsD编码序列编码的多肽。
[0109] epsE
[0110] 在一些方面中,该内源epsA-O操纵子的破坏发生在epsE编码序列中。在一个方面中,该epsE编码序列是失活的。
[0111] 内源芽孢杆菌属epsE编码序列的实例包括SEQ ID NO:13的解淀粉芽孢杆菌epsE编码序列(其编码SEQ ID NO:58的多肽)、SEQ ID NO:14的地衣芽孢杆菌epsE编码序列(其编码SEQ ID NO:59的多肽)、以及SEQ ID NO:15的枯草芽孢杆菌epsE编码序列(其编码SEQ ID NO:60的多肽)。
[0112] 在一些实施例中,该内源epsE编码序列(a)编码一种多肽,该多肽与SEQ ID NO:58、59、或60具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:13、14、或15的全长互补链杂交;或(c)与SEQ ID NO:13、14、或15具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0113] 在一些实施例中,该内源epsE编码序列编码一种多肽,该多肽与SEQ ID NO:58、59、或60具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少
95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些实施例中,该内源epsE编码序列编码一种多肽,该多肽具有的序列与SEQ ID NO:58、59、或60中任一个的差异不多于十个氨基酸,例如不多于五个氨基酸、不多于四个氨基酸、不多于三个氨基酸、不多于两个氨基酸或一个氨基酸。在一些实施例中,该内源epsE编码序列编码一种多肽,该多肽包括SEQ ID NO:58、59、或60或由其组成。
[0114] 在一些实施例中,该内源epsE编码序列在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:10、11、或12的全长互补链杂交。
[0115] 在一些实施例中,该内源epsE编码序列与SEQ ID NO:10、11、或12具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些实施例中,该内源epsE编码序列包括SEQ ID NO:10、11、或12或由其组成。
[0116] 在一些方面中,当在相同条件下培养时,与缺乏对该内源epsA-O操纵子的破坏的亲本芽孢杆菌属菌株相比,该突变体产生少至少25%(例如,少至少50%、少至少60%、少至少70%、少至少80%、少至少90%、或少100%)的由该内源epsE编码序列编码的多肽。
[0117] epsF
[0118] 在一些方面中,该内源epsA-O操纵子的破坏发生在epsF编码序列中。在一个方面中,该epsF编码序列是失活的。
[0119] 芽孢杆菌属epsF编码序列的实例包括SEQ ID NO:16的解淀粉芽孢杆菌epsF编码序列(其编码SEQ ID NO:61的多肽)、SEQ ID NO:17的地衣芽孢杆菌epsF编码序列(其编码SEQ ID NO:62的多肽)、以及SEQ ID NO:18的枯草芽孢杆菌epsF编码序列(其编码SEQ ID NO:63的多肽)。
[0120] 在一些实施例中,该内源epsF编码序列(a)编码一种多肽,该多肽与SEQ ID NO:61、62、或63具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:16、17、或18的全长互补链杂交;或(c)与SEQ ID NO:16、17、或18具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0121] 在一些实施例中,该内源epsF编码序列编码一种多肽,该多肽与SEQ ID NO:61、62、或63具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少
95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些实施例中,该内源epsF编码序列编码一种多肽,该多肽具有的序列与SEQ ID NO:61、62、或63中任一个的差异不多于十个氨基酸,例如不多于五个氨基酸、不多于四个氨基酸、不多于三个氨基酸、不多于两个氨基酸或一个氨基酸。在一些实施例中,该内源epsF编码序列编码一种多肽,该多肽包括SEQ ID NO:61、62、或63或由其组成。
[0122] 在一些实施例中,该内源epsF编码序列在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:16、17、或18的全长互补链杂交。
[0123] 在一些实施例中,该内源epsF编码序列与SEQ ID NO:16、17、或18具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些实施例中,该内源epsF编码序列包括SEQ ID NO:16、17、或18或由其组成。
[0124] 在一些方面中,当在相同条件下培养时,与缺乏对该内源epsA-O操纵子的破坏的亲本芽孢杆菌属菌株相比,该突变体产生少至少25%(例如,少至少50%、少至少60%、少至少70%、少至少80%、少至少90%、或少100%)的由该内源epsF编码序列编码的多肽。
[0125] epsG
[0126] 在一些方面中,该内源epsA-O操纵子的破坏发生在epsG编码序列中。在一个方面中,该epsG编码序列是失活的。
[0127] 芽孢杆菌属epsG编码序列的实例包括SEQ ID NO:19的解淀粉芽孢杆菌epsG编码序列(其编码SEQ ID NO:64的多肽)、SEQ ID NO:20的地衣芽孢杆菌epsG编码序列(其编码SEQ ID NO:65的多肽)、以及SEQ ID NO:21的枯草芽孢杆菌epsG编码序列(其编码SEQ ID NO:66的多肽)。
[0128] 在一些实施例中,该内源epsG编码序列(a)编码一种多肽,该多肽与SEQ ID NO:64、65、或66具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:19、20、或21的全长互补链杂交;或(c)与SEQ ID NO:19、20、或21具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0129] 在一些实施例中,该内源epsG编码序列编码一种多肽,该多肽与SEQ ID NO:64、65、或66具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少
95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些实施例中,该内源epsG编码序列编码一种多肽,该多肽具有的序列与SEQ ID NO:64、65、或66中任一个的差异不多于十个氨基酸,例如不多于五个氨基酸、不多于四个氨基酸、不多于三个氨基酸、不多于两个氨基酸或一个氨基酸。在一些实施例中,该内源epsG编码序列编码一种多肽,该多肽包括SEQ ID NO:64、65、或66或由其组成。
[0130] 在一些实施例中,该内源epsG编码序列在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:19、20、或21的全长互补链杂交。
[0131] 在一些实施例中,该内源epsG编码序列与SEQ ID NO:19、20、或21具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些实施例中,该内源epsG编码序列包括SEQ ID NO:19、20、或21或由其组成。
[0132] 在一些方面中,当在相同条件下培养时,与缺乏对该内源epsA-O操纵子的破坏的亲本芽孢杆菌属菌株相比,该突变体产生少至少25%(例如,少至少50%、少至少60%、少至少70%、少至少80%、少至少90%、或少100%)的由该内源epsG编码序列编码的多肽。
[0133] epsH
[0134] 在一些方面中,该内源epsA-O操纵子的破坏发生在epsH编码序列中。在一个方面中,该epsH编码序列是失活的。
[0135] 芽孢杆菌属epsH编码序列的实例包括SEQ ID NO:22的解淀粉芽孢杆菌epsH编码序列(其编码SEQ ID NO:67的多肽)、SEQ ID NO:23的地衣芽孢杆菌epsH编码序列(其编码SEQ ID NO:68的多肽)、以及SEQ ID NO:24的枯草芽孢杆菌epsH编码序列(其编码SEQ ID NO:69的多肽)。
[0136] 在一些实施例中,该内源epsH编码序列(a)编码一种多肽,该多肽与SEQ ID NO:67、68、或69具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:22、23、或24的全长互补链杂交;或(c)与SEQ ID NO:22、23、或24具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0137] 在一些实施例中,该内源epsH编码序列编码一种多肽,该多肽与SEQ ID NO:67、68、或69具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少
95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些实施例中,该内源epsH编码序列编码一种多肽,该多肽具有的序列与SEQ ID NO:67、68、或69中任一个的差异不多于十个氨基酸,例如不多于五个氨基酸、不多于四个氨基酸、不多于三个氨基酸、不多于两个氨基酸或一个氨基酸。在一些实施例中,该内源epsH编码序列编码一种多肽,该多肽包括SEQ ID NO:67、68、或69或由其组成。
[0138] 在一些实施例中,该内源epsH编码序列在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:22、23、或24的全长互补链杂交。
[0139] 在一些实施例中,该内源epsH编码序列与SEQ ID NO:22、23、或24具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些实施例中,该内源epsH编码序列包括SEQ ID NO:22、23、或24或由其组成。
[0140] 在一些方面中,当在相同条件下培养时,与缺乏对该内源epsA-O操纵子的破坏的亲本芽孢杆菌属菌株相比,该突变体产生少至少25%(例如,少至少50%、少至少60%、少至少70%、少至少80%、少至少90%、或少100%)的由该内源epsH编码序列编码的多肽。
[0141] epsI
[0142] 在一些方面中,该内源epsA-O操纵子的破坏发生在epsI编码序列中。在一个方面中,该epsI编码序列是失活的。
[0143] 芽孢杆菌属epsI编码序列的实例包括SEQ ID NO:25的解淀粉芽孢杆菌epsI编码序列(其编码SEQ ID NO:70的多肽)、SEQ ID NO:26的地衣芽孢杆菌epsI编码序列(其编码SEQ ID NO:71的多肽)、以及SEQ ID NO:27的枯草芽孢杆菌epsI编码序列(其编码SEQ ID NO:72的多肽)。
[0144] 在一些实施例中,该内源epsI编码序列(a)编码一种多肽,该多肽与SEQ ID NO:70、71、或72具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:25、26、或27的全长互补链杂交;或(c)与SEQ ID NO:25、26、或27具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0145] 在一些实施例中,该内源epsI编码序列编码一种多肽,该多肽与SEQ ID NO:70、71、或72具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少
95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些实施例中,该内源epsI编码序列编码一种多肽,该多肽具有的序列与SEQ ID NO:70、71、或72中任一个的差异不多于十个氨基酸,例如不多于五个氨基酸、不多于四个氨基酸、不多于三个氨基酸、不多于两个氨基酸或一个氨基酸。在一些实施例中,该内源epsI编码序列编码一种多肽,该多肽包括SEQ ID NO:70、71、或72或由其组成。
[0146] 在一些实施例中,该内源epsI编码序列在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:25、26、或27的全长互补链杂交。
[0147] 在一些实施例中,该内源epsI编码序列与SEQ ID NO:25、26、或27具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些实施例中,该内源epsI编码序列包括SEQ ID NO:25、26、或27或由其组成。
[0148] 在一些方面中,当在相同条件下培养时,与缺乏对该内源epsA-O操纵子的破坏的亲本芽孢杆菌属菌株相比,该突变体产生少至少25%(例如,少至少50%、少至少60%、少至少70%、少至少80%、少至少90%、或少100%)的由该内源epsI编码序列编码的多肽。
[0149] epsJ
[0150] 在一些方面中,该内源epsA-O操纵子的破坏发生在epsJ编码序列中。在一个方面中,该epsJ编码序列是失活的。
[0151] 芽孢杆菌属epsJ编码序列的实例包括SEQ ID NO:28的解淀粉芽孢杆菌epsJ编码序列(其编码SEQ ID NO:73的多肽)、SEQ ID NO:29的地衣芽孢杆菌epsJ编码序列(其编码SEQ ID NO:74的多肽)、以及SEQ ID NO:30的枯草芽孢杆菌epsJ编码序列(其编码SEQ ID NO:75的多肽)。
[0152] 在一些实施例中,该内源epsJ编码序列(a)编码一种多肽,该多肽与SEQ ID NO:73、74、或75具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:28、29、或30的全长互补链杂交;或(c)与SEQ ID NO:28、29、或30具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0153] 在一些实施例中,该内源epsJ编码序列编码一种多肽,该多肽与SEQ ID NO:73、74、或75具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少
95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些实施例中,该内源epsJ编码序列编码一种多肽,该多肽具有的序列与SEQ ID NO:73、74、或75中任一个的差异不多于十个氨基酸,例如不多于五个氨基酸、不多于四个氨基酸、不多于三个氨基酸、不多于两个氨基酸或一个氨基酸。在一些实施例中,该内源epsJ编码序列编码一种多肽,该多肽包括SEQ ID NO:73、74、或75或由其组成。
[0154] 在一些实施例中,该内源epsJ编码序列在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:28、29、或30的全长互补链杂交。
[0155] 在一些实施例中,该内源epsJ编码序列与SEQ ID NO:28、29、或30具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些实施例中,该内源epsJ编码序列包括SEQ ID NO:28、29、或30或由其组成。
[0156] 在一些方面中,当在相同条件下培养时,与缺乏对该内源epsA-O操纵子的破坏的亲本芽孢杆菌属菌株相比,该突变体产生少至少25%(例如,少至少50%、少至少60%、少至少70%、少至少80%、少至少90%、或少100%)的由该内源epsJ编码序列编码的多肽。
[0157] epsK
[0158] 在一些方面中,该内源epsA-O操纵子的破坏发生在epsK编码序列中。在一个方面中,该epsK编码序列是失活的。
[0159] 芽孢杆菌属epsK编码序列的实例包括SEQ ID NO:31的解淀粉芽孢杆菌epsK编码序列(其编码SEQ ID NO:76的多肽)、SEQ ID NO:32的地衣芽孢杆菌epsK编码序列(其编码SEQ ID NO:77的多肽)、以及SEQ ID NO:33的枯草芽孢杆菌epsK编码序列(其编码SEQ ID NO:78的多肽)。
[0160] 在一些实施例中,该内源epsK编码序列(a)编码一种多肽,该多肽与SEQ ID NO:76、77、或78具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:31、32、或33的全长互补链杂交;或(c)与SEQ ID NO:31、32、或33具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0161] 在一些实施例中,该内源epsK编码序列编码一种多肽,该多肽与SEQ ID NO:76、77、或78具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少
95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些实施例中,该内源epsK编码序列编码一种多肽,该多肽具有的序列与SEQ ID NO:76、77、或78中任一个的差异不多于十个氨基酸,例如不多于五个氨基酸、不多于四个氨基酸、不多于三个氨基酸、不多于两个氨基酸或一个氨基酸。在一些实施例中,该内源epsK编码序列编码一种多肽,该多肽包括SEQ ID NO:76、77、或78或由其组成。
[0162] 在一些实施例中,该内源epsK编码序列在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:31、32、或33的全长互补链杂交。
[0163] 在一些实施例中,该内源epsK编码序列与SEQ ID NO:31、32、或33具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些实施例中,该内源epsK编码序列包括SEQ ID NO:31、32、或33或由其组成。
[0164] 在一些方面中,当在相同条件下培养时,与缺乏对该内源epsA-O操纵子的破坏的亲本芽孢杆菌属菌株相比,该突变体产生少至少25%(例如,少至少50%、少至少60%、少至少70%、少至少80%、少至少90%、或少100%)的由该内源epsK编码序列编码的多肽。
[0165] epsL
[0166] 在一些方面中,该内源epsA-O操纵子的破坏发生在epsL编码序列中。在一个方面中,该epsL编码序列是失活的。
[0167] 芽孢杆菌属epsL编码序列的实例包括SEQ ID NO:34的解淀粉芽孢杆菌epsL编码序列(其编码SEQ ID NO:79的多肽)、SEQ ID NO:35的地衣芽孢杆菌epsL编码序列(其编码SEQ ID NO:80的多肽)、以及SEQ ID NO:36的枯草芽孢杆菌epsL编码序列(其编码SEQ ID NO:81的多肽)。
[0168] 在一些实施例中,该内源epsL编码序列(a)编码一种多肽,该多肽与SEQ ID NO:79、80、或81具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:34、35、或36的全长互补链杂交;或(c)与SEQ ID NO:34、35、或36具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0169] 在一些实施例中,该内源epsL编码序列编码一种多肽,该多肽与SEQ ID NO:79、80、或81具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少
95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些实施例中,该内源epsL编码序列编码一种多肽,该多肽具有的序列与SEQ ID NO:79、80、或81中任一个的差异不多于十个氨基酸,例如不多于五个氨基酸、不多于四个氨基酸、不多于三个氨基酸、不多于两个氨基酸或一个氨基酸。在一些实施例中,该内源epsL编码序列编码一种多肽,该多肽包括SEQ ID NO:79、80、或81或由其组成。
[0170] 在一些实施例中,该内源epsL编码序列在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:34、35、或36的全长互补链杂交。
[0171] 在一些实施例中,该内源epsL编码序列与SEQ ID NO:34、35、或36具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些实施例中,该内源epsL编码序列包括SEQ ID NO:34、35、或36或由其组成。
[0172] 在一些方面中,当在相同条件下培养时,与缺乏对该内源epsA-O操纵子的破坏的亲本芽孢杆菌属菌株相比,该突变体产生少至少25%(例如,少至少50%、少至少60%、少至少70%、少至少80%、少至少90%、或少100%)的由该内源epsL编码序列编码的多肽。
[0173] epsM
[0174] 在一些方面中,该内源epsA-O操纵子的破坏发生在epsM编码序列中。在一个方面中,该epsM编码序列是失活的。
[0175] 芽孢杆菌属epsM编码序列的实例包括SEQ ID NO:37的解淀粉芽孢杆菌epsM编码序列(其编码SEQ ID NO:82的多肽)、SEQ ID NO:38的地衣芽孢杆菌epsM编码序列(其编码SEQ ID NO:83的多肽)、以及SEQ ID NO:39的枯草芽孢杆菌epsM编码序列(其编码SEQ ID NO:84的多肽)。
[0176] 在一些实施例中,该内源epsM编码序列(a)编码一种多肽,该多肽与SEQ ID NO:82、83、或84具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:37、38、或39的全长互补链杂交;或(c)与SEQ ID NO:37、38、或39具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0177] 在一些实施例中,该内源epsM编码序列编码一种多肽,该多肽与SEQ ID NO:82、83、或84具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少
95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些实施例中,该内源epsM编码序列编码一种多肽,该多肽具有的序列与SEQ ID NO:82、83、或84中任一个的差异不多于十个氨基酸,例如不多于五个氨基酸、不多于四个氨基酸、不多于三个氨基酸、不多于两个氨基酸或一个氨基酸。在一些实施例中,该内源epsM编码序列编码一种多肽,该多肽包括SEQ ID NO:82、83、或84或由其组成。
[0178] 在一些实施例中,该内源epsM编码序列在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:37、38、或39的全长互补链杂交。
[0179] 在一些实施例中,该内源epsM编码序列与SEQ ID NO:37、38、或39具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些实施例中,该内源epsM编码序列包括SEQ ID NO:37、38、或39或由其组成。
[0180] 在一些方面中,当在相同条件下培养时,与缺乏对该内源epsA-O操纵子的破坏的亲本芽孢杆菌属菌株相比,该突变体产生少至少25%(例如,少至少50%、少至少60%、少至少70%、少至少80%、少至少90%、或少100%)的由该内源epsM编码序列编码的多肽。
[0181] epsN
[0182] 在一些方面中,该内源epsA-O操纵子的破坏发生在epsN编码序列中。在一个方面中,该epsN编码序列是失活的。
[0183] 芽孢杆菌属epsN编码序列的实例包括SEQ ID NO:40的解淀粉芽孢杆菌epsN编码序列(其编码SEQ ID NO:85的多肽)、SEQ ID NO:41的地衣芽孢杆菌epsN编码序列(其编码SEQ ID NO:86的多肽)、以及SEQ ID NO:42的枯草芽孢杆菌epsN编码序列(其编码SEQ ID NO:87的多肽)。
[0184] 在一些实施例中,该内源epsN编码序列(a)编码一种多肽,该多肽与SEQ ID NO:85、86、或87具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:40、41、或42的全长互补链杂交;或(c)与SEQ ID NO:40、41、或42具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0185] 在一些实施例中,该内源epsN编码序列编码一种多肽,该多肽与SEQ ID NO:85、86、或87具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少
95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些实施例中,该epsN编码序列编码一种多肽,该多肽具有的序列与SEQ ID NO:85、86、或87中任一个的差异不多于十个氨基酸,例如不多于五个氨基酸、不多于四个氨基酸、不多于三个氨基酸、不多于两个氨基酸或一个氨基酸。在一些实施例中,该内源epsN编码序列编码一种多肽,该多肽包括SEQ ID NO:85、86、或87或由其组成。
[0186] 在一些实施例中,该内源epsN编码序列在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:40、41、或42的全长互补链杂交。
[0187] 在一些实施例中,该内源epsN编码序列与SEQ ID NO:40、41、或42具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些实施例中,该内源epsN编码序列包括SEQ ID NO:40、41、或42或由其组成。
[0188] 在一些方面中,当在相同条件下培养时,与缺乏对该内源epsA-O操纵子的破坏的亲本芽孢杆菌属菌株相比,该突变体产生少至少25%(例如,少至少50%、少至少60%、少至少70%、少至少80%、少至少90%、或少100%)的由该内源epsN编码序列编码的多肽。
[0189] epsO
[0190] 在一些方面中,该内源epsA-O操纵子的破坏发生在epsO编码序列中。在一个方面中,该epsO编码序列是失活的。
[0191] 芽孢杆菌属epsO编码序列的实例包括SEQ ID NO:43的解淀粉芽孢杆菌epsO编码序列(其编码SEQ ID NO:88的多肽)、SEQ ID NO:44的地衣芽孢杆菌epsO编码序列(其编码SEQ ID NO:89的多肽)、以及SEQ ID NO:45的枯草芽孢杆菌epsO编码序列(其编码SEQ ID NO:90的多肽)。
[0192] 在一些实施例中,该内源epsO编码序列(a)编码一种多肽,该多肽与SEQ ID NO:88、89、或90具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:43、44、或45的全长互补链杂交;或(c)与SEQ ID NO:43、44、或45具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0193] 在一些实施例中,该内源epsO编码序列编码一种多肽,该多肽与SEQ ID NO:88、89、或90具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少
95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些实施例中,该epsO编码序列编码一种多肽,该多肽具有的序列与SEQ ID NO:88、89、或90中任一个的差异不多于十个氨基酸,例如不多于五个氨基酸、不多于四个氨基酸、不多于三个氨基酸、不多于两个氨基酸或一个氨基酸。在一些实施例中,该内源epsO编码序列编码一种多肽,该多肽包括SEQ ID NO:88、89、或90或由其组成。
[0194] 在一些实施例中,该内源epsO编码序列在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:43、44、或45的全长互补链杂交。
[0195] 在一些实施例中,该内源epsO编码序列与SEQ ID NO:43、44、或45具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些实施例中,该内源epsO编码序列包括SEQ ID NO:43、44、或45或由其组成。
[0196] 在一些方面中,当在相同条件下培养时,与缺乏对该内源epsA-O操纵子的破坏的亲本芽孢杆菌属菌株相比,该突变体产生少至少25%(例如,少至少50%、少至少60%、少至少70%、少至少80%、少至少90%、或少100%)的由该内源epsO编码序列编码的多肽。
[0197] mecA
[0198] 已经显示mecA基因的破坏有助于芽孢杆菌属宿主中增加的转化效率(参见WO2014/052630,将其内容通过引用结合在此;以及哈恩(Hahn)等人,1995,分子微生物学(Mol.Microbiol.)18:755-767)。相应地,在一些方面中,这些芽孢杆菌属突变体进一步包含内源mecA基因的破坏。内源mecA基因的破坏可发生在该编码序列和/或启动子序列中。
在一个方面中,该mecA基因是失活的。
[0199] 内源mecA基因的实例包括:包含SEQ ID NO:91的编码序列的解淀粉芽孢杆菌mecA基因(编码SEQ ID NO:92的多肽)、包含SEQ ID NO:93的编码序列的地衣芽孢杆菌mecA基因(编码SEQ ID NO:94的多肽)、以及包含SEQ ID NO:95的编码序列的枯草芽孢杆菌mecA基因(编码SEQ ID NO:96的多肽)。
[0200] 在一些实施例中,该内源mecA编码序列(a)编码一种多肽,该多肽与SEQ ID NO:92、94、或96具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:91、93、或95的全长互补链杂交;或(c)与SEQ ID NO:91、93、或95具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0201] 在一些实施例中,该内源mecA编码序列编码一种多肽,该多肽与SEQ ID NO:92、94、或96具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少
95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些实施例中,该内源epsA编码序列编码一种多肽,该多肽具有的序列与SEQ ID NO:92、94、或96中任一个的差异不多于十个氨基酸,例如不多于五个氨基酸、不多于四个氨基酸、不多于三个氨基酸、不多于两个氨基酸或一个氨基酸。在一些实施例中,该内源mecA编码序列编码一种多肽,该多肽包括SEQ ID NO:92、94、或96或由其组成。
[0202] 在一些实施例中,该内源mecA编码序列在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:91、93、或95的全长互补链杂交。
[0203] 在一些实施例中,该内源mecA编码序列与SEQ ID NO:91、93、或95具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。在一些实施例中,该内源epsA编码序列包括SEQ ID NO:91、93、或95或由其组成。
[0204] 在一些方面中,当在相同条件下培养时,与缺乏对该内源mecA基因的破坏的亲本芽孢杆菌属菌株相比,该突变体产生少至少25%(例如,少至少50%、少至少60%、少至少70%、少至少80%、少至少90%、或少100%)的由该内源mecA编码序列编码的多肽。
[0205] 在一些方面中,当在相同条件下培养时,与缺乏对该内源mecA基因的破坏的亲本芽孢杆菌属菌株相比,该突变体具有改进的转化效率。在一些实施例中,当在相同条件下培养时,与缺乏对该内源mecA基因的破坏的亲本芽孢杆菌属菌株相比,该突变体能够产生多至少10倍(例如,至少100倍、至少1000倍、至少10000倍、或至少100000倍)转化体。
[0206] 在此披露的多核苷酸序列或其子序列;以及在此披露的氨基酸序列或其片段可以用来设计核酸探针,以便根据本领域熟知的方法从不同属或物种的菌株中鉴定并克隆epsA-O操纵子中的同源编码序列。具体而言,可以根据标准DNA印迹程序,使用此类探针与来自感兴趣的芽孢杆菌属物种的DNA杂交,以便鉴定并分离其中的对应基因。这样的探针可以大大短于整个序列,例如至少14个核苷酸、至少25个核苷酸、至少35个核苷酸、至少70个核苷酸长度。该探针可以更长,例如至少100个核苷酸、至少200个核苷酸、至少300个核苷酸、至少400个核苷酸、至少500个核苷酸长度。可以使用甚至更长的探针,例如至少600个核苷酸、至少700个核苷酸、至少800个核苷酸、或至少900个核苷酸长度。DNA和
32 3 35
RNA探针两者都可使用。典型地将探针进行标记,用于检测相应的基因(例如,用 P、H、S、生物素或抗生物素蛋白)。
[0207] 可以针对与上述探针杂交的DNA来筛选由此类其他菌株制备的DNA文库。来自此类其他菌株的基因组DNA或其他DNA可以通过琼脂糖或聚丙烯酰胺凝胶电泳,或其他分离技术来分离。来自文库的DNA或分离的DNA可转移到并固定在硝酸纤维素或其他适合的载体材料上。为了鉴定与在此描述的多核苷酸序列或其子序列同源的克隆或DNA,在DNA印迹法中可以使用载体材料。出于上述探针的目的,杂交是指在非常低至非常高严格条件下,多核苷酸杂交至与多核苷酸序列、其全长互补链、或前述各项的子序列对应的标记核酸探针上。在这些条件下,核酸探针杂交的分子可以使用例X射线胶片而进行检测。
[0208] 对于长度为至少100个核苷酸的长探针而言,非常低至非常高严格条件定义为最佳地按照标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/mL剪切并变性的鲑鱼精子DNA中,以及对于非常低和低严谨度在25%甲酰胺中,对于中和中-高严谨度在35%甲酰胺中,或对于高和非常高严谨度在50%甲酰胺中预杂交和杂交12至24小时。将载体材料最终使用0.2X SSC、0.2%SDS在45℃下(非常低严谨度)、在50℃下(低严谨度)、在55℃下(中严谨度)、在60℃下(中-高严谨度)、在65℃下(高严谨度)以及在
70℃下(非常高严谨度)洗涤三次,每次15分钟。
[0209] 对于长度为约15个核苷酸至约70个核苷酸的短探针而言,严格条件被定义为最佳地,遵循标准DNA印迹程序,在比使用根据博尔顿(Bolton)和麦卡(McCarthy)(美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)48:1390(1962))的计算所计算的Tm低约5℃至约10℃下,在0.9M NaCl、0.09M TrisHCl(pH 7.6)、6mM EDTA、0.5%NP40、1X登哈特氏溶液(Denhardt's solution)、1mM焦磷酸钠、1mM磷酸二氢钠、0.1mM ATP、以及每mL 0.2mg的酵母RNA中预杂交和杂交12至24小时。最后,将载体材料在所计算的Tm之下5℃至10℃,在6X SCC加0.1%SDS中洗涤1次(持续15分钟)并且使用6X SSC洗涤2次(每次15分钟)。
[0210] 由来自不同属或种的菌株的在此描述的epsA-O操纵子的内源编码序列编码的多肽的同系物通常具有以下氨基酸变化,这些氨基酸变化是一种次要性质的变化,即并不显著影响蛋白质的折叠和/或活性的保守氨基酸取代或插入;典型地具有一个到约30个氨基酸的小缺失;小氨基-或羧基-末端延伸,如一种氨基-末端甲硫氨酸残基;具有多达约20-25个残基的一种小连接肽;或通过改变净电荷促进纯化或另一种功能的一种小延伸,如一种聚组氨酸段(poly-histidine tract)、一种抗原表位或一种结合域。
[0211] 保守取代的实例是在下组的范围内:碱性氨基酸(精氨酸、赖氨酸及组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、异亮氨酸及缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸及酪氨酸)及小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸及甲硫氨酸)。一般不会改变比活性的氨基酸取代是本领域已知的并且例如由H.诺伊拉特(Neurath)和R.L.希尔(Hill),1979,在蛋白质(The Proteins),学术出版社(Academic Press),纽约中描述。最常发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu、和Asp/Gly。
[0212] 可以根据本领域已知的程序来鉴定必需氨基酸,例如定点诱变或丙氨酸扫描诱变(坎宁安(Cunningham)和威尔斯(Wells),1989,科学(Science)244:1081-1085)。在后一项技术中,在该分子中的每个残基处引入单个丙氨酸突变,并且对所得突变体分子的活性进行测试以鉴定对于该分子的活性至关重要的氨基酸残基。还参看希尔顿(Hilton)等人,1996,《生物化学杂志》(J.Biol.Chem.)271:4699-4708。也可结合假定接触位点氨基酸的突变,如通过以下技术例如核磁共振、结晶学、电子衍射、或光亲和标记进行确定的对结构进行物理学分析,从而确定酶的活性位点或其他生物学相互作用。参见例如德福斯(de Vos)等人,1992,科学255:306-312;史密斯(Smith)等人,1992,分子生物学杂志224:899-904;
沃勒达尔(Wlodaver)等人,1992,欧洲生物化学学会联盟通讯(FEBS Lett.)309:59-64。还可以从用其他相关酶进行的鉴定分析中推断鉴定必需氨基酸。
[0213] 可以做出单个或多个氨基酸取代、缺失和/或插入并且使用诱变、重组和/或改组的已知方法进行测试,随后进行相关筛选程序,如由里德哈尔-奥尔森(Reidhaar-Olson)和萨奥尔(Sauer),1988,科学(Science)241:53-57;博维(Bowie)和萨奥尔,1989,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)86:2152-2156;WO 95/17413;或WO 95/22625所披露的那些。可以使用的其他方法包括易错PCR、噬菌体展示(例如,洛曼(Lowman)等人,1991,生物化学(Biochemistry)30:10832-10837;美国专利号5,223,409;WO 92/06204)以及区域定向诱变(德比什尔(Derbyshire)等人,1986,基因(Gene)46:145;内尔(Ner)等人,1988,DNA 7:127)。
[0214] 可以结合诱变/改组方法与高通量自动化筛选方法来检测由宿主细胞表达的克隆的、诱变的多肽的活性(内斯(Ness)等人,1999,自然生物技术(Nature Biotechnol.)17:893-896)。编码活性酶的诱变的DNA分子可以回收自宿主细胞,并且使用本领域的标准方法对其进行迅速测序。这些方法允许迅速确定多肽中单个氨基酸残基的重要性。
[0215] epsA-O操纵子的破坏与产生芽孢杆菌属突变体的方法
[0216] 可以使用本领域熟知的方法(包括在此描述的那些方法),通过破坏参照内源epsA-O操纵子来构建在此描述的芽孢杆菌属突变体菌株。可以破坏该操纵子的一部分,例如一个或多个(例如,两个、若干个)编码区或为这些编码区的表达所需的控制序列。该操纵子的这样一种控制序列可以是启动子序列或其功能部分,即足以影响该操纵子的表达的部分。例如,可以将启动子序列失活从而无表达或可以将天然启动子替换为较弱的启动子以减少编码序列的表达。可修饰的其他控制序列包括但不限于前导子、前肽序列、信号序列、转录终止子以及转录激活因子。
[0217] 可以通过基因缺失技术来构建芽孢杆菌属突变体菌株,以消除或减少epsA-O操纵子编码序列的表达。基因缺失技术使得可以部分或完全除去该操纵子,从而消除表达。在此类方法中,使用已经构建为邻接地包含侧翼于这些基因的5’和3’区的一种或多种质粒,通过同源重组完成该操纵子的缺失。
[0218] 还可以通过引入、取代和/或除去该epsA-O操纵子中的或为其转录或翻译所需的其控制序列中的一个或多个(例如,两个、若干个)核苷酸来构建芽孢杆菌属突变体菌株。例如,可以插入或除去核苷酸,用于引入终止密码子、除去起始密码子或移码开放阅读框。
可以根据本领域已知的方法,通过定点诱变或PCR产生的诱变完成这样的修饰。参见,例如波特斯坦(Botstein)和绍特勒(Shortle),1985,《科学》(Science)229:4719;洛(Lo)等人,1985,《美国国家科学院院刊》(Proc.Natl.Acad.Sci.USA)81:2285;樋口(Higuchi)等人,1988,《核酸研究》(Nucleic Acids Res)16:7351;岛田(Shimada),1996,《分子生物学方法》(Meth.Mol.Biol.)57:157;霍(Ho)等人,1989,《基因》(Gene)77:51;霍尔顿(Horton)等人,1989,《基因》(Gene)77:61;以及萨卡尔(Sarkar)和松梅尔(Sommer),1990,《生物技术》(BioTechniques)8:404。
[0219] 还可以通过基因破坏技术,通过将破坏性核酸构建体插入进该epsA-O操纵子中而构建芽孢杆菌属突变体菌株,该破坏性核酸构建体包括与该编码序列同源的核酸片段,该片段将产生具有同源性的区域的重复并且在重复的区域之间掺入构建体DNA。这样的一种基因破坏可以消除表达,如果插入的构建体将该操纵子的启动子与编码区分离或打断编码序列,这样使得产生无功能性或功能性降低的编码序列。破坏构建体可以简单地是伴有与该基因同源的5’和3’区的选择性标记基因。该选择性标记使得可以鉴定包含破坏的操纵子的转化体。
[0220] 还可以通过基因转化过程构建芽孢杆菌属突变体菌株(参见例如,伊格莱西亚斯(Iglesias)和特劳特勒(Trautner),1985,《分子普通遗传学》(Molecular General Genetics)189:73-76)。例如,在基因转化方法中,将对应于该epsA-O操纵子中的序列的核苷酸序列体外诱变,以产生缺陷核苷酸序列,然后将其转化进亲本芽孢杆菌属菌株中以产生缺陷操纵子。通过同源重组,该缺陷核苷酸序列替换该内源序列。该缺陷核苷酸序列还包括一种用于选择含有缺陷序列的转化体的标记可以是令人希望的。
[0221] 可以使用本领域熟知的方法(包括但不限于化学诱变),通过随机或特异诱变进一步构建芽孢杆菌属突变体菌株(参见例如,霍普伍德(Hopwood),微生物学方法中的突变体分离(The Isolation of Mutants in Methods in Microbiology(J.R.诺里斯(Norris)和D.W.里本(Ribbons),编辑))第363-433页,学术出版社(Academic Press),纽约,1970)。可以通过使亲本菌株经受诱变并筛选其中该基因的表达已经被减少或失活的突变体菌株来修饰该epsA-O操纵子。诱变可以是特异的或随机的,例如通过使用适合的物理或化学诱变剂、使用适合的寡核苷酸或使DNA序列经受PCR产生的诱变来进行。此外,诱变可以通过使用这些诱变方法的任何组合来进行。
[0222] 适用于本发明目的的物理或化学诱变剂的实例包括紫外线(UV)照射,羟胺,N-甲基-N’-硝基-N-亚硝基胍(MNNG),N-甲基-N’-亚硝基胍(NTG)邻甲基羟胺,亚硝酸,乙基甲磺酸(EMS),亚硫酸氢钠,甲酸和核苷酸类似物。当使用此类试剂时,诱变典型地是在适合条件下在所选的诱变剂的存在下通过孵育有待诱变的亲本菌株并选择展现出该epsA-O操纵子中编码序列的减少表达或无表达的突变体来进行的。
[0223] 可以使用来自其他微生物来源的与在此描述的序列同源或互补的核苷酸序列来破坏所选的芽孢杆菌属菌株中的对应序列。
[0224] 在一个方面中,芽孢杆菌属突变体中的epsA-O操纵子的破坏未用选择性标记加以标记。可以通过将突变体在反向选择培养基中进行培养来除去选择性标记基因。在该选择性标记基因包含侧翼于其5'和3'端的重复序列的情况下,当该突变体菌株经受反向选择时,这些重复序列将有助于该选择性标记基因通过同源重组而环出。还可以通过向该突变体菌株中引入一个核酸片段,该核酸片段包括缺陷基因的5'和3'区但是缺乏该选择性标记基因,随后在反向选择培养基上进行选择,通过同源重组来除去该选择性标记基因。通过同源重组,包含该选择性标记基因的缺陷基因被缺乏该选择性标记基因的核酸片段替换。还可以使用本领域已知的其他方法。
[0225] 还描述了产生在此描述的芽孢杆菌属突变体的方法。在一个方面中,是一种用于获得在此描述的芽孢杆菌属突变体的方法,该方法包括破坏亲本芽孢杆菌属菌株中的内源epsA-O操纵子。在另一个方面中,是一种用于获得在此描述的芽孢杆菌属突变体的方法,该方法包括:(a)培养亲本芽孢杆菌属菌株;(b)破坏(a)的亲本芽孢杆菌属菌株中的内源epsA-O操纵子;并且(c)分离从(b)中所得突变体菌株。
[0226] 使用芽孢杆菌属突变体的方法
[0227] 将在此描述的芽孢杆菌属突变体用于产生芽孢杆菌属转化体。一个方面是一种获得芽孢杆菌属转化体的方法,该方法包括将异源多核苷酸转化进在此描述的芽孢杆菌属突变体中。另一个方面是一种获得芽孢杆菌属转化体的方法,该方法包括:(a)培养在此描述的芽孢杆菌属突变体(例如,包括内源epsA-O操纵子的破坏的芽孢杆菌属突变体);(b)将异源多核苷酸转化进(a)的该芽孢杆菌属突变体中;并且(c)分离从(b)中所得转化体菌株。
[0228] 在此描述的转化的DNA可以是任何感兴趣的DNA。DNA可以是基因组、cDNA、半合成、合成来源的,或其任何组合。DNA可以是编码具有感兴趣的生物学活性的任何多肽的异源多核苷酸或可以是具有生物学活性的多肽的表达中涉及的DNA(例如启动子)。
[0229] 具有生物学活性的该多肽可以是任何感兴趣的多肽。该多肽对于感兴趣的芽孢杆菌属宿主细胞而言可以是天然的或外源的。该多肽可以是以下提及的多肽和杂合多肽的天然发生的等位基因变异和工程化变异。
[0230] 术语“多肽”在此不意在是指特定长度的编码产物,并且因此,涵盖肽、寡肽和蛋白。术语“多肽”还涵盖杂合多肽,其包括自至少两种不同多肽获得的部分或完整多肽序列的组合,其中一种或多种序列对于芽孢杆菌属细胞而言可以是外源的。多肽进一步包括多肽的天然发生的等位基因变异和工程化变异。
[0231] 在一个方面中,该多肽是抗体、抗原、抗微生物肽、酶、生长因子、激素、免疫调节剂(immunodilator)、神经递质、受体、报告蛋白、结构蛋白以及转录因子。
[0232] 在另一个方面中,该多肽是水解酶、异构酶、连接酶、裂解酶、氧化还原酶或转移酶。在一个最优选的方面中,该多肽是α-葡糖苷酶、氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、葡糖脑苷脂酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、磷脂酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、尿激酶或木聚糖酶。
[0233] 在另一个方面中,该多肽是白蛋白、胶原、弹性蛋白原、弹性蛋白或明胶。
[0234] 在另一个方面中,该多肽是一种杂合多肽,其包括自至少两种不同多肽获得的部分或完整多肽序列的组合,其中一种或多种序列对于芽孢杆菌属宿主细胞而言可以是外源的。
[0235] 在另一个方面中,该多肽是一种融合多肽,其中另一种多肽融合在该多肽或其片段的N-末端或C-末端。通过将编码一种多肽的核苷酸序列(或其部分)融合至编码另一种多肽的核苷酸序列(或其部分)而产生融合多肽。用于产生融合多肽的技术在本领域是已知的,并包括连接编码多肽的编码序列,这样使得它们在框内并且融合多肽的表达处于相同的一个或多个启动子和终止子的控制下。
[0236] 编码感兴趣的多肽的异源多核苷酸可以由任何原核、真核或其他来源获得。出于本发明的目的,在此与给定来源结合使用的术语“从……中获得”应意指该多肽由该来源或有其中已经插入来自该来源的基因的细胞产生。
[0237] 用来分离或克隆编码感兴趣的多肽的异源多核苷酸的技术在本领域中是已知的,并且包括从基因组DNA分离、从cDNA制备或其组合。例如通过使用熟知的聚合酶链式反应(PCR)可以实现从此类基因组DNA中克隆感兴趣的DNA。参见例如,英尼斯(Innis)等人,PCR方案:方法与应用指南(PCR Protocols:A Guide to Methods and Application),学术出版社,纽约,1990。克隆程序可以涉及切割并分离包括编码该多肽的核酸序列的希望的核酸片段,将该片段插入进载体分子中,并且将该重组载体掺入芽孢杆菌属突变体中,其中该核酸序列的多个拷贝或克隆将被复制。DNA可以是基因组、cDNA、RNA、半合成、合成来源的,或其任何组合。
[0238] 可以按多种方式操作编码感兴趣的多肽的异源多核苷酸,以在突变体芽孢杆菌属菌株中提供该多肽的表达。取决于表达载体,在多核苷酸序列插入进载体之前对其进行操作可以是令人希望的或必要的。利用重组DNA方法修饰多核苷酸序列的技术在本领域是熟知的。
[0239] 可以将包括编码多肽的多核苷酸的核酸构建体可操作地连接至一个或多个(例如,两个、若干个)控制序列,这些控制序列能够在与这些控制序列相容的条件下,指导编码序列在本发明的突变体芽孢杆菌属菌株中的表达。
[0240] 控制序列可以是一个适当的启动子序列、一个为本发明的突变体芽孢杆菌属菌株所识别的核苷酸序列,用于表达编码该多肽的该多核苷酸。启动子序列包括介导该多肽的表达的转录控制序列。启动子可以是在突变体芽孢杆菌属菌株中显示出转录活性的任何核苷酸序列,包括突变体、截短和杂合启动子,并且可以获得自编码对该突变体芽孢杆菌属菌株而言天然或外源的细胞外或细胞内多肽的基因。
[0241] 在突变体芽孢杆菌属菌株中,适合指导核酸构建体转录的启动子的实例是获得自以下各项的启动子:解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌α-淀粉酶基因(amyL)、地衣芽孢杆菌青霉素酶基因(penP)、嗜热脂肪芽孢杆菌麦芽淀粉酶基因(amyM)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌xylA和xylB基因、大肠杆菌lac操纵子、大肠杆菌trc启动子(Egon(埃贡)等人,1988,Gene(基因)69:301-315),天蓝链霉菌琼脂酶基因(dagA)、和原核β-内酰胺酶基因(Villa(维拉)-Kamaroff(卡玛诺夫)等人,1978,Proc.Natl.Acad.Sci.USA(美国国家科学院院刊)75:3727-3731),连同tac启动子(DeBoer(德波尔)等人,1983,Proc.Natl.Acad.Sci.USA(美国国家科学院院刊)80:21-25)。其他启动子描述在吉尔伯特(Gilbert)等人,1980,科学美国人(Scientific American)242:74-94的“来自重组细菌的有用蛋白质(Useful proteins from recombinant bacteria)”;以及在萨姆布鲁克(Sambrook)等人,1989,分子克隆实验指南(Molecular Cloning,A Laboratory Manual),第二版,冷泉港(Cold Spring Harbor),纽约。
[0242] 该控制序列还可以是一种适合的转录终止子序列,一种为突变体芽孢杆菌属菌株所识别以终止转录的序列。终止子序列可操作地连接至编码异源多肽的核苷酸序列的3’末端。可以使用在芽孢杆菌属菌株中具有功能的任何终止子。
[0243] 该控制序列还可以是一种适合的前导序列,即对突变体芽孢杆菌属菌株翻译而言重要的mRNA的非翻译区。前导序列可操作地连接至编码异源多肽的核苷酸序列的5’末端。可以使用在突变体芽孢杆菌属菌株中具有功能的任何前导序列。
[0244] 该控制序列还可以是一种信号肽编码序列,其编码连接至多肽的氨基末端并指导编码的多肽进入细胞分泌途径的氨基酸序列。核苷酸序列的编码序列的5'端可以固有地包含在翻译阅读框中与编码分泌的多肽的编码序列的区段天然地连接的一个信号肽编码序列。或者,编码序列的5’端可以包含对于该编码序列而言外源的一个信号肽编码序列。在编码序列不天然地包含信号肽编码序列的情况下,可能需要外来信号肽编码序列。可替代地,外来信号肽编码序列可以单纯地替代天然信号肽编码序列以便增强多肽的分泌。然而,可以在本发明中使用指导表达的多肽进入突变体芽孢杆菌属菌株分泌途径的任何信号肽编码序列,即被分泌进培养基中。
[0245] 可以将重组表达载体用于重组产生感兴趣的多肽,该重组表达载体包括一个核苷酸序列、一个启动子以及转录和翻译终止信号。可以将在此描述的各种核酸和控制序列连接在一起以产生一个重组表达载体,该重组表达载体可以包括一个或多个(例如,两个、若干个)适当的限制酶切位点,以允许在此类位点处插入或取代编码多肽的核苷酸序列。可替代地,可以通过将该核苷酸序列或包括该序列的核酸构建体插入用于表达的适当载体中来表达该核苷酸序列。在产生该表达载体时,该编码序列是位于该载体中,这样使得该编码序列与该供表达的适当控制序列可操作地连接。
[0246] 该重组表达载体可以是可以方便地经受重组DNA程序并且可以引起该核苷酸序列表达的任何载体(例如,质粒或病毒)。载体的选择将典型地取决于该载体与该载体有待引入其中的突变体芽孢杆菌属菌株的相容性。该载体可以是一种线性的或闭合的环状质粒。
[0247] 载体可以是自主复制载体,即,作为染色体外实体存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微染色体、或人工染色体。该载体可以包含用于确保自我复制的任何装置。可替代地,该载体可以是这样一种载体,当它被引入突变体芽孢杆菌属菌株中时,被整合到基因组中并且与其中已整合了它的一个或多个染色体一起复制。此外,可以使用单个载体或质粒或两个或更多个载体或质粒(这些载体或质粒共同包含有待引入到突变体芽孢杆菌属菌株的基因组中的总DNA)或转座子。
[0248] 该载体可以包含一个或多个(例如,两个、若干个)允许容易选择转化的突变体芽孢杆菌属菌株的选择性标记。选择性标记是一种基因,该基因的产物提供了杀生物剂抗性或病毒抗性、重金属抗性、营养缺陷型的原养型、以及类似物。
[0249] 用于在突变体芽孢杆菌属菌株中使用的选择性标记的实例包括但不限于,来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予抗生素抗性(例如氨比西林、氯霉素、卡那霉素或四环素抗性)的标记。
[0250] 该载体可以包含一个或多个(例如,两个、若干个)允许将该载体整合进芽孢杆菌属基因组中或在该细胞中独立于基因组而自主复制的元件。
[0251] 用于整合进突变体芽孢杆菌属菌株的基因组中,该载体可以依赖于编码感兴趣的多肽的多核苷酸的序列或该载体的通过同源或非同源重组而整合进该基因组中的任何其他元件。可替代地,该载体可以包含用于指导通过同源重组而整合进突变体芽孢杆菌属菌株的基因组的染色体中的一个或多个精确位置处的另外的核苷酸序列。为了增加在精确位置处整合的可能性,这些整合的元件应该优选包含足够数目的核酸,例如100至1,500个碱基对,优选400至1,500个碱基对,并且最优选800至1,500个碱基对,这些碱基对与对应的靶序列具有高一致性程度以提高同源重组的可能性。这些整合元件可以是与突变体芽孢杆菌属菌株的基因组中的靶序列同源的任何序列。此外,这些整合元件可以是非编码或编码核苷酸序列。另一方面,该载体可以通过非同源重组而整合进突变体芽孢杆菌属菌株的基因组中。
[0252] 对于自主复制,该载体可以进一步包括使该载体能够在突变体芽孢杆菌属菌株中自主复制的复制起点。复制起点可以是在细胞中起作用的介导自主复制的任何质粒复制子。在此将术语“复制起点”或“质粒复制子”定义为使质粒或载体能够在体内复制的核苷酸序列。在突变体芽孢杆菌属菌株中有用的细菌复制起点的实例是允许在大肠杆菌内进行复制的质粒pBR322、pUC19、pACYC177及pACYC184以及允许在芽孢杆菌内进行复制的pUB110、pE194、pTA1060及pAMβ1的复制起点。
[0253] 用于连接此处所描述的元件以构建重组表达载体的程序是本领域的普通技术人员熟知的(参见,例如,J.萨姆布鲁克(J.Sambrook)等人,1989,见上文)。
[0254] DNA还可以是用于操纵感兴趣的基因的表达的控制序列,例如启动子。上文描述了控制序列的非限制性实例。
[0255] DNA可以进一步是用于使芽孢杆菌属细胞中的感兴趣基因失活的核酸构建体。
[0256] DNA并不限于上面披露的具体实例的范围,因为这些实例意图作为本发明若干方面的说明。
[0257] 可以使用本领域已知的技术,例如如描述于以下实例部分中的电穿孔,而将DNA转化进突变体芽孢杆菌属菌株中。
[0258] 可以使用本领域熟知的标准技术分离在此描述的转化体,包括但不限于,划线平板分离、在富集或选择性培养基中生长、温度生长选择、过滤、或单细胞分离技术(例如流式细胞术和流体技术)。
[0259] 产生多肽和发酵产物的方法
[0260] 多肽
[0261] 如上文所提及,在此描述的芽孢杆菌属突变体可以增加产生芽孢杆菌属转化体的效率,这在例如产生具有生物学活性的多肽中是有用的。因此,在一个方面中,是一种产生具有生物学活性的多肽的方法,该方法包括:(a)在有益于产生该多肽的条件下,培养用编码该多肽的异源多核苷酸转化的芽孢杆菌属宿主细胞,其中该芽孢杆菌属宿主细胞是一种在此描述的芽孢杆菌属突变体;并且(b)回收该多肽。
[0262] 另一个方面是一种产生多肽的方法,该方法包括:(a)培养在此描述的芽孢杆菌属转化体(例如,包括内源epsA-O操纵子的破坏的芽孢杆菌属突变体);并且(b)回收该多肽。
[0263] 使用本领域已知的方法,在适于产生感兴趣的多肽的营养培养基中培养感受态芽孢杆菌属宿主细胞。例如,可以通过在适合的培养基中和在允许表达和/或分离感兴趣的多肽的条件下,进行摇瓶培养,在实验室或工业发酵罐中进行小规模或大规模发酵(包括连续,分批,分批补料或固态发酵)来培养细胞。该培养是使用本领域中已知的程序,在一种适合营养培养基中发生,该培养基包括和氮来源及无机盐。适合的培养基可从商业供应商获得或可以根据公开的组成(例如,在美国典型培养物保藏中心的目录中)制备。可以直接从培养基中回收分泌的感兴趣物质,例如多肽或发酵产物,或者回收全发酵液。
[0264] 可以使用本领域已知的专用于该物质的方法检测具有生物学活性的多肽。这些检测方法可以包括使用特异性抗体、高效液相层析、毛细管层析、酶产物的形成、酶底物的消失或SDS-PAGE。例如,可以使用酶测定来确定具有酶活性的多肽的活性。对于许多酶而言,用于确定酶活性的程序在本领域是已知的(参见例如,D.朔姆堡(Schomburg)和扎尔茨曼(M.Salzmann)(编辑),酶手册(Enzyme Handbook),施普林格出版社(Springer-Verlag),纽约,1990)。
[0265] 可以通过本领域已知的方法分离具有生物学活性的所得多肽。例如,可以通过常规程序,包括但不限于离心、过滤、萃取、喷雾干燥蒸发或沉淀,从培养基中分离感兴趣的多肽。然后,可以通过本领域已知的多种程序进一步纯化分离的多肽,这些程序包括但不限于层析(例如,离子交换层析、亲和层析、疏水层析、聚焦层析和大小排阻层析)、电泳方法(例如,制备性等电聚焦(IEF))、差别溶解度(例如,硫酸铵沉淀)、或萃取(参见,例如,《蛋白纯化》(Protein Purification),编者J.-C.詹森(Janson)和拉尔斯赖登(Lars Ryden),VCH出版社,纽约,1989)。
[0266] 发酵产物
[0267] 在此描述的芽孢杆菌属突变体可以用于代谢工程中,例如用于产生发酵产物。这些突变体的增加的转化效率可以提供使用芽孢杆菌属优于现有宿主的工具,并且可以允许迅速筛选过量表达的异源基因,用于现有及新的代谢途径。
[0268] “发酵”或“发酵过程”是指任何发酵过程或包括发酵步骤的任何过程。发酵过程包括用于消费性醇工业(例如,啤酒和葡萄酒)、乳品工业(例如,发酵的乳制品)、皮革工业、烟草工业以及特种或散装化学品工业的发酵过程。
[0269] 在一个方面中,是一种产生发酵产物的方法,该方法包括:(a)在有益于产生该发酵产物的条件下,培养在此描述的芽孢杆菌属转化体(例如,用一种或多种编码发酵途径的一种或多种多肽的异源多核苷酸转化的、在此描述的芽孢杆菌属突变体);并且(b)回收该发酵产物。
[0270] 该芽孢杆菌属转化体可以是在此描述的任何芽孢杆菌属突变体,该突变体用一个或多个异源发酵途径基因转化,从而引起希望的发酵产物的产生增加。用于发酵多种希望的发酵产物的代谢途径基因及相应的工程化转化体在本领域是已知的,例如以下各项的产生:异丙醇和正丙醇(WO 2012/058603)、3-羟基丙酸(WO 2005/118719)、苹果酸(WO 2011/028643)、1,4-丁二醇(WO 2008/115840)、1,3-丁二醇(WO 2010/127319)、2-丁醇(WO 2010/144746)、THF(WO 2010/141920)、己内酰胺(WO 2010/129936)、己二胺(WO2010/129936)、乙酰丙酸(WO 2010/129936)、2/3-羟基异丁酸(WO 2009/135074)、甲基丙烯酸(WO 2009/135074)、己二酸(WO 2009/151728)、丁二烯(WO 2011/140171)、粘康酸盐(muconate)(WO 2011/017560)以及4-羟基丁(WO 2011/047101)(将这些申请的内容通过引用而特此结合)。在此描述的芽孢杆菌属突变体可以提供用于进一步改进以上引用中的发酵产物的产生的工具。
[0271] 可以在一种可发酵培养基中进行多种产生发酵产物的方法,该可发酵培养基包括一种或多种(例如,两种、若干种)糖,这些糖是例如葡萄糖、果糖、蔗糖、纤维二糖、木糖、木糖、阿拉伯糖、甘露糖、半乳糖和/或可溶的低聚糖。在一些情况下,这种发酵培养基来源于天然来源,例如甘蔗、淀粉、或纤维素;并且可以来自这种来源的酶水解(糖化作用)的预处理。
[0272] 除了来自一种或多种(例如,两种、若干种)糖的适当的碳源之外,该可发酵的培养基可以包含本领域的普通技术人员已知的其他营养素或刺激物,例如大量营养素(如,氮源)以及微量营养素(如,维生素、矿物盐、以及金属辅因子)。在一些方面中,碳源优先TM地可以补充有至少一种碳源,例如酵母提取物、N2、蛋白胨(例如,Bacto 蛋白胨)、或大豆TM
蛋白胨(例如,Bacto 大豆蛋白胨)。维生素的非限制性实例包括多种维生素、生物素、泛酸盐、烟酸、内消旋肌醇、硫胺素、吡哆醇、对氨基苯甲酸、叶酸、核黄素、以及维生素A、维生素B、维生素C、维生素D和维生素E。矿物盐和金属辅因子的实例包括但不限于Na、P、K、Mg、S、Ca、Fe、Zn、Mn以及Cu。
[0273] 典型地向发酵培养基中添加发酵微生物,并且进行发酵持续约8至约96小时,例如约24至约60小时。温度典型地在约26℃至约60℃之间,例如约32℃或50℃,并且约pH3至约pH 8,例如pH 4-5、6、或7。
[0274] 视情况而定,可以在厌氧、基本上厌氧(微好氧)、或好氧条件下进行培养。简言之,厌氧的是指一种缺少氧气的环境,基本上厌氧的(微好氧的)是指一种其中氧气的浓度比空气低的环境,并且好氧是指一种其中氧气浓度大致等于或大于空气的氧气浓度的环境。基本上缺氧条件包括例如使得在培养基中的溶氧浓度保持在小于10%的饱和度的培养、分批发酵或连续发酵。基本上缺氧条件还包括使细胞在维持有小于1%氧气的气氛的密封室内的液体培养基中或固体琼脂上生长或静止。例如可以通过向培养物鼓吹N2/CO2混合物或其他一种或多种适合的非氧气体来维持氧气的百分比。在一些实施例中,在缺氧条件或基本上缺氧条件下进行培养。
[0275] 用于产生发酵产物的方法可以利用任何适合的发酵操作模式。例如,分批模式发酵可以与一个封闭系统一起使用,其中培养基和宿主微生物(在发酵的开始设置的)除了试剂(某些例如用于pH控制、泡沫控制或过程支持所需的其他试剂)之外,没有另外的投入。在此描述的过程还可以在补料分批模式或连续模式中利用。
[0276] 可以在若干生物反应器配置中实践用于产生发酵产物的方法,例如搅拌槽、鼓泡塔、气升式反应器以及本领域的普通技术人员已知的其他反应器。视情况而定,能以游离细胞培养或固定化细胞培养的方式执行这些方法。可以使用任何用于支持固定化细胞培养的材料,例如藻酸盐、纤维床、或菱形材料,例如温、蒙脱石KSF和蒙脱石K-10。
[0277] 发酵产物可以是由发酵得到的任何物质。发酵产物可以是,而不局限于一种醇(例如阿拉伯糖醇、正丁醇、异丁醇、乙醇、甘油(glycerol)、甲醇、乙二醇、1,3-丙二醇[丙二醇]、丁二醇、甘油(glycerin)、山梨醇和木糖醇);一种烷(例如戊烷、己烷、庚烷、辛烷、壬烷、癸烷、十一烷、和十二烷);一种环烷(例如环戊烷、环己烷、环庚烷、和环辛烷),一种烯烃(例如戊烯、己烯、庚烯、和辛烯);一种氨基酸(例如天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸、和苏氨酸);一种气体(例如甲烷、氢气(H2)、二氧化碳(CO2)、和一氧化碳(CO));异戊二烯;一种酮(例如丙酮);一种有机酸(例如乙酸、醋酮酸、己二酸、抗坏血酸柠檬酸、2,5-二酮-D-葡糖酸、甲酸、富酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸草酸、草酰乙酸、丙酸、琥珀酸、和木糖酸);以及聚酮化合物。发酵产物还可以是作为高价值产物的蛋白。
[0278] 在一个方面中,发酵产物是一种醇。应理解的是,术语“醇”涵盖包含一个或多个羟基部分的物质。醇可以是任何醇,包括但不限于丙醇、正丁醇、异丁醇(iso-butanol)、异丁醇(isobutanol)、乙醇、甲醇、阿拉伯糖醇、丁二醇、乙二醇、甘油(glycerin)、丙三醇(glycerol)、1,3-丙二醇、山梨醇或木糖醇。参见例如,宫(Gong)等人,1999,由可再生资源生产乙醇(Ethanol production from renewable resources),在生化工程/生物技术进展(Advances in Biochemical Engineering/Biotechnology)中,舍佩尔,T.(Scheper,T.)编辑,施普林格出版社,柏林,海德堡,德国,65:207-241;西尔维拉(Silveira)和乔纳斯(Jonas),2002,应用微生物学与生物技术(Appl.Microbiol.Biotechnol.)59:400-408;尼加姆(Nigam)和辛格,1995,加工生物化学(Process Biochemistry)30:117-124;埃塞吉(Ezeji)等人,2003,微生物与生物技术世界杂志(World Journal of Microbiology and Biotechnology)19:595-603。
[0279] 在另一个方面中,发酵产物是丙醇,例如异丙醇和/或正丙醇(参见WO2012/058603,将其内容通过引用而特此结合)。
[0280] 在另一个方面中,发酵产物是一种烷烃。烷烃可以是任何直链或支链烷烃,包括但不限于戊烷、己烷、庚烷、辛烷、壬烷、癸烷、十一烷、或十二烷。
[0281] 在另一个方面中,发酵产物是环烷烃,例如环戊烷、环己烷、环庚烷或环辛烷。
[0282] 在另一个方面中,该发酵产物是一种烯烃。烯烃可以是任何直链或支链烯烃,包括但不限于戊烯、己烯、庚烯或辛烯。
[0283] 在另一个方面中,发酵产物是一种氨基酸。氨基酸可以是任何氨基酸,包括但不限于天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸或苏氨酸。参见例如,理查德(Richard)和马加里蒂斯(Margaritis),2004,生物技术与生物工程(Biotechnol.Bioeng.)87:501-515。
[0284] 在另一个方面中,该发酵产物是一种气体。气体可以是任何气体,包括但不限于甲烷、H2、CO2或CO。参见例如,片冈(Kataoka)等人,1997,水科学与技术(Water Science and Technology)36:41-47;以及古纳森兰(Gunaseelan),1997,生物质与生物能源(Biomass and Bioenergy)13:83-114。
[0285] 在另一个方面中,该发酵产物是异戊二烯。
[0286] 在另一个方面中,该发酵产物是一种酮。术语“酮”涵盖包含一个或多个酮部分的物质。在一个方面中,该酮是丙酮。
[0287] 在另一个方面中,发酵产物是一种有机酸。有机酸可以是任何有机酸,包括但不限于乙酸、醋酮酸、己二酸、抗坏血酸、柠檬酸、2,5-二酮-D-葡糖酸、甲酸、富马酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、丙酸、琥珀酸或木糖酸。参见,例如,陈(Chen)和李(Lee),1997,生物化学与生物技术(Biochem.Biotechnol.)63-65:435-448。在一些方面中,发酵产物是一种氨基酸。氨基酸可以是任何氨基酸,包括但不限于天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸或苏氨酸。参见例如,理查德(Richard)和马加里蒂斯(Margaritis),2004,生物技术与生物工程(Biotechnol.Bioeng.)87:501-515。
[0288] 在另一个方面中,该发酵产物是聚酮化合物。
[0289] 可以使用本领域已知的方法进行用于测试发酵产物的产生的适合测定,如以上针对多肽所描述的。例如,可以通过多种方法(例如HPLC(高效液相层析)、GC-MS(气相层析-质谱法)和LC-MS(液相层析-质谱法))或使用本领域熟知的常规程序的其他适合的分析方法对发酵产物(以及其他有机化合物,例如副产品)进行分析。还可以用培养上清液测试发酵液中的发酵产物的释放。可以使用例如针对葡萄糖和醇类的折光率检测器、以及针对有机酸的UV检测器通过HPLC(林(Lin)等人,2005,生物技术与生物工程(Biotechnol Bioeng)90:775-779),或使用本领域熟知的其他适合的测定和检测方法量化在发酵培养基中的副产品和残余的糖(例如,葡萄糖)。
[0290] 可以使用本领域已知的任何程序从发酵培养基中回收发酵产物,这些程序包括但不限于层析(例如,尺寸排阻层析、吸附层析、离子交换层析)、电泳程序、溶解度差异、蒸馏、萃取(例如,液液萃取)、渗透蒸发、萃取过滤、膜过滤、膜分离、反渗透超滤或结晶化。
[0291] 通过说明提供了以下实例,并且并不旨在使限制本发明。
[0292] 实例
[0293] 用作缓沖液和底物的化学品至少是试剂等级的商品。
[0294] 菌株
[0295] 大肠杆菌
[0296] 将One ShotTMTOP10化学感受态大肠杆菌细胞(英杰公司(Invitrogen),卡尔斯巴TM德,加利福尼亚州,美国)和Sure 感受态细胞(Stratagene公司,拉荷亚,加利福尼亚州,美国)用于常规质粒构建与繁殖。
[0297] 地衣芽孢杆菌(Bacillus licheniformis)
[0298] 将地衣芽孢杆菌SJ1904(美国专利号5,733,753)用作进行如下所述破坏的宿主。
[0299] 解淀粉芽孢杆菌(Bacillus amyloliquefaciens)
[0300] 将解淀粉芽孢杆菌 FZB24( EPA登 记号:70127-5,EPA商 号:33967-NJ-1)用作进行如下所述破坏的宿主。
[0301] 培养基
[0302] 使芽孢杆菌属菌株生长在TBAB(胰蛋白胨血琼脂基质,Difco实验室,斯帕克斯,马里兰州,美国)或LB琼脂平板(10g/l胰蛋白胨、5g/l酵母提取物、5g/l NaCl,15g/l琼脂)板上或生长于LB液体培养基(10g/l胰蛋白胨、5g/l酵母提取物、5g/l NaCl)中。
[0303] 为了选择红霉素抗性,将琼脂培养基补充1μg/ml红霉素+25μg/ml洁霉素并且将液体培养基补充5μg/ml红霉素。为了选择大观霉素抗性,将琼脂培养基补充120μg/ml大观霉素。为了选择氯霉素抗性,将琼脂培养基补充5μg/ml氯霉素。
[0304] 斯皮宰曾(Spizizen)I培养基由以下组成:1x斯皮宰曾盐(6g/l KH2PO4、14g/l K2HPO4、2g/l(NH4)2SO4、1g/l柠檬酸钠、0.2g/l MgSO4,pH 7.0)、0.5%葡萄糖、0.1%酵母提取物以及0.02%酪蛋白水解物。
[0305] 斯皮宰曾II培养基由补充有0.5mM CaCl2和2.5mM MgCl2的斯皮宰曾I培养基组成。
[0306] 实例1:包含破坏的epsA-O操纵子的解淀粉芽孢杆菌菌株的构建(BaC0171)[0307] 本实例描述了在epsH和epsG编码序列内通过缺失核苷酸破坏epsA-O操纵子。
[0308] 将质粒pBM340设计为在解淀粉芽孢杆菌epsH基因中缺失421bp并且在epsG基因中缺失217bp。根据先前描述的方法(皮彻(Pitcher)等人,1989,应用微生物学简讯(Letters in Applied Microbiology)8(4):151-156),从解淀粉芽孢杆菌FZB24中分离基因组DNA。使用以下所述的引物1202693和1203820,通过PCR扩增解淀粉芽孢杆菌FZB24染色体的1984bp片段。
[0309] 引物1202693:
[0310] 5′-GATCGGATCCATCGCCGTCCGCAAAACCGATATAA-3′(SEQ ID NO:97)
[0311] 引物1203820:
[0312] 5′-CGGAAGCATTTGGGAGATCTCGATCGCTTCAGCGTACGCG-3′(SEQ ID NO:98)[0313] 将限制性内切酶BamHI(粗体)的切割位点掺入进引物1203820中。
[0314] 使用以下所述的引物1203819和1202694,通过PCR扩增解淀粉芽孢杆菌FZB24染色体的第二个1927bp片段。
[0315] 引物1203819:
[0316] 5′-CGCGTACGCTGAAGCGATCGAGATCTCCCAAATGCTTCCG-3′(SEQ ID NO:99)[0317] 引物1202694:
[0318] 5 ′ -GATCGGATCCATTATATCGCCAGGCAGGACGGTGATGACA TCTCCAAC-3 ′ (SEQ ID NO:100)
[0319] 将BamHI限制性内切酶(粗体)的切割位点掺入进引物1202694中。引物1203820和1203819互补。加
[0320] 使用扩展高保真 PCR系统( High Fidelityplus PCR system)(罗氏诊断公司(Roche Diagnostics),曼海姆,德国)通过PCR扩增对应的DNA片段。PCR混合物含有大约1μg的解淀粉芽孢杆菌FZB24基因组DNA、1μl的正义引物(50pmol/μl)、
1μl的反义引物(50pmol/μl)、10μl含15mM MgCl2的5X PCR缓冲液、1μl的dNTP混合液(每种10mM)、32.25μl的水、以及0.75μl的DNA聚合酶混合物(3.5U/μl)。使用热循环仪用以下设置扩增片段:一个循环,94℃ 2分钟;10个循
环,每个为94℃ 15秒、58℃ 30秒以及72℃ 2分钟;15个循环,每个为94℃ 15秒、58℃
30秒以及72℃ 2分钟,且每个循环依次加5秒的延长;一个循环,72℃ 7分钟以及在4℃保持。根据制造商的说明书,使用 凝胶提取试剂盒(凯杰公司(Qiagen,Inc.),巴伦西亚,加利福尼亚州,美国),用1x TBE缓冲液(10.8g/l Tris碱,5.5g/l酸和2mM EDTA pH 8)从0.7%琼脂糖(Amresco公司,梭伦,俄亥俄州)凝胶中纯化PCR产物。

[0321] 将纯化的PCR产物用于通过剪接重叠(SOE)PCR使用 高保真 PCR系统( High Fidelityplus PCR System)如下产生单片段。PCR混合物含有大约
50ng的来自引物组合1202693/1203820的凝胶纯化的PCR产物、大约50ng的来自引物组合1203819/1202694的凝胶纯化的PCR产物、1μl的引物1202693(50pmol/μl)、1μl的引物1202694(50pmol/μl)、10μl含15mM MgCl2的5X PCR缓冲液、1μl的dNTP混合物(各自10mM)、32.25μl水、以及0.75μl的DNA聚合酶混合物(3.5U/μl)。使用热循环仪用以下设置扩增片段:一个循环,94℃ 2分钟;10个循
环,每个为94℃ 15秒、58℃ 30秒以及72℃ 4分钟;15个循环,每个为94℃ 15秒、58℃
30秒以及72℃ 4分钟,且每个循环依次加5秒的延长;一个循环,72℃7分钟以及在4℃保持。根据制造商的说明书,使用 凝胶提取试剂盒,用1X TBE缓冲液从0.7%琼脂糖(Amresco公司)凝胶中纯化所得3959bp PCR产物。
[0322] 将纯化的PCR产物和质粒pShV2(EP 0941349B1)各自用BamHI进行消化,并且根据制造商的说明书,通过使用TBE缓冲液进行0.7%琼脂糖凝胶电泳,随后使用凝胶提取试剂盒进行纯化而分离所得的片段。遵循制造商的说明书,使用快速DNA连接试剂盒连接这些片段。根据制造商的说明书,将连接物的2μl等分部分用于转化TM大肠杆菌OneShot 细胞。从大肠杆菌转化体中制备质粒DNA并且使用限制性内切酶BamHI消化,随后使用TBE缓冲液进行0.7%琼脂糖凝胶电泳。将鉴定为具有正确的限制图谱的质粒指定为pBM340。
[0323] 根据先前描述的方法(美国专利号5,843,720),通过染色体整合与切割将热敏质粒pBM340掺入解淀粉芽孢杆菌FZB24的基因组中。使包含质粒pBM340的解淀粉芽孢杆菌FZB24转化体在50℃下生长在TBAB选择培养基上,以推动载体整合。基于其在50℃下在TBAB红霉素/洁霉素选择培养基上生长的能力选择希望的整合体。然后,使整合体于37℃下无选择性地生长在LB液体培养基中,以允许切除整合的质粒。将细胞涂布在LB琼脂平板上并且针对红霉素-敏感性进行筛选。
[0324] 根据先前描述的方法(皮彻(Pitcher)等人,1989,见上文),从以上若干红霉素/洁霉素敏感分离体中制备基因组DNA。基因组PCR确认了epsG和epsH编码序列的破坏。将所得菌株指定为BaC0171(FZB24epsGΔ887-1104,epsHΔ1-421)。
[0325] 实例2:转化质粒的构建,pBM331
[0326] 将质粒pBM331用于说明性目的以确定菌株BaC0171的增加的转化效率。此质粒是基于pNNB194的质粒(美国专利号5,958,728),该质粒允许在含有红霉素/洁霉素的琼脂平板上在34℃下选择转化体。按如下方法构建质粒pBM331。
[0327] 将质粒pBM331设计为缺失解淀粉芽孢杆菌srfAC基因。根据先前描述的方法(皮彻(Pitcher)等人,1989,见上文),从解淀粉芽孢杆菌FZB24中分离基因组DNA。使用以下所述的引物1202649和1202650,通过PCR扩增解淀粉芽孢杆菌FZB24染色体的532bp片段。
[0328] 引物1202649:
[0329] 5′-GATCCTCGAGAAAACGGTAAAAGAGACG-3′(SEQ ID NO:101)
[0330] 引物1202650:
[0331] 5′-CCATTGGCGGGCTTCCTCCTTTTCTGCTCCGCTCCCCCCTTCTGTT-3′(SEQ ID NO:102)[0332] 将限制性内切酶XhoI(粗体)的切割位点掺入进引物1202649中。
[0333] 使用以下所述的引物1203819和1202694,通过PCR扩增解淀粉芽孢杆菌FZB24染色体的第二个533bp片段。
[0334] 引物1202651:
[0335] 5′-AACAGAAGGGGGGAGCGGAGCAGAAAAGGAGGAAGCCCGCCAATGG-3′(SEQ ID NO:103)[0336] 引物1202652:
[0337] 5′-GATCCTCGAGTGAAAGAAGGCAGG-3′(SEQ ID NO:104)
[0338] 将BamHI限制性内切酶(粗体)的切割位点掺入进引物1202694中。引物1202650和1202651互补。
[0339] 使用扩展高保真加PCR系统( High Fidelityplus PCR system)通过PCR扩增对应的DNA片段。PCR混合物含有大约1μg的解淀粉芽孢杆菌FZB24基因组DNA、1μl的正义引物(50pmol/μl)、1μl的反义引物(50pmol/μl)、10μl含15mM MgCl2的5X PCR缓冲液、1μl的dNTP混合物(每种10mM)、32.25μl的水、以及0.75μl的DNA聚合酶混合物(3.5U/μl)。使用 热循环仪用以下设置扩增片段:一个循环,94℃ 2分钟;10个循环,每个为94℃ 15秒、58℃ 30秒以及72℃ 30秒;15个循环,每个为
94℃ 15秒、58℃30秒以及72℃ 30秒,且每个循环依次加5秒的延长;一个循环,72℃7分钟以及在4℃保持。根据制造商的说明书,使用 凝胶提取试剂盒,用1X TBE缓冲液从0.7%琼脂糖(Amresco公司,梭伦,俄亥俄州,美国)凝胶中纯化PCR产物。

[0340] 将纯化的PCR产物用于b7SOE PCR使用 高保真 PCR系统(High Fidelityplus PCR System)如下产生单片段。PCR混合物含有大约50ng的来自引物组合1202649/1202650的凝胶纯化的PCR产物、大约50ng的来自引物组合1202651/1202652的凝胶纯化的PCR产物、1μl的引物1202649(50pmol/μl)、1μl的引物1202652(50pmol/μl)、10μl含15mM MgCl2的5X PCR缓冲液、1μl的dNTP混合物(各自10mM)、32.25μl水、以及0.75μl的DNA聚合酶混合物(3.5U/μl)。使用 热循
环仪用以下设置扩增片段:一个循环,94℃ 2分钟;10个循环,每个为94℃ 15秒、58℃ 30秒以及72℃ 1分钟;15个循环,每个为94℃ 15秒、58℃ 30秒以及72℃ 1分钟,且每个循环依次加5秒的延长;一个循环,72℃ 7分钟以及在4℃保持。根据制造商的说明书,使用凝胶提取试剂盒,用1X TBE缓冲液从0.7%琼脂糖(Amresco公司)凝胶中纯
化所得1019bp PCR产物。
[0341] 将纯化的PCR产物和质粒pBM317(WO 2014/052630)各自用XhoI进行消化,并且根据制造商的说明书,通过使用TBE缓冲液进行0.7%琼脂糖凝胶电泳,随后使用凝胶提取试剂盒进行纯化而分离所得的片段。遵循制造商的说明书,使用快速DNA连接试剂盒连接这些纯化的片段。根据制造商的说明书,将连接物的2μl等分部分用TM于转化大肠杆菌OneShot 细胞。从大肠杆菌转化体中制备质粒DNA并且使用限制性内切酶XhoI消化,随后使用TBE缓冲液进行0.7%琼脂糖凝胶电泳。将鉴定为具有正确的限制图谱的质粒指定为pBM331。在转化实验之前,根据制造商的说明(凯杰公司(Qiagen,Inc.),巴伦西亚,加利福尼亚州,美国),使用 大量制备(Maxi-prep)程序从大肠杆菌SCS110(Stratagene公司,拉荷亚,加利福尼亚州,美国)细胞中分离质粒pBM331。
[0342] 实例3:包含破坏的epsA-O操纵子的解淀粉芽孢杆菌菌株的转化效率(BaC0171)[0343] 将在实例1中所描述的包括epsA-O操纵子的破坏的解淀粉芽孢杆菌菌株BaC0171涂布在LB琼脂板上,以在37℃下孵育过夜后获得单菌落分离菌。孵育过夜后,将一个菌落接种于10ml的LB液体培养基中,并且在37℃下在摇动培养箱中生长过夜。使用大约250μl的过夜培养物接种12ml的斯皮宰曾I培养基,该培养基包含30μl的1M MgCl2。使用克莱特(Klett)光密度计监测生长直到细胞进入静止期早期。收获细胞,并将500ml的细胞培养物添加至15ml猎鹰2059管中。将转化质粒DNA(携带实例2中所描述的红霉素抗性基因的质粒pBM331)以下文所示的量添加至该转化混合物中,并且在34℃下,250rpm孵育30分钟。30分钟之后,将2微升的50mg/ml红霉素添加至该转化混合物中。将该培养物在34℃下,250rpm进一步孵育另外的一小时,之后将细胞涂布在TBAB(加有红霉素)琼脂板上。将这些板在34℃培养箱中孵育直到出现菌落。第二天对菌落计数,以确定转化效率。
[0344] 将两个独立实验(使用两微克的转化质粒DNA)的结果示于图3中(实际转化频率如下:实验I(Expt I)FZB2415CFUs,BaC0171541CFUs。实验II(Expt II)FZB242CFUs,BaC017122CFUs)。将两个另外的独立实验(使用四微克的转化质粒DNA)的结果示于图4中(实际转化频率如下:实验I FZB2412CFUs,BaC0171290CFUs。实验II FZB247CFUs,BaC0171>5900CFUs)。根据这些实验,与亲本菌株FZB24相比时,epsA-O操纵子的破坏导致芽孢杆菌属菌株(菌株BaC0171)显示出显著更高的转化效率。
[0345] 实例4:地衣芽孢杆菌mecA-破坏的菌株(TaHy9)的构建。
[0346] 将质粒pBM294设计为在地衣芽孢杆菌mecA基因中缺失500bp。根据先前描述的方法(皮彻(Pitcher)等人,1989,见上文),从地衣芽孢杆菌SJ1904中分离基因组DNA。使用以下所述的引物0612056和0612057,通过PCR扩增地衣芽孢杆菌SJ1904染色体的323bp片段(包括mecA编码序列的前67bp)。
[0347] 引物0612056(SEQ ID NO:105):
[0348] 5′-GAATTCCATTAATAGCTGCTG-3′
[0349] 引物0612057(SEQ ID NO:106):
[0350] 5′-TCCATACTCTTTCAGCATGGTCTTCGATATCACCGT-3′
[0351] 将限制性内切酶EcoRI(粗体)的切割位点掺入进引物0612056中。引物0612057掺入对应于mecA编码序列的bp 568至588的18bp(加下划线的)。
[0352] 使用以下所示的引物0612058和0612060,通过PCR扩增地衣芽孢杆菌SJ1904染色体的第二个288bp片段(包括mecA编码序列的从核苷酸568至639的区段)。
[0353] 引物0612058(SEQ ID NO:107):
[0354] 5′-ACGGTGATATCGAAGACCATGCTGAAAGAGTATGGA-3′
[0355] 引物0612060(SEQ ID NO:108):
[0356] 5′-CTCGAGCGCATCCTCCCAAAATC-3′
[0357] 将XhoI限制性内切酶(粗体)的切割位点掺入进引物0612060中。引物0612058掺入对应于mecA编码序列的bp 47至67的18bp(加下划线的)。引物0612057和0612058互补。
[0358] 使用扩展高保真加PCR系统( High Fidelityplus PCR system)通过PCR扩增对应的DNA片段。PCR混合物含有4μl(~1μg)的地衣芽孢杆菌SJ1904基因组DNA、1μl的正义引物(50pmol/μl)、1μl的反义引物(50pmol/μl)、10μl含15mM MgCl2的5X PCR缓冲液、1μl的dNTP混合物(每种10mM)、32.25μl的水、以及0.75μl的DNA聚合酶混合物(3.5U/μl)。使用 热循环仪用以下设置扩增片段:一个
循环,94℃ 2分钟;10个循环,每个为94℃ 15秒、58℃ 30秒以及72℃ 20秒;15个循环,每个为94℃ 15秒、58℃30秒以及72℃ 20秒,且每个循环依次加5秒的延长;一个循环,
72℃7分钟以及在4℃保持。根据制造商的说明书,使用 凝胶提取试剂盒,用
1X TBE缓冲液从1.2%琼脂糖(Amresco公司,梭伦,俄亥俄州,美国)凝胶中纯化PCR产物。
[0359] 将纯化的PCR产物用于随后的PCR反应中,以通过SOE PCR(使用 高保真加PCR系统( High Fidelityplus PCR System)如下产生单片段。PCR混合物含有2μl(~50ng)的来自引物组合0612056/0612057的凝胶纯化的PCR产物、2μl(~50ng)的来自引物组合0612058/0612060的凝胶纯化的PCR产物、1μl的引物0612056(50pmol/μl)、1μl的引物0612060(50pmol/μl)、10μl含15mM MgCl2的5X PCR缓冲液、1μl的dNTP混合物(各自10mM)、32.25μl水、以及0.75μl的DNA聚合酶混合物(3.5U/μl)。使用 热循环仪用以下设置扩增片段:一个循环,94℃ 2分钟;10个
循环,每个为94℃ 15秒、58℃ 30秒以及72℃ 40秒;15个循环,每个为94℃ 15秒、58℃
30秒以及72℃ 40秒,且每个循环依次加5秒的延长;一个循环,72℃ 7分钟以及在4℃保持。根据制造商的说明书,使用 凝胶提取试剂盒,用1X TBE缓冲液从1.2%琼脂糖(Amresco公司)凝胶中纯化所得611bp PCR产物。
[0360] 根据制造商的说明书,将纯化的PCR产物克隆进质粒pCR2.1-TOPO(英杰公司,卡尔斯巴德,加州,美国)中,从而产生指定为pBM293的质粒。将质粒pBM293和质粒pNNB194(美国专利号5,958,728)用限制性内切酶XhoI和EcoRI消化,以分别分离606bp插入片段和载体片段。根据制造商的说明书,通过使用TBE缓冲液进行1%琼脂糖凝胶电泳,随后使用 凝胶提取试剂盒进行纯化而分离这些片段。遵循制造商的说明书,使用快速DNA连接试剂盒连接这些片段。根据制造商的说明书,将连接物的2μl等分TM部分用于转化大肠杆菌Sure 细胞。从大肠杆菌转化体中制备质粒DNA并使用限制性内切酶EcoRI和XhoI消化,随后使用TBE缓冲液进行0.7%琼脂糖凝胶电泳并且将鉴定为具有正确的限制图谱的质粒指定为pBM294。
[0361] 根据先前描述的方法(美国专利号5,843,720),通过染色体整合与切割将热敏质粒pBM294掺入地衣芽孢杆菌SJ1904的基因组中。使包含质粒pBM294的地衣芽孢杆菌SJ1904转化体在50℃下生长在TBAB选择培养基上,以推动载体整合。基于其在50℃下在TBAB红霉素/洁霉素选择培养基上生长的能力选择希望的整合体。然后,使整合体于37℃下无选择性地生长在LB培养基中,以允许切除整合的质粒。将细胞涂布在LB琼脂平板上并且针对红霉素-敏感性进行筛选。
[0362] 根据先前描述的方法(皮彻(Pitcher)等人,1989,见上文),从以上若干红霉素/洁霉素敏感分离体中制备基因组DNA。基因组PCR确认了mecA的破坏并且将所得菌株指定为TaHY9。
[0363] 实例5:地衣芽孢杆菌mecA-破坏的菌株(TaHy9)的转化效率。
[0364] 将来自实例4的地衣芽孢杆菌mecA-破坏的菌株TaHy9涂布在LB琼脂板上,以在37℃下孵育过夜后获得汇合生长。孵育过夜后,向每个板中添加大约2-3ml的斯皮宰曾I培养基。使用无菌涂布器将细胞刮出并且转移进15ml猎鹰(Falcon)2059管中。使用大约
500μl的此培养物接种50ml的斯皮宰曾I培养基,该培养基包含1%木糖作为唯一碳源。
使用克莱特(Klett)光密度计监测生长。在对应于克莱特(Klett)单位140、160、180及
200的每个细胞密度处,向猎鹰2059管中添加250μl的培养物加包含2mM EGTA的250μl斯皮宰曾II培养基。向每个管中添加一微克的转化DNA(包含整合在glpD基因座处的大观霉素抗性表达盒的地衣芽孢杆菌MDT232染色体DNA;参见WO 2008/079895)。两微升的
50μg/ml大观霉素也被包括在转化混合物中。将管在37℃下在设置为250rpm的旋转摇床上孵育1小时。将转化反应物涂覆在包含120μg/ml的大观霉素的LB琼脂板上。第二天对菌落计数,以确定转化效率。
[0365] 在指数生长期过程中,在破坏的mecA菌株中达到地衣芽孢杆菌感受态状态并且随着细胞进入静止期而下降(图5)。在克莱特光密度计读数为160处获得最高转化效率并且随着细胞达到静止期,转化效率下降。
[0366] 实例6:地衣芽孢杆菌mecA-破坏的菌株(TaHy9)的DNA微阵列分析。
[0367] 为了获得对地衣芽孢杆菌感受态发展的另外的理解,使用DNA微阵列技术比较地衣芽孢杆菌菌株TaHy9(见上文)和MMar2(地衣芽孢杆菌SJ1904amyL::Xylp-comK,包含木糖诱导型启动子的转录控制之下的comK基因的第二个拷贝的地衣芽孢杆菌菌株;参见US 2010/0028944)中的整体转录图谱。如描述于实例2中,使菌株TaHy9和MMar2一式三份地生长于包含斯皮宰曾I+1%木糖培养基的摇瓶培养物中,以在克莱特光密度计上读出160。从一式三份的摇瓶培养物中纯化RNA样品并且使用设计为与枯草芽孢杆菌菌株168,A164和地衣芽孢杆菌SJ1904一起使用的定制Affymetrix微阵列芯片(昂飞公司(Affymetrix Inc.),圣克拉拉,加利福尼亚州,美国)进行DNA微阵列分析。根据制造商TM TM针对细菌RNA分离的建议,使用FastRNA Pro蓝色试剂盒(FastRNA Pro Blue Kit)(MP生物医学有限责任公司(MP Biomedicals,LLC),梭伦,OH,美国)分离RNA。将细胞以最大速度(速度6)在 仪器(MP生物医学有限责任公司(MP Biomedicals,LLC),梭伦,TM
OH,美国)中破坏两次,持续40秒。另外,根据制造商的说明,使用RNeasy 柱(凯杰公司,瓦伦西亚(Valencia),加利福尼亚州,美国)进一步纯化来自每个样品的45μg的RNA。使用生物分析器(Bioanalyzer)仪器(安捷伦科技公司(Agilent Technologies Inc.),圣克拉拉,加利福尼亚州,美国)测量RNA样品的质量、完整性和浓度。将RNA样品和定制的Affymetrix微阵列芯片提交至UCLA临床芯片核心研究机构(Clinical Microarray Core Research Facility)(洛杉矶,加利福尼亚,美国),用于标记、杂交与扫描。如先前所描述(吉莱斯皮(Gillespie)等人,2010,BMC研究笔记(BMC Research Notes)3(81)),使用定制脚本分析微阵列数据。使用稳健多阵列平均值(Robust Multi-array Average)(RMA)(伊里萨里(Irizarry)等人,2003,生物统计学(Biostatistics)4:249-264)标准化数据,随后使用微阵列数据(Limma)软件的线性方式分析差异表达(史密斯(Smyth),2005,在使用R和生物执行器的生物信息学和计算生物学解决方案(Bioinformatics and Computational Biology Solutions using R and Bioconductor)中的Limma:微阵列数据的线性方式(Limma:Linearmodels formicroarray data).施普林格(Springer),纽约,第397-420页)。
[0368] 与菌株MMar2相比(p<0.05),微阵列数据揭示了地衣芽孢杆菌菌株TaHy9中的epsH、tapA、sigW以及tasA基因的显著增加的转录本水平。
[0369] 本发明在下面各段中进行了进一步的定义:
[0370] 1.一种突变体芽孢杆菌属菌株,其包含内源epsA-O操纵子的破坏。
[0371] 2.如段落1所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是内源epsA编码序列的破坏。
[0372] 3.如段落2所述的突变体芽孢杆菌属菌株,其中该内源epsA编码序列(a)编码一种多肽,该多肽与SEQ ID NO:46、47、或48具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:1、2、或3的全长互补链杂交;或(c)与SEQ ID NO:1、2、或3具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或
100%序列一致性。
[0373] 4.如段落2或3所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是在内源epsA编码序列的编码区内。
[0374] 5.如段落2-4中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是在内源epsA编码序列的控制序列内。
[0375] 6.如段落1-5中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是内源epsB编码序列的破坏。
[0376] 7.如段落6所述的突变体芽孢杆菌属菌株,其中该内源epsB编码序列(a)编码一种多肽,该多肽与SEQ ID NO:49、50、或51具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:4、5、或6的全长互补链杂交;或(c)与SEQ ID NO:4、5、或6具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或
100%序列一致性。
[0377] 8.如段落6或7所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是在内源epsB编码序列的编码区内。
[0378] 9.如段落6-8中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是在内源epsB编码序列的控制序列内。
[0379] 10.如段落1-9中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是内源epsC编码序列的破坏。
[0380] 11.如段落10所述的突变体芽孢杆菌属菌株,其中该内源epsC编码序列(a)编码一种多肽,该多肽与SEQ ID NO:52、53、或54具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:7、8、或9的全长互补链杂交;或(c)与SEQ ID NO:7、8、或9具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0381] 12.如段落10或11所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是在内源epsC编码序列的编码区内。
[0382] 13.如段落10-12中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是在内源epsC编码序列的控制序列内。
[0383] 14.如段落1-13中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是内源epsD编码序列的破坏。
[0384] 15.如段落14所述的突变体芽孢杆菌属菌株,其中该内源epsD编码序列(a)编码一种多肽,该多肽与SEQ ID NO:55、56、或57具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:10、11、或12的全长互补链杂交;或(c)与SEQ ID NO:10、11、或12具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0385] 16.如段落14或15所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是在内源epsD编码序列的编码区内。
[0386] 17.如段落14-16中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是在内源epsD编码序列的控制序列内。
[0387] 18.如段落1-17中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是内源epsE编码序列的破坏。
[0388] 19.如段落18所述的突变体芽孢杆菌属菌株,其中该内源epsE编码序列(a)编码一种多肽,该多肽与SEQ ID NO:58、59、或60具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:10、11、或12的全长互补链杂交;或(c)与SEQ ID NO:10、11、或12具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0389] 20.如段落18或19所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是在内源epsE编码序列的编码区内。
[0390] 21.如段落18-20中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是在内源epsE编码序列的控制序列内。
[0391] 22.如段落1-21中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是内源epsF编码序列的破坏。
[0392] 23.如段落22所述的突变体芽孢杆菌属菌株,其中该内源epsF编码序列(a)编码一种多肽,该多肽与SEQ ID NO:61、62、或63具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:16、17、或18的全长互补链杂交;或(c)与SEQ ID NO:16、17、或18具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0393] 24.如段落22或23所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是在内源epsF编码序列的编码区内。
[0394] 25.如段落22-24中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是在内源epsF编码序列的控制序列内。
[0395] 26.如段落1-25中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是内源epsG编码序列的破坏。
[0396] 27.如段落26所述的突变体芽孢杆菌属菌株,其中该内源epsG编码序列(a)编码一种多肽,该多肽与SEQ ID NO:64、65、或66具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:19、20、或21的全长互补链杂交;或(c)与SEQ ID NO:19、20、或21具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0397] 28.如段落26或27所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是在内源epsG编码序列的编码区内。
[0398] 29.如段落26-28中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是在内源epsG编码序列的控制序列内。
[0399] 30.如段落1-29中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是内源epsH编码序列的破坏。
[0400] 31.如段落30所述的突变体芽孢杆菌属菌株,其中该内源epsH编码序列(a)编码一种多肽,该多肽与SEQ ID NO:67、68、或69具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:22、23、或24的全长互补链杂交;或(c)与SEQ ID NO:22、23、或24具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0401] 32.如段落30或31所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是在内源epsH编码序列的编码区内。
[0402] 33.如段落30-32中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是在内源epsH编码序列的控制序列内。
[0403] 34.如段落1-33中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是内源epsI编码序列的破坏。
[0404] 35.如段落34所述的突变体芽孢杆菌属菌株,其中该内源epsI编码序列(a)编码一种多肽,该多肽与SEQ ID NO:70、71、或72具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:25、26、或27的全长互补链杂交;或(c)与SEQ ID NO:25、26、或27具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0405] 36.如段落34或35所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是在内源epsI编码序列的编码区内。
[0406] 37.如段落34-36中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是在内源epsI编码序列的控制序列内。
[0407] 38.如段落1-37中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是内源epsJ编码序列的破坏。
[0408] 39.如段落38所述的突变体芽孢杆菌属菌株,其中该内源epsJ编码序列(a)编码一种多肽,该多肽与SEQ ID NO:73、74、或75具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:28、29、或30的全长互补链杂交;或(c)与SEQ ID NO:28、29、或30具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0409] 40.如段落38或39所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是在内源epsJ编码序列的编码区内。
[0410] 41.如段落38-40中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是在内源epsJ编码序列的控制序列内。
[0411] 42.如段落1-41中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是内源epsK编码序列的破坏。
[0412] 43.如段落42所述的突变体芽孢杆菌属菌株,其中该内源epsK编码序列(a)编码一种多肽,该多肽与SEQ ID NO:76、77、或78具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:31、32、或33的全长互补链杂交;或(c)与SEQ ID NO:31、32、或33具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0413] 44.如段落42或43所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是在内源epsK编码序列的编码区内。
[0414] 45.如段落42-44中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是在内源epsK编码序列的控制序列内。
[0415] 46.如段落1-45中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是内源epsL编码序列的破坏。
[0416] 47.如段落46所述的突变体芽孢杆菌属菌株,其中该内源epsL编码序列(a)编码一种多肽,该多肽与SEQ ID NO:79、80、或81具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:34、35、或36的全长互补链杂交;或(c)与SEQ ID NO:34、35、或36具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0417] 48.如段落46或47所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是在内源epsL编码序列的编码区内。
[0418] 49.如段落46-48中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是在内源epsL编码序列的控制序列内。
[0419] 50.如段落1-49中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是内源epsM编码序列的破坏。
[0420] 51.如段落50所述的突变体芽孢杆菌属菌株,其中该内源epsM编码序列(a)编码一种多肽,该多肽与SEQ ID NO:82、83、或84具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:37、38、或39的全长互补链杂交;或(c)与SEQ ID NO:37、38、或39具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0421] 52.如段落50或51所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是在内源epsM编码序列的编码区内。
[0422] 53.如段落50-52中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是在内源epsM编码序列的控制序列内。
[0423] 54.如段落1-53中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是内源epsN编码序列的破坏。
[0424] 55.如段落54所述的突变体芽孢杆菌属菌株,其中该内源epsN编码序列(a)编码一种多肽,该多肽与SEQ ID NO:85、86、或87具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:40、41、或42的全长互补链杂交;或(c)与SEQ ID NO:40、41、或42具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0425] 56.如段落54或55所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是在内源epsN编码序列的编码区内。
[0426] 57.如段落54-56中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是在内源epsN编码序列的控制序列内。
[0427] 58.如段落1-57中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是内源epsO编码序列的破坏。
[0428] 59.如段落58所述的突变体芽孢杆菌属菌株,其中该内源epsO编码序列(a)编码一种多肽,该多肽与SEQ ID NO:88、89、或90具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:43、44、或45的全长互补链杂交;或(c)与SEQ ID NO:43、44、或45具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0429] 60.如段落58或59所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是在内源epsO编码序列的编码区内。
[0430] 61.如段落58-60中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏是在内源epsO编码序列的控制序列内。
[0431] 62.如段落1-61中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子(a)编码至少一种多肽,该多肽与SEQ ID NO:46-90中任一个具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)包含至少一种编码序列,该编码序列在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:1-45中任一个的全长互补链杂交;或(c)包含至少一种编码序列,该编码序列与SEQ ID NO:1-45中任一个具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0432] 63.如段落1-62中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子编码至少一种多肽,该多肽与SEQ ID NO:46-90中任一个具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0433] 64.如段落1-63中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子编码至少一种多肽,该多肽包括SEQ ID NO:46-90中的任何或由其组成。
[0434] 65.如段落1-64中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子包含至少一种编码序列,该编码序列在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:1-45中任一个的全长互补链杂交。
[0435] 66.如段落1-65中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子包含至少一种编码序列,该编码序列与SEQ ID NO:1-45中任一个具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0436] 67.如段落1-66中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子包含至少一种编码序列,该编码序列包括SEQ ID NO:1-45中的任何或由其组成。
[0437] 68.如段落1-67中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏发生在该epsA-O操纵子的启动子序列内。
[0438] 69.如段落1-68中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏发生在该epsA-O操纵子的一种或多种编码序列内。
[0439] 70.如段落69所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏发生在:
[0440] (i)epsA编码序列,其(a)编码一种多肽,该多肽与SEQ ID NO:46、47、或48具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:1、2、或3的全长互补链杂交;或(c)与SEQ ID NO:1、2、或3具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
[0441] (ii)epsB编码序列,其(a)编码一种多肽,该多肽与SEQ ID NO:49、50、或51具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:4、5、或6的全长互补链杂交;或(c)与SEQ ID NO:4、5、或6具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
[0442] (iii)epsC编码序列,其(a)编码一种多肽,该多肽与SEQ ID NO:52、53、或54具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:7、8、或9的全长互补链杂交;或(c)与SEQ ID NO:7、8、或9具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
[0443] (iv)epsD编码序列,其(a)编码一种多肽,该多肽与SEQ ID NO:55、56、或57具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:10、11、或12的全长互补链杂交;或(c)与SEQ ID NO:10、
11、或12具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少
95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
[0444] (v)epsE编码序列,其(a)编码一种多肽,该多肽与SEQ ID NO:58、59、或60具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:10、11、或12的全长互补链杂交;或(c)与SEQ ID NO:10、11、或12具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
[0445] (vi)epsF编码序列,其(a)编码一种多肽,该多肽与SEQ ID NO:61、62、或63具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:16、17、或18的全长互补链杂交;或(c)与SEQ ID NO:16、
17、或18具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少
95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
[0446] (vii)epsG编码序列,其(a)编码一种多肽,该多肽与SEQ ID NO:64、65、或66具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:19、20、或21的全长互补链杂交;或(c)与SEQ ID NO:19、
20、或21具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少
95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
[0447] (viii)epsH编码序列,其(a)编码一种多肽,该多肽与SEQ ID NO:67、68、或69具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:22、23、或24的全长互补链杂交;或(c)与SEQ ID NO:22、
23、或24具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少
95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
[0448] (ix)epsI编码序列,其(a)编码一种多肽,该多肽与SEQ ID NO:70、71、或72具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:25、26、或27的全长互补链杂交;或(c)与SEQ ID NO:25、
26、或27具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少
95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
[0449] (x)epsJ编码序列,其(a)编码一种多肽,该多肽与SEQ ID NO:73、74、或75具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:28、29、或30的全长互补链杂交;或(c)与SEQ ID NO:28、29、或30具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
[0450] (xi)epsK编码序列,其(a)编码一种多肽,该多肽与SEQ ID NO:76、77、或78具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:31、32、或33的全长互补链杂交;或(c)与SEQ ID NO:31、
32、或33具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少
95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
[0451] (xii)epsL编码序列,其(a)编码一种多肽,该多肽与SEQ ID NO:79、80、或81具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:34、35、或36的全长互补链杂交;或(c)与SEQ ID NO:34、
35、或36具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少
95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
[0452] (xiii)epsM编码序列,其(a)编码一种多肽,该多肽与SEQ ID NO:82、83、或84具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:37、38、或39的全长互补链杂交;或(c)与SEQ ID NO:37、
38、或39具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少
95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
[0453] (xiv)epsN编码序列,其(a)编码一种多肽,该多肽与SEQ ID NO:85、86、或87具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:40、41、或42的全长互补链杂交;或(c)与SEQ ID NO:40、
41、或42具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少
95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;和/或[0454] (xv)epsO编码序列,其(a)编码一种多肽,该多肽与SEQ ID NO:88、89、或90具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少
96%、至少97%、至少98%、至少99%、或100%序列一致性;(b)在至少低、中、中-高、高或非常高严格条件下与SEQ ID NO:43、44、或45的全长互补链杂交;或(c)与SEQ ID NO:43、
44、或45具有至少60%,例如至少70%、至少75%、至少80%、至少85%、至少90%、至少
95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[0455] 71.如段落1-70中任一项所述的突变体芽孢杆菌属菌株,其中当在相同条件下培养时,与缺乏对该内源epsA-O操纵子的破坏的亲本芽孢杆菌属菌株相比,该突变体产生少至少25%(例如,少至少50%、少至少60%、少至少70%、少至少80%、少至少90%、或少100%)的由该内源epsA、epsB、epsC、epsD、epsE、epsF、epsG、epsH、epsI、epsJ、epsK、epsL、epsM、epsN、或epsO编码序列编码的多肽。
[0456] 72.如段落1-71中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA、epsB、epsC、epsD、epsE、epsF、epsG、epsH、epsI、epsJ、epsK、epsL、epsM、epsN、或epsO编码序列是失活的。
[0457] 73.如段落1-72中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏包括epsA-O操纵子编码序列中的至少两种(例如,三种、四种、五种、六种等)的破坏。
[0458] 74.如段落1-73中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏包括epsA-O操纵子编码序列中的至少两种(例如,三种、四种、五种、六种等)的失活。
[0459] 75.如段落1-74中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏包括epsG和epsH编码序列两者的破坏。
[0460] 76.如段落1-74中任一项所述的突变体芽孢杆菌属菌株,其中该内源epsA-O操纵子的破坏包括epsG和epsH编码序列两者的失活。
[0461] 77.如段落1-76中任一项所述的突变体芽孢杆菌属菌株,其中当在相同条件下培养时,与缺乏对该内源epsA-O操纵子的破坏的亲本芽孢杆菌属菌株相比,该突变体具有改进的转化效率。
[0462] 78.如段落1-77中任一项所述的突变体芽孢杆菌属菌株,其中当在相同条件下培养时,与缺乏对该内源epsA-O操纵子的破坏的亲本芽孢杆菌属菌株相比,该突变体能够产生多至少10倍(例如,至少100倍、至少1000倍、至少10000倍、或至少100000倍)的转化体。
[0463] 79.如段落1-78中任一项所述的突变体芽孢杆菌属菌株,其中该突变体进一步包含内源mecA基因的破坏。
[0464] 80.如段落79所述的突变体芽孢杆菌属菌株,其中该内源mecA基因的破坏发生在该编码序列内和/或启动子序列内。
[0465] 81.如段落79或80所述的突变体芽孢杆菌属菌株,其中当在相同条件下培养时,与缺乏对该内源mecA基因的破坏的亲本芽孢杆菌属菌株相比,该突变体产生少至少25%(例如,少至少50%、少至少60%、少至少70%、少至少80%、少至少90%、或少100%)的由该内源mecA基因编码的多肽。
[0466] 82.如段落79-81中任一项所述的突变体芽孢杆菌属菌株,其中使该内源mecA基因失活。
[0467] 83.如段落79-82中任一项所述的突变体芽孢杆菌属菌株,其中当在相同条件下培养时,与缺乏对该内源mecA基因的破坏的亲本芽孢杆菌属菌株相比,该突变体具有改进的转化效率。
[0468] 84.如段落79-83中任一项所述的突变体芽孢杆菌属菌株,其中当在相同条件下培养时,与缺乏对该内源mecA基因的破坏的亲本芽孢杆菌属菌株相比,该突变体能够产生多至少10倍(例如,至少100倍、至少1000倍、至少10000倍、或至少100000倍)的转化体。
[0469] 85.如段落1-84中任一项所述的突变体芽孢杆菌属菌株,其中该亲本芽孢杆菌属菌株选自嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、或苏芸金芽孢杆菌。
[0470] 86.如段落85所述的突变体芽孢杆菌属菌株,其中该亲本芽孢杆菌属菌株是解淀粉芽孢杆菌菌株。
[0471] 87.如段落85所述的突变体芽孢杆菌属菌株,其中该亲本芽孢杆菌属菌株是地衣芽孢杆菌菌株。
[0472] 88.如段落85所述的突变体芽孢杆菌属菌株,其中该亲本芽孢杆菌属菌株是枯草芽孢杆菌菌株。
[0473] 89.如段落1-88中任一项所述的突变体芽孢杆菌属菌株,其进一步包括编码多肽的多核苷酸。
[0474] 90.如段落89所述的突变体芽孢杆菌属菌株,其中该多肽对亲本芽孢杆菌属菌株而言是天然的。
[0475] 91.如段落89所述的突变体芽孢杆菌属菌株,其中该多肽对亲本芽孢杆菌属菌株而言是异源的。
[0476] 92.如段落89-91中任一项所述的突变体芽孢杆菌属菌株,其中该多肽是水解酶、异构酶、连接酶、裂解酶、氧化还原酶或转移酶。
[0477] 93.如段落92所述的突变体芽孢杆菌属菌株,其中该多肽是α-葡糖苷酶、氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、葡糖脑苷脂酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、磷脂酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、尿激酶或木聚糖酶。
[0478] 94.如段落89-91中任一项所述的突变体芽孢杆菌属菌株,其中该多肽是白蛋白、胶原、弹性蛋白原、弹性蛋白或明胶。
[0479] 95.如段落1-88中任一项所述的突变体芽孢杆菌属菌株,其进一步包括一种或多种多核苷酸,该一种或多种多核苷酸编码用于产生发酵产物的发酵途径的一种或多种多核苷酸。
[0480] 96.如段落95所述的突变体芽孢杆菌属菌株,其中该一种或多种多肽对亲本芽孢杆菌属菌株而言是天然的。
[0481] 97.如段落95或96所述的突变体芽孢杆菌属菌株,其中该一种或多种多肽对亲本芽孢杆菌属菌株而言是异源的。
[0482] 98.如段落95-97中任一项所述的突变体芽孢杆菌属菌株,其中该发酵产物是醇、烷烃、环烷烃、烯烃、氨基酸、气体、类异戊二烯、酮、有机酸、或聚酮化合物。
[0483] 99.一种用于获得如段落1-98中任一项所述的芽孢杆菌属突变体菌株的方法,该方法包括
[0484] (a)破坏亲本芽孢杆菌属菌株中的内源epsA-O操纵子;并且
[0485] (b)分离从(a)所得的该芽孢杆菌属突变体菌株。
[0486] 100.一种产生多肽的方法,该方法包括:在有益于产生该多肽的条件下,培养如段落89-94中任一项所述的芽孢杆菌属突变体菌株。
[0487] 101.如段落100所述的方法,该方法进一步包括回收该多肽。
[0488] 102.一种产生发酵产物的方法,该方法包括:在有益于产生该发酵产物的条件下,培养如段落95-98中任一项所述的芽孢杆菌属突变体菌株。
[0489] 103.如段落102所述的方法,该方法进一步包括回收该发酵产物。
[0490] 104.一种用于获得如段落89-94中任一项所述的芽孢杆菌属突变体菌株的转化体的方法,该方法包括
[0491] (a)将编码多肽的多核苷酸引入包含内源epsA-O操纵子的破坏的芽孢杆菌属突变体菌株中;并且
[0492] (b)分离该芽孢杆菌属转化体。
[0493] 105.一种用于获得如段落95-98中任一项所述的芽孢杆菌属突变体菌株的转化体的方法,该方法包括
[0494] (a)将对用于产生发酵产物的发酵途径的一种或多种多肽进行编码的一种或多种多核苷酸引入包含内源epsA-O操纵子的破坏的芽孢杆菌属突变体菌株中;并且[0495] (b)分离该芽孢杆菌属转化体。
[0496] 虽然出于清楚理解的目的,已经通过说明以及实例的方式相当详细描述了上文,本领域的普通技术人员将清楚的是,可以实施任何等效方面或修饰。因此,该说明和实例不应当解释为限制本发明的范围。
QQ群二维码
意见反馈