蛋白酶变体

阅读:451发布:2020-05-12

专利汇可以提供蛋白酶变体专利检索,专利查询,专利分析的服务。并且本 发明 涉及与来源于橙橘嗜热子囊菌(Thermoascus aurantiacus)的蛋白酶具有至少75%同一性,并在其 氨 基酸序列中包含至少一个修饰的蛋白酶。这些蛋白酶变体具有改善的热 稳定性 。本发明亦涉及编码这些蛋白酶的DNA,其产生方法,以及其用途。,下面是蛋白酶变体专利的具体信息内容。

1.一种产生具有蛋白酶活性并且当与野生型亲本蛋白酶相比时具有改善的热稳定性的蛋白酶变体的方法,所述方法包括培养细胞,该细胞导入了包含下述可操作地连接的元件的表达载体:
(a)转录启动子,
(b)多核苷酸分子,其编码蛋白酶变体,所述蛋白酶变体与SEQ ID NO:2的基酸1至
177中所示的蛋白酶相比至少95%同一性,并且与SEQ ID NO:2的氨基酸1至177相比在选自下述的位置包含如下修饰:A27K+A112P+D142L,
该多核苷酸分子通过将至少一个突变导入编码蛋白酶的DNA分子而制备,和(c)转录终止子,
由此,所述细胞表达由所述多核苷酸分子编码的蛋白酶变体;和回收所述蛋白酶变体。
2.权利要求1的方法,其中由所述多核苷酸分子编码的蛋白酶变体包含下述的修饰:
A27K/D79L/S87P/A112P/D142L、A27K/D79L/S87P/A112P/T124V/D142L、A27K/D79L/Y82F/S87G/D104P/A112P/A126V/D142L、
A27K/Y82F/S87G/D104P/A112P/A126V/D142L、
A27K/D79L/Y82F/D104P/A112P/A126V/D142L、
A27K/Y82F/D104P/A112P/A126V/D142L、
A27K/D79L/S87P/A112P/A126V/D142L。
3.一种多肽,其与SEQ ID NO:2的氨基酸1至177中所示的蛋白酶相比具有至少95%同一性,并且与SEQ ID NO:2的氨基酸1至177相比在第142位置包含如下修饰:A27K+A112P+D142L,其中所述多肽与SEQ ID NO:2的氨基酸1至177中所示的蛋白酶相比具有改善的热稳定性
4.权利要求3的具有蛋白酶活性的多肽,该多肽包含选自下组的修饰:
A27K/D79L/S87P/A112P/D142L、A27K/D79L/S87P/A112P/T124V/D142L、A27K/D79L/Y82F/S87G/D104P/A112P/A126V/D142L、
A27K/Y82F/S87G/D104P/A112P/A126V/D142L、
A27K/D79L/Y82F/D104P/A112P/A126V/D142L、
A27K/Y82F/D104P/A112P/A126V/D142L、
A27K/D79L/S87P/A112P/A126V/D142L。
5.一种分离的核酸序列,其由编码权利要求3至4任一项的具有蛋白酶活性的多肽的核酸序列组成。
6.一种核酸构建体,其包含可操作地连接的权利要求5的核酸序列和一种或多种调控序列,所述调控序列指导蛋白酶在合适的表达宿主中产生。
7.一种重组表达载体,其包含权利要求6的核酸构建体。
8.一种重组宿主细胞,其包含权利要求6的核酸构建体和/或权利要求7的重组表达载体。
9.一种用于产生权利要求3至4任一项的具有蛋白酶活性的多肽的方法,其包括:
(a)培养权利要求8的重组宿主细胞以产生包含具有蛋白酶活性的多肽的上清;和(b)回收具有蛋白酶活性的多肽。
10.一种用于产生发酵产物的方法,其包括:(a)使用发酵生物和含糖材料在权利要求3至4任一项的具有蛋白酶活性的多肽的存在下进行发酵,和(b)从经发酵的含糖材料产生发酵产物。
11.权利要求10的方法,其中所述发酵产物是乙醇,和/或蒸馏干酒糟(DDG,distillers dried grains)。
12.至少一种权利要求3至4任一项的具有蛋白酶活性的多肽在用于产生发酵产物的工艺中的用途。
13.至少一种权利要求3至4任一项的具有蛋白酶活性的多肽在用于产生发酵乙醇的工艺中的用途。

说明书全文

蛋白酶变体

[0001] 本发明是基于申请日为2010年12月10日,申请号为“201080063729.3”(国际申请号为PCT/US2010/059814),发明名称为“脂肪酶变体”的专利申请的分案申请。
[0002] 涉及序列表
[0003] 本申请包含计算机可读形式的序列表。所述计算机可读形式通过提述并入本文。

技术领域

[0004] 本发明涉及与来源于橙橘嗜热子囊菌(Thermoascus aurantiacus)的蛋白酶具有至少75%同一性的蛋白酶,其基酸序列作为SEQ ID NO:2的氨基酸1至177示于所附序列
表,并与该蛋白酶相比包含至少一个修饰(即,为其变体)。本发明还涉及编码这些蛋白酶的DNA,包含这些多核苷酸的核酸构建体、载体和宿主细胞,以及其产生方法,及其用途,例如,用于产生发酵产物,例如乙醇
[0005] 发明背景
[0006] 蛋白酶为公知的酶,将其应用于发酵产物的产生中的优点也是公知的。已从多种来源包括多种真菌和细菌菌株分离了蛋白酶。
[0007] 本发明的目标是提供其他具有蛋白酶活性的多肽(蛋白酶变体)和编码所述多肽的多核苷酸。本发明的目标还在于提供与其来源的亲本蛋白酶相比具有改善性质的蛋白
酶。本发明的蛋白酶变体与野生型亲本蛋白酶相比呈现改善的热稳定性
[0008] WO 2003/048353公开了橙橘嗜热子囊菌CGMCC No.0670的野生型蛋白酶。

发明内容

[0009] 在第一个方面,本发明涉及产生具有蛋白酶活性并且当与野生型亲本蛋白酶相比时具有改善的热稳定性的蛋白酶变体的方法,所述方法包括培养细胞,该细胞导入了包含
下述可操作地连接的元件的表达载体:
[0010] (a)转录启动子,
[0011] (b)多核苷酸分子,其编码蛋白酶变体,所述变体与SEQ ID NO:2的氨基酸1至177中所示的蛋白酶具有至少75%同一性,并与SEQ ID NO:2的氨基酸1至177相比在选自下述
的至少一个位置包含至少一个修饰:27、79、82、87、112、142、2、5、6、8、26、41、43、46、49、53、
54、73、88、104、114、115、116、126、152、157、158和173,
[0012] 该多核苷酸分子通过将至少一个突变导入编码蛋白酶的DNA分子而制备,和
[0013] (c)转录终止子,
[0014] 由此,所述细胞表达由所述多核苷酸分子编码的蛋白酶变体;和回收所述蛋白酶变体。
[0015] 在第二个方面,本发明涉及蛋白酶,其与SEQ ID NO:2的氨基酸1至177具有至少75%同一性,且与SEQ ID NO:2的氨基酸1至177相比在至少一个选自下述的位置包含至少
一个修饰:27、79、82、87、112、142、2、5、6、8、26、41、43、46、49、53、54、73、88、104、114、115、
116、126、152、157、158、和173。
[0016] 本发明还涉及编码这些蛋白酶的核酸序列,包含所述核酸序列的核酸构建体,包含所述核酸构建体的表达载体,包含所述表达载体和/或所述核酸构建体的宿主细胞。
[0017] 本发明还涉及所述蛋白酶的用途,例如用于淀粉液化糖化和/或发酵工艺。
[0018] 发明详述
[0019] 本发明涉及亲本蛋白酶的分离的变体,其在至少一个对应于SEQ ID NO:2的成熟多肽的位置27、79、82、87、112、142、2、5、6、8、26、41、43、46、49、53、54、73、88、104、114、115、
116、126、152、157、158和173的位置包含修饰。具体而言,本发明的变体具有改善的热稳定性。
[0020] 蛋白酶活性:术语“蛋白酶活性”意指EC.3.4.-.-的多肽。在一个优选实施方案中,其为属于EC 3.4.24金属内肽酶的多肽。蛋白酶活性可根据实施例1中所述的步骤确定,例如使用偶氮-酪蛋白(azo-casein)测定法或使用protazyme OL的内蛋白酶测定法。
[0021] 互联网上的ENZYME站点(http://www.expasy.ch/enzyme/)是关于酶命名的信息的档案库。其主要基于Nomenclature Committee of the International Union of 
Biochemistry and Molecular Biology(IUB-MB)的推荐,并描述了已提供了EC(Enzyme 
Commission)编号的所有类型的已表征的酶(Bairoch A.The ENZYME database,2000,
Nucleic Acids Res 28:304-305)。亦参见来自NC-IUBMB,1992的Enzyme Nomenclature手
册。
[0022] 变体:术语“变体”意指具有蛋白酶活性的多肽,其与SEQ ID NO:2的1至177所示的氨基酸序列相比包含至少一个修饰,即取代、插入和/或缺失。在本文的上下文中,“至少一个”(例如修饰)意指一个或多个,例如1、2、3、4、5、6、7、8、9或10个修饰;或12、14、15、16、18、20、22、24、25、28或30个修饰;依此类推,直至最大数量为44个修饰。然而,本发明的蛋白酶变体仍应与SEQ ID NO:2的氨基酸1至177至少75%相同。在另一个实施方案中,所述变体与SEQ ID NO:2的氨基酸1至177具有至少76%、77%、78%、79%、80%、81%、82%、83%、
84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或至少99%同一性。仍旧在进一步的具体实施方案中,同一性程度为与SEQ ID NO:2的成熟多肽至少98.0%、98.2%、98.4%、98.6%、98.8%、99.0%、99.1%、99.2%、99.3%,或至少
99.4%,但小于100%的序列同一性。
[0023] 突变体:术语“突变体”意指编码变体的多核苷酸。
[0024] 野生型酶:术语“野生型”蛋白酶意指由天然出现的生物如见于自然界的细菌、酵母或丝状真菌表达的蛋白酶。
[0025] 亲本或亲本蛋白酶:术语“亲本”或“亲本蛋白酶”意指蛋白酶,对其进行了改变以产生本发明的酶变体。所述亲本可为天然出现的(野生型)多肽或其变体。
[0026] 亲本变体:术语亲本变体意指制备变体蛋白酶的起点自身与野生型蛋白酶相比为变体。
[0027] 分离的变体:术语“分离的变体”意指经人修饰的变体。在一个方面,所述变体为至少1%纯,例如至少5%纯,至少10%纯,至少20%纯,至少40%纯,至少60%纯,至少80%纯和至少90%纯,如通过SDS-PAGE所确定。
[0028] 基本上纯的变体:术语“基本上纯的变体”意指制备物,其含有按重量计最多10%,最多8%,最多6%,最多5%,最多4%,最多3%,最多2%,最多1%和最多0.5%的与其天然或重组相联系的其他多肽。优选地,所述变体按制备物中存在的总多肽物质的重量计为至少92%纯,例如至少94%纯,至少95%纯,至少96%纯,至少97%纯,至少98%纯,至少99%纯,至少99.5%纯,和至少100%纯。本发明的变体优选为基本上纯的形式。这可例如通过藉由公知的重组方法或藉由经典的纯化方法制备多肽来实现。
[0029] 成熟多肽:术语“成熟多肽”意指在翻译和任何翻译后修饰(如N端加工,C-端截短,糖基化,磷酸化等)之后以其最终形式存在的多肽。在一个方面,所述成熟多肽是SEQ ID NO:2的氨基酸1至177。信号肽部分可通过本领域中已知的程序(SignalP(Nielsen等,1997,
Protein Engineering 10:1-6))来预测。SEQ ID NO:2的氨基酸1至177是预期的成熟部分。
一般而言,酶成熟部分的第一个氨基酸可通过纯化酶的N端测序来确定。成熟多肽的N端通
过N端测序来确证。由此,信号肽部分和成熟部分之间的任何差异必然是由于前肽的存在。
[0030] 成熟多肽编码序列:术语“成熟多肽编码序列”意指编码具有蛋白酶活性的成熟多肽的多核苷酸。在一个方面,基于预测SEQ ID NO:1的核苷酸535至1065编码信号肽的SignalP(Nielsen等,1997,Protein Engineering 10:1-6),所述成熟多肽编码序列是SEQ 
ID NO:1的核苷酸535至1065。
[0031] 序列同一性:两个氨基酸序列或两个核苷酸序列之间的相关性由参数“序列同一性”描述。就本发明而言,两个氨基酸序列之间的序列同一性程度使用如EMBOSS包(EMBOSS:
The European Molecular Biology Open Software Suite,等,2000,Trends Genet.16:
276-277)的Needle程序(优选版本3.0.0或更新版本)中执行的Needleman-Wunsch算法
(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)来确定。使用的可选参数为缺口开放
罚分为10,缺口延伸罚分为0.5,和EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。使用标以“最长同一性(longest identity)”(使用-nobrief选项获得)的Needle输出作为百分比同
一性,并如下所示计算:
[0032] (相同残基x 100)/(比对长度–比对中缺口总数)
[0033] 就本发明而言,两个脱核糖核苷酸序列之间的序列同一性程度使用如EMBOSS包(EMBOSS:The European Molecular Biology Open Software Suite,Rice等,2000,见上
文)的Needle程序(优选版本3.0.0或更新版本)中执行的Needleman-Wunsch算法
(Needleman和Wunsch,1970,见上文)来确定。使用的可选参数为缺口开放罚分为10,缺口延伸罚分为0.5,和EDNAFULL(NCBI NUC4.4的EMBOSS版本)取代矩阵。使用标以“最长同一性
(longest identity)”(使用-nobrief选项获得)的Needle输出作为百分比同一性,并如下
所示计算:
[0034] (相同脱氧核糖核苷酸x 100)/(比对长度–比对中缺口总数)
[0035] 分离的多核苷酸:术语“分离的多核苷酸”意指经人力修饰的多核苷酸。在一个方面,所述分离的多核苷酸为至少1%纯,例如至少5%纯,至少10%纯,至少20%纯,至少40%纯,至少60%纯,至少80%纯,至少90%纯和至少95%纯,如通过琼脂糖电泳所确定。所述多核苷酸可为基因组、cDNA、RNA、半合成和合成来源,或其任意组合。
[0036] 基本上纯的多核苷酸:术语“基本上纯的多核苷酸”意指不含其他外源或不需要的核苷酸,并处于适用于遗传工程多肽产生系统内的形式的多核苷酸制备物。因此,基本上纯的多核苷酸含有按重量计最多10%,最多8%,最多6%,最多5%,最多4%,最多3%,最多2%,最多1%和最多0.5%的与其天然或重组相联系的其他多核苷酸物质。然而,基本上纯的多核苷酸可包含天然出现的5’-和3’-未翻译区,如启动子和终止子。优选所述基本上纯的多核苷酸按重量计为至少90%纯,例如至少92%纯,至少94%纯,至少95%纯,至少96%纯,至少97%纯,至少98%纯,至少99%纯,和至少99.5%纯。本发明的多核苷酸优选为基本上纯的形式。
[0037] 编码序列:术语“编码序列”意指多核苷酸,其直接指定其多肽产物的氨基酸序列。编码序列的边界一般通过开读框确定,其通常以ATG起始密码子或其他起始密码子如GTG和
TTG开始,并以终止密码子如TAA、TAG和TGA结束。所述编码序列可为DNA、cDNA、合成或重组的多核苷酸。
[0038] 核酸构建体:术语“核酸构建体”意指单链或双链的核酸分子,其从天然出现的基因分离,或经修饰以否则不会在自然界存在的方式含有核酸区段,或为合成的。当核酸构建体含有表达本发明的编码序列所需的调控序列时,术语核酸构建体与术语“表达盒“同义。
[0039] 调控序列:术语“调控序列”意指供表达编码本发明的变体所需的所有成分。每个调控序列对于编码变体的多核苷酸或对于彼此可为天然或外源的。此类调控序列包括但不限于先导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最低限度,调控序列包括启动子,以及转录和翻译终止信号。调控序列可与接头一同提供,以供导入特定限制性位点的目的,所述位点便于所述调控序列与编码变体的多核苷酸的编码区的连
接。
[0040] 可操作地连接:术语“可操纵地连接”意指这样的构型,其中调控序列置于相对于多核苷酸的编码序列的合适位置,从而使得调控序列指导编码序列的表达。
[0041] 表达:术语“表达”包括变体产生所涉及的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。
[0042] 表达载体:术语“表达载体”意指直链或环状的DNA分子,其包含编码变体的多核苷酸,并可操作地连接于提供其表达的其他核苷酸。
[0043] 宿主细胞:术语“宿主细胞”意指任何细胞类型,其易受包含本发明的多核苷酸的核酸构建体或表达载体的转化、转染、转导等。术语“宿主细胞”涵盖亲本细胞的任何后代,其由于复制过程发生的突变与亲本细胞不完全相同。
[0044] 改善的性质:术语“改善的性质”意指与变体相关、与亲本相比改善的特征。此类改善的性质包括但不限于热活性、热稳定性、pH活性、pH稳定性、底物/辅因子特异性、改善的表面性质、产物特异性、在经预处理的生物质存在下增加的稳定性或可溶性、在储藏条件下改善的稳定性、和化学稳定性。
[0045] 改善的热稳定性:术语“改善的热稳定性”意指在升高的温度,在缓冲液中或在如那些在产物储藏/运输过程中存在或类似于在变体的工业使用过程中存在的那些的条件下温育一段时间之后,相对于亲本显示保留蛋白酶活性的变体。本发明的变体蛋白酶是否相
对于亲本蛋白酶具有改善的热稳定性可如实施例1中所述确定。本发明的变体蛋白酶可与
亲本蛋白酶相比具有改善的热稳定性,其中改善的热稳定性作为增加的相对活性确定。本
发明的变体蛋白酶可与亲本蛋白酶相比具有改善的热稳定性,其中改善的热稳定性作为增
加的剩余活性确定。
[0046] 在一个方面,当使用实施例中用于确定剩余活性的测定法(偶氮酪蛋白)相比较时,具有蛋白酶活性的变体的热稳定性比亲本更加热稳定至少1.05倍,例如至少1.1倍,至少1.5倍,至少1.8倍,至少2倍,至少5倍,至少10倍,至少15倍,至少20倍和至少25倍。
[0047] 修饰,如取代、缺失、插入
[0048] 蛋白酶变体可相对于模板(即亲本或参照蛋白酶,或比较性氨基酸序列,如SEQ ID NO:2的氨基酸1至177)包含多种类型的修饰:一个氨基酸可由另一个氨基酸取代;一个氨基酸可缺失;一个氨基酸可插入两个残基之间,以及任何数量的此类修饰的任意组合。
[0049] 取代或延伸而未指明取代为何或用何延伸指插入任何天然的或非天然的氨基酸,但在模板中占据该位置的氨基酸除外。
[0050] 取代意指将占据某位置的氨基酸用不同的氨基酸替代;缺失意指去除占据某位置的氨基酸;而插入意指紧邻占据某位置的氨基酸添加1-3个氨基酸。在本文的上下文中,术语“插入”旨在同样涵盖N和/或C端延伸。
[0051] 就本发明而言,使用包含于SEQ ID NO:2中的成熟多肽来确定变体蛋白酶中的相应氨基酸残基。将变体蛋白酶的氨基酸序列与SEQ ID NO:2中公开的成熟多肽进行比对,并且基于该比对,使用如执行于EMBOSS包(EMBOSS:The European Molecular Biology Open 
Software Suite,Rice等,2000,Trends Genet.16:276-277)的Needle程序(优选版本3.0.0
或更新版本)中的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-
453)确定对应于SEQ ID NO:2中公开的成熟多肽中的任何氨基酸残基的氨基酸位置编号。
[0052] 在另一个蛋白酶中相应氨基酸残基的鉴定可通过使用“ClustalW”(Larkin 等,2007,Bioinformatics 23:2947-2948)比对多个多肽序列来确证。
[0053] 取代:对于氨基酸取代,使用下述命名法:原始氨基酸,位置,取代氨基酸。相应地,在位置226用丙氨酸取代苏氨酸命名为“Thr226Ala”或“T226A”。多重突变由斜杠符号(“/”)分隔,例如“Gly205Arg/Ser411Phe”或“G205R/S411F”,代表分别在位置205和411用精氨酸(R)和苯丙氨酸(F)取代甘氨酸(G)和丝氨酸(S)。
[0054] 缺失:对于氨基酸缺失,使用下述命名法:“Δ”,原始氨基酸,位置。相应地,在位置195的甘氨酸的缺失命名为“ΔGly195”或“ΔG195”。多重缺失由斜杠符号(“/”)分隔,例如“ΔGly195/ΔSer411”或“ΔG195/ΔS411”。
[0055] 插入:对于氨基酸插入,使用下述命名法:原始氨基酸,位置,原始氨基酸,插入氨基酸。相应地,在位置195的甘氨酸之后插入赖氨酸命名为“Gly195GlyLys”或“G195GK”。
[0056] 多重改变:包含多重改变的变体由斜杠符号(“/”)分隔,例如“Arg170Tyr/Gly195Glu”或“R170Y/G195E”代表分别在位置170和195用酪氨酸和谷氨酸取代精氨酸和甘氨酸。
[0057] 位置编号
[0058] 本文中使用的用于确定氨基酸位置的命名法是基于来源于橙橘嗜热子囊菌CGMCC No.0670的蛋白酶的氨基酸序列,其成熟多肽序列在序列表中作为SEQ ID NO:2的氨基酸1
至177(SEQ ID NO:2的氨基酸1-177)给出。相应地,在本文的上下文中,编号位置的基础是SEQ ID NO:2,以T1起始,以C177终止。
[0059] 当用于本文,术语“成熟”部分(或序列)指多肽由细胞分泌的部分,其作为其遗传装置的一部分,包含编码所述多肽的多核苷酸。换言之,成熟多肽部分指多肽在切割去信号肽部分以及前肽部分(若有的话)之后遗留的多肽部分。信号肽部分可通过本领域中已知的程序(例如SignalP)来预测。SEQ ID NO:2的氨基酸1至177是预期的成熟部分。一般而言,酶成熟部分的第一个氨基酸可通过纯化酶的N端测序来确定。由此,信号肽部分和成熟部分之间的任何差异必然归结于前肽的存在。
[0060] 产生蛋白酶变体的方法
[0061] 本发明涉及产生具有蛋白酶活性并且当与野生型亲本蛋白酶相比时具有改善的热稳定性的蛋白酶变体的方法,所述方法包括培养细胞,该细胞导入了包含下述可操作地
连接的元件的表达载体:
[0062] (a)转录启动子,
[0063] (b)多核苷酸分子,其编码蛋白酶变体,所述蛋白酶变体与SEQ ID NO:2的氨基酸1至177中所示的亲本蛋白酶相比具有至少75%同一性,并与SEQ ID NO:2的氨基酸1至177相
比在选自下述的至少一个位置包含至少一个修饰:27、79、82、87、112、142、2、5、6、8、26、41、
43、46、49、53、54、73、88、104、114、115、116、126、152、157、158和173,
[0064] 该多核苷酸分子通过将至少一个突变导入编码蛋白酶的DNA分子而制备,和
[0065] (c)转录终止子,
[0066] 由此,所述细胞表达由所述多核苷酸分子编码的蛋白酶变体;和回收所述蛋白酶变体。
[0067] 优选地,应用于本发明的方法、呈现改善的热稳定性的蛋白酶包含至少一种下述修饰:A27K、A27G、A27V、Q53K、Q53R、T54R、D79K、D79L、D79M、Y82F、S87G、S87P、A112P、D142L、R2P、ΔS5、C6R、ΔG8、N26R、S41R、Y43F、T46R、S49R、A73C、P81R、N88R、D104R、D104P、T114P、S115R、T116V、T124L、T124V、A126V、M152R、S157K、Q158W和I173V。
[0068] 在第二个方面,本发明涉及蛋白酶变体,其与SEQ ID NO:2的氨基酸1至177具有至少75%同一性,并与SEQ ID NO:2的氨基酸1至177相比在选自下述的至少一个位置包含至
少一个修饰:27、79、82、87、112、142、2、5、6、8、26、41、43、46、49、53、54、73、88、104、114、
115、116、126、152、157、158和173。在一个更具体的实施方案中,所述蛋白酶变体在选自下组的至少一个位置包含至少一个修饰:27、79、82、87、104、112、126和142。
[0069] 优选地,呈现改善的热稳定性的本发明的蛋白酶包含至少一种下述修饰:A27K、A27G、A27V、Q53K、Q53R、T54R、D79K、D79L、D79M、Y82F、S87G、S87P、A112P、D142L、R2P、ΔS5、C6R、ΔG8、N26R、S41R、Y43F、T46R、S49R、A73C、P81R、N88R、D104P、D104R、T114P、S115R、T116V、T124L、T124V、A126V、M152R、S157K、Q158W和I173V。
[0070] 位置编号指如“位置编号”部分中所述的SEQ ID NO:2的氨基酸1至177的位置编号。在其他蛋白酶中对应于这些SEQ ID NO:2位置编号的氨基酸1至177的位置如上所述确
定。
[0071] 本发明的变体蛋白酶是SEQ ID NO:2的氨基酸1至177的蛋白酶的变体,即,其与SEQ ID NO:2的氨基酸1至177并不相同,因为其与SEQ ID NO:2的氨基酸1至177相比包含至
少一个修饰。
[0072] 在另一个优选的实施方案中,所述蛋白酶包含至少一个下述的修饰的组合:
[0073] ΔS5/D79L/S87P,
[0074] ΔS5/D79L/S87P/A112P/D142L,
[0075] ΔS5/N26R/D79L/S87P/A112P/D142L,
[0076] C6R/D79L/S87P,
[0077] ΔG8/D79L/S87P,
[0078] N26R/D79L/S87P,
[0079] N26R/T46R/D79L/S87P/A112P/D142L,
[0080] A27G/D79L/S87P/A112P/D142L,
[0081] A27K/D79L/S87P/A112P/D142L,
[0082] A27K/D79L/S87P/A112P/T124V/D142L,
[0083] A27V/D79L/S87P/A112P/D142L,
[0084] S41R/D79L/S87P,
[0085] S41R/D79L/S87P/A112P/D142L,
[0086] S41R/D79L/S87P/A112P/D142L/S157K,
[0087] Y43F/D79L/S87P/A112P/D142L,
[0088] T46R/D79L/S87P,
[0089] T46R/D79L/S87P/A112P/D142L,
[0090] T46R/D79L/S87P/T116V/D142L,
[0091] S49R/D79L/S87P,
[0092] Q53K/D79L/S87P/I173V,
[0093] Q53R/D79L/S87P,
[0094] T54R/D79L/S87P,
[0095] D79L/S87P/A112P,
[0096] D79L/P81R/S87P/A112P/D142L,
[0097] D79L/S87P,
[0098] D79L/S87P/A112P,
[0099] D79L/S87P/A112P/D142L,
[0100] D79L/S87P/A112P/D142L/S157K,
[0101] D79L/S87P/A112P/T124L/D142L,
[0102] D79L/S87P/A112P/T124V/A126V/D142L,
[0103] D79L/S87P/A112P/T124V/D142L,
[0104] D79L/S87P/D104R,
[0105] D79L/S87P/D142L,
[0106] D79L/S87P/N88R,
[0107] D79L/S87P/Q158W,
[0108] D79L/S87P/S115R,
[0109] D79L/S87P/S157K,
[0110] D79L/S87P/T114P,
[0111] D79L/S87P/T116V/,
[0112] D79L/Y82F/S87P/A112P/T124V/D142L,
[0113] D79L/Y82F/S87P/A112P/T124V/D142L,
[0114] A27K/D79L/Y82F/S87G/D104P/A112P/A126V/D142L,
[0115] A27K/Y82F/S87G/D104P/A112P/A126V/D142L,
[0116] A27K/D79L/Y82F/D104P/A112P/A126V/D142L,
[0117] A27K/Y82F/D104P/A112P/A126V/D142L。
[0118] 用于制备变体的策略
[0119] 使用PDB登录号1EB6作为模板构建了SEQ ID NO:2的结构的同源性模型。该模型使用Yasara程序构建(http://yasara.org.YASARA Biosciences,Neue-Welt-Hoehe 13/b,
8042Graz,Austria/Europe)。
[0120] 对模型进行分子动力学(MD)模拟,静电计算祖先序列重构(electrostatic calculations ancestral sequence reconstruction),共同序列计算,和自切割位点预
测。基于建模的结构和模拟结果,提出了特别着重于改善热稳定性质的修饰。
[0121] 基于结构模型,鉴定出了接近活性位点Zn离子的位置。D142是接近活性位点的残基的实例。类似地,鉴定出了暴露于表面的位置。在表面的位置与相互作用,并对于稳定性是重要的。位置2、5、6、8、26、27、41、49、53、73、79、87、88、104、112、114、115、116、157、158暴露于表面。这些之中最重要的是112、79和87。
[0122] 使用GROMACS程序版本4(http://gromacs.org.Hess,等(2008)J.Chem.Theory Comput.4:435-447)进行了分子动力学模拟。模拟在300K、400K、500K重复三次进行(使用不同的随机种子(seed))。基于模拟,选择显示高运动性(mobility)(相对于平均结构的波动)的位置或显示大位移(在平均结构中与起始模型相比较)的位置作为供稳定化的候选——
通过直接突变这些,或通过突变与这些相互作用的位置。高度位移的位置包括区144-163中的位置,特别是位置152。具有高运动性的位置包括区5-10,86-89和109-120中的位置。
[0123] 基于该模型,计算了在蛋白中及其周围的静电势,并标记在不利的静电势中具有荷电荷的氨基酸的位置(例如,在负静电势中的荷负电的氨基酸)及周围位置作为突变目
标。在不利的位置具有荷电荷的氨基酸的位置包括2、19、42、52、58、60、64、80、104、121、
143,特别是142和79。
[0124] 使用MUSCLE程序(Edgar,Robert C.(2004),MUSCLE:multiple sequence alignment with high accuracy and high throughput,Nucleic Acids Research 32
(5),1792-97.)将已知的同源序列同时进行比对。基于多重序列比对,进行了数种基于共同性(consensus)的分析。使用PAUP程序找出了PAUP暗示与祖先基因不同的位置。鉴定出了基于比对SEQ ID NO:2与共同序列不同的位置A37、A73、S86、F106、T108、A126、A145、M152、G153、S156、V160、M161和T165。该祖先重建指向位置73、86、126、152、153、156、38、50、94、
109、135、136、142,并特别指向位置142、73、126、152。
[0125] 蛋白酶活性的丧失可涉及自身蛋白水解。基于SEQ ID NO:2的自消化的蛋白的质谱分析与来自同源酶的特异性数据的组合,提出了许多位置:59、100、105、130、131、148以及特别是位置27。
[0126] 已知脯氨酸影响稳定性,且使用模型结构,使用WHATIF(http://www.cmbi.kun.nl/whatif.WHAT IF Foundation/CMBI,Toernooiveld 1,6525ED 
Nijmegen,The Netherlands)程序中的功能SUGPRO鉴定出了与取代脯氨酸相容的位置。
[0127] 胱氨酸桥(cystein bridge)可使结构稳定化,并通过对模型结构应用WHATIF程序的SUGCYS功能,鉴定出了与胱氨酸取代相容的位置。
[0128] 相应的蛋白酶变体通过本领域中已知的方法制备,并如实验部分中所述测试。
[0129] 热稳定性
[0130] 本发明的变体蛋白酶是否与亲本蛋白酶相比具有改善的热稳定性可如实施例1中所述来确定。本发明的变体蛋白酶可与亲本蛋白酶相比具有改善的热稳定性,其中所述改
善的热稳定性作为增加的相对活性来确定。本发明的变体蛋白酶可与亲本蛋白酶相比具有
改善的热稳定性,其中所述改善的热稳定性作为增加的剩余活性来确定。
[0131] 热稳定性亦可使用DSC测量确定纯化的蛋白酶蛋白的变性温度Td来确定。Td指示蛋白的热稳定性:Td越高,热稳定性越高。相应地,在一个优选实施方案中,本发明的蛋白酶具有比参照蛋白酶的Td更高的Td,其中对纯化的蛋白酶样品在通过使用离心过滤装置(10,
000MWCO)缓冲液交换至含或不含2.5mM Zn2+的20mM乙酸钠pH 4.5或5.5之后,在20mM乙酸钠缓冲液中使用以90℃/h的扫描速率以从20℃至110℃(在某些扫描中高至120℃)进行差示
扫描量热法(Differential Scanning Calorimetry)来确定Td。在一个优选实施方案中,本发明的蛋白酶的Td相对于SEQ ID NO:2的氨基酸1至177的蛋白酶的T的更高,更优选是其至
少101%,或其至少102%、103%、104%、105%、106%、107%、108%、109%或至少110%。甚至更优选地,本发明的蛋白酶的Td是SEQ ID NO:2的氨基酸1至177的蛋白酶的Td的至少
120%、130%、140%、150%、160%、170%、180%或至少190%。仍旧在进一步的具体实施方案中,本发明的热稳定性蛋白酶具有至少50℃的熔融温度Tm(或变性温度Td),如实施例中
所述使用差示扫描量热法(DSC)确定的(即,在20mM乙酸钠中)。仍旧在进一步的具体实施方案中,Tm为至少51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、
72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、
97、98、99或至少100℃。
[0132] 在具体实施方案中,本发明涉及SEQ ID NO:2的氨基酸1至177的亲本蛋白酶的改善的热稳定性变体,其包含至少一个下述修饰:A27K、A27G、A27V、Q53K、Q53R、T54R、D79K、D79L、D79M、Y82F、S87P、S87G、A112P、D142L、R2P、ΔS5、C6R、ΔG8、N26R、S41R、Y43F、T46R、S49R、A73C、P81R、N88R、D104R、D104P、T114P、S115R、T116V、T124L、T124V、A126V、M152R、S157K、Q158W和I173V。在一个更具体的实施方案中,所述修饰选自下组:A27K、D79L、Y82F、S87G、S87P、D104P、A112P、A126V和D142L。
[0133] 在具体实施方案中,本发明涉及SEQ ID NO:2的氨基酸1至177的亲本蛋白酶的改善的热稳定性变体,其包含选自下述的修饰:
[0134] ΔS5/D79L/S87P、ΔS5/D79L/S87P/A112P/D142L、ΔS5/N26R/D79L/S87P/A112P/D142L、C6R/D79L/S87P、ΔG8/D79L/S87P、N26R/D79L/S87P、N26R/T46R/D79L/S87P/A112P/D142L、A27G/D79L/S87P/A112P/D142L、A27K/D79L/S87P/A112P/D142L、A27K/D79L/S87P/
A112P/T124V/D142L、A27V/D79L/S87P/A112P/D142L、S41R/D79L/S87P、S41R/D79L/S87P/
A112P/D142L、S41R/D79L/S87P/A112P/D142L/S157K、Y43F/D79L/S87P/A112P/D142L、T46R/D79L/S87P、T46R/D79L/S87P/A112P/D142L、T46R/D79L/S87P/T116V/D142L、S49R/D79L/
S87P、Q53K/D79L/S87P/I173V、Q53R/D79L/S87P、T54R/D79L/S87P、D79L/S87P/A112P、D79L/P81R/S87P/A112P/D142L、D79L/S87P、D79L/S87P/A112P、D79L/S87P/A112P/D142L、D79L/S87P/A112P/D142L/S157K、D79L/S87P/A112P/T124L/D142L、D79L/S87P/A112P/T124V/
A126V/D142L、D79L/S87P/A112P/T124V/D142L、D79L/S87P/D104R、D79L/S87P/D142L、D79L/S87P/N88R、D79L/S87P/Q158W、D79L/S87P/S115R、D79L/S87P/S157K、D79L/S87P/T114P、D79L/S87P/T116V/、D79L/Y82F/S87P/A112P/T124V/D142L、D79L/Y82F/S87P/A112P/T124V/D142L、A27K/D79L/Y82F/S87G/D104P/A112P/A126V/D142L、A27K/Y82F/S87G/D104P/A112P/A126V/D142L、A27K/D79L/Y82F/D104P/A112P/A126V/D142L、A27K/Y82F/D104P/A112P/
A126V/D142L。
[0135] 在一个具体实施方案中,本发明涉及SEQ ID NO:2的氨基酸1至177的亲本蛋白酶的改善的热稳定性变体,其包含修饰:A27K/D79L/Y82F/S87G/D104P/A112P/A126V/D142L。
[0136] 在另一个具体实施方案中,本发明涉及SEQ ID NO:2的氨基酸1至177的亲本蛋白酶的改善的热稳定性变体,其包含修饰:A27K/Y82F/S87G/D104P/A112P/A126V/D142L。
[0137] 仍旧在另一个具体实施方案中,本发明涉及SEQ ID NO:2的氨基酸1至177的亲本蛋白酶的改善的热稳定性变体,其包含修饰:A27K/D79L/Y82F/D104P/A112P/A126V/D142L。
[0138] 在一个甚至进一步的具体实施方案中,本发明涉及SEQ ID NO:2的氨基酸1至177的亲本蛋白酶的改善的热稳定性变体,其包含修饰:A27K/Y82F/D104P/A112P/A126V/
D142L。
[0139] 核酸序列和构建体
[0140] 本发明还涉及包含编码本发明蛋白酶变体的核酸序列的核酸序列。
[0141] 术语“分离的核酸序列”指基本上不含其他核酸序列的核酸序列,例如,至少约20%纯,优选至少约40%纯,更优选至少约60%纯,甚至更优选至少约80%纯,并且最优选至少约90%纯,如通过琼脂糖电泳确定。举例而言,分离的核酸序列可通过遗传工程中使用的标准克隆步骤获得,在所述步骤中,将核酸序列从其天然位置重新置于不同位点,在此其会被复制。所述克隆步骤可涉及对包含编码所述多肽的核酸序列的所需核酸片段的切出和
分离,将所述片段插入载体分子,并将所述重组载体组入宿主细胞,在此会复制所述核酸序列的多重拷贝或克隆。所述核酸序列可为基因组、cDNA、RNA、半合成、合成来源,或其任意组合。
[0142] 本发明的核酸序列可通过将至少一个突变导入模板蛋白酶编码序列或其亚序列来制备,其中所述突变体核酸序列编码变体蛋白酶。将突变导入核酸序列以用一个核苷酸
替换另一个核苷酸可通过任何本领域中已知的方法,例如通过定位诱变,通过随机诱变或
通过掺杂的(doped)、混杂的(spiked)或局部化(localized)的随机诱变来完成。
[0143] 随机诱变可作为局部化或区特异性随机诱变,在翻译至所述显示的氨基酸序列的至少三个部分或在全基因内适当地进行。当通过使用寡核苷酸进行诱变时,可将所述寡核
苷酸在所述寡核苷酸的合成过程中在待改变的位置掺杂或混杂以三个非亲本核苷酸。可进
行所述掺杂或混杂使得不欢迎的氨基酸的密码子得以避免。可通过任何技术,使用例
PCR、LCR或任何视为适当的DNA聚合酶和连接酶,将所述掺杂或混杂的寡核苷酸组入编码所述蛋白酶的DNA。
[0144] 优选地,掺杂(doping)是使用“恒定随机掺杂(constant random doping)”进行的,其中预先决定在每个位置野生型和突变的百分比。此外,可将掺杂导向成优选导入某些核苷酸,并由此优选导入一个或多个特定氨基酸残基。例如,可使得所述掺杂允许在每个位置导入90%野生型和10%突变。在选择掺杂方案的另一个考量基于遗传的以及蛋白结构的
限制。
[0145] 可将随机诱变有利地局限于所述亲本蛋白酶的一部分。这可例如在当已鉴定出酶的某些区对于酶的给定性质特别重要时是有利的。
[0146] 用于提供本发明的变体的其他方法包括例如如描述于WO 95/22625或WO 96/00343中的基因改组,和如描述于EP 897985中的共同衍生过程(consensus derivation 
process)。
[0147] 核酸构建体
[0148] 核酸构建体包含可操作地连接的本发明的核酸序列和一个或多个调控序列,所述调控序列指导所述编码序列在与所述调控序列相容的条件下在合适宿主细胞中表达。表达
应理解为包括多肽产生所涉及的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。
[0149] 术语“核酸构建体”用于本文中指单链或双链的核酸分子,其从天然出现的基因分离,或经修饰以否则不会在自然界存在的方式含有核酸区段。当核酸构建体含有表达本发明的编码序列所需的调控序列时,术语核酸构建体与术语“表达盒“同义。
[0150] 术语“调控序列”用于本文中包括对于表达编码本发明多肽的多核苷酸必需或有利的所有成分。每个调控序列对于编码多肽的核苷酸序列可为天然或外源的。此类调控序
列包括但不限于先导序列、聚腺苷酸化序列、前肽序列、转录启动子、信号肽序列和转录终止子。最低限度,调控序列包括转录启动子,以及转录和翻译终止信号。调控序列可与接头一同提供,以供导入特定限制性位点的目的,所述位点便于所述调控序列与编码多肽的核
苷酸序列的编码区的连接。
[0151] 术语“可操纵地连接”在本文中意指构型,其中调控序列置于相对于多核苷酸序列的编码序列的合适位置,从而使得调控序列指导多肽的编码序列的表达。
[0152] 当用于本文中,术语“编码序列”(CDS)意指核苷酸序列,其直接指定其蛋白产物的氨基酸序列。编码序列的边界一般通过开读框确定,其通常以ATG起始密码子或其他起始密码子如GTG和TTG开始。所述编码序列可为DNA、cDNA或重组的核苷酸序列。
[0153] 表达载体
[0154] 术语“表达”包括多肽产生所涉及的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。
[0155] 术语“表达载体”在本文中定义为直链或环状的DNA分子,其包含编码本发明的多肽的多核苷酸,且其可操作地连接于提供其表达的其他多核苷酸。
[0156] 编码本发明的蛋白酶变体的核酸序列可使用表达载体表达,所述表达载体通常包括编码启动子、操纵子、核糖体结合位点、翻译起始信号和任选地阻抑物基因或多种激活剂基因的调控序列。
[0157] 携带编码本发明的蛋白酶变体的DNA序列的重组表达载体可为任何载体,可便利地对其进行重组DNA步骤,且载体的选择通常会取决于其要导入的宿主细胞。所述载体可为这样的载体,当其导入宿主细胞时,其整合入宿主细胞基因组,并与其整合入的染色体一同复制。
[0158] 所述蛋白酶变体亦可与至少一种其他感兴趣的酶,如葡糖淀粉酶、α-淀粉酶、磷酸酶、木聚糖酶、半乳聚糖酶、α-半乳糖苷酶、蛋白酶、磷脂酶和/或β-葡聚糖酶一同共表达。所述酶可从不同的载体,从同一载体,或使用两种技术的混合进行共表达。当使用不同载体时,所述载体可具有不同的选择性标记,和不同的复制起点。当仅使用一个载体时,基因可从一个或多个启动子表达。若在一个启动子的调节下克隆(双或多顺反性(di-or multi-
cistronic)),基因克隆的顺序可影响蛋白的表达水平。所述蛋白酶变体亦可作为融合蛋白表达,即编码所述蛋白酶变体的基因与编码另一个蛋白的基因框内融合。该蛋白可为另一
个酶或来自另一个酶的功能域。
[0159] 宿主细胞
[0160] 术语“宿主细胞”如用于本文中,包括各种对于用包含本发明的多核苷酸的核酸构建体进行的转化、转染、转导等是易感的细胞类型。
[0161] 本发明还涉及包含本发明的多核苷酸的重组宿主细胞,其有利地用于多肽的重组产生。将包含本发明的多核苷酸的载体导入宿主细胞,使得所述载体作为染色体整合体,或作为之前所述的自主复制的染色体外载体维持。术语“宿主细胞”涵盖亲本细胞的任何后
代,其由于在复制过程中发生的突变,与亲本细胞不完全相同。宿主细胞的选择在很大程度上会取决于编码所述多肽的基因及其来源。
[0162] 所述宿主细胞可为单细胞微生物,例如原核生物,或非单细胞微生物,例如真核生物。
[0163] 可用的单细胞微生物为细菌细胞,如革兰氏阳性细菌,其包括但不限于芽孢杆菌属(Bacillus)细胞,例如嗜芽孢杆菌(Bacillus alkalophilus),解淀粉芽孢杆菌
(Bacillus amyloliquefaciens),短芽孢杆菌(Bacillus brevis),环状芽孢杆菌
(Bacillus circulans),克劳氏芽孢杆菌(Bacillus clausii),凝结芽孢杆菌(Bacillus 
coagulans),灿烂芽孢杆菌(Bacillus lautus),迟缓芽孢杆菌(Bacillus lentus),地衣芽孢杆菌(Bacillus licheniformis),巨大芽孢杆菌(Bacillus megaterium),嗜热脂肪芽孢杆菌(Bacillus stearothermophilus),枯草芽孢杆菌(Bacillus subtilis)和苏金芽孢
杆菌(Bacillus thuringiensis);或链霉属(Streptomyces)细胞,例如浅青紫链霉菌
(Streptomyces lividans)和鼠灰链霉菌(Streptomyces murinus),或革兰氏阴性细菌如
大肠杆菌(E.coli)和假单胞菌属菌种(Pseudomonas sp.)。在一个优选的方面,所述细菌宿主细胞是迟缓芽孢杆菌、地衣芽孢杆菌、嗜热脂肪芽孢杆菌或枯草芽孢杆菌细胞。在另一个优选的方面,所述芽孢杆菌属细胞是嗜碱芽孢杆菌。
[0164] 将载体导入细菌宿主细胞可通过例如原生质体转化(参见,例如Chang和Cohen,1979,Molecular General Genetics 168:111-115),使用感受态细胞(参见,例如Young和
Spizizin,1961,Journal of Bacteriology 81:823-829,或Dubnau和Davidoff-Abelson,
1971,Journal of Molecular Biology 56:209-221),电穿孔(参见,例如Shigekawa和
Dower,1988,Biotechniques 6:742-751)或接合(参见,例如Koehler和Thorne,1987,
Journal of Bacteriology 169:5771-5278)来实现。
[0165] 所述宿主细胞亦可为真核细胞,如哺乳动物、昆虫、植物或真菌细胞。
[0166] 在一个优选的方面,所述宿主细胞是真菌细胞。“真菌”如用于本文包括子囊菌(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(如由Hawksworth等,于Ainsworth and Bisby’s Dictionary of The 
Fungi,第八版,1995,CAB International,University Press,Cambridge,UK中所定义)以
及卵菌门(Oomycota)(如Hawksworth等,1995,见上,171页中所引用),和所有有丝分裂孢子
真菌(mitosporic fungi)(Hawksworth等,1995,见上)。
[0167] 在一个更优选的方面,所述真菌宿主细胞为酵母细胞。“酵母”如用于本文中包括产子囊酵母(ascosporogenous yeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenous yeast)和属于半知菌类(Fungi Imperfecti)(芽孢纲
(Blastomycetes))的酵母。由于酵母的分类在未来可能改变,就本发明而言,应将酵母定义为如Biology and Activities of Yeast(Skinner,F.A.,Passmore,S.M.,和Davenport,
R.R.编,Soc.App.Bacteriol.Symposium Series No.9,1980)中所述。
[0168] 在一个甚至更优选的方面,所述酵母宿主细胞为假丝酵母属(Candida)、汉逊酵母属(Hansenula)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属
(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓍霉属(Yarrowia)细胞。
[0169] 在一个最优选的方面,所述酵母宿主细胞为巴斯德毕赤酵母(Pichia pastoris),甲醇毕赤酵母(Pichia methanolica),卡尔酵母(Saccharomyces carlsbergensis)、酿酒
酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母
(Saccharomyces norbensis)或卵形酵母(Saccharomyces oviformis)细胞。在另一个最优
选的方面,酵母宿主细胞是乳酸克鲁维酵母(Kluyveromyces lactis)细胞。在另一个最优
选的方面,酵母宿主细胞是解脂西洋蓍霉(Yarrowia lipolytica)细胞。
[0170] 在另一个更优选的方面,真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由Hawksworth等,1995,见上文,所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖组成的菌丝体壁。通过菌丝延伸进行营养生长,而分解代谢是专性需
氧的。相反,酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行,而碳分解代谢可以是发酵的。
[0171] 在一个甚至更优选的方面,丝状真菌宿主细胞是枝顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、烟管霉属(Bjerkandera)、Ceriporiopsis、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属(Cryptococcus)、Filibasidium、镰孢属(Fusarium)、腐质霉属(Humicola)、梨孢菌属(Magnaporthe)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属
(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属(Piromyces)、侧属(Pleurotus)、裂褶菌属(Schizophyllum)、踝节菌属
(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属
(Tolypocladium)、栓菌属(Trametes)或木霉属(Trichoderma)细胞。
[0172] 在最优选的方面,丝状真菌宿主细胞是泡盛曲霉(Aspergillus awamori)、烟曲霉(Aspergillus fumigatus)、臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillus 
japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)或米曲霉
(Aspergillus oryzae)细胞。在另一个最优选方面,丝状真菌宿主细胞是杆孢状镰孢
(Fusarium bactridioides)、禾谷镰孢(Fusarium cerealis)、库威镰孢(Fusarium 
crookwellense)、大刀镰孢(Fusarium culmorum)、禾本科镰孢(Fusarium graminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢
(Fusarium negundi)、尖镰孢(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium 
sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium 
sulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢(Fusarium trichothecioides)
或镶片镰孢(Fusarium venenatum)细胞。在另一个最优选的方面,丝状真菌宿主细胞是黑
刺烟管菌(Bjerkandera adusta)、Ceriporiopsis aneirina、Ceriporiopsis aneirina、
Ceriporiopsis caregiea、Ceriporiopsis gilvescens、Ceriporiopsis pannocinta、
Ceriporiopsis rivulosa、Ceriporiopsis subrufa或Ceriporiopsis subvermispora、灰
盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolus hirsutus)、特异腐质霉(Humicola 
insolens)、疏状腐质霉(Humicola lanuginosa)、米黑毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthora thermophila)、粗糙脉孢菌(Neurospora crassa)、产紫青霉
(Penicillium purpurogenum)、黄孢平革菌(Phanerochaete chrysosporium)、辐射射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢霉(Thielavia 
terrestris)、Trametes  villosa、杂色栓菌(Trametes versicolor)、哈茨木霉
(Trichoderma harzianum)、康宁木霉(Trichoderma koningii)、长枝木霉(Trichoderma 
longibrachiatum)、里氏木霉(Trichoderma reesei)或绿色木霉(Trichoderma viride)菌
株细胞。
[0173] 可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁重建的方法以本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP 238023和Yelton
等,1984,Proc.Nat.Acad.Sci.USA 81:1470-1474中描述。用于转化镰孢属菌种的合适方法
由Malardier等,1989,Gene 78:147-156和WO 96/00787描述。可以使用由如下文献描述的
方法转化酵母:Becker和Guarente,于Abelson,J.N.和Simon,M.I.编,Guide to Yeast 
Genetics and Molecular Biology,Methods in Enzymology,Volume 194,182-187页,
Academic Press,Inc.,New York;Ito等,1983,Journal of Bacteriology 153:163;和
Hinnen等,1978,Proc.Nat.Acad.Sci.USA 75:1920。
[0174] 产生方法
[0175] 本发明还涉及产生本发明的蛋白酶的方法,包括(a)培养宿主细胞;和(b)回收所述蛋白酶。
[0176] 在本发明的产生方法中,使用本领域熟知的方法在适合于产生所述多肽的营养培养基中培养细胞。例如,可以通过在合适培养基中和允许表达和/或分离所述多肽的条件下进行的摇瓶培养,和实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养,所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据
公开的组成制备(例如,在美国典型培养物保藏中心的目录中)。如果多肽分泌到营养培养
基中,该多肽能够从所述培养基中直接回收。如果多肽不分泌,其能够从细胞裂解物
(lysate)回收。
[0177] 所得多肽可以使用本领域已知的方法回收。例如,多肽可以通过常规方法从营养培养基中回收,所述常规方法包括但不限于离心、过滤、提取、喷雾干燥蒸发或沉淀。
[0178] 本发明的多肽可以通过多种本领域已知的方法纯化,所述方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型
(preparative)等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、SDS-PAGE或提取(参见,例如,Protein Purification,J.-C.Janson和Lars Ryden编,VCH Publishers,New York,1989)。
[0179] 转基因植物
[0180] 本发明还涉及转基因植物、植物部分或植物细胞,其经本发明编码具有蛋白酶活性的多肽的核苷酸序列转化,从而以可回收的量表达和产生所述多肽。多肽可从植物或植
物部分回收。或者,同样可以将含有该重组多肽的植物或植物部分用于改进食品或饲料
质量,例如,改进营养价值、适口性(palatability)和流变性质(rheological 
properties),或用于破坏抗营养因子
[0181] 在一个具体实施方案中,所述多肽靶向种子中的胚乳储藏液泡。这可通过将其作为具有合适信号肽的前体合成来获得,参见Horvath等,PNAS,Feb.15,2000,vol.97,no.4,
p.1914-1919。
[0182] 转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)或其经工程改造变体。单子叶植物的实例是草(grasses),如草地早熟禾(meadow grass)(蓝草(blue 
grass),早熟禾属(Poa));饲用牧草(forage grass)如羊茅属(Festuca)、黑麦草属
(Lolium);寒地型牧草(temperate grass),如Agrostis(翦股颖属);和谷类,例如,小麦、燕麦、黑麦、大麦、稻(rice)、高粱、小黑麦(triticale)(小麦(Triticum)和黑麦(Secale)的稳定杂种)和玉蜀黍(maize)(玉米)。双子叶植物的实例是烟草(tobacco),豆类(legumes),如向日葵(Helianthus)、棉花(Gossypium)、羽扇豆(lupins),铃薯,糖甜菜(sugar beet),豌豆,豆(bean)和大豆(soybean)和十字花科的(cruciferous)植物(十字花科(family 
Brassicaceae)),如花椰菜(cauliflower),油菜籽(rape seed)和紧密相关的模式生物拟
南芥(Arabidopsis thaliana)。低植酸植物,如描述于例如美国专利号5,689,054和美国专利号6,111,168中的,是经工程改造的植物的实例。
[0183] 植物部分的实例是茎(stem)、愈伤组织(callus)、叶(leaf)、根(root)、果实(fruit)、种子(seed)和茎(tuber),以及包含这些部分的独立组织,例如,表皮
(epidermis)、叶肉(mesophyll)、薄壁组织(parenchyme)、维管组织(vascular tissue)、分生组织(meristem)。具体的植物细胞区室(compartments),如叶绿体(chloroplast)、质外体(apoplast)、线粒体(mitochondria)、液泡(vacuole)、过氧化物酶体(peroxisome)和细胞质(cytoplasm)也被认为是植物部分。此外,任何植物细胞,无论什么组织来源,都被认为是植物部分。同样地,植物部分,如为了促进本发明的应用而分离的具体组织和细胞也被认为是植物部分,例如胚(embryo)、胚乳(endosperm)、糊粉(aleurone)和种皮(seed coat)。
[0184] 同样包含于本发明范围内的还有这些植物、植物部分和植物细胞的子代。
[0185] 表达本发明多肽的转基因植物或植物细胞可以依照本领域已知方法构建。简而言之,通过如下方法构建所述植物或植物细胞:将编码本发明多肽的一个或多个表达构建体
并入植物宿主基因组,并且将所得的修饰植物或植物细胞繁殖为转基因植物或植物细胞。
[0186] 表达构建体便利地是包含编码本发明多肽的核酸序列的核酸构建体,所述核酸序列与在选择的植物或植物部分中表达该核酸序列所需的适当的调节序列可操作地连接。此
外,表达构建体可以包含对于鉴定在其中整合了该表达构建体的宿主细胞有用的选择性标
记和将该构建体引入到所述植物中所必需的DNA序列(后者依赖于使用的DNA引入方法)。
[0187] 调节序列的选择,例如启动子和终止子序列和任选地信号或转运序列的选择,举例来说,基于期望何时、何处以及如何表达多肽而确定。例如,编码本发明多肽的基因的表达可以是组成型的或诱导型的,或可以是发育、阶段或组织特异性的,并且基因产物可以靶向特定的细胞区室、组织或植物部分例如种子或叶。调节序列由例如Tague等,1988,Plant Physiology 86:506所述。
[0188] 对于组成型表达,可以使用下述启动子:35S-CaMV启动子(Franck等,1980,Cell 21:285-294)、玉米泛素1(Christensen AH,Sharrock RA和Quail 1992.Maize 
polyubiquitin genes:structure,thermal perturbation of expression and 
transcript splicing,and promoter activity following transfer to protoplasts 
by electroporation)和稻肌动蛋白1启动子(Plant Mol.Biol.18,675-689.;Zhang W,
McElroy D.和Wu R 1991,Analysis of rice Act15’region activity in transgenic 
rice plants.Plant Cell 3,1155-1165)。器官特异性启动子可以是例如来自贮藏库组织
(storage sink tissue)例如种子、马铃薯块茎和果实的启动子(Edwards&Coruzzi,1990,
Ann.Rev.Genet.24:275-303),或来自代谢库组织(metabolic sink tissue)例如分生组织
的启动子(Ito等,1994,Plant Mol.Biol.24:863-878),种子特异性启动子诸如来自稻的谷
蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)启动子(Wu
等,1998,Plant and Cell Physiology 39:885-889),来自豆球蛋白(legumin)B4和蚕豆
(Vicia faba)的未知种子蛋白基因的蚕豆启动子(Conrad等,1998,Journal of Plant 
Physiology 152:708-711)、来自种子油体蛋白(oil body protein)的启动子(Chen等,
1998,Plant and Cell Physiology 39:935-941),来自欧洲油菜(Brassica napus)的贮藏
蛋白napA启动子,或本技术领域公知的任何其它种子特异性的启动子,例如,在WO 91/
14772中所描述的。此外,启动子可为叶特异性的启动子,如来自稻或番茄的rbcs启动子
(Kyozuka等,1993,Plant Physiology 102:991-1000),小球藻病毒(chlorella virus)腺
嘌呤甲基转移酶(adenine methyltransferase)基因启动子(Mitra和Higgins,1994,Plant 
Molecular Biology 26:85-93),或来自稻的aldP基因启动子(Kagaya等,1995,Molecular 
and General Genetics 248:668-674),或伤口诱导的启动子,如马铃薯pin2启动子(Xu等,
1993,Plant Molecular Biology 22:573-588)。同样地,所述启动子可通过非生物的处理
诱导,所述非生物的处理诸如温度、干旱或盐度修饰,或通过外源施加的激活所述启动子的物质诱导,例如乙醇、雌激素(oestrogens)、植物激素(plant hormones)如乙烯、脱落酸
(abscisic acid)、赤霉酸(gibberellic acid),和/或重金属。
[0189] 启动子增强子元件也可以用于实现多肽在植物中的较高表达。例如,启动子增强子元件可以是内含子,其置于启动子和编码本发明多肽的核苷酸序列之间。例如Xu等,
1993,见上,公开了使用稻肌动蛋白1基因的第一内含子以增强表达。
[0190] 此外,可对于所述植物物种优化密码子使用以改善表达(参见上述体积的Horvath等)。
[0191] 选择性标记基因和表达构建体的任何其它部分可以选自本领域内可用的那些。
[0192] 将核酸构建体根据本领域已知的常规技术并入植物基因组,所述常规技术包括土壤杆菌属(Agrobacterium)介导的转化、病毒介导的转化、显微注射(microinjection)、粒子轰击、生物射弹转化和电穿孔(Gasser等,1990,Science 244:1293;Potrykus,1990,Bio/Technology 8:535;Shimamoto等,1989,Nature 338:274)。
[0193] 目前,土壤杆菌(Agrobacterium)介导的基因转移(gene transfer)是产生转基因双子叶植物的优选方法(为了参考,见Hooykas和Schilperoort,1992,Plant Molecular 
Biology 19:15-38),而且也可以用于转化单子叶植物,虽然对于这些植物更经常使用其它的转化方法。目前,补充土壤杆菌方法的产生转基因单子叶植物的优选方法是用粒子(用转化DNA涂覆的微观的金或钨粒子)轰击胚愈伤组织(embryonic calli)或发育中的胚
(developing embryos)(Christou,1992,Plant Journal 2:275-281;Shimamoto,1994,
Current Opinion Biotechnology 5:158-162;Vasil等,1992,Bio/Technology 10:667-
674)。转化单子叶植物的可供选择的方法是基于原生质体转化,如由Omirulleh等,1993,
Plant Molecular Biology 21:415-428所描述的。
[0194] 转化之后,根据本领域熟知的方法选择其中并入了表达构建体的转化体并且再生成为完整植株。通常设计转化方法用于通过如下方法在再生期间或在后续世代中选择性消
除选择基因:例如,使用带有两种独立的T-DNA构建体的共转化或通过特异性重组酶位点特异性地切除选择基因。
[0195] 本发明还涉及产生本发明多肽的方法,其包括:(a)在有益于产生多肽的条件下培养包含核酸序列的转基因植物或植物细胞,所述核酸序列编码本发明具有蛋白酶活性的多
肽;和(b)回收所述多肽。
[0196] 组合物和用途
[0197] 仍旧在进一步的方面,本发明涉及包含本发明多肽的组合物,以及使用这些的方法。
[0198] 多肽组合物可依照本领域已知方法制备,且可为液体或干组合物的形式。举例而言,所述多肽组合物可为颗粒或微颗粒的形式。待包括在组合物中的多肽可依照本领域中
已知的方法稳定化。
[0199] 本发明的多肽和/或组合物可用于去污剂组合物,动物饲料组合物,以供淀粉液化、糖化和/或发酵,例如如WO9220777中公开。
[0200] 本发明的多肽和/或组合物可用于产生糖浆的工艺。举例而言,终产物可为葡萄糖,但亦可例如通过葡糖异构酶转化为果糖或几乎由等量葡萄糖和果糖构成的混合物。该
混合物,或进一步富集果糖的混合物,是在全世界商业化的最常使用的高果糖玉米糖浆
(HFCS)。
[0201] 本发明的多肽和/或组合物可用于产生发酵产物的工艺。在一个具体实施方案中,本发明涉及产生发酵产物的方法,包括(a)使用发酵微生物和含糖材料在具有权利要求6至
10任一项的具有蛋白酶活性的多肽的存在下进行发酵,和(b)从发酵的含糖材料产生发酵
产物。
[0202] 发酵产物包括醇(例如乙醇、甲醇、丁醇、1,3-丙二醇);有机酸(例如柠檬酸、乙酸、衣康酸、乳酸、葡糖酸、葡糖酸盐、乳酸、琥珀酸、2,5-二-D-葡糖酸);酮(例如丙酮);氨基酸(例如谷氨酸);气体(例如H2和CO2),和更复杂的化合物,包括例如抗生素(例如青霉素和四环素);酶;维生素(例如核黄素、B12、β-胡萝卜素);激素,和其他难以合成产生的化合物。发酵工艺亦常用于产生可饮用的醇(例如啤酒和葡萄酒)。优选的发酵产物是乙醇,例如工
业乙醇、燃料乙醇和/或可饮用的乙醇。其他优选的发酵产物包括来自乙醇发酵工艺的共产物,例如蒸馏干酒糟(distillers dried grain;DDG)。
[0203] 在一个优选实施方案中,将淀粉在α-淀粉酶的存在下液化,将液化的醪在葡糖淀粉酶的存在下糖化。将糖化的醪用酵母发酵,和(d)回收产生的乙醇。在此工艺中,将本发明的多肽在液化或糖化之前或过程中添加至所述醪,和/或在发酵过程中添加至经水解的淀
粉和糖。
[0204] 优选地,包含本发明的多肽的组合物包含至少一种其他选自下组的多肽,淀粉酶如例如α-淀粉酶(EC 3.2.1.1)、葡糖淀粉酶(EC 3.2.1.3)和支链淀粉酶(pullulanase)(EC 
3.2.1.41);植酸酶(EC 3.1.3.8或3.1.3.26);磷酸酶(EC 3.1.3.1;EC 3.1.3.2;EC 
3.1.3.39);木聚糖酶(EC 3.2.1.8);半乳聚糖酶(EC 3.2.1.89);α-半乳糖苷酶(EC 
3.2.1.22);蛋白酶(EC 3.4.-.-);磷脂酶A1(EC 3.1.1.32);磷脂酶A2(EC 3.1.1.4);溶血磷脂酶(EC 3.1.1.5);磷脂酶C(3.1.4.3);磷脂酶D(EC 3.1.4.4);和/或β-葡聚糖酶(EC 
3.2.1.4或EC 3.2.1.6)。
[0205] 本文描述和要求保护的本发明并不局限于本文公开的具体实施方案的范围内,因为这些实施方案旨在作为对于本发明几个方面的说明。旨在将任何等同的实施方案包含于
本发明的范围内。实际上,从前面的说明中,除本文所显示和描述的之外,本发明的多种修改对于本领域的技术人员来说是显而易见的。这些修改也旨在落入所附的权利要求的范围
内。在冲突的情况下,将以包括定义部分的本公开为准。
[0206] 在本文中引用了多个文献,其公开通过全文提述并入本文。
[0207] 本发明涉及:
[0208] 1.一种产生具有蛋白酶活性并且当与野生型亲本蛋白酶相比时具有改善的热稳定性的蛋白酶变体的方法,所述方法包括培养细胞,该细胞导入了包含下述可操作地连接
的元件的表达载体:
[0209] (a)转录启动子,
[0210] (b)多核苷酸分子,其编码蛋白酶变体,所述蛋白酶变体与SEQ ID NO:2的氨基酸1至177中所示的蛋白酶相比至少75%同一性,并且与SEQ ID NO:2的氨基酸1至177相比在选
自下述的至少一个位置包含至少一个修饰:27、79、82、87、112、142、2、5、6、8、26、41、43、46、
49、53、54、73、88、104、114、115、116、126、152、157、158和173,
[0211] 该多核苷酸分子通过将至少一个突变导入编码蛋白酶的DNA分子而制备,和
[0212] (c)转录终止子,
[0213] 由此,所述细胞表达由所述多核苷酸分子编码的蛋白酶变体;和回收所述蛋白酶变体。
[0214] 2.项1的方法,其中由所述多核苷酸分子编码的蛋白酶变体包含至少一个选自下组的修饰:A27K、A27G、A27V、Q53K、Q53R、T54R、D79K、D79L、D79M、Y82F、S87P、S87G、A112P、D142L、R2P、ΔS5、C6R、ΔG8、N26R、S41R、Y43F、T46R、S49R、A73C、P81R、N88R、D104R、D104P、T114P、S115R、T116V、T124L、T124V、A126V、M152R、S157K、Q158W和I173V。
[0215] 3.项1或2任一项的方法,其中由所述多核苷酸分子编码的蛋白酶变体包含至少一种下述的修饰的组合:
[0216] ΔS5/D79L/S87P、ΔS5/D79L/S87P/A112P/D142L、ΔS5/N26R/D79L/S87P/A112P/D142L、C6R/D79L/S87P、ΔG8/D79L/S87P、N26R/D79L/S87P、N26R/T46R/D79L/S87P/A112P/D142L、A27G/D79L/S87P/A112P/D142L、A27K/D79L/S87P/A112P/D142L、A27K/D79L/S87P/
A112P/T124V/D142L、A27V/D79L/S87P/A112P/D142L、S41R/D79L/S87P、S41R/D79L/S87P/
A112P/D142L、S41R/D79L/S87P/A112P/D142L/S157K、Y43F/D79L/S87P/A112P/D142L、T46R/D79L/S87P、T46R/D79L/S87P/A112P/D142L、T46R/D79L/S87P/T116V/D142L、S49R/D79L/
S87P、Q53K/D79L/S87P/I173V、Q53R/D79L/S87P、T54R/D79L/S87P、D79L/S87P/A112P、D79L/P81R/S87P/A112P/D142L、D79L/S87P、D79L/S87P/A112P、D79L/S87P/A112P/D142L、D79L/S87P/A112P/D142L/S157K、D79L/S87P/A112P/T124L/D142L、D79L/S87P/A112P/T124V/
A126V/D142L、D79L/S87P/A112P/T124V/D142L、D79L/S87P/D104R、D79L/S87P/D142L、D79L/S87P/N88R、D79L/S87P/Q158W、D79L/S87P/S115R、D79L/S87P/S157K、D79L/S87P/T114P、D79L/S87P/T116V、D79L/Y82F/S87P/A112P/T124V/D142L、D79L/Y82F/S87P/A112P/T124V/
D142L、A27K/D79L/Y82F/S87G/D104P/A112P/A126V/D142L、A27K/Y82F/S87G/D104P/A112P/A126V/D142L、A27K/D79L/Y82F/D104P/A112P/A126V/D142L、A27K/Y82F/D104P/A112P/
A126V/D142L。
[0217] 4.项1的方法,其中所述蛋白酶变体在至少一个选自下组的位置包含至少一个修饰:27、79、82、87、104、112、126和142。
[0218] 5.项4的方法,其中所述蛋白酶变体包含至少一个选自下组的修饰:A27K、D79L、Y82F、S87G、S87P、D104P、A112P、A126V和D142L。
[0219] 6.一种多肽,其与SEQ ID NO:2的氨基酸1至177中所示的蛋白酶相比具有至少75%同一性,并且与SEQ ID NO:2的氨基酸1至177相比在选自下述的至少一个位置包含至
少一个修饰:27、79、82、87、112、142、2、5、6、8、26、41、43、46、49、53、54、73、88、104、114、
115、116、126、152、157、158和173,其中所述多肽与SEQ ID NO:2的氨基酸1至177中所示的蛋白酶相比具有改善的热稳定性。
[0220] 7.项6的具有蛋白酶活性的多肽,其包含至少一种选自下述的修饰:A27K、A27G、A27V、Q53K、Q53R、T54R、D79K、D79L、D79M、Y82F、S87P、S87G、A112P、D142L、R2P、ΔS5、C6R、ΔG8、N26R、S41R、Y43F、T46R、S49R、A73C、P81R、N88R、D104R、D104P、T114P、S115R、T116V、T124L、T124V、A126V、M152R、S157K、Q158W和I173V。
[0221] 8.项6的具有蛋白酶活性的多肽,其中所述多肽在至少一个选自下组的位置具有至少一个修饰:27、79、82、87、104、112、126和142。
[0222] 9.项8的具有蛋白酶活性的多肽,其中所述多肽包含选自下述的至少一个修饰:A27K、D79L、Y82F、S87G、S87P、D104P、A112P、A126V和D142L。
[0223] 10.项6至9任一项的具有蛋白酶活性的多肽,该多肽包含选自下组的修饰组:
[0224] ΔS5/D79L/S87P、ΔS5/D79L/S87P/A112P/D142L、ΔS5/N26R/D79L/S87P/A112P/D142L、C6R/D79L/S87P、ΔG8/D79L/S87P、N26R/D79L/S87P、N26R/T46R/D79L/S87P/A112P/D142L、A27G/D79L/S87P/A112P/D142L、A27K/D79L/S87P/A112P/D142L、A27K/D79L/S87P/
A112P/T124V/D142L、A27V/D79L/S87P/A112P/D142L、S41R/D79L/S87P、S41R/D79L/S87P/
A112P/D142L、S41R/D79L/S87P/A112P/D142L/S157K、Y43F/D79L/S87P/A112P/D142L、T46R/D79L/S87P、T46R/D79L/S87P/A112P/D142L、T46R/D79L/S87P/T116V/D142L、S49R/D79L/
S87P、Q53K/D79L/S87P/I173V、Q53R/D79L/S87P、T54R/D79L/S87P、D79L/S87P/A112P、D79L/P81R/S87P/A112P/D142L、D79L/S87P、D79L/S87P/A112P、D79L/S87P/A112P/D142L、D79L/S87P/A112P/D142L/S157K、D79L/S87P/A112P/T124L/D142L、D79L/S87P/A112P/T124V/
A126V/D142L、D79L/S87P/A112P/T124V/D142L、D79L/S87P/D104R、D79L/S87P/D142L、D79L/S87P/N88R、D79L/S87P/Q158W、D79L/S87P/S115R、D79L/S87P/S157K、D79L/S87P/T114P、D79L/S87P/T116V/、D79L/Y82F/S87P/A112P/T124V/D142L、D79L/Y82F/S87P/A112P/T124V/D142L、A27K/D79L/Y82F/S87G/D104P/A112P/A126V/D142L、A27K/Y82F/S87G/D104P/A112P/A126V/D142L、A27K/D79L/Y82F/D104P/A112P/A126V/D142L、A27K/Y82F/D104P/A112P/
A126V/D142L。
[0225] 11.一种分离的核酸序列,其包含编码项6至10任一项的具有蛋白酶活性的多肽的核酸序列。
[0226] 12.一种核酸构建体,其包含可操作地连接的项11的核酸序列和一种或多种调控序列,所述调控序列指导蛋白酶在合适的表达宿主中产生。
[0227] 13.一种重组表达载体,其包含项12的核酸构建体。
[0228] 14.一种重组宿主细胞,其包含项12的核酸构建体和/或项13的表达载体。
[0229] 15.一种用于产生项6至10任一项的具有蛋白酶活性的多肽的方法,其包括:
[0230] (a)培养项14的宿主细胞以产生包含具有蛋白酶活性的多肽的上清;和(b)回收具有蛋白酶活性的多肽。
[0231] 16.一种转基因植物或植物部分,其能够表达项6至10任一项的具有蛋白酶活性的多肽。
[0232] 17.一种用于产生发酵产物的方法,其包括:(a)使用发酵微生物和含糖材料在项6至10任一项的具有蛋白酶活性的多肽的存在下进行发酵,和(b)从经发酵的含糖材料产生
发酵产物。
[0233] 18.项17的方法,其中所述发酵产物是乙醇,和/或蒸馏干酒糟(DDG)。
[0234] 19.至少一种项6至10任一项的具有蛋白酶活性的多肽在用于产生发酵产物优选乙醇的工艺中的用途。
实施例
[0235] 使用的化学品是至少试剂级的商品。
[0236] 实施例1:变体的制备,和热稳定性的测试
[0237] 菌株和质粒
[0238] 使用大肠杆菌DH12S(可从Gibco BRL获得)进行酵母质粒回收。pJTP000是TPI启动子调控下的酿酒酵母和大肠杆菌穿梭载体,其从WO 01/92502中所述的pJC039构建,其中插入了橙橘嗜热子囊菌M35蛋白酶基因(WO 03048353)。
[0239] 使用酿酒酵母YNG318感受态细胞:MATa Dpep4[cir+]ura3-52,leu2-D2,his 4-539进行蛋白酶变体表达。其描述于J.Biol.Chem.272(15),pp 9720-9727,1997。
[0240] 培养基和底物
[0241] 10X基础溶液:不含氨基酸的酵母氮基(DIFCO)66.8g/l,琥珀酸盐(succinate)100g/l,NaOH 60g/l。
[0242] SC-葡萄糖:20%葡萄糖(即最终浓度为2%=2g/100ml)100ml/l,5%苏氨酸4ml/l,1%色氨酸10ml/l,20%水解酪蛋白氨基酸25ml/l,10X基础溶液100ml/l。该溶液使用孔径为0.20微米的过滤器灭菌。将琼脂(2%)和H2O(大约761ml)一同高压灭菌,并将单独灭菌的SC-葡萄糖溶液添加至琼脂溶液。
[0243] YPD:Bacto蛋白胨20g/l,酵母提取物10g/l,20%葡萄糖100ml/l。
[0244] YPD+Zn:YPD+0.25mM ZnSO4。
[0245] PEG/LiAc溶液:40%PEG400050ml,5M乙酸锂1ml。
[0246] 96孔玉米醇溶蛋白(Zein)微滴定板:
[0247] 每孔含有200微升的20mM乙酸钠缓冲液pH 4.5中的0.05-0.1%的玉米醇溶蛋白(Sigma),0.25mM ZnSO4和1%的琼脂。
[0248] DNA操作
[0249] 除非另行指明,DNA操作和转化使用如Sambrook等(1989)Molecular cloning:A laboratory manual,Cold Spring Harbor lab.Cold Spring Harbor,NY;Ausubel,F.M.等
(eds.)"Current protocols in Molecular Biology",John Wiley and Sons,1995;
Harwood,C.R.和Cutting,S.M.(Eds.)中所述的分子生物学标准方法进行。
[0250] 酵母转化
[0251] 酵母转化使用乙酸锂方法进行。将0.5微升的载体(由限制性内切核酸酶消化)和1微升的PCR片段混合。将DNA混合物,100微升的YNG318感受态细胞,和10微升的YEAST MAKER运载体DNA(Clontech)添加至12ml聚丙烯试管(Falcon 2059)。添加0.6ml PEG/LiAc溶液并
轻柔地混合。在30℃和200rpm温育30分钟,接着在42℃进行30分钟(热激)。转移至
Eppendorf试管,并离心5秒。去除上清,并溶解于3ml的YPD。在30℃在200rpm温育细胞悬液
45分钟。将悬液倾至SC-葡萄糖平板,并在30℃温育3日以生长菌落。酵母总DNA通过
Zymoprep Yeast Plasmid Miniprep Kit(ZYMO research)提取。
[0252] DNA测序
[0253] 用于DNA测序的大肠杆菌转化通过电穿孔进行(BIO-RAD Gene Pulser)。DNA质粒通过碱性方法(Molecular Cloning,Cold Spring Harbor)或用 Plasmid Kit制
备。DNA片段从琼脂糖凝胶通过Qiagen凝胶提取试剂盒回收。PCR使用PTC-200DNA Engine进行。使用ABI PRISMTM 310Genetic Analyzer确定所有DNA序列。
[0254] 蛋白酶表达载体的构建
[0255] 嗜热子囊菌M35蛋白酶基因用引物对Prot F(SEQ ID NO:3)和Prot R(SEQ ID NO:4)扩增。将所得的PCR片段与用限制性酶消化以去除特异腐质霉质酶基因的pJC039载体
(描述于WO2001/92502)一同导入酿酒酵母YNG318。
[0256] 回收SC-葡萄糖平板上的酵母克隆中的质粒以确证内部序列,并命名为pJTP001。
[0257] 酵母文库和定点变体的构建
[0258] 酵母中的文库和定点变体通过SOE PCR方法(Splicing by Overlap Extension,参见“PCR:A practical approach”,207-209页,Oxford University  press,编
.McPherson,Quirke,Taylor)继以酵母体内重组来构建。
[0259] 用于扩增和测序的通用引物
[0260] 使用引物AM34(SEQ ID NO:5)和AM35(SEQ ID NO:6)以与简并引物(AM34+反向引物和AM35+正向引物)一同通过SOE方法制备含有任何突变的片段的DNA片段,或仅用于扩增
整个蛋白酶基因(AM34+AM35)。
[0261]
[0262] DNA片段从琼脂糖凝胶通过Qiagen凝胶提取试剂盒回收。将所得的纯化的片段与载体消化物混合。将混合溶液导入酿酒酵母以通过体内重组构建文库或定位变体。
[0263] 相对活性测定
[0264] 将SC-葡萄糖上的酵母克隆接种至含有YPD+Zn培养基的96孔微滴定板的孔中,并在28℃培养3日。将培养上清施于96孔玉米醇溶蛋白微滴定板,并在至少2个温度(例如,60℃和65℃,70℃和75℃,70℃和80℃)温育超过4小时或过夜。平板中玉米醇溶蛋白的浊度测量为A630,并确定相对活性(较高/较低温度)作为热活性改善的指标。选择与亲本变体相比具有较高相对活性的克隆并确定其序列。
[0265] 剩余活性测定
[0266] 将SC-葡萄糖上的酵母克隆接种至96孔微滴定板的孔中,并在28℃培养3日。在20mM乙酸钠缓冲液pH 4.5中在一定温度(80℃或84℃,以4℃作为参照)温育培养上清10分
钟之后,使用偶氮酪蛋白(Megazyme)在65℃测量蛋白酶活性以确定剩余活性。选择与亲本
变体相比具有较高剩余活性的克隆,并确定其序列。
[0267] 偶氮酪蛋白测定
[0268] 将20微升的样品与150微升的底物溶液(96ml的20mM乙酸钠pH 4.5中的4ml乙醇中的12.5%偶氮酪蛋白,含有0.01%triton-100和0.25mM ZnSO4)混合,并温育4小时或更久。
[0269] 在添加20微升/孔的100%三氯乙酸(TCA)溶液之后,对平板进行离心,并移出100微升的上清以测量A440。
[0270] 蛋白酶变体在米曲霉中的表达
[0271] 使用包含蛋白酶变体基因的构建体以构建用于曲霉属的表达载体。曲霉属表达载体由表达盒组成,所述表达盒基于融合于构巢曲霉丙糖磷酸异构酶未翻译先导序列(Pna2/
tpi)和黑曲霉淀粉葡糖苷酶终止子(Tamg)的黑曲霉中性淀粉酶II启动子。亦存在于质粒上
的是来自构巢曲霉的曲霉属选择性标记amdS,其使得能够以乙酰胺作为唯一氮源进行生
长。将用于蛋白酶变体的表达质粒如在Lassen等(2001),Appl.Environ.Microbiol.67,
4701-4707中所述转化入曲霉属。对于每个构建体,将10-20个菌株分离,纯化,并在摇瓶中培养。
[0272] 表达变体的纯化
[0273] 1.将0.22μm过滤的发酵样品的pH调整至4.0。
[0274] 2.将样品置于浴上进行磁力搅拌。添加小份的(NH4)2SO4(对应于大约2.0-2.2M(NH4)2SO4,当添加该化合物时不考虑体积增加)。
[0275] 3.在(NH4)2SO4的最终添加之后,将样品在冰上以轻柔磁力搅拌温育至少45分钟。
[0276] 4.离心:配置有R20A2转子头的Hitachi himac CR20G High-Speed Refrigerated Centrifuge,5℃,20,000rpm,30分钟。
[0277] 5.将形成的沉淀溶解于200ml 50mM乙酸钠pH 4.0。
[0278] 6.通过使用0.22μm PES PLUS膜(IWAKI)的真空抽吸过滤样品。
[0279] 7.使用在冷房中的过夜超滤(配置有5kDa MWCO PES膜的来自Vivascience的Vivacell 250)将样品脱盐/缓冲液交换至50mM乙酸钠pH 4.0。将渗余样品使用50mM乙酸钠
pH 4.0稀释至200ml。样品的电导率优选低于5mS/cm。
[0280] 8.将样品加载于用50mM乙酸钠pH 4.0平衡的阳离子交换柱。使用3倍柱体积的结合缓冲液(50mM乙酸钠pH 4.0)将未结合的样品从柱洗出,并使用10倍柱体积的线性梯度0-
100%洗脱缓冲液(50mM乙酸钠+1M NaCl pH 4.0)洗脱样品。
[0281] 9.通过内蛋白酶测定(参见下文)继以对选定级分进行标准的SDS-PAGE(还原条件)来测定收集的级分。基于所述内蛋白酶测定和SDS-PAGE来汇集级分。
[0282] 内蛋白酶测定
[0283] 1.将Protazyme OL片/5ml 250mM乙酸钠pH 5.0通过磁力搅拌溶解(底物:来自Megazyme的内蛋白酶Protazyme AK片-目录号PRAK 11/08)。
[0284] 2.在搅拌下,将250微升的底物溶液转移至1.5ml Eppendorf试管。
[0285] 3.将25微升的样品添加至每个试管(空白为样品缓冲液)。
[0286] 4.将试管在Thermomixer上在50℃振荡(1000rpm)温育15分钟。
[0287] 5.将250微升的1M NaOH添加至每个试管,接着进行涡旋。
[0288] 6.在16,100×G和25℃离心3分钟。
[0289] 7.将200微升的上清转移至MTP,并记录在590nm的吸光度。
[0290] 结果
[0291]
[0292]
[0293]
[0294]
[0295]
[0296]
[0297]
[0298]
[0299] 实施例2
[0300] 使用纯化的酶进行的选定的变体的温度概貌
[0301] 纯化了显示良好热稳定性的选定的变体,并将纯化的酶用于如下所述的玉米醇溶蛋白-BCA测定。剩余蛋白酶活性在60℃在所示的升高的温度下温育酶60分钟之后来确定。
[0302] 玉米醇溶蛋白-BCA测定:
[0303] 在多个温度进行了玉米醇溶蛋白-BCA测定以检测变体蛋白酶从玉米醇溶蛋白释放的可溶性蛋白的量。
[0304] 实验方案:
[0305] 1)在微滴定板(MTP)中将10ul的10ug/ml酶溶液和100ul的0.025%玉米醇溶蛋白溶液混合。
[0306] 2)在多个温度下温育60分钟。
[0307] 3)添加10ul的100%三氯乙酸(TCA)溶液。
[0308] 4)在3500rpm将MTP离心5分钟。
[0309] 5)取出15ul至含有100ul的BCA测定溶液的新MTP(Pierce目录号:23225,BCA Protein Assay Kit)。
[0310] 6)在60℃温育30分钟。
[0311] 7)测量A562。
[0312] 结果示于表6。所有测试的变体与wt蛋白酶相比显示改善的热稳定性。
[0313] 表6:玉米醇溶蛋白-BCA测定
[0314]
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈