首页 / 专利库 / 植物油脂 / 植物油 / 棉籽油 / 磷脂酶、编码它们的核酸及其制备和应用方法

磷脂酶、编码它们的核酸及其制备和应用方法

阅读:117发布:2022-06-20

专利汇可以提供磷脂酶、编码它们的核酸及其制备和应用方法专利检索,专利查询,专利分析的服务。并且本 发明 提供了具有磷脂酶活性的新型多肽、编码它们的核酸和与它们结合的 抗体 ,所述磷脂酶活性包括,例如,磷脂酶A、B、C和D活性, 马 铃薯 块 茎蛋白活性,磷脂酸 磷酸 酶(PAP)和/或脂酰 水 解 酶(LAH)活性。也提供包括应用这些磷脂酶的工业方法,如,油脱胶,以及包括应用这些磷脂酶的产品。,下面是磷脂酶、编码它们的核酸及其制备和应用方法专利的具体信息内容。

1.分离的、合成的或者重组的核酸,其包含如下核酸序列:
(a)编码具有磷脂酶活性的多肽,和
(i)与SEQ ID NO:177或SEQ ID NO:178具有至少50%、51%、52%、53%、 54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、 67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、 80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、 93%、94%、95%、96%、97%、98%、99%或者更多的或者100%序列同一性,以及 编码具有至少一、二、三、四、五、六、七、八、九、十、十一、十二、十三、十四、 十五、十六、十七、十八、十九、二十、二十一、二十二、二十三、二十四、二十五、 二十六、二十七、二十八、二十九或三十个由E41A、E41W、E41F、E41Y、E41R、 E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y1 16W、 I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、 D234V、D234G、D234R、D234K和/或Q265R或等同基酸突变或其任何组合组成 的突变的多肽,
以及任选地,所述序列同一性通过用序列比对算法分析或者通过目测检查来 确定,
以及任选地,所述序列比对算法是BLAST 2.2.2版算法,其中过滤设置设为 blastall-p,blastp-d“nr pataa”-F F,并且所有其它可选项设为默认值;或者
(ii)编码具有至少一、二、三、四、五、六、七、八、九、十、十一、十二、 十三、十四、十五、十六、十七、十八、十九、二十、二十一、二十二、二十三、二 十四、二十五、二十六、二十七、二十八、二十九或三十个由表5所列的氨基酸突变 或等同氨基酸突变组成的氨基酸突变的多肽;或者
(iii)在严格条件下,与包括具有一个或多个编码E41A、E41W、E41F、E41Y、 E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、 Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、 D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQ ID NO:177或SEQ ID NO:178的核酸杂交,
其中所述严格条件包括洗涤步骤,其包括在0.2×SSC、大约65℃温度下 洗涤大约15分钟;
(b),(a)所述的核酸(多核苷酸)序列,其编码具有磷脂酶活性的多肽,但缺乏:信 号序列或原蛋白序列或同源启动子序列;
(c),(a)或(b)所述的核酸(多核苷酸),编码具有磷脂酶活性的多肽,并且进一步包 括异源氨基酸序列,或(a)或(b)中所述的核酸(多核苷酸)包括异源核苷酸序列;
(d),(c)所述的核酸(多核苷酸),其中所述异源氨基酸序列包括编码异源(前导)信 号序列、或标记或表位的序列,或由编码异源(前导)信号序列、或标记或表位的序列 组成,或者所述异源核苷酸序列包括异源启动子序列;
(e),(c)或(d)所述的核酸(多核苷酸),其中所述异源核苷酸序列编码异源(前导)信 号序列,该信号序列包括N-末端和/或C-末端延伸或由N-末端和/或C-末端延伸组成, 用于靶向至内质网(ER)或内膜、或者靶向至植物内质网(ER)或内膜系统,或者所述异 源序列编码限制性位点;
(f),(d)所述的核酸(多核苷酸),其中所述异源启动子序列包括组成型或诱导型启 动子、或细胞类型特异性启动子、或植物特异性启动子或细菌特异性启动子,或由所 述启动子组成;
(g),(a)至(f)任何一项所述的核酸(多核苷酸),其中所述磷脂酶活性包括:
(i)催化在生物细胞、真菌细胞、哺乳动物细胞或植物细胞中的磷脂解; 催化甘油磷酸酯键的水解;催化植物油中磷脂的酯键的水解;催化植物油磷脂或含油 种子磷脂中磷脂的酯键的水解;磷脂酶C(PLC)活性;磷脂酶A(PLA)活性;磷脂酶 B(PLB)活性;磷脂酶D(PLD)活性;磷脂酶D1或者磷脂酶D2活性;催化糖蛋白的 水解;催化铃薯或茎糖蛋白的水解;patatin酶活性;或脂酰水解酶(LAH)活性, 或一种或多种这些磷脂酶活性的任何组合,
(ii),任何PLC和/或PLA活性;PLB和/或PLA活性;PLC和/或PLD活性; PLC和/或PLB活性;PLB和/或patatin活性;PLC和/或patatin活性;PLD和/或PLA; PLD、PLA、PLB和PLC活性;和/或PLD、PLA、PLB、PLC和patatin活性,
(iii)任何溶血磷脂酶(LPL)活性或溶血磷脂酶-转酰基酶(LPTA)活性或溶血磷 脂酶(LPL)活性和溶血磷脂酶-转酰基酶(LPTA)活性,或者
(iv)催化磷脂酰胆(PC)、磷脂酰乙醇胺(PE)、磷脂酰丝氨酸(PS)、磷脂酰肌 醇(PI)和/或磷脂酸或其组合中的甘油磷酸酯键的水解;
(h),(a)至(g)任何一项所述的核酸(多核苷酸),其中所述磷脂酶活性是热稳定的, 或者所述多肽在包括温度范围为约-100℃至约-80℃、约-80℃至约-40℃、约-40℃至 约-20℃、约-20℃至约0℃、约0℃至约37℃、约0℃至约5℃、约5℃至约15℃、约 15℃至约25℃、约25℃至约37℃、约37℃至约45℃、约45℃至约55℃、约55℃ 至约70℃、约70℃至约75℃、约75℃至约85℃、约85℃至约90℃、约90℃至约 95℃、约95℃至约100℃、约100℃至约105℃、约105℃至约110℃、约110℃至约 120℃、或者95℃、96℃、97℃、98℃、99℃、100℃、101℃、102℃、103℃、104℃、 105℃、106℃、107℃、108℃、109℃、110℃、111℃、112℃、113℃、114℃、115℃ 或更高的条件下,保持磷脂酶活性;或者
(i),(a)至(g)任何一项所述的核酸(多核苷酸),其中所述磷脂酶活性是耐热的,或 者所述多肽在暴露于范围为约-100℃至约-80℃、约-80℃至约-40℃、约-40℃至约 -20℃、约-20℃至约0℃、约0℃至约37℃、约0℃至约5℃、约5℃至约15℃、约 15℃至约25℃、约25℃至约37℃、约37℃至约45℃、约45℃至约55℃、约55℃至 约70℃、约70℃至约75℃、约75℃至约85℃、约85℃至约90℃、约90℃至约95℃、 约95℃至约100℃、约100℃至约105℃、约105℃至约110℃、约110℃至约120℃、 或95℃、96℃、97℃、98℃、99℃、100℃、101℃、102℃、103℃、104℃、105℃、 106℃、107℃、108℃、109℃、110℃、111℃、112℃、113℃、114℃、115℃或更高 的温度后,保持磷脂酶活性;
(j),(h)或(i)任何一项所述的分离的、合成的或者重组的核酸,其中所述多肽在约 pH6.5、pH6.0、pH5.5、pH5.0、pH4.5、pH4.0、pH3.5、pH3.0或更低的酸性pH下是 耐热的或热活性的,或者所述多肽在约pH7、pH7.5、pH8.0、pH8.5、pH9.0、pH9.5、 pH10、pH10.5、pH11.0、pH11.5、pH12.0、pH12.5或更高pH时是耐热的或热活 性的,或者在包括约pH6.5、pH6.0、pH5.5、pH5.0、pH4.5、pH4.0、pH3.5、pH 3.0 或更低的酸性pH的条件下是有活性的,或者在包括约pH7、pH7.5、pH8.0、pH8.5、 pH9.0、pH9.5、pH10、pH10.5、pH11.0、pH11.5、pH12.0、pH12.5或更高pH的 条件下是有活性的;
(k),(a)至(j)任何一项所述的分离的、合成的或者重组的核酸,其中在隐蔽转录 起始位点的核苷酸残基被修饰以消除大部分或所有截短转录体的产生;
(l),(k)所述的分离的、合成的或者重组的核酸,其中所述在隐蔽转录起始位点的 核苷酸残基修饰包括在核糖体结合位点(RBS)中的改变;或者
(m),与(a)至(1)任何一项中所述的核苷酸序列完全互补的核酸序列。
2.用于鉴定编码具有磷脂酶活性的多肽的核酸的核酸探针,其中所述探针包括 核酸(多核苷酸)序列的至少10、20、30、40、50、60、70、80、90、100或150或更 多,或至少10至50、约20至60、约30至70、约40至80、约60至100、或约50 至150个连续碱基,所述核酸(多核苷酸)序列包括:
(a)(i)权利要求1所述的核酸(多核苷酸)序列;或(ii)SEQ ID NO:177或SEQ ID NO:178,以及
(b)编码具有一个或多个氨基酸突变E41A、E41W、E41F、E41Y、E41R、E94R、 D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、 P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、 D234G、D234R、D234K和/或Q265Ra或等同氨基酸突变的多肽;
其中所述探针通过结合或者杂交鉴定所述核酸。
3.载体、表达盒或克隆载体:(a)其包括权利要求1所述的核酸(多核苷酸)序列; 或者(b),(a)所述的载体、表达盒或克隆载体,其包括或包含在病毒载体、质粒、噬 菌体、噬菌粒、粘粒、F粘粒、细菌噬菌体、人工染色体、腺病毒载体,逆转录病毒 载体或者腺相关病毒载体中;或者,细菌人工染色体(BAC)、质粒、细菌噬菌体P1 衍生载体(PAC)、酵母人工染色体(YAC)、或者哺乳动物人工染色体(MAC)。
4.宿主细胞或转化细胞:(a)其包括权利要求1所述的核酸(多核苷酸)序列,或权 利要求3所述的载体、表达盒或克隆载体;或者,(b)(a)所述的宿主细胞或转化细胞, 其中所述细胞是细菌细胞、哺乳动物细胞、真菌细胞、酵母细胞、昆虫细胞或者植物 细胞。
5.转基因非-人类动物:(a)其包括权利要求1所述的核酸(多核苷酸)序列;权利 要求3所述的载体、表达盒或克隆载体;或者权利要求4所述的宿主细胞或转化细胞; 或(b)(a)所述的转基因非-人类动物,其中所述动物是小鼠、大鼠、山羊、兔、绵羊、 猪或
6.转基因植物或种子:(a)其包括权利要求1所述的核酸(多核苷酸)序列;权利要 求3所述的载体、表达盒或克隆载体;或者权利要求4所述的宿主细胞或转化细胞; (b)(a)所述的转基因植物,其中所述植物是玉米植物、蜀黍植物、马铃薯植物、番茄 植物、小麦植物、含油种子植物、油菜籽植物、大豆植物、水稻植物、大麦植物、草、 花种子、棕榈、芝麻种子植物、花生植物、向日葵植物或烟草植物;(a)所述的转基 因种子,其中所述种子是玉米种子、小麦仁、含油种子、油菜籽、大豆种子、棕榈仁、 向日葵种子、芝麻种子、水稻、大麦、花生、棉花种子、棕榈、花生、芝麻种子、向 日葵种子或烟草植物种子。
7.反义寡核苷酸,其包括与权利要求1所述的核酸(多核苷酸)序列互补或在严格 条件下能够与其杂交的核酸序列。
8.抑制细胞内磷脂酶信息翻译的方法,其包括向所述细胞施用包括权利要求1 所述的核酸(多核苷酸)序列的反义寡核苷酸,或在所述细胞中表达包括权利要求1所 述的核酸(多核苷酸)序列的反义寡核苷酸。
9.分离的、合成的或者重组的多肽,其具有磷脂酶活性,并且:
(a)包括氨基酸序列,(i)其具有与SEQ ID NO:175或SEQ ID NO:176具有至少 50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、 63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、 76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、 89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或者更多的或 者100%序列同一性,和具有至少一、二、三、四、五、六、七、八、九、十、十一、 十二、十三、十四、十五、十六、十七、十八、十九、二十、二十一、二十二、二十 三、二十四、二十五、二十六、二十七、二十八、二十九或三十个由E41A、E41W、 E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、 D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、 D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R或等同氨基 酸突变组成的氨基酸突变,其中任选地,所述序列同一性通过用序列比对算法分析或 者通过目测检查来确定;或者,(ii)由权利要求1所述的核酸(多核苷酸)编码;
(b),包括(a)所述的多肽,但缺乏信号序列或原蛋白序列;
(c),进一步包括异源氨基酸序列;
(d),包括(c)所述的多肽,其中所述异源氨基酸序列包括异源(前导)信号序列、或 标记或表位,或由异源(前导)信号序列、或标记或表位组成;
(e),包括(c)或(d)所述的多肽,其中所述异源(前导)信号序列包括N-末端和/或C- 末端延伸或由N-末端和/或C-末端延伸组成,用于靶向至内质网(ER)或内膜、或者靶 向至植物内质网(ER)或内膜系统;
(f),包括(a)至(e)任何一项所述的多肽,其中所述磷脂酶活性包括:
(i)催化在微生物细胞、真菌细胞、哺乳动物细胞或植物细胞中的磷脂水解; 催化甘油磷酸酯键的水解;催化植物油中磷脂的酯键的水解;催化植物油磷脂或含油 种子磷脂中磷脂的酯键的水解;磷脂酶C(PLC)活性;磷脂酶A(PLA)活性;磷脂酶 B(PLB)活性;磷脂酶D(PLD)活性;磷脂酶D1或者磷脂酶D2活性;催化糖蛋白的 水解;催化马铃薯或块茎糖蛋白的水解;patatin酶活性;或脂酰水解酶(LAH)活性, 或一种或多种这些磷脂酶活性的任何组合,
(ii)任何PLC和/或PLA活性;PLB和/或PLA活性;PLC和/或PLD活性; PLC和/或PLB活性;PLB和/或patatin活性;PLC和/或patatin活性;PLD和/或PLA; PLD、PLA、PLB和PLC活性;和/或PLD、PLA、PLB、PLC和patatin活性,
(iii)任何溶血磷脂酶(LPL)或溶血磷脂酶-转酰基酶(LPTA)活或溶血磷脂酶 (LPL)活性和溶血磷脂酶-转酰基酶(LPTA)活性,或者
(iv)催化磷脂酰胆碱(PC)、磷脂酰乙醇胺(PE)、磷脂酰丝氨酸(PS)、磷脂酰肌 醇(PI)和/或磷脂酸或其组合中的甘油磷酸酯键的水解;
(g),包括(a)至(f)任何一项所述的多肽,其中所述磷脂酶活性是热稳定的,或者 所述多肽在包括温度范围为约-100℃至约-80℃、约-80℃至约-40℃、约-40℃至约 -20℃、约-20℃至约0℃、约0℃至约37℃、约0℃至约5℃、约5℃至约15℃、约 15℃至约25℃、约25℃至约37℃、约37℃至约45℃、约45℃至约55℃、约55℃ 至约70℃、约70℃至约75℃、约75℃至约85℃、约85℃至约90℃、约90℃至约 95℃、约95℃至约100℃、约100℃至约105℃、约105℃至约110℃、约110℃至约 120℃、或者95℃、96℃、97℃、98℃、99℃、100℃、101℃、102℃、103℃、104℃、 105℃、106℃、107℃、108℃、109℃、110℃、111℃、112℃、113℃、114℃、115℃ 或更高温度的条件下,保持磷脂酶活性;或者
(h),包括(a)至(f)任何一项所述的多肽,其中所述磷脂酶活性是耐热的,或者所 述多肽在暴露于包括范围为约-100℃至约-80℃、约-80℃至约-40℃、约-40℃至约 -20℃、约-20℃至约0℃、约0℃至约37℃、约0℃至约5℃、约5℃至约15℃、约 15℃至约25℃、约25℃至约37℃、约37℃至约45℃、约45℃至约55℃、约55℃至 约70℃、约70℃至约75℃、约75℃至约85℃、约85℃至约90℃、约90℃至约95℃、 约95℃至约100℃、约100℃至约105℃、约105℃至约110℃、约110℃至约120℃、 或95℃、96℃、97℃、98℃、99℃、100℃、101℃、102℃、103℃、104℃、105℃、 106℃、107℃、108℃、109℃、110℃、111℃、112℃、113℃、114℃、115℃或更高 的温度后,保持磷脂酶活性;
(i),包括(g)或(h)所述的多肽,其中所述多肽在约pH6.5、pH6.0、pH5.5、pH5.0、 pH4.5、pH4.0、pH3.5、pH3.0或更低的酸性pH下是耐热的或热活性的,或者所述多 肽在约pH 7、pH7.5、pH8.0、pH8.5、pH9.0、pH9.5、pH10、pH10.5、pH11.0、pH11.5、 pH12.0、pH12.5或更高pH下是耐热的或热活性的,或者在包括约pH6.5、pH6.0、 pH5.5、pH5.0、pH4.5、pH4.0、pH3.5、pH3.0或更低的酸性pH的条件下是有活性的, 或者在包括约pH 7、pH7.5、pH8.0、pH8.5、pH9.0、pH9.5、pH10、pH10.5、pH11.0、 pH11.5、pH12.0、pH12.5或更高pH的条件下是有活性的;或者其中所述耐热性包 括经加热至升高的温度以后,在37℃下仍保持磷脂酶至少一半的比活性;或者其中 所述耐热性包括经加热至升高的温度以后,在37℃下保持每毫克蛋白大约500到大 约1200单位的比活性;
(j),包括(a)至(i)任何一项所述的多肽,其中所述多肽是糖基化的,或者所述多肽 包括至少一个糖基化位点,(ii)(i)所述的多肽,其中所述糖基化是N-连接糖基化或O- 连接糖基化;(iii)(i)或(ii)所述的多肽,其中所述多肽在酵母细胞中表达后进行糖基化; 或(iv)(iii)所述的多肽,其中所述酵母细胞是巴斯德毕赤酵母或粟酒裂殖酵母;
(k),(a)至(j)任何一项所述的多肽,其中所述磷脂酶活性包括在约37℃下每毫克 蛋白约100至约1000单位、每毫克蛋白约500至约750单位、每毫克蛋白约500至 约1200单位、或每毫克蛋白约750至约1000单位范围内的比活性;或者
(l),(a)至(k)任何一项所述的多肽,其中(i)所述多肽进一步包括信号序列(前导序 列或引导肽)与所述酶之间的另外的氨基酸残基,或(ii),(i)所述的多肽,其中所述另 外的氨基酸残基包括Glu-Ala。
10.蛋白制备物,其包括权利要求9所述的多肽,其中所述蛋白制备物包括液体、 固体或凝胶。
11.异源二聚物:(a)其包括权利要求9所述的多肽和第二结构域;或(b),(a)所述 的异源二聚物,其中所述第二结构域是多肽并且所述异源二聚物是融合蛋白,或者所 述第二结构域是表位或者标记。
12.同源二聚物,其包括权利要求9所述的多肽。
13.固定化多肽:(a)其中所述多肽包括权利要求9所述的多肽;或者(b),(a)所 述的固定化多肽,其中所述多肽被固定在细胞、金属、树脂聚合物、陶瓷、玻璃、 微电极石墨颗粒、珠子、凝胶、板、阵列或者毛细管上。
14.分离的、合成的或者重组的抗体:(a)其特异性地与权利要求9所述的多肽结 合;或者(b),(a)所述的分离的、合成的或者重组的抗体,其中所述抗体是单克隆或 者多克隆抗体,或者其抗原结合片段
15.杂交瘤,其包括权利要求14所述的抗体。
16.阵列,其包括权利要求9所述的固定化多肽,或1所述的固定化的核酸;或 权利要求14所述的抗体,或其组合。
17.分离或鉴定具有磷脂酶活性的多肽的方法,包括以下步骤:
(a)提供权利要求14所述的抗体;
(b)提供含有多肽的样品;以及
(c)在所述抗体能够特异性地结合所述多肽的条件下,将步骤(b)所述的样品与步 骤(a)所述的抗体接触,从而分离或鉴定具有磷脂酶活性的多肽。
18.制备抗磷脂酶抗体的方法,包括向非人类动物施用足以产生体液免疫应答的 量的权利要求1所述的磷脂酶编码核酸(多核苷酸)序列,从而制备抗磷脂酶抗体。
19.制备抗磷脂酶抗体的方法,包括向非人类动物施用足以产生体液免疫应答的 量的权利要求9所述的多肽,从而制备抗磷脂酶抗体。
20.生产重组多肽的方法,其包括:
(A),(a)提供可操作地连接于启动子的核酸,其中所述核酸包括权利要求1所述 的核酸(多核苷酸)序列;以及(b)在允许所述多肽表达的条件下表达步骤(a)所述的核 酸,从而生产重组多肽;或者
(B),(A)所述的方法,其进一步包括用步骤(a)所述的核酸转化宿主细胞,随后表 达步骤(a)所述的核酸,从而在转化细胞中生产重组多肽。
21.鉴定具有磷脂酶活性的多肽的方法,其包括
(a)提供权利要求9所述的多肽;
(b)提供磷脂酶底物;以及
(c)将所述多肽与步骤(b)所述的底物接触,并检测底物量的减少或者反应产物量 的增加,其中底物量的减少或者反应产物量的增加说明检测到了具有磷脂酶活性的多 肽。
22.鉴定磷脂酶底物的方法,其包括
(a)提供权利要求9所述的多肽;
(b)提供测试底物;以及
(c)将步骤(a)所述的多肽与步骤(b)所述的测试底物接触,并检测底物量的减少或 者反应产物量的增加,其中底物量的减少或者反应产物量的增加鉴定测试底物为磷脂 酶底物。
23.确定测试化合物是否特异性地结合多肽的方法,其包括:
(a)在允许所述核酸翻译成多肽的条件下,表达核酸或者包含所述核酸的载体,其 中所述核酸具有权利要求1所述的核酸(多核苷酸)序列;
(b)提供测试化合物;
(c)将所述多肽与所述测试化合物接触;以及
(d)确定步骤(b)所述的测试化合物是否特异性地结合所述多肽。
24.确定测试化合物是否特异性地结合多肽的方法,其包括:
(a)提供权利要求9所述的多肽;
(b)提供测试化合物;
(c)将所述多肽与所述测试化合物接触;以及
(d)确定步骤(b)所述的测试化合物是否特异性地结合所述多肽。
25.鉴定磷脂酶活性的调节物的方法,其包括:
(A)(a)提供权利要求9所述的多肽;
(b)提供测试化合物;
(c)将步骤(a)所述的多肽与步骤(b)所述的测试化合物接触,并测定所述磷脂 酶的活性,其中在测试化合物存在的条件下测得的磷脂酶活性与在无测试化合物存在 的条件下测得的磷脂酶活性相比的变化确定所述测试化合物调节所述磷脂酶活性;
(B),(A)所述的方法,其中所述磷脂酶活性通过提供磷脂酶底物并且检测底物量 的减少或者反应产物量的增加、或者底物量的增加或者反应产物量的减少来测定;
(C),(B)所述的方法,其中与不存在测试化合物的条件下底物或者反应产物的量 相比,存在测试化合物时底物量的减少或者反应产物量的增加鉴定所述测试化合物为 磷脂酶活性的激活剂;或者,
(D),(B)所述的方法,其中与不存在测试化合物时底物或者产物的量相比,存在 测试化合物时底物量的增加或者反应产物量的减少鉴定测试化合物是磷脂酶活性的 抑制剂
26.计算机系统,其包括:
(a)处理器和数据存储设备,其中所述的数据存储设备上已存储了多肽序列或核酸 序列,其中所述多肽序列包括权利要求9所述的多肽(氨基酸)序列,由权利要求1所 述的核酸(多核苷酸)序列编码的多肽;
(b)(a)所述的计算机系统,进一步包括序列比较算法,和其上存储了至少一个参 照序列的数据存储设备;
(c)(b)所述的计算机系统,其中所述序列比较算法包括表明多态性的计算机程序; 或者
(d),(a)至(c)任何一项所述的计算机系统,其进一步包括鉴定所述序列的一个或 者多个特征的鉴定器。
27.计算机可读介质,其上已存储了多肽序列或核酸序列,其中所述多肽序列包 括权利要求9所述的多肽(氨基酸)序列;权利要求1所述的核酸(多核苷酸)序列编码 的多肽。
28.鉴定序列中的特征的方法,其包括:
(a)使用鉴定序列的一个或者多个特征的计算机程序来读取序列,其中所述序列包 括多肽序列或核酸序列,其中所述多肽序列包括权利要求9所述的多肽(氨基酸)序列; 由权利要求1所述的核酸(多核苷酸)序列编码的多肽;和(b)用所述计算机程序鉴定所 述序列中的一个或者多个特征。
29.比较第一序列和第二序列的方法,其包括:
(A)(a)通过使用比较序列的计算机程序读取所述第一序列和所述第二序列,其中 所述第一序列包括多肽序列或核酸序列,其中所述多肽序列包括权利要求9所述的多 肽(氨基酸)序列或由权利要求1所述的核酸(多核苷酸)序列编码的多肽;以及(b)用所 述计算机程序确定所述第一序列和所述第二序列之间的差异;
(B)(A)所述的方法,其中确定所述第一序列和所述第二序列之间差异的步骤进一 步包括鉴定多态性的步骤;
(C),(A)或(B)所述的方法,其进一步包括鉴定序列中一个或者多个特征的鉴定器; 或者
(D),(A)至(C)任何一项所述的方法,其包括使用计算机程序读取所述第一序列, 并鉴定所述序列中的一个或者多个特征。
30.从样品中分离或者回收编码具有磷脂酶活性的多肽的核酸的方法,其包括:
(A)(a)提供包括权利要求1所述的核酸(多核苷酸)序列的多核苷酸探针;
(b)从所述样品中分离核酸,或者处理所述样品,以便所述样品中的核酸能 够与步骤(a)所述的多核苷酸探针杂交;
(c)将步骤(b)所述的分离的核酸或处理的样品与步骤(a)所述的多核苷酸探针 结合;以及
(d)分离特异性地与步骤(a)所述多核苷酸探针杂交的核酸,从而从样品中分 离或回收编码具有磷脂酶活性的多肽的核酸;
(B),(A)所述的方法,其中所述样品是环境样品或包括环境样品;
(C),(B)所述的方法,其中所述环境样品是水样品、液体样品、土壤样品、空气 样品或者生物样品,或包括水样品、液体样品、土壤样品、空气样品或者生物样品; 或
(D),(C)所述的方法,其中所述生物样品来源于细菌细胞、原生动物细胞、昆虫 细胞、酵母细胞、植物细胞、真菌细胞或者哺乳动物细胞。
31.产生编码具有磷脂酶活性的多肽的核酸的变体的方法,其包括:
(A)(a)提供包括权利要求1所述的核酸(多核苷酸)序列的模板核酸;以及
(b)在模板序列中修饰、缺失或者添加一个或者多个核苷酸或其组合,从而产 生所述模板核酸的变体;
(B),(A)所述的方法,其进一步包括表达所述变体核酸以产生变体磷脂酶多肽;
(C),(A)或(B)所述的方法,其中所述修饰、添加或者缺失由包括如下的方法引入: 易错PCR、重排、寡核苷酸定向诱变、装配PCR、有性PCR诱变、体内诱变、盒式 诱变、回归整体诱变、指数整体诱变、位点专一性诱变、基因重装配、基因位点饱和 诱变(GSSM)、合成连接重装配(SLR)和其组合;
(D),(A)至(C)所述的方法,其中所述修饰、添加或者缺失由包括如下的方法引入: 重组、回归序列重组、硫代磷酸酯-修饰的DNA诱变、含尿嘧啶的模板诱变、缺口二 重诱变、点错配修复诱变、修复-缺陷型宿主株诱变、化学诱变、放射诱变、缺失诱 变、限制-选择诱变、限制-纯化诱变、人工基因合成、整体诱变、嵌合核酸多聚体生 成和其组合;
(E),(A)至(D)所述的方法,其中所述方法被反复重复,直到产生与所述模板核酸 编码的多肽相比,具有改变的或不同的(变体)活性或者改变的或不同的(变体)稳定性 的(变体)磷脂酶;或者产生与所述模板核酸编码的多肽相比,改变的或不同的(变体) 二级结构;或者产生与所述模板核酸编码的多肽相比,改变的或不同的(变体)翻译后 修饰;
(F),(E)所述的方法,其中所述变体磷脂酶多肽是耐热的,并且在暴露于升高的 温度后,保持某些活性;
(G),(E)所述的方法,其中与模板核酸编码的磷脂酶相比,所述变体磷脂酶多肽 具有增加的糖基化;
(H),(E)所述的方法,其中所述变体磷脂酶多肽在高温下具有磷脂酶活性,其中 模板核酸编码的磷脂酶在高温下没有活性;
(I),(A)至(H)任何一项所述的方法,其中所述方法被反复重复,直到产生与模板 核酸相比具有改变的密码子使用的磷脂酶编码序列;或者
(J),(A)至(H)任何一项所述的方法,其中所述方法被反复重复,直到产生与模板 核酸相比具有更高或更低水平的信息表达或者信使稳定性的磷脂酶基因。
32.修饰编码具有磷脂酶活性的多肽的核酸中的密码子以增加其在宿主细胞中 表达的方法,其包括:
(a)提供编码具有磷脂酶活性的多肽的核酸,其包括权利要求1所述的核酸(多核 苷酸)序列;以及
(b)鉴定步骤(a)的核酸中的非优选或者较不优选的密码子,并且用编码相同氨基 酸的优选的或者中度使用的密码子作为替代密码子替换之,其中优选密码子是在宿主 细胞基因的编码序列中过度表现的密码子,而非优选或较不优选的密码子是在宿主细 胞基因的编码序列中表现不足的密码子,由此修饰所述核酸以增加其在宿主细胞中的 表达。
33.修饰编码磷脂酶多肽的核酸中的密码子的方法,所述方法包括:
(a)提供编码具有磷脂酶活性的多肽的核酸,其包括权利要求1所述的核酸(多核 苷酸)序列;以及
(b)确定步骤(a)的核酸中的密码子,并用编码相同氨基酸的不同密码子作为替代 密码子来替换之,从而修饰编码磷脂酶的核酸中的密码子。
34.修饰编码磷脂酶多肽的核酸中的密码子以增加其在宿主细胞中表达的方法, 所述方法包括:
(a)提供编码磷脂酶多肽的核酸,其包括权利要求1所述的核酸(多核苷酸)序列; 以及
(b)鉴定步骤(a)的核酸中的非优选或者较不优选的密码子,并且用编码相同氨基 酸的优选的或者中度使用的密码子作为替代密码子替换之,其中优选密码子是在宿主 细胞基因的编码序列中过度表现的密码子,而非优选或较不优选的密码子是在宿主细 胞基因的编码序列中表现不足的密码子,由此修饰所述核酸以增加其在宿主细胞中的 表达。
35.修饰编码具有磷脂酶活性的多肽的核酸中的密码子以降低其在宿主细胞中 的表达的方法,所述方法包括:
(A)(a)提供编码磷脂酶多肽的核酸,其包括权利要求1所述的核酸(多核苷酸)序 列;以及
(b)鉴定步骤(a)的核酸中的至少一个优选的密码子,并用编码相同氨基酸的非 优选的或者较不优选的密码子作为替代密码子替换之,其中优选密码子是在宿主细胞 基因的编码序列中过度表现的密码子,非优选或较不优选的密码子是在宿主细胞基因 的编码序列中表现不足的密码子,由此修饰该核酸以减少其在宿主细胞中的表达;或 者,
(B)所述的方法(A),其中所述宿主细胞是细菌细胞、真菌细胞、昆虫细胞、酵母 细胞、植物细胞或哺乳动物细胞。
36.产生编码多个经修饰的磷脂酶活性位点或底物结合位点的核酸文库的方法, 其中所述经修饰的活性位点或者底物结合位点源自包括编码第一活性位点或者第一 底物结合位点的序列的第一核酸,所述方法包括:
(A)(a)提供编码第一个活性位点或者第一个底物结合位点的第一核酸,其中所述 第一核酸序列包括在严格条件下与具有一个或多个编码E41A、E41W、E41F、E41Y、 E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、 Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、 D234W、D234V、D234G、D234R、D234K或Q265R的突变或等同氨基酸突变的SEQ ID NO:177或SEQ ID NO:178所示序列杂交的序列,或权利要求1所述序列;并且所 述核酸编码磷脂酶活性位点或磷脂酶底物结合位点;
(b)提供一组诱变寡核苷酸,其在所述第一核酸的多个靶密码子处编码天然存 在的氨基酸变体;以及
(c)使用该组诱变寡核苷酸产生一组编码活性位点或者编码底物结合位点的变 体核酸,在每一个被诱变的氨基酸密码子处,所述变体核酸编码一定范围的氨基酸变 异,从而产生编码多个修饰的磷脂酶活性位点或者底物结合位点的核酸文库;
(B),(A)所述的方法,其包括通过包括优化的定向进化系统、基因位点饱和诱变 (GSSM)或合成连接重装配(SLR)的方法诱变步骤(a)所述的第一核酸;
(C),(A)或(B)所述的方法,其包括通过包括如下的方法诱变步骤(a)所述的第一 核酸或变体:易错PCR、重排、寡核苷酸定点突变、装配PCR、有性PCR诱变、体 内诱变、盒式诱变、回归整体诱变、指数整体诱变、位点专一性诱变、基因重装配、 基因位点饱和诱变(GSSM)、合成连接重装配(SLR)和其组合;或
(D),(A)或(B)所述的方法,包括通过包括如下的方法诱变步骤(a)的第一核酸或 变体:重组、回归序列重组、硫代磷酸酯修饰的DNA诱变、含尿嘧啶的模板诱变、 缺口二重诱变、点错配修复诱变、修复-缺陷型宿主株诱变、化学诱变、放射诱变、 缺失诱变、限制-选择诱变、限制-纯化诱变、人工基因合成、整体诱变、嵌合核酸多 聚体生成和其组合。
37.制备小分子的方法,其包括:
(a)提供能够合成或者修饰小分子的多种生物合成酶,其中所述酶之一包括权利要 求1所述的核酸(多核苷酸)序列编码的磷脂酶;
(b)提供用于步骤(a)的至少一种酶的底物;以及
(c)在有利于多个生物催化反应进行的条件下,将步骤(b)的底物与所述酶反应, 从而通过一系列生物催化反应产生小分子。
38.修饰小分子的方法,其包括:
(A)(a)提供磷脂酶,其中所述酶包括权利要求9所述的多肽,或权利要求1所述 的核酸编码的多肽;
(b)提供小分子;以及
c)在有利于所述磷脂酶催化的酶促反应进行的条件下,将步骤(a)所述的酶与 步骤(b)所述的小分子反应,从而通过磷脂酶酶促反应修饰小分子;
(B),(A)所述的方法,其包括多种用于步骤(a)所述的酶的小分子底物,从而产生 由所述磷脂酶催化的至少一种酶促反应产生的修饰的小分子的文库;
(C),(A)或(B)所述的方法,其进一步包括多种额外的酶,在有利于进行由所述酶 催化的多种生物催化反应的条件下,通过多种酶促反应形成经修饰的小分子的文库;
(D),(C)所述的方法,其进一步包括检测所述文库以确定在所述文库中是否存在 表现出期望活性的特定修饰小分子的步骤;或者
(E),(D)所述的方法,其中所述测试所述文库的步骤进一步包括步骤:系统地去除 所有但保留一个用于产生所述文库中多个所述修饰的小分子中的一部分的生物催化反 应,这通过测试所述修饰的小分子的所述部分中存在或不存在具有期望活性的所述特定 修饰的小分子进行;并鉴定出产生具有期望活性的所述特定修饰的小分子的至少一个特 定生物催化反应。
39.确定磷脂酶的功能性片段方法,其包括:
(A)(a)提供磷脂酶,其中所述酶包括权利要求9所述的多肽,或权利要求1所 述的核酸(多核苷酸)序列编码的多肽;以及
(b)缺失步骤(a)所述序列中的多个氨基酸残基,并且测定剩余子序列的磷脂 酶活性,从而确定磷脂酶的功能性片段;或者
(B),(A)所述的方法,其中所述磷脂酶活性通过提供磷脂酶底物,并且检测底物 量的增加或者反应产物量的减少来测定。
40.通过使用实时代谢流分析进行新的或修饰的表型的全细胞工程改造的方法,所 述方法包括:
(A)(a)通过修饰细胞的遗传组成制备修饰的细胞,其中所述遗传组成通过将权利要 求1所述的核酸(多核苷酸)序列加入到所述细胞来修饰;
(b)培养所述修饰的细胞以产生多个修饰的细胞;
(c)通过实时监控步骤(b)的细胞培养物来测量所述细胞的至少一个代谢参数;和
(d)分析步骤(c)的数据,以确定被测量的参数是否与在类似条件下未修饰细胞中 的参照测量值不同,从而使用实时代谢流分析鉴定细胞中工程改造的表型;
(B),(A)所述的方法,其中所述细胞的遗传组成通过包括在细胞中序列的删除或序 列的修饰,或敲除基因的表达的方法来修饰;
(C),(A)或(B)所述的方法,进一步包括选择含有新工程改造的表型的细胞;或
(D),(C)所述的方法,进一步包括培养所述被选择的细胞,从而产生包含新工程改 造的表型的新细胞株。
41.增加磷脂酶多肽的耐热性或热稳定性的方法,所述方法包括糖基化磷脂酶, 其中所述多肽包括权利要求9所述的多肽或权利要求1所述的核酸(多核苷酸)序列编 码的多肽的至少三十个连续氨基酸,从而增加所述磷脂酶的耐热性或热稳定性。
42.在细胞中过表达重组磷脂酶的方法,其包括表达包括权利要求1所述的核酸 (多核苷酸)序列的载体,其中通过使用高活性启动子、双顺反子载体或者通过所述载 体的基因扩增来实现过表达。
43.制备转基因植物的方法,其包括:
(A)(a)将异源核酸序列引入细胞,其中所述异源核酸序列包括权利要求1所述的 核酸(多核苷酸)序列,从而产生转化的植物细胞;和(b)从所述转化的细胞产生转基因 植物;
(B),(A)所述的方法,其中所述步骤(A)(a)进一步包括通过电穿孔或显微注射植 物细胞原生质体来引入所述异源核酸序列;或者
(C),(C)所述的方法,其中所述步骤(A)(a)包括通过DNA粒子轰击或通过使用根 瘤农杆菌(Agrobacterium tumefaciens)宿主将所述异源核酸序列直接引入植物组织。
44.在植物细胞中表达异源核酸序列的方法,其包括如下步骤:
(a)用被可操作连接至启动子的异源核酸序列转化所述植物细胞,其中所述异源核 酸序列包括权利要求1所述的核酸(多核苷酸)序列;以及
(b)在所述异源核酸序列在所述植物细胞中表达的条件下培养所述植物。
45.水解、分解或破坏含磷脂组合物的方法,其包括:
(A)(a)提供权利要求9所述的磷脂酶多肽或权利要求1所述的核酸(多核苷酸)序 列编码的磷脂酶多肽;
(b)提供含磷脂组合物;以及
(c)在所述磷脂酶水解、分解或破坏所述含磷脂组合物的条件下,将步骤(a) 所述的多肽与步骤(b)所述组合物接触;
(B),(A)所述的方法,其中所述组合物包括含磷脂的脂双层或膜;或者
(C),(A)或(B)任何一项所述的方法,其中所述组合物包括植物细胞、细菌细胞、 酵母细胞、昆虫细胞或动物细胞。
46.液化或去除含磷脂组合物的方法,其包括:
(a)提供权利要求9所述的磷脂酶多肽,或权利要求1所述的核酸(多核苷酸)序列 编码的多肽;
(b)提供含磷脂组合物;以及
(c)在所述磷脂酶去除或液化含磷脂组合物的条件下,将步骤(a)所述的多肽与步 骤(b)所述的组合物接触。
47.洗涤剂组合物:
(a)包括权利要求9所述的磷脂酶多肽或权利要求1所述的核酸(多核苷酸)序列编 码的磷脂酶多肽;(b)(a)所述的洗涤剂组合物,其中所述磷脂酶是非表面活性磷脂酶 或表面活性磷脂酶;或者(c),(a)或(b)所述的洗涤剂组合物,其中所述磷脂酶被配制 为非含水液体组合物、铸塑固体、冻干粉末、粒状形式、微粒形式、压缩片剂、小球、 凝胶形式、糊剂、气溶胶或浆状物形式。
48.洗涤物体的方法,其包括:
(a)提供包括权利要求9所述的磷脂酶多肽或权利要求1所述的核酸(多核苷酸)序 列编码的多肽的组合物;
(b)提供物体;以及
(c)在所述组合物能够洗涤所述物体的条件下,将步骤(a)所述的多肽与步骤(b)所 述的物体接触。
49.脱胶油的方法,其包括:
(A)(a)提供包括权利要求9所述的磷脂酶多肽或权利要求1所述的核酸(多核苷酸) 序列编码的多肽的组合物;
(b)提供包括含有磷脂的脂肪或油的组合物;以及
(c)在所述多肽能够催化水解组合物中的磷脂的条件下,将步骤(a)所述的多 肽与步骤(b)所述的组合物接触;
(B),(A)所述的方法,其中所述含油的组合物包括植物、动物、藻或鱼油或脂肪, 或者所述油是植物油、动物油、鱼油或藻类油,或所述油包括植物油、动物油、鱼油 或藻类油;
(C),(B)所述的方法,其中植物油包括米糠油、大豆油、油菜籽油、玉米油、棕 榈仁的油、油菜油、葵花油、芝麻油或花生油
(D),(A)至(C)任何一项所述的方法,其中所述多肽水解所述含油组合物中水合和 /或非水合磷脂的磷脂;
(E),(A)至(C)任何一项所述的方法,其中所述多肽在甘油磷酸酯键处水解磷脂, 产生甘油二酯和水溶性磷酸盐化合物;
(F),(A)至(E)任何一项所述的方法,其中所述多肽具有磷脂酶C活性;
(G),(A)至(E)任何一项所述的方法,其中所述多肽具有磷脂酶D活性,并且还 加入磷酸酶;
(H),(A)至(G)任何一项所述的方法,其中所述接触包括油中的水合磷脂的水解;
(I),(A)至(H)任何一项所述的方法,其中步骤(c)的水解条件包括在碱性pH下, 温度为大约20℃到40℃;
(J),权利要求190所述的方法,其中所述碱性条件包括约pH8到pH10的pH;
(K),(A)至(J)任何一项所述的方法,其中步骤(c)的水解条件包括反应时间为约3 到10分钟;
(L),(A)至(K)任何一项所述的方法,其中步骤(A)(c)的水解条件包括在温度为大 约50℃到60℃,pH为大约pH5到pH6.5,pH为大约pH6.0到pH7.5,或pH为大 约pH5到pH8.0,反应时间为大约30到60分钟,水解油中的水合或者非水合磷脂;
(M),(A)至(L)任何一项所述的方法,其中所述多肽结合于过滤器,并使含有磷 脂的脂肪或者油通过所述过滤器;
(N),(A)至(M)任何一项所述的方法,其中将所述多肽加入到包括含磷脂的脂肪 或油的溶液中,然后使所述溶液通过过滤器;
(O),(A)至(N)任何一项所述的方法,其中所述多肽具有磷脂酶活性,具有PLC 活性,并且所述方法增加了中性油的量(在包括含磷脂的脂肪或油的处理的组合物 中);
(P),(A)至(N)任何一项所述的方法,其中所述多肽具有PLC活性,并且所述方 法增加二酰甘油(DAG)的产生以增加油相(所述方法增加在包括含磷脂的脂肪或油的 处理的组合物中二酰甘油(DAG)的量),或其中最终脱胶油产物的1,3-DAG得以富集, 或其中所述最终脱胶油产物包括不少于1.0%的1,3-DAG;
(Q),(A)至(P)任何一项所述的方法,进一步包括加入一种或多种多肽,其具有蛋 白酶、淀粉酶、脂酶、质酶、另一种磷脂酶、糖酶、纤维素酶、果胶酶、甘露聚糖 酶、阿拉伯聚糖酶、半乳聚糖酶、木聚糖酶、化酶,例如乳糖酶和/或过氧化物酶 或具有等同活性的多肽,或其组合,以进一步破坏胶质和增加油产量;
(R),(A)至(Q)任何一项所述的方法,其中水解条件包括碱性pH;
(S),(R)所述的方法,其中所述碱性条件足以导致由PLC引起的1,2-DAG异构 化为至1,3-DAG;
(T),(A)至(S)任何一项所述的方法,进一步包括通过加入硬化物质物理去除所述 脱胶方法产生的胶;或者
(U),(A)至(S)任何一项所述的方法,其中所述硬化物质是母或包括云母。
50.将非水合磷脂转化为水合形式的方法,包括:
(A)(a)提供包括权利要求9所述的磷脂酶多肽或权利要求1所述的核酸(多核苷酸) 序列编码的多肽的组合物;
(b)提供包括非水合磷脂的组合物;以及
(c)在所述多肽将非水合磷脂转化为水合形式的条件下,将步骤(a)所述的多 肽与步骤(b)所述组合物接触;
(B),(A)所述的方法,其中所述多肽具有磷脂酶C活性;或者
(C),(A)所述的方法,其中所述多肽具有磷脂酶D活性,并且也加入磷酸酶。
51.碱法精炼含磷脂组合物的方法,其包括:
(A)(a)提供包括具有磷脂酶活性的多肽的组合物;
(b)提供含磷脂组合物;以及
(c)在碱法精炼之前、期间或者之后,将步骤(a)所述的多肽与步骤(b)所述的 组合物接触;
(B),(A)所述的方法,其中所述多肽具有磷脂酶C活性;
(C),(A)或(B)所述的方法,其中所述具有磷脂酶活性的多肽在加入酸或碱之前加 入;
(D),(A)至(C)的任何一项所述的方法,其中所述具有磷脂酶活性的多肽在碱性精 炼期间加入,并根据磷水平和游离脂肪酸的水平,加入变化水平的酸和碱;或者
(E),(A)至(C)任何一项所述的方法,其中所述具有磷脂酶活性的多肽在碱性精炼 之后加入:分离之前,在强混合器或保留混合器中;加热步骤之后;在离心机中;在 皂脚中;在洗涤水中;或在漂白或除臭步骤中;
(F),(A)至(E)任何一项所述的方法,其中碱性精炼条件通过加入浓的碱溶液产生, 或其中碱性精炼条件包括使用比11%工业标准更浓的浓碱溶液,或其中碱性精炼条件 包括使用约12%至50%之间浓度的浓碱溶液;
(G),(A)至(F)任何一项所述的方法,其中所述具有磷脂酶活性的多肽具有权利要 求9所述的氨基酸序列,或包括权利要求1所述的核酸(多核苷酸)序列编码的多肽;
(H),(A)至(G)任何一项所述的方法,其中所述含磷脂的所述组合物包括植物;
(I),(H)所述的方法,其中所述多肽通过转基因的方式在所述植物中表达;
(J),(A)至(I)任何一项所述的方法,其中所述具有磷脂酶活性的多肽在破碎种子 或其它植物部分期间加入,或者,所述具有磷脂酶活性的多肽在破碎之后或精炼之前 加入;或者
(K),(A)至(J)任何一项所述的方法,包括图13所阐明的方法;或图13所阐明的 所述方法,其中加入足够的酸以促进镁金属含量的降低。
52.纯化植物甾醇或者三萜的方法,其包括:
(A)(a)提供包括权利要求9所述的磷脂酶多肽或权利要求1所述的核酸(多核苷酸) 序列编码的多肽的组合物;
(b)提供包括植物甾醇或三萜的组合物;以及
(c)在所述多肽可以催化组合物中磷脂的水解的条件下,将步骤(a)所述的多 肽与步骤(b)所述的组合物接触;
(B),(A)所述的方法,其中所述多肽具有磷脂酶C活性;
(C),(A)或(B)所述的方法,其中所述植物甾醇或者三萜包括植物甾醇;
(D),(C)所述的方法,其中所述植物甾醇源自植物油;
(E),(D)所述的方法,其中所述植物油包括椰子油、油菜油、可可黄油、玉米油、 棉籽油、亚麻油、橄榄油棕榈油、花生油、来自米糠的油、红花油、芝麻油、大豆 油或葵花油;
(F),(A)至(E)任何一项所述的方法,其进一步包括使用非极性溶剂来定量提取游 离的植物甾醇和甾醇脂肪酸酯;或者
(G),(F)所述的方法,其中所述植物甾醇或者三萜可以包括β-谷甾醇、菜油甾醇、 豆甾醇、豆甾烷醇、β-谷甾烷醇、谷甾烷醇、链甾醇、海绵甾醇、多孔甾醇、穿贝海 绵甾醇或者菜籽甾醇。
53.精炼粗制油的方法,其包括:
(A)(a)提供包括权利要求9所述的磷脂酶多肽或权利要求1所述的核酸(多核苷酸) 序列编码的多肽的组合物;
(b)提供包括包含磷脂的油的组合物;以及
(c)在所述多肽能够催化组合物中的磷脂水解的条件下,将步骤(a)所述的多 肽与步骤(b)所述的组合物接触;
(B),(A)所述的方法,其中所述多肽具有磷脂酶C活性;
(C),(A)或(B)所述的方法,其中所述具有磷脂酶活性的多肽在加入到所述组合物 的水溶液中;
(D),(C)所述的方法,其中所述水的水平在0.5%到5%之间;
(E),(A)至(D)任何一项所述的方法,其中处理时间低于约2小时;
(F),(A)至(D)任何一项所述的方法,其中所述处理时间低于约60分钟;
(G),(A)至(D)任何一项所述的方法,其中所述处理时间低于约30分钟;低于约 15分钟,或低于约5分钟;
(F),(A)至(G)任何一项所述的方法,其中所述水解条件包括约25℃到70℃之间 的温度;
(G),(A)至(F)任何一项所述的方法,其中所述水解条件包括使用碱;
(H),(A)至(G)任何一项所述的方法,其中所述水解条件包括约pH 3到pH 10之 间的pH;
(I),(A)至(H)任何一项所述的方法,其中所述水解条件包括在步骤(A)(c)的接触 后加入乳化剂和/或进行混合;
(J),(A)至(I)任何一项所述的方法,包括加入乳化剂-破乳剂和/或加热或冷却以促 进水相的分离;
(K),(A)至(J)任何一项所述的方法,包括在接触步骤前进行脱胶,以通过离心收 集卵磷脂,然后再加入PLC、PLC和/或PLA以去除非水合的磷脂;
(L),(A)至(L)任何一项所述的方法,包括对粗制油进行水脱胶至少于10ppm的 磷以获得食用油,以及接着进行物理精炼至少于大约50ppm的磷以获得生物柴油; 或者
(M),(A)至(L)任何一项所述的方法,包括加入酸以促进非水合磷脂的水合作用。
54.油或脂肪脱胶的方法,其包括:
(a)提供包括权利要求9所述的磷脂酶多肽、或权利要求1所述的核酸(多核苷酸) 序列编码的多肽和磷酸酶的组合物,其中磷脂酶活性包括磷脂酶D活性;
(b)提供包括含有磷脂的脂肪或油的组合物;以及
(c)在所述多肽能够催化组合物中的磷脂水解的条件下,将步骤(a)所述的多肽与 步骤(b)所述的组合物接触。
55.具有磷脂酶C活性的等同活性的组合物,其包括提供包括权利要求9所述的 磷脂酶多肽或权利要求1所述的核酸(多核苷酸)序列编码的多肽和磷酸酶的组合物, 其中所述磷脂酶活性包括磷脂酶D活性。
56.改善、处理或防止脂多糖(LPS)-介导的毒性的方法,其包括向患者施用包括 权利要求9所述的多肽或权利要求1所述的核酸(多核苷酸)序列编码的多肽的药物组 合物。
57.权利要求9所述的多肽或权利要求1所述的核酸(多核苷酸)序列编码的多肽 用于制备药物组合物的用途。
58.权利要求9所述的多肽或权利要求1所述的核酸(多核苷酸)序列编码的多肽 在制备用于防止、处理或改善脂多糖(LPS)介导的毒性,对内毒素进行解毒,或者对 类脂A的2’或3’脂肪酸链进行脱酰基的药物组合物的用途。
59.对内毒素进行解毒的方法,其包括将所述内毒素与权利要求9所述的多肽或 权利要求1所述的核酸(多核苷酸)序列编码的多肽接触。
60.对类脂A的2’或3’脂肪酸链进行脱酰基的方法,其包括:
(A)(a),将所述类脂A与权利要求9所述的多肽或权利要求1所述的核酸(多核苷 酸)序列编码的多肽接触;(b),(a)所述的方法,其中所述多肽具有patatin活性;(c), (a)或(b)所述的方法,其中所述patatin具有带有一个或多个编码E41A、E41W、E41F、 E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、 T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、 D230R、D234W、D234V、D234G、D234R、D234K,或Q265R的突变或等同氨基酸 突变或其任何组合的SEQ ID NO:177或SEQ ID NO:178所示的序列。
61.减少胶质量并通过减少油被夹带走的数量来增加中性油(甘油三酯)产量的方 法,其包括:
(A)(a)提供包括权利要求9所述的磷脂酶多肽或权利要求1所述的核酸(多核苷酸) 序列编码的多肽的组合物;
(b)提供包括含有磷脂的脂肪或油的组合物;以及
(c)在所述多肽能够催化水解组合物中的磷脂一段时间以足以减少胶质量和 增加中性油的条件下,将步骤(a)所述的多肽与步骤(b)所述的组合物接触;
(B),(A)所述的蛋白制备物,其中所述蛋白制备物包括制剂,其包括非水液体组 合物、铸造固体、粉末、冻干粉末、粒状形式、颗粒形式、压缩片剂、小球、丸剂、 凝胶形式、水凝胶、糊剂、气溶胶、喷雾剂、洗液、浆状制剂、水/油乳状液、乳剂、 胶囊、小泡或胶束悬浮液;或者
(C),(A)或(B)所述的方法,其包括使用高剪切混合所述组合物,然后以无剪切 力或低剪切力与至少一种具有磷脂酶活性的本发明的多肽混合,以使磷脂底物与所述 磷脂酶充分接触。
62.制备变体磷脂酶编码序列的方法,所述变体磷脂酶编码序列在宿主细胞中具 有增加的表达,所述方法包括修饰权利要求1所述的核酸(多核苷酸)序列,以便一个、 多个或所有N-连接糖基化位点编码基序被修饰成非糖基化基序。
63.分离的、合成的或者重组的磷脂酶,其由权利要求62所述的方法制备的序 列编码。
64.制备变体磷脂酶编码序列的方法,所述序列编码对蛋白酶具有增加的抗性的 磷脂酶,所述方法包括将等同于具有一个或多个编码E41A、E41W、E41F、E41Y、 E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、 Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、 D234W、D234V、D234G、D234R、D234K或Q265R的突变或等同氨基酸突变的SEQ ID NO:177或SEQ ID NO:178的位置131上的氨基酸修改成下述的一个、多个或所有 残基:赖氨酸(K);丝氨酸(S);甘氨酸(G);精氨酸(R);谷氨酰胺(Q);丙氨酸(A);异 亮氨酸(I);组氨酸(H);苯丙氨酸(F);苏氨酸(T);甲硫氨酸(M);亮氨酸(L)。
65.分离的、合成的或者重组的磷脂酶,其由权利要求64所述的方法制备的序 列编码。
66.制备变体磷脂酶编码序列的方法,所述序列编码对蛋白酶具有降低的抗性的 磷脂酶,所述方法包括将等同于具有一个或多个编码E41A、E41W、E41F、E41Y、 E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、 Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、 D234W、D234V、D234G、D234R、D234K或Q265R的突变或等同氨基酸突变的SEQ ID NO:177或SEQ ID NO:178的位置131上的氨基酸修改成下述的一个、多个或所有 残基:色氨酸(W);谷氨酸(E);酪氨酸(Y)。
67.分离的、合成的或者重组的磷脂酶,其由权利要求66所述的方法制备的序 列编码。
68.制造生物燃料的方法,其包括:
(A)(a)提供权利要求9所述的磷脂酶,或由权利要求1所述的核酸(多核苷酸)序 列编码的磷脂酶,或权利要求63或权利要求66所述的磷脂酶;
(b)提供包括脂类或烷基酯的生物质组合物;
(c)将(a)所述的磷脂酶与(b)所述的生物质组合物接触,以产生生物燃料或对 脂类或烷基酯进行酯交换;
(B),(A)所述的方法,其中所述生物燃料是生物柴油或包括生物柴油;
(C),(A)或(B)所述的方法,其中所述包括脂类或烷基酯的生物质组合物是植物油 和/或动物脂肪,或包括植物油和/或动物脂肪;
(D),(A)至(C)任何一项所述的方法,其中所述包括脂类或烷基酯的生物质组合物 是藻类、植物油、直链植物油、粗植物油、废植物油、动物脂肪、动物脂、牛脂、猪 脂或黄油或包括藻类、植物油、直链植物油、粗植物油、废植物油、动物脂肪、动物 脂、牛脂、猪脂或黄油;或者
(E),(A)至(D)任何一项所述的方法,其中所述磷脂酶是具有SEQ ID NO:1至SEQ ID NO:178任何一个所示序列或其任何组合的多肽,或包括具有SEQ ID NO:1至SEQ ID NO:178任何一个所示序列或其任何组合的多肽。
69.生物燃料:(a)其由权利要求68所述的方法制备;(b)其包括(i)具有SEQ ID NO:1至SEQ ID NO:178任何一个所示序列或其任何组合的磷脂酶,或(ii)权利要求9 所述的磷脂酶,或由权利要求1所述的核酸(多核苷酸)序列编码的磷脂酶,或权利要 求63或权利要求66所述的磷脂酶。
70.可溶性干酒糟(DDS)、谷物干酒糟(DDS)、可溶性浓酒糟(CDS)、谷物湿酒糟 (DWG)或含可溶物的谷物干酒糟(DDGS),其包括:(i)具有SEQ ID NO:1至SEQ ID NO:178任何一个所示序列或其任何组合的磷脂酶,或(ii)权利要求9所述的磷脂酶, 或由权利要求1所述的核酸(多核苷酸)序列编码的磷脂酶,或权利要求63或权利要 求66所述的磷脂酶。
71.生物质,其包括:
(a)(i)具有SEQ ID NO:1至SEQ ID NO:178任何一个所示序列或其任何组合的磷 脂酶,或(ii)权利要求9所述的磷脂酶,或由权利要求1所述的核酸(多核苷酸)序列编 码的磷脂酶,或权利要求63或权利要求66所述的磷脂酶;或者
(b),(a)所述的生物质,其中所述生物质是动物、藻类和/或植物生物质、或包含 脂类的生物质或木质纤维生物质、或废物材料,或包括动物、藻类和/或植物生物质、 或包含脂类的生物质或木质纤维生物质、或废物材料;
(c),(a)所述的生物质,其中所述生物质是生物乙醇、生物丙醇、生物丁醇、生 物丙醇或生物甲醇或其任何组合,或包括生物乙醇、生物丙醇、生物丁醇、生物丙醇 或生物甲醇或其任何组合。
72.基于石油的产品,其包括:
(a)(i)具有SEQ ID NO:1至SEQ ID NO:178任何一个所示序列或其任何组合的磷 脂酶,或(ii)权利要求9所述的磷脂酶,或由权利要求1所述的核酸(多核苷酸)序列编 码的磷脂酶,或权利要求63或权利要求66所述的磷脂酶;或
(b),(a)所述的基于石油的产品,其包括油、生物柴油或汽油、或生物乙醇、生 物丙醇、生物丁醇、生物丙醇或生物甲醇;或者生物乙醇、生物丙醇、生物丁醇、生 物丙醇、生物甲醇和/或生物柴油和汽油的混合物。

说明书全文

参考通过EFS-WEB提交的序列表

【0001】本申请通过USPTO EFS-WEB服务器电子提交,如在MPEP§1730 II.B.2.(a)(A)所批准并阐明的,并且该电子提交包括电子提交的序列(SEQ ID)表;该序 列表的全部内容通过引用并入本文用于所有目的。序列表根据如下电子提交的.txt文 件确定:

  文件名   创建日期   大小   564462015940seqlist.txt   2007年9月20日   422,053字节

发明领域

【0002】总体上说,本发明涉及磷脂酶、编码磷脂酶的多核苷酸、制备以及使用 这些多核苷酸和多肽的方法。特别地,本发明提供了具有磷脂酶活性的新颖多肽、编 码它们的核酸以及与它们结合的抗体。也提供了包括应用这些磷脂酶的工业方法和产 品。

背景技术

【0003】磷脂酶是解磷脂中的酯键的酶。与它们在磷脂代谢中的重要性相对应, 这些酶广泛存在于真核和原核细胞中。磷脂酶影响生物膜的代谢、形成和再组织,并 且磷脂酶也参与信号的级联作用。已经知道了几种类型的磷脂酶,按照磷脂分子中受 到攻击的键的位置,它们在特异性上有所不同。磷脂酶A1(PLA1)除去1-位的脂肪 酸,产生游离的脂肪酸和1-溶血-2-酰基磷脂(1-lyso-2-acylphospholipid)。磷脂酶A2 (PLA2)去除2-位的脂肪酸,产生游离的脂肪酸和1-酰基-2-溶血磷脂 (1-acyl-2-lysophospholipid)。PLA1和PLA2酶可以是胞内酶或胞外酶,是膜结合的酶 或者可溶性酶。发现胞内的PLA2存在于几乎所有的哺乳动物细胞中。磷脂酶C(PLC) 去除磷酸部分,产生1,2二酰基甘油和磷酸酯。磷脂酶D(PLD)产生1,2-二酰基甘 油磷酸和性基团(base group)。PLC和PLD对于细胞功能和信号传导是重要的。PLD 是生物催化中主要的磷脂酶(参见,如,Godfrey,T.和West S.(1996)Industrial enzymology,299-300,Stockton Press,New York)。铃薯茎储藏蛋白(Patatins)是 另一类磷脂酶,据认为其作用如同PLA(参见例如,Hirschberg HJ,等,(2001),Eur J Biochem 268(19):5037-44)。
【0004】常见的含油种子,如大豆、油菜籽、向日葵籽、米糠油、芝麻和花生被 用作油的来源和原料。在榨油过程中,种子被机械和热处理。用溶剂从粗粉(meal)中 分离和分开油。然后应用蒸馏法,从油中分离出溶剂并回收。油经过“脱胶 (degummed)”并且进行精炼。粗粉中的溶剂组分可以通过“脱溶剂烤炉(desolventizer toaster)”的热处理而蒸发掉,随后,粗粉干燥和冷却。当溶剂通过蒸馏分离掉以后, 产生的粗油利用特殊的脱胶程序和物理精炼的方法加工成为食用油。它也可以作为原 料用于产生脂肪酸和甲基酯。粗粉可以用做动物饲料(animal rations)。
【0005】脱胶是植物油精炼的第一步,脱胶的目的是去除与油一起被抽提、但干 扰随后的油加工的污染磷脂。这些磷脂仅仅以无水形式溶于植物油中,如果简单地被 水合,磷脂可以被沉淀并去除。水合作用一般通过小比例的水与充分干燥的油连续混 合来完成。典型地,水的量是磷脂含量的75%,磷脂的量典型地是1到1.5%。虽然 在50℃到80℃的范围内,油的粘度降低,水合胶的分离效果更好,但是温度条件并 不非常严格。
【0006】很多油脱胶(oil degumming)的方法目前都在使用。油脱胶的过程可以 通过使用磷脂酶酶法协助进行。磷脂酶A1和A2已经在各种商业方法中用于油脱胶, 如“ENZYMAXTM脱胶”(Lurgi Life Science Technologies GmbH,Germany)。也已经考 虑将磷脂酶C(PLC)应用于油的脱胶作用,因为磷脂酶C在磷脂上作用产生的磷酸 盐部分是极易溶于水的,并且容易去除,而且甘油二酯会与油在一起,降低了损失; 参见,如Godfrey,T.和West S.(1996)Industrial Enzymology第299-300页,Stockton Press,New York;Dahlke(1998)“An enzymatic process for the physical refining of seed oils,”Chem.Eng.Technol.21:278-281;Clausen(2001)“Enzymatic oil degumming by a novel microbial phospholipase,”Eur.J.Lipid Sci.Technol.103:333-340。
【0007】高磷脂油,例如黄豆、油菜和向日葵油的处理方法不同于别的油如棕榈 的处理方法。不像低磷脂油的蒸气或“物理精炼”处理,这些高磷油需要特别的化学和 机械处理,以去除含磷的磷脂。这些油一般在这样的过程中化学精炼,该过程必需中 和游离脂肪酸,以形成皂和不溶性的胶成分。中和过程对于去除游离脂肪酸和磷脂非 常有效,但是该过程也导致产率和质量显著降低。在一些情况下,高磷脂的粗制油在 碱中和之前的步骤中进行脱胶。用于卵磷脂的大豆油就是这种情况,其中的油首先用 水或者酸来脱胶。
【0008】植物固醇(phytosterols)(植物甾醇(plant sterols))是天然产物三萜家族的成 员,其包括100种以上不同的植物固醇和4000种以上其它种类的三萜。一般而言, 据认为,植物甾醇是由于甾醇/磷脂配给量增加导致膜硬化,从而稳定植物膜。在化 学上,植物甾醇在结构上非常类似于胆固醇,并被认为调节植物膜的膜流动性,如胆 固醇在动物膜中所做的那样。主要的植物甾醇是β-谷甾醇、菜油甾醇和豆甾醇。其它 的植物甾醇包括豆甾烯醇(二氢β-谷甾醇)、二氢谷甾醇、24-脱氢胆固醇、二氢菜油 甾醇、海绵甾醇(chalinasterol)、多孔甾醇、γ-谷甾醇和菜籽甾醇。
【0009】植物甾醇是健康和营养行业中的重要的农产品。它们是用于制造化妆品 的有用乳化剂并且为激素药物的生产提供大多数甾体中间体和前体。植物甾醇的饱和 类似物以及它们的酯已经被认为是益于心血管健康的有效的降低胆固醇的试剂。植物 甾醇通过在肠腔中抑制胆固醇的吸收来降低血清胆固醇水平,并且植物甾醇在极低的 浓度时便具有免疫调节特性,包括T淋巴细胞的增强的细胞应答和抗癌细胞系的天然 杀伤细胞的细胞毒性能。此外,它们的治疗效应已在治疗结核、湿性关节炎、 控制HIV感染的病人和抑制马拉松选手的免疫压力的临床研究中已经得到证明。
【0010】植物甾醇的酯类,也指植物甾醇酯,由美国食品药品管理局(FDA)批 准为GRAS(一般认为安全,Generally Recognized As Safe),用于人造黄油,并在 1999年得到推广。2000年9月,FDA也提出一个试行规定,该规定准许了含有植物 甾醇酯类的食品使用健康声明标记(health-claiming labeling)。因此,用植物甾醇酯 类强化的食品非常有望受到消费者的青睐。
【0011】大豆油被广泛使用,是重要的粮食,占来自种子和水果的油产量的约 30%。大豆仅含有20%的油,在商业规模上通常通过使用溶剂诸如己烷来提取。其油 公认的质量和粗粉蛋白的营养价值使得大豆成为首要的含油种子。在提取之前,大豆 必需清洗,破碎并去皮,这是因为对油来说有效的溶剂提取需要破碎每一个油细胞以 提高物质转移水平。细胞壁主要由纤维素——其与半纤维素相关、果胶物质和木质素 组成,细胞壁也可以用酶破碎,以显著提高提取产量和速度。
【0012】二酰甘油(DAG)油是食用油,比天然脂肪酸含有80%或更多的DAG。 已经显示,在人中,消化DAG油乳剂之后,相比具有类似的脂肪酸组成的TAG油, 餐后乳糜微粒中的甘油三脂的升高水平明显较低。在以日本男子和美国男子和女子为 对象的研究中,长期食用DAG油促进体重减轻和身体脂肪减少。一项研究显示,用 DAG油取代普通的烹饪油降低肥胖和其它危险因素的发生率。
发明概述
【0013】本发明提供包括与具有一个或多个编码E41A、E41W、E41F、E41Y、 E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、 Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、 D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQ ID NO:177或SEQ ID NO:178在至少大约10、15、20、25、30、35、40、45、50、75、100、150、200、 250、300、350、400、450、500、550、600、650、700、750、800、850或者更多个 的残基范围内具有至少大约50%、51%、52%、53%、54%、55%、56%、57%、58%、 59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、 72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、 98%、99%或者更多的或者完全的(100%)序列同一性的核酸序列的分离的、合成的 或者重组的核酸,在一个方面所述核酸编码具有磷脂酶(PL)活性的至少一种多肽, 所述磷脂酶活性例如磷脂酶A(PLA)、磷脂酶C(PLC)或磷脂酶D(PLD)活性, 或磷脂酶活性的任何组合,例如PLA、PLC和/或PLD活性——作为多功能活性。一 方面,所述序列同一性通过用序列比较算法分析或者通过目测检查来确定。
【0014】本发明提供包括与具有一个或多个编码E41A、E41W、E41F、E41Y、 E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、 Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、 D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQ ID NO:177或SEQ ID NO:178在至少大约10、15、20、25、30、35、40、45、50、75、100、150、200、 250、300、350、400、450、500、550、600、650、700、750、800、850更多个连续 残基范围内具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、 60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、 73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、 86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、 99%或者更多的或者完全的(100%)序列同一性的核酸序列的分离的、合成的或者 重组的核酸,在一个方面所述核酸编码具有磷脂酶(PL)活性的至少一种多肽,所述 磷脂酶活性例如磷脂酶A、C或D活性,或磷脂酶活性的任何组合,例如PLA、PLC 和/或PLD活性——作为多功能活性。一方面,所述序列同一性通过用序列比较算法 分析或者通过目测检查来确定。
【0015】在可选的方面,分离的、合成的或者重组的核酸编码这样的多肽,其包 括具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、 D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、 S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、 D234K或Q265R的突变的SEQ ID NO:177或SEQ ID NO:178中列出的序列。一方面, 这些多肽具有磷脂酶,例如磷脂酶A、B、C或D的活性,或磷脂酶活性的任何组合, 例如PLA、PLC和/或PLD活性-作为多功能活性。
【0016】在一方面,序列比较算法是BLAST算法,如BLAST 2.2.2版算法。一 方面,过滤设置(filtering setting)设为blastall-p,blastp-d“nr pataa”-F F,所有其它选 项设为默认值。
【0017】在可选的方面,分离的、合成的或者重组的核酸编码这样的多肽,其具 有磷脂酶活性,但缺少:信号序列或原蛋白序列(proprotein sequences)、或者同源启 动子序列;或者本发明的核酸(多核苷酸)编码具有磷脂酶活性以及进一步包括异源 基酸序列的多肽,或者本发明的核酸(多核苷酸)包括异源核苷酸序列;或者本发 明的核酸(多核苷酸)包括由编码异源(前导)信号序列、或标记或表位的序列,或 由编码异源(前导)信号序列、或标记或表位的序列组成,或者异源核苷酸序列包括 异源启动子序列;或者本发明的核酸(多核苷酸)包括编码异源(前导)信号序列的 异源核苷酸序列,其包括N-末端和/或C-末端延伸或由N-末端和/或C-末端延伸组成, 用于靶向至内质网(ER)或内膜、或者靶向至植物内质网(ER)或内膜系统,或者 该异源序列编码限制性位点;或者本发明的核酸(多核苷酸)包括异源启动子序列, 其包括组成型或诱导型启动子、或者细胞类型特异性启动子、或者植物特异性启动子 或者细菌特异性启动子,或由这些启动子组成。
【0018】一方面,磷脂酶活性包括催化甘油磷酸酯键的水解(即,切割甘油磷酸 酯键)。磷脂酶活性可以包括催化植物油中磷脂的酯键的水解。植物油磷脂可以包括 油籽(an oilseed)的磷脂。磷脂酶活性可以包括磷脂酶C(PLC)活性;磷脂酶A(PLA) 活性,如磷脂酶A1或者磷脂酶A2活性;磷脂酶D(PLD)活性,如磷脂酶D1或者 磷脂酶D2活性;磷脂酶B(PLB)活性,例如磷脂酶和溶血磷脂酶(LPL)活性或磷脂 酶和溶血磷脂酶-转酰基酶(LPTA)活性或磷脂酶和溶血磷脂酶(LPL)活性和溶血磷脂 酶-转酰基酶(LPTA)活性;或马铃薯块茎蛋白(patatin)活性,或其组合。磷脂酶活性可 以包括水解糖蛋白,例如马铃薯块茎中发现的糖蛋白。磷脂酶活性可以包括patatin 酶活性。磷脂酶活性可以包括脂酰水解酶(LAH)活性。一方面,本发明的磷脂酶可以 具有多功能的活性,例如本文中描述的一种或多种酶活性的组合,例如本发明的磷脂 酶可以具有PLC和PLA活性;PLB和PLA活性;PLC和PLD活性;PLC和PLB活 性;PLB和patatin活性;PLC和patatin活性;PLD和PLA;PLD、PLA、PLB和PLC 活性;或PLD、PLA、PLB、PLC和patatin活性;或磷脂酶和溶血磷脂酶(LPL)活性 或磷脂酶和溶血磷脂酶-转酰基酶(LPTA)活性,或磷脂酶和溶血磷脂酶(LPL)活性和溶 血磷脂酶-转酰基酶(LPTA)活性,或其任意组合。
【0019】例如,一方面,本发明的多肽具有酶活性,但是缺少脂酶活性,例如缺 少影响中性油(甘油三酯)部分的任何酶活性。在特定的方法中使用这种多肽可能是有 利的,例如在脱胶方法中,中性油部分不受损(不减少,例如不水解)是重要的。因 此,一方面,本发明提供了脱胶方法,该方法包括使用本发明的具有磷脂酶活性但不 具有脂酶活性的多肽。
【0020】一方面,分离的、合成的或重组的核酸编码具有磷脂酶活性的多肽,其 是热稳定性的。例如本发明的多肽,举例来说——例如本发明的变体或者进化的酶, 例如SEQ ID NO:2、SEQ ID NO:175、SEQ ID NO:176、SEQ ID NO:177和SEQ ID NO:178的具体变异,如表5和实施例4所述——可以是热稳定性的。根据本发明的 热稳定性多肽可在包括温度范围为约-100℃至约-80℃、约-80℃至约-40℃、约-40℃至 约-20℃、约-20℃至约0℃、约0℃至约37℃、约0℃至约5℃、约5℃至约15℃、约 15℃至约25℃、约25℃至约37℃、约37℃至约45℃、约45℃至约55℃、约55℃ 至约70℃、约70℃至约75℃、约75℃至约85℃、约85℃至约90℃、约90℃至约 95℃、约95℃至约100℃、约100℃至约105℃、约105℃至约110℃、约110℃至约 120℃、或者95℃、96℃、97℃、98℃、99℃、100℃、101℃、102℃、103℃、104℃、 105℃、106℃、107℃、108℃、109℃、110℃、111℃、112℃、113℃、114℃、115℃ 或更高温度的条件下,保持结合和/或酶活性,例如磷脂酶活性。根据本发明的热稳 定性多肽可在范围为约-100℃至约-80℃、约-80℃至约-40℃、约-40℃至约-20℃、约 -20℃至约0℃、约0℃至约5℃、约5℃至约15℃、约15℃至约25℃、约25℃至约 37℃、约37℃至约45℃、约45℃至约55℃、约55℃至约70℃、约70℃至约75℃、 约75℃至约85℃、约85℃至约90℃、约90℃至约95℃、约95℃至约100℃、约100℃ 至约105℃、约105℃至约110℃、约110℃至约120℃的温度、或者95℃、96℃、97℃、 98℃、99℃、100℃、101℃、102℃、103℃、104℃、105℃、106℃、107℃、108℃、 109℃、110℃、111℃、112℃、113℃、114℃、115℃或更高的温度中,保持活性, 例如磷脂酶活性。在一些实施方式中,根据本发明的热稳定性多肽在上述温度范围, 在约pH 3.0、约pH 3.5、约pH 4.0、约pH 4.5、约pH 5.0、约pH 5.5、约pH 6.0、约 pH 6.5、约pH 7.0、约pH 7.5、约pH 8.0、约pH 8.5、约pH 9.0、约pH 9.5、约pH 10.0、 约pH 10.5、约pH 11.0、约pH 11.5、约pH 12.0或更高pH下,保持活性,例如磷脂 酶活性。
【0021】在另一个方面,分离的、合成的或重组的核酸编码具有磷脂酶活性的多 肽,其是耐热的。例如本发明的多肽,举例来说——例如本发明的变体或者进化的酶, 例如SEQ ID NO:2、SEQ ID NO:175、SEQ ID NO:176、SEQ ID NO:177和SEQ ID NO:178的具体变异,如表5和实施例4和7所述——是耐热的或热活性的。根据本 发明的耐热多肽可在暴露于包括温度范围为约-100℃至约-80℃、约-80℃至约-40℃、 约-40℃至约-20℃、约-20℃至约0℃、约0℃至约5℃、约5℃至约15℃、约15℃至 约25℃、约25℃至约37℃、约37℃至约45℃、约45℃至约55℃、约55℃至约70℃、 约70℃至约75℃、约75℃至约85℃、约85℃至约90℃、约90℃至约95℃、约95℃ 至约100℃、约100℃至约105℃、约105℃至约110℃、约110℃至约120℃、或95℃、 96℃、97℃、98℃、99℃、100℃、101℃、102℃、103℃、104℃、105℃、106℃、 107℃、108℃、109℃、110℃、111℃、112℃、113℃、114℃、115℃或更高温度的 条件后,保持结合和/或酶活性,例如磷脂酶活性。根据本发明的耐热多肽可在暴露 于范围约-100℃至约-80℃、约-80℃至约-40℃、约-40℃至约-20℃、约-20℃至约0℃、 约0℃至约5℃、约5℃至约15℃、约15℃至约25℃、约25℃至约37℃、约37℃至 约45℃、约45℃至约55℃、约55℃至约70℃、约70℃至约75℃、约75℃至约85℃、 约85℃至约90℃、约90℃至约95℃、约95℃至约100℃、约100℃至约105℃、约 105℃至约110℃、约110℃至约120℃的温度、或95℃、96℃、97℃、98℃、99℃、 100℃、101℃、102℃、103℃、104℃、105℃、106℃、107℃、108℃、109℃、110℃、 111℃、112℃、113℃、114℃、115℃或更高的温度后,保持活性,例如磷脂酶活性。 一方面,该多肽在pH 4.5下暴露于高于90℃至约95℃范围的温度后,保持磷脂酶或 其它活性。
【0022】一方面,分离的、合成的或重组的核酸包括在严格条件下,与具有一个 或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、 D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、 D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K 或Q265R的突变的SEQ ID NO:177或SEQ ID NO:178中所示序列杂交的序列,其中 该核酸编码具有磷脂酶活性的多肽。如本文所述,核酸的长度上可以为至少大约10、 20、30、40、50、60、70、80、90、100、150、200、250、300、350、400、450、500、 550、600、650、700、750、800、850个或更多残基或者是基因或者转录体的全长, 具有或者不具有信号序列。如此处所述,严格条件可以是高度严格、中度严格或者低 严格性。严格条件可以包括洗涤步骤,如,包括在0.2×SSC,大约65℃的温度下洗涤 大约15分钟的洗涤步骤。
【0023】本发明提供用于鉴定编码具有磷脂酶,例如磷脂酶活性的多肽的核酸的 核酸探针,其中该探针包括本发明的序列,例如具有一个或多个编码E41A、E41W、 E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、 D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、 D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQ ID NO:177或SEQ ID NO:178中所示序列的至少10、20、30、40、50、60、70、80、 90、100、150、200、250、300、350、400、450、500、550、600、650、700、750、 800、850个或者更多的连续碱基,并且该探针通过结合或者杂交鉴定核酸。该探针 可包括寡核苷酸,该寡核苷酸包括根据本发明序列的约10-100个之间的连续碱基, 或者是其片段或子序列,例如在具有一个或多个编码E41A、E41W、E41F、E41Y、 E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、 Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、 D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQ ID NO:177或SEQ ID NO:178中所示序列的10、15、20、25、30、35、40、45、50、55、60、65、70、 75、80、85、90、95或100个碱基或者更多碱基,或任何所期望的长度。
【0024】本发明提供了用于鉴定编码具有磷脂酶,如磷脂酶活性多肽的核酸的核 酸探针,其中该探针包括本发明的核酸,例如在至少大约10、20、30、40、50、60、 70、80、90、100、150、200、250、300、350、400、450、500、550、600、650、700、 750、800、850或者更多连续残基的范围内,与具有一个或多个编码E41A、E41W、 E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、 D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、 D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQ ID NO:177或SEQ ID NO:178中所示的序列或者它们的子序列具有至少50%、51%、 52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64 %、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76 %、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88 %、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或者 更多,或者完全的(100%)的序列同一性的核酸,并且一方面,序列同一性通过序 列比较算法分析或者通过目测检查确定。
【0025】本发明提供用于扩增编码具有磷脂酶活性多肽的核酸的扩增引物序列 对,其中该引物对能够扩增包括本发明的序列或者片段或者其子序列的核酸。一个或 每一个扩增引物序列对的成员可以包括含有该序列至少大约10到50个连续碱基,或 者该序列大约10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、 或者25个或更多个连续碱基的寡核苷酸。
【0026】本发明提供扩增引物对,其中该引物对包括第一成员和第二成员,其中 第一成员具有本发明核酸的大约前(5′端)12、13、14、15、16、17、18、19、20、 21、22、23、24、或者25个或更多个残基所示的序列,第二成员具有第一成员互补 链的大约前(5′)12、13、14、15、16、17、18、19、20、21、22、23、24或者25 个或更多个残基所示的序列。
【0027】本发明提供了使用本发明的扩增引物对通过扩增,例如聚合酶链式反应 (PCR)产生的磷脂酶。本发明提供了应用发明的扩增引物对通过扩增,例如聚合酶 链式反应(PCR)制备磷脂酶的方法。一方面,扩增引物对扩增来自文库的核酸,例 如基因文库,如环境文库。
【0028】本发明提供了扩增编码具有磷脂酶活性的多肽的核酸的方法,包括用能 够扩增本发明核酸序列或者片段或者其子序列的扩增引物序列对来扩增模板核酸序 列。该扩增引物对可以是本发明的扩增引物对。
【0029】本发明提供包括本发明的核酸或者其子序列的表达盒(expression cassettes)。一方面,表达盒可以包括可操作性地连接于启动子的核酸。启动子可以是 病毒的、细菌的、哺乳动物的或者植物的启动子。一方面,植物启动子可以是马铃薯、 水稻、玉米、小麦、烟草或者大麦启动子。启动子可以是组成型启动子。组成型启动 子可以包括CaMV35S。另一方面,启动子可以是诱导型启动子。一方面,启动子可 以是组织特异性启动子或者环境调控或者发育调控的启动子。因此,启动子可以是, 例如种子特异性、叶特异性、根特异性、茎特异性或者脱落诱导启动子。一方面,表 达盒可以进一步包括植物表达载体或者植物病毒表达载体。
【0030】本发明提供包括本发明的表达盒(如载体)或者本发明的核酸的克隆载 体。克隆载体可以是病毒载体、质粒、噬菌体、噬菌粒(phagemid)、粘粒、F粘粒(fosmid)、 细菌噬菌体或者人工染色体。病毒载体可以包括腺病毒载体,逆转录病毒载体或者腺 相关病毒载体。克隆载体可以包括细菌人工染色体(BAC)、质粒、细菌噬菌体P1 衍生载体(PAC)、酵母人工染色体(YAC)、或者哺乳动物人工染色体(MAC)。
【0031】本发明提供含有本发明核酸或者本发明表达盒(如,载体)或者本发明 克隆载体的转化细胞。一方面,转化细胞可以是细菌细胞、哺乳动物细胞、真菌细胞、 酵母细胞、昆虫细胞或者植物细胞。一方面,植物细胞可以是马铃薯、小麦、水稻、 玉米、烟草或者大麦细胞。
【0032】本发明提供包括本发明的核酸或者本发明的表达盒(如,载体)的转基 因非-人类动物。在一方面,动物是小鼠、大鼠、兔、羊、猪或奶或其它哺乳动物。
【0033】本发明提供包括本发明的核酸或者本发明的表达盒(如,载体)的转基 因植物。转基因植物可以是玉米植物、马铃薯植物、番茄植物、小麦植物、油籽植物、 油菜籽植物、大豆植物、水稻植物、大麦植物或烟草植物。本发明提供包括本发明的 核酸或本发明的表达盒(例如,载体)的转基因种子。转基因种子可以是玉米种子、 小麦仁、油籽、油菜籽(油菜植物)、大豆种子、棕榈仁、向日葵种子、芝麻种子、 花生、水稻或烟草植物种子。
【0034】本发明提供含有与本发明的核酸互补或在严格条件下能够与本发明的核 酸杂交的核酸序列的反义寡核苷酸。本发明提供抑制细胞内磷脂酶信使翻译的方法, 该方法包括向细胞施用或在细胞中表达含有与本发明的核酸互补或在严格条件下能 够与本发明的核酸杂交的核酸序列的反义寡核苷酸。
【0035】本发明提供含有与本发明的核酸互补或在严格条件下能够与本发明的核 酸杂交的核酸序列的反义寡核苷酸。本发明提供抑制细胞内磷脂酶信使翻译的方法, 该方法包括向细胞施用或在细胞中表达含有与本发明的核酸互补或在严格条件下能 够与本发明的核酸杂交的核酸序列的反义寡核苷酸。反义寡核苷酸的长度可以是大约 10到50、大约20到60、大约30到70、大约40到80、大约60到100、大约70到 110或者大约80到120个碱基。
【0036】本发明提供抑制磷脂酶如细胞内磷脂酶信使翻译的方法,该方法包括向 细胞施用或在细胞中表达含有与本发明的核酸互补或在严格条件下能够与本发明的 核酸杂交的核酸序列的反义寡核苷酸。本发明提供包括本发明序列的子序列的双链抑 制性RNA(RNAi)分子。在一方面,RNAi长度是大约15、16、17、18、19、20、 21、22、23、24、25或者更多的双链核苷酸。本发明提供抑制磷脂酶如细胞内磷脂 酶表达的方法,该方法包括向细胞施用或者在细胞中表达双链抑制性RNA(RNAi), 其中该RNA包括本发明序列的子序列。
【0037】本发明提供了分离的、合成的或重组的多肽,该多肽包含与本发明示例 性的多肽或肽(例如具有一个或多个E41A、E41W、E41F、E41Y、E41R、E94R、 D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、 P118W、E125K、S168N、D171V、E41A、E41W、E41F、E41Y、E41R、E94R、D100L、 D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、 E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、 D234R、D234K或Q265R突变的SEQ ID NO:175或SEQ ID NO:176)在多肽的至少 大约10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、90、100、 125、150、175、200、225、250、275、300、325、350、400、450、500、550或600 或更多残基,或多肽的全长范围内,具有至少大约50%、51%、52%、53%、54%、 55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、 68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、 81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、 94%、95%、96%、97%、98%或99%,或更大,或完全的(100%)序列同一性的氨 基酸序列;并且,一方面,序列同一性通过序列比较算法分析或者通过目测观察来确 定。
【0038】一方面,本发明提供包括与具有一个或多个编码E41A、E41W、E41F、 E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、 T112R、Y116W、I117W、P118W、E125K、S168N、D171V、E41A、E41W、E41F、 E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、 T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、 D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQ ID NO:175 或SEQ ID NO:176具有至少大约81%、82%、83%、84%、85%、86%、87%、88 %、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或者 更多,或者完全的(100%)序列同一性的氨基酸序列的分离的、合成的或者重组的 多肽。
【0039】本发明提供由本发明的核酸编码的分离的、合成的或者重组的多肽。在 可选的方面,多肽可以具有如在具有一个或多个编码E41A、E41W、E41F、E41Y、 E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、 Y116W、I117W、P118W、E125K、S168N、D171V、E41A、E41W、E41F、E41Y、 E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、 Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、 D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQ ID NO:175或SEQ ID NO:176中所示的序列。多肽可以具有磷脂酶活性,如磷脂酶A、B、C或D活性, 或磷脂酶活性的任何组合,例如PLA、PLC和/或PLD活性——作为多功能活性。例 如,一方面,本发明的多肽具有酶活性,但是缺少脂酶活性,例如缺少影响中性油(甘 油三酯)部分的任何酶活性。一方面,本发明提供了脱胶方法,该方法包括使用具有 磷脂酶活性但不具有脂酶活性的本发明的多肽,这样在脱胶方法中,任何中性油部分 不受损害(减少、改变、降解,例如水解)。
【0040】在可选的方面,本发明的多肽具有磷脂酶活性,但缺乏:信号序列或原 蛋白序列;或者,具有磷脂酶活性以及进一步包括异源氨基酸序列,或者本发明的核 酸(多核苷酸)包括异源核苷酸序列。一方面,异源氨基酸序列包括编码异源(前导) 信号序列、或标记或表位的序列、或由之组成,或者异源核苷酸序列包括异源启动子 序列;一方面,异源(前导)信号序列包括N-末端和/或C-末端延伸或由之组成,其 用于靶向至内质网(ER)或内膜、或者靶向至植物内质网(ER)或内膜系统,或者 该异源序列编码限制性位点。
【0041】本发明提供了含有缺乏信号序列的本发明多肽的分离的、合成的或者重 组的多肽。一方面,缺乏信号肽的多肽与具有一个或多个编码E41A、E41W、E41F、 E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、 T112R、Y116W、I117W、P118W、E125K、S168N、D171V、E41A、E41W、E41F、 E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、 T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、 D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQ ID NO:175 或SEQ ID NO:176的残基30到287具有至少81%、82%、83%、84%、85%、86%、 87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99 %或者更多序列同一性。序列同一性通过序列比较算法分析或者通过目测观察确定。
【0042】本发明的另一方面提供分离的、合成的或者重组的多肽或者肽,该分离 的、合成的或者重组的多肽或者肽包括本发明的多肽或肽序列、与之基本相同的序列, 和与之互补的序列的至少10、15、20、25、30、35、40、45、50、55、60、65、70、 75、80、85、90、95或者100或者更多的连续碱基。该肽可以是,例如,免疫源性 的片段、基序(如结合位点)或者活性位点。
【0043】一方面,本发明分离的、合成的或重组的多肽(有或无信号序列)具有 磷脂酶活性。一方面,磷脂酶活性包括催化甘油磷酸酯键的水解(即,切割甘油磷酸 酯键)。磷脂酶活性可以包括催化植物油中磷脂的酯键的水解。植物油磷脂可以包括 油籽的磷脂。磷脂酶活性可以包括磷脂酶C(PLC)活性;磷脂酶A(PLA)活性, 如磷脂酶A1或者磷脂酶A2活性;磷脂酶D(PLD)活性,如磷脂酶D1或者磷脂酶 D2活性;磷脂酶B(PLB)活性,例如磷脂酶和溶血磷脂酶(LPL)活性,或磷脂酶和 溶血磷脂酶-转酰基酶(LPTA)活性,或磷脂酶和溶血磷脂酶(LPL)活性和溶血磷脂酶- 转酰基酶(LPTA)活性;或patatin活性,或其组合。例如,一方面,磷脂酶活性包括 本文中描述的一种或多种酶活性的组合,例如磷脂酶可以具有PLC和PLA活性;PLB 和PLA活性;PLC和PLD活性;PLC和PLB活性;PLB和patatin活性;PLC和patatin 活性;PLD和PLA;PLD、PLA、PLB和PLC活性;或PLD、PLA、PLB、PLC和 patatin活性;或磷脂酶和溶血磷脂酶(LPL)活性或磷脂酶和溶血磷脂酶-转酰基酶 (LPTA)活性或磷脂酶和溶血磷脂酶(LPL)活性和溶血磷脂酶-转酰基酶(LPTA)活性,或 其任意组合。
【0044】磷脂酶活性可以包括水解糖蛋白,如马铃薯块茎中发现的糖蛋白。磷脂 酶活性可以包括patatin酶活性。磷脂酶活性可以包括脂酰水解酶(LAH)活性。
【0045】一方面,分离的、合成的或者重组的多肽可以包括缺乏信号序列的本发 明的多肽。一方面,分离的、合成的或者重组的多肽可以包括含有异源信号序列,如 异源磷脂酶或者非-磷脂酶信号序列的本发明多肽。
【0046】一方面,本发明提供包括第一结构域和至少第二结构域的嵌合蛋白,第 一结构域包括本发明的信号序列。该蛋白可以是融合蛋白。第二结构域可以包括酶。 酶可以是磷脂酶。
【0047】本发明提供包括至少第一结构域和至少第二结构域的嵌合多肽,第一结 构域包括发明的信号肽(SP)或本发明磷脂酶的催化结构域(CD),或活性位点,第 二结构域包括异源多肽或肽,其中异源多肽或者肽与信号肽(SP)或者催化结构域 (CD)之间没有天然的联系。一方面,异源多肽或者肽不是磷脂酶。异源多肽或者 肽可以在信号肽(SP)或者催化结构域(CD)的氨基末端,羧基末端或者羧基和氨 基末端。
【0048】本发明提供编码嵌合多肽的分离的、合成的或者重组的核酸,其中嵌合 多肽包括至少第一结构域和至少第二结构域,第一结构域含有本发明多肽的信号肽 (SP)或者催化结构域(CD)或者活性位点,第二结构域包括异源多肽或者肽,其 中异源多肽或者肽与信号肽(SP)或者催化结构域(CD)之间没有天然的联系。
【0049】一方面,磷脂酶活性包括在大约37℃下,每毫克蛋白大约10到大约100 单位范围的比活性。另一方面,磷脂酶活性包括每毫克蛋白大约100到大约1000单 位,大约500到大约750单位范围的比活性。可选地,磷脂酶活性包括在37℃下每 毫克蛋白大约100到大约500单位的比活性。在一方面,磷脂酶活性包括在37℃下 每毫克蛋白大约500到大约1200单位的比活性。另一方面,磷脂酶活性包括在37℃ 下每毫克蛋白大约750到大约1000单位的比活性。另一方面,耐热性包含经加热至 升高的温度以后,在37℃下仍保持磷脂酶至少一半的比活性。可选地,耐热性包含 经加热至升高的温度——例如约0℃至约20℃、约20℃至约37℃、约37℃至约50℃、 约50℃至约70℃、约70℃至约75℃、约75℃至约80℃、约80℃至约85℃、约85℃ 至约90℃、约90℃至约95℃、约95℃至约100℃、约100℃至约110℃或更高的温 度以后,在37℃下仍保持每毫克蛋白大约500到大约1200单位的比活性。可选地, 耐热性可包括经加热至升高的温度以后,在37℃下仍保持每毫克蛋白大约1至大约 1200单位、或每毫克蛋白大约500至大约1000单位的比活性。另一方面,耐热性 可包括经加热至如上所述的升高的温度以后,在37℃下仍保持每毫克蛋白大约1至 大约500单位的比活性。
【0050】本发明提供本发明分离的、合成的或者重组的多肽,其中多肽包括至少 一个糖基化位点。一方面,糖基化可以是N-连接糖基化。一方面,多肽可以是在巴 斯德毕赤酵母(P.pastoris)或者粟酒裂殖酵母(S.pombe)中表达后进行糖基化。
【0051】本发明提供了磷脂酶和编码它们的核酸,该磷脂酶具有本发明任何示例 性磷脂酶的序列,其中一个或多个或所有糖基化位点被改变,如上所述。因此,本发 明提供了制备在宿主细胞中具有增加的表达水平的变体磷脂酶编码序列的方法,其中 该方法包括修饰本发明的磷脂酶编码序列,这样,一个、多个或所有N-连接的糖基 化位点编码基序被修改为非糖基化基序。本发明也提供了由该方法制得的磷脂酶编码 序列,和它们编码的酶。
【0052】本发明提供了制备变体磷脂酶编码序列的方法,该序列编码对蛋白酶具 有增加的耐受性的磷脂酶,该方法包括将等同于具有一个或多个编码E41A、E41W、 E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、 D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、E41A、E41W、 E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、 D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、 D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQ ID NO:175或SEQ ID NO:176的位置131的氨基酸修改成一个、多个或所有下述残基: 赖氨酸(K);丝氨酸(S);甘氨酸(G);精氨酸(R);谷氨酰胺(Q);丙氨酸(A);异亮氨酸 (I);组氨酸(H);苯丙氨酸(F);苏氨酸(T);蛋氨酸(M);亮氨酸(L)。本发明也提供由 该方法制得的序列所编码的分离的、合成的或重组的磷脂酶。
【0053】本发明提供了制备变体磷脂酶编码序列的方法,该序列编码对蛋白酶具 有减少的耐受性的磷脂酶,该方法包括将等同于具有一个或多个编码E41A、E41W、 E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、 D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171、VE41A、E41W、 E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、 D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、 D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQ ID NO:175或SEQ ID NO:176的位置131的氨基酸修改成一个、多个或所有下述残基: 色氨酸(W);谷氨酸(E);酪氨酸(Y)。本发明也提供由该方法制得的序列所编码的分离 的、合成的或重组的磷脂酶。
【0054】本发明提供包括本发明多肽的蛋白制备物,其中蛋白制备物包括液体、 固体或者凝胶制备物。
【0055】本发明提供包括本发明多肽和第二种蛋白或者结构域的异源二聚体。异 源二聚体的第二个成员可以是不同的磷脂酶、不同的酶或者另一种蛋白。在一方面, 第二个结构域可以是多肽,且异源二聚体可以是融合蛋白。在一方面,第二个结构域 可以是表位(抗原决定簇)或者标记。在一方面,本发明提供包括本发明多肽的同源二 聚体。
【0056】本发明提供具有磷脂酶活性的固定化多肽,其中多肽包含本发明的多肽, 本发明核酸编码的多肽,或者包括本发明多肽和第二个结构域的多肽(例如融合蛋 白)。在一方面,本发明多肽固定在细胞、细胞小泡、脂质体、薄膜(film)、膜 (membrane)、金属、树脂聚合物、陶瓷、玻璃、微电极石墨颗粒、珠子、凝胶、 板、晶体、片剂、丸、胶囊、粉末、附聚物、表面、多孔结构、阵列或者毛细管上。 一方面,本发明的多肽固定在物质诸如谷物、果壳、树皮、皮、毛发、釉质、骨、壳 和由它们衍生的物质,或动物饲料物质,或其组合上。
【0057】本发明的多肽(例如磷脂酶)也可以单独存在或以磷脂酶混合物或磷脂 酶与其它水解酶混合物的形式存在,其它水解酶诸如纤维素酶、木聚糖酶、蛋白酶、 脂酶、淀粉酶、或化还原酶如漆酶、过氧化物酶、过氧化氢酶、氧化酶或还原酶。 它们可以配制成固体形式如粉末、冻干制剂、颗粒、片剂、条、晶体、胶囊、丸、丸 粒,或液体形式如水溶液、气溶胶、凝胶、糊、浆、水/油乳状液、乳剂、胶囊、小 泡或胶束悬浮液。一方面,本发明的这些制剂可以包括任何下述组分或它们的组合: 多元醇如聚乙二醇、聚乙烯醇、丙三醇,糖类如蔗糖、山梨醇、海藻糖、葡萄糖、果 糖、麦芽糖;胶凝剂如瓜尔树胶、鹿菜胶、藻酸盐、葡聚糖、纤维素衍生物、果胶; 盐如氯化钠硫酸钠、硫酸铵、氯化、氯化镁、氯化锌、硫酸锌、脂肪酸及其衍生 物的盐;金属螯合剂如EDTA、EGTA、柠檬酸钠;抗微生物剂如脂肪酸、其衍生物、 对羟基苯甲酸酯、山梨酸酯、苯甲酸盐;抑制蛋白酶作用的其它化合物如大体积蛋白 质(bulk protein),诸如BSA;小麦水解产物;酸盐化合物;乳化剂如非离子型和 离子型洗涤剂可以单独或组合使用;植物甾醇;维生素;氨基酸;还原剂如半胱氨酸 或抗氧化化合物如抗坏血酸可以包括在内以及分散剂。
【0058】一方面,交联和蛋白质修饰作用如聚乙二醇化、脂肪酸修饰和糖基化被 用于提高本发明多肽的稳定性(例如酶稳定性)。一方面,多元醇和/或糖占制剂的约 5%至约60%,或更多,制剂的约10%至约50%、制剂的约20%至约40%、或制剂的 约5%至约20%。另一方面,胶凝剂占制剂的约0.5%至约10%、制剂的约1%至约8%、 制剂的约2%至约5%、或制剂的约0.5%至约3%。另一方面,盐如氯化钠、硫酸钠、 硫酸铵、氯化钙和/或氯化镁占制剂的约1%至约30%、制剂的约2%至约20%、制剂 的约5%至约15%、或制剂的约1%至约10%。另一方面,氯化锌以包括约0.1mM至 约20mM、约0.5mM至约10mM、约1mM至约5mM、或约0.1mM至约5mM 的浓度存在于制剂中。又在另一个方面,硫酸锌以包括约0.1mM至约20mM、约0.5 mM至约10mM、约1mM至约5mM、或约0.1mM至约5mM的浓度存在于制剂 中。在另一个方面,脂肪酸和/或其衍生物的盐占制剂的约5%至约40%、制剂的约 10%至约30%、制剂的约15%至约25%、或制剂的约5%至约20%。另一方面,金属 螯合剂如EDTA、EGTA和/或柠檬酸钠以包括0.1mM至约10mM、约0.5mM至约 8mM、约1mM至约5mM或约0.1mM至约1mM的浓度存在于制剂中。另一方面, 抗微生物剂如对羟基苯甲酸酯类、山梨酸酯和/或苯甲酸盐占制剂的约0.01%至约 10%、制剂的约0.05%至约5%、制剂的约0.1%至约1%、或制剂的约0.05%至约0.5%。 又在另一个方面,大体积蛋白质如BSA和/或小麦水解产物占制剂的约1%至约20%、 制剂的约5%至约15%、制剂的约2.5%至约7.5%、或制剂的约1%至约5%。另一方 面,乳化剂如非离子型和/或离子型洗涤剂以一定浓度存在于制剂中,该浓度包括约1× 临界胶束浓度(CMC)至约10×CMC,约2.5×CMC至约7.5×CMC,约1×CMC至约 5×CMC,或约3×至约6×CMC。在另一个方面,维生素、氨基酸、还原剂和/或抗氧 化化合物占制剂的约0.1%至约5%、制剂的约0.5%至约4%、制剂的约1%至约2.5%、 制剂的约0.1%至约1%。
【0059】本发明提供包含固定化多肽的阵列,其中多肽是本发明的磷脂酶或者本 发明核酸编码的多肽。本发明提供含有本发明的固定化核酸的阵列。本发明提供含有 本发明的固定化抗体的阵列。
【0060】本发明提供特异性地结合于本发明多肽或者本发明的核酸编码的多肽的 分离的、合成的或者重组的抗体。抗体可以是单克隆抗体或者多克隆抗体。本发明提 供含有本发明抗体的杂交瘤。
【0061】本发明提供分离和鉴定具有磷脂酶活性的多肽的方法,包括以下步骤: (a)提供本发明的抗体;(b)提供含有多肽的样品;以及(c)在抗体能够特异性地 结合于该多肽的条件下,将步骤(b)的样品与步骤(a)的抗体接触,从而分离和鉴 定磷脂酶。本发明提供制备抗-磷脂酶抗体的方法,包括向非人类动物施用足以产生 体液免疫应答的量的本发明核酸或者本发明多肽,从而制备抗磷脂酶抗体。
【0062】本发明提供生产重组多肽的方法,包含以下的步骤:(a)提供可操作地 连接于启动子的本发明的核酸,以及(b)在允许多肽表达的条件下表达步骤(a)的 核酸,从而生产重组多肽。该核酸可以包括与具有一个或多个编码E41A、E41W、 E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、 D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、 D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQ ID NO:175或SEQ ID NO:176在至少大约100个残基的区域内具有至少85%的序列 同一性的序列,其中序列同一性通过序列比较算法分析或者目测观察来确定。核酸可 以包括在严格的条件下与具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、 E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、 I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、 D234V、D234G、D234R、D234K或Q265R的突变的SEQ ID NO:177或SEQ ID NO:178 所示的核酸杂交的核酸。该方法可以进一步包括用步骤(a)的核酸转化宿主细胞, 随后表达步骤(a)的核酸,从而在转化细胞中生产重组多肽。该方法可以进一步包 括把步骤(a)的核酸插入到非人类动物宿主中,随后表达步骤(a)的核酸,从而在 非人动物宿主中生产重组多肽。
【0063】本发明提供鉴定具有磷脂酶活性的多肽的方法,包括以下的步骤:(a) 提供本发明的多肽或由本发明核酸编码的多肽,或其片段或变体,(b)提供磷脂酶底 物;和(c)将步骤(a)的多肽或其片段或变体与步骤(b)的底物接触,并检测底 物量的增加或者反应产物量的减少,其中底物量的减少或者反应产物量的增加说明检 测到了具有磷脂酶活性的多肽。在可选的方面,核酸包括与具有一个或多个编码 E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、 A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、 M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的 突变的SEQ ID NO:177或SEQ ID NO:178在至少大约100个残基的范围内具有至少 85%的序列同一性的序列,其中序列同一性通过序列比较算法分析或者目测观察来确 定。在可选的方面,核酸可以在严格的条件下与具有一个或多个编码E41A、E41W、 E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、 D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、 D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQ ID NO:177或SEQ ID NO:178所示的序列杂交。
【0064】本发明提供确定磷脂酶底物的方法,包括以下步骤:(a)提供本发明的 多肽或者本发明核酸编码的多肽;(b)提供测试底物;以及(c)将步骤(a)的多肽 与步骤(b)的测试底物接触,检测底物量的增加或者反应产物量的减少,其中底物 量的减少或者反应产物量的增加确定测试底物为磷脂酶底物。在可选的方面,核酸可 以与具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、 D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、 S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、 D234K或Q265R的突变的SEQ ID NO:177或SEQ ID NO:178具有至少85%的序列同 一性,其中序列同一性通过序列比较算法分析或者目测观察来确定。在可选的方面, 核酸在严格的条件下与具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、 D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、 P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、 D234G、D234R、D234K或Q265R的突变的SEQ ID NO:177或SEQ ID NO:178所示 的序列杂交。
【0065】本发明提供确定化合物是否特异性地与磷脂酶结合的方法,包括以下步 骤:(a)在允许核酸翻译成多肽的条件下,表达核酸或者包含该核酸的载体,其中该 核酸和载体包括本发明的核酸或者载体;或者,提供本发明的多肽,(b)使多肽与测 试化合物接触;和(c)确定测试化合物是否特异性地与多肽结合,从而确定该化合 物是否特异地与磷脂酶结合。在可选的方面,核酸序列与具有一个或多个编码E41A、 E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、 A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、 M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的 突变的SEQ ID NO:177或SEQ ID NO:178具有至少85%的序列同一性,其中序列同 一性通过序列比较算法分析或者通过目测观察来确定。在可选的方面,核酸在严格的 条件下与具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、 D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、 E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、 D234R、D234K或Q265R的突变的SEQ ID NO:177或SEQ ID NO:178所示的序列或 其子序列杂交。
【0066】本发明提供鉴定磷脂酶活性的调节物的方法,包括以下步骤:(a)提供 本发明的多肽或者本发明核酸编码的多肽;(b)提供测试化合物;以及(c)将步骤 (a)的多肽与步骤(b)的测试化合物接触;并测定磷脂酶的活性,其中在测试化合 物存在的条件下测得的磷脂酶活性与在无测试化合物存在的条件下测得的磷脂酶活 性相比的变化证明测试化合物调节磷脂酶的活性。在可选的方面,核酸可以与具有一 个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、 D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、 D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K 或Q265R的突变的SEQ ID NO:177或SEQ ID NO:178在至少大约100个残基的范围 内,具有至少85%的序列同一性,其中序列同一性通过序列比较算法分析或者通过 目测观察来确定。在可选的方面,核酸可以在严格的条件下与选自具有一个或多个编 码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、 D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、 D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或 Q265R的突变的SEQ ID NO:177或SEQ ID NO:178所示的序列或其子序列的核酸序 列杂交。
【0067】一方面,磷脂酶活性通过提供磷脂酶底物并且检测底物量的增加或者反 应产物量的减少来测定。与不存在测试化合物的条件下底物或者反应产物的量相比, 在存在测试化合物的条件下,底物量的减少或者反应产物量的增加证明测试化合物是 磷脂酶活性的激活剂。与不存在测试化合物的条件下底物或者反应产物的量相比,在 存在测试化合物的条件下,底物量的增加或者反应产物量的减少证明测试化合物是磷 脂酶活性的抑制剂
【0068】本发明提供包含处理器和数据存储设备的计算机系统,其中所述的数据 存储设备上已存储了本发明的多肽序列或者本发明的核酸序列。
【0069】一方面,计算机系统可以进一步包括序列比较算法,和其上已经存储了 至少一个参照序列的数据存储设备。序列比较算法可以包括表明多态性的计算机程 序。计算机系统可以进一步包括鉴定所述序列的一个或者多个特征的鉴定器(an identifier)。
【0070】本发明提供其上已储存了包括本发明多肽序列或本发明核酸序列的序列 的计算机可读介质。
【0071】本发明提供了鉴定序列中的特征的方法,包括以下步骤:(a)应用鉴定 序列的一个或者多个特征的计算机程序来读取序列,其中该序列包括本发明的多肽序 列或者本发明的核酸序列;和(b)用计算机程序鉴定序列中的一个或者多个特征。
【0072】本发明提供比较第一序列和第二序列的方法,该方法包括以下步骤:(a) 应用比较序列的计算机程序读取第一序列和第二序列,其中第一序列包括本发明的多 肽序列或者本发明的核酸序列;并且(b)用计算机程序确定第一序列和第二序列间 的差异。一方面,确定第一序列和第二序列间差异的步骤进一步包括鉴定多态性的步 骤。一方面,该方法进一步包括鉴定序列中一个或者多个特征的鉴定器(以及鉴定器 的应用)。一方面,该方法包括用计算机程序读取第一序列,并鉴定该序列中的一个 或者多个特征。
【0073】本发明提供从环境样品中分离或者回收编码具有磷脂酶活性的多肽的核 酸的方法,包括以下步骤:(a)提供扩增编码具有磷脂酶活性的多肽的核酸的扩增引 物序列对,其中引物对能够扩增本发明的核酸(如具有一个或多个编码E41A、E41W、 E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、 D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、 D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQ ID NO:177或SEQ ID NO:178或其子序列,等等);(b)从环境样品中分离核酸或者 处理环境样品以便样品中的核酸可以与扩增引物对杂交;和(c)将步骤(b)的核酸 和步骤(a)的扩增引物对结合,并且从环境样品中扩增核酸,从而从环境样品中分 离或者回收编码具有磷脂酶活性的多肽的核酸。在一方面,扩增引物序列对的每一个 成员包括含有本发明的核酸序列的至少大约10到50个连续碱基的寡核苷酸。在一方 面,扩增引物序列对是本发明的扩增对。
【0074】本发明提供从环境样品中分离或者回收编码具有磷脂酶活性的多肽的核 酸的方法,包括以下步骤:(a)提供包含本发明的核酸序列或其子序列的多核苷酸探 针;(b)从环境样品中分离核酸或者处理环境样品以便样品中的核酸可以与步骤(a) 的多核苷酸探针杂交;(c)将步骤(b)的分离的核酸或者经处理的环境样品与步骤 (a)的多核苷酸探针结合;和(d)分离与步骤(a)的多核苷酸探针特异性杂交的 核酸,因此从环境样品中分离或者回收编码具有磷脂酶活性的多肽的核酸。在可选的 方面,环境样品包括水样品、液体样品、土壤样品、空气样品或者生物样品。在可选 的方面,生物样品来源于细菌细胞、原生动物细胞、昆虫细胞、酵母细胞、植物细胞、 真菌细胞、藻类细胞、地衣细胞或者哺乳动物细胞。
【0075】本发明提供产生编码磷脂酶的核酸的变体的方法,包括以下步骤(a) 提供包括本发明核酸的模板核酸;(b)在模板序列中修饰、缺失或者添加一个或者多 个核苷酸,或其组合,从而产生模板核酸的变体。
【0076】在一方面,该方法进一步包括表达变异核酸,以产生变体磷脂酶多肽。 在可选的方面,修饰、添加或者缺失由易错PCR(error-prone PCR)、重排(shuffling)、 寡核苷酸定向诱变(oligonucleotide-directed mutagenesis)、装配PCR(assembly PCR)、 有性PCR诱变(sexual PCR mutagenesis)、体内诱变(in vivo mutagenesis)、盒式诱变 (cassette mutagenesis)、回归整体诱变(recursive ensemble mutagenesis)、指数整体诱变 (exponential ensemble mutagenesis)、位点特异性诱变(site-specific mutagenesis)、基因 重装配(gene reassembly)、基因位点饱和诱变(Gene Site Saturation Mutagenesis, GSSM)、合成连接重装配(synthetic ligation reassembly,SLR)和/或其组合的方法来引 入。在可选的方面,修饰、添加或者缺失通过选自下述的方法引入:重组、回归序列 重组(recursive sequence recombination)、硫代磷酸酯-修饰的DNA诱变 (phosphothioate-modified DNA mutagenesis)、含尿嘧啶的模板诱变(uracil-containing template mutagenesis)、缺口二重诱变(gapped duplex mutagenesis)、点错配修复诱变 (point mismatch repair mutagenesis)、修复-缺陷型宿主株诱变(repair-deficient host strain mutagenesis)、化学诱变、放射诱变、缺失诱变、限制-选择诱变(restriction-selection mutagenesis)、限制-纯化诱变(restriction-purification mutagenesis)、人工基因合成 (artificial gene synthesis)、整体诱变(ensemble mutagenesis)、嵌合核酸多聚体生成 (chimeric nucleic acid multimer creation)和/或其组合。
【0077】在一方面,该方法被反复重复,直到产生与模板核酸编码的磷脂酶相比, 具有改变的或不同的活性或者改变的或不同的稳定性的磷脂酶。在一方面,改变的或 不同的活性是在酸性条件下的磷脂酶活性,其中模板核酸编码的磷脂酶在酸性条件下 没有活性。一方面,改变的或不同的活性是在高温下的磷脂酶活性,其中模板核酸编 码的磷脂酶在高温的条件下没有活性。一方面,该方法反复重复,直到产生与模板核 酸的密码子选择相比具有改变的密码子选择的磷脂酶编码序列。该方法反复重复,直 到产生与模板核酸的信使表达或者信使稳定性相比具有更高或更低水平的信使表达 或者信使稳定性的磷脂酶基因。
【0078】本发明提供修饰编码磷脂酶的核酸中密码子以增强其在宿主细胞中表达 的方法,该方法包括(a)提供本发明的编码磷脂酶的核酸;(b)鉴定步骤(a)的核 酸中的非偏爱(non-preferrd)或者不太偏爱(less preferred)的密码子,并且用编码相同氨 基酸的偏爱的(或优选的)或者中度使用(neutrally used)的密码子作为替代密码子 替换之,其中偏爱密码子是在宿主细胞基因的编码序列中过度表现(出现频率较多, over-represent)的密码子,而非偏爱(或非优选的)或不太偏爱的密码子是在宿主细胞 基因的编码序列中表现不足(出现频率较少,under-represent)的密码子,由此修饰该核 酸以增加其在宿主细胞中的表达。
【0079】本发明提供修饰编码磷脂酶的核酸中的密码子的方法,该方法包括(a) 提供本发明的编码磷脂酶的核酸;并且(b)确定步骤(a)的核酸中的密码子,并用 编码相同氨基酸的不同的密码子作为替代密码子来替换之,从而修饰编码磷脂酶的核 酸中的密码子。
【0080】本发明提供修饰编码磷脂酶的核酸中的密码子以增强其在宿主细胞中的 表达的方法,该方法包括(a)提供本发明的编码磷脂酶的核酸,和(b)鉴定步骤(a) 的核酸中的非偏爱的或者不太偏爱的密码子,并用编码相同氨基酸的偏爱的或者中度 使用的密码子作为替代密码子来替换之,其中偏爱密码子是在宿主细胞基因的编码序 列中过度表现的密码子,非-偏爱或不太偏爱的密码子是在宿主细胞基因的编码序列 中表现不足的密码子,由此修饰该核酸以增加其在宿主细胞中的表达。
【0081】本发明提供修饰编码磷脂酶的核酸中的密码子以降低其在宿主细胞的表 达的方法,该方法包括(a)提供本发明的编码磷脂酶的核酸;和(b)鉴别步骤(a) 的核酸中的至少一个偏爱的密码子,并用编码相同氨基酸的非偏爱的或者不太偏爱的 密码子作为替代密码子替换之,其中偏爱密码子是在宿主细胞基因的编码序列中过度 表现的密码子,非偏爱或不太偏爱的密码子是在宿主细胞基因的编码序列中表现不足 的密码子,由此修饰该核酸以减少其在宿主细胞中的表达。在可选的方面,宿主细胞 是细菌细胞、真菌细胞、昆虫细胞、酵母细胞、植物细胞、藻类细胞、地衣细胞或哺 乳动物细胞。
【0082】本发明提供产生编码多个经修饰的磷脂酶活性位点或底物结合位点的核 酸文库的方法,其中经修饰的活性位点或者底物结合位点来源于包括编码第一活性位 点或者第一底物结合位点的序列的第一核酸,该方法包括:(a)提供编码第一个活性 位点或者第一个底物结合位点的第一核酸,其中第一核酸序列包括本发明的核酸, (b)提供一组在第一核酸的多个靶密码子处编码天然产生的氨基酸变体的诱变寡核 苷酸;和(c)应用该组诱变寡核苷酸产生一组编码活性位点或者编码底物结合位点 的变体核酸,在每一个被诱变的氨基酸密码子处,变体核酸编码一定范围的氨基酸变 异,从而产生编码多个修饰的磷脂酶活性位点或者底物结合位点的核酸文库。在可选 的方面,本方法包括通过下列的方法诱变步骤(a)的第一核酸,所述方法包括优化 的定向进化系统(optimized directed evolution system)、基因位点饱和诱变(Gene Site-Saturation Mutagenesis)(GSSM)、合成连接重装配(SLR)。该方法可以进一步包括 通过下列方法诱变步骤(a)的第一核酸或变体,所述方法包括易错PCR、重排、寡 核苷酸定点突变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、回归整体诱变、 指数整体诱变、位点特异性诱变、基因重装配、基因位点饱和诱变(GSSM)、合成连 接重装配(SLR)及其组合。本方法可以进一步包括通过以下的方法诱变步骤(a)的第 一核酸或变体,所述方法包括重组、回归序列重组、硫代磷酸酯修饰的DNA诱变、 含尿嘧啶的模板诱变、缺口二重诱变、点错配修复诱变、修复-缺陷型宿主株诱变、 化学诱变、放射诱变、缺失诱变、限制-选择诱变、限制-纯化诱变、人工基因合成、 整体诱变、嵌合核酸多聚体生成及其组合。
【0083】本发明提供制备小分子的方法,包括以下步骤:(a)提供可以合成或者 修饰小分子的多种生物合成酶,其中一种酶包括由本发明核酸编码的磷脂酶;(b)提 供步骤(a)的至少一种酶的底物,并且(c)在利于许多生物催化反应进行的条件下, 将步骤(b)的底物和酶反应,通过一系列生物催化反应产生小分子。
【0084】本发明提供修饰小分子的方法,包括以下步骤:(a)提供由本发明核酸 编码的磷脂酶;(b)提供小分子;和(c)在利于磷脂酶催化的酶反应进行的条件下, 将步骤(a)的酶与步骤(b)的小分子反应,从而通过磷脂酶酶促反应修饰小分子。 一方面,该方法包括提供多种用于步骤(a)的酶的小分子底物,从而产生经修饰的 小分子文库,该小分子文库由磷脂酶催化的至少一种酶促反应产生。一方面,该方法 可以包括多种其它的酶,在有助于这些酶的多个生物催化反应的条件下使用,以形成由 多个酶促反应产生的被修饰小分子的文库。另一方面,该方法可以进一步包括测试该文 库以确定该文库中是否存在表现出期望活性的特定被修饰小分子的步骤。测试该文库的 步骤可以进一步包括系统地去除所有但保留一个用于产生文库中多个被修饰小分子中 的一部分的生物催化反应,方法是通过测试被修饰小分子的所述部分中存在或不存在具 有期望活性的特定被修饰小分子,并鉴定出产生具有期望活性的特定修饰小分子的至少 一个特定生物催化反应。
【0085】本发明提供用于确定磷脂酶的功能性片段方法,包括以下步骤:(a)提 供包括本发明氨基酸序列的磷脂酶;和(b)删除步骤(a)序列中的多个氨基酸残基, 并且测定剩余子序列的磷脂酶活性,从而确定磷脂酶的功能性片段。一方面,磷脂酶 活性通过提供磷脂酶底物,并检测底物量的增加或者反应产物量的减少来测定。一方 面,与不存在测试化合物条件下确定的底物或者反应产物的量相比较,在测试化合物 存在的条件下,酶底物量的减少或者反应产物量的增加表明测试化合物是磷脂酶活性 的激活剂。
【0086】本发明提供切割甘油磷酸酯键的方法,包括以下步骤:(a)提供具有磷 脂酶活性的多肽,其中该多肽包括本发明的氨基酸序列,或者该多肽由本发明的核酸 编码;(b)提供包含甘油磷酸酯键的组合物;和(c)在该多肽切割甘油磷酸酯键的 条件下,将步骤(a)的多肽与步骤(b)的组合物接触。一方面,该条件包括大约 pH5到大约8.5之间,或者大约pH4.5(或酸性更大,即pH<4.5)到大约9.0(或碱 性更大,即pH>9)之间。一方面,该条件包括大约40℃到大约70℃之间的温度。一 方面,该组合物包括植物油。一方面,该组合物包括油籽磷脂。一方面,切割反应可 以产生水可抽提的磷酸化的碱和甘油二酯。
【0087】本发明提供了水解、分解或破坏含磷脂组合物(或组分)的方法,该方 法包括提供具有磷脂酶活性的至少一种本发明的多肽,或由本发明的至少一种核酸编 码的具有磷脂酶活性的多肽;提供包含磷脂的组合物;以及在磷脂酶水解、分解或破 坏含磷脂组合物的条件下将所述多肽与所述组合物接触。一方面,该方法包括使用高 剪切,然后不使用低剪切或使用低剪切,将组合物与至少一种具有磷脂酶活性的本发 明的多肽混合,以使磷脂底物与磷脂酶充分“接触”。具有磷脂酶活性的至少一种多肽 也可以存在于高剪切混合步骤中。该方法可以以任何规模实施,例如以包括约1克(g) 至约500、1000、2000、2500、5000g或更多,或该范围内的任何数量的规模实施。
【0088】本发明提供油脱胶(oil degumming)方法,包括以下步骤:(a)提供具 有磷脂酶活性的至少一种多肽,其中多肽包括本发明的氨基酸序列,或者多肽由本发 明的核酸序列编码;(b)提供包括植物油的组合物;和(c)在多肽可以切割植物油 中的酯键的条件下,将步骤(a)的多肽与步骤(b)的植物油接触,从而进行油的脱 胶。在一方面,植物油包括油籽。植物油可以包括米糠油(rice bran oil)、棕榈油、油 菜籽油、玉米油、大豆油、油菜油(canola oil)、芝麻油、花生油、或者葵花油。在 一方面,该方法进一步包括加入本发明的磷脂酶、其它磷脂酶或其组合。一方面,将 一种以上具有磷脂酶活性的多肽加入到该方法中,其中至少一种多肽是本发明的酶。 一方面,酶以特定顺序加入,例如,具有不同特性的PLC以特定顺序加入,例如具 有PC和PE活性的酶被首先加入(或者两种酶同时加入,一种具有PC活性,另一种 具有PE活性),然后加入具有PI PLC活性的酶,或其任意组合。
【0089】在油脱胶方法的一个方面,含油组合物包括植物、动物、藻类或鱼的油 或脂肪。植物油可以包括米糠油、大豆油、油菜籽油、玉米油、来自棕榈仁的油、油 菜油、向日葵油、芝麻油或花生油。多肽可以水解含油组合物中来自水合和/或非水 合磷脂的磷脂。一方面,多肽在甘油磷酯键处水解磷脂从而产生甘油二酯和水溶性磷 酸盐化合物。一方面,多肽具有磷脂酶C的活性。一方面,多肽是磷脂酶D,且也可 以加入磷酸酶。
【0090】在油脱胶方法的一个方面,接触步骤包括水解油中的水合磷脂。水解条 件可以包括碱性条件,例如一方面,该条件包括在碱性pH条件下约20℃至40℃的 温度。碱性条件可以包括约pH 8至pH 10,或更大的pH。在该方法的任何时刻,水 解条件都可以被变为碱性,例如一方面,在该条件变成碱性之前,加入磷脂酶诸如 PLC(例如,含酸诸如磷脂酸的油的“碱中和”)。
【0091】在油脱胶方法的一个方面,在PLC的作用下,碱将使1,2-DAG异构成 1,3-DAG,1,3-DAG的营养健康价值超过1,2-DAG,例如1,3-DAG作为能源被燃烧掉, 而不是作为脂肪储存起来(如1,2-DAG似的)。因此,本发明提供了碱性油精炼方法, 其中磷脂酶例如本发明的酶——包括PLC,“在前端”加入,即在加入任何酸和碱之前 加入,例如,如图13的示例性方法中所示。在本发明的碱性精炼方法的前端加入 PLC(参见下面进一步的论述)以及随后加入酸和碱的结果之一就是产生了提高水平的 1,3-DAG(不是1,2-DAG)。这可能是酸或碱催化的酰基转移的结果。从营养角度讲, 1,3-DAG胜于1,2-DAG。因此,本发明包括使用本发明的PLC进行的油脱胶方法, 因而最终的脱胶油产物含有不少于约0.5%、1.0%、2.0%、3.0%、4.0%或5.0%的 1,3-DAG。
【0092】在油脱胶方法的一个方面,水解条件可以包括反应时间约3至10分钟 或更多时间。水解条件可以包括在约50℃至60℃的温度下,在约pH 5至pH 6.5, 或约pH 5至pH 7.5,或约pH 5至pH 8.0的pH,水解油中的水合或非水合的磷脂, 反应时间是约30至60分钟。
【0093】在油脱胶方法的一个方面,多肽被结合到过滤器上,并使含磷脂的脂肪 或油通过过滤器。该多肽可以被加入到包括含磷脂脂肪或油的溶液中,然后使该溶液 通过过滤器。
【0094】在油脱胶方法的一个方面,该方法还包括通过物理的方法除去脱胶方法 产生的胶,这是通过加入硬化物质例如母或等同物进行的。一方面,这增加了油产 量。
【0095】本发明还提供将非水合磷脂转化成水合形式的磷脂的方法,包括以下步 骤:(a)提供具有磷脂酶活性的多肽,其中多肽包括本发明的氨基酸序列,或者多肽 由本发明的核酸编码;(b)提供包括非水合磷脂的组合物;和(c)在多肽能够切割 非水合磷脂中的酯键的条件下,将步骤(a)的多肽与步骤(b)的非水合磷脂接触, 从而将非水合磷脂转化为水合形式。
【0096】本发明提供使油脱胶的方法,包括以下步骤:(a)提供包括具有磷脂酶 活性的本发明的多肽,或者由本发明核酸编码的多肽的组合物;(b)提供包括含有磷 脂的脂肪或者油的组合物;(c)在多肽能够对含磷脂的组合物进行脱胶的条件下(在 本发明的多肽能够催化磷脂水解的条件下),将步骤(a)的多肽与步骤(b)的组合 物接触。在一方面,含油的组合物包括植物、动物、藻或者鱼的油。植物油可以包括 米糠油、大豆油、油菜籽油、玉米油、棕榈仁的油、油菜油、葵花子油、芝麻油或者 花生油。多肽可以水解含油组合物中水合和/或非水合磷脂中的磷脂。多肽可以在甘 油磷脂键处水解磷脂,产生甘油二酯和水溶性的磷酸盐化合物。多肽可以具有磷脂酶 C,B,A或者D的活性。在一方面,加入了磷脂酶D活性和磷酸酶活性。接触可以 包括油中的水合磷脂的水解。水解条件可以包括在碱性pH下,温度为大约20℃到 40℃。碱性条件可以包括大约pH 8到pH 10的pH。水解条件可以包括反应时间为3 到10分钟。水解条件可以包括在温度为大约50℃到60℃,pH大约为pH 5到pH 6.5, 反应时间为大约30到60分钟,水解油中水合的或者非水合的磷脂。多肽可以结合于 过滤器,并使含有磷脂的脂肪或者油通过过滤器。多肽可以加入到包含含磷脂的脂肪 或者油的溶液中,然后使溶液通过过滤器。
【0097】本发明提供将非水合的磷脂转化为水合形式的方法,包括以下的步骤: (a)提供包括具有本发明磷脂酶活性的多肽,或者由本发明的核酸序列编码的多肽 的组合物;(b)提供包括非水合的磷脂的组合物;和(c)在多肽将非水合磷脂转化 为水合形式的条件下,将步骤(a)的多肽与步骤(b)组合物接触。多肽可以具有磷 脂酶C的活性。多肽可以具有磷脂酶D的活性,并且也加入磷酸酶。
【0098】本发明提供碱法精炼含磷脂的组合物的方法,包括以下步骤:(a)提供 包含磷脂酶的组合物,磷脂酶可以是本发明的具有磷脂酶活性的多肽,或者由本发明 核酸编码的多肽;(b)提供包含磷脂的组合物;和(c)在碱法精炼之前,碱法精炼 期间或者之后,将步骤(a)的多肽与步骤(b)的组合物接触。多肽可以具有磷脂酶 活性,例如PLC、PLB、PLD和/或PLA活性。多肽可以在碱性精炼之前即在该方法 的“前端”,在加入酸或碱之前加入,如图13所示。
【0099】多肽(其可以是本发明的酶,例如PLC)可以在碱性精炼期间加入,并 根据磷水平和游离脂肪酸的水平,可以加入变化水平的酸或碱。多肽(其可以是本发 明的酶)可以在碱性精炼之前或之后加入:分离以前,在强力混合器(intense mixer) 或恒定混合器(retention mixer)中;加热步骤之后;在离心机中;在皂脚中;在洗涤 水中;和/或在漂白或除臭步骤中。该方法可以包括使用浓的碱溶液,例如浓度比11% 的工业标准更高,以降低胶的质量。在可选的方面,浓的碱溶液浓度在约12%至50% 之间,例如约20%、30%、40%、50%或60%或更浓。
【0100】含磷脂的组合物可以包括植物。多肽可以通过转基因的方式在该植物中 表达。具有磷脂酶活性的多肽可以在破碎种子或植物其它部分期间加入,或者具有磷 脂酶活性的多肽在破碎之后或精炼之前加入。
【0101】还提供了使用本发明的多肽水解油(例如植物油)中的磷脂,以产生二 酰甘油(DAG)和水溶性磷酸酯的碱法精炼方法。一方面,本发明的酶必须在碱法精炼 方法中,包括任选地低含量水和/或在约55℃至约70℃的温度范围内操作。在该温度 范围内,以低水含量条件使用碱法精炼方法,将通过增加DAG和减少夹带油(entrained oil)而使产量最大化。一方面,在本发明的碱法精炼方法中使用的酶对磷脂酰胆碱(PC) 和磷脂酰乙醇胺(PE)具有非常好的活性,在约pH 6至pH 9具有活性,在高达75℃下 具有活性,在油中的低含量水例如约2%至5%水中具有活性,例如由具有一个或多 个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、 D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、 D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或 Q265R的突变的SEQ ID NO:177或SEQ ID NO:178的序列编码的酶。
在本发明用于水解油中磷脂的碱法精炼方法的另一方面,使用了两种酶:PI-特 异性PLC(水解PI)和水解PC、PE及PA的PC-PLC。该实施方式产生适合于化学或物 理精炼的油,并使DAG的产量增加最大化,并减少夹带的油。
【0102】本发明提供纯化植物甾醇或者三萜的方法,包括以下的步骤:(a)提供 包括本发明的具有磷脂酶活性的多肽或者由本发明核酸编码的多肽的组合物;(b)提 供含有植物甾醇或者三萜的组合物;和(c)在多肽可以催化组合物中磷脂的水解的 条件下,将步骤(a)的多肽与步骤(b)的组合物接触。该多肽可以具有磷脂酶C的 活性。植物甾醇或者三萜可以包括植物甾醇(plant sterol)。该植物甾醇可以来源于植 物油。植物油可以包括米糠油、椰子油、油菜油、可可黄油、玉米油、籽油、亚麻 油、橄榄油、棕榈油、花生油、来自米糠的油、红花油、芝麻油、大豆油或者葵花油。 该方法可以包括应用非极性溶剂来定量地提取游离的植物甾醇和甾醇脂肪酸酯。植物 甾醇或者三萜可以包括β-谷甾醇、菜油甾醇、豆甾醇、豆甾烷醇、β-谷甾烷醇、谷甾 烷醇、链甾醇、海绵甾醇、多孔甾醇、穿贝海绵甾醇或者菜籽甾醇。
【0103】本发明提供精炼粗制油的方法,包括以下步骤:(a)提供包括本发明的 具有磷脂酶活性的多肽,或者由本发明核酸编码的多肽的组合物;(b)提供包括含磷 脂的油的组合物;和(c)在多肽催化组合物中的磷脂水解的条件下,将步骤(a)的 多肽与步骤(b)的组合物接触。该多肽可以具有磷脂酶C的活性。多肽可以在加入 到组合物的水溶液中具有磷脂酶活性。水的水平可以是在0.5到5%之间。处理时间 可以大约2小时以下,大约60分钟以下,大约30分钟以下,大约15分钟以下,或 者5分钟以下。水解条件可以包括温度范围在大约25℃到70℃之间。水解条件可以 包括使用苛性碱。可以使用碱的浓溶液,例如比11%的工业标准更浓的浓度,以减少 胶的质量。在可选的方面,碱的浓溶液是在约12%至50%之间的浓度,例如约20%、 30%、40%、50%或60%或更浓的浓度。
【0104】水解条件可以包括pH在大约pH 3到pH 10之间、在大约pH 4到pH 9 之间、或者在大约pH 5到pH 8之间。水解条件可以包括在接触步骤(c)后加入乳 化剂和/或进行混合。该方法可以包括加入乳化剂破乳剂(emulsifiers-breaker)和/或 加热或冷却(例如在约4℃至约-20℃之间,或更低温度),来促进水相的分离。该方 法可以包括在接触步骤前进行脱胶,通过离心收集卵磷脂,然后再加入PLC,PLC 和/或PLA以去除非水合的磷脂。该方法可以包括水脱胶粗制油至少于10ppm的磷以 获得食用油,以及接着物理精炼至少于大约50ppm的磷以获得生物柴油。该方法可 以包括加入酸来增强非水合磷脂的水合作用。一方面,加入酸来促进钙镁金属含量的 降低。
【0105】本发明提供了改善、处理或防止脂多糖(LPS)-介导的毒性的方法,该方 法包括给予患者包含本发明多肽的药物组合物。本发明提供了内毒素的解毒方法,包 括使内毒素与本发明的多肽接触。本发明提供了从类脂A上脱去2’或3’脂肪酸链的 脱酰基方法,包括将类脂A与本发明的多肽接触。
【0106】本发明提供了使用本发明的多肽来制造药物组合物——例如来制造用于 防止、处理或改善脂多糖(LPS)-介导的毒性的药物组合物,或用来解毒内毒素,或者 从类脂A上脱去2’或3’脂肪酸链的脱酰基。本发明提供用于内毒素的解毒的方法, 包括将内毒素与本发明的多肽接触。
【0107】本发明提供了精炼润滑剂的方法,包括以下步骤:(a)提供包括本发明 的酶的组合物;(b)提供润滑剂;和(c)在酶可以选择性地水解润滑剂中的油的条 件下,用酶处理润滑剂,从而精炼该润滑剂。该润滑剂可以是液压油。
【0108】本发明提供了处理织物的方法,包括下述步骤:(a)提供包括本发明的 酶的组合物;(b)提供织物;和(c)用该酶处理织物。织物的处理可以包括最终织 物的手感与悬垂的改善、染色、获得阻燃性、获得防水性、获得光学亮度或者获得树 脂整理。该织物可以包括棉、粘胶纤维、人造纤维、莱塞尔纤维(lyocell)、亚麻(flax)、 亚麻(linen)、苎麻、其所有的混合物,或者它们与聚酯、羊毛、聚酰胺丙烯酸或聚丙 烯酸的混合物。本发明提供了包含本发明的酶的织物、纱线或纤维。该酶可以被吸附, 吸收或固定在织物、纱或纤维的表面。
【0109】本发明提供了表达磷脂酶C方法,该方法包括提供具有Mut+表型的毕 赤酵母菌株;将异源的磷脂酶C-编码核酸插入毕赤酵母菌株;并将毕赤酵母菌株培 养在表达磷脂酶C的条件下。该方法还可以包括用锌补充培养条件。本发明也提供了 用于表达磷脂酶C的细胞体系,分离的细胞和细胞系,包括Mut+表型毕赤酵母菌株, 其含有可操作性地连接于毕赤酵母菌株中可以操作的启动子的异源的磷脂酶C-编码 核酸。
【0110】本发明提供了用于表达异源蛋白的耐zeocin的酵母细胞体系(例如酵母 细胞、细胞系、单细胞),包括步骤:提供含有能够表达异源蛋白的异源核酸的毕赤 酵母某种(Pichia sp.)(例如巴斯德毕赤酵母(P.pastoris))细胞;在含某一初始浓 度zeocin的条件下培养该细胞;挑选对初始浓度的zeocin有抗性的细胞,并在含有 较高浓度zeocin的条件下再培养;并挑选出步骤(C)中培养的耐较高浓度zeocin的 细胞。一方面,异源蛋白是酶,或任选地是磷脂酶,或任选地是磷脂酶C(PLC), 例如本发明的任何酶。
【0111】本发明提供制造生物燃料的方法,其包括:(A)(a)提供本发明的具有 磷脂酶,或者由本发明核酸(多核苷酸)编码的磷脂酶,或者由本发明的方法制造的 磷脂酶;(b)提供包括脂或烷基酯的生物质组合物;(c)将(a)的磷脂酶与(b)的 生物质组合物接触,以产生生物燃料或对脂或烷基酯进行酯交换;(B)(A)的方法, 其中所述生物燃料是或包括生物柴油;(C)(A)或(B)的方法,其中所述包括脂或 烷基酯的生物质组合物是或包括植物油和/或动物脂肪;(D)(A)至(C)的任何方 法,其中所述包括脂或烷基酯的生物质组合物是或包括藻类、植物油、直链植物油、 粗植物油(virgin vegetable oil)、废植物油(waste vegetable oil)、动物脂肪、动物脂 (grease)、牛脂(tallow)、猪脂(lard)或黄油(yellow grease);或(E)(A)至(D) 的任何方法,其中所述磷脂酶是或包括具有SEQ ID NO:1至SEQ ID NO:178的任何 一个所示的序列的多肽,或其任何组合。
【0112】本发明提供生物燃料:(a)其根据权利要求68所述的方法制备;(b) 其包括(i)本发明的磷脂酶,或由本发明的核酸(多核苷酸)编码的磷脂酶,或根 据本发明方法制备的磷脂酶。
【0113】本发明提供可溶性干酒糟(distillers dried soluble,DDS)、谷物干酒糟 (distillers dried grain,DDS)、可溶性浓缩酒糟(a condensed distillers soluble,CDS)、 谷物湿酒糟(a distillers wet grain,DWG)或含可溶物的谷物干酒糟(distillers dried grain with solubles,DDGS):其包括(i)具有SEQ ID NO:1至SEQ ID NO:178任何一个所 示序列的所述磷脂酶,或其任何组合,或(ii)本发明的磷脂酶,或由本发明的核酸 (多核苷酸)编码的磷脂酶,或本发明方法制备的磷脂酶。
【0114】本发明提供生物质,包括:(a)(i)具有SEQ ID NO:1至SEQ ID NO:178 任何一个所示序列的磷脂酶,或其任何组合,或(ii)本发明的磷脂酶,或由本发明 的核酸(多核苷酸)编码的磷脂酶,或本发明方法制备的磷脂酶;或(b)(a)的生 物质,其中所述生物质是或包括动物、藻类和/或植物生物质,或含脂类的生物质或 木质纤维生物质,或者废物材料;(c)(a)的生物质,其中所述生物质是或包括生物 乙醇、生物丙醇、生物丁醇、生物丙醇或生物甲醇或其任何组合。
【0115】本发明提供基于石油的产品,其包括:(a)(i)具有SEQ ID NO:1至SEQ ID NO:178任何一个所示的序列的磷脂酶,或其任何组合,或(ii)本发明的磷脂酶, 或由本发明的核酸(多核苷酸)编码的磷脂酶,或本发明方法制备的磷脂酶;或(b) (a)的基于石油的产品,其包括油、生物柴油或汽油、或生物乙醇、生物丙醇、生 物丁醇、生物丙醇或生物甲醇;或者生物乙醇、生物丙醇、生物丁醇、生物丙醇或生 物甲醇和/或生物柴油或汽油的混合物。
【0116】本发明的一个或者多个实施方式的细节在附图和以下的说明书中进行阐 明。本发明的其它特征、目标以及优势将通过阅读说明书和附图以及权利要求得变得 显而易见。
【0117】出于各种目的,本文所引用的所有出版物、专利、专利申请、GenBank 序列以及美国典型培养物保藏中心(ATCC)保藏物,通过引用特意并入本文。
附图简述
【0118】下图是本发明的实施方式的示例性说明,并非为了限制权利要求所包含 的发明范围。
【0119】图1是计算机系统的框图,具体细节如下所述。
【0120】图2是图解过程200的一个方面的流程图,为确定新序列与数据库中序 列间的同源性水平,将新的核苷酸或蛋白质序列与序列数据库相比较,具体细节如下 所述。
【0121】图3是图解在计算机中确定两个序列是否是同源的过程的一种实施方式 的流程图,具体细节如下所述。
【0122】图4是图解鉴定器过程的一个方面的流程图,该鉴定器过程用于检测 序列中特征的存在与否,具体细节如下所述。
【0123】图5A、5B和5C示意性说明用于模拟PLC-介导的脱胶的典型两相系统, 具体细节如下文实施例2中所述。
【0124】图6示意性说明了应用本发明磷脂酶的示例性植物油精炼过程。
【0125】图7示意性说明了用于物理精炼油的本发明的示例性脱胶过程,具体细 节如下所述。
【0126】图8示意性说明了用本发明的磷脂酶C进行的磷脂水解,具体细节如下 所述。
【0127】图9示意性说明了本发明的示例性碱炼方法,并图解了用本发明的磷脂 酶C作为“碱炼助剂”(长混合碱炼,Long Mix Caustic Refining)的一个可选择的实施 方式,具体细节如下所述。
【0128】图10示意性说明了应用本发明的磷脂酶C作为脱胶助剂,具体细节如 下所述。
【0129】图11是描述本发明的示例性核酸和多肽的选择特征的表,如在下面所 进一步详细描述的。
【0130】图12示意性说明了来自本发明的两个酶系统的数据,如在下面实施例 3中所述。
【0131】图13示意性说明了本发明的示例性碱炼方法,并图解了一个可选的实 施方式,包括应用本发明的磷脂酶C作为“碱炼助剂”(长混合碱炼),如下面所详细描 述的。
【0132】图14图解了本发明方法的另一种变化,其中在方法中使用了两个离心 步骤,如下面所详细描述的。
【0133】图15说明了本发明方法的另一种变化,其中在方法中使用了三个离心 步骤,如下面所详细描述的。
【0134】图16示出了本方法的另一种示例性变化,其使用酸处理并在脱胶步骤 前有离心步骤,如下面所详细描述的。
【0135】图17图解了体外消化实验的结果,其中本发明的磷脂酶C变体,如下 面实施例4中所详细描述的。
【0136】图18图解了使用本发明的示例性酶进行的分批发酵罐培养的结果,如 下面实施例5中所详细描述的。
【0137】图19图解了本发明的巴斯德毕赤酵母MutS菌株培养物的氧吸收速率 (Oxygen Uptake Rate,“OUR”)比较结果,如下面实施例5中所详细描述的。
【0138】图20图解了本发明的巴斯德毕赤酵母MutS菌株的甲醇消耗图比较, 如下面实施例5中所详细描述的。
【0139】图21图解了本发明SEQ ID NO:2的示例性PLC酶的重组形式的培养物 的“OUR”图,如下面实施例5中所详细描述的。
【0140】图22图解了SDS-PAGE的结果,显示了在培养物中产生的PLC蛋白的 质量,及与之相对应的本发明SEQ ID NO:2的示例性PLC酶的重组形式的培养物的 “OUR”图,如下面实施例5中所详细描述的。
【0141】图23说明了SDS-PAGE的结果,显示了活性PLC的数量,该活性PLC 位于本发明SEQ ID NO:2的示例性PLC酶的重组形式的培养物的细胞内,如下面实 施例5中所详细描述的。
【0142】图24说明了与活性PLC——本发明SEQ ID NO:2的示例性PLC酶的重 组形式相关的酵母细胞形态学变化的可视化图,如下面实施例5中所详细描述的。
【0143】图25用图概述了数据,显示了在95h TFT(总发酵时间),在毕赤酵母 中使用本发明SEQ ID NO:2的示例性PLC酶进行的PLC生产性能的状态,如下面实 施例5中所详细描述的。
【0144】图26是数据简表,这些数据来自对本发明的示例性zeocin-适应的细胞 菌落的表达筛选,如下面实施例5中所详细描述的。
【0145】图27说明了数据,这些数据显示:在含有本发明的示例性zeocin-适应 的细胞菌落的培养物中,PLC蛋白水平是较高的,如下面实施例5中详细描述地。
【0146】图28说明了数据,这些数据显示了本发明的zeocin-适应的菌落与对照 的生长比较,如下面实施例5中所详细描述的。
【0147】图29说明了加热实验的结果,显示了本发明SEQ ID NO:2的示例性酶 的热稳定性,图中指出了实验条件,如下面实施例6中所详细描述的。
【0148】图30说明了总结加热实验的NMR数据,证明了本发明SEQ ID NO:2 的示例性酶的热稳定性,如下面实施例6中所详细描述的。
【0149】图31、32和33说明了数据,使用p-NPPC,这些数据证明了SEQ ID NO:2 的热稳定性,实验条件为图中所示的条件,如下面实施例6中所详细描述的。
【0150】图34说明了数据,使用DSC分析,这些数据证明了SEQ ID NO:2的热 稳定性,如下面实施例6中所详细描述的。
【0151】图35说明了在用本发明突变体磷脂酶处理后,单独磷脂(PL)种类(PA、 PE、PI和PC)相对于剩余的总PL的重量分数。
【0152】图36说明了选择包含在基因重装配文库(GeneReassembly Library)中 的GSSM高表达突变型(upmutant),其包括本发明示例性的磷脂酶。
【0153】图37说明了示例性的醇方法,其可包括本发明酶的使用。
【0154】在不同的附图中同样的标记符号表示同样的要素。
发明详述
【0155】本发明提供了磷脂酶,如,具有磷脂酶A、B、C和D、patatin、磷脂 酸磷酸酶(PAP)和/或脂酰水解酶(LAH)或等同活性的多肽,编码它们的核酸,以 及制备和应用它们的方法。本发明提供了有效地切割油,如植物油,例如油籽磷脂中 的甘油磷酸酯键,产生水可提取的磷酸化的碱和甘油二酯的酶。一方面,本发明的磷 脂酶具有脂酰水解酶(LAH)的活性。在可选的方面,本发明的磷脂酶可以切割磷脂 酰胆碱(PC)、磷脂酰乙醇胺(PE)、磷脂酰丝氨酸(PS)、磷脂酰肌醇(PI)、磷脂酸 和/或鞘磷脂或它们的组合中的甘油磷酸酯键。例如,一方面,本发明的磷脂酶对一 种或多种特定的底物具有特异性,例如本发明的酶可以对PE和PC;PE和PI;PE和 PS;PS和PE;PS和PI;PI和PE;PS、PI和PC;PE、PI和PC;或PE、PS、PI 和PC具有特异性作用。
【0156】本发明的磷脂酶(如,具有磷脂酶A、B、C和D、patatin、磷脂酸磷 酸酶(PAP)和/或脂酰水解酶(LAH)或等同活性的多肽)可以用于植物油的酶法脱胶, 这是因为磷酸部分可溶于水,并且容易去除。甘油二酯产物将仍存留在油中,从而降 低损失。在商业油脱胶中,诸如方法中,本发明的PLC可以用于加入 到PLA1和PLA2或者替换PLA1和PLA2,其中磷脂是由PLA1和PLA2水解的。
【0157】在一方面,本发明的磷脂酶在高温和/或低温下,或者在较宽的温度范 围内,具有活性,例如,它们可以在20℃到90℃,30℃到80℃,或者在40℃到70℃ 的温度范围内具有活性。本发明也提供在碱性pH或者酸性pH下,例如低的水酸度 具有活性的本发明的磷脂酶。可选择的方面,本发明的磷脂酶可以在酸性pH低至 pH6.5、pH6.0、pH5.5、pH5.0、pH4.5、pH4.0、和pH3.5或酸性更大(即pH<3.5)的 条件下具有活性。在可选的方面,本发明的磷脂酶可以在碱性pH高至pH7.5、pH8.0、 pH8.5、pH9.0、pH9.5、pH10或碱性更大(即pH>10)的条件下具有活性。一方面, 本发明的磷脂酶在低水活度(低的水含量)条件下,在约40到约70℃、75℃或80℃ 或更大温度的温度范围内具有活性。
【0158】本发明也提供了进一步修饰本发明的示例性磷脂酶,以便产生具有期望 特性的酶的方法。例如,由本发明方法产生的磷脂酶可以具有改变的底物特异性、底 物结合特异性、底物切割形式、热稳定性、pH/活性曲线、pH/稳定性曲线(如在低 pH值,例如pH<6或者pH<5,或者高的pH值,如pH>9的情况下热稳定性提高)、 对于氧化作用的稳定性、Ca2+的依赖性、比活性和类似特性。本发明提供对于任何感 兴趣特性的改变。例如,这些改变可以产生与亲本磷脂酶相比,具有改变的pH和温 度活性曲线的变体。
【0159】在一方面,本发明的磷脂酶被用于各种植物油处理步骤中,如植物油提 取中,特别地,用于在称为“油脱胶”的过程中去除“磷脂胶”,如在此所述。本发明提 供了组合物(例如包含本发明酶的组合物)和由各种来源生产植物油的方法,所述各 种来源如米糠、大豆、油菜、花生、芝麻、向日葵和玉米。本发明的磷脂酶可以在任 何植物油加工步骤中用于替代PLA,例如磷脂酶A2。
【0160】术语“磷脂酶”包括具有任何磷脂酶活性的酶,例如,切割油中,如植物 油中的甘油磷酸酯键(催化水解甘油磷酸酯键)。本发明的磷脂酶活性可以产生水可 提取的磷酸化的碱以及甘油二酯。本发明的磷脂酶活性也包括在高温、低温、碱性 pH和酸性pH条件下水解甘油磷酸酯键。术语“磷脂酶活性”也包括切割甘油磷酸酯, 产生水可提取的磷酸化的碱以及甘油二酯。术语“磷脂酶活性”也包括切割磷脂中甘油 和磷酸的酯键。术语“磷脂酶活性”也包括其它的活性,如结合并水解底物,如油,例 如植物油的能力,底物也包括植物和动物的卵磷脂、磷脂酰乙醇胺、磷脂酰丝氨酸和 鞘磷脂。磷脂酶活性可以包括磷脂酶C(PLC)的活性;磷脂酶A(PLA)的活性, 如磷脂酶A1或者磷脂酶A2的活性;磷脂酶B(PLB)活性,如磷脂酶B1或者磷脂 酶B2的活性,包括溶血磷脂酶(LPL)活性和/或溶血磷脂酶-转酰基酶(LPTA)活性;磷 脂酶D(PLD)的活性,如磷脂酶D1或者磷脂酶D2的活性;和/或patatin活性或它 们的任何组合。磷脂酶活性可以包括水解糖蛋白,如马铃薯块茎中或者任何茄属 (Solanum)植物,如马铃薯(Solanum tuberosum)中的糖蛋白。磷脂酶活性可以包 括patatin酶活性,如patatin酯酶活性(见,例如,Jimenez(2002)Biotechnol.Prog. 18:635-640)。磷脂酶活性可以包括脂酰水解酶(LAH)活性。磷脂酶活性可以包括对 一种或多种特定的底物具有特异性,例如本发明的酶可以对PE和PC;PE和PI;PE 和PS;PS和PE;PS和PI;PI和PE;PS、PI和PC;PE、PI和PC;或PE、PS、 PI和PC,或它们的任何组合具有特异性作用。
【0161】一方面,本发明的磷脂酶可以具有多功能活性,例如一种或多种本文中 描述的酶活性的组合。例如,一方面,本发明的多肽具有酶活性,但是缺少脂酶活性, 或缺少影响中性油(甘油三脂)部分的任何酶活性。在特定的方法中,例如在脱胶方法 中使用这样的多肽可能是有利的,在脱胶方法中,中性油部分不受损害(减少、降解 例如水解)是重要的。因此,一方面,本发明提供了脱胶方法,该方法包括使用具有 磷脂酶活性但是缺少脂酶活性的本发明的多肽。
【0162】一方面,本发明的PLC磷脂酶利用(例如催化水解)各种磷脂底物, 包括磷脂酰胆碱(PC)、磷脂酰乙醇胺(PE)、磷脂酰丝氨酸(PS)、磷脂酰肌醇(PI)和/或 磷脂酸或它们的组合。此外,这些酶对溶血磷脂形式的这些磷脂具有不同程度的活性。 在不同的方面,本发明的PLC酶可以对磷脂酰胆碱和磷脂酰乙醇胺底物显示出优选 性。
【0163】一方面,本发明的磷脂酰肌醇PLC磷脂酶利用各种磷脂底物,包括磷 脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰肌醇和磷脂酸或它们的组合。此外, 这些酶可以对溶血磷脂形式的这些磷脂具有不同程度的活性。在不同的方面,本发明 的磷脂酰肌醇PLC酶可以对磷脂酰肌醇底物显示出优选性。
【0164】一方面,本发明的patatin酶利用各种磷脂底物,包括磷脂酰胆碱、磷 脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰肌醇和磷脂酸或它们的组合。此外,这些酶可以 对溶血磷脂形式的这些磷脂具有不同程度的活性。在不同的方面,本发明的patatin 酶可以基于氨基序列相似性的保守性。在不同的方面,这些酶展示出多组不同的生物 化学活性,并可以发挥PLA1、PLA2、PLC或PLD酶类的反应特征。
【0165】一方面,本发明的PLD磷脂酶利用各种磷脂底物,包括磷脂酰胆碱、 磷脂酰乙醇胺、磷脂酰丝氨酸、磷脂酰肌醇和磷脂酸或它们的组合。此外,这些酶可 以对溶血磷脂形式的这些磷脂具有不同程度的活性。一方面,这些酶可用于进行酯交 换反应,以产生有结构的磷脂。
【0166】如在此所用的,术语“阵列(array)”或者“微阵列(microarray)”或者“生 物芯片(biochip)”或者“芯片(chip)”是许多靶元素,每一个靶元素包括确定量的一 个或者多个多肽(包括抗体)或者固定于底物表面的确定区域上的核酸,如下面进一 步详细讨论的。
【0167】如在此所用的,术语“计算机”,“计算机程序”和“处理器”以其最广义的 一般语境使用,并整合所有这样的设备,如以下详细描述的。
【0168】特定的多肽或者蛋白的“编码序列”或者“编码特定的多肽或者蛋白的序 列”,是指当置于合适的调控序列的控制下时可以转录和翻译成多肽或者蛋白的核酸 序列。
【0169】在此使用的术语“表达盒(expression cassette)”是指在宿主中可以影响 结构基因(即,编码蛋白质,如本发明的磷脂酶的序列)表达的核苷酸序列,所述宿 主与所述序列相容。表达盒包括至少一个与编码多肽的序列可操作地连接的启动子; 并且,任选地,与其它的序列例如转录终止信号可操作地连接。也可以应用进行表达 所必要的或有帮助的额外的因子,例如增强子。如在此所应用的“可操作地连接 (operably linked)”是指连接DNA序列上游的启动子,这样该启动子能够介导该DNA 序列的转录。因此,表达盒也包括质粒、表达载体、重组病毒、任何形式的重组的“裸 露DNA”载体,和类似物。“载体”包括可以感染、转染、瞬间或者永久转导细胞的核 酸。将被认识到,载体可以是裸露的核酸,或者与蛋白或者脂类复合的核酸。载体任 选地包括病毒或者细菌的核酸和/或蛋白,和/或膜(如,细胞膜,病毒的脂包膜,等 等)。载体包括,但不限于复制子(如,RNA复制子,细菌噬菌体),DNA片段可以 与其连接,并被复制。载体因此包括,但不限于是RNA,自主复制的环状或者线性 的DNA或者RNA(如质粒、病毒以及类似物,参见,如美国专利第5,217,879号), 并且也包括表达质粒和非表达质粒。当重组微生物或者细胞培养物被描述为容纳“表 达载体”时,其包括染色体外的环状和线性DNA,和已经整合进入宿主染色体的DNA。 当载体由宿主细胞维持时,该载体可以在细胞有丝分裂期间作为自主结构由细胞稳定 地复制,或者整合入宿主基因组中。
【0170】“质粒”命名为在大写字母和/或数字之前和/或之后加上小写字母“p”。在 此使用的起始质粒(starting plasmid)可以通过商业渠道获得,通过公共渠道自由获 得,或者按照公开的程序从可利用的质粒构建得到。此外,与那些在此描述的质粒等 价的质粒是在本领域是已知的,并且对普通技术人员而言是显而易见的。
【0171】术语“基因”是指参与产生多肽链的DNA片段,包括在编码区的前面和 后面的区域,如头部和尾部,启动子和增强子,以及适当情况下,单个编码片段(外 显子)之间的插入序列(内含子),等等。
【0172】如本文所用,短语“核酸”或者“核酸序列”是指寡核苷酸、核苷酸、多核 苷酸、或者是指它们中的任何之一的片段,是指基因组或者合成来源的DNA或者RNA (如,mRNA、rRNA、tRNA、iRNA),其可以是单链的或者双链的,并且可以代表 有义链或者无义链,是指肽核酸(PNA),或者是指任何DNA样或者RNA样的物质, 天然的或者合成来源的,包括如iRNA,核糖核蛋白(如双链iRNA,如iRNPs)。该 术语包括核酸,即,寡核苷酸,包括天然核苷酸的已知类似物。该术语也包括具有合 成骨架的核酸样结构,参见如Mata(1997)Toxicol.Appl.Pharmacol.144:189-197; Strauss-Soukup(1997)Biochemistry 36:8692-8698;Samstag(1996)Antisense Nucleic Acid Drug Dev 6:153-156。
【0173】如本文所用,“氨基酸”或者“氨基酸序列”是指寡肽、肽、多肽或者蛋白 序列,或者是指这些序列中的任何序列的片段、部分或亚基,并且是指天然产生的或 者合成的分子。
【0174】如本文所用,术语“多肽”和“蛋白”是指通过肽键或者修饰的肽键相互连 接在一起的氨基酸,即,肽等排体(peptide isosteres),可以含有除了20个基因编码的 氨基酸外的修饰氨基酸。术语“多肽”也指肽或者多肽片段,基序和类似物。该术语也 包括糖基化的多肽。本发明的肽或者多肽也包括所有“模拟”和“肽模拟”形式,正如下 面进一步详细描述的。
【0175】如本文所用,术语“分离的”是指从原始的环境(例如天然环境,如果该 环境是天然存在的话)中移取的物质。例如,存在于活动物中的天然发生的多核苷酸 或者多肽不是分离的,但是,如果该同样的多核苷酸或者多肽,与天然系统中的一些 或者所有的共存物分离,那么就是分离的。这样的多核苷酸可以是载体的一部分和/ 或这样的多核苷酸或者多肽可以是组合物的一部分,并且仍然是分离,这是因为这样 的载体或者组合物不是其天然环境的一部分。如本文所用,分离的物质或者组合物也 可以是“纯化”的组合物,即,它并不需要绝对的纯度;相反,这意味着是一个相对定 义。从文库中得到的单个核酸可以经过常规纯化为具有电泳均一性。在可选择的方面, 本发明提供从基因组DNA或者从文库中的其它序列中或者其它的环境中以至少一 个、两个、三个、四个、五个或者更多数量级纯化得到的核酸。
【0176】如本文所用,术语“重组子”是邻接于“骨架”核酸的核酸,而在天然环境 下它们并不邻接。在一方面,核酸代表了核酸“骨架分子”群体中5%或者更多数目的 核酸插入物。本发明的“骨架分子”包括核酸,如表达载体、自主复制核酸、病毒、整 合性核酸,和用于维持或者操作感兴趣的核酸插入物的其它的载体或者核酸。在一方 面,富集的核酸代表了重组骨架分子群体中的15%、20%、30%、40%、50%、60 %、70%、80%、90%或者更多数目的核酸插入物。“重组”多肽或者蛋白是指由重组 DNA技术产生的多肽或者蛋白,如,从用编码所需多肽或者蛋白的外源DNA构建物 转化的细胞产生。“合成的”多肽或者蛋白是那些通过化学合成制备的多肽或者蛋白, 如下面进一步详细描述地。
【0177】如下面进一步讨论地,当在启动子处启动转录的RNA聚合酶将编码序 列转录成为mRNA时,启动子序列被“可操作地连接于”编码序列。
【0178】“寡核苷酸”是指单链多聚脱氧核苷酸或者可以被化学合成的两个互补的 多聚脱氧核苷酸链。这样的合成的寡核苷酸没有5’磷酸,因此如果不在存在激酶的情 况下采用ATP添加磷酸,该合成寡核苷酸便不会连接到另一个寡核苷酸上。合成的寡 核苷酸可以连接到没有被去磷酸化的片段上。
【0179】在两个核酸或者多肽的上下文中,短语“实质上相同(substantially identical)”,是指当比较和比对最大对应性(correspondence)时,具有至少50%、 60%、70%、75%、80%、85%、90%、95%、98%或者99%的核苷酸或者氨基酸 残基(序列)的同一性的两个或者多个序列,所述最大对应性用一个任何已知的序列 比较算法测量,如以下详细讨论的,或者通过目测的方法测量。在可选的方面,本发 明提供与本发明的示例性序列,例如具有一个或多个编码E41A、E41W、E41F、E41Y、 E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、 Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、 D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQ ID NO:175或SEQ ID NO:176等等,在核酸或者多肽的至少大约100个残基、150个残基、200个残基、 300个残基、400个残基或者从约50个残基到全长的区域范围内,具有实质上同一性 的核酸和多肽序列。本发明的核酸序列可以在多肽编码区域的整个长度上实质一致。
【0180】另外,“实质上相同”的氨基酸序列是与参考序列差异一个或者多个保守 性或者非保守性氨基酸置换、缺失或者插入的序列,特别地,当这样的置换发生在分 子的非活性位点的位置上,并且前提是多肽基本上保留其功能特性。保守氨基酸置换, 例如,用一个氨基酸置换另一个同类的氨基酸(如,将一个疏水性氨基酸,如异亮氨 酸、缬氨酸、亮氨酸或者甲硫氨酸置换为另一个疏水性氨基酸,或者将一个极性氨基 酸置换为另一个极性氨基酸,诸如用精氨酸置换赖氨酸,用谷氨酸置换天冬氨酸,或 者用谷酰胺置换天冬酰胺)。可以缺失一个或者多个氨基酸,例如,从磷脂酶多肽中 缺失一个或者多个氨基酸,从而对多肽结构进行修饰,而并不显著改变其生物活性。 例如,可以去除对于磷脂酶的生物活性并不需要的氨基或者羧基端氨基酸。可以通过 很多方法中的任何方法分析本发明修饰的多肽序列的磷脂酶生物活性,包括将修饰的 多肽序列与磷脂酶底物接触,并且确定是否修饰的多肽减少了分析中的特异底物的量 或者增加了功能性磷脂酶与底物的酶促反应的生物产物的量,如下面进一步论述地。
【0181】“杂交”是指通过碱基配对,核酸链与互补链结合的过程。杂交反应可能 是敏感的并且具有选择性,这样可以鉴定在样品中以低浓度存在的感兴趣的特定的序 列。合适的严格条件可以通过例如,预杂交和杂交溶液中的盐和甲酰胺浓度,或者杂 交温度来确定,并且在本领域是熟知的。例如,严格性可以通过降低盐浓度,增加甲 酰胺的浓度,或者提高杂交温度,改变杂交时间而增加,如下面所详细描述地。在可 选的方面,本发明的核酸通过它们在各种严格条件下(如,高、中和低严格条件)的 杂交能力来定义,如在此所阐明地。
【0182】术语“变体”是指在一个或者多个碱基对、密码子、内含子、外显子、或 者氨基酸残基(分别地)被修饰,但仍保持本发明的磷脂酶生物活性的本发明的多核 苷酸或者多肽。变体可以通过很多种方法中的任何方法产生,例如易错PCR、重排、 寡核苷酸定向诱变、装配PCR、有性PCR诱变、体外诱变、盒式诱变、递归整体诱 变、指数整体诱变、定点诱变、基因重装配、GSSM和它们的任何组合。在此包括了 产生在一定的pH或温度下具有活性的变体磷脂酶,例如不同于野生型磷脂酶的变体 磷脂酶的技术。
【0183】术语“饱和诱变”、基因位点饱和诱变TM(GSSM)或者“GSSM”,包括 应用简并性寡核苷酸引物将点突变引入多核苷酸中的方法,如下详细描述地。
【0184】术语“优化的定向进化系统”或者“优化的定向进化”包括对相关核酸序 列,例如相关基因的片段重新进行装配的方法,并在下面进行了详细解释。
【0185】术语“合成连接重装配”或者“SLR”包括以非随机的方式连接寡核苷酸片 段的方法,并在下面进行了详细解释。
核酸的产生和操作
【0186】本发明提供分离的和重组的核酸(例如具有一个或多个编码E41A、 E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、 A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、 M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的 突变的示例性SEQ ID NO:177或SEQ ID NO:178),包括编码本发明的多肽和磷脂酶 的表达盒,如表达载体。本发明也包括应用本发明的核酸发现新的磷脂酶序列的方法。 也提供用于修饰本发明核酸的方法,例如通过合成连接重装配、优化的定向进化系统 和/或饱和诱变。
【0187】通过,例如克隆和表达cDNA文库,通过PCR扩增信使或者基因组DNA, 和类似方法,可以制备、合成和/或操作本发明的核酸。在实践本发明的方法中,通 过操作模板核酸,可以修饰同源基因,如本文所述的。可以与本领域已知的其它任何 方法或者方案或者装置结合来实践本发明,这些方法或者方案或者装置在科学和专利 文献中得到充分描述。
一般技术
【0188】用于实践本发明的核酸,不管是RNA、iRNA、反义核酸、cDNA、基 因组DNA、载体、病毒或者它们的杂合体,都可以从不同的来源分离、进行遗传工 程改造、扩增和/或表达/重组产生。从这些核酸产生的重组多肽可以单独分离或者克 隆,并且检测所需的活性。可以应用任何重组表达系统,包括细菌、哺乳动物、酵母、 昆虫或者植物细胞表达系统。
【0189】可选地,这些核酸可以通过已知的化学合成技术在体外合成,如在例如 Adams(1983)J.Am.Chem,Soc.105:661;Belousov(1997)Nucleic Acids Res. 25:3440-3444;Frenkel(1995)Free Radic.Biol.Med.19:373-380;Blommers(1994) Biochemistry 33:7886-7896;Narang(1979)Meth.Enzymol.68:90;Brown(1979)Meth. Enzymol.68:109;Beaucage(1981)Tetra.Lett.22:1859;美国专利4,458,066中描述 的。
【0190】用于操纵核酸的技术,例如亚克隆、标记探针(例如使用Klenow聚合 酶的随机引物标记、切口平移、扩增)、测序、杂交以及类似的技术在科学和专利文 献中有充分的描述,例如参见Sambrook编著,MOLECULAR CLONING:A LABORATORY MANUAL(2ND ED.),1-3卷,Cold Spring Harbor Laboratory,(1989); CURRENT PROTOCOLS IN MOLECULAR BIOLOGY,Ausubel编著,John Wiley & Sons,Inc.,New York(1997);LABORATORY TECHNIQUES IN BIOCHEMISTRYAND MOLECULAR BIOLOGY:HYBRIDIZATION WITH NUCLEIC ACID PROBES,Part I. Theory and Nucleic Acid Preparation,Tijssen,ed.Elsevier,N.Y.(1993)。
【0191】获得和操纵用于实践本发明的方法的核酸的另一个有用方法是从基因组 样品中克隆,并且如果期望的话,筛选和再克隆插入物,插入物可以分离或扩增自例 如基因组克隆或cDNA克隆。用于本发明的方法中的核酸的来源包括基因组或cDNA 文库,所述文库可以包含在例如哺乳动物人工染色体(MACs),例如参见美国专利 5,721,118;6,025,155;人类人工染色体,例如参见Rosenfeld(1997)Nat.Genet.15: 333-335;酵母人工染色体(YAC);细菌人工染色体(BAC);P1人工染色体,例如 参见Woon(1998)Genomics 50:306-316;P1来源的载体(PACs),例如参见Kern (1997)Biotechniques 23:120-124;粘粒、重组病毒、噬菌体或质粒中。
【0192】在一方面,编码本发明的多肽的核酸与能指导翻译出的多肽或其片段的 分泌的前导序列以适当的位置关系进行装配。
【0193】本发明提供了融合蛋白和编码这些融合蛋白的核酸。本发明的多肽可以 被融合到异源肽或多肽上,如N-末端鉴定肽,其给予了期望的特性,如增加的稳定性 或简化的纯化特性。本发明的肽和多肽也可以作为融合蛋白被合成和表达,其中所述融 合蛋白中连接有一个或多个额外的结构域,例如用于产生免疫原性更强的肽、以便更易 于分离重组合成的肽、以便鉴定和分离抗体和表达抗体的B细胞,等等。有利于检测 和纯化的结构域包括,例如金属螯合肽,如多组氨酸标记和组氨酸-色氨酸模块,其允 许在固定的金属上纯化,还包括蛋白A结构域,其允许在固定的免疫球蛋白上纯化, 还包括在FLAGS延伸/亲和纯化系统中所使用的结构域(Immunex Corp,Seattle WA)。 在纯化结构域和含有基序的肽或多肽之间包含可切裂的连接子序列有助于纯化,这样的 连接子序列例如Xa因子或肠激酶(Invitrogen,San Diego CA)。例如,表达载体可以 包括编码表位的核酸序列,其连接到六组氨酸残基上,还连接有硫氧还蛋白和肠激酶切 割位点(例如参见Williams(1995)Biochemistry 34:1787-1797;Dobeli(1998)Protein Expr.Purif.12:404-414)。组氨酸残基有助于检测和纯化,而肠激酶切割位点提供了从 融合蛋白的剩余部分纯化表位的手段。关于编码融合蛋白的载体的技术以及融合蛋白的 应用在科学和专利文献中进行了充分的描述,例如参见Kroll(1993)DNA Cell.Biol., 12:441-53。
转录和翻译控制序列
【0194】本发明提供了可操作地连接到一个或多个表达(例如转录或翻译)控制 序列上的本发明的核酸(例如DNA)序列,所述控制序列例如启动子或增强子,它 们指导或调节RNA合成/表达。表达控制序列可以在表达载体中。示例性的细菌启动 子包括lacI、lacZ、T3、T7、gpt、λPR、PL和trp。示例性的真核启动子包括CMV 即时早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、来自逆转录病毒 的LTR启动子以及鼠金属硫蛋白I启动子。
【0195】适合于在细菌中表达多肽的启动子包括大肠杆菌(E.coli)lac或trp启动子、 lacI启动子、lacZ启动子、T3启动子、T7启动子、gpt启动子、λPR启动子和λPL 启动子、来自编码糖酵解酶如3-磷酸甘油酯激酶(PGK)的操纵子的启动子以及酸性 磷酸酶启动子。真核启动子包括CMV即时早期启动子、HSV胸苷激酶启动子、热激 启动子、早期和晚期SV40启动子、来自逆转录病毒的LTRs、以及小鼠金属硫蛋白-I 启动子。也可以使用已知在原核或真核细胞或它们的病毒中控制基因表达的其它启动 子。
表达载体和克隆载体
【0196】本发明提供包括本发明的核酸,如,编码本发明的磷脂酶的序列的表达 载体和克隆载体。本发明的表达载体和克隆载体可以包括病毒颗粒、杆状病毒、噬菌 体、质粒、噬菌粒、粘粒、fos-质粒(fosmids)、细菌人工染色体、病毒DNA(如, 牛痘、腺病毒、禽痘病毒、伪狂犬病病毒和SV40衍生物),以P1为基础的人工染色 体、酵母质粒、酵母人工染色体以及对感兴趣的特定宿主(如杆菌属(Bacillus)、曲 霉属(Aspergillus)和酵母)特异的任何其它载体。本发明的载体可以包括染色体的, 非染色体的和合成的DNA序列。很多合适的载体为本领域技术人员所知的,并且可 以商业获得。典型的载体包括:细菌的:pQE载体(Qiagen)、pBluescript质粒、pNH 载体、(λ-ZAP载体(Stratagene);ptrc99a、pKK223-3、pDR540、pRIT2T(Pharmacia); 真核的:PXT1、pSG5(Stratagene)、pSVK3、pBPV、pMSG、pSVLSV40(Pharmacia)。 然而,也可以应用任何其它的质粒或其它的载体,只要它们可以在宿主中复制并且可 存活。可以在本发明中使用低拷贝数或高拷贝数的载体。
【0197】表达载体可以包括启动子、用于起始翻译的核糖体结合位点和转录终止 子。载体也可以包括用于扩增表达的合适序列。哺乳动物表达载体可以包括复制起点、 任何必需的核糖体结合位点、聚腺苷酸化位点、剪接供体和受体位点、转录终止序列、 5’侧翼非转录序列。在一些方面,衍生于SV40剪接子和聚腺苷酸化位点的DNA序 列可以用于提供所需要的非转录遗传元件。
【0198】在一个方面,表达载体含有一个或多个选择性标记基因,使得可以对含 有该载体的宿主细胞进行选择。这样的选择性标记包括编码二氢叶酸还原酶的基因或 使得真核细胞培养物具有新霉素抗性的基因、使得大肠杆菌(E.coli)具有四环素或 氨苄青霉素抗性的基因和酿酒酵母(S.cerevisiae)TRP1基因。启动子区域可以从任 何期望的基因中选择出来,使用氯霉素转移酶(CAT)载体或具有选择标记的其它载 体。
【0199】用于在真核细胞中表达多肽或其片段的载体也可以含有增强子,以增加 表达水平。增强子是DNA的顺式作用元件,一般长度为大约10到大约300bp,其作 用于启动子,增强其转录。例子包括在复制起点下游侧100bp到270bp的SV40增强 子、巨细胞病毒早期启动子增强子、在复制起点下游侧的多瘤增强子,和腺病毒增强 子。
【0200】DNA序列可以通过各种方法插入载体中。一般而言,将插入物和载体 用合适的限制性内切酶消化后,DNA序列可以连接到载体中的所希望的位置。可选 择地,插入物和载体的平末端可以被连接。多种克隆技术在本领域已知,例如在 Ausubel和Sambrook中描述的。这样的方法和其它方法被认为在本领域技术人员的 范围内。
【0201】载体可以是质粒、病毒颗粒或噬菌体的形式。其它载体包括染色体的、 非染色体的和合成的DNA序列,SV40的衍生物;细菌质粒、噬菌体DNA、杆状病 毒、酵母质粒、衍生于质粒和噬菌体DNA的组合的载体、病毒DNA例如牛痘、腺 病毒、禽痘病毒和伪狂犬病病毒DNA。在原核和真核宿主中使用的各种克隆和表达 载体被例如Sambrook描述。
【0202】可以使用的具体细菌载体包括商业上可获得的质粒,其包括以下熟知的 克隆载体的遗传元件:pBR322(ATCC 37017)、pKK223-3(Pharmacia Fine Chemicals, Uppsala,Sweden)、GEM1(Promega Biotec,Madison,WI,USA)、pQE70、pQE60、pQE-9 (Qiagen)、pD10、psiX174 pBluescript II KS、pNH8A、pNH16a、pNH18A、pNH46A (Stratagene)、ptrc99a、pKK223-3、pKK233-3、DR540、pRIT5(Pharmacia)、pKK232-8 和pCM7。具体的真核载体包括pSV2CAT、pOG44、pXT1、pSG(Stratagene)pSVK3、 pBPV、pMSG和pSVL(Pharmacia)。然而,可以使用任何其它载体,只要它可以在 宿主细胞中复制和存活。
宿主细胞和转化的细胞
【0203】本发明也提供包括发明核酸序列,如编码本发明磷脂酶的序列、本发明 的载体的转化的细胞。宿主细胞可以是本领域技术熟练人员所熟悉的任何宿主细胞, 包括原核细胞,真核细胞,如细菌细胞、真菌细胞、酵母细胞、哺乳动物细胞、昆虫 细胞或者植物细胞。本发明的酶可以在任何宿主细胞中表达,例如任何细菌细胞、任 何酵母细胞,例如巴斯德毕赤酵母、酿酒酵母或粟酒裂殖酵母(Schizosaccharomyces pombe)。示例性的细菌细胞包括埃希氏菌属(Escherichia)、杆菌属(Bacillus)、链 霉菌属(Streptomyces)、沙氏菌属(Salmonella)、假单胞菌属(Pseudomonas)和 葡萄球菌属(Staphylococcus)内的任何种,包括例如大肠杆菌(E.coli)、乳酸乳球 菌(Lactococcus lactis)、枯草芽孢杆菌(Bacillus subtilis)、蜡状芽孢杆菌(Bacillus cereus)、鼠伤寒沙门菌(Salmonella typhimurium)和荧光假单胞菌(Pseudomonas fluorescens)。示例性真菌细胞包括曲霉菌属(Aspergillus)内的任何种。示例性酵母 细胞包括毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属 (Schizosaccharomyces)或许旺酵母属(Schwanniomyces)的种,包括巴斯德毕赤酵 母(Pichia pastoris)、酿酒酵母(Saccharomyces cerevisiae)或粟酒裂殖酵母 (Schizosaccharomyces pombe)。示例性昆虫细胞包括灰翅夜蛾属(Spodoptera)或果 蝇属(Drosophila)内的任何种,包括果蝇S2(Drosophila S2)和草地夜蛾Sf9(Spodoptera Sf9)。示例性的动物细胞包括CHO、COS或者Bowes melanoma或者任何小鼠或者人 类细胞系。适当的宿主的选择是在本领域技术人员的能力之内。
【0204】载体可以使用各种技术导入宿主细胞中,包括转化、转染、转导、病毒 感染、基因枪或者Ti介导的基因转移。具体的方法包括磷酸钙转染、DEAE-Dextran 介导的转染、脂转染法(lipofection)或电穿孔(Davis,L.,Dibner,M.,Battey,I.,Basic Methods in Molecular Biology,(1986))。
【0205】在适当的情况下,工程化宿主细胞可以在传统的营养培养基中培养,所 述营养培养基经改良而适于激活启动子、选择转化子或扩增本发明的基因。在合适的 宿主株被转化和宿主株生长到合适的细胞密度之后,用合适的方法(例如,温度变化 或化学诱导)诱导被选择的启动子,细胞再培养一段时期,使得它们产生所需的多肽 或其片段。
【0206】细胞可以通过离心收获,通过物理或化学方法破碎,保留得到的粗提物 以用于进一步的纯化。被用来表达蛋白质的微生物细胞可以用任何常规方法破碎,包 括冷冻-融解循环、声波裂解法、机械破碎法或使用细胞裂解剂。这些方法为本领 域技术人员所熟知。表达的多肽或其片段可以从重组细胞培养物中通过包括硫酸铵或 乙醇沉淀、酸提取、阴离子或阳离子交换层析、磷酸纤维素层析、疏水作用层析、亲 和层析、羟基磷灰石层析和凝集素层析在内的方法回收和纯化。假如必要的话,可以 应用蛋白质重折叠来完成多肽的构象。假如需要的话,在最终的纯化步骤中可以采用 高效液相层析(HPLC)。
【0207】各种哺乳动物培养系统可以用来表达重组蛋白。哺乳动物表达系统的例 子包括猴肾成纤维细胞COS-7细胞系和能够从相容性载体中表达蛋白的其它的细胞 系,如C127、3T3、CHO、Hela和BHK细胞系。
【0208】宿主细胞中的构建物可以以传统方式用于产生由重组序列编码的基因产 物。取决于重组生产方法中所用的宿主,由含有载体的宿主细胞产生的多肽可以糖基 化或者未糖基化。本发明的多肽也可以包括或不包括起始甲硫氨酸残基。
【0209】也可以采用无细胞的翻译系统来产生本发明的多肽。无细胞翻译系统可 以应用由DNA构建物转录得到的mRNA,所述DNA构建物包括与编码所述多肽或 其片段的核酸可操作地连接的启动子。在一些方面,该DNA构建物在进行体外转录 反应之前可以被线性化。转录得到的mRNA然后与合适的无细胞翻译提取物例如兔 网状细胞提取物温育,产生所需的多肽或其片段。
【0210】表达载体可以含有一个或多个选择性标记基因,为选择转化的宿主细胞 提供表型特征,例如真核细胞培养物的二氢叶酸还原酶或新霉素抗性,或者例如大肠 杆菌的四环素或氨苄青霉素抗性。
【0211】示例性磷脂酶C酶(具有SEQ ID NO:2中所示的序列)已在各种宿主 系统中以活性形式被过量表达,这些系统包括革兰氏阴性细菌,诸如大肠杆菌,革兰 氏阳性细菌,诸如任何杆菌属的种(例如枯草芽孢杆菌、蜡状芽孢杆菌)、酵母宿主 细胞(包括例如巴斯德毕赤酵母、酵母属某种(Saccharomyces sp.),诸如酿酒酵母和 粟酒裂殖酵母)和乳酸乳球菌或哺乳动物、真菌、植物或昆虫细胞。在每一宿主系统 中,由各种构建物表达活性酶。这些核酸表达构建物可以包含编码全长开放阅读框(由 信号序列、前序列和成熟蛋白编码序列组成)的核苷酸,或它们可以包含这些遗传元 件的亚组,单独或者与异源遗传元件组合,异源遗传元件充当信号序列和/或成熟开 放阅读框的前序列。这些系统中的每一个可以充当表达PLC的商用生产性宿主,PLC 用于之前描述的酶法油脱胶方法中。
核酸的扩增
【0212】在实践本发明时,编码本发明多肽的核酸,或者修饰的核酸可以如通过 扩增复制。本发明提供用于扩增编码具有磷脂酶活性的多肽的核酸的扩增引物序列 对。在一方面,引物对能够扩增本发明的核酸序列。本领域技术人员可以设计用于扩 增这些序列的任何部分或全长的扩增引物序列对。
【0213】本发明提供用于扩增编码具有磷脂酶活性的多肽的核酸的扩增引物序列 对,其中引物对可以扩增包括本发明序列,或者其片段或子序列的核酸。扩增引物序 列对的其中一个或每一个成员可以包括含有该序列的至少大约10到50个连续碱基的 寡核苷酸,或者包括含有该序列的大约12、13、14、15、16、17、18、19、20、21、 22、23、24或者25个连续碱基的寡核苷酸。
【0214】本发明提供扩增引物对,其中引物对包括具有在本发明核酸的大约前(5′ 端)12、13、14、15、16、17、18、19、20、21、22、23、24或者25个残基中阐 明的序列的第一成员,和具有在第一成员的互补链的大约前(5′)12、13、14、15、 16、17、18、19、20、21、22、23、24或者25个残基中阐明的序列的第二成员。本 发明提供应用本发明的扩增引物对,通过扩增如聚合酶链式反应(PCR)产生的磷脂 酶。本发明提供使用本发明的扩增引物对,通过扩增例如聚合酶链式反应(PCR)制 备发明磷脂酶的方法。在一方面,扩增引物对从文库,例如基因文库,如环境文库中 扩增核酸。
【0215】扩增反应也可以被用于量化样品中核酸的量(如细胞样品中信息的量)、 标记核酸(例如将其应用于阵列或印迹)、检测核酸,或量化样品中特异性核酸的量。 在本发明的一个方面,扩增从细胞或cDNA文库分离出的信息。技术人员可以选择和 设计合适的寡核苷酸扩增引物。扩增方法在本技术领域也是熟知的,包括,例如聚合 酶链式反应PCR(例如参见PCR PROTOCOLS,A GUIDE TO METHODS AND APPLICATIONS,ed.Innis,Academic Press,N.Y.(1990)和PCR STRATEGIES(1995), ed.Innis,Academic Press,Inc.N.Y.,连接酶链式反应(LCR)(例如参见Wu(1989) Genomics 4:560;Landegren(1988)Science 241:1077;Barringer(1990)Gene 89:117); 转录扩增(例如参见Kwoh(1989)Proc.Natl.Acad.Sci.USA 86:1173);和自主维持序 列复制(例如参见Guatelli(1990)Proc.Natl.Acad.Sci.USA 87:1874);Qβ复制酶扩 增(例如参见Smith(1997)J.Clin.Microbiol.35:1477-1491),自动Q-β复制酶扩增测 定法(例如参见Burg(1996)Mol.Cell.Probes 10:257-271)和其它的RNA聚合酶介导 的技术(例如NASBA,Cangene,Mississauga,Ontario);也参见Berger(1987)Methods Enzymol.152:307-316;Sambrook;Ausubel;美国专利4,683,195和4,683,202; Sooknanan(1995)Biotechnology 13:563-564。
确定序列同一性程度
【0216】本发明提供包括与本发明的示例性核酸(例如具有一个或多个编码 E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、 A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、 M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的 突变的SEQ ID NO:177或SEQ ID NO:178,以及编码具有一个或多个编码E41A、 E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、 A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、 M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的 突变的SEQ ID NO:177或SEQ ID NO:178的核酸),在至少大约50、75、100、150、 200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、 950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550 或者更多的残基范围内,具有至少大约50%、51%、52%、53%、54%、55%、56%、 57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、 70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、 83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、 96%、97%、98%、99%或者更多的或者完全的(100%)的序列同一性的序列的分离 的和重组的核酸。本发明提供包括与本发明的示例性多肽具有至少大约50%、51%、 52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、 65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、 78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、 91%、92%、93%、94%、95%、96%、97%、98%、99%或者更多的或者完全的(100 %)的序列同一性的序列的多肽。序列同一性(同源性)的程度可以应用任何计算机 程序和相关参数来确定,包括那些在此所描述的,如用默认参数的BLAST 2.2.2.或 者FASTA 3.0t78版。在可选择的实施方式中,序列同一性可以在核酸或者多肽的至 少大约5、10、20、30、40、50、100、150、200、250、300、350、400个连续的残 基,或者全长的范围内。序列同一性(同源性)的程度可以应用任何计算机程序和相 关联的参数来确定,包括那些在此所说明的,如使用默认参数的BLAST 2.2.2.或者 FASTA 3.0t78版。
【0217】图11用图表描述了本发明的示例性核酸和多肽的选择的特征,包括示 例性序列与公共数据库的序列同一性比较。图11中描述的所有序列对两组数据库进 行BLAST搜索(如在下面详细描述地)。第一数据库获自NCBI(美国国家生物技术信 息中心)。对这些数据库搜索所获得的所有结果参见名称为“NR描述(NR Description)”、“NR登录号(NR Accession Code)”、“NR评价(NR Evalue)”或“NR 生物(NR Organism)”的各栏。“NR”指由NCBI维护的非-冗余(Non-Redundant)核苷 酸数据库。该数据库是GenBank、GenBank更新和EMBL更新的综合。栏“NR描述 (NR Description)”中的条目指任何给定的NCBI记录中的定义行(definition line), 其包括了对序列的描述,诸如来源生物、基因名称/蛋白质名称,或对序列的一些功 能描述。“NR登录号(NR Accession Code)”一栏中的条目指给予序列记录的独特的 标识符(identifier)。“NR评价(NR Evalue)”一栏中的条目指期望值(评价),其代 表了这样的可能性:同询问序列(query sequence)(本发明的序列)与数据库序列之间发 现的比对分值一样良好的比对分值,发现在随机序列之间具有相同的数量的比较,如 在当前的BLAST搜索中所进行的。“NR生物(NR Organism)”一栏中的条目指被鉴 定为关系最密切的BLAST命中(hit)的序列的来源生物。第二组数据库统称为 GeneseqTM数据库,其可从Thomson Derwent(Philadelphia,PA)获得。对该数据库所作 搜索的所有结果参见名称为“Geneseq蛋白质描述(Geneseq Protein Description)”、 “Geneseq蛋白质登录号(Geneseq Protein Accession Code)”、“Geneseq蛋白质评价 (Geneseq Protein Evalue)”、“Geneseq DNA描述(Geneseq DNA Description)”、“Geneseq DNA登录号(Geneseq DNA Accession Code)”、“Geneseq DNA评价(Geneseq DNA Evalue)”各栏中。这些栏中发现的信息与上述NR各栏中发现的信息具有可比性,除 了它来自对GeneseqTM数据库而不是对NCBI数据库进行的BLAST搜索。此外,该 表包括栏“预测的EC编号(Predicted EC No.)”一栏。EC编号是根据标准化的酶命 名法的方案赋予一类酶的编号,该命名法是由国际生物化学和分子生物学联合会 (IUBMB)的命名委员会的酶分组(Enzyme Commission of the Nomenclature Committee of International Union of Biochemistry and Molecular Biology)开发的。在“预 测的EC编号”栏中的结果由对Kegg(Kyoto Encyclopedia of Genes and Genomes)数 据库的BLAST搜索结果测定。如果最高BLAST匹配(top BLAST match)的评价值等 于或小于e-6,那么赋予最高匹配的EC编号进入表中。最高命中(top hit)的EC编 号用作向导,用于指出本发明序列的EC编号可能是什么。“询问DNA长度(Query DNA Length)”和“询问蛋白质程度(Query Protein Length)”这两栏分别指本发明的序列中 核苷酸的数目或氨基酸的数目,本发明的序列被用于对NCBI或Geneseq数据库进行 搜索或查询。“Geneseq或NR DNA长度(Geneseq or NR DNA Length)”、“Geneseq或 NR蛋白质长度(Geneseq or NR Protein Length)”这两栏分别指从BLAST搜索获得的最 高匹配的序列中的核苷酸的数目或氨基酸的数目。这些栏中给出的结果来自搜索,其 将较低的评价——或者来自NCBI数据库或者来自Geneseq数据库的较低的评价返回 (return)。“Geneseq或NR%ID蛋白质(Geneseq或NR%ID Protein)”和“Geneseq 或NR%ID DNA(Geneseq or NR%ID DNA)”指本发明序列与最高BLAST匹配的序 列之间的百分序列同一性。这些栏中给出的结果来自搜索,其将较低的评价——或者 来自NCBI数据库或者来自Geneseq数据库的较低的评价返回。
【0218】同源性序列也包括RNA序列,其中在核酸序列中尿嘧啶替代了胸腺嘧 啶。同源序列可以应用在此说明的任何程序得到或者可以由校正测序错误得到。应该 理解到的是,在此所示核酸序列可以以传统的单字母形式表示(见,如,Stryer,Lubert. Biochemistry 3rd Ed.,W.H.Freeman & Co.,New York)或者以记录序列中的核苷酸的 同一性的任何其它形式来表示。
【0219】在本发明的这一方面,可以使用在此指明的各种序列比较程序。蛋白和 /或核酸序列同一性(同源性)可以应用本领域已知的任何序列比较算法和程序评估。 这样的算法和程序包括,但不限于,TBLASTN、BLASTP、FASTA、TFASTA和 CLUSTALW(Pearson和Lipman,Proc.Natl.Acad.Sci.USA 85(8):2444-2448,1988; Altschul等,J.Mol.Biol.215(3):403-410,1990;Thompson等,Nucleic Acids Res.22 (2):4673-4680,1994;Higgins等,Methods Enzymol.266:383-402,1996;Altschul 等,J.Mol.Biol.215(3):403-410,1990;Altschul等,Nature Genetics 3:266-272,1993)。
【0220】同源性或者同一性可以应用序列分析软件来测定(例如,位于1710 University Avenue,Madison,WI 53705的威斯康星大学生物技术中心遗传学计算机组 (Genetics Computer Group)的序列分析软件包)。这样的软件通过对各种缺失、置换 和其它的修饰指定同源性程度来匹配相似的序列。在两个或者多个核酸或者多肽序列 的情况下,术语“同源性”和“同一性”是指两个或者多个序列或者子序列,当在比较窗 口或者指定区域中应用任何数量的序列比较算法或者手动比对和目测来测定,通过比 较和比对以便获得最大的一致性时,它们是相同的或者具有相同的氨基酸残基或者核 苷酸的特异百分比。对于序列比较,一个序列可以作为参照序列与待测序列进行比较。 当应用序列比较算法,待测序列和参照序列被输入到计算机中,指定子序列坐标,如 果必要,指定序列算法程序参数。可以应用默认程序参数,或者指定选择性参数。依 据程序参数,序列比较算法计算待测序列和参照序列同一性的百分比。
【0221】如本文所用,“比较窗口(comparison window)”,包括涉及任一数目的 连续残基的片段。例如,在本发明可选择的方面,当两个序列优化比对后,将范围从 20到本发明的示例性序列的全长的连续残基,与相同数目的连续位置的参照序列进 行比较。如果参照序列与本发明的示例性序列具有必要的序列同一性,如50%、51 %、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63 %、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75 %、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87 %、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99 %或者更多的序列同一性,那么该序列是属于本发明的范围。在可选择的实施方式中, 当两个序列优化地比对后,将范围从大约20到600、大约50到200、和大约100到 150的序列,与同样数目的连续位置的参照序列进行比较。用于比较的联配方法在本 技术领域是熟知的。可以通过如下方法进行用于比较的序列的最优化联配:例如Smith 和Waterman,Adv.Appl.Math.2:482,1981的局部同源性算法,Needleman和Wunsch, J.Mol.Biol.48:443,1970的同源性联配算法,person和Lipman,Proc.Nat′l.Acad.Sci. USA 85:2444,1988的查找相似性的方法,这些算法的计算机化实施(Wisconsin Genetics Software Package中的GAP、BESTFIT、FASTA和TFASTA,Genetics Computer Group,575 Science Dr.,Madison,WI),或者手工联配和观察检验。除了 BLAST程序(国家生物信息中心的基本局域联配搜索工具(Basic Local Alignment Search Tool))外,用于确定同源性或者同一性的其它的算法包括,例如,ALIGN、 AMAS(多重联配序列分析(Analysis of Multiply Aligned Sequences))、AMPS(蛋白 多重序列联配(Protein Multiple Sequence Alignment))、ASSET(联配片段统计评估 工具(Aligned Segment Statistical Evaluation Tool))、BANDS、BESTSCOR、BIOSCAN (生物学序列比较分析节点(Biological Sequence Comparative Analysis Node))、 BLIMPS(BLocks IMProved Searcher)、FASTA、Intervals & Points、BMB、CLUSTAL V、CLUSTALW、CONSENSUS、LCONSENSUS、WCONSENSUS、Smith-Waterman 算法、DARWIN、Las Vegas算法、FNAT(强迫核苷酸联配工具(Forced Nucleotide Alignment Tool))、Framealign、Framesearch、DYNAMIC、FILTER、FASP(Fristensky 序列分析软件包)、GAP(全局联配程序(Global Alignment Program))、GENAL、 GIBBS、GenQuest、ISSC(灵敏性序列比较(Sensitive Sequence Comparison))、LALIGN (局部序列联配(Local Sequence Alignment))、LCP(局部内容程序(Local Content Program))、MACAW(多重联配构建和分析工作台(Multiple Alignment Construction & Analysis Workbench))、MAP(多重联配程序(Multiple Alignment Program))、MBLKP、 MBLKN、PIMA(模式诱导的多重序列联配(Pattern-Induced Multi-sequence Alignment))、SAGA(通过遗传算法的序列联配(Sequence Alignment by Genetic Algorithm))和WHAT-IF。这样的联配程序也可以用于筛查基因组数据库,以鉴定具 有大体上相同的序列的多核苷酸序列。大量的基因组数据库是可利用的,例如,作为 人类基因组测序工程的一部分的人类基因组的实质部分可以被利用(Gibbs,1995)。 若干基因组已经被测序,如生殖器支原体(M.genitalium)(Fraser等,1995)、甲烷球 菌(M.jannaschii)(Bult等,1996)、流行性感冒杆菌(H.influenzae)(Fleischmann 等,1995)、大肠杆菌(E.coli)(Blattner等,1997)和酵母(酿酒酵母(S.cerevisiae)) (Mewes等,1997)和黑腹果蝇(D.melanogaster)(Adams等,2000)。在模式生物的 基因组序列的测序上已经取得了很大的进展,如小鼠,线虫(C.elegans)和拟南芥 (Arabadopsis sp.)。含有基因组信息并且注释有一些功能性信息的数据库由不同组织 维护,可以通过互联网登录。
【0222】BLAST、BLAST 2.0和BLAST 2.2.2算法也用于实践本发明。这些算法 在,如Altschul(1977)Nuc.Acids Res.25:3389-3402;Altschul(1990)J.Mol.Biol. 215:403-410中有描述。用于实施BLAST分析的软件可以通过美国国家生物技术信息 中心公开获得。这一算法涉及首先通过鉴别待询序列(query sequence)中长度为W 的短的字串来确定高分序列对(high scoring sequence pairs,HSPs),所述高分序列对 在与数据库序列中同样长度的字串联配时,匹配或者满足某些正值的阈值T。T是指 邻近字串(neighborhood word)的分数阈值(Altschul(1990),如上)。这些初始的 邻近字串作为种子(seed)用来启动搜索以发现包含有它们的更长的HSPs。只要累积的 联配分数能够被增加,所述字串一直沿着每一个序列向两个方向延伸。对于核苷酸序 列,使用参数M(一对匹配的残基的奖励分数;总是大于0)来计算累积分数。对于 氨基酸序列,使用记分矩阵来计算累计分数。出现下面情况时,字串在各个方向上的 延伸便停止:累积的联配分数由达到的最大值下降了数量X;由于一个或者多个记分 为负的残基联配的累积,累积分数达到0或者0以下;或者延伸到了任一序列的末端。 BLAST算法的参数W、T和X决定了联配的灵敏度和速率。BLASTN程序(对于核 苷酸序列)使用的默认值的是:字串长度(W)为11,期望值(E)为10,M=5, N=-4,对两条链进行比较。对于氨基酸序列,BLASTP程序使用的默认值的是:字串 长度为3,期望值(E)为10,BLOSUM62记分矩阵(参见Henikoff和Henikoff(1989), Proc.Natl.Acad.Sci.USA 89:10915)联配(B)为50,期望值(E)为10,M=5,N=-4, 对两条链进行比较。BLAST算法也进行两个序列之间的相似性的统计学分析(参见, 例如,Karlin和Altschul(1993),Proc.Natl.Acad.Sci.USA 90:5873)。由BLAST算 法提供的一种相似性量度是最小合计概率(smallest sum probability,P(N)),其表示 两个核苷酸或者氨基酸序列间的匹配将偶然发生的概率。例如,在测试核酸和参考核 酸的比较中,如果最小合计概率小于约0.2,在一方面中更优选的是小于约0.01,在 一方面中最优选的是小于约0.001,就认为该核酸与参考序列相似。一方面,应用基 本局域联配搜索工具(“BLAST”)来评价蛋白和核酸序列同源性。具体而言,五个特 定的BLAST程序可以用来进行以下的任务:(1)BLASTP和BLAST3将氨基酸待询 序列与蛋白质序列数据库进行比较;(2)BLASTN将核苷酸待询序列与核苷酸序列数 据库进行比较;(3)BLASTX将待询核苷酸序列(两条链)的六个阅读框架的概念上 的翻译产物与蛋白序列数据库进行比较;(4)TBLASTN将待询蛋白序列与核苷酸序 列数据库的所有六个阅读框架(两条链)的翻译结果进行比较;和(5)TBLASTX 将核苷酸待询序列的六个框架的翻译结果与核苷酸序列数据库的六个框架的翻译结 果进行比较。BLAST程序通过确定相似片段来确定同源序列,所述相似片段在此是 指在待查询的氨基酸或核酸序列与受测序列之间的“高分片段对(high-scoring segment pairs)”,该受测序列优选从蛋白或者核酸序列数据库得到。高分片段对优选利用记 分矩阵来鉴定(即,联配),很多的记分矩阵在本领域是已知的。优选地,应用的记 分矩阵为BLOSUM62矩阵(Gonnet等,Science 256:1443-1445,1992);Henikoff和 Henikoff,Proteins 17:49-61,1993)。较不优选地,也可以应用PAM或者PAM250矩 阵(参见如,Schwartz和Dayhoff,eds.,1978,Matrices for Detecting Distance Relationships:Atlas of protein Sequence and Structure,Washingion:National Biomedical Research Foundation)。
【0223】本发明的一方面,为了确定是否核酸具有本发明范围内的必需的序列同 一性,应用NCBI BLAST 2.2.2程序,默认值的选择是blastp。在BLAST 2.2.2程序 中,有大约38个设置选择。在本发明的该示例性方面,除了默认的过滤设置外,应 用所有的默认值(即除了过滤设置为关闭(OFF)外,所有的参数设定为默认值), 在该位置上应用“-FF”设置,其使得不能进行过滤。由于短的序列的长度的缘故,默 认过滤的使用经常导致与Karlin-Altschul不同。
【0224】如上所述,用于本发明该示例性方面,并用于测定图11中值的默认值 包括:
“低复杂性过滤器(Filter for low complexity):开启(ON)
>字长:3
>矩阵:Blosum62
>空位成本:存在值:11
>延伸:1”
其它的默认值设置为:低复杂性过滤器关闭(OFF),蛋白质字长为3,BLOSUM62 矩阵,空位存在罚值-11,并且空位延伸罚值-1。
【0225】示例性的NCBI BLAST2.2.2程序设置在下面的实施例1中阐明。注意, “-W”选项默认值为0。这是指,如果没有设置,对于蛋白,字长默认值为3,对于核 苷酸字长默认值为11。
计算机系统和计算机程序产品
【0226】为了确定和鉴定序列同一性、结构同源性、基序和在计算机芯片上的类 似物,本发明的多肽或核酸序列可以在可被计算机读取和访问的任何介质上存储、记 录和操作。因此,本发明提供了计算机、计算机系统、计算机可读取的介质、计算机 程序产品以及其上记录或存储了本发明的核酸和多肽序列,例如本发明的示例性序列 的类似设备。如本文所用,词语“记录”和“存储”指在计算机介质上存储信息的过程。 熟练的技术人员能容易地采用任何已知方法,在计算机可读取的介质上存储信息,以 产生包括本发明的一个或多个核酸和/或多肽序列的产品。
【0227】本发明的另一方面是其上已记录有本发明的至少一个核酸和/或多肽序 列的计算机可读介质。计算机可读介质包括磁性可读介质、光学可读介质、电子可读 介质和磁性/光学介质、闪存。例如,计算机可读介质可以是硬盘软盘、磁带、闪 存、CD-ROM、数码多功能光盘(DVD)、随机存储器(RAM)、或只读存储器(ROM) 或本领域技术人员知道的任何类型的介质。
【0228】本发明的方面包括系统(如,以因特网为基础的系统),特别地计算机 系统,其存储和操作在此描述的序列和序列信息。计算机系统100的一个例子描述在 图1的方块图中。正如此处所用,“计算机系统”指硬件部分、软件部分以及数据存储 部分,它们用于分析本发明的核酸序列的核苷酸序列或本发明的多肽序列。计算机系 统100可包括用于处理、访问和操纵序列数据的处理器。处理器105可以是任何熟知 类型的中央处理单元,如来自英特尔公司的奔腾III,或来自Sun、Motorola、Compag、 AMD或IBM公司的类似处理器。计算机系统100是一个通用的系统,该系统包括处 理器105和用于存储数据的一个或多个内部数据存储部件110,以及用于检索数据存 储部件上存储的数据的一个或多个数据检索设备。技术人员能容易地意识到,任何一 种当前可获得的计算机系统都是合适的。
【0229】在一个特定的方面,计算机系统100包括连接到总线上的处理器105, 总线连接到主存储器115(优选地,以RAM来实现),和一个或多个内部数据存储设 备110,例如其上已经存储了数据的硬盘驱动器和/或其它计算机可读介质。计算机系 统100进一步包括一个或多个数据检索设备118,用于读取在内部数据存储设备110 上存储的数据。
【0230】数据检索设备118可以是,例如软盘驱动器、压缩磁盘驱动器、磁带驱 动器或能连接到远程数据存储系统的调制解调器(例如通过因特网)等等。在一些实 施方式中,内部数据存储设备110是可移动的计算机可读介质,例如含有控制逻辑和 /或其上记录的数据的软盘、压缩磁盘、磁带等等。计算机系统100可以有利地包括 适当的软件或用适当的软件编程,用于当数据存储部件被插入到数据检索设备中时从 数据存储部件读取控制逻辑和/或数据。
【0231】计算机系统100包括用于给计算机应用者显示输出的结果的显示器120。 应当注意到,计算机系统100可以在网络中或者宽域网中与其它的计算机系统125a-c 相联,以便给计算机100提供集中访问。访问和处理本发明的核苷酸或者氨基酸序列 的软件可以在执行过程中驻留在主存储器115中。
【0232】在一些方面,计算机系统100可以进一步包括比较发明的本核酸序列的 序列比较算法。算法和序列可以储存在计算机可读的介质中。“序列比较算法”是指一 个或多个程序,其可在计算机系统100上(本地或远程)执行以比较核苷酸序列和数 据储存装置中存储的其它的核苷酸序列和/或化合物。例如,序列比较算法可将储存 在计算机可读介质上的示例性序列的核苷酸序列与储存在计算机可读介质上的参考 序列比较,以鉴定同源性或结构基序。
【0233】以上算法应用的参数可以依据所研究的序列长度和同源性水平而加以调 整。在一些方面,在使用者没有给出指令的情况下,算法使用的参数可以应用默认参 数。图2是说明过程200的一个方面的流程图,这个处理过程是为了确定新序列和数 据库中的序列间的同源性水平,把新的核苷酸或者蛋白序列与数据库中的序列加以比 较。含有序列的数据库可以是存储于计算机系统100的私人数据库,或者公共的数据 库,如通过因特网可以访问到的GENBANK。过程200开始于起始状态201,然后转 到状态202,其中待比较的新序列存储在计算机系统100的存储器上。如上讨论,存 储器可以是任何形式的存储器,包括RAM或者内部存储设备。
【0234】然后过程200转到状态204,其中打开序列数据库以进行分析和比较。 然后过程200转到状态206,其中数据库中存储的第一个序列被读取到计算机的存储 器中。然后在状态210进行比较,以确定第一个序列是否与第二个序列相同。重要的 是应该注意到,该步骤不限于进行新序列和数据库中第一个序列之间的精确比较。用 于比较两个核苷酸或蛋白序列的熟知的方法对于本技术领域的普通技术人员是已知 的,即使所述两个核苷酸或蛋白序列不相同。例如,可以在一个序列中引入空位,以 提高两个测试序列之间的同源性水平。控制空位或其它特征在比较过程中是否被引入 到序列中的参数通常由计算机系统的用户输入。
【0235】一旦已经在状态210进行两个序列的比较,在决策状态210就要作出两 个序列是否相同的判断。当然,术语“相同的”不限于绝对相同的序列。在过程200中, 在由用户输入的同源性参数范围内的序列都将被标记为“相同的”。如果作出两个序 列相同的判断,过程200转到状态214,其中来自数据库的序列的名称被显示给用户。 该状态通知用户,具有显示的名称的序列满足所输入的同源性限制。一旦所存储序列 的名称被显示给用户,过程200转到决策状态218,其中作出数据库中是否存在更多 序列的判断。如果数据库中不存在更多的序列,那么过程200在结束状态220终止。 然而,如果数据库中确实存在更多的序列,那么过程200转到状态224,其中指针被 指向数据库中的下一个序列,以便与新序列进行比较。以这种方式,将新序列与数据 库中的每一序列联配并进行比较。
【0236】应该注意到,如果已经在决策状态212已经作出了序列不同源的判断, 那么过程200将立即转到决策状态218,以便确定用于比较的数据库中的任何其它序 列是否可利用。因此,发明的一方面是包括处理器,其上储存有本发明的核酸序列的 数据存储设备以及用于进行比较的序列比较器的计算机系统。序列比较器可以指示待 比较序列之间的同源性水平或者鉴定结构基序,或者可以确定与这些核酸代码和多肽 代码相比较的序列中的结构基序。
【0237】图3是示意性说明计算机中的过程250的一个实施方式的流程图,该过 程用于确定两个序列是否同源。过程250在起始状态252开始,然后转到状态254, 其中要被比较的第一个序列被存储到存储器上。然后要被比较的第二个序列在状态 256被存储到存储器上。然后过程250转到状态260,其中读取第一个序列中的第一 个字符,然后转到状态262,其中读取第二个序列的第一个字符。应该理解到,如果 序列是核苷酸序列,那么字符将通常是A、T、C、G或U。如果序列是蛋白序列, 那么字符可以是单字母氨基酸代码,以便第一个序列和第二个序列可以被容易地比 较。然后在决策状态264作出两个字符是否相同的判断。如果它们相同,那么过程 250转到状态268,其中第一个和第二个序列中的下一个字符被读取。然后作出该下 一个字符是否相同的判断。如果它们相同,那么过程250继续循环,直到两个字符不 相同。如果作出的判断是这两个字母不相符,那么过程250转到决策状态274,以确 定是否有更多的字符或者序列可以读取。如果没有可读取的任何更多的字符,那么过 程250转到状态276,其中第一个和第二个序列之间的同源性水平被显示给用户。同 源性水平通过计算序列之间相同的字符在第一个序列的序列总数中的比例来确定。因 此,如果前100个核苷酸序列中的每一个字符都与第二个序列中的每一个字符联配, 那么同源性水平将是100%。
【0238】可选地,计算机程序可以比较参照序列与本发明的序列,以确定是否序 列在一个或者多个位置上不同。程序可以记录本发明序列或参照序列中插入、缺失或 者替换的核苷酸或者氨基酸残基的长度和同一性。计算机程序可以是确定是否参照序 列与本发明的序列相比,含有单核苷酸多态性(SNP),或者是否本发明的序列含有 已知序列的SNP的程序。因此,在一些方面,计算机程序是鉴定SNPs的程序。该方 法可以通过以上描述的计算机系统来完成并且该方法描述在图3中。该方法可以通过 应用计算机程序读取本发明序列和参照序列,并且用计算机程序来鉴定差异来进行。
【0239】在其它方面,以计算机为基础的系统包括鉴定本发明的核酸或者多肽中 的特征的鉴定器。“鉴定器”是指鉴定核酸序列中的某些特征的一个或者多个程序。例 如,鉴定器可以包括鉴定核酸序列中的开放阅读框架(ORF)的程序。图4是说明用 于检测序列中特征存在与否的鉴定器程序300的一个方面的流程图。过程300起始于 起始状态302,然后转到状态304,其中待检测特征的第一序列存储于计算机系统100 的存储器115上。过程300然后转到状态306,在该状态下,打开具有序列特征的数 据库。这样数据库将包括一系列每一个特征的属性和特征的名称。例如,特征名称可 以是“起始密码子”,属性为“ATG”。另一个例子是特征名称为“TAATAA盒”,特征属 性为“TAATAA”。这样的数据库的例子是由威斯康辛大学遗传学计算机组(University of Wisconsin Genetics Computer Group)制作。可选地,特征可以是结构多肽基序,如 α螺旋、β折叠,或者功能性多肽基序,如酶的活性位点、螺旋-转角-螺旋基序或者 本领域技术知道的其它基序。一旦在状态306打开特征数据库,过程300转到状态 308,其中第一特征从数据库中读取。然后在状态310中进行第一特征的属性与第一 序列的比较。然后在决定状态316下作出决定,确定是否在第一序列发现所述特征的 属性。如果发现该属性,过程300转到状态318,其中所发现的特征的名称显示给使 用者。过程300然后转到决定状态320,在其中作出是否在数据库中存在更多的特征 的决定。如果不存在更多的特征,过程300终止于结束状态324。然而,如果数据库 中确实存在有更多的特征,那么过程300在状态326读取下一个序列特征,并且循环 回到状态310,其中该下一个特征的属性与第一序列进行比较。如果在决定状态316 在第一个序列中没有发现特征属性,那么过程300直接转到决定状态320,以便确定 数据库中是否存在更多特征。因此,在一方面,本发明提供了鉴定开放阅读框架 (ORFs)的计算机程序。
【0240】本发明的多肽或核酸序列可在各种数据处理程序中以多种格式被储存和 进行操作。例如,序列可以以文本形式储存在字处理文件如Microsoft WORD或 WORDPERFECT中,或以ASCII文件储存在各种本领域技术人员所熟悉的数据库程 序如DB2、SYBAS或ORACL中。另外,许多计算机程序和数据库都可用作序列比 较算法、鉴定器、或参考核苷酸序列或多肽序列的来源,所述参考核苷酸序列或多肽 序列要与本发明的核酸序列进行比较。用于实践本发明的程序和数据库包括,但不限 于:MacPattern(EMBL)、DiscoveryBase(Molecular Applications Group)、GeneMine (Molecular Applications Group)、Look(Molecular Applications Group)、MacLook (Molecular Applications Group)、BLAST和BLAST2(NCBI)、BLASTN和BLASTX (Altschul等,J.Mol.Biol.215:403,1990)、FASTA(Pearson和Lipman,Proc.Natl.Acad. Sci.USA,85:2444,1988)、FASTDB(Brutlag等,Comp.App.Biosci.6:237-245,1990)、 Catalyst(Molecular Simulations Inc.)、Catalyst/SHAPE(Molecular Simulations Inc.)、 Cerius2.DBAccess(Molecular Simulations Inc.)、HypoGen(Molecular Simulations Inc.)、 Insight II(Molecular Simulations Inc.)、Discover(Molecular Simulations Inc.)、CHARMm (Molecular Simulations Inc.)、Felix(Molecular Simulations Inc.)、DelPhi(Molecular Simulations Inc.)、QuanteMM(Molecular Simulations Inc.)、Homology(Molecular Simulations Inc.)、Modeler(Molecular Simulations Inc.)、ISIS(Molecular Simulations Inc.)、Quanta/Protein Design(Molecular Simulations Inc.)、WebLab(Molecular Simulations Inc.)、WebLab Diversity Explorer(Molecular Simulations Inc.)、Gene Explorer(Molecular Simulations Inc.)、SeqFold(Molecular Simulations Inc.)、MDL 可用化学制品目录数据库(Available Chemicals Directory database)、MDL药品数据报 告数据库(Drug Data Report data base)、综合医药化学数据库(Comprehensive Medicinal Chemistry database)、德温特世界药物索引数据库(World Drug Index database)、BioByteMasterFile数据库、Genbank数据库和Genseqn数据库。其它的程 序和数据库对于本公开内容的所述技术领域内的技术人员是显而易见的。
【0241】可以用上述程序检测的基序包括:编码亮氨酸拉链的序列、螺旋-转角- 螺旋基序、糖基化位点、泛素化位点、α螺旋和β折叠、编码指导被编码的蛋白分泌 的信号肽的信号序列、在转录调节中涉及的序列如同源框、酸性伸展物(acidic stretches)、酶活性位点、底物结合位点和酶切割位点。
核酸的杂交
【0242】本发明提供了可在严格性条件下与本发明的示例性序列,例如在具有一 个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、 D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、 D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K 或Q265R的突变的SEQ ID NO:177或SEQ ID NO:178中所提及的序列,或者编码包 括在具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、E94R、D100L、D100M、 D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、I117W、P118W、E125K、 S168N、D171V、D171E、M176W、D230H、D230R、D234W、D234V、D234G、D234R、 D234K或Q265R的突变的SEQ ID NO:177或SEQ ID NO:178中所提及的序列的多肽 的核酸杂交的分离的、合成的或者重组的核酸。严格条件可以是高度严格条件、中度 严格条件、低度严格条件,包括在此描述的高度的和降低的严格性条件。在可选的方 面,本发明的核酸根据它们在严格条件下杂交的能力来定义,它们可以在大约5个残 基到某分子,例如本发明的示例性核酸全长之间。例如,它们的长度可以是至少5、 10、15、20、25、30、35、40、50、55、60、65、70、75、80、90、100、150、200、 250、300、350、400个残基。比全长核酸较短的核酸也包括在内。这些核酸可以用 作例如杂交探针、标记探针、PCR寡核苷酸探针、iRNA(单链或者双链)、编码抗体 结合肽(表位)的反义序列或序列、基序、活性位点、结合结构域、调控结构域以及 类似物。
【0243】一方面,本发明的核酸通过它们在高度严格性下杂交的能力定义,高度 严格性包括在大约37℃到42℃的温度下大约50%的甲酰胺的条件。一方面,本发明 的核酸通过它们在降低的严格性下杂交的能力定义,降低的严格性包括在大约30℃ 到35℃在大约35%至25%的甲酰胺中的条件。可以选择地,本发明的核酸通过它们 在高度严格性下杂交的能力定义,高度严格性包括的条件为:在42℃、在50%甲酰 胺、5×SSPE、0.3%SDS中,和封闭核酸的重复序列,如cot-1或鲑精DNA(例如200μg /ml的剪切和变性鲑精DNA)。一方面,本发明的核酸通过它们在降低的严格性条件 下杂交的能力定义,降低的严格性条件包括在35℃的降低温度下的35%甲酰胺中。
【0244】杂交以后,滤膜可以在50℃,用6×SSC,0.5%的SDS洗涤。超过25 %的甲酰胺,这些条件认为是“中度”条件,低于25%的甲酰胺,这些条件认为是“低 度”条件。“中度”杂交条件的一个特定例子是当上面的杂交在甲酰胺为30%进行时。 “低严格性”杂交条件的特定例子是当上面的杂交在甲酰胺为10%进行时。
【0245】与特定水平的严格性相对应的温度范围可以进一步通过计算感兴趣的核 酸中嘌呤与嘧啶的比例,并且相应地调节温度来缩小。本发明的核酸也通过其可以在 Ausubel和Sambrook中所述的高度、中度、低度严格性条件下杂交的能力来定义。 对上面的范围和条件所作的变化可以用于实施本发明,并且是本领域技术人员所熟知 的。下面进一步描述了杂交条件。
寡核苷酸探针和应用方法
【0246】本发明也提供了用于鉴定编码具有磷脂酶活性的多肽的核酸的核酸探 针。一方面,探针包括在具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、 E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、 I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、 D234V、D234G、D234R、D234K或Q265R的突变的SEQ ID NO:177或SEQ ID NO:178 中所阐明的序列的至少10个连续的碱基。可选地,本发明的探针可以是本发明的序 列中所阐明的序列的至少大约5、6、7、8、9、10、11、12、13、14、15、16、17、 18、19、20、21、22、23、24、25、30、35、40、50、55、60、65、70、75、80、90、 100或150,或更多,或大约10到50、大约20到60、大约30到70个连续碱基。这 些探针通过结合或者杂交来鉴定核酸。这些探针可以用于本发明的阵列中,见下面的 讨论,包括例如毛细管阵列。本发明的探针也可以用于分离其它的核酸或多肽。
【0247】本发明的探针可以用于确定是否生物样品,如土壤样品,含有具有本发 明的核酸序列的生物或者可以从其获得该核酸的生物。在这一程序中,获得了潜在地 隐藏了从其分离得到核酸的生物体的生物样品,并且从该生物样品获得核酸。在允许 探针与样品中存在的任何互补序列特异性杂交的条件下,将核酸与探针接触。在必要 的情况下,为了确定允许探针特异地与互补序列杂交的条件,可以让探针与来自已知 含有互补序列的样品中的互补序列相接触,同时与不含有互补序列的对照序列相接 触。杂交条件,如杂交缓冲液中的盐浓度、杂交缓冲液中甲酰胺的浓度或者杂交温度, 可以进行变化以确定允许所述探针特异地与互补的核酸杂交的条件(参见有关特异性 杂交条件的论述)。
【0248】如果该样品含有从中可分离出核酸的生物体,那么探针的特异性杂交被 检测到。杂交可以通过用可检测的试剂标记探针来检测,所述可检测的试剂如放射性 同位素、荧光染料或能催化可检测产物形成的酶。使用标记探针来检测样品中互补核 酸的存在的许多方法对于本领域技术人员是熟知的。这些方法包括DNA印迹法、RNA 印迹法、集落杂交方法和斑点印迹法。这些方法中的每一种方法的方案在Ansubel和 Sambrook中给出。
【0249】可选地,可以在一个扩增反应中使用一种以上的探针(其中的至少之一 可以特异地与存在于核酸样品的任何互补序列杂交)来检测样品中是否含有包括本发 明的核酸序列的生物体(如,从中分离出所述核酸的生物体)。在一方面,所述探针 包括寡核苷酸。一方面,所述扩增反应可以包括PCR反应。PCR的实验方案见前面 Ausubel和Sambrook的如上的所述(参见有关扩增反应的讨论)。在这些程序中,所 述样品中的核酸与所述探针相接触,进行所述扩增反应,检测任何得到的扩增产物。 扩增产物可以通过对反应产物进行凝胶电泳,并用嵌入剂如溴化乙啶染胶来进行检 测。可选地,一种或者多种探针可以用放射性同位素标记,并且在凝胶电泳后通过放 射性自显影来检测放射性的扩增产物的存在与否。
【0250】源自位于本发明序列的3’或者5’末端附近的序列的探针也可以用于染色 体步移(chromosome walking)程序中,以鉴定含有另外的,如基因组序列的克隆。 这样的方法允许从宿主生物体中分离出编码其它感兴趣的蛋白的基因。
【0251】在一方面,本发明的核酸被用作探针来鉴定和分离相关的核酸。在一些 方面,所述的相关的核酸可以是来自某些生物体的cDNA或者基因组DNA,而不是 本发明的核酸起初被分离出来的那些生物体。在这样的程序中,核酸样品与所述探针 在允许探针特异地与相关序列杂交的条件下接触。所述探针与来自相关生物体的核酸 的杂交然后采用以上描述的任何方法来检测。
【0252】在核酸杂交反应中,用于达到特定严格性水平的条件可以根据待杂交核 酸的性质来进行改变。例如,在选择杂交条件时可以考虑核酸杂交区域的长度、互补 程度、核苷酸序列组成(如,GC对AT含量的比率)、以及核酸类型(如,RNA对 DNA)。另外考虑是否其中一个核酸固定于,如滤膜上。杂交可以在低严格性,中度 严格性或者高严格性的条件下进行。作为核酸杂交的例子,含有固定化变性核酸的多 聚膜首先在45℃下,在由0.9M NaCl、50mM NaH2PO4,PH 7.0、5.0mM Na2EDTA、 0.5%SDS、10×Denhardt′s和0.5mg/ml多核腺苷酸组成的溶液中预杂交30分钟。然 后将大约2×107cpm(比活性4-9×108cpm/ug)的32P末端标记的寡核苷酸探针加入 到溶液中。在12-16小时的温育以后,膜在室温(RT)下于含有0.5%SDS的1×SET (150mM NaCl、20mM Tris盐酸,PH 7.8、1mM Na2EDTA)中洗涤30分钟,然后 在新鲜配制的1×SET,在Tm-10℃下,再洗涤寡核苷酸探针30分钟。然后将膜暴露 于自显影膜上来检测杂交信号。
【0253】通过改变用于鉴定核酸,如与可检测探针杂交的cDNA或者基因组DNA 的杂交条件的严格性,可以鉴定和分离与探针具有不同同源性水平的核酸。可以通过 在低于探针的解链温度下的不同温度中进行杂交而使严格性变化。解链温度,Tm, 是指(在定义的离子强度和pH下)50%的靶序列与精确互补的探针杂交的温度。非 常严格的条件被选择为与特定的探针的Tm值相等或比其低大约5℃。探针的解链温 度可以通过应用以下的示例性公式计算。对于在14到70个核苷酸长度的探针,应用 此公式计算解链温度:Tm=81.5+16.6(log[Na+])+0.41(G+C分数)-(600/N),其中的N 是探针的长度。如果杂交在含有甲酰胺的溶液中进行,解链温度可以通过应用以下的 公式来计算:Tm=81.5+16.6(log[Na+])+0.41(G+C分数)-(0.63%甲酰胺)-(600/N),其 中的N是探针的长度。预杂交可以在6×SSC、5×Denhardt′s试剂、0.5%SDS、100μg/ml 变性的鲑鱼精DNA片段或者6×SSC、5×Denhardt′s试剂、0.5%SDS、100μg/ml变性 的鲑鱼精DNA片段、50%甲酰胺中进行。SSC和Denhardt′s和其它溶液的配方列于 例如Sambrook中。
【0254】通过在以上所示预杂交溶液中加入可以检测到的探针来进行杂交。当所 述探针包括双链DNA时,它应在加入到杂交缓冲液前被变性。滤膜与杂交缓冲液接 触足够长的时间使得探针与含有其互补序列或者其同源序列的cDNA或者基因组 DNA杂交。对于超过200个核苷酸长度的探针,杂交可以是在低于Tm温度15-25℃ 进行。对于较短的探针,如寡核苷酸探针,杂交可以是在低于Tm温度5-10℃下进行。 一方面,在6×SSC溶液中的杂交在大约68℃进行。一方面,在含有50%甲酰胺的溶 液中的杂交在大约42℃进行。考虑所有前述的杂交在高严格性条件下进行。
【0255】杂交以后,洗涤滤膜以去除任何非特异结合的可以检测到的探针。洗涤 滤膜所用的严格性也可以根据正被杂交的核酸的性质、正被杂交的核酸的长度、互补 的程度,核苷酸序列的组成(如,GC对AT的含量),以及核酸类型(如,RNA对 DNA)来进行变化。逐渐增高的严格性条件洗涤的例子如下:2×SSC,0.1%SDS,室 温下15分钟,(低严格性);0.1×SSC,0.5%SDS,室温下30分钟到1小时(中度严 格性);0.1×SSC,0.5%SDS,杂交温度和68℃之间,15到30分钟(高严格性);0.15M NaCl,在72℃下15分钟(极高严格性)。最后低严格性洗涤可以在0.1×SSC,室温 下进行。以上的例子仅仅示出了可以用于实施本发明,例如洗涤滤膜的一组条件。本 领域技术人员将知道,对于不同严格性洗涤有无数方案,所有这些方案都可以用于实 施本发明。
【0256】已经与探针杂交的核酸可以通过放射自显影或者其它传统的技术来确 定。可以改变以上的程序来鉴定与探针序列具有降低水平的同源性的核酸。例如为了 获得与可检测探针具有降低水平的同源性的核酸,可以应用不太严格的条件。例如, 在含有Na+浓度为大约1M的杂交缓冲液中,杂交温度可以以5℃的幅度从68℃降低 到42℃。杂交后,滤膜用2×SSC,0.5%SDS,在杂交温度下洗膜。超过50℃,这些 条件认为是“中度”条件,低于50℃,这些条件认为是“低度”条件。“中度”杂交条件的 例子是上面的杂交在55℃进行时。“低严格性”杂交条件的特定例子是上面的杂交在 45℃进行时。
【0257】可选地,杂交在缓冲液,如含有甲酰胺的6×SSC中,在42℃下进行。 在这种情况下,杂交缓冲液中甲酰胺的浓度可以以5%的幅度从50%降低到0%,来 确定与探针具有降低的同源性水平的克隆。杂交后,滤膜可以用6×SSC,0.5%SDS 在50℃下洗涤。当甲酰胺浓度大于25%时,这些条件认为是“中度”条件,而低于25 %时为“低度”条件。“中度”杂交条件的特定例子是当以上的杂交在30%的甲酰胺中进 行时。“低严格性”杂交条件的特定例子是当以上的杂交在10%的甲酰胺中进行时。
【02580】本发明的这些探针和方法可以用于分离具有与本发明的核酸序列有至 少大约99%、至少98%、至少97%、至少96%、至少95%、至少90%、至少85%、 至少80%、至少75%、至少70%、至少65%、至少60%、至少55%、或者至少50 %的同源性的序列的核酸,该本发明的核酸序列包括其的至少大约10、15、20、25、 30、35、40、50、75、100、150、200、250、300、350、400或者500个连续的碱基, 和与之互补的序列。同源性可以应用在此所述的比对算法测定。例如,同源的多核苷 酸可以具有在此说明的其中一个编码序列的天然发生的等位基因突变体的编码序列。 当与本发明的核酸比较时,这样的等位基因突变体可以具有置换,缺失或者插入一个 或者多个核苷酸。
【0259】此外,本发明的探针和方法可以用于分离编码与本发明多肽具有至少大 约99%、至少95%、至少90%、至少85%、至少80%、至少75%、至少70%、至 少65%、至少60%、至少55%、或者至少50%的序列同一性(同源性)的多肽的核 酸,如应用序列比对算法(如,使用默认参数的FASTA版本3.0t78的算法,或者具 有在此提及的示例性设置的BLAST 2.2.2程序)确定的,所述本发明多肽含有其至少 5、10、15、20、25、30、35、40、50、75、100或者150个连续的氨基酸。
抑制磷脂酶的表达
【0260】本发明进一步提供与本发明的核酸序列如磷脂酶编码核酸互补的核酸 (如,本发明的核酸序列的反义序列)。反义序列可以抑制磷脂酶编码基因的转运, 剪接或者转录。抑制可以通过靶向基因组DNA或者信使RNA而起作用。例如,通 过杂交和/或切割,可以抑制被靶向的核酸的转录或者功能。本发明提供的特别有效 的一套抑制物包括能够结合磷脂酶基因或者信使的寡核苷酸,在每一种情况下,阻止 或者抑制磷脂酶的产生或者发挥功能。结合可以通过序列特异性的杂交实现。另一类 有用的抑制物包括引起磷脂酶信使物失活或者切割的寡核苷酸。寡核苷酸可以具有引 起此种切割的酶活性,如核酶。寡核苷酸可以进行化学修饰,或者接合到能够切割互 补核酸的酶或组合物上。操作人员可以筛选具有许多不同的此类寡核苷酸的文库,以 获得那些具有期望的活性的寡核苷酸。
【0261】磷脂酶表达的抑制可以具有多种不同的工业用途。例如,抑制磷脂酶的 表达可以减慢或者阻止酸败。当脂类或多肽,如,结构脂类或者多肽,被酶降解时, 可能发生酸败。这可以导致水果和蔬菜的变质或者腐败。一方面,应用可以抑制磷脂 酶的表达和/或活性的本发明的组分,例如,抗体、反义寡核苷酸、核酶和RNAi,可 以用于减缓或者阻止酸败。因此,在一方面,本发明提供方法和组分,包括将本发明 的抗体、反义寡核苷酸、核酶和RNAi应用于植物或者植物产品(如,水果、种籽、 根、叶等),以阻止或者延缓酸败。这些组分也可以由植物(如,转基因植物)或者 其它生物(如,用本发明的磷脂酶基因转化的细菌或者其它微生物)表达。
【0262】用于抑制磷脂酶表达的本发明的组分(如反义物、iRNA、核酶、抗体) 可以用作药物组分。
反义寡核苷酸
【0263】本发明提供能够结合磷脂酶信使的反义寡核苷酸,该反义寡核苷酸可以 通过靶向mRNA来抑制磷脂酶活性。设计反义寡核苷酸的策略在科学和专利文献中 已经充分说明,并且技术熟练人员可以应用本发明的新型试剂来设计这样的磷脂酶寡 核苷酸。例如,用于筛选有效的反义寡核苷酸的基因步行/RNA作图试验方案是本领 域所熟知的参见,如Ho(2000)Methods Enzymol.314:168-183,该文献描述了RNA 作图分析方法,作图分析方法以标准的分子技术为基础,为有效的反义序列选择提供 了简单而可靠的方法。也参见Smith(2000)Eur.J.Pharm.Sci.11:191-198。
【0264】也可以应用天然存在的核酸作为反义寡核苷酸。反义寡核苷酸可以是任 何长度;例如,在可选的方面,反义寡核苷酸在大约5到100、大约10到80、大约 15到60、大约18到40之间。最佳长度可以通过常规的筛选方法来确定。反义寡核 苷酸可以以任何浓度存在。最佳浓度可以通过常规的筛选方法来确定。已经知道有许 多能够解决该潜在的问题的合成的,非天然存在的核苷酸和核酸类似物。例如,可以 应用含有非离子性骨架,如N-(2-氨基乙基)甘氨酸单位的肽核酸(PNAs)。也可以应 用具有硫代磷酸连接的反义寡核苷酸,如WO 97/03211;WO 96/39154;Mata(1997) Toxicol Appl Pharmacol 144:189-197;Antisense Therapeutics,ed.Agrawal(Humana Press,Totowa,N.J.,1996)所述。正如上面所描述的,本发明提供的具有合成DNA骨 架类似物的反义寡核苷酸也可以包括二硫代磷酸酯、甲基膦酸、氨基磷酸酯、烷基磷 酸三酯、氨基磺酸酯、3′-硫代乙缩、亚甲基(甲基亚氨)、3′-N-氨基甲酸酯和吗啉代 氨基甲酸酯核酸。
【0265】可以应用组合化学方法产生大量的寡核苷酸,可以对这些寡核苷酸快速 筛选,以获得对任何靶,如本发明的有义和反义的磷脂酶序列,具有适当的结合亲和 性和特异性的特定的寡核苷酸(见,如Gold(1995)J.of Biol.Chem.270:13581-13584)。
抑制性核酶
【0266】本发明提供能够结合磷脂酶信使的核酶,其可以通过靶向mRNA来抑 制磷脂酶的酶活性。设计核酶和选择用于靶向作用的对磷脂酶具特异性的反义序列在 科学和专利文献中已经充分说明,并且技术熟练人员可以应用本发明的新型试剂来设 计这样的核酶。核酶通过核酶的靶RNA结合部分结合靶RNA而起作用,该核酶的 靶RNA结合部分与切割靶RNA的RNA酶活部分非常接近。因此,核酶通过互补的 碱基配对作用,识别并且结合靶RNA,并且一旦结合于正确的位点,将酶法切割靶 RNA并且使靶RNA失活。如果切割发生在编码序列中,以这种方式进行的靶RNA 的切割将破坏其指导编码蛋白合成的能力。当核酶结合并且切割其靶RNA后,一般 情况下,将从RNA上释放,因此能够反复地结合和切割新的靶标。
【0267】在一些情况下,核酶的酶促性质会优于其它的技术,如反义技术(其中 核酸分子仅结合于核酸靶来阻止其转录、翻译或者与其它分子的结合),因为实现治 疗效果所必要的核酶有效浓度可能低于反义寡核苷酸的浓度。这一潜在的优点反映出 核酶可以以酶促方式进行作用的能力。因此,单个核酶分子可以切割靶RNA的多个 分子。另外,核酶典型地是高度特异性的抑制物,其抑制作用的特异性不仅依赖于碱 基配对的结合机制,也依赖于该分子抑制与其结合的RNA的表达的机制。即,所述 抑制是由切割靶RNA引起的,因此特异性定义为靶RNA的切割率与非靶RNA的切 割率的比值。除了涉及碱基配对的那些因素,这种切割机制还依赖于另外的因素。这 样,核酶作用的特异性比结合于同样的RNA位点的反义寡核苷酸高。
【0268】具有酶活的核酶RNA分子可以以锤头状基序(hammerhead motif)形 成,但也可以以发夹、肝炎δ病毒、I类内含子或者RnaseP样的RNA(与RNA的引 导序列有关)基序形成。这样的锤头状基序的例子在如Rossi(1992)Aids Research and Human Retroviruses 8:183中有描述;发夹基序在Hampel(1989)Biochemistry 28:4929 和Hampel(1990)Nuc.Acids Res.18:299中有描述;肝炎δ病毒基序在Perrotta(1992) Biochemistry 31:16中有描述;RNaseP基序在Guetrier-Takada(1983)Cell 35:849中 有描述;I类内含子在Cech美国专利4,987,071中有描述。描述这些特异基序的目的 不是限制性的;本领域技术人员将认识到,本发明的酶RNA分子具有与一个或者多 个靶基因RNA区域互补的特异性底物结合位点,并且具有在底物结合位点内或者周 围赋予该分子以RNA切割活性的核苷酸序列。
RNA干涉(RNAi)
【0269】一方面,本发明提供包括本发明的磷脂酶序列的RNA抑制分子,所谓 的“RNAi”分子。RNAi分子包括双链RNA(dsRNA)分子。RNAi可以抑制磷脂酶基 因的表达。在一个方面,RNAi的长度大约为15、16、17、18、19、20、21、22、23、 24、25或更多个双链体核苷酸。虽然本发明不限于任何特殊的作用机制,但RNAi 可进入细胞中,引起相似或相同序列的单链RNA(ssRNA)的降解,包括内源性mRNA。 当细胞暴露于双链RNA(dsRNA)时,来自同源基因的mRNA被称为RNA干扰(RNAi) 的过程选择性地降解。RNAi的一个可能的基本机制是将与特定的基因序列匹配的双 链RNA(dsRNA)打断成为称为短的干扰RNA的短碎片,它可触发与其序列匹配的 mRNA的降解。在一个方面,本发明的RNAi可用于基因沉默(gene-silencing)疗法 中,见,例如Shuey(2002)Drug Discov.Today 7:1040-1046。在一个方面,本发明提 供了使用本发明的RNAi选择性降解RNA的方法。该过程可在体外、离体或体内实 施。在一个方面,本发明的RNAi分子可用来在细胞、器官或动物中产生丧失功能的 突变。制备和应用可选择性降解RNA的RNAi分子的方法在本领域中是熟知的,见, 例如美国专利6,506,559;6,511,82;6,515,109;6,489,127。
核酸修饰
【0270】本发明提供产生本发明的核酸,例如那些编码磷脂酶的核酸的变体的方 法。在可选择的实施方式中,本发明提供了修饰本发明的酶的方法,例如通过随意或 随机方法,或非随机方法或“定向进化”方法,诸如基因位点饱和诱变TM(GSSM) 对其编码序列进行突变,以改变酶的活性pH范围或最佳活性pH范围,活性温度范 围或最佳活性温度范围、特异性、活性(动力学);酶对糖基化、磷酸化或金属(例如 Ca、Mg、Zn、Fe、Na)的应用,例如以影响pH/温度稳定性。本发明提供了修饰本发 明的酶的方法,例如通过GSSM对其编码序列进行突变,以增加它对蛋白酶活性的 抗性。本发明提供了修饰本发明的酶的方法,例如通过GSSM对其编码序列进行突 变,以改变酶对Ca、Mg、Na的特异性金属螯合剂的应用,其不会螯合Zn。本发明 提供了修饰本发明的酶的方法,例如通过GSSM对其编码序列进行突变,其将具有 期望的活性组合,例如PI、PA和PC/PE特异性PLCs。
【0271】这些方法可以重复或者在不同的组合中使用,产生与模板核酸编码的磷 脂酶相比具有改变的或不同活性或者改变的或不同稳定性的磷脂酶。这些方法也可以 重复或者在不同的组合中使用,例如,产生基因/信息表达,信息翻译或者信息稳定 性上的变异。另一方面,细胞的遗传组分可以通过,例如离体的同源基因修饰,然后 再插入细胞中而加以改变。
【0272】本发明的核酸可以通过任何方法改变。例如,无规则或随机方法,或者, 非随机方法,或者“定向进化”方法。
【0273】基因的随机突变方法在本领域是已知的,参见如,美国专利5,830,696。 例如,可以应用突变剂来对基因进行随机突变。突变剂包括,如,紫外线或者γ辐射, 或者化学诱变剂,如,丝裂霉素,亚硝酸,光活化的补骨脂内酯,它们单独使用或者 组合使用来诱导DNA的断裂,其可以通过重组被修复。其它的化学诱变剂包括,如, 亚硫酸氢钠、亚硝酸、羟胺、肼或者甲酸。其它的诱变剂是核苷酸前体的类似物,如, 亚硝基胍、5-溴尿嘧啶、2-氨基嘌呤或者吖啶。这些试剂可以加入到PCR反应中替换 核苷酸前体,从而突变该序列。也可以应用嵌入试剂如普罗黄素、吖啶黄、奎纳克林 和类似物。
【0274】可以应用分子生物学上的任何技术,如随机PCR诱变,参见,如,Rice (1992)Proc.Natl.Acad.Sci.USA 89:5467-5471;或者组合式多重盒式诱变,参见如, Crameri(1995)Biotechinques 18:194-196。可选择地,核酸,如基因,可以在随机片 段化后重新装配,参见,如,美国专利6,291,242;6,287,862;6,287,861;5,955,358; 5,830,721;5,824,514,5,811,238;5,605,793。在可选择的方面,修饰、增加或者删除 可以通过易错PCR、改组、寡核苷酸诱导的定点突变、装配PCR、有性PCR诱变、 体内诱变、盒式诱变、递归整体诱变、指数整体突变、位点专一性诱变、基因再装配、 基因位点饱和诱变(GSSM)、合成连接重装配(SLR)、重组、递归序列重组(recursive sequence recombination)、硫代磷酸酯修饰的DNA诱变、含有尿嘧啶模板的诱变、缺 口双重诱变(gapped duplex mutagenesis)、点错配修复诱变(point mismatch repair mutagenesis)、修复缺陷型宿主株诱变、化学诱变、放射诱变、缺失诱变、限制选择 诱变(restriction-selection mutagenesis)、限制纯化诱变(restriction-purification mutagenesis)、人工基因合成、整体诱变、嵌合核酸多聚体生成和/或者这些方法和其 它方法的组合产生。
【0275】以下的出版物描述了各种递归重组程序和/或可以并入到本发明的方法 中的方法:Stemmer(1999)“Molecular breeding of viruses for targeting and other clinical properties”Tumor Targeting 4:1-4;Ness(1999)Nature Biotechnology 17:893-896;Chang (1999)“Evolution of a cytokine using DNA family shuffling”Nature Biotechnology 17:793-797;Minshull(1999)“Protein evolution by molecular breeding”Current Opinion in Chemical Biology 3:284-290;Christians(1999)“Directed evolution of thymidine kinase for AZT phosphorylation using DNA family shuffling”Nature Biotechnology 17:259-264; Crameri(1998)“DNA shuffling of a family of genes from diverse species accelerates directed evolution”Nature 391:288-291;Crameri(1997)“Molecular evolution of an arsenate detoxification pathway by DNA shuffling”Nature Biotechnology 15:436-438; Zhang(1997)“Directed evolution of an effective fucosidase from a galactosidase by DNA shuffling and screening”Proc.Natl.Acad.Sci.USA 94:4504-4509;Patten等(1997) “Applications of DNA Shuffling to Pharmaceuticals and Vaccines”Current Opinion in Biotechnology 8:724-733;Crameri等(1996)“℃onstruction and evolution of antibody-phage libraries by DNA shuffling”Nature Medicine 2:100-103;Crameri等 (1996)“Improved green fluorescent protein by molecular evolution using DNA shuffling”Nature Biotechnology 14:315-319;Gates等(1996)“Affinity selective isolation of ligands from peptide libraries through display on a lac repressor ′headpiece dimer” Journal of Molecular Biology 255:373-386;Stemmer(1996)“Sexual PCR and Assembly PCR”In:The Encyclopedia of Molecular Biology.VCH Publishers,New York.447-457 页;Crameri和Stemmer(1995)“Combinatorial multiple cassette mutagenesis creates all the permutations of mutant and wildtype cassettes”Bio Techniques 18:194-195;Stemmer 等(1995)“Single-step assembly of a gene and entire plasmid form large numbers of oligodeoxyribonucleotides”Gene,164:49-53;Stemmer(1995)“The Evolution of Molecular Computation”Science 270:1510;Stemmer(1995)“Searching Sequence Space” Bio/Technology 13:549-553;Stemmer(1994)“Rapid evolution of a protein in vitro by DNA shuffling”Nature 370:389-391;和Stemmer(1994)“DNA shuffling by random fragmentation and reassembly:In vitro recombination for molecular evolution”Proc.Natl. Acad.Sci.USA 91:10747-10751。
【0276】产生多样性的突变方法包括,例如,定点诱变(Ling等(1997)“Approaches to DNA mutagenesis:an overview”Anal Biochem.254(2):157-178;Dale等(1996) “Oligonucleotide-directed random mutagenesis using the phosphorothioate method” Methods Mol.Biol.57:369-374;Smith(1985)“In vitro mutagenesis”Ann.Rev.Genet. 19:423-462;Botstein & Shortle(1985)“Strategies and applications of in vitro mntagenesis” Science 229:1193-1201;Carter(1986)“Site-directed mutagenesis”Biochem.J.237:1-7; Kunkel(1987)“The efficiency of oligonucleotide directed mutagenesis”在Nucleic Acids & Molecular Biology(Eckstein,F.和Lille y,D.M.J.eds.,Springer Verlag,Berlin));使 用含有尿嘧啶的模板的诱变(Kunkel(1985)“Rapid and efficient site-specific mutagenesis without phenotypic selection”Proc.Natl.Acad.Sci.USA 82:488-492; Kunkel等(1987)“Rapid and efficient site-specific mutagenesis without phenotypic selection”Methods in Enzymol.154,367-382;和Bass等(1988)“Mutant Trp repressors with new DNA-binding specificities”Science 242:240-245);寡核苷酸诱导的定点诱变 (Methods in Enzymol.100:468-500(1983);Methods in Enzymol.154:329-350(1987); Zoller & Smith(1982)“Oligonucleotide-directed mutagenesis using M 13-derived vectors: an efficient and general procedure for the production of point mutations in any DNA fragment”Nucleic Acids Res.10:6487-6500;Zoller & Smith(1983) “Oligonucleotide-directed mutagenesis of DNA fragments cloned into M13 vectors” Methods in Enzymol.100:468-500;和Zoller & Smith(1987)″Oligonucleotide-directed mutagenesis:a simple method using two oligonucleotide primers and a single-stranded DNA template”Methods in Enzymol.154:329-350);硫代磷酸酯修饰的DNA诱变 (Taylor等(1985)“The use of phosphorothioate-modified DNA in restriction enzyme reactions to prepare nicked DNA”Nucl.Acids Res.13:8749-8764;Taylor等(1985)“The rapid generation of oligonucleotide-directed mutations at high frequency using phosphorothioate-modified DNA”Nucl.Acids Res.13:8765-8787(1985);Nakamaye (1986)“Inhibition of restriction endonuclease Nci I cleavage by phosphorothioate gronps and its application to oligonucleotide-directed mutagenesis”Nucl.Acids Res.14: 9679-9698;Sayers等(1988)“Y-T Exonucleases in phosphorothioate-based oligonucleotide-directed mutagenesis”Nucl.Asids Res.16:791-802;和Sayers等(1988) “Strand specific cleavage of phosphorothioate-containing DNA by reaction with restriction endonucleases in the presence of ethidium bromide”Nucl.Acids Res.16:803-814);使用 缺口二倍DNA的诱变(Kramer等(1984)“The gapped duplex DNA approach to oligonucleotide-directed mutation construction”Nucl.Acids Res.12:9441-9456;Kramer & Fritz(1987)Methods in Enzymol.“Oligonucleotide-directed construction of mutations via gapped duplex DNA”154:350-367;Kramer等(1988)“Improved enzymatic in vitro reactions in the gapped duplex DNA approach to oligonucleotide-directed construction of mutations”Nucl.Acids Res.16:7207;和Fritz等(1988)“Oligonucleotide-directed construction of mutations:a gapped duplex DNA procedure without enzymatic reactions in vitro”Nucl.Acids Res.16:6987-6999)。
【0277】可以用于实践本发明方法的另外的实验方案包括点错配修复(Kramer (1984)“Point Mismatch Repair”Cell 38:879-887),应用修复缺陷型宿主株的诱变 (Carter等(1985)“Improved oligonucleotide site-directed mutagenesis using M13 vectors”Nucl.Acids Res.13:4431-4443;和Carter(1987)“Improved oligonucleotide-directed mutagenesis using M13 vectors”Methods in Enzymol.154: 382-403),缺失诱变(Eghtedarzadeh(1986)“Use of oligonucleotides to generate large deletions”Nucl.Acids Res.14:5115),限制-选择和限制-选择和限制-纯化(Wells等 (1986)“Importance of hydrogen-bond formation in stabilizing the transition state of subtilisin”Phil.Trans.R.Soc.Lond.A 317:415-423),通过全基因合成的诱变(Nambiar 等(1984)“Total synthesis and cloning of a gene coding for the ribonuclease S protein” Science 223:1299-1301;Sakamar和Khorana(1988)“Total synthesis and expression of a gene for the a-subunit of bovine rod outer segment guanine nucleotide-binding protein (transducin)”Nucl.Acids Res.14:6361-6372;Wells等(1985)“Cassette mutagenesis: an efficient method for generation of multiple mutations at defined sites”Gene 34:315-323; 和Grundstrom等(1985)“Oligonucleotide-directed mutagenesis by microscale‘shot-gun’ gene synthesis”Nucl.Acids Res.13:3305-3316),双链断裂修复(Mandecki(1986); Arnold(1993)“Protein engineering for unusual environments”Current Opinion in Biotechnology 4:450-455。“Oligonucleotide-directed double-strand break repair in plasmids of Escherichia coli:a method for site-speciflc mutagenesis”Proc.Natl.Acad.Sci. USA,83:7177-7181)。很多以上的方法的另外的细节可在Methods in Enzymology第 154卷中发现,其中也描述了用于解决各种诱变方法中所遇到的问题的有用策略。
【0278】也参见Stemmer的美国专利5,605,793(1997年2月25日),“Methods for In Vitro Recombination;”Stemmer等人的美国专利5,811,238(1998年9月22日) “Methods for Generating Polynucleotides having Desired Characteristics by Iterative Selection and Recombination;”Stemmer等人的美国专利5,830,721(1998年11月3日), “DNA Mutagenesis by Random Fragmentation and Reassembly;”Stemmer等人的美国专 利5,834,252(1998年11月10日)“End-Complementary Polymerase Reaction;”Minshull 等人的美国专利5,837,458(1998年11月17日),“Methods and Compositions for Cellular and Metabolic Engineering;”WO 95/22625,Stemmer和Cramen,“Mutagenesis by Random Fragmentation and Reassembly;”Stemmer和Lipschutz的WO 96/33207“End Complementary Polymerase Chain Reaction;”Stemmer和Crameri的WO 97/20078 “Methods for Generating Polynucleotides having Desired Characteristics by Iterative Selection and Recombination;”Minshull和Stemmer的WO 97/35966,“Methods and Compositions for Cellular and Metabolic Engineering;”Punnonen等人的WO 99/41402 “Targeting of Genetic Vaccine Vectors;”Punnonen等人的WO 99/41383“Antigen Library Immunization;”Punnonen等人的WO 99/41369“Genetic Vaccine Vector Engineering;” Punnonen等人的WO 99/41368“Optimization of Immunomodulatory Properties of Genetic Vaccines;”Stemmer和Crameri的EP 752008“DNA Mutagenesis by Random Fragmentation and Reassembly;”Stemmer的EP 0932670“Evolving Cellular DNA Uptake by Recursive Sequence Recombination;”Stemmer等人的WO 99/23107,“Modification of Virus Tropism and Host Range by Viral Genome Shuffling;”Apt等人的WO 99/21979, “Human Papillomavirus Vectors;”del Cardayre等人的WO 98/31837“Evolution of Whole Cells and Organisms by Recursive Sequence Recombination;”Patten和Stemmer 的WO 98/27230“Methods and Compositions for Polypeptide Engineering,”Stemmer等 人的WO 98/27230,“Methods for Optimization of Gene Therapy by Recursive Sequence Shuffling and Selection,”WO 00/00632,“Methods for Generating Highly Diverse Libraries,”WO 00/09679,“Methods for Obtaining in Vitro Recombined Polynucleotide Sequence Banks and Resulting Sequences,”Arnold等人的WO 98/42832, “Recombination of Polynucleotide Sequences Using Random or Defined Primers,”Arnold 等人的WO 99/29902,“Method for Creating Polynucleotide and Polypeptide Sequences,” Vind的WO 98/41653,“An in Vitro Method for Construction of a DNA Library,”Borchert 等人的WO 98/41622,“Method for constructing a Library Using DNA Shuffling,”和Pati 和Zarling的WO 98/42727,“Sequence Alterations using Homologous Recombination”。
【0279】某些美国申请提供了关于产生不同多样性的方法的额外细节,包括Patten 等人于1999年9月28日提交的“SHUFFLING OF CODON ALTEAED GENES”(美国 系列号09/407,800);del Cardayre等人于1998年7月15日提交的(美国系列号 09/166,188)和于1999年7月15日提交的(美国系列号09/354,922)“EVOLUTION OF WHOLE CELLS AND ORGANISMS BY RECURSIVE SEQUENCE RECOMBINATION”;Crameri等人的于1999年9月28日提交的 “OLIGONUCLEOTIDE MEDIATED NUCLEIC ACID RECOMBINATION”(美国系列 号09/408,392)和Crameri等人于2000年1月18日提交的“OLIGONUCLEOTIDE MEDIATED NUCLEIC ACID RECOMBINATION”(PCT/US00/01203);Welch等人于 1999年9月28日提交的“USE OF CODON-VARIED OLIGONUCLEOTIDE SYNTHESIS FOR SYNTHETIC SHUFFLING”(美国系列号09/408,393);Selifonov等 人于2000年1月18日提交的“METHODS FOR MAKING CHARACTER STRINGS, POLYNUCLEOTIDS & POLYPEPTIDES HAVING DESIRED CHARACTERISTICS” (PCT/US00/01202)和,例如,Selifonov等人于2000年7月18日提交的“METHODS FOR MAKING CHARACTER STRINGS,POLYNUCLEOTIDS & POLYPEPTIDES HAVING DESIRED CHARACTERISTICS”(美国系列号09/618,579);Selifonov和 Stemmer于2000年1月18日提交的“METHODS OF POPULATING DATA STRUCTURES FOR USE IN EVOLUTIONARY SIMULATIONS”(PCT/US00/01138); 和Affholter于2000年9月6日提交的“SINGLE-STRANDED N UCLEIC ACID TEMPLATE-MEDIATED RECOMBINATION AND NUCLEIC ACID FRAGMENT ISOLATION”(美国系列号09/656,549)。
【0280】非随机或“定向进化”方法包括,例如饱和诱变(例如GSSM)、合成连 接重装配(SLR)或其组合,它们被用于修饰本发明的核酸,以产生具有新的或改变 的特性(例如在高度酸性或碱性条件下的活性,在高温或低温的活性,等等)的磷脂 酶。由修饰的核酸编码的多肽可以在测试磷脂酶或其它活性之前被筛选活性。可以使 用任何测试形式或实验方案,例如使用毛细管阵列平台。例如参见美国专利6,361,974; 6,280,926;5,939,250。
饱和诱变或GSSM
【0281】本发明的一个方面,非随机的基因修饰,“定向进化过程”用于产生具有 新的或者改变的特性的磷脂酶。本方法的各种变化已经被称为“基因位点诱变”、“位 点饱和诱变”、“基因位点饱和诱变”或者简单地称为“GSSM”。饱和诱变可以与别的诱 变过程相结合。见,例如,美国专利6,171,820;6,238,884。一方面,GSSM包括提 供模板多核苷酸和众多的寡核苷酸,其中每种寡核苷酸包括与模板多核苷酸同源的序 列,因此靶向模板多核苷酸中的特异序列,以及为同源基因的变体的序列;通过使用 寡核苷酸复制模板多核苷酸,产生包括非随机序列变体的子代多核苷酸,从而产生包 括同源基因序列变异的多核苷酸。
【0282】一方面,含有简并N,N,G/T序列的密码子引物被用于将点突变引入多核 苷酸中,以便产生一组子代多肽,其中在每一氨基酸位置上可表现出全范围的单氨基 酸置换,置换发生的位置例如酶活性位点中的氨基酸残基,或将要被修饰的配体结合 位点。这些寡核苷酸可以包括相邻的第一同源序列,简并N,N,G/T序列,和任选地第 二同源序列。由使用这些寡核苷酸而得到的下游子代翻译产物包含沿着多肽的每一氨 基酸位点上的所有可能的氨基酸变化,这是由于N,N,G/T序列的简并性包括了所有 20个氨基酸的密码子。一方面,一个这样的简并寡核苷酸(例如包括一个简并N,N,G/T 序列盒)被用于使亲本多核苷酸模板中的每一原始密码子进行完全范围的密码子置 换。另一方面,使用至少两个简并序列盒,或在相同的寡核苷酸中或不同的寡核苷酸 中,用于使亲本多核苷酸模板中的至少两个原始密码子进行完全范围的密码子置换。 例如,一个寡核苷酸中可以包含一个以上N,N,G/T序列,以便在多于一个的位点上引 入氨基酸突变。这些多个N,N,G/T序列可以直接相邻,或被一个或多个额外的核苷酸 序列分隔开。另一方面,用于引入插入和删除的寡核苷酸可以单独使用,或者与含有 N,N,G/T序列的密码子组合使用,以便引入氨基酸插入、删除和/或置换的任何排列组 合。
【0283】一方面,两个或更多个连续氨基酸位置的同时诱变是使用含有相邻 N,N,G/T三联体的寡核苷酸进行的,即简并(N,N,G/T)n序列。另一方面,使用与 N,N,G/T序列相比具有较低简并性的简并序列盒。例如,在一些情况下,可能期望(例 如,在寡核苷酸中)使用仅包括一个N的简并三联体序列,其中所述的N可以在三 联体的第一、第二或第三位置上。在该三联体的剩余两个位置上,可以使用包括任意 排列组合的任何其它碱基。可以选择地,在一些情况下可能期望使用(例如在寡聚体 中)简并N,N,N三联体序列。
【0284】一方面,使用简并三联体(例如N,N,G/T三联体)允许在多肽中的每一 和每个氨基酸位置上系统且容易地产生完全范围的可能的天然氨基酸(总共20种氨 基酸)(在可以选择的方面,这些方法也包括在每一氨基酸残基或密码子、位置产生 少于全部的可能置换)。例如,对于100个氨基酸的多肽,可以产生2000个不同种类 (即每个位置上的20种可能氨基酸×100个氨基酸位置)。通过使用含有简并N,N,G/T 三联体的寡核苷酸或一组寡核苷酸,32种不同序列可编码所有20种可能的天然氨基 酸。因此,在其中使用至少一种这样的寡核苷酸对亲本多核苷酸序列进行饱和诱变的 反应容器中,产生了编码20种不同多肽的32种不同的子代多核苷酸。相反,在定点 诱变中使用非简并寡核苷酸在每个反应容器中仅仅导致一种子代多肽。非简并寡核苷 酸可以任选地与所公开的简并引物组合使用;例如,非简并寡核苷酸可以被用于在工 作多核苷酸中产生特异性点突变。这提供了产生特异性沉默点突变、导致相应的氨基 酸变化的点突变、以及导致产生终止密码子和多肽片段的相应表达的手段。
【0285】一方面,每一饱和诱变反应容器含有编码至少20种子代多肽(例如磷 脂酶)分子的多核苷酸,以便所有的20种天然氨基酸都会出现在对应于亲本多核苷 酸中被诱变的密码子位置的特定氨基酸位置(其它方面使用了少于20个天然的组 合)。从每一饱和诱变反应容器产生的32倍简并的子代多肽可以被克隆扩增(例如使 用表达载体克隆到合适的宿主中,例如大肠杆菌宿主中),并进行表达筛选。当单个 子代多肽通过筛选鉴定,显示出有利的特性变化时(当与亲本多肽相比时,如在碱性 或酸性条件下增高的磷脂酶水解活性),可以对其测序以鉴定其中所含的相应的有利 氨基酸置换。
【0286】一方面,如本文所公开的,应用饱和诱变对亲本多肽的各个和所有的氨 基酸位置进行诱变后,可以在超过一个的氨基酸位置确定出有利的氨基酸变化。可以 产生一个或多个新的子代分子,其含有所有或部分这些有利的氨基酸置换的组合。例 如,如果在多肽的3个氨基酸位置的每一个氨基酸位置处鉴定出2个特异的有利的氨 基酸变化,那么出现的排列就包括每一位置上的3种可能性(与原始氨基酸没有变化 的可能性,以及两个有利变化中的每一个的可能性)和3个位置。因此,总共有3×3×3 或27种可能性,其中包括了先前被检验的7种可能性,即6个单点突变(即三个位 置的每一个位置有2个)和在任何位置上没有变化的点突变。
【0287】另一方面,为了改变序列,定点饱和诱变可以与任何随机的或非随机方 法一起使用,例如合成的连接重装配(见下文)、重排、嵌合化、重组和其它诱变方 法和诱变剂。本发明提供以重复方式使用任何诱变方法,包括饱和诱变。
合成连接重装配(SLR)
【0288】本发明提供称为“合成连接重装配”,或者简单地称为“SLR”的非随机基 因修饰系统,这是一种“定向进化方法”,以产生具有新的或者改变的特性的磷脂酶。 SLR是非随机地把寡核苷酸片段连接在一起的方法。此方法与随机的寡核苷酸重排不 同,因为核酸构件不是改组的、串联的或者随机地嵌合的,而是非随机组装的。参见, 例如,美国专利申请系列号(USSN)09/332,835,题目是“Synthetic Ligation Reassembty in Directed Evolution”,于1999年6月14日提交(“USSN 09/332,835”)。一方面,SLR 包括下述步骤:(a)提供模板多核苷酸,其中模板多核苷酸包含编码同源基因的序列; (b)提供多个构件多核苷酸,其中这些构件多核苷酸被设计成可在预定的序列处与 模板多核苷酸交换重装配(cross-over reassemble),所述构件多核苷酸包含作为同源 基因变体的序列和与变体序列两侧的模板多核苷酸同源的序列;(c)将构件多核苷酸 与模板多核苷酸组合在一起,以便构件多核苷酸与模板多核苷酸交换重装配,以产生 包含同源基因序列变异的多核苷酸。
【0289】SLR不依赖于将被重新排列的多核苷酸之间存在高度同源性。因此,该 方法可以被用于非随机地产生包括超过10100个不同嵌合体的子代分子的文库(或集 合)。SLR可以被用于产生包括超过101000个不同子代嵌合体的文库。因此,本发明 的一些方面包括产生一组最终嵌合的核酸分子的非随机方法,所述最终嵌合的核酸分 子具有按设计所选择的整个装配次序。该方法包括按设计产生多个特异性核酸构件的 步骤,以及装配这些核酸构件的步骤,这样可获得依设计而定的整个装配次序,所述 的多个特异性核酸构件具有可被应用的互相相容的可连接末端。
【0290】将被装配的核酸构件的互相相容的可连接末端被认为对于这种类型的有 序装配是“有用的”,如果它们能使这些构件以预定次序结合的话。因此,核酸构件可 以被偶联的整个装配次序是由可连接末端的设计来确定的。如果使用多于一个的装配 步骤,那么核酸构件可被偶联的总装配次序也由装配步骤的连续次序来确定。一方面, 用酶例如连接酶(例如T4DNA连接酶)处理退火的结构片段,以实现结构片段的共 价结合。
【0291】一方面,寡核苷酸构件的设计通过分析一组祖先核酸序列模板来获得, 所述祖先核酸模板作为产生最终嵌合的多核苷酸的子代集合的基础。这些亲本寡核苷 酸模板因此作为序列信息的来源,它们在将被诱变例如被嵌合或改组的核酸构件的设 计中有用。
【0292】在该方法的一个方面,多个亲本核酸模板的序列被联配,以便选择一个 或多个分界点。这些分界点可以位于同源区域,由一个或多个核苷酸构成。这些分界 点优选地由至少两个祖先模板共享。从而这些分界点可以被用于描绘将要产生的寡核 苷酸构件的边界,以便重排列亲本多核苷酸。在祖先分子中鉴定和选择的分界点作为 最终嵌合的子代分子的装配中的潜在嵌合点。分界点可以是由至少两个亲本多核苷酸 序列分享的同源区域(包括至少一个同源性核苷酸碱基)。可以选择地,分界点可以 是由至少一半的亲本多核苷酸序列分享的同源区域,或者可以是由至少三分之二的亲 本多核苷酸序列分享的同源区域。甚至更优选地,在一个方面,有用的分界点是由至 少四分之三的亲本多核苷酸序列分享的同源区域,或者可以是由几乎所有的亲本多核 苷酸序列分享的同源区域。一方面,分界点是由所有亲本多核苷酸序列共有的同源区 域。
【0293】一方面,连接再装配过程被彻底地进行,以便产生含有尽量可能多的子 代嵌合多核苷酸的文库。换句话说,核酸构件的所有可能的有序组合都呈现在最终嵌 合的核酸分子集合中。同时,另一方面,在每一组合中的装配次序(即各个最终嵌合 核酸的5’到3序列中每一构件的装配次序)遵循如上所述的设计(或非随机地)。由 于本发明的非随机特性,大大地降低了不需要的副产品的可能性。
【0294】另一方面,连接再装配方法被系统地进行。例如,实施该方法,以便产 生子代分子的系统区分化的文库,该文库分成能被系统地筛选的数个部分,例如可以 逐个地筛选。换句话说,通过选择性的和审慎的应用特定的核酸构件,再加上选择性 的和审慎的应用连续的分步骤的装配反应,本发明使得这样一种设计可以实现,即可 以在各个反应容器中制备出各自特定的一系列子代产物。这样的设计允许进行系统的 检查和筛选步骤。因此,这些方法允许很可能非常大量的子代分子以更小的组被系统 地检查。由于其具有以高度变通而又彻底和系统的方式进行嵌合化反应的能力,尤其 是当祖先分子之间具有低水平的同源性时,这些方法可以产生包含大量子代分子的文 库(或集合)。由于本发明的连接再装配的非随机特性,所产生的子代分子一方面包 含有最终嵌合核酸分子的文库,这些核酸分子具有按设计而选择的总装配次序。饱和 诱变和优化的定向进化方法也可以被用于产生不同的子代分子种类。应该意识到,本 发明在分界点的选择、核酸构件的大小和数量以及偶联的大小和设计方面提供了选择 的自由度和可控制性。进一步,应该意识到,就本发明的可操作性而言,对分子间同 源性的要求大大地放宽了。事实上,甚至可以在有很少的分子间同源性或没有分子间 同源性的区域内选择分界点。例如,由于密码子的摆动,即密码子的简并性,可以将 核苷酸取代引入核酸构件,同时又不会改变在相应的祖先模板中最初编码的氨基酸。 可以选择地,可以改变密码子,从而改变对原始氨基酸的编码。在本发明中,这样的 取代可以被引入到核酸构件中,以便增加分子间同源分界点的发生率,从而使得在构 件之间可获得的偶联的数量增加,而这又允许产生更多数量的子代嵌合分子。
【0295】另一方面,产生构件的步骤的合成属性允许设计和引入核苷酸(例如一 个或多个核苷酸,例如可以是密码子或内含子或调控序列),这些核苷酸随后可以在 体外过程中(例如通过诱变)或者在体内过程中(例如通过利用宿主生物体的基因剪 接能力)被任选地去除。应该意识到,在许多情况下,除了产生有用的分界点的潜在 好处之外,还有许多其它原因也使得可能期望引入这些核苷酸。
【0296】一方面,核酸构件被用于引入内含子。因此,功能性的内含子被引入进 根据在此描述的方法产生的人造基因中。人工引入的内含子可以在宿主细胞中发挥基 因剪切的功能,作用方式非常像天然产生的内含子发挥基因剪切功能的方式。
优化的定向进化系统
【0297】本发明提供了一种非随机的基因修饰系统,命名为“优化的定向进化系统”, 其可以用来产生具有新的或者改变的特性的磷脂酶。优化的定向进化涉及还原性重配、 重组和选择的重复循环应用,其使得可以通过重组实现核酸的定向分子进化。优化的定 向进化允许产生大量的进化出的嵌合序列,其中产生的群体显著地富集了具有预定数目 遗传交换事件(crossover events)的序列。
【0298】遗传交换事件是在嵌合序列中的一个点,在这里,从一个亲本变体到另 一个亲本变体的序列转换发生。这样的点一般在来自两个亲本的寡核苷酸连接在一起形 成单个序列的连接处。这一方法允许计算寡核苷酸序列的正确浓度,这样,序列的最终 嵌合群体富集了选定数目的遗传交换事件。这也提供了对选择具有预定数目的遗传交换 事件的嵌合突变体的更多控制。
【0299】此外,这一方法与其它系统相比,提供了一种用于探究大数量的可能蛋 白变体空间的方便手段。以前,例如,如果在反应中产生了1013个嵌合分子,测试这样 大数目的嵌合突变体的特定活性将会非常困难。此外,子代群体的相当部分将具有很高 数目的遗传交换事件,其中得到的蛋白较不可能具有增高水平的特定活性。通过应用这 些方法,嵌合分子的群体可以富集那些含有特定数目的遗传交换事件的变体。因此,尽 管在反应中可以仍然产生1013嵌合分子,但是所选择的用于进一步分析的每一个分子很 可能具有,例如,仅仅三个遗传学交换事件。因为得到的子代群体可以偏向于具有预定 数目的遗传交换事件,所以嵌合分子之间的功能多样性的界限缩小了。当要计算在最初 的亲本多核苷酸中的哪一个寡核苷酸可能影响到特定的性质时,这便提供了更加可控数 目的变量。
【0300】产生嵌合子代多核苷酸序列的一个方法是产生对应于每一个亲本序列的 片段或者部分的寡核苷酸。每一个寡核苷酸优选地包括重叠的独特区域,这样把所述 寡核苷酸混合在一起,得到具有以正确顺序装配的每一寡核苷酸片段的新的变体。在 USSN 09/332,835中可以发现另外的信息。对应于每一个亲本变体产生的寡核苷酸数目 与在最终产生的嵌合分子中得到的交换的总的数目具有一定的关系。例如,为了发现如 在高温下具有更高活性的嵌合变体,可以提供三个亲本核苷酸序列变体来进行连接反 应。作为一个例子,对应于每一个亲本变体的每一部分可以产生总共50个寡核苷酸序 列。相应地,在连接再装配过程中,在每一个嵌合序列中就有可能有多达50个交换事 件。产生的每一个嵌合多核苷酸都以交替的顺序含有来自各个亲本变体的寡核苷酸的可 能性很低。如果每一个寡核苷酸片段以同样的摩尔量存在于连接反应中,有可能在一些 位置上来自同一亲本多核苷酸的寡核苷酸将与相邻的彼此连接,而不导致遗传交换事 件。如果在这一例子的任何连接步骤中,来自每一个亲本的每一种寡核苷酸的浓度都保 持不变,那么将会有三分之一的机会(假定3个亲本)来自同一个亲本变体的寡核苷酸 将连接于嵌合序列内而不产生交换。
【0301】因此,可以确定概率密度函数(PDF),预测在一个连接反应的每一步中 可能发生的遗传交换事件的总数,其中给出了一套许多的亲本变体、对应于每种变体的 许多寡核苷酸、以及在连接反应的每个步骤中的每种变体的浓度。在确定PDF中应用 到的统计学和数学在下面被描述。通过应用这些方法,可以计算这样的概率密度函数, 而且这样就富集了来源于特定连接反应的具有预定数目的遗传交换事件的嵌合子代群 体。此外,可以预先确定遗传交换事件的目标数目,然后对该系统进行程序化,以计算 在该连接反应的每一个步骤中,每种亲本寡核苷酸的起始量,从而得到以遗传交换事件 的预先确定的数目为中心的概率密度函数。这些方法涉及还原性重配、重组和选择的重 复循环应用,使得能够通过重组实现编码多肽的核酸的定向分子进化。该系统允许产生 大量的进化出的嵌合序列,其中产生的群体显著地富集了具有预定数目遗传交换事件的 序列。遗传交换事件是在嵌合序列中的一个点,在这里,从一个亲本变体到另一个亲本 变体的序列转换发生。这样的点一般是在两个亲本的寡核苷酸连接在一起形成单个序列 的连接处。这一方法允许计算寡核苷酸序列的正确浓度,这样,序列的最终嵌合群体富 集了选定数目的遗传交换事件。这也提供了对选择具有预定数目的遗传交换事件的嵌合 突变体的更多控制。
【0302】此外,这些方法与其它系统相比,提供了一种用于探究大数量的可能蛋 白变体空间的方便手段。通过应用在这里描述的方法,嵌合分子的群体可以富集那些含 有特定数目的遗传交换事件的变体。因此,尽管在反应中可以仍然产生1013个嵌合分子, 但是所选择的用于进一步分析的每一个分子很可能具有,例如,仅仅三个遗传学交换事 件。因为得到的子代群体可以倾向于具有预定数目的遗传交换事件,所以造成嵌合分子 之间的功能多样性的界限减少。当计算出在最初的亲本多核苷酸中的哪一个可能影响到 特定的性质时,便提供了更加可控制的变量。
【0303】一方面,该方法通过产生对应于每一个亲本序列的片段或者部分的寡核 苷酸,产生嵌合子代多核苷酸序列。每一个寡核苷酸优选地包括重叠的独特区域,这 样把所述寡核苷酸混合一起,得到具有以正确顺序装配的每一寡核苷酸片段的新的变 体。也可参见USSN 09/332,835。
【0304】对应于每一个亲本变体产生的寡核苷酸数目与在最终产生的嵌合分子中 得到的交换的总的数目具有一定的关系。例如,为了发现如在高温下具有更高活性的嵌 合变体,可以提供三个亲本核苷酸序列变体来进行连接反应。作为一个例子,对应于每 一个亲本变体的每一部分可以产生一组50个寡核苷酸序列。相应地,在连接再装配过 程中,在每一个嵌合序列中就有可能有多达50个交换事件。产生的每一个嵌合多核苷 酸都以交替的顺序含有来自各个亲本变体的寡核苷酸的可能性很低。如果每一个寡核苷 酸片段以同样的摩尔量存在于连接反应中,有可能在一些位置上来自同一亲本多核苷酸 的寡核苷酸将与相邻的彼此连接,而不导致遗传交换事件。如果在这一例子的任何连接 步骤中,来自每一个亲本的每一种寡核苷酸的浓度都保持不变,那么将会有三分之一的 机会(假定3个亲本)来自同一个亲本变体的寡核苷酸将连接于嵌合序列内而不产生交 换。
【0305】因此,可以确定概率密度函数(PDF),预测在一个连接反应的每一步中 可能发生的遗传交换事件的总数,其中给出了一套许多的亲本变体、对应于每种变体的 许多寡核苷酸、以及在连接反应的每个步骤中的每种变体的浓度。在确定PDF中应用 到的统计学和数学在下面被描述。可以计算这样的概率密度函数,而且这样就富集了来 源于特定连接反应的具有预定数目的遗传交换事件的嵌合子代群体。此外,可以预先确 定遗传交换事件的目标数目,然后对该系统进行程序化,以计算在该连接反应的每一个 步骤中,每种亲本寡核苷酸的起始量,从而得到以遗传交换事件的预先确定的数目为中 心的概率密度函数。
确定交换事件
【0306】本发明的多个实施方式包括系统和软件,它们接收所需的遗传交换的概 率密度函数(PDF)、待再装配的亲本基因的数目以及在再装配中的片段数目作为输入 值。该程序输出是“片段PDF”,它可以用于确定用于产生重新装配的基因和那些基因的 估计的遗传交换PDF的方案。在此描述的过程优选地在(The Mathworks, Natick,Massachusetts)中进行,是一种用于技术计算的程序语言和开发环境。
迭代方法(iterative process)
【0307】在实践本发明时,这些过程可以迭代反复。例如,对产生改变的磷脂酶 表型的核酸(或者,所述核酸)进行鉴定,重新分离,再修饰,再检测活性。此过程 可以反复重复,直到得到所需的表型。例如,整个生物化学的合成代谢或者分解代谢 途径可以被工程化到细胞中,包括磷脂酶活性。
【0308】类似地,如果确定了某特定寡核苷酸对于所期望的特性(例如新的磷脂 酶表型)根本不会造成影响,则可以通过合成包括待除去的序列的更大的亲本寡核苷酸, 从而将这段序列作为变量除去。由于将这一序列合并到更大的序列中避免了任何遗传交 换事件,所以在子代多核苷酸中,这一序列不再有任何变异。确定哪些寡核苷酸与所需 的性质最有关系,以及哪些与所需的性质无关的重复实践可以更有效地探寻所有可能的 可能提供特定性质或者活性的蛋白变体。
体内改组
【0309】分子的体内改组在本发明的方法中使用,提供本发明的多肽的变体,例 如抗体、磷脂酶以及类似物。体内改组可以利用重组多聚体的细胞的天然特性进行。尽 管体内重组已经提供了分子多样性的主要天然途径,但遗传重组仍然是一种相对复杂的 过程,该过程涉及1)同源性识别;2)链切割,链侵入,和导致产生重组交叉(recombination chiasma)的代谢步骤;和最后3)交叉消除,得到分离的重组分子。交叉的形成需要同 源序列的识别。
【0310】一方面,本发明提供由至少第一个多核苷酸和第二个多核苷酸产生杂合 多核苷酸的方法。本发明可以用于通过将共有部分序列同源性的至少一个区域的至少 第一多核苷酸和第二多核苷酸引入到合适的宿主细胞中而产生杂合多核苷酸。该部分 序列同源性的区域促进导致产生杂合多核苷酸的序列识别的过程。如本文所用,术语 “杂合多核苷酸”是由本发明的方法产生的任何核苷酸序列,含有从至少两个最初多核 苷酸序列得到的序列。这样的杂合多核苷酸可以由促进DNA分子间的序列整合的分 子间重组事件产生。另外,这样的杂合多核苷酸可以由利用重复序列以改变DNA分 子中的核苷酸序列的分子内还原性重配过程产生。
产生序列变体
【0311】本发明也提供使用本发明的核酸和多肽产生本发明的核酸和磷脂酶序列 的序列变体,或者分离磷脂酶,例如,磷脂酶的序列变体的方法。一方面,本发明提 供本发明的磷脂酶基因的变体,该变体可以使用任何方法改变,包括,例如随意或随 机方法,或者非随机方法,或者“定向进化”方法,如以上描述。
【0312】被分离的变体可以是天然发生的。变体也可以在体外产生。变体也可以 应用基因工程技术来产生,如定点诱变、随机的化学诱变、核酸外切酶III缺失方法和 标准的克隆技术。可选择地,可以应用化学合成或者修饰方法来产生这样的变体、片段、 类似物或者衍生物。本领域技术人员也熟悉制备变体的其它方法。这些方法包括这样的 程序,其中,从天然分离物中获得的核酸序列经过修饰而产生编码具有某些特征的多肽 的核酸,所述的特征增加这些多肽在工业或实验室应用中的价值。在这样的程序中,大 量的变体序列被获得和表征,这些变体序列与从天然分离物中得到的序列相比,有一个 或者多个核苷酸的差异。这些核苷酸的差异可能引起相对于天然分离物的核酸编码的多 肽的氨基酸变化。
【0313】例如,变体可以通过使用易错PCR产生。在易错PCR中,PCR在DNA 聚合酶的复制保真性较低的情况下进行,这样便在全长的PCR产物中得到较高的点突 变率。易错PCR在例如,Leung,D.W.等,Technique,1:11~15,1989和Caldwell,R.C. 和Joyce G.F.,PCR Methods Applic.,2:28-33,1992中描述。简要地说,在这样的程序中, 待诱变的核酸与PCR引物、反应缓冲液、MgCl2、MnCl2、Taq聚合酶以及适当浓度的 dNTP混合,从而在全长的PCR产物中得到高的点突变率。例如,反应可以使用20fmol 待诱变的核酸进行,每种PCR引物30pmol,反应缓冲液包含50mM KCl、10mM Tris HCl (pH8.3)和0.01%明胶、7mM MgCl2、0.5mM MnCl2、5单位的Taq聚合酶、0.2mM dGTP、 0.2mM dATP、1mM dCTP和1mM dTTP。PCR可以进行30个循环,每个循环为94℃1 分钟;45℃1分钟;和72℃1分钟。然而,应该意识到,这些参数可以适当地变化。 诱变的核酸被克隆到一个适当的载体,并评价由诱变核酸编码的多肽的活性。
【0314】变体也可以用寡核苷酸诱导的定向突变产生,在任何感兴趣的克隆DNA 中产生位点特异性的突变。寡核苷酸诱变在,例如,Reidhaar-Olson(1988)Science 241:53-57中描述。简要地说,在这样的程序中,合成多个具有将要被导入被克隆的DNA 中的一个或多个突变的双链寡核苷酸,将这些寡核苷酸插入到待诱变的克隆DNA中。 回收含有诱变DNA的克隆,并评估它们编码的多肽的活性。
【0315】另一种产生变体的方法是装配PCR。装配PCR涉及由小DNA片段的混 合物来装配PCR产物。大量不同的PCR反应在相同的容器中平行地发生,一个反应的 产物引发另一个反应的产物。装配PCR已经被描述,例如在美国专利5,965,408中。
【0316】还有另一种产生变体的方法是有性PCR诱变。在有性PCR诱变中,由于 基于序列同源性的DNA分子随机片段化,在不同的但是高度相关的DNA序列的DNA 分子之间,在体外强行发生同源重组,然后通过PCR反应的引物延伸,交换得到固定。 有性PCR诱变在,例如,Stemmer(1994)Proc.Natl.Asad.Sci.USA 91:10747-10751 中描述。简要地说,在这样的程序中,多个待重组的核酸用DNase消化,产生具有50 到200个核苷酸的平均大小的片段。纯化具有所需的平均大小的片段,并重悬于PCR 混合物中。在有利于核酸片段之间发生重组的条件下进行PCR反应。例如,PCR可以 这样进行:将纯化的片段以10-30ng/μl的浓度重悬于含有0.2mM的各种dNTP、2.2mM MgCl2、50mM KCl、10mM的Tris-HCl,pH 9.0以及0.1%的Triton X-100的溶液中。以 100∶1的比例在反应混合物中加入2.5单位的Taq聚合酶,用以下的条件进行PCR:94℃ 60秒,94℃30秒,50-55℃30秒,72℃30秒(30-45次),然后72℃进行5分钟。然 而,可以意识到,这些参数可以进行适当的变化。在一些方面,寡核苷酸可以被包括在 该PCR反应中。在其它方面,DNA聚合酶I的Klenow片段可以用于第一组PCR反应, 而Taq聚合酶可以用于后续组的PCR反应。重组序列被分离,并评估它们编码的多肽 的活性。
【0317】变体也可以通过体内诱变产生。在一些实施方式中,感兴趣的序列中的 随机突变通过在细菌菌株中扩增该感兴趣的序列而产生,所述细菌菌株例如在一个或 者多个DNA修复途径中具有突变的大肠杆菌菌株。这样的“突变”菌株具有比野生型 亲本更高的随机突变率。在一种这样的菌株中进行DNA的繁殖将最终产生DNA中 的随机突变。适于在体内诱变中应用的突变菌株在,例如,PCT公开号WO 91/16427 中有描述。
【0318】变体也可以通过应用盒式诱变产生。在盒式诱变中,双链DNA分子的一 个小的区域被不同于天然序列的合成的寡核苷酸“盒”替代。所述寡核苷酸一般含有完全 和/或部分随机的天然序列。
【0319】递归整体诱变也可以用于产生变体。递归整体诱变是一种用于蛋白质工 程(蛋白突变)的算法,它的开发是为了产生表型相关的突变体组成的多样性群体, 其成员在氨基酸序列上有所不同。该方法应用反馈机制来控制连续多轮的组合式盒式 诱变。递归整体诱变在如Aikin(1992)Proc.Natl.Acad.Sci.USA 89:7811-7815中有 描述。
【0320】在一些实施方式中,用指数整体诱变产生变体。指数整体诱变是一个用 于产生具有较高百分比的独特且具功能性的突变体的组合文库的过程,其中一小组的 残基被随机化,同时在每一个被改变的位置确认导致功能性蛋白的氨基酸。指数整体 诱变在如,Delegrave(1993)Biotechnology Res.11:1548-1552中有描述。随机和定点 诱变在如,Amold(1993)Current Opinion in Biotechnology 4:450-455中有描述。
【0321】在一些实施方式,变体利用改组方法产生,其中编码不同的多肽的多个 核酸的部分被融合在一起,产生编码嵌合多肽的嵌合核酸序列,如美国专利5,965,408; 5,939,250中描述。
【0322】本发明也提供本发明的多肽变体,包括其中一个或多个氨基酸残基(例 如,本发明的示例性多肽的氨基酸残基)被保守的或不保守的氨基酸残基(例如,保 守的氨基酸残基)置换,这样的置换的氨基酸残基可以是或者不是由遗传密码编码的 氨基酸残基。保守的置换是多肽中给定的氨基酸被具有相似特征的另一个氨基酸置 换。因此,本发明的多肽包括具有本发明序列的保守置换的多肽,包括但不局限于以 下置换:脂肪族氨基酸,例如丙氨酸、缬氨酸、亮氨酸和异亮氨酸被另一个脂肪族氨 基酸替换;丝氨酸被苏氨酸替换,或者相反;酸性残基例如天冬氨酸和谷氨酸被另一 酸性残基替换;具有酰胺基团的残基,例如天冬酰胺和谷氨酰胺被另一具有酰胺基团 的残基替换;碱性残基例如赖氨酸和精氨酸与另一碱性残基互换;芳香族残基例如苯 丙氨酸、酪氨酸被另一芳香族残基替换。其它变体是本发明的多肽的一个或多个氨基 酸残基包括取代基团的那些变体。
【0323】包括在本发明范围中的其它变体是多肽与另一化合物,例如可以增加多 肽半寿期的化合物,例如聚乙二醇缔合的那些变体。
【0324】在本发明范围内的另外的变体中,另外的氨基酸融合到多肽上,如前导 序列、分泌序列、原蛋白序列或者有利于纯化、富集或者使所述多肽稳定的序列。
【0325】在一些方面,本发明的多肽的变体、片段、衍生物和类似物保持与示例 性多肽相同的生物功能或活性,例如在此描述的磷脂酶活性。另一些方面,变体、片 段、衍生物或类似物包括前蛋白,使得变体、片段、衍生物或类似物可以通过切割前 蛋白部分以产生活性多肽而被活化。
密码子优化,以实现宿主细胞中高水平的蛋白表达
【0326】本发明提供修饰编码磷脂酶的核酸,以便改变密码子使用(codon usage) 的方法。一方面,本发明提供修饰编码磷脂酶的核酸中密码子,以增加或降低其在宿 主细胞中的表达的方法。本发明也提供了编码经修饰而增强其在宿主细胞中的表达的 磷脂酶的核酸、经过这样的修饰的磷脂酶,和制备经修饰的磷脂酶的方法。该方法包 括鉴定编码磷脂酶的核酸中的“非优选的”或“较不优选的”密码子,并且用编码相同氨基 酸的“优选密码子”作为替换密码子替换一个或者多个这些非优选或者较不优选的密码 子,并且在所述核酸中至少一个非优选或较不优选的密码子被编码相同氨基酸的优选密 码子替换。优选密码子是在宿主细胞基因的编码序列中被较多使用的密码子,而不优选 的或者较不优选的密码子是指在宿主细胞基因的编码序列中较少使用的密码子
【0327】用于表达本发明的核酸、表达序列盒以及载体的宿主细胞包括细菌、酵 母、真菌、植物细胞、昆虫细胞和哺乳动物细胞。因此,本发明提供了在所有这些细 胞中优化密码子使用的方法、密码子被改变的核酸,以及由所述的密码子被改变的核 酸编码的多肽。示例性的宿主细胞包括革兰氏阴性细菌,如大肠杆菌;革兰氏阳性细 菌,诸如任何芽胞杆菌属(Bacillus)(如蜡状芽孢杆菌)或链霉菌属、加氏乳酸杆菌 (Lactobacillus gasseri)、乳酸乳球菌、乳脂乳球菌(Lactococcus cremoris)、枯草芽 胞杆菌。示例性的宿主细胞也包括真核生物体,如,各种酵母,如酵母属某种 (Saccharomyces sp.),包括酿酒酵母、粟酒裂殖酵母、巴斯德毕赤酵母和乳酸克鲁维 酵母(Kluyveromyces lactis)、多形汉森酵母(Hansenula polymorpha)、黑曲霉 (Aspergillus niger)和哺乳动物细胞和细胞系以及昆虫细胞和细胞系。因此,本发明 也包括在这些生物体和生物物种中的表达被优化的核酸和多肽。
【0328】例如,从细菌细胞中分离的编码磷脂酶的核酸密码子被修饰,以便该核 酸在细菌细胞——其不同于获得磷脂酶的细菌、酵母、真菌、植物细胞、昆虫细胞或 者哺乳动物细胞中优化表达。优化密码子的方法在本领域是已知的,参见如,美国专 利5,795,737;Baca(2000)Int.J.Parasitol.30:113-118;Hale(1998)Protein Expr.Purif. 12:185-188;Narum(2001)Inect.Immun.69:7250-7253。也参见Narum(2001)Infect. Immun.69:7250-7253,描述了在鼠系统中优化密码子;Outchkourov(2002)Protein Expr. Purif.24:18-24,描述了在酵母中优化密码子;Feng(2000)Biochemistry 39: 15399-15409,描述了在大肠杆菌中优化密码子;Humphreys(2000)Protein Expr.Purif 20:252-264,描述了大肠杆菌中导致分泌的优化的密码子使用。
转基因非-人类动物
【0329】本发明提供了包含本发明的核酸、多肽、表达序列盒或者载体或者被转 染的细胞或者被转化的细胞的转基因非人类动物。转基因非人动物可以是,例如,包 括本发明的核酸的山羊、兔、绵羊、猪、母牛、大鼠和小鼠。这些动物可以作为,例 如体内研究磷脂酶活性的模型使用,或者体内筛选体内磷脂酶活性的调节物的模型使 用。要在转基因非人动物中表达的多肽的编码序列可以设计为组成型的,或者在组织特 异性、发育特异性或者可诱导的转录调控因子的控制之下。转基因非人动物可以应用本 领域任何已知的方法设计和产生;参见,如,美国专利6,211,428;6,187,992;6,156,952; 6,118,044;6,111,166;6,107,541;5,959,171;5,922,854;5,892,070;5,880,327;5,891,698; 5,639,940;5,573,933;5,387,742;5,087,571,它们描述了制造和应用转化的细胞和卵以 及转基因小鼠、大鼠、兔、羊、猪和牛。也参见,如,Pollock(1999)J.Immunol.Methods 231:147-157,描述了在转基因产奶动物的乳汁中生产重组蛋白;Baguisi(1999)Nat. Biotechnol.17:456-461,描述了转基因山羊的产生。美国专利6,211,428,描述了制备和 应用在其脑中表达含有DNA序列的核酸构建物的转基因非人哺乳动物。美国专利 5,387,742,描述了把克隆的重组子或者合成的DNA序列注射至小鼠受精卵中,移植注 射的卵至假孕的雌鼠中,并生长成为转基因鼠,它的细胞表达与阿尔茨海默氏病的病理 相关的蛋白。美国专利6,187,992,描述了制备和应用转基因小鼠,它的基因组包括编 码淀粉样前体蛋白(amyloid precursor protein,APP)的基因的断裂。
【0330】“基因敲除动物(Knockout animals)”也可以用于实践本发明的方法。 例如,在一方面,本发明的转基因动物或者修饰的动物包括“基因敲除动物”,如“基 因敲除鼠”,它被工程改造成不表达或不能表达磷脂酶。
转基因植物和种子
【0331】本发明提供了包含本发明的核酸、多肽(例如磷脂酶)、表达序列盒或 者载体或者被转染的细胞或者被转化的细胞的转基因植物和种子。本发明也提供了包 含本发明的核酸和/或多肽(例如磷脂酶)的植物产物,如油、种子、叶、提取物以 及类似物。转基因植物可以是双子叶的(双子叶植物)或者单子叶的(单子叶植物)。 本发明也提供了制备和应用这些转基因植物和种子的方法。表达本发明的多肽的转基 因植物或者植物细胞可以按照本领域任何已知的方法构建。参见例如,美国专利 6,309,872。
本发明的核酸和表达构建物可以通过任何方式导入到植物细胞中。例如,核酸或 者表达构建物可以导入到所需的植物宿主的基因组中,或者,核酸或者表达构建物可 以是附加体。导入到所需植物的基因组可以使得宿主的磷脂酶的产生被内源性的转录 或者翻译控制元件调控。本发明也提供了“基因敲除植物”,其中例如同源重组导致的 基因序列的插入破坏了内源性基因的表达。产生“基因敲除”植物的方法在本领域是已 知的,参见如Strepp(1998)Proc Natl.Acad.Sci.USA 95:4368-4373;Miao(1995) Plant J 7:359-365。参见下面关于转基因植物的讨论。
【0332】本发明的核酸可以用于将所需的性质赋予基本上任何植物,例如,含油 籽的植物,如大豆、油菜籽、向日葵籽、芝麻和花生。为了优化或改变宿主磷脂酶的 表达,本发明的核酸可以用于控制植物代谢途径。这可以改变植物中磷脂酶的活性。 可选地,本发明的磷脂酶可以用于产生转基因植物,以产生不能由那种植物天然产生 的化合物。这可以降低生产成本或产生新的产物。
【0333】一方面,产生转基因植物的第一步骤涉及制备在植物细胞中表达的表达 构建物。这些技术是本领域熟知的。它们可以包括选择和克隆启动子、便于核糖体有 效结合mRNA的编码序列以及选择适当的基因终止序列。一个典型的组成型启动子 是来自花椰菜花叶病毒的CaMV35S,它一般在植物中导致高水平的表达。其它的启 动子更具特异性,并且对植物的内部或者外部环境中的暗示有反应。典型的光诱导的 启动子是来自编码主要叶绿素a/b结合蛋白的cab基因的启动子。
【0334】一方面,修饰核酸来实现在植物细胞中更强的表达。例如,本发明的序 列与在植物中所见的相比可能具有更高百分比的A-T核苷酸对,而一些植物优选G-C 核苷酸对。因此,编码序列中的A-T核苷酸可以用G-C核苷酸取代,而不显著改变 氨基酸序列,以增强在植物细胞中基因产物的产生。
【0335】为了鉴定已经成功整合了转移基因的植物细胞或者组织,可以将选择性 标记基因加入到基因构建物中。这可能是必要的,因为在植物细胞中完成基因的整合 和表达是一个小概率事件,仅仅在较少百分率的靶组织和细胞中发生。选择性标记基 因编码对试剂有抗性的蛋白,所述试剂一般对植物有毒性,如抗生素或者除草剂。当 在含有适当的抗生素或者除草剂的培养基上生长时,只有已经整合了选择性标记基因 的植物细胞可以成活。与其它的插入基因一样,为了有恰当的功能,标记基因也需要 启动子和终止序列。
【0336】一方面,转基因植物或种子制备方法包括将本发明的序列,和任选地, 标记基因整合到目标表达构建物(例如,质粒)中,同时定位启动子和终止子序列。 这可以包括将修饰的基因通过合适方法转入植物中。例如,构建物可以应用如电穿孔 和显微注射植物细胞原生质体的技术直接引入到植物细胞的基因组DNA中,或者构 建物可以应用弹道方法(ballistic methods),如DNA微粒轰击(DNA particle bombardment)的方法直接引入到植物组织中。例如,参见如,Christou(1997)Plant Mol.Biol.35:197-203;Pawlowski(1996)Mol.Biotechnol.6:17-30;Klein(1987)Nature 327:70-73;Talcumi(1997)Genes Genet.Syst.72:63-69,讨论了应用微粒轰击引入 转基因到小麦中;Adam(1997)如上,应用微粒轰击将YACs引入至植物细胞中。 例如,Rinehart(1997)如上,用微粒轰击来产生转基因棉花植物。用于加速微粒的 设备在美国专利5,015,580中有说明;而且,可以通过商业渠道获得BioRad(Biolistics) PDS-2000微粒加速设备;也参见John,美国专利5,608,148;和Ellis,美国专利 5,681,730,描述了微粒介导的裸子植物的转化。
【0337】一方面,原生质体可以被固定,并注射以核酸例如表达构建物。尽管源 自原生质体的植物再生对于谷类并不容易,但是应用体细胞胚胎发生由原生质体来源 的愈伤组织进行植物再生在豆类中是有可能的。机化组织可以使用基因枪技术用裸 DNA转化,其中的DNA被包裹于钨微射弹(tungsten microprojectiles)上,射出物 的大小为细胞大小的1/100,它携带DNA深入到细胞和细胞器中。转化的组织然后 被诱导再生,一般通过体细胞胚胎发生技术。这一技术已经在包括玉米和水稻的几个 谷类物种中成功应用。
【0338】核酸,例如表达构建物也可以应用重组病毒引入到植物细胞中。植物细 胞可以用病毒载体转化,如,烟草花叶病毒衍生的载体(Rouwendal(1997)Plant Mol. Biol.33:989-999),参见Porta(1996)“Use of viral replicons for the expression of genes in plants”,Mol.Biotechnol.5:209-221。
【0339】可选择地,核酸,如表达构建物,可以与合适的T-DNA侧翼区组合, 并导入到传统的根瘤农杆菌宿主载体中。根瘤农杆菌宿主的毒力功能将在植物细胞受 该细菌感染时,引导构建物和邻近的标记插入至植物细胞DNA中。根瘤农杆菌介导 的转化技术,包括解毒(disarming)和应用二元载体,在科学文献中有详细的说明。 参见,如,Horsch(1984)Science 233:496-498;Fraley(1983)Proc.Natl.Acad.Sci.USA 80:4803(1983);Gene Transfer to Plants,Potrykus,ed.(Springer-Verlag,Berlin 1995)。 根瘤农杆菌细胞的DNA被包含在细菌染色体中,也被包含在称为Ti(肿瘤诱导)质 粒的另一种结构中。Ti质粒含有一段命名为T-DNA的DNA(~20kb长)和一系列毒 力(毒性)基因,T-DNA在感染过程中被转移到植物细胞中,毒力基因则引导所述 感染过程。根瘤农杆菌可以通过伤口感染植物:当一种植物的根或者茎受伤时,它释 放某种化学信号,作为对这种信号的响应,根瘤农杆菌的毒力基因被激活,并引发一 系列从Ti质粒转移T-DNA至植物染色体所必需的事件。T-DNA然后通过伤口进入到 植物细胞。一个推测是T-DNA一直等到植物DNA被复制或者转录,然后将自身插入 到暴露的植物DNA中。为了应用根瘤农杆菌作为转基因载体,必须去除T-DNA的肿 瘤诱导部分,而保留T-DNA的边界区域和毒力基因。转基因然后插入到T-DNA的边 界区域之间,从这里转移到植物细胞并且整合到植物的染色体中。
【0340】本发明提供了应用本发明的核酸进行包括重要的谷类植物在内的单子叶 植物的转化,参见Hiei(1997)Plant Mol.Biol.35:205-218。也参见如,Horsch,Science (1984)233:496;Fraley(1983)Proc.Natl Acad.Sci USA 80:4803;Thykjaer(1997) 如上;Park(1996)Plant Mol.Biol.32:1135-1148,讨论了将T-DNA整合到基因组 DNA中。也参见D′Halluin,美国专利5,712,135,描述了包含在谷类或者其它单子叶 植物的细胞中的具有功能的基因的DNA的稳定整合过程。
【0341】一方面,第三步可能涉及完整植物的选择和再生,所述植物能够将整合 的靶基因传递至下一代。这样的再生技术依赖于在组织培养生长培养基中对某些植物 激素的操作,其通常依赖于同所期望的核苷酸序列一起引入的杀虫剂和/或除草剂标 记。源自培养的原生质体的植物再生在以下文献中有说明,Evans等,Protoplasts Isolation and Culture,Handbook of Plant Cell Culture,124-176页,MacMillilan Publishing Company,New York,1983;和Binding,Regeneration of Plants,Plant Protoplasts,21-73页,CRC Press,BocaRaton,1985。再生也可以从植物愈伤组织、外 植体、器官或者其中的一部分得到。这样的再生技术在Klee(1987)Ann.Rev.of plant Phys.38:467-486中有概括性的说明。为了从转基因组织如未成熟的胚胎获得整个植 物,它们可以在一系列含有营养物和激素的培养基中在可控制的环境条件下培养,即 称为组织培养的过程。一旦整个植物再生并且产生种子,便开始评测其子代。
【0342】在表达序列盒稳定地整入到转基因植物之后,其可以通过有性杂交 (sexual crossing)引入到其它的植物中。可以应用任何的标准繁殖技术,这依赖于待 杂交的物种。因为本发明核酸的转基因表达导致表型变化,包含本发明的重组核酸的 植物可以和另一植物有性杂交而得到最终产物。因此,本发明的种子可以来自本发明 的两个转基因植物的杂交,或者来自本发明的植物和其它植物的杂交。当两个亲本植 物都表达本发明的多肽(如,磷脂酶)时,所需的效应(例如,表达本发明的多肽来 产生一种开花行为被改变的植物)可以被增强。所需的效应通过标准的繁殖方法传到 以后的植物世代中。
【0343】本发明的核酸和多肽被表达于或者插入到任何植物或者种子中。本发明 的转基因植物可以是双子叶植物或者单子叶植物。本发明的单子叶转基因植物的例子 是草,如牧草(蓝草,早熟禾属(Poa)),饲料草如羊茅属,黑麦草属,温带草,如 翦股颖属(Agrostis),和谷类,如小麦、燕麦、黑麦、大麦、水稻、蜀黍和玉米(maize) (玉米(corn))。本发明的双子叶转基因植物的例子是烟草、豆类,如羽扇豆、马铃 薯、甜菜、豌豆、蚕豆和大豆,以及十字花科植物(Brassicaceae属),如花椰菜,油 菜籽,和紧密相关的模式生物拟南芥(Arabidopsis thaliana)。这样,本发明的转基因 植物和种子包括很宽范围的植物,包括,但不限于,以下属的种:腰果属(Anacardium)、 落花生属(Arachis)、天冬属(Asparagus)、茄属(Atropa)、燕麦属(Avena)、油菜 属(Brassica)、柑桔属(Citrus)、西瓜属(Citrullus)、辣椒属(Capsicum)、红花属 (Carthamus)、椰子属(Cocos)、咖啡属(Coffea)、香瓜属(Cucumis)、南瓜属 (Cucurbita)、胡萝卜属(Daucus)、油棕属(Elaeis)、草莓属(Fragaria)、大豆属 (Glycine)、棉属(Gossyptum)、向日葵属(Helianthus)、Heterocallis、大麦属(Hordeum)、 天仙子属(Hyoscyamus)、莴苣属(Lactuca)、亚麻属(Linum)、黑麦草属(Lolium)、 羽扇豆属(Lupinus)、番茄属(Lycopersicon)、苹果属(Malus)、木薯属(Manihot)、 马郁兰属(Majorana)、苜蓿属(Medicago)、烟草属(Nicotiana)、木犀榄属(Olea)、 稻属(Oryza)、黍属(Panieum)、狼尾草属(Pannisetum)、鳄梨属(Persea)、菜豆 属(Phaseolus)、黄连木属(Pistachia)、豌豆属(Pisum)、梨属(Pyrus)、李属(Prunus)、 萝卡属(Raphanus)、蓖麻属(Ricinus)、黑麦属(Secale)、千里光属(Senecio)、 白芥属(Sinapis)、茄属(Solanum)、高粱属(Sorghum)、可可属(Theobromus)、胡 卢巴属(Trigonella)、小麦属(Triticum)、野豌豆属(Vicia)、葡萄属(Vitis)、豇豆 属(Vigna)、和玉蜀黍属(Zea)。
【0343a】在可选择的实施方式中,本发明的核酸在植物(例如,转基因植物), 如含油籽植物,例如水稻、大豆、油菜籽、向日葵子、芝麻和花生中表达。本发明的 核酸可以在含纤维细胞的植物,包括例如,棉花、丝棉树(木棉、吉贝木棉)、沙漠 柳、石炭酸灌木(winterfat)、轻木(balsa)、苎麻、洋麻、大麻、洛神葵、黄麻、马 尼拉剑麻和亚麻中表达。在可选择的实施方式中,本发明的转基因植物可以是棉属 (Gossypium)的成员,包括任何棉属(Gossypium)种的成员,如,亚洲棉(G.arboreum)、 草棉(G.herbaceum)、海岛棉(G.barbadense)和陆地棉(G.hirsutum)。
【0344】本发明也提供用于大量生产本发明的多肽(例如磷脂酶或抗体)的转基 因植物。例如,参见Palingren(1997)Trends Genet.13:348;Chong(1997)Transgenic Res.6:289-296(利用植物生长素诱导的双向甘露氨酸合成酶(mas1′,2′)启动子,应 用根癌农杆菌介导的叶片圆盘(leaf disc)转化方法,在转基因马铃薯植物中生产人 乳汁蛋白β-酪蛋白)。
【0345】应用已知的程序,技术人员可以通过检测在转基因植物中转基因mRNA 或蛋白的增加或减少来筛选本发明的植物。检测和定量mRNA或蛋白的方法在本领 域是熟知的。
多肽或肽
【0346】本发明提供了与本发明的示例性序列,例如具有一个或多个编码E41A、 E41W、E41F、E41Y、E41R、E94R、D100L、D100M、D100Y、D100F、D100W、 A104L、D111R、T112R、Y116W、I117W、P118W、E125K、S168N、D171V、D171E、 M176W、D230H、D230R、D234W、D234V、D234G、D234R、D234K或Q265R的 突变的SEQ ID NO:175或SEQ ID NO:176,具有序列同一性(例如,至少50%、51 %、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63 %、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75 %、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、 88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或 者更多,或者完全(100%)序列同一性)的分离的、合成的或重组的多肽。如以上 讨论的,同一性可以在多肽的全长范围内,或者,同一性可以在其子序列,例如,至 少大约50、60、70、80、90、100、150、200、250、300、350、400、450、500、550、 600、650、700或更多残基的范围内。本发明的多肽也可以比示例性多肽的全长要短。 在可选择的实施方式中,本发明提供大小在大约5到全长多肽范围的多肽(肽,片段), 例如酶,如磷脂酶,例如,磷脂酶;示例性大小为大约5、10、15、20、25、30、35,40、 45、50、55、60、65、70、75、80、85、90、100、125、150、175、200、250、300、 350、400或更多残基,例如,示例性磷脂酶的连续残基。本发明的肽可以用作,例 如,标记探针、抗原、耐受原、基序、磷脂酶活性位点、结合结构域、调控区域和类 似物。
【0347】一方面,多肽具有磷脂酶活性,例如,切割甘油磷酸酯键,水解磷酸酯 键的能力,包括马铃薯块茎蛋白(patatin),脂酰水解酶(LAH),磷脂酶A,B,C和/ 或磷脂酶D活性,或它们的任意组合。
【0348】在可选的方面,本发明的示例性多肽具有磷脂酶活性、信号序列位置、 最初来源,如在下表1中所阐述。为了帮助阅读此表,例如在第一行,其中SEQ ID NO: 143、144指具有在SEQ ID NO:144中阐述的序列的多肽,和由SEQ ID NO:143编码 的多肽,具有PLA-特异性PLA活性,最初分离自未知来源;另一个例子在SEQ ID NO:167,168行,其中167、168指具有在SEQ ID NO:168中阐述的序列的多肽,和由 SEQ ID NO:167编码的多肽,具有磷脂酸磷酸酶活性,残基1至30的信号序列 (“AA1-30”指氨基酸残基1至30等),即MARSWKWRPLLSSFLLVSLAPFST SVPCFK,最初分离自未知来源。本发明也提供包含信号序列的肽,和嵌合多肽,其 中肽或嵌合多肽包含表1中所阐述的信号序列,且如下面所述。
表1
  SEQ ID   NO:  酶类型  信号  序列  位置  (AA=氨  基酸)   信号(AA)   来源   143,144  PA-特异  性PLA   未知   25,26  马铃薯  块茎蛋  白  (Patatin)   未知   77,78  Patatin   未知   35,36  Patatin   未知   125,126  Patatin   未知   135,136  Patatin   未知   99,100  Patatin   未知
  65,66   Patatin   未知   87,88   Patatin   未知   86,87   Patatin   未知   45,46   Patatin   未知   59,60   Patatin   未知   13,14   Patatin   未知   71,72   Patatin   未知   55,56   Patatin   未知   33,34   Patatin   未知   91,92   Patatin   未知   103,104   Patatin   未知   11,12   Patatin   未知   17,18   Patatin   未知   95,96   Patatin   未知   43,44   Patatin   未知   27,28   Patatin   未知   131,132   Patatin   未知   127,128   Patatin   未知   133,134   Patatin   未知   137,138   Patatin   未知   165,166   Patatin   未知   167,168   磷脂酸   磷酸酶   AA1-30   MARSWKWRPLLSSFLLVSLAPFSTSVPCF   未知   169,170   磷脂酸   磷酸酶   未知   171,172   磷脂酸   磷酸酶   未知   173,174   磷脂酸   磷酸酶   未知   111,112   磷脂酰   肌醇   PLC   AA1-16   MGAGAILLTGAPTASA   细菌   107,108   磷脂酰   肌醇   PLC   AA1-23   MSNKKFILKLFICSTILSTFVFA   未知
  109,110   磷脂酰   肌醇   PLC   AA1-23   MSNKKFILKLFICSTILSTFVFA   未知   113,114   磷   脂酰肌   醇PLC   AA1-23   MSNKKFILKLFICSTILSTFVFA   未知   117,118   磷脂酰   肌醇   PLC   AA1-23   MNNKKFILKLFICSMVLSAFVFA   未知   119,120   磷脂酰   肌醇   PLC   AA1-23   MNNKKFILKLFICSMVLSAFVFA   未知   115,116   磷脂酰   肌醇   PLC   AA1-23   MNNKKFILKLFICSMVLSAFVFA   未知   121,122   磷脂酰   肌醇   PLC   AA1-23   MRNKKFILKLLICSTVLSTFVFA   未知   141,142   磷脂酶   未知   155,156   磷脂酶   AA1-36   MRTTTTNWRQIVKSLKLFLMGLCLFISASF   ASSAYA   未知   159,160   磷脂酶   未知   145,146   PLA   未知   147,148   PLA   未知   149,150   PLA   未知   151,152   PLA   未知   153,154   PLA   未知   157,158   PLA   未知   163,164   PLA   未知   101,102   PLC   AA1-39   LSLVASLRRAPGAALALALAAATLAVTAQG   ATAAPAAAAA   细菌   1,2   PLC   AA1-24   MKKKVLALAAMVALAAPVQSWFAQ   未知   3,4   PLC   AA1-24   MKRKILAIASVIALTAPIQSVAFAH   未知   5,6   PLC   AA1-24   MKRKILAIASVIALTAPIQSVAFAH   未知   97,98   PLC   AA1-25   MKRKLCTWALVTAIASSTAVIPTAAE   未知
  7,8   PLC   AA1-29   MITLIKKCLLVLTMTLLLGVFVPLQPSHAT   未知   31,32   PLC   AA1-20   MKKKLCTWALVTAISSGWAI   未知   81,82   PLC   AA1-25   MKKKLCTMALVTAISSGVVTIPTEAQ   未知   93,94   PLC   AA1-29   MITLIKKCLLVLTMTLLSGVFVPLQPSYAT   未知   89,90   PLC   AA1-25   MKKKLCTLAFVTAISSIAITIPTEAQ   未知   123,124   PLC   AA1-24   MKKKVLALAAMVALAAPVQSWFA   未知   129,130   PLC   AA1-27   MKKKICTLALVSAITSGWTIPTVASA   未知   139,140   PLC   AA1-20   MKIKPLTFSFGLAVTSSVQA   未知   105,106   PLC   AA1-30   MNRCRNSLNLQLRAVTVAALVWASSAALA   W   未知   9,10   PLC   AA1-20   MKLLRVFVCVFALLSAHSKAD   未知   47,48   PLD   未知   15,16   PLD   未知   41,42   PLD   未知   23,24   PLD   未知   51,52   PLD   未知   53,54   PLD   未知   19,20   PLD   AA1-19   MKKTTLVLALLMPFGAASAQ   未知   75,76   PLD   未知   57,58   PLD   未知   63,64   PLD   AA1-18   MKNTLILAGCILAAPAVAD   未知   79,80   PLD   AA1-23   MRNFSKGLTSILLSIATSTSAMAF   未知   37,38   PLD   A1-23   AMRNFSKGLTSILLSIATSTSAMAF   未知   61,62   PLD   AA1-21   MTLKLSLLIASLSAVSPAVLAN   未知   67,68   PLD   无   未知   83,84   PLD   AA1-21   MKKIVIYSFVAGVMTSGGVFAA   未知   49,50   PLD   AA1-23   MNFWSFLLSITLPMGVGVAHAQPD   未知   39,40   PLD   未知   73,74   PLD   未知   29,30   PLD   未知   21,22   PLD   AA1-28   MQQHKLRNFNKGLTGWLSVLTSTSAMAF   未知   71,72   PLD   未知   161,162   PLD   AA1-24   MNRKLLSLCLGATSCIALSLPVHA   未知
【0349】一方面,本发明提供了具有一个或多个E41A、E41W、E41F、E41Y、 E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、 Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、 D234W、D234V、D234G、D234R、D234K或Q265R突变的SEQ ID NO:175或SEQ ID NO:176中提及的序列和其子序列的多肽,子序列例如它们具有磷脂酶活性,例如 磷脂酶C(PLC)活性的活性位点(催化区域)。一方面,多肽具有磷脂酶活性,但是缺 少中性油(甘油三酯)水解活性。例如,一方面,多肽具有磷脂酶酶活性,但是缺少 影响中性油(甘油三酯)部分的任何活性。一方面,本发明提供了油脱胶方法,该方 法包括使用具有磷脂酶活性,但是缺少脂酶活性的本发明多肽。
【0350】本发明的多肽和肽可以分离自天然来源,可以是合成的,或者可以是重 组产生的多肽。肽和蛋白可以在体外或体内重组表达。本发明的肽和多肽可以使用本 技术领域已知的任何方法产生和分离。本发明的多肽和肽也可以使用本技术领域熟知 的化学方法全部或部分合成。例如参见Caruthers(1980)Nucleic Acids Res.Symp. Ser.215-223;Horn(1980)Nucleic Acids Res.Symp.Ser.225-232;Banga,A.K., Therapeutic Peptides and Proteins,Formulation,Processing and Delivery Systems(1995) Technomic Publishing Co.,Lancaster,PA。例如,肽合成可以使用各种固相技术进行 (例如参见Roberge(1995)Science 269:202;Merrifield(1997)Methods Enzymol.289: 3-13),自动合成可以根据制造商提供的说明书来实施,例如使用ABI 431A肽合成仪 (Perkin Elmer)。
【0351】本发明的肽和多肽也可被是糖基化。所述糖基化可以在翻译后通过化学 方法或者通过细胞的生物合成机制而加上,其中后者包括应用已知的糖基化作用基 序,所述糖基化作用基序可以对于所述序列是天然的,或者是作为肽段而被加入的, 或者是在核酸编码序列中加入的。糖基化作用可以是O-联接的或者是N-联接的。
【0352】本发明的肽和多肽,如以上所定义的,包括所有的“模拟物(mimetic)” 和“肽模拟物(peptidomimetic)”形式。术语“模拟物”和“肽模拟物”是指具有与本发明 的多肽实质上相同的结构和/或功能特征的合成的化学化合物。该模拟物或者完全由 合成的非天然的氨基酸类似物组成,或者是由部分天然的肽氨基酸和部分非天然的氨 基酸类似物构成的嵌合分子。所述模拟物也可以包括任意数量的天然氨基酸保守置 换,只要这样的置换本质上不改变该模拟物的结构和/或活性。对于作为保守性变体 的本发明多肽,常规实验将可以确定一种模拟物是否在本发明的范围内,即,其结构 和/或功能并没有实质上的改变。因此,一方面,如果一种模拟组合物具有磷脂酶活 性,那么它在本发明的范围内。
【0353】本发明的多肽模拟组合物可以包含非天然结构成分的任何组合。在可选 的方面,本发明的模拟组合物包括以下三种结构基团中的一种或全部:a)不是天然 酰胺键(“肽键”)连接的残基连接基团;b)置换天然发生的氨基酸残基的非天然残 基;或者c)诱导二级结构拟态(mimicry)的残基,即,可以诱导或者稳定二级结构, 如β转角、γ转角、β折叠、α螺旋构象,以及类似的结构。例如,当本发明的多肽 的所有残基或者一些残基通过非天然肽键的化学方式连接时,该多肽可以表征为模拟 物。各个肽模拟物残基可以通过肽键、其它的化学键或者偶联方式连接,如,通过戊 二醛、N-羟基琥珀酰亚胺酯、双功能马来酰亚胺、N,N′-二环己基二亚胺(DCC) 或者N,N′-二异丙基碳二亚胺(DIC)连接。可以替代传统的酰胺键(“肽键”)连接的 连接基团包括,如,基亚甲基(如,-C(=O)-CH2-代替-C(=O)-NH-)、氨基亚甲基 (CH2-NH)、次乙基、烯(CH=CH)、醚(CH2-O)、硫醚(CH2-S)、四唑(CN4-)、 噻唑、逆酰胺(retroamide)、硫代酰胺或者酯(参见如,Spatola(1983)在Chemistry and Biochemistry of Amino Acids,Peptides and Proteins,第7卷,267-357页,“Peptide Backbone Modifications”Marcell Dekker, NY)。
【0354】本发明的多肽也可以由于含有全部或者部分替代了天然发生的氨基酸残 基的非天然氨基酸残基而被表征为模拟物。在科学和专利文献中充分描述了非天然的 残基;用作天然氨基酸残基的模拟物的一些典型的非天然组合物及指导在下面有描 述。芳香族氨基酸的模拟物可以通过用以下进行取代来产生,如,D-或L-基丙氨 酸;D-或L-苯基甘氨基,D-或L-2噻吩基丙氨酸(thieneylalanine);D-或L-1,-2,3-或 4-芘基丙氨酸;D-或L-3噻吩基丙氨酸;D-或L-(2-吡啶基)-丙氨酸;D-或L-(3-吡啶 基)-丙氨酸;D-或L-(2-吡嗪基)-丙氨酸,D-或L-(4-异丙基)-苯基甘氨酸;D-(三氟甲 基)-苯基甘氨酸;D-(三氟甲基)-苯基丙氨酸;D-p-氟-苯基丙氨酸;D-或L-p-二苯基苯 基丙氨酸;D-或L-p-甲氧基-二苯基苯基丙氨酸;D-或L-2-吲哚(烷基)丙氨酸;和, D-或L-烷基丙氨酸,其中的烷基可以是取代的或非取代的甲基、乙基、丙基、己基、 丁基、戊基、异丙基、异丁基、仲异基(sec-isotyl)、异戊基或者非酸性氨基酸。非 天然氨基酸的芳香环包括,如噻唑基、噻吩基、吡唑基、苯并咪唑基、萘基、呋喃基、 吡咯基和吡啶基芳香环。
【0355】酸性氨基酸的模拟物可以通过用以下进行取代来产生,如,同时保持负 电荷的非羧酸氨基酸;(膦酰基)丙氨酸;硫酸化的苏氨酸。羧基侧链基团(如,天冬 氨酰基或者谷氨酰基)也可以通过与碳二亚胺(R′-N-C-N-R′)反应进行选择性的修饰, 所述碳二亚胺如1-环己基-3(2-吗啉基-(4-乙基)碳二亚胺或者1-乙基-3(4-氮鎓-4,4-二 甲基戊基)碳二亚胺。天冬氨酰基或者谷氨酰基也可以通过与铵离子反应转化为天冬 酰胺酰基和谷氨酰胺酰基。碱性氨基酸的模拟物可以通过用如,(除了赖氨酸和精氨 酸外)氨基酸氨酸、瓜氨酸、或者(胍基)-乙酸,或者(胍基)烷基-乙酸取代产生,其 中烷基如以上定义。腈衍生物(如,含有取代COOH的CN-部分)可以取代天冬酰 胺或者谷氨酰胺。天冬酰胺酰基和谷氨酰胺酰基可以脱氨基成为相应的天冬氨酰基或 者谷氨酰基残基。精氨酸残基模拟物可以通过精氨酰基与例如一种或者多种常规试剂 优选在碱性的条件下反应而产生,所述的常规试剂包括如苯乙二醛、2,3-丁二酮、1,2- 环己二酮或者茚三酮。酪氨酸残基模拟物可以通过酪氨酰基与例如芳香重氮鎓化合物 或者四硝基甲烷反应而产生。N-乙酰基咪唑基甲烷和四硝基甲烷可以分别用于形成 O-乙酰基酪氨酰物质和3-硝基衍生物。半胱氨酸残基模拟物可以通过半胱氨酰残基与 例如α-卤素乙酸例如2-氯乙酸或者氯乙酰胺和相应的胺反应而产生;得到羧甲基或 者羧酰胺甲基衍生物。半胱氨酸残基模拟物也可以通过半胱氨酰残基与例如溴代-三 氟丙酮、α-溴-β-(5-咪唑基)丙酸;氯乙酰磷酸、N-烷基马来酰亚胺、3-硝基-2-吡啶基 二硫化物;甲基2-吡啶基二硫化物;p-氯汞苯甲酸盐;2-氯汞-4硝基苯酚,或者,氯 -7-硝基苯并-氧杂-1,3-二唑反应而产生。可以通过赖氨酰基与例如琥珀酸或者其它的 羧酸酸酐反应而产生赖氨酸模拟物(和改变氨基末端残基)。赖氨酸和其它的含有α- 氨基的残基模拟物也可以通过与亚氨酸酯例如甲基吡啶亚氨酸甲酯(methyl picolinimidate)、磷酸吡哆醛、吡哆醛、氯硼氢化物、三硝基-苯磺酸、O-甲基异脲、 2,4,戊二酮的反应,和与乙醛酸的转酰胺基酶催化的反应而产生。甲硫氨酸的模拟物 可以通过与例如甲硫氨酸亚砜反应而产生。脯氨酸的模拟物包括,例如,2-哌啶酸、 四氢噻唑羧酸、3-或4-羟脯氨酸、脱氢脯氨酸、3-或4-甲基脯氨酸,或者3,3,-二甲基 脯氨酸。组氨酸残基模拟物可以通过组氨酰基与例如二乙基原碳酸酯或对溴苯甲酰甲 基溴化物反应而产生。其它的模拟物包括,例如,由脯氨酸和赖氨酸的羟基化作用产 生的模拟物;由丝氨酰或者苏氨酰残基的羟基的磷酸化作用产生的模拟物;由赖氨酸、 精氨酸和组氨酸的α氨基基团的甲基化作用产生的模拟物;由N-末端胺的乙酰化作 用而产生的模拟物;由主链酰胺残基的甲基化或用N-甲基氨基酸取代而产生的模拟 物;或者,由C-末端羧基的酰胺化而产生的模拟物。
【0356】本发明的多肽的残基例如氨基酸也可以用相反手性的氨基酸(或者肽模 拟物残基)替代。因此,天然发生的L-构型(也可以被称为R或者S,取决于化学实 体的结构)的任何氨基酸都可用相同化学结构类型但是具有相反手性的氨基酸或者肽 模拟物替代,相反手性的氨基酸称为D-氨基酸,但也可以称R-或者S-型。
【0357】本发明也提供了通过天然过程,如,翻译后加工(如,磷酸化,酰化以 及类似作用)或者通过化学修饰技术来修饰本发明的多肽的方法,以及得到的被修饰 的多肽。修饰可以发生在所述多肽的任何地方,包括肽骨架、氨基酸侧链和氨基端或 者羧基端。可以理解,相同类型的修饰可以在已知的多肽中以相同的或者不同的水平 在几个位点处发生。一个给定的多肽也可以具有很多类型的修饰。修饰包括乙酰化、 酰化作用、ADP-核糖基化作用、酰胺化作用、共价连接核黄素、共价连接血红素组 分、共价连接核苷酸或核苷酸衍生物、共价连接脂质或脂质衍生物、共价连接磷脂酰 肌醇、交联环化作用、二硫键形成、去甲基作用、形成共价交联、形成半胱氨酸、形 成焦谷氨酸、甲酰基化作用、γ-羧化作用、糖基化作用、形成GPI锚、羟基化作用、 碘化作用、甲基化作用、肉豆蔻酰基化作用、氧化作用、聚乙二醇化、蛋白水解处理、 磷酸化作用、异戊烯作用、外消旋作用、硒化作用、硫酸盐化作用,和转移RNA介 导氨基酸添加到蛋白质中,如精氨酰化。参见,如,Creighton,T.E.,Proteins-Structure and Molecular Properties 2nd Ed.,W.H.Freeman and Company,New York(1993); Posttranslational Covalent Modification of Proteins,B.C.Johnson,Ed.,Academic Press, NewYork,11-12页(1983)。
【0358】固相化学肽合成方法也可以用于合成本发明的多肽或者片段。这样的方 法自二十世纪六十年代早期起就是本领域已知的方法(Merrifield,R.B.,J.Am.Chem. Soc.,85:2149-2154,1963)(也参见Stewart,J.M.和Young,J.D.,Solid Phase Peptide Synthesis,第二版,Pierce Chemical Co.,Rockford,III,11-12页),并且这些方法近来已 经可以用于商业上可获得的实验室肽设计和合成试剂盒(Cambridge Research Biochemicals)。这样的商业上可获得的实验室试剂盒一般是利用H.M.Geysen等,Proc. Natl.Acad.Sci.,USA,81:3998(1984)的教导,它们将肽合成在多个“杆(rods)”或 者“钉(pins)”的顶端,而所有的“杆”或者“钉”都被连接到一块板上。当使用这样的 系统时,一个板的杆或者钉被倒转并插入到第二个板的相应孔或者贮存器中,所述孔 或者贮存器含有用于将一种适合的氨基酸附着或固定在杆或钉的顶端的溶液。通过重 复这样的处理步骤,即是,反转和插入所述杆和钉的顶端至适当的溶液中,将氨基酸 构建成所要的肽。此外,大量的可利用的FMOC肽合成系统是可利用的。例如,应 用Applied Biosystems,Inc.的Model 431ATM自动肽合成仪可以在固体支持物上装配多 肽或者片段。这些设备使得本发明的肽容易获得,或者通过直接的合成或者通过合成 用其它已知的技术可以偶联起来的一系列片段。
磷脂酶
【0359】本发明提供新的磷脂酶,编码磷脂酶的核酸,结合磷脂酶的抗体,代表 酶的抗原位点的肽(抗原决定簇或表位)和活性位点的肽,调控和结合结构域,和产 生和使用它们的方法。一方面,本发明的多肽具有磷脂酶活性,或如以上描述的磷脂 酶活性(例如,甘油磷酸酯键的切割,缺少脂酶活性,等等)的任何组合。在可选的 方面,本发明的磷脂酶具有由在此描述的示例性脂酶的活性修饰而得的活性。
【0360】本发明也包括具有或不具有信号序列的磷脂酶和信号序列本身。本发明 包括本发明酶的片段或子序列,例如包含催化结构域(活性位点)、结合结构域、调 控结构域、表位、信号序列、前区域和类似物的肽或多肽,或由它们组成的肽或多肽。 本发明也包括固定化的磷脂酶、抗磷脂酶抗体和它们的片段。本发明包括杂合物 (heterocomplexes),例如,包括本发明的磷脂酶的融合蛋质、异二聚体等。代表酶 的抗原位点(表位)、活性位点、结合位点、信号序列和类似物的肽可以用常规的筛 选方案确定。
【0361】本发明的这些酶和方法可以用于实现对高磷含量的油,特别是大米、大 豆、玉米、油菜和向日葵油更彻底的脱胶。例如,一方面,用PI-PLC切割后,磷脂 酰肌醇被转化为二酰甘油和磷酸肌醇。在离心期间,二酰甘油与水相分开(从而提高 油产量),并且磷酸肌醇与水相分开,其中它作为重相的组分被去除。本发明的酶, 例如本发明的PI-PLC可以被掺入化学或物理油精炼过程。
【0362】在可选的实施方式中,本发明的酶具有磷脂酰肌醇-特异性磷脂酶C (PI-PLC)活性、磷脂酰胆碱-特异性磷脂酶C活性、磷脂酸磷酸酶活性、磷脂酶A 活性和/或patatin-相关的磷脂酶活性。这些酶可以单独使用,或者相互之间或与本发 明的其它酶,或其它酶组合使用。一方面,本发明提供了这样的方法,其中这些酶(包 括本发明的磷脂酰肌醇-特异性磷脂酶C(PIPLC)、磷脂酰胆碱-特异性磷脂酶C和/ 或磷脂酶D(与磷酸酶结合)、磷脂酸磷酸酶、磷脂酶A、patatin-相关的磷脂酶)被单 独或组合用于使油脱胶,所述油诸如植物油,例如高磷油,诸如大豆油、玉米油、油 菜油、米糠油和向日葵油。本发明的这些酶和方法可以用于实现对高磷含量的油,特 别是大豆、玉米、油菜、米糠和向日葵油更彻底的脱胶。一旦用PI-PLC切割,磷脂 酰肌醇被转化为二酰甘油和磷酸肌醇。在离心期间,二酰甘油与水相分开(从而提高 油产量),且磷酸肌醇与水相分开,其中它作为重相的组分被去除。本发明的酶,例 如本发明的PI-PLC可以被掺入化学或物理油精炼过程。
【0363】一方面,本发明提供了组合物,例如溶液,包括中性pH的柠檬酸钠, 以水合不可水合物。例如,本发明提供了pH范围在约4至9、或约5至8、或约6 至7的柠檬酸钠溶液,其可以被用于水合高磷油中的不可水合的磷脂(包括本发明的 酶)。一方面,非水合磷脂的水合是通过螯合与磷脂相缔合的钙和镁进行的,从而使 得之前不可溶性的磷脂盐更容易地在水相中分开。一方面,一旦磷脂向水/油介面移 动或进入水相,本发明的磷脂酶(本发明的磷脂酶-特异性磷酸水解酶)或其它磷脂 酶,将把磷脂转化为二酰甘油和磷酸酯。一方面,一旦加入酸和碱,钙和酶金属的含 量将降低(参见有关碱方法的论述)
【0364】本发明的酶是高度选择性的催化剂。与别的酶一样,它们催化具有常规 合成化学中不能比拟的强的立体选择性、区域选择性和化学选择性的反应。而且,本 发明的酶是非常多用的。它们可以经改变在有机溶剂中具有功能,可在极端pH(例 如,高pH和低pH)、极端温度(例如,高温和低温)、极端盐度水平(例如,高盐 度和低盐度)下操作,并且催化结构上与它们的天然的、生理学上的底物无关的化合 物的反应。本发明的酶可以设计为与大范围的天然和非天然底物反应,因此,使得能 事实上修饰任何有机先导化合物。本发明的酶也可以设计为具有高度的对映选择性和 区域选择性。这些酶所展示出的高度的官能团特异性使得人们能明了产生新的活性化 合物的合成顺序中的每一个反应。本发明的酶也可以设计为催化许多与它们的天然生 理功能无关的不同的反应。
【0365】本发明利用了酶的独特催化特性。然而,在化学转化中,生物催化剂(即, 纯化的酶或粗酶,非活细胞或活细胞)的使用一般要求确定与特异的起始化合物反应 的特定生物催化剂。本发明使用经选择的生物催化剂,即,本发明的酶,和对在许多 起始化合物中都存在的官能团具有特异性的反应条件。每种生物催化剂对一种官能 团,或几种相关官能团特异,可以与含有这种官能团的多种起始化合物反应。生物催 化反应由单个的起始化合物产生一个衍生物群体。这些衍生物可以经过另一轮生物催 化途径,产生第二个衍生化合物群体。生物催化衍生化作用的每次重复都可以产生数 千种最初化合物的变体。
【0366】酶在起始化合物的特异位点反应而不影响该分子的其余部分,这是使用 传统的化学方法非常难以达到的过程。这种高度的生物催化特异性提供了鉴定文库内 单个活性化合物的方法。所述文库由一系列用于产生该文库的生物催化反应来表征, 即所谓的“生物合成历史”。就生物学活性筛选文库和追踪生物合成历史鉴定出产生活 性化合物的具体反应顺序。重复该反应序列并且确定所合成的化合物的结构。不像其 它的合成和筛选方法,这种鉴定方式不需要固定技术,以及化合物可以被合成并应用 实际上任何类型的筛选试验在溶液中被自由测试。重要的是,注意到,酶反应对于官 能团的高度特异性允许追踪生成生物催化产生的文库的特异酶促反应。
【0367】本发明也提供使用本发明的核酸、多肽和抗体,来发现新的磷脂酶的方 法。一方面,筛选λ-噬菌体文库以基于表达发现磷脂酶。在筛选中使用λ-噬菌体文库 可以允许如下事项:检测毒性克隆;改进与底物的接触;降低对工程改造宿主的要求, 绕开任何由文库的大量切除所致的任何潜在偏差;和,在低克隆密度下的快速生长。 λ-噬菌体文库的筛选可以在液相或在固相中进行。在液相中筛选赋予分析条件的更大 灵活性;额外的底物灵活性;对弱克隆更为灵敏;比固相筛选易于自动化。
【0368】许多程序步骤使用机器自动化进行,这使得每天可以完成几千种生物催 化反应和筛选分析,同时确保高度准确和再现性(见以下的阵列讨论)。结果,衍生 化合物的文库可以在大概数周内产生。对分子,包括小分子修饰的进一步教导,参见 PCT/US94/09174。
磷脂酶信号序列
【0369】本发明提供磷脂酶的信号序列(例如,信号肽(SPs)),例如含有信号 序列的肽和/或嵌合多肽,其中所述肽或嵌合多肽具有表1中示出的信号序列,或如 下面示出的信号序列。本发明提供了编码这些信号序列(SPs,例如具有含有本发明 多肽的氨基末端残基的序列的肽,或具有由本发明多肽的氨基末端残基组成的序列的 肽)的核酸。一方面,本发明提供了信号序列,其包括这样的肽,该肽包含本发明多 肽的残基1到20、1到21、1到22、1到23、1到24、1到25、1到26、1到27、1 到28、1到29、1到30、1到31、1到32或1到33中所阐述的序列,或该肽由所述 序列组成,所述本发明的多肽例如具有一个或多个编码E41A、E41W、E41F、E41Y、 E41R、E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、 Y116W、I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、 D234W、D234V、D234G、D234R、D234K或Q265R的突变的SEQ ID NO:175或SEQ ID NO:176。这些肽中的任何肽可以是嵌合蛋白,例如重组蛋白的一部分。信号序列 肽可以与本发明的其它酶(例如本发明的磷脂酶,不是从其衍生得到的),或与其它 磷脂酶,或与任何多肽匹配,如下所进一步论述的。
【0370】示例性的信号序列列于表1和SEQ ID列表中,如,SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6的残基1到24;SEQ ID NO:8的残基1到29;SEQ ID NO: 10的残基1到20;SEQ ID NO:20的残基1到19;SEQ ID NO:22的残基1到28; SEQ ID NO:32的残基1到20;SEQ ID NO:38的残基1到23;对于本发明的其它示 例性信号序列,参见表1和SEQ ID列表。
【0371】在一些方面,本发明的磷脂酶无信号序列。一方面,本发明提供了缺少 所有或部分信号序列的磷脂酶。一方面,本发明提供了编码来自一个磷脂酶的信号序 列的核酸序列,该信号序列可操作性地连接到不同的磷脂酶的核酸序列上,或任选地, 来自非磷脂酶蛋白的信号序列也可以是期望的。
磷脂酶前原结构域、结合结构或和催化结构域
【0372】如上所述,除了信号序列(例如信号肽(SPs)),本发明提供了前原结 构域、结合结构域(例如底物结合结构域)和催化结构域(CDs)。本发明的SP结构 域、结合结构域、前原结构域和/或CDs可以是分离的、合成的或重组的肽,或可以 是融合蛋白的一部分,例如作为嵌合蛋白中的异源结构域。本发明提供了编码这些催 化结构域(CDs)(例如“活性位点”)、前原结构域、结合结构域和信号序列(SPs,例 如具有含有本发明多肽的氨基末端残基的序列的肽,或具有由本发明多肽的氨基末端 残基组成的序列的肽)的核酸。
【0373】本发明的磷脂酶的信号序列(SPs)、结合结构域、催化结构域(CDs) 和/或前原序列可以是分离的肽,或者连接于其它磷脂酶或者非磷脂酶多肽的序列上, 如,作为融合(嵌合)蛋白。在一方面,包含本发明磷脂酶信号序列SPs和/或前原 的多肽含有与本发明磷脂酶异源的序列(例如,包含本发明的SP和/或前原以及其它 磷脂酶或非磷脂酶蛋白的序列的融合蛋白)。一方面,本发明提供了具有异源CDs、 SPs和/或前原序列,例如具有酵母信号序列的序列的本发明磷脂酶。本发明的磷脂酶 可以包括异源的CDs、SPs和/或前原序列,在载体中,例如在pPIC系列载体(lnvitrogen, Carlsbad,CA)中。
【0374】一方面,本发明的SPs、CDs和/或前原序列在鉴定新型的磷脂酶多肽之 后来确定。进行分选蛋白质并且转运蛋白质至它们的细胞内合适位置的途径,一般被 称为蛋白质定向转运途径(protein targeting pathways)。在所有这些定向转运系统中的 最重要成员之一是在新合成多肽的氨基端的短氨基酸序列,叫做信号序列。信号序列 引导蛋白质至细胞的合适位置定位,并且在转运过程中或者当蛋白到达其最终的目的 地之后去除。大多数溶酶体蛋白,膜蛋白,或者分泌蛋白具有氨基末端信号序列,该 序列标记这些蛋白用于转移到内质网的腔中。信号序列的长度可以在从13到45或更 多个氨基酸残基内进行变化。本领域技术人员知道识别信号序列的各种方法。例如, 一方面,通过称为SignalP的方法来鉴定新型的水解酶信号肽。SignalP应用识别信号 肽和它们的切割位点的组合的神经网络。(Nielsen,等,“Identification of prokaryotic and eukaryotic signal peptides and prediction of their cleavage sites.”Protein Engineering, vol.10,no.1,p.1~6(1997)。
【0375】一方面,本发明的磷脂酶不必具有SPs和/或前序列,和/或催化结构域 (CDs)。一方面,本发明提供缺少所有或部分SP、CD和/或前原结构域的磷脂酶。一 方面,本发明提供了编码来自一个磷脂酶的信号序列(SP)、CD和/或前序列的核酸序 列,其可操作性地连接到不同的磷脂酶的核酸序列上,或任选地,来自非磷脂酶蛋白 的信号序列(SP)、CD和/或前原结构域也是可期待的。
【0376】本发明也提供了分离的、合成的或者重组的多肽,含有本发明的信号序 列(SPs)、前原结构域和/或催化结构域(CDs),以及异源序列。异源序列是与SP、 前原结构域和/或CD非天然相关(如,对于磷脂酶)的序列。与SP、前原结构域和/ 或CD非天然相关的序列可以在SP、前原结构域和/或CD的氨基末端,羧基末端, 和/或在SP和/或CD的末端。一方面,本发明提供了分离的、合成的或者重组的多肽, 包括(或者由之组成)这样的多肽,该多肽包括本发明的信号序列(SPs)、前原结构 域和/或催化结构域(CDs),条件是其并不与和其有天然联系的任何序列有联系(如 磷脂酶序列)。相似地,一方面,本发明提供了编码这些多肽的分离的、合成的或者 重组的核酸。所以,一方面,本发明的分离、合成或者重组核酸包含有本发明的信号 序列(SP)、前原结构域和/或催化结构域(CD)以及异源序列(即是,与本发明的 信号序列(SP)、前原结构域和/或催化结构域(CD)的编码序列并不天然关联的序 列)的编码序列。异源序列可以在3’末端、5’末端,和/或在SP、前原结构域和/或 CD编码序列的末端。
【0377】本发明的多肽包括活性形式的或无活性形式的磷脂酶。例如,本发明的 多肽包括“成熟”或对前序列加工之前的前蛋白,对前序列加工例如通过前蛋白-加 工酶,例如前蛋白转化酶对前蛋白加工以产生“有活性的”成熟蛋白。本发明的多肽包 括因其它原因而失活的磷脂酶,例如在翻译后加工事件“激活”之前,例如内-或外肽 酶或蛋白酶作用、磷酸化作用事件、酰胺化作用、糖基化作用、去糖基化、硫酸化作 用、二聚体化事件和/或类似作用。鉴定“前”区域序列、CDs、结合结构域和信号序列 的方法是常规的,并且是本领域熟知的,参见例如Van de Ven(1993)Crit.Rev.Oncog. 4(2):115-136;用于鉴定蛋白质-蛋白质相互作用的酵母双杂交筛选,由Miller(2004) Methods MoI.Biol.261:247-62;Heyninck(2004)Methods MoI.Biol.282:223-41,USPN 6,617,122;6,190,874描述。例如,为了鉴定前原序列,从胞外空间纯化蛋白质,测定 N-端蛋白质序列,并与未加工的形式作比较。
【0378】本发明的多肽可以作为蛋白质制剂配制成任何液体、固体、半固体或凝 胶形式。例如,本发明的蛋白质制品可以包括这样的制剂,其含有非水液体组合物、 铸造固体、粉末、冻干粉末、粒状形式、颗粒形式、压缩片剂、小球、丸剂、凝胶形 式、水凝胶、膏、气溶胶、雾剂、洗液或浆状制剂。
【0379】本发明的多肽包括所有的活性形式,包括本发明酶的活性子序列,例如 催化结构域(CDs)或活性位点。一方面,本发明提供下面阐述的催化结构域或活性位 点。一方面,本发明提供了肽或多肽或等同物,其包括通过使用数据库诸如Pfam(其 收集了大量的多序列比对和覆盖了许多常见的蛋白质家族的隐藏的Markov模型,The Pfam protein families database,A.Bateman,E.Birney,L.Cerruti,R.Durbin,L.Etwiller, S.R.Eddy,S.Griffiths-Jones,K.L.Howe,M.Marshall和E.L.L.Sonnhammer,Nucleic Acids Research,30(1):276-280,2002)而预测到的活性结构域,或由这些预测到的活性 结构域组成。
【0380】本发明提供了本发明酶的N-端或C-端子序列(例如信号序列、前序列) 与其它多肽、活性蛋白质或蛋白质片段的融合物。本发明的酶(例如磷脂酶C酶)也可 以通过将酶作为无活性的融合蛋白表达而产生,该无活性的融合蛋白随后通过蛋白质 水解切割事件激活(使用内源性或外源性蛋白酶活性,例如胰蛋白酶),切割导致融 合蛋白伴侣和成熟的酶,例如磷脂酶C酶分离。一方面,本发明的融合蛋白由杂合核 苷酸构建物表达,该构建物编码单个开放阅读框,含有下述元件:融合蛋白的核苷酸 序列、接头序列(定义为编码连接两个柔性较小的蛋白区域的柔性氨基酸序列的核苷 酸序列)、蛋白酶切割识别位点和成熟酶(例如本发明的任何酶,例如磷脂酶)序列。 在可选的方面,融合蛋白可以包含果胶裂解酶序列、木聚糖酶序列、磷脂酸磷酸酶序 列或另一序列,例如之前显示在感兴趣的宿主细胞中过量表达的序列。
【0381】可以使用任何宿主系统(参见上面论述),例如任何细菌,例如革兰氏 阳性细菌,诸如杆菌属,或革兰氏阴性细菌,诸如大肠杆菌,或任何酵母,例如巴斯 德毕赤酵母。嵌合核苷酸构建物中的核苷酸序列的排列可以基于用每一融合构建物获 得的蛋白质表达水平来测定。一方面,从核苷酸构建物的5’端至构建物的3’端,核苷 酸序列如下装配而成:信号序列/融合蛋白/接头序列/蛋白酶切割识别位点/成熟酶(例 如本发明的任何酶,例如磷脂酶)或信号序列/前序列/成熟酶/接头序列/融合蛋白。酶 (例如本发明的任何酶,例如磷脂酶)作为无活性融合蛋白表达,可以提高酶序列的 总表达水平,可以减少与活性酶过表达相关的任何潜在的毒性,和/或可以增加使用 之前的货架期,这是因为在融合蛋白,例如果胶裂解酶与酶,例如磷脂酶蛋白分离之 前是无活性的。
【0382】在各个方面,本发明提供了激活作为融合蛋白表达的本发明的磷脂酶的 具体的制剂。一方面,使用蛋白质水解活性或潜在的蛋白质水解活性结合氨基-末端 或羧基末端肽酶,来激活最初作为无活性的融合蛋白表达磷脂酶活性。该激活事件可 以用各种方法实现,并且是在应用于油脱胶之前的制备/储存过程的各种时间点时进 行。本发明的示例性方法包括:在将融合构建物分泌到发酵介质中后由生产性宿主表 达的内源活性进行的切割;在宿主细胞破坏之后,由激活的内源性蛋白酶活性进行的 切割,或与胞内表达的融合构建物接触;使粗或纯化的融合构建物通过具有固定化的 蛋白酶活性的柱,以在制备酶制剂之前完成切割和酶(例如本发明的磷脂酶,例如磷 脂酶C)激活作用。用可溶性的蛋白质水解活性源处理粗的或纯化的融合构建物;在 油精炼中,使用可溶性的或不溶性的蛋白质水解活性源,激活磷脂酶(例如本发明的 磷脂酶,例如磷脂酶C),之后立即用于各方法中;和/或在减低的温度(例如在约40℃ 至200℃之间的任何温度),通过使融合构建物制剂持续循环通过具有固定化的蛋白 酶活性的柱,来激活(例如本发明的磷脂酶,例如磷脂酶C)磷脂酶活性。该激活事件 可以在传递到使用位置之前完成,或它可以在油精炼中原位发生。
糖基化
【0383】本发明的肽和多肽(例如水解酶、抗体)也可以进行糖基化,例如一方面, 含有至少一个糖基化位点,例如N-连接或O-连接的糖基化。一方面,多肽可以在巴 斯德毕赤酵母或粟酒裂殖酵母中表达后进行糖基化。糖基化可以在翻译后以化学的方 式或通过胞内生物合成机制加入,其中后者整合使用已知的糖基化基序,其对于序列 来说可以是天然的,或可以作为肽加入,或加入到核酸编码序列中。
【0384】一方面,本发明提供了含有N-连接的糖基化的SEQ ID NO:2的多肽, 如下表中所述:

全长SEQ ID NO:2(在一个方面其由SEQ ID NO:1编码)开放阅读框编码七(7) 个潜在的天冬酰胺-连接的(N-连接)的糖基化位点。野生型SEQ ID NO:2开放阅读 框在能够进行糖基化的宿主(例如,巴斯德毕赤酵母、酿酒酵母、粟酒裂殖酵母或哺 乳动物细胞)中的表达,导致产生糖基化的SEQ ID NO:2磷脂酶,其由于存在N-连 接的糖基化作用基本上没有活性。用糖苷酶(PNGase)F或内切糖苷酶H对野生型 糖基化的SEQ ID NO:2进行酶法去糖基化作用,导致激活SEQ ID NO:2活性。此外, 通过诱变对一个或多个N-连接的糖基化位点进行修饰(以便该位点不再被识别为N- 连接的糖基化位点,并且糖基化不再在那个位点发生),导致产生具有不同的活性增 加程度的SEQ ID NO:2。
【0385】相比起在相同的宿主细胞中表达的野生型开放阅读框,对SEQ ID NO:2 糖基化位点4、5和/或6中编码天冬酰胺的核苷酸密码子进行诱变(例如将天冬酰胺 转化为天冬氨酸),导致产生具有增加的PLC活性的酶(在巴斯德毕赤酵母中表达的 三联突变体具有与在非糖基化宿主如大肠杆菌中表达的野生型序列基本上相同的比 活性和功能活性)。在N-连接的糖基化共有序列(NXS/T)中通过诱变丝氨酸和苏氨酸 来废除N-连接的糖基化位点也是可能的,例如通过在这些位置转化这些核苷酸密码 子产生缬氨酸或异亮氨酸,以代替丝氨酸或苏氨酸。使用该策略来除去N-连接的糖 基化位点也导致在具有糖基化作用的宿主表达系统中产生活性SEQ ID NO:2磷脂酶。
磷脂酶活件的分析
【0386】本发明提供了具有磷脂酶活性或任何组合的磷脂酶活性的分离的、合成 的或者重组的多肽(例如酶、抗体),以及编码它们的核酸。本领域已知的很多磷脂 酶分析方法中的任何方法都可以用于确定多肽是否具有磷脂酶活性,并且在本发明的 范围内。用于确定磷脂酶A,B,D,和C,patatin和脂酰水解酶活性或脂酶活性的 常规方案是本领域已知的。
【0387】示例性的活性分析包括混浊度分析、羟甲香豆素磷酸胆碱(荧光)分析、 Amplex red(荧光)磷脂酶分析、薄层色谱分析(TLC)、细胞裂解分析和p-硝基苯 基磷脂酰胆碱分析。应用这些分析方法,可以很快地筛查出具有磷脂酶活性的多肽、 肽或抗体。
【0388】磷脂酶活性可以包括脂酰水解酶(LAH)活性,参见如,Jimenez(2001) Lipids 36:1169-1174,该文献描述了用于确定patatin的脂酰水解酶活性的以八乙二醇 单十二烷基醚(octaethylene glycol monododecyl ether)为基础的混合微胶粒分析。 Pinsirodom(2000)J.Agric.Food Chem.48:155-160,该文献描述了示例性的脂酰水解 酶(LAH)patatin活性。
【0389】在以下文献中说明了用于确定磷脂酶活性的混浊度分析,如Kauffmann (2001)“Conversion of Bacillus thermocatenulatus lipase into an efficient phospholipase with increased activity towards long-chain fatty acyl substrates by directed evolution and rational design”Protein Engineering 14:919-928;Ibrahim(1995)“Evidence implicating phospholipase as a virulence factor of Candida albicans,”Infect.Immun.63:1993-1998。
【0390】用于确定磷脂酶活性的羟甲香豆素(荧光)磷酸胆碱分析方法描述在下 述文献中,例如Goode(1997)“Evidence for cell surface and internal phospholipase activity in ascidian eggs,”Develop.Growth Differ.39:655-660;Diaz(1999)“Direct fluorescence-based lipase activity assay,”BioTechniques 27:696-700。
【0391】用于确定磷脂酶活性的Amplex Red(荧光)磷脂酶分析可以作为试剂 盒获得,如,应用来自Molecular Probes Inc.(Eugene,OR)的Amplex Red磷脂酰胆 碱-特异性磷脂酶分析试剂盒,按照制造商的说明,检测磷脂酰胆碱-特异性磷脂酶。 在荧光微板读数器中,使用560±10nm的激发光和590±10nm的荧光检测,测量荧光。 该分析在极低酶浓度时也灵敏。
【0392】确定磷脂酶活性的薄层色谱分析(TLC)描述在Reynolds(1991)Methods in Enzymol.197:3-13;Taguchi(1975)“Phospholipase from Clostridium novyi type A.I,” Biochim.Biophys.Acta 409:75-85中。薄层色谱分析(TLC)是用于检测磷脂酶活性 的广泛应用的技术。已经应用了该方法的不同的经改良的方法从液相分析混合物提取 磷脂酶。在一些PLC的分析中,通过将氯仿/甲醇(2∶1)加入到反应混合物中来终 止水解。未反应的起始物以及二酰基甘油通过萃取进入有机相,并且可以通过TLC 分离,而首基(head group)产物仍保留在水相中。为了获得对磷脂消化更精确的测 定,可以使用放射性标记的底物(参见,如,Reynolds(1991)Methods in Enzymol. 197:3-13)。产物和反应物的比率可以用于计算单位时间内的底物水解的实际摩尔数。 如果所有的成分相同提取,提取中的任何损失将相同地影响所有的成分。磷脂消化产 物的分离可以通过胶TCL来完成,用氯仿/甲醇/水(65∶25∶4)作为溶剂系统(参 见,如,Taguchi(1975)Biochim.Biophys.Acta 409:75-85)。
【0393】确定磷脂酶活性的P-硝基苯磷脂酰胆碱分析描述于例如Korbsrisate (1999)J.Clin.Microbiol.37:3742-3745;Berka(1981)Infect.Immun.34:1071-1074。 该分析方法基于酶法水解底物类似物P-硝基苯磷脂酰胆碱,释放黄色的生色化合物 p-硝基苯,可以在405nm检测到。该底物方便用于进行高通量筛选。
【0394】基于红细胞裂解,细胞裂解分析可以检测具有细胞裂解活性的磷脂酶。 毒性磷脂酶可以与真核细胞膜作用,并水解磷脂酰胆碱和鞘磷脂,引起细胞裂解,参 见,如,Titall(1993)Microbiol.Rev.57:347-366。
杂合(嵌合)磷脂酶和肽文库
【0395】一方面,本发明提供了杂合磷脂酶和融合蛋白,包括肽文库,其含有本 发明的序列。本发明的肽文库可以用于分离靶,如磷脂酶底物、受体、酶的肽调节物 (如激活剂或者抑制剂)。本发明的肽文库可以用于鉴定与靶的正常结合伴侣,如配 体,例如,细胞因子、激素和类似物。一方面,本发明提供了包括本发明的信号序列 (SP)和/或催化结构域(CD)以及异源序列的嵌合蛋白(参见上文)。
【0396】本发明也提供了应用本发明核酸和多肽,来产生“改进的”和杂合的磷脂 酶的方法。例如,本发明提供了用于产生具有活性的酶的方法,所述活性如,在极端 碱性pH值和/或酸性pHs、高和低的温度、渗透压和类似条件下的磷脂酶活性(如, 磷脂酶A、B、C或者D活性、patatin酯酶活性、甘油磷酸酯键的切割、植物油中磷 脂的酯键的切割)。本发明提供了用于产生杂合酶(如,杂合磷脂酶)的方法。
【0397】一方面,本发明的方法通过应用细胞内过程产生新的杂合多核苷酸,该 过程整合第一多核苷酸的序列,这样所得到的杂合多核苷酸编码表现源于第一生物活 性多肽的活性的多肽。例如,第一多核苷酸可以是编码本发明示例性的磷脂酶的示例 性核酸序列。第一核酸可以编码来自一种生物的酶,其在特定的环境条件下,如高盐 的条件下有效地发挥作用。它可以与由源于不同生物体的第二多核苷酸所编码的酶 “整合”,该酶可以在不同的环境条件下如极端的高温条件下,有效地发挥作用。例如, 两个核酸可以通过例如重组和/或还原性重配产生杂合分子。含有来自第一和第二原 始多核苷酸的序列的杂合多核苷酸可以编码表现出由该原始多核苷酸编码的两种酶 的特性的酶。因此,由杂合多核苷酸编码的酶可以在第一和第二多核苷酸编码的酶中 的每一个酶共有的环境条件下,如高盐和极端温度下有效地发挥作用。
【0398】可选地,由本发明得到的杂合核苷酸可以表现出原始酶所没有显示出的 特异化酶活性。例如,在编码磷脂酶活性的多核苷酸重组和/或还原性重配以后,由 杂合多核苷酸编码的杂合多肽可以被筛查其得自每一个起始酶的特异活性,即,磷脂 酶对之作用的键的类型以及磷脂酶发挥作用的温度。这样,例如,可以筛查磷脂酶, 来查明那些可以将杂合磷脂酶从起初的磷脂酶分辨出来的化学官能度,如:(a)酰胺 (肽键),即,磷脂酶;(b)酯键,即,淀粉酶和脂肪酶;(c)缩醛,即寡糖酶,和, 例如,杂合多肽作用的温度、pH或者盐浓度。
【0399】待与本发明的核酸“整合”的多核苷酸来源可以从下述分离:个体生物 (“分离物”),生长于确定培养基的生物群(“富集培养物”),或者,未经培养的生物 (“环境样品”)。由于其使人们可以接近未开发的生物多样性的资源,应用培养基依 赖的(culture-independent)方法来得到编码来自环境样品的新型生物活性的多核苷酸 是最优选的。“环境文库”从环境样品中产生,并且代表了天然发生生物体的全体的基 因组,环境文库保存在克隆载体中,载体可以在适合的原核宿主中繁殖扩增。因为克 隆DNA起初是从环境样品中直接提取,文库并不限于可以生长于纯培养基中的小部 分的原核生物。此外,存在于这些样品中的环境DNA的标准化,可以允许其更加平 等地代表在起始样品中存在的所有种的DNA。这就可以显著增加从样品中的较少组 成中发现感兴趣基因的效率,该样品中的较少组成与优势种相比,可能少了几个数量 级的代表性。
【0400】例如,从一个或者更多的未培养的微生物产生的基因文库中,筛查感兴 趣的活性。编码感兴趣的生物活性分子的潜在途径,首先在原核生物细胞中以基因表 达文库的方式被捕获。编码感兴趣活性的多核苷酸分离自这样的文库,并且引入到宿 主细胞中。将宿主细胞生长于促进重组和/或还原性重配的环境中,从而产生具有新 型的或者增强活性的潜在的生物活性分子。
【0401】可以制备杂合多核苷酸的微生物包括原核微生物如真细菌(Eubacteria) 和古细菌(Archeabacteria),低等真核微生物如真菌、一些藻类和原生动物。多核苷 酸可以分离自环境样品。核酸可以被回收而不需培养某一种生物体,或者是从一种或 者多种培养的生物中回收。在一方面,这样的微生物可以是适于极端环境的,如,嗜 高温的、嗜冷的、兼性嗜冷菌(psychrotroph)、嗜盐的、嗜压的和嗜酸的。在一方面, 编码从极端微生物中分离出来的磷脂酶的多核苷酸可以用于制备杂合酶。这样的酶可 以在例如地表温泉和深海的热火山口超过100℃的温度发挥作用,在例如北极水域低 于0℃的温度发挥作用,在例如死海的饱和的盐环境下发挥作用,在pH值在0附近 例如沉积物和地热富硫矿泉中起作用,或者在pH值超过11例如污水污泥中起作 用。例如,来自极端条件下的生物体的几种被克隆和被表达的磷脂酶可以在很宽的温 度和pH范围内表现出高活性。
【0402】正如在此说明的选择和分离的多核苷酸,包括至少一种本发明的核酸, 被引入到适当的宿主细胞中。适当的宿主细胞是可以促进重组和/或还原性重配的任 何细胞。选择的多核苷酸可以在包括合适控制序列的载体中。宿主细胞可以是较高等 的真核生物细胞,如哺乳动物细胞,或者较低等的真核生物细胞,如,酵母细胞,或 者优选地,宿主细胞可以是原核细胞,如细菌细胞。将构建物导入宿主细胞可通过磷 酸钙转染、DEAE-葡聚糖介导的转染,或电穿孔(Davis等人,1986)来实现。
【0403】示例性的适当的宿主可以是本领域技术人员所熟悉的宿主细胞的任何一 种,其包括原核细胞、真核细胞,例如细菌细胞、真菌细胞、酵母细胞、哺乳动物细 胞、昆虫细胞或植物细胞。示例性的细菌细胞包括埃希氏菌属、杆菌属、链霉菌属、 沙门氏菌属、假单胞菌属和葡萄球菌属的任何种,包括例如大肠杆菌、乳酸乳球菌、 枯草芽孢杆菌、蜡状芽孢杆菌、鼠伤寒沙门菌和荧光假单胞菌。示例性真菌细胞包括 曲霉菌属的任何种。示例性酵母细胞包括毕赤酵母、酵母菌属、裂殖酵母属或许旺酵 母属的任何种,包括巴斯德毕赤酵母、酿酒酵母或粟酒裂殖酵母。示例性昆虫细胞包 括灰翅夜蛾属或果蝇属的任何种,包括果蝇S2和草地夜蛾Sf9。示例性的动物细胞 包括CHO、COS或者Bowes melanoma或者任何小鼠或者人类细胞系。适当的宿主 的选择在本领域技术人员的能力之内。选择适合的宿主用于重组和/或还原性重配或 者仅仅用于表达重组蛋白被认为是在本领域技术人员已知的范围内。可以用于重组和 /或还原性重配或者仅仅用于表达重组蛋白的哺乳动物细胞培养系统包括:猴肾纤维 原细胞的COS-7细胞系——其在“SV40-transformed simian cells support the replication of early SV40 mutants”(Gluzman,1981)中有说明,C127、3T3、CHO、HeLa和BHK 细胞系。哺乳动物表达载体可以包括复制起点、合适的启动子和增强子,以及必要的 核糖体结合位点、多聚腺苷酸化的位点、剪接供体和受体位点、转录终止序列,以及 5’旁侧的非转录序列。源于SV40剪接的DNA序列和多聚腺苷酸化的位点可以用于 提供所需的非转录的遗传学元件。
【0404】含有感兴趣多核苷酸的宿主细胞(用于重组和/或还原性重配或者仅仅 用于表达重组蛋白)可以在传统的营养培养基中培养,对该培养基进行改变以适于激 活启动子,选择转化子或者扩增基因。培养的条件,如温度,pH和类似因素是那些 之前选择用于表达条件的宿主细胞所使用的,并且对于普通技术人员是显而易见的。 经鉴定具有特异酶活性的克隆可以随后进行测序,以鉴定编码具有增强活性的酶的多 核苷酸序列。
【0405】另一方面,本发明的核酸和方法可以用于产生用于生物化学途径的新型 多核苷酸,所述生物化学途径如,来自一个或者多个操纵子或者基因簇或者其部分的 途径。例如,细菌和很多的真核生物具有调控基因的协调机制,其中所述基因的产物 参与相关的过程。基因成簇排列在单个染色体上,在结构上称“基因簇”,它们在单个 调控序列的控制下一起转录,所述调控序列包括起始整个簇的转录的单个启动子。因 此,基因簇是指一组或者相同或者相关的相邻基因,一般是指功能上相关的邻近的基 因。
【0406】基因簇DNA可以从不同的生物体中分离出来并且连接到载体中,特别 是含有表达调控序列的载体,所述表达控制序列可以控制和调控可检测蛋白或者来自 连接在一起的基因簇的蛋白相关系列活性的产生。对于引入外源DNA使用具有非常 大的容量的载体,特别适合用于这样的基因簇,在这里通过包括大肠杆菌的f-因子(或 者致育因子)的例子加以说明。大肠杆菌的f-因子是一种质粒,在接合过程中它能实 现自身的高频率转移,f-因子对于获得和稳定扩增大DNA片段,如来自混合的微生 物样品的基因簇是理想的。可以使用“Fosmids”、粘粒或者细菌人工染色体(BAC) 载体作为克隆载体。它们源于大肠杆菌f因子,可以稳定地整合大的基因组DNA片 段。当整合来自混合的未经过培养的环境样品的DNA时,这就有可能得到以稳定的 “环境DNA文库”形式存在的大的基因组片段。粘粒载体最初是设计用来克隆和扩增 基因组DNA的大片段。应用粘粒载体的克隆在Sambrook等,Molecular Cloning:A Laboratory Mannual,第二版,Cold Spring Harbor Laboratory Press(1989)中有详细 说明。一旦连接到适当的载体,含有不同的聚酮化合物合成酶基因簇的两个或者多个 载体可以引入到适合的宿主细胞中。这些基因簇所共有的具有部分序列同源性的区域 将促进导致序列重新组织为杂合基因簇的过程。然后可以对新的杂合基因簇进行筛 选,以获得在起初的基因簇没有发现的增强的活性。
【0407】因此,一方面,本发明涉及使用本发明的核酸序列产生具有生物活性的 杂合多肽以及筛选具有活性(增强的活性)的多肽的方法,该方法通过:
1)以可操作性连接的方式导入至少第一多核苷酸(例如本发明的核酸)和第二 多核苷酸到合适的宿主细胞,所述的至少第一多核苷酸和第二多核苷酸共有具有部分 序列同源性的至少一个区域。;
2)在促进序列重新组织的条件下培养宿主细胞,得到可操作性连接的杂合多核 苷酸;
3)表达由所述杂合多核苷酸编码的杂合多肽;
4)在有利于鉴定期望的生物活性(例如增强的磷脂酶活性)的条件下筛选所述 的杂合多肽;和
5)分离编码该杂合多肽的多核苷酸。
【0408】用于筛选各种酶活性的方法对于本领域技术人员是已知的,关于它的讨 论贯穿于本说明书。当要分离本发明的多核苷酸和多肽时,可以应用这些方法。
【0409】体内重配可以集中在“分子间”的过程上,统称为“重组”。在细菌中,它 一般被视为是“RecA-依赖”的现象。本发明可以依赖于宿主细胞的重组过程来重组和 重配序列,或者依赖于细胞介导还原过程的能力,通过缺失来减少细胞中的准-重复 序列的复杂性。该“还原性重配”过程通过“分子内的”、RecA-依赖过程而发生。因此, 在本发明的一方面,应用本发明的核酸,通过还原性重配过程,产生新型的多核苷酸。 该方法包括产生含有连续序列(起始编码序列)的构建物,它们插入到合适的载体中, 并且然后将它们引入到合适的宿主细胞。单个分子同一性的重配通过在构建物中具有 同源性区域的连续序列间的组合过程,或者准-重复单位间的组合过程而发生。重配 过程重组和/或降低重复序列的复杂性和程度,并且导致产生新型的分子种类。
【0410】可以运用各种处理来提高重配效率。这些处理可以包括用紫外光,或者 损坏DNA的化学试剂处理,和/或使用表现增高水平的“遗传不稳定性”的宿主细胞系。 因此,这样的重配过程可以涉及同源重组或者准-重复序列指导它们自身进化的天然 特性。
【0411】重复或者“准重复(quasi-repeated)”序列在遗传不稳定性中起作用。“准 重复”是并不限于它们起初的单元结构的重复。准重复单元可以在构建物中以序列的排 列出现;以相似序列的连续单元出现。一旦连接,在连续序列之间的连接处变得基本上 不可见,并且得到的构建物的准重复性质在分子水平现在是连续的。细胞在准重复序列 之间进行的缺失过程降低了得到的构建物的复杂性。准重复单位提供了一个实际上没有 限制的模板库,在模板上可以发生滑移事件。含有准重复的构建物因此有效地提供了足 够的分子弹性,缺失(和潜在的插入)事件实际上可以在准重复单元内的实际上任何地 方发生。当准重复序列全部以相同方向连接,例如,头对尾或者反之亦然,细胞就不能 区别各个单元。因此,还原过程可以在整个序列中发生。相反地,例如,当所述单元以 头对头存在,而不是头对尾,倒置勾画了相邻单元的末端,这样缺失的形成将有利于不 连续单元的失去。因此,在本发明的一个方面,待重配序列是处于相同的方向。准重 复序列的随机定向将会导致重装配效率的损失,而序列的一致定向将提供最高的效率。 然而,虽然具有较少的相同方向的连续序列降低效率,但是仍然可以为新型分子的有效 回收提供足够的弹性。可以用相同定向以允许更高效率的准重复序列制备构建物。
【0412】应用各种方法中的任何一种,序列可以以头对尾的定向进行装配,包括 以下方法:a)可以使用包括poly-A头和poly-T尾的引物,当制成单链时,包括poly-A 头和poly-T尾的引物将提供定向。这通过具有由RNA制备引物的头几个碱基来完成, 而且因此用RNaseH容易去除。b)可以应用包括独特的限制酶切割位点的引物。这 需要多个位点、一组独特的序列、和重复的合成和连接步骤。c)引物的内部少数碱 基可以被硫醇化,并且用外切酶来产生合适的具有尾巴的分子。
【0413】重装配序列的回收依赖于具有减低的重复指数(RI)的克隆载体的确定。 被重装配的编码序列可以随后通过扩增回收。产物被再克隆和表达。具有减低的RI 的克隆载体的回收可以通过如下实现:1)应用仅仅当构建物的复杂性下降时才能稳 定地维持的载体。2)通过物理方法对缩短的载体进行物理回收。在这一情况下,克 隆载体将应用标准的质粒分离程序进行回收,或者在具有低分子量截留的琼脂糖凝胶 或者柱子上利用标准程序进行大小分离。3)插入物的大小下降时,对含有可以选择 的断裂基因的载体进行回收。4)应用表达载体以及适当的选择,使用定向选择技术。
【0414】相关的生物体的编码序列(例如,基因)可以表现出高度的同源性,并 且编码相当多样化的蛋白产物。这些类型的序列特别可作为准重复序列用在本发明 中。然而,这一过程并不限于这种几乎相同的重复。
【0415】以下是本发明的示例性方法。编码性核酸序列(准-重复)来自三(3) 种,包括本发明的核酸。每一序列编码具有一套不同特征的蛋白质,包括本发明的酶。 每一个序列在序列的独特位置只有一个或者几个碱基对的不同。准-重复序列分别地 或者共同被扩增并且被连接到随机的组合中,以便所有可能的排列交换和组合可以在 连接的分子群中获得。准-重复单位的数目可以通过装配条件来控制。在构建物中,准 -重复单位的平均数目被定义为重复指数(RI)。一旦形成,构建物可以,或可以不按照 已公开的方法在琼脂糖凝胶上按大小分离,插入到克隆载体,并且转染到合适的宿主细 胞中。然后细胞进行繁殖,并且进行“还原性重装配”。如果需要,还原性重装配过程的 速率可以通过引入DNA损伤来刺激。RI的降低是通过一种“分子内”的机制在重复序列 间形成缺失来介导,还是通过“分子间”的机制由类似重组的事件来介导是不重要的。最 终的结果是分子被重装配,得到所有可能的组合。一方面,本方法包括一个额外的步 骤,即对改组库的文库成员进行筛选,以确定个别的改组文库成员——其具有与一种预 定的大分子如蛋白质受体、寡糖、病毒颗粒或者其它的预定的化合物或者结构结合或者 另外地相互作用,或者催化特定的反应(如,酶的催化结构域)的能力。从这样的文 库所鉴定得到的多肽,如磷脂酶,可以用于各种目的,例如在此说明的工业方法和/ 或可以进行改组和/或选择的一个或者多个另外的循环。
【0416】在另一方面,可以预见,在重组或重装配之前,或者在重组或重装配的 过程中,通过本发明的方法产生的多核苷酸可以用试剂或方法处理,这些试剂或方法促 进突变引入到原始的多核苷酸中。引入这样的突变将会增加得到的杂合多核苷酸及由其 编码的多肽的多样性。促进诱变的所述试剂或方法可以包括,但不限于:(+)-CC-1065, 或者合成的类似物如(+)-CC-1065-(N3-腺嘌呤)(参见Sun和Hurley,(1992);能够抑制 DNA合成的N-乙酰化或者脱乙酰基的4’-氟-4-氨基联苯加合物(见,例如,van de Poll 等(1992));或者能够抑制DNA合成的N-乙酰化或者脱乙酰基的4-氨基联苯加合物(也 见,van de Poll等(1992),751-758页);三价铬、三价铬的盐、可以抑制DNA复制的 多环芳香烃(PAH)DNA加合物,如7-溴甲基-苯[a]蒽(“BMA”)、三(2,3-二溴丙基)磷 酸盐(“Tris-BP”)、1,2-二溴-3-氯丙烷(“DBCP”)、2-溴丙烯醛(2BA)、苯并[a]芘-7,8- 二氢二醇-9-10-环氧化物(“BPDE”)、铂(II)卤素盐、N-羟基-2-氨基-3-甲基咪唑并[4,5-f]- 喹啉(“N-羟基-IQ”)、和N-羟基-2-氨基-1-甲基-6-苯基咪唑并[4,5-f]-吡啶(“N-羟基 -PhIP”)。用于减慢或者停止PCR扩增的特别优选的方法由紫外线(+)-CC-1065和 (+)-CC-1065-(N3-腺嘌呤)组成。特别考虑的方法是DNA加合物或者来自多核苷酸或者 多核苷酸库的含有DNA加合物的多核苷酸,在进一步的处理前,其可以通过包括加热 含有所述多核苷酸的溶液的过程被释放或者去除。
筛选方法学和“在线”监控设备
【0417】在实践本发明的方法中,可以应用各种设备和方法学,结合使用本发明 的多肽和核酸,例如,来筛选具有磷脂酶活性的多肽,来筛选作为潜在的活性调节物 的化合物(如,酶活性的增强或者抑制),以获得结合于本发明多肽的抗体,获得与 本发明核酸杂交的核酸,等等。
固定化的酶固体支持物
【0418】磷脂酶、其片段以及编码该酶和片段的核酸可以附于固体支持物上。这 对于工业过程中磷脂酶的使用常常是经济的且有效的。例如,磷脂酶(或其活性片段) 的聚生体或者混合物——其用于特定的化学反应——可以附于固体支持物,并且浸于 处理容器中。酶反应因此可以进行。随后,可以将固体支持物从容器中取出,同时取 出的是固定在支持物上的酶,用于重复使用。在本发明的一个实施方式中,将分离的 本发明核酸附着于固体支持物。在本发明的另一个实施方式中,固体支持物选自凝胶、 树脂、聚合物、陶瓷、玻璃、微电极以及它们的任何组合。
【0419】例如,用于本发明的固体支持物包括凝胶。凝胶的一些例子包括琼脂糖 (Sepharose)、明胶、戊二醛、壳聚糖-处理的戊二醛、清蛋白-戊二醛、壳聚糖-黄原 胶、toyopearl胶(聚合胶)、藻酸盐、藻酸盐-聚赖氨酸、角叉菜胶、琼脂糖、乙二醛 琼脂糖(glyoxyl agarose)、磁性琼脂糖、葡聚糖-琼脂糖、聚(氨基甲酰磺酸盐)水凝胶、 BSA-PEG水凝胶、磷酸化的聚乙烯醇(PVC)、单氨基乙基-N-氨基乙基(MANA)、 氨基,或者它们的任何组合。
【0420】用于本发明的另一固体支持物是树脂或者聚合物。树脂或者聚合物的一 些例子包括纤维素、丙烯酰胺、尼龙、人造纤维、聚酯、阴离子交换树脂、 AMBERLITETMXAD-7、AMBERLITETMXAD-8、AMBERLITETMIRA-94、 AMBERLITETMIRC-50、聚乙烯、聚丙烯酸、聚甲基丙烯酸酯凝胶或者它们的任何组 合。
【0421】用于本发明的另一类固体支持物是陶瓷。一些例子包括无孔陶瓷、多孔 陶瓷、SiO2、Al2O3。用于本发明的另一类固体支持物是玻璃。一些例子包括无孔玻 璃、多孔玻璃、氨丙基玻璃或者它们的任何组合。可以应用的另一类型固体支持物是 微电极。例子是聚乙烯亚胺涂层磁。石墨颗粒可以用作固体支持物。
【0422】用于实施本发明的其它示例性固体支持物包括硅藻土产品和硅酸盐。一 些例子包括硅藻土和 MICRO-SILASORBTM和合成硅酸钙和硅酸镁。固体 支持物的其它例子是细胞,诸如血红细胞。
固定化方法
【0423】有许多本领域技术人员已知的用于将酶或者其片段,或者核酸固定在固 体支持物上的方法。这样的方法的一些例子包括:如,产生静电液滴的方法、电化学 方法,通过吸收、通过共价结合、通过交联、通过化学反应或者化学方法、通过封装、 通过捕集、通过藻酸钙,或者通过聚(2-甲基丙烯酸羟基乙酯)进行固定化的方法。类 似的方法在下述文献中描述:Enzymology,Immobilized Enzymes and Cells,Part C.1987. Academic Press.S.P.Colowick和N.O.Kaplan编辑,Volume 136;和Immobilization of Enzymes and Cells.1997.Humana Press.Edited,G.F.Bickerstaff编辑.Series:Methods in Biotechnology,由J.M.Walker编辑。
毛细管阵列
【0424】毛细管阵列,如GIGAMATRIXTM,Diversa Corporation,San Diego,CA,可 以用于本发明的方法。本发明的核酸或者多肽可以固定于或者施用于阵列,包括毛细 管阵列。阵列可以用于筛选或者监控能够结合或者调节本发明核酸或者多肽活性的组 分(如,小分子,抗体,核酸等)文库。毛细管阵列提供了另一个系统用于固定和筛 查样品。例如,样品筛选设备可以包括形成由相邻的毛细管组成的阵列的许多毛细管, 其中每一个毛细管包括至少一个界定保持样品的腔的壁。该设备也可以进一步包括置 于阵列中邻近毛细管之间的空隙物质,以及在空隙物质内形成的一个或者多个参照标 记。用于筛选样品的毛细管,其中毛细管经修改以适合结合在毛细管阵列中,可以包 括界定保留样品的腔的第一壁,以及由过滤材料形成的第二壁,用于过滤被提供给腔 以激发样品的激发能。
【0425】多肽或者核酸,如配体,可以引入第一成分到毛细管阵列中的至少一部 分毛细管。毛细管阵列中的每一个毛细管可以包括至少一个界定保留第一组分的腔的 壁。在第一组分后,引入气泡至毛细管中。可以将第二组分引入到毛细管中,其中第 二组分是通过气泡与第一组分分开。令人感兴趣的样品可以作为用可检测的颗粒标记 的第一液体引入到毛细管阵列的毛细管中,其中毛细管阵列中的每一个毛细管包括至 少一个界定保留第一液体和可检测颗粒的腔的壁,并且其中至少一个壁用将可检测颗 粒结合到至少一个壁的结合材料包被。该方法可以进一步包括从毛细管中去除第一液 体,其中结合的可检测颗粒仍保留在毛细管中,然后将第二液体引入到毛细管中。
【0426】毛细管阵列可以包括许多单个的毛细管,包括由至少一个界定腔的外壁。 毛细管的外壁可以是一个或者多个融合在一起的壁。相似地,壁可以界定的腔是圆柱 形、正方形、六角形或者任何其它的几何性状,只要壁形成保留液体或者样品的腔即 可。毛细管阵列中的毛细管可以非常接近地固定在一起,以形成平面结构。毛细管可 以通过融合(如,当毛细管由玻璃制成时)、胶粘、粘合或者通过夹具并列结合在一 起。毛细管阵列可以由任何数量的单个毛细管构成,例如,范围从100到4,000,000 个毛细管。毛细管阵列可以形成具有大约100,000或者更多单个毛细管结合在一起的 微滴定板。
阵列或“生物芯片”
【0427】本发明的核酸或者多肽可以固定于或者应用于阵列。可以应用阵列来筛 选或者监测组合物(例如,小分子、抗体、核酸等等)的文库,所述筛选或者监测是 针对它们结合本发明的核酸或多肽或者调控本发明的核酸或多肽的活性的能力。例 如,在本发明的一个方面,一个被监测的参数是磷脂酶基因的转录体表达。细胞的一 种或多种或所有的转录体可以通过包含细胞转录体、或代表细胞转录体的核酸、或与 细胞转录体互补的核酸的样品的杂交,通过与阵列或“生物芯片”上的固定化核酸的杂 交来测定。通过在微型芯片上应用核酸“阵列”,细胞的一些或所有的转录体可以同时 被定量。可选择地,包含基因组核酸的阵列也可以用于确定通过本发明的方法制造的 新的工程菌株的基因型。“多肽阵列”也可以用于同时定量多种蛋白。
【0428】本发明可以用任何已知的“阵列”进行实践,所述“阵列”也被称为“微阵 列”或“核酸阵列”或“多肽阵列”或“抗体阵列”或“生物芯片”,或者它们的变型。阵列一 般是多个“点”或者“靶元素”,每一个靶元素包括确定数量的一种或多种生物分子,例 如,固定于基材表面的确定区域、用于特异结合样品分子如mRNA转录体的寡核苷 酸。
【0429】在实践本发明的方法时,任何已知的阵列和/或制备和应用阵列的方法 都可以被全部或者部分地并入,或者引入它们的变型,例如在下列文献中描述的:美 国专利6,277,628;6,277,489;6,261,776;6,258,606;6,054,270;6,048,695;6,045,996; 6,022,963;6,013,440;5,965,452;5,959,098;5,856,174;5,830,645;5,770,456;5,632,957; 5,556,752;5,143,854;5,807,522;5,800,992;5,744,305;5,700,637;5,556,752;5,434,049; 还例如,WO 99/51773;WO 99/09217;WO 97/46313;WO 96/17958;也参见例如, Johnston(1998)Curr.Biol.8:R171-R174;Schummer(1997)Biotechinques 23:1087-1092;Kern(1997)Biotechniques 23:120-124;Solinas-Toldo(1997)Genes, Chromosomes & Cancer 20:399-407;Bowtell(1999)Nature Genetics Supp.21:25-32。 也参见公开的美国专利申请20010018642;20010019827;20010016322;20010014449; 20010014448;20010012537;20010008765。
抗体和基于抗体的筛选方法
【0430】本发明提供了可与本发明的磷脂酶特异结合的分离的、合成的或重组的 抗体。这些抗体可用来分离、鉴定或定量本发明的磷脂酶或相关的多肽。这些抗体可 以用于抑制本发明酶的活性。这些抗体可以用于分离与本发明的那些物质相关的多 肽,如相关的磷脂酶。
【0431】本发明的“抗体”可以包括由一个免疫球蛋白基因或多个免疫球蛋白基因 衍生(derived)、仿造(modeled after)或基本上由之编码的肽或多肽或者其片段,它 们能特异地结合抗原或表位,见例如,Fundamental Immunology,第三版,W.E.Paul, ed.,Raven Press,N.Y.(1993);Wilson(1994)J.Immunol.Methods 175:267-273;Yarmush (1992)J.Biochem.Biophys.Methods 25:85-97。术语抗体包括结合抗原的部分,即, 保留与抗原结合的能力的“抗原结合位点”(例如,片段、子序列、互补决定区(CDRs)), 包括(i)Fab片段,由VL、VH、CL和CH1结构域组成的单价片段;(ii)F(ab’)2 片段,包括在铰链区由二硫键连接的两个Fab片段的二价片段;(iii)由VH和CH1 结构域组成的Fd片段;(iv)由抗体单臂的VL和VH结构域组成的Fv片段;(v)由 VH结构域组成的dAb片段(Ward等,(1989)Nature 341:544-546);和(vi)分离的 互补决定区(CDR)。单链抗体也被包括在术语“抗体”中。
【0432】抗体可以用于免疫沉淀,染色(如FACS)、免疫亲和柱和类似物。如果 需要的话,编码特异抗原的核酸序列可以通过免疫方法获得,随后分离出多肽或者核 酸,进行扩增或者克隆,将多肽固定在本发明的阵列上。
【0433】可选地,本发明的方法可以用于修饰由细胞产生的待修饰的抗体的结构, 如,抗体的亲和性可以增加或者降低。而且,制备或者修饰抗体的能力可以是通过本 发明的方法工程改造入细胞的表型。
【0434】免疫、产生和分离抗体(多克隆抗体和单克隆抗体)的方法是本领域技 术人员已知的,并且在科学和专利文献中有描述,参见,如Coligan,CURRENT PROTOCOLS IN IMMUNOLOGY,Wiley/Greene,NY(1991);Stites(eds.)BASIC AND CLINICAL IMMUNOLOGY(第7版)Lange Medical Publications,Los Altos,CA (“Stites”);Goding,MONOCLONAL ANTIBODIES:PRINCIPLES AND PRACTICE (第2版)Academic Press,New York,NY(1986);Kohler(1975)Nature 256:495; Harlow(1988)ANTIBODIES,A LABORATORY MANUAL,Cold Spring Harbor Publications,NewYork。除了使用动物的传统的体内方法外,抗体也可以在体外产生, 例如,应用表达重组抗体结合位点的噬菌体展示文库。参见如,Hoogenboom(1997) Trends Biotechnol.15:62-70;Katz(1997)Annu.Rev.Biophys.Biomol.Struct.26:27-45。
【0435】多肽可以用于产生可以特异性结合本发明多肽的抗体。得到的抗体可以 用于免疫亲和层析方法中,来分离或者纯化多肽或者确定是否多肽存在于生物样品 中。在这样的程序中,将蛋白制备物,如提取物,或者生物样品与能够特异性结合本 发明的其中一个多肽的抗体相接触。
【0436】在免疫亲和步骤中,抗体被连接到固态支持物,如珠子或其它柱基质。 在抗体特异性结合本发明的一种多肽的条件下,蛋白质制备物被置于与抗体接触。经 清洗去除非特异性结合的蛋白质之后,特异性结合的多肽被洗脱。
【0437】在生物样品中蛋白质结合抗体的能力可以通过使用本领域技术人员所熟 悉的各种方法中的任何一种来确定。例如,结合可以通过用可检测标记物,例如荧光 试剂、酶标记或放射性同位素标记抗体来确定。可选择地,抗体与样品的结合可以通 过应用具有这样的可检测标记的二抗来检测。特定的分析包括ELISA分析、夹心分 析、放射免疫分析以及蛋白质印迹法。
【0438】产生的针对本发明多肽的多克隆抗体可以通过直接注射该多肽至动物中 而得到,或者将该多肽施用于动物例如,非人类动物而得到。这样得到的抗体随后结 合于该多肽本身。以这样的方式,甚至可以应用仅仅编码多肽片段的序列来产生可以 结合整个天然多肽的抗体。这样的抗体随后可以用于从表达多肽的细胞中分离该多 肽。
【0439】为了制备单克隆抗体,可使用可通过连续细胞系培养来产生抗体的任何 技术。实例包括杂交瘤技术、trioma技术、人B-细胞杂交瘤技术和EBV-杂交瘤技术 (参见例如Cole(1985)Monoclonal Antibodies and Cancer Therapy,Alan R.Liss,Inc., pp.77-96)。
【0440】可以对描述用于产生单链抗体的技术(参见如,美国专利编号4,946,778) 进行调整,用于产生针对本发明多肽的单链抗体。可选地,可以用转基因鼠来表达针 对这些多肽或者其片段的人源化的抗体。
【0441】产生的针对本发明多肽的抗体可以用于从其它的生物体和样品中筛选类 似的多肽。在这样的技术中,将来自该生物体的多肽与该抗体接触,检测特异性结合 抗体的那些多肽。以上所述的任何程序可以用于检测抗体结合。
试剂盒
【0442】本发明提供了包括以下成分的试剂盒,如,核酸、表达盒、载体、细胞、 多肽(如含有至少一种本发明的磷脂酶的试剂盒)和/或本发明的抗体(如含有至少 一种本发明的抗体的试剂盒)。该试剂盒可含有用于加工(制造)生物燃料、洗涤剂, 或用于处理或加工食品、饲料、生物质、食品或饲料添加剂或营养补充剂和类似物的 酶。该试剂盒也可以含有指导性材料,来指导本发明的方法学和工业应用,如本文所 述。
本发明酶的工业和医学应用
【0443】本发明提供了使用本发明的多肽,例如磷脂酶和本发明的其它酶,例如 磷脂酶A、B、C和D、patatins的许多工业应用和医学应用,包括转换非-水合的磷 脂至水合形式、制造生物燃料和加工生物质、油脱胶,加工来自植物、鱼、藻类和类 似物的油,在此仅仅指出了几种应用。在任何这些可选择的工业应用和医学应用中, 酶可以以特定的顺序加入,例如具有不同的特异性的磷脂酶以特定顺序加入,例如首 先加入具有PC-和PE-水解活性的酶(或加入两种酶,一种具有PC-水解活性,另一种 具有PE-水解活性),然后加入具有PI-水解活性(例如PLC活性)的酶,或其任何组合。
【0444】任何或所有本发明的方法可以在“加工级”使用,例如在约15,000;25,000; 50,000;75,000;或100,000lbs精炼的油/天至约1、2、3、4、5或6百万或更多lbs 精炼的油/天的级别(规模)上进行的油加工或精炼。
【0445】在工业应用中使用磷脂酶的方法在本领域是熟知的。例如,本发明的磷 脂酶和方法可以用于处理脂肪和油,如,在日本专利申请公开H6-306386中所述,该 申请描述了将存在于油和脂肪的磷脂转化为含有磷酸基团的水溶性物质。
【0446】本发明的磷脂酶可以用于处理植物油和磷脂,如那些来源于或者分离自 米糠、大豆、油菜、棕榈、棉籽、玉米、棕榈仁、椰子、花生、芝麻、向日葵的植物 油和磷脂。本发明的磷脂酶可以用于处理精炼油,如那些来自果籽的油,如葡萄籽、 杏仁、琉璃苣等。本发明的磷脂酶可以用于处理不同形式的油和磷脂,包括粗品形式、 脱胶的、胶的、洗涤水、黏土、硅石、皂脚和类似物。本发明的磷脂酶可以用于处理 高磷含量的油、鱼油、动物油、植物油、藻类油和类似物。在本发明的任何方面,任 何时候可以应用磷脂酶C,一种选择包括应用本发明的磷脂酶D和磷酸酶(如,应用 PLD/磷酸酶的组合来提高高磷含量油,如大豆油的产量)。
【0447】本发明的磷脂酶可以用于处理和制备食用油、生物柴油、用于药物和化 妆品的脂质体、结构磷脂和结构脂类。本发明的磷脂酶可以用于油提取。本发明的磷 脂酶可以用于处理和制备各种肥皂。
加工食用油:产生1,3-二酰甘油(1,3DAG)
【0448】本发明提供了使用本发明的酶(或多种酶)来制备1,3-二酰甘油(1,3DAG) 的方法。一方面,在食用油精炼期间,磷脂酶C或磷脂酶D加磷酸酶产生1,2-二酰 甘油;这提高了油产量。当用于包括碱中和步骤的方法时,例如作为碱精炼助剂,多 达70%的1,2-二酰甘油(1,2DAG)进行酰基转移,并被转化为1,3-DAG。1,3-DAG具 有增加的健康益处,因此使用PLC作为碱精炼助剂产生具有增加的营养价值的油。
【0449】本发明提供了使用本发明的酶(或多种酶)制备和加工食用油的方法, 包括产生具有增加数量的1,3-DAG的食用油。二酰甘油是许多食用油中天然发现的 化合物。在本发明方法,例如油脱胶方法的一个方面,碱(苛性碱)引起PLC产生 的1,2-DAG发生异构化成1,3-DAG,从而提供超过1,2-DAG的营养健康价值,例如 1,3-DAG作为能量被燃烧掉,而不是作为脂肪(如1,2-DAG)被储存起来。通过在碱炼 方法开始时加入PLC(酸和碱随后加入),本发明的方法产生提高水平的1,3-DAG(减 少1,2-DAG)。从营养角度看,1,3-DAG优于1,2-DAG。在可选的方面,本发明包括 使用本发明的PLC的油脱胶方法,从而产生含有不少于0.5%、1.0%、2.0%或3.0% 或更多1,3-DAG的最终脱胶的油产物。
【0450】因此,本发明提供制备(通过酯交换)精炼的油(例如二酰甘油油),包括 食用油的方法,所述的油含有增加水平的1,3-二酰甘油(1,3-DAG),如在实施例13中 所示,其中,磷脂酶诸如本发明的酶是“前载型的(front-loaded)”,或在加入酸或碱之 前加入。由甘油三酯酶法水解产生DAG通过异构化由1,2DAG产生1,3DAG。相比 起传统的食用油,含有1,3DAG的食用油显示出不同的代谢效应。1,3DAG和1,2DAG 或甘油三酯之间代谢途经的差异使得较大部分的来自1,3二酰甘油的脂肪酸作为能源 被燃烧掉,而不是作为脂肪储存起来。临床研究已经显示,经常食用DAG油作为感 观食物(sensible diet)的一部分,能帮助个体控制它们的体重和体内脂肪。此外,1,3 DAG的代谢减少血流中循环的餐后甘油三酯。因为肥胖和增高的血脂与慢性疾病, 包括心血管疾病和2型糖尿病的危险因子相关,这些生活方式相关的健康条件,可以 受到有规律的食用DAG油这样的有益方式的影响。
【0451】可以通过各种方法食用含DAG的油。因此,一方面,本发明提供使用 本发明的酶制备食物的方法,食物例如具有增加水平的1,3-DAG二酰甘油的焙烤食 物,和含有二酰甘油油的焙烤食物。一方面,焙烤食物是饼干、蛋糕和类似的焙烤食 物。
【0452】在可选择的实施方式中,可以用于本发明方法,包括食用油加工方法的 酶组合包括(其中组合中的一种或多种或所有酶包含本发明的酶):
○PLC+PI-PLC+PLA(PLC反应完成后加入PLA);
○PLD+磷酸酶+PI-PLC,然后加入PLA;或
○PLC或(PLC+PI-PLC)+PLA,对磷脂酸具有特异性(所有的酶同时或依次加 入)。
油脱胶和植物油加工
【0453】本发明的酶(例如具有脂酶、磷脂酶、酯酶和/或糖苷酶或等同活性的 多肽)可以用于各种植物油加工步骤中,诸如用于植物油提取,特别地,用于在称为 “油脱胶”的方法中除去“磷脂胶”。
【0454】本发明的这些方法可在“生产规模(process scale)”使用,例如在约15,000; 25,000;50,000;75,000;或100,000lbs精炼油/天至约1、2、3、4、5或6百万或更 多百万lbs精炼油/天规模上使用。
【0455】一方面,本发明提供了油脱胶的方法,该方法包括使用本发明的磷脂酶, 例如本发明的PLC。一方面,该方法还包括添加另一磷脂酶(其也可以是本发明的磷 脂酶),例如本发明的其它PLC、PLA、PLB、PLB或patatin,或具有溶血磷脂酶-转 酰基酶(LPTA)活性或溶血磷脂酶(LPL)活性和溶血磷脂酶-转酰基酶(LPTA)或它们的 组合活性的酶(其也可以是本发明的酶),和/或patatin-样磷脂酶(其也可以是本发明的 酶)。一方面,所有酶一起加入,或可选地,酶以特定的顺序加入,例如加入PLC后 加入PLA和/或patatin;或者首先加入本发明具有PC和PE活性的酶或许多酶,然后 加入PI PLC。
【0456】一方面,作为磷脂酶(例如本发明的PLC)处理的结果,该过程使得产 量提高。一方面,作为使用磷脂酶(例如本发明的PLA)处理的结果,该过程使得油 中磷含量额外地减少。
【0457】一方面,本发明提供了这样的方法,其包括使用本发明的磷脂酶,例如 本发明的PLC来减少胶质量并通过减少油被捕获的数量来增加中性油(甘油三酯) 产量。一方面,本发明提供了这样的方法,其包括使用本发明的磷脂酶,例如本发明 的PLC来增加中性油和二酰甘油(DAG)的产量,以增加油相。在可选的方面,本 发明的方法(例如脱胶方法)可以包含一种或多种其它的酶,诸如蛋白酶、淀粉酶、 脂酶、角质酶、其它磷脂酶(包括例如本发明的酶)、糖酶、纤维素酶、果胶酶、甘 露聚糖酶、阿拉伯糖酶、半乳糖酶、木聚糖酶、氧化酶,例如乳糖酶和/或过氧化物 酶或具有等同活性的多肽,或其组合。
【0458】本发明的磷脂酶可以用于各种植物油处理步骤,如用于植物油的提取, 特别地,用于在上述称为“油脱胶”的过程中去除“磷脂胶”。本发明提供了用于处理不 同来源的植物油的方法,所述来源如米糠、大豆、油菜、花生和其它果实、芝麻、向 日葵、棕榈和玉米。该方法可以与基于使用如己烷提取的方法联合,随后将粗提取物 精炼成食用油,包括使用本发明酶和方法。精炼过程的第一步骤是所谓的“脱胶”过程, 其用于通过加入水来分离磷脂。分离通过脱胶沉淀的物质,并且进一步加工成卵磷脂 混合物。商业上的卵磷脂,如大豆卵磷脂和向日葵卵磷脂,是半固体的或者是非常粘 稠的物质。它们是由极性脂类和油的混合物组成,其中,极性脂类主要是磷脂,油主 要是甘油三酯。
【0459】本发明的磷脂酶可以用于任何“脱胶”过程,包括水脱胶、ALCON油脱 胶(如,用于大豆)、safinco脱胶、“超脱胶”、UF脱胶、TOP脱胶、单脱胶、干法脱 胶和ENZYMAXTM脱胶。参见,美国专利号6,355,693;6,162,623;6,103,505; 6,001,640;5,558,781;5,264,367。本发明方法应用的各种脱胶过程描述于Bockisch,M. (1998)Fats and Oils Handbook,The extraction of Vegetable Oils(Chapter 5),345~445, AOCS Press,Champaign,lllinois。本发明的磷脂酶可以用于甘油三酯油酶法脱胶的工 业应用,如在EP 513709中所述。
【0460】一方面,本发明的磷脂酶用于处理植物油,例如粗油,诸如米糠、大豆、 油菜、花和类似物。一方面,这提高脱胶方法的效率。一方面,本发明提供了在低水 条件下进行酶脱胶的方法,例如在约0.1%至20%水,或0.5%至10%水的范围内。 一方面,这提高了在离心期间,重相从油相的分离水平。对这些相提高的分离水平能 够导致磷脂更有效地从油中去除,包括水合的和非水合的油。一方面,这能够产生含 有较少捕获的中性油(甘油三酯)的胶部分,从而提高脱胶方法期间的总油产量。
【0461】一方面,本发明的磷脂酶,例如具有PLC活性的多肽用于处理油(例 如植物油,例如粗油,诸如米糠、大豆、油菜、花和类似物),例如用于脱胶方法, 以减少胶质量和通过减少油捕获而增加中性油含量。一方面,本发明的磷脂酶,例如 具有PLC活性的多肽,用于生产二酰甘油(DAG)和用于增加油相。
【0462】本发明的磷脂酶可以用于酶法脱胶的工业应用,如在CA 1102795中所 述,其描述了通过加入至少50%重量百分比的水从谷物脂类中分离极性脂类的方法。 以其应用的原理是加入水到粗油混合物的角度来看,该方法是经过改良的脱胶方法。
【0463】一方面,本发明提供了酶方法,其包括应用本发明的磷脂酶(如PLC), 包括水解在油中的水合磷脂,温度为约20℃到40℃,碱性pH下进行,如pH为大约 pH 8到pH 10,反应时间为大约3到10分钟。这可以导致油中的最终磷水平少于10 ppm。本发明也提供了酶方法,其包括应用本发明的磷脂酶(如,PLC),包括水解油 中水合的和非水合的磷脂,温度为大约50℃到60℃,pH值略低于中性,例如大约 pH5到pH6.5,反应时间为大约30到60分钟。这可能导致油中的最终磷水平少于10 ppm。
【0464】在一方面,本发明提供了酶方法,该方法利用磷脂酶C酶水解甘油磷酸 酯键,并且随后使得能将磷脂中的二酰甘油酯部分返回到油中,如植物油、鱼油或者 藻类的油(“磷脂酶C(PLC)碱精炼助剂”);和,在脱胶步骤中将磷脂含量减少至对 于待物理精炼的高磷油足够低的水平(“磷脂酶C(PLC)脱胶助剂”)。这两种方法能 够产生不同的价值并且具有不同的目标应用。
【0465】在本发明不同的示例性方法中,很多不同的步骤组成了核心的漂白和除 臭精炼过程之前的脱胶过程。这些步骤包括加热、混合、维持、分离和干燥。在加热 步骤以后,加入水以及常常加入酸,并且混合,以便使得不溶性的磷脂“胶”凝聚成可 以被分离的颗粒。虽然在脱胶过程中水分离很多磷脂,但是磷脂部分是以钙盐或者镁 盐的形式存在的非-水合磷脂(NHPs)。脱胶方法通过加入酸处理这些NHPs。在磷脂 水合以后,混合油,维持并且通过离心分离。最后,将油干燥并且贮存、运输或者精 炼,如图6所示。得到的胶既可以进一步处理以获得卵磷脂产物,也可以加入到食物 中。
【0466】在本发明的各种示例性方法中,磷的水平被降到低至对于物理精炼足够 低的水平。与碱精炼相比,分离步骤可以导致潜在的较高的产量损失。此外,脱胶过 程可以产生不能以商业卵磷脂出售的废品,参见,例如图7,图7是物理精炼油的示 例性脱胶过程。因此,这些过程并没有取得显著的市场份额,碱精炼过程继续统治着 米糠、大豆、油菜和向日葵工业。然而,注意到,用于特异性脱胶过程的磷脂酶C 酶将降低胶的形成,并且将磷脂中的二酰甘油酯部分回收到油中。
【0467】一方面,本发明提供了在胶部分中使用本发明的PLC的方法。在该方 法的一个方面,将油加入到粗油中,以产生乳状液,这导致磷脂酰胆碱、磷脂酰乙醇 胺和磷脂酰肌醇移入水相(水脱胶)。离心之后,这些磷脂是含水胶部分的主要组分。 胶部分中的磷脂可以用磷脂酶C或磷脂酶D加磷酸酶(或其它组合,下文描述)处 理,以产生二酰甘油(DAG)和磷酸酯。此时,DAG可以从其它胶组分提取出来,并 在适合于对DAG进行酯交换作用的条下件用脂酶处理,产生期望的甘油三酯(结构 性脂类)。
【0468】另一方面,利用在PLC反应后例如通过加入碱增加胶的pH,大部分的 1,2-DAG可以被转化为1,3-DAG。1,3-DAG然后可以从胶中提取出来,并在合适的条 件下与脂酶反应,以在sn2位置对1,3-DAG进行酯交换作用,从而产生期望的结构性 甘油三酯。
【0469】在可选的方面,用于酯交换反应的脂肪酸,可以来自各种来源,包括粗 油中发现的游离脂肪酸。
【0470】一方面,来自水脱胶的磷脂与本发明的PLC组合使用,产生结构性脂 类。水脱胶的油可以暴露于PLC和/或PLD(其中之一或两者可以是本发明的酶)加磷 酸酶或这些组合中的其中一种,然后暴露于PLA(可以是本发明的酶),以将磷减少至 适合于碱或物理精炼的水平。
【0471】在可选择的实施方式中,可以用于本发明方法,包括这些脱胶方法的酶 组合包括(其中,组合中的一种或多种或所有酶包含本发明的酶):
○PLC+PI-PLC+PLA(PLC反应完成后加入PLA);
○PLD+磷酸酶+PI-PLC,然后加入PLA;或
○PLC或(PLC+PI-PLC)+PLA,对磷脂酸具有特异性(所有的酶同时或依次加 入)。
碱精炼
【0472】本发明提供了在碱炼中使用磷脂酶(包括本发明的酶)的方法,其中酶 被用作碱炼助剂。在可选的方面,PLC或PLD和/或磷酸酶以滴加的方式用于该方法, 可以在碱中和精炼方法(连续精炼或分批精炼)之前、期间或者之后加入。加入的酶 量可以根据方法而变化。用于本方法的水的水平可以是低水平的,例如约0.5到5%。 可选地,通过多次,将碱加入至该方法中。此外,该方法可以在不同的温度下(25℃ 到70℃),不同的酸或碱性条件下,并且在变化的pH值(4到12)下进行。可以使 用浓的碱溶液,例如比11%的工业标准浓度更大,以减少胶的质量。在可选的方面, 浓的碱溶液浓度在约12%至50%之间,例如约20%、30%、40%、50%或60%或更浓。
【0473】在一方面,本发明的磷脂酶C在甘油磷酸酯键上水解磷脂产生甘油二酯 和水溶性的磷酸化合物。水解的磷脂进入到水相,而甘油二酯留在油相中,如在图8 所说明的。PLC“碱炼助剂”的一个目的是将在中和期间形成的磷脂胶转化为二酰甘油 酯,二酰甘油酯将迁移回到油相。相反地,“PLC脱胶助剂”的一个目的是将粗油中的 磷脂降低为少于百万分之十(10ppm)的磷当量。
【0474】可以用于碱炼方法的酸包括,但是并不限于,磷酸、柠檬酸、抗坏血酸、 硫酸、反丁烯二酸顺丁烯二酸、盐酸和/或乙酸。酸被用于水合非水合的磷脂。可 以应用的碱包括,但不限于,KOH和NaOH。碱被用于中和游离脂肪酸。可选地, 磷脂酶,或者更具体地PLC或者PLD和磷酸酶,用于从胶/皂脚中纯化植物固醇。
【0475】在碱炼前加入磷脂酶的本发明的可选择实施方式是在植物中表达磷脂 酶。在另一个实施方式中,在破碎植物、种籽或者其它的植物部分期间加入磷脂酶。 可选地,在破碎后,但是在精炼前(即是在维持容器中)加入磷脂酶。此外,在有酸 或无酸的条件下,加入磷脂酶作为精炼预处理。
【0476】已经描述的本发明的另一个实施方式,是在碱精炼方法期间加入磷脂酶。 在这一方法中,酸和碱的水平依赖于磷的水平和游离脂肪酸的水平而变化。此外,该 方法使用宽的温度和pH范围,这依赖于所应用酶的类型。
【0477】在本发明的另一个实施方式中,磷脂酶在碱炼后加入(图9)。在一个 例子中,在分离前,磷脂酶加入到强力混合器(intense mixer)或者恒定混合器(retention mixer)。可选地,磷脂酶在加热步骤后加入。在另一个实施方式,磷脂酶在离心步骤 中加入。在额外的实施方式中,磷脂酶加入到皂脚中。可选地,磷脂酶加入到洗涤水 中。在另一个例子中,磷脂酶在漂白和/或除臭步骤期间加入。
【0478】一方面,在漂白和除臭之前,磷脂酶,例如磷脂酶C,本发明的酶将水 解中和过的粗的和脱胶的油中水合和非水合磷脂的磷脂。本发明的示例性的“碱精炼” 方法在图9和图13中示出。图9包括静态混合器(static mixer)的示例性的时间、温度 和pH(30至60分钟、50至60℃,pH 5至6.5)以及恒定混合器示例性的时间、温度(3 至10分钟,20-40℃)。目标酶可以作为滴加产品(drop-in product)应用于现有的碱中 和方法中,如在图9中所示。在该方面,如果酶在加入碱之后加入,酶将不必经受极 端的pH水平。如图13(酶“前载型”示例性方法)所示,任何磷脂酶,包括本发明的磷 脂酶,诸如PLC、PLB、PLA和/或PLC都可以用于粗油脱胶方法,如Bailey′s Industrial Oil & Fat Products v.4(ed.Y.H.Hui)中所述。图14和图15示出了本发明方法的变型, 其中两个或三个离心步骤分别用于所述方法中,其可以用于加工任何油,例如植物油, 诸如粗的大豆油,如图中所示。图15的示例性方法在碱炼之前具有离心步骤(除了碱 炼之后和水洗之前,和水洗之后的离心步骤),而图14的示例性方法在碱炼之前没有 离心步骤。图16示出了该方法的另一示例性变型,其使用酸处理并在脱胶步骤之前 有离心步骤;该示例性方法用于处理任何油,例如植物油诸如粗的豆油,如图所示。
【0479】一方面,本发明的磷脂酶使得磷被除至物理精炼可接受的低水平。一方 面,本发明的PLC将在漂白和除臭前,水解来自粗油中水合的和非水合磷脂的磷脂。 在目前的脱胶操作中,目标酶可以作为滴加产品应用,参见例如图10。假如在商业 设备中为亚最佳状态的混合,很可能需要酸来引起非水合的磷脂与酶在油/水界面上 接触。因此,一方面,应用本发明的酸稳定性PLC。
【0480】一方面,本发明的PLC脱胶助剂方法可以消除表2中示出的一个或者 所有三个方面的损失。由于磷脂的去除,与PLC方法相关的损失可以被估计为约0.8% 对5.2%,这以质量为基础。
表2:由PLC产品所致的损失
  碱炼助剂   脱胶助剂   1)胶形成和分离中的油损失    2.1%   X   X   2)在碱加入中的皂化的油      3.1%   X   3)在漂白中俘获于黏土中的油* <1.0%   X   X   总产量损失                  ~5.2%   ~2.1%   ~5.2%
【0481】本发明该方法的另外潜在的益处包括如下:
●减少的吸附剂-对较低水平(<5ppm)的磷,需要较少的吸附剂
●较低的化学品用量-与非水合磷脂的水合作用相关的较少的化学品和处理成 本
●较低的废物产生-需要较少的水来从油中去除磷
【0482】通过本发明的方法处理的(如“脱胶”)油包括植物油种籽,如大豆油、 油菜籽油、米糠油和向日葵油。一方面,本发明的“PLC碱炼助剂”可以比目前的碱炼 方法节约1.2%。精炼助剂的应用处理已被脱胶获得卵磷脂的豆油,并且这些也从值/ 负载计算中排出。
【0483】本发明方法的性能目标可以根据应用而变化,并且更具体地,根据酶加 入的时间点而变化,参见表3。
表3:应用的性能目标

【0484】可以应用本发明磷脂酶,如,磷脂酶A1的其它方法可以将非水合的天 然磷脂转化为至水合的形式。一方面,该酶对热敏感。因为对油加热可以破坏酶,这 可能是所需要的。然而,脱胶反应必须调节为pH 4-5以及60℃来适应该酶。在300 单位/kg的油饱和剂量时,该示例性方法成功地将以前的水-脱胶油的磷含量降至≤10 ppm P。优点可以是减少的H2O含量,以及在应用、处理和废物上的节省。表4列出 了本发明酶的示例性的工业应用:
表4:示例性应用
  碱炼助剂   脱胶助剂   豆油/卵磷脂产生   X   化学精炼的豆油、向日葵油、油菜油   X   X   低磷脂油(如棕榈)   X
【0485】除了这些不同的“脱胶”方法,本发明的磷脂酶可以用于任何植物油处理 步骤。例如,在任何植物油处理步骤中,本发明的磷脂酶可以用于替代PLA,如磷脂 酶A2。在本发明的方法中“处理”或者“脱胶”的油包括大豆油、油菜籽油、玉米油、 来自棕榈仁的油、油菜油、向日葵油、芝麻油、花生油、米糠油和类似的油。该方法 的主要产物包括甘油三酯。
【0486】在一种示例性方法中,当酶加入到粗制油并且与粗制油反应时,每1kg 粗制油,应用约10-10,000单位,或者可选地,约100-2,000单位的磷脂酶量。酶处理 进行5分钟到10个小时,温度为30℃到90℃,或者可选地,约40℃到70℃。条件 可以依赖于酶的最适温度而变化。加入用于溶解酶的水的量为,每100重量份的粗制 油使用5-1,000重量份的水,或者可选地,每100重量份的粗制油使用大约10到200 重量份的水。
【0487】一旦这样的酶处理完成后,用合适的方式,如离心分离器分离酶液体, 并得到经处理的油。以这样的方法对胶状物进行酶分解所产生的含磷化合物实际上全 部被转移到水相,并且从油相中去除。一旦酶处理完成后,如果需要,处理的油可以 用水或者有机或者无机酸另外洗涤,如乙酸、柠檬酸、磷酸、琥珀酸和等同的酸,或 用盐溶液洗涤。
【0488】在超滤脱胶的一个示例性方法中,在过滤前,将酶结合于过滤器,或者 将酶加入到油中,或定时用酶清洗过滤器。
【0489】在磷脂酶介导的物理精炼助剂的一个示例性方法中,将水和酶加入到粗 制油中(例如粗植物油)。一方面,本发明的PLC或者PLD以及磷酸酶用于该方法 中。在磷脂酶介导的物理精炼中,水可以是低水平的,即0.5-5%,处理时间应当短 (少于2小时,或者少于60分钟,或者少于30分钟,或者少于15分钟,或者少于 5分钟)。该方法可以在不同的pH(如3-10),不同的温度(25℃到70℃)下,应用 不同的酸和/或碱进行。
【0490】在可选的方面,水脱胶是首先通过离心收集卵磷脂,然后加入本发明的 PLC或PLC和PLA以去除非-水合的磷脂(该方法应当在低的水浓度下进行)进行的。 另一方面,对粗制油进行水脱胶至少于10ppm(食用油),并且随后进行物理精炼(对 于生物柴油少于50ppm)。一方面,加入乳化剂,和/或将粗制油置于到强力混合器中 促进混合。可选地,加入破乳剂,和/或对粗制油加热来促进水相的分离。另一方面, 加入酸来促进非-水合磷脂的水合。另外地,磷脂酶可以用于调节从胶/皂脚中纯化植 物固醇。
【0491】一方面,本发明提供了用于油脱胶的组合物和方法(其可以包括使用本 发明的磷脂酶),包括使用变化数量的酸和碱,而不制备皂脚。使用本发明油脱胶的 这一方面,酸(包括磷酸和/或柠檬酸)可以用于水合高磷含量油(包括大豆、油菜 和向日葵)中的非水合的磷脂。一旦磷脂被水合,水相的pH可以加入碱来提高:加 入的碱的量可以为酶活性产生有利的pH,但不会导致在油中形成显著的皂脚部分。 因为,不形成皂脚,油中的游离脂肪酸可以在下游除去,这发生在脱胶步骤之后、漂 白和除臭期间。
【0492】本发明的酶可用于改善油提取和油脱胶(例如植物油)。一方面,本发明 的PLC和至少一种植物细胞壁降解剂(例如纤维素酶、半纤维素酶或类似物,以使细 胞壁软化并增加提取产量)被用于本发明的方法中。在使用本发明的酶以改善油提取 和油脱胶的该示例性方法中,在与油生产(包括但是不限于大豆油、油菜油、向日葵 油、米糠油)相关的破碎步骤期间,使用本发明的磷脂酶C以及其它水解酶(例如纤维 素酶、半纤维素酶、酯酶、蛋白酶和/或磷酸酶)。通过在溶剂提取之前使用酶,或使 用酶以代替溶剂提取,有可能增加油产量和减少粗油中水合和非水合的磷脂的数量。 非水合磷脂的减少可以归因于在与钙或镁络合之前,潜在的非水合磷脂转化为二酰甘 油和相应的磷酸酯。粗油中磷脂的总减少量将提高精炼期间的产量,并有可能无需在 漂白和除臭之前独立的脱胶步骤。
【0493】一方面,本发明提供了将本发明的磷脂酶(例如本发明的磷脂酶-特异 性磷酸水解酶)或另一磷脂酶用于改良的“有机精炼方法”的方法,其可以包括将酶(例 如PLC)加入盛有柠檬酸的桶中。
【0494】本发明的酶可以用于任何油处理的方法,如,脱胶或等同的方法。例如, 本发明的酶可以用于美国专利号5,558,781;5,264,367;6,001,640所描述的方法中。 USPN 5,558,781所描述的方法应用磷脂酶A1、A2或B,实际上降解了油中的卵磷脂, 其作为乳化剂发挥作用。
【0495】通过应用本发明的磷脂酶,如具有磷脂酶A和/或B活性的多肽,本发 明的酶和方法可以用于旨在减少包含高含量非水合磷的食用油中的含磷组分的方法 中,如在EP专利号:EP 0869167中所述。一方面,食用油是粗制油,所谓的“非-脱 胶油”。一方面,该方法处理非-脱胶油,包括压榨油或者提取油,或者其混合物,来 自例如油菜籽、大豆、芝麻、花生、玉米、米糠或向日葵。在粗制油中,磷脂含量可 以在从0.5到3%w/w之间变化,这对应于磷含量的范围为200到1200ppm,或者在 250到1200ppm范围内。除了磷脂,粗制油也可以含有低浓度的碳水化合物、糖化 合物和Ca、Mg和Fe的金属/磷脂酸复合物。一方面,该方法包括用本发明的磷脂酶 处理磷脂或者溶血磷脂,以便水解脂肪酰基基团。一方面,磷脂或者溶血磷脂包括卵 磷脂或者溶血卵磷脂。在本方法的一方面,食用油具有的磷含量在大约50到250ppm 之间,而且该方法包括用本发明的磷脂酶处理油,以便水解大部分的磷脂,并且从油 中分离含有水解的磷脂的水相。一方面,酶法脱胶过程之前,对油进行水脱胶。一方 面,该方法生产动物饲料,包括将本发明的磷脂酶与饲料物质以及至少一种磷脂混合。
【0496】本发明的酶和方法可以用于油脱胶方法,正如在WO 98/18912所描述 的。本发明的磷脂酶可以降低食用油中的磷脂含量。该方法可以包括用本发明的磷脂 酶处理油,来水解大部分的磷脂,并且从油中分离含有水解的磷脂的水相。该方法可 以用于纯化含有磷脂的任何食用油,如,植物油,例如大豆油、米糠油、油菜籽油和 向日葵油、鱼油,藻类油和动物油和类似油。在用酶处理以前,植物油优选地进行预 处理,例如通过湿法精炼去除残渣(胶状物)。在用磷脂酶处理开始之时,该油可能 含有约50-250ppm的磷,或50-约1500ppm的磷,或更多的磷,如磷脂,并且本发 明的方法可以将该值降低到约5-10ppm以下。
【0497】本发明的酶可以用于如1993年4月25日提交的日本申请号H5-132283 所述的方法,该日本申请包括纯化油和脂肪的方法,该方法包括步骤:将油和脂肪中 的磷脂转化为含磷酸基团的水溶性物质,并且作为水溶性物质去除它们。酶的作用被 用于转化成水溶性物质。优选使用的酶是具有磷脂酶C活性的酶。
【0498】本发明的酶可以用于被描述为“有机精炼方法”(“Organic Refining Process”,ORP)(IPH,Omaha,NE)的方法,其是精炼种籽油的一种方法。ORP可 具有优于传统化学精炼的优点,包括提高的精油产量、增值的副产品、降低的投资成 本和更低的环境成本。
【0499】本发明的酶可以用于处理油或脂肪,动物或者植物,未加工的、半加工 的或者精炼的油或脂肪的方法,包括将本发明的至少一种酶加入到这样的油或者脂肪 中,该酶能够水解和/或解聚在油中含有的非-甘油酯化合物,例如EP申请号: 82870032.8所述。本发明用于水解和/或解聚在油中含有的非-甘油酯化合物的示例性 方法为:
1)在油和脂肪中,加入之前溶解于少量合适溶剂(例如,水)中的本发明的酶 或者酶复合物,并混合。一定数目的溶剂是可能的,但是选择对该酶无毒性的和适合 的溶剂。这种加入可以在逐次加载的方法中进行,也可以在连续的方法中进行。按照 该方法,加入到油和脂肪中所必需的酶量的范围可以依赖于酶以及待处理的产物,范 围从5到400ppm,或约20到400ppm;例如,对于1000kg的油或者脂肪为0.05kg 至0.4kg的酶,并且优选5到100ppm,即,对于1000kg的油从0.05kg到0.1kg的 酶,这些值被理解是对于浓酶而言的,即没有稀释剂或者溶剂。
2)使油或者脂肪通过固体或者半固体支持物上的本发明酶的固定的或者不溶性 滤床,支持物优选呈现多孔的或者纤维性结构。在这一技术中,酶被捕获于支持物的 多孔或者纤维结构的微孔中。这些支持物由,例如树脂或合成聚合物、碳酸纤维素、 凝胶如琼脂糖、具有多孔结构的聚合物或共聚物的丝构成,从而将处于溶液中的酶的 小液滴捕获在它们的微孔中。关于酶的浓度,有可能达到支持物的饱和水平。
3)以微小的液滴形式,在稀酶溶液中,分散油和脂肪,在可选的方面,含有约 0.05%体积到4%体积,或含有约0.2%体积到4%体积的本发明的酶。这一技术描述 在例如比利时专利号595,219中。具有圆锥形盖子的几米高的圆柱形柱子装满稀酶溶 液。对于这一目的,选择在待处理的油或者脂肪中无毒或不可溶混的溶剂,优选水。 柱子的底部装备了分配系统,在其中,油或者脂肪以极其分散的形式(每m2大约 10,000流量)连续注入。这样,形成无数的油或脂肪液滴,其在酶溶液中缓慢地升高 并且到达表面,从而在反应器的圆锥形盖子的顶部被连续排出。
【0500】棕榈油可以在用本发明酶处理前进行预处理。例如,将大约30kg未处 理的棕榈油加热到+50℃。在蒸馏水中制备具有纤维素酶和果胶酶的1%溶液。在强 烈搅拌几分钟下,将600g的这些中的每一物质加入到油的水溶液中。然后,在中度 搅拌的条件下,将油保持在+50℃,总反应时间是两个小时。然后,将温度升高到+ 90℃,以使酶失活,并制备用于过滤和进一步处理的混合物。将油在真空下干燥,并 使用过滤助剂进行过滤。
【0501】本发明的酶可以用在如EP专利EP 0 513 709 B2所述的方法中。例如, 本发明提供了通过使用本发明的磷脂酶的酶分解作用,减少动物和植物油中的含磷成 分的含量的方法。在可选的方面,将具有磷含量约50至1500ppm,或约50至250ppm 的预先除去粘液的动物和植物油与有机羧酸混合搅拌,并且将所得到的混合物的pH 值设定为约pH 4至pH 6,将含有本发明的磷脂酶A1、A2或者B的酶溶液加入到该 混合物中,在混合容器中,通过强力搅拌,形成微小的液滴,在其中,形成相对于油 的重量百分比为0.5到5%的乳状液,所述乳化通过至少一个后续的反应容器,在涡 旋运动下,在0.1到10小时的反应时间中,在20℃到80℃的温度范围内进行,并且 其中,在水溶液分离后,处理的油具有5ppm以下的磷含量。
【0502】有机精炼方法可以用于粗制油和脱胶油。该方法在控制的方法条件下, 应用在线方式加入有机酸,并与传统的离心分离相结合。从植物油磷脂(“VOP”)自 然分离的水再循环,并再次使用。有机精炼方法的结果为,总的水用量大大降低。
【0503】本发明的磷脂酶和方法也可以用于酶法处理食用油,如在美国专利号 6,162,623中所述。在这一示例性的方法中,本发明提供了两亲性的酶。该酶可以被 固定化,例如,通过制备含有连续疏水相以及含有酶以及酶载体的分散水相的乳状液, 并且从分散相中去除水,直到该相变成固体酶包被的颗粒。该酶可以是脂酶。固定化 的脂酶可以用于由脂酶催化的反应,如甘油单酯、甘油二酯或甘油三酯的酯交换;甘 油三酯油的脱酸作用;或者当脂酶是磷脂酶时,从甘油三酯油去除磷脂。水相可以含 有发酵液,可食用的甘油三酯油可以是疏水相,载体包括糖类、淀粉、葡聚糖、水溶 性纤维素衍生物和发酵残余物。这一示例性的方法可以用于处理甘油三酯、甘油二酯、 甘油单酯、甘油、磷脂或脂肪酸,其可以存在于疏水相中。在一方面,用于去除甘油 三酯油中的磷脂的方法包括,将含有磷脂的甘油三酯油与含有本发明磷脂酶的制备物 混合;将磷脂水解为溶血磷脂;从油中分离水解的磷脂,其中磷脂酶是固定化的磷脂 酶。
【0504】本发明的磷脂酶和方法也可以应用于食用油的酶法处理,如在美国专利 号6,127,137中所述。这一示例性方法水解完整磷脂的两个脂肪酰基团。用于该方法 的本发明的磷脂酶没有脂酶活性,并且其在很低的pH下具有活性。这些特征使其非 常适于油脱胶,这是因为油的酶法和碱法水解(皂化作用)可能均受到抑制。在一方 面,本发明提供水解磷脂或者溶血磷脂中的脂肪酰基团的方法,包括用磷脂酶处理磷 脂或者溶血磷脂,所述磷脂酶水解磷脂中的两个脂肪酰基团并且基本上无脂酶活性。 一方面,本发明的磷脂酶具有约50℃的最佳温度,测量的条件是在pH 3到pH 4下 进行10分钟;最佳pH为大约pH 3,测量的条件是在40℃下进行10分钟。一方面, 磷脂或者溶血磷脂包括卵磷脂或溶血卵磷脂。一方面,在水解大部分的磷脂后,从油 中分离含有水解的磷脂的水相。一方面,本发明提供了方法,用于从食用油中去除磷 脂,包括用本发明磷脂酶的水溶液的分散液在pH 1.5至pH 3下处理油,并从油中分 离含有水解的磷脂的水相。一方面,在用磷脂酶处理前,处理油以除粘质。一方面, 在用磷脂酶处理前,该油含有磷脂,其量相当于50到250ppm的磷。一方面,在0.5 到5%的水存在下,在30℃到45℃,用磷脂酶处理1到12个小时,磷脂酶的剂量为 0.1到10mg/l。
【0505】本发明的磷脂酶和方法也可以用于用酶法处理食用油,如在美国专利号 6,025,171中所述。在这一示例性的方法中,本发明的酶通过如下步骤被固定化:制 备含有连续疏水相如甘油三酯和分散的水相的乳状液,所述水相含有两亲性酶,如脂 酶或者本发明的磷脂酶和在水相中部分溶解和部分不溶解的载体物质;并从水相中去 除水,直到该相变为固体酶包被的载体颗粒。因为水相已经用水溶性物质饱和,载体 物质的非溶解部分可以是在水中和油中不溶的物质,或者非溶解形式的水溶性物质。 水相可以用含有发酵残留物和生物质的粗脂酶发酵液形成,生物质可以作为载体物 质。固定化的脂酶可以用于油中的酯重排和脱酸作用。反应后,固定化的酶可以通过 如下的方法再生,用于以后的反应:加入水以得到载体的部分溶解,且所得到的含有 酶和载体的水相分散到疏水相中,蒸发掉水,再次形成酶包被的载体颗粒。
【0506】本发明的磷脂酶和方法也可以用酶法处理食用油,如在美国专利号 6,143,545中所述。该示例性方法用于应用本发明的磷脂酶来降低食用油中含磷组分 的含量,该食用油包含高含量的非-水合磷。一方面,该方法用于降低食用油中含磷 组分的含量,该食用油具有至少50ppm的非-水合磷含量,这如下方法测量:通过加 入含有柠檬酸单水合物的水溶液(加入水对油为4.8%w/w;在水相中的(柠檬酸) =106mM,水/油乳液=4.6mM)在60℃预处理食用油30分钟;将10ml预处理的油 包水乳状液转移至试管中;在沸水浴中加热乳状液30分钟;在5000rpm离心10分 钟,将大约8ml的上层(油)相转移至新的试管中,并且放置24小时;从上清相中 取2克,用于测定在食用油中的非-水合磷的含量(ppm)。该方法也可以包括在大约 pH 5到8的pH下,将油与本发明的磷脂酶A或者B的水溶液(如,PLA1、PLA2 或PLB)接触,该溶液在油中进行乳化,直到油的磷含量下降到小于11ppm。然后 从处理的油中分离水相。
【0507】本发明的磷脂酶和方法也可以用于酶法处理食用油,如在美国专利 5,532,163中所述。本发明提供精炼油和脂肪的方法,通过该方法,待处理的油和脂 肪中的磷脂可以被有效地分解和去除。一方面,本发明提供精炼油和脂肪的方法,包 括在乳状液中使油和脂肪与本发明的酶反应,本发明的酶例如具有分解甘油磷脂中甘 油-脂肪酸酯键的活性的酶(如本发明的PLA2);也提供了另一个方法,其中用酶处 理的油和脂肪用水或者酸性水溶液洗涤。一方面,用于洗涤步骤的酸性水溶液是至少 一种酸的溶液,如柠檬酸、乙酸、磷酸以及它们的盐。一方面,通过每100重量份的 油和脂肪应用30重量份或更多的水来形成乳化条件。因为油和脂肪可以不用传统的 碱法精炼步骤来纯化,所以可以降低洗涤废水和工业废物的产生。此外,由于包含在 这些废物中而导致天然油和脂肪损失的现象不在本发明的方法中发生,所以油的回收 产量增加。一方面,本发明提供了用于精炼含有约100到10,000ppm的磷脂的油和 脂肪的方法,包括:在乳化的条件中,将所述油和脂肪与具有分解甘油磷脂中的甘油 -脂肪酸酯键的活性的本发明酶进行反应。一方面,本发明提供了用于精炼含有约100 到10,000ppm的磷脂的油和脂肪的方法,包括:在乳化的条件中,将所述油和脂肪 与具有分解甘油磷脂中的甘油-脂肪酸酯键的活性的本发明酶进行反应;并且随后用 洗涤水洗涤处理的油和脂肪。
【0508】本发明的磷脂酶和方法也可以用于酶法处理食用油,例如在美国专利号 5,264,367中所述。可食用植物油或者动物油,如油,例如大豆油——其已经通过湿 法精炼去除胶质——的含磷成分的含量以及铁含量通过下述方法降低:通过将所述油 与本发明的酶如磷脂酶A1、A2或者B的水溶液接触进行酶分解,然后从处理的油中 分离水相。一方面,本发明提供了降低油中的含磷组分和含铁组分的含量的酶方法, 所述油已经进行精炼去除胶质。已经进行精炼去除胶质的油可以用本发明的酶处理, 如磷脂酶C、A1、A2或B。可以实现磷含量低于5ppm,铁含量低于1ppm。低的铁 含量对油的稳定性可能是有利的。
【0509】本发明的磷脂酶和方法也可以用于制备酯交换的油,如在美国专利 5,288,619所描述的。本发明提供了酶法酯交换的方法,用于制备具有低的反式酸和 低的中链脂肪酸含量的人造黄油。该方法包括以下步骤:提供含有硬脂酸源物质和可 食用液体植物油的酯交换反应混合物;应用1-,3-位置特异性脂酶对硬脂酸源物质和植 物油进行酯交换;然后,最后氢化脂肪酸混合物,来提供再循环的硬脂酸源物质,用 于与植物油进行再循环反应。本发明也提供了制备酯交换油的逆流方法 (counter-current method)。该方法包括下述步骤:提供含有1-,3-位置特异性脂酶的酯 交换反应区域;将植物油引入酯交换区域;引入硬脂酸源物质;传输超临界气体或者 亚临界液化气体逆流流体;在反应区域中进行甘油三酯流与硬脂酸或者硬脂酸单酯流 的酯交换反应,;抽提酯交换的甘油三酯人造黄油流;抽提逆流流体相;对酯交换的 硬脂酸或者硬脂酸单酯进行氢化作用,以提供氢化的再循环硬脂酸源物质;并将氢化 的再循环硬脂酸源物质引入反应区域。
【0510】一方面,高度不饱和的磷脂化合物可以通过适当地应用本发明的磷脂酶 C以去除sn-3位置的磷酸基团,随后进行1,3脂酶酰基酯的合成,而转变为甘油三酯。 2-取代的磷脂可以直接用作功能性食物成分,或者随后可以应用本发明的固定化的磷 脂酶C在反应器160中选择性地进行水解,以产生1-甘油二酯,随后进行在此描述 的酶促酯化反应,来产生具有2-取代的多聚不饱和脂肪酸组分的甘油三酯产物。
【0511】本发明的磷脂酶和方法也可以用于植物油的酶法脱胶方法,如在美国专 利号6,001,640中所描述的。本发明的该方法包括在食用油生产中的脱胶步骤。通过 先前的水脱胶方法已经去除可水合磷脂的植物油,通过用本发明的磷脂酶进行酶法处 理,不含有非-水合磷脂。该方法可以是温和的、经济的以及环境友好的。仅仅水解 溶血卵磷脂而不水解卵磷脂的磷脂酶用于该脱胶方法。
【0512】一方面,为了使本发明的酶能在两相中作用,含有酶的油相和水相,必 须充分混合。仅仅搅拌它们可能是不够的。如果其溶解于少量的水中,如0.5-5%重 量百分比(相对于油),则有助于酶在油中很好地分散开,并且以这一形式在油中进 行乳化,从而形成直径小于10微米的液滴(平均重量)。液滴可以小于1微米。可以 以超过100cm/秒的径向速率进行剧烈的搅拌。油也可以应用外部旋转在反应器中 循环。含有酶的水相也可以利用超声作用充分分散。可以应用分散仪器。
【0513】酶反应可能发生在油相和水相之间的界面上。所有这些混合措施的目标 是为含有酶的水相产生最大可能的表面。表面活性剂的加入增加了水相的微分散。所 以,在一些情况下,将HLB值高于9的表面活性剂,如十二烷基硫酸钠加入到酶溶 液中,如在EP-A 0 513 709中所描述的。增加乳化作用的类似有效的方法是加入溶血 卵磷脂。相对于油,加入的量可以在0.001%到1%范围内。酶处理期间的温度不是至 关重要的。可以应用在20℃到80℃之间的温度,但是后者只能短时间应用。在该方 面,应用具有良好的温度和/或低pH值耐受性的本发明的磷脂酶。在30℃到50℃之 间的应用温度是最佳的。处理时间取决于温度,并且可以随着温度增加,时间变短。 时间从0.1到10小时,或者从1到5小时一般足够了。反应在脱胶反应器中发生, 其可以划分为几个阶段,如在DE-A 43 39 556中所描述的。因此,可以进行连续操作, 以及间歇性(分批)操作。反应可以在不同的温度阶段中进行。例如,温育可以在40℃ 下进行3小时,然后在60℃下进行1小时。如果反应在这些阶段中进行,这也可能 在各个阶段调节不同的pH值。例如,通过加入柠檬酸溶液,在第一阶段,溶液pH 值可以调节到7,例如,在第二阶段,将pH值调节到2.5。然而,在至少一个阶段, 酶溶液的pH值必须低于4或者低于3。如果pH值随后调节到低于这一水平,可能 会损害效果。因此,柠檬酸可以在后者被混合到油中之前被加入至酶溶液中。
【0514】在酶处理完成以后,酶溶液以及包含在酶溶液中的NHP的分解产物, 可以例如通过离心的方式,从油相中分批或连续地分离出来。由于酶具有高水平的稳 定性,并且包含在溶液中的分解产物的量较少(它们可能沉淀为污泥),存在于水相 中的同样的酶可以应用几次。也有可能从污泥中释放出酶,参见如DE-A 43 39 556, 这样基本上没有污泥的酶溶液可以被再次使用。在这一脱胶方法的一个方面中,得到 含有少于15ppm磷的油。一个目标是磷含量少于10ppm;或者少于5ppm。在磷含 量低于10ppm的情况下,按照蒸馏脱酸方法进一步处理油是非常可能的。许多其它 的离子,如镁、钙、锌以及铁,可以从油中去除,如低于0.1ppm。这样,该产品为 在进一步处理和储存期间具有良好的耐氧化性具有理想的前提条件。
【0515】本发明的磷脂酶和方法也可以用于降低植物油和动物油中含磷组分的 量,如在EP专利EP0513709中所述。在这一方法中,植物和动物油中含磷组分,尤 其是磷脂如卵磷脂的含量以及铁含量,通过应用本发明的磷脂酶A1、A2或者B的酶 法降解作用而被降低,所述植物和动物油之前经过了脱泥处理,如大豆油。
【0516】本发明的磷脂酶和方法也可以用于精炼脂肪或者油,如在JP 06306386 中所述。本发明提供了用于精炼脂肪或者油的方法,该方法包括将在脂肪或者油中的 磷脂转化成水溶性的含磷基团物质,并除去该物质的步骤。本发明酶(如,PLC)的 作用被用于将磷脂转化成这种物质。因此,有可能在无需进行碱精炼步骤的情况下, 精炼脂肪或者油,碱精炼步骤产生含有碱性废水和大量油的工业废物。由于中性脂肪 或油与废物一起排出所致的损失可以降低到零,可以实现产量的增加。在一方面,通 过在粗制油脱胶阶段加入本发明具有磷脂酶C活性的酶,和进行酶处理,胶状物质被 转化成水溶性物质,并作为水溶性物质而被去除。一方面,本发明的磷脂酶C具有切 割磷脂中的甘油和磷酸的酯键的活性。如果需要,该方法可以包括用水或者酸性水溶 液洗涤经过酶处理的油。一方面,加入本发明的酶,并且与粗制油反应。所用的磷脂 酶C的量可以是每公斤粗制油10到10,000单位,或大约100到2,000单位。
【0517】本发明的磷脂酶和方法也可以用于水脱胶方法,如在Dijkstra,Albert J. 等,Oleagineux,Corps Gras,Lipides(1998),5(5),367-370中描述。在该示例性的方法 中,水脱胶方法被用于产生卵磷脂,并且用于使用脱胶酸和漂白土的干法脱胶方法。 这一方法可能仅仅对于低磷脂含量的油是经济可行的,如棕榈油、月桂油等。对于具 有高NHP含量的种籽油,应用酸精炼方法,其中该方法在榨油机中进行,以使得胶 经粗粉(meal)去除。一方面,该酸精炼的油是在物理精炼之前所进行的一个可能的 “磨光(polishing)”操作。
【0518】本发明的磷脂酶和方法也可以用于脱胶方法,如在Dijkstra,等,Res.Dev. Dep.,N.V.Vandemoortele Coord.Cent.,Izegem,Belg.JAOCS,J.Am.Oil Chem.Soc. (1989),66:1002-1009中描述。在该示例性的方法中,全部的脱胶方法包括将酸如磷酸 或者柠檬酸分散至大豆油中,允许接触一定的时间,随后将碱如苛性钠或者硅酸钠混 合到油包酸(acid-in-oil)乳状液中。这可以将中和度保持在足够低的水平,以避免形 成肥皂,这是因为这将导致油损失的增加。随后,油通过离心分离器,在其中,大多 数胶从油流中去除,产生具有最少油含量的胶相(gum phase)。油流随后通过第二离 心分离器中,以去除所有残留的胶,得到稀胶相,其被循环再利用。洗涤和干燥或者 在线碱法精炼完成该方法。在采用全部的脱胶方法以后,与经典的碱法精炼方法比较, 实现了总产量增加大约0.5%。完全脱胶的油然后可以进行碱精炼,漂白和除臭,或 者被漂白和物理精炼。
【0519】本发明的磷脂酶和方法也可以用于去除植物油,如大豆油中的非水合磷 脂,如在Hvolby,等,Sojakagefabr.,Copenhagen,Den.,J.Amer.Oil Chem.Soc.(1971) 48:503-509中所描述的。在这一示例性的方法中,水脱胶的油在不同的固定pH值下 与含有和不含有Ca++、Mg/Ca结合试剂的缓冲液以及表面活性剂混合。非水合的磷脂 可以作为微胶粒或混合乳化剂的组分以未转化的状态被去除。更进一步地,非水合磷 脂可以通过转化为解离形式而去除,例如通过从磷脂中去除Mg和Ca,该过程可以 通过酸化或者通过用Mg/Ca络合试剂或者Mg/Ca沉淀试剂处理来完成。非水合磷脂 的去除或者化学转化可能导致乳状液形成减少,和从乳状液层和皂脚分离的脱酸油增 加。
【0520】本发明的磷脂酶和方法也可以用于植物油的脱胶,如在Buchold,等, Frankfurt/Main,Germany.Fett Wissenschaft Technologie(1993),95(8),300-304中所述。 在本发明的用于食用植物油脱胶的这一示例性方法中,用本发明酶如磷脂酶A2的水 悬浮液来水解结合在磷脂sn2位上的脂肪酸,得到不溶于油的1-酰基-溶血磷脂,并 且因此更适用于物理分离。甚至加入少量的相当于大约700卵磷脂酶(lecitase)单位/ 公斤油,得到的残留磷浓度小于10ppm,这样化学精炼是可以用物理精炼替代的, 从而消除了中和、皂脚破裂和废水处理的必要性。
【0521】本发明的磷脂酶和方法也可以用于植物油的脱胶,如EnzyMax.Dahlke, Klaus.Dept.G-PDO,Lurgi O1-Gas,Chemie,GmbH,Frankfurt,Germany.Oleagineux, Corps Gras,Lipides(1997),4(1),55-57中所述。该示例性方法是一个用于物理精 炼几乎任何种类油的脱胶方法。通过酶-催化的水解,磷脂转化为水溶性的溶血磷脂, 其可以通过离心从油中分离得到。在酶法脱胶的油中,残留的磷含量可以低至2ppm P。
【0522】本发明的磷脂酶和方法也可以用于植物油的脱胶,如在Cleenewerck,等, N.V.Vamo Mills,Izegem,Belg.Fett Wissenschaft Technologie(1992),94:317-22;和 Clausen,Kim;Nielsen,Munk.Novozymes A/S,Den.Dansk Kemi(2002)83(2):24-27中 所述。本发明的磷脂酶和方法可以合并用酸对植物油进行的预精炼方法,预精炼方法 如在下述文献中所述:Nilsson-Johansson,等,Fats Oils Div.,Alfa-Laval Food Eng.AB, Tumba,Swed.Fett Wissenschaft Technologie(1988),90(11),447-51;以及,Munch,Ernst W.Cereol Deutschland GmbH,Mannheim,Germany.Editor(s):Wilson,Richard F. Proceedings of the World Conference on Oilseed Processing Utilization,Cancun,Mexico, Nov.12-17,2000(2001),Meeting Date 2000,17-20。
【0523】本发明的磷脂酶和方法也可以用于植物油中的脱胶,如在Jerzewska,等, Inst.Przemyslu Miesnego i Tluszczowego,Warsaw,Pol.,Tluszcze Jadalne(2001),36(3/4), 97-110中所述。在本发明的这一方法中,通过应用本发明的磷脂酶A2对水合的低- 芥酸油菜籽油进行酶法脱胶。该酶可以催化磷脂中与甘油部分的中心碳原子连接的脂 肪酸酯键的水解。它也可以水解非-水合的磷脂成它们相应的水合溶血化合物。使用 非纯化的酶制备物,加入2%的制备物4小时,可以得到更好的结果(87%的磷去除)。
【0524】在本发明的油脱胶(或使用本发明酶的油脱胶方法)的另一示例性方法中, 加入酸性聚合物,例如藻酸盐或果胶。在本发明的该油脱胶方法中,将酸性聚合物(例 如藻酸或果胶或更加可溶性的盐形式)加入到含有少量水(例如在约0.5至5%范围内) 的粗油中。在该方面中,通过结合粗油中的钙和/或镁,酸性聚合物可以减少和/或分 解磷脂-金属络合物,从而提高非水合磷脂的溶解性。在可选的方面,这些磷脂将移 动到油/水介面或进入水相,或者转化为二酰甘油和相应的侧链,或者完整的磷脂将 作为重相的组分被随后的离心除去。在水相中酸性聚合物的存在也可以增加水相的密 度,并提高从油(轻)相分离重相的效果。
【0525】本发明的油脱胶(或使用本发明酶的油脱胶方法)的一个示例性方法改变 除臭程序,以获得二酰甘油(DAG)部分。在可选的方面,如果必要或需要,在酶助 脱胶之后,可以改良除臭条件(温度、压力、蒸馏设备的构造),以达到提高游离脂 肪酸(FFA)从二酰甘油/三酰甘油部分分离的结果,或进一步改良以从三酰甘油部分 分离二酰甘油。这些改良的结果是,使用本发明的方法有可能获得食品级FFA和二 酰甘油,如果本发明的酶(例如磷脂酶,或PLC或PLC和磷酸酶的组合)用于在物 理精炼方法中使食用油脱胶的话。
【0526】在各个方面,实施在此描述的本发明方法(或使用本发明的酶),具有许 多优点,诸如:减少或消除溶剂和溶剂回收步骤;降低资金成本;减少下游精炼成本; 减少化学品的利用、设备、处理时间、能源(热能)和水利用/废水产生;产生高质 量的油;在一些烹饪和煎炒应用中可以使用未精炼的压榨机压出的油(该压出的油可 以具有优异的稳定性、色泽和气味特征和高维生素E含量);产生高质量的膳食;产 生低脂肪含量的膳食(目前,出自机械压榨的膳食引起反刍动物的消化问题);产生提 高的营养特性——减少水平的芥子油苷、单宁、植酸(如在Technology and Solvents for Extracting Oilseeds and Nonpetroleum Oils,AOCS 1997中所述)。
【0527】一方面,本发明提供了精炼植物油(例如大豆油、玉米油、棉籽油、棕 榈油、花生油、油菜油、红花油、向日葵籽油、芝麻籽油、米糠油、椰子油或油菜油) 和它们的副产物的方法,和对卵磷脂除臭的方法,例如在美国专利6,172,248或 6,172,247中所述,其中该方法包括使用至少一种本发明的酶,例如本发明的磷脂酶C。 因此,本发明提供了包含至少一种本发明的酶的卵磷脂和植物油。在示例性有机酸精 炼方法中,将植物油与稀的含水有机酸溶液组合,并进行高剪切,以将酸溶液充分分 散在油中。将所得的酸-和-油混合物在低剪切下混合一段足够的时间,以将污染物螯 合入水合的杂质相中,从而产生纯化的植物油相。在该示例性方法中,可以使用混合 器或循环系统(例如循环水桶)和/或磷脂或卵磷脂储存桶,如在美国专利4,240,972、 4,049,686、6,172,247或6,172,248中所述。这些方法可以作为分批或连续方法操作。 粗或脱胶的植物油可以由储存桶供应(例如通过泵)并可以加热。待纯化的植物油可以 是粗的或“脱胶的”油。
【0528】一方面,本发明的磷脂酰肌醇-PLC(PI-PLC)酶用于植物油脱胶。本发明 的PI-PLC可以单独使用,或与其它的酶(例如,本发明的PLC、PLD、磷酸酶)组 合使用,用于提高植物油(包括大豆油、油菜油和向日葵油)脱胶期间的油产量。PI-PLC 可以优选将磷脂酰肌醇转化为1,2-二酰甘油(DAG)和磷酸肌醇(phosphoinositol),但是 它也可以对其它磷脂表现出活性,包括磷脂酰胆碱、磷脂酰乙醇胺、磷脂酰丝氨酸或 磷脂酸或其组合。对植物油进行酶处理导致捕获在较小的胶部分中的油的数量减少, 这增加了酶处理的植物油中的DAG量和中性油增加,从而实现产量增加。
含油种子的酶法加工
【0529】本发明提供了酶法加工含油种子,包括大豆、油菜、椰子、鳄梨和橄榄 糊的组分(例如酶)和方法。一方面,本发明的这些方法可以增加油产量,并提高获得 的膳食的营养质量。在一些方面,使用本发明的酶和方法来酶法加工含油种子,将具 有经济和环境利益,并为油萃取和加工人类和动物食物提供了可供选择的技术。在可 选的方面,本发明的方法包括使用本发明的磷脂酶、其它磷脂酶、蛋白酶、磷酸酶、 植酸酶、木聚糖酶、淀粉酶(例如α-淀粉酶)、葡聚糖酶(例如β-葡聚糖酶)、聚半 乳糖醛酸酶、半乳糖脂酶、纤维素酶、半纤维素酶、果胶酶和其它降解植物细胞壁的 酶、以及混合酶制剂和细胞裂解酶。
【0530】在可选的方面,本发明的方法可以与其它方法联合实施,例如酶处理, 例如用碳水化合物酶处理,包括纤维素酶、半纤维素酶和其它具有副降解活性的酶, 或与化学方法联合,例如己烷提取大豆油方法。当在溶剂萃取之前进行酶法处理,酶 法处理可以增加油萃取率达8-10%。
【0531】在可选的方面,本发明的方法可以用水萃取方法实施。水萃取方法对于 油萃取来说可能是可选择的环境清洁器技术。水方法的低萃取产量可以通过使用这样 的酶克服,即该酶水解形成含有种子细胞壁的结构多糖,或水解形成细胞和类脂体膜 的蛋白质,例如,利用包括纤维素酶、半纤维素酶和/或原果胶酶在内的酶进行消化, 以从大豆细胞提取油。一方面,根据Kasai(2003)J.Agric.Food Chem.51;6217-6222 的描述,用本发明的酶实施本方法,该文献报道了消化细胞壁最有效的酶是纤维素酶。
【0532】一方面,蛋白酶与本发明的方法一起使用。已经评价了蛋白酶和纤维素 酶的操作变量和酶活性以及其它方法参数,诸如酶浓度、水解时间、颗粒大小和固液 比对油和蛋白质提取产量的联合效应。一方面,根据Rosenthal(2001)Enzyme and Microb.Tech.28;499-509的描述,用本发明的酶实施本方法,该文献报道了使用蛋白 酶能比使用热处理面粉的对照产生明显较高的油和蛋白质产量。
【0533】一方面,全蛋白、果胶和半纤维素提取方法与本发明方法一起使用。植 物细胞由一系列的多糖组成,其常常与蛋白质和酚类化合物相关或用蛋白质和酚类化 合物替代。这些碳水化合物中的大部分只是被消化酶部分消化或低效利用。通过加工 酶或降解性酶来裂解这些结构,可以提高它们的营养可利用率。一方面,根据Ouhida (2002)J.Agric.Food Chem.50;1933-1938的描述,用本发明的酶实施本方法,该文献 报道了全蛋白、果胶和半纤维素提取之后大大降解了大豆细胞壁纤维素(高达20%)。
【0534】一方面,本发明的方法进一步包括在处理种子例如油菜籽中结合各种酶 处理,这些处理包括使用蛋白酶、纤维素酶和半纤维素酶(本发明的一种或多种酶相 互之间和与本发明的一种或多种酶的各种组合)。例如,该方法可以包括在传统方法 之前,在用酶温育期间,在20至40水份中酶法处理油菜种子,如Sosulski(1990)Proc. Can.Inst.Food Sci.Technol.3;656所述。本发明的方法可以进一步结合蛋白酶、α-淀 粉酶、聚半乳糖醛酸酶(本发明的一种或多种酶相互之间和与本发明的一种或多种酶 的各种组合),以水解椰子膳食中的纤维素物质和释放椰子油,该椰子油可以通过离 心回收,如McGlone(1986)J.of Food Sci.51;695-697所述。本发明的方法可以进一步 以不同的组合方式结合果胶酶、α-淀粉酶、蛋白酶、纤维素酶(本发明的一种或多种 酶相互之间和与本发明的一种或多种酶的各种组合),以在酶法提取椰子油期间明显 提高产量(在最好的情况下~70%),如Buenrostro(1986)Biotech.Letters 8(7):505-506 所述。在本发明的橄榄油提取方法中,用纤维素酶、半纤维素酶、聚半乳糖醛酸酶 (poligalacturonase)、果胶-转甲基酶、蛋白酶和它们的组合(本发明的一种或多种酶相 互之间和与本发明的一种或多种酶的组合)处理橄榄糊,如,例如Montedoro(1976) Acta Vitamin.Enzymol.(Milano)30;13所述。
从植物油中纯化植物固醇
【0535】本发明提供了方法,用于从植物油中纯化植物固醇和三萜,或者植物甾 醇。应用本发明的磷脂酶和方法可以纯化的植物固醇,包括-谷固醇、菜子甾醇、豆 甾醇、豆甾烷醇、β-谷甾烷醇、谷甾烷醇、24-脱氢胆甾醇、海绵甾醇、海棉动物甾醇、 γ-谷甾醇和菜子甾醇。植物固醇是用于健康和营养工业的重要农产品。因此,本发明 的磷脂酶和方法可用于制备用于化妆品制造的乳化剂以及用于生产激素药物的甾体 中间物和前体。本发明的磷脂酶和方法用于制备(如,纯化)植物固醇和它们的酯的 类似物,用作具有心血管健康价值的降低胆固醇的试剂。本发明的磷脂酶和方法用于 纯化植物甾醇,植物甾醇通过抑制在消化道中的胆固醇吸收,来降低血清中的胆固醇 水平。本发明的磷脂酶和方法用于纯化在极低的浓度下具有免疫调节特征的植物甾 醇,包括增强的T淋巴细胞的细胞应答和天然杀伤细胞对癌细胞系的细胞毒性活性。 本发明的磷脂酶和方法用于纯化植物甾醇,植物甾醇用于治疗肺结核、类风湿性关节 炎、HIV-感染病人的处理和免疫应力的抑制,例如,在马拉松选手中。
【0536】本发明的磷脂酶和方法用于纯化存在于商品植物油(如,椰子、油菜、 可可豆脂油、玉米、棉籽、亚麻、橄榄、棕榈、花生、米糠、红花、芝麻、大豆、向 日葵油)的甾醇部分中的甾醇组分,如,谷固醇(40.2-92.3%)、菜油甾醇(2.6-38.6%)、 豆甾醇(0-31%)和5-燕麦固醇(1.5-29%)。
【0537】本发明的方法可以结合油籽中植物来源固醇的分离,该分离通过下述方 法完成:用氯仿-甲醇、己烷、二氯甲烷或者丙酮进行溶剂抽提,然后进行皂化作用 和层析法纯化,以获得富集的总甾醇。可选地,植物样品可以通过应用超临界二氧化 碳的超临界流体提取法提取,以得到总的脂类提取物,从中可以富集和分离甾醇。对 于甾醇化合物的随后表征和定量,粗分离物可以通过很多不同的色谱技术纯化和分 离,包括柱层析(CC)、气相色谱、薄层色谱(TLC)、正相高效液相色谱(HPLC)、 反相高效液相色谱和毛细管电色谱。在所有的色谱分离和分选技术中,对于样品清理、 纯化、定性分析和测试样品中固醇的初步估计而言,CC和TCL程序的应用是最容易 进行的,成本上承受得起的并且是适当的。
【0538】在可食用油的精炼过程中,植物油中的植物固醇作为副产物而丧失。本 发明的磷脂酶和方法应用从这样的副产物中分离的植物固醇,来制备从这样的副产物 中分离得到的富集植物固醇的产物。本发明的植物固醇分离和纯化方法可以合并油处 理方法中的工业副产物,并且可以包括如分子蒸馏、液-液提取和结晶的操作。
【0539】本发明的方法可以结合抽提液体来提取植物固醇的方法。例如,本发明 的方法可以应用非极性溶剂如己烷(一般用于提取大部分种类的植物油),定量地提 取游离的植物固醇和植物固醇酰基脂肪酸酯。固醇糖苷和脂肪酰化固醇糖苷仅仅用己 烷部分提取,并且增强的溶剂极性产生了更高百分比的抽提率。可以应用的一个程序 是Bligh和Dyer的氯仿-甲醇方法,用于提取所有的固醇脂类,包括磷脂。一个定性 分离和定量分析植物固醇脂类的示例性方法包括将脂类提取物注射入HPLC系统。
【0540】本发明的磷脂酶和方法可以用于从脂肪和油中去除甾醇,如在美国专利 号6,303,803中所描述的。这是降低含有固醇的脂肪和油中的固醇含量的方法。其基 于胆固醇和其它甾醇对于形成疏水流体双层,如磷脂双层的两性分子的亲和性,是一 个高效和具有成本效率的过程。磷脂的聚集体与,例如含有甾醇的脂肪或者油在含水 环境下接触,随后进行混合。聚集的磷脂混合物的分子结构对胆固醇和其它甾醇具有 高亲和性,并可以从脂肪和油中选择性地去除这样的分子。水相分离混合物混合足够 长的时间,以便通过分配甾醇到磷脂聚集体部分中,从而选择性地降低脂肪/油产物 中的甾醇含量。甾醇含量降低的脂肪或者油被从水相分离混合物中分离。可选地,相 应的富集甾醇的部分也可以被从水相分离混合物中分离。这些步骤可以在室温下进 行,涉及加热的成本被减到最少,同样地,产物可能因为热而降解也被减少。另外, 需要最少量的设备,并且因为所有需要的物质是食品级的,该方法不需要在操作、废 物处理、或者最终产物的污染方面有特别预防措施。
【0541】本发明的磷脂酶和方法可以用于从脂肪和油中去除甾醇,如,在美国专 利号5,880,300所描述的。将磷脂聚集体与,如含有甾醇的脂肪或者油在含水环境中 接触,然后进行混合。在充分混合后,甾醇含量降低的脂肪或者油从含水分离混合物 中分离出来。可选地,相应的甾醇富集的磷脂也可以从含水分离混合物中分离。植物 (如蔬菜)油含有植物甾醇(植物固醇),它们也可以应用本发明的方法去除。该方 法可以用于商业处理循环的任何阶段的脂肪/油产品。例如,本发明的方法可以用于 精炼、漂白和除臭的油(“RBD油”),或者在达到RBD状态之前的加工过程的任何 阶段。与预RBD油相比,尽管RBD油可以具有改变的密度,但本过程易于改变而适 合于RBD也适合预RBD油(pre-RBD oil),或者适合于各种非脂肪/油产品,这是通 过改变磷脂含量、磷脂组成、磷脂:水的比例、温度、压力、混合条件和以下所述的 分离条件而进行的。
【0542】可选地,本发明的酶和方法可以用于在油加工的中间步骤中分离植物甾 醇或者其它甾醇。例如,已知在植物油的除臭期间失去植物甾醇。含有甾醇的蒸馏部 分——例如来自处理的中间阶段,可以进行以上描述的甾醇抽提程序。这提供了富含 甾醇的卵磷脂或者其它的磷脂物质,其可以进一步处理以便回收抽提的甾醇。
洗涤剂组合物
【0543】本发明提供了包括一种或者多种本发明的磷脂酶的洗涤剂组合物,和制 备和使用这些组合物的方法。本发明结合了所有制备和使用洗涤剂组合物的方法,参 见例如美国专利号6,413,928;6,399,561;6,365,561;6,380,147。洗涤剂组合物可以 是一个和两个部分的含水组合物、非含水液体组合物、铸塑固体、粒形形式、微粒形 式、压缩片剂、凝胶和/或膏状物以及浆状物形式。本发明也提供应用这些洗涤剂组 合物能够快速去除粗食物污染、食物残留物膜和其它微小的食物组分的方法。本发明 的磷脂酶可以通过磷脂的催化水解来帮助去除污染。本发明的磷脂酶可以用在洗盘洗 涤剂和纺织品洗涤洗涤剂中。
【0544】实际的活性酶含量依赖于洗涤剂组合物的制造方法,并且并不是重要的, 只要洗涤剂溶液具有所需的酶促活性。一方面,存在于最终溶液的磷脂酶的量的范围 为,在每克洗涤剂组合物中,大约0.001mg到0.5mg。选择用于本发明的方法和产 品的特定酶,依赖于最终用途的条件,包括物理产品形式、应用pH、应用温度和待 降解或者改变的污物类型。对于任何给定的一套应用条件,可以选择酶以提供最佳的 活性和稳定性。一方面,本发明的多肽在大约4到大约12的pH范围,大约20℃到 大约95℃的温度范围内有活性。本发明的洗涤剂可以包括阳离子、半极性非离子的 或者兼性离子表面活性剂;或者其混合物。
【0545】本发明的磷脂酶可以配制成粉末洗涤剂和液体洗涤剂,其pH值在4.0 到12.0之间,以重量百分比计算,含量水平为约0.01到大约5%(优选地0.1%到0.5 %)。这些洗涤剂组合物也可以包括其它的酶,如已知的蛋白酶、纤维素酶、脂酶或 内切糖苷酶,以及助洗剂和稳定剂。本发明磷脂酶的加入到传统的清洗组合物中,并 不产生任何特定的应用限制。换句话说,只要pH在以上的范围内,温度低于所述酶 的变性温度,适于洗涤剂的任何温度和pH也适于本组合物。此外,本发明的多肽可 以用于不含洗涤剂的洗涤组合物中,或者可以单独应用,或者可以与助洗剂和稳定剂 组合应用。
【0546】本发明提供了包括洗涤剂的洗涤或消毒组合物,和/或用于洗涤和/或消 毒硬表面的消毒组合物,适用于洗涤和/或消毒织品的洗涤剂组合物,洗盘组合物, 口腔清洗组合物,牙齿清洗组合物,和/或隐形眼镜清洗液。
【0547】一方面,本发明提供了洗涤对象的方法,该方法包括在足以洗涤的条件 下,使该对象与本发明的磷脂酶接触。可以包括本发明的磷脂酶,作为洗涤剂添加剂。 本发明的洗涤剂组合物可以,例如,配制成包括本发明磷脂酶的手洗或机洗洗涤剂组 合物。适用于对染色织物前处理的洗涤添加剂可以包括本发明的磷脂酶。织物柔软剂 组合物可以包括本发明的磷脂酶。可选地,本发明的磷脂酶可以被配制为洗涤剂组合 物,一般用于家用硬表面的洗涤操作。在可选的方面,本发明的洗涤剂添加剂和洗涤 剂组合物可以包括一种或者多种其它的酶,如蛋白酶、脂酶、角质酶、另一种磷脂酶、 碳水化合物酶、纤维素酶、果胶酶、甘露聚糖酶、阿拉伯醣酶、半乳聚糖酶、木聚糖 酶、氧化酶,如乳糖酶和/或过氧化物酶。选择本发明酶的特征以与选定的洗涤剂相 容(即,最适pH,与其它酶和非酶成分相容等等),并且该酶以有效量存在。在一方 面,本发明的磷脂酶用于从织物中去除恶臭物质。可以用于实践本发明的各种洗涤剂 组合物和用于制备它们的方法描述在下述专利中,例如美国专利号6,333,301; 6,329,333;6,326,341;6,297,038;6,309,871;6,204,232;6,197,070;5,856,164。
废物处理
【0548】本发明的磷脂酶可以用于废物处理。一方面,本发明提供了应用本发明 磷脂酶的固体废物消化方法。该方法可以包括降低基本上未处理的固体废物的质量和 体积。固体废物可以用酶消化方法处理,是在酶溶液(包括本发明的磷脂酶)存在的 条件下,在控制的温度下进行的。固体废物可以转化为液化废物和任何残留固体废物。 所得到的液化废物可以与所述的任何残留固体废物分离。参见如美国专利号 5,709,796。
消毒
【0549】磷脂酶(例如本发明的PLCs、patatins)可以用于消毒方法,例如对内毒 素,如包含磷脂多糖(LPS)的组分毒,并且,本发明提供了使用至少一种本发明的酶 的消毒方法,所述酶例如包括具有一个或多个编码E41A、E41W、E41F、E41Y、E41R、 E94R、D100L、D100M、D100Y、D100F、D100W、A104L、D111R、T112R、Y116W、 I117W、P118W、E125K、S168N、D171V、D171E、M176W、D230H、D230R、D234W、 D234V、D234G、D234R、D234K或Q265R的突变的SEQ ID NO:175或SEQ ID NO:176 阐述的序列的patatin。一方面,本发明的磷脂酶用于对脂多糖(LPS)消毒。一方面, 该消毒作用对来自类脂A的2′和/或3′脂肪酸链进行脱酰作用。一方面,本发明的磷 脂酶(例如PLC、patatin)用于水解来自类脂,例如类脂A(例如来自细菌内毒素)的2′- 月桂酰和/或3′-肉豆蔻酰链。一方面,本发明的方法用于破坏内毒素,例如来革兰氏 阴性细菌,如来自大肠杆菌的毒素。一方面,本发明的磷脂酶(例如PLC、patatin)被 用于改善毒素中毒(例如进行性革兰氏阴性感染)结果,或预防性地防止感染(例如动物 或人感染)期间的内毒素作用。因此,本发明提供包含本发明的磷脂酶(例如PLC、 patatin)的药物组合物,和使用本发明的水解酶来改善或预防脂多糖(LPS)毒性作用的 方法,例如在脓血症期间。
加工食物
【0550】本发明的磷脂酶可以用于加工食物,例如以改变它们的稳定性、货架期、 风味、质地,提高它们的营养价值和类似情况。例如,一方面,本发明的磷脂酶用于 产生酸性磷脂,用于控制食物的苦味。
【0551】一方面,本发明提供了使用本发明的磷脂酶制备奶酪的方法(因此,本 发明也提供了包含本发明磷脂酶的奶酪)。一方面,本发明的酶(例如磷脂酶A、溶血 磷脂酶或其组合)被用于加工奶酪,以增强风味、增加产量和/或“稳定”奶酪,例如通 过减少“去油(oil-off)”的趋势而进行,或一方面,本发明的酶用于从酪乳加工奶酪。 本发明的这些方法可以结合任何方法或方案,例如如在美国专利6,551,635和 6,399,121、WO 03/070013、WO 00/054601中所述。例如,一方面,本发明的磷脂酶 被用于稳定乳或含乳组合物,例如奶油中的脂肪乳状液,以及用于稳定乳组合物,例 如用于制备奶油或液体奶油。一方面,本发明提供了使用至少一种本发明的酶来增强 奶酪的风味的方法,该方法包括在含水介质中,在产生增强的奶酪风味的条件下(例 如减少的苦味),温育蛋白、脂肪和蛋白酶和脂酶,如WO 99/66805所述。一方面, 本发明的磷脂酶用于增强奶酪(例如凝乳)的风味,这通过在升高的温度,例如在约 75℃至95℃之间,用水、蛋白酶和脂酶(本发明的)混合进行,如在美国专利4,752,483 中所述。一方面,本发明的磷脂酶用于通过在将凝结剂加入到乳之前将本发明的酶(例 如脂酶或磷脂酶)加入到奶酪(例如酪乳)中,或在挤压之前将本发明的酶加入到含盐凝 乳中来促进奶酪老化,如美国专利4,707,364中所述。一方面,本发明的脂酶用于降 解乳中的甘油三酯来释放游离脂肪酸,从而增强风味。蛋白酶也可以用于本发明的这 些方法的任何方法中,参见例如Brindisi(2001)J.of Food Sci.66;1100-1107。在另一 个方面,酯酶、脂酶、磷脂酶和/或蛋白酶的组合可以用于本发明的这些方法或任何 方法。
【0552】一方面,本发明的磷脂酶用于减少食物中,例如油,诸如具有高含量的 非水解磷组分的植物油中的磷组分含量,如WO 98/26057所述。
生物质转化和清洁生物燃料的产生
【0553】本发明提供多肽,包括本发明的酶(磷脂酶(PLs)——例如本发明的 PLAs、PLCs或PLDs)和抗体,以及用于将生物质或任何木质纤维材料(例如包括 纤维素、半纤维素和木质素的任何组分)转化至燃料(例如生物乙醇、生物丙醇、生 物丁醇、生物丙醇、生物甲醇、生物柴油)的方法,除了食品、饲料和化学药品。例 如,在可选的实施方式中,用于生物质转化和用于生物燃料产生的本发明的酶可具有 一种或多种磷脂酶活性,包括磷脂酶C(PLC)活性;磷脂酶A(PLA)活性,例如 磷脂酶A1或磷脂酶A2活性;磷脂酶D(PLD)活性,例如磷脂酶D1或磷脂酶D2 活性;磷脂酶B(PLB)活性,例如磷脂酶和溶血磷脂酶(LPL)活性或磷脂酶以及 溶血磷脂酶-转酰酶(LPTA)活性或磷脂酶以及溶血磷脂酶(LPL)活性和溶血磷脂 酶-转酰酶(LPTA)活性;或patatin活性,或其组合。
【0554】因此,本发明的组合物和方法提供石油基产品使用的有效、可持续的替 代物或附加物,例如作为生物甲醇、生物乙醇、生物丙醇、生物丁醇及类似物的生物 燃料的混合物,柴油燃料、汽油、煤油及类似物的替代物或附加物。本发明提供表达 本发明的酶的生物,用于参与涉及自然生物质转化的化学循环。一方面,用于转化的 酶和方法用于磷脂加工的酶的总体(ensemble)中。本发明提供发现和实施最有效的酶 的方法,从而能进行这些重要的新的“生物质转化”以及可选的能量工业方法。
【0555】本发明的组合物和方法可用于提供石油基产品使用的有效、可持续的替 代物或附加物,例如作为生物乙醇、生物丙醇、生物丁醇、生物丙醇、生物甲醇和/ 或生物柴油和汽油的混合物。本发明提供表达本发明的酶的生物,用于参与涉及自然 生物质转化的化学循环。本发明提供发现和实施最有效的酶的方法,从而能进行这些 重要的新的“生物质转化”以及可选的能量工业方法。
【0556】本发明提供本发明的方法、酶和酶的混合物或“混合物”(“cocktails”), 用于加工材料,例如生物质材料,其包括纤维寡糖、阿糖基木聚糖低聚物、木质素、 木质纤维素、木聚糖、葡聚糖、纤维素和/或可发酵的糖,其包括将组合物与本发明 的多肽、或由本发明核酸编码的多肽接触,其中任选地,材料衍生自农业作物(例如 小麦、大麦、马铃薯、柳枝稷、杨木),其是食品或饲料生产的副产品,其是木质纤 维废物产品,或者是植物残余物或者是废纸或者是废纸产品,以及任选地所述植物残 余物包括茎、叶、皮、外壳、玉米或玉米芯、玉米秸秆、玉米纤维、干草、麦秆(例 如水稻秸秆或小麦秸秆)、甘蔗渣、甜菜渣、柑桔浆和柑桔皮、木材、木屑、木片、 木浆、浆废料、木材废料、木材刨花和锯屑、建筑和/或拆除废物和碎片(木材、木 材刨花和锯屑),以及任选地,纸废料包括废弃的或用过的影印纸、计算机打印纸、 笔记本纸、记事本纸、打字机纸、报纸、杂志、纸板和基于纸的包装材料,以及再生 纸材料。另外,城市废物(urban wastes),例如城市固体废物的纸质部分、城市木材 废物,和城市绿色废物,与其它包括糖、淀粉和/或纤维素的材料一起,可被使用。 在可选的方面,所述材料——例如生物质材料的加工产生生物醇,例如生物乙醇、生 物甲醇、生物丁醇或生物丙醇。
【0557】可选地,本发明的多肽可表达在生物质植物材料或其给料本身中。
【0558】本发明的方法也包括提供加工的或“转化的”(例如通过包括使用本发明 酶的方法)生物质或植物材料,例如包括脂类的材料或木质纤维材料(例如由本发明 的酶加工的);以及通过将其发酵(例如,由酵母)和/或化学合成方法制成燃料(例 如生物醇,例如生物乙醇、生物甲醇、生物丁醇或生物丙醇,或生物柴油)。一方面, 所产生的糖被发酵,和/或不可发酵的产品被气化
【0559】本发明的方法也包括使用本发明的酶,转化藻类、植物油、例如粗植物 油或废植物油、动物脂肪和动物脂(例如牛脂、猪脂或黄油)或污水;以及通过发酵 和/或化学合成方法将其制成燃料(例如生物醇,例如生物乙醇、生物甲醇、生物丁 醇或生物丙醇,或生物柴油)。
【0560】本发明的酶(包括例如产生并在某些方面分泌本发明的重组酶的生物, 例如微生物,例如真菌、酵母或细菌)可用于或包括/并入任何生物质转化方法的任 何阶段,例如在任意一步、几步或包括所有的步骤中,或所有下述生物质转化方法或 者所有这些生物燃料可选方法:
■直接燃烧:通过直接加热来燃烧材料,是最简单的生物质技术;如果生物质 来源在附近,可以是非常经济的。
■高温分解:在不存在氧气的情况下通过加热进行的生物质热降解。一方面, 将生物质加热至温度为约800和1400华氏度之间,但不引入氧气以支持燃烧,导致 产生气体、燃料油木炭
■气化;通过加热或厌氧消化,生物质可用于产生甲烷。合成气一氧化碳和 氢的混合物,可衍生自生物质。
■填埋气(Landfill Gas):在垃圾填埋中通过掩埋垃圾的腐烂(厌氧消化)来产 生。当有机废物分解时,它产生由约50%甲烷组成的气体,其是天然气的主要成分。
■厌氧消化:将有机物质转化为甲烷——天然气的主要成分,和一氧化碳的混 合物。一方面,生物质例如废水(污水)、肥料或食物加工废物,与水混合,并投料 至不含空气的消化池。
■发酵
■醇发酵:通过将纤维质和/或淀粉转化成糖,将糖发酵成醇,然后通过蒸馏 分离醇水混合物来产生燃料醇。原料,例如专用作物(例如小麦、大麦、马铃薯、柳 枝稷、杨木),农业残留物和废物(例如水稻秸秆、玉米秸秆、小麦秸秆、甘蔗渣、 水稻壳、玉米纤维、甜菜浆、柑桔浆和柑桔皮),林业废物(例如硬木和软木屑、木 料操作中的硬木和软木残余物、木材刨花和锯屑),城市废物(例如城市固体废物的 纸质部分、城市木材废物,和城市绿色废物),木材废物(例如锯木厂废物、纸浆厂 废物、建筑废物、拆除废物、木材刨花和锯屑),以及废纸或其它包括糖、淀粉和/或 纤维素的材料,可转化成蔗糖,然后用酵母发酵。可选地,包括蔗糖的材料可通过发 酵直接转化为醇。
■酯交换:将油转化为生物柴油的示例性反应称为酯交换。酯交换方法将醇(像 甲醇)与植物油、动物脂肪或再生油脂中含有的甘油三酯油反应,形成脂肪酸烷基酯 (生物柴油)和甘油。该反应要求加热和强碱催化剂,例如氢氧化钠或氢氧化
■生物柴油:生物柴油是由植物油、动物脂肪或再生油脂制造的脂肪酸烷基酯 混合物。生物柴油可以它的纯的形式用作汽车燃料,但它通常用作石油柴油添加剂, 以降低来自柴油动力汽车的微粒、一氧化碳、烃和空气有毒物的水平。
■水解:包括水解化合物,例如生物质,例如木质纤维材料,使用本发明的酶 催化。
■共产生(Congeneration):是使用单一燃料和设备同时产生一种以上形式的能 量。在一方面,生物质共产生具有比生物质单独产生更有潜力的生长,因为共产生的 方式产生热和电二者。
【0561】一方面,本发明的多肽具有水解酶活性,例如磷脂酶、patatin和/或其 它相关酶活性,用于从有机材料,例如生物质,例如衍生自植物和动物的组分——包 括任何农业作物或其它可再生的原料、农业残留物或动物废料、城市和工业废物的有 机成分、或建筑或拆除废物或碎片,或微生物,例如藻类或酵母——来产生燃料(例 如生物醇,例如生物乙醇、生物甲醇、生物丁醇或生物丙醇,或生物柴油)。
【0562】一方面,本发明的多肽用于将任何生物质——例如动物、藻类和/或植 物生物质,包括包含脂类的物质或木质纤维生物质——转化为燃料(例如生物醇,例 如生物乙醇、生物甲醇、生物丁醇或生物丙醇,或生物柴油),或另外用于水解或消 化生物材料的方法,以使它们能用作燃料(例如生物醇,例如生物乙醇、生物甲醇、 生物丁醇或生物丙醇,或生物柴油),或用于使它更易于将生物质加工成燃料。
【0563】本发明的酶,包括酶的混合物或本发明的“混合物”(“cocktails”),也可 用于甘油精炼。甘油副产品含有未反应的催化剂和肥皂,其被用酸中和。去除水和醇 以产生50%至80%粗甘油。剩余的杂质包括未反应的脂肪和油,其用本发明的多肽 处理。在本发明的大型生物柴油工厂中,甘油可进一步被纯化,例如至99%或更高的 纯度,用于制药和化妆品工业。
【0564】使用本发明的多肽,例如本发明的酶的混合物或“混合物”(“cocktails”) 制造的燃料(包括生物醇,例如生物乙醇、生物甲醇、生物丁醇或生物丙醇,或生物 柴油)可与燃料含氧化物一起使用,以改进燃烧特性。添加氧产生更完全的燃烧,其 降低一氧化碳的排放。这是用生物燃料(例如,本发明的燃料)代替石油燃料的另一 个环境优势。使用本发明的组合物和/或方法制造的生物燃料可与汽油混合以形成E10 混合物(约5%至10%乙醇和约90%至95%汽油),但它可以以更高的浓度使用,例 如E85或以其纯的形式。用本发明的组合物和/或方法制造的生物燃料可与石油柴油 混合以形成B20混合物(20%生物柴油和80%石油柴油),尽管其它混合水平可被使 用,直至B100(完全生物柴油)。
【0565】本发明也提供从包括任何生物质——例如动物、藻类和/或植物生物质, 包括包含脂类的生物质或木质纤维生物质——的组合物制造生物燃料(包括生物醇, 例如生物乙醇、生物甲醇、生物丁醇或生物丙醇,或生物柴油)的方法。生物质材料 可从农业作物,作为食物或饲料生产的副产品,或作为木质纤维废物产品,例如植物 残留物、废纸或建筑和/或拆除废物或碎片来获得。用于使用本发明的多肽处理的适 合的植物来源或植物残留物的例子包括海藻、藻类、谷物、种子、茎、叶、皮、外壳、 玉米芯、玉米秸秆、麦秆、干草(例如印度草,如印度草(Sorghastrum nutans);或 柳枝稷,例如稷(Panicum)种,例如柳枝稷(Panicum virgatum))及类似物,以及 木材、木片、木浆和锯屑。适合于使用本发明的多肽处理的纸质废料的例子包括废弃 的影印纸、计算机打印纸、笔记本纸、记事本纸、打字机纸及类似物、以及报纸、杂 志、纸板和基于纸的包装材料。建筑和/或拆除废物和碎片的例子包括木材、木材废 料、木材刨花和锯屑。
【0566】在一个实施方式中,酶——包括本发明的酶的混合物或“混合物” (“cocktails”)——和本发明的方法可与更“传统”的从生物质制造乙醇、甲醇、丙醇、 丁醇、丙醇和/或柴油的方法结合,例如包括通过在反应器中将干燥的任何生物质, 例如动物、藻类和/或植物生物质,其包括包含脂类的生物质或木质纤维生物质材料, 施用至包括催化剂的强酸和金属盐的稀溶液,来水解脂类和/或木质纤维材料的方法; 这可以降低纤维素水解的活化能或温度,以获得更高的糖产量;参见例如美国专利号 6,660,506和6,423,145。
【0567】与本发明的酶——包括酶的混合物或本发明的“混合物”(“cocktais”)—— 结合使用的另一个示例性方法包括在水介质中,在选定的主要用于实现半纤维素解 聚,而不主要用于实现纤维素解聚为葡萄糖的温度和压力下,通过将材料进行第一阶 段水解步骤,水解任何生物质——例如动物、藻类和/或植物生物质,包括包含脂类 的生物质或木质纤维生物质,其含有半纤维素、纤维素和木质素,或任何其它可由本 发明的酶水解的多糖。该步骤产生浆状物,其中含水液相含有从半纤维素解聚得到的 溶解的单糖,而固相含有纤维素和木质素。第二阶段水解步骤可以包括使得至少大部 分纤维素被解聚的条件,该步骤产生含有溶解的/可溶的纤维素解聚产物的含水液相。 参见例如美国专利5,536,325。本发明的酶(包括本发明的混合物或酶的“混合物” (“cocktais”))可以在该示例性方法中的任何阶段加入。
【0568】与本发明的酶——包括酶的混合物或本发明的“混合物”(“cocktais”)—— 结合使用的另一个示例性方法包括:通过一个或多个用大约0.4%至2%强酸进行稀释 酸水解的阶段来处理任何生物质,例如动物、藻类和/或植物生物质,其包括包含脂 类的生物质或木质纤维生物质材料;以及通过碱法去木质作用来处理酸水解的生物质 材料的未反应的固体木质纤维素成分,以产生可生物降解的热塑塑料和衍生产品的前 体。参见,例如美国专利6,409,841。本发明的酶可以在该示例性方法的任何阶段加 入。
【0569】与本发明的酶——包括酶的混合物或本发明的“混合物”(“cocktais”)—— 结合使用的另一个示例性方法包括:在预水解反应器中预水解任何生物质,例如动物、 藻类和/或植物生物质,其包括包含脂类的生物质或木质纤维生物质材料;向该固体 材料(例如,木质纤维材料)加入酸性液体,制备混合物;将该混合物加热至反应温 度;维持反应温度足够的时间,以将木质纤维素材料分馏成含有至少大约20%的来自 木质纤维素材料的木质素的溶解部分以及含有纤维素的固体部分;当处于或接近其中 固体部分中的纤维素变得更易于进行酶促消化的反应温度时,从固体部分除去溶解部 分;以及回收溶解部分。参见,例如美国专利5,705,369。本发明的酶可以在该示例 性方法的任何阶段加入。
【0570】本发明提供了制备基于液体烃的发动机燃料组合物(例如,用于火花 点火发动机)的方法,所述液体烃掺混有利用本发明的酶或方法制备的燃料级醇。一 方面,利用本发明的酶生产的燃料包括,例如液体煤气或液体天然气-乙醇混合物。 一方面,共溶剂是生物质衍生的2-甲基四氢呋喃(MTHF)。参见例如美国专利 6,712,866。
【0571】一方面,用于任何生物质——例如动物、藻类和/或植物生物质,包括 包含脂类的生物质或木质纤维生物质——的酶促降解的本发明方法,例如,用于从任 何有机材料生产生物燃料(包括生物醇,例如生物乙醇、生物甲醇、生物丁醇或生物 丙醇,或生物柴油)的方法,还可以包括生物质材料的超声处理;参见,例如,美国 专利6,333,181。
【0572】另一方面,本发明用于从纤维素底物生产生物燃料(包括生物醇,例如 生物乙醇、生物甲醇、生物丁醇或生物丙醇,或生物柴油)的方法包括提供浆体形式 的反应混合物,其包含纤维素底物、本发明的酶和发酵试剂(如,在反应容器内,例 如半连续固体送料生物反应器),以及该反应混合物在足以起始并维持发酵反应的条 件下反应(如美国专利申请号20060014260中所述)。一方面,实验或理论计算可以 确定最优的给料频率。一方面,额外量的纤维素底物和酶根据优化的送料频率的间隔 被送进反应容器。
【0573】本发明制备生物燃料(包括生物醇,例如生物乙醇、生物甲醇、生物 丁醇或生物丙醇,或生物柴油)的一个示例性方法在美国专利申请公开号 20050069998、20020164730中描述;并且一方面,包括以下步骤:研磨任何生物质 ——例如动物、藻类和/或植物生物质,包括包含脂类的生物质或木质纤维生物质材 料(如,到15-30mm的大小),使获得的产物在反应器中经历蒸汽爆碎(steam explosion) 预处理(如,在190-230℃的温度)1到10分钟;在气旋中收集预处理的材料或相关 产物;以及通过在压力过滤机(filter press)中过滤分离液态和固态馏分,向发酵沉 积物引入固态馏分并加入一种或多种本发明的酶,如纤维素酶和/或β-葡萄糖苷酶(如 溶解在柠檬酸缓冲液pH4.8中)。
【0574】使用本发明的酶生产本发明的生物燃料(包括生物醇,例如生物乙醇、 生物甲醇、生物丁醇或生物丙醇,或生物柴油)——其包括生物乙醇、生物甲醇、生 物丁醇或生物丙醇——的另一个示例性的方法包括:预处理起始材料,起始材料包括 任何生物质——例如动物、藻类和/或植物生物质,包括包含脂类或至少包含半纤维 素和纤维素的木质纤维素生物质原料。一方面,起始材料包括马铃薯、大豆(油菜籽)、 大麦、黑麦、玉米、燕麦、小麦、甜菜或甘蔗或成分或废物或食品或饲料生产副产物。 起始材料(“原料”)在破坏植物纤维结构的条件下发生反应,以实现半纤维素和纤维 素的至少部分水解。破坏性条件可以包括,例如使起始材料在pH 0.5至2.5下经受 180℃至270℃的平均温度大约5秒至60分钟的时间;或,在pH 0.5至2.5下经受220℃ 至270℃的温度大约5秒至120秒的时间,或同等条件。这产生可利用性增加的原料, 该原料有待酶例如本发明的纤维素酶消化。美国专利6,090,595。
【0575】使用本发明的酶水解任何生物质——例如动物、藻类和/或植物生物质, 包括包含脂类的生物质或木质纤维生物质材料——的示例性条件包括在约30℃到 48℃之间的温度和/或在约pH4.0到6.0之间的pH条件下反应。其它示例性条件包括 在约30℃到60℃之间的温度和在约4.0到8.0之间的pH。
【0576】本发明的葡聚糖酶(或纤维素酶)、甘露聚糖酶、木聚糖酶、淀粉酶、 黄原胶酶和/或糖苷酶,例如纤维二糖水解酶、甘露聚糖酶和/或β-葡糖苷酶可用于生 物质至燃料的转化以及乙醇的生产中,例如,如PCT中请号WO 0043496和WO 8100857所述。本发明的葡聚糖酶(或纤维素酶)、甘露聚糖酶、木聚糖酶、淀粉酶、 黄原胶酶和/或糖苷酶,例如纤维二糖水解酶、甘露聚糖酶和/或β-葡糖苷酶可用于产 生可发酵的糖和含有葡聚糖的生物质,其可被转化为燃料乙醇
生物柴油—使用本发明的酶制造它们
【0577】本发明提供包含本发明的酶的组合物,以及用于制造生物柴油燃料的方 法,所述生物柴油燃料包含任何生物燃料,例如包括从植物油和/或动物脂肪的酯交 换制得的烷基酯的生物柴油。
【0578】例如,在可选的方面,本发明的多肽,包括酶的混合物或本发明的“混 合物”(“cocktails”),用于酯交换方法的处理,其中将醇(像乙醇、丙醇、丁醇、丙 醇、甲醇)与植物油、动物脂肪或再生油脂中含有的甘油三酯油反应,形成包括生物 柴油的脂肪酸烷基酯和甘油。一方面,生物柴油由大豆油或再生食用油制造。动物脂 肪、其它植物油和其它再生油也可用于(以及由本发明的酶,例如磷脂酶处理的)产 生生物柴油,其取决于它们的成本和可用性。另一方面,使用本发明的酶,所有种类 的脂肪和油的掺合物用于产生本发明的生物柴油燃料。
【0579】本发明提供包括本发明的酶的组合物,以及用于处理“黄油”(“yellow grease”)的方法,术语“黄油”最初在炼油工业中提出。可使用本发明的组合物和方法 处理的黄油包括来自煎炸用油的动物脂(grease),例如来自深炸锅(deep fryer)或饭店隔 油器(restaurants′grease trap)的动物脂、或来自各种(例如较低质量)级别的炼动物油 油厂(rendering plant)的牛油(tallow)的动物脂。因此,本发明也提供油、动物脂、煎炸 油、植物油、餐馆废油,以及处理包括至少一种本发明的酶的牛油等级。
【0580】使用包括酶的本发明组合物和本发明的方法处理的黄油可用于喷洒在路 面,例如用于尘土控制,或者用于动物饲料添加剂或饲料或食品补充剂。
【0581】另一方面,包括酶的本发明的组合物和本发明的方法可用于处理脂类, 例如动物脂,例如餐馆废油,以制造生物燃料,例如生物柴油燃料,例如用于汽车、 公共汽车、卡车或船只。一方面,使用本发明的组合物或方法制造的生物柴油可从任 何可再生的植物来源,例如大豆和/或从动物脂,例如“黄油”生产。
【0582】包括酶的本发明的组合物和本发明的方法可用于处理“SVO”或“直链植 物油”,其包括可为柴油发动机提供燃料的任何植物油,例如,其中所述处理包括在 例如用于低温的燃料中进行的脂类酯交换。
【0583】包括酶的本发明的组合物和本发明的方法可用于处理“WVO”或废植物 油,以制造例如黄油,其包括来自餐馆的动物脂。一方面,该动物脂必须被过滤以去 除食物颗粒。用包括酶的本发明的组合物和本发明的方法处理的黄油可落入 SVO/WVO的范畴,其包括任何动物脂,例如餐馆废动物脂,其可含有牛油和其它动 物产物。
谷物干酒糟加工
【0584】另一方面,本发明的酶(例如磷脂酶)可用于处理/加工“可溶性干酒 糟(DDS)”、“谷物干酒糟(DDS)”、“可溶性浓缩酒糟(CDS)”、“谷物湿 酒糟(DWG)”或“含可溶物的谷物干酒糟(DDGS)”;谷物干酒糟可以是蒸馏方 法的谷物副产品,并且可包含可溶物。这些方法可包括干磨植物副产品,例如用于饲 料应用,例如用于家禽、牛、猪和其它家养动物。因此,本发明的酶可用于处理/加 工谷物,例如,谷类,其是任何蒸馏方法的副产品,包括使用任何谷物来源的方法, 例如来自酿酒厂的传统来源,或可选地,来自乙醇生产厂家(工厂、作坊等等)。本 发明的酶可用于处理/加工来自造酒厂的于醪;然后,这种醪可以用于各种目的,例 如,作为家畜特别是反刍动物的饲料;因此本发明提供加工家畜诸如反刍动物的饲料 的方法,以及包括本发明的肌醇六磷酸酶的酶加工饲料。
【0585】本发明的酶可单独使用或与其它酶一起加工“可溶性干酒糟(DDS)”、 “谷物干酒糟(DDS)”、“可溶性浓缩酒糟(CDS)”、“谷物湿酒糟(DWG)” 或“含可溶物的谷物干酒糟(DDGS)”。例如,本发明的酶可用于图37所述的醇 生产方法的任何步骤。本发明的酶可用于提高在任何生物燃料或潜在的生物燃料中磷 的生物利用度,包括在“可溶性干酒糟(DDS)”、“谷物干酒糟(DDS)”、“可 溶性浓缩酒糟(CDS)”、“谷物湿酒糟(DWG)”或“含可溶物的谷物干酒糟(DDGS)” 中发现的磷(参见C.Martinez Amezcua,2004 Poultry Science 83;971-976)。
酒精(spirit)或可饮用醇生产
【0586】本发明的本发明的酶也可用于加工谷物干酒糟用于醇生产——如在“酒 精”(“spirits”)中的醇,例如啤酒或威士忌生产(除了用于加工生物质来制造生物燃 料)。本发明的本发明的酶也可用于乙醇工厂,例如用于加工谷物,例如玉米。谷物 干酒糟可首先通过碾磨谷物(例如玉米)以得到粗糙度一致性,并添加热水而制备。 冷却后,加入酵母并且该混合物发酵几天至一周。发酵后剩余的固体是谷物酒糟。本 发明的本发明的肌醇六磷酸酶可用于该方法的任何步骤。
制剂
【0587】本发明提供包括本发明酶的新的制剂,以及用于本发明磷脂酶的制剂, 其包括含有本发明新型酶的制剂。本发明的酶可单独使用或配制或作为本发明的磷脂 酶,或其它磷脂酶,或其它酶例如木聚糖酶、纤维素酶、蛋白酶、脂酶、淀粉酶、或 氧化还原酶如漆酶、过氧化物酶、过氧化氢酶、氧化酶或还原酶的混合物来使用或配 制。它们可以用于配制成固体形式如粉末、冻干制剂、颗粒、片剂、条、晶体、胶囊、 丸剂、小粒,或液体形式如水溶液、气溶胶、凝胶、糊、浆、水/油乳状液、乳剂、胶 囊,或小泡或胶束悬浮液。本发明的制剂可以包括任何下述组分或它们的组合:多元 醇如聚乙二醇、聚乙烯醇、丙三醇,糖类如蔗糖、山梨醇、海藻糖、葡萄糖、果糖、 麦芽糖、甘露糖;胶凝剂如瓜尔胶、鹿角菜胶、藻酸盐、葡聚糖、纤维素衍生物、果 胶;盐如氯化钠、硫酸钠、硫酸铵、氯化钙、氯化镁、氯化锌、硫酸锌、脂肪酸及其 衍生物的盐;金属螯合剂如EDTA、EGTA、柠檬酸钠;抗微生物剂如脂肪酸或脂肪 酸衍生物、对羟基苯甲酸酯、山梨酸酯、甲苯酸盐;阻碍蛋白酶作用的其它调节化合 物如蛋白酶、大体积蛋白质(bulk protein)诸如BSA、小麦水解产物、硼酸盐化合物、 氨基酸或肽、合适的pH或温度调节化合物;乳化剂如非离子型和/或离子型洗涤剂; 氧化还原剂如胱氨酸/半胱氨酸、谷胱甘肽、氧化型谷胱甘肽、还原型谷胱甘肽、或 抗氧化化合物如抗坏血酸以及分散剂。
【0588】交联和蛋白质修饰作用,例如聚乙二醇化、脂肪酸修饰和糖基化也可用 于提高酶稳定性。
本发明磷脂酶的其它用途
【0589】本发明的磷脂酶也可以用于研究磷酸肌醇(PI)信号传导系统;双极性 紊乱的诊断、预后和治疗开发(参见如,Pandey(2002)Neuropsychopharmacology 26;216-228);作为抗氧化剂;作为修饰的磷脂;作为发泡剂和凝胶剂;产生用于血管 形成组织的血管生成素脂类;鉴定磷脂酶,如PLA、PLB、PLC、PLD和/或patatin 的调节剂(激动剂或者拮抗剂),如作为抑制剂,用作抗-瘤剂、消炎剂以及作为止痛 剂。它们可以用于产生酸性磷脂,用于控制食品和药物中的苦味。它们可以用于脂肪 纯化。它们可以用于鉴定治疗病毒性、炎症性、过敏性和心血管疾病的肽抑制剂。它 们可以用于制备疫苗。它们可以用于制备多不饱和脂肪酸甘油酯和磷脂酰甘油。
【0590】本发明的磷脂酶,例如PLA和PLC酶,用于产生免疫毒素和各种用于 抗-肿瘤治疗的治疗剂。
【0591】本发明磷脂酶可以与其它用于脱色(即去除叶绿素)的酶和洗涤剂(参 见上文)联合使用,如,与其它的酶(如脂酶、蛋白酶、酯酶、磷酸酶)联合使用。 例如,在应用PLC的任何情况中,可以组合应用PLD和磷酸酶,以便产生与PLC单 独使用相同的结果。
【0592】下表概述了本发明的若干示例性方法和制剂:
本发明的示例性方法            目的
PLC油脱胶中的化学品使用
不用酸                        消除化学品
不用碱                        消除化学品
酸和碱的使用范围(不过量)      化学品减少/脱胶方法可选择的实施
方式
其它类型的酸和碱              脱胶方法可选择的实施方式
水在PLC油脱胶中的影响
硅胶的使用替代水洗步骤
水干燥剂的使用                消除最终产品中的水
碱处理期间较低含量水的影响    消除最终产品中的水
最低水含量(<5%)             消除最终产品中的水
最大水含量(>5%)             可选方法
PLC脱胶的湿度图                  脱胶方法可选择的实施方式
对于PLC脱胶,油依赖于水含量      脱胶方法可选择的实施方式
原位去除游离脂肪酸,FFA
加入FFA螯合剂                    脱胶方法可选择的实施方式;改善
                                 来自腐烂豆的油中的状况
混合方案对PLC油脱胶的影响
具有最小混合的PLC                脱胶保护酶不受混合诱导变性的破坏,
                                 节约能量
先剪切混合,再搅拌混合进行PLC    脱胶脱胶方法可选择的实施方式
加入化学品的顺序
加入顺序:酶-水,然后酸,然后碱  在暴露于酸或碱之前使PLC发挥功
                                 效,导致潜在的pH或金属螯合PLC
                                 失活
针对温度和时间,PLC油脱胶方法可选择的实施方式
酶处理步骤(时间):<60min,优选<30min    脱胶方法可选择的实施方式
酶处理步骤(温度):50-70℃,可能           脱胶方法可选择的实施方式 <50℃(例如室温)
PLC油脱胶的益处
产生具有最小的PL含量和丰富的              脱胶方法可选择的实施方式
水溶性磷酸酯的皂脚
通过使用PLC,胶中中性油减少               脱胶方法可选择的实施方式
植物油中DAG(例如1,3-DAG)产生增加         脱胶方法可选择的实施方式 的方法
使用增加的DAG植物油和其它对健康有益       示例性的产物益处
处的油的益处
研究在油中不留下PLC活性的脱胶方法         脱胶方法可选择的实施方式/控制型
                                          提高
研究在油中不留下可检测PLC蛋白的脱胶方     脱胶方法可选择的实施方式/控制型
法                                        提高
使用酶从卵磷脂胶物质产生DAG               示例性产物益处
PLC用于专用油(富集的PA、PI)               示例性产物益处
使用PA/PI特异性酶(例如596ES2/PI特异性     脱胶方法可选择的实施方式
的)
使用PA/PI特异性酶(例如596ES2/PI特异性     脱胶方法可选择的实施方式
的)+PC/PE特异性酶;加入顺序的影响
分批或连续方法                           脱胶方法可选择的实施方式
使用重悬浮的PLC处理的胶,用于进一步的    脱胶方法可选择的实施方式
油脱胶操作
胶中DAG、FFA、P、金属、中性油的质量      脱胶方法可选择的实施方式
平衡
多种方法
在提取之前,将PLC加入到剥落的油种子仁    方法可选择的实施方式
小规模脱胶分析                           脱胶方法可选择的实施方式
使用其它酶来减少胶质量(例如              脱胶方法可选择的实施方式
PYROLASETM酶、叶绿素酶、过氧化物酶、
脂酶、漆酶、甘露聚糖酶、蛋白酶、乳糖酶、
淀粉酶等,或其组合)
使用化合物以更好地帮助油/胶分离          脱胶方法可选择的实施方式
硬化PLC处理油中的                        胶脱胶方法可选择的实施方式
糖基化的/去糖基化的磷脂酶变体            脱胶方法可选择的实施方式
本发明示例性的制剂                       目的
用于稳定的示例性液体制剂
使用化合物以增加不同pH和温度范围中的     稳定酶以获得最大的DAG产量,可
PLC的稳定性(多元醇、盐、金属...)。       能改变底物特异性,或引导产物形
                                         成1,3-DAG类型。
对PLC使用疏水型传递系统(脂质体,在精     稳定酶以获得最大的DAG产量,可
炼的油滴中水合的酶)                      能改变底物特异性,或引导产物形
                                         成1,3-DAG类型。
用于稳定的固体制剂
使用不同的PLC、磷脂酶载体系统(固定化     稳定酶,并使得在脱胶之后容易从
树脂、多孔物质、凝胶、颗粒、粉末、片剂、 或油或胶相分离酶;酶制剂的可再
囊/胶束、胶囊、结构性液体等)来稳定磷脂   利用性;油方法期间物理分离酶相;
酶和辅酶。                               由PLC攻击PI/PA。
使用脱胶废物(胶组分、种子壳)用于PLC      减少制剂组分的成本,酶与油更好
制剂                                     的可混和性,酶的热稳定
促进活性的示例性制剂和方法
使用化学品或酶帮助酶更好地分散在油中     更快的反应时间/脱胶方法/化学品
(例如发泡基质等)                         利用率减少
再次使用胶/酶,以进一步进行脱胶反应      酶的可再利用性
使用增加分聚的制剂或捕获PL进行水解的   更快的反应时间/脱胶方法/化学品
酶                                     利用率减少
使用多种制剂以适应具有不同PL特异性的   方法的多功能性;不同的酶可能需
酶                                     要不同的制剂或可以在方法的不同
                                       阶段加入
使用多种酶制剂以防止在制备具有不同底物 在多酶形式的实施方式中,保护
特异性的另一PLC中某组分使一种PLC失活   PLC活性
使用多种酶制剂以防止在制备另一酶(水解  在多酶形式的实施方式中,保护
酶、氧化酶)中某组分使一种PLC失活       PLC活性
间歇性加入碱,如在时间释放型碱加入制剂 保护酶免遭混合诱导变性,节省能
中                                     量
通过糖基化失活和调节酶活性
【0593】本发明提供这样的方法,包括使用重组技术制备和表达具有生物活性的 酶或其它蛋白,例如有害的或有毒的酶(其中酶或其它蛋白未正常糖基化),它们是 无活性或活性较低,但是可再激活形式的。该方法包括将一种或多种糖基化位点(例 如N-连接的或O-连接的糖基化作用)加入到具有生物活性的酶或其它蛋白(例如本 发明的酶)中,这是通过下述步骤进行的:对编码序列进行工程化以整合入新的糖基 化位点(许多位点);在真核细胞或工程化的等同物中或在能够进行翻译后糖基化的 体外系统中表达变体编码序列。例如,3个氨基酸序列NXS/T是真核细胞中的糖基化 位点,而原核细胞不是这样的。因此,本发明包括将至少3个氨基酸序列NXS/T加 入到蛋白中,以便它的活性因翻译后糖基化的缘故而减少或失活。
【0594】糖基化可以产生加入到N残基的2个N-乙酰葡萄糖胺(NGlucNac)分子。 随后的加入可以是生物特异性的。在大部分的种中,然后将甘露糖(Mann)加入到 NGlucNa上,Mann残基的数目在10至100范围内。硅酸也可以加入到一些种中。在 毕赤酵母中,加入NGlucNac,可以加入10至25的Mann残基。
【0595】这些方法包括使用任何去糖基化酶或一组酶,它们中的许多酶已被鉴定 和/或可以通过商业渠道获得。例如,内切糖苷酶H在最后一个NGlucNac处切割, 留下一个NGlucNac依然连接在N残基上。PNGaseF酶切割掉所有糖,并将N残基 的氨基酸链转化成羟基,从而使N氨基酸变成酶中的天冬氨酸(D)氨基酸。因此,该 方法包括体内或体外使用内切糖苷酶H和/或PNGaseF或等价的酶,从而部分或完全 再激活工程化的“临时失活的”蛋白。
【0596】该方法包括将酶或其它多肽靶向宿主分泌通道,以便酶被糖基化。设计 新的糖基化位点,以便糖基化作用使酶失活,或修饰它的活性,例如减少它的活性, 或者另外修饰活性,诸如阻抑底物结合位点。因为酶或是失活的或活性较小,由于这 些酶活性的负面影响不再限制蛋白可以在宿主细胞中积聚的数量,所以有害的或有毒 的酶可以以较高水平表达。通过除去糖,例如使用商业上可获得的去糖基化酶,例如 通过使用全细胞工程化方法体外除去糖或体内除去糖,失活的、糖基化的酶可以被重 新激活(部分或完全)。
【0597】一方面,将真核糖基化靶位点诸如NXS/T加入到任何蛋白,例如本发 明的酶。这使本领域技术人员能够将糖基化位点加入到感兴趣的蛋白,并期望当通过 在真核宿主细胞中表达那个蛋白并将该蛋白靶向宿主细胞的分泌通道使得那个蛋白 糖基化时,将那个蛋白转化为临时失活的蛋白。
【0598】因此,本发明提供了产生在正常情况下数量巨大时因害处或毒性太大而 不能被宿主细胞忍受的酶的方法。该结果可以是临时性的,因为它可以重新产生活性 酶(通过去糖基化作用,例如通过翻译后修饰/去糖基化作用),用于需要活性酶的进 一步的工作。
【0599】一方面,本发明提供了制备和表达具有生物活性的蛋白的方法,该蛋白 的活性通过糖基化作用而临时失活,该方法包括:(a)提供编码具有生物活性的蛋白的 核酸,其中所述蛋白不是天然糖基化的;(b)将至少一个糖基化基序编码序列插入编码 蛋白的核酸中,其中所述糖基化形式的蛋白是无活性的;(c)将靶向序列插入蛋白,这 样该蛋白被导向宿主细胞的分泌通道,其中所述宿主细胞能够识别糖基化基序并糖基 化蛋白;和(d)在宿主细胞中表达修饰的核酸。一方面,该方法进一步包括对表达的蛋 白去糖基化,从而再次激活蛋白,例如酶,诸如本发明的酶的活性。一方面,宿主细 胞是真核细胞。一方面,通过去糖基化作用,或者化学方法或者酶法方法,体外再次 激活无活性的表达的重组蛋白。
【0600】对放置一个或多个糖基化基序以临时失活蛋白的测定,仅仅涉及制备变 体蛋白编码核酸的常规方法,例如通过GSSM,和常规筛选方案,例如活性或结合分 析方法。
【0601】因为糖基化作用的缘故,使活性对宿主细胞有害的酶失活。因为它是无 活性的,它可以以相当高的水平在真核宿主细胞中积聚。因为它不再具有活性,它不 再能够发挥其负面作用。有毒的酶的失活作用是临时性的,这是因为使用EndoH或 PNGase F对酶进行去糖基化作用能完全恢复酶的正常活性。积聚在培养基中大量糖 基化的、失活的酶表明,宿主细胞完全耐受无活性形式的酶。
【0602】本发明参照以下的实施例来进一步说明;然而,应当理解地是,本发明 并不限于这些实施例。
实施例
实施例1:用于序列同一性作图的BLAST程序
【603】本实施例描述了示例性的序列同一性程序,用以确定核酸是否在本发明 的范围内。应用NCBI BLAST 2.2.2程序,默认选择为blastp。除了默认过滤设置外, 应用所有默认值(即,除了过滤设置为OFF(关)外,所有参数设置为默认);在该 位置应用“-FF”设置,其使得不能进行过滤。由于序列长度短,应用默认过滤常常导 致Karlin-Altschul歪曲(violation)。用于本实施例的默认值为:
“低复杂度过滤(Filter for low complexity):开(ON)
>字长(Word Size):3
>矩阵(Matrix):Blosum 62
>空位成本(Gap Costs):存在(Existence):11
>延伸(Extension):1”
【604】其它的默认设置为:低复杂度过滤关闭(OFF),对于蛋白字长为3, BLOSUM62矩阵,空位存在罚分-11和空位延伸罚分-1。“-W”选项设定为默认值0。 这意味着,如果不设定,字长默认值对于蛋白为3,对于核苷酸为11。设置读作:
<>
>-----------------------------------------------------
>blastall arguments(变元):
>
>-p Program Name(程序名称)[String(串)]
>-d Database(数据库)[String(串)]
>default(默认值)=nr
>-i Query File(查询文件)[File In(编入)]
>default(默认值)=stdin
>-e Expectation value(期望值)(E)[Real(真实)]
>default(默认值)=10.0
>-m alignment view options(比对视角选项):
>0=pairwise(成对),
>1=query-anchored showing identities(查询-锚定显示同一性),
>2=query-anchored no identities(查询-锚定无同一性),
>3=flat query-anchored,show identities(平面查询-锚定,显示同一性),
>4=flat query-anchored,no identities(平面查询-锚定,无同一性),
>5=query-anchored no identities and blunt ends(查询-锚定无同一性和平末端),
>6=flat query-anchored,no identilies and blunt ends(平面查询-锚定,无同一性和 平末端),
>7=XML Blast output(输出),
>8=tabular(列表),
>9 tabular with comment lines(具有注解行的列表)[Integer(整数)]
>default(默认值)=0
>-o BLAST report Outout File(报告输出文件)[File Out(输出)]Optional(任选的)
>default(默认值)=stdout
>-F Filter query sequence(过滤查询序列)(DUST with blastn,SEG with others(用 blastn的DUST,用其它的SEG))[String(串)]
>default(默认值)=T
>-G Cost to open a gap(开放空位的成本)(zero invokes default behavior(零调用默 认行为))[Integer(整数)]
>default(默认值)=0
>-E Cost to extend a gap(延伸空位的成本)(zero invokes default behavior(零调用默 认行为))[Integer(整数)]
>default(默认值)=0
>-X X dropoff value for gapped alignment(空位比对X离开值)(in bits(字节))(zero invokes default(零调用默认)
>behavior(行为))[Integer(整数)]
>default(默认值)=0
>-I Show GI′s in deflines[T/F]
>default(默认值)=F
>-q Penalty for a nucleotide mismatch(核苷酸错配罚分)(blastn only(仅blastn)) [Integer(整数)]
>default(默认值)=-3
>-r Reward for a nucleotide match(核苷酸匹配得分)(blastu only(仅blastn)) [Integer(整数)]
>default(默认值)=1
>-v Number of database sequences to show one-line descriptions for(V)(对(V)显示 在线描述的数据库序列数目)
>[Integer(整数)]
>default(默认值)=500
>-b Number of database sequence to show alignments for(B)(对(B)显示比对的数 据库序列数目)[Integer(整数)]
>default(默认值)=250
>-fThreshold for extending hits,default ifzero(延伸命中的阈值,如果是零为默认 值)[Intege(整数)]
>default(默认值)=0
>-g Perform gapped alignment(进行空位比对)(not available with tblastx(对于 tblastx不可用))[T/F]
>default(默认值)=T
>-Q Query Genetic code to use(查询遗传密码子以使用)[Integer(整数)]
>default(默认值)=1
>-D DB Genetic code(遗传密码子)(for tblast[nx]only(仅对于tblast[nx])) [Integer(整数)]
>default(默认值)=1
>-a Number of processors to use(使用的处理器的数目)[Integer(整数)]
>default(默认值)=1
>-O SeqAlign file(文件)[File Out(输出)]Optional(任选的)
>-J Believe the query defline[T/F]
>default(默认值)=F
>-M Matrix(矩阵)[String(串)]
>default(默认值)=BLO SUM62
>-W Word size,default if zero(字长,如果是零为默认值)[Integer(整数)]
>default(默认值)=0
>-z Effective length of the database(数据库的有效长度)(use zero for the real size(对于真实大小使用零))
>[String(串)]
>default(默认值)=0
>-K Number of best hits from a region to keep(区域最佳命中数目保持)(off by default,if used a
>value of 100 is recommended(推荐使用值100))[Integer(整数)]
>default(默认值)=0
>-P 0 for multiple hits 1-pass,1 for single hit 1-pass,2for 2-pass(0,对于多次命中 1-pass,1,对于单次命中1-pass,2,对于2-pass)
>[Integer(整数)]
>default(默认值)=0
>-Y Effective length of the search space(检索空间的有效长度)(use zero for the real size(对于真实大小使用零))
>[Real(真实)]
>default(默认值)=0
>-S Query strands to search against database(检索数据库的查询线)(for blast[nx], and(对于blast[nx]和)
>tblastx).3 is both,1 is top,2 is bottom(3是两者,1是顶端,2是底端)[Integer(整 数)]
>default(默认值)=3
>-T Produce HTML output(产生HTML输出)[T/F]
>default(默认值)=F
>-1 Restrict search of database to list of GI′s(限制数据库检索至GI′s清单) [String(串)]Optional(任选的)
>-U Use lower case filtering of FASTA sequence(使用FASTA序列的较低情况过滤) [T/F]Optional(任选的)
>default(默认值)=F
>-y Dropoff(X)for blast extensions in bits(blast延伸的离开(X),字节)(0.0 invokes default(0.0调用默认行为)
>behavior)[Real(真实)]
>default(默认值)=0.0
>-Z X dropoff value for final gapped alignment(最后空位比对的X离开值)(in bits(字节))[Integer(整数)]
>default(默认值)=0
>-R PSI-TBLASTN checkpoint file(检查点文件)[File In(输入)]Optional(任选的)
>n MegaBlast search(检索)[T/F]
>default(默认值)=F
>-L Location on query sequence(查询序列的位置)[String(串)]Optional(任选的)
>-A Multiple Hits window size(多命中窗口大小)(zero for single hit algorithm(对于 单命中算法为零))[Integer(整数)]
>default(默认值)=40
实施例2:PLC介导的脱胶的模拟
【605】该实施例描述了磷脂酶C(PLC)介导脱胶的模拟。
【606】由于在水中溶解性差,首先将磷脂酰胆碱(PC)溶解于乙醇中(100mg/ml)。 对于初步测试,制备了PC的储备溶液,是在pH 6的50mM的3-吗啉基丙磺酸或60 mM柠檬酸/NaOH中。将PC储液(10μl,1μg/μl)加入到Eppendorf管中的500μl 精炼的大豆油(含2%的水)中。为了产生乳状液,将管中的内容物通过涡流振荡混 合3分钟(参见图5A)。油和水相通过在13,000rpm离心1分钟来分离(图5B)。反 应管在期望的温度下(37℃、50℃或60℃)进行预温育,并且加入3μl来自蜡状芽 孢杆菌(Bacillus cereus)的PLC(0.9U/μl)至水相(图5C)。通过用氯仿/甲醇/水(65∶ 25∶4)作为溶剂系统的TLC分析PC的消失(参见如Taguchi(1975),见上文),并 且在暴露于I2蒸汽后被观察到。
【607】图5示意性地说明了用于模拟PLC-介导的脱胶的两相系统模型。图5A: 通过混合粗制油与2%的水来水合污染的磷脂(P),产生乳状液。图5B:离心后分 离水相和油相,并将PLC加入到水相中,其含有沉淀的磷脂(“胶”)。在水相中发生 PLC水解。图5C:通过从水相中抽取等分试样并用TLC对它们进行分析,监控反应 的时间进程
实施例3:磷脂酶的表达
【608】该实施例描述了构建可以表达多种磷脂酶(包括本发明的酶)的本发明的商 业生产菌株。为了产生适合用于对食品级植物油(包括大豆、油菜和向日葵)脱胶的 多酶制剂,可以产生在同一表达宿主中表达两种不同磷脂酶序列的重组表达菌株。例 如,可以构建该菌株以含有一个或多个拷贝的PLC基因,和一个或多个拷贝的磷脂 酰肌醇-PLC基因。这些基因可以存在于一个质粒、多个质粒上,或者这些基因可以 通过同源重组被插入到表达宿主的基因组中。当基因通过同源重组导入时,基因可以 作为DNA表达盒导入宿主基因组中的单个位点中,所述表达盒含有一个或多个拷贝 的两个基因。可选地,每个基因的一个或多个拷贝可以导入宿主染色体中的不同位点。 这两个基因序列的表达可以由一种类型的启动子驱动,或者每一基因序列可以由独立 的启动子驱动。根据每一基因的拷贝数和启动子的类型,最终的菌株将表达变化比例 的每一活性酶类型。表达菌株可以用任何杆菌(例如蜡状芽孢杆菌)或链霉菌、大肠杆 菌、粟酒裂殖酵母、巴斯德毕赤酵母或者其它革兰氏阴性、革兰氏阳性或酵母表达系 统来构建。
【609】一方面,本发明提供了对大豆油进行脱胶的双酶系统,其中至少一种酶 是本发明的酶。PLC加上PI-PLC比单独使用其中一种酶产生更多的DAG。然而,两 种酶都比无酶对照样品产生更多的DAG。一方面,反应条件包括1毫升大豆油、在 任何添加之前油中~0.4%初始水分含量、50℃、用2.75M NaOH中和的0.2%柠檬酸、 10U PLC、15μL PI-PLC(0.45mg总蛋白),1小时总反应时间。图12所示的表概述了 从本发明的该双酶脱胶系统获得的数据。
【610】另一方面,本发明的PI-PLC酶可以在与PLC中所述的相同条件下使用。 这些条件包括植物油的化学精炼和植物油的水脱胶。
实施例4:具有提高的表达和改变的蛋白酶抗性的磷脂酶
【611】本发明提供了挑选磷脂酶C变体(突变体)的方法,该磷脂酶C在糖基化 宿主中具有提高的表达并对分泌的蛋白酶具有改变的抗性。
在糖基化宿主中提高的表达
【612】潜在的天冬酰胺-连接的糖基化位点——其具有氨基酸共有序列:天冬酰 胺-任何氨基酸-丝氨酸或苏氨酸(用单字母氨基酸代码表示为NXS/T),用诱变方法 敲除,以便将糖基化识别基序中的天冬酰胺或丝氨酸或苏氨酸改变成不同的氨基酸, 因此序列不再编码潜在的糖基化位点。糖基化位点的去除在如下所述位置实现:本发 明的磷脂酶C的氨基酸位置氨基酸63、氨基酸131和氨基酸134,该磷脂酶C具有 如SEQ ID NO:175所述的序列,由SEQ ID NO:178编码。当该蛋白在酵母:巴斯德 毕赤酵母中异源表达时,其糖基化位点的消除提高这种变体-活性磷脂酶C的表达。 这种减少或消除PLC酶中的潜在糖基化位点的策略可以提高活性PLC在任何糖基化 宿主中的表达。因此,本发明提供了具有任何本发明的示例性磷脂酶的序列的磷脂酶 (和编码它们的核酸),其中一个或多个或所有糖基化位点已被改变,如上所述。因 此,本发明提供了制备在宿主细胞中具有增加的表达水平的变体磷脂酶编码序列的方 法,其中该方法包括修饰本发明的磷脂酶编码序列,以便一个或多个或所有N-连接 糖基化位点编码基序被修饰成非糖基化基序。本发明也提供了由该方法制备的磷脂酶 编码序列,和它们所编码的酶。
改变的蛋白酶抗性
【613】本发明提供了制备变体磷脂酶编码序列的方法,该序列编码对蛋白酶具 有增加的抗性的磷脂酶,该方法包括将等同于SEQ ID NO:175的位置131上的氨基酸 修改成下述一个、多个或所有残基:赖氨酸(K);丝氨酸(S);甘氨酸(G);精氨酸(R); 谷氨酰胺(Q);丙氨酸(A);异亮氨酸(I);组氨酸(H);苯丙氨酸(F);苏氨酸(T);甲硫 氨酸(M);亮氨酸(L)。本发明也提供了由该方法制备的序列所编码的分离的、合成的 或重组的磷脂酶。本发明也提供了制备变体磷脂酶编码序列的方法,该序列编码对蛋 白酶具有减少的抗性的磷脂酶,该方法包括将等同于SEQ ID NO:175的位置131上的 氨基酸修改成下述的一个、多个或所有残基:色氨酸(W);谷氨酸(E);酪氨酸(Y)。 本发明也提供了由该方法制备的序列所编码的分离的、合成的或重组的磷脂酶。
【614】将含有天然分泌的巴斯德毕赤酵母蛋白酶的混合物的上清液与野生型和 突变型PLC酶制剂混合并温育。终止反应,与无蛋白酶阴性对照相比,通过 SDS-PAGE,显现降解。通过测量残留PLC活性也可以测定降解。通过观察发现了新 奇现象,即某些敲除糖基化作用的突变显著改变该表达的磷脂酶在发酵期间对降解的 敏感性。该方法的优势是在生产期间直接选择对宿主生物分泌的蛋白酶具有增加的或 减少的抗性的突变体。
【615】本发明的这种方法可以使用定点诱变(例如GSSM)来改变本发明的磷脂酶 C的氨基酸序列,例如如下所示,SEQ ID NO:2(SEQ ID NO:175)的酶活性子序列。 用加粗和下划线标出的每一氨基酸(下面)由天冬酰胺(单字母代码N)改变为天冬氨酸 (D)、丝氨酸(S)或另一氨基酸,如下所述。这些氨基酸被命名为下面序列中的氨基酸 63、氨基酸131和氨基酸134,其中色氨酸(W)命名为氨基酸1。通过减少在巴斯德毕 赤酵母表达系统中表达的蛋白的糖基化作用来进行这些突变,以增加活性磷脂酶C 蛋白的表达水平。这些相同的突变可以增加本发明的任何活性磷脂酶C在任何其它表 达系统中的表达水平,所述表达系统根据NXS/T系统对天冬酰胺进行糖基化(N-连 接的糖基化),其中N是天冬酰胺,X是任何氨基酸,S/T是丝氨酸或苏氨酸。因此, 本发明也提供了通过改变位置131处的氨基酸来改变表达的磷脂酶C的敏感性的方 法。
【616】SEQ ID NO:2的氨基酸1-37是前导序列,其在毕赤酵母中表达期间被去 除或者当在大肠杆菌中表达时用蛋白酶去除。SEQ ID NO:2的氨基酸38-286,其中并 入三个修饰(N63D、N131S、N134D),是SEQ ID NO:175:
注意:为了计算变化的位置,将第一个氨基酸(W)计为位置1。 WSAEDKHNEGINSHLWIVNRAIDIMSRNTTIVNPNETALLNEWRADLENGIYSADY ENPYYDDSTYASHFYDPDTGTTYIPFAKHAKETGAKYFNLAGQAYQNQDMQQAFF YLGLSLHYLGDVNQPMHAASFTDLSYPMGFHSKYENFVDTIKNNYIVSDSNGYW NWKGANPEDWIEGAAVAAKQDYPGVVNDTTKDWFVKAAVSQEYADKWRAEVTP VTGKRLMEAQRVTAGYIHLWFDTYVNR-
【617】如下面所述,将表达的磷脂酶C变体在存在巴斯德毕赤酵母蛋白酶的情 况下温育,获得以下结果:
【618】在SEQ ID NO:2的氨基酸位置131的以下氨基酸增加了表达的磷脂酶C 对巴斯德毕赤酵母蛋白酶降解作用的抗性:赖氨酸(K);丝氨酸(S);甘氨酸(G);精氨 酸(R);谷氨酰胺(Q);丙氨酸(A);异亮氨酸(I);组氨酸(H);苯丙氨酸(F);苏氨酸(T); 甲硫氨酸(M);亮氨酸(L)。在SEQ ID NO:2的氨基酸位置131的以下氨基酸减少了表 达的磷脂酶C对巴斯德毕赤酵母蛋白酶降解作用的抗性:色氨酸(W);谷氨酸(E);酪 氨酸(Y)。因此,本发明提供了变体磷脂酶,其具有任何其中之一或若干或所有这些 修饰,这取决于是否需要增加或减少表达的磷脂酶C对蛋白酶降解作用的抗性。本发 明提供了在等同于SEQ ID NO:2的位置131上具有任何其中之一或若干或所有这些修 饰的变体磷脂酶。该残基等同于SEQ ID NO:2的位置131,并且对任何特定氨基酸残 基的修饰是否可以增加或减少该酶对蛋白酶降解作用的抗性,可以通过本领域熟知的 方案常规地和预测性地确定,例如用于评价磷脂酶C(SEQ ID NO:2,由SEQ ID NO:1 编码)的蛋白酶敏感性的示例性分析方法,如下所述:
缓冲液:
○1.0M MES,pH 6.2
○0.7M醋酸钠(“NaAc”),pH 5.2
测试
○使用独立的1.5mL微量离心管
○向25μLPLC酶样品,加入5μLNaAc或7μLMES缓冲液,并混合
○加入25μL含蛋白酶的巴斯德毕赤酵母上清液,并混合
○加入2μL 5%叠氮钠,并混合
○在加湿温育器中,将管置于盛有水的预热烧杯中的悬浮架上
○对照包括PLC+缓冲液+dH2O,和毕赤酵母SN+缓冲液+dH2O
○温育0-24小时,如果需要,在多个时间点取样。
检测
○将样品按1∶2与含5mMEDTA的样品缓冲液混合,100℃加热4分钟,冷却, 离心,混合,每泳道加载5μL样品,考马斯(Coomassie)染色,在SDS-PAGE上显 现结果。
○也可以直接提取样品和时间点进行标准PLC活性分析。
【619】结果:SDS-PAGE跑胶,结果显示在图17中;其显示了体外消化试验的 结果,其中磷脂酶C变体在粗蛋白酶提取物中37℃温育最高达22小时。根据序列 “DXD”(氨基酸位置63的天冬氨酸-氨基酸位置131的任何氨基酸-氨基酸位置134 的天冬氨酸)的“X”位置发现的氨基酸,命名每一PLC突变体。这些凝胶显示了用粗 蛋白酶温育后表达的PLC变体蛋白的稳定性或敏感性。稳定的变体在“-”(无蛋白酶 反应的对照)和“+”(反应含有蛋白酶)中显示出具有相似染色强度的PLC带。与“-” 泳道相比,在“=”泳道中,对蛋白酶更敏感的变体将显示出PLC蛋白带染色强度的减 少。
实施例5:获得稳定的高水平表达PLC的方法
【620】本发明提供了在酵母培养物例如巴斯德毕赤酵母培养物中获得稳定的高 水平表达和高比活性的磷脂酶例如PLC的发酵方法。由该方法生产的酶可以用于例 如植物油精炼,诸如大豆油、油菜油、向日葵油或其它油。
【621】本发明提供了生产方法,该方法包括这样的特征,即能够在酵母细胞培 养物,例如巴斯德毕赤酵母,如在分批喂料培养物中以g/l水平,生产活性磷脂酶, 例如PLC。在微生物培养物中活性PLC蛋白的异源表达仅以mg/l的水平在文献中偶 有描述。此外,本发明的方法是基于这样的发现,在毕赤酵母培养物中PLC蛋白的 表达削弱了对MeOH的吸收能力,但是无其它研究过的生理生长特征。与毕赤酵母 培养物中常规的异源蛋白表达相反,需要高的共-喂料速率(high co-feed rates)(葡萄 糖/或甘油)。除提高酶的生产特征外,较高的共-喂料速率也消除了普通蛋白酶活性的 表达,该蛋白酶活性与PLC降解相关。此外,通过在具有Mut+表型的毕赤酵母菌株 中产生PLC而不损害与Mut+表型相关的可测量测试(并且因此,不以工业级使用), 可以克服较差的MeOH利用率特征,从而进一步提高生产特征。因此,相比于通常 用于工业规模的毕赤酵母系统的条件,本发明的该方法将活性PLC的生产率提高>50- 倍(从使用常规方法的100U/ml提高至>5000U/ml全肉汤;>5g/l蛋白)。此外,因 为PLC是需要结合锌以获得正确的折叠和活性的金属酶,一方面,本发明包括补充 锌。对本发明的培养物而言,该锌补充策略使得PLC活性如同全肉汤中一样,几乎 完全稳定(<5%的活性丧失),例如在4℃下,>5天。这明显有助于回收方法,因为 1)不稳定蛋白活性的产生在回收方法期间继续恶化,和2)其赋予了更大的加工灵活 性,特别是在大规模水平。
色氨酰基氨肽酶微量培养板分析
【622】本发明提供了色氨酰基氨肽酶微量培养板分析方法,其被开发用于测定 毕赤酵母发酵各时间点样品中的相对色氨酰基氨肽酶活性。该分析的通量能力足以满 足从大量发酵反应中的多个时间点进行取样。
材料与方法
缓冲液:
○15mM NaPO4,2mM MnCl2,pH 7.5,aq.
底物
○HTrp-AMC(Bachem,I1670)
底物溶液:
○将底物溶于10mM甲醇中
○将100μL 10mM底物加入6mL缓冲液中
样品:
○毕赤酵母发酵各时间点的样品
○离心除去细胞。
微量培养板制备:
○对于每一份平行测定样品、空白和参考,黑色96孔板(black 96-well)每个孔加 入90μl底物溶液等分试样
○将微量培养板置于荧光微量培养板阅读台上(例如SpectraMax,Molecular Dynamics)
样品添加和反应动力学:
○设置荧光微量培养板阅读器:
○Ex.350nm/Em.460nm;自动切断(455nm);PMT介质;每孔3次阅读;自 动校准“开”
○RT(室温)
○0-30分钟时程;每30秒阅读一次
○在第一次阅读之前,初始化设备板的混合功能,混合5秒
○将样品按96-孔形式等分,并用多通道移液器以每孔10μL转移样品
○取下盖子,重新将微量培养板放置在微量培养板阅读器中
○开始读数
【623】根据未知样品的固有活性,可期望的是改变样品稀释度、分析持续时间 和动态取样,以及可以用常规筛选方法测定的所有变量。
【624】底物已经显示出在这些条件下非常稳定,阴性对照空白应当显示出其吸 光率没有随时间变化而增加。
Bodipy BSA蛋白酶微量培养板分析
【625】本发明提供了Bodipy BSA蛋白酶微量培养板分析方法,以帮助测定毕赤 酵母发酵各时间点样品中的总蛋白酶活性。该分析的物料通过量足以满足从大量发酵 反应中进行多时间点取样。
材料与方法
底物:
○DQ BSA green(Molecular Probes,D 12050)
底物溶液:
○将一瓶底物(1mg)中的内含物溶于含有0.1%叠氮钠的1mL水中
样品:
○毕赤酵母发酵各时间点的样品
○离心除去细胞。
阳性对照:
○0.2mg/mL枯草杆菌蛋白酶(Sigma,P5380),于50mM NaPO4,pH 7.5中
○在水中连续稀释
微量培养板制备:
○对于每一份平行测定样品、空白和参考,黑色96孔板(black 96-well)每个孔加 入90μl底物溶液等分试样
样品添加和反应
○将样品按96-孔形式等分,并用多通道移液器以每孔10μL转移样品
○替换微量培养板的盖子,用箔包裹,在37℃置于加湿温育器中,温育3-4小 时或过夜
荧光测量:
○设置荧光微量培养板阅读器(SpectraMax):
○Ex.495nm/Em.525nm;自动切断(515nm);PMT低;每孔3次阅读;自动 校准“开”
○RT
【626】选择Bodipy BSA作为通用蛋白酶底物。缺少对bodipy BSA的水解并不 表明不存在蛋白酶,但是已经显示其与PLC酶的水解和PLC活性的丧失相关。已经 证明,BSA可以用bodipy卵清蛋白或酪蛋白替代。
【627】一方面,在整个发酵时程内表征蛋白酶活性是有用的,这是因为该活性 可以是临时性的和瞬时的。
【628】底物已经显示出在这些条件下非常稳定,阴性对照空白应当显示出其吸 光率没有随时间变化而增加。
在全培养肉汤或上清液中PLC活性的测量:
【629】本发明提供了在全培养肉汤或上清液中进行的PLC活性测量分析方法; 该分析方法是对Edward A.Dennis(1973)Kinetic dependence of phospholipase A2 activity on the detergent Triton X-100.J.Lipid Res.14:152-159,USP 24/NF 19, Pancrealipase-Assay for lipase activity.第1256-1257页中描述的方法的修改。本发明的 PLC活性测量分析方法包括:
溶液:
100mM硫酸锌溶液
100mM氯化钙溶液
底物溶液(20mM磷脂酰胆碱,40mM Triton X-100,5mM氯化钙)
稀释缓冲液(0.1%Triton X-100,1mM硫酸锌,1%阿拉伯胶)
分析程序:
-用稀释缓冲液(1.0%阿拉伯胶,1.0%Triton X-100,1mM硫酸锌)制备待分析样 品的稀释液。在分析前一刻用冷的缓冲液制备稀释液,并保藏在冰浴中,直到使用。
-将20mL的底物溶液转移入约50mL容量的带夹套的玻璃容器,该玻璃容器的 外室与恒温控制的水浴相连。覆盖混合物,并用机械搅拌装置持续搅拌。将混合物的 温度维持在37±0.1℃,从通过盖子上的孔插入的微量滴定管,用0.01N KOH VS预 滴定底物,将pH调节至7.3。加入50μL的酶稀释液,然后自动持续添加0.01N KOH VS 6分钟,将pH维持在7。
【630】此外,对发酵罐培养物进行标准的PAGE凝胶电泳,蛋白质和RNA印迹 分析以及标准分析技术,以获得在线/离线发酵参数(生物质水平、气体分析等)的。
产生Mut+表型毕赤酵母菌株
【631】本发明提供了细胞、细胞系统和表达磷脂酶C的方法,该方法包括使用 具有Mut+表型的毕赤酵母菌株。该方法包括将编码异源PLC的核酸插入毕赤酵母菌 株中。然后在表达PLC的条件下培养该细胞。该方法可以进一步为所述培养条件补 充锌。
【632】一方面,这些方法、细胞和细胞系统使用SEQ ID NO:2,其是需要锌的 金属酶。一方面,它以3摩尔/摩尔的量使用。它的MW近似28kDa,pI近似5.2, 并具有宽的底物耐受性:PC>PE>PS>>PI。未加工的酶具有24个氨基酸的信号序列, 13个氨基酸的前序列,和245个氨基酸残基的“成熟”酶。
【633】一方面,本发明的Mut+毕赤酵母菌株具有两个拷贝的醇氧化酶(AOX)基 因,AOX1和AOX2,在转化期间受到影响(“Mut”代表“甲醇利用率(Methanol Utilization)”),如下所述:
·Mut+
·单交换事件,AOX1和AOX2基因完整
·单独依靠甲醇生长和表达。可能共喂料
·Muts
·双交换事件,破坏AOX1基因
·共喂料提高生长和表达
·Mut-
·重组事件破坏AOX1和AOX2基因
·不能代谢甲醇,需要共喂料
总之:Mut-<Mutsplc<Muts/Mut+plc<Mut+
在Mut+和Muts之间存在发酵差异,包括:
·甲醇的最佳诱导浓度
·氧消耗率
·由于更快的吸收能力,依靠甲醇,Mut+生长比Muts快
·诱导之后,容易度过过渡期
·Mut+不用于大规模表达
·通风/冷却能力,MeOH敏感性
【634】巴斯德毕赤酵母的甲醇利用途经是本领域所熟知的。醇氧化酶(AOX) 将甲醇催化转变为甲醛;因此,如果AOX被过量表达,导致“腌渍的(pickled)”酵母细 胞。
在本发明的一个方面,使用巴斯德毕赤酵母的示例性发酵方案,包括:
·种子培养(瓶或桶)
·在丰富培养基中进行分批发酵,以增加生物质
·分批发酵罐培养
·分批阶段(甘油)
·随着初始碳源被消耗,生物质增长
·葡萄糖或甘油喂料阶段
·由D.O.含量引发喂料添加,或线性/指数喂料
·增长至足够的生物质,以进行诱导和表达(无乙醇,C-受限的)
·甲醇诱导
·喂料是受调控的(D.O.%,MeOH传感器,RQ),或者预先设置的喂料方 案
·与葡萄糖或甘油共喂料,取决于表型和表达参数
·Mut+诱导,以1-3g/LMeOH
·Muts诱导,以4-7g/LMeOH
【635】图18示出了分批发酵罐培养的结果,如上所述,仅使用甘油。蛋白酶活 性来自毕赤酵母中的内源性蛋白酶。分批发酵可以是丰富培养基,以增加生物质。如 在图18中所示,在约69小时开始的蛋白酶活性的逐步增加对应于PLC活性的逐步 减少。较高的甘油(glyc)共喂料速率提高了活性PLC的表达,减少(消除)了蛋白酶 的产生,如下面数据概括表所示:

【636】这些研究在30-L BB发酵罐中、以DSD-PLC进行。测量OUR或体积氧 吸收率(Vol.Oxygen Uptake Rate,“OUR”),作为良好表达的“总培养物健康”指标, 或“生物标记”。图19示出了该研究的结果,产生DSD-PLC的巴斯德毕赤酵母MutS 30 L培养物的OUR曲线比较结果,使用1700U/ml、1100U/ml和100U/ml的PLC,温 度为30℃,甘油共喂料,如上所述。
【637】图20示出了产生DSD-PLC,pH 6.2(1100U/ml和100U/ml PLC),或异 源蛋白的巴斯德毕赤酵母MutS 30L培养物的甲醇消耗曲线比较结果,以甘油共喂料, 如上所述。这是需求-驱动型(demand-driven)MeOH喂料,残余MeOH水平控制在4g/l。
【638】此外,Mut+表型提高活性PLC表达水平,并增强MeOH吸收,如该数 据表格所概括的:

【639】PLC似乎不影响该Mut+表型菌株的生理生长特征,该菌株以6×拷贝数 表达重组PLC SEQ ID NO:2,数据在图21中示出,OUR图如附图说明中所阐述。这 只是供应-驱动型(supply-driven)MeOH喂料,在Mut+培养物中无残留的葡萄糖或 MeOH。
【640】此外,产生的PLC蛋白的质量是可变的,具有不可预测性,例如《或》50% 的总PLC蛋白具有活性,如图22中的SDS-PAGE结果所代表性示出。该OUR图(如 上所论述)数据图解概述被插入到SDS-PAGE示图的上面部分。对照命名为JG=0.5μl 1.6mg ml-1。与蛋白酶或氨肽酶活性没有相关性。显著数量的活性PLC位于细胞内, 如图23所示(也显示了研究的方案),其中在细胞内检测到>700U/ml PLC(在图23中, PLC(SEQ ID NO:2)+α信号肽(来自酿酒酵母属)+糖基化作用)。形态学变化与活性 PLC的浓度相关,如图24中所示。形态学变化的大小依赖于菌株和碳源。
【641】增加的Zn并没有促进具有2×拷贝数的Mut+SEQ ID NO:2的毕赤酵母菌 株的表达,所述Mut+SEQ ID NO:2具有DSD突变,如在下面数据表格中所概述的(超 过1×通过共喂料来供应)(上面第一行是空载体对照)。增加的Zn确实提高了作为全肉 汤的储藏稳定性(在4℃,>100h后,具有相类的活性水平),和总的方法稳健性。
  Zn   MeOH   (L)   碱   (L)   70%(v/v)   甘油(L)   OD600   PLC   (U/ml)   1X   (2.2mM)   7.1   2.3   9.6   765   0   0.2X   7.4   2.1   8.6   731   392   1X   7.1   2.8   9.0   776   2700   4X   6.1   2.2   10   780   2448   12X   6.4   2.3   9.8   776   2498
【642】图25用图表概述的数据显示了在95h TFT(total fermentation time,总发 酵时间)时,毕赤酵母中PLC生产性能的状态。在图表右边的5条柱显示了从“Zeo菌 株”得到的结果,或生产PLC的巴斯德毕赤酵母菌株的Zeocin适应性。该菌株是抗生 素-抗性的、无标记菌株,在巴斯德毕赤酵母中表达作为异源基因的本发明PLC(SEQ ID NO:2)。已经证明,通过用抗生素zeocin来使菌株适应,人们可以获得新的稳定菌 株,该菌株具有极大提高的感兴趣蛋白的表达水平。
【643】将原始的抗生素-抗性无标记菌株,菌株#1(含有SEQ ID NO:2)在一系列 稀释步骤中进行培养,每一次增加抗生素zeocin的浓度。在每一步骤,将前面步骤的 一部分培养物用新鲜培养基稀释至在600nm的光密度(OD600)为1.0,并将增加数量 的zeocin加入到新的培养基中,再生长24小时。在最后阶段,使用200ug/ml的zeocin 浓度,将最终培养物划线接种到MD/YPD板上,以使单菌落生长。结果发现,来自 最终阶段培养物的菌落对zeocin显示出高度耐受性,而亲代菌株则显示出非常低的耐 受性。其中一个菌落,菌株#2(含有SEQ ID NO:2)相比起原始PLC菌株,菌株#1,显 示出显著提高的(约70%以上)PLC表达水平。同样证明了,在传代40代之后,菌株 #2在zeocin耐受性和PLC表达上都是稳定的,这表明新菌株获得“永久性的”高PLC 表达和zeocin耐受性的性状。
【644】通过使用本发明的“Zeo菌株”(Zeocin毕赤酵母适应型)获得高水平的PLC 活性:4100u/ml,在小罐(mini-tanks)中。该结果来自包含6×DSD SEQ ID NO:2的毕 赤酵母菌株。简而言之,该SEQ ID NO:2表达菌株通过在一系列的步骤中进行培养而 “适应”,每一步骤都使用增加的zeocin浓度。明显地,该适应方法迫使菌株/构建物 发生一些变化(在分子或遗传水平上),并使PLC活性水平显著提高。示例性的结果 是:
·罐1、2和4(每一个代表不同的菌落)的表现都超出原始预适应的SEQ ID NO:2-表达菌株,罐1和4都达到4100u/ml,罐2达到3500u/ml。
·罐1和4早在75hrs时就达到3000u/ml以上,这表示:比原始预适应的SEQ ID NO:2-表达菌株(其在此时通常远低于2000u/ml)具有更快的活性积聚水平。
实验设计和结果的详细内容是:
zeocin适应的基本原理:
【645】有关PLC表达的早期工作是在毕赤酵母pPICZa载体中完成的,该载体 含有zeocin-抗性标记。zeocin因此被用于转化选择。后来,我们转换到AMR-较少形 式的构建物(AMR-less version construct)以开发商业候选产品。当进行小罐发酵时, 我们观察到使用AMR-less构建物获得PLC活性水平显著下降:在pPICZa-DSD构建 物中,上清液活性达到4000u/ml,而在2×DSD中仅获得约2000u/ml。使用AMR-less 构建物,也观察到明显的生理差异,例如较低的甲醇消耗率和更多的细胞裂解,特别 是当使用同样的发酵方案测试较高拷贝数的(5×、6×)构建物时。
【646】pPIZa构建物和AMR-less构建物之间的明显差异之一是在转化过程中 zeocin的使用,问题是细胞有可能依靠什么来度过zeocin选择。本发明提供了在zeocin 存在下培养AMR-less构建物的方法,然后使细胞经受某些有利于PLC表达的变化。
2×DSD的Zeocin适应实验:
【647】实验首先用2×DSD(因为此时它是转移分子)进行。该研究以1ug/ml的 zeocin浓度(″zeo 1″)开始,使培养物生长~24hrs。从那时起,进行各步骤,将zeocin 浓度增加至zeo 5、zeo 10、zeo 15、zeo 20、zeo 40、zeo 60、zeo 80、zeo 100,最后 增加至zeo 200(zeo 100通常用于转化选择)。每一步骤都使用新鲜的培养基,并将前 一阶段的培养物用于接种下一阶段的培养物,OD值为1.0,生长~24hrs。将每一阶 段的培养物划线接种于YPD板,用于保藏以及获得单菌落。
zeo-适应菌落的小罐发酵结果:
【648】为了检测zeocin适应的效果,从zeo 200和zeo 100培养物(其被划线接 种于YPD板)挑选12个菌落,并用小罐筛选。结果总结在幻灯片(slide)6中。我们 能够发现若干菌落的表现明显超出原始构建物(含SEQ ID NO:2的毕赤酵母菌株)。其 中,来自zeo 200培养物的菌落#5显示PLC活性水平提高约50%。对筛选的观察如 下:
·zeo-适应的培养物和原始的SEQ ID NO:2-表达菌株之间的生长曲线没有明显的 差异。
·尽管已适应的培养物的稳定性没有被广泛测试,它们还是在无zeocin存在的 YPD和/或MD板上被重新划线接种了若干次。所有发酵过程也是在无zeocin存在下 进行的。
·菌落与菌落之间有明显的变化,无论是生长上的还是PLC表达上的。
·有关发酵的一些技术问题可能部分地是这些变化所致。
在6×DSD上进行Zeocin适应试验:
【649】受来自zeo-适应2×DSD的结果的鼓舞,我们随后对6×DSD(此时测定得 知其优于2×DSD)进行了同样的试验。我们以zeocin浓度5ug/ml(“zeo 5”)开始,并 使培养物生长~24小时。从那时起,进行各个步骤,将zeocin浓度增加至zeo 15、zeo 30、zeo 50、zeo 100,最终至zeo 200。与2×DSD相同,每一步骤都使用新鲜的培养 基,并将前一阶段的培养物用于接种下一阶段的培养物,OD值为1.0,生长~24hrs。 将每一阶段的培养物划线接种于YPD板,用于保藏以及获得单菌落。
zeo-适应的6×DSD菌落的小罐发酵结果:
【650】挑选来自zeo 200培养物(其被划线接种于MD板)的六个菌落,并与 小罐中的原始SEQ ID NO:2-表达菌株一起测试。关键的观察结果如下:
·所有三个菌落(罐1、2和4)的表现都超出原始SEQ ID NO:2-表达菌株,罐 1和4都达到4100u/ml,罐2达到3500u/ml。
·罐1和4早在75hrs时就达到3000u/ml以上,这表示与SEQ ID NO:2-表达菌 株(其在此时通常远低于2000u/ml)相比,具有更快的活性积聚水平。
·相比起在10-L罐中进行的3000u/ml,在罐1、2和4中的PLC表达水平也似 乎是较高(参见幻灯片4)。因此不清楚是否表观比活性在罐1、2和4中较高,即,是 否所产生的PLC不同于原始SEQ ID NO:2-表达菌株。
·对照,罐7和8此时未达到3000u/ml。不清楚是否罐1、2和4能达到更高的 水平。应注意,百分比的增加(35%,4100u/ml对3000u/ml)是小于2×适应的培养物。
·图26给出了对来自6×DSD zeocin-适应的菌落表达筛选的概述。原始菌株最高 的活性水平为~3000u/ml(小罐和10-L);zeocin-适应的6×DSD的活性水平为4100u/ml (增加~35%)。图27的数据显示,相比起在10-L罐(和罐条件)中的3000u/ml,罐1、 2和4中的PLC蛋白水平较高,如上所述(凝胶载量是1.0ul的5×稀释肉汤,0.2ul 的全肉汤)。图28显示了zeo-适应的菌落与对照的生长比较。相比起原始SEQ ID NO:2-表达菌株,Zeocin-适应的6×DSD菌落(6×DSD)具有相似的生长曲线。
【651】在C-限制的好氧酵母培养物中,分泌蛋白的Qp,在μ=0.10h-1下,一般 为0.5-2.5mg/g.h-1。基于400mg/g DW的蛋白含量,“代谢载荷(metabolic burden)”小 于总蛋白生产率的10%。在整个发酵期间,PLC mRNA水平保持在高水平上,这与 表达并不相关。基于5g/l(150g)PLC蛋白,少于总5mol C/h的0.1mol C/h(总C的 ~2%被消耗)成为PLC中的碳,~25%成为生物质。在这些生产条件下,PLC活性似 乎没有影响一般的生长生理特征(除MeOH利用能力受影响外)。
【652】总之,本发明提供了zeocin-抗性酵母细胞系统,诸如酵母细胞,细胞系 和/或单细胞,用于表达由下述方法制备的异源蛋白(例如酶,诸如PLC),该方法包 括下述步骤:提供包含能够表达异源蛋白的异源核酸(例如,包含酶编码序列的载体; 可操作性连接到启动子的ORF)的毕赤酵母某种(例如巴斯德毕赤酵母)的细胞;将细 胞(许多细胞)培养在包含起始浓度(该浓度足够低以便一些细胞存活,而足够高以 选择抗生素抗性细胞)的zeocin的条件下;选择对起始浓度的zeocin具有抗性的细胞, 并重新培养在包含较高浓度的zeocin的条件下;选择对较高浓度的zeocin具有抗性 的细胞。本发明也提供了该方法制备的酵母细胞、细胞系和/或单细胞。常规的筛选 方法能够确定使用什么起始浓度的抗生素,需要或期望多少轮的选择,和如何快速增 加各轮选择之间的抗生素浓度。
实施例6:热稳定性PLC
【653】本发明提供了热稳定性磷脂酶。具有SEQ ID NO:2中所阐明的序列的示 例性酶的热稳定性得到了证明。使用SEQ ID NO:2证明了本发明可比较的磷脂的热稳 定性。在两个不同的系统中测试了SEQ ID NO:2的活性:水中和在油中。在含水系统 中,替代底物(p-nppc)用于测量活性;该酶在86℃开始丧失活性。然而,在油分析中, 在85℃,水解大豆油中存在的PC和PE底物时,该酶显示出良好的活性。检测相同 的酶的Tm,发现它在15mg/mL时为86℃,并且是不可逆的。
【654】图29示出了使用10U的SEQ ID NO:2时的85℃加热试验的结果,条件 如图中所示。图30示出了总结该加热试验的NMR数据。图31、32和33所示出的 数据概述了使用p-NPPC时的SEQ ID NO:2的热稳定性,在图中所示的条件下。图 34示出了来自DSC分析的数据,显示了SEQ ID NO:2的热稳定性,酶浓度为15 mg/mL,Tm为86℃。
实施例7:对本发明PLC的修饰
【655】实施例4所述的修饰的磷脂酶C酶(SEQ ID NO:175,由SEQ ID NO:178 编码)是较长序列(SEQ ID NO:176)的酶学活性子序列。SEQ ID NO:176具有SEQ ID NO:2的1至37残基的前导序列(粗体)。由SEQ ID NO:177编码的SEQ ID NO:176 被用作使用GSSM技术进行进一步修饰的模板。从N-末端甲硫氨酸起始编号位置。 实施例4所述的突变用下划线和粗体标出(此处的编号为N100D、N168S和N171D)。
WSA EDKHNEGINS
HLWIVNRAID IMSRNTTIVN PNETALLNEW RADLENGIYS ADYENPYYD
STYASHFYDP DTGTTYIPFA KHAKETGAKY FNLAGQAYQN QDMQQAFFYL
GLSLHYLGDV NQPMHAAFTLSYPMGFHS KYENFVDTIK NNYIVSDSNG
YWNWKGANPE DWIEGAAVAA KQDYPGVVND TTKDWFVKAA VSQEYADKWR
AEVTPVTGKR LMEAQRVTAG YIHLWFDTYV NR(SEQ ID NO:176)
                                 WSA EDKHNEGINS
HLWIVNRA IDIMSRNTTIVN PNETALLNEW RADLENGIYS ADYENPYYD
STYASHFYDP  DTGTTYIPFA KHAKETGAKY FNLAGQAYQN QDMQQAFFYL
GLSLHYLGDV NQPMHAAFTLSYPMGFHS  KYENFVDTIK NNYIVSDSNG
YWNWKGANPE DWIEGAAVAA KQDYPGVVND TTKDWFVKAA VSQEYADKWR
AEVTPVTGKR LMEAQRVTAG YIHLWFDTYV NR    (SEQ ID NO:175)

TGGTC
AGCTGAGGATAAGCATAATGAGGGGATTAACTCTCATTTGTGGATTGTAAATCGTGCA
ATTGACATCATGTCTCGTAATACAACGATTGTGAATCCGAATGAAACTGCATTATTAA
ATGAGTGGCGTGCTGATTTAGAAAATGGTATTTATTCTGCTGATTACGAGAATCCTTA
TTATGATGATAGTACATATGCTTCTCACTTTTATGATCCGGATACTGGAACAACATAT
ATTCCTTTTGCGAAACATGCAAAAGAAACAGGCGCAAAATATTTTAACCTTGCTGGTC
AAGCATACCAAAATCAAGATATGCAGCAAGCATTCTTCTACTTAGGATTATCGCTTCA
TTATTTAGGAGATGTGAATCAGCCAATGCATGCAGCATCTTTTACGGATCTTTCTTAT
CCAATGGGTTTCCATTCTAAATACGAAAATTTTGTTGATACAATAAAAAATAACTATA
TTGTTTCAGATAGCAATGGATATTGGAATTGGAAAGGAGCAAACCCAGAAGATTGGAT
TGAAGGAGCAGCGGTAGCAGCTAAACAAGATTATCCTGGCGTTGTGAACGATACGACA
AAAGATTGGTTTGTAAAAGCAGCCGTATCTCAAGAATATGCAGATAAATGGCGTGCGG
AAGTAACACCGGTGACAGGAAAGCGTTTAATGGAAGCGCAGCGCGTTACAGCTGGTTA
TATTCATTTGTGGTTTGATACGTATGTAAATCGCTAA(SEQ ID NO:177)
TGGTCAGCTGAGGATAAGCATAATGAGGGGATTAACTCTCATTTGTGGATTGTAAATC
GTGCAATTGACATCATGTCTCGTAATACAACGATTGTGAATCCGAATGAAACTGCATT
ATTAAATGAGTGGCGTGCTGATTTAGAAAATGGTATTTATTCTGCTGATTACGAGAAT
CCTTATTATGATGATAGTACATATGCTTCTCACTTTTATGATCCGGATACTGGAACAA
CATATATTCCTTTTGCGAAACATGCAAAAGAAACAGGCGCAAAATATTTTAACCTTGC
TGGTCAAGCATACCAAAATCAAGATATGCAGCAAGCATTCTTCTACTTAGGATTATCG
CTTCATTATTTAGGAGATGTGAATCAGCCAATGCATGCAGCATCTTTTACGGATCTTT
CTTATCCAATGGGTTTCCATTCTAAATACGAAAATTTTGTTGATACAATAAAAAATAA
CTATATTGTTTCAGATAGCAATGGATATTGGAATTGGAAAGGAGCAAACCCAGAAGAT
TGGATTGAAGGAGCAGCGGTAGCAGCTAAACAAGATTATCCTGGCGTTGTGAACGATA
CGACAAAAGATTGGTTTGTAAAAGCAGCCGTATCTCAAGAATATGCAGATAAATGGCG
TGCGGAAGTAACACCGGTGACAGGAAAGCGTTTAATGGAAGCGCAGCGCGTTACAGCT
GGTTATATTCATTTGTGGTTTGATACGTATGTAAATCGCTAA(SEQ ID NO:178)
【656】使用如上所述的基因位点饱和诱变(GSSM)方法进行单一残基突变并 分析磷脂酶活性。用于筛选目的,表达载体是在E.coli宿主Topl0中的pASK。GSSM 命中(hits)选自初级筛选,其中PA/PI乳剂用作为底物,并且用LCMS分析样本。 然后在大豆油上确证这些初级命中,并用31P NMR和HPLC分析。
【657】制备用于NMR分析的样本的大豆油分析和方法如下:
【658】通过在900mL水中溶解25g脱氧胆酸、5.84g EDTA、5.45g Tris碱来 制备NMR洗涤剂,然后使用KOH小粒将pH调节至10.5。NMR内标是在HPLC-级 异丙醇中的50mM TIP和12.5mM TBP。低顺磁性重水(D,99.9%)来自Cambridge Isotope Laboratories Inc.(DLM-11-100)。NMR对照是Avanti Lecithin(International Lecithin & Phospholipids Society mixed soy phospholipids reference Standard oil),Avanti Polar Lipids Inc,#95309。
【659】标准和样本如下制备:
彻底混合一批天然大豆油
将1mL油分散至2mL管中并且加入60uL的纯化酶(作为对照,18个单位) 或纯的细胞裂解液(用于筛选突变体)并且混合15秒。单位的定义为在37℃,pH 7.3 时每分钟水解1μmol PC。
在60℃在热混合器中以14000rpm振荡温育48小时,间歇涡旋。
温育后,使用旋转彻底混合样本
称量每个样本250mg(+/-0.2mg)至2mL管,并称量10mg(+/-0.1mg)Avanti Lecithin的NMR对照。
向每个样本中加入900uLNMR洗涤剂,然后加入100uLD2O。
在30-37℃并且以14000rpm在Eppendorf热混合器中通过旋转和振荡彻底混合样 本30分钟
以13,000RPM离心10分钟
小心去除顶部油层
向每个样本中添加750uL己烷并温和旋转*
以13,000RPM离心10分钟
小心去除600uL底层水层并且转移至新管
加入25uL内标(Internal Standard),充分混合
将500uL转移至5mm NMR管
【660】DAG的释放根据如下方法用定量HPLC测量:
【661】样本溶液是~50ul油样本和950ul己醇/异丙醇(9∶1)来形成1ml溶液。 标准溶液是,例如0.25mg/ml、0.5mg/ml、1mg/ml、2mg/ml和4mg/mlEnovaTM油。Enova 油是高DAG油,其具有与常规植物油(1,3-DAG和1,2-DAG)相似的脂肪酸分布。
HPLC设置:
柱:ChromegasphereTM SI-60,15cm×4.6mm
温度:40℃
流速:2mL/min
进样量:20ul
流动相A:己醇
流动相B:己醇/异丙醇/乙酸乙酯/蚁酸=800∶100∶100∶1
梯度洗脱:

【662】ELSD设置:示例性设置是温度40℃、增益(gain)5和氮气3.5巴(bars)。 通过将保留时间与标准的保留时间比较来鉴定DAG峰。定量是基于检测器的响应(峰 面积)和分析物浓度之间的关系。
【663】基于:NMR和HPLC数据,选择如下表5所示的突变。表5显示起始氨 基酸、氨基酸改变和改变的氨基酸的位置数。该表还显示原始密码子、替换的密码子 和其它用于相同氨基酸改变的密码子。例如,第二行,“E41A”显示位置41的氨基酸 原始为“E”(谷氨酸),但被改变为“A”(丙氨酸)。E41A改变的原始密码子是“GAG”, 但被改变为“GCA”。然而,密码子“GCG”、“GCC”或“GCT”也可使用。表5所述的密 码子变体产生的变体(SEQ ID NO:176的)具有最佳变化或优于“野生型”(SEQ ID NO:176)的PA水解的“改进”。本发明提供核酸,和它们编码的多肽,其包括一种、 几种或所有的变化或所有变化的等同物,如表5所示。
【664】在图35中,单个磷脂(PL)种类的重量分数相对于反应后剩余的总PL 给出,其反映了突变体对具体种类的特异性。此处,种类是磷脂酸(PA)、磷脂酰乙 醇胺(PE)、磷脂酰肌醇(PI)、卵磷脂(PC)。“TIP”是指NMR内标。“释放的DAG” 由HPLC测定并且反映了样本和总1,3-DAG和1,2-DAG对照之间的相对值。阳性对 照为Tan等人之前在Biochemistry 37:4275-4279(1998)所述的E41A突变体的纯化样 本。结果显示突变体释放DAG良好并且对各个种类具有良好活性,种类包括卵磷脂 (PC)和磷脂酰乙醇胺(PE),与模板(SEQ ID NO:176)相当或优于模板。例如,D100L 和D100M显示对PA具有特别活性。Q265R显示对PI具有特别活性。这些突变可被 组合以提供具有对各种底物所期望活性的酶。
表5:GSSM命中(hit)


【665】因此,本发明提供包括具有编码上表所列氨基酸突变,例如本文所述的 密码子改变的一个、两个或更多核酸突变的序列SEQ ID NO:177或SEQ ID NO:178 的核酸;这些核酸和多肽进一步在本文所述的实施方式中提供。
【666】GSSM命中被筛选以及选择高命中(top hits)之后(见表5),在卵黄平 板上进行进一步的特征分析,以便使用基因重装配(GeneReassembly)技术缩小用于 组合的单个GSSM突变体的数目。表7显示了卵黄分析数据(卵黄分析如下所述), 以及油分析和耐热残留活性测定的结果。图36说明了单个GSSM高表达突变型 (upmutant),其被选择用于包含在基因重装配方法中。基因重装配按前述进行。
【667】如下,表6列出了288个本发明的示例性多肽序列,其通过选择的单个 GSSM高表达突变型的基因重装配组合来产生。所有都是起始氨基酸序列SEQ ID NO:176(“野生型”或“WT”序列)的变体。
【668】为了帮助阅读表6,例如,本发明的示例性磷脂酶表征为进化的磷脂酶1 (第二行):
-在残基位置41的野生型氨基酸残基“E”或谷氨酸(glu)被修饰为“Y”或酪氨 酸(tyr)残基;
-在残基位置100的野生型氨基酸残基“N”或天冬胺酸(asp)被修饰为“M”或 甲硫氨酸(met)残基;
-在残基位置168的野生型氨基酸残基“N”或天冬胺酸(asp)被修饰为“S”或丝 氨酸(ser)残基;
-在残基位置171的野生型氨基酸残基“N”或天冬胺酸(asp)保留为“N”;以及
-在残基位置176的野生型氨基酸残基“M”或甲硫氨酸(met)保留为“M”。
注意:进化的磷脂酶172(173行,粗体)不是本发明的示例性磷脂酶,它是起 始磷脂酶序列SEQ ID NO:2(见实施例4)。
表6:从单个GSSM高表达突变型的基因重装配组合产生的磷脂酶文库









【670】表7总结了分析本发明的示例性酶(以及对于巴斯德毕赤酵母表达系统 ——编码它们的核酸的表达活性)的各种酶学活性和表达系统行为的分析结果,其中 所有的本发明的多肽都是起始磷脂酶序列SEQ ID NO:176(由例如核酸序列SEQ ID NO:177编码)的序列变体。为了帮助阅读表7,例如,在E41A行中,该行描述了本 发明的示例性酶,其具有SEQ ID NO:176,但在氨基酸位置41用“A”或丙氨酸(ala) 替代“E”或(glu),等等。


卵黄分析
【0671】卵黄分析按如下进行:
通过在高压灭菌之前向培养基中加入0.5%(按重量计)卵黄卵磷脂,来制备卵 黄琼脂平板。如果在高压灭菌培养基之前用高剪切力混合器分散卵磷脂,平板将更均 匀。
在琼脂中打孔,等体积(例如2ml)的连续稀释样本,包括阳性对照,上样至孔 中。
平板在37℃放置3-12小时,在此期间酶扩散出孔,水解卵黄卵磷脂并由于二酰 甘油的形成而形成沉淀带。
由环直径或综合密度值(integrated density value,IDV)测量的沉淀环内的面积 针对阳性对照的标准曲线作图,以测定样本磷脂酶的活性。整个方法可用于测定样本 的未知PLC活性。该方法是半定量的。
卵磷脂(PC):来自Sigma,目录号P 5394
PC来自干卵黄,X-E型,TLC测定约60%PC。
【0672】尽管本发明以通过参考它的某些示例性方面而被详细描述,但是应理解 的是,修改和变化在被描述和要求保护的精神和范围内。
序列表
<110>E.奥多诺谷
     N.R.巴尔顿
<120>磷脂酶、编码它们的核酸及其制备和应用方法
<130>564462015940
<140>尚未授予
<140>与此同时
<150>60/826.512
<151>2006-09-21
<160>178
<170>FastSEQ for Windows Version 4.0
<210>1
<211>849
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>1
atgaaaaaga aagtattagc actagcagct atggttgctt tagctgcgcc agttcaaagt     60
gtagtatttg cacaaacaaa taatagtgaa agtcctgcac cgattttaag atggtcagct    120
gaggataagc ataatgaggg gattaactct catttgtgga ttgtaaatcg tgcaattgac    180
atcatgtctc gtaatacaac gattgtgaat ccgaatgaaa ctgcattatt aaatgagtgg    240
cgtgctgatt tagaaaatgg tatttattct gctgattacg agaatcctta ttatgataat    300
agtacatatg cttctcactt ttatgatccg gatactggaa caacatatat tccttttgcg    360
aaacatgcaa aagaaacagg cgcaaaatat tttaaccttg ctggtcaagc ataccaaaat    420
caagatatgc agcaagcatt cttctactta ggattatcgc ttcattattt aggagatgtg    480
aatcagccaa tgcatgcagc aaactttacg aatctttctt atccaatggg tttccattct    540
aaatacgaaa attttgttga tacaataaaa aataactata ttgtttcaga tagcaatgga    600
tattggaatt ggaaaggagc aaacccagaa gattggattg aaggagcagc ggtagcagct    660
aaacaagatt atcctggcgt tgtgaacgat acgacaaaag attggtttgt aaaagcagcc    720
gtatctcaag aatatgcaga taaatggcgt gcggaagtaa caccggtgac aggaaagcgt    780
ttaatggaag cgcagcgcgt tacagctggt tatattcatt tgtggtttga tacgtatgta    840
aatcgctaa                                                            849
<210>2
<211>282
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(24)
<400>2
Met Lys Lys Lys Val Leu Ala Leu Ala Ala Met Val Ala Leu Ala Ala
 1               5                  10                  15
Pro Val Gln Ser Val Val Phe Ala Gln Thr Asn Asn Ser Glu Ser Pro
            20                  25                  30
Ala Pro Ile Leu Arg Trp Ser Ala Glu Asp Lys His Asn Glu Gly Ile
        35                  40                  45
Asn Ser His Leu Trp Ile Val Asn Arg Ala Ile Asp Ile Met Ser Arg
    50                  55                  60
Asn Thr Thr Ile Val Asn Pro Asn Glu Thr Ala Leu Leu Asn Glu Trp
65                  70                  75                  80
Arg Ala Asp Leu Glu Asn Gly Ile Tyr Ser Ala Asp Tyr Glu Asn Pro
                85                  90                  95
Tyr Tyr Asp Asn Ser Thr Tyr Ala Ser His Phe Tyr Asp Pro Asp Thr
            100                 105                 110
Gly Thr Thr Tyr Ile Pro Phe Ala Lys His Ala Lys Glu Thr Gly Ala
        115                 120                 125
Lys Tyr Phe Asn Leu Ala Gly Gln Ala Tyr Gln Asn Gln Asp Met Gln
    130                 135                 140
Gln Ala Phe Phe Tyr Leu Gly Leu Ser Leu His Tyr Leu Gly Asp Val
145                 150                 155                 160
Asn Gln Pro Met His Ala Ala Asn Phe Thr Asn Leu Ser Tyr Pro Met
                165                 170                 175
Gly Phe His Ser Lys Tyr Glu Asn Phe Val Asp Thr Ile Lys Asn Asn
            180                 185                 190
Tyr Ile Val Ser Asp Ser Asn Gly Tyr Trp Asn Trp Lys Gly Ala Asn
        195                 200                 205
Pro Glu Asp Trp Ile Glu Gly Ala Ala Val Ala Ala Lys Gln Asp Tyr
    210                 215                 220
Pro Gly Val Val Asn Asp Thr Thr Lys Asp Trp Phe Val Lys Ala Ala
225                 230                 235                 240
Val Ser Gln Glu Tyr Ala Asp Lys Trp Arg Ala Glu Val Thr Pro Val
                245                 250                 255
Thr Gly Lys Arg Leu Met Glu Ala Gln Arg Val Thr Ala Gly Tyr Ile
            260                 265                 270
His Leu Trp Phe Asp Thr Tyr Val Asn Arg
        275                 280
<210>3
<211>852
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>3
atgaaaagaa aaattttagc tatagcttcc gtaattgctt taacagctcc tatccaaagt      60
gtggcgtttg cgcatgaaaa tggtcaccaa gatccaccaa ttgctctaaa gtggtcagca     120
gaatctatac ataatgaagg agtaagttct catttatgga ttgtaaacag agccattgat     180
attatgtccc aaaatacgac tgttgtgaag caaaatgaga cagctctatt aaatgaatgg     240
cgtacggatc tagagaaagg catttactct gcggattatg aaaacccata ctatgataat     300
tccacattcg cttcacactt ctatgatcct gattcaggaa aaacgtatat tccatttgct     360
aaacaagcaa agcaaacagg agcgaaatat tttaaattag ctggtgaagc ttatcaaaat     420
aaagatctga aaaacgcatt cttttattta ggattatcac ttcactattt aggggatgtc     480
aaccaaccaa tgcatgcagc aaactttact aatatttcgc atccatttgg cttccactca     540
aaatatgaaa atttcgttga tacagtgaaa gacaattata gagtaacgga tggaaatggc     600
tattggaatt ggcaaagtgc aaatccagaa gagtgggttc atgcatcagc atcagcagca     660
aaagctgatt ttccatcaat tgttaatgat aagacgaaaa attggttcct aaaagcagct     720
gtatcacaag actctgctga taaatggcgt gcagaagtaa caccgataac aggaaaacgt     780
ttaatggaag cgcagcgtgt tacagctgga tatatccatt tatggtttga tacgtacgtg     840
aataacaaat aa                                                         852
<210>4
<211>283
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(24)
<400>4
Met Lys Arg Lys Ile Leu Ala Ile Ala Ser Val Ile Ala Leu Thr Ala
 1               5                  10                  15
Pro Ile Gln Ser Val Ala Phe Ala His Glu Asn Gly His Gln Asp Pro
            20                  25                  30
Pro Ile Ala Leu Lys Trp Ser Ala Glu Ser Ile His Asn Glu Gly Val
        35                  40                  45
Ser Ser His Leu Trp Ile Val Asn Arg Ala Ile Asp Ile Met Ser Gln
    50                  55                  60
Asn Thr Thr Val Val Lys Gln Asn Glu Thr Ala Leu Leu Asn Glu Trp
65                  70                  75                  80
Arg Thr Asp Leu Glu Lys Gly Ile Tyr Ser Ala Asp Tyr Glu Asn Pro
                85                  90                  95
Tyr Tyr Asp Asn Ser Thr Phe Ala Ser His Phe Tyr Asp Pro Asp Ser
            100                 105                 110
Gly Lys Thr Tyr Ile Pro Phe Ala Lys Gln Ala Lys Gln Thr Gly Ala
        115                 120                 125
Lys Tyr Phe Lys Leu Ala Gly Glu Ala Tyr Gln Asn Lys Asp Leu Lys
    130                 135                 140
Asn Ala Phe Phe Tyr Leu Gly Leu Ser Leu His Tyr Leu Gly Asp Val
145                 150                 155                 160
Asn Gln Pro Met His Ala Ala Asn Phe Thr Asn Ile Ser His Pro Phe
                165                 170                 175
Gly Phe His Ser Lys Tyr Glu Asn Phe Val Asp Thr Val Lys Asp Asn
            180                 185                 190
Tyr Arg Val Thr Asp Gly Asn Gly Tyr Trp Asn Trp Gln Ser Ala Asn
        195                 200                 205
Pro Glu Glu Trp Val His Ala Ser Ala Ser Ala Ala Lys Ala Asp Phe
    210                 215                 220
Pro Ser Ile Val Asn Asp Lys Thr Lys Asn Trp Phe Leu Lys Ala Ala
225                 230                 235                 240
Val Ser Gln Asp Ser Ala Asp Lys Trp Arg Ala Glu Val Thr Pro Ile
                245                 250                 255
Thr Gly Lys Arg Leu Met Glu Ala Gln Arg Val Thr Ala Gly Tyr Ile
            260                 265                 270
His Leu Trp Phe Asp Thr Tyr Val Asn Asn Lys
        275                 280
<210>5
<211>843
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>5
atgaaaagaa aaattttagc tatagcttct gtaattgctt taacagctcc tattcaaagt     60
gtggcgtttg cgcatgaatc tgatgggcct attgctttaa gatggtcagc ggaatctgta    120
cataatgaag gagtaagttc tcatttatgg attgtaaaca gagcaattga tattatgtcc    180
caaaatacga ctgtggtgaa gcaaaatgag acagctctat taaatgaatg gcgtacgaat    240
ttggaggaag gtatttattc tgcagattat aaaaacccat actatgataa ttccacattc    300
gcttcacact tctatgatcc tgattcagaa aaaacgtata ttccatttgc taaacaagca    360
aagcaaacgg gagcaaagta ttttaaatta gctggtgaag cttatcaaaa taaagatctg    420
aaaaatgcat tcttttattt aggattatca cttcattatt taggggatgt caatcaacca    480
atgcatgcag caaactttac taacatttcg catccatttg gcttccactc aaaatatgaa    540
aacttcgttg atacagtgaa agacaattat agagtaacag atggagatgg ctattggaat    600
tggaaaagtg caaatccaga agagtgggtt catgcatcag catcagcagc aaaagctgat    660
ttcccatcaa ttgttaatga taatacgaaa agttggttcc taaaagcagc ggtatcacaa    720
gactctgctg acaaatggcg tgctgaagta acaccggtaa caggaaaacg tttaatggaa    780
gcacagcgta ttacagctgg atatattcat ttatggtttg atacgtacgt gaataacaaa    840
taa                                                                  843
<210>6
<211>280
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(24)
<400>6
Met Lys Arg Lys Ile Leu Ala Ile Ala Ser Val Ile Ala Leu Thr Ala
 1               5                  10                  15
Pro Ile Gln Ser Val Ala Phe Ala His Glu Ser Asp Gly Pro Ile Ala
            20                  25                  30
Leu Arg Trp Ser Ala Glu Ser Val His Asn Glu Gly Val Ser Ser His
        35                  40                  45
Leu Trp Ile Val Asn Arg Ala Ile Asp Ile Met Ser Gln Asn Thr Thr
    50                  55                  60
Val Val Lys Gln Asn Glu Thr Ala Leu Leu Asn Glu Trp Arg Thr Asn
65                  70                  75                  80
Leu Glu Glu Gly Ile Tyr Ser Ala Asp Tyr Lys Asn Pro Tyr Tyr Asp
                85                  90                  95
Asn Ser Thr Phe Ala Ser His Phe Tyr Asp Pro Asp Ser Glu Lys Thr
            100                 105                 110
Tyr Ile Pro Phe Ala Lys Gln Ala Lys Gln Thr Gly Ala Lys Tyr Phe
        115                 120                 125
Lys Leu Ala Gly Glu Ala Tyr Gln Asn Lys Asp Leu Lys Asn Ala Phe
    130                 135                 140
Phe Tyr Leu Gly Leu Ser Leu His Tyr Leu Gly Asp Val Asn Gln Pro
145                 150                 155                 160
Met His Ala Ala Asn Phe Thr Asn Ile Ser His Pro Phe Gly Phe His
                165                 170                 175
Ser Lys Tyr Glu Asn Phe Val Asp Thr ValLys Asp Asn Tyr Arg Val
            180                 185                 190
Thr Asp Gly Asp Gly Tyr Trp Asn Trp Lys Ser Ala Asn Pro Glu Glu
        195                 200                 205
Trp Val His Ala Ser Ala Ser Ala Ala Lys Ala Asp Phe Pro Ser Ile
    210                 215                 220
Val Asn Asp Asn Thr Lys Ser Trp Phe Leu Lys Ala Ala Val Ser Gln
225                 230                 235                 240
Asp Ser Ala Asp Lys Trp Arg Ala Glu Val Thr Pro Val Thr Gly Lys
                245                 250                 255
Arg Leu Met Glu Ala Gln Arg Ile Thr Ala Gly Tyr Ile His Leu Trp
            260                 265                 270
Phe Asp Thr Tyr Val Asn Asn Lys
        275                 280
<210>7
<211>963
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>7
gtgattactt tgataaaaaa atgtttatta gtattgacga tgactctatt gttaggggtt     60
ttcgtaccgc tgcagccatc acatgctact gaaaattatc caaatgattt taaactgttg    120
caacataatg tatttttatt gcctgaatca gtttcttatt ggggtcagga cgaacgtgca    180
gattatatga gtaatgcaga ttacttcaag ggacatgatg ctctgctctt aaatgagctt    240
tttgacaatg gaaattcgaa catgctgcta atgaacttat ccacggaata tccatatcaa    300
acgccagtgc ttggccgttc gatgagtgga tgggatgaaa ctagaggaag ctattctaat    360
tttgtacccg aagatggcgg tgtagcaatt atcagtaaat ggccaatcgt ggagaaaata    420
cagcatgttt acgcgaatgg ttgcggtgca gactattatg caaataaagg atttgtttat    480
gcaaaagtac aaaaagggga taaattctat catcttatca gcactcatgc tcaagccgaa    540
gatactgggt gtgatcaggg tgaaggagca gaaattcgtc attcacagtt tcaagaaatc    600
aacgacttta ttaaaaataa aaacattccg aaagatgaag tggtatttat tggtggtgac    660
tttaatgtga tgaagagtga cacaacagag tacaatagca tgttatcaac attaaatgtc    720
aatgcgccta ccgaatattt agggcatagc tctacttggg acccagaaac gaacagcatt    780
acaggttaca attaccctga ttatgcgcca cagcatttag attatatttt tgtggaaaaa    840
gatcataaac aaccaagttc atgggtaaat gaaacgatta ctccgaagtc tccaacttgg    900
aaggcaatct atgagtataa tgattattcc gatcactatc ctgttaaagc atacgtaaaa    960
taa                                                                  963
<210>8
<211>320
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(29)
<400>8
Met Ile Thr Leu Ile Lys Lys Cys Leu Leu Val Leu Thr Met Thr Leu
 1               5                  10                  15
Leu Leu Gly Val Phe Val Pro Leu Gln Pro Ser His Ala Thr Glu Asn
            20                  25                  30
Tyr Pro Asn Asp Phe Lys Leu Leu Gln His Asn Val Phe Leu Leu Pro
        35                  40                  45
Glu Ser Val Ser Tyr Trp Gly Gln Asp Glu Arg Ala Asp Tyr Met Ser
    50                  55                  60
Asn Ala Asp Tyr Phe Lys Gly His Asp Ala Leu Leu Leu Asn Glu Leu
65                  70                  75                  80
Phe Asp Asn Gly Asn Ser Asn Met Leu Leu Met Asn Leu Ser Thr Glu
                85                  90                  95
Tyr Pro Tyr Gln Thr Pro Val Leu Gly Arg Ser Met Ser Gly Trp Asp
            100                 105                 110
Glu Thr Arg Gly Ser Tyr Ser Asn Phe Val Pro Glu Asp Gly Gly Val
        115                 120                 125
Ala Ile Ile Ser Lys Trp Pro Ile Val Glu Lys Ile Gln His Val Tyr
    130                 135                 140
Ala Asn Gly Cys Gly Ala Asp Tyr Tyr Ala Asn Lys Gly Phe Val Tyr
145                 150                 155                 160
Ala Lys Val Gln Lys Gly Asp Lys Phe Tyr His Leu Ile Ser Thr His
                165                 170                 175
Ala Gln Ala Glu Asp Thr Gly Cys Asp Gln Gly Glu Gly Ala Glu Ile
            180                 185                 190
Arg His Ser Gln Phe Gln Glu Ile Asn Asp Phe Ile Lys Asn Lys Asn
        195                 200                 205
Ile Pro Lys Asp Glu Val Val Phe Ile Gly Gly Asp Phe Asn Val Met
    210                 215                 220
Lys Ser Asp Thr Thr Glu Tyr Asn Ser Met Leu Ser Thr Leu Asn Val
225                 230                 235                 240
Asn Ala Pro Thr Glu Tyr Leu Gly His Ser Ser Thr Trp Asp Pro Glu
                245                 250                 255
Thr Asn Ser Ile Thr Gly Tyr Asn Tyr Pro Asp Tyr Ala Pro Gln His
            260                 265                 270
Leu Asp Tyr Ile Phe Val Glu Lys Asp His Lys Gln Pro Ser Ser Trp
        275                 280                 285
Val Asn Glu Thr Ile Thr Pro Lys Ser Pro Thr Trp Lys Ala Ile Tyr
    290                 295                 300
Glu Tyr Asn Asp Tyr Ser Asp His Tyr Pro Val Lys Ala Tyr Val Lys
305                 310                 315                 320
<210>9
<211>999
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>9
atgaaattac tgcgtgtctt tgtgtgcgtt tttgctttac tcagcgcaca cagcaaagcc     60
gatacactta aagtaatggc ttataatatt atgcaactaa acgtacaaga ttgggatcaa    120
gcaaatcgtg cacagcgctt gccaaacgtc atatctcaat taagtgacag tcctgatgtc    180
attcttatca gcgaagcgtt tagcagccaa tcagaatctg cgttagcgca acttgctcaa    240
ctttaccctt atcaaactcc caatgttggc gaagactgta gtggcgctgg ctggcaaagc    300
ttaacgggta actgctcgaa tagccccttt gtgatccgcg gtggagtggt gattttatct    360
aagtacccca tcattacgca aaaagcccat gtgtttaata acagcctgac tgatagttgg    420
gattatttag caaacaaagg tttcgcttat gttgaaatag aaaaacatgg caaacgttac    480
caccttattg gcacgcattt acaagcaacg catgatggcg acacagaagc tgagcatatt    540
gtgagaatgg gtcaattaca agagatacaa gatttcattc aaagcgagca aattcacact    600
tctgagccgg tcattatcgg cggtgatatg aacgtagagt ggagcaagca atctgaaatt    660
acagatatgc tcgaagtggt tcgcagccgt ctaattttca acacacctga agttggctct    720
ttctctgcaa aacacaactg gtttaccaaa gctaacgcct actatttcga ctacagctta    780
gagtataacg acacgctcga ttatgtactt tggcatgcag accataagca acccaccaat    840
accccagaaa tgttagtacg ttacccaaaa gcagagcgtg acttttactg gcgttactta    900
cgcggaaatt ggaacttacc ttctggccgt tattatcatg atggatacta taacgaactg    960
tctgatcact acccagtgca agttaacttt gaattttaa                           999
<210>10
<211>332
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(20)
<400>10
Met Lys Leu Leu Arg Val Phe Val Cys Val Phe Ala Leu Leu Ser Ala
 1               5                  10                  15
His Ser Lys Ala Asp Thr Leu Lys Val Met Ala Tyr Asn Ile Met Gln
            20                  25                  30
Leu Asn Val Gln Asp Trp Asp Gln Ala Asn Arg Ala Gln Arg Leu Pro
        35                  40                  45
Asn Val Ile Ser Gln Leu Ser Asp Ser Pro Asp Val Ile Leu Ile Ser
    50                  55                  60
Glu Ala Phe Ser Ser Gln Ser Glu Ser Ala Leu Ala Gln Leu Ala Gln
65                  70                  75                  80
Leu Tyr Pro Tyr Gln Thr Pro Asn Val Gly Glu Asp Cys Ser Gly Ala
                85                  90                  95
Gly Trp Gln Ser Leu Thr Gly Asn Cys Ser Asn Ser Pro Phe Val Ile
            100                 105                 110
Arg Gly Gly Val Val Ile Leu Ser Lys Tyr Pro Ile Ile Thr Gln Lys
        115                 120                 125
Ala His Val Phe Asn Asn Ser Leu Thr Asp Ser Trp Asp Tyr Leu Ala
    130                 135                 140
Asn Lys Gly Phe Ala Tyr Val Glu Ile Glu Lys His Gly Lys Arg Tyr
145                 150                 155                 160
His Leu Ile Gly Thr His Leu Gln Ala Thr His Asp Gly Asp Thr Glu
                165                 170                 175
Ala Glu His Ile Val Arg Met Gly Gln Leu Gln Glu Ile Gln Asp Phe
            180                 185                 190
Ile Gln Ser Glu Gln Ile His Thr Ser Glu Pro Val Ile Ile Gly Gly
        195                 200                 205
Asp Met Asn Val Glu Trp Ser Lys Gln Ser Glu Ile Thr Asp Met Leu
    210                 215                 220
Glu Val Val Arg Ser Arg Leu Ile Phe Asn Thr Pro Glu Val Gly Ser
225                 230                 235                 240
Phe Ser Ala Lys His Asn Trp Phe Thr Lys Ala Asn Ala Tyr Tyr Phe
                245                 250                 255
Asp Tyr Ser Leu Glu Tyr Asn Asp Thr Leu Asp Tyr Val Leu Trp His
            260                 265                 270
Ala Asp His Lys Gln Pro Thr Asn Thr Pro Glu Met Leu Val Arg Tyr
        275                 280                 285
Pro Lys Ala Glu Arg Asp Phe Tyr Trp Arg Tyr Leu Arg Gly Asn Trp
    290                 295                 300
Asn Leu Pro Ser Gly Arg Tyr Tyr His Asp Gly Tyr Tyr Asn Glu Leu
305                 310                 315                 320
Ser Asp His Tyr Pro Val Gln Val Asn Phe Glu Phe
                325                 330
<210>11
<211>1041
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>11
atggcttcac aattcaggaa tctggttttt gaaggaggcg gtgtaaaggg aatcgcctat     60
atcggcgcca tgcaggtgct ggagcagcgc ggacatttgg agcacgttgt gagggtggga    120
ggaacaagtg caggggctat taacgctctc attttttcgc tgggctttac cattaaagag    180
cagcaggata ttctcaattc caccaacttc agggagttta tggacagctc tttcggattt    240
gtgcgaaact tcagaaggct ctggagtgaa ttcgggtgga accgcggtga tgtgttttcg    300
gagtgggcag gagagctggt gaaagagaaa ctcggcaaga agaacgccac cttcggcgat    360
ctgaaaaaag cgaagcgccc cgatctctac gttatcggaa ccaacctctc caccgggttt    420
tccgagactt tttcgcatga acgccacgcc aacatgccgc tggtggatgc ggtgcggatc    480
agcatgtcga tcccgctctt ttttgcggca cgcagacttg gcaaacgaag cgatgtgtat    540
gtggatggag gtgttatgct caactacccg gtaaagctgt tcgacaggga gaaatacatc    600
gatttggaga aggagaaaga ggcagcccgc tacgtggagt actacaatca agagaatgcc    660
cggtttctgc ttgagcggcc cggccgaagc ccgtacgttt acaaccggca gaccctaggc    720
ctgcggctcg actcgcagga agagatcggc ctgttccgtt acgatgagcc gctgaagggc    780
aaacagatca accgcttccc cgaatatgcc aaagccctga tcggtgcact gatgcaggtg    840
caggagaaca tccacctgaa aagcgacgac tggcagcgaa cgctctacat caacacgctg    900
gatgtgggta ccacagattt cgacattaat gacgagaaga aaaaagtgct ggtgaatgag    960
ggaatcaagg gagcggaaac ctacttccgc tggtttgagg atcccgaagc taaaccggtg   1020
aacaaggtgg atttggtctg a                                             1041
<210>12
<211>346
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>12
Met Ala Ser Gln Phe Arg Asn Leu Val Phe Glu Gly Gly Gly Val Lys
 1               5                  10                  15
Gly Ile Ala Tyr Ile Gly Ala Met Gln Val Leu Glu Gln Arg Gly His
            20                  25                  30
Leu Glu His Val Val Arg Val Gly Gly Thr Ser Ala Gly Ala Ile Asn
        35                  40                  45
Ala Leu Ile Phe Ser Leu Gly Phe Thr Ile Lys Glu Gln Gln Asp Ile
    50                  55                  60
Leu Asn Ser Thr Asn Phe Arg Glu Phe Met Asp Ser Ser Phe Gly Phe
65                  70                  75                  80
Val Arg Asn Phe Arg Arg Leu Trp Ser Glu Phe Gly Trp Asn Arg Gly
                85                  90                  95
Asp Val Phe Ser Glu Trp Ala Gly Glu Leu Val Lys Glu Lys Leu Gly
            100                 105                 110
Lys Lys Asn Ala Thr Phe Gly Asp Leu Lys Lys Ala Lys Arg Pro Asp
        115                 120                 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ser Glu Thr Phe
    130                 135                 140
Ser His Glu Arg His Ala Asn Met Pro Leu Val Asp Ala Val Arg Ile
145                 150                 155                 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Arg Arg Leu Gly Lys Arg
                165                 170                 175
Ser Asp Val Tyr Val Asp Gly Gly Val Met Leu Asn Tyr Pro Val Lys
            180                 185                 190
Leu Phe Asp Arg Glu Lys Tyr Ile Asp Leu Glu Lys Glu Lys Glu Ala
        195                 200                 205
Ala Arg Tyr Val Glu Tyr Tyr Asn Gln Glu Asn Ala Arg Phe Leu Leu
    210                 215                 220
Glu Arg Pro Gly Arg Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225                 230                 235                 240
Leu Arg Leu Asp Ser Gln Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu
                245                 250                 255
Pro Leu Lys Gly Lys Gln Ile Asn Arg Phe Pro Glu Tyr Ala Lys Ala
            260                 265                 270
Leu Ile Gly Ala Leu Met Gln Val Gln Glu Asn Ile His Leu Lys Ser
        275                 280                 285
Asp Asp Trp Gln Arg Thr Leu Tyr Ile Asn Thr Leu Asp Val Gly Thr
    290                 295                 300
Thr Asp Phe Asp Ile Asn Asp Glu Lys Lys Lys Val Leu Val Asn Glu
305                 310                 315                 320
Gly Ile Lys Gly Ala Glu Thr Tyr Phe Arg Trp Phe Glu Asp Pro Glu
                325                 330                 335
Ala Lys Pro Val Asn Lys Val Asp Leu Val
            340                 345
<210>13
<211>1038
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>13
atgacaacac aatttagaaa cttgatattt gaaggcggcg gtgtaaaagg tgttgcttac     60
attggcgcca tgcagattct cgaaaatcgt ggcgtgttgc aagatattca cagagtcgga    120
gggtgcagtg cgggtgcgat caacgcgctg atttttgcgc tgggttacac ggtccgtgag    180
caaaaagaga tcttacaagc cacggatttt aaccagttta tggataactc ttggggtgtt    240
attcgtgata ttcgcaggct tgctcgagac tttggctggc acaagggtga cttctttaat    300
agctggatag gtgatttgat tcatcgtcgt ttggggaatc gccgagcgac gttcaaagat    360
ctgcaaaagg ccaagcttcc tgatctttat gtcatcggta ctaatctgtc tacagggtat    420
gcagaggttt tttcagccga aagacacccc gatatggagc tagcgacagc ggtgcgtatc    480
tccatgtcga taccgctgtt ctttgcggcc gtgcgtcacg gtgaacgaca agatgtgtat    540
gtcgatgggg gtgttcaact taactatccg attaaactgt ttgatcggga gcgttacatt    600
gatctggtca aagatcccgg tgccgttcgg cgaacgggtt attacaacaa agaaaacgct    660
cgctttcagc ttgagcggcc gggccatagc ccctatgttt acaatcgcca gaccttgggt    720
ttgcgactgg atagtcgaga ggagataggg ctctttcgtt atgacgaacc cctcaagggc    780
aaacccatta agtccttcac tgactacgct cgacaacttt tcggtgcgtt gatgaatgca    840
caggaaaaca ttcatctaca tggcgatgat tgggcgcgca cggtctatat cgatacattg    900
gatgtgggta cgacggattt caatctttct gatgcaacca agcaagcact gattgagcaa    960
ggaattaacg gcaccgaaaa ttatttcgac tggtttgata atccgttaga gaagcctgtg   1020
aatagagtgg agtcatag                                                 1038
<210>14
<211>345
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>14
Met Thr Thr Gln Phe Arg Asn Leu Ile Phe Glu Gly Gly Gly Val Lys
 1               5                  10                  15
Gly Val Ala Tyr Ile Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val
            20                  25                  30
Leu Gln Asp Ile His Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn
        35                  40                  45
Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile
    50                  55                  60
Leu Gln Ala Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val
65                  70                  75                  80
Ile Arg Asp Ile Arg Arg Leu Ala Arg Asp Phe Gly Trp His Lys Gly
                85                  90                  95
Asp Phe Phe Asn Ser Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly
            100                 105                 110
Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Lys Ala Lys Leu Pro Asp
        115                 120                 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Tyr Ala Glu Val Phe
    130                 135                 140
Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile
145                 150                 155                 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Glu Arg
                165                 170                 175
Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys
            180                 185                 190
Leu Phe Asp Arg Glu Arg Tyr Ile Asp Leu Val Lys Asp Pro Gly Ala
        195                 200                 205
Val Arg Arg Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu
    210                 215                 220
Glu Arg Pro Gly His Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225                 230                 235                 240
Leu Arg Leu Asp Ser Arg Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu
                245                 250                 255
Pro Leu Lys Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln
            260                 265                 270
Leu Phe Gly Ala Leu Met Asn Ala Gln Glu Asn Ile His Leu His Gly
        275                 280                 285
Asp Asp Trp Ala Arg Thr Val Tyr Ile Asp Thr Leu Asp Val Gly Thr
    290                 295                 300
Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln
305                 310                 315                 320
Gly Ile Asn Gly Thr Glu Asn Tyr Phe Asp Trp Phe Asp Asn Pro Leu
                325                 330                 335
Glu Lys Pro Val Asn Arg Val Glu Ser
            340                 345
<210>15
<211>1344
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>15
atgctggtca tcattcatgg ctggagcgat gaggcgggct cgttcaagac cctggccaga     60
cgtttggcca aggcgccacc cgagggcctc gggacgcagg tcacggaaat ccatctgggt    120
gattatgtgt ccctggatga ccaggtgacg ttcaatgatc tggtcgatgc catggccaga    180
gcctggagcg atcgtggtct gcccacggcc ccgcgcagcg tcgatgccgt cgtgcacagc    240
accggcggcc tggtgatccg cgactggctc acgcagctgt acacgccgga aacagccccc    300
attcgtcgcc tgctgatgct cgctccggcc aatttcggct cgccgctggc acacaccgga    360
cgcagcatga tcggccgggt caccaagggc tggaagggca cgcggctctt tgaaacgggc    420
aagcacattc tcaaagggct cgaactggcc agcccctacg cctgggcgct ggccgaacgc    480
gatctgttca gcgatcagaa ctattatggc gccgggcgca tcctgtgcac tgtcctggtg    540
ggcaacgccg gttatcgcgg catcagcgcc gtcgccaacc ggcccggcac ggacggcacc    600
gtgcgcgtca gcagcgccaa tctccaagcg gccaggatgc tgctcgattt cagcgccagt    660
ccacaggctg agccggaatt caccctgcac gacagcaccg cggaaattgc cttcggcatc    720
gccgacgagg aagaccacag caccatcgcc gccaaggatc gcggcccgcg caaggcagtc    780
acctgggaac tgattctcaa agccctgcag atcgaggatg caagctttgc tcaatggtgc    840
cggcagatgc aggagcattc cgcggccgtg acggaaacgg cggaaaagcg ccgcaatgtt    900
cactacaaca gcttccagaa taccgtcgtg cgcgtggtgg acaaccacgg tgccgccgtg    960
caggattatc tcatcgagtt ttacatgaat gatgatcgca aactccgcga tcagcgcctc   1020
acccagcgcc tgcaggagca ggtgattacc aacgtgcacg gctacggtga cgacaagtcc   1080
tatcgcagca tgctgatcaa ctgcacggag ctctatgcgc tgatgtccag accgcaggat   1140
cgcctgaaca tcagcatcac cgcctatccg gatctctcca agggactggt ggggtatcgc   1200
acctacacgg acgaggatat cggttccctc tctctggatg cagcgcagat ccgaaagctc   1260
tttaagccgc accgtaccct gttgatgaca ctgtgcctgc aacgctatca gaaagatgat   1320
gtgttccgat tcagggatgt ttga                                          1344
<210>16
<211>447
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>16
Met Leu Val Ile Ile His Gly Trp Ser Asp Glu Ala Gly Ser Phe Lys
 1               5                  10                  15
Thr Leu Ala Arg Arg Leu Ala Lys Ala Pro Pro Glu Gly Leu Gly Thr
            20                  25                  30
Gln Val Thr Glu Ile His Leu Gly Asp Tyr Val Ser Leu Asp Asp Gln
        35                  40                  45
Val Thr Phe Asn Asp Leu Val Asp Ala Met Ala Arg Ala Trp Ser Asp
    50                  55                  60
Arg Gly Leu Pro Thr Ala Pro Arg Ser Val Asp Ala Val Val His Ser
65                  70                  75                  80
Thr Gly Gly Leu Val Ile Arg Asp Trp Leu Thr Gln Leu Tyr Thr Pro
                85                  90                  95
Glu Thr Ala Pro Ile Arg Arg Leu Leu Met Leu Ala Pro Ala Asn Phe
            100                 105                 110
Gly Ser Pro Leu Ala His Thr Gly Arg Ser Met Ile Gly Arg Val Thr
        115                 120                 125
Lys Gly Trp Lys Gly Thr Arg Leu Phe Glu Thr Gly Lys His Ile Leu
    1301                 35                 140
Lys Gly Leu Glu Leu Ala Ser Pro Tyr Ala Trp Ala Leu Ala Glu Arg
145                 150                 155                 160
Asp Leu Phe Ser Asp Gln Asn Tyr Tyr Gly Ala Gly Arg Ile Leu Cys
                165                 170                 175
Thr Val Leu Val Gly Asn Ala Gly Tyr Arg Gly Ile Ser Ala Val Ala
            180                 185                 190
Asn Arg Pro Gly Thr Asp Gly Thr Val Arg Val Ser Ser Ala Asn Leu
        195                 200                 205
Gln Ala Ala Arg Met Leu Leu Asp Phe Ser Ala Ser Pro Gln Ala Glu
    210                 215                 220
Pro Glu Phe Thr Leu His Asp Ser Thr Ala Glu Ile Ala Phe Gly Ile
225                  30                 235                 240
Ala Asp Glu Glu Asp His Ser Thr Ile Ala Ala Lys Asp Arg Gly Pro
                245                 250                 255
Arg Lys Ala Val Thr Trp Glu Leu Ile Leu Lys Ala Leu Gln Ile Glu
            260                 265                 270
Asp Ala Ser Phe Ala Gln Trp Cys Arg Gln Met Gln Glu His Ser Ala
        275                 280                 285
Ala Val Thr Glu Thr Ala Glu Lys Arg Arg Asn Val His Tyr Asn Ser
    290                 295                 300
Phe Gln Asn Thr Val Val Arg Val Val Asp Asn His Gly Ala Ala Val
305                 310                 315                 320
Gln Asp Tyr Leu Ile Glu Phe Tyr Met Asn Asp Asp Arg Lys Leu Arg
                325                 330                 335
Asp Gln Arg Leu Thr Gln Arg Leu Gln Glu Gln Val Ile Thr Asn Val
            340                 345                 350
His Gly Tyr Gly Asp Asp Lys Ser Tyr Arg Ser Met Leu Ile Asn Cys
        355                 360                 365
Thr Glu Leu Tyr Ala Leu Met Ser Arg Pro Gln Asp Arg Leu Asn Ile
    370                 375                 380
Ser Ile Thr Ala Tyr Pro Asp Leu Ser Lys Gly Leu Val Gly Tyr Arg
385                 390                 395                 400
Thr Tyr Thr Asp Glu Asp Ile Gly Ser Leu Ser Leu Asp Ala Ala Gln
                405                 410                 415
Ile Arg Lys Leu Phe Lys Pro His Arg Thr Leu Leu Met Thr Leu Cys
            420                 425                 430
Leu Gln Arg Tyr Gln Lys Asp Asp Val Phe Arg Phe Arg Asp Val
        435                 440                 445
<210>17
<211>1137
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>17
atgaaaaaaa gccttcaaca acatcttgcc gctgacggca gcccaaagaa tattctttct     60
ctcgacgggg gaggaatcag aggggctttg acccttggtt ttctcaaaaa aatagaaagc    120
atcctgcagg aaaaacatgg gaaggactat ctcctttgcg atcactttga tttgatcggt    180
ggaacttcca caggctccat cattgcagca gcattggcta taggcatgac agtggaggaa    240
atcactaaaa tgtatatgga tctgggcgga aaaattttcg gcaagaaaag gagtttctgg    300
agaccctggg aaactgcgaa atacttgaaa gcaggatatg accacaaagc tcttgaaaag    360
agtctgaaag atgctttcca ggattttctt ttaggaagtg accaaattag aacaggtctt    420
tgtatagtag ccaaaagagc agataccaat agtatatggc cattgattaa ccaccccaaa    480
ggaaaattct atgattcaga acaaggcaaa aacaaaaata tccccttatg gcaggcagta    540
agggcgagta ccgctgctcc aacctatttc gctccacaat taatagatgt gggtgatggt    600
caaaaggctg cttttgtgga cggaggggta agcatggcca ataaccccgc attaaccctg    660
ttaaaagtgg ctacacttaa aggttttcct tttcattggc caatgggaga agacaaactg    720
accatagttt cagtaggcac cggatatagt gttttccaaa gacaaaaggg tgaaatcacc    780
aaagcttcct tattaacttg ggccaaaaac gtcccggaaa tgttgatgca ggatgcttct    840
tggcagaatc agaccatact tcagtggatt tctaaatccc ccactgcaca ttccatagat    900
atggaaatgg aagaccttag agatgacttt ctaggcggaa gaccactcat caaatacctc    960
aggtacaact tccccttgac agtaaatgat ctcaatggat tgaagcttgg gaaaagcttt   1020
acccaaaaag aggtcgaaga tttggtggaa atgagcaatg cacataaccg agaggagttg   1080
tataggattg gggagaaggc ggctgaaggg tcggtaaaaa aagaacattt tgaataa      1137
<210>18
<211>378
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>18
Met Lys Lys Ser Leu Gln Gln His Leu Ala Ala Asp Gly Ser Pro Lys
 1               5                  10                  15
Asn Ile Leu Ser Leu Asp Gly Gly Gly Ile Arg Gly Ala Leu Thr Leu
            20                  25                  30
Gly Phe Leu Lys Lys Ile Glu Ser Ile Leu Gln Glu Lys His Gly Lys
        35                  40                  45
Asp Tyr Leu Leu Cys Asp His Phe Asp Leu Ile Gly Gly Thr Ser Thr
    50                  55                  60
Gly Ser Ile Ile Ala Ala Ala Leu Ala Ile Gly Met Thr Val Glu Glu
65                  70                  75                  80
Ile Thr Lys Met Tyr Met Asp Leu Gly Gly Lys Ile Phe Gly Lys Lys
                85                  90                  95
Arg Ser Phe Trp Arg Pro Trp Glu Thr Ala Lys Tyr Leu Lys Ala Gly
            100                 105                 110
Tyr Asp His Lys Ala Leu Glu Lys Ser Leu Lys Asp Ala Phe Gln Asp
        115                 120                 125
Phe Leu Leu Gly Ser Asp Gln Ile Arg Thr Gly Leu Cys Ile Val Ala
    130                 135                 140
Lys Arg Ala Asp Thr Asn Ser Ile Trp Pro Leu Ile Asn His Pro Lys
145                 150                 155                 160
Gly Lys Phe Tyr Asp Ser Glu Gln Gly Lys Asn Lys Asn Ile Pro Leu
                165                 170                 175
Trp Gln Ala Val Arg Ala Ser Thr Ala Ala Pro Thr Tyr Phe Ala Pro
            180                 185                 190
Gln Leu Ile Asp Val Gly Asp Gly Gln Lys Ala Ala Phe Val Asp Gly
        195                 200                 205
Gly Val Ser Met Ala Asn Asn Pro Ala Leu Thr Leu Leu Lys Val Ala
    210                 215                 220
Thr Leu Lys Gly Phe Pro Phe His Trp Pro Met Gly Glu Asp Lys Leu
225                 230                 235                 240
Thr Ile Val Ser Val Gly Thr Gly Tyr Ser Val Phe Gln Arg Gln Lys
                245                 250                 255
Gly Glu Ile Thr Lys Ala Ser Leu Leu Thr Trp Ala Lys Asn Val Pro
            260                 265                 270
Glu Met Leu Met Gln Asp Ala Ser Trp Gln Asn Gln Thr Ile Leu Gln
        275                 280                 285
Trp Ile Ser Lys Ser Pro Thr Ala His Ser Ile Asp Met Glu Met Glu
    290                 295                 300
Asp Leu Arg Asp Asp Phe Leu Gly Gly Arg Pro Leu Ile Lys Tyr Leu
305                 310                 315                 320
Arg Tyr Asn Phe Pro Leu Thr Val Asn Asp Leu Asn Gly Leu Lys Leu
                325                 330                 335
Gly Lys Ser Phe Thr Gln Lys Glu Val Glu Asp Leu Val Glu Met Ser
            340                 345                 350
Asn Ala His Asn Arg Glu Glu Leu Tyr Arg Ile Gly Glu Lys Ala Ala
        355                 360                 365
Glu Gly Ser Val Lys Lys Glu His Phe Glu
    370                 375
<210>19
<211>1248
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>19
atgaaaaaga caacgttagt tttggctcta ttgatgccat ttggtgccgc ctccgcacaa     60
gacaatagta tgactccaga agcaatcaca tcagctcaag tcgcacaaac acaatcagcc    120
tccacctata cctacgttag gtgttggtat cgaacagacg caagccatga ttcaccagca    180
accgactggg agtgggctag aaaggaaaac ggagactatt acaccattga cggttactgg    240
tggtcatcga tctcctttaa aaatatgttc tatagcgaga ctcctcaaca agagatcaag    300
cagcgttgtg tagacacctt ggatgttcag cacgacaaag ccgacatcac ctactttgcc    360
gctgacaacc gcttctctta caaccattct atctggacta acgatcacgg ctttcaagcg    420
aaccaaatca accgaatagt cgcttttggc gatagtcttt cagacacggg caacctattt    480
aatgggtcac aatggatttt ccctaaccct aattcttggt tcttgggtca cttctctaac    540
ggcttcgttt ggactgaata cttggctaac gctaagggcg ttccactcta taactgggct    600
gtgggtggcg cagcaggaac caaccaatat gtcgctctaa ctggtgtcta tgatcaggtc    660
acttcgtacc tgacttacat gaagatggcg aaaaattatc gcccagagaa cacactattc    720
acattagagt ttggattgaa tgactttatg aattacggac gtgaagtagc tgatgtaaaa    780
gctgacttta gtagcgcact gattcgcctc accgacgctg gcgcaaaaaa cattctgttg    840
ttcaccctac cagatgcgac caaagcccct cagtttaagt actcaacggc ccaagaaatc    900
gagacagttc gtggcaagat tctggcgttc aaccagttca tcaaagaaca agcagagtac    960
tatcaaagca aaggtgacaa cgtgatccta tttgatgcgc acgctctatt ctctagcatc   1020
accagcgacc cacaaaaaca cgggttcaga aacgcaaaag atgcctgcct agatattaat   1080
cgtagtgcat ctcaagacta cctatacagc catagtctga ccaacgactg tgcaacctat   1140
ggttctgata gctatgtatt ttggggcgta acacacccaa ccacagcaac tcataaatac   1200
atcgcaacgc atatactgat gaattcaatg tcgaccttcg acttttaa                1248
<210>20
<211>415
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(19)
<400>20
Met Lys Lys Thr Thr Leu Val Leu Ala Leu Leu Met Pro Phe Gly Ala
 1               5                  10                  15
Ala Ser Ala Gln Asp Asn Ser Met Thr Pro Glu Ala Ile Thr Ser Ala
            20                  25                  30
Gln Val Ala Gln Thr Gln Ser Ala Ser Thr Tyr Thr Tyr Val Arg Cys
        35                  40                  45
Trp Tyr Arg Thr Asp Ala Ser His Asp Ser Pro Ala Thr Asp Trp Glu
    50                  55                  60
Trp Ala Arg Lys Glu Asn Gly Asp Tyr Tyr Thr Ile Asp Gly Tyr Trp
65                  70                  75                  80
Trp Ser Ser Ile Ser Phe Lys Asn Met Phe Tyr Ser Glu Thr Pro Gln
                85                  90                  95
Gln Glu Ile Lys Gln Arg Cys Val Asp Thr Leu Asp Val Gln His Asp
            100                 105                 110
Lys Ala Asp Ile Thr Tyr Phe Ala Ala Asp Asn Arg Phe Ser Tyr Asn
        115                 120                 125
His Ser Ile Trp Thr Asn Asp His Gly Phe Gln Ala Asn Gln Ile Asn
    130                 135                 140
Arg Ile Val Ala Phe Gly Asp Ser Leu Ser Asp Thr Gly Asn Leu Phe
145                 150                 155                 160
Asn Gly Ser Gln Trp Ile Phe Pro Asn Pro Asn Ser Trp Phe Leu Gly
                165                 170                 175
His Phe Ser Asn Gly Phe Val Trp Thr Glu Tyr Leu Ala Asn Ala Lys
            180                 185                 190
Gly Val Pro Leu Tyr Asn Trp Ala Val Gly Gly Ala Ala Gly Thr Asn
        195                 200                 205
Gln Tyr Val Ala Leu Thr Gly Val Tyr Asp Gln Val Thr Ser Tyr Leu
    210                 215                 220
Thr Tyr Met Lys Met Ala Lys Asn Tyr Arg Pro Glu Asn Thr Leu Phe
225                 230                 235                 240
Thr Leu Glu Phe Gly Leu Asn Asp Phe Met Asn Tyr Gly Arg Glu Val
                245                 250                 255
Ala Asp Val Lys Ala Asp Phe Ser Ser Ala Leu Ile Arg Leu Thr Asp
            260                 265                 270
Ala Gly Ala Lys Asn Ile Leu Leu Phe Thr Leu Pro Asp Ala Thr Lys
        275                 280                 285
Ala Pro Gln Phe Lys Tyr Ser Thr Ala Gln Glu Ile Glu Thr Val Arg
    290                 295                 300
Gly Lys Ile Leu Ala Phe Asn Gln Phe Ile Lys Glu Gln Ala Glu Tyr
305                 310                 315                 320
Tyr Gln Ser Lys Gly Asp Asn Val Ile Leu Phe Asp Ala His Ala Leu
                325                 330                 335
Phe Ser Ser Ile Thr Ser Asp Pro Gln Lys His Gly Phe Arg Asn Ala
            340                 345                 350
Lys Asp Ala Cys Leu Asp Ile Asn Arg Ser Ala Ser Gln Asp Tyr Leu
        355                 360                 365
Tyr Ser His Ser Leu Thr Asn Asp Cys Ala Thr Tyr Gly Ser Asp Ser
    370                 375                 380
Tyr Val Phe Trp Gly Val Thr His Pro Thr Thr Ala Thr His Lys Tyr
385                 390                 395                 400
Ile Ala Thr His Ile Leu Met Asn Ser Met Ser Thr Phe Asp Phe
                405                 410                 415
<210>21
<211>1716
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>21
atgcagcagc ataaattgag gaatttcaac aagggattga ccggcgtcgt attgagcgta     60
ttgacctcta ccagcgccat ggcttttaca caaatcggtg gcggcggcgc gattccgatg    120
ggccatgaat ggctcacgcg cagatccgca ctggaattat taaatgcaga ccatatcgtc    180
tccaacgacc cgctcgaccc acgcttgggc tggagccagg gcttggccaa aaatttggat    240
ctctccaatg cattgaacga agtgcagcgc atccagagcg ttaccaagac caacgcactt    300
tatgaaccac gctatgatga cgtgttttct gcgattgtcg gcgaacgctg ggtggacacg    360
gccggtttca acgttgcgaa ggctaccgtc ggtaaaatcg attgtttcag cgcggtcgcg    420
caagaacctg ccgatgttca gcaagaccat ttcatgcgtc gttacgatga cgtgggcgga    480
caaggtggcg ttaacgccgc acgccgcggg caacaacgtt tcatcaccca tttcatcaac    540
gccgcgatgg ccgaagaaaa aagcataaaa gcgtgggacg gcggtggata ctccacgctg    600
gaaaaagtca gccacaatta tttcttgttt ggtcgcgctg tgcatttgtt ccaggattct    660
ttcagcccgg aacacaccgt gcgtctgccg caagacaact acgaaaaagt acgtcaggta    720
aaagcctatc tgtgttccga aggcgcagag caacatacgc ataacgcgca ggatgcgatc    780
agcttcacca gcggcgacgt tatctggaag aaaaacaccc gtctggatgc cggctggagc    840
acctacaaac ccagcaatat gaaacccgtt gccttggtgg cgatggaagc ctcgaaggac    900
ttgtgggccg ccttcattcg caccatggcc gcaccgcgca gcgagcgtcg cgccattgct    960
cagcaagagg cacaaacgct ggtaaacaac tggttgtcgt tcgacgaaca ggaaatgctg   1020
agctggtacg acgaagaaac tcatcgcgat cacacttacg tgctcgaacc cggccagaac   1080
ggccccggta tttccatgtt cgattgcatg gtgggtctgg gcgtgacgtc tggcagccag   1140
gctgcgcgtg tggccgaact ggatcaacaa cgtcgccagt gcttgttcaa cgtcaaggcc   1200
accaccggtt acagcgatct gaacgatccg cacatggata tcccgtataa ctggcaatgg   1260
acgtcgacca cgcagtggaa agtgccaagc gcgagctgga cgattccgca gttgccggcc   1320
gacgcaggca agaaagtgac gatcaaaaac gccatcaacg gcaatccgct ggtagcgccg   1380
gctggcgtca aacacaacag cgatatttat tccgcgccgg gtgaagccat cgaattcatt   1440
ttcgtcggtg actacaacaa tgagtcttat ctgcgctcga aaaaagatgc ggatttgttc   1500
ttgagctaca gtgcggtatc cggcaagggc ttgctgtaca acacaccgaa tcaggcaggt   1560
tatcgcgtga aaccggcggg cgtgctgtgg acgatcgaga acacctactg gaatgatttc   1620
ctgtggttca acagttcgaa caaccgcatc tacgtaagcg gcacgggcga tgccaacaag   1680
ttacattcac agtggatcat tgacggtctg aaataa                             1716
<210>22
<211>571
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(28)
<400>22
Met Gln Gln His Lys Leu Arg Asn Phe Asn Lys Gly Leu Thr Gly Val
 1               5                  10                  15
Val Leu Ser Val Leu Thr Ser Thr Ser Ala Met Ala Phe Thr Gln Ile
            20                  25                  30
Gly Gly Gly Gly Ala Ile Pro Met Gly His Glu Trp Leu Thr Arg Arg
        35                  40                  45
Ser Ala Leu Glu Leu Leu Asn Ala Asp His Ile Val Ser Asn Asp Pro
    50                  55                  60
Leu Asp Pro Arg Leu Gly Trp Ser Gln Gly Leu Ala Lys Asn Leu Asp
65                  70                  75                  80
Leu Ser Asn Ala Leu Asn Glu Val Gln Arg Ile Gln Ser Val Thr Lys
                85                  90                  95
Thr Asn Ala Leu Tyr Glu Pro Arg Tyr Asp Asp Val Phe Ser Ala Ile
            100                 105                 110
Val Gly Glu Arg Trp Val Asp Thr Ala Gly Phe Asn Val Ala Lys Ala
        115                 120                 125
Thr Val Gly Lys Ile Asp Cys Phe Ser Ala Val Ala Gln Glu Pro Ala
    130                 135                 140
Asp Val Gln Gln Asp His Phe Met Arg Arg Tyr Asp Asp Val Gly Gly
145                 150                 155                 160
Gln Gly Gly Val Asn Ala Ala Arg Arg Gly Gln Gln Arg Phe Ile Thr
                165                 170                 175
His Phe Ile Asn Ala Ala Met Ala Glu Glu Lys Ser Ile Lys Ala Trp
            180                 185                 190
Asp Gly Gly Gly Tyr Ser Thr Leu Glu Lys Val Ser His Asn Tyr Phe
        195                 200                 205
Leu Phe Gly Arg Ala Val His Leu Phe Gln Asp Ser Phe Ser Pro Glu
    210                 215                 220
His Thr Val Arg Leu Pro Gln Asp Asn Tyr Glu Lys Val Arg Gln Val
225                 230                 235                 240
Lys Ala Tyr Leu Cys Ser Glu Gly Ala Glu Gln His Thr His Asn Ala
                245                 250                 255
Gln Asp Ala Ile Ser Phe Thr Ser Gly Asp Val Ile Trp Lys Lys Asn
            260                 265                 270
Thr Arg Leu Asp Ala Gly Trp Ser Thr Tyr Lys Pro Ser Asn Met Lys
        275                 280                 285
Pro Val Ala Leu Val Ala Met Glu Ala Ser Lys Asp Leu Trp Ala Ala
    290                 295                 300
Phe Ile Arg Thr Met Ala Ala Pro Arg Ser Glu Arg Arg Ala Ile Ala
305                 310                 315                 320
Gln Gln Glu Ala Gln Thr Leu Val Asn Asn Trp Leu Ser Phe Asp Glu
                325                 330                 335
Gln Glu Met Leu Ser Trp Tyr Asp Glu Glu Thr His Arg Asp His Thr
            340                 345                 350
Tyr Val Leu Glu Pro Gly Gln Asn Gly Pro Gly Ile Ser Met Phe Asp
        355                 360                 365
Cys Met Val Gly Leu Gly Val Thr Ser Gly Ser Gln Ala Ala Arg Val
    370                 375                 380
Ala Glu Leu Asp Gln Gln Arg Arg Gln Cys Leu Phe Asn Val Lys Ala
385                 390                 395                 400
Thr Thr Gly Tyr Ser Asp Leu Asn Asp Pro His Met Asp Ile Pro Tyr
                405                 410                 415
Asn Trp Gln Trp Thr Ser Thr Thr Gln Trp Lys Val Pro Ser Ala Ser
            420                 425                 430
Trp Thr Ile Pro Gln Leu Pro Ala Asp Ala Gly Lys Lys Val Thr Ile
        435                 440                 445
Lys Asn Ala Ile Asn Gly Asn Pro Leu Val Ala Pro Ala Gly Val Lys
    450                 455                 460
His Asn Ser Asp Ile Tyr Ser Ala Pro Gly Glu Ala Ile Glu Phe Ile
465                 470                 475                 480
Phe Val Gly Asp Tyr Asn Asn Glu Ser Tyr Leu Arg Ser Lys Lys Asp
                485                 490                 495
Ala Asp Leu Phe Leu Ser Tyr Ser Ala Val Ser Gly Lys Gly Leu Leu
            500                 505                 510
Tyr Asn Thr Pro Asn Gln Ala Gly Tyr Arg Val Lys Pro Ala Gly Val
        515                 520                 525
Leu Trp Thr Ile Glu Asn Thr Tyr Trp Asn Asp Phe Leu Trp Phe Asn
    530                 535                 540
Ser Ser Asn Asn Arg Ile Tyr Val Ser Gly Thr Gly Asp Ala Asn Lys
545                 550                 555                 560
Leu His Ser Gln Trp Ile Ile Asp Gly Leu Lys
                565                 570
<210>23
<211>1473
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>23
atgacgatcc gctcgaccga ctacgcgctg ctcgcgcagg agagctacca cgacagccag     60
gtcgatgctg acgtcaagct cgatggcatc tcctacaagg tattcgccac cacggacgac    120
cccctcaccg gcttccaggc caccgcttac cagcgccagg atacgggcga ggtggtcatc    180
gcctaccgcg gcacggaatt cgaccgcgaa cccgtgcgcg atggcggcgt cgacgcaggc    240
atggtgttgc ttggcgtcaa cgcccagtca cctgcatccg aggtattcac ccgcgaagtg    300
atcgaaaagg cgaagcacga agccgagctc aacgatcgcg agccgaagat caccgtcacc    360
gggcattccc tcggcggcac cctcgccgaa atcaatgccg cgaaatacgg cctccacggc    420
gaaaccttca atgcctacgg tgcggccagc ctcaagggca tccccgaggg cggcgacacg    480
gtgatcgacc atgtccgcgc cggcgatctc gtcagcgccg ccagcccgca ctacgggcag    540
gtgcgtgtgt acgcagctca gcaggatatc gataccctgc aacatgccgg ctaccgcgac    600
gacagtggca tcttcagcct gcgcaacccc atcaaggcca cggatttcga cgcccacgcg    660
atcgataact tcgtgcccaa cagcaagctg cttggccaat cgatcatcgc tcctgagaac    720
gaagcccgtt acgaagccca caagggcatg atcgatcgct atcgcgatga cgtggccgat    780
atccggaaag gcatctccgc tccctgggaa atccccaagg ccgtcggcga gctgaaggac    840
aagctcgaac acgaagcctt cgagctggcc ggcaagggca tcctcgccgt cgagcacggt    900
gtagccgagg tcgttcacga ggcgaaggaa gggttcgatc atctcaagga aggcttgcac    960
cacgtcaggg aagagatcag cgagggcatc cacgccgtgg aagagaaggc ttccagcgca   1020
tggcacaccc tcacccaccc gaaggaatgg ttcgagcacg acaaacctca agtgaatctc   1080
gaccatcccc agcatccaga caacgccttg ttcaagcagg cgcagggcgc ggtacacgcc   1140
ctcgatgcca cgcaaggccg cacgccagat aggacgagcg accagatcgc aggttctctg   1200
gtggtcgcgg cgcgacgcga tggtctcgag cgggtggacc gcgccgtgct cagcgatgac   1260
actagccggc tctacggcgt gcagggtgcg acggattcgc ccttgaagca gttcaccgag   1320
gtgaacacga cagtggcggc gcaaacgtca ctgcagcaaa gcagccaggc atggcagcag   1380
caagcagaga tcgcgcgaca gaaccaggca accagccagg ctcagcgcat ggaaccgcag   1440
gtgcccccgc aggcaccggc acatggcatg taa                                1473
<210>24
<211>490
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>24
Met Thr Ile Arg Ser Thr Asp Tyr Ala Leu Leu Ala Gln Glu Ser Tyr
 1               5                  10                  15
His Asp Ser Gln Val Asp Ala Asp Val Lys Leu Asp Gly Ile Ser Tyr
            20                  25                  30
Lys Val Phe Ala Thr Thr Asp Asp Pro Leu Thr Gly Phe Gln Ala Thr
        35                  40                  45
Ala Tyr Gln Arg Gln Asp Thr Gly Glu Val Val Ile Ala Tyr Arg Gly
    50                  55                  60
Thr Glu Phe Asp Arg Glu Pro Val Arg Asp Gly Gly Val Asp Ala Gly
65                  70                  75                  80
Met Val Leu Leu Gly Val Asn Ala Gln Ser Pro Ala Ser Glu Val Phe
                85                  90                  95
Thr Arg Glu Val Ile Glu Lys Ala Lys His Glu Ala Glu Leu Asn Asp
            100                 105                 110
Arg Glu Pro Lys Ile Thr Val Thr Gly His Ser Leu Gly Gly Thr Leu
        115                 120                 125
Ala Glu Ile Asn Ala Ala Lys Tyr Gly Leu His Gly Glu Thr Phe Asn
    130                 135                 140
Ala Tyr Gly Ala Ala Ser Leu Lys Gly Ile Pro Glu Gly Gly Asp Thr
145                 150                 155                 160
Val Ile Asp His Val Arg Ala Gly Asp Leu Val Ser Ala Ala Ser Pro
                165                 170                 175
His Tyr Gly Gln Val Arg Val Tyr Ala Ala Gln Gln Asp Ile Asp Thr
            180                 185                 190
Leu Gln His Ala Gly Tyr Arg Asp Asp Ser Gly Ile Phe Ser Leu Arg
        195                 200                 205
Asn Pro Ile Lys Ala Thr Asp Phe Asp Ala His Ala Ile Asp Asn Phe
    210                 215                 220
Val Pro Ash Ser Lys Leu Leu Gly Gln Ser Ile Ile Ala Pro Glu Asn
225                 230                 235                 240
Glu Ala Arg Tyr Glu Ala His Lys Gly Met Ile Asp Arg Tyr Arg Asp
                245                 250                 255
Asp Val Ala Asp Ile Arg Lys Gly Ile Ser Ala Pro Trp Glu Ile Pro
            260                 265                 270
Lys Ala Val Gly Glu Leu Lys Asp Lys Leu Glu His Glu Ala Phe Glu
        275                 280                 285
Leu Ala Gly Lys Gly Ile Leu Ala Val Glu His Gly Val Ala Glu Val
    290                 295                 300
Val His Glu Ala Lys Glu Gly Phe Asp His Leu Lys Glu Gly Leu His
305                 310                 315                 320
His Val Arg Glu Glu Ile Ser Glu Gly Ile His Ala Val Glu Glu Lys
                325                 330                 335
Ala Ser Ser Ala Trp His Thr Leu Thr His Pro Lys Glu Trp Phe Glu
            340                 345                 350
His Asp Lys Pro Gln Val Asn Leu Asp His Pro Gln His Pro Asp Asn
        355                 360                 365
Ala Leu Phe Lys Gln Ala Gln Gly Ala Val His Ala Leu Asp Ala Thr
    370                 375                 380
Gln Gly Arg Thr Pro Asp Arg Thr Ser Asp Gln Ile Ala Gly Ser Leu
385                 390                 395                 400
Val Val Ala Ala Arg Arg Asp Gly Leu Glu Arg Val Asp Arg Ala Val
                405                 410                 415
Leu Ser Asp Asp Thr Ser Arg Leu Tyr Gly Val Gln Gly Ala Thr Asp
            420                 425                 430
Ser Pro Leu Lys Gln Phe Thr Glu Val Asn Thr Thr Val Ala Ala Gln
        435                 440                 445
Thr Ser Leu Gln Gln Ser Ser Gln Ala Trp Gln Gln Gln Ala Glu Ile
    450                 455                 460
Ala Arg Gln Asn Gln Ala Thr Ser Gln Ala Gln Arg Met Glu Pro Gln
465                 470                 475                 480
Val Pro Pro Gln Ala Pro Ala His Gly Met
                485                 490
<210>25
<211>1098
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>25
atgtgcgcca aagttaaagt agtcaaaata aagacaaaca caggcagccc aaacaaatac     60
cacttcaaga acctcgtctt cgaaggcggc ggcgtgaaag gcattgccta tgtgggagcc    120
cttaccaagc tcgacgagga aggcatcctt caaaacatta agcgcgtggc cggcacctca    180
gcaggagcaa tggtggccgt cctcgtcgga ttgggcttca ccgctaagga gataagcgac    240
atcctgtggg acatcaaatt ccagaacttt ttagacaact catggggcgt gatacgcaac    300
accaatcgtc tgctgacgga atacggctgg tataagggcg agtttttccg cgacctcatg    360
gctgattaca tcaaaagaaa gacagacgat ggcgagatta ctttcgggga gttggaggcc    420
atgagaaaag agggcaagcc cttcttggaa atccatctgg ttggctccga cctcacgaca    480
gggtattcca gagtgttcaa ctccaaaaac accccaaatg tgaaagtcgc cgatgccgcc    540
cgcatctcca tgtcgatacc gctgtttttc tccgctgtga gaggcgtgca aggcgacgac    600
cacctctatg tggacggtgg gcttttggac aactacgcca tcaagatttt cgaccagtcg    660
aaactcgttt cagacaaaaa caacaaaagg aagaccgagt attacaacag gctcaaccag    720
caagtgaacg cgaaagcaac gaaaagcaag acggaatctg tagagtatgt ctacaacaag    780
gagactttgg gcttccgctt ggatgccaaa gaggacatca acctcttcct caaccacgat    840
gatgcccctc aaaaagaaat caagagtttc ttctcttaca ccaaagcttt ggtttccacg    900
ctcatcgatt tccagaacaa tgtacacctg cacagcgacg actggcagcg tacggtctac    960
atcgacacac tcggtgtcag ctccattgac ttcggtctgt caaacacaac gaaacaagct   1020
cttgtcgatt cgggctacaa ctacaccaca gcctacctcg actggtacaa caacgacgag   1080
gataaagcca acaagtaa                                                 1098
<210>26
<211>365
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>26
Met Cys Ala Lys Val Lys Val Val Lys Ile Lys Thr Asn Thr Gly Ser
 1               5                  10                  15
Pro Asn Lys Tyr His Phe Lys Asn Leu Val Phe Glu Gly Gly Gly Val
            20                  25                  30
Lys Gly Ile Ala Tyr Val Gly Ala Leu Thr Lys Leu Asp Glu Glu Gly
        35                  40                  45
Ile Leu Gln Asn Ile Lys Arg Val Ala Gly Thr Ser Ala Gly Ala Met
    50                  55                  60
Val Ala Val Leu Val Gly Leu Gly Phe Thr Ala Lys Glu Ile Ser Asp
65                  70                  75                  80
Ile Leu Trp Asp Ile Lys Phe Gln Asn Phe Leu Asp Asn Ser Trp Gly
                85                  90                  95
Val Ile Arg Asn Thr Asn Arg Leu Leu Thr Glu Tyr Gly Trp Tyr Lys
            100                 105                 110
Gly Glu Phe Phe Arg Asp Leu Met Ala Asp Tyr Ile Lys Arg Lys Thr
        115                 120                 125
Asp Asp Gly Glu Ile Thr Phe Gly Glu Leu Glu Ala Met Arg Lys Glu
    130                 135                 140
Gly Lys Pro Phe Leu Glu Ile His Leu Val Gly Ser Asp Leu Thr Thr
145                 150                 155                 160
Gly Tyr Ser Arg Val Phe Asn Ser Lys Asn Thr Pro Asn Val Lys Val
                165                 170                 175
Ala Asp Ala Ala Arg Ile Ser Met Ser Ile Pro Leu Phe Phe Ser Ala
            180                 185                 190
Val Arg Gly Val Gln Gly Asp Asp His Leu Tyr Val Asp Gly Gly Leu
        195                 200                 205
Leu Asp Asn Tyr Ala Ile Lys Ile Phe Asp Gln Ser Lys Leu Val Ser
    210                 215                 220
Asp Lys Asn Asn Lys Arg Lys Thr Glu Tyr Tyr Asn Arg Leu Asn Gln
225                 230                 235                 240
Gln Val Asn Ala Lys Ala Thr Lys Ser Lys Thr Glu Ser Val Glu Tyr
                245                 250                 255
Val Tyr Asn Lys Glu Thr Leu Gly Phe Arg Leu Asp Ala Lys Glu Asp
            260                 265                 270
Ile Asn Leu Phe Leu Asn His Asp Asp Ala Pro Gln Lys Glu Ile Lys
        275                 280                 285
Ser Phe Phe Ser Tyr Thr Lys Ala Leu Val Ser Thr Leu Ile Asp Phe
    290                 295                 300
Gln Asn Asn Val His Leu His Ser Asp Asp Trp Gln Arg Thr Val Tyr
305                 310                 315                 320
Ile Asp Thr Leu Gly Val Ser Ser Ile Asp Phe Gly Leu Ser Asn Thr
                325                 330                 335
Thr Lys Gln Ala Leu Val Asp Ser Gly Tyr Asn Tyr Thr Thr Ala Tyr
            340                 345                 350
Leu Asp Trp Tyr Asn Asn Asp Glu Asp Lys Ala Asn Lys
        355                 360                 365
<210>27
<211>1287
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>27
gtgtcgatta ccgtttaccg gaagccctcc ggcgggtttg gagcgatagt tcctcaagcg     60
aaaattgaga accttgtttt cgagggcggc ggaccaaagg gcctggtcta tgtcggcgcg    120
gtcgaggttc tcggcgaaag gggactgctg gaagggatcg caaatgtcgg cggcgcttca    180
gcaggcgcca tgaccgctct agccgtcggt ctgggactga gccccaggga aattcgcgcg    240
gtcgtcttta accagaacat tgcggacctc accgatatcg agaagaccgt cgagccgtcc    300
tccgggatta caggcatgtt caagagcgtg ttcaagaagg gttggcaggc ggtgcgcaac    360
gtaaccggca cctctgacga gcgcgggcgc gggctctatc gcggcgagaa gttgcgagcc    420
tggatcagag acctgattgc acagcgagtc gaggcggggc gctccgaggt cctgagccga    480
gccgacgccg atggacggaa cttctatgag aaagccgccg caaagaaggg cgccctgaca    540
tttgccgagc ttgatcgggt ggcgcaaatg gcgccgggcc tgcggcttcg ccgcctggcc    600
ttcaccggaa ccaacttcac gtcgaagaag ctcgaagtgt tcagtctgca cgagaccccg    660
gacatgccga tcgacgtcgc ggtacgcatc tccgcatcgt tgccatggtt tttcaaatcc    720
gtgaaatgga acggctccga atacatagat ggcggctgcc tgtcgaactt cccaatgccg    780
atattcgacg tcgatcccta tcgtggcgac gcatcgtcga aaatccggct cggcatcttc    840
ggccagaacc tcgcgacgct cggcttcaag gtcgacagcg aggaggagat ccgcgacatt    900
ctctggcgta gccccgagag cacgagcgac ggctttttcc aaggcatcct gtcaagcgtg    960
aaagcttctg cagaacactg ggtcgtcggc atcgacgtcg aaggcgccac ccgcgcgtcg   1020
aacgtggccg ttcacggcaa gtatgctcag cgaacgatcc agataccgga cctcggatat   1080
agcacgttca agttcgatct ttcggacgct gacaaggagc gcatggccga ggccggcgca   1140
aaggccacgc gggaatggct ggcgctgtac ttcgacgacg ccggaataga ggtcgaattt   1200
tctgatccga acgaattgcg cggccagttg tccgacgccg cattcgcaga cctcgaggat   1260
tcgtttcgag ccttgatcgc ggcctag                                       1287
<210>28
<211>428
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>28
Met Ser Ile Thr Val Tyr Arg Lys Pro Ser Gly Gly Phe Gly Ala Ile
 1               5                  10                  15
Val Pro Gln Ala Lys Ile Glu Asn Leu Val Phe Glu Gly Gly Gly Pro
            20                  25                  30
Lys Gly Leu Val Tyr Val Gly Ala Val Glu Val Leu Gly Glu Arg Gly
        35                  40                  45
Leu Leu Glu Gly Ile Ala Asn Val Gly Gly Ala Ser Ala Gly Ala Met
    50                  55                  60
Thr Ala Leu Ala Val Gly Leu Gly Leu Ser Pro Arg Glu Ile Arg Ala
65                  70                  75                  80
Val Val Phe Asn Gln Asn Ile Ala Asp Leu Thr Asp Ile Glu Lys Thr
                85                  90                  95
Val Glu Pro Ser Ser Gly Ile Thr Gly Met Phe Lys Ser Val Phe Lys
            100                 105                 110
Lys Gly Trp Gln Ala Val Arg Asn Val Thr Gly Thr Ser Asp Glu Arg
        115                 120                 125
Gly Arg Gly Leu Tyr Arg Gly Glu Lys Leu Arg Ala Trp Ile Arg Asp
    130                 135                 140
Leu Ile Ala Gln Arg Val Glu Ala Gly Arg Ser Glu Val Leu Ser Arg
145                 150                 155                 160
Ala Asp Ala Asp Gly Arg Asn Phe Tyr Glu Lys Ala Ala Ala Lys Lys
                165                 170                 175
Gly Ala Leu Thr Phe Ala Glu Leu Asp Arg Val Ala Gln Met Ala Pro
            180                 185                 190
Gly Leu Arg Leu Arg Arg Leu Ala Phe Thr Gly Thr Asn Phe Thr Ser
        195                 200                 205
Lys Lys Leu Glu Val Phe Ser Leu His Glu Thr Pro Asp Met Pro Ile
    210                 215                 220
Asp Val Ala Val Arg Ile Ser Ala Ser Leu Pro Trp Phe Phe Lys Ser
225                 230                 235                 240
Val Lys Trp Asn Gly Ser Glu Tyr Ile Asp Gly Gly Cys Leu Ser Asn
                245                 250                 255
Phe Pro Met Pro Ile Phe Asp Val Asp Pro Tyr Arg Gly Asp Ala Ser
            260                 265                 270
Ser Lys Ile Arg Leu Gly Ile Phe Gly Gln Asn Leu Ala Thr Leu Gly
        275                 280                 285
Phe Lys Val Asp Ser Glu Glu Glu Ile Arg Asp Ile Leu Trp Arg Ser
    290                 295                 300
Pro Glu Ser Thr Ser Asp Gly Phe Phe Gln Gly Ile Leu Ser Ser Val
305                 310                 315                 320
Lys Ala Ser Ala Glu His Trp Val Val Gly Ile Asp Val Glu Gly Ala
                325                 330                 335
Thr Arg Ala Ser Asn Val Ala Val His Gly Lys Tyr Ala Gln Arg Thr
            340                 345                 350
Ile Gln Ile Pro Asp Leu Gly Tyr Ser Thr Phe Lys Phe Asp Leu Ser
        355                 360                 365
Asp Ala Asp Lys Glu Arg Met Ala Glu Ala Gly Ala Lys Ala Thr Arg
    370                 375                 380
Glu Trp Leu Ala Leu Tyr Phe Asp Asp Ala Gly Ile Glu Val Glu Phe
385                 390                 395                 400
Ser Asp Pro Asn Glu Leu Arg Gly Gln Leu Ser Asp Ala Ala Phe Ala
                405                 410                 415
Asp Leu Glu Asp Ser Phe Arg Ala Leu Ile Ala Ala
            420                 425
<210>29
<211>753
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>29
atgggaaacg gtgcagcagt tggttcgaat gataatggta gagaagaaag tgtttacgta     60
ctttctgtga tcgcctgtaa tgtttattat ttacaaaagt gtgaaggtgg ggcatcgcgt    120
gatagcgtga ttagagaaat caatagccaa actcaacctt taggatatga gattgtagca    180
gattctattc gtgatggtca tattggctct tttgcctgta agatggctgt ctttagaaat    240
aatggaaacg gcaattgtgt tttagcaatc aaagggactg atatgaataa tatcaatgac    300
ttggtgaatg acctaaccat gatattagga ggtattggtt ctgttgctgc aatccaacca    360
acgattaaca tggcacaaga actcatcgac caatatggag tgaatttgat tacaggtcac    420
tcccttggag gctacatgac tgagatcatc gccaccaatc gtggacttcc aggtattgca    480
ttttgcgcac caggttcaaa tggtcccatt gtaaaattag gtggacaaga gacacctggc    540
tttcacaatg tgaactttga acatgatcca gcaggtaacg ttatgacggg ggtttatact    600
catgtccaat ggagtattta tgtaggatgt gatggtatga ctcatggtat tgaaaatatg    660
gtgaattatt ttaaagataa aagagattta accaatcgca atattcaagg aagaagtgaa    720
agtcataata cgggttatta ttacccaaaa taa                                 753
<210>30
<211>250
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>30
Met Gly Asn Gly Ala Ala Val Gly Ser Asn Asp Asn Gly Arg Glu Glu
 1               5                  10                  15
Ser Val Tyr Val Leu Ser Val Ile Ala Cys Asn Val Tyr Tyr Leu Gln
            20                  25                  30
Lys Cys Glu Gly Gly Ala Ser Arg Asp Ser Val Ile Arg Glu Ile Asn
        35                  40                  45
Ser Gln Thr Gln Pro Leu Gly Tyr Glu Ile Val Ala Asp Ser Ile Arg
    50                  55                  60
Asp Gly His Ile Gly Ser Phe Ala Cys Lys Met Ala Val Phe Arg Asn
65                  70                  75                  80
Asn Gly Asn Gly Asn Cys Val Leu Ala Ile Lys Gly Thr Asp Met Asn
                85                  90                  95
Asn Ile Asn Asp Leu Val Asn Asp Leu Thr Met Ile Leu Gly Gly Ile
            100                 105                 110
Gly Ser Val Ala Ala Ile Gln Pro Thr Ile Asn Met Ala Gln Glu Leu
        115                 120                 125
Ile Asp Gln Tyr Gly Val Asn Leu Ile Thr Gly His Ser Leu Gly Gly
    130                 135                 140
Tyr Met Thr Glu Ile Ile Ala Thr Asn Arg Gly Leu Pro Gly Ile Ala
145                 150                 155                 160
Phe Cys Ala Pro Gly Ser Asn Gly Pro Ile Val Lys Leu Gly Gly Gln
                165                 170                 175
Glu Thr Pro Gly Phe His Asn Val Asn Phe Glu His Asp Pro Ala Gly
            180                 185                 190
Asn Val Met Thr Gly Val Tyr Thr His Val Gln Trp Ser Ile Tyr Val
        195                 200                 205
Gly Cys Asp Gly Met Thr His Gly Ile Glu Asn Met Val Asn Tyr Phe
    210                 215                 220
Lys Asp Lys Arg Asp Leu Thr Asn Arg Asn Ile Gln Gly Arg Ser Glu
225                 230                 235                 240
Ser His Asn Thr Gly Tyr Tyr Tyr Pro Lys
                245                 250
<210>31
<211>1422
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>31
atgaaaaaga aattatgtac atgggctctc gtaacagcga tatcttctgg agttgttgcg     60
attccaaccg tagcatctgc ttgcggaatg ggtgaagtaa tgaaacagga ggatcaagag    120
cacaaacgtg tgaagagatg gtctgcggag catccgcacc atgctaatga aagcacgcac    180
ttatggattg ctcgaaatgc gattcaaatt atgagtcgta atcaagataa gacggttcaa    240
gaaaatgaat tacaattctt aaaaatacct gaatataagg agttatttga aagagggctt    300
tatgatgccg attatcttga tgagtttaac gatggaggta caggtacaat cggtattgat    360
gggctaatta aaggaggctg gaaatctcat ttctatgatc ctgatacgaa aaagaactat    420
aaaggagaag aagaaccaac agccctttcg caaggggata aatattttaa attagcagga    480
gattatttta agaaagaaga ttggaaacaa gctttctatt atttaggtgt tgcgacgcat    540
tacttcacag atgctactca gccaatgcat gctgctaatt ttacagctgt cgacatgagt    600
gcaataaagt ttcatagcgc ttttgaaaat tatgtaacga cagttcagac accgtttgaa    660
gtgaaggatg ataagggaac atataatttg gtcaattctg atgatccgaa gcagtggata    720
catgaaacag cgaaactcgc aaaagcagaa attatgaata ttactagtga taatattaaa    780
tctcaatata ataaaggaaa caaagatctt tggcaacaag aagttatgcc agctgtccag    840
aggagtttag agaaagcgca aagaaacacg gcgggattta ttcatttatg gtttaaaaca    900
tatgttggca aaactgcagc tgaagatatt gaaactacac aggtaaaaga ttctaatgga    960
gaagcaatac aagaacaaaa aaaatactac gttgtgccta gtgagttttt aaatagaggt   l020
ttgacctttg aggtatatgc ttcgaatgac tacgcactat tatctaatca cgtagatgat   1080
aataaagttc atggtacacc tgttcagttt gtttttgata aagagaataa cggaattgtt   1140
catcggggag aaagtgtact gctgaaaatg acgcaatcta actatgatga ttatgtattt   1200
cttaattact ctaatatgac aaattggtta catcttgcga aacgaaaaac aaatactgca   1260
cagtttaaag tgtatccaaa tccggataac tcatctgaat atttcctata tacagatgga   1320
tacccggtaa attatcaaga aaatggtaat gggaagagct ggattgagtt aggaaagaaa   1380
acggataaac cgaaagcgtg gaaatttcaa caggcagaat aa                      1422
<210>32
<211>473
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(20)
<400>32
Met Lys Lys Lys Leu Cys Thr Trp Ala Leu Val Thr Ala Ile Ser Ser
 1               5                  10                  15
Gly Val Val Ala Ile Pro Thr Val Ala Ser Ala Cys Gly Met Gly Glu
            20                  25                  30
Val Met Lys Gln Glu Asp Gln Glu His Lys Arg Val Lys Arg Trp Ser
        35                  40                  45
Ala Glu His Pro His His Ala Asn Glu Ser Thr His Leu Trp Ile Ala
    50                  55                  60
Arg Asn Ala Ile Gln Ile Met Ser Arg Asn Gln Asp Lys Thr Val Gln
65                  70                  75                  80
Glu Asn Glu Leu Gln Phe Leu Lys Ile Pro Glu Tyr Lys Glu Leu Phe
                85                  90                  95
Glu Arg Gly Leu Tyr Asp Ala Asp Tyr Leu Asp Glu Phe Asn Asp Gly
            100                 105                 110
Gly Thr Gly Thr Ile Gly Ile Asp Gly Leu Ile Lys Gly Gly Trp Lys
        115                 120                 125
Ser His Phe Tyr Asp Pro Asp Thr Lys Lys Asn Tyr Lys Gly Glu Glu
    130                 135                 140
Glu Pro Thr Ala Leu Ser Gln Gly Asp Lys Tyr Phe Lys Leu Ala Gly
145                 150                 155                 160
Asp Tyr Phe Lys Lys Glu Asp Trp Lys Gln Ala Phe Tyr Tyr Leu Gly
                165                 170                 175
Val Ala Thr His Tyr Phe Thr Asp Ala Thr Gln Pro Met His Ala Ala
            180                 185                 190
Asn Phe Thr Ala Val Asp Met Ser Ala Ile Lys Phe His Ser Ala Phe
        195                 200                 205
Glu Asn Tyr Val Thr Thr Val Gln Thr Pro Phe Glu Val Lys Asp Asp
    210                 215                 220
Lys Gly Thr Tyr Asn Leu Val Asn Ser Asp Asp Pro Lys Gln Trp Ile
225                 230                 235                 240
His Glu Thr Ala Lys Leu Ala Lys Ala Glu Ile Met Asn Ile Thr Ser
                245                 250                 255
Asp Asn Ile Lys Ser Gln Tyr Asn Lys Gly Asn Lys Asp Leu Trp Gln
            260                 265                 270
Gln Glu Val Met Pro Ala Val Gln Arg Ser Leu Glu Lys Ala Gln Arg
        275                 280                 285
Asn Thr Ala Gly Phe Ile His Leu Trp Phe Lys Thr Tyr Val Gly Lys
    290                 295                 300
Thr Ala Ala Glu Asp Ile Glu Thr Thr Gln Val Lys Asp Ser Asn Gly
305                 310                 315                 320
Glu Ala Ile Gln Glu Gln Lys Lys Tyr Tyr Val Val Pro Ser Glu Phe
                325                 330                 335
Leu Asn Arg Gly Leu Thr Phe Glu Val Tyr Ala Ser Asn Asp Tyr Ala
            340                 345                 350
Leu Leu Ser Asn His Val Asp Asp Asn Lys Val His Gly Thr Pro Val
        355                 360                 365
Gln Phe Val Phe Asp Lys Glu Asn Asn Gly Ile Val His Arg Gly Glu
    370                 375                 380
Ser Val Leu Leu Lys Met Thr Gln Ser Asn Tyr Asp Asp Tyr Val Phe
385                 390                 395                 400
Leu Asn Tyr Ser Asn Met Thr Asn Trp Leu His Leu Ala Lys Arg Lys
                405                 410                 415
Thr Asn Thr Ala Gln Phe Lys Val Tyr Pro Asn Pro Asp Asn Ser Ser
            420                 425                 430
Glu Tyr Phe Leu Tyr Thr Asp Gly Tyr Pro Val Asn Tyr Gln Glu Asn
        435                 440                 445
Gly Asn Gly Lys Ser Trp Ile Glu Leu Gly Lys Lys Thr Asp Lys Pro
    450                 455                 460
Lys Ala Trp Lys Phe Gln Gln Ala Glu
465                 470
<210>33
<211>792
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>33
atgagagcac tcgtgctggc aggcggtgga gccaagggct cgtttcaagt gggcgtgctg     60
cagcggttca cccccgcaga cttcggtctc gtggtgggat gctcggtcgg agctttaaac    120
gccgcggggt ttgcccacct gggtagccat ggcatcaaag acctctggca agggatcagg    180
agtcgagatg acatcctgtc ccgtgtctgg tggccgtttg gctcagacgg gatcttctcg    240
cagaagcctc ttgaaaagct cgtctccaaa gcatgcacgg gtcctgctcg ggtgccggtc    300
cacgtggcga cggtctgcct tgaacgcggc cttgtccact acgggatctc cggggactct    360
gactttgaga agaaagtgct ggcatcggct gcgatcccag gcgtggtgaa gccagttaag    420
atccatggcg accactacgt cgacggtggt gtcagagaga tctgtccgct gcgtcgagcc    480
atcgacctgg gcgccacgga gatcacagtc atcatgtgcg ctccggaata catcccgacc    540
tggtcgcgta gttcctcgct gttcccgttt gtgaacgtga tgatccggtc tctcgacatc    600
ctgaccgatg agatcctggt caacgacatc gccgagtgcg tggcaaagaa caagatgcca    660
ggtaaacgtc acgtaaagct caccatctac cggccgaaga aagagctcat gggcacgctc    720
gactttgacc ccaaagccat cgccgcaggg atcaaggcag gcaccgaagc ccagccaagg    780
ttctgggagt aa                                                        792
<210>34
<211>263
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>34
Met Arg Ala Leu Val Leu Ala Gly Gly Gly Ala Lys Gly Ser Phe Gln
 1               5                  10                  15
Val Gly Val Leu Gln Arg Phe Thr Pro Ala Asp Phe Gly Leu Val Val
            20                  25                  30
Gly Cys Ser Val Gly Ala Leu Asn Ala Ala Gly Phe Ala His Leu Gly
        35                  40                  45
Ser His Gly Ile Lys Asp Leu Trp Gln Gly Ile Arg Ser Arg Asp Asp
    50                  55                  60
Ile Leu Ser Arg Val Trp Trp Pro Phe Gly Ser Asp Gly Ile Phe Ser
65                  70                  75                  80
Gln Lys Pro Leu Glu Lys Leu Val Ser Lys Ala Cys Thr Gly Pro Ala
                85                  90                  95
Arg Val Pro Val His Val Ala Thr Val Cys Leu Glu Arg Gly Leu Val
            100                 105                 110
His Tyr Gly Ile Ser Gly Asp Ser Asp Phe Glu Lys Lys Val Leu Ala
        115                 120                 125
Ser Ala Ala Ile Pro Gly Val Val Lys Pro Val Lys Ile His Gly Asp
    130                 135                 140
His Tyr Val Asp Gly Gly Val Arg Glu Ile Cys Pro Leu Arg Arg Ala
145                 150                 155                 160
Ile Asp Leu Gly Ala Thr Glu Ile Thr Val Ile Met Cys Ala Pro Glu
                165                 170                 175
Tyr Ile Pro Thr Trp Ser Arg Ser Ser Ser Leu Phe Pro Phe Val Asn
            180                 185                 190
Val Met Ile Arg Ser Leu Asp Ile Leu Thr Asp Glu Ile Leu Val Asn
        195                 200                 205
Asp Ile Ala Glu Cys Val Ala Lys Asn Lys Met Pro Gly Lys Arg His
    210                 215                 220
Val Lys Leu Thr Ile Tyr Arg Pro Lys Lys Glu Leu Met Gly Thr Leu
225                 230                 235                 240
Asp Phe Asp Pro Lys Ala Ile Ala Ala Gly Ile Lys Ala Gly Thr Glu
                245                 250                 255
Ala Gln Pro Arg Phe Trp Glu
            260
<210>35
<21l>1389
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>35
atgcccgagc cgcccgccgc atgccgttgc gattgcgcct gcgagcgcga ccagcacctt     60
ttttgcaagg gacccaagcg tatcctcgcg ctcgacggcg gcggcgtgcg cggcgccgtc    120
agcgtcgcat tcctcgaacg gatcgaggcg gtgctcgagg cccggctcgg acgcaaggtg    180
ctgctcggcc actggttcga cctgatcggc ggcacctcga cgggcgccat catcggcggc    240
gcgctggcga tgggattcgc ggccgaggac gtccaaagat tctatcacga gctcgcgccg    300
cgggtgttca ggcatccgct cctgcgcatc ggtctcctgc gcccgttccg cgcgaaattc    360
gacgcccgcc tgctgcgcga ggagatccac cgcatcatcg gcgacagcac gctcggcgac    420
aaagcgctga tgaccgggtt cgcgctcgtc gccaagcgga tggacaccgg cagcacctgg    480
atcctcgcca acaacaagcg cagcaaatac tgggaagggc gggacggcgt cgtcggcaac    540
aaggattatc tcctcggcag cctcattcgc gcgagcacgg cggcgccgct gtatttcgac    600
cccgaggagg tcgtgatcgc ggaggcccgc aaggacatcg agggcatcag gggcctgttc    660
gtcgacggcg gcgtcacgcc gcacaacaat ccttcgctcg cgatgctgct gctggcgctg    720
ctcgacgcct accggctgcg ctgggaaacg ggaccggaca agctcacggt cgtctcgatc    780
ggcactggaa cgcatcgcga ccgcgtcgtt cccgacacgc tcggcatggg caagaacgcg    840
aagatcgcgc tgcgcgccat gagctcgctg atgaacgacg tgcacgagct cgcgctcacg    900
cagatgcagt acctcggtga gacgctcacc ccgtggcgca tcaacgacga gctcggcgac    960
atgcggaccg agcggccgcc gcaaggcaag ctcttccgct tcctccgcta cgacgtccgg   1020
ctggagctcg attggatcaa cgaggacgag gagcgccggc gcaagatcaa gaacaaattc   1080
aagcgcgagc tgaccgagac cgacatgatc cgcctgcgca gcctcgacga tccgacgacc   1140
atcccggacc tctacatgct tgcccaggtc gcggccgagg agcaggtcaa ggcggagcac   1200
tggctcggcg acgtgccgga gtggagcgaa ggcgcgcgcc cgtgtgcgcc gcgccggcac   1260
ctgccgccga cgccgccggg ccgctccgag gattcggcgc gcttccgggc cgagaaggcc   1320
gtcggcgagt ggctcagttt tgcgcgcgcg aacatcacgc gcctcatgtc gcggaagccg   1380
ccgggttga                                                           1389
<210>36
<211>462
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>36
Met Pro Glu Pro Pro Ala Ala Cys Arg Cys Asp Cys Ala Cys Glu Arg
 1               5                  10                  15
Asp Gln His Leu Phe Cys Lys Gly Pro Lys Arg Ile Leu Ala Leu Asp
            20                  25                  30
Gly Gly Gly Val Arg Gly Ala Val Ser Val Ala Phe Leu Glu Arg Ile
        35                  40                  45
Glu Ala Val Leu Glu Ala Arg Leu Gly Arg Lys Val Leu Leu Gly His
    50                  55                  60
Trp Phe Asp Leu Ile Gly Gly Thr Ser Thr Gly Ala Ile Ile Gly Gly
65                  70                  75                  80
Ala Leu Ala Met Gly Phe Ala Ala Glu Asp Val Gln Arg Phe Tyr His
                85                  90                  95
Glu Leu Ala Pro Arg Val Phe Arg His Pro Leu Leu Arg Ile Gly Leu
            100                 105                 110
Leu Arg Pro Phe Arg Ala Lys Phe Asp Ala Arg Leu Leu Arg Glu Glu
        115                 120                 125
Ile His Arg Ile Ile Gly Asp Ser Thr Leu Gly Asp Lys Ala Leu Met
    130                 135                 140
Thr Gly Phe Ala Leu Val Ala Lys Arg Met Asp Thr Gly Ser Thr Trp
145                 150                 155                 160
Ile Leu Ala Asn Asn Lys Arg Ser Lys Tyr Trp Glu Gly Arg Asp Gly
                165                 170                 175
Val Val Gly Asn Lys Asp Tyr Leu Leu Gly Ser Leu Ile Arg Ala Ser
            180                 185                 190
Thr Ala Ala Pro Leu Tyr Phe Asp Pro Glu Glu Val Val Ile Ala Glu
        195                 200                 205
Ala Arg Lys Asp Ile Glu Gly Ile Arg Gly Leu Phe Val Asp Gly Gly
    210                 215                 220
Val Thr Pro His Asn Asn Pro Ser Leu Ala Met Leu Leu Leu Ala Leu
225                 230                 235                 240
Leu Asp Ala Tyr Arg Leu Arg Trp Glu Thr Gly Pro Asp Lys Leu Thr
                245                 250                 255
Val Val Ser Ile Gly Thr Gly Thr His Arg Asp Arg Val Val Pro Asp
            260                 265                 270
Thr Leu Gly Met Gly Lys Asn Ala Lys Ile Ala Leu Arg Ala Met Ser
        275                 280                 285
Ser Leu Met Asn Asp Val His Glu Leu Ala Leu Thr Gln Met Gln Tyr
    290                 295                 300
Leu Gly Glu Thr Leu Thr Pro Trp Arg Ile Asn Asp Glu Leu Gly Asp
305                 310                 315                 320
Met Arg Thr Glu Arg Pro Pro Gln Gly Lys Leu Phe Arg Phe Leu Arg
                325                 330                 335
Tyr Asp Val Arg Leu Glu Leu Asp Trp Ile Asn Glu Asp Glu Glu Arg
            340                 345                 350
Arg Arg Lys Ile Lys Asn Lys Phe Lys Arg Glu Leu Thr Glu Thr Asp
        355                 360                 365
Met Ile Arg Leu Arg Ser Leu Asp Asp Pro Thr Thr Ile Pro Asp Leu
    370                 375                 380
Tyr Met Leu Ala Gln Val Ala Ala Glu Glu Gln Val Lys Ala Glu His
385                 390                 395                 400
Trp Leu Gly Asp Val Pro Glu Trp Ser Glu Gly Ala Arg Pro Cys Ala
                405                 410                 415
Pro Arg Arg His Leu Pro Pro Thr Pro Pro Gly Arg Ser Glu Asp Ser
            420                 425                 430
Ala Arg Phe Arg Ala Glu Lys Ala Val Gly Glu Trp Leu Ser Phe Ala
        435                 440                 445
Arg Ala Asn Ile Thr Arg Leu Met Ser Arg Lys Pro Pro Gly
    450                 455                 460
<210>37
<211>1329
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>37
atgagaaatt tcagcaaggg attgaccagt attttgctta gcatagcgac atccaccagt     60
gcgatggcct ttacccagat cggggccggc ggagcgattc cgatgggcca tgagtggcta    120
acccgccgct cggcgctgga actgctgaat gccgacaatc tggtcggcaa tgacccggcc    180
gacccacgct tgggctggag cgaaggtctc gccaacaatc tcgatctctc gaatgcccag    240
aacgaagtgc agcgcatcaa gagcattacc aagagccacg ccctgtatga gccgcgttac    300
gatgacgttt tcgccgccat cgtcggcgag cgctgggttg ataccgccgg tttcaacgtg    360
gccaaggcca ccgtcggcaa gatcgattgc ttcagcgccg tcgcgcaaga gcccgccgat    420
gtgcaacaag accatttcat gcgccgttat gacgacgtgg gtggacaagg gggcgtgaac    480
gctgcccgcc gcgcgcagca gcgctttatc aatcacttcg tcaacgcagc catggccgaa    540
gagaagagca tcaaggcatg ggatggcggc ggttattctt cgctggaaaa agtcagccac    600
aactacttct tgtttggccg cgccgttcat ttgttccagg attctttcag ccccgaacac    660
accgtgcgcc tgcctgaaga caattacgtc aaagtccgtc aggtcaaggc gtatctctgc    720
tctgaaggtg ccgaacagca tacgcacaac acgcaagatg ccatcaactt caccagcggc    780
gatgtcatct ggaaacagaa cacccgtctg gatgcaggct ggagcaccta caaggccagc    840
aacatgaagc cggtggcatt ggttgccctc gaagccagca aagatttgtg ggccgccttt    900
attcgcacca tggccgtttc ccgcgaggag cgtcgcgccg tcgccgaaca ggaagcgcag    960
gctctcgtca atcactggtt gtcgttcgac gaacaggaaa tgctgaactg gtacgaagaa   1020
gaagagcacc gcgatcatac gtacgtcaag gaacccggcc agagcggccc aggttcgtcg   1080
ttattcgatt gcatggttgg tctgggtgtg gcctcgggca gtcaggcgca acgggtggcg   1140
gaactcgatc agcaacgccg ccaatgtttg ttcaacgtca aggccgctac tggctatggc   1200
gatctgaatg atccacacat ggatattccg tacaactggc aatgggtgtc gtcgacgcaa   1260
tggaaaatcc ctgcggccga ctggaaaatc ccgcagctgc ccgccgattc agggaaatca   1320
gtcgtcatc                                                           1329
<210>38
<211>443
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(23)
<400>38
Met Arg Asn Phe Ser Lys Gly Leu Thr Ser Ile Leu Leu Ser Ile Ala
 1               5                  10                  15
Thr Ser Thr Ser Ala Met Ala Phe Thr Gln Ile Gly Ala Gly Gly Ala
            20                  25                  30
Ile Pro Met Gly His Glu Trp Leu Thr Arg Arg Ser Ala Leu Glu Leu
        35                  40                  45
Leu Asn Ala Asp Asn Leu Val Gly Asn Asp Pro Ala Asp Pro Arg Leu
    50                  55                  60
Gly Trp Ser Glu Gly Leu Ala Asn Asn Leu Asp Leu Ser Asn Ala Gln
65                  70                  75                  80
Asn Glu Val Gln Arg Ile Lys Ser Ile Thr Lys Ser His Ala Leu Tyr
                85                  90                  95
Glu Pro Arg Tyr Asp Asp Val Phe Ala Ala Ile Val Gly Glu Arg Trp
            100                 105                 110
Val Asp Thr Ala Gly Phe Asn Val Ala Lys Ala Thr Val Gly Lys Ile
        115                 120                 125
Asp Cys Phe Ser Ala Val Ala Gln Glu Pro Ala Asp Val Gln Gln Asp
    130                 135                 140
His Phe Met Arg Arg Tyr Asp Asp Val Gly Gly Gln Gly Gly Val Asn
145                 150                 155                 160
Ala Ala Arg Arg Ala Gln Gln Arg Phe Ile Asn His Phe Val Asn Ala
                165                 170                 175
Ala Met Ala Glu Glu Lys Ser Ile Lys Ala Trp Asp Gly Gly Gly Tyr
            180                 185                 190
Ser Ser Leu Glu Lys Val Ser His Asn Tyr Phe Leu Phe Gly Arg Ala
        195                 200                 205
Val His Leu Phe Gln Asp Ser Phe Ser Pro Glu His Thr Val Arg Leu
    210                 215                 220
Pro Glu Asp Asn Tyr Val Lys Val Arg Gln Val Lys Ala Tyr Leu Cys
225                 230                 235                 240
Ser Glu Gly Ala Glu Gln His Thr His Asn Thr Gln Asp Ala Ile Asn
                245                 250                 255
Phe Thr Ser Gly Asp Val Ile Trp Lys Gln Asn Thr Arg Leu Asp Ala
            260                 265                 270
Gly Trp Ser Thr Tyr Lys Ala Ser Asn Met Lys Pro Val Ala Leu Val
        275                 280                 285
Ala Leu Glu Ala Ser Lys Asp Leu Trp Ala Ala Phe Ile Arg Thr Met
    290                 295                 300
Ala Val Ser Arg Glu Glu Arg Arg Ala Val Ala Glu Gln Glu Ala Gln
305                 310                 315                 320
Ala Leu Val Asn His Trp Leu Ser Phe Asp Glu Gln Glu Met Leu Asn
                325                 330                 335
Trp Tyr Glu Glu Glu Glu His Arg Asp His Thr Tyr Val Lys Glu Pro
            340                 345                 350
Gly Gln Ser Gly Pro Gly Ser Ser Leu Phe Asp Cys Met Val Gly Leu
        355                 360                 365
Gly Val Ala Ser Gly Ser Gln Ala Gln Arg Val Ala Glu Leu Asp Gln
    370                 375                 380
Gln Arg Arg Gln Cys Leu Phe Asn Val Lys Ala Ala Thr Gly Tyr Gly
385                 390                 395                 400
Asp Leu Asn Asp Pro His Met Asp Ile Pro Tyr Asn Trp Gln Trp Val
                405                 410                 415
Ser Ser Thr Gln Trp Lys Ile Pro Ala Ala Asp Trp Lys Ile Pro Gln
            420                 425                 430
Leu Pro Ala Asp Ser Gly Lys Ser Val Val Ile
        435                 440
<210>39
<211>1335
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>39
atggccaacc ccatcgtcat catccacggc tggagcgacg acttcggctc gttccgcaag     60
ctgcgcgact tcctctccac caacctcggc gttccggcga agatcctcaa gctcggcgac    120
tggatctcgc tcgacgacga cgtcggctac gccgacatcg cgatggcgct ggaacgcgcg    180
tggaaggcgg agaaactgcc gaccgcgccg cgttcggtcg acgtcgtcgt gcacagcacc    240
ggcgcgctgg tggtgcgcga atggatgacg cgctaccacg cgcccgaaac cgtgccgatc    300
cagcgcttcc tgcacctggc gccggccaac ttcggctcgc acctcgcgca caagggccgc    360
tcgttcatcg gccgcgcggt gaagggctgg aagaccggct tcgaaaccgg cacccgcatc    420
ctgcgcgggc tggaactcgc ctcgccctac tcgcgcgcgc tggccgagcg cgacctgttc    480
gtggcgccgt cgaagcgctg gtacggcgcc ggccgcatcc tcgccaccgt gctggtcggc    640
aacagcggct actccggcat ccaggccatc gccaacgagg acggctccga cggcaccgtg    600
cgcatcggca ccgccaacct gcaggcggcg cttgcgaagg tggtgttccc gcccggcccg    660
gtcgcgccgg tggtgcagtt ccgcaacatc gcgggcgcca ccgcgttcgc catcgtcgac    720
ggcgacaacc attccgacat caccatgaag gacaagccgt cgaagaccgg catccgcgag    780
gaactgatcc tcggcgcgct gaaggtgcgc gacgccgact tccccgagaa cgccgacggc    840
gcgttcccgt ggcaggcgaa gctcgacgcg aaggccggtg cggccaaggt gtcttcgccc    900
gggcgccaga acaccgtggt gcacctcacc gacagcttcg gcgacgacgt cgtcgatttc    960
ttcttcgagt tctggcgcag cgaacgcagc gacaaggtgt tcgagcagcg cttctacaag   1020
gacgtcatcg acgacgtgca cgtgtacgac ggcaacggcg cgtggcgctc gctcaacctc   1080
gacctcgaca agttcgaggc gctgcgcaag gacccgaagc tcggcttcga gaaactgctg   1140
gtcagcgtgt tcgcctcgcc cgcgaagaag ggcgacgcca aggtcggcta cagcaccgcc   1200
accggccgcg acatcggcgc ctggcacgtc gaaggccgtg acttcgccaa ggccttcacg   1260
ccgcaccgca ccctgttcgt cgacatcgag atcccacgca tcgtcgacga cgcggtgttc   1320
cggttccggg aatag                                                    1335
<210>40
<211>444
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>40
Met Ala Asn Pro Ile Val Ile Ile His Gly Trp Ser Asp Asp Phe Gly
 1               5                  10                  15
Ser Phe Arg Lys Leu Arg Asp Phe Leu Ser Thr Asn Leu Gly Val Pro
            20                  25                  30
Ala Lys Ile Leu Lys Leu Gly Asp Trp Ile Ser Leu Asp Asp Asp Val
        35                  40                  45
Gly Tyr Ala Asp Ile Ala Met Ala Leu Glu Arg Ala Trp Lys Ala Glu
    50                  55                  60
Lys Leu Pro Thr Ala Pro Arg Ser Val Asp Val Val Val His Ser Thr
65                  70                  75                  80
Gly Ala Leu Val Val Arg Glu Trp Met Thr Arg Tyr His Ala Pro Glu
                85                  90                  95
Thr Val Pro Ile Gln Arg Phe Leu His Leu Ala Pro Ala Asn Phe Gly
            100                 105                 110
Ser His Leu Ala His Lys Gly Arg Ser Phe Ile Gly Arg Ala Val Lys
        115                 120                 125
Gly Trp Lys Thr Gly Phe Glu Thr Gly Thr Arg Ile Leu Arg Gly Leu
    130                 135                 140
Glu Leu Ala Ser Pro Tyr Ser Arg Ala Leu Ala Glu Arg Asp Leu Phe
145                 150                 155                 160
Val Ala Pro Ser Lys Arg Trp Tyr Gly Ala Gly Arg Ile Leu Ala Thr
                165                 170                 175
Val Leu Val Gly Asn Ser Gly Tyr Ser Gly Ile Gln Ala Ile Ala Asn
            180                 185                 190
Glu Asp Gly Ser Asp Gly Thr Val Arg Ile Gly Thr Ala Asn Leu Gln
        195                 200                 205
Ala Ala Leu Ala Lys Val Val Phe Pro Pro Gly Pro Val Ala Pro Val
    210                 215                 220
Val Gln Phe Arg Asn Ile Ala Gly Ala Thr Ala Phe Ala Ile Val Asp
225                 230                 235                 240
Gly Asp Asn His Ser Asp Ile Thr Met Lys Asp Lys Pro Ser Lys Thr
                245                 250                 255
Gly Ile Arg Glu Glu Leu Ile Leu Gly Ala Leu Lys Val Arg Asp Ala
            260                 265                 270
Asp Phe Pro Glu Asn Ala Asp Gly Ala Phe Pro Trp Gln Ala Lys Leu
        275                 280                 285
Asp Ala Lys Ala Gly Ala Ala Lys Val Ser Ser Pro Gly Arg Gln Asn
    290                 295                 300
Thr Val Val His Leu Thr Asp Ser Phe Gly Asp Asp Val Val Asp Phe
305                 310                 315                 320
Phe Phe Glu Phe Trp Arg Ser Glu Arg Ser Asp Lys Val Phe Glu Gln
                325                 330                 335
Arg Phe Tyr Lys Asp Val Ile Asp Asp Val His Val Tyr Asp Gly Asn
            340                 345                 350
Gly Ala Trp Arg Ser Leu Asn Leu Asp Leu Asp Lys Phe Glu Ala Leu
        355                 360                 365
Arg Lys Asp Pro Lys Leu Gly Phe Glu Lys Leu Leu Val Ser Val Phe
    370                 375                 380
Ala Ser Pro Ala Lys Lys Gly Asp Ala Lys Val Gly Tyr Ser Thr Ala
385                 390                 395                 400
Thr Gly Arg Asp Ile Gly Ala Trp His Val Glu Gly Arg Asp Phe Ala
                405                 410                 415
Lys Ala Phe Thr Pro His Arg Thr Leu Phe Val Asp Ile Glu Ile Pro
            420                 425                 430
Arg Ile Val Asp Asp Ala Val Phe Arg Phe Arg Glu
        435                 440
<210>41
<211>1419
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>41
atgacgctcc gatcaacgga ctatgcgctg ctggcgcagg agagctacca cgacagccag     60
gtggacgccg acgtcaagct ggatggcgtg gcgtataaag tcttcgccac caccagcgac    120
gggctcaccg gattccaggc cacggcctac cagcgccagg acaccggcga ggtagtgatt    180
gcgtaccgcg gcacggagtt tgatcgcgag cccgtccgcg acggcggcgt cgatgcgggc    240
atggtgctgc tcggtgtcaa cgcacaggca ccagcgtcgg aagtgttcac ccggcaagtg    300
atcgagaagg cgaaacacga agccgagctc aacgaccgcg aaccgcagat caccgtcacc    360
ggccattccc tcggcggcac cctcgccgag atcaacgccg cgaagtacgg cctccatggc    420
gaaaccttca acgcctacgg cgcagccagc ctcaagggta ttccggaggg cggcgatacc    480
gtcatcgacc acgtccgtgc cggcgatctc gtcagcgcgg ccagccccca ctacgggcag    540
gtacgcgtct acgcggcgca gcaggacatc gatacgctgc aacacgccgg ttaccgcgat    600
gacagcggca tcctcagctt gcgcaacccg atcaaggcca cggatttcga tgcccatgcc    660
atcgataact tcgtgcccaa cagcaagctg ctcggtcagt cgatcatcgc gccggaaaac    720
gtggcgcgtt acgatgccca caaaggcatg gtcgaccgtt accgcgatga cgtggccgat    780
atccgcaagg gcatctcggc gccctgggaa atccccaagg ccatcggcga gctgaaggac    840
accctggagc acgaagcctt cgaactcgcc ggcaagggca ttctcgcggt ggagcacggc    900
ttcgaacatc tcaaggagga gatcggcgaa ggcatccacg ccgtggagga gaaagcttcc    960
agcgcgtggc ataccctcac ccatcccaag gaatggttcg agcacgataa acccaaggtg   1020
accctggacc acccggacca ccccgaccat gccctgttca agcaggcgca gggcgcggtg   1080
cacacagtcg atgcctcgca cggccgcacc cctgacaaga ccagcgacca gatcgccggc   1140
tcgctggtgg tatcggcacg ccgtgacggc cttgagcggg tagaccgcgc tgtactcagc   1200
gatgacgcca accgcctgta cggtgtgcag ggtgcggtgg actcgccgct gaagcaggtc   1260
accgaagtga acaccgccac cgccgcgcag acatcgctcc agcagagcag cgtggcctgg   1320
cagcaacagg cagaaatcgc gcgtcagaac caggcggcaa gccaggctca gcgcatggac   1380
cagcaggtgc cgccgcaggc acccgcgcac ggcatgtaa                          1419
<210>42
<211>472
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>42
Met Thr Leu Arg Ser Thr Asp Tyr Ala Leu Leu Ala Gln Glu Ser Tyr
 1               5                  10                  15
His Asp Ser Gln Val Asp Ala Asp Val Lys Leu Asp Gly Val Ala Tyr
            20                  25                  30
Lys Val Phe Ala Thr Thr Ser Asp Gly Leu Thr Gly Phe Gln Ala Thr
        35                  40                  45
Ala Tyr Gln Arg Gln Asp Thr Gly Glu ValVal Ile Ala Tyr Arg Gly
    50                  55                  60
Thr Glu Phe Asp Arg Glu Pro Val Arg Asp Gly Gly Val Asp Ala Gly
65                  70                  75                  80
Met Val Leu Leu Gly Val Asn Ala Gln Ala Pro Ala Ser Glu Val Phe
                85                  90                  95
Thr Arg Gln Val Ile Glu Lys Ala Lys His Glu Ala Glu Leu Asn Asp
            100                 105                 110
Arg Glu Pro Gln Ile Thr Val Thr Gly His Ser Leu Gly Gly Thr Leu
        115                 120                 125
Ala Glu Ile Asn Ala Ala Lys Tyr Gly Leu His Gly Glu Thr Phe Asn
    130                 135                 140
Ala Tyr Gly Ala Ala Ser Leu Lys Gly Ile Pro Glu Gly Gly Asp Thr
145                 150                 155                 160
Val Ile Asp His Val Arg Ala Gly Asp Leu Val Ser Ala Ala Ser Pro
                165                 170                 175
His Tyr Gly Gln Val Arg Val Tyr Ala Ala Gln Gln Asp Ile Asp Thr
            180                 185                 190
Leu Gln His Ala Gly Tyr Arg Asp Asp Ser Gly Ile Leu Ser Leu Arg
        195                 200                 205
Asn Pro Ile Lys Ala Thr Asp Phe Asp Ala His Ala Ile Asp Asn Phe
    210                 215                 220
Val Pro Asn Ser Lys Leu Leu Gly Gln Ser Ile Ile Ala Pro Glu Asn
225                 230                 235                 240
Val Ala Arg Tyr Asp Ala His Lys Gly Met Val Asp Arg Tyr Arg Asp
                245                 250                 255
Asp Val Ala Asp Ile Arg Lys Gly Ile Ser Ala Pro Trp Glu Ile Pro
            260                 265                 270
Lys Ala Ile Gly Glu Leu Lys Asp Thr Leu Glu His Glu Ala Phe Glu
        275                 280                 285
Leu Ala Gly Lys Gly Ile Leu Ala Val Glu His Gly Phe Glu His Leu
    290                 295                 300
Lys Glu Glu Ile Gly Glu Gly Ile His Ala Val Glu Glu Lys Ala Ser
305                 310                 315                 320
Ser Ala Trp His Thr Leu Thr His Pro Lys Glu Trp Phe Glu His Asp
                325                 330                 335
Lys Pro Lys Val Thr Leu Asp His Pro Asp His Pro Asp His Ala Leu
            340                 345                 350
Phe Lys Gln Ala Gln Gly Ala Val His Thr Val Asp Ala Ser His Gly
        355                 360                 365
Arg Thr Pro Asp Lys Thr Ser Asp Gln Ile Ala Gly Ser Leu Val Val
    370                 375                 380
Ser Ala Arg Arg Asp Gly Leu Glu Arg Val Asp Arg Ala Val Leu Ser
385                 390                 395                 400
Asp Asp Ala Asn Arg Leu Tyr Gly Val Gln Gly Ala Val Asp Ser Pro
                405                 410                 415
Leu Lys Gln Val Thr Glu Val Asn Thr Ala Thr Ala Ala Gln Thr Ser
            420                 425                 430
Leu Gln Gln Ser Ser Val Ala Trp Gln Gln Gln Ala Glu Ile Ala Arg
        435                 440                 445
Gln Asn Gln Ala Ala Ser Gln Ala Gln Arg Met Asp Gln Gln Val Pro
    450                 455                 460
Pro Gln Ala Pro Ala His Gly Met
465                 470
<210>43
<211>1287
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>43
atgtcgatta ccgtttaccg gaagccctcc ggcgggtttg gagcgatagt tcctcaagcg     60
aaaattgaga accttgtttt cgagggcggc ggaccaaagg gcctggtcta tgtcggcgcg    120
gtcgaggttc tcggtgaaag gggactgctg gaagggatcg caaatgtcgg cggcgcttca    180
gcaggcgcca tgaccgctct agccgtcggt ctgggactga gccccaggga aattcgcgcg    240
gtcgtcttta accagaacat tgcggacctc accgatatcg agaagaccgt cgagccgtcc    300
tccgggatca caggcatgtt caagagcgtg ttcaagaagg gttggcaggc ggtgcgcaac    360
gtaaccggca cctctgacga gcgcgggcgc gggctctatc gcggcgagaa gttgcgagcc    420
tggatcagag acctgattgc acagcgagtc gaggcagggc gctcagaggt gctgagccga    480
gccgacgccg acgggcggaa cttctatgag aaagccgccg caaagaaggg cgccctgaca    540
tttgccgaac ttgatcgggt ggcgcaaatg gcgccgggcc tgcggcttcg ccgcctggcc    600
ttcaccggaa ccaacttcac gtcgaagaag ctcgaagtgt tcagtctgca cgagaccccg    660
gacatgccga tcgacgtcgc ggtacgcatc tcggcatcgt tgccatggtt tttcaaatcc    720
gtgaaatgga acggctccga atacatagat ggcggatgcc tgtcgaactt cccaatgccg    780
atattcgacg tcgatcccta tcgtggcgac gcatcgtcga agatccggct cggcatcttc    840
ggccagaacc tcgcgacgct cggcttcaag gtcgacagcg aggaggagat ccgcgacatc    900
ctctggcgta gccccgagag cacgagcgac ggctttttcc aaggcatcct gtcaagcgtg    960
aaagcctcgg cagaacactg ggtcgtcggc atcgatgtcg agggcgccac ccgcgcgtcg   1020
aacgtggccg ttcacggcaa gtatgctcag cgaacgatcc agataccgga cctcggatat   1080
agcacgttca agttcgatct ctcagacgcg gacaaggagc gcatggccga ggccggcgca   1140
aaggccacgc gggaatggct ggcgctgtac ttcgacgacg ccggaataga ggtcgaattt   1200
tctgatccga acgaattgcg cggccagttg tccgacgccg cattcgcaga cctcgaggat   1260
tcgtttcgag ccttgatcgc ggcctag                                       1287
<210>44
<211>428
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>44
Met Ser Ile Thr Val Tyr Arg Lys Pro Ser Gly Gly Phe Gly Ala Ile
 1               5                  10                  15
Val Pro Gln Ala Lys Ile Glu Asn Leu Val Phe Glu Gly Gly Gly Pro
            20                  25                  30
Lys Gly Leu Val Tyr Val Gly Ala Val Glu Val Leu Gly Glu Arg Gly
        35                  40                  45
Leu Leu Glu Gly Ile Ala Asn Val Gly Gly Ala Ser Ala Gly Ala Met
    50                  55                  60
Thr Ala Leu Ala Val Gly Leu Gly Leu Ser Pro Arg Glu Ile Arg Ala
65                  70                  75                  80
Val Val Phe Asn Gln Asn Ile Ala Asp Leu Thr Asp Ile Glu Lys Thr
                85                  90                  95
Val Glu Pro Ser Ser Gly Ile Thr Gly Met Phe Lys Ser Val Phe Lys
            100                 105                 110
Lys Gly Trp Gln Ala Val Arg Asn Val Thr Gly Thr Ser Asp Glu Arg
        115                 120                 125
Gly Arg Gly Leu Tyr Arg Gly Glu Lys Leu Arg Ala Trp Ile Arg Asp
    130                 135                 140
Leu Ile Ala Gln Arg Val Glu Ala Gly Arg Ser Glu Val Leu Ser Arg
145                 150                 155                 160
Ala Asp Ala Asp Gly Arg Asn Phe Tyr Glu Lys Ala Ala Ala Lys Lys
                165                 170                 175
Gly Ala Leu Thr Phe Ala Glu Leu Asp Arg Val Ala Gln Met Ala Pro
            180                 185                 190
Gly Leu Arg Leu Arg Arg Leu Ala Phe Thr Gly Thr Asn Phe Thr Ser
        195                 200                 205
Lys Lys Leu Glu ValPhe Ser Leu His Glu Thr Pro Asp Met Pro Ile
    210                 215                 220
Asp Val Ala Val Arg Ile Ser Ala Ser Leu Pro Trp Phe Phe Lys Ser
225                 230                 235                 240
Val Lys Trp Asn Gly Ser Glu Tyr Ile Asp Gly Gly Cys Leu Ser Asn
                245                 250                 255
Phe Pro Met Pro Ile Phe Asp Val Asp Pro Tyr Arg Gly Asp Ala Ser
            260                 265                 270
Ser Lys Ile Arg Leu Gly Ile Phe Gly Gln Asn Leu Ala Thr Leu Gly
        275                 280                 285
Phe Lys Val Asp Ser Glu Glu Glu Ile Arg Asp Ile Leu Trp Arg Ser
    290                 295                 300
Pro Glu Ser Thr Ser Asp Gly Phe Phe Gln Gly Ile Leu Ser Ser Val
305                 310                 315                 320
Lys Ala Ser Ala Glu His Trp Val Val Gly Ile Asp Val Glu Gly Ala
                325                 330                 335
Thr Arg Ala Ser Asn Val Ala Val His Gly Lys Tyr Ala Gln Arg Thr
            340                 345                 350
Ile Gln Ile Pro Asp Leu Gly Tyr Ser Thr Phe Lys Phe Asp Leu Ser
        355                 360                 365
Asp Ala Asp Lys Glu Arg Met Ala Glu Ala Gly Ala Lys Ala Thr Arg
    370                 375                 380
Glu Trp Leu Ala Leu Tyr Phe Asp Asp Ala Gly Ile Glu Val Glu Phe
385                 390                 395                 400
Ser Asp Pro Asn Glu Leu Arg Gly Gln Leu Ser Asp Ala Ala Phe Ala
                405                 410                 415
Asp Leu Glu Asp Ser Phe Arg Ala Leu Ile Ala Ala
            420                 425
<210>45
<211>1038
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>45
atgacaaccc aatttagaaa cttgatattt gaaggcggcg gtgtaaaagg tgttgcttac     60
attggcgcca tgcagattct cgaaaatcgt ggcgtgttgc aagatattca ccgagtcgga    120
gggtgcagtg cgggtgcgat taatgcgctg atttttgcgc tgggttacac ggttcgtgag    180
caaaaagaga tcttacaagc caccgatttt aaccagttta tggataactc ttggggtgtt    240
attcgtgata ttcgcaggct tgctcgagac tttggctgga ataagggtga tttctttagt    300
agctggatag gtgatttgat tcatcgtcgt ttggggaatc gccgagcgac gttcaaagat    360
ctgcaaaatg ccaagcttcc tgatctttat gtcatcggta ctaatctgtc tacagggttt    420
gcagaggttt tttctgccga aagacacccc gatatggagc tggcgacagc ggtgcgtatc    480
tccatgtcga taccgctgtt ctttgcagcc gtgcgtcacg gtgatcgaca agatgtgtat    540
gtcgatgggg gtgttcaact taactatccg attaaactgt ttgatcggga gcgttacatt    600
gatctggcca aagatcccgg tgctgttcgg cgaacgggtt attacaacaa agaaaacgct    660
cgctttcagc ttgagcggcc cggtcatagc ccctatgttt acaatcgcca gaccttgggt    720
ttgcgtcttg atagtcgcga gcagataggg ctctttcgtt atgacgaacc cctcaagggc    780
aaacccatta agtccttcac tgactacgct cgacaacttt tcggtgcgtt gatgaatgca    840
caggaaaaga ttcatctaca tggcgatgat tggcaacgca cggtctatat cgatacattg    900
gatgtgggta cgacggactt caatctttct gatgcaacta agcaagcact gattgagcaa    960
ggaattaacg gcaccgaaaa ttatttcgag tggtttgata atccgttaga gaagcccgtg   1020
aatagagtgg agtcatag                                                 1038
<210>46
<211>345
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>46
Met Thr Thr Gln Phe Arg Asn Leu Ile Phe Glu Gly Gly Gly Val Lys
 1               5                  10                  15
Gly Val Ala Tyr Ile Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val
            20                  25                  30
Leu Gln Asp Ile His Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn
        35                  40                  45
Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile
    50                  55                  60
Leu Gln Ala Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val
65                  70                  75                  80
Ile Arg Asp Ile Arg Arg Leu Ala Arg Asp Phe Gly Trp Asn Lys Gly
                85                  90                  95
Asp Phe Phe Ser Ser Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly
            100                 105                 110
Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Asn Ala Lys Leu Pro Asp
        115                 120                 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ala Glu Val Phe
    130                 135                 140
Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile
145                 150                 155                 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Asp Arg
                165                 170                 175
Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys
            180                 185                 190
Leu Phe Asp Arg Glu Arg Tyr Ile Asp Leu Ala Lys Asp Pro Gly Ala
        195                 200                 205
Val Arg Arg Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu
    210                 215                 220
Glu Arg Pro Gly His Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225                 230                 235                 240
Leu Arg Leu Asp Ser Arg Glu Gln Ile Gly Leu Phe Arg Tyr Asp Glu
                245                 250                 255
Pro Leu Lys Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln
            260                 265                 270
Leu Phe Gly Ala Leu Met Asn Ala Gln Glu Lys Ile His Leu His Gly
        275                 280                 285
Asp Asp Trp Gln Arg Thr Val Tyr Ile Asp Thr Leu Asp Val Gly Thr
    290                 295                 300
Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln
305                 310                 315                 320
Gly Ile Asn Gly Thr Glu Asn Tyr Phe Glu Trp Phe Asp Asn Pro Leu
                325                 330                 335
Glu Lys Pro Val Asn Arg Val Glu Ser
            340                 345
<210>47
<211>1476
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>47
atgtcaacaa aagtagtatt tgtacatgga tggagcgtta ccaacctaaa tacatatggc     60
gaacttccgt tgagattaaa ggccgaagca ataagcagga acctgaacat cgaagtaaat    120
gaaattttcc tgggccgtta tatcagcttt aatgataaca ttacattaga tgacgtttcg    180
cgggctttta atacggccat tagcgaacag ttagacaata cagacaggtt tatatgtatt    240
acacattcta ccggagggcc ggttattcgc gaatggttaa ataaatacta ttataatgaa    300
cgtccaccac taagtcattt aataatgctt gcaccggcca attttggttc ggcattggct    360
cgtttaggga aaagtaaatt aagccgtatt aaaagttggt ttgaaggtgt agaaccaggg    420
cagaaaattt tagactggct ggagtgtgga agcaaccaat cgtggttact aaataaagac    480
tggatcgaca atggcaattt tcagattggc gctgataagt atttcccgtt tgttatcatt    540
ggccagtcga ttgatcgtaa actttacgat catcttaact catataccgg cgagcttggg    600
tccgatggtg tagttcgcac ctcaggagct aatcttaatt cgcggtatat taagcttgtt    660
caggacagaa atacaatagc taatggaaat atttccagta cattacgaat tgccgaatat    720
agagaagctt gtgcaacgcc catacgggta gttagaggta aatcgcattc gggcgatgaa    780
atgggtatcat gaaaagtgt taaaaaagaa attactgatg ccggaagcaa ggaaacaata    840
aatgccatat tcgagtgtat tgaagttaca aacaacgaac aatatcaatc cttaattact    900
aaatttgata acgaaacagc acaggtacaa aaggatgagc tgattgaaac ggaaacagaa    960
ttatttttaa tgcaccgtca tttcattcac gaccgctttt cgcaattcat ttttaaagta   1020
actgactcag aagggcaacc tgttacagat tatgatttaa tttttacagc cgggccacaa   1080
aacgatgcga accacttacc ggaaggattt gccattgaca ggcaacaaaa ttcaaataat   1140
aacgaaacca ttacgtatta ttttaattac gatgtattga aaggggctcc cgcaaatgtt   1200
taccgggacg cattaccagg tatttctatg ctggggctaa ccataaaccc aaggccggac   1260
gaaggttttg taagatatat cccatgcagc attaaagcca attccgagtt gatggaaaaa   1320
gcctttaaac caaattctac taccttggtc gatattgtta ttcaacgtgt agttagcaaa   1380
gaagtttttc ggttggaaaa gttaactggt agctcaatgc caacagacaa agatgggaat   1440
tttaaaaata ctgaacctgg taacgaaata atatga                             1476
<210>48
<211>491
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>48
Met Ser Thr Lys Val Val Phe Val His Gly Trp Ser Val Thr Asn Leu
 1               5                  10                  15
Asn Thr Tyr Gly Glu Leu Pro Leu Arg Leu Lys Ala Glu Ala Ile Ser
            20                  25                  30
Arg Asn Leu Asn Ile Glu Val Asn Glu Ile Phe Leu Gly Arg Tyr Ile
        35                  40                  45
Ser Phe Asn Asp Asn Ile Thr Leu Asp Asp Val Ser Arg Ala Phe Asn
    50                  55                  60
Thr Ala Ile Ser Glu Gln Leu Asp Asn Thr Asp Arg Phe Ile Cys Ile
65                  70                  75                  80
Thr His Ser Thr Gly Gly Pro Val Ile Arg Glu Trp Leu Asn Lys Tyr
                85                  90                  95
Tyr Tyr Asn Glu Arg Pro Pro Leu Ser His Leu Ile Met Leu Ala Pro
            100                 105                 110
Ala Asn Phe Gly Ser Ala Leu Ala Arg Leu Gly Lys Ser Lys Leu Ser
        115                 120                 125
Arg Ile Lys Ser Trp Phe Glu Gly Val Glu Pro Gly Gln Lys Ile Leu
    130                 135                 140
Asp Trp Leu Glu Cys Gly Ser Asn Gln Ser Trp Leu Leu Asn Lys Asp
145                 150                 155                 160
Trp Ile Asp Asn Gly Asn Phe Gln Ile Gly Ala Asp Lys Tyr Phe Pro
                165                 170                 175
Phe Val Ile Ile Gly Gln Ser Ile Asp Arg Lys Leu Tyr Asp His Leu
            180                 185                 190
Asn Ser Tyr Thr Gly Glu Leu Gly Ser Asp Gly Val Val Arg Thr Ser
        195                 200                 205
Gly Ala Asn Leu Asn Ser Arg Tyr Ile Lys Leu ValGln Asp Arg Asn
    210                 215                 220
Thr Ile Ala Asn Gly Asn Ile Ser Ser Thr Leu Arg Ile Ala Glu Tyr
225                 230                 235                 240
Arg Glu Ala Cys Ala Thr Pro Ile Arg Val Val Arg Gly Lys Ser His
                245                 250                 255
Ser Gly Asp Glu Met Gly Ile Met Lys Ser Val Lys Lys Glu Ile Thr
            260                 265                 270
Asp Ala Gly Ser Lys Glu Thr Ile Asn Ala Ile Phe Glu Cys Ile Glu
        275                 280                 285
Val Thr Asn Asn Glu Gln Tyr Gln Ser Leu Ile Thr Lys Phe Asp Asn
    290                 295                 300
Glu Thr Ala Gln Val Gln Lys Asp Glu Leu Ile Glu Thr Glu Thr Glu
305                 310                 315                 320
Leu Phe Leu Met His Arg His Phe Ile His Asp Arg Phe Ser Gln Phe
                325                 330                 335
Ile Phe Lys Val Thr Asp Ser Glu Gly Gln Pro Val Thr Asp Tyr Asp
            340                 345                 350
Leu Ile Phe Thr Ala Gly Pro Gln Asn Asp Ala Asn His Leu Pro Glu
        355                 360                 365
Gly Phe Ala Ile Asp Arg Gln Gln Asn Ser Asn Asn Asn Glu Thr Ile
    370                 375                 380
Thr Tyr Tyr Phe Asn Tyr Asp Val Leu Lys Gly Ala Pro Ala Asn Val
385                 390                 395                 400
Tyr Arg Asp Ala Leu Pro Gly Ile Ser Met Leu Gly Leu Thr Ile Asn
                405                 410                 415
Pro Arg Pro Asp Glu Gly Phe Val Arg Tyr Ile Pro Cys Ser Ile Lys
            420                 425                 430
Ala Asn Ser Glu Leu Met Glu Lys Ala Phe Lys Pro Asn Ser Thr Thr
        435                 440                 445
Leu Val Asp Ile Val Ile Gln Arg Val Val Ser Lys Glu Val Phe Arg
    450                 455                 460
Leu Glu Lys Leu Thr Gly Ser Ser Met Pro Thr Asp Lys Asp Gly Asn
465                 470                 475                 480
Phe Lys Asn Thr Glu Pro Gly Asn Glu Ile Ile
                485                 490
<210>49
<211>1257
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>49
atgaattttt ggtcctttct tcttagtata accttaccta tgggggtagg cgttgctcat     60
gcacagcccg atacggattt tcaatcggct gagccttatg tctcttctgc gccaatgggg    120
cgacaaactt atacttacgt gcgttgttgg tatcgcacca gccacagtac ggatgatcca    180
gcgacagatt ggcagtgggc gagaaactcc gatggtagct attttacttt gcaaggatac    240
tggtggagct cggtaagact aaaaaatatg ttttacactc aaacctcgca aaatgttatt    300
cgtcagcgct gcgaacacac tttaagcatt aatcatgata atgcggatat tactttttat    360
gcggcggata atcgtttctc attaaaccat acgatttggt cgaatgatcc tgtcatgcag    420
gctaatcaaa tcaacaagat tgtcgcgttt ggtgacagct tgtccgatac cggtaatatt    480
tttaatgccg cgcagtggcg ttttcctaat cccaatagtt ggtttttggg gcatttttct    540
aacggtttgg tatggactga gtacttagct aaacagaaaa acttaccgat atataactgg    600
gcggttggtg gcgctgctgg ggcgaatcaa tatgtggcgt taaccggtgt tacaggccaa    660
gtgaactctt atttacagta catgggtaaa gcgcaaaact atcgtccaca gaataccttg    720
tacactttgg tcttcggttt gaatgatttt atgaattata accgtgaggt tgctgaggtg    780
gcggctgatt ttgaaacggc attacagcgt ttaacgcaag ctggcgcgca aaatatttta    840
atgatgacgc taccggatgt gactaaagca ccacagttta cctactcaac tcaagcggaa    900
atcgacttga ttcaaggtaa aatcaatgcg ttgaacatca agttaaaaca gttgactgcg    960
caatatattt tacaaggcta tgccattcat ctatttgata cttatgagtt atttgattca   1020
atggtcgctg aaccggaaaa gcatggcttt gctaatgcca gtgaaccttg tttgaatctc   1080
acccgttctt cagcggcgga ttatttgtac cgtcatccca ttaccaatac ttgtgctcgt   1140
tatggtgcag acaaatttgt attttgggat gtcacccatc caaccacggc aactcatcgc   1200
tatatttcac aaacgctgtt agcgccgggt aatggattac aatattttaa tttttaa      1257
<210>50
<211>418
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(23)
<400>50
Met Asn Phe Trp Ser Phe Leu Leu Ser Ile Thr Leu Pro Met Gly Val
 1               5                  10                  15
Gly Val Ala His Ala Gln Pro Asp Thr Asp Phe Gln Ser Ala Glu Pro
            20                  25                  30
Tyr Val Ser Ser Ala Pro Met Gly Arg Gln Thr Tyr Thr Tyr Val Arg
        35                  40                  45
Cys Trp Tyr Arg Thr Ser His Ser Thr Asp Asp Pro Ala Thr Asp Trp
    50                  55                  60
Gln Trp Ala Arg Asn Ser Asp Gly Ser Tyr Phe Thr Leu Gln Gly Tyr
65                  70                  75                  80
Trp Trp Ser Ser Val Arg Leu Lys Asn Met Phe Tyr Thr Gln Thr Ser
                85                  90                  95
Gln Asn Val Ile Arg Gln Arg Cys Glu His Thr Leu Ser Ile Asn His
            100                 105                 110
Asp Asn Ala Asp Ile Thr Phe Tyr Ala Ala Asp Asn Arg Phe Ser Leu
        115                 120                 125
Asn His Thr Ile Trp Ser Asn Asp Pro Val Met Gln Ala Asn Gln Ile
    130                 135                 140
Asn Lys Ile Val Ala Phe Gly Asp Ser Leu Ser Asp Thr Gly Asn Ile
145                 150                 155                 160
Phe Asn Ala Ala Gln Trp Arg Phe Pro Asn Pro Asn Ser Trp Phe Leu
                165                 170                 175
Gly His Phe Ser Asn Gly Leu Val Trp Thr Glu Tyr Leu Ala Lys Gln
            180                 185                 190
Lys Asn Leu Pro Ile Tyr Asn Trp Ala Val Gly Gly Ala Ala Gly Ala
        195                 200                 205
Asn Gln Tyr Val Ala Leu Thr Gly Val Thr Gly Gln Val Asn Ser Tyr
    210                 215                 220
Leu Gln Tyr Met Gly Lys Ala Gln Asn Tyr Arg Pro Gln Asn Thr Leu
225                 230                 235                 240
Tyr Thr Leu Val Phe Gly Leu Asn Asp Phe Met Asn Tyr Asn Arg Glu
                245                 250                 255
Val Ala Glu Val Ala Ala Asp Phe Glu Thr Ala Leu Gln Arg Leu Thr
            260                 265                 270
Gln Ala Gly Ala Gln Asn Ile Leu Met Met Thr Leu Pro Asp Val Thr
        275                 280                 285
Lys Ala Pro Gln Phe Thr Tyr Ser Thr Gln Ala Glu Ile Asp Leu Ile
    290                 295                 300
Gln Gly Lys Ile Asn Ala Leu Asn Ile Lys Leu Lys Gln Leu Thr Ala
305                 310                 315                 320
Gln Tyr Ile Leu Gln Gly Tyr Ala Ile His Leu Phe Asp Thr Tyr Glu
                325                 330                 335
Leu Phe Asp Ser Met Val Ala Glu Pro Glu Lys His Gly Phe Ala Asn
            340                 345                 350
Ala Ser Glu Pro Cys Leu Asn Leu Thr Arg Ser Ser Ala Ala Asp Tyr
        355                 360                 365
Leu Tyr Arg His Pro Ile Thr Asn Thr Cys Ala Arg Tyr Gly Ala Asp
    370                 375                 380
Lys Phe Val Phe Trp Asp Val Thr His Pro Thr Thr Ala Thr His Arg
385                 390                 395                 400
Tyr Ile Ser Gln Thr Leu Leu Ala Pro Gly Asn Gly Leu Gln Tyr Phe
                405                 410                 415
Asn Phe
<210>51
<211>1482
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>51
atgacaatcc gctcaacgga ctatgcgctg ctcgcgcagg agagctacca cgacagccag     60
gtcgatgccg acgtcaaact cgatggcatc gcctacaagg tcttcgccac caccgatgac    120
ccgctcacgg ggttccaggc caccgcgtac cagcgccagg acaccggcga agtcgtcatc    180
gcctatcgtg gtacggaatt cgaccgcgag cccgttcgcg acggcggcgt cgatgccggc    240
atggtgctgc tgggggtgaa tgcccagtcg cctgcctccg agctatttac ccgcgaagtg    300
atcgagaagg cgacgcacga agccgaactc aatgaccgcg agccccggat caccgtgact    360
ggccactccc tcggcggcac cctcgccgaa atcaacgcgg ccaagtacgg cctgcacggc    420
gaaaccttca acgcatacgg tgcggccagc ctcaagggca tcccggaagg cggcaatacc    480
gtgatcgacc acgtgcgcgc tggcgacctc gtcagcgccg ccagcccgca ttacgggcag    540
gtgcgcgtct acgcggccca gcaggatatc gacaccttgc agcatgccgg ctaccgcgac    600
gacagcggca tccttagcct gcgcaacccg atcaaggcca cggatttcga cgcgcacgcc    660
atcgacaact tcgtgccgaa cagcaaactg cttggccagt cgatcatcgc gccggaaaac    720
gaagcccgtt acgaagccca caagggcatg gtcgaccgct accgcgatga cgtggctgac    780
atccgcatgc tcgtctccgc tcccctgaac atcccgcgca ccatcggcga tatcaaggat    840
gccgtggaac gcgaggcatt tgagctggct ggcaagggca tcctcgccgt tgaacacggc    900
atcgaagagg tcgtgcacga ggcaaaggaa ggcttcgagc acctcaagga aggctttgag    960
cacctgaagg aagaagtcag cgagggcttc catgccttcg aggaaaaggc ctccagcgcg   1020
tggcatacgc tgacccatcc caaggaatgg ttcgagcacg acaagccgca ggtcgccctg   1080
aaccacccac agcacccgga caacgaactg ttcaagaagg tgctcgaagg cgtgcaccag   1140
gttgatgcga agcagggtcg ttcacccgac cagctcagtg agaacctggc cgcatcgctt   1200
accgttgccg cacgcaagga aggcctggac aaggtcaacc acgtgctgct cgacgacccc   1260
ggcattcgca cctacgccgt gcagggtgag ctcaactcgc cgttgaagca ggtctccagt   1320
gtcgataacg cccaggcggt cgccacaccg gtggcccaga gcagcgcgca atggcagcag   1380
gctgccgagg cgcggcaggc acagcacaat gaggcgcttg cgcagcagca ggcgcaacag   1440
cagcagaaca accggcccaa ccatggggtt gccggcccgt ga                      1482
<210>52
<211>493
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>52
Met Thr Ile Arg Ser Thr Asp Tyr Ala Leu Leu Ala Gln Glu Ser Tyr
 1               5                  10                  15
His Asp Ser Gln Val Asp Ala Asp Val Lys Leu Asp Gly Ile Ala Tyr
            20                  25                  30
Lys Val Phe Ala Thr Thr Asp Asp Pro Leu Thr Gly Phe Gln Ala Thr
        35                  40                  45
Ala Tyr Gln Arg Gln Asp Thr Gly Glu Val Val Ile Ala Tyr Arg Gly
    50                  55                  60
Thr Glu Phe Asp Arg Glu Pro Val Arg Asp Gly Gly Val Asp Ala Gly
65                  70                  75                  80
Met Val Leu Leu Gly Val Asn Ala Gln Ser Pro Ala Ser Glu Leu Phe
                85                  90                  95
Thr Arg Glu Val Ile Glu Lys Ala Thr His Glu Ala Glu Leu Asn Asp
            100                 105                 110
Arg Glu Pro Arg Ile Thr Val Thr Gly His Ser Leu Gly Gly Thr Leu
        115                 120                 125
Ala Glu Ile Asn Ala Ala Lys Tyr Gly Leu His Gly Glu Thr Phe Asn
    130                 135                 140
Ala Tyr Gly Ala Ala Ser Leu Lys Gly Ile Pro Glu Gly Gly Asn Thr
145                 150                 155                 160
Val Ile Asp His Val Arg Ala Gly Asp Leu Val Ser Ala Ala Ser Pro
                165                 170                 175
His Tyr Gly Gln Val Arg Val Tyr Ala Ala Gln Gln Asp Ile Asp Thr
            180                 185                 190
Leu Gln His Ala Gly Tyr Arg Asp Asp Ser Gly Ile Leu Ser Leu Arg
        195                 200                 205
Asn Pro Ile Lys Ala Thr Asp Phe Asp Ala His Ala Ile Asp Asn Phe
    210                 215                 220
Val Pro Asn Ser Lys Leu Leu Gly Gln Ser Ile Ile Ala Pro Glu Asn
225                 230                 235                 240
Glu Ala Arg Tyr Glu Ala His Lys Gly Met Val Asp Arg Tyr Arg Asp
                245                 250                 255
Asp Val Ala Asp Ile Arg Met Leu Val Ser Ala Pro Leu Asn Ile Pro
            260                 265                 270
Arg Thr Ile Gly Asp Ile Lys Asp Ala Val Glu Arg Glu Ala Phe Glu
        275                 280                 285
Leu Ala Gly Lys Gly Ile Leu Ala Val Glu His Gly Ile Glu Glu Val
    290                 295                 300
Val His Glu Ala Lys Glu Gly Phe Glu His Leu Lys Glu Gly Phe Glu
305                 310                 315                 320
His Leu Lys Glu Glu Val Ser Glu Gly Phe His Ala Phe Glu Glu Lys
                325                 330                 335
Ala Ser Ser Ala Trp His Thr Leu Thr His Pro Lys Glu Trp Phe Glu
            340                 345                 350
His Asp Lys Pro Gln Val Ala Leu Asn His Pro Gln His Pro Asp Asn
        355                 360                 365
Glu Leu Phe Lys Lys Val Leu Glu Gly Val His Gln Val Asp Ala Lys
    370                 375                 380
Gln Gly Arg Ser Pro Asp Gln Leu Ser Glu Asn Leu Ala Ala Ser Leu
385                 390                 395                 400
Thr Val Ala Ala Arg Lys Glu Gly Leu Asp Lys Val Asn His Val Leu
                405                 410                 415
Leu Asp Asp Pro Gly Ile Arg Thr Tyr Ala Val Gln Gly Glu Leu Asn
            420                 425                 430
Ser Pro Leu Lys Gln Val Ser Ser Val Asp Asn Ala Gln Ala Val Ala
        435                 440                 445
Thr Pro Val Ala Gln Ser Ser Ala Gln Trp Gln Gln Ala Ala Glu Ala
    450                 455                 460
Ara Gln Ala Gln His Asn Glu Ala Leu Ala Gln Gln Gln Ala Gln Gln
465                 470                 475                 480
Gln Gln Asn Asn Arg Pro Asn His Gly Val Ala Gly Pro
                485                 490
<210>53
<211>1491
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>53
atgcgtcagg ttacattagt atttgttcat ggctacagcg ttacaaacat cgacacttat      60
ggtgaaatgc cactcaggct ccgcaacgaa ggagccacac gtgatataga aataaaaatt     120
gagaacattt tcctggggcg ctacatcagc tttaatgatg atgtgagatt aaatgatgtt     180
tccagagcat tggaaacagc cgtacaacaa cagattgcac cgggaaataa aaacaattcc     240
cgttacgtat tcatcaccca ctctaccggc ggaccggtag tgagaaactg gtgggatctg     300
tactataaaa acagcacgaa acaatgccct atgagccacc tcattatgct ggctcctgcc     360
aattttggct cggcactggc acaactggga aaaagcaaac taagccgcat taaatcctgg     420
ttcgatggtg tggaacccgg acagaatgta ttgaattggc tggaactggg aagcgcggaa     480
gcatggaagc taaacaccga ctggattaag agtgatggaa gtcagatctc ggcacagggt     540
atttttcctt ttgtgatcat aggtcaggac attgaccgca aattatacga tcatttaaac     600
tcctacaccg gtgagctggg ttccgacggc gtggtgcgtt cggccgcagc caatttaaat     660
gctacttatg taaaactcac acaacctaaa cccaccttgg taaatggaaa actggtaaca     720
ggtaatctgg aaataggaga agtaaaacaa gcgccttata cacccatgcg catcgtctca     780
aaaaaatcgc attccaacaa ggatatggga attatgagaa gtgtactgaa atcaacaaat    840
gatgccaaca gcgccgaaac ggtaaacgcc atttttgact gcattaatgt gaaaacctta    900
accgattacc agagcattgc cacacagttt gattcgcaaa caaaagacgt gcaggaaaat    960
tcaattattg aaagggaaaa aacgcccttt ggaactaaaa actatattca cgaccgtttc   1020
tcccaggtca ttttcagagt aacagacagt gaaggttacc cggttaccag ttttgatctg   1080
atcctcaccg gcggcgaaaa aaatgatccc aacgccttgc ctcagggctt ttttgtggac   1140
agacaatgca acagtgtcaa taaatcgacc attacttatt ttttaaatta cgatattatg   1200
aacggcacac cagctatagc aggtataaga ccggcatcca aaggcatgga aaaactgggt   1260
ctgatcatta acccaaggcc tgaagaaggc tttgtgcgtt acattccctg caaaataaac   1320
acatcgcccg atttgtttga cgccgctctg aaacccaacg ccacaacgct tattgatatt   1380
gtattgcaac gcgtggtaag taccgaagta ttccgctttg aaggaacaga cggggtaacg   1440
ccgcctaaaa aagatttctc gaaagtgaaa cccggaacgg atattatttg a            1491
<210>54
<211>496
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>54
Met Arg Gln Val Thr Leu Val Phe Val His Gly Tyr Ser Val Thr Asn
 1               5                  10                  15
Ile Asp Thr Tyr Gly Glu Met Pro Leu Arg Leu Arg Asn Glu Gly Ala
            20                  25                  30
Thr Arg Asp Ile Glu Ile Lys Ile Glu Asn Ile Phe Leu Gly Arg Tyr
        35                  40                  45
Ile Ser Phe Asn Asp Asp Val Arg Leu Asn Asp Val Ser Arg Ala Leu
    50                  55                  60
Glu Thr Ala Val Gln Gln Gln Ile Ala Pro Gly Asn Lys Asn Asn Ser
65                  70                  75                  80
Arg Tyr Val Phe Ile Thr His Ser Thr Gly Gly Pro Val Val Arg Asn
                85                  90                  95
Trp Trp Asp Leu Tyr Tyr Lys Asn Ser Thr Lys Gln Cys Pro Met Ser
            100                 105                 110
His Leu Ile Met Leu Ala Pro Ala Asn Phe Gly Ser Ala Leu Ala Gln
        115                 120                 125
Leu Gly Lys Ser Lys Leu Ser Arg Ile Lys Ser Trp Phe Asp Gly Val
    130                 135                 140
Glu Pro Gly Gln Asn Val Leu Asn Trp Leu Glu Leu Gly Ser Ala Glu
145                 150                 155                 160
Ala Trp Lys Leu Asn Thr Asp Trp Ile Lys Ser Asp Gly Ser Gln Ile
                165                 170                 175
Ser Ala Gln Gly Ile Phe Pro Phe Val Ile Ile Gly Gln Asp Ile Asp
            180                 185                 190
Ara Lys Leu Tyr Asp His Leu Asn Ser Tyr Thr Gly Glu Leu Gly Ser
        195                 200                 205
Asp Gly Val Val Arg Ser Ala Ala Ala Asn Leu Asn Ala Thr Tyr Val
    210                 215                 220
Lys Leu Thr Gln Pro Lys Pro Thr Leu Val Asn Gly Lys Leu Val Thr
225                 230                 235                 240
Gly Asn Leu Glu Ile Gly Glu Val Lys Gln Ala Pro Tyr Thr Pro Met
                245                 250                 255
Arg Ile Val Ser Lys Lys Ser His Ser Asn Lys Asp Met Gly Ile Met
            260                 265                 270
Arg Ser Val Leu Lys Ser Thr Asn Asp Ala Asn Ser Ala Glu Thr Val
        275                 280                 285
Asn Ala Ile Phe Asp Cys Ile Asn Val Lys Thr Leu Thr Asp Tyr Gln
    290                 295                 300
Ser Ile Ala Thr Gln Phe Asp Ser Gln Thr Lys Asp Val Gln Glu Asn
305                 310                 315                 320
Ser Ile Ile Glu Arg Glu Lys Thr Pro Phe Gly Thr Lys Asn Tyr Ile
                325                 330                 335
His Asp Arg Phe Ser Gln Val Ile Phe Arg Val Thr Asp Ser Glu Gly
            340                 345                 350
Tyr Pro Val Thr Ser Phe Asp Leu Ile Leu Thr Gly Gly Glu Lys Asn
        355                 360                 365
Asp Pro Asn Ala Leu Pro Gln Gly Phe Phe Val Asp Arg Gln Cys Asn
    370                 375                 380
Ser Val Asn Lys Ser Thr Ile Thr Tyr Phe Leu Asn Tyr Asp Ile Met
385                 390                 395                 400
Asn Gly Thr Pro Ala Ile Ala Gly Ile Arg Pro Ala Ser Lys Gly Met
                405                 410                 415
Glu Lys Leu Gly Leu Ile Ile Asn Pro Arg Pro Glu Glu Gly Phe Val
            420                 425                 430
Arg Tyr Ile Pro Cys Lys Ile Asn Thr Ser Pro Asp Leu Phe Asp Ala
        435                 440                 445
Ala Leu Lys Pro Asn Ala Thr Thr Leu Ile Asp Ile Val Leu Gln Arg
    450                 455                 460
Val Val Ser Thr Glu Val Phe Arg Phe Glu Gly Thr Asp Gly Val Thr
465                 470                 475                 480
Pro Pro Lys Lys Asp Phe Ser Lys ValLys Pro Gly Thr Asp Ile Ile
                485                 490                 495
<210>55
<211>1041
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>55
atggcttcac aattcagaaa tctggttttt gaaggaggcg gtgtgaaggg catcgcctat     60
atcggcgcca tgcaggtgct ggagcagcgg ggactgctca aggatattgt ccgggtggga    120
ggtaccagtg caggcgccat caacgcgctg atcttttcgc tgggctttac catcaaagag    180
cagcaggata ttctcaactc caccaacttc agggagttta tggacagctc gttcgggttc    240
atccgaaact tccggaggtt atggagcgaa ttcggttgga accgcggcga tgtattttcg    300
gactgggccg gggagctggt gaaagagaag ctcggcaaaa agaacgccac gttcggcgat    360
ctgaaaaagg cgaaacgtcc cgatctgtac gtgatcggca ccaatctctc tacggggttt    420
tccgagacct tttcgcacga acgccacgcc gacatgcctc tggtagatgc ggtgcggata    480
agcatgtcga tcccgctctt ttttgctgca cggaggctgg gaaaacgtaa ggatgtgtat    540
gtggatggcg gggtgatgct caactatccc gtgaagctgt tcgacaggga gaagtatatc    600
gatttggaga aagagaatga ggcggcccgc tatgtggagt actacaatca agagaatgcc    660
cggtttctgc tcgagcggcc cggccgaagc ccttatgtgt ataaccggca gactctcggt    720
ctgcggctcg acacgcagga agagatcggc ctgttccgtt acgatgagcc gctgaagggc    780
aagcagatca accgtttccc cgaatacgcc agagccctga tcggctcgct gatgcaggta    840
caggagaaca tccacctgaa aagtgacgac tggcagcgaa cgctctacat caacacgctg    900
gatgtgggca ccaccgattt cgacattacc gacgagaaga aaaaagtgct ggtgaatgag    960
gggatcaagg gagcggagac ctatttccgc tggtttgagg atcccgaaga aaaaccggtg   1020
aataaggtga atcttgtctg a                                             1041
<210>56
<211>346
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>56
Met Ala Ser Gln Phe Arg Asn Leu Val Phe Glu Gly Gly Gly Val Lys
 1               5                  10                  15
Gly Ile Ala Tyr Ile Gly Ala Met Gln Val Leu Glu Gln Arg Gly Leu
            20                  25                  30
Leu Lys Asp Ile Val Arg Val Gly Gly Thr Ser Ala Gly Ala Ile Asn
        35                  40                  45
Ala Leu Ile Phe Ser Leu Gly Phe Thr Ile Lys Glu Gln Gln Asp Ile
    50                  55                  60
Leu Asn Ser Thr Asn Phe Arg Glu Phe Met Asp Ser Ser Phe Gly Phe
65                  70                  75                  80
Ile Arg Asn Phe Arg Arg Leu Trp Ser Glu Phe Gly Trp Asn Arg Gly
                85                  90                  95
Asp Val Phe Ser Asp Trp Ala Gly Glu Leu Val Lys Glu Lys Leu Gly
            100                 105                 110
Lys Lys Asn Ala Thr Phe Gly Asp Leu Lys Lys Ala Lys Arg Pro Asp
        115                 120                 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ser Glu Thr Phe
    130                 135                 140
Ser His Glu Arg His Ala Asp Met Pro Leu Val Asp Ala Val Arg Ile
145                 150                 155                 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Arg Arg Leu Gly Lys Arg
                165                 170                 175
Lys Asp Val Tyr Val Asp Gly Gly Val Met Leu Asn Tyr Pro Val Lys
            180                 185                 190
Leu Phe Asp Arg Glu Lys Tyr Ile Asp Leu Glu Lys Glu Asn Glu Ala
        195                 200                 205
Ala Arg Tyr Val Glu Tyr Tyr Asn Gln Glu Asn Ala Arg Phe Leu Leu
    210                 215                 220
Glu Arg Pro Gly Arg Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225                 230                 235                 240
Leu Arg Leu Asp Thr Gln Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu
                245                 250                 255
Pro Leu Lys Gly Lys Gln Ile Asn Arg Phe Pro Glu Tyr Ala Arg Ala
            260                 265                 270
Leu Ile Gly Ser Leu Met Gln Val Gln Glu Asn Ile His Leu Lys Ser
        275                 280                 285
Asp Asp Trp Gln Arg Thr Leu Tyr Ile Asn Thr Leu Asp Val Gly Thr
    290                 295                 300
Thr Asp Phe Asp Ile Thr Asp Glu Lys Lys Lys Val Leu Val Asn Glu
305                 310                 315                 320
Gly Ile Lys Gly Ala Glu Thr Tyr Phe Arg Trp Phe Glu Asp Pro Glu
                325                 330                 335
Glu Lys Pro Val Asn Lys Val Asn Leu Val
            340                 345
<210>57
<211>1413
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>57
atgcaattag tgttcgtaca cgggtggagt gttacccata ccaataccta tggtgaatta     60
cccgaaagtt tggcggcagg cgccgcgaca cacggcctgc agatcgatat caggcacgtt    120
tttctcggca agtacatcag ctttcacgat gaggtgactc tggatgatat agcacgtgcc    180
ttcgacaagg cgctgagaga catgtcgggt gatggtgaca cggtctcgcc tttctcctgt    240
atcacgcatt cgaccggcgg ccctgtcgtt cggcactgga ttaacaaatt ctacggcgcg    300
cgagggctat cgaaactgcc gctggagcat ttggttatgc tggcgcctgc caaccacggc    360
tccagcctgg cggtactcgg caagcaacgt cttggtcgca tcaagtcctg gttcgatggc    420
gtggagcccg gacaaaaagt gctcgactgg ctatcgctgg gcagcaatgg gcaatgggcg    480
ctcaacaggg attttttgag ctaccgcccg gccaaacatg gcttcttccc ttttgttctg    540
acgggccagg gtatagacac aaaattctac gattttttga acagctacct tgtggagccc    600
ggcagtgacg gtgtggttcg cgtggcgggt gccaatatgc attttcgcta cctctccctg    660
gtacaatctg agaccgtatt acacaccccg ggcaaggtgc tacagctgga atataacgag    720
cggcgccccg tgaagtcccc acaagcggta ccgatgggcg tcttctccca atttagccac    780
tctggcgaca agatggggat tatggcagtc aagcgcaaga aagacgcgca tcaaatgatc    840
gtaacggaag tgctgaagtg tctctgcgta tcggacagcg atgaatatca gcaaagaggc    900
cttgaacttg cagaactgac cgccagcgaa cagcgcaagc ccatcgaaga ccaggacaag    960
attatcagcc gctatagcat gctggtattt agagtgcgcg accaggcggg caatacgatc   1020
ggagtgcacg atttcgatat cctcttactg gccggagata cctatagccc cgacaaactg   1080
ccagaggggt tcttcatgga taaacaggcc aatagagatg ccggctcact gatctactat   1140
gtggatgccg acaaaatgtc cgagatgaaa gatggctgct acggactgcg ggtggtcgtg   1200
cggccggaga aagggttttc ctattacaca acaggtgagt tcaggtcaga gggtatcccc   1260
gtggaccgtg tatttgcagc aaacgaaacc acctatattg atatcaccat gaaccgaagt   1320
gtcgatcaaa atgtattccg gttttcgcct gcaacagagc cacctgaaag cttcaaaaga   1380
accacgccct caggtaccga tatcccttca tag                                1413
<210>58
<211>470
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>58
Met Gln Leu Val Phe Val His Gly Trp Ser Val Thr His Thr Asn Thr
 1               5                  10                  15
Tyr Gly Glu Leu Pro Glu Ser Leu Ala Ala Gly Ala Ala Thr His Gly
            20                  25                  30
Leu Gln Ile Asp Ile Arg His Val Phe Leu Gly Lys Tyr Ile Ser Phe
        35                  40                  45
His Asp Glu Val Thr Leu Asp Asp Ile Ala Arg Ala Phe Asp Lys Ala
    50                  55                  60
Leu Arg Asp Met Ser Gly Asp Gly Asp Thr Val Ser Pro Phe Ser Cys
65                  70                  75                  80
Ile Thr His Ser Thr Gly Gly Pro Val Val Arg His Trp Ile Asn Lys
                85                  90                  95
Phe Tyr Gly Ala Arg Gly Leu Ser Lys Leu Pro Leu Glu His Leu Val
            100                 105                 110
Met Leu Ala Pro Ala Asn His Gly Ser Ser Leu Ala Val Leu Gly Lys
        115                 120                 125
Gln Arg Leu Gly Arg Ile Lys Ser Trp Phe Asp Gly Val Glu Pro Gly
    130                 135                 140
Gln Lys Val Leu Asp Trp Leu Ser Leu Gly Ser Asn Gly Gln Trp Ala
145                 150                 155                 160
Leu Asn Arg Asp Phe Leu Ser Tyr Arg Pro Ala Lys His Gly Phe Phe
                165                 170                 175
Pro Phe Val Leu Thr Gly Gln Gly Ile Asp Thr Lys Phe Tyr Asp Phe
            180                 185                 190
Leu Asn Ser Tyr Leu Val Glu Pro Gly Ser Asp Gly Val Val Arg Val
        195                 200                 205
Ala Gly Ala Asn Met His Phe Arg Tyr Leu Ser Leu Val Gln Ser Glu
    210                 215                 220
Thr Val Leu His Thr Pro Gly Lys Val Leu Gln Leu Glu Tyr Asn Glu
225                 230                 235                 240
Arg Arg Pro Val Lys Ser Pro Gln Ala Val Pro Met Gly Val Phe Ser
                245                 250                 255
Gln Phe Ser His Ser Gly Asp Lys Met Gly Ile Met Ala Val Lys Arg
            260                 265                 270
Lys Lys Asp Ala His Gln Met Ile Val Thr Glu Val Leu Lys Cys Leu
        275                 280                 285
Cys Val Ser Asp Ser Asp Glu Tyr Gln Gln Arg Gly Leu Glu Leu Ala
    290                 295                 300
Glu Leu Thr Ala Ser Glu Gln Arg Lys Pro Ile Glu Asp Gln Asp Lys
305                 310                 315                 320
Ile Ile Ser Arg Tyr Ser Met Leu Val Phe Arg Val Arg Asp Gln Ala
                325                 330                 335
Gly Asn Thr Ile Gly Val His Asp Phe Asp Ile Leu Leu Leu Ala Gly
            340                 345                 350
Asp Thr Tyr Ser Pro Asp Lys Leu Pro Glu Gly Phe Phe Met Asp Lys
        355                 360                 365
Gln Ala Asn Arg Asp Ala Gly Ser Leu Ile Tyr Tyr Val Asp Ala Asp
    370                 375                 380
Lys Met Ser Glu Met Lys Asp Gly Cys Tyr Gly Leu Arg Val Val Val
385                 390                 395                 400
Arg Pro Glu Lys Gly Phe Ser Tyr Tyr Thr Thr Gly Glu Phe Arg Ser
                405                 410                 415
Glu Gly Ile Pro Val Asp Arg Val Phe Ala Ala Asn Glu Thr Thr Tyr
            420                 425                 430
Ile Asp Ile Thr Met Asn Arg Ser Val Asp Gln Asn Val Phe Arg Phe
        435                 440                 445
Ser Pro Ala Thr Glu Pro Pro Glu Ser Phe Lys Arg Thr Thr Pro Ser
    450                 455                 460
Gly Thr Asp Ile Pro Ser
465                 470
<210>59
<211>1038
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>59
atgacaacac aatttagaaa cttgatcttt gaaggcggcg gtgtaaaagg cgttgcttac     60
attggcgcca tgcagattct tgaaaatcgt ggcgtgttgc aagatattcg ccgagtcgga    120
gggtgcagtg cgggtgcgat taacgcgctg atttttgcgc tgggttacac ggtccgtgag    180
caaaaagaga tcttacaagc caccgatttt aaccagttta tggataactc ttggggggtt    240
attcgtgata ttcgcaggct tgctcgagac tttggctgga ataagggtga tttctttagt    300
agctggatag gtgatttgat tcatcgtcgt ttggggaatc gccgagcgac gttcaaagat    360
ctgcaaaagg ccaagcttcc tgatctttat gtcatcggta ctaatctgtc tacagggttt    420
gcagaggtgt tttctgccga aagacacccc gatatggagc tggcgacagc ggtgcgtatc    480
tccatgtcga taccgctgtt ctttgcggca gtgcgtcatg gtgatcgaca agatgtgtat    540
gtcgatgggg gtgttcaact taactatccg attaaactgt ttgatcggga gcgttatatt    600
gatctggcca aagatcccgg tgccgttcgg cgaacgggtt attacaacaa agaaaacgct    660
cgctttcagc ttgatcggcc gggccatagc ccctatgttt acaatcgcca gaccttgggt    720
ttgcgactgg atagtcgcga ggagataggg ctctttcgtt atgacgaacc cctcaagggc    780
aaacccatta agtccttcac tgactacgct cgacaacttt tcggtgcgct gatgaatgca    840
caggaaaaga ttcatctaca tggcgatgat tggcaacgca cggtctatat cgatacactc    900
gatgtgggta cgacggactt caatctttct gatgcaacca agcaagcact gattgagcaa    960
ggaattaacg gcaccgaaaa ttatttcgac tggtttgata atccgttaga gaagcctgtg   1020
aatagagtgg agtcatag                                                 1038
<210>60
<211>345
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>60
Met Thr Thr Gln Phe Arg Asn Leu Ile Phe Glu Gly Gly Gly Val Lys
 1               5                  10                  15
Gly Val Ala Tyr Ile Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val
            20                  25                  30
Leu Gln Asp Ile Arg Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn
        35                  40                  45
Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile
    50                  55                  60
Leu Gln Ala Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val
65                  70                  75                  80
Ile Arg Asp Ile Arg Arg Leu Ala Arg Asp Phe Gly Trp Asn Lys Gly
                85                  90                  95
Asp Phe Phe Ser Ser Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly
            100                 105                 110
Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Lys Ala Lys Leu Pro Asp
        115                 120                 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ala Glu Val Phe
    130                 135                 140
Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile
145                 150                 155                 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Asp Arg
                165                 170                 175
Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys
            180                 185                 190
Leu Phe Asp Arg Glu Arg Tyr Ile Asp Leu Ala Lys Asp Pro Gly Ala
        195                 200                 205
Val Arg Arg Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu
    210                 215                 220
Asp Arg Pro Gly His Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225                 230                 235                 240
Leu Arg Leu Asp Ser Arg Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu
                245                 250                 255
Pro Leu Lys Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln
            260                 265                 270
Leu Phe Gly Ala Leu Met Asn Ala Gln Glu Lys Ile His Leu His Gly
        275                 280                 285
Asp Asp Trp Gln Arg Thr Val Tyr Ile Asp Thr Leu Asp Val Gly Thr
    290                 295                 300
Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln
305                 310                 315                 320
Gly Ile Asn Gly Thr Glu Asn Tyr Phe Asp Trp Phe Asp Asn Pro Leu
                325                 330                 335
Glu Lys Pro Val Asn Arg Val Glu Ser
            340                 345
<210>61
<211>1257
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>61
atgacattaa aactctccct gctgatcgcg agcctgagcg ccgtgtctcc agcagtcttg     60
gcaaacgacg tcaatccagc gccactcatg gcgccgtccg aagcggattc cgcgcagacg    120
ctgggcagtc tgacgtacac ctatgttcgc tgctggtatc gtccggctgc gacgcataat    180
gatccttaca ccacctggga gtgggcgaag aacgcggacg gcagtgattt caccattgat    240
ggctattggt ggtcatcggt gagttacaaa aacatgttct ataccgatac tcagcccgat    300
accatcatgc agcgctgtgc agagacgttg gggttaaccc acgataccgc tgacatcacc    360
tatgccgcgg ccgatacccg tttctcctac aaccacacca tctggagcaa cgatgtcgcc    420
aacgcgccga gcaaaatcaa taaggtgatc gcctttggtg acagcctgtc agacacgggc    480
aacattttta acgcctcgca atggcgcttc ccgaacccga actcctggtt tgtcggccac    540
ttctcaaacg ggtttgtctg gaccgagtat ctggcgcaag gtttggggct gcccctctac    600
aactgggccg tgggcggcgc ggcggggcgc aatcaatact gggcgctgac tggcgtgaat    660
gaacaggtca gttcgtacct gacctacatg gagatggcgc cgaattaccg tgcggagaac    720
acgctgttta cactcgaatt cggtctgaat gattttatga actacgaccg ttcactggca    780
gacgtcaaag cagattacag ctcggcgctg attcgtctgg tggaagccgg agcgaaaaat    840
atggtgctgt tgaccctacc ggatgccacg cgcgcgccgc agttccaata ttcaacgcaa    900
gaacacatcg acgaggtgcg cgccaaagtg attggcatga acgcgttcat tcgtgagcag    960
gcacgctact tccagatgca gggcatcaac atttcgctgt ttgacgccta cacgctgttt   1020
gatcagatga tcgccgaccc agccgcgcac ggctttgata atgccagcgc gccatgtctt   1080
gatattcagc gcagctctgc ggcggactat ctctacacgc atgctctggc agccgagtgt   1140
gcctcatccg gttcagaccg ctttgtgttc tgggatgtga ctcacccaac cacggcaacg   1200
catcgctaca tcgccgacca cattctggct accggtgttg cgcagttccc gcgttaa      1257
<210>62
<211>418
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(21)
<400>62
Met Thr Leu Lys Leu Ser Leu Leu Ile Ala Ser Leu Ser Ala Val Ser
 1               5                  10                  15
Pro Ala Val Leu Ala Asn Asp Val Asn Pro Ala Pro Leu Met Ala Pro
            20                  25                  30
Ser Glu Ala Asp Ser Ala Gln Thr Leu Gly Ser Leu Thr Tyr Thr Tyr
        35                  40                  45
Val Arg Cys Trp Tyr Arg Pro Ala Ala Thr His Asn Asp Pro Tyr Thr
    50                  55                  60
Thr Trp Glu Trp Ala Lys Asn Ala Asp Gly Ser Asp Phe Thr Ile Asp
65                  70                  75                  80
Gly Tyr Trp Trp Ser Ser Val Ser Tyr Lys Asn Met Phe Tyr Thr Asp
                85                  90                  95
Thr Gln Pro Asp Thr Ile Met Gln Arg Cys Ala Glu Thr Leu Gly Leu
            100                 105                 110
Thr His Asp Thr Ala Asp Ile Thr Tyr Ala Ala Ala Asp Thr Arg Phe
        115                 120                 125
Ser Tyr Asn His Thr Ile Trp Ser Asn Asp Val Ala Asn Ala Pro Ser
    130                 135                 140
Lys Ile Asn Lys Val Ile Ala Phe Gly Asp Ser Leu Ser Asp Thr Gly
145                 150                 155                 160
Asn Ile Phe Asn Ala Ser Gln Trp Arg Phe Pro Asn Pro Asn Ser Trp
                165                 170                 175
Phe Val Gly His Phe Ser Asn Gly Phe Val Trp Thr Glu Tyr Leu Ala
            180                 185                 190
Gln Gly Leu Gly Leu Pro Leu Tyr Asn Trp Ala Val Gly Gly Ala Ala
        195                 200                 205
Gly Arg Asn Gln Tyr Trp Ala Leu Thr Gly Val Asn Glu Gln Val Ser
    210                 215                 220
Ser Tyr Leu Thr Tyr Met Glu Met Ala Pro Asn Tyr Arg Ala Glu Asn
225                 230                 235                 240
Thr Leu Phe Thr Leu Glu Phe Gly Leu Asn Asp Phe Met Asn Tyr Asp
                245                 250                 255
Arg Ser Leu Ala Asp Val Lys Ala Asp Tyr Ser Ser Ala Leu Ile Arg
            260                 265                 270
Leu Val Glu Ala Gly Ala Lys Asn Met Val Leu Leu Thr Leu Pro Asp
        275                 280                 285
Ala Thr Arg Ala Pro Gln Phe Gln Tyr Ser Thr Gln Glu His Ile Asp
    290                 295                 300
Glu Val Arg Ala Lys Val Ile Gly Met Asn Ala Phe Ile Arg Glu Gln
305                 310                 315                 320
Ala Arg Tyr Phe Gln Met Gln Gly Ile Asn Ile Ser Leu Phe Asp Ala
                325                 330                 335
Tyr Thr Leu Phe Asp Gln Met Ile Ala Asp Pro Ala Ala His Gly Phe
            340                 345                 350
Asp Asn Ala Ser Ala Pro Cys Leu Asp Ile Gln Arg Ser Ser Ala Ala
        355                 360                 365
Asp Tyr Leu Tyr Thr His Ala Leu Ala Ala Glu Cys Ala Ser Ser Gly
    370                 375                 380
Ser Asp Arg Phe Val Phe Trp Asp Val Thr His Pro Thr Thr Ala Thr
385                 390                 395                 400
His Arg Tyr Ile Ala Asp His Ile Leu Ala Thr Gly Val Ala Gln Phe
                405                 410                 415
Pro Arg
<210>63
<211>1242
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>63
atgaaaaata cgttaatttt ggctggctgt atattggcag ctccagccgt cgcagatgac     60
ctaacaatca cccctgaaac tataagtgtg cgctacgcgt ctgaggtgca gaacaaacaa    120
acatacactt atgttcgctg ctggtatcgt ccagcgcaga accatgacga cccttccact    180
gagtgggaat gggctcgtga cgacaatggc gattacttca ctatcgatgg gtactggtgg    240
tcgtctgtct ccttcaaaaa catgttctat accaataccc cgcaaacaga aattgaaaac    300
cgctgtaaag aaacactagg ggttaatcat gatagtgccg atcttcttta ctatgcatca    360
gacaatcgtt tctcctacaa ccatagtatt tggacaaacg acaacgcagt aaacaacaaa    420
atcaatcgta ttgtcgcatt cggtgatagc ctgtctgaca ccggtaatct gtacaatgga    480
tcccaatggg tattccccaa ccgtaattct tggtttctcg gtcacttttc aaacggtttg    540
gtgtggactg aatacttagc gcaaaacaaa aacgtaccac tgtacaactg ggcggtcggt    600
ggcgccgccg gcaccaacca atacgtcgca ttgacaggca tttatgacca agtgacgtct    660
tatcttacgt acatgaagat ggcaaagaac tacaacccaa acaacagttt gatgacgctg    720
gaatttggcc taaatgattt catgaattac ggccgagaag tggcggacgt gaaagctgac    780
ttaagtagcg cattgattcg cttgaccgaa tcaggcgcaa gcaacattct actcttcacg    840
ttaccggacg caacaaaggc accgcagttt aaatattcga ctcaggagga aattgagacc    900
gttcgagcta agattcttga gttcaacact tttattgaag aacaagcgtt actctatcaa    960
gctaaaggac tgaatgtggc cctctacgat gctcatagca tctttgatca gctgacatcc   1020
aatcctaaac aacacggttt tgagaactca acagatgcct gtctgaacat caaccgcagt   1080
tcctctgtcg actaccttta cagtcatgag ctaactaacg attgtgcgta tcatagctct   1140
gataaatatg tgttctgggg agtcactcac ccaaccacag caacacataa atacattgcc   1200
gaccaaatca ttcagaccaa gctagaccag ttcaatttct aa                      1242
<210>64
<211>413
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(18)
<400>64
Met Lys Asn Thr Leu Ile Leu Ala Gly Cys Ile Leu Ala Ala Pro Ala
 1               5                  10                  15
Val Ala Asp Asp Leu Thr Ile Thr Pro Glu Thr Ile Ser Val Arg Tyr
            20                  25                  30
Ala Ser Glu Val Gln Asn Lys Gln Thr Tyr Thr Tyr Val Arg Cys Trp
        35                  40                  45
Tyr Arg Pro Ala Gln Asn His Asp Asp Pro Ser Thr Glu Trp Glu Trp
    50                  55                  60
Ala Arg Asp Asp Asn Gly Asp Tyr Phe Thr Ile Asp Gly Tyr Trp Trp
65                  70                  75                  80
Ser Ser Val Ser Phe Lys Asn Met Phe Tyr Thr Asn Thr Pro Gln Thr
                85                  90                  95
Glu Ile Glu Asn Arg Cys Lys Glu Thr Leu Gly Val Asn His Asp Ser
            100                 105                 110
Ala Asp Leu Leu Tyr Tyr Ala Ser Asp Asn Arg Phe Ser Tyr Asn His
        115                 120                 125
Ser Ile Trp Thr Asn Asp Asn Ala Val Asn Asn Lys Ile Asn Arg Ile
    130                 135                 140
Val Ala Phe Gly Asp Ser Leu Ser Asp Thr Gly Asn Leu Tyr Asn Gly
145                 150                 155                 160
Ser Gln Trp Val Phe Pro Asn Arg Asn Ser Trp Phe Leu Gly His Phe
                165                 170                 175
Ser Asn Gly Leu Val Trp Thr Glu Tyr Leu Ala Gln Asn Lys Asn Val
            180                 185                 190
Pro Leu Tyr Asn Trp Ala Val Gly Gly Ala Ala Gly Thr Asn Gln Tyr
        195                 200                 205
Val Ala Leu Thr Gly Ile Tyr Asp Gln Val Thr Ser Tyr Leu Thr Tyr
    210                 215                 220
Met Lys Met Ala Lys Asn Tyr Asn Pro Asn Asn Ser Leu Met Thr Leu
225                 230                 235                 240
Glu Phe Gly Leu Asn Asp Phe Met Asn Tyr Gly Arg Glu Val Ala Asp
                245                 250                 255
Val Lys Ala Asp Leu Ser Ser Ala Leu Ile Arg Leu Thr Glu Ser Gly
            260                 265                 270
Ala Ser Asn Ile Leu Leu Phe Thr Leu Pro Asp Ala Thr Lys Ala Pro
        275                 280                 285
Gln Phe Lys Tyr Ser Thr Gln Glu Glu Ile Glu Thr Val Arg Ala Lys
    290                 295                 300
Ile Leu Glu Phe Asn Thr Phe Ile Glu Glu Gln Ala Leu Leu Tyr Gln
305                 310                 315                 320
Ala Lys Gly Leu Asn Val Ala Leu Tyr Asp Ala His Ser Ile Phe Asp
                325                 330                 335
Gln Leu Thr Ser Asn Pro Lys Gln His Gly Phe Glu Asn Ser Thr Asp
            340                 345                 350
Ala Cys Leu Asn Ile Asn Arg Ser Ser Ser Val Asp Tyr Leu Tyr Ser
        355                 360                 365
His Glu Leu Thr Asn Asp Cys Ala Tyr His Ser Ser Asp Lys Tyr Val
    370                 375                 380
Phe Trp Gly Val Thr His Pro Thr Thr Ala Thr His Lys Tyr Ile Ala
385                 390                 395                 400
Asp Gln Ile Ile Gln Thr Lys Leu Asp Gln Phe Asn Phe
                405                 410
<210>65
<211>1164
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>65
atgaaccctt ttcttgaaga taaaattaaa tcctccggtc ccaagaaaat cctcgcctgc     60
gatggcggag gtattttggg tttgatgagc gttgaaatcc tagcaaaaat tgaagcggat    120
ttacgcacta agttaggtaa agaccagaac ttcgtgctcg cggattattt cgattttgtc    180
tgcggcacca gcaccggcgc gattatcgct gcctgtattt ctagtggcat gtcgatggct    240
aaaatacgcc aattctatct cgacagtggg aagcaaatgt tcgataaggc ctccttgctt    300
aagcgcttgc aatacagtta tgacgatgag ccattggcga ggcagttgcg tgcagccttt    360
gatgagcaac tgaaggaaac cgatgccaag ctgggtagtg cgcacctaaa aacgctgttg    420
atgatggtga tgcgtaacca cagcaccgac tcaccttggc cggtttccaa taacccttac    480
gcaaaataca ataatatcgc ccgaaaggat tgcaacctca acctgccttt atggcaattg    540
gtccgtgcca gcaccgccgc tccgacgtat ttcccaccgg aagtcatcac tttcgcagat    600
ggcacacccg aagaatacaa cttcatcttc gtcgacggtg gcgtgaccac ctacaacaac    660
ccagcatatc ttgctttcct aatggccact gccaagcctt atgccctcaa ctggccgaca    720
ggcagcaacc agttattgat cgtttccgta ggcaccggaa gtgccgccaa tgtccgacct    780
aatctggacg tggatgatat gaacctgatc cattttgcca aaaacatccc ttcagccctg    840
atgaatgccg catctgccgg ttgggatatg acctgccggg tattgggtga atgccgccat    900
ggtggcatgt tagatcggga gtttggtgac atggtgatgc ccgcgtcaag agatcttaat    960
tttaccggcc ctaagctttt tacttatatg cgttatgatc ccgatgtttc ctttgagggc   1020
ttgaagacta tcggtatatc agatatcgat ccagccaaaa tgcagcaaat ggattccgtc   1080
aataatattc cagatataca acgggtaggt atcgaatatg ccaaacgcca tgttgataca   1140
gctcattttg aggggtttaa ataa                                          1164
<210>66
<211>387
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>66
Met Asn Pro Phe Leu Glu Asp Lys Ile Lys Ser Ser Gly Pro Lys Lys
 1               5                  10                  15
Ile Leu Ala Cys Asp Gly Gly Gly Ile Leu Gly Leu Met Ser Val Glu
            20                  25                  30
Ile Leu Ala Lys Ile Glu Ala Asp Leu Arg Thr Lys Leu Gly Lys Asp
        35                  40                  45
Gln Asn Phe Val Leu Ala Asp Tyr Phe Asp Phe Val Cys Gly Thr Ser
    50                  55                  60
Thr Gly Ala Ile Ile Ala Ala Cys Ile Ser Ser Gly Met Sar Met Ala
65                  70                  75                  80
Lys Ile Arg Gln Phe Tyr Leu Asp Ser Gly Lys Gln Met Phe Asp Lys
                85                  90                  95
Ala Ser Leu Leu Lys Arg Leu Gln Tyr Ser Tyr Asp Asp Glu Pro Leu
            100                 105                 110
Ala Arg Gln Leu Arg Ala Ala Phe Asp Glu Gln Leu Lys Glu Thr Asp
        115                 120                 125
Ala Lys Leu Gly Ser Ala His Leu Lys Thr Leu Leu Met Met Val Met
    130                 135                 140
Arg Asn His Ser Thr Asp Ser Pro Trp Pro Val Ser Asn Asn Pro Tyr
145                 150                 155                 160
Ala Lys Tyr Asn Asn Ile Ala Arg Lys Asp Cys Asn Leu Asn Leu Pro
                165                 170                 175
Leu Trp Gln Leu Val Arg Ala Ser Thr Ala Ala Pro Thr Tyr Phe Pro
            180                 185                 190
Pro Glu Val Ile Thr Phe Ala Asp Gly Thr Pro Glu Glu Tyr Asn Phe
        195                 200                 205
Ile Phe Val Asp Gly Gly Val Thr Thr Tyr Asn Asn Pro Ala Tyr Leu
    210                 215                 220
Ala Phe Leu Met Ala Thr Ala Lys Pro Tyr Ala Leu Asn Trp Pro Thr
225                 230                 235                 240
Gly Ser Asn Gln Leu Leu Ile Val Ser Val Gly Thr Gly Ser Ala Ala
                245                 250                 255
Asn Val Arg Pro Asn Leu Asp Val Asp Asp Met Asn Leu Ile His Phe
            260                 265                 270
Ala Lys Asn Ile Pro Ser Ala Leu Met Asn Ala Ala Ser Ala Gly Trp
        275                 280                 285
Asp Met Thr Cys Arg Val Leu Gly Glu Cys Arg His Gly Gly Met Leu
    290                 295                 300
Asp Arg Glu Phe Gly Asp Met Val Met Pro Ala Ser Arg Asp Leu Asn
305                 310                 315                 320
Phe Thr Gly Pro Lys Leu Phe Thr Tyr Met Arg Tyr Asp Pro Asp Val
                325                 330                 335
Ser Phe Glu Gly Leu Lys Thr Ile Gly Ile Ser Asp Ile Asp Pro Ala
            340                 345                 350
Lys Met Gln Gln Met Asp Ser Val Asn Asn Ile Pro Asp Ile Gln Arg
        355                 360                 365
Val Gly Ile Glu Tyr Ala Lys Arg His Val Asp Thr Ala His Phe Glu
    370                 375                 380
Gly Phe Lys
385
<210>67
<211>1419
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>67
atggtcattg tcttcgtcca cggatggagc gtgcgcaaca ccaacacgta cgggcagctg     60
cccttgcgtc tcaagaagag cttcaaagcc gccgggaaac agattcaggt cgagaacatc    120
tacctgggcg agtacgtgag ctttgacgac caggtaacag tcgacgacat cgcccgcgca    180
ttcgattgcg cactgcggga aaaactatac gatccggcga cgaagcagtg gacgaagttc    240
gcctgcatca ctcattccac cggcggcccg gtcgcgcgct tgtggatgga tctctactac    300
ggcgccgcca gactggccga gtgcccgatg tcccacctcg tgatgctcgc cccggccaat    360
catggctcgg cccttgccca gctcggcaag agccgcctca gccgcatcaa gagcttcttc    420
gagggtgtcg aaccgggcca gcgcgtcctc gactggctcg aactcggcag tgagctgagt    480
tgggccctca acacgagatg gctcgactac gactgccgcg ccgccgcctg ctgggtcttc    540
accctcaccg gccagcgcat cgaccggagt ttgtacgacc atctcaacag ctataccggt    600
gagcagggat cggatggcgt cgtgcgcgtc gccgcggcca acatgaacac caagctgctg    660
acctttgaac agaaggggcg caagctcgtg ttcacaggcc agaagaagac cgccgacacc    720
ggccttggcg tcgtgccggg ccggtcgcac tccggccgcg acatgggcat catcgccagc    780
gtgcgcggca ccggcgacca tcccaccctg gaatgggtga ctcgttgcct ggccgtcacc    840
gacgtcaaca cgtacgatgc cgtctgtaag gatctggacg ctctcaccgc ccagacccag    900
aaggatgaaa aggtggaaga ggtcaaaggc ctgctgcgga cggtcagata ccagacggac    960
cgctacgtca tgctcgtctt ccgcctgaag aacgaccgcg gcgactacct ctccgattac   1020
gatctcctgc tcaccgccgg acccaactac tcgcccgacg acctgcccga aggcttcttc   1080
gtcgaccgcc aacggaacca gcggaacccg ggcaagctca cttactacct gaactacgac   1140
gccatggcca aattgaaagg taagaccgcc gagggccgtc tgggcttcaa gatcctggcg   1200
cgcccggtga aaggcggcct cgtctactat gaggttgcgg agttccagtc cgacgtgggc   1260
ggcgtcagca gcatgctgca gcccaacgca acagtgatga tcgacatcac cctcaatcgc   1320
aacgtcgacg cgcgcgtctt ccggttcacc gagaatctgc ccacgggtga ccagggcgag   1380
gaaatcagcg gcgtcccgct ggggcagaac gtcccgtag                          1419
<210>68
<211>472
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>68
Met Val Ile Val Phe Val His Gly Trp Ser Val Arg Asn Thr Asn Thr
 1               5                  10                  15
Tyr Gly Gln Leu Pro Leu Arg Leu Lys Lys Ser Phe Lys Ala Ala Gly
            20                  25                  30
Lys Gln Ile Gln Val Glu Asn Ile Tyr Leu Gly Glu Tyr Val Ser Phe
        35                  40                  45
Asp Asp Gln Val Thr Val Asp Asp Ile Ala Arg Ala Phe Asp Cys Ala
    50                  55                  60
Leu Arg Glu Lys Leu Tyr Asp Pro Ala Thr Lys Gln Trp Thr Lys Phe
65                  70                  75                  80
Ala Cys Ile Thr His Ser Thr Gly Gly Pro Val Ala Arg Leu Trp Met
                85                  90                  95
Asp Leu Tyr Tyr Gly Ala Ala Arg Leu Ala Glu Cys Pro Met Ser His
            100                 105                 110
Leu Val Met Leu Ala Pro Ala Asn His Gly Ser Ala Leu Ala Gln Leu
        115                 120                 125
Gly Lys Ser Arg Leu Ser Arg Ile Lys Ser Phe Phe Glu Gly Val Glu
    130                 135                 140
Pro Gly Gln Arg Val Leu Asp Trp Leu Glu Leu Gly Ser Glu Leu Ser
145                 150                 155                 160
Trp Ala Leu Asn Thr Arg Trp Leu Asp Tyr Asp Cys Arg Ala Ala Ala
                165                 170                 175
Cys Trp Val Phe Thr Leu Thr Gly Gln Arg Ile Asp Arg Ser Leu Tyr
            180                 185                 190
Asp His Leu Asn Ser Tyr Thr Gly Glu Gln Gly Ser Asp Gly Val Val
        195                 200                 205
Arg Val Ala Ala Ala Asn Met Asn Thr Lys Leu Leu Thr Phe Glu Gln
    210                 215                 220
Lys Gly Arg Lys Leu Val Phe Thr Gly Gln Lys Lys Thr Ala Asp Thr
225                 230                 235                 240
Gly Leu Gly Val Val Pro Gly Arg Ser His Ser Gly Arg Asp Met Gly
                245                 250                 255
Ile Ile Ala Ser Val Arg Gly Thr Gly Asp His Pro Thr Leu Glu Trp
            260                 265                 270
Val Thr Arg Cys Leu Ala Val Thr Asp Val Asn Thr Tyr Asp Ala Val
        275                 280                 285
Cys Lys Asp Leu Asp Ala Leu Thr Ala Gln Thr Gln Lys Asp Glu Lys
    290                 295                 300
Val Glu Glu Val Lys Gly Leu Leu Arg Thr Val Arg Tyr Gln Thr Asp
305                 310                 315                 320
Arg Tyr Val Met Leu Val Phe Arg Leu Lys Asn Asp Arg Gly Asp Tyr
                325                 330                 335
Leu Ser Asp Tyr Asp Leu Leu Leu Thr Ala Gly Pro Asn Tyr Ser Pro
            340                 345                 350
Asp Asp Leu Pro Glu Gly Phe Phe Val Asp Arg Gln Arg Asn Gln Arg
        355                 360                 365
Asn Pro Gly Lys Leu Thr Tyr Tyr Leu Asn Tyr Asp Ala Met Ala Lys
    370                 375                 380
Leu Lys Gly Lys Thr Ala Glu Gly Arg Leu Gly Phe Lys Ile Leu Ala
385                 390                 395                 400
Arg Pro Val Lys Gly Gly Leu Val Tyr Tyr Glu Val Ala Glu Phe Gln
                405                 410                 415
Ser Asp Val Gly Gly Val Ser Ser Met Leu Gln Pro Asn Ala Thr Val
            420                 425                 430
Met Ile Asp Ile Thr Leu Asn Arg Asn Val Asp Ala Arg Val Phe Arg
        435                 440                 445
Phe Thr Glu Asn Leu Pro Thr Gly Asp Gln Gly Glu Glu Ile Ser Gly
    450                 455                 460
Val Pro Leu Gly Gln Asn Val Pro
465                 470
<210>69
<211>1038
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>69
atgacaacac aatttagaaa cttgatattt gaaggcggcg gtgtaaaagg tgttgcttac     60
attggcgcca tgcagattct cgaaaatcgt ggcgtgttgc aagatattcg ccgagtcgga    120
gggtgcagtg cgggtgcgat caacgcgctg atttttgcgc tgggttacac tgtccgtgag    180
caaaaagaga tcttacaagc cacggatttt aaccagttta tggataactc ttggggtgtt    240
attcgtgata ttcgcaggct tgctcgagac tttggctggc acaagggtga cttctttaat    300
agctggatag gtgatttgat tcatcgtcgt ttggggaatc gccgagcgac gttcaaagat    360
ctgcaaaagg ccaagcttcc tgatctttat gtcatcggta ctaatctgtc tacggggtat    420
gcagaggttt tttcagccga aagacacccc gatatggagc tagcgacagc ggtgcgtatc    480
tccatgtcga taccgctgtt ctttgcggcc gtgcgccacg gtgaccgaca agatgtgtat    540
gtcgatgggg gtgttcaact taactatccg attaaacttt ttgatcggga gcgttacatt    600
gatctggcca aagatcccgg tgccgttcgg cgaacgggct attacaacaa agaaaacgct    660
cgctttcagc ttgagcggcc gggctatagc ccctatgttt acaatcgcca gaccttgggt    720
ttgcgactag atagtcgaga ggagataggg ctctttcgtt atgacgaacc cctcaagggc    780
aaacccatta agtccttcac tgactacgct cgacaacttt tcggtgcgtt gatgaatgca    840
caggaaaaga ttcatctaca tggcgatgat tggcagcgca cggtctatat cgatacattg    900
gatgtgggta cgacggactt caatctttct gatgcaacta agcaagcact gattgaacag    960
ggaattaacg gcaccgaaaa ttatttcgag tggtttgata atccgttgga gaagcctgtt   1020
aatagagtgg agtcatag                                                 1038
<210>70
<211>345
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>70
Met Thr Thr Gln Phe Arg Ash Leu Ile Phe Glu Gly Gly Gly Val Lys
 1               5                  10                  15
Gly Val Ala Tyr Ile Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val
            20                  25                  30
Leu Gln Asp Ile Arg Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn
        35                  40                  45
Ala Leu Ile Phe Ala Leu Gly Tyr Thr ValArg Glu Gln Lys Glu Ile
    50                  55                  60
Leu Gln Ala Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val
65                  70                  75                  80
Ile Arg Asp Ile Arg Arg Leu Ala Arg Asp Phe Gly Trp His Lys Gly
                85                  90                  95
Asp Phe Phe Asn Ser Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly
            100                 105                 110
Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Lys Ala Lys Leu Pro Asp
        115                 120                 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Tyr Ala Glu Val Phe
    130                 135                 140
Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile
145                 150                 155                 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Asp Arg
                165                 170                 175
Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys
            180                 185                 190
Leu Phe Asp Arg Glu Arg Tyr Ile Asp Leu Ala Lys Asp Pro Gly Ala
        195                 200                 205
Val Arg Arg Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu
    210                 215                 220
Glu Arg Pro Gly Tyr Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225                 230                 235                 240
Leu Arg Leu Asp Ser Arg Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu
                245                 250                 255
Pro Leu Lys Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln
            260                 265                 270
Leu Phe Gly Ala Leu Met Asn Ala Gln Glu Lys Ile His Leu His Gly
        275                 280                 285
Asp Asp Trp Gln Arg Thr Val Tyr Ile Asp Thr Leu Asp Val Gly Thr
    290                 295                 300
Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln
305                 310                 315                 320
Gly Ile Asn Gly Thr Glu Asn Tyr Phe Glu Trp Phe Asp Asn Pro Leu
                325                 330                 335
Glu Lys Pro Val Asn Arg Val Glu Ser
            340                 345
<210>71
<211>3264
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>71
atgtcgctat catcaccgcc cgaaaccccc gaaccccccg aacccccgtc acccggcgcg     60
cgatcgctcc ggggaggatg gagccgccgg gtggccggcc tgctggccct ggtgctgctc    120
accgggctcc tccagatcgt cgtgccgctc gcacggcccg ccgcggcggc cgtacagcag    180
cccgcgatga cgtggaacct gcatggggcc aagaagaccg cggaactggt tcccgatctg    240
atgcgtaacc ataacgtcac cgtcgcggcc ctccaggaag tggccaacgg caacttcctg    300
ggcctcactc ccacagagca cgacgtgccc tacctcaagc cggacggcac gacctcgact    360
ccgccggatc cgcagaaatg gcgggtcgag aagtacaacc tcgccaagga cgatgcaacc    420
gctttcgtga tccggaccgg ctccaacaac cgcgggctcg cgatcgtcac cacccaggac    480
gtcggcgatg tctcgcagaa tgtacacgtc gtcaatgtga ccgaggattg ggaaggcaag    540
atgttccccg ccctgggggt gaagatcgac ggcgcctggt actactccat ccacgcctcc    600
accacgccga agcgcgcgaa caacaacgcc ggcactctgg tcgaggacct ctccaagctg    660
cacgagacgg ccgctttcga aggcgactgg gccgcgatgg gcgactggaa ccggtacccc    720
tccgaggact cgaacgccta cgagaaccaa cggaagcatc tcaaaggcgc catgcggaca    780
aactttccgg ataatcaggc ggcgttgcgc gaagtcctgg agttcgagtc cgacgaacgc    840
gtcatctggc agggtgcgag gacccacgac cacggcgccg agctcgacta catggtggcc    900
aagggagccg gtaacgacta caaggccagc cgatcgacgt cgaagcacgg ctccgatcac    960
tacccggtgt tcttcggtat tggggacgat tcggacacct gcatgggcgg cacggcgccg   1020
gtggcggcga acgcgccgcg tgcggccgcc accgagtcct gtcccctgga cgacgatctg   1080
ccggccgtca tcgtctcgat gggggacagc tatatctccg gcgagggagg gcgctggcag   1140
ggcaacgcca acacctcctc cgggggcgac tcctggggca ccgaccgggc cgccgacggc   1200
acggaggtct acgagaagaa ctccgaaggc agcgatgcct gtcaccgctc cgacgtcgcg   1260
gagatcaagc gcgccgacat cgccgacatc ccggcggaac gcaggatcaa catcgcctgc   1320
tcgggcgccg agaccaagca cctgctcacc gagaccttca agggtgaaaa gccccagatc   1380
gagcagctcg ccgacgtcgc cgaaacccac cgggtggaca cgatcgtggt ctccatcggc   1440
ggcaacgacc tcgagttcgc cgacatcgtg agccagtgcg ccacggcctt catgctcggg   1500
gaaggcgcgt gtcacacgga cgtcgacgat acccttgata gccggttggg cgatgtgagc   1560
agatccgtct ccgaggttct ggccgccatc cgcgacacca tgatcgaggc cgggcaggac   1620
gataccagct acaagctcgt tctccagtcc taccctgccc cgttgcccgc gtcggatgag   1680
atgcggtaca cgggcgatca ctacgaccgg tacaccgagg gcggctgccc cttctatgac   1740
gtcgacctgg actggacgcg cgacgtcctc atcaaaaaga tcgaagccac gctgcgcggg   1800
gtggccaaga gtgcggatgc ggccttcctc aacctgacgg acacgttcac ggggcacgag   1860
ctgtgctcga agcacacccg acaggcggag tccggcgaat cgctggcgaa tccaatactg   1920
gaacacgagg ccgagtgggt gcgcttcgta ccaggtctca ccacgccggg tgacacggcc   1980
gaagccatcc atccgaatgc gttcggccag cacgccctca gtagctgcct cagccaggcc   2040
gtccggacga tggacgattc ggaccagagg tacttcgagt gcgacgggcg ggacaccgga   2100
aatccccgcc tcgtgtggcc acgcagttcg cccatcgacg ccgtcgtgga gaccgcggac   2160
ggttggcagg gcgacgactt ccggctcgcc gaccactaca tgttccagcg cggcgtctac   2220
gcccgcttca acccggacgc ggaccggagc ggcgcgatcg atccgggccg aatcaccttc   2280
ggccaaaccg acggatggct cggtgaggtg aaggacactt cgaactggcc gagcctgagt   2340
ggaaccgact tcgtcgacgg catcgacgcc gccgccgagg cacgcaccag caccggtcac   2400
cagctgctgc tgttccacag cggcgttgag gacaaccagt acgtgcgggt cgagatggcg   2460
ccgggcacca ctgacgacca gctcgtcagg ggccccgtgc ccatcacgag gtactggccc   2520
ctcttccagg acaccccttt cgaatggggc gtggatgccg ccgcggggga ccagctgaac   2580
cgggcgatgg tcttcaggca cggctatgtg gggctggtgc aggtctccct cgacgctctc   2640
agcgacgaat ggctcgtgga accgacgttg atcggctcgg cgattccggc gctggagggc   2700
accccgttcg agacaggggt ggacgcggcg atcgtgcggc accagcaacc gacggccatg   2760
tgggtcgacc tgatcagcgg tacgcaggtg gtgacgctgc tggtggactt ggacgatctg   2820
tcgaagagca cgtacatgac gagcatcgtg gagatcacga cgatgtggcc gagcctgcgc   2880
ggcagcatct tcgactggac cggcggagag gcgtggaagc cggagaagat gcagatcaag   2940
accggcgcgg gcgatcccta cgacatggac gccgacgacc ggcaggccaa gcctgcggtg   3000
tcgggctcgc acgagcagtg ccgtccggag ggactagcgc agacccccgg cgtgaacacg   3060
ccgtactgcg aggtgtacga caccgacggc cgcgaatggc tgggcgggaa cgggcacgac   3120
aggcgggtca tcggctactt caccggctgg cgcaccggtg agaacgacca gccgcgctac   3180
ctggtgccga acatcccgtg gtcgaaggtg acccacatca actacgcgtt cgcgaaagtc   3240
gacgacgaca acaagatcca aaga                                          3264
<210>72
<211>1088
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>72
Met Ser Leu Ser Ser Pro Pro Glu Thr Pro Glu Pro Pro Glu Pro Pro
 1               5                  10                  15
Ser Pro Gly Ala Arg Ser Leu Arg Gly Gly Trp Ser Arg Arg Val Ala
            20                  25                  30
Gly Leu Leu Ala Leu Val Leu Leu Thr Gly Leu Leu Gln Ile Val Val
        35                  40                  45
Pro Leu Ala Arg Pro Ala Ala Ala Ala Val Gln Gln Pro Ala Met Thr
    50                  55                  60
Trp Asn Leu His Gly Ala Lys Lys Thr Ala Glu Leu Val Pro Asp Leu
65                  70                  75                  80
Met Arg Asn His Asn Val Thr Val Ala Ala Leu Gln Glu Val Ala Asn
                85                  90                  95
Gly Asn Phe Leu Gly Leu Thr Pro Thr Glu His Asp Val Pro Tyr Leu
            100                 105                 110
Lys Pro Asp Gly Thr Thr Ser Thr Pro Pro Asp Pro Gln Lys Trp Arg
        115                 120                 125
Val Glu Lys Tyr Asn Leu Ala Lys Asp Asp Ala Thr Ala Phe Val Ile
    130                 135                 140
Arg Thr Gly Ser Asn Asn Arg Gly Leu Ala Ile Val Thr Thr Gln Asp
145                 150                 155                 160
Val Gly Asp Val Ser Gln Asn Val His Val Val Asn Val Thr Glu Asp
                165                 170                 175
Trp Glu Gly Lys Met Phe Pro Ala Leu Gly Val Lys Ile Asp Gly Ala
            180                 185                 190
Trp Tyr Tyr Ser Ile His Ala Ser Thr Thr Pro Lys Arg Ala Asn Asn
        195                 200                 205
Asn Ala Gly Thr Leu Val Glu Asp Leu Ser Lys Leu His Glu Thr Ala
    210                 215                 220
Ala Phe Glu Gly Asp Trp Ala Ala Met Gly Asp Trp Asn Arg Tyr Pro
225                 230                 235                 240
Ser Glu Asp Ser Asn Ala Tyr Glu Asn Gln Arg Lys His Leu Lys Gly
                245                 250                 255
Ala Met Arg Thr Asn Phe Pro Asp Asn Gln Ala Ala Leu Arg Glu Val
            260                 265                 270
Leu Glu Phe Glu Ser Asp Glu Arg Val Ile Trp Gln Gly Ala Arg Thr
        275                 280                 285
His Asp His Gly Ala Glu Leu Asp Tyr Met Val Ala Lys Gly Ala Gly
    290                 295                 300
Asn Asp Tyr Lys Ala Ser Arg Ser Thr Ser Lys His Gly Ser Asp His
305                 310                 315                 320
Tyr Pro Val Phe Phe Gly Ile Gly Asp Asp Ser Asp Thr Cys Met Gly
                325                 330                 335
Gly Thr Ala Pro Val Ala Ala Asn Ala Pro Arg Ala Ala Ala Thr Glu
            340                 345                 350
Ser Cys Pro Leu Asp Asp Asp Leu Pro Ala Val Ile Val Ser Met Gly
        355                 360                 365
Asp Ser Tyr Ile Ser Gly Glu Gly Gly Arg Trp Gln Gly Asn Ala Asn
    370                 375                 380
Thr Ser Ser Gly Gly Asp Ser Trp Gly Thr Asp Arg Ala Ala Asp Gly
385                 390                 395                 400
Thr Glu Val Tyr Glu Lys Asn Ser Glu Gly Ser Asp Ala Cys His Arg
                405                 410                 415
Ser Asp Val Ala Glu Ile Lys Arg Ala Asp Ile Ala Asp Ile Pro Ala
            420                 425                 430
Glu Arg Arg Ile Asn Ile Ala Cys Ser Gly Ala Glu Thr Lys His Leu
        435                 440                 445
Leu Thr Glu Thr Phe Lys Gly Glu Lys Pro Gln Ile Glu Gln Leu Ala
    450                 455                 460
Asp Val Ala Glu Thr His Arg Val Asp Thr Ile Val Val Ser Ile Gly
465                 470                 475                 480
Gly Asn Asp Leu Glu Phe Ala Asp Ile Val Ser Gln Cys Ala Thr Ala
                485                 490                 495
Phe Met Leu Gly Glu Gly Ala Cys His Thr Asp Val Asp Asp Thr Leu
            500                 505                 510
Asp Ser Arg Leu Gly Asp Val Ser Arg Ser Val Ser Glu Val Leu Ala
        515                 520                 525
Ala Ile Arg Asp Thr Met Ile Glu Ala Gly Gln Asp Asp Thr Ser Tyr
    530                 535                 540
Lys Leu Val Leu Gln Ser Tyr Pro Ala Pro Leu Pro Ala Ser Asp Glu
545                 550                 555                 560
Met Arg Tyr Thr Gly Asp His Tyr Asp Arg Tyr Thr Glu Gly Gly Cys
                565                 570                 575
Pro Phe Tyr Asp Val Asp Leu Asp Trp Thr Arg Asp Val Leu Ile Lys
            580                 585                 590
Lys Ile Glu Ala Thr Leu Arg Gly Val Ala Lys Ser Ala Asp Ala Ala
        595                 600                 605
Phe Leu Asn Leu Thr Asp Thr Phe Thr Gly His Glu Leu Cys Ser Lys
    610                 615                 620
His Thr Arg Gln Ala Glu Ser Gly Glu Ser Leu Ala Asn Pro Ile Leu
625                 630                 635                 640
Glu His Glu Ala Glu Trp Val Arg Phe Val Pro Gly Leu Thr Thr Pro
                645                 650                 655
Gly Asp Thr Ala Glu Ala Ile His Pro Asn Ala Phe Gly Gln His Ala
            660                 665                 670
Leu Ser Ser Cys Leu Ser Gln Ala Val Arg Thr Met Asp Asp Ser Asp
        675                 680                 685
Gln Arg Tyr Phe Glu Cys Asp Gly Arg Asp Thr Gly Asn Pro Arg Leu
    690                 695                 700
Val Trp Pro Arg Ser Ser Pro Ile Asp Ala Val Val Glu Thr Ala Asp
705                 710                 715                 720
Gly Trp Gln Gly Asp Asp Phe Arg Leu Ala Asp His Tyr Met Phe Gln
                725                 730                 735
Arg Gly Val Tyr Ala Arg Phe Asn Pro Asp Ala Asp Arg Ser Gly Ala
            740                 745                 750
Ile Asp Pro Gly Arg Ile Thr Phe Gly Gln Thr Asp Gly Trp Leu Gly
        755                 760                 765
Glu Val Lys Asp Thr Ser Asn Trp Pro Ser Leu Ser Gly Thr Asp Phe
    770                 775                 780
Val Asp Gly Ile Asp Ala Ala Ala Glu Ala Arg Thr Ser Thr Gly His
785                 790                 795                 800
Gln Leu Leu Leu Phe His Ser Gly Val Glu Asp Asn Gln Tyr Val Arg
                805                 810                 815
Val Glu Met Ala Pro Gly Thr Thr Asp Asp Gln Leu Val Arg Gly Pro
            820                 825                 830
Val Pro Ile Thr Arg Tyr Trp Pro Leu Phe Gln Asp Thr Pro Phe Glu
        835                 840                 845
Trp Gly Val Asp Ala Ala Ala Gly Asp Gln Leu Asn Arg Ala Met Val
    850                 855                 860
Phe Arg His Gly Tyr Val Gly Leu Val Gln Val Ser Leu Asp Ala Leu
865                 870                 875                 880
Ser Asp Glu Trp Leu Val Glu Pro Thr Leu Ile Gly Ser Ala Ile Pro
                885                 890                 895
Ala Leu Glu Gly Thr Pro Phe Glu Thr Gly Val Asp Ala Ala Ile Val
            900                 905                 910
Arg His Gln Gln Pro Thr Ala Met Trp Val Asp Leu Ile Ser Gly Thr
        915                 920                 925
Gln Val Val Thr Leu Leu Val Asp Leu Asp Asp Leu Ser Lys Ser Thr
    930                 935                 940
Tyr Met Thr Ser Ile Val Glu Ile Thr Thr Met Trp Pro Ser Leu Arg
945                 950                 955                 960
Gly Ser Ile Phe Asp Trp Thr Gly Gly Glu Ala Trp Lys Pro Glu Lys
                965                 970                 975
Met Gln Ile Lys Thr Gly Ala Gly Asp Pro Tyr Asp Met Asp Ala Asp
            980                 985                 990
Asp Arg Gln Ala Lys Pro Ala Val Ser Gly Ser His Glu Gln Cys Arg
        995                 1000                1005
Pro Glu Gly Leu Ala Gln Thr Pro Gly Val Asn Thr Pro Tyr Cys Glu
    1010                1015                1020
Val Tyr Asp Thr Asp Gly Arg Glu Trp Leu Gly Gly Asn Gly His Asp
1025                1030                1035                1040
Arg Arg Val Ile Gly Tyr Phe Thr Gly Trp Arg Thr Gly Glu Asn Asp
                1045                1050                1055
Gln Pro Arg Tyr Leu Val Pro Asn Ile Pro Trp Ser Lys Val Thr His
            1060                1065                1070
Ile Asn Tyr Ala Phe Ala Lys Val Asp Asp Asp Asn Lys Ile Gln Arg
        1075                1080                1085
<210>73
<211>753
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>73
atgggaaacg gtgcagcagt tggttccaat gataatggta gagaagaaag tgtttacgta     60
ctttctgtga tcgcctgtaa tgtttattat ttacagaagt gtgaaggtgg ggcatcgcgt    120
gatagcgtga ttagagaaat taatagccaa actcaacctt taggatatga gattgtagca    180
gattctattc gtgatggtca tattggttct tttgcctgta agatggcagt ctttagaaat    240
aatggtaatg gcaattgtgt tttagcgatc aaagggacag atatgaataa tatcaatgac    300
ttggtgaatg atctaaccat gatattagga ggcattggtt ctgttgctgc aatccaacca    360
acgattaaca tggcacaaga actcatcgac caatatggag tgaatttgat tactggtcac    420
tcccttggag gctacatgac tgaaatcatc gctaccaatc gtggactacc aggtattgca    480
ttttgcgcac caggttcaaa tggtccaatt gtaaaattag gtggacaaga gacacctggc    540
tttcacaatg ttaactttga acatgatcca gcaggtaacg ttatgactgg ggtttatact    600
catgtccaat ggagtattta tgtaggatgt gatggtatga ctcatggtat tgaaaatatg    660
gtgaattatt ttaaagataa aagagattta accaatcgca atattcaagg aagaagtgaa    720
agtcataata cgggttatta ttacccaaaa taa                                 753
<210>74
<211>250
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>74
Met Gly Asn Gly Ala Ala Val Gly Ser Asn Asp Asn Gly Arg Glu Glu
 1               5                  10                  15
Ser Val Tyr Val Leu Ser Val Ile Ala Cys Asn Val Tyr Tyr Leu Gln
            20                  25                  30
Lys Cys Glu Gly Gly Ala Ser Arg Asp Ser Val Ile Arg Glu Ile Asn
        35                  40                  45
Ser Gln Thr Gln Pro Leu Gly Tyr Glu Ile Val Ala Asp Ser Ile Arg
    50                  55                  60
Asp Gly His Ile Gly Ser Phe Ala Cys Lys Met Ala Val Phe Arg Asn
65                  70                  75                  80
Asn Gly Asn Gly Asn Cys Val Leu Ala Ile Lys Gly Thr Asp Met Asn
                85                  90                  95
Asn Ile Asn Asp Leu Val Asn Asp Leu Thr Met Ile Leu Gly Gly Ile
            100                 105                 110
Gly Ser Val Ala Ala Ile Gln Pro Thr Ile Asn Met Ala Gln Glu Leu
        115                 120                 125
Ile Asp Gln Tyr Gly Val Asn Leu Ile Thr Gly His Ser Leu Gly Gly
    130                 135                 140
Tyr Met Thr Glu Ile Ile Ala Thr Asn Arg Gly Leu Pro Gly Ile Ala
145                 150                 155                 160
Phe Cys Ala Pro Gly Ser Asn Gly Pro Ile Val Lys Leu Gly Gly Gln
                165                 170                 175
Glu Thr Pro Gly Phe His Asn Val Asn Phe Glu His Asp Pro Ala Gly
            180                 185                 190
Asn Val Met Thr Gly Val Tyr Thr His Val Gln Trp Ser Ile Tyr Val
        195                 200                 205
Gly Cys Asp Gly Met Thr His Gly Ile Glu Asn Met Val Asn Tyr Phe
    210                 215                 220
Lys Asp Lys Arg Asp Leu Thr Asn Arg Asn Ile Gln Gly Arg Ser Glu
225                 230                 235                 240
Ser His Asn Thr Gly Tyr Tyr Tyr Pro Lys
                245                 250
<210>75
<211>1335
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>75
atgactacta aaatcttttt aattcacgga tggtctgtca agacaacaca aacatatcag     60
gcgctgcacc ttaagttggc agagcaggga tatcagctgg aagatattta cctcgggcgg    120
tatctgtccc ttgaaaatca tatcgaaata cgggatattg caaaagcaat gcaccgtgca    180
ttgctggaga ggattaccga ctggagtcag cctttccatt ttattactca cagtacggga    240
ggtatggtcg ccaaatattg gatattgaat cattataaag gaagtattgc aaaacaaaaa    300
ccactcaaaa atgtagtgtt tctggctgca cctaattttg gttcaaggct ggcacaccat    360
ggacgtacca tgctgggaga aataatggaa ctgggagaaa cagggaagaa gattcttgaa    420
tctctggagt taggaagtgc tttttcgtgg gatgtgaatg agcagttttt taatgcgtcc    480
aattggaaag ataaagaaat aaagttctat aacctgatag gagacagggt caaaacggat    540
ttttttaaat ccaaaatttt tccagctgcg tttgaaagcg ggtcagatat ggtgattcgg    600
gttgcggcag gaaatcagaa ctttgtccgg tacaggtacg atagtcagaa agatagcttt    660
actgttgtca atgagttgaa aggaattgct tttggtgctc tctaccaata tacacattcc    720
aatgatgatt atggaatcct gaacagcatc aaaaaaagtt caacccttga aaaccatcag    780
gcactcagac taattgtaga atgtctgaag gtttcgggag ataaagaata tgaaaatgtt    840
gttgcacagt tggctgcagc gacaaaagaa accagagaaa aacgccaggg atatgcacag    900
ctggatttcc gttttcggga tgatgaaggc tttccaatag atgattatgt tgtagagctg    960
ggagtaatgg taaatggaaa acctaaacca tctaaaacag tagatgacgt gcataagaat   1020
aaaattacac caaaccatct tactgtattc attaacctga aagaactgga acctaatctg   1080
aagtacttta tcaatattaa atcgatatcg gaatcctcca tgtatagtta cgatcctgct   1140
gtcaggacta tagagcttgc ttctaacgag attacaaaaa ttatccgtga ggaccataca   1200
acacagattg atgtgatact ttcccggact cctgctaaaa accttttcat gtttcatcgc   1260
ggagatgatg aagacctaca tgtgacatgg tcgcggtacg gagaaacaaa aagtacaaag   1320
cagggaataa aataa                                                    1335
<210>76
<211>444
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>76
Met Thr Thr Lys Ile Phe Leu Ile His Gly Trp Ser Val Lys Thr Thr
 1               5                  10                  15
Gln Thr Tyr Gln Ala Leu His Leu Lys Leu Ala Glu Gln Gly Tyr Gln
            20                  25                  30
Leu Glu Asp Ile Tyr Leu Gly Arg Tyr Leu Ser Leu Glu Asn His Ile
        35                  40                  45
Glu Ile Arg Asp Ile Ala Lys Ala Met His Arg Ala Leu Leu Glu Arg
    50                  55                  60
Ile Thr Asp Trp Ser Gln Pro Phe His Phe Ile Thr His Ser Thr Gly
65                  70                  75                  80
Gly Met Val Ala Lys Tyr Trp Ile Leu Asn His Tyr Lys Gly Ser Ile
                85                  90                  95
Ala Lys Gln Lys Pro Leu Lys Asn Val Val Phe Leu Ala Ala Pro Asn
            100                 105                 110
Phe Gly Ser Arg Leu Ala His His Gly Arg Thr Met Leu Gly Glu Ile
        115                 120                 125
Met Glu Leu Gly Glu Thr Gly Lys Lys Ile Leu Glu Ser Leu Glu Leu
    130                 135                 140
Gly Ser Ala Phe Ser Trp Asp Val Asn Glu Gln Phe Phe Asn Ala Ser
145                 150                 155                 160
Asn Trp Lys Asp Lys Glu Ile Lys Phe Tyr Asn Leu Ile Gly Asp Arg
                165                 170                 175
Val Lys Thr Asp Phe Phe Lys Ser Lys Ile Phe Pro Ala Ala Phe Glu
            180                 185                 190
Ser Gly Ser Asp Met Val Ile Arg Val Ala Ala Gly Asn Gln Asn Phe
        195                 200                 205
Val Arg Tyr Arg Tyr Asp Ser Gln Lys Asp Ser Phe Thr Val Val Asn
    210                 215                 220
Glu Leu Lys Gly Ile Ala Phe Gly Ala Leu Tyr Gln Tyr Thr His Ser
225                 230                 235                 240
Asn Asp Asp Tyr Gly Ile Leu Asn Ser Ile Lys Lys Ser Ser Thr Leu
                245                 250                 255
Glu Asn His Gln Ala Leu Arg Leu Ile Val Glu Cys Leu Lys Val Ser
            260                 265                 270
Gly Asp Lys Glu Tyr Glu Asn Val Val Ala Gln Leu Ala Ala Ala Thr
        275                 280                 285
Lys Glu Thr Arg Glu Lys Arg Gln Gly Tyr Ala Gln Leu Asp Phe Arg
    290                 295                 300
Phe Arg Asp Asp Glu Gly Phe Pro Ile Asp Asp Tyr Val Val Glu Leu
305                 310                 315                 320
Gly Val Met Val Asn Gly Lys Pro Lys Pro Ser Lys Thr Val Asp Asp
                325                 330                 335
Val His Lys Asn Lys Ile Thr Pro Asn His Leu Thr Val Phe Ile Asn
            340                 345                 350
Leu Lys Glu Leu Glu Pro Asn Leu Lys Tyr Phe Ile Asn Ile Lys Ser
        355                 360                 365
Ile Ser Glu Ser Ser Met Tyr Ser Tyr Asp Pro Ala Val Arg Thr Ile
    370                 375                 380
Glu Leu Ala Ser Asn Glu Ile Thr Lys Ile Ile Arg Glu Asp His Thr
385                 390                 395                 400
Thr Gln Ile Asp Val Ile Leu Ser Arg Thr Pro Ala Lys Asn Leu Phe
                405                 410                 415
Met Phe His Arg Gly Asp Asp Glu Asp Leu His Val Thr Trp Ser Arg
            420                 425                 430
Tyr Gly Glu Thr Lys Ser Thr Lys Gln Gly Ile Lys
        435                 440
<210>77
<211>1026
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>77
atggcttatc actttaaaaa cttggtcttc gaaggcggtg gcgtgaaagg catcgcctac     60
gtgggtgctc ttgaagtact tgagagagaa ggcattctga aagacatcaa acgcgtggct    120
ggtacttcgg ctggagcgct ggttgccgtc ttaatcagtt tgggctatac cgcccaagaa    180
ttgaaggaca tcctatggaa aatcaatttc caaaactttt tggacagctc gtggggcttg    240
gtgcgcaaca cggcacgttt cattgaggat tacggttggt acaaaggtga gtttttccgc    300
gaattggttg ccggctacat caaggaaaaa acgggcaata gtgaaagcac tttcaaggat    360
ctggccaaat caaaagattt ccgtggcctc agccttattg gtagcgatct gtccacagga    420
tactcaaagg tgttcagcaa cgaattcacc ccaaacgtca aagtagctga tgcagcccgc    480
atctccatgt cgatacccct gtttttcaaa gccgttcgcg gtgtaaacgg tgatggacac    540
atttacgtcg atggtggact gttagacaac tatgccatca aggtgttcga ccgcgtcaat    600
tacgtaaaga ataagaacaa cgtacggtac accgagtatt atgaaaagac caacaagtcg    660
ctgaaaagca aaaacaagct gaccaacgaa tacgtctaca ataaagaaac tttgggcttc    720
cgattggatg ccaaagaaca gattgagatg tttctcgacc atagtataga accaaaggca    780
aaggacattg actcactatt ctcttacacg aaggctttgg tcaccaccct catcgacttt    840
caaaacaatg tacatttgca tagtgacgac tggcaacgca cagtctatat cgactcttta    900
ggtatcagtt ccactgactt cggcatctct gactctaaaa aacagaaact cgtcgattca    960
ggcattttgc atacgcaaaa atacctggat tggtataaca acgacgaaga gaaagccaac   1020
aaatag                                                              1026
<210>78
<211>341
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>78
Met Ala Tyr His Phe Lys Asn Leu Val Phe Glu Gly Gly Gly Val Lys
 1               5                  10                  15
Gly Ile Ala Tyr Val Gly Ala Leu Glu Val Leu Glu Arg Glu Gly Ile
            20                  25                  30
Leu Lys Asp Ile Lys Arg Val Ala Gly Thr Ser Ala Gly Ala Leu Val
        35                  40                  45
Ala Val Leu Ile Ser Leu Gly Tyr Thr Ala Gln Glu Leu Lys Asp Ile
    50                  55                  60
Leu Trp Lys Ile Asn Phe Gln Asn Phe Leu Asp Ser Ser Trp Gly Leu
65                  70                  75                  80
Val Arg Asn Thr Ala Arg Phe Ile Glu Asp Tyr Gly Trp Tyr Lys Gly
                85                  90                  95
Glu Phe Phe Arg Glu Leu Val Ala Gly Tyr Ile Lys Glu Lys Thr Gly
            100                 105                 110
Asn Ser Glu Ser Thr Phe Lys Asp Leu Ala Lys Ser Lys Asp Phe Arg
        115                 120                 125
Gly Leu Ser Leu Ile Gly Ser Asp Leu Ser Thr Gly Tyr Ser Lys Val
    130                 135                 140
Phe Ser Ash Glu Phe Thr Pro Asn Val Lys Val Ala Asp Ala Ala Arg
145                 150                 155                 160
Ile Ser Met Ser Ile Pro Leu Phe Phe Lys Ala Val Arg Gly Val Asn
                165                 170                 175
Gly Asp Gly His Ile Tyr Val Asp Gly Gly Leu Leu Asp Asn Tyr Ala
            180                 185                 190
Ile Lys Val Phe Asp Arg Val Asn Tyr Val Lys Asn Lys Asn Asn Val
        195                 200                 205
Arg Tyr Thr Glu Tyr Tyr Glu Lys Thr Asn Lys Ser Leu Lys Ser Lys
    210                 215                 220
Asn Lys Leu Thr Asn Glu Tyr Val Tyr Asn Lys Glu Thr Leu Gly Phe
225                 230                 235                 240
Arg Leu Asp Ala Lys Glu Gln Ile Glu Met Phe Leu Asp His Ser Ile
                245                 250                 255
Glu Pro Lys Ala Lys Asp Ile Asp Ser Leu Phe Ser Tyr Thr Lys Ala
            260                 265                 270
Leu Val Thr Thr Leu Ile Asp Phe Gln Asn Asn Val His Leu His Ser
        275                 280                 285
Asp Asp Trp Gln Arg Thr Val Tyr Ile Asp Ser Leu Gly Ile Ser Ser
    290                 295                 300
Thr Asp Phe Gly Ile Ser Asp Ser Lys Lys Gln Lys Leu Val Asp Ser
305                 310                 315                 320
Gly Ile Leu His Thr Gln Lys Tyr Leu Asp Trp Tyr Asn Asn Asp Glu
                325                 330                 335
Glu Lys Ala Asn Lys
            340
<210>79
<211>1701
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>79
atgagaaatt tcagcaaggg attgaccagt attttgctta gcatagcgac atccaccagt     60
gcgatggcct ttacccagat cggggccggc ggagcgattc cgatgggcca tgagtggcta    120
acccgccgct cggcgctgga actgctgaat gccgacaatc tggtcggcaa tgacccggcc    180
gacccacgct tgggctggag cgaaggtctc gccaacaatc tcgatctctc gaatgcccag    240
aacgaagtgc agcgcatcaa gagcattacc aagagccacg ccctgtatga gccgcgttac    300
gatgacgttt tcgccgccat cgtcggcgag cgctgggttg ataccgccgg tttcaacgtg    360
gccaaggcca ccgtcggcaa gatcgattgc ttcagcgccg tcgcgcaaga gcccgccgat    420
gtgcaacaag accatttcat gcgccgttat gacgacgtgg gtggacaagg gggcgtgaac    480
gctgcccgcc gcgcgcagca gcgctttatc aatcacttcg tcaacgcagc catggccgaa    540
gagaagagca tcaaggcatg ggatggcggc ggttattctt cgctggaaaa agtcagccac    600
aactacttct tgtttggccg cgccgttcat ttgttccagg attctttcag ccccgaacac    660
accgtgcgcc tgcctgaaga caattacgtc aaagtccgtc aggtcaaggc gtatctctgc    720
tctgaaggtg ccgaacagca tacgcacaac acgcaagatg ccatcaactt caccagcggc    780
gatgtcatct ggaaacagaa cacccgtctg gatgcaggct ggagcaccta caaggccagc    840
aacatgaagc cggtggcatt ggttgccctc gaagccagca aagatttgtg ggccgccttt    900
attcgcacca tggccgtttc ccgcgaggag cgtcgcgccg tcgccgaaca ggaagcgcag    960
gctctcgtca atcactggtt gtcgttcgac gaacaggaaa tgctgaactg gtacgaagaa   1020
gaagagcacc gcgatcatac gtacgtcaag gaacccggcc agagcggccc aggttcgtcg   1080
ttattcgatt gcatggttgg tctgggtgtg gcctcgggca gtcaggcgca acgggtggcg   1140
gaactcgatc agcaacgccg ccaatgtttg ttcaacgtca aggccgctac tggctatggc   1200
gatctgaatg atccacacat ggatattccg tacaactggc aatgggtgtc gtcgacgcaa   1260
tggaaaatcc ctgcggccga ctggaaaatc ccgcagctgc ccgccgattc agggaaatca   1320
gtcgtcatca agaattcgat caatggcgat ccgctggtgg cacctgccgg gctcaagcac   1380
aacaccgatg tttacggtgc accgggtgag gcgattgaat tcattttcgt cggtgatttc   1440
aaccatgagg cgtatttccg caccaaggac aacgcggatc tgttcctgag ttacagcgcg   1500
gtatcgggca agggcttgct gtacaacacg cccaaccagg ccggttatcg tgttcagcct   1560
tatggtgtgc tgtggacgat tgagaatacc tactggaatg atttcctctg gtacaacagc   1620
tcgaacgacc gcatctatgt cagcggcacc ggcgctgcca acaagtcaca ctcccagtgg   1680
attattgacg gcttgcagtg a                                             1701
<210>80
<211>566
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(23)
<400>80
Met Arg Asn Phe Ser Lys Gly Leu Thr Ser Ile Leu Leu Ser Ile Ala
 1               5                  10                  15
Thr Ser Thr Ser Ala Met Ala Phe Thr Gln Ile Gly Ala Gly Gly Ala
            20                  25                  30
Ile Pro Met Gly His Glu Trp Leu Thr Arg Arg Ser Ala Leu Glu Leu
        35                  40                  45
Leu Asn Ala Asp Asn Leu Val Gly Asn Asp Pro Ala Asp Pro Arg Leu
    50                  55                  60
Gly Trp Ser Glu Gly Leu Ala Asn Asn Leu Asp Leu Ser Asn Ala Gln
65                  70                  75                  80
Asn Glu Val Gln Arg Ile Lys Ser Ile Thr Lys Ser His Ala Leu Tyr
                85                  90                  95
Glu Pro Arg Tyr Asp Asp Val Phe Ala Ala Ile Val Gly Glu Arg Trp
            100                 105                 110
Val Asp Thr Ala Gly Phe Asn Val Ala Lys Ala Thr Val Gly Lys Ile
        115                 120                 125
Asp Cys Phe Ser Ala Val Ala Gln Glu Pro Ala Asp Val Gln Gln Asp
    130                 135                 140
His Phe Met Arg Arg Tyr Asp Asp Val Gly Gly Gln Gly Gly Val Asn
145                 150                 155                 160
Ala Ala Arg Arg Ala Gln Gln Arg Phe Ile Asn His Phe Val Asn Ala
                165                 170                 175
Ala Met Ala Glu Glu Lys Ser Ile Lys Ala Trp Asp Gly Gly Gly Tyr
            180                 185                 190
Ser Ser Leu Glu Lys Val Ser His Asn Tyr Phe Leu Phe Gly Arg Ala
        195                 200                 205
Val His Leu Phe Gln Asp Ser Phe Ser Pro Glu His Thr Val Arg Leu
    210                 215                 220
Pro Glu Asp Asn Tyr Val Lys Val Arg Gln Val Lys Ala Tyr Leu Cys
225                 230                 235                 240
Ser Glu Gly Ala Glu Gln His Thr His Asn Thr Gln Asp Ala Ile Asn
                245                 250                 255
Phe Thr Ser Gly Asp Val Ile Trp Lys Gln Asn Thr Arg Leu Asp Ala
            260                 265                 270
Gly Trp Ser Thr Tyr Lys Ala Ser Asn Met Lys Pro Val Ala Leu Val
        275                 280                 285
Ala Leu Glu Ala Ser Lys Asp Leu Trp Ala Ala Phe Ile Arg Thr Met
    290                 295                 300
Ala Val Ser Arg Glu Glu Arg Arg Ala Val Ala Glu Gln Glu Ala Gln
305                 310                 315                 320
Ala Leu Val Asn His Trp Leu Ser Phe Asp Glu Gln Glu Met Leu Asn
                325                 330                 335
Trp Tyr Glu Glu Glu Glu His Arg Asp His Thr Tyr Val Lys Glu Pro
            340                 345                 350
Gly Gln Ser Gly Pro Gly Ser Ser Leu Phe Asp Cys Met Val Gly Leu
        355                 360                 365
Gly Val Ala Ser Gly Ser Gln Ala Gln Arg Val Ala Glu Leu Asp Gln
    370                 375                 380
Gln Arg Arg Gln Cys Leu Phe Asn Val Lys Ala Ala Thr Gly Tyr Gly
385                 390                 395                 400
Asp Leu Asn Asp Pro His Met Asp Ile Pro Tyr Asn Trp Gln Trp Val
                405                 410                 415
Ser Ser Thr Gln Trp Lys Ile Pro Ala Ala Asp Trp Lys Ile Pro Gln
            420                 425                 430
Leu Pro Ala Asp Ser Gly Lys Ser Val Val Ile Lys Asn Ser Ile Asn
        435                 440                 445
Gly Asp Pro Leu Val Ala Pro Ala Gly Leu Lys His Asn Thr Asp Val
    450                 455                 460
Tyr Gly Ala Pro Gly Glu Ala Ile Glu Phe Ile Phe Val Gly Asp Phe
465                 470                 475                 480
Asn His Glu Ala Tyr Phe Arg Thr Lys Asp Asn Ala Asp Leu Phe Leu
                485                 490                 495
Ser Tyr Ser Ala Val Ser Gly Lys Gly Leu Leu Tyr Asn Thr Pro Asn
            500                 505                 510
Gln Ala Gly Tyr Arg Val Gln Pro Tyr Gly Val Leu Trp Thr Ile Glu
        515                 520                 525
Asn Thr Tyr Trp Asn Asp Phe Leu Trp Tyr Asn Ser Ser Asn Asp Arg
    530                 535                 540
Ile Tyr Val Ser Gly Thr Gly Ala Ala Asn Lys Ser His Ser Gln Trp
545                 550                 555                 560
Ile Ile Asp Gly Leu Gln
                565
<210>81
<211>1422
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>81
atgaaaaaga aattatgtac aatggctctt gtaacagcaa tatcttctgg tgttgttacg     60
attccaacag aagcacaagc ttgtggaata ggcgaagtaa tgaaacagga gaaccaagag    120
cacaaacgtg tgaaaagatg gtctgcggag catccgcatc attcaaatga aagtacacat    180
ttatggattg cacgaaatgc gattcaaatt atgagtcgta atcaagataa gacggttcaa    240
gaaaatgaat tacaattttt aaatactcct gaatataagg agttatttga aagaggtctt    300
tatgatgctg attaccttga tgaatttaac gatggaggta caggtacaat cggcattgat    360
gggctaatta gaggagggtg gaaatctcat ttttacgatc ccgatacaag aaagaactat    420
aaaggggaag aagaaccaac agctctttca caaggagata aatattttaa attagcaggt    480
gaatacttta agaagggcga ccaaaaacaa gctttttatt atttaggtgt tgcaacgcat    540
tactttacag atgctactca accaatgcat gctgctaatt ttacagccgt cgacacgagt    600
gctttaaagt ttcatagcgc ttttgaaaat tatgtgacga caattcagac acagtatgaa    660
gtatctgatg gtgagggcgt atataattta gtgaattcta atgatccaaa acagtggatc    720
catgaaacag cgagactcgc aaaagtggaa atcgggaaca ttaccaatga cgagattaaa    780
tctcactata ataaaggaaa caatgctctt tggcaacaag aagttatgcc agctgtccag    840
aggagtttag agaacgcaca aagaaacacg gcgggattta ttcatttatg gtttaaaaca    900
tttgttggca atactgccgc tgaagaaatt gaaaatactg tagtgaaaga ttctaaagga    960
gaagcaatac aagataataa aaaatacttc gtagtgccaa gtgagtttct aaatagaggt   1020
ttgacctttg aagtatatgc aaggaatgac tatgcactat tatctaatta cgtagatgat   1080
agtaaagttc atggtacgcc agttcagttt gtatttgata aagataataa cggtatcctt   1140
catcgaggag aaagtgtact gctgaaaatg acgcaatcta actatgataa ttacgtattt   1200
ctaaactact ctaacttgac aaactgggta catcttgcgc aacaaaaaac aaatactgca   1260
cagtttaaag tgtatccaaa tccgaataac ccatctgaat attacctata tacagatgga   1320
tacccagtaa attatcaaga aaatggtaac ggaaagagct ggattgtgtt aggaaagaaa   1380
acagatacac caaaagcttg gaaatttata caggctgaat ag                      1422
<210>82
<211>473
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(25)
<400>82
Met Lys Lys Lys Leu Cys Thr Met Ala Leu Val Thr Ala Ile Ser Ser
 1               5                  10                  15
Gly Val Val Thr Ile Pro Thr Glu Ala Gln Ala Cys Gly Ile Gly Glu
            20                  25                  30
Val Met Lys Gln Glu Asn Gln Glu His Lys Arg Val Lys Arg Trp Ser
        35                  40                  45
Ala Glu His Pro His His Ser Asn Glu Ser Thr His Leu Trp Ile Ala
    50                  55                  60
Arg Asn Ala Ile Gln Ile Met Ser Arg Asn Gln Asp Lys Thr Val Gln
65                  70                  75                  80
Glu Asn Glu Leu Gln Phe Leu Asn Thr Pro Glu Tyr Lys Glu Leu Phe
                85                  90                  95
Glu Arg Gly Leu Tyr Asp Ala Asp Tyr Leu Asp Glu Phe Asn Asp Gly
            100                 105                 110
Gly Thr Gly Thr Ile Gly Ile Asp Gly Leu Ile Arg Gly Gly Trp Lys
        115                 120                 125
Ser His Phe Tyr Asp Pro Asp Thr Arg Lys Asn Tyr Lys Gly Glu Glu
    130                 135                 140
Glu Pro Thr Ala Leu Ser Gln Gly Asp Lys Tyr Phe Lys Leu Ala Gly
145                 150                 155                 160
Glu Tyr Phe Lys Lys Gly Asp Gln Lys Gln Ala Phe Tyr Tyr Leu Gly
                165                 170                 175
Val Ala Thr His Tyr Phe Thr Asp Ala Thr Gln Pro Met His Ala Ala
            180                 185                 190
Asn Phe Thr Ala Val Asp Thr Ser Ala Leu Lys Phe His Ser Ala Phe
        195                 200                 205
Glu Asn Tyr Val Thr Thr Ile Gln Thr Gln Tyr Glu Val Ser Asp Gly
    210                 215                 220
Glu Gly Val Tyr Asn Leu Val Asn Ser Asn Asp Pro Lys Gln Trp Ile
225                 230                 235                 240
His Glu Thr Ala Arg Leu Ala Lys Val Glu Ile Gly Asn Ile Thr Asn
                245                 250                 255
Asp Glu Ile Lys Ser His Tyr Asn Lys Gly Asn Asn Ala Leu Trp Gln
            260                 265                 270
Gln Glu Val Met Pro Ala Val Gln Arg Ser Leu Glu Asn Ala Gln Arg
        275                 280                 285
Asn Thr Ala Gly Phe Ile His Leu Trp Phe Lys Thr Phe Val Gly Asn
    290                 295                 300
Thr Ala Ala Glu Glu Ile Glu Asn Thr Val Val Lys Asp Ser Lys Gly
305                 310                 315                 320
Glu Ala Ile Gln Asp Asn Lys Lys Tyr Phe Val Val Pro Ser Glu Phe
                325                 330                 335
Leu Asn Arg Gly Leu Thr Phe Glu Val Tyr Ala Arg Asn Asp Tyr Ala
            340                 345                 350
Leu Leu Ser Asn Tyr Val Asp Asp Ser Lys Val His Gly Thr Pro Val
        355                 360                 365
Gln Phe Val Phe Asp Lys Asp Asn Asn Gly Ile Leu His Arg Gly Glu
    370                 375                 380
Ser Val Leu Leu Lys Met Thr Gln Ser Asn Tyr Asp Asn Tyr Val Phe
385                 390                 395                 400
Leu Asn Tyr Ser Asn Leu Thr Asn Trp Val His Leu Ala Gln Gln Lys
                405                 410                 415
Thr Asn Thr Ala Gln Phe Lys Val Tyr Pro Asn Pro Asn Asn Pro Ser
            420                 425                 430
Glu Tyr Tyr Leu Tyr Thr Asp Gly Tyr Pro Val Asn Tyr Gln Glu Asn
        435                 440                 445
Gly Asn Gly Lys Ser Trp Ile Val Leu Gly Lys Lys Thr Asp Thr Pro
    450                 455                 460
Lys Ala Trp Lys Phe Ile Gln Ala Glu
465                 470
<210>83
<211>1290
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>83
atgaaaaaga tagtgattta ttcatttgta gcaggggtta tgacatcagg cggcgtattt     60
gccgccagtg acaatattgt ggagacgtcg accccaccac agcatcaggc cccaagcaga    120
caggacaggg cattattcgc gggtgataca acaacctata taaaatgtgt ctacaaagtg    180
gatggccagg atgacagcaa tccatcctca tcttggttat gggcgaaagt gggtagcaac    240
tatgcgaagc tgaaggggta ttggtataat tcaatgccgc tggcaaacat gttttacact    300
gaagtaccct atgcagaggt gatggacttg tgtaatagca ccctgaaggc ggtaggtgcc    360
aactccactc ttgttattcc atatgcatcg gattacaccc tgtcctatta ctatgtgatt    420
tggaatcaag gggctaacca gccggttatc aacgttggcg gcagagagct tgaccgtatg    480
gtggtctttg gtgacagctt gagcgatacc gtcaatgtct ataacggctc gtacggtacc    540
gtgccgaata gtacctcctg gttattgggc catttctcta acggaaagct ttggcatgaa    600
tacctttcca cggtattgaa tctgcctagc tatgtgtggg cgactggcaa tgcggagagt    660
ggagagaaac ccttctttaa cggattcagt aagcaggtgg attctttcag ggattatcac    720
gctcgcacta aaggctacga tattagcaag acgttgttta ccgttctgtt tggtggaaat    780
gattttataa cggggggaaa aagcgccgat gaggtcattg agcaatatac ggtgtcattg    840
aactacttgg ctcaactagg ggcgaagcag gttgcaattt tccgcttgcc agatttttca    900
gtgataccca gcgtttcaac gtggacagag gctgataagg acaaactgag agagaatagt    960
gttcagttta atgaccaagc cgagaagctg atcgctaaac taaacgcggc acatccccaa   1020
acgacgtttt atacgctgag gttggatgac gcttttaagc aggtgttgga aaacagcgac   1080
caatacggct ttgttaataa gactgatacc tgcctggata tttcccaagg cggatacaac   1140
tatgccattg gggcccgcgc gaaaacggca tgtaagagca gcaatgcggc gtttgtattc   1200
tgggacaata tgcatccgac caccaaaaca cacggattgt tggccgatct tttaaaagat   1260
gatgtggtac gcggcctcgc tgcgccatga                                    1290
<210>84
<211>429
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(22)
<400>84
Met Lys Lys Ile Val Ile Tyr Ser Phe Val Ala Gly Val Met Thr Ser
 1               5                  10                  15
Gly Gly Val Phe Ala Ala Ser Asp Asn Ile Val Glu Thr Ser Thr Pro
            20                  25                  30
Pro Gln His Gln Ala Pro Ser Arg Gln Asp Arg Ala Leu Phe Ala Gly
        35                  40                  45
Asp Thr Thr Thr Tyr Ile Lys Cys Val Tyr Lys Val Asp Gly Gln Asp
    50                  55                  60
Asp Ser Asn Pro Ser Ser Ser Trp Leu Trp Ala Lys Val Gly Ser Asn
65                  70                  75                  80
Tyr Ala Lys Leu Lys Gly Tyr Trp Tyr Asn Ser Met Pro Leu Ala Asn
                85                  90                  95
Met Phe Tyr Thr Glu Val Pro Tyr Ala Glu Val Met Asp Leu Cys Asn
            100                 105                 110
Ser Thr Leu Lys Ala Val Gly Ala Asn Ser Thr Leu Val Ile Pro Tyr
        115                 120                 125
Ala Ser Asp Tyr Thr Leu Ser Tyr Tyr Tyr Val Ile Trp Asn Gln Gly
    130                 135                 140
Ala Asn Gln Pro Val Ile Asn Val Gly Gly Arg Glu Leu Asp Arg Met
145                 150                 155                 160
Val Val Phe Gly Asp Ser Leu Ser Asp Thr Val Asn Val Tyr Asn Gly
                165                 170                 175
Ser Tyr Gly Thr Val Pro Asn Ser Thr Ser Trp Leu Leu Gly His Phe
            180                 185                 190
Ser Asn Gly Lys Leu Trp His Glu Tyr Leu Ser Thr Val Leu Asn Leu
        195                 200                 205
Pro Ser Tyr Val Trp Ala Thr Gly Asn Ala Glu Ser Gly Glu Lys Pro
    210                 215                 220
Phe Phe Asn Gly Phe Ser Lys Gln Val Asp Ser Phe Arg Asp Tyr His
225                 230                 235                 240
Ala Arg Thr Lys Gly Tyr Asp Ile Ser Lys Thr Leu Phe Thr Val Leu
                245                 250                 255
Phe Gly Gly Asn Asp Phe Ile Thr Gly Gly Lys Ser Ala Asp Glu Val
            260                 265                 270
Ile Glu Gln Tyr Thr Val Ser Leu Asn Tyr Leu Ala Gln Leu Gly Ala
        275                 280                 285
Lys Gln Val Ala Ile Phe Arg Leu Pro Asp Phe Ser Val Ile Pro Ser
    290                 295                 300
Val Ser Thr Trp Thr Glu Ala Asp Lys Asp Lys Leu Arg Glu Asn Ser
305                 310                 315                 320
Val Gln Phe Asn Asp Gln Ala Glu Lys Leu Ile Ala Lys Leu Asn Ala
                325                 330                 335
Ala His Pro Gln Thr Thr Phe Tyr Thr Leu Arg Leu Asp Asp Ala Phe
            340                 345                 350
Lys Gln Val Leu Glu Asn Ser Asp Gln Tyr Gly Phe Val Asn Lys Thr
        355                 360                 365
Asp Thr Cys Leu Asp Ile Ser Gln Gly Gly Tyr Asn Tyr Ala Ile Gly
    370                 375                 380
Ala Arg Ala Lys Thr Ala Cys Lys Ser Ser Asn Ala Ala Phe Val Phe
385                 390                 395                 400
Trp Asp Asn Met His Pro Thr Thr Lys Thr His Gly Leu Leu Ala Asp
                405                 410                 415
Leu Leu Lys Asp Asp Val Val Arg Gly Leu Ala Ala Pro
            420                 425
<210>85
<211>1038
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>85
atgacaacac aatttagaaa cttgatattt gaaggcggcg gtgtaaaagg tgttgcttac     60
attggcgcca tgcagattct tgaaaatcgt ggcgtgttgc aagatattcg ccgagtcgga    120
gggtgcagtg cgggtgcgat taacgcgctg atttttgcgc taggttacac ggtccgtgaa    180
caaaaagaga tcttacaagc caccgatttt aaccagttta tggataactc ttggggggtt    240
attcgtgata ttcgcaggct tgctcgagac tttggctgga ataagggtga tttctttagt    300
agctggatag gtgatttgat tcatcgtcgt ttggggaatc gccgagcgac gttcaaagat    360
ctgcaaaagg ccaagcttcc tgatctttat gtcatcggta ctaatctgtc tacagggttt    420
gcagaggtgt tttctgccga aagacacccc gatatggagc tggcgacagc ggtgcgtatc    480
tccatgtcga taccgctgtt ctttgcggcc gtgcgtcacg gtgatcgaca agatgtgtat    540
gtcgatgggg gtgttcaact taactatccg attaaactgt ttgatcggga gcgttacatt    600
gatttggcca aagatcccgg tgccgttcgg cgaacgggtt attacaacaa agaaaacgct    660
cgctttcagc ttgatcggcc gggccatagc ccctatgttt acaatcgcca gaccttgggt    720
ttgcgactgg atagtcgcga ggagataggg ctctttcgtt atgacgaacc cctcaagggc    780
aaacccatta agtccttcac tgactacgct cgacaacttt tcggtgcgtt gatgaatgca    840
caggaaaaga ttcatctaca tggcgatgat tggcaacgca cgatctatat cgatacattg    900
gatgtgggta cgacggactt caatctttct gatgcaacta agcaagcact gattgagcaa    960
ggaattaacg gcaccgaaaa ttatttcgag tggtttgata atccgttaga gaagcctgtg   1020
aatagagtgg agtcatag                                                 1038
<210>86
<211>345
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>86
Met Thr Thr Gln Phe Arg Asn Leu Ile Phe Glu Gly Gly Gly Val Lys
 1               5                  10                  15
Gly Val Ala Tyr Ile Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val
            20                  25                  30
Leu Gln Asp Ile Arg Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn
        35                  40                  45
Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile
    50                  55                  60
Leu Gln Ala Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val
65                  70                  75                  80
Ile Arg Asp Ile Arg Arg Leu Ala Arg Asp Phe Gly Trp Asn Lys Gly
                85                  90                  95
Asp Phe Phe Ser Ser Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly
            100                 105                 110
Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Lys Ala Lys Leu Pro Asp
        115                 120                 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ala Glu Val Phe
    130                 135                 140
Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile
145                 150                 155                 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Asp Arg
                165                 170                 175
Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys
            180                 185                 190
Leu Phe Asp Arg Glu Arg Tyr Ile Asp Leu Ala Lys Asp Pro Gly Ala
        195                 200                 205
Val Arg Arg Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu
    210                 215                 220
Asp Arg Pro Gly His Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225                 230                 235                 240
Leu Arg Leu Asp Ser Arg Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu
                245                 250                 255
Pro Leu Lys Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln
            260                 265                 270
Leu Phe Gly Ala Leu Met Asn Ala Gln Glu Lys Ile His Leu His Gly
        275                 280                 285
Asp Asp Trp Gln Arg Thr Ile Tyr Ile Asp Thr Leu Asp Val Gly Thr
    290                 295                 300
Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln
305                 310                 315                 320
Gly Ile Asn Gly Thr Glu Asn Tyr Phe Glu Trp Phe Asp Asn Pro Leu
                325                 330                 335
Glu Lys Pro Val Asn Arg Val Glu Ser
            340                 345
<210>87
<211>870
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>87
atgtcaaaga aactcgtaat atcggtagcg ggcggcggag cactcggaat cggaccactc     60
gcattcctgt gcaagattga acagatgctg ggaaagaaga taccccaggt tgcgcaggca    120
tacgccggca cttcaaccgg agcaataatt gcggcaggac tggccgaagg ctactccgcg    180
catgaactgt tcgacctata caaatcaaat ctcagcaaga tattcaccaa atacagctgg    240
tacaaacgcc tgcagccaac gtgtcctaca tatgacaaca gtaacctaaa gaaattactg    300
aaggacaaat tcaagggcaa ggtcggcgac tggaaaactc ccgtatacat cccggcaaca    360
cacatgaacg gccaatccgt agaaaaggtg tgggacttgg gtgacaagaa tgttgacaag    420
tggtttgcca ttctgacaag taccgcggca ccaacctatt tcgactgcat atacgacgac    480
gagaagaact gctacatcga tggtggcatg tggtgcaacg caccaatcga tgtgcttaat    540
gcaggcctga tcaagtccgg ctggtccaac tacaaggtcc tggacctgga gaccggcatg    600
gacacaccga atacggaaag cggaaacaag acacttctcg gatgggggga atacatcata    660
agcaactggg tagcccgttc cagcaagtcc ggcgaatacg aggtaaaggc cataatcggg    720
gaagacaatg tatgtgttgc ccgtccatac gtaagcaaga aaccgaagat ggatgacgtg    780
gacagcaaga cgctggatga agtcgtggat atctgggaaa actacttcta cgccaagcag    840
aaagacatcg catcgtggct gaaaatctag                                     870
<210>88
<211>289
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>88
Met Ser Lys Lys Leu Val Ile Ser Val Ala Gly Gly Gly Ala Leu Gly
 1               5                  10                  15
Ile Gly Pro Leu Ala Phe Leu Cys Lys Ile Glu Gln Met Leu Gly Lys
            20                  25                  30
Lys Ile Pro Gln Val Ala Gln Ala Tyr Ala Gly Thr Ser Thr Gly Ala
        35                  40                  45
Ile Ile Ala Ala Gly Leu Ala Glu Gly Tyr Ser Ala His Glu Leu Phe
    50                  55                  60
Asp Leu Tyr Lys Ser Asn Leu Ser Lys Ile Phe Thr Lys Tyr Ser Trp
65                  70                  75                  80
Tyr Lys Arg Leu Gln Pro Thr Cys Pro Thr Tyr Asp Asn Ser Asn Leu
                85                  90                  95
Lys Lys Leu Leu Lys Asp Lys Phe Lys Gly Lys Val Gly Asp Trp Lys
            100                 105                 110
Thr Pro Val Tyr Ile Pro Ala Thr His Met Asn Gly Gln Ser Val Glu
        115                 120                 125
Lys Val Trp Asp Leu Gly Asp Lys Asn Val Asp Lys Trp Phe Ala Ile
    130                 135                 140
Leu Thr Ser Thr Ala Ala Pro Thr Tyr Phe Asp Cys Ile Tyr Asp Asp
145                 150                 155                 160
Glu Lys Asn Cys Tyr Ile Asp Gly Gly Met Trp Cys Asn Ala Pro Ile
                165                 170                 175
Asp Val Leu Asn Ala Gly Leu Ile Lys Ser Gly Trp Ser Asn Tyr Lys
            180                 185                 190
Val Leu Asp Leu Glu Thr Gly Met Asp Thr Pro Asn Thr Glu Ser Gly
        195                 200                 205
Asn Lys Thr Leu Leu Gly Trp Gly Glu Tyr Ile Ile Ser Asn Trp Val
    210                 215                 220
Ala Arg Ser Ser Lys Ser Gly Glu Tyr Glu Val Lys Ala Ile Ile Gly
225                 230                 235                 240
Glu Asp Asn Val Cys Val Ala Arg Pro Tyr Val Ser Lys Lys Pro Lys
                245                 250                 255
Met Asp Asp Val Asp Ser Lys Thr Leu Asp Glu Val Val Asp Ile Trp
            260                 265                 270
Glu Asn Tyr Phe Tyr Ala Lys Gln Lys Asp Ile Ala Ser Trp Leu Lys
        275                 280                 285
Ile
<210>89
<211>1422
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>89
atgaaaaaga aattatgtac actggctttt gtaacagcaa tatcttctat cgctatcaca      60
attccaacag aagcacaagc ttgtggaata ggcgaagtaa tgaaacagga gaaccaagag     120
cacaaacgtg tgaagagatg gtctgcggaa catccacatc atcctaatga aagtacgcac     180
ttatggattg cgcgaaatgc aattcaaata atggcccgta atcaagataa gacggttcaa     240
gaaaatgaat tacaattttt aaatactcct gaatataagg agttatttga aagaggtctt     300
tatgatgctg attaccttga tgaatttaac gatggaggta caggtacaat cggcattgat     360
gggctaatta aaggagggtg gaaatctcat ttttacgatc ccgatacgag aaagaactat     420
aaaggggaag aagaaccaac agctctctct caaggagata aatattttaa attagcaggc     480
gattacttta agaaagagga ttggaaacaa gctttctatt atttaggtgt tgcgacgcac     540
tacttcacag atgctactca gccaatgcat gctgctaatt ttacagccgt cgacacgagt     600
gctttaaagt ttcatagcgc ttttgaaaat tatgtgacga caattcagac acagtatgaa     660
gtatctgatg gtgagggcgt atataattta gtgaattcta atgatccaaa acagtggatc     720
catgaaacag cgagactcgc aaaagtggaa atcgggaaca ttaccaatga cgagattaaa     780
tctcactata ataaaggaaa caatgctctt tggcaacaag aagttatgcc agctgtccag     840
aggagtttag agaacgcaca aagaaacacg gcgggattta ttcatttatg gtttaaaaca     900
tttgttggca atactgccgc tgaagaaatt gaaaatactg tagtgaaaga ttctaaagga     960
gaagcaatac aagataataa aaaatacttc gtagtgccaa gtgagtttct aaatagaggt    1020
ttgacctttg aagtatatgc aaggaatgac tatgcactat tatctaatta cgtagatgat    1080
agtaaagttc atggtacgcc agttcagttt gtatttgata aagataataa cggtatcctt    1140
catcgaggag aaagtatact gctgaaaatg acgcaatcta actatgataa ttacgtattt    1200
ctaaactact ctaacttgac aaactgggta catcttgcgc aacaaaaaac aaatactgca    1260
cagtttaaag tgtatccaaa tccgaataac ccatctgaat attacctata tacagatgga    1320
tacccagtaa attatcaaga aaatggtaac ggaaagagct ggattgtgtt aggaaagaaa    1380
acagatacac caaaagcttg gaaatttata caggctgaat ag                       1422
<210>90
<211>473
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(25)
<400>90
Met Lys Lys Lys Leu Cys Thr Leu Ala Phe Val Thr Ala Ile Ser Ser
 1               5                  10                  15
Ile Ala Ile Thr Ile Pro Thr Glu Ala Gln Ala Cys Gly Ile Gly Glu
            20                  25                  30
Val Met Lys Gln Glu Asn Gln Glu His Lys Arg Val Lys Arg Trp Ser
        35                  40                  45
Ala Glu His Pro His His Pro Asn Glu Ser Thr His Leu Trp Ile Ala
    50                  55                  60
Arg Asn Ala Ile Gln Ile Met Ala Arg Asn Gln Asp Lys Thr Val Gln
65                  70                  75                  80
Glu Asn Glu Leu Gln Phe Leu Asn Thr Pro Glu Tyr Lys Glu Leu Phe
                85                  90                  95
Glu Arg Gly Leu Tyr Asp Ala Asp Tyr Leu Asp Glu Phe Asn Asp Gly
            100                 105                 110
Gly Thr Gly Thr Ile Gly Ile Asp Gly Leu Ile Lys Gly Gly Trp Lys
        115                 120                 125
Ser His Phe Tyr Asp Pro Asp Thr Arg Lys Asn Tyr Lys Gly Glu Glu
    130                 135                 140
Glu Pro Thr Ala Leu Ser Gln Gly Asp Lys Tyr Phe Lys Leu Ala Gly
145                 150                 155                 160
Asp Tyr Phe Lys Lys Glu Asp Trp Lys Gln Ala Phe Tyr Tyr Leu Gly
                165                 170                 175
Val Ala Thr His Tyr Phe Thr Asp Ala Thr Gln Pro Met His Ala Ala
            180                 185                 190
Asn Phe Thr Ala Val Asp Thr Ser Ala Leu Lys Phe His Ser Ala Phe
        195                 200                 205
Glu Asn Tyr Val Thr Thr Ile Gln Thr Gln Tyr Glu Val Ser Asp Gly
    210                 215                 220
Glu Gly Val Tyr Asn Leu Val Asn Ser Asn Asp Pro Lys Gln Trp Ile
225                 230                 235                 240
His Glu Thr Ala Arg Leu Ala Lys Val Glu Ile Gly Asn Ile Thr Asn
                245                 250                 255
Asp Glu Ile Lys Ser His Tyr Asn Lys Gly Asn Asn Ala Leu Trp Gln
            260                 265                 270
Gln Glu Val Met Pro Ala Val Gln Arg Ser Leu Glu Asn Ala Gln Arg
        275                 280                 285
Asn Thr Ala Gly Phe Ile His Leu Trp Phe Lys Thr Phe Val Gly Asn
    290                 295                 300
Thr Ala Ala Glu Glu Ile Glu Asn Thr Val Val Lys Asp Ser Lys Gly
305                 310                 315                 320
Glu Ala Ile Gln Asp Asn Lys Lys Tyr Phe Val Val Pro Ser Glu Phe
                325                 330                 335
Leu Asn Arg Gly Leu Thr Phe Glu Val Tyr Ala Arg Asn Asp Tyr Ala
            340                 345                 350
Leu Leu Ser Asn Tyr Val Asp Asp Ser Lys Val His Gly Thr Pro Val
        355                 360                 365
Gln Phe Val Phe Asp Lys Asp Asn Asn Gly Ile Leu His Arg Gly Glu
    370                 375                 380
Ser Ile Leu Leu Lys Met Thr Gln Ser Asn Tyr Asp Asn Tyr Val Phe
385                 390                 395                 400
Leu Asn Tyr Ser Asn Leu Thr Asn Trp Val His Leu Ala Gln Gln Lys
                405                 410                 415
Thr Asn Thr Ala Gln Phe Lys Val Tyr Pro Asn Pro Asn Asn Pro Ser
            420                 425                 430
Glu Tyr Tyr Leu Tyr Thr Asp Gly Tyr Pro Val Asn Tyr Gln Glu Asn
        435                 440                 445
Gly Asn Gly Lys Ser Trp Ile Val Leu Gly Lys Lys Thr Asp Thr Pro
    450                 455                 460
Lys Ala Trp Lys Phe Ile Gln Ala Glu
465                 470
<210>91
<211>1035
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>91
atgacaaccc aatttagaaa cctgatcttt gagggcggcg gtgtaaaggg cattgcttac     60
gtcggagcaa tgcagattct tgaaaatcgt ggtgtattac aagatattca ccgagtcgga    120
ggttgtagtg cgggtgcgat taacgcgctg atttttgcgc tgggttacac agtccgtgag    180
caaaaagaga tcttacaaat taccgatttt aaccagttta tggataactc gtggggtgtt    240
attcgggata ttcgcaggct tgcgagagaa tttggctgga ataagggtaa cttctttaat    300
acctggatag gtgatttgat tcatcgtcgt ttgggtaatc gccgagccac gttcaaagat    360
ctgcaaaagg caaagcttcc tgatctttat gtcatcggta ctaatctgtc tacagggttt    420
gcagaggttt tttctgccga aagacacccc gatatggagc tggcgacagc ggtgcgtatc    480
tccatgtcga taccgctgtt ctttgcggcc gtgcgtcacg gtgatcgaca agatgtgtat    540
gtcgatgggg gtgtgcagct taactacccg atcaagctgt ttgatcgaac tcgttatatt    600
gacctcgcca aagatccggg tgctgctcgc cacacgggtt attacaataa agagaatgct    660
cgttttcagc ttgagcgacc gggccacagt ccttatgtgt acaatcgcca aacattaggc    720
ttgcgtcttg acagtcgtga agagatagcg ctgtttcgtt acgacgaacc tcttcagggt    780
aaacccatta agtccttcac tgactacgct cgacaacttt ttggtgcgct gaagaatgca    840
caggaaaaca ttcacctaca tggcgatgat tggcagcgca cggtctatat cgatacattg    900
gatgtgggta cgacggattt caatctttct gatgcaacca agcaagcact gattgaacag    960
ggaattaacg gcaccgaaaa ttatttcgag tggtttgata atccgtttga gaagcctgtg   1020
aatagagtgg agtaa                                                    1035
<210>92
<211>344
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>92
Met Thr Thr Gln Phe Arg Asn Leu Ile Phe Glu Gly Gly Gly Val Lys
 1               5                  10                  15
Gly Ile Ala Tyr Val Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val
            20                  25                  30
Leu Gln Asp Ile His Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn
        35                  40                  45
Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile
    50                  55                  60
Leu Gln Ile Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val
65                  70                  75                  80
Ile Arg Asp Ile Arg Arg Leu Ala Arg Glu Phe Gly Trp Asn Lys Gly
                85                  90                  95
Asn Phe Phe Asn Thr Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly
            100                 105                 110
Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Lys Ala Lys Leu Pro Asp
        115                 120                 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ala Glu Val Phe
    130                 135                 140
Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile
145                 150                 155                 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Asp Arg
                165                 170                 175
Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys
            180                 185                 190
Leu Phe Asp Arg Thr Arg Tyr Ile Asp Leu Ala Lys Asp Pro Gly Ala
        195                 200                 205
Ala Arg His Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu
    210                 215                 220
Glu Arg Pro Gly His Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225                 230                 235                 240
Leu Arg Leu Asp Ser Arg Glu Glu Ile Ala Leu Phe Arg Tyr Asp Glu
                245                 250                 255
Pro Leu Gln Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln
            260                 265                 270
Leu Phe Gly Ala Leu Lys Asn Ala Gln Glu Asn Ile His Leu His Gly
        275                 280                 285
Asp Asp Trp Gln Arg Thr Val Tyr Ile Asp Thr Leu Asp Val Gly Thr
    290                 295                 300
Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln
305                 310                 315                 320
Gly Ile Asn Gly Thr Glu Asn Tyr Phe Glu Trp Phe Asp Asn Pro Phe
                325                 330                 335
Glu Lys Pro Val Asn Arg Val Glu
            340
<210>93
<211>963
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>93
gtgattactt tgataaaaaa atgtttatta gtattgacga tgactctatt atcaggggtt     60
ttcgtaccgc tgcagccatc atatgctact gaaaattatc caaatgattt taaactgttg    120
caacataatg tatttttatt gcctgaatca gtttcttatt ggggtcagga cgaacgtgca    180
gattatatga gtaatgcaga ttactttaag ggacatgatg ctctgctctt aaatgagctt    240
tttgacaatg gaaattcgaa cgtgctgcta atgaacttat ccaaggaata tacatatcaa    300
acgccagtgc ttggccgttc gatgagtgga tgggatgaaa ctagaggaag ctattctaat    360
tttgtacccg aagatggtgg tgtagcaatt atcagtaaat ggccaatcgt ggagaaaata    420
cagcatgttt acgcgaatgg ttgcggtgca gactattatg caaataaagg atttgtttat    480
gcaaaagtac aaaaagggga taaattctat catcttatca gcactcatgc tcaagccgaa    540
gataccgggt gtgatcaggg tgaaggagca gaaattcgtc attcacagtt tcaagaaatc    600
aacgacttta ttaaaaataa aaacattccg aaagatgaag tggtatttat tggtggtgac    660
tttaatgtga tgaagagtga cacaacagag tacaatagca tgttatcaac attaaatgtc    720
aatgcgccta ccgaatattt agggcataac tctacttggg acccagaaac gaacagcatt    780
acaggttaca attaccctga ttatgcgcca cagcatttag attatatttt tgtggaaaaa    840
gatcataaac aaccaagttc atgggtaaat gaaacgatta ctccgaagtc tccaacttgg    900
aaggcaatct atgagtataa tgattattcc gatcactatc ctgttaaagc atacgtaaaa    960
taa                                                                  963
<210>94
<211>320
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(29)
<400>94
Met Ile Thr Leu Ile Lys Lys Cys Leu Leu Val Leu Thr Met Thr Leu
 1               5                  10                  15
Leu Ser Gly Val Phe Val Pro Leu Gln Pro Ser Tyr Ala Thr Glu Asn
            20                  25                  30
Tyr Pro Asn Asp Phe Lys Leu Leu Gln His Asn Val Phe Leu Leu Pro
        35                  40                  45
Glu Ser Val Ser Tyr Trp Gly Gln Asp Glu Arg Ala Asp Tyr Met Ser
    50                  55                  60
Asn Ala Asp Tyr Phe Lys Gly His Asp Ala Leu Leu Leu Asn Glu Leu
65                  70                  75                  80
Phe Asp Asn Gly Asn Ser Asn Val Leu Leu Met Asn Leu Ser Lys Glu
                85                  90                  95
Tyr Thr Tyr Gln Thr Pro Val Leu Gly Arg Ser Met Ser Gly Trp Asp
            100                 105                 110
Glu Thr Arg Gly Ser Tyr Ser Asn Phe Val Pro Glu Asp Gly Gly Val
        115                 120                 125
Ala Ile Ile Ser Lys Trp Pro Ile Val Glu Lys Ile Gln His Val Tyr
    130                 135                 140
Ala Asn Gly Cys Gly Ala Asp Tyr Tyr Ala Asn Lys Gly Phe Val Tyr
145                 150                 155                 160
Ala Lys Val Gln Lys Gly Asp Lys Phe Tyr His Leu Ile Ser Thr His
                165                 170                 175
Ala Gln Ala Glu Asp Thr Gly Cys Asp Gln Gly Glu Gly Ala Glu Ile
            180                 185                 190
Arg His Ser Gln Phe Gln Glu Ile Asn Asp Phe Ile Lys Asn Lys Asn
        195                 200                 205
Ile Pro Lys Asp Glu Val Val Phe Ile Gly Gly Asp Phe Asn Val Met
    210                 215                 220
Lys Ser Asp Thr Thr Glu Tyr Asn Ser Met Leu Ser Thr Leu Asn Val
225                 230                 235                 240
Asn Ala Pro Thr Glu Tyr Leu Gly His Asn Ser Thr Trp Asp Pro Glu
                245                 250                 255
Thr Asn Ser Ile Thr Gly Tyr Asn Tyr Pro Asp Tyr Ala Pro Gln His
            260                 265                 270
Leu Asp Tyr Ile Phe Val Glu Lys Asp His Lys Gln Pro Ser Ser Trp
        275                 280                 285
Val Asn Glu Thr Ile Thr Pro Lys Ser Pro Thr Trp Lys Ala Ile Tyr
    290                 295                 300
Glu Tyr Asn Asp Tyr Ser Asp His Tyr Pro Val Lys Ala Tyr Val Lys
305                 310                 315                 320
<210>95
<211>1038
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>95
atggcttcac aattcaggaa tctggtattt gaaggaggtg gtgtaaaagg gattgcgtac     60
ataggtgcga tgcaggtgct ggatcagcgc ggttatttgg gtgataacat caaacgcgtt    120
ggtggaacca gtgcaggtgc cataaatgcg ctgatttatt cgttaggata tgacatccac    180
gaacaacaag agatactgaa ctctacagat tttaaaaagt ttatggataa ctcttttgga    240
tttgtgaggg atttcagaag gctatggaat gaatttggat ggaatagagg agactttttt    300
cttaaatggt caggtgagct gatcaaaaat aaattgggca cctcaaaagc cacctttcag    360
gatttgaagg atgccggtca gccagatttg tatgtaattg gaacaaattt atcgacgggg    420
ttttccgaga ctttttcata tgaacgtcac cccgatatga ctcttgcaga agccgtaaga    480
atcagtatgt cgcttccgct gtttttcagg gctgtgcggt tgggcgacag gaatgatgta    540
tatgtggatg gtggggttca gctcaattac ccggtaaaac tatttgatcg tgaaaaatat    600
attgatatgg ataatgaggc ggctgcagca cgatttactg attattacaa caaagaaaat    660
gccagatttt cgctccagcg gcctggacga agcccctatg tatataatcg tcaaaccctt    720
ggtttgagac tggatacagc cgaagaaatt gcgcttttca ggtacgatga acccattcag    780
gggaaagaga tcaaacggtt tccggaatat gcaaaggctc tgatcggcgc actaatgcag    840
gtgcaggaaa acatacatct ccacagtgac gactggcagc gtacgctgta tatcaatacc    900
ctggatgtaa aaaccacaga ttttgaatta accgatgaga aaaaaaagga actggtagaa    960
cagggaatcc ttggcgcgga aacctatttc aaatggtttg aagacaggga tgaagtagtt   1020
gtaaaccgcc ttgcttag                                                 1038
<210>96
<211>345
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>96
Met Ala Ser Gln Phe Arg Asn Leu Val Phe Glu Gly Gly Gly Val Lys
 1               5                  10                  15
Gly Ile Ala Tyr Ile Gly Ala Met Gln Val Leu Asp Gln Arg Gly Tyr
            20                  25                  30
Leu Gly Asp Asn Ile Lys Arg Val Gly Gly Thr Ser Ala Gly Ala Ile
        35                  40                  45
Asn Ala Leu Ile Tyr Ser Leu Gly Tyr Asp Ile His Glu Gln Gln Glu
    50                  55                  60
Ile Leu Asn Ser Thr Asp Phe Lys Lys Phe Met Asp Asn Ser Phe Gly
65                  70                  75                  80
Phe Val Arg Asp Phe Arg Arg Leu Trp Asn Glu Phe Gly Trp Asn Arg
                85                  90                  95
Gly Asp Phe Phe Leu Lys Trp Ser Gly Glu Leu Ile Lys Asn Lys Leu
            100                 105                 110
Gly Thr Ser Lys Ala Thr Phe Gln Asp Leu Lys Asp Ala Gly Gln Pro
        115                 120                 125
Asp Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ser Glu Thr
    130                 135                 140
Phe Ser Tyr Glu Arg His Pro Asp Met Thr Leu Ala Glu Ala Val Arg
145                 150                 155                 160
Ile Ser Met Ser Leu Pro Leu Phe Phe Arg Ala Val Arg Leu Gly Asp
                165                 170                 175
Arg Asn Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Val
            180                 185                 190
Lys Leu Phe Asp Arg Glu Lys Tyr Ile Asp Met Asp Asn Glu Ala Ala
        195                 200                 205
Ala Ala Arg Phe Thr Asp Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Ser
    210                 215                 220
Leu Gln Arg Pro Gly Arg Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu
225                 230                 235                 240
Gly Leu Arg Leu Asp Thr Ala Glu Glu Ile Ala Leu Phe Arg Tyr Asp
                245                 250                 255
Glu Pro Ile Gln Gly Lys Glu Ile Lys Arg Phe Pro Glu Tyr Ala Lys
            260                 265                 270
Ala Leu Ile Gly Ala Leu Met Gln Val Gln Glu Asn Ile His Leu His
        275                 280                 285
Ser Asp Asp Trp Gln Arg Thr Leu Tyr Ile Asn Thr Leu Asp Val Lys
    290                 295                 300
Thr Thr Asp Phe Glu Leu Thr Asp Glu Lys Lys Lys Glu Leu Val Glu
305                 310                 315                 320
Gln Gly Ile Leu Gly Ala Glu Thr Tyr Phe Lys Trp Phe Glu Asp Arg
                325                 330                 335
Asp Glu Val Val Val Asn Arg Leu Ala
            340                 345
<210>97
<211>1422
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>97
atgaaaagga aactatgtac atgggctctc gtaacagcaa tagcttctag tactgcggta     60
attccaacag cagcagaagc ttgtggatta ggagaagtaa tcaaacaaga gaatcaagag    120
cacaaacgtg tgaaaagatg gtctgcggag catccgcatc attcacatga aagtacccat    180
ttatggattg cacaaaatgc gattcaaatt atgagccgta atcaagataa gacggttcaa    240
gaaaatgaat tacaattttt aaatacccct gaatataagg agttatttga aagaggtctt    300
tatgatgctg attaccttga tgaatttaac gatggaggta caggtataat cggcattgat    360
gggctaattc gaggagggtg gaaatctcat ttctacgatc ccgatacaag aaagaactat    420
aaaggggagg aagaaccaac agctctttct caaggagata aatattttaa attagcaggt    480
gaatacttta agaagaatga ttggaaacag gctttctatt atttaggtgt tgcgacgcac    540
tactttacag atgctactca gccaatgcat gctgctaatt ttacagctgt cgacaggagt    600
gctataaagt ttcatagtgc ttttgaagat tatgtgacga caattcagga acagtttaaa    660
gtatcagatg gagagggaaa atataattta gtaaattcta atgatccgaa acagtggatc    720
catgaaacag cgagactcgc aaaagtggaa atcgggaaca ttaccaatga tgtgattaaa    780
tctcactata ataaaggaaa caatgctctt tggcagcaag aagttatgcc agctgttcag    840
agaagtttag aacaagccca aagaaatacg gcgggattta ttcatttatg gtttaaaaca    900
tatgttggaa aaacagctgc tgaagatatt gaaaatacta tagtgaaaga ttctagggga    960
gaagcaatac aagagaataa aaaatacttt gtagtaccaa gtgagttttt aaatagaggc   1020
ttaacatttg aagtgtatgc tgcttatgac tatgcgttat tatctaacca tgtggatgat   1080
aataatattc atggtacacc ggttcaaatt gtatttgata aagaaaataa tgggatcctt   1140
catcaaggag aaagtgcatt gttaaagatg acacaatcca actacgataa ttatgtattt   1200
ctaaattatt ctatcataac aaattgggta catcttgcaa aaagagaaaa caatactgca   1260
cagtttaaag tgtatccaaa tccaaataat ccaactgaat atttcatata tacagatggc   1320
tatccagtta attatcaaga aaaaggtaaa gagaaaagct ggattgtttt aggaaagaaa   1380
acggataaac caaaagcatg gaaatttata caggcggaat aa                      1422
<210>98
<211>473
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(25)
<400>98
Met Lys Arg Lys Leu Cys Thr Trp Ala Leu Val Thr Ala Ile Ala Ser
 1               5                  10                  15
Ser Thr Ala Val Ile Pro Thr Ala Ala Glu Ala Cys Gly Leu Gly Glu
            20                  25                  30
Val Ile Lys Gln Glu Asn Gln Glu His Lys Arg Val Lys Arg Trp Ser
        35                  40                  45
Ala Glu His Pro His His Ser His Glu Ser Thr His Leu Trp Ile Ala
    50                  55                  60
Gln Asn Ala Ile Gln Ile Met Ser Arg Asn Gln Asp Lys Thr Val Gln
65                  70                  75                  80
Glu Asn Glu Leu Gln Phe Leu Asn Thr Pro Glu Tyr Lys Glu Leu Phe
                85                  90                  95
Glu Arg Gly Leu Tyr Asp Ala Asp Tyr Leu Asp Glu Phe Asn Asp Gly
            100                 105                 110
Gly Thr Gly Ile Ile Gly Ile Asp Gly Leu Ile Arg Gly Gly Trp Lys
        115                 120                 125
Ser His Phe Tyr Asp Pro Asp Thr Arg Lys Asn Tyr Lys Gly Glu Glu
    130                 135                 140
Glu Pro Thr Ala Leu Ser Gln Gly Asp Lys Tyr Phe Lys Leu Ala Gly
145                 150                 155                 160
Glu Tyr Phe Lys Lys Asn Asp Trp Lys Gln Ala Phe Tyr Tyr Leu Gly
                165                 170                 175
Val Ala Thr His Tyr Phe Thr Asp Ala Thr Gln Pro Met His Ala Ala
            180                 185                 190
Asn Phe Thr Ala Val Asp Arg Ser Ala Ile Lys Phe His Ser Ala Phe
        195                 200                 205
Glu Asp Tyr Val Thr Thr Ile Gln Glu Gln Phe Lys Val Ser Asp Gly
    210                 215                 220
Glu Gly Lys Tyr Asn Leu Val Asn Ser Asn Asp Pro Lys Gln Trp Ile
225                 230                 235                 240
His Glu Thr Ala Arg Leu Ala Lys Val Glu Ile Gly Asn Ile Thr Asn
                245                 250                 255
Asp Val Ile Lys Ser His Tyr Asn Lys Gly Asn Asn Ala Leu Trp Gln
            260                 265                 270
Gln Glu Val Met Pro Ala Val Gln Arg Ser Leu Glu Gln Ala Gln Arg
        275                 280                 285
Asn Thr Ala Gly Phe Ile His Leu Trp Phe Lys Thr Tyr Val Gly Lys
    290                 295                 300
Thr Ala Ala Glu Asp Ile Glu Asn Thr Ile Val Lys Asp Ser Arg Gly
305                 310                 315                 320
Glu Ala Ile Gln Glu Asn Lys Lys Tyr Phe Val Val Pro Ser Glu Phe
                325                 330                 335
Leu Asn Arg Gly Leu Thr Phe Glu Val Tyr Ala Ala Tyr Asp Tyr Ala
            340                 345                 350
Leu Leu Ser Asn His Val Asp Asp Asn Asn Ile His Gly Thr Pro Val
        355                 360                 365
Gln Ile Val Phe Asp Lys Glu Asn Asn Gly Ile Leu His Gln Gly Glu
    370                 375                 380
Ser Ala Leu Leu Lys Met Thr Gln Ser Asn Tyr Asp Asn Tyr Val Phe
385                 390                 395                 400
Leu Asn Tyr Ser Ile Ile Thr Asn Trp Val His Leu Ala Lys Arg Glu
                405                 410                 415
Asn Asn Thr Ala Gln Phe Lys Val Tyr Pro Asn Pro Asn Asn Pro Thr
            420                 425                 430
Glu Tyr Phe Ile Tyr Thr Asp Gly Tyr Pro Val Asn Tyr Gln Glu Lys
        435                 440                 445
Gly Lys Glu Lys Ser Trp Ile Val Leu Gly Lys Lys Thr Asp Lys Pro
    450                 455                 460
Lys Ala Trp Lys Phe Ile Gln Ala Glu
465                 470
<210>99
<211>1053
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>99
atggcaaagc gttttattct ttcgatcgat ggtggtggca ttcgcgggat catcccggcg      60
gccatcctgg tggagctggc caagcggttg gaggggctgc cgcttcacaa ggcattcgac     120
atgatcgccg ggacatccac cggcggcatc attgcggcgg ggctgacatg cccgcatcct     180
gacgatgagg agacggcggc gtgcacgccg accgatcttc tcaagcttta tgtcgatcac     240
ggcggcaaga tcttcgagaa aaacccgatc ctcggcctca tcaacccatt cggcctcaac     300
gatccgcgct accagccaga tgagctggaa aacaggctga aggcgcagct cggcttgacg     360
gcgacgctcg ataaagggct caccaaggtg ctgatcacgg cctatgatat ccagcagcgg     420
caggcgctgt tcatggcaaa caccgacaac gagaacagca atttccgcta ctgggaggca     480
gcgcgggcga catcggccgc acccacctat tttccgccgg cgctgatcga aagggttggc     540
gagaagaaca aggacaagcg cttcgtgcca ttgatcgacg gcggcgtctt cgccaacgat     600
cctatccttg ccgcctatgt ggaggcgcga aagcagaaat ggggcaatga cgagctcgtt     660
ttcctgtcgc ttggtaccgg ccagcaaaac cgcccgatcg cctatcagga ggccaagggc     720
tggggcattt taggctggat gcagccgtct catgacacgc cgctgatctc gatcctgatg     780
cagggacagg cgagcaccgc ctcctatcag gccaatgcgc tgctcaatcc gcccggcacc     840
aagatcgact attcgaccgt ggtgacgaag gacaacgcgg cttcgctcag ctatttccgt     900
ctcgaccggc agctgagctc gaaggagaac gacgcgctgg acgacgcatc gcccgaaaac     960
atcagggcgc tgaaggcaat cgccgcgcaa atcatcaagg ataacgcgcc ggcgctcgac    1020
gaaatcgcca aacgcatcct ggccaaccaa taa                                 1053
<210>100
<211>350
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>100
Met Ala Lys Arg Phe Ile Leu Ser Ile Asp Gly Gly Gly Ile Arg Gly
 1               5                  10                  15
Ile Ile Pro Ala Ala Ile Leu Val Glu Leu Ala Lys Arg Leu Glu Gly
            20                  25                  30
Leu Pro Leu His Lys Ala Phe Asp Met Ile Ala Gly Thr Ser Thr Gly
        35                  40                  45
Gly Ile Ile Ala Ala Gly Leu Thr Cys Pro His Pro Asp Asp Glu Glu
    50                  55                  60
Thr Ala Ala Cys Thr Pro Thr Asp Leu Leu Lys Leu Tyr Val Asp His
65                  70                  75                  80
Gly Gly Lys Ile Phe Glu Lys Asn Pro Ile Leu Gly Leu Ile Asn Pro
                85                  90                  95
Phe Gly Leu Asn Asp Pro Arg Tyr Gln Pro Asp Glu Leu Glu Asn Arg
            100                 105                 110
Leu Lys Ala Gln Leu Gly Leu Thr Ala Thr Leu Asp Lys Gly Leu Thr
        115                 120                 125
Lys Val Leu Ile Thr Ala Tyr Asp Ile Gln Gln Arg Gln Ala Leu Phe
    130                 135                 140
Met Ala Asn Thr Asp Asn Glu Asn Ser Asn Phe Arg Tyr Trp Glu Ala
145                 150                 155                 160
Ala Arg Ala Thr Ser Ala Ala Pro Thr Tyr Phe Pro Pro Ala Leu Ile
                165                 170                 175
Glu Arg Val Gly Glu Lys Asn Lys Asp Lys Arg Phe Val Pro Leu Ile
            180                 185                 190
Asp Gly Gly Val Phe Ala Asn Asp Pro Ile Leu Ala Ala Tyr Val Glu
        195                 200                 205
Ala Arg Lys Gln Lys Trp Gly Asn Asp Glu Leu Val Phe Leu Ser Leu
    210                 215                 220
Gly Thr Gly Gln Gln Asn Arg Pro Ile Ala Tyr Gln Glu Ala Lys Gly
225                 230                 235                 240
Trp Gly Ile Leu Gly Trp Met Gln Pro Ser His Asp Thr Pro Leu Ile
                245                 250                 255
Ser Ile Leu Met Gln Gly Gln Ala Ser Thr Ala Ser Tyr Gln Ala Asn
            260                 265                 270
Ala Leu Leu Asn Pro Pro Gly Thr Lys Ile Asp Tyr Ser Thr Val Val
        275                 280                 285
Thr Lys Asp Asn Ala Ala Ser Leu Ser Tyr Phe Arg Leu Asp Arg Gln
    290                 295                 300
Leu Ser Ser Lys Glu Asn Asp Ala Leu Asp Asp Ala Ser Pro Glu Asn
305                 310                 315                 320
Ile Arg Ala Leu Lys Ala Ile Ala Ala Gln Ile Ile Lys Asp Asn Ala
                325                 330                 335
Pro Ala Leu Asp Glu Ile Ala Lys Arg Ile Leu Ala Asn Gln
            340                 345                 350
<210>101
<211>996
<212>DNA
<213>Bacteria
<400>101
ttgtcgctcg tcgcgtcgct ccgccgcgcc cccggcgccg ccctggccct cgcgcttgcc     60
gccgccaccc tggccgtgac cgcgcagggc gcgaccgccg cccccgccgc ggccgccgcc    120
gaggccccgc ggctcaaggt gctcacgtac aacacgttcc tgttctcgaa gacgctctac    180
ccgaactggg gccaggacca ccgggccaag gcgatcccca ccgccccctt ctaccagggc    240
caggacgtcg tggtcctcca ggaggccttc gacaactccg cgtcggacgc cctcaaggcg    300
aactccgccg gccagtaccc ctaccagacc cccgtcgtgg gccgcggcac cggcggctgg    360
gacgccaccg gcgggtccta ctcctcgacc acccccgagg acggcggcgt gacgatcctc    420
agcaagtggc cgatcgtccg caaggagcag tacgtctaca aggacgcgtg cggcgccgac    480
tggtggtcca acaagggctt cgcctacgtc gtgctcaacg tgaacggcag caaggtgcac    540
gtcctcggca cccacgccca gtccaccgac ccgggctgct cggcgggcga ggcggtgcag    600
atgcggagcc gccagttcaa ggcgatcgac gccttcctcg acgccaagaa catcccggcg    660
ggcgagcagg tgatcgtcgc cggcgacatg aacgtcgact cgcgcacgcc cgagtacggc    720
accatgctcg ccgacgccgg tctggcggcg gccgacgcgc gcaccggcca cccgtactcc    780
ttcgacaccg agctgaactc gatcgcctcc gagcgctacc cggacgaccc gcgcgaggac    840
ctcgattacg tcctctaccg cgccgggaac gcccgccccg ccaactggac caacaacgtg    900
gtcctggaga agagcgcccc gtggaccgtc tccagctggg gcaagagcta cacctacacc    960
aacctctccg accactaccc ggtcaccggc ttctga                              996
<210>102
<211>331
<212>PRT
<213>细菌
<220>
<221>信号
<222>(1)...(39)
<400>102
Leu Ser Leu Val Ala Ser Leu Arg Arg Ala Pro Gly Ala Ala Leu Ala
 1               5                  10                  15
Leu Ala Leu Ala Ala Ala Thr Leu Ala Val Thr Ala Gln Gly Ala Thr
            20                  25                  30
Ala Ala Pro Ala Ala Ala Ala Ala Glu Ala Pro Arg Leu Lys Val Leu
        35                  40                  45
Thr Tyr Asn Thr Phe Leu Phe Ser Lys Thr Leu Tyr Pro Asn Trp Gly
    50                  55                  60
Gln Asp His Arg Ala Lys Ala Ile Pro Thr Ala Pro Phe Tyr Gln Gly
65                  70                  75                  80
Gln Asp Val Val Val Leu Gln Glu Ala Phe Asp Asn Ser Ala Ser Asp
                85                  90                  95
Ala Leu Lys Ala Asn Ser Ala Gly Gln Tyr Pro Tyr Gln Thr Pro Val
            100                 105                 110
Val Gly Arg Gly Thr Gly Gly Trp Asp Ala Thr Gly Gly Ser Tyr Ser
        115                 120                 125
Ser Thr Thr Pro Glu Asp Gly Gly Val Thr Ile Leu Ser Lys Trp Pro
    130                 135                 140
Ile Val Arg Lys Glu Gln Tyr Val Tyr Lys Asp Ala Cys Gly Ala Asp
145                 150                 155                 160
Trp Trp Ser Asn Lys Gly Phe Ala Tyr Val Val Leu Asn Val Asn Gly
                165                 170                 175
Ser Lys Val His Val Leu Gly Thr His Ala Gln Ser Thr Asp Pro Gly
            180                 185                 190
Cys Ser Ala Gly Glu Ala Val Gln Met Arg Ser Arg Gln Phe Lys Ala
        195                 200                 205
Ile Asp Ala Phe Leu Asp Ala Lys Asn Ile Pro Ala Gly Glu Gln Val
    210                 215                 220
Ile Val Ala Gly Asp Met Asn Val Asp Ser Arg Thr Pro Glu Tyr Gly
225                 230                 235                 240
Thr Met Leu Ala Asp Ala Gly Leu Ala Ala Ala Asp Ala Arg Thr Gly
                245                 250                 255
His Pro Tyr Ser Phe Asp Thr Glu Leu Asn Ser Ile Ala Ser Glu Arg
            260                 265                 270
Tyr Pro Asp Asp Pro Arg Glu Asp Leu Asp Tyr Val Leu Tyr Arg Ala
        275                 280                 285
Gly Asn Ala Arg Pro Ala Asn Trp Thr Asn Asn Val Val Leu Glu Lys
    290                 295                 300
Ser Ala Pro Trp Thr Val Ser Ser Trp Gly Lys Ser Tyr Thr Tyr Thr
305                 310                 315                 320
Asn Leu Ser Asp His Tyr Pro Val Thr Gly Phe
                325                 330
<210>103
<211>2205
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>103
atgagcgaga agaaggagat tcgcgttgcg ttgatcatgg ggggtggcgt cagcctcggc     60
agtttttcgg gtggtgcgct tctcaagacc atcgagctgc tgcagcacac tgcccgcggt    120
ccggcgaaga tcgatgtcgt gaccggtgcc tcggcgggaa gcatgacgct gggcgtagtc    180
atctaccacc tcatgcgggg atcgtcgacc gatgagattc tccgcgatct gaggcggtcg    240
tgggtggaaa tgatctcgtt cgacggcctc tgtccgccga acctgtcccg tcacgacaag    300
ccgagcctgt tttccgatga gatcgtccgg aagatcgcgg ccaccgtcat cgatatgggg    360
cgcaagctcg aggcggctcc tcatccgctt ttcgccgacg aactcgtagc ctcgttcgca    420
ctgacgaacc tgaacggcat ccccgcccgt acggagggcc agctcatccg gcaggcaaag    480
ggaggcggag ggtccgagaa gggctcgaaa tccgttttcg ccgacgccgt gcagactacc    540
tttcaccacg acgtgatgcg attcgtggtg cggcgcgatc acaacgggca aggcagcctg    600
ttcgacagcc gttaccgggc acgcatactc cctccatgga atgttgggaa gggcggcgat    660
gcatgggaag cctttcgcac ggcggctgtt gcctcggggg cgtttccggc cgcatttcct    720
cccgtcgaga tcagccgcaa ccgcgacgaa ttcaacatct ggcccgatcg catcgaggac    780
cagaaggcat ttacgttcga ttacgtggac ggcggggtac ttcgcaacga acccctccgg    840
gaggcgattc acctggccgc gctgcgcgat gagggagcga cggacatcga gcgtgtgttc    900
atcctcatcg acccgaacat cagcggcacc ggcgaggtct tcccgctctc ctataaccag    960
cagatgcgga tcaagccgaa ctacgattcc aacggcgacg tccgacagta cgatctcgat   1020
gtgccggact acaccggcaa tctgatcggg gcgatcggtc ggctgggttc ggtgatcgtc   1080
gggcaggcga cgttccgcga ctggctcaag gctgccaaag tgaacagcca gatcgagtgg   1140
cgacgggaat tgctgcccat tctccgcgac ctgaacccga accccgggga ggaggcgcgc   1200
aggggcgtga acgggatgat cgacaagatc taccggcaaa agtatcagcg cgccctcgag   1260
tcaaagagcg ttccggtcga ggaggtggaa cggcgcgttg ccgaagacat cgaacgggac   1320
ctggcgcggc gccgttcgga ggccggcgac aacgacttca ttgcccggct cctcctgctc   1380
gtcgacctga tcggcaacct gcgtgagaag cagaagctga acatggtggc gatcaccccc   1440
gcttccgcgc cgcacaacga cgggcgcccc ttgccgctgg ccggcaattt tatgttcagc   1500
ttcggggggt tcttcaggga ggagtacagg caatacgact tctcggtcgg cgaattcgca   1560
gcatggaacg tcctgagcac gccggcctcc gagacgccct ttcttgccga gaccgccccg   1620
aaaccgcccg cccgacctcc ccagccgccg gcaatcaatc ctacctaccg ctcactcggc   1680
ccgcccatcc agcagcggtt cgaggagttc gttcgtgggc acgttcgcgc ctttatcgct   1740
tcggtcgctc cgctgggaac gagagggatc gtcacgggca agattggcgg aaagcttcga   1800
acgatgctga tggcctcgcg caacgggaaa tcagagtact tccggcttcg cctctccggc   1860
gttgacgggc tctacctccg aggctccaag ggccgcaacc tgagggcggt taacggatcg   1920
atcgacacgg tcgtcggcgt ctatatcgac gaggaagatc agcaccgcga tgagtttttc   1980
ggtccccatg tcttcggcgc gaacggctca ggctttacga tggaactatg ggagtcccgc   2040
ggttttttcg ggcgtgatcg tcgcgtcgct gtgatcgagt tggagaacaa ccccggcggg   2100
ttcgcaatcg ccgccggatg caggcggcgg cccggcgtgg tgctggatat ggccaggcgt   2160
aacgggcagc cactgcggac ggtggatgtg atggaatttg cgtga                   2205
<210>104
<211>734
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<400>104
Met Ser Glu Lys Lys Glu Ile Arg Val Ala Leu Ile Met Gly Gly Gly
 1               5                  10                  15
Val Ser Leu Gly Ser Phe Ser Gly Gly Ala Leu Leu Lys Thr Ile Glu
            20                  25                  30
Leu Leu Gln His Thr Ala Arg Gly Pro Ala Lys Ile Asp Val Val Thr
        35                  40                  45
Gly Ala Ser Ala Gly Ser Met Thr Leu Gly Val Val Ile Tyr His Leu
    50                  55                  60
Met Arg Gly Ser Ser Thr Asp Glu Ile Leu Arg Asp Leu Arg Arg Ser
65                  70                  75                  80
Trp Val Glu Met Ile Ser Phe Asp Gly Leu Cys Pro Pro Asn Leu Ser
                85                  90                  95
Arg His Asp Lys Pro Ser Leu Phe Ser Asp Glu Ile Val Arg Lys Ile
            100                 105                 110
Ala Ala Thr Val Ile Asp Met Gly Arg Lys Leu Glu Ala Ala Pro His
        115                 120                 125
Pro Leu Phe Ala Asp Glu Leu Val Ala Ser Phe Ala Leu Thr Asn Leu
    130                 135                 140
Asn Gly Ile Pro Ala Arg Thr Glu Gly Gln Leu Ile Arg Gln Ala Lys
145                 150                 155                 160
Gly Gly Gly Gly Ser Glu Lys Gly Ser Lys Ser Val Phe Ala Asp Ala
                165                 170                 175
Val Gln Thr Thr Phe His His Asp Val Met Arg Phe Val Val Arg Arg
            180                 185                 190
Asp His Asn Gly Gln Gly Ser Leu Phe Asp Ser Arg Tyr Arg Ala Arg
        195                 200                 205
Ile Leu Pro Pro Trp Asn Val Gly Lys Gly Gly Asp Ala Trp Glu Ala
    210                 215                 220
Phe Arg Thr Ala Ala Val Ala Ser Gly Ala Phe Pro Ala Ala Phe Pro
225                 230                 235                 240
Pro Val Glu Ile Ser Arg Asn Arg Asp Glu Phe Asn Ile Trp Pro Asp
                245                 250                 255
Arg Ile Glu Asp Gln Lys Ala Phe Thr Phe Asp Tyr Val Asp Gly Gly
            260                 265                 270
Val Leu Arg Asn Glu Pro Leu Arg Glu Ala Ile His Leu Ala Ala Leu
        275                 280                 285
Arg Asp Glu Gly Ala Thr Asp Ile Glu Arg Val Phe Ile Leu Ile Asp
    290                 295                 300
Pro Asn Ile Ser Gly Thr Gly Glu ValPhe Pro Leu Ser Tyr Asn Gln
305                 310                 315                 320
Gln Met Arg Ile Lys Pro Asn Tyr Asp Ser Asn Gly Asp Val Arg Gln
                325                 330                 335
Tyr Asp Leu Asp Val Pro Asp Tyr Thr Gly Asn Leu Ile Gly Ala Ile
            340                 345                 350
Gly Arg Leu Gly Ser Val Ile Val Gly Gln Ala Thr Phe Arg Asp Trp
        355                 360                 365
Leu Lys Ala Ala Lys Val Asn Ser Gln Ile Glu Trp Arg Arg Glu Leu
    370                 375                 380
Leu Pro Ile Leu Arg Asp Leu Asn Pro Asn Pro Gly Glu Glu Ala Arg
385                 390                 395                 400
Arg Gly Val Asn Gly Met Ile Asp Lys Ile Tyr Arg Gln Lys Tyr Gln
                405                 410                 415
Arg Ala Leu Glu Ser Lys Ser Val Pro Val Glu Glu Val Glu Arg Arg
            420                 425                 430
Val Ala Glu Asp Ile Glu Arg Asp Leu Ala Arg Arg Arg Ser Glu Ala
        435                 440                 445
Gly Asp Asn Asp Phe Ile Ala Arg Leu Leu Leu Leu Val Asp Leu Ile
    450                 455                 460
Gly Asn Leu Arg Glu Lys Gln Lys Leu Asn Met Val Ala Ile Thr Pro
465                 470                 475                 480
Ala Ser Ala Pro His Asn Asp Gly Arg Pro Leu Pro Leu Ala Gly Asn
                485                 490                 495
Phe Met Phe Ser Phe Gly Gly Phe Phe Arg Glu Glu Tyr Arg Gln Tyr
            500                 505                 510
Asp Phe Ser Val Gly Glu Phe Ala Ala Trp Asn Val Leu Ser Thr Pro
        515                 520                 525
Ala Ser Glu Thr Pro Phe Leu Ala Glu Thr Ala Pro Lys Pro Pro Ala
    530                 535                 540
Arg Pro Pro Gln Pro Pro Ala Ile Asn Pro Thr Tyr Arg Ser Leu Gly
545                 550                 555                 560
Pro Pro Ile Gln Gln Arg Phe Glu Glu Phe Val Arg Gly His Val Arg
                565                 570                 575
Ala Phe Ile Ala Ser Val Ala Pro Leu Gly Thr Arg Gly Ile Val Thr
            580                 585                 590
Gly Lys Ile Gly Gly Lys Leu Arg Thr Met Leu Met Ala Ser Arg Asn
        595                 600                 605
Gly Lys Ser Glu Tyr Phe Arg Leu Arg Leu Ser Gly Val Asp Gly Leu
    610                 615                 620
Tyr Leu Arg Gly Ser Lys Gly Arg Asn Leu Arg Ala Val Asn Gly Ser
625                 630                 635                 640
Ile Asp Thr Val Val Gly Val Tyr Ile Asp Glu Glu Asp Gln His Arg
                645                 650                 655
Asp Glu Phe Phe Gly Pro His Val Phe Gly Ala Asn Gly Ser Gly Phe
            660                 665                 670
Thr Met Glu Leu Trp Glu Ser Arg Gly Phe Phe Gly Arg Asp Arg Arg
        675                 680                 685
Val Ala Val Ile Glu Leu Glu Asn Asn Pro Gly Gly Phe Ala Ile Ala
    690                 695                 700
Ala Gly Cys Arg Arg Arg Pro Gly Val Val Leu Asp Met Ala Arg Arg
705                 710                 715                 720
Asn Gly Gln Pro Leu Arg Thr Val Asp Val Met Glu Phe Ala
                725                 730
<210>105
<211>756
<212>DNA
<213>未知
<220>
<223>获自环境样品.
<400>105
atgaaccgtt gtcggaactc actcaacctc caacttcgcg cggtgaccgt ggcggcgttg      60
gtagtcgtcg catcctcggc cgcgctggcg tgggacagcg cctcgcgcaa tccgacccat     120
cccacccaca gctacctcac cgaatacgcc atcgatcagc ttggggtggc gcggccggag     180
ctccggcaat accgcaagca gatcatcgag ggcgccaaca ccgagctgca cgaactgcca     240
gtcaagggga cggcctatgg cctcgacctc gacgccaagc ggcgggaaca ccgcggcacc     300
aatgccggga cagacgacat cgccggctgg tgggcggaaa gcctccaagc ctatcgcgcc     360
ggtgccaagg aacgcgccta cttcgtgctg ggggtggtgc tgcacatggt cgaggacatg     420
ggcgtgccgg cgcacgcgaa cggcgtctac caccagggca acctgactga attcgacaat     480
ttcgagttca tgggactgtc gaactggaag ccctctttcg ccgacatcaa ccggaccgat     540
ccgggctacg ccgacccgtc gcgctactac gagttcagcc gagattggac ggcggcagac     600
gcacccggct atcgcgaccg cgacagcttc tcgaagacct gggttctcgc cagcccggcc     660
gaacgtcagc tgcttcagaa ccgccagggc cggaccgcca cggtcgccat gtgggcgtta     720
cggagcgcga cgaaggcgtt cgccgggaaa ccctag                               756
<210>106
<211>251
<212>PRT
<213>未知
<220>
<223>获自环境样品.
<220>
<221>信号
<222>(1)...(30)
<400>106
Met Asn Arg Cys Arg Asn Ser Leu Asn Leu Gln Leu Arg Ala Val Thr
 1               5                  10                  15
Val Ala Ala Leu Val Val ValAla Ser Ser Ala Ala Leu Ala Trp Asp
            20                  25                  30
Ser Ala Ser Arg Asn Pro Thr His Pro Thr His Ser Tyr Leu Thr Glu
        35                  40                  45
Tyr Ala Ile Asp Gln Leu Gly Val Ala Arg Pro Glu Leu Arg Gln Tyr
    50                  55                  60
Arg Lys Gln Ile Ile Glu Gly Ala Asn Thr Glu Leu His Glu Leu Pro
65                  70                  75                  80
Val Lys Gly Thr Ala Tyr Gly Leu Asp Leu Asp Ala Lys Arg Arg Glu
                85                  90                  95
His Arg Gly Thr Asn Ala Gly Thr Asp Asp Ile Ala Gly Trp Trp Ala
            100                 105                 110
Glu Ser Leu Gln Ala Tyr Arg Ala Gly Ala Lys Glu Arg Ala Tyr Phe
        115                 120                 125
Val Leu Gly Val Val Leu His Met Val Glu Asp Met Gly Val Pro Ala
    130                 135                 140
His Ala Asn Gly Val Tyr His Gln Gly Asn Leu Thr Glu Phe Asp Asn
145                 150                 155                 160
Phe Glu Phe Met Gly Leu Ser Asn Trp Lys Pro Ser Phe Ala Asp Ile
                165                 170                 175
Asn Arg Thr Asp Pro Gly Tyr Ala Asp Pro Ser Arg Tyr Tyr Glu Phe
            180                 185                 190
Ser Arg Asp Trp Thr Ala Ala Asp Ala Pro Gly Tyr Arg Asp Arg Asp
        195                 200                 205
Ser Phe Ser Lys Thr Trp Val Leu Ala Ser Pro Ala Glu Arg Gln Leu
    210                 215                 220
Leu Gln Asn Arg Gln Gly Arg Thr Ala Thr Val Ala Met Trp Ala Leu
225                 230                 235                 240
Arg Ser Ala Thr Lys Ala Phe Ala Gly Lys Pro
                245                 250
<210>107
<211>990
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>107
atgagcaata agaagtttat tttgaaatta ttcatatgta gtactatact tagcacattt      60
gtatttgctt tcaatgataa gcaagcagtt gctgctagcg ctggtaatgg gcttgaaaac     120
tggtcaaaat ggatgcaacc tatacccgat aacgtaccgt tagcacgaat ttcaattcca     180
ggaacacatg atagtggaac gttcaagttg caaaatccga taaagcaagt atggggaatg     240
acgcaagaat ataattttcg ttaccaaatg gatcacggag ctagaatttt tgatattaga     300
gggcgtttaa cagatgataa tacgatagtt cttcatcatg gaccattata tctttatgta     360
acattgcatg aatttataaa tgaagcgaaa caatttttaa aagataatcc aagtgaaacg     420
attattatgt ctttaaaaaa agagtatgag gatatgaaag gggcagaaga ttcatttagt     480
agtacgtttg aaaaaaaata ttttcctgat cctatctttt taaaaacaga agggaatata     540
agacttggag atgctcgagg aaaaattgtg ctactaaaaa gatacagtgg tagtaatgaa     600
tctggaggat ataataattt ttattggcca gataatgaca cgtttacgac aactgtaaat     660
caaaatgtaa atgtaacagt acaagataaa tataaggtga gttatgatga gaaagtaaca     720
tctattaaag atacgataaa tgaaacgatt aacaacagtg aagattgtaa tcatctatat     780
attaatttta caagcttgtc ttctggtggt acagcatgga atagtccata ttattacgcg     840
tcctacataa atcctgaaat tgcaaactat atgaagcaaa agaatcctac gagagtgggc     900
tgggtaattc aagattatat aaatgaaaaa tggtccccaa tactttatga agaagttata     960
agagcgaata agtcacttgt aaaagagtaa                                      990
<210>108
<211>329
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号
<222>(1)...(23)
<220>
<221>结构域
<222>(56)...(195)
<223>磷脂酰肌醇特异性磷脂酶C,X结构域
<400>108
Met Ser Asn Lys Lys Phe Ile Leu Lys Leu Phe Ile Cys Ser Thr Ile
 1               5                  10                  15
Leu Ser Thr Phe Val Phe Ala Phe Asn Asp Lys Gln Ala Val Ala Ala
            20                  25                  30
Ser Ala Gly Asn Gly Leu Glu Asn Trp Ser Lys Trp Met Gln Pro Ile
        35                  40                  45
Pro Asp Asn Val Pro Leu Ala Arg Ile Ser Ile Pro Gly Thr His Asp
    50                  55                  60
Ser Gly Thr Phe Lys Leu Gln Asn Pro Ile Lys Gln Val Trp Gly Met
65                  70                  75                  80
Thr Gln Glu Tyr Asn Phe Arg Tyr Gln Met Asp His Gly Ala Arg Ile
                85                  90                  95
Phe Asp Ile Arg Gly Arg Leu Thr Asp Asp Asn Thr Ile Val Leu His
            100                 105                 110
His Gly Pro Leu Tyr Leu Tyr Val Thr Leu His Glu Phe Ile Asn Glu
        115                 120                 125
Ala Lys Gln Phe Leu Lys Asp Asn Pro Ser Glu Thr Ile Ile Met Ser
    130                 135                 140
Leu Lys Lys Glu Tyr Glu Asp Met Lys Gly Ala Glu Asp Ser Phe Ser
145                 150                 155                 160
Ser Thr Phe Glu Lys Lys Tyr Phe Pro Asp Pro Ile Phe Leu Lys Thr
                165                 170                 175
Glu Gly Asn Ile Arg Leu Gly Asp Ala Arg Gly Lys Ile Val Leu Leu
            180                 185                 190
Lys Arg Tyr Ser Gly Ser Asn Glu Ser Gly Gly Tyr Asn Asn Phe Tyr
        195                 200                 205
Trp Pro Asp Asn Asp Thr Phe Thr Thr Thr Val Asn Gln Asn Val Asn
    210                 215                 220
Val Thr Val Gln Asp Lys Tyr Lys Val Ser Tyr Asp Glu Lys Val Thr
225                 230                 235                 240
Ser Ile Lys Asp Thr Ile Asn Glu Thr Ile Asn Asn Ser Glu Asp Cys
                245                 250                 255
Asn His Leu Tyr Ile Asn Phe Thr Ser Leu Ser Ser Gly Gly Thr Ala
            260                 265                 270
Trp Asn Ser Pro Tyr Tyr Tyr Ala Ser Tyr Ile Asn Pro Glu Ile Ala
        275                 280                 285
Asn Tyr Met Lys Gln Lys Asn Pro Thr Arg Val Gly Trp Val Ile Gln
    290                 295                 300
Asp Tyr Ile Asn Glu Lys Trp Ser Pro Ile Leu Tyr Glu Glu Val Ile
305                 310                 315                 320
Arg Ala Asn Lys Ser Leu Val Lys Glu
                325
<210>109
<211>990
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>109
atgagcaata agaagtttat tttgaaatta ttcatatgta gtactatact tagcacattt      60
gtatttgctt tcaatgataa gcaagcagtt gctgctagcg ctggtaatgg gcttgaaaac     120
tggtcaaaat ggatgcaacc tatacccgat aacgtaccgt tagcacgaat ttcaattcca     180
ggaacacatg atagtggaac gttcaagttg caaaatccga taaagcaagt atggggaatg     240
acgcaagaat ataattttcg ttaccaaatg gatcacggag ctagaatttt tgatattaga     300
gggcgtttaa cagatgataa tacgatagtt cttcatcatg ggccattata tctttatgta     360
acattgcatg aatttataaa tgaagcgaaa caatttttaa aagataatcc aagtgaaacg     420
attattatgt ctttaaaaaa agagtatgag gatatgaaag gggcagaaga ttcatttagt     480
agtacgtttg aaaaaaaata ttttcctgat cctatctttt taaaaacaga agggaatata     540
agacttggag atgctcgagg aaaaattgtg ctactaaaaa gatacagtgg tagtaatgaa     600
tctggaggat ataataattt ttattggcca gataatgaga cgtttacgac aactgtaaat     660
caaaatgtaa atgtaacagt acaagataaa tataaagtga gttatgatga gaaagtaaaa     720
tctattaaag atacgataaa tgaaacgatt aacaacagtg aagattgtaa tcatctatat     780
attaatttta caagcttgtc ttctggtggt acagcatgga atagtccata ttattatgcg     840
tcctacataa atcctgaaat tgcaaactat atgaagcaaa agaatcctat gagagtgggc     900
tgggtaattc aagattatat aaatgaaaaa tggtccccaa tactttatga agaagttata     960
agagcgaata agtcacttgt aaaagagtaa                                      990
<210>110
<211>329
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号
<222>(1)...(23)
<220>
<221>结构域
<222>(56)...(195)
<400>110
Met Ser Asn Lys Lys Phe Ile Leu Lys Leu Phe Ile Cys Ser Thr Ile
 1               5                  10                  15
Leu Ser Thr Phe Val Phe Ala Phe Asn Asp Lys Gln Ala Val Ala Ala
            20                  25                  30
Ser Ala Gly Asn Gly Leu Glu Asn Trp Ser Lys Trp Met Gln Pro Ile
        35                  40                  45
Pro Asp Asn Val Pro Leu Ala Arg Ile Ser Ile Pro Gly Thr His Asp
    50                  55                  60
Ser Gly Thr Phe Lys Leu Gln Asn Pro Ile Lys Gln Val Trp Gly Met
65                  70                  75                  80
Thr Gln Glu Tyr Asn Phe Arg Tyr Gln Met Asp His Gly Ala Arg Ile
                85                  90                  95
Phe Asp Ile Arg Gly Arg Leu Thr Asp Asp Asn Thr Ile Val Leu His
            100                 105                 110
His Gly Pro Leu Tyr Leu Tyr ValThr Leu His Glu Phe Ile Asn Glu
        115                 120                 125
Ala Lys Gln Phe Leu Lys Asp Asn Pro Ser Glu Thr Ile Ile Met Ser
    130                 135                 140
Leu Lys Lys Glu Tyr Glu Asp Met Lys Gly Ala Glu Asp Ser Phe Ser
145                 150                 155                 160
Ser Thr Phe Glu Lys Lys Tyr Phe Pro Asp Pro Ile Phe Leu Lys Thr
                165                 170                 175
Glu Gly Asn Ile Arg Leu Gly Asp Ala Arg Gly Lys Ile Val Leu Leu
            180                 185                 190
Lys Arg Tyr Ser Gly Ser Asn Glu Ser Gly Gly Tyr Asn Asn Phe Tyr
        195                 200                 205
Trp Pro Asp Asn Glu Thr Phe Thr Thr Thr Val Asn Gln Asn Val Asn
    210                 215                 220
Val Thr Val Gln Asp Lys Tyr Lys Val Ser Tyr Asp Glu Lys Val Lys
225                 230                 235                 240
Ser Ile Lys Asp Thr Ile Asn Glu Thr Ile Asn Asn Ser Glu Asp Cys
                245                 250                 255
Asn His Leu Tyr Ile Asn Phe Thr Ser Leu Ser Ser Gly Gly Thr Ala
            260                 265                 270
Trp Asn Ser Pro Tyr Tyr Tyr Ala Ser Tyr Ile Asn Pro Glu Ile Ala
        275                 280                 285
Asn Tyr Met Lys Gln Lys Asn Pro Met Arg Val Gly Trp Val Ile Gln
    290                 295                 300
Asp Tyr Ile Asn Glu Lys Trp Ser Pro Ile Leu Tyr Glu Glu Val Ile
305                 310                 315                 320
Arg Ala Asn Lys Ser Leu Val Lys Glu
                325
<210>111
<211>828
<212>DNA
<213>细菌
<400>111
gtgggtgccg gggcgatcct tctcaccggg gcccccaccg cctcggccgt ggacacgcgc      60
gcgtggatgg ggggacacgg ggacggcacg ccgctccagc ggctcaccat ccccggcacc     120
cacgactccg gcgcccggtt cggcgggccc tggtcggagt gccagaacac caccatcgcc     180
cagcagctgg acagcgggat ccggttcctg gacgtccggt gccgggtcac cggcgggtcc     240
ttcgccatcc accacggggc ctcctaccag aacatgatgt tcggcgacgt cctcgtcgcc     300
tgccgcgact tcctcgccgc gcacccctcc gagaccgtcc tcatgcgggt caagcaggag     360
tactcgaccg actccgacgc caccttccgg gccgtcttcg acgactacct cgacgcgcgc     420
ggctggcgct ccctgttccg catcggcgac ggggtcccgc tgctcggcga ggcccgcggc     480
cgggtcgtgc tcatcgccga caacggcgga ctgccgggcg gtctgcgctg gggcgacggc     540
tcggccctcg ccatccagga cgactggaac gcgctgcccg accccaagta cgccaagatc     600
gaggcgcact tccgtaccgc cgtcgcccag ccgggccggc tgtacgtgaa cttcgtcagc     660
acctccgcct acctgccgcc ccgctggaac tccgacaacc tcaacccgcg cgtgcaccgc     720
tacctcgaca gcgcggccgc cgcgggcgcg aagggcctcg ggatcgtccc catggacttc     780
cccaacaccc gctcgggtct ggtcgaggcg ctgctccggc acaactga                  828
<210>112
<211>275
<212>PRT
<213>细菌
<220>
<221>信号
<222>(1)...(16)
<220>
<221>结构域
<222>(34)...(168)
<223>磷脂酰肌醇特异性磷脂酶C,X结构域
<400>112
Mer Gly Ala Gly Ala Ile Leu Leu Thr Gly Ala Pro Thr Ala Ser Ala
 1               5                  10                  15
Val Asp Thr Arg Ala Trp Met Gly Gly His Gly Asp Gly Thr Pro Leu
            20                  25                  30
Gln Arg Leu Thr Ile Pro Gly Thr His Asp Ser Gly Ala Arg Phe Gly
        35                  40                  45
Gly Pro Trp Ser Glu Cys Gln Asn Thr Thr Ile Ala Gln Gln Leu Asp
    50                  55                  60
Ser Gly Ile Arg Phe Leu Asp Val Arg Cys Arg Val Thr Gly Gly Ser
65                  70                  75                  80
Phe Ala Ile His His Gly Ala Ser Tyr Gln Asn Met Mer Phe Gly Asp
                85                  90                  95
Val Leu Val Ala Cys Arg Asp Phe Leu Ala Ala His Pro Ser Glu Thr
            100                 105                 110
Val Leu Met Arg Val Lys Gln Glu Tyr Ser Thr Asp Ser Asp Ala Thr
        115                 120                 125
Phe Arg Ala Val Phe Asp Asp Tyr Leu Asp Ala Arg Gly Trp Arg Ser
    130                 135                 140
Leu Phe Arg Ile Gly Asp Gly Val Pro Leu Leu Gly Glu Ala Arg Gly
145                 150                 155                 160
Arg Val Val Leu Ile Ala Asp Asn Gly Gly Leu Pro Gly Gly Leu Arg
                165                 170                 175
Trp Gly Asp Gly Ser Ala Leu Ala Ile Gln Asp Asp Trp Asn Ala Leu
            180                 185                 190
Pro Asp Pro Lys Tyr Ala Lys Ile Glu Ala His Phe Arg Thr Ala Val
        195                 200                 205
Ala Gln Pro Gly Arg Leu Tyr Val Asn Phe Val Ser Thr Ser Ala Tyr
    210                 215                 220
Leu Pro Pro Arg Trp Asn Ser Asp Asn Leu Asn Pro Arg Val His Arg
225                 230                 235                 240
Tyr Leu Asp Ser Ala Ala Ala Ala Gly Ala Lys Gly Leu Gly Ile Val
                245                 250                 255
Pro Met Asp Phe Pro Asn Thr Arg Ser Gly Leu Val Glu Ala Leu Leu
            260                 265                 270
Arg His Asn
        275
<210>113
<211>981
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>113
atgagcaata agaagtttat tttgaaatta ttcatatgta gtactatact tagcacattt      60
gtatttgctt tcaatgataa gcaagcagtt gctgctagcg ctggtaatgg gcttgaaaac     120
tggtcaaaat ggatgcaacc tatacccgat aacgtaccgt tagcacgaat ttcaattcca     180
ggaacacatg atagtggaac gttcaagttg caaaatccga taaagcaagt atggggaatg     240
acgcaagaat ataattttcg ttaccaaatg gatcacggag ctagaatttt tgatattaga     300
gggcgtttaa cagatgataa tacgatagtt cttcatcatg ggccattata tctttatgta     360
acattgcatg aatttataaa tgaagcgaaa caatttttaa aagataatcc aagtgaaacg     420
attattatgt ctttaaaaaa agagtatgag gatatgaaag gggcagaaga ttcatttagt     480
agtacgtttg aaaaaaaata ttttcctgat cctatctttt taaaaacaga agggaatata     540
agacttggag atgctcgagg aaaaattgtg ctactaaaaa gatacagtgg tagtaatgaa     600
tctggaggat ataataattt ttattggcca gataatgaga cgtttacgac aactgtaaat     660
caaaatgtaa atgtaacagt acaagataaa tataaagtga gttatgatga gaaagtaaaa     720
tctattaaag atacgataaa tgaaacgatt aacaacagtg aagattgtaa tcatctatat     780
attaatttta caagcttgtc ttctggtggt acagcatgga atagtccata ttattatgcg     840
tcctacataa atcctgaaat tgcaaactat atgaagcaaa agaatcctat gagagtgggc     900
tgggtaattc aagattatat aaatgaaaaa tggtccccaa tactttatga agaagttata     960
agagcgaata agtcactgta a                                               981
<210>114
<211>326
<212>PRT
<213>未知
<223>获自环境样品
<220>
<221>信号
<222>(1)...(23)
<220>
<221>结构域
<222>(56)...(195)
<223>磷脂酰肌醇特异性磷脂酶C,X结构域
<400>114
Met Ser Asn Lys Lys Phe Ile Leu Lys Leu Phe Ile Cys Ser Thr Ile
 1               5                  10                  15
Leu Ser Thr Phe Val Phe Ala Phe Asn Asp Lys Gln Ala Val Ala Ala
            20                  25                  30
Ser Ala Gly Asn Gly Leu Glu Asn Trp Ser Lys Trp Met Gln Pro Ile
        35                  40                  45
Pro Asp Asn Val Pro Leu Ala Arg Ile Ser Ile Pro Gly Thr His Asp
    50                  55                  60
Ser Gly Thr Phe Lys Leu Gln Asn Pro Ile Lys Gln Val Trp Gly Met
65                  70                  75                  80
Thr Gln Glu Tyr Asn Phe Arg Tyr Gln Met Asp His Gly Ala Arg Ile
                85                  90                  95
Phe Asp Ile Arg Gly Arg Leu Thr Asp Asp Asn Thr Ile Val Leu His
            100                 105                 110
His Gly Pro Leu Tyr Leu Tyr Val Thr Leu His Glu Phe Ile Asn Glu
        115                 120                 125
Ala Lys Gln Phe Leu Lys Asp Asn Pro Ser Glu Thr Ile Ile Met Ser
    130                 135                 140
Leu Lys Lys Glu Tyr Glu Asp Met Lys Gly Ala Glu Asp Ser Phe Ser
145                 150                 155                 160
Ser Thr Phe Glu Lys Lys Tyr Phe Pro Asp Pro Ile Phe Leu Lys Thr
                165                 170                 175
Glu Gly Asn Ile Arg Leu Gly Asp Ala Arg Gly Lys Ile Val Leu Leu
            180                 185                 190
Lys Arg Tyr Ser Gly Ser Asn Glu Ser Gly Gly Tyr Asn Asn Phe Tyr
        195                 200                 205
Trp Pro Asp Asn Glu Thr Phe Thr Thr Thr Val Asn Gln Asn Val Asn
    210                 215                 220
Val Thr Val Gln Asp Lys Tyr Lys Val Ser Tyr Asp Glu Lys Val Lys
225                 230                 235                 240
Ser Ile Lys Asp Thr Ile Asn Glu Thr Ile Asn Asn Ser Glu Asp Cys
                245                 250                 255
Asn His Leu Tyr Ile Asn Phe Thr Ser Leu Ser Ser Gly Gly Thr Ala
            260                 265                 270
Trp Asn Ser Pro Tyr Tyr Tyr Ala Ser Tyr Ile Asn Pro Glu Ile Ala
        275                 280                 285
Asn Tyr Met Lys Gln Lys Asn Pro Met Arg Val Gly Trp Val Ile Gln
    290                 295                 300
Asp Tyr Ile Asn Glu Lys Trp Ser Pro Ile Leu Tyr Glu Glu Val Ile
305                 310                 315                 320
Arg Ala Asn Lys Ser Leu
                325
<210>115
<211>987
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>115
atgaacaata agaagtttat tttgaagtta ttcatatgta gtatggtact tagcgccttt     60
gtatttgctt tcaatgataa gaaaaccgtt gcagctagct ctattaatga gcttgaaaat    120
tggtctagat ggatgaaacc tataaatgat gacataccgt tagcacgaat ttcaattcca    180
ggaacacatg atagtggaac gttcaagttg caaaatccga taaagcaagt gtggggaatg    240
acgcaagaat atgattttcg ttatcaaatg gatcatggag ctagaatttt tgatataaga    300
gggcgtttaa cagatgataa tacgatagtt cttcatcatg ggccattata tctttatgta    360
acactgcacg aatttataaa cgaagcgaaa caatttttaa aagataatcc aagtgaaacg    420
attattatgt ctttaaaaaa agagtatgag gatatgaaag gggcggaaag ctcatttagt    480
agtacgtttg agaaaaatta ttttcgtgat ccaatctttt taaaaacaga agggaatata    540
aagcttggag atgctcgtgg gaaaattata ttactaaaac gatatagtgg tagtaatgaa    600
tctgggggat ataataattt ctattggcca gacaatgaga cgtttacctc aactataaat    660
caaaatgtaa atgtcacagt acaagataaa tataaagtga gttatgatga gaaagtaaac    720
gctattaaag atacattaaa tgaaacgatt aacaatagtg aagatgttaa tcatctatat    780
attaatttta taagcttgtc ttctggtggt acagcatgga atagtccata ttattatgcg    840
tcctacataa atcctgaaat tgcaaattat atgaagcaaa agaatcctac gagagtgggc    900
tggataatac aagattatat aaatgaaaaa tggtcaccat tactttatca agaagttata    960
agagcgaata agtcacttgt aaaatag                                        987
<210>116
<211>328
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号
<222>(1)...(23)
<220>
<221>结构域
<222>(56)...(195)
<223>磷脂酰肌醇特异性磷脂酶C,X结构域
<400>116
Met Asn Asn Lys Lys Phe Ile Leu Lys Leu Phe Ile Cys Ser Met Val
 1               5                  10                  15
Leu Ser Ala Phe Val Phe Ala Phe Asn Asp Lys Lys Thr Val Ala Ala
            20                  25                  30
Ser Ser Ile Asn Glu Leu Glu Asn Trp Ser Arg Trp Met Lys Pro Ile
        35                  40                  45
Asn Asp Asp Ile Pro Leu Ala Arg Ile Ser Ile Pro Gly Thr His Asp
    50                  55                  60
Ser Gly Thr Phe Lys Leu Gln Asn Pro Ile Lys Gln Val Trp Gly Met
65                  70                  75                  80
Thr Gln Glu Tyr Asp Phe Arg Tyr Gln Met Asp His Gly Ala Arg Ile
                85                  90                  95
Phe Asp Ile Arg Gly Arg Leu Thr Asp Asp Asn Thr Ile Val Leu His
            100                 105                 110
His Gly Pro Leu Tyr Leu Tyr Val Thr Leu His Glu Phe Ile Asn Glu
        115                 120                 125
Ala Lys Gln Phe Leu Lys Asp Asn Pro Ser Glu Thr Ile Ile Met Ser
    130                 135                 140
Leu Lys Lys Glu Tyr Glu Asp Met Lys Gly Ala Glu Ser Ser Phe Ser
145                 150                 155                 160
Ser Thr Phe Glu Lys Asn Tyr Phe Arg Asp Pro Ile Phe Leu Lys Thr
                165                 170                 175
Glu Gly Asn Ile Lys Leu Gly Asp Ala Arg Gly Lys Ile Ile Leu Leu
            180                 185                 190
Lys Arg Tyr Ser Gly Ser Asn Glu Ser Gly Gly Tyr Asn Asn Phe Tyr
        195                 200                 205
Trp Pro Asp Asn Glu Thr Phe Thr Ser Thr Ile Asn Gln Asn Val Asn
    210                 215                 220
Val Thr Val Gln Asp Lys Tyr Lys Val Ser Tyr Asp Glu Lys Val Asn
225                 230                 235                 240
Ala Ile Lys Asp Thr Leu Asn Glu Thr Ile Asn Asn Ser Glu Asp Val
                245                 250                 255
Asn His Leu Tyr Ile Asn Phe Ile Ser Leu Ser Ser Gly Gly Thr Ala
            260                 265                 270
Trp Asn Ser Pro Tyr Tyr Tyr Ala Ser Tyr Ile Asn Pro Glu Ile Ala
        275                 280                 285
Asn Tyr Met Lys Gln Lys Asn Pro Thr Arg Val Gly Trp Ile Ile Gln
    290                 295                 300
Asp Tyr Ile Asn Glu Lys Trp Ser Pro Leu Leu Tyr Gln Glu Val Ile
305                 310                 315                 320
Arg Ala Asn Lys Ser Leu Val Lys
                325
<210>117
<211>987
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>117
atgaacaata agaagtttat tttgaagtta ttcatatgta gtatggtact tagcgccttt     60
gtatttgctt tcaatgataa gaaaaccgtt gcagctagct ctattaatga gcttgaaaat    120
tggtctagat ggatgaaacc tataaatgat gacataccgt tagcacgaat ttcaattcca    180
ggaacacatg atagtggaac gttcaagttg caaaatccga taaagcaagt gtggggaatg    240
acgcaagaat atgattttcg ttatcaaatg gatcatggag ctagaatttt tgatataaga    300
gggcgtttaa cagatgataa tacgatagtt cttcatcatg ggccattata tctttatgta    360
acactgcacg aatttataaa cgaagcgaaa caatttttaa aagataatcc aagtgaaacg    420
attattatgt ctttaaaaaa agagtatgag gatatgaaag gggcggaaag ctcatttagt    480
agtacgtttg agaaaaatta ttttcgtgat ccaatctttt taaaaacaga aggaaatata    540
aagcttggag atgctcgtgg gaaaattgta ttactaaaaa gatatagtgg tagtaatgaa    600
tctgggggat ataataattt ctattggcca gacaatgaga cgtttacctc aactataaat    660
caaaatgtaa atgtaacagt acaagataaa tataaagtga gttatgatga gaaaataaac    720
gctattaaag atacattaaa tgaaacgatt aacaatagtg aagatgttaa tcatctatat    780
attaatttta caagcttgtc ttctggtggt acagcatgga atagtccata ttattatgcg    840
tcctacataa atcctgaaat tgcaaattat atgaagcaaa agaatcctac gagagtgggc    900
tggataatac aagattatat aaatgaaaaa tggtcaccat tactttatca agaagttata    960
agagcgaata agtcacttgt aaaatag                                        987
<210>118
<211>328
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号
<222>(1)...(23)
<220>
<221>结构域
<222>(56)...(195)
<223>磷脂酰肌醇特异性磷脂酶C,X结构域
<400>118
Met Asn Asn Lys Lys Phe Ile Leu Lys Leu Phe Ile Cys Ser Met Val
 1               5                  10                  15
Leu Ser Ala Phe Val Phe Ala Phe Asn Asp Lys Lys Thr Val Ala Ala
            20                  25                  30
Ser Ser Ile Asn Glu Leu Glu Asn Trp Ser Arg Trp Met Lys Pro Ile
        35                  40                  45
Asn Asp Asp Ile Pro Leu Ala Arg Ile Ser Ile Pro Gly Thr His Asp
    50                  55                  60
Ser Gly Thr Phe Lys Leu Gln Asn Pro Ile Lys Gln Val Trp Gly Met
65                  70                  75                  80
Thr Gln Glu Tyr Asp Phe Arg Tyr Gln Met Asp His Gly Ala Arg Ile
                85                  90                  95
Phe Asp Ile Arg Gly Arg Leu Thr Asp Asp Asn Thr Ile Val Leu His
            100                 105                 110
His Gly Pro Leu Tyr Leu Tyr Val Thr Leu His Glu Phe Ile Asn Glu
        115                 120                 125
Ala Lys Gln Phe Leu Lys Asp Asn Pro Ser Glu Thr Ile Ile Met Ser
    130                 135                 140
Leu Lys Lys Glu Tyr Glu Asp Met Lys Gly Ala Glu Ser Ser Phe Ser
145                 150                 155                 160
Ser Thr Phe Glu Lys Asn Tyr Phe Arg Asp Pro Ile Phe Leu Lys Thr
                165                 170                 175
Glu Gly Asn Ile Lys Leu Gly Asp Ala Arg Gly Lys Ile Val Leu Leu
            180                 185                 190
Lys Arg Tyr Ser Gly Ser Asn Glu Ser Gly Gly Tyr Asn Asn Phe Tyr
        195                 200                 205
Trp Pro Asp Asn Glu Thr Phe Thr Ser Thr Ile Asn Gln Asn Val Asn
    210                 215                 220
Val Thr Val Gln Asp Lys Tyr Lys Val Ser Tyr Asp Glu Lys Ile Asn
225                 230                 235                 240
Ala Ile Lys Asp Thr Leu Asn Glu Thr Ile Asn Asn Ser Glu Asp Val
                245                 250                 255
Asn His Leu Tyr Ile Asn Phe Thr Ser Leu Ser Ser Gly Gly Thr Ala
            260                 265                 270
Trp Asn Ser Pro Tyr Tyr Tyr Ala Ser Tyr Ile Asn Pro Glu Ile Ala
        275                 280                 285
Asn Tyr Met Lys Gln Lys Asn Pro Thr Arg Val Gly Trp Ile Ile Gln
    290                 295                 300
Asp Tyr Ile Asn Glu Lys Trp Ser Pro Leu Leu Tyr Gln Glu Val Ile
305                 310                 315                 320
Arg Ala Asn Lys Ser Leu Val Lys
                325
<210>119
<211>987
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>119
atgaacaata agaagtttat tttgaagtta ttcatatgta gtatggtact tagcgccttt     60
gtatttgctt tcaatgataa gaaaaccgtt gcagctagct ctattaatgt gcttgaaaat    120
tggtctagat ggatgaaacc tataaatgat gacataccgt tagcacgaat ttcaattcca    180
ggaacacatg atagtggaac gttcaagttg caaaatccga taaagcaagt gtggggaatg    240
acgcaagaat atgattttcg ttatcaaatg gatcatggag ctagaatttt tgatataaga    300
gggcgtttaa cagatgataa tacgatagtt cttcatcatg ggccattata tctttatgta    360
acactgcacg aatttataaa cgaagcgaaa caatttttaa aagataatcc aagtgaaacg    420
attattatgt ctttaaaaaa agagtatgag gatatgaaag gggcggaaag ctcatttagt    480
agtacgtttg agaaaaatta ttttcgtgat ccaatctttt taaaaacaga agggaatata    540
aagcttggag atgctcgtgg gaaaattgta ttactaaaaa gatatagtgg tagtaatgaa    600
tctgggggat ataataattt ctattggcca gacaatgaga cgtttacctc aactataaat    660
caaaatgtaa atgtaacagt acaagataaa tataaagtga gttatgatga gaaaataaac    720
gctattaaag atacattaaa tgaaacgatt aacaatagtg aagatgttaa tcatctatat    780
attaatttta caagcttgtc ttctggtggt acagcatgga atagtccata ttattatgcg    840
tcctacataa atcctgaaat tgcaaattat atgaagcaaa agaatcctac gagagtgggc    900
tggataatac aagattatat aaatgaaaaa tggtcaccat tactttatca agaagttata    960
agagcgaata agtcacttgt aaaatag                                        987
<210>120
<211>328
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号
<222>(1)...(23)
<220>
<221>结构域
<222>(56)...(195)
<223>磷脂酰肌醇特异性磷脂酶C,X结构域
<400>120
Met Asn Asn Lys Lys Phe Ile Leu Lys Leu Phe Ile Cys Ser Met Val
 1               5                  10                  15
Leu Ser Ala Phe Val Phe Ala Phe Asn Asp Lys Lys Thr Val Ala Ala
            20                  25                  30
Ser Ser Ile Asn Val Leu Glu Asn Trp Ser Arg Trp Met Lys Pro Ile
        35                  40                  45
Asn Asp Asp Ile Pro Leu Ala Arg Ile Ser Ile Pro Gly Thr His Asp
    50                  55                  60
Ser Gly Thr Phe Lys Leu Gln Asn Pro Ile Lys Gln Val Trp Gly Met
65                  70                  75                  80
Thr Gln Glu Tyr Asp Phe Arg Tyr Gln Met Asp His Gly Ala Arg Ile
                85                  90                  95
Phe Asp Ile Arg Gly Arg Leu Thr Asp Asp Asn Thr Ile Val Leu His
            100                 105                 110
His Gly Pro Leu Tyr Leu Tyr Val Thr Leu His Glu Phe Ile Asn Glu
        115                 120                 125
Ala Lys Gln Phe Leu Lys Asp Asn Pro Ser Glu Thr Ile Ile Met Ser
    130                 135                 140
Leu Lys Lys Glu Tyr Glu Asp Met Lys Gly Ala Glu Ser Ser Phe Ser
145                 150                 155                 160
Ser Thr Phe Glu Lys Asn Tyr Phe Arg Asp Pro Ile Phe Leu Lys Thr
                165                 170                 175
Glu Gly Asn Ile Lys Leu Gly Asp Ala Arg Gly Lys Ile Val Leu Leu
            180                 185                 190
Lys Arg Tyr Ser Gly Ser Asn Glu Ser Gly Gly Tyr Asn Asn Phe Tyr
        195                 200                 205
Trp Pro Asp Asn Glu Thr Phe Thr Ser Thr Ile Asn Gln Asn Val Asn
    210                 215                 220
Val Thr Val Gln Asp Lys Tyr Lys Val Ser Tyr Asp Glu Lys Ile Asn
225                 230                 235                 240
Ala Ile Lys Asp Thr Leu Asn Glu Thr Ile Asn Asn Ser Glu Asp Val
                245                 250                 255
Asn His Leu Tyr Ile Asn Phe Thr Ser Leu Ser Ser Gly Gly Thr Ala
            260                 265                 270
Trp Asn Ser Pro Tyr Tyr Tyr Ala Ser Tyr Ile Asn Pro Glu Ile Ala
        275                 280                 285
Asn Tyr Met Lys Gln Lys Asn Pro Thr Arg Val Gly Trp Ile Ile Gln
    290                 295                 300
Asp Tyr Ile Asn Glu Lys Trp Ser Pro Leu Leu Tyr Gln Glu Val Ile
305                 310                 315                 320
Arg Ala Asn Lys Ser Leu Val Lys
                325
<210>121
<211>990
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>121
atgcgtaata agaagtttat tttgaaatta ttaatatgta gtacggtact tagcaccttt     60
gtatttgctt tcaatgataa gcaaactgtt gcagctagct ctattaatga actcgaaaat    120
tggtctagat ggatgcagcc tatacctgat gacatgccgt tagcaagaat ttcaattcca    180
ggaacacatg atagtggaac gttcaaactg caaaatccga taaagcaagt atggggaatg    240
acgcaagaat atgattttcg ttaccaaatg gatcatgggg ctagaatttt tgatataaga    300
gggcgtttaa cagatgataa tacgatagtc cttcatcatg ggccattata tctttatgta    360
acactgaacg aatttataaa tgaagcgaaa caatttttaa aagataaccc aagtgaaacg    420
attattatgt ctttaaagaa agagtatgag gatatgaaag gggcagaaaa ttcatttagt    480
agtacgtttg aaaaaaaata ttttcttgat cctatctttt taaaaacaga agggaatata    540
aaacttggag atgctcgtgg gaaaattgta ctactaaaaa gatatagtgg tagtaatgaa    600
tctggaggat ataataattt ttattggcca gataacgaga cgtttacgac aactgtaaat    660
caaaatgtaa atgtaacagt acaagataaa tataaagtga gttatgatga gaaagtaaaa    720
tctattaaag atacgataaa tgaaacgatt aacaatagtg aagattttaa tcatctatat    780
attaatttta caagcttgtc ttctggtggt acagcatgga atagtccata ttattatgca    840
tcctacataa atcctgaaat tgcaaaccat atgaagcaaa agaatcctac gagagtgggc    900
tgggtaattc aagattatat aaatgaaaaa tggtcaccaa tactttatca agaagttata    960
agagcgaata agtcacttat aaaagagtag                                     990
<210>122
<211>329
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号
<222>(1)...(23)
<220>
<221>结构域
<222>(56)...(195)
<223>磷脂酰肌醇特异性磷脂酶C,X结构域
<400>122
Met Arg Asn Lys Lys Phe Ile Leu Lys Leu Leu Ile Cys Ser Thr Val
 1               5                  10                  15
Leu Ser Thr Phe Val Phe Ala Phe Asn Asp Lys Gln Thr Val Ala Ala
            20                  25                  30
Ser Ser Ile Asn Glu Leu Glu Asn Trp Ser Arg Trp Met Gln Pro Ile
        35                  40                  45
Pro Asp Asp Met Pro Leu Ala Arg Ile Ser Ile Pro Gly Thr His Asp
    50                  55                  60
Ser Gly Thr Phe Lys Leu Gln Asn Pro Ile Lys Gln Val Trp Gly Met
65                  70                  75                  80
Thr Gln Glu Tyr Asp Phe Arg Tyr Gln Met Asp His Gly Ala Arg Ile
                85                  90                  95
Phe Asp Ile Arg Gly Arg Leu Thr Asp Asp Asn Thr Ile Val Leu His
            100                 105                 110
His Gly Pro Leu Tyr Leu Tyr Val Thr Leu Asn Glu Phe Ile Asn Glu
        115                 120                 125
Ala Lys Gln Phe Leu Lys Asp Asn Pro Ser Glu Thr Ile Ile Met Ser
    130                 135                 140
Leu Lys Lys Glu Tyr Glu Asp Met Lys Gly Ala Glu Asn Ser Phe Ser
145                 150                 155                 160
Ser Thr Phe Glu Lys Lys Tyr Phe Leu Asp Pro Ile Phe Leu Lys Thr
                165                 170                 175
Glu Gly Asn Ile Lys Leu Gly Asp Ala Arg Gly Lys Ile Val Leu Leu
            180                 185                 190
Lys Arg Tyr Ser Gly Ser Asn Glu Ser Gly Gly Tyr Asn Asn Phe Tyr
        195                 200                 205
Trp Pro Asp Asn Glu Thr Phe Thr Thr Thr Val Asn Gln Asn Val Asn
    210                 215                 220
Val Thr Val Gln Asp Lys Tyr Lys Val Ser Tyr Asp Glu Lys Val Lys
225                 230                 235                 240
Ser Ile Lys Asp Thr Ile Asn Glu Thr Ile Asn Asn Ser Glu Asp Phe
                245                 250                 255
Asn His Leu Tyr Ile Asn Phe Thr Ser Leu Ser Ser Gly Gly Thr Ala
            260                 265                 270
Trp Asn Ser Pro Tyr Tyr Tyr Ala Ser Tyr Ile Asn Pro Glu Ile Ala
        275                 280                 285
Asn His Met Lys Gln Lys Asn Pro Thr Arg Val Gly Trp Val Ile Gln
    290                 295                 300
Asp Tyr Ile Asn Glu Lys Trp Ser Pro Ile Leu Tyr Gln Glu Val Ile
305                 310                 315                 320
Arg Ala Asn Lys Ser Leu Ile Lys Glu
                325
<210>123
<211>849
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>123
atgaaaaaga aagtattagc actagcagct atggttgctt tagctgcacc agttcaaagt     60
gtagtgtttg cgcaaacaaa taatagtgaa agtcctgcac cgatcttaag atggtcagct    120
gaggacaagc ataatgaggg agttagtact catttgtgga ttgtaaatcg tgcaattgac    180
atcatgtctc gtaatacagc gattgtgaag ccaaatgaaa ctgctttatt aaatgagtgg    240
cgtactgatt tagaaaatgg tatttattct gctgattacg agaatcctta ttatgataat    300
agtacatatg cttctcattt ttacgatccg gatactggaa aaacatatat tccttttgcg    360
aaacaggcaa aagaaacagg tacaaaatat tttaaacttg ctggtgaagc atacaaaaat    420
caagatatga aacaggcatt cttctattta ggattatcac ttcattattt aggagatgta    480
aatcagccaa tgcatgcagc aaactttacg aatctttctt atccaatggg tttccattct    540
aaatatgaaa attttgttga tacaataaaa aataactata tagtttcaga tagtagtgga    600
tattggaatt ggaaaggggc aaacccagaa gattggattc aaggagcagc agtagcggct    660
aaacaagatt atcctggtat tgtgaacgat acgacaaaag attggtttgt aaaagcagct    720
gtatctcaag catatgcaga taaatggcgt gcagaagtaa caccggtgac aggaaaacgc    780
ttaatggagg cacagcgcgt tacagctggt tatattcatt tatggtttga tacgtatgta    840
aatcactaa                                                            849
<210>124
<211>282
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号
<222>(1)...(24)
<220>
<221>结构域
<222>(1)...(281)
<223>锌依赖型磷脂酶C
<400>124
Met Lys Lys Lys Val Leu Ala Leu Ala Ala Met Val Ala Leu Ala Ala
 1               5                  10                  15
Pro Val Gln Ser Val Val Phe Ala Gln Thr Asn Asn Ser Glu Ser Pro
            20                  25                  30
Ala Pro Ile Leu Arg Trp Ser Ala Glu Asp Lys His Asn Glu Gly Val
        35                  40                  45
Ser Thr His Leu Trp Ile Val Asn Arg Ala Ile Asp Ile Met Ser Arg
    50                  55                  60
Asn Thr Ala Ile Val Lys Pro Asn Glu Thr Ala Leu Leu Asn Glu Trp
65                  70                  75                  80
Arg Thr Asp Leu Glu Asn Gly Ile Tyr Ser Ala Asp Tyr Glu Asn Pro
                85                  90                  95
Tyr Tyr Asp Asn Ser Thr Tyr Ala Ser His Phe Tyr Asp Pro Asp Thr
            100                 105                 110
Gly Lys Thr Tyr Ile Pro Phe Ala Lys Gln Ala Lys Glu Thr Gly Thr
        115                 120                 125
Lys Tyr Phe Lys Leu Ala Gly Glu Ala Tyr Lys Asn Gln Asp Met Lys
    130                 135                 140
Gln Ala Phe Phe Tyr Leu Gly Leu Ser Leu His Tyr Leu Gly Asp Val
145                 150                 155                 160
Asn Gln Pro Met His Ala Ala Asn Phe Thr Asn Leu Ser Tyr Pro Met
                165                 170                 175
Gly Phe His Ser Lys Tyr Glu Asn Phe Val Asp Thr Ile Lys Asn Asn
            180                 185                 190
Tyr Ile Val Ser Asp Ser Ser Gly Tyr Trp Asn Trp Lys Gly Ala Asn
        195                 200                 205
Pro Glu Asp Trp Ile Gln Gly Ala Ala Val Ala Ala Lys Gln Asp Tyr
    210                 215                 220
Pro Gly Ile Val Asn Asp Thr Thr Lys Asp Trp Phe Val Lys Ala Ala
225                 230                 235                 240
Val Ser Gln Ala Tyr Ala Asp Lys Trp Arg Ala Glu Val Thr Pro Val
                245                 250                 255
Thr Gly Lys Arg Leu Met Glu Ala Gln Arg Val Thr Ala Gly Tyr Ile
            260                 265                 270
His Leu Trp Phe Asp Thr Tyr Val Asn His
        275                 280
<210>125
<211>1710
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>125
atggctgaca acgagttgcc cctggcgcgg cccagggaga cgccgccgtg ccgccccggc     60
acgttcgagc ttgggctcgc cctggctggc gcggtctctg gcggcgccta cgccgcggga    120
gtcctggatt tcttctacga agccctcgag cattggtacg aggccaggga ggcgggagcg    180
ccggtgccca accacgacgt gctcctccgg atcatctcgg gtgcgtcggc gggcagtatc    240
aatggcgtgc tttcgggcat cgcgctgccg taccgttttc cccacgtgca cagcgggccc    300
gcgcccgagg gtgccacggg caaccccttc tacgacgcct gggtgaagcg catcgacgtg    360
cgcgaactgt tgggcaacga agacctggcc gatcccacgc agccggtggc atccctgctc    420
gacgccacct gcctggatac gatcgcgaag gacatgctcg gcttctcggc ggcgccggcc    480
acccggccgt acgtcgctaa tccgctgaaa tgcgtgttca cggtgaccaa cctgcgtggc    540
gttccttacg tcgtgcagtt caagggaaac ccggagatcc ccggccacgg catgatggcc    600
cacgccgact ggctgcgctt cgccgtcgac accgggcagg gcgaccggga tggggaatgg    660
atgttccccg atgaacggct cgtcagcggg ccgagccatg cgcggactcc ggcctggcaa    720
ggtttcatgg aggcggcgct cgcttcgtcg gcgttcccgg ccggcttgcg tttccgcgaa    780
gtcgcccggc cctggagcga ttacgaccag cgcgtcgtgg tggtgcccaa ccaggcgggg    840
gccgcggtcc cggtcccgct cccgccggcc tgggcggagg gcgagggcag cgatggggac    900
taccggttcg tcgcggtgga tggtggcgcg atggacaacg agccgttcga acttgcccgt    960
accgagctgg cgggcacgct cggccgcaat ccacgcgaag ggaaccgggt caaccgcatc   1020
gtgatcatgc tcgatccgtt tcccgaggcc gaggcgccgg gacccgcgga agccgcgagc   1080
acgaatctcg tcgaggcgat ggcctcgctg tttggtgcgt ggaaacagca ggcacggttc   1140
aagccggagg aagtggcgct cgccctggat tcgaccgtgt acagccgctt catgatcgcg   1200
cccagccggc cgtgcatgga gggcgggcca cggtggatcg gtgggcgagc gctcgccgcg   1260
ggtgcgctgg gtggcttctc ggggttcctg gcggaggcat acaggcacca cgatttcctc   1320
ctgggacgcc gcaactgcca acgcttcctc gccgagcgcc tgttgatccc cgcggacaat   1380
ccgatcttcg ccggctggat cgacgatccc tccctgcagg gctacatccg cgagatcgat   1440
ggcgtgcgtt acgccccggt catcccgctg gtgggcggct gccagggctt gcgcgagccg   1500
ttgcccacgt ggccgcgtgg tgcattcgac ctggactcgc tcatgccgct ggtcgagcgc   1560
cgcatgcagc gcctgtattc ggcggctacc gcgacgctcg gtggccgctt cgccacctgg   1620
ctggcgtggc gcttctacct gcgccgcaag ctcctcgacc tggtctcaag ccgtatccgt   1680
agcgcattga gggacttcgg cctttggtga                                    1710
<210>126
<211>569
<212>PRT
<213>未知
<220>
<223>获自环境样品
<400>126
Met Ala Asp Asn Glu Leu Pro Leu Ala Arg Pro Arg Glu Thr Pro Pro
 1               5                  10                  15
Cys Arg Pro Gly Thr Phe Glu Leu Gly Leu Ala Leu Ala Gly Ala Val
            20                  25                  30
Ser Gly Gly Ala Tyr Ala Ala Gly Val Leu Asp Phe Phe Tyr Glu Ala
        35                  40                  45
Leu Glu His Trp Tyr Glu Ala Arg Glu Ala Gly Ala Pro Val Pro Asn
    50                  55                  60
His Asp Val Leu Leu Arg Ile Ile Ser Gly Ala Ser Ala Gly Ser Ile
65                  70                  75                  80
Asn Gly Val Leu Ser Gly Ile Ala Leu Pro Tyr Arg Phe Pro His Val
                85                  90                  95
His Ser Gly Pro Ala Pro Glu Gly Ala Thr Gly Asn Pro Phe Tyr Asp
            100                 105                 110
Ala Trp Val Lys Arg Ile Asp Val Arg Glu Leu Leu Gly Asn Glu Asp
        115                 120                 125
Leu Ala Asp Pro Thr Gln Pro Val Ala Ser Leu Leu Asp Ala Thr Cys
    130                 135                 140
Leu Asp Thr Ile Ala Lys Asp Met Leu Gly Phe Ser Ala Ala Pro Ala
145                 150                 155                 160
Thr Arg Pro Tyr Val Ala Asn Pro Leu Lys Cys Val Phe Thr Val Thr
                165                 170                 175
Asn Leu Arg Gly Val Pro Tyr Val Val Gln Phe Lys Gly Asn Pro Glu
            180                 185                 190
Ile Pro Gly His Gly Met Met Ala His Ala Asp Trp Leu Arg Phe Ala
        195                 200                 205
Val Asp Thr Gly Gln Gly Asp Arg Asp Gly Glu Trp Met Phe Pro Asp
    210                 215                 220
Glu Arg Leu Val Ser Gly Pro Ser His Ala Arg Thr Pro Ala Trp Gln
225                 230                 235                 240
Gly Phe Met Glu Ala Ala Leu Ala Ser Ser Ala Phe Pro Ala Gly Leu
                245                 250                 255
Arg Phe Arg Glu Val Ala Arg Pro Trp Ser Asp Tyr Asp Gln Arg Val
            260                 265                 270
Val Val Val Pro Asn Gln Ala Gly Ala Ala Val Pro Val Pro Leu Pro
        275                 280                 285
Pro Ala Trp Ala Glu Gly Glu Gly Ser Asp Gly Asp Tyr Arg Phe Val
    290                 295                 300
Ala Val Asp Gly Gly Ala Met Asp Asn Glu Pro Phe Glu Leu Ala Arg
305                 310                 315                 320
Thr Glu Leu Ala Gly Thr Leu Gly Arg Asn Pro Arg Glu Gly Asn Arg
                325                 330                 335
Val Asn Arg Ile Val Ile Met Leu Asp Pro Phe Pro Glu Ala Glu Ala
            340                 345                 350
Pro Gly Pro Ala Glu Ala Ala Ser Thr Asn Leu Val Glu Ala Met Ala
        355                 360                 365
Ser Leu Phe Gly Ala Trp Lys Gln Gln Ala Arg Phe Lys Pro Glu Glu
    370                 375                 380
Val Ala Leu Ala Leu Asp Ser Thr Val Tyr Ser Arg Phe Met Ile Ala
385                 390                 395                 400
Pro Ser Arg Pro Cys Met Glu Gly Gly Pro Arg Trp Ile Gly Gly Arg
                405                 410                 415
Ala Leu Ala Ala Gly Ala Leu Gly Gly Phe Ser Gly Phe Leu Ala Glu
            420                 425                 430
Ala Tyr Arg His His Asp Phe Leu Leu Gly Arg Arg Asn Cys Gln Arg
        435                 440                 445
Phe Leu Ala Glu Arg Leu Leu Ile Pro Ala Asp Asn Pro Ile Phe Ala
    450                 455                 460
Gly Trp Ile Asp Asp Pro Ser Leu Gln Gly Tyr Ile Arg Glu Ile Asp
465                 470                 475                 480
Gly Val Arg Tyr Ala Pro Val Ile Pro Leu Val Gly Gly Cys Gln Gly
                485                 490                 495
Leu Arg Glu Pro Leu Pro Thr Trp Pro Arg Gly Ala Phe Asp Leu Asp
            500                 505                 510
Ser Leu Met Pro Leu Val Glu Arg Arg Met Gln Arg Leu Tyr Ser Ala
        515                 520                 525
Ala Thr Ala Thr Leu Gly Gly Arg Phe Ala Thr Trp Leu Ala Trp Arg
    530                 535                 540
Phe Tyr Leu Arg Arg Lys Leu Leu Asp Leu Val Ser Ser Arg Ile Arg
545                 550                 555                 560
Ser Ala Leu Arg Asp Phe Gly Leu Trp
                565
<210>127
<211>1038
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>127
atgacaaccc aatttagaaa cttgatcttt gaaggtggtg gtgtaaaagg agttgcttac      60
attggcgcca tgcagattct tgaaaatcgt ggcgtgttgc aagatattca ccgagtcgga     120
ggttgcagtg ccggtgcgat taacgcgctg atttttgcgc tgggttacac ggttcgtgag     180
caaaaagaga tcttacaagc caccgatttt aaccagttta tggataactc ttggggggtt     240
attcgtgata ttcgcaggct tgctcgagac tttggctgga ataagggtgg cttctttaat     300
agctggatag gtgatttgat tcatcgtcgt ttggggaatc gccgagcgac gttcaaggat     360
ctgcaaaagg ccaagcttcc tgatctttat gtcatcggta ctaatctgtc tacagggttt     420
gcagaggttt tttctgccga aagacacccc gatatggagc tagcgacagc ggtgcgcatc     480
tccatgtcga taccgctgtt ctttgcggcc gtgcgccacg gtgatcgaca agatgtgtat     540
gtcgatggag gtgttcaact taactatccg attaaactgt ttgatcggga gcgttatatt     600
gatctggcca aagatcccgg tgccgttcgg cgaacgggtt attacaataa agaaaacgct     660
cgctttcagc ttgaacggcc gggccatagc ccctatgttt acaatcgcca gaccttgggt     720
ttgcgactgg atagtcgaga ggagataggg ctttttcgtt atgacgaacc cctcaagggc     780
aaaccgatta agtccttcac tgactacgct cgacaacttt tcggtgcgtt gatgaatgcg     840
caggaaaaca ttcatctaca tggcgatgat tggcagcgca cggtctatat cgacacactg     900
gatgtgagta cgacggactt caatctttct gatgcaacca agcaagcact gattgagcaa     960
ggaattaacg gcaccgaaaa ttatttcgag tggtttgata atccgttaga gaagcctgtg    1020
aatagagtgg agtcatag                                                  1038
<210>128
<211>345
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>结构域
<222>(8)...(195)
<223>Patatin-样磷脂酶
<400>128
Met Thr Thr Gln Phe Arg Asn Leu Ile Phe Glu Gly Gly Gly Val Lys
 1               5                  10                  15
Gly Val Ala Tyr Ile Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val
            20                  25                  30
Leu Gln Asp Ile His Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn
        35                  40                  45
Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile
    50                  55                  60
Leu Gln Ala Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val
65                  70                  75                  80
Ile Arg Asp Ile Arg Arg Leu Ala Arg Asp Phe Gly Trp Asn Lys Gly
                85                  90                  95
Gly Phe Phe Asn Ser Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly
            100                 105                 110
Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Lys Ala Lys Leu Pro Asp
        115                 120                 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ala Glu Val Phe
    130                 135                 140
Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile
145                 150                 155                 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Asp Arg
                165                 170                 175
Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys
            180                 185                 190
Leu Phe Asp Arg Glu Arg Tyr Ile Asp Leu Ala Lys Asp Pro Gly Ala
        195                 200                 205
Val Arg Arg Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu
    210                 215                 220
Glu Arg Pro Gly His Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225                 230                 235                 240
Leu Arg Leu Asp Ser Arg Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu
                245                 250                 255
Pro Leu Lys Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln
            260                 265                 270
Leu Phe Gly Ala Leu Met Asn Ala Gln Glu Asn Ile His Leu His Gly
        275                 280                 285
Asp Asp Trp Gln Arg Thr Val Tyr Ile Asp Thr Leu Asp Val Ser Thr
    290                 295                 300
Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln
305                 310                 315                 320
Gly Ile Asn Gly Thr Glu Asn Tyr Phe Glu Trp Phe Asp Asn Pro Leu
                325                 330                 335
Glu Lys Pro Val Asn Arg Val Glu Ser
            340                 345
<210>129
<211>1434
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>129
atgaaaaaga aaatatgtac attggctctt gtatcagcaa taacttctgg agttgtgacg     60
attccaacgg tagcatctgc ttgcagaata ggcgaagaag taatgaaaca ggagaaacag    120
gataatcaag agcacaaacg tgtgaaaaga tggtctgcgg agcatccgca tcattctaat    180
gaaagcacgc acttatggat tgctcgaaat gcgattcaaa ttatgagtcg taatcaagat    240
aacacggtcc aaaacaatga attacagttc ttaaatattc ctgaatataa ggagttattt    300
gaaagaggac tttatgatgc tgattacctt gatgaattta acgatggcgg tacaggtaca    360
atcggcattg atgggctaat taaaggaggg tggaaatctc atttttatga tccagatacg    420
aaaaagaatt ataaaggaga agaagctcca acagccctta cgcaaggaga taaatatttt    480
aaattagcag gagactattt taagaaagag gatttgaaac aagctttcta ctatttaggt    540
gttgcgactc actatttcac agatgctact cagccaatgc atgctgctaa ttttacagct    600
gtcgacatga gtgcgataaa gtttcatagc gcttttgaaa attatgtaac gacaattcag    660
acgccatttg aagtgaagga tgataaagga acctataatt tggttgattc taatgatccg    720
aagcagtgga tacatgaaac agcgaaactc gcaaaagcgg aaattatgaa tattactaat    780
gatactatta aatctcaata taataaaggg aacaatgatc tttggcaaca aggagttatg    840
ccagctgttc agagaagtct ggaaacagca caaaggaaca cggcaggatt tattcattta    900
tggtttaaaa catatgttgg caaaactgct gctgaagata ttgaaaatac acaagtaaaa    960
gattctaacg gagaagcaat acaagaaaat aaaaaatact acgttgtacc gagtgagttt   1020
ttaaatagag gtttgacctt tgaggtatat gctgcaaatg actacgcact attagctaat   1080
cacgtagatg ataataaagt tcatggtaca cctgttcagt ttgtttttga taaagacaat   1140
aacggaattc ttcatcgggg agaaagtgca ctgatgaaaa tgacgcaatc taactatgct   1200
gattatgtat ttctcaatta ctctaatatg acaaattggg tacatcttgc gaaacgaaaa   1260
acaaatactt cacagtttaa agtgtatcca aatccggata actcatctga atatttctta   1320
tatacagatg gatacccggt aaattatcaa gaaaatggta acggaaagag ctggattgtg   1380
ttaggaaaga aaacggataa accaaaagcg tggaaattta tacaggcgga ataa         1434
<210>130
<211>477
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号
<222>(1)...(27)
<220>
<221>结构域
<222>(1)...(307)
<223>锌依赖型磷脂酶C
<400>130
Met Lys Lys Lys Ile Cys Thr Leu Ala Leu Val Ser Ala Ile Thr Ser
 1               5                  10                  15
Gly Val Val Thr Ile Pro Thr Val Ala Ser Ala Cys Arg Ile Gly Glu
            20                  25                  30
Glu Val Met Lys Gln Glu Lys Gln Asp Asn Gln Glu His Lys Arg Val
        35                  40                  45
Lys Arg Trp Ser Ala Glu His Pro His His Ser Asn Glu Ser Thr His
    50                  55                  60
Leu Trp Ile Ala Arg Asn Ala Ile Gln Ile Met Ser Arg Asn Gln Asp
65                  70                  75                  80
Asn Thr Val Gln Asn Asn Glu Leu Gln Phe Leu Asn Ile Pro Glu Tyr
                85                  90                  95
Lys Glu Leu Phe Glu Arg Gly Leu Tyr Asp Ala Asp Tyr Leu Asp Glu
            100                 105                 110
Phe Asn Asp Gly Gly Thr Gly Thr Ile Gly Ile Asp Gly Leu Ile Lys
        115                 120                 125
Gly Gly Trp Lys Ser His Phe Tyr Asp Pro Asp Thr Lys Lys Asn Tyr
    130                 135                 140
Lys Gly Glu Glu Ala Pro Thr Ala Leu Thr Gln Gly Asp Lys Tyr Phe
145                 150                 155                 160
Lys Leu Ala Gly Asp Tyr Phe Lys Lys Glu Asp Leu Lys Gln Ala Phe
                165                 170                 175
Tyr Tyr Leu Gly Val Ala Thr His Tyr Phe Thr Asp Ala Thr Gln Pro
            180                 185                 190
Met His Ala Ala Asn Phe Thr Ala Val Asp Met Ser Ala Ile Lys Phe
        195                 200                 205
His Ser Ala Phe Glu Asn Tyr Val Thr Thr Ile Gln Thr Pro Phe Glu
    210                 215                 220
Val Lys Asp Asp Lys Gly Thr Tyr Asn Leu Val Asp Ser Asn Asp Pro
225                 230                 235                 240
Lys Gln Trp Ile His Glu Thr Ala Lys Leu Ala Lys Ala Glu Ile Met
                245                 250                 255
Asn Ile Thr Asn Asp Thr Ile Lys Ser Gln Tyr Asn Lys Gly Asn Asn
            260                 265                 270
Asp Leu Trp Gln Gln Gly Val Met Pro Ala Val Gln Arg Ser Leu Glu
        275                 280                 285
Thr Ala Gln Arg Asn Thr Ala Gly Phe Ile His Leu Trp Phe Lys Thr
    290                 295                 300
Tyr Val Gly Lys Thr Ala Ala Glu Asp Ile Glu Asn Thr Gln Val Lys
305                 310                 315                 320
Asp Ser Asn Gly Glu Ala Ile Gln Glu Asn Lys Lys Tyr Tyr Val Val
                325                 330                 335
Pro Ser Glu Phe Leu Asn Arg Gly Leu Thr Phe Glu Val Tyr Ala Ala
            340                 345                 350
Asn Asp Tyr Ala Leu Leu Ala Asn His Val Asp Asp Asn Lys Val His
        355                 360                 365
Gly Thr Pro Val Gln Phe Val Phe Asp Lys Asp Asn Asn Gly Ile Leu
    370                 375                 380
His Arg Gly Glu Ser Ala Leu Met Lys Met Thr Gln Ser Asn Tyr Ala
385                 390                 395                 400
Asp Tyr Val Phe Leu Asn Tyr Ser Asn Met Thr Asn Trp Val His Leu
                405                 410                 415
Ala Lys Arg Lys Thr Asn Thr Ser Gln Phe Lys Val Tyr Pro Asn Pro
            420                 425                 430
Asp Asn Ser Ser Glu Tyr Phe Leu Tyr Thr Asp Gly Tyr Pro Val Asn
        435                 440                 445
Tyr Gln Glu Asn Gly Asn Gly Lys Ser Trp Ile Val Leu Gly Lys Lys
    450                 455                 460
Thr Asp Lys Pro Lys Ala Trp Lys Phe Ile Gln Ala Glu
465                 470                 475
<210>131
<211>927
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>131
atgccgagcc caaaaagtaa tattgatgtt atcagcatcg atggtggtgg aatacgtgga     60
gtattctccg ttacattatt ggatagatta tgtaagacct atcccaatct tcttaagaaa    120
acatatctgt ttgctggaac atctacaggt gggatcattg ccttaggatt agcaaacaac    180
atgacacctc ttgagataag agccttgtac gagaagaacg gttcaaagat atttcataaa    240
tctgtgtggg aaggcgttaa agatttaggt ggaaccatag gtgcaaagta tagtaacaag    300
aatcttaaat ccgttttgaa aaaatacttt ggttcattga agttaaaaga tttatctaaa    360
aaagtactaa tacctacttt tgatttacac tcagacaaag aagaaggcta tccaatgtgg    420
aagcctaagt tctatcacaa ctttgatgga gaaacggaag atatagaaaa gctcgttctt    480
gatgtagcta tgatgacatc agcagcgccc actttcttcc ctacatacaa cgggcatatt    540
gatggcggtg ttgtagccaa caatccatcg atggccgcat tagcccagat tatggatgaa    600
agatatggca tcaatgcctc tgaagttcat attcttaata taggaacagg ttttaaccct    660
gcttatgtta agatgaatcc aggggaagag aaagactggg gtgaacttca gtggataaaa    720
cctttaatca atcttctagt cgatggctct atggatgttt ctacttatta ttgtaagcaa    780
gtcttacgtg ataattttta tagggttaac atgaaattac ctaagaacgt agaaatggat    840
gatcctaatt ctattcctta tttaattgaa cttgcaaact cagttgatct aactgaatgt    900
atcaactggc ttaattcgag gtggtaa                                        927
<210>132
<211>308
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>结构域
<222>(11)...(194)
<223>Patatin-样磷脂酶
<400>132
Met Pro Ser Pro Lys Ser Asn Ile Asp Val Ile Ser Ile Asp Gly Gly
 1               5                  10                  15
Gly Ile Arg Gly Val Phe Ser Val Thr Leu Leu Asp Arg Leu Cys Lys
            20                  25                  30
Thr Tyr Pro Asn Leu Leu Lys Lys Thr Tyr Leu Phe Ala Gly Thr Ser
        35                  40                  45
Thr Gly Gly Ile Ile Ala Leu Gly Leu Ala Asn Asn Met Thr Pro Leu
    50                  55                  60
Glu Ile Arg Ala Leu Tyr Glu Lys Asn Gly Ser Lys Ile Phe His Lys
65                  70                  75                  80
Ser Val Trp Glu Gly Val Lys Asp Leu Gly Gly Thr Ile Gly Ala Lys
                85                  90                  95
Tyr Ser Asn Lys Asn Leu Lys Ser Val Leu Lys Lys Tyr Phe Gly Ser
            100                 105                 110
Leu Lys Leu Lys Asp Leu Ser Lys Lys Val Leu Ile Pro Thr Phe Asp
        115                 120                 125
Leu His Ser Asp Lys Glu Glu Gly Tyr Pro Met Trp Lys Pro Lys Phe
    130                 135                 140
Tyr His Asn Phe Asp Gly Glu Thr Glu Asp Ile Glu Lys Leu Val Leu
145                 150                 155                 160
Asp Val Ala Met Met Thr Ser Ala Ala Pro Thr Phe Phe Pro Thr Tyr
                165                 170                 175
Asn Gly His Ile Asp Gly Gly Val Val Ala Asn Asn Pro Ser Met Ala
            180                 185                 190
Ala Leu Ala Gln Ile Met Asp Glu Arg Tyr Gly Ile Asn Ala Ser Glu
        195                 200                 205
Val His Ile Leu Asn Ile Gly Thr Gly Phe Asn Pro Ala Tyr Val Lys
    210                 215                 220
Met Asn Pro Gly Glu Glu Lys Asp Trp Gly Glu Leu Gln Trp Ile Lys
225                 230                 235                 240
Pro Leu Ile Asn Leu Leu Val Asp Gly Ser Met Asp Val Ser Thr Tyr
                245                 250                 255
Tyr Cys Lys Gln Val Leu Arg Asp Asn Phe Tyr Arg Val Asn Met Lys
            260                 265                 270
Leu Pro Lys Asn Val Glu Met Asp Asp Pro Asn Ser Ile Pro Tyr Leu
        275                 280                 285
Ile Glu Leu Ala Asn Ser Val Asp Leu Thr Glu Cys Ile Asn Trp Leu
    290                 295                 300
Asn Ser Arg Trp
305
<210>133
<211>1053
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>133
atgactacac agtttcgcaa tctcgttttc gaaggaggcg gcgtcagggg tatagcctat     60
gtgggggcaa tgcaggttct tgagcaacgg ggaatgctca ggaacataga ccgtgcaggc    120
ggcacgagcg ccggtgcgat taacgcactc atcttttcac tcggctatga cataaggtct    180
cagctcgaaa tactccattc taccgacttt agaaatttta tggatagttc cttcgggata    240
atcagggata tccgccgtct tgcacgggat ttcggatggt acaagggtga tttcttcaca    300
ggctggattg gcaagcttat aaaagacagg ctcggtagcg agaaagcaac tttccgtgac    360
cttgcagaat cagattgtcc cgatctgtat gtgatcggca ccaacctctc aaccggcttc    420
gccgaggtat tctcagccga gagacatccc gatatgcctc ttgcaacggc tgtccgtatc    480
agcatgtcga tccctctatt ttttgctgca atgcgttatg gtccgaggga agacgtattt    540
gtagacggtg gggtagtact caactatcct gtaaagctgt ttgacaggtt gaaatacatt    600
gaaagcgggg agacggagga agccgcacgc tataccgaat attataacag ggagaacgca    660
cggttccttc tcaaaagtcc cgaccgcagt ccctatgttt ataaccgtca gacactgggt    720
ttgcgtctcg atacgcgtga ggagattgca catttccgtt atgacgagcc cctggagggt    780
aaaaaaatca tacgctttac ggattatgca cgggcactcg tttcaacctt gcttcaggtt    840
caggaaaacc agcatctgca cagtgacgac tggcagcgta cagtttacat tgacacactg    900
gatgtgaaga cgactgattt tgatatcacg gataagcaga aggacatcct gataaagcag    960
ggaattaacg gagcggagaa ctatttgggt tggtttgaag acccgtatga aaaacccgcc   1020
aaccgcctgc ccggtggcag caagtctgac tga                                1053
<210>134
<211>350
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>结构域
<222>(8)...(195)
<223>Patatin-样磷脂酶
<400>134
Met Thr Thr Gln Phe Arg Asn Leu Val Phe Glu Gly Gly Gly Val Arg
 1               5                  10                  15
Gly Ile Ala Tyr Val Gly Ala Met Gln Val Leu Glu Gln Arg Gly Met
            20                  25                  30
Leu Arg Asn Ile Asp Arg Ala Gly Gly Thr Ser Ala Gly Ala Ile Asn
        35                  40                  45
Ala Leu Ile Phe Ser Leu Gly Tyr Asp Ile Arg Ser Gln Leu Glu Ile
    50                  55                  60
Leu His Ser Thr Asp Phe Arg Asn Phe Met Asp Ser Ser Phe Gly Ile
65                  70                  75                  80
Ile Arg Asp Ile Arg Arg Leu Ala Arg Asp Phe Gly Trp Tyr Lys Gly
                85                  90                  95
Asp Phe Phe Thr Gly Trp Ile Gly Lys Leu Ile Lys Asp Arg Leu Gly
            100                 105                 110
Ser Glu Lys Ala Thr Phe Arg Asp Leu Ala Glu Ser Asp Cys Pro Asp
        115                 120                 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ala Glu Val Phe
    130                 135                 140
Ser Ala Glu Arg His Pro Asp Met Pro Leu Ala Thr Ala Val Arg Ile
145                 150                 155                 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Met Arg Tyr Gly Pro Arg
                165                 170                 175
Glu Asp Val Phe Val Asp Gly Gly Val Val Leu Asn Tyr Pro Val Lys
            180                 185                 190
Leu Phe Asp Arg Leu Lys Tyr Ile Glu Ser Gly Glu Thr Glu Glu Ala
        195                 200                 205
Ala Arg Tyr Thr Glu Tyr Tyr Asn Arg Glu Asn Ala Arg Phe Leu Leu
    210                 215                 220
Lys Ser Pro Asp Arg Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225                 230                 235                 240
Leu Arg Leu Asp Thr Arg Glu Glu Ile Ala His Phe Arg Tyr Asp Glu
                245                 250                 255
Pro Leu Glu Gly Lys Lys Ile Ile Arg Phe Thr Asp Tyr Ala Arg Ala
            260                 265                 270
Leu Val Ser Thr Leu Leu Gln Val Gln Glu Asn Gln His Leu His Ser
        275                 280                 285
Asp Asp Trp Gln Arg Thr Val Tyr Ile Asp Thr Leu Asp Val Lys Thr
    290                 295                 300
Thr Asp Phe Asp Ile Thr Asp Lys Gln Lys Asp Ile Leu Ile Lys Gln
305                 310                 315                 320
Gly Ile Asn Gly Ala Glu Asn Tyr Leu Gly Trp Phe Glu Asp Pro Tyr
                325                 330                 335
Glu Lys Pro Ala Asn Arg Leu Pro Gly Gly Ser Lys Ser Asp
            340                 345                 350
<210>135
<211>1710
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>135
atggctgaca acgagttacc cctggcccgc cccagggaaa cccctccgtg ccgtcccggc       60
acgttcgagc tggggctggc gctcgccggc gcggtatcgg gcggcgccta cgccgcgggc      120
gtgctggatt tcttctacga ggcgctggag cactggtacg acgcgaaggc gaacggtgcg    180
cccgtgccga gccacgacgt gctgctacgg atcatttcag gcgcctccgc gggcagcatc    240
aacggcgtgc tttccggcat cgcgttgccg taccgcttcc cgcacgtgca cagcggaccc    300
gcgccccggc aggcgacggg aaaccccttc tacgacgcgt gggtgaggcg catcgatgta    360
cgcgagctgc tgggcgaggc cgacctggct aacccggcgc ggccgatcac ctcgctgctt    420
gattccagca gcctggatac gatcgcgaag gacatgctcg gctacgccgg cgtgccggcc    480
gcgcgccctt acatcgcgaa cccgctgaaa tgcgtgttca ccgtgacgaa tcttcgcggc    540
gtgccctacg tggtgcagtt caagggcaac cccgagattc ccggccacgg catgatggcg    600
cacgccgatt ggctgcgctt cgccatcgac tcggggcagg gcgaacgcga tggcgcatgg    660
atgttccccg acgagcgcat cgtcagcggc ccgagccatg cgcgcagccc ggcctggcat    720
gcgctcatgg aggcggccct ggcgtcgtcc gcgttcccgg ccggcctgcg cttccgcgag    780
gtggcccggc cgtggagcga ttacgaccag cgcgtggttg tcgtgcccgg tcaggatggc    840
atggcggtgc cggtaccgct gccaccagcg tggggcgaag gggagggtgg gaagggcgac    900
taccgctttg tcgccgtgga tggtggcgcc atggataacg aaccgttcga gctggcccgc    960
acggagcttg cgggcacgat gggccgcaac ccgcgtgaag gtacccgggt gaatcgtatc   1020
gtgattatgc tcgatccgtt tccggaggcc gaggcgcccg gcccctcgga ggcggcgtcg   1080
acgaacctgg tggaagcgat ggcgtcgctg ttcggtgcat ggaagcagca ggcgcggttc   1140
aagcccgagg aagtggcgct ggccctcgat agcacggtgt acagccgctt catgatcgcg   1200
cctagccgcc cctgcacgga tggcggcccg cggtggatcg gcggccgcgc gctcaccgcg   1260
ggcgcactgg gtggcttctc ggggttcctg gccgaggatt accgccacca cgatttcctc   1320
ctgggccggc gtaactgcca gcggtttctc gccgagcggc tgctcgttcc cgcaacgaac   1380
ccgatcttcg ctggatggat cgacgatccc gcactgcagg gctacgtgcg tgagatcgat   1440
ggtgagcgct ttgcccccgt gattccccta gtgggcggct gccaggccct gcaagagccc   1500
ttgccggcgt ggccgcgtgg ggcgttcgac atggatgcgc tcatgcccct ggtcgagaag   1560
cgcatgcagg ccctgtacac ggcggccacc acgaagctgg gtggccgctt cgccatgtgg   1620
ctcgcgtggc gcttcttcat ccgccgcaaa ctcctcgaca tcgtctcaag ccgtatccgc   1680
aatgcgctga aagacttcgg cctttggtga                                    1710
<210>136
<211>569
<212>PRT
<213>未知
<220>
<223>获自环境样品
<400>136
Met Ala Asp Asn Glu Leu Pro Leu Ala Arg Pro Arg Glu Thr Pro Pro
 1               5                  10                  15
Cys Arg Pro Gly Thr Phe Glu Leu Gly Leu Ala Leu Ala Gly Ala Val
            20                  25                  30
Ser Gly Gly Ala Tyr Ala Ala Gly Val Leu Asp Phe Phe Tyr Glu Ala
        35                  40                  45
Leu Glu His Trp Tyr Asp Ala Lys Ala Asn Gly Ala Pro Val Pro Ser
    50                  55                  60
His Asp Val Leu Leu Arg Ile Ile Ser Gly Ala Ser Ala Gly Ser Ile
65                  70                  75                  80
Asn Gly Val Leu Ser Gly Ile Ala Leu Pro Tyr Arg Phe Pro His Val
                85                  90                  95
His Ser Gly Pro Ala Pro Arg Gln Ala Thr Gly Asn Pro Phe Tyr Asp
            100                 105                 110
Ala Trp Val Arg Arg Ile Asp Val Arg Glu Leu Leu Gly Glu Ala Asp
        115                 120                 125
Leu Ala Asn Pro Ala Arg Pro Ile Thr Ser Leu Leu Asp Ser Ser Ser
    130                 135                 140
Leu Asp Thr Ile Ala Lys Asp Met Leu Gly Tyr Ala Gly Val Pro Ala
145                 150                 155                 160
Ala Arg Pro Tyr Ile Ala Asn Pro Leu Lys Cys Val Phe Thr Val Thr
                165                 170                 175
Asn Leu Arg Gly Val Pro Tyr Val Val Gln Phe Lys Gly Asn Pro Glu
            180                 185                 190
Ile Pro Gly His Gly Met Met Ala His Ala Asp Trp Leu Arg Phe Ala
        195                 200                 205
Ile Asp Ser Gly Gln Gly Glu Arg Asp Gly Ala Trp Met Phe Pro Asp
    210                 215                 220
Glu Arg Ile Val Ser Gly Pro Ser His Ala Arg Ser Pro Ala Trp His
225                 230                 235                 240
Ala Leu Met Glu Ala Ala Leu Ala Ser Ser Ala Phe Pro Ala Gly Leu
                245                 250                 255
Arg Phe Arg Glu Val Ala Arg Pro Trp Ser Asp Tyr Asp Gln Arg Val
            260                 265                 270
Val Val Val Pro Gly Gln Asp Gly Met Ala Val Pro Val Pro Leu Pro
        275                 280                 285
Pro Ala Trp Gly Glu Gly Glu Gly Gly Lys Gly Asp Tyr Arg Phe Val
    290                 295                 300
Ala Val Asp Gly Gly Ala Met Asp Asn Glu Pro Phe Glu Leu Ala Arg
305                 310                 315                 320
Thr Glu Leu Ala Gly Thr Met Gly Arg Asn Pro Arg Glu Gly Thr Arg
                325                 330                 335
Val Asn Arg Ile Val Ile Met Leu Asp Pro Phe Pro Glu Ala Glu Ala
            340                 345                 350
Pro Gly Pro Ser Glu Ala Ala Ser Thr Asn Leu Val Glu Ala Met Ala
        355                 360                 365
Ser Leu Phe Gly Ala Trp Lys Gln Gln Ala Arg Phe Lys Pro Glu Glu
    370                 375                 380
Val Ala Leu Ala Leu Asp Ser Thr Val Tyr Ser Arg Phe Met Ile Ala
385                 390                 395                 400
Pro Ser Arg Pro Cys Thr Asp Gly Gly Pro Arg Trp Ile Gly Gly Arg
                405                 410                 415
Ala Leu Thr Ala Gly Ala Leu Gly Gly Phe Ser Gly Phe Leu Ala Glu
            420                 425                 430
Asp Tyr Arg His His Asp Phe Leu Leu Gly Arg Arg Asn Cys Gln Arg
        435                 440                 445
Phe Leu Ala Glu Arg Leu Leu Val Pro Ala Thr Asn Pro Ile Phe Ala
    450                 455                 460
Gly Trp Ile Asp Asp Pro Ala Leu Gln Gly Tyr Val Arg Glu Ile Asp
465                 470                 475                 480
Gly Glu Arg Phe Ala Pro Val Ile Pro Leu Val Gly Gly Cys Gln Ala
                485                 490                 495
Leu Gln Glu Pro Leu Pro Ala Trp Pro Arg Gly Ala Phe Asp Met Asp
            500                 505                 510
Ala Leu Met Pro Leu Val Glu Lys Arg Met Gln Ala Leu Tyr Thr Ala
        515                 520                 525
Ala Thr Thr Lys Leu Gly Gly Arg Phe Ala Met Trp Leu Ala Trp Arg
    530                 535                 540
Phe Phe Ile Arg Arg Lys Leu Leu Asp Ile Val Ser Ser Arg Ile Arg
545                 550                 555                 560
Asn Ala Leu Lys Asp Phe Gly Leu Trp
                565
<210>137
<211>1038
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>137
atgacaacac aatttagaaa cttgatattt gaaggcggcg gtgtaaaagg tgttgcttac     60
attggcgcca tgcagattct tgaaaatcgt ggcgtgttgc aagatattcg ccgagtcgga    120
gggtgcagtg cgggtgcgat taacgcgctg atttttgcgc taggttacac ggtccgtgaa    180
caaaaagaga tcttacaagc caccgatttt aaccagttta tggataactc ttggggggtt    240
attcgtgata ttcgcaggct tgctcgagac tttggctgga ataagggtga tttctttagt    300
agctggatag gtgatttgat tcatcgtcgt ttggggaatc gccgagcgac gttcaaagat    360
ctgcaaaagg ccaagcttcc tgatctttat gtcatcggta ctaatctgtc tacagggttt    420
gcagaggtgt tttctgccga aagacacccc gatatggagc tggcgacagc ggtgcgtatc    480
tccatgtcga taccgctgtt ctttgcggcc gtgcgtcacg gtgatcgaca agatgtgtat    540
gtcgatgggg gtgttcaact taactatccg attaaactgt ttgatcggga gcgttacatt    600
gatttggcca aagatcccgg tgccgttcgg cgaacgggtt attacaacaa agaaaacgct    660
cgctttcagc ttgatcggcc gggccatagc ccctatgttt acaatcgcca gaccttgggt    720
ttgcgactgg atagtcgcga ggagataggg ctctttcgtt atgacgaacc cctcaagggc    780
aaacccatta agtccttcac tgactacgct cgacaacttt tcggtgcgtt gatgaatgca    840
caggaaaaga ttcatctaca tggcgatgat tggcaacgca cgatctatat cgatacattg    900
gatgtgggta cgacggactt caatctttct gatgcaacta agcaagcact gattgagcaa    960
ggaattaacg gcaccgaaaa ttatttcgag tggtttgata atccgttaga gaagcctgtg   1020
aatagagtgg agtcatag                                                 1038
<210>138
<211>345
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>结构域
<222>(8)...(195)
<223>Patatin-样磷脂酶
<400>138
Met Thr Thr Gln Phe Arg Asn Leu Ile Phe Glu Gly Gly Gly Val Lys
 1               5                  10                  15
Gly Val Ala Tyr Ile Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val
            20                  25                  30
Leu Gln Asp Ile Arg Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn
        35                  40                  45
Ala Leu Ile Phe Ala Leu Gly Tyr Thr ValArg Glu Gln Lys Glu Ile
    50                  55                  60
Leu Gln Ala Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val
65                  70                  75                  80
Ile Arg Asp Ile Arg Arg Leu Ala Arg Asp Phe Gly Trp Asn Lys Gly
                85                  90                  95
Asp Phe Phe Ser Ser Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly
            100                 105                 110
Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Lys Ala Lys Leu Pro Asp
        115                 120                 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ala Glu Val Phe
    130                 135                 140
Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile
145                 150                 155                 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Asp Arg
                165                 170                 175
Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys
            180                 185                 190
Leu Phe Asp Arg Glu Arg Tyr Ile Asp Leu Ala Lys Asp Pro Gly Ala
        195                 200                 205
Val Arg Arg Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu
    210                 215                 220
Asp Arg Pro Gly His Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225                 230                 235                 240
Leu Arg Leu Asp Ser Arg Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu
                245                 250                 255
Pro Leu Lys Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln
            260                 265                 270
Leu Phe Gly Ala Leu Met Asn Ala Gln Glu Lys Ile His Leu His Gly
        275                 280                 285
Asp Asp Trp Gln Arg Thr Ile Tyr Ile Asp Thr Leu Asp Val Gly Thr
    290                 295                 300
Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln
305                 310                 315                 320
Gly Ile Asn Gly Thr Glu Asn Tyr Phe Glu Trp Phe Asp Asn Pro Leu
                325                 330                 335
Glu Lys Pro Val Asn Arg Val Glu Ser
            340                 345
<210>139
<211>1692
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>139
atgaaaataa agccgctcac gttttctttt ggattagcag tcactagctc ggtgcaagcc     60
ttcactcaat ttggcggaca aggcgttatg ccgatgggtc acgaatggtt aacgcgcacc    120
gctgctctcg aggtacttaa tgcagagcat atcatcgaag cggatccgaa tgacccaaga    180
tatacttggc aggacggact tgctaaaaac cttgaactta ataccgccca atctgaaatc    240
acgcgcttac aatctcattt aaataataac ccgctctatg agccgagata cgacggtata    300
aactcagcca tcgttggtga acgctgggtc gatattgcag ggtttaacgt cacaacagcc    360
agcgcagacc cgactggccc taattgcttt agcgcagttt cacaagagcc cgcagatatt    420
cagcaagacc actttatgcg ccgctatgat gatattggag gtcaaggtgg agttgatgct    480
gcttatcgcg cacagcaacg atttgtgcaa cactttgtgg atgcggccat ggccgaaaaa    540
aaacgactaa aagtatggga cggtggtggc cattctgcgt tagcagaggt agatcataat    600
tactttttat ttggtcgtgc ggttcaccta tttcaagact catttagtcc agaacacacg    660
gtacggctcc ctcaagataa ctacgaaaaa gtttggcagg ttaaggcata tctttgctca    720
gagggggctg agcaacattc acacgatacc aaagacgtgc tcaactttgc cagtggcgat    780
gttatttggc aacctcaaac ccgactagaa gcaggctggc aatcttacca gatcagcagt    840
atgaagcccg ttgctattgt ggcccttgaa gccagtaaag atctttgggc tgcgtttatt    900
cgcaccatgg cgaccccaaa agcacagaga cgtaacgtgg caacgcaaga agcccaacaa    960
cttgtacaaa actggttgtc ttttgatgag gcccagatgc tgacttggta tcaagatgag   1020
aataagcgtg accatactta tgtgcttgcc cccaatgaaa cgggaaaagg aaaatctctg   1080
gaagcctgta tgacagagct aaaggtaggc actagcagtc aagcagaacg ggttgcgcaa   1140
ctggaagccg agcgtaatca atgcctatac aacattgagg cggaacctgg ctttgcagac   1200
ttaaacgatc cacacctcga tattccatat aactggcgct ggaagtctct gacttggcaa   1260
acgcctccta gtggctggac atacccacaa ctaaatgcag ataccggcga gcaagtcgcc   1320
attaaatcgc cgataaataa tcagtattta tctgcacaaa ctctaagtaa cgacaccccg   1380
atcactctga gtcaagcaca tccaatttcc ttgatccaag tgacgaatgc acagggccag   1440
cactatttta ggagcgctca agccccttca ctatttctgg gttatagcaa caaaattgca   1500
ggctacctca agcttgtaga ttcacccaag caagccctat atacgttgat ttatcaaggt   1560
ggtctttgga atatccaaaa tgaattttgg caacagtata tctggttaaa tcaagacaaa   1620
gagcggccgg aattaaatcg ccatggtgag cctagccaat taaacgctca gtggatggtc   1680
gaacacttat aa                                                       1692
<210>140
<211>563
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号
<222>(1)...(20)
<400>140
Met Lys Ile Lys Pro Leu Thr Phe Ser Phe Gly Leu Ala Val Thr Ser
 1               5                  10                  15
Ser Val Gln Ala Phe Thr Gln Phe Gly Gly Gln Gly Val Met Pro Met
            20                  25                  30
Gly His Glu Trp Leu Thr Arg Thr Ala Ala Leu Glu Val Leu Asn Ala
        35                  40                  45
Glu His Ile Ile Glu Ala Asp Pro Asn Asp Pro Arg Tyr Thr Trp Gln
    50                  55                  60
Asp Gly Leu Ala Lys Asn Leu Glu Leu Asn Thr Ala Gln Ser Glu Ile
65                  70                  75                  80
Thr Arg Leu Gln Ser His Leu Asn Asn Asn Pro Leu Tyr Glu Pro Arg
                85                  90                  95
Tyr Asp Gly Ile Asn Ser Ala Ile Val Gly Glu Arg Trp Val Asp Ile
            100                 105                 110
Ala Gly Phe Asn Val Thr Thr Ala Ser Ala Asp Pro Thr Gly Pro Asn
        115                 120                 125
Cys Phe Ser Ala Val Ser Gln Glu Pro Ala Asp Ile Gln Gln Asp His
    130                 135                 140
Phe Met Arg Arg Tyr Asp Asp Ile Gly Gly Gln Gly Gly Val Asp Ala
145                 150                 155                 160
Ala Tyr Arg Ala Gln Gln Arg Phe Val Gln His Phe Val Asp Ala Ala
                165                 170                 175
Met Ala Glu Lys Lys Arg Leu Lys Val Trp Asp Gly Gly Gly His Ser
            180                 185                 190
Ala Leu Ala Glu Val Asp His Asn Tyr Phe Leu Phe Gly Arg Ala Val
        195                 200                 205
His Leu Phe Gln Asp Ser Phe Ser Pro Glu His Thr Val Arg Leu Pro
    210                 215                 220
Gln Asp Asn Tyr Glu Lys Val Trp Gln Val Lys Ala Tyr Leu Cys Ser
225                 230                 235                 240
Glu Gly Ala Glu Gln His Ser His Asp Thr Lys Asp Val Leu Asn Phe
                245                 250                 255
Ala Ser Gly Asp Val Ile Trp Gln Pro Gln Thr Arg Leu Glu Ala Gly
            260                 265                 270
Trp Gln Ser Tyr Gln Ile Ser Ser Met Lys Pro Val Ala Ile Val Ala
        275                 280                 285
Leu Glu Ala Ser Lys Asp Leu Trp Ala Ala Phe Ile Arg Thr Met Ala
    290                 295                 300
Thr Pro Lys Ala Gln Arg Arg Asn Val Ala Thr Gln Glu Ala Gln Gln
305                 310                 315                 320
Leu Val Gln Asn Trp Leu Ser Phe Asp Glu Ala Gln Met Leu Thr Trp
                325                 330                 335
Tyr Gln Asp Glu Asn Lys Arg Asp His Thr Tyr Val Leu Ala Pro Asn
            340                 345                 350
Glu Thr Gly Lys Gly Lys Ser Leu Glu Ala Cys Met Thr Glu Leu Lys
        355                 360                 365
Val Gly Thr Ser Ser Gln Ala Glu Arg Val Ala Gln Leu Glu Ala Glu
    370                 375                 380
Arg Asn Gln Cys Leu Tyr Asn Ile Glu Ala Glu Pro Gly Phe Ala Asp
385                 390                 395                 400
Leu Asn Asp Pro His Leu Asp Ile Pro Tyr Asn Trp Arg Trp Lys Ser
                405                 410                 415
Leu Thr Trp Gln Thr Pro Pro Ser Gly Trp Thr Tyr Pro Gln Leu Asn
            420                 425                 430
Ala Asp Thr Gly Glu Gln Val Ala Ile Lys Ser Pro Ile Asn Asn Gln
        435                 440                 445
Tyr Leu Ser Ala Gln Thr Leu Ser Asn Asp Thr Pro Ile Thr Leu Ser
    450                 455                 460
Gln Ala His Pro Ile Ser Leu Ile Gln Val Thr Asn Ala Gln Gly Gln
465                 470                 475                 480
His Tyr Phe Arg Ser Ala Gln Ala Pro Ser Leu Phe Leu Gly Tyr Ser
                485                 490                 495
Asn Lys Ile Ala Gly Tyr Leu Lys Leu Val Asp Ser Pro Lys Gln Ala
            500                 505                 510
Leu Tyr Thr Leu Ile Tyr Gln Gly Gly Leu Trp Asn Ile Gln Asn Glu
        515                 520                 525
Phe Trp Gln Gln Tyr Ile Trp Leu Asn Gln Asp Lys Glu Arg Pro Glu
    530                 535                 540
Leu Asn Arg His Gly Glu Pro Ser Gln Leu Asn Ala Gln Trp Met Val
545                 550                 555                 560
Glu His Leu
<210>141
<211>471
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>141
atgcaaaaaa aaaccagtac atgtgaagac gagggcccgt accgggcagt cttgtttgat     60
ttggacggca ccctgttgga tacggagcgg attggggcgg cctcctggga ccatgcggga    120
gacgaattgg gtctgcgggt gccggaggcg gtaaagcggc agatggtggg tcggacgctg    180
ccggatattc atgcaattgt acgggaaggc atgccggacg tggacgcgga tcgtctgctg    240
gagcgggcca atcatcatta tcaccgtttg gtgaccgaag tgccaccgcc ggtgaaggcc    300
ggggcgcggg aactgctgga atggctgaag ggtgctgggg tgcccatggc ggtggcgact    360
tccagccgcc gggttcaggc cgaagacaaa ttaagccgta ccggcctgcg gcattttttt    420
gatgtgattg tggccggcga tgaaatcgcg cggggcaagc cggatccaaa g             471
<210>142
<211>157
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>结构域
<222>(14)...(157)
<223>卤酸脱卤酶样水解酶
M400>142
Met Gln Lys Lys Thr Ser Thr Cys Glu Asp Glu Gly Pro Tyr Arg Ala
1               5                   10                  15
Val Leu Phe Asp Leu Asp Gly Thr Leu Leu Asp Thr Glu Arg Ile Gly
            20                  25                  30
Ala Ala Ser Trp Asp His Ala Gly Asp Glu Leu Gly Leu Arg Val Pro
        35                  40                  45
Glu Ala Val Lys Arg Gln Met Val Gly Arg Thr Leu Pro Asp Ile His
    50                  55                  60
Ala Ile Val Arg Glu Gly Met Pro Asp Val Asp Ala Asp Arg Leu Leu
65                  70                  75                  80
Glu Arg Ala Asn His His Tyr His Arg Leu Val Thr Glu Val Pro Pro
                85                 90                 95
Pro Val Lys Ala Gly Ala Arg Glu Leu Leu Glu Trp Leu Lys Gly Ala
            100                 105                 110
Gly Val Pro Met Ala Val Ala Thr Ser Ser Arg Arg Val Gln Ala Glu
        115                 120                 125
Asp Lys Leu Ser Arg Thr Gly Leu Arg His Phe Phe Asp Val Ile Val
    130                 135                 140
Ala Gly Asp Glu Ile Ala Arg Gly Lys Pro Asp Pro Lys
145                 150                 155
<210>143
<211>603
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>143
atgaataaca agagcttcat cacaatccat ggcattcgta agtttggctc ttctcccact     60
cacatgcgcc ctataaacga atcactcctc tctagtaatc tgaggacaat cccagtcaat    120
tatggctaca ccctgctccc aatcacgaac agaaagagtg tttctagggc aattcctgtg    180
ctagaaaacg agctaaagcg agggagggac atcaccctta tcgggtattc taacggcgct    240
tggacagctc tacagcttgc ggaaatggct tatccaatcc aacgtctagt gctcatctct    300
cctgctcttc actctgctca cgccttccct caaatccctt ctcttgagcg tgtagacgtg    360
ttctattgcc ctacagataa tgttggtgat cttgccaaga cttggagggg agttactaga    420
atcatgcctt ggagatggtt ctctccacac ccttacggaa gaatgatgaa aactggattt    480
attggagagg atgaacgtgt ctttaaccac aggcttggcg atcatgtagg ccatgctttc    540
tacaaccatg ctgatgctgt ttcacacatt atagaggtga ttaaatatga aactccttat    600
tag                                                                  603
<210>144
<211>200
<212>PRT
<213>未知
<220>
<223>获自环境样品
<400>144
Met Asn Asn Lys Ser Phe Ile Thr Ile His Gly Ile Arg Lys Phe Gly
1               5                   10                  15
Ser Ser Pro Thr His Met Arg Pro Ile Asn Glu Ser Leu Leu Ser Ser
            20                  25                  30
Asn Leu Arg Thr Ile Pro Val Asn Tyr Gly Tyr Thr Leu Leu Pro Ile
        35                  40                  45
Thr Asn Arg Lys Ser Val Ser Arg Ala Ile Pro Val Leu Glu Asn Glu
    50                  55                  60
Leu Lys Arg Gly Arg Asp Ile Thr Leu Ile Gly Tyr Ser Asn Gly Ala
65                  70                  75                  80
Trp Thr Ala Leu Gln Leu Ala Glu Met Ala Tyr Pro Ile Gln Arg Leu
                85                  90                  95
Val Leu Ile Ser Pro Ala Leu His Ser Ala His Ala Phe Pro Gln Ile
            100                 105                 110
Pro Ser Leu Glu Arg Val Asp Val Phe Tyr Cys Pro Thr Asp Asn Val
        115                 120                 125
Gly Asp Leu Ala Lys Thr Trp Arg Gly Val Thr Arg Ile Met Pro Trp
    130                 135                 140
Arg Trp Phe Ser Pro His Pro Tyr Gly Arg Met Met Lys Thr Gly Phe
145                 150                 155                 160
Ile Gly Glu Asp Glu Arg Val Phe Asn His Arg Leu Gly Asp His Val
                165                 170                 175
Gly His Ala Phe Tyr Asn His Ala Asp Ala Val Ser His Ile Ile Glu
            180                 185                 190
Val Ile Lys Tyr Glu Thr Pro Tyr
        195                 200
<210>145
<211>1197
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>145
atgaacgcaa cctccgcaac gatcgccgcc accgacaccc agcagcgcgg tggcttcgcc    60
ggcaccgatc cgcaaccggt cgatcgggtg ctggccgcac tgatccagga caactacgac   120
cgcgtcgacc agcgtcgcgg cgacccgccg atcgaccgcc cgctgccgca gggctgggcg   180
cgcatgggcg acgacgaagt gcgcgccgcg ggcatcgatc ctgcgatgca gcacgatgcc   240
aagagcggct tcgacgcctc gttctaccgc gacgaccagg gccgggtggc cctggtctat   300
gccggcagcg acgagggcca ggactggaag cacaacttcg gccagggcct gggtttccag   360
gacgcgcagt acgaccaggc gatcgcgctg gcgcgcgagg cgaaatcggc cttcggcgac   420
cagctcgtgc tgtcgggcca gtcgctcggc ggcggcctgg ccgcggcagc gtccatggtc   480
aacgaggtgc ccgcggtgac cttcaacgcc gccggcgtgc acgaccacac ggtcgagcgc   540
tacggcctgg acgcggacgc ggtcaagcgc caggcggacc agggcctggt ccggcactac   600
gtggtcgaga acgacatcct gacccacctg caggagaacg cgttcccgct caatgcggcg   660
atgccggatg cgcccggcgc gcgcatcgac ctgcccgatc cggatccgct gaccacgttc   720
gagaagctgc tgccctggaa gacctggccg caccgcgtgc ataaccacta catcgaggcg   780
gtgatcgagt ccatggacaa ggccggctac acgctcgaag gcgcggcggc gacgcgggat   840
gcgtcgcagg acaccgccaa ccggctgctc gacgattcgg tgcgcgggct cgcgccgcag   900
cgcgaacgcc tcgggctgca ggacgacgac cgcttcttca acgcggccgc cggcatggcc   960
gcctcggccg gacgcgatgg cctgcgcagc atccagcacg tggtcgccac gcccgacggc   1020
cacggcgtgt tcgcggtcga aggcgacctg cgcgacgccg gccaccgccg cagcctggtc   1080
gacgtggaac gcggcgccgc gacgccggtc gaggacagcg tggccagcct gcgcgagcac   1140
gcctcgcgtt ccccggagca ggagccgcag cgggagcgcc acctggcgat ggcctga      1197
<210>146
<211>398
<212>PRT
<213>未知
<220>
<223>获自环境样品
<400>146
Met Asn Ala Thr Ser Ala Thr Ile Ala Ala Thr Asp Thr Gln Gln Arg
1               5                   10                  15
Gly Gly Phe Ala Gly Thr Asp Pro Gln Pro Val Asp Arg Val Leu Ala
            20                  25                  30
Ala Leu Ile Gln Asp Asn Tyr Asp Arg Val Asp Gln Arg Arg Gly Asp
        35                  40                  45
Pro Pro Ile Asp Arg Pro Leu Pro Gln Gly Trp Ala Arg Met Gly Asp
    50                  55                  60
Asp Glu Val Arg Ala Ala Gly Ile Asp Pro Ala Met Gln His Asp Ala
65                  70                  75                  80
Lys Ser Gly Phe Asp Ala Ser Phe Tyr Arg Asp Asp Gln Gly Arg Val
                85                  90                  95
Ala Leu Val Tyr Ala Gly Ser Asp Glu Gly Gln Asp Trp Lys His Asn
            100                 105                 110
Phe Gly Gln Gly Leu Gly Phe Gln Asp Ala Gln Tyr Asp Gln Ala Ile
        115                 120                 125
Ala Leu Ala Arg Glu Ala Lys Ser Ala Phe Gly Asp Gln Leu Val Leu
    130                 135                 140
Ser Gly Gln Ser Leu Gly Gly Gly Leu Ala Ala Ala Ala Ser Met Val
145                 150                 155                 160
Asn Glu Val Pro Ala Val Thr Phe Asn Ala Ala Gly Val His Asp His
                165                 170                 175
Thr Val Glu Arg Tyr Gly Leu Asp Ala Asp Ala Val Lys Arg Gln Ala
            180                 185                 190
Asp Gln Gly Leu Val Arg His Tyr Val Val Glu Asn Asp Ile Leu Thr
        195                 200                 205
His Leu Gln Glu Asn Ala Phe Pro Leu Asn Ala Ala Met Pro Asp Ala
    210                 215                 220
Pro Gly Ala Arg Ile Asp Leu Pro Asp Pro Asp Pro Leu Thr Thr Phe
225                 230                 235                 240
Glu Lys Leu Leu Pro Trp Lys Thr Trp Pro His Arg Val His Asn His
                245                 250                 255
Tyr Ile Glu Ala Val Ile Glu Ser Met Asp Lys Ala Gly Tyr Thr Leu
            260                 265                 270
Glu Gly Ala Ala Ala Thr Arg Asp Ala Ser Gln Asp Thr Ala Asn Arg
        275                 280                 285
Leu Leu Asp Asp Ser Val Arg Gly Leu Ala Pro Gln Arg Glu Arg Leu
    290                 295                 300
Gly Leu Gln Asp Asp Asp Arg Phe Phe Asn Ala Ala Ala Gly Met Ala
305                 310                 315                 320
Ala Ser Ala Gly Arg Asp Gly Leu Arg Ser Ile Gln His Val Val Ala
                325                 330                 335
Thr Pro Asp Gly His Gly Val Phe Ala Val Glu Gly Asp Leu Arg Asp
            340                 345                 350
Ala Gly His Arg Arg Ser Leu Val Asp Val Glu Arg Gly Ala Ala Thr
        355                 360                 365
Pro Val Glu Asp Ser Val Ala Ser Leu Arg Glu His Ala Ser Arg Ser
    370                 375                 380
Pro Glu Gln Glu Pro Gln Arg Glu Arg His Leu Ala Met Ala
385                 390                 395
<210>147
<211>1104
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>147
atgcaagtca gtggtgcaat ggaagcaata aatcctgcgc agatgaatgc agcggaagtc     60
acttcatcgc aggtatctga ccagatcatc ggcggcgtta gccaggtgcc ggaagcaggt    120
ttagctagtg aagtcggagc aatggcgatg gcacctgctg ctgaagatgc ggcccttgcc    180
gccatggttg ccggccctgc caatcaagcc agttacggca atttgcccag tgactggacg    240
gaagccgact ataatcatgc tctcgacatg gccaagctgt cttcccaagc ttatagccgg    300
ttcaacgata tcaccgtcga tcttctgttg gctccatttg gtggtattgg tgacataaaa    360
gcgcaggatt ttaccaccga taactggcgc ctaatggaca ccagtggcaa gagtgacttt    420
ttcttacccg tacagagcgg gctggacttc actgtttttg aggcggtagc cgatgacccg    480
gcagctaatg tgaaggaagg ggatattgtg ctcgcatttc gcggcagtga gcctacctcc    540
gcaccggatt ggatcaataa tgtaaaacag gcggcgggta attcctctca gtatgctcag    600
gcggtagaag tcgcgaagga gctgcaaggg caggtagacc agtacaatgc agacaataac    660
ctgaccggca atgatgccag aagcctccat tttaccggcc atagcctggg cgggggattg    720
gcaacagcgg ccgcgctggc cacaggcagt agcgctaccg ccttcaatgc agcgggcctt    780
ggggattcca ccctaaagaa ccttgggctc aatgaagggc tggcggcagg cttccacaat    840
aacgttacca atattaatgt ggaaggcgat ctgttgagcg atgccaaccg ccaaaaggat    900
gtctatacca cgggttcagg catcctcgat gaaaccaggc agtatgggga acaggtttgg    960
ctgcagggcg tcgatgataa ggccagattg ggcggaccgc ttaatcccct gataccggga   1020
gtggctgatg acctggcaat ccaggcactc aaccatgcct ggcatgtgta tacctaccag   1080
ttggaaaatc gcaacttcgc ctaa                                          1104
<210>148
<211>367
<212>PRT
<213>未知
<220>
<223>获自环境样品
<400>148
Met Gln Val Ser Gly Ala Met Glu Ala Ile Asn Pro Ala Gln Met Asn
1               5                   10                  15
Ala Ala Glu Val Thr Ser Ser Gln Val Ser Asp Gln Ile Ile Gly Gly
            20                  25                  30
Val Ser Gln Val Pro Glu Ala Gly Leu Ala Ser Glu Val Gly Ala Met
        35                  40                  45
Ala Met Ala Pro Ala Ala Glu Asp Ala Ala Leu Ala Ala Met Val Ala
    50                  55                  60
Gly Pro Ala Asn Gln Ala Ser Tyr Gly Asn Leu Pro Ser Asp Trp Thr
65                  70                  75                  80
Glu Ala Asp Tyr Asn His Ala Leu Asp Met Ala Lys Leu Ser Ser Gln
                85                  90                  95
Ala Tyr Ser Arg Phe Asn Asp Ile Thr Val Asp Leu Leu Leu Ala Pro
            100                 105                 110
Phe Gly Gly Ile Gly Asp Ile Lys Ala Gln Asp Phe Thr Thr Asp Asn
        115                 120                 125
Trp Arg Leu Met Asp Thr Ser Gly Lys Ser Asp Phe Phe Leu Pro Val
    130                 135                 140
Gln Ser Gly Leu Asp Phe Thr Val Phe Glu Ala Val Ala Asp Asp Pro
145                 150                 155                 160
Ala Ala Asn Val Lys Glu Gly Asp Ile Val Leu Ala Phe Arg Gly Ser
                165                 170                 175
Glu Pro Thr Ser Ala Pro Asp Trp Ile Asn Asn Val Lys Gln Ala Ala
            180                 185                 190
Gly Asn Ser Ser Gln Tyr Ala Gln Ala Val Glu Val Ala Lys Glu Leu
        195                 200                 205
Gln Gly Gln Val Asp Gln Tyr Asn Ala Asp Asn Asn Leu Thr Gly Asn
    210                 215                 220
Asp Ala Arg Ser Leu His Phe Thr Gly His Ser Leu Gly Gly Gly Leu
225                 230                 235                 240
Ala Thr Ala Ala Ala Leu Ala Thr Gly Ser Ser Ala Thr Ala Phe Asn
                245                 250                 255
Ala Ala Gly Leu Gly Asp Ser Thr Leu Lys Asn Leu Gly Leu Asn Glu
            260                 265                 270
Gly Leu Ala Ala Gly Phe His Asn Asn Val Thr Asn Ile Asn Val Glu
        275                 280                 285
Gly Asp Leu Leu Ser Asp Ala Asn Arg Gln Lys Asp Val Tyr Thr Thr
    290                 295                 300
Gly Ser Gly Ile Leu Asp Glu Thr Arg Gln Tyr Gly Glu Gln Val Trp
305                 310                 315                 320
Leu Gln Gly Val Asp Asp Lys Ala Arg Leu Gly Gly Pro Leu Asn Pro
                325                 330                 335
Leu Ile Pro Gly Val Ala Asp Asp Leu Ala Ile Gln Ala Leu Asn His
            340                 345                 350
Ala Trp His Val Tyr Thr Tyr Gln Leu Glu Asn Arg Asn Phe Ala
        355                 360                 365
<210>149
<211>975
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>149
atgagcgtcc aactgcaacc gagccagctc cagccgactt ggcagaaacc gctggaaccc     60
ctggccccgc cgatccaggc ggcaccgccg ctgccgcaag gctcgtacgc cctggacccc    120
agctaccacc cgcagctggc cgcggtcacc gcgaagcagg cgccggccgc caacgccgcg    180
ccggacccga cctcgttcga ccagcaactg cgcggcaagg attcgcaggc catcgacctg    240
gagatggcgc agctctcgca ggcggtctac aaccccgaca ccaagaccgt cggcaactgg    300
acccgtctcg acgacgccca gctgacccag gccggaatcg atcccaagtc gctggagaac    360
agcgacaccg gcttccgcgc cggcatctac accgacggca acggcaagta cgtggtcgcc    420
tacgccggtt ccaacgacgt gcaggactgg atcaccaacg cgcgccaggg catcggctgg    480
gattccaagc agtacgacca ggccgtgcag ctggcccagg acgcgcagca ggccttcggc    540
gagaacatgg tcatcaccgg ccattcgctc ggcggcggcc tggccgcgac cgcggcgctg    600
gccaccgaca ccgccgcagt gaccttcaac gcctccggcg tgcacgacga caccctgcgc    660
ggactgggcc tggacccggg taccgccaag agcgacgccg ccgacggcca gatccgccgc    720
tacaacatcg gcggcgaaat cctgactgcg gcgcaggaag acgtgccgct gctcaacggc    780
attcccgacg cgcccggcca cgagatcaac ctcaacgacc cggacccgcc gaaggccccg    840
gatttcacct ggaacccgat cgagatggcc aagcgcaccg ccgaatacgt ggccgccaag    900
gcgatccgtc cgggcgagct gcacgccatc ggcccggtga tcgaggcgct gcagcagcag    960
acgccctggc aatga                                                     975
<210>150
<211>324
<212>PRT
<213>未知
<220>
<223>获自环境样品
<400>150
Met Ser Val Gln Leu Gln Pro Ser Gln Leu Gln Pro Thr Trp Gln Lys
1               5                   10                  15
Pro Leu Glu Pro Leu Ala Pro Pro Ile Gln Ala Ala Pro Pro Leu Pro
            20                  25                  30
Gln Gly Ser Tyr Ala Leu Asp Pro Ser Tyr His Pro Gln Leu Ala Ala
        35                  40                  45
Val Thr Ala Lys Gln Ala Pro Ala Ala Asn Ala Ala Pro Asp Pro Thr
    50                  55                  60
Ser Phe Asp Gln Gln Leu Arg Gly Lys Asp Ser Gln Ala Ile Asp Leu
65                  70                  75                  80
Glu Met Ala Gln Leu Ser Gln Ala Val Tyr Asn Pro Asp Thr Lys Thr
                85                  90                  95
Val Gly Asn Trp Thr Arg Leu Asp Asp Ala Gln Leu Thr Gln Ala Gly
            100                 105                 110
Ile Asp Pro Lys Ser Leu Glu Asn Ser Asp Thr Gly Phe Arg Ala Gly
        115                 120                 125
Ile Tyr Thr Asp Gly Asn Gly Lys Tyr Val Val Ala Tyr Ala Gly Ser
    130                 135                 140
Asn Asp Val Gln Asp Trp Ile Thr Asn Ala Arg Gln Gly Ile Gly Trp
145                 150                 155                 160
Asp Ser Lys Gln Tyr Asp Gln Ala Val Gln Leu Ala Gln Asp Ala Gln
                165                 170                 175
Gln Ala Phe Gly Glu Asn Met Val Ile Thr Gly His Ser Leu Gly Gly
            180                 185                 190
Gly Leu Ala Ala Thr Ala Ala Leu Ala Thr Asp Thr Ala Ala Val Thr
        195                 200                 205
Phe Asn Ala Ser Gly Val His Asp Asp Thr Leu Arg Gly Leu Gly Leu
    210                 215                 220
Asp Pro Gly Thr Ala Lys Ser Asp Ala Ala Asp Gly Gln Ile Arg Arg
225                 230                 235                 240
Tyr Asn Ile Gly Gly Glu Ile Leu Thr Ala Ala Gln Glu Asp Val Pro
                245                 250                 255
Leu Leu Asn Gly Ile Pro Asp Ala Pro Gly His Glu Ile Asn Leu Asn
            260                 265                 270
Asp Pro Asp Pro Pro Lys Ala Pro Asp Phe Thr Trp Asn Pro Ile Glu
        275                 280                 285
Met Ala Lys Arg Thr Ala Glu Tyr Val Ala Ala Lys Ala Ile Arg Pro
    290                 295                 300
Gly Glu Leu His Ala Ile Gly Pro Val Ile Glu Ala Leu Gln Gln Gln
305                 310                 315                 320
Thr Pro Trp Gln
<210>151
<211>1341
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>151
atgggcggag aacggcaccc cgatggcgtg agcacgatac cggcaacggc ctcggacctg     60
gcgagctttg accgcgccag tggacagctg gcgacattcg ccgcgcctgt cctccacgac    120
agtggcaaac cagacgatcg tctgttcgtc gcggcgttcg acggcaccgg caacagcatg    180
gtcaaggacg cgccggagaa tcacacgaac gttgcgcgca tcgccaggca gatcgagtcc    240
ctgggcgatc ccgccatcgc gcaaggctat gtggaaggcc cgggcacgca gggcggaatc    300
ggcggaggca tcgacctcat gacagggcag agctacgaag cccgcatgga ggacatgtac    360
ctgcagttcg tgaagcaatc cgccgcgtgg ttgaaggaga acccggatgc ggacatccgc    420
atcgccgcca tcggattcag tcgtggcgcg gaacaggcgg ccggcttcac ccggatggtc    480
gaagaacgcg gcatccggaa tccggaaggc gcgcaggtca cgcgcgacgg cgatggtcgg    540
gtactgcgtg tcgactacat cggtccaccg ctgcgcgaac ccggcaccgt catccaggcg    600
gttggcctgt tcgaccccgt cggcacgggt gagccgcgcg atcacgaccg ccgtctgcca    660
ccgtcggtgg tgtcgggttt ccagatcacc gccgacgatg agcggcgcaa cctgttccag    720
tccacccgcg tgatggatcc tggcgtgacc gatggcgggc gcttcctcaa cgtcaccgtc    780
gccggtgcgc acagcgacat cggcggtggc tatacgcagg atggcatcgc gatccgcagc    840
ggcaacctga tgatcgacta cctcaacggt ctgagcgacc ggccattcct ggacaagcgt    900
gaagaaccgt tcgatcccgc tcgcaacgtg atccatcgct ccgaggaaca ccggttcttc    960
taccgcacct cgatctacga caaggcggga acgcgcggga tgcaggagga actcgcgccg   1020
tcgcacctgt gcaggatcga ctgcctcgat gcacagcccc gcaatgaaac gctcgcgcgc   1080
gagctggcct ggcgacccgt cgagatcgga ccggtcccgg tcggcgcgga ggtgtcgcgt   1140
tcgggcggca tggtcgagcg tctgttgcag gcggccaaac acggcgacgg tggcgccgtc   1200
gagcgcatct cgcgggagta tctgcacgga gacgccgggc aggcgtggct gcaggcaggc   1260
cagcagcggc tcgacgccgc ctccatcacg caggcaccac cggtggaacg ccagcaggag   1320
ccggccgcgc tcgcgcgctg a                                             1341
<210>152
<211>446
<212>PRT
<213>未知
<220>
<223>获自环境样品
<400>152
Met Gly Gly Glu Arg His Pro Asp Gly Val Ser Thr Ile Pro Ala Thr
1               5                   10                  15
Ala Ser Asp Leu Ala Ser Phe Asp Arg Ala Ser Gly Gln Leu Ala Thr
            20                  25                  30
Phe Ala Ala Pro Val Leu His Asp Ser Gly Lys Pro Asp Asp Arg Leu
        35                  40                  45
Phe Val Ala Ala Phe Asp Gly Thr Gly Asn Ser Met Val Lys Asp Ala
    50                  55                  60
Pro Glu Asn His Thr Asn Val Ala Arg Ile Ala Arg Gln Ile Glu Ser
65                  70                  75                  80
Leu Gly Asp Pro Ala Ile Ala Gln Gly Tyr Val Glu Gly Pro Gly Thr
                85                  90                  95
Gln Gly Gly Ile Gly Gly Gly Ile Asp Leu Met Thr Gly Gln Ser Tyr
            100                 105                 110
Glu Ala Arg Met Glu Asp Met Tyr Leu Gln Phe Val Lys Gln Ser Ala
        115                 120                 125
Ala Trp Leu Lys Glu Asn Pro Asp Ala Asp Ile Arg Ile Ala Ala Ile
    130                 135                 140
Gly Phe Ser Arg Gly Ala Glu Gln Ala Ala Gly Phe Thr Arg Met Val
145                 150                 155                 160
Glu Glu Arg Gly Ile Arg Asn Pro Glu Gly Ala Gln Val Thr Arg Asp
                165                 170                 175
Gly Asp Gly Arg Val Leu Arg Val Asp Tyr Ile Gly Pro Pro Leu Arg
            180                 185                 190
Glu Pro Gly Thr Val Ile Gln Ala Val Gly Leu Phe Asp Pro Val Gly
        195                 200                 205
Thr Gly Glu Pro Arg Asp His Asp Arg Arg Leu Pro Pro Ser Val Val
    210                 215                 220
Ser Gly Phe Gln Ile Thr Ala Asp Asp Glu Arg Arg Asn Leu Phe Gln
225                 230                 235                 240
Ser Thr Arg Val Met Asp Pro Gly Val Thr Asp Gly Gly Arg Phe Leu
                245                 250                 255
Asn Val Thr Val Ala Gly Ala His Ser Asp Ile Gly Gly Gly Tyr Thr
            260                 265                 270
Gln Asp Gly Ile Ala Ile Arg Ser Gly Asn Leu Met Ile Asp Tyr Leu
        275                 280                 285
Asn Gly Leu Ser Asp Arg Pro Phe Leu Asp Lys Arg Glu Glu Pro Phe
    290                 295                 300
Asp Pro Ala Arg Asn Val Ile His Arg Ser Glu Glu His Arg Phe Phe
305                 310                 315                 320
Tyr Arg Thr Ser Ile Tyr Asp Lys Ala Gly Thr Arg Gly Met Gln Glu
                325                 330                 335
Glu Leu Ala Pro Ser His Leu Cys Arg Ile Asp Cys Leu Asp Ala Gln
            340                 345                 350
Pro Arg Asn Glu Thr Leu Ala Arg Glu Leu Ala Trp Arg Pro Val Glu
        355                 360                 365
Ile Gly Pro Val Pro Val Gly Ala Glu Val Ser Arg Ser Gly Gly Met
    370                 375                 380
Val Glu Arg Leu Leu Gln Ala Ala Lys His Gly Asp Gly Gly Ala Val
385                 390                 395                 400
Glu Arg Ile Ser Arg Glu Tyr Leu His Gly Asp Ala Gly Gln Ala Trp
                405                 410                 415
Leu Gln Ala Gly Gln Gln Arg Leu Asp Ala Ala Ser Ile Thr Gln Ala
            420                 425                 430
Pro Pro Val Glu Arg Gln Gln Glu Pro Ala Ala Leu Ala Arg
        435                 440                 445
<210>153
<211>384
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>153
atgtctttac tttatgcacc agaagagttt tggctagcag atgtagaaac tttagaaagt     60
gtatgtaatg gctgtggtac tgaaggctgg aaaggtaaac taattcctaa cagcatgtat    120
ggtctagata tacgcattgc ttgtgatatc catgactgga tgtatcactt tggtaagtca    180
gaaaaagata aagaaaaagc agataaagct tttttaaata atcttattcg ccttatcaat    240
gatgaaggtg gcttcttagc ttggcctaga cgttataggg ctatgactta ttataacgca    300
gtcaaagatt ttggtgggcc tgcattttgg gcaaataaaa accctaaggg tactatgaaa    360
gaacctaagg gtactcctgc ttaa                                           384
<210>154
<211>127
<212>PRT
<213>未知
<220>
<223>获自环境样品
<400>154
Met Ser Leu Leu Tyr Ala Pro Glu Glu Phe Trp Leu Ala Asp Val Glu
1               5                   10                  15
Thr Leu Glu Ser Val Cys Asn Gly Cys Gly Thr Glu Gly Trp Lys Gly
            20                  25                  30
Lys Leu Ile Pro Asn Ser Met Tyr Gly Leu Asp Ile Arg Ile Ala Cys
        35                  40                  45
Asp Ile His Asp Trp Met Tyr His Phe Gly Lys Ser Glu Lys Asp Lys
    50                  55                  60
Glu Lys Ala Asp Lys Ala Phe Leu Asn Asn Leu Ile Arg Leu Ile Asn
65                  70                  75                  80
Asp Glu Gly Gly Phe Leu Ala Trp Pro Arg Arg Tyr Arg Ala Met Thr
                85                  90                  95
Tyr Tyr Asn Ala Val Lys Asp Phe Gly Gly Pro Ala Phe Trp Ala Asn
            100                 105                 110
Lys Asn Pro Lys Gly Thr Met Lys Glu Pro Lys Gly Thr Pro Ala
        115                 120                 125
<210>155
<211>1263
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>155
atgcggacga caactacaaa ttggagacaa atcgtgaaaa gcctgaagct cttcctgatg    60
ggcctttgcc tgttcatttc cgcttcattc gcatcatctg cctatgcact gggcagttac   120
acctacacgt acctgcgctg tttctatcgc gtcgatacat ccccgctgaa gcccaagacc   180
acctacgtct ggggcatcga tccgggcagc ggcggctact accgcatcta tggccgctgg   240
tggaaagacg gcttgctgag ctgggaaaac atgttctaca gcgacgtgtc gcaagatacg   300
ctgaaatcgg tttgccagag cacgctcgcc ggctacggca tcaaccgcag cgtcgcactc   360
tcggcggcgg ccgatacgtc gctctcgctc aattacacgg tgtggaccaa cgacagcgca   420
tcgcagggct cacgcatcaa caaaatcgtc gcattcggcg acagcctgtc ggacaaccag   480
aatctgtaca acgcgaccca atggcaactg ccgaaccgca acagttggtt tctcggccgc   540
ttctcgaatg acaggaactg gatcgaatac ctgtcgagca acgtgaatct gccgatgtac   600
aactgggcag tggcgggcgc ggcggcggat cagtactacg tcatcccggg tgtgtcgcaa   660
caggtcgact cgtggatcac ctacatgcag agcgcgccga attaccaggc cgcgaatacg   720
ctgttcaccg tgcttgtcgg cggcaacgat ctggtgaact acggccggtc tgtcgactcg   780
atcatctccg cggagcagca ggcgctggtg aagatgatca atgccggcgc tcgcaacatc   840
ctgttgctga atctgcccga cgtatcgcgc gcaccggtat tccagtatcg cagcgacgcc   900
gccaccatcg ccgcgcaagt ccgcgacttc aaccagaagc tggcgcaact gcgcgacaat   960
cttcaggcga cgtacggccc gtcgctcgtc attcgcatgt tcgataccta caccttgttc  1020
aacgatctgc tgaacaatcc gaccaactat ggcgtgacga acacctggca gtcctgcctc  1080
gacatcaact cggattccgg gtcgaactat ctttatacct ggccgacgcg cgccgaatgc  1140
accaacgccg acagcttcgt gttctgggac acgctgcacc cgaccacgca tacgcacaag  1200
ctgctgggcg acaatgcggc gaatttcgta cgcgccggtt tccccgcatt gtctgcgcct  1260
tga                                                                1263
<210>156
<211>420
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号
<222>(1)...(36)
<220>
<221>结构域
<222>(149)...(406)
<223>GDSL-样脂酶/酰基水解酶
<400>156
Met Arg Thr Thr Thr Thr Asn Trp Arg Gln Ile Val Lys Ser Leu Lys
1               5                   10                  15
Leu Phe Leu Met Gly Leu Cys Leu Phe Ile Ser Ala Ser Phe Ala Ser
            20                  25                  30
Ser Ala Tyr Ala Leu Gly Ser Tyr Thr Tyr Thr Tyr Leu Arg Cys Phe
        35                  40                  45
Tyr Arg Val Asp Thr Ser Pro Leu Lys Pro Lys Thr Thr Tyr Val Trp
    50                  55                  60
Gly Ile Asp Pro Gly Ser Gly Gly Tyr Tyr Arg Ile Tyr Gly Arg Trp
65                  70                  75                  80
Trp Lys Asp Gly Leu Leu Ser Trp Glu Asn Met Phe Tyr Ser Asp Val
                85                  90                  95
Ser Gln Asp Thr Leu Lys Ser Val Cys Gln Ser Thr Leu Ala Gly Tyr
            100                 105                 110
Gly Ile Asn Arg Ser Val Ala Leu Ser Ala Ala Ala Asp Thr Ser Leu
        115                 120                 125
Ser Leu Asn Tyr Thr Val Trp Thr Asn Asp Ser Ala Ser Gln Gly Ser
    130                 135                 140
Arg Ile Asn Lys Ile Val Ala Phe Gly Asp Ser Leu Ser Asp Asn Gln
145                 150                 155                 160
Asn Leu Tyr Asn Ala Thr Gln Trp Gln Leu Pro Asn Arg Asn Ser Trp
                165                 170                 175
Phe Leu Gly Arg Phe Ser Asn Asp Arg Asn Trp Ile Glu Tyr Leu Ser
            180                 185                 190
Ser Asn Val Asn Leu Pro Met Tyr Asn Trp Ala Val Ala Gly Ala Ala
        195                 200                 205
Ala Asp Gln Tyr Tyr Val Ile Pro Gly Val Ser Gln Gln Val Asp Ser
    210                 215                 220
Trp Ile Thr Tyr Met Gln Ser Ala Pro Asn Tyr Gln Ala Ala Asn Thr
225                 230                 235                 240
Leu Phe Thr Val Leu Val Gly Gly Asn Asp Leu Val Asn Tyr Gly Arg
                245                 250                 255
Ser Val Asp Ser Ile Ile Ser Ala Glu Gln Gln Ala Leu Val Lys Met
            260                 265                 270
Ile Asn Ala Gly Ala Arg Asn Ile Leu Leu Leu Asn Leu Pro Asp Val
        275                 280                 285
Ser Arg Ala Pro Val Phe Gln Tyr Arg Ser Asp Ala Ala Thr Ile Ala
    290                 295                 300
Ala Gln Val Arg Asp Phe Asn Gln Lys Leu Ala Gln Leu Arg Asp Asn
305                 310                 315                 320
Leu Gln Ala Thr Tyr Gly Pro Ser Leu Val Ile Arg Met Phe Asp Thr
                325                 330                 335
Tyr Thr Leu Phe Asn Asp Leu Leu Asn Asn Pro Thr Asn Tyr Gly Val
            340                 345                 350
Thr Asn Thr Trp Gln Ser Cys Leu Asp Ile Asn Ser Asp Ser Gly Ser
        355                 360                 365
Asn Tyr Leu Tyr Thr Trp Pro Thr Arg Ala Glu Cys Thr Asn Ala Asp
    370                 375                 380
Ser Phe Val Phe Trp Asp Thr Leu His Pro Thr Thr His Thr His Lys
385                 390                 395                 400
Leu Leu Gly Asp Asn Ala Ala Asn Phe Val Arg Ala Gly Phe Pro Ala
                405                 410                 415
Leu Ser Ala Pro
            420
<210>157
<211>1329
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>157
atgagcctca acagccaaga ctacgctgcg ctatccgaag atgcatacaa ggattatgcg    60
gtcggtcgtc gagcgcctgg tcaagaagaa atcgttccga tcaacgggca caagtacaag   120
atcctcgagc acgttgacaa tcggctgaac ggttatcagg gaacgatcta ccagcgagtc   180
gacaccaatg aaattgtcgt cgcacatcgc ggaaccgaac aaatcgcacg cgatgcgatt   240
ctgaccgatg gtggcatggt cgttgcccgt accaatgtgc aggcgccaga cgcaatcgcg   300
ctgacccaac gcgccctggc ttacgccaag aaggaggggc aggatctcgg ccaacgtccg   360
cctgaggtca ccgtcaccgg ccactccctc ggcggcgctc tggcccagat cacctcgcac   420
cacttcaacg tcaagggcga gaccttcaac gcctatggcg cggtcagcct cagctaccgc   480
atcccggaag gtggcaacac catgatcaac catgtcatgg cctccgatcc ggtcagcgcg   540
gcgtcgccac atttcggcca ggtgcggatc tacgccaggc cgaatgaaat cagcacgctc   600
gccgcgaacg gtttcagcaa tcactcgttg cgcgccctta tccccgaccg gccgatcatc   660
gccgcaggca gctcgttcgg cgcgcacaag ctgggcaact tcctcggtga cggctcggtg   720
ctgcagcacc cggaaacgca gaagctggca aaagacaacg ccaggatgat cgaggaatac   780
cgcgacgacg ttgaattact gcgccgtggt gtcacccgcg cggcgcgggg cattccgggc   840
ggcgccgtcg acctgtacga ccacatccgc ggcccgctgc agcccggtga gccggcacgc   900
cgcgaagcgg agaagaacgg ccatcacacc agcatgctgc gaatggacga tgccaaccat   960
gtgggcaacc cactgttcaa cgacgcgatc cgtggcgtgc acgcgcagga tgtccgcgtc  1020
ggccgggtac cagacgtgat gagcacgcaa ctggcaggca gtctggccgc cgaaatgcac  1080
gcagcaggcg gcaagcgcat cgacgaagtg gtcatgaatg ccgatgcctc gcgcagcttc  1140
gccgtgcagg gccagggcgg tgaccccgcc caccttcgtg tgtcggtgga tacggcagtg  1200
gcgatgaaca ccccgctgga acagagcagc cagcgcatcg accagcaggc cgccgaccag  1260
cgcgttgcgc tggagcgcga ccagcagctg gaacagcagc ggaaccagac ccgcagcctg  1320
caggcctga                                                          1329
<210>158
<211>442
<212>PRT
<213>未知
<220>
<223>获自环境样品
<400>158
Met Ser Leu Asn Ser Gln Asp Tyr Ala Ala Leu Ser Glu Asp Ala Tyr
1               5                   10                  15
Lys Asp Tyr Ala Val Gly Arg Arg Ala Pro Gly Gln Glu Glu Ile Val
            20                  25                  30
Pro Ile Asn Gly His Lys Tyr Lys Ile Leu Glu His Val Asp Asn Arg
        35                  40                  45
Leu Asn Gly Tyr Gln Gly Thr Ile Tyr Gln Arg Val Asp Thr Asn Glu
    50                  55                  60
Ile Val Val Ala His Arg Gly Thr Glu Gln Ile Ala Arg Asp Ala Ile
65                  70                  75                  80
Leu Thr Asp Gly Gly Met Val Val Ala Arg Thr Asn Val Gln Ala Pro
                85                  90                  95
Asp Ala Ile Ala Leu Thr Gln Arg Ala Leu Ala Tyr Ala Lys Lys Glu
            100                 105                 110
Gly Gln Asp Leu Gly Gln Arg Pro Pro Glu Val Thr Val Thr Gly His
        115                 120                 125
Ser Leu Gly Gly Ala Leu Ala Gln Ile Thr Ser His His Phe Asn Val
    130                 135                 140
Lys Gly Glu Thr Phe Asn Ala Tyr Gly Ala Val Ser Leu Ser Tyr Arg
145                 150                 155                 160
Ile Pro Glu Gly Gly Asn Thr Met Ile Asn His Val Met Ala Ser Asp
                165                 170                 175
Pro Val Ser Ala Ala Ser Pro His Phe Gly Gln Val Arg Ile Tyr Ala
            180                 185                 190
Arg Pro Asn Glu Ile Ser Thr Leu Ala Ala Asn Gly Phe Ser Asn His
        195                 200                 205
Ser Leu Arg Ala Leu Ile Pro Asp Arg Pro Ile Ile Ala Ala Gly Ser
    210                 215                 220
Ser Phe Gly Ala His Lys Leu Gly Asn Phe Leu Gly Asp Gly Ser Val
225                 230                 235                 240
Leu Gln His Pro Glu Thr Gln Lys Leu Ala Lys Asp Asn Ala Arg Met
                245                 250                 255
Ile Glu Glu Tyr Arg Asp Asp Val Glu Leu Leu Arg Arg Gly Val Thr
            260                 265                 270
Arg Ala Ala Arg Gly Ile Pro Gly Gly Ala Val Asp Leu Tyr Asp His
        275                 280                 285
Ile Arg Gly Pro Leu Gln Pro Gly Glu Pro Ala Arg Arg Glu Ala Glu
    290                 295                 300
Lys Asn Gly His His Thr Ser Met Leu Arg Met Asp Asp Ala Asn His
305                 310                 315                 320
Val Gly Asn Pro Leu Phe Asn Asp Ala Ile Arg Gly Val His Ala Gln
                325                 330                 335
Asp Val Arg Val Gly Arg Val Pro Asp Val Met Ser Thr Gln Leu Ala
            340                 345                 350
Gly Ser Leu Ala Ala Glu Met His Ala Ala Gly Gly Lys Arg Ile Asp
        355                 360                 365
Glu Val Val Met Asn Ala Asp Ala Ser Arg Ser Phe Ala Val Gln Gly
    370                 375                 380
Gln Gly Gly Asp Pro Ala His Leu Arg Val Ser Val Asp Thr Ala Val
385                 390                 395                 400
Ala Met Asn Thr Pro Leu Glu Gln Ser Ser Gln Arg Ile Asp Gln Gln
                405                 410                 415
Ala Ala Asp Gln Arg Val Ala Leu Glu Arg Asp Gln Gln Leu Glu Gln
            420                 425                 430
Gln Arg Asn Gln Thr Arg Ser Leu Gln Ala
        435                 440
<210>159
<211>1428
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>159
atgtcgatca cgctggtatt cgtgcacggc tggagtgtca caagcaagga cacctacggg    60
aagcttcccg aggccatctc tcaagccgct gcggccgcgg gcatcgatgt agagctgaag   120
gacatctacc tcggccgcta catcagcttt cacgacgagg ttacggtcga cgacatcgcg   180
accgcgatga atcacgcggt ggcgaacgac ttgaaagggg tgaaggagtt ctcgtgcatc   240
acgcactcca cgggcggccc ggtcgtgcgt cgctgggtag atatgttcta cggcgcgaag   300
gacctcgaca actgtccgct gcgtcatctc atcatgctgg cgcctgcaaa ccatggttcc   360
gcgttggccg tcttggggaa gggccgcgtc ggtcgaatcc aggcgtggtg gggtggggtc   420
gagcccggtc agggcgtgct cgactggctt tgcctcggca gctcggaagc gtgggagctc   480
caggacagct tcacggatta ctcgctggac gacgcgaagt tcttcccgtt cgtgctgagc   540
ggcgagacga ttgataagca cttctacgac ttcctcaaca gctatctgga tgaagtgggc   600
tcggatggcg tggttcgtct ggcgggggcc aatctgaact acacgtttat tcggctcgac   660
caaactgaaa agcgttacga cgacggcgag gaaacgggct acatactgac tgttcggccg   720
cggacaaagc cgcgcccacc cgtaacggcg ttcggagtca taccgagcgc gagtcactcg   780
ggtaacgaca tcggcatcat gcgcagcgtc acgccggcga actccgattc gaagcctgtc   840
gtggcgcaaa tcgtgaaatg cctcggcgtg gagacacaag cggattacaa agcgcgtgtc   900
accgagctgg ccgcgttcac cgccgaaacg cagaaagcca acgccgtgca gtacggcggc   960
aaagagcgcc atttcgtgat gttcatcttc cgcatccgcg acgacagagg gcgcacgata  1020
agcgactacg acctgttgct gctcggcgac ggtttccacc cggacaagct gcccaaggga  1080
ttcttcgttg accgtcaacg caatcccaag tcccaggcgc tggtctacta cctcgactac  1140
gacgcgctga cggctgacga cgacaccgac ttaggtattc gagtgaacgc gcgaccgctc  1200
tatagcgcgc ccggagcagc agagccagac gcattcgcgg gctatcgagc cgccgagtat  1260
cgattcacgg gcaaagtact gaagcaattc gtgcgcccga acgaaactgt gtacgtcgac  1320
atcgtgctga atcgcatggt ggacgttgaa acgctccggc tggagcctct ggaaggatcg  1380
ccgcgtgggt cgttcaagaa aactctgccc aaagggccgg tgagttag               1428
<210>160
<211>475
<212>PRT
<213>未知
<220>
<223>获自环境样品
<400>160
Met Ser Ile Thr Leu Val Phe Val His Gly Trp Ser Val Thr Ser Lys
1               5                   10                  15
Asp Thr Tyr Gly Lys Leu Pro Glu Ala Ile Ser Gln Ala Ala Ala Ala
            20                  25                  30
Ala Gly Ile Asp Val Glu Leu Lys Asp Ile Tyr Leu Gly Arg Tyr Ile
        35                  40                  45
Ser Phe His Asp Glu Val Thr Val Asp Asp Ile Ala Thr Ala Met Asn
    50                  55                  60
His Ala Val Ala Asn Asp Leu Lys Gly Val Lys Glu Phe Ser Cys Ile
65                  70                  75                  80
Thr His Ser Thr Gly Gly Pro Val Val Arg Arg Trp Val Asp Met Phe
                85                  90                  95
Tyr Gly Ala Lys Asp Leu Asp Asn Cys Pro Leu Arg His Leu Ile Met
            100                 105                 110
Leu Ala Pro Ala Asn His Gly Ser Ala Leu Ala Val Leu Gly Lys Gly
        115                 120                 125
Arg Val Gly Arg Ile Gln Ala Trp Trp Gly Gly Val Glu Pro Gly Gln
    130                 135                 140
Gly Val Leu Asp Trp Leu Cys Leu Gly Ser Ser Glu Ala Trp Glu Leu
145                 150                 155                 160
Gln Asp Ser Phe Thr Asp Tyr Ser Leu Asp Asp Ala Lys Phe Phe Pro
                165                 170                 175
Phe Val Leu Ser Gly Glu Thr Ile Asp Lys His Phe Tyr Asp Phe Leu
            180                 185                 190
Asn Ser Tyr Leu Asp Glu Val Gly Ser Asp Gly Val Val Arg Leu Ala
        195                 200                 205
Gly Ala Asn Leu Asn Tyr Thr Phe Ile Arg Leu Asp Gln Thr Glu Lys
    210                 215                 220
Arg Tyr Asp Asp Gly Glu Glu Thr Gly Tyr Ile Leu Thr Val Arg Pro
225                 230                 235                 240
Arg Thr Lys Pro Arg Pro Pro Val Thr Ala Phe Gly Val Ile Pro Ser
                245                 250                 255
Ala Ser His Ser Gly Asn Asp Ile Gly Ile Met Arg Ser Val Thr Pro
            260                 265                 270
Ala Asn Ser Asp Ser Lys Pro Val Val Ala Gln Ile Val Lys Cys Leu
        275                 280                 285
Gly Val Glu Thr Gln Ala Asp Tyr Lys Ala Arg Val Thr Glu Leu Ala
    290                 295                 300
Ala Phe Thr Ala Glu Thr Gln Lys Ala Asn Ala Val Gln Tyr Gly Gly
305                 310                 315                 320
Lys Glu Arg His Phe Val Met Phe Ile Phe Arg Ile Arg Asp Asp Arg
                325                 330                 335
Gly Arg Thr Ile Ser Asp Tyr Asp Leu Leu Leu Leu Gly Asp Gly Phe
            340                 345                 350
His Pro Asp Lys Leu Pro Lys Gly Phe Phe Val Asp Arg Gln Arg Asn
        355                 360                 365
Pro Lys Ser Gln Ala Leu Val Tyr Tyr Leu Asp Tyr Asp Ala Leu Thr
    370                 375                 380
Ala Asp Asp Asp Thr Asp Leu Gly Ile Arg Val Asn Ala Arg Pro Leu
385                 390                 395                 400
Tyr Ser Ala Pro Gly Ala Ala Glu Pro Asp Ala Phe Ala Gly Tyr Arg
                405                 410                 415
Ala Ala Glu Tyr Arg Phe Thr Gly Lys Val Leu Lys Gln Phe Val Arg
            420                 425                 430
Pro Asn Glu Thr Val Tyr Val Asp Ile Val Leu Asn Arg Met Val Asp
        435                 440                 445
Val Glu Thr Leu Arg Leu Glu Pro Leu Glu Gly Ser Pro Arg Gly Ser
    450                 455                 460
Phe Lys Lys Thr Leu Pro Lys Gly Pro Val Ser
465                 470                 475
<210>161
<211>1740
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>161
atgaacagaa aattattatc gttatgcttg ggagcaacgt cctgtattgc actatcactt     60
cctgtgcatg catttacgca aaagggtgcg ggtacggaaa tttctaatgg gatacctatg    120
gggcacgaat gggttacgcg tttgtctgca ttggaattgc ttggtggcga tcctattatg    180
ccgccagatc caaatgaccc acgtaaaaac tggactaaag ggaaagccaa aaacctcgat    240
ctttccagcc caggtgcgcg tgcagaagtt gcgcggatta tgagtgttga ttatcacgat    300
aaaatattcc agtcgacgta caaagttgtt ttcgacgcta ttattggcga gcgctgggta    360
gatttggcgg gatataacgt gacgaccagc atgttgggaa aaataaactg ttttgatgct    420
gtagcccaag agccagtaga aatccagtac gatcatttta tgcgtcgtta cgacgagcgc    480
ggtggaaaag gtggagcgac tgctgcgacc aattcacgcg agcgttttgt gcaatatttt    540
gttgcagcgg caatggctcc ccaaacaact atgaaagtat gggatggcgg tgttgttagt    600
gatttggtta ccgtagatag gaattacttt ttatttggca gggctgcgca tttattcgaa    660
gactcattta gttcagaaca tacagtgcgg gtgagtgatg ataattttga actggtgcgc    720
caagtaaaaa gctacatgtg tgctgcaggt tctgaacagc atacgcattc aaatgaaaaa   780
atatttaatt acaccagtgg cgatgttatt tggaaaccgg gtactggttt ggatccaagt   840
tggtccgcat ataaaccaag caacatgaaa accgtcgcat tggtggcgac cgaagcaact   900
aaagatttat gggcagcgtt tattcgctcc atgggcacgc ctatagcgca gcgtgagcag   960
tgggcgcgta aagaggctaa taaactggcc gataattggt tggcttttga taaatacaaa  1020
ctccccgatt ggtatgacat tgaagctcat cgggatgata cctatgtatt ggctgatggg  1080
cagacaggga aaggccaaac tgttgccgct tgtatgcaaa agttgggggt tgcatcaggc  1140
aagcaggagg ataaggttcg ccaattggaa gcagatcaaa aaacctgttt atacaatgtc  1200
gtggctgaag agggatacgc cgatttattt gatcccgcat ttcacatgcc attcaattgg  1260
cgttggaaaa caggccggtt tggtgattgg ttacaaccac cagcaggatg gaaaattcca  1320
actcgtccag cggatacagg cacacgcgtg aatattctca gtgcgacaaa caatctccct  1380
atggtggcag ctgatggtgt aagccataac cagtgggttt atgttaaagc aggttttcct  1440
gcgctgggtt ttatcaaagt gccggatgaa aataatactg acaaaaagaa tagtattttt  1500
tatcgcgtaa ttaatgatcc cgatttattt ttaagttaca acgccactac tggcgcagta  1560
aaactctggg ccagtccgaa ccaggctaat tatgcaactg aaccaaaatc agggaatatt  1620
gcaatcaaga gtttgtattg ggatcaatat atgtggcttt caaacgaatc cccttatatt  1680
acccgtaccg ggaatcccaa aaatttggat gcccaatgga aagaagtagc cgctaagtaa  1740
<210>162
<211>579
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号
<222>(1)...(24)
<400>162
Met Asn Arg Lys Leu Leu Ser Leu Cys Leu Gly Ala Thr Ser Cys Ile
1               5                   10                  15
Ala Leu Ser Leu Pro Val His Ala Phe Thr Gln Lys Gly Ala Gly Thr
            20                  25                  30
Glu Ile Ser Asn Gly Ile Pro Met Gly His Glu Trp Val Thr Arg Leu
        35                  40                  45
Ser Ala Leu Glu Leu Leu Gly Gly Asp Pro Ile Met Pro Pro Asp Pro
    50                  55                  60
Asn Asp Pro Arg Lys Asn Trp Thr Lys Gly Lys Ala Lys Asn Leu Asp
65                  70                  75                  80
Leu Ser Ser Pro Gly Ala Arg Ala Glu Val Ala Arg Ile Met Ser Val
                85                  90                  95
Asp Tyr His Asp Lys Ile Phe Gln Ser Thr Tyr Lys Val Val Phe Asp
            100                 105                 110
Ala Ile Ile Gly Glu Arg Trp Val Asp Leu Ala Gly Tyr Asn Val Thr
        115                 120                 125
Thr Ser Met Leu Gly Lys Ile Asn Cys Phe Asp Ala Val Ala Gln Glu
    130                 135                 140
Pro Val Glu Ile Gln Tyr Asp His Phe Met Arg Arg Tyr Asp Glu Arg
145                 150                 155                 160
Gly Gly Lys Gly Gly Ala Thr Ala Ala Thr Asn Ser Arg Glu Arg Phe
                165                 170                 175
Val Gln Tyr Phe Val Ala Ala Ala Met Ala Pro Gln Thr Thr Met Lys
            180                 185                 190
Val Trp Asp Gly Gly Val Val Ser Asp Leu Val Thr Val Asp Arg Asn
        195                 200                 205
Tyr Phe Leu Phe Gly Arg Ala Ala His Leu Phe Glu Asp Ser Phe Ser
    210                 215                 220
Ser Glu His Thr Val Arg Val Ser Asp Asp Asn Phe Glu Leu Val Arg
225                 230                 235                 240
Gln Val Lys Ser Tyr Met Cys Ala Ala Gly Ser Glu Gln His Thr His
                245                 250                 255
Ser Asn Glu Lys Ile Phe Asn Tyr Thr Ser Gly Asp Val Ile Trp Lys
            260                 265                 270
Pro Gly Thr Gly Leu Asp Pro Ser Trp Ser Ala Tyr Lys Pro Ser Asn
        275                 280                 285
Met Lys Thr Val Ala Leu Val Ala Thr Glu Ala Thr Lys Asp Leu Trp
    290                 295                 300
Ala Ala Phe Ile Arg Ser Met Gly Thr Pro Ile Ala Gln Arg Glu Gln
305                 310                 315                 320
Trp Ala Arg Lys Glu Ala Asn Lys Leu Ala Asp Asn Trp Leu Ala Phe
                325                 330                 335
Asp Lys Tyr Lys Leu Pro Asp Trp Tyr Asp Ile Glu Ala His Arg Asp
            340                 345                 350
Asp Thr Tyr Val Leu Ala Asp Gly Gln Thr Gly Lys Gly Gln Thr Val
        355                 360                 365
Ala Ala Cys Met Gln Lys Leu Gly Val Ala Ser Gly Lys Gln Glu Asp
    370                 375                 380
Lys Val Arg Gln Leu Glu Ala Asp Gln Lys Thr Cys Leu Tyr Asn Val
385                 390                 395                 400
Val Ala Glu Glu Gly Tyr Ala Asp Leu Phe Asp Pro Ala Phe His Met
                405                 410                 415
Pro Phe Asn Trp Arg Trp Lys Thr Gly Arg Phe Gly Asp Trp Leu Gln
            420                 425                 430
Pro Pro Ala Gly Trp Lys Ile Pro Thr Arg Pro Ala Asp Thr Gly Thr
        435                 440                 445
Arg Val Asn Ile Leu Ser Ala Thr Asn Asn Leu Pro Met Val Ala Ala
    450                 455                 460
Asp Gly Val Ser His Asn Gln Trp Val Tyr Val Lys Ala Gly Phe Pro
465                 470                 475                 480
Ala Leu Gly Phe Ile Lys Val Pro Asp Glu Asn Asn Thr Asp Lys Lys
                485                 490                 495
Asn Ser Ile Phe Tyr Arg Val Ile Asn Asp Pro Asp Leu Phe Leu Ser
            500                 505                 510
Tyr Asn Ala Thr Thr Gly Ala Val Lys Leu Trp Ala Ser Pro Asn Gln
        515                 520                 525
Ala Asn Tyr Ala Thr Glu Pro Lys Ser Gly Asn Ile Ala Ile Lys Ser
    530                 535                 540
Leu Tyr Trp Asp Gln Tyr Met Trp Leu Ser Asn Glu Ser Pro Tyr Ile
545                 550                 555                 560
Thr Arg Thr Gly Asn Pro Lys Asn Leu Asp Ala Gln Trp Lys Glu Val
                565                 570                 575
Ala Ala Lys
<210>163
<211>1104
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>163
atgcaagtca atggtgcaat tgcagttact gatccggcgt tgagcaatgc agtggaagca   60
acctcttacc agacatctga acagattgtg ggtggagtaa gcgaagcggc ggaagcaggg  120
ttggcggcag aagtgggcgc ggcggagacg ttcgctgcag ctgacgatgt tgccctttca  180
tccatggtcg ccggcccggc taatgatgcc tcttacggca acctgcccgc agggtgggat  240
gaggcccggt ttgatcatgc cctggatatg gccaagttgt cctctcaggc ctacagcagt  300
ttcaatgaca gaactgtaga tcttctactg gcgccgttta gcggtatcaa tgacataaaa  360
aatcaagatt tctccaccga taattatctc cctataaatt ccggtggcaa atctgacttc  420
ctgttgcccc tgcagaatgg gctggactat acggtcttcc agcaagtcac cgatcctaat  480
ggtgtcgatc atgccgccaa gactgccggc ggcgatatcg ttctttcctt ccggggcagt  540
gaacccacat ccgccccgga ttgggtgaac aatgtgaagc aggccgctgg ccattctccc  600
caatatgggg ccgcggtaaa tgtggcgagg gatttgcagc agcaagtgga tgcctataat  660
gagaagcatg ggcttgaagg cgacgctgcc atgaagctcc acttcaccgg ccacagcctg  720
ggtggcggat tggccactgc cgctgccctg gctaccggta gcgaagcgac agtctttaat   780
gctgccggtc tctcagacca taccattaac aaccttggcc tggacgcaag ccatgccgac   840
aaggtgacca atattaacgt ggaaggcgat ctgctgagcg atggcaaccg gcagaaggat   900
gctcacacca cgggctctgg tgtctttggc gataccaagc aatatggtga gcaggtctgg   960
ctgcagggtg tagatgaccg cgcaagattt ggcggccctc tcaacttcct ggtgccgggc  1020
tttgtcaacg acctggccat tcaggggctt aatcacgcct ggcatgtgta tacctaccaa  1080
ttggaaaacc gcaactttgc ctga                                         1104
<210>164
<211>367
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>结构域
<222>(174)...(296)
<223>脂酶(类型3)
<400>164
Met Gln Val Asn Gly Ala Ile Ala Val Thr Asp Pro Ala Leu Ser Asn
1               5                   10                  15
Ala Val Glu Ala Thr Ser Tyr Gln Thr Ser Glu Gln Ile Val Gly Gly
            20                  25                  30
Val Ser Glu Ala Ala Glu Ala Gly Leu Ala Ala Glu Val Gly Ala Ala
        35                  40                  45
Glu Thr Phe Ala Ala Ala Asp Asp Val Ala Leu Ser Ser Met Val Ala
    50                  55                  60
Gly Pro Ala Asn Asp Ala Ser Tyr Gly Asn Leu Pro Ala Gly Trp Asp
65                  70                  75                  80
Glu Ala Arg Phe Asp His Ala Leu Asp Met Ala Lys Leu Ser Ser Gln
                85                  90                  95
Ala Tyr Ser Ser Phe Asn Asp Arg Thr Val Asp Leu Leu Leu Ala Pro
            100                 105                 110
Phe Ser Gly Ile Asn Asp Ile Lys Asn Gln Asp Phe Ser Thr Asp Asn
        115                 120                 125
Tyr Leu Pro Ile Asn Ser Gly Gly Lys Ser Asp Phe Leu Leu Pro Leu
    130                 135                 140
Gln Asn Gly Leu Asp Tyr Thr Val Phe Gln Gln Val Thr Asp Pro Asn
145                 150                 155                 160
Gly Val Asp His Ala Ala Lys Thr Ala Gly Gly Asp Ile Val Leu Ser
                165                 170                 175
Phe Arg Gly Ser Glu Pro Thr Ser Ala Pro Asp Trp Val Asn Asn Val
            180                 185                 190
Lys Gln Ala Ala Gly His Ser Pro Gln Tyr Gly Ala Ala Val Asn Val
        195                 200                 205
Ala Arg Asp Leu Gln Gln Gln Val Asp Ala Tyr Asn Glu Lys His Gly
    210                 215                 220
Leu Glu Gly Asp Ala Ala Met Lys Leu His Phe Thr Gly His Ser Leu
225                 230                 235                 240
Gly Gly Gly Leu Ala Thr Ala Ala Ala Leu Ala Thr Gly Ser Glu Ala
                245                 250                 255
Thr Val Phe Asn Ala Ala Gly Leu Ser Asp His Thr Ile Asn Asn Leu
            260                 265                 270
Gly Leu Asp Ala Ser His Ala Asp Lys Val Thr Asn Ile Asn Val Glu
        275                 280                 285
Gly Asp Leu Leu Ser Asp Gly Asn Arg Gln Lys Asp Ala His Thr Thr
    290                 295                 300
Gly Ser Gly Val Phe Gly Asp Thr Lys Gln Tyr Gly Glu Gln Val Trp
305                 310                 315                 320
Leu Gln Gly Val Asp Asp Arg Ala Arg Phe Gly Gly Pro Leu Asn Phe
                325                 330                 335
Leu Val Pro Gly Phe Val Asn Asp Leu Ala Ile Gln Gly Leu Asn His
            340                 345                 350
Ala Trp His Val Tyr Thr Tyr Gln Leu Glu Asn Arg Asn Phe Ala
        355                 360                 365
<210>165
<211>927
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>165
atgcccaaat acagaattct tagtttggac ggcggcggaa tccgggggct gctcagcgcg   60
attctgctcg agcggttgga agcggaggca cccaattggc tgagccaggt ggacctgatc  120
gccggcacat ccaccggcgg gatcatcgcc ctgggtctcg ccaaaggcct cagcccaacc  180
caactgcgca atctctatca actgcgcggg gcggcgatat tcgatgattc atggtgggac  240
gacgtgctcg atattgggaa gatttcgggc gcggattatg ataacaagca actcaccaaa  300
gagttgaaga cgattctcgg caacacgaaa ctgcgcgagt tgtcgaagcg ggttttgatt  360
tcgagtttcg atctggacag tgaagagcgc gatcccacca aacgaagttg gacgccgaag  420
ttcttccaca acttcccggg catcgacagc gacggcgagc aactggccta caaggtggcg  480
ctgtacacca gtgccgcgcc gacgtatttt ccgaccgtgg acgggtacat cgatggcggt  540
gtggtggcca acaaccccag catggcagcc ctcgcgcaaa cgcaggacac ccgcgcgctg  600
aaaacaccgc cgcgcttctc cgaaatccgg ctgctctcga tcggcacggg caaatccctc  660
tatcgcatcg aagggcagaa cctggactgg ggctacgccc agtgggccaa gccgctcatc  720
aacatcatga tggacggcgt gatgggtgtg gcagattacc agtgccggca ggtcctggac  780
gacaattatt gccggatttc gcccaccttc ccgcccggcg cggtgtttcc cttggacggt  840
gtcaaacaga ttcccgacct ggtgaccttt gccacttccg tggacctcac gcgcgccgtt  900
cagtggatca agagcaagtg ggcttag                                      927
<210>166
<211>308
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>结构域
<222>(7)...(191)
<223>Patatin-样磷脂酶
<400>166
Met Pro Lys Tyr Arg Ile Leu Ser Leu Asp Gly Gly Gly Ile Arg Gly
1               5                   10                  15
Leu Leu Ser Ala Ile Leu Leu Glu Arg Leu Glu Ala Glu Ala Pro Asn
            20                  25                  30
Trp Leu Ser Gln Val Asp Leu Ile Ala Gly Thr Ser Thr Gly Gly Ile
        35                  40                  45
Ile Ala Leu Gly Leu Ala Lys Gly Leu Ser Pro Thr Gln Leu Arg Asn
    50                  55                  60
Leu Tyr Gln Leu Arg Gly Ala Ala Ile Phe Asp Asp Ser Trp Trp Asp
65                  70                  75                  80
Asp Val Leu Asp Ile Gly Lys Ile Ser Gly Ala Asp Tyr Asp Asn Lys
                85                  90                  95
Gln Leu Thr Lys Glu Leu Lys Thr Ile Leu Gly Asn Thr Lys Leu Arg
            100                 105                 110
Glu Leu Ser Lys Arg Val Leu Ile Ser Ser Phe Asp Leu Asp Ser Glu
        115                 120                 125
Glu Arg Asp Pro Thr Lys Arg Ser Trp Thr Pro Lys Phe Phe His Asn
    130                 135                 140
Phe Pro Gly Ile Asp Ser Asp Gly Glu Gln Leu Ala Tyr Lys Val Ala
145                 150                 155                 160
Leu Tyr Thr Ser Ala Ala Pro Thr Tyr Phe Pro Thr Val Asp Gly Tyr
                165                 170                 175
Ile Asp Gly Gly Val Val Ala Asn Asn Pro Ser Met Ala Ala Leu Ala
            180                 185                 190
Gln Thr Gln Asp Thr Arg Ala Leu Lys Thr Pro Pro Arg Phe Ser Glu
        195                 200                 205
Ile Arg Leu Leu Ser Ile Gly Thr Gly Lys Ser Leu Tyr Arg Ile Glu
    210                 215                 220
Gly Gln Asn Leu Asp Trp Gly Tyr Ala Gln Trp Ala Lys Pro Leu Ile
225                 230                 235                 240
Asn Ile Met Met Asp Gly Val Met Gly Val Ala Asp Tyr Gln Cys Arg
                245                 250                 255
Gln Val Leu Asp Asp Asn Tyr Cys Arg Ile Ser Pro Thr Phe Pro Pro
            260                 265                 270
Gly Ala Val Phe Pro Leu Asp Gly Val Lys Gln Ile Pro Asp Leu Val
        275                 280                 285
Thr Phe Ala Thr Ser Val Asp Leu Thr Arg Ala Val Gln Trp Ile Lys
    290                 295                 300
Ser Lys Trp Ala
305
<210>167
<211>522
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>167
atggcgagga gctggaagtg gaggccgctt cttagctctt tcttattggt atccttggcg     60
cccttctcga cgtccgtgcc ttgcttcaag ctacccggcc ttgagagcgt ggccttctgg    120
ataagcacta ctatgaactt cttcccgttc ctcctctaca cggctatact agcctacgtt    180
aggaaagact acaaaatagt gctagagggg ctcgccctga acgcgttcgt gctcgtcctc    240
aagtactcgt tccacacccc caggccggag ggctctggcc acctaacccc gggctacccc    300
tccggccaca cggcgagggc cttctggctg gcgctcgagc tcgaaggggt ctggaggtac    360
cctatgttaa cctacgcggc tctggtcgcg tggtcgcgcg ttcagctctg cgcgcactac    420
ccgctggacg tagtgggagg agcgttgagc gctttggcct tccgcgactt atgggaggtt    480
ctgctggaga gggtaggagc cttgaggggg cagcgcgctt ag                       522
<210>168
<211>173
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>信号
<222>(1)...(30)
<220>
<221>结构域
<222>(48)...(167)
<223>PAP2超家族
<400>168
Met Ala Arg Ser Trp Lys Trp Arg Pro Leu Leu Ser Ser Phe Leu Leu
1               5                   10                  15
Val Ser Leu Ala Pro Phe Ser Thr Ser Val Pro Cys Phe Lys Leu Pro
            20                  25                  30
Gly Leu Glu Ser Val Ala Phe Trp Ile Ser Thr Thr Met Asn Phe Phe
        35                  40                  45
Pro Phe Leu Leu Tyr Thr Ala Ile Leu Ala Tyr Val Arg Lys Asp Tyr
    50                  55                  60
Lys Ile Val Leu Glu Gly Leu Ala Leu Asn Ala Phe Val Leu Val Leu
65                  70                  75                  80
Lys Tyr Ser Phe His Thr Pro Arg Pro Glu Gly Ser Gly His Leu Thr
                85                  90                  95
Pro Gly Tyr Pro Ser Gly His Thr Ala Arg Ala Phe Trp Leu Ala Leu
            100                 105                 110
Glu Leu Glu Gly Val Trp Arg Tyr Pro Met Leu Thr Tyr Ala Ala Leu
        115                 120                 125
Val Ala Trp Ser Arg Val Gln Leu Cys Ala His Tyr Pro Leu Asp Val
    130                 135                 140
Val Gly Gly Ala Leu Ser Ala Leu Ala Phe Arg Asp Leu Trp Glu Val
145                 150                 155                 160
Leu Leu Glu Arg Val Gly Ala Leu Arg Gly Gln Arg Ala
                165                 170
<210>169
<211>579
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>169
atgagcattc gcgcagtctt cttcgacctt ggcggagtca tcgtccgcac tgaatatcaa     60
tcaccgcgcc agcagctggc agaccggctt ggcctggact acgatgactt gagcaggatc    120
gtctttgata gcgagacggg catcaaggcg acggttggca cgatcacatc ccagcagcat    180
tgggaagcgg tgatgaaacg cctgaaacgc cctcatgagg aaattaccgc catccgcgat    240
gaattctttg caggcgacat cattgaccgt gagatcatca gtttcctccg ttcactgcgc    300
ggcacctgca aaaccggatt gatctcgaac gcctggagcg acttgcgcga ctttatgaca    360
cgcgaaaaaa taatcgacgc cttcgaccat atcatcatct cgtcggaggt aggtgtggcc    420
aagccggaag cgaagatctt ccagattgcc ctggagcagg ccggggtgag tccgaacgag    480
gcggtgtttg tcgatgattt ttacgtcaat atcgaaggct gtgaaaaagt cggaatgaag    540
ggcattcatt ttaaggaccc cgaatccgct ttggctcaa                           579
<210>170
<211>193
<212>PRT
<213>未知
<220>
<223>获自环境样品
(220>
<221>结构域
<222>(3)...(187)
<223>卤酸脱卤酶样水解酶
<400>170
Met Ser Ile Arg Ala Val Phe Phe Asp Leu Gly Gly Val Ile Val Arg
1               5                   10                  15
Thr Glu Tyr Gln Ser Pro Arg Gln Gln Leu Ala Asp Arg Leu Gly Leu
            20                  25                  30
Asp Tyr Asp Asp Leu Ser Arg Ile Val Phe Asp Ser Glu Thr Gly Ile
        35                  40                  45
Lys Ala Thr Val Gly Thr Ile Thr Ser Gln Gln His Trp Glu Ala Val
    50                  55                  60
Met Lys Arg Leu Lys Arg Pro His Glu Glu Ile Thr Ala Ile Arg Asp
65                  70                  75                  80
Glu Phe Phe Ala Gly Asp Ile Ile Asp Arg Glu Ile Ile Ser Phe Leu
                85                  90                  95
Arg Ser Leu Arg Gly Thr Cys Lys Thr Gly Leu Ile Ser Asn Ala Trp
            100                 105                 110
Ser Asp Leu Arg Asp Phe Met Thr Arg Glu Lys Ile Ile Asp Ala Phe
        115                 120                 125
Asp His Ile Ile Ile Ser Ser Glu Val Gly Val Ala Lys Pro Glu Ala
    130                 135                 140
Lys Ile Phe Gln Ile Ala Leu Glu Gln Ala Gly Val Ser Pro Asn Glu
145                 150                 155                 160
Ala Val Phe Val Asp Asp Phe Tyr Val Asn Ile Glu Gly Cys Glu Lys
                165                 170                 175
Val Gly Met Lys Gly Ile His Phe Lys Asp Pro Glu Ser Ala Leu Ala
            180                 185                 190
Gln
<210>171
<211>834
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>171
atgggcaaag cgatgttctt cacggcagat gacggggcgc ggctggccta ttctgaccag     60
ggtaaggggc tgccggtcct gtgcctggcc gggctgacgc ggaacatggg cgatttcaat    120
tacgtcgctc cgcatctgtc gggcgtgcgg ctgatccgga tggactatcg cggacgcggg    180
cagtccgacc gcaccggcgc cgccacctat accgtcccgc aggaaggcaa ggatgcgctg    240
gcgctgctgg atcacctggg ggtggacagg gccgcgatcc tgggcacgtc tcgcggcggg    300
ctgatcggga tgctgctggc cgccgtggcg catgaccggc tgctggggct gtgcctgaac    360
gatgtcggcc cggtgatcga gcgcgcgggg ctggagcgga tcttcgacta tgtcgggcgc    420
aacccggcgg cgcggacgca tgaggcgctg gcggaacgac tgcctgcggc catgcccggc    480
ttcacaaatg tccccgatgg ccgttggctg gcggatgcgc agaagcatta cgacgaaacg    540
ccggaggggc tgcggatcaa atatgaccct gccctgcgcg aggcgttcct ggcagccttc    600
gagggcgctg cgccggatct gtggccgctg tgggatgcga ctgcgggact gcccgtcgcg    660
ctgatccggg gggccagttc cgacctgctg tctgctacgg ttgccgccga gatgctgcgc    720
cgccgccccg acacgatctt tgccgaggtt ccgggccgcg cccatgtgcc ttggctggac    780
gagccggaat cgctggatgc gatcaatgcc tggctggatc gctgcgggcg crag          834
<210>172
<211>277
<212>PRT
<213>未知
<220>
<223>获自环境样品
<400>172
Met Gly Lys Ala Met Phe Phe Thr Ala Asp Asp Gly Ala Arg Leu Ala
1               5                   10                  15
Tyr Ser Asp Gln Gly Lys Gly Leu Pro Val Leu Cys Leu Ala Gly Leu
            20                  25                  30
Thr Arg Asn Met Gly Asp Phe Asn Tyr Val Ala Pro His Leu Ser Gly
        35                  40                  45
Val Arg Leu Ile Arg Met Asp Tyr Arg Gly Arg Gly Gln Ser Asp Arg
    50                  55                  60
Thr Gly Ala Ala Thr Tyr Thr Val Pro Gln Glu Gly Lys Asp Ala Leu
65                  70                  75                  80
Ala Leu Leu Asp His Leu Gly Val Asp Arg Ala Ala Ile Leu Gly Thr
                85                  90                  95
Ser Arg Gly Gly Leu Ile Gly Met Leu Leu Ala Ala Val Ala His Asp
            100                 105                 110
Arg Leu Leu Gly Leu Cys Leu Asn Asp Val Gly Pro Val Ile Glu Arg
        115                 120                 125
Ala Gly Leu Glu Arg Ile Phe Asp Tyr Val Gly Arg Asn Pro Ala Ala
    130                 135                 140
Arg Thr His Glu Ala Leu Ala Glu Arg Leu Pro Ala Ala Met Pro Gly
145                 150                 155                 160
Phe Thr Asn Val Pro Asp Gly Arg Trp Leu Ala Asp Ala Gln Lys His
                165                 170                 175
Tyr Asp Glu Thr Pro Glu Gly Leu Arg Ile Lys Tyr Asp Pro Ala Leu
            180                 185                 190
Arg Glu Ala Phe Leu Ala Ala Phe Glu Gly Ala Ala Pro Asp Leu Trp
        195                 200                 205
Pro Leu Trp Asp Ala Thr Ala Gly Leu Pro Val Ala Leu Ile Arg Gly
    210                 215                 220
Ala Ser Ser Asp Leu Leu Ser Ala Thr Val Ala Ala Glu Met Leu Arg
225                 230                 235                 240
Arg Arg Pro Asp Thr Ile Phe Ala Glu Val Pro Gly Arg Ala His Val
                245                 250                 255
Pro Trp Leu Asp Glu Pro Glu Ser Leu Asp Ala Ile Asn Ala Trp Leu
            260                 265                 270
Asp Arg Cys Gly Arg
        275
<210>173
<211>642
<212>DNA
<213>未知
<220>
<223>获自环境样品
<400>173
gtgagcgggc tggccggggt gctcttcgac atgggtggcg tggtcatgga ctcgccgctg   60
cacgccatcg cgcggtacga gcgggagcgc gggctgccgc cgcactcgat caaccgcgcg  120
atcgcgaccg ccggcgagac gggggcgtgg gcccgactcg agcgcggcga gctgaccgtg  180
gcgacgttct gcgcaccgtt cgaagcggac tgtcgcgccc gcggcgtcga ggtggatggg  240
gcggcggtca tggccgcgat cgccgcggcc ggcgtggcgc gccccgccat gctggaggcg  300
attcgcagac tccgcgcgca cgggctccgc gtcggcgcgc tcaccaacaa ctggcggcga  360
gaaggacccg acgacgacgt gatcccgcac cgtctgcgct cccacttcga cgccttcgtg  420
gaatcacgcg cggtcggcct gcgcaagccc gacccgcgaa tctacgtgct ggcctgccac  480
gagctgggcg tggagccgtc gcggacggcg ttcctcgacg acatcggcgg caacctcaag  540
ccggcgcgcg cgctcgggat ggcgacgatc aaggtggacg acccggagcg ggcgctggtg  600
gagctcggtg tgctcgtgga gatggacctg ctcggcccgt ga                     642
<210>174
<211>213
<212>PRT
<213>未知
<220>
<223>获自环境样品
<220>
<221>结构域
<222>(4)...(195)
<223>卤酸脱卤酶样水解酶
<400>174
Met Ser Gly Leu Ala Gly Val Leu Phe Asp Met Gly Gly Val Val Met
1               5                   10                  15
Asp Ser Pro Leu His Ala Ile Ala Arg Tyr Glu Arg Glu Arg Gly Leu
            20                  25                  30
Pro Pro His Ser Ile Asn Arg Ala Ile Ala Thr Ala Gly Glu Thr Gly
        35                  40                  45
Ala Trp Ala Arg Leu Glu Arg Gly Glu Leu Thr Val Ala Thr Phe Cys
    50                  55                  60
Ala Pro Phe Glu Ala Asp Cys Arg Ala Arg Gly Val Glu Val Asp Gly
65                  70                  75                  80
Ala Ala Val Met Ala Ala Ile Ala Ala Ala Gly Val Ala Arg Pro Ala
                85                  90                  95
Met Leu Glu Ala Ile Arg Arg Leu Arg Ala His Gly Leu Arg Val Gly
            100                 105                 110
Ala Leu Thr Asn Asn Trp Arg Arg Glu Gly Pro Asp Asp Asp Val Ile
        115                 120                 125
Pro His Arg Leu Arg Ser His Phe Asp Ala Phe Val Glu Ser Arg Ala
    130                 135                 140
Val Gly Leu Arg Lys Pro Asp Pro Arg Ile Tyr Val Leu Ala Cys His
145                 150                 155                 160
Glu Leu Gly Val Glu Pro Ser Arg Thr Ala Phe Leu Asp Asp Ile Gly
                165                 170                 175
Gly Asn Leu Lys Pro Ala Arg Ala Leu Gly Met Ala Thr Ile Lys Val
            180                 185                 190
Asp Asp Pro Glu Arg Ala Leu Val Glu Leu Gly Val Leu Val Glu Met
        195                 200                 205
Asp Leu Leu Gly Pro
    210
<210>175
<211>245
<212>PRT
<213>合成的
<220>
<223>合成产生
<400>175
Trp Ser Ala Glu Asp Lys His Asn Glu Gly Ile Asn Ser His Leu Trp
1               5                   10                  15
Ile Val Asn Arg Ala Ile Asp Ile Met Ser Arg Asn Thr Thr Ile Val
            20                  25                  30
Asn Pro Asn Glu Thr Ala Leu Leu Asn Glu Trp Arg Ala Asp Leu Glu
        35                  40                  45
Asn Gly Ile Tyr Ser Ala Asp Tyr Glu Asn Pro Tyr Tyr Asp Asp Ser
    50                  55                  60
Thr Tyr Ala Ser His Phe Tyr Asp Pro Asp Thr Gly Thr Thr Tyr Ile
65                  70                  75                  80
Pro Phe Ala Lys His Ala Lys Glu Thr Gly Ala Lys Tyr Phe Asn Leu
                85                  90                  95
Ala Gly Gln Ala Tyr Gln Asn Gln Asp Met Gln Gln Ala Phe Phe Tyr
            100                 105                 110
Leu Gly Leu Ser Leu His Tyr Leu Gly Asp Val Asn Gln Pro Met His
        115                 120                 125
Ala Ala Ser Phe Thr Asp Leu Ser Tyr Pro Met Gly Phe His Ser Lys
    130                 135                 140
Tyr Glu Asn Phe Val Asp Thr Ile Lys Asn Asn Tyr Ile Val Ser Asp
145                 150                 155                 160
Ser Asn Gly Tyr Trp Asn Trp Lys Gly Ala Asn Pro Glu Asp Trp Ile
                165                 170                 175
Glu Gly Ala Ala Val Ala Ala Lys Gln Asp Tyr Pro Gly Val Val Asn
            180                 185                 190
Asp Thr Thr Lys Asp Trp Phe Val Lys Ala Ala Val Ser Gln Glu Tyr
        195                 200                 205
Ala Asp Lys Trp Arg Ala Glu Val Thr Pro Val Thr Gly Lys Arg Leu
    210                 215                 220
Met Glu Ala Gln Arg Val Thr Ala Gly Tyr Ile His Leu Trp Phe Asp
225                 230                 235                 240
Thr Tyr Val Asn Arg
                245
<210>176
<211>282
<212>PRT
<213>合成的
<220>
<223>合成产生
<220>
<221>信号
<222>(1)...(37)
<400>176
Met Lys Lys Lys Val Leu Ala Leu Ala Ala Met Val Ala Leu Ala Ala
1               5                   10                  15
Pro Val Gln Ser Val Val Phe Ala Gln Thr Asn Asn Ser Glu Ser Pro
            20                  25                  30
Ala Pro Ile Leu Arg Trp Ser Ala Glu Asp Lys His Asn Glu Gly Ile
        35                  40                  45
Asn Ser His Leu Trp Ile Val Asn Arg Ala Ile Asp Ile Met Ser Arg
    50                  55                  60
Asn Thr Thr Ile Val Asn Pro Asn Glu Thr Ala Leu Leu Asn Glu Trp
65                  70                  75                  80
Arg Ala Asp Leu Glu Asn Gly Ile Tyr Ser Ala Asp Tyr Glu Asn Pro
                85                  90                  95
Tyr Tyr Asp Asp Ser Thr Tyr Ala Ser His Phe Tyr Asp Pro Asp Thr
            100                 105                 110
Gly Thr Thr Tyr Ile Pro Phe Ala Lys His Ala Lys Glu Thr Gly Ala
        115                 120                 125
Lys Tyr Phe Asn Leu Ala Gly Gln Ala Tyr Gln Asn Gln Asp Met Gln
    130                 135                 140
Gln Ala Phe Phe Tyr Leu Gly Leu Ser Leu His Tyr Leu Gly Asp Val
145                 150                 155                 160
Asn Gln Pro Met His Ala Ala Ser Phe Thr Asp Leu Ser Tyr Pro Met
                165                 170                 175
Gly Phe His Ser Lys Tyr Glu Asn Phe Val Asp Thr Ile Lys Asn Asn
            180                 185                 190
Tyr Ile Val Ser Asp Ser Asn Gly Tyr Trp Asn Trp Lys Gly Ala Asn
        195                 200                 205
Pro Glu Asp Trp Ile Glu Gly Ala Ala Val Ala Ala Lys Gln Asp Tyr
    210                 215                 220
Pro Gly Val Val Asn Asp Thr Thr Lys Asp Trp Phe Val Lys Ala Ala
225                 230                 235                 240
Val Ser Gln Glu Tyr Ala Asp Lys Trp Arg Ala Glu Val Thr Pro Val
                245                 250                 255
Thr Gly Lys Arg Leu Met Glu Ala Gln Arg Val Thr Ala Gly Tyr Ile
            260                 265                 270
His Leu Trp Phe Asp Thr Tyr Val Asn Arg
        275                 280
<210>177
<211>849
<212>DNA
<213>合成的
<220>
<223>合成产生
<400>177
atgaaaaaga aagtattagc actagcagct atggttgctt tagctgcgcc agttcaaagt     60
gtagtatttg cacaaacaaa taatagtgaa agtcctgcac cgattttaag atggtcagct    120
gaggataagc ataatgaggg gattaactct catttgtgga ttgtaaatcg tgcaattgac    180
atcatgtctc gtaatacaac gattgtgaat ccgaatgaaa ctgcattatt aaatgagtgg    240
cgtgctgatt tagaaaatgg tatttattct gctgattacg agaatcctta ttatgatgat    300
agtacatatg cttctcactt ttatgatccg gatactggaa caacatatat tccttttgcg  360
aaacatgcaa aagaaacagg cgcaaaatat tttaaccttg ctggtcaagc ataccaaaat  420
caagatatgc agcaagcatt cttctactta ggattatcgc ttcattattt aggagatgtg  480
aatcagccaa tgcatgcagc atcttttacg gatctttctt atccaatggg tttccattct  540
aaatacgaaa attttgttga tacaataaaa aataactata ttgtttcaga tagcaatgga  600
tattggaatt ggaaaggagc aaacccagaa gattggattg aaggagcagc ggtagcagct  660
aaacaagatt atcctggcgt tgtgaacgat acgacaaaag attggtttgt aaaagcagcc  720
gtatctcaag aatatgcaga taaatggcgt gcggaagtaa caccggtgac aggaaagcgt  780
ttaatggaag cgcagcgcgt tacagctggt tatattcatt tgtggtttga tacgtatgta  840
aatcgctaa                                                          849
<210>178
<211>738
<212>DNA
<213>人工的
<220>
<223>合成产生
<400>178
tggtcagctg aggataagca taatgagggg attaactctc atttgtggat tgtaaatcgt   60
gcaattgaca tcatgtctcg taatacaacg attgtgaatc cgaatgaaac tgcattatta  120
aatgagtggc gtgctgattt agaaaatggt atttattctg ctgattacga gaatccttat  180
tatgatgata gtacatatgc ttctcacttt tatgatccgg atactggaac aacatatatt  240
ccttttgcga aacatgcaaa agaaacaggc gcaaaatatt ttaaccttgc tggtcaagca  300
taccaaaatc aagatatgca gcaagcattc ttctacttag gattatcgct tcattattta  360
ggagatgtga atcagccaat gcatgcagca tcttttacgg atctttctta tccaatgggt  420
ttccattcta aatacgaaaa ttttgttgat acaataaaaa ataactatat tgtttcagat  480
agcaatggat attggaattg gaaaggagca aacccagaag attggattga aggagcagcg  540
gtagcagcta aacaagatta tcctggcgtt gtgaacgata cgacaaaaga ttggtttgta  600
aaagcagccg tatctcaaga atatgcagat aaatggcgtg cggaagtaac accggtgaca  660
ggaaagcgtt taatggaagc gcagcgcgtt acagctggtt atattcattt gtggtttgat  720
acgtatgtaa atcgctaa                                                738
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈