新杀虫蛋白质和菌株

申请号 CN95195349.4 申请日 1995-09-27 公开(公告)号 CN1255539C 公开(公告)日 2006-05-10
申请人 辛根塔参与股份公司; 发明人 G·W·沃伦; M·G·科泽尔; M·A·默林斯; G·J·奈; B·卡尔; N·M·德塞; K·科斯蒂克卡; N·B·达克; J·J·埃斯特鲁克;
摘要 本 发明 涉及杀虫菌株和 蛋白质 。本发明提供了能够在营养生长期间产生杀虫蛋白质和辅助蛋白质的芽孢杆菌属菌株。本发明也提供了纯化的蛋白质,编码这些蛋白质的核苷酸序列以及使用这些菌株、蛋白质和基因防治 害虫 的方法。
权利要求

1.一种含有编码营养性杀虫蛋白质的核苷酸序列之分离的DNA分 子,所述蛋白质在芽孢杆菌营养生长期分泌,其中所述核苷酸序列具有 与SEQ ID NO:28或SEQ ID NO:31所示的核苷酸序列至少98%的同一 性。
2.权利要求1的分离的DNA分子,其中所述核苷酸序列如SEQ ID NO:28或SEQ ID NO:31所示。
3.权利要求1的分离的DNA分子,其中所述核苷酸序列编码SEQ ID NO:29或SEQ ID NO:32中所示的基酸序列。
4.权利要求1之分离的DNA分子,其中所述核苷酸序列是玉米偏 好的核苷酸序列,其具有与SEQ ID NO:28或SEQ ID NO:31所示的 核苷酸至少98%的同一性。
5.权利要求4的分离的DNA分子,其中所述核苷酸序列为SEQ ID NO:30所示的核苷酸序列。
6.一种表达盒,其含有与权利要求1-5中任一项的DNA分子有效 连接的调控序列
7.一种包含权利要求6的表达盒之重组载体。
8.一种含有权利要求6的表达盒的宿主生物,其中所述宿主生物选 自植物细胞和昆虫细胞、细菌、酵母、杆状病毒、原生生物、线虫和藻 类。
9.权利要求8的宿主生物,其为细菌。
10.权利要求9的宿主生物,其中所述细菌为以保藏号NRRL B-21225保藏的苏金芽孢杆菌AB88,或以保藏号NRRL B-21439保藏 的苏云金芽孢杆菌AB424。
11.权利要求8的宿主生物,其为植物细胞。
12.一种由权利要求1的分离的DNA分子编码的营养性杀虫蛋白质。
13.权利要求12的营养性杀虫蛋白质,其中所述蛋白质具有包括边 界值在内的60-100kDa的分子量。
14.权利要求13的营养性杀虫蛋白质,其中所述蛋白质具有SEQ ID NO:29或SEQ ID NO:32所示的氨基酸序列。
15.权利要求12的营养性杀虫蛋白质,其可在以保藏号NRRL B-21225保藏的苏云金芽孢杆菌AB88或以保藏号NRRL B-21439保藏的 苏云金芽孢杆菌AB424之营养生长期分离。
16.一种用于分离权利要求1的DNA分子的方法,所述方法包括:
(a)获得含有编码营养性杀虫蛋白质的核苷酸序列之DNA分子;
(b)将该DNA分子与SEQ ID NO:28或SEQ ID NO:31所示的核 苷酸序列杂交;和
(c)从杂交的DNA分子中分离权利要求1所述的DNA分子。
17.一种用于增加昆虫靶范围的方法,其特征在于将权利要求6的表 达盒在植物中与至少一种不同于所述表达盒编码的营养性杀虫蛋白质的 第二种杀昆虫蛋白质一起表达。
18.权利要求17的方法,其中第二种杀昆虫蛋白质选自Btδ-内毒素, 蛋白酶抑制剂,凝集素,α-淀粉酶和过化物酶。
19.一种用于保护植物免受由昆虫害虫引起的损伤的方法,包括种植 这样的植物,其用权利要求1所述的DNA分子转基因;其中所述植物表 达该营养性杀虫蛋白质。
20.一种产生表达营养性杀虫蛋白质的植物或植物细胞的方法,包括 用权利要求6的表达盒或权利要求7的重组载体转化所述植物或植物细 胞。

说明书全文

发明涉及控制植物和非植物害虫的方法和组合物。本发明特别提供了 从芽孢杆菌属的营养生长阶段分离到的新杀虫蛋白质。本发明还提供了芽 孢杆菌菌株、蛋白质、以及编码这些蛋白质的基因。本发明的方法和组合 物可以用于控制植物和非植物害虫的各种系统。    

虫害在世界重要的商业性农作物损失中是一个主要因素。广谱性化学杀 虫剂被广泛用于控制或根除农业重要性害虫。然而,研制有效的替代杀虫 剂有实质性的利益。

生物杀虫剂在替代化学虫害控制中起着重要的作用。最广泛使用的微 生物产品基于细菌苏金芽孢杆菌(Bt)。Bt是革兰氏阳性孢子形式,它在 孢子形成期产生一种杀虫结晶蛋白质(ICP)。

已知的多种Bt产生超过25种不同但相关的ICP。由Bt制造的多数ICP对 鳞翅目、双翅目和鞘翅目中的一些昆虫的幼虫有毒。通常,当ICP被敏感昆 虫摄食后,晶体溶解并被昆虫肠蛋白质酶转化为毒性成分。没有一个对鞘翅 目幼虫如土豆甲虫(Leptinotarsa decemlineata)或大黄粉虫(Tenebrio molitor) 有活性的ICP′s对Diabrotica属的成员特别是玉米根叶甲(Diabrotica virgifera virgifera,WCRW)或长叶甲(Diabrotica longicornis barberi) 有明显的效果。

蜡状芽孢杆菌(Bc)与Bt关系密切。一个主要的区别特征是在Bc中缺 乏伴孢晶体。Bc是一种广泛分布的细菌,在土壤中大量存在,并已从许多 食品和药物中分离出来。这种有机体与食品变质有关。

虽然Bt曾在控制虫害中十分有用,但有需要增加潜在的生物防治剂的数 量。

本发明提供了用于控制植物害虫的组合物和方法。尤其是提供了在芽孢 杆菌菌株的营养生长期间产生的新杀虫蛋白质。这些蛋白质可用作杀虫剂。

本发明还特别涉及实质上纯化的芽孢杆菌菌株,该菌株在营养生长期间 产生杀虫蛋白质,其中所说的芽孢杆菌不是球形芽孢杆菌SSII-I。优选地是 保藏号为NRRL B-21058的蜡状芽孢杆菌菌株和保藏号为NRRL B-21060的 苏云金芽孢杆菌菌株。优选的还有选自保藏号为NRRL B-21224,NRRL B-21225,NRRL B-21226,NRRL B-21227,NRRL B-21228,NRRL B- 21229,NRRL B-21230和NRRL B-21439的芽孢杆菌菌株。

本发明还涉及可在芽孢杆菌属的几个种(Bacillus spp)的营养生长期间 分离到的昆虫特异性蛋白质,但是优选的是苏云金芽孢杆菌和蜡状芽孢杆菌 菌株的昆虫特异性蛋白质以及它们的组分,其中所说的蛋白质不是得自球形 芽孢杆菌SSII-I的杀蚊毒素。本发明的昆虫特异性蛋白质对鞘翅目或鳞翅目 昆虫毒性更高,其分子量大约为30kDa或更大,优选的大约为100kDa,更 优的大约为80kDa。

更特别地,本发明的昆虫特异性蛋白质杀虫活性谱包括针对地老虎属和/ 或灰翅夜蛾属的种类,但是优选的是针对小地老虎[Agrotis ipsilon,BCW] 和/或草地贪夜蛾[Spodoptera frugiperda]和/或甜菜夜蛾[Spodoptera exigua] 和/或烟芽夜蛾和/或玉米夜蛾[Helicoverpa tea]的活性。

优选地,本发明的昆虫特异性蛋白质可被分离,例如,从保藏号为No. NRRL B-21058的蜡状芽孢杆菌或从保藏号为NRRL B-21060的苏云金芽孢 杆菌中分离。

优选地,本发明的昆虫特异性蛋白质也能从保藏号为NRRL B-21224, NRRL B-21225,NRRL B-21226,NRRL B-21227,NRRL B-21228,NRRL B-21229,NRRL B-21230和NRRL B-21439的芽孢杆菌属几个种的菌株分 离。

本发明尤其包括基酸序列选自SEQ ID NO:5和SEQ ID NO:7的昆虫 特异性蛋白质,包括任何在结构上和/或功能上与其同源的蛋白质。

也优选的是这样的昆虫特异性蛋白质,其中所说的蛋白质具有选自SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:29,SEQ ID NO:32和SEQ ID NO:2的序列,此外还包括任何在结构上和/或功能上与其同源的蛋白 质。

特别优选的是这样的昆虫特异性蛋白质,其中所说的蛋白质具有选自 SEQ ID NO:29和SEQ ID NO:32的序列,此外还包括任何在结构上和/ 或功能上与其同源的蛋白质。

本发明进一步优选的实施方案包括本发明的昆虫特异性蛋白质,其中代 表分泌信号的序列被除去或灭活。

本发明还包括辅助蛋白质,这种辅助蛋白质提高昆虫特异性蛋白质的昆 虫特异性活性。这些辅助蛋白质优选的具有大约50kDa的分子量,并且能被 分离,例如从蜡状芽孢杆菌菌株尤其是蜡状芽孢杆菌菌株AB78的营养生长 期分离。

本发明优选的实施方案涉及一种辅助蛋白质,其中代表分泌信号的序列 被除去或灭活。

本发明还涉及多亚基杀虫蛋白质,这种蛋白质包含一种以上的多肽链, 其中至少一种多肽链代表本发明的昆虫特异性蛋白质,至少一种多肽链代表 本发明的辅助蛋白质,这种辅助蛋白质激活或增强上述昆虫特异性蛋白质的 杀虫活性。

按照本发明优选的多亚基杀虫蛋白质的分子量大约为50kDa到 200kDa。

本发明尤其包括多亚基杀虫蛋白质,它包含按照本发明的昆虫特异蛋白 质和辅助蛋白质,这种辅助蛋白质能激活或增强所说昆虫特异性蛋白质的杀 虫活性。

本发明还涉及由几个蛋白质结构域组成的融合蛋白,其中蛋白质结构 域包含至少一种本发明的昆虫特异性蛋白质和/或按照本发明的辅助蛋白 质,这种融合蛋白由符合读框的基因融合产生,当由核糖体翻译时,产生融 合蛋白,这种融合蛋白至少具有本发明的昆虫特异性蛋白质和/或按照本发 明辅助蛋白质以及用于融合的其它可有可无的组分的组合的特性。

本发明的一个特定实施方案涉及包含核糖核酸酶S-蛋白质、本发明的昆 虫特异性蛋白质和按照本发明辅助蛋白质的融合蛋白。

本发明的另一个实施方案涉及按照本发明的昆虫特异性蛋白质和按照本 发明辅助蛋白质组成的融合蛋白,其中在该融合蛋白的N-端或者是昆虫特异 性蛋白质或者是辅助蛋白质。

优选的是这样一种融合蛋白,该蛋白质包含形成的SEO ID NO:23给出 的蛋白质的SEQ ID NO:5给出的昆虫特异性蛋白质和SEQ ID NO:2给出 的辅助蛋白质,此外还包括在结构上和/或功能上与其同源的蛋白质。

优选的是这样一种融合蛋白,该蛋白质包含形成SEQ ID NO:50中给出 的蛋白质的SEQ ID NO:35给出的昆虫特异性蛋白质和SEQ ID NO:27给 出的辅助蛋白质,此外还包括在结构上和/或功能上与其同源的蛋白质。

本发明还涉及这样的融合蛋白,该蛋白质包含融合成信号序列的本发明 昆虫特异性蛋白质和/或按照本发明的辅助蛋白质。优选的是分泌信号序列 或导向序列,它指导转基因产物到特定的细胞器或细胞区室,对受体蛋白质 来说,所述信号序列是异源源。

本发明内特别优选的是这样一种融合蛋白质,其中该蛋白质具有SEQ ID NO:43或SEQ ID NO:46给出的序列,此外还包括在结构上和/或功能上与 其同源的蛋白质。

申请所用的实质上序列同源性指在氨基酸序列间的结构关系相近。例 如,实质上的同源性可以是40%同源,优选地是50%,更优选的是60%或 80%或更多。同源也包含这样一种关系,其中一个或几个几个氨基酸的子序 列(subsequences)缺失,或其它氨基酸的子序列被分散开(interdispersed)。

本发明的另一个方面还涉及这样的DNA分子,该分子包含编码可在芽孢 杆菌属几个种的营养生长期间分离到的昆虫特异性蛋白质及其组分的核苷 酸序列,其中所说的蛋白质不是得自球形芽孢杆菌SSII-1的杀蚊毒素。本发 明尤其涉及这样的DNA分子,其包含编码昆虫特异性蛋白质的核苷酸序 列,其中杀虫活性谱包含针对地老虎属和/或灰翅夜蛾属种类的活性,但优 选的是针对小地老虎[Agrotis ipsilon,BCW]和/或草地贪夜蛾[Spodoptera frugiperda]和/或甜菜夜蛾[Spodoptera exigua]和/或烟芽夜蛾和/或玉米夜 蛾[Helicoverpa tea]活性。

优选的是这样的DNA分子,其中该分子包含SEQ ID NO:4或SEQ ID NO:6给出的核苷酸序列,此外还包括任何在结构上和/或功能上与其同源 的DNA分子。

优选的是这样的DNA分子,其中该分子包含SEQ ID NO:19,SEQ ID NO:28,SEQ ID NO:31或SEQ ID NO:1给出的核苷酸序列,此外还包 括任何在结构上和/或功能上与其同源的DNA分子。

本发明还涉及这样的DNA分子,它包含编码按照本发明之辅助蛋白质的 核苷酸序列,这种辅助蛋白质能增强昆虫特异性蛋白质的昆虫特异性活性。

优选的是这样的DNA分子,其中该分子包含SEQ ID NO:19给出的核苷 酸序列,此外还包括任何在结构上和/或功能上与其同源的DNA分子。

本发明的实施方案还涉及这样的DNA分子,该分子包含编码可在芽孢杆 菌属几个种的营养生长期间分离到的昆虫特异性蛋白质及其组分的核苷酸 序列,其中所说的蛋白质不是得自球形芽孢杆菌SSII-1的杀蚊毒素。这些核 苷酸序列被最优化以适于在微生物或植物中表达。

优选的是这样的DNA分子,其中该分子包含SEQ ID NO:17或SEQ ID NO:18给出的核苷酸序列,此外还包括任何在结构上和/或功能上与其同源 的DNA分子。

也优选的是这样的DNA分子,其中该分子包含SEQ ID NO:24,SEQ ID NO:26,SEQ ID NO:27或SEQ ID NO:30给出的核苷酸序列,此外还包 括任何在结构上和/或功能上与其同源的DNA分子。

本发明还涉及这样的DNA分子,该分子包含编码多亚基杀虫蛋白质的核 苷酸序列,这种多亚基杀虫蛋白质包含一个以上的多肽链,其中上述的多肽 链中至少一条代表本发明的昆虫特异性蛋白质,而且至少一条代表按照本发 明的辅助蛋白质,这种辅助蛋白质激活或增强上述的昆虫特异性蛋白质的杀 虫活性。

优选的是这样的DNA分子,该分子包含编码本发明的昆虫特异性蛋白质 和按照本发明的辅助蛋白质的核苷酸序列,其中辅助蛋白质激活或增强上述 的昆虫特异性蛋白质的杀虫活性。

特别优选的是这样的DNA分子,其中该分子包含SEQ ID NO:1或SEQ ID NO:19给出的核苷酸序列,此外还包括任何在结构上和/或功能上与其同 源的DNA分子。本发明的另一个实施方案涉及这样的DNA分子,该分子包 含编码融合蛋白的核苷酸序列,这种融合蛋白由几个蛋白质结构域组成,包 含至少一种本发明的昆虫特异性蛋白质和/或按照本发明的辅助蛋白质,它 由符合读框基因融合产生,当由核糖体翻译时,产生融合蛋白,这种融合蛋 白至少具有本发明的昆虫特异性蛋白质和/或按照本发明辅助蛋白质以及在 融合使用的其它可有可无的组分的组合的特性。

本发明内优选的是这样的DNA分子,该分子包含编码融合蛋白的核苷酸 序列,这种融合蛋白由几个蛋白质结构域组成,包含至少一种本发明的昆虫 特异性蛋白质和/或按照本发明的辅助蛋白质,在该融合蛋白的N-端是昆虫 特异性蛋白质或辅助蛋白质。特别优选的是这样的DNA分子,其中该分子 包含SEQ ID NO:22给出的核苷酸序列,此外还包括任何在结构上和/或功 能上与其同源的DNA分子。

本发明还涉及这样的DNA分子,该分子包含编码融合蛋白的核苷酸序列 和信号序列,优选的是分泌信号序列或导向序列,其中融合蛋白包含本发明 的昆虫特异性蛋白质和/或本发明的辅助蛋白质,导向序列指导转基因产物 到特定的细胞器或细胞区室,这个信号序列对受体DNA来说是异源源。

本发明还包括DNA分子,它包含编码按照本发明融合蛋白或多亚基蛋白 质的核苷酸序列,这种序列被最优化以适于在微生物或植物中表达。

优选的的是最优化的DNA分子,其中该分子包含SEQ ID NO:42,SEQ ID NO:45或SEQ ID NO:49给出的核苷酸序列,此外还包括任何在结构 上和/或功能上与其同源的DNA分子。

本发明还涉及这样的最优化的DNA分子,其中编码分泌信号的序列从5′ 端除去,但尤其涉及这样的最优化的DNA分子,其中该分子包含SEQ ID NO:35或SEQ ID NO:39给出的核苷酸序列,此外还包括任何在结构上和 /或功能上与其同源的DNA分子。

本申请所用的实质上序列同源性指在核苷酸序列间的结构关系相近。例 如,实质上的同源的DNA分子可能是60%同源,优选地是80%,更优选的 是90%或95%或更多的同源。同源也包括这样一种关系,其中一个或几个 核苷酸或氨基酸的子序列缺失,或者有附加核苷酸或氨基酸的子序列被分散 开。

也包括在本发明中的是能和按照本发明上文限定的DNA分子杂交的的 DNA分子,但优选的是能和所说的DNA分子获得的寡核苷酸探针杂交的 DNA分子,探针包含为上述的昆虫特异性蛋白质编码的序列邻接序列,其 长度为10个核苷酸,杂交在适当严格的条件下进行。这种DNA分子具有昆 虫特异性活性,昆虫特异性蛋白质也由该DNA分子编码。

优选的是这样的DNA分子,其中杂交发生在65℃下包含7%SDS和0.5M 磷酸钠的缓冲液中。

尤其优选的是这样的DNA分子,该分子包含编码按照本发明的昆虫特异 性蛋白质的核苷酸序列,它可通过以下方法获得:

(a)获得包含编码昆虫特异性蛋白质的核苷酸序列的DNA分子;

(b)用按照权利要求107的寡核苷酸探针与所说DNA分子杂交,探针从包 含SEQ ID NO:28,SEQ ID NO:30,或SEQ ID NO:31给出的核苷酸序 列的DNA分子获得;

(c)分离该杂交DNA。

本发明还涉及昆虫特异性蛋白质,其中所说的蛋白质由按照本发明的 DNA分子编码。

也包括在本发明中的是表达盒,该表达盒包含可操作连接到表达序列上 的按照本发明的DNA分子和可有可无的调节序列。其中表达序列包含结合 DNA构建体在宿主有机体(优选的是微生物和植物)中表达所必需的转录 和翻译调节信号。

本发明还涉及载体分子,该载体分子包含按照本发明的表达盒。

按照本发明的表达盒和/或载体分子优选的是植物基因组的一部分。

本发明的另一个实施方案还涉及宿主有机体,优选的是选自植物和昆虫 细胞,细菌,酵母,杆状病毒,原生动物线虫和藻类的有机体,该有机体 包含按照本发明的DNA分子、含有该DNA分子的表达盒或含有该表达盒的 载体分子,优选的是稳定掺入宿主有机体基因组的分子。

本发明还涉及转基因植物,但优选的是包括植物体部分及其后代和种子 在内的玉米植株,该植物包含按照本发明的DNA分子、含有该DNA分子的 表达盒或含有该表达盒的载体分子,优选的是稳定掺入宿主有机体基因组的 分子。

优选的是包括植物体部分及其后代和种子再内的转基因植物,该植物可 以用按照本发明的DNA分子、含有该DNA分子的表达盒或含有该表达盒的 载体分子稳定地转化。

也优选的是包括植物体部分及其后代和种子在内的转基因植物,该植物 能够表达按照本发明的昆虫特异性蛋白质。

本发明还涉及这样的转基因植物,优选的是玉米植株,按照本发明在上 文中的定义,这种植物还表达第二种不同的昆虫防治素,但优选的是Btδ- 内源毒素,该植物优选的是杂种植物。

在本发明的范围内,转基因植物的部分可理解为包括植物细胞,原生质 体,组织,胼胝体,胚胎以及花,茎,果实,叶,根。这些部分起源于预先 用按照本发明的DNA分子转化的转基因植物或他们的后代,因而至少包含 转基因细胞的一部分,它们也是本发明的目的。

本发明还涉及按照本发明的植物繁殖材料,该材料用种子保护剂包衣处 理过。

本发明还包括用按照本发明的DNA分子、含有该DNA分子的表达盒或含 有该表达盒的载体分子转化的微生物,其中该微生物优选地在植物中繁殖, 更优选的是根定居性细菌。

本发明的另一个实施方案涉及胶囊化的昆虫特异性蛋白质,该蛋白质包 含含有按照本发明的昆虫特异性蛋白质的微生物。

本发明也涉及一种杀虫组合物,该组合物包含有效杀虫量的本发明的宿 主有机体,但优选的是纯化芽孢杆菌菌株以及适当的载体。

也包括在本发明中的是杀虫组合物,该组合物包含有效杀虫量的单独的 或与本发明的宿主有机体和/或按照本发明的胶囊化昆虫特异性蛋白质组合 的按照本发明的分离的蛋白质分子以及适当的载体。

本发明的另一个实施方案包括获得按照本发明的纯化蛋白质的方法,该 方法包括把包含上述的昆虫特异性蛋白质的溶液加入到NAD柱,并洗脱组 合的(bound)蛋白质。

也包括在本发明的是一种用于鉴别按照本发明的昆虫特异性蛋白质的杀 虫活性的方法,该方法包括:

在培养基上培养芽孢杆菌菌株;

从所述培养基获得上清液;

用所述上清液饲喂昆虫幼虫;

测定死亡率。

本发明的另一个方面涉及分离按照本发明的昆虫特异性蛋白质的杀虫活 性的方法,该方法包括:

在培养基上培养芽孢杆菌菌株;

从所述培养基获得上清液;

从述民上清液分离上述的昆虫特异性蛋白质。

本发明也包括一种用于分离编码表现出按照本发明的蛋白质的杀虫活性 的昆虫特异性蛋白质的DNA分子,该方法包括:

获得包含编码昆虫特异性蛋白质的核苷酸序列的DNA分子;

用从芽孢杆菌属微生物获得的DNA分子与上述DNA分子杂交;

分离该杂种DNA。

本发明还涉及增加昆虫靶范围的方法,该方法通过使用与至少一种不同 于按照本发明的昆虫特异性蛋白质的杀虫蛋白质组合(但最好与选自Btδ- 内毒素,蛋白质酶抑制因子,外源凝集素,α-淀粉酶和过化物酶的杀虫 蛋白质组合)的按照本发明的昆虫特异性蛋白质。

优选的是在植物体内增加昆虫靶范围的方法,该方法通过将按照本发明 的昆虫特异性蛋白质与至少一种不同于按照本发明的昆虫特异性蛋白质的 杀虫蛋白质一起(但最好与选自Btδ-内毒素,蛋白质酶抑制因子,外源凝 集素,α-淀粉酶和过氧化物酶的杀虫蛋白质一起)在所说的植物体内表达。

也包括在本发明的是保护植物使之免受由虫害造成的破坏的方法,但是 优选是由灰翅夜蛾属和/或地老虎属种类造成的损坏,更优选的是选自小地 老虎[Agrotis ipsilon,BCW],草地贪夜蛾[Spodoptera frugiperda],甜菜夜 蛾[Spodoptera exigua],烟芽夜蛾,玉米夜蛾[Helicoverpa tea]的虫害造成的 损坏,这种方法包括对植物或该植物的生长区域施用按照本发明的杀虫组合 物或毒素蛋白质。

本发明还涉及保护植物使之免受由虫害造成的损坏的方法,但是优选是 由灰翅夜蛾属和/或地老虎属种类造成的损坏,更优选的是选自小地老虎 [Agrotis ipsilon,BCW],草地贪夜蛾[Spodoptera frugiperda],甜菜夜蛾 [Spodoptera exigua],烟芽夜蛾,玉米夜蛾[Helicoverpa tea]的虫害造成的损 坏。这种方法包括种植一种转基因植物,它能在上述的虫害发生的范围内表 达按照本发明的昆虫特异性蛋白质。

本发明也包括产生宿主有机体的方法,这种有机体包含有稳定地整合到 它的基因组内的按照本发明的DNA分子,优选的是其表达按照本发明的昆 虫特异性蛋白质,这种方法包括用按照本发明的DNA分子、含有该DNA分 子的表达盒或含有该表达盒的载体分子转化上述宿主有机体。

本发明的另一个实施方案涉及产生转基因植物或植物细胞的方法,在这 种植物或植物细胞内包含有稳定地整合到植物基因组内的按照本发明的 DNA分子,优选的是其表达按照本发明的昆虫特异性蛋白质,这种方法包 括用按照本发明的DNA分子、含有该DNA分子的表达盒或含有该表达盒的 载体分子分别转化上述植物和植物细胞。

本发明还涉及产生杀虫组合物的方法,该方法包含将有效杀虫量的按照 本发明的分离的芽孢杆菌菌株和/或宿主有机体和/或分离的蛋白质分子和/ 或胶囊化的蛋白质与适当的载体混合。

本发明还包括产生转基因亲本植株的转基因后代的方法,这种方法包括 把包含编码按照本发明的昆虫特异性蛋白质的核苷酸序列的DNA分子稳定 地掺入到植物基因组内。这种方法还包括用按照本发明的DNA分子、含有 该DNA分子的表达盒或含有该表达盒的载体分子转化上述亲本植物,并通 过已知的植物育种技术把杀虫特性转移到上述转基因亲本的后代体内。

也包括在本发明的是能特异地和编码可在芽孢杆菌属的几个种的营养生 长期间分离到的昆虫特异性蛋白质及其组分的核苷酸序列杂交的寡核苷酸 探针。其中所说的蛋白质不是得自球形芽孢杆菌SSII-1的杀蚊毒素。其中 所说的探针包含为上述昆虫特异性蛋白质编码的序列的邻接部分长度为10 个核苷酸。

本发明还包括上述寡核苷酸探针用于筛选芽孢杆菌菌株或其它有机体, 以确定昆虫特异性蛋白质是否天然存在或特定的转化有机体是否包含所述 基因的用途用途。

本发明认识到杀虫蛋白质在芽孢杆菌菌株营养生长期间产生。认识到这 一类杀虫蛋白质的存在,本发明包括所有除了得自球形芽孢杆菌SSII-1的杀 蚊毒素外的营养生长期间的杀虫蛋白质,即下文提到的VIP。

VIP在孢子形成后并不丰富,主要是在稳定生长期之前的对数期表达。 本发明所用的营养生长期定义为孢子形成期开始之前的时期。编码VIP的基 因可被分离、克隆并转化到不同的运送载体中以用于虫害防治方法。

本发明所指的虫害包括(但并不限于)昆虫,真菌,细菌,线虫,螨类, 蜱类,原生动物病原体,动物寄生性肝吸虫等等。虫害包含从鞘翅目,双翅 目,膜翅目,鳞翅目,食毛目,同翅目,半翅目,直翅目,缨翅目,革翅目, 等翅目,虱目,蚤目,毛翅目等,特别是鞘翅目和鳞翅目选择的害虫。

表1-10是主要作物害虫和人畜重要性害虫表,这些害虫包括在本发明的 范围内。

            表1     鳞翅目(蝶蛾类)

玉米

    玉米螟

    小地老虎

    玉米夜蛾

    草地贪夜蛾

    巨座玉米螟

    非洲蔗螟

    小蔗螟

高粱

    高粱螟

    草地贪夜蛾

    非洲蔗螟

    玉米夜蛾

    粒肤地虎

小麦

    一点粘虫

    草地贪夜蛾

    非洲蔗螟

    西部灰地老虎

    非洲蔗螟

向日葵

    sunflower bud moth(Suleima helianthaha)

    向日葵斑螟

    烟芽夜蛾

    玉米夜蛾

    甜菜夜蛾

    棉红铃虫

    小蔗螟

    fall armyworm(Spodoptera frugiperda)

    玉米夜蛾

大豆

    大豆夜蛾

    黎豆夜蛾

    苜蓿绿夜蛾

    玉米螟

    甜菜夜蛾

    烟芽夜蛾

    玉米夜蛾

大麦

    玉米螟

    小地老虎

            表2     鞘翅目(甲虫类)

玉米

    玉米根叶甲

    长角叶甲

    瓜十一星叶甲

    梳爪叩头虫属的几个种

    北方圆头犀金龟(白蛴螬)

    南方圆头犀金龟(白蛴螬)

    日本丽金龟

高粱

    white grub(Phyllophaga crinita)

    wireworm(Eleodes,Conoderus和Aeolus spp.)

    橙足负泥虫

    玉米跳甲

    玉米谷象

小麦

    橙足负泥虫

    三叶草叶象

    瓜十一星叶甲

向日葵

    向日葵叶甲

    胡萝卜金龟

棉花

    棉铃象

水稻

    葡萄肖叶甲

    稻根象

    米象

大豆

    墨西哥大豆瓢虫

            表3     同翅目(粉虱,蚜虫等)

玉米

    玉米蚜

    玉米根蚜

高粱

    玉米蚜

    美甘蔗伪毛蚜

小麦

    俄罗斯小麦蚜

麦二叉蚜

    麦长管蚜

棉花

    棉蚜

    棉序盲蝽

    苘麻粉虱

水稻

    叶蝉(Nephoteftix nigropictus)

大豆

    桃蚜

    蚕豆微叶蝉

大麦

    麦二叉蚜

油用油菜

    甘蓝蚜

            表4     半翅目(臭虫类)

玉米

    美洲谷长蝽

高粱

    美洲谷长蝽

棉花

    美国牧草盲蝽

水稻

    美洲谷长蝽

    拟缘蝽

大豆

    拟缘蝽

大麦

美洲谷长蝽

拟缘蝽

烟草

        表5     直翅目(蝗虫,蟋蟀和蜚蠊非类)

玉米

    赤胫黑蝗

    血黑蝗

小麦

    赤胫黑蝗

    异黑蝗

    血黑蝗

棉花

    赤胫黑蝗

    异黑蝗

大豆

    赤胫黑蝗

    异黑蝗

结构/室内

    美洲大蠊

    德国蠊

    东方蠊

           表6     双翅目(蝇蚊类)

玉米

    玉米种蝇

    玉米斑潜蝇

高粱

    高粱瘿蚊

小麦

    小麦瘿蚊

    麦红吸浆虫

    美洲杆蝇

    麦瘦种蝇

向日葵

    向日葵籽瘿蚊

大豆

    玉米种蝇

大麦

    玉米种蝇

    小麦瘿蚊

攻击人类和动物以及携带疾病的昆虫

    埃及伊蚊

    白纹伊蚊

    巴氏白蛉

    家蝇

    黑虻

    旋丽蝇

                表7     缨翅目(蓟类)

玉米

    玉米黄呆蓟马

小麦

    烟褐花蓟马

棉花

    烟蓟马

    烟褐花蓟马

大豆

    soybean thrips(Sericothrips variabilis)

    烟蓟马

            表8     膜翅目(叶蜂,蚂蚁,黄蜂等等)

玉米

    窃蚁

小麦

    麦茎蜂

            表9     其它目与代表的物种

革翅目(蠼螋类)

    欧洲球螋

等翅目(白蚁类)

    欧洲散白蚁

食毛目(羽虱类)

    鸡头羽虱

    羽虱

虱目(吸虱类)

    人虱

蚤目(跳蚤类)

    猫栉首蚤

                表10     蜱螨目(蜱螨类)

玉米

    棉叶螨

高粱

    红叶螨

    棉叶螨

小麦

    麦瘿螨

棉花

    红叶螨

    棉叶螨

大豆

    草莓叶螨

    棉叶螨

大麦

    潜岩螨

    重要的人和动物蜱螨

    变异革螨

    波斯锐缘蜱

    嗜皮螨

    特嗜皮螨

现在已经认识到,杀虫蛋白质可从芽孢杆菌的营养生长阶段分离,其它 菌株可用标准方法分离并测定对植物和非植物害虫的活性。通常芽孢杆菌菌 株可使用本领域已知的方法从来自包括土壤,植物,昆虫,谷物仓库粉尘以 及其它样品材料等任何环境的样品中分离到,参见,例如,Travers等,(1987) 应用环境微生物,53:1263-1266;Saleh等,(1969)加拿大微生物学杂志, 15:1101-1104;DeLucca等,(1981)加拿大微生物学杂志,27:865-870; Norris等,(1981),“芽孢杆菌属和乳孢芽孢杆菌属”,在Starr等(eds.), 原核生物:细菌的生境、分离与鉴别手册。第II卷,Springer-Verlog Berlin Heidelberg.分离后,可以测试菌株在营养生长期间的杀虫活性。用这种方 式,可以鉴别新的杀虫蛋白质和菌株。

在本发明中使用的芽孢杆菌属微生物包含蜡状芽孢杆菌,苏云金芽孢杆 菌以及表11所列的芽孢杆菌属种类。

                表11     芽孢杆菌属物种表

形态组1

  巨大芽孢杆菌

  蜡状芽孢杆菌*

  蜡状芽孢杆菌菌覃状变种

  苏云金芽孢杆菌*

  地衣状芽孢杆菌

  枯草芽孢杆菌*

  短小芽孢杆菌

  强固芽孢杆菌*

  凝结芽孢杆菌

形态组2

  多粘芽孢杆菌

  软化芽孢杆菌

  环状芽孢杆菌

  嗜热脂肪芽孢杆菌

  蜂房芽孢杆菌*

  侧孢芽孢杆菌*

  短芽孢杆菌

  尘埃芽孢杆菌

  日本甲虫芽孢杆菌*

  缓死芽孢杆菌*

  幼虫芽孢杆菌*

形态组3

  球形芽孢杆菌*

  巴斯德氏芽孢杆菌

指定的菌株

  亚组A

  蜜蜂芽孢杆菌*

  B.filicolonicus

  溶硫胺素芽孢杆菌

  嗜减芽孢杆菌

  亚组B

  丛毛芽孢杆菌

  B.chitinosporus

  缓慢芽孢杆菌

  亚组C

  栗褐芽孢杆菌

  解硫胺素芽孢杆菌

  B.macroides

  B.frcundenreichii

  亚组D

  B.pantothenticus

  植表芽孢杆菌

  亚组El

  B.aminovorans

  B.globisporus

  B.insolitus

  B.psychrophilus

  亚组E2

  B.psychrosaccharolytic

  B.macquariensis

*号表明已经发现和昆虫有关的芽孢杆菌菌株

根据Parry,J.M.等,(1983)芽孢杆菌属物种的彩色图谱,Wolfe医学出 版社,伦敦所述分组。

按照本发明,芽孢杆菌在营养生长期间产生的杀虫蛋白质可分离出来。 在一个实施方案中,分离了在营养生长期间产生的杀虫蛋白质。用于蛋白质 分离的方法在本领域中是已知的。通常,蛋白质可用常规色谱法(包括凝胶 过滤,离子交换)和免疫亲合色谱法、高效液相色谱法(如反相高效液相色 谱法,离子交换高效液相色谱法,筛析高效液相色谱法,高效层析聚焦与疏 水相互作用层析等)、电泳法(如一维凝胶电泳法,二维凝胶电泳法等)分 离。这些方法在本领域中是已知的。参见例如, 分子生物学中通用方法,第 一卷和第二卷,Ausubel等(eds.),John Wiley & Sons,NY(1988)。另外, 可以制备抗实质上纯的蛋白质制剂的抗体。参见例如,Radka等(1983),免 疫学杂志,128:2804;Radka等(1984),免疫遗传学,19:63。可把任何 方法结合起来,用来提纯具有杀虫特性的蛋白质。当步骤确定后,在每一提 纯步骤后都测定杀虫活性。

这样的纯化步骤将产生实质上纯化的蛋白质片断。″实质上纯化的″或“实 质上纯的”是指蛋白质实质上从天然状态下与蛋白质结合的复合物中分离出 来。蛋白质的“实质上纯化的”制备可通过SDS-PAGE后目视或光密度扫描 确定有无其它可检测的带存在来评价。另外,在纯化制剂中没有其它氨基末 端序列或N-末端残基的存在也能表明纯化的水平。可以用“纯”制剂通过离 子交换,反相色谱或毛细管电泳表明无其它峰的存在来检验纯度。术语″实 质上纯化的″或“实质上纯的”并不意味排除少量不干扰蛋白质生物活性的 杂质的存在,例如,杂质可能因为不完全的纯化而存在。

纯化的蛋白质分离后,蛋白质或它包含的多肽可以通过本领域已知的标 准方法确定其特征并测序。例如,纯化的蛋白质或它包含的多肽可以用溴化 氰或用蛋白质酶如木瓜蛋白质酶,胰凝乳蛋白质酶,胰蛋白质酶,赖氨酰- C肽链内切酶等裂解。(Oike等,(1982), 生物化学杂志,257:9751-9758; Liu等,(1983), 国际肽链和蛋白质研究杂志,21:209-215)。形成的肽链最 好通过HPLC或凝胶溶解以及电印迹进PVDF膜分离,以便于氨基酸序列分 析,要完成这个任务,肽链最好用自动序列分析仪分析。已经知道,N-端, C-端,或内部的氨基酸序列都可测定。从纯化的蛋白质的氨基酸序列可以合 成一条核苷酸序列,它可用作探针以协助分离编码杀虫蛋白质的基因。

已经知道,杀虫蛋白质可以是低聚物,并且在分子量,原体(protomer) 数量,组成肽链,对特定昆虫的活性以及其它特征都有变化。然而,通过这 里提出的方法对许多害虫具有活性的蛋白质都可分离并确定其特征。

已经知道,纯化蛋白质分离和确定特征后,可以用多种方法包括氨基酸 的取代,缺失,截断和插入来改变。这种操作的方法在本领域中都是已知的。 例如,杀虫蛋白质的氨基酸序列变异体可以通过DNA突变来制备。这种突 变体具有所需的杀虫活性。很明显,在编码变异体的DNA中所做的突变不 应使序列置于阅读框架之外,最好不创造能产生第二个mRNA结构的互补区 域。参见EP专利申请出版物No.75,444。

在这种意义上,本发明包含了杀虫蛋白质及其组分和片段。也就是说, 已经认识到可以生成保留杀虫活性的蛋白质的组分原体,多肽链或蛋白质片 段。这些片段包含截断序列以及蛋白质的N-端,C-端,内部和内部缺失 (internally deleted)的氨基酸序列。

蛋白质序列的大多数缺失,插入,和替代并不期望产生杀虫蛋白质特性 的根本改变。然而,当在替代,缺失或插入之前预测确切的影响有困难时, 本领域的技术人员将希望通过常规筛选测定评价结果。

这儿所说的蛋白质或其它组分多肽可以单独或结合使用,也就是说,几 种蛋白质可以用来控制不同的虫害。

一些蛋白质是单一多肽,而许多蛋白质由一条以上的多肽链组成,即它 们是寡聚体。另外,一些VIP作为寡聚体具有杀虫活性。在这种情况下,另 外的原体用来增强杀虫活性或激活杀虫蛋白质。这些增强或激活原体就是提 到的辅助蛋白质。辅助蛋白质通过与杀虫蛋白质相互作用形成寡聚蛋白质来 激活或增强杀虫蛋白质,寡聚蛋白质与缺乏辅助蛋白质时观察到的活性相 比,杀虫活性增强。

辅助蛋白质激活或增强杀虫蛋白质(如AB78的VIP1蛋白质)的活性。 这些辅助蛋白质可以用得自AB78的VIP2蛋白质例证,但并不限制在这种蛋 白质上。如在申请的实验部分说明的,辅助蛋白质可以激活许多杀虫蛋白 质。这样,在本发明的一个实施方案中,一种植物(第1亲本)可以用一种 辅助蛋白质转化。这种亲本可以和许多亲本2植物杂交,该亲本2植物用一种 或多种其杀虫活性由辅助蛋白质激活的杀虫蛋白质转化。

本发明的杀虫蛋白质中,一组新的昆虫特异性蛋白质在本发明的范围内 能令人惊奇地被鉴定出来。这种蛋白质在整个申请中被指定为VIP3,可以 从芽孢杆菌属的几个种的菌株中获得,但优选的是从苏云金芽孢杆菌菌株 中,更优选的是从苏云金芽孢杆菌菌株AB88和AB424中获得。该VIP大部 分存在于芽孢杆菌的培养物上清液中,至少可达到菌株AB88的75%。通过 VIP3蛋白质的独特的杀虫活性谱可以进一步确定其特征。它的活性包括对 地老虎属和/或灰翅夜蛾属物种,但是尤其是对小地老虎[BCW]和/或草地贪 夜蛾和/或甜菜夜蛾和/或烟芽夜蛾和/或玉米夜蛾的活性。

小地老虎是相当抗δ-内毒素的重要农业害虫。Maclntosh等(1990)在 脊椎动物病理学杂志,56,258-266报道δ-内毒素和CrylA(B)和CrylA(C) 对BCW的杀虫特性,其食用半致死浓度(LC50)分别超过80μg和18μ g/ml,按照本发明的杀虫蛋白质vip3A杀虫蛋白质加到至少比CrylA蛋白质 达到刚好50%死亡率所需的数量要低10至500倍,优选的是50至350倍,更 优选的是200至300倍时,可提供50%的死亡率。本发明特别优选的vip3A杀 虫蛋白质当数量加到比CrylA蛋白质达到刚好50%死亡率所需的数量要低 260倍时就达到100%的死亡率。

根据发明的vip3杀虫蛋白质大多数存在于培养物上清液中,因而可以归 类为分泌蛋白质。它们最好在N-末端包含许多的荷正电的残基,接着是疏水 核心区,而且在输出期间N-末端不被加工。

如本发明范围内报道的其它杀虫活性蛋白质一样,VIP3蛋白质可以在生 长阶段而不能在孢子形成阶段检测到。这使它和其它属于δ-内毒素类的蛋 白质有了更清楚的区别。优选的,昆虫特异性蛋白质在指数中期开始并持续 到孢子形成期。由于表达方式的特异性与VIP3蛋白质的高稳定性,在孢子 形成期培养物上清液中发现了大量的蛋白质。尤其优选的是在在分类位置上 为SEQ ID NO:29和SEQ ID NO:32的VIP3蛋白质,以及包含编码该蛋白 质的核苷酸序列的相应DNA序列。但尤其是包含SEQ ID NO:28,SEQ ID NO:30和SEQ ID NO:31给出的核苷酸序列的DNA分子。

本发明的杀虫蛋白质可与Bt内毒素或其它杀虫蛋白质组合使用能扩大昆 虫靶范围。进而,本发明的VIP和Btδ-内毒素或其它明显的自然杀虫素结 合对于预防和/或控制昆虫抗性有特别的效用。其它杀虫素包含蛋白质酶抑 制因子(丝氨酸和半胱氨酸类型),外源凝集素,α-淀粉酶和过氧化物酶。在 一个优选的实施方案中,VIP在一种转基因植物中表达伴随着一个或多个δ -内毒素的表达。这种超过一种的杀虫素在同一转基因植物中共同表达可以 通过遗传工程使植物包含并表达所需的基因来达到。另外,一种植物(第1 亲本)可以通过遗传工程操作表达VIP。第二种植物(第2亲本)可以通过 遗传工程操作表达Btδ-内毒素。通过亲本1和亲本2杂交获得表达引入亲本 1和亲本2的所有基因的后代植物。特别优选的Btδ-内毒素是那些本文一并 参考的在EP-A0618976给出的Btδ-内毒素。

许多细胞毒素蛋白质(尽管并非全部)作用是双重(binary)的。双重 毒素(binary toxins)典型地是由两个蛋白质结构域组成,一个称为结构域 A,另一个称为结构域B(参见 细菌蛋白质毒素的原始资料集,J.E.Alouf和 J.H.Freer eds.(1991)学术出版社)。结构域A具有高效细胞毒素活性。结构 域B在被内在化(being inlernized)之前与外源细胞表面受体结合。典型地, 细胞毒素结构域A必须靠转移结构域被送到细胞质。结构域A和B常常是分 离的多肽或原体,通过蛋白质-蛋白质相互作用或二硫键结合。然而,毒素 可以是单一多肽,在细胞内被水解加工成两个结构域。如假单孢菌外毒素 A。总之,双重毒素具有三个重要的结构域:细胞毒素A结构域,结合受体 的B结构域和转移结构域。结构域A和B常通过蛋白质-蛋白质相互作用结 合。

本发明的受体结合结构域对于把任何蛋白质,毒素,酶,转录因子,核 酸,化学因子或任何其它因子送进具有被本发明的双重毒素的受体结合结构 域识别的受体的靶昆虫是有用的。同样地,因为双重毒素具有转移结构域, 它能通过磷脂双层膜并使细胞毒素也穿过这些膜,这样的转移结构域在使任 何蛋白质,毒素,酶,转录因子,核酸,化学的或任何其它因因子穿过磷脂 双层膜如质膜或泡囊膜(vesicle membrane)可能是有用的。转移结构域自 身可使膜形成穿孔,这样就有毒性或杀虫活性。而且,所有双重毒素具有细 胞毒素结构域,这样的细胞毒素结构域不管是单独使用还是以任何方式被送 进任何靶细胞都可用作致死蛋白质。

最后,由两个多肽链组成的双重毒素常形成一个复合物,在本发明的双 重毒素的组分内可能具有蛋白质-蛋白质相互作用的结构域。这些蛋白质-蛋 白质相互作用结构域可能在形成毒素,酶,转录因子,核酸,抗体,细胞结 合组分或任何其它化学制剂,因子,蛋白质或蛋白质结构域之间的结合是具 有用的。

毒素,酶,转录因子,抗体,细胞结合组分或其它蛋白质结构域能通过 符合读框的基因融合而融合到杀虫蛋白质或辅助蛋白质中,符合读框的融合 基因由核糖体翻译时,产生有VIP和在融合中使用的其它组分组合的特性的 融合蛋白。而且,如果融合蛋白结构域和另一个蛋白质,核酸,水化合物, 脂类,或其它化学制剂或因子有亲和,就形成一个三组分的复合物。这个 复合物有它的所有组分的特性。类似的原理可用于产生四个或更多组分的复 合物。这些复合物可用作杀虫毒素,药物,实验室试剂和诊断试剂等。这样 的目前正在使用的复合物的例子是用于潜在的癌症治疗的融合毒素,ELISA 测定试剂和免疫印迹分析试剂。

改变杀虫蛋白质或辅助蛋白质的一个方法就是把一个15个氨基酸的“S- 尾巴”融合到蛋白质上,但不破坏蛋白质的昆虫细胞结合结构域,转移结构 域或蛋白质-蛋白质相互作用结构域。S-尾巴和核糖核酸酶S-蛋白质有高度 的亲和力(Kd=10~9M),后者和S-尾巴结合时,形成活性的核糖核酸酶(参 见F.M.Richards和H.W.Wyckoff(1971),“酶”,第IV卷。(Boyer,P.D.ed.). pp.647-806.学术出版社,纽约)。融合可以通过这样的方法完成:破坏或 移去杀虫蛋白质或辅助蛋白质的细胞毒素活性,并用新的细胞毒素核糖核酸 酶活性取代VIP细胞毒素活性。最后毒素将包含S-蛋白质,杀虫蛋白质以及 辅助蛋白质,其中不论杀虫蛋白质还是辅助蛋白质是作为带有S-尾巴的翻译 融合蛋白产生的,类似的方法可用于把其它潜在的细胞毒素融合到杀虫蛋白 质和辅助蛋白质中,这些细胞毒素包含(但不限于)核糖体活化蛋白质,昆虫 激素,激素受体,转录因子,蛋白质酶,磷酸酶,假单孢杆菌外毒素或任何 进入细胞内时是致死的蛋白质或化学因子,同样地,任何非致死的但改变细 胞的生理生化的蛋白质也可被送入细胞。

对不同种类的活性谱可通过把结构域融合到识别其它种类细胞表面受体 的杀虫蛋白质或辅助蛋白质上而改变,这样的结构域可能包含(但不限于) 抗体,转蛋白质,激素,或从表现出亲合选择性文库的噬菌体中分离到的 肽链序列。和营养素,维生素,激素,或其它能转移进细胞的化学物质结合 的肽序列也能用于改变毒性谱。相似地,其它结合到细胞表面受体或膜上并 能被内在化的蛋白质或化学物质也可以用来改变VIP1和VIP2的活性谱。   本发明的杀虫蛋白质是那些有特异杀虫活性的蛋白质。这些蛋白质的分 子量可以不同,其组分肽链分子量至少有30kDa或更大,优选的大约50kDa 或更大。

本发明的辅助蛋白质分子量可以不同,至少大约15kDa或更大,优选的 大约20kDa或更大,更优选的大约30kDa或更大。辅助蛋白质自身可能有组 分多肽链。

杀虫蛋白质和辅助蛋白质也可能是多亚基的杀虫蛋白质的组分。这样一 个包含辅助蛋白质作为其一个或多个组分多肽的杀虫蛋白质分子量可以不 同,分子量为至少50kDa到至少200kDa,优选的大约100kDa到150kDa。

辅助蛋白质可用于和本发明的杀虫蛋白质结合以增强活性或激活杀虫蛋 白质。为确定辅助蛋白质是否影响活性,杀虫蛋白质可单独表达和与辅助蛋 白质一起表达,在饲喂测定杀虫活性时比较它们各自的活性。

检测菌株自身和它与辅助蛋白质结合后的活性,对于筛选有潜在杀虫活 性的菌株是有益的。在某些情况下,辅助蛋白质与菌株的天然蛋白质结合产 生杀虫活性,而在缺乏辅助蛋白质时没有检测到活性。

如上所述,辅助蛋白质可以通过本领域已知的各种方法修饰,因此,本 发明所用的术语“营养杀虫蛋白质”(VIP)包含那些在营养生长期间产生的 单独或结合使用有杀虫活性的蛋白质。这种蛋白质包括杀虫蛋白质、辅助蛋 白质和那些仅仅在辅助蛋白质存在时显示活性的蛋白质或这些蛋白质的多 肽组分。

已经认识到用其它方法可获得这些蛋白质的核苷酸与氨基酸序列。例 如,要获得编码杀虫蛋白质的核苷酸序列,表达杀虫蛋白质的粘粒克隆可从 基因文库中分离到。小的亚克隆可从较大的活性粘粒克隆中制得并测其活 性。用这种方法,可以测定表达活性杀虫蛋白质的克隆的序列以确定基因的 核苷酸序列。然后,可以推导出组成蛋白质的氨基酸序列。对于一般的分子 技术,参见例如,分子克隆实验室手册,第二版,第1-3卷,Sambrook等(eds.) 冷泉港实验室出版社,冷泉港,NY(1989)以及其中引用的参考文献。

本发明也包括得自有机体而不是芽孢杆菌的核苷酸序列,其中核苷酸序 列可通过本发明的芽孢杆菌核苷酸序列杂交来分离。测定此核苷酸序列编码 的蛋白质的杀虫活性。本发明也包括由此核苷酸序列编码的蛋白质。而且, 本发明包括从有机体而不是芽孢杆菌获得的蛋白质,其中蛋白质可与抗本发 明蛋白质的抗体发生交叉反应。同样,分离到的蛋白质可使用本文或其它本 领域中众所周知的方法测定其杀虫活性。

编码本发明的杀虫蛋白质的核苷酸序列分离后,它们可以被操纵并用来 在许多宿主如其它有机体(包含微生物和植物)中表达蛋白质。

可以优化本发明的杀虫基因以增强其在植物中的表达。参见,例如EP- A 0618976;EP-A 0359472;EP-A 0385962;WO 91/16432;Perlak等 (1991), 美国科学院学报(Proc.Natl.Acad.Sci.USA)88:3324-3328;Murray 等(1989), 核酸研究17:477-498。用这种方法,利用植物的最优密码子可 以合成基因。对于一个特定的宿主来说,最优密码子是编码宿主氨基酸频率 最高的单个密码子,例如对于特定氨基酸的玉米最优密码子可以从玉米的已 知基因序列中推导出。对于玉米的28个基因的玉米密码子的使用可在 Murray等,(1989), 核酸研究17:477 498中找到,本文一并参考。合成 的基因也可以基于特定宿主对特定的氨基酸使用的密码子的分布制得。

用这种方法,可以优化核苷酸序列以适合在任何植物中表达。已经认识 到可以优化或合成所用或任何一部分基因序列,也就是说,合成的或部分优 化的序列也可以使用。

以同样的方法,核苷酸序列也可以优化以适于在任何微生物中表达。对 于芽孢杆菌,最优密码子使用参见如美国专利号No.5,024,837和Johansen 等,(1988) 基因65:293-304。

植物表达盒的构建和外源DNA导入植物的方法在本领域中已有叙述。此 表达盒可能包含原体,终止子,增强子,前导序列,内含子以及其它可操作 地连结到杀虫蛋白质编码序列的其它调节序列。进一步认识到VIP基因的启 动子或终止子能在表达盒中使用。

通常,为把外源DNA导入植物,可以使用Ti质粒载体传送外源DNA,也 可以用直接DNA吸收,脂质体,电穿孔,微注射,以及使用微粒。这些方 法在本领域都已发表。参见,例如,Guerche等,(1987) 植物科学 52:111-116;Neuhause等,(1987) 理论与应用遗传( Theor.Appl.Genet.) 75:30-36;Klein等,(1987) 自然327:70-73;Howell等,(1980) 科学208: 1265;Horsch等,(1985) 科学227:1229-1231;DeBlock等,(1989) 植 物生理91:694-701; 植物分子生物学方法Weissbach和Weissbach,eds.) 学术出版社,(1988); 植物分子生物学方法Schuler和Zielinski,eds.)学术 出版社,(1989)。也参见美国专利申请号08/008,374,本文一并参考。也 参见EP-A 0193259和EP-A 0451878。可以理解,转化的方法取决于被转化 的植物细胞。

已经进一步认识到,可以修饰表达盒的组分以增强表达。例如,可以用 截短序列,核苷酸替代或其它修饰。参见,例如,Perlak et(1991) 美国科 学院学报88:3324-3328;Murray等,(1989) 核酸研究17:477-498;和 WO 91 16432。

构建体也可以包含任何可操作地连结到核苷酸序列必须的调节子如终止 子,(Guerineau等,(1991), 分子基因遗传226:141-144;Proudfoot, (1991), 细胞64:671-674;Sanfacon等,(1991), Genes Dev.,5:141-149; Mogen等(1990), 植物细胞,2:1261-1272;Munroe等,(1990), 基因,91: 151-158;Ballas等,(1989), 核酸研究,17:7891-7903;Joshi等,(1987), 核酸研究,15:9627-9639);植物翻译共用序列(Joshi,C.P.,(1987), 核酸 研究,15:6643-6653),内含子(Luehrsen和Walbot,(1991), 分子基因遗 传,225:81-93)等等。在表达盒构建体中包含5′前导序列将是有益的。此 前导序列可以起作用以增强翻译。

在本领域中已知的翻译前导序列包含:

小RNA病毒前导序列,例如,EMCV前导序列(脑心肌炎病毒5′非编码 区)(Elroy-Stein,O.,Fuerst,T.R.,和Moss,B.(1989) 美国国家科学 院进展86:6126-6130);

马铃薯Y病毒组前导序列,如TEV前导序列(Tobacco Etch Virus)(Allison 等,(1986);MDMV前导序列(玉米矮缩花叶病毒); 病毒学,154:9-20);

人类免疫球蛋白质重链结合蛋白质(BiP),Macejak,D.G.和Sarnow,P., (1991), 自然,353:90-94;

苜蓿花叶病毒的外壳蛋白质mRNA的不翻译前导序列(AMV RNA4), (Jobling,S.A.,和Ge小时ke,L.,(1987), 自然,325:622-625; 烟草花叶病毒前导序列(TMV),(Gallie,D.R.等,(1989), RNA分子生 物学,第237-256页;Maize chlorotic mottle Virus病毒前导序列(MCMV) (Lommel,S.A.等,(1991), 病毒学,81:382-385。也参见Della-Cioppa等, (1987), 植物生理,84:965-968。

植物终止子可在表达盒内使用。参见,Rosenberg等,(1987), 基因,56: 125;Guerineau等,(1991), 分子基因遗传,226:141-144;Proudfoot等, (1991), 细胞,64:671-674;Sanfacon等,(1991), Genes Dev.,5:141- 149;Mogen等,(1990), 植物细胞,2:1261-1272;Munroe等,(1990), 基因91:151-158;Ballas等,(1989), 核酸研究,17:7891-7903;Joshi 等,(1987), 核酸研究,15:9627-9639.

为了组织特异性表达,本发明的核苷酸序列能可操作地连结到组织特异 性启动子上。参见,例如,EP-A 0618976,本文一并参考。

也包括在本发明的范围之内的是转基因植物,尤其是通过前面叙述的步 骤转化的转基因丰产植物以及它们的包含并最好也表达按照本发明的杀虫 蛋白质无性和/或有性后代,尤其优选的是杂种植物。

按照本发明的转基因植物可以是双子叶植物或单子叶植物。优选的是禾 本科的单子叶植物,包含:黑麦草属,玉蜀黍属,小麦属,Triticale,蜀黍 属,甘蔗属,雀麦属,稻属,燕麦属,大麦属,黑麦属和狗尾草属植物。

尤其优选的是转基因玉米,小麦,大麦,高粱,黑麦,燕麦,草坪草和 水稻。

双子叶植物中尤其优选的是大豆,棉花,烟草,甜菜,油子油菜和向日 葵。

表达“后代”可理解为包含“无性”和“有性”产生的转基因植物的后 代。这个定义也意味着包含通过已知的方法如细胞融合、突变选择获得的突 变体与变异体,它们仍能表现出最初被转化的亲本植物的独特的特性,这个 定义还包含所有转化植物材料的杂交和融合产物。

本发明的另一个目的涉及转基因植物的繁殖材料。

与本发明有关的转基因植物的繁殖材料定义为可在体内或体外有性或无 性繁殖的任何植物材料。在本发明的范围之内尤其优选的是原生质体,细 胞,愈伤组织,组织,器官,种子,胚胎,花粉,卵细胞,合子,以及其它 可从转基因植物获得的任何繁殖材料。

起源于曾通过本发明转化的转基因植物或它们的后代因而至少包含转基 因细胞的一部分的植物体部分(如花,茎,果实,叶,根),也是本发明的 目标。

植物繁殖材料(果实,茎,谷粒,种子)尤其是种子作为商业性产 品出售之前,通常用保护性包衣剂处理。包衣剂包含:除草剂,杀虫剂,杀 真菌剂,杀细菌剂,杀线虫剂,杀软体动物剂或这些制剂的混合物,如果需 要的话,还可加入载体,表面活性剂或施用促进辅剂(application-promoting adjuvants),以防止由细菌,真菌或有害动物引起的破坏。

为了处理种子,保护性包衣剂可以以液体制剂浸渗块茎或谷粒的方式用 于种子,或者用结合的湿或干制剂给种子包衣。另外,在特定的情况下,对 植物施用的其它方法也是可能的,如直接处理芽或果实。

按照本发明之植物种子包括含有编码按照本发明之杀虫蛋白质的核苷酸 序列的DNA分子,它也可以用种子保护性包衣剂处理,包衣剂包含种子处 理复合物,如克菌丹,萎锈灵,福美双(IMTDR),methalaxyl(ApronR), 和pirimiphos-methyl(Actellic)和其它在种子处理中常用的药剂。在本发 明的范围之内优选的是包含按照本发明之杀虫组合物单独或与一种种子处 理时常用的种子保护性包衣剂结合的保护性包衣剂。

这样,本发明的另一个目的是为栽培植物提供繁殖材料,尤其是用上文 定义的种子保护性包衣剂处理的植物种子。

已经认识到编码杀虫蛋白质的基因可用于转移昆虫致病有机体。这些有 机体包括杆状病毒,真菌,原生动物,细菌和线虫。

本发明的芽孢杆菌菌株可用于保护农作物及其产品使之免受害虫危害。 另外,编码杀虫剂的基因可通过适当的载体进入微生物宿主体内,该宿主再 被施用到环境或植物或动物上。微生物宿主可以从已知具有一种或多种兴趣 作物的“phytosphere”(phylloplane,phyllosphere,Rhizosphere和/或 rhizoplana)中选择出来。选择这些微生物的目的是使其有能力在特定的环 境中与野生型微生物成功地竞争,能保持稳定并能表达多肽杀虫剂的基因, 并使杀虫剂增强对环境性退化和灭活的抗性。

这些微生物包括细菌,藻类和真菌。其中特别的兴趣微生物如细菌,例 如,假单孢杆菌属,欧文氏杆菌属,克雷白氏杆菌属,黄单孢菌属,链霉菌 属,根瘤菌属,红假单孢杆菌属,Methylius,土壤杆菌属,醋杆菌属,乳 芽孢杆菌属,节杆菌属,固氮杆菌属,明串珠属,产杆菌属;真菌,特别 是酵母如,糖酵母属,隐球酵母属,克鲁维氏酵母属,掷孢酵母属,红酵母 属,和短柄霉属。其中特别的兴趣微生物是这样的phytosphere细菌种类诸 如丁香假单孢杆菌,荧光假单孢杆菌,粘质沙雷氏菌,木质醋杆菌,土壤杆 菌,球形红假单孢杆菌,田野黄单孢菌,苜蓿根瘤菌,真养产碱杆菌, Clavibacter xyli和棕色固氮杆菌;phytosphere酵母种类如深红酵母,胶粘 酵母,海滨酵母,橙黄酵母,浅白隐球酵母,流散酵母,罗仑氏酵母,罗茜 糖酵母,善地酵母,啤酒酵母,红色掷孢酵母,香气酵母,佛地克鲁维氏酵 母和出芽短柄霉。其中特别的兴趣微生物是带色素的微生物。

在能使基因稳定保持并表达的条件下,有很多方法可用于把表达杀虫蛋 白质的基因导入微生物宿主体内。例如,可以构建一个表达盒,它包含感兴 趣的DNA构建体(这种构建体能可操作地与转录和翻译调节信号连结以利 于其表达)和与宿主有机体的序列同源的序列(靠此产生整合)和/或在宿 主体内有功能的复制系统(靠此整合或保持稳定)。

转录和翻译调节信号包括(但不限于)启动子,转录起始位点,操纵子, 激活子,增强子,其它调节分子,核糖体结合位点,起始密码子,终止信号 等,参见如,美国专利号5,039,523;美国专利号4,853,331;EPO 0480762A2; Sambrook等, supra;分子克隆实验室手册,Maniatis等(eds.),冷泉港实 验室,冷泉港,NY(1982);高级细菌遗传学,Davis等,(eds.)冷泉港实验室, 冷泉港,NY(1980);以及其中引用的文献。

在适当的宿主细胞内,当包含杀虫剂的细胞施用到靶昆虫所在的环境中 时,这些细胞将被处理以延长细胞中的毒素活性,适当的宿主细胞包含原核 生物或真核生物,通常被限制在不产生对高等有机体如哺乳动物有毒的物质 的细胞内。然而,如果产生对高等有机体有毒的物质的有机体的毒素不稳定 或施用水平非常低而能避免对宿主有毒的可能时,这种有机体也可以使用。 作为宿主,最感兴趣的是生原核生物和低真核生物,如真菌。作为例证的革 兰氏阴性和革兰氏阳性原核生物,包含肠杆菌科的埃希式杆菌属,欧文氏杆 菌属,志贺氏菌属,沙氏菌属和变形菌属;芽孢杆菌科,根瘤菌科的根瘤 菌属;螺菌科的发光杆菌属,发酵但孢菌属,沙雷氏菌属,气单孢菌属,弧 菌属,脱硫弧菌属,螺菌属,乳芽孢杆菌科,假单孢菌科,如假单孢杆菌属 和醋杆菌属;固氮杆菌科和硝化杆菌科。在真核生物中是真菌,如藻状菌纲 和子囊菌纲,也包含酵母如糖酵母属,裂殖酵母属以及担子菌纲酵母如红酵 母属,短柄霉属,掷孢酵母属等等。

在选择宿主细胞用于生产时特别的兴趣特征包含易于把蛋白质基因导入 宿主体内,表达系统的可利用性,表达效率,蛋白质在宿主体内的稳定性, 以及辅助基因潜能的存在。用作杀虫剂微囊体感兴趣的特征包含对杀虫剂的 保护质量,如厚细胞壁,着色,胞内包装或内含体的形成;叶片亲和力;对 哺乳动物无毒;吸引害虫摄食;易杀死和固定并却不破坏毒素等等,其它考 虑的因素包含易于形成制剂,易于操作,经济,贮存时稳定性等等。

特别的兴趣宿主有机体包含酵母,如红酵母属的一个种,短柄霉属的一 个种以及掷孢酵母属的一个种,phylloplane有机体如假单孢杆菌的一个 种,欧文氏杆菌属的一个种和黄杆菌属的一个种,或其它的有机体如埃希氏 杆菌属乳芽孢杆菌属的一个种,芽孢杆菌属的一个种等等。特异的有机体 包含荧光假单孢杆菌,绿假单孢杆菌,海滨酵母,苏云金芽孢杆菌,大肠 杆菌枯草芽孢杆菌等等。

VIP基因可被导入微生物体内,微生物在植物(附生植物)体内繁殖,把 VIP蛋白质送入潜在的靶害虫。附生植物可以是例举的革兰氏阳性或革兰氏 阴性细菌。

例如,定居性细菌通过本领域已知的方法可以从感兴趣的植物中分离出 来,尤其是,定居性的芽孢杆菌可以从植物根中分离到。(参见,例如,J. Handelsman,S.Raffel,E.Mester,L.Wunderlich和C.Grau, 应用环境微 生物,56:713-718,(1990))。VIP1和/或VIP2和/或VIP3可以通过本领域 的标准方法导入根定居性蜡状芽孢杆菌内。

从蜡状芽孢杆菌菌株AB78中得到的VIP1和/或VIP2使用标准方法借助 于结合可导入根定居性蜡状芽孢杆菌内(J.Gonzalez,B.Brown和 B.Carlton, 美国科学院学报,79:6951-6955,(1982))。

VIP1和/或VIP2和/或VIP3或其它本发明的VIP也可通过电转化法导入 根定居性芽孢杆菌。尤其是,VIP可象在实施例10中所述被克隆到一个穿梭 载体如DHT3101内(D.Lereclus等, FEMS微生物学通信,60:211- 218(1989))。穿梭载体pHT3101包含着编码特定VIP蛋白质的序列,它可通 过电穿孔转化进入根定居性芽孢杆菌。

可以设计表达系统以使VIP蛋白质能分泌到革兰氏阴性细菌入大肠杆菌 的细胞质外,VIP蛋白质分泌的优点为(1)避免在细胞质内表达的VIP蛋白质 的潜在毒性影响,(2)可以增加所表达的VIP蛋白质的水平和(3)有助于VIP 蛋白质的高效纯化。

可以使VIP蛋白质在大肠杆菌中分泌,如通过把一个适当的信号肽融合 到VIP的信号肽的氨基端,或者用大肠杆菌的信号肽取代VIP的信号肽。被 大肠杆菌识别的信号肽可在已知的大肠杆菌分泌蛋白质中发现,如OmpA蛋 白质(J.Ghrayeb,H.Kimura,M.Takahara,Y.Masui和M.Inouye, EMBO 杂志,3:2437-2442(1984))。OmpA是大肠杆菌外膜的主要蛋白质。因而 认为它的信号肽在转化过程中是高效的。OmpA信号肽加工前也不需要修 饰,而其它信号是需要修饰的,如脂蛋白质信号肽(G.Duffaud,P.March 和M.Inouye, 酶学方法,153:492(1987))。

尤其是使用本领域已知的标准方法,可以把单一的BamHI限制位点导入 VIP编码序列的氨基端和羧基端。这些BamHI片段可以符合读框地克隆进载 体pIN-III-ompA1,A2或A3中(J.Ghrayeb,H.Kimura,M.Takahara, H.Hsiung,Y.Masui和M.Inouye, EMBO杂志,3:2437-2442(1984)),进 而创造出ompA:VIP融合基因,它能分泌到周质空间。在pIN-III-ompA的 多接头的其它的限制位点可用本领域中已知的标准方法除去,以使VIP氨基 -端氨基酸的编码序列直接连接在ompA信号肽裂解位点之后。这样,在大肠 杆菌中分泌的VIP序列和天然的VIP序列是一致的。

当VIP天然信号肽不需要成熟蛋白质的适当折叠时,可以除去此信号序 列并用ompA信号序列取代。单一BamHI限制位点可被导入前体蛋白质编码 序列的氨基端(直接在VIP信号肽编码序列之后)和VIP编码序列的羧基端。 然后,可以用上述方法把这些BamHI片段克隆进pIN-III-ompA载体。

在杀虫控制或用基因工程把其它有机体作为杀虫剂中使用本发明菌株的 常用方法在本领域中是已知的。参见,例如,美国专利号5,039,523和EP 0480762A2。

VIP能在细菌宿主内发酵,加工产生的细菌以与苏云金芽孢杆菌菌株 作为杀虫喷洒剂相同的方式用作杀虫喷洒剂。在由芽孢杆菌分泌的VIP的情 况下,分泌信号使用在本领域中已知的方法除去或突变。这样的突变和/或 缺失防止在发酵期间VIP蛋白质分泌进生长培养基。VIP保留在细胞内,然 后细胞被加工以生产胶囊化的VIP。任何适合微生物都能用于这个目的。用 假单胞菌属以胶囊化的蛋白质的形式表达苏云金芽孢杆菌内毒素,加工产生 的细胞并用作杀虫剂喷洒(H.Gaertner等.1993,高级工程杀虫剂,L.Kim ed.)。

用这种方式可利用苏云金芽孢杆菌的各种菌株。这样的Bt菌株产生内毒 素蛋白质以及VIP。此外,这样的菌株仅仅产生VIP。枯草芽孢杆菌的孢子 形成缺失菌株能产生高水平的苏云金芽孢杆菌之CryIIIA内毒素(Agaisse, H.和Lereclus,D.,″苏云金芽孢杆菌CryIIIA毒素基因在B.subtilis中的表达 不是依赖于孢子形成特异性的西格马因子并在spoOA突变体内增长″, 细菌 学杂志.,176:4734-4741(1994))。一种相似的spoOA突变体可是在苏云金 芽孢杆菌中的制备,并用于生产不是被分泌进培养基而是保留在细胞内的胶 囊化VIP。

为使VIP保留在芽孢杆菌属细胞内,可以除去信号肽以使它不再有分泌 信号的功能。尤其是推定的VIP1信号肽包括在这个序列C-末端部分有推定 的共用裂解位点Ala-X-Ala的蛋白质开始的31个氨基酸(G.Von Heijne, 分子 生物学杂志。184:99-105(1989))。推定的VIP2信号肽在Ala40后有推定的裂 解位点的蛋白质的前40个氨基酸。无论在VIP1还是VIP2裂解位点可用本领 域中已知的方法突变,再用不被信号肽酶识别的氨基酸取代裂解位点共用序 列。

另外,VIP1,VIP2和/或本发明的其它VIP信号肽可从序列中除去。因而 使它们作为分泌蛋白质在芽孢杆菌中是不可识别的。尤其是,使用本领域已 知的方法,可用基因工程把蛋氨酸起始位点导入到VIP前体蛋白质序列的前 面部分,在Asp32起始,或导入到VIP2前体蛋白质的前面部分,在Glu41起 始。

VIP基因可导入微生物,微生物在植物(附生植物)中繁殖把VIP蛋白质运 送给潜在的靶害虫。附生植物可以是革兰氏阳性或革兰氏阴性细菌。

本发明的在遗传上改变以包含杀虫基因或蛋白质的芽孢杆菌菌株和微生 物可用于保护农作物及其产品使之免受害虫危害。在本发明的一个方面,完 整的(即未水解的)产生毒素(杀虫剂)的有机体细胞施用到靶昆虫的环境中 时,可用延长在细胞内生成的毒素活性的试剂处理。

另外,杀虫剂可通过把异源基因导入单细胞宿主产生。异源基因的表达 直接或间接地导致杀虫剂细胞内生产和保持。然后在细胞施用到靶害虫的环 境中时能延长细胞内生成的毒素活性的条件下处理细胞。生成的产物保留了 毒素的毒性,这些天然胶囊化的杀虫剂可与传统技术结合形成制剂,可施用 到寄生靶昆虫的环境如土壤,水,以及植物叶片。参见,例如,EPA 0192319 以及其中引用的参考文献。

本发明的有效成分通常以组合物的形式施用,可以施用到作物或被处理 的植物上,可与其它复合物同时或先后使用,这些复合物可以是肥料或微量 营养供体或影响植物生长的其它制剂,它们也可以是选择性除草剂,杀虫 剂,杀真菌剂,杀细菌剂,杀线虫剂,杀软体动物剂或这些制剂中的几种的 混合物,如果需要,还可与农业上可接受的载体,表面活性剂或施用促进辅 剂混合。适合的载体可以是固体或液体以及相应的常在制剂中使用的物质如 天然的或再生的矿物质,溶剂,分散剂,湿润剂,胶粘剂,粘合剂或肥料。

施用本发明的活性成分或包含至少一种有本发明的菌株产生的杀虫蛋白 质的农化组合物的最优方法是叶面施用,种子包衣和土壤施用。施用的数量 和比率(rate)取决于相应害虫的侵害程度。

因此,本发明还提供一种杀虫组合物,该组合物包含作为活性成分的至 少一种按照本发明的新昆虫特异性蛋白质和/或重组微生物以及农业辅剂如 载体,稀释剂,表面活性剂或施用促进辅剂,其中微生物含有至少一种包含 编码重组形式的新昆虫特异性蛋白质的核苷酸序列的DNA分子,但尤其是 包含至少一种含有编码重组形式的新昆虫特异性蛋白质的核苷酸序列之 DNA分子的重组的芽孢杆菌属几个种的菌株如蜡状芽孢杆菌或苏云金芽孢 杆菌,或者它们的衍生物或突变体。组合物还可包含生物活性复合物。该复 合物可以是肥料或微量营养供体或影响植物生长的其它制剂,它们也可以是 选择性除草剂,杀虫剂,杀真菌剂,杀细菌剂,杀线虫剂,杀软体动物剂或 这些制剂中的几种的混合物,如果需要,还可加入农业上可接受的载体,表 面活性剂或常在制剂领域中使用的施用促进辅剂混合。适合的载体可以是固 体或液体以及相应的常在制剂中使用的物质如天然的或再生的矿物质,溶 剂,分散剂,湿润剂,胶粘剂,粘合剂或肥料。

组合物可以包含重量为0.1%至99%的活性成分,重量为1%至99.9%固 体或液体辅剂,和重量为0到25%的表面活性剂。活性成分包含至少一种按 照本发明的新昆虫特异性蛋白质或重组微生物,该微生物包含至少一种编码 重组形式的新昆虫特异性蛋白质之核苷酸序列的DNA分子,但尤其是包含 至少一种包含编码重组形式的新昆虫特异性蛋白质的核苷酸序列的DNA分 子的重组的芽孢杆菌属几个种的菌株如蜡状芽孢杆菌或苏云金芽孢杆菌,或 者它们的衍生物或突变体。活性成分或者包含该活性成分的组合物可以和其 它不损失杀虫效力的杀虫剂或化学物质(1993农作物保护化学药品参考, 化学与药学出版社,加拿大)一起施用到被保护的植物和作物上。它与大多 数常用的农业喷洒物质相容,但不应在极端碱性的喷洒溶液中使用。它也可 以以粉剂,悬浮液,可湿性粉剂或其它任何适合农业施用的物质形态使用。

本发明还提供通过对(A)虫害发生的环境,(B)植物或植物体的一部分(防 止该植物或植物部分受到害虫引起的破坏)或(C)种子(为保护从该种子发 育来的植物不受虫害引起的破坏)使用包含至少一种按照本发明的新昆虫特 异性蛋白质和包含至少一种包含编码重组形式的新昆虫特异性蛋白质的核 苷酸序列的DNA分子的活性成分或包含该活性成分的组合物来控制或抑制 害虫的方法。

应用于植保领域的更优方法是施用到植物叶片上(叶面施用),使用的 数量和比率取决于被保护的植物和正被谈论的害虫成灾的危害性。然而,如 果植物所在地点用用液体制剂灌注,或者活性成分以固体形式掺入植物所在 地点如以粒子形式进入土壤(土壤施用),活性成分也能通过根系进入植物 (内吸作用)。在稻谷作物中,这种粒子可以定量地施用到水淹的农田里。

按照本发明的组合物也适合保护植物繁殖材料,如种子(象果实,块茎 或谷粒)或植物插条免受虫害危害。繁殖材料在种植前可用制剂处理,如种 子播前包衣,本发明的活性成分也可应用到谷粒(包衣)或者用液体制剂浸 谷粒,或者用固体制剂包被谷粒。繁殖材料播种时,制剂也可施用到种植位 点,如播种时施用到播种沟中。本发明也涉及这些处理植物繁殖材料的方 法以及被处理的植物繁殖材料。

按照本发明的组合物包含作为活性成分的重组微生物,它包含至少一种 重组形式的新毒素基因,但尤其是芽孢杆菌属几个种菌株的重组体(如蜡状 芽孢杆菌或苏云金芽孢杆菌的菌株,它们包含至少一种包含编码重组形式的 新昆虫特异性蛋白质的核苷酸序列的DNA分子)或其衍生物或突变体。该 组合物可以以任何已知的用细菌菌株进行种子或土壤处理的方式施用。参 见,例如,美国专利N0.4,863,866。即使微生物不再存活,菌株对于生物 控制也是有效的,然而优选的是活着的微生物的施用。

在本发明的范围之内保护的目标农作物包含如下种类:

谷物(小麦,大麦,黑麦,燕麦,水稻,高粱以及有关的农作物),甜菜(糖 用甜菜和饲料甜菜),草坪草(果园草(orchardgrass),羊茅等),核果, 梨果与软果(soft fruit)(苹果,梨,梅,桃,杏,樱桃,草莓,木莓和黑 莓),豆科植物(蚕豆,小扁豆,豌豆,大豆),油料植物(油菜,芥,罂粟, 橄榄,向日葵,椰子,蓖麻,可可豆,花生),黄瓜植物(黄瓜,南瓜,甜瓜), 纤维植物(棉花,亚麻,大麻,黄麻),柑桔(桔,柠檬,葡萄,柑橘),蔬菜 (菠菜,莴苣,芦笋,甘蓝以及其它白菜属蔬菜,洋葱,番茄,土豆,红辣 椒),樟科植物(鳄梨,胡萝卜,樟,樟脑),落叶树和针叶树(如椴树,紫杉, 橡树,桤木,杨,白桦,冷杉,落叶松,松),或者如玉米,烟草,坚果树 类,咖啡,甘蔗,茶,藤本植物,忽布,香蕉和天然橡胶植物以及装饰品(包 括合成物)。

包含至少一种包含编码重组形式的新昆虫特异性蛋白质之核苷酸序列的 DNA分子重组体的芽孢杆菌属的几个种的菌株,如蜡状芽孢杆菌或苏云金 芽孢杆菌菌株,通常以杀虫组合物的形式施用,可用于作物或被保护的植 物,还可与生物活性复合物同时施用或先后施用。这些复合物可以是肥料或 微量营养供体或影响植物生长的其它制剂,它们也可以是选择性除草剂,杀 虫剂,杀真菌剂,杀细菌剂,杀线虫剂,杀软体动物剂或这些制剂中的几种 的混合物,如果需要,还可还加入农业上可接受的载体,表面活性剂或常在 制剂领域中使用的施用促进辅剂。

按照本发明的活性成分可以以非修饰的形式或与其它适合的农业上可接 受的载体一起使用。这些载体是通常在农业制剂领域中使用是辅助剂,因而 制剂以已知的方式形成可乳化的浓缩物,可包衣的浆状物,直接喷洒或可稀 释的溶液,稀释的乳剂,可湿性粉剂,可溶性粉剂,粉剂,粒剂也可以是胶 丸如聚合物。根据组合物的特性,施用方式如喷洒、喷雾、喷粉、散布 (scattering)或灌注(pouring)可根据意定的目标和流行的环境选择。施 用的最佳比率通常为每公顷(“ha”,大约2.471英亩)大约50克至大约5k 克活性成分(a.i.),优选的是大约100克至2kg a.i./ha和200g至500g a.i./ha。

种子包衣的较好的施用比率是每100kg种子0.5k到100kg a.i.,优选的是每 100kg种子3克至100克或每100kg种子10g至50g a.i.。

适当的载体和辅剂可以是固体或液体和通常在制剂中使用的相应物质。 如天然的或再生的矿物质,溶剂,分散剂,润湿剂,胶粘剂,粘合剂或者肥 料。制剂(即包含至少一种包含编码重组形式的昆虫特异性蛋白质之核苷 酸序列的DNA分子的重组芽孢杆菌属几个种的菌株,如蜡状芽孢杆菌和苏 云金芽孢杆菌作为活性成分或与其它活性成分结合,并在适当时加入固体或 液体的辅剂的杀虫组合物,制品或混合物)以已知的方法制备。例如,通过 均匀混合和/或用伸展剂(extender)如溶剂,固体载体,在某些情况下是表 面活性复合物(表面活性剂)磨碎活性成分。

适合溶剂有:芳香,优选的是包含8至12碳原子的片断(如二甲苯混合 物,),邻苯二酸盐(如邻苯二甲酸二正丁酯或双(2-乙基己基)酞酯), 脂族烃(如环己烷或石蜡,醇和乙二醇以及它们的醚和酯,如乙醇,乙二醇 单甲醚或单苯醚),(如环己酮),强极性溶剂(如N-2-吡咯烷酮,二甲 基亚砜或二甲基甲酰胺),以及植物油或环氧化植物油如环氧化椰子油或大 豆油或水。

在粉剂和可扩散性粉剂中使用的固体载体是通常的天然矿物填料如方解 石,滑石,高岭土,蒙脱石或绿坡缕石。为了提高物理特性,也可能加入高 扩散性酸或高扩散性的吸收多聚物。适合的粒状吸附载体是多孔型的,如 浮石,碎砖,海泡石或皂土;适合非吸附性载体是如方解石或沙子的材料。 此外,也可以使用许多预先粒子化的无机或有机材料,如特别的白云石或磨 碎的植物残余物。

依靠制剂的活性成分的特性,合适的表面活性复合物可以是能较好乳 化、扩散和湿润特性的非离子、阳离子和/或阴离子表面活性剂。术语“表 面活性剂”也可以理解为表面活性剂组成的混合物,适合的阴离子表面活性 剂可以是水溶性皂和水溶性合成表面活性复合物。适合的皂是碱金属盐,碱 土金属盐,或高级脂肪酸(C10-C12)的未取代的或取代的铵盐,如油酸或 硬脂酸的钠盐或盐,或可从椰子油或牛脂油获得的天然脂肪酸混合物的钾 盐或钠盐。也适合的表面活性剂还有脂肪酸甲基磺酸盐以及修饰或非修饰的 硫酸酯。

然而更常使用的是所谓的合成表面活性剂,特别是脂肪磺酸盐,脂肪硫 酸盐,磺基化的苯并咪唑衍生物或烷基芳基磺酸盐,脂肪磺酸盐,脂肪硫酸 盐通常是碱金属盐、碱土金属盐、取代或未取代铵盐的形式,并且通常包括 C8-C22烷基基团(它也包含烷基基团的烷基部分),例如,木质素磺酸、 十二烷基磺酸或从天然脂肪酸得到的脂肪醇硫酸盐混合物的钠盐或盐。此 复合物也包括脂肪醇/环氧乙烷加成形成的硫酸酯和磺酸酯的盐。磺基化的 苯并咪唑衍生物优选地包括2个磺酸基团和一个包括大约8到22个碳原子的 脂肪酸基团。烷基芳基磺酸盐的例子是是十二烷基苯磺酸、二丁基萘磺酸或 萘磺酸/甲的钠盐,钙盐或三乙醇胺盐的浓缩产物。也适合的是相应的磷 酸盐,如p壬基酚和4-14mol的环氧乙烷加成形成的磷酸三乙酯的盐。

非离子表面活性剂是优选的是脂族或环脂醇或饱和或不饱和脂肪酸和烷 基酚的聚乙二醇醚的衍生物。该衍生物包括3到30个乙二醇醚基团和在烃(脂 族)部分的8到20个碳原子以及在烷基酚中的烷基部分的6到18个碳原子。

适合的非离子表面活性剂还有水溶性的聚环氧乙烷和聚丙二醇、乙二胺 聚丙二醇以及在烷基链包含1到10个碳原子的烷基聚丙二醇的加成产物,该 产物包括20到250个乙二醇醚基团和10到100个丙二醇醚基团。此化合物通 常每个丙二醇单元包含1至5个乙二醇单元。非离子表面活性剂的代表例子是 壬基酚聚乙氧基乙醇,蓖麻油聚乙二醇醚,聚丙烯/环氧乙烷加成物,三丁 基苯氧基聚乙氧基乙醇,聚乙烯乙二醇和辛基苯氧基聚乙氧基乙醇。聚氧 乙烯脱水山梨糖醇的脂肪酸酯如聚氧乙烯脱水山梨糖醇三油酸盐也是适合 非离子表面活性剂。

阳离子表面活性剂优选地是季铵盐,包含作为N-取代基的至少C8-C22 烷基基团,取代基还有低级未取代的或卤化烷基,苯基或低级烃烷基基团。 优选的是以卤化物,甲基硫酸盐或乙基硫酸盐的形式存在的盐,如硬脂酰三 甲基氯化铵或苄基二(2-氯乙基)溴化乙胺。

在制剂领域常用的表面活性剂已有叙述,如“McCutcheon′s洗涤剂和乳 化剂年鉴”,MC出版公司。Ridgewood,NJ.,1979;Dr.Helmut Stache, “Tensid Taschenbuch”(表面活性剂手册),Carl Hanser Verlag,慕尼黑/ 维也纳。

本发明的杀虫组合物的另一个特别优选的特征是施用到植物或土壤后 有效成分的持续性。失去活性的可能原因包含:被紫外光、热、叶片分泌物 和pH值灭活。例如,在高pH值下,特别是有还原剂存在时,δ-内毒素晶体 可溶解并变得易于水解灭活。高的叶片pH值可能也是重要的,特别是叶片 表面的pH值能达到8-10的范围时。本发明的杀虫组合物可以通过加入附加 剂以协助防止活性成分失去,或以活性成分受保护免于灭活的方法如用胶囊 包被材料解决这些问题。胶囊化可以化学完成(McGuire和Shasha,J Econ Entomol 85:1425-1433,1992)或生物完成(Barnes和Cum分钟gs,1986; EP-A 0 192 319)。化学胶囊化参与了活性成分用多聚物包被的加工,而生 物胶囊化参与了δ-内毒素在微生物中的表达。对于生物胶囊化,包含至少 含有编码重组形式的新昆虫特异性蛋白质之核苷酸序列的DNA分子的完整 微生物在制剂中用作活性成分。紫外线保护剂的加入可以有效地减少放射破 坏。由于热的灭活也可以通过包含一个适当的附加物来控制。

本申请内优选的制剂是包含微生物作为活性成分的制剂,其中活性成分 是营养细胞的形式或者更优选的的是以孢子形式(如果能得到的话)。例如, 适合的制剂可能由与多价阳离子形成交联并包含这些微生物的多聚物凝 胶,如在由D.R.Fravel等编著的植物病理学,75卷,No.7,774-777,1985 中有藻酸盐作为多聚物材料的叙述。从这本出版物中还知道:载体物质可 以共用(co-use)。通常制剂通过混合天然产生的或合成的凝胶形式的多聚 物如藻酸盐和多价金属离子盐的水溶液来制得。这样形成了单个小滴,这种 单滴使微生物悬浮在任一种或两种的反应溶液中成为可能。凝胶形成以小滴 的混合开始,这些凝胶离子的随后干燥是可能的。这种方法称为ionotropic 凝胶化。依据干燥的程度,形成了结构上通过多价阳离子交联并包含微生物 和表现出均匀分布的载体的多聚物的致密、坚硬的粒子。粒子的大小可达 5mm。

在EP-A1-0097571中叙述了基于部分交联的多糖加上如微生物并包含精 细分离的硅酸作为载体材料可通过如Ca++离子发生交联的组合物。组合物 的水活性不大于0.3。W.J.Cornick等在一篇综述文章[生物控制新方向:抑 制农业病虫害的替代,345-372页,Alan R.Liss,Inc.(1990)]中叙述了各种 制剂系统、用蛭石作为载体离子化以及通过在前面提到的ionotropic凝胶化 制备的致密藻酸盐小珠。

D.R.Fravel在《杀虫剂制剂和施用系统)》(11卷,ASTM STP 1112美 国检验和材料学会,费城,1992,173至179页)中也提到过这样的组合物, 它可用于制造按照本发明的重组微生物的制剂。

本发明的杀虫组合物通常包含大约0.1%至大约99%,优选的是大约 0.1%至大约95%,更优的是大约3%至大约90%的活性成分;从大约1%至 大约99.9%,优选的大约1%至大约99%,更优的是大约5%至大约95%的固 体或液体辅剂;以及从O至大约25%,优选的是大约0.1%至大约25%,更 优的从大约0.1%至大约20%的表面活性剂。

在本发明一个优选的实施方案中,杀虫组合物通常包含0.1%至99%,优 选的是0.1%至95%重组的包含至少一种包含编码重组形式的新昆虫特异性 蛋白质的核苷酸序列的DNA分子的芽孢杆菌属的几个种的菌株,如蜡状芽 孢杆菌或苏云金芽孢杆菌菌株,或者它与其它活性成分(1%至99%的固体 或液体辅剂以及0至25%优选的是0.1%至20%的表面活性剂)的结合物。

但是,商业性产品最好以浓缩物制成制剂,最终用户通常使用实质上更 低浓度的稀释制剂。杀虫组合物也可以包含更多的成分,如稳定剂,消泡剂, 粘度调节剂,粘合剂,胶粘剂以及肥料或其它活性成分。

在本发明的一个实施方案中,分离到一种蜡状芽孢杆菌微生物,它能杀 死玉米根叶甲和长角叶甲,新的蜡状芽孢杆菌菌株AB78保藏于农业研究机 构保藏中心(NRRL)北方地区研究中心(美国,伊利诺斯州61604,彼奥 利亚,北大学街1815号),保藏号为NRRL B-21058。

片断蛋白质可从蜡状芽孢杆菌菌株中实质纯化出来。蛋白质纯度可用 SDS-PAGE和生物活性检验。蛋白质分子量为大约60至大约100kDa,特别 是大约70至大约90kDa,更特别的是大约80kDa,即下文的VIP。

氨基末端序列分析表明N-端氨基酸的序列是:

NH2-Lys-Arg-Glu-Ile-Asp-Glu-Asp-Thr-Asp-Thr-Asx-Gly-Asp-Ser- Ile-Pro-(SEQ ID NO:8),其中Asx代表Asp或Asn。全部的氨基酸序列由SEQ ID NO:7给出。编码SEQ ID NO:7中的氨基酸的DNA序列由SEQ ID NO: 6给出。

可生成一段对编码NH2-末端3-9个氨基酸的基因区域的寡核苷酸探针。 探针合成基于苏云金芽孢杆菌(Bt)δ-内毒素基因的密码子使用。用于 Southern杂交的寡核苷酸探针的核苷酸序列如下:

5-GAA ATT GAT CAA GAT ACN GAT-3(SEQ ID NO:9)

其中N代表任何碱基。

此外,这里所述的Bc AB78 VIP1基因的DNA探针,可用于筛选任何芽孢 杆菌属菌株或其它有机体以确定VIP1基因(或有关的基因)是否天然存在, 或特定的转化有机体是否包含VIP1基因。

现在,全面叙述了本发明,通过参考下面的详细的实施例将更好地理解 本发明。实施例用于例证,除非特别指出,它不能被认为是对本发明的限定。

基于包含在本发明中的蛋白质序列的一致性,发展了标准的命名法。下 面详细的实施例中的基因和蛋白质名和使用在专利申请[美国申请号 31594/08]中的名字的关系如下:   基因/蛋白质   按标准命   名法的名称 基因/蛋白质 本专利中的 名称     蛋白质描述   VIP1A(a)     VIP1     得自菌株AB78的EQ ID NO:5给出的     VIP1   VIP2A(b)     VIP2     得自菌株AB78的SEQ ID NO:2给出的     VIP2   VIP1A(a)     VIP1     同系物     得自苏云金芽孢杆菌变种tenebrioni的     SEQ ID NO:21给出的VPI1   VIP2A(b)     VIP2     同系物     得自苏云金芽孢杆菌变tenebrionis的SEQ     ID NO:20给出的VIP2   VIP3A(a)     --     得自AB88菌株的在本申请的SEQ ID     NO:20中给出的VIP   VIP3A(b)     --     得自AB424菌株的在本申请的SEQ ID     NO:31中给出的VIP

                            实验

制剂实施例

在下列制剂实施例中使用的活性成分是保藏号为NRRL B-21058的蜡状 芽孢杆菌菌株;保藏号为NRRL B-21060,NRRL B-21224,NRRL B- 21225,NRRL B-21226,NRRL B-21227以及NRRL B-21439的苏云金芽 孢杆菌菌株;和保藏号为NRRL B-21228,NRRL B-2 1229以及NRRL R-21230 的芽孢杆菌属几个种的菌株。所有提到的菌株是包含按照本发明的昆虫特 异性蛋白质的天然分离的菌株。

另外,分离到的昆虫特异性蛋白质单独或与上述的芽孢杆菌属菌株组合 用作活性成分。

A1.  可湿性粉剂     a)   b)   c)     苏云金芽孢杆菌孢子     木质素磺酸钠     十二烷基磺酸钠     二异丁基萘磺酸钠     辛基酚聚乙二醇醚     (7-8moles环氧乙烷)     高扩散性硅酸     高岭土     25%     5%     3%     --     --       5%     62%   50%   5%   --   6%   2%     10%   27%   75%   --   5%   10%   --     10%   ---

孢子完全与辅剂混合,混合物在适当的碾磨机上完全磨碎,产生的可湿 性粉剂可用水溶解生成合乎需要的浓度的悬浮液。

A2.  可乳化浓缩物

苏云金芽孢杆菌孢子                                  10%

辛基酚聚乙二醇醚(4-5moles环氧乙烷)                  3%

十二烷基苯磺酸钙                                    3%

蓖麻油聚乙二醇醚(36moles环氧乙烷)                   4%

环己酮                                              30%

二甲苯混合物                                        50%

任何所需浓度的乳浊液都可通过用水稀释此浓缩物来获得。

A3.  粉剂     a)   b) 苏云金芽孢杆菌孢子 滑石 高岭土     5%     95%     --   8%   --   92%

准备使用的粉剂可通过把活性成分与载体混合并在适当的碾磨机上磨碎 混合物获得。

A4.  挤压粒剂(Extruder Granulate)

苏云金芽孢杆菌孢子                10%

木质素磺酸钠                      2%

羧甲基纤维素                      1%

高岭土                            87%

混合活性成分或结合物,用辅剂磨碎,然后混合物用水湿润。挤压混合 物,粒化,在流动空气中干燥。

A5.  包衣颗粒

苏云金芽孢杆菌孢子                3%

聚乙二醇(mol wt 200)              3%

高岭土                            94%

活性成分或结合物和用聚乙烯乙二醇湿润的高岭土在混合机中均匀混 合。这种方法可获得非粉性包衣颗粒。

A6.  悬浮浓缩液

苏云金芽孢杆菌孢子                    40%

乙二醇                                10%

壬基酚聚乙二醇醚(15moles环氧乙烷)     6%

木质素磺酸钠                          10%

羧甲基纤维素                          1%

37%甲醛水溶液                        0.2%

75%水溶液形式的硅酮油                0.8%

水                                    32%

活性成分或结合物与辅剂密切混合,产生悬浮浓缩物。从中任何所需浓 度的悬浮液可以用水稀释得到。

实施例1.AB78的分离和特征确定

在实验室中蜡状芽孢杆菌菌株AB78在T3培养基上(每升:3克胰胨,2克 胰蛋白质际,1.5克酵母抽提物,0.05M磷酸钠(pH6.8),以及0.005克MnCl2; Travers,R.S.1983)作为平板污染物来分离。在对数生长阶段,AB78产生 明显对玉米根叶甲的活性。抗革兰氏阳性芽孢杆菌属的几个种的抗体活性液 被证明。

                表12

        AB78培养物上清液抗体活性   测试细菌     AB78     链霉素   大肠杆菌   巨大芽孢杆菌   蕈状芽孢杆菌   蜡状芽孢杆菌CB   蜡状芽孢杆菌11950   蜡状芽孢杆菌14579     0.0     1.1     1.3     1.0     1.3     1.0     3.0     2.2     2.1     2.0     2.1     2.4 蜡状芽孢杆菌AB78 苏云金芽孢杆菌israelensis变种 苏云金芽孢杆菌tenebrionis变种   0.0   1.1   0.9     2.2     2.2     2.3

AB78的形态特征如下:

营养生长阶段为直杆菌,3.1-5.0mm长,0.5-2.0mm宽。细胞有圆形末端, 以单细胞组成短链。单亚端圆柱形-椭圆形,每细胞形成内生孢子。无伴孢 晶体形成。菌落不透明,缺刻状,裂片形,扁平。无色素产生。细胞能游动, 有鞭毛。

AB78的生长特征如下:

兼性厌氧型,最适生长温度21-30℃,可在15,20,25,30,37℃下生长。 高于40℃不能生长。可在5-7%NaCl中生长。

表13提供了AB78的生化特征简介。

                    表13

          蜡状芽孢杆菌菌株AB78的生化特性 从L-阿拉伯糖产酸 从L-阿拉伯糖产气 从D-木糖产酸 从D-木糖产气 从D-葡萄糖产酸 从D-葡萄糖产气 从乳糖产酸 从乳糖产气 从蔗糖产酸 从蔗糖产气 从D-甘露醇产酸     -     -     -     -     +     -     -     -     -     -     -     亚甲蓝再氧化     硝酸盐还原     NO3还原成NO2     VP     H2O2降解     吲哚     酪氨酸降解     二羟基丙酮     石蕊牛乳酸     石蕊牛乳凝结     石蕊牛乳碱     +     +     +     +     +     -     +     -     -     -     -   从D-甘露醇产气 Proprionate利用 柠檬酸利用 马尿酸水解 亚甲蓝还原 卵磷脂酶产生       -     +     +     W     +     W   石蕊牛乳胨化 石蕊牛乳还原 酪蛋白质水解 淀粉水解 明胶液化       -     -     +     +     +

W=软弱的反应

实施例2.细菌培养

用蜡状芽孢杆菌菌株AB78的继代培养物接种到下列培养基,即已知的 TB肉汤:

胰胨            12g/l

酵母提取物      24g/l

甘油            4ml/l

KH2PO4          2.1g/l

KH2PO4          14.7g/l

pH7.4

高压灭菌的肉汤冷却后加入磷酸钾。培养瓶在250rpm的旋转振荡器上在 30℃下培养24-36小时。这代表指数生长中期的早期。

上述方法易于通过本领域已熟知的方法扩大成发酵罐

营养生长阶段通常为24-36小时。开始培养代表指数生长中期的早期,之 后,AB78细菌从培养物上清液中离心得到。培养物上清液中包含用于生物 检定活性蛋白质。

实施例3.昆虫生物检定

测试蜡状芽孢杆菌菌株AB78分别抗不同种类的昆虫如下:玉米根叶甲, 长角叶甲,瓜十一星叶甲(Diabrotica virgifera virgifera,D。longcornis barberi和D。undecempunctata howardi):稀释液用生长24-36小时的AB78 培养物上清液制得。与熔化的人工食品混合(Marrone等,(1985), 经济昆 虫学杂志,78:290-293),使其固化。固化食品切块后置于盘中,新生幼虫 置于食物上,保持在30℃,6天之后记录死亡率。

大肠杆菌克隆生物检定:大肠杆菌细胞在包含100μg/ml氨苄青霉素的肉 汤上生长过夜。10ml培养物超声处理3次,每次20秒,500μl的超声处理培 养物加入到熔化的玉米根叶甲食物中。

土豆甲虫(Leptinotarsa decemlineata):生长24-36小时的AB78培养物 上清液用Triton X-100(使其最终浓度为0.1%TX-100)制得稀释液。5cm2 的土豆叶片在此溶液浸一下,空气中干燥,置于塑料盘中的湿润滤纸上。新 生幼虫置于食物上,保持在30℃,6-8天后计算死亡率。

大黄粉虫(Tenebrio molitor)用生长24-36小时的AB78培养物上清液制 得稀释液。与熔化的人工食品(Bioserv #9240)混合,使其固化。固化食 品切块后置于盘中,新生幼虫置于食物上,保持在30℃,6天之后记录死亡 率。

玉米螟,小地老虎,烟芽夜蛾,烟草天蛾和甜菜夜蛾分别(Ostrinia nubilalis,Agrotis ipsilon,Heliothis virescens,Manduca serta,Spodoptera exigua):生长24-36小时的AB78培养物上清液用TX-100(最终浓度为 0.1%TX-100)制得稀释液。用移液管吸取100μl到18cm2到固化人工食品 (Bioserv #9240)的表面,空气中干燥。新生幼虫置于食物上,保持在30 ℃,3-6天后计算死亡率。

尖音库蚊(Culex pipiens):用生长24-36小时的AB78培养物上清液制得 稀释液。用移液管吸取100μl到有10ml水的30ml塑料杯中,三龄幼虫置于 水中,保持在室温下,24-48小时后计算死亡率。AB78的杀虫活性谱如表14。

                表  14

AB78培养物上清液对不同种类的昆虫的活性 迄今所测的昆虫种类     目     活性 玉米根叶甲 (Diabrotica virgifera virgirera) 长角叶甲 (Diabrotica longicornis barberi) 瓜十一星叶甲 (Diabrotica undecimpunctata howardi) 土豆甲虫 (Leptinotarsa decemlineata) 大黄粉虫 (Tenebrio molitor) 玉米螟 (Ostrinia nubilalis) 烟芽夜蛾 (Heliothis virescens) 烟草天蛾 (Manduca serta) 甜菜夜蛾 (spodoptera exigua) 小地老虎 (Agrotis ipsilon) 尖音库蚊 (Culex pipiens)       鞘翅目       鞘翅目       鞘翅目       鞘翅目       鞘翅目       鳞翅目       鳞翅目       鳞翅目       鳞翅目       鳞翅目       双翅目       +++       +++       -       -       -       -       -       -       -       -       -

最近发现的蜡状芽孢杆菌菌株AB78与已知的得自Bt的鞘翅目活性的δ- 内毒素相比,杀虫活性谱显著不同。特别是,AB78比已知的鞘翅目活性的 Bt菌株对甲虫类有更强的选择活性。其中对Diabrotica属的几个种的有特别 的活性。尤其是对玉米根叶甲和长角叶甲的活性最大,但对瓜十一星叶甲无 活性。

检测许多芽孢杆菌菌株在营养生长期间对玉米根叶甲的活性。结果表 明:AB78有独特的抗玉米根叶甲的活性,这不是普遍现象。

                  表  15

芽孢杆菌属的几个种的培养物上清液对玉米根叶甲的活性 芽孢杆菌菌株     WCRW死亡百分率% 蜡状芽孢杆菌AB78(Bat.l) 蜡状芽孢杆菌AB78(Bat.2) 蜡状芽孢杆菌(Carolina Bio.) 蜡状芽孢杆菌ATCC 11950 蜡状芽孢杆菌ATCC 14579 蕈状芽孢杆菌(Carolina Bio.) 日本甲虫芽孢杆菌 苏云金芽孢杆菌HD135 苏云金芽孢杆菌HD191 苏云金芽孢杆菌GC91 苏云金芽孢杆菌isrealensis变种 水对照     100     100     12     12     8     30     28     41     9     4     24     4

AB78对玉米根叶甲的特并性活性在表16给出。

            表  16    

AB78培养物上清液对新生玉米根叶甲的活性 培养物上清液 浓度(μl/ml)       WCRW死亡%   100   25   10   5   2.5   1   0     100     87     80     40     20     6     0

计算出半致死浓度(LC50)是玉米根叶甲食物中培养物上清液浓度为6.2 μl/ml。

对细胞团状沉淀也进行生物检定,表明对WCRW无活性。这样,活性仅 仅存在于上清液中表明VIP是一种外毒素。

实施例4.叶甲类活性蛋白质从AB78的分离和纯化

无细胞的培养介质和残骸通过加入固体硫酸铵(472g/L)制成70%饱和 液。室温下溶解,浴中冷却,10000×g离心30分钟使可沉淀的蛋白质沉 淀,丢弃上清液。团状沉淀在pH7.5下起始体积为20mM的1/10TRIS-HCl中溶解。溶解的沉淀通过透析进入pH为7.5的20mM TRIS-HCl中,或者通 过除盐层析柱除去盐分。

去盐物质用pH为2.5的20mM柠檬酸钠滴定到pH3.5,室温下温育30分钟 后,溶液在3000×g下离心10分钟,这个阶段的上清液包含着最大数量的活 性蛋白质。

pH中性化到7.0后,把上清液加入Mono-Q,阴离子交换,层析柱用20mM pH为7.5的Tris以300ml/分钟的流速平衡。层析柱用pH为7.5的在20mMTris 中的400mMNaCl逐步和线形梯度展开。

层析片段的生物检定和SDS-PAGE分析用于确定活性片段。SDS-PAGE 分析鉴别出生物活性蛋白质有一个分子量在大约80kDa到50kDa之间的组 分。

实施例5.叶甲类(corn rootworm)活性蛋白质的序列分析

由SDS-PAGE分离的80kDa组分转移到PVDF膜上,在ABI470脉冲液体 分析仪上通过重复的Edman循环进行氨基端序列分析,然后再转移进含有 10%甲醇、pH为11.0的10mM CAPS缓冲液中,步骤如下:

电泳后在转移缓冲液中凝胶温育5分钟,ProBlott PVDF膜用 100%MeOH短时间湿润,然后在转移缓冲液中平衡。在泡沫海绵和滤纸块 之间的三明治形物排列为:阳极-凝胶-膜-阴极

转移在70V恒定电压下进行1小时。

转移后,膜以水漂洗,用在50%MeOH中的考马斯蓝R-250染色2分钟。

用50%MeOH、40%水、10%醋酸漂洗几次脱色。

脱色后,膜在空气中干燥,把条带切下进行序列分析,使用BlottCartridge 与适当的周期达到最大的效率和产量。数据使用610序列分析模型软件进行 分析,它能定性和定量测定每一个序列周期的PTH-氨基酸衍生物。

测到的N-端序列为:

NH2-Lys-Arg-Glu-Ile-Asp-Glu-Asp-Thr-Asp-Thr-Asx-Gly-Asp-Ser-Ile- Pro-(SEQ ID NO:8),其中Asx代表Asp或Asn。80kDa组分的全部氨基酸序 列在SEQ ID NO:7给出。编码SEQ ID NO:7蛋白质的DNA序列在SEQ ID NO:6给出。

实施例6.DNA探针的结构

本发明生成了探察编码N-末端序列氨基酸3-9的基因区域(实施例5)的寡 核苷酸探针。探针是在苏云金芽孢杆菌(Bt)的密码子使用基础上合成的。寡 核苷酸序列

5′-GAA ATT GAT CAA GAT ACN GAT-3′(SEQ ID NO:9)

用作Southern杂交的探针。寡核苷酸用标准的方法和设备合成。

实施例7.叶甲类活性蛋白质的等电点测定

从纯化步骤的第五步得到的纯化蛋白质使用快速凝胶电泳系统 (Pharmacia)在PI为3-9的等电聚焦凝胶上分析。分离和染展开步骤都使用 此系统的标准操作步骤。PI值大约为4.9。

实施例8.AB78的PCR数据

使用PCR分析(参见如美国专利申请序列号No.08,008,006;和Carozzi 等,(1991), 应用环境微生物,57(11):3057-3061,本文一并参考)检验到 蜡状芽孢杆菌菌株AB78不含任何苏云金芽孢杆菌或球形芽孢杆菌的杀虫结 晶蛋白质基因(第17表)。

                表  17

由PCR测定的抗AB78 DNA的芽孢杆菌杀虫结晶蛋白质基因的引 物     测试引物     产生的产物 对CryIIIA特异性的2组 CryIIIB 对CryIA特异性的2组 CryIA(a) CryIA(b)特异性的 CryIB CryIC特异性的 CryIE特异性的 对球形芽孢杆菌特异性的2组 对CryIV特异性的2组 芽孢杆菌属对照(PI-PLC)     阴性     阴性     阴性     阴性     阴性     阴性     阴性     阴性     阴性     阴性     阳性

实施例9.得自蜡状芽孢杆菌菌株AB78的总DNA的粘粒克隆

在从菌株AB78制备的总DNA中克隆出VIP1A(a)基因的步骤如下:

AB78 DNA分离如下:

1.细菌在10ml的L-肉汤中生长过夜。(使用50ml的无菌离心管)

2.加25ml的新鲜L-肉汤和氨苄青霉素(30μg/ml)。

3.细胞在30℃下生长2-6小时,同时振荡。

4.50ml的聚丙烯桔色盖试管在IEC桌面临床离心机中以3/4转速旋转细 胞。

5.把细胞团状沉淀重新悬浮在10mlTES(TES=50mM TRIS pH8.0, 100mM EDTA,15mMNaCl)中。

6.加30mg溶菌酶,在37℃下培养2小时。

7.加200μl 20%的SDS和400μl蛋白质酶K原种(20mg/ml),在37℃下培 养。

8.加200μl新鲜蛋白质酶K,55℃下培养1小时。加5ml TES使最终体积 达到15ml。

9.酚提取两次(10ml酚,室温下在IEC桌面临床离心机中以3/4的转速旋 转)。使用宽内径移液管把上清液(上相)转移到干净试管中。

10.用1∶1(体积)的酚:三氯甲烷/异戊醇(24∶1比率)再抽提一次。

11.用相等体积的冷异丙醇沉淀DNA;离心使沉淀成团状。

12.团状沉淀在5ml TE中重新悬浮。

13.用pH为5.2的0.5ml 3M NaOAc和11ml的95%乙醇沉淀DNA,在-20℃ 下放置2小时。

14.用塑料环从试管中“钩出”DNA,转移到一个小离心管中,旋转离 心,用移液管吸去多余的乙醇,真空中干燥。

15.在0.5ml的TE中重新悬浮,培养90分钟。在65℃下把DNA放回溶液 中。

16.用标准方法测定浓度。

AB78的粘粒克隆

除非特别指出,所有方法都根据Stratagene方法,Supercos1指导手册, cat.No.251301进行。

一般步骤如下:

A.AB78 DNA用Sau 3A部分消化

B.载体DNA制备

C.DNA的连接和包装

D.Tittering粘粒文库

1.把50ml的过夜培养物放置在有0.2%麦芽糖的5ml TB上,开始 HB101细胞的培养。在37℃下培养3.5小时。

2.旋转离心出细胞,重新悬浮进0.5ml 10mM MgSO4中。

3.再加上:

100l cells

100l稀释的包装混合物

100l 10mM MgSO4

30l TB

4.在室温下吸附30分钟,不振荡。

5.加1ml TB,并使之慢慢混合。在37℃下培养30分钟。 

6.把200l平铺在L-amp平板上。在37℃下培养过夜。

随机选择至少400个粘粒克隆,如实施例3所述筛选抗玉米根叶甲的活性 物。得自5个活性克隆和5个非活性克隆的DNA用于Southern杂交。结果表 明:使用上述的寡核苷酸探针杂交结果与对玉米根叶甲的活性相关(表18)。

粘粒克隆P3-12和P5-4保藏于农业研究机构保藏中心(NRRL)北方地区 研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号),保藏 号分别为NRRL B-21061和NRRL B-21059。

                    表  18

        AB78粘粒克隆对玉米根叶甲的活性

克隆                                平均死亡率(N=4)

与探针杂交的克隆:

P1-73                                47

P1-83                            64

P2-2                             69

P3-12                            85

P5-4                             97

不与探针杂交的克隆:

P1-2                             5

P3-8                             4

P3-9                             12

P3-18                            0

P4-6                             9

实施例10.对玉米根叶甲有活性的一个6KB区域的鉴别

P3-12的DNA用限制性内切酶Sau 3A部分消化,连接到大肠杆菌载体 pUC19内,转移进大肠杆菌。特异地探察80KDa VIP1A(a)的探针通过 P3-12DNA的一部分PCR扩增合成。与VIP1(a)一部分杂交的寡核苷酸 MK113和MK117使用80kDa蛋白质的部分氨基酸合成。质粒亚克隆通过菌 落和PCR生成的探针进行杂交来鉴别,并测其抗玉米根叶甲的活性。与PCR 生成的片段杂交的这样一个克隆PL2在上述测定中对玉米根叶甲是活性 的。

得自pL2的一个6kb Cla I限制性片段被克隆进大肠杆菌-芽孢杆菌穿梭载 体PHT3103的的Sma I位点(Lereclus,D.等, FEMS微生物通信,60:211-218 (1989))生产pCIB6201。这个构建体的抗玉米根叶甲活性超过芽孢杆菌和大 肠杆菌菌株。在pBluescript SK(+)载体内(Stratagene)包含同样的6kb cla 1片段的pCIB6022产生出相当的CIP1(a)蛋白质(通过western印迹),这个 蛋白质对玉米根叶甲也是活性的。

pCIB6022的核苷酸序列通过双脱氧末端法(Sanger等, 美国科学院学 报,74:5463-5467(1 977)),使用PRISM Ready Reaction Dye双脱氧末 端循环测序试剂盒和PRISM SequenaseR末端双链DNA测序试剂盒在 ABI373自动测序仪上分析。序列在SEQ ID NO:1中给出。通过SEQ ID NO:1中叙述的开放读框表明:6kb片段编码VIP1A(a)和VIP2A(a)。编码 VIP2A(a)的序列在SEQ ID NO:4中提供。VIP1A(a)和VIP2A(b)在发现于 pCIB6022的6kb片段的关系在表19中描述。pCIB6022保藏于农业研究机构 保藏中心(NRRL)北方地区研究中心(美国,伊利诺斯州61604,彼奥利 亚,北大学街1815号),保藏号为NRRL B-21222。

实施例11.VIP1A(a)DNA区功能分析

为证明VIP1A(a)开放读框(ORF)对于杀虫活性是必须的。在基因 中创造出一个翻译移码突变。限制性内切酶Bgl II识别把857bp定位进 VIP1A(a)密码区的单一位点。pCIB6201用Bgl II消化,并且以DNA聚合酶 (Klenow片段)和dNTPS添补单链末端。重新与质粒连结转化进大肠杆菌。 产生的质粒pCIB6203在VIP1A(a)的编码区包含着四个核苷酸插入序列。 pCIB6203对WCRW无杀虫活性,证明VIP1A(a)是对WCRW活性的本质成 分。

为进一步限定编码VIP1A所必须的区域,构建了VIP1A(a)和 VIP2A(a)(辅助蛋白质)区的亚克隆,并测其互补pCIB6203突变的能力。 pCIB6203包含在pBluescript SK(+)载体(Stratagene)中的Xbal-EcoRV片 段。western印迹分析表明:pCIB6023产生的VIP1A(a)蛋白质与克隆PL2 和pCIB6022产生的蛋白质大小和数量相等。pCIB6023包含编码上述80kDa 蛋白质的完整基因。pC1B6023保藏于农业研究机构保藏中心(NRRL)北 方地区研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号), 保藏号为NRRL B-21223N。pCIB6206包含在pBluescript SK(+)载体 (Stratagenc)中得自pCIB6022的4.3kb的Xbal-Cla I片段。pCIB6206也保藏 于农业研究机构保藏中心(NRRL)北方地区研究中心(美国,伊利诺斯州 61604,彼奥利亚,北大学街1815号),保藏号为NRRL B-21321。

pCIB6023,pCIB6206,和pCIB6203单个测试时不产生可检测的对玉米 根叶甲的活性。然而,包含pCIB6203(VIP1A(a)突变,加上VIP2A(a)) 的细胞和pCIB6023(只有VIP1A(a))的细胞的混合物表现出对玉米根叶甲 的高度活性。同样地,包含pCIB6206的细胞和pCIB6203的细胞的混合物显 示对玉米根叶甲的高度活性。

为进一步确定VIP2A(a)的界限,我们构建了pCIB6024,它包含着完 整的VIP2A(a),但是缺乏VIP1A(a)的大部分编码区。pCIB6024通过凝 胶纯化得自pCIB6022的2.2kb Cla I限制性片段构建,并用DNA聚合酶 (Klenow片段)和dNTPs添补单链末端,然后把这个片段连结进用酶Eco RV 消化的pBluescript SK(+)载体内(Stratagene)。包含pCIB6024的细胞不 表现对玉米根叶甲的活性。但包含pCIB6024的细胞和pCIB6023的细胞的混 合物显示出对玉米根叶甲的高度活性(参见表19)。

这样,pCIB6023和pCIB6206一定产生一个功能性的VIPIA(a)基因产 物,而pCIB6203和pCIB6024一定产生一个功能性的VIP2A(a)基因产物。 这些结果表明:需要得自VIP2A(a)区的基因产物与VIP1A(a)结合,才能产 生最大的抗玉米根叶甲的活性(参见表19)。

   表  19

pCIB6022的特征

VIP的功能互补

方框区表示VIP1A(a)和VIP2A(a)的范围。白方框表示编码在芽孢杆菌中观 察到的80kDa肽链的VIP1区域。黑方框表示由DNA序列分析指出的 VIP1A(a)的N-末端“前肽”。打点方框表示VIP2A(a)的编码区。大“X” 表示导入VIP1A(a)的移码突变位置。箭头表示由β-半乳糖苷酶转录的结 构。

实施例12.AB78抗体产生

抗体产生在两只Lewis大鼠中开始,要求有移动杂交瘤细胞系产物的可能 性并能为基因组DNA文库的极限筛选产生足够的血清。另一个因素是可供 使用的抗原数量非常有限以及它仅能够用PAGE纯化随后转移到硝酸纤维 素膜上的事实。

由于在硝酸纤维素上得到的抗原有限,硝酸纤维素在DMSO中乳化,并 注射进动物的后脚掌,以在(popliteal)淋巴结的上游得到B-细胞产物。通 过用开始的血进行Werstern印迹分析判断,产生了高效价的血清。随后的 几次注射和放血产生完成筛选需要的所有血清。

然后开始另一只大鼠的杂交生产。取下popliteal淋巴结,离析产生的细 胞与小鼠骨髓瘤P3x63Ag8.653融合。随后按下述的方法完成细胞筛选。选 择四个对极限稀释克隆有最高乳化抗原反应的initial孔。选择另外的10个孔 用于扩展或深低温保存。

在DMSO中乳化硝酸纤维素膜上的AB78以利于筛选的步骤:

把在PAGE中电泳的AB78样品转移到硝酸纤维素膜上后,使用可逆菌株 Ponceau S使所有的转移的蛋白质显示出来。鉴别出相对应于AB78毒素(前 面已经鉴别并N-末端测序)的带,并从硝酸纤维素膜上切割下来。每条带大 约1mm×5mm大小,以使被乳化的硝酸纤维素的量最小。单个的带放于有 250μl的微离心管内,使用塑料研钵离析(Kontes,Vineland,NJ)。为促 进乳化,DMSO混合物加热到37-45℃下2-3分钟。加热后可能需要进一步 的离析,但是所有的硝酸纤维素膜都应该乳化。在AB78样品乳化后,立即 置于冰上。为用乳化抗原包被微滴定板,样品必须在酸盐溶液中稀释如 下:1∶5,1∶10,1∶15,1∶20,1∶30,1∶50,1∶100和0。包被的抗体必须现配 现用。

ELISA方法:

1.在BBS中用AB78/DMSO包被。在4℃下培养过夜。

2.用1×ELISA洗涤缓冲液洗涤平板3次。

3.在室温下封闭(在含有1%BSA和0.05%Tween20的PBS中)30 分钟。

4.用1×ELISA洗涤缓冲液洗涤平板3次。

5.加入大鼠血清。在37℃下培养1.5小时。

6.用1×ELISA洗涤缓冲液洗涤平板3次。

7.加入浓度为2μg/ml的山羊抗大鼠到ELISA稀释液中,37℃下培养 1小时。

8.用1×ELISA洗涤缓冲液洗涤平板3次。

9.加入2μg/ml的兔抗山羊碱性磷酸酶到ELISA稀释液中,37℃下培 养1小时。

10.用1×ELISA洗涤缓冲液洗涤平板3次。

11.加入底物,在室温的培养30分钟。

12.30分钟后用3N NaOH停止反应。

VIP2A(a)抗血清的制备

部分纯化的AB78培养物上清液用不连续的SDS-PAGE(Nevex)按制造厂 商的说明分离。分离的蛋白质按Towbin等(1979)所述的方法电泳到硝酸 纤维素膜上(S & S#21640)。硝酸纤维膜用Ponceau S染色,鉴别出VIP2A(a) 带。注射前切下VIP2A(a)带并立即在DMSO中乳化。用乳化的VIP2A(a)与 弗氏完全佐剂大约1∶1的混合物在四个不同位点肌肉注射开始免疫兔子。随 后每四周一次的免疫除了不使用弗氏完全佐剂外与第一次相同。在VIP2A (a)蛋白质免疫反应后,收获第一次血清。使用这种血清对AB78培养物上 清液的western印迹分析鉴别出大多全长度的VIP2A(a)蛋白质。

实施例13.带AB78 VIP克隆的非活性BT菌株的杀虫活性的激活

pCIB6203与得自Bt菌株GC91的24小时的培养物(指数生长中期的早 期)上清液一起导致玉米根叶甲的100%死亡。pCIB6203和GC91单独对玉 米根叶甲都无活性。数据如下:     测试材料     玉米根叶甲的死亡百分率     pCIB6203     GC91     pCIB6203+GC91     对照     0     16     100     0

实施例14.蜡状芽孢杆菌AB81的分离和生物活性

定名为AB81的第二种蜡状芽孢杆菌菌株是通过标准方法从谷物箱粉末 样品中分离的得到的。如实施例2的方法培养和制备AB81亚克隆以进行生物 检定。生物活性用实施例3中描述的方法进行评价,结果如下:   测试的   昆虫种类     死亡百分率   玉米螟   小地老虎   玉米根叶甲   0   0   55

实施例15.苏云金芽孢杆菌的分离和生物活性

定名为AB6的苏云金芽孢杆菌是通过本领域中已知的标准方法从谷物箱 粉末中分离得到的。如实施例2所示的方法培养和制备AB6的亚克隆以进行 生物检定。一半样品高压灭菌15分钟后,测定β-外毒素的存在。

生物活性用实施例3所述的方法评价,结果如下:   测试的   昆虫种类     死亡百分率   玉米螟   小地老虎   小地老虎(接种样品)   玉米根叶甲   0   100   0   0

高压灭菌后,培养物上清液的杀虫活性降低到不明显的水平证明了活性 素不是β-外毒素。

菌株AB6保藏于农业研究机构保藏中心(NRRL)北方地区研究中心(美 国,伊利诺斯州61604,彼奥利亚,北大学街1815号),保藏号为NRRL B-821060。

实施例16.苏云金芽孢杆菌AB88的分离和生物学活性。

定名为AB88的苏云金芽孢杆菌是通过标准方法从谷物箱粉末中分离得 到的。如实施例2所示的方法培养和制备AB6的亚克隆以进行生物检定。一 半样品高压灭菌15分钟后,测定β-外毒素的存在。生物活性用实施例3所述 的方法评价结果如下:     测试的   昆虫种类     目     培养物上清液的死亡百分率     没有高压灭菌   高压灭菌   小地老虎   玉米螟   草地贪夜蛾   玉米夜蛾   烟芽夜蛾   土豆甲虫   玉米根叶甲   鳞翅目   鳞翅目   鳞翅目   鳞翅目   鳞翅目   鞘翅目   鞘翅目     100     100     100     100     100     0     0     5     0     4     12     12     0     5

高压灭菌后,培养物上清液的杀虫活性降低到不明显的水平证明了活性 素不是β-外毒素。

Δ-内毒素结晶通过标准方法从菌株AB88中纯化得到。在对小地老虎的 生物检定时,没有观察到纯结晶有活性。

实施例17.得自菌株AB88的VIP的纯化:

细菌液体培养物在TB培养基中30℃下生长过夜(12小时)。细胞在5000 ×g下离心20分钟,保留上清液。存在于上清液中的蛋白质用硫酸铵(70% 饱和度)沉淀。离心(5000×g下15分钟),保留团状沉淀。团状沉淀在pH 为7.5最初体积为20mM的Tris中重新悬浮。在4℃下对同样的缓冲液透析过 夜。AB88透析液与AB78中的类似物质相比更浑浊。透析液用20mM柠檬酸 钠(pH 2.5)滴定到pH4.5,在室温下培养30分钟。溶液在3000g下离心10分 钟。蛋白质团状物重新溶解在20mM pH为9.0的Bis-Tris-Propane中。

澄清化后,AB88蛋白质通过下列几种不同的方法分离:等电点聚焦 (Rotofor,BioRad,Hercules,CA),pH4.5下沉淀,离子交换色谱,大小 排阻色谱以及超滤作用。

蛋白质在Poros HQ N阴离子交换层析柱(PerSeptive生物系统,剑桥, MA)上使用从0到500mM NaCl的线形梯度在20mM pH为9.0的Bis-Tris- Propane中以4ml/分钟的流速分离。杀虫蛋白质在250mM NaCl中洗脱。

玉米螟(ECB)活性蛋白质保留在由透析液在pH为4.5下沉淀获得的团状 沉淀中。使用pH值3-10的两性电解质在透析液中制备IEF时,ECB杀虫活性 在用pH为7或更大得到的所有片段中都有杀虫活性发现。这些片断的SDS- PAGE分析显示出分子量为大约60kDa和大约80kDa的蛋白质带。60kDa和 80kDa带用阴离子交换HPLC在Poros-Q层析柱上分离(PerSeptive生物系 统,剑桥,MA)。N-末端序列从包含分子量稍有不同但大小都约为60KDa 的两个片断中获得。获得的序列相互之间相似,而且和一些δ-内毒素相似。

阴离子交换片断23(较小):xEPFVSAxxxQxxx(SEQ ID NO: 10)

阴离子交换片断28(较大):xEYENVEPFVSAx(SEQ ID NO: 11)

当ECB活性的pH为4.5的团状沉淀进一步在Poros-Q层析柱上通过阴离 子交换分离。活性只在主要包含约60KDa带的片段中有发现。

当AB88透析液pH降到4.5时,小地老虎活性蛋白质也保留在团状沉淀 内。使用pH3-10的两性电解质制备的IEF中,在ECB活性的IEF片断中没有 发现对BCW的活性;代替的是,它在pH4.5-5.0中的片段的活性是最高的, 它的主要组分分子量为大约35KDa和大约80KDa。

pH4.5团状沉淀用阴离子交换HPLC分离,产生只包含35KDa物质的片段 和包含35KDa和80KDa带的片段。

实施例18.AB88 VIP的定性

包含不同对鳞翅目昆虫有活性的营养生长时期蛋白质的片段如实施例17 所述生成。有杀虫活性的片段在8-16%的SDS-聚丙烯酰胺凝胶中分离,并 转移到PVDF膜上[LeGendre等,(1989):用于微序列分析的蛋白质和肽纯 化实用指南,ed Matsudaria PT(学术出版公司,纽约]。片段的生物分析证 明:不同的VIP负责对不同的鳞翅目种类的活性。

对小地老虎活性是由于80kDa和/或35kDa蛋白质,不管是单独或结合施 用。这些蛋白质和已知的Btδ-内毒素序列无同源性,证明它们和任何Bt的 δ-内毒素无关。得自菌株AB88的vip3A(a)杀虫蛋白质主要存在于AB88的培 养物上清液内(至少为总数的75%)。

这些蛋白质在AB88Btδ-内毒素结晶中也没有找到。主要的δ-内毒素蛋 白质的N-末端序列与80kDa和35kDa VIP的N-末端序列相比,没有表现出序 列同源性。vip3A(a)杀虫蛋白质的N-末端序列有许多正电荷残基(从Asn2 至Asn7),其后有疏水核心区(从THR8至Ile34)。不同于大多数已知的 分泌蛋白质,菌株AB88的vip3A(a)杀虫蛋白质在输出时不是N-末端加工。

结果概述如下: 地老虎VIP N-末端序列 序列    主要δ-内毒素蛋白质的N-末端     NO:14) 80kDa MNKNNTKLPTRALP(SEQ ID NO:12) ID NO:12)     NO:16) 35kDa ALSENTGKDGGYIVP(SEQ ID NO:13)    130KDa    MDNNPNINE(SEQ ID      80kDa    MDNNPNINE(SEQ      60kDa    MNVLNSGRTTI(SEQ ID

对玉米螟活性是由于60kDa的VIP,对草地贪夜蛾活性是由于一个未知大 小的VIP。

苏云金芽孢杆菌菌株AB88保藏于农业研究机构保藏中心(NRRL)北 方地区研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号), 保藏号为NRRL B-21225。

实施例18A.苏云金芽孢杆菌AB428的分离和生物活性

定名为AB424的苏云金芽孢杆菌菌株用本领域已知的标准方法从藓类覆 盖的松球果样品中分离到的。如实施例2所述培养并制备AB424的继代培养 物以用于生物检定。生物活性用实施例3所述的方法评价,结果如下: 测试的 昆虫种类       死亡百分率 玉米螟 小地老虎 玉米根叶甲     100     100     0

菌株AB424保藏于农业研究机构保藏中心(NRRL)北方地区研究中 心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号),保藏号为NRRL B-21439。

实施例18B.编码小地老虎活性蛋白质的VIP3A(a)和VIP3A(b)基因的克 隆

分离出分离菌AB88和AB424的总DNA[Ausubel等(1988),分子生物学 通用方法(John Wiley & Sons,NY)],用限制性酶Xbal(苏云金芽孢杆菌 AB88 DNA的4.0至5.0Kb大小级别的Xbal片段的文库)和EcoRl(苏云金芽 孢杆菌AB424的4.5-6.0Kb大小级别的EcoRl片段的文库)分别消化,连结进 pBluescript载体,用同样的酶线形化,再去磷酸化,然后转化进大肠杆菌 DH5α菌株。重组体克隆印迹进硝酸纤维素滤纸,随后用32P标记的33个碱 基长的相对应于对小地老虎活性的80KDa蛋白质N-端的11个氨基酸的寡核 苷酸探察。

42℃下在2×SSC/O.1%SDS(1×SSC=0.15M NaCl/O.O15M柠檬酸钠, pH7.4)中杂交5分钟,然后在50℃下1×SSC/O.1%SDS中杂交两次10分钟。 在400个重组体克隆中有四个是阳性的。阳性重组体的昆虫生物检定表明对 小地老虎幼虫有和AB88或AB424上清液类似的毒性。

质粒pCIB7104包含AB88 DNA的一个4.5Kb的Xbal片段。建立亚克隆以 限定杀虫蛋白质的编码区。

大肠杆菌pCIB7105通过把pCIB7104的3.5kb Xbal-Accl片段克隆进 pBluescript载体来构建。

质粒pCIB7106包含AB424 DNA的一个5.0Kb的EcoRl片段。片段进一步 用HincII消化,产生一个2.8kb的EcoRI-HincII插入序列(pCIB7107),它仍 能编码有功能的杀虫蛋白质。

pCIB7104、AB88的阳性重组体克隆、pCIB7107以及AB424的阳性重组 体克隆的核苷酸序列用Sanger等( 美国科学院学报,74:5463-5467(1977)) 的双脱氧末端法测定,使用PRISM Ready Reaction Dye双脱氧末端循环测 序试剂盒和PRISM SequenaseR末端双链DNA测序试剂盒在ABI 373自动测 序仪上分析。

克隆pCIB7104包含着VIP3A(a)基因,其编码区SEQ ID NO:28给出, 编码的蛋白质序列SEQ ID NO:29给出。设计在玉米中高度表达的编码区 的合成物由本SEQ ID NO:30给出。基于SEQ ID NO:29给出的氨基酸序 列可以设计许多合成基因。

克隆pCIB7107包含着VIP3A(b)基因,其编码区在SEQ ID NO:31中给 出,编码的蛋白质序列在SEQ ID NO:32中给出。pCIB7104和pCIB7107 都保藏于农业研究机构保藏中心(NRRL)北方地区研究中心,保藏号分别 为NRRL B-21422和B-21423。

VIP3A(a)基因包含着一个开放读框(ORF),它从核苷酸732伸展至3105。 这个ORF编码一个分子量为88,500道尔顿的791个氨基酸的肽链。一个 Shine-Dalgarno(SD)序列定位在第一个蛋氨酸之前的6个碱基处,它的序 列鉴别为对芽孢杆菌的强的SD。

VIP3A(b)基因98%等同于VIP3A(a)。

分离自苏云金芽孢杆菌AB88细胞的总DNA的blost用一个跨VIP3A杀虫 蛋白质的N末端区域的33个碱基的片段探察。单个带可在不同的限制性消化 时观察到。这个结果通过使用更大的跨基因编码区的探针证实。GenBank 资料库碱基的研究表明它和已知蛋白质无同源性。

实施例18C.VIP3A杀虫蛋白质的表达

VIP3A(a)杀虫蛋白质表达的时间过程用Western印迹法分析。得自苏 云金芽孢杆菌AB88培养物的样品完全通过生长曲线和孢子形成期。 VIP3A(a)杀虫蛋白质在开始培养15小时之后就可在对数生长期的AB88培 养物上清液中检测到。它在稳定生长阶段的早期达到最高水平,并在孢子形 成期间和此期后仍然保持着较高水平。当使用AB424蜡状芽孢杆菌培养物上 清液时获得了类似的结果。如同用Northern印迹测定的结果一样,VIP3A(a) 杀虫蛋白质的水平反映了VIP3A(a)基因的表达。孢子形成期的开始通过显 微镜直接观察和测定δ-内毒素在细胞团状沉淀中的存在来决定。Cry-I型蛋 白质可在稳定期后期、孢子形成期和此期之后检测到。

实施例18D.类似于VIP3的新基因的杂交鉴定

为确定得自分离菌AB88的芽孢杆菌包含着与VIP3A有关的基因,通过杂 交筛选芽孢杆菌的收集品。463个芽孢杆菌菌株的培养物生长在微滴定孔中 直到孢子形成。96-针菌落0印模(stampel)用于把培养物转移到包含L-琼脂 的150mm平板上。接种板保持在30℃下10小时,再在4℃下过夜。菌落印 迹进尼龙滤纸,用1.2Kb HindIII的VIP3A(a)衍生片段探查。使用Maniatis 等( 分子克隆实验室手册(1982))的杂交条件在62℃下杂交过夜。滤纸 用2×SSC/O.1%SDS在62℃下洗涤,并对x-射线底片曝光。

所筛选的463个芽孢杆菌菌株中,有60个菌株包含着可用杂交检测到的类 似于VIP3的基因。它们中的一些(AB6和AB426)的特征还表明它们的上清液 中包含着BCW杀虫蛋白质,这个蛋白质与对BCW有活性的VIP3蛋白质类 似。

实施例18E.包含着一个隐蔽的类似于VIP3的基因的苏云金芽孢杆菌菌 株M2194的特性

定名为M2194的苏云金芽孢杆菌菌株,通过在实施例18C中所述的菌落 杂交表明包含类似于VIP3的基因。与M2194 VIP3类似的基因被认为是隐蔽 的,因为在整个细菌生长阶段不管是通过抗从AB88中分离到的VIP3蛋白质 的多克隆抗体的免疫印迹分析还是通过在实施例3中所述的生物检定都无法 检测到其表达。

抗纯化的VIP3A(a)杀虫蛋白质的抗血清在兔中产生。硝酸纤维素结合的 蛋白质(50μg)溶解在DMSO中,用弗氏完全佐剂(Difco)乳化。两只兔皮下 注射三个月,每月一次。第二次和第三次注射10天后放血,血清从血样品中 制得。[Harlow等,(1988),抗体:实验室手册(冷泉港实验室出版社, Plainview,NY)]。

M2194与类似于VIP3的基因通过在实施例9中创造pCIB7108的方法克 隆进PKS。包含pCIB7108(它包含M2194 VIP3基因)的大肠杆菌对小地老 虎是活性的,证明此基因编码带杀虫活性的有功能的蛋白质。质粒pCIB7108 保藏于农业研究机构保藏中心(NRRL)北方地区研究中心,保藏号为NRRL B-21438。

实施例18F.VIP3A蛋白质的杀虫活性

VIP3A杀虫蛋白质的活性谱在用带VIP*A的重组大肠杆菌饲喂幼虫的昆 虫生物检定中定量测定。在这些测定中,携带VIP3A(a)和VIP3A(b)基因的 细胞对小地老虎,草地贪夜蛾,甜菜夜蛾,烟芽夜蛾,玉米夜蛾是有杀虫活 性的。在同样的实验条件下,包含VIP3A蛋白质的细菌浸提液没表现出任何 抗玉米螟的活性。

    VIP*A对小地老虎幼虫的效果 处理     死亡百分率 TB培养基 AB88上清液 AB424上清液 缓冲液 大肠杆菌pKS 大肠杆菌pCIB7104(AB88)     5     100     100     7     10     100

大肠杆菌pCIB7105(AB88) 大肠杆菌pCIB7106(AB424) 大肠杆菌pCIB7107(AB424)     100     100     100

VIP3A杀虫蛋白质对鳞翅目昆虫幼虫的效果 处理  昆虫     死亡百分率(%) 大肠杆菌pKS         勤克俭 大肠杆菌pCIB7105 大肠杆菌pCIB7107  BCW  FAW  BAW  TBW  CEW  ECB    BCW  FAW  BAW  TBW  CEW  ECB     10     5     10     8     10     5       100     100     100     100     50     10

BCW=小地老虎;FAW=草地贪夜蛾;BAW=甜菜夜蛾;TBW=烟芽夜 蛾;

CEW=玉米夜蛾;ECB=玉米螟

实施例19.芽孢杆菌属其它种的分离和生物活性

可把营养生长期间产生杀虫活性蛋白质的其它芽孢杆菌属种类分离出 来。这些菌株是用标准方法从环境样品中分离的。制备分离物用于实施例2 和实施例3中分别叙述的生物检定和测定。在营养生长期间产生在生物检定 中对小地老虎有活性的杀虫蛋白质的分离物列于下表;在δ-内毒素结晶的 存在与营养生长期间的杀虫蛋白质的产生之间没有观察到相关关系。     芽孢杆菌属分离菌    δ-内毒素结晶的存在     死亡百分率     AB6     AB53     AB88     AB195     AB211     AB217     AB272     AB279     AB289     AB292     AB294     AB300     AB359     +     -     +     -     -     -     -     -     +     +     -     -     -     100     80     100     60     70     83     80     70     100     80     100     80     100

分离物AB289,AB294和AB359保藏于农业研究机构保藏中心(NRRL) 北方地区研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号), 保藏号分别为NRRL B-21227,NRRL B-821229和NRRL B-21226。

在营养生长期间产生对玉米根叶甲有活性的杀虫蛋白质的芽孢杆菌属分 离物如下表。   芽孢杆菌属分离物   δ-内毒素结晶的存在     死亡百分率   AB52   AB59   AB68   AB78   AB122   AB218   AB256     -     -     +     -     -     -     -     50     71     60     100     57     64     64

分离物AB59和AB256保藏于农业研究机构保藏中心(NRRL)北方地区 研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号),保藏 号分别为NRRL B-21228,NRRL B-821230。

实施例20.类似于VIP1/VIP2的新基因的杂交鉴定

为鉴别包含与在AB78的VIP1A(a)/VIP2A(a)区发现的基因相关的基因, 用杂交筛选芽孢杆菌菌株的收集物。463个芽孢杆菌属菌株的独立培养物生 长在96孔微滴定盘的孔中(共五个盘)直到培养物形成孢子。测试的菌株中, 基于δ-内毒素结晶的存在或缺乏把288个菌株归类为苏云金芽孢杆菌,175 个归类为其它芽孢杆菌属种类。对于每个微滴定盘,使用96-针菌落印模转 移大约100μl孢子培养物到两个包含L-琼脂的150mm平板上。接种板在30 ℃下生长4-8小时,然后冷却到4℃。再把菌落转移到尼龙网上,用本领域已 知的方法水解细胞。滤纸与包含VIP1A(a)和VIP2A(a)DNA序列的DNA片段 产生的探针杂交。杂交使用Church和Gilbert的杂交条件在65℃下过夜 (Church,G.M.,W.Gilbert,美国科学院学报,81:1991-1995(1984))。 滤纸用包含0.1%SDS的2×SSC在65℃下洗涤,并对X-底片曝光。

在供筛选的463个芽孢杆菌属菌株中,鉴定出55个菌株和 VIP1A(a)/VIP2A(a)探针杂交。从这些菌株的22个中分离DNA,使用 Southern印迹法用VIP1(a)/VIP2A(a)DNA作为探针分析。基于Southern印 迹的方式将这些菌株分为8类,每一类都和AB78的Southern印迹的方式不 同。其中一类的方式和苏云金芽孢杆菌变种tenebrionis的VIP1(a)/VIP2A(a) 同系物的方式相同(见下面)。测定22个菌株每一个对玉米根叶甲(WCRW) 的活性。发现AB433,AB434和AB435三个菌株对WCRW有活性。使用 VIP2(a)抗血清Western印迹方式表明菌株AB6,AB433,AB434,AB435, AB444和AB445产生的蛋白质大小与VIP2A(a)相当。

在供鉴定的菌株中,最显著的是苏云金芽孢杆菌菌株AB6(NRRL B- 21060),如实施例15所述,它产生抗小地老虎(Agrotis ipsilon)的VIP活性, 用对VIP2A(a)的多克隆抗血清的Werstern印迹分析表明AB6产生和 VIP2A(a)相似的VIP,但是杀虫活性谱不同。

实施例21.得自苏云金芽孢杆菌变种TENEBRIONIS的VIP1(a)/VIP2A(a) 同系物的克隆

用Southern印迹技术测定几个已经定性的芽孢杆菌菌株是否有与 VIP1(a)/VIP2A(a)相似的DNA的存在。并分析芽孢杆菌菌株AB78,AB88, GC91和ATCC10876的DNA是否有与VIP1(a)/VIP2A(a)类似序列的存在。 Bt菌株GC91,HD-1和Bc菌株ATCC10876的DNA不和VIP1(a)/VIP2A(a)杂 交,表明它们缺乏和VIP1(a)/VIP2A(a)基因类似的序列。相似的,杀虫菌株 AB88(实施例16)的DNA不和VIP1(a)/VIP2A(a)的DNA杂交,表明由这个 菌株产生的VIP活性不是由VIP1(a)/VIP2A(a)同系物造成的。相对而言,苏 云金芽孢杆菌变种tenebrionis(Btt)包含着能和VIP1(a)/VIP2A(a)杂交的序 列,进一步的分析证明Btt包含与VIP1(a)/VIP2A(a)类似的序列。

为确定VIP2A(a)和VIP1(a)的Btt同系物的特征,克隆了编码这些蛋白质 的基因。Southern印迹分析鉴定出一个9.5kb Eco RI限制型片段。基因组 DNA用Eco RI消化,凝胶纯化长度大约为9.5kb的DNA片段。这段DNA连结 进用Eco RI消化的pBluescript SK(+)载体,转化进大肠杆菌以产生质粒 文库。大约10,000菌落通过菌落杂交筛选VIP2A(a)同源序列的存在,鉴定出 28个阳性菌落。所有的28个克隆是一致的,都包含着VIP1A(a)/VIP2A(a)同 系物。克隆pCIB7100保藏于农业研究机构保藏中心(NRRL)北方地区研 究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号),保藏号 为NRRL B-21322。几个亚克隆从pCIB7100构建。一个得自pCIB7100的 3.8kb的Xba I片段被克隆进pBluescript SK(+)载体,产生pCIB7101。得自 pCIB7100的1.8kb的HindIII片段和一个1.4kb的HindIII片段被克隆 pBluescript SK(+)载体,分别产生pCIB7102和pCIB7103。亚克隆 pCIB7101,pCIB7102和pCIB7103保藏于农业研究机构保藏中心(NRRL) 北方地区研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号), 保藏号分别为NRRL B-21323,B21324和B-21325。

包含VIP2A(a)和VIP1A(a)同系物的pCIB7100的DNA序列区用双脱氧末 端法测定(Sanger等,1977,美国科学院学报,74:5463-5467)。反应使用 PRISM Ready Reaction Dye双脱氧末端循环测序试剂盒和PRISM SequenaseR末端双链DNA测序试剂盒在ABI373自动测序仪上分析。特制的 寡核苷酸用作引物测定一定区域的DNA序列,这个区域的DNA序列见SEQ ID NO:19。

SEQ ID NO:19中的4kb区域包含两个开放读框(ORFs),它编码与得自 菌落AB78的VIP1A(a)和VIP2A(a)高度相似的蛋白质。使用标准命名法定名 为VIP2A(b)的VIP2A(a)同系物的氨基酸序列在SEQ IN NO:20中。使用标 准的命名法定名为VIP1A(b)的VIP1A(a)同系物的氨基酸序列在SEQ IN NO:21给出。VIP2A(b)蛋白质和得自AB78的VIP2A(a)蛋白质的氨基酸有 91%相同。两种VIP2蛋白质的氨基酸序列在表20给出。VIP1A(b)蛋白质和 得自AB78的VIP1A(a)的氨基酸有77%相同。两种VIP1蛋白质的氨基酸序列 在表21给出。表21所示的序列列表表明VIP1A(b)和得自AB78的VIP1A(a) 的相似性。这个列表表明:两个VIP1蛋白质在氨基末端比在羧基末端有更 高的氨基酸一致性。事实上,两个蛋白质氨基末端2/3(直到表21所示的 VIP1A(b)序列的氨基酸618)表现出90%的一致性,而羧基末端的 1/3(VIP1A(b)序列的619-833的氨基酸)表现出35%一致性。

Western印迹分析表明;苏云金芽孢杆菌变种tenebrionis(Btt)产生类似于 VIP1A(a)蛋白质和类似于VIP2A(a)蛋白质。然而,这些蛋白质没有表现出 对玉米根叶甲的活性。生物检定抗玉米根叶甲活性使用Btt的24小时培养物 上清液或大肠杆菌克隆pCIB7100(它包含着VIP1A(a)/VIP2A(a)同系物)。在 任何一种情况下都没有检测到对玉米根叶甲的活性。

假定Btt和AB78的VIP2蛋白质之间是相似的,测定Btt的VIP2A(b)替代 AB78的VIP2A(a)的能力。包含pCIB6206(它产生AB78 VIP1A(a)但不产生 VIP2A(a)蛋白质)与Btt培养物上清液混合,并测定这种混合物对玉米根叶甲 的活性。Btt培养物上清液和包含pCIB6206细胞都没有对WCRW的活性, Btt和pCIB6206的混合物却产生了对WCRW的高度活性。而且,另外的生 物检定表明在大肠杆菌中含有Btt VIP1A(b)/VIP2A(b)基因的Btt克隆 pCIB7100与pCIB6206混合时也产生对WCRW的活性。这样,由Btt产生的 VIP2A(b)蛋白质是由AB78产生的VIP2A(a)的功能等价物。

这样,通过使用VIP DNA作为杂交探针鉴定新的有杀虫活性的菌株的能 力得到了证明。进而,包含类似于VIP1A(a)/VIP2A(a)序列的芽孢杆菌产生 已经证明对不同种类害虫有毒性的类似于VIP1A(a)/VIP2A(a)的蛋白质。相 似的方法可以鉴别VIP1/VIP2族的许多成员。而且,相似的方法的使用可以 鉴别其它种类的VIP的同系物(例如AB88的VIP)。

                         表  20

      苏云金芽孢杆菌变种tenebrionis的VIP2氨基酸序列(VIP2A(b))

              与AB78的VIP2氨基酸序列(VIP2A(a))的比较

Btt   1 MQRMEGKLFVVSKTLQVVTRTVLLSTVYSITLLNNVVIKADQLNINSQSK 50 SEQ ID NO:20

        |.|||||||:|||.|||||:|||||||:||.|||| ||||:|||||||||

AB78  1 MKRMEGKLFMVSKKLQVVTKTVLLSTVFSISLLNNEVIKAEQLNINSQSK 50 SEQ ID NO:2

     51 YTNLQNLKIPDNAEDFKEDKGKAKEWGKEKGEEWRPPATEKGEMNNFLDN 100

        |||||||||.|..|||||||:|||||||||:.||: .|||||.|||||||

     51 YTNLQNLKITDKVEDFKEDKEKAKEWGKEKEKEWKLTATEKGKMNNFLDN 100

    101 KNDIKTNYKEITFSMAGSCEDEIKDLEEIDKIFDKANLSSSIITYKNVEP 150

        |||| ||||||||||||| |||||||.||||:|||.|||.||||||||||

    101 KNDIXTNYKEITFSMAGSFEDEIKDLKEIDKMFDKTNLSNSIITYKNVEP 150

    151 ATIGFNKSLTEGNTINSDAMAQFKEQFLGKDMKFDSYLDTHLTAQQVSSK 200

        .|||||||||||||||||||||||||||::|:||||||||||||||||||

    151 TTIGFNKSLTEGNTINSDAMAQFKEQFLDRDIKFDSYLDTHLTAQQVSSK 200

    201 KRVILKVTVPSGKGSTTPTKAGVILNNNEYKMLIDNGYVLHVDKVSKVVK 250

        .||||||||||||||||||||||||||.||||||||||::||||||||||

    201 ERVILKVTVPSGKGSTTPTKAGVILNNSEYKMLIDNGYMVHVDKVSKVVK 250

    251 KGMECLQVEGTLKKSLDFKNDINAEAHSWGMKIYEDWAKNLTASQREALD 300

        ||:||||:|||||||||||||||||||||||| ||:|||:||.|||||||

    251 KGVECLQIEGTLKKSLDFKNDINAEAHSWGMKNYEEWAKDLTDSQREALD 300

        ||||||||||||||||||||||||||||:|||||||||||||||||||||

    301 GYARQDYKEINNYLRNQGGSGNEKLDAQIKNISDALGKKPIPENITVYRW 350

    351 CGMPEFGYQISDPLPSLKDFEEQFLNTIKEDKGYMSTSLSSERLAAFGSR 400

        ||||||||||||||||||||||||||||||||||||||||||||||||||

    351 CGMPEFGYQISDPLPSLKDFEEQFLNTIKEDKGYMSTSLSSERLAAFGSR 400

    401 KIILRLQVPKGSTGAYLSAIGGFASEKEILLDKDSKYHIDKATEVIIKGV 450

        |||||||||||||||||||||||||||||||||||||||||.||||||||

    401 KIILRLQVPKGSTGAYLSAIGGFASEKEILLDKDSKYHIDKVTEVIIKGV 450

    451 KRYVVDATLLTN 462

        ||||||||||||

    451 KRYVVDATLLTN 462

                             表  21

    苏云金芽孢杆菌变种tenebrionis的VIP1氨基酸序列(VIP1A(b))

          与AB78的VIP1氨基酸序列(VIP1A(a))的比较

    151 PIKIEYQSDTKFNIDSKTFKELKLFKIDSQNQPQQVQQDELRNPEFNKKE 200

    198 SQEFLAKASKTNLFKQKMKRDIDEDTDTDGDSIPDLWEENGYTIQNKVAV 247

        |||||||:||.|||.|||||:|||||||||||||||||||||||||::||

    201 SQEFLAKPSKINLFTQKMKREIDEDTDTDGDSIPDLWEENGYTIQNRIAV 250

    248 KWDDSLASKGYTKFVSNPLDSHTVGDPYTDYEKAARDLDLSNAKETFNPL 297

        |||||||||||||||||||:||||||||||||||||||||||||||||||

    251 KWDDSLASKGYTKFVSNPLESHTVGDPYTDYEKAARDLDLSNAKETFNPL 300

    298 VAAFPSVNVSMEKVILSPNENLSNSVESHSSTNWSYTNTEGASIEAGGGP 347

        |||||||||||||||||||||||||||||||||||||||||||:||| ||

    301 VAAFPSVNVSMEKVILSPNENLSNSVESHSSTNWSYTNTEGASVEAGIGP 350

    348 LGLSFGVSVTYQHSETVAQEWGTSTGNTSQFNTASAGYLNANVRYNNVGT 397

         |:||||||.||||||||||||||||||||||||||||||||||||||||

    351 KGISFGVSVNYQHSETVAQEWGTSTGNTSQFNTASAGYLNANVRYNNVGT 400

Btt   1 MKNMKKKLASVVTCMLLAPMFLNGNVNAVNADSKINQISTTQENQQKEMD 50 SEQ ID NO:21

        |||||||||||||| |||||||||||||| ||||.|||||||.|||||||

Ab78  1 MKMMKKKLASVVTCTLLAPMFLNGNVNAVYADSKTNQISTTQKNQQKEMD 50 SEQ ID NO:5

     51 RKGLLGYYFKGKDFNNLTMFAPTRDNTLMYDQQTANALLDKKQQEYQSIR 100

        ||||||||||||||.||||||||||.||:||||||| |||||||||||||

     51 RKGLLGYYFKGKDFSNLTMFAPTRDSTLIYDQQTANKLLDKKQQEYQSIR 100

    101 WIGLIQRKETGDFTFNLSKDEQAIIEIDGKIISNKGKEKQVVHLEKEKLV 150

        ||||||.|||||||||||.||||||||:||||||||||||||||||:|||

    101 WIGLIQSKETGDFTFNLSEDEQAIIEINGKIISNKGKEKQVVHLEKGKLV 150

    151 PIKIEYQSDTKFNIDSKTFKELKLFKIDSQNQSQQVQ...LRNPEFNKKE 197

        ||||||||||||||||||||||||||||||||.||||   ||||||||||

398 GAIYDVKPTTSFVLNNNTIATITAKSNSTALRISPGDSYPEIGENAIAIT 447

    ||||||||||||||||:||||||||||||||.||||:|||. |:|:||||

401 GAIYDVKPTTSFVLNNDTIATITAKSNSTALNISPGESYPKKGQNGIAIT 450

448 SMDDFNSHPITLNKQQVNQLINNKPIMLETDQTDGVYKIRDTHGNIVTGG 497

    ||||||||||||||.||:.|:||||:||||:||||||||:||||||||||

451 SMDDFNSHPITLNKKQVDNLLNNKPMMLETNQTDGVYKIKDTHGNIVTGG 500

498 EWNGVTQQIKAKTASIIVDDGKQVAEKRVAAKDYGHPEDKTPPLTLKDTL 547

    |||||.|||||||||||||||..|||||||||||::||||||.|||||.|

501 EWNGVIQQIKAKTASIIVDDGERVAEKRVAAKDYENPEDKTPSLTLKDAL 550

548 KLSYPDEIKETNGLLYYDDKPIYESSVMTYLDENTAKEVKKQINDTTGKF 597

    ||||||||||.:|||||.:||||||||||||||||||||.||:|||||||

551 KLSYPDEIKEIEGLLYYKNKPIYESSVMTYLDENTAKEVTKQLNDTTGKF 600

实施例22.VIP蛋白质融合形成单一多肽

VIP蛋白质以单一多肽或以两个或更多相互作用的多肽存在于自然界。 当活性VIP由两个或更多相互作用的蛋白质链组成时,这些蛋白质链可以以 单个多肽链从两个(或多个)VIP编码区融合形成的基因中产生。编码两个 链的基因通过基因的编码区合并而融合,产生编码两个VIP多肽的单个开放 读框。组合物多肽可以如融合产生如融合蛋白氨基末端的更小的多肽。或者 它们可以可以被融合产生象融合蛋白氨基末端的更大的多肽。在两个多肽结 构域之间,可以任意使用接头。这些接头在本领域是已知的。此接头可被任 意设计成包含蛋白质酶裂解位点的接头,以便只要单融合多肽被靶昆虫摄 入,它就能在接头区域裂解,释放活性VIP分子的两个多肽组分。

蜡状芽孢杆菌菌株AB78的VIP1A(a)和VIP2A(a)通过编码区融合形成单 多肽。产生的DNA包含SEQ ID NO:22给出的序列,它编码的蛋白质的序 列在SEQ ID NO:23给出。以相似的方式,也可以产生其它融合蛋白。

编码VIP1A(a)和VIP2A(a)的基因融合通过使用分子生物学的标准方法 完成。在VIP1A(a)和VIP2A(a)编码区之间,要缺失的核苷酸通过已知的诱 变技术缺失,或者替代地使用PCR技术融合的编码区。

融合的VIP多肽可以使用被优化以利于在其它宿主中表达的合成基因或 部分合成基因在其它有机体内表达。例如,为在玉米中表达上述的融合VIP 多肽,人们使用玉米每一氨基酸的优化密码子制作了合成基因,参见,例如, EP-A 0618976,本文一并参考。根据这种方法创造的DNA序列在SEQ ID NO:17(100kDa VIP1A(a)编码序列的玉米优化体),SEQ ID NO:18 (80kDa VIP1A(a)编码序列的玉米优化体)和SEQ ID NO:24(VIP2A(a)编 码序列的玉米优化体)中给出。

优化以适于在玉米中表达的合成VIP1和VIP2基因可以使用PCR技术或 通过在一个共用限制位点融合以设计成合成基因。另外,也可以把合成的基 因设计成编码包含VIP1和VIP2结构域的单一多肽的基因。

在融合蛋白的VIP1和VIP2结构域之间加入一个多肽接头可以通过PCR 诱变、使用编码接头肽的合成DNA接头或其它本领域已知的方法实现。

融合的VIP多肽可由一个或多个结合结构域组成。如果在融合中使用超 过一个的结合结构域,可用这样一个融合蛋白来控制多个靶害虫。其它的结 合结构域可以通过使用其它VIP的全部或部分、苏云金芽孢杆菌内毒素或它 的一部分、其它能够和靶害虫结合的蛋白质或从这些结合蛋白质中衍生的适 当的结合结构域中获得。

pCIB5531提供了一个融合结构体的例子,它包含编码一个VIP2A(a)在 N-末端、VIP1A(a)在C-末端的单多肽融合物的玉米最优化DNA序列。在两 个编码区之间插入编码带有肽序列PSTPPTPSPSTPPTPS(SEQ ID NO:47) 的接头的DNA序列。编码这个接头的序列和相关的克隆位点是5′- CCC GGG CCT TCT ACT CCC CCA ACT CCC TCT CCT AGC ACG CCT CCG ACA CCT  AGC GAT ATC GGA TCC-3′(SEQ ID NO:48)。在使用 标准方法杂交和磷酸化之后,合成代表上链和下链(upper strand and lower strang)的寡核苷酸并把它克隆进pUC载体。使用PCR除去VIP2A(a)中的 终止密码子并用带一个Smal位点的BgIII限制位点取代。通过把pCIB5522 (参见实施例24)的VIP2A(a)基因的BamHI/Pstl片段、一个包含VIP2A(a) 基因(和构建pCIB5522使用的基因相同)的Pstl-末端的PCR片段、一个末 端能和5′末端平端位点并在3′末端有BamHI的合成接头以及下面叙述的 PCIB5526修饰的合成VIP1A(a)基因(参见SEQ ID NO:35)连接起来,可以 形成一个翻译融合蛋白。融合蛋白通过上述四个序列连接,形成一个质粒, 它包含着没有翻译终止密码子的VIP2基因、接头和没有芽孢杆菌分泌信号 的VIP1A(a)编码区。这个构建体的DNA序列在SEQ ID NO:49给出,它编 码的融合蛋白在SEQ ID NO:50给出。VIP1A(a)在N-末端和VIP2A(a)在C- 末端的单多肽融合蛋白可以用相似的方式得到。而且,一个或两个基因都可 连接进在5′或3′端有(或无)和其它分子(如毒素编码基因或报道基因)的 接头的翻译融合物。

实施例23.VIP2对植物细胞器的定位

已知在植物中存在着几种定位基因产物的机制。控制这些机制功能的序 列在某些细节上已确定特征。例如,基因产物定位到叶绿体由一个在各种蛋 白质的氨基末端发现的信号序列控制。这个信号在叶绿体输入过程中裂解, 产生成熟的蛋白质。(e.g.Comai等,生物化学杂志,263:15104- 15109(1988))。这些信号序列可被融合到异源基因产物如VIP2使这些产物 输入叶绿体(van den Broeck等,自然313:358-363(1985))。编码适当的信 号序列DNA可从编码RUBISCO蛋白质、CAB蛋白质、EPSP合成酶、GS2 蛋白质以及许多已知定位于叶绿体的其它蛋白质的cDNA的5′端分离到。

其它基因产物定位到其它细胞器如线粒体和过氧化物酶体中(e.g.Unger 等,植物分子生物学,13:411-418(1989))。编码这些产物的cDNA也能被 操纵使异源基因产物如VIP2定位到这些细胞器上。这样的序列的例子是核 编码的ATP酶和线粒体特异性天冬氨酸氨基转移酶的同工型。相似地,对细 胞的蛋白质体的定位由Rogers等描述(美国科学院学报,82:6512- 6516(1985))。

通过上面叙述的适当的导向序列融合成兴趣编码序列(如VIP2),有可 能把转基因产物定位到任何细胞器或细胞区室。例如,对于叶绿体定位,得 自RUBISCO基因、CAB基因、EPSP合成酶基因、GS2基因的叶绿体信号 序列可以符合读框地融合到转移基因的氨基末端ATG上。选择的信号序列 应该包含已知的裂解位点,构建的融合体应该考虑裂解所需的裂解位点之后 的任何氨基酸。在某些情况下,可以通过在裂解位点和起始密码子ATG之 间加入少数氨基酸,或者取代编码序列内的一些氨基酸以满足这个需要。为 叶绿体输入构建的融合体可以通过离体转录的结构的离体翻译再加上使用 Bartlett等(Edelmann等(Eds.),叶绿体分子生物学方法,Elsevier.pp 1081-1091(1982);Wasmann等,分子基因遗传学,205:446-453(1986)) 叙述的技术进行离体叶绿体吸收来测定叶绿体的吸收效率。这些构建技术在 本领域是熟知的,同样地适用于线粒体和过氧化物酶体。

上面所述的细胞定位机制不仅可以用于与它们的关联启动子连接,而且 可以用于与异源启动子连接以影响在启动子转录调节下的特异细胞定位目 标。这个启动子的表达方式不同于定位信号衍生的启动子。

编码分泌信号的DNA序列存在于天然的芽孢杆菌VIP2基因中。这个信号 不存在于N-末端序列为LKITDKVEDF(SEQ ID NO:2的57至66氨基酸残基) 的成熟蛋白质中。使用基因工程的方法使VIP2分泌出植物细胞或定位到亚 细胞结构的细胞器上如内质网、液泡、线粒体或包含叶绿体的质体上是可能 的。由分泌信号肽融合到标志基因上形成的杂种蛋白质成功地定位进分泌途 径(Itirriaga G.等, 植物细胞,1:381-390(1989),Denecke等, 植物细胞, 2:51-59(1990))。鉴别出氨基末端序列负责对内质网,质外体和糊粉层细的 胞外分泌定位(Koehler & Ho, 植物细胞,2:769-783(1990))。

蛋白质保留在内质网或是液泡中需要另外的信号存在。在蛋白质的羧基 末端的肽序列KDEL/HDEL对于蛋白质保留在内质网中是必须的(由 Pelham综述, 细胞生物学年评,5:1-23(1989)。使蛋白质保留在液泡中的 信号也已经确定其特征。液泡定位信号可能存在于氨基末端部分(Holwerda 等, 植物细胞,4:307-318(1992),Nakamura等, 植物生理,101:1-5(1993)), 羧基末端部分或存在于定位蛋白质的内部序列中(Tague等, 植物细胞,4: 307-318(1992),Saalbach等, 植物细胞,3:695-708(1991))。另外,氨基 末端序列和羧基末端序列结合负责基因产物的液泡定位(Shinshi等, 植物分 子生物学,14:357-368(1990))。相似地,使用特异性的羧基末端信号肽融 合蛋白也可把蛋白质定位到线粒体或质体上(Heijne等,欧洲生物化学杂 志,180:535-545(1989),Archer和Keegstra, 植物分子生物学,23: 1105-1115(1993))。

为了把VIP2定位到分泌或不同的亚细胞结构的细胞器上,编码已知信号 肽的玉米优化DNA序列按需要设计到基因的5′或3′端。为把VIP2分泌出细 胞,PCT申请号IB95/00497的真核分泌信号肽 MGWSWIFLFLLSGAAGVHCL(SEQ ID NO:25)或任何其他在文献中记 载(Itirriaga等,植物细胞,1:381-390(1989);Denecke等,植物细胞,2: 51-59(1990))的DNA序列都可以加到完整的VIP2基因序列的5′端或者构建 的编码成熟蛋白质的序列上或者构建核苷酸286的基因上或编码从氨基酸残 基94(蛋氨酸)开始的蛋白质的基因上。为使VIP2保留在内质网内,可把 编码内质网信号肽KDEL/HDEL的DNA序列和分泌信号加到基因的3′端。要 定位到液泡,可把编码信号肽SSSSFADSNPIRVTDRAAST(SEQ ID N0: 3;Holwerda等, 植物细胞,4:307-318(1992))的DNA序列设计得和分泌信 号或编码Dombrowski等( 植物细胞,5:587-596(1993))所述的羧基信号肽 的序列相邻或者在基因的3′端插入功能性的变异。相似地,通过在叙述的编 码所需定位信号的VIP2序列中插入一个序列,VIP2可被设计定位到线粒体 或包含叶绿体的质体中。存在于VIP2中的细菌分泌信号可以保留或从最终 的构建体中除去。

pCIB5528是一个掺入真核分泌信号的构建体与VIP编码序列融合的例 子。合成相对应于编码SEQ ID NO:25中的分泌信号肽的上链和下链的寡 核苷酸,其序列为:5′- GGATCCACC ATG GGC TGG AGC TGG ATC TTC CTG TTC CTG CTG AGC GGC  GCC GCG GGC GTG CAC TGC CTGCAG-3′(SEQ ID NO:41)。杂交时,分泌信号的5′端与对应于限制位 点BamHI和Pstl的“粘性末端”相似。使用标准方法,寡核苷酸杂交、磷酸 化并连接进pCIB5527中(在实施例23A中叙述的构建体),后者再根据标 准方法用BamHI/Pstl消化。产生的玉米优化编码序列SEQ ID NO:42给出, 它编码SEQ ID NO:43给出的蛋白质。这个被编码的蛋白质在芽孢杆菌分 泌信号的地方包含着真核分泌信号。

pCIB5533是一个掺入液泡分泌信号的构建体与VIP编码序列融合的例 子。合成相对应于编码SEQ ID NO:3中的分泌信号肽的上链和下链的寡核 苷酸,其序列为:5′- CCG CGG GCG TGC ACT GCC TCA GCA GCA GCA GCT TCG CCG ACA GCA ACC CCA TCC GCG TGA CCG ACG GCG CCG CCA GCA CC C TGC AG-3′(SEQ ID NO:44)。杂交时,液泡 定位信号的5′端与对应于限制位点SacII和Pstl的“粘性末端”相似。使用标 准方法,寡核苷酸杂交、磷酸化并连接进pCIB5588中(上面所述的构建体), 后者再根据标准方法用SacII/Pstl消化。产生的玉米优化编码序列SEQ ID NO:45给出,它编码SEQ ID NO:46给出的蛋白质。这个被编码的蛋白质 除真核分泌信号之外还包含液泡定位肽。

也可以用相似的方法,设计VIP1基因使其分泌、定位到亚细胞细胞器 上。

实施例23A.从VIP1A(a)和VIP2A(a)中除去芽孢杆菌分泌信号

VIP1A(a)和VIP2A(a)在菌株AB78的生长期间分泌。作为分泌信号的肽 链特征在文献中已有叙述(Simonen和Palva,微生物综述,pg.109- 137(1993))。根据上面出版物的信息,在两个基因中鉴别了推定的分泌信 号。在VIP1A(a)中这个信号由氨基酸1-33组成(参见SEQ ID NO:5)。分泌 信号的加工可能发生在第33个氨基酸丝氨酸之后。VIP2A(a)的分泌信号鉴 别为氨基酸1-49(参见SEQ ID NO:2)。分泌的成熟VIP2A(a)蛋白质的N-末 端肽链分析表明N-末端序列为LKITDKVEDFKEDK。在SEQ ID NO:2中 发现这个序列从氨基酸57开始。通过除去芽孢杆菌分泌信号修饰编码这些蛋 白质的基因,构建成玉米优化VIP1A(a)编码区域,它把编码开始33个氨基 酸的序列(即分泌信号)从5′端除去。这种修饰通过PCR使用一个引物达到, 此引物包含着能与玉米优化基因(SEQ ID NO:26)在核苷酸位置100杂交的 序列5′-GGA TCC ACC ATG AAG ACC AAC CAG ATC AGC-3′(SEQ ID NO:33),并加上一个BamHI限制位点和一个包含起始密码子的翻译起始 位点共用序列。包含着序列5′-AAG CTT CAG CTC CTT G-3′(SEQ ID NO:34)的反向引物在互补链的位置507处杂交,得到一个在5′端包含着限 制位点BamHI和在3′端包含着HindIII位点的527bp的扩增产物。扩增产物 被克隆进T-载体(在下面的实施例24中叙述)并测序以保证DNA序列正确。然 后,通过限制性消化获得BamHI/HindIII片段,并用于取代克隆进根优选的 启动子盒中的玉米最优化VIP1A(a)基因的BamHI/HindIII片段。获得的构 建体定名为pCIB5526。为除去芽孢杆菌分泌信号的VIP1A(a)编码的玉米优 化编码区在SEQ ID NO:35给出,它编码的蛋白质在SEQ ID NO:36给出。

编码加工形式的VIP2A(a)的基因(即分泌信号被除去)的编码区通过和 上面用于构建加工形式的VIPIA(a)相类似的方法构建。修饰通过PCR使用 正引物5′-GGA TCC ACC ATG CTG CAG AAC CTG AAG ATC AC- 3′(SEQ ID NO:37)达到。此引物与玉米优化的VIP2A(a)基因(SEQ ID NO: 27)的核苷酸位置150处杂交。一个不活动的突变插入此引物的核苷酸位置 15,获得一个Pstl限制性位点。反向引物序列为5′-AAG CTT CCA CTC CTT CTC-3′(SEQ ID NO:38)。用在3′端的限制性位点获得一个259bp产物。此 扩增产物被克隆进T-载体,测序并连接进BamHI/HindIII消化的包含玉米优 化的VIP2A(a)的根优选的启动子盒中。获得的构建体定名pCIB5527。为 VIP2A(a)编码的除去分泌信号的玉米优化编码区在SEQ ID NO:39给出, 它编码的蛋白质在SEQ ID NO:40给出。

实施例24.VIP1A(a)和VIP2A(a)玉米优化基因的构建和克隆

设计玉米优化基因通过天然的VIP1A(a)和VIP2A(a)蛋白质序列使用在 玉米中最常用的密码逆翻译得到(Murray等, 核酸研究,17:477- 498(1989))。为了易于克隆,DNA序列被进一步修饰,每间隔200-360个核 苷酸掺入单一限制位点。使VIP1A(a)克隆进11个这样的片段,VIP2A(a)克 隆进5个片段。在几个片段的克隆后,使用两个片段共同的限制性位点连接 相邻的片段,得到完整的基因。为克隆每一片段,寡核苷酸(50-85个核苷酸) 设计成对应于DNA的上链和下链。第一个寡核苷酸对(oligo pair)上部寡 核苷酸被设计成在3′末端包含15bp的单链区,它和指导定位的下一个寡核苷 酸对下链相似的单链区(此区指导给定片段的各种寡核苷酸对的定位和序 列)。也可设计寡核苷酸使之与所有代表片段的寡核苷酸杂交时末端有相对 应于特定限制位点的单链区形成。检测每一寡核苷酸的结构是否有稳定的二 级结构,如使用NBI公司的OLIGO方法形成的发夹环。如果需要,可以改 变核苷酸,以降低二级结构的稳定性。同时并不改变蛋白质的氨基酸顺序。 把一个植物核糖体结合位点共用序列TAAACA ATG(Joshi等, 核酸研究, 15:6643-6653(1987))或真核生物核糖体结合位点共用序列 CCACC ATG(Kozak, 核酸研究,12:857-872(1984))插入基因翻译起始密 码于。

克隆:由IDT Inc.合成的寡核苷酸作为冻干的粉剂使用。寡核苷酸以200 μM的浓度重新悬浮。每30μl的寡核苷酸加入甲酰胺使其最终浓度为25- 50%,样品煮沸2分钟,然后在Novex的premade 10%聚丙烯酰胺/尿素凝胶 上分离,电泳后,把凝胶放在包含荧光指示剂的TLC板上,用UV光照射, 寡核苷酸通过UV投影可以检测到。切下包含正确大小DNA的区域,通过绞 碎的凝胶片在包含0.4M LiCl,0.1mM EDTA的缓冲液中过夜温育以从聚丙 烯酰胺中提取DNA。离心通过微孔UFMC滤膜把DNA从凝胶残余物中分离 出来。提取的DNA通过加入2倍体积的无水酒精沉淀。离心后,沉淀以2.5 μM的浓度重新悬浮在dH2O中。片段或是通过寡核苷酸杂交并与适当的载 体连接,或是通过使用以一个特定片段作为模板的所有寡核苷酸和末端特异 性PCR引物的等摩尔的混合物的杂交片段的扩增来克隆。

通过杂交和连接克隆:同源的双链寡核苷酸对通过混合5μl的上链和5μ 1的下链(对每一寡核苷酸对加入包含1×多核苷酸激酶(PNK)的缓冲液(70 mMTris-HCl(pH值为7.6),10mM MgCl2,5mM二硫苏糖醇(DTT), 50mMKCl和5%甲酰胺,最终体积为50μl的缓冲液))得到。寡核苷酸煮沸 10分钟,缓慢冷却到37℃或室温。移去10μl用于在TAE缓冲系统 (Metaphorer;FMC)中的4%琼脂糖上分析。每一杂交的寡核苷酸对都通过 加入最终浓度为1mM的ATP、最终浓度为100μg/ml的BSA、200单位的多 核苷酸激酶以及10×PNK缓冲液(总体积为10μl)活化。杂交和磷酸化之 后,反应在37℃下温育2小时到过夜。加入对某一特定片段的片段的寡核苷 酸对10μl混合,最终体积为50μl。寡核苷酸对在80℃下加热10分钟杂交, 缓慢冷却到37℃。2μl的寡核苷酸用大约100ng的载体混合,使用含50mM Tris-HCl(pH7.8),10mM MgCl2,10mM二硫苏糖醇,1mM ATP的缓冲 液连接。按照标准方法,反应在室温下温育2小时或过夜,再转化进大肠杆 菌DH5a菌株,平铺到含浓度为100μg/ml的氨苄青霉素的L-平板上,进一步 确定阳性克隆的特征。并通过在EP 0618976中详细描述的使用通用引物 “Reverse”和M13“-20”作为引物的PCR筛选证实。阳性克隆通过用适当 的酶消化DNA再加上DNA测序鉴别。选择带有期望的DNA序列的重组体备 用。

PCR扩增和克隆进T-载体:PCR扩增通过使用所有低聚体的混合物进 行。其中混合物表示特定片段的上链和下链(每一个最终的浓度为5mM)作 为模板,特定片段的特异性末端引物(最终浓度为2μM)dATP,dPTP,dCTP 和dGTP各200μM 10mM Tris-HCl(pH8.3),50mM KCl,1.5mM MgCl2, 0.01%明胶以及5单位的聚合酶,最终体积为50μl。扩增反应在Perkin Elmer 热循环器9600中通过95℃下温育1分钟(一个周期)、90℃下温育20个周期 (每个周期45sec.)、50℃下45sec.、72℃下30sec.进行。最后在72℃下温育 5分钟,再分析产物。10μl的反应液用于在TAE缓冲系统中的2.5% Nusieve(FMC)琼脂糖凝胶上分析。正确大小的片段通过凝胶纯化,并被克 隆进PCR克隆载体或T-载体。T-载体构建体由Marchuk等叙述(核酸研究, 19:1154(1991))。pBluescriptsk+载体(Stratagener,Ca.)用作亲本载体。 正确克隆的转化和鉴别按上述的方法进行。

VIP1A(a)的片段1,3,4,5,6,8和9以及VIP2A(a)的片段2和4通过 PCR扩增产物的克隆获得;但是,VIP1A(a)的片段2,7,10和11以及VIP2A(a) 的片段1,3和5通过杂交/连接获得。

一旦获得带有期望序列的片段,可以通过把相邻的片段克隆到一起装配 成完整的基因。对完整的基因重新测序并测定其在转移进包含根优化启动子 的植物表达载体(发表在美国专利申请序列No.08 017,209,此处被参考文献 收编)和水稻肌动蛋白质启动子之前对WCRW的活性。

pCIB5521是这样一个植物表达载体。玉米优化的VIP1A(a)编码区(SEQ ID NO:26)克隆进一个植物表达载体。这个载体在带有PEP羧化酶内含子 #9的基因的5′端包含根优选的启动子,在3′端有35S终止子。质粒也包含质 粒pUC19抗氨苄青霉素的序列。另一个植物表达载体是pCIB5522,它包含 玉米优化的VIP2A(a)编码区(SEQ ID NO:27)和基因5′端的根优选启动子融 合的产物,此基因有PEP羧化酶内含子#9和其后3′端的35S终止子。

实施例25.NAD亲合层析

基于VIP2对低物NAD的亲合性可以使用一种纯化方法。在实施例4中描 述的用pH3.5的柠檬酸钠缓冲液处理的上清液透析进pH为7.5的20mM TRIS中,过夜。在中性化的上清液中加入相等体积的洗涤NAD琼脂糖并在4 ℃下轻微振荡温育过夜。树脂和蛋白质溶液加入到一次性10ml的一次性聚 丙烯层析柱中,使蛋白质溶液流出。层析柱用5倍于柱体积的pH7.5的20mM TRIS冲洗,然后用2-5倍柱体积的pH7.5的20mM TRIS、100mM NaCl冲 洗,接着再用2-5倍柱体积的的pH7.5的20mM TRIS冲洗。最后VIP蛋白质 用pH为7.5的20mM TRIS加上5mM NAD洗脱。大约收集到3倍于柱体积的 流出液,在Centricon-10中浓缩。典型的产量是每毫升树脂大约7-15μg蛋 白质。

当纯化的蛋白质通过SDS-PAGE以及其后的银染分析时,可见的有两条 多肽带,一个分子量大约为80,000,另一个分子量大约为45,000。测序表明 分子量为80,000的蛋白质对应于蛋白质水解处理的VIP1A(a)的加工形式,分 子量为45,000的蛋白质对应于蛋白质水解处理的VIP2A(a)的加工形式。 VIP1A(a)和VIP2A(a)的共纯化表明两种蛋白质可能形成一个复合物并有蛋 白质-蛋白质相互作用区域。以这种方式纯化的VIP1A(a)和VIP2A(a)对玉米 根叶甲是生物活性的。

实施例26.1玉米优化的VIP1A(a)和VIP2A(a)的表达

包含着不同的含有VIP基因的质粒的大肠杆菌菌株用于分析VIP的表 达。带有单个质粒的大肠杆菌菌株在L-肉汤中生长过夜并表达从上面实施例 3所述的培养物中提取的蛋白质。蛋白质表达使用抗体通过Western印迹分 析并用本领域已知的类似于在上面实施例12中所述的标准方法展开。同样, 表达的蛋白质对玉米根叶甲的杀虫活性根据上面实施例3中所述的方法测 定。大肠杆菌表达测定结果叙述如下:

                  大肠杆菌中VIP的表达 含有所需质粒的 大肠杆菌提取物   测定No.1   测定No.2   检测到蛋白质   死亡百分率 对照 pCIB5521(玉米优化 的VIP1A(a)) pCIB5522(玉米优化 的VIP2A(a)) pCIB6024(天然VIP2A(a)) pCIB6206(天然VIP1A(a)) pCIB5521+pCIB5522结合 的提取液 pCIB5521+pCIB6024结合 的提取液 pCIB5522+pCIB6206结合 的提取液   0   47     7     13   27   87     93     100   0   27     7     13   40   47     100     100   无   有     有     有   有 pCIB6024+pCIB6206结合 的提取液     100     100

这些质粒的DNA用于在玉米原生质体表达系统中过渡性地表达VIP。原 生质体从玉米2717第6系培养物通过使用纤维素酶RS和解析酶R10消化细 胞壁分离得到。原生质体通过过筛和离心回收。原生质体使用大约75g质粒 DNA和PEG-40用标准的直接转基因法转化。处理的原生质体在室温下黑暗 中培养过夜。VIP表达的分析通过在原生质外植体上Western印迹分析和通 过如上所述的在大肠杆菌中表达的方法进行对玉米根叶甲杀虫活性的分析 来完成。玉米原生质体表达测定的结果如下:

                    VIP在植物原生质体中的表达 测定的提取液     测定No.1     测定No.2   检测到蛋白质     死亡百分率(%) 无DNA对照 pCIB5521(p)(玉米 优化的VIP1A(a)) pCIB5522(p)(玉米 优化的VIP2A(a)) pCIB5521(p)+pCIB5522(p) 结合的提取物 pCIB5521(p)+pCIB5522(e)   结合提取物 pCIB5522(p)+pCIB5521(e) 结合提取物     27     20(0)       20(0)       87(82)       100          53(56)     10     30       20       90       -         -   无   有     有 pCIB5521(p)+pCIB6024(e) 结合提取物 pCIB5522(p)+pCIB6206(e) 结合提取物 pCIB6024(e)(天然VIP2A(a)) pCIB6206(e)(天然VIP1A(a)) pCIB5521+pCIB5522(通过转 化传送的质粒)     100       100       0     20     100     -       -       -     -     100             有     有     有

(p)=用所需的质粒转化的原生质体培养物的提取物

(e)=包含所需质粒的大肠杆菌的提取物

用玉米和大肠杆菌所获得的表达数据表明:玉米优化的VIP1A(a)和 VIP2A(a)基因分别与天然VIP1A(a)和VIP2A(a)基因编码相同的蛋白质。而 且,由玉米优化基因编码的蛋白质和天然基因编码的蛋白质是功能等价物。

在本说明书中提到的所有出版物和专利应用表明了与本发明有关适合的 本领域技术人员的水平。本文一并参考的所有出版物和专利申请与特别或单 独指出的本文一并参考的单个出版物或专利申请在相同程度上被参考。

下列寄存物保藏于农业研究机构保藏中心(NRRL)北方地区研究中心 (美国,伊利诺斯州61604,彼奥利亚,北大学街1815号):  菌株定名     保存号     保存日期  1.大肠杆菌PL2  2.大肠杆菌PL2  3.大肠杆菌pCIB6022  4.大肠杆菌pCIB6023  5.大肠杆菌pC186023     NRRL B-21221     NRRL B-21221N     NRRL B-21222     NRRL B-21223     NRRL B-21223N     1994.3.9     1994.9.2     1994.3.9     1994.3.9     1994.9.2  6.苏云金芽孢杆菌HD73-78VIP  7.苏云金芽孢杆菌AB88  8.苏云金芽孢杆菌AB359  9.苏云金芽孢杆菌AB289  10.芽孢杆菌属一个种AB59  11.芽孢杆菌属一个种AB294  12.芽孢杆菌属一个种AB256  13.大肠杆菌P5-4  14.大肠杆菌P3-12  15.蜡状芽孢杆菌AB78  16.苏云金芽孢杆菌AB6  17.大肠杆菌pCIB6202  18.大肠杆菌pCIB7100  19.大肠杆菌pCIB7101  20.大肠杆菌pCIB7102  21.大肠杆菌pCIB7103  22.大肠杆菌pCIB7104  23.大肠杆菌pCIB7107  24.大肠杆菌pCIB7108  25.苏云金芽孢杆菌AB424   NRRL B-21224   NRRL B-21225   NRRL B-21226   NRRL B-21227   NRRL B-21228   NRRL B-21229   NRRL B-21230   NRRL B-21059   NRRL B-21061   NRRL B-21058   NRRL B-21060   NRRL B-21321   NRRL B-21322   NRRL B-21323   NRRL B-21324   NRRL B-21325   NRRL B-21422   NRRL B-21423   NRRL B-21438   NRRL B-21439   1994.3.9   1994.3.9   1994.3.9   1994.3.9   1994.3.9   1994.3.9   1994.3.9   1993.3.18   1993.3.18   1993.3.18   1993.3.18   1994.9.2   1994.9.2   1994.9.2   1994.9.2   1994.9.2   1995.3.24   1995.3.24   1995.5.5   1995.5.5

尽管为了清楚理解前面通过说明和实施例详细描述了本发明,很明显在 所附的权利要求书的范围内一定的改变和修正是可实施的。

                     序  列  表

(1)一般信息:

    (A)姓名:CIBA-GEIGY AG

    (B)街道:Klybeckstr.141

    (C)城市:巴塞尔

    (E)国家:瑞士

    (F)邮区代码(ZIP):4002

    (G)电话:+41 61 69 1111

    (H)传真:+41 61 696 79 76

    (I)电传:962 991

  (ii)发明名称:新杀虫蛋白质和菌株

  (iii)序列数:52个

  (iv)计算机可读形式:

    (A)介质类型:软盘

    (B)计算机:IBM PC兼容机

    (C)操作系统:PCDOS/MS-DOS

    (D)软件:PatentIn Release#1.0,版本#1.30B

(2)SEQ ID NO:1信息:

  (i)序列特征:

    (A)长度:6049个碱基对

    (B)类型:核酸

    (C)链型:单链

    (D)拓扑结构:线性

  (ii)分子类型:DNA(基因组)

  (vi)原始来源:

    (A)有机体:蜡状芽孢杆菌

    (B)菌株:AB78

  (C)单独的分离物:NRRL B-21058

(ix)特征:

  (A)名称/关键词:CDS

  (B)位置:1082..2467

  (D)其它信息:/产物=″VIP2A(a)″

(ix)特征:

  (A)名称/关键词:misc_特征

  (B)位置:2475..5126

  (D)其它信息:/注=″100kd VIP1A(a)蛋白质的编码序列。该编 码序列在SEQ ID NO:4中重复并单独翻译″

(xi)序列描述:SEQ ID NO:1:

ATCGATACAA TGTTGTTTTA CTTAGACCGG TAGTCTCTGT AATTTGTTTA ATGCTATATT    60

CTTTACTTTG ATACATTTTA ATAGCCATTT CAACCTTATC AGTATGTTTT TGTGGTCTTC    120

CTCCTTTTTT TCCACGAGCT CTAGCTGCGT TTAATCCTGT TTTGGTACGT TCGCTAATAA    180

TATCTCTTTC TAATTCTGCA ATACTTGCCA TCATTCGAAA GAAGAATTTC CCCATAGCAT    240

TAGAGGTATC AATGTTGTCA TGAATAGAAA TAAAATCTAC ACCTAGCTCT TTGAATTTTT    300

CACTTAACTC AATTAGGTGT TTTGTAGAGC GAGAAATTCG ATCAAGTTTG TAAACAACTA    360

TCTTATCGCC TTTACGTAAT ACTTTTAGCA ACTCTTCGAG TTGAGGGCGC TCTTTTTTTA    420

TTCCTGTTAT TTTCTCCTGA TATAGCCTTT CTACACCATA TTGTTGCAAA GCATCTATTT    480

GCATATCGAG ATTTTGTTCT TCTGTGCTGA CACGAGCATA ACCAAAAATC AAATTGGTTT    540

CACTTCCTAT CTAAATATAT CTATTAAAAT AGCACCAAAA ACCTTATTAA ATTAAAATAA    600

GGAACTTTGT TTTTGGATAT GGATTTTGGT ACTCAATATG GATGAGTTTT TAACGCTTTT    660

GTTAAAAAAC AAACAAGTGC CATAAACGGT CGTTTTTGGG ATGACATAAT AAATAATCTG    720

TTTGATTAAC CTAACCTTGT ATCCTTACAG CCCAGTTTTA TTTGTACTTC AACTGACTGA    780

ATATGAAAAC AACATGAAGG TTTCATAAAA TTTATATATT TTCCATAACG GATGCTCTAT    840

CTTTAGGTTA TAGTTAAATT ATAAGAAAAA AACAAACGGA GGGAGTGAAA AAAAGCATCT    900

TCTCTATAAT TTTACAGGCT CTTTAATAAG AAGGGGGGAG ATTAGATAAT AAATATGAAT    960

ATCTATCTAT AATTGTTTGC TTCTACAATA ACTTATCTAA CTTTCATATA CAACAACAAA   1020

ACAGACTAAA TCCAGATTGT ATATTCATTT TCAGTTGTTC CTTTATAAAA TAATTTCATA   1080

A ATG AAA AGA ATG GAG GGA AAG TTG TTT ATG GTG TCA AAA AAA TTA      1126

  Met Lys Arg Met Glu Gly Lys Leu Phe Met Val Ser Lys Lys Leu

    1               5                  10                  15

CAA GTA GTT ACT AAA ACT GTA TTG CTT AGT ACA GTT TTC TCT ATA TCT    1174

Gln Val Val Thr Lys Thr Val Leu Leu Ser Thr Val Phe Ser Ile Ser

                 20                  25                  30

TTA TTA AAT AAT GAA GTG ATA AAA GCT GAA CAA TTA AAT ATA AAT TCT    1222

Leu Leu Asn Asn Glu Val Ile Lys Ala Glu Gln Leu Asn Ile Asn Ser

             35                  40                  45

CAA AGT AAA TAT ACT AAC TTG CAA AAT CTA AAA ATC ACT GAC AAG GTA    1270

Gln Ser Lys Tyr Thr Asn Leu Gln Asn Leu Lys Ile Thr Asp Lys Val

         50                  55                  60

GAG GAT TTT AAA GAA GAT AAG GAA AAA GCG AAA GAA TGG GGG AAA GAA    1318

Glu Asp Phe Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu

     65                  70                  75

AAA GAA AAA GAG TGG AAA CTA ACT GCT ACT GAA AAA GGA AAA ATG AAT    1366

Lys Glu Lys Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn

 80                  85                  90                  95

AAT TTT TTA GAT AAT AAA AAT GAT ATA AAG ACA AAT TAT AAA GAA ATT    1414

Asn Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile

                100                 105                 110

ACT TTT TCT ATG GCA GGC TCA TTT GAA GAT GAA ATA AAA GAT TTA AAA    1462

Thr Phe Ser Met Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys

            115                 120                 125

GAA ATT GAT AAG ATG TTT GAT AAA ACC AAT CTA TCA AAT TCT ATT ATC    1510

Glu Ile Asp Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile

        130                 135                 140

ACC TAT AAA AAT GTG GAA CCG ACA ACA ATT GGA TTT AAT AAA TCT TTA    1558

Thr Tyr Lys Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu

    145                 150                 155

ACA GAA GGT AAT ACG ATT AAT TCT GAT GCA ATG GCA CAG TTT AAA GAA    1606

Thr Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu

160                 165                 170                 175

CAA TTT TTA GAT AGG GAT ATT AAG TTT GAT AGT TAT CTA GAT ACG CAT    1654

Gln Phe Leu Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His

                180                 185                 190

TTA ACT GCT CAA CAA GTT TCC AGT AAA GAA AGA GTT ATT TTG AAG GTT    1702

Leu Thr Ala Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val

            195                 200                 205

ACG GTT CCG AGT GGG AAA GGT TCT ACT ACT CCA ACA AAA GCA GGT GTC    1750

Thr Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val

        210                 215                 220

ATT TTA AAT AAT AGT GAA TAC AAA ATG CTC ATT GAT AAT GGG TAT ATG    1798

Ile Leu Asn Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Met

    225                 230                 235

GTC CAT GTA GAT AAG GTA TCA AAA GTG GTG AAA AAA GGG GTG GAG TGC    1846

Val His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Val Glu Cys

240                 245                 250                 255

TTA CAA ATT GAA GGG AGT TTA AAA AAG AGT CTT GAC TTT AAA AAT GAT    1894

Leu Gln Ile Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp

                260                 265                 270

ATA AAT GCT GAA GCG CAT AGC TGG GGT ATG AAG AAT TAT GAA GAG TGG    1942

Ile Asn Ala Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp

            275                 280                 285

GCT AAA GAT TTA ACC GAT TCG CAA AGG GAA GCT TTA GAT GGG TAT GCT    1990

Ala Lys Asp Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala

         290                295                 300

AGG CAA GAT TAT AAA GAA ATC AAT AAT TAT TTA AGA AAT CAA GGC GGA    2038

Arg Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly

    305                 310                 315

AGT GGA AAT GAA AAA CTA GAT GCT CAA ATA AAA AAT ATT TCT GAT GCT    2086

Ser Gly Asn Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala

320                 325                 330                 335

TTA GGG AAG AAA CCA ATA CCG GAA AAT ATT ACT GTG TAT AGA TGG TGT    2134

Leu Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys

                340                 345                 350

GGC ATG CCG GAA TTT GGT TAT CAA ATT AGT GAT CCG TTA CCT TCT TTA    2182

Gly Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu

            355                 360                 365

AAA GAT TTT GAA GAA CAA TTT TTA AAT ACA ATC AAA GAA GAC AAA GGA    2230

Lys Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly

        370                 375                 380

TAT ATG AGT ACA AGC TTA TCG AGT GAA CGT CTT GCA GCT TTT GGA TCT    2278

Tyr Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser

    385                 390                 395

AGA AAA ATT ATA TTA CGA TTA CAA GTT CCG AAA GGA AGT ACG GGT GCG    2326

Arg Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala

400                 405                 410                 415

TAT TTA AGT GCC ATT GGT GGA TTT GCA AGT GAA AAA GAG ATC CTA CTT    2374

Tyr Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu

                420                 425                 430

GAT AAA GAT AGT AAA TAT CAT ATT GAT AAA GTA ACA GAG GTA ATT ATT    2422

Asp Lys Asp Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile

            435                 440                 445

AAA GGT GTT AAG CGA TAT GTA GTG GAT GCA ACA TTA TTA ACA AAT    2467

Lys Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn

        450                 455                 460

TAAGGAGATG AAAAATATGA AGAAAAAGTT AGCAAGTGTT GTAACGTGTA CGTTATTAGC    2527

TCCTATGTTT TTGAATGGAA ATGTGAATGC TGTTTACGCA GACAGCAAAA CAAATCAAAT    2587

TTCTACAACA CAGAAAAATC AACAGAAAGA GATGGACCGA AAAGGATTAC TTGGGTATTA    2647

TTTCAAAGGA AAAGATTTTA GTAATCTTAC TATGTTTGCA CCGACACGTG ATAGTACTCT    2707

TATTTATGAT CAACAAACAG CAAATAAACT ATTAGATAAA AAACAACAAG AATATCAGTC    2767

TATTCGTTGG ATTGGTTTGA TTCAGAGTAA AGAAACGGGA GATTTCACAT TTAACTTATC    2827

TGAGGATGAA CAGGCAATTA TAGAAATCAA TGGGAAAATT ATTTCTAATA AAGGGAAAGA    2887

AAAGCAAGTT GTCCATTTAG AAAAAGGAAA ATTAGTTCCA ATCAAAATAG AGTATCAATC    2947

AGATACAAAA TTTAATATTG ACAGTAAAAC ATTTAAAGAA CTTAAATTAT TTAAAATAGA    3007

TAGTCAAAAC CAACCCCAGC AAGTCCAGCA AGATGAACTG AGAAATCCTG AATTTAACAA    3067

GAAAGAATCA CAGGAATTCT TAGCGAAACC ATCGAAAATA AATCTTTTCA CTCAAAAAAT    3127

GAAAAGGGAA ATTGATGAAG ACACGGATAC GGATGGGGAC TCTATTCCTG ACCTTTGGGA    3187

AGAAAATGGG TATACGATTC ACAATAGAAT CGCTGTAAAG TGGGACGATT CTCTAGCAAG    3247

TAAAGGGTAT ACGAAATTTG TTTCAAATCC ACTAGAAAGT CACACAGTTG GTGATCCTTA    3307

TACAGATTAT GAAAAGGCAG CAAGAGATCT AGATTTGTCA AATGCAAAGG AAACGTTTAA    3367

CCCATTGGTA GCTGCTTTTC CAAGTGTGAA TGTTAGTATG GAAAAGGTGA TATTATCACC    3427

AAATGAAAAT TTATCCAATA GTGTAGAGTC TCATTCATCC ACGAATTGGT CTTATACAAA    3487

TACAGAAGGT GCTTCTGTTG AAGCGGGGAT TGGACCAAAA GGTATTTCGT TCGGAGTTAG    3547

CGTAAACTAT CAACACTCTG AAACAGTTGC ACAAGAATGG GGAACATCTA CAGGAAATAC    3607

TTCGCAATTC AATACGGCTT CAGCGGGATA TTTAAATGCA AATGTTCGAT ATAACAATGT    3667

AGGAACTGGT GCCATCTACG ATGTAAAACC TACAACAAGT TTTGTATTAA ATAACGATAC    3727

TATCGCAACT ATTACGGCGA AATCTAATTC TACAGCCTTA AATATATCTC CTGGAGAAAG    3787

TTACCCGAAA AAAGGACAAA ATGGAATCGC AATAACATCA ATGGATGATT TTAATTCCCA    3847

TCCGATTACA TTAAATAAAA AACAAGTAGA TAATCTGCTA AATAATAAAC CTATGATGTT    3907

GGAAACAAAC CAAACAGATG GTGTTTATAA GATAAAAGAT ACACATGGAA ATATAGTAAC    3967

TGGCGGAGAA TGGAATGGTG TCATACAACA AATCAAGGCT AAAACAGCGT CTATTATTGT    4027

GGATGATGGG GAACGTGTAG CAGAAAAACG TGTAGCGGCA AAAGATTATG AAAATCCAGA    4087

AGATAAAACA CCGTCTTTAA CTTTAAAAGA TGCCCTGAAG CTTTCATATC CAGATGAAAT    4147

AAAAGAAATA GAGGGATTAT TATATTATAA AAACAAACCG ATATACGAAT CGAGCGTTAT    4207

GACTTACTTA GATGAAAATA CAGCAAAAGA AGTGACCAAA CAATTAAATG ATACCACTGG    4267

GAAATTTAAA GATGTAAGTC ATTTATATGA TGTAAAACTG ACTCCAAAAA TGAATGTTAC    4327

AATCAAATTG TCTATACTTT ATGATAATGC TGAGTCTAAT GATAACTCAA TTGGTAAATG    4387

GACAAACACA AATATTGTTT CAGGTGGAAA TAACGGAAAA AAACAATATT CTTCTAATAA    4447

TCCGGATGCT AATTTGACAT TAAATACAGA TGCTCAAGAA AAATTAAATA AAAATCGTGA    4507

CTATTATATA AGTTTATATA TGAAGTCAGA AAAAAACACA CAATGTGAGA TTACTATAGA    4567

TGGGGAGATT TATCCGATCA CTACAAAAAC AGTGAATGTG AATAAAGACA ATTACAAAAG    4627

ATTAGATATT ATAGCTCATA ATATAAAAAG TAATCCAATT TCTTCACTTC ATATTAAAAC    4687

GAATGATGAA ATAACTTTAT TTTGGGATGA TATTTCTATA ACAGATGTAG CATCAATAAA    4747

ACCGGAAAAT TTAACAGATT CAGAAATTAA ACAGATTTAT AGTAGGTATG GTATTAAGTT    4807

AGAAGATGGA ATCCTTATTG ATAAAAAAGG TGGGATTCAT TATGGTGAAT TTATTAATGA    4867

AGCTAGTTTT AATATTGAAC CATTGCAAAA TTATGTGACC AAATATGAAG TTACTTATAG    4927

TAGTGAGTTA GGACCAAACG TGAGTGACAC ACTTGAAAGT GATAAAATTT ACAAGGATGG    4987

GACAATTAAA TTTGATTTTA CCAAATATAG TAAAAATGAA CAAGGATTAT TTTATGACAG    5047

TGGATTAAAT TGGGACTTTA AAATTAATGC TATTACTTAT GATGGTAAAG AGATGAATGT    5107

TTTTCATAGA TATAATAAAT AGTTATTATA TCTATGAAGC TGGTGCTAAA GATAGTGTAA    5167

AAGTTAATAT ACTGTAGGAT TGTAATAAAA GTAATGGAAT TGATATCGTA CTTTGGAGTG    5227

GGGGATACTT TGTAAATAGT TCTATCAGAA ACATTAGACT AAGAAAAGTT ACTACCCCCA    5287

CTTGAAAATG AAGATTCAAC TGATTACAAA CAACCTGTTA AATATTATAA GGTTTTAACA    5347

AAATATTAAA CTCTTTATGT TAATACTGTA ATATAAAGAG TTTAATTGTA TTCAAATGAA    5407

GCTTTCCCAC AAAATTAGAC TGATTATCTA ATGAAATAAT CAGTCTAATT TTGTAGAACA    5467

GGTCTGGTAT TATTGTACGT GGTCACTAAA AGATATCTAA TATTATTGGG CAAGGCGTTC    5527

CATGATTGAA TCCTCGAATG TCTTGCCCTT TTCATTTATT TAAGAAGGAT TGTGGAGAAA    5587

TTATGGTTTA GATAATGAAG AAAGACTTCA CTTCTAATTT TTGATGTTAA ATAAATCAAA    5647

ATTTGGCGAT TCACATTGTT TAATCCACTG ATAAAACATA CTGGAGTGTT CTTAAAAAAT    5707

CAGCTTTTTT CTTTATAAAA TTTTGCTTAG CGTACGAAAT TCGTGTTTTG TTGGTGGGAC    5767

CCCATGCCCA TCAACTTAAG AGTAAATTAG TAATGAACTT TCGTTCATCT GGATTAAAAT    5827

AACCTCAAAT TAGGACATGT TTTTAAAAAT AAGCAGACCA AATAAGCCTA GAATAGGTAT    5887

CATTTTTAAA AATTATGCTG CTTTCTTTTG TTTTCCAAAT CCATTATACT CATAAGCAAC    5947

ACCCATAATG TCAAAGACTG TTTTTGTCTC ATATCGATAA GCTTGATATC GAATTCCTGC    6007

AGCCCGGGGG ATCCACTAGT TCTAGAGCGG CCGCCACCGC GG                       6049

(2)SEQ ID NO:2信息:

  (i)序列特征:

    (A)长度:462个氨基酸

    (B)类型:氨基酸

    (D)拓扑结构:线性

  (ii)分子类型:蛋白质

  (xi)序列描述:SEQ ID NO:2:

Met Lys Arg Met Glu Gly Lys Leu Phe Met Val Ser Lys Lys Leu Gln

  1               5                  10                  15

Val Val Thr Lys Thr Val Leu Leu Ser Thr Val Phe Ser Ile Ser Leu

             20                  25                  30

Leu Asn Asn Glu Val Ile Lys Ala Glu Gln Leu Asn Ile Asn Ser Gln

         35                  40                  45

Ser Lys Tyr Thr Asn Leu Gln Asn Leu Lys Ile Thr Asp Lys Val Glu

     50                  55                  60

Asp Phe Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys

 65                  70                  75                  80

Glu Lys Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn Asn

                 85                  90                  95

Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr

            100                 105                 110

Phe Ser Met Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu

        115                 120                 125

Ile Asp Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile Thr

    130                 135                 140

Tyr Lys Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu Thr

145                 150                 155                 160

Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln

                165                     170                 175

Phe Leu Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu

            180                 185                 190

Thr Ala Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val Thr

        195                 200                 205

Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile

    210                 215                 220

Leu Asn Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Met Val

225                 230                 235                 240

His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Val Glu Cys Leu

                245                 250                 255

Gln Ile Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile

            260                 265                 270

Asn Ala Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp Ala

        275                 280                 285

Lys Asp Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp GLy Tyr Ala Arg

    290                 295                 300

Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser

305                 310                 315                 320

Gly Asn Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala Leu

                325                 330                 335

Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly

            340                 345                 350

Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys

        355                 360                 365

Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr

    370                 375                 380

Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg

385                 390                 395                 400

Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr

                405                 410                 415

Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp

            420                 425                 430

Lys Asp Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile Lys

        435                 440                 445

Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn

    450                 455                 460

(2)SEQ ID NO:3信息:

  (i)序列特征:

    (A)长度:20个氨基酸

    (B)类型:氨基酸

    (C)链型:单链

    (D)拓扑结构:线性

  (ii)分子类型:蛋白质

  (ix)特征:

    (A)名称/关键词:肽

    (B)位置:1..20

    (D)其它信息:/注=″用于液泡定位的信号肽″

(xi)序列描述:SEQ ID NO:3:

Ser Ser Ser Ser Phe Ala Asp Ser Asn Pro Ile Arg Val Thr Asp Arg

1               5                   10                  15

Ala Ala Ser Thr

            20

(2)SEQ ID NO:4信息:

  (i)序列特征:

    (A)长度:2655个碱基对

    (B)类型:核酸

    (C)链型:单链

    (D)拓扑结构:线性

  (ii)分子类型:DNA(基因组)

  (iii)假设:否

  (iv)反义:否

  (vi)原始来源:

    (A)有机体:蜡状芽孢杆菌

    (B)菌株:AB78

    (C)单独的分离物:NRRL B-21058

(ix)特征:

  (A)名称/关键词:CDS

  (B)位置:1..2652

  (D)其它信息:/注=″100kd蛋白质VIP1A(a)″

/注=″这一序列与SEQ ID NO:1:的核苷酸2475-5126之间的部分相同″

(xi)序列描述:SEQ ID NO:4:

ATG AAA AAT ATG AAG AAA AAG TTA GCA AGT GTT GTA ACG TGT ACG TTA    48

Met Lys Asn Met Lys Lys Lys Leu Ala Ser Val Val Thr Cys Thr Leu

        465                 470                 475

TTA GCT CCT ATG TTT TTG AAT GGA AAT GTG AAT GCT GTT TAC GCA GAC    96

Leu Ala Pro Met Phe Leu Asn Gly Asn Val Asn Ala Val Tyr Ala Asp

    480                 485                 490

AGC AAA ACA AAT CAA ATT TCT ACA ACA CAG AAA AAT CAA CAG AAA GAG   144

Ser Lys Thr Asn Gln Ile Ser Thr Thr Gln Lys Asn Gln Gln Lys Glu

495                 500                 505                 510

ATG GAC CGA AAA GGA TTA CTT GGG TAT TAT TTC AAA GGA AAA GAT TTT   192

Met Asp Arg Lys Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys Asp Phe

                515                 520                 525

AGT AAT CTT ACT ATG TTT GCA CCG ACA CGT GAT AGT ACT CTT ATT TAT   240

Ser Asn Leu Thr Met Phe Ala Pro Thr Arg Asp Ser Thr Leu Ile Tyr

            530                 535                 540

GAT CAA CAA ACA GCA AAT AAA CTA TTA GAT AAA AAA CAA CAA GAA TAT   288

Asp Gln Gln Thr Ala Asn Lys Leu Leu Asp Lys Lys Gln Gln Glu Tyr

        545                 550                 555

CAG TCT ATT CGT TGG ATT GGT TTG ATT CAG AGT AAA GAA ACG GGA GAT   336

Gln Ser Ile Arg Trp Ile Gly Leu Ile Gln Ser Lys Glu Thr Gly Asp

    560                 565                 570

TTC ACA TTT AAC TTA TCT GAG GAT GAA CAG GCA ATT ATA GAA ATC AAT   384

Phe Thr Phe Asn Leu Ser Glu Asp Glu Gln Ala Ile Ile Glu Ile Asn

575                 580                 585                 590

GGG AAA ATT ATT TCT AAT AAA GGG AAA GAA AAG CAA GTT GTC CAT TTA   432

Gly Lys Ile Ile Ser Asn Lys Gly Lys Glu Lys Gln Val Val His Leu

                595                 600                 605

GAA AAA GGA AAA TTA GTT CCA ATC AAA ATA GAG TAT CAA TCA GAT ACA   480

Glu Lys Gly Lys Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser Asp Thr

            610                 615                 620

AAA TTT AAT ATT GAC AGT AAA ACA TTT AAA GAA CTT AAA TTA TTT AAA   528

Lys Phe Asn Ile Asp Ser Lys Thr Phe Lys Glu Leu Lys Leu Phe Lys

        625                 630                 635

ATA GAT AGT CAA AAC CAA CCC CAG CAA GTC CAG CAA GAT GAA CTG AGA   576

Ile Asp Ser Gln Asn Gln Pro Gln Gln Val Gln Gln Asp Glu Leu Arg

    640                 645                 650

AAT CCT GAA TTT AAC AAG AAA GAA TCA CAG GAA TTC TTA GCG AAA CCA     624

Asn Pro Glu Phe Asn Lys Lys Glu Ser Gln Glu Phe Leu Ala Lys Pro

655                 660                 665                 670

TCG AAA ATA AAT CTT TTC ACT CAA AAA ATG AAA AGG GAA ATT GAT GAA     672

Ser Lys Ile Asn Leu Phe Thr Gln Lys Met Lys Arg Glu Ile Asp Glu

                675                 680                 685

GAC ACG GAT ACG GAT GGG GAC TCT ATT CCT GAC CTT TGG GAA GAA AAT     720

Asp Thr Asp Thr Asp Gly Asp Ser Ile Pro Asp Leu Trp Glu Glu Asn

            690                 695                 700

GGG TAT ACG ATT CAA AAT AGA ATC GCT GTA AAG TGG GAC GAT TCT CTA     768

Gly Tyr Thr Ile Gln Asn Arg Ile Ala Val Lys Trp Asp Asp Ser Leu

        705                 710                 715

GCA AGT AAA GGG TAT ACG AAA TTT GTT TCA AAT CCA CTA GAA AGT CAC     816

Ala Ser Lys Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Glu Ser His

    720                 725                 730

ACA GTT GGT GAT CCT TAT ACA GAT TAT GAA AAG GCA GCA AGA GAT CTA     864

Thr Val Gly Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg Asp Leu

735                 740                 745                 750

GAT TTG TCA AAT GCA AAG GAA ACG TTT AAC CCA TTG GTA GCT GCT TTT     912

Asp Leu Ser Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala Phe

                755                 760                 765

CCA AGT GTG AAT GTT AGT ATG GAA AAG GTG ATA TTA TCA CCA AAT GAA     960

Pro Ser Val Asn Val Ser Met Glu Lys Val Ile Leu Ser Pro Asn Glu

            770                 775                 780

AAT TTA TCC AAT AGT GTA GAG TCT CAT TCA TCC ACG AAT TGG TCT TAT    1008

Asn Leu Ser Asn Ser Val Glu Ser His Ser Ser Thr Asn Trp Ser Tyr

        785                 790                 795

ACA AAT ACA GAA GGT GCT TCT GTT GAA GCG GGG ATT GGA CCA AAA GGT    1056

Thr Asn Thr Glu Gly Ala Ser Val Glu Ala Gly Ile Gly Pro Lys Gly

    800                 805                 810

ATT TCG TTC GGA GTT AGC GTA AAC TAT CAA CAC TCT GAA ACA GTT GCA    1104

Ile Ser Phe Gly Val Ser Val Asn Tyr Gln His Ser Glu Thr Val Ala

815                 820                 825                 830

CAA GAA TGG GGA ACA TCT ACA GGA AAT ACT TCG CAA TTC AAT ACG GCT    1152

Gln Glu Trp Gly Thr Ser Thr Gly Asn Thr Ser Gln Phe Asn Thr Ala

                835                 840                 845

TCA GCG GGA TAT TTA AAT GCA AAT GTT CGA TAT AAC AAT GTA GGA ACT    1200

Ser Ala Gly Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val Gly Thr

            850                 855                 860

GGT GCC ATC TAC GAT GTA AAA CCT ACA ACA AGT TTT GTA TTA AAT AAC    1248

Gly Ala Ile Tyr Asp Val Lys Pro Thr Thr Ser Phe Val Leu Asn Asn

        865                 870                 875

GAT ACT ATC GCA ACT ATT ACG GCG AAA TCT AAT TCT ACA GCC TTA AAT    1296

Asp Thr Ile Ala Thr Ile Thr Ala Lys Ser Asn Ser Thr Ala Leu Asn

    880                 885                 890

ATA TCT CCT GGA GAA AGT TAC CCG AAA AAA GGA CAA AAT GGA ATC GCA    1344

Ile Ser Pro Gly Glu Ser Tyr Pro Lys Lys Gly Gln Asn Gly Ile Ala

895                 900                 905                 910

ATA ACA TCA ATG GAT GAT TTT AAT TCC CAT CCG ATT ACA TTA AAT AAA    1392

Ile Thr Ser Met Asp Asp Phe Asn Ser His Pro Ile Thr Leu Asn Lys

                915                 920                 925

AAA CAA GTA GAT AAT CTG CTA AAT AAT AAA CCT ATG ATG TTG GAA ACA    1440

Lys Gln Val Asp Asn Leu Leu Asn Asn Lys Pro Met Met Leu Glu Thr

            930                 935                 940

AAC CAA ACA GAT GGT GTT TAT AAG ATA AAA GAT ACA CAT GGA AAT ATA    1488

Asn Gln Thr Asp Gly Val Tyr Lys Ile Lys Asp Thr His Gly Asn Ile

        945                 950                 955

GTA ACT GGC GGA GAA TGG AAT GGT GTC ATA CAA CAA ATC AAG GCT AAA    1536

Val Thr Gly Gly Glu Trp Asn Gly Val Ile Gln Gln Ile Lys Ala Lys

    960                 965                 970

ACA GCG TCT ATT ATT GTG GAT GAT GGG GAA CGT GTA GCA GAA AAA CGT    1584

Thr Ala Ser Ile Ile Val Asp Asp Gly Glu Arg Val Ala Glu Lys Arg

975                 980                 985                 990

GTA GCG GCA AAA GAT TAT GAA AAT CCA GAA GAT AAA ACA CCG TCT TTA    1632

Val Ala Ala Lys Asp Tyr Glu Asn Pro Glu Asp Lys Thr Pro Ser Leu

                995                 1000                1005

ACT TTA AAA GAT GCC CTG AAG CTT TCA TAT CCA GAT GAA ATA AAA GAA    1680

Thr Leu Lys Asp Ala Leu Lys Leu Ser Tyr Pro Asp Glu Ile Lys Glu

            1010                1015                1020

ATA GAG GGA TTA TTA TAT TAT AAA AAC AAA CCG ATA TAC GAA TCG AGC    1728

Ile Glu Gly Leu Leu Tyr Tyr Lys Asn Lys Pro Ile Tyr Glu Ser Ser

        1025                1030                1035

GTT ATG ACT TAC TTA GAT GAA AAT ACA GCA AAA GAA GTG ACC AAA CAA    1776

Val Met Thr Tyr Leu Asp Glu Asn Thr Ala Lys Glu Val Thr Lys Gln

    1040                1045                1050

TTA AAT GAT ACC ACT GGG AAA TTT AAA GAT GTA AGT CAT TTA TAT GAT    1824

Leu Asn Asp Thr Thr Gly Lys Phe Lys Asp Val Ser His Leu Tyr Asp

1055                1060                1065               1070

GTA AAA CTG ACT CCA AAA ATG AAT GTT ACA ATC AAA TTG TCT ATA CTT    1872

Val Lys Leu Thr Pro Lys Met Asn Val Thr Ile Lys Leu Ser Ile Leu

                1075                1080                1085

TAT GAT AAT GCT GAG TCT AAT GAT AAC TCA ATT GGT AAA TGG ACA AAC    1920

Tyr Asp Asn Ala Glu Ser Asn Asp Asn Ser Ile Gly Lys Trp Thr Asn

            1090                1095                1100

ACA AAT ATT GTT TCA GGT GGA AAT AAC GGA AAA AAA CAA TAT TCT TCT    1968

Thr Asn Ile Val Ser Gly Gly Asn Asn Gly Lys Lys Gln Tyr Ser Ser

        1105                1110                1115

AAT AAT CCG GAT GCT AAT TTG ACA TTA AAT ACA GAT GCT CAA GAA AAA    2016

Asn Asn Pro Asp Ala Asn Leu Thr Leu Asn Thr Asp Ala Gln Glu Lys

    1120                1125                1130

TTA AAT AAA AAT CGT GAC TAT TAT ATA AGT TTA TAT ATG AAG TCA GAA    2064

Leu Asn Lys Asn Arg Asp Tyr Tyr Ile Ser Leu Tyr Met Lys Ser Glu

1135                1140                1145                1150

AAA AAC ACA CAA TGT GAG ATT ACT ATA GAT GGG GAG ATT TAT CCG ATC    2112

Lys Asn Thr Gln Cys Glu Ile Thr Ile Asp Gly Glu Ile Tyr Pro Ile

                1155                1160                1165

ACT ACA AAA ACA GTG AAT GTG AAT AAA GAC AAT TAC AAA AGA TTA GAT    2160

Thr Thr Lys Thr Val Asn Val Asn Lys Asp Asn Tyr Lys Arg Leu Asp

            1170                1175                1180

ATT ATA GCT CAT AAT ATA AAA AGT AAT CCA ATT TCT TCA CTT CAT ATT    2208

Ile Ile Ala His Asn Ile Lys Ser Asn Pro Ile Ser Ser Leu His Ile

        1185                1190                1195

AAA ACG AAT GAT GAA ATA ACT TTA TTT TGG GAT GAT ATT TCT ATA ACA    2256

Lys Thr Asn Asp Glu Ile Thr Leu Phe Trp Asp Asp Ile Ser Ile Thr

    1200                1205                1210

GAT GTA GCA TCA ATA AAA CCG GAA AAT TTA ACA GAT TCA GAA ATT AAA    2304

Asp Val Ala Ser Ile Lys Pro Glu Asn Leu Thr Asp Ser Glu Ile Lys

1215                1220                1225                1230

CAG ATT TAT AGT AGG TAT GGT ATT AAG TTA GAA GAT GGA ATC CTT ATT    2352

Gln Ile Tyr Ser Arg Tyr Gly Ile Lys Leu Glu Asp Gly Ile Leu Ile

                1235                1240                1245

GAT AAA AAA GGT GGG ATT CAT TAT GGT GAA TTT ATT AAT GAA GCT AGT    2400

Asp Lys Lys Gly Gly Ile His Tyr Gly Glu Phe Ile Asn Glu Ala Ser

            1250                1255                1260

TTT AAT ATT GAA CCA TTG CAA AAT TAT GTG ACC AAA TAT GAA GTT ACT    2448

Phe Asn Ile Glu pro Leu Gln Asn Tyr Val Tnr Lys Tyr Glu Val Thr

        1265                1270                1275

TAT AGT AGT GAG TTA GGA CCA AAC GTG AGT GAC ACA CTT GAA AGT GAT    2496

Tyr Ser Ser Glu Leu Gly Pro Asn Val Ser Asp Thr Leu Glu Ser Asp

    1280                1285                1290

AAA ATT TAC AAG GAT GGG ACA ATT AAA TTT GAT TTT ACC AAA TAT AGT    2544

Lys Ile Tyr Lys Asp Gly Thr Ile Lys Phe Asp Phe Thr Lys Tyr Ser

1295                1300                1305                13l0

AAA AAT GAA CAA GGA TTA TTT TAT GAC AGT GGA TTA AAT TGG GAC TTT    2592

Lys Asn Glu Gln Gly Leu Phe Tyr Asp Ser Gly Leu Asn Trp Asp Phe

                1315                1320                1325

AAA ATT AAT GCT ATT ACT TAT GAT GGT AAA GAG ATG AAT GTT TTT CAT    2640

Lys Ile Asn Ala Ile Thr Tyr Asp Gly Lys Glu Met Asn Val Phe His

            1330                1335                1340

AGA TAT AAT AAA TAG                                                2655

Arg Tyr Asn Lys

        1345

(2)SEQ ID NO:5信息:

  (i)序列特征:

    (A)长度:884个氨基酸

    (B)类型:氨基酸

    (D)拓扑结构:线性

  (ii)分子类型:蛋白质

  (xi)序列描述:SEQ ID NO:5:

Met Lys Asn Met Lys Lys Lys Leu Ala Ser Val Val Thr Cys Thr Leu

  1               5                  10                  15

Leu Ala Pro Met Phe Leu Asn Gly Asn Val Asn Ala Val Tyr Ala Asp

             20                  25                  30

Ser Lys Thr Asn Gln Ile Ser Thr Thr Gln Lys Asn Gln Gln Lys Glu

         35                  40                  45

Met Asp Arg Lys Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys Asp Phe

     50                  55                  60

Ser Asn Leu Thr Met Phe Ala Pro Thr Arg Asp Ser Thr Leu Ile Tyr

65                  70                  75                  80

Asp Gln Gln Thr Ala Asn Lys Leu Leu Asp Lys Lys Gln Gln Glu Tyr

                 85                  90                  95

Gln Ser Ile Arg Trp Ile Gly Leu Ile Gln Ser Lys Glu Thr Gly Asp

            100                 105                 110

Phe Thr Phe Asn Leu Ser Glu Asp Glu Gln Ala Ile Ile Glu Ile Asn

        115                 120                 125

Gly Lys Ile Ile Ser Asn Lys Gly Lys Glu Lys Gln Val Val His Leu

    130                 135                 140

Glu Lys Gly Lys Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser Asp Thr

145                 150                 155                 160

Lys Phe Asn Ile Asp Ser Lys Thr Phe Lys Glu Leu Lys Leu Phe Lys

                165                 170                 175

Ile Asp Ser Gln Asn Gln Pro Gln Gln Val Gln Gln Asp Glu Leu Arg

            180                 185                 190

Asn Pro Glu Phe Asn Lys Lys Glu Ser Gln Glu Phe Leu Ala Lys Pro

        195                 200                 205

Ser Lys Ile Asn Leu Phe Thr Gln Lys Met Lys Arg Glu Ile Asp Glu

    210                 215                 220

Asp Thr Asp Thr Asp Gly Asp Ser Ile Pro Asp Leu Trp Glu Glu Asn

225                 230                 235                 240

Gly Tyr Thr Ile Gln Asn Arg Ile Ala Val Lys Trp Asp Asp Ser Leu

                245                 250                 255

Ala Ser Lys Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Glu Ser His

            260                 265                 270

Thr Val Gly Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg Asp Leu

        275                 280                 285

Asp Leu Ser Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala Phe

    290                 295                 300

Pro Ser Val Asn Val Ser Met Glu Lys Val Ile Leu Ser Pro Asn Glu

305                 310                 315                 320

Asn Leu Ser Asn Ser Val Glu Ser His Ser Ser Thr Asn Trp Ser Tyr

                325                 330                 335

Thr Asn Thr Glu Gly Ala Ser Val Glu Ala Gly Ile Gly Pro Lys Gly

            340                 345                 350

Ile Ser Phe Gly Val Ser Val Asn Tyr Gln His Ser Glu Thr Val Ala

        355                 360                 365

Gln Glu Trp Gly Thr Ser Thr Gly Asn Thr Ser Gln Phe Asn Thr Ala

    370                 375                 380

Ser Ala Gly Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val Gly Thr

385                 390                 395                 400

Gly Ala Ile Tyr Asp Val Lys Pro Thr Thr Ser Phe Val Leu Asn Asn

                405                 410                 415

Asp Thr Ile Ala Thr Ile Thr Ala Lys Ser Asn Ser Thr Ala Leu Asn

            420                 425                 430

Ile Ser Pro Gly Glu Ser Tyr Pro Lys Lys Gly Gln Asn Gly Ile Ala

        435                 440                 445

Ile Thr Ser Met Asp Asp Phe Asn Ser His Pro Ile Thr Leu Asn Lys

    450                 455                 460

Lys Gln Val Asp Asn Leu Leu Asn Asn Lys Pro Met Met Leu Glu Thr

465                 470                 475                 480

Asn Gln Thr Asp Gly Val Tyr Lys Ile Lys Asp Thr His Gly Asn Ile

                485                 490                 495

Val Thr Gly Gly Glu Trp Asn Gly Val Ile Gln Gln Ile Lys Ala Lys

            500                 505                 510

Thr Ala Ser Ile Ile Val Asp Asp Gly Glu Arg Val Ala Glu Lys Arg

        5l5                 520                 525

Val Ala Ala Lys Asp Tyr Glu Asn Pro Glu Asp Lys Thr Pro Ser Leu

    530                 535                 540

Thr Leu Lys Asp Ala Leu Lys Leu Ser Tyr Pro Asp Glu Ile Lys Glu

545                 550                 555                 560

Ile Glu Gly Leu Leu Tyr Tyr Lys Asn Lys Pro Ile Tyr Glu Ser Ser

                565                 570                 575

Val Met Thr Tyr Leu Asp Glu Asn Thr Ala Lys Glu Val Thr Lys Gln

            580                 585                 590

Leu Asn Asp Thr Thr Gly Lys Phe Lys Asp Val Ser His Leu Tyr Asp

        595                 600                 605

Val Lys Leu Thr Pro Lys Met Asn Val Thr Ile Lys Leu Ser Ile Leu

    610                 615                 620

Tyr Asp Asn Ala Glu Ser Asn Asp Asn Ser Ile Gly Lys Trp Thr Asn

625                 630                 635                 640

Thr Asn Ile Val Ser Gly Gly Asn Asn Gly Lys Lys Gln Tyr Ser Ser

                645                 650                 655

Asn Asn Pro Asp Ala Asn Leu Thr Leu Asn Thr Asp Ala Gln Glu Lys

            660                 665                 670

Leu Asn Lys Asn Arg Asp Tyr Tyr Ile Ser Leu Tyr Met Lys Ser Glu

        675                 680                 685

Lys Asn Thr Gln Cys Glu Ile Thr Ile Asp Gly Glu Ile Tyr Pro Ile

    690                 695                 700

Thr Thr Lys Thr Val Asn Val Asn Lys Asp Asn Tyr Lys Arg Leu Asp

705                 710                 715                 720

Ile Ile Ala His Asn Ile Lys Ser Asn Pro Ile Ser Ser Leu His Ile

                725                     730                 735

Lys Thr Asn Asp Glu Ile Thr Leu Phe Trp Asp Asp Ile Ser Ile Thr

            740                 745                 750

Asp Val Ala Ser Ile Lys Pro Glu Asn Leu Thr Asp Ser Glu Ile Lys

        755                 760                 765

Gln Ile Tyr Ser Arg Tyr Gly Ile Lys Leu Glu Asp Gly Ile Leu Ile

    770                 775                 780

Asp Lys Lys Gly Gly Ile His Tyr Gly Glu Phe Ile Asn Glu Ala Ser

785                 790                 795                 800

Phe Asn Ile Glu Pro Leu Gln Asn Tyr Val Thr Lys Tyr Glu Val Thr

                805                 810                 815

Tyr Ser Ser Glu Leu Gly Pro Asn Val Ser Asp Thr Leu Glu Ser Asp

            820                 825                 830

Lys Ile Tyr Lys Asp Gly Thr Ile Lys Phe Asp Phe Thr Lys Tyr Ser

        835                 840                 845

Lys Asn Glu Gln Gly Leu Phe Tyr Asp Ser Gly Leu Asn Trp Asp Phe

    850                 855                 860

Lys Ile Asn Ala Ile Thr Tyr Asp Gly Lys Glu Met Asn Val Phe His

865                 870                 875                 880

Arg Tyr Asn Lys

(2)SEQ ID NO:6信息:

  (i)序列特征:

    (A)长度:2004个碱基对

    (B)类型:核酸

    (C)链型:单链

    (D)拓扑结构:线性

  (ii)分子类型:DNA(基因组)

  (iii)假设:否

  (iv)反义:否

  (vi)原始来源:

    (A)有机体:蜡状芽孢杆菌

    (B)菌株:AB78

    (C)单独的分离物:NRRL B-21058

  (ix)特征:

    (A)名称/关键词:CDS

    (B)位置:1..2001

    (D)其它信息:/注=″80kd蛋白质VIP1A(a)″

/注=″这一序列与SEQ ID NO:1:的核苷酸3126-5126之间所发现的序列 相同″

(xi)序列描述:SEQ ID NO:6:

ATG AAA AGG GAA ATT GAT GAA GAC ACG GAT ACG GAT GGG GAC TCT ATT     48

Met Lys Arg Glu Ile Asp Glu Asp Thr Asp Thr Asp Gly Asp Ser Ile

885                 890                 895                 900

CCT GAC CTT TGG GAA GAA AAT GGG TAT ACG ATT CAA AAT AGA ATC GCT     96

Pro Asp Leu Trp Glu Glu Asn Gly Tyr Thr Ile Gln Asn Arg Ile Ala

                905                 910                 915

GTA AAG TGG GAC GAT TCT CTA GCA AGT AAA GGG TAT ACG AAA TTT GTT    144

Val Lys Trp Asp Asp Ser Leu Ala Ser Lys Gly Tyr Thr Lys Phe Val

            920                 925                 930

TCA AAT CCA CTA GAA AGT CAC ACA GTT GGT GAT CCT TAT ACA GAT TAT    192

Ser Asn Pro Leu Glu Ser His Thr Val Gly Asp Pro Tyr Thr Asp Tyr

        935                 940                 945

GAA AAG GCA GCA AGA GAT CTA GAT TTG TCA AAT GCA AAG GAA ACG TTT    240

Glu Lys Ala Ala Arg Asp Leu Asp Leu Ser Asn Ala Lys Glu Thr Phe

    950                 955                 960

AAC CCA TTG GTA GCT GCT TTT CCA AGT GTG AAT GTT AGT ATG GAA AAG    288

Asn Pro Leu Val Ala Ala Phe Pro Ser Val Asn Val Ser Met Glu Lys

965                 970                 975                 980

GTG ATA TTA TCA CCA AAT GAA AAT TTA TCC AAT AGT GTA GAG TCT CAT    336

Val Ile Leu Ser Pro Asn Glu Asn Leu Ser Asn Ser Val Glu Ser His

                985                 990                 995

TCA TCC ACG AAT TGG TCT TAT ACA AAT ACA GAA GGT GCT TCT GTT GAA    384

Ser Ser Thr Asn Trp Ser Tyr Thr Asn Thr Glu Gly Ala Ser Val Glu

            1000                1005                1010

GCG GGG ATT GGA CCA AAA GGT ATT TCG TTC GGA GTT AGC GTA AAC TAT    432

Ala Gly Ile Gly Pro Lys Gly Ile Ser Phe Gly Val Ser Val Asn Tyr

        1015                1020                1025

CAA CAC TCT GAA ACA GTT GCA CAA GAA TGG GGA ACA TCT ACA GGA AAT    480

Gln His Ser Glu Thr Val Ala Gln Glu Trp Gly Thr Ser Thr Gly Asn

    1030                1035                1040

ACT TCG CAA TTC AAT ACG GCT TCA GCG GGA TAT TTA AAT GCA AAT GTT    528

Thr Ser Gln Phe Asn Thr Ala Ser Ala Gly Tyr Leu Asn Ala Asn Val

1045                1050                1055                1060

CGA TAT AAC AAT GTA GGA ACT GGT GCC ATC TAC GAT GTA AAA CCT ACA    576

Arg Tyr Asn Asn Val Gly Thr Gly Ala Ile Tyr Asp Val Lys Pro Thr

                1065                1070                1075

ACA AGT TTT GTA TTA AAT AAC GAT ACT ATC GCA ACT ATT ACG GCG AAA    624

Thr Ser Phe Val Leu Asn Asn Asp Thr Ile Ala Thr Ile Thr Ala Lys

            1080                1085                1090

TC TAAT TCT ACA GCC TTA AAT ATA TCT CCT GGA GAA AGT TAC CCG AAA    672

Ser Asn Ser Thr Ala Leu Asn Ile Ser Pro Gly Glu Ser Tyr Pro Lys

        1095                1100                    1105

AAA GGA CAA AAT GGA ATC GCA ATA ACA TCA ATG GAT GAT TTT AAT TCC    720

Lys Gly Gln Asn Gly Ile Ala Ile Thr Ser Met Asp Asp Phe Asn Ser

    1110                1115                1120

CAT CCG ATT ACA TTA AAT AAA AAA CAA GTA GAT AAT CTG CTA AAT AAT    768

His Pro Ile Thr Leu Asn Lys Lys Gln Val Asp Asn Leu Leu Asn Asn

1125                1130                1135                1140

AAA CCT ATG ATG TTG GAA ACA AAC CAA ACA GAT GGT GTT TAT AAG ATA    816

Lys Pro Met Met Leu Glu Thr Asn Gln Thr Asp Gly Val Tyr Lys Ile

                1145                1150                1155

AAA GAT ACA CAT GGA AAT ATA GTA ACT GGC GGA GAA TGG AAT GGT GTC    864

Lys Asp Thr His Gly Asn Ile Val Thr Gly Gly Glu Trp Asn Gly Val

            1160                1165                1170

ATA CAA CAA ATC AAG GCT AAA ACA GCG TCT ATT ATT GTG GAT GAT GGG    912

Ile Gln Gln Ile Lys Ala Lys Thr Ala Ser Ile Ile Val Asp Asp Gly

        1175                1180                1185

GAA CGT GTA GCA GAA AAA CGT GTA GCG GCA AAA GAT TAT GAA AAT CCA    960

Glu Arg Val Ala Glu Lys Arg Val Ala Ala Lys Asp Tyr Glu Asn Pro

    1190                1195                1200

GAA GAT AAA ACA CCG TCT TTA ACT TTA AAA GAT GCC CTG AAG CTT TCA    1008

Glu Asp Lys Thr Pro Ser Leu Thr Leu Lys Asp A1a Leu Lys Leu Ser

1205                1210                1215                1220

TAT CCA GAT GAA ATA AAA GAA ATA GAG GGA TTA TTA TAT TAT AAA AAC    1056

Tyr Pro Asp Glu Ile Lys Glu Ile Glu Gly Leu Leu Tyr Tyr Lys Asn

                1225                1230                1235

AAA CCG ATA TAC GAA TCG AGC GTT ATG ACT TAC TTA GAT GAA AAT ACA    1104

Lys Pro Ile Tyr Glu Ser Ser Val Met Thr Tyr Leu Asp Glu Asn Thr

            1240                1245                1250

GCA AAA GAA GTG ACC AAA CAA TTA AAT GAT ACC ACT GGG AAA TTT AAA    1152

Ala Lys Glu Val Thr Lys Gln Leu Asn Asp Thr Thr Gly Lys Phe Lys

        1255                1260                1265

GAT GTA AGT CAT TTA TAT GAT GTA AAA CTG ACT CCA AAA ATG AAT GTT    1200

Asp Val Ser His Leu Tyr Asp Val Lys Leu Thr Pro Lys Met Asn Val

    1270                1275                1280

ACA ATC AAA TTG TCT ATA CTT TAT GAT AAT GCT GAG TCT AAT GAT AAC    1248

Thr Ile Lys Leu Ser Ile Leu Tyr Asp Asn Ala Glu Ser Asn Asp Asn

1285                1290                1295                1300

TCA ATT GGT AAA TGG ACA AAC ACA AAT ATT GTT TCA GGT GGA AAT AAC    1296

Ser Ile Gly Lys Trp Thr Asn Thr Asn Ile Val Ser Gly Gly Asn Asn

                1305                1310                1315

GGA AAA AAA CAA TAT TCT TCT AAT AAT CCG GAT GCT AAT TTG ACA TTA    1344

Gly Lys Lys Gln Tyr Ser Ser Asn Asn Pro Asp Ala Asn Leu Thr Leu

            1320                1325                1330

AAT ACA GAT GCT CAA GAA AAA TTA AAT AAA AAT CGT GAC TAT TAT ATA    1392

Asn Thr Asp Ala Gln Glu Lys Leu Asn Lys Asn Arg Asp Tyr Tyr Ile

        1335                1340                1346

AGT TTA TAT ATG AAG TCA GAA AAA AAC ACA CAA TGT GAG ATT ACT ATA    1440

Ser Leu Tyr Met Lys Ser Glu Lys Asn Thr Gln Cys Glu Ile Thr Ile

    1350                1355                1360

GAT GGG GAG ATT TAT CCG ATC ACT ACA AAA ACA GTG AAT GTG AAT AAA    1488

Asp Gly Glu Ile Tyr Pro Ile Thr Thr Lys Thr Val Asn Val Asn Lys

1365                1370                1375                1380

GAC AAT TAC AAA AGA TTA GAT ATT ATA GCT CAT AAT ATA AAA AGT AAT    1536

Asp Asn Tyr Lys Arg Leu Asp Ile Ile Ala His Asn Ile Lys Ser Asn

                1385                1390                1395

GGA ATT TCT TCA CTT CAT ATT AAA ACG AAT GAT GAA ATA ACT TTA TTT    1584

Pro Ile Ser Ser Leu His Ile Lvs Thr Asn Asp Glu Ile Thr Leu Phe

            1400                1405                1410

TGG GAT GAT ATT TCT ATA ACA GAT GTA GCA TCA ATA AAA CCG GAA AAT    1632

Trp Asp Asp Ile Ser Ile Thr Asp Val Ala Ser Ile Lys Pro Glu Asn

        1415                1420                1425

TTA ACA GAT TCA GAA ATT AAA CAG ATT TAT AGT AGG TAT GGT ATT AAG    1680

Leu Thr Asp Ser Glu Ile Lys Gln Ile Tyr Ser Arg Tyr Gly Ile Lys

    1430                1435                1440

TTA GAA GAT GGA ATC CTT ATT GAT AAA AAA GGT GGG ATT CAT TAT GGT    1728

Leu Glu Asp Gly Ile Leu Ile Asp Lys Lys Gly Gly Ile His Tyr Gly

1445                1450                1455                1460

GAA TTT ATT AAT GAA GCT AGT TTT AAT ATT GAA CCA TTG CCA AAT TAT    1776

Glu Phe Ile Asn Glu Ala Ser Phe Asn Ile Glu Pro Leu Pro Asn Tyr

                1465                1470                1475

GTG ACC AAA TAT GAA GTT ACT TAT AGT AGT GAG TTA GGA CCA AAC GTG    1824

Val Thr Lys Tyr Glu Val Thr Tyr Ser Ser Glu Leu Gly Pro Asn Val

            1480                1485                1490

AGT GAC ACA CTT GAA AGT GAT AAA ATT TAC AAG GAT GGG ACA ATT AAA    1872

Ser Asp Thr Leu Glu Ser Asp Lys Ile Tyr Lys Asp Gly Thr Ile Lys

        1495                1500                1505

TTT GAT TTT ACC AAA TAT AGT AAA AAT GAA CAA GGA TTA TTT TAT GAC    1920

Phe Asp Phe Thr Lys Tyr Ser Lys Asn Glu Gln Gly Leu Phe Tyr Asp

    1510                1515                    1520

AGT GGA TTA AAT TGG GAC TTT AAA ATT AAT GCT ATT ACT TAT GAT GGT    1968

Ser Gly Leu Asn Trp Asp Phe Lys Ile Asn Ala Ile Thr Tyr Asp Gly

1525                1530                1535                1540

AAA GAG ATG AAT GTT TTT CAT AGA TAT AAT AAA TAG                    2004

Lys Glu Met Asn Val Phe His Arg Tyr Asn Lys

                1545                1550

(2)SEQ ID NO:7信息:

  (i)序列特征:

    (A)长度:667个氨基酸

    (B)类型:氨基酸

    (D)拓扑结构:线性

  (ii)分子类型:蛋白质

  (xi)序列描述:SEQ ID NO:7:

Met Lys Arg Glu Ile Asp Glu Asp Thr Asp Thr Asp Gly Asp Ser Ile

  1               5                  10                  15

Pro Asp Leu Trp Glu Glu Asn Gly Tyr Thr Ile Gln Asn Arg Ile Ala

             20                  25                  30

Val Lys Trp Asp Asp Ser Leu Ala Ser Lys Gly Tyr Thr Lys Phe Val

         35                  40                  45

Ser Asn Pro Leu Glu Ser His Thr Val Gly Asp Pro Tyr Thr Asp Tyr

     50                  55                  60

Glu Lys Ala Ala Arg Asp Leu Asp Leu Ser Asn Ala Lys Glu Thr Phe

65                   70                  75                  80

Asn Pro Leu Val Ala Ala Phe Pro Ser Val Asn Val Ser Met Glu Lys

                 85                  90                  95

Val Ile Leu Ser Pro Asn Glu Asn Leu Ser Asn Ser Val Glu Ser His

            100                 105                 110

Ser Ser Thr Asn Trp Ser Tyr Thr Asn Thr Glu Gly Ala Ser Val Glu

        115                 120                 125

Ala Gly Ile Gly Pro Lys Gly Ile Ser Phe Gly Val Ser Val Asn Tyr

    130                 135                 140

Gln His Ser Glu Thr Val Ala Gln Glu Trp Gly Thr Ser Thr Gly Asn

145                 150                 155                 160

Thr Ser Gln Phe Asn Thr Ala Ser Ala Gly Tyr Leu Asn Ala Asn Val

                165                 170                 175

Arg Tyr Asn Asn Val Gly Thr Gly Ala Ile Tyr Asp Val Lys Pro Thr

            180                 185                 190

Thr Ser Phe Val Leu Asn Asn Asp Thr Ile Ala Thr Ile Thr Ala Lys

        195                 200                 205

Ser Asn Ser Thr Ala Leu Asn Ile Ser Pro Gly Glu Ser Tyr Pro Lys

    210                 215                 220

Lys Gly Gln Asn Gly Ile Ala Ile Thr Ser Met Asp Asp Phe Asn Ser

225                 230                 235                 240

His Pro Ile Thr Leu Asn Lys Lys Gln Val Asp Asn Leu Leu Asn Asn

                245                 250                 255

Lys Pro Met Met Leu Glu Thr Asn Gln Thr Asp Gly Val Tyr Lys Ile

            260                 265                 270

Lys Asp Thr His Gly Asn Ile Val Thr Gly Gly Glu Trp Asn Gly Val

        275                 280                 285

Ile Gln Gln Ile Lys Ala Lys Thr Ala Ser Ile Ile Val Asp Asp Gly

    290                 295                 300

Glu Arg Val Ala Glu Lys Arg Val Ala Ala Lys Asp Tyr Glu Asn Pro

305                 310                 315                 320

Glu Asp Lys Thr Pro Ser Leu Thr Leu Lys Asp Ala Leu Lys Leu Ser

                325                 330                 335

Tyr Pro Asp Glu Ile Lys Glu Ile Glu Gly Ieu Leu Tyr Tyr Lys Asn

            340                 345                 350

Lys Pro Ile Tyr Glu Ser Ser Val Met Thr Tyr Leu Asp Glu Asn Thr

        355                 360                 365

Ala Lys Glu Val Thr Lys Gln Leu Asn Asp Thr Thr Gly Lys Phe Lys

    370                 375                 380

Asp Val Ser His Leu Tyr Asp Val Lys Leu Thr Pro Lys Met Asn Val

385                 390                 395                 400

Thr Ile Lys Leu Ser Ile Leu Tyr Asp Asn Ala Glu Ser Asn Asp Asn

                405                 410                 415

Ser Ile Gly Lys Trp Thr Asn Thr Asn Ile Val Ser Gly Gly Asn Asn

            420                 425                 430

Gly Lys Lys Gln Tyr Ser Ser Asn Asn Pro Asp Ala Asn Leu Thr Leu

        435                 440                 445

Asn Thr Asp Ala Gln Glu Lys Leu Asn Lys Asn Arg Asp Tyr Tyr Ile

    450                 455                 460

Ser Leu Tyr Met Lys Ser Glu Lys Asn Thr Gln Cys Glu Ile Thr Ile

465                 470                 475                 480

Asp Gly Glu Ile Tyr Pro Ile Thr Thr Lys Thr Val Asn Val Asn Lys

                485                 490                 495

Asp Asn Tyr Lys Arg Leu Asp Ile Ile Ala His Asn Ile Lys Ser Asn

            500                 505                 510

Pro Ile Ser Ser Leu His Ile Lys Thr Asn Asp Glu Ile Thr Leu Phe

        515                 520                 525

Trp Asp Asp Ile Ser Ile Thr Asp Val Ala Ser Ile Lys Pro Glu Asn

    530                 535                 540

Leu Thr Asp Ser Glu Ile Lys Gln Ile Tyr Ser Arg Tyr Gly Ile Lys

545                 550                 555                 560

Leu Glu Asp Gly Ile Leu Ile Asp Lys Lys Gly Gly Ile His Tyr Gly

                565                 570                 575

Glu Phe Ile Asn Glu Ala Ser Phe Asn Ile Glu Pro Leu Pro Asn Tyr

            580                 585                 590

Val Thr Lys Tyr Glu Val Thr Tyr Ser Ser Glu Leu Gly Pro Asn Val

        595                 600                 605

Ser Asp Thr Leu Glu Ser Asp Lys Ile Tyr Lys Asp Gly Thr Ile Lys

    610                 615                 620

Phe Asp Phe Thr Lys Tyr Ser Lys Asn Glu Gln Gly Leu Phe Tyr Asp

625                 630                 635                 640

Ser Gly Leu Asn Trp Asp Phe Lys Ile Asn Ala Ile Thr Tyr Asp Gly

                645                 650                 655

Lys Glu Met Asn Val Phe His Arg Tyr Asn Lys

            660                 665

(2)SEQ ID NO:8信息:

  (i)序列特征:

    (A)长度:16个氨基酸

    (B)类型:氨基酸

    (C)链型:单链

    (D)拓扑结构:线性

  (ii)分子类型:肽

  (iii)假设:否

  (v)片段类型:N-末端

  (vi)原始来源:

    (A)有机体:蜡状芽孢杆菌

    (B)菌株:AB78

    (C)单独的分离物:NRRL B-21058

  (ix)特征:

    (A)名称/关键词:肽

    (B)位置:1..16

    (D)其它信息:/注=″从菌株AB78纯化的蛋白质的N-末端序 列″

  (xi)序列描述:SEQ ID NO:8:

Lys Arg Glu Ile Asp Glu Asp Thr Asp Thr Asx Gly Asp Ser Ile Pro

 1              5                 10               15

(2)SEQ ID NO:9信息:

  (i)序列特征:

    (A)长度:21个碱基对

    (B)类型:核酸

    (C)链型:单链

    (D)拓扑结构:线性

  (ii)分子类型:DNA(基因组)

  (iii)假设:否

(iv)反义:否

(ix)特征:

  (A)名称/关键词:misc_特征

  (B)位置:1..21

  (D)其它信息:/注=″基于SEQ ID NO:8的氨基酸3-9之寡核 苷酸探针,采用苏云金芽孢杆菌的密码子使用″

(xi)序列描述:SEQ ID NO:9:

CAAATTGATC AAGATACNGA T

(2)SEQ ID NO:10信息:

  (i)序列特征:

    (A)长度:14个氨基酸

    (B)类型:氨基酸

    (C)链型:单链

    (D)拓扑结构:线性

  (ii)分子类型:肽

  (iii)假设:否

  (v)片段类型:N-末端

  (vi)原始来源:

    (A)有机体:苏云金芽孢杆菌

    (B)菌株:AB88

  (ix)特征:

    (A)名称/关键词:肽

    (B)位置:1..14

    (D)其它信息:/注=″已知为阴离子交换组分23的蛋白质的N- 末端氨基酸序列(较小)″

  (xi)序列描述:SEQ ID NO:10:

Xaa Glu Pro Phe Val Ser Ala Xaa Xaa Xaa Gln Xaa Xaa Xaa

 1              5                 10

(2)SEQ ID NO:11信息:

  (i)序列特征:

    (A)长度:13个氨基酸

    (B)类型:氨基酸    

    (C)链型:单链

    (D)拓扑结构:N-末端

  (vi)原始来源:

    (A)有机体:苏云金芽孢杆菌

  (xi)序列描述:SEQ ID NO:11:

Xaa Glu Tyr Glu Asn Val Glu Pro Phe Val Ser Ala Xaa

 1              5                10

(2)SEQ ID NO:12信息:

  (i)序列特征:

    (A)长度:14个氨基酸

    (B)类型:氨基酸

    (C)链型:单链

    (D)拓扑结构:N-末端

  (vi)原始来源:

    (A)有机体:苏云金芽孢杆菌

  (xi)序列描述:SEQ ID NO:12:

Met Asn Lys Asn Asn Thr Lys Leu Pro Thr Arg Ala Leu Pro

 1              5                 10

(2)SEQ ID NO:13信息:

  (i)序列特征:

    (A)长度:15个氨基酸

    (B)类型:氨基酸

    (C)链型:单链

    (D)拓扑结构:线性

  (ii)分子类型:肽

  (iii)假设:否

  (v)片段类型:N-末端

  (vi)原始来源:

    (A)有机体:苏云金芽孢杆菌

    (B)菌株:AB88

  (ix)特征:

   (A)名称/关键词:肽

   (B)位置:1..15

   (D)其它信息:/注=″抗Agrotis ipsilon活性的35kDaVIP的N -末端氨基酸序列″

  (xi)序列描述:SEQ ID NO:13:

Ala Leu Ser Glu Asn Thr Gly Lys Asp Gly Gly Tyr Ile Val Pro

1               5                 10               15

(2)SEQ ID NO:14信息:

  (i)序列特征:

    (A)长度:9个氨基酸

    (B)类型:氨基酸

    (C)链型:单链

    (D)拓扑结构:N-末端

  (vi)原始来源:

    (A)有机体:苏云金芽孢杆菌

  (xi)序列描述:SEQ ID NO:14:

Met Asp Asn Asn Pro Asn Ile Asn Glu

 1              5

(2)SEQ ID NO:15信息:

  (i)序列特征:

    (A)长度:9个氨基酸

    (B)类型:氨基酸

    (C)链型:单链

    (D)拓扑结构:线性

  (ii)分子类型:肽

  (iii)假设:否

  (v)片段类型:N-末端

  (ix)特征:

    (A)名称/关键词:肽

    (B)位置:1..9

    (D)其它信息:/注=″80kDa δ-内毒素的N-末端序列″

  (xi)序列描述:SEQ ID NO:15:

Met Asp Asn Asn Pro Asn Ile Asn Glu

1               5

(2)SEQ ID NO:16信息:

  (i)序列特征:

    (A)长度:11个氨基酸

    (B)类型:氨基酸

    (C)链型:单链

    (D)拓扑结构:线性

  (ii)分子类型:肽

  (iii)假设:否

  (v)片段类型:N-末端

  (vi)原始来源:

    (A)有机体:苏云金芽孢杆菌

  (ix)特征:

    (A)名称/关键词:肽

    (B)位置:1..11

    (D)其它信息:/注=″60kDa δ-内毒素的N-末端序列″

  (xi)序列描述:SEQ ID NO:16:

Met Asn Val Leu Asn Ser Gly Ary Thr Thr Ile

1               5                10

(2)SEQ ID NO:17信息:

  (i)序列特征:

    (A)长度:2655个碱基对

    (B)类型:核酸

    (C)链型:单链

    (D)拓扑结构:线性

  (ii)分子类型:DNA(基因组)

  (iii)假设:否

  (iv)反义:否

  (ix)特征:

    (A)名称/关键词:misc_特征

    (B)位置:1..2652

    (D)其它信息:/注=″玉米优化的得自AB78的100kd VIP1A(a) DNA序列″

  (xi)序列描述:SEQ ID NO:17:

ATGAAGAACA TGAAGAAGAA GCTGGCCAGC GTGGTGACCT GCACCCTGCT GGCCCCCATG     60

TTCCTGAACG GCAACGTGAA CGCCGTGTAC GCCGACAGCA AGACCAACCA GATCAGCACC    120

ACCCAGAAGA ACCAGCAGAA GGAGATGGAC CGCAAGGGCC TGCTGGGCTA CTACTTCAAG    180

GGCAAGGACT TCAGCAACCT GACCATGTTC GCCCCCACGC GTGACAGCAC CCTGATCTAC    240

GACCAGCAGA CCGCCAACAA GCTGCTGGAC AAGAAGCAGC AGGAGTACCA GAGCATCCGC    300

TGGATCGGCC TGATCCAGAG CAAGGAGACC GGCGACTTCA CCTTCAACCT GAGCGAGGAC    360

GAGCAGGCCA TCATCGAGAT CAACGGCAAG ATCATCAGCA ACAAGGGCAA GGAGAAGCAG    420

GTGGTGCACC TGGAGAAGGG CAAGCTGGTG CCCATCAAGA TCGAGTACCA GAGCGACACC    480

AAGTTCAACA TCGACAGCAA GACCTTCAAG GAGCTGAAGC TTTTCAAGAT CGACAGCCAG    540

AACCAGCCCC AGCAGGTGCA GCAGGACGAG CTGCGCAACC CCGAGTTCAA CAAGAAGGAG    600

AGCCAGGAGT TCCTGGCCAA GCCCAGCAAG ATCAACCTGT TCACCCAGCA GATGAAGCGC    660

GAGATCGACG AGGACACCGA CACCGACGGC GACAGCATCC CCGACCTGTG GGAGGAGAAC    720

GGCTACACCA TCCAGAACCG CATCGCCGTG AAGTGGGACG ACAGCCTGGC TAGCAAGGGC     780

TACACCAAGT TCGTGAGCAA CCCCCTGGAG AGCCACACCG TGGGCGACCC CTACACCGAC     840

TACGAGAAGG CCGCCCGCGA CCTGGACCTG AGCAACGCCA AGGAGACCTT CAACCCCCTG     900

GTGGCCGCCT TCCCCAGCGT GAACGTGAGC ATGGAGAAGG TGATCCTGAG CCCCAACGAG     960

AACCTGAGCA ACAGCGTGGA GAGCCACTCG AGCACCAACT GGAGCTACAC CAACACCGAG    1020

GGCGCCAGCG TGGAGGCCGG CATCGGTCCC AAGGGCATCA GCTTCGGCGT GAGCGTGAAC    1080

TACCAGCACA GCGAGACCGT GGCCCAGGAG TGGGGCACCA GCACCGGCAA CACCAGCCAG    1140

TTCAACACCG CCAGCGCCGG CTACCTGAAC GCCAACGTGC GCTACAACAA CGTGGGCACC    1200

GGCGCCATCT ACGACGTGAA GCCCACCACC AGCTTCGTGC TGAACAACGA CACCATCGCC    1260

ACCATCACCG CCAAGTCGAA TTCCACCGCC CTGAACATCA GCCCCGGCGA GAGCTACCCC    1320

AAGAAGGGCC AGAACGGCAT CGCCATCACC AGCATGGACG ACTTCAACAG CCACCCCATC    1380

ACCCTGAACA AGAAGCAGGT GGACAACCTG CTGAACAACA AGCCCATGAT GCTGGAGACC    1440

AACCAGACCG ACGGCGTCTA CAAGATCAAG GACACCCACG GCAACATCGT GACCGGCGGC    1500

GAGTGGAACG GCGTGATCCA GCAGATCAAG GCCAAGACCG CCAGCATCAT CGTCGACGAC    1560

GGCGAGCGCG TGGCCGAGAA GCGCGTGGCC GCCAAGGACT ACGAGAACCC CGAGGACAAG    1620

ACCCCCAGCC TGACCCTGAA GGACGCCCTG AAGCTGAGCT ACCCCGACGA GATCAAGGAG    1680

ATCGAGGGCC TGCTGTACTA CAAGAACAAG CCCATCTACG AGAGCAGCGT GATGACCTAT    1740

CTAGACGAGA ACACCGCCAA GGAGGTGACC AAGCAGCTGA ACGACACCAC CGGCAAGTTC    1800

AAGGACGTGA GCCACCTGTA CGACGTGAAG CTGACCCCCA AGATGAACGT GACCATCAAG    1860

CTGAGCATCC TGTACGACAA CGCCGAGAGC AACGACAACA GCATCGGCAA GTGGACCAAC    1920

ACCAACATCG TGAGCGGCGG CAACAACGGC AAGAAGCAGT ACAGCAGCAA CAACCCCGAC    1980

GCCAACCTGA CCCTGAACAC CGACGCCCAG GAGAAGCTGA ACAAGAACCG CGACTACTAC    2040

ATCAGCCTGT ACATGAAGAG CGAGAAGAAC ACCCAGTGCG AGATCACCAT CGACGGCGAG    2100

ATATACCCCA TCACCACCAA GACCGTGAAC GTGAACAAGG ACAACTACAA GCGCCTGGAC    2160

ATCATCGCCC ACAACATCAA GAGCAACCCC ATCAGCAGCC TGCACATCAA GACCAACGAC    2220

GAGATCACCC TGTTCTGGGA CGACATATCG ATTACCGACG TCGCCAGCAT CAAGCCCGAG    2280

AACCTGACCG ACAGCGAGAT CAAGCAGATA TACAGTCGCT ACGGCATCAA GCTGGAGGAC    2340

GGCATCCTGA TCGACAAGAA GGGCGGCATC CACTACGGCG AGTTCATCAA CGAGGCCAGC    2400

TTCAACATCG AGCCCCTGCA GAACTACGTG ACCAAGTACG AGGTGACCTA CAGCAGCGAG    2460

CTGGGCCCCA ACGTGAGCGA CACCCTGGAG AGCGACAAGA TTTACAAGGA CGGCACCATC    2520

AAGTTCGACT TCACCAAGTA CAGCAAGAAC GAGCAGGGCC TGTTCTACGA CAGCGGCCTG    2580

AACTGGGACT TCAAGATCAA CGCCATCACC TACGACGGCA AGGAGATGAA CGTGTTCCAC    2640

CGCTACAACA AGTAG                                                     2655

(2)SEQ ID NO:18信息:

  (i)序列特征:

    (A)长度:2004个碱基对

    (B)类型:核酸

    (C)链型:单链

    (D)拓扑结构:线性

  (ii)分子类型:DNA(基因组)

  (iii)假设:否

  (iv)反义:否

  (ix)特征:

    (A)名称/关键词:misc_特征

    (B)位置:1..2004

    (D)其它信息:/注=″玉米优化的得自AB78的80kd VIP1A(a) DNA序列″

  (xi)序列描述:SEQ ID NO:18:

ATGAAGCGCG AGATCGACGA GGACACCGAC ACCGACGGCG ACAGCATCCC CGACCTGTGG     60

GAGGAGAACG GCTACACCAT CCAGAACCGC ATCGCCGTGA AGTGGGACGA CAGCCTGGCT    120

AGCAAGGGCT ACACCAAGTT CGTGAGCAAC CCCCTGGAGA GCCACACCGT GGGCGACCCC    180

TACACCGACT ACGAGAAGGC CGCCCGCGAC CTGGACCTGA GCAACGCCAA GGAGACCTTC    240

AACCCCCTGG TGGCCGCCTT CCCCAGCGTG AACGTGAGCA TGGAGAAGGT GATCCTGAGC    300

CCCAACGAGA ACCTGAGCAA CAGCGTGGAG AGCCACTCGA GCACCAACTG GAGCTACACC    360

AACACCGAGG GCGCCAGCGT GGAGGCCGGC ATCGGTCCCA AGGGCATCAG CTTCGGCGTG    420

AGCGTGAACT ACCAGCACAG CGAGACCGTG GCCCAGGAGT GGGGCACCAG CACCGGCAAC    480

ACCAGCCAGT TCAACACCGC CAGCGCCGGC TACCTGAACG CCAACGTGCG CTACAACAAC    540

GTGGGCACCG GCGCCATCTA CGACGTGAAG CCCACCACCA GCTTCGTGCT GAACAACGAC     600

ACCATCGCCA CCATCACCGC CAAGTCGAAT TCCACCGCCC TGAACATCAG CCCCGGCGAG     660

AGCTACCCCA AGAAGGGCCA GAACGGCATC GCCATCACCA GCATGGACGA CTTCAACAGC     720

CACCCCATCA CCCTGAACAA GAAGCAGGTG GACAACCTGC TGAACAACAA GCCCATGATG     780

CTGGAGACCA ACCAGACCGA CGGCGTCTAC AAGATCAAGG ACACCCACGG CAACATCGTG     840

ACCGGCGGCG AGTGGAACGG CGTGATCCAG CAGATCAAGG CCAAGACCGC CAGCATCATC     900

GTCGACGACG GCGAGCGCGT GGCCGAGAAG CGCGTGGCCG CCAAGGACTA CGAGAACCCC     960

GAGGACAAGA CCCCCAGCCT GACCCTGAAG GACGCCCTGA AGCTGAGCTA CCCCGACGAG    1020

ATCAAGGAGA TCGAGGGCCT GCTGTACTAC AAGAACAAGC CCATCTACGA GAGCAGCGTG    1080

ATGACCTATC TAGACGAGAA CACCGCCAAG GAGGTGACCA AGCAGCTGAA CGACACCACC    1140

GGCAAGTTCA AGGACGTGAG CCACCTGTAC GACGTGAAGC TGACCCCCAA GATGAACGTG    1200

ACCATCAAGC TGAGCATCCT GTACGACAAC GCCGAGAGCA ACGACAACAG CATCGGCAAG    1260

TGGACCAACA CCAACATCGT GAGCGGCGGC AACAACGGCA AGAAGCAGTA CAGCAGCAAC    1320

AACCCCGACG CCAACCTGAC CCTGAACACC GACGCCCAGG AGAAGCTGAA CAAGAACCGC    1380

GACTACTACA TCAGCCTGTA CATGAAGAGC GAGAAGAACA CCCAGTGCGA GATCACCATC    1440

GACGGCGAGA TATACCCCAT CACCACCAAG ACCGTGAACG TGAACAAGGA CAACTACAAG    1500

CGCCTGGACA TCATCGCCCA CAACATCAAG AGCAACCCCA TCAGCAGCCT GCACATCAAG    1560

ACCAACGACG AGATCACCCT GTTCTGGGAC GACATATCGA TTACCGACGT CGCCAGCATC    1620

AAGCCCGAGA ACCTGACCGA CAGCGAGATC AAGCAGATAT ACAGTCGCTA CCGCATCAAG    1680

CTGGAGGACG GCATCCTGAT CGACAAGAAG GGCGGCATCC ACTACGGCGA GTTCATCAAC    1740

GAGGCCAGCT TCAACATCGA GCCCCTGCAG AACTACGTGA CCAAGTACGA GGTGACCTAC    1800

AGCAGCGAGC TGGGCCCCAA CGTGAGCGAC ACCCTGGAGA GCGACAAGAT TTACAAGGAC    1860

GGCACCATCA AGTTCGACTT CACCAAGTAC AGCAAGAACG AGCAGGGCCT GTTCTACGAC    1920

AGCGGCCTGA ACTGGGACTT CAAGATCAAC GCCATCACCT ACGACGGCAA GGAGATGAAC    1980

GTGTTCCACC GCTACAACAA GTAG                                           2004

(2)SEQ ID NO:19信息:

  (i)序列特征:

    (A)长度:4074个碱基对

    (B)类型:核酸

    (C)链型:单链

    (D)拓扑结构:线性

  (ii)分子类型:DNA(基因组)

  (ix)特征:

    (A)名称/关键词:CDS

    (B)位置: 1..1386

    (D)其它信息:/产物=″得自Btt的VIP2A(b)″

  (ix)特征:

    (A)名称/关键词:misc_特征

    (B)位置:1..4074

    (D)其它信息:/注=″克隆的得自Btt d DNA序列,其含有VIP1A (b)VIP2A(b)两者的基因″

  (xi)序列描述:SEQ ID NO:19:

ATG CAA AGA ATG GAG GGA AAG TTG TTT GTG GTG TCA AAA ACA TTA CAA     48

Met Gln Arg Met Glu Gly Lys Leu Phe Val Val Ser Lys Thr Leu Gln

        670                 675                 680

GTA GTT ACT AGA ACT GTA TTG CTT AGT ACA GTT TAC TCT ATA ACT TTA     96

Val Val Thr Arg Thr Val Leu Leu Ser Thr Val Tyr Ser Ile Thr Leu

    685                 690                 695

TTA AAT AAT GTA GTG ATA AAA GCT GAC CAA TTA AAT ATA AAT TCT CAA    144

Leu Asn Asn Val Val Ile Lys Ala Asp Gln Leu Asn Ile Asn Ser Gln

700                 705                 710                 715

AGT AAA TAT ACT AAC TTG CAA AAT CTA AAA ATC CCT GAT AAT GCA GAG    192

Ser Lys Tyr Thr Asn Leu Gln Asn Leu Lys Ile Prc Asp Asn Ala Glu

                720                 725                 730

GAT TTT AAA GAA GAT AAG GGG AAA GCG AAA GAA TGG GGG AAA GAG AAA    240

Asp Phe Lys Glu Asp Lys Gly Lys Ala Lys Glu Trp Gly Lys Glu Lys

            735                 740                 745

GGG GAA GAG TGG AGG CCT CCT GCT ACT GAG AAA GGA GAA ATG AAT AAT    288

Gly Glu Glu Trp Arg Pro Pro Ala Thr Glu Lys Gly Glu Met Asn Asn

        750                 755                 760

TTT TTA GAT AAT AAA AAT GAT ATA AAG ACC AAT TAT AAA GAA ATT ACT    336

Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr

    765                 770                 775

TTT TCT ATG GCA GGT TCA TGT GAA GAT GAA ATA AAA GAT TTA GAA GAA    384

Phe Ser Met Ala Gly Ser Cys Glu Asp Glu Ile Lys Asp Leu Glu Glu

780                 785                 790                 795

ATT GAT AAG ATC TTT GAT AAA GCC AAT CTC TCG AGT TCT ATT ATC ACC    432

Ile Asp Lys Ile Phe Asp Lys Ala Asn Leu Ser Ser Ser Ile Ile Thr

                800                 805                 810

TAT AAA AAT GTG GAA CCA GCA ACA ATT GGA TTT AAT AAA TCT TTA ACA    480

Tyr Lys Asn Val Glu Pro Ala Thr Ile Gly Phe Asn Lys Ser Leu Thr

            815                 820                 825

GAA GGT AAT ACG ATT AAT TCT GAT GCA ATG GCA CAG TTT AAA GAA CAA    528

Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln

        830                 835                 840

TTT TTA GGT AAG GAT ATG AAG TTT GAT AGT TAT CTA GAT ACT CAT TTA    576

Phe Leu Gly Lys Asp Met Lys Phe Asp Ser Tyr Leu Asp Thr His Leu

    845                 850                 855

ACT GCT CAA CAA GTT TCC AGT AAA AAA AGA GTT ATT TTG AAG GTT ACG    624

Thr Ala Gln Gln Val Ser Ser Lys Lys Arg Val Ile Leu Lys Val Thr

860                 865                 870                 875

GTT CCG AGT GGG AAA GGT TCT ACT ACT CCA ACA AAA GCA GGT GTC ATT    672

Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile

                880                 885                 890

TTA AAC AAT AAT GAA TAC AAA ATG CTC ATT GAT AAT GGG TAT GTG CTC    720

Leu Asn Asn Asn Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Val Leu

            895                 900                 905

CAT GTA GAT AAG G TA TCA AAA GTA GTA AAA AAA GGG ATG GAG TGC TTA   768

His Val Asp Lys Val Ser Lys Val Val  Lys Lys Gly Met Glu Cys Leu

        910                 915                 920

CAA GTT GAA GGG ACT TTA AAA AAG AGT CTC GAC TTT AAA AAT GAT ATA    816

Gln Val Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile

    925                 930                 935

AAT GCT GAA GCG CAT AGC TGG GGG ATG AAA ATT TAT GAA GAC TGG GCT    864

Asn Ala Glu Ala His Ser Trp Gly Met Lys Ile Tyr Glu Asp Trp Ala

940                 945                 950                 955

AAA AAT TTA ACC GCT TCG CAA AGG GAA GCT TTA GAT GGG TAT GCT AGG    912

Lys Asn Leu Thr Ala Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg

                960                 965                 970

CAA GAT TAT AAA GAA ATC AAT AAT TAT TTG CGC AAT CAA GGC GGG AGT    960

Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser

            975                 980                 985

GGA AAT GAA AAG CTG GAT GCC CAA TTA AAA AAT ATT TCT GAT GCT TTA    1008

Gly Asn Glu Lys Leu Asp Ala Gln Leu Lys Asn Ile Ser Asp Ala Leu

        990                 995                 1000

GGG AAG AAA CCC ATA CCA GAA AAT ATT ACC GTG TAT AGA TGG TGT GGC    1056

Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly

    1005                1010                1015

ATG CCG GAA TTT GGT TAT CAA ATT AGT GAT CCG TTA CCT TCT TTA AAA    1104

Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys

1020                1025                1030                1035

GAT TTT GAA GAA CAA TTT TTA AAT ACA ATT AAA GAA GAC AAA GGG TAT    1152

Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr

                1040                1045                1050

ATG AGT ACA AGC TTA TCG AGT GAA CGT CTT GCA GCT TTT GGA TCT AGA    1200

Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg

            1055                1060                1065

AAA ATT ATA TTA CGC TTA CAA GTT CCG AAA GGA AGT ACG GGG GCG TAT    1248

Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr

        1070                1075                1080

TTA AGT GCC ATT GGT GGA TTT GCA AGT GAA AAA GAG ATC CTA CTT GAT    1296

Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp

    1085                1090                1095

AAA GAT AGT AAA TAT CAT ATT GAT AAA GCA ACA GAG GTA ATC ATT AAA    1344

Lys Asp Ser Lys Tyr His Ile Asp Lys Ala Thr Glu Val Ile Ile Lys

1100                1105                1110                1115

GGT GTT AAG CGA TAT GTA GTG GAT GCA ACA TTA TTA ACA AAT            1386

Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn

                1120                1125

TAAGGAG ATG AAA AAT ATG AAG AAA AAG TTA GCA AGT GTT GTA ACC TGT    1435

        Met Lys Asn Met Lys Lys Lys Leu Ala Ser Val Val Thr Cys

          1               5                  10

ATG TTA TTA GCT CCT ATG TTT TTG AAT GGA AAT GTG AAT GCT GTT AAC    1483

Met Leu Leu Ala Pro Met Phe Leu Asn Gly Asn Val Asn Ala Val Asn

 15                  20                  25                  30

GCG GAT AGT AAA ATA AAT CAG ATT TCT ACA ACG CAG GAA AAC CAA CAG    1531

Ala Asp Ser Lys Ile Asn Gln Ile Ser Thr Thr Gln Glu Asn Gln Gln

                 35                  40                  45

AAA GAG ATG GAC CGA AAG GGA TTA TTG GGA TAT TAT TTC AAA GGA AAA    1579

Lys Glu Met Asp Arg Lys Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys

             50                  55                  60

GAT TTT AAT AAT CTT ACT ATG TTT GCA CCG ACA CGT GAT AAT ACC CTT    1627

Asp Phe Asn Asn Leu Thr Met Phe Ala Pro Thr Arg Asp Asn Thr Leu

         65                  70                  75

ATG TAT GAC CAA CAA ACA GCG AAT GCA TTA TTA GAT AAA AAA CAA CAA    1675

Met Tyr Asp Gln Gln Thr Ala Asn Ala Leu Leu Asp Lys Lys Gln Gln

     80                  85                  90

GAA TAT CAG TCC ATT CGT TGG ATT GGT TTG ATT CAG CGT AAA GAA ACG    1723

Glu Tyr Gln Ser Ile Arg Trp Ile Gly Leu Ile Gln Arg Lys Glu Thr

 95                 100                 105                 110

GGC GAT TTC ACA TTT AAC TTA TCA AAG GAT GAA CAG GCA ATT ATA GAA    1771

Gly Asp Phe Thr Phe Asn Leu Ser Lys Asp Glu Gln Ala Ile Ile Glu

                115                 120                 125

ATC GAT GGG AAA ATC ATT TCT AAT AAA GGG AAA GAA AAG CAA GTT GTC    1819

Ile Asp Gly Lys Ile Ile Ser Asn Lys Gly Lys Glu Lys Gln Val Val

            130                 135                 140

CAT TTA GAA AAA GAA AAA TTA GTT CCA ATC AAA ATA GAG TAT CAA TCA    1867

His Leu Glu Lys Glu Lys Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser

        145                 150                 155

GAT ACG AAA TTT AAT ATT GAT AGT AAA ACA TTT AAA GAA CTT AAA TTA    1915

Asp Thr Lys Phe Asn Ile Asp Ser Lys Thr Phe Lys Glu Leu Lys Leu

    160                 165                 170

TTT AAA ATA GAT AGT CAA AAC CAA TCT CAA CAA GTT CAA CTG AGA AAC    1963

Phe Lys Ile Asp Ser Gln Asn Gln Ser Gln Gln Val Gln Leu Arg Asn

175                 180                 185                 190

CCT GAA TTT AAC AAA AAA GAA TCA CAG GAA TTT TTA GCA AAA GCA TCA    2011

Pro Glu Phe Asn Lys Lys Glu Ser Gln Glu Phe Leu Ala Lys Ala Ser

                195                 200                 205

AAA ACA AAC CTT TTT AAG CAA AAA ATG AAA AGA GAT ATT GAT GAA GAT    2059

Lys Thr Asn Leu Phe Lys Gln Lys Met Lys Arg Asp Ile Asp Glu Asp

            210                 215                 220

ACG GAT ACA GAT GGA GAC TCC ATT CCT GAT CTT TGG GAA GAA AAT GGG    2107

Thr Asp Thr Asp Gly Asp Ser Ile Pro Asp Leu Trp Glu Glu Asn Gly

        225                 230                 235

TAC ACG ATT CAA AAT AAA GTT GCT GTC AAA TGG GAT GAT TCG CTA GCA    2155

Tyr Thr Ile Gln Asn Lys Val Ala Val Lys Trp Asp Asp Ser Leu Ala

    240                 245                 250

AGT AAG GGA TAT ACA AAA TTT GTT TCG AAT CCA TTA GAC AGC CAC ACA    2203

Ser Lys Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Asp Ser His Thr

255                 260                 265                 270

GTT GGC GAT CCC TAT ACT GAT TAT GAA AAG GCC GCA AGG GAT TTA GAT    2251

Val Gly Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg Asp Leu Asp

                275                 280                 285

TTA TCA AAT GCA AAG GAA ACG TTC AAC CCA TTG GTA GCT GCT TTT CCA    2299

Leu Ser Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala Phe Pro

            290                 295                 300

AGT GTG AAT GTT AGT ATG GAA AAG GTG ATA TTA TCA CCA AAT GAA AAT    2347

Ser Val Asn Val Ser Met Glu Lys Val Ile Leu Ser Pro Asn Glu Ash

        305                 310                 315

TTA TCC AAT AGT GTA GAG TCT CAT TCA TCC ACG AAT TGG TCT TAT ACG    2395

Leu Ser Asn Ser Val Glu Ser His Ser Ser Thr Asn Trp Ser Tyr Thr

    320                 325                 330

AAT ACA GAA GGA GCT TCC ATT GAA GCT GGT GGC GGT CCA TTA GGC CTT    2443

Asn Thr Glu Gly Ala Ser Ile Glu Ala Gly Gly Gly Pro Leu Gly Leu

335                 340                 345                 350

TCT TTT GGC GTG AGT GTT ACT TAT CAA CAC TCT GAA ACA GTT GCA CAA    2491

Ser Phe Gly Val Ser Val Thr Tyr Gln His Ser Glu Thr Val Ala Gln

                355                 360                 365

GAA TGG GGA ACA TCT ACA GGA AAT ACT TCA CAA TTC AAT ACG GCT TCA    2539

Glu Trp Gly Thr Ser Thr Gly Asn Thr Ser Gln Phe Asn Thr Ala Ser

            370                 375                 380

GCG GGA TAT TTA AAT GCA AAT GTT CGG TAT AAC AAT GTA GGG ACT GGT    2587

Ala Gly Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val Gly Thr Gly

        385                 390                 395

GCC ATC TAT GAT GTA AAA CCT ACA ACA AGT TTT GTA TTA AAT AAC AAT    2635

Ala Ile Tyr Asp Val Lys Pro Thr Thr Ser Phe Val Leu Asn Asn Asn

    400                 405                 410

ACC ATC GCA ACG ATT ACA GCA AAA TCA AAT TCA ACA GCT TTA CGT ATA    2683

Thr Ile Ala Thr Ile Thr Ala Lys Ser Asn Ser Thr Ala Leu Arg Ile

415                 420                 425                 430

TCT CCG GGG GAT AGT TAT CCA GAA ATA GGA GAA AAC GCT ATT GCG ATT    273l

Ser Pro Gly Asp Ser Tyr Pro Glu Ile Gly Glu Asn Ala Ile Ala Ile

                435                 440                 445

ACA TCT ATG GAT GAT TTT AAT TCT CAT CCA ATT ACA TTA AAT AAA CAA    2779

Thr Ser Met Asp Asp Phe Asn Ser His Pro Ile Thr Leu Asn Lys Gln

            450                 455                 460

CAG GTA AAT CAA TTG ATA AAT AAT AAG CCA ATT ATG CTA GAG ACA GAC    2827

Gln Val Asn Gln Leu Ile Asn Asn Lys Pro Ile Met Leu Glu Thr Asp

        465                 470                 475

CAA ACA GAT GGT GTT TAT AAA ATA AGA GAT ACA CAT GGA AAT ATT GTA    2875

Gln Thr Asp Gly Val Tyr Lys Ile Arg Asp Thr His Gly Asn Ile Val

    480                 485                 490

ACT GGT GGA GAA TGG AAT GGT GTA ACA CAA CAA ATT AAA GCA AAA ACA    2923

Thr Gly Gly Glu Trp Asn Gly Val Thr Gln Gln Ile Lys Ala Lys Thr

495                 500                 505                 510

GCG TCT ATT ATT GTG GAT GAC GGG AAA CAG GTA GCA GAA AAA CGT GTG    2971

Ala Ser Ile Ile Val Asp Asp Gly Lys Gln Val Ala Glu Lys Arg Val

                515                 520                 525

GCG GCA AAA GAT TAT GGT CAT CCA GAA GAT AAA ACA CCA CCT TTA ACT    3019

Ala Ala Lys Asp Tyr Gly His Pro Glu Asp Lys Thr Pro Pro Leu Thr

            530                 535                 540

TTA AAA GAT ACC CTG AAG CTT TCA TAC CCA GAT GAA ATA AAA GAA ACT    3067

Leu Lys Asp Thr Leu Lys Leu Ser Tyr Pro Asp Glu Ile Lys Glu Thr

        545                 550                 555

AAT GGA TTG TTG TAC TAT GAT GAC AAA CCA ATC TAT GAA TCG AGT GTC    3115

Asn Gly Leu Leu Tyr Tyr Asp Asp Lys Pro Ile Tyr Glu Ser Ser Val

    560                 565                 570

ATG ACT TAT CTG GAT GAA AAT ACG GCA AAA GAA GTC AAA AAA CAA ATA    3163

Met Thr Tyr Leu Asp Glu Asn Thr Ala Lys Glu Val Lys Lys Gln Ile

575                 580                 585                 590

AAT GAT ACA ACC GGA AAA TTT AAG GAT GTA AAT CAC TTA TAT GAT GTA    3211

Asn Asp Thr Thr Gly Lys Phe Lys Asp Val Asn His Leu Tyr Asp Val

                595                 600                 605

AAA CTG ACT CCA AAA ATG AAT TTT ACG ATT AAA ATG GCT TCC TTG TAT    3259

Lys Leu Thr Pro Lys Met Asn Phe Thr Ile Lys Met Ala Ser Leu Tyr

            610                 615                 620

GAT GGG GCT GAA AAT AAT CAT AAC TCT TTA GGA ACC TGG TAT TTA ACA    3307

Asp Gly Ala Glu Asn Asn His Asn Ser Leu Gly Thr Trp Tyr Leu Thr

        625                 630                 635

TAT AAT GTT GCT GGT GGA AAT ACT GGG AAG AGA CAA TAT CGT TCA GCT    3355

Tyr Asn Val Ala Gly Gly Asn Thr Gly Lys Arg Gln Tyr Arg Ser Ala

    640                 645                 650

CAT TCT TGT GCA CAT GTA GCT CTA TCT TCA GAA GCG AAA AAG AAA CTA    3403

His Ser Cys Ala His Val Ala Leu Ser Ser Glu Ala Lys Lys Lys Leu

655                 660                 665                 670

AAT CAA AAT GCG AAT TAC TAT CTT AGC ATG TAT ATG AAG GCT GAT TCT    3451

Asn Gln Asn Ala Asn Tyr Tyr Leu Ser Met Tyr Met Lys Ala Asp Ser

                675                 680                 685

ACT ACG GAA CCT ACA ATA GAA GTA GCT GGG GAA AAA TCT GCA ATA ACA    3499

Thr Thr Glu Pro Thr Ile Glu Val Ala Gly Glu Lys Ser Ala Ile Thr

            690                 695                 700

AGT AAA AAA GTA AAA TTA AAT AAT CAA AAT TAT CAA AGA GTT GAT ATT    3547

Ser Lys Lys Val Lys Leu Asn Asn Gln Asn Tyr Gln Arg Val Asp Ile

        705                 710                 715

TTA GTG AAA AAT TCT GAA AGA AAT CCA ATG GAT AAA ATA TAT ATA AGA    3595

Leu Val Lys Asn Ser Glu Arg Asn Pro Met Asp Lys Ile Tyr Ile Arg

    720                 725                 730

GGA AAT GGC ACG ACA AAT GTT TAT GGG GAT GAT GTT ACT ATC CCA GAG    3643

Gly Asn Gly Thr Thr Asn Val Tyr Gly Asp Asp Val Thr Ile Pro Glu

735                 740                 745                 750

GTA TCA GCT ATA AAT CCG GCT AGT CTA TCA GAT GAA GAA ATT CAA GAA    3691

Val Ser Ala Ile Asn Pro Ala Ser Leu Ser Asp Glu Glu Ile Gln Glu

                755                 760                 765

ATA TTT AAA GAC TCA ACT ATT GAA TAT GGA AAT CCT AGT TTC GTT GCT    3739

Ile Phe Lys Asp Ser Thr Ile Glu Tyr Gly Asn Pro Ser Phe Val Ala

            770                 775                 780

GAT GCC GTA ACA TTT AAA AAT ATA AAA CCT TTA CAA AAT TAT GTA AAG    3787

Asp Ala Val Thr Phe Lys Asn Ile Lys Pro Leu Gln Asn Tyr Val Lys

        785                 790                 795

GAA TAT GAA ATA TAT CAT AAA TCT CAT CGA TAT GAA AAG AAA ACG GTC    3835

Glu Tyr Glu Ile Tyr His Lys Ser His Arg Tyr Glu Lys Lys Thr Val

    800                 805                 810

TTT GAT ATC ATG GGT GTT CAT TAT GAG TAT AGT ATA GCT AGG GAA CAA    3883

Phe Asp Ile Met Gly Val His Tyr Glu Tyr Ser Ile Ala Arg Glu Gln

815                 820                 825                 830

AAG AAA GCC GCA TAATTTTAAA AATAAAACTC GTTAGAGTTT ATTTAGCATG        3935

Lys Lys Ala Ala

GTATTTTTAA GAATAATCAA TATGTTGAAC CGTTTGTAGC TGTTTTGGAA GGGAATTTCA  3995

TTTTATTTGG TCTCTTAAGT TGATGGGCAT GGGATATGTT CAGCATCCAA GCGTTTNGGG  4055

GGTTANAAAA TCCAATTTT                                               4074

(2)SEQ ID NO:20信息:

  (i)序列特征:

    (A)长度:462个氨基酸

    (B)类型:氨基酸

    (D)拓扑结构:线性

  (ii)分子类型:蛋白质

  (xi)序列描述:SEQ ID NO:20:

Met Gln Arg Met Glu Gly Lys Leu Phe Val Val Ser Lys Thr Leu Gln

  1               5                  10                  15

Val Val Thr Arg Thr Val Leu Leu Ser Thr Val Tyr Ser Ile Thr Leu

             20                  25                  30

Leu Asn Asn Val Val Ile Lys Ala Asp Gln Leu Asn Ile Asn Ser Gln

         35                  40                  45

Ser Lys Tyr Thr Asn Leu Gln Asn Leu Lys Ile Pro Asp Asn Ala Glu

     50                  55                  60

Asp Phe Lys Glu Asp Lys Gly Lys Ala Lys Glu Trp Gly Lys Glu Lys

65                  70                  75                  80

Gly Glu Glu Trp Arg Pro Pro Ala Thr Glu Lys Gly Glu Met Asn Asn

                 85                  90                  95

Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr

            100                 105                 110

Phe Ser Met Ala Gly Ser Cys Glu Asp Glu Ile Lys Asp Leu Glu Glu

        115                 120                 125

Ile Asp Lys Ile Phe Asp Lys Ala Asn Leu Ser Ser Ser Ile Ile Thr

    130                 135                 140

Tyr Lys Asn Val Glu Pro Ala Thr Ile Gly Phe Asn Lys Ser Leu Thr

145                 150                 155                 160

Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln

                165                 170                 175

Phe Leu Gly Lys Asp Met Lys Phe Asp Ser Tyr Leu Asp Thr His Leu

            180                 185                 190

Thr Ala Gln Gln Val Ser Ser Lys Lys Arg Val Ile Leu Lys Val Thr

        195                 200                 205

Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile

    210                 215                 220

Leu Asn Asn Asn Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Val Leu

225                 230                 235                 240

His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Met Glu Cys Ieu

                245                 250                 255

Gln Val Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile

            260                 265                 270

Asn Ala Glu Ala His Ser Trp Gly Met Lys Ile Tyr Glu Asp Trp Ala

        275                 280                 285

Lys Asn Leu Thr Ala Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg

    290                 295                 300

Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser

305                 310                 315                 320

Gly Asn Glu Lys Leu Asp Ala Gln Leu Lys Asn Ile Ser Asp Ala Leu

                325                 330                 335

Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly

            340                 345                 350

Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys

        355                 360                 365

Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr

    370                 375                 380

Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg

385                 390                 395                 400

Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr

                405                 410                 415

Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp

            420                 425                 430

Lys Asp Ser Lys Tyr His Ile Asp Lys Ala Thr Glu Val Ile Ile Lys

        435                 440                 445

Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn

    450                 455                 460

(2)SEQ ID NO:21信息:

  (i)序列特征:

    (A)长度:834个氨基酸

    (B)类型:氨基酸

    (D)拓扑结构:线性

  (ii)分子类型:蛋白质

  (xi)序列描述:SEQ ID NO:21:

Met Lys Asn Met Lys Lys Lys Leu Ala Ser Val Val Thr Cys Met Leu

  1                   5              10                  15

Leu Ala Pro Met Phe Leu Asn Gly Asn Val Asn Ala Val Asn Ala Asp

             20                  25                  30

Ser Lys Ile Asn Gln Ile Ser Thr Thr Gln Glu Asn Gln Gln Lys Glu

        35                   40                  45

Met Asp Arg Lys Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys Asp Phe

     50                  55                  60

Asn Asn Leu Thr Met Phe Ala Pro Thr Arg Asp Ash Thr Leu Met Tyr

65                   70                  75                  80

Asp Gln Gln Thr Ala Asn Ala Leu Leu Asp Lys Lys Gln Gln Glu Tyr

                 85                  90                  95

Gln Ser Ile Arg Trp Ile Gly Leu Ile Gln Arg Lys Glu Thr Gly Asp

            100                 105                 110

Phe Thr Phe Asn Leu Ser Lys Asp Glu Gln Ala Ile Ile Glu Ile Asp

        115                 120                 125

Gly Lys Ile Ile Ser Asn Lys Gly Lys Glu Lys Gln Val Val His Leu

    130                 135                 140

Glu Lys Glu Lys Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser Asp Thr

145                 150                 155                 160

Lys Phe Asn Ile Asp Ser Lys Thr Phe Lys Glu Leu Lys Leu Phe Lys

                165                 170                 175

Ile Asp Ser Gln Asn Gln Ser Gln Gln Val Gln Leu Arg Asn Pro Glu

            180                 185                 190

Phe Asn Lys Lys Glu Ser Gln Glu Phe Leu Ala Lys Ala Ser Lys Thr

        195                 200                 205

Asn Leu Phe Lys Gln Lys Met Lys Arg Asp Ile Asp Glu Asp Thr Asp

    210                 215                 220

Thr Asp Gly Asp Ser Ile Pro Asp Leu Trp Glu Glu Asn Gly Tyr Thr

225                 230                 235                 240

Ile Gln Asn Lys Val Ala Val Lys Trp Asp Asp Ser Leu Ala Ser Lys

                245                 250                 255

Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Asp Ser His Thr Val Gly

            260                 265                 270

Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg Asp Leu Asp Leu Ser

        275                 280                 285

Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala Phe Pro Ser Val

    290                 295                 300

Asn Val Ser Met Glu Lys Val Ile Leu Ser Pro Asn Glu Asn Leu Ser

305                 310                 315                 320

Asn Ser Val Glu Ser His Ser Ser Thr Asn Trp Ser Tyr Thr Asn Thr

                325                 330                 335

Glu Gly Ala Ser Ile Glu Ala Gly Gly Gly Pro Leu Gly Leu Ser Phe

            340                 345                 350

Gly Val Ser Val Thr Tyr Gln His Ser Glu Thr Val Ala Gln Glu Trp

        355                 360                 365

Gly Thr Ser Thr Gly Asn Thr Ser Gln Phe Asn Thr Ala Ser Ala Gly

    370                 375                 380

Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val Gly Thr Gly Ala Ile

385                 390                 395                 400

Tyr Asp Val Lys Pro Thr Thr Ser Phe Val Leu Asn Asn Asn Thr Ile

                405                 410                 415

Ala Thr Ile Thr Ala Lys Ser Asn Ser Thr Ala Leu Arg Ile Ser Pro

            420                 425                 430

Gly Asp Ser Tyr Pro Glu Ile Gly Glu Asn Ala Ile Ala Ile Thr Ser

        435                 440                 445

Met Asp Asp Phe Asn Ser His Pro Ile Thr Leu Asn Lys Gln Gln Val

    450                 455                 460

Asn Gln Leu Ile Asn Asn Lys Pro Ile Met Leu Glu Thr Asp Gln Thr

465                 470                 475                 480

Asp Gly Val Tyr Lys Ile Arg Asp Thr His Gly Asn Ile Val Thr Gly

                485                 490                 495

Gly Glu Trp Asn Gly Val Thr Gln Gln Ile Lys Ala Lys Thr Ala Ser

            500                 505                 510

Ile Ile Val Asp Asp Gly Lys Gln Val Ala Glu Lys Arg Val Ala Ala

        515                 520                 525

Lys Asp Tyr Gly His Pro Glu Asp Lys Thr Pro Pro Leu Thr Leu Lys

    530                 535                 540

Asp Thr Leu Lys Leu Ser Tyr Pro Asp Glu Ile Lys Glu Thr Asn Gly

545                 550                 555                 560

Leu Leu Tyr Tyr Asp Asp Lys Pro Ile Tyr Glu Ser Ser Val Met Thr

                565                 570                 575

Tyr Leu Asp Glu Asn Thr Ala Lys Glu Val Lys Lys Gln Ile Asn Asp

            580                 585                 590

Thr Thr Gly Lys Phe Lys Asp Val Asn His Leu Tyr Asp Val Lys Leu

        595                 600                 605

Thr Pro Lys Met Asn Phe Thr Ile Lys Met Ala Ser Leu Tyr Asp Gly

    610                 615                 620

Ala Glu Asn Asn His Asn Ser Leu Gly Thr Trp Tyr Leu Thr Tyr Asn

625                 630                 635                 640

Val Ala Gly Gly Asn Thr Gly Lys Arg Gln Tyr Arg Ser Ala His Ser

                645                 650                 655

Cys Ala His Val Ala Leu Ser Ser Glu Ala Lys Lys Lys Leu Asn Gln

            660                 665                 670

Asn Ala Asn Tyr Tyr Leu Ser Met Tyr Met Lys Ala Asp Ser Thr Thr

        675                 680                 685

Glu Pro Thr Ile Glu Val Ala Gly Glu Lys Ser Ala Ile Thr Ser Lys

    690                 695                 700

Lys Val Lys Leu Asn Asn Gln Asn Tyr Gln Arg Val Asp Ile Leu Val

70S                 710                 715                 720

Lys Asn Ser Glu Arg Asn Pro Met Asp Lys Ile Tyr Ile Arg Gly Asn

            725                 730                 735

Gly Thr Thr Asn Val Tyr Gly Asp Asp Val Thr Ile Pro Glu Val Ser

            740                 745                 750

Ala Ile Asn Pro Ala Ser Leu Ser Asp Glu Glu Ile Gln Glu Ile Phe

        755                 760                 765

Lys Asp Ser Thr Ile Glu Tyr Gly Asn Pro Ser Phe Val Ala Asp Ala

    770                 775                 780

Val Thr Phe Lys Asn Ile Lys Pro Leu Gln Asn Tyr Val Lys Glu Tyr

785                 790                 795                 800

Glu Ile Tyr His Lys Ser His Arg Tyr Glu Lys Lys Thr Val Phe Asp

                805                 810                 815

Ile Met Gly Val His Tyr Glu Tyr Ser Ile Ala Arg Glu Gln Lys Lys

            820                 825                 830

Ala Ala

(2)SEQ ID NO:22信息:

  (i)序列特征:

    (A)长度:4041个碱基对

    (B)类型:核酸

    (C)链型:单链

    (D)拓扑结构:线性

  (ii)分子类型:DNA(基因组)

  (ix)特征:

    (A)名称/关键词:CDS

    (B)位置:1..4038

    (D)其它信息:/产物=″VIP1A(a)/VIP2A(a)融合蛋白质″

  (xi)序列描述:SEQ ID NO:22:

ATG AAA AGA ATG GAG GGA AAG TTG TTT ATG GTG TCA AAA AAA TTA CAA    48

Met Lys Arg Met Glu Gly Lys Leu Phe Met Val Ser Lys Lys Leu Gln

835                 840                 845                 850

GTA GTT ACT AAA ACT GTA TTG CTT AGT ACA GTT TTC TCT ATA TCT TTA    96

Val Val Thr Lys Thr Val Leu Leu Ser Thr Val Phe Ser Ile Ser Leu

                855                 860                 865

TTA AAT AAT GAA GTG ATA AAA GCT GAA CAA TTA AAT ATA AAT TCT CAA    144

Leu Asn Asn Glu Val Ile Lys Ala Glu Gln Leu Asn Ile Asn Ser Gln

            870                 875                 880

AGT AAA TAT ACT AAC TTG CAA AAT CTA AAA ATC ACT GAC AAG GTA GAG    192

Ser Lys Tyr Thr Asn Leu Gln Asn Leu Lys Ile Thr Asp Lys Val Glu

        885                 890                 895

GAT TTT AAA GAA GAT AAG GAA AAA GCG AAA GAA TGG GGG AAA GAA AAA    240

Asp Phe Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys

    900                 905                 910

GAA AAA GAG TGG AAA CTA ACT GCT ACT GAA AAA GGA AAA ATG AAT AAT    288

Glu Lys Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn Asn

915                 920                 925                 930

TTT TTA GAT AAT AAA AAT GAT ATA AAG ACA AAT TAT AAA GAA ATT ACT    336

Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr

                935                 940                 945

TTT TCT ATG GCA GGC TCA TTT GAA GAT GAA ATA AAA GAT TTA AAA GAA    384

Phe Ser Met Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu

            950                 955                 960

ATT GAT AAG ATG TTT GAT AAA ACC AAT CTA TCA AAT TCT ATT ATC ACC    432

Ile Asp Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile Thr

        965                 970                 975

TAT AAA AAT GTG GAA CCG ACA ACA ATT GGA TTT AAT AAA TCT TTA ACA    480

Tyr Lys Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu Thr

    980                 985                 990

GAA GGT AAT ACG ATT AAT TCT GAT GCA ATG GCA CAG TTT AAA GAA CAA    528

Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln

995                 1000                1005                1010

TTT TTA GAT AGG GAT ATT AAG TTT GAT AGT TAT CTA GAT ACG CAT TTA    576

Phe Leu Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu

                1015                1020                1025

ACT GCT CAA CAA GTT TCC AGT AAA GAA AGA GTT ATT TTG AAG GTT ACG    624

Thr Ala Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val Thr

            1030                1035                1040

GTT CCG AGT GGG AAA GGT TCT ACT ACT CCA ACA AAA GCA GGT GTC ATT    672

Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile

        1045                1050                1055

TTA AAT AAT AGT GAA TAC AAA ATG CTC ATT GAT AAT GGG TAT ATG GTC    720

Leu Asn Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Met Val

    1060                1065                1070

CAT GTA GAT AAG GTA TCA AAA GTG GTG AAA AAA GGG GTG GAG TGC TTA    768

His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Val Glu Cys Leu

1075                1080                1085                1090

CAA ATT GAA GGG ACT TTA AAA AAG AGT CTT GAC TTT AAA AAT GAT ATA    816

Gln Ile Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile

                1095                1100                1105

AAT GCT GAA GCG CAT AGC TGG GGT ATG AAG AAT TAT GAA GAG TGG GCT    864

Asn Ala Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp Ala

            1110                1115                1120

AAA GAT TTA ACC GAT TCG CAA AGG GAA GCT TTA GAT GGG TAT GCT AGG    912

Lys Asp Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg

        1125                1130                1135

CAA GAT TAT AAA GAA ATC AAT AAT TAT TTA AGA AAT CAA GGC GGA AGT    960

Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser

    1140                1145                1150

GGA AAT GAA AAA CTA GAT GCT CAA ATA AAA AAT ATT TCT GAT GCT TTA    1008

Gly Asn Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala Leu

1155                1160                1165                1170

GGG AAG AAA CCA ATA CCG GAA AAT ATT ACT GTG TAT AGA TGG TGT GGC    1056

Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly

                1175                1180                1185

ATG CCG GAA TTT GGT TAT CAA ATT AGT GAT CCG TTA CCT TCT TTA AAA    1104

Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys

            1190                1195                1200

GAT TTT GAA GAA CAA TTT TTA AAT ACA ATC AAA GAA GAC AAA GGA TAT    1152

Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr

        1205                1210                1215

ATG AGT ACA AGC TTA TCG AGT GAA CGT CTT GCA GCT TTT GGA TCT AGA    1200

Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg

    1220                1225                1230

AAA ATT ATA TTA CGA TTA CAA GTT CCG AAA GGA AGT ACG GGT GCG TAT    1248

Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr

1235                1240                1245                1250

TTA AGT GCC ATT GGT GGA TTT GCA AGT GAA AAA GAG ATC CTA CTT GAT    1296

Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp

                1255                1260                1265

AAA GAT AGT AAA TAT CAT ATT GAT AAA GTA ACA GAG GTA ATT ATT AAA    1344

Lys Asp Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile Lys

            1270                1275                1280

GGT GTT AAG CGA TAT GTA GTG GAT GCA ACA TTA TTA ACA AAT ATG AAA    1392

Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn Met Lys

        1285                1290                1295

AAT ATG AAG AAA AAG TTA GCA AGT GTT GTA ACG TGT ACG TTA TTA GCT    1440

Asn Met Lys Lys Lys Leu Ala Ser Val Val Thr Cys Thr Leu Leu Ala

    1300                1305                1310

CCT ATG TTT TTG AAT GGA AAT GTG AAT GCT GTT TAC GCA GAC AGC AAA    1488

Pro Met Phe Leu Asn Gly Asn Val Asn Ala Val Tyr Ala Asp Ser Lys

1315                1320                1325                1330

ACA AAT CAA ATT TCT ACA ACA CAG AAA AAT CAA CAG AAA GAG ATG GAC    1536

Thr Asn Gln Ile Ser Thr Thr Gln Lys Asn Gln Gln Lys Glu Met Asp

                1335                1340                1345

CGA AAA GGA TTA CTT GGG TAT TAT TTC AAA GGA AAA GAT TTT AGT AAT    1584

Arg Lys Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys Asp Phe Ser Asn

            1350                1355                1360

CTT ACT ATG TTT GCA CCG ACA CGT GAT AGT ACT CTT ATT TAT GAT CAA    1632

Leu Thr Met Phe Ala Pro Thr Arg Asp Ser Thr Leu Ile Tyr Asp Gln

        1365                1370                1375

CAA ACA GCA AAT AAA CTA TTA GAT AAA AAA CAA CAA GAA TAT CAG TCT    1680

Gln Thr Ala Asn Lys Leu Leu Asp Lys Lys Gln Gln Glu Tyr Gln Ser

    1380                1385                1390

ATT CGT TGG ATT GGT TTG ATT CAG AGT AAA GAA ACG GGA GAT TTC ACA    1728

Ile Arg Trp Ile Gly Leu Ile Gln Ser Lys Glu Thr Gly Asp Phe Thr

1395                1400                1405                1410

TTT AAC TTA TCT GAG GAT GAA CAG GCA ATT ATA GAA ATC AAT GGG AAA    1776

Phe Asn Leu Ser Glu Asp Glu Gln Ala Ile Ile Glu Ile Asn Gly Lys

                1415                1420                1425

ATT ATT TCT AAT AAA GGG AAA GAA AAG CAA GTT GTC CAT TTA GAA AAA    1824

Ile Ile Ser Asn Lys Gly Lys Glu Lys Gln Val Val His Leu Glu Lys

            1430                1435                1440

GGA AAA TTA GTT CCA ATC AAA ATA GAG TAT CAA TCA GAT ACA AAA TTT    1872

Gly Lys Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser Asp Thr Lys Phe

        1445                1450                1455

AAT ATT GAC AGT AAA ACA TTT AAA GAA CTT AAA TTA TTT AAA ATA GAT    1920

Asn Ile Asp Ser Lys Thr Phe Lys Glu Leu Lys Leu Phe Lys Ile Asp

    1460                1465                1470

AGT CAA AAC CAA CCC CAG CAA GTC CAG CAA GAT GAA CTG AGA AAT CCT    1968

Ser Gln Asn Gln Pro Gln Gln Val Gln Gln Asp Glu Leu Arg Asn Pro

1475                1480                1485                1490

GAA TTT AAC AAG AAA GAA TCA CAG GAA TTC TTA GCG AAA CCA TCG AAA    2016

Glu Phe Asn Lys Lys Glu Ser Gln Glu Phe Leu Ala Lys Pro Ser Lys

                1495                1500                1505

ATA AAT CTT TTC ACT CAA AAA ATG AAA AGG GAA ATT GAT GAA GAC ACG    2064

Ile Asn Leu Phe Thr Gln Lys Met Lys Arg Glu Ile Asp Glu Asp Thr

            15l0                1515                1520

GAT ACG GAT GGG GAC TCT ATT CCT GAC CTT TGG GAA GAA AAT GGG TAT    2112

Asp Thr Asp Gly Asp Ser Ile Pro Asp Leu Trp Glu Glu Asn Gly Tyr

            1525                1530                1535

ACG ATT CAA AAT AGA ATC GCT GTA AAG TGG GAC GAT TCT CTA GCA AGT    2160

Thr Ile Gln Asn Arg Ile Ala Val Lys Trp Asp Asp Ser Leu Ala Ser

    1540                1545                1550

AAA GGG TAT ACG AAA TTT GTT TCA AAT CCA CTA GAA AGT CAC ACA GTT    2208

Lys Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Glu Ser His Thr Val

1555                1560                1565                1570

GGT GAT CCT TAT ACA GAT TAT GAA AAG GCA GCA AGA GAT CTA GAT TTG    2256

Gly Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg Asp Leu Asp Leu

                1575                1580                1585

TCA AAT GCA AAG GAA ACG TTT AAC CCA TTG GTA GCT GCT TTT CCA AGT    2304

Ser Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala Phe Pro Ser

        1590                1595                1600

GTG AAT GTT AGT ATG GAA AAG GTG ATA TTA TCA CCA AAT GAA AAT TTA    2352

Val Asn Val Ser Met Glu Lys Val Ile Leu Ser Pro Asn Glu Asn Leu

        1605                1610                1615

TCC AAT AGT GTA GAG TCT CAT TCA TCC ACG AAT TGG TCT TAT ACA AAT    2400

Ser Asn Ser Val Glu Ser His Ser Ser Thr Asn Trp Ser Tyr Thr Asn

    1620                1625                1630

ACA GAA GGT GCT TCT GTT GAA GCG GGG ATT GGA CCA AAA GGT ATT TCG    2448

Thr Glu Gly Ala Ser Val Glu Ala Gly Ile Gly Pro Lys Gly Ile Ser

1635                1640                1645                1650

TTC GGA GTT AGC GTA AAC TAT CAA CAC TCT GAA ACA GTT GCA CAA GAA    2496

Phe Gly Val Ser Val Asn Tyr Gln His Ser Glu Thr Val Ala Gln Glu

                1655                1660                1665

TGG GGA ACA TCT ACA GGA AAT ACT TCG CAA TTC AAT ACG GCT TCA GCG    2544

Trp Gly Thr Ser Thr Gly Asn Thr Ser Gln Phe Asn Thr Ala Ser Ala

            1670                1675                1680

GGA TAT TTA AAT GCA AAT GTT CGA TAT AAC AAT GTA GGA ACT GGT GCC    2592

Gly Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val Gly Thr Gly Ala

        1685                1690                1695

ATC TAC GAT GTA AAA CCT ACA ACA AGT TTT GTA TTA AAT AAC GAT ACT    2640

Ile Tyr Asp Val Lys Pro Thr Thr Ser Phe Val Leu Asn Asn Asp Thr

1700                1705                1710

ATC GCA ACT ATT ACG GCG AAA TCT AAT TCT ACA GCC TTA AAT ATA TCT    2688

Ile Ala Thr Ile Thr Ala Lys Ser Asn Ser Thr Ala Leu Asn Ile Ser

1715                1720                1725                1730

CCT GGA GAA AGT TAC CCG AAA AAA GGA CAA AAT GGA ATC GCA ATA ACA    2736

Pro Gly Glu Ser Tyr Pro Lys Lys Gly Gln Asn Gly Ile Ala Ile Thr

                1735                1740                1745

TCA ATG GAT GAT TTT AAT TCC CAT CCG ATT ACA TTA AAT AAA AAA CAA    2784

Ser Met Asp Asp Phe Asn Ser His Pro Ile Thr Leu Asn Lys Lys Gln

            1750                1755                1760

GTA GAT AAT CTG CTA AAT AAT AAA CCT ATG ATG TTG GAA ACA AAC CAA    2832

Val Asp Asn Leu Leu Asn Asn Lys Pro Met Met Leu Glu Thr Asn Gln

        1765                1770                1775

ACA GAT GGT GTT TAT AAG ATA AAA GAT ACA CAT GGA AAT ATA GTA ACT    2880

Thr Asp Gly Val Tyr Lys Ile Lys Asp Thr His Gly Asn Ile Val Thr

    1780                1785                1790

GGC GGA GAA TGG AAT GGT GTC ATA CAA CAA ATC AAG GCT AAA ACA GCG    2928

Gly Gly Glu Trp Asn Gly Val Ile Gln Gln Ile Lys Ala Lys Thr Ala

1795                1800                1805                1810

TCT ATT ATT GTG GAT GAT GGG GAA CGT GTA GCA GAA AAA CGT GTA GCG    2976

Ser Ile Ile Val Asp Asp Gly Glu Arg Val Ala Glu Lys Arg Val Ala

                1815                1820                1825

GCA AAA GAT TAT GAA AAT CCA GAA GAT AAA ACA CCG TCT TTA ACT TTA    3024

Ala Lys Asp Tyr Glu Asn Pro Glu Asp Lys Thr Pro Ser Leu Thr Leu

            1830                1835                1840

AAA GAT GCC CTG AAG CTT TCA TAT CCA GAT GAA ATA AAA GAA ATA GAG    3072

Lys Asp Ala Leu Lys Leu Ser Tyr Pro Asp Glu Ile Lys Glu Ile Glu

        1845                1850                1855

GGA TTA TTA TAT TAT AAA AAC AAA CCG ATA TAC GAA TCG AGC GTT ATG    3120

Gly Leu Leu Tyr Tyr Lys Asn Lys Pro Ile Tyr Glu Ser Ser Val Met

    1860                1865                1870

ACT TAC TTA GAT GAA AAT ACA GCA AAA GAA GTG ACC AAA CAA TTA AAT    3168

Thr Tyr Leu Asp Glu Asn Thr Ala Lys Glu Val Thr Lys Gln Leu Asn

1875                1880                1885                1890

GAT ACC ACT GGG AAA TTT AAA GAT GTA AGT CAT TTA TAT GAT GTA AAA    3216

Asp Thr Thr Gly Lys Phe Lys Asp Val Ser His Leu Tyr Asp Val Lys

                1895                1900                1905

CTG ACT CCA AAA ATG AAT GTT ACA ATC AAA TTG TCT ATA CTT TAT GAT    3264

Leu Thr Pro Lys Met Asn Val Thr Ile Lys Leu Ser Ile Leu Tyr Asp

            1910                1915                1920

AAT GCT GAG TCT AAT GAT AAC TCA ATT GGT AAA TGG ACA AAC ACA AAT    3312

Asn Ala Glu Ser Asn Asp Asn Ser Ile Gly Lys Trp Thr Asn Thr Asn

        1925                1930                1935

ATT GTT TCA GGT GCA AAT AAC GGA AAA AAA CAA TAT TCT TCT AAT AAT    3360

Ile Val Ser Gly Gly Asn Asn Gly Lys Lys Gln Tyr Ser Ser Asn Asn

    1940                1945                1950

CCG GAT GCT AAT TTG ACA TTA AAT ACA GAT GCT CAA GAA AAA TTA AAT    3408

Pro Asp Ala Asn Leu Thr Leu Asn Thr Asp Ala Gln Glu Lys Leu Asn

1955                1960                1965                1970

AAA AAT CGT GAC TAT TAT ATA AGT TTA TAT ATG AAG TCA GAA AAA AAC    3456

Lys Asn Arg Asp Tyr Tyr Ile Ser Leu Tyr Met Lys Ser Glu Lys Asn

                1975                1980                1985

ACA CAA TGT GAG ATT ACT ATA GAT GGG GAG ATT TAT CCG ATC ACT ACA    3504

Thr Gln Cys Glu Ile Thr Ile Asp Gly Glu Ile Tyr Pro Ile Thr Thr

            1990                1995                2000

AAA ACA GTG AAT GTG AAT AAA GAC AAT TAC AAA AGA TTA GAT ATT ATA    3552

Lys Thr Val Asn Val Asn Lys Asp Asn Tyr Lys Arg Leu Asp Ile Ile

        2005                2010                2015

GCT CAT AAT ATA AAA AGT AAT CCA ATT TCT TCA CTT CAT ATT AAA ACG    3600

Ala His Asn Ile Lys Ser Asn Pro Ile Ser Ser Leu His Ile Lys Thr

    2020                2025                2030

AAT GAT GAA ATA ACT TTA TTT TGG GAT GAT ATT TCT ATA ACA GAT GTA    3648

Asn Asp Glu Ile Thr Leu Phe Trp Asp Asp Ile Ser Ile Thr Asp Val

2035                2040                2045                2050

GCA TCA ATA AAA CCG GAA AAT TTA ACA GAT TCA GAA ATT AAA CAG ATT    3696

Ala Ser Ile Lys Pro Glu Asn Leu Thr Asp Ser Glu Ile Lys Gln Ile

                2055                2060                2065

TAT AGT AGG TAT GGT ATT AAG TTA GAA GAT GGA ATC CTT ATT GAT AAA    3744

Tyr Ser Arg Tyr Gly Ile Lys Leu Glu Asp Gly Ile Leu Ile Asp Lys

            2070                2075                2080

AAA GGT GGG ATT CAT TAT GGT GAA TTT ATT AAT GAA GCT AGT TTT AAT    3792

Lys Gly Gly Ile His Tyr Gly Glu Phe Ile Asn Glu Ala Ser Phe Asn

        2085                2090                2095

ATT GAA CCA TTG CAA AAT TAT GTG ACC AAA TAT GAA GTT ACT TAT AGT    3840

Ile Glu Pro Leu Gln Asn Tyr Val Thr Lys Tyr Glu Val Thr Tyr Ser

    2100                2105                2110

AGT GAG TTA GGA CCA AAC GTG AGT GAC ACA CTT GAA AGT GAT AAA ATT    3888

Ser Glu Leu Gly Pro Asn Val Ser Asp Thr Leu Glu Ser Asp Lys Ile

2115                2120                2125                2130

TAC AAG GAT GGG ACA ATT AAA TTT GAT TTT ACC AAA TAT AGT AAA AAT    3936

Tyr Lys Asp Gly Thr Ile Lys Phe Asp Phe Thr Lys Tyr Ser Lys Asn

                2135                2140                2145

GAA CAA GGA TTA TTT TAT GAC AGT GGA TTA AAT TGG GAC TTT AAA ATT    3984

Glu Gln Gly Leu Phe Tyr Asp Ser Gly Leu Asn Trp Asp Phe Lys Ile

            2150                2155                2160

AAT GCT ATT ACT TAT GAT GGT AAA GAG ATG AAT GTT TTT CAT AGA TAT    4032

Asn Ala Ile Thr Tyr Asp Gly Lys Glu Met Asn Val Phe His Arg Tyr

        2165                2170                2175

AAT AAA TAG                                                        4041

Asn Lys

    2180

(2)SEQ ID NO:23信息:

  (i)序列特征:

    (A)长度:1346个氨基酸

    (B)类型:氨基酸

    (D)拓扑结构:线性

  (ii)分子类型:蛋白质

  (xi)序列描述:SEQ ID NO:23:

Met Lys Arg Met Glu Gly Lys Leu Phe Met Val Ser Lys Lys Leu Gln

  1               5                  10                  15

Val Val Thr Lys Thr Val Leu Leu Ser Thr Val Phe Ser Ile Ser Leu

             20                  25                  30

Leu Asn Asn Glu Val Ile Lys Ala Glu Gln Leu Asn Ile Asn Ser Gln

         35                  40                  45

Ser Lys Tyr Thr Asn Leu Gln Asn Leu Lys Ile Thr Asp Lys Val Glu

     50                  55                  60

Asp Phe Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys

 65                  70                  75                  80

Glu Lys Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn Asn

                 85                  90                  95

Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr

            100                 105                 110

Phe Ser Met Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu

        115                 120                 125

Ile Asp Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile Thr

    130                 135                 140

Tyr Lys Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu Thr

145                 150                 155                 160

Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln

                165                 170                 175

Phe Leu Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu

            180                 185                 190

Thr Ala Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val Thr

        195                 200                 205

Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile

    210                 215                 220

Leu Asn Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Met Val

225                 230                 235                 240

His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Val Glu Cys Leu

                245                 250                 255

Gln Ile Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile

            260                 265                 270

Asn Ala Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp Ala

        275                 280                 285

Lys Asp Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg

    290                 295                 300

Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser

305                 310                 315                 320

Gly Asn Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala Leu

                325                 330                 335

Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly

            340                 345                 350

Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys

        355                 360                 365

Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr

    370                 375                 380

Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg

385                 390                 395                 400

Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr

                405                 410                 415

Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp

            420                 425                 430

Lys Asp Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile Lys

        435                 440                 445

Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn Met Lys

    450                 455                 460

Asn Met Lys Lys Lys Leu Al Ser Val Val Thr Cys Thr Leu Leu Ala

465                 470                 475                 480

Pro Met Phe Leu Asn Gly Asn Val Asn Ala Val Tyr Ala Asp Ser Lys

                485                 490                 495

Thr Asn Gln Ile Ser Thr Thr Gln Lys Asn Gln Gln Lys Glu Met Asp

            500                 505                 510

Arg Lys Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys Asp Phe Ser Asn

        515                 520                 525

Leu Thr Met Phe Ala Pro Thr Arg Asp Ser Thr Leu Ile Tyr Asp Gln

    530                 535                 540

Gln Thr Ala Asn Lys Leu Leu Asp Lys  Lys Gln Gln Glu Tyr Gln Ser

545                 550                 555                 560

Ile Arg Trp Ile Gly Leu  Ile Gln Ser Lys Glu Thr Gly Asp Phe Thr

                565                 570                 575

Phe Asn Leu Ser Glu Asp Glu Gln Ala Ile Ile Glu Ile Asn Gly Lys

            580                 585                 590

Ile Ile Ser Asn Lys Gly Lys Glu Lys Gln Val Val His Leu Glu Lys

        595                 600                 605

Gly Lys Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser Asp Thr Lys Phe

    610                 615                 620

Asn Ile Asp Ser Lys Thr Phe Lys Glu Leu Lys Leu Phe Lys Ile Asp

625                 630                 635                 640

Ser Gln Asn Gln Pro Gln Gln Val Gln Gln Asp Glu Leu Arg Asn Pro

                645                 650                 655

Glu Phe Asn Lys Lys Glu Ser Gln Glu Phe Leu Ala Lys Pro Ser Lys

            660                 665                 670

Ile Asn Leu Phe Thr Gln Lys Met Lys Arg Glu Ile Asp Glu Asp Thr

        675                 680                 685

Asp Thr Asp Gly Asp Ser Ile Pro Asp Leu Trp Glu Glu Asn Gly Tyr

    690                 695                 700

Thr Ile Gln Asn Arg Ile Ala Val Lys Trp Asp Asp Ser Leu Ala Ser

705                 7l0                 715                 720

Lys Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Glu Ser His Thr Val

                725                 730                 735

Gly Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg Asp Leu Asp Leu

            740                 745                 750

Ser Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala Phe Pro Ser

        755                 760                 765

Val Asn Val Ser Met Glu Lys Val Ile Leu Ser Pro Asn Glu Asn Leu

    770                 775                 780

Ser Asn Ser Val Glu Ser His Ser Ser Thr Asn Trp Ser Tyr Thr Asn

785                 790                 795                 800

Thr Glu Gly Ala Ser Val Glu Ala Gly Ile Gly Pro Lys Gly Ile Ser

                805                 810                 815

Phe Gly Val Ser Val Asn Tyr Gln His Ser Glu Thr Val Ala Gln Glu

            820                 825                 830

Trp Gly Thr Ser Thr Gly Asn Thr Ser Gln Phe Asn Thr Ala Ser Ala

            835                 840                 845

Gly Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val Gly Thr Gly Ala

    850                 855                 860

Ile Tyr Asp Val Lys Pro Thr Thr Ser Phe Val Leu Asn Asn Asp Thr

865                 870                 875                 880

Ile Ala Thr Ile Thr Ala Lys Ser Asn Ser Thr Ala Leu Asn Ile Ser

                885                 890                 895

Pro Gly Glu Ser Tyr Pro Lys Lys Gly Gln Asn Gly Ile Ala Ile Thr

            900                 905                 910

Ser Met Asp Asp Phe Asn Ser His Pro Ile Thr Leu Asn Lys Lys Gln

        915                 920                 925

Val Asp Asn Leu Leu Asn Asn Lys Pro Met Met Leu Glu Thr Asn Gln

    930                 935                 940

Thr Asp Gly Val Tyr Lys Ile Lys Asp Thr His Gly Asn Ile Val Thr

945                 950                 955                 960

Gly Gly Glu Trp Asn Gly Val Ile Gln Gln Ile Lys Ala Lys Thr Ala

                965                 970                 975

Ser Ile Ile Val Asp Asp Gly Glu Arg Val Ala Glu Lys Arg Val Ala

            980                 985                 990

Ala Lys Asp Tyr Glu Asn Pro Glu Asp Lys Thr Pro Ser Leu Thr Leu

        995                 1000                1005

Lys Asp Ala Leu Lys Leu Ser Tyr Pro Asp Glu Ile Lys Glu Ile Glu

    1010                1015                1020

Gly Leu Leu Tyr Tyr Lys Asn Lys Pro Ile Tyr Glu Ser Ser Val Mer

1025                1030                1035                1040

Thr Tyr Leu Asp Glu Asn Thr Ala Lys Glu Val Thr Lys Gln Leu Asn

                1045                1050                1055

Asp Thr Thr Gly Lys Phe Lys Asp Val Ser His Leu Tyr Asp Val Lys

            1060                1065                1070

Leu Thr Pro Lys Met Asn Val Thr Ile Lys Leu Ser Ile Leu Tyr Asp

        1075                1080                1085

Asn Ala Glu Ser Asn Asp Asn Ser Ile Gly Lys Trp Thr Asn Thr Asn

    1090                1095                1100

Ile Val Ser Gly Gly Asn Asn Gly Lys Lys Gln Tyr Ser Ser Asn Asn

1105                1110                1115                1120

Pro Asp Ala Asn Leu Thr Leu Asn Thr Asp Ala Gln Glu Lys Leu Asn

               1125                1130                1135

Lys Asn Arg Asp Tyr Tyr Ile Ser Leu Tyr Met Lys Ser Glu Lys Asn

            1140                1145                1150

Thr Gln Cys Glu Ile Thr Ile Asp Gly Glu Ile Tyr Pro Ile Thr Thr

        1155                1160                1165

Lys Thr Val Asn Val Asn Lys Asp Asn Tyr Lys Arg Leu Asp Ile Ile

    1170                1175                1180

Ala His Asn Ile Lys Ser Asn Pro Ile Ser Ser Leu His Ile Lys Thr

1185                1190                1195                1200

Asn Asp Glu Ile Thr Leu Phe Trp Asp Asp Ile Ser Ile Thr Asp Val

                1205                1210                1215

Ala Ser Ile Lys Pro Glu Asn Leu Thr Asp Ser Glu Ile Lys Gln Ile

            1220                1225                1230

Tyr Ser Arg Tyr Gly Ile Lys Leu Glu Asp Gly Ile Leu Ile Asp Lys

        1235                1240                1245

Lys Gly Gly Ile His Tyr Gly Glu Phe Ile Asn Glu Ala Ser Phe Asn

    1250                1255                1260

Ile Glu Pro Leu Gln Asn Tyr Val Thr Lys Tyr Glu Val Thr Tyr Ser

1265                1270                1275                1280

Ser Glu Leu Gly Pro Asn Val Ser Asp Thr Leu Glu Ser Asp Lys Ile

                1285                1290                1295

Tyr Lys Asp Gly Thr Ile Lys Phe Asp Phe Thr Lys Tyr Ser Lys Asn

            1300                1305                1310

Glu Gln Gly Leu Phe Tyr Asp Ser Gly Leu Asn Trp Asp Phe Lys Ile

        1315                1320                1325

Asn Ala Ile Thr Tyr Asp Gly Lys Glu Met Asn Val Phe His Arg Tyr

    1330                1335                1340

Asn Lys

1345

(2)SEQ ID NO:24信息:

  (i)序列特征:

    (A)长度:1399个碱基对

    (B)类型:核酸

    (C)链型:单链

    (D)拓扑结构:线性

  (ii)分子类型:DNA(基因组)

  (ix)特征:

    (A)名称/关键词:misc_特征

    (B)位置:1..1386

    (D)其它信息:/注=″玉米优化的得自AB78的VIP2A(a)DNA 序列″

  (xi)序列描述:SEQ ID NO:24:

ATGAAGCGCA TGGAGGGCAA GCTGTTCATG GTGAGCAAGA AGCTCCAGGT GGTGACCAAG     60

ACCGTGCTGC TGAGCACCGT GTTCAGCATC AGCCTGCTGA ACAACGAGGT GATCAAGGCC    120

GAGCAGCTGA ACATCAACAG CCAGAGCAAG TACACCAACC TCCAGAACCT GAAGATCACC    180

GACAAGGTGG AGGACTTCAA GGAGGACAAG GAGAAGGCCA AGGAGTGGGG CAAGGAGAAG    240

GAGAAGGAGT GGAAGCTTAC CGCCACCGAG AAGGGCAAGA TGAACAACTT CCTGGACAAC    300

AAGAACGACA TCAAGACCAA CTACAAGGAG ATCACCTTCA GCATGGCCGG CAGCTTCGAG    360

GACGAGATCA AGGACCTGAA GGAGATCGAC AAGATGTTCG ACAAGACCAA CCTGAGCAAC    420

AGCATCATCA CCTACAAGAA CGTGGAGCCC ACCACCATCG GCTTCAACAA GAGCCTGACC    480

GAGGGCAACA CCATCAACAG CGACGCCATG GCCCAGTTCA AGGAGCAGTT CCTGGACCGC    540

GACATCAAGT TCGACAGCTA CCTGGACACC CACCTGACCG CCCAGCAGGT GAGCAGCAAG    600

GAGCGCGTGA TCCTGAAGGT GACCGTCCCC AGCGGCAAGG GCAGCACCAC CCCCACCAAG    660

GCCGGCGTGA TCCTGAACAA CAGCGAGTAC AAGATGCTGA TCGACAACGG CTACATGGTG    720

CACGTGGACA AGGTGAGCAA GGTGGTGAAG AAGGGCGTGG AGTGCCTCCA GATCGAGGGC    780

ACCCTGAAGA AGAGTCTAGA CTTCAAGAAC GACATCAACG CCGAGGCCCA CAGCTGGGGC    840

ATGAAGAACT ACGAGGAGTG GGCCAAGGAC CTGACCGACA GCCAGCGCGA GGCCCTGGAC     900

GGCTACGCCC GCCAGGACTA CAAGGAGATC AACAACTACC TGCGCAACCA GGGCGGCAGC     960

GGCAACGAGA AGCTGGACGC CCAGATCAAG AACATCAGCG ACGCCCTGGG CAAGAAGCCC    1020

ATCCCCGAGA ACATCACCGT GTACCGCTGG TGCGGCATGC CCGAGTTCGG CTACCAGATC    1080

AGCGACCCCC TGCCCAGCCT GAAGGACTTC GAGGAGCAGT TCCTGAACAC CATCAAGGAG    1140

GACAAGGGCT ACATGAGCAC CAGCCTGAGC AGCGAGCGCC TGGCCGCCTT CGGCAGCCGC    1200

AAGATCATCC TGCGCCTGCA GGTGCCCAAG GGCAGCACCG GCGCCTACCT GAGCGCCATC    1260

GGCGGCTTCG CCAGCGAGAA GGAGATCCTG CTGGACAAGG ACAGCAAGTA CCACATCGAC    1320

AAGGTGACCG AGGTGATCAT CAAGGGCGTG AAGCGCTACG TGGTGGACGC CACCCTGCTG    1380

ACCAACTAGA TCTGAGCTC                                                 1399

(2)SEQ ID NO:25信息:

  (i)序列特征:

    (A)长度:19个氨基酸

    (B)类型:氨基酸

    (D)拓扑结构:线性

  (ii)分子类型:肽

  (ix)特征:

    (A)名称/关键词:肽

    (B)位置:1..1 9

    (D)其它信息:/注=″将VIP2分泌出细胞的分泌信号肽序列″

  (xi)序列描述:SEQ ID NO:25:

Gly Trp Ser Trp Ile Phe Leu Phe Leu Leu Ser Gly Ala Ala Gly Val

1               5                   10                  15

His Cys Leu

(2)SEQ ID NO:26信息:

  (i)序列特征:

    (A)长度:2655个碱基对

    (B)类型:核酸

    (C)链型:单链

  (D)拓扑结构:线性

(ii)分子类型:其它核酸

  (A)描述:/desc=“合成DNA”

(iii)假设:否

(ix)特征:

  (A)名称/关键词:misc_特征

  (B)位置:1..2655

  (D)其它信息:/注=″玉米优化的编码VIP1A(a)的DNA序列″

  (xi)序列描述:SEQ ID NO:26:

ATGAAGAACA TGAAGAAGAA GCTGGCCAGC GTGGTGACCT GCACCCTGCT GGCCCCCATG      60

TTCCTGAACG GCAACGTGAA CGCCGTGTAC GCCGACAGCA AGACCAACCA GATCAGCACC     120

ACCCAGAAGA ACCAGCAGAA GGAGATGGAC CGCAAGGGCC TGCTGGGCTA CTACTTCAAG     180

GGCAAGGACT TCAGCAACCT GACCATGTTC GCCCCCACGC GTGACAGCAC CCTGATCTAC     240

GACCAGCAGA CCGCCAACAA GCTGCTGGAC AAGAAGCAGC AGGAGTACCA GAGCATCCGC     300

TGGATCGGCC TGATCCAGAG CAAGGAGACC GGCGACTTCA CCTTCAACCT GAGCGAGGAC     360

GAGCAGGCCA TCATCGAGAT CAACGGCAAG ATCATCAGCA ACAAGGGCAA GGAGAAGCAG     420

GTGGTGCACC TGGAGAAGGG CAAGCTGGTG CCCATCAAGA TCGAGTACCA GAGCGACACC     480

AAGTTCAACA TCGACAGCAA GACCTTCAAG GAGCTGAAGC TTTTCAAGAT CGACAGCCAG     540

AACCAGCCCC AGCAGGTGCA GCAGGACGAG CTGCGCAACC CCGAGTTCAA CAAGAAGGAG     600

AGCCAGGAGT TCCTGGCCAA GCCCAGCAAG ATCAACCTGT TCACCCAGCA GATGAAGCGC     660

GAGATCGACG AGGACACCGA CACCGACGGC GACAGCATCC CCGACCTGTG GGAGGAGAAC     720

GGCTACACCA TCCAGAACCG CATCGCCGTG AAGTGGGACG ACAGCCTGGC TAGCAAGGGC     780

TACACCAAGT TCGTGAGCAA CCCCCTGGAG AGCCACACCG TGGGCGACCC CTACACCGAC     840

TACGAGAAGG CCGCCCGCGA CCTGGACCTG AGCAACGCCA AGGAGACCTT CAACCCCCTG     900

GTGGCCGCCT TCCCCAGCGT GAACGTGAGC ATGGAGAAGG TGATCCTGAG CCCCAACGAG     960

AACCTGAGCA ACAGCGTGGA GAGCCACTCG AGCACCAACT GGAGCTACAC CAACACCGAG    1020

GGCGCCAGCG TGGAGGCCGG CATCGGTCCC AAGGGCATCA GCTTCGGCGT GAGCGTGAAC    1080

TACCAGCACA GCGAGACCGT GGCCCAGGAG TGGGGCACCA GCACCGGCAA CACCAGCCAG    1140

TTCAACACCG CCAGCGCCGG CTACCTGAAC GCCAACGTGC GCTACAACAA CGTGGGCACC    1200

GGCGCCATCT ACGACGTGAA GCCCACCACC AGCTTCGTGC TGAACAACGA CACCATCGCC    1260

ACCATCACCG CCAAGTCGAA TTCCACCGCC CTGAACATCA GCCCCGGCGA GAGCTACCCC    1320

AAGAAGGGCC AGAACGGCAT CGCCATCACC AGCATGGACG ACTTCAACAG CCACCCCATC    1380

ACCCTGAACA AGAAGCAGGT GGACAACCTG CTGAACAACA AGCCCATGAT GCTGGAGACC    1440

AACCAGACCG ACGGCGTCTA CAAGATCAAG GACACCCACG GCAACATCGT GACGGGCGGC    1500

GAGTGGAACG GCGTGATCCA GCAGATCAAG GCCAAGACCG CCAGCATCAT CGTCGACGAC    1560

GGCGAGCGCG TGGCCGAGAA GCGCGTGGCC GCCAAGGACT ACGAGAACCC CGAGGACAAG    1620

ACCCCCAGCC TGACCCTGAA GGACGCCCTG AAGCTGAGCT ACCCCGACGA GATCAAGGAG    1680

ATCGAGGGCT TGCTGTACTA CAAGAACAAG CCCATCTACG AGAGCAGCGT GATGACCTAT    1740

CTAGACGAGA ACACCGCCAA GGAGGTGACC AAGCAGCTGA ACGACACCAC CGGCAAGTTC    1800

AAGGACGTGA GCCACCTGTA CGACGTGAAG CTGACCCCCA AGATGAACGT GACCATCAAG    1860

CTGAGCATCC TGTACGACAA CGCCGAGAGC AACGACAACA GCATCGGCAA GTGGACCAAC    1920

ACCAACATCG TGAGCGGCGG CAACAACGGC AAGAAGCAGT ACAGCAGCAA CAACCCCGAC    1980

GCCAACCTGA CCCTGAACAC CGACGCCCAG GAGAAGCTGA ACAAGAACCG CGACTACTAC    2040

ATCAGCCTGT ACATGAAGAG CGAGAAGAAC ACCCAGTGCG AGATCACCAT CGACGGCGAG    2100

ATATACCCCA TCACCACCAA GACCGTGAAC GTGAACAAGG ACAACTACAA GCGCCTGGAC    2160

ATCATCGCCC ACAACATCAA GAGCAACCCC ATCAGCAGCC TGCACATCAA GACCAACGAC    2220

GAGATCACCC TGTTCTGGGA CGACATATCG ATTACCGACG TCGCCAGCAT CAAGCCCGAG    2280

AACCTGACCG ACAGCGAGAT CAAGCAGATA TACAGTCGCT ACGGCATCAA GCTGGAGGAC    2340

GGCATCCTGA TCGACAAGAA AGGCGGCATC CACTACGGCG AGTTCATCAA CGAGGCCAGC    2400

TTCAACATCG AGCCCCTGCA GAACTACGTG ACCAAGTACG AGGTGACCTA CAGCAGCGAG    2460

CTGGGCCCCA ACGTGAGCGA CACCCTGGAG AGCGACAAGA TTTACAAGGA CGGCACCATC    2520

AAGTTCGACT TCACCAAGTA CAGCAAGAAC GAGCAGGGCC TGTTCTACGA CAGCGGCCTG    2580

AACTGGGACT TCAAGATCAA CGCCATCACC TACGACGGCA AGGAGATGAA CGTGTTCCAC    2640

CGCTACAACA AGTAG                                                     2655

(2)SEQ ID NO:27信息:

  (i)序列特征:

    (A)长度:1389个碱基对

    (B)类型:核酸

    (C)链型:单链

  (D)拓扑结构:线性

(ii)分子类型:其它核酸

  (A)描述:/desc=“合成DNA”

(iii)假设:否

(ix)特征:

  (A)名称/关键词:misc_特征

  (B)位置:1..1389

  (D)其它信息:/注=″玉米优化的编码VIP2A(a)的DNA序列″

(xi)序列描述:SEQ ID NO:27:

ATGAAGCGCA TGGAGGGCAA GCTGTTCATG GTGAGCAAGA AGCTCCAGGT GGTGACCAAG     60

ACCGTGCTGC TGAGCACCGT GTTCAGCATC AGCCTGCTGA ACAACGAGGT GATCAAGGCC    120

GAGCAGCTGA ACATCAACAG CCAGAGCAAG TACACCAACC TCCAGAACCT GAAGATCACC    180

GACAAGGTGG AGGACTTCAA GGAGGACAAG GAGAAGGCCA AGGAGTGGGG CAAGGAGAAG    240

GAGAAGGAGT GGAAGCTTAC CGCCACCGAG AAGGGCAAGA TGAACAACTT CCTGGACAAC    300

AAGAACGACA TCAAGACCAA CTACAAGGAG ATCACCTTCA GCATAGCCGG CAGCTTCGAG    360

GACGAGATCA AGGACCTGAA GGAGATCGAC AAGATGTTCG ACAAGACCAA CCTGAGCAAC    420

AGCATCATCA CCTACAAGAA CGTGGAGCCC ACCACCATCG GCTTCAACAA GAGCCTGACC    480

GAGGGCAACA CCATCAACAG CGACGCCATG GCCCAGTTCA AGGAGCAGTT CCTGGACCGC    540

GACATCAAGT TCGACAGCTA CCTGGACACC CACCTGACCG CCCAGCAGGT GAGCAGCAAG    600

GAGCGCGTGA TCCTGAAGGT GACCGTCCCC AGCGGCAAGG GCAGCACCAC CCCCACCAAG    660

GCCGGCGTGA TCCTGAACAA CAGCGAGTAC AAGATGCTGA TCGACAACGG CTACATGGTG    720

CACGTGGACA AGGTGAGCAA GGTGGTGAAG AAGGGCGTGG AGTGCCTCCA GATCGAGGGC    780

ACCCTGAAGA AGAGTCTAGA CTTCAAGAAC GACATCAACG CCGAGGCCCA CAGCTGGGGC    840

ATGAAGAACT ACGAGGAGTG GGCCAAGGAC CTGACCGACA GCCAGCGCGA GGCCCTGGAC    900

GGCTACGCCC GCCAGGACTA CAAGGAGATC AACAACTACC TGCGCAACCA GGGCGGCAGC    960

GGCAACGAGA AGCTGGACGC CCAGATCAAG AACATCAGCG ACGCCCTGGG CAAGAAGCCC   1020

ATCCCCGAGA ACATCACCGT GTACCGCTGG TGCGGCATGC CCGAGTTCGG CTACCAGATC   1080

AGCGACCCCC TGCCCAGCCT GAAGGACTTC GAGGAGCAGT TCCTGAACAC CATCAAGGAG   1140

GACAAGGGCT ACATGAGCAC CAGCCTGAGC AGCGAGCGCC TGGCCGCCTT CGGCAGCCGC   1200

AAGATCATCC TGCGCCTGCA GGTGCCCAAG GGCAGCACTG GTGCCTACCT GAGCGCCATC   1260

GGCGGCTTCG CCAGCGAGAA GGAGATCCTG CTGGATAAGG ACAGCAAGTA CCACATCGAC    1320

AAGGTGACCG AGGTGATCAT CAAGGGCGTG AAGCGCTACG TGGTGGACGC CACCCTGCTG    1380

ACCAACTAG                                                            1389

(2)SEQ ID NO:28信息:

  (i)序列特征:

    (A)长度:2378个碱基对

    (B)类型:核酸

    (C)链型:单链

    (D)拓扑结构:线性

  (ii)分子类型:DNA(基因组)

  (iii)假设:否

  (ix)特征:

    (A)名称/关键词:CDS

    (B)位置:9..2375

    (D)其它信息:/注=″包含在pCIB7104中的编码VIP3A(a)的天 然DNA序列″

  (xi)序列描述:SEQ ID NO:28:

AGATGAAC ATG AAC AAG AAT AAT ACT AAA TTA AGC ACA AGA GCC TTA CCA    50

         Met Asn Lys Asn Asn Thr Lys Leu Ser Thr Arg Ala Leu Pro

           1               5                  10

AGT TTT ATT GAT TAT TTT AAT GGC ATT TAT GGA TTT GCC ACT GGT ATC     98

Ser Phe Ile Asp Tyr Phe Asn Gly Ile Tyr Gly Phe Ala Thr Gly Ile

 15                  20                  25                  30

AAA GAC ATT ATG AAC ATG ATT TTT AAA ACG GAT ACA GGT GGT GAT CTA    146

Lys Asp Ile Met Asn Met Ile Phe Lys Thr Asp Thr Gly Gly Asp Leu

                 35                  40                  45

ACC CTA GAC GAA ATT TTA AAG AAT CAG CAG TTA CTA AAT GAT ATT TCT    194

Thr Leu Asp Glu Ile Leu Lys Asn Gln Gln Leu Leu Asn Asp Ile Ser

             50                  55                  60

GGT AAA TTG GAT GGG GTG AAT GGA AGC TTA AAT GAT CTT ATC GCA CAG    242

Gly Lys Leu Asp Gly Val Asn Gly Ser Leu Asn Asp Leu Ile Ala Gln

         65                  70                  75

GGA AAC TTA AAT ACA GAA TTA TCT AAG GAA ATA TTA AAA ATT GCA AAT    290

Gly Asn Leu Asn Thr Glu Leu Ser Lys Glu Ile Leu Lys Ile Ala Asn

     80                  85                  90

GAA CAA AAT CAA GTT TTA AAT GAT GTT AAT AAC AAA CTC GAT GCG ATA    338

Glu Gln Asn Gln Val Leu Asn Asp Val Asn Asn Lys Leu Asp Ala Ile

 95                 100                 105                 110

AAT ACG ATG CTT CGG GTA TAT CTA CCT AAA ATT ACC TCT ATG TTG AGT    386

Asn Thr Met Leu Arg Val Tyr Leu Pro Lys Ile Thr Ser Met Leu Ser

                115                 120                 125

GAT GTA ATG AAA CAA AAT TAT GCG CTA AGT CTG CAA ATA GAA TAC TTA    434

Asp Val Met Lys Gln Asn Tyr Ala Leu Ser Leu Gln Ile Glu Tyr Leu

            130                 135                 140

AGT AAA CAA TTG CAA GAG ATT TCT GAT AAG TTG GAT ATT ATT AAT GTA    482

Ser Lys Gln Leu Gln Glu Ile Ser Asp Lys Leu Asp Ile Ile Asn Val

        145                 150                 155

AAT GTA CTT ATT AAC TCT ACA CTT ACT GAA ATT ACA CCT GCG TAT CAA    530

Asn Val Leu Ile Asn Ser Thr Leu Thr Glu Ile Thr Pro Ala Tyr Gln

    160                 165                 170

AGG ATT AAA TAT GTG AAC GAA AAA TTT GAG GAA TTA ACT TTT GCT ACA    578

Arg Ile Lys Tyr Val Asn Glu Lys Phe Glu Glu Leu Thr Phe Ala Thr

175                 180                 185                 190

GAA ACT AGT TCA AAA GTA AAA AAG GAT GGC TCT CCT GCA GAT ATT CTT    626

Glu Thr Ser Ser Lys Val Lys Lys Asp Gly Ser Pro Ala Asp Ile Leu

                195                 200                 205

GAT GAG TTA ACT GAG TTA ACT GAA CTA GCG AAA AGT GTA ACA AAA AAT    674

Asp Glu Leu Thr Glu Leu Thr Glu Leu Ala Lys Ser Val Thr Lys Asn

            210                 215                 220

GAT GTG GAT GGT TTT GAA TTT TAC CTT AAT ACA TTC CAC GAT GTA ATG    722

Asp Val Asp Gly Phe Glu Phe Tyr Leu Asn Thr Phe His Asp Val Met

        225                 230                 235

GTA GGA AAT AAT TTA TTC GGG CGT TCA GCT TTA AAA ACT GCA TCG GAA    770

Val Gly Asn Asn Leu Phe Gly Arg Ser Ala Leu Lys Thr Ala Ser Glu

    240                 245                 250

TTA ATT ACT AAA GAA AAT GTG AAA ACA AGT GGC AGT GAG GTC GGA AAT    818

Leu Ile Thr Lys Glu Asn Val Lys Thr Ser Gly Ser Glu Val Gly Asn

255                 260                 265                 270

GTT TAT AAC TTC TTA ATT GTA TTA ACA GCT CTG CAA GCC CAA GCT TTT    866

Val Tyr Asn Phe Leu Ile Val Leu Thr Ala Leu Gln Ala Gln Ala Phe

                275                 280                 285

CTT ACT TTA ACA ACA TGC CGA AAA TTA TTA GGC TTA GCA GAT ATT GAT    914

Leu Thr Leu Thr Thr Cys Arg Lys Leu Leu Gly Leu Ala Asp Ile Asp

            290                 295                 300

TAT ACT TCT ATT ATG AAT GAA CAT TTA AAT AAG GAA AAA GAG GAA TTT    962

Tyr Thr Ser Ile Met Asn Glu His Leu Asn Lys Glu Lys Glu Glu Phe

        305                 310                 315

AGA GTA AAC ATC CTC CCT ACA CTT TCT AAT ACT TTT TCT AAT CCT AAT   1010

Arg Val Asn Ile Leu Pro Thr Leu Ser Asn Thr Phe Ser Asn Pro Asn

    320                 325                 330

TAT GCA AAA GTT AAA GGA AGT GAT GAA GAT GCA AAG ATG ATT GTG GAA    1058

Tyr Ala Lys Val Lys Gly Ser Asp Glu Asp Ala Lys Met Ile Val Glu

335                 340                 345                 350

GCT AAA CCA GGA CAT GCA TTG ATT GGG TTT GAA ATT AGT AAT GAT TCA    1106

Ala Lys Pro Gly His Ala Leu Ile Gly Phe Glu Ile Ser Asn Asp Ser

                355                 360                 365

ATT ACA GTA TTA AAA GTA TAT GAG GCT AAG CTA AAA CAA AAT TAT CAA    1154

Ile Thr Val Leu Lys Val Tyr Glu Ala Lys Leu Lys Gln Asn Tyr Gln

            370                 375                 380

GTC GAT AAG GAT TCC TTA TCG GAA GTT ATT TAT GGT GAT ATG GAT AAA    1202

Val Asp Lys Asp Ser Leu Ser Glu Val Ile Tyr Gly Asp Met Asp Lys

        385                 390                 395

TTA TTG TGC CCA GAT CAA TCT GAA CAA ATC TAT TAT ACA AAT AAC ATA    1250

Leu Leu Cys Pro Asp Gln Ser Glu Gln Ile Tyr Tyr Thr Asn Asn Ile

400                 405                 410

GTA TTT CCA AAT GAA TAT GTA ATT ACT AAA ATT GAT TTC ACT AAA AAA    1298

Val Phe Pro Asn Glu Tyr Val Ile Thr Lys Ile Asp Phe Thr Lys Lys

415                 420                 425                 430

ATG AAA ACT TTA AGA TAT GAG GTA ACA GCG AAT TTT TAT GAT TCT TCT    1346

Met Lys Thr Leu Arg Tyr Glu Val Thr Ala Asn Phe Tyr Asp Ser Ser

                435                 440                 445

ACA GGA GAA ATT GAC TTA AAT AAG AAA AAA GTA GAA TCA AGT GAA GCG    1394

Thr Gly Glu Ile Asp Leu Asn Lys Lys Lys Val Glu Ser Ser Glu Ala

            450                 455                 460

GAG TAT AGA ACG TTA AGT GCT AAT GAT GAT GGG GTG TAT ATG CCG TTA    1442

Glu Tyr Arg Thr Leu Ser Ala Asn Asp Asp Gly Val Tyr Met Pro Leu

        465                 470                 475

GGT GTC ATC AGT GAA ACA TTT TTG ACT CCG ATT AAT GGG TTT GGC CTC    1490

Gly Val Ile Ser Glu Thr Phe Leu Thr Pro Ile Asn Gly Phe Gly Leu

    480                 485                 490

CAA GCT GAT GAA AAT TCA AGA TTA ATT ACT TTA ACA TGT AAA TCA TAT    1538

Gln Ala Asp Glu Asn Ser Arg Leu Ile Thr Leu Thr Cys Lys Ser Tyr

495                 500                 505                 510

TTA AGA GAA CTA CTG CTA GCA ACA GAC TTA AGC AAT AAA GAA ACT AAA    1586

Leu Arg Glu Leu Leu Leu Ala Thr Asp Leu Ser Asn Lys Glu Thr Lys

                515                 520                 525

TTG ATC GTC CCG CCA AGT GGT TTT ATT AGC AAT ATT GTA GAG AAC GGG    1634

Leu Ile Val Pro Pro Ser Gly Phe Ile Ser Asn Ile Val Glu Asn Gly

            530                 535                 540

TCC ATA GAA GAG GAC AAT TTA GAG CCG TGG AAA GCA AAT AAT AAG AAT    1682

Ser Ile Glu Glu Asp Asn Leu Glu Pro Trp Lys Ala Asn Asn Lys Asn

        545                 550                 555

GCG TAT GTA GAT CAT ACA GGC GGA GTG AAT GGA ACT AAA GCT TTA TAT    1730

Ala Tyr Val Asp His Thr Gly Gly Val Asn Gly Thr Lys Ala Leu Tyr

    560                 565                 570

GTT CAT AAG GAC GGA GGA ATT TCA CAA TTT ATT GGA GAT AAG TTA AAA    1778

Val His Lys Asp Gly Gly Ile Ser Gln Phe Ile Gly Asp Lys Leu Lys

575                 580                 585                 590

CCG AAA ACT GAG TAT GTA ATC CAA TAT ACT GTT AAA GGA AAA CCT TCT    1826

Pro Lys Thr Glu Tyr Val Ile Gln Tyr Thr Val Lys Gly Lys Pro Ser

                595                 600                 605

ATT CAT TTA AAA GAT GAA AAT ACT GGA TAT ATT CAT TAT GAA GAT ACA    1874

Ile His Leu Lys Asp Glu Asn Thr Gly Tyr Ile His Tyr Glu Asp Thr

            610                 615                 620

AAT AAT AAT TTA GAA GAT TAT CAA ACT ATT AAT AAA CGT TTT ACT ACA    1922

Asn Asn Asn Leu Glu Asp Tyr Gln Thr Ile Asn Lys Arg Phe Thr Thr

        625                 630                 635

GGA ACT GAT TTA AAG GGA GTG TAT TTA ATT TTA AAA AGT CAA AAT GGA    1970

Gly Thr Asp Leu Lys Gly Val Tyr Leu Ile Leu Lys Ser Gln Asn Gly

    640                 645                 650

GAT GAA GCT TGG GGA GAT AAC TTT ATT ATT TTG GAA ATT AGT CCT TCT    2018

Asp Glu Ala Trp Gly Asp Asn Phe Ile Ile Leu Glu Ile Ser Pro Ser

655                 660                 665                 670

GAA AAG TTA TTA AGT CCA GAA TTA ATT AAT ACA AAT AAT TGG ACG AGT    2066

Glu Lys Leu Leu Ser Pro Glu Leu Ile Asn Thr Asn Asn Trp Thr Ser

                675                 680                 685

ACG GGA TCA ACT AAT ATT AGC GGT AAT ACA CTC ACT CTT TAT CAG GGA    2114

Thr Gly Ser Thr Asn Ile Ser Gly Asn Thr Leu Thr Leu Tyr Gln Gly

            690                 695                 700

GGA CGA GGG ATT CTA AAA CAA AAC CTT CAA TTA GAT AGT TTT TCA ACT    2162

Gly Arg Gly Ile Leu Lys Gln Asn Leu Gln Leu Asp Ser Phe Ser Thr

        705                 710                 715

TAT AGA GTG TAT TTT TCT GTG TCC GGA GAT GCT AAT GTA AGG ATT AGA    2210

Tyr Arg Val Tyr Phe Ser Val Ser Gly Asp Ala Asn Val Arg Ile Arg

    720                 725                 730

AAT TCT AGG GAA GTG TTA TTT GAA AAA AGA TAT ATG AGC GGT GCT AAA    2258

Asn Ser Arg Glu Val Leu Phe Glu Lys Arg Tyr Met Ser Gly Ala Lys

735                 740                 745                 750

GAT GTT TCT GAA ATG TTC ACT ACA AAA TTT GAG AAA GAT AAC TTT TAT    2306

Asp Val Ser Glu Met Phe Thr Thr Lys Phe Glu Lys Asp Asn Phe Tyr

                755                 760                 765

ATA GAG CTT TCT CAA GGG AAT AAT TTA TAT GGT GGT CCT ATT GTA CAT    2354

Ile Glu Leu Ser Gln Gly Asn Asn Leu Tyr Gly Gly Pro Ile Val His

            770                 775                 780

TTT TAC GAT GTC TCT ATT AAG TAA                                    2378

Phe Tyr Asp Val Ser Ile Lys

        785

(2)SEQ ID NO:29信息:

  (i)序列特征:

    (A)长度:789个氨基酸

    (B)类型:氨基酸

    (D)拓扑结构:线性

  (ii)分子类型:蛋白质

  (xi)序列描述:SEQ ID NO:29:

Met Asn Lys Asn Asn Thr Lys Leu Ser Thr Arg Ala Leu Pro Ser Phe

  1               5                  10                  15

Ile Asp Tyr Phe Asn Gly Ile Tyr Gly Phe Ala Thr Gly Ile Lys Asp

             20                  25                  30

Ile Met Asn Met Ile Phe Lys Thr Asp Thr Gly Gly Asp Leu Thr Leu

         35                  40                  45

Asp Glu Ile Leu Lys Asn Gln Gln Leu Leu Asn Asp Ile Ser Gly Lys

     50                  55                  60

Leu Asp Gly Val Asn Gly Ser Leu Asn Asp Leu Ile Ala Gln Gly Asn

 65                  70                  75                  80

Leu Asn Thr Glu Leu Ser Lys Glu Ile Leu Lys Ile Ala Asn Glu Gln

                 85                  90                  95

Asn Gln Val Leu Asn Asp Val Asn Asn Lys Leu Asp Ala Ile Asn Thr

            100                 105                 110

Met Leu Arg Val Tyr Leu Pro Lys Ile Thr Ser Met Leu Ser Asp Val

        115                 120                 125

Met Lys Gln Asn Tyr Ala Leu Ser Leu Gln Ile Glu Tyr Leu Ser Lys

    130                 135                 140

Gln Leu Gln Glu Ile Ser Asp Lys Leu Asp Ile Ile Asn Val Asn Val

145                 150                 155                 160

Leu Ile Asn Ser Thr Leu Thr Glu Ile Thr Pro Ala Tyr Gln Arg Ile

                165                 170                 175

Lys Tyr Val Asn Glu Lys Phe Glu Glu Leu Thr Phe Ala Thr Glu Thr

            180                 185                 190

Ser Ser Lys Val Lys Lys Asp Gly Ser Pro Ala Asp Ile Leu Asp Glu

        195                 200                 205

Leu Thr Glu Leu Thr Glu Leu Ala Lys Ser Val Thr Lys Asn Asp Val

    210                 215                 220

Asp Gly Phe Glu Phe Tyr Leu Asn Thr Phe His Asp Val Met Val Gly

225                  230                235                 240

Asn Asn Leu Phe Gly Arg Ser Ala Leu Lys Thr Ala Ser Glu Leu Ile

                245                 250                 255

Thr Lys Glu Asn Val Lys Thr Ser Gly Ser Glu Val Gly Asn Val Tyr

            260                 265                 270

Asn Phe Leu Ile Val Leu Thr Ala Leu Gln Ala Gln Ala Phe Leu Thr

        275                 280                 285

Leu Thr Thr Cys Arg Lys Leu Leu Gly Leu Ala Asp Ile Asp Tyr Thr

    290                 295                 300

Ser Ile Met Asn Glu His Leu Asn Lys Glu Lys Glu Glu Phe Arg Val

305                 310                 315                 320

Asn Ile Leu Pro Thr Leu Ser Asn Thr Phe Ser Asn Pro Asn Tyr Ala

                325                 330                 335

Lys Val Lys Gly Ser Asp Glu Asp Ala Lys Met Ile Val Glu Ala Lys

            340                 345                 350

Pro Gly His Ala Leu Ile Gly Phe Glu Ile Ser Asn Asp Ser Ile Thr

        355                 360                 365

Val Leu Lys Val Tyr Glu Ala Lys Leu Lys Gln Asn Tyr Gln Val Asp

    370                 375                 380

Lys Asp Ser Leu Ser Glu Val Ile Tyr Gly Asp Met Asp Lys Leu Leu

385                 390                 395                 400

Cys Pro Asp Gln Ser Glu Gln Ile Tyr Tyr Thr Asn Asn Ile Val Phe

                405                 410                 415

Pro Asn Glu Tyr Val Ile Thr Lys Ile Asp Phe Thr Lys Lys Met Lys

            420                 425                 430

Thr Leu Arg Tyr Glu Val Thr Ala Asn Phe Tyr Asp Ser Ser Thr Gly

        435                 440                 445

Glu Ile Asp Leu Asn Lys Lys Lys Val Glu Ser Ser Glu Ala Glu Tyr

    450                 455                 460

Arg Thr Leu Ser Ala Asn Asp Asp Gly Val Tyr Met Pro Leu Gly Val

465                 470                 475                 480

Ile Ser Glu Thr Phe Leu Thr Pro Ile Asn Gly Phe Gly Leu Gln Ala

                485                 490                 495

Asp Glu Asn Ser Arg Leu Ile Thr Leu Thr Cys Lys Ser Tyr Leu Arg

            500                 505                 510

Glu Leu Leu Leu Ala Thr Asp Leu Ser Asn Lys Glu Thr Lys Leu Ile

        515                 520                 525

Val Pro Pro Ser Gly Phe Ile Ser Asn Ile Val Glu Asn Gly Ser Ile

    530                 535                 540

Glu Glu Asp Asn Leu Glu Pro Trp Lys Ala Asn Asn Lys Asn Ala Tyr

545                 550                 555                 560

Val Asp His Thr Gly Gly Val Asn Gly Thr Lys Ala Leu Tyr Val His

                565                 570                 575

Lys Asp Gly Gly Ile Ser Gln Phe Ile Gly Asp Lys Leu Lys Pro Lys

            580                 585                 590

Thr Glu Tyr Val Ile Gln Tyr Thr Val Lys Gly Lys Pro Ser Ile His

        595                 600                 605

Leu Lys Asp Glu Asn Thr Gly Tyr Ile His Tyr Glu Asp Thr Asn Asn

    610                 615                 620

Asn Leu Glu Asp Tyr Gln Thr Ile Asn Lys Arg Phe Thr Thr Gly Thr

625                 630                 635                 640

Asp Leu Lys Gly Val Tyr Leu Ile Leu Lys Ser Gln Asn Gly Asp Glu

                645                 650                 655

Ala Trp Gly Asp Asn Phe Ile Ile Leu Glu Ile Ser Pro Ser Glu Lys

            660                 665                 670

Leu Leu Ser Pro Glu Leu Ile Asn Thr Asn Asn Trp Thr Ser Thr Gly

        675                 680                 685

Ser Thr Asn Ile Ser Gly Asn Thr Leu Thr Leu Tyr Gln Gly Gly Arg

    690                 695                 700

Gly Ile Leu Lys Gln Asn Leu Gln Leu Asp Ser Phe Ser Thr Tyr Arg

705                 710                 715                 720

Val Tyr Phe Ser Val Ser Gly Asp Ala Asn Val Arg Ile Arg Asn Ser

                725                 730                 735

Arg Glu Val Leu Phe Glu Lys Arg Tyr Met Ser Gly Ala Lys Asp Val

            740                 745                 750

Ser Glu Met Phe Thr Thr Lys Phe Glu Lys Asp Asn Phe Tyr Ile Glu

        755                 760                 765

Leu Ser Gln Gly Asn Asn Leu Tyr Gly Gly Pro Ile Val His Phe Tyr

    770                 775                 780

Asp Val Ser Ile Lys

785

(2)SEQ ID NO:30信息:

  (i)序列特征:

    (A)长度:2403个碱基对

    (B)类型:核酸

    (C)链型:单链

    (D)拓扑结构:线性

  (ii)分子类型:其它核酸

    (A)描述:/desc=“合成DNA”

  (iii)假设:否

  (ix)特征:

    (A)名称/关键词:misc_特征

    (B)位置:11..2389

    (D)其它信息:/注=″玉米优化的编码VIP3A(a)的DNA序列″

  (xi)序列描述:SEQ ID NO:30:

GGATCCACCA ATGAACATGA ACAAGAACAA CACCAAGCTG AGCACCCGCG CCCTGCCGAG     60

CTTCATCGAC TACTTCAACG GCATCTACGG CTTCGCCACC GGCATCAAGG ACATCATGAA    120

CATGATCTTC AAGACCGACA CCGGCGGCGA CCTGACCCTG GACGAGATCC TGAAGAACCA    180

GCAGCTGCTG AACGACATCA GCGGCAAGCT GGACGGCGTG AACGGCAGCC TGAACGACCT    240

GATCGCCCAG GGCAACCTGA ACACCGAGCT GAGCAAGGAG ATCCTTAAGA TCGCCAACGA    300

GCAGAACCAG GTGCTGAACG ACGTGAACAA CAAGCTGGAC GCCATCAACA CCATGCTGCG    360

CGTGTACCTG CCGAAGATCA CCAGCATGCT GAGCGACGTG ATGAAGCAGA ACTACGCCCT    420

GAGCCTGCAG ATCGAGTACC TGAGCAAGCA GCTGCAGGAG ATCAGCGACA AGCTGGACAT    480

CATCAACGTG AACGTCCTGA TCAACAGCAC CCTGACCGAG ATCACCCCGG CCTACCAGCG    540

CATCAAGTAC GTGAACGAGA AGTTCGAAGA GCTGACCTTC GCCACCGAGA CCAGCAGCAA    600

GGTGAAGAAG GACGGCAGCC CGGCCGACAT CCTGGACGAG CTGACCGAGC TGACCGAGCT    660

GGCCAAGAGC GTGACCAAGA ACGACGTGGA CGGCTTCGAG TTCTACCTGA ACACCTTCCA    720

CGACGTGATG GTGGGCAACA ACCTGTTCGG CCGCAGCGCC CTGAAGACCG CCAGCGAGCT    780

GATCACCAAG GAGAACGTGA AGACCAGCGG CAGCGAGGTG GGCAACGTGT ACAACTTCCT    840

GATCGTGCTG ACCGCCCTGC AGGCCCAGGC CTTCCTGACC CTGACCACCT GTCGCAAGCT    900

GCTGGGCCTG GCCGACATCG ACTACACCAG CATCATGAAC GAGCACTTGA ACAAGGAGAA     960

GGAGGAGTTC CGCGTGAACA TCCTGCCGAC CCTGAGCAAC ACCTTCAGCA ACCCGAACTA    1020

CGCCAAGGTG AAGGGCAGCG ACGAGGACGC CAAGATGATC GTGGAGGCTA AGCCGGGCCA    1080

CGCGTTGATC GGCTTCGAGA TCAGCAACGA CAGCATCACC GTGCTGAAGG TGTACGAGGC    1140

CAAGCTGAAG CAGAACTACC AGGTGGACAA GGACAGCTTG AGCGAGGTGA TCTACGGCGA    1200

CATGGACAAG CTGCTGTGTC CGGACCAGAG CGAGCAAATC TACTACACCA ACAACATCGT    1260

GTTCCCGAAC GAGTACGTGA TCACCAAGAT CGACTTCACC AAGAAGATGA AGACCCTGCG    1320

CTACGAGGTG ACCGCCAACT TCTACGACAG CAGCACCGGC GAGATCGACC TGAACAAGAA    1380

GAAGGTGGAG AGCAGCGAGG CCGAGTACCG CACCCTGAGC GCGAACGACG ACGGCGTCTA    1440

CATGCCACTG GGCGTGATCA GCGAGACCTT CCTGACCCCG ATCAACGGCT TTGGCCTGCA    1500

GGCCGACGAG AACAGCCGCC TGATCACCCT GACCTGTAAG AGCTACCTGC GCGAGCTGCT    1560

GCTAGCCACC GACCTGAGCA ACAAGGAGAC CAAGCTGATC GTGCCACCGA GCGGCTTCAT    1620

CAGCAACATC GTGGAGAACG GCAGCATCGA GGAGGACAAC CTGGAGCCGT GGAAGGCCAA    1680

CAACAAGAAC GCCTACGTGG ACCACACCGG CGGCGTGAAC GGCACCAAGG CCCTGTACGT    1740

GCACAAGGAC GGCGGCATCA GCCAGTTCAT CGGCGACAAG CTGAAGCCGA AGACCGAGTA    1800

CGTGATCCAG TACACCGTGA AGGGCAAGCC ATCGATTCAC CTGAAGGACG AGAACACCGG    1860

CTACATCCAC TACGAGGACA CCAACAACAA CCTGGAGGAC TACCAGACCA TCAACAAGCG    1920

CTTCACCACC GGCACCGACC TGAAGGGCGT GTACCTGATC CTGAAGAGCC AGAACGGCGA    1980

CGAGGCCTGG GGCGACAACT TCATCATCCT GGAGATCAGC CCGAGCGAGA AGCTGCTGAG    2040

CCCGGAGCTG ATCAACACCA ACAACTGGAC CAGCACCGGC AGCACCAACA TCAGCGGCAA    2100

CACCCTGACC CTGTACCAGG GCGGCCGCGG CATCCTGAAG CAGAACCTGC AGCTGGACAG    2160

CTTCAGCACC TACCGCGTGT ACTTCAGCGT GAGCGGCGAC GCCAACGTGC GCATCCGCAA    2220

CAGCCGCGAG GTGCTGTTCG AGAAGAGGTA CATGAGCGGC GCCAAGGACG TGAGCGAGAT    2280

GTTCACCACC AAGTTCGAGA AGGACAACTT CTACATCGAG CTGAGCCAGG GCAACAACCT    2340

GTACGGCGGC CCGATCGTGC ACTTCTACGA CGTGAGCATC AAGTTAACGT AGAGCTCAGA    2400

TCT                                                                  2403

(2)SEQ ID NO:31信息:

  (i)序列特征:

    (A)长度:2612个碱基对

    (B)类型:核酸

    (C)链型:单链

    (D)拓扑结构:线性

  (ii)分子类型:DNA(基因组)

  (iii)假设:否

  (ix)特征:

    (A)名称/关键词:CDS

    (B)位置:118..2484

    (D)其它信息:/注=″得自AB424的编码VIP3A(a)的天然DNA 序列″

  (xi)序列描述:SEQ ID NO:31:

ATTGAAATTG ATAAAAAGTT ATGAGTGTTT AATAATCAGT AATTACCAAT AAAGAATTAA   60

GAATACAAGT TTACAAGAAA TAAGTGTTAC AAAAAATAGC TGAAAAGGAA GATGAAC     117

ATG AAC AAG AAT AAT ACT AAA TTA AGC ACA AGA GCC TTA CCA AGT TTT    165

Met Asn Lys Asn Asn Thr Lys Leu Ser Thr Arg Ala Leu Pro Ser Phe

790                 795                 800                 805

ATT GAT TAT TTC AAT GGC ATT TAT GGA TTT GCC ACT GGT ATC AAA GAC    213

Ile Asp Tyr Phe Asn Gly Ile Tyr Gly Phe Ala Thr Gly Ile Lys Asp

                810                 815                 820

ATT ATG AAC ATG ATT TTT AAA ACG GAT ACA GGT GGT GAT CTA ACC CTA    261

Ile Met Asn Met Ile Phe Lys Thr Asp Thr Gly Gly Asp Leu Thr Leu

            825                 830                 835

GAC GAA ATT TTA AAG AAT CAG CAG CTA CTA AAT GAT ATT TCT GGT AAA    309

Asp Glu Ile Leu Lys Asn Gln Gln Leu Leu Asn Asp Ile Ser Gly Lys

        840                 845                 850

TTG GAT GGG GTG AAT GGA AGC TTA AAT GAT CTT ATC GCA CAG GGA AAC    357

Leu Asp Gly Val Asn Gly Ser Leu Asn Asp Leu Ile Ala Gln Gly Asn

    855                 860                 865

TTA AAT ACA GAA TTA TCT AAG GAA ATA TTA AAA ATT GCA AAT GAA CAA    405

Leu Asn Thr Glu Leu Ser Lys Glu Ile Leu Lys Ile Ala Asn Glu Gln

870                 875                 880                 885

AAT CAA GTT TTA AAT GAT GTT AAT AAC AAA CTC GAT GCG ATA AAT ACG    453

Asn Gln Val Leu Asn Asp Val Asn Asn Lys Leu Asp Ala Ile Asn Thr

                890                 895                 900

ATG CTT CGG GTA TAT CTA CCT AAA ATT ACC TCT ATG TTG AGT GAT GTA    501

Met Leu Arg Val Tyr Leu Pro Lys Ile Thr Ser Met Leu Ser Asp Val

            905                 910                 915

ATG AAA CAA AAT TAT GCG CTA AGT CTG CAA ATA GAA TAC TTA AGT AAA    549

Met Lys Gln Asn Tyr Ala Leu Ser Leu Gln Ile Glu Tyr Leu Ser Lys

        920                 925                 930

CAA TTG CAA GAG ATT TCT GAT AAG TTG GAT ATT ATT AAT GTA AAT GTA    597

Gln Leu Gln Glu Ile Ser Asp Lys Leu Asp Ile Ile Asn Val Asn Val

    935                 940                 945

CTT ATT AAC TCT ACA CTT ACT GAA ATT ACA CCT GCG TAT CAA AGG ATT    645

Leu Ile Asn Ser Thr Leu Thr Glu Ile Thr Pro Ala Tyr Gln Arg Ile

950                 955                 960                 965

AAA TAT GTG AAC GAA AAA TTT GAG GAA TTA ACT TTT GCT ACA GAA ACT    693

Lys Tyr Val Asn Glu Lys Phe Glu Glu Leu Thr Phe Ala Thr Glu Thr

                970                 975                 980

AGT TCA AAA GTA AAA AAG GAT GGC TCT CCT GCA GAT ATT CGT GAT GAG    741

Ser Ser Lys Val Lys Lys Asp Gly Ser Pro Ala Asp Ile Arg Asp Glu

            985                 990                 995

TTA ACT GAG TTA ACT GAA CTA GCG AAA AGT GTA ACA AAA AAT GAT GTG    789

Leu Thr Glu Leu Thr Glu Leu Ala Lys Ser Val Thr Lys Asn Asp Val

        1000                1005                1010

GAT GGT TTT GAA TTT TAC CTT AAT ACA TTC CAC GAT GTA ATG GTA GGA    837

Asp Gly Phe Glu Phe Tyr Leu Asn Thr Phe His Asp Val Met Val Gly

    1015                1020                1025

AAT AAT TTA TTC GGG CGT TCA GCT TTA AAA ACT GCA TCG GAA TTA ATT    885

Asn Asn Leu Phe Gly Arg Ser Ala Leu Lys Thr Ala Ser Glu Leu Ile

1030                1035                1040                1045

ACT AAA GAA AAT GTG AAA ACA AGT GGC AGT GAG GTC GGA AAT GTT TAT    933

Thr Lys Glu Asn Val Lys Thr Ser Gly Ser Glu Val Gly Asn Val Tyr

               1050                1055                1060

AAC TTC CTA ATT GTA TTA ACA GCT CTG CAA GCA AAA GCT TTT CTT ACT    981

Asn Phe Leu Ile Val Leu Thr Ala Leu Gln Ala Lys Ala Phe Leu Thr

            1065                1070                1075

TTA ACA CCA TGC CGA AAA TTA TTA GGC TTA GCA GAT ATT GAT TAT ACT   1029

Leu Thr Pro Cys Arg Lys Leu Leu Gly Leu Ala Asp Ile Asp Tyr Thr

        1080                1085                1090

TCT ATT ATG AAT GAA CAT TTA AAT AAG GAA AAA GAG GAA TTT AGA GTA   1077

Ser Ile Met Asn Glu His Leu Asn Lys Glu Lys Glu Glu Phe Arg Val

    1095                1100                1105

AAC ATC CTC CCT ACA CTT TCT AAT ACT TTT TCT AAT CCT AAT TAT GCA   1125

Asn Ile Leu Pro Thr Leu Ser Asn Thr Phe Ser Asn Pro Asn Tyr Ala

1110                1115                1120                1125

AAA GTT AAA GGA AGT GAT GAA GAT GCA AAG ATG ATT GTG GAA GCT AAA    1173

Lys Val Lys Gly Ser Asp Glu Asp Ala Lys Met Ile Val Glu Ala Lys

                1130                1135                1140

CCA GGA CAT GCA TTG ATT GGG TTT GAA ATT AGT AAT GAT TCA ATT ACA    1221

Pro Gly His Ala Leu Ile Gly Phe Glu Ile Ser Asn Asp Ser Ile Thr

            1145                1150                1155

GTA TTA AAA GTA TAT GAG GCT AAG CTA AAA CAA AAT TAT CAA GTC GAT    1269

Val Leu Lys Val Tyr Glu Ala Lys Leu Lys Gln Asn Tyr Gln Val Asp

        1160                1165                1170

AAG GAT TCC TTA TCG GAA GTT ATT TAT GGC GAT ATG GAT AAA TTA TTG    1317

Lys Asp Ser Leu Ser Glu Val Ile Tyr Gly Asp Met Asp Lys Leu Leu

    1175                1180                1185

TGC CCA GAT CAA TCT GGA CAA ATC TAT TAT ACA AAT AAC ATA GTA TTT    1365

Cys Pro Asp Gln Ser Gly Gln Ile Tyr Tyr Thr Asn Asn Ile Val Phe

1190                1195                1200                1205

CCA AAT GAA TAT GTA ATT ACT AAA ATT GAT TTC ACT AAA AAA ATG AAA    1413

Pro Asn Glu Tyr Val Ile Thr Lys Ile Asp Phe Thr Lys Lys Met Lys

                1210                1215                1220

ACT TTA AGA TAT GAG GTA ACA GCG AAT TTT TAT GAT TCT TCT ACA GGA    1461

Thr Leu Arg Tyr Glu Val Thr Ala Asr Phe Tyr Asp Ser Ser Thr Gly

            1220                1230                1235

GAA ATT GAC TTA AAT AAG AAA AAA GTA GAA TCA AGT GAA GCG GAG TAT    1509

Glu Ile Asp Leu Asn Lys Lys Lys Val Glu Ser Ser Glu Ala Glu Tyr

        1240                1245                1250

AGA ACG TTA AGT GCT AAT GAT GAT GGG GTG TAT ATG CCG TTA GGT GTC    1557

Arg Thr Leu Ser Ala Asn Asp Asp Gly Val Tyr Met Pro Leu Gly Val

    1255                1260                1265

ATC AGT GAA ACA TTT TTG ACT CCG ATT AAT GGG TTT GGC CTC CAA GCT    1605

Ile Ser Glu Thr Phe Leu Thr Pro Ile Asn Gly Phe Gly Leu Gln Ala

1270                1275                1280                1285

GAT GAA AAT TCA AGA TTA ATT ACT TTA ACA TGT AAA TCA TAT TTA AGA    1653

Asp Glu Asn Ser Arg Leu Ile Thr Leu Thr Cys Lys Ser Tyr Leu Arg

                1290                1295                1300

GAA CTA CTG CTA GCA ACA GAC TTA AGC AAT AAA GAA ACT AAA TTG ATC    1701

Glu Leu Leu Leu Ala Thr Asp Leu Ser Asn Lys Glu Thr Lys Leu Ile

            1305                1310                1315

GTC CCG CCA AGT GGT TTT ATT AGC AAT ATT GTA GAG AAC GGG TCC ATA    1749

Val Pro Pro Ser Gly Phe Ile Ser Asn Ile Val Glu Asn Gly Ser Ile

        1320                1325                1330

GAA GAG GAC AAT TTA GAG CCG TGG AAA GCA AAT AAT AAG AAT GCG TAT    1797

Glu Glu Asp Asn Leu Glu Pro Trp Lys Ala Asn Asn Lys Asn Ala Tyr

    1335                1340                1345

GTA GAT CAT ACA GGC GGA GTG AAT GGA ACT AAA GCT TTA TAT GTT CAT    1845

Val Asp His Thr Gly Gly Val Asn Gly Thr Lys Ala Leu Tyr Val His

1350                1355                1360                1365

AAG GAC GGA GGA ATT TCA CAA TTT ATT GGA GAT AAG TTA AAA CCG AAA    1893

Lys Asp Gly Gly Ile Ser Gln Phe Ile Gly Asp Lys Leu Lys Pro Lys

                1370                1375                1380

ACT GAG TAT GTA ATC CAA TAT ACT GTT AAA GGA AAA CCT TCT ATT CAT    1941

Thr Glu Tyr Val Ile Gln Tyr Thr Val Lys Gly Lys Pro Ser Ile His

            1385                1390                1395

TTA AAA GAT GAA AAT ACT GGA TAT ATT CAT TAT GAA GAT ACA AAT AAT    1989

Leu Lys Asp Glu Asn Thr Gly Tyr Ile His Tyr Glu Asp Thr Asn Asn

        1400                1405                1410

AAT TTA GAA GAT TAT CAA ACT ATT AAT AAA CGT TTT ACT ACA GGA ACT    2037

Asn Leu Glu Asp Tyr Gln Thr Ile Asn Lys Arg Phe Thr Thr Gly Thr

    1415                1420                1425

GAT TTA AAG GGA GTG TAT TTA ATT TTA AAA AGT CAA AAT GGA GAT GAA    2085

Asp Leu Lys Gly Val Tyr Leu Ile Leu Lys Ser Gln Asn Gly Asp Glu

1430                1435                1440                1445

GCT TGG GGA GAT AAC TTT ATT ATT TTG GAA ATT AGT CCT TCT GAA AAG    2133

Ala Trp Gly Asp Asn Phe Ile Ile Leu Glu Ile Ser Pro Ser Glu Lys

                1450                1455                1460

TTA TTA AGT CCA GAA TTA ATT AAT ACA AAT AAT TGG ACG AGT ACG GGA    2181

Leu Leu Ser Pro Glu Leu Ile Asn Thr Asn Asn Trp Thr Ser Thr Gly

            1465                1470                1475

TCA ACT AAT ATT AGC GGT AAT ACA CTC ACT CTT TAT CAG GGA GGA CGA    2229

Ser Thr Asn Ile Ser Gly Asn Thr Leu Thr Leu Tyr Gln Gly Gly Arg

        1480                1485                1490

GGG ATT CTA AAA CAA AAC CTT CAA TTA GAT AGT TTT TCA ACT TAT AGA    2277

Gly Ile Leu Lys Gln Asn Leu Gln Leu Asp Ser Phe Ser Thr Tyr Arg

    1495                1500                1505

GTG TAT TTC TCT GTG TCC GGA GAT GCT AAT GTA AGG ATT AGA AAT TCT    2325

Val Tyr Phe Ser Val Ser Gly Asp Ala Asn Val Arg Ile Arg Asn Ser

1510                1515                1520                1525

AGG GAA GTG TTA TTT GAA AAA AGA TAT ATG AGC GGT GCT AAA GAT GTT    2373

Arg Glu Val Leu Phe Glu Lys Arg Tyr Met Ser Gly Ala Lys Asp Val

                1530                1535                1540

TCT GAA ATG TTC ACT ACA AAA TTT GAG AAA GAT AAC TTC TAT ATA GAG    2421

Ser Glu Met Phe Thr Thr Lys Phe Glu Lys Asp Asn Phe Tyr Ile Glu

            1545                1550                1555

CTT TCT CAA GGG AAT AAT TTA TAT GGT GGT CCT ATT GTA CAT TTT TAC    2469

Leu Ser Gln Gly Asn Asn Leu Tyr Gly Gly Pro Ile Val His Phe Tyr

        1560                1565                1570

GAT GTC TCT ATT AAG TAAGATCGGG ATCTAATATT AACAGTTTTT AGAAGCTAAT    2524

Asp Val Ser Ile Lys

    1575

TCTTGTATAA TGTCCTTGAT TATGGAAAAA CACAATTTTG TTTGCTAAGA TGTATATATA  2584

GCTCACTCAT TAAAAGGCAA TCAAGCTT                                     2612

(2)SEQ ID NO:32信息:

  (i)序列特征:

    (A)长度:789个氨基酸

    (B)类型:氨基酸

    (D)拓扑结构:线性

    (ii)分子类型:蛋白质

  (xi)序列描述:SEQ ID NO:32:

Met Asn Lys Asn Asn Thr Lys Leu Ser Thr Arg Ala Leu Pro Ser Phe

  1               5                  10                  15

Ile Asp Tyr Phe Asn Gly Ile Tyr Gly Phe Ala Thr Gly Ile Lys Asp

             20                  25                  30

Ile Met Asn Met Ile Phe Lys Thr Asp Thr Gly Gly Asp Leu Thr Leu

         35                  40                  45

Asp Glu Ile Leu Lys Asn Gln Gln Leu Leu Asn Asp Ile Ser Gly Lys

     50                  55                  60

Leu Asp Gly Val Asn Gly Ser Leu Asn Asp Leu Ile Ala Gln Gly Asn

 65                  70                  75                  80

Leu Asn Thr Glu Leu Ser Lys Glu Ile Leu Lys Ile Ala Asn Glu Gln

                 85                  90                  95

Asn Gln Val Leu Asn Asp Val Asn Asn Lys Leu Asp Ala Ile Asn Thr

            100                 105                 110

Met Leu Arg Val Tyr Leu Pro Lys Ile Thr Ser Met Leu Ser Asp Val

        115                 120                 125

Met Lys Gln Asn Tyr Ala Leu Ser Leu Gln Ile Glu Tyr Leu Ser Lys

    130                 135                 140

Gln Leu Gln Glu Ile Ser Asp Lys Leu Asp Ile Ile Asn Val Asn Val

145                 150                 155                 160

Leu Ile Asn Ser Thr Leu Thr Glu Ile Thr Pro Ala Tyr Gln Arg Ile

                165                 170                 175

Lys Tyr Val Asn Glu Lys Phe Glu Glu Leu Thr Phe Ala Thr Glu Thr

            180                 185                 190

Ser Ser Lys Val Lys Lys Asp Gly Ser pro Ala Asp Ile Arg Asp Glu

        195                 200                 205

Leu Thr Glu Leu Thr Glu Leu Ala Lys Ser Val Thr Lys Asn Asp Val

    210                 215                 220

Asp Gly Phe Glu Phe Tyr Leu Asn Thr Phe His Asp Val Met Val Gly

225                 230                 235                 240

Asn Asn Leu Phe Gly Arg Ser Ala Leu Lys Thr Ala Ser Glu Leu Ile

                245                 250                 255

Thr Lys Glu Asn Val Lys Thr Ser Gly Ser Glu Val Gly Asn Val Tyr

            260                 265                 270

Asn Phe Leu Ile Val Leu Thr Ala Leu Gln Ala LVs Ala Phe Leu Thr

        275                 280                 285

Leu Thr Pro Cys Arg Lys Leu Leu Gly Leu Ala Asp Ile Asp Tyr Thr

   290                 295                 300

Ser Ile Met Asn Glu His Leu Asn Lys Glu Lys Glu Glu Phe Arg Val

305                 310                 315                 320

Asn Ile Leu Pro Thr Leu Ser Asn Thr Phe Ser Asn Pro Asn Tyr Ala

                325                 330                 335

Lys Val Lys Gly Ser Asp Glu Asp Ala Lys Met Ile Val Glu Ala Lys

            340                 345                 350

Pro Gly His Ala Leu Ile Gly Phe Glu Ile Ser Asn Asp Ser Ile Thr

        355                 360                 365

Val Leu Lys Val Tyr Glu Ala Lys Leu Lys Gln Asn Tyr Gln Val Asp

    370                 375                 380

Lys Asp Ser Leu Ser Glu Val Ile Tyr Gly Asp Met Asp Lys Leu Leu

385                 390                 395                 400

Cys Pro Asp Gln Ser Gly Gln Ile Tyr Tyr Thr Asn Asn Ile Val Phe

                405                 410                 415

Pro Asn Glu Tyr Val Ile Thr Lys Ile Asp Phe Thr Lys Lys Met Lys

            420                 425                 430

Thr Leu Arg Tyr Glu Val Thr Ala Asn Phe Tyr Asp Ser Ser Thr Gly

        435                 440                 445

Glu Ile Asp Leu Asn Lys Lys Lys Val Glu Ser Ser Glu Ala Glu Tyr

    450                 455                 460

Arg Thr Leu Ser Ala Asn Asp Asp Gly Val Tyr Met Pro Ieu Gly Val

465                 470                 475                 480

Ile Ser Glu Thr Phe Leu Thr Pro Ile Asn Gly Phe Gly Leu Gln Ala

                485                 490                 495

Asp Glu Asn Ser Arg Leu Ile Thr Leu Thr Cys Lys Ser Tyr Leu Arg

            500                 505                 510

Glu Leu Leu Leu Ala Thr Asp Leu Ser Asn Lys Glu Thr Lys Leu Ile

      515                 520                 525

Val Pro Pro Ser Gly Phe Ile Ser Asn Ile Val Glu Asn Gly Ser Ile

    530                 535                 540

Glu Glu Asp Asn Leu Glu Pro Trp Lys Ala Asn Asn Lys Asn Ala Tyr

545                 550                 555                 560

Val Asp His Thr Gly Gly Val Asn Gly Thr Lys Ala Leu Tyr Val His

                565                 570                 575

Lys Asp Gly Gly Ile Ser Gln Phe Ile Gly Asp Lys Leu Lys Pro Lys

            580                 585                 590

Thr Glu Tyr Val Ile Gln Tyr Thr Val Lys Gly Lys Pro Ser Ile His

        595                 600                 605

Leu Lys Asp Glu Asn Thr Gly Tyr Ile His Tyr Glu Asp Thr Asn Asn

    610                 615                 620

Asn Leu Glu Asp Tyr Gln Thr Ile Asn Lys Arg Phe Thr Thr Gly Thr

625                 630                 635                 640

Asp Leu Lys Gly Val Tyr Leu Ile Leu Lys Ser Gln Asn Gly Asp Glu

                645                 650                 655

Ala Trp Gly Asp Asn Phe Ile Ile Leu Glu Ile Ser Pro Ser Glu Lys

            660                 665                 670

Leu Leu Ser Pro Glu Leu Ile Asn Thr Asn Asn Trp Thr Ser Tnr Gly

        675                 680                 685

Ser Thr Asn Ile Ser Gly Asn Thr Leu Thr Leu Tyr Gln Gly Gly Arg

    690                 695                 700

Gly Ile Leu Lys Gln Asn Leu Gln Leu Asp Ser Phe Ser Thr Tyr Arg

705                 710                 715                 720

Val Tyr Phe Ser Val Ser Gly Asp Ala Asn Val Arg Ile Arg Asn Ser

                725                 730                 735

Arg Glu Val Leu Phe Glu Lys Arg Tyr Met Ser Gly Ala Lys Asp Val

            740                 745                 750

Ser Glu Met Phe Thr Thr Lys Phe Glu Lys Asp Asn Phe Tyr Ile Glu

        755                 760                 765

Leu Ser Gln Gly Asn Asn Leu Tyr Gly Gly Pro Ile Val His Phe Tyr

    770                 775                 780

Asp Val Ser Ile Lys

785

(2)SEQ ID NO:33信息:

  (i)序列特征:

    (A)长度:30个碱基对

    (B)类型:核酸

    (C)链型:单链

    (D)拓扑结构:线性

  (ii)分子类型:其它核酸

    (A)描述:/desc=“用于制备pCIB5526的正向引物”

  (iii)假设:否

  (xi)序列描述:SEQ ID NO:33:

GGATCCACCA TGAAGACCAA CCAGATCAGC

(2)SEQ ID NO:34信息:

  (i)序列特征:

    (A)长度:15个碱基对

    (B)类型:核酸

    (C)链型:单链

    (D)拓扑结构:线性

  (ii)分子类型:其它核酸

    (A)描述:/desc=“用于制备pCIB5526的反向引物”

  (iii)假设:否

  (xi)序列描述:SEQ ID NO:34:

AAGCTTCAGC TCCTT

(2)SEQ ID NO:35信息:

  (i)序列特征:

    (A)长度:2576个碱基对

    (B)类型:核酸

    (C)链型:单链

    (D)拓扑结构:线性

  (ii)分子类型:其它核酸

    (A)描述:/desc=“合成DNA”

  (iii)假设:否

  (ix)特征:

    (A)名称/关键词:CDS

    (B)位置:9..2564

    (D)其它信息:/注=″包含在pCIB5526中的玉米优化的编码除 去了芽孢杆菌属分泌信号的VIP1A(a)的序列″

  (xi)序列描述:SEQ ID NO:35:

GATCCACC ATG AAG ACC AAC CAG ATC AGC ACC ACC CAG AAG AAC CAG CAG    50

         Met Lys Thr Asn Gln Ile Ser Thr Thr Gln Lys Asn Gln Gln

                     825                 830                 835

AAG GAG ATG GAC CGC AAG GGC CTG CTG GGC TAC TAC TTC AAG GGC AAG     98

Lys Glu Met Asp Arg Lys Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys

                840                 845                 850

GAC TTC AGC AAC CTG ACC ATG TTC GCC CCC ACG CGT GAC AGC ACC CTG    146

Asp Phe Ser Asn Leu Thr Met Phe Ala Pro Thr Arg Asp Ser Thr Leu

            855                 860                 865

ATC TAC GAC CAG CAG ACC GCC AAC AAG CTG CTG GAC AAG AAG CAG CAG    194

Ile Tyr Asp Gln Gln Thr Ala Asn Lys Leu Leu Asp Lys Lys Gln Gln

        870                 875                 880

GAG TAC CAG AGC ATC CGC TGG ATC GGC CTG ATC CAG AGC AAG GAG ACC    242

Glu Tyr Gln Ser Ile Arg Trp Ile Gly Leu Ile Gln Ser Lys Glu Thr

    885                 890                 895

GGC GAC TTC ACC TTC AAC CTG AGC GAG GAC GAG CAG GCC ATC ATC GAG    290

Gly Asp Phe Thr Phe Asn Leu Ser Glu Asp Glu Gln Ala Ile Ile Glu

900                 905                 910                 915

ATC AAC GGC AAG ATC ATC AGC AAC AAG GGC AAG GAG AAG CAG GTG GTG    338

Ile Asn Gly Lys Ile Ile Ser Asn Lys Gly Lys Glu Lys Gln Val Val

                920                 925                 930

CAC CTG GAG AAG GGC AAG CTG GTG CCC ATC AAG ATC GAG TAC CAG AGC    386

His Leu Glu Lys Gly Lys Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser

            935                 940                 945

GAC ACC AAG TTC AAC ATC GAC AGC AAG ACC TTC AAG GAG CTG AAG CTT    434

Asp Thr Lys Phe Asn Ile Asp Ser Lys Thr Phe Lys Glu Leu Lys Leu

        950                 955                 960

TTC AAG ATC GAC AGC CAG AAC CAG CCC CAG CAG GTG CAG CAG GAC GAG    482

Phe Lys Ile Asp Ser Gln Asn Gln Pro Gln Gln Val Gln Gln Asp Glu

    965                 970                 975

CTG CGC AAC CCC GAG TTC AAC AAG AAG GAG AGC CAG GAG TTC CTG GCC    530

Leu Arg Asn Pro Glu Phe Asn Lys Lys Glu Ser Gln Glu Phe Leu Ala

980                 985                 990                 995

AAG CCC AGC AAG ATC AAC CTG TTC ACC CAG CAG ATG AAG CGC GAG ATC    578

Lys Pro Ser Lys Ile Asn Leu Phe Thr Gln Gln Met Lys Arg Glu Ile

                1000                1005                1010

GAC GAG GAC ACC GAC ACC GAC GGC GAC AGC ATC CCC GAC CTG TGG GAG    626

Asp Glu Asp Thr Asp Thr Asp Gly Asp Ser Ile Pro Asp Leu Trp Glu

            1015                1020                1025

GAG AAC GGC TAC ACC ATC CAG AAC CGC ATC GCC GTG AAG TGG GAC GAC    674

Glu Asn Gly Tyr Thr Ile Gln Asn Arg Ile Ala Val Lys Trp Asp Asp

        1030                1035                1040

AGC CTG GCT AGC AAG GGC TAC ACC AAG TTC GTG AGC AAC CCC CTG GAG    722

Ser Leu Ala Ser Lys Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Glu

    1045                1050                1055

AGC CAC ACC GTG GGC GAC CCC TAC ACC GAC TAC GAG AAG GCC GCC CGC    770

Ser His Thr Val Gly Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg

1060                1065                1070                1075

GAC CTG GAC CTG AGC AAC GCC AAG GAG ACC TTC AAC CCC CTG GTG GCC    818

Asp Leu Asp Leu Ser Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala

            1080                1085                1090

GCC TTC CCC AGC GTG AAC GTG AGC ATG GAG AAG GTG ATC CTG AGC CCC    866

Ala Phe Pro Ser Val Asn Val Ser Met Glu Lys Val Ile Leu Ser Pro

            1095                1100                1105

AAC GAG AAC CTG AGC AAC AGC GTG GAG AGC CAC TCG AGC ACC AAC TGG    914

Asn Glu Asn Leu Ser Asn Ser Val Glu Ser His Ser Ser Thr Asn Trp

        1110                1115                1120

AGC TAC ACC AAC ACC GAG GGC GCC AGC GTG GAG GCC GGC ATC GGT CCC    962

Ser Tyr Thr Asn Thr Glu Gly Ala Ser Val Glu Ala Gly Ile Gly Pro

    1125                1130                1135

AAG GGC ATC AGC TTC GGC GTG AGC GTG AAC TAC CAG CAC AGC GAG ACC    1010

Lys Gly Ile Ser Phe Gly Val Ser Val Asn Tyr Gln His Ser Glu Thr

1140                1145                1150                1155

GTG GCC CAG GAG TGG GGC ACC AGC ACC GGC AAC ACC AGC CAG TTC AAC    1058

Val Ala Gln Glu Trp Gly Thr Ser Thr Gly Asn Thr Ser Gln Phe Asn

                1160                1165                1170

ACC GCC AGC GCC GGC TAC CTG AAC GCC AAC GTG CGC TAC AAC AAC GTG    1106

Thr Ala Ser Ala Gly Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val

            1175                1180                1185

GGC ACC GGC GCC ATC TAC GAC GTG AAG CCC ACC ACC AGC TTC GTG CTG    1154

Gly Thr Gly Ala Ile Tyr Asp Val Lys Pro Thr Thr Ser Phe Val Leu

        1190                1195                1200

AAC AAC GAC ACC ATC GCC ACC ATC ACC GCC AAG TCG AAT TCC ACC GCC    1202

Asn Asn Asp Thr Ile Ala Thr Ile Thr Ala Lys Ser Asn Ser Thr Ala

    1205                1210                1215

CTG AAC ATC AGC CCC GGC GAG AGC TAC CCC AAG AAG GGC CAG AAC GGC    1250

Leu Asn Ile Ser Pro Gly Glu Ser Tyr Pro Lys Lys Gly Gln Asn Gly

1220                1225                1230                1235

ATC GCC ATC ACC AGC ATG GAC GAC TTC AAC AGC CAC CCC ATC ACC CTG    1298

Ile Ala Ile Thr Ser Met Asp Asp Phe Asn Ser His Pro Ile Thr Leu

                1240                1245                1250

AAC AAG AAG CAG GTG GAC AAC CTG CTG AAC AAC AAG CCC ATG ATG CTG    1346

Asn Lys Lys Gln Val Asp Asn Leu Leu Asn Asn Lys Pro Met Met Leu

            1255                1260                1265

GAG ACC AAC CAG ACC GAC GGC GTC TAC AAG ATC AAG GAC ACC CAC GGC    1394

Glu Thr Asn Gln Thr Asp Gly Val Tyr Lys Ile Lys Asp Thr His Gly

        1270                1275                1280

AAC ATC GTG ACG GGC GGC GAG TGG AAC GGC GTG ATC CAG CAG ATC AAG    1442

Asn Ile Val Thr Gly Gly Glu Trp Asn Gly Val Ile Gln Gln Ile Lys

    1285                1290                1295

GCC AAG ACC GCC AGC ATC ATC GTC GAC GAC GGC GAG CGC GTG GCC GAG    1490

Ala Lys Thr Ala Ser Ile Ile Val Asp Asp Gly Glu Arg Val Ala Glu

1300                1305                1310                1315

AAG CGC GTG GCC GCC AAG GAC TAC GAG AAC CCC GAG GAC AAG ACC CCC    1538

Lys Arg Val Ala Ala Lys Asp Tyr Glu Asn Pro Glu Asp Lys Thr Pro

                1320                1325                1330

AGC CTG ACC CTG AAG GAC GCC CTG AAG CTG AGC TAC CCC GAC GAG ATC    1586

Ser Leu Thr Leu Lys Asp Ala Leu Lys Leu Ser Tyr Pro Asp Glu Ile

           1335                1340                1345

AAG GAG ATC GAG GGC TTG CTG TAC TAC AAG AAC AAG CCC ATC TAC GAG    1634

Lys Glu Ile Glu Gly Leu Leu Tyr Tyr Lys Asn Lys Pro Ile Tyr Glu

        1350                1355                1360

AGC AGC GTG ATG ACC TAT CTA GAC GAG AAC ACC GCC AAG GAG GTG ACC    1682

Ser Ser Val Met Thr Tyr Leu Asp Glu Asn Thr Ala Lys Glu Val Thr

    1365                1370                1375

AAG CAG CTG AAC GAC ACC ACC GGC AAG TTC AAG GAC GTG AGC CAC CTG    1730

Lys Gln Leu Asn Asp Thr Thr Gly Lys Phe Lys Asp Val Ser His Leu

1380                1385                1390                1395

TAC GAC GTG AAG CTG ACC CCC AAG ATG AAC GTG ACC ATC AAG CTG AGC    1778

Tyr Asp Val Lys Leu Thr Pro Lys Met Asn Val Thr Ile Lys Leu Ser

                1400                1405                1410

ATC CTG TAC GAC AAC GCC GAG AGC AAC GAC AAC AGC ATC GGC AAG TGG    1826

Ile Leu Tyr Asp Asn Ala Glu Ser Asn Asp Asn Ser Ile Gly Lys Trp

            1415                1420                1425

ACC AAC ACC AAC ATC GTG AGC GGC GGC AAC AAC GGC AAG AAG CAG TAC    1874

Thr Asn Thr Asn Ile Val Ser Gly Gly Asn Asn Gly Lys Lys Gln Tyr

        1430                1435                1440

AGC AGC AAC AAC CCC GAC GCC AAC CTG ACC CTG AAC ACC GAC GCC CAG    1922

Ser Ser Asn Asn Pro Asp Ala Asn Leu Thr Leu Asn Thr Asp Ala Gln

    1445                1450                1455

GAG AAG CTG AAC AAG AAC CGC GAC TAC TAC ATC AGC CTG TAC ATG AAG    1970

Glu Lys Leu Asn Lys Asn Arg Asp Tyr Tyr Ile Ser Leu Tyr Met Lys

1460                1465                1470                1475

AGC GAG AAG AAC ACC CAG TGC GAG ATC ACC ATC GAC GGC GAG ATA TAC    2018

Ser Glu Lys Asn Thr Gln Cys Glu Ile Thr Ile Asp Gly Glu Ile Tyr

                1480                1485                1490

CCC ATC ACC ACC AAG ACC GTG AAC GTG AAC AAG GAC AAC TAC AAG CGC    2066

Pro Ile Thr Thr Lys Thr Val Asn Val Asn Lys Asp Asn Tyr Lys Arg

        1495                1500                1505

CTG GAC ATC ATC GCC CAC AAC ATC AAG AGC AAC CCC ATC AGC AGC CTG    2114

Leu Asp Ile Ile Ala His Asn Ile Lys Ser Asn Pro Ile Ser Ser Leu

        1510                1515                1520

CAC ATC AAG ACC AAC GAC GAG ATC ACC CTG TTC TGG GAC GAC ATA TCG    2162

His Ile Lys Thr Asn Asp Glu Ile Thr Leu Phe Trp Asp Asp Ile Ser

    1525                1530                1535

ATT ACC GAC GTC GCC AGC ATC AAG CCC GAG AAC CTG ACC GAC AGC GAG    2210

Ile Thr Asp Val Ala Ser Ile Lys Pro Glu Asn Leu Thr Asp Ser Glu

1540                1545                1550                1555

ATC AAG CAG ATA TAC AGT CGC TAC GGC ATC AAG CTG GAG GAC GGC ATC    2258

Ile Lys Gln Ile Tyr Ser Arg Tyr Gly Ile Lys Leu Glu Asp Gly Ile

                1560                1565                1570

CTG ATC GAC AAG AAA GGC GGC ATC CAC TAC GGC GAG TTC ATC AAC GAG    2306

Leu Ile Asp Lys Lys Gly Gly Ile His Tyr Gly Glu Phe Ile Asn Glu

                1575                1580                1585

GCC AGC TTC AAC ATC GAG CCC CTG CAG AAC TAC GTG ACC AAG TAC GAG    2354

Ala Ser Phe Asn Ile Glu Pro Leu Gln Asn Tyr Val Thr Lys Tyr Glu

        1590                1595                1600

GTG ACC TAC AGC AGC GAG CTG GGC CCC AAC GTG AGC GAC ACC CTG GAG    2402

Val Thr Tyr Ser Ser Glu Leu Gly Pro Asn Val Ser Asp Thr Leu Glu

    1605                1610                1615

AGC GAC AAG ATT TAC AAG GAC GGC ACC ATC AAG TTC GAC TTC ACC AAG    2450

Ser Asp Lys Ile Tyr Lys Asp Gly Thr Ile Lys Phe Asp Phe Thr Lys

1620                1625                1630                1635

TAC AGC AAG AAC GAG CAG GGC CTG TTC TAC GAC AGC GGC CTG AAC TGG    2498

Tyr Ser Lys Asn Glu Gln Gly Leu Phe Tyr Asp Ser Gly Leu Asn Trp

                1640                1645                1650

GAC TTC AAG ATC AAC GCC ATC ACC TAC GAC GGC AAG GAG ATG AAC GTG    2546

Asp Phe Lys Ile Asn Ala Ile Thr Tyr Asp Gly Lys Glu Met Asn Val

            1655                1660                1665

TTC CAC CGC TAC AAC AAG TAGATCTGAG CT                              2576

Phe His Arg Tyr Asn Lys

        1670

(2)SEQ ID NO:36信息:

  (i)序列特征:

    (A)长度:852个氨基酸

    (B)类型:氨基酸

    (D)拓扑结构:线性

  (ii)分子类型:蛋白质

  (xi)序列描述:SEQ ID NO:36:

Met Lys Thr Asn Gln Ile Ser Thr Thr Gln Lys Asn Gln Gln Lys Glu

  1               5                  10                  15

Met Asp Arg Lys Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys Asp Phe

             20                  25                  30

Ser Asn Leu Thr Met Phe Ala Pro Thr Arg Asp Ser Thr Leu Ile Tyr

         35                  40                  45

Asp Gln Gln Thr Ala Asn Lys Leu Leu Asp Lys Lys Gln Gln Glu Tyr

     50                  55                  60

Gln Ser Ile Arg Trp Ile Gly Leu Ile Gln Ser Lys Glu Thr Gly Asp

 65                  70                  75                  80

Phe Thr Phe Asn Leu Ser Glu Asp Glu Gln Ala Ile Ile Glu Ile Asn

                 85                  90                  95

Gly Lys Ile Ile Ser Asn Lys Gly Lys Glu Lys Gln Val Val His Leu

            100                 105                 110

Glu Lys Gly Lys Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser Asp Thr

        115                 120                 125

Lys Phe Asn Ile Asp Ser Lys Thr Phe Lys Glu Leu Lys Leu Phe Lys

    130                 135                 140

Ile Asp Ser Gln Asn Gln Pro Gln Gln Val Gln Gln Asp Glu Leu Arg

145                 150                 155                 160

Asn Pro Glu Phe Asn Lys Lys Glu Ser Gln Glu Phe Leu Ala Lys Pro

                165                 170                 175

Ser Lys Ile Asn Leu Phe Thr Gln Gln Met Lys Arg Glu Ile Asp Glu

            180                 185                 190

Asp Thr Asp Thr Asp Gly Asp Ser Ile Pro Asp Leu Trp Glu Glu Asn

       195                 200                 205

Gly Tyr Thr Ile Gln Asn Arg Ile Ala Val Lys Trp Asp Asp Ser Leu

    210                 215                 220

Ala Ser Lys Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Glu Ser His

225                 230                 235                 240

Thr Val Gly Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg Asp Leu

                245                 250                 255

Asp Leu Ser Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala Phe

            260                 265                 270

Pro Ser Val Asn Val Ser Met Glu Lys Val Ile Leu Ser Pro Asn Glu

        275                 280                 285

Asn Leu Ser Asn Ser Val Glu Ser His Ser Ser Thr Asn Trp Ser Tyr

    290                 295                 300

Thr Asn Thr Glu Gly Ala Ser Val Glu Ala Gly Ile Gly Pro Lys Gly

305                 310                 315                 320

Ile Ser Phe Gly Val Ser Val Asn Tyr Gln His Ser Glu Thr Val Ala

                325                 330                 335

Gln Glu Trp Gly Thr Ser Thr Gly Asn Thr Ser Gln Phe Asn Thr Ala

            340                 345                 350

Ser Ala Gly Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val Gly Thr

        355                 360                 365

Gly Ala Ile Tyr Asp Val Lys Pro Thr Thr Ser Phe Val Leu Asn Asn

    370                 375                 380

Asp Thr Ile Ala Thr Ile Thr Ala Lys Ser Asn Ser Thr Ala Leu Asn

385                 390                 395                 400

Ile Ser Pro Gly Glu Ser Tyr Pro Lys Lys Gly Gln Asn Gly Ile Ala

                405                 410                 415

Ile Thr Ser Met Asp Asp Phe Asn Ser His Pro Ile Thr Leu Asn Lys

            420                 425                 430

Lys Gln Val Asp Asn Leu Leu Asn Asn Lys Pro Met Met Leu Glu Thr

        435                 440                 445

Asn Gln Thr Asp Gly Val Tyr Lys Ile Lys Asp Thr His Gly Asn Ile

    450                 455                 460

Val Thr Gly Gly Glu Trp Asn Gly Val Ile Gln Gln Ile Lys Ala Lys

465                 470                 475                 480

Thr Ala Ser Ile Ile Val Asp Asp Gly Glu Arg Val Ala Glu Lys Arg

                485                 490                 495

Val Ala Ala Lys Asp Tyr Glu Asn Pro Glu Asp Lys Thr Pro Ser Leu

            500                 505                 510

Thr Leu Lys Asp Ala Leu Lys Leu Ser Tyr Pro Asp Glu Ile Lys Glu

        515                 520                 525

Ile Glu Gly Leu Leu Tyr Tyr Lys Asn Lys Pro Ile Tyr Glu Ser Ser

    530                 535                 540

Val Met Thr Tyr Leu Asp Glu Asn Thr Ala Lys Glu Val Thr Lys Gln

545                 550                 555                 560

Leu Asn Asp Thr Thr Gly Lys Phe Lys Asp Val Ser His Leu Tyr Asp

                565                 570                 575

Val Lys Leu Thr Pro Lys Met Asn Val Thr Ile Lys Leu Ser Ile Leu

        580                 585                 590

Tyr Asp Asn Ala Glu Ser Asn Asp Asn Ser Ile Gly Lys Trp Thr Asn

        595                 600                 605

Thr Asn Ile Val Ser Gly Gly Asn Asn Gly Lys Lys Gln Tyr Ser Ser

    610                 615                 620

Asn Asn Pro Asp Ala Asn Leu Thr Leu Asn Thr Asp Ala Gln Glu Lys

625                 630                 635                 640

Leu Asn Lys Asn Arg Asp Tyr Tyr Ile Ser Leu Tyr Met Lys Ser Glu

                645                 650                 655

Lys Asn Thr Gln Cys Glu Ile Thr Ile Asp Gly Glu Ile Tyr Pro Ile

            660                 665                 670

Thr Thr Lys Thr Val Asn Val Asn Lys Asp Asn Tyr Lys Arg Leu Asp

        675                 680                 685

Ile Ile Ala His Asn Ile Lys Ser Asn Pro Ile Ser Ser Leu His Ile

690                 695                 700

Lys Thr Asn Asp Glu Ile Thr Leu Phe Trp Asp Asp Ile Ser Ile Thr

705                 710                 715                 720

Asp Val Ala Ser Ile Lys Pro Glu Asn Leu Thr Asp Ser Glu Ile Lys

                725                 730                 735

Gln Ile Tyr Ser Arg Tyr Gly Ile Lys Leu Glu Asp Gly Ile Leu Ile

            740                 745                 750

Asp Lys Lys Gly Gly Ile His Tyr Gly Glu Phe Ile Asn Glu Ala Ser

        755                 760                 765

Phe Asn Ile Glu Pro Leu Gln Asn Tyr Val Thr Lys Tyr Glu Val Thr

    770                 775                 780

Tyr Ser Ser Glu Leu Gly Pro Asn Val Ser Asp Thr Leu Glu Ser Asp

785                 790                 795              800

Lys Ile Tyr Lys Asp Gly Thr Ile Lys Phe Asp Phe Thr Lys Tyr Ser

                805                 810                 815

Lys Asn Glu Gln Gly Leu Phe Tyr Asp Ser Gly Leu Asn Trp Asp Phe

            820                 825                 830

Lys Ile Asn Ala Ile Thr Tyr Asp Gly Lys Glu Met Asn Val Phe His

        835                 840                 845

Arg Tyr Ash Lys

    850

(2)SEQ ID NO:37信息:

  (i)序列特征:

    (A)长度:32个碱基对

    (B)类型:核酸

    (C)链型:单链

    (D)拓扑结构:线性

  (ii)分子类型:其它核酸

    (A)描述:/desc=“用于制备pCIB5527的正向引物”

  (iii)假设:否

  (xi)序列描述:SEQ ID N0:37:

GGATCCACA TACTGCAGAA CCTGAAGATC AC

(2)SEQ ID NO:38信息:

  (i)序列特征:

    (A)长度:18个碱基对

    (B)类型:核酸

    (C)链型:单链

    (D)拓扑结构:线性

  (ii)分子类型:其它核酸

    (A)描述:/desc=“用于制备pCIB5527的反向引物”

  (iii)假设:否

  (xi)序列描述:SEQ ID NO:38:

AAGCTTCCAC TCCTTCTC

(2)SEQ ID NO:39信息:

  (i)序列特征:

    (A)长度:1241个碱基对

    (B)类型:核酸

    (C)链型:单链

    (D)拓扑结构:线性

  (ii)分子类型:其它核酸

    (A)描述:/desc=“合成DNA”

  (iii)假设:否

  (ix)特征:

    (A)名称/关键词:CDS

    (B)位置:9..1238

    (D)其它信息:/注=″包含在pCIB5527中的玉米优化的编码除 去了芽孢杆菌属分泌信号的VIP2A(a)的序列″

  (xi)序列描述:SEQ ID NO:39:

GATCCACC ATG CTG CAG AAC CTG AAG ATC ACC GAC AAG GTG GAG GAC TTC    50

         Met Leu Gln Asn Leu Lys Ile Thr Asp Lys Val Glu Asp Phe

                 855                 860                 865

AAG GAG GAC AAG GAG AAG GCC AAG GAG TGG GGC AAG GAG AAG GAG AAG     98

Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys Glu Lys

            870                 875                 880

GAG TGG AAG CTT ACC GCC ACC GAG AAG GGC AAG ATG AAC AAC TTC CTG    146

Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn Asn Phe Leu

        885                 890                 895

GAC AAC AAG AAC GAC ATC AAG ACC AAC TAC AAG GAG ATC ACC TTC AGC    194

Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr Phe Ser

    900                 905                 910

ATA GCC GGC AGC TTC GAG GAC GAG ATC AAG GAC CTG AAG GAG ATC GAC    242

Ile Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu Ile Asp

915                 920                 925                 930

AAG ATG TTC GAC AAG ACC AAC CTG AGC AAC AGC ATC ATC ACC TAC AAG    290

Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile Thr Tyr Lys

                935                 940                 945

AAC GTG GAG CCC ACC ACC ATC GGC TTC AAC AAG AGC CTG ACC GAG GGC    338

Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu Thr Glu Gly

            950                 955                 960

AAC ACC ATC AAC AGC GAC GCC ATG GCC CAG TTC AAG GAG CAG TTC CTG    386

Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln Phe Leu

        965                 970                 975

GAC CGC GAC ATC AAG TTC GAC AGC TAC CTG GAC ACC CAC CTG ACC GCC    434

Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu Thr Ala

    980                 985                 990

CAG CAG GTG AGC AGC AAG GAG CGC GTG ATC CTG AAG GTG ACC GTC CCC    482

Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val Thr Val Pro

995                 1000                1005                1010

AGC GGC AAG GGC AGC ACC ACC CCC ACC AAG GCC GGC GTG ATC CTG AAC    530

Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile Leu Asn

                1015                1020                1025

AAC AGC GAG TAC AAG ATG CTG ATC GAC AAC GGC TAC ATG GTG CAC GTG    578

Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Met Val His Val

            1030                1035                1040

GAC AAG GTG AGC AAG GTG GTG AAG AAG GGC GTG GAG TGC CTC CAG ATC    626

Asp Lys Val Ser Lys Val Val Lys Lys Gly Val Glu Cys Leu Gln Ile

        1045                1050                1055

GAG GGC ACC CTG AAG AAG AGT CTA GAC TTC AAG AAC GAC ATC AAC GCC    674

Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile Asn Ala

    1060                1065                1070

GAG GCC CAC AGC TGG GGC ATG AAG AAC TAC GAG GAG TGG GCC AAG GAC    722

Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp Ala Lys Asp

1075                1080                1085                1090

CTG ACC GAC AGC CAG CGC GAG GCC CTG GAC GGC TAC GCC CGC CAG GAC    770

Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg Gln Asp

                1095                1100                1105

TAC AAG GAG ATC AAC AAC TAC CTG CGC AAC CAG GGC GGC AGC GGC AAC    818

Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser Gly Asn

            1110                1115            1120

GAG AAG CTG GAC GCC CAG ATC AAG AAC ATC AGC GAC GCC CTG GGC AAG    866

Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala Leu Gly Lys

        1125                1130                1135

AAG CCC ATC CCC GAG AAC ATC ACC GTG TAC CGC TGG TGC GGC ATG CCC    914

Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly Met Pro

    1140                1145                1150

GAG TTC GGC TAC CAG ATC AGC GAC CCC CTG CCC AGC CTG AAG GAC TTC    962

Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys Asp Phe

1155                1160                1165                1170

GAG GAG CAG TTC CTG AAC ACC ATC AAG GAG GAC AAG GGC TAC ATG AGC    1010

Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr Met Ser

                1175                1180                1185

ACC AGC CTG AGC AGC GAG CGC CTG GCC GCC TTC GGC AGC CGC AAG ATC    1058

Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg Lys Ile

            1190                1195                1200

ATC CTG CGC CTG CAG GTG CCC AAG GGC AGC ACT GGT GCC TAC CTG AGC    1106

Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr Leu Ser

        1205                1210                1215

GCC ATC GGC GGC TTC GCC AGC GAG AAG GAG ATC CTG CTG GAT AAG GAC    1154

Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp Lys Asp

    1220                1225                1230

AGC AAG TAC CAC ATC GAC AAG GTG ACC GAG GTG ATC ATC AAG GGC GTG    1202

Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile Lys Gly Val

1235                1240                1245                1250

AAG CGC TAC GTG GTG GAC GCC ACC CTG CTG ACC AAC TAG                1241

Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn

                1255                1260

(2)SEQ ID NO:40信息:

  (i)序列特征:

    (A)长度:410个氨基酸

    (B)类型:氨基酸

    (D)拓扑结构:线性

  (ii)分子类型:蛋白质

  (xi)序列描述:SEQ ID NO:40:

Met Leu Gln Asn Leu Lys Ile Thr Asp Lys Val Glu Asp Phe Lys Glu

  1               5                  10                  15

Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys Glu Lys Glu Trp

             20                  25                  30

Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn Asn Phe Leu Asp Asn

         35                  40                 45

Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr Phe Ser Ile Ala

     50                  55                  60

Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu Ile Asp Lys Met

 65                  70                  75                  80

Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile Thr Tyr Lys Asn Val

                 85                  90                  95

Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu Thr Glu Gly Asn Thr

            100                 105                 110

Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln Phe Leu Asp Arg

        115                 120                 125

Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu Thr Ala Gln Gln

    130                 135                 140

Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val Thr Val Pro Ser Gly

145                 150                 155                 160

Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile Leu Asn Asn Ser

                165                 170                 175

Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Met Val His Val Asp Lys

            180                 185                 190

Val Ser Lys Val Val Lys Lys Gly Val Glu Cys Leu Gln Ile Glu Gly

        195                 200                 205

Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile Asn Ala Glu Ala

    210                 215                 220

His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp Ala Lys Asp Leu Thr

225                 230                 235                 240

Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg Gln Asp Tyr Lys

                245                 250                 255

Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser Gly Asn Glu Lys

            260                 265                 270

Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala Leu Gly Lys Lys Pro

        275                 280                 285

Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly Met Pro Glu Phe

    290                 295                 300

Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys Asp Phe Glu Glu

305                 310                 315                 320

Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr Met Ser Thr Ser

                325                 330                 335

Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg Lys Ile Ile Leu

            340                 345                 350

Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr Leu Ser Ala Ile

        355                 360                 365

Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp Lys Asp Ser Lys

    370                 375                 380

Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile Lys Gly Val Lys Arg

385                 390                 395                 400

Tyr Val Val Asp Ala Thr Leu Leu Thr Asn

               405                 410

(2)SEQ ID NO:41信息:

  (i)序列特征:

   (A)长度:72个碱基对

   (B)类型:核酸

   (C)链型:单链

   (D)拓扑结构:  线性

  (ii)分子类型:其它核酸

    (A)描述:/desc=“用于构建pCIB5527的编码真核生物分泌信号的寡 核苷酸”

  (iii)假设:否

  (xi)序列描述:SEQ ID NO:41:

GGATCCACCA TGGGCTGGAG CTGGATCTTC CTGTTCCTGC TGAGCGGGCGC CGCGGGCGTG    60

CACTGCCTGC AG                                                         72

(2)SEQ ID NO:42信息:

  (i)序列特征:

    (A)长度:1421个碱基对

    (B)类型:核酸

    (C)链型:单链

    (D)拓扑结构:线性

  (ii)分子类型:其它核酸

    (A)描述:/desc=“合成DNA”

  (iii)假设:否

  (ix)特征:

    (A)名称/关键词:CDS

    (B)位置:9..1238

    (D)其它信息:/注=″包含在pCIB5528中的玉米优化的编码除 去了芽孢杆菌属分泌信号并插入了真核生物分泌信号的VIP2A(a)的DNA 序列″

  (xi)序列描述:SEQ ID NO:42:

GATCCACC ATG CTG CAG AAC CTG AAG ATC ACC GAC AAG GTG GAG GAC TTC    50

         Met Leu Gln Asn Leu Lys Ile Thr Asp Lys Val Glu Asp Phe

                         415                 420

AAG GAG GAC AAG GAG AAG GCC AAG GAG TGG GGC AAG GAG AAG GAG AAG     98

Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys Glu Lys

425                 430                 435                 440

GAG TGG AAG CTT ACC GCC ACC GAG AAG GGC AAG ATG AAC AAC TTC CTG    146

Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn Asn Phe Leu

                445                 450                 455

GAC AAC AAG AAC GAC ATC AAG ACC AAC TAC AAG GAG ATC ACC TTC AGC    194

Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr Phe Ser

            460                 465                 470

ATA GCC GGC AGC TTC GAG GAC GAG ATC AAG GAC CTG AAG GAG ATC GAC    242

Ile Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu Ile Asp

        475                 480                 485

AAG ATG TTC GAC AAG ACC AAC CTG AGC AAC AGC ATC ATC ACC TAC AAG    290

Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile Thr Tyr Lys

    490                 495                 500

AAC GTG GAG CCC ACC ACC ATC GGC TTC AAC AAG AGC CTG ACC GAG GGC    338

Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu Thr Glu Gly

505                 510                 515                 520

AAC ACC ATC AAC AGC GAC GCC ATG GCC CAG TTC AAG GAG CAG TTC CTG    386

Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln Phe Leu

                525                 530                 535

GAC CGC GAC ATC AAG TTC GAC AGC TAC CTG GAC ACC CAC CTG ACC GCC    434

Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu Thr Ala

            540                 545                 550

CAG CAG GTG AGC AGC AAG GAG CGC GTG ATC CTG AAG GTG ACC GTC CCC    482

Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val Thr Val Pro

        555                 560                 565

AGC GGC AAG GGC AGC ACC ACC CCC ACC AAG GCC GGC GTG ATC CTG AAC    530

Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile Leu Asn

   570                 575                 580

AAC AGC GAG TAC AAG ATG CTG ATC GAC AAC GGC TAC ATG GTG CAC GTG    578

Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Met Val His Val

585                 590                 595                 600

GAC AAG GTG AGC AAG GTG GTG AAG AAG GGC GTG GAG TGC CTC CAG ATC    626

Asp Lys Val Ser Lys Val Val Lys Lys Gly Val Glu Cys Leu Gln Ile

                605                 610                 615

GAG GGC ACC CTG AAG AAG AGT CTA GAC TTC AAG AAC GAC ATC AAC GCC      674

Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile Asn Ala

            620                 625                 630

GAG GCC CAC AGC TGG GGC ATG AAG AAC TAC GAG GAG TGG GCC AAG GAC      722

Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp Ala Lys Asp

        635                 640                 645

CTG ACC GAC AGC CAG CGC GAG GCC CTG GAC GGC TAC GCC CGC CAG GAC      770

Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg Gln Asp

    650                 655                 660

TAC AAG GAG ATC AAC AAC TAC CTG CGC AAC CAG GGC GGC AGC GGC AAC      818

Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser Gly Asn

665                 670                 675                 680

GAG AAG CTG GAC GCC CAG ATC AAG AAC ATC AGC GAC GCC CTG GGC AAG      866

Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala Leu Gly Lys

                685                 690                 695

AAG CCC ATC CCC GAG AAC ATC ACC GTG TAC CGC TGG TGC GGC ATG CCC      914

Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly Met Pro

            700                 705                 710

GAG TTC GGC TAC CAG ATC AGC GAC CCC CTG CCC AGC CTG AAG GAC TTC      962

Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys Asp Phe

        715                 720                 725

GAG GAG CAG TTC CTG AAC ACC ATC AAG GAG GAC AAG GGC TAC ATG AGC     1010

Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr Met Ser

    730                 735                 740

ACC AGC CTG AGC AGC GAG CGC CTG GCC GCC TTC GGC AGC CGC AAG ATC    1058

Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg Lys Ile

745                 750                 755                 760

ATC CTG CGC CTG CAG GTG CCC AAG GGC AGC ACT GGT GCC TAC CTG AGC    1106

Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr Leu Ser

                765                 770                 775

GCC ATC GGC GGC TTC GCC AGC GAG AAG GAG ATC CTG CTG GAT AAG GAC    1154

Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp Lys Asp

            780                 785                 790

AGC AAG TAC CAC ATC GAC AAG GTG ACC GAG GTG ATC ATC AAG GGC GTG    1202

Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile Lys Gly Val

        795                 800                 805

AAG CGC TAC GTG GTG GAC GCC ACC CTG CTG ACC AAC TAG                1241

Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn

    810                 815                 820

(2)SEQ ID NO:43信息:

  (i)序列特征:

    (A)长度:410个氨基酸

    (B)类型:氨基酸

    (D)拓扑结构:线性

  (ii)分子类型:蛋白质

  (xi)序列描述:SEQ ID NO:43:

Met Leu Gln Asn Leu Lys Ile Thr Asp Lys Val Glu Asp Phe Lys Glu

  1               5                  10                  15

Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys Glu Lys Glu Trp

             20                  25                  30

Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn Asn Phe Leu Asp Asn

         35                  40                  45

Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr Phe Ser Ile Ala

     50                  55                  60

Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu Ile Asp Lys Met

 65                  70                  75                  80

Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile Thr Tyr Lys Asn Val

                 85                  90                  95

Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu Thr Glu Gly Asn Thr

            100                 105                 110

Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln Phe Leu Asp Arg

        115                 120                 125

Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu Thr Ala Gln Gln

    130                 135                 140

Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val Thr Val Pro Ser Gly

145                 150                 155                 160

Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile Leu Asn Asn Ser

                165                 170                 175

Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Met Val His Val Asp Lys

            180                 185                 190

Val Ser Lys Val Val Lys Lys Gly Val Glu Cys Leu Gln Ile Glu Gly

        195                 200                 205

Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile Asn Ala Glu Ala

    210                 215                 220

His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp Ala Lys Asp Leu Thr

225                 230                 235                 240

Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg Gln Asp Tyr Lys

                245                 250                 255

Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser Gly Asn Glu Lys

            260                 265                 270

Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala Leu Gly Lys Lys Pro

        275                 280                 285

Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly Met Pro Glu Phe

    290                 295                 300

Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys Asp Phe Glu Glu

305                 310                 315                 320

Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr Met Ser Thr Ser

                325                 330                 335

Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg Lys Ile Ile Leu

            340                 345                 350

Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr Leu Ser Ala Ile

        355                 360                 365

Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp Lys Asp Ser Lys

    370                 375                 380

Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile Lys Gly Val Lys Arg

385                 390                 395                 400

Tyr Val Val Asp Ala Thr Leu Leu Thr Asn

                405                 410

(2)SEQ ID NO:44信息:

  (i)序列特征:

    (A)长度:86个碱基对

    (B)类型:核酸

    (C)链型:单链

    (D)拓扑结构:线性

  (ii)分子类型:其它核酸

    (A)描述:/desc=“用于构建pCIB5533的编码液泡定位肽的寡核苷酸”

  (iii)假设:否

  (xi)序列描述:SEQ ID NO:44:

CCGCGGGCGT GCACTGCCTC AGCAGCAGCA GCTTCGCCGA

CAGCAACCCC ATCCGCGTGA CCGACCGCGC CGCCAGCACC

CTGCAG

(2)SEQ ID NO:45信息:

  (i)序列特征:

    (A)长度:1358个碱基对

    (B)类型:核酸

    (C)链型:单链

    (D)拓扑结构:线性

  (ii)分子类型:其它核酸

    (A)描述:/desc=“合成DNA”

  (iii)假设:否

  (ix)特征:

    (A)名称/关键词:CDS

    (B)位置:9..1355

    (D)其它信息:/注=″包含在pCIB5533中的玉米优化的编码除 去了芽孢杆菌属分泌信号并插入了液泡定位信号的VIP2A(a)的DNA序列 ″

(xi)序列描述:SEQ ID NO:45:

GATCCACC ATG GGC TGG AGC TGG ATC TTC CTG TTC CTG CTG AGC GGC GCC    50

         Met Gly Trp Ser Trp Ile Phe Leu Phe Leu Leu Ser Gly Ala

                         415                 420

GCG GGC GTG CAC TGC CTC AGC AGC AGC AGC TTC GCC GAC AGC AAC CCC     98

Ala Gly Val His Cys Leu Ser Ser Ser Ser Phe Ala Asp Ser Asn Pro

425                 430                 435                 440

ATC CGC GTG ACC GAC CGC GCC GCC AGC ACC CTG CAG AAC CTG AAG ATC    146

Ile Arg Val Thr Asp Arg Ala Ala Ser Thr Leu Gln Asn Leu Lys Ile

                445                 450                 455

ACC GAC AAG GTG GAG GAC TTC AAG GAG GAG AAG GAG AAG GCC AAG GAG    194

Thr Asp Lys Val Glu Asp Phe Lys Glu Asp Lys Glu Lys Ala Lys Glu

            460                 465                 470

TGG GGC AAG GAG AAG GAG AAG GAG TGG AAG CTT ACC GCC ACC GAG AAG    242

Trp Gly Lys Glu Lys Glu Lys Glu Trp Lys Leu Thr Ala Thr Glu Lys

        475                 480                 485

GGC AAG ATG AAC AAC TTC CTG GAC AAC AAG AAC GAC ATC AAG ACC AAC    290

GAy Lys Met Asn Asn Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn

    490                 495                 500

TAC AAG GAG ATC ACC TTC AGC ATA GCC GGC AGC TTC GAG GAC GAG ATC    338

Tyr Lys Glu Ile Thr Phe Ser Ile Ala Gly Ser Phe Glu Asp Glu Ile

505                 510                 515                 520

AAG GAC CTG AAG GAG ATC GAC AAG ATG TTC GAC AAG ACC AAC CTG AGC    386

Lys Asp Leu Lys Glu Ile Asp Lys Met Phe Asp Lys Thr Asn Leu Ser

                525                 530                 535

AAC AGC ATC ATC ACC TAC AAG AAC GTG GAG CCC ACC ACC ATC GGC TTC    434

Asn Ser Ile Ile Thr Tyr Lys Asn Val Glu Pro Thr Thr Ile Gly Phe

            540                 545                 550

AAC AAG AGC CTG ACC GAG GGC AAC ACC ATC AAC AGC GAC GCC ATG GCC    482

Asn Lys Ser Leu Thr Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala

        555                 560                 565

CAG TTC AAG GAG CAG TTC CTG GAC CGC GAC ATC AAG TTC GAC AGC TAC    530

Gln Phe Lys Glu Gln Phe Leu Asp Arg Asp Ile Lys Phe Asp Ser Tyr

    570                 575                 580

CTG GAC ACC CAC CTG ACC GCC CAG CAG GTG AGC AGC AAG GAG CGC GTG    578

Leu Asp Thr His Leu Thr Ala Gln Gln Val Ser Ser Lys Glu Ara Val

585                 590                 595                 600

ATC CTG AAG GTG ACC GTC CCC AGC GGC AAG GGC AGC ACC ACC CCC ACC    626

Ile Leu Lys Val Thr Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr

                605                 610                 615

AAG GCC GGC GTG ATC CTG AAC AAC AGC GAG TAC AAG ATG CTG ATC GAC    674

Lys Ala Gly Val Ile Leu Asn Asn Ser Glu Tyr Lys Met Leu Ile Asp

            620                 625                 630

AAC GGC TAC ATG GTG CAC GTG GAC AAG GTG AGC AAG GTG GTG AAG AAG    722

Asn Gly Tyr Met Val His Val Asp Lys Val Ser Lys Val Val Lys Lys

        635                 640                 645

GGC GTG GAG TGC CTC CAG ATC GAG GGC ACC CTG AAG AAG AGT CTA GAC    770

Gly Val Glu Cys Leu Gln Ile Glu Gly Thr Leu Lys Lys Ser Leu Asp

    650                 655                 660

TTC AAG AAC GAC ATC AAC GCC GAG GCC CAC AGC TGG GGC ATG AAG AAC    818

Phe Lys Asn Asp Ile Asn Ala Glu Ala His Ser Trp Gly Met Lys Asn

665                 670                 675                 680

TAC GAG GAG TGG GCC AAG GAC CTG ACC GAC AGC CAG CGC GAG GCC CTG    866

Tyr Glu Glu Trp Ala Lys Asp Leu Thr Asp Ser Gln Arg Glu Ala Leu

                685                 690                 695

GAC GGC TAC GCC CGC CAG GAC TAC AAG GAG ATC AAC AAC TAC CTG CGC    914

Asp Gly Tyr Ala Arg Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg

            700                 705                 710

AAC CAG GGC GGC AGC GGC AAC GAG AAG CTG GAC GCC CAG ATC AAG AAC    962

Asn Gln Gly Gly Ser Gly Asn Glu Lys Leu Asp Ala Gln Ile Lys Asn

        715                 720                 725

ATC AGC GAC GCC CTG GGC AAG AAG CCC ATC CCC GAG AAC ATC ACC GTG   1010

Ile Ser Asp Ala Leu Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val

    730                 735                 740

TAC CGC TGG TGC GGC ATG CCC GAG TTC GGC TAC CAG ATC AGC GAC CCC    1058

Tyr Arg Trp Cys Gly Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro

745                 750                 755                 760

CTG CCC AGC CTG AAG GAC TTC GAG GAG CAG TTC CTG AAC ACC ATC AAG    1106

Leu Pro Ser Leu Lys Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys

                765                 770                 775

GAG GAC AAG GGC TAC ATG AGC ACC AGC CTG AGC AGC GAG CGC CTG GCC    1154

Glu Asp Lys Gly Tyr Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala

            780                 785                 790

GCC TTC GGC AGC CGC AAG ATC ATC CTG CGC CTG CAG GTG CCC AAG GGC    1202

Ala Phe Gly Ser Arg Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly

        795                 800                 805

AGC ACT GGT GCC TAC CTG AGC GCC ATC GGC GGC TTC GCC AGC GAG AAG    1250

Ser Thr Gly Ala Tyr Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys

    810                 815                 820

GAG ATC CTG CTG GAT AAG GAC AGC AAG TAC CAC ATC GAC AAG GTG ACC    1298

Glu Ile Leu Leu Asp Lys Asp Ser Lys Tyr His Ile Asp Lys Val Thr

825                 830                 835                 840

GAG GTG ATC ATC AAG GGC GTG AAG CGC TAC GTG GTG GAC GCC ACC CTG    1346

Glu Val Ile Ile Lys Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu

                845                 850                 855

CTG ACC AAC TAG                                                    1358

Leu Thr Asn

(2)SEQ ID NO:46信息:

  (i)序列特征:

    (A)长度:449个氨基酸

    (B)类型:氨基酸

    (D)拓扑结构:线性

  (ii)分子类型:蛋白质

  (xi)序列描述:SEQ ID NO:46:

Met Gly Trp Ser Trp Ile Phe Leu Phe Leu Leu Ser Gly Ala Ala Gly

  1               5                  10                  15

Val His Cys Leu Ser Ser Ser Ser Phe Ala Asp Ser Asn Pro Ile Arg

             20                 25                 30

Val Thr Asp Arg Ala Ala Ser Thr Leu Gln Asn Leu Lys Ile Thr Asp

         35                  40                  45

Lys Val Glu Asp Phe Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly

     50                  55                  60

Lys Glu Lys Glu Lys Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys

 65                  70                  75                  80

Met Asn Asn Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys

                 85                  90                  95

Glu Ile Thr Phe Ser Ile Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp

            100                 105                 110

Leu Lys Glu Ile Asp Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser

        115                 120                 125

Ile Ile Thr Tyr Lys Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys

    130                 135                 140

Ser Leu Thr Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe

145                 150                 155                 160

Lys Glu Gln Phe Leu Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp

                165                 170                 175

Thr His Leu Thr Ala Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu

            180                 185                 190

Lys Val Thr Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala

        195                 200                 205

Gly Val Ile Leu Asn Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly

    210                 215                 220

Tyr Met Val His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Val

225                 230                 235                 240

Glu Cys Leu Gln Ile Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys

                245                 250                 255

Asn Asp Ile Asn Ala Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu

            260                 265                 270

Glu Trp Ala Lys Asp Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp Gly

        275                 280                 285

Tyr Ala Arg Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln

    290                 295                 300

Gly Gly Ser Gly Asn Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser

305                 310                 315                 320

Asp Ala Leu Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg

                325                 330                 335

Trp Cys Gly Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro

            340                 345                 350

Ser Leu Lys Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp

        355                 360                 365

Lys Gly Tyr Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe

    370                 375                 380

Gly Ser Arg Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr

385                 390                 395                 400

Gly Ala Tyr Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile

                405                 410                 415

Leu Leu Asp Lys Asp Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val

            420                 425                 430

Ile Ile Lys Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr

        435                 440                 445

Asn

(2)SEQ ID NO:47信息:

  (i)序列特征:

    (A)长度:16个氨基酸

    (B)类型:氨基酸

    (D)拓扑结构:线性

  (ii)分子类型:肽

  (iii)假设:否

  (ix)特征:

    (A)名称/关键词:肽

    (B)位置:1..16

    (D)其它信息:/注=″用于构建pCIB的融合VIP1(a)和 VIP2A(a)d接头肽″

  (xi)序列描述:SEQ ID NO:47:

Pro Ser Thr Pro Pro Thr Pro Ser Pro Ser Thr Pro Pro Thr Pro Ser

 1               5               10                  15

(2)SEQ ID NO:48信息:

  (i)序列特征:

    (A)长度:66个碱基对

    (B)类型:核酸

    (C)链型:单链

    (D)拓扑结构:线性

  (ii)分子类型:其它核酸

    (A)描述:/desc=“编码用于构建pCIB5533的接头肽之DNA序列”

  (iii)假设:否

  (xi)序列描述:SEQ ID NO:48:

CCCGGGCCTT CTACTCCCCC AACTCCCTCT CCTAGCACGC CTCCGACACC TAGCGATATC    60

GGATCC                                                               66

(2)SEQ ID NO:49信息:

  (i)序列特征:

    (A)长度:4031个碱基对

    (B)类型:核酸

    (C)链型:单链

    (D)拓扑结构:线性

  (ii)分子类型:其它核酸

    (A)描述:/desc=“合成DNA”

  (iii)假设:否

  (ix)特征:

    (A)名称/关键词:CDS

    (B)位置:6..4019

    (D)其它信息:/注=″包含在pCIB5531中的玉米优化的编码 VIP2A(a)-VIP1A(a)融合蛋白质的DNA序列″

  (xi)序列描述:SEQ ID NO:49:

GATCC ATG AAG CGC ATG GAG GGC AAG CTG TTC ATG GTG AGC AAG AAG       47

      Met Lys Arg Met Glu Gly Lys Leu Phe Met Val Ser Lys Lys

      450                 455                 460

CTC CAG GTG GTG ACC AAG ACC GTG CTG CTG AGC ACC GTG TTC AGC ATC     95

Leu Gln Val Val Thr Lys Thr Val Leu Leu Ser Thr Val Phe Ser Ile

    465                 470                 475

AGC CTG CTG AAC AAC GAG GTG ATC AAG GCC GAG CAG CTG AAC ATC AAC    143

Ser Leu Leu Asn Asn Glu Val Ile Lys Ala Glu Gln Leu Asn Ile Asn

480                 485                 490                 495

AGC CAG AGC AAG TAC ACC AAC CTC CAG AAC CTG AAG ATC ACC GAC AAG    191

Ser Gln Ser Lys Tyr Thr Asn Leu Gln Asn Leu Lys Ile Thr Asp Lys

                500                 505                 510

GTG GAG GAC TTC AAG GAG GAC AAG GAG AAG GCC AAG GAG TGG GGC AAG    239

Val Glu Asp Phe Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys

            515                 520                 525

GAG AAG GAG AAG GAG TGG AAG CTT ACC GCC ACC GAG AAG GGC AAG ATG    287

Glu Lys Glu Lys Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys Met

        530                 535                 540

AAC AAC TTC CTG GAC AAC AAG AAC GAC ATC AAG ACC AAC TAC AAG GAG    335

Asn Asn Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu

    545                 550                 555

ATC ACC TTC AGC ATA GCC GGC AGC TTC GAG GAC GAG ATC AAG GAC CTG    383

Ile Thr Phe Ser Ile Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu

560                 565                 570                 575

AAG GAG ATC GAC AAG ATG TTC GAC AAG ACC AAC CTG AGC AAC AGC ATC    431

Lys Glu Ile Asp Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile

                580                 585                 590

ATC ACC TAC AAG AAC GTG GAG CCC ACC ACC ATC GGC TTC AAC AAG AGC    479

Ile Thr Tyr Lys Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser

            595                 600                 605

CTG ACC GAG GGC AAC ACC ATC AAC AGC GAC GCC ATG GCC CAG TTC AAG    527

Leu Thr Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys

        610                 615                 620

GAG CAG TTC CTG GAC CGC GAC ATC AAG TTC GAC AGC TAC CTG GAC ACC    575

Glu Gln Phe Leu Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr

    625                 630                 635

CAC CTG ACC GCC CAG CAG GTG AGC AGC AAG GAG CGC GTG ATC CTG AAG    623

His Leu Thr Ala Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu Lys

640                 645                 650                 655

GTG ACC GTC CCC AGC GGC AAG GGC AGC ACC ACC CCC ACC AAG GCC GGC    671

Val Thr Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly

                660                 665                 670

GTG ATC CTG AAC AAC AGC GAG TAC AAG ATG CTG ATC GAC AAC GGC TAC    719

Val Ile Leu Asn Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr

            675                 680                 685

ATG GTG CAC GTG GAC AAG GTG AGC AAG GTG GTG AAG AAG GGC GTG GAG    767

Met Val His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Val Glu

        690                 695                 700

TGC CTC CAG ATC GAG GGC ACC CTG AAG AAG AGT CTA GAC TTC AAG AAC    815

Cys Leu Gln Ile Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn

    705                 710                 715

GAC ATC AAC GCC GAG GCC CAC AGC TGG GGC ATG AAG AAC TAC GAG GAG    863

Asp Ile Asn Ala Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu Glu

720                 725                 730                 735

TGG GCC AAG GAC CTG ACC GAC AGC CAG CGC GAG GCC CTG GAC GGC TAC    911

Trp Ala Lys Asp Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr

                740                 745                     750

GCC CGC CAG GAC TAC AAG GAG ATC AAC AAC TAC CTG CGC AAC CAG GGC    959

Ala Arg Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly

            755                 760                 765

GGC AGC GGC AAC GAG AAG CTG GAC GCC CAG ATC AAG AAC ATC AGC GAC   1007

Gly Ser Gly Asn Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp

        770                 775                 780

GCC CTG GGC AAG AAG CCC ATC CCC GAG AAC ATC ACC GTG TAC CGC TGG   1055

Ala Leu Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp

    785                 790                 795

TGC GGC ATG CCC GAG TTC GGC TAC CAG ATC AGC GAC CCC CTG CCC AGC   1103

Cys Gly Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser

800                 805                 810                 815

CTG AAG GAC TTC GAG GAG CAG TTC CTG AAC ACC ATC AAG GAG GAC AAG    1151

Leu Lys Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys

                820                 825                 830

GGC TAC ATG AGC ACC AGC CTG AGC AGC GAG CGC CTG GCC GCC TTC GGC    1199

Gly Tyr Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly

            835                 840                 845

AGC CGC AAG ATC ATC CTG CGC CTG CAG GTG CCC AAG GGC AGC ACT GGT    1247

Ser Arg Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly

        850                 855                 860

GCC TAC CTG AGC GCC ATC GGC GGC TTC GCC AGC GAG AAG GAG ATC CTG    1295

Ala Tyr Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu

    865                 870                 875

CTG GAT AAG GAC AGC AAG TAC CAC ATC GAC AAG GTG ACC GAG GTG ATC    1343

Leu Asp Lys Asp Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val Ile

880                 885                 890                 895

ATC AAG GGC GTG AAG CGC TAC GTG GTG GAC GCC ACC CTG CTG ACC AAC    1391

Ile Lys Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn

                900                 905                 910

TCC CGG GGG CCT TCT ACT CCC CCA ACT CCC TCT CCT AGC ACG CCT CCG    1439

Ser Arg Gly Pro Ser Thr Pro Pro Thr Pro Ser Pro Ser Thr Pro Pro

            915                 920                 925

ACA CCT AGC GAT ATC GGA TCC ACC ATG AAG ACC AAC CAG ATC AGC ACC    1487

Thr Pro Ser Asp Ile Gly Ser Thr Met Lys Thr Asn Gln Ile Ser Thr

        930                 935                 940

ACC CAG AAG AAC CAG CAG AAG GAG ATG GAC CGC AAG GGC CTG CTG GGC    1535

Thr Gln Lys Asn Gln Gln Lys Glu Met Asp Arg Lys Gly Leu Leu Gly

    945                 950                 955

TAC TAC TTC AAG GGC AAG GAC TTC AGC AAC CTG ACC ATG TTC GCC CCC    1583

Tyr Tyr Phe Lys Gly Lys Asp Phe Ser Asn Leu Thr Met Phe Ala Pro

960                 965                 970                 975

ACG CGT GAC AGC ACC CTG ATC TAC GAC CAG CAG ACC GCC AAC AAG CTG    1631

Thr Arg Asp Ser Thr Leu Ile Tyr Asp Gln Gln Thr Ala Asn Lys Leu

                980                 985                 990

CTG GAC AAG AAG CAG CAG GAG TAC CAG AGC ATC CGC TGG ATC GGC CTG    1679

Leu Asp Lys Lys Gln Gln Glu Tyr Gln Ser Ile Arg Trp Ile Gly Leu

            995                 1000                1005

ATC CAG AGC AAG GAG ACC GGC GAC TTC ACC TTC AAC CTG AGC GAG GAC    1727

Ile Gln Ser Lys Glu Thr Gly Asp Phe Thr Phe Asn Leu Ser Glu Asp

        1010                1015                1020

GAG CAG GCC ATC ATC GAG ATC AAC GGC AAG ATC ATC AGC AAC AAG GGC    1775

Glu Gln Ala Ile Ile Glu Ile Asn Gly Lys Ile Ile Ser Asn Lys Gly

    1025                1030                1035

AAG GAG AAG CAG GTG GTG CAC CTG GAG AAG GGC AAG CTG GTG CCC ATC    1823

Lys Glu Lys Gln Val Val His Leu Glu Lys Gly Lys Leu Val Pro Ile

1040                1045                1050                1055

AAG ATC GAG TAC CAG AGC GAC ACC AAG TTC AAC ATC GAC AGC AAG ACC    1871

Lys Ile Glu Tyr Gln Ser Asp Thr Lys Phe Asn Ile Asp Ser Lys Thr

                1060                1065                1070

TTC AAG GAG CTG AAG CTT TTC AAG ATC GAC AGC CAG AAC CAG CCC CAG    1919

Phe Lys Glu Leu Lys Leu Phe Lys Ile Asp Ser Gln Asn Gln Pro Gln

            1075                1080                1085

CAG GTG CAG CAG GAC GAG CTG CGC AAC CCC GAG TTC AAC AAG AAG GAG    1967

Gln Val Gln Gln Asp Glu Leu Arg Asn Pro Glu Phe Asn Lys Lys Glu

        1090                1095                1100

AGC CAG GAG TTC CTG GCC AAG CCC AGC AAG ATC AAC CTG TTC ACC CAG    2015

Ser Gln Glu Phe Leu Ala Lys Pro Ser Lys Ile Asn Leu Phe Thr Gln

    1105                1110                1115

CAG ATG AAG CGC GAG ATC GAC GAG GAC ACC GAC ACC GAC GGC GAC AGC    2063

Gln Met Lys Arg Glu Ile Asp Glu Asp Thr Asp Thr Asp Gly Asp Ser

1120                1125                1130                1135

ATC CCC GAC CTG TGG GAG GAG AAC GGC TAC ACC ATC CAG AAC CGC ATC    2111

Ile Pro Asp Leu Trp Glu Glu Asn Gly Tyr Thr Ile Gln Asn Arg Ile

                1140                1145                1150

GCC GTG AAG TGG GAC GAC AGC CTG GCT AGC AAG GGC TAC ACC AAG TTC    2159

Ala Val Lys Trp Asp Asp Ser Leu Ala Ser Lys Gly Tyr Thr Lys Phe

            1155                1160                1165

GTG AGC AAC CCC CTG GAG AGC CAC ACC GTG GGC GAC CCC TAC ACC GAC    2207

Val Ser Asn Pro Leu Glu Ser His Thr Val Gly Asp Pro Tyr Thr Asp

        1170                1175                1180

TAC GAG AAG GCC GCC CGC GAC CTG GAC CTG AGC AAC GCC AAG GAG ACC    2255

Tyr Glu Lys Ala Ala Arg Asp Leu Asp Leu Ser Asn Ala Lys Glu Thr

    1185                1190                1195

TTC AAC CCC CTG GTG GCC GCC TTC CCC AGC GTG AAC GTG AGC ATG GAG    2303

Phe Asn Pro Leu Val Ala Ala Phe Pro Ser Val Asn Val Ser Met Glu

1200                1205                1210                1215

AAG GTG ATC CTG AGC CCC AAC GAG AAC CTG AGC AAC AGC GTG GAG AGC    235l

Lys Val Ile Leu Ser Pro Asn Glu Asn Leu Ser Asn Ser Val Glu Ser

                1220                1225                1230

CAC TCG AGC ACC AAC TGG AGC TAC ACC AAC ACC GAG GGC GCC AGC GTG    2399

His Ser Ser Thr Asn Trp Ser Tyr Thr Asn Thr Glu Gly Ala Ser Val

            1235                1240                1245

GAG GCC GGC ATC GGT CCC AAG GGC ATC AGC TTC GGC GTG AGC GTG AAC    2447

Glu Ala Gly Ile Gly Pro Lys Gly Ile Ser Phe Gly Val Ser Val Asn

        1250                1255                1260

TAC CAG CAC AGC GAG ACC GTG GCC CAG GAG TGG GGC ACC AGC ACC GGC    2495

Tyr Gln His Ser Glu Thr Val Ala Gln Glu Trp Gly Thr Ser Thr Gly

    1265                1270                1275

AAC ACC AGC CAG TTC AAC ACC GCC AGC GCC GGC TAC CTG AAC GCC AAC    2543

Asn Thr Ser Gln Phe Asn Thr Ala Ser Ala Gly Tyr Leu Asn Ala Asn

1280                1285                1290                1295

GTG CGC TAC AAC AAC GTG GGC ACC GGC GCC ATC TAC GAC GTG AAG CCC    2591

Val Arg Tyr Asn Asn Val Gly Thr Gly Ala Ile Tyr Asp Val Lys Pro

                1300                1305                1310

ACC ACC AGC TTC GTG CTG AAC AAC GAC ACC ATC GCC ACC ATC ACC GCC    2639

Thr Thr Ser Phe Val Leu Asn Asn Asp Thr Ile Ala Thr Ile Thr Ala

            1315                1320                1325

AAG TCG AAT TCC ACC GCC CTG AAC ATC AGC CCC GGC GAG AGC TAC CCC    2687

Lys Ser Asn Ser Thr Ala Leu Asn Ile Ser Pro Gly Glu Ser Tyr Pro

        1330                1335                1340

AAG AAG GGC CAG AAC GGC ATC GCC ATC ACC AGC ATG GAC GAC TTC AAC    2735

Lys Lys Gly Gln Asn Gly Ile Ala Ile Thr Ser Met Asp Asp Phe Asn

1345                1350                1355

AGC CAC CCC ATC ACC CTG AAC AAG AAG CAG GTG GAC AAC CTG CTG AAC    2783

Ser His Pro Ile Thr Leu Asn Lys Lys Gln Val Asp Asn Leu Leu Asn

1360                1365                1370                1375

AAC AAG CCC ATG ATG CTG GAG ACC AAC CAG ACC GAC GGC GTC TAC AAG    2831

Asn Lys Pro Met Met Leu Glu Thr Asn Gln Thr Asp Gly Val Tyr Lys

                1380                1385                1390

ATC AAG GAC ACC CAC GGC AAC ATC GTG ACG GGC GGC GAG TGG AAC GGC    2879

Ile Lys Asp Thr His Gly Asn Ile Val Thr Gly Gly Glu Trp Asn Gly

            1395                1400                1405

GTG ATC CAG CAG ATC AAG GCC AAG ACC GCC AGC ATC ATC GTC GAC GAC    2927

Val Ile Gln Gln Ile Lys Ala Lys Thr Ala Ser Ile Ile Val Asp Asp

        1410                1415                1420

GGC GAG CGC GTG GCC GAG AAG CGC GTG GCC GCC AAG GAC TAC GAG AAC    2975

Gly Glu Arg Val Ala Glu Lys Arg Val Ala Ala Lys Asp Tyr Glu Asn

    1425                1430                1435

CCC GAG GAC AAG ACC CCC AGC CTG ACC CTG AAG GAC GCC CTG AAG CTG    3023

Pro Glu Asp Lys Thr Pro Ser Leu Thr Leu Lys Asp Ala Leu Lys Leu

1440                1445                1450                1455

AGC TAC CCC GAC GAG ATC AAG GAG ATC GAG GGC TTG CTG TAC TAC AAG    3071

Ser Tyr Pro Asp Glu Ile Lys Glu Ile Glu Gly Leu Leu Tyr Tyr Lys

                1460                1465                1470

AAC AAG CCC ATC TAC GAG AGC AGC GTG ATG ACC TAT CTA GAC GAG AAC    3119

Asn Lys Pro Ile Tyr Glu Ser Ser Val Met Thr Tyr Leu Asp Glu Asn

            1475                1480                1485

ACC GCC AAG GAG GTG ACC AAG CAG CTG AAC GAC ACC ACC GGC AAG TTC    3167

Thr Ala Lys Glu Val Thr Lys Gln Leu Asn Asp Thr Thr Gly Lys Phe

        1490                1495                1500

AAG GAC GTG AGC CAC CTG TAC GAC GTG AAG CTG ACC CCC AAG ATG AAC    3215

Lys Asp Val Ser His Leu Tyr Asp Val Lys Leu Thr Pro Lys Met Asn

    1505                1510                1515

GTG ACC ATC AAG CTG AGC ATC CTG TAC GAC AAC GCC CAG ACC AAC GAC    3263

Val Thr Ile Lys Leu Ser Ile Leu Tyr Asp Asn Ala Glu Ser Asn Asp

1520                1525                1530                1535

AAC AGC ATC GGC AAG TGG ACC AAC ACC AAC ATC GTG AGC GGC GGC AAC    3311

Asn Ser Ile Gly Lys Trp Thr Asn Thr Asn Ile Val Ser Gly Gly Asn

                1540                1545                1550

AAC GGC AAG AAG CAG TAC AGC AGC AAC AAC CCC GAC GCC AAC CTG ACC    3359

Asn Gly Lys Lys Gln Tyr Ser Ser Asn Asn Pro Asp Ala Asn Leu Thr

            1555                1560                1565

CTG AAC ACC GAC GCC CAG GAG AAG CTG AAC AAG AAC CGC GAC TAC TAC    3407

Leu Asn Thr Asp Ala Gln Glu Lys Leu Asn Lys Asn Arg Asp Tyr Tyr

        1570                1575                1580

ATC AGC CTG TAC ATG AAG AGC GAG AAG AAC ACC CAG TGC GAG ATC ACC    3455

Ile Ser Leu Tyr Met Lys Ser Glu Lys Asn Thr Gln Cys Glu Ile Thr

    1585                1590                1595

ATC GAC GGC GAG ATA TAC CCC ATC ACC ACC AAG ACC GTG AAC GTG AAC    3503

Ile Asp Gly Glu Ile Tyr Pro Ile Thr Thr Lys Thr Val Asn Val Asn

1600                1605                1610                1615

AAG GAC AAC TAC AAG CGC CTG GAC ATC ATC GCC CAC AAC ATC AAG AGC    3551

Lys Asp Asn Tyr Lys Arg Leu Asp Ile Ile Ala His Asn Ile Lys Ser

                1620                1625                1630

AAC CCC ATC AGC AGC CTG CAC ATC AAG ACC AAC GAC GAG ATC ACC CTG    3599

Asn Pro Ile Ser Ser Leu His Ile Lys Thr Asn Asp Glu Ile Thr Leu

            1635                1640                1645

TTC TGG GAC GAC ATA TCG ATT ACC GAC GTC GCC AGC ATC AAG CCC GAG    3647

Phe Trp Asp Asp Ile Ser Ile Thr Asp Val Ala Ser Ile Lys Pro Glu

        1650                1655                1660

AAC CTG ACC GAC AGC GAG ATC AAG CAG ATA TAC AGT CGC TAC GGC ATC    3695

Asn Leu Thr Asp Ser Glu Ile Lys GLn Ile Tyr Ser Arg Tyr Gly Ile

    1665                1670                1675

AAG CTG GAG GAC GGC ATC CTG ATC GAC AAG AAA GGC GGC ATC CAC TAC    3743

Lys Leu Glu Asp Gly Ile Leu Ile Asp Lys Lys Gly Gly Ile His Tyr

1680                1685                1690                1695

GGC GAG TTC ATC AAC GAG GCC AGC TTC AAC ATC GAG CCC CTG CAG AAC    3791

Gly Glu Phe Ile Asn Glu Ala Ser Phe Asn Ile Glu Pro Leu Gln Asn

                1700                1705                1710

TAC GTG ACC AAG TAC GAG GTG ACC TAC AGC AGC GAG CTG GGC CCC AAC    3839

Tyr Val Thr Lys Tyr Glu Val Thr Tyr Ser Ser Glu Leu Gly Pro Asn

            1715                1720                1725

GTG AGC GAC ACC CTG GAG AGC GAC AAG ATT TAC AAG GAC GGC ACC ATC    3887

Val Ser Asp Thr Leu Glu Ser Asp Lys Ile Tyr Lys Asp Gly Thr Ile

        1730                1735                1740

AAG TTC GAC TTC ACC AAG TAC AGC AAG AAC GAG CAG GGC CTG TTC TAC    3935

Lys Phe Asp Phe Thr Lys Tyr Ser Lys Asn Glu Gln Gly Leu Phe Tyr

    1745                1750                1755

GAC AGC GGC CTG AAC TGG GAC TTC AAG ATC AAC GCC ATC ACC TAC GAC    3983

Asp Ser Gly Leu Asn Trp Asp Phe Lys Ile Asn Ala Ile Thr Tyr Asp

1760                1765                1770                1775

GGC AAG GAG ATG AAC GTG TTC CAC CGC TAC AAC AAG TAGATCTGAG        4029

Gly Lys Glu Met Asn Val Phe His Arg Tyr Asn Lys

                1780                1785

CT                                                                4031

(2)SEQ ID NO:50信息:

  (i)序列特征:

    (A)长度:1338个氨基酸

    (B)类型:氨基酸

    (D)拓扑结构:线性

  (ii)分子类型:蛋白质

  (xi)序列描述:SEQ ID NO:50:

Met Lys Arg Met Glu Gly Lys Leu Phe Met Val Ser Lys Lys Leu Gln

  1               5                  10                  15

Val Val Thr Lys Thr Val Leu Leu Ser Thr Val Phe Ser Ile Ser Leu

             20                  25                  30

Leu Asn Asn Glu Val Ile Lys Ala Glu Gln Leu Asn Ile Asn Ser Gln

         35                  40                  45

Ser Lys Tyr Thr Asn Leu Gln Asn Leu Lys Ile Thr Asp Lys Val Glu

     50                  55                  60

Asp Phe Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys

 65                  70                  75                  80

Glu Lys Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn Asn

                 85                  90                  95

Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr

            100                 105                 110

Phe Ser Ile Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu

        115                 120                 125

Ile Asp Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile Thr

    130                 135                 140

Tyr Lys Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu Thr

145                 150                 155                 160

Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln

                165                 170                 175

Phe Leu Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu

            180                 185                 190

Thr Ala Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val Thr

        195                 200                 205

Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile

    210                 215                 220

Leu Asn Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Met Val

225                 230                 235                 240

His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Val Glu Cys Leu

                245                 250                 255

Gln Ile Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile

            260                 265                 270

Asn Ala Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp Ala

        275                 280                 285

Lys Asp Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg

    290                 295                 300

Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser

305                 310                 315                 320

Gly Asn Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala Leu

                325                 330                 335

Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly

            340                 345                 350

Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys

        355                 360                 365

Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr

    370                 375                 380

Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg

385                 390                 395                 400

Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr

                405                 410                 415

Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp

            420                 425                 430

Lys Asp Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile Lys

        435                 440                 445

Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn Ser Arg

    450                 455                 460

Gly Pro Ser Thr Pro Pro Thr Pro Ser Pro Ser Thr Pro Pro Thr Pro

465                 470                 475                 480

Ser Asp Ile Gly Ser Thr Met Lys Thr Asn Gln Ile Ser Thr Thr Gln

                485                 490                 495

Lys Asn Gln Gln Lys Glu Met Asp Arg Lys Gly Leu Leu Gly Tyr Tyr

            500                 505                 510

Phe Lys Gly Lys Asp Phe Ser Asn Leu Thr Met Phe Ala Pro Thr Arg

        515                 520                 525

Asp Ser Thr Leu Ile Tyr Asp Gln Gln Thr Ala Asn Lys Leu Leu Asp

    530                 535                 540

Lys Lys Gln Gln Glu Tyr Gln Ser Ile Arg Trp Ile Gly Leu Ile Gln

545                 550                 555                 560

Ser Lys Glu Thr Gly Asp Phe Thr Phe Asn Leu Ser Glu Asp Glu Gln

                565                 570                 575

Ala Ile Ile Glu Ile Asn Gly Lys Ile Ile Ser Asn Lys Gly Lys Glu

            580                 585                 590

Lys Gln Val Val His Leu Glu Lys Gly Lys Leu Val Pro Ile Lys Ile

        595                 600                 605

Glu Tyr Gln Ser Asp Thr Lys Phe Asn Ile Asp Ser Lys Thr Phe Lys

    610                 615                 620

Glu Leu Lys Leu Phe Lys Ile Asp Ser Gln Asn Gln Pro Gln Gln Val

625                 630                 635                 640

Gln Gln Asp Glu Leu Arg Asn Pro Glu Phe Asn Lys Lys Glu Ser Gln

                645                 650                 655

Glu Phe Leu Ala Lys Pro Ser Lys Ile Asn Leu Phe Thr Gln Gln Met

            660                 665                 670

Lys Arg Glu Ile Asp Glu Asp Thr Asp Thr Asp Gly Asp Ser Ile Pro

        675                 680                 685

Asp Leu Trp Glu Glu Asn Gly Tyr Thr Ile Gln Asn Arg Ile Ala Val

    690                 695                 700

Lys Trp Asp Asp Ser Leu Ala Ser Lys Gly Tyr Thr Lys Phe Val Ser

705                 710                 715                 720

Asn Pro Leu Glu Ser His Thr Val Gly Asp Pro Tyr Thr Asp Tyr Glu

                725                 730                 735

Lys Ala Ala Arg Asp Leu Asp Leu Ser Asn Ala Lys Glu Thr Phe Asn

            740                 745                 750

Pro Leu Val Ala Ala Phe Pro Ser Val Asn Val Ser Met Glu Lys Val

        755                 760                 765

Ile Leu Ser Pro Asn Glu Asn Leu Ser Asn Ser Val Glu Ser His Ser

    770                 775                 780

Ser Thr Asn Trp Ser Tyr Thr Asn Thr Glu Gly Ala Ser Val Glu Ala

785                 790                 795                 800

Gly Ile Gly Pro Lys Gly Ile Ser Phe Gly Val Ser Val Asn Tyr Gln

                805                 810                 815

His Ser Glu Thr Val Ala Gln Glu Trp Gly Thr Ser Thr Gly Asn Thr

            820                 825                 830

Ser Gln Phe Asn Thr Ala Ser Ala Gly Tyr Leu Asn Ala Asn Val Arg

        835                 840                 845

Tyr Asn Asn Val Gly Thr Gly Ala Ile Tyr Asp Val Lys Pro Thr Thr

    850                 855                 860

Ser Phe Val Leu Asn Asn Asp Thr Ile Ala Thr Ile Thr Ala Lys Ser

865                 870                 875                 880

Asn Ser Thr Ala Leu Asn Ile Ser Pro Gly Glu Ser Tyr Pro Lys Lys

                885                 890                 895

Gly Gln Asn Gly Ile Ala Ile Thr Ser Met Asp Asp Phe Asn Ser His

            900                 905                 910

Pro Ile Thr Leu Asn Lys Lys Gln Val Asp Asn Leu Leu Asn Asn Lys

        915                 920                 925

Pro Met Met Leu Glu Thr Asn Gln Thr Asp Gly Val Tyr Lys Ile Lys

    930                 935                 940

Asp Thr His Gly Asn Ile Val Thr Gly Gly Glu Trp Asn Gly Val Ile

945                 950                 955                 960

Gln Gln Ile Lys Ala Lys Thr Ala Ser Ile Ile Val Asp Asp Gly Glu

                965                 970                 975

Arg Val Ala Glu Lys Arg Val Ala Ala Lys Asp Tyr Glu Asn Pro Glu

            980                 985                 990

Asp Lys Thr Pro Ser Leu Thr Leu Lys Asp Ala Leu Lys Leu Ser Tyr

        995                 1000                1005

Pro Asp Glu Ile Lys Glu Ile Glu Gly Leu Leu Tyr Tyr Lys Asn Lys

    1010                1015                1020

Pro Ile Tyr Glu Ser Ser Val Met Thr Tyr Leu Asp Glu Asn Thr Ala

1025                1030                1035                1040

Lys Glu Val Thr Lys Gln Leu Asn Asp Thr Thr Gly Lys Phe Lys Asp

                1045                1050                1055

Val Ser His Leu Tyr Asp Val Lys Leu Thr Pro Lys Met Asn Val Thr

            1060                1065                1070

Ile Lys Leu Ser Ile Leu Tyr Asp Asn Ala Glu Ser Asn Asp Asn Ser

        1075                1080                1085

Ile Gly Lys Trp Thr Asn Thr Asn Ile Val Ser Gly Gly Asn Asn Gly

    1090                1095                1100

Lys Lys Gln Tyr Ser Ser Asn Asn Pro Asp Ala Asn Leu Thr Leu Asn

1105                1110                1115                1120

Thr Asp Ala Gln Glu Lys Leu Asn Lys Asn Arg Asp Tyr Tyr Ile Ser

                1125                1130                1135

Leu Tyr Met Lys Ser Glu Lys Asn Thr Gln Cys Glu Ile Thr Ile Asp

            1140                1145                1150

Gly Glu Ile Tyr Pro Ile Thr Thr Lys Thr Val Asn Val Asn Lys Asp

        1155                1160                1165

Asn Tyr Lys Arg Leu Asp Ile Ile Ala His Asn Ile Lys Ser Asn Pro

    1170                1175                1180

Ile Ser Ser Leu His Ile Lys Thr Asn Asp Glu Ile Thr Leu Phe Trp

1185                1190                1195                1200

Asp Asp Ile Ser Ile Thr Asp Val Ala Ser Ile Lys Pro Glu Asn Leu

                1205                1210                1215

Thr Asp Ser Glu Ile Lys Gln Ile Tyr Ser Arg Tyr Gly Ile Lys Leu

            1220                1225                1230

Glu Asp Gly Ile Leu Ile Asp Lys Lys Gly Gly Ile His Tyr Gly Glu

        1235                1240                1245

Phe Ile Asn Glu Ala Ser Phe Asn Ile Glu Pro Leu Gln Asn Tyr Val

    1250                1255                1260

Thr Lys Tyr Glu Val Thr Tyr Ser Ser Glu Leu Gly Pro Asn Val Ser

1265                1270                1275                1280

Asp Thr Leu Glu Ser Asp Lys Ile Tyr Lys Asp Gly Thr Ile Lys Phe

                1285                1290                1295

Asp Phe Thr Lys Tyr Ser Lys Asn Glu Gln Gly Leu Phe Tyr Asp Ser

            1300                1305                1310

Gly Leu Asn Trp Asp Phe Lys Ile Asn Ala Ile Thr Tyr Asp Gly Lys

        1315                1320                1325

Glu Met Asn Val Phe His Arg Tyr Asn Lys

    1330                1335

(2)SEQ ID NO:51信息:

  (i)序列特征:

    (A)长度:2444个碱基对

    (B)类型:核酸

    (C)链型:单链

    (D)拓扑结构:线性

  (ii)分子类型:DNA(基因组)

  (iii)假设:否

  (ix)特征:

    (A)名称/关键词:CDS

    (B)位置:17..2444

    (D)其它信息:/产物=″3A(a)合成:天然融合体″

 (xi)序列描述:SEQ ID NO:51:

GGATCCACCA ATGAAC ATG AAC AAG AAC AAC ACC AAG CTG AGC ACC CGC      49

                  Met Asn Lys Asn Asn Thr Lys Leu Ser Thr Arg

                    1               5                  10

GCC CTG CCG AGC TTC ATC GAC TAC TTC AAC GGC ATC TAC GGC TTC GCC     97

Ala Leu Pro Ser Phe Ile Asp Tyr Phe Asn Gly Ile Tyr Gly Phe Ala

             15                  20                  25

ACC GGC ATC AAG GAC ATC ATG AAC ATG ATC TTC AAG ACC GAC ACC GGC    145

Thr Gly Ile Lys Asp Ile Met Asn Met Ile Phe Lys Thr Asp Thr Gly

         30                  35                  40

GGC GAC CTG ACC CTG GAC GAG ATC CTG AAG AAC CAG CAG CTG CTG AAC    193

Gly Asp Leu Thr Leu Asp Glu Ile Leu Lys Asn Gln Gln Leu Leu Asn

     45                  50                  55

GAC ATC AGC GGC AAG CTG GAC GGC GTG AAC GGC AGC CTG AAC GAC CTG    241

Asp Ile Ser Gly Lys Leu Asp Gly Val Asn Gly Ser Leu Asn Asp Leu

60                   65                  70                  75

ATC GCC CAG GGC AAC CTG AAC ACC GAG CTG AGC AAG GAG ATC CTT AAG    289

Ile Ala Gln Gly Asn Leu Asn Thr Glu Leu Ser Lys Glu Ile Leu Lys

                 80                  85                  90

ATC GCC AAC GAG CAG AAC CAG GTG CTG AAC GAC GTG AAC AAC AAG CTG    337

Ile Ala Asn Glu Gln Asn Gln Val Leu Asn Asp Val Asn Asn Lys Leu

             95                 100                 105

GAC GCC ATC AAC ACC ATG CTG CGC GTG TAC CTG CCG AAG ATC ACC AGC    385

Asp Ala Ile Asn Thr Met Leu Arg Val Tyr Leu Pro Lys Ile Thr Ser

        110                 115                 120

ATG CTG AGC GAC GTG ATG AAG CAG AAC TAC GCC CTG AGC CTG CAG ATC    433

Met Leu Ser Asp Val Met Lys Gln Asn Tyr Ala Leu Ser Leu Gln Ile

    125                 130                 135

GAG TAC CTG AGC AAG CAG CTG CAG GAG ATC AGC GAC AAG CTG GAC ATC    481

Glu Tyr Leu Ser Lys Gln Leu Gln Glu Ile Ser Asp Lys Leu Asp Ile

140                 145                 150                 155

ATC AAC GTG AAC GTC CTG ATC AAC AGC ACC CTG ACC GAG ATC ACC CCG    529

Ile Asn Val Asn Val Leu Ile Asn Ser Thr Leu Thr Glu Ile Thr Pro

                160                 165                 170

GCC TAC CAG CGC ATC AAG TAC GTG AAC GAG AAG TTC GAA GAG CTG ACC    577

Ala Tyr Gln Arg Ile Lys Tyr Val Asn Glu Lys Phe Glu Glu Leu Thr

            175                 180                 185

TTC GCC ACC GAG ACC AGC AGC AAG GTG AAG AAG GAC GGC AGC CCG GCC    625

Phe Ala Thr Glu Thr Ser Ser Lys Val Lys Lys Asp Gly Ser Pro Ala

        190                 195                 200

GAC ATC CTG GAC GAG CTG ACC GAG CTG ACC GAG CTG GCC AAG AGC GTG    673

Asp Ile Leu Asp Glu Leu Thr Glu Leu Thr Glu Leu Ala Lys Ser Val

    205                 210                 215

ACC AAG AAC GAC GTG GAC GGC TTC GAG TTC TAC CTG AAC ACC TTC CAC    721

Thr Lys Asn Asp Val Asp Gly Phe Glu Phe Tyr Leu Asn Thr Phe His

220                 225                 230                 235

GAC GTG ATG GTG GGC AAC AAC CTG TTC GGC CGC AGC GCC CTG AAG ACC    769

Asp Val Met Val Gly Asn Asn Leu Phe Gly Arg Ser Ala Leu Lys Thr

                240                 245                 250

GCC AGC GAG CTG ATC ACC AAG GAG AAC GTG AAG ACC AGC GGC AGC GAG    817

Ala Ser Glu Leu Ile Thr Lys Glu Asn Val Lys Thr Ser Gly Ser Glu

            255                 260                 265

GTG GGC AAC GTG TAC AAC TTC CTG ATC GTG CTG ACC GCC CTG CAG GCC    865

Val Gly Asn Val Tyr Asn Phe Leu Ile Val Leu Thr Ala Leu Gln Ala

        270                 275                 280

CAG GCC TTC CTG ACC CTG ACC ACC TGT CGC AAG CTG CTG GGC CTG GCC    913

Gln Ala Phe Leu Thr Leu Thr Thr Cys Arg Lys Leu Leu Gly Leu Ala

    285                 290                 295

GAC ATC GAC TAC ACC AGC ATC ATG AAC GAG CAC TTG AAC AAG GAG AAG    961

Asp Ile Asp Tyr Thr Ser Ile Met Asn Glu His Leu Asn Lys Glu Lys

300                 305                 310                 315

GAG GAG TTC CGC GTG AAC ATC CTG CCG ACC CTG AGC AAC ACC TTC AGC    1009

Glu Glu Phe Arg Val Asn Ile Leu Pro Thr Leu Ser Asn Thr Phe Ser

                320                 325                 330

AAC CCG AAC TAC GCC AAG GTG AAG GGC AGC GAC GAG GAC GCC AAG ATG    1057

Asn Pro Asn Tyr Ala Lys Val Lys Gly Ser Asp Glu Asp Ala Lys Met

            335                 340                 345

ATC GTG GAG GCT AAG CCG GGC CAC GCG TTG ATC GGC TTC GAG ATC AGC    1105

Ile Val Glu Ala Lys Pro Gly His Ala Leu Ile Gly Phe Glu Ile Ser

        350                 355                 360

AAC GAC AGC ATC ACC GTG CTG AAG GTG TAC GAG GCC AAG CTG AAG CAG    1153

Asn Asp Ser Ile Thr Val Leu Lys Val Tyr Glu Ala Lys Leu Lys Gln

    365                 370                 375

AAC TAC CAG GTG GAC AAG GAC AGC TTG AGC GAG GTG ATC TAC GGC GAC    1201

Asn Tyr Gln Val Asp Lys Asp Ser Leu Ser Glu Val Ile Tyr Gly Asp

380                 385                 390                 395

ATG GAC AAG CTG CTG TGT CCG GAC CAG AGC GAG CAA ATC TAC TAC ACC    1249

Met Asp Lys Leu Leu Cys Pro Asp Gln Ser Glu Gln Ile Tyr Tyr Thr

            400                 405                 410

AAC AAC ATC GTG TTC CCG AAC GAG TAC GTG ATC ACC AAG ATC GAC TTC    1297

Asn Asn Ile Val Phe Pro Asn Glu Tyr Val Ile Thr Lys Ile Asp Phe

            415                 420                 425

ACC AAG AAG ATG AAG ACC CTG CGC TAC GAG GTG ACC GCC AAC TTC TAC    1345

Thr Lys Lys Met Lys Thr Leu Arg Tyr Glu Val Thr Ala Asn Phe Tyr

        430                 435                 440

GAC AGC AGC ACC GGC GAG ATC GAC CTG AAC AAG AAG AAG GTG GAG AGC    1393

Asp Ser Ser Thr Gly Glu Ile Asp Leu Asn Lys Lys Lys Val Glu Ser

    445                 450                 455

AGC GAG GCC GAG TAC CGC ACC CTG AGC GCG AAC GAC GAC GGC GTC TAC    1441

Ser Glu Ala Glu Tyr Arg Thr Leu Ser Ala Asn Asp Asp Gly Val Tyr

460                 465                 470                 475

ATG CCA CTG GGC GTG ATC AGC GAG ACC TTC CTG ACC CCG ATC AAC GGC    1489

Met Pro Leu Gly Val Ile Ser Glu Thr Phe Leu Thr Pro Ile Asn Gly

                480                 485                 490

TTT GGC CTG CAG GCC GAC GAG AAC AGC CGC CTG ATC ACC CTG ACC TGT    1537

Phe Gly Leu Gln Ala Asp Glu Asn Ser Arg Leu Ile Thr Leu Thr Cys

            495                 500                 505

AAG AGC TAC CTG CGC GAG CTG CTG CTA GCC ACC GAC CTG AGC AAC AAG    1585

Lys Ser Tyr Leu Arg Glu Leu Leu Leu Ala Thr Asp Leu Ser Asn Lys

        510                 515                 520

GAG ACC AAG CTG ATC GTG CCA CCG AGC GGC TTC ATC AGC AAC ATC GTG    1633

Glu Thr Lys Leu Ile Val Pro Pro Ser Gly Phe Ile Ser Asn Ile Val

    525                 530                 535

GAG AAC GGC AGC ATC GAG GAG GAC AAC CTG GAG CCG TGG AAG GCC AAC    1681

Glu Asn Gly Ser Ile Glu Glu Asp Asn Leu Glu Pro Trp Lys Ala Asn

540                 545                 550                 555

AAC AAG AAC GCC TAC GTG GAC CAC ACC GGC GGC GTG AAC GGC ACC AAG    1729

Asn Lys Asn Ala Tyr Val Asp His Thr Gly Gly Val Asn Gly Thr Lys

                560                 565                 570

GCC CTG TAC GTG CAC AAG GAC GGC GGC ATC AGC CAG TTC ATC GGC GAC    1777

Ala Leu Tyr Val His Lys Asp Gly Gly Ile Ser Gln Phe Ile Gly Asp

            575                 580                 585

AAG CTG AAG CCG AAG ACC GAG TAC GTG ATC CAG TAC ACC GTG AAG GGC    1825

Lys Leu Lys Pro Lys Thr Glu Tyr Val Ile Gln Tyr Thr Val Lys Gly

        590                 595                 600

AAG CCA TCG ATT CAC CTG AAG GAC GAG AAC ACC GGC TAC ATC CAC TAC    1873

Lys Pro Ser Ile His Leu Lys Asp Glu Asn Thr Gly Tyr Ile His Tyr

    605                 610                 615

GAG GAC ACC AAC AAC AAC CTG GAG GAC TAC CAG ACC ATC AAC AAG CGC    1921

Glu Asp Thr Asn Asn Asn Leu Glu Asp Tyr Gln Thr Ile Asn Lys Arg

620                 625                 630                 635

TTC ACC ACC GGC ACC GAC CTG AAG GGC GTG TAC CTG ATC CTG AAG AGC    1969

Phe Thr Thr Gly Thr Asp Leu Lys Gly Val Tyr Leu Ile Leu Lys Ser

                640                 645                 650

CAG AAC GGC GAC GAG GCC TGG GGC GAC AAC TTC ATC ATC CTG GAG ATC    2017

Gln Asn Gly Asp Glu Ala Trp Gly Asp Asn Phe Ile Ile Leu Glu Ile

           655                 660                 665

AGC CCG AGC GAG AAG CTG CTG AGC CCG GAG CTG ATC AAC ACC AAC AAC    2065

Ser Pro Ser Glu Lys Leu Leu Ser Pro Glu Leu Ile Asn Thr Asn Asn

        670                 675                 680

TGG ACC AGC ACC GGC AGC ACC AAC ATC AGC GGC AAC ACC CTG ACC CTG    2113

Trp Thr Ser Thr Gly Ser Thr Asn Ile Ser Gly Asn Thr Leu Thr Leu

    685                 690                 695

TAC CAG GGC GGC CGG GGG ATT CTA AAA CAA AAC CTT CAA TTA GAT AGT    2161

Tyr Gln Gly Gly Arg Gly Ile Leu Lys Gln Asn Leu Gln Leu Asp Ser

700                 705                 710                 715

TTT TCA ACT TAT AGA GTG TAT TTT TCT GTG TCC GGA GAT GCT AAT GTA    2209

Phe Ser Thr Tyr Arg Val Tyr Phe Ser Val Ser Gly Asp Ala Asn Val

                720                 725                 730

AGG ATT AGA AAT TCT AGG GAA GTG TTA TTT GAA AAA AGA TAT ATG AGC    2257

Arg Ile Arg Asn Ser Arg Glu Val Leu Phe Glu Lys Arg Tyr Met Ser

            735                 740                 745

GGT GCT AAA GAT GTT TCT GAA ATG TTC ACT ACA AAA TTT GAG AAA GAT    2305

Gly Ala Lys Asp Val Ser Glu Met Phe Thr Thr Lys Phe Glu Lys Asp

        750                 755                 760

AAC TTT TAT ATA GAG CTT TCT CAA GGG AAT AAT TTA TAT GGT GGT CCT    2353

Asn Phe Tyr Ile Glu Leu Ser Gln Gly Asn Asn Leu Tyr Gly Gly Pro

    765                 770                 775

ATT GTA CAT TTT TAC GAT GTC TCT ATT AAG NAA GAT CGG GAT CTA ATA    2401

Ile Val His Phe Tyr Asp Val Ser Ile Lys Xaa Asp Arg Asp Leu Ile

780                 785                 790                 795

TTA ACA GTT TTT AAA AGC NAA TTC TTG TAT AAT GTC CTT GAT  T         2444

Leu Thr Val Phe Lys Ser Xaa Phe Leu Tyr Asn Val Leu Asp

                800                 805

(2)SEQ ID NO:52信息:

  (i)序列特征:

    (A)长度:809个氨基酸

    (B)类型:氨基酸

    (D)拓扑结构:线性

  (ii)分子类型:蛋白质

  (xi)序列描述:SEQ ID NO:52:

Met Asn Lys Asn Asn Thr Lys Leu Ser Thr Arg Ala Leu Pro Ser Phe

  1               5                  10                  15

Ile Asp Tyr Phe Asn Gly Ile Tyr Gly Phe Ala Thr Gly Ile Lys Asp

             20                  25                  30

Ile Met Asn Met Ile Phe Lys Thr Asp Thr Gly Gly Asp Leu Thr Leu

         35                  40                  45

Asp Glu Ile Leu Lys Asn Gln Gln Leu Leu Asn Asp Ile Ser Gly Lys

     50                  55                  60

Leu Asp Gly Val Asn Gly Ser Leu Asn Asp Leu Ile Ala Gln Gly Asn

 65                  70                  75                  80

Leu Asn Thr Glu Leu Ser Lys Glu Ile Leu Lys Ile Ala Asn Glu Gln

                 85                  90                  95

Asn Gln Val Leu Asn Asp Val Asn Asn Lys Leu Asp Ala Ile Asn Thr

            100                 105                 110

Met Leu Arg Val Tyr Leu Pro Lys Ile Thr Ser Met Leu Ser Asp Val

        115                 120                 125

Met Lys Gln Asn Tyr Ala Leu ser Leu Gln Ile Glu Tyr Leu ser Lys

    130                 135                 140

Gln Leu Gln Glu Ile Ser Asp Lys Leu Asp Ile Ile Asn Val Asn Val

145                 150                 155                 160

Leu Ile Asn Ser Thr Leu Thr Glu Ile Thr Pro Ala Tyr Gln Ar9 Ile

                165                 170                 175

Lys Tyr Val Asn Glu Lys Phe Glu Glu Leu Thr Phe Ala Thr Glu Thr

           180                 185                 190

Ser Ser Lys Val Lys Lys Asp Gly Ser Pro Ala Asp Ile Leu Asp Glu

        195                 200                 205

Leu Thr Glu Leu Thr Glu Leu Ala Lys Ser Val Thr Lys Asn Asp Val

    210                 215                 220

Asp Gly Phe Glu Phe Tyr Leu Asn Thr Phe His Asp Val Met Val Gly

225                 230                 235                 240

Asn Asn Leu Phe Gly Arg Ser Ala Leu Lys Thr Ala Ser Glu Leu Ile

                245                 250                 255

Thr Lys Glu Asn Val Lys Thr Ser Gly Ser Glu Val Gly Asn Val Tyr

            260                 265                 270

Asn Phe Leu Ile Val Leu Thr Ala Leu Gln Ala Gln Ala Phe Leu Thr

        275                 280                 285

Leu Thr Thr Cys Arg Lys Leu Leu Gly Leu Ala Asp Ile Asp Tyr Thr

    290                 295                 300

Ser Ile Met Asn Glu His Leu Asn Lys Glu Lys Glu Glu Phe Arg Val

305                 310                 315                 320

Asn Ile Leu Pro Thr Leu Ser Asn Thr Phe Ser Asn Pro Asn Tyr Ala

                325                 330                 335

Lys Val Lys Gly Ser Asp Glu Asp Ala Lys Met Ile Val Glu Ala Lys

            340                 345                 350

Pro Gly His Ala Leu Ile Gly Phe Glu Ile Ser Asn Asp Ser Ile Thr

        355                 360                 365

Val Leu Lys Val Tyr Glu Ala Lys Leu Lys Gln Asn Tyr Gln Val Asp

    370                 375                 380

Lys Asp Ser Leu Ser Glu Val Ile Tyr Gly Asp Met Asp Lys Leu Leu

385                 390                 395                 400

Cys Pro Asp Gln Ser Glu Gln Ile Tyr Tyr Thr Asn Asn Ile Val Phe

                405                 410                 415

Pro Asn Glu Tyr Val Ile Thr Lys Ile Asp Phe Thr Lys Lys Met Lys

            420                 425                 430

Thr Leu Arg Tyr Glu Val Thr Ala Asn Phe Tyr Asp Ser Ser Thr Gly

        435                 440                 445

Glu Ile Asp Leu Asn Lys Lys Lys Val Glu Ser Ser Glu Ala Glu Tyr

    450                 455                 460

Arg Thr Leu Ser Ala Asn Asp Asp Gly Val Tyr Met Pro Leu Gly Val

465                 470                 475                 480

Ile Ser Glu Thr Phe Leu Thr Pro Ile Asn Gly Phe Gly Leu Gln Ala

                485                 490                 495

Asp Glu Asn Ser Arg Leu Ile Thr Leu Thr Cys Lys Ser Tyr Leu Arg

            500                 505                 510

Glu Leu Leu Leu Ala Thr Asp Leu Ser Asn Lys Glu Thr Lys Leu Ile

        515                 520                 525

Val Pro Pro Ser Gly Phe Ile Ser Asn Ile Val Glu Asn Gly Ser Ile

    530                 535                 540

Glu Glu Asp Asn Leu Glu Pro Trp Lys Ala Asn Asn Lys Asn Ala Tyr

545                 550                 555                 560

Val Asp His Thr Gly Gly Val Asn Gly Thr Lys Ala Leu Tyr Val His

                565                 570                 575

Lys Asp Gly Gly Ile Ser Gln Phe Ile Gly Asp Lys Leu Lys Pro Lys

            580                 585                 590

Thr Glu Tyr Val Ile Gln Tyr Thr Val Lys Gly Lys Pro Ser Ile His

        595                 600                 605

Leu Lys Asp Glu Asn Thr Gly Tyr Ile His Tyr Glu Asp Thr Asn Asn

    610                 615                 620

Asn Leu Glu Asp Tyr Gln Thr Ile Asn Lys Arg Phe Thr Thr Gly Thr

625                 630                 635                 640

Asp Leu Lys Gly Val Tyr Leu Ile Leu Lys Ser Gln Asn Gly Asp Glu

                645                 650                 655

Ala Trp Gly Asp Asn Phe Ile Ile Leu Glu Ile Ser Pro Ser Glu Lys

            660                 665                 670

Leu Leu Ser Pro Glu Leu Ile Asn Thr Asn Asn Trp Thr Ser Thr Gly

        675                 680                 685

Ser Thr Asn Ile Ser Gly Asn Thr Leu Thr Leu Tyr Gln Gly Gly Arg

    690                 695                 700

Gly Ile Leu Lys Gln Asn Leu Gln Leu Asp Ser Phe Ser Thr Tyr Arg

705                 710                 715                 720

Val Tyr Phe Ser Val Ser Gly Asp Ala Asn Val Arg Ile Arg Asn ser

                725                 730                 735

Arg Glu Val Leu Phe Glu Lys Arg Tyr Met Ser Gly Ala Lys Asp Val

            740                 745                 750

Ser Glu Met Phe Thr Thr Lys Phe Glu Lys Asp Asn Phe Tyr Ile Glu

    755                 760                 765

Leu Ser Gln Gly Asn Asn Leu Tyr Gly Gly Pro Ile Val His Phe Tyr

    770                 775                 780

Asp Val Ser Ile Lys Xaa Asp Arg Asp Leu Ile Leu Thr Val Phe Lys

785                 790                 795                 800

Ser Xaa Phe Leu Tyr Asn Val Leu Asp

                805

QQ群二维码
意见反馈