新杀虫蛋白质和菌株 |
|||||||
申请号 | CN95195349.4 | 申请日 | 1995-09-27 | 公开(公告)号 | CN1255539C | 公开(公告)日 | 2006-05-10 |
申请人 | 辛根塔参与股份公司; | 发明人 | G·W·沃伦; M·G·科泽尔; M·A·默林斯; G·J·奈; B·卡尔; N·M·德塞; K·科斯蒂克卡; N·B·达克; J·J·埃斯特鲁克; | ||||
摘要 | 本 发明 涉及杀虫菌株和 蛋白质 。本发明提供了能够在营养生长期间产生杀虫蛋白质和辅助蛋白质的芽孢杆菌属菌株。本发明也提供了纯化的蛋白质,编码这些蛋白质的核苷酸序列以及使用这些菌株、蛋白质和基因防治 害虫 的方法。 | ||||||
权利要求 | 1.一种含有编码营养性杀虫蛋白质的核苷酸序列之分离的DNA分 子,所述蛋白质在芽孢杆菌营养生长期分泌,其中所述核苷酸序列具有 与SEQ ID NO:28或SEQ ID NO:31所示的核苷酸序列至少98%的同一 性。 |
||||||
说明书全文 | 本发明涉及控制植物和非植物害虫的方法和组合物。本发明特别提供了 从芽孢杆菌属的营养生长阶段分离到的新杀虫蛋白质。本发明还提供了芽 孢杆菌菌株、蛋白质、以及编码这些蛋白质的基因。本发明的方法和组合 物可以用于控制植物和非植物害虫的各种系统。虫害在世界重要的商业性农作物损失中是一个主要因素。广谱性化学杀 虫剂被广泛用于控制或根除农业重要性害虫。然而,研制有效的替代杀虫 剂有实质性的利益。 微生物杀虫剂在替代化学虫害控制中起着重要的作用。最广泛使用的微 生物产品基于细菌苏云金芽孢杆菌(Bt)。Bt是革兰氏阳性孢子形式,它在 孢子形成期产生一种杀虫结晶蛋白质(ICP)。 已知的多种Bt产生超过25种不同但相关的ICP。由Bt制造的多数ICP对 鳞翅目、双翅目和鞘翅目中的一些昆虫的幼虫有毒。通常,当ICP被敏感昆 虫摄食后,晶体溶解并被昆虫肠蛋白质酶转化为毒性成分。没有一个对鞘翅 目幼虫如土豆甲虫(Leptinotarsa decemlineata)或大黄粉虫(Tenebrio molitor) 有活性的ICP′s对Diabrotica属的成员特别是玉米根叶甲(Diabrotica virgifera virgifera,WCRW)或长角叶甲(Diabrotica longicornis barberi) 有明显的效果。 蜡状芽孢杆菌(Bc)与Bt关系密切。一个主要的区别特征是在Bc中缺 乏伴孢晶体。Bc是一种广泛分布的细菌,在土壤中大量存在,并已从许多 食品和药物中分离出来。这种有机体与食品变质有关。 虽然Bt曾在控制虫害中十分有用,但有需要增加潜在的生物防治剂的数 量。 本发明提供了用于控制植物害虫的组合物和方法。尤其是提供了在芽孢 杆菌菌株的营养生长期间产生的新杀虫蛋白质。这些蛋白质可用作杀虫剂。 本发明还特别涉及实质上纯化的芽孢杆菌菌株,该菌株在营养生长期间 产生杀虫蛋白质,其中所说的芽孢杆菌不是球形芽孢杆菌SSII-I。优选地是 保藏号为NRRL B-21058的蜡状芽孢杆菌菌株和保藏号为NRRL B-21060的 苏云金芽孢杆菌菌株。优选的还有选自保藏号为NRRL B-21224,NRRL B-21225,NRRL B-21226,NRRL B-21227,NRRL B-21228,NRRL B- 21229,NRRL B-21230和NRRL B-21439的芽孢杆菌菌株。 本发明还涉及可在芽孢杆菌属的几个种(Bacillus spp)的营养生长期间 分离到的昆虫特异性蛋白质,但是优选的是苏云金芽孢杆菌和蜡状芽孢杆菌 菌株的昆虫特异性蛋白质以及它们的组分,其中所说的蛋白质不是得自球形 芽孢杆菌SSII-I的杀蚊毒素。本发明的昆虫特异性蛋白质对鞘翅目或鳞翅目 昆虫毒性更高,其分子量大约为30kDa或更大,优选的大约为100kDa,更 优的大约为80kDa。 更特别地,本发明的昆虫特异性蛋白质杀虫活性谱包括针对地老虎属和/ 或灰翅夜蛾属的种类,但是优选的是针对小地老虎[Agrotis ipsilon,BCW] 和/或草地贪夜蛾[Spodoptera frugiperda]和/或甜菜夜蛾[Spodoptera exigua] 和/或烟芽夜蛾和/或玉米夜蛾[Helicoverpa tea]的活性。 优选地,本发明的昆虫特异性蛋白质可被分离,例如,从保藏号为No. NRRL B-21058的蜡状芽孢杆菌或从保藏号为NRRL B-21060的苏云金芽孢 杆菌中分离。 优选地,本发明的昆虫特异性蛋白质也能从保藏号为NRRL B-21224, NRRL B-21225,NRRL B-21226,NRRL B-21227,NRRL B-21228,NRRL B-21229,NRRL B-21230和NRRL B-21439的芽孢杆菌属几个种的菌株分 离。 本发明尤其包括氨基酸序列选自SEQ ID NO:5和SEQ ID NO:7的昆虫 特异性蛋白质,包括任何在结构上和/或功能上与其同源的蛋白质。 也优选的是这样的昆虫特异性蛋白质,其中所说的蛋白质具有选自SEQ ID NO:20,SEQ ID NO:21,SEQ ID NO:29,SEQ ID NO:32和SEQ ID NO:2的序列,此外还包括任何在结构上和/或功能上与其同源的蛋白 质。 特别优选的是这样的昆虫特异性蛋白质,其中所说的蛋白质具有选自 SEQ ID NO:29和SEQ ID NO:32的序列,此外还包括任何在结构上和/ 或功能上与其同源的蛋白质。 本发明进一步优选的实施方案包括本发明的昆虫特异性蛋白质,其中代 表分泌信号的序列被除去或灭活。 本发明还包括辅助蛋白质,这种辅助蛋白质提高昆虫特异性蛋白质的昆 虫特异性活性。这些辅助蛋白质优选的具有大约50kDa的分子量,并且能被 分离,例如从蜡状芽孢杆菌菌株尤其是蜡状芽孢杆菌菌株AB78的营养生长 期分离。 本发明优选的实施方案涉及一种辅助蛋白质,其中代表分泌信号的序列 被除去或灭活。 本发明还涉及多亚基杀虫蛋白质,这种蛋白质包含一种以上的多肽链, 其中至少一种多肽链代表本发明的昆虫特异性蛋白质,至少一种多肽链代表 本发明的辅助蛋白质,这种辅助蛋白质激活或增强上述昆虫特异性蛋白质的 杀虫活性。 按照本发明优选的多亚基杀虫蛋白质的分子量大约为50kDa到 200kDa。 本发明尤其包括多亚基杀虫蛋白质,它包含按照本发明的昆虫特异蛋白 质和辅助蛋白质,这种辅助蛋白质能激活或增强所说昆虫特异性蛋白质的杀 虫活性。 本发明还涉及由几个蛋白质结构域组成的融合蛋白,其中蛋白质结构 域包含至少一种本发明的昆虫特异性蛋白质和/或按照本发明的辅助蛋白 质,这种融合蛋白由符合读框的基因融合产生,当由核糖体翻译时,产生融 合蛋白,这种融合蛋白至少具有本发明的昆虫特异性蛋白质和/或按照本发 明辅助蛋白质以及用于融合的其它可有可无的组分的组合的特性。 本发明的一个特定实施方案涉及包含核糖核酸酶S-蛋白质、本发明的昆 虫特异性蛋白质和按照本发明辅助蛋白质的融合蛋白。 本发明的另一个实施方案涉及按照本发明的昆虫特异性蛋白质和按照本 发明辅助蛋白质组成的融合蛋白,其中在该融合蛋白的N-端或者是昆虫特异 性蛋白质或者是辅助蛋白质。 优选的是这样一种融合蛋白,该蛋白质包含形成的SEO ID NO:23给出 的蛋白质的SEQ ID NO:5给出的昆虫特异性蛋白质和SEQ ID NO:2给出 的辅助蛋白质,此外还包括在结构上和/或功能上与其同源的蛋白质。 优选的是这样一种融合蛋白,该蛋白质包含形成SEQ ID NO:50中给出 的蛋白质的SEQ ID NO:35给出的昆虫特异性蛋白质和SEQ ID NO:27给 出的辅助蛋白质,此外还包括在结构上和/或功能上与其同源的蛋白质。 本发明还涉及这样的融合蛋白,该蛋白质包含融合成信号序列的本发明 昆虫特异性蛋白质和/或按照本发明的辅助蛋白质。优选的是分泌信号序列 或导向序列,它指导转基因产物到特定的细胞器或细胞区室,对受体蛋白质 来说,所述信号序列是异源源。 本发明内特别优选的是这样一种融合蛋白质,其中该蛋白质具有SEQ ID NO:43或SEQ ID NO:46给出的序列,此外还包括在结构上和/或功能上与 其同源的蛋白质。 本申请所用的实质上序列同源性指在氨基酸序列间的结构关系相近。例 如,实质上的同源性可以是40%同源,优选地是50%,更优选的是60%或 80%或更多。同源也包含这样一种关系,其中一个或几个几个氨基酸的子序 列(subsequences)缺失,或其它氨基酸的子序列被分散开(interdispersed)。 本发明的另一个方面还涉及这样的DNA分子,该分子包含编码可在芽孢 杆菌属几个种的营养生长期间分离到的昆虫特异性蛋白质及其组分的核苷 酸序列,其中所说的蛋白质不是得自球形芽孢杆菌SSII-1的杀蚊毒素。本发 明尤其涉及这样的DNA分子,其包含编码昆虫特异性蛋白质的核苷酸序 列,其中杀虫活性谱包含针对地老虎属和/或灰翅夜蛾属种类的活性,但优 选的是针对小地老虎[Agrotis ipsilon,BCW]和/或草地贪夜蛾[Spodoptera frugiperda]和/或甜菜夜蛾[Spodoptera exigua]和/或烟芽夜蛾和/或玉米夜 蛾[Helicoverpa tea]活性。 优选的是这样的DNA分子,其中该分子包含SEQ ID NO:4或SEQ ID NO:6给出的核苷酸序列,此外还包括任何在结构上和/或功能上与其同源 的DNA分子。 优选的是这样的DNA分子,其中该分子包含SEQ ID NO:19,SEQ ID NO:28,SEQ ID NO:31或SEQ ID NO:1给出的核苷酸序列,此外还包 括任何在结构上和/或功能上与其同源的DNA分子。 本发明还涉及这样的DNA分子,它包含编码按照本发明之辅助蛋白质的 核苷酸序列,这种辅助蛋白质能增强昆虫特异性蛋白质的昆虫特异性活性。 优选的是这样的DNA分子,其中该分子包含SEQ ID NO:19给出的核苷 酸序列,此外还包括任何在结构上和/或功能上与其同源的DNA分子。 本发明的实施方案还涉及这样的DNA分子,该分子包含编码可在芽孢杆 菌属几个种的营养生长期间分离到的昆虫特异性蛋白质及其组分的核苷酸 序列,其中所说的蛋白质不是得自球形芽孢杆菌SSII-1的杀蚊毒素。这些核 苷酸序列被最优化以适于在微生物或植物中表达。 优选的是这样的DNA分子,其中该分子包含SEQ ID NO:17或SEQ ID NO:18给出的核苷酸序列,此外还包括任何在结构上和/或功能上与其同源 的DNA分子。 也优选的是这样的DNA分子,其中该分子包含SEQ ID NO:24,SEQ ID NO:26,SEQ ID NO:27或SEQ ID NO:30给出的核苷酸序列,此外还包 括任何在结构上和/或功能上与其同源的DNA分子。 本发明还涉及这样的DNA分子,该分子包含编码多亚基杀虫蛋白质的核 苷酸序列,这种多亚基杀虫蛋白质包含一个以上的多肽链,其中上述的多肽 链中至少一条代表本发明的昆虫特异性蛋白质,而且至少一条代表按照本发 明的辅助蛋白质,这种辅助蛋白质激活或增强上述的昆虫特异性蛋白质的杀 虫活性。 优选的是这样的DNA分子,该分子包含编码本发明的昆虫特异性蛋白质 和按照本发明的辅助蛋白质的核苷酸序列,其中辅助蛋白质激活或增强上述 的昆虫特异性蛋白质的杀虫活性。 特别优选的是这样的DNA分子,其中该分子包含SEQ ID NO:1或SEQ ID NO:19给出的核苷酸序列,此外还包括任何在结构上和/或功能上与其同 源的DNA分子。本发明的另一个实施方案涉及这样的DNA分子,该分子包 含编码融合蛋白的核苷酸序列,这种融合蛋白由几个蛋白质结构域组成,包 含至少一种本发明的昆虫特异性蛋白质和/或按照本发明的辅助蛋白质,它 由符合读框基因融合产生,当由核糖体翻译时,产生融合蛋白,这种融合蛋 白至少具有本发明的昆虫特异性蛋白质和/或按照本发明辅助蛋白质以及在 融合使用的其它可有可无的组分的组合的特性。 本发明内优选的是这样的DNA分子,该分子包含编码融合蛋白的核苷酸 序列,这种融合蛋白由几个蛋白质结构域组成,包含至少一种本发明的昆虫 特异性蛋白质和/或按照本发明的辅助蛋白质,在该融合蛋白的N-端是昆虫 特异性蛋白质或辅助蛋白质。特别优选的是这样的DNA分子,其中该分子 包含SEQ ID NO:22给出的核苷酸序列,此外还包括任何在结构上和/或功 能上与其同源的DNA分子。 本发明还涉及这样的DNA分子,该分子包含编码融合蛋白的核苷酸序列 和信号序列,优选的是分泌信号序列或导向序列,其中融合蛋白包含本发明 的昆虫特异性蛋白质和/或本发明的辅助蛋白质,导向序列指导转基因产物 到特定的细胞器或细胞区室,这个信号序列对受体DNA来说是异源源。 本发明还包括DNA分子,它包含编码按照本发明融合蛋白或多亚基蛋白 质的核苷酸序列,这种序列被最优化以适于在微生物或植物中表达。 优选的的是最优化的DNA分子,其中该分子包含SEQ ID NO:42,SEQ ID NO:45或SEQ ID NO:49给出的核苷酸序列,此外还包括任何在结构 上和/或功能上与其同源的DNA分子。 本发明还涉及这样的最优化的DNA分子,其中编码分泌信号的序列从5′ 端除去,但尤其涉及这样的最优化的DNA分子,其中该分子包含SEQ ID NO:35或SEQ ID NO:39给出的核苷酸序列,此外还包括任何在结构上和 /或功能上与其同源的DNA分子。 本申请所用的实质上序列同源性指在核苷酸序列间的结构关系相近。例 如,实质上的同源的DNA分子可能是60%同源,优选地是80%,更优选的 是90%或95%或更多的同源。同源也包括这样一种关系,其中一个或几个 核苷酸或氨基酸的子序列缺失,或者有附加核苷酸或氨基酸的子序列被分散 开。 也包括在本发明中的是能和按照本发明上文限定的DNA分子杂交的的 DNA分子,但优选的是能和所说的DNA分子获得的寡核苷酸探针杂交的 DNA分子,探针包含为上述的昆虫特异性蛋白质编码的序列邻接序列,其 长度为10个核苷酸,杂交在适当严格的条件下进行。这种DNA分子具有昆 虫特异性活性,昆虫特异性蛋白质也由该DNA分子编码。 优选的是这样的DNA分子,其中杂交发生在65℃下包含7%SDS和0.5M 磷酸钠的缓冲液中。 尤其优选的是这样的DNA分子,该分子包含编码按照本发明的昆虫特异 性蛋白质的核苷酸序列,它可通过以下方法获得: (a)获得包含编码昆虫特异性蛋白质的核苷酸序列的DNA分子; (b)用按照权利要求107的寡核苷酸探针与所说DNA分子杂交,探针从包 含SEQ ID NO:28,SEQ ID NO:30,或SEQ ID NO:31给出的核苷酸序 列的DNA分子获得; (c)分离该杂交DNA。 本发明还涉及昆虫特异性蛋白质,其中所说的蛋白质由按照本发明的 DNA分子编码。 也包括在本发明中的是表达盒,该表达盒包含可操作连接到表达序列上 的按照本发明的DNA分子和可有可无的调节序列。其中表达序列包含结合 DNA构建体在宿主有机体(优选的是微生物和植物)中表达所必需的转录 和翻译调节信号。 本发明还涉及载体分子,该载体分子包含按照本发明的表达盒。 按照本发明的表达盒和/或载体分子优选的是植物基因组的一部分。 本发明的另一个实施方案还涉及宿主有机体,优选的是选自植物和昆虫 细胞,细菌,酵母,杆状病毒,原生动物,线虫和藻类的有机体,该有机体 包含按照本发明的DNA分子、含有该DNA分子的表达盒或含有该表达盒的 载体分子,优选的是稳定掺入宿主有机体基因组的分子。 本发明还涉及转基因植物,但优选的是包括植物体部分及其后代和种子 在内的玉米植株,该植物包含按照本发明的DNA分子、含有该DNA分子的 表达盒或含有该表达盒的载体分子,优选的是稳定掺入宿主有机体基因组的 分子。 优选的是包括植物体部分及其后代和种子再内的转基因植物,该植物可 以用按照本发明的DNA分子、含有该DNA分子的表达盒或含有该表达盒的 载体分子稳定地转化。 也优选的是包括植物体部分及其后代和种子在内的转基因植物,该植物 能够表达按照本发明的昆虫特异性蛋白质。 本发明还涉及这样的转基因植物,优选的是玉米植株,按照本发明在上 文中的定义,这种植物还表达第二种不同的昆虫防治素,但优选的是Btδ- 内源毒素,该植物优选的是杂种植物。 在本发明的范围内,转基因植物的部分可理解为包括植物细胞,原生质 体,组织,胼胝体,胚胎以及花,茎,果实,叶,根。这些部分起源于预先 用按照本发明的DNA分子转化的转基因植物或他们的后代,因而至少包含 转基因细胞的一部分,它们也是本发明的目的。 本发明还涉及按照本发明的植物繁殖材料,该材料用种子保护剂包衣处 理过。 本发明还包括用按照本发明的DNA分子、含有该DNA分子的表达盒或含 有该表达盒的载体分子转化的微生物,其中该微生物优选地在植物中繁殖, 更优选的是根定居性细菌。 本发明的另一个实施方案涉及胶囊化的昆虫特异性蛋白质,该蛋白质包 含含有按照本发明的昆虫特异性蛋白质的微生物。 本发明也涉及一种杀虫组合物,该组合物包含有效杀虫量的本发明的宿 主有机体,但优选的是纯化芽孢杆菌菌株以及适当的载体。 也包括在本发明中的是杀虫组合物,该组合物包含有效杀虫量的单独的 或与本发明的宿主有机体和/或按照本发明的胶囊化昆虫特异性蛋白质组合 的按照本发明的分离的蛋白质分子以及适当的载体。 本发明的另一个实施方案包括获得按照本发明的纯化蛋白质的方法,该 方法包括把包含上述的昆虫特异性蛋白质的溶液加入到NAD柱,并洗脱组 合的(bound)蛋白质。 也包括在本发明的是一种用于鉴别按照本发明的昆虫特异性蛋白质的杀 虫活性的方法,该方法包括: 在培养基上培养芽孢杆菌菌株; 从所述培养基获得上清液; 用所述上清液饲喂昆虫幼虫; 测定死亡率。 本发明的另一个方面涉及分离按照本发明的昆虫特异性蛋白质的杀虫活 性的方法,该方法包括: 在培养基上培养芽孢杆菌菌株; 从所述培养基获得上清液; 从述民上清液分离上述的昆虫特异性蛋白质。 本发明也包括一种用于分离编码表现出按照本发明的蛋白质的杀虫活性 的昆虫特异性蛋白质的DNA分子,该方法包括: 获得包含编码昆虫特异性蛋白质的核苷酸序列的DNA分子; 用从芽孢杆菌属微生物获得的DNA分子与上述DNA分子杂交; 分离该杂种DNA。 本发明还涉及增加昆虫靶范围的方法,该方法通过使用与至少一种不同 于按照本发明的昆虫特异性蛋白质的杀虫蛋白质组合(但最好与选自Btδ- 内毒素,蛋白质酶抑制因子,外源凝集素,α-淀粉酶和过氧化物酶的杀虫 蛋白质组合)的按照本发明的昆虫特异性蛋白质。 优选的是在植物体内增加昆虫靶范围的方法,该方法通过将按照本发明 的昆虫特异性蛋白质与至少一种不同于按照本发明的昆虫特异性蛋白质的 杀虫蛋白质一起(但最好与选自Btδ-内毒素,蛋白质酶抑制因子,外源凝 集素,α-淀粉酶和过氧化物酶的杀虫蛋白质一起)在所说的植物体内表达。 也包括在本发明的是保护植物使之免受由虫害造成的破坏的方法,但是 优选是由灰翅夜蛾属和/或地老虎属种类造成的损坏,更优选的是选自小地 老虎[Agrotis ipsilon,BCW],草地贪夜蛾[Spodoptera frugiperda],甜菜夜 蛾[Spodoptera exigua],烟芽夜蛾,玉米夜蛾[Helicoverpa tea]的虫害造成的 损坏,这种方法包括对植物或该植物的生长区域施用按照本发明的杀虫组合 物或毒素蛋白质。 本发明还涉及保护植物使之免受由虫害造成的损坏的方法,但是优选是 由灰翅夜蛾属和/或地老虎属种类造成的损坏,更优选的是选自小地老虎 [Agrotis ipsilon,BCW],草地贪夜蛾[Spodoptera frugiperda],甜菜夜蛾 [Spodoptera exigua],烟芽夜蛾,玉米夜蛾[Helicoverpa tea]的虫害造成的损 坏。这种方法包括种植一种转基因植物,它能在上述的虫害发生的范围内表 达按照本发明的昆虫特异性蛋白质。 本发明也包括产生宿主有机体的方法,这种有机体包含有稳定地整合到 它的基因组内的按照本发明的DNA分子,优选的是其表达按照本发明的昆 虫特异性蛋白质,这种方法包括用按照本发明的DNA分子、含有该DNA分 子的表达盒或含有该表达盒的载体分子转化上述宿主有机体。 本发明的另一个实施方案涉及产生转基因植物或植物细胞的方法,在这 种植物或植物细胞内包含有稳定地整合到植物基因组内的按照本发明的 DNA分子,优选的是其表达按照本发明的昆虫特异性蛋白质,这种方法包 括用按照本发明的DNA分子、含有该DNA分子的表达盒或含有该表达盒的 载体分子分别转化上述植物和植物细胞。 本发明还涉及产生杀虫组合物的方法,该方法包含将有效杀虫量的按照 本发明的分离的芽孢杆菌菌株和/或宿主有机体和/或分离的蛋白质分子和/ 或胶囊化的蛋白质与适当的载体混合。 本发明还包括产生转基因亲本植株的转基因后代的方法,这种方法包括 把包含编码按照本发明的昆虫特异性蛋白质的核苷酸序列的DNA分子稳定 地掺入到植物基因组内。这种方法还包括用按照本发明的DNA分子、含有 该DNA分子的表达盒或含有该表达盒的载体分子转化上述亲本植物,并通 过已知的植物育种技术把杀虫特性转移到上述转基因亲本的后代体内。 也包括在本发明的是能特异地和编码可在芽孢杆菌属的几个种的营养生 长期间分离到的昆虫特异性蛋白质及其组分的核苷酸序列杂交的寡核苷酸 探针。其中所说的蛋白质不是得自球形芽孢杆菌SSII-1的杀蚊毒素。其中 所说的探针包含为上述昆虫特异性蛋白质编码的序列的邻接部分长度为10 个核苷酸。 本发明还包括上述寡核苷酸探针用于筛选芽孢杆菌菌株或其它有机体, 以确定昆虫特异性蛋白质是否天然存在或特定的转化有机体是否包含所述 基因的用途用途。 本发明认识到杀虫蛋白质在芽孢杆菌菌株营养生长期间产生。认识到这 一类杀虫蛋白质的存在,本发明包括所有除了得自球形芽孢杆菌SSII-1的杀 蚊毒素外的营养生长期间的杀虫蛋白质,即下文提到的VIP。 VIP在孢子形成后并不丰富,主要是在稳定生长期之前的对数期表达。 本发明所用的营养生长期定义为孢子形成期开始之前的时期。编码VIP的基 因可被分离、克隆并转化到不同的运送载体中以用于虫害防治方法。 本发明所指的虫害包括(但并不限于)昆虫,真菌,细菌,线虫,螨类, 蜱类,原生动物病原体,动物寄生性肝吸虫等等。虫害包含从鞘翅目,双翅 目,膜翅目,鳞翅目,食毛目,同翅目,半翅目,直翅目,缨翅目,革翅目, 等翅目,虱目,蚤目,毛翅目等,特别是鞘翅目和鳞翅目选择的害虫。 表1-10是主要作物害虫和人畜重要性害虫表,这些害虫包括在本发明的 范围内。 表1 鳞翅目(蝶蛾类) 玉米 玉米螟 小地老虎 玉米夜蛾 草地贪夜蛾 巨座玉米螟 非洲蔗螟 小蔗螟 高粱螟 草地贪夜蛾 非洲蔗螟 玉米夜蛾 粒肤地虎 小麦 一点粘虫 草地贪夜蛾 非洲蔗螟 西部灰地老虎 非洲蔗螟 向日葵 sunflower bud moth(Suleima helianthaha) 向日葵斑螟 棉花 烟芽夜蛾 玉米夜蛾 甜菜夜蛾 棉红铃虫 水稻 小蔗螟 fall armyworm(Spodoptera frugiperda) 玉米夜蛾 大豆 黎豆夜蛾 苜蓿绿夜蛾 玉米螟 甜菜夜蛾 烟芽夜蛾 玉米夜蛾 玉米螟 小地老虎 表2 鞘翅目(甲虫类) 玉米 玉米根叶甲 长角叶甲 瓜十一星叶甲 梳爪叩头虫属的几个种 北方圆头犀金龟(白蛴螬) 南方圆头犀金龟(白蛴螬) 日本丽金龟 高粱 white grub(Phyllophaga crinita) wireworm(Eleodes,Conoderus和Aeolus spp.) 橙足负泥虫 玉米跳甲 玉米谷象 小麦 橙足负泥虫 三叶草叶象 瓜十一星叶甲 向日葵 向日葵叶甲 胡萝卜金龟 棉花 棉铃象 水稻 葡萄肖叶甲 稻根象 米象 大豆 墨西哥大豆瓢虫 表3 同翅目(粉虱,蚜虫等) 玉米 玉米蚜 玉米根蚜 高粱 玉米蚜 美甘蔗伪毛蚜 小麦 俄罗斯小麦蚜 麦二叉蚜 麦长管蚜 棉花 棉蚜 棉序盲蝽 苘麻粉虱 水稻 叶蝉(Nephoteftix nigropictus) 大豆 桃蚜 蚕豆微叶蝉 大麦 麦二叉蚜 油用油菜 甘蓝蚜 表4 半翅目(臭虫类) 玉米 美洲谷长蝽 高粱 美洲谷长蝽 棉花 美国牧草盲蝽 水稻 美洲谷长蝽 拟缘蝽 大豆 拟缘蝽 大麦 美洲谷长蝽 拟缘蝽 烟草蝽 表5 直翅目(蝗虫,蟋蟀和蜚蠊非类) 玉米 赤胫黑蝗 血黑蝗 小麦 赤胫黑蝗 异黑蝗 血黑蝗 棉花 赤胫黑蝗 异黑蝗 大豆 赤胫黑蝗 异黑蝗 结构/室内 美洲大蠊 德国蠊 东方蠊 表6 双翅目(蝇蚊类) 玉米 玉米种蝇 玉米斑潜蝇 高粱 高粱瘿蚊 小麦 小麦瘿蚊 麦红吸浆虫 美洲杆蝇 麦瘦种蝇 向日葵 向日葵籽瘿蚊 大豆 玉米种蝇 大麦 玉米种蝇 小麦瘿蚊 攻击人类和动物以及携带疾病的昆虫 埃及伊蚊 白纹伊蚊 巴氏白蛉 黑虻 旋丽蝇 表7 缨翅目(蓟马类) 玉米 玉米黄呆蓟马 小麦 烟褐花蓟马 棉花 烟蓟马 烟褐花蓟马 大豆 soybean thrips(Sericothrips variabilis) 烟蓟马 表8 膜翅目(叶蜂,蚂蚁,黄蜂等等) 玉米 窃蚁 小麦 麦茎蜂 表9 其它目与代表的物种 革翅目(蠼螋类) 欧洲球螋 等翅目(白蚁类) 欧洲散白蚁 食毛目(羽虱类) 鸡头羽虱 牛羽虱 虱目(吸虱类) 人虱 蚤目(跳蚤类) 猫栉首蚤 表10 蜱螨目(蜱螨类) 玉米 棉叶螨 高粱 红叶螨 棉叶螨 小麦 麦瘿螨 棉花 红叶螨 棉叶螨 大豆 草莓叶螨 棉叶螨 大麦 潜岩螨 重要的人和动物蜱螨 变异革螨 波斯锐缘蜱 嗜皮螨 特嗜皮螨 现在已经认识到,杀虫蛋白质可从芽孢杆菌的营养生长阶段分离,其它 菌株可用标准方法分离并测定对植物和非植物害虫的活性。通常芽孢杆菌菌 株可使用本领域已知的方法从来自包括土壤,植物,昆虫,谷物仓库粉尘以 及其它样品材料等任何环境的样品中分离到,参见,例如,Travers等,(1987) 应用环境微生物,53:1263-1266;Saleh等,(1969)加拿大微生物学杂志, 15:1101-1104;DeLucca等,(1981)加拿大微生物学杂志,27:865-870; Norris等,(1981),“芽孢杆菌属和乳孢芽孢杆菌属”,在Starr等(eds.), 原核生物:细菌的生境、分离与鉴别手册。第II卷,Springer-Verlog Berlin Heidelberg.分离后,可以测试菌株在营养生长期间的杀虫活性。用这种方 式,可以鉴别新的杀虫蛋白质和菌株。 在本发明中使用的芽孢杆菌属微生物包含蜡状芽孢杆菌,苏云金芽孢杆 菌以及表11所列的芽孢杆菌属种类。 表11 芽孢杆菌属物种表 形态组1 巨大芽孢杆菌 蜡状芽孢杆菌* 蜡状芽孢杆菌菌覃状变种 苏云金芽孢杆菌* 地衣状芽孢杆菌 枯草芽孢杆菌* 短小芽孢杆菌 强固芽孢杆菌* 凝结芽孢杆菌 形态组2 多粘芽孢杆菌 软化芽孢杆菌 环状芽孢杆菌 嗜热脂肪芽孢杆菌 蜂房芽孢杆菌* 侧孢芽孢杆菌* 短芽孢杆菌 尘埃芽孢杆菌 日本甲虫芽孢杆菌* 缓死芽孢杆菌* 幼虫芽孢杆菌* 形态组3 球形芽孢杆菌* 巴斯德氏芽孢杆菌 未指定的菌株 亚组A 蜜蜂芽孢杆菌* B.filicolonicus 溶硫胺素芽孢杆菌 嗜减芽孢杆菌 亚组B 丛毛芽孢杆菌 B.chitinosporus 缓慢芽孢杆菌 亚组C 栗褐芽孢杆菌 解硫胺素芽孢杆菌 B.macroides B.frcundenreichii 亚组D B.pantothenticus 植表芽孢杆菌 亚组El B.aminovorans B.globisporus B.insolitus B.psychrophilus 亚组E2 B.psychrosaccharolytic B.macquariensis *号表明已经发现和昆虫有关的芽孢杆菌菌株 根据Parry,J.M.等,(1983)芽孢杆菌属物种的彩色图谱,Wolfe医学出 版社,伦敦所述分组。 按照本发明,芽孢杆菌在营养生长期间产生的杀虫蛋白质可分离出来。 在一个实施方案中,分离了在营养生长期间产生的杀虫蛋白质。用于蛋白质 分离的方法在本领域中是已知的。通常,蛋白质可用常规色谱法(包括凝胶 过滤,离子交换)和免疫亲合色谱法、高效液相色谱法(如反相高效液相色 谱法,离子交换高效液相色谱法,筛析高效液相色谱法,高效层析聚焦与疏 水相互作用层析等)、电泳法(如一维凝胶电泳法,二维凝胶电泳法等)分 离。这些方法在本领域中是已知的。参见例如, 分子生物学中通用方法,第 一卷和第二卷,Ausubel等(eds.),John Wiley & Sons,NY(1988)。另外, 可以制备抗实质上纯的蛋白质制剂的抗体。参见例如,Radka等(1983),免 疫学杂志,128:2804;Radka等(1984),免疫遗传学,19:63。可把任何 方法结合起来,用来提纯具有杀虫特性的蛋白质。当步骤确定后,在每一提 纯步骤后都测定杀虫活性。 这样的纯化步骤将产生实质上纯化的蛋白质片断。″实质上纯化的″或“实 质上纯的”是指蛋白质实质上从天然状态下与蛋白质结合的复合物中分离出 来。蛋白质的“实质上纯化的”制备可通过SDS-PAGE后目视或光密度扫描 确定有无其它可检测的带存在来评价。另外,在纯化制剂中没有其它氨基末 端序列或N-末端残基的存在也能表明纯化的水平。可以用“纯”制剂通过离 子交换,反相色谱或毛细管电泳表明无其它峰的存在来检验纯度。术语″实 质上纯化的″或“实质上纯的”并不意味排除少量不干扰蛋白质生物活性的 杂质的存在,例如,杂质可能因为不完全的纯化而存在。 纯化的蛋白质分离后,蛋白质或它包含的多肽可以通过本领域已知的标 准方法确定其特征并测序。例如,纯化的蛋白质或它包含的多肽可以用溴化 氰或用蛋白质酶如木瓜蛋白质酶,胰凝乳蛋白质酶,胰蛋白质酶,赖氨酰- C肽链内切酶等裂解。(Oike等,(1982), 生物化学杂志,257:9751-9758; Liu等,(1983), 国际肽链和蛋白质研究杂志,21:209-215)。形成的肽链最 好通过HPLC或凝胶溶解以及电印迹进PVDF膜分离,以便于氨基酸序列分 析,要完成这个任务,肽链最好用自动序列分析仪分析。已经知道,N-端, C-端,或内部的氨基酸序列都可测定。从纯化的蛋白质的氨基酸序列可以合 成一条核苷酸序列,它可用作探针以协助分离编码杀虫蛋白质的基因。 已经知道,杀虫蛋白质可以是低聚物,并且在分子量,原体(protomer) 数量,组成肽链,对特定昆虫的活性以及其它特征都有变化。然而,通过这 里提出的方法对许多害虫具有活性的蛋白质都可分离并确定其特征。 已经知道,纯化蛋白质分离和确定特征后,可以用多种方法包括氨基酸 的取代,缺失,截断和插入来改变。这种操作的方法在本领域中都是已知的。 例如,杀虫蛋白质的氨基酸序列变异体可以通过DNA突变来制备。这种突 变体具有所需的杀虫活性。很明显,在编码变异体的DNA中所做的突变不 应使序列置于阅读框架之外,最好不创造能产生第二个mRNA结构的互补区 域。参见EP专利申请出版物No.75,444。 在这种意义上,本发明包含了杀虫蛋白质及其组分和片段。也就是说, 已经认识到可以生成保留杀虫活性的蛋白质的组分原体,多肽链或蛋白质片 段。这些片段包含截断序列以及蛋白质的N-端,C-端,内部和内部缺失 (internally deleted)的氨基酸序列。 蛋白质序列的大多数缺失,插入,和替代并不期望产生杀虫蛋白质特性 的根本改变。然而,当在替代,缺失或插入之前预测确切的影响有困难时, 本领域的技术人员将希望通过常规筛选测定评价结果。 这儿所说的蛋白质或其它组分多肽可以单独或结合使用,也就是说,几 种蛋白质可以用来控制不同的虫害。 一些蛋白质是单一多肽,而许多蛋白质由一条以上的多肽链组成,即它 们是寡聚体。另外,一些VIP作为寡聚体具有杀虫活性。在这种情况下,另 外的原体用来增强杀虫活性或激活杀虫蛋白质。这些增强或激活原体就是提 到的辅助蛋白质。辅助蛋白质通过与杀虫蛋白质相互作用形成寡聚蛋白质来 激活或增强杀虫蛋白质,寡聚蛋白质与缺乏辅助蛋白质时观察到的活性相 比,杀虫活性增强。 辅助蛋白质激活或增强杀虫蛋白质(如AB78的VIP1蛋白质)的活性。 这些辅助蛋白质可以用得自AB78的VIP2蛋白质例证,但并不限制在这种蛋 白质上。如在申请的实验部分说明的,辅助蛋白质可以激活许多杀虫蛋白 质。这样,在本发明的一个实施方案中,一种植物(第1亲本)可以用一种 辅助蛋白质转化。这种亲本可以和许多亲本2植物杂交,该亲本2植物用一种 或多种其杀虫活性由辅助蛋白质激活的杀虫蛋白质转化。 本发明的杀虫蛋白质中,一组新的昆虫特异性蛋白质在本发明的范围内 能令人惊奇地被鉴定出来。这种蛋白质在整个申请中被指定为VIP3,可以 从芽孢杆菌属的几个种的菌株中获得,但优选的是从苏云金芽孢杆菌菌株 中,更优选的是从苏云金芽孢杆菌菌株AB88和AB424中获得。该VIP大部 分存在于芽孢杆菌的培养物上清液中,至少可达到菌株AB88的75%。通过 VIP3蛋白质的独特的杀虫活性谱可以进一步确定其特征。它的活性包括对 地老虎属和/或灰翅夜蛾属物种,但是尤其是对小地老虎[BCW]和/或草地贪 夜蛾和/或甜菜夜蛾和/或烟芽夜蛾和/或玉米夜蛾的活性。 小地老虎是相当抗δ-内毒素的重要农业害虫。Maclntosh等(1990)在 脊椎动物病理学杂志,56,258-266报道δ-内毒素和CrylA(B)和CrylA(C) 对BCW的杀虫特性,其食用半致死浓度(LC50)分别超过80μg和18μ g/ml,按照本发明的杀虫蛋白质vip3A杀虫蛋白质加到至少比CrylA蛋白质 达到刚好50%死亡率所需的数量要低10至500倍,优选的是50至350倍,更 优选的是200至300倍时,可提供50%的死亡率。本发明特别优选的vip3A杀 虫蛋白质当数量加到比CrylA蛋白质达到刚好50%死亡率所需的数量要低 260倍时就达到100%的死亡率。 根据发明的vip3杀虫蛋白质大多数存在于培养物上清液中,因而可以归 类为分泌蛋白质。它们最好在N-末端包含许多的荷正电的残基,接着是疏水 核心区,而且在输出期间N-末端不被加工。 如本发明范围内报道的其它杀虫活性蛋白质一样,VIP3蛋白质可以在生 长阶段而不能在孢子形成阶段检测到。这使它和其它属于δ-内毒素类的蛋 白质有了更清楚的区别。优选的,昆虫特异性蛋白质在指数中期开始并持续 到孢子形成期。由于表达方式的特异性与VIP3蛋白质的高稳定性,在孢子 形成期培养物上清液中发现了大量的蛋白质。尤其优选的是在在分类位置上 为SEQ ID NO:29和SEQ ID NO:32的VIP3蛋白质,以及包含编码该蛋白 质的核苷酸序列的相应DNA序列。但尤其是包含SEQ ID NO:28,SEQ ID NO:30和SEQ ID NO:31给出的核苷酸序列的DNA分子。 本发明的杀虫蛋白质可与Bt内毒素或其它杀虫蛋白质组合使用能扩大昆 虫靶范围。进而,本发明的VIP和Btδ-内毒素或其它明显的自然杀虫素结 合对于预防和/或控制昆虫抗性有特别的效用。其它杀虫素包含蛋白质酶抑 制因子(丝氨酸和半胱氨酸类型),外源凝集素,α-淀粉酶和过氧化物酶。在 一个优选的实施方案中,VIP在一种转基因植物中表达伴随着一个或多个δ -内毒素的表达。这种超过一种的杀虫素在同一转基因植物中共同表达可以 通过遗传工程使植物包含并表达所需的基因来达到。另外,一种植物(第1 亲本)可以通过遗传工程操作表达VIP。第二种植物(第2亲本)可以通过 遗传工程操作表达Btδ-内毒素。通过亲本1和亲本2杂交获得表达引入亲本 1和亲本2的所有基因的后代植物。特别优选的Btδ-内毒素是那些本文一并 参考的在EP-A0618976给出的Btδ-内毒素。 许多细胞毒素蛋白质(尽管并非全部)作用是双重(binary)的。双重 毒素(binary toxins)典型地是由两个蛋白质结构域组成,一个称为结构域 A,另一个称为结构域B(参见 细菌蛋白质毒素的原始资料集,J.E.Alouf和 J.H.Freer eds.(1991)学术出版社)。结构域A具有高效细胞毒素活性。结构 域B在被内在化(being inlernized)之前与外源细胞表面受体结合。典型地, 细胞毒素结构域A必须靠转移结构域被送到细胞质。结构域A和B常常是分 离的多肽或原体,通过蛋白质-蛋白质相互作用或二硫键结合。然而,毒素 可以是单一多肽,在细胞内被水解加工成两个结构域。如假单孢菌外毒素 A。总之,双重毒素具有三个重要的结构域:细胞毒素A结构域,结合受体 的B结构域和转移结构域。结构域A和B常通过蛋白质-蛋白质相互作用结 合。 本发明的受体结合结构域对于把任何蛋白质,毒素,酶,转录因子,核 酸,化学因子或任何其它因子送进具有被本发明的双重毒素的受体结合结构 域识别的受体的靶昆虫是有用的。同样地,因为双重毒素具有转移结构域, 它能通过磷脂双层膜并使细胞毒素也穿过这些膜,这样的转移结构域在使任 何蛋白质,毒素,酶,转录因子,核酸,化学的或任何其它因因子穿过磷脂 双层膜如质膜或泡囊膜(vesicle membrane)可能是有用的。转移结构域自 身可使膜形成穿孔,这样就有毒性或杀虫活性。而且,所有双重毒素具有细 胞毒素结构域,这样的细胞毒素结构域不管是单独使用还是以任何方式被送 进任何靶细胞都可用作致死蛋白质。 最后,由两个多肽链组成的双重毒素常形成一个复合物,在本发明的双 重毒素的组分内可能具有蛋白质-蛋白质相互作用的结构域。这些蛋白质-蛋 白质相互作用结构域可能在形成毒素,酶,转录因子,核酸,抗体,细胞结 合组分或任何其它化学制剂,因子,蛋白质或蛋白质结构域之间的结合是具 有用的。 毒素,酶,转录因子,抗体,细胞结合组分或其它蛋白质结构域能通过 符合读框的基因融合而融合到杀虫蛋白质或辅助蛋白质中,符合读框的融合 基因由核糖体翻译时,产生有VIP和在融合中使用的其它组分组合的特性的 融合蛋白。而且,如果融合蛋白结构域和另一个蛋白质,核酸,碳水化合物, 脂类,或其它化学制剂或因子有亲和力,就形成一个三组分的复合物。这个 复合物有它的所有组分的特性。类似的原理可用于产生四个或更多组分的复 合物。这些复合物可用作杀虫毒素,药物,实验室试剂和诊断试剂等。这样 的目前正在使用的复合物的例子是用于潜在的癌症治疗的融合毒素,ELISA 测定试剂和免疫印迹分析试剂。 改变杀虫蛋白质或辅助蛋白质的一个方法就是把一个15个氨基酸的“S- 尾巴”融合到蛋白质上,但不破坏蛋白质的昆虫细胞结合结构域,转移结构 域或蛋白质-蛋白质相互作用结构域。S-尾巴和核糖核酸酶S-蛋白质有高度 的亲和力(Kd=10~9M),后者和S-尾巴结合时,形成活性的核糖核酸酶(参 见F.M.Richards和H.W.Wyckoff(1971),“酶”,第IV卷。(Boyer,P.D.ed.). pp.647-806.学术出版社,纽约)。融合可以通过这样的方法完成:破坏或 移去杀虫蛋白质或辅助蛋白质的细胞毒素活性,并用新的细胞毒素核糖核酸 酶活性取代VIP细胞毒素活性。最后毒素将包含S-蛋白质,杀虫蛋白质以及 辅助蛋白质,其中不论杀虫蛋白质还是辅助蛋白质是作为带有S-尾巴的翻译 融合蛋白产生的,类似的方法可用于把其它潜在的细胞毒素融合到杀虫蛋白 质和辅助蛋白质中,这些细胞毒素包含(但不限于)核糖体活化蛋白质,昆虫 激素,激素受体,转录因子,蛋白质酶,磷酸酶,假单孢杆菌外毒素或任何 进入细胞内时是致死的蛋白质或化学因子,同样地,任何非致死的但改变细 胞的生理生化的蛋白质也可被送入细胞。 对不同种类的活性谱可通过把结构域融合到识别其它种类细胞表面受体 的杀虫蛋白质或辅助蛋白质上而改变,这样的结构域可能包含(但不限于) 抗体,转铁蛋白质,激素,或从表现出亲合选择性文库的噬菌体中分离到的 肽链序列。和营养素,维生素,激素,或其它能转移进细胞的化学物质结合 的肽序列也能用于改变毒性谱。相似地,其它结合到细胞表面受体或膜上并 能被内在化的蛋白质或化学物质也可以用来改变VIP1和VIP2的活性谱。 本发明的杀虫蛋白质是那些有特异杀虫活性的蛋白质。这些蛋白质的分 子量可以不同,其组分肽链分子量至少有30kDa或更大,优选的大约50kDa 或更大。 本发明的辅助蛋白质分子量可以不同,至少大约15kDa或更大,优选的 大约20kDa或更大,更优选的大约30kDa或更大。辅助蛋白质自身可能有组 分多肽链。 杀虫蛋白质和辅助蛋白质也可能是多亚基的杀虫蛋白质的组分。这样一 个包含辅助蛋白质作为其一个或多个组分多肽的杀虫蛋白质分子量可以不 同,分子量为至少50kDa到至少200kDa,优选的大约100kDa到150kDa。 辅助蛋白质可用于和本发明的杀虫蛋白质结合以增强活性或激活杀虫蛋 白质。为确定辅助蛋白质是否影响活性,杀虫蛋白质可单独表达和与辅助蛋 白质一起表达,在饲喂测定杀虫活性时比较它们各自的活性。 检测菌株自身和它与辅助蛋白质结合后的活性,对于筛选有潜在杀虫活 性的菌株是有益的。在某些情况下,辅助蛋白质与菌株的天然蛋白质结合产 生杀虫活性,而在缺乏辅助蛋白质时没有检测到活性。 如上所述,辅助蛋白质可以通过本领域已知的各种方法修饰,因此,本 发明所用的术语“营养杀虫蛋白质”(VIP)包含那些在营养生长期间产生的 单独或结合使用有杀虫活性的蛋白质。这种蛋白质包括杀虫蛋白质、辅助蛋 白质和那些仅仅在辅助蛋白质存在时显示活性的蛋白质或这些蛋白质的多 肽组分。 已经认识到用其它方法可获得这些蛋白质的核苷酸与氨基酸序列。例 如,要获得编码杀虫蛋白质的核苷酸序列,表达杀虫蛋白质的粘粒克隆可从 基因文库中分离到。小的亚克隆可从较大的活性粘粒克隆中制得并测其活 性。用这种方法,可以测定表达活性杀虫蛋白质的克隆的序列以确定基因的 核苷酸序列。然后,可以推导出组成蛋白质的氨基酸序列。对于一般的分子 技术,参见例如,分子克隆实验室手册,第二版,第1-3卷,Sambrook等(eds.) 冷泉港实验室出版社,冷泉港,NY(1989)以及其中引用的参考文献。 本发明也包括得自有机体而不是芽孢杆菌的核苷酸序列,其中核苷酸序 列可通过本发明的芽孢杆菌核苷酸序列杂交来分离。测定此核苷酸序列编码 的蛋白质的杀虫活性。本发明也包括由此核苷酸序列编码的蛋白质。而且, 本发明包括从有机体而不是芽孢杆菌获得的蛋白质,其中蛋白质可与抗本发 明蛋白质的抗体发生交叉反应。同样,分离到的蛋白质可使用本文或其它本 领域中众所周知的方法测定其杀虫活性。 编码本发明的杀虫蛋白质的核苷酸序列分离后,它们可以被操纵并用来 在许多宿主如其它有机体(包含微生物和植物)中表达蛋白质。 可以优化本发明的杀虫基因以增强其在植物中的表达。参见,例如EP- A 0618976;EP-A 0359472;EP-A 0385962;WO 91/16432;Perlak等 (1991), 美国科学院学报(Proc.Natl.Acad.Sci.USA)88:3324-3328;Murray 等(1989), 核酸研究17:477-498。用这种方法,利用植物的最优密码子可 以合成基因。对于一个特定的宿主来说,最优密码子是编码宿主氨基酸频率 最高的单个密码子,例如对于特定氨基酸的玉米最优密码子可以从玉米的已 知基因序列中推导出。对于玉米的28个基因的玉米密码子的使用可在 Murray等,(1989), 核酸研究17:477 498中找到,本文一并参考。合成 的基因也可以基于特定宿主对特定的氨基酸使用的密码子的分布制得。 用这种方法,可以优化核苷酸序列以适合在任何植物中表达。已经认识 到可以优化或合成所用或任何一部分基因序列,也就是说,合成的或部分优 化的序列也可以使用。 以同样的方法,核苷酸序列也可以优化以适于在任何微生物中表达。对 于芽孢杆菌,最优密码子使用参见如美国专利号No.5,024,837和Johansen 等,(1988) 基因65:293-304。 植物表达盒的构建和外源DNA导入植物的方法在本领域中已有叙述。此 表达盒可能包含原体,终止子,增强子,前导序列,内含子以及其它可操作 地连结到杀虫蛋白质编码序列的其它调节序列。进一步认识到VIP基因的启 动子或终止子能在表达盒中使用。 通常,为把外源DNA导入植物,可以使用Ti质粒载体传送外源DNA,也 可以用直接DNA吸收,脂质体,电穿孔,微注射,以及使用微粒。这些方 法在本领域都已发表。参见,例如,Guerche等,(1987) 植物科学 52:111-116;Neuhause等,(1987) 理论与应用遗传( Theor.Appl.Genet.) 75:30-36;Klein等,(1987) 自然327:70-73;Howell等,(1980) 科学208: 1265;Horsch等,(1985) 科学227:1229-1231;DeBlock等,(1989) 植 物生理91:694-701; 植物分子生物学方法Weissbach和Weissbach,eds.) 学术出版社,(1988); 植物分子生物学方法Schuler和Zielinski,eds.)学术 出版社,(1989)。也参见美国专利申请号08/008,374,本文一并参考。也 参见EP-A 0193259和EP-A 0451878。可以理解,转化的方法取决于被转化 的植物细胞。 已经进一步认识到,可以修饰表达盒的组分以增强表达。例如,可以用 截短序列,核苷酸替代或其它修饰。参见,例如,Perlak et(1991) 美国科 学院学报88:3324-3328;Murray等,(1989) 核酸研究17:477-498;和 WO 91 16432。 构建体也可以包含任何可操作地连结到核苷酸序列必须的调节子如终止 子,(Guerineau等,(1991), 分子基因遗传226:141-144;Proudfoot, (1991), 细胞64:671-674;Sanfacon等,(1991), Genes Dev.,5:141-149; Mogen等(1990), 植物细胞,2:1261-1272;Munroe等,(1990), 基因,91: 151-158;Ballas等,(1989), 核酸研究,17:7891-7903;Joshi等,(1987), 核酸研究,15:9627-9639);植物翻译共用序列(Joshi,C.P.,(1987), 核酸 研究,15:6643-6653),内含子(Luehrsen和Walbot,(1991), 分子基因遗 传,225:81-93)等等。在表达盒构建体中包含5′前导序列将是有益的。此 前导序列可以起作用以增强翻译。 在本领域中已知的翻译前导序列包含: 小RNA病毒前导序列,例如,EMCV前导序列(脑心肌炎病毒5′非编码 区)(Elroy-Stein,O.,Fuerst,T.R.,和Moss,B.(1989) 美国国家科学 院进展86:6126-6130); 马铃薯Y病毒组前导序列,如TEV前导序列(Tobacco Etch Virus)(Allison 等,(1986);MDMV前导序列(玉米矮缩花叶病毒); 病毒学,154:9-20); 人类免疫球蛋白质重链结合蛋白质(BiP),Macejak,D.G.和Sarnow,P., (1991), 自然,353:90-94; 苜蓿花叶病毒的外壳蛋白质mRNA的不翻译前导序列(AMV RNA4), (Jobling,S.A.,和Ge小时ke,L.,(1987), 自然,325:622-625; 烟草花叶病毒前导序列(TMV),(Gallie,D.R.等,(1989), RNA分子生 物学,第237-256页;Maize chlorotic mottle Virus病毒前导序列(MCMV) (Lommel,S.A.等,(1991), 病毒学,81:382-385。也参见Della-Cioppa等, (1987), 植物生理,84:965-968。 植物终止子可在表达盒内使用。参见,Rosenberg等,(1987), 基因,56: 125;Guerineau等,(1991), 分子基因遗传,226:141-144;Proudfoot等, (1991), 细胞,64:671-674;Sanfacon等,(1991), Genes Dev.,5:141- 149;Mogen等,(1990), 植物细胞,2:1261-1272;Munroe等,(1990), 基因91:151-158;Ballas等,(1989), 核酸研究,17:7891-7903;Joshi 等,(1987), 核酸研究,15:9627-9639. 为了组织特异性表达,本发明的核苷酸序列能可操作地连结到组织特异 性启动子上。参见,例如,EP-A 0618976,本文一并参考。 也包括在本发明的范围之内的是转基因植物,尤其是通过前面叙述的步 骤转化的转基因丰产植物以及它们的包含并最好也表达按照本发明的杀虫 蛋白质无性和/或有性后代,尤其优选的是杂种植物。 按照本发明的转基因植物可以是双子叶植物或单子叶植物。优选的是禾 本科的单子叶植物,包含:黑麦草属,玉蜀黍属,小麦属,Triticale,蜀黍 属,甘蔗属,雀麦属,稻属,燕麦属,大麦属,黑麦属和狗尾草属植物。 尤其优选的是转基因玉米,小麦,大麦,高粱,黑麦,燕麦,草坪草和 水稻。 双子叶植物中尤其优选的是大豆,棉花,烟草,甜菜,油子油菜和向日 葵。 表达“后代”可理解为包含“无性”和“有性”产生的转基因植物的后 代。这个定义也意味着包含通过已知的方法如细胞融合、突变选择获得的突 变体与变异体,它们仍能表现出最初被转化的亲本植物的独特的特性,这个 定义还包含所有转化植物材料的杂交和融合产物。 本发明的另一个目的涉及转基因植物的繁殖材料。 与本发明有关的转基因植物的繁殖材料定义为可在体内或体外有性或无 性繁殖的任何植物材料。在本发明的范围之内尤其优选的是原生质体,细 胞,愈伤组织,组织,器官,种子,胚胎,花粉,卵细胞,合子,以及其它 可从转基因植物获得的任何繁殖材料。 起源于曾通过本发明转化的转基因植物或它们的后代因而至少包含转基 因细胞的一部分的植物体部分(如花,茎,果实,叶,根),也是本发明的 目标。 在植物繁殖材料(果实,块茎,谷粒,种子)尤其是种子作为商业性产 品出售之前,通常用保护性包衣剂处理。包衣剂包含:除草剂,杀虫剂,杀 真菌剂,杀细菌剂,杀线虫剂,杀软体动物剂或这些制剂的混合物,如果需 要的话,还可加入载体,表面活性剂或施用促进辅剂(application-promoting adjuvants),以防止由细菌,真菌或有害动物引起的破坏。 为了处理种子,保护性包衣剂可以以液体制剂浸渗块茎或谷粒的方式用 于种子,或者用结合的湿或干制剂给种子包衣。另外,在特定的情况下,对 植物施用的其它方法也是可能的,如直接处理芽或果实。 按照本发明之植物种子包括含有编码按照本发明之杀虫蛋白质的核苷酸 序列的DNA分子,它也可以用种子保护性包衣剂处理,包衣剂包含种子处 理复合物,如克菌丹,萎锈灵,福美双(IMTDR),methalaxyl(ApronR), 和pirimiphos-methyl(Actellic)和其它在种子处理中常用的药剂。在本发 明的范围之内优选的是包含按照本发明之杀虫组合物单独或与一种种子处 理时常用的种子保护性包衣剂结合的保护性包衣剂。 这样,本发明的另一个目的是为栽培植物提供繁殖材料,尤其是用上文 定义的种子保护性包衣剂处理的植物种子。 已经认识到编码杀虫蛋白质的基因可用于转移昆虫致病有机体。这些有 机体包括杆状病毒,真菌,原生动物,细菌和线虫。 本发明的芽孢杆菌菌株可用于保护农作物及其产品使之免受害虫危害。 另外,编码杀虫剂的基因可通过适当的载体进入微生物宿主体内,该宿主再 被施用到环境或植物或动物上。微生物宿主可以从已知具有一种或多种兴趣 作物的“phytosphere”(phylloplane,phyllosphere,Rhizosphere和/或 rhizoplana)中选择出来。选择这些微生物的目的是使其有能力在特定的环 境中与野生型微生物成功地竞争,能保持稳定并能表达多肽杀虫剂的基因, 并使杀虫剂增强对环境性退化和灭活的抗性。 这些微生物包括细菌,藻类和真菌。其中特别的兴趣微生物如细菌,例 如,假单孢杆菌属,欧文氏杆菌属,克雷白氏杆菌属,黄单孢菌属,链霉菌 属,根瘤菌属,红假单孢杆菌属,Methylius,土壤杆菌属,醋杆菌属,乳 芽孢杆菌属,节杆菌属,固氮杆菌属,明串珠属,产碱杆菌属;真菌,特别 是酵母如,糖酵母属,隐球酵母属,克鲁维氏酵母属,掷孢酵母属,红酵母 属,和短柄霉属。其中特别的兴趣微生物是这样的phytosphere细菌种类诸 如丁香假单孢杆菌,荧光假单孢杆菌,粘质沙雷氏菌,木质醋杆菌,土壤杆 菌,球形红假单孢杆菌,田野黄单孢菌,苜蓿根瘤菌,真养产碱杆菌, Clavibacter xyli和棕色固氮杆菌;phytosphere酵母种类如深红酵母,胶粘 酵母,海滨酵母,橙黄酵母,浅白隐球酵母,流散酵母,罗仑氏酵母,罗茜 糖酵母,善地酵母,啤酒酵母,红色掷孢酵母,香气酵母,佛地克鲁维氏酵 母和出芽短柄霉。其中特别的兴趣微生物是带色素的微生物。 在能使基因稳定保持并表达的条件下,有很多方法可用于把表达杀虫蛋 白质的基因导入微生物宿主体内。例如,可以构建一个表达盒,它包含感兴 趣的DNA构建体(这种构建体能可操作地与转录和翻译调节信号连结以利 于其表达)和与宿主有机体的序列同源的序列(靠此产生整合)和/或在宿 主体内有功能的复制系统(靠此整合或保持稳定)。 转录和翻译调节信号包括(但不限于)启动子,转录起始位点,操纵子, 激活子,增强子,其它调节分子,核糖体结合位点,起始密码子,终止信号 等,参见如,美国专利号5,039,523;美国专利号4,853,331;EPO 0480762A2; Sambrook等, supra;分子克隆实验室手册,Maniatis等(eds.),冷泉港实 验室,冷泉港,NY(1982);高级细菌遗传学,Davis等,(eds.)冷泉港实验室, 冷泉港,NY(1980);以及其中引用的文献。 在适当的宿主细胞内,当包含杀虫剂的细胞施用到靶昆虫所在的环境中 时,这些细胞将被处理以延长细胞中的毒素活性,适当的宿主细胞包含原核 生物或真核生物,通常被限制在不产生对高等有机体如哺乳动物有毒的物质 的细胞内。然而,如果产生对高等有机体有毒的物质的有机体的毒素不稳定 或施用水平非常低而能避免对宿主有毒的可能时,这种有机体也可以使用。 作为宿主,最感兴趣的是生原核生物和低真核生物,如真菌。作为例证的革 兰氏阴性和革兰氏阳性原核生物,包含肠杆菌科的埃希式杆菌属,欧文氏杆 菌属,志贺氏菌属,沙门氏菌属和变形菌属;芽孢杆菌科,根瘤菌科的根瘤 菌属;螺菌科的发光杆菌属,发酵但孢菌属,沙雷氏菌属,气单孢菌属,弧 菌属,脱硫弧菌属,螺菌属,乳芽孢杆菌科,假单孢菌科,如假单孢杆菌属 和醋杆菌属;固氮杆菌科和硝化杆菌科。在真核生物中是真菌,如藻状菌纲 和子囊菌纲,也包含酵母如糖酵母属,裂殖酵母属以及担子菌纲酵母如红酵 母属,短柄霉属,掷孢酵母属等等。 在选择宿主细胞用于生产时特别的兴趣特征包含易于把蛋白质基因导入 宿主体内,表达系统的可利用性,表达效率,蛋白质在宿主体内的稳定性, 以及辅助基因潜能的存在。用作杀虫剂微囊体感兴趣的特征包含对杀虫剂的 保护质量,如厚细胞壁,着色,胞内包装或内含体的形成;叶片亲和力;对 哺乳动物无毒;吸引害虫摄食;易杀死和固定并却不破坏毒素等等,其它考 虑的因素包含易于形成制剂,易于操作,经济,贮存时稳定性等等。 特别的兴趣宿主有机体包含酵母,如红酵母属的一个种,短柄霉属的一 个种以及掷孢酵母属的一个种,phylloplane有机体如假单孢杆菌的一个 种,欧文氏杆菌属的一个种和黄杆菌属的一个种,或其它的有机体如埃希氏 杆菌属乳芽孢杆菌属的一个种,芽孢杆菌属的一个种等等。特异的有机体 包含荧光假单孢杆菌,铜绿假单孢杆菌,海滨酵母,苏云金芽孢杆菌,大肠 杆菌枯草芽孢杆菌等等。 VIP基因可被导入微生物体内,微生物在植物(附生植物)体内繁殖,把 VIP蛋白质送入潜在的靶害虫。附生植物可以是例举的革兰氏阳性或革兰氏 阴性细菌。 例如,定居性细菌通过本领域已知的方法可以从感兴趣的植物中分离出 来,尤其是,定居性的芽孢杆菌可以从植物根中分离到。(参见,例如,J. Handelsman,S.Raffel,E.Mester,L.Wunderlich和C.Grau, 应用环境微 生物,56:713-718,(1990))。VIP1和/或VIP2和/或VIP3可以通过本领域 的标准方法导入根定居性蜡状芽孢杆菌内。 从蜡状芽孢杆菌菌株AB78中得到的VIP1和/或VIP2使用标准方法借助 于结合可导入根定居性蜡状芽孢杆菌内(J.Gonzalez,B.Brown和 B.Carlton, 美国科学院学报,79:6951-6955,(1982))。 VIP1和/或VIP2和/或VIP3或其它本发明的VIP也可通过电转化法导入 根定居性芽孢杆菌。尤其是,VIP可象在实施例10中所述被克隆到一个穿梭 载体如DHT3101内(D.Lereclus等, FEMS微生物学通信,60:211- 218(1989))。穿梭载体pHT3101包含着编码特定VIP蛋白质的序列,它可通 过电穿孔转化进入根定居性芽孢杆菌。 可以设计表达系统以使VIP蛋白质能分泌到革兰氏阴性细菌入大肠杆菌 的细胞质外,VIP蛋白质分泌的优点为(1)避免在细胞质内表达的VIP蛋白质 的潜在毒性影响,(2)可以增加所表达的VIP蛋白质的水平和(3)有助于VIP 蛋白质的高效纯化。 可以使VIP蛋白质在大肠杆菌中分泌,如通过把一个适当的信号肽融合 到VIP的信号肽的氨基端,或者用大肠杆菌的信号肽取代VIP的信号肽。被 大肠杆菌识别的信号肽可在已知的大肠杆菌分泌蛋白质中发现,如OmpA蛋 白质(J.Ghrayeb,H.Kimura,M.Takahara,Y.Masui和M.Inouye, EMBO 杂志,3:2437-2442(1984))。OmpA是大肠杆菌外膜的主要蛋白质。因而 认为它的信号肽在转化过程中是高效的。OmpA信号肽加工前也不需要修 饰,而其它信号是需要修饰的,如脂蛋白质信号肽(G.Duffaud,P.March 和M.Inouye, 酶学方法,153:492(1987))。 尤其是使用本领域已知的标准方法,可以把单一的BamHI限制位点导入 VIP编码序列的氨基端和羧基端。这些BamHI片段可以符合读框地克隆进载 体pIN-III-ompA1,A2或A3中(J.Ghrayeb,H.Kimura,M.Takahara, H.Hsiung,Y.Masui和M.Inouye, EMBO杂志,3:2437-2442(1984)),进 而创造出ompA:VIP融合基因,它能分泌到周质空间。在pIN-III-ompA的 多接头的其它的限制位点可用本领域中已知的标准方法除去,以使VIP氨基 -端氨基酸的编码序列直接连接在ompA信号肽裂解位点之后。这样,在大肠 杆菌中分泌的VIP序列和天然的VIP序列是一致的。 当VIP天然信号肽不需要成熟蛋白质的适当折叠时,可以除去此信号序 列并用ompA信号序列取代。单一BamHI限制位点可被导入前体蛋白质编码 序列的氨基端(直接在VIP信号肽编码序列之后)和VIP编码序列的羧基端。 然后,可以用上述方法把这些BamHI片段克隆进pIN-III-ompA载体。 在杀虫控制或用基因工程把其它有机体作为杀虫剂中使用本发明菌株的 常用方法在本领域中是已知的。参见,例如,美国专利号5,039,523和EP 0480762A2。 VIP能在细菌宿主内发酵,加工产生的细菌以与苏云金芽孢杆菌菌株 作为杀虫喷洒剂相同的方式用作杀虫喷洒剂。在由芽孢杆菌分泌的VIP的情 况下,分泌信号使用在本领域中已知的方法除去或突变。这样的突变和/或 缺失防止在发酵期间VIP蛋白质分泌进生长培养基。VIP保留在细胞内,然 后细胞被加工以生产胶囊化的VIP。任何适合微生物都能用于这个目的。用 假单胞菌属以胶囊化的蛋白质的形式表达苏云金芽孢杆菌内毒素,加工产生 的细胞并用作杀虫剂喷洒(H.Gaertner等.1993,高级工程杀虫剂,L.Kim ed.)。 用这种方式可利用苏云金芽孢杆菌的各种菌株。这样的Bt菌株产生内毒 素蛋白质以及VIP。此外,这样的菌株仅仅产生VIP。枯草芽孢杆菌的孢子 形成缺失菌株能产生高水平的苏云金芽孢杆菌之CryIIIA内毒素(Agaisse, H.和Lereclus,D.,″苏云金芽孢杆菌CryIIIA毒素基因在B.subtilis中的表达 不是依赖于孢子形成特异性的西格马因子并在spoOA突变体内增长″, 细菌 学杂志.,176:4734-4741(1994))。一种相似的spoOA突变体可是在苏云金 芽孢杆菌中的制备,并用于生产不是被分泌进培养基而是保留在细胞内的胶 囊化VIP。 为使VIP保留在芽孢杆菌属细胞内,可以除去信号肽以使它不再有分泌 信号的功能。尤其是推定的VIP1信号肽包括在这个序列C-末端部分有推定 的共用裂解位点Ala-X-Ala的蛋白质开始的31个氨基酸(G.Von Heijne, 分子 生物学杂志。184:99-105(1989))。推定的VIP2信号肽在Ala40后有推定的裂 解位点的蛋白质的前40个氨基酸。无论在VIP1还是VIP2裂解位点可用本领 域中已知的方法突变,再用不被信号肽酶识别的氨基酸取代裂解位点共用序 列。 另外,VIP1,VIP2和/或本发明的其它VIP信号肽可从序列中除去。因而 使它们作为分泌蛋白质在芽孢杆菌中是不可识别的。尤其是,使用本领域已 知的方法,可用基因工程把蛋氨酸起始位点导入到VIP前体蛋白质序列的前 面部分,在Asp32起始,或导入到VIP2前体蛋白质的前面部分,在Glu41起 始。 VIP基因可导入微生物,微生物在植物(附生植物)中繁殖把VIP蛋白质运 送给潜在的靶害虫。附生植物可以是革兰氏阳性或革兰氏阴性细菌。 本发明的在遗传上改变以包含杀虫基因或蛋白质的芽孢杆菌菌株和微生 物可用于保护农作物及其产品使之免受害虫危害。在本发明的一个方面,完 整的(即未水解的)产生毒素(杀虫剂)的有机体细胞施用到靶昆虫的环境中 时,可用延长在细胞内生成的毒素活性的试剂处理。 另外,杀虫剂可通过把异源基因导入单细胞宿主产生。异源基因的表达 直接或间接地导致杀虫剂细胞内生产和保持。然后在细胞施用到靶害虫的环 境中时能延长细胞内生成的毒素活性的条件下处理细胞。生成的产物保留了 毒素的毒性,这些天然胶囊化的杀虫剂可与传统技术结合形成制剂,可施用 到寄生靶昆虫的环境如土壤,水,以及植物叶片。参见,例如,EPA 0192319 以及其中引用的参考文献。 本发明的有效成分通常以组合物的形式施用,可以施用到作物或被处理 的植物上,可与其它复合物同时或先后使用,这些复合物可以是肥料或微量 营养供体或影响植物生长的其它制剂,它们也可以是选择性除草剂,杀虫 剂,杀真菌剂,杀细菌剂,杀线虫剂,杀软体动物剂或这些制剂中的几种的 混合物,如果需要,还可与农业上可接受的载体,表面活性剂或施用促进辅 剂混合。适合的载体可以是固体或液体以及相应的常在制剂中使用的物质如 天然的或再生的矿物质,溶剂,分散剂,湿润剂,胶粘剂,粘合剂或肥料。 施用本发明的活性成分或包含至少一种有本发明的菌株产生的杀虫蛋白 质的农化组合物的最优方法是叶面施用,种子包衣和土壤施用。施用的数量 和比率(rate)取决于相应害虫的侵害程度。 因此,本发明还提供一种杀虫组合物,该组合物包含作为活性成分的至 少一种按照本发明的新昆虫特异性蛋白质和/或重组微生物以及农业辅剂如 载体,稀释剂,表面活性剂或施用促进辅剂,其中微生物含有至少一种包含 编码重组形式的新昆虫特异性蛋白质的核苷酸序列的DNA分子,但尤其是 包含至少一种含有编码重组形式的新昆虫特异性蛋白质的核苷酸序列之 DNA分子的重组的芽孢杆菌属几个种的菌株如蜡状芽孢杆菌或苏云金芽孢 杆菌,或者它们的衍生物或突变体。组合物还可包含生物活性复合物。该复 合物可以是肥料或微量营养供体或影响植物生长的其它制剂,它们也可以是 选择性除草剂,杀虫剂,杀真菌剂,杀细菌剂,杀线虫剂,杀软体动物剂或 这些制剂中的几种的混合物,如果需要,还可加入农业上可接受的载体,表 面活性剂或常在制剂领域中使用的施用促进辅剂混合。适合的载体可以是固 体或液体以及相应的常在制剂中使用的物质如天然的或再生的矿物质,溶 剂,分散剂,湿润剂,胶粘剂,粘合剂或肥料。 组合物可以包含重量为0.1%至99%的活性成分,重量为1%至99.9%固 体或液体辅剂,和重量为0到25%的表面活性剂。活性成分包含至少一种按 照本发明的新昆虫特异性蛋白质或重组微生物,该微生物包含至少一种编码 重组形式的新昆虫特异性蛋白质之核苷酸序列的DNA分子,但尤其是包含 至少一种包含编码重组形式的新昆虫特异性蛋白质的核苷酸序列的DNA分 子的重组的芽孢杆菌属几个种的菌株如蜡状芽孢杆菌或苏云金芽孢杆菌,或 者它们的衍生物或突变体。活性成分或者包含该活性成分的组合物可以和其 它不损失杀虫效力的杀虫剂或化学物质(1993农作物保护化学药品参考, 化学与药学出版社,加拿大)一起施用到被保护的植物和作物上。它与大多 数常用的农业喷洒物质相容,但不应在极端碱性的喷洒溶液中使用。它也可 以以粉剂,悬浮液,可湿性粉剂或其它任何适合农业施用的物质形态使用。 本发明还提供通过对(A)虫害发生的环境,(B)植物或植物体的一部分(防 止该植物或植物部分受到害虫引起的破坏)或(C)种子(为保护从该种子发 育来的植物不受虫害引起的破坏)使用包含至少一种按照本发明的新昆虫特 异性蛋白质和包含至少一种包含编码重组形式的新昆虫特异性蛋白质的核 苷酸序列的DNA分子的活性成分或包含该活性成分的组合物来控制或抑制 害虫的方法。 应用于植保领域的更优方法是施用到植物叶片上(叶面施用),使用的 数量和比率取决于被保护的植物和正被谈论的害虫成灾的危害性。然而,如 果植物所在地点用用液体制剂灌注,或者活性成分以固体形式掺入植物所在 地点如以粒子形式进入土壤(土壤施用),活性成分也能通过根系进入植物 (内吸作用)。在稻谷作物中,这种粒子可以定量地施用到水淹的农田里。 按照本发明的组合物也适合保护植物繁殖材料,如种子(象果实,块茎 或谷粒)或植物插条免受虫害危害。繁殖材料在种植前可用制剂处理,如种 子播前包衣,本发明的活性成分也可应用到谷粒(包衣)或者用液体制剂浸 谷粒,或者用固体制剂包被谷粒。繁殖材料播种时,制剂也可施用到种植位 点,如播种时施用到播种犁沟中。本发明也涉及这些处理植物繁殖材料的方 法以及被处理的植物繁殖材料。 按照本发明的组合物包含作为活性成分的重组微生物,它包含至少一种 重组形式的新毒素基因,但尤其是芽孢杆菌属几个种菌株的重组体(如蜡状 芽孢杆菌或苏云金芽孢杆菌的菌株,它们包含至少一种包含编码重组形式的 新昆虫特异性蛋白质的核苷酸序列的DNA分子)或其衍生物或突变体。该 组合物可以以任何已知的用细菌菌株进行种子或土壤处理的方式施用。参 见,例如,美国专利N0.4,863,866。即使微生物不再存活,菌株对于生物 控制也是有效的,然而优选的是活着的微生物的施用。 在本发明的范围之内保护的目标农作物包含如下种类: 谷物(小麦,大麦,黑麦,燕麦,水稻,高粱以及有关的农作物),甜菜(糖 用甜菜和饲料甜菜),草坪草(果园草(orchardgrass),羊茅等),核果, 梨果与软果(soft fruit)(苹果,梨,梅,桃,杏,樱桃,草莓,木莓和黑 莓),豆科植物(蚕豆,小扁豆,豌豆,大豆),油料植物(油菜,芥,罂粟, 橄榄,向日葵,椰子,蓖麻,可可豆,花生),黄瓜植物(黄瓜,南瓜,甜瓜), 纤维植物(棉花,亚麻,大麻,黄麻),柑桔(桔,柠檬,葡萄,柑橘),蔬菜 (菠菜,莴苣,芦笋,甘蓝以及其它白菜属蔬菜,洋葱,番茄,土豆,红辣 椒),樟科植物(鳄梨,胡萝卜,樟,樟脑),落叶树和针叶树(如椴树,紫杉, 橡树,桤木,杨,白桦,冷杉,落叶松,松),或者如玉米,烟草,坚果树 类,咖啡,甘蔗,茶,藤本植物,忽布,香蕉和天然橡胶植物以及装饰品(包 括合成物)。 包含至少一种包含编码重组形式的新昆虫特异性蛋白质之核苷酸序列的 DNA分子重组体的芽孢杆菌属的几个种的菌株,如蜡状芽孢杆菌或苏云金 芽孢杆菌菌株,通常以杀虫组合物的形式施用,可用于作物或被保护的植 物,还可与生物活性复合物同时施用或先后施用。这些复合物可以是肥料或 微量营养供体或影响植物生长的其它制剂,它们也可以是选择性除草剂,杀 虫剂,杀真菌剂,杀细菌剂,杀线虫剂,杀软体动物剂或这些制剂中的几种 的混合物,如果需要,还可还加入农业上可接受的载体,表面活性剂或常在 制剂领域中使用的施用促进辅剂。 按照本发明的活性成分可以以非修饰的形式或与其它适合的农业上可接 受的载体一起使用。这些载体是通常在农业制剂领域中使用是辅助剂,因而 制剂以已知的方式形成可乳化的浓缩物,可包衣的浆状物,直接喷洒或可稀 释的溶液,稀释的乳剂,可湿性粉剂,可溶性粉剂,粉剂,粒剂也可以是胶 丸如聚合物。根据组合物的特性,施用方式如喷洒、喷雾、喷粉、散布 (scattering)或灌注(pouring)可根据意定的目标和流行的环境选择。施 用的最佳比率通常为每公顷(“ha”,大约2.471英亩)大约50克至大约5k 克活性成分(a.i.),优选的是大约100克至2kg a.i./ha和200g至500g a.i./ha。 种子包衣的较好的施用比率是每100kg种子0.5k到100kg a.i.,优选的是每 100kg种子3克至100克或每100kg种子10g至50g a.i.。 适当的载体和辅剂可以是固体或液体和通常在制剂中使用的相应物质。 如天然的或再生的矿物质,溶剂,分散剂,润湿剂,胶粘剂,粘合剂或者肥 料。制剂(即包含至少一种包含编码重组形式的昆虫特异性蛋白质之核苷 酸序列的DNA分子的重组芽孢杆菌属几个种的菌株,如蜡状芽孢杆菌和苏 云金芽孢杆菌作为活性成分或与其它活性成分结合,并在适当时加入固体或 液体的辅剂的杀虫组合物,制品或混合物)以已知的方法制备。例如,通过 均匀混合和/或用伸展剂(extender)如溶剂,固体载体,在某些情况下是表 面活性复合物(表面活性剂)磨碎活性成分。 适合溶剂有:芳香烃,优选的是包含8至12碳原子的片断(如二甲苯混合 物,萘),邻苯二酸盐(如邻苯二甲酸二正丁酯或双(2-乙基己基)酞酯), 脂族烃(如环己烷或石蜡,醇和乙二醇以及它们的醚和酯,如乙醇,乙二醇 单甲醚或单苯醚),酮(如环己酮),强极性溶剂(如N-2-吡咯烷酮,二甲 基亚砜或二甲基甲酰胺),以及植物油或环氧化植物油如环氧化椰子油或大 豆油或水。 在粉剂和可扩散性粉剂中使用的固体载体是通常的天然矿物填料如方解 石,滑石,高岭土,蒙脱石或绿坡缕石。为了提高物理特性,也可能加入高 扩散性硅酸或高扩散性的吸收多聚物。适合的粒状吸附载体是多孔型的,如 浮石,碎砖,海泡石或皂土;适合非吸附性载体是如方解石或沙子的材料。 此外,也可以使用许多预先粒子化的无机或有机材料,如特别的白云石或磨 碎的植物残余物。 依靠制剂的活性成分的特性,合适的表面活性复合物可以是能较好乳 化、扩散和湿润特性的非离子、阳离子和/或阴离子表面活性剂。术语“表 面活性剂”也可以理解为表面活性剂组成的混合物,适合的阴离子表面活性 剂可以是水溶性皂和水溶性合成表面活性复合物。适合的皂是碱金属盐,碱 土金属盐,或高级脂肪酸(C10-C12)的未取代的或取代的铵盐,如油酸或 硬脂酸的钠盐或钾盐,或可从椰子油或牛脂油获得的天然脂肪酸混合物的钾 盐或钠盐。也适合的表面活性剂还有脂肪酸甲基磺酸盐以及修饰或非修饰的 硫酸酯。 然而更常使用的是所谓的合成表面活性剂,特别是脂肪磺酸盐,脂肪硫 酸盐,磺基化的苯并咪唑衍生物或烷基芳基磺酸盐,脂肪磺酸盐,脂肪硫酸 盐通常是碱金属盐、碱土金属盐、取代或未取代铵盐的形式,并且通常包括 C8-C22烷基基团(它也包含烷基基团的烷基部分),例如,木质素磺酸、 十二烷基磺酸或从天然脂肪酸得到的脂肪醇硫酸盐混合物的钠盐或钙盐。此 复合物也包括脂肪醇/环氧乙烷加成形成的硫酸酯和磺酸酯的盐。磺基化的 苯并咪唑衍生物优选地包括2个磺酸基团和一个包括大约8到22个碳原子的 脂肪酸基团。烷基芳基磺酸盐的例子是是十二烷基苯磺酸、二丁基萘磺酸或 萘磺酸/甲醛的钠盐,钙盐或三乙醇胺盐的浓缩产物。也适合的是相应的磷 酸盐,如p壬基酚和4-14mol的环氧乙烷加成形成的磷酸三乙酯的盐。 非离子表面活性剂是优选的是脂族或环脂醇或饱和或不饱和脂肪酸和烷 基酚的聚乙二醇醚的衍生物。该衍生物包括3到30个乙二醇醚基团和在烃(脂 族)部分的8到20个碳原子以及在烷基酚中的烷基部分的6到18个碳原子。 适合的非离子表面活性剂还有水溶性的聚环氧乙烷和聚丙二醇、乙二胺 聚丙二醇以及在烷基链包含1到10个碳原子的烷基聚丙二醇的加成产物,该 产物包括20到250个乙二醇醚基团和10到100个丙二醇醚基团。此化合物通 常每个丙二醇单元包含1至5个乙二醇单元。非离子表面活性剂的代表例子是 壬基酚聚乙氧基乙醇,蓖麻油聚乙二醇醚,聚丙烯/环氧乙烷加成物,三丁 基苯氧基聚乙氧基乙醇,聚乙烯乙二醇和辛基苯氧基聚乙氧基乙醇。聚氧 乙烯脱水山梨糖醇的脂肪酸酯如聚氧乙烯脱水山梨糖醇三油酸盐也是适合 非离子表面活性剂。 阳离子表面活性剂优选地是季铵盐,包含作为N-取代基的至少C8-C22 烷基基团,取代基还有低级未取代的或卤化烷基,苯基或低级烃烷基基团。 优选的是以卤化物,甲基硫酸盐或乙基硫酸盐的形式存在的盐,如硬脂酰三 甲基氯化铵或苄基二(2-氯乙基)溴化乙胺。 在制剂领域常用的表面活性剂已有叙述,如“McCutcheon′s洗涤剂和乳 化剂年鉴”,MC出版公司。Ridgewood,NJ.,1979;Dr.Helmut Stache, “Tensid Taschenbuch”(表面活性剂手册),Carl Hanser Verlag,慕尼黑/ 维也纳。 本发明的杀虫组合物的另一个特别优选的特征是施用到植物或土壤后 有效成分的持续性。失去活性的可能原因包含:被紫外光、热、叶片分泌物 和pH值灭活。例如,在高pH值下,特别是有还原剂存在时,δ-内毒素晶体 可溶解并变得易于水解灭活。高的叶片pH值可能也是重要的,特别是叶片 表面的pH值能达到8-10的范围时。本发明的杀虫组合物可以通过加入附加 剂以协助防止活性成分失去,或以活性成分受保护免于灭活的方法如用胶囊 包被材料解决这些问题。胶囊化可以化学完成(McGuire和Shasha,J Econ Entomol 85:1425-1433,1992)或生物完成(Barnes和Cum分钟gs,1986; EP-A 0 192 319)。化学胶囊化参与了活性成分用多聚物包被的加工,而生 物胶囊化参与了δ-内毒素在微生物中的表达。对于生物胶囊化,包含至少 含有编码重组形式的新昆虫特异性蛋白质之核苷酸序列的DNA分子的完整 微生物在制剂中用作活性成分。紫外线保护剂的加入可以有效地减少放射破 坏。由于热的灭活也可以通过包含一个适当的附加物来控制。 本申请内优选的制剂是包含微生物作为活性成分的制剂,其中活性成分 是营养细胞的形式或者更优选的的是以孢子形式(如果能得到的话)。例如, 适合的制剂可能由与多价阳离子形成交联并包含这些微生物的多聚物凝 胶,如在由D.R.Fravel等编著的植物病理学,75卷,No.7,774-777,1985 中有藻酸盐作为多聚物材料的叙述。从这本出版物中还知道:载体物质可 以共用(co-use)。通常制剂通过混合天然产生的或合成的凝胶形式的多聚 物如藻酸盐和多价金属离子盐的水溶液来制得。这样形成了单个小滴,这种 单滴使微生物悬浮在任一种或两种的反应溶液中成为可能。凝胶形成以小滴 的混合开始,这些凝胶离子的随后干燥是可能的。这种方法称为ionotropic 凝胶化。依据干燥的程度,形成了结构上通过多价阳离子交联并包含微生物 和表现出均匀分布的载体的多聚物的致密、坚硬的粒子。粒子的大小可达 5mm。 在EP-A1-0097571中叙述了基于部分交联的多糖加上如微生物并包含精 细分离的硅酸作为载体材料可通过如Ca++离子发生交联的组合物。组合物 的水活性不大于0.3。W.J.Cornick等在一篇综述文章[生物控制新方向:抑 制农业病虫害的替代,345-372页,Alan R.Liss,Inc.(1990)]中叙述了各种 制剂系统、用蛭石作为载体离子化以及通过在前面提到的ionotropic凝胶化 制备的致密藻酸盐小珠。 D.R.Fravel在《杀虫剂制剂和施用系统)》(11卷,ASTM STP 1112美 国检验和材料学会,费城,1992,173至179页)中也提到过这样的组合物, 它可用于制造按照本发明的重组微生物的制剂。 本发明的杀虫组合物通常包含大约0.1%至大约99%,优选的是大约 0.1%至大约95%,更优的是大约3%至大约90%的活性成分;从大约1%至 大约99.9%,优选的大约1%至大约99%,更优的是大约5%至大约95%的固 体或液体辅剂;以及从O至大约25%,优选的是大约0.1%至大约25%,更 优的从大约0.1%至大约20%的表面活性剂。 在本发明一个优选的实施方案中,杀虫组合物通常包含0.1%至99%,优 选的是0.1%至95%重组的包含至少一种包含编码重组形式的新昆虫特异性 蛋白质的核苷酸序列的DNA分子的芽孢杆菌属的几个种的菌株,如蜡状芽 孢杆菌或苏云金芽孢杆菌菌株,或者它与其它活性成分(1%至99%的固体 或液体辅剂以及0至25%优选的是0.1%至20%的表面活性剂)的结合物。 但是,商业性产品最好以浓缩物制成制剂,最终用户通常使用实质上更 低浓度的稀释制剂。杀虫组合物也可以包含更多的成分,如稳定剂,消泡剂, 粘度调节剂,粘合剂,胶粘剂以及肥料或其它活性成分。 在本发明的一个实施方案中,分离到一种蜡状芽孢杆菌微生物,它能杀 死玉米根叶甲和长角叶甲,新的蜡状芽孢杆菌菌株AB78保藏于农业研究机 构保藏中心(NRRL)北方地区研究中心(美国,伊利诺斯州61604,彼奥 利亚,北大学街1815号),保藏号为NRRL B-21058。 片断蛋白质可从蜡状芽孢杆菌菌株中实质纯化出来。蛋白质纯度可用 SDS-PAGE和生物活性检验。蛋白质分子量为大约60至大约100kDa,特别 是大约70至大约90kDa,更特别的是大约80kDa,即下文的VIP。 氨基末端序列分析表明N-端氨基酸的序列是: NH2-Lys-Arg-Glu-Ile-Asp-Glu-Asp-Thr-Asp-Thr-Asx-Gly-Asp-Ser- Ile-Pro-(SEQ ID NO:8),其中Asx代表Asp或Asn。全部的氨基酸序列由SEQ ID NO:7给出。编码SEQ ID NO:7中的氨基酸的DNA序列由SEQ ID NO: 6给出。 可生成一段对编码NH2-末端3-9个氨基酸的基因区域的寡核苷酸探针。 探针合成基于苏云金芽孢杆菌(Bt)δ-内毒素基因的密码子使用。用于 Southern杂交的寡核苷酸探针的核苷酸序列如下: 5-GAA ATT GAT CAA GAT ACN GAT-3(SEQ ID NO:9) 其中N代表任何碱基。 此外,这里所述的Bc AB78 VIP1基因的DNA探针,可用于筛选任何芽孢 杆菌属菌株或其它有机体以确定VIP1基因(或有关的基因)是否天然存在, 或特定的转化有机体是否包含VIP1基因。 现在,全面叙述了本发明,通过参考下面的详细的实施例将更好地理解 本发明。实施例用于例证,除非特别指出,它不能被认为是对本发明的限定。 基于包含在本发明中的蛋白质序列的一致性,发展了标准的命名法。下 面详细的实施例中的基因和蛋白质名和使用在专利申请[美国申请号 31594/08]中的名字的关系如下: 基因/蛋白质 按标准命 名法的名称 基因/蛋白质 本专利中的 名称 蛋白质描述 VIP1A(a) VIP1 得自菌株AB78的EQ ID NO:5给出的 VIP1 VIP2A(b) VIP2 得自菌株AB78的SEQ ID NO:2给出的 VIP2 VIP1A(a) VIP1 同系物 得自苏云金芽孢杆菌变种tenebrioni的 SEQ ID NO:21给出的VPI1 VIP2A(b) VIP2 同系物 得自苏云金芽孢杆菌变tenebrionis的SEQ ID NO:20给出的VIP2 VIP3A(a) -- 得自AB88菌株的在本申请的SEQ ID NO:20中给出的VIP VIP3A(b) -- 得自AB424菌株的在本申请的SEQ ID NO:31中给出的VIP 实验 制剂实施例 在下列制剂实施例中使用的活性成分是保藏号为NRRL B-21058的蜡状 芽孢杆菌菌株;保藏号为NRRL B-21060,NRRL B-21224,NRRL B- 21225,NRRL B-21226,NRRL B-21227以及NRRL B-21439的苏云金芽 孢杆菌菌株;和保藏号为NRRL B-21228,NRRL B-2 1229以及NRRL R-21230 的芽孢杆菌属几个种的菌株。所有提到的菌株是包含按照本发明的昆虫特 异性蛋白质的天然分离的菌株。 另外,分离到的昆虫特异性蛋白质单独或与上述的芽孢杆菌属菌株组合 用作活性成分。 A1. 可湿性粉剂 a) b) c) 苏云金芽孢杆菌孢子 木质素磺酸钠 十二烷基磺酸钠 二异丁基萘磺酸钠 辛基酚聚乙二醇醚 (7-8moles环氧乙烷) 高扩散性硅酸 高岭土 25% 5% 3% -- -- 5% 62% 50% 5% -- 6% 2% 10% 27% 75% -- 5% 10% -- 10% --- 孢子完全与辅剂混合,混合物在适当的碾磨机上完全磨碎,产生的可湿 性粉剂可用水溶解生成合乎需要的浓度的悬浮液。 A2. 可乳化浓缩物 苏云金芽孢杆菌孢子 10% 辛基酚聚乙二醇醚(4-5moles环氧乙烷) 3% 十二烷基苯磺酸钙 3% 蓖麻油聚乙二醇醚(36moles环氧乙烷) 4% 环己酮 30% 二甲苯混合物 50% 任何所需浓度的乳浊液都可通过用水稀释此浓缩物来获得。 A3. 粉剂 a) b) 苏云金芽孢杆菌孢子 滑石 高岭土 5% 95% -- 8% -- 92% 准备使用的粉剂可通过把活性成分与载体混合并在适当的碾磨机上磨碎 混合物获得。 A4. 挤压粒剂(Extruder Granulate) 苏云金芽孢杆菌孢子 10% 木质素磺酸钠 2% 羧甲基纤维素 1% 高岭土 87% 混合活性成分或结合物,用辅剂磨碎,然后混合物用水湿润。挤压混合 物,粒化,在流动空气中干燥。 A5. 包衣颗粒 苏云金芽孢杆菌孢子 3% 聚乙二醇(mol wt 200) 3% 高岭土 94% 活性成分或结合物和用聚乙烯乙二醇湿润的高岭土在混合机中均匀混 合。这种方法可获得非粉性包衣颗粒。 A6. 悬浮浓缩液 苏云金芽孢杆菌孢子 40% 乙二醇 10% 壬基酚聚乙二醇醚(15moles环氧乙烷) 6% 木质素磺酸钠 10% 羧甲基纤维素 1% 37%甲醛水溶液 0.2% 75%水溶液形式的硅酮油 0.8% 水 32% 活性成分或结合物与辅剂密切混合,产生悬浮浓缩物。从中任何所需浓 度的悬浮液可以用水稀释得到。 实施例1.AB78的分离和特征确定 在实验室中蜡状芽孢杆菌菌株AB78在T3培养基上(每升:3克胰胨,2克 胰蛋白质际,1.5克酵母抽提物,0.05M磷酸钠(pH6.8),以及0.005克MnCl2; Travers,R.S.1983)作为平板污染物来分离。在对数生长阶段,AB78产生 明显对玉米根叶甲的活性。抗革兰氏阳性芽孢杆菌属的几个种的抗体活性液 被证明。 表12 AB78培养物上清液抗体活性 测试细菌 AB78 链霉素 大肠杆菌 巨大芽孢杆菌 蕈状芽孢杆菌 蜡状芽孢杆菌CB 蜡状芽孢杆菌11950 蜡状芽孢杆菌14579 0.0 1.1 1.3 1.0 1.3 1.0 3.0 2.2 2.1 2.0 2.1 2.4 蜡状芽孢杆菌AB78 苏云金芽孢杆菌israelensis变种 苏云金芽孢杆菌tenebrionis变种 0.0 1.1 0.9 2.2 2.2 2.3 AB78的形态特征如下: 营养生长阶段为直杆菌,3.1-5.0mm长,0.5-2.0mm宽。细胞有圆形末端, 以单细胞组成短链。单亚端圆柱形-椭圆形,每细胞形成内生孢子。无伴孢 晶体形成。菌落不透明,缺刻状,裂片形,扁平。无色素产生。细胞能游动, 有鞭毛。 AB78的生长特征如下: 兼性厌氧型,最适生长温度21-30℃,可在15,20,25,30,37℃下生长。 高于40℃不能生长。可在5-7%NaCl中生长。 表13提供了AB78的生化特征简介。 表13 蜡状芽孢杆菌菌株AB78的生化特性 从L-阿拉伯糖产酸 从L-阿拉伯糖产气 从D-木糖产酸 从D-木糖产气 从D-葡萄糖产酸 从D-葡萄糖产气 从乳糖产酸 从乳糖产气 从蔗糖产酸 从蔗糖产气 从D-甘露醇产酸 - - - - + - - - - - - 亚甲蓝再氧化 硝酸盐还原 NO3还原成NO2 VP H2O2降解 吲哚 酪氨酸降解 二羟基丙酮 石蕊牛乳酸 石蕊牛乳凝结 石蕊牛乳碱 + + + + + - + - - - - 从D-甘露醇产气 Proprionate利用 柠檬酸利用 马尿酸水解 亚甲蓝还原 卵磷脂酶产生 - + + W + W 石蕊牛乳胨化 石蕊牛乳还原 酪蛋白质水解 淀粉水解 明胶液化 - - + + + W=软弱的反应 实施例2.细菌培养 用蜡状芽孢杆菌菌株AB78的继代培养物接种到下列培养基,即已知的 TB肉汤: 胰胨 12g/l 酵母提取物 24g/l 甘油 4ml/l KH2PO4 2.1g/l KH2PO4 14.7g/l pH7.4 高压灭菌的肉汤冷却后加入磷酸钾。培养瓶在250rpm的旋转振荡器上在 30℃下培养24-36小时。这代表指数生长中期的早期。 上述方法易于通过本领域已熟知的方法扩大成发酵罐。 营养生长阶段通常为24-36小时。开始培养代表指数生长中期的早期,之 后,AB78细菌从培养物上清液中离心得到。培养物上清液中包含用于生物 检定活性蛋白质。 实施例3.昆虫生物检定 测试蜡状芽孢杆菌菌株AB78分别抗不同种类的昆虫如下:玉米根叶甲, 长角叶甲,瓜十一星叶甲(Diabrotica virgifera virgifera,D。longcornis barberi和D。undecempunctata howardi):稀释液用生长24-36小时的AB78 培养物上清液制得。与熔化的人工食品混合(Marrone等,(1985), 经济昆 虫学杂志,78:290-293),使其固化。固化食品切块后置于盘中,新生幼虫 置于食物上,保持在30℃,6天之后记录死亡率。 大肠杆菌克隆生物检定:大肠杆菌细胞在包含100μg/ml氨苄青霉素的肉 汤上生长过夜。10ml培养物超声处理3次,每次20秒,500μl的超声处理培 养物加入到熔化的玉米根叶甲食物中。 土豆甲虫(Leptinotarsa decemlineata):生长24-36小时的AB78培养物 上清液用Triton X-100(使其最终浓度为0.1%TX-100)制得稀释液。5cm2 的土豆叶片在此溶液浸一下,空气中干燥,置于塑料盘中的湿润滤纸上。新 生幼虫置于食物上,保持在30℃,6-8天后计算死亡率。 大黄粉虫(Tenebrio molitor)用生长24-36小时的AB78培养物上清液制 得稀释液。与熔化的人工食品(Bioserv #9240)混合,使其固化。固化食 品切块后置于盘中,新生幼虫置于食物上,保持在30℃,6天之后记录死亡 率。 玉米螟,小地老虎,烟芽夜蛾,烟草天蛾和甜菜夜蛾分别(Ostrinia nubilalis,Agrotis ipsilon,Heliothis virescens,Manduca serta,Spodoptera exigua):生长24-36小时的AB78培养物上清液用TX-100(最终浓度为 0.1%TX-100)制得稀释液。用移液管吸取100μl到18cm2到固化人工食品 (Bioserv #9240)的表面,空气中干燥。新生幼虫置于食物上,保持在30 ℃,3-6天后计算死亡率。 尖音库蚊(Culex pipiens):用生长24-36小时的AB78培养物上清液制得 稀释液。用移液管吸取100μl到有10ml水的30ml塑料杯中,三龄幼虫置于 水中,保持在室温下,24-48小时后计算死亡率。AB78的杀虫活性谱如表14。 表 14 AB78培养物上清液对不同种类的昆虫的活性 迄今所测的昆虫种类 目 活性 玉米根叶甲 (Diabrotica virgifera virgirera) 长角叶甲 (Diabrotica longicornis barberi) 瓜十一星叶甲 (Diabrotica undecimpunctata howardi) 土豆甲虫 (Leptinotarsa decemlineata) 大黄粉虫 (Tenebrio molitor) 玉米螟 (Ostrinia nubilalis) 烟芽夜蛾 (Heliothis virescens) 烟草天蛾 (Manduca serta) 甜菜夜蛾 (spodoptera exigua) 小地老虎 (Agrotis ipsilon) 尖音库蚊 (Culex pipiens) 鞘翅目 鞘翅目 鞘翅目 鞘翅目 鞘翅目 鳞翅目 鳞翅目 鳞翅目 鳞翅目 鳞翅目 双翅目 +++ +++ - - - - - - - - - 最近发现的蜡状芽孢杆菌菌株AB78与已知的得自Bt的鞘翅目活性的δ- 内毒素相比,杀虫活性谱显著不同。特别是,AB78比已知的鞘翅目活性的 Bt菌株对甲虫类有更强的选择活性。其中对Diabrotica属的几个种的有特别 的活性。尤其是对玉米根叶甲和长角叶甲的活性最大,但对瓜十一星叶甲无 活性。 检测许多芽孢杆菌菌株在营养生长期间对玉米根叶甲的活性。结果表 明:AB78有独特的抗玉米根叶甲的活性,这不是普遍现象。 表 15 芽孢杆菌属的几个种的培养物上清液对玉米根叶甲的活性 芽孢杆菌菌株 WCRW死亡百分率% 蜡状芽孢杆菌AB78(Bat.l) 蜡状芽孢杆菌AB78(Bat.2) 蜡状芽孢杆菌(Carolina Bio.) 蜡状芽孢杆菌ATCC 11950 蜡状芽孢杆菌ATCC 14579 蕈状芽孢杆菌(Carolina Bio.) 日本甲虫芽孢杆菌 苏云金芽孢杆菌HD135 苏云金芽孢杆菌HD191 苏云金芽孢杆菌GC91 苏云金芽孢杆菌isrealensis变种 水对照 100 100 12 12 8 30 28 41 9 4 24 4 AB78对玉米根叶甲的特并性活性在表16给出。 表 16 AB78培养物上清液对新生玉米根叶甲的活性 培养物上清液 浓度(μl/ml) WCRW死亡% 100 25 10 5 2.5 1 0 100 87 80 40 20 6 0 计算出半致死浓度(LC50)是玉米根叶甲食物中培养物上清液浓度为6.2 μl/ml。 对细胞团状沉淀也进行生物检定,表明对WCRW无活性。这样,活性仅 仅存在于上清液中表明VIP是一种外毒素。 实施例4.叶甲类活性蛋白质从AB78的分离和纯化 无细胞的培养介质和残骸通过加入固体硫酸铵(472g/L)制成70%饱和 液。室温下溶解,冰浴中冷却,10000×g离心30分钟使可沉淀的蛋白质沉 淀,丢弃上清液。团状沉淀在pH7.5下起始体积为20mM的1/10TRIS-HCl中溶解。溶解的沉淀通过透析进入pH为7.5的20mM TRIS-HCl中,或者通 过除盐层析柱除去盐分。 去盐物质用pH为2.5的20mM柠檬酸钠滴定到pH3.5,室温下温育30分钟 后,溶液在3000×g下离心10分钟,这个阶段的上清液包含着最大数量的活 性蛋白质。 pH中性化到7.0后,把上清液加入Mono-Q,阴离子交换,层析柱用20mM pH为7.5的Tris以300ml/分钟的流速平衡。层析柱用pH为7.5的在20mMTris 中的400mMNaCl逐步和线形梯度展开。 层析片段的生物检定和SDS-PAGE分析用于确定活性片段。SDS-PAGE 分析鉴别出生物活性蛋白质有一个分子量在大约80kDa到50kDa之间的组 分。 实施例5.叶甲类(corn rootworm)活性蛋白质的序列分析 由SDS-PAGE分离的80kDa组分转移到PVDF膜上,在ABI470脉冲液体 分析仪上通过重复的Edman循环进行氨基端序列分析,然后再转移进含有 10%甲醇、pH为11.0的10mM CAPS缓冲液中,步骤如下: 电泳后在转移缓冲液中凝胶温育5分钟,ProBlott PVDF膜用 100%MeOH短时间湿润,然后在转移缓冲液中平衡。在泡沫海绵和滤纸块 之间的三明治形物排列为:阳极-凝胶-膜-阴极。 转移在70V恒定电压下进行1小时。 转移后,膜以水漂洗,用在50%MeOH中的考马斯蓝R-250染色2分钟。 用50%MeOH、40%水、10%醋酸漂洗几次脱色。 脱色后,膜在空气中干燥,把条带切下进行序列分析,使用BlottCartridge 与适当的周期达到最大的效率和产量。数据使用610序列分析模型软件进行 分析,它能定性和定量测定每一个序列周期的PTH-氨基酸衍生物。 测到的N-端序列为: NH2-Lys-Arg-Glu-Ile-Asp-Glu-Asp-Thr-Asp-Thr-Asx-Gly-Asp-Ser-Ile- Pro-(SEQ ID NO:8),其中Asx代表Asp或Asn。80kDa组分的全部氨基酸序 列在SEQ ID NO:7给出。编码SEQ ID NO:7蛋白质的DNA序列在SEQ ID NO:6给出。 实施例6.DNA探针的结构 本发明生成了探察编码N-末端序列氨基酸3-9的基因区域(实施例5)的寡 核苷酸探针。探针是在苏云金芽孢杆菌(Bt)的密码子使用基础上合成的。寡 核苷酸序列 5′-GAA ATT GAT CAA GAT ACN GAT-3′(SEQ ID NO:9) 用作Southern杂交的探针。寡核苷酸用标准的方法和设备合成。 实施例7.叶甲类活性蛋白质的等电点测定 从纯化步骤的第五步得到的纯化蛋白质使用快速凝胶电泳系统 (Pharmacia)在PI为3-9的等电聚焦凝胶上分析。分离和银染展开步骤都使用 此系统的标准操作步骤。PI值大约为4.9。 实施例8.AB78的PCR数据 使用PCR分析(参见如美国专利申请序列号No.08,008,006;和Carozzi 等,(1991), 应用环境微生物,57(11):3057-3061,本文一并参考)检验到 蜡状芽孢杆菌菌株AB78不含任何苏云金芽孢杆菌或球形芽孢杆菌的杀虫结 晶蛋白质基因(第17表)。 表 17 由PCR测定的抗AB78 DNA的芽孢杆菌杀虫结晶蛋白质基因的引 物 测试引物 产生的产物 对CryIIIA特异性的2组 CryIIIB 对CryIA特异性的2组 CryIA(a) CryIA(b)特异性的 CryIB CryIC特异性的 CryIE特异性的 对球形芽孢杆菌特异性的2组 对CryIV特异性的2组 芽孢杆菌属对照(PI-PLC) 阴性 阴性 阴性 阴性 阴性 阴性 阴性 阴性 阴性 阴性 阳性 实施例9.得自蜡状芽孢杆菌菌株AB78的总DNA的粘粒克隆 在从菌株AB78制备的总DNA中克隆出VIP1A(a)基因的步骤如下: AB78 DNA分离如下: 1.细菌在10ml的L-肉汤中生长过夜。(使用50ml的无菌离心管) 2.加25ml的新鲜L-肉汤和氨苄青霉素(30μg/ml)。 3.细胞在30℃下生长2-6小时,同时振荡。 4.50ml的聚丙烯桔色盖试管在IEC桌面临床离心机中以3/4转速旋转细 胞。 5.把细胞团状沉淀重新悬浮在10mlTES(TES=50mM TRIS pH8.0, 100mM EDTA,15mMNaCl)中。 6.加30mg溶菌酶,在37℃下培养2小时。 7.加200μl 20%的SDS和400μl蛋白质酶K原种(20mg/ml),在37℃下培 养。 8.加200μl新鲜蛋白质酶K,55℃下培养1小时。加5ml TES使最终体积 达到15ml。 9.酚提取两次(10ml酚,室温下在IEC桌面临床离心机中以3/4的转速旋 转)。使用宽内径移液管把上清液(上相)转移到干净试管中。 10.用1∶1(体积)的酚:三氯甲烷/异戊醇(24∶1比率)再抽提一次。 11.用相等体积的冷异丙醇沉淀DNA;离心使沉淀成团状。 12.团状沉淀在5ml TE中重新悬浮。 13.用pH为5.2的0.5ml 3M NaOAc和11ml的95%乙醇沉淀DNA,在-20℃ 下放置2小时。 14.用塑料环从试管中“钩出”DNA,转移到一个小离心管中,旋转离 心,用移液管吸去多余的乙醇,真空中干燥。 15.在0.5ml的TE中重新悬浮,培养90分钟。在65℃下把DNA放回溶液 中。 16.用标准方法测定浓度。 AB78的粘粒克隆 除非特别指出,所有方法都根据Stratagene方法,Supercos1指导手册, cat.No.251301进行。 一般步骤如下: A.AB78 DNA用Sau 3A部分消化 B.载体DNA制备 C.DNA的连接和包装 D.Tittering粘粒文库 1.把50ml的过夜培养物放置在有0.2%麦芽糖的5ml TB上,开始 HB101细胞的培养。在37℃下培养3.5小时。 2.旋转离心出细胞,重新悬浮进0.5ml 10mM MgSO4中。 3.再加上: 100l cells 100l稀释的包装混合物 100l 10mM MgSO4 30l TB 4.在室温下吸附30分钟,不振荡。 5.加1ml TB,并使之慢慢混合。在37℃下培养30分钟。 6.把200l平铺在L-amp平板上。在37℃下培养过夜。 随机选择至少400个粘粒克隆,如实施例3所述筛选抗玉米根叶甲的活性 物。得自5个活性克隆和5个非活性克隆的DNA用于Southern杂交。结果表 明:使用上述的寡核苷酸探针杂交结果与对玉米根叶甲的活性相关(表18)。 粘粒克隆P3-12和P5-4保藏于农业研究机构保藏中心(NRRL)北方地区 研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号),保藏 号分别为NRRL B-21061和NRRL B-21059。 表 18 AB78粘粒克隆对玉米根叶甲的活性 克隆 平均死亡率(N=4) 与探针杂交的克隆: P1-73 47 P1-83 64 P2-2 69 P3-12 85 P5-4 97 不与探针杂交的克隆: P1-2 5 P3-8 4 P3-9 12 P3-18 0 P4-6 9 实施例10.对玉米根叶甲有活性的一个6KB区域的鉴别 P3-12的DNA用限制性内切酶Sau 3A部分消化,连接到大肠杆菌载体 pUC19内,转移进大肠杆菌。特异地探察80KDa VIP1A(a)的探针通过 P3-12DNA的一部分PCR扩增合成。与VIP1(a)一部分杂交的寡核苷酸 MK113和MK117使用80kDa蛋白质的部分氨基酸合成。质粒亚克隆通过菌 落和PCR生成的探针进行杂交来鉴别,并测其抗玉米根叶甲的活性。与PCR 生成的片段杂交的这样一个克隆PL2在上述测定中对玉米根叶甲是活性 的。 得自pL2的一个6kb Cla I限制性片段被克隆进大肠杆菌-芽孢杆菌穿梭载 体PHT3103的的Sma I位点(Lereclus,D.等, FEMS微生物通信,60:211-218 (1989))生产pCIB6201。这个构建体的抗玉米根叶甲活性超过芽孢杆菌和大 肠杆菌菌株。在pBluescript SK(+)载体内(Stratagene)包含同样的6kb cla 1片段的pCIB6022产生出相当的CIP1(a)蛋白质(通过western印迹),这个 蛋白质对玉米根叶甲也是活性的。 pCIB6022的核苷酸序列通过双脱氧末端法(Sanger等, 美国科学院学 报,74:5463-5467(1 977)),使用PRISM Ready Reaction Dye双脱氧末 端循环测序试剂盒和PRISM SequenaseR末端双链DNA测序试剂盒在 ABI373自动测序仪上分析。序列在SEQ ID NO:1中给出。通过SEQ ID NO:1中叙述的开放读框表明:6kb片段编码VIP1A(a)和VIP2A(a)。编码 VIP2A(a)的序列在SEQ ID NO:4中提供。VIP1A(a)和VIP2A(b)在发现于 pCIB6022的6kb片段的关系在表19中描述。pCIB6022保藏于农业研究机构 保藏中心(NRRL)北方地区研究中心(美国,伊利诺斯州61604,彼奥利 亚,北大学街1815号),保藏号为NRRL B-21222。 实施例11.VIP1A(a)DNA区功能分析 为证明VIP1A(a)开放读框(ORF)对于杀虫活性是必须的。在基因 中创造出一个翻译移码突变。限制性内切酶Bgl II识别把857bp定位进 VIP1A(a)密码区的单一位点。pCIB6201用Bgl II消化,并且以DNA聚合酶 (Klenow片段)和dNTPS添补单链末端。重新与质粒连结转化进大肠杆菌。 产生的质粒pCIB6203在VIP1A(a)的编码区包含着四个核苷酸插入序列。 pCIB6203对WCRW无杀虫活性,证明VIP1A(a)是对WCRW活性的本质成 分。 为进一步限定编码VIP1A所必须的区域,构建了VIP1A(a)和 VIP2A(a)(辅助蛋白质)区的亚克隆,并测其互补pCIB6203突变的能力。 pCIB6203包含在pBluescript SK(+)载体(Stratagene)中的Xbal-EcoRV片 段。western印迹分析表明:pCIB6023产生的VIP1A(a)蛋白质与克隆PL2 和pCIB6022产生的蛋白质大小和数量相等。pCIB6023包含编码上述80kDa 蛋白质的完整基因。pC1B6023保藏于农业研究机构保藏中心(NRRL)北 方地区研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号), 保藏号为NRRL B-21223N。pCIB6206包含在pBluescript SK(+)载体 (Stratagenc)中得自pCIB6022的4.3kb的Xbal-Cla I片段。pCIB6206也保藏 于农业研究机构保藏中心(NRRL)北方地区研究中心(美国,伊利诺斯州 61604,彼奥利亚,北大学街1815号),保藏号为NRRL B-21321。 pCIB6023,pCIB6206,和pCIB6203单个测试时不产生可检测的对玉米 根叶甲的活性。然而,包含pCIB6203(VIP1A(a)突变,加上VIP2A(a)) 的细胞和pCIB6023(只有VIP1A(a))的细胞的混合物表现出对玉米根叶甲 的高度活性。同样地,包含pCIB6206的细胞和pCIB6203的细胞的混合物显 示对玉米根叶甲的高度活性。 为进一步确定VIP2A(a)的界限,我们构建了pCIB6024,它包含着完 整的VIP2A(a),但是缺乏VIP1A(a)的大部分编码区。pCIB6024通过凝 胶纯化得自pCIB6022的2.2kb Cla I限制性片段构建,并用DNA聚合酶 (Klenow片段)和dNTPs添补单链末端,然后把这个片段连结进用酶Eco RV 消化的pBluescript SK(+)载体内(Stratagene)。包含pCIB6024的细胞不 表现对玉米根叶甲的活性。但包含pCIB6024的细胞和pCIB6023的细胞的混 合物显示出对玉米根叶甲的高度活性(参见表19)。 这样,pCIB6023和pCIB6206一定产生一个功能性的VIPIA(a)基因产 物,而pCIB6203和pCIB6024一定产生一个功能性的VIP2A(a)基因产物。 这些结果表明:需要得自VIP2A(a)区的基因产物与VIP1A(a)结合,才能产 生最大的抗玉米根叶甲的活性(参见表19)。 表 19 pCIB6022的特征 VIP的功能互补 方框区表示VIP1A(a)和VIP2A(a)的范围。白方框表示编码在芽孢杆菌中观 察到的80kDa肽链的VIP1区域。黑方框表示由DNA序列分析指出的 VIP1A(a)的N-末端“前肽”。打点方框表示VIP2A(a)的编码区。大“X” 表示导入VIP1A(a)的移码突变位置。箭头表示由β-半乳糖苷酶转录的结 构。 实施例12.AB78抗体产生 抗体产生在两只Lewis大鼠中开始,要求有移动杂交瘤细胞系产物的可能 性并能为基因组DNA文库的极限筛选产生足够的血清。另一个因素是可供 使用的抗原数量非常有限以及它仅能够用PAGE纯化随后转移到硝酸纤维 素膜上的事实。 由于在硝酸纤维素上得到的抗原有限,硝酸纤维素在DMSO中乳化,并 注射进动物的后脚掌,以在(popliteal)淋巴结的上游得到B-细胞产物。通 过用开始的血进行Werstern印迹分析判断,产生了高效价的血清。随后的 几次注射和放血产生完成筛选需要的所有血清。 然后开始另一只大鼠的杂交生产。取下popliteal淋巴结,离析产生的细 胞与小鼠骨髓瘤P3x63Ag8.653融合。随后按下述的方法完成细胞筛选。选 择四个对极限稀释克隆有最高乳化抗原反应的initial孔。选择另外的10个孔 用于扩展或深低温保存。 在DMSO中乳化硝酸纤维素膜上的AB78以利于筛选的步骤: 把在PAGE中电泳的AB78样品转移到硝酸纤维素膜上后,使用可逆菌株 Ponceau S使所有的转移的蛋白质显示出来。鉴别出相对应于AB78毒素(前 面已经鉴别并N-末端测序)的带,并从硝酸纤维素膜上切割下来。每条带大 约1mm×5mm大小,以使被乳化的硝酸纤维素的量最小。单个的带放于有 250μl的微离心管内,使用塑料研钵离析(Kontes,Vineland,NJ)。为促 进乳化,DMSO混合物加热到37-45℃下2-3分钟。加热后可能需要进一步 的离析,但是所有的硝酸纤维素膜都应该乳化。在AB78样品乳化后,立即 置于冰上。为用乳化抗原包被微滴定板,样品必须在硼酸盐溶液中稀释如 下:1∶5,1∶10,1∶15,1∶20,1∶30,1∶50,1∶100和0。包被的抗体必须现配 现用。 ELISA方法: 1.在BBS中用AB78/DMSO包被。在4℃下培养过夜。 2.用1×ELISA洗涤缓冲液洗涤平板3次。 3.在室温下封闭(在含有1%BSA和0.05%Tween20的PBS中)30 分钟。 4.用1×ELISA洗涤缓冲液洗涤平板3次。 5.加入大鼠血清。在37℃下培养1.5小时。 6.用1×ELISA洗涤缓冲液洗涤平板3次。 7.加入浓度为2μg/ml的山羊抗大鼠到ELISA稀释液中,37℃下培养 1小时。 8.用1×ELISA洗涤缓冲液洗涤平板3次。 9.加入2μg/ml的兔抗山羊碱性磷酸酶到ELISA稀释液中,37℃下培 养1小时。 10.用1×ELISA洗涤缓冲液洗涤平板3次。 11.加入底物,在室温的培养30分钟。 12.30分钟后用3N NaOH停止反应。 VIP2A(a)抗血清的制备 部分纯化的AB78培养物上清液用不连续的SDS-PAGE(Nevex)按制造厂 商的说明分离。分离的蛋白质按Towbin等(1979)所述的方法电泳到硝酸 纤维素膜上(S & S#21640)。硝酸纤维膜用Ponceau S染色,鉴别出VIP2A(a) 带。注射前切下VIP2A(a)带并立即在DMSO中乳化。用乳化的VIP2A(a)与 弗氏完全佐剂大约1∶1的混合物在四个不同位点肌肉注射开始免疫兔子。随 后每四周一次的免疫除了不使用弗氏完全佐剂外与第一次相同。在VIP2A (a)蛋白质免疫反应后,收获第一次血清。使用这种血清对AB78培养物上 清液的western印迹分析鉴别出大多全长度的VIP2A(a)蛋白质。 实施例13.带AB78 VIP克隆的非活性BT菌株的杀虫活性的激活 pCIB6203与得自Bt菌株GC91的24小时的培养物(指数生长中期的早 期)上清液一起导致玉米根叶甲的100%死亡。pCIB6203和GC91单独对玉 米根叶甲都无活性。数据如下: 测试材料 玉米根叶甲的死亡百分率 pCIB6203 GC91 pCIB6203+GC91 对照 0 16 100 0 实施例14.蜡状芽孢杆菌AB81的分离和生物活性 定名为AB81的第二种蜡状芽孢杆菌菌株是通过标准方法从谷物箱粉末 样品中分离的得到的。如实施例2的方法培养和制备AB81亚克隆以进行生物 检定。生物活性用实施例3中描述的方法进行评价,结果如下: 测试的 昆虫种类 死亡百分率 玉米螟 小地老虎 玉米根叶甲 0 0 55 实施例15.苏云金芽孢杆菌的分离和生物活性 定名为AB6的苏云金芽孢杆菌是通过本领域中已知的标准方法从谷物箱 粉末中分离得到的。如实施例2所示的方法培养和制备AB6的亚克隆以进行 生物检定。一半样品高压灭菌15分钟后,测定β-外毒素的存在。 生物活性用实施例3所述的方法评价,结果如下: 测试的 昆虫种类 死亡百分率 玉米螟 小地老虎 小地老虎(接种样品) 玉米根叶甲 0 100 0 0 高压灭菌后,培养物上清液的杀虫活性降低到不明显的水平证明了活性 素不是β-外毒素。 菌株AB6保藏于农业研究机构保藏中心(NRRL)北方地区研究中心(美 国,伊利诺斯州61604,彼奥利亚,北大学街1815号),保藏号为NRRL B-821060。 实施例16.苏云金芽孢杆菌AB88的分离和生物学活性。 定名为AB88的苏云金芽孢杆菌是通过标准方法从谷物箱粉末中分离得 到的。如实施例2所示的方法培养和制备AB6的亚克隆以进行生物检定。一 半样品高压灭菌15分钟后,测定β-外毒素的存在。生物活性用实施例3所述 的方法评价结果如下: 测试的 昆虫种类 目 培养物上清液的死亡百分率 没有高压灭菌 高压灭菌 小地老虎 玉米螟 草地贪夜蛾 玉米夜蛾 烟芽夜蛾 土豆甲虫 玉米根叶甲 鳞翅目 鳞翅目 鳞翅目 鳞翅目 鳞翅目 鞘翅目 鞘翅目 100 100 100 100 100 0 0 5 0 4 12 12 0 5 高压灭菌后,培养物上清液的杀虫活性降低到不明显的水平证明了活性 素不是β-外毒素。 Δ-内毒素结晶通过标准方法从菌株AB88中纯化得到。在对小地老虎的 生物检定时,没有观察到纯结晶有活性。 实施例17.得自菌株AB88的VIP的纯化: 细菌液体培养物在TB培养基中30℃下生长过夜(12小时)。细胞在5000 ×g下离心20分钟,保留上清液。存在于上清液中的蛋白质用硫酸铵(70% 饱和度)沉淀。离心(5000×g下15分钟),保留团状沉淀。团状沉淀在pH 为7.5最初体积为20mM的Tris中重新悬浮。在4℃下对同样的缓冲液透析过 夜。AB88透析液与AB78中的类似物质相比更浑浊。透析液用20mM柠檬酸 钠(pH 2.5)滴定到pH4.5,在室温下培养30分钟。溶液在3000g下离心10分 钟。蛋白质团状物重新溶解在20mM pH为9.0的Bis-Tris-Propane中。 澄清化后,AB88蛋白质通过下列几种不同的方法分离:等电点聚焦 (Rotofor,BioRad,Hercules,CA),pH4.5下沉淀,离子交换色谱,大小 排阻色谱以及超滤作用。 蛋白质在Poros HQ N阴离子交换层析柱(PerSeptive生物系统,剑桥, MA)上使用从0到500mM NaCl的线形梯度在20mM pH为9.0的Bis-Tris- Propane中以4ml/分钟的流速分离。杀虫蛋白质在250mM NaCl中洗脱。 玉米螟(ECB)活性蛋白质保留在由透析液在pH为4.5下沉淀获得的团状 沉淀中。使用pH值3-10的两性电解质在透析液中制备IEF时,ECB杀虫活性 在用pH为7或更大得到的所有片段中都有杀虫活性发现。这些片断的SDS- PAGE分析显示出分子量为大约60kDa和大约80kDa的蛋白质带。60kDa和 80kDa带用阴离子交换HPLC在Poros-Q层析柱上分离(PerSeptive生物系 统,剑桥,MA)。N-末端序列从包含分子量稍有不同但大小都约为60KDa 的两个片断中获得。获得的序列相互之间相似,而且和一些δ-内毒素相似。 阴离子交换片断23(较小):xEPFVSAxxxQxxx(SEQ ID NO: 10) 阴离子交换片断28(较大):xEYENVEPFVSAx(SEQ ID NO: 11) 当ECB活性的pH为4.5的团状沉淀进一步在Poros-Q层析柱上通过阴离 子交换分离。活性只在主要包含约60KDa带的片段中有发现。 当AB88透析液pH降到4.5时,小地老虎活性蛋白质也保留在团状沉淀 内。使用pH3-10的两性电解质制备的IEF中,在ECB活性的IEF片断中没有 发现对BCW的活性;代替的是,它在pH4.5-5.0中的片段的活性是最高的, 它的主要组分分子量为大约35KDa和大约80KDa。 pH4.5团状沉淀用阴离子交换HPLC分离,产生只包含35KDa物质的片段 和包含35KDa和80KDa带的片段。 实施例18.AB88 VIP的定性 包含不同对鳞翅目昆虫有活性的营养生长时期蛋白质的片段如实施例17 所述生成。有杀虫活性的片段在8-16%的SDS-聚丙烯酰胺凝胶中分离,并 转移到PVDF膜上[LeGendre等,(1989):用于微序列分析的蛋白质和肽纯 化实用指南,ed Matsudaria PT(学术出版公司,纽约]。片段的生物分析证 明:不同的VIP负责对不同的鳞翅目种类的活性。 对小地老虎活性是由于80kDa和/或35kDa蛋白质,不管是单独或结合施 用。这些蛋白质和已知的Btδ-内毒素序列无同源性,证明它们和任何Bt的 δ-内毒素无关。得自菌株AB88的vip3A(a)杀虫蛋白质主要存在于AB88的培 养物上清液内(至少为总数的75%)。 这些蛋白质在AB88Btδ-内毒素结晶中也没有找到。主要的δ-内毒素蛋 白质的N-末端序列与80kDa和35kDa VIP的N-末端序列相比,没有表现出序 列同源性。vip3A(a)杀虫蛋白质的N-末端序列有许多正电荷残基(从Asn2 至Asn7),其后有疏水核心区(从THR8至Ile34)。不同于大多数已知的 分泌蛋白质,菌株AB88的vip3A(a)杀虫蛋白质在输出时不是N-末端加工。 结果概述如下: 地老虎VIP N-末端序列 序列 主要δ-内毒素蛋白质的N-末端 NO:14) 80kDa MNKNNTKLPTRALP(SEQ ID NO:12) ID NO:12) NO:16) 35kDa ALSENTGKDGGYIVP(SEQ ID NO:13) 130KDa MDNNPNINE(SEQ ID 80kDa MDNNPNINE(SEQ 60kDa MNVLNSGRTTI(SEQ ID 对玉米螟活性是由于60kDa的VIP,对草地贪夜蛾活性是由于一个未知大 小的VIP。 苏云金芽孢杆菌菌株AB88保藏于农业研究机构保藏中心(NRRL)北 方地区研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号), 保藏号为NRRL B-21225。 实施例18A.苏云金芽孢杆菌AB428的分离和生物活性 定名为AB424的苏云金芽孢杆菌菌株用本领域已知的标准方法从藓类覆 盖的松球果样品中分离到的。如实施例2所述培养并制备AB424的继代培养 物以用于生物检定。生物活性用实施例3所述的方法评价,结果如下: 测试的 昆虫种类 死亡百分率 玉米螟 小地老虎 玉米根叶甲 100 100 0 菌株AB424保藏于农业研究机构保藏中心(NRRL)北方地区研究中 心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号),保藏号为NRRL B-21439。 实施例18B.编码小地老虎活性蛋白质的VIP3A(a)和VIP3A(b)基因的克 隆 分离出分离菌AB88和AB424的总DNA[Ausubel等(1988),分子生物学 通用方法(John Wiley & Sons,NY)],用限制性酶Xbal(苏云金芽孢杆菌 AB88 DNA的4.0至5.0Kb大小级别的Xbal片段的文库)和EcoRl(苏云金芽 孢杆菌AB424的4.5-6.0Kb大小级别的EcoRl片段的文库)分别消化,连结进 pBluescript载体,用同样的酶线形化,再去磷酸化,然后转化进大肠杆菌 DH5α菌株。重组体克隆印迹进硝酸纤维素滤纸,随后用32P标记的33个碱 基长的相对应于对小地老虎活性的80KDa蛋白质N-端的11个氨基酸的寡核 苷酸探察。 42℃下在2×SSC/O.1%SDS(1×SSC=0.15M NaCl/O.O15M柠檬酸钠, pH7.4)中杂交5分钟,然后在50℃下1×SSC/O.1%SDS中杂交两次10分钟。 在400个重组体克隆中有四个是阳性的。阳性重组体的昆虫生物检定表明对 小地老虎幼虫有和AB88或AB424上清液类似的毒性。 质粒pCIB7104包含AB88 DNA的一个4.5Kb的Xbal片段。建立亚克隆以 限定杀虫蛋白质的编码区。 大肠杆菌pCIB7105通过把pCIB7104的3.5kb Xbal-Accl片段克隆进 pBluescript载体来构建。 质粒pCIB7106包含AB424 DNA的一个5.0Kb的EcoRl片段。片段进一步 用HincII消化,产生一个2.8kb的EcoRI-HincII插入序列(pCIB7107),它仍 能编码有功能的杀虫蛋白质。 pCIB7104、AB88的阳性重组体克隆、pCIB7107以及AB424的阳性重组 体克隆的核苷酸序列用Sanger等( 美国科学院学报,74:5463-5467(1977)) 的双脱氧末端法测定,使用PRISM Ready Reaction Dye双脱氧末端循环测 序试剂盒和PRISM SequenaseR末端双链DNA测序试剂盒在ABI 373自动测 序仪上分析。 克隆pCIB7104包含着VIP3A(a)基因,其编码区SEQ ID NO:28给出, 编码的蛋白质序列SEQ ID NO:29给出。设计在玉米中高度表达的编码区 的合成物由本SEQ ID NO:30给出。基于SEQ ID NO:29给出的氨基酸序 列可以设计许多合成基因。 克隆pCIB7107包含着VIP3A(b)基因,其编码区在SEQ ID NO:31中给 出,编码的蛋白质序列在SEQ ID NO:32中给出。pCIB7104和pCIB7107 都保藏于农业研究机构保藏中心(NRRL)北方地区研究中心,保藏号分别 为NRRL B-21422和B-21423。 VIP3A(a)基因包含着一个开放读框(ORF),它从核苷酸732伸展至3105。 这个ORF编码一个分子量为88,500道尔顿的791个氨基酸的肽链。一个 Shine-Dalgarno(SD)序列定位在第一个蛋氨酸之前的6个碱基处,它的序 列鉴别为对芽孢杆菌的强的SD。 VIP3A(b)基因98%等同于VIP3A(a)。 分离自苏云金芽孢杆菌AB88细胞的总DNA的blost用一个跨VIP3A杀虫 蛋白质的N末端区域的33个碱基的片段探察。单个带可在不同的限制性消化 时观察到。这个结果通过使用更大的跨基因编码区的探针证实。GenBank 资料库碱基的研究表明它和已知蛋白质无同源性。 实施例18C.VIP3A杀虫蛋白质的表达 VIP3A(a)杀虫蛋白质表达的时间过程用Western印迹法分析。得自苏 云金芽孢杆菌AB88培养物的样品完全通过生长曲线和孢子形成期。 VIP3A(a)杀虫蛋白质在开始培养15小时之后就可在对数生长期的AB88培 养物上清液中检测到。它在稳定生长阶段的早期达到最高水平,并在孢子形 成期间和此期后仍然保持着较高水平。当使用AB424蜡状芽孢杆菌培养物上 清液时获得了类似的结果。如同用Northern印迹测定的结果一样,VIP3A(a) 杀虫蛋白质的水平反映了VIP3A(a)基因的表达。孢子形成期的开始通过显 微镜直接观察和测定δ-内毒素在细胞团状沉淀中的存在来决定。Cry-I型蛋 白质可在稳定期后期、孢子形成期和此期之后检测到。 实施例18D.类似于VIP3的新基因的杂交鉴定 为确定得自分离菌AB88的芽孢杆菌包含着与VIP3A有关的基因,通过杂 交筛选芽孢杆菌的收集品。463个芽孢杆菌菌株的培养物生长在微滴定孔中 直到孢子形成。96-针菌落0印模(stampel)用于把培养物转移到包含L-琼脂 的150mm平板上。接种板保持在30℃下10小时,再在4℃下过夜。菌落印 迹进尼龙滤纸,用1.2Kb HindIII的VIP3A(a)衍生片段探查。使用Maniatis 等( 分子克隆实验室手册(1982))的杂交条件在62℃下杂交过夜。滤纸 用2×SSC/O.1%SDS在62℃下洗涤,并对x-射线底片曝光。 所筛选的463个芽孢杆菌菌株中,有60个菌株包含着可用杂交检测到的类 似于VIP3的基因。它们中的一些(AB6和AB426)的特征还表明它们的上清液 中包含着BCW杀虫蛋白质,这个蛋白质与对BCW有活性的VIP3蛋白质类 似。 实施例18E.包含着一个隐蔽的类似于VIP3的基因的苏云金芽孢杆菌菌 株M2194的特性 定名为M2194的苏云金芽孢杆菌菌株,通过在实施例18C中所述的菌落 杂交表明包含类似于VIP3的基因。与M2194 VIP3类似的基因被认为是隐蔽 的,因为在整个细菌生长阶段不管是通过抗从AB88中分离到的VIP3蛋白质 的多克隆抗体的免疫印迹分析还是通过在实施例3中所述的生物检定都无法 检测到其表达。 抗纯化的VIP3A(a)杀虫蛋白质的抗血清在兔中产生。硝酸纤维素结合的 蛋白质(50μg)溶解在DMSO中,用弗氏完全佐剂(Difco)乳化。两只兔皮下 注射三个月,每月一次。第二次和第三次注射10天后放血,血清从血样品中 制得。[Harlow等,(1988),抗体:实验室手册(冷泉港实验室出版社, Plainview,NY)]。 M2194与类似于VIP3的基因通过在实施例9中创造pCIB7108的方法克 隆进PKS。包含pCIB7108(它包含M2194 VIP3基因)的大肠杆菌对小地老 虎是活性的,证明此基因编码带杀虫活性的有功能的蛋白质。质粒pCIB7108 保藏于农业研究机构保藏中心(NRRL)北方地区研究中心,保藏号为NRRL B-21438。 实施例18F.VIP3A蛋白质的杀虫活性 VIP3A杀虫蛋白质的活性谱在用带VIP*A的重组大肠杆菌饲喂幼虫的昆 虫生物检定中定量测定。在这些测定中,携带VIP3A(a)和VIP3A(b)基因的 细胞对小地老虎,草地贪夜蛾,甜菜夜蛾,烟芽夜蛾,玉米夜蛾是有杀虫活 性的。在同样的实验条件下,包含VIP3A蛋白质的细菌浸提液没表现出任何 抗玉米螟的活性。 VIP*A对小地老虎幼虫的效果 处理 死亡百分率 TB培养基 AB88上清液 AB424上清液 缓冲液 大肠杆菌pKS 大肠杆菌pCIB7104(AB88) 5 100 100 7 10 100 大肠杆菌pCIB7105(AB88) 大肠杆菌pCIB7106(AB424) 大肠杆菌pCIB7107(AB424) 100 100 100 VIP3A杀虫蛋白质对鳞翅目昆虫幼虫的效果 处理 昆虫 死亡百分率(%) 大肠杆菌pKS 勤克俭 大肠杆菌pCIB7105 大肠杆菌pCIB7107 BCW FAW BAW TBW CEW ECB BCW FAW BAW TBW CEW ECB 10 5 10 8 10 5 100 100 100 100 50 10 BCW=小地老虎;FAW=草地贪夜蛾;BAW=甜菜夜蛾;TBW=烟芽夜 蛾; CEW=玉米夜蛾;ECB=玉米螟 实施例19.芽孢杆菌属其它种的分离和生物活性 可把营养生长期间产生杀虫活性蛋白质的其它芽孢杆菌属种类分离出 来。这些菌株是用标准方法从环境样品中分离的。制备分离物用于实施例2 和实施例3中分别叙述的生物检定和测定。在营养生长期间产生在生物检定 中对小地老虎有活性的杀虫蛋白质的分离物列于下表;在δ-内毒素结晶的 存在与营养生长期间的杀虫蛋白质的产生之间没有观察到相关关系。 芽孢杆菌属分离菌 δ-内毒素结晶的存在 死亡百分率 AB6 AB53 AB88 AB195 AB211 AB217 AB272 AB279 AB289 AB292 AB294 AB300 AB359 + - + - - - - - + + - - - 100 80 100 60 70 83 80 70 100 80 100 80 100 分离物AB289,AB294和AB359保藏于农业研究机构保藏中心(NRRL) 北方地区研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号), 保藏号分别为NRRL B-21227,NRRL B-821229和NRRL B-21226。 在营养生长期间产生对玉米根叶甲有活性的杀虫蛋白质的芽孢杆菌属分 离物如下表。 芽孢杆菌属分离物 δ-内毒素结晶的存在 死亡百分率 AB52 AB59 AB68 AB78 AB122 AB218 AB256 - - + - - - - 50 71 60 100 57 64 64 分离物AB59和AB256保藏于农业研究机构保藏中心(NRRL)北方地区 研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号),保藏 号分别为NRRL B-21228,NRRL B-821230。 实施例20.类似于VIP1/VIP2的新基因的杂交鉴定 为鉴别包含与在AB78的VIP1A(a)/VIP2A(a)区发现的基因相关的基因, 用杂交筛选芽孢杆菌菌株的收集物。463个芽孢杆菌属菌株的独立培养物生 长在96孔微滴定盘的孔中(共五个盘)直到培养物形成孢子。测试的菌株中, 基于δ-内毒素结晶的存在或缺乏把288个菌株归类为苏云金芽孢杆菌,175 个归类为其它芽孢杆菌属种类。对于每个微滴定盘,使用96-针菌落印模转 移大约100μl孢子培养物到两个包含L-琼脂的150mm平板上。接种板在30 ℃下生长4-8小时,然后冷却到4℃。再把菌落转移到尼龙网上,用本领域已 知的方法水解细胞。滤纸与包含VIP1A(a)和VIP2A(a)DNA序列的DNA片段 产生的探针杂交。杂交使用Church和Gilbert的杂交条件在65℃下过夜 (Church,G.M.,W.Gilbert,美国科学院学报,81:1991-1995(1984))。 滤纸用包含0.1%SDS的2×SSC在65℃下洗涤,并对X-底片曝光。 在供筛选的463个芽孢杆菌属菌株中,鉴定出55个菌株和 VIP1A(a)/VIP2A(a)探针杂交。从这些菌株的22个中分离DNA,使用 Southern印迹法用VIP1(a)/VIP2A(a)DNA作为探针分析。基于Southern印 迹的方式将这些菌株分为8类,每一类都和AB78的Southern印迹的方式不 同。其中一类的方式和苏云金芽孢杆菌变种tenebrionis的VIP1(a)/VIP2A(a) 同系物的方式相同(见下面)。测定22个菌株每一个对玉米根叶甲(WCRW) 的活性。发现AB433,AB434和AB435三个菌株对WCRW有活性。使用 VIP2(a)抗血清Western印迹方式表明菌株AB6,AB433,AB434,AB435, AB444和AB445产生的蛋白质大小与VIP2A(a)相当。 在供鉴定的菌株中,最显著的是苏云金芽孢杆菌菌株AB6(NRRL B- 21060),如实施例15所述,它产生抗小地老虎(Agrotis ipsilon)的VIP活性, 用对VIP2A(a)的多克隆抗血清的Werstern印迹分析表明AB6产生和 VIP2A(a)相似的VIP,但是杀虫活性谱不同。 实施例21.得自苏云金芽孢杆菌变种TENEBRIONIS的VIP1(a)/VIP2A(a) 同系物的克隆 用Southern印迹技术测定几个已经定性的芽孢杆菌菌株是否有与 VIP1(a)/VIP2A(a)相似的DNA的存在。并分析芽孢杆菌菌株AB78,AB88, GC91和ATCC10876的DNA是否有与VIP1(a)/VIP2A(a)类似序列的存在。 Bt菌株GC91,HD-1和Bc菌株ATCC10876的DNA不和VIP1(a)/VIP2A(a)杂 交,表明它们缺乏和VIP1(a)/VIP2A(a)基因类似的序列。相似的,杀虫菌株 AB88(实施例16)的DNA不和VIP1(a)/VIP2A(a)的DNA杂交,表明由这个 菌株产生的VIP活性不是由VIP1(a)/VIP2A(a)同系物造成的。相对而言,苏 云金芽孢杆菌变种tenebrionis(Btt)包含着能和VIP1(a)/VIP2A(a)杂交的序 列,进一步的分析证明Btt包含与VIP1(a)/VIP2A(a)类似的序列。 为确定VIP2A(a)和VIP1(a)的Btt同系物的特征,克隆了编码这些蛋白质 的基因。Southern印迹分析鉴定出一个9.5kb Eco RI限制型片段。基因组 DNA用Eco RI消化,凝胶纯化长度大约为9.5kb的DNA片段。这段DNA连结 进用Eco RI消化的pBluescript SK(+)载体,转化进大肠杆菌以产生质粒 文库。大约10,000菌落通过菌落杂交筛选VIP2A(a)同源序列的存在,鉴定出 28个阳性菌落。所有的28个克隆是一致的,都包含着VIP1A(a)/VIP2A(a)同 系物。克隆pCIB7100保藏于农业研究机构保藏中心(NRRL)北方地区研 究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号),保藏号 为NRRL B-21322。几个亚克隆从pCIB7100构建。一个得自pCIB7100的 3.8kb的Xba I片段被克隆进pBluescript SK(+)载体,产生pCIB7101。得自 pCIB7100的1.8kb的HindIII片段和一个1.4kb的HindIII片段被克隆 pBluescript SK(+)载体,分别产生pCIB7102和pCIB7103。亚克隆 pCIB7101,pCIB7102和pCIB7103保藏于农业研究机构保藏中心(NRRL) 北方地区研究中心(美国,伊利诺斯州61604,彼奥利亚,北大学街1815号), 保藏号分别为NRRL B-21323,B21324和B-21325。 包含VIP2A(a)和VIP1A(a)同系物的pCIB7100的DNA序列区用双脱氧末 端法测定(Sanger等,1977,美国科学院学报,74:5463-5467)。反应使用 PRISM Ready Reaction Dye双脱氧末端循环测序试剂盒和PRISM SequenaseR末端双链DNA测序试剂盒在ABI373自动测序仪上分析。特制的 寡核苷酸用作引物测定一定区域的DNA序列,这个区域的DNA序列见SEQ ID NO:19。 SEQ ID NO:19中的4kb区域包含两个开放读框(ORFs),它编码与得自 菌落AB78的VIP1A(a)和VIP2A(a)高度相似的蛋白质。使用标准命名法定名 为VIP2A(b)的VIP2A(a)同系物的氨基酸序列在SEQ IN NO:20中。使用标 准的命名法定名为VIP1A(b)的VIP1A(a)同系物的氨基酸序列在SEQ IN NO:21给出。VIP2A(b)蛋白质和得自AB78的VIP2A(a)蛋白质的氨基酸有 91%相同。两种VIP2蛋白质的氨基酸序列在表20给出。VIP1A(b)蛋白质和 得自AB78的VIP1A(a)的氨基酸有77%相同。两种VIP1蛋白质的氨基酸序列 在表21给出。表21所示的序列列表表明VIP1A(b)和得自AB78的VIP1A(a) 的相似性。这个列表表明:两个VIP1蛋白质在氨基末端比在羧基末端有更 高的氨基酸一致性。事实上,两个蛋白质氨基末端2/3(直到表21所示的 VIP1A(b)序列的氨基酸618)表现出90%的一致性,而羧基末端的 1/3(VIP1A(b)序列的619-833的氨基酸)表现出35%一致性。 Western印迹分析表明;苏云金芽孢杆菌变种tenebrionis(Btt)产生类似于 VIP1A(a)蛋白质和类似于VIP2A(a)蛋白质。然而,这些蛋白质没有表现出 对玉米根叶甲的活性。生物检定抗玉米根叶甲活性使用Btt的24小时培养物 上清液或大肠杆菌克隆pCIB7100(它包含着VIP1A(a)/VIP2A(a)同系物)。在 任何一种情况下都没有检测到对玉米根叶甲的活性。 假定Btt和AB78的VIP2蛋白质之间是相似的,测定Btt的VIP2A(b)替代 AB78的VIP2A(a)的能力。包含pCIB6206(它产生AB78 VIP1A(a)但不产生 VIP2A(a)蛋白质)与Btt培养物上清液混合,并测定这种混合物对玉米根叶甲 的活性。Btt培养物上清液和包含pCIB6206细胞都没有对WCRW的活性, Btt和pCIB6206的混合物却产生了对WCRW的高度活性。而且,另外的生 物检定表明在大肠杆菌中含有Btt VIP1A(b)/VIP2A(b)基因的Btt克隆 pCIB7100与pCIB6206混合时也产生对WCRW的活性。这样,由Btt产生的 VIP2A(b)蛋白质是由AB78产生的VIP2A(a)的功能等价物。 这样,通过使用VIP DNA作为杂交探针鉴定新的有杀虫活性的菌株的能 力得到了证明。进而,包含类似于VIP1A(a)/VIP2A(a)序列的芽孢杆菌产生 已经证明对不同种类害虫有毒性的类似于VIP1A(a)/VIP2A(a)的蛋白质。相 似的方法可以鉴别VIP1/VIP2族的许多成员。而且,相似的方法的使用可以 鉴别其它种类的VIP的同系物(例如AB88的VIP)。 表 20 苏云金芽孢杆菌变种tenebrionis的VIP2氨基酸序列(VIP2A(b)) 与AB78的VIP2氨基酸序列(VIP2A(a))的比较 Btt 1 MQRMEGKLFVVSKTLQVVTRTVLLSTVYSITLLNNVVIKADQLNINSQSK 50 SEQ ID NO:20 |.|||||||:|||.|||||:|||||||:||.|||| ||||:||||||||| AB78 1 MKRMEGKLFMVSKKLQVVTKTVLLSTVFSISLLNNEVIKAEQLNINSQSK 50 SEQ ID NO:2 51 YTNLQNLKIPDNAEDFKEDKGKAKEWGKEKGEEWRPPATEKGEMNNFLDN 100 |||||||||.|..|||||||:|||||||||:.||: .|||||.||||||| 51 YTNLQNLKITDKVEDFKEDKEKAKEWGKEKEKEWKLTATEKGKMNNFLDN 100 101 KNDIKTNYKEITFSMAGSCEDEIKDLEEIDKIFDKANLSSSIITYKNVEP 150 |||| ||||||||||||| |||||||.||||:|||.|||.|||||||||| 101 KNDIXTNYKEITFSMAGSFEDEIKDLKEIDKMFDKTNLSNSIITYKNVEP 150 151 ATIGFNKSLTEGNTINSDAMAQFKEQFLGKDMKFDSYLDTHLTAQQVSSK 200 .|||||||||||||||||||||||||||::|:|||||||||||||||||| 151 TTIGFNKSLTEGNTINSDAMAQFKEQFLDRDIKFDSYLDTHLTAQQVSSK 200 201 KRVILKVTVPSGKGSTTPTKAGVILNNNEYKMLIDNGYVLHVDKVSKVVK 250 .||||||||||||||||||||||||||.||||||||||::|||||||||| 201 ERVILKVTVPSGKGSTTPTKAGVILNNSEYKMLIDNGYMVHVDKVSKVVK 250 251 KGMECLQVEGTLKKSLDFKNDINAEAHSWGMKIYEDWAKNLTASQREALD 300 ||:||||:|||||||||||||||||||||||| ||:|||:||.||||||| 251 KGVECLQIEGTLKKSLDFKNDINAEAHSWGMKNYEEWAKDLTDSQREALD 300 ||||||||||||||||||||||||||||:||||||||||||||||||||| 301 GYARQDYKEINNYLRNQGGSGNEKLDAQIKNISDALGKKPIPENITVYRW 350 351 CGMPEFGYQISDPLPSLKDFEEQFLNTIKEDKGYMSTSLSSERLAAFGSR 400 |||||||||||||||||||||||||||||||||||||||||||||||||| 351 CGMPEFGYQISDPLPSLKDFEEQFLNTIKEDKGYMSTSLSSERLAAFGSR 400 401 KIILRLQVPKGSTGAYLSAIGGFASEKEILLDKDSKYHIDKATEVIIKGV 450 |||||||||||||||||||||||||||||||||||||||||.|||||||| 401 KIILRLQVPKGSTGAYLSAIGGFASEKEILLDKDSKYHIDKVTEVIIKGV 450 451 KRYVVDATLLTN 462 |||||||||||| 451 KRYVVDATLLTN 462 表 21 苏云金芽孢杆菌变种tenebrionis的VIP1氨基酸序列(VIP1A(b)) 与AB78的VIP1氨基酸序列(VIP1A(a))的比较 151 PIKIEYQSDTKFNIDSKTFKELKLFKIDSQNQPQQVQQDELRNPEFNKKE 200 198 SQEFLAKASKTNLFKQKMKRDIDEDTDTDGDSIPDLWEENGYTIQNKVAV 247 |||||||:||.|||.|||||:|||||||||||||||||||||||||::|| 201 SQEFLAKPSKINLFTQKMKREIDEDTDTDGDSIPDLWEENGYTIQNRIAV 250 248 KWDDSLASKGYTKFVSNPLDSHTVGDPYTDYEKAARDLDLSNAKETFNPL 297 |||||||||||||||||||:|||||||||||||||||||||||||||||| 251 KWDDSLASKGYTKFVSNPLESHTVGDPYTDYEKAARDLDLSNAKETFNPL 300 298 VAAFPSVNVSMEKVILSPNENLSNSVESHSSTNWSYTNTEGASIEAGGGP 347 |||||||||||||||||||||||||||||||||||||||||||:||| || 301 VAAFPSVNVSMEKVILSPNENLSNSVESHSSTNWSYTNTEGASVEAGIGP 350 348 LGLSFGVSVTYQHSETVAQEWGTSTGNTSQFNTASAGYLNANVRYNNVGT 397 |:||||||.|||||||||||||||||||||||||||||||||||||||| 351 KGISFGVSVNYQHSETVAQEWGTSTGNTSQFNTASAGYLNANVRYNNVGT 400 Btt 1 MKNMKKKLASVVTCMLLAPMFLNGNVNAVNADSKINQISTTQENQQKEMD 50 SEQ ID NO:21 |||||||||||||| |||||||||||||| ||||.|||||||.||||||| Ab78 1 MKMMKKKLASVVTCTLLAPMFLNGNVNAVYADSKTNQISTTQKNQQKEMD 50 SEQ ID NO:5 51 RKGLLGYYFKGKDFNNLTMFAPTRDNTLMYDQQTANALLDKKQQEYQSIR 100 ||||||||||||||.||||||||||.||:||||||| ||||||||||||| 51 RKGLLGYYFKGKDFSNLTMFAPTRDSTLIYDQQTANKLLDKKQQEYQSIR 100 101 WIGLIQRKETGDFTFNLSKDEQAIIEIDGKIISNKGKEKQVVHLEKEKLV 150 ||||||.|||||||||||.||||||||:||||||||||||||||||:||| 101 WIGLIQSKETGDFTFNLSEDEQAIIEINGKIISNKGKEKQVVHLEKGKLV 150 151 PIKIEYQSDTKFNIDSKTFKELKLFKIDSQNQSQQVQ...LRNPEFNKKE 197 ||||||||||||||||||||||||||||||||.|||| |||||||||| 398 GAIYDVKPTTSFVLNNNTIATITAKSNSTALRISPGDSYPEIGENAIAIT 447 ||||||||||||||||:||||||||||||||.||||:|||. |:|:|||| 401 GAIYDVKPTTSFVLNNDTIATITAKSNSTALNISPGESYPKKGQNGIAIT 450 448 SMDDFNSHPITLNKQQVNQLINNKPIMLETDQTDGVYKIRDTHGNIVTGG 497 ||||||||||||||.||:.|:||||:||||:||||||||:|||||||||| 451 SMDDFNSHPITLNKKQVDNLLNNKPMMLETNQTDGVYKIKDTHGNIVTGG 500 498 EWNGVTQQIKAKTASIIVDDGKQVAEKRVAAKDYGHPEDKTPPLTLKDTL 547 |||||.|||||||||||||||..|||||||||||::||||||.|||||.| 501 EWNGVIQQIKAKTASIIVDDGERVAEKRVAAKDYENPEDKTPSLTLKDAL 550 548 KLSYPDEIKETNGLLYYDDKPIYESSVMTYLDENTAKEVKKQINDTTGKF 597 ||||||||||.:|||||.:||||||||||||||||||||.||:||||||| 551 KLSYPDEIKEIEGLLYYKNKPIYESSVMTYLDENTAKEVTKQLNDTTGKF 600 实施例22.VIP蛋白质融合形成单一多肽 VIP蛋白质以单一多肽或以两个或更多相互作用的多肽存在于自然界。 当活性VIP由两个或更多相互作用的蛋白质链组成时,这些蛋白质链可以以 单个多肽链从两个(或多个)VIP编码区融合形成的基因中产生。编码两个 链的基因通过基因的编码区合并而融合,产生编码两个VIP多肽的单个开放 读框。组合物多肽可以如融合产生如融合蛋白氨基末端的更小的多肽。或者 它们可以可以被融合产生象融合蛋白氨基末端的更大的多肽。在两个多肽结 构域之间,可以任意使用接头。这些接头在本领域是已知的。此接头可被任 意设计成包含蛋白质酶裂解位点的接头,以便只要单融合多肽被靶昆虫摄 入,它就能在接头区域裂解,释放活性VIP分子的两个多肽组分。 蜡状芽孢杆菌菌株AB78的VIP1A(a)和VIP2A(a)通过编码区融合形成单 多肽。产生的DNA包含SEQ ID NO:22给出的序列,它编码的蛋白质的序 列在SEQ ID NO:23给出。以相似的方式,也可以产生其它融合蛋白。 编码VIP1A(a)和VIP2A(a)的基因融合通过使用分子生物学的标准方法 完成。在VIP1A(a)和VIP2A(a)编码区之间,要缺失的核苷酸通过已知的诱 变技术缺失,或者替代地使用PCR技术融合的编码区。 融合的VIP多肽可以使用被优化以利于在其它宿主中表达的合成基因或 部分合成基因在其它有机体内表达。例如,为在玉米中表达上述的融合VIP 多肽,人们使用玉米每一氨基酸的优化密码子制作了合成基因,参见,例如, EP-A 0618976,本文一并参考。根据这种方法创造的DNA序列在SEQ ID NO:17(100kDa VIP1A(a)编码序列的玉米优化体),SEQ ID NO:18 (80kDa VIP1A(a)编码序列的玉米优化体)和SEQ ID NO:24(VIP2A(a)编 码序列的玉米优化体)中给出。 优化以适于在玉米中表达的合成VIP1和VIP2基因可以使用PCR技术或 通过在一个共用限制位点融合以设计成合成基因。另外,也可以把合成的基 因设计成编码包含VIP1和VIP2结构域的单一多肽的基因。 在融合蛋白的VIP1和VIP2结构域之间加入一个多肽接头可以通过PCR 诱变、使用编码接头肽的合成DNA接头或其它本领域已知的方法实现。 融合的VIP多肽可由一个或多个结合结构域组成。如果在融合中使用超 过一个的结合结构域,可用这样一个融合蛋白来控制多个靶害虫。其它的结 合结构域可以通过使用其它VIP的全部或部分、苏云金芽孢杆菌内毒素或它 的一部分、其它能够和靶害虫结合的蛋白质或从这些结合蛋白质中衍生的适 当的结合结构域中获得。 pCIB5531提供了一个融合结构体的例子,它包含编码一个VIP2A(a)在 N-末端、VIP1A(a)在C-末端的单多肽融合物的玉米最优化DNA序列。在两 个编码区之间插入编码带有肽序列PSTPPTPSPSTPPTPS(SEQ ID NO:47) 的接头的DNA序列。编码这个接头的序列和相关的克隆位点是5′- CCC GGG CCT TCT ACT CCC CCA ACT CCC TCT CCT AGC ACG CCT CCG ACA CCT AGC GAT ATC GGA TCC-3′(SEQ ID NO:48)。在使用 标准方法杂交和磷酸化之后,合成代表上链和下链(upper strand and lower strang)的寡核苷酸并把它克隆进pUC载体。使用PCR除去VIP2A(a)中的 终止密码子并用带一个Smal位点的BgIII限制位点取代。通过把pCIB5522 (参见实施例24)的VIP2A(a)基因的BamHI/Pstl片段、一个包含VIP2A(a) 基因(和构建pCIB5522使用的基因相同)的Pstl-末端的PCR片段、一个末 端能和5′末端平端位点并在3′末端有BamHI的合成接头以及下面叙述的 PCIB5526修饰的合成VIP1A(a)基因(参见SEQ ID NO:35)连接起来,可以 形成一个翻译融合蛋白。融合蛋白通过上述四个序列连接,形成一个质粒, 它包含着没有翻译终止密码子的VIP2基因、接头和没有芽孢杆菌分泌信号 的VIP1A(a)编码区。这个构建体的DNA序列在SEQ ID NO:49给出,它编 码的融合蛋白在SEQ ID NO:50给出。VIP1A(a)在N-末端和VIP2A(a)在C- 末端的单多肽融合蛋白可以用相似的方式得到。而且,一个或两个基因都可 连接进在5′或3′端有(或无)和其它分子(如毒素编码基因或报道基因)的 接头的翻译融合物。 实施例23.VIP2对植物细胞器的定位 已知在植物中存在着几种定位基因产物的机制。控制这些机制功能的序 列在某些细节上已确定特征。例如,基因产物定位到叶绿体由一个在各种蛋 白质的氨基末端发现的信号序列控制。这个信号在叶绿体输入过程中裂解, 产生成熟的蛋白质。(e.g.Comai等,生物化学杂志,263:15104- 15109(1988))。这些信号序列可被融合到异源基因产物如VIP2使这些产物 输入叶绿体(van den Broeck等,自然313:358-363(1985))。编码适当的信 号序列DNA可从编码RUBISCO蛋白质、CAB蛋白质、EPSP合成酶、GS2 蛋白质以及许多已知定位于叶绿体的其它蛋白质的cDNA的5′端分离到。 其它基因产物定位到其它细胞器如线粒体和过氧化物酶体中(e.g.Unger 等,植物分子生物学,13:411-418(1989))。编码这些产物的cDNA也能被 操纵使异源基因产物如VIP2定位到这些细胞器上。这样的序列的例子是核 编码的ATP酶和线粒体特异性天冬氨酸氨基转移酶的同工型。相似地,对细 胞的蛋白质体的定位由Rogers等描述(美国科学院学报,82:6512- 6516(1985))。 通过上面叙述的适当的导向序列融合成兴趣编码序列(如VIP2),有可 能把转基因产物定位到任何细胞器或细胞区室。例如,对于叶绿体定位,得 自RUBISCO基因、CAB基因、EPSP合成酶基因、GS2基因的叶绿体信号 序列可以符合读框地融合到转移基因的氨基末端ATG上。选择的信号序列 应该包含已知的裂解位点,构建的融合体应该考虑裂解所需的裂解位点之后 的任何氨基酸。在某些情况下,可以通过在裂解位点和起始密码子ATG之 间加入少数氨基酸,或者取代编码序列内的一些氨基酸以满足这个需要。为 叶绿体输入构建的融合体可以通过离体转录的结构的离体翻译再加上使用 Bartlett等(Edelmann等(Eds.),叶绿体分子生物学方法,Elsevier.pp 1081-1091(1982);Wasmann等,分子基因遗传学,205:446-453(1986)) 叙述的技术进行离体叶绿体吸收来测定叶绿体的吸收效率。这些构建技术在 本领域是熟知的,同样地适用于线粒体和过氧化物酶体。 上面所述的细胞定位机制不仅可以用于与它们的关联启动子连接,而且 可以用于与异源启动子连接以影响在启动子转录调节下的特异细胞定位目 标。这个启动子的表达方式不同于定位信号衍生的启动子。 编码分泌信号的DNA序列存在于天然的芽孢杆菌VIP2基因中。这个信号 不存在于N-末端序列为LKITDKVEDF(SEQ ID NO:2的57至66氨基酸残基) 的成熟蛋白质中。使用基因工程的方法使VIP2分泌出植物细胞或定位到亚 细胞结构的细胞器上如内质网、液泡、线粒体或包含叶绿体的质体上是可能 的。由分泌信号肽融合到标志基因上形成的杂种蛋白质成功地定位进分泌途 径(Itirriaga G.等, 植物细胞,1:381-390(1989),Denecke等, 植物细胞, 2:51-59(1990))。鉴别出氨基末端序列负责对内质网,质外体和糊粉层细的 胞外分泌定位(Koehler & Ho, 植物细胞,2:769-783(1990))。 蛋白质保留在内质网或是液泡中需要另外的信号存在。在蛋白质的羧基 末端的肽序列KDEL/HDEL对于蛋白质保留在内质网中是必须的(由 Pelham综述, 细胞生物学年评,5:1-23(1989)。使蛋白质保留在液泡中的 信号也已经确定其特征。液泡定位信号可能存在于氨基末端部分(Holwerda 等, 植物细胞,4:307-318(1992),Nakamura等, 植物生理,101:1-5(1993)), 羧基末端部分或存在于定位蛋白质的内部序列中(Tague等, 植物细胞,4: 307-318(1992),Saalbach等, 植物细胞,3:695-708(1991))。另外,氨基 末端序列和羧基末端序列结合负责基因产物的液泡定位(Shinshi等, 植物分 子生物学,14:357-368(1990))。相似地,使用特异性的羧基末端信号肽融 合蛋白也可把蛋白质定位到线粒体或质体上(Heijne等,欧洲生物化学杂 志,180:535-545(1989),Archer和Keegstra, 植物分子生物学,23: 1105-1115(1993))。 为了把VIP2定位到分泌或不同的亚细胞结构的细胞器上,编码已知信号 肽的玉米优化DNA序列按需要设计到基因的5′或3′端。为把VIP2分泌出细 胞,PCT申请号IB95/00497的真核分泌信号肽 MGWSWIFLFLLSGAAGVHCL(SEQ ID NO:25)或任何其他在文献中记 载(Itirriaga等,植物细胞,1:381-390(1989);Denecke等,植物细胞,2: 51-59(1990))的DNA序列都可以加到完整的VIP2基因序列的5′端或者构建 的编码成熟蛋白质的序列上或者构建核苷酸286的基因上或编码从氨基酸残 基94(蛋氨酸)开始的蛋白质的基因上。为使VIP2保留在内质网内,可把 编码内质网信号肽KDEL/HDEL的DNA序列和分泌信号加到基因的3′端。要 定位到液泡,可把编码信号肽SSSSFADSNPIRVTDRAAST(SEQ ID N0: 3;Holwerda等, 植物细胞,4:307-318(1992))的DNA序列设计得和分泌信 号或编码Dombrowski等( 植物细胞,5:587-596(1993))所述的羧基信号肽 的序列相邻或者在基因的3′端插入功能性的变异。相似地,通过在叙述的编 码所需定位信号的VIP2序列中插入一个序列,VIP2可被设计定位到线粒体 或包含叶绿体的质体中。存在于VIP2中的细菌分泌信号可以保留或从最终 的构建体中除去。 pCIB5528是一个掺入真核分泌信号的构建体与VIP编码序列融合的例 子。合成相对应于编码SEQ ID NO:25中的分泌信号肽的上链和下链的寡 核苷酸,其序列为:5′- GGATCCACC ATG GGC TGG AGC TGG ATC TTC CTG TTC CTG CTG AGC GGC GCC GCG GGC GTG CAC TGC CTGCAG-3′(SEQ ID NO:41)。杂交时,分泌信号的5′端与对应于限制位 点BamHI和Pstl的“粘性末端”相似。使用标准方法,寡核苷酸杂交、磷酸 化并连接进pCIB5527中(在实施例23A中叙述的构建体),后者再根据标 准方法用BamHI/Pstl消化。产生的玉米优化编码序列SEQ ID NO:42给出, 它编码SEQ ID NO:43给出的蛋白质。这个被编码的蛋白质在芽孢杆菌分 泌信号的地方包含着真核分泌信号。 pCIB5533是一个掺入液泡分泌信号的构建体与VIP编码序列融合的例 子。合成相对应于编码SEQ ID NO:3中的分泌信号肽的上链和下链的寡核 苷酸,其序列为:5′- CCG CGG GCG TGC ACT GCC TCA GCA GCA GCA GCT TCG CCG ACA GCA ACC CCA TCC GCG TGA CCG ACG GCG CCG CCA GCA CC C TGC AG-3′(SEQ ID NO:44)。杂交时,液泡 定位信号的5′端与对应于限制位点SacII和Pstl的“粘性末端”相似。使用标 准方法,寡核苷酸杂交、磷酸化并连接进pCIB5588中(上面所述的构建体), 后者再根据标准方法用SacII/Pstl消化。产生的玉米优化编码序列SEQ ID NO:45给出,它编码SEQ ID NO:46给出的蛋白质。这个被编码的蛋白质 除真核分泌信号之外还包含液泡定位肽。 也可以用相似的方法,设计VIP1基因使其分泌、定位到亚细胞细胞器 上。 实施例23A.从VIP1A(a)和VIP2A(a)中除去芽孢杆菌分泌信号 VIP1A(a)和VIP2A(a)在菌株AB78的生长期间分泌。作为分泌信号的肽 链特征在文献中已有叙述(Simonen和Palva,微生物综述,pg.109- 137(1993))。根据上面出版物的信息,在两个基因中鉴别了推定的分泌信 号。在VIP1A(a)中这个信号由氨基酸1-33组成(参见SEQ ID NO:5)。分泌 信号的加工可能发生在第33个氨基酸丝氨酸之后。VIP2A(a)的分泌信号鉴 别为氨基酸1-49(参见SEQ ID NO:2)。分泌的成熟VIP2A(a)蛋白质的N-末 端肽链分析表明N-末端序列为LKITDKVEDFKEDK。在SEQ ID NO:2中 发现这个序列从氨基酸57开始。通过除去芽孢杆菌分泌信号修饰编码这些蛋 白质的基因,构建成玉米优化VIP1A(a)编码区域,它把编码开始33个氨基 酸的序列(即分泌信号)从5′端除去。这种修饰通过PCR使用一个引物达到, 此引物包含着能与玉米优化基因(SEQ ID NO:26)在核苷酸位置100杂交的 序列5′-GGA TCC ACC ATG AAG ACC AAC CAG ATC AGC-3′(SEQ ID NO:33),并加上一个BamHI限制位点和一个包含起始密码子的翻译起始 位点共用序列。包含着序列5′-AAG CTT CAG CTC CTT G-3′(SEQ ID NO:34)的反向引物在互补链的位置507处杂交,得到一个在5′端包含着限 制位点BamHI和在3′端包含着HindIII位点的527bp的扩增产物。扩增产物 被克隆进T-载体(在下面的实施例24中叙述)并测序以保证DNA序列正确。然 后,通过限制性消化获得BamHI/HindIII片段,并用于取代克隆进根优选的 启动子盒中的玉米最优化VIP1A(a)基因的BamHI/HindIII片段。获得的构 建体定名为pCIB5526。为除去芽孢杆菌分泌信号的VIP1A(a)编码的玉米优 化编码区在SEQ ID NO:35给出,它编码的蛋白质在SEQ ID NO:36给出。 编码加工形式的VIP2A(a)的基因(即分泌信号被除去)的编码区通过和 上面用于构建加工形式的VIPIA(a)相类似的方法构建。修饰通过PCR使用 正引物5′-GGA TCC ACC ATG CTG CAG AAC CTG AAG ATC AC- 3′(SEQ ID NO:37)达到。此引物与玉米优化的VIP2A(a)基因(SEQ ID NO: 27)的核苷酸位置150处杂交。一个不活动的突变插入此引物的核苷酸位置 15,获得一个Pstl限制性位点。反向引物序列为5′-AAG CTT CCA CTC CTT CTC-3′(SEQ ID NO:38)。用在3′端的限制性位点获得一个259bp产物。此 扩增产物被克隆进T-载体,测序并连接进BamHI/HindIII消化的包含玉米优 化的VIP2A(a)的根优选的启动子盒中。获得的构建体定名pCIB5527。为 VIP2A(a)编码的除去分泌信号的玉米优化编码区在SEQ ID NO:39给出, 它编码的蛋白质在SEQ ID NO:40给出。 实施例24.VIP1A(a)和VIP2A(a)玉米优化基因的构建和克隆 设计玉米优化基因通过天然的VIP1A(a)和VIP2A(a)蛋白质序列使用在 玉米中最常用的密码逆翻译得到(Murray等, 核酸研究,17:477- 498(1989))。为了易于克隆,DNA序列被进一步修饰,每间隔200-360个核 苷酸掺入单一限制位点。使VIP1A(a)克隆进11个这样的片段,VIP2A(a)克 隆进5个片段。在几个片段的克隆后,使用两个片段共同的限制性位点连接 相邻的片段,得到完整的基因。为克隆每一片段,寡核苷酸(50-85个核苷酸) 设计成对应于DNA的上链和下链。第一个寡核苷酸对(oligo pair)上部寡 核苷酸被设计成在3′末端包含15bp的单链区,它和指导定位的下一个寡核苷 酸对下链相似的单链区(此区指导给定片段的各种寡核苷酸对的定位和序 列)。也可设计寡核苷酸使之与所有代表片段的寡核苷酸杂交时末端有相对 应于特定限制位点的单链区形成。检测每一寡核苷酸的结构是否有稳定的二 级结构,如使用NBI公司的OLIGO方法形成的发夹环。如果需要,可以改 变核苷酸,以降低二级结构的稳定性。同时并不改变蛋白质的氨基酸顺序。 把一个植物核糖体结合位点共用序列TAAACA ATG(Joshi等, 核酸研究, 15:6643-6653(1987))或真核生物核糖体结合位点共用序列 CCACC ATG(Kozak, 核酸研究,12:857-872(1984))插入基因翻译起始密 码于。 克隆:由IDT Inc.合成的寡核苷酸作为冻干的粉剂使用。寡核苷酸以200 μM的浓度重新悬浮。每30μl的寡核苷酸加入甲酰胺使其最终浓度为25- 50%,样品煮沸2分钟,然后在Novex的premade 10%聚丙烯酰胺/尿素凝胶 上分离,电泳后,把凝胶放在包含荧光指示剂的TLC板上,用UV光照射, 寡核苷酸通过UV投影可以检测到。切下包含正确大小DNA的区域,通过绞 碎的凝胶片在包含0.4M LiCl,0.1mM EDTA的缓冲液中过夜温育以从聚丙 烯酰胺中提取DNA。离心通过微孔UFMC滤膜把DNA从凝胶残余物中分离 出来。提取的DNA通过加入2倍体积的无水酒精沉淀。离心后,沉淀以2.5 μM的浓度重新悬浮在dH2O中。片段或是通过寡核苷酸杂交并与适当的载 体连接,或是通过使用以一个特定片段作为模板的所有寡核苷酸和末端特异 性PCR引物的等摩尔的混合物的杂交片段的扩增来克隆。 通过杂交和连接克隆:同源的双链寡核苷酸对通过混合5μl的上链和5μ 1的下链(对每一寡核苷酸对加入包含1×多核苷酸激酶(PNK)的缓冲液(70 mMTris-HCl(pH值为7.6),10mM MgCl2,5mM二硫苏糖醇(DTT), 50mMKCl和5%甲酰胺,最终体积为50μl的缓冲液))得到。寡核苷酸煮沸 10分钟,缓慢冷却到37℃或室温。移去10μl用于在TAE缓冲系统 (Metaphorer;FMC)中的4%琼脂糖上分析。每一杂交的寡核苷酸对都通过 加入最终浓度为1mM的ATP、最终浓度为100μg/ml的BSA、200单位的多 核苷酸激酶以及10×PNK缓冲液(总体积为10μl)活化。杂交和磷酸化之 后,反应在37℃下温育2小时到过夜。加入对某一特定片段的片段的寡核苷 酸对10μl混合,最终体积为50μl。寡核苷酸对在80℃下加热10分钟杂交, 缓慢冷却到37℃。2μl的寡核苷酸用大约100ng的载体混合,使用含50mM Tris-HCl(pH7.8),10mM MgCl2,10mM二硫苏糖醇,1mM ATP的缓冲 液连接。按照标准方法,反应在室温下温育2小时或过夜,再转化进大肠杆 菌DH5a菌株,平铺到含浓度为100μg/ml的氨苄青霉素的L-平板上,进一步 确定阳性克隆的特征。并通过在EP 0618976中详细描述的使用通用引物 “Reverse”和M13“-20”作为引物的PCR筛选证实。阳性克隆通过用适当 的酶消化DNA再加上DNA测序鉴别。选择带有期望的DNA序列的重组体备 用。 PCR扩增和克隆进T-载体:PCR扩增通过使用所有低聚体的混合物进 行。其中混合物表示特定片段的上链和下链(每一个最终的浓度为5mM)作 为模板,特定片段的特异性末端引物(最终浓度为2μM)dATP,dPTP,dCTP 和dGTP各200μM 10mM Tris-HCl(pH8.3),50mM KCl,1.5mM MgCl2, 0.01%明胶以及5单位的聚合酶,最终体积为50μl。扩增反应在Perkin Elmer 热循环器9600中通过95℃下温育1分钟(一个周期)、90℃下温育20个周期 (每个周期45sec.)、50℃下45sec.、72℃下30sec.进行。最后在72℃下温育 5分钟,再分析产物。10μl的反应液用于在TAE缓冲系统中的2.5% Nusieve(FMC)琼脂糖凝胶上分析。正确大小的片段通过凝胶纯化,并被克 隆进PCR克隆载体或T-载体。T-载体构建体由Marchuk等叙述(核酸研究, 19:1154(1991))。pBluescriptsk+载体(Stratagener,Ca.)用作亲本载体。 正确克隆的转化和鉴别按上述的方法进行。 VIP1A(a)的片段1,3,4,5,6,8和9以及VIP2A(a)的片段2和4通过 PCR扩增产物的克隆获得;但是,VIP1A(a)的片段2,7,10和11以及VIP2A(a) 的片段1,3和5通过杂交/连接获得。 一旦获得带有期望序列的片段,可以通过把相邻的片段克隆到一起装配 成完整的基因。对完整的基因重新测序并测定其在转移进包含根优化启动子 的植物表达载体(发表在美国专利申请序列No.08 017,209,此处被参考文献 收编)和水稻肌动蛋白质启动子之前对WCRW的活性。 pCIB5521是这样一个植物表达载体。玉米优化的VIP1A(a)编码区(SEQ ID NO:26)克隆进一个植物表达载体。这个载体在带有PEP羧化酶内含子 #9的基因的5′端包含根优选的启动子,在3′端有35S终止子。质粒也包含质 粒pUC19抗氨苄青霉素的序列。另一个植物表达载体是pCIB5522,它包含 玉米优化的VIP2A(a)编码区(SEQ ID NO:27)和基因5′端的根优选启动子融 合的产物,此基因有PEP羧化酶内含子#9和其后3′端的35S终止子。 实施例25.NAD亲合层析 基于VIP2对低物NAD的亲合性可以使用一种纯化方法。在实施例4中描 述的用pH3.5的柠檬酸钠缓冲液处理的上清液透析进pH为7.5的20mM TRIS中,过夜。在中性化的上清液中加入相等体积的洗涤NAD琼脂糖并在4 ℃下轻微振荡温育过夜。树脂和蛋白质溶液加入到一次性10ml的一次性聚 丙烯层析柱中,使蛋白质溶液流出。层析柱用5倍于柱体积的pH7.5的20mM TRIS冲洗,然后用2-5倍柱体积的pH7.5的20mM TRIS、100mM NaCl冲 洗,接着再用2-5倍柱体积的的pH7.5的20mM TRIS冲洗。最后VIP蛋白质 用pH为7.5的20mM TRIS加上5mM NAD洗脱。大约收集到3倍于柱体积的 流出液,在Centricon-10中浓缩。典型的产量是每毫升树脂大约7-15μg蛋 白质。 当纯化的蛋白质通过SDS-PAGE以及其后的银染分析时,可见的有两条 多肽带,一个分子量大约为80,000,另一个分子量大约为45,000。测序表明 分子量为80,000的蛋白质对应于蛋白质水解处理的VIP1A(a)的加工形式,分 子量为45,000的蛋白质对应于蛋白质水解处理的VIP2A(a)的加工形式。 VIP1A(a)和VIP2A(a)的共纯化表明两种蛋白质可能形成一个复合物并有蛋 白质-蛋白质相互作用区域。以这种方式纯化的VIP1A(a)和VIP2A(a)对玉米 根叶甲是生物活性的。 实施例26.1玉米优化的VIP1A(a)和VIP2A(a)的表达 包含着不同的含有VIP基因的质粒的大肠杆菌菌株用于分析VIP的表 达。带有单个质粒的大肠杆菌菌株在L-肉汤中生长过夜并表达从上面实施例 3所述的培养物中提取的蛋白质。蛋白质表达使用抗体通过Western印迹分 析并用本领域已知的类似于在上面实施例12中所述的标准方法展开。同样, 表达的蛋白质对玉米根叶甲的杀虫活性根据上面实施例3中所述的方法测 定。大肠杆菌表达测定结果叙述如下: 大肠杆菌中VIP的表达 含有所需质粒的 大肠杆菌提取物 测定No.1 测定No.2 检测到蛋白质 死亡百分率 对照 pCIB5521(玉米优化 的VIP1A(a)) pCIB5522(玉米优化 的VIP2A(a)) pCIB6024(天然VIP2A(a)) pCIB6206(天然VIP1A(a)) pCIB5521+pCIB5522结合 的提取液 pCIB5521+pCIB6024结合 的提取液 pCIB5522+pCIB6206结合 的提取液 0 47 7 13 27 87 93 100 0 27 7 13 40 47 100 100 无 有 有 有 有 pCIB6024+pCIB6206结合 的提取液 100 100 这些质粒的DNA用于在玉米原生质体表达系统中过渡性地表达VIP。原 生质体从玉米2717第6系培养物通过使用纤维素酶RS和解析酶R10消化细 胞壁分离得到。原生质体通过过筛和离心回收。原生质体使用大约75g质粒 DNA和PEG-40用标准的直接转基因法转化。处理的原生质体在室温下黑暗 中培养过夜。VIP表达的分析通过在原生质外植体上Western印迹分析和通 过如上所述的在大肠杆菌中表达的方法进行对玉米根叶甲杀虫活性的分析 来完成。玉米原生质体表达测定的结果如下: VIP在植物原生质体中的表达 测定的提取液 测定No.1 测定No.2 检测到蛋白质 死亡百分率(%) 无DNA对照 pCIB5521(p)(玉米 优化的VIP1A(a)) pCIB5522(p)(玉米 优化的VIP2A(a)) pCIB5521(p)+pCIB5522(p) 结合的提取物 pCIB5521(p)+pCIB5522(e) 结合提取物 pCIB5522(p)+pCIB5521(e) 结合提取物 27 20(0) 20(0) 87(82) 100 53(56) 10 30 20 90 - - 无 有 有 pCIB5521(p)+pCIB6024(e) 结合提取物 pCIB5522(p)+pCIB6206(e) 结合提取物 pCIB6024(e)(天然VIP2A(a)) pCIB6206(e)(天然VIP1A(a)) pCIB5521+pCIB5522(通过转 化传送的质粒) 100 100 0 20 100 - - - - 100 有 有 有 (p)=用所需的质粒转化的原生质体培养物的提取物 (e)=包含所需质粒的大肠杆菌的提取物 用玉米和大肠杆菌所获得的表达数据表明:玉米优化的VIP1A(a)和 VIP2A(a)基因分别与天然VIP1A(a)和VIP2A(a)基因编码相同的蛋白质。而 且,由玉米优化基因编码的蛋白质和天然基因编码的蛋白质是功能等价物。 在本说明书中提到的所有出版物和专利应用表明了与本发明有关适合的 本领域技术人员的水平。本文一并参考的所有出版物和专利申请与特别或单 独指出的本文一并参考的单个出版物或专利申请在相同程度上被参考。 下列寄存物保藏于农业研究机构保藏中心(NRRL)北方地区研究中心 (美国,伊利诺斯州61604,彼奥利亚,北大学街1815号): 菌株定名 保存号 保存日期 1.大肠杆菌PL2 2.大肠杆菌PL2 3.大肠杆菌pCIB6022 4.大肠杆菌pCIB6023 5.大肠杆菌pC186023 NRRL B-21221 NRRL B-21221N NRRL B-21222 NRRL B-21223 NRRL B-21223N 1994.3.9 1994.9.2 1994.3.9 1994.3.9 1994.9.2 6.苏云金芽孢杆菌HD73-78VIP 7.苏云金芽孢杆菌AB88 8.苏云金芽孢杆菌AB359 9.苏云金芽孢杆菌AB289 10.芽孢杆菌属一个种AB59 11.芽孢杆菌属一个种AB294 12.芽孢杆菌属一个种AB256 13.大肠杆菌P5-4 14.大肠杆菌P3-12 15.蜡状芽孢杆菌AB78 16.苏云金芽孢杆菌AB6 17.大肠杆菌pCIB6202 18.大肠杆菌pCIB7100 19.大肠杆菌pCIB7101 20.大肠杆菌pCIB7102 21.大肠杆菌pCIB7103 22.大肠杆菌pCIB7104 23.大肠杆菌pCIB7107 24.大肠杆菌pCIB7108 25.苏云金芽孢杆菌AB424 NRRL B-21224 NRRL B-21225 NRRL B-21226 NRRL B-21227 NRRL B-21228 NRRL B-21229 NRRL B-21230 NRRL B-21059 NRRL B-21061 NRRL B-21058 NRRL B-21060 NRRL B-21321 NRRL B-21322 NRRL B-21323 NRRL B-21324 NRRL B-21325 NRRL B-21422 NRRL B-21423 NRRL B-21438 NRRL B-21439 1994.3.9 1994.3.9 1994.3.9 1994.3.9 1994.3.9 1994.3.9 1994.3.9 1993.3.18 1993.3.18 1993.3.18 1993.3.18 1994.9.2 1994.9.2 1994.9.2 1994.9.2 1994.9.2 1995.3.24 1995.3.24 1995.5.5 1995.5.5 尽管为了清楚理解前面通过说明和实施例详细描述了本发明,很明显在 所附的权利要求书的范围内一定的改变和修正是可实施的。 序 列 表 (1)一般信息: (A)姓名:CIBA-GEIGY AG (B)街道:Klybeckstr.141 (C)城市:巴塞尔 (E)国家:瑞士 (F)邮区代码(ZIP):4002 (G)电话:+41 61 69 1111 (H)传真:+41 61 696 79 76 (I)电传:962 991 (ii)发明名称:新杀虫蛋白质和菌株 (iii)序列数:52个 (iv)计算机可读形式: (A)介质类型:软盘 (B)计算机:IBM PC兼容机 (C)操作系统:PCDOS/MS-DOS (D)软件:PatentIn Release#1.0,版本#1.30B (2)SEQ ID NO:1信息: (i)序列特征: (A)长度:6049个碱基对 (B)类型:核酸 (C)链型:单链 (D)拓扑结构:线性 (ii)分子类型:DNA(基因组) (vi)原始来源: (A)有机体:蜡状芽孢杆菌 (B)菌株:AB78 (C)单独的分离物:NRRL B-21058 (ix)特征: (A)名称/关键词:CDS (B)位置:1082..2467 (D)其它信息:/产物=″VIP2A(a)″ (ix)特征: (A)名称/关键词:misc_特征 (B)位置:2475..5126 (D)其它信息:/注=″100kd VIP1A(a)蛋白质的编码序列。该编 码序列在SEQ ID NO:4中重复并单独翻译″ (xi)序列描述:SEQ ID NO:1: ATCGATACAA TGTTGTTTTA CTTAGACCGG TAGTCTCTGT AATTTGTTTA ATGCTATATT 60 CTTTACTTTG ATACATTTTA ATAGCCATTT CAACCTTATC AGTATGTTTT TGTGGTCTTC 120 CTCCTTTTTT TCCACGAGCT CTAGCTGCGT TTAATCCTGT TTTGGTACGT TCGCTAATAA 180 TATCTCTTTC TAATTCTGCA ATACTTGCCA TCATTCGAAA GAAGAATTTC CCCATAGCAT 240 TAGAGGTATC AATGTTGTCA TGAATAGAAA TAAAATCTAC ACCTAGCTCT TTGAATTTTT 300 CACTTAACTC AATTAGGTGT TTTGTAGAGC GAGAAATTCG ATCAAGTTTG TAAACAACTA 360 TCTTATCGCC TTTACGTAAT ACTTTTAGCA ACTCTTCGAG TTGAGGGCGC TCTTTTTTTA 420 TTCCTGTTAT TTTCTCCTGA TATAGCCTTT CTACACCATA TTGTTGCAAA GCATCTATTT 480 GCATATCGAG ATTTTGTTCT TCTGTGCTGA CACGAGCATA ACCAAAAATC AAATTGGTTT 540 CACTTCCTAT CTAAATATAT CTATTAAAAT AGCACCAAAA ACCTTATTAA ATTAAAATAA 600 GGAACTTTGT TTTTGGATAT GGATTTTGGT ACTCAATATG GATGAGTTTT TAACGCTTTT 660 GTTAAAAAAC AAACAAGTGC CATAAACGGT CGTTTTTGGG ATGACATAAT AAATAATCTG 720 TTTGATTAAC CTAACCTTGT ATCCTTACAG CCCAGTTTTA TTTGTACTTC AACTGACTGA 780 ATATGAAAAC AACATGAAGG TTTCATAAAA TTTATATATT TTCCATAACG GATGCTCTAT 840 CTTTAGGTTA TAGTTAAATT ATAAGAAAAA AACAAACGGA GGGAGTGAAA AAAAGCATCT 900 TCTCTATAAT TTTACAGGCT CTTTAATAAG AAGGGGGGAG ATTAGATAAT AAATATGAAT 960 ATCTATCTAT AATTGTTTGC TTCTACAATA ACTTATCTAA CTTTCATATA CAACAACAAA 1020 ACAGACTAAA TCCAGATTGT ATATTCATTT TCAGTTGTTC CTTTATAAAA TAATTTCATA 1080 A ATG AAA AGA ATG GAG GGA AAG TTG TTT ATG GTG TCA AAA AAA TTA 1126 Met Lys Arg Met Glu Gly Lys Leu Phe Met Val Ser Lys Lys Leu 1 5 10 15 CAA GTA GTT ACT AAA ACT GTA TTG CTT AGT ACA GTT TTC TCT ATA TCT 1174 Gln Val Val Thr Lys Thr Val Leu Leu Ser Thr Val Phe Ser Ile Ser 20 25 30 TTA TTA AAT AAT GAA GTG ATA AAA GCT GAA CAA TTA AAT ATA AAT TCT 1222 Leu Leu Asn Asn Glu Val Ile Lys Ala Glu Gln Leu Asn Ile Asn Ser 35 40 45 CAA AGT AAA TAT ACT AAC TTG CAA AAT CTA AAA ATC ACT GAC AAG GTA 1270 Gln Ser Lys Tyr Thr Asn Leu Gln Asn Leu Lys Ile Thr Asp Lys Val 50 55 60 GAG GAT TTT AAA GAA GAT AAG GAA AAA GCG AAA GAA TGG GGG AAA GAA 1318 Glu Asp Phe Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu 65 70 75 AAA GAA AAA GAG TGG AAA CTA ACT GCT ACT GAA AAA GGA AAA ATG AAT 1366 Lys Glu Lys Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn 80 85 90 95 AAT TTT TTA GAT AAT AAA AAT GAT ATA AAG ACA AAT TAT AAA GAA ATT 1414 Asn Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile 100 105 110 ACT TTT TCT ATG GCA GGC TCA TTT GAA GAT GAA ATA AAA GAT TTA AAA 1462 Thr Phe Ser Met Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys 115 120 125 GAA ATT GAT AAG ATG TTT GAT AAA ACC AAT CTA TCA AAT TCT ATT ATC 1510 Glu Ile Asp Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile 130 135 140 ACC TAT AAA AAT GTG GAA CCG ACA ACA ATT GGA TTT AAT AAA TCT TTA 1558 Thr Tyr Lys Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu 145 150 155 ACA GAA GGT AAT ACG ATT AAT TCT GAT GCA ATG GCA CAG TTT AAA GAA 1606 Thr Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu 160 165 170 175 CAA TTT TTA GAT AGG GAT ATT AAG TTT GAT AGT TAT CTA GAT ACG CAT 1654 Gln Phe Leu Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His 180 185 190 TTA ACT GCT CAA CAA GTT TCC AGT AAA GAA AGA GTT ATT TTG AAG GTT 1702 Leu Thr Ala Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val 195 200 205 ACG GTT CCG AGT GGG AAA GGT TCT ACT ACT CCA ACA AAA GCA GGT GTC 1750 Thr Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val 210 215 220 ATT TTA AAT AAT AGT GAA TAC AAA ATG CTC ATT GAT AAT GGG TAT ATG 1798 Ile Leu Asn Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Met 225 230 235 GTC CAT GTA GAT AAG GTA TCA AAA GTG GTG AAA AAA GGG GTG GAG TGC 1846 Val His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Val Glu Cys 240 245 250 255 TTA CAA ATT GAA GGG AGT TTA AAA AAG AGT CTT GAC TTT AAA AAT GAT 1894 Leu Gln Ile Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp 260 265 270 ATA AAT GCT GAA GCG CAT AGC TGG GGT ATG AAG AAT TAT GAA GAG TGG 1942 Ile Asn Ala Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp 275 280 285 GCT AAA GAT TTA ACC GAT TCG CAA AGG GAA GCT TTA GAT GGG TAT GCT 1990 Ala Lys Asp Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala 290 295 300 AGG CAA GAT TAT AAA GAA ATC AAT AAT TAT TTA AGA AAT CAA GGC GGA 2038 Arg Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly 305 310 315 AGT GGA AAT GAA AAA CTA GAT GCT CAA ATA AAA AAT ATT TCT GAT GCT 2086 Ser Gly Asn Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala 320 325 330 335 TTA GGG AAG AAA CCA ATA CCG GAA AAT ATT ACT GTG TAT AGA TGG TGT 2134 Leu Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys 340 345 350 GGC ATG CCG GAA TTT GGT TAT CAA ATT AGT GAT CCG TTA CCT TCT TTA 2182 Gly Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu 355 360 365 AAA GAT TTT GAA GAA CAA TTT TTA AAT ACA ATC AAA GAA GAC AAA GGA 2230 Lys Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly 370 375 380 TAT ATG AGT ACA AGC TTA TCG AGT GAA CGT CTT GCA GCT TTT GGA TCT 2278 Tyr Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser 385 390 395 AGA AAA ATT ATA TTA CGA TTA CAA GTT CCG AAA GGA AGT ACG GGT GCG 2326 Arg Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala 400 405 410 415 TAT TTA AGT GCC ATT GGT GGA TTT GCA AGT GAA AAA GAG ATC CTA CTT 2374 Tyr Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu 420 425 430 GAT AAA GAT AGT AAA TAT CAT ATT GAT AAA GTA ACA GAG GTA ATT ATT 2422 Asp Lys Asp Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile 435 440 445 AAA GGT GTT AAG CGA TAT GTA GTG GAT GCA ACA TTA TTA ACA AAT 2467 Lys Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn 450 455 460 TAAGGAGATG AAAAATATGA AGAAAAAGTT AGCAAGTGTT GTAACGTGTA CGTTATTAGC 2527 TCCTATGTTT TTGAATGGAA ATGTGAATGC TGTTTACGCA GACAGCAAAA CAAATCAAAT 2587 TTCTACAACA CAGAAAAATC AACAGAAAGA GATGGACCGA AAAGGATTAC TTGGGTATTA 2647 TTTCAAAGGA AAAGATTTTA GTAATCTTAC TATGTTTGCA CCGACACGTG ATAGTACTCT 2707 TATTTATGAT CAACAAACAG CAAATAAACT ATTAGATAAA AAACAACAAG AATATCAGTC 2767 TATTCGTTGG ATTGGTTTGA TTCAGAGTAA AGAAACGGGA GATTTCACAT TTAACTTATC 2827 TGAGGATGAA CAGGCAATTA TAGAAATCAA TGGGAAAATT ATTTCTAATA AAGGGAAAGA 2887 AAAGCAAGTT GTCCATTTAG AAAAAGGAAA ATTAGTTCCA ATCAAAATAG AGTATCAATC 2947 AGATACAAAA TTTAATATTG ACAGTAAAAC ATTTAAAGAA CTTAAATTAT TTAAAATAGA 3007 TAGTCAAAAC CAACCCCAGC AAGTCCAGCA AGATGAACTG AGAAATCCTG AATTTAACAA 3067 GAAAGAATCA CAGGAATTCT TAGCGAAACC ATCGAAAATA AATCTTTTCA CTCAAAAAAT 3127 GAAAAGGGAA ATTGATGAAG ACACGGATAC GGATGGGGAC TCTATTCCTG ACCTTTGGGA 3187 AGAAAATGGG TATACGATTC ACAATAGAAT CGCTGTAAAG TGGGACGATT CTCTAGCAAG 3247 TAAAGGGTAT ACGAAATTTG TTTCAAATCC ACTAGAAAGT CACACAGTTG GTGATCCTTA 3307 TACAGATTAT GAAAAGGCAG CAAGAGATCT AGATTTGTCA AATGCAAAGG AAACGTTTAA 3367 CCCATTGGTA GCTGCTTTTC CAAGTGTGAA TGTTAGTATG GAAAAGGTGA TATTATCACC 3427 AAATGAAAAT TTATCCAATA GTGTAGAGTC TCATTCATCC ACGAATTGGT CTTATACAAA 3487 TACAGAAGGT GCTTCTGTTG AAGCGGGGAT TGGACCAAAA GGTATTTCGT TCGGAGTTAG 3547 CGTAAACTAT CAACACTCTG AAACAGTTGC ACAAGAATGG GGAACATCTA CAGGAAATAC 3607 TTCGCAATTC AATACGGCTT CAGCGGGATA TTTAAATGCA AATGTTCGAT ATAACAATGT 3667 AGGAACTGGT GCCATCTACG ATGTAAAACC TACAACAAGT TTTGTATTAA ATAACGATAC 3727 TATCGCAACT ATTACGGCGA AATCTAATTC TACAGCCTTA AATATATCTC CTGGAGAAAG 3787 TTACCCGAAA AAAGGACAAA ATGGAATCGC AATAACATCA ATGGATGATT TTAATTCCCA 3847 TCCGATTACA TTAAATAAAA AACAAGTAGA TAATCTGCTA AATAATAAAC CTATGATGTT 3907 GGAAACAAAC CAAACAGATG GTGTTTATAA GATAAAAGAT ACACATGGAA ATATAGTAAC 3967 TGGCGGAGAA TGGAATGGTG TCATACAACA AATCAAGGCT AAAACAGCGT CTATTATTGT 4027 GGATGATGGG GAACGTGTAG CAGAAAAACG TGTAGCGGCA AAAGATTATG AAAATCCAGA 4087 AGATAAAACA CCGTCTTTAA CTTTAAAAGA TGCCCTGAAG CTTTCATATC CAGATGAAAT 4147 AAAAGAAATA GAGGGATTAT TATATTATAA AAACAAACCG ATATACGAAT CGAGCGTTAT 4207 GACTTACTTA GATGAAAATA CAGCAAAAGA AGTGACCAAA CAATTAAATG ATACCACTGG 4267 GAAATTTAAA GATGTAAGTC ATTTATATGA TGTAAAACTG ACTCCAAAAA TGAATGTTAC 4327 AATCAAATTG TCTATACTTT ATGATAATGC TGAGTCTAAT GATAACTCAA TTGGTAAATG 4387 GACAAACACA AATATTGTTT CAGGTGGAAA TAACGGAAAA AAACAATATT CTTCTAATAA 4447 TCCGGATGCT AATTTGACAT TAAATACAGA TGCTCAAGAA AAATTAAATA AAAATCGTGA 4507 CTATTATATA AGTTTATATA TGAAGTCAGA AAAAAACACA CAATGTGAGA TTACTATAGA 4567 TGGGGAGATT TATCCGATCA CTACAAAAAC AGTGAATGTG AATAAAGACA ATTACAAAAG 4627 ATTAGATATT ATAGCTCATA ATATAAAAAG TAATCCAATT TCTTCACTTC ATATTAAAAC 4687 GAATGATGAA ATAACTTTAT TTTGGGATGA TATTTCTATA ACAGATGTAG CATCAATAAA 4747 ACCGGAAAAT TTAACAGATT CAGAAATTAA ACAGATTTAT AGTAGGTATG GTATTAAGTT 4807 AGAAGATGGA ATCCTTATTG ATAAAAAAGG TGGGATTCAT TATGGTGAAT TTATTAATGA 4867 AGCTAGTTTT AATATTGAAC CATTGCAAAA TTATGTGACC AAATATGAAG TTACTTATAG 4927 TAGTGAGTTA GGACCAAACG TGAGTGACAC ACTTGAAAGT GATAAAATTT ACAAGGATGG 4987 GACAATTAAA TTTGATTTTA CCAAATATAG TAAAAATGAA CAAGGATTAT TTTATGACAG 5047 TGGATTAAAT TGGGACTTTA AAATTAATGC TATTACTTAT GATGGTAAAG AGATGAATGT 5107 TTTTCATAGA TATAATAAAT AGTTATTATA TCTATGAAGC TGGTGCTAAA GATAGTGTAA 5167 AAGTTAATAT ACTGTAGGAT TGTAATAAAA GTAATGGAAT TGATATCGTA CTTTGGAGTG 5227 GGGGATACTT TGTAAATAGT TCTATCAGAA ACATTAGACT AAGAAAAGTT ACTACCCCCA 5287 CTTGAAAATG AAGATTCAAC TGATTACAAA CAACCTGTTA AATATTATAA GGTTTTAACA 5347 AAATATTAAA CTCTTTATGT TAATACTGTA ATATAAAGAG TTTAATTGTA TTCAAATGAA 5407 GCTTTCCCAC AAAATTAGAC TGATTATCTA ATGAAATAAT CAGTCTAATT TTGTAGAACA 5467 GGTCTGGTAT TATTGTACGT GGTCACTAAA AGATATCTAA TATTATTGGG CAAGGCGTTC 5527 CATGATTGAA TCCTCGAATG TCTTGCCCTT TTCATTTATT TAAGAAGGAT TGTGGAGAAA 5587 TTATGGTTTA GATAATGAAG AAAGACTTCA CTTCTAATTT TTGATGTTAA ATAAATCAAA 5647 ATTTGGCGAT TCACATTGTT TAATCCACTG ATAAAACATA CTGGAGTGTT CTTAAAAAAT 5707 CAGCTTTTTT CTTTATAAAA TTTTGCTTAG CGTACGAAAT TCGTGTTTTG TTGGTGGGAC 5767 CCCATGCCCA TCAACTTAAG AGTAAATTAG TAATGAACTT TCGTTCATCT GGATTAAAAT 5827 AACCTCAAAT TAGGACATGT TTTTAAAAAT AAGCAGACCA AATAAGCCTA GAATAGGTAT 5887 CATTTTTAAA AATTATGCTG CTTTCTTTTG TTTTCCAAAT CCATTATACT CATAAGCAAC 5947 ACCCATAATG TCAAAGACTG TTTTTGTCTC ATATCGATAA GCTTGATATC GAATTCCTGC 6007 AGCCCGGGGG ATCCACTAGT TCTAGAGCGG CCGCCACCGC GG 6049 (2)SEQ ID NO:2信息: (i)序列特征: (A)长度:462个氨基酸 (B)类型:氨基酸 (D)拓扑结构:线性 (ii)分子类型:蛋白质 (xi)序列描述:SEQ ID NO:2: Met Lys Arg Met Glu Gly Lys Leu Phe Met Val Ser Lys Lys Leu Gln 1 5 10 15 Val Val Thr Lys Thr Val Leu Leu Ser Thr Val Phe Ser Ile Ser Leu 20 25 30 Leu Asn Asn Glu Val Ile Lys Ala Glu Gln Leu Asn Ile Asn Ser Gln 35 40 45 Ser Lys Tyr Thr Asn Leu Gln Asn Leu Lys Ile Thr Asp Lys Val Glu 50 55 60 Asp Phe Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys 65 70 75 80 Glu Lys Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn Asn 85 90 95 Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr 100 105 110 Phe Ser Met Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu 115 120 125 Ile Asp Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile Thr 130 135 140 Tyr Lys Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu Thr 145 150 155 160 Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln 165 170 175 Phe Leu Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu 180 185 190 Thr Ala Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val Thr 195 200 205 Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile 210 215 220 Leu Asn Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Met Val 225 230 235 240 His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Val Glu Cys Leu 245 250 255 Gln Ile Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile 260 265 270 Asn Ala Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp Ala 275 280 285 Lys Asp Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp GLy Tyr Ala Arg 290 295 300 Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser 305 310 315 320 Gly Asn Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala Leu 325 330 335 Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly 340 345 350 Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys 355 360 365 Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr 370 375 380 Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg 385 390 395 400 Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr 405 410 415 Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp 420 425 430 Lys Asp Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile Lys 435 440 445 Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn 450 455 460 (2)SEQ ID NO:3信息: (i)序列特征: (A)长度:20个氨基酸 (B)类型:氨基酸 (C)链型:单链 (D)拓扑结构:线性 (ii)分子类型:蛋白质 (ix)特征: (A)名称/关键词:肽 (B)位置:1..20 (D)其它信息:/注=″用于液泡定位的信号肽″ (xi)序列描述:SEQ ID NO:3: Ser Ser Ser Ser Phe Ala Asp Ser Asn Pro Ile Arg Val Thr Asp Arg 1 5 10 15 Ala Ala Ser Thr 20 (2)SEQ ID NO:4信息: (i)序列特征: (A)长度:2655个碱基对 (B)类型:核酸 (C)链型:单链 (D)拓扑结构:线性 (ii)分子类型:DNA(基因组) (iii)假设:否 (iv)反义:否 (vi)原始来源: (A)有机体:蜡状芽孢杆菌 (B)菌株:AB78 (C)单独的分离物:NRRL B-21058 (ix)特征: (A)名称/关键词:CDS (B)位置:1..2652 (D)其它信息:/注=″100kd蛋白质VIP1A(a)″ /注=″这一序列与SEQ ID NO:1:的核苷酸2475-5126之间的部分相同″ (xi)序列描述:SEQ ID NO:4: ATG AAA AAT ATG AAG AAA AAG TTA GCA AGT GTT GTA ACG TGT ACG TTA 48 Met Lys Asn Met Lys Lys Lys Leu Ala Ser Val Val Thr Cys Thr Leu 465 470 475 TTA GCT CCT ATG TTT TTG AAT GGA AAT GTG AAT GCT GTT TAC GCA GAC 96 Leu Ala Pro Met Phe Leu Asn Gly Asn Val Asn Ala Val Tyr Ala Asp 480 485 490 AGC AAA ACA AAT CAA ATT TCT ACA ACA CAG AAA AAT CAA CAG AAA GAG 144 Ser Lys Thr Asn Gln Ile Ser Thr Thr Gln Lys Asn Gln Gln Lys Glu 495 500 505 510 ATG GAC CGA AAA GGA TTA CTT GGG TAT TAT TTC AAA GGA AAA GAT TTT 192 Met Asp Arg Lys Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys Asp Phe 515 520 525 AGT AAT CTT ACT ATG TTT GCA CCG ACA CGT GAT AGT ACT CTT ATT TAT 240 Ser Asn Leu Thr Met Phe Ala Pro Thr Arg Asp Ser Thr Leu Ile Tyr 530 535 540 GAT CAA CAA ACA GCA AAT AAA CTA TTA GAT AAA AAA CAA CAA GAA TAT 288 Asp Gln Gln Thr Ala Asn Lys Leu Leu Asp Lys Lys Gln Gln Glu Tyr 545 550 555 CAG TCT ATT CGT TGG ATT GGT TTG ATT CAG AGT AAA GAA ACG GGA GAT 336 Gln Ser Ile Arg Trp Ile Gly Leu Ile Gln Ser Lys Glu Thr Gly Asp 560 565 570 TTC ACA TTT AAC TTA TCT GAG GAT GAA CAG GCA ATT ATA GAA ATC AAT 384 Phe Thr Phe Asn Leu Ser Glu Asp Glu Gln Ala Ile Ile Glu Ile Asn 575 580 585 590 GGG AAA ATT ATT TCT AAT AAA GGG AAA GAA AAG CAA GTT GTC CAT TTA 432 Gly Lys Ile Ile Ser Asn Lys Gly Lys Glu Lys Gln Val Val His Leu 595 600 605 GAA AAA GGA AAA TTA GTT CCA ATC AAA ATA GAG TAT CAA TCA GAT ACA 480 Glu Lys Gly Lys Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser Asp Thr 610 615 620 AAA TTT AAT ATT GAC AGT AAA ACA TTT AAA GAA CTT AAA TTA TTT AAA 528 Lys Phe Asn Ile Asp Ser Lys Thr Phe Lys Glu Leu Lys Leu Phe Lys 625 630 635 ATA GAT AGT CAA AAC CAA CCC CAG CAA GTC CAG CAA GAT GAA CTG AGA 576 Ile Asp Ser Gln Asn Gln Pro Gln Gln Val Gln Gln Asp Glu Leu Arg 640 645 650 AAT CCT GAA TTT AAC AAG AAA GAA TCA CAG GAA TTC TTA GCG AAA CCA 624 Asn Pro Glu Phe Asn Lys Lys Glu Ser Gln Glu Phe Leu Ala Lys Pro 655 660 665 670 TCG AAA ATA AAT CTT TTC ACT CAA AAA ATG AAA AGG GAA ATT GAT GAA 672 Ser Lys Ile Asn Leu Phe Thr Gln Lys Met Lys Arg Glu Ile Asp Glu 675 680 685 GAC ACG GAT ACG GAT GGG GAC TCT ATT CCT GAC CTT TGG GAA GAA AAT 720 Asp Thr Asp Thr Asp Gly Asp Ser Ile Pro Asp Leu Trp Glu Glu Asn 690 695 700 GGG TAT ACG ATT CAA AAT AGA ATC GCT GTA AAG TGG GAC GAT TCT CTA 768 Gly Tyr Thr Ile Gln Asn Arg Ile Ala Val Lys Trp Asp Asp Ser Leu 705 710 715 GCA AGT AAA GGG TAT ACG AAA TTT GTT TCA AAT CCA CTA GAA AGT CAC 816 Ala Ser Lys Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Glu Ser His 720 725 730 ACA GTT GGT GAT CCT TAT ACA GAT TAT GAA AAG GCA GCA AGA GAT CTA 864 Thr Val Gly Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg Asp Leu 735 740 745 750 GAT TTG TCA AAT GCA AAG GAA ACG TTT AAC CCA TTG GTA GCT GCT TTT 912 Asp Leu Ser Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala Phe 755 760 765 CCA AGT GTG AAT GTT AGT ATG GAA AAG GTG ATA TTA TCA CCA AAT GAA 960 Pro Ser Val Asn Val Ser Met Glu Lys Val Ile Leu Ser Pro Asn Glu 770 775 780 AAT TTA TCC AAT AGT GTA GAG TCT CAT TCA TCC ACG AAT TGG TCT TAT 1008 Asn Leu Ser Asn Ser Val Glu Ser His Ser Ser Thr Asn Trp Ser Tyr 785 790 795 ACA AAT ACA GAA GGT GCT TCT GTT GAA GCG GGG ATT GGA CCA AAA GGT 1056 Thr Asn Thr Glu Gly Ala Ser Val Glu Ala Gly Ile Gly Pro Lys Gly 800 805 810 ATT TCG TTC GGA GTT AGC GTA AAC TAT CAA CAC TCT GAA ACA GTT GCA 1104 Ile Ser Phe Gly Val Ser Val Asn Tyr Gln His Ser Glu Thr Val Ala 815 820 825 830 CAA GAA TGG GGA ACA TCT ACA GGA AAT ACT TCG CAA TTC AAT ACG GCT 1152 Gln Glu Trp Gly Thr Ser Thr Gly Asn Thr Ser Gln Phe Asn Thr Ala 835 840 845 TCA GCG GGA TAT TTA AAT GCA AAT GTT CGA TAT AAC AAT GTA GGA ACT 1200 Ser Ala Gly Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val Gly Thr 850 855 860 GGT GCC ATC TAC GAT GTA AAA CCT ACA ACA AGT TTT GTA TTA AAT AAC 1248 Gly Ala Ile Tyr Asp Val Lys Pro Thr Thr Ser Phe Val Leu Asn Asn 865 870 875 GAT ACT ATC GCA ACT ATT ACG GCG AAA TCT AAT TCT ACA GCC TTA AAT 1296 Asp Thr Ile Ala Thr Ile Thr Ala Lys Ser Asn Ser Thr Ala Leu Asn 880 885 890 ATA TCT CCT GGA GAA AGT TAC CCG AAA AAA GGA CAA AAT GGA ATC GCA 1344 Ile Ser Pro Gly Glu Ser Tyr Pro Lys Lys Gly Gln Asn Gly Ile Ala 895 900 905 910 ATA ACA TCA ATG GAT GAT TTT AAT TCC CAT CCG ATT ACA TTA AAT AAA 1392 Ile Thr Ser Met Asp Asp Phe Asn Ser His Pro Ile Thr Leu Asn Lys 915 920 925 AAA CAA GTA GAT AAT CTG CTA AAT AAT AAA CCT ATG ATG TTG GAA ACA 1440 Lys Gln Val Asp Asn Leu Leu Asn Asn Lys Pro Met Met Leu Glu Thr 930 935 940 AAC CAA ACA GAT GGT GTT TAT AAG ATA AAA GAT ACA CAT GGA AAT ATA 1488 Asn Gln Thr Asp Gly Val Tyr Lys Ile Lys Asp Thr His Gly Asn Ile 945 950 955 GTA ACT GGC GGA GAA TGG AAT GGT GTC ATA CAA CAA ATC AAG GCT AAA 1536 Val Thr Gly Gly Glu Trp Asn Gly Val Ile Gln Gln Ile Lys Ala Lys 960 965 970 ACA GCG TCT ATT ATT GTG GAT GAT GGG GAA CGT GTA GCA GAA AAA CGT 1584 Thr Ala Ser Ile Ile Val Asp Asp Gly Glu Arg Val Ala Glu Lys Arg 975 980 985 990 GTA GCG GCA AAA GAT TAT GAA AAT CCA GAA GAT AAA ACA CCG TCT TTA 1632 Val Ala Ala Lys Asp Tyr Glu Asn Pro Glu Asp Lys Thr Pro Ser Leu 995 1000 1005 ACT TTA AAA GAT GCC CTG AAG CTT TCA TAT CCA GAT GAA ATA AAA GAA 1680 Thr Leu Lys Asp Ala Leu Lys Leu Ser Tyr Pro Asp Glu Ile Lys Glu 1010 1015 1020 ATA GAG GGA TTA TTA TAT TAT AAA AAC AAA CCG ATA TAC GAA TCG AGC 1728 Ile Glu Gly Leu Leu Tyr Tyr Lys Asn Lys Pro Ile Tyr Glu Ser Ser 1025 1030 1035 GTT ATG ACT TAC TTA GAT GAA AAT ACA GCA AAA GAA GTG ACC AAA CAA 1776 Val Met Thr Tyr Leu Asp Glu Asn Thr Ala Lys Glu Val Thr Lys Gln 1040 1045 1050 TTA AAT GAT ACC ACT GGG AAA TTT AAA GAT GTA AGT CAT TTA TAT GAT 1824 Leu Asn Asp Thr Thr Gly Lys Phe Lys Asp Val Ser His Leu Tyr Asp 1055 1060 1065 1070 GTA AAA CTG ACT CCA AAA ATG AAT GTT ACA ATC AAA TTG TCT ATA CTT 1872 Val Lys Leu Thr Pro Lys Met Asn Val Thr Ile Lys Leu Ser Ile Leu 1075 1080 1085 TAT GAT AAT GCT GAG TCT AAT GAT AAC TCA ATT GGT AAA TGG ACA AAC 1920 Tyr Asp Asn Ala Glu Ser Asn Asp Asn Ser Ile Gly Lys Trp Thr Asn 1090 1095 1100 ACA AAT ATT GTT TCA GGT GGA AAT AAC GGA AAA AAA CAA TAT TCT TCT 1968 Thr Asn Ile Val Ser Gly Gly Asn Asn Gly Lys Lys Gln Tyr Ser Ser 1105 1110 1115 AAT AAT CCG GAT GCT AAT TTG ACA TTA AAT ACA GAT GCT CAA GAA AAA 2016 Asn Asn Pro Asp Ala Asn Leu Thr Leu Asn Thr Asp Ala Gln Glu Lys 1120 1125 1130 TTA AAT AAA AAT CGT GAC TAT TAT ATA AGT TTA TAT ATG AAG TCA GAA 2064 Leu Asn Lys Asn Arg Asp Tyr Tyr Ile Ser Leu Tyr Met Lys Ser Glu 1135 1140 1145 1150 AAA AAC ACA CAA TGT GAG ATT ACT ATA GAT GGG GAG ATT TAT CCG ATC 2112 Lys Asn Thr Gln Cys Glu Ile Thr Ile Asp Gly Glu Ile Tyr Pro Ile 1155 1160 1165 ACT ACA AAA ACA GTG AAT GTG AAT AAA GAC AAT TAC AAA AGA TTA GAT 2160 Thr Thr Lys Thr Val Asn Val Asn Lys Asp Asn Tyr Lys Arg Leu Asp 1170 1175 1180 ATT ATA GCT CAT AAT ATA AAA AGT AAT CCA ATT TCT TCA CTT CAT ATT 2208 Ile Ile Ala His Asn Ile Lys Ser Asn Pro Ile Ser Ser Leu His Ile 1185 1190 1195 AAA ACG AAT GAT GAA ATA ACT TTA TTT TGG GAT GAT ATT TCT ATA ACA 2256 Lys Thr Asn Asp Glu Ile Thr Leu Phe Trp Asp Asp Ile Ser Ile Thr 1200 1205 1210 GAT GTA GCA TCA ATA AAA CCG GAA AAT TTA ACA GAT TCA GAA ATT AAA 2304 Asp Val Ala Ser Ile Lys Pro Glu Asn Leu Thr Asp Ser Glu Ile Lys 1215 1220 1225 1230 CAG ATT TAT AGT AGG TAT GGT ATT AAG TTA GAA GAT GGA ATC CTT ATT 2352 Gln Ile Tyr Ser Arg Tyr Gly Ile Lys Leu Glu Asp Gly Ile Leu Ile 1235 1240 1245 GAT AAA AAA GGT GGG ATT CAT TAT GGT GAA TTT ATT AAT GAA GCT AGT 2400 Asp Lys Lys Gly Gly Ile His Tyr Gly Glu Phe Ile Asn Glu Ala Ser 1250 1255 1260 TTT AAT ATT GAA CCA TTG CAA AAT TAT GTG ACC AAA TAT GAA GTT ACT 2448 Phe Asn Ile Glu pro Leu Gln Asn Tyr Val Tnr Lys Tyr Glu Val Thr 1265 1270 1275 TAT AGT AGT GAG TTA GGA CCA AAC GTG AGT GAC ACA CTT GAA AGT GAT 2496 Tyr Ser Ser Glu Leu Gly Pro Asn Val Ser Asp Thr Leu Glu Ser Asp 1280 1285 1290 AAA ATT TAC AAG GAT GGG ACA ATT AAA TTT GAT TTT ACC AAA TAT AGT 2544 Lys Ile Tyr Lys Asp Gly Thr Ile Lys Phe Asp Phe Thr Lys Tyr Ser 1295 1300 1305 13l0 AAA AAT GAA CAA GGA TTA TTT TAT GAC AGT GGA TTA AAT TGG GAC TTT 2592 Lys Asn Glu Gln Gly Leu Phe Tyr Asp Ser Gly Leu Asn Trp Asp Phe 1315 1320 1325 AAA ATT AAT GCT ATT ACT TAT GAT GGT AAA GAG ATG AAT GTT TTT CAT 2640 Lys Ile Asn Ala Ile Thr Tyr Asp Gly Lys Glu Met Asn Val Phe His 1330 1335 1340 AGA TAT AAT AAA TAG 2655 Arg Tyr Asn Lys 1345 (2)SEQ ID NO:5信息: (i)序列特征: (A)长度:884个氨基酸 (B)类型:氨基酸 (D)拓扑结构:线性 (ii)分子类型:蛋白质 (xi)序列描述:SEQ ID NO:5: Met Lys Asn Met Lys Lys Lys Leu Ala Ser Val Val Thr Cys Thr Leu 1 5 10 15 Leu Ala Pro Met Phe Leu Asn Gly Asn Val Asn Ala Val Tyr Ala Asp 20 25 30 Ser Lys Thr Asn Gln Ile Ser Thr Thr Gln Lys Asn Gln Gln Lys Glu 35 40 45 Met Asp Arg Lys Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys Asp Phe 50 55 60 Ser Asn Leu Thr Met Phe Ala Pro Thr Arg Asp Ser Thr Leu Ile Tyr 65 70 75 80 Asp Gln Gln Thr Ala Asn Lys Leu Leu Asp Lys Lys Gln Gln Glu Tyr 85 90 95 Gln Ser Ile Arg Trp Ile Gly Leu Ile Gln Ser Lys Glu Thr Gly Asp 100 105 110 Phe Thr Phe Asn Leu Ser Glu Asp Glu Gln Ala Ile Ile Glu Ile Asn 115 120 125 Gly Lys Ile Ile Ser Asn Lys Gly Lys Glu Lys Gln Val Val His Leu 130 135 140 Glu Lys Gly Lys Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser Asp Thr 145 150 155 160 Lys Phe Asn Ile Asp Ser Lys Thr Phe Lys Glu Leu Lys Leu Phe Lys 165 170 175 Ile Asp Ser Gln Asn Gln Pro Gln Gln Val Gln Gln Asp Glu Leu Arg 180 185 190 Asn Pro Glu Phe Asn Lys Lys Glu Ser Gln Glu Phe Leu Ala Lys Pro 195 200 205 Ser Lys Ile Asn Leu Phe Thr Gln Lys Met Lys Arg Glu Ile Asp Glu 210 215 220 Asp Thr Asp Thr Asp Gly Asp Ser Ile Pro Asp Leu Trp Glu Glu Asn 225 230 235 240 Gly Tyr Thr Ile Gln Asn Arg Ile Ala Val Lys Trp Asp Asp Ser Leu 245 250 255 Ala Ser Lys Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Glu Ser His 260 265 270 Thr Val Gly Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg Asp Leu 275 280 285 Asp Leu Ser Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala Phe 290 295 300 Pro Ser Val Asn Val Ser Met Glu Lys Val Ile Leu Ser Pro Asn Glu 305 310 315 320 Asn Leu Ser Asn Ser Val Glu Ser His Ser Ser Thr Asn Trp Ser Tyr 325 330 335 Thr Asn Thr Glu Gly Ala Ser Val Glu Ala Gly Ile Gly Pro Lys Gly 340 345 350 Ile Ser Phe Gly Val Ser Val Asn Tyr Gln His Ser Glu Thr Val Ala 355 360 365 Gln Glu Trp Gly Thr Ser Thr Gly Asn Thr Ser Gln Phe Asn Thr Ala 370 375 380 Ser Ala Gly Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val Gly Thr 385 390 395 400 Gly Ala Ile Tyr Asp Val Lys Pro Thr Thr Ser Phe Val Leu Asn Asn 405 410 415 Asp Thr Ile Ala Thr Ile Thr Ala Lys Ser Asn Ser Thr Ala Leu Asn 420 425 430 Ile Ser Pro Gly Glu Ser Tyr Pro Lys Lys Gly Gln Asn Gly Ile Ala 435 440 445 Ile Thr Ser Met Asp Asp Phe Asn Ser His Pro Ile Thr Leu Asn Lys 450 455 460 Lys Gln Val Asp Asn Leu Leu Asn Asn Lys Pro Met Met Leu Glu Thr 465 470 475 480 Asn Gln Thr Asp Gly Val Tyr Lys Ile Lys Asp Thr His Gly Asn Ile 485 490 495 Val Thr Gly Gly Glu Trp Asn Gly Val Ile Gln Gln Ile Lys Ala Lys 500 505 510 Thr Ala Ser Ile Ile Val Asp Asp Gly Glu Arg Val Ala Glu Lys Arg 5l5 520 525 Val Ala Ala Lys Asp Tyr Glu Asn Pro Glu Asp Lys Thr Pro Ser Leu 530 535 540 Thr Leu Lys Asp Ala Leu Lys Leu Ser Tyr Pro Asp Glu Ile Lys Glu 545 550 555 560 Ile Glu Gly Leu Leu Tyr Tyr Lys Asn Lys Pro Ile Tyr Glu Ser Ser 565 570 575 Val Met Thr Tyr Leu Asp Glu Asn Thr Ala Lys Glu Val Thr Lys Gln 580 585 590 Leu Asn Asp Thr Thr Gly Lys Phe Lys Asp Val Ser His Leu Tyr Asp 595 600 605 Val Lys Leu Thr Pro Lys Met Asn Val Thr Ile Lys Leu Ser Ile Leu 610 615 620 Tyr Asp Asn Ala Glu Ser Asn Asp Asn Ser Ile Gly Lys Trp Thr Asn 625 630 635 640 Thr Asn Ile Val Ser Gly Gly Asn Asn Gly Lys Lys Gln Tyr Ser Ser 645 650 655 Asn Asn Pro Asp Ala Asn Leu Thr Leu Asn Thr Asp Ala Gln Glu Lys 660 665 670 Leu Asn Lys Asn Arg Asp Tyr Tyr Ile Ser Leu Tyr Met Lys Ser Glu 675 680 685 Lys Asn Thr Gln Cys Glu Ile Thr Ile Asp Gly Glu Ile Tyr Pro Ile 690 695 700 Thr Thr Lys Thr Val Asn Val Asn Lys Asp Asn Tyr Lys Arg Leu Asp 705 710 715 720 Ile Ile Ala His Asn Ile Lys Ser Asn Pro Ile Ser Ser Leu His Ile 725 730 735 Lys Thr Asn Asp Glu Ile Thr Leu Phe Trp Asp Asp Ile Ser Ile Thr 740 745 750 Asp Val Ala Ser Ile Lys Pro Glu Asn Leu Thr Asp Ser Glu Ile Lys 755 760 765 Gln Ile Tyr Ser Arg Tyr Gly Ile Lys Leu Glu Asp Gly Ile Leu Ile 770 775 780 Asp Lys Lys Gly Gly Ile His Tyr Gly Glu Phe Ile Asn Glu Ala Ser 785 790 795 800 Phe Asn Ile Glu Pro Leu Gln Asn Tyr Val Thr Lys Tyr Glu Val Thr 805 810 815 Tyr Ser Ser Glu Leu Gly Pro Asn Val Ser Asp Thr Leu Glu Ser Asp 820 825 830 Lys Ile Tyr Lys Asp Gly Thr Ile Lys Phe Asp Phe Thr Lys Tyr Ser 835 840 845 Lys Asn Glu Gln Gly Leu Phe Tyr Asp Ser Gly Leu Asn Trp Asp Phe 850 855 860 Lys Ile Asn Ala Ile Thr Tyr Asp Gly Lys Glu Met Asn Val Phe His 865 870 875 880 Arg Tyr Asn Lys (2)SEQ ID NO:6信息: (i)序列特征: (A)长度:2004个碱基对 (B)类型:核酸 (C)链型:单链 (D)拓扑结构:线性 (ii)分子类型:DNA(基因组) (iii)假设:否 (iv)反义:否 (vi)原始来源: (A)有机体:蜡状芽孢杆菌 (B)菌株:AB78 (C)单独的分离物:NRRL B-21058 (ix)特征: (A)名称/关键词:CDS (B)位置:1..2001 (D)其它信息:/注=″80kd蛋白质VIP1A(a)″ /注=″这一序列与SEQ ID NO:1:的核苷酸3126-5126之间所发现的序列 相同″ (xi)序列描述:SEQ ID NO:6: ATG AAA AGG GAA ATT GAT GAA GAC ACG GAT ACG GAT GGG GAC TCT ATT 48 Met Lys Arg Glu Ile Asp Glu Asp Thr Asp Thr Asp Gly Asp Ser Ile 885 890 895 900 CCT GAC CTT TGG GAA GAA AAT GGG TAT ACG ATT CAA AAT AGA ATC GCT 96 Pro Asp Leu Trp Glu Glu Asn Gly Tyr Thr Ile Gln Asn Arg Ile Ala 905 910 915 GTA AAG TGG GAC GAT TCT CTA GCA AGT AAA GGG TAT ACG AAA TTT GTT 144 Val Lys Trp Asp Asp Ser Leu Ala Ser Lys Gly Tyr Thr Lys Phe Val 920 925 930 TCA AAT CCA CTA GAA AGT CAC ACA GTT GGT GAT CCT TAT ACA GAT TAT 192 Ser Asn Pro Leu Glu Ser His Thr Val Gly Asp Pro Tyr Thr Asp Tyr 935 940 945 GAA AAG GCA GCA AGA GAT CTA GAT TTG TCA AAT GCA AAG GAA ACG TTT 240 Glu Lys Ala Ala Arg Asp Leu Asp Leu Ser Asn Ala Lys Glu Thr Phe 950 955 960 AAC CCA TTG GTA GCT GCT TTT CCA AGT GTG AAT GTT AGT ATG GAA AAG 288 Asn Pro Leu Val Ala Ala Phe Pro Ser Val Asn Val Ser Met Glu Lys 965 970 975 980 GTG ATA TTA TCA CCA AAT GAA AAT TTA TCC AAT AGT GTA GAG TCT CAT 336 Val Ile Leu Ser Pro Asn Glu Asn Leu Ser Asn Ser Val Glu Ser His 985 990 995 TCA TCC ACG AAT TGG TCT TAT ACA AAT ACA GAA GGT GCT TCT GTT GAA 384 Ser Ser Thr Asn Trp Ser Tyr Thr Asn Thr Glu Gly Ala Ser Val Glu 1000 1005 1010 GCG GGG ATT GGA CCA AAA GGT ATT TCG TTC GGA GTT AGC GTA AAC TAT 432 Ala Gly Ile Gly Pro Lys Gly Ile Ser Phe Gly Val Ser Val Asn Tyr 1015 1020 1025 CAA CAC TCT GAA ACA GTT GCA CAA GAA TGG GGA ACA TCT ACA GGA AAT 480 Gln His Ser Glu Thr Val Ala Gln Glu Trp Gly Thr Ser Thr Gly Asn 1030 1035 1040 ACT TCG CAA TTC AAT ACG GCT TCA GCG GGA TAT TTA AAT GCA AAT GTT 528 Thr Ser Gln Phe Asn Thr Ala Ser Ala Gly Tyr Leu Asn Ala Asn Val 1045 1050 1055 1060 CGA TAT AAC AAT GTA GGA ACT GGT GCC ATC TAC GAT GTA AAA CCT ACA 576 Arg Tyr Asn Asn Val Gly Thr Gly Ala Ile Tyr Asp Val Lys Pro Thr 1065 1070 1075 ACA AGT TTT GTA TTA AAT AAC GAT ACT ATC GCA ACT ATT ACG GCG AAA 624 Thr Ser Phe Val Leu Asn Asn Asp Thr Ile Ala Thr Ile Thr Ala Lys 1080 1085 1090 TC TAAT TCT ACA GCC TTA AAT ATA TCT CCT GGA GAA AGT TAC CCG AAA 672 Ser Asn Ser Thr Ala Leu Asn Ile Ser Pro Gly Glu Ser Tyr Pro Lys 1095 1100 1105 AAA GGA CAA AAT GGA ATC GCA ATA ACA TCA ATG GAT GAT TTT AAT TCC 720 Lys Gly Gln Asn Gly Ile Ala Ile Thr Ser Met Asp Asp Phe Asn Ser 1110 1115 1120 CAT CCG ATT ACA TTA AAT AAA AAA CAA GTA GAT AAT CTG CTA AAT AAT 768 His Pro Ile Thr Leu Asn Lys Lys Gln Val Asp Asn Leu Leu Asn Asn 1125 1130 1135 1140 AAA CCT ATG ATG TTG GAA ACA AAC CAA ACA GAT GGT GTT TAT AAG ATA 816 Lys Pro Met Met Leu Glu Thr Asn Gln Thr Asp Gly Val Tyr Lys Ile 1145 1150 1155 AAA GAT ACA CAT GGA AAT ATA GTA ACT GGC GGA GAA TGG AAT GGT GTC 864 Lys Asp Thr His Gly Asn Ile Val Thr Gly Gly Glu Trp Asn Gly Val 1160 1165 1170 ATA CAA CAA ATC AAG GCT AAA ACA GCG TCT ATT ATT GTG GAT GAT GGG 912 Ile Gln Gln Ile Lys Ala Lys Thr Ala Ser Ile Ile Val Asp Asp Gly 1175 1180 1185 GAA CGT GTA GCA GAA AAA CGT GTA GCG GCA AAA GAT TAT GAA AAT CCA 960 Glu Arg Val Ala Glu Lys Arg Val Ala Ala Lys Asp Tyr Glu Asn Pro 1190 1195 1200 GAA GAT AAA ACA CCG TCT TTA ACT TTA AAA GAT GCC CTG AAG CTT TCA 1008 Glu Asp Lys Thr Pro Ser Leu Thr Leu Lys Asp A1a Leu Lys Leu Ser 1205 1210 1215 1220 TAT CCA GAT GAA ATA AAA GAA ATA GAG GGA TTA TTA TAT TAT AAA AAC 1056 Tyr Pro Asp Glu Ile Lys Glu Ile Glu Gly Leu Leu Tyr Tyr Lys Asn 1225 1230 1235 AAA CCG ATA TAC GAA TCG AGC GTT ATG ACT TAC TTA GAT GAA AAT ACA 1104 Lys Pro Ile Tyr Glu Ser Ser Val Met Thr Tyr Leu Asp Glu Asn Thr 1240 1245 1250 GCA AAA GAA GTG ACC AAA CAA TTA AAT GAT ACC ACT GGG AAA TTT AAA 1152 Ala Lys Glu Val Thr Lys Gln Leu Asn Asp Thr Thr Gly Lys Phe Lys 1255 1260 1265 GAT GTA AGT CAT TTA TAT GAT GTA AAA CTG ACT CCA AAA ATG AAT GTT 1200 Asp Val Ser His Leu Tyr Asp Val Lys Leu Thr Pro Lys Met Asn Val 1270 1275 1280 ACA ATC AAA TTG TCT ATA CTT TAT GAT AAT GCT GAG TCT AAT GAT AAC 1248 Thr Ile Lys Leu Ser Ile Leu Tyr Asp Asn Ala Glu Ser Asn Asp Asn 1285 1290 1295 1300 TCA ATT GGT AAA TGG ACA AAC ACA AAT ATT GTT TCA GGT GGA AAT AAC 1296 Ser Ile Gly Lys Trp Thr Asn Thr Asn Ile Val Ser Gly Gly Asn Asn 1305 1310 1315 GGA AAA AAA CAA TAT TCT TCT AAT AAT CCG GAT GCT AAT TTG ACA TTA 1344 Gly Lys Lys Gln Tyr Ser Ser Asn Asn Pro Asp Ala Asn Leu Thr Leu 1320 1325 1330 AAT ACA GAT GCT CAA GAA AAA TTA AAT AAA AAT CGT GAC TAT TAT ATA 1392 Asn Thr Asp Ala Gln Glu Lys Leu Asn Lys Asn Arg Asp Tyr Tyr Ile 1335 1340 1346 AGT TTA TAT ATG AAG TCA GAA AAA AAC ACA CAA TGT GAG ATT ACT ATA 1440 Ser Leu Tyr Met Lys Ser Glu Lys Asn Thr Gln Cys Glu Ile Thr Ile 1350 1355 1360 GAT GGG GAG ATT TAT CCG ATC ACT ACA AAA ACA GTG AAT GTG AAT AAA 1488 Asp Gly Glu Ile Tyr Pro Ile Thr Thr Lys Thr Val Asn Val Asn Lys 1365 1370 1375 1380 GAC AAT TAC AAA AGA TTA GAT ATT ATA GCT CAT AAT ATA AAA AGT AAT 1536 Asp Asn Tyr Lys Arg Leu Asp Ile Ile Ala His Asn Ile Lys Ser Asn 1385 1390 1395 GGA ATT TCT TCA CTT CAT ATT AAA ACG AAT GAT GAA ATA ACT TTA TTT 1584 Pro Ile Ser Ser Leu His Ile Lvs Thr Asn Asp Glu Ile Thr Leu Phe 1400 1405 1410 TGG GAT GAT ATT TCT ATA ACA GAT GTA GCA TCA ATA AAA CCG GAA AAT 1632 Trp Asp Asp Ile Ser Ile Thr Asp Val Ala Ser Ile Lys Pro Glu Asn 1415 1420 1425 TTA ACA GAT TCA GAA ATT AAA CAG ATT TAT AGT AGG TAT GGT ATT AAG 1680 Leu Thr Asp Ser Glu Ile Lys Gln Ile Tyr Ser Arg Tyr Gly Ile Lys 1430 1435 1440 TTA GAA GAT GGA ATC CTT ATT GAT AAA AAA GGT GGG ATT CAT TAT GGT 1728 Leu Glu Asp Gly Ile Leu Ile Asp Lys Lys Gly Gly Ile His Tyr Gly 1445 1450 1455 1460 GAA TTT ATT AAT GAA GCT AGT TTT AAT ATT GAA CCA TTG CCA AAT TAT 1776 Glu Phe Ile Asn Glu Ala Ser Phe Asn Ile Glu Pro Leu Pro Asn Tyr 1465 1470 1475 GTG ACC AAA TAT GAA GTT ACT TAT AGT AGT GAG TTA GGA CCA AAC GTG 1824 Val Thr Lys Tyr Glu Val Thr Tyr Ser Ser Glu Leu Gly Pro Asn Val 1480 1485 1490 AGT GAC ACA CTT GAA AGT GAT AAA ATT TAC AAG GAT GGG ACA ATT AAA 1872 Ser Asp Thr Leu Glu Ser Asp Lys Ile Tyr Lys Asp Gly Thr Ile Lys 1495 1500 1505 TTT GAT TTT ACC AAA TAT AGT AAA AAT GAA CAA GGA TTA TTT TAT GAC 1920 Phe Asp Phe Thr Lys Tyr Ser Lys Asn Glu Gln Gly Leu Phe Tyr Asp 1510 1515 1520 AGT GGA TTA AAT TGG GAC TTT AAA ATT AAT GCT ATT ACT TAT GAT GGT 1968 Ser Gly Leu Asn Trp Asp Phe Lys Ile Asn Ala Ile Thr Tyr Asp Gly 1525 1530 1535 1540 AAA GAG ATG AAT GTT TTT CAT AGA TAT AAT AAA TAG 2004 Lys Glu Met Asn Val Phe His Arg Tyr Asn Lys 1545 1550 (2)SEQ ID NO:7信息: (i)序列特征: (A)长度:667个氨基酸 (B)类型:氨基酸 (D)拓扑结构:线性 (ii)分子类型:蛋白质 (xi)序列描述:SEQ ID NO:7: Met Lys Arg Glu Ile Asp Glu Asp Thr Asp Thr Asp Gly Asp Ser Ile 1 5 10 15 Pro Asp Leu Trp Glu Glu Asn Gly Tyr Thr Ile Gln Asn Arg Ile Ala 20 25 30 Val Lys Trp Asp Asp Ser Leu Ala Ser Lys Gly Tyr Thr Lys Phe Val 35 40 45 Ser Asn Pro Leu Glu Ser His Thr Val Gly Asp Pro Tyr Thr Asp Tyr 50 55 60 Glu Lys Ala Ala Arg Asp Leu Asp Leu Ser Asn Ala Lys Glu Thr Phe 65 70 75 80 Asn Pro Leu Val Ala Ala Phe Pro Ser Val Asn Val Ser Met Glu Lys 85 90 95 Val Ile Leu Ser Pro Asn Glu Asn Leu Ser Asn Ser Val Glu Ser His 100 105 110 Ser Ser Thr Asn Trp Ser Tyr Thr Asn Thr Glu Gly Ala Ser Val Glu 115 120 125 Ala Gly Ile Gly Pro Lys Gly Ile Ser Phe Gly Val Ser Val Asn Tyr 130 135 140 Gln His Ser Glu Thr Val Ala Gln Glu Trp Gly Thr Ser Thr Gly Asn 145 150 155 160 Thr Ser Gln Phe Asn Thr Ala Ser Ala Gly Tyr Leu Asn Ala Asn Val 165 170 175 Arg Tyr Asn Asn Val Gly Thr Gly Ala Ile Tyr Asp Val Lys Pro Thr 180 185 190 Thr Ser Phe Val Leu Asn Asn Asp Thr Ile Ala Thr Ile Thr Ala Lys 195 200 205 Ser Asn Ser Thr Ala Leu Asn Ile Ser Pro Gly Glu Ser Tyr Pro Lys 210 215 220 Lys Gly Gln Asn Gly Ile Ala Ile Thr Ser Met Asp Asp Phe Asn Ser 225 230 235 240 His Pro Ile Thr Leu Asn Lys Lys Gln Val Asp Asn Leu Leu Asn Asn 245 250 255 Lys Pro Met Met Leu Glu Thr Asn Gln Thr Asp Gly Val Tyr Lys Ile 260 265 270 Lys Asp Thr His Gly Asn Ile Val Thr Gly Gly Glu Trp Asn Gly Val 275 280 285 Ile Gln Gln Ile Lys Ala Lys Thr Ala Ser Ile Ile Val Asp Asp Gly 290 295 300 Glu Arg Val Ala Glu Lys Arg Val Ala Ala Lys Asp Tyr Glu Asn Pro 305 310 315 320 Glu Asp Lys Thr Pro Ser Leu Thr Leu Lys Asp Ala Leu Lys Leu Ser 325 330 335 Tyr Pro Asp Glu Ile Lys Glu Ile Glu Gly Ieu Leu Tyr Tyr Lys Asn 340 345 350 Lys Pro Ile Tyr Glu Ser Ser Val Met Thr Tyr Leu Asp Glu Asn Thr 355 360 365 Ala Lys Glu Val Thr Lys Gln Leu Asn Asp Thr Thr Gly Lys Phe Lys 370 375 380 Asp Val Ser His Leu Tyr Asp Val Lys Leu Thr Pro Lys Met Asn Val 385 390 395 400 Thr Ile Lys Leu Ser Ile Leu Tyr Asp Asn Ala Glu Ser Asn Asp Asn 405 410 415 Ser Ile Gly Lys Trp Thr Asn Thr Asn Ile Val Ser Gly Gly Asn Asn 420 425 430 Gly Lys Lys Gln Tyr Ser Ser Asn Asn Pro Asp Ala Asn Leu Thr Leu 435 440 445 Asn Thr Asp Ala Gln Glu Lys Leu Asn Lys Asn Arg Asp Tyr Tyr Ile 450 455 460 Ser Leu Tyr Met Lys Ser Glu Lys Asn Thr Gln Cys Glu Ile Thr Ile 465 470 475 480 Asp Gly Glu Ile Tyr Pro Ile Thr Thr Lys Thr Val Asn Val Asn Lys 485 490 495 Asp Asn Tyr Lys Arg Leu Asp Ile Ile Ala His Asn Ile Lys Ser Asn 500 505 510 Pro Ile Ser Ser Leu His Ile Lys Thr Asn Asp Glu Ile Thr Leu Phe 515 520 525 Trp Asp Asp Ile Ser Ile Thr Asp Val Ala Ser Ile Lys Pro Glu Asn 530 535 540 Leu Thr Asp Ser Glu Ile Lys Gln Ile Tyr Ser Arg Tyr Gly Ile Lys 545 550 555 560 Leu Glu Asp Gly Ile Leu Ile Asp Lys Lys Gly Gly Ile His Tyr Gly 565 570 575 Glu Phe Ile Asn Glu Ala Ser Phe Asn Ile Glu Pro Leu Pro Asn Tyr 580 585 590 Val Thr Lys Tyr Glu Val Thr Tyr Ser Ser Glu Leu Gly Pro Asn Val 595 600 605 Ser Asp Thr Leu Glu Ser Asp Lys Ile Tyr Lys Asp Gly Thr Ile Lys 610 615 620 Phe Asp Phe Thr Lys Tyr Ser Lys Asn Glu Gln Gly Leu Phe Tyr Asp 625 630 635 640 Ser Gly Leu Asn Trp Asp Phe Lys Ile Asn Ala Ile Thr Tyr Asp Gly 645 650 655 Lys Glu Met Asn Val Phe His Arg Tyr Asn Lys 660 665 (2)SEQ ID NO:8信息: (i)序列特征: (A)长度:16个氨基酸 (B)类型:氨基酸 (C)链型:单链 (D)拓扑结构:线性 (ii)分子类型:肽 (iii)假设:否 (v)片段类型:N-末端 (vi)原始来源: (A)有机体:蜡状芽孢杆菌 (B)菌株:AB78 (C)单独的分离物:NRRL B-21058 (ix)特征: (A)名称/关键词:肽 (B)位置:1..16 (D)其它信息:/注=″从菌株AB78纯化的蛋白质的N-末端序 列″ (xi)序列描述:SEQ ID NO:8: Lys Arg Glu Ile Asp Glu Asp Thr Asp Thr Asx Gly Asp Ser Ile Pro 1 5 10 15 (2)SEQ ID NO:9信息: (i)序列特征: (A)长度:21个碱基对 (B)类型:核酸 (C)链型:单链 (D)拓扑结构:线性 (ii)分子类型:DNA(基因组) (iii)假设:否 (iv)反义:否 (ix)特征: (A)名称/关键词:misc_特征 (B)位置:1..21 (D)其它信息:/注=″基于SEQ ID NO:8的氨基酸3-9之寡核 苷酸探针,采用苏云金芽孢杆菌的密码子使用″ (xi)序列描述:SEQ ID NO:9: CAAATTGATC AAGATACNGA T (2)SEQ ID NO:10信息: (i)序列特征: (A)长度:14个氨基酸 (B)类型:氨基酸 (C)链型:单链 (D)拓扑结构:线性 (ii)分子类型:肽 (iii)假设:否 (v)片段类型:N-末端 (vi)原始来源: (A)有机体:苏云金芽孢杆菌 (B)菌株:AB88 (ix)特征: (A)名称/关键词:肽 (B)位置:1..14 (D)其它信息:/注=″已知为阴离子交换组分23的蛋白质的N- 末端氨基酸序列(较小)″ (xi)序列描述:SEQ ID NO:10: Xaa Glu Pro Phe Val Ser Ala Xaa Xaa Xaa Gln Xaa Xaa Xaa 1 5 10 (2)SEQ ID NO:11信息: (i)序列特征: (A)长度:13个氨基酸 (B)类型:氨基酸 (C)链型:单链 (D)拓扑结构:N-末端 (vi)原始来源: (A)有机体:苏云金芽孢杆菌 (xi)序列描述:SEQ ID NO:11: Xaa Glu Tyr Glu Asn Val Glu Pro Phe Val Ser Ala Xaa 1 5 10 (2)SEQ ID NO:12信息: (i)序列特征: (A)长度:14个氨基酸 (B)类型:氨基酸 (C)链型:单链 (D)拓扑结构:N-末端 (vi)原始来源: (A)有机体:苏云金芽孢杆菌 (xi)序列描述:SEQ ID NO:12: Met Asn Lys Asn Asn Thr Lys Leu Pro Thr Arg Ala Leu Pro 1 5 10 (2)SEQ ID NO:13信息: (i)序列特征: (A)长度:15个氨基酸 (B)类型:氨基酸 (C)链型:单链 (D)拓扑结构:线性 (ii)分子类型:肽 (iii)假设:否 (v)片段类型:N-末端 (vi)原始来源: (A)有机体:苏云金芽孢杆菌 (B)菌株:AB88 (ix)特征: (A)名称/关键词:肽 (B)位置:1..15 (D)其它信息:/注=″抗Agrotis ipsilon活性的35kDaVIP的N -末端氨基酸序列″ (xi)序列描述:SEQ ID NO:13: Ala Leu Ser Glu Asn Thr Gly Lys Asp Gly Gly Tyr Ile Val Pro 1 5 10 15 (2)SEQ ID NO:14信息: (i)序列特征: (A)长度:9个氨基酸 (B)类型:氨基酸 (C)链型:单链 (D)拓扑结构:N-末端 (vi)原始来源: (A)有机体:苏云金芽孢杆菌 (xi)序列描述:SEQ ID NO:14: Met Asp Asn Asn Pro Asn Ile Asn Glu 1 5 (2)SEQ ID NO:15信息: (i)序列特征: (A)长度:9个氨基酸 (B)类型:氨基酸 (C)链型:单链 (D)拓扑结构:线性 (ii)分子类型:肽 (iii)假设:否 (v)片段类型:N-末端 (ix)特征: (A)名称/关键词:肽 (B)位置:1..9 (D)其它信息:/注=″80kDa δ-内毒素的N-末端序列″ (xi)序列描述:SEQ ID NO:15: Met Asp Asn Asn Pro Asn Ile Asn Glu 1 5 (2)SEQ ID NO:16信息: (i)序列特征: (A)长度:11个氨基酸 (B)类型:氨基酸 (C)链型:单链 (D)拓扑结构:线性 (ii)分子类型:肽 (iii)假设:否 (v)片段类型:N-末端 (vi)原始来源: (A)有机体:苏云金芽孢杆菌 (ix)特征: (A)名称/关键词:肽 (B)位置:1..11 (D)其它信息:/注=″60kDa δ-内毒素的N-末端序列″ (xi)序列描述:SEQ ID NO:16: Met Asn Val Leu Asn Ser Gly Ary Thr Thr Ile 1 5 10 (2)SEQ ID NO:17信息: (i)序列特征: (A)长度:2655个碱基对 (B)类型:核酸 (C)链型:单链 (D)拓扑结构:线性 (ii)分子类型:DNA(基因组) (iii)假设:否 (iv)反义:否 (ix)特征: (A)名称/关键词:misc_特征 (B)位置:1..2652 (D)其它信息:/注=″玉米优化的得自AB78的100kd VIP1A(a) DNA序列″ (xi)序列描述:SEQ ID NO:17: ATGAAGAACA TGAAGAAGAA GCTGGCCAGC GTGGTGACCT GCACCCTGCT GGCCCCCATG 60 TTCCTGAACG GCAACGTGAA CGCCGTGTAC GCCGACAGCA AGACCAACCA GATCAGCACC 120 ACCCAGAAGA ACCAGCAGAA GGAGATGGAC CGCAAGGGCC TGCTGGGCTA CTACTTCAAG 180 GGCAAGGACT TCAGCAACCT GACCATGTTC GCCCCCACGC GTGACAGCAC CCTGATCTAC 240 GACCAGCAGA CCGCCAACAA GCTGCTGGAC AAGAAGCAGC AGGAGTACCA GAGCATCCGC 300 TGGATCGGCC TGATCCAGAG CAAGGAGACC GGCGACTTCA CCTTCAACCT GAGCGAGGAC 360 GAGCAGGCCA TCATCGAGAT CAACGGCAAG ATCATCAGCA ACAAGGGCAA GGAGAAGCAG 420 GTGGTGCACC TGGAGAAGGG CAAGCTGGTG CCCATCAAGA TCGAGTACCA GAGCGACACC 480 AAGTTCAACA TCGACAGCAA GACCTTCAAG GAGCTGAAGC TTTTCAAGAT CGACAGCCAG 540 AACCAGCCCC AGCAGGTGCA GCAGGACGAG CTGCGCAACC CCGAGTTCAA CAAGAAGGAG 600 AGCCAGGAGT TCCTGGCCAA GCCCAGCAAG ATCAACCTGT TCACCCAGCA GATGAAGCGC 660 GAGATCGACG AGGACACCGA CACCGACGGC GACAGCATCC CCGACCTGTG GGAGGAGAAC 720 GGCTACACCA TCCAGAACCG CATCGCCGTG AAGTGGGACG ACAGCCTGGC TAGCAAGGGC 780 TACACCAAGT TCGTGAGCAA CCCCCTGGAG AGCCACACCG TGGGCGACCC CTACACCGAC 840 TACGAGAAGG CCGCCCGCGA CCTGGACCTG AGCAACGCCA AGGAGACCTT CAACCCCCTG 900 GTGGCCGCCT TCCCCAGCGT GAACGTGAGC ATGGAGAAGG TGATCCTGAG CCCCAACGAG 960 AACCTGAGCA ACAGCGTGGA GAGCCACTCG AGCACCAACT GGAGCTACAC CAACACCGAG 1020 GGCGCCAGCG TGGAGGCCGG CATCGGTCCC AAGGGCATCA GCTTCGGCGT GAGCGTGAAC 1080 TACCAGCACA GCGAGACCGT GGCCCAGGAG TGGGGCACCA GCACCGGCAA CACCAGCCAG 1140 TTCAACACCG CCAGCGCCGG CTACCTGAAC GCCAACGTGC GCTACAACAA CGTGGGCACC 1200 GGCGCCATCT ACGACGTGAA GCCCACCACC AGCTTCGTGC TGAACAACGA CACCATCGCC 1260 ACCATCACCG CCAAGTCGAA TTCCACCGCC CTGAACATCA GCCCCGGCGA GAGCTACCCC 1320 AAGAAGGGCC AGAACGGCAT CGCCATCACC AGCATGGACG ACTTCAACAG CCACCCCATC 1380 ACCCTGAACA AGAAGCAGGT GGACAACCTG CTGAACAACA AGCCCATGAT GCTGGAGACC 1440 AACCAGACCG ACGGCGTCTA CAAGATCAAG GACACCCACG GCAACATCGT GACCGGCGGC 1500 GAGTGGAACG GCGTGATCCA GCAGATCAAG GCCAAGACCG CCAGCATCAT CGTCGACGAC 1560 GGCGAGCGCG TGGCCGAGAA GCGCGTGGCC GCCAAGGACT ACGAGAACCC CGAGGACAAG 1620 ACCCCCAGCC TGACCCTGAA GGACGCCCTG AAGCTGAGCT ACCCCGACGA GATCAAGGAG 1680 ATCGAGGGCC TGCTGTACTA CAAGAACAAG CCCATCTACG AGAGCAGCGT GATGACCTAT 1740 CTAGACGAGA ACACCGCCAA GGAGGTGACC AAGCAGCTGA ACGACACCAC CGGCAAGTTC 1800 AAGGACGTGA GCCACCTGTA CGACGTGAAG CTGACCCCCA AGATGAACGT GACCATCAAG 1860 CTGAGCATCC TGTACGACAA CGCCGAGAGC AACGACAACA GCATCGGCAA GTGGACCAAC 1920 ACCAACATCG TGAGCGGCGG CAACAACGGC AAGAAGCAGT ACAGCAGCAA CAACCCCGAC 1980 GCCAACCTGA CCCTGAACAC CGACGCCCAG GAGAAGCTGA ACAAGAACCG CGACTACTAC 2040 ATCAGCCTGT ACATGAAGAG CGAGAAGAAC ACCCAGTGCG AGATCACCAT CGACGGCGAG 2100 ATATACCCCA TCACCACCAA GACCGTGAAC GTGAACAAGG ACAACTACAA GCGCCTGGAC 2160 ATCATCGCCC ACAACATCAA GAGCAACCCC ATCAGCAGCC TGCACATCAA GACCAACGAC 2220 GAGATCACCC TGTTCTGGGA CGACATATCG ATTACCGACG TCGCCAGCAT CAAGCCCGAG 2280 AACCTGACCG ACAGCGAGAT CAAGCAGATA TACAGTCGCT ACGGCATCAA GCTGGAGGAC 2340 GGCATCCTGA TCGACAAGAA GGGCGGCATC CACTACGGCG AGTTCATCAA CGAGGCCAGC 2400 TTCAACATCG AGCCCCTGCA GAACTACGTG ACCAAGTACG AGGTGACCTA CAGCAGCGAG 2460 CTGGGCCCCA ACGTGAGCGA CACCCTGGAG AGCGACAAGA TTTACAAGGA CGGCACCATC 2520 AAGTTCGACT TCACCAAGTA CAGCAAGAAC GAGCAGGGCC TGTTCTACGA CAGCGGCCTG 2580 AACTGGGACT TCAAGATCAA CGCCATCACC TACGACGGCA AGGAGATGAA CGTGTTCCAC 2640 CGCTACAACA AGTAG 2655 (2)SEQ ID NO:18信息: (i)序列特征: (A)长度:2004个碱基对 (B)类型:核酸 (C)链型:单链 (D)拓扑结构:线性 (ii)分子类型:DNA(基因组) (iii)假设:否 (iv)反义:否 (ix)特征: (A)名称/关键词:misc_特征 (B)位置:1..2004 (D)其它信息:/注=″玉米优化的得自AB78的80kd VIP1A(a) DNA序列″ (xi)序列描述:SEQ ID NO:18: ATGAAGCGCG AGATCGACGA GGACACCGAC ACCGACGGCG ACAGCATCCC CGACCTGTGG 60 GAGGAGAACG GCTACACCAT CCAGAACCGC ATCGCCGTGA AGTGGGACGA CAGCCTGGCT 120 AGCAAGGGCT ACACCAAGTT CGTGAGCAAC CCCCTGGAGA GCCACACCGT GGGCGACCCC 180 TACACCGACT ACGAGAAGGC CGCCCGCGAC CTGGACCTGA GCAACGCCAA GGAGACCTTC 240 AACCCCCTGG TGGCCGCCTT CCCCAGCGTG AACGTGAGCA TGGAGAAGGT GATCCTGAGC 300 CCCAACGAGA ACCTGAGCAA CAGCGTGGAG AGCCACTCGA GCACCAACTG GAGCTACACC 360 AACACCGAGG GCGCCAGCGT GGAGGCCGGC ATCGGTCCCA AGGGCATCAG CTTCGGCGTG 420 AGCGTGAACT ACCAGCACAG CGAGACCGTG GCCCAGGAGT GGGGCACCAG CACCGGCAAC 480 ACCAGCCAGT TCAACACCGC CAGCGCCGGC TACCTGAACG CCAACGTGCG CTACAACAAC 540 GTGGGCACCG GCGCCATCTA CGACGTGAAG CCCACCACCA GCTTCGTGCT GAACAACGAC 600 ACCATCGCCA CCATCACCGC CAAGTCGAAT TCCACCGCCC TGAACATCAG CCCCGGCGAG 660 AGCTACCCCA AGAAGGGCCA GAACGGCATC GCCATCACCA GCATGGACGA CTTCAACAGC 720 CACCCCATCA CCCTGAACAA GAAGCAGGTG GACAACCTGC TGAACAACAA GCCCATGATG 780 CTGGAGACCA ACCAGACCGA CGGCGTCTAC AAGATCAAGG ACACCCACGG CAACATCGTG 840 ACCGGCGGCG AGTGGAACGG CGTGATCCAG CAGATCAAGG CCAAGACCGC CAGCATCATC 900 GTCGACGACG GCGAGCGCGT GGCCGAGAAG CGCGTGGCCG CCAAGGACTA CGAGAACCCC 960 GAGGACAAGA CCCCCAGCCT GACCCTGAAG GACGCCCTGA AGCTGAGCTA CCCCGACGAG 1020 ATCAAGGAGA TCGAGGGCCT GCTGTACTAC AAGAACAAGC CCATCTACGA GAGCAGCGTG 1080 ATGACCTATC TAGACGAGAA CACCGCCAAG GAGGTGACCA AGCAGCTGAA CGACACCACC 1140 GGCAAGTTCA AGGACGTGAG CCACCTGTAC GACGTGAAGC TGACCCCCAA GATGAACGTG 1200 ACCATCAAGC TGAGCATCCT GTACGACAAC GCCGAGAGCA ACGACAACAG CATCGGCAAG 1260 TGGACCAACA CCAACATCGT GAGCGGCGGC AACAACGGCA AGAAGCAGTA CAGCAGCAAC 1320 AACCCCGACG CCAACCTGAC CCTGAACACC GACGCCCAGG AGAAGCTGAA CAAGAACCGC 1380 GACTACTACA TCAGCCTGTA CATGAAGAGC GAGAAGAACA CCCAGTGCGA GATCACCATC 1440 GACGGCGAGA TATACCCCAT CACCACCAAG ACCGTGAACG TGAACAAGGA CAACTACAAG 1500 CGCCTGGACA TCATCGCCCA CAACATCAAG AGCAACCCCA TCAGCAGCCT GCACATCAAG 1560 ACCAACGACG AGATCACCCT GTTCTGGGAC GACATATCGA TTACCGACGT CGCCAGCATC 1620 AAGCCCGAGA ACCTGACCGA CAGCGAGATC AAGCAGATAT ACAGTCGCTA CCGCATCAAG 1680 CTGGAGGACG GCATCCTGAT CGACAAGAAG GGCGGCATCC ACTACGGCGA GTTCATCAAC 1740 GAGGCCAGCT TCAACATCGA GCCCCTGCAG AACTACGTGA CCAAGTACGA GGTGACCTAC 1800 AGCAGCGAGC TGGGCCCCAA CGTGAGCGAC ACCCTGGAGA GCGACAAGAT TTACAAGGAC 1860 GGCACCATCA AGTTCGACTT CACCAAGTAC AGCAAGAACG AGCAGGGCCT GTTCTACGAC 1920 AGCGGCCTGA ACTGGGACTT CAAGATCAAC GCCATCACCT ACGACGGCAA GGAGATGAAC 1980 GTGTTCCACC GCTACAACAA GTAG 2004 (2)SEQ ID NO:19信息: (i)序列特征: (A)长度:4074个碱基对 (B)类型:核酸 (C)链型:单链 (D)拓扑结构:线性 (ii)分子类型:DNA(基因组) (ix)特征: (A)名称/关键词:CDS (B)位置: 1..1386 (D)其它信息:/产物=″得自Btt的VIP2A(b)″ (ix)特征: (A)名称/关键词:misc_特征 (B)位置:1..4074 (D)其它信息:/注=″克隆的得自Btt d DNA序列,其含有VIP1A (b)VIP2A(b)两者的基因″ (xi)序列描述:SEQ ID NO:19: ATG CAA AGA ATG GAG GGA AAG TTG TTT GTG GTG TCA AAA ACA TTA CAA 48 Met Gln Arg Met Glu Gly Lys Leu Phe Val Val Ser Lys Thr Leu Gln 670 675 680 GTA GTT ACT AGA ACT GTA TTG CTT AGT ACA GTT TAC TCT ATA ACT TTA 96 Val Val Thr Arg Thr Val Leu Leu Ser Thr Val Tyr Ser Ile Thr Leu 685 690 695 TTA AAT AAT GTA GTG ATA AAA GCT GAC CAA TTA AAT ATA AAT TCT CAA 144 Leu Asn Asn Val Val Ile Lys Ala Asp Gln Leu Asn Ile Asn Ser Gln 700 705 710 715 AGT AAA TAT ACT AAC TTG CAA AAT CTA AAA ATC CCT GAT AAT GCA GAG 192 Ser Lys Tyr Thr Asn Leu Gln Asn Leu Lys Ile Prc Asp Asn Ala Glu 720 725 730 GAT TTT AAA GAA GAT AAG GGG AAA GCG AAA GAA TGG GGG AAA GAG AAA 240 Asp Phe Lys Glu Asp Lys Gly Lys Ala Lys Glu Trp Gly Lys Glu Lys 735 740 745 GGG GAA GAG TGG AGG CCT CCT GCT ACT GAG AAA GGA GAA ATG AAT AAT 288 Gly Glu Glu Trp Arg Pro Pro Ala Thr Glu Lys Gly Glu Met Asn Asn 750 755 760 TTT TTA GAT AAT AAA AAT GAT ATA AAG ACC AAT TAT AAA GAA ATT ACT 336 Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr 765 770 775 TTT TCT ATG GCA GGT TCA TGT GAA GAT GAA ATA AAA GAT TTA GAA GAA 384 Phe Ser Met Ala Gly Ser Cys Glu Asp Glu Ile Lys Asp Leu Glu Glu 780 785 790 795 ATT GAT AAG ATC TTT GAT AAA GCC AAT CTC TCG AGT TCT ATT ATC ACC 432 Ile Asp Lys Ile Phe Asp Lys Ala Asn Leu Ser Ser Ser Ile Ile Thr 800 805 810 TAT AAA AAT GTG GAA CCA GCA ACA ATT GGA TTT AAT AAA TCT TTA ACA 480 Tyr Lys Asn Val Glu Pro Ala Thr Ile Gly Phe Asn Lys Ser Leu Thr 815 820 825 GAA GGT AAT ACG ATT AAT TCT GAT GCA ATG GCA CAG TTT AAA GAA CAA 528 Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln 830 835 840 TTT TTA GGT AAG GAT ATG AAG TTT GAT AGT TAT CTA GAT ACT CAT TTA 576 Phe Leu Gly Lys Asp Met Lys Phe Asp Ser Tyr Leu Asp Thr His Leu 845 850 855 ACT GCT CAA CAA GTT TCC AGT AAA AAA AGA GTT ATT TTG AAG GTT ACG 624 Thr Ala Gln Gln Val Ser Ser Lys Lys Arg Val Ile Leu Lys Val Thr 860 865 870 875 GTT CCG AGT GGG AAA GGT TCT ACT ACT CCA ACA AAA GCA GGT GTC ATT 672 Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile 880 885 890 TTA AAC AAT AAT GAA TAC AAA ATG CTC ATT GAT AAT GGG TAT GTG CTC 720 Leu Asn Asn Asn Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Val Leu 895 900 905 CAT GTA GAT AAG G TA TCA AAA GTA GTA AAA AAA GGG ATG GAG TGC TTA 768 His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Met Glu Cys Leu 910 915 920 CAA GTT GAA GGG ACT TTA AAA AAG AGT CTC GAC TTT AAA AAT GAT ATA 816 Gln Val Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile 925 930 935 AAT GCT GAA GCG CAT AGC TGG GGG ATG AAA ATT TAT GAA GAC TGG GCT 864 Asn Ala Glu Ala His Ser Trp Gly Met Lys Ile Tyr Glu Asp Trp Ala 940 945 950 955 AAA AAT TTA ACC GCT TCG CAA AGG GAA GCT TTA GAT GGG TAT GCT AGG 912 Lys Asn Leu Thr Ala Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg 960 965 970 CAA GAT TAT AAA GAA ATC AAT AAT TAT TTG CGC AAT CAA GGC GGG AGT 960 Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser 975 980 985 GGA AAT GAA AAG CTG GAT GCC CAA TTA AAA AAT ATT TCT GAT GCT TTA 1008 Gly Asn Glu Lys Leu Asp Ala Gln Leu Lys Asn Ile Ser Asp Ala Leu 990 995 1000 GGG AAG AAA CCC ATA CCA GAA AAT ATT ACC GTG TAT AGA TGG TGT GGC 1056 Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly 1005 1010 1015 ATG CCG GAA TTT GGT TAT CAA ATT AGT GAT CCG TTA CCT TCT TTA AAA 1104 Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys 1020 1025 1030 1035 GAT TTT GAA GAA CAA TTT TTA AAT ACA ATT AAA GAA GAC AAA GGG TAT 1152 Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr 1040 1045 1050 ATG AGT ACA AGC TTA TCG AGT GAA CGT CTT GCA GCT TTT GGA TCT AGA 1200 Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg 1055 1060 1065 AAA ATT ATA TTA CGC TTA CAA GTT CCG AAA GGA AGT ACG GGG GCG TAT 1248 Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr 1070 1075 1080 TTA AGT GCC ATT GGT GGA TTT GCA AGT GAA AAA GAG ATC CTA CTT GAT 1296 Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp 1085 1090 1095 AAA GAT AGT AAA TAT CAT ATT GAT AAA GCA ACA GAG GTA ATC ATT AAA 1344 Lys Asp Ser Lys Tyr His Ile Asp Lys Ala Thr Glu Val Ile Ile Lys 1100 1105 1110 1115 GGT GTT AAG CGA TAT GTA GTG GAT GCA ACA TTA TTA ACA AAT 1386 Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn 1120 1125 TAAGGAG ATG AAA AAT ATG AAG AAA AAG TTA GCA AGT GTT GTA ACC TGT 1435 Met Lys Asn Met Lys Lys Lys Leu Ala Ser Val Val Thr Cys 1 5 10 ATG TTA TTA GCT CCT ATG TTT TTG AAT GGA AAT GTG AAT GCT GTT AAC 1483 Met Leu Leu Ala Pro Met Phe Leu Asn Gly Asn Val Asn Ala Val Asn 15 20 25 30 GCG GAT AGT AAA ATA AAT CAG ATT TCT ACA ACG CAG GAA AAC CAA CAG 1531 Ala Asp Ser Lys Ile Asn Gln Ile Ser Thr Thr Gln Glu Asn Gln Gln 35 40 45 AAA GAG ATG GAC CGA AAG GGA TTA TTG GGA TAT TAT TTC AAA GGA AAA 1579 Lys Glu Met Asp Arg Lys Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys 50 55 60 GAT TTT AAT AAT CTT ACT ATG TTT GCA CCG ACA CGT GAT AAT ACC CTT 1627 Asp Phe Asn Asn Leu Thr Met Phe Ala Pro Thr Arg Asp Asn Thr Leu 65 70 75 ATG TAT GAC CAA CAA ACA GCG AAT GCA TTA TTA GAT AAA AAA CAA CAA 1675 Met Tyr Asp Gln Gln Thr Ala Asn Ala Leu Leu Asp Lys Lys Gln Gln 80 85 90 GAA TAT CAG TCC ATT CGT TGG ATT GGT TTG ATT CAG CGT AAA GAA ACG 1723 Glu Tyr Gln Ser Ile Arg Trp Ile Gly Leu Ile Gln Arg Lys Glu Thr 95 100 105 110 GGC GAT TTC ACA TTT AAC TTA TCA AAG GAT GAA CAG GCA ATT ATA GAA 1771 Gly Asp Phe Thr Phe Asn Leu Ser Lys Asp Glu Gln Ala Ile Ile Glu 115 120 125 ATC GAT GGG AAA ATC ATT TCT AAT AAA GGG AAA GAA AAG CAA GTT GTC 1819 Ile Asp Gly Lys Ile Ile Ser Asn Lys Gly Lys Glu Lys Gln Val Val 130 135 140 CAT TTA GAA AAA GAA AAA TTA GTT CCA ATC AAA ATA GAG TAT CAA TCA 1867 His Leu Glu Lys Glu Lys Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser 145 150 155 GAT ACG AAA TTT AAT ATT GAT AGT AAA ACA TTT AAA GAA CTT AAA TTA 1915 Asp Thr Lys Phe Asn Ile Asp Ser Lys Thr Phe Lys Glu Leu Lys Leu 160 165 170 TTT AAA ATA GAT AGT CAA AAC CAA TCT CAA CAA GTT CAA CTG AGA AAC 1963 Phe Lys Ile Asp Ser Gln Asn Gln Ser Gln Gln Val Gln Leu Arg Asn 175 180 185 190 CCT GAA TTT AAC AAA AAA GAA TCA CAG GAA TTT TTA GCA AAA GCA TCA 2011 Pro Glu Phe Asn Lys Lys Glu Ser Gln Glu Phe Leu Ala Lys Ala Ser 195 200 205 AAA ACA AAC CTT TTT AAG CAA AAA ATG AAA AGA GAT ATT GAT GAA GAT 2059 Lys Thr Asn Leu Phe Lys Gln Lys Met Lys Arg Asp Ile Asp Glu Asp 210 215 220 ACG GAT ACA GAT GGA GAC TCC ATT CCT GAT CTT TGG GAA GAA AAT GGG 2107 Thr Asp Thr Asp Gly Asp Ser Ile Pro Asp Leu Trp Glu Glu Asn Gly 225 230 235 TAC ACG ATT CAA AAT AAA GTT GCT GTC AAA TGG GAT GAT TCG CTA GCA 2155 Tyr Thr Ile Gln Asn Lys Val Ala Val Lys Trp Asp Asp Ser Leu Ala 240 245 250 AGT AAG GGA TAT ACA AAA TTT GTT TCG AAT CCA TTA GAC AGC CAC ACA 2203 Ser Lys Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Asp Ser His Thr 255 260 265 270 GTT GGC GAT CCC TAT ACT GAT TAT GAA AAG GCC GCA AGG GAT TTA GAT 2251 Val Gly Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg Asp Leu Asp 275 280 285 TTA TCA AAT GCA AAG GAA ACG TTC AAC CCA TTG GTA GCT GCT TTT CCA 2299 Leu Ser Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala Phe Pro 290 295 300 AGT GTG AAT GTT AGT ATG GAA AAG GTG ATA TTA TCA CCA AAT GAA AAT 2347 Ser Val Asn Val Ser Met Glu Lys Val Ile Leu Ser Pro Asn Glu Ash 305 310 315 TTA TCC AAT AGT GTA GAG TCT CAT TCA TCC ACG AAT TGG TCT TAT ACG 2395 Leu Ser Asn Ser Val Glu Ser His Ser Ser Thr Asn Trp Ser Tyr Thr 320 325 330 AAT ACA GAA GGA GCT TCC ATT GAA GCT GGT GGC GGT CCA TTA GGC CTT 2443 Asn Thr Glu Gly Ala Ser Ile Glu Ala Gly Gly Gly Pro Leu Gly Leu 335 340 345 350 TCT TTT GGC GTG AGT GTT ACT TAT CAA CAC TCT GAA ACA GTT GCA CAA 2491 Ser Phe Gly Val Ser Val Thr Tyr Gln His Ser Glu Thr Val Ala Gln 355 360 365 GAA TGG GGA ACA TCT ACA GGA AAT ACT TCA CAA TTC AAT ACG GCT TCA 2539 Glu Trp Gly Thr Ser Thr Gly Asn Thr Ser Gln Phe Asn Thr Ala Ser 370 375 380 GCG GGA TAT TTA AAT GCA AAT GTT CGG TAT AAC AAT GTA GGG ACT GGT 2587 Ala Gly Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val Gly Thr Gly 385 390 395 GCC ATC TAT GAT GTA AAA CCT ACA ACA AGT TTT GTA TTA AAT AAC AAT 2635 Ala Ile Tyr Asp Val Lys Pro Thr Thr Ser Phe Val Leu Asn Asn Asn 400 405 410 ACC ATC GCA ACG ATT ACA GCA AAA TCA AAT TCA ACA GCT TTA CGT ATA 2683 Thr Ile Ala Thr Ile Thr Ala Lys Ser Asn Ser Thr Ala Leu Arg Ile 415 420 425 430 TCT CCG GGG GAT AGT TAT CCA GAA ATA GGA GAA AAC GCT ATT GCG ATT 273l Ser Pro Gly Asp Ser Tyr Pro Glu Ile Gly Glu Asn Ala Ile Ala Ile 435 440 445 ACA TCT ATG GAT GAT TTT AAT TCT CAT CCA ATT ACA TTA AAT AAA CAA 2779 Thr Ser Met Asp Asp Phe Asn Ser His Pro Ile Thr Leu Asn Lys Gln 450 455 460 CAG GTA AAT CAA TTG ATA AAT AAT AAG CCA ATT ATG CTA GAG ACA GAC 2827 Gln Val Asn Gln Leu Ile Asn Asn Lys Pro Ile Met Leu Glu Thr Asp 465 470 475 CAA ACA GAT GGT GTT TAT AAA ATA AGA GAT ACA CAT GGA AAT ATT GTA 2875 Gln Thr Asp Gly Val Tyr Lys Ile Arg Asp Thr His Gly Asn Ile Val 480 485 490 ACT GGT GGA GAA TGG AAT GGT GTA ACA CAA CAA ATT AAA GCA AAA ACA 2923 Thr Gly Gly Glu Trp Asn Gly Val Thr Gln Gln Ile Lys Ala Lys Thr 495 500 505 510 GCG TCT ATT ATT GTG GAT GAC GGG AAA CAG GTA GCA GAA AAA CGT GTG 2971 Ala Ser Ile Ile Val Asp Asp Gly Lys Gln Val Ala Glu Lys Arg Val 515 520 525 GCG GCA AAA GAT TAT GGT CAT CCA GAA GAT AAA ACA CCA CCT TTA ACT 3019 Ala Ala Lys Asp Tyr Gly His Pro Glu Asp Lys Thr Pro Pro Leu Thr 530 535 540 TTA AAA GAT ACC CTG AAG CTT TCA TAC CCA GAT GAA ATA AAA GAA ACT 3067 Leu Lys Asp Thr Leu Lys Leu Ser Tyr Pro Asp Glu Ile Lys Glu Thr 545 550 555 AAT GGA TTG TTG TAC TAT GAT GAC AAA CCA ATC TAT GAA TCG AGT GTC 3115 Asn Gly Leu Leu Tyr Tyr Asp Asp Lys Pro Ile Tyr Glu Ser Ser Val 560 565 570 ATG ACT TAT CTG GAT GAA AAT ACG GCA AAA GAA GTC AAA AAA CAA ATA 3163 Met Thr Tyr Leu Asp Glu Asn Thr Ala Lys Glu Val Lys Lys Gln Ile 575 580 585 590 AAT GAT ACA ACC GGA AAA TTT AAG GAT GTA AAT CAC TTA TAT GAT GTA 3211 Asn Asp Thr Thr Gly Lys Phe Lys Asp Val Asn His Leu Tyr Asp Val 595 600 605 AAA CTG ACT CCA AAA ATG AAT TTT ACG ATT AAA ATG GCT TCC TTG TAT 3259 Lys Leu Thr Pro Lys Met Asn Phe Thr Ile Lys Met Ala Ser Leu Tyr 610 615 620 GAT GGG GCT GAA AAT AAT CAT AAC TCT TTA GGA ACC TGG TAT TTA ACA 3307 Asp Gly Ala Glu Asn Asn His Asn Ser Leu Gly Thr Trp Tyr Leu Thr 625 630 635 TAT AAT GTT GCT GGT GGA AAT ACT GGG AAG AGA CAA TAT CGT TCA GCT 3355 Tyr Asn Val Ala Gly Gly Asn Thr Gly Lys Arg Gln Tyr Arg Ser Ala 640 645 650 CAT TCT TGT GCA CAT GTA GCT CTA TCT TCA GAA GCG AAA AAG AAA CTA 3403 His Ser Cys Ala His Val Ala Leu Ser Ser Glu Ala Lys Lys Lys Leu 655 660 665 670 AAT CAA AAT GCG AAT TAC TAT CTT AGC ATG TAT ATG AAG GCT GAT TCT 3451 Asn Gln Asn Ala Asn Tyr Tyr Leu Ser Met Tyr Met Lys Ala Asp Ser 675 680 685 ACT ACG GAA CCT ACA ATA GAA GTA GCT GGG GAA AAA TCT GCA ATA ACA 3499 Thr Thr Glu Pro Thr Ile Glu Val Ala Gly Glu Lys Ser Ala Ile Thr 690 695 700 AGT AAA AAA GTA AAA TTA AAT AAT CAA AAT TAT CAA AGA GTT GAT ATT 3547 Ser Lys Lys Val Lys Leu Asn Asn Gln Asn Tyr Gln Arg Val Asp Ile 705 710 715 TTA GTG AAA AAT TCT GAA AGA AAT CCA ATG GAT AAA ATA TAT ATA AGA 3595 Leu Val Lys Asn Ser Glu Arg Asn Pro Met Asp Lys Ile Tyr Ile Arg 720 725 730 GGA AAT GGC ACG ACA AAT GTT TAT GGG GAT GAT GTT ACT ATC CCA GAG 3643 Gly Asn Gly Thr Thr Asn Val Tyr Gly Asp Asp Val Thr Ile Pro Glu 735 740 745 750 GTA TCA GCT ATA AAT CCG GCT AGT CTA TCA GAT GAA GAA ATT CAA GAA 3691 Val Ser Ala Ile Asn Pro Ala Ser Leu Ser Asp Glu Glu Ile Gln Glu 755 760 765 ATA TTT AAA GAC TCA ACT ATT GAA TAT GGA AAT CCT AGT TTC GTT GCT 3739 Ile Phe Lys Asp Ser Thr Ile Glu Tyr Gly Asn Pro Ser Phe Val Ala 770 775 780 GAT GCC GTA ACA TTT AAA AAT ATA AAA CCT TTA CAA AAT TAT GTA AAG 3787 Asp Ala Val Thr Phe Lys Asn Ile Lys Pro Leu Gln Asn Tyr Val Lys 785 790 795 GAA TAT GAA ATA TAT CAT AAA TCT CAT CGA TAT GAA AAG AAA ACG GTC 3835 Glu Tyr Glu Ile Tyr His Lys Ser His Arg Tyr Glu Lys Lys Thr Val 800 805 810 TTT GAT ATC ATG GGT GTT CAT TAT GAG TAT AGT ATA GCT AGG GAA CAA 3883 Phe Asp Ile Met Gly Val His Tyr Glu Tyr Ser Ile Ala Arg Glu Gln 815 820 825 830 AAG AAA GCC GCA TAATTTTAAA AATAAAACTC GTTAGAGTTT ATTTAGCATG 3935 Lys Lys Ala Ala GTATTTTTAA GAATAATCAA TATGTTGAAC CGTTTGTAGC TGTTTTGGAA GGGAATTTCA 3995 TTTTATTTGG TCTCTTAAGT TGATGGGCAT GGGATATGTT CAGCATCCAA GCGTTTNGGG 4055 GGTTANAAAA TCCAATTTT 4074 (2)SEQ ID NO:20信息: (i)序列特征: (A)长度:462个氨基酸 (B)类型:氨基酸 (D)拓扑结构:线性 (ii)分子类型:蛋白质 (xi)序列描述:SEQ ID NO:20: Met Gln Arg Met Glu Gly Lys Leu Phe Val Val Ser Lys Thr Leu Gln 1 5 10 15 Val Val Thr Arg Thr Val Leu Leu Ser Thr Val Tyr Ser Ile Thr Leu 20 25 30 Leu Asn Asn Val Val Ile Lys Ala Asp Gln Leu Asn Ile Asn Ser Gln 35 40 45 Ser Lys Tyr Thr Asn Leu Gln Asn Leu Lys Ile Pro Asp Asn Ala Glu 50 55 60 Asp Phe Lys Glu Asp Lys Gly Lys Ala Lys Glu Trp Gly Lys Glu Lys 65 70 75 80 Gly Glu Glu Trp Arg Pro Pro Ala Thr Glu Lys Gly Glu Met Asn Asn 85 90 95 Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr 100 105 110 Phe Ser Met Ala Gly Ser Cys Glu Asp Glu Ile Lys Asp Leu Glu Glu 115 120 125 Ile Asp Lys Ile Phe Asp Lys Ala Asn Leu Ser Ser Ser Ile Ile Thr 130 135 140 Tyr Lys Asn Val Glu Pro Ala Thr Ile Gly Phe Asn Lys Ser Leu Thr 145 150 155 160 Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln 165 170 175 Phe Leu Gly Lys Asp Met Lys Phe Asp Ser Tyr Leu Asp Thr His Leu 180 185 190 Thr Ala Gln Gln Val Ser Ser Lys Lys Arg Val Ile Leu Lys Val Thr 195 200 205 Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile 210 215 220 Leu Asn Asn Asn Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Val Leu 225 230 235 240 His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Met Glu Cys Ieu 245 250 255 Gln Val Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile 260 265 270 Asn Ala Glu Ala His Ser Trp Gly Met Lys Ile Tyr Glu Asp Trp Ala 275 280 285 Lys Asn Leu Thr Ala Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg 290 295 300 Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser 305 310 315 320 Gly Asn Glu Lys Leu Asp Ala Gln Leu Lys Asn Ile Ser Asp Ala Leu 325 330 335 Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly 340 345 350 Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys 355 360 365 Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr 370 375 380 Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg 385 390 395 400 Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr 405 410 415 Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp 420 425 430 Lys Asp Ser Lys Tyr His Ile Asp Lys Ala Thr Glu Val Ile Ile Lys 435 440 445 Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn 450 455 460 (2)SEQ ID NO:21信息: (i)序列特征: (A)长度:834个氨基酸 (B)类型:氨基酸 (D)拓扑结构:线性 (ii)分子类型:蛋白质 (xi)序列描述:SEQ ID NO:21: Met Lys Asn Met Lys Lys Lys Leu Ala Ser Val Val Thr Cys Met Leu 1 5 10 15 Leu Ala Pro Met Phe Leu Asn Gly Asn Val Asn Ala Val Asn Ala Asp 20 25 30 Ser Lys Ile Asn Gln Ile Ser Thr Thr Gln Glu Asn Gln Gln Lys Glu 35 40 45 Met Asp Arg Lys Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys Asp Phe 50 55 60 Asn Asn Leu Thr Met Phe Ala Pro Thr Arg Asp Ash Thr Leu Met Tyr 65 70 75 80 Asp Gln Gln Thr Ala Asn Ala Leu Leu Asp Lys Lys Gln Gln Glu Tyr 85 90 95 Gln Ser Ile Arg Trp Ile Gly Leu Ile Gln Arg Lys Glu Thr Gly Asp 100 105 110 Phe Thr Phe Asn Leu Ser Lys Asp Glu Gln Ala Ile Ile Glu Ile Asp 115 120 125 Gly Lys Ile Ile Ser Asn Lys Gly Lys Glu Lys Gln Val Val His Leu 130 135 140 Glu Lys Glu Lys Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser Asp Thr 145 150 155 160 Lys Phe Asn Ile Asp Ser Lys Thr Phe Lys Glu Leu Lys Leu Phe Lys 165 170 175 Ile Asp Ser Gln Asn Gln Ser Gln Gln Val Gln Leu Arg Asn Pro Glu 180 185 190 Phe Asn Lys Lys Glu Ser Gln Glu Phe Leu Ala Lys Ala Ser Lys Thr 195 200 205 Asn Leu Phe Lys Gln Lys Met Lys Arg Asp Ile Asp Glu Asp Thr Asp 210 215 220 Thr Asp Gly Asp Ser Ile Pro Asp Leu Trp Glu Glu Asn Gly Tyr Thr 225 230 235 240 Ile Gln Asn Lys Val Ala Val Lys Trp Asp Asp Ser Leu Ala Ser Lys 245 250 255 Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Asp Ser His Thr Val Gly 260 265 270 Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg Asp Leu Asp Leu Ser 275 280 285 Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala Phe Pro Ser Val 290 295 300 Asn Val Ser Met Glu Lys Val Ile Leu Ser Pro Asn Glu Asn Leu Ser 305 310 315 320 Asn Ser Val Glu Ser His Ser Ser Thr Asn Trp Ser Tyr Thr Asn Thr 325 330 335 Glu Gly Ala Ser Ile Glu Ala Gly Gly Gly Pro Leu Gly Leu Ser Phe 340 345 350 Gly Val Ser Val Thr Tyr Gln His Ser Glu Thr Val Ala Gln Glu Trp 355 360 365 Gly Thr Ser Thr Gly Asn Thr Ser Gln Phe Asn Thr Ala Ser Ala Gly 370 375 380 Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val Gly Thr Gly Ala Ile 385 390 395 400 Tyr Asp Val Lys Pro Thr Thr Ser Phe Val Leu Asn Asn Asn Thr Ile 405 410 415 Ala Thr Ile Thr Ala Lys Ser Asn Ser Thr Ala Leu Arg Ile Ser Pro 420 425 430 Gly Asp Ser Tyr Pro Glu Ile Gly Glu Asn Ala Ile Ala Ile Thr Ser 435 440 445 Met Asp Asp Phe Asn Ser His Pro Ile Thr Leu Asn Lys Gln Gln Val 450 455 460 Asn Gln Leu Ile Asn Asn Lys Pro Ile Met Leu Glu Thr Asp Gln Thr 465 470 475 480 Asp Gly Val Tyr Lys Ile Arg Asp Thr His Gly Asn Ile Val Thr Gly 485 490 495 Gly Glu Trp Asn Gly Val Thr Gln Gln Ile Lys Ala Lys Thr Ala Ser 500 505 510 Ile Ile Val Asp Asp Gly Lys Gln Val Ala Glu Lys Arg Val Ala Ala 515 520 525 Lys Asp Tyr Gly His Pro Glu Asp Lys Thr Pro Pro Leu Thr Leu Lys 530 535 540 Asp Thr Leu Lys Leu Ser Tyr Pro Asp Glu Ile Lys Glu Thr Asn Gly 545 550 555 560 Leu Leu Tyr Tyr Asp Asp Lys Pro Ile Tyr Glu Ser Ser Val Met Thr 565 570 575 Tyr Leu Asp Glu Asn Thr Ala Lys Glu Val Lys Lys Gln Ile Asn Asp 580 585 590 Thr Thr Gly Lys Phe Lys Asp Val Asn His Leu Tyr Asp Val Lys Leu 595 600 605 Thr Pro Lys Met Asn Phe Thr Ile Lys Met Ala Ser Leu Tyr Asp Gly 610 615 620 Ala Glu Asn Asn His Asn Ser Leu Gly Thr Trp Tyr Leu Thr Tyr Asn 625 630 635 640 Val Ala Gly Gly Asn Thr Gly Lys Arg Gln Tyr Arg Ser Ala His Ser 645 650 655 Cys Ala His Val Ala Leu Ser Ser Glu Ala Lys Lys Lys Leu Asn Gln 660 665 670 Asn Ala Asn Tyr Tyr Leu Ser Met Tyr Met Lys Ala Asp Ser Thr Thr 675 680 685 Glu Pro Thr Ile Glu Val Ala Gly Glu Lys Ser Ala Ile Thr Ser Lys 690 695 700 Lys Val Lys Leu Asn Asn Gln Asn Tyr Gln Arg Val Asp Ile Leu Val 70S 710 715 720 Lys Asn Ser Glu Arg Asn Pro Met Asp Lys Ile Tyr Ile Arg Gly Asn 725 730 735 Gly Thr Thr Asn Val Tyr Gly Asp Asp Val Thr Ile Pro Glu Val Ser 740 745 750 Ala Ile Asn Pro Ala Ser Leu Ser Asp Glu Glu Ile Gln Glu Ile Phe 755 760 765 Lys Asp Ser Thr Ile Glu Tyr Gly Asn Pro Ser Phe Val Ala Asp Ala 770 775 780 Val Thr Phe Lys Asn Ile Lys Pro Leu Gln Asn Tyr Val Lys Glu Tyr 785 790 795 800 Glu Ile Tyr His Lys Ser His Arg Tyr Glu Lys Lys Thr Val Phe Asp 805 810 815 Ile Met Gly Val His Tyr Glu Tyr Ser Ile Ala Arg Glu Gln Lys Lys 820 825 830 Ala Ala (2)SEQ ID NO:22信息: (i)序列特征: (A)长度:4041个碱基对 (B)类型:核酸 (C)链型:单链 (D)拓扑结构:线性 (ii)分子类型:DNA(基因组) (ix)特征: (A)名称/关键词:CDS (B)位置:1..4038 (D)其它信息:/产物=″VIP1A(a)/VIP2A(a)融合蛋白质″ (xi)序列描述:SEQ ID NO:22: ATG AAA AGA ATG GAG GGA AAG TTG TTT ATG GTG TCA AAA AAA TTA CAA 48 Met Lys Arg Met Glu Gly Lys Leu Phe Met Val Ser Lys Lys Leu Gln 835 840 845 850 GTA GTT ACT AAA ACT GTA TTG CTT AGT ACA GTT TTC TCT ATA TCT TTA 96 Val Val Thr Lys Thr Val Leu Leu Ser Thr Val Phe Ser Ile Ser Leu 855 860 865 TTA AAT AAT GAA GTG ATA AAA GCT GAA CAA TTA AAT ATA AAT TCT CAA 144 Leu Asn Asn Glu Val Ile Lys Ala Glu Gln Leu Asn Ile Asn Ser Gln 870 875 880 AGT AAA TAT ACT AAC TTG CAA AAT CTA AAA ATC ACT GAC AAG GTA GAG 192 Ser Lys Tyr Thr Asn Leu Gln Asn Leu Lys Ile Thr Asp Lys Val Glu 885 890 895 GAT TTT AAA GAA GAT AAG GAA AAA GCG AAA GAA TGG GGG AAA GAA AAA 240 Asp Phe Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys 900 905 910 GAA AAA GAG TGG AAA CTA ACT GCT ACT GAA AAA GGA AAA ATG AAT AAT 288 Glu Lys Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn Asn 915 920 925 930 TTT TTA GAT AAT AAA AAT GAT ATA AAG ACA AAT TAT AAA GAA ATT ACT 336 Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr 935 940 945 TTT TCT ATG GCA GGC TCA TTT GAA GAT GAA ATA AAA GAT TTA AAA GAA 384 Phe Ser Met Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu 950 955 960 ATT GAT AAG ATG TTT GAT AAA ACC AAT CTA TCA AAT TCT ATT ATC ACC 432 Ile Asp Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile Thr 965 970 975 TAT AAA AAT GTG GAA CCG ACA ACA ATT GGA TTT AAT AAA TCT TTA ACA 480 Tyr Lys Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu Thr 980 985 990 GAA GGT AAT ACG ATT AAT TCT GAT GCA ATG GCA CAG TTT AAA GAA CAA 528 Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln 995 1000 1005 1010 TTT TTA GAT AGG GAT ATT AAG TTT GAT AGT TAT CTA GAT ACG CAT TTA 576 Phe Leu Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu 1015 1020 1025 ACT GCT CAA CAA GTT TCC AGT AAA GAA AGA GTT ATT TTG AAG GTT ACG 624 Thr Ala Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val Thr 1030 1035 1040 GTT CCG AGT GGG AAA GGT TCT ACT ACT CCA ACA AAA GCA GGT GTC ATT 672 Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile 1045 1050 1055 TTA AAT AAT AGT GAA TAC AAA ATG CTC ATT GAT AAT GGG TAT ATG GTC 720 Leu Asn Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Met Val 1060 1065 1070 CAT GTA GAT AAG GTA TCA AAA GTG GTG AAA AAA GGG GTG GAG TGC TTA 768 His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Val Glu Cys Leu 1075 1080 1085 1090 CAA ATT GAA GGG ACT TTA AAA AAG AGT CTT GAC TTT AAA AAT GAT ATA 816 Gln Ile Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile 1095 1100 1105 AAT GCT GAA GCG CAT AGC TGG GGT ATG AAG AAT TAT GAA GAG TGG GCT 864 Asn Ala Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp Ala 1110 1115 1120 AAA GAT TTA ACC GAT TCG CAA AGG GAA GCT TTA GAT GGG TAT GCT AGG 912 Lys Asp Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg 1125 1130 1135 CAA GAT TAT AAA GAA ATC AAT AAT TAT TTA AGA AAT CAA GGC GGA AGT 960 Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser 1140 1145 1150 GGA AAT GAA AAA CTA GAT GCT CAA ATA AAA AAT ATT TCT GAT GCT TTA 1008 Gly Asn Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala Leu 1155 1160 1165 1170 GGG AAG AAA CCA ATA CCG GAA AAT ATT ACT GTG TAT AGA TGG TGT GGC 1056 Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly 1175 1180 1185 ATG CCG GAA TTT GGT TAT CAA ATT AGT GAT CCG TTA CCT TCT TTA AAA 1104 Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys 1190 1195 1200 GAT TTT GAA GAA CAA TTT TTA AAT ACA ATC AAA GAA GAC AAA GGA TAT 1152 Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr 1205 1210 1215 ATG AGT ACA AGC TTA TCG AGT GAA CGT CTT GCA GCT TTT GGA TCT AGA 1200 Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg 1220 1225 1230 AAA ATT ATA TTA CGA TTA CAA GTT CCG AAA GGA AGT ACG GGT GCG TAT 1248 Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr 1235 1240 1245 1250 TTA AGT GCC ATT GGT GGA TTT GCA AGT GAA AAA GAG ATC CTA CTT GAT 1296 Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp 1255 1260 1265 AAA GAT AGT AAA TAT CAT ATT GAT AAA GTA ACA GAG GTA ATT ATT AAA 1344 Lys Asp Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile Lys 1270 1275 1280 GGT GTT AAG CGA TAT GTA GTG GAT GCA ACA TTA TTA ACA AAT ATG AAA 1392 Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn Met Lys 1285 1290 1295 AAT ATG AAG AAA AAG TTA GCA AGT GTT GTA ACG TGT ACG TTA TTA GCT 1440 Asn Met Lys Lys Lys Leu Ala Ser Val Val Thr Cys Thr Leu Leu Ala 1300 1305 1310 CCT ATG TTT TTG AAT GGA AAT GTG AAT GCT GTT TAC GCA GAC AGC AAA 1488 Pro Met Phe Leu Asn Gly Asn Val Asn Ala Val Tyr Ala Asp Ser Lys 1315 1320 1325 1330 ACA AAT CAA ATT TCT ACA ACA CAG AAA AAT CAA CAG AAA GAG ATG GAC 1536 Thr Asn Gln Ile Ser Thr Thr Gln Lys Asn Gln Gln Lys Glu Met Asp 1335 1340 1345 CGA AAA GGA TTA CTT GGG TAT TAT TTC AAA GGA AAA GAT TTT AGT AAT 1584 Arg Lys Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys Asp Phe Ser Asn 1350 1355 1360 CTT ACT ATG TTT GCA CCG ACA CGT GAT AGT ACT CTT ATT TAT GAT CAA 1632 Leu Thr Met Phe Ala Pro Thr Arg Asp Ser Thr Leu Ile Tyr Asp Gln 1365 1370 1375 CAA ACA GCA AAT AAA CTA TTA GAT AAA AAA CAA CAA GAA TAT CAG TCT 1680 Gln Thr Ala Asn Lys Leu Leu Asp Lys Lys Gln Gln Glu Tyr Gln Ser 1380 1385 1390 ATT CGT TGG ATT GGT TTG ATT CAG AGT AAA GAA ACG GGA GAT TTC ACA 1728 Ile Arg Trp Ile Gly Leu Ile Gln Ser Lys Glu Thr Gly Asp Phe Thr 1395 1400 1405 1410 TTT AAC TTA TCT GAG GAT GAA CAG GCA ATT ATA GAA ATC AAT GGG AAA 1776 Phe Asn Leu Ser Glu Asp Glu Gln Ala Ile Ile Glu Ile Asn Gly Lys 1415 1420 1425 ATT ATT TCT AAT AAA GGG AAA GAA AAG CAA GTT GTC CAT TTA GAA AAA 1824 Ile Ile Ser Asn Lys Gly Lys Glu Lys Gln Val Val His Leu Glu Lys 1430 1435 1440 GGA AAA TTA GTT CCA ATC AAA ATA GAG TAT CAA TCA GAT ACA AAA TTT 1872 Gly Lys Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser Asp Thr Lys Phe 1445 1450 1455 AAT ATT GAC AGT AAA ACA TTT AAA GAA CTT AAA TTA TTT AAA ATA GAT 1920 Asn Ile Asp Ser Lys Thr Phe Lys Glu Leu Lys Leu Phe Lys Ile Asp 1460 1465 1470 AGT CAA AAC CAA CCC CAG CAA GTC CAG CAA GAT GAA CTG AGA AAT CCT 1968 Ser Gln Asn Gln Pro Gln Gln Val Gln Gln Asp Glu Leu Arg Asn Pro 1475 1480 1485 1490 GAA TTT AAC AAG AAA GAA TCA CAG GAA TTC TTA GCG AAA CCA TCG AAA 2016 Glu Phe Asn Lys Lys Glu Ser Gln Glu Phe Leu Ala Lys Pro Ser Lys 1495 1500 1505 ATA AAT CTT TTC ACT CAA AAA ATG AAA AGG GAA ATT GAT GAA GAC ACG 2064 Ile Asn Leu Phe Thr Gln Lys Met Lys Arg Glu Ile Asp Glu Asp Thr 15l0 1515 1520 GAT ACG GAT GGG GAC TCT ATT CCT GAC CTT TGG GAA GAA AAT GGG TAT 2112 Asp Thr Asp Gly Asp Ser Ile Pro Asp Leu Trp Glu Glu Asn Gly Tyr 1525 1530 1535 ACG ATT CAA AAT AGA ATC GCT GTA AAG TGG GAC GAT TCT CTA GCA AGT 2160 Thr Ile Gln Asn Arg Ile Ala Val Lys Trp Asp Asp Ser Leu Ala Ser 1540 1545 1550 AAA GGG TAT ACG AAA TTT GTT TCA AAT CCA CTA GAA AGT CAC ACA GTT 2208 Lys Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Glu Ser His Thr Val 1555 1560 1565 1570 GGT GAT CCT TAT ACA GAT TAT GAA AAG GCA GCA AGA GAT CTA GAT TTG 2256 Gly Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg Asp Leu Asp Leu 1575 1580 1585 TCA AAT GCA AAG GAA ACG TTT AAC CCA TTG GTA GCT GCT TTT CCA AGT 2304 Ser Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala Phe Pro Ser 1590 1595 1600 GTG AAT GTT AGT ATG GAA AAG GTG ATA TTA TCA CCA AAT GAA AAT TTA 2352 Val Asn Val Ser Met Glu Lys Val Ile Leu Ser Pro Asn Glu Asn Leu 1605 1610 1615 TCC AAT AGT GTA GAG TCT CAT TCA TCC ACG AAT TGG TCT TAT ACA AAT 2400 Ser Asn Ser Val Glu Ser His Ser Ser Thr Asn Trp Ser Tyr Thr Asn 1620 1625 1630 ACA GAA GGT GCT TCT GTT GAA GCG GGG ATT GGA CCA AAA GGT ATT TCG 2448 Thr Glu Gly Ala Ser Val Glu Ala Gly Ile Gly Pro Lys Gly Ile Ser 1635 1640 1645 1650 TTC GGA GTT AGC GTA AAC TAT CAA CAC TCT GAA ACA GTT GCA CAA GAA 2496 Phe Gly Val Ser Val Asn Tyr Gln His Ser Glu Thr Val Ala Gln Glu 1655 1660 1665 TGG GGA ACA TCT ACA GGA AAT ACT TCG CAA TTC AAT ACG GCT TCA GCG 2544 Trp Gly Thr Ser Thr Gly Asn Thr Ser Gln Phe Asn Thr Ala Ser Ala 1670 1675 1680 GGA TAT TTA AAT GCA AAT GTT CGA TAT AAC AAT GTA GGA ACT GGT GCC 2592 Gly Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val Gly Thr Gly Ala 1685 1690 1695 ATC TAC GAT GTA AAA CCT ACA ACA AGT TTT GTA TTA AAT AAC GAT ACT 2640 Ile Tyr Asp Val Lys Pro Thr Thr Ser Phe Val Leu Asn Asn Asp Thr 1700 1705 1710 ATC GCA ACT ATT ACG GCG AAA TCT AAT TCT ACA GCC TTA AAT ATA TCT 2688 Ile Ala Thr Ile Thr Ala Lys Ser Asn Ser Thr Ala Leu Asn Ile Ser 1715 1720 1725 1730 CCT GGA GAA AGT TAC CCG AAA AAA GGA CAA AAT GGA ATC GCA ATA ACA 2736 Pro Gly Glu Ser Tyr Pro Lys Lys Gly Gln Asn Gly Ile Ala Ile Thr 1735 1740 1745 TCA ATG GAT GAT TTT AAT TCC CAT CCG ATT ACA TTA AAT AAA AAA CAA 2784 Ser Met Asp Asp Phe Asn Ser His Pro Ile Thr Leu Asn Lys Lys Gln 1750 1755 1760 GTA GAT AAT CTG CTA AAT AAT AAA CCT ATG ATG TTG GAA ACA AAC CAA 2832 Val Asp Asn Leu Leu Asn Asn Lys Pro Met Met Leu Glu Thr Asn Gln 1765 1770 1775 ACA GAT GGT GTT TAT AAG ATA AAA GAT ACA CAT GGA AAT ATA GTA ACT 2880 Thr Asp Gly Val Tyr Lys Ile Lys Asp Thr His Gly Asn Ile Val Thr 1780 1785 1790 GGC GGA GAA TGG AAT GGT GTC ATA CAA CAA ATC AAG GCT AAA ACA GCG 2928 Gly Gly Glu Trp Asn Gly Val Ile Gln Gln Ile Lys Ala Lys Thr Ala 1795 1800 1805 1810 TCT ATT ATT GTG GAT GAT GGG GAA CGT GTA GCA GAA AAA CGT GTA GCG 2976 Ser Ile Ile Val Asp Asp Gly Glu Arg Val Ala Glu Lys Arg Val Ala 1815 1820 1825 GCA AAA GAT TAT GAA AAT CCA GAA GAT AAA ACA CCG TCT TTA ACT TTA 3024 Ala Lys Asp Tyr Glu Asn Pro Glu Asp Lys Thr Pro Ser Leu Thr Leu 1830 1835 1840 AAA GAT GCC CTG AAG CTT TCA TAT CCA GAT GAA ATA AAA GAA ATA GAG 3072 Lys Asp Ala Leu Lys Leu Ser Tyr Pro Asp Glu Ile Lys Glu Ile Glu 1845 1850 1855 GGA TTA TTA TAT TAT AAA AAC AAA CCG ATA TAC GAA TCG AGC GTT ATG 3120 Gly Leu Leu Tyr Tyr Lys Asn Lys Pro Ile Tyr Glu Ser Ser Val Met 1860 1865 1870 ACT TAC TTA GAT GAA AAT ACA GCA AAA GAA GTG ACC AAA CAA TTA AAT 3168 Thr Tyr Leu Asp Glu Asn Thr Ala Lys Glu Val Thr Lys Gln Leu Asn 1875 1880 1885 1890 GAT ACC ACT GGG AAA TTT AAA GAT GTA AGT CAT TTA TAT GAT GTA AAA 3216 Asp Thr Thr Gly Lys Phe Lys Asp Val Ser His Leu Tyr Asp Val Lys 1895 1900 1905 CTG ACT CCA AAA ATG AAT GTT ACA ATC AAA TTG TCT ATA CTT TAT GAT 3264 Leu Thr Pro Lys Met Asn Val Thr Ile Lys Leu Ser Ile Leu Tyr Asp 1910 1915 1920 AAT GCT GAG TCT AAT GAT AAC TCA ATT GGT AAA TGG ACA AAC ACA AAT 3312 Asn Ala Glu Ser Asn Asp Asn Ser Ile Gly Lys Trp Thr Asn Thr Asn 1925 1930 1935 ATT GTT TCA GGT GCA AAT AAC GGA AAA AAA CAA TAT TCT TCT AAT AAT 3360 Ile Val Ser Gly Gly Asn Asn Gly Lys Lys Gln Tyr Ser Ser Asn Asn 1940 1945 1950 CCG GAT GCT AAT TTG ACA TTA AAT ACA GAT GCT CAA GAA AAA TTA AAT 3408 Pro Asp Ala Asn Leu Thr Leu Asn Thr Asp Ala Gln Glu Lys Leu Asn 1955 1960 1965 1970 AAA AAT CGT GAC TAT TAT ATA AGT TTA TAT ATG AAG TCA GAA AAA AAC 3456 Lys Asn Arg Asp Tyr Tyr Ile Ser Leu Tyr Met Lys Ser Glu Lys Asn 1975 1980 1985 ACA CAA TGT GAG ATT ACT ATA GAT GGG GAG ATT TAT CCG ATC ACT ACA 3504 Thr Gln Cys Glu Ile Thr Ile Asp Gly Glu Ile Tyr Pro Ile Thr Thr 1990 1995 2000 AAA ACA GTG AAT GTG AAT AAA GAC AAT TAC AAA AGA TTA GAT ATT ATA 3552 Lys Thr Val Asn Val Asn Lys Asp Asn Tyr Lys Arg Leu Asp Ile Ile 2005 2010 2015 GCT CAT AAT ATA AAA AGT AAT CCA ATT TCT TCA CTT CAT ATT AAA ACG 3600 Ala His Asn Ile Lys Ser Asn Pro Ile Ser Ser Leu His Ile Lys Thr 2020 2025 2030 AAT GAT GAA ATA ACT TTA TTT TGG GAT GAT ATT TCT ATA ACA GAT GTA 3648 Asn Asp Glu Ile Thr Leu Phe Trp Asp Asp Ile Ser Ile Thr Asp Val 2035 2040 2045 2050 GCA TCA ATA AAA CCG GAA AAT TTA ACA GAT TCA GAA ATT AAA CAG ATT 3696 Ala Ser Ile Lys Pro Glu Asn Leu Thr Asp Ser Glu Ile Lys Gln Ile 2055 2060 2065 TAT AGT AGG TAT GGT ATT AAG TTA GAA GAT GGA ATC CTT ATT GAT AAA 3744 Tyr Ser Arg Tyr Gly Ile Lys Leu Glu Asp Gly Ile Leu Ile Asp Lys 2070 2075 2080 AAA GGT GGG ATT CAT TAT GGT GAA TTT ATT AAT GAA GCT AGT TTT AAT 3792 Lys Gly Gly Ile His Tyr Gly Glu Phe Ile Asn Glu Ala Ser Phe Asn 2085 2090 2095 ATT GAA CCA TTG CAA AAT TAT GTG ACC AAA TAT GAA GTT ACT TAT AGT 3840 Ile Glu Pro Leu Gln Asn Tyr Val Thr Lys Tyr Glu Val Thr Tyr Ser 2100 2105 2110 AGT GAG TTA GGA CCA AAC GTG AGT GAC ACA CTT GAA AGT GAT AAA ATT 3888 Ser Glu Leu Gly Pro Asn Val Ser Asp Thr Leu Glu Ser Asp Lys Ile 2115 2120 2125 2130 TAC AAG GAT GGG ACA ATT AAA TTT GAT TTT ACC AAA TAT AGT AAA AAT 3936 Tyr Lys Asp Gly Thr Ile Lys Phe Asp Phe Thr Lys Tyr Ser Lys Asn 2135 2140 2145 GAA CAA GGA TTA TTT TAT GAC AGT GGA TTA AAT TGG GAC TTT AAA ATT 3984 Glu Gln Gly Leu Phe Tyr Asp Ser Gly Leu Asn Trp Asp Phe Lys Ile 2150 2155 2160 AAT GCT ATT ACT TAT GAT GGT AAA GAG ATG AAT GTT TTT CAT AGA TAT 4032 Asn Ala Ile Thr Tyr Asp Gly Lys Glu Met Asn Val Phe His Arg Tyr 2165 2170 2175 AAT AAA TAG 4041 Asn Lys 2180 (2)SEQ ID NO:23信息: (i)序列特征: (A)长度:1346个氨基酸 (B)类型:氨基酸 (D)拓扑结构:线性 (ii)分子类型:蛋白质 (xi)序列描述:SEQ ID NO:23: Met Lys Arg Met Glu Gly Lys Leu Phe Met Val Ser Lys Lys Leu Gln 1 5 10 15 Val Val Thr Lys Thr Val Leu Leu Ser Thr Val Phe Ser Ile Ser Leu 20 25 30 Leu Asn Asn Glu Val Ile Lys Ala Glu Gln Leu Asn Ile Asn Ser Gln 35 40 45 Ser Lys Tyr Thr Asn Leu Gln Asn Leu Lys Ile Thr Asp Lys Val Glu 50 55 60 Asp Phe Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys 65 70 75 80 Glu Lys Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn Asn 85 90 95 Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr 100 105 110 Phe Ser Met Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu 115 120 125 Ile Asp Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile Thr 130 135 140 Tyr Lys Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu Thr 145 150 155 160 Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln 165 170 175 Phe Leu Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu 180 185 190 Thr Ala Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val Thr 195 200 205 Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile 210 215 220 Leu Asn Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Met Val 225 230 235 240 His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Val Glu Cys Leu 245 250 255 Gln Ile Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile 260 265 270 Asn Ala Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp Ala 275 280 285 Lys Asp Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg 290 295 300 Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser 305 310 315 320 Gly Asn Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala Leu 325 330 335 Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly 340 345 350 Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys 355 360 365 Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr 370 375 380 Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg 385 390 395 400 Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr 405 410 415 Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp 420 425 430 Lys Asp Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile Lys 435 440 445 Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn Met Lys 450 455 460 Asn Met Lys Lys Lys Leu Al Ser Val Val Thr Cys Thr Leu Leu Ala 465 470 475 480 Pro Met Phe Leu Asn Gly Asn Val Asn Ala Val Tyr Ala Asp Ser Lys 485 490 495 Thr Asn Gln Ile Ser Thr Thr Gln Lys Asn Gln Gln Lys Glu Met Asp 500 505 510 Arg Lys Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys Asp Phe Ser Asn 515 520 525 Leu Thr Met Phe Ala Pro Thr Arg Asp Ser Thr Leu Ile Tyr Asp Gln 530 535 540 Gln Thr Ala Asn Lys Leu Leu Asp Lys Lys Gln Gln Glu Tyr Gln Ser 545 550 555 560 Ile Arg Trp Ile Gly Leu Ile Gln Ser Lys Glu Thr Gly Asp Phe Thr 565 570 575 Phe Asn Leu Ser Glu Asp Glu Gln Ala Ile Ile Glu Ile Asn Gly Lys 580 585 590 Ile Ile Ser Asn Lys Gly Lys Glu Lys Gln Val Val His Leu Glu Lys 595 600 605 Gly Lys Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser Asp Thr Lys Phe 610 615 620 Asn Ile Asp Ser Lys Thr Phe Lys Glu Leu Lys Leu Phe Lys Ile Asp 625 630 635 640 Ser Gln Asn Gln Pro Gln Gln Val Gln Gln Asp Glu Leu Arg Asn Pro 645 650 655 Glu Phe Asn Lys Lys Glu Ser Gln Glu Phe Leu Ala Lys Pro Ser Lys 660 665 670 Ile Asn Leu Phe Thr Gln Lys Met Lys Arg Glu Ile Asp Glu Asp Thr 675 680 685 Asp Thr Asp Gly Asp Ser Ile Pro Asp Leu Trp Glu Glu Asn Gly Tyr 690 695 700 Thr Ile Gln Asn Arg Ile Ala Val Lys Trp Asp Asp Ser Leu Ala Ser 705 7l0 715 720 Lys Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Glu Ser His Thr Val 725 730 735 Gly Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg Asp Leu Asp Leu 740 745 750 Ser Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala Phe Pro Ser 755 760 765 Val Asn Val Ser Met Glu Lys Val Ile Leu Ser Pro Asn Glu Asn Leu 770 775 780 Ser Asn Ser Val Glu Ser His Ser Ser Thr Asn Trp Ser Tyr Thr Asn 785 790 795 800 Thr Glu Gly Ala Ser Val Glu Ala Gly Ile Gly Pro Lys Gly Ile Ser 805 810 815 Phe Gly Val Ser Val Asn Tyr Gln His Ser Glu Thr Val Ala Gln Glu 820 825 830 Trp Gly Thr Ser Thr Gly Asn Thr Ser Gln Phe Asn Thr Ala Ser Ala 835 840 845 Gly Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val Gly Thr Gly Ala 850 855 860 Ile Tyr Asp Val Lys Pro Thr Thr Ser Phe Val Leu Asn Asn Asp Thr 865 870 875 880 Ile Ala Thr Ile Thr Ala Lys Ser Asn Ser Thr Ala Leu Asn Ile Ser 885 890 895 Pro Gly Glu Ser Tyr Pro Lys Lys Gly Gln Asn Gly Ile Ala Ile Thr 900 905 910 Ser Met Asp Asp Phe Asn Ser His Pro Ile Thr Leu Asn Lys Lys Gln 915 920 925 Val Asp Asn Leu Leu Asn Asn Lys Pro Met Met Leu Glu Thr Asn Gln 930 935 940 Thr Asp Gly Val Tyr Lys Ile Lys Asp Thr His Gly Asn Ile Val Thr 945 950 955 960 Gly Gly Glu Trp Asn Gly Val Ile Gln Gln Ile Lys Ala Lys Thr Ala 965 970 975 Ser Ile Ile Val Asp Asp Gly Glu Arg Val Ala Glu Lys Arg Val Ala 980 985 990 Ala Lys Asp Tyr Glu Asn Pro Glu Asp Lys Thr Pro Ser Leu Thr Leu 995 1000 1005 Lys Asp Ala Leu Lys Leu Ser Tyr Pro Asp Glu Ile Lys Glu Ile Glu 1010 1015 1020 Gly Leu Leu Tyr Tyr Lys Asn Lys Pro Ile Tyr Glu Ser Ser Val Mer 1025 1030 1035 1040 Thr Tyr Leu Asp Glu Asn Thr Ala Lys Glu Val Thr Lys Gln Leu Asn 1045 1050 1055 Asp Thr Thr Gly Lys Phe Lys Asp Val Ser His Leu Tyr Asp Val Lys 1060 1065 1070 Leu Thr Pro Lys Met Asn Val Thr Ile Lys Leu Ser Ile Leu Tyr Asp 1075 1080 1085 Asn Ala Glu Ser Asn Asp Asn Ser Ile Gly Lys Trp Thr Asn Thr Asn 1090 1095 1100 Ile Val Ser Gly Gly Asn Asn Gly Lys Lys Gln Tyr Ser Ser Asn Asn 1105 1110 1115 1120 Pro Asp Ala Asn Leu Thr Leu Asn Thr Asp Ala Gln Glu Lys Leu Asn 1125 1130 1135 Lys Asn Arg Asp Tyr Tyr Ile Ser Leu Tyr Met Lys Ser Glu Lys Asn 1140 1145 1150 Thr Gln Cys Glu Ile Thr Ile Asp Gly Glu Ile Tyr Pro Ile Thr Thr 1155 1160 1165 Lys Thr Val Asn Val Asn Lys Asp Asn Tyr Lys Arg Leu Asp Ile Ile 1170 1175 1180 Ala His Asn Ile Lys Ser Asn Pro Ile Ser Ser Leu His Ile Lys Thr 1185 1190 1195 1200 Asn Asp Glu Ile Thr Leu Phe Trp Asp Asp Ile Ser Ile Thr Asp Val 1205 1210 1215 Ala Ser Ile Lys Pro Glu Asn Leu Thr Asp Ser Glu Ile Lys Gln Ile 1220 1225 1230 Tyr Ser Arg Tyr Gly Ile Lys Leu Glu Asp Gly Ile Leu Ile Asp Lys 1235 1240 1245 Lys Gly Gly Ile His Tyr Gly Glu Phe Ile Asn Glu Ala Ser Phe Asn 1250 1255 1260 Ile Glu Pro Leu Gln Asn Tyr Val Thr Lys Tyr Glu Val Thr Tyr Ser 1265 1270 1275 1280 Ser Glu Leu Gly Pro Asn Val Ser Asp Thr Leu Glu Ser Asp Lys Ile 1285 1290 1295 Tyr Lys Asp Gly Thr Ile Lys Phe Asp Phe Thr Lys Tyr Ser Lys Asn 1300 1305 1310 Glu Gln Gly Leu Phe Tyr Asp Ser Gly Leu Asn Trp Asp Phe Lys Ile 1315 1320 1325 Asn Ala Ile Thr Tyr Asp Gly Lys Glu Met Asn Val Phe His Arg Tyr 1330 1335 1340 Asn Lys 1345 (2)SEQ ID NO:24信息: (i)序列特征: (A)长度:1399个碱基对 (B)类型:核酸 (C)链型:单链 (D)拓扑结构:线性 (ii)分子类型:DNA(基因组) (ix)特征: (A)名称/关键词:misc_特征 (B)位置:1..1386 (D)其它信息:/注=″玉米优化的得自AB78的VIP2A(a)DNA 序列″ (xi)序列描述:SEQ ID NO:24: ATGAAGCGCA TGGAGGGCAA GCTGTTCATG GTGAGCAAGA AGCTCCAGGT GGTGACCAAG 60 ACCGTGCTGC TGAGCACCGT GTTCAGCATC AGCCTGCTGA ACAACGAGGT GATCAAGGCC 120 GAGCAGCTGA ACATCAACAG CCAGAGCAAG TACACCAACC TCCAGAACCT GAAGATCACC 180 GACAAGGTGG AGGACTTCAA GGAGGACAAG GAGAAGGCCA AGGAGTGGGG CAAGGAGAAG 240 GAGAAGGAGT GGAAGCTTAC CGCCACCGAG AAGGGCAAGA TGAACAACTT CCTGGACAAC 300 AAGAACGACA TCAAGACCAA CTACAAGGAG ATCACCTTCA GCATGGCCGG CAGCTTCGAG 360 GACGAGATCA AGGACCTGAA GGAGATCGAC AAGATGTTCG ACAAGACCAA CCTGAGCAAC 420 AGCATCATCA CCTACAAGAA CGTGGAGCCC ACCACCATCG GCTTCAACAA GAGCCTGACC 480 GAGGGCAACA CCATCAACAG CGACGCCATG GCCCAGTTCA AGGAGCAGTT CCTGGACCGC 540 GACATCAAGT TCGACAGCTA CCTGGACACC CACCTGACCG CCCAGCAGGT GAGCAGCAAG 600 GAGCGCGTGA TCCTGAAGGT GACCGTCCCC AGCGGCAAGG GCAGCACCAC CCCCACCAAG 660 GCCGGCGTGA TCCTGAACAA CAGCGAGTAC AAGATGCTGA TCGACAACGG CTACATGGTG 720 CACGTGGACA AGGTGAGCAA GGTGGTGAAG AAGGGCGTGG AGTGCCTCCA GATCGAGGGC 780 ACCCTGAAGA AGAGTCTAGA CTTCAAGAAC GACATCAACG CCGAGGCCCA CAGCTGGGGC 840 ATGAAGAACT ACGAGGAGTG GGCCAAGGAC CTGACCGACA GCCAGCGCGA GGCCCTGGAC 900 GGCTACGCCC GCCAGGACTA CAAGGAGATC AACAACTACC TGCGCAACCA GGGCGGCAGC 960 GGCAACGAGA AGCTGGACGC CCAGATCAAG AACATCAGCG ACGCCCTGGG CAAGAAGCCC 1020 ATCCCCGAGA ACATCACCGT GTACCGCTGG TGCGGCATGC CCGAGTTCGG CTACCAGATC 1080 AGCGACCCCC TGCCCAGCCT GAAGGACTTC GAGGAGCAGT TCCTGAACAC CATCAAGGAG 1140 GACAAGGGCT ACATGAGCAC CAGCCTGAGC AGCGAGCGCC TGGCCGCCTT CGGCAGCCGC 1200 AAGATCATCC TGCGCCTGCA GGTGCCCAAG GGCAGCACCG GCGCCTACCT GAGCGCCATC 1260 GGCGGCTTCG CCAGCGAGAA GGAGATCCTG CTGGACAAGG ACAGCAAGTA CCACATCGAC 1320 AAGGTGACCG AGGTGATCAT CAAGGGCGTG AAGCGCTACG TGGTGGACGC CACCCTGCTG 1380 ACCAACTAGA TCTGAGCTC 1399 (2)SEQ ID NO:25信息: (i)序列特征: (A)长度:19个氨基酸 (B)类型:氨基酸 (D)拓扑结构:线性 (ii)分子类型:肽 (ix)特征: (A)名称/关键词:肽 (B)位置:1..1 9 (D)其它信息:/注=″将VIP2分泌出细胞的分泌信号肽序列″ (xi)序列描述:SEQ ID NO:25: Gly Trp Ser Trp Ile Phe Leu Phe Leu Leu Ser Gly Ala Ala Gly Val 1 5 10 15 His Cys Leu (2)SEQ ID NO:26信息: (i)序列特征: (A)长度:2655个碱基对 (B)类型:核酸 (C)链型:单链 (D)拓扑结构:线性 (ii)分子类型:其它核酸 (A)描述:/desc=“合成DNA” (iii)假设:否 (ix)特征: (A)名称/关键词:misc_特征 (B)位置:1..2655 (D)其它信息:/注=″玉米优化的编码VIP1A(a)的DNA序列″ (xi)序列描述:SEQ ID NO:26: ATGAAGAACA TGAAGAAGAA GCTGGCCAGC GTGGTGACCT GCACCCTGCT GGCCCCCATG 60 TTCCTGAACG GCAACGTGAA CGCCGTGTAC GCCGACAGCA AGACCAACCA GATCAGCACC 120 ACCCAGAAGA ACCAGCAGAA GGAGATGGAC CGCAAGGGCC TGCTGGGCTA CTACTTCAAG 180 GGCAAGGACT TCAGCAACCT GACCATGTTC GCCCCCACGC GTGACAGCAC CCTGATCTAC 240 GACCAGCAGA CCGCCAACAA GCTGCTGGAC AAGAAGCAGC AGGAGTACCA GAGCATCCGC 300 TGGATCGGCC TGATCCAGAG CAAGGAGACC GGCGACTTCA CCTTCAACCT GAGCGAGGAC 360 GAGCAGGCCA TCATCGAGAT CAACGGCAAG ATCATCAGCA ACAAGGGCAA GGAGAAGCAG 420 GTGGTGCACC TGGAGAAGGG CAAGCTGGTG CCCATCAAGA TCGAGTACCA GAGCGACACC 480 AAGTTCAACA TCGACAGCAA GACCTTCAAG GAGCTGAAGC TTTTCAAGAT CGACAGCCAG 540 AACCAGCCCC AGCAGGTGCA GCAGGACGAG CTGCGCAACC CCGAGTTCAA CAAGAAGGAG 600 AGCCAGGAGT TCCTGGCCAA GCCCAGCAAG ATCAACCTGT TCACCCAGCA GATGAAGCGC 660 GAGATCGACG AGGACACCGA CACCGACGGC GACAGCATCC CCGACCTGTG GGAGGAGAAC 720 GGCTACACCA TCCAGAACCG CATCGCCGTG AAGTGGGACG ACAGCCTGGC TAGCAAGGGC 780 TACACCAAGT TCGTGAGCAA CCCCCTGGAG AGCCACACCG TGGGCGACCC CTACACCGAC 840 TACGAGAAGG CCGCCCGCGA CCTGGACCTG AGCAACGCCA AGGAGACCTT CAACCCCCTG 900 GTGGCCGCCT TCCCCAGCGT GAACGTGAGC ATGGAGAAGG TGATCCTGAG CCCCAACGAG 960 AACCTGAGCA ACAGCGTGGA GAGCCACTCG AGCACCAACT GGAGCTACAC CAACACCGAG 1020 GGCGCCAGCG TGGAGGCCGG CATCGGTCCC AAGGGCATCA GCTTCGGCGT GAGCGTGAAC 1080 TACCAGCACA GCGAGACCGT GGCCCAGGAG TGGGGCACCA GCACCGGCAA CACCAGCCAG 1140 TTCAACACCG CCAGCGCCGG CTACCTGAAC GCCAACGTGC GCTACAACAA CGTGGGCACC 1200 GGCGCCATCT ACGACGTGAA GCCCACCACC AGCTTCGTGC TGAACAACGA CACCATCGCC 1260 ACCATCACCG CCAAGTCGAA TTCCACCGCC CTGAACATCA GCCCCGGCGA GAGCTACCCC 1320 AAGAAGGGCC AGAACGGCAT CGCCATCACC AGCATGGACG ACTTCAACAG CCACCCCATC 1380 ACCCTGAACA AGAAGCAGGT GGACAACCTG CTGAACAACA AGCCCATGAT GCTGGAGACC 1440 AACCAGACCG ACGGCGTCTA CAAGATCAAG GACACCCACG GCAACATCGT GACGGGCGGC 1500 GAGTGGAACG GCGTGATCCA GCAGATCAAG GCCAAGACCG CCAGCATCAT CGTCGACGAC 1560 GGCGAGCGCG TGGCCGAGAA GCGCGTGGCC GCCAAGGACT ACGAGAACCC CGAGGACAAG 1620 ACCCCCAGCC TGACCCTGAA GGACGCCCTG AAGCTGAGCT ACCCCGACGA GATCAAGGAG 1680 ATCGAGGGCT TGCTGTACTA CAAGAACAAG CCCATCTACG AGAGCAGCGT GATGACCTAT 1740 CTAGACGAGA ACACCGCCAA GGAGGTGACC AAGCAGCTGA ACGACACCAC CGGCAAGTTC 1800 AAGGACGTGA GCCACCTGTA CGACGTGAAG CTGACCCCCA AGATGAACGT GACCATCAAG 1860 CTGAGCATCC TGTACGACAA CGCCGAGAGC AACGACAACA GCATCGGCAA GTGGACCAAC 1920 ACCAACATCG TGAGCGGCGG CAACAACGGC AAGAAGCAGT ACAGCAGCAA CAACCCCGAC 1980 GCCAACCTGA CCCTGAACAC CGACGCCCAG GAGAAGCTGA ACAAGAACCG CGACTACTAC 2040 ATCAGCCTGT ACATGAAGAG CGAGAAGAAC ACCCAGTGCG AGATCACCAT CGACGGCGAG 2100 ATATACCCCA TCACCACCAA GACCGTGAAC GTGAACAAGG ACAACTACAA GCGCCTGGAC 2160 ATCATCGCCC ACAACATCAA GAGCAACCCC ATCAGCAGCC TGCACATCAA GACCAACGAC 2220 GAGATCACCC TGTTCTGGGA CGACATATCG ATTACCGACG TCGCCAGCAT CAAGCCCGAG 2280 AACCTGACCG ACAGCGAGAT CAAGCAGATA TACAGTCGCT ACGGCATCAA GCTGGAGGAC 2340 GGCATCCTGA TCGACAAGAA AGGCGGCATC CACTACGGCG AGTTCATCAA CGAGGCCAGC 2400 TTCAACATCG AGCCCCTGCA GAACTACGTG ACCAAGTACG AGGTGACCTA CAGCAGCGAG 2460 CTGGGCCCCA ACGTGAGCGA CACCCTGGAG AGCGACAAGA TTTACAAGGA CGGCACCATC 2520 AAGTTCGACT TCACCAAGTA CAGCAAGAAC GAGCAGGGCC TGTTCTACGA CAGCGGCCTG 2580 AACTGGGACT TCAAGATCAA CGCCATCACC TACGACGGCA AGGAGATGAA CGTGTTCCAC 2640 CGCTACAACA AGTAG 2655 (2)SEQ ID NO:27信息: (i)序列特征: (A)长度:1389个碱基对 (B)类型:核酸 (C)链型:单链 (D)拓扑结构:线性 (ii)分子类型:其它核酸 (A)描述:/desc=“合成DNA” (iii)假设:否 (ix)特征: (A)名称/关键词:misc_特征 (B)位置:1..1389 (D)其它信息:/注=″玉米优化的编码VIP2A(a)的DNA序列″ (xi)序列描述:SEQ ID NO:27: ATGAAGCGCA TGGAGGGCAA GCTGTTCATG GTGAGCAAGA AGCTCCAGGT GGTGACCAAG 60 ACCGTGCTGC TGAGCACCGT GTTCAGCATC AGCCTGCTGA ACAACGAGGT GATCAAGGCC 120 GAGCAGCTGA ACATCAACAG CCAGAGCAAG TACACCAACC TCCAGAACCT GAAGATCACC 180 GACAAGGTGG AGGACTTCAA GGAGGACAAG GAGAAGGCCA AGGAGTGGGG CAAGGAGAAG 240 GAGAAGGAGT GGAAGCTTAC CGCCACCGAG AAGGGCAAGA TGAACAACTT CCTGGACAAC 300 AAGAACGACA TCAAGACCAA CTACAAGGAG ATCACCTTCA GCATAGCCGG CAGCTTCGAG 360 GACGAGATCA AGGACCTGAA GGAGATCGAC AAGATGTTCG ACAAGACCAA CCTGAGCAAC 420 AGCATCATCA CCTACAAGAA CGTGGAGCCC ACCACCATCG GCTTCAACAA GAGCCTGACC 480 GAGGGCAACA CCATCAACAG CGACGCCATG GCCCAGTTCA AGGAGCAGTT CCTGGACCGC 540 GACATCAAGT TCGACAGCTA CCTGGACACC CACCTGACCG CCCAGCAGGT GAGCAGCAAG 600 GAGCGCGTGA TCCTGAAGGT GACCGTCCCC AGCGGCAAGG GCAGCACCAC CCCCACCAAG 660 GCCGGCGTGA TCCTGAACAA CAGCGAGTAC AAGATGCTGA TCGACAACGG CTACATGGTG 720 CACGTGGACA AGGTGAGCAA GGTGGTGAAG AAGGGCGTGG AGTGCCTCCA GATCGAGGGC 780 ACCCTGAAGA AGAGTCTAGA CTTCAAGAAC GACATCAACG CCGAGGCCCA CAGCTGGGGC 840 ATGAAGAACT ACGAGGAGTG GGCCAAGGAC CTGACCGACA GCCAGCGCGA GGCCCTGGAC 900 GGCTACGCCC GCCAGGACTA CAAGGAGATC AACAACTACC TGCGCAACCA GGGCGGCAGC 960 GGCAACGAGA AGCTGGACGC CCAGATCAAG AACATCAGCG ACGCCCTGGG CAAGAAGCCC 1020 ATCCCCGAGA ACATCACCGT GTACCGCTGG TGCGGCATGC CCGAGTTCGG CTACCAGATC 1080 AGCGACCCCC TGCCCAGCCT GAAGGACTTC GAGGAGCAGT TCCTGAACAC CATCAAGGAG 1140 GACAAGGGCT ACATGAGCAC CAGCCTGAGC AGCGAGCGCC TGGCCGCCTT CGGCAGCCGC 1200 AAGATCATCC TGCGCCTGCA GGTGCCCAAG GGCAGCACTG GTGCCTACCT GAGCGCCATC 1260 GGCGGCTTCG CCAGCGAGAA GGAGATCCTG CTGGATAAGG ACAGCAAGTA CCACATCGAC 1320 AAGGTGACCG AGGTGATCAT CAAGGGCGTG AAGCGCTACG TGGTGGACGC CACCCTGCTG 1380 ACCAACTAG 1389 (2)SEQ ID NO:28信息: (i)序列特征: (A)长度:2378个碱基对 (B)类型:核酸 (C)链型:单链 (D)拓扑结构:线性 (ii)分子类型:DNA(基因组) (iii)假设:否 (ix)特征: (A)名称/关键词:CDS (B)位置:9..2375 (D)其它信息:/注=″包含在pCIB7104中的编码VIP3A(a)的天 然DNA序列″ (xi)序列描述:SEQ ID NO:28: AGATGAAC ATG AAC AAG AAT AAT ACT AAA TTA AGC ACA AGA GCC TTA CCA 50 Met Asn Lys Asn Asn Thr Lys Leu Ser Thr Arg Ala Leu Pro 1 5 10 AGT TTT ATT GAT TAT TTT AAT GGC ATT TAT GGA TTT GCC ACT GGT ATC 98 Ser Phe Ile Asp Tyr Phe Asn Gly Ile Tyr Gly Phe Ala Thr Gly Ile 15 20 25 30 AAA GAC ATT ATG AAC ATG ATT TTT AAA ACG GAT ACA GGT GGT GAT CTA 146 Lys Asp Ile Met Asn Met Ile Phe Lys Thr Asp Thr Gly Gly Asp Leu 35 40 45 ACC CTA GAC GAA ATT TTA AAG AAT CAG CAG TTA CTA AAT GAT ATT TCT 194 Thr Leu Asp Glu Ile Leu Lys Asn Gln Gln Leu Leu Asn Asp Ile Ser 50 55 60 GGT AAA TTG GAT GGG GTG AAT GGA AGC TTA AAT GAT CTT ATC GCA CAG 242 Gly Lys Leu Asp Gly Val Asn Gly Ser Leu Asn Asp Leu Ile Ala Gln 65 70 75 GGA AAC TTA AAT ACA GAA TTA TCT AAG GAA ATA TTA AAA ATT GCA AAT 290 Gly Asn Leu Asn Thr Glu Leu Ser Lys Glu Ile Leu Lys Ile Ala Asn 80 85 90 GAA CAA AAT CAA GTT TTA AAT GAT GTT AAT AAC AAA CTC GAT GCG ATA 338 Glu Gln Asn Gln Val Leu Asn Asp Val Asn Asn Lys Leu Asp Ala Ile 95 100 105 110 AAT ACG ATG CTT CGG GTA TAT CTA CCT AAA ATT ACC TCT ATG TTG AGT 386 Asn Thr Met Leu Arg Val Tyr Leu Pro Lys Ile Thr Ser Met Leu Ser 115 120 125 GAT GTA ATG AAA CAA AAT TAT GCG CTA AGT CTG CAA ATA GAA TAC TTA 434 Asp Val Met Lys Gln Asn Tyr Ala Leu Ser Leu Gln Ile Glu Tyr Leu 130 135 140 AGT AAA CAA TTG CAA GAG ATT TCT GAT AAG TTG GAT ATT ATT AAT GTA 482 Ser Lys Gln Leu Gln Glu Ile Ser Asp Lys Leu Asp Ile Ile Asn Val 145 150 155 AAT GTA CTT ATT AAC TCT ACA CTT ACT GAA ATT ACA CCT GCG TAT CAA 530 Asn Val Leu Ile Asn Ser Thr Leu Thr Glu Ile Thr Pro Ala Tyr Gln 160 165 170 AGG ATT AAA TAT GTG AAC GAA AAA TTT GAG GAA TTA ACT TTT GCT ACA 578 Arg Ile Lys Tyr Val Asn Glu Lys Phe Glu Glu Leu Thr Phe Ala Thr 175 180 185 190 GAA ACT AGT TCA AAA GTA AAA AAG GAT GGC TCT CCT GCA GAT ATT CTT 626 Glu Thr Ser Ser Lys Val Lys Lys Asp Gly Ser Pro Ala Asp Ile Leu 195 200 205 GAT GAG TTA ACT GAG TTA ACT GAA CTA GCG AAA AGT GTA ACA AAA AAT 674 Asp Glu Leu Thr Glu Leu Thr Glu Leu Ala Lys Ser Val Thr Lys Asn 210 215 220 GAT GTG GAT GGT TTT GAA TTT TAC CTT AAT ACA TTC CAC GAT GTA ATG 722 Asp Val Asp Gly Phe Glu Phe Tyr Leu Asn Thr Phe His Asp Val Met 225 230 235 GTA GGA AAT AAT TTA TTC GGG CGT TCA GCT TTA AAA ACT GCA TCG GAA 770 Val Gly Asn Asn Leu Phe Gly Arg Ser Ala Leu Lys Thr Ala Ser Glu 240 245 250 TTA ATT ACT AAA GAA AAT GTG AAA ACA AGT GGC AGT GAG GTC GGA AAT 818 Leu Ile Thr Lys Glu Asn Val Lys Thr Ser Gly Ser Glu Val Gly Asn 255 260 265 270 GTT TAT AAC TTC TTA ATT GTA TTA ACA GCT CTG CAA GCC CAA GCT TTT 866 Val Tyr Asn Phe Leu Ile Val Leu Thr Ala Leu Gln Ala Gln Ala Phe 275 280 285 CTT ACT TTA ACA ACA TGC CGA AAA TTA TTA GGC TTA GCA GAT ATT GAT 914 Leu Thr Leu Thr Thr Cys Arg Lys Leu Leu Gly Leu Ala Asp Ile Asp 290 295 300 TAT ACT TCT ATT ATG AAT GAA CAT TTA AAT AAG GAA AAA GAG GAA TTT 962 Tyr Thr Ser Ile Met Asn Glu His Leu Asn Lys Glu Lys Glu Glu Phe 305 310 315 AGA GTA AAC ATC CTC CCT ACA CTT TCT AAT ACT TTT TCT AAT CCT AAT 1010 Arg Val Asn Ile Leu Pro Thr Leu Ser Asn Thr Phe Ser Asn Pro Asn 320 325 330 TAT GCA AAA GTT AAA GGA AGT GAT GAA GAT GCA AAG ATG ATT GTG GAA 1058 Tyr Ala Lys Val Lys Gly Ser Asp Glu Asp Ala Lys Met Ile Val Glu 335 340 345 350 GCT AAA CCA GGA CAT GCA TTG ATT GGG TTT GAA ATT AGT AAT GAT TCA 1106 Ala Lys Pro Gly His Ala Leu Ile Gly Phe Glu Ile Ser Asn Asp Ser 355 360 365 ATT ACA GTA TTA AAA GTA TAT GAG GCT AAG CTA AAA CAA AAT TAT CAA 1154 Ile Thr Val Leu Lys Val Tyr Glu Ala Lys Leu Lys Gln Asn Tyr Gln 370 375 380 GTC GAT AAG GAT TCC TTA TCG GAA GTT ATT TAT GGT GAT ATG GAT AAA 1202 Val Asp Lys Asp Ser Leu Ser Glu Val Ile Tyr Gly Asp Met Asp Lys 385 390 395 TTA TTG TGC CCA GAT CAA TCT GAA CAA ATC TAT TAT ACA AAT AAC ATA 1250 Leu Leu Cys Pro Asp Gln Ser Glu Gln Ile Tyr Tyr Thr Asn Asn Ile 400 405 410 GTA TTT CCA AAT GAA TAT GTA ATT ACT AAA ATT GAT TTC ACT AAA AAA 1298 Val Phe Pro Asn Glu Tyr Val Ile Thr Lys Ile Asp Phe Thr Lys Lys 415 420 425 430 ATG AAA ACT TTA AGA TAT GAG GTA ACA GCG AAT TTT TAT GAT TCT TCT 1346 Met Lys Thr Leu Arg Tyr Glu Val Thr Ala Asn Phe Tyr Asp Ser Ser 435 440 445 ACA GGA GAA ATT GAC TTA AAT AAG AAA AAA GTA GAA TCA AGT GAA GCG 1394 Thr Gly Glu Ile Asp Leu Asn Lys Lys Lys Val Glu Ser Ser Glu Ala 450 455 460 GAG TAT AGA ACG TTA AGT GCT AAT GAT GAT GGG GTG TAT ATG CCG TTA 1442 Glu Tyr Arg Thr Leu Ser Ala Asn Asp Asp Gly Val Tyr Met Pro Leu 465 470 475 GGT GTC ATC AGT GAA ACA TTT TTG ACT CCG ATT AAT GGG TTT GGC CTC 1490 Gly Val Ile Ser Glu Thr Phe Leu Thr Pro Ile Asn Gly Phe Gly Leu 480 485 490 CAA GCT GAT GAA AAT TCA AGA TTA ATT ACT TTA ACA TGT AAA TCA TAT 1538 Gln Ala Asp Glu Asn Ser Arg Leu Ile Thr Leu Thr Cys Lys Ser Tyr 495 500 505 510 TTA AGA GAA CTA CTG CTA GCA ACA GAC TTA AGC AAT AAA GAA ACT AAA 1586 Leu Arg Glu Leu Leu Leu Ala Thr Asp Leu Ser Asn Lys Glu Thr Lys 515 520 525 TTG ATC GTC CCG CCA AGT GGT TTT ATT AGC AAT ATT GTA GAG AAC GGG 1634 Leu Ile Val Pro Pro Ser Gly Phe Ile Ser Asn Ile Val Glu Asn Gly 530 535 540 TCC ATA GAA GAG GAC AAT TTA GAG CCG TGG AAA GCA AAT AAT AAG AAT 1682 Ser Ile Glu Glu Asp Asn Leu Glu Pro Trp Lys Ala Asn Asn Lys Asn 545 550 555 GCG TAT GTA GAT CAT ACA GGC GGA GTG AAT GGA ACT AAA GCT TTA TAT 1730 Ala Tyr Val Asp His Thr Gly Gly Val Asn Gly Thr Lys Ala Leu Tyr 560 565 570 GTT CAT AAG GAC GGA GGA ATT TCA CAA TTT ATT GGA GAT AAG TTA AAA 1778 Val His Lys Asp Gly Gly Ile Ser Gln Phe Ile Gly Asp Lys Leu Lys 575 580 585 590 CCG AAA ACT GAG TAT GTA ATC CAA TAT ACT GTT AAA GGA AAA CCT TCT 1826 Pro Lys Thr Glu Tyr Val Ile Gln Tyr Thr Val Lys Gly Lys Pro Ser 595 600 605 ATT CAT TTA AAA GAT GAA AAT ACT GGA TAT ATT CAT TAT GAA GAT ACA 1874 Ile His Leu Lys Asp Glu Asn Thr Gly Tyr Ile His Tyr Glu Asp Thr 610 615 620 AAT AAT AAT TTA GAA GAT TAT CAA ACT ATT AAT AAA CGT TTT ACT ACA 1922 Asn Asn Asn Leu Glu Asp Tyr Gln Thr Ile Asn Lys Arg Phe Thr Thr 625 630 635 GGA ACT GAT TTA AAG GGA GTG TAT TTA ATT TTA AAA AGT CAA AAT GGA 1970 Gly Thr Asp Leu Lys Gly Val Tyr Leu Ile Leu Lys Ser Gln Asn Gly 640 645 650 GAT GAA GCT TGG GGA GAT AAC TTT ATT ATT TTG GAA ATT AGT CCT TCT 2018 Asp Glu Ala Trp Gly Asp Asn Phe Ile Ile Leu Glu Ile Ser Pro Ser 655 660 665 670 GAA AAG TTA TTA AGT CCA GAA TTA ATT AAT ACA AAT AAT TGG ACG AGT 2066 Glu Lys Leu Leu Ser Pro Glu Leu Ile Asn Thr Asn Asn Trp Thr Ser 675 680 685 ACG GGA TCA ACT AAT ATT AGC GGT AAT ACA CTC ACT CTT TAT CAG GGA 2114 Thr Gly Ser Thr Asn Ile Ser Gly Asn Thr Leu Thr Leu Tyr Gln Gly 690 695 700 GGA CGA GGG ATT CTA AAA CAA AAC CTT CAA TTA GAT AGT TTT TCA ACT 2162 Gly Arg Gly Ile Leu Lys Gln Asn Leu Gln Leu Asp Ser Phe Ser Thr 705 710 715 TAT AGA GTG TAT TTT TCT GTG TCC GGA GAT GCT AAT GTA AGG ATT AGA 2210 Tyr Arg Val Tyr Phe Ser Val Ser Gly Asp Ala Asn Val Arg Ile Arg 720 725 730 AAT TCT AGG GAA GTG TTA TTT GAA AAA AGA TAT ATG AGC GGT GCT AAA 2258 Asn Ser Arg Glu Val Leu Phe Glu Lys Arg Tyr Met Ser Gly Ala Lys 735 740 745 750 GAT GTT TCT GAA ATG TTC ACT ACA AAA TTT GAG AAA GAT AAC TTT TAT 2306 Asp Val Ser Glu Met Phe Thr Thr Lys Phe Glu Lys Asp Asn Phe Tyr 755 760 765 ATA GAG CTT TCT CAA GGG AAT AAT TTA TAT GGT GGT CCT ATT GTA CAT 2354 Ile Glu Leu Ser Gln Gly Asn Asn Leu Tyr Gly Gly Pro Ile Val His 770 775 780 TTT TAC GAT GTC TCT ATT AAG TAA 2378 Phe Tyr Asp Val Ser Ile Lys 785 (2)SEQ ID NO:29信息: (i)序列特征: (A)长度:789个氨基酸 (B)类型:氨基酸 (D)拓扑结构:线性 (ii)分子类型:蛋白质 (xi)序列描述:SEQ ID NO:29: Met Asn Lys Asn Asn Thr Lys Leu Ser Thr Arg Ala Leu Pro Ser Phe 1 5 10 15 Ile Asp Tyr Phe Asn Gly Ile Tyr Gly Phe Ala Thr Gly Ile Lys Asp 20 25 30 Ile Met Asn Met Ile Phe Lys Thr Asp Thr Gly Gly Asp Leu Thr Leu 35 40 45 Asp Glu Ile Leu Lys Asn Gln Gln Leu Leu Asn Asp Ile Ser Gly Lys 50 55 60 Leu Asp Gly Val Asn Gly Ser Leu Asn Asp Leu Ile Ala Gln Gly Asn 65 70 75 80 Leu Asn Thr Glu Leu Ser Lys Glu Ile Leu Lys Ile Ala Asn Glu Gln 85 90 95 Asn Gln Val Leu Asn Asp Val Asn Asn Lys Leu Asp Ala Ile Asn Thr 100 105 110 Met Leu Arg Val Tyr Leu Pro Lys Ile Thr Ser Met Leu Ser Asp Val 115 120 125 Met Lys Gln Asn Tyr Ala Leu Ser Leu Gln Ile Glu Tyr Leu Ser Lys 130 135 140 Gln Leu Gln Glu Ile Ser Asp Lys Leu Asp Ile Ile Asn Val Asn Val 145 150 155 160 Leu Ile Asn Ser Thr Leu Thr Glu Ile Thr Pro Ala Tyr Gln Arg Ile 165 170 175 Lys Tyr Val Asn Glu Lys Phe Glu Glu Leu Thr Phe Ala Thr Glu Thr 180 185 190 Ser Ser Lys Val Lys Lys Asp Gly Ser Pro Ala Asp Ile Leu Asp Glu 195 200 205 Leu Thr Glu Leu Thr Glu Leu Ala Lys Ser Val Thr Lys Asn Asp Val 210 215 220 Asp Gly Phe Glu Phe Tyr Leu Asn Thr Phe His Asp Val Met Val Gly 225 230 235 240 Asn Asn Leu Phe Gly Arg Ser Ala Leu Lys Thr Ala Ser Glu Leu Ile 245 250 255 Thr Lys Glu Asn Val Lys Thr Ser Gly Ser Glu Val Gly Asn Val Tyr 260 265 270 Asn Phe Leu Ile Val Leu Thr Ala Leu Gln Ala Gln Ala Phe Leu Thr 275 280 285 Leu Thr Thr Cys Arg Lys Leu Leu Gly Leu Ala Asp Ile Asp Tyr Thr 290 295 300 Ser Ile Met Asn Glu His Leu Asn Lys Glu Lys Glu Glu Phe Arg Val 305 310 315 320 Asn Ile Leu Pro Thr Leu Ser Asn Thr Phe Ser Asn Pro Asn Tyr Ala 325 330 335 Lys Val Lys Gly Ser Asp Glu Asp Ala Lys Met Ile Val Glu Ala Lys 340 345 350 Pro Gly His Ala Leu Ile Gly Phe Glu Ile Ser Asn Asp Ser Ile Thr 355 360 365 Val Leu Lys Val Tyr Glu Ala Lys Leu Lys Gln Asn Tyr Gln Val Asp 370 375 380 Lys Asp Ser Leu Ser Glu Val Ile Tyr Gly Asp Met Asp Lys Leu Leu 385 390 395 400 Cys Pro Asp Gln Ser Glu Gln Ile Tyr Tyr Thr Asn Asn Ile Val Phe 405 410 415 Pro Asn Glu Tyr Val Ile Thr Lys Ile Asp Phe Thr Lys Lys Met Lys 420 425 430 Thr Leu Arg Tyr Glu Val Thr Ala Asn Phe Tyr Asp Ser Ser Thr Gly 435 440 445 Glu Ile Asp Leu Asn Lys Lys Lys Val Glu Ser Ser Glu Ala Glu Tyr 450 455 460 Arg Thr Leu Ser Ala Asn Asp Asp Gly Val Tyr Met Pro Leu Gly Val 465 470 475 480 Ile Ser Glu Thr Phe Leu Thr Pro Ile Asn Gly Phe Gly Leu Gln Ala 485 490 495 Asp Glu Asn Ser Arg Leu Ile Thr Leu Thr Cys Lys Ser Tyr Leu Arg 500 505 510 Glu Leu Leu Leu Ala Thr Asp Leu Ser Asn Lys Glu Thr Lys Leu Ile 515 520 525 Val Pro Pro Ser Gly Phe Ile Ser Asn Ile Val Glu Asn Gly Ser Ile 530 535 540 Glu Glu Asp Asn Leu Glu Pro Trp Lys Ala Asn Asn Lys Asn Ala Tyr 545 550 555 560 Val Asp His Thr Gly Gly Val Asn Gly Thr Lys Ala Leu Tyr Val His 565 570 575 Lys Asp Gly Gly Ile Ser Gln Phe Ile Gly Asp Lys Leu Lys Pro Lys 580 585 590 Thr Glu Tyr Val Ile Gln Tyr Thr Val Lys Gly Lys Pro Ser Ile His 595 600 605 Leu Lys Asp Glu Asn Thr Gly Tyr Ile His Tyr Glu Asp Thr Asn Asn 610 615 620 Asn Leu Glu Asp Tyr Gln Thr Ile Asn Lys Arg Phe Thr Thr Gly Thr 625 630 635 640 Asp Leu Lys Gly Val Tyr Leu Ile Leu Lys Ser Gln Asn Gly Asp Glu 645 650 655 Ala Trp Gly Asp Asn Phe Ile Ile Leu Glu Ile Ser Pro Ser Glu Lys 660 665 670 Leu Leu Ser Pro Glu Leu Ile Asn Thr Asn Asn Trp Thr Ser Thr Gly 675 680 685 Ser Thr Asn Ile Ser Gly Asn Thr Leu Thr Leu Tyr Gln Gly Gly Arg 690 695 700 Gly Ile Leu Lys Gln Asn Leu Gln Leu Asp Ser Phe Ser Thr Tyr Arg 705 710 715 720 Val Tyr Phe Ser Val Ser Gly Asp Ala Asn Val Arg Ile Arg Asn Ser 725 730 735 Arg Glu Val Leu Phe Glu Lys Arg Tyr Met Ser Gly Ala Lys Asp Val 740 745 750 Ser Glu Met Phe Thr Thr Lys Phe Glu Lys Asp Asn Phe Tyr Ile Glu 755 760 765 Leu Ser Gln Gly Asn Asn Leu Tyr Gly Gly Pro Ile Val His Phe Tyr 770 775 780 Asp Val Ser Ile Lys 785 (2)SEQ ID NO:30信息: (i)序列特征: (A)长度:2403个碱基对 (B)类型:核酸 (C)链型:单链 (D)拓扑结构:线性 (ii)分子类型:其它核酸 (A)描述:/desc=“合成DNA” (iii)假设:否 (ix)特征: (A)名称/关键词:misc_特征 (B)位置:11..2389 (D)其它信息:/注=″玉米优化的编码VIP3A(a)的DNA序列″ (xi)序列描述:SEQ ID NO:30: GGATCCACCA ATGAACATGA ACAAGAACAA CACCAAGCTG AGCACCCGCG CCCTGCCGAG 60 CTTCATCGAC TACTTCAACG GCATCTACGG CTTCGCCACC GGCATCAAGG ACATCATGAA 120 CATGATCTTC AAGACCGACA CCGGCGGCGA CCTGACCCTG GACGAGATCC TGAAGAACCA 180 GCAGCTGCTG AACGACATCA GCGGCAAGCT GGACGGCGTG AACGGCAGCC TGAACGACCT 240 GATCGCCCAG GGCAACCTGA ACACCGAGCT GAGCAAGGAG ATCCTTAAGA TCGCCAACGA 300 GCAGAACCAG GTGCTGAACG ACGTGAACAA CAAGCTGGAC GCCATCAACA CCATGCTGCG 360 CGTGTACCTG CCGAAGATCA CCAGCATGCT GAGCGACGTG ATGAAGCAGA ACTACGCCCT 420 GAGCCTGCAG ATCGAGTACC TGAGCAAGCA GCTGCAGGAG ATCAGCGACA AGCTGGACAT 480 CATCAACGTG AACGTCCTGA TCAACAGCAC CCTGACCGAG ATCACCCCGG CCTACCAGCG 540 CATCAAGTAC GTGAACGAGA AGTTCGAAGA GCTGACCTTC GCCACCGAGA CCAGCAGCAA 600 GGTGAAGAAG GACGGCAGCC CGGCCGACAT CCTGGACGAG CTGACCGAGC TGACCGAGCT 660 GGCCAAGAGC GTGACCAAGA ACGACGTGGA CGGCTTCGAG TTCTACCTGA ACACCTTCCA 720 CGACGTGATG GTGGGCAACA ACCTGTTCGG CCGCAGCGCC CTGAAGACCG CCAGCGAGCT 780 GATCACCAAG GAGAACGTGA AGACCAGCGG CAGCGAGGTG GGCAACGTGT ACAACTTCCT 840 GATCGTGCTG ACCGCCCTGC AGGCCCAGGC CTTCCTGACC CTGACCACCT GTCGCAAGCT 900 GCTGGGCCTG GCCGACATCG ACTACACCAG CATCATGAAC GAGCACTTGA ACAAGGAGAA 960 GGAGGAGTTC CGCGTGAACA TCCTGCCGAC CCTGAGCAAC ACCTTCAGCA ACCCGAACTA 1020 CGCCAAGGTG AAGGGCAGCG ACGAGGACGC CAAGATGATC GTGGAGGCTA AGCCGGGCCA 1080 CGCGTTGATC GGCTTCGAGA TCAGCAACGA CAGCATCACC GTGCTGAAGG TGTACGAGGC 1140 CAAGCTGAAG CAGAACTACC AGGTGGACAA GGACAGCTTG AGCGAGGTGA TCTACGGCGA 1200 CATGGACAAG CTGCTGTGTC CGGACCAGAG CGAGCAAATC TACTACACCA ACAACATCGT 1260 GTTCCCGAAC GAGTACGTGA TCACCAAGAT CGACTTCACC AAGAAGATGA AGACCCTGCG 1320 CTACGAGGTG ACCGCCAACT TCTACGACAG CAGCACCGGC GAGATCGACC TGAACAAGAA 1380 GAAGGTGGAG AGCAGCGAGG CCGAGTACCG CACCCTGAGC GCGAACGACG ACGGCGTCTA 1440 CATGCCACTG GGCGTGATCA GCGAGACCTT CCTGACCCCG ATCAACGGCT TTGGCCTGCA 1500 GGCCGACGAG AACAGCCGCC TGATCACCCT GACCTGTAAG AGCTACCTGC GCGAGCTGCT 1560 GCTAGCCACC GACCTGAGCA ACAAGGAGAC CAAGCTGATC GTGCCACCGA GCGGCTTCAT 1620 CAGCAACATC GTGGAGAACG GCAGCATCGA GGAGGACAAC CTGGAGCCGT GGAAGGCCAA 1680 CAACAAGAAC GCCTACGTGG ACCACACCGG CGGCGTGAAC GGCACCAAGG CCCTGTACGT 1740 GCACAAGGAC GGCGGCATCA GCCAGTTCAT CGGCGACAAG CTGAAGCCGA AGACCGAGTA 1800 CGTGATCCAG TACACCGTGA AGGGCAAGCC ATCGATTCAC CTGAAGGACG AGAACACCGG 1860 CTACATCCAC TACGAGGACA CCAACAACAA CCTGGAGGAC TACCAGACCA TCAACAAGCG 1920 CTTCACCACC GGCACCGACC TGAAGGGCGT GTACCTGATC CTGAAGAGCC AGAACGGCGA 1980 CGAGGCCTGG GGCGACAACT TCATCATCCT GGAGATCAGC CCGAGCGAGA AGCTGCTGAG 2040 CCCGGAGCTG ATCAACACCA ACAACTGGAC CAGCACCGGC AGCACCAACA TCAGCGGCAA 2100 CACCCTGACC CTGTACCAGG GCGGCCGCGG CATCCTGAAG CAGAACCTGC AGCTGGACAG 2160 CTTCAGCACC TACCGCGTGT ACTTCAGCGT GAGCGGCGAC GCCAACGTGC GCATCCGCAA 2220 CAGCCGCGAG GTGCTGTTCG AGAAGAGGTA CATGAGCGGC GCCAAGGACG TGAGCGAGAT 2280 GTTCACCACC AAGTTCGAGA AGGACAACTT CTACATCGAG CTGAGCCAGG GCAACAACCT 2340 GTACGGCGGC CCGATCGTGC ACTTCTACGA CGTGAGCATC AAGTTAACGT AGAGCTCAGA 2400 TCT 2403 (2)SEQ ID NO:31信息: (i)序列特征: (A)长度:2612个碱基对 (B)类型:核酸 (C)链型:单链 (D)拓扑结构:线性 (ii)分子类型:DNA(基因组) (iii)假设:否 (ix)特征: (A)名称/关键词:CDS (B)位置:118..2484 (D)其它信息:/注=″得自AB424的编码VIP3A(a)的天然DNA 序列″ (xi)序列描述:SEQ ID NO:31: ATTGAAATTG ATAAAAAGTT ATGAGTGTTT AATAATCAGT AATTACCAAT AAAGAATTAA 60 GAATACAAGT TTACAAGAAA TAAGTGTTAC AAAAAATAGC TGAAAAGGAA GATGAAC 117 ATG AAC AAG AAT AAT ACT AAA TTA AGC ACA AGA GCC TTA CCA AGT TTT 165 Met Asn Lys Asn Asn Thr Lys Leu Ser Thr Arg Ala Leu Pro Ser Phe 790 795 800 805 ATT GAT TAT TTC AAT GGC ATT TAT GGA TTT GCC ACT GGT ATC AAA GAC 213 Ile Asp Tyr Phe Asn Gly Ile Tyr Gly Phe Ala Thr Gly Ile Lys Asp 810 815 820 ATT ATG AAC ATG ATT TTT AAA ACG GAT ACA GGT GGT GAT CTA ACC CTA 261 Ile Met Asn Met Ile Phe Lys Thr Asp Thr Gly Gly Asp Leu Thr Leu 825 830 835 GAC GAA ATT TTA AAG AAT CAG CAG CTA CTA AAT GAT ATT TCT GGT AAA 309 Asp Glu Ile Leu Lys Asn Gln Gln Leu Leu Asn Asp Ile Ser Gly Lys 840 845 850 TTG GAT GGG GTG AAT GGA AGC TTA AAT GAT CTT ATC GCA CAG GGA AAC 357 Leu Asp Gly Val Asn Gly Ser Leu Asn Asp Leu Ile Ala Gln Gly Asn 855 860 865 TTA AAT ACA GAA TTA TCT AAG GAA ATA TTA AAA ATT GCA AAT GAA CAA 405 Leu Asn Thr Glu Leu Ser Lys Glu Ile Leu Lys Ile Ala Asn Glu Gln 870 875 880 885 AAT CAA GTT TTA AAT GAT GTT AAT AAC AAA CTC GAT GCG ATA AAT ACG 453 Asn Gln Val Leu Asn Asp Val Asn Asn Lys Leu Asp Ala Ile Asn Thr 890 895 900 ATG CTT CGG GTA TAT CTA CCT AAA ATT ACC TCT ATG TTG AGT GAT GTA 501 Met Leu Arg Val Tyr Leu Pro Lys Ile Thr Ser Met Leu Ser Asp Val 905 910 915 ATG AAA CAA AAT TAT GCG CTA AGT CTG CAA ATA GAA TAC TTA AGT AAA 549 Met Lys Gln Asn Tyr Ala Leu Ser Leu Gln Ile Glu Tyr Leu Ser Lys 920 925 930 CAA TTG CAA GAG ATT TCT GAT AAG TTG GAT ATT ATT AAT GTA AAT GTA 597 Gln Leu Gln Glu Ile Ser Asp Lys Leu Asp Ile Ile Asn Val Asn Val 935 940 945 CTT ATT AAC TCT ACA CTT ACT GAA ATT ACA CCT GCG TAT CAA AGG ATT 645 Leu Ile Asn Ser Thr Leu Thr Glu Ile Thr Pro Ala Tyr Gln Arg Ile 950 955 960 965 AAA TAT GTG AAC GAA AAA TTT GAG GAA TTA ACT TTT GCT ACA GAA ACT 693 Lys Tyr Val Asn Glu Lys Phe Glu Glu Leu Thr Phe Ala Thr Glu Thr 970 975 980 AGT TCA AAA GTA AAA AAG GAT GGC TCT CCT GCA GAT ATT CGT GAT GAG 741 Ser Ser Lys Val Lys Lys Asp Gly Ser Pro Ala Asp Ile Arg Asp Glu 985 990 995 TTA ACT GAG TTA ACT GAA CTA GCG AAA AGT GTA ACA AAA AAT GAT GTG 789 Leu Thr Glu Leu Thr Glu Leu Ala Lys Ser Val Thr Lys Asn Asp Val 1000 1005 1010 GAT GGT TTT GAA TTT TAC CTT AAT ACA TTC CAC GAT GTA ATG GTA GGA 837 Asp Gly Phe Glu Phe Tyr Leu Asn Thr Phe His Asp Val Met Val Gly 1015 1020 1025 AAT AAT TTA TTC GGG CGT TCA GCT TTA AAA ACT GCA TCG GAA TTA ATT 885 Asn Asn Leu Phe Gly Arg Ser Ala Leu Lys Thr Ala Ser Glu Leu Ile 1030 1035 1040 1045 ACT AAA GAA AAT GTG AAA ACA AGT GGC AGT GAG GTC GGA AAT GTT TAT 933 Thr Lys Glu Asn Val Lys Thr Ser Gly Ser Glu Val Gly Asn Val Tyr 1050 1055 1060 AAC TTC CTA ATT GTA TTA ACA GCT CTG CAA GCA AAA GCT TTT CTT ACT 981 Asn Phe Leu Ile Val Leu Thr Ala Leu Gln Ala Lys Ala Phe Leu Thr 1065 1070 1075 TTA ACA CCA TGC CGA AAA TTA TTA GGC TTA GCA GAT ATT GAT TAT ACT 1029 Leu Thr Pro Cys Arg Lys Leu Leu Gly Leu Ala Asp Ile Asp Tyr Thr 1080 1085 1090 TCT ATT ATG AAT GAA CAT TTA AAT AAG GAA AAA GAG GAA TTT AGA GTA 1077 Ser Ile Met Asn Glu His Leu Asn Lys Glu Lys Glu Glu Phe Arg Val 1095 1100 1105 AAC ATC CTC CCT ACA CTT TCT AAT ACT TTT TCT AAT CCT AAT TAT GCA 1125 Asn Ile Leu Pro Thr Leu Ser Asn Thr Phe Ser Asn Pro Asn Tyr Ala 1110 1115 1120 1125 AAA GTT AAA GGA AGT GAT GAA GAT GCA AAG ATG ATT GTG GAA GCT AAA 1173 Lys Val Lys Gly Ser Asp Glu Asp Ala Lys Met Ile Val Glu Ala Lys 1130 1135 1140 CCA GGA CAT GCA TTG ATT GGG TTT GAA ATT AGT AAT GAT TCA ATT ACA 1221 Pro Gly His Ala Leu Ile Gly Phe Glu Ile Ser Asn Asp Ser Ile Thr 1145 1150 1155 GTA TTA AAA GTA TAT GAG GCT AAG CTA AAA CAA AAT TAT CAA GTC GAT 1269 Val Leu Lys Val Tyr Glu Ala Lys Leu Lys Gln Asn Tyr Gln Val Asp 1160 1165 1170 AAG GAT TCC TTA TCG GAA GTT ATT TAT GGC GAT ATG GAT AAA TTA TTG 1317 Lys Asp Ser Leu Ser Glu Val Ile Tyr Gly Asp Met Asp Lys Leu Leu 1175 1180 1185 TGC CCA GAT CAA TCT GGA CAA ATC TAT TAT ACA AAT AAC ATA GTA TTT 1365 Cys Pro Asp Gln Ser Gly Gln Ile Tyr Tyr Thr Asn Asn Ile Val Phe 1190 1195 1200 1205 CCA AAT GAA TAT GTA ATT ACT AAA ATT GAT TTC ACT AAA AAA ATG AAA 1413 Pro Asn Glu Tyr Val Ile Thr Lys Ile Asp Phe Thr Lys Lys Met Lys 1210 1215 1220 ACT TTA AGA TAT GAG GTA ACA GCG AAT TTT TAT GAT TCT TCT ACA GGA 1461 Thr Leu Arg Tyr Glu Val Thr Ala Asr Phe Tyr Asp Ser Ser Thr Gly 1220 1230 1235 GAA ATT GAC TTA AAT AAG AAA AAA GTA GAA TCA AGT GAA GCG GAG TAT 1509 Glu Ile Asp Leu Asn Lys Lys Lys Val Glu Ser Ser Glu Ala Glu Tyr 1240 1245 1250 AGA ACG TTA AGT GCT AAT GAT GAT GGG GTG TAT ATG CCG TTA GGT GTC 1557 Arg Thr Leu Ser Ala Asn Asp Asp Gly Val Tyr Met Pro Leu Gly Val 1255 1260 1265 ATC AGT GAA ACA TTT TTG ACT CCG ATT AAT GGG TTT GGC CTC CAA GCT 1605 Ile Ser Glu Thr Phe Leu Thr Pro Ile Asn Gly Phe Gly Leu Gln Ala 1270 1275 1280 1285 GAT GAA AAT TCA AGA TTA ATT ACT TTA ACA TGT AAA TCA TAT TTA AGA 1653 Asp Glu Asn Ser Arg Leu Ile Thr Leu Thr Cys Lys Ser Tyr Leu Arg 1290 1295 1300 GAA CTA CTG CTA GCA ACA GAC TTA AGC AAT AAA GAA ACT AAA TTG ATC 1701 Glu Leu Leu Leu Ala Thr Asp Leu Ser Asn Lys Glu Thr Lys Leu Ile 1305 1310 1315 GTC CCG CCA AGT GGT TTT ATT AGC AAT ATT GTA GAG AAC GGG TCC ATA 1749 Val Pro Pro Ser Gly Phe Ile Ser Asn Ile Val Glu Asn Gly Ser Ile 1320 1325 1330 GAA GAG GAC AAT TTA GAG CCG TGG AAA GCA AAT AAT AAG AAT GCG TAT 1797 Glu Glu Asp Asn Leu Glu Pro Trp Lys Ala Asn Asn Lys Asn Ala Tyr 1335 1340 1345 GTA GAT CAT ACA GGC GGA GTG AAT GGA ACT AAA GCT TTA TAT GTT CAT 1845 Val Asp His Thr Gly Gly Val Asn Gly Thr Lys Ala Leu Tyr Val His 1350 1355 1360 1365 AAG GAC GGA GGA ATT TCA CAA TTT ATT GGA GAT AAG TTA AAA CCG AAA 1893 Lys Asp Gly Gly Ile Ser Gln Phe Ile Gly Asp Lys Leu Lys Pro Lys 1370 1375 1380 ACT GAG TAT GTA ATC CAA TAT ACT GTT AAA GGA AAA CCT TCT ATT CAT 1941 Thr Glu Tyr Val Ile Gln Tyr Thr Val Lys Gly Lys Pro Ser Ile His 1385 1390 1395 TTA AAA GAT GAA AAT ACT GGA TAT ATT CAT TAT GAA GAT ACA AAT AAT 1989 Leu Lys Asp Glu Asn Thr Gly Tyr Ile His Tyr Glu Asp Thr Asn Asn 1400 1405 1410 AAT TTA GAA GAT TAT CAA ACT ATT AAT AAA CGT TTT ACT ACA GGA ACT 2037 Asn Leu Glu Asp Tyr Gln Thr Ile Asn Lys Arg Phe Thr Thr Gly Thr 1415 1420 1425 GAT TTA AAG GGA GTG TAT TTA ATT TTA AAA AGT CAA AAT GGA GAT GAA 2085 Asp Leu Lys Gly Val Tyr Leu Ile Leu Lys Ser Gln Asn Gly Asp Glu 1430 1435 1440 1445 GCT TGG GGA GAT AAC TTT ATT ATT TTG GAA ATT AGT CCT TCT GAA AAG 2133 Ala Trp Gly Asp Asn Phe Ile Ile Leu Glu Ile Ser Pro Ser Glu Lys 1450 1455 1460 TTA TTA AGT CCA GAA TTA ATT AAT ACA AAT AAT TGG ACG AGT ACG GGA 2181 Leu Leu Ser Pro Glu Leu Ile Asn Thr Asn Asn Trp Thr Ser Thr Gly 1465 1470 1475 TCA ACT AAT ATT AGC GGT AAT ACA CTC ACT CTT TAT CAG GGA GGA CGA 2229 Ser Thr Asn Ile Ser Gly Asn Thr Leu Thr Leu Tyr Gln Gly Gly Arg 1480 1485 1490 GGG ATT CTA AAA CAA AAC CTT CAA TTA GAT AGT TTT TCA ACT TAT AGA 2277 Gly Ile Leu Lys Gln Asn Leu Gln Leu Asp Ser Phe Ser Thr Tyr Arg 1495 1500 1505 GTG TAT TTC TCT GTG TCC GGA GAT GCT AAT GTA AGG ATT AGA AAT TCT 2325 Val Tyr Phe Ser Val Ser Gly Asp Ala Asn Val Arg Ile Arg Asn Ser 1510 1515 1520 1525 AGG GAA GTG TTA TTT GAA AAA AGA TAT ATG AGC GGT GCT AAA GAT GTT 2373 Arg Glu Val Leu Phe Glu Lys Arg Tyr Met Ser Gly Ala Lys Asp Val 1530 1535 1540 TCT GAA ATG TTC ACT ACA AAA TTT GAG AAA GAT AAC TTC TAT ATA GAG 2421 Ser Glu Met Phe Thr Thr Lys Phe Glu Lys Asp Asn Phe Tyr Ile Glu 1545 1550 1555 CTT TCT CAA GGG AAT AAT TTA TAT GGT GGT CCT ATT GTA CAT TTT TAC 2469 Leu Ser Gln Gly Asn Asn Leu Tyr Gly Gly Pro Ile Val His Phe Tyr 1560 1565 1570 GAT GTC TCT ATT AAG TAAGATCGGG ATCTAATATT AACAGTTTTT AGAAGCTAAT 2524 Asp Val Ser Ile Lys 1575 TCTTGTATAA TGTCCTTGAT TATGGAAAAA CACAATTTTG TTTGCTAAGA TGTATATATA 2584 GCTCACTCAT TAAAAGGCAA TCAAGCTT 2612 (2)SEQ ID NO:32信息: (i)序列特征: (A)长度:789个氨基酸 (B)类型:氨基酸 (D)拓扑结构:线性 (ii)分子类型:蛋白质 (xi)序列描述:SEQ ID NO:32: Met Asn Lys Asn Asn Thr Lys Leu Ser Thr Arg Ala Leu Pro Ser Phe 1 5 10 15 Ile Asp Tyr Phe Asn Gly Ile Tyr Gly Phe Ala Thr Gly Ile Lys Asp 20 25 30 Ile Met Asn Met Ile Phe Lys Thr Asp Thr Gly Gly Asp Leu Thr Leu 35 40 45 Asp Glu Ile Leu Lys Asn Gln Gln Leu Leu Asn Asp Ile Ser Gly Lys 50 55 60 Leu Asp Gly Val Asn Gly Ser Leu Asn Asp Leu Ile Ala Gln Gly Asn 65 70 75 80 Leu Asn Thr Glu Leu Ser Lys Glu Ile Leu Lys Ile Ala Asn Glu Gln 85 90 95 Asn Gln Val Leu Asn Asp Val Asn Asn Lys Leu Asp Ala Ile Asn Thr 100 105 110 Met Leu Arg Val Tyr Leu Pro Lys Ile Thr Ser Met Leu Ser Asp Val 115 120 125 Met Lys Gln Asn Tyr Ala Leu Ser Leu Gln Ile Glu Tyr Leu Ser Lys 130 135 140 Gln Leu Gln Glu Ile Ser Asp Lys Leu Asp Ile Ile Asn Val Asn Val 145 150 155 160 Leu Ile Asn Ser Thr Leu Thr Glu Ile Thr Pro Ala Tyr Gln Arg Ile 165 170 175 Lys Tyr Val Asn Glu Lys Phe Glu Glu Leu Thr Phe Ala Thr Glu Thr 180 185 190 Ser Ser Lys Val Lys Lys Asp Gly Ser pro Ala Asp Ile Arg Asp Glu 195 200 205 Leu Thr Glu Leu Thr Glu Leu Ala Lys Ser Val Thr Lys Asn Asp Val 210 215 220 Asp Gly Phe Glu Phe Tyr Leu Asn Thr Phe His Asp Val Met Val Gly 225 230 235 240 Asn Asn Leu Phe Gly Arg Ser Ala Leu Lys Thr Ala Ser Glu Leu Ile 245 250 255 Thr Lys Glu Asn Val Lys Thr Ser Gly Ser Glu Val Gly Asn Val Tyr 260 265 270 Asn Phe Leu Ile Val Leu Thr Ala Leu Gln Ala LVs Ala Phe Leu Thr 275 280 285 Leu Thr Pro Cys Arg Lys Leu Leu Gly Leu Ala Asp Ile Asp Tyr Thr 290 295 300 Ser Ile Met Asn Glu His Leu Asn Lys Glu Lys Glu Glu Phe Arg Val 305 310 315 320 Asn Ile Leu Pro Thr Leu Ser Asn Thr Phe Ser Asn Pro Asn Tyr Ala 325 330 335 Lys Val Lys Gly Ser Asp Glu Asp Ala Lys Met Ile Val Glu Ala Lys 340 345 350 Pro Gly His Ala Leu Ile Gly Phe Glu Ile Ser Asn Asp Ser Ile Thr 355 360 365 Val Leu Lys Val Tyr Glu Ala Lys Leu Lys Gln Asn Tyr Gln Val Asp 370 375 380 Lys Asp Ser Leu Ser Glu Val Ile Tyr Gly Asp Met Asp Lys Leu Leu 385 390 395 400 Cys Pro Asp Gln Ser Gly Gln Ile Tyr Tyr Thr Asn Asn Ile Val Phe 405 410 415 Pro Asn Glu Tyr Val Ile Thr Lys Ile Asp Phe Thr Lys Lys Met Lys 420 425 430 Thr Leu Arg Tyr Glu Val Thr Ala Asn Phe Tyr Asp Ser Ser Thr Gly 435 440 445 Glu Ile Asp Leu Asn Lys Lys Lys Val Glu Ser Ser Glu Ala Glu Tyr 450 455 460 Arg Thr Leu Ser Ala Asn Asp Asp Gly Val Tyr Met Pro Ieu Gly Val 465 470 475 480 Ile Ser Glu Thr Phe Leu Thr Pro Ile Asn Gly Phe Gly Leu Gln Ala 485 490 495 Asp Glu Asn Ser Arg Leu Ile Thr Leu Thr Cys Lys Ser Tyr Leu Arg 500 505 510 Glu Leu Leu Leu Ala Thr Asp Leu Ser Asn Lys Glu Thr Lys Leu Ile 515 520 525 Val Pro Pro Ser Gly Phe Ile Ser Asn Ile Val Glu Asn Gly Ser Ile 530 535 540 Glu Glu Asp Asn Leu Glu Pro Trp Lys Ala Asn Asn Lys Asn Ala Tyr 545 550 555 560 Val Asp His Thr Gly Gly Val Asn Gly Thr Lys Ala Leu Tyr Val His 565 570 575 Lys Asp Gly Gly Ile Ser Gln Phe Ile Gly Asp Lys Leu Lys Pro Lys 580 585 590 Thr Glu Tyr Val Ile Gln Tyr Thr Val Lys Gly Lys Pro Ser Ile His 595 600 605 Leu Lys Asp Glu Asn Thr Gly Tyr Ile His Tyr Glu Asp Thr Asn Asn 610 615 620 Asn Leu Glu Asp Tyr Gln Thr Ile Asn Lys Arg Phe Thr Thr Gly Thr 625 630 635 640 Asp Leu Lys Gly Val Tyr Leu Ile Leu Lys Ser Gln Asn Gly Asp Glu 645 650 655 Ala Trp Gly Asp Asn Phe Ile Ile Leu Glu Ile Ser Pro Ser Glu Lys 660 665 670 Leu Leu Ser Pro Glu Leu Ile Asn Thr Asn Asn Trp Thr Ser Tnr Gly 675 680 685 Ser Thr Asn Ile Ser Gly Asn Thr Leu Thr Leu Tyr Gln Gly Gly Arg 690 695 700 Gly Ile Leu Lys Gln Asn Leu Gln Leu Asp Ser Phe Ser Thr Tyr Arg 705 710 715 720 Val Tyr Phe Ser Val Ser Gly Asp Ala Asn Val Arg Ile Arg Asn Ser 725 730 735 Arg Glu Val Leu Phe Glu Lys Arg Tyr Met Ser Gly Ala Lys Asp Val 740 745 750 Ser Glu Met Phe Thr Thr Lys Phe Glu Lys Asp Asn Phe Tyr Ile Glu 755 760 765 Leu Ser Gln Gly Asn Asn Leu Tyr Gly Gly Pro Ile Val His Phe Tyr 770 775 780 Asp Val Ser Ile Lys 785 (2)SEQ ID NO:33信息: (i)序列特征: (A)长度:30个碱基对 (B)类型:核酸 (C)链型:单链 (D)拓扑结构:线性 (ii)分子类型:其它核酸 (A)描述:/desc=“用于制备pCIB5526的正向引物” (iii)假设:否 (xi)序列描述:SEQ ID NO:33: GGATCCACCA TGAAGACCAA CCAGATCAGC (2)SEQ ID NO:34信息: (i)序列特征: (A)长度:15个碱基对 (B)类型:核酸 (C)链型:单链 (D)拓扑结构:线性 (ii)分子类型:其它核酸 (A)描述:/desc=“用于制备pCIB5526的反向引物” (iii)假设:否 (xi)序列描述:SEQ ID NO:34: AAGCTTCAGC TCCTT (2)SEQ ID NO:35信息: (i)序列特征: (A)长度:2576个碱基对 (B)类型:核酸 (C)链型:单链 (D)拓扑结构:线性 (ii)分子类型:其它核酸 (A)描述:/desc=“合成DNA” (iii)假设:否 (ix)特征: (A)名称/关键词:CDS (B)位置:9..2564 (D)其它信息:/注=″包含在pCIB5526中的玉米优化的编码除 去了芽孢杆菌属分泌信号的VIP1A(a)的序列″ (xi)序列描述:SEQ ID NO:35: GATCCACC ATG AAG ACC AAC CAG ATC AGC ACC ACC CAG AAG AAC CAG CAG 50 Met Lys Thr Asn Gln Ile Ser Thr Thr Gln Lys Asn Gln Gln 825 830 835 AAG GAG ATG GAC CGC AAG GGC CTG CTG GGC TAC TAC TTC AAG GGC AAG 98 Lys Glu Met Asp Arg Lys Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys 840 845 850 GAC TTC AGC AAC CTG ACC ATG TTC GCC CCC ACG CGT GAC AGC ACC CTG 146 Asp Phe Ser Asn Leu Thr Met Phe Ala Pro Thr Arg Asp Ser Thr Leu 855 860 865 ATC TAC GAC CAG CAG ACC GCC AAC AAG CTG CTG GAC AAG AAG CAG CAG 194 Ile Tyr Asp Gln Gln Thr Ala Asn Lys Leu Leu Asp Lys Lys Gln Gln 870 875 880 GAG TAC CAG AGC ATC CGC TGG ATC GGC CTG ATC CAG AGC AAG GAG ACC 242 Glu Tyr Gln Ser Ile Arg Trp Ile Gly Leu Ile Gln Ser Lys Glu Thr 885 890 895 GGC GAC TTC ACC TTC AAC CTG AGC GAG GAC GAG CAG GCC ATC ATC GAG 290 Gly Asp Phe Thr Phe Asn Leu Ser Glu Asp Glu Gln Ala Ile Ile Glu 900 905 910 915 ATC AAC GGC AAG ATC ATC AGC AAC AAG GGC AAG GAG AAG CAG GTG GTG 338 Ile Asn Gly Lys Ile Ile Ser Asn Lys Gly Lys Glu Lys Gln Val Val 920 925 930 CAC CTG GAG AAG GGC AAG CTG GTG CCC ATC AAG ATC GAG TAC CAG AGC 386 His Leu Glu Lys Gly Lys Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser 935 940 945 GAC ACC AAG TTC AAC ATC GAC AGC AAG ACC TTC AAG GAG CTG AAG CTT 434 Asp Thr Lys Phe Asn Ile Asp Ser Lys Thr Phe Lys Glu Leu Lys Leu 950 955 960 TTC AAG ATC GAC AGC CAG AAC CAG CCC CAG CAG GTG CAG CAG GAC GAG 482 Phe Lys Ile Asp Ser Gln Asn Gln Pro Gln Gln Val Gln Gln Asp Glu 965 970 975 CTG CGC AAC CCC GAG TTC AAC AAG AAG GAG AGC CAG GAG TTC CTG GCC 530 Leu Arg Asn Pro Glu Phe Asn Lys Lys Glu Ser Gln Glu Phe Leu Ala 980 985 990 995 AAG CCC AGC AAG ATC AAC CTG TTC ACC CAG CAG ATG AAG CGC GAG ATC 578 Lys Pro Ser Lys Ile Asn Leu Phe Thr Gln Gln Met Lys Arg Glu Ile 1000 1005 1010 GAC GAG GAC ACC GAC ACC GAC GGC GAC AGC ATC CCC GAC CTG TGG GAG 626 Asp Glu Asp Thr Asp Thr Asp Gly Asp Ser Ile Pro Asp Leu Trp Glu 1015 1020 1025 GAG AAC GGC TAC ACC ATC CAG AAC CGC ATC GCC GTG AAG TGG GAC GAC 674 Glu Asn Gly Tyr Thr Ile Gln Asn Arg Ile Ala Val Lys Trp Asp Asp 1030 1035 1040 AGC CTG GCT AGC AAG GGC TAC ACC AAG TTC GTG AGC AAC CCC CTG GAG 722 Ser Leu Ala Ser Lys Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Glu 1045 1050 1055 AGC CAC ACC GTG GGC GAC CCC TAC ACC GAC TAC GAG AAG GCC GCC CGC 770 Ser His Thr Val Gly Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg 1060 1065 1070 1075 GAC CTG GAC CTG AGC AAC GCC AAG GAG ACC TTC AAC CCC CTG GTG GCC 818 Asp Leu Asp Leu Ser Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala 1080 1085 1090 GCC TTC CCC AGC GTG AAC GTG AGC ATG GAG AAG GTG ATC CTG AGC CCC 866 Ala Phe Pro Ser Val Asn Val Ser Met Glu Lys Val Ile Leu Ser Pro 1095 1100 1105 AAC GAG AAC CTG AGC AAC AGC GTG GAG AGC CAC TCG AGC ACC AAC TGG 914 Asn Glu Asn Leu Ser Asn Ser Val Glu Ser His Ser Ser Thr Asn Trp 1110 1115 1120 AGC TAC ACC AAC ACC GAG GGC GCC AGC GTG GAG GCC GGC ATC GGT CCC 962 Ser Tyr Thr Asn Thr Glu Gly Ala Ser Val Glu Ala Gly Ile Gly Pro 1125 1130 1135 AAG GGC ATC AGC TTC GGC GTG AGC GTG AAC TAC CAG CAC AGC GAG ACC 1010 Lys Gly Ile Ser Phe Gly Val Ser Val Asn Tyr Gln His Ser Glu Thr 1140 1145 1150 1155 GTG GCC CAG GAG TGG GGC ACC AGC ACC GGC AAC ACC AGC CAG TTC AAC 1058 Val Ala Gln Glu Trp Gly Thr Ser Thr Gly Asn Thr Ser Gln Phe Asn 1160 1165 1170 ACC GCC AGC GCC GGC TAC CTG AAC GCC AAC GTG CGC TAC AAC AAC GTG 1106 Thr Ala Ser Ala Gly Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val 1175 1180 1185 GGC ACC GGC GCC ATC TAC GAC GTG AAG CCC ACC ACC AGC TTC GTG CTG 1154 Gly Thr Gly Ala Ile Tyr Asp Val Lys Pro Thr Thr Ser Phe Val Leu 1190 1195 1200 AAC AAC GAC ACC ATC GCC ACC ATC ACC GCC AAG TCG AAT TCC ACC GCC 1202 Asn Asn Asp Thr Ile Ala Thr Ile Thr Ala Lys Ser Asn Ser Thr Ala 1205 1210 1215 CTG AAC ATC AGC CCC GGC GAG AGC TAC CCC AAG AAG GGC CAG AAC GGC 1250 Leu Asn Ile Ser Pro Gly Glu Ser Tyr Pro Lys Lys Gly Gln Asn Gly 1220 1225 1230 1235 ATC GCC ATC ACC AGC ATG GAC GAC TTC AAC AGC CAC CCC ATC ACC CTG 1298 Ile Ala Ile Thr Ser Met Asp Asp Phe Asn Ser His Pro Ile Thr Leu 1240 1245 1250 AAC AAG AAG CAG GTG GAC AAC CTG CTG AAC AAC AAG CCC ATG ATG CTG 1346 Asn Lys Lys Gln Val Asp Asn Leu Leu Asn Asn Lys Pro Met Met Leu 1255 1260 1265 GAG ACC AAC CAG ACC GAC GGC GTC TAC AAG ATC AAG GAC ACC CAC GGC 1394 Glu Thr Asn Gln Thr Asp Gly Val Tyr Lys Ile Lys Asp Thr His Gly 1270 1275 1280 AAC ATC GTG ACG GGC GGC GAG TGG AAC GGC GTG ATC CAG CAG ATC AAG 1442 Asn Ile Val Thr Gly Gly Glu Trp Asn Gly Val Ile Gln Gln Ile Lys 1285 1290 1295 GCC AAG ACC GCC AGC ATC ATC GTC GAC GAC GGC GAG CGC GTG GCC GAG 1490 Ala Lys Thr Ala Ser Ile Ile Val Asp Asp Gly Glu Arg Val Ala Glu 1300 1305 1310 1315 AAG CGC GTG GCC GCC AAG GAC TAC GAG AAC CCC GAG GAC AAG ACC CCC 1538 Lys Arg Val Ala Ala Lys Asp Tyr Glu Asn Pro Glu Asp Lys Thr Pro 1320 1325 1330 AGC CTG ACC CTG AAG GAC GCC CTG AAG CTG AGC TAC CCC GAC GAG ATC 1586 Ser Leu Thr Leu Lys Asp Ala Leu Lys Leu Ser Tyr Pro Asp Glu Ile 1335 1340 1345 AAG GAG ATC GAG GGC TTG CTG TAC TAC AAG AAC AAG CCC ATC TAC GAG 1634 Lys Glu Ile Glu Gly Leu Leu Tyr Tyr Lys Asn Lys Pro Ile Tyr Glu 1350 1355 1360 AGC AGC GTG ATG ACC TAT CTA GAC GAG AAC ACC GCC AAG GAG GTG ACC 1682 Ser Ser Val Met Thr Tyr Leu Asp Glu Asn Thr Ala Lys Glu Val Thr 1365 1370 1375 AAG CAG CTG AAC GAC ACC ACC GGC AAG TTC AAG GAC GTG AGC CAC CTG 1730 Lys Gln Leu Asn Asp Thr Thr Gly Lys Phe Lys Asp Val Ser His Leu 1380 1385 1390 1395 TAC GAC GTG AAG CTG ACC CCC AAG ATG AAC GTG ACC ATC AAG CTG AGC 1778 Tyr Asp Val Lys Leu Thr Pro Lys Met Asn Val Thr Ile Lys Leu Ser 1400 1405 1410 ATC CTG TAC GAC AAC GCC GAG AGC AAC GAC AAC AGC ATC GGC AAG TGG 1826 Ile Leu Tyr Asp Asn Ala Glu Ser Asn Asp Asn Ser Ile Gly Lys Trp 1415 1420 1425 ACC AAC ACC AAC ATC GTG AGC GGC GGC AAC AAC GGC AAG AAG CAG TAC 1874 Thr Asn Thr Asn Ile Val Ser Gly Gly Asn Asn Gly Lys Lys Gln Tyr 1430 1435 1440 AGC AGC AAC AAC CCC GAC GCC AAC CTG ACC CTG AAC ACC GAC GCC CAG 1922 Ser Ser Asn Asn Pro Asp Ala Asn Leu Thr Leu Asn Thr Asp Ala Gln 1445 1450 1455 GAG AAG CTG AAC AAG AAC CGC GAC TAC TAC ATC AGC CTG TAC ATG AAG 1970 Glu Lys Leu Asn Lys Asn Arg Asp Tyr Tyr Ile Ser Leu Tyr Met Lys 1460 1465 1470 1475 AGC GAG AAG AAC ACC CAG TGC GAG ATC ACC ATC GAC GGC GAG ATA TAC 2018 Ser Glu Lys Asn Thr Gln Cys Glu Ile Thr Ile Asp Gly Glu Ile Tyr 1480 1485 1490 CCC ATC ACC ACC AAG ACC GTG AAC GTG AAC AAG GAC AAC TAC AAG CGC 2066 Pro Ile Thr Thr Lys Thr Val Asn Val Asn Lys Asp Asn Tyr Lys Arg 1495 1500 1505 CTG GAC ATC ATC GCC CAC AAC ATC AAG AGC AAC CCC ATC AGC AGC CTG 2114 Leu Asp Ile Ile Ala His Asn Ile Lys Ser Asn Pro Ile Ser Ser Leu 1510 1515 1520 CAC ATC AAG ACC AAC GAC GAG ATC ACC CTG TTC TGG GAC GAC ATA TCG 2162 His Ile Lys Thr Asn Asp Glu Ile Thr Leu Phe Trp Asp Asp Ile Ser 1525 1530 1535 ATT ACC GAC GTC GCC AGC ATC AAG CCC GAG AAC CTG ACC GAC AGC GAG 2210 Ile Thr Asp Val Ala Ser Ile Lys Pro Glu Asn Leu Thr Asp Ser Glu 1540 1545 1550 1555 ATC AAG CAG ATA TAC AGT CGC TAC GGC ATC AAG CTG GAG GAC GGC ATC 2258 Ile Lys Gln Ile Tyr Ser Arg Tyr Gly Ile Lys Leu Glu Asp Gly Ile 1560 1565 1570 CTG ATC GAC AAG AAA GGC GGC ATC CAC TAC GGC GAG TTC ATC AAC GAG 2306 Leu Ile Asp Lys Lys Gly Gly Ile His Tyr Gly Glu Phe Ile Asn Glu 1575 1580 1585 GCC AGC TTC AAC ATC GAG CCC CTG CAG AAC TAC GTG ACC AAG TAC GAG 2354 Ala Ser Phe Asn Ile Glu Pro Leu Gln Asn Tyr Val Thr Lys Tyr Glu 1590 1595 1600 GTG ACC TAC AGC AGC GAG CTG GGC CCC AAC GTG AGC GAC ACC CTG GAG 2402 Val Thr Tyr Ser Ser Glu Leu Gly Pro Asn Val Ser Asp Thr Leu Glu 1605 1610 1615 AGC GAC AAG ATT TAC AAG GAC GGC ACC ATC AAG TTC GAC TTC ACC AAG 2450 Ser Asp Lys Ile Tyr Lys Asp Gly Thr Ile Lys Phe Asp Phe Thr Lys 1620 1625 1630 1635 TAC AGC AAG AAC GAG CAG GGC CTG TTC TAC GAC AGC GGC CTG AAC TGG 2498 Tyr Ser Lys Asn Glu Gln Gly Leu Phe Tyr Asp Ser Gly Leu Asn Trp 1640 1645 1650 GAC TTC AAG ATC AAC GCC ATC ACC TAC GAC GGC AAG GAG ATG AAC GTG 2546 Asp Phe Lys Ile Asn Ala Ile Thr Tyr Asp Gly Lys Glu Met Asn Val 1655 1660 1665 TTC CAC CGC TAC AAC AAG TAGATCTGAG CT 2576 Phe His Arg Tyr Asn Lys 1670 (2)SEQ ID NO:36信息: (i)序列特征: (A)长度:852个氨基酸 (B)类型:氨基酸 (D)拓扑结构:线性 (ii)分子类型:蛋白质 (xi)序列描述:SEQ ID NO:36: Met Lys Thr Asn Gln Ile Ser Thr Thr Gln Lys Asn Gln Gln Lys Glu 1 5 10 15 Met Asp Arg Lys Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys Asp Phe 20 25 30 Ser Asn Leu Thr Met Phe Ala Pro Thr Arg Asp Ser Thr Leu Ile Tyr 35 40 45 Asp Gln Gln Thr Ala Asn Lys Leu Leu Asp Lys Lys Gln Gln Glu Tyr 50 55 60 Gln Ser Ile Arg Trp Ile Gly Leu Ile Gln Ser Lys Glu Thr Gly Asp 65 70 75 80 Phe Thr Phe Asn Leu Ser Glu Asp Glu Gln Ala Ile Ile Glu Ile Asn 85 90 95 Gly Lys Ile Ile Ser Asn Lys Gly Lys Glu Lys Gln Val Val His Leu 100 105 110 Glu Lys Gly Lys Leu Val Pro Ile Lys Ile Glu Tyr Gln Ser Asp Thr 115 120 125 Lys Phe Asn Ile Asp Ser Lys Thr Phe Lys Glu Leu Lys Leu Phe Lys 130 135 140 Ile Asp Ser Gln Asn Gln Pro Gln Gln Val Gln Gln Asp Glu Leu Arg 145 150 155 160 Asn Pro Glu Phe Asn Lys Lys Glu Ser Gln Glu Phe Leu Ala Lys Pro 165 170 175 Ser Lys Ile Asn Leu Phe Thr Gln Gln Met Lys Arg Glu Ile Asp Glu 180 185 190 Asp Thr Asp Thr Asp Gly Asp Ser Ile Pro Asp Leu Trp Glu Glu Asn 195 200 205 Gly Tyr Thr Ile Gln Asn Arg Ile Ala Val Lys Trp Asp Asp Ser Leu 210 215 220 Ala Ser Lys Gly Tyr Thr Lys Phe Val Ser Asn Pro Leu Glu Ser His 225 230 235 240 Thr Val Gly Asp Pro Tyr Thr Asp Tyr Glu Lys Ala Ala Arg Asp Leu 245 250 255 Asp Leu Ser Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala Phe 260 265 270 Pro Ser Val Asn Val Ser Met Glu Lys Val Ile Leu Ser Pro Asn Glu 275 280 285 Asn Leu Ser Asn Ser Val Glu Ser His Ser Ser Thr Asn Trp Ser Tyr 290 295 300 Thr Asn Thr Glu Gly Ala Ser Val Glu Ala Gly Ile Gly Pro Lys Gly 305 310 315 320 Ile Ser Phe Gly Val Ser Val Asn Tyr Gln His Ser Glu Thr Val Ala 325 330 335 Gln Glu Trp Gly Thr Ser Thr Gly Asn Thr Ser Gln Phe Asn Thr Ala 340 345 350 Ser Ala Gly Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val Gly Thr 355 360 365 Gly Ala Ile Tyr Asp Val Lys Pro Thr Thr Ser Phe Val Leu Asn Asn 370 375 380 Asp Thr Ile Ala Thr Ile Thr Ala Lys Ser Asn Ser Thr Ala Leu Asn 385 390 395 400 Ile Ser Pro Gly Glu Ser Tyr Pro Lys Lys Gly Gln Asn Gly Ile Ala 405 410 415 Ile Thr Ser Met Asp Asp Phe Asn Ser His Pro Ile Thr Leu Asn Lys 420 425 430 Lys Gln Val Asp Asn Leu Leu Asn Asn Lys Pro Met Met Leu Glu Thr 435 440 445 Asn Gln Thr Asp Gly Val Tyr Lys Ile Lys Asp Thr His Gly Asn Ile 450 455 460 Val Thr Gly Gly Glu Trp Asn Gly Val Ile Gln Gln Ile Lys Ala Lys 465 470 475 480 Thr Ala Ser Ile Ile Val Asp Asp Gly Glu Arg Val Ala Glu Lys Arg 485 490 495 Val Ala Ala Lys Asp Tyr Glu Asn Pro Glu Asp Lys Thr Pro Ser Leu 500 505 510 Thr Leu Lys Asp Ala Leu Lys Leu Ser Tyr Pro Asp Glu Ile Lys Glu 515 520 525 Ile Glu Gly Leu Leu Tyr Tyr Lys Asn Lys Pro Ile Tyr Glu Ser Ser 530 535 540 Val Met Thr Tyr Leu Asp Glu Asn Thr Ala Lys Glu Val Thr Lys Gln 545 550 555 560 Leu Asn Asp Thr Thr Gly Lys Phe Lys Asp Val Ser His Leu Tyr Asp 565 570 575 Val Lys Leu Thr Pro Lys Met Asn Val Thr Ile Lys Leu Ser Ile Leu 580 585 590 Tyr Asp Asn Ala Glu Ser Asn Asp Asn Ser Ile Gly Lys Trp Thr Asn 595 600 605 Thr Asn Ile Val Ser Gly Gly Asn Asn Gly Lys Lys Gln Tyr Ser Ser 610 615 620 Asn Asn Pro Asp Ala Asn Leu Thr Leu Asn Thr Asp Ala Gln Glu Lys 625 630 635 640 Leu Asn Lys Asn Arg Asp Tyr Tyr Ile Ser Leu Tyr Met Lys Ser Glu 645 650 655 Lys Asn Thr Gln Cys Glu Ile Thr Ile Asp Gly Glu Ile Tyr Pro Ile 660 665 670 Thr Thr Lys Thr Val Asn Val Asn Lys Asp Asn Tyr Lys Arg Leu Asp 675 680 685 Ile Ile Ala His Asn Ile Lys Ser Asn Pro Ile Ser Ser Leu His Ile 690 695 700 Lys Thr Asn Asp Glu Ile Thr Leu Phe Trp Asp Asp Ile Ser Ile Thr 705 710 715 720 Asp Val Ala Ser Ile Lys Pro Glu Asn Leu Thr Asp Ser Glu Ile Lys 725 730 735 Gln Ile Tyr Ser Arg Tyr Gly Ile Lys Leu Glu Asp Gly Ile Leu Ile 740 745 750 Asp Lys Lys Gly Gly Ile His Tyr Gly Glu Phe Ile Asn Glu Ala Ser 755 760 765 Phe Asn Ile Glu Pro Leu Gln Asn Tyr Val Thr Lys Tyr Glu Val Thr 770 775 780 Tyr Ser Ser Glu Leu Gly Pro Asn Val Ser Asp Thr Leu Glu Ser Asp 785 790 795 800 Lys Ile Tyr Lys Asp Gly Thr Ile Lys Phe Asp Phe Thr Lys Tyr Ser 805 810 815 Lys Asn Glu Gln Gly Leu Phe Tyr Asp Ser Gly Leu Asn Trp Asp Phe 820 825 830 Lys Ile Asn Ala Ile Thr Tyr Asp Gly Lys Glu Met Asn Val Phe His 835 840 845 Arg Tyr Ash Lys 850 (2)SEQ ID NO:37信息: (i)序列特征: (A)长度:32个碱基对 (B)类型:核酸 (C)链型:单链 (D)拓扑结构:线性 (ii)分子类型:其它核酸 (A)描述:/desc=“用于制备pCIB5527的正向引物” (iii)假设:否 (xi)序列描述:SEQ ID N0:37: GGATCCACA TACTGCAGAA CCTGAAGATC AC (2)SEQ ID NO:38信息: (i)序列特征: (A)长度:18个碱基对 (B)类型:核酸 (C)链型:单链 (D)拓扑结构:线性 (ii)分子类型:其它核酸 (A)描述:/desc=“用于制备pCIB5527的反向引物” (iii)假设:否 (xi)序列描述:SEQ ID NO:38: AAGCTTCCAC TCCTTCTC (2)SEQ ID NO:39信息: (i)序列特征: (A)长度:1241个碱基对 (B)类型:核酸 (C)链型:单链 (D)拓扑结构:线性 (ii)分子类型:其它核酸 (A)描述:/desc=“合成DNA” (iii)假设:否 (ix)特征: (A)名称/关键词:CDS (B)位置:9..1238 (D)其它信息:/注=″包含在pCIB5527中的玉米优化的编码除 去了芽孢杆菌属分泌信号的VIP2A(a)的序列″ (xi)序列描述:SEQ ID NO:39: GATCCACC ATG CTG CAG AAC CTG AAG ATC ACC GAC AAG GTG GAG GAC TTC 50 Met Leu Gln Asn Leu Lys Ile Thr Asp Lys Val Glu Asp Phe 855 860 865 AAG GAG GAC AAG GAG AAG GCC AAG GAG TGG GGC AAG GAG AAG GAG AAG 98 Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys Glu Lys 870 875 880 GAG TGG AAG CTT ACC GCC ACC GAG AAG GGC AAG ATG AAC AAC TTC CTG 146 Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn Asn Phe Leu 885 890 895 GAC AAC AAG AAC GAC ATC AAG ACC AAC TAC AAG GAG ATC ACC TTC AGC 194 Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr Phe Ser 900 905 910 ATA GCC GGC AGC TTC GAG GAC GAG ATC AAG GAC CTG AAG GAG ATC GAC 242 Ile Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu Ile Asp 915 920 925 930 AAG ATG TTC GAC AAG ACC AAC CTG AGC AAC AGC ATC ATC ACC TAC AAG 290 Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile Thr Tyr Lys 935 940 945 AAC GTG GAG CCC ACC ACC ATC GGC TTC AAC AAG AGC CTG ACC GAG GGC 338 Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu Thr Glu Gly 950 955 960 AAC ACC ATC AAC AGC GAC GCC ATG GCC CAG TTC AAG GAG CAG TTC CTG 386 Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln Phe Leu 965 970 975 GAC CGC GAC ATC AAG TTC GAC AGC TAC CTG GAC ACC CAC CTG ACC GCC 434 Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu Thr Ala 980 985 990 CAG CAG GTG AGC AGC AAG GAG CGC GTG ATC CTG AAG GTG ACC GTC CCC 482 Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val Thr Val Pro 995 1000 1005 1010 AGC GGC AAG GGC AGC ACC ACC CCC ACC AAG GCC GGC GTG ATC CTG AAC 530 Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile Leu Asn 1015 1020 1025 AAC AGC GAG TAC AAG ATG CTG ATC GAC AAC GGC TAC ATG GTG CAC GTG 578 Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Met Val His Val 1030 1035 1040 GAC AAG GTG AGC AAG GTG GTG AAG AAG GGC GTG GAG TGC CTC CAG ATC 626 Asp Lys Val Ser Lys Val Val Lys Lys Gly Val Glu Cys Leu Gln Ile 1045 1050 1055 GAG GGC ACC CTG AAG AAG AGT CTA GAC TTC AAG AAC GAC ATC AAC GCC 674 Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile Asn Ala 1060 1065 1070 GAG GCC CAC AGC TGG GGC ATG AAG AAC TAC GAG GAG TGG GCC AAG GAC 722 Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp Ala Lys Asp 1075 1080 1085 1090 CTG ACC GAC AGC CAG CGC GAG GCC CTG GAC GGC TAC GCC CGC CAG GAC 770 Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg Gln Asp 1095 1100 1105 TAC AAG GAG ATC AAC AAC TAC CTG CGC AAC CAG GGC GGC AGC GGC AAC 818 Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser Gly Asn 1110 1115 1120 GAG AAG CTG GAC GCC CAG ATC AAG AAC ATC AGC GAC GCC CTG GGC AAG 866 Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala Leu Gly Lys 1125 1130 1135 AAG CCC ATC CCC GAG AAC ATC ACC GTG TAC CGC TGG TGC GGC ATG CCC 914 Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly Met Pro 1140 1145 1150 GAG TTC GGC TAC CAG ATC AGC GAC CCC CTG CCC AGC CTG AAG GAC TTC 962 Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys Asp Phe 1155 1160 1165 1170 GAG GAG CAG TTC CTG AAC ACC ATC AAG GAG GAC AAG GGC TAC ATG AGC 1010 Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr Met Ser 1175 1180 1185 ACC AGC CTG AGC AGC GAG CGC CTG GCC GCC TTC GGC AGC CGC AAG ATC 1058 Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg Lys Ile 1190 1195 1200 ATC CTG CGC CTG CAG GTG CCC AAG GGC AGC ACT GGT GCC TAC CTG AGC 1106 Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr Leu Ser 1205 1210 1215 GCC ATC GGC GGC TTC GCC AGC GAG AAG GAG ATC CTG CTG GAT AAG GAC 1154 Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp Lys Asp 1220 1225 1230 AGC AAG TAC CAC ATC GAC AAG GTG ACC GAG GTG ATC ATC AAG GGC GTG 1202 Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile Lys Gly Val 1235 1240 1245 1250 AAG CGC TAC GTG GTG GAC GCC ACC CTG CTG ACC AAC TAG 1241 Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn 1255 1260 (2)SEQ ID NO:40信息: (i)序列特征: (A)长度:410个氨基酸 (B)类型:氨基酸 (D)拓扑结构:线性 (ii)分子类型:蛋白质 (xi)序列描述:SEQ ID NO:40: Met Leu Gln Asn Leu Lys Ile Thr Asp Lys Val Glu Asp Phe Lys Glu 1 5 10 15 Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys Glu Lys Glu Trp 20 25 30 Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn Asn Phe Leu Asp Asn 35 40 45 Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr Phe Ser Ile Ala 50 55 60 Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu Ile Asp Lys Met 65 70 75 80 Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile Thr Tyr Lys Asn Val 85 90 95 Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu Thr Glu Gly Asn Thr 100 105 110 Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln Phe Leu Asp Arg 115 120 125 Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu Thr Ala Gln Gln 130 135 140 Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val Thr Val Pro Ser Gly 145 150 155 160 Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile Leu Asn Asn Ser 165 170 175 Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Met Val His Val Asp Lys 180 185 190 Val Ser Lys Val Val Lys Lys Gly Val Glu Cys Leu Gln Ile Glu Gly 195 200 205 Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile Asn Ala Glu Ala 210 215 220 His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp Ala Lys Asp Leu Thr 225 230 235 240 Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg Gln Asp Tyr Lys 245 250 255 Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser Gly Asn Glu Lys 260 265 270 Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala Leu Gly Lys Lys Pro 275 280 285 Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly Met Pro Glu Phe 290 295 300 Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys Asp Phe Glu Glu 305 310 315 320 Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr Met Ser Thr Ser 325 330 335 Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg Lys Ile Ile Leu 340 345 350 Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr Leu Ser Ala Ile 355 360 365 Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp Lys Asp Ser Lys 370 375 380 Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile Lys Gly Val Lys Arg 385 390 395 400 Tyr Val Val Asp Ala Thr Leu Leu Thr Asn 405 410 (2)SEQ ID NO:41信息: (i)序列特征: (A)长度:72个碱基对 (B)类型:核酸 (C)链型:单链 (D)拓扑结构: 线性 (ii)分子类型:其它核酸 (A)描述:/desc=“用于构建pCIB5527的编码真核生物分泌信号的寡 核苷酸” (iii)假设:否 (xi)序列描述:SEQ ID NO:41: GGATCCACCA TGGGCTGGAG CTGGATCTTC CTGTTCCTGC TGAGCGGGCGC CGCGGGCGTG 60 CACTGCCTGC AG 72 (2)SEQ ID NO:42信息: (i)序列特征: (A)长度:1421个碱基对 (B)类型:核酸 (C)链型:单链 (D)拓扑结构:线性 (ii)分子类型:其它核酸 (A)描述:/desc=“合成DNA” (iii)假设:否 (ix)特征: (A)名称/关键词:CDS (B)位置:9..1238 (D)其它信息:/注=″包含在pCIB5528中的玉米优化的编码除 去了芽孢杆菌属分泌信号并插入了真核生物分泌信号的VIP2A(a)的DNA 序列″ (xi)序列描述:SEQ ID NO:42: GATCCACC ATG CTG CAG AAC CTG AAG ATC ACC GAC AAG GTG GAG GAC TTC 50 Met Leu Gln Asn Leu Lys Ile Thr Asp Lys Val Glu Asp Phe 415 420 AAG GAG GAC AAG GAG AAG GCC AAG GAG TGG GGC AAG GAG AAG GAG AAG 98 Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys Glu Lys 425 430 435 440 GAG TGG AAG CTT ACC GCC ACC GAG AAG GGC AAG ATG AAC AAC TTC CTG 146 Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn Asn Phe Leu 445 450 455 GAC AAC AAG AAC GAC ATC AAG ACC AAC TAC AAG GAG ATC ACC TTC AGC 194 Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr Phe Ser 460 465 470 ATA GCC GGC AGC TTC GAG GAC GAG ATC AAG GAC CTG AAG GAG ATC GAC 242 Ile Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu Ile Asp 475 480 485 AAG ATG TTC GAC AAG ACC AAC CTG AGC AAC AGC ATC ATC ACC TAC AAG 290 Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile Thr Tyr Lys 490 495 500 AAC GTG GAG CCC ACC ACC ATC GGC TTC AAC AAG AGC CTG ACC GAG GGC 338 Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu Thr Glu Gly 505 510 515 520 AAC ACC ATC AAC AGC GAC GCC ATG GCC CAG TTC AAG GAG CAG TTC CTG 386 Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln Phe Leu 525 530 535 GAC CGC GAC ATC AAG TTC GAC AGC TAC CTG GAC ACC CAC CTG ACC GCC 434 Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu Thr Ala 540 545 550 CAG CAG GTG AGC AGC AAG GAG CGC GTG ATC CTG AAG GTG ACC GTC CCC 482 Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val Thr Val Pro 555 560 565 AGC GGC AAG GGC AGC ACC ACC CCC ACC AAG GCC GGC GTG ATC CTG AAC 530 Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile Leu Asn 570 575 580 AAC AGC GAG TAC AAG ATG CTG ATC GAC AAC GGC TAC ATG GTG CAC GTG 578 Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Met Val His Val 585 590 595 600 GAC AAG GTG AGC AAG GTG GTG AAG AAG GGC GTG GAG TGC CTC CAG ATC 626 Asp Lys Val Ser Lys Val Val Lys Lys Gly Val Glu Cys Leu Gln Ile 605 610 615 GAG GGC ACC CTG AAG AAG AGT CTA GAC TTC AAG AAC GAC ATC AAC GCC 674 Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile Asn Ala 620 625 630 GAG GCC CAC AGC TGG GGC ATG AAG AAC TAC GAG GAG TGG GCC AAG GAC 722 Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp Ala Lys Asp 635 640 645 CTG ACC GAC AGC CAG CGC GAG GCC CTG GAC GGC TAC GCC CGC CAG GAC 770 Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg Gln Asp 650 655 660 TAC AAG GAG ATC AAC AAC TAC CTG CGC AAC CAG GGC GGC AGC GGC AAC 818 Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser Gly Asn 665 670 675 680 GAG AAG CTG GAC GCC CAG ATC AAG AAC ATC AGC GAC GCC CTG GGC AAG 866 Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala Leu Gly Lys 685 690 695 AAG CCC ATC CCC GAG AAC ATC ACC GTG TAC CGC TGG TGC GGC ATG CCC 914 Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly Met Pro 700 705 710 GAG TTC GGC TAC CAG ATC AGC GAC CCC CTG CCC AGC CTG AAG GAC TTC 962 Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys Asp Phe 715 720 725 GAG GAG CAG TTC CTG AAC ACC ATC AAG GAG GAC AAG GGC TAC ATG AGC 1010 Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr Met Ser 730 735 740 ACC AGC CTG AGC AGC GAG CGC CTG GCC GCC TTC GGC AGC CGC AAG ATC 1058 Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg Lys Ile 745 750 755 760 ATC CTG CGC CTG CAG GTG CCC AAG GGC AGC ACT GGT GCC TAC CTG AGC 1106 Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr Leu Ser 765 770 775 GCC ATC GGC GGC TTC GCC AGC GAG AAG GAG ATC CTG CTG GAT AAG GAC 1154 Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp Lys Asp 780 785 790 AGC AAG TAC CAC ATC GAC AAG GTG ACC GAG GTG ATC ATC AAG GGC GTG 1202 Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile Lys Gly Val 795 800 805 AAG CGC TAC GTG GTG GAC GCC ACC CTG CTG ACC AAC TAG 1241 Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn 810 815 820 (2)SEQ ID NO:43信息: (i)序列特征: (A)长度:410个氨基酸 (B)类型:氨基酸 (D)拓扑结构:线性 (ii)分子类型:蛋白质 (xi)序列描述:SEQ ID NO:43: Met Leu Gln Asn Leu Lys Ile Thr Asp Lys Val Glu Asp Phe Lys Glu 1 5 10 15 Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys Glu Lys Glu Trp 20 25 30 Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn Asn Phe Leu Asp Asn 35 40 45 Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr Phe Ser Ile Ala 50 55 60 Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu Ile Asp Lys Met 65 70 75 80 Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile Thr Tyr Lys Asn Val 85 90 95 Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu Thr Glu Gly Asn Thr 100 105 110 Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln Phe Leu Asp Arg 115 120 125 Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu Thr Ala Gln Gln 130 135 140 Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val Thr Val Pro Ser Gly 145 150 155 160 Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile Leu Asn Asn Ser 165 170 175 Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Met Val His Val Asp Lys 180 185 190 Val Ser Lys Val Val Lys Lys Gly Val Glu Cys Leu Gln Ile Glu Gly 195 200 205 Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile Asn Ala Glu Ala 210 215 220 His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp Ala Lys Asp Leu Thr 225 230 235 240 Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg Gln Asp Tyr Lys 245 250 255 Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser Gly Asn Glu Lys 260 265 270 Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala Leu Gly Lys Lys Pro 275 280 285 Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly Met Pro Glu Phe 290 295 300 Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys Asp Phe Glu Glu 305 310 315 320 Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr Met Ser Thr Ser 325 330 335 Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg Lys Ile Ile Leu 340 345 350 Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr Leu Ser Ala Ile 355 360 365 Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp Lys Asp Ser Lys 370 375 380 Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile Lys Gly Val Lys Arg 385 390 395 400 Tyr Val Val Asp Ala Thr Leu Leu Thr Asn 405 410 (2)SEQ ID NO:44信息: (i)序列特征: (A)长度:86个碱基对 (B)类型:核酸 (C)链型:单链 (D)拓扑结构:线性 (ii)分子类型:其它核酸 (A)描述:/desc=“用于构建pCIB5533的编码液泡定位肽的寡核苷酸” (iii)假设:否 (xi)序列描述:SEQ ID NO:44: CCGCGGGCGT GCACTGCCTC AGCAGCAGCA GCTTCGCCGA CAGCAACCCC ATCCGCGTGA CCGACCGCGC CGCCAGCACC CTGCAG (2)SEQ ID NO:45信息: (i)序列特征: (A)长度:1358个碱基对 (B)类型:核酸 (C)链型:单链 (D)拓扑结构:线性 (ii)分子类型:其它核酸 (A)描述:/desc=“合成DNA” (iii)假设:否 (ix)特征: (A)名称/关键词:CDS (B)位置:9..1355 (D)其它信息:/注=″包含在pCIB5533中的玉米优化的编码除 去了芽孢杆菌属分泌信号并插入了液泡定位信号的VIP2A(a)的DNA序列 ″ (xi)序列描述:SEQ ID NO:45: GATCCACC ATG GGC TGG AGC TGG ATC TTC CTG TTC CTG CTG AGC GGC GCC 50 Met Gly Trp Ser Trp Ile Phe Leu Phe Leu Leu Ser Gly Ala 415 420 GCG GGC GTG CAC TGC CTC AGC AGC AGC AGC TTC GCC GAC AGC AAC CCC 98 Ala Gly Val His Cys Leu Ser Ser Ser Ser Phe Ala Asp Ser Asn Pro 425 430 435 440 ATC CGC GTG ACC GAC CGC GCC GCC AGC ACC CTG CAG AAC CTG AAG ATC 146 Ile Arg Val Thr Asp Arg Ala Ala Ser Thr Leu Gln Asn Leu Lys Ile 445 450 455 ACC GAC AAG GTG GAG GAC TTC AAG GAG GAG AAG GAG AAG GCC AAG GAG 194 Thr Asp Lys Val Glu Asp Phe Lys Glu Asp Lys Glu Lys Ala Lys Glu 460 465 470 TGG GGC AAG GAG AAG GAG AAG GAG TGG AAG CTT ACC GCC ACC GAG AAG 242 Trp Gly Lys Glu Lys Glu Lys Glu Trp Lys Leu Thr Ala Thr Glu Lys 475 480 485 GGC AAG ATG AAC AAC TTC CTG GAC AAC AAG AAC GAC ATC AAG ACC AAC 290 GAy Lys Met Asn Asn Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn 490 495 500 TAC AAG GAG ATC ACC TTC AGC ATA GCC GGC AGC TTC GAG GAC GAG ATC 338 Tyr Lys Glu Ile Thr Phe Ser Ile Ala Gly Ser Phe Glu Asp Glu Ile 505 510 515 520 AAG GAC CTG AAG GAG ATC GAC AAG ATG TTC GAC AAG ACC AAC CTG AGC 386 Lys Asp Leu Lys Glu Ile Asp Lys Met Phe Asp Lys Thr Asn Leu Ser 525 530 535 AAC AGC ATC ATC ACC TAC AAG AAC GTG GAG CCC ACC ACC ATC GGC TTC 434 Asn Ser Ile Ile Thr Tyr Lys Asn Val Glu Pro Thr Thr Ile Gly Phe 540 545 550 AAC AAG AGC CTG ACC GAG GGC AAC ACC ATC AAC AGC GAC GCC ATG GCC 482 Asn Lys Ser Leu Thr Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala 555 560 565 CAG TTC AAG GAG CAG TTC CTG GAC CGC GAC ATC AAG TTC GAC AGC TAC 530 Gln Phe Lys Glu Gln Phe Leu Asp Arg Asp Ile Lys Phe Asp Ser Tyr 570 575 580 CTG GAC ACC CAC CTG ACC GCC CAG CAG GTG AGC AGC AAG GAG CGC GTG 578 Leu Asp Thr His Leu Thr Ala Gln Gln Val Ser Ser Lys Glu Ara Val 585 590 595 600 ATC CTG AAG GTG ACC GTC CCC AGC GGC AAG GGC AGC ACC ACC CCC ACC 626 Ile Leu Lys Val Thr Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr 605 610 615 AAG GCC GGC GTG ATC CTG AAC AAC AGC GAG TAC AAG ATG CTG ATC GAC 674 Lys Ala Gly Val Ile Leu Asn Asn Ser Glu Tyr Lys Met Leu Ile Asp 620 625 630 AAC GGC TAC ATG GTG CAC GTG GAC AAG GTG AGC AAG GTG GTG AAG AAG 722 Asn Gly Tyr Met Val His Val Asp Lys Val Ser Lys Val Val Lys Lys 635 640 645 GGC GTG GAG TGC CTC CAG ATC GAG GGC ACC CTG AAG AAG AGT CTA GAC 770 Gly Val Glu Cys Leu Gln Ile Glu Gly Thr Leu Lys Lys Ser Leu Asp 650 655 660 TTC AAG AAC GAC ATC AAC GCC GAG GCC CAC AGC TGG GGC ATG AAG AAC 818 Phe Lys Asn Asp Ile Asn Ala Glu Ala His Ser Trp Gly Met Lys Asn 665 670 675 680 TAC GAG GAG TGG GCC AAG GAC CTG ACC GAC AGC CAG CGC GAG GCC CTG 866 Tyr Glu Glu Trp Ala Lys Asp Leu Thr Asp Ser Gln Arg Glu Ala Leu 685 690 695 GAC GGC TAC GCC CGC CAG GAC TAC AAG GAG ATC AAC AAC TAC CTG CGC 914 Asp Gly Tyr Ala Arg Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg 700 705 710 AAC CAG GGC GGC AGC GGC AAC GAG AAG CTG GAC GCC CAG ATC AAG AAC 962 Asn Gln Gly Gly Ser Gly Asn Glu Lys Leu Asp Ala Gln Ile Lys Asn 715 720 725 ATC AGC GAC GCC CTG GGC AAG AAG CCC ATC CCC GAG AAC ATC ACC GTG 1010 Ile Ser Asp Ala Leu Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val 730 735 740 TAC CGC TGG TGC GGC ATG CCC GAG TTC GGC TAC CAG ATC AGC GAC CCC 1058 Tyr Arg Trp Cys Gly Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro 745 750 755 760 CTG CCC AGC CTG AAG GAC TTC GAG GAG CAG TTC CTG AAC ACC ATC AAG 1106 Leu Pro Ser Leu Lys Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys 765 770 775 GAG GAC AAG GGC TAC ATG AGC ACC AGC CTG AGC AGC GAG CGC CTG GCC 1154 Glu Asp Lys Gly Tyr Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala 780 785 790 GCC TTC GGC AGC CGC AAG ATC ATC CTG CGC CTG CAG GTG CCC AAG GGC 1202 Ala Phe Gly Ser Arg Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly 795 800 805 AGC ACT GGT GCC TAC CTG AGC GCC ATC GGC GGC TTC GCC AGC GAG AAG 1250 Ser Thr Gly Ala Tyr Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys 810 815 820 GAG ATC CTG CTG GAT AAG GAC AGC AAG TAC CAC ATC GAC AAG GTG ACC 1298 Glu Ile Leu Leu Asp Lys Asp Ser Lys Tyr His Ile Asp Lys Val Thr 825 830 835 840 GAG GTG ATC ATC AAG GGC GTG AAG CGC TAC GTG GTG GAC GCC ACC CTG 1346 Glu Val Ile Ile Lys Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu 845 850 855 CTG ACC AAC TAG 1358 Leu Thr Asn (2)SEQ ID NO:46信息: (i)序列特征: (A)长度:449个氨基酸 (B)类型:氨基酸 (D)拓扑结构:线性 (ii)分子类型:蛋白质 (xi)序列描述:SEQ ID NO:46: Met Gly Trp Ser Trp Ile Phe Leu Phe Leu Leu Ser Gly Ala Ala Gly 1 5 10 15 Val His Cys Leu Ser Ser Ser Ser Phe Ala Asp Ser Asn Pro Ile Arg 20 25 30 Val Thr Asp Arg Ala Ala Ser Thr Leu Gln Asn Leu Lys Ile Thr Asp 35 40 45 Lys Val Glu Asp Phe Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly 50 55 60 Lys Glu Lys Glu Lys Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys 65 70 75 80 Met Asn Asn Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys 85 90 95 Glu Ile Thr Phe Ser Ile Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp 100 105 110 Leu Lys Glu Ile Asp Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser 115 120 125 Ile Ile Thr Tyr Lys Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys 130 135 140 Ser Leu Thr Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe 145 150 155 160 Lys Glu Gln Phe Leu Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp 165 170 175 Thr His Leu Thr Ala Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu 180 185 190 Lys Val Thr Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala 195 200 205 Gly Val Ile Leu Asn Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly 210 215 220 Tyr Met Val His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Val 225 230 235 240 Glu Cys Leu Gln Ile Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys 245 250 255 Asn Asp Ile Asn Ala Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu 260 265 270 Glu Trp Ala Lys Asp Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp Gly 275 280 285 Tyr Ala Arg Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln 290 295 300 Gly Gly Ser Gly Asn Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser 305 310 315 320 Asp Ala Leu Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg 325 330 335 Trp Cys Gly Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro 340 345 350 Ser Leu Lys Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp 355 360 365 Lys Gly Tyr Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe 370 375 380 Gly Ser Arg Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr 385 390 395 400 Gly Ala Tyr Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile 405 410 415 Leu Leu Asp Lys Asp Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val 420 425 430 Ile Ile Lys Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr 435 440 445 Asn (2)SEQ ID NO:47信息: (i)序列特征: (A)长度:16个氨基酸 (B)类型:氨基酸 (D)拓扑结构:线性 (ii)分子类型:肽 (iii)假设:否 (ix)特征: (A)名称/关键词:肽 (B)位置:1..16 (D)其它信息:/注=″用于构建pCIB的融合VIP1(a)和 VIP2A(a)d接头肽″ (xi)序列描述:SEQ ID NO:47: Pro Ser Thr Pro Pro Thr Pro Ser Pro Ser Thr Pro Pro Thr Pro Ser 1 5 10 15 (2)SEQ ID NO:48信息: (i)序列特征: (A)长度:66个碱基对 (B)类型:核酸 (C)链型:单链 (D)拓扑结构:线性 (ii)分子类型:其它核酸 (A)描述:/desc=“编码用于构建pCIB5533的接头肽之DNA序列” (iii)假设:否 (xi)序列描述:SEQ ID NO:48: CCCGGGCCTT CTACTCCCCC AACTCCCTCT CCTAGCACGC CTCCGACACC TAGCGATATC 60 GGATCC 66 (2)SEQ ID NO:49信息: (i)序列特征: (A)长度:4031个碱基对 (B)类型:核酸 (C)链型:单链 (D)拓扑结构:线性 (ii)分子类型:其它核酸 (A)描述:/desc=“合成DNA” (iii)假设:否 (ix)特征: (A)名称/关键词:CDS (B)位置:6..4019 (D)其它信息:/注=″包含在pCIB5531中的玉米优化的编码 VIP2A(a)-VIP1A(a)融合蛋白质的DNA序列″ (xi)序列描述:SEQ ID NO:49: GATCC ATG AAG CGC ATG GAG GGC AAG CTG TTC ATG GTG AGC AAG AAG 47 Met Lys Arg Met Glu Gly Lys Leu Phe Met Val Ser Lys Lys 450 455 460 CTC CAG GTG GTG ACC AAG ACC GTG CTG CTG AGC ACC GTG TTC AGC ATC 95 Leu Gln Val Val Thr Lys Thr Val Leu Leu Ser Thr Val Phe Ser Ile 465 470 475 AGC CTG CTG AAC AAC GAG GTG ATC AAG GCC GAG CAG CTG AAC ATC AAC 143 Ser Leu Leu Asn Asn Glu Val Ile Lys Ala Glu Gln Leu Asn Ile Asn 480 485 490 495 AGC CAG AGC AAG TAC ACC AAC CTC CAG AAC CTG AAG ATC ACC GAC AAG 191 Ser Gln Ser Lys Tyr Thr Asn Leu Gln Asn Leu Lys Ile Thr Asp Lys 500 505 510 GTG GAG GAC TTC AAG GAG GAC AAG GAG AAG GCC AAG GAG TGG GGC AAG 239 Val Glu Asp Phe Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys 515 520 525 GAG AAG GAG AAG GAG TGG AAG CTT ACC GCC ACC GAG AAG GGC AAG ATG 287 Glu Lys Glu Lys Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys Met 530 535 540 AAC AAC TTC CTG GAC AAC AAG AAC GAC ATC AAG ACC AAC TAC AAG GAG 335 Asn Asn Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu 545 550 555 ATC ACC TTC AGC ATA GCC GGC AGC TTC GAG GAC GAG ATC AAG GAC CTG 383 Ile Thr Phe Ser Ile Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu 560 565 570 575 AAG GAG ATC GAC AAG ATG TTC GAC AAG ACC AAC CTG AGC AAC AGC ATC 431 Lys Glu Ile Asp Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile 580 585 590 ATC ACC TAC AAG AAC GTG GAG CCC ACC ACC ATC GGC TTC AAC AAG AGC 479 Ile Thr Tyr Lys Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser 595 600 605 CTG ACC GAG GGC AAC ACC ATC AAC AGC GAC GCC ATG GCC CAG TTC AAG 527 Leu Thr Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys 610 615 620 GAG CAG TTC CTG GAC CGC GAC ATC AAG TTC GAC AGC TAC CTG GAC ACC 575 Glu Gln Phe Leu Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr 625 630 635 CAC CTG ACC GCC CAG CAG GTG AGC AGC AAG GAG CGC GTG ATC CTG AAG 623 His Leu Thr Ala Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu Lys 640 645 650 655 GTG ACC GTC CCC AGC GGC AAG GGC AGC ACC ACC CCC ACC AAG GCC GGC 671 Val Thr Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly 660 665 670 GTG ATC CTG AAC AAC AGC GAG TAC AAG ATG CTG ATC GAC AAC GGC TAC 719 Val Ile Leu Asn Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr 675 680 685 ATG GTG CAC GTG GAC AAG GTG AGC AAG GTG GTG AAG AAG GGC GTG GAG 767 Met Val His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Val Glu 690 695 700 TGC CTC CAG ATC GAG GGC ACC CTG AAG AAG AGT CTA GAC TTC AAG AAC 815 Cys Leu Gln Ile Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn 705 710 715 GAC ATC AAC GCC GAG GCC CAC AGC TGG GGC ATG AAG AAC TAC GAG GAG 863 Asp Ile Asn Ala Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu Glu 720 725 730 735 TGG GCC AAG GAC CTG ACC GAC AGC CAG CGC GAG GCC CTG GAC GGC TAC 911 Trp Ala Lys Asp Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr 740 745 750 GCC CGC CAG GAC TAC AAG GAG ATC AAC AAC TAC CTG CGC AAC CAG GGC 959 Ala Arg Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly 755 760 765 GGC AGC GGC AAC GAG AAG CTG GAC GCC CAG ATC AAG AAC ATC AGC GAC 1007 Gly Ser Gly Asn Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp 770 775 780 GCC CTG GGC AAG AAG CCC ATC CCC GAG AAC ATC ACC GTG TAC CGC TGG 1055 Ala Leu Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp 785 790 795 TGC GGC ATG CCC GAG TTC GGC TAC CAG ATC AGC GAC CCC CTG CCC AGC 1103 Cys Gly Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser 800 805 810 815 CTG AAG GAC TTC GAG GAG CAG TTC CTG AAC ACC ATC AAG GAG GAC AAG 1151 Leu Lys Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys 820 825 830 GGC TAC ATG AGC ACC AGC CTG AGC AGC GAG CGC CTG GCC GCC TTC GGC 1199 Gly Tyr Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly 835 840 845 AGC CGC AAG ATC ATC CTG CGC CTG CAG GTG CCC AAG GGC AGC ACT GGT 1247 Ser Arg Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly 850 855 860 GCC TAC CTG AGC GCC ATC GGC GGC TTC GCC AGC GAG AAG GAG ATC CTG 1295 Ala Tyr Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu 865 870 875 CTG GAT AAG GAC AGC AAG TAC CAC ATC GAC AAG GTG ACC GAG GTG ATC 1343 Leu Asp Lys Asp Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val Ile 880 885 890 895 ATC AAG GGC GTG AAG CGC TAC GTG GTG GAC GCC ACC CTG CTG ACC AAC 1391 Ile Lys Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn 900 905 910 TCC CGG GGG CCT TCT ACT CCC CCA ACT CCC TCT CCT AGC ACG CCT CCG 1439 Ser Arg Gly Pro Ser Thr Pro Pro Thr Pro Ser Pro Ser Thr Pro Pro 915 920 925 ACA CCT AGC GAT ATC GGA TCC ACC ATG AAG ACC AAC CAG ATC AGC ACC 1487 Thr Pro Ser Asp Ile Gly Ser Thr Met Lys Thr Asn Gln Ile Ser Thr 930 935 940 ACC CAG AAG AAC CAG CAG AAG GAG ATG GAC CGC AAG GGC CTG CTG GGC 1535 Thr Gln Lys Asn Gln Gln Lys Glu Met Asp Arg Lys Gly Leu Leu Gly 945 950 955 TAC TAC TTC AAG GGC AAG GAC TTC AGC AAC CTG ACC ATG TTC GCC CCC 1583 Tyr Tyr Phe Lys Gly Lys Asp Phe Ser Asn Leu Thr Met Phe Ala Pro 960 965 970 975 ACG CGT GAC AGC ACC CTG ATC TAC GAC CAG CAG ACC GCC AAC AAG CTG 1631 Thr Arg Asp Ser Thr Leu Ile Tyr Asp Gln Gln Thr Ala Asn Lys Leu 980 985 990 CTG GAC AAG AAG CAG CAG GAG TAC CAG AGC ATC CGC TGG ATC GGC CTG 1679 Leu Asp Lys Lys Gln Gln Glu Tyr Gln Ser Ile Arg Trp Ile Gly Leu 995 1000 1005 ATC CAG AGC AAG GAG ACC GGC GAC TTC ACC TTC AAC CTG AGC GAG GAC 1727 Ile Gln Ser Lys Glu Thr Gly Asp Phe Thr Phe Asn Leu Ser Glu Asp 1010 1015 1020 GAG CAG GCC ATC ATC GAG ATC AAC GGC AAG ATC ATC AGC AAC AAG GGC 1775 Glu Gln Ala Ile Ile Glu Ile Asn Gly Lys Ile Ile Ser Asn Lys Gly 1025 1030 1035 AAG GAG AAG CAG GTG GTG CAC CTG GAG AAG GGC AAG CTG GTG CCC ATC 1823 Lys Glu Lys Gln Val Val His Leu Glu Lys Gly Lys Leu Val Pro Ile 1040 1045 1050 1055 AAG ATC GAG TAC CAG AGC GAC ACC AAG TTC AAC ATC GAC AGC AAG ACC 1871 Lys Ile Glu Tyr Gln Ser Asp Thr Lys Phe Asn Ile Asp Ser Lys Thr 1060 1065 1070 TTC AAG GAG CTG AAG CTT TTC AAG ATC GAC AGC CAG AAC CAG CCC CAG 1919 Phe Lys Glu Leu Lys Leu Phe Lys Ile Asp Ser Gln Asn Gln Pro Gln 1075 1080 1085 CAG GTG CAG CAG GAC GAG CTG CGC AAC CCC GAG TTC AAC AAG AAG GAG 1967 Gln Val Gln Gln Asp Glu Leu Arg Asn Pro Glu Phe Asn Lys Lys Glu 1090 1095 1100 AGC CAG GAG TTC CTG GCC AAG CCC AGC AAG ATC AAC CTG TTC ACC CAG 2015 Ser Gln Glu Phe Leu Ala Lys Pro Ser Lys Ile Asn Leu Phe Thr Gln 1105 1110 1115 CAG ATG AAG CGC GAG ATC GAC GAG GAC ACC GAC ACC GAC GGC GAC AGC 2063 Gln Met Lys Arg Glu Ile Asp Glu Asp Thr Asp Thr Asp Gly Asp Ser 1120 1125 1130 1135 ATC CCC GAC CTG TGG GAG GAG AAC GGC TAC ACC ATC CAG AAC CGC ATC 2111 Ile Pro Asp Leu Trp Glu Glu Asn Gly Tyr Thr Ile Gln Asn Arg Ile 1140 1145 1150 GCC GTG AAG TGG GAC GAC AGC CTG GCT AGC AAG GGC TAC ACC AAG TTC 2159 Ala Val Lys Trp Asp Asp Ser Leu Ala Ser Lys Gly Tyr Thr Lys Phe 1155 1160 1165 GTG AGC AAC CCC CTG GAG AGC CAC ACC GTG GGC GAC CCC TAC ACC GAC 2207 Val Ser Asn Pro Leu Glu Ser His Thr Val Gly Asp Pro Tyr Thr Asp 1170 1175 1180 TAC GAG AAG GCC GCC CGC GAC CTG GAC CTG AGC AAC GCC AAG GAG ACC 2255 Tyr Glu Lys Ala Ala Arg Asp Leu Asp Leu Ser Asn Ala Lys Glu Thr 1185 1190 1195 TTC AAC CCC CTG GTG GCC GCC TTC CCC AGC GTG AAC GTG AGC ATG GAG 2303 Phe Asn Pro Leu Val Ala Ala Phe Pro Ser Val Asn Val Ser Met Glu 1200 1205 1210 1215 AAG GTG ATC CTG AGC CCC AAC GAG AAC CTG AGC AAC AGC GTG GAG AGC 235l Lys Val Ile Leu Ser Pro Asn Glu Asn Leu Ser Asn Ser Val Glu Ser 1220 1225 1230 CAC TCG AGC ACC AAC TGG AGC TAC ACC AAC ACC GAG GGC GCC AGC GTG 2399 His Ser Ser Thr Asn Trp Ser Tyr Thr Asn Thr Glu Gly Ala Ser Val 1235 1240 1245 GAG GCC GGC ATC GGT CCC AAG GGC ATC AGC TTC GGC GTG AGC GTG AAC 2447 Glu Ala Gly Ile Gly Pro Lys Gly Ile Ser Phe Gly Val Ser Val Asn 1250 1255 1260 TAC CAG CAC AGC GAG ACC GTG GCC CAG GAG TGG GGC ACC AGC ACC GGC 2495 Tyr Gln His Ser Glu Thr Val Ala Gln Glu Trp Gly Thr Ser Thr Gly 1265 1270 1275 AAC ACC AGC CAG TTC AAC ACC GCC AGC GCC GGC TAC CTG AAC GCC AAC 2543 Asn Thr Ser Gln Phe Asn Thr Ala Ser Ala Gly Tyr Leu Asn Ala Asn 1280 1285 1290 1295 GTG CGC TAC AAC AAC GTG GGC ACC GGC GCC ATC TAC GAC GTG AAG CCC 2591 Val Arg Tyr Asn Asn Val Gly Thr Gly Ala Ile Tyr Asp Val Lys Pro 1300 1305 1310 ACC ACC AGC TTC GTG CTG AAC AAC GAC ACC ATC GCC ACC ATC ACC GCC 2639 Thr Thr Ser Phe Val Leu Asn Asn Asp Thr Ile Ala Thr Ile Thr Ala 1315 1320 1325 AAG TCG AAT TCC ACC GCC CTG AAC ATC AGC CCC GGC GAG AGC TAC CCC 2687 Lys Ser Asn Ser Thr Ala Leu Asn Ile Ser Pro Gly Glu Ser Tyr Pro 1330 1335 1340 AAG AAG GGC CAG AAC GGC ATC GCC ATC ACC AGC ATG GAC GAC TTC AAC 2735 Lys Lys Gly Gln Asn Gly Ile Ala Ile Thr Ser Met Asp Asp Phe Asn 1345 1350 1355 AGC CAC CCC ATC ACC CTG AAC AAG AAG CAG GTG GAC AAC CTG CTG AAC 2783 Ser His Pro Ile Thr Leu Asn Lys Lys Gln Val Asp Asn Leu Leu Asn 1360 1365 1370 1375 AAC AAG CCC ATG ATG CTG GAG ACC AAC CAG ACC GAC GGC GTC TAC AAG 2831 Asn Lys Pro Met Met Leu Glu Thr Asn Gln Thr Asp Gly Val Tyr Lys 1380 1385 1390 ATC AAG GAC ACC CAC GGC AAC ATC GTG ACG GGC GGC GAG TGG AAC GGC 2879 Ile Lys Asp Thr His Gly Asn Ile Val Thr Gly Gly Glu Trp Asn Gly 1395 1400 1405 GTG ATC CAG CAG ATC AAG GCC AAG ACC GCC AGC ATC ATC GTC GAC GAC 2927 Val Ile Gln Gln Ile Lys Ala Lys Thr Ala Ser Ile Ile Val Asp Asp 1410 1415 1420 GGC GAG CGC GTG GCC GAG AAG CGC GTG GCC GCC AAG GAC TAC GAG AAC 2975 Gly Glu Arg Val Ala Glu Lys Arg Val Ala Ala Lys Asp Tyr Glu Asn 1425 1430 1435 CCC GAG GAC AAG ACC CCC AGC CTG ACC CTG AAG GAC GCC CTG AAG CTG 3023 Pro Glu Asp Lys Thr Pro Ser Leu Thr Leu Lys Asp Ala Leu Lys Leu 1440 1445 1450 1455 AGC TAC CCC GAC GAG ATC AAG GAG ATC GAG GGC TTG CTG TAC TAC AAG 3071 Ser Tyr Pro Asp Glu Ile Lys Glu Ile Glu Gly Leu Leu Tyr Tyr Lys 1460 1465 1470 AAC AAG CCC ATC TAC GAG AGC AGC GTG ATG ACC TAT CTA GAC GAG AAC 3119 Asn Lys Pro Ile Tyr Glu Ser Ser Val Met Thr Tyr Leu Asp Glu Asn 1475 1480 1485 ACC GCC AAG GAG GTG ACC AAG CAG CTG AAC GAC ACC ACC GGC AAG TTC 3167 Thr Ala Lys Glu Val Thr Lys Gln Leu Asn Asp Thr Thr Gly Lys Phe 1490 1495 1500 AAG GAC GTG AGC CAC CTG TAC GAC GTG AAG CTG ACC CCC AAG ATG AAC 3215 Lys Asp Val Ser His Leu Tyr Asp Val Lys Leu Thr Pro Lys Met Asn 1505 1510 1515 GTG ACC ATC AAG CTG AGC ATC CTG TAC GAC AAC GCC CAG ACC AAC GAC 3263 Val Thr Ile Lys Leu Ser Ile Leu Tyr Asp Asn Ala Glu Ser Asn Asp 1520 1525 1530 1535 AAC AGC ATC GGC AAG TGG ACC AAC ACC AAC ATC GTG AGC GGC GGC AAC 3311 Asn Ser Ile Gly Lys Trp Thr Asn Thr Asn Ile Val Ser Gly Gly Asn 1540 1545 1550 AAC GGC AAG AAG CAG TAC AGC AGC AAC AAC CCC GAC GCC AAC CTG ACC 3359 Asn Gly Lys Lys Gln Tyr Ser Ser Asn Asn Pro Asp Ala Asn Leu Thr 1555 1560 1565 CTG AAC ACC GAC GCC CAG GAG AAG CTG AAC AAG AAC CGC GAC TAC TAC 3407 Leu Asn Thr Asp Ala Gln Glu Lys Leu Asn Lys Asn Arg Asp Tyr Tyr 1570 1575 1580 ATC AGC CTG TAC ATG AAG AGC GAG AAG AAC ACC CAG TGC GAG ATC ACC 3455 Ile Ser Leu Tyr Met Lys Ser Glu Lys Asn Thr Gln Cys Glu Ile Thr 1585 1590 1595 ATC GAC GGC GAG ATA TAC CCC ATC ACC ACC AAG ACC GTG AAC GTG AAC 3503 Ile Asp Gly Glu Ile Tyr Pro Ile Thr Thr Lys Thr Val Asn Val Asn 1600 1605 1610 1615 AAG GAC AAC TAC AAG CGC CTG GAC ATC ATC GCC CAC AAC ATC AAG AGC 3551 Lys Asp Asn Tyr Lys Arg Leu Asp Ile Ile Ala His Asn Ile Lys Ser 1620 1625 1630 AAC CCC ATC AGC AGC CTG CAC ATC AAG ACC AAC GAC GAG ATC ACC CTG 3599 Asn Pro Ile Ser Ser Leu His Ile Lys Thr Asn Asp Glu Ile Thr Leu 1635 1640 1645 TTC TGG GAC GAC ATA TCG ATT ACC GAC GTC GCC AGC ATC AAG CCC GAG 3647 Phe Trp Asp Asp Ile Ser Ile Thr Asp Val Ala Ser Ile Lys Pro Glu 1650 1655 1660 AAC CTG ACC GAC AGC GAG ATC AAG CAG ATA TAC AGT CGC TAC GGC ATC 3695 Asn Leu Thr Asp Ser Glu Ile Lys GLn Ile Tyr Ser Arg Tyr Gly Ile 1665 1670 1675 AAG CTG GAG GAC GGC ATC CTG ATC GAC AAG AAA GGC GGC ATC CAC TAC 3743 Lys Leu Glu Asp Gly Ile Leu Ile Asp Lys Lys Gly Gly Ile His Tyr 1680 1685 1690 1695 GGC GAG TTC ATC AAC GAG GCC AGC TTC AAC ATC GAG CCC CTG CAG AAC 3791 Gly Glu Phe Ile Asn Glu Ala Ser Phe Asn Ile Glu Pro Leu Gln Asn 1700 1705 1710 TAC GTG ACC AAG TAC GAG GTG ACC TAC AGC AGC GAG CTG GGC CCC AAC 3839 Tyr Val Thr Lys Tyr Glu Val Thr Tyr Ser Ser Glu Leu Gly Pro Asn 1715 1720 1725 GTG AGC GAC ACC CTG GAG AGC GAC AAG ATT TAC AAG GAC GGC ACC ATC 3887 Val Ser Asp Thr Leu Glu Ser Asp Lys Ile Tyr Lys Asp Gly Thr Ile 1730 1735 1740 AAG TTC GAC TTC ACC AAG TAC AGC AAG AAC GAG CAG GGC CTG TTC TAC 3935 Lys Phe Asp Phe Thr Lys Tyr Ser Lys Asn Glu Gln Gly Leu Phe Tyr 1745 1750 1755 GAC AGC GGC CTG AAC TGG GAC TTC AAG ATC AAC GCC ATC ACC TAC GAC 3983 Asp Ser Gly Leu Asn Trp Asp Phe Lys Ile Asn Ala Ile Thr Tyr Asp 1760 1765 1770 1775 GGC AAG GAG ATG AAC GTG TTC CAC CGC TAC AAC AAG TAGATCTGAG 4029 Gly Lys Glu Met Asn Val Phe His Arg Tyr Asn Lys 1780 1785 CT 4031 (2)SEQ ID NO:50信息: (i)序列特征: (A)长度:1338个氨基酸 (B)类型:氨基酸 (D)拓扑结构:线性 (ii)分子类型:蛋白质 (xi)序列描述:SEQ ID NO:50: Met Lys Arg Met Glu Gly Lys Leu Phe Met Val Ser Lys Lys Leu Gln 1 5 10 15 Val Val Thr Lys Thr Val Leu Leu Ser Thr Val Phe Ser Ile Ser Leu 20 25 30 Leu Asn Asn Glu Val Ile Lys Ala Glu Gln Leu Asn Ile Asn Ser Gln 35 40 45 Ser Lys Tyr Thr Asn Leu Gln Asn Leu Lys Ile Thr Asp Lys Val Glu 50 55 60 Asp Phe Lys Glu Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys 65 70 75 80 Glu Lys Glu Trp Lys Leu Thr Ala Thr Glu Lys Gly Lys Met Asn Asn 85 90 95 Phe Leu Asp Asn Lys Asn Asp Ile Lys Thr Asn Tyr Lys Glu Ile Thr 100 105 110 Phe Ser Ile Ala Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu 115 120 125 Ile Asp Lys Met Phe Asp Lys Thr Asn Leu Ser Asn Ser Ile Ile Thr 130 135 140 Tyr Lys Asn Val Glu Pro Thr Thr Ile Gly Phe Asn Lys Ser Leu Thr 145 150 155 160 Glu Gly Asn Thr Ile Asn Ser Asp Ala Met Ala Gln Phe Lys Glu Gln 165 170 175 Phe Leu Asp Arg Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu 180 185 190 Thr Ala Gln Gln Val Ser Ser Lys Glu Arg Val Ile Leu Lys Val Thr 195 200 205 Val Pro Ser Gly Lys Gly Ser Thr Thr Pro Thr Lys Ala Gly Val Ile 210 215 220 Leu Asn Asn Ser Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Met Val 225 230 235 240 His Val Asp Lys Val Ser Lys Val Val Lys Lys Gly Val Glu Cys Leu 245 250 255 Gln Ile Glu Gly Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile 260 265 270 Asn Ala Glu Ala His Ser Trp Gly Met Lys Asn Tyr Glu Glu Trp Ala 275 280 285 Lys Asp Leu Thr Asp Ser Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg 290 295 300 Gln Asp Tyr Lys Glu Ile Asn Asn Tyr Leu Arg Asn Gln Gly Gly Ser 305 310 315 320 Gly Asn Glu Lys Leu Asp Ala Gln Ile Lys Asn Ile Ser Asp Ala Leu 325 330 335 Gly Lys Lys Pro Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly 340 345 350 Met Pro Glu Phe Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys 355 360 365 Asp Phe Glu Glu Gln Phe Leu Asn Thr Ile Lys Glu Asp Lys Gly Tyr 370 375 380 Met Ser Thr Ser Leu Ser Ser Glu Arg Leu Ala Ala Phe Gly Ser Arg 385 390 395 400 Lys Ile Ile Leu Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr 405 410 415 Leu Ser Ala Ile Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Leu Asp 420 425 430 Lys Asp Ser Lys Tyr His Ile Asp Lys Val Thr Glu Val Ile Ile Lys 435 440 445 Gly Val Lys Arg Tyr Val Val Asp Ala Thr Leu Leu Thr Asn Ser Arg 450 455 460 Gly Pro Ser Thr Pro Pro Thr Pro Ser Pro Ser Thr Pro Pro Thr Pro 465 470 475 480 Ser Asp Ile Gly Ser Thr Met Lys Thr Asn Gln Ile Ser Thr Thr Gln 485 490 495 Lys Asn Gln Gln Lys Glu Met Asp Arg Lys Gly Leu Leu Gly Tyr Tyr 500 505 510 Phe Lys Gly Lys Asp Phe Ser Asn Leu Thr Met Phe Ala Pro Thr Arg 515 520 525 Asp Ser Thr Leu Ile Tyr Asp Gln Gln Thr Ala Asn Lys Leu Leu Asp 530 535 540 Lys Lys Gln Gln Glu Tyr Gln Ser Ile Arg Trp Ile Gly Leu Ile Gln 545 550 555 560 Ser Lys Glu Thr Gly Asp Phe Thr Phe Asn Leu Ser Glu Asp Glu Gln 565 570 575 Ala Ile Ile Glu Ile Asn Gly Lys Ile Ile Ser Asn Lys Gly Lys Glu 580 585 590 Lys Gln Val Val His Leu Glu Lys Gly Lys Leu Val Pro Ile Lys Ile 595 600 605 Glu Tyr Gln Ser Asp Thr Lys Phe Asn Ile Asp Ser Lys Thr Phe Lys 610 615 620 Glu Leu Lys Leu Phe Lys Ile Asp Ser Gln Asn Gln Pro Gln Gln Val 625 630 635 640 Gln Gln Asp Glu Leu Arg Asn Pro Glu Phe Asn Lys Lys Glu Ser Gln 645 650 655 Glu Phe Leu Ala Lys Pro Ser Lys Ile Asn Leu Phe Thr Gln Gln Met 660 665 670 Lys Arg Glu Ile Asp Glu Asp Thr Asp Thr Asp Gly Asp Ser Ile Pro 675 680 685 Asp Leu Trp Glu Glu Asn Gly Tyr Thr Ile Gln Asn Arg Ile Ala Val 690 695 700 Lys Trp Asp Asp Ser Leu Ala Ser Lys Gly Tyr Thr Lys Phe Val Ser 705 710 715 720 Asn Pro Leu Glu Ser His Thr Val Gly Asp Pro Tyr Thr Asp Tyr Glu 725 730 735 Lys Ala Ala Arg Asp Leu Asp Leu Ser Asn Ala Lys Glu Thr Phe Asn 740 745 750 Pro Leu Val Ala Ala Phe Pro Ser Val Asn Val Ser Met Glu Lys Val 755 760 765 Ile Leu Ser Pro Asn Glu Asn Leu Ser Asn Ser Val Glu Ser His Ser 770 775 780 Ser Thr Asn Trp Ser Tyr Thr Asn Thr Glu Gly Ala Ser Val Glu Ala 785 790 795 800 Gly Ile Gly Pro Lys Gly Ile Ser Phe Gly Val Ser Val Asn Tyr Gln 805 810 815 His Ser Glu Thr Val Ala Gln Glu Trp Gly Thr Ser Thr Gly Asn Thr 820 825 830 Ser Gln Phe Asn Thr Ala Ser Ala Gly Tyr Leu Asn Ala Asn Val Arg 835 840 845 Tyr Asn Asn Val Gly Thr Gly Ala Ile Tyr Asp Val Lys Pro Thr Thr 850 855 860 Ser Phe Val Leu Asn Asn Asp Thr Ile Ala Thr Ile Thr Ala Lys Ser 865 870 875 880 Asn Ser Thr Ala Leu Asn Ile Ser Pro Gly Glu Ser Tyr Pro Lys Lys 885 890 895 Gly Gln Asn Gly Ile Ala Ile Thr Ser Met Asp Asp Phe Asn Ser His 900 905 910 Pro Ile Thr Leu Asn Lys Lys Gln Val Asp Asn Leu Leu Asn Asn Lys 915 920 925 Pro Met Met Leu Glu Thr Asn Gln Thr Asp Gly Val Tyr Lys Ile Lys 930 935 940 Asp Thr His Gly Asn Ile Val Thr Gly Gly Glu Trp Asn Gly Val Ile 945 950 955 960 Gln Gln Ile Lys Ala Lys Thr Ala Ser Ile Ile Val Asp Asp Gly Glu 965 970 975 Arg Val Ala Glu Lys Arg Val Ala Ala Lys Asp Tyr Glu Asn Pro Glu 980 985 990 Asp Lys Thr Pro Ser Leu Thr Leu Lys Asp Ala Leu Lys Leu Ser Tyr 995 1000 1005 Pro Asp Glu Ile Lys Glu Ile Glu Gly Leu Leu Tyr Tyr Lys Asn Lys 1010 1015 1020 Pro Ile Tyr Glu Ser Ser Val Met Thr Tyr Leu Asp Glu Asn Thr Ala 1025 1030 1035 1040 Lys Glu Val Thr Lys Gln Leu Asn Asp Thr Thr Gly Lys Phe Lys Asp 1045 1050 1055 Val Ser His Leu Tyr Asp Val Lys Leu Thr Pro Lys Met Asn Val Thr 1060 1065 1070 Ile Lys Leu Ser Ile Leu Tyr Asp Asn Ala Glu Ser Asn Asp Asn Ser 1075 1080 1085 Ile Gly Lys Trp Thr Asn Thr Asn Ile Val Ser Gly Gly Asn Asn Gly 1090 1095 1100 Lys Lys Gln Tyr Ser Ser Asn Asn Pro Asp Ala Asn Leu Thr Leu Asn 1105 1110 1115 1120 Thr Asp Ala Gln Glu Lys Leu Asn Lys Asn Arg Asp Tyr Tyr Ile Ser 1125 1130 1135 Leu Tyr Met Lys Ser Glu Lys Asn Thr Gln Cys Glu Ile Thr Ile Asp 1140 1145 1150 Gly Glu Ile Tyr Pro Ile Thr Thr Lys Thr Val Asn Val Asn Lys Asp 1155 1160 1165 Asn Tyr Lys Arg Leu Asp Ile Ile Ala His Asn Ile Lys Ser Asn Pro 1170 1175 1180 Ile Ser Ser Leu His Ile Lys Thr Asn Asp Glu Ile Thr Leu Phe Trp 1185 1190 1195 1200 Asp Asp Ile Ser Ile Thr Asp Val Ala Ser Ile Lys Pro Glu Asn Leu 1205 1210 1215 Thr Asp Ser Glu Ile Lys Gln Ile Tyr Ser Arg Tyr Gly Ile Lys Leu 1220 1225 1230 Glu Asp Gly Ile Leu Ile Asp Lys Lys Gly Gly Ile His Tyr Gly Glu 1235 1240 1245 Phe Ile Asn Glu Ala Ser Phe Asn Ile Glu Pro Leu Gln Asn Tyr Val 1250 1255 1260 Thr Lys Tyr Glu Val Thr Tyr Ser Ser Glu Leu Gly Pro Asn Val Ser 1265 1270 1275 1280 Asp Thr Leu Glu Ser Asp Lys Ile Tyr Lys Asp Gly Thr Ile Lys Phe 1285 1290 1295 Asp Phe Thr Lys Tyr Ser Lys Asn Glu Gln Gly Leu Phe Tyr Asp Ser 1300 1305 1310 Gly Leu Asn Trp Asp Phe Lys Ile Asn Ala Ile Thr Tyr Asp Gly Lys 1315 1320 1325 Glu Met Asn Val Phe His Arg Tyr Asn Lys 1330 1335 (2)SEQ ID NO:51信息: (i)序列特征: (A)长度:2444个碱基对 (B)类型:核酸 (C)链型:单链 (D)拓扑结构:线性 (ii)分子类型:DNA(基因组) (iii)假设:否 (ix)特征: (A)名称/关键词:CDS (B)位置:17..2444 (D)其它信息:/产物=″3A(a)合成:天然融合体″ (xi)序列描述:SEQ ID NO:51: GGATCCACCA ATGAAC ATG AAC AAG AAC AAC ACC AAG CTG AGC ACC CGC 49 Met Asn Lys Asn Asn Thr Lys Leu Ser Thr Arg 1 5 10 GCC CTG CCG AGC TTC ATC GAC TAC TTC AAC GGC ATC TAC GGC TTC GCC 97 Ala Leu Pro Ser Phe Ile Asp Tyr Phe Asn Gly Ile Tyr Gly Phe Ala 15 20 25 ACC GGC ATC AAG GAC ATC ATG AAC ATG ATC TTC AAG ACC GAC ACC GGC 145 Thr Gly Ile Lys Asp Ile Met Asn Met Ile Phe Lys Thr Asp Thr Gly 30 35 40 GGC GAC CTG ACC CTG GAC GAG ATC CTG AAG AAC CAG CAG CTG CTG AAC 193 Gly Asp Leu Thr Leu Asp Glu Ile Leu Lys Asn Gln Gln Leu Leu Asn 45 50 55 GAC ATC AGC GGC AAG CTG GAC GGC GTG AAC GGC AGC CTG AAC GAC CTG 241 Asp Ile Ser Gly Lys Leu Asp Gly Val Asn Gly Ser Leu Asn Asp Leu 60 65 70 75 ATC GCC CAG GGC AAC CTG AAC ACC GAG CTG AGC AAG GAG ATC CTT AAG 289 Ile Ala Gln Gly Asn Leu Asn Thr Glu Leu Ser Lys Glu Ile Leu Lys 80 85 90 ATC GCC AAC GAG CAG AAC CAG GTG CTG AAC GAC GTG AAC AAC AAG CTG 337 Ile Ala Asn Glu Gln Asn Gln Val Leu Asn Asp Val Asn Asn Lys Leu 95 100 105 GAC GCC ATC AAC ACC ATG CTG CGC GTG TAC CTG CCG AAG ATC ACC AGC 385 Asp Ala Ile Asn Thr Met Leu Arg Val Tyr Leu Pro Lys Ile Thr Ser 110 115 120 ATG CTG AGC GAC GTG ATG AAG CAG AAC TAC GCC CTG AGC CTG CAG ATC 433 Met Leu Ser Asp Val Met Lys Gln Asn Tyr Ala Leu Ser Leu Gln Ile 125 130 135 GAG TAC CTG AGC AAG CAG CTG CAG GAG ATC AGC GAC AAG CTG GAC ATC 481 Glu Tyr Leu Ser Lys Gln Leu Gln Glu Ile Ser Asp Lys Leu Asp Ile 140 145 150 155 ATC AAC GTG AAC GTC CTG ATC AAC AGC ACC CTG ACC GAG ATC ACC CCG 529 Ile Asn Val Asn Val Leu Ile Asn Ser Thr Leu Thr Glu Ile Thr Pro 160 165 170 GCC TAC CAG CGC ATC AAG TAC GTG AAC GAG AAG TTC GAA GAG CTG ACC 577 Ala Tyr Gln Arg Ile Lys Tyr Val Asn Glu Lys Phe Glu Glu Leu Thr 175 180 185 TTC GCC ACC GAG ACC AGC AGC AAG GTG AAG AAG GAC GGC AGC CCG GCC 625 Phe Ala Thr Glu Thr Ser Ser Lys Val Lys Lys Asp Gly Ser Pro Ala 190 195 200 GAC ATC CTG GAC GAG CTG ACC GAG CTG ACC GAG CTG GCC AAG AGC GTG 673 Asp Ile Leu Asp Glu Leu Thr Glu Leu Thr Glu Leu Ala Lys Ser Val 205 210 215 ACC AAG AAC GAC GTG GAC GGC TTC GAG TTC TAC CTG AAC ACC TTC CAC 721 Thr Lys Asn Asp Val Asp Gly Phe Glu Phe Tyr Leu Asn Thr Phe His 220 225 230 235 GAC GTG ATG GTG GGC AAC AAC CTG TTC GGC CGC AGC GCC CTG AAG ACC 769 Asp Val Met Val Gly Asn Asn Leu Phe Gly Arg Ser Ala Leu Lys Thr 240 245 250 GCC AGC GAG CTG ATC ACC AAG GAG AAC GTG AAG ACC AGC GGC AGC GAG 817 Ala Ser Glu Leu Ile Thr Lys Glu Asn Val Lys Thr Ser Gly Ser Glu 255 260 265 GTG GGC AAC GTG TAC AAC TTC CTG ATC GTG CTG ACC GCC CTG CAG GCC 865 Val Gly Asn Val Tyr Asn Phe Leu Ile Val Leu Thr Ala Leu Gln Ala 270 275 280 CAG GCC TTC CTG ACC CTG ACC ACC TGT CGC AAG CTG CTG GGC CTG GCC 913 Gln Ala Phe Leu Thr Leu Thr Thr Cys Arg Lys Leu Leu Gly Leu Ala 285 290 295 GAC ATC GAC TAC ACC AGC ATC ATG AAC GAG CAC TTG AAC AAG GAG AAG 961 Asp Ile Asp Tyr Thr Ser Ile Met Asn Glu His Leu Asn Lys Glu Lys 300 305 310 315 GAG GAG TTC CGC GTG AAC ATC CTG CCG ACC CTG AGC AAC ACC TTC AGC 1009 Glu Glu Phe Arg Val Asn Ile Leu Pro Thr Leu Ser Asn Thr Phe Ser 320 325 330 AAC CCG AAC TAC GCC AAG GTG AAG GGC AGC GAC GAG GAC GCC AAG ATG 1057 Asn Pro Asn Tyr Ala Lys Val Lys Gly Ser Asp Glu Asp Ala Lys Met 335 340 345 ATC GTG GAG GCT AAG CCG GGC CAC GCG TTG ATC GGC TTC GAG ATC AGC 1105 Ile Val Glu Ala Lys Pro Gly His Ala Leu Ile Gly Phe Glu Ile Ser 350 355 360 AAC GAC AGC ATC ACC GTG CTG AAG GTG TAC GAG GCC AAG CTG AAG CAG 1153 Asn Asp Ser Ile Thr Val Leu Lys Val Tyr Glu Ala Lys Leu Lys Gln 365 370 375 AAC TAC CAG GTG GAC AAG GAC AGC TTG AGC GAG GTG ATC TAC GGC GAC 1201 Asn Tyr Gln Val Asp Lys Asp Ser Leu Ser Glu Val Ile Tyr Gly Asp 380 385 390 395 ATG GAC AAG CTG CTG TGT CCG GAC CAG AGC GAG CAA ATC TAC TAC ACC 1249 Met Asp Lys Leu Leu Cys Pro Asp Gln Ser Glu Gln Ile Tyr Tyr Thr 400 405 410 AAC AAC ATC GTG TTC CCG AAC GAG TAC GTG ATC ACC AAG ATC GAC TTC 1297 Asn Asn Ile Val Phe Pro Asn Glu Tyr Val Ile Thr Lys Ile Asp Phe 415 420 425 ACC AAG AAG ATG AAG ACC CTG CGC TAC GAG GTG ACC GCC AAC TTC TAC 1345 Thr Lys Lys Met Lys Thr Leu Arg Tyr Glu Val Thr Ala Asn Phe Tyr 430 435 440 GAC AGC AGC ACC GGC GAG ATC GAC CTG AAC AAG AAG AAG GTG GAG AGC 1393 Asp Ser Ser Thr Gly Glu Ile Asp Leu Asn Lys Lys Lys Val Glu Ser 445 450 455 AGC GAG GCC GAG TAC CGC ACC CTG AGC GCG AAC GAC GAC GGC GTC TAC 1441 Ser Glu Ala Glu Tyr Arg Thr Leu Ser Ala Asn Asp Asp Gly Val Tyr 460 465 470 475 ATG CCA CTG GGC GTG ATC AGC GAG ACC TTC CTG ACC CCG ATC AAC GGC 1489 Met Pro Leu Gly Val Ile Ser Glu Thr Phe Leu Thr Pro Ile Asn Gly 480 485 490 TTT GGC CTG CAG GCC GAC GAG AAC AGC CGC CTG ATC ACC CTG ACC TGT 1537 Phe Gly Leu Gln Ala Asp Glu Asn Ser Arg Leu Ile Thr Leu Thr Cys 495 500 505 AAG AGC TAC CTG CGC GAG CTG CTG CTA GCC ACC GAC CTG AGC AAC AAG 1585 Lys Ser Tyr Leu Arg Glu Leu Leu Leu Ala Thr Asp Leu Ser Asn Lys 510 515 520 GAG ACC AAG CTG ATC GTG CCA CCG AGC GGC TTC ATC AGC AAC ATC GTG 1633 Glu Thr Lys Leu Ile Val Pro Pro Ser Gly Phe Ile Ser Asn Ile Val 525 530 535 GAG AAC GGC AGC ATC GAG GAG GAC AAC CTG GAG CCG TGG AAG GCC AAC 1681 Glu Asn Gly Ser Ile Glu Glu Asp Asn Leu Glu Pro Trp Lys Ala Asn 540 545 550 555 AAC AAG AAC GCC TAC GTG GAC CAC ACC GGC GGC GTG AAC GGC ACC AAG 1729 Asn Lys Asn Ala Tyr Val Asp His Thr Gly Gly Val Asn Gly Thr Lys 560 565 570 GCC CTG TAC GTG CAC AAG GAC GGC GGC ATC AGC CAG TTC ATC GGC GAC 1777 Ala Leu Tyr Val His Lys Asp Gly Gly Ile Ser Gln Phe Ile Gly Asp 575 580 585 AAG CTG AAG CCG AAG ACC GAG TAC GTG ATC CAG TAC ACC GTG AAG GGC 1825 Lys Leu Lys Pro Lys Thr Glu Tyr Val Ile Gln Tyr Thr Val Lys Gly 590 595 600 AAG CCA TCG ATT CAC CTG AAG GAC GAG AAC ACC GGC TAC ATC CAC TAC 1873 Lys Pro Ser Ile His Leu Lys Asp Glu Asn Thr Gly Tyr Ile His Tyr 605 610 615 GAG GAC ACC AAC AAC AAC CTG GAG GAC TAC CAG ACC ATC AAC AAG CGC 1921 Glu Asp Thr Asn Asn Asn Leu Glu Asp Tyr Gln Thr Ile Asn Lys Arg 620 625 630 635 TTC ACC ACC GGC ACC GAC CTG AAG GGC GTG TAC CTG ATC CTG AAG AGC 1969 Phe Thr Thr Gly Thr Asp Leu Lys Gly Val Tyr Leu Ile Leu Lys Ser 640 645 650 CAG AAC GGC GAC GAG GCC TGG GGC GAC AAC TTC ATC ATC CTG GAG ATC 2017 Gln Asn Gly Asp Glu Ala Trp Gly Asp Asn Phe Ile Ile Leu Glu Ile 655 660 665 AGC CCG AGC GAG AAG CTG CTG AGC CCG GAG CTG ATC AAC ACC AAC AAC 2065 Ser Pro Ser Glu Lys Leu Leu Ser Pro Glu Leu Ile Asn Thr Asn Asn 670 675 680 TGG ACC AGC ACC GGC AGC ACC AAC ATC AGC GGC AAC ACC CTG ACC CTG 2113 Trp Thr Ser Thr Gly Ser Thr Asn Ile Ser Gly Asn Thr Leu Thr Leu 685 690 695 TAC CAG GGC GGC CGG GGG ATT CTA AAA CAA AAC CTT CAA TTA GAT AGT 2161 Tyr Gln Gly Gly Arg Gly Ile Leu Lys Gln Asn Leu Gln Leu Asp Ser 700 705 710 715 TTT TCA ACT TAT AGA GTG TAT TTT TCT GTG TCC GGA GAT GCT AAT GTA 2209 Phe Ser Thr Tyr Arg Val Tyr Phe Ser Val Ser Gly Asp Ala Asn Val 720 725 730 AGG ATT AGA AAT TCT AGG GAA GTG TTA TTT GAA AAA AGA TAT ATG AGC 2257 Arg Ile Arg Asn Ser Arg Glu Val Leu Phe Glu Lys Arg Tyr Met Ser 735 740 745 GGT GCT AAA GAT GTT TCT GAA ATG TTC ACT ACA AAA TTT GAG AAA GAT 2305 Gly Ala Lys Asp Val Ser Glu Met Phe Thr Thr Lys Phe Glu Lys Asp 750 755 760 AAC TTT TAT ATA GAG CTT TCT CAA GGG AAT AAT TTA TAT GGT GGT CCT 2353 Asn Phe Tyr Ile Glu Leu Ser Gln Gly Asn Asn Leu Tyr Gly Gly Pro 765 770 775 ATT GTA CAT TTT TAC GAT GTC TCT ATT AAG NAA GAT CGG GAT CTA ATA 2401 Ile Val His Phe Tyr Asp Val Ser Ile Lys Xaa Asp Arg Asp Leu Ile 780 785 790 795 TTA ACA GTT TTT AAA AGC NAA TTC TTG TAT AAT GTC CTT GAT T 2444 Leu Thr Val Phe Lys Ser Xaa Phe Leu Tyr Asn Val Leu Asp 800 805 (2)SEQ ID NO:52信息: (i)序列特征: (A)长度:809个氨基酸 (B)类型:氨基酸 (D)拓扑结构:线性 (ii)分子类型:蛋白质 (xi)序列描述:SEQ ID NO:52: Met Asn Lys Asn Asn Thr Lys Leu Ser Thr Arg Ala Leu Pro Ser Phe 1 5 10 15 Ile Asp Tyr Phe Asn Gly Ile Tyr Gly Phe Ala Thr Gly Ile Lys Asp 20 25 30 Ile Met Asn Met Ile Phe Lys Thr Asp Thr Gly Gly Asp Leu Thr Leu 35 40 45 Asp Glu Ile Leu Lys Asn Gln Gln Leu Leu Asn Asp Ile Ser Gly Lys 50 55 60 Leu Asp Gly Val Asn Gly Ser Leu Asn Asp Leu Ile Ala Gln Gly Asn 65 70 75 80 Leu Asn Thr Glu Leu Ser Lys Glu Ile Leu Lys Ile Ala Asn Glu Gln 85 90 95 Asn Gln Val Leu Asn Asp Val Asn Asn Lys Leu Asp Ala Ile Asn Thr 100 105 110 Met Leu Arg Val Tyr Leu Pro Lys Ile Thr Ser Met Leu Ser Asp Val 115 120 125 Met Lys Gln Asn Tyr Ala Leu ser Leu Gln Ile Glu Tyr Leu ser Lys 130 135 140 Gln Leu Gln Glu Ile Ser Asp Lys Leu Asp Ile Ile Asn Val Asn Val 145 150 155 160 Leu Ile Asn Ser Thr Leu Thr Glu Ile Thr Pro Ala Tyr Gln Ar9 Ile 165 170 175 Lys Tyr Val Asn Glu Lys Phe Glu Glu Leu Thr Phe Ala Thr Glu Thr 180 185 190 Ser Ser Lys Val Lys Lys Asp Gly Ser Pro Ala Asp Ile Leu Asp Glu 195 200 205 Leu Thr Glu Leu Thr Glu Leu Ala Lys Ser Val Thr Lys Asn Asp Val 210 215 220 Asp Gly Phe Glu Phe Tyr Leu Asn Thr Phe His Asp Val Met Val Gly 225 230 235 240 Asn Asn Leu Phe Gly Arg Ser Ala Leu Lys Thr Ala Ser Glu Leu Ile 245 250 255 Thr Lys Glu Asn Val Lys Thr Ser Gly Ser Glu Val Gly Asn Val Tyr 260 265 270 Asn Phe Leu Ile Val Leu Thr Ala Leu Gln Ala Gln Ala Phe Leu Thr 275 280 285 Leu Thr Thr Cys Arg Lys Leu Leu Gly Leu Ala Asp Ile Asp Tyr Thr 290 295 300 Ser Ile Met Asn Glu His Leu Asn Lys Glu Lys Glu Glu Phe Arg Val 305 310 315 320 Asn Ile Leu Pro Thr Leu Ser Asn Thr Phe Ser Asn Pro Asn Tyr Ala 325 330 335 Lys Val Lys Gly Ser Asp Glu Asp Ala Lys Met Ile Val Glu Ala Lys 340 345 350 Pro Gly His Ala Leu Ile Gly Phe Glu Ile Ser Asn Asp Ser Ile Thr 355 360 365 Val Leu Lys Val Tyr Glu Ala Lys Leu Lys Gln Asn Tyr Gln Val Asp 370 375 380 Lys Asp Ser Leu Ser Glu Val Ile Tyr Gly Asp Met Asp Lys Leu Leu 385 390 395 400 Cys Pro Asp Gln Ser Glu Gln Ile Tyr Tyr Thr Asn Asn Ile Val Phe 405 410 415 Pro Asn Glu Tyr Val Ile Thr Lys Ile Asp Phe Thr Lys Lys Met Lys 420 425 430 Thr Leu Arg Tyr Glu Val Thr Ala Asn Phe Tyr Asp Ser Ser Thr Gly 435 440 445 Glu Ile Asp Leu Asn Lys Lys Lys Val Glu Ser Ser Glu Ala Glu Tyr 450 455 460 Arg Thr Leu Ser Ala Asn Asp Asp Gly Val Tyr Met Pro Leu Gly Val 465 470 475 480 Ile Ser Glu Thr Phe Leu Thr Pro Ile Asn Gly Phe Gly Leu Gln Ala 485 490 495 Asp Glu Asn Ser Arg Leu Ile Thr Leu Thr Cys Lys Ser Tyr Leu Arg 500 505 510 Glu Leu Leu Leu Ala Thr Asp Leu Ser Asn Lys Glu Thr Lys Leu Ile 515 520 525 Val Pro Pro Ser Gly Phe Ile Ser Asn Ile Val Glu Asn Gly Ser Ile 530 535 540 Glu Glu Asp Asn Leu Glu Pro Trp Lys Ala Asn Asn Lys Asn Ala Tyr 545 550 555 560 Val Asp His Thr Gly Gly Val Asn Gly Thr Lys Ala Leu Tyr Val His 565 570 575 Lys Asp Gly Gly Ile Ser Gln Phe Ile Gly Asp Lys Leu Lys Pro Lys 580 585 590 Thr Glu Tyr Val Ile Gln Tyr Thr Val Lys Gly Lys Pro Ser Ile His 595 600 605 Leu Lys Asp Glu Asn Thr Gly Tyr Ile His Tyr Glu Asp Thr Asn Asn 610 615 620 Asn Leu Glu Asp Tyr Gln Thr Ile Asn Lys Arg Phe Thr Thr Gly Thr 625 630 635 640 Asp Leu Lys Gly Val Tyr Leu Ile Leu Lys Ser Gln Asn Gly Asp Glu 645 650 655 Ala Trp Gly Asp Asn Phe Ile Ile Leu Glu Ile Ser Pro Ser Glu Lys 660 665 670 Leu Leu Ser Pro Glu Leu Ile Asn Thr Asn Asn Trp Thr Ser Thr Gly 675 680 685 Ser Thr Asn Ile Ser Gly Asn Thr Leu Thr Leu Tyr Gln Gly Gly Arg 690 695 700 Gly Ile Leu Lys Gln Asn Leu Gln Leu Asp Ser Phe Ser Thr Tyr Arg 705 710 715 720 Val Tyr Phe Ser Val Ser Gly Asp Ala Asn Val Arg Ile Arg Asn ser 725 730 735 Arg Glu Val Leu Phe Glu Lys Arg Tyr Met Ser Gly Ala Lys Asp Val 740 745 750 Ser Glu Met Phe Thr Thr Lys Phe Glu Lys Asp Asn Phe Tyr Ile Glu 755 760 765 Leu Ser Gln Gly Asn Asn Leu Tyr Gly Gly Pro Ile Val His Phe Tyr 770 775 780 Asp Val Ser Ile Lys Xaa Asp Arg Asp Leu Ile Leu Thr Val Phe Lys 785 790 795 800 Ser Xaa Phe Leu Tyr Asn Val Leu Asp 805 |