减毒的活胸膜肺炎放线杆菌 |
|||||||
申请号 | CN98109848.7 | 申请日 | 1998-04-09 | 公开(公告)号 | CN1198918C | 公开(公告)日 | 2005-04-27 |
申请人 | 阿克佐诺贝尔公司; | 发明人 | R·P·A·M·塞格斯; J·夫雷; | ||||
摘要 | 本 发明 涉及在apxIV基因中具有突变从而不能产生有功能的ApxIV毒素的胸膜 肺 炎放线杆菌属活减毒菌。本发明也涉及制备这种细菌的方法。包括这种细菌的 疫苗 及用于制备该疫苗的方法也是本发明的部分。本发明进一步涉及包括ApxIV毒素的 亚单位疫苗 ,制备该疫苗的方法及用于保护动物免受胸膜肺炎放线杆菌属细菌感染的方法。此外,本发明涉及apxIV基因的启动子。最后,本发明涉及用于选择性诊断胸膜肺炎放线杆菌感染的诊断测试及区分胸膜肺炎放线杆菌野生菌株与疫苗菌株的诊断测试。 | ||||||
权利要求 | 1.核苷酸序列,其中带有控制apxIV基因表达的启动子。 |
||||||
说明书全文 | 本发明涉及在编码毒素基因中具有突变的减毒活胸膜肺炎放线杆菌, 用于制备该细菌的方法,包括该细菌的疫苗,制备这种疫苗的方法,包括 毒素的疫苗,制造这种疫苗的方法以及用于保护动物免受胸膜肺炎放线杆 菌感染的方法。放线杆菌属的细菌均产生所谓的RTX-毒素。(RTX代表毒素中的重 复)。 正是由于这些RTX-毒素的存在才高度地促成了这些细菌的病原性特 征。 RTX-毒素已由Braun等进行了广泛综述。(微生物学关键综述18 (2):115-158(1991))。革兰氏阴性菌株的RTX-毒素也已由Welch,R.A. (分子微生物学5/3:521-528(1991))和Welch等(感染源和疾病4: 254-272(1995))加以综述。 所有已知的RTX-毒素显示一定种类的细胞毒或溶细胞活性。然而依据 毒素和酰化的差异,靶细胞和宿主特异性各有不同(McWhinney等;细菌 学杂志174:291-297(1992)和Hackett等;生物化学杂志270: 20250-20253(1995))。由于靶细胞的不同,RTX-毒素家族的多种毒 素称为如溶血素、溶细胞素或细胞毒素。 放线杆菌属包括许多不同种,特别是胸膜肺炎放线杆菌、体放线放线 杆菌、猪放线杆菌、罗氏放线杆菌、马驹放线杆菌(A.equuli)和李氏放 线杆菌(A.Lignieresi)。 胸膜肺炎放线杆菌产生血清型依赖性RTX-毒素,其对猪、马、牛和人 类红细胞、兔和猪嗜中性细胞和猪肺泡巨噬细胞是细胞毒性/溶细胞性的 (Rosendel等;美国兽医研究杂志,49:1053-1058(1998),Maudsley J.R.和Kadis S;加拿大微生物学杂志,32:801-805(1986),Frey.J 和Nicolet J;感染与免疫,56:2570-2575(1988),Bendixon等;感 染与免疫,33:673-676(1981),Kamp,E.M.和Van Leengoed,L.A.M.G.;临床微生物学杂志,27:1187-1191(1989))。 猪中放线杆菌的感染,由于小猪的急性致死和大龄动物体重净增的下 降而导致养猪业中严重的经济损失。 革兰氏阴性细菌中涉及RTX-毒素合成,激活和运输的操纵子的遗传结 构最近已由Coote,J.G加以综述(FEMS微生物学综述88:137-162 (1992))。Frey已在细菌蛋白毒素,Zbl Bakt增刊,24,p.322-,Freer 等.(编),Gustaf Fischer,Stuttgart,Jena,纽约,1994中对胸膜肺炎放线 杆菌中的已知三种RTX-毒素进行了具体的综述。 在胸膜肺炎放线杆菌中,此种RTX-操纵子含有4个基因:实际的毒素 -基因(A),激活基因(C)和2个编码涉及毒素分泌至周围介质蛋白的 基因(B和D)。毒素基因(A)的初级翻译产物是无毒性的蛋白,其中 的毒素活性由激活基因(C)产物所激活。 直到最近,认为只有具有上述遗传结构或至少具有毒素-基因(A)及 激活基因(C)的三种RTX-毒素才存在于放线杆菌中。 这三种RTX-毒素,ApxI、Apx-II和Apx-III分别具有显著的溶血活 性(ApxI)、温和的溶血活性(Apx-II)或巨噬细胞的细胞毒活性 (Apx-III)。 各种毒素的活性以不同的血清型相当随机地划分。存在四种亚型: 由血清型1,5,9和11所代表的亚型A,产生ApxI和Apx-II, 由血清型2,3,4,6和8所代表的亚型B,产生 Apx-II和Apx-III, 由血清型10所代表的亚型C,仅产生ApxI, 由血清型7和12所代表的亚型D,仅产生Apx-II, 已知,ApxI、-II和-III是抗胸膜肺炎放线杆菌感染的一般疫苗中的必 需成分:不包括至少ApxI、-II和III的疫苗将不提供对所有胸膜肺炎放线 杆菌血清型的保护。同样,不包括至少一种特异血清型Apx-毒素的疫苗将 甚至不会诱导对单-血清型的保护。 较早时期已描述了基于体外合成,丧失其毒性的胸膜肺炎放线杆菌 RTX-毒素的亚单位疫苗,如在欧洲专利EP NO.0354.628中所述,其中公 开了基于胸膜肺炎放线杆菌溶血素和细胞毒素的亚单位疫苗,并且在欧洲 专利EP NO.0453.024中所述,其中公开了基于溶血素、细胞毒素和外膜蛋 白的胸膜肺炎放线杆菌亚单位疫苗。 然而对亚单位疫苗来说一般具有4个重要的不足: ·为了充分地激活免疫系统需要大量的免疫原性材料。 ·通常仅B-细胞免疫被激活。 ·几种保护性抗原仅在体内被激活,且因此不能够以亚单位疫苗形式 存在。 ·活的病原性细菌具有许多重要的免疫原性分子,如外膜蛋白和荚膜 蛋白,它们均对于保护至关重要且因此被包括进有效的亚单位疫苗中。 仅次于上述第1和第2点,尤其是第4点的明显问题使得难以制备有 效的亚单位疫苗。 这由例如在上述欧洲专利EP NO.0.453.024中公开的胸膜肺炎放线杆 菌亚单位疫苗加以说明,其中4种不同的亚单位(三种RTX-毒素和外膜蛋 白)结合于一种疫苗中。 很显然,为了克服抗Pasteurellaceae感染亚单位疫苗的不足,一种活 的减毒疫苗将是高度需要的。 活减毒疫苗具有下面的优势: 其可用低剂量施用(其是自我复制的) 其密切模拟天然/野生-型感染 其同时提供所有可能的免疫学重要的抗原。不过,尽管明显的优势, 本发明之前还没有商业上可得到的基于胸膜肺炎放线杆菌的活疫苗。其原 因在于下面似是而非的论点:如前述,Apx-I、-II和-III均是抗胸膜肺炎 放线杆菌感染普通疫苗的必需成分。因此活疫苗必需产生这三种RTX-毒 素。然而这三种RTX-毒素是所有放线杆菌种类中强有力的毒性因子(见, 如Coote,J.G.;FEMS微生物学综述88:137-162(1992)),Tascon 等.;分子微生物学,14:207-216(1994),Jansen等.;感染与免疫.63: 27-37(1995))。 为了减弱活App菌株的毒力而对RTX-毒素的缺失在技术上是可行 的,但其没有提供解决问题的途径:由于它们不再在宿主中诱导对胸膜肺 炎放线杆菌溶血/细胞毒活性的免疫性,故这种RTX-阴性菌株作为活减毒 疫苗菌株将是无用的。 然而到现在,尽管在诱导免疫性中是重要的,但在建立免疫性中较 ApxI、-II和-III是次要的毒力因子还是未知的。 因此,在App基因组中具有这样的位点是高度必要的,即该位点当被 修饰时有利于毒力且因此导致减毒的App菌株,而同时,尽管其在激发免 疫性中是有用的,但从疫苗观点来看是必不可少的。然而这样的位点目前 还是未知的。此外,如果这样的位点将普遍存在于所有的App菌株中而不 是局限于某些血清型中,该位点是高度必要的。那么这样的位点将通过相 同位点的缺失允许对所有不同的血清型减毒。 提供普遍存在于无论什么血清型的所有胸膜肺炎放线杆菌菌株中的这 种减毒位点是本发明的目的之一。 最近,在胸膜肺炎放线杆菌血清型1菌株中发现了一种新的基因(论 文T.J.Anderson Nov.1995)。 尽管该基因不象已知的放线杆菌的ApxI、-II和-III基因,但其与已知 的脑膜炎奈氏球菌的RTX-毒素具有相似性,正是由于此原因将其命名为 RTX-基因apxIV。然而该基因几乎在所有的方面均与上述存在于各种放线 杆菌科的不同种中的三种已知RTX-毒素基因apxI、-II和-III不同。首先, 基因组结构完全不同。其次,没有如同发现于已知Apx-毒素的激活机制。 第三,在那时没有特异性的体内溶血或细胞毒活性可归结于该基因或其可 能的基因产物。 现已惊奇地发现该基因与三种已知的RTX-基因完全不同,无论其什么 血清型存在于胸膜肺炎放线杆菌的所有种类中。这通过探针杂交加以测 定,该探针包括apxIV编码序列,此序列中具有实施例6和7中所述所有 血清型胸膜肺炎放线杆菌的DNA限制性片段。出乎意料的是现已发现,虽 然apxIV缺失突变体是存活的,但与其具有apxIV的母本菌株相比,它们 毒性较小。 因此,已确定该基因产物,ApxIV毒素是所有胸膜肺炎放线杆菌菌株 中的毒力因子。这是个出乎意料的结论。因为到目前为止,根本没有什么 效应,更不用说可能影响毒力的效应被归结于该基因的体内产物。实际上, 直到现在无论如何甚至还没有该基因在胸膜肺炎放线杆菌体内或体外表达 的证据。因此以下的发现是本发明的优点之一: ·apxIV基因存在于任何血清型的所有胸膜肺炎放线杆菌菌株中; ·apxIV基因产物是所有胸膜肺炎放线杆菌血清型中的毒力因子, ·具有apxIV基因缺失的胸膜肺炎放线杆菌菌株仍然是存活的但具有 降低的毒力而没有显著减弱该菌株的免疫原性, 因此,本发明首次提供不产生有功能ApxIV毒素的胸膜肺炎放线杆菌 活减毒细菌。 有功能的ApxIV毒素被认为是这样的一种蛋白:即其具有在野生型细 菌中表达ApxIV毒素的所有特征,并且以野生型水平表达。因此,无功能 的ApxIV毒素被认为是这样的一种毒素:即其缺乏在野生型细菌中表达 ApxIV毒素的部分或所有特征,并且/或者以不足以获得ApxIV毒素野生型 效应的水平表达。 产生ApxIV毒素能力的丧失可,例如是由于编码ApxIV毒素编码序列 中的修饰。其也可是由于,例如,已知涉及apxIV基因转录的区域,如启 动子区域的修饰或由于涉及翻译区域,如核糖体结合位点的修饰。 apxIV基因的整体结构列于图1中。 该图中,ApxIV毒素特征性的同向重复区由阴影框(dashed box)表 示,而也是ApxIV特异的富含-甘氨酸的非肽(nonapeptide)区由黑箭头 表示。该重复区发现于ApxIV的C-末端部分。这些鉴别性特征存在于所有 的胸膜肺炎放线杆菌血清型中。两种血清型的核苷酸序列和氨基酸序列列 于SEQ.ID NO.1-4中。SEQ.ID.NO.1显示了App血清型1apxIV基因的核 酸序列,且SEQ.ID.NO.2显示了血清型1ApxIV毒素的相应氨基酸序列。 SEQ.ID.NO.3显示了App血清型3apxIV基因的核苷酸序列,而 SEQ.ID.NO.4显示了血清型3ApxIV毒素的相应氨基酸序列。图2显示各 种胸膜肺炎放线杆菌血清型的Apx-毒素之间的氨基酸水平,特别位于N- 末端的650个氨基酸具有相当高水平的保守性。这也是apxIV基因的异常 特性。从图1中显而易见,根据血清型的不同,位于该毒素C-末端重复数 目的差异可能发生。此差异解释了获自各种血清型基因及编码毒素大小的 差异。 甚至在分离自相同血清型的胸膜肺炎放线杆菌不同分离物的apxIV基 因之间可能有某些核苷酸序列的差异。这是由于本领域众所周知的存在于 所有有机体中的自然变异。在由apxIV基因编码的ApxIV毒素中某些氨基 酸由其它血清型ApxIV毒素中的别的氨基酸所替代是可能的,然而该多肽 功能没有改变。例如,在某一位点含有Asp的多肽和其相应位点含有Asn 的变异体仍然具有相同的特性。其中的氨基酸由功能类似氨基酸所替代的 方法称为功能性替换。此时的变异体蛋白称为功能性变异体。另一种变异 的原因是遗传密码简并现象。简言之,其意思为,例如氨基酸谷氨酸由GAT 和GAA所编码。除了Met和Trp以外,此现象适用于所有的氨基酸。因 此,很明显,例如本发明给出的血清型1ApxIV毒素可不仅由SEQ ID NO: 1中的核苷酸序列所编码而且也可由很多种其它序列所编码,所有的仍然得 到相同或功能相同的多肽。 因此,编码与ApxIV毒素功能相当多肽的变异apxIV序列属于本发明 的范围之内。 根据本发明的活减毒细菌可以几种方式获得。获得该菌一种可能的方 式是通过经典方法的途径,如以诱变剂如碱基类似物处理野生型胸膜肺炎 放线杆菌,以紫外光处理或温度处理细菌。不产生有功能ApxIV毒素的菌 株不诱导或以较小程度诱导抗ApxIV毒素抗体,且因此可容易地在动物测 试中加以筛选。必需的抗血清可按下面实施例3中描述获得。另一种可能 性是用重组DNA-技术有意识地向编码ApxIV毒素的基因中导入详细定义 的突变。这样的突变可以是插入、缺失、一个核苷酸被另一个所替代或其 组合,唯一的条件是该突变基因不再编码有功能的ApxIV毒素。可容易地 看出,尤其是在开放阅读框中导入终止密码子的突变,或导致开放阅读框 中移码的突变很适于获得不再编码有功能ApxIV毒素的菌株。这种突变可 通过,例如,用Clontech销售的Transformer试剂盒的体外定点诱变方 法加以完成。许多其它标准的重组DNA技术如以限制性酶消化基因,然后 以内切核酸酶处理和重新连接同样是可用的。 因此,在优选的方式中,本发明的该实施方案涉及其中编码ApxIV毒 素的基因包括突变的活减毒细菌。 包括apxIV基因片段或甚至整个基因缺失,或异源DNA-片段插入的详 细定义的突变,与经典诱导的突变相比,具有这样的优势:即它们将不回 复到野生型状况。 因此,在更为优选的方式中,本发明的该实施方案指其中编码ApxIV 毒素的基因包括插入和/或缺失的活减毒细菌。 如果现将大量的疫苗施于猪中,只要是为了降低接种费用的原因,很 明显几种疫苗的联合施用将会是合乎需要的。因此,使用活体减毒疫苗菌 株作为编码选自其它病原性微生物或病毒抗原的异源基因的重组载体是很 有吸引力的。施用这样的重组载体具有这样的优势,即施用该载体后,诱 导出同时抗两种或更多种疾病的免疫性。因为编码ApxIV毒素的基因可用 作这样异源基因的插入位点,所以根据本发明的活减毒细菌提供了异源基 因很适宜的载体。ApxIV基因用作插入位点具有这样的优势:即apxIV基 因被同时失活,并且新导入的异源基因可根据同源的胸膜肺炎放线杆菌基 因来表达。这种重组载体的构建可用标准的分子生物学技术如同源重组按 常规地加以完成。因此,在甚至更为优选的实施方案中,本发明涉及这样 的活减毒的胸膜肺炎放线杆菌:即其不产生有功能的ApxIV毒素,并且其 中有异源基因插入到ApxIV基因中。如上述,这样的异源基因可以是例如, 编码选自其它病原微生物或病毒抗原的基因。另一种可能性是插入编码涉 及激发免疫系统的蛋白,如白细胞介素或干扰素的基因。 在本发明更为优选的形式中,异源基因编码一个或更多个选自以下类 群的抗原,包括猪生殖呼吸综合症(PRRS)病毒、假狂犬病毒、猪流感 病毒、猪细小病毒、传染性胃肠炎病毒(Transmissible Gastroenteritis vires)、轮状病毒、大肠杆菌、猪丹毒丝菌、多杀巴斯德氏菌、支气管炎 博德特氏菌、副猪嗜血菌及猪链球菌。 然而在重组载体中异源基因的表达有严重的潜在危险:已知这几种蛋 白如果在异源菌中表达是有毒的。因此,编码该蛋白的基因决不可导入异 源载体中,因为由于表达一定量异源基因,故成功的重组体将会最终死亡。 流感嗜血杆菌的P-2蛋白,仅列举一个实施例,可简单地不在大肠杆菌中 表达(Munson等,感染与免疫57:88-94(1989))。本发明的目标 之一是提供没有此缺点的重组活载体。已意外发现,尽管apxIV基因在体 内有效表达(见实施例5),但是其在体外不表达(见实施例4)。这是 从未能在体外培养的胸膜肺炎放线杆菌培养物中显示出ApxIV毒素的存在 得出的。这意味着ApxIV的表达依赖于其中培养有胸膜肺炎放线杆菌外在 环境来开启和关闭。该特征较已知的活重组载体提供了出乎预料的优势: 如果异源基因的表达受apxIV启动子控制,那么无论插入什么异源基因, 根据本发明的胸膜肺炎放线杆菌活减毒载体可在体外培养至高密度,因为 外源基因在这些条件下将不表达。施用许多细菌至宿主以后,异源基因的 表达将开始且在复制期间或细菌死后的某个时间,其将是宿主的免疫系统 可利用的。可通过,例如,用异源基因的编码区替代apxIV基因的编码序 列而将待表达的异源基因有功能地连接到apxIV启动子上。替代整个apxIV 基因是不必要的:以包括其终止密码子的异源基因编码区替代ApxIV的 ATG密码子就已足够。通过建立融合构建体在apxIV启动子影响下表达异 源基因也是可能的。这可通过在具有apxIV ATG密码子下游的apxIV阅读 框的框架中插入异源基因加以完成。 词语“有功能地连接到apxIV启动子上”意思为异源基因的转录在 apxIV启动子处起始。 不用说,插入异源基因的每个位置,其中的异源基因有功能地连接到 apxIV启动子上,存在于本发明的范围之内。 因此,该实施方案最为优选的形式涉及本发明的活减毒细菌,其中带 有有功能地连接到apxIV启动子区域上的异源基因。 天然apxIV启动子是个可开关的启动子,其在体外关闭且在体内打开, 该惊人的发现使该启动子成为其天然宿主中和作为其它细菌的异源启动子 很通用的表达工具。当用作其它细菌中的异源启动子时,包括该启动子的 DNA可从其宿主中分离并转入除胸膜肺炎放线杆菌以外的细菌中。 现在易行的另一种选择是克隆数拷贝的apxIV启动子,其中每种控制 着另一种基因的表达。这虽然能够在宿主菌胸膜肺炎放线杆菌中加以完 成,但该多拷贝原理同样适用于其它细菌。如上述,该启动子可用于在体 内选择性地表达一种或多种编码选自其它病原微生物或病毒抗原的异源基 因。该启动子也可用于表达编码细胞因子如白细胞介素、肿瘤坏死因子或 干扰素的异源DNA序列。已知数种细胞因子,如干扰素作为免疫调节剂而 起重要作用。因此在apxIV启动子的控制下表达这样的遗传信息可能是优 越的。因此,本发明的另一实施方案涉及带有控制apxIV基因表达启动子 的核苷酸序列。 在自然状态下控制apxIV基因表达的可开关启动子现被发现位于SEQ ID NO:5中位置451和1132之间的DNA片段中。很明显该DNA片段 中那些非启动子必需成分的部分不必要存在于该片段中。因此,保留该启 动子活性的此DNA片段的较短部分同样适用于异源基因的表达。因此,该 实施方案更为优选的形式涉及包括SEQ ID NO:5中位置451到1132DNA 片段或其仍具有启动子活性子片段的核苷酸序列。 细菌启动子均具有两个共有区,所谓的-10和-35区。虽然这些共有区 的侧翼序列可能在一定程度上影响启动子的效率,仅使用包括-35与ATG 密码子之间的DNA片段的启动子区域部分可能是优越的。该DNA片段位 于SEQ ID NO:5的位置617与位置641之间。因此,在本发明该实施方 案更为优选的形式中涉及包括SEQ ID NO:5中位置617至641之间DNA 片段的核苷酸序列。 本发明也涉及作为亚单位疫苗成分的ApxIV毒素。亚单位疫苗将最为 可能包括这三种已知的Apx-毒素。这一点上面已经提到。然而,如上述, 由于意外地发现ApsIV毒素存在于所有胸膜肺炎放线杆菌血清型中,故其 是亚单位疫苗理想的添加成分:产生的抗ApxIV毒素的中和抗体提供了对 无论什么血清型的每种及所有胸膜肺炎放线杆菌株所产生ApxIV毒素的保 护。因此,本发明的另一个实施方案涉及用于保护动物免受胸膜肺炎放线 杆菌细菌感染的亚单位疫苗,其中包括纯化的ApxIV毒素。ApxIV毒素可 单独施用,或与任何或所有上述的毒素ApxI、-II和-III结合施用和/或, 例如,与胸膜肺炎放线杆菌外膜蛋白(OMPs)结合施用。可通过将ApxIV 毒素以足以诱导免疫反应的量与药物上可接受的载体混合而容易地制备该 疫苗。通过在适当的表达载体中导入apxIV基因、表达该基因及分离毒素 而制备ApxIV毒素是可能的。本领域中已知有多种通用表达系统,如细胞 表达系统,杆状病毒表达系统及哺乳动物细胞表达系统。在实施例3中描 述了如何通过大肠杆菌中表达该基因而获得ApxIV毒素。 本发明的另一实施方案涉及活减毒疫苗,其中包括上述用于保护动物 免受胸膜肺炎放线杆菌感染的活减毒细菌。这种疫苗可通过将活减毒细菌 与药物上可接受的载体混合而获得。这些疫苗包括至少免疫原性有效量的 根据本发明活减毒产生菌。免疫原性有效量意思为接种时施用的活减毒菌 的量足以在宿主内诱导对产生毒性形式RTX-毒素菌的有效免疫反应。待施 用的有用剂量将随着年龄、体重及接种的动物,施用的方式和接种所要针 对病原体的类型而改变。此疫苗包括足以导致免疫反应的任何剂量的细 菌。例如,103与105个细菌之间的剂量范围是很合适的剂量。 药物上可接受的载体可以是简单的如水,但其也可以包括,例如,在 其中培养细菌的培养液。其它合适的载体例如,生理盐浓度的溶液。用于 本发明其它药物上可接受载体或稀释剂的实例包括稳定剂如SPGA、碳水 化合物(如山梨醇、甘露醇、淀粉、蔗糖、葡萄糖、葡聚糖)、蛋白如清 蛋白或酪蛋白、含有蛋白如牛血清或去脂牛奶的试剂及缓冲液(如磷酸盐 缓冲液)。 任选地,具有佐剂活性的一种或多种化合物可加入到疫苗中。佐剂为 非特异性的免疫系统刺激剂。它们增强宿主对入侵病原体的免疫反应。本 领域已知佐剂的实例有弗氏完全和不完全佐剂,维生素E,非离子型嵌段 聚合物,胞壁酰二肽,ISCOMs(免疫刺激复合物,参考如欧洲专利 EP109942),皂角苷,矿物油,植物油和Carbopol(均聚物)。特别是 适用于粘膜应用的佐剂有,例如,大肠杆菌热不稳定性毒素(LT)或霍乱 毒素(CT)。 其它合适的佐剂有,例如,氢氧化铝,磷酸铝或氧化铝,油性乳剂(如 Bayol F(R)或Marcol52(R),皂角苷或维生素E-加溶物。 因此,在优选形式中,根据本发明的疫苗包括佐剂。 为了施用到动物,根据本发明的疫苗可特别地以鼻内、皮内、皮下、 通过烟雾剂或肌肉内施用。 有几种保存亚单位和活生物的方式。例如在冰箱内保存是众所周知的 方法。在含有甘油的缓冲液中于-70℃保存也常使用。细菌也可保存于液氮 中。冷冻干燥是另一种保存方式。冷冻干燥的细菌可被保存并维持存活多 年。冷冻干燥的细菌的保存温度可位于零度以上而不损害其存活力。冷冻 干燥同样适用于亚单位。 冷冻干燥可根据众所周知的标准冷冻干燥方法加以完成。任选有利的 添加剂,如去脂牛奶、海藻糖、明胶或牛血清白蛋白可在冷冻过程中加入。 因此,在更为优选的实施方案中,根据本发明的疫苗是冷冻的形式。 在该实施方案更为优选的形式中,疫苗还额外包括一种或多种选自其 它病原体微生物或病毒的抗原。这种疫苗可通过将选自其它病原菌或病毒 的一种或多种抗原添加到根据本发明的活减毒菌及上述药物上可接受的载 体中而获得。 当然,不仅添加一种或多种抗原,而且添加一种或多种整个病原体如, 失活或活性形式病原体是可能的。 作为选择,可用上述已知的重组DNA技术将编码一种或多种选自其它 病原微生物或病毒的抗原的遗传信息克隆到活减毒菌中而获得疫苗。无论 从医学还是从身体角度看,这种疫苗当然较以每种病原体单独接种对接种 的动物产生较小的协迫。 在甚至更为优选的形式中,这些抗原选自猪生殖呼吸综合症(PRRS) 病毒、伪狂犬病毒、猪流感病毒、猪细小病毒、传染性胃肠炎病毒、轮状 病毒、大肠杆菌、猪丹毒丝菌、多杀巴斯德氏菌、支气管炎博德特氏菌、 副猪嗜血菌及猪链球菌。 本发明也涉及不能产生有功能ApxIV毒素的各种活减毒胸膜肺炎放线 杆菌的制备方法。这些方法包括在编码apxIV蛋白的基因中导入突变。用 诱变剂的经典突变技术和本领域众所周知的用于apxIV基因遗传信息插 入、替代或缺失的重组DNA技术是可用的。 在更为优选的形式中,上述方法用于导入缺失。 包括将根据本发明的细菌与药物上可接受的载体混合的用于本发明活 减毒疫苗制备的方法也是本发明的一部分。 用于亚单位疫苗制备的方法也在本发明的范围之内。该方法包括将纯 化的ApxIV毒素与药物上可接受的载体混合。 在活疫苗接种领域中另一个普遍认识到的问题如下:在宿主动物血清 中抗某种病原体抗体的存在表明该宿主已被此毒性或减毒形式的病原体感 染。然而区分野外感染的动物与以活疫苗菌株接种的动物是不可能的。根 据本发明的活体减毒胸膜肺炎放线杆菌按如下提供了该问题的解决方案: 如在实施例3中所述,胸膜肺炎放线杆菌血清型1的apxIV基因已被分离 并在异源宿主细胞中表达。将此表达产物进行PAAGE-凝胶电泳且然后用 于Western-印迹。将印迹与获自以胸膜肺炎放线杆菌有意识感染猪的恢复 期血清及获自野生菌株感染的血清孵育。发现apxIV基因在所有测试的胸 膜肺炎放线杆菌野生菌株中均有体内表达。这表明以胸膜肺炎放线杆菌感 染的猪将一直具有抗所有感染菌株血清型的感染它们的菌株的抗体。由于 apxIV基因的缺失,根据本发明的活减毒菌不再产生ApxIV毒素。因此以 本发明的活减毒胸膜肺炎放线杆菌菌株接种的动物在其血清中将不具有抗 ApxIV毒素的抗体。 在比较测试,如ELISA测试中,该血清将因此与所有免疫原性的胸膜 肺炎放线杆菌-蛋白如ApxI、II和/或III反应,但将不与ApxIV起反应。 然而,以胸膜肺炎放线杆菌野生菌株感染猪的血清将与所有免疫原性的胸 膜肺炎放线杆菌-蛋白,包括ApxIV起反应。因此,根据本发明的活减毒胸 膜肺炎放线杆菌证明是很适宜的标记疫苗,即可与野生菌株区分的疫苗菌 株。 用于区分疫苗菌株与野生菌株的诊断测试可以是简单的ELISA-测 试,其中的纯化ApxIV毒素涂到ELISA-平板的孔壁上。然后与待测的猪 血清孵育,接着与,如标记的抗猪抗体孵育可显示抗ApxIV毒素的抗体存 在与否。 另一种诊断测试系统的实例是,如,将包括纯化ApxIV毒素的Western 印迹与待测的猪血清孵育,接着检测特异性的抗-ApxIV抗体。 因此,用于区分以胸膜肺炎放线杆菌野生菌株感染猪的血清与以包括 本发明活减毒疫苗胸膜肺炎放线杆菌菌株疫苗接种猪的血清(包括纯化 ApxIV毒素)的诊断测试也在本发明的范围之内。 猪健康保护中的另一问题如下:即难以用快捷而清晰的方式测定猪是 否以胸膜肺炎放线杆菌或猪放线杆菌感染,或是二者共同感染。目前还没 有用于对猪放线杆菌特异性检测的诊断测试。这主要是由于这样的事实, 即胸膜肺炎放线杆菌与猪放线杆菌共有许多相同的抗原。两种高度抗原性 的Apx-毒素可作为实例;在如猪放线杆菌中,ApxI与ApxII具有高度保 守的同源物(Van Ostaayen等.,待发表)。 编码ApxI、-II和-III毒素或同源物的已知RTX基因实际上发现于放 线杆菌属的所有成员中,如胸膜肺炎放线杆菌、猪放线杆菌、罗氏放线杆 菌及马驹放线杆菌。因此,本发明者最初认为,新的RTX-毒素ApxIV在 所有放线杆菌属成员中是相同的。然而,测试猪病原性放线杆菌后发现, 又一次与已知三种RTX-基因惊奇地形成鲜明对照,即该新的RTX-基因 apxIV仅存在于猪病原体胸膜肺炎放线杆菌中。其没有出现于所有其它常 见的猪病原性放线杆菌各种类中,且因此它也没有出现于猪放线杆菌中。 见实施例6和7。因此,令人惊奇地注意到猪血清中抗ApxIV抗体的存在 是猪被胸膜肺炎放线杆菌感染而不是被猪放线杆菌或任何其它猪病原体放 线杆菌种类感染的快捷而又清晰的证据。 这样,本发明也提供了基于抗ApxIV抗体存在与否的诊断测试,且因 此用于特异性区分胸膜肺炎放线杆菌感染与猪放线杆菌感染的区别测试。 这种测试可以是,如,ELISA测试,其在分离的小孔中包括既存在于胸膜 肺炎放线杆菌又存在于猪放线杆菌中的ApxI及-II毒素和纯化的ApxIV毒 素。猪放线杆菌感染的动物血清将仅与包括ApxI和Apx-II的小孔起反应 而胸膜肺炎放线杆菌感染的动物也将与包括纯化ApxIV毒素的小孔起反 应。 实施例1: 胸膜肺炎放线杆菌血清型1apxIV基因的克隆与分析 标准的分子生物学方法(质粒DNA分离,限制性酶切、琼脂糖凝胶电 泳、Southern印迹、连接、转化、电穿孔),如果没有另作说明,基本上 按Sambrook等(分子克隆,实验手册,冷泉港、纽约,1989)或Ausubel 等(当前分子生物学方法,John Wiley & Sons,纽约,1987)的描述进 行。PCR基本上按Innis等(PCR方法,方法及应用指南,学术出版公司, 圣地亚哥,1990)所述进行。染色体DNA分离根据Pitcher等(应用微生 物学通迅8;151-156,1989)完成。所有胸膜肺炎放线杆菌参比菌株(血 清型1:菌株4074;血清型2:菌株S1536:血清型3:S1421;血清型 4M62;血清型5a:K17;血清型5b:L20;血清型6:femφ;血清 型7:WF83;血清型8:405;血清型9:CVI13261;血清型10:13039; 血清型11:56153及血清型12:8329)的来源由Frey和Nicolet描述(临 床微生物杂志,28;232-236,1990)。胸膜肺炎放线杆菌血清型3菌 株HV114为野生型分离子(即在Beck等,临床微生物学杂志.,32; 2749-2754,1994中测试的血清型3菌株之一)。所用的其它放线杆菌菌 株;罗氏放线杆菌:ATCC27072;马驹放线杆菌:ATCC19392;猪放线 杆菌:ATCC15558。溶血巴斯德氏菌1型菌株ATCC14003被使用。 所用的大肠杆菌宿主菌株:XL1-blue(Stratagene,La Yolla,Ca;基因 型:rec A1 end A1 gyrA96 thi-1 hsd R17 sup E44 rel A 1lac[F’proAB laclq ZDM 15 Tn10(Tetr)])及HMS174(DE3)(AMS生物技术公司, 瑞士;基因型:F-rec A(rk12-mk12+)rifr IDE3)。根据获自T.J.,Anderson 论文的初步序列数据(Guelph大学,1995),合成两条命名为 APXIVA-1L(5’-TGGCACTGACGGTGATGA-3’)和APXIVA-1R(5’ -GGCCATCGACTCAACCAT-3’)的引物。这些引物用于以胸膜肺炎放 线杆菌血清型3菌株HV114和血清型1参照菌株4074的染色体DNA作为 模板的PCR扩增中。用两种菌株扩增出442bp的片段。将获自血清型3染 色体DNA的此片段根据制造商方法手册以洋地黄毒苷-11-dUTP(宝灵曼) 标记(此片段命名为探针APXIVA,见图4)。随后将该标记探针用于与 含有ClaI消化的菌株4074染色体DNA的Southern印迹杂交。该探针与 大约8.0kb的片段杂交。血清型1菌株4074的apxIV基因通过将ClaI消 化的染色体DNA连接到ClaI消化的pBluescript II SK-(Stratagene美国) 中而加以分离。以连接的DNA转化大肠杆菌菌株XL1-blue并将转化体于 含有100mg/ml氨苄青霉素的LB平板上进行筛选。 用APXIVA探针通过平板硝酸纤维素复制品的菌落杂交筛选带有 apxIV的克隆。这样,分离到命名为pROK7的质粒并显示其带有约8kb 的ClaI插入子。将ClaI插入子的头6736bp进行测序(SEQ ID 1)并鉴 定出编码具有约186KD预期大小的编码1657个氨基酸残基蛋白 (SEQ ID 2)的4971个核苷酸的开放阅读框。该基因命名为apxIV-var1 (见图3)。 实施例2: 胸膜肺炎放线杆菌血清型3apxIV基因的克隆与分析 将标记的探针APXIVA(在实施例1中提到)用于与含有ClaI消化的 HV114菌株染色体DNA的Southern印迹杂交。探针与约7.0kb的片段杂 交。将从HV114分离的染色体DNA以CIaI消化,并与ClaI消化的 pBluescript II SK-(Stratagene美国)连接。以连接的DNA转化大肠杆菌 菌株XL1-blue并于具有100mg/ml氨苄青霉素的LB平板上筛选转化体。 用APXIVA探针通过平板的硝酸纤维素复制品的菌落杂交筛选带有apxIV 的克隆。因此,分离出一个名为pROK5的质粒并显示其带有约7kb的ClaI 插入子。通过序列分析分析该插入子(SEQ ID 3)。鉴定出一个4146bp 的开放阅读框,其编码具有约154KD预期大小的1382氨基酸残基的蛋白 (SEQ ID 4)。该基因命名为apxIV-Var3(见图3)。 实施例3: ApxIV var3-多聚组氨酸融合蛋白在大肠杆菌中的表达 由质粒pROK5,制备一个缺失克隆,其中含有apxIV基因的3’末端, 从BamHI位点(SEQ ID NO:3中核苷酸NO.2747)到apxIV基因插 入下游末端的ClaI位点。将该质粒命名为pROK1。用寡核苷酸 APXIVAHIS1-L(5’-AGCCATATGGGCGATTTAAATTTCAG-3’)及 APXIVAHIS1-R(5’-TATGGATCCTCCGTGCTTCTGAGC-3’)和质粒 pROK1 DNA作为模板,扩增出2.1kb的DNA片段(见图4),其中含有 分别位于5’和3’末端NdeI及BamHI限制性位点两侧的apxIV-var3(SEQ ID 3)中3520到5643bp的区域。在表达载体pETHIS-1中克隆NdeI/BamHI 消化的PCR片段后,以相同的酶消化,获得名为pJFFapxIV6/10 his-1的 质粒。质粒pETHIS-1是pET14b(Novagen公司.,Madison,Wi)的衍 生物,其中的多克隆位点已被扩展且已插入编码组氨酸十聚体 (decamer)的区域。因而,pJFFapxIV6/10 his-1质粒含有T7启动子控 制下的翻译融合体,其编码组氨酸六聚体、后接SEQ ID 4中653到1360 氨基酸残基,后面再接上组氨酸十聚体。将此质粒转化至具有pLysS的大 肠杆菌菌株HMS174(DE3)中,其中含有IPTG可诱导的T7RNA聚合 酶基因和用于增加稳定性的T7溶菌酶基因。将该菌株培养于含25mg/ml 氯霉素及100mg/ml的氨苄青霉素的LB培养基至0.5的OD650,并以10mM 浓度的异丙基-b-D-硫代吡喃半乳糖苷诱导。添加IPTG以后,细胞于37 ℃孵育2.5小时,离心收获细胞,并且分离包涵体形式的80kD预期大小的 融合蛋白。将包涵体溶解于pH8.0的6M盐酸胍、300mM NaCl和50mM NaH2PO4溶液中且80kD融合蛋白通过用Ni2+螯合柱(Qiagen AG,Basel) 的固定金属亲和层析(IMAC)(Schmitt等,分子生物学报告18; 223-230,1993)进一步加以纯化。以pH5.0从柱中洗脱纯净蛋白。将收 集的馏份于pH8.0的300mM NaCl和50mM NaH2PO4溶液中透析。以用1 体积完全弗氏佐剂(Difco实验室,Detroit,MI)混合的500mg多聚组 氨酸融合产物免疫兔子。3周后施以混合有不完全弗氏佐剂的相同量的增 强剂量。增强免疫后四周,将兔子放血并获得包括抗-ApxIV毒素抗体称为 血清522-409的超免疫血清。 实施例4: apxIV基因在体外培养的胸膜肺炎放线杆菌中的表达 将血清型1的胸膜肺炎放线杆菌参比菌株培养于补充以10mg/ml b- NAD的Columbia肉汤中并按所述(Beck等,临床微生物杂志,32; 2749-2754,1994)进行收获。在相邻于包括ApxIA、ApxIIA和ApxIVA- 多聚组氨酸融合蛋白道的位置通过聚丙烯酰胺凝胶电泳(Laemmli,自然 227:680-685,1970)分离浓缩的培养上清并进行Western印迹方法 (Towbin等,美国自然科学院院报76:4350-4354,1979)。将Western 印迹按Beek等所述(临床微生物学杂志,32;2749-2754,1994)与抗 -ApxIA-和抗-ApxIIA单克隆抗体及抗-ApxIV血清522-409(见实施例 3)起反应。分离的血清型1RTX毒素馏份清楚地含有ApxIA和ApxIIA。 ApxIVA的存在没能得到证实(见图5)。 实施例5: apxIV基因在胸膜肺炎放线杆菌感染期间的体内表达 将含有80kD多聚组氨酸-ApxIV-var3融合蛋白(见实施例3)的聚丙 烯酰胺凝胶转移至硝酸纤维素膜上。将该膜分成细条带(strips)与抗血 清型1的(100倍稀释的)恢复期野生血清或以血清型1的参比菌株(Frey 和Nicolet,兽医微生物学,28;61-73,1991)实验性感染的猪血清起 反应。用碱性磷酸酶标记的抗兔IgG的偶联物(Kirkegaard Perry公司, Graithersburg,Md)与NBT(4-氮蓝四唑氯化物)及BCIP(5-溴-4-氯 -3-吲哚基-磷酸酯)显色观察反应(见图6)。血清型1野生型血清及实验 性感染的猪血清与80kD的多聚组氨酸-ApxIV-var3蛋白反应。这表明 ApxIV蛋白实际上表达,具有抗原性且在猪中胸膜肺炎放线杆菌感染过程 中诱导抗-ApxIV毒素抗体。 实施例6: 用Southern印迹(证明)apxIV基因在所有胸膜肺炎放线杆菌血清型 中的存在及其在非胸膜肺炎放线杆菌菌株中的不存在 为了研究apxIV基因在各种胸膜肺炎放线杆菌血清型及相关细菌中的 存在,制备三种探针(见图4)。探针APXIVA在实施例1中描述过。探 针APXIVA2在BamHI和NruI位点之间含有2015bp的DNA片段。通过 用寡聚体APPIV1-L(5’-GGGACAGTGGCTCAATTAAG-3’)和 (APPIV1-R(5’-AGCTGTAAACTCCACCAACG-3’)的PCR扩增制 备758bp的探针APPIVA1。所有的探针根据制造商手册以洋地黄毒苷- 11-dUTP(宝灵曼)标记并与Southern印迹杂交,印迹中含有所有胸膜肺 炎放线杆菌参比菌株和HV114野生菌株、猪放线杆菌(ATCC15558)、 罗氏放线杆菌(ATCC27072)及马驹放线杆菌(ATCC19392)的ClaI 消化的染色体DNA。所有三个探针反应类似(见图7APXIVA2探针的结 果)。所有的胸膜肺炎放线杆菌菌株反应,而没有观察到与猪放线杆菌、 马驹放线杆菌及罗氏放线杆菌菌株的反应。 实施例7: 用PCR扩增(证实)apxIV基因在胸膜肺炎放线杆菌及相关菌株中的 存在 用来自各种胸膜肺炎放线杆菌血清型、其它放线杆菌种类及溶血巴斯 德氏菌的50ng染色体DNA作为模板,及引物APXIVA-1L(5’- TGGCACTGACGGTGATGA-3’)和APXIVA-IR(5’- GGCCATCGACTCAACCAT-3’进行PCR扩增。产物在琼脂糖凝胶上分析 以后,在所有胸膜肺炎放线杆菌样品中观察到442bp预期大小的产物,但 没有在其它放线杆菌种类中观察到(图8)。这表明除了实施例6中的结 果外,PCR也可用于区分胸膜肺炎放线杆菌与其它放线杆菌种类。 实施例8: ApxIV-var1多聚组氨酸融合蛋白的过量表达 以质粒pROK-7(见实施例1)作为模板且寡核苷酸APX4/II5-L (5’-CGCCATATGACAAAATTAACTATGCAAG)及APX4II6-R (5’-CGCGAATTCAGCGACACAAGAGATAT)作为PCR-引物开始, 扩增PCR片段。然后将足够量的该片段以限制性酶NdeI和EcoRI消化并 克隆入实施例3中所述的以相同酶消化的表达载体pETHIS-1中。根据得 到的命名为pJFFApxIVA1His1的质粒,按实施例3中所述在大肠杆菌中 过量表达206kD的1841个氨基酸残基的多聚组氨酸融合蛋白(PAGE中 测定的MW)。如在SEQ ID NO:5中所述,该蛋白由横跨其中no.1132 至6546核酸的编码区所编码。蛋白的氨基酸序列显示于SEQ ID NO:6 中。在Western印迹中,显示此产物与特异性的抗-ApxIV血清522-409反 应(实施例3中描述的抗血清)。 实施例9: 通过以ApxIV接种保护小鼠免受APP感染 两种均源自血清型1参比菌株4074基因组材料的在实施例8中所述 206KD多聚组氨酸-ApxIV融合蛋白和相应的108KD多聚组氨酸-ApxIA- 融合蛋白按实施例3中所述过量表达。将诱导大肠杆菌细胞的细胞沉淀物 重悬于PBS缓冲液(1g细胞沉淀于6ml缓冲液中)并于冰上45秒钟超声 粉碎2次用于细胞裂解。以22.000xg 4℃离心20分钟后,弃上清并将3M 的尿素(pH6.3)溶液洗得到的沉淀。22.000xg离心20分钟后去除尿素, 并将得到的沉淀溶于6M的盐酸胍(pH8.0)中。经PAGE凝胶的光密度 测定后通过特定蛋白的浓度对蛋白样品进行标准化。样品以PBS稀释并以 油性佐剂配制。 15只小鼠为一组共3组以ApxIV抗原(36.3微克)、ApxIA抗原 (36.3微克)或仅以佐剂进行腹膜内免疫。以0.4ml体积施用疫苗。第一 次接种24天后,将每组小鼠分成7只和8只小鼠的两组,均以一半量的抗 原增强免疫。7只小鼠的组以0.2ml的体积在腹膜内进行增强免疫且8只 小鼠的组以0.1ml每只于后肢进行肌肉内接种。增强免疫13天后,将小鼠 1.5 108cfu的毒性血清型1菌株腹膜内感染。 实施例10: ApxIV的孔道形成能力: 表达ApxIV的新鲜诱导的大肠杆菌用作用于按Maier等,感染免疫, 64;4415-4423(1996)所述在人工脂双层中测试孔道形成的蛋白来源。 用于黑色脂双层实验的方法以前已有描述(Benz等;生物化学生物物理学 报511:305-319(1978)。膜由1%的asolection溶液(Sigma的大豆凝 集素型IV-S,St,Louis MO)于正癸烷中形成。形成10倍跨膜盐梯度 后5-10分钟用Keithley 610C静电计测量零电流膜电势(Zero current membrane potential)(Benz等,生物化学生物物理杂志551:238-247 (1979)。在0.5%胆固醇存在时ApxIV的存在导致高频率的孔道形成, 平均单个通道电导率(G)为4nS。 这些结果表示ApxIV诱导进入人工双层的孔道且因此对真核细胞是有 毒的且因此为胸膜肺炎放线杆菌的毒性因子。 附图说明: 图1:ApxIVA var1和ApxIVA var3(var代表血清型)的比较。图 示发现于C-末端的不同特征。阴影框代表ApxIVA中的同向重复区域。黑 体竖线表示富含甘氨酸非肽(nonapeptides)的位置,且DNA聚合酶家 族B特征以黑三角形表示。氨基酸序列YSDSANSKK代表ApxIVA var3 基因中的间隔序列。在ApxIVA var3中被缺失的ApxIVA var1序列片段也 显示于图中。 图2:ApxIVA var1和ApxIVA var3的同向重复1(A)、同向重复 2(B)及同向重复3(C)的氨基酸序列的比较。同向重复1,2和3 的每个拷贝由字母标记以区分它们用于序列比较。变异的残基以黑体字母 显示。 图3:pBLac7(T.J.Anderson学位论文.University of Guelph,1995),pROK7和pROK5的部分限制性图谱。不同的开放阅读框 (ORF’s)以箭头表示。pROK7中的lacZ断箭头表示该基因的部分测 序。潜在的rho-非依赖性转录终止子被标出(W)。潜在的转录起点由三 角形标出。限制性位点: A=Asp700;B=BamHI;C=ClaI;E=EcoRV;Ec=EcoRI;H=HindIII;N=NruI; Nd=NdeI,Nh=NheI;P=PstI;S=SpeI;Sm=SmI。 图4:各种寡核苷酸和探针在apxIVA var3基因图谱上的位置。 图5:ApxIV在体外培养的血清型1参比菌株4074中的表达。A板 与抗-ApxIA单克隆抗体反应,板B与抗-ApxIIA单克隆抗体反应且板C与 抗-ApxIVA血清522-409反应。1道含有ApxIA-多聚组氨酸融合蛋白,2 道含有ApxIIA-多聚组氨酸融合蛋白,3道含有菌株4074浓缩培养物上 清,4道含有ApxIVA多聚组氨酸融合蛋白。 图6:显示以参比菌株血清型1实验性感染的猪血清(1道)或以80KD 多聚组氨酸融合蛋白血清型1野生感染猪血清(2-4道)反应性的免疫印 迹。使用血清522-409作为阳性对照(+),用1000-倍稀释的多克隆兔抗 ApxI和ApxII(Frey等,感染免疫,57;2050-2056,1989)血清作 为阴性对照(-)。 图7:与探针APXIVA2杂交的ClaI消化的基因组DNA的Southern 印迹。1-13泳道:胸膜肺炎放线杆菌参比菌株;1:血清型1;2:血清 型2;3:血清型;4:血清型4;5:血清型5a;6:血清型5b;7: 血清型6;8:血清型7;9:血清型8;10:血清型9;11:血清型 10;12:血清型11;13:血清型12;14:HV114野生菌株;15: 猪放线杆菌(ATCC15558);16:罗氏放线杆菌(ATCC27072);17: 马驹放线杆菌(ATCC 19392)。分子大小标记(以千碱基对)显示于左 边。 图8:用引物APXIVA-1L和APXIVA-1R的PCR扩增。泳道分配: 1到13泳道分别含有胸膜肺炎放线杆菌参比菌株的1、2、3、4、5a、 5b、6、7、8、9、10、11和12血清型;14泳道:菌株HV114; 15泳道:猪放线杆菌ATCC15558;16泳道:罗氏放线杆菌ATCC27072; 17泳道:马驹放线杆菌ATCC19392;18泳道:李氏放线杆菌 (A.lignieresii)ATCC49236;19泳道:溶血巴斯德氏菌1型 ATCC14003。分子大小标记(以千碱基对)显示于左边。 (1)一般信息: (i)申请人: (A)名称:AKZO Noble N.V. (B)街道:Velperweg 76 (C)城市:Arnhem (E)国家:荷兰 (F)邮编:(ZIP):6824BM (ii)发明题目:活体减毒胸膜肺炎放线杆菌 (iii)序列数目:4 (iv)计算机可读形式: (A)介质类型:软盘 (B)计算机:IBM PC兼容机 (C)操作系统:PC-DOS/MS-DOS (D)软件:专利发布#1.0,1.30版(EPO) (2)SEQ ID NO:1信息: (i)序列特征: (A)长度:6736个碱基对 (B)类型:核酸 (C)链型:双链 (D)拓扑学:线性 (ii)分子类型:DNA(基因组) (iii)假设条件:无 (iv)反义:无 (vi)最初来源: (A)有机体:胸膜肺炎放线杆菌 (B)菌株:4074(血清型1参比菌株) (vii)直接来源 (B)克隆:pROK7 (ix)特征: (A)名字/关键:CDS (B)位置:1576…6549 (D)其它信息/密码子-起始-1576 /功能=“RTX毒素” /产物:“ApxIV_var1” /基因=“apxIV_var1” /数目=1 (xi)序列描述:SEQ ID NO:1: ATCGATATGC CGCCGGGTAC GGGCGATATC CAACTTACTC TTTCGCAACA AATTCCGGTT 60 ACCGGTGCGG TGGTGGTAAC CACTCCGCAA GATATTGCGT TATTAGATGC GGTGAAAGGT 120 ATTTCAATGT TCCAAAAAGT GTCGGTACCG GTCTTAGGTA TCATTGAAAA TATGAGCGTA 180 CATATCTGCC AAAATTGCGG TCACCACGAA GATATTTTCG GCACCGGCGG TGCGGAGAAA 240 GTGGCGAAGA AATACGGTAC TAAAGTATTA GGACAAATGC CGTTGCATAT TCGCTTACGT 300 CAAGATTTGG ATGCCGGCAC ACCGACCGTC GTTGCGGCAC CGGAACACGA AACCAGCCGA 360 GCCTATATTG AATTAGCGGC AAAAGTCGCT TCGGAATTAT ACTGGCAAGG TTCGGTTATC 420 CCGTCTGAAA TTATGATTCG TGAAGTAAAA TAAGTTTTAA TAACCACGAA AACACAAAGA 480 ACACAAGCGG TAGAATTTGC AGAAAAATTT GCAAATCCTA CCGCTTTTTT ATTAGTACGA 540 TTCGCTGTTG GACTGCTATT TGATTTGGTT TGTCAGGATA TTATGTTATT GTAATGAAAT 600 GTTAGTGAAT TATTTTTATT AATTTGAAAG GAAACAAAAT GAAAATAAAA AAACGTTACA 660 TTGCGCTGTT GGTCTTAGGT GTCGTTATCA GCTATGCCTG GTATCAAAAT TATCAATGGG 720 AACAGCTGAT GTTAAGCGGT TATTGTGAAA AGGACGGAAG TTATTTTGAT GATAGGCATA 780 CGAAGCAAGA ACTGATTGAT AGGGCAATTA ACTATATGCT GGAGCATCAA TCTAAAAAAA 840 CATACGATGC TTATACTGAT GAACCTTTAG AAATAAAACC ATATTTAACA ATAGAGGAAT 900 TTAAAAAACT CAATCCAAAT TGTTGTGAAA TTACCTCATG GCCAGCAGAT GCAGTTCCAC 960 AAGATTGGGA TGTTCGTGTG GAAGGTAAGG CATATAGGTA TGTAATCGTA AAATATTTAA 1020 GAACCTTAGC AAATAGAGAA CCTGAACGAT GGGAAACTAG TATTGTTTTT GATAATTGCG 1080 GCAATCCTAA AAGAGCAAGC TACTTATATT ATTTAAAGAG AGAAATTTAT TATGACAAAA 1140 TTAACTATGC AAGATGTGAC CAATTTATAT TTATATAAAA CGAAAACTCT ACCTAAAGAT 1200 AGATTGGATG ATTCACTTAT TTCTGAAATA GGAAAAGGAG ATGATGATAT TGATAGAAAA 1260 GAATTTATGG TGGGGCCGGG ACGTTTTGTG ACCGCTGATA ACTTTAGCGT TGTAAGAGAT 1320 TTTTTTAATG CTGGGAAATC ACGCATTATT GCGCCGCAAG TCCCGCCTAT TCGTTCACAG 1380 CAGGAAAAAA TCTTGGTCGG TTTAAAACCG GGCAAATATT CCAAAGCGCA GATATTGGAA 1440 ATGCTGGGTT ATACGAAAGG CGGAGAAGTG GTAAATGGCA TGTTTGCCGG TGAAGTCCAG 1500 ACATTAGGCT TTTATGACGA TGGCAAAGGG GATTTACTCG AACGCGCCTA TATCTGGAAT 1560 ACCACAGGAT TTAAA ATG AGC GAC AAT GCC TTT TTT GTT ATA GAA GAA TCA 1611 Met Ser Asp Asn Ala Phe Phe Val Ile Glu Glu Ser 1 5 10 GGC AAA CGC TAT ATT GAA AAC TTT GGT ATT GAA CCT CTT GGT AAG CAA 1659 Gly Lys Arg Tyr Ile Glu Asn Phe Gly Ile Glu Pro Leu Gly Lys Gln 15 20 25 GAA GAT TTT GAT TTT GTC GGC GGC TTT TGG TCT AAC TTA GTG AAT CGT 1707 Glu Asp Phe Asp Phe Val Gly Gly Phe Trp Ser Asn Leu Val Asn Arg 30 35 40 GGT TTG GAA AGT ATT ATC GAC CCA TCC GGT ATC GGT GGA ACG GTA AAC 1755 Gly Leu Glu Ser Ile Ile Asp Pro Ser Gly Ile Gly Gly Thr Val Asn 45 50 55 60 CTT AAC TTT ACC GGC GAG GTG GAA ACC TAC ACG TTA GAC GAA ACA AGG 1803 Leu Asn Phe Thr Gly Glu Val Glu Thr Tyr Thr Leu Asp Glu Thr Arg 65 70 75 TTT AAA GCG GAA GCG GCG AAG AAA AGC CAT TGG AGT TTA GTG AAT GCG 1851 Phe Lys Ala Glu Ala Ala Lys Lys Ser His Trp Ser Leu Val Asn Ala 80 85 90 GCG AAA GTA TAC GGC GGT TTA GAC CAA ATT ATT AAA AAA CTA TGG GAC 1899 Ala Lys Val Tyr Gly Gly Leu Asp Gln Ile Ile Lys Lys Leu Trp Asp 95 100 105 AGT GGC TCA ATT AAG CAT TTA TAT CAA GAT AAA GAT ACG GGC AAA TTA 1947 Ser Gly Ser Ile Lys His Leu Tyr Gln Asp Lys Asp Thr Gly Lys Leu 110 115 120 AAA CCG ATT ATT TAC GGC ACG GCC GGC AAC GAC AGT AAG ATT GAA GGC 1995 Lys Pro Ile Ile Tyr Gly Thr Ala Gly Asn Asp Ser Lys Ile Glu Gly 125 130 135 140 ACT AAA ATC ACC CGT AGG ATT GCG GGT AAA GAA GTT ACG CTT GAT ATT 2043 Thr Lys Ile Thr Arg Arg Ile Ala Gly Lys Glu Val Thr Leu Asp Ile 145 150 155 GCC AAT CAG AAA ATT GAA AAA GGC GTG TTA GAG AAA TTG GGG CTG TCT 2091 Ala Asn Gln Lys Ile Glu Lys Gly Val Leu Glu Lys Leu Gly Leu Ser 160 165 170 GTT AGT GGT TCG GAT ATC ATT AAA TTG TTG TTT GGA GCA TTG ACT CCA 2139 Val Ser Gly Ser Asp Ile Ile Lys Leu Leu Phe Gly Ala Leu Thr Pro 175 180 185 ACT TTA AAT AGA ATG TTG CTA TCA CAA CTT ATC CAG TCT TTT TCC GAT 2187 Thr Leu Asn Arg Met Leu Leu Ser Gln Leu Ile Gln Ser Phe Ser Asp 190 195 200 AGC TTG GCT AAA CTT GAT AAT CCC TTA GCC CCT TAC ACT AAA AAT GGC 2235 Ser Leu Ala Lys Leu Asp Asn Pro Leu Ala Pro Tyr Thr Lys Asn Gly 205 210 215 220 GTG GTT TAT GTC ACC GGC AAA GGG AAT GAT GTG CTT AAA GGA ACT GAA 2283 Val Val Tyr Val Thr Gly Lys Gly Asn Asp Val Leu Lys Gly Thr Glu 225 230 235 CAT GAG GAT TTG TTT CTC GGT GGT GAG GGG AAT GAT ACT TAT TAT GCG 2331 His Glu Asp Leu Phe Leu Gly Gly Glu Gly Asn Asp Thr Tyr Tyr Ala 240 245 250 AGA GTA GGC GAT ACA ATT GAA GAC GCC GAC GGC AAA GGT AAA GTC TAT 2379 Arg Val Gly Asp Thr Ile Glu Asp Ala Asp Gly Lys Gly Lys Val Tyr 255 260 265 TTT GTG AGA GAA AAA GGG GTA CCT AAG GCG GAT CCT AAG CGG GTA GAG 2427 Phe Val Arg Glu Lys Gly Val Pro Lys Ala Asp Pro Lys Arg Val Glu 270 275 280 TTT AGC GAG TAC ATA ACG AAA GAA GAA ATA AAA GAG GTT GAA AAG GGG 2475 Phe Ser Glu Tyr Ile Thr Lys Glu Glu Ile Lys Glu Val Glu Lys Gly 285 290 295 300 TTA TTA ACT TAC GCA GTT TTA GAA AAT TAT AAr TGG GAA GAG AAA ACG 2523 Leu Leu Thr Tyr Ala Val Leu Glu Asn Tyr Asn Trp Glu Glu Lys Thr 305 310 315 GCG ACT TTC GCT CAT GCG ACT ATG CTT AAT GAG CTT TTT ACT GAT TAT 2571 Ala Thr Phe Ala His Ala Thr Met Leu Asn Glu Leu Phe Thr Asp Tyr 320 325 330 ACT AAT TAT CGT TAT GAA GTT AAA GGA CTA AAA TTG CCC GCC GTT AAA 2619 Thr Asn Tyr Arg Tyr Glu Val Lys Gly Leu Lys Leu Pro Ala Val Lys 335 340 345 AAG TTA AAA AGT CCG TTG GTG GAG TTT ACA GCT GAT TTA TTA ACT GTT 2667 Lys Leu Lys Ser Pro Leu Val Glu Phe Thr Ala Asp Leu Leu Thr Val 350 355 360 ACG CCT ATT GAC GAA AAC GGA AAA GCA CTT AGC GAA AAA AGT ATT ACG 2715 Thr Pro Ile Asp Glu Asn Gly Lys Ala Leu Ser Glu Lys Ser Ile Thr 365 370 375 380 GTT AAA AAT TTT AAA AAT GGT GAT TTA GGA ATA AGG TTG TTG GAT CCT 2763 Val Lys Asn Phe Lys Asn Gly Asp Leu Gly Ile Arg Leu Leu Asp Pro 385 390 395 AAT AGC TAT TAT TAT TTC CTT GAA GGC CAA GAT ACG GGT TTT TAT GGT 2811 Asn Ser Tyr Tyr Tyr Phe Leu Glu Gly Gln Asp Thr Gly Phe Tyr Gly 400 405 410 CCT GCT TTT TAT ATT GAA CGA AAA AAC GGT GGC GGC GCT AAA AAT AAC 2859 Pro Ala Phe Tyr Ile Glu Arg Lys Asn Gly Gly Gly Ala Lys Asn Asn 415 420 425 TCG TCG GGA GCA GGA AAT AGC AAA GAT TGG GGC GGG AAC GGG CAT GGA 2907 Ser Ser Gly Ala Gly Asn Ser Lys Asp Trp Gly Gly Asn Gly His Gly 430 435 440 AAT CAC CGA AAT AAT GCC TCC GAC CTG AAT AAA CCG GAC GGA AAT AAT 2955 Asn His Arg Asn Asn Ala Ser Asp Leu Asn Lys Pro Asp Gly Asn Asn 445 450 455 460 GGG AAT AAC CAA AAT AAC GGA AGC AAT CAA GAT AAT CAT AGC GAT GTG 3003 Gly Asn Asn Gln Asn Asn Gly Ser Asn Gln Asp Asn His Ser Asp Val 465 470 475 AAT GCG CCA AAT AAC CCG GGA CGT AAC TAT GAT ATT TAC GAT CCT TTA 3051 Asn Ala Pro Asn Asn Pro Gly Arg Asn Tyr Asp Ile Tyr Asp Pro Leu 480 485 490 GCT TTA GAT TTA GAT GGA GAT GGG CTT GAA ACC GTG TCG ATG AAC GGG 3099 Ala Leu Asp Leu Asp Gly Asp Gly Leu Glu Thr Val Ser Met Asn Gly 495 500 505 CGA CAA GGC GCG TTA TTC GAT CAT GAA GGA AAA GGT ATT CGT ACC GCA 3147 Arg Gln Gly Ala Leu Phe Asp His Glu Gly Lys Gly Ile Arg Thr Ala 510 515 520 ACG GGC TGG CTC GCT GCG GAT GAC GGT TTT TTA GTG TTA GAT CGT AAC 3195 Thr Gly Trp Leu Ala Ala Asp Asp Gly Phe Leu Val Leu Asp Arg Asn 525 530 535 540 CAA GAC GGC ATT ATT AAT GAT ATA AGC GAG TTA TTT AGT AAT AAA AAT 3243 Gln Asp Gly Ile Ile Asn Asp Ile Ser Glu Leu Phe Ser Asn Lys Asn 545 550 555 CAA CTT TCC GAC GGC AGT ATT TCT GCA CAC GGT TTT GCG ACA TTA GCC 3291 Gln Leu Ser Asp Gly Ser Ile Ser Ala His Gly Phe Ala Thr Leu Ala 560 565 570 GAT TTG GAT ACA AAC CAA GAT CAG CGT ATC GAC CAA AAT GAT AAG CTG 3339 Asp Leu Asp Thr Asn Gln Asp Gln Arg Ile Asp Gln Asn Asp Lys Leu 575 580 585 TTT TCT AAA CTC CAA ATT TGG CGG GAT TTA AAT CAA AAC GGT TTT AGT 3387 Phe Ser Lys Leu Gln Ile Trp Arg Asp Leu Asn Gln Asn Gly Phe Ser 590 595 600 GAA GCG AAT GAG CTG TTT AGC TTA GAA AGT TTG AAT ATT AAA TCT TTA 3435 Glu Ala Asn Glu Leu Phe Ser Leu Glu Ser Leu Asn Ile Lys Ser Leu 605 610 615 620 CAT ACC GCC TAT GAA GAG CGT AAT GAT TTT CTA GCG GGC AAT AAT ATC 3483 His Thr Ala Tyr Glu Glu Arg Asn Asp Phe Leu Ala Gly Asn Asn Ile 625 630 635 CTT GCT CAG CTT GGG AAG TAT GAA AAA ACG GAC GGT ACT TTT GCA CAA 3531 Leu Ala Gln Leu Gly Lys Tyr Glu Lys Thr Asp Gly Thr Phe Ala Gln 640 645 650 ATG GGC GAT TTA AAT TTC AGT TTT AAC CCG TTT TAT AGC CGA TTT ACC 3579 Met Gly Asp Leu Asn Phe Ser Phe Asn Pro Phe Tyr Ser Arg Phe Thr 655 660 665 GAA GCG TTA AAT TTA ACC GAG CAA CAA CGT CGC ACA ATT AAT CTA ACC 3627 Glu Ala Leu Asn Leu Thr Glu Gln Gln Arg Arg Thr Ile Asn Leu Thr 670 675 680 GGC ACC GGT CGG GTT CGG GAT TTG CGT GAA GCC GCC GCA CTT TCT GAG 3675 Gly Thr Gly Arg Val Arg Asp Leu Arg Glu Ala Ala Ala Leu Ser Glu 685 690 695 700 GAG TTG GCT GCT TTA TTA CAA CAG TAC ACT AAG GCC TCC GAT TTT CAG 3723 Glu Leu Ala Ala Leu Leu Gln Gln Tyr Thr Lys Ala Ser Asp Phe Gln 705 710 715 GCA CAA CGA GAA TTA TTG CCT GCC ATT TTA GAT AAA TGG GCG GCA ACG 3771 Ala Gln Arg Glu Leu Leu Pro Ala Ile Leu Asp Lys Trp Ala Ala Thr 720 725 730 GAT TTA CAG TAT CAA CAT TAT GAT AAA ACA TTA CTT AAA ACG GTA GAA 3819 Asp Leu Gln Tyr Gln His Tyr Asp Lys Thr Leu Leu Lys Thr Val Glu 735 740 745 AGT ACC GAT AGT AGT GCT TCT GTC GTT AGA GTC ACG CCT TCT CAA TTA 3867 Ser Thr Asp Ser Ser Ala Ser Val Val Arg Val Thr Pro Ser Gln Leu 750 755 760 AGT AGT ATA CGC AAT GCA AAG CAT GAT CCT ACC GTT ATG CAA AAC TTT 3915 Ser Ser Ile Arg Asn Ala Lys His Asp Pro Thr Val Met Gln Asn Phe 765 770 775 780 GAA CAG AGT AAG GCA AAA ATT GCG ACT TTA AAT TCG CTC TAC GGG TTA 3963 Glu Gln Ser Lys Ala Lys Ile Ala Thr Leu Asn Ser Leu Tyr Gly Leu 785 790 795 AAT ATC GAT CAA CTT TAT TAC ACG ACG GAT AAA GAC ATT CGC TAT ATT 4011 Asn Ile Asp Gln Leu Tyr Tyr Thr Thr Asp Lys Asp Ile Arg Tyr Ile 800 805 810 ACT GAT AAA GTG AAT AAT ATG TAT CAA ACA ACC GTA GAA CTT GCC TAC 4059 Thr Asp Lys Val Asn Asn Met Tyr Gln Thr Thr Val Glu Leu Ala Tyr 815 820 825 CGT TCT TTA CTT TTA CAA ACG CGT TTG AAG AAA TAT GTT TAT AGC GTT 4107 Arg Ser Leu Leu Leu Gln Thr Arg Leu Lys Lys Tyr Val Tyr Ser Val 830 835 840 AAT GCG AAA CAA TTC GAA GGG AAA TGG GTA ACC GAT TAT TCT CGT ACT 4155 Asn Ala Lys Gln Phe Glu Gly Lys Trp Val Thr Asp Tyr Ser Arg Thr 845 850 855 860 GAA GCC TTA TTT AAC TCT ACT TTT AAA CAA TCG CCT GAA AAT GCA TTA 4203 Glu Ala Leu Phe Asn Ser Thr Phe Lys Gln Ser Pro Glu Asn Ala Leu 865 870 875 TAT GAT TTA AGC GAA TAC CTT TCT TTC TTT AAC GAT CCT ACG GAA TGG 4251 Tyr Asp Leu Ser Glu Tyr Leu Ser Phe Phe Asn Asp Pro Thr Glu Trp 880 885 890 AAA GAA GGG CTA TTA CTG TTA AGC CGT TAT ATA GAT TAT GCT AAA GCA 4299 Lys Glu Gly Leu Leu Leu Leu Ser Arg Tyr Ile Asp Tyr Ala Lys Ala 895 900 905 CAA GGA TTT TAT GAA AAC TGG GCG GCT ACT TCT AAC TTA ACT ATT GCC 4347 Gln Gly Phe Tyr Glu Asn Trp Ala Ala Thr Ser Asn Leu Thr Ile Ala 910 915 920 CGT TTA AGA GAG GCT GGA GTA ATT TTT GCA GAA TCG ACG GAT TTA AAA 4395 Arg Leu Arg Glu Ala Gly Val Ile Phe Ala Glu Ser Thr Asp Leu Lys 925 930 935 940 GGC GAT GAA AAA AAT AAT ATT TTG TTA GGT AGC CAA AAA GAT AAT AAC 4443 Gly Asp Glu Lys Asn Asn Ile Leu Leu Gly Ser Gln Lys Asp Asn Asn 945 950 955 TTA TCG GGT AGT GCA GGT GAT GAT CTA CTT ATC GGC GGA GAG GGT AAT 4491 Leu Ser Gly Ser Ala Gly Asp Asp Leu Leu Ile Gly Gly Glu Gly Asn 960 965 970 GAT ACG TTA AAA GGC AGC TAC GGT GCA GAC ACC TAT ATC TTT AGC AAA 4539 Asp Thr Leu Lys Gly Ser Tyr Gly Ala Asp Thr Tyr Ile Phe Ser Lys 975 980 985 GGA CAC GGA CAG GAT ATC GTT TAT GAA GAT ACC AAT AAT GAT AAC CGC 4587 Gly His Gly Gln Asp Ile Val Tyr Glu Asp Thr Asn Asn Asp Asn Arg 990 995 1000 GCA AGA GAT ATC GAC ACC TTA AAA TTT ACC GAT GTG AAT TAT GCG GAA 4635 Ala Arg Asp Ile Asp Thr Leu Lys Phe Thr Asp Val Asn Tyr Ala Glu 1005 1010 1015 1020 GTG AAG TTT CGA CGA GTA GAT AAT GAC TTA ATG TTA TTC GGT TAT CAT 4683 Val Lys Phe Arg Arg Val Asp Asn Asp Leu Met Leu Phe Gly Tyr His 1025 1030 1035 GAT ACG GAT TCG GTC ACG GTA AAA TCC TTC TAC AGC CAT GTA GAT TAT 4731 Asp Thr Asp Ser Val Thr Val Lys Ser Phe Tyr Ser His Val Asp Tyr 1040 1045 1050 CAA TTT GAC AAA TTG GAG TTT GCT GAC CGC AGT ATA ACT CGC GAT GAA 4779 Gln Phe Asp Lys Leu Glu Phe Ala Asp Arg Ser Ile Thr Arg Asp Glu 1055 1060 1065 CTG ATT AAA GCA GGG CTT CAT CTA TAC GGC ACC GAT GGC AAT GAT GAT 4827 Leu Ile Lys Ala Gly Leu His Leu Tyr Gly Thr Asp Gly Asn Asp Asp 1070 1075 1080 ATA AAG GAT CAT GCG GAT TGG GAC AGC ATT TTG GAA GGC GGC AAA GGC 4875 Ile Lys Asp His Ala Asp Trp Asp Ser Ile Leu Glu Gly Gly Lys Gly 1085 1090 1095 1100 AAC GAT ATT CTA AGA GGT GGC TAC GGT GCG GAC ACC TAT ATC TTT AGC 4923 Asn Asp Ile Leu Arg Gly Gly Tyr Gly Ala Asp Thr Tyr Ile Phe Ser 1105 1110 1115 AAA GGA CAC GGA CAG GAT ATC GTT TAT GAA GAT ACC AAT AAT GAT AAC 4971 Lys Gly His Gly Gln Asp Ile Val Tyr Glu Asp Thr Asn Asn Asp Asn 1120 1125 1130 CGC GCA AGA GAT ATC GAC ACC TTA AAA TTT ACT GAT GTG AAT TAT GCG 5019 Arg Ala Arg Asp Ile Asp Thr Leu Lys Phe Thr Asp Val Asn Tyr Ala 1135 1140 1145 GAA GTG AAA TTC CGA CGA GTA GAT AAT GAC TTA ATG TTA TTC GGT TAT 5067 Glu Val Lys Phe Arg Arg Val Asp Asn Asp Leu Met Lau Phe Gly Tyr 1150 1155 1160 CAT GAT ACG GAT TCG GTC ACG ATA AAA TCC TTC TAC AAC CAT GTA GAT 5115 His Asp Thr Asp Ser Val Thr Ile Lys Ser Phe Tyr Asn His Val Asp 1165 1170 1175 1180 TAT CAA TTT GAC AAA TTG GAA TTT GCT GAC CGC AGT ATA ACT CGT GAT 5163 Tyr Gln Phe Asp Lys Leu Glu Phe Ala Asp Arg Ser Ile Thr Arg Asp 1185 1190 1195 GAA CTA GGT AAA CAA GGT ATG GCA TTA TTT GGC ACT GAC GGT GAT GAT 5211 Glu Leu Gly Lys Gln Gly Met Ala Leu Phe Gly Thr Asp Gly Asp Asp 1200 1205 1210 AAT ATC AAC GAC TGG GGA CGT AAC TCG GTG ATT GAT GCC GGT GCG GGT 5259 Asn Ile Asn Asp Trp Gly Arg Asn Ser Val Ile Asp Ala Gly Ala Gly 1215 1220 1225 AAT GAT ACG GTT AAT GGC GGT AAT GGC GAT GAC ACC CTC ATC GGC GGC 5307 Asn Asp Thr Val Asn Gly Gly Asn Gly Asp Asp Thr Leu Ile Gly Gly 1230 1235 1240 AAA GGT AAT GAT ATT CTA AGA GGT GGC TAC GGT GCG GAC ACC TAT ATC 5355 Lys Gly Asn Asp Ile Leu Arg Gly Gly Tyr Gly Ala Asp Thr Tyr Ile 1245 1250 1255 1260 TTT AGC AAA GGA CAC GGA CAG GAT ATC GTT TAT GAA GAT ACC AAT AAT 5403 Phe Ser Lys Gly His Gly Gln Asp Ile Val Tyr Glu Asp Thr Asn Asn 1265 1270 1275 GAT AAC CGC GCA AGA GAT ATC GAC ACC TTA AAA TTT ACC GAT GTG AAT 5451 Asp Asn Arg Ala Arg Asp Ile Asp Thr Leu Lys Phe Thr Asp Val Asn 1280 1285 1290 TAT GCG GAA GTG AAA TTC CGA CGA GTA GAT AAT GAC TTA ATG TTA TTC 5499 Tyr Ala Glu Val Lys Phe Arg Arg Val Asp Asn Asp Leu Met Leu Phe 1295 1300 1305 GGT TAT CAT GAT ACG GAT TCG GTC ACG GTA AAA TCC TTC TAC AGC CAT 5547 Gly Tyr His Asp Thr Asp Ser Val Thr Val Lys Ser Phe Tyr Ser His 1310 1315 1320 GTA GAT TAT CAA TTT GAC AAA TTG GAG TTT GCT GAC CGC AGT ATA ACT 5595 Val Asp Tyr Gln Phe Asp Lys Leu Glu Phe Ala Asp Arg Ser Ile Thr 1325 1330 1335 1340 CGC GAT GAA CTG ATT AAA GCA GGG CTT CAT CTA TAC GGC ACC GAT GGC 5643 Arg Asp Glu Leu Ile Lys Ala Gly Leu His Leu Tyr Gly Thr Asp Gly 1345 1350 1355 AAT GAT GAT ATA AAG GAT CAT GCG GAT TGG GAC AGC ATT TTG GAA GGC 5691 Asn Asp Asp Ile Lys Asp His Ala Asp Trp Asp Ser Ile Leu Glu Gly 1360 1365 1370 GGC AAA GGC AAC GAT ATT CTA AGA GGT GGC TAC GGT GCG GAC ACC TAT 5739 Gly Lys Gly Asn Asp Ile Leu Arg Gly Gly Tyr Gly Ala Asp Thr Tyr 1375 1380 1385 ATC TTT AGC AAA GGA CAC GGA CAG GAT ATC GTT TAT GAA GAT ACC AAT 5787 Ile Phe Ser Lys Gly His Gly Gln Asp Ile Val Tyr Glu Asp Thr Asn 1390 1395 1400 AAT GAT AAC CGA GCA AGA GAT ATC GAC ACC TTA AAA TTT ACT GAT GTG 5835 Asn Asp Asn Arg Ala Arg Asp Ile Asp Thr Leu Lys Phe Thr Asp Val 1405 1410 1415 1420 AAT TAT GCG GAA GTG AAA TTC CGA CGA GTA GAT AAT GAC TTA ATG TTA 5883 Asn Tyr Ala Glu Val Lys Phe Arg Arg Val Asp Asn Asp Leu Met Leu 1425 1430 1435 TTC GGT TAT CAT GAT ACG GAT TCG GTC ACG ATA AAA TCC TTC TAC AAC 5931 Phe Gly Tyr His Asp Thr Asp Ser Val Thr Ile Lys Ser Phe Tyr Asn 1440 1445 1450 CAT GTA GAT TAT CAA TTT GAC AAA TTG GAA TTT GCT GAC CGC AGT ATA 5979 His Val Asp Tyr Gln Phe Asp Lys Leu Glu Phe Ala Asp Arg Ser Ile 1455 1460 1465 ACT CGT GAT GAA CTA GGT AAA CAA GGT ATG GCA TTA TTT GGC ACT GAC 6027 Thr Arg Asp Glu Leu Gly Lys Gln Gly Met Ala Leu Phe Gly Thr Asp 1470 1475 1480 GGT GAT GAT AAT ATC AAC GAC TGG GGA CGT AAC TCG GTG ATT GAT GCC 6075 Gly Asp Asp Asn Ile Asn Asp Trp Gly Arg Asn Ser Val Ile Asp Ala 1485 1490 1495 1500 GGT GCG GGT AAT GAT ACG GTT AAT GGC GGT AAT GGC GAT GAC ACC CTC 6123 Gly Ala Gly Asn Asp Thr Val Asn Gly Gly Asn Gly Asp Asp Thr Leu 1505 1510 1515 ATC GGC GGC AAA GGT AAT GAT ATT CTA AGA GGT GGC TAC GGT GCG GAC 6171 Ile Gly Gly Lys Gly Asn Asp Ile Leu Arg Gly Gly Tyr Gly Ala Asp 1520 1525 1530 ACC TAT ATC TTT AGC AAA GGA CAC GGA CAG GAT ATC GTT TAT GAA GAT 6219 Thr Tyr Ile Phe Ser Lys Gly His Gly Gln Asp Ile Val Tyr Glu Asp 1535 1540 1545 ACC AAT AAT GAT AAC CGC GCA AGA GAT ATC GAC ACC TTA AAA TTT ACT 6267 Thr Asn Asn Asp Asn Arg Ala Arg Asp Ile Asp Thr Leu Lys Phe Thr 1550 1555 1560 GAT ATT AAT TTA TCC GAA CTT TGG TTT AGC CGA GAA AAT AAC GAT TTG 6315 Asp Ile Asn Leu ser Glu Leu Trp Phe Ser Arg Glu Asn Asn Asp Leu 1565 1570 1575 1580 ATT ATT AAA TCA TTA TTA AGT GAG GAT AAA GTC ACG GTT CAA AAT TGG 6363 Ile Ile Lys Ser Leu Leu Ser Glu Asp Lys Val Thr Val Gln Asn Trp 1585 1590 1595 TAT TCA CAC CAA GAT CAT AAA ATA GAA AAT ATT CGT TTA TCG AAT GAG 6411 Tyr Ser His Gln Asp His Lys Ile Glu Asn Ile Arg Leu Ser Asn Glu 1600 1605 1610 CAA ACG TTG GTG AGC ACT CAG GTG GAG AAG ATG GTT GAG TCG ATG GCC 6459 Gln Thr Leu Val Ser Thr Gln Val Glu Lys Met Val Glu Ser Met Ala 1615 1620 1625 GGC TTT GCT CAG AAG CAC GGA GGA GAG ATA TCT CTT GTG TCG CTT GAA 6507 Gly Phe Ala Gln Lys His Gly Gly Glu Ile Ser Leu Val Ser Leu Glu 1630 1635 1640 GAG GTA AAA CAA TAT ATC AAT AGC TTA ACA GCT GCT TTA TAA 6549 Glu Val Lys Gln Tyr Ile Asn Ser Leu Thr Ala Ala Leu * 1645 1650 1655 CATACGAAAG AAATCGGCAC AGTTTTTTTG AACTGTGCCG ATTTGATTTT AGTGTAAGAA 6609 TATAGCCTGA TTTTAAGAAA TTTACTCTTG GCTAATAACT ATTTCCCATT TTATAAGTTA 6669 TTGACGGATG GTTTTATCAA ATATGAGATC AAATCTTATT TTAAATTCGC TTTCCATTAA 6729 GCGATAT 6736 (2)SEQ ID NO:2信息: (i)序列特征: (A)长度:1658个氨基酸 (B)类型:氨基酸 (D)拓扑学:线性 (ii)分子类型:蛋白 (xi)序列描述:SEQ ID NO:2: Met Ser Asp Asn Ala Phe Phe Val Ile Glu Glu Ser Gly Lys Arg Tyr 1 5 10 15 Ile Glu Asn Phe Gly Ile Glu Pro Leu Gly Lys Gln Glu Asp Phe Asp 20 25 30 Phe Val Gly Gly Phe Trp Ser Asn Leu Val Asn Arg Gly Leu Glu Ser 35 40 45 Ile Ile Asp Pro Ser Gly Ile Gly Gly Thr Val Asn Leu Asn Phe Thr 50 55 60 Gly Glu Val Glu Thr Tyr Thr Leu Asp Glu Thr Arg Phe Lys Ala Glu 65 70 75 80 Ala Ala Lys Lys Ser His Trp Ser Leu Val Asn Ala Ala Lys Val Tyr 85 90 95 Gly Gly Leu Asp Gln Ile Ile Lys Lys Leu Trp Asp Ser Gly Ser Ile 100 105 110 Lys His Leu Tyr Gln Asp Lys Asp Thr Gly Lys Leu Lys Pro Ile Ile 115 120 125 Tyr Gly Thr Ala Gly Asn Asp Ser Lys Ile Glu Gly Thr Lys Ile Thr 130 135 140 Arg Arg Ile Ala Gly Lys Glu Val Thr Leu Asp Ile Ala Asn Gln Lys 145 150 155 160 Ile Glu Lys Gly Val Leu Glu Lys Leu Gly Leu Ser Val Ser Gly Ser 165 170 175 Asp Ile Ile Lys Leu Leu Phe Gly Ala Leu Thr Pro Thr Leu Asn Arg 180 185 190 Met Leu Leu Ser Gln Leu Ile Gln Ser Phe Ser Asp Ser Leu Ala Lys 195 200 205 Leu Asp Asn Pro Leu Ala Pro Tyr Thr Lys Asn Gly Val Val Tyr Val 210 215 220 Thr Gly Lys Gly Asn Asp Val Leu Lys Gly Thr Glu His Glu Asp Leu 225 230 235 240 Phe Leu Gly Gly Glu Gly Asn Asp Thr Tyr Tyr Ala Arg Val Gly Asp 245 250 255 Thr Ile Glu Asp Ala Asp Gly Lys Gly Lys Val Tyr Phe Val Arg Glu 260 265 270 Lys Gly Val Pro Lys Ala Asp Pro Lys Arg Val Glu Phe Ser Glu Tyr 275 280 285 Ile Thr Lys Glu Glu Ile Lys Glu Val Glu Lys Gly Leu Leu Thr Tyr 290 295 300 Ala Val Leu Glu Asn Tyr Asn Trp Glu Glu Lys Thr Ala Thr Phe Ala 305 310 315 320 His Ala Thr Met Leu Asn Glu Leu Phe Thr Asp Tyr Thr Asn Tyr Arg 325 330 335 Tyr Glu Val Lys Gly Leu Lys Leu Pro Ala Val Lys Lys Leu Lys Ser 340 345 350 Pro Leu Val Glu Phe Thr Ala Asp Leu Leu Thr Val Thr Pro Ile Asp 355 360 365 Glu Asn Gly Lys Ala Leu Ser Glu Lys Ser Ile Thr Val Lys Asn Phe 370 375 380 Lys Asn Gly Asp Leu Gly Ile Arg Leu Leu Asp Pro Asn Ser Tyr Tyr 385 390 395 400 Tyr Phe Leu Glu Gly Gln Asp Thr Gly Phe Tyr Gly Pro Ala Phe Tyr 405 410 415 Ile Glu Arg Lys Asn Gly Gly Gly Ala Lys Asn Asn Ser Ser Gly Ala 420 425 430 Gly Asn Ser Lys Asp Trp Gly Gly Asn Gly His Gly Asn His Arg Asn 435 440 445 Asn Ala Ser Asp Leu Asn Lys Pro Asp Gly Asn Asn Gly Asn Asn Gln 450 455 460 Asn Asn Gly Ser Asn Gln Asp Asn His Ser Asp Val Asn Ala Pro Asn 465 470 475 480 Asn Pro Gly Arg Asn Tyr Asp Ile Tyr Asp Pro Leu Ala Leu Asp Leu 485 490 495 Asp Gly Asp Gly Leu Glu Thr Val Ser Met Asn Gly Arg Gln Gly Ala 500 505 510 Leu Phe Asp His Glu Gly Lys Gly Ile Arg Thr Ala Thr Gly Trp Leu 515 520 525 Ala Ala Asp Asp Gly Phe Leu Val Leu Asp Arg Asn Gln Asp Gly Ile 530 535 540 Ile Asn Asp Ile Ser Glu Leu Phe Ser Asn Lys Asn Gln Leu Ser Asp 545 550 555 560 Gly Ser Ile Ser Ala His Gly Phe Ala Thr Leu Ala Asp Leu Asp Thr 565 570 575 Asn Gln Asp Gln Arg Ile Asp Gln Asn Asp Lys Leu Phe Ser Lys Leu 580 585 590 Gln Ile Trp Arg Asp Leu Asn Gln Asn Gly Phe Ser Glu Ala Asn Glu 595 600 605 Leu Phe Ser Leu Glu Ser Leu Asn Ile Lys Ser Leu His Thr Ala Tyr 610 615 620 Glu Glu Arg Asn Asp Phe Leu Ala Gly Asn Asn Ile Leu Ala Gln Leu 625 630 635 640 Gly Lys Tyr Glu Lys Thr Asp Gly Thr Phe Ala Gln Met Gly Asp Leu 645 650 655 Asn Phe Ser Phe Asn Pro Phe Tyr Ser Arg Phe Thr Glu Ala Leu Asn 660 665 670 Leu Thr Glu Gln Gln Arg Arg Thr Ile Asn Leu Thr Gly Thr Gly Arg 675 680 685 Val Arg Asp Leu Arg Glu Ala Ala Ala Leu Ser Glu Glu Leu Ala Ala 690 695 700 Leu Leu Gln Gln Tyr Thr Lys Ala Ser Asp Phe Gln Ala Gln Arg Glu 705 710 715 720 Leu Leu Pro Ala Ile Leu Asp Lys Trp Ala Ala Thr Asp Leu Gln Tyr 725 730 735 Gln His Tyr Asp Lys Thr Leu Leu Lys Thr Val Glu Ser Thr Asp Ser 740 745 750 Ser Ala Ser Val Val Arg Val Thr Pro Ser Gln Leu Ser Ser Ile Arg 755 760 765 Asn Ala Lys His Asp Pro Thr Val Met Gln Asn Phe Glu Gln Ser Lys 770 775 780 Ala Lys Ile Ala Thr Leu Asn Ser Leu Tyr Gly Leu Asn Ile Asp Gln 785 790 795 800 Leu Tyr Tyr Thr Thr Asp Lys Asp Ile Arg Tyr Ile Thr Asp Lys Val 805 810 815 Asn Asn Met Tyr Gln Thr Thr Val Glu Leu Ala Tyr Arg Ser Leu Leu 820 825 830 Leu Gln Thr Arg Leu Lys Lys Tyr Val Tyr Ser Val Asn Ala Lys Gln 835 840 845 Phe Glu Gly Lys Trp Val Thr Asp Tyr Ser Arg Thr Glu Ala Leu Phe 850 855 860 Asn Ser Thr Phe Lys Gln Ser Pro Glu Asn Ala Leu Tyr Asp Leu Ser 865 870 875 880 Glu Tyr Leu Ser Phe Phe Asn Asp Pro Thr Glu Trp Lys Glu Gly Leu 885 890 895 Leu Leu Leu Ser Arg Tyr Ile Asp Tyr Ala Lys Ala Gln Gly Phe Tyr 900 905 910 Glu Asn Trp Ala Ala Thr Ser Asn Leu Thr Ile Ala Arg Leu Arg Glu 915 920 925 Ala Gly Val Ile Phe Ala Glu Ser Thr Asp Leu Lys Gly Asp Glu Lys 930 935 940 Asn Asn Ile Leu Leu Gly Ser Gln Lys Asp Asn Asn Leu Ser Gly Ser 945 950 955 960 Ala Gly Asp Asp Leu Leu Ile Gly Gly Glu Gly Asn Asp Thr Leu Lys 965 970 975 Gly Ser Tyr Gly Ala Asp Thr Tyr Ile Phe Ser Lys Gly His Gly Gln 980 985 990 Asp Ile Val Tyr Glu Asp Thr Asn Asn Asp Asn Arg Ala Arg Asp Ile 995 1000 1005 Asp Thr Leu Lys Phe Thr Asp Val Asn Tyr Ala Glu Val Lys Phe Arg 1010 1015 1020 Arg Val Asp Asn Asp Leu Met Leu Phe Gly Tyr His Asp Thr Asp Ser 1025 1030 1035 1040 Val Thr Val Lys Ser Phe Tyr Ser His Val Asp Tyr Gln Phe Asp Lys 1045 1050 1055 Leu Glu Phe Ala Asp Arg Ser Ile Thr Arg Asp Glu Leu Ile Lys Ala 1060 1065 1070 Gly Leu His Leu Tyr Gly Thr Asp Gly Asn Asp Asp Ile Lys Asp His 1075 1080 1085 Ala Asp Trp Asp Ser Ile Leu Glu Gly Gly Lys Gly Asn Asp Ile Leu 1090 1095 1100 Arg Gly Gly Tyr Gly Ala Asp Thr Tyr Ile Phe Ser Lys Gly His Gly 1105 1110 1115 1120 Gln Asp Ile Val Tyr Glu Asp Thr Asn Asn Asp Asn Arg Ala Arg Asp 1125 1130 1135 Ile Asp Thr Leu Lys Phe Thr Asp Val Asn Tyr Ala Glu Val Lys Phe 1140 1145 1150 Arg Arg Val Asp Asn Asp Leu Met Leu Phe Gly Tyr His Asp Thr Asp 1155 1160 1165 Ser Val Thr Ile Lys Ser Phe Tyr Asn His Val Asp Tyr Gln Phe Asp 1170 1175 1180 Lys Leu Glu Phe Ala Asp Arg Ser Ile Thr Arg Asp Glu Leu Gly Lys 1185 1190 1195 1200 Gln Gly Met Ala Leu Phe Gly Thr Asp Gly Asp Asp Asn Ile Asn Asp 1205 1210 1215 Trp Gly Arg Asn Ser Val Ile Asp Ala Gly Ala Gly Asn Asp Thr Val 1220 1225 1230 Asn Gly Gly Asn Gly Asp Asp Thr Leu Ile Gly Gly Lys Gly Asn Asp 1235 1240 1245 Ile Leu Arg Gly Gly Tyr Gly Ala Asp Thr Tyr Ile Phe Ser Lys Gly 1250 1255 1260 His Gly Gln Asp Ile Val Tyr Glu Asp Thr Asn Asn Asp Asn Arg Ala 1265 1270 1275 1280 Arg Asp Ile Asp Thr Leu Lys Phe Thr Asp Val Asn Tyr Ala Glu Val 1285 1290 1295 Lys Phe Arg Arg Val Asp Asn Asp Leu Met Leu Phe Gly Tyr His Asp 1300 1305 1310 Thr Asp Ser Val Thr Val Lys Ser Phe Tyr Ser His Val Asp Tyr Gln 1315 1320 1325 Phe Asp Lys Leu Glu Phe Ala Asp Arg Ser Ile Thr Arg Asp Glu Leu 1330 1335 1340 Ile Lys Ala Gly Leu His Leu Tyr Gly Thr Asp Gly Asn Asp Asp Ile 1345 1350 1355 1360 Lys Asp His Ala Asp Trp Asp Ser Ile Leu Glu Gly Gly Lys Gly Asn 1365 1370 1375 Asp Ile Leu Arg Gly Gly Tyr Gly Ala Asp Thr Tyr Ile Phe Ser Lys 1380 1385 1390 Gly His Gly Gln Asp Ile Val Tyr Glu Asp Thr Asn Asn Asp Asn Arg 1395 1400 1405 Ala Arg Asp Ile Asp Thr Leu Lys Phe Thr Asp Val Asn Tyr Ala Glu 1410 1415 1420 Val Lys Phe Arg Arg Val Asp Asn Asp Leu Met Leu Phe Gly Tyr His 1425 1430 1435 1440 Asp Thr Asp Ser Val Thr Ile Lys Ser Phe Tyr Asn His Val Asp Tyr 1445 1450 1455 Gln Phe Asp Lys Leu Glu Phe Ala Asp Arg Ser Ile Thr Arg Asp Glu 1460 1465 1470 Leu Gly Lys Gln Gly Met Ala Leu Phe Gly Thr Asp Gly Asp Asp Asn 1475 1480 1485 Ile Asn Asp Trp Gly Arg Asn Ser Val Ile Asp Ala Gly Ala Gly Asn 1490 1495 1500 Asp Thr Val Asn Gly Gly Asn Gly Asp Asp Thr Leu Ile Gly Gly Lys 1505 1510 1515 1520 Gly Asn Asp Ile Leu Arg Gly Gly Tyr Gly Ala Asp Thr Tyr Ile Phe 1525 1530 1535 Ser Lys Gly His Gly Gln Asp Ile Val Tyr Glu Asp Thr Asn Asn Asp 1540 1545 1550 Asn Arg Ala Arg Asp Ile Asp Thr Leu Lys Phe Thr Asp Ile Asn Leu 1555 1560 1565 Ser Glu Leu Trp Phe Ser Arg Glu Asn Asn Asp Leu Ile Ile Lys Ser 1570 1575 1580 Leu Leu Ser Glu Asp Lys Val Thr Val Gln Asn Trp Tyr Ser His Gln 1585 1590 1595 1600 Asp His Lys Ile Glu Asn Ile Arg Leu Ser Asn Glu Gln Thr Leu Val 1605 1610 1615 Ser Thr Gln Val Glu Lys Met Val Glu Ser Met Ala Gly Phe Ala Gln 1620 1625 1630 Lys His Gly Gly Glu Ile Ser Leu Val Ser Leu Glu Glu Val Lys Gln 1635 1640 1645 Tyr Ile Asn Ser Leu Thr Ala Ala Leu * 1650 1655 (2)SEQ ID NO:3信息: (i)序列特征: (A)长度:7004个碱基对 (B)类型:核酸 (C)链型:双链 (D)拓扑学:线性 (ii)分子类型:DNA(基因组) (iii)假设:无 (iv)反义:无 (vi)最初来源: (A)有机体:胸膜肺炎放线杆菌 (B)菌株:HV114(血清型3野生菌株) (vii)直接来源: (B)克隆:pROK5 (ix)特征: (A)名字/关键:CDS (B)位置:1566…5714 (D)其它信息:/密码子-起始=1566 /功能=“RTX-毒素” /产物=“ ApxIV_var3 ” /基因=“apxIV_var3” /数目=1 (xi)序列描述:SEQ ID NO:3: ATCGATATGC CGCCGGGTAC GGGCGATATC CAACTTACTC TTTCGCAACA AATTCCGGTT 60 ACCGGTGCGG TAGTGGTAAC TACTCCGCAA GATATTGCGT TATTAGATGC GGTGAAAGGT 120 ATTTCAATGT TCCAAAAAGT GTCGGTACCG GTCTTAGGTA TCATTGAAAA TATGAGCGTG 180 CATATCTGCC AAAATTGCGG TCACCACGAA GATATTTTCG GCACCGGCGG TGCGGAGAAA 240 GTGGCGAAGA AATACGGTAC TAAAGTATTA GGACAAATGC CGTTGCATAT TCGCTTACGT 300 CAAGATTTGG ATGCCGGCAC ACCGACCGTC GTTGCGGCAC CGGAACACGA CACCAGCAGA 360 GCCTATATTG AATTAGCGGC AAAAGTCGCT TCGGAATTAT ACTGGCAAGG TTCGGTTATC 420 CCGTCTGAAA TTATGATTCG TGAAGTAAAA TAAGCCTACA TAACCACGGA ATACCAGATA 480 ACACAGAAGG AAAACAAGCG GTAGAATTTG CAGAAAAAGT TGCAAATTCT ACCGCTTTTT 540 TATTAGTACG ATTCGCTGTT GGACTGCCAT TTGATTTGGT TTGTCAGGAT ATTATGTTAT 600 TGTAATGAAA TGTTAGTGAA TTATTTTTAT TAATTTGAAA GGAGACAAAA TGAAAATAAA 660 AAAACGTTAC ATTGCGCTGC TAGCTTTAGG CAGTGTTATT GGCTATGCCT GGTATCAAAA 720 TTATCAATGG GAACAGTTGA TGTTAAGTGG CTATTGTGAA AAGGACGGAA GCTATTGTGA 780 TGATAGGCAT ACGAAGCAGG AACTGATTGA TAGGGCAATT AACTATGTGC TGGAAAATCA 840 AATTCAACAG ACATATGAAG GTGATGACCT TGTGGATATA AAACAATATT CAACAATAGA 900 GGAATTTAAA AAACTAAATC CGAATTGTTG TAAGGTAGAT TCTTGGCCGG ATGATGCTGT 960 TCGTGAGGAT GCTGATTTAC AGCGAGAGGG CAAAGCGTAT AAATACGTAA AAGTCAAATA 1020 TTTAAGAACC TATTTAGCGA ATAGAGAACC TGAACAATGG GAAAATTACA TAGTATTTGA 1080 TAATTGCAGT GGAATTAAAG AAAGACACCA ACTGTATTAA AAATAGATTA GATGGAGACA 1140 ACACGATGAC AAAACTAACT ATCCAAGATG TGACTAATTT ATATTTATAT AAGCAAAGAA 1200 CTTTACCTAC GGATAGGTTA GATGATTCGC TTATTAGCAA AACAGGAAAA GGGGAAAATA 1260 TTGATAAAAA GGAATTTATG GCGGGGCCGG GACGTTTTGT GACGGCCGAT AATTTTAGTG 1320 TTGTAAAAGA CTTTTTTACT GCAAAGGATT CATTAATAAA CCTAAGCTTG CAGACTCGTA 1380 TATTAGCGAA TTTAAAGCCG GGCAAATATT CCAAAGCGCA GATATTAGAA ATGTTGGGCT 1440 ATACGAAAAA TGGAGAAAAG GTAGATGGCA TGTTTACCGG TGAAGTCCAG ACATTAGGCT 1500 TTTATGACGA TGGCAAAGGG GATTTACTCG AACGCGCCTA TATCTGAAAT ACCACAGGAT 1560 TTAAA ATG AGC GAC AAT GCC TTT TTT GTT ATA GAA GAA TCA GGC AAA 1607 Met Ser Asp Asn Ala Phe Phe Val Ile Glu Glu Ser Gly Lys 1660 1665 1670 CGC TAT ATT GAA AAC TTT GGT ATT GAA CCT CTT GGT AAG CAA GAA GAT 1655 Arg Tyr Ile Glu Asn Phe Gly Ile Glu Pro Leu Gly Lys Gln Glu Asp 1675 1680 1685 TTT GAT TTT GTC GGC GGC TTT TGG TCT AAC TTA GTG AAT CGT GGT TTG 1703 Phe Asp Phe Val Gly Gly Phe Trp Ser Asn Leu Val Asn Arg Gly Leu 1690 1695 1700 GAA AGT ATT ATC GAC CCA TCC GGT ATC GGT GGA ACG GTA AAC CTT AAC 1751 Glu Ser Ile Ile Asp Pro Ser Gly Ile Gly Gly Thr Val Asn Leu Asn 1705 1710 1715 1720 TTT ACC GGC GAG GTG GAA ACC TAC ACG TTA GAC GAA ACA AGG TTT AAA 1799 Phe Thr Gly Glu Val Glu Thr Tyr Thr Leu Asp Glu Thr Arg Phe Lys 1725 1730 1735 GCG GAA GCG GCG AAG AAA AGC CAT TGG AGT TTA GTG AAT GCG GCG AAA 1847 Ala Glu Ala Ala Lys Lys Ser His Trp Ser Leu Val Asn Ala Ala Lys 1740 1745 1750 GTA TAC GGC GGT TTA GAC CAA ATT ATT AAA AAA CTA TGG GAC AGT GGC 1895 Val Tyr Gly Gly Leu Asp Gln Ile Ile Lys Lys Leu Trp Asp Ser Gly 1755 1760 1765 TCA ATT AAG CAT TTA TAT CAA GAT AAA GAT ACG GGC AAA TTA AAA CCG 1943 Ser Ile Lys His Leu Tyr Gln Asp Lys Asp Thr Gly Lys Leu Lys Pro 1770 1775 1780 ATT ATT TAC GGC ACG GCC GGC AAC GAC AGT AAG ATT GAA GGC ACT AAA 1991 Ile Ile Tyr Gly Thr Ala Gly Asn Asp Ser Lys Ile Glu Gly Thr Lys 1785 1790 1795 1800 ATC ACC CGT AGG ATT GCG GGT AAA GAA GTT ACG CTT GAT ATT GCC AAT 2039 Ile Thr Arg Arg Ile Ala Gly Lys Glu Val Thr Leu Asp Ile Ala Asn 1805 1810 1815 CAG AAA ATT GAA AAA GGC GTG TTA GAG AAA TTG GGG CTG TCT GTT AGT 2087 Gln Lys Ile Glu Lys Gly Val Leu Glu Lys Leu Gly Leu Ser Val Ser 1820 1825 1830 GGT TCG GAT ATC ATT AAA TTG TTG TTT GGA GCA TTG ACT CCA ACT TTA 2135 Gly Ser Asp Ile Ile Lys Leu Leu Phe Gly Ala Leu Thr Pro Thr Leu 1835 1840 1845 AAT AGA ATG TTG CTA TCA CAA CTT ATC CAG TCT TTT TCC GAT AGC TTG 2183 Asn Arg Met Leu Leu Ser Gln Leu Ile Gln Ser Phe Ser Asp Ser Leu 1850 1855 1860 GCT AAA CTT GAT AAT CCC TTA GCC CCT TAC ACT AAA AAT GGC GTG GTT 2231 Ala Lys Leu Asp Asn Pro Leu Ala Pro Tyr Thr Lys Asn Gly Val Val 1865 1870 1875 1880 TAT GTC ACC GGC AAA GGG AAT GAT GTG CTT AAA GGA ACT GAA CAT GAG 2279 Tyr Val Thr Gly Lys Gly Asn Asp Val Leu Lys Gly Thr Glu His Glu 1885 1890 1895 GAT TTG TTT CTC GGT GGT GAG GGG AAT GAT ACT TAT TAT GCG AGA GTA 2327 Asp Leu Phe Leu Gly Gly Glu Gly Asn Asp Thr Tyr Tyr Ala Arg Val 1900 1905 1910 GGC GAT ACA ATT GAA GAC GCC GAC GGC AAA GGT AAA GTC TAT TTT GTG 2375 Gly Asp Thr Ile Glu Asp Ala Asp Gly Lys Gly Lys Val Tyr Phe Val 1915 1920 1925 AGA GAA AAA GGG GTA CCT AAG GCG GAT CCT AAG CGG GTA GAG TTT AGC 2423 Arg Glu Lys Gly Val Pro Lys Ala Asp Pro Lys Arg Val Glu Phe Ser 1930 1935 1940 GAG TAC ATA ACG AAA GAA GAA ATA AAA GAG GTT GAA AAG GGG TTA TTA 2471 Glu Tyr Ile Thr Lys Glu Glu Ile Lys Glu Val Glu Lys Gly Leu Leu 1945 1950 1955 1960 ACT TAC GCA GTT TTA GAA AAT TAT AAT TGG GAA GAG AAA ACG GCG ACT 2519 Thr Tyr Ala Val Leu Glu Asn Tyr Asn Trp Glu Glu Lys Thr Ala Thr 1965 1970 1975 TTC GCT CAT GCG ACT ATG CTT AAT GAG CTT TTT ACT GAT TAT ACT AAT 2567 Phe Ala His Ala Thr Met Leu Asn Glu Leu Phe Thr Asp Tyr Thr Asn 1980 1985 1990 TAT CGT TAT GAA GTT AAA GGA CTA AAA TTG CCC GCC GTT AAA AAG TTA 2615 Tyr Arg Tyr Glu Val Lys Gly Leu Lys Leu Pro Ala Val Lys Lys Leu 1995 2000 2005 AAA AGT CCG TTG GTG GAG TTT ACA GCT GAT TTA TTA ACT GTT ACG CCT 2663 Lys Ser Pro Leu Val Glu Phe Thr Ala Asp Leu Leu Thr Val Thr Pro 2010 2015 2020 ATT GAC GAA AAC GGA AAA GCA CTT AGC GAA AAA AGT ATT ACG GTT AAA 2711 Ile Asp Glu Asn Gly Lys Ala Leu Ser Glu Lys Ser Ile Thr Val Lys 2025 2030 2035 2040 AAT TTT AAA AAT GGT GAT TTA GGA ATA AGG TTG TTG GAT CCT AAT AGC 2759 Asn Phe Lys Asn Gly Asp Leu Gly Ile Arg Leu Leu Asp Pro Asn Ser 2045 2050 2055 TAT TAT TAT TTC CTT GAA GGC CAA GAT ACG GGT TTT TAT GGT CCT GCT 2807 Tyr Tyr Tyr Phe Leu Glu Gly Gln Asp Thr Gly Phe Tyr Gly Pro Ala 2060 2065 2070 TTT TAT ATT GAA CGA AAA AAC GGT GGA GGC TCT AAA AAT AAC TCG TCG 2855 Phe Tyr Ile Glu Arg Lys Asn Gly Gly Gly Ser Lys Asn Asn Ser Ser 2075 2080 2085 GGA GCA GGA AAT AGC AAA GAT TGG GGC GGG AAC GGG CAT GGA AAT CAC 2903 Gly Ala Gly Asn Ser Lys Asp Trp Gly Gly Asn Gly His Gly Asn His 2090 2095 2100 CGA AAT AAT GCC TCC GAC CTG AAT AAA CCG GAC GGA AAT AAT GGG AAT 2951 Arg Asn Asn Ala Ser Asp Leu Asn Lys Pro Asp Gly Asn Asn Gly Asn 2105 2110 2115 2120 AAC CAA AAT AAC GGA AGC AAT CAA GAT AAT CAT AGC GAT GTG AAT GCG 2999 Asn Gln Asn Asn Gly Ser Asn Gln Asp Asn His Ser Asp Val Asn Ala 2125 2130 2135 CCA AAT AAC CCG GGA CGT AAC TAT GAT ATT TAC GAT CCT TTA GCT TTA 3047 Pro Asn Asn Pro Gly Arg Asn Tyr Asp Ile Tyr Asp Pro Leu Ala Leu 2140 2145 2150 GAT TTA GAT GGA GAT GGG CTT GAA ACC GTG TCG ATG AAC GGG CGA CAA 3095 Asp Leu Asp Gly Asp Gly Leu Glu Thr Val Ser Met Asn Gly Arg Gln 2155 2160 2165 GGC GCG TTA TTC GAT CAT GAA GGA AAA GGT ATT CGT ACC GCA ACG GGC 3143 Gly Ala Leu Phe Asp His Glu Gly Lys Gly Ile Arg Thr Ala Thr Gly 2170 2175 2180 TGG CTC GCT GCG GAT GAC GGT TTT TTA GTG TTA GAT CGT AAC CAA GAC 3191 Trp Leu Ala Ala Asp Asp Gly Phe Leu Val Leu Asp Arg Asn Gln Asp 2185 2190 2195 2200 GGC ATT ATT AAT GAT ATA AGC GAG TTA TTT AGT AAT AAA AAT CAA CTT 3239 Gly Ile Ile Asn Asp Ile Ser Glu Leu Phe Ser Asn Lys Asn Gln Leu 2205 2210 2215 TCC GAC GGG AGT ATT TCT GCA CAC GGT TTT GCG ACA TTA GCC GAT TTG 3287 Ser Asp Gly Ser Ile Ser Ala His Gly Phe Ala Thr Leu Ala Asp Leu 2220 2225 2230 GAT ACA AAC CAA GAT CAG CGT ATC GAC CAA AAT GAT AAG CTG TTT TCT 3335 Asp Thr Asn Gln Asp Gln Arg Ile Asp Gln Asn Asp Lys Leu Phe Ser 2235 2240 2245 AAA CTC CAA ATT TGG CGG GAT TTA AAT CAA AAC GGT TTT AGT GAA GCG 3383 Lys Leu Gln Ile Trp Arg Asp Leu Asn Gln Asn Gly Phe Ser Glu Ala 2250 2255 2260 AAT GAG CTG TTT AGC TTA GAA AGT TTG AAT ATT AAA TCT TTA CAT ACC 3431 Asn Glu Leu Phe Ser Leu Glu Ser Leu Asn Ile Lys Ser Leu His Thr 2265 2270 2275 2280 GCC TAT GAA GAG CGT AAT GAT TTT CTA GCG GGC AAT AAT ATC CTT GCT 3479 Ala Tyr Glu Glu Arg Asn Asp Phe Leu Ala Gly Asn Asn Ile Leu Ala 2285 2290 2295 CAG CTT GGG AAG TAT GAA AAA ACG GAC GGT ACT TTT GGA CAA ATG GGC 3527 Gln Leu Gly Lys Tyr Glu Lys Thr Asp Gly Thr Phe Gly Gln Met Gly 2300 2305 2310 GAT TTA AAT TTC AGT TTT AAC CCG TTT TAT AGC CGA TTT ACC GAA GCG 3575 Asp Leu Asn Phe Ser Phe Asn Pro Phe Tyr Ser Arg Phe Thr Glu Ala 2315 2320 2325 TTA AAT TTA ACC GAG CAA CAA CGT CGC ACA ATT AAT CTA ACC GGC ACC 3623 Leu Asn Leu Thr Glu Gln Gln Arg Arg Thr Ile Asn Leu Thr Gly Thr 2330 2335 2340 GGT CGG GTT CGG GAT TTG CGT GAA GCC GCC GCA CTT TCT GAG GAG TTG 3671 Gly Arg Val Arg Asp Leu Arg Glu Ala Ala Ala Leu Ser Glu Glu Leu 2345 2350 2355 2360 GCT GCT TTA TTA CAA CAG TAC ACT AAG GGC TCC GAT TTT CAG GCA CAA 3719 Ala Ala Leu Leu Gln Gln Tyr Thr Lys Gly Ser Asp Phe Gln Ala Gln 2365 2370 2375 CGA GAA TTA TTG CCT GCC ATT TTA GAT AAA TGG GCG GCA ACG GAT TTA 3767 Arg Glu Leu Leu Pro Ala Ile Leu Asp Lys Trp Ala Ala Thr Asp Leu 2380 2385 2390 CAG TAT CAA CAT TAT GAT AAA ACA TTA CTT AAA ACG GTA GAA AGT ACC 3815 Gln Tyr Gln His Tyr Asp Lys Thr Leu Leu Lys Thr Val Glu Ser Thr 2395 2400 2405 GAT AGT AGT GCT TCT GTC GTT AGA GTC ACG CCT TCT CAA TTA AGT AGT 3863 Asp Ser Ser Ala Ser Val Val Arg Val Thr Pro Ser Gln Leu Ser Ser 2410 2415 2420 ATA CGC AAT GTA AAG CAT GAT CCT ACC GTT ATG CAA AAC TGT GAA CAA 3911 Ile Arg Asn Val Lys His Asp Pro Thr Val Met Gln Asn Cys Glu Gln 2425 2430 2435 2440 AGT AAG GCA AAA ATT GCG ACT TTA AAT TCG CTC TAC GGG TTA AAT ATT 3959 Ser Lys Ala Lys Ile Ala Thr Leu Asn Ser Leu Tyr Gly Leu Asn Ile 2445 2450 2455 GAT CAA CTT TAT TAT ACG ACG GAT AAA GAC ATT CGT TAT ATT ACT GAC 4007 Asp Gln Leu Tyr Tyr Thr Thr Asp Lys Asp Ile Arg Tyr Ile Thr Asp 2460 2465 2470 AAA GTG AAT AAT ATG TAT CAA ACA ACC GGA GAA CTC GGC TAT CGT TCT 4055 Lys Val Asn Asn Met Tyr Gln Thr Thr Gly Glu Leu Gly Tyr Arg Ser 2475 2480 2485 TTA CTT TTA CAA ACG CGT GTG AAG AAA TAT GTT TAT AGC GTT AAT GCG 4103 Leu Leu Leu Gln Thr Arg Val Lys Lys Tyr Val Tyr Ser Val Asn Ala 2490 2495 2500 AAA CAA TTC GAA GGG AAA TGG GTA GCC GAT TAT TCT CGT ACT GAA GCC 4151 Lys Gln Phe Glu Gly Lys Trp Val Ala Asp Tyr Ser Arg Thr Glu Ala 2505 2510 2515 2520 TTA TTT AAC TCT ACT TAT AAA CAA TCG CCC GAA AAT GTA TTA TAT GAT 4199 Leu Phe Asn Ser Thr Tyr Lys Gln Ser Pro Glu Asn Val Leu Tyr Asp 2525 2530 2535 TTA CGC GAA TAC CTT TCT TTC TAT AAC GAC CCT ACG GAA TGG AAA GAA 4247 Leu Arg Glu Tyr Leu Ser Phe Tyr Asn Asp Pro Thr Glu Trp Lys Glu 2540 2545 2550 GGG CTA TTA CTG TTA AGC CGT TAT ATA GAT TAT GCT AAA GCA CAA GGA 4295 Gly Leu Leu Leu Leu Ser Arg Tyr Ile Asp Tyr Ala Lys Ala Gln Gly 2555 2560 2565 TTT TAT GAA AAC TGG GCG GCT ACT TCT AAC TTA ACT ATT GCC CGT TTA 4343 Phe Tyr Glu Asn Trp Ala Ala Thr Ser Asn Leu Thr Ile Ala Arg Leu 2570 2575 2580 AGA GAG GCT GGA GTA ATT TGT GCA GAA TCG ACG GAT TTA AAA GGC GAT 4391 Arg Glu Ala Gly Val Ile Cys Ala Glu Ser Thr Asp Leu Lys Gly Asp 2585 2590 2595 2600 GAA AAA AAT AAT ATT GTG TTA GGT AGC CAA AAA GAT AAT AAC TTA TCG 4439 Glu Lys Asn Asn Ile Val Leu Gly Ser Gln Lys Asp Asn Asn Leu Ser 2605 2610 2615 GGT AGT GCA GGT GAT GAT CTA CTT ATC GGC GGA GAG GGT AAT GAT ACG 4487 Gly Ser Ala Gly Asp Asp Leu Leu Ile Gly Gly Glu Gly Asn Asp Thr 2620 2625 2630 TTA AAA GGC AGC TAC GGT GCA GAC ACC TAT ATC TTT AGC AAA GGG CAT 4535 Leu Lys Gly Ser Tyr Gly Ala Asp Thr Tyr Ile Phe Ser Lys Gly His 2635 2640 2645 GGA CAA GAT GTA ATT TAT GAA TAT TCC GAC AGT GCA AAC TCT AAA AAA 4583 Gly Gln Asp Val Ile Tyr Glu Tyr Ser Asp Ser Ala Asn Ser Lys Lys 2650 2655 2660 GAT ATT GAT ACC TTA AAA TTT ACC GAT GTG AAT TAT GCG GAA GTG AAG 4631 Asp Ile Asp Thr Leu Lys Phe Thr Asp Val Asn Tyr Ala Glu Val Lys 2665 2670 2675 2680 TTT CGA CGA GTA GAT AAT GAC TTA ATG TTA TTC GGT TAT CAT GAT ACG 4679 Phe Arg Arg Val Asp Asn Asp Leu Met Leu Phe Gly Tyr His Asp Thr 2685 2690 2695 GAT TCG GTC ACG GTA AAA TCC TTC TAC AGC CAT GTA GAT TAT CAA TTT 4727 Asp Ser Val Thr Val Lys Ser Phe Tyr Ser His Val Asp Tyr Gln Phe 2700 2705 2710 GAC AAA TTG GAG TTT GCT GAC CGC AGT ATA ACT CGC GAT GAA CTG ATT 4775 Asp Lys Leu Glu Phe Ala Asp Arg Ser Ile Thr Arg Asp Glu Leu Ile 2715 2720 2725 AAA GCA GGG CTT CAT CTA TAC GGC ACC GAT GGC AAT GAT GAT ATA AAG 4823 Lys Ala Gly Leu His Leu Tyr Gly Thr Asp Gly Asn Asp Asp Ile Lys 2730 2735 2740 GAT CAT GCG GAT TGG GAC AGC ATT GTG GAA GGC GGC AAA GGC AAC GAT 4871 Asp His Ala Asp Trp Asp Ser Ile Val Glu Gly Gly Lys Gly Asn Asp 2745 2750 2755 2760 ATT CTA AGA GGT GGC TAC GGT GCG GAC ACC TAT ATC TTT AGC AAA GGA 4919 Ile Leu Arg Gly Gly Tyr Gly Ala Asp Thr Tyr Ile Phe Ser Lys Gly 2765 2770 2775 CAC GGA CAG GAT ATC GTT TAT GAA GAT ACC AAT AAT GAT AAC CGA GCA 4967 His Gly Gln Asp Ile Val Tyr Glu Asp Thr Asn Asn Asp Asn Arg Ala 2780 2785 2790 AGA GAT ATC GAC ACC TTA ACA TTT ACT GAT GTG AAT TAT GCG GAA GTG 5015 Arg Asp Ile Asp Thr Leu Thr Phe Thr Asp Val Asn Tyr Ala Glu Val 2795 2800 2805 AAA TTC CGA CGA GTA GAT AAT GAC TTA ATG TTA TTC GGT TAT CAT GAT 5063 Lys Phe Arg Arg Val Asp Asn Asp Leu Met Leu Phe Gly Tyr His Asp 2810 2815 2820 ACG GAT TCG GTC ACG ATA AAA TCC TTC TAC AAC CAT GTA GAT TAT CAA 5111 Thr Asp Ser Val Thr Ile Lys Ser Phe Tyr Asn His Val Asp Tyr Gln 2825 2830 2835 2840 TGT GAC AAA TTG GAC TTT GCT GAC CGC AGT ATA ACT CGT GAT GAA CTA 5159 Cys Asp Lys Leu Asp Phe Ala Asp Arg Ser Ile Thr Arg Asp Glu Leu 2845 2850 2855 GGT AAA CAA GGT ATG GCA TTA TTT GGC ACT GAC GGC GAT GAT AAT ATC 5207 Gly Lys Gln Gly Met Ala Leu Phe Gly Thr Asp Gly Asp Asp Asn Ile 2860 2865 2870 AAC GAC TGG GGA CGT AAC TCG GTG ATT GAT GCC GGT GCG GGT AAT GAT 5255 Asn Asp Trp Gly Arg Asn Ser Val Ile Asp Ala Gly Ala Gly Asn Asp 2875 2880 2885 ACG GTT AAT GGC GGT AAT GGC GAT GAC ACC CTC ATC GGC GGC AAA GGT 5303 Thr Val Asn Gly Gly Asn Gly Asp Asp Thr Leu Ile Gly Gly Lys Gly 2890 2895 2900 AAT GAT ATT CTA AGA GGT GGC TAC GGT GCG GAC ACC TAT ATC TTT AGC 5351 Asn Asp Ile Leu Arg Gly Gly Tyr Gly Ala Asp Thr Tyr Ile Phe Ser 2905 2910 2915 2920 AAA GGA CAC GGA CAG GAT ATC GTT TAT GAA GAT ACC AAT AAT GAT AAC 5399 Lys Gly His Gly Gln Asp Ile Val Tyr Glu Asp Thr Asn Asn Asp Asn 2925 2930 2935 CGC GCA AGA GAT ATC GAC ACC TTA AAA TTT ACT GAT ATT AAT TTA TCC 5447 Arg Ala Arg Asp Ile Asp Thr Leu Lys Phe Thr Asp Ile Asn Leu Ser 2940 2945 2950 GAA CTT TGG TTT AGC CGA GAA AAT AAC GAT TTG ATT ATT AAA TCA TTA 5495 Glu Leu Trp Phe Ser Arg Glu Asn Asn Asp Leu Ile Ile Lys Ser Leu 2955 2960 2965 TTA AGT GAG GAT AAA GTC ACG GTT CAA AAT TGG TAT TCA CAC CAA GAT 5543 Leu Ser Glu Asp Lys Val Thr Val Gln Asn Trp Tyr Ser His Gln Asp 2970 2975 2980 CAT AAA ATA GAA AAT ATT CGT TTA TCG AAT GAG CAA ATG TTG GTG AGC 5591 His Lys Ile Glu Asn Ile Arg Leu Ser Asn Glu Gln Met Leu Val Ser 2985 2990 2995 3000 ACT CAG GTG GAG AAG ATG GTT GAG TCG ATG GCC GGC TTT GCT CAG AAG 5639 Thr Gln Val Glu Lys Met Val Glu Ser Met Ala Gly Phe Ala Gln Lys 3005 3010 3015 CAC GGA GGA GAG ATA TCT CTT CTG TCG CCT GAA GAG GTA AAA CAA TAT 5687 His Gly Gly Glu Ile Ser Leu Leu Ser Pro Glu Glu Val Lys Gln Tyr 3020 3025 3030 ATC AAT AGC TTA ACA GCT GCT TTA TAA CATACGAAAG AAATCGGCAC 5734 Ile Asn Ser Leu Thr Ala Ala Leu * 3035 3040 AGTTTTTGTG AACTGTGCCG ATTTGATTTT AGTGTAAGAA TATAGCCTGA TTTTAAGAAA 5794 TTTACTCTTG GCTAATAACT ATTTCCCATT TTATAAGTTA TTGACGGATG GTTTTATCAA 5854 ATATGAGATC AAATCTTATT TTAAATTCGC TTTCCATTAA GCGATATTGA TCTTTTAAGT 5914 TTGGGGCCGC ATGAGTTTGG AACCGATACC ACTCATTGTG GGAATCAATA CACAATACGC 5974 TGTAATCGGA CTCTTGCAGT TCATAATAAT GCTTTCTCTC CGTTAATTCT TCTTGCGTAT 6034 ATGGCGAGAG ATTAAAGCTG AATGGCTGGT TCGCACTAAC AAACAGGTTC TCCGATTTCA 6094 GATATTCACA ACCGTAATGG CTACCGGTTT CCTGCGGTTT TACATAATTG GTATGATTTT 6154 GTTTAGCTGT TATACGGTAG ATGCCTAATT GTGGTAAATT GCGTGTGTCA ATATAGCTTT 6214 CTTGTTCTCC GTAACCGAAA TACTCAATGG CGTTTTCTGT TTTAGCTAAG AAGAAACGTA 6274 AGCCGAAGCG GGGTAAATAC GGTAATTCGA TCGGGCGAAT AGCGTTAATT TCAACCGAAA 6334 GTTGTCCGTC ATTGAAGATA CGATAACGAA TATCCAGTGT TAAAATGCGA CCGCGAGAAA 6394 TTGACACAAT TGCAGATTTT ACTGAAAATT CGACCGCTTG TTCGCTTTGC TGCCACTGAA 6454 TTTCATACGC TCTGGTATAG GCTTTATCGT AGCCGGCATT TTGGCACGCC TCACGAATGA 6514 GGCGATCATT GTCGGTTGGC GCACGCCAAA TATTAAAATC TAACGATTGT TGGATAATCG 6574 CTTTACCGGC TTTTTCAATA CGGGTGAAAA TCCCTTTCTG TTTATCTAAT TGATAACTAA 6634 ATTGACCGTT GTGTACGTTA ATGTGGAAGC GATCTTCTTG TACTTCAAAT GCACTGTTCT 6694 CAATTGTGAA TTGTGGTAAT ACTAATTTAT TTTCGCTAAA TAAATTGAGC TGCTCGAAGC 6754 CAAGTGAATG TGCTTCGTCT AATAATTCGA CCGCGGTATT TAAGCGATAA TTTAAATTCA 6814 GTAGCCATAA ATGCCCGTTA TTTTTTGGTA ACTCAATCGG TAATACTACG CTGCCGTGCG 6874 GTTGGCAAGA AACGGATAAA TTCCCACCGC TTGTCACCAC GCCGTTTTCG ACAAATTCGT 6934 AATCAATCGT TAAATAATCG GCAAGATCAG TGAAATCCAA GTAGTTGTGG ATCACAATTT 6994 GGTTATCGAT 7004 (2)SEQ ID NO:4:信息: (i)序列特征: (A)长度:1383个氨基酸 (B)类型:氨基酸 (D)拓扑学:线性 (ii)分子类型:蛋白 (xi)序列描述:SEQ ID NO:4: Met Ser Asp Asn Ala Phe Phe Val Ile Glu Glu Ser Gly Lys Arg Tyr 1 5 10 15 Ile Glu Asn Phe Gly Ile Glu Pro Leu Gly Lys Gln Glu Asp Phe Asp 20 25 30 Phe Val Gly Gly Phe Trp Ser Asn Leu Val Asn Arg Gly Leu Glu Ser 35 40 45 Ile Ile Asp Pro Ser Gly Ile Gly Gly Thr Val Asn Leu Asn Phe Thr 50 55 60 Gly Glu Val Glu Thr Tyr Thr Leu Asp Glu Thr Arg Phe Lys Ala Glu 65 70 75 80 Ala Ala Lys Lys Ser His Trp Ser Leu Val Asn Ala Ala Lys Val Tyr 85 90 95 Gly Gly Leu Asp Gln Ile Ile Lys Lys Leu Trp Asp Ser Gly Ser Ile 100 105 110 Lys His Leu Tyr Gln Asp Lys Asp Thr Gly Lys Leu Lys Pro Ile Ile 115 120 125 Tyr Gly Thr Ala Gly Asn Asp Ser Lys Ile Glu Gly Thr Lys Ile Thr 130 135 140 Arg Arg Ile Ala Gly Lys Glu Val Thr Leu Asp Ile Ala Asn Gln Lys 145 150 155 160 Ile Glu Lys Gly Val Leu Glu Lys Leu Gly Leu Ser Val Ser Gly Ser 165 170 175 Asp Ile Ile Lys Leu Leu Phe Gly Ala Leu Thr Pro Thr Leu Asn Arg 180 185 190 Met Leu Leu Ser Gln Leu Ile Gln Ser Phe Ser Asp Ser Leu Ala Lys 195 200 205 Leu Asp Asn Pro Leu Ala Pro Tyr Thr Lys Asn Gly Val Val Tyr Val 210 215 220 Thr Gly Lys Gly Asn Asp Val Leu Lys Gly Thr Glu His Glu Asp Leu 225 230 235 240 Phe Leu Gly Gly Glu Gly Asn Asp Thr Tyr Tyr Ala Arg Val Gly Asp 245 250 255 Thr Ile Glu Asp Ala Asp Gly Lys Gly Lys Val Tyr Phe Val Arg Glu 260 265 270 Lys Gly Val Pro Lys Ala Asp Pro Lys Arg Val Glu Phe Ser Glu Tyr 275 280 285 Ile Thr Lys Glu Glu Ile Lys Glu Val Glu Lys Gly Leu Leu Thr Tyr 290 295 300 Ala Val Leu Glu Asn Tyr Asn Trp Glu Glu Lys Thr Ala Thr Phe Ala 305 310 315 320 His Ala Thr Met Leu Asn Glu Leu Phe Thr Asp Tyr Thr Asn Tyr Arg 325 330 335 Tyr Glu Val Lys Gly Leu Lys Leu Pro Ala Val Lys Lys Leu Lys Ser 340 345 350 Pro Leu Val Glu Phe Thr Ala Asp Leu Leu Thr Val Thr Pro Ile Asp 355 360 365 Glu Asn Gly Lys Ala Leu Ser Glu Lys Ser Ile Thr Val Lys Asn Phe 370 375 380 Lys Asn Gly Asp Leu Gly Ile Arg Leu Leu Asp Pro Asn Ser Tyr Tyr 385 390 395 400 Tyr Phe Leu Glu Gly Gln Asp Thr Gly Phe Tyr Gly Pro Ala Phe Tyr 405 410 415 Ile Glu Arg Lys Asn Gly Gly Gly Ser Lys Asn Asn Ser Ser Gly Ala 420 425 430 Gly Asn Ser Lys Asp Trp Gly Gly Asn Gly His Gly Asn His Arg Asn 435 440 445 Asn Ala Ser Asp Leu Asn Lys Pro Asp Gly Asn Asn Gly Asn Asn Gln 450 455 460 Asn Asn Gly Ser Asn Gln Asp Asn His Ser Asp Val Asn Ala Pro Asn 465 470 475 480 Asn Pro Gly Arg Asn Tyr Asp Ile Tyr Asp Pro Leu Ala Leu Asp Leu 485 490 495 Asp Gly Asp Gly Leu Glu Thr Val Ser Met Asn Gly Arg Gln Gly Ala 500 505 510 Leu Phe Asp His Glu Gly Lys Gly Ile Arg Thr Ala Thr Gly Trp Leu 515 520 525 Ala Ala Asp Asp Gly Phe Leu Val Leu Asp Arg Asn Gln Asp Gly Ile 530 535 540 Ile Asn Asp Ile Ser Glu Leu Phe Ser Asn Lys Asn Gln Leu Ser Asp 545 550 555 560 Gly Ser Ile Ser Ala His Gly Phe Ala Thr Leu Ala Asp Leu Asp Thr 565 570 575 Asn Gln Asp Gln Arg Ile Asp Gln Asn Asp Lys Leu Phe Ser Lys Leu 580 585 590 Gln Ile Trp Arg Asp Leu Asn Gln Asn Gly Phe Ser Glu Ala Asn Glu 595 600 605 Leu Phe Ser Leu Glu Ser Leu Asn Ile Lys Ser Leu His Thr Ala Tyr 610 615 620 Glu Glu Arg Asn Asp Phe Leu Ala Gly Asn Asn Ile Leu Ala Gln Leu 625 630 635 640 Gly Lys Tyr Glu Lys Thr Asp Gly Thr Phe Gly Gln Met Gly Asp Leu 645 650 655 Asn Phe Ser Phe Asn Pro Phe Tyr Ser Arg Phe Thr Glu Ala Leu Asn 660 665 670 Leu Thr Glu Gln Gln Arg Arg Thr Ile Asn Leu Thr Gly Thr Gly Arg 675 680 685 Val Arg Asp Leu Arg Glu Ala Ala Ala Leu Ser Glu Glu Leu Ala Ala 690 695 700 Leu Leu Gln Gln Tyr Thr Lys Gly Ser Asp Phe Gln Ala Gln Arg Glu 705 710 715 720 Leu Leu Pro Ala Ile Leu Asp Lys Trp Ala Ala Thr Asp Leu Gln Tyr 725 730 735 Gln His Tyr Asp Lys Thr Leu Leu Lys Thr Val Glu Ser Thr Asp Ser 740 745 750 Ser Ala Ser Val Val Arg Val Thr Pro Ser Gln Leu Ser Ser Ile Arg 755 760 765 Asn Val Lys His Asp Pro Thr Val Met Gln Asn Cys Glu Gln Ser Lys 770 775 780 Ala Lys Ile Ala Thr Leu Asn Ser Leu Tyr Gly Leu Asn Ile Asp Gln 785 790 795 800 Leu Tyr Tyr Thr Thr Asp Lys Asp Ile Arg Tyr Ile Thr Asp Lys Val 805 810 815 Asn Asn Met Tyr Gln Thr Thr Gly Glu Leu Gly Tyr Arg Ser Leu Leu 820 825 830 Leu Gln Thr Arg Val Lys Lys Tyr Val Tyr Ser Val Asn Ala Lys Gln 835 840 845 Phe Glu Gly Lys Trp Val Ala Asp Tyr Ser Arg Thr Glu Ala Leu Phe 850 855 860 Asn Ser Thr Tyr Lys Gln Ser Pro Glu Asn Val Leu Tyr Asp Leu Arg 865 870 875 880 Glu Tyr Leu Ser Phe Tyr Asn Asp Pro Thr Glu Trp Lys Glu Gly Leu 885 890 895 Leu Leu Leu Ser Arg Tyr Ile Asp Tyr Ala Lys Ala Gln Gly Phe Tyr 900 905 910 Glu Asn Trp Ala Ala Thr Ser Asn Leu Thr Ile Ala Arg Leu Arg Glu 915 920 925 Ala Gly Val Ile Cys Ala Glu Ser Thr Asp Leu Lys Gly Asp Glu Lys 930 935 940 Asn Asn Ile Val Leu Gly Ser Gln Lys Asp Asn Asn Leu Ser Gly Ser 945 950 955 960 Ala Gly Asp Asp Leu Leu Ile Gly Gly Glu Gly Asn Asp Thr Leu Lys 965 970 975 Gly Ser Tyr Gly Ala Asp Thr Tyr Ile Phe Ser Lys Gly His Gly Gln 980 985 990 Asp Val Ile Tyr Glu Tyr Ser Asp Ser Ala Asn Ser Lys Lys Asp Ile 995 1000 1005 Asp Thr Leu Lys Phe Thr Asp Val Asn Tyr Ala Glu Val Lys Phe Arg 1010 1015 1020 Arg Val Asp Asn Asp Leu Met Leu Phe Gly Tyr His Asp Thr Asp Ser 1025 1030 1035 1040 Val Thr Val Lys Ser Phe Tyr Ser His Val Asp Tyr Gln Phe Asp Lys 1045 1050 1055 Leu Glu Phe Ala Asp Arg Ser Ile Thr Arg Asp Glu Leu Ile Lys Ala 1060 1065 1070 Gly Leu His Leu Tyr Gly Thr Asp Gly Asn Asp Asp Ile Lys Asp His 1075 1080 1085 Ala Asp Trp Asp Ser Ile Val Glu Gly Gly Lys Gly Asn Asp Ile Leu 1090 1095 1100 Arg Gly Gly Tyr Gly Ala Asp Thr Tyr Ile Phe Ser Lys Gly His Gly 1105 1110 1115 1120 Gln Asp Ile Val Tyr Glu Asp Thr Asn Asn Asp Asn Arg Ala Arg Asp 1125 1130 1135 Ile Asp Thr Leu Thr Phe Thr Asp Val Asn Tyr Ala Glu Val Lys Phe 1140 1145 1150 Arg Arg Val Asp Asn Asp Leu Met Leu Phe Gly Tyr His Asp Thr Asp 1155 1160 1165 Ser Val Thr Ile Lys Ser Phe Tyr Asn His Val Asp Tyr Gln Cys Asp 1170 1175 1180 Lys Leu Asp Phe Ala Asp Arg Ser Ile Thr Arg Asp Glu Leu Gly Lys 1185 1190 1195 1200 Gln Gly Met Ala Leu Phe Gly Thr Asp Gly Asp Asp Asn Ile Asn Asp 1205 1210 1215 Trp Gly Arg Asn Ser Val Ile Asp Ala Gly Ala Gly Asn Asp Thr Val 1220 1225 1230 Asn Gly Gly Asn Gly Asp Asp Thr Leu Ile Gly Gly Lys Gly Asn Asp 1235 1240 1245 Ile Leu Arg Gly Gly Tyr Gly Ala Asp Thr Tyr Ile Phe Ser Lys Gly 1250 1255 1260 His Gly Gln Asp Ile Val Tyr Glu Asp Thr Asn Asn Asp Asn Arg Ala 1265 1270 1275 1280 Arg Asp Ile Asp Thr Leu Lys Phe Thr Asp Ile Asn Leu Ser Glu Leu 1285 1290 1295 Trp Phe Ser Arg Glu Asn Asn Asp Leu Ile Ile Lys Ser Leu Leu Ser 1300 1305 1310 Glu Asp Lys Val Thr Val Gln Asn Trp Tyr Ser His Gln Asp His Lys 1315 1320 1325 Ile Glu Asn Ile Arg Leu Ser Asn Glu Gln Met Leu Val Ser Thr Gln 1330 1335 1340 Val Glu Lys Met Val Glu Ser Met Ala Gly Phe Ala Gln Lys His Gly 1345 1350 1355 1360 Gly Glu Ile Ser Leu Leu Ser Pro Glu Glu Val Lys Gln Tyr Ile Asn 1365 1370 1375 Ser Leu Thr Ala Ala Leu * 1380 (2)SEQ ID NO:5信息: (i)序列特征: (A)长度:6736个碱基对 (B)类型:核酸 (C)链型:双链 (D)拓扑学:线性 (ii)分子类型:DNA(基因组) (iii)假设:无 (iv)反义:无 (vi)最初来源: (A)有机体:胸膜肺炎放线杆菌 (B)菌株:4074(血清型1参比菌株) (vii)直接来源: (B)克隆:pROK7 (ix)特征: (A)名字/关键:CDS (B)位置:1132…6549 (C)鉴定方法:实验 (D)其它信息:/密码子-起始=1132 /功能=“RTX毒素” /产物=“ApxIV” /证据=实验 /基因=“ApxIV_v1” (ix)特征: (A)名字/关键:CDS (B)位置:639…1178 (D)其它信息:/密码子_起始=639 /功能=“未知” /产物=“ORF1” /基因=“orf1” (ix)特征: (A)名字/关键:CDS (B)位置:1…453 (D)其它信息:/部分 /产物=“Met-G” /基因=“mrp” /标准_名=“mrp” /标记=mrp (ix)特征: (A)名字/关键:-10_信号 (B)位置:617…623 (D)其它信息:/标准_名字=“-10” /标记=-10_S (ix)特征: (A)名字/关键:-35_信号 (B)位置:594..599 (D)其它信息:/标准_名字=“-35_S” /标记:=-35_S (ix)特征: (A)名字/关键:启动子 (B)位置:454…1131 (D)其它信息:/功能=“启动子” /标准_名称=“启动子ApxIV” /标记=启动子 (ix)序列描述:SEQ ID NO:5: ATC GAT ATG CCG CCG GGT ACG GGC GAT ATC CAA CTT ACT CTT TCG CAA 48 Ile Asp Met Pro Pro Gly Thr Gly Asp Ile Gln Leu Thr Leu Ser Gln 1 5 10 15 CAA ATT CCG GTT ACC GGT GCG GTG GTG GTA ACC ACT CCG CAA GAT ATT 96 Gln Ile Pro Val Thr Gly Ala Val Val Val Thr Thr Pro Gln Asp Ile 20 25 30 GCG TTA TTA GAT GCG GTG AAA GGT ATT TCA ATG TTC CAA AAA GTG TCG 144 Ala Leu Leu Asp Ala Val Lys Gly Ile Ser Met Phe Gln Lys Val Ser 35 40 45 GTA CCG GTC TTA GGT ATC ATT GAA AAT ATG AGC GTA CAT ATC TGC CAA 192 Val Pro Val Leu Gly Ile Ile Glu Asn Met Ser Val His Ile Cys Gln 50 55 60 AAT TGC GGT CAC CAC GAA GAT ATT TTC GGC ACC GGC GGT GCG GAG AAA 240 Asn Cys Gly His His Glu Asp Ile Phe Gly Thr Gly Gly Ala Glu Lys 65 70 75 80 GTG GCG AAG AAA TAC GGT ACT AAA GTA TTA GGA CAA ATG CCG TTG CAT 288 Val Ala Lys Lys Tyr Gly Thr Lys Val Leu Gly Gln Met Pro Leu His 85 90 95 ATT CGC TTA CGT CAA GAT TTG GAT GCC GGC ACA CCG ACC GTC GTT GCG 336 Ile Arg Leu Arg Gln Asp Leu Asp Ala Gly Thr Pro Thr Val Val Ala 100 105 110 GCA CCG GAA CAC GAA ACC AGC CGA GCC TAT ATT GAA TTA GCG GCA AAA 384 Ala Pro Glu His Glu Thr Ser Arg Ala Tyr Ile Glu Leu Ala Ala Lys 115 120 125 GTC GCT TCG GAA TTA TAC TGG CAA GGT TCG GTT ATC CCG TCT GAA ATT 432 Val Ala Ser Glu Leu Tyr Trp Gln Gly Sar Val Ile Pro Ser Glu Ile 130 135 140 ATG ATT CGT GAA GTA AAA TAA GTTTTAATAA CCACGAAAAC ACAAAGAACA 483 Met Ile Arg Glu Val Lys * 145 150 CAAGCGGTAG AATTTGCAGA AAAATTTGCA AATCCTACCG CTTTTTTATT AGTACGATTC 543 GCTGTTGGAC TGCTATTTGA TTTGGTTTGT CAGGATATTA TGTTATTGTA ATGAAATGTT 603 AGTGAATTAT TTTTATTAAT TTGAAAGGAA ACAAAATGAA AATAAAAAAA CGTTACATTG 663 CGCTGTTGGT CTTAGGTGTC GTTATCAGCT ATGCCTGGTA TCAAAATTAT CAATGGGAAC 723 AGCTGATGTT AAGCGGTTAT TGTGAAAAGG ACGGAAGTTA TTTTGATGAT AGGCATACGA 783 AGCAAGAACT GATTGATAGG GCAATTAACT ATATGCTGGA GCATCAATCT AAAAAAACAT 843 ACGATGCTTA TACTGATGAA CCTTTAGAAA TAAAACCATA TTTAACAATA GAGGAATTTA 903 AAAAACTCAA TCCAAATTGT TGTGAAATTA CCTCATGGCC AGCAGATGCA GTTCCACAAG 963 ATTGGGATGT TCGTGTGGAA GGTAAGGCAT ATAGGTATGT AATCGTAAAA TATTTAAGAA 1023 CCTTAGCAAA TAGAGAACCT GAACGATGGG AAACTAGTAT TGTTTTTGAT AATTGCGGCA 1083 ATCCTAAAAG AGCAAGCTAC TTATATTATT TAAAGAGAGA AATTTATT ATG ACA AAA 1140 Met Thr Lys 1 TTA ACT ATG CAA GAT GTG ACC AAT TTA TAT TTA TAT AAA ACG AAA ACT 1188 Leu Thr Met Gln Asp Val Thr Asn Leu Tyr Leu Tyr Lys Thr Lys Thr 5 10 15 CTA CCT AAA GAT AGA TTG GAT GAT TCA CTT ATT TCT GAA ATA GGA AAA 1236 Leu Pro Lys Asp Arg Leu Asp Asp Ser Leu Ile Ser Glu Ile Gly Lys 20 25 30 35 GGA GAT GAT GAT ATT GAT AGA AAA GAA TTT ATG GTG GGG CCG GGA CGT 1284 Gly Asp Asp Asp Ile Asp Arg Lys Glu Phe Met Val Gly Pro Gly Arg 40 45 50 TTT GTG ACC GCT GAT AAC TTT AGC GTT GTA AGA GAT TTT TTT AAT GCT 1332 Phe Val Thr Ala Asp Asn Phe Ser Val Val Arg Asp Phe Phe Asn Ala 55 60 65 GGG AAA TCA CGC ATT ATT GCG CCG CAA GTC CCG CCT ATT CGT TCA CAG 1380 Gly Lys Ser Arg Ile Ile Ala Pro Gln Val Pro Pro Ile Arg Ser Gln 70 75 80 CAG GAA AAA ATC TTG GTC GGT TTA AAA CCG GGC AAA TAT TCC AAA GCG 1428 Gln Glu Lys Ile Leu Val Gly Leu Lys Pro Gly Lys Tyr Ser Lys Ala 85 90 95 CAG ATA TTG GAA ATG CTG GGT TAT ACG AAA GGC GGA GAA GTG GTA AAT 1476 Gln Ile Leu Glu Met Leu Gly Tyr Thr Lys Gly Gly Glu Val Val Asn 100 105 110 115 GGC ATG TTT GCC GGT GAA GTC CAG ACA TTA GGC TTT TAT GAC GAT GGC 1524 Gly Met Phe Ala Gly Glu Val Gln Thr Leu Gly Phe Tyr Asp Asp Gly 120 125 130 AAA GGG GAT TTA CTC GAA CGC GCC TAT ATC TGG AAT ACC ACA GGA TTT 1572 Lys Gly Asp Leu Leu Glu Arg Ala Tyr Ile Trp Asn Thr Thr Gly Phe 135 140 145 AAA ATG AGC GAC AAT GCC TTT TTT GTT ATA GAA GAA TCA GGC AAA CGC 1620 Lys Met Ser Asp Asn Ala Phe Phe Val Ile Glu Glu Ser Gly Lys Arg 150 155 160 TAT ATT GAA AAC TTT GGT ATT GAA CCT CTT GGT AAG CAA GAA GAT TTT 1668 Tyr Ile Glu Asn Phe Gly Ile Glu Pro Leu Gly Lys Gln Glu Asp Phe 165 170 175 GAT TTT GTC GGC GGC TTT TGG TCT AAC TTA GTG AAT CGT GGT TTG GAA 1716 Asp Phe Val Gly Gly Phe Trp Ser Asn Leu Val Asn Arg Gly Leu Glu 180 185 190 195 AGT ATT ATC GAC CCA TCC GGT ATC GGT GGA ACG GTA AAC CTT AAC TTT 1764 Sar Ile Ile Asp Pro Sar Gly Ile Gly Gly Thr Val Asn Leu Asn Phe 200 205 210 ACC GGC GAG GTG GAA ACC TAC ACG TTA GAC GAA ACA AGG TTT AAA GCG 1812 Thr Gly Glu Val Glu Thr Tyr Thr Leu Asp Glu Thr Arg Phe Lys Ala 215 220 225 GAA GCG GCG AAG AAA AGC CAT TGG AGT TTA GTG AAT GCG GCG AAA GTA 1860 Glu Ala Ala Lys Lys Ser His Trp Ser Leu Val Asn Ala Ala Lys Val 230 235 240 TAC GGC GGT TTA GAC CAA ATT ATT AAA AAA CTA TGG GAC AGT GGC TCA 1908 Tyr Gly Gly Leu Asp Gln Ile Ile Lys Lys Leu Trp Asp Ser Gly Ser 245 250 255 ATT AAG CAT TTA TAT CAA GAT AAA GAT ACG GGC AAA TTA AAA CCG ATT 1956 Ile Lys His Leu Tyr Gln Asp Lys Asp Thr Gly Lys Leu Lys Pro Ile 260 265 270 275 ATT TAC GGC ACG GCC GGC AAC GAC AGT AAG ATT GAA GGC ACT AAA ATC 2004 Ile Tyr Gly Thr Ala Gly Asn Asp Ser Lys Ile Glu Gly Thr Lys Ile 280 285 290 ACC CGT AGG ATT GCG GGT AAA GAA GTT ACG CTT GAT ATT GCC AAT CAG 2052 Thr Arg Arg Ile Ala Gly Lys Glu Val Thr Leu Asp Ile Ala Asn Gln 295 300 305 AAA ATT GAA AAA GGC GTG TTA GAG AAA TTG GGG CTG TCT GTT AGT GGT 2100 Lys Ile Glu Lys Gly Val Leu Glu Lys Leu Gly Leu Ser Val Ser Gly 310 315 320 TCG GAT ATC ATT AAA TTG TTG TTT GGA GCA TTG ACT CCA ACT TTA AAT 2148 Ser Asp Ile Ile Lys Leu Leu Phe Gly Ala Leu Thr Pro Thr Leu Asn 325 330 335 AGA ATG TTG CTA TCA CAA CTT ATC CAG TCT TTT TCC GAT AGC TTG GCT 2196 Arg Met Leu Leu Ser Gln Leu Ile Gln Ser Phe Ser Asp Ser Leu Ala 340 345 350 355 AAA CTT GAT AAT CCC TTA GCC CCT TAC ACT AAA AAT GGC GTG GTT TAT 2244 Lys Leu Asp Asn Pro Leu Ala Pro Tyr Thr Lys Asn Gly Val Val Tyr 360 365 370 GTC ACC GGC AAA GGG AAT GAT GTG CTT AAA GGA ACT GAA CAT GAG GAT 2292 Val Thr Gly Lys Gly Asn Asp Val Leu Lys Gly Thr Glu His Glu Asp 375 380 385 TTG TTT CTC GGT GGT GAG GGG AAT GAT ACT TAT TAT GCG AGA GTA GGC 2340 Leu Phe Leu Gly Gly Glu Gly Asn Asp Thr Tyr Tyr Ala Arg Val Gly 390 395 400 GAT ACA ATT GAA GAC GCC GAC GGC AAA GGT AAA GTC TAT TTT GTG AGA 2388 Asp Thr Ile Glu Asp Ala Asp Gly Lys Gly Lys Val Tyr Phe Val Arg 405 410 415 GAA AAA GGG GTA CCT AAG GCG GAT CCT AAG CGG GTA GAG TTT AGC GAG 2436 Glu Lys Gly Val Pro Lys Ala Asp Pro Lys Arg Val Glu Phe Ser Glu 420 425 430 435 TAC ATA ACG AAA GAA GAA ATA AAA GAG GTT GAA AAG GGG TTA TTA ACT 2484 Tyr Ile Thr Lys Glu Glu Ile Lys Glu Val Glu Lys Gly Leu Leu Thr 440 445 450 TAC GCA GTT TTA GAA AAT TAT AAT TGG GAA GAG AAA ACG GCG ACT TTC 2532 Tyr Ala Val Leu Glu Asn Tyr Asn Trp Glu Glu Lys Thr Ala Thr Phe 455 460 465 GCT CAT GCG ACT ATG CTT AAT GAG CTT TTT ACT GAT TAT ACT AAT TAT 2580 Ala His Ala Thr Met Leu Asn Glu Leu Phe Thr Asp Tyr Thr Asn Tyr 470 475 480 CGT TAT GAA GTT AAA GGA CTA AAA TTG CCC GCC GTT AAA AAG TTA AAA 2628 Arg Tyr Glu Val Lys Gly Leu Lys Leu Pro Ala Val Lys Lys Leu Lys 485 490 495 AGT CCG TTG GTG GAG TTT ACA GCT GAT TTA TTA ACT GTT ACG CCT ATT 2676 Ser Pro Leu Val Glu Phe Thr Ala Asp Leu Leu Thr Val Thr Pro Ile 500 505 510 515 GAC GAA AAC GGA AAA GCA CTT AGC GAA AAA AGT ATT ACG GTT AAA AAT 2724 Asp Glu Asn Gly Lys Ala Leu Ser Glu Lys Ser Ile Thr Val Lys Asn 520 525 530 TTT AAA AAT GGT GAT TTA GGA ATA AGG TTG TTG GAT CCT AAT AGC TAT 2772 Phe Lys Asn Gly Asp Leu Gly Ile Arg Leu Leu Asp Pro Asn Ser Tyr 535 540 545 TAT TAT TTC CTT GAA GGC CAA GAT ACG GGT TTT TAT GGT CCT GCT TTT 2820 Tyr Tyr Phe Leu Glu Gly Gln Asp Thr Gly Phe Tyr Gly Pro Ala Phe 550 555 560 TAT ATT GAA CGA AAA AAC GGT GGC GGC GCT AAA AAT AAC TCG TCG GGA 2868 Tyr Ile Glu Arg Lys Asn Gly Gly Gly Ala Lys Asn Asn Ser Ser Gly 565 570 575 GCA GGA AAT AGC AAA GAT TGG GGC GGG AAC GGG CAT GGA AAT CAC CGA 2916 Ala Gly Asn Ser Lys Asp Trp Gly Gly Asn Gly His Gly Asn His Arg 580 585 590 595 AAT AAT GCC TCC GAC CTG AAT AAA CCG GAC GGA AAT AAT GGG AAT AAC 2964 Asn Asn Ala Ser Asp Leu Asn Lys Pro Asp Gly Asn Asn Gly Asn Asn 600 605 610 CAA AAT AAC GGA AGC AAT CAA GAT AAT CAT AGC GAT GTG AAT GCG CCA 3012 Gln Asn Asn Gly Ser Asn Gln Asp Asn His Ser Asp Val Asn Ala Pro 615 620 625 AAT AAC CCG GGA CGT AAC TAT GAT ATT TAC GAT CCT TTA GCT TTA GAT 3060 Asn Asn Pro Gly Arg Asn Tyr Asp Ile Tyr Asp Pro Leu Ala Leu Asp 630 635 640 TTA GAT GGA GAT GGG CTT GAA ACC GTG TCG ATG AAC GGG CGA CAA GGC 3108 Leu Asp Gly Asp Gly Leu Glu Thr Val Ser Met Asn Gly Arg Gln Gly 645 650 655 GCG TTA TTC GAT CAT GAA GGA AAA GGT ATT CGT ACC GCA ACG GGC TGG 3156 Ala Leu Phe Asp His Glu Gly Lys Gly Ile Arg Thr Ala Thr Gly Trp 660 665 670 675 CTC GCT GCG GAT GAC GGT TTT TTA GTG TTA GAT CGT AAC CAA GAC GGC 3204 Leu Ala Ala Asp Asp Gly Phe Leu Val Leu Asp Arg Asn Gln Asp Gly 680 685 690 ATT ATT AAT GAT ATA AGC GAG TTA TTT AGT AAT AAA AAT CAA CTT TCC 3252 Ile Ile Asn Asp Ile Ser Glu Leu Phe Ser Asn Lys Asn Gln Leu Ser 695 700 705 GAC GGC AGT ATT TCT GCA CAC GGT TTT GCG ACA TTA GCC GAT TTG GAT 3300 Asp Gly Ser Ile Ser Ala His Gly Phe Ala Thr Leu Ala Asp Leu Asp 710 715 720 ACA AAC CAA GAT CAG CGT ATC GAC CAA AAT GAT AAG CTG TTT TCT AAA 3348 Thr Asn Gln Asp Gln Arg Ile Asp Gln Asn Asp Lys Leu Phe Ser Lys 725 730 735 CTC CAA ATT TGG CGG GAT TTA AAT CAA AAC GGT TTT AGT GAA GCG AAT 3396 Leu Gln Ile Trp Arg Asp Leu Asn Gln Ass Gly Phe Ser Glu Ala Asn 740 745 750 755 GAG CTG TTT AGC TTA GAA AGT TTG AAT ATT AAA TCT TTA CAT ACC GCC 3444 Glu Leu Phe Ser Leu Glu Ser Leu Asn Ile Lys Ser Leu His Thr Ala 760 765 770 TAT GAA GAG CGT AAT GAT TTT CTA GCG GGC AAT AAT ATC CTT GCT CAG 3492 Tyr Glu Glu Arg Asn Asp Phe Leu Ala Gly Asn Asn Ile Leu Ala Gln 775 780 785 CTT GGG AAG TAT GAA AAA ACG GAC GGT ACT TTT GCA CAA ATG GGC GAT 3540 Leu Gly Lys Tyr Glu Lys Thr Asp Gly Thr Phe Ala Gln Met Gly Asp 790 795 800 TTA AAT TTC AGT TTT AAC CCG TTT TAT AGC CGA TTT ACC GAA GCG TTA 3588 Leu Asn Phe Ser Phe Asn Pro Phe Tyr Ser Arg Phe Thr Glu Ala Leu 805 810 815 AAT TTA ACC GAG CAA CAA CGT CGC ACA ATT AAT CTA ACC GGC ACC GGT 3636 Asn Leu Thr Glu Gln Gln Arg Arg Thr Ile Asn Leu Thr Gly Thr Gly 820 825 830 835 CGG GTT CGG GAT TTG CGT GAA GCC GCC GCA CTT TCT GAG GAG TTG GCT 3684 Arg Val Arg Asp Leu Arg Glu Ala Ala Ala Leu Ser Glu Glu Leu Ala 840 845 850 GCT TTA TTA CAA CAG TAC ACT AAG GCC TCC GAT TTT CAG GCA CAA CGA 3732 Ala Leu Leu Gln Gln Tyr Thr Lys Ala Ser Asp Phe Gln Ala Gln Arg 855 860 865 GAA TTA TTG CCT GCC ATT TTA GAT AAA TGG GCG GCA ACG GAT TTA CAG 3780 Glu Leu Leu Pro Ala Ile Leu Asp Lys Trp Ala Ala Thr Asp Leu Gln 870 875 880 TAT CAA CAT TAT GAT AAA ACA TTA CTT AAA ACG GTA GAA AGT ACC GAT 3828 Tyr Gln His Tyr Asp Lys Thr Leu Leu Lys Thr Val Glu Ser Thr Asp 885 890 895 AGT AGT GCT TCT GTC GTT AGA GTC ACG CCT TCT CAA TTA AGT AGT ATA 3876 Ser Ser Ala Ser Val Val Arg Val Thr Pro Ser Gln Leu Ser Ser Ile 900 905 910 915 CGC AAT GCA AAG CAT GAT CCT ACC GTT ATG CAA AAC TTT GAA CAG AGT 3924 Arg Asn Ala Lys His Asp Pro Thr Val Met Gln Asn Phe Glu Gln Ser 920 925 930 AAG GCA AAA ATT GCG ACT TTA AAT TCG CTC TAC GGG TTA AAT ATC GAT 3972 Lys Ala Lys Ile Ala Thr Leu Asn Ser Leu Tyr Gly Leu Asn Ile Asp 935 940 945 CAA CTT TAT TAC ACG ACG GAT AAA GAC ATT CGC TAT ATT ACT GAT AAA 4020 Gln Leu Tyr Tyr Thr Thr Asp Lys Asp Ile Arg Tyr Ile Thr Asp Lys 950 955 960 GTG AAT AAT ATG TAT CAA ACA ACC GTA GAA CTT GCC TAC CGT TCT TTA 4068 Val Asn Asn Met Tyr Gln Thr Thr Val Glu Leu Ala Tyr Arg Ser Leu 965 970 975 CTT TTA CAA ACG CGT TTG AAG AAA TAT GTT TAT AGC GTT AAT GCG AAA 4116 Leu Leu Gln Thr Arg Leu Lys Lys Tyr Val Tyr Ser Val Asn Ala Lys 980 985 990 995 CAA TTC GAA GGG AAA TGG GTA ACC GAT TAT TCT CGT ACT GAA GCC TTA 4164 Gln Phe Glu Gly Lys Trp Val Thr Asp Tyr Ser Arg Thr Glu Ala Leu 1000 1005 1010 TTT AAC TCT ACT TTT AAA CAA TCG CCT GAA AAT GCA TTA TAT GAT TTA 4212 Phe Asn Ser Thr Phe Lys Gln Ser Pro Glu Asn Ala Leu Tyr Asp Leu 1015 1020 1025 AGC GAA TAC CTT TCT TTC TTT AAC GAT CCT ACG GAA TGG AAA GAA GGG 4260 Ser Glu Tyr Leu Ser Phe Phe Asn Asp Pro Thr Glu Trp Lys Glu Gly 1030 1035 1040 CTA TTA CTG TTA AGC CGT TAT ATA GAT TAT GCT AAA GCA CAA GGA TTT 4308 Leu Leu Leu Leu Ser Arg Tyr Ile Asp Tyr Ala Lys Ala Gln Gly Phe 1045 1050 1055 TAT GAA AAC TGG GCG GCT ACT TCT AAC TTA ACT ATT GCC CGT TTA AGA 4356 Tyr Glu Asn Trp Ala Ala Thr Ser Asn Leu Thr Ile Ala Arg Leu Arg 1060 1065 1070 1075 GAG GCT GGA GTA ATT TTT GCA GAA TCG ACG GAT TTA AAA GGC GAT GAA 4404 Glu Ala Gly Val Ile Phe Ala Glu Ser Thr Asp Leu Lys Gly Asp Glu 1080 1085 1090 AAA AAT AAT ATT TTG TTA GGT AGC CAA AAA GAT AAT AAC TTA TCG GGT 4452 Lys Asn Asn Ile Leu Leu Gly Ser Gln Lys Asp Asn Asn Leu Ser Gly 1095 1100 1105 AGT GCA GGT GAT GAT CTA CTT ATC GGC GGA GAG GGT AAT GAT ACG TTA 4500 Ser Ala Gly Asp Asp Leu Leu Ile Gly Gly Glu Gly Asn Asp Thr Leu 1110 1115 1120 AAA GGC AGC TAC GGT GCA GAC ACC TAT ATC TTT AGC AAA GGA CAC GGA 4548 Lys Gly Ser Tyr Gly Ala Asp Thr Tyr Ile Phe Ser Lys Gly His Gly 1125 1130 1135 CAG GAT ATC GTT TAT GAA GAT ACC AAT AAT GAT AAC CGC GCA AGA GAT 4596 Gln Asp Ile Val Tyr Glu Asp Thr Asn Asn Asp Asn Arg Ala Arg Asp 1140 1145 1150 1155 ATC GAC ACC TTA AAA TTT ACC GAT GTG AAT TAT GCG GAA GTG AAG TTT 4644 Ile Asp Thr Leu Lys Phe Thr Asp Val Asn Tyr Ala Glu Val Lys Phe 1160 1165 1170 CGA CGA GTA GAT AAT GAC TTA ATG TTA TTC GGT TAT CAT GAT ACG GAT 4692 Arg Arg Val Asp Asn Asp Leu Met Leu Phe Gly Tyr His Asp Thr Asp 1175 1180 1185 TCG GTC ACG GTA AAA TCC TTC TAC AGC CAT GTA GAT TAT CAA TTT GAC 4740 Ser Val Thr Val Lys Ser Phe Tyr Ser His Val Asp Tyr Gln Phe Asp 1190 1195 1200 AAA TTG GAG TTT GCT GAC CGC AGT ATA ACT CGC GAT GAA CTG ATT AAA 4788 Lys Leu Glu Phe Ala Asp Arg Ser Ile Thr Arg Asp Glu Leu Ile Lys 1205 1210 1215 GCA GGG CTT CAT CTA TAC GGC ACC GAT GGC AAT GAT GAT ATA AAG GAT 4836 Ala Gly Leu His Leu Tyr Gly Thr Asp Gly Asn Asp Asp Ile Lys Asp 1220 1225 1230 1235 CAT GCG GAT TGG GAC AGC ATT TTG GAA GGC GGC AAA GGC AAC GAT ATT 4884 His Ala Asp Trp Asp Ser Ile Leu Glu Gly Gly Lys Gly Asn Asp Ile 1240 1245 1250 CTA AGA GGT GGC TAC GGT GCG GAC ACC TAT ATC TTT AGC AAA GGA CAC 4932 Leu Arg Gly Gly Tyr Gly Ala Asp Thr Tyr Ile Phe Ser Lys Gly His 1255 1260 1265 GGA CAG GAT ATC GTT TAT GAA GAT ACC AAT AAT GAT AAC CGC GCA AGA 4980 Gly Gln Asp Ile Val Tyr Glu Asp Thr Asn Asn Asp Asn Arg Ala Arg 1270 1275 1280 GAT ATC GAC ACC TTA AAA TTT ACT GAT GTG AAT TAT GCG GAA GTG AAA 5028 Asp Ile Asp Thr Leu Lys Phe Thr Asp Val Asn Tyr Ala Glu Val Lys 1285 1290 1295 TTC CGA CGA GTA GAT AAT GAC TTA ATG TTA TTC GGT TAT CAT GAT ACG 5076 Phe Arg Arg Val Asp Asn Asp Leu Met Leu Phe Gly Tyr His Asp Thr 1300 1305 1310 1315 GAT TCG GTC ACG ATA AAA TCC TTC TAC AAC CAT GTA GAT TAT CAA TTT 5124 Asp Ser Val Thr Ile Lys Ser Phe Tyr Asn His Val Asp Tyr Gln Phe 1320 1325 1330 GAC AAA TTG GAA TTT GCT GAC CGC AGT ATA ACT CGT GAT GAA CTA GGT 5172 Asp Lys Leu Glu Phe Ala Asp Arg Ser Ile Thr Arg Asp Glu Leu Gly 1335 1340 1345 AAA CAA GGT ATG GCA TTA TTT GGC ACT GAC GGT GAT GAT AAT ATC AAC 5220 Lys Gln Gly Met Ala Leu Phe Gly Thr Asp Gly Asp Asp Asn Ile Asn 1350 1355 1360 GAC TGG GGA CGT AAC TCG GTG ATT GAT GCC GGT GCG GGT AAT GAT ACG 5268 Asp Trp Gly Arg Asn Ser Val Ile Asp Ala Gly Ala Gly Asn Asp Thr 1365 1370 1375 GTT AAT GGC GGT AAT GGC GAT GAC ACC CTC ATC GGC GGC AAA GGT AAT 5316 Val Asn Gly Gly Asn Gly Asp Asp Thr Leu Ile Gly Gly Lys Gly Asn 1380 1385 1390 1395 GAT ATT CTA AGA GGT GGC TAC GGT GCG GAC ACC TAT ATC TTT AGC AAA 5364 Asp Ile Leu Arg Gly Gly Tyr Gly Ala Asp Thr Tyr Ile Phe Ser Lys 1400 1405 1410 GGA CAC GGA CAG GAT ATC GTT TAT GAA GAT ACC AAT AAT GAT AAC CGC 5412 Gly His Gly Gln Asp Ile Val Tyr Glu Asp Thr Asn Asn Asp Asn Arg 1415 1420 1425 GCA AGA GAT ATC GAC ACC TTA AAA TTT ACC GAT GTG AAT TAT GCG GAA 5460 Ala Arg Asp Ile Asp Thr Leu Lys Phe Thr Asp Val Asn Tyr Ala Glu 1430 1435 1440 GTG AAA TTC CGA CGA GTA GAT AAT GAC TTA ATG TTA TTC GGT TAT CAT 5508 Val Lys Phe Arg Arg Val Asp Asn Asp Leu Met Leu Phe Gly Tyr His 1445 1450 1455 GAT ACG GAT TCG GTC ACG GTA AAA TCC TTC TAC AGC CAT GTA GAT TAT 5556 Asp Thr Asp Ser Val Thr Val Lys Ser Phe Tyr Ser His Val Asp Tyr 1460 1465 1470 1475 CAA TTT GAC AAA TTG GAG TTT GCT GAC CGC AGT ATA ACT CGC GAT GAA 5604 Gln Phe Asp Lys Leu Glu Phe Ala Asp Arg Ser Ile Thr Arg Asp Glu 1480 1485 1490 CTG ATT AAA GCA GGG CTT CAT CTA TAC GGC ACC GAT GGC AAT GAT GAT 5652 Leu Ile Lys Ala Gly Leu His Leu Tyr Gly Thr Asp Gly Asn Asp Asp 1495 1500 1505 ATA AAG GAT CAT GCG GAT TGG GAC AGC ATT TTG GAA GGC GGC AAA GGC 5700 Ile Lys Asp His Ala Asp Trp Asp Ser Ile Leu Glu Gly Gly Lys Gly 1510 1515 1520 AAC GAT ATT CTA AGA GGT GGC TAC GGT GCG GAC ACC TAT ATC TTT AGC 5748 Asn Asp Ile Leu Arg Gly Gly Tyr Gly Ala Asp Thr Tyr Ile Phe Ser 1525 1530 1535 AAA GGA CAC GGA CAG GAT ATC GTT TAT GAA GAT ACC AAT AAT GAT AAC 5796 Lys Gly His Gly Gln Asp Ile Val Tyr Glu Asp Thr Asn Asn Asp Asn 1540 1545 1550 1555 CGA GCA AGA GAT ATC GAC ACC TTA AAA TTT ACT GAT GTG AAT TAT GCG 5844 Arg Ala Arg Asp Ile Asp Thr Leu Lys Phe Thr Asp Val Asn Tyr Ala 1560 1565 1570 GAA GTG AAA TTC CGA CGA GTA GAT AAT GAC TTA ATG TTA TTC GGT TAT 5892 Glu Val Lys Phe Arg Arg Val Asp Asn Asp Leu Met Leu Phe Gly Tyr 1575 1580 1585 CAT GAT ACG GAT TCG GTC ACG ATA AAA TCC TTC TAC AAC CAT GTA GAT 5940 His Asp Thr Asp Ser Val Thr Ile Lys Ser Phe Tyr Asn His Val Asp 1590 1595 1600 TAT CAA TTT GAC AAA TTG GAA TTT GCT GAC CGC AGT ATA ACT CGT GAT 5988 Tyr Gln Phe Asp Lys Leu Glu Phe Ala Asp Arg Ser Ile Thr Arg Asp 1605 1610 1615 GAA CTA GGT AAA CAA GGT ATG GCA TTA TTT GGC ACT GAC GGT GAT GAT 6036 Glu Leu Gly Lys Gln Gly Met Ala Leu Phe Gly Thr Asp Gly Asp Asp 1620 1625 1630 1635 AAT ATC AAC GAC TGG GGA CGT AAC TCG GTG ATT GAT GCC GGT GCG GGT 6084 Asn Ile Asn Asp Trp Gly Arg Asn Ser Val Ile Asp Ala Gly Ala Gly 1640 1645 1650 AAT GAT ACG GTT AAT GGC GGT AAT GGC GAT GAC ACC CTC ATC GGC GGC 6132 Asn Asp Thr Val Asn Gly Gly Asn Gly Asp Asp Thr Leu Ile Gly Gly 1655 1660 1665 AAA GGT AAT GAT ATT CTA AGA GGT GGC TAC GGT GCG GAC ACC TAT ATC 6180 Lys Gly Asn Asp Ile Leu Arg Gly Gly Tyr Gly Ala Asp Thr Tyr Ile 1670 1675 1680 TTT AGC AAA GGA CAC GGA CAG GAT ATC GTT TAT GAA GAT ACC AAT AAT 6228 Phe Ser Lys Gly His Gly Gln Asp Ile Val Tyr Glu Asp Thr Asn Asn 1685 1690 1695 GAT AAC CGC GCA AGA GAT ATC GAC ACC TTA AAA TTT ACT GAT ATT AAT 6276 Asp Asn Arg Ala Arg Asp Ile Asp Thr Leu Lys Phe Thr Asp Ile Asn 1700 1705 1710 1715 TTA TCC GAA CTT TGG TTT AGC CGA GAA AAT AAC GAT TTG ATT ATT AAA 6324 Leu Ser Glu Leu Trp Phe Ser Arg Glu Asn Asn Asp Leu Ile Ile Lys 1720 1725 1730 TCA TTA TTA AGT GAG GAT AAA GTC ACG GTT CAA AAT TGG TAT TCA CAC 6372 Ser Leu Leu Ser Glu Asp Lys Val Thr Val Gln Asn Trp Tyr Ser His 1735 1740 1745 CAA GAT CAT AAA ATA GAA AAT ATT CGT TTA TCG AAT GAG CAA ACG TTG 6420 Gln Asp His Lys Ile Glu Asn Ile Arg Leu Ser Asn Glu Gln Thr Leu 1750 1755 1760 GTG AGC ACT CAG GTG GAG AAG ATG GTT GAG TCG ATG GCC GGC TTT GCT 6468 Val Ser Thr Gln Val Glu Lys Met Val Glu Ser Met Ala Gly Phe Ala 1765 1770 1775 CAG AAG CAC GGA GGA GAG ATA TCT CTT GTG TCG CTT GAA GAG GTA AAA 6516 Gln Lys His Gly Gly Glu Ile Ser Leu Val Ser Leu Glu Glu Val Lys 1780 1785 1790 1795 CAA TAT ATC AAT AGC TTA ACA GCT GCT TTA TAA CATACGAAAG AAATCGGCAC 6569 Gln Tyr Ile Asn Ser Leu Thr Ala Ala Leu * 1800 1805 AGTTTTTTTG AACTGTGCCG ATTTGATTTT AGTGTAAGAA TATAGCCTGA TTTTAAGAAA 6629 TTTACTCTTG GCTAATAACT ATTTCCCATT TTATAAGTTA TTGACGGATG GTTTTATCAA 6689 ATATGAGATC AAATCTTATT TTAAATTCGC TTTCCATTAA GCGATAT 6736 (2)SEQ ID NO:6信息: (i)序列特征: (A)长度:151个氨基酸 (B)类型:氨基酸 (D)拓扑学:线性 (ii)分子类型:蛋白 (xi)序列描述:SEQ ID NO:6: Ile Asp Met Pro Pro Gly Thr Gly Asp Ile Gln Leu Thr Leu Ser Gln 1 5 10 15 Gln Ile Pro Val Thr Gly Ala Val Val Val Thr Thr Pro Gln Asp Ile 20 25 30 Ala Leu Leu Asp Ala Val Lys Gly Ile Ser Met Phe Gln Lys Val Ser 35 40 45 Val Pro Val Leu Gly Ile Ile Glu Asn Met Ser Val His Ile Cys Gln 50 55 60 Asn Cys Gly His His Glu Asp Ile Phe Gly Thr Gly Gly Ala Glu Lys 65 70 75 80 Val Ala Lys Lys Tyr Gly Thr Lys Val Leu Gly Gln Met Pro Leu His 85 90 95 Ile Arg Leu Arg Gln Asp Leu Asp Ala Gly Thr Pro Thr Val Val Ala 100 105 110 Ala Pro Glu His Glu Thr Ser Arg Ala Tyr Ile Glu Leu Ala Ala Lys 115 120 125 Val Ala Ser Glu Leu Tyr Trp Gln Gly Ser Val Ile Pro Ser Glu Ile 130 135 140 Met Ile Arg Glu Val Lys * 145 150 (2)SEQ ID NO:7信息: (i)序列特征: (A)长度:1806个氨基酸 (B)类型:氨基酸 (D)拓扑学:线性 (ii)分子类型:蛋白 (xi)序列描述:SEQ ID NO:7: Met Thr Lys Leu Thr Met Gln Asp Val Thr Asn Leu Tyr Leu Tyr Lys 1 5 10 15 Thr Lys Thr Leu Pro Lys Asp Arg Leu Asp Asp Ser Leu Ile Ser Glu 20 25 30 Ile Gly Lys Gly Asp Asp Asp Ile Asp Arg Lys Glu Phe Met Val Gly 35 40 45 Pro Gly Arg Phe Val Thr Ala Asp Asn Phe Ser Val Val Arg Asp Phe 50 55 60 Phe Asn Ala Gly Lys Ser Arg Ile Ile Ala Pro Gln Val Pro Pro Ile 65 70 75 80 Arg Ser Gln Gln Glu Lys Ile Leu Val Gly Leu Lys Pro Gly Lys Tyr 85 90 95 Ser Lys Ala Gln Ile Leu Glu Met Leu Gly Tyr Thr Lys Gly Gly Glu 100 105 110 Val Val Asn Gly Met Phe Ala Gly Glu Val Gln Thr Leu Gly Phe Tyr 115 120 125 Asp Asp Gly Lys Gly Asp Leu Leu Glu Arg Ala Tyr Ile Trp Asn Thr 130 135 140 Thr Gly Phe Lys Met Ser Asp Asn Ala Phe Phe Val Ile Glu Glu Ser 145 150 155 160 Gly Lys Arg Tyr Ile Glu Asn Phe Gly Ile Glu Pro Leu Gly Lys Gln 165 170 175 Glu Asp Phe Asp Phe Val Gly Gly Phe Trp Ser Asn Leu Val Asn Arg 180 185 190 Gly Leu Glu Ser Ile Ile Asp Pro Ser Gly Ile Gly Gly Thr Val Asn 195 200 205 Leu Asn Phe Thr Gly Glu Val Glu Thr Tyr Thr Leu Asp Glu Thr Arg 210 215 220 Phe Lys Ala Glu Ala Ala Lys Lys Ser His Trp Ser Leu Val Asn Ala 225 230 235 240 Ala Lys Val Tyr Gly Gly Leu Asp Gln Ile Ile Lys Lys Leu Trp Asp 245 250 255 Ser Gly Ser Ile Lys His Leu Tyr Gln Asp Lys Asp Thr Gly Lys Leu 260 265 270 Lys Pro Ile Ile Tyr Gly Thr Ala Gly Asn Asp Ser Lys Ile Glu Gly 275 280 285 Thr Lys Ile Thr Arg Arg Ile Ala Gly Lys Glu Val Thr Leu Asp Ile 290 295 300 Ala Asn Gln Lys Ile Glu Lys Gly Val Leu Glu Lys Leu Gly Leu Ser 305 310 315 320 Val Ser Gly Ser Asp Ile Ile Lys Leu Leu Phe Gly Ala Leu Thr Pro 325 330 335 Thr Leu Asn Arg Met Leu Leu Ser Gln Leu Ile Gln Ser Phe Ser Asp 340 345 350 Ser Leu Ala Lys Leu Asp Asn Pro Leu Ala Pro Tyr Thr Lys Asn Gly 355 360 365 Val Val Tyr Val Thr Gly Lys Gly Asn Asp Val Leu Lys Gly Thr Glu 370 375 380 His Glu Asp Leu Phe Leu Gly Gly Glu Gly Asn Asp Thr Tyr Tyr Ala 385 390 395 400 Arg Val Gly Asp Thr Ile Glu Asp Ala Asp Gly Lys Gly Lys Val Tyr 405 410 415 Phe Val Arg Glu Lys Gly Val Pro Lys Ala Asp Pro Lys Arg Val Glu 420 425 430 Phe Ser Glu Tyr Ile Thr Lys Glu Glu Ile Lys Glu Val Glu Lys Gly 435 440 445 Leu Leu Thr Tyr Ala Val Leu Glu Asn Tyr Asn Trp Glu Glu Lys Thr 450 455 460 Ala Thr Phe Ala His Ala Thr Met Leu Asn Glu Leu Phe Thr Asp Tyr 465 470 475 480 Thr Asn Tyr Arg Tyr Glu Val Lys Gly Leu Lys Leu Pro Ala Val Lys 485 490 495 Lys Leu Lys Ser Pro Leu Val Glu Phe Thr Ala Asp Leu Leu Thr Val 500 505 510 Thr Pro Ile Asp Glu Asn Gly Lys Ala Leu Ser Glu Lys Ser Ile Thr 515 520 525 Val Lys Asn Phe Lys Asn Gly Asp Leu Gly Ile Arg Leu Leu Asp Pro 530 535 540 Asn Ser Tyr Tyr Tyr Phe Leu Glu Gly Gln Asp Thr Gly Phe Tyr Gly 545 550 555 560 Pro Ala Phe Tyr Ile Glu Arg Lys Asn Gly Gly Gly Ala Lys Asn Asn 565 570 575 Ser Ser Gly Ala Gly Asn Ser Lys Asp Trp Gly Gly Asn Gly His Gly 580 585 590 Asn His Arg Asn Asn Ala Ser Asp Leu Asn Lys Pro Asp Gly Asn Asn 595 600 605 Gly Asn Asn Gln Asn Asn Gly Ser Asn Gln Asp Asn His Ser Asp Val 610 615 620 Asn Ala Pro Asn Asn Pro Gly Arg Asn Tyr Asp Ile Tyr Asp Pro Leu 625 630 635 640 Ala Leu Asp Leu Asp Gly Asp Gly Leu Glu Thr Val Ser Met Asn Gly 645 650 655 Arg Gln Gly Ala Leu Phe Asp His Glu Gly Lys Gly Ile Arg Thr Ala 660 665 670 Thr Gly Trp Leu Ala Ala Asp Asp Gly Phe Leu Val Leu Asp Arg Asn 675 680 685 Gln Asp Gly Ile Ile Asn Asp Ile Ser Glu Leu Phe Ser Asn Lys Asn 690 695 700 Gln Leu Ser Asp Gly Ser Ile Ser Ala His Gly Phe Ala Thr Leu Ala 705 710 715 720 Asp Leu Asp Thr Asn Gln Asp Gln Arg Ile Asp Gln Asn Asp Lys Leu 725 730 735 Phe Ser Lys Leu Gln Ile Trp Arg Asp Leu Asn Gln Asn Gly Phe Ser 740 745 750 Glu Ala Asn Glu Leu Phe Ser Leu Glu Ser Leu Asn Ile Lys Ser Leu 755 760 765 His Thr Ala Tyr Glu Glu Arg Asn Asp Phe Leu Ala Gly Asn Asn Ile 770 775 780 Leu Ala Gln Leu Gly Lys Tyr Glu Lys Thr Asp Gly Thr Phe Ala Gln 785 790 795 800 Met Gly Asp Leu Asn Phe Ser Phe Asn Pro Phe Tyr Ser Arg Phe Thr 805 810 815 Glu Ala Leu Asn Leu Thr Glu Gln Gln Arg Arg Thr Ile Asn Leu Thr 820 825 830 Gly Thr Gly Arg Val Arg Asp Leu Arg Glu Ala Ala Ala Leu Ser Glu 835 840 845 Glu Leu Ala Ala Leu Leu Gln Gln Tyr Thr Lys Ala Ser Asp Phe Gln 850 855 860 Ala Gln Arg Glu Leu Leu Pro Ala Ile Leu Asp Lys Trp Ala Ala Thr 865 870 875 880 Asp Leu Gln Tyr Gln His Tyr Asp Lys Thr Leu Leu Lys Thr Val Glu 885 890 895 Ser Thr Asp Ser Ser Ala Ser Val Val Arg Val Thr Pro Ser Gln Leu 900 905 910 Ser Ser Ile Arg Asn Ala Lys His Asp Pro Thr Val Met Gln Asn Phe 915 920 925 Glu Gln Ser Lys Ala Lys Ile Ala Thr Leu Asn Ser Leu Tyr Gly Leu 930 935 940 Asn Ile Asp Gln Leu Tyr Tyr Thr Thr Asp Lys Asp Ile Arg Tyr Ile 945 950 955 960 Thr Asp Lys Val Asn Asn Met Tyr Gln Thr Thr Val Glu Leu Ala Tyr 965 970 975 Arg Ser Leu Leu Leu Gln Thr Arg Leu Lys Lys Tyr Val Tyr Ser Val 980 985 990 Asn Ala Lys Gln Phe Glu Gly Lys Trp Val Thr Asp Tyr Ser Arg Thr 995 1000 1005 Glu Ala Leu Phe Asn Ser Thr Phe Lys Gln Ser Pro Glu Asn Ala Leu 1010 1015 1020 Tyr Asp Leu Ser Glu Tyr Leu Ser Phe Phe Asn Asp Pro Thr Glu Trp 1025 1030 1035 1040 Lys Glu Gly Leu Leu Leu Leu Ser Arg Tyr Ile Asp Tyr Ala Lys Ala 1045 1050 1055 Gln Gly Phe Tyr Glu Asn Trp Ala Ala Thr Ser Asn Leu Thr Ile Ala 1060 1065 1070 Arg Leu Arg Glu Ala Gly Val Ile Phe Ala Glu Ser Thr Asp Leu Lys 1075 1080 1085 Gly Asp Glu Lys Asn Asn Ile Leu Leu Gly Ser Gln Lys Asp Asn Asn 1090 1095 1100 Leu Ser Gly Ser Ala Gly Asp Asp Leu Leu Ile Gly Gly Glu Gly Asn 1105 1110 1115 1120 Asp Thr Leu Lys Gly Ser Tyr Gly Ala Asp Thr Tyr Ile Phe Ser Lys 1125 1130 1135 Gly His Gly Gln Asp Ile Val Tyr Glu Asp Thr Asn Asn Asp Asn Arg 1140 1145 1150 Ala Arg Asp Ile Asp Thr Leu Lys Phe Thr Asp Val Asn Tyr Ala Glu 1155 1160 1165 Val Lys Phe Arg Arg Val Asp Asn Asp Leu Met Leu Phe Gly Tyr His 1170 1175 1180 Asp Thr Asp Ser Val Thr Val Lys Ser Phe Tyr Ser His Val Asp Tyr 1185 1190 1195 1200 Gln Phe Asp Lys Leu Glu Phe Ala Asp Arg Ser Ile Thr Arg Asp Glu 1205 1210 1215 Leu Ile Lys Ala Gly Leu His Leu Tyr Gly Thr Asp Gly Asn Asp Asp 1220 1225 1230 Ile Lys Asp His Ala Asp Trp Asp Ser Ile Leu Glu Gly Gly Lys Gly 1235 1240 1245 Asn Asp Ile Leu Arg Gly Gly Tyr Gly Ala Asp Thr Tyr Ile Phe Ser 1250 1255 1260 Lys Gly His Gly Gln Asp Ile Val Tyr Glu Asp Thr Asn Asn Asp Asn 1265 1270 1275 1280 Arg Ala Arg Asp Ile Asp Thr Leu Lys Phe Thr Asp Val Asn Tyr Ala 1285 1290 1295 Glu Val Lys Phe Arg Arg Val Asp Asn Asp Leu Met Leu Phe Gly Tyr 1300 1305 1310 His Asp Thr Asp Ser Val Thr Ile Lys Ser Phe Tyr Asn His Val Asp 1315 1320 1325 Tyr Gln Phe Asp Lys Leu Glu Phe Ala Asp Arg Ser Ile Thr Arg Asp 1330 1335 1340 Glu Leu Gly Lys Gln Gly Met Ala Leu Phe Gly Thr Asp Gly Asp Asp 1345 1350 1355 1360 Asn Ile Asn Asp Trp Gly Arg Asn Ser Val Ile Asp Ala Gly Ala Gly 1365 1370 1375 Asn Asp Thr Val Asn Gly Gly Asn Gly Asp Asp Thr Leu Ile Gly Gly 1380 1385 1390 Lys Gly Asn Asp Ile Leu Arg Gly Gly Tyr Gly Ala Asp Thr Tyr Ile 1395 1400 1405 Phe Ser Lys Gly His Gly Gln Asp Ile Val Tyr Glu Asp Thr Asn Asn 1410 1415 1420 Asp Asn Arg Ala Arg Asp Ile Asp Thr Leu Lys Phe Thr Asp Val Asn 1425 1430 1435 1440 Tyr Ala Glu Val Lys Phe g Arg Val Asp Asn Asp Leu Met Leu Phe 1445 1450 1455 Gly Tyr His Asp Thr Asp Ser Val Thr Val Lys Ser Phe Tyr Ser His 1460 1465 1470 Val Asp Tyr Gln Phe Asp Lys Leu Glu Phe Ala Asp Arg Ser Ile Thr 1475 1480 1485 Arg Asp Glu Leu Ile Lys Ala Gly Leu His Leu Tyr Gly Thr Asp Gly 1490 1495 1500 Asn Asp Asp Ile Lys Asp His Ala Asp Trp Asp Ser Ile Leu Glu Gly 1505 1510 1515 1520 Gly Lys Gly Asn Asp Ile Leu Arg Gly Gly Tyr Gly Ala Asp Thr Tyr 1525 1530 1535 Ile Phe Ser Lys Gly His Gly Gln Asp Ile Val Tyr Glu Asp Thr Asn 1540 1545 1550 Asn Asp Asn Arg Ala Arg Asp Ile Asp Thr Leu Lys Phe Thr Asp Val 1555 1560 1565 Asn Tyr Ala Glu Val Lys Phe Arg Arg Val Asp Asn Asp Leu Met Leu 1570 1575 1580 Phe Gly Tyr His Asp Thr Asp Ser Val Thr Ile Lys Ser Phe Tyr Asn 1585 1590 1595 1600 His Val Asp Tyr Gln Phe Asp Lys Leu Glu Phe Ala Asp Arg Ser Ile 1605 1610 1615 Thr Arg Asp Glu Leu Gly Lys Gln Gly Met Ala Leu Phe Gly Thr Asp 1620 1625 1630 Gly Asp Asp Asn Ile Asn Asp Trp Gly Arg Asn Ser Val Ile Asp Ala 1635 1640 1645 Gly Ala Gly Asn Asp Thr Val Asn Gly Gly Asn Gly Asp Asp Thr Leu 1650 1655 1660 Ile Gly Gly Lys Gly Asn Asp Ile Leu Arg Gly Gly Tyr Gly Ala Asp 1665 1670 1675 1680 Thr Tyr Ile Phe Ser Lys Gly His Gly Gln Asp Ile Val Tyr Glu Asp 1685 1690 1695 Thr Asn Asn Asp Asn Arg Ala Arg Asp Ile Asp Thr Leu Lys Phe Thr 1700 1705 1710 Asp Ile Asn Leu Ser Glu Leu Trp Phe Ser Arg Glu Asn Asn Asp Leu 1715 1720 1725 Ile Ile Lys Ser Leu Leu Ser Glu Asp Lys Val Thr Val Gln Asn Trp 1730 1735 1740 Tyr Ser His Gln Asp His Lys Ile Glu Asn Ile Arg Leu Ser Asn Glu 1745 1750 1755 1760 Gln Thr Leu Val Ser Thr Gln Val Glu Lys Met Val Glu Ser Met Ala 1765 1770 1775 Gly Phe Ala Gln Lys His Gly Gly Glu Ile Ser Leu Val Ser Leu Glu 1780 1785 1790 Glu Val Lys Gln Tyr Ile Asn Ser Leu Thr Ala Ala Leu * 1795 1800 1805 |