经过特异性灭活丁子香酚和阿魏酸分解代谢的基因构建制备取代酚的生产菌株

申请号 CN99812907.0 申请日 1999-10-20 公开(公告)号 CN1325444A 公开(公告)日 2001-12-05
申请人 哈尔曼及赖默股份有限公司; 发明人 J·拉本霍尔斯特; A·斯坦比歇尔; H·普里菲尔特; J·奥维尔哈格;
摘要 本 发明 涉及转化的和/或诱变的单或多细胞 生物 体,其特征在于,丁子香酚和/或阿魏酸代谢的酶被灭活,使得中间产物松柏 醛 ,松柏醇,阿魏酸,香草醛和/或香 草酸 被积累。
权利要求

1.转化的和/或诱变的单细胞或多细胞生物,其特征在于丁子香 酚和/或阿魏酸分解代谢的酶被灭活,使得中间产物松柏醇,松柏, 阿魏酸,香草醛和/或香草酸积累。
2.根据权利要求1的生物,其特征在于经过在相应的基因插入Ω 元件或导入缺失改变丁子香酚和/或阿魏酸分解代谢。
3.根据权利要求1或2的生物,其特征在于编码松柏醇脱氢酶, 松柏醛脱氢酶,阿魏酰-CoA合成酶,烯酰-CoA合酶-醛缩酶,β -硫解酶,香草醛脱氢酶或香草酸脱甲基酶的一个或多个基因被改 变和/或被灭活。
4.根据权利要求1-3之一的生物,其特征在于它是单细胞的, 优选微生物植物或动物细胞。
5.根据权利要求1-4之一的生物,其特征在于它是细菌,优选 假单胞菌属种类。
6.编码松柏醇脱氢酶,松柏醛脱氢酶,阿魏酰-CoA合成酶,烯 酰-CoA水合酶-醛缩酶,β-酮硫解酶,香草醛脱氢酶或香草酸脱甲基 酶,或两个或多个该酶的核苷酸序列被改变和/或被灭活的基因结 构。
7.具有图1a-1r所给序列的基因结构。
8.具有图2a-2r所给序列的基因结构。
9.含有至少一个根据权利要求6-8之一的基因结构的载体。
10.根据权利要求1-5之一的转化的生物,其特征在于它含有 至少一个根据权利要求9的载体。
11.根据权利要求1-5之一的生物,其特征在于它含有整合进 基因组中代替各完整基因的至少一个根据权利要求6-8之一的基因 结构。
12.有机化合物,特别是醇,醛和有机酸的生物技术制备方法, 其特征在于使用根据权利要求1-5或10-11之一的生物。
13.制备根据权利要求1-5之一的生物的方法,其特征在于借 助于本身已知的微生物学培养方法实现改变丁子香酚和/或阿魏酸分 解代谢。
14.制备根据权利要求1-5或10-11之一的生物的方法,其特 征在于借助于重组DNA方法实现改变丁子香酚和/或阿魏酸分解代 谢,和/或灭活相应的基因。
15.根据权利要求1-5或10-11之一的生物在制备松柏醇,松 柏醛,阿魏酸,香草醛和/或香草酸中的应用。
16.根据权利要求6-8之一的基因结构或根据权利要求9的载 体在制备转化的和/或诱变的生物中的应用。

说明书全文

发明涉及生产菌株的构建且涉及制备取代的甲苯酚,特别 是香草的方法。

DE-A4227076(制备取代的甲氧基苯酚的方法,及适用于该目 的的生物)描述了使用一种新的假单胞菌属种类制备取代的甲氧基 苯酚。在该文中起始材料是丁子香酚且产物是阿魏酸、香草酸、松柏 醇和松柏醛。

由Rosazza等撰写(阿魏酸:一种丰富的芳香族天然产物:J.Ind. Microbiol.15:457-471)的使用阿魏酸可能的生物转化的综述也于 1995年出版。

在EP-A0845532中描述了来自假单胞菌属种类的合成松柏醇, 松柏醛,阿魏酸,香草酸和香草醛的基因和酶。

英国Norwich郡食品研究所在WO97/35999中描述了将反式-阿 魏酸转化成反式-阿魏酰-SCoA酯并随后转化成香草醛的酶及裂解 该酯的基因。1998年,该专利的内容以科技文献的形式出版(Gasson 等,1998,阿魏酸代谢成香草醛。生物学化学杂志,273:4163-4170: Narbad和Gasson 1998。在新分离的荧光假单胞菌菌株中使用新的 CoA-依赖型途径经香草醛代谢阿魏酸。微生物学,144:1397-1405)。

DE-A-19532317描述了使用拟无枝酸菌属种类经发酵从阿 魏酸以高产量获得香草醛。

已知方法的缺点在于它们仅能获得极低产量的香草醛或者使用 相当昂贵的起始化合物。尽管最后提到的方法(DE-A19532317) 确实实现了高产量,但使用假单胞菌属种类HR199和拟无枝酸菌属种 类HR167将丁子香酚生物转化成香草醛需要进行2步发酵,因此导致 相当昂贵和费时。

因此本发明的目的是构建能以一步方法相当廉价地将原材料丁 子香酚转化成香草醛的生物。

借助于构建单细胞的生产菌株或多细胞的生物实现该目的,该菌 株的特征在于丁子香酚和/或阿魏酸分解代谢的酶被灭活使得积累中 间产物松柏醇,松柏醛,阿魏酸,香草醛和/或香草酸。

该生产菌株可以是单细胞或多细胞。因此,本发明涉及微生物, 植物或动物。而且也可使用从生产品种获得的提取物。根据本发明, 优选使用单细胞生物。这些所述的生物可以是微生物或动物或植物细 胞。根据本发明,特别优选使用真菌和细菌。最优选的是细菌种类。 在其丁子香酚和/或阿魏酸分解代谢被改变后特别可使用的细菌是红 球菌属,假单胞菌属和埃希氏杆菌属的种类。

在最简单的情况下,已知的常规微生物学方法可用于分离根据本 发明使用的生物。

因此,可使用酶抑制剂改变丁子香酚和/或阿魏酸分解代谢中涉 及的蛋白质的酶活性。而且,经过突变编码这些蛋白质的基因可改变 丁子香酚和/或阿魏酸分解代谢中涉及的蛋白质的酶活性。该突变可 借助于传统方法以随机方式产生,例如经过使用紫外照射或诱导突变 的化学剂。

诸如缺失,插入和/或核苷酸交换的重组DNA方法同样适合于分 离新生物。因此,例如可使用其它的DNA元件(Ω元件)灭活该生物 的基因。合适的载体可用于以改变和/或灭活的基因结构取代完整基 因。在本文中,待灭活的基因,和用于灭活的DNA元件可借助于传统 克隆技术或借助于聚合酶链式反应(PCR)获得。

例如,在本发明的一个可能的实施方案中,可经过插入Ω元件或 导入缺失进入合适的基因中来改变丁子香酚分解代谢和阿魏酸分解 代谢。在本文中,可使用上述重组DNA方法灭活编码脱氢酶,合成酶, 合酶-醛缩酶,硫解酶或脱甲基酶的基因的功能以便阻断相关酶的 生产。优选的是,该基因是编码松柏醇脱氢酶,松柏醛脱氢酶,阿魏 酰CoA合成酶,烯酰CoA水合酶-醛缩酶,β-硫解酶,香草醛脱氢 酶或香草酸脱甲基酶的基因。非常特别优选的是编码在EP-A 0845532中限定的基酸序列的基因和/或编码其等位变异体的核苷 酸序列。

因此本发明还涉及制备转化生物和突变体的基因结构。

优选采用编码脱氢酶,合成酶,水合酶-醛缩酶,硫解酶或脱甲 基酶的核苷酸序列被灭活的基因结构来分离该生物和突变体。特别优 选的是编码松柏醇脱氢酶,松柏醛脱氢酶,阿魏酰CoA合成酶,烯酰 CoA水合酶-醛缩酶,β-酮硫解酶,香草醛脱氢酶或香草酸脱甲基酶 的核苷酸序列被灭活的基因结构。极其优选的基因结构表现为图1a 至1r给出的结构,具有图2a至2r所示的核苷酸序列和/或编码其等 位变异体的核苷酸序列。在本文中,特别优选的是核苷酸序列1至 18。

本发明还包含这些基因结构的部分序列及其功能等同物。功能等 同物的意思应理解为该DNA的衍生物,其中个别的核苷酸基被交换 (摆动交换(Wobbel austausche))而不改变其功能。在蛋白质水平 上也可交换氨基酸而不导致其功能改变。

在该基因结构的上游和/或下游可插入一个或多个DNA序列。经 过克隆该基因结构,可获得适用于转化和/或转染生物和/或适用于接 合转移进生物的质粒或载体。

本发明还涉及用于制备根据本发明转化的生物和突变体的质粒 和/或载体。因而这些生物和突变体含有所述的基因结构。因此本发 明还涉及含有所说质粒和/或载体的生物。

质粒和/或载体的性质取决于其应用的对象。例如,为了用以Ω元 件灭活的基因取代假单胞菌中丁子香酚和/或阿魏酸分解代谢的完整 基因,所需的载体一方面可转移进假单胞菌中(经接合可转移的质 粒),但另一方面不能在这些生物中复制,因此在假单胞菌中是不稳 定的(所谓的自杀质粒)。借助于该质粒系统转移进假单胞菌的DNA 片段只有当它们经同源重组整合进细菌细胞基因组中时才能保留。

所述的基因结构,载体和质粒可用于制备不同的转化生物或突变 体。所说的基因结构可用于以改变的和/或灭活的基因结构取代完整 的核酸序列。在这种可经转化或转染或接合获得的细胞中,用改变的 和/或灭活的基因结构经同源重组取代完整的基因,因此所得的细胞 最终在其基因组中仅具有改变的和/或灭活的基因结构。以这种方 式,根据本发明优选可改变和/或灭活基因,以便有关生物能产生松 柏醇,松柏醛,阿魏酸,香草醛和/或香草酸。

在DE-A4227076和EP-A0845532中详细描述的菌株假单胞菌 属种类HR199(DSM7063)的突变体是根据本发明以这种方式构建的 生产菌株的例子,其中相应的基因结构特别是来自图1a至1r与图2a 至2r:

1.假单胞菌属种类HR199calAΩKm,含有ΩKm-灭活的calA基 因代替编码松柏醇脱氢酶的完整calA基因(图1a;图2a)。

2.假单胞菌属种类HR199calAΩGm,含有ΩGm灭活的calA基因 代替编码松柏醇脱氢酶的完整calA基因(图1b;图2b)。

3.假单胞菌属种类HR199calAΔ,含有缺失灭活的calA基因代 替编码松柏醇脱氢酶的完整calA基因(图1c;图2c)。

4.假单胞菌属种类HR199calBΩKm,含有ΩKm灭活的calB基因 代替编码松柏醛脱氢酶的完整calB基因(图1d;图2d)。

5.假单胞菌属种类HR199calBΩGm,含有ΩGm-灭活的calB基 因代替编码松柏醛脱氢酶的完整calB基因(图1e;图2e)。

6.假单胞菌属种类HR199calBΔ,含有缺失灭活的calB基因代 替编码松柏醛脱氢酶的完整calB基因(图1f;图2f)。

7.假单胞菌属种类HR199fcsΩKm,含有ΩKm-灭活的fcs基因代 替编码阿魏酰CoA合成酶的完整fcs基因(图1g;图2g)。

8.假单胞菌属种类HR199fcsΩGm,含有ΩGm灭活的fcs基因代 替编码阿魏酰-CoA合成酶的完整fcs基因(图1h;图2h)。

9.假单胞菌属种类HR199fcsΔ,含有缺失灭活的fcs基因代替 编码阿魏酰CoA合成酶的完整fcs基因(图1i;图2i)。

10.假单胞菌属种类HR199echΩKm,含有ΩKm灭活的ech基因代 替编码烯酰-CoA水合酶-醛缩酶的完整ech基因(图1j;图2j)。

11.假单胞菌属种类HR199echΩGm,含有ΩGm灭活的ech基因代 替编码烯酰-CoA水合酶-醛缩酶的完整ech基因(图1k;图2k)。

12.假单胞菌属种类HR199echΔ,含有缺失灭活的ech基因代替 编码烯酰-CoA水合酶-醛缩酶的完整ech基因(图11;图21)。

13.假单胞菌属种类HR199aatΩKm,含有ΩKm-灭活的aat基因 代替编码β-酮硫解酶的完整aat基因(图1m,图2m)。

14.假单胞菌属种类HR199aatΩGm,含有ΩGm-灭活的aat基因 代替编码β-酮硫解酶的完整aat基因(图1n;图2n)。

15.假单胞菌属种类HR199aatΔ,含有缺失灭活的aat基因代替 编码β-酮硫解酶的完整aat基因(图10;20)。

16.假单胞菌属种类HR199vdhΩKm,含有ΩKm-灭活的vdh基因 代替编码香草醛脱氢酶的完整vdh基因(图1p;图2p)。

17.假单胞菌属种类HR199vdhΩGm,含有ΩGm-灭活的vdh基因 代替编码香草醛脱氢酶的完整vdh基因(图1q;图2q)。

18.假单胞菌属种类HR199vdhΔ,含有缺失灭活的vdh基因代替 编码香草醛脱氢酶的完整vdh基因(图1r;图2r)。

19.假单胞菌属种类HR199vdhBΩKm,含ΩKm灭活的vdhB基因代 替编码香草醛脱氢酶Ⅱ的完整vdhB基因。

20.假单胞菌属种类HR199vdhBΩGm,含有ΩGm-灭活的vdhB基 因代替编码香草醛脱氢酶Ⅱ的完整vdhB基因。

21.假单胞菌属种类HR199vdhBΔ,含有缺失灭活的vdhB基因代 替编码香草醛脱氢酶Ⅱ的完整vdhB基因。

22.假单胞菌属种类HR199adHΩKm,含有ΩKm灭活的adh基因代 替编码乙醇脱氢酶的完整adH基因。

23.假单胞菌属种类HR199adhΩGm,含有ΩGm-灭活的adh基因 代替编码乙醇脱氢酶的完整adh基因。

24.假单胞菌属种类HR199adhΔ,含有缺失灭活的adh基因代替 编码乙醇脱氢酶的完整adh基因。

25.假单胞菌属种类HR199vanAΩKm,含有ΩKm灭活的vanA基因 代替编码香草酸脱甲基酶α-亚基的完整vanA基因。

26.假单胞菌属种类HR199vanAΩGm,含有ΩGm-灭活的vanA基 因代替编码香草酸脱甲基酶α-亚基的完整vanA基因。

27.假单胞菌属种类HR199vanAΔ,含有缺失灭活的vanA基因代 替编码香草酸脱甲基酶α-亚基的完整vanA基因。

28.假单胞菌属种类HR199vanBΩKm,含有ΩKm灭活的vanB基因 代替编码香草酸脱甲基酶β-亚基的完整vanB基因。

29.假单胞菌属种类HR199vanBΩGm,含有ΩGm-灭活的vanB基 因代替编码香草酸脱甲基酶β-亚基的完整vanB基因。

30.假单胞菌属种类HR199vanBΔ,含有缺失灭活的vanB基因代 替编码香草酸脱甲基酶β-亚基的完整vanB基因。

本发明还涉及有机化合物的生物技术制备方法。特别是该方法可 用于制备醇,醛和有机酸。后者优选是松柏醇,松柏醛,阿魏酸,香 草醛和香草酸。

上述生物用于该新方法。特别优选的生物包括细菌,特别是假单 胞菌属种类。具体地说,上述假单胞菌属种类优选用于下面的方法:

1.假单胞菌属种类HR199calAΩkm,假单胞菌属种类 HR199calAΩGm和假单胞菌属种类HR199calAΔ用于从丁子香酚制备 松柏醇。

2.假单胞菌属种类HR199calBΩKm,假单胞菌属种类 HR199calBΩGm和假单胞菌属种类HR199calBΔ用于从丁子香酚或松 柏醇制备松柏醛。

3.假单胞菌属种类HR199fcsΩKm,假单胞菌属种类 HR199fcsΩGm,假单胞菌属种类HR199fcsΔ,假单胞菌属种类 HR199echΩKm,假单胞菌属种类HR199echΩGm和假单胞菌属种类 HR199echΔ用于从丁子香酚或松柏醇或松柏醛制备阿魏酸。

4.假单胞菌属种类HR199vdhΩKm,假单胞菌属种类 HR199vdhΩGm,假单胞菌属种类HR199vdhΔ,假单胞菌属种类 HR199vdhΩGmvdhBΩKm,假单胞菌属种类HR199vdhΩKmvdhBΩGm,假 单胞菌属种类HR199vdhΔvdhBΩGm和假单胞菌属种类 HR199vdKΔvdhBΩKm用于从丁子香酚或松柏醇或松柏醛或阿魏酸制备 香草醛。

5.假单胞菌属种类HR199vanAΩKm,假单胞菌属种类 HR199vanAΩGm,假单胞菌属种类HR199vanAΔ,假单胞菌属种类 HR199vanBΩKm,假单胞菌属种类HR199vanBΩGm和假单胞菌属种类 HR199vanBΔ用于从丁子香酚或松柏醇或松柏醛或阿魏酸或香草醛制 备香草酸。

丁子香酚是优选的底物。然而,巴可加入其它底物或甚至用其它 底物代替丁子香酚。

根据本发明采用的用于该生物的合适营养培养基是合成的,半合 成的或复合培养基。这些培养基可包括含和含氮化合物,无机盐、 其中包括合适的痕量元素和维生素。

合适的含碳化合物是碳水化合物,碳氢化合物或有机标准化学 剂。可优选使用的化合物的例子是糖,醇或糖醇,有机酸或复合物混 合物。

优选的糖是葡萄糖。可优选使用的有机酸是柠檬酸或乙酸。复合 混合物的例子是麦芽提取物,酵母提取物,酪蛋白或酪蛋白水解产 物。

无机化合物是合适的含氮物质。其例子有硝酸盐和铵盐。也可使 用有机氮源。这些氮源包括酵母提取物,大豆粉、酪蛋白,酪蛋白水 解物和玉米浆。

可使用的无机盐的例子是硫酸盐,硝酸盐,氯化物,碳酸盐和磷 酸盐。所说的盐所含的金属优选是钠,,镁,锰,,锌和

培养温度优选范围是50至100℃。特别优选的范围是从15至60 ℃,最优选22至37℃

培养基的pH优选是2至12。特别优选的范围是4至8。

原则上,技术人员已知的任何生物反应器均可用于实施该新方 法。优先考虑的是适于浸没方法的任何装置。这意味着根据本发明可 采用具有或不具有机械混合装置的容器。后者的例子是摇动装置,泡 罩塔反应器或循环式反应器。前者优选包括所有已知的装配有任何设 计的搅拌器的装置。

可连续或分批实施该新方法。达到最大产量所需的发酵时间取决 于所用生物的具体特性。然而,原则上,发酵时间在2至200小时之 间。

下面更详细地解释本发明,在提及的实施例中:

利用丁子香酚的菌株假单胞菌属种类HR199(DSM7063)的突变 体是借助于插入Ω元件或导入缺失经特异性灭活丁子香酚分解代谢的 基因以靶向方式产生的。采用的Ω元件是编码对抗生素卡那霉素 (ΩKm)和庆大霉素(ΩGm)产生抗性的DNA片段。这些抗性基因是 使用标准方法从Tn5和质粒pBBR 1MCS-5分离出的。编码松柏醇脱氢 酶,松柏醛脱氢酶,阿魏酰-CoA合成酶,烯酰-CoA水合酶-醛缩 酶,β-酮硫解酶,香草醛脱氢酶,乙醇脱氢酶,香草醛脱氢酶Ⅱ和 香草酸脱甲基酶的基因calA,calB,fcs,ech,aat,vdh,adh,vdhB, vanA和vanB使用标准方法从菌株假单胞菌属种类HR199的基因组 DNA分离出并克隆进pBluescript SK-。借助于用合适的限制性核酸 内切酶消化,可从这些基因中去除DNA片段(缺失)或用Ω元件取代 (插入),导致各基因失活。以这种方式突变的基因重新克隆进可接 合转移的载体中并随后导入菌株假单胞菌属种类HR199。使用合适的 选择获得用新导入的失活基因取代了各有功能的野生型基因的转接 合子(transkonju-ganten)。以这种方式获得的插入和缺失突变体现 在仅具有各失活的基因。使用这一方法可获得仅具有一种缺陷基因的 突变体以及用该方式灭活了几种基因的多重突变体。这些突变体可用 于进行下列生物转化:

a)将丁子香酚转化为松柏醇,松柏醛,阿魏酸,香草醛和/或香 草酸;

b)将松柏醇转化成松柏醛,阿魏酸,香草醛和/或香草酸;

c)将松柏醛转化成阿魏酸,香草醛和/或香草酸;

d)将阿魏酸转化成香草醛和/或香草酸,和

e)将香草醛转化成香草酸。

材料和方法

生长细菌的条件

大肠杆菌的菌株在37℃下在Luria-Bertani(LB)或M9无机培养 基中繁殖(J.Sambrook,E.F.Fritsch和T.Maniatis,1989。分子 克隆;实验室手册,第2版,冷泉港实验室出版,纽约冷泉港)。假 单胞菌属种类的菌株在营养肉汤(NB,0.8%,wt/vol)或无机培养 基(MM)(H.G.Schlegel等,1961,微生物学报38:209-222)或HR 无机培养基(HR-MM)(J.Rabenhorst,1996,应用微生物学及生物技 术,46:470-474)中30℃下繁殖。阿魏酸,香草醛,香草酸和原儿 荼酸溶于二甲基甲砜并加入到各培养基中以得到0.1%(wt/vol)的终 浓度。丁子香酚可直接加入到培养基中以得到0.1%(vol/vol)的终 浓度或加入到MM琼脂板盖的滤纸(圆形滤纸595,Schleicher & Schuell,Dassel,德国)上。繁殖假单胞菌属种类的转接合子和突 变体时,分别使用终浓度为25μg/ml,100μg/ml和7.5μg/ml的 四环素,卡那霉素和庆大霉素。

培养上清液中代谢中间产物的定性和定量检测。

用高压液相色谱(Knauer HPLC)直接或用双蒸水稀释后分析培 养上清液。在Nucleosil 100 C18(7μm,250×4mm)上进行色谱。 0.1%(vol/vol)甲酸和乙腈用作溶剂。用于洗脱物质的梯度过程如 下:

00:00-06:30→26%乙腈

06:30-08:00→100%乙腈

08:00-12:00→100%乙腈

12:00-13:00→26%乙腈

13:00-18:00→26%乙腈

香草醛脱氢酶Ⅱ的纯化。

在4℃下进行纯化。

粗制提取物

将在丁子香酚中繁殖的假单胞菌属种类HRl99细胞在10mM磷酸 钠缓冲液pH6.0中洗涤,然后重悬于相同缓冲液中并在1000psi的 压下通过弗氏压碎器(Amicon,silver Spring,美国里兰州)2 次破碎细胞。对细胞匀浆物进行超速离心(1h,100,000xg,4℃), 所得的粗提物的可溶性部分从上清液中获得。

在DEAE葡聚糖纤维素上进行阴离子交换色谱:

粗提物的可溶部分在10mM磷酸钠缓冲液,pH6.0中透析过夜。 将透析产物上样到用10mM磷酸钠缓冲液pH6.0平衡过的DEAE- Sephacel柱(2.6cm×35cm,柱容器[BV]:186ml)上,其流速为0.8ml/ 分。用2倍BV的10mM磷酸钠缓冲液pH6.0冲洗柱。香草醛脱氢酶 Ⅱ(VDHⅡ)用在10mM磷酸钠缓冲液pH6.0(750ml)中从0到400 mM NaCl的线性盐梯度洗脱。收集10ml馏份。合并具有高VDHⅡ 活性的馏份以形成DEAE合并液。

测定香草醛脱氢酶活性

使用光学酶试验在30℃下测定VDH活性。体积为1ml的反应混 合物含0.1mmol磷酸钾(pH7.1),0.125μmol香草醛,0.5μmol NAD, 1.2μmol丙酮酸(钠盐),乳酸脱氢酶(IU;来自猪心)和酶溶液。 在λ=340mm下监测香草醛的氧化(ε香草醛=11.6cm2/μmol)。酶活 性以单位(U)表示,1U相应于每分钟转变1μmol香草醛的酶的量。 使用Lowry等(O.H.Lowry.N.J.Rosebrough,A.L.Farr和 R.J.Randall.1951,生物学化学杂志,193:265-275)的方法测定 样品中的蛋白质浓度。

测定松柏醇脱氢酶活性

根据Jaeger等(E.L.Jaeger,Eggeling和H.Sahm,1981.普通 微生物学.6:333-336)使用光学酶试验在30℃下测定CADH活性。体 积为1ml的反应混合物含有0.2mmol tris/HCL(pH9.0),0.4μmol 松柏醇,2μmol NAD,0.1mmol氨基脲和酶溶液。在λ=340nm下 监测NAD的减少(ε=6.3cm2/μmol)。酶活性用单位(U)来表示,lU 相应于每分钟转化1μmol底物的酶量。按Lowry等(0.H.Lowry,N.J. Rosebrough,A.L.Far和R.J.Randall,1951,生物学化学杂志, 193:265-275)的方法测定样品中的蛋白质浓度。

测定松柏醛脱氢酶的活性

使用光学酶试验在30℃下测定CALDH活性。体积为1ml的反应混 合物含有0.1mmol的tris/HCL(pH8.8),0.08μmol的松柏醛,2.7 μmol的NAD和酶溶液。在λ=400nm下监测松柏醛氧化成阿魏酸(ε=34 cm2/μmol)。酶活性以单位(U)表示,1U相应于每分钟转变1μmol 底物的酶量。按Lowry等(O.H.Lowry,N.J.Rosebrough,A.L.Far 和Randall,1951,生物学化学杂志,193:265-275)的方法测定样品 中的蛋白质浓度。

测定阿魏酰CoA合成酶(阿魏酸硫激酶)活性。

使用Zenk等(Zenk等,1980,生物化学年鉴,101:182-187) 改良的光学酶试验在30℃下测定FCS活性。体积为1ml的反应混合 物含有0.09mmol的磷酸钾(pH7.0),2.1μmol的MgCl2,0.7μmol 的阿魏酸,2μmol的ATP,0.4μmol的辅酶A和酶溶液。在λ=345nm 下监测从阿魏酸形成CoA酯(ε=10cm2/μmol)。酶活性以单位(U) 表示,1U相应于每分钟转化1μmol底物的酶量。使用Lowry等 (O.H.Lowry,N.J.Rosebrough,A.L.Farr和R.J.Randall,1951, 生物学化学杂志,193:265-275)的方法测定样品中的蛋白质浓度。

电泳方法

使用Stegemann等(Stegemann等,1973,Z.Naturforsch. 28c:722-732)的方法在7.4%(wt/vol)聚丙烯酰胺凝胶中天然条件 下或者使用Laemmli(Laemmli,U.K.1970,自然(伦敦)227:680- 685)的方法在11.5%(wt/vol)聚丙烯酰胺凝胶中在变性条件下分离 含蛋白质的提取物。Serva Blue R用于非特异性蛋白质染色。为了 特异性染色松柏醇脱氢酶,松柏醛脱氢酶和香草醛脱氢酶,将凝胶在 100mM KP缓冲液(pH7.0)中重新缓冲20分钟并随后在加入了0.08 %(wt/vol)NAD,0.04%(wt/vol)对硝基蓝四唑氯,0.003%(wt/vol) 吩嗪硫酸甲酯和1mM的各底物的相同缓冲液中30℃下温育直到看见 相应的颜色带。

将蛋白质从聚丙烯酰胺凝胶上转移到PVDF膜上。

使用半干快速印迹器具(B32/33,Biometra,Gttingen,德国) 按照厂家说明将蛋白质从SDS-聚丙烯酰胺凝胶转移到PVDF膜 (Waters-Millipore,Bedford,Mass,USA)上。

测定N端氨基酸序列

使用蛋白质肽测序仪(477A型,应用生物系统,Foster City, USA)和PTH分析仪按照厂商说明测定N-端氨基酸序列。

分离和操作DNA

使用Marmur的方法(J.Marmur,1961,分子生物学杂志,3:208- 218)分离基因组DNA。使用标准方法(J.E.Sambrook,F.Fritsch 和T.Maniatis,1989,分子克隆:实验室手册,第2版,冷泉港实验 室出版,纽约冷泉港)分离和分析其它质粒DNA和/或DNA限制性片 段。

转移DNA

使用Hanahan的方法(D.Hanahan,1983,分子生物学杂志, 166:557-580)制备和转化感受态的大肠杆菌细胞。在含有质粒的大 肠杆菌S17-1菌株(供体)和假单胞菌属种类菌株(受体)之间的 接合质粒转移在NB琼脂板上按Friedrich等的方法(B.Friedrich 等,1981,细菌学杂志,147:198-205)进行或借助于“微量互补法” 在含0.5%(wt/vol)葡萄糖酸作碳源及25μg四环素/ml或100μg卡 那霉素/ml的MM琼脂平板上进行。在这种情况下,将受体细胞以一个 方向进行接种划线。5分钟后,将供体菌株的细胞进行接种划线,这 些划线与受体接种划线相交叉。在30℃培养48h后,转接合子直接位 于交叉点下方生长,而供体菌株和受体菌株都不能生长。

杂交实验

在0.8%(wt/vol)琼脂糖凝胶上在50mM tris-50mM酸-1.25 mM EDTA缓冲液(pH8.5)中电泳分离DNA限制性酶切片段 (J.E.Sambrook,F.Fritsch和T.Maniatis.1989,分子克隆:实验 室手册。第2版,冷泉港实验室出版,纽约冷泉港)。将变性的DNA 从凝胶转移到带正电的尼龙膜(孔经:0.45μm,Pall Filtrationstechnik,Dreieich,德国)上,随后与生物素标记的 或洋地黄毒苷标记的DNA探针的杂交,及这些DNA探针的制备均使用 标准方法进行(J.E.Sambrook,F.Fritsch和T.Maniatis,1989,分 子克隆:实验室手册,第2版,冷泉港实验室出版社,纽约冷泉港)。

DNA测序:

按Sanger等(Sanger等1977,美国科学院学报74:5463-5467) 的双脱氧链终止法使用“LI-COR”DNA测序仪400L型(LI-COR公 司,生物技术部,Lincdn,NE,USA)并使用“含7-脱氮-2-脱氧 苷三磷酸的热测序酶荧光标记的引物循环测序试剂盒”(Amersham 生命科学,Amersham International pls.,Little Chalfont, Buckinghamshire,英国)“非放射活性”测定核苷酸序列,在每种 情况按厂商说明书进行。

按Strauss等(E.C.Strauss等,1986,生物化学年鉴, 154:353-360)的“引物跳跃方法”使用合成寡核苷酸进行测序。

化学试剂,生化试剂和酶

从C.F.Boehringer & Shne(Mannheim,德国)或从 GIBCO/BRL(Eggenstein,德国)获得限制性酶,T4 DNA连接酶,λDNA 和酶及光学酶试验的底物。[γ-32P]ATP来自 Amersham/Buchler(Braunschweig,德国)。寡核苷酸从MWG- Btotech GmbH(Ebersberg,德国)获得。NA型琼脂糖从Pharmacia- LKB(Uppsala,Schweden)获得。所有其它的化学试剂来自Haarmann & Reimer(Holzminden,德国),E.Merch AG(Darmstadt,德国),Fluka Chemie(Buchs,瑞士),Serva Feinbiochemica(Heidelberg,德国) 或Sigma Chemie(Deisenhofen,德国)。

实施例

实施例1

构建介导卡那霉素(ΩKm)或庆大霉素(ΩGm)抗性的Ω元件

为丁构建ΩKm元件,以制备规模分离2099bp的转座子Tn5的 BglⅠ片段(E.A.Auerswald,G.Ludwig和H.Schaller.1981,Cold Spring Harb.Symp.Quant.Biol.45:107-113;E.Beck,G.Ludwig, E.A.Auerswald,B.Reiss和H.Schaller,1982,基因,19:327-336; P.Mazodier,P.Cossart,E.Giraud和F.Gasser,1985,核酸研究, 13:195-205)。经过用Bal 31核酸酶处理将片段缩短到大约990bp。 然后将这一仅含有卡那霉素抗性基因(编码氨基糖苷-3’-0-磷酸转移 酶)的片段连接到SmaⅠ切割的pSKsym DNA(含对称结构的多克隆位 点[SalⅠ,Hind Ⅲ,EcoRⅠ,SmaⅠ,EcoRⅠ,Hind Ⅲ,SalⅠ]的 pBluescript SK-衍生物)上。可作为SmaⅠ片段,EcoRⅠ片段,Hind Ⅲ片段或SalⅠ片段从所得的质粒中重新分离出ΩKm元件。

为了构建ΩGm元件,在制备规模上分离出质粒pBRIMCS-5的983 bp EaeⅠ片段(M.E.Kovach,P.H.Elzer,D.S.Hill,G.T.Robertson, M.A.Farris,R.M.Roop和K.M.Peterson,1995,基因166:175- 176),然后用绿豆核酸酶处理(逐渐消化单链DNA分子末端)。然 后将仅含庆大霉素抗性基因(编码庆大霉素-3-乙酰转移酶)的片 段连接到SmaⅠ-裂解的pSKsym DNA(见上文)上。可作为SmaⅠ片段, EcoRⅠ片段,HindⅢ片段或SalⅠ片段从所得质粒重新分离出ΩGm 元件。

实施例2

从假单胞菌属种类HRl99(DSM7063)克隆待插入Ω元件或缺失 灭活的基因。

单独从大肠杆菌S17-1菌株DSM10439和DSM10440克隆 fcs,ech,vdh和aat基因并使用质粒pE207和pE5-1(见EP-A- 0845532)。从这些质粒在制备规模上分离所述片段并按如下所述处 理:

为了克隆fcs基因,将来自质粒pE207的2350bp SalⅠ/EcoRⅠ 片段和来自质粒pE5-1的3700bp EcoRⅠ/SalⅠ片段一起在 pBluescript SK-中克隆使得2片段借助于EcoRⅠ端连接在一起。从 所得的杂种质粒在制备规模上分离6050bp SalⅠ片段并经过用Bal 31 核酸酶处理缩短到大约2480bp。PstⅠ连接子随后连接到该片段的末 端,用PstⅠ消化后,将该片段克隆进pBluescript SK-(pSKfcs)。 转化大肠杆菌XL1 blue后,所得的克隆表达fcs基因并表现出0.2 U/mg蛋白质的Fcs活性。

为了克隆ech基因,在制备规模上从质粒pE 207分离3800bp HindⅢ/EcoRⅠ片段并经过用Bal 31核酸酶处理缩短到大约1470 bp。然后,将EcoRⅠ连接子连接到该片段的末端,用EcoRⅠ消化后, 将该片段克隆进pBluescript SK-(pSkech)。

为了克隆vdh基因,在制备规模上从质粒pE207分离2350bp的 SalⅠ/EcoRⅠ片段。克隆进pBluescript SK-后,使用外切核酸酶Ⅲ/ 绿豆核酸酶系统将该片段在一端截短大约1530bp。然后将EcoRⅠ连 接子连接到该片段的末端,用EcoRⅠ消化后,将该片段克隆进 pBluescript SK-(pSKvdh)。转化大肠杆菌XL1 blue后,获得的克 隆表达VDH基因且表现出0.01U/mg蛋白质的VDH活性。

为了克隆aat基因,在制备规模上从质粒pE5-1分离3700bp EcoRⅠ/SalⅠ片段并经过用Bal 31核酸酶处理缩短到大约1590bp。然 然后将EcoRⅠ连接子连接到该片段的末端,用EcoRⅠ消化后,将该片 段克隆进pBluescript SK-(pSKaat)。

实施例3

经过插入Ω元件或经过缺失这些基因的部分区域灭活上述基因。

用BssHⅡ消化含fcs基因的质粒pSKfcs,导致从fcs基因切割 出1290bp的片段。随后重新连接,在pBluescript SK-中以克隆的 形式(pSKfcsΔ)获得fcs基因的缺失衍生物(fcsΔ)(见图1i和 2i)。另外,切除该片段后,将Ω元件ΩKm和ΩGm代替其连接进去。 这样产生了fcs基因的Ω-灭活衍生物(fcsΩKm,见图1g和2g)及 (fcsΩGm,见图1h和2h),它们均在pBluescript SK-中以克隆的 形式获得(pSKfcsΩKm和pSKfcsΩGm)。在其杂交质粒具有经缺失或经 Ω元件插入而失活的fcs基因的大肠杆菌克隆粗提物中不可能检测到 任何FCS活性。

用NruⅠ消化含ech基因的质粒pSKech,导致从ech基因切除了 53bp的片段及430bp的片段。重新连接后,ech基因的缺失衍生物 (echΔ,见图11和21)在pBluescript SK-中以克隆的形式获得 (pSKechΔ)。另外,切除该片段后,将Ω元件ΩKm和ΩGm代替其连接 进其中。结果产生ech基因的Ω-灭活衍生物(echΩKm和echΩGm), 它们在pBluescript SK-中以克隆的形式获得(pSKechΩKm和 pSKechΩGm)。

用BssHⅡ消化含vdh基因的质粒pSKvdh,导致从vdh基因切除 了210bp的片段。重新连接后,vdh基因的缺失衍生物(vdhΔ,见图10 和20)以克隆的形式在pBluescript SK-(pSK vdhΔ)中获得。另外, 切除该片段后,将Ω元件ΩKm和ΩGm代替其连接进入。结果产生vdh 基因的Ω-灭活衍生物(vdhΩKm和vdhΩGm),在pBluescript SK-中 以克隆的形式获得(pSKvdhΩKm,见图1m和2m)及(pSKvdhΩGm, 见图1n和2n)。在所得的大肠杆菌克隆的粗提物中不能检测到任何 VDH活性,该克隆中的杂交质粒具有经缺失或Ω元件插入灭活的vdh 基因。

用BssHⅡ消化含aat基因的质粒pSKaat,导致从aat基因中切 除了59bp的片段。重新连接后,aat基因的缺失衍生物(aatΔ,见图 1r和2r)在pBluescript SK-中以克隆的形式获得(pSKaatΔ)。另外, 切除该片段后,将Ω元件ΩKm和ΩGm代替其连接进入其中。结果产生 aat基因的Ω-灭活衍生物(aatΩKm,见图1p和2p)和(aatΩGm,见 图1q和2q),在pBluescript SK-中以克隆的形式获得(pSKaatΩKm 和pSKaatΩGm)。

实施例4

将Ω元件灭活的基因亚克隆进可接合转移的“自杀质粒”pSUP202 中。

为了用Ω-元件灭活的基因取代假单胞菌属种类HR199中的完整 基因,需要一种载体,一方面该载体可转移进假单胞菌中(可接合转 移的质粒),另一方面它在这些细菌中不能复制,因此在假单胞菌中 不稳定(“自杀质粒”)。使用这种质粒系统转移进假单胞菌中的DNA 片段只有借助于同源重组(RecA-依赖性重组)整合进细菌细胞的基因 组中才能保留。在这种情况下,使用“自杀质粒”pSUP202(Simon等, 1983,见A.Piihler,细菌-植物相互作用的分子遗传学,Springer Verlag,Berlin,Heidelberg,纽约,p98-106)。

用PstⅠ消化后,以质粒pSKfcsΩKm和pSKfcsΩGm分离灭活的基 因fcsΩKm和fcsΩGm并连接到PstⅠ-裂解的pSUP202DNA上。将连接 混合物转化进大肠杆菌S17-1。在分别还含卡那霉素或庆大霉素的含 四环素LB培养基中进行选择。获得其杂交质粒(pSUPfcsΩKm)含灭活 基因fcsΩKm的卡那霉素抗性转化子。庆大霉素抗性转化子的相应杂 交质粒(pSUPfcsΩGm)含灭活的基因fcsΩGm。

EcoRⅠ消化后,从质粒pSKechΩKm和pSKechΩGm分离灭活的基 因echΩKm和echΩGm并连接到EcoRⅠ裂解的pSUP202 DNA上。将连 接混合物转化进大肠杆菌S17-1。在分别还含卡那霉素或庆大霉素的 含四环素LB培养基上进行选择。获得其杂交质粒(pSUPechΩKm)含灭 活基因echΩKm的卡那霉素抗性转化子。庆大霉素抗性转化子的相应 杂交质粒(pSUPechΩGm)含灭活的基因echΩGm。

EcoRⅠ消化后,从质粒pSKvdhΩKm和pSKvdhΩGm分离灭活的基 因vdhΩKm和vdhΩGm并连接到EcoRⅠ-裂解的pSUP202DNA上。将连 接混合物转化进大肠杆菌S17-1。在分别还含卡那霉素或庆大霉素的 含四环素LB培养基上进行选择。获得其杂交质粒(pSUPvdhΩKm)含灭 活基因vdhΩKm的卡那霉素抗性转化子。庆大霉素抗性转化子的相应 杂交换粒(pSUPvdhΩGm)含灭活基因vdhΩGm。

EcoRⅠ消化后,从质粒pSKaatΩKm和pSKaatΩGm分离灭活基因 aatΩKm和aatΩGm并连接到EcoRⅠ裂解的pSUP202DNA上。将连接混 合物转化进大肠杆菌S17-1中。在分别还含卡那霉素或庆大霉素的 含四环素LB培养基上进行选择。获得其杂交质粒(pSUPaatΩKm)含灭 活基因aatΩKm的卡那霉素抗性转化子。庆大霉素抗性转化子的相应 杂交质粒(pSUPaatΩGm)含灭活的基因aatΩGm。

实施例5

将缺失灭活的基因亚克隆进具有“sacB选择系统”的可接合转移 “自杀质粒”PHE55中

为了用缺失灭活的基因取代假单胞菌属种类HR199中的完整基 因,需要具有在pSUP202的例子中已描述过的特性的载体。在缺失失 活基因的情况下,由于不存在选择假单胞菌属种类HR199中基因成功 取代的可能性,与Ω元件灭活基因相反,使用了另一选择系统。在“sacB 选择系统”中,取代的缺失失活基因被克隆进一种质粒中,该质粒除 抗生素抗性基因外还具有sacB基因。将该杂交质粒接合转移进假单 胞菌后,在完整基因在基因组中所处的位点处经同源重组整合质粒 (第一次交换)。这种产生的“杂基因型”菌株同时具有完整基因和 缺失失活基因,且被pHE55 DNA将这些基因互相分隔开。这些菌株表 现出由载体编码的抗性且也具有活性sacB基因。随后的目的是借助 于第二次同源重组事件将pHE55 DNA与完整基因一起分离出基因组 DNA(第二次交换)。这次重组事件产生的菌株仅具有失活的基因。 而且,pHE55编码的抗生素抗性和sacB基因均已丢失。如果将菌株在 含蔗糖的培养基上划线培养,见表达sacB基因的菌株的生长受抑制, 因为该基因产物将蔗糖转变成聚合物,而该聚合物积累于细胞周质 中。由于发生了第二次重组事件而不再携带sacB基因的细胞的生长 因此不受抑制。为了具有在表型上选择缺失灭活基因整合的可能性, 该基因不与完整基因交换,相反,使用的菌株待替换的基因已通过插 入Ω元件而被“标记”。当发生成功替换时,所得的菌株丧失由Ω元 件编码的抗生素抗性。

用PstⅠ消化后,从质粒pSKfcsΔ分离失活基因fcsΔ并连接到 PstⅠ-裂解的pHE55 DNA上。将连接混合物转化进大肠杆菌S17-1。 在含四环素的LB培养基上进行选择。获得四环素抗性转化子,其杂 交质粒(pHEfcsΔ)含灭活基因fcsΔ。

用EcoRⅠ消化后,从质粒pSKechΔ分离失活基因echΔ并用绿豆 核酸酶处理(产生钝末端)。将该片段连接到BamHⅠ-裂解的且用绿豆 核酸酶处理的pHE55 DNA上。将连接混合物转化进大肠杆菌S17-1。 在含四环素的LB培养基上进行选择。获得四环素抗性转化子,其杂 交质粒(pHEechΔ)含有失活基因echΔ。

用EcoRⅠ消化后,从质粒pSKvdhΔ分离失活基因vdhΔ并用绿豆 核酸酶处理。将该片段连接到BamHⅠ裂解的且用绿豆核酸酶处理过的 pHE55 DNA上。将连接混合物转化进大肠杆菌S17-1。在含四环素的 LB培养基上进行选择。获得四环素抗性转化子,其杂交质粒(pHEvdhΔ) 含有灭活的基因vdhΔ。

用EcoRⅠ消化后,从质粒pSKaatΔ分离出灭活基因aatΔ并用绿 豆核酸酶处理。将该片段连接到BamHⅠ裂解的并用绿豆核酸酶处理过 的pHE55 DNA上。将连接混合物转化进大肠杆菌S17-1。在含四环 素的LB培养基上进行选择。获得四环素抗性转化子,其杂交质粒 (phEaatΔ)含有灭活的基因aatΔ。

实施例6

产生假单胞菌属种类HR199菌株的突变体,其中经过插入Ω-元件 特异性灭活丁子香酚分解代谢基因。

在接合实验中菌株假单胞菌属种类HR199用作受体,其中下述含 有pSUP202杂交质粒的菌株大肠杆菌S17-1用作供体。转接合子在 含有相应于Ω元件之抗生素的含葡糖酸无机培养基上选择。可根据 pSUP202-编码的四环素抗性区分“同基因子”(通过2次交换用Ω 元件插入失活基因取代完整基因)和“杂基因子”(借助于单次交换 将杂交质粒整合进基因组)转接合子。

将假单胞菌属种类HR199分别与大肠杆菌S17-1(pSUPfcsΩKm) 和大肠杆菌S17-1(pSUPfcsΩGm)接合后获得突变的假单胞菌属种类 HR199fcsΩKm和假单胞菌属种类HR199fcsΩGm。经过DNA测序证实 完整fcs基因被ΩKm-灭活的或ΩGm-灭活的基因(分别为fcsΩKm和 fcsΩGm)取代。

将假单胞菌属种类HR199分别与大肠杆菌S17-1(pSUPechΩKm) 和大肠杆菌S17-1(pSUPechΩGm)接合后获得突变的假单胞菌属种类 HR199echΩKm假单胞菌属种类HR199echΩGm。经过DNA测序证实完 整的ech基因被ΩKm-灭活的或ΩGm-灭活的基因(分别为echΩkm和 echΩGm)取代。

将假单胞菌属种类HR199分别与大肠杆菌S17-1(pSUPvdhΩKm) 和大肠杆菌S17-1(pSUPvdhΩGm)接合后获得突变的假单胞菌属种类 HR199vdhΩKm和假单胞菌属种类HR199vdhΩGm。经过DNA测序证 实完整的vdh基因被ΩKm-灭活的或ΩGm-灭活的基因(分别为vdhΩ Km和vdhΩGm)取代。

将假单胞菌属种类HR199分别与大肠杆菌S17-1(pSUPaatΩ Km)和大肠杆菌S17-1(pSUPaatΩGm)接合后获得突变的假单胞 菌属种类HR199aatΩKm和假单胞菌属种类HR199aatΩGm。经过DNA 测序证实完整的aat基因被ΩKm-灭活的或ΩGm-灭活的基因(分别是 aatΩKm和aatΩGm)取代。

将假单胞菌属种类HR199fcsΩ Km与大肠杆菌S17-1(pSUPvdh ΩGm)接合后获得突变的假单胞菌属种类HR199fcsΩKm vdhΩGm。 经过DNA测序证实完整的vdh基因被ΩGm灭活的基因(vdhΩGm)取 代。

将假单胞菌属种类HR199vdhΩKm大肠杆菌S17-1(pSUPaatΩ Gm)接合后获得突变的假单胞菌属种类HR199vdh ΩKmaatΩGm。经 过DNA测序证实完整的aat基因被ΩGm-灭活的基因(aatΩGm)取代。

将假单胞菌属种类HR199vdhΩ Km与大肠杆菌S17-1(pSUPech ΩGm)接合后获得突变的假单胞菌属种类HR199vdhΩKmechΩGm。 经过DNA测序证实完整的ech基因被ΩGm灭活的基因(echΩGm)取 代。

实施例7

产生菌株假单胞菌属种类HR199的突变体,

其中经过缺失部分区域特异性灭活丁子香酚分解代谢的基因。

在接合实验中,菌株假单胞菌属种类HR199fcsΩKm,假单胞菌 属种类HR199echΩKm,假单胞菌属种类HR199vdhΩKm和假单胞菌 属种类HR199aatΩKm用作受体,下述含有pHE55杂交质粒的大肠杆 菌S17-1菌株用作供体。在除四环素(pHE55编码的抗性)外还含有 相应于Ω元件的抗生素的含葡糖酸无机培养基上选择“杂基因子”转 接合子。在含蔗糖的无机培养基上划线培养后,获得的转接合子经第 二次重组事件(第二次交换)删除了载体DNA。经过在不含抗生素或 含有相应于Ω元件的抗生素的无机培养基中划线培养,可鉴定出用缺 失灭活的基因(无抗生素抗性)取代了Ω元件灭活的基因的突变体。

将假单胞菌属种类HR199fcsΩKm与大肠杆菌S17-1(pHEfcs Δ)接合后获得突变的假单胞菌属种类HR199fcsΔ。经DNA测序证 实ΩKm灭活的基因(fcsΩKm)被缺失灭活的基因(fcsΔ)取代。

将假单胞菌属种类HR199echΩKm与大肠杆菌S17-1(pHEechΔ) 接合后获得突变的假单胞菌属种类HR199echΔ。经DNA测序证实Ω Km灭活的基因(echΩKm)被缺失灭活基因(echΔ)取代。

将假单胞菌属种类HR199vdhΩKm与大肠杆菌S17-1(pHEvdh Δ)接合后获得突变的假单胞菌属种类HR199vdhΔ。经DNA测序证 实ΩKm灭活的基因(vdhΩKm)被缺失灭活的基因(vdhΔ)取代。

将假单胞菌属种类HR199aatΩKm与大肠杆菌S17-1(pHEaat Δ)接合后获得突变的假单胞菌属种类HR199aatΔ。经过DNA测序 证实ΩKm-灭活的基因(aatΩKm)被缺失灭活的基因(aatΔ)取代。

实施例8

使用突变的假单胞菌属种类HR199vdhΩKm将丁子香酚生物转化 成香草醛。

菌株假单胞菌属种类HR199vdhΩKm在50ml含6mM丁子香酚的 HR-MM中繁殖到光密度为大约OD600nm=0.6。17小时后,在培养上 清中可检测到2.9mM的香草醛,1.4mM阿魏酸和0.4mM香草酸。

实施例9

使用突变的假单胞菌属种类HR199vdhΩGmaatΩKm将丁子香酚 生物转化成阿魏酸

菌株假单胞菌属种类HR199vdhΩGmaatΩkm在50ml含6mM丁子 香酚的HR-MM中繁殖到光密度为大约OD600nm=0.6。18小时后,在 培养上清中可检测到1.9mM香草醛,2.4mM阿魏酸和0.6mM香草酸。

实施例10

使用突变假单胞菌属种类HR199vdhΩGmaatΩKm将丁子香酚生 物转化成松柏醇。

菌株假单胞菌属种类HR199vdhΩGmaatΩKm在50ml含60mM丁 子香酚的HR-MM中繁殖到光密度大约为OD600nm=0.4。15小时后, 在培养物上清中可检测到1.7mM松柏醇,1.4mM香草醛,1.4mM阿魏 酸和0.2mM香草酸。

实施例11

使用突变的假单胞菌属种类HR199vdhΩKm在10 l发酵罐中从 丁子香酚发酵生产天然香草醛。

用100ml培养了24小时的预培养物接种生产发酵罐,其中该预 培养物在调至pH7.0且由12.5g甘油/l,10g酵母提取物/l和0.37g 乙酸/l组成的培养基中在摇床(120rpm)上32℃繁殖过。发酵罐含 有9.9 l下列组成的培养基:1.5g酵母提取物/l,1.6g KH2PO4/l, 0.2g NaCl/l,0.2g MgSO4/l。用氢氧化钠溶液将pH调节至pH7.0。 灭菌后,向培养基中加入4g丁子香酚。温度为32℃,通气为3NL/分, 搅拌速度为600rpm。用氢氧化钠溶液将pH维持在pH6.5。

在接种后4小时,开始连续加入丁子香酚使得在65小时后发酵 终止时,向培养物中加入了255g的丁子香酚。在发酵期间还加入40g 酵母提取物。发酵终止时,丁子香酚的浓度为0.2g/l。香草醛的含量 为2.6g/l。也存在3.4g的阿魏酸/l。

用诸如色谱,蒸馏和/或提取的已知物理方法分离以这种方式获 得的香草醛并用于制备天然调味品

附图的说明

图1a至1r:

分离生物和突变体的基因结构

cclA*:松柏醇脱氢酶的部分失活基因

calB*:松柏醛脱氢酶的部分失活基因

fcs*:阿魏酰-CoA合成酶的部分失活基因

ech*:烯酰-CoA水合酶-醛缩酶的部分失活基因

vdh*:香草醛脱氢酶的部分失活基因

aat*:β-酮硫解酶的部分失活基因

尽管标记“*”的限制性酶裂解位点用于构建,但它们在所得的 构建体上不再具有功能。

图2a:calAΩKm基因结构的核苷酸序列

图2b:calAΩGm基因结构的核苷酸序列

图2c:calAΔ基因结构的核苷酸序列

图2d:calBΩKm基因结构的核苷酸序列

图2e:calBΩGm基因结构的核苷酸序列

图2f:calBΔ基因结构的核苷酸序列

图2g:fcsΩKm基因结构的核苷酸序列

图2h:fcsΩGm基因结构的核苷酸序列

图2i:fcsΔ基因结构的核苷酸序列

图2j:echΩKm基因结构的核苷酸序列

图2k:echΩGm基因结构的核苷酸序列

图2l:echΔ基因结构的核苷酸序列

图2m:vdhΩKm基因结构的核苷酸序列

图2n:vdhΩGm基因结构的核苷酸序列

图2o:vdhΔ基因结构的核苷酸序列

图2p:aatΩKm基因结构的核苷酸序列

图2q:aatΩGm基因结构的核苷酸序列

图2r:aatΔ基因结构的核苷酸序列

                           序列 CTGCAGCCAG GGCTGAAAAG GAGGGATTCA GTGAGGTCAT GAAGGGAGGG GACGGCGCCT       60 GGCTCCAATT GCTCGATGGC GCCGCGATTG AGTGTCTTGG GCGCGGTCTT GGAGAGTTCG      120 GCTAGGGAGA TAAATTTGCT GGCCATGGTG GCGGCCCCTG ATGGGTTGGA TGATTTTCTG      180 CATTCTGCAT CATGAAATTC ATGAAATCAT CACTTTTCGG GGGGTGGGTG CACGGGATTG      240 AAGGTTGCTA GGAGAGTGCA TTGCTCGTAA GCCCAGGAAG CACGCGGGTT TCAGGATGGT      300 GCATGGAAAT GGCATGAGCT TTGCTGGATA TGATTAGAGA CATTAACTAT TTTGGCGGAA      360 TGGAAGCACG ATTCCTCGCC CGGTAGAGCG GTAACCGCGA CATTCAGGAC CGTAAAAAGG      420 AAAGAGCATG CAA CTG ACC AAC AAG AAA ATC GTC GTC ACC GGA GTG TCC TCC     472

   Met Gln Leu Thr Asn Lys Lys Ile Val Val Thr Gly Val Ser Ser

     1               5                  10                  15 GGT ATC GGT GCC GAA ACT GCC CGC GTT CTG CGC TCT CAC GGC GCC ACA        520 Gly Ile Gly Ala Glu Thr Ala Arg Val Leu Arg Ser His Gly Ala Thr

              20                 25                  30 GTG ATT GGC GTA GAT CGC AAC ATG CCG AGC CTG ACT CTG GAT GCT TTC        568 Val Ile Gly Val Asp Arg Asn Met Pro Ser Leu Thr Leu Asp Ala Phe

         35                  40                  45 GTT CAG GCT GAC CTG AGC CAT CCT GAA GGC ATC GAT AAG GCC ATC GGG        616 Val Gln Ala Asp Leu Ser His Pro Glu Gly Ile Asp Lys Ala Ile

     50                  55                  60      62 ACAGCAAGCG AACCGGAATT GCCAGCTGGG GCGCCCTCTG GTAAGGTTGG GAAGCCCTGC      676 AAAGTAAACT GGATGGCTTT CTTGCCGCCA AGGATCTGAT GGCGCAGGGG ATCAAGATCT      736 GATCAAGAGA CAGGATGAGG ATCGTTTCGC ATG ATT GAA CAA GAT GGA TTG CAC       790

                             Met Ile Glu Gln Asp Gly Leu His

                               1               5 GCA GGT TCT CCG GCC GCT TGG GTG GAG AGG CTA TTC GGC TAT GAC TGG        838 Ala Gly Ser Pro Ala Ala Trp Val Glu Arg Leu Phe Gly Tyr Asp Trp

 10                  15                  20 GCA CAA CAG ACA ATC GGC TGC TCT GAT GCC GCC GTG TTC CGG CTG TCA        886 Ala Gln Gln Thr Ile Gly Cys Ser Asp Ala Ala Val Phe Arg Leu Ser  25                  30                  35                  40 GCG CAG GGG CGC CCG GTT CTT TTT GTC AAG ACC GAC CTG TCC GGT GCC        934 Ala Gln Gly Arg Pro Val Leu Phe Val Lys Thr Asp Leu Ser Gly Ala

             45                  50                  55 CTG AAT GAA CTG CAG GAC GAG GCA GCG CGG CTA TCG TGG CTG GCC ACG        982 Leu Asn Glu Leu Gln Asp Glu Ala Ala Arg Leu Ser Trp Leu Ala Thr

         60                  65                  70 ACG GGC GTT CCT TGC GCA GCT GTG CTC GAC GTT GTC ACT GAA GCG GGA       1030 Thr Gly Val Pro Cys Ala Ala Val Leu Asp Val Val Thr Glu Ala Gly

     75                  80                  85 AGG GAC TGG CTG CTA TTG GGC GAA GTG CCG GGG CAG GAT CTC CTG TCA       1078 Arg Asp Trp Leu Leu Leu Gly Glu Val Pro Gly Gln Asp Leu Leu Ser

 90                  95                 100 TCT CAC CTT GCT CCT GCC GAG AAA GTA TCC ATC ATG GCT GAT GCA ATG       1126 Ser His Leu Ala Pro Ala Glu Lys Val Ser Ile Met Ala Asp Ala Met 105                 110                 115                 120 CGG CGG CTG CAT ACG CTT GAT CCG GCT ACC TGC CCA TTC GAC CAC CAA       1174 Arg Arg Leu His Thr Leu Asp Pro Ala Thr Cys Pro Phe Asp His Gln

            125                 130                 135 GCG AAA CAT CGC ATC GAG CGA GCA CGT ACT CGG ATG GAA GCC GGT CTT       1222 Ala Lys His Arg Ile Glu Arg Ala Arg Thr Arg Met Glu Ala Gly Leu

        140                 145                 150 GTC GAT CAG GAT GAT CTG GAC GAA GAG CAT CAG GGG CTC GCG CCA GCC       1270 Val Asp Gln Asp Asp Leu Asp Glu Glu His Gln Gly Leu Ala Pro Ala

    155                 160                 165 GAA CTG TTC GCC AGG CTC AAG GCG CGC ATG CCC GAC GGC GAG GAT CTC       1318 Glu Leu Phe Ala Arg Leu Lys Ala Arg Met Pro Asp Gly Glu Asp Leu

170                 175                 180 GTC GTG ACC CAT GGC GAT GCC TGC TTG CCG AAT ATC ATG GTG GAA AAT       1366 Val Val Thr His Gly Asp Ala Cys Leu Pro Asn Ile Met Val Glu Asn 185                 190                 195                 200 GGC CGC TTT TCT GGA TTC ATC GAC TGT GGC CGG CTG GGT GTG GCG GAC       1414 Gly Arg Phe Ser Gly Phe Ile Asp Cys Gly Arg Leu Gly Val Ala Asp

            205                 210                 215 CGC TAT CAG GAC ATA GCG TTG GCT ACC CGT GAT ATT GCT GAA GAG CTT       1462 Arg Tyr Gln Asp Ile Ala Leu Ala Thr Arg Asp Ile Ala Glu Glu Leu

        220                 225                 230 GGC GGC GAA TGG GCT GAC CGC TTC CTC GTG CTT TAC GGT ATC GCC GCT       1510 Gly Gly Glu Trp Ala Asp Arg Phe Leu Val Leu Tyr Gly Ile Ala Ala

    235                 240                 245 CCC GAT TCG CAG CGC ATC GCC TTC TAT CGC CTT CTT GAC GAG TTC TTC       1558 Pro Asp Ser Gln Arg Ile Ala Phe Tyr Arg Leu Leu Asp Glu Phe Phe

250                 255                 260             264 TGAGCGGGAC TCTGGGGTTC GAAATGACCG ACCAAGCGAC GCCCTG GCC GCG GTG        1613

                                               Ala Ala Val

                                               225 ATT GCA TTC ATG TGT GCT GAG GAG TCA CGT TGG ATC AAC GGC ATA AAT       1661 Ile Ala Phe Met Cys Ala Glu Glu Ser Arg Trp Ile Asn Gly Ile Asn

    230                 235                 240 ATT CCA GTG GAC GGA GGT TTG GCA TCG ACC TAC GTG TAA GTTCGTGGAC        1710 Ile Pro Val Asp Gly Gly Leu Ala Ser Thr Tyr Val

245                 250                 255 GCCCTTTGCA CGCGCACTAT ATCTCTATGC AGCAGCTGAA AGCAGCTTTG GTTTTGATCG     1770 GAGGTAGCGG GCGGAAAGGT GCAGAATGTC TAAATAATAA AGGATTCTTG TGAAGCTTTA     1830 GTTGTCCGTA AACGAAAATA AAAATAAAGA GGAATGATAT GAAAGCAAGT AGATCAGTCT     1890 GCACTTTCAA AATAGCTACC CTGGCAGGCG CCATTTATGC AGCGCTGCCA ATGTCAGCTG     1950 CAAACTCGAT GCAGCTGGAT GTAGGTAGCT CGGATTGGAC GGTGCGTTGG GGACAACACC     2010 CTCAAGTATA GCCTTGCCTC TCGCCTGAAT GAGCAAGACT CAAGTCTGAC AAATGCGCCG     2070 ACTGTCAATG GTTATATCCG GATATTCAAA GTCAGGGTGA TCGTAACTTT GACCGGGGGC     2130 TTGGTATCCA ATCGTCTCGA TATTCTGGCT GCAG                                 2164 图2a: CTGCAGCCAG GGCTGAAAAG GAGGGATTCA GTGAGGTCAT GAAGGGAGGG GACGGCGCCT       60 GGCTCCAATT GCTCGATGGC GCCGCGATTG AGTGTCTTGG GCGCGGTCTT GGAGAGTTCG      120 GCTAGGGAGA TAAATTTGCT GGCCATGGTG GCGGCCCCTG ATGGGTTGGA TGATTTTCTG      180 CATTCTGCAT CATGAAATTC ATGAAATCAT CACTTTTCGG GGGGTGGGTG CACGGGATTG      240 AAGGTTGCTA GGAGAGTGCA TTGCTCGTAA GCCCAGGAAG CACGCGGGTT TCAGGATGGT      300 GCATGGAAAT GGCATGAGCT TTGCTGGATA TGATTAGAGA CATTAACTAT TTTGGCGGAA      360 TGGAAGCACG ATTCCTCGCC CGGTAGAGCG GTAACCGCGA CATTCAGGAC CGTAAAAAGG      420 AAAGAGCATG CAA CTG ACC AAC AAG AAA ATC GTC GTC ACC GGA GTG TCC TCC     472

   Met Gln Leu Thr Asn Lys Lys Ile Val Val Thr Gly Val Ser Ser

     1               5                  10                  15 GGT ATC GGT GCC GAA ACT GCC CGC GTT CTG CGC TCT CAC GGC GCC ACA        520 Gly Ile Gly Ala Glu Thr Ala Arg Val Leu Arg Ser His Gly Ala Thr

             20                  25                  30 GTG ATT GGC GTA GAT CGC AAC ATG CCG AGC CTG ACT CTG GAT GCT TTC        568 Val Ile Gly Val Asp ArG Asn Met Pro Ser Leu Thr Leu Asp Ala Phe

         35                  40                  45 GTT CAG GCT GAC CTG AGC CAT CCT GAGGGGAGAG GCGGTTTGCG TATTGGGCGC       622 Val Gln Ala Asp Leu Ser His Pro

     50                  55 ATGCATAAAA ACTGTTGTAA TTCATTAAGC ATTCTGCCGA CATGGAAGCC ATCACAAACG      682 GCATGATGAA CCTGAATCGC CAGCGGCATC AGCACCTTGT CGCCTTGCGT ATAATATTTG      742 CCCATGGACG CACACCGTGG AAACGGATGA AGGCACGAAC CCAGTTGACA TAAGCCTGTT      802 CGGTTCGTAA ACTGTAATGC AAGTAGCGTA TGCGCTCACG CAACTGGTCC AGAACCTTGA      862 CCGAACGCAG CGGTGGTAAC GGCGCAGTGG CGGTTTTCAT GGCTTGTTAT GACTGTTTTT      922 TTGTACAGTC TATGCCTCGG GCATCCAAGC AGCAAGCGCG TTACGCCGTG GGTCGATGTT      982 TGATGTTATG GAGCAGCAAC G ATG TTA CGC AGC AGC AAC GAT GTT ACG CAG       1033

                    Met Leu ArG Ser Ser Asn Asp Val Thr Gln

                      1               5                  10 CAG GGC AGT CGC CCT AAA ACA AAG TTA GGT GGC TCA AGT ATG GGC ATC       1081 Gln Gly Ser Arg Pro Lys Thr Lys Leu Gly Gly Ser Ser Met Gly Ile

             15                  20                  25 ATT CGC ACA TGT AGG CTC GGC CCT GAC CAA GTC AAA TCC ATG CGG GCT       1129 Ile Arg Thr Cys Arg Leu Gly Pro Asp Gln Val Lys Ser Met Arg Ala

         30                  35                  40 GCT CTT GAT CTT TTC GGT CGT GAG TTC GGA GAC GTA GCC ACC TAC TCC       1177 Ala Leu Asp Leu Phe Gly Arg Glu Phe Gly Asp Val Ala Thr Tyr Ser

     45                  50                  55 CAA CAT CAG CCG GAC TCC GAT TAC CTC GGG AAC TTG CTC CGT AGT AAG       1225 Gln His Gln Pro Asp Ser Asp Tyr Leu Gly Asn Leu Leu Arg Ser Lys

 60                  65                  70 ACA TTC ATC GCG CTT GCT GCC TTC GAC CAA GAA GCG GTT GTT GGC GCT       1273 Thr Phe Ile Ala Leu Ala Ala Phe Asp Gln Glu Ala Val Val Gly Ala  75                  80                  85                  90 CTC GCG GCT TAC GTT CTG CCC AGG TTT GAG CAG CCG CGT AGT GAG ATC       1321 Leu Ala Ala Tyr Val Leu Pro Arg Phe Glu Gln Pro Arg Ser Glu Ile

             95                 100                 105 TAT ATC TAT GAT CTC GCA GTC TCC GGC GAG CAC CGG AGG CAG GGC ATT       1369 Tyr Ile Tyr Asp Leu Ala Val Ser Gly Glu His Arg Arg Gln Gly Ile

        110                 115                 120 GCC ACC GCG CTC ATC AAT CTC CTC AAG CAT GAG GCC AAC GCG CTT GGT       1417 Ala Thr Ala Leu Ile Asn Leu Leu Lys His Glu Ala Asn Ala Leu Gly

    125                 130                 135 GCT TAT GTG ATC TAC GTG CAA GCA GAT TAC GGT GAC GAT CCC GCA GTG       1465 Ala Tyr Val Ile Tyr Val Gln Ala Asp Tyr Gly Asp Asp Pro Ala Val

140                 145                 150 GCT CTC TAT ACA AAG TTG GGC ATA CGG GAA GAA GTG ATG CAC TTT GAT       1513 Ala Leu Tyr Thr Lys Leu Gly Ile Arg Glu Glu Val Met His Phe Asp 155                 160                 165                 170 ATC GAC CCA AGT ACC GCC ACC TAA CAATTCGTTC AAGCCGAGAT CGGCTTCCCT      1567 Ile Asp Pro Ser Thr Ala Thr

            175     177 G ATT GCA TTC ATG TGT GCT GAG GAG TCA CGT TGG ATC AAC GGC ATA AAT     1616   Ile Ala Phe Met Cys Ala Glu Glu Ser Arg Trp Ile Asn Gly Ile Asn   228     230                 235                 240 ATT CCA GTG GAC GGA GGT TTG GCA TCG ACC TAC GTG TAA GTTCGTGGAC        1665 Ile Pro Val Asp Gly Gly Leu Ala Ser Thr Tyr Val

245                 250                 255 GCCCTTTGCA CGCGCACTAT ATCTCTATGC AGCAGCTGAA AGCAGCTTTG GTTTTGATCG     1725 GAGGTAGCGG GCGGAAAGGT GCAGAATGTC TAAATAATAA AGGATTCTTG TGAAGCTTTA     1785 GTTGTCCGTA AACGAAAATA AAAATAAAGA GGAATGATAT GAAAGCAAGT AGATCAGTCT     1845 GCACTTTCAA AATAGCTACC CTGGCAGGCG CCATTTATGC AGCGCTGCCA ATGTCAGCTG     1905 CAAACTCGAT GCAGCTGGAT GTAGGTAGCT CGGATTGGAC GGTGCGTTGG GGACAACACC     1965 CTCAAGTATA GCCTTGCCTC TCGCCTGAAT GAGCAAGACT CAAGTCTGAC AAATGCGCCG     2025 ACTGTCAATG GTTATATCCG GATATTCAAA GTCAGGGTGA TCGTAACTTT GACCGGGGGC     2085 TTGGTATCCA ATCGTCTCGA TATTCTGGCT GCAG                                 2119 图2b: CTGCAGCCAG GGCTGAAAAG GAGGGATTCA GTGAGGTCAT GAAGGGAGGG GACGGCGCCT       60 GGCTCCAATT GCTCGATGGC GCCGCGATTG AGTGTCTTGG GCGCGGTCTT GGAGAGTTCG      120 GCTAGGGAGA TAAATTTGCT GGCCATGGTG GCGGCCCCTG ATGGGTTGGA TGATTTTCTG      180 CATTCTGCAT CATGAAATTC ATGAAATCAT CACTTTTCGG GGGGTGGGTG CACGGGATTG      240 AAGGTTGCTA GGAGAGTGCA TTGCTCGTAA GCCCAGGAAG CACGCGGGTT TCAGGATGGT      300 GCATGGAAAT GGCATGAGCT TTGCTGGATA TGATTAGAGA CATTAACTAT TTTGGCGGAA      360 TGGAAGCACG ATTCCTCGCC CGGTAGAGCG GTAACCGCGA CATTCAGGAC CGTAAAAAGG      420 AAAGAGCATG CAA CTG ACC AAC AAG AAA ATC GTC GTC ACC GGA GTG TCC TCC     472

   Met Gln Leu Thr Asn Lys Lys Ile Val Val Thr Gly Val Ser Ser

     1               5                  10                  15 GGT ATC GGT GCC GAA ACT GCC CGC GTT CTG CGC TCT CAC GGC GCC ACA        520 Gly Ile Gly Ala Glu Thr Ala Arg Val Leu Arg Ser His Gly Ala Thr

             20                  25                  30 GTG ATT GGC GTA GAT CGC AAC ATG CCG AGC CTG ACT CTG GAT GCT TTC        568 Val Ile Gly Val Asp Arg Asn Met Pro Ser Leu Thr Leu Asp Ala Phe

         35                  40                  45 GTT CAG GCT GAC CTG AGC CAT CCT GAA GGC ATC GATC AAC GGC ATA AAT       617 Val Gln Ala Asp Leu Ser His Pro Glu Gly Ile      Asn Gly Ile Asn

     50                  55          58      240 ATT CCA GTG GAC GGA GGT TTG GCA TCG ACC TAC GTG TAA GTTCGTGGAC         666 Ile Pro Val Asp Gly Gly Leu Ala Ser Thr Tyr Val

245                 250                 255 GCCCTTTGCA CGCGCACTAT ATCTCTATGC AGCAGCTGAA AGCAGCTTTG GTTTTGATCG      726 GAGGTAGCGG GCGGAAAGGT GCAGAATGTC TAAATAATAA AGGATTCTTG TGAAGCTTTA      786 GTTGTCCGTA AACGAAAATA AAAATAAAGA GGAATGATAT GAAAGCAAGT AGATCAGTCT      846 GCACTTTCAA AATAGCTACC CTGGCAGGCG CCATTTATGC AGCGCTGCCA ATGTCAGCTG      906 CAAACTCGAT GCAGCTGGAT GTAGGTAGCT CGGATTGGAC GGTGCGTTGG GGACAACACC      966 CTCAAGTATA GCCTTGCCTC TCGCCTGAAT GAGCAAGACT CAAGTCTGAC AAATGCGCCG     1026 ACTGTCAATG GTTATATCCG GATATTCAAA GTCAGGGTGA TCGTAACTTT GACCGGGGGC     1086 TTGGTATCCA ATCGTCTCGA TATTCTGGCT GCAG                                 1120 图2c: GAATTCCGCG TATCGCCCGG TTCTATCAGC GGGCCGCTTT CGAAAGTCAT GGTGTTAGCC        60 GGTAGGGTCT TTTTCTTGGC CATGCTTGTT GCCTGAACCT TCGTTGACAT AGGGCAGAGG       120 TGCGTTTGCC GCTTCGCTTC GCGATGAACC GCATCGAGAT GCTGAGGTCA GGATTTTTCC       180 TTAACTCGCG TAAGCATTCT GTCATTTTTT TGGTGGCTTT GAACAGCCTG ATGAAAGGTG       240 GTCTCGCCCT TTGAGGCCGA TTCTTGGGCG CTTGGCGGCG TCGAAGCGAT GCTCCACTAC       300 CGATTAAGAT AATTAAAATA AGGAAACCGC ATGGTTTCTT ATGTGAATTT GTCTGGCATA       360 CTCCAGCTCA AGGGCAATTT TTGGGCTATT GGCTGAGCAG TTGCCTCTAT ATGGTTATTC       420 AGAATAACAA TTGACTCCTC AGGAGGTCAG CG ATG AGC ATT CTT GGT TTG AAT         473

                                Met Ser Ile Leu Gly Leu Asn

                                  1               5 GGT GCC CCG GTC GGA GCT GAG CAG CTG GGC TCG GCT CTT GAT CGC ATG         521 Gly Ala Pro Val Gly Ala Glu Gln Leu Gly Ser Ala Leu Asp Arg Met

     10                  15                  20 AAG AAG GCG CAC CTG GAG CAG GGG CCT GCA AAC TTG GAG CTG CGT CTG         569 Lys Lys Ala His Leu Glu Gln Gly Pro Ala Asn Leu Glu Leu ArG Leu

 25                  30                  35 AGT AGG CTG GAT CGT GCG ATT GCA ATG CTT CTG GAA AAT CGT GAA GCA         617 Ser Arg Leu Asp Arg Ala Ile Ala Met Leu Leu Glu Asn Arg Glu Ala  40                  45                  50                  55 ATT GCC GAC GCG GTT TCT GCT GAC TTT GGC AAT CGC AGC CGT GAG CAA         665 Ile Ala Asp Ala Val Ser Ala Asp Phe Gly Asn Arg Ser Arg Glu Gln

             60                  65                  70 ACA CTG CTT TGC GAC ATT GCT GGC TCG GTG GCA AGC CTG AAG GAT AGC         713 Thr Leu Leu Cys Asp Ile Ala Gly Ser Val Ala Ser Leu Lys Asp Ser

         75                  80                  85 CGC GAG CAC GTG GCC AAA TGG ATG GAG CCC GAA CAT CAC AAG GCG ATG         761 ArG Glu His Val Ala Lys Trp Met Glu Pro Glu His His Lys Ala Met

     90                  95                 100 TTT CCA GGG GCG GAG GCA CGC GTT GAG TTT CAG CCG CTG GGT GTC GTT         809 Phe Pro Gly Ala Glu Ala Arg Val Glu Phe Gln Pro Leu Gly Val Val

105                 110                 115 GGG GTC ATT AGT CCC TGG AAC TTC CCT ATC GTA CTG GCC TTT GGG CCG         857 Gly Val Ile Ser Pro Trp Asn Phe Pro Ile Val Leu Ala Phe Gly Pro 120                 125                 130                 135 CTG GCC GGC ATA TTC GCA GCA GGT AAT CGC GCC ATG CTC AAG CCG TCC         905 Leu Ala Gly Ile Phe Ala Ala Gly Asn Arg Ala Met Leu Lys Pro Ser

            140                 145                 150 GAG CTT ACC CCG CGG ACT TCT GCC CTG CTT GCG GAG CTA ATT GCT CGT         953 Glu Leu Thr Pro Arg Thr Ser Ala Leu Leu Ala Glu Leu Ile Ala Arg

        155                 160                 165 TAC TTC GAT GAA ACT GAG CTG ACT ACA GTG CTG GGC GAC GCT GAA GTC      1001 Tyr Phe Asp Glu Thr Glu Leu Thr Thr Val Leu Gly Asp Ala Glu Val

   170                 175                 180 GGT GCG CTG TTC AGT GCT CAG CCT TTC GAT CAT CTG ATC TTC ACC GGC      1049 Gly Ala Leu Phe Ser Ala Gln Pro Phe Asp His Leu Ile Phe Thr Gly

185                 190                 195 GGC ACT GCC GTG GCC AAG CAC ATC ATG CGT GCC GCG GCG GAT AAC CTA      1097 Gly Thr Ala Val Ala Lys His Ile Met Arg Ala Ala Ala Asp Asn Leu 200                 205                 210                 215 GTG CCC GTT ACC CTG GAA TTG GGT GGC AAA TCG CCG GTG ATC GTT TCC      1145 Val Pro Val Thr Leu Glu Leu Gly Gly Lys Ser Pro Val Ile Val Ser

            220                 225                 230 CGC AGT GCA GAT ATG GCG GAC GTT GCA CAA CGG GTG TTG ACG GTG AAA      1193 Arg Ser Ala Asp Met Ala Asp Val Ala Gln ArG Val Leu Thr Val Lys

        235                 240                 245 ACC TTC AAT GCC GGG CAA ATC TGT CTG GCA CCG GAC TAT GTG CTG CTG      1241 Thr Phe Asn Ala Gly Gln Ile Cys Leu Ala Pro Asp Tyr Val Leu Leu

    250                 255                 260 CCG GAA GGGACAGCAA GCGAACCGGA ATTGCCAGCT GGGGCGCCCT CTGGTAAGGT       1297 Pro Glu

265 TGGGAAGCCC TGCAAAGTAA ACTGGATGGC TTTCTTGCCG CCAAGGATCT GATGGCGCAG    1357 GGGATCAAGA TCTGATCAAG AGACAGGATG AGGATCGTTT CGC ATG ATT GAA CAA      1412

                                            Met Ile Glu Gln

                                              1 GAT GGA TTG CAC GCA GGT TCT CCG GCC GCT TGG GTG GAG AGG CTA TTC      1460 Asp Gly Leu His Ala Gly Ser Pro Ala Ala Trp Val Glu Arg Leu Phe   5                  10                  15                  20 GGC TAT GAC TGG GCA CAA CAG ACA ATC GGC TGC TCT GAT GCC GCC GTG      1508 Gly Tyr Asp Trp Ala Gln Gln Thr Ile Gly Cys Ser Asp Ala Ala Val

             25                  30                  35 TTC CGG CTG TCA GCG CAG GGG CGC CCG GTT CTT TTT GTC AAG ACC GAC      1556 Phe Arg Leu Ser Ala Gln Gly Arg Pro Val Leu Phe Val Lys Thr Asp

         40                  45                  50 CTG TCC GGT GCC CTG AAT GAA CTG CAG GAC GAG GCA GCG CGG CTA TCG      1604 Leu Ser Gly Ala Leu Asn Glu Leu Gln Asp Glu Ala Ala Arg Leu Ser

     55                  60                  65 TGG CTG GCC ACG ACG GGC GTT CCT TGC GCA GCT GTG CTC GAC GTT GTC      1652 Trp Leu Ala Thr Thr Gly val Pro Cys Ala Ala Val Leu Asp Val Val

 70                  75                  80 ACT GAA GCG GGA AGG GAC TGG CTG CTA TTG GGC GAA GTG CCG GGG CAG      1700 Thr Glu Ala Gly Arg Asp Trp Leu Leu Leu Gly Glu Val Pro Gly Gln  85                  90                  95                 100 GAT CTC CTG TCA TCT CAC CTT GCT CCT GCC GAG AAA GTA TCC ATC ATG      1748 Asp Leu Leu Ser Ser His Leu Ala Pro Ala Glu Lys Val Ser Ile Met

            105                 110                 115 GCT GAT GCA ATG CGG CGG CTG CAT ACG CTT GAT CCG GCT ACC TGC CCA      1796 Ala Asp Ala Met Arg Arg Leu His Thr Leu Asp Pro Ala Thr Cys Pro

        120                 125                 130 TTC GAC CAC CAA GCG AAA CAT CGC ATC GAG CGA GCA CGT ACT CGG ATG      1844 Phe Asp His Gln Ala Lys His Arg Ile Glu Arg Ala Arg Thr Arg Met

    135                 140                 145 GAA GCC GGT CTT GTC GAT CAGGAT GAT CTG GAC GAA GAG CAT CAG GGG       1892 Glu Ala Gly Leu Val Asp Gln Asp Asp Leu Asp Glu Glu His Gln Gly

150                 155                 160 CTC GCG CCA GCC GAA CTG TTC GCC AGG CTC AAG GCG CGC ATG CCC GAC      1940 Leu Ala Pro Ala Glu Leu Phe Ala Arg Leu Lys Ala Arg Met Pro Asp 165                 170                 175                 180 GGC GAG GAT CTC GTC GTG ACC CAT GGC GAT GCC TGC TTG CCG AAT ATC      1988 Gly Glu Asp Leu Val Val Thr His Gly Asp Ala Cys Leu Pro Asn Ile

            185                 190                 195 ATG GTG GAA AAT GGC CGC TTT TCT GGA TTC ATC GAC TGT GGC CGG CTG      2036 Met Val Glu Asn Gly Arg Phe Ser Gly Phe Ile Asp Cys Gly Arg Leu

        200                 205                 210 GGT GTG GCG GAC CGC TAT CAG GAC ATA GCG TTG GCT ACC CGT GAT ATT      2084 Gly Val Ala Asp Arg Tyr Gln Asp Ile Ala Leu Ala Thr Arg Asp Ile

    215                 220                 225 GCT GAA GAG CTT GGC GGC GAA TGG GCT GAC CGC TTC CTC GTG CTT TAC      2132 Ala Glu Glu Leu Gly Gly Glu Trp Ala Asp Arg Phe Leu Val Leu Tyr

230                 235                 240 GGT ATC GCC GCT CCC GAT TCG CAG CGC ATC GCC TTC TAT CGC CTT CTT      2180 Gly Ile Ala Ala Pro Asp Ser Gln Arg Ile Ala Phe Tyr Arg Leu Leu 245                 250                 255                 260 GAC GAG TTC TTC TGA GCGGGACTCT GGGGTTCGAA ATGACCGACC AAGCGACGCC      2235 Asp Glu Phe Phe

        264 CGC CAT GCC AAG CCT GTT CTC GTG CAA AGT CCT GTG GGT GAG TCG AAC      2283

His Ala Lys Pro Val Leu Val Gln Ser Pro Val Gly Glu Ser Asn

444 445                 450                 455 TTG GCG ATG CGC GCA CCC TAC GGA GAA GCG ATC CAC GGA CTG CTC TCT      2331 Leu Ala Met Arg Ala Pro Tyr Gly Glu Ala Ile His Gly Leu Leu Ser

460                 465                 470 GTC CTC CTT TCA ACG GAG TGT TAG AACCGTTGGT AGTGGTTTTG GACGGGCCCA      2385 Va1 Leu Leu Ser Thr Glu Cys 475                 480 481 GGAGCATGCG CTTCTGGGCC CGTTTCTTGA GTATTCATTG GATAGTCACG CGTGGTAGCT     2445 TCGAGCCTGC ACAGCTGATG AGCACCCTGG AAGGCGCGCT GTACGCGGAC GACTGGGTTC     2505 ATCTTCGCCA TTCATGACGG AACTCCGTTC CCCAGTACCG CGATGACTAT TTTGCCTCTT     2565 CCGATGTCCG ATTCCACGCC GCCTGACGCT AAGCGGGGGC GGGGGCGCCC GCATCCCAGC     2625 CCAGACAGCA ACAAATGAGT AGGCTCTTGG ATGCCGCGGC GGCTGAGATT GGTAACGGCA     2685 ATTTCGTCAA TGTGACGATG GATTCGATTG CCCGTGCTGC CGGCGTCTCA AAAAAAACGC     2745 TGTACGTCTT GGTGGCGAGC AAGGAAGAAC TCATTTCCCG GTTAGTGGCT CGAGACATGT     2805 CCAACCTTGA GGAATTC                                                                        2822 图2d: GAATTCCGCG TATCGCCCGG TTCTATCAGC GGGCCGCTTT CGAAAGTCAT GGTGTTAGCC      60 GGTAGGGTCT TTTTCTTGGC CATGCTTGTT GCCTGAACCT TCGTTGACAT AGGGCAGAGG     120 TGCGTTTGCC GCTTCGCTTC GCGATGAACC GCATCGAGAT GCTGAGGTCA GGATTTTTCC     180 TTAACTCGCG TAAGCATTCT GTCATTTTTT TGGTGGCTTT GAACAGCCTG ATGAAAGGTG     240 GTCTCGCCCT TTGAGGCCGA TTCTTGGGCG CTTGGCGGCG TCGAAGCGAT GCTCCACTAC     300 CGATTAAGAT AATTAAAATA AGGAAACCGC ATGGTTTCTT ATGTGAATTT GTCTGGCATA     360 CTCCAGCTCA AGGGCAATTT TTGGGCTATT GGCTGAGCAG TTGCCTCTAT ATGGTTATTC     420 AGAATAACAA TTGACTCCTC AGGAGGTCAG CG ATG AGC ATT CTT GGT TTG AAT       473

                                Met Ser Ile Leu Gly Leu Asn

                                  1               5 GGT GCC CCG GTC GGA GCT GAG CAG CTG GGC TCG GCT CTT GAT CGC ATG       521 Gly Ala Pro Val Gly Ala Glu Gln Leu Gly Ser Ala Leu Asp ArG Met

     10                  15                  20 AAG AAG GCG CAC CTG GAG CAG GGG CCT GCA AAC TTG GAG CTG CGT CTG       569 Lys Lys Ala His Leu Glu Gln Gly Pro Ala Asn Leu Glu Leu Arg Leu

 25                  30                  35 AGT AGG CTG GAT CGT GCG ATT GCA ATG CTT CTG GAA AAT CGT GAA GCA       617 Ser Arg Leu Asp Arg Ala Ile Ala Met Leu Leu Glu Asn Arg Glu Ala  40                  45                  50                  55 ATT GCC GAC GCG GTT TCT GCT GAC TTT GGC AAT CGC AGC CGT GAG CAA       665 Ile Ala Asp Ala Val Ser Ala Asp Phe Gly Asn Arg Ser Arg Glu Gln

             60                  65                  70 ACA CTG CTT TGC GAC ATT GCT GGC TCG GTG GCA AGC CTG AAG GAT AGC       713 Thr Leu Leu Cys Asp Ile Ala Gly Ser Val Ala Ser Leu Lys Asp Ser

         75                  80                  85 CGC GAG CAC GTG GCC AAA TGG ATG GAG CCC GAA CAT CAC AAG GCG ATG       761 Arg Glu His Val Ala Lys Trp Met Glu Pro Glu His His Lys Ala Met

     90                  95                 100 TTT CCA GGG GCG GAG GCA CGC GTT GAG TTT CAG CCG CTG GGT GTC GTT       809 Phe Pro Gly Ala Glu Ala Arg Val Glu Phe Gln Pro Leu Gly Val Val

105                 110                 115 GGG GTC ATT AGT CCC TGG AAC TTC CCT ATC GTA CTG GCC TTT GGG CCG       857 Gly Val Ile Ser Pro Trp Asn Phe Pro Ile Val Leu Ala Phe Gly Pro 120                 125                 130                 135 CTG GCC GGC ATA TTC GCA GCA GGT AAT CGC GCC ATG CTC AAG CCG TCC       905 Leu Ala Gly Ile Phe Ala Ala Gly Asn Arg Ala Met Leu Lys Pro Ser

            140                 145                 150 GAG CTT ACC CCG CGG ACT TCT GCC CTG CTT GCG GAG CTA ATT GCT CGT       953 Glu Leu Thr Pro Arg Thr Ser Ala Leu Leu Ala Glu Leu Ile Ala Arg

        155                 160                 165 TAC TTC GAT GAA ACT GAG CTG ACT ACA GTG CTG GGC GAC GCT GAA GTC       1001 Tyr Phe Asp Glu Thr Glu Leu Thr Thr Val Leu Gly Asp Ala Glu Val

   170                  175                 180 GGT GCG CTG TTC AGT GCT CAG CCT TTC GAT CAT CTG ATC TTC ACC GGC       1049 Gly Ala Leu Phe Ser Ala Gln Pro Phe Asp His Leu Ile Phe Thr Gly

185                 190                 195 GGC ACT GCC GTG GCC AAG CAC ATC ATG CGT GCC GCG GCG GAT AAC CTA       1097 Gly Thr Ala Val Ala Lys His Ile Met Arg Ala Ala Ala Asp Asn Leu 200                 205                 210                 215 GTG CCC GTT ACC CTG GAA TTG GGT GGC AAA TCG CCG GTG ATC GTT TCC       1145 Val Pro Val Thr Leu Glu Leu Gly Gly Lys Ser Pro Val Ile Val Ser

            220                 225                 230 CGC AGT GCA GAT ATG GCG GAC GTT GCA CAA CGG GTG TTG ACG GTG AAA       1193 Arg Ser Ala Asp Met Ala Asp Val Ala Gln Arg Val Leu Thr Val Lys

        235                 240                 245 ACC TTC AAT GCC GGG CAA ATC TGT CTG GCA CCG GAC TAT GTG CTG GGG       1241 Thr Phe Asn Ala Gly Gln Ile Cys Leu Ala Pro Asp Tyr Val Leu

    250                 255                 260     262 GAGAGGCGGT TTGCGTATTG GGCGCATGCA TAAAAACTGT TGTAATTCAT TAAGCATTCT     1301 GCCGACATGG AAGCCATCAC AAACGGCATG ATGAACCTGA ATCGCCAGCG GCATCAGCAC     1361 CTTGTCGCCT TGCGTATAAT ATTTGCCCAT GGACGCACAC CGTGGAAACG GATGAAGGCA     1421 CGAACCCAGT TGACATAAGC CTGTTCGGTT CGTAAACTGT AATGCAAGTA GCGTATGCGC     1481 TCACGCAACT GGTCCAGAAC CTTGACCGAA CGCAGCGGTG GTAACGGCGC AGTGGCGGTT     1541 TTCATGGCTT GTTATGACTG TTTTTTTGTA CAGTCTATGC CTCGGGCATC CAAGCAGCAA     1601 GCGCGTTACG CCGTGGGTCG ATGTTTGATG TTATGGAGCA GCAACG ATG TTA CGC        1656

                                               Met Leu Arg

                                                 1 AGC AGC AAC GAT GTT ACG CAG CAG GGC AGT CGC CCT AAA ACA AAG TTA       1704 Ser Ser Asn Asp Val Thr Gln Gln Gly Ser Arg Pro Lys Thr Lys Leu

  5                  10                  15 GGT GGC TCA AGT ATG GGC ATC ATT CGC ACA TGT AGG CTC GGC CCT GAC       1752 Gly Gly Ser Ser Met Gly Ile Ile Arg Thr Cys Arg Leu Gly Pro Asp  20                  25                  30                  35 CAA GTC AAA TCC ATG CGG GCT GCT CTT GAT CTT TTC GGT CGT GAG TTC       1800 Gln Val Lys Ser Met Arg Ala Ala Leu Asp Leu Phe Gly Arg Glu Phe

            40                   45                  50 GGA GAC GTA GCC ACC TAC TCC CAA CAT CAG CCG GAC TCC GAT TAC CTC       1848 Gly Asp Val Ala Thr Tyr Ser Gln His Gln Pro Asp Ser Asp Tyr Leu

         55                  60                  65 GGG AAC TTG CTC CGT AGT AAG ACA TTC ATC GCG CTT GCT GCC TTC GAC       1896 Gly Asn Leu Leu Arg Ser Lys Thr Phe Ile Ala Leu Ala Ala Phe Asp

     70                  75                  80 CAA GAA GCG GTT GTT GGC GCT CTC GCG GCT TAC GTT CTG CCC AGG TTT       1944 Gln Glu Ala Val Val Gly Ala Leu Ala Ala Tyr Val Leu Pro Arg Phe

 85                  90                  95 GAG CAG CCG CGT AGT GAG ATC TAT ATC TAT GAT CTC GCA GTC TCC GGC       1992 Glu Gln Pro Arg Ser Glu Ile Tyr Ile Tyr Asp Leu Ala Val Ser Gly 100                     105             110                 115 GAG CAC CGG AGG CAG GGC ATT GCC ACC GCG CTC ATC AAT CTC CTC AAG       2040 Glu His Arg Arg Gln Gly Ile Ala Thr Ala Leu Ile Asn Leu Leu Lys

            120                 125                 130 CAT GAG GCC AAC GCG CTT GGT GCT TAT GTG ATC TAC GTG CAA GCA GAT       2088 His Glu Ala Asn Ala Leu Gly Ala Tyr Val Ile Tyr Val Gln Ala Asp

            135             140                 145 TAC GGT GAC GAT CCC GCA GTG GCT CTC TAT ACA AAG TTG GGC ATA CGG       2136 Tyr Gly Asp Asp Pro Ala Val Ala Leu Tyr Thr Lys Leu Gly Ile Arg

    150                 155                 160 GAA GAA GTG ATG CAC TTT GAT ATC GAC CCA AGT ACC GCC ACC TAA CAA       2184 Glu Glu Val Met His Phe Asp Ile Asp Pro Ser Thr Ala Thr

165                 170                 175     177 TTCGTTCAAG CCGAGATCGG CTTCCCTG CAA AGT CCT GTG GGT GAG TCG AAC        2236

                           Gln Ser Pro Val Gly Glu Ser Asn

                           451             455 TTG GCG ATG CGC GCA CCC TAC GGA GAA GCG ATC CAC GGA CTG CTC TCT       2284 Leu Ala Met Arg Ala Pro Tyr Gly Glu Ala Ile His Gly Leu Leu Ser

460                 465                 470 GTC CTC CTT TCA ACG GAG TGT TAG AACCGTTGGT AGTGGTTTTG GACGGGCCCA      2338 Val Leu Leu Ser Thr Glu Cys 475                 480 481 GGAGCATGCG CTTCTGGGCC CGTTTCTTGA GTATTCATTG GATAGTCACG CGTGGTAGCT     2398 TCGAGCCTGC ACAGCTGATG AGCACCCTGG AAGGCGCGCT GTACGCGGAC GACTGGGTTC     2458 ATCTTCGCCA TTCATGACGG AACTCCGTTC CCCAGTACCG CGATGACTAT TTTGCCTCTT     2518 CCGATGTCCG ATTCCACGCC GCCTGACGCT AAGCGGGGGC GGGGGCGCCC GCATCCCAGC     2578 CCAGACAGCA ACAAATGAGT AGGCTCTTGG ATGCCGCGGC GGCTGAGATT GGTAACGGCA     2638 ATTTCGTCAA TGTGACGATG GATTCGATTG CCCGTGCTGC CGGCGTCTCA AAAAAAACGC     2698 TGTACGTCTT GGTGGCGAGC AAGGAAGAAC TCATTTCCCG GTTAGTGGCT CGAGACATGT     2758 CCAACCTTGA GGAATTC                                                    2775 图2e: GAATTCCGCG TATCGCCCGG TTCTATCAGC GGGCCGCTTT CGAAAGTCAT GGTGTTAGCC      60 GGTAGGGTCT TTTTCTTGGC CATGCTTGTT GCCTGAACCT TCGTTGACAT AGGGCAGAGG     120 TGCGTTTGCC GCTTCGCTTC GCGATGAACC GCATCGAGAT GCTGAGGTCA GGATTTTTCC     180 TTAACTCGCG TAAGCATTCT GTCATTTTTT TGGTGGCTTT GAACAGCCTG ATGAAAGGTG     240 GTCTCGCCCT TTGAGGCCGA TTCTTGGGCG CTTGGCGGCG TCGAAGCGAT GCTCCACTAC     300 CGATTAAGAT AATTAAAATA AGGAAACCGC ATGGTTTCTT ATGTGAATTT GTCTGGCATA     360 CTCCAGCTCA AGGGCAATTT TTGGGCTATT GGCTGAGCAG TTGCCTCTAT ATGGTTATTC     420 AGAATAACAA TTGACTCCTC AGGAGGTCAG CG ATG AGC ATT CTT GGT TTG AAT       473

                                Met Ser Ile Leu Gly Leu Asn

                                  1               5 GGT GCC CCG GTC GGA GCT GAG CAG CTG GGC TCG GCT CTT GAT CGC ATG       521 Gly Ala Pro Val Gly Ala Glu Gln Leu Gly Ser Ala Leu Asp Arg Met

     10                  15                  20 AAG AAG GCG CAC CTG GAG CAG GGG CCT GCA AAC TTG GAG CTG CGT CTG       569 Lys Lys Ala His Leu Glu Gln Gly Pro Ala Asn Leu Glu Leu Arg Leu

 25                  30                  35 AGT AGG CTG GAT CGT GCG ATT GCA ATG CTT CTG GAA AAT CGT GAA GCA       617 Ser Arg Leu Asp Arg Ala Ile Ala Met Leu Leu Glu Asn Arg Glu Ala  40                  45                  50                  55 ATT GCC GAC GCG GTT TCT GCT GAC TTT GGC AAT CGC AGC CGT GAG CAA       665 Ile Ala Asp Ala Val Ser Ala Asp Phe Gly Asn Arg Ser Arg Glu Gln

             60                  65                  70 ACA CTG CTT TGC GAC ATT GCT GGC TCG GTG GCA AGC CTG AAG GAT AGC       713 Thr Leu Leu Cys Asp Ile Ala Gly Ser Val Ala Ser Leu Lys Asp Ser

         75                  80                  85 CGC GAG CAC GTG GCC AAA TGG ATG GAG CCC GAA CAT CAC AAG GCG ATG       761 Arg Glu His Val Ala Lys Trp Met Glu Pro Glu His His Lys Ala Met

     90                  95                 100 TTT CCA GGG GCG GAG GCA CGC GTT GAG TTT CAG CCG CTG GGT GTC GTT       809 Phe Pro Gly Ala Glu Ala Arg Val Glu Phe Gln Pro Leu Gly Val Val

105                 110                 115 GGG GTC ATT AGT CCC TGG AAC TTC CCT ATC GTA CTG GCC TTT GGG CCG       857 Gly Val Ile Ser Pro Trp Asn Phe Pro Ile Val Leu Ala Phe Gly Pro 120                 125                 130                 135 CTG GCC GGC ATA TTC GCA GCA GGT AAT CGC GCC ATG CTC AAG CCG TCC       905 Leu Ala Gly Ile Phe Ala Ala Gly Ash Arg Ala Met Leu Lys Pro Ser

            140                 145                 150 GAG CTT ACC CCG CGG ACT TCT GCC CTG CTT GCG GAG CTA ATT GCT CGT       953 Glu Leu Thr Pro Arg Thr Ser Ala Leu Leu Ala Glu Leu Ile Ala Arg

        155                 160                 165 TAC TTC GAT GAA ACT GAG CTG ACT ACA GTG CTG GGC GAC GCT GAA GTC       1001 Tyr Phe Asp Glu Thr Glu Leu Thr Thr Val Leu Gly Asp Ala Glu Val

   170                  175                 180 GGT GCG CTG TTC AGT GCT CAG CCT TTC GAT CAT CTG ATC TTC ACC GGC       1049 Gly Ala Leu Phe Ser Ala Gln Pro Phe Asp His Leu Ile Phe Thr Gly

185                 190                 195 GGC ACT GCC GTG GCC AAG CAC ATC ATG CGT GCC GCG GCG GAT AAC CTA       1097 Gly Thr Ala Val Ala Lys His Ile Met Arg Ala Ala Ala Asp Asn Leu 200                 205                 210                 215 GTG CCC GTT ACC CTG GAA TTG GGT GGC AAA TCG CCG GTG ATC GTT TCC       1145 Val Pro Val Thr Leu Glu Leu Gly Gly Lys Ser Pro Val Ile Val Ser

            220                 225                 230 CGC AGT GCA GAT ATG GCG GAC GTT GCA CAA CGG GTG TTG ACG GTG AAA       1193 Arg Ser Ala Asp Met Ala Asp Val Ala Gln Arg Val Leu Thr Val Lys

        235                 240                 245 ACC TTC AAT GCC GGG CAA ATC TGT CTG GCA CC GTG GGT GAG TCG AAC        1240 Thr Phe Asn Ala Gly Gln Ile Cys Leu Ala    Val Gly Glu Ser Asn

    250                 255     257    454 455 TTG GCG ATG CGC GCA CCC TAC GGA GAA GCG ATC CAC GGA CTG CTC TCT       1288 Leu Ala Met ArG Ala Pro Tyr Gly Glu Ala Ile His Gly Leu Leu Ser

460                 465                 470 GTC CTC CTT TCA ACG GAG TGT TAG AACCGTTGGT AGTGGTTTTG GACGGGCCCA      1342 Val Leu Leu Ser Thr Glu Cys 475                 480 481 GGAGCATGCG CTTCTGGGCC CGTTTCTTGA GTATTCATTG GATAGTCACG CGTGGTAGCT     1402 TCGAGCCTGC ACAGCTGATG AGCACCCTGG AAGGCGCGCT GTACGCGGAC GACTGGGTTC     1462 ATCTTCGCCA TTCATGACGG AACTCCGTTC CCCAGTACCG CGATGACTAT TTTGCCTCTT     1522 CCGATGTCCG ATTCCACGCC GCCTGACGCT AAGCGGGGGC GGGGGCGCCC GCATCCCAGC     1582 CCAGACAGCA ACAAATGAGT AGGCTCTTGG ATGCCGCGGC GGCTGAGATT GGTAACGGCA     1642 ATTTCGTCAA TGTGACGATG GATTCGATTG CCCGTGCTGC CGGCGTCTCA AAAAAAACGC     1702 TGTACGTCTT GGTGGCGAGC AAGGAAGAAC TCATTTCCCG GTTAGTGGCT CGAGACATGT     1762 CCAACCTTGA GGAATTC                                                                                                                                                 1779 图2f: CTGCAGCCGA GCATCGATTG AGCACTTTAC CCAGCTGCGC TGGCTGACCA TTCAGAATGG       60 CCCGCGGCAC TATCCAATCT AAATCGATCT TCGGGCGCCG CGGGCATCAT GCCCGCGGCG      120 CTCGCCTCAT TTCAATCTCT AACTTGATAA AAACAGAGCT GTTCTCCGGT CTTGGTGGAT      180 CAAGGCCAGT CGCGGAGAGT CTCGAAGAGG AGAGTACAGT GAACGCCGAG TCCACATTGC      240 AACCGCAGGC ATCATCATGC TCTGCTCAGC CACGCTACCG CAGTGTGTCG ATTGGTCATC      300 CTCCGGTTGA GGTTACGCAA GACGCTGGAG GTATTGTCCG G ATG CGT TCT CTC GAG      356

                                          Met Arg Ser Leu Glu

                                            1               5 GCG CTT CTT CCC TTC CCG GGT CGA ATT CTT GAG CGT CTC GAG CAT TGG       404 Ala Leu Leu Pro Phe Pro Gly Arg Ile Leu Glu Arh Leu glu His Trp

             10                  15                  20 GCT AAG ACC CGT CCA GAA CAA ACC TGC GTT GCT GCC AGG GCG GCA AAT       452 Ala Lys Thr Arg Pro Glu Gln Thr Cys Val Ala Ala Arg Ala Ala Asn

         25                  30                  35 GGG GAA TGG CGT CGT ATC AGC TAC GCG GAA ATG TTC CAC AAC GTC CGC       500 Gly Glu Trp Arg Arg Ile Ser Tyr Ala Glu Met Phe His Asn Val Arg

     40                  45                  50 GCC ATC GCA CAG AGC TTG CTT CCT TAC GGA CTA TCG GCA GAG CGT CCG       548 Ala Ile Ala Gln Ser Leu Leu Pro Tyr Gly Leu Ser Ala Glu Arg Pro

 55                  60                  65 CTG CTT ATC GTC TCT GGA AAT GAC CTG GAA CAT CTT CAG CTG GCA TTT       596 Leu Leu Ile Val Ser Gly Asn Asp Leu Glu His Leu Gln Leu Ala Phe  70                  75                  80                  85 GGG GCT ATG TAT GCG GGC ATT CCC TAT TGC CCG GTG TCT CCT GCT TAT       644 Gly Ala Met Tyr Ala Gly Ile Pro Tyr Cys Pro Val Ser Pro Ala Tyr

             90                  95                  100 TCA CTG CTG TCG CAA GAT TTG GCG AAG CTG CGT CAC ATC GTA GGT CTT       692 Ser Leu Leu Ser Gln Asp Leu Ala Lys Leu Arg HisIle Val Gly Leu

        105                 110                115 CTG CAA CCG GGA CTG GTC TTT GCT GCC GAT GCA GCA CCT TTC CAG GGG       740 Leu Gln Pro Gly Leu Val Phe Ala Ala Asp Ala A la Pro Phe Gln

    120                 125                  130     132 ACAGCAAGCG AACCGGAATT GCCAGCTGGG GCGCCCTCTG GTAAGGTTGG GAAGCCCTGC     800 AAAGTAAACT GGATGGCTTT CTTGCCGCCA AGGATCTGAT GGCGCAGGGG ATCAAGATCT     860 GATCAAGAGA CAGGATGAGG ATCGTTTCGC ATG ATT GAA CAA GAT GGA TTG CAC      914

                             Met Ile Glu Gln Asp Gly Leu His

                               1               5 GCA GGT TCT CCG GCC GCT TGG GTG GAG AGG CTA TTC GGC TAT GAC TGG       962 Ala Gly Ser Pro Ala Ala Trp Val Glu Arg Leu Phe Gly Tyr Asp Trp

 10                  15                  20 GCA CAA CAG ACA ATC GGC TGC TCT GAT GCC GCC GTG TTC CGG CTG TCA       1010 Ala Gln Gln Thr Ile Gly Cys Ser Asp Ala Ala Val Phe Arg Leu Ser  25                  30                  35                  40 GCG CAG GGG CGC CCG GTT CTT TTT GTC AAG ACC GAC CTG TCC GGT GCC       1058 Ala Gln Gly Arg Pro Val Leu Phe Val Lys Thr Asp Leu Ser Gly Ala

             45                  50                  55 CTG AAT GAA CTG CAG GAC GAG GCA GCG CGG CTA TCG TGG CTG GCC ACG       1106 Leu Asn Glu Leu Gln Asp Glu Ala Ala Arg Leu Ser Trp Leu Ala Thr

         60                  65                  70 ACG GGC GTT CCT TGC GCA GCT GTG CTC GAC GTT GTC ACT GAA GCG GGA       1154 Thr Gly Val Pro Cys Ala Ala Val Leu Asp Val Val Thr Glu Ala Gly

     75                  80                  85 AGG GAC TGG CTG CTA TTG GGC GAA GTG CCG GGG CAG GAT CTC CTG TCA       1202 Arg Asp Trp Leu Leu Leu Gly Glu Val Pro Gly Gln Asp Leu Leu Ser

 90                  95                 100 TCT CAC CTT GCT CCT GCC GAG AAA GTA TCC ATC ATG GCT GAT GCA ATG       1250 Ser His Leu Ala Pro Ala Glu Lys Val Ser Ile Met Ala Asp Ala Met 105                 110                 115                 120 CGG CGG CTG CAT ACG CTT GAT CCG GCT ACC TGC CCA TTC GAC CAC CAA       1298 Arg Arg Leu His Thr Leu Asp Pro Ala Thr Cys Pro Phe Asp His Gln

            125                 130                 135 GCG AAA CAT CGC ATC GAG CGA GCA CGT ACT CGG ATG GAA GCC GGT CTT       1346 Ala Lys His Arg Ile Glu Arg Ala Arg Thr Arg Met Glu Ala Gly Leu

        140                 145                 150 GTC GAT CAG GAT GAT CTG GAC GAA GAG CAT CAG GGG CTC GCG CCA GCC       1394 Val Asp Gln Asp Asp Leu Asp Glu Glu His Gln Gly Leu Ala Pro Ala

    155                 160                 165 GAA CTG TTC GCC AGG CTC AAG GCG CGC ATG CCC GAC GGC GAG GAT CTC       1442 Glu Leu Phe Ala Arg Leu Lys Ala Arg Met Pro Asp Gly Glu Asp Leu

170                 175                 180 GTC GTG ACC CAT GGC GAT GCC TGC TTG CCG AAT ATC ATG GTG GAA AAT       1490 Val Val Thr His Gly Asp Ala Cys Leu Pro ASn Ile Met Val Glu Asn 185                 190                 195                 200 GGC CGC TTT TCT GGA TTC ATC GAC TGT GGC CGG CTG GGT GTG GCG GAC       1538 Gly Arg Phe Ser Gly Phe Ile Asp Cys Gly Arg Leu Gly Val Ala Asp

            205                 210                 215 CGC TAT CAG GAC ATA GCG TTG GCT ACC CGT GAT ATT GCT GAA GAG CTT       1586 Arg Tyr Gln Asp Ile Ala Leu Ala Thr Arg Asp Ile Ala Glu Glu Leu

        220                 225                 230 GGC GGC GAA TGG GCT GAC CGC TTC CTC GTG CTT TAC GGT ATC GCC GCT       1634 Gly Gly Glu Trp Ala Asp Arg Phe Leu Val Leu Tyr Gly Ile Ala Ala

    235                 240                 245 CCC GAT TCG CAG CGC ATC GCC TTC TAT CGC CTT CTT GAC GAG TTC TTC       1682 Pro Asp Ser Gln Arg Ile Ala Phe Tyr Arg Leu Leu Asp Glu Phe Phe

250                 255                 260             264 TGAGCGGGAC TCTGGGGTTC GAAATGACCG ACCAAGCGAC GCCCCT GTT TTG CAA        1737

                                               Val Leu Gln

                                               563     565 TGG CGG TCG GCG AAA GTT GAT GCG CTG TAT CGT GGT GAA GAT CAA TCC       1785 Trp Arg Ser Ala Lys Val Asp Ala Leu Tyr Arg Gly Glu Asp Gln Ser

            570                 575                 580 ATG CTG CGT GAC GAG GCC ACA CTG TGA GTTGGTCAGG GGGGGCTTAC             1832 Met Leu Arg Asp Glu Ala Thr Leu

        585             589 TCGGCGTTTT CCGACACTGC GTTGGTTGCG GCAGTGCGCA CCCCCTGGAT TGATTGCGGG     1892 GGTGCCCTGT CGCTGGTGTC GCCTATCGAC TTAGGGGTAA AGGTCGCTCG CGAAGTTCTG     1952 ATGCGTGCGT CGCTTGAACC ACAAATGGTC GATAGCGTAC TCGCAGGCTC TATGGCTCAA     2012 GCAAGCTTTG ATGCTTACCT GCTCCCGCGG CACATTGGCT TGTACAGCGG TGTTCCCAAG     2072 TCGGTTCCGG CCTTGGGGGT GCAGCGCATT TGCGGCACAG GCTTCGAACT GCTTCGGCAG     2132 GCCGGCGAGC AGATTTCCCA AGGCGCTGAT CACGTGCTGT GTGTCGCGGG CTGCAG         2188 图2g: CTGCAGCCGA GCATCGATTG AGCACTTTAC CCAGCTGCGC TGGCTGACCA TTCAGAATGG      60 CCCGCGGCAC TATCCAATCT AAATCGATCT TCGGGCGCCG CGGGCATCAT GCCCGCGGCG     120 CTCGCCTCAT TTCAATCTCT AACTTGATAA AAACAGAGCT GTTCTCCGGT CTTGGTGGAT     180 CAAGGCCAGT CGCGGAGAGT CTCGAAGAGG AGAGTACAGT GAACGCCGAG TCCACATTGC     240 AACCGCAGGC ATCATCATGC TCTGCTCAGC CACGCTACCG CAGTGTGTCG ATTGGTCATC     300 CTCCGGTTGA GGTTACGCAA GACGCTGGAG GTATTGTCCG G ATG CGT TCT CTC GAG     356

                                          Met Arg Ser Leu Glu

                                            1               5 GCG CTT CTT CCC TTC CCG GGT CGA ATT CTT GAG CGT CTC GAG CAT TGG       404 Ala Leu Leu Pro Phe Pro Gly Arg Ile Leu Glu Arg Leu Glu His Trp

             10                  15                  20 GCT AAG ACC CGT CCA GAA CAA ACC TGC GTT GCT GCC AGG GCG GCA AAT       452 Ala Lys Thr Arg Pro Glu Gln Thr Cys Val Ala Ala Arg Ala Ala Asn

         25                  30                  35 GGG GAA TGG CGT CGT ATC AGC TAC GCG GAA ATG TTC CAC AAC GTC CGC       500 Gly Glu Trp Arg Arg Ile Ser Tyr Ala Glu Met Phe His Asn Val Arg

     40                  45                  50 GCC ATC GCA CAG AGC TTG CTT CCT TAC GGA CTA TCG GCA GAG CGT CCG       548 Ala Ile Ala Gln Ser Leu Leu Pro Tyr Gly Leu Ser Ala Glu Arg Pro

 55                  60                  65 CTG CTT ATC GTC TCT GGA AAT GAC CTG GAA CAT CTT CAG CTG GCA TTT       596 Leu Leu Ile Val Ser Gly Asn Asp Leu Glu His Leu Gln Leu Ala Phe  70                  75                  80                  85 GGG GCT ATG TAT GCG GGC ATT CCC TAT TGC CCG GTG TCT CCT GCT TAT       644 Gly Ala Met Tyr Ala Gly Ile Pro Tyr Cys Pro Val Ser Pro Ala Tyr

             90                  95                 100 TCA CTG CTG TCG CAA GAT TTG GCG AAG CTG CGT CAC ATC GTA GGT CTT       692 Ser Leu Leu Ser Gln Asp Leu Ala Lys Leu Arg His Ile Val Gly Leu

        105                 110                 115 CTG CAA CCG GGA CTG GTC TTT GCT GCC GAT GCA GCA CCT TTC CAG GGG       740 Leu Gln Pro Gly Leu Val Phe Ala Ala Asp Ala Ala Pro Phe Gln

    120                 125                 130     132 GAGAGGCGGT TTGCGTATTG GGCGCATGCA TAAAAACTGT TGTAATTCAT TAAGCATTCT     800 GCCGACATGG AAGCCATCAC AAACGGCATG ATGAACCTGA ATCGCCAGCG GCATCAGCAC     860 CTTGTCGCCT TGCGTATAAT ATTTGCCCAT GGACGCACAC CGTGGAAACG GATGAAGGCA     920 CGAACCCAGT TGACATAAGC CTGTTCGGTT CGTAAACTGT AATGCAAGTA GCGTATGCGC     980 TCACGCAACT GGTCCAGAAC CTTGACCGAA CGCAGCGGTG GTAACGGCGC AGTGGCGGTT    1040 TTCATGGCTT GTTATGACTG TTTTTTTGTA CAGTCTATGC CTCGGGCATC CAAGCAGCAA    1100 GCGCGTTACG CCGTGGGTCG ATGTTTGATG TTATGGAGCA GCAACG ATG TTA CGC        1155

                                               Met Leu Arg

                                                 1 AGC AGC AAC GAT GTT ACG CAG CAG GGC AGT CGC CCT AAA ACA AAG TTA       1203 Ser Ser Asn Asp Val Thr Gln Gln Gly Ser Arg Pro Lys Thr Lys Leu

  5                  10                  15 GGT GGC TCA AGT ATG GGC ATC ATT CGC ACA TGT AGG CTC GGC CCT GAC       1251 Gly Gly Ser Ser Met Gly Ile Ile Arg Thr Cys Arg Leu Gly Pro Asp  20                  25                  30                  35 CAA GTC AAA TCC ATG CGG GCT GCT CTT GAT CTT TTC GGT CGT GAG TTC       1299 Gln Val Lys Ser Met Arg Ala Ala Leu Asp Leu Phe Gly Arg Glu Phe

             40                  45                  50 GGA GAC GTA GCC ACC TAC TCC CAA CAT CAG CCG GAC TCC GAT TAC CTC       1347 Gly Asp Val Ala Thr Tyr Ser Gln His Gln Pro Asp Ser Asp Tyr Leu

         55                  60                  65 GGG AAC TTG CTC CGT AGT AAG ACA TTC ATC GCG CTT GCT GCC TTC GAC       1395 Gly Asn Leu Leu Arg Ser Lys Thr Phe Ile Ala Leu Ala Ala Phe Asp

     70                  75                  80 CAA GAA GCG GTT GTT GGC GCT CTC GCG GCT TAC GTT CTG CCC AGG TTT       1443 Gln Glu Ala Val Val Gly Ala Leu Ala Ala Tyr Val Leu Pro Arg Phe

 85                  90                  95 GAG CAG CCG CGT AGT GAG ATC TAT ATC TAT GAT CTC GCA GTC TCC GGC       1491 Glu Gln Pro Arg Ser Glu Ile Tyr Ile Tyr Asp Leu Ala Val Ser Gly 100                 105                 110                 115 GAG CAC CGG AGG CAG GGC ATT GCC ACC GCG CTC ATC AAT CTC CTC AAG       1539 Glu His Arg Arg Gln Gly Ile Ala Thr Ala Leu Ile Asn Leu Leu Lys

            120                 125                 130 CAT GAG GCC AAC GCG CTT GGT GCT TAT GTG ATC TAC GTG CAA GCA GAT       1587 His Glu Ala Asn Ala Leu Gly Ala Tyr Val Ile Tyr Val Gln Ala Asp

        135                 140                 145 TAC GGT GAC GAT CCC GCA GTG GCT CTC TAT ACA AAG TTG GGC ATA CGG       1635 Tyr Gly Asp Asp Pro Ala Val Ala Leu Tyr Thr Lys Leu Gly Ile Arg

    150                 155                 160 GAA GAA GTG ATG CAC TTT GAT ATC GAC CCA AGT ACC GCC ACC TAA CAA       1683 Glu Glu Val Met His Phe Asp Ile Asp Pro Ser Thr Ala Thr

165                 170                 175     177 TTCGTTCAAG CCGAGATCGG CTTCCCCT GTT TTG CAA TGG CGG TCG GCG AAA        1735

                           Val Leu Gln Trp Arg Ser Ala Lys

                           563     565                 570 GTT GAT GCG CTG TAT CGT GGT GAA GAT CAA TCC ATG CTG CGT GAC GAG       1783 Val Asp Ala Leu Tyr Arg Gly Glu Asp Gln Ser Met Leu Arg Asp Glu

            575                 580                 585 GCC ACA CTG TGA GTTGGTCAGG GGGGGCTTAC TCGGCGTTTT CCGACACTGC           1835 Ala Thr Leu

    589 GTTGGTTGCG GCAGTGCGCA CCCCCTGGAT TGATTGCGGG GGTGCCCTGT CGCTGGTGTC     1895 GCCTATCGAC TTAGGGGTAA AGGTCGCTCG CGAAGTTCTG ATGCGTGCGT CGCTTGAACC     1955 ACAAATGGTC GATAGCGTAC TCGCAGGCTC TATGGCTCAA GCAAGCTTTG ATGCTTACCT     2015 GCTCCCGCGG CACATTGGCT TGTACAGCGG TGTTCCCAAG TCGGTTCCGG CCTTGGGGGT     2075 GCAGCGCATT TGCGGCACAG GCTTCGAACT GCTTCGGCAG GCCGGCGAGC AGATTTCCCA     2135 AGGCGCTGAT CACGTGCTGT GTGTCGCGGG CTGCAG                               2171 图2h: CTGCAGCCGA GCATCGATTG AGCACTTTAC CCAGCTGCGC TGGCTGACCA TTCAGAATGG      60 CCCGCGGCAC TATCCAATCT AAATCGATCT TCGGGCGCCG CGGGCATCAT GCCCGCGGCG     120 CTCGCCTCAT TTCAATCTCT AACTTGATAA AAACAGAGCT GTTCTCCGGT CTTGGTGGAT     180 CAAGGCCAGT CGCGGAGAGT CTCGAAGAGG AGAGTACAGT GAACGCCGAG TCCACATTGC     240 AACCGCAGGC ATCATCATGC TCTGCTCAGC CACGCTACCG CAGTGTGTCG ATTGGTCATC     300 CTCCGGTTGA GGTTACGCAA GACGCTGGAG GTATTGTCCG G ATG CGT TCT CTC GAG     356

                                          Met Arg Ser Leu Glu

                                          1                 5 GCG CTT CTT CCC TTC CCG GGT CGA ATT CTT GAG CGT CTC GAG CAT TGG       404 Ala Leu Leu Pro Phe Pro Gly Arg Ile Leu Glu Arg Leu Glu His Trp

             10                  15                  20 GCT AAG ACC CGT CCA GAA CAA ACC TGC GTT GCT GCC AGG GCG GCA AAT       452 Ala Lys Thr Arg Pro Glu Gln Thr Cys Val Ala Ala Arg Ala Ala Asn

         25                  30                  35 GGG GAA TGG CGT CGT ATC AGC TAC GCG GAA ATG TTC CAC AAC GTC CGC       500 Gly Glu Trp Arg Arg Ile Ser Tyr Ala Glu Met Phe His Asn Val Arg

     40                  45                  50 GCC ATC GCA CAG AGC TTG CTT CCT TAC GGA CTA TCG GCA GAG CGT CCG       548 Ala Ile Ala Gln Ser Leu Leu Pro Tyr Gly Leu Ser Ala Glu Arg Pro

 55                  60                  65 CTG CTT ATC GTC TCT GGA AAT GAC CTG GAA CAT CTT CAG CTG GCA TTT       596 Leu Leu Ile Val Ser Gly Asn Asp Leu Glu His Leu Gln Leu Ala Phe  70                  75                  80                  85 GGG GCT ATG TAT GCG GGC ATT CCC TAT TGC CCG GTG TCT CCT GCT TAT       644 Gly Ala Met Tyr Ala Gly Ile Pro Tyr Cys Pro Val Ser Pro Ala Tyr

             90                  95                 100 TCA CTG CTG TCG CAA GAT TTG GCG AAG CTG CGT CAC ATC GTA GGT CTT       692 Ser Leu Leu Ser Gln Asp Leu Ala Lys Leu Arg His Ile Val Gly Leu

        105                 110                 115 CTG CAA CCG GGA CTG GTC TTT GCT GCC GAT GCA GCA CCT TTC CAG CGC       740 Leu Gln Pro Gly Leu Val Phe Ala Ala Asp Ala Ala Pro Phe Gln Arg

    120                 125                 130         133 GCT GTT TTG CAA TGG CGG TCG GCG AAA GTT GAT GCG CTG TAT CGT GGT       788 Ala Val Leu Gln Trp Arg Ser Ala Lys Val Asp Ala Leu Tyr Arg Gly 562         565                 570                 575 GAA GAT CAA TCC ATG CTG CGT GAC GAG GCC ACA CTG TGA GTTGGTCAGG        837 Glu Asp Gln Ser Met Leu Arg Asp Glu Ala Thr Leu

    580                 585             589 GGGGGCTTAC TCGGCGTTTT CCGACACTGC GTTGGTTGCG GCAGTGCGCA CCCCCTGGAT     897 TGATTGCGGG GGTGCCCTGT CGCTGGTGTC GCCTATCGAC TTAGGGGTAA AGGTCGCTCG     957 CGAAGTTCTG ATGCGTGCGT CGCTTGAACC ACAAATGGTC GATAGCGTAC TCGCAGGCTC     1017 TATGGCTCAA GCAAGCTTTG ATGCTTACCT GCTCCCGCGG CACATTGGCT TGTACAGCGG     1077 TGTTCCCAAG TCGGTTCCGG CCTTGGGGGT GCAGCGCATT TGCGGCACAG GCTTCGAACT     1137 GCTTCGGCAG GCCGGCGAGC AGATTTCCCA AGGCGCTGAT CACGTGCTGT GTGTCGCGGG     1197 CTGCAG                                                                1203 图2i: GAATTCCCCT GGCGACGAAA GGGCGGCAGG CCGCATGGCC ACGGCTGGGC GGTAACTGAT      60 GCTTGCGTTA ATCGTTAACC GTTTGAAATT CCTTGCCAAA TTTCGGCGAG AGAATCATGC     120 GGGTACGCCT TTCCGTGCGC TTTGATCTGC GCTTCCGTGC CTTGAATCAG AAAAATAGTT     180 AATTGACAGA ACTATAGGTT CGCAGTAGCT TTTGCTCACC CACCAAATCC ACAGCACTGG     240 GGTGCACG ATG AAT AGC TAC GAT GGC CGT TGG TCT ACC GTT GAT GTG AAG      290

     Met Asn Ser Tyr Asp Gly Arg Trp Ser Thr Val Asp Val Lys

       1               5                  10 GTT GAA GAA GGT ATC GCT TGG GTC ACG CTG AAC CGC CCG GAG AAG CGC       338 Val Glu Glu Gly Ile Ala Trp Val Thr Leu Asn Arg Pro Glu Lys Arg  15                  20                  25                  30 AAC GCA ATG AGC CCA ACT CTC AAT CGA GAG ATG GTC GAG GTT CTG GAG       386 Asn Ala Met Ser Pro Thr Leu Asn Arg Glu Met Val Glu Val Leu Glu

             35                  40                  45 GTG CTG GAG CAG GAC GCA GAT GCT CGC GTG CTT GTT CTG ACT GGT GCA       434 Val Leu Glu Gln Asp Ala Asp Ala Arg Val Leu Val Leu Thr Gly Ala

         50                  55                  60 GGC GAA TCC TGG ACC GCG GGC ATG GAC CTG AAG GAG TAT TTC CGC GAG       482 Gly Glu Ser Trp Thr Ala Gly Met Asp Leu Lys Glu Tyr Phe Arg Glu

     65                  70                  75 ACC GAT GCT GGC CCC GAA ATT CTG CAA GAG AAG ATT CGT CGGGGACAGC        531 Thr Asp Ala Gly Pro Glu Ile Leu Gln Glu Lys Ile Arg

 80                  85                  90  91 AAGCGAACCG GAATTGCCAG CTGGGGCGCC CTCTGGTAAG GTTGGGAAGC CCTGCAAAGT     591 AAACTGGATG GCTTTCTTGC CGCCAAGGAT CTGATGGCGC AGGGGATCAA GATCTGATCA     651 AGAGACAGGA TGAGGATCGT TTCGC ATG ATT GAA CAA GAT GGA TTG CAC GCA       703

                        Met Ile Glu Gln Asp Gly Leu His Ala

                          1               5 GGT TCT CCG GCC GCT TGG GTG GAG AGG CTA TTC GGC TAT GAC TGG GCA       751 Gly Ser Pro Ala Ala Trp Val Glu Arg Leu Phe Gly Tyr Asp Trp Ala  10                  15                  20                  25 CAA CAG ACA ATC GGC TGC TCT GAT GCC GCC GTG TTC CGG CTG TCA GCG       799 Gln Gln Thr Ile Gly Cys Ser Asp Ala Ala Val Phe Arg Leu Ser Ala

             30                  35                  40 CAG GGG CGC CCG GTT CTT TTT GTC AAG ACC GAC CTG TCC GGT GCC CTG       847 Gln Gly Arg Pro Val Leu Phe Val Lys Thr Asp Leu Ser Gly Ala Leu

         45                  50                  55 AAT GAA CTG CAG GAC GAG GCA GCG CGG CTA TCG TGG CTG GCC ACG ACG       895 ASn Glu Leu Gln Asp Glu Ala Ala Arg Leu Ser Trp Leu Ala Thr Thr

     60                  65                  70 GGC GTT CCT TGC GCA GCT GTG CTC GAC GTT GTC ACT GAA GCG GGA AGG        943 Gly Val Pro Cys Ala Ala Val Leu Asp Val Val Thr Glu Ala Gly Arg

 75                  80                  85 GAC TGG CTG CTA TTG GGC GAA GTG CCG GGG CAG GAT CTC CTG TCA TCT        991 Asp Trp Leu Leu Leu Gly Glu Val Pro Gly Gln Asp Leu Leu Ser Ser  90                  95                 100                 105 CAC CTT GCT CCT GCC GAG AAA GTA TCC ATC ATG GCT GAT GCA ATG CGG       1039 His Leu Ala Pro Ala Glu Lys Val Ser Ile Met Ala Asp Ala Met Arg

            110                 115                 120 CGG CTG CAT ACG CTT GAT CCG GCT ACC TGC CCA TTC GAC CAC CAA GCG       1087 Arg Leu His Thr Leu Asp Pro Ala Thr Cys Pro Phe Asp His Gln Ala

        125                 130                 135 AAA CAT CGC ATC GAG CGA GCA CGT ACT CGG ATG GAA GCC GGT CTT GTC       1135 Lys His Arg Ile Glu Arg Ala Arg Thr Arg Met Glu Ala Gly Leu Val

    140                 145                 150 GAT CAG GAT GAT CTG GAC GAA GAG CAT CAG GGG CTC GCG CCA GCC GAA       1183 Asp Gln Asp Asp Leu Asp Glu Glu His Gln Gly Leu Ala Pro Ala Glu

155                 160                 165 CTG TTC GCC AGG CTC AAG GCG CGC ATG CCC GAC GGC GAG GAT CTC GTC       1231 Leu Phe Ala Arg Leu Lys Ala Arg Met Pro Asp Gly Glu Asp Leu Val 170                 175                 180                 185 GTG ACC CAT GGC GAT GCC TGC TTG CCG AAT ATC ATG GTG GAA AAT GGC       1279 Val Thr His Gly Asp Ala Cys Leu Pro Asn Ile Met Val Glu Asn Gly

            190                 195                 200 CGC TTT TCT GGA TTC ATC GAC TGT GGC CGG CTG GGT GTG GCG GAC CGC       1327 Arg Phe Ser Gly Phe Ile Asp Cys Gly Arg Leu Gly Val Ala Asp Arg

        205                 210                 215 TAT CAG GAC ATA GCG TTG GCT ACC CGT GAT ATT GCT GAA GAG CTT GGC       1375 Tyr Gln Asp Ile Ala Leu Ala Thr Arg Asp Ile Ala Glu Glu Leu Gly

    220                 225                 230 GGC GAA TGG GCT GAC CGC TTC CTC GTG CTT TAC GGT ATC GCC GCT CCC       1423 Gly Glu Trp Ala Asp Arg Phe Leu Val Leu Tyr Gly Ile Ala Ala Pro

235                 240                 245 GAT TCG CAG CGC ATC GCC TTC TAT CGC CTT CTT GAC GAG TTC TTC TGA       1471 Asp Ser Gln Arg Ile Ala Phe Tyr Arg Leu Leu Asp Glu Phe Phe 250                 255                 260             264 GCGGGACTCT GGGGTTCGAA ATGACCGACC AAGCGACGCC CC GAG CAG GGC ATG        1525

                                           Glu Gln Gly Met

                                           255 AAG CAG TTC CTT GAC GAG AAA AGC ATC AAG CCG GGC TTG CAG ACC TAC       1573 Lys Gln Phe Leu Asp Glu Lys Ser Ile Lys Pro Gly Leu Gln Thr Tyr

260                 265                 270 AAG CGC TGA TAAATGCGCC GGGGCCCTCG CTGCGCCCCC GGCCTTCCAA TAATGACAAT    1632 Lys Arg 275 276 AATGAGGAGT GCCCAATGTT TCACGTGCCC CTGCTTATTG GTGGTAAGCC TTGTTCAGCA     1692 TCTGATGAGC GCACCTTCGA GCGTCGTAGC CCGCTGACCG GAGAAGTGGT ATCGCGCGTC     1752 GCTGCTGCCA GTTTGGAAGA TGCGGACGCC GCAGTGGCCG CTGCACAGGC TGCGTTTCCT     1812 GAATGGGCGG CGCTTGCTCC GAGCGAACGC CGTGCCCGAC TGCTGCGAGC GGCGGATCTT     1872 CTAGAGGACC GTTCTTCCGA GTTCACCGCC GCAGCGAGTG AAACTGGCGC AGCGGGAAAC     1932 TGGTATGGGT TTAACGTTTA CCTGGCGGCG GGCATGTTGC GGGGAATTC                 1981 图2j: GAATTCCCCT GGCGACGAAA GGGCGGCAGG CCGCATGGCC ACGGCTGGGC GGTAACTGAT      60 GCTTGCGTTA ATCGTTAACC GTTTGAAATT CCTTGCCAAA TTTCGGCGAG AGAATCATGC     120 GGGTACGCCT TTCCGTGCGC TTTGATCTGC GCTTCCGTGC CTTGAATCAG AAAAATAGTT     180 AATTGACAGA ACTATAGGTT CGCAGTAGCT TTTGCTCACC CACCAAATCC ACAGCACTGG     240 GGTGCACG ATG AAT AGC TAC GAT GGC CGT TGG TCT ACC GTT GAT GTG AAG      290

     Met Asn Ser Tyr Asp Gly Arg Trp Ser Thr Val Asp Val Lys

       1               5                  10 GTT GAA GAA GGT ATC GCT TGG GTC ACG CTG AAC CGC CCG GAG AAG CGC       338 Val Glu Glu Gly Ile Ala Trp val Thr Leu Asn Arg Pro Glu Lys Arg  15                  20                  25                  30 AAC GCA ATG AGC CCA ACT CTC AAT CGA GAG ATG GTC GAG GTT CTG GAG       386 Asn Ala Met Ser Pro Thr Leu Asn Arg Glu Met Val Glu Val Leu Glu

             35                  40                  45 GTG CTG GAG CAG GAC GCA GAT GCT CGC GTG CTT GTT CTG ACT GGT GCA       434 Val Leu Glu Gln Asp Ala Asp Ala Arg Val Leu Val Leu Thr Gly Ala

         50                  55                  60 GGC GAA TCC TGG ACC GCG GGC ATG GAC CTG AAG GAG TAT TTC CGC GAG       482 Gly Glu Ser Trp Thr Ala Gly Met Asp Leu Lys Glu Tyr Phe Arg Glu

     65                  70                  75 ACC GAT GCT GGC CCC GAA ATT CTG CAA GAG AAG ATT CGT CGGGGGAGAG        531 Thr Asp Ala Gly Pro Glu Ile Leu Gln Glu Lys Ile Arg

 80                  85                  90  91 GCGGTTTGCG TATTGGGCGC ATGCATAAAA ACTGTTGTAA TTCATTAAGC ATTCTGCCGA     591 CATGGAAGCC ATCACAAACG GCATGATGAA CCTGAATCGC CAGCGGCATC AGCACCTTGT     651 CGCCTTGCGT ATAATATTTG CCCATGGACG CACACCGTGG AAACGGATGA AGGCACGAAC     711 CCAGTTGACA TAAGCCTGTT CGGTTCGTAA ACTGTAATGC AAGTAGCGTA TGCGCTCACG     771 CAACTGGTCC AGAACCTTGA CCGAACGCAG CGGTGGTAAC GGCGCAGTGG CGGTTTTCAT     831 GGCTTGTTAT GACTGTTTTT TTGTACAGTC TATGCCTCGG GCATCCAAGC AGCAAGCGCG     891 TTACGCCGTG GGTCGATGTT TGATGTTATG GAGCAGCAAC G ATG TTA CGC AGC AGC     947

                                          Met Leu Arg Ser Ser

                                            1               5 AAC GAT GTT ACG CAG CAG GGC AGT CGC CCT AAA ACA AAG TTA GGT GGC       995 Asn Asp Val Thr Gln Gln Gly Ser Arg Pro Lys Thr Lys Leu Gly Gly

             10                  15                  20 TCA AGT ATG GGC ATC ATT CGC ACA TGT AGG CTC GGC CCT GAC CAA GTC      1043 Ser Ser Met Gly Ile Ile Arg Thr Cys Arg Leu Gly Pro Asp Gln Val

         25                  30                  35 AAA TCC ATG CGG GCT GCT CTT GAT CTT TTC GGT CGT GAG TTC GGA GAC       1091 Lys Ser Met Arg Ala Ala Leu Asp Leu Phe Gly Arg Glu Phe Gly Asp

     40                  45                  50 GTA GCC ACC TAC TCC CAA CAT CAG CCG GAC TCC GAT TAC CTC GGG AAC       1139 Val Ala Thr Tyr Ser Gln His Gln Pro Asp Ser Asp Tyr Leu Gly Asn

 55                  60                  65 TTG CTC CGT AGT AAG ACA TTC ATC GCG CTT GCT GCC TTC GAC CAA GAA       1187 Leu Leu Arg Ser Lys Thr Phe Ile Ala Leu Ala Ala Phe Asp Gln Glu  70                  75                  80                  85 GCG GTT GTT GGC GCT CTC GCG GCT TAC GTT CTG CCC AGG TTT GAG CAG       1235 Ala Val Val Gly Ala Leu Ala Ala Tyr Val Leu Pro Arg Phe Glu Gln

             90                  95                 100 CCG CGT AGT GAG ATC TAT ATC TAT GAT CTC GCA GTC TCC GGC GAG CAC       1283 Pro Arg Ser Glu Ile Tyr Ile Tyr Asp Leu Ala Val Ser Gly Glu His

        105                 110                 115 CGG AGG CAG GGC ATT GCC ACC GCG CTC ATC AAT CTC CTC AAG CAT GAG       1331 Arg Arg Gln Gly Ile Ala Thr Ala Leu Ile Asn Leu Leu Lys His Glu

    120                 125                 130 GCC AAC GCG CTT GGT GCT TAT GTG ATC TAC GTG CAA GCA GAT TAC GGT       1379 Ala Asn Ala Leu Gly Ala Tyr Val Ile Tyr Val Gln Ala Asp Tyr Gly

135                 140                 145 GAC GAT CCC GCA GTG GCT CTC TAT ACA AAG TTG GGC ATA CGG GAA GAA       1427 Asp Asp Pro Ala Val Ala Leu Tyr Thr Lys Leu Gly Ile Arg Glu Glu 150                 155                 160                 165 GTG ATG CAC TTT GAT ATC GAC CCA AGT ACC GCC ACC TAA CAATTCGTTC        1476 Val Met His Phe Asp Ile Asp Pro Ser Thr Ala Thr

            170                 175     177 AAGCCGAGAT CGGCTTCCCC GAG CAG GGC ATG AAG CAG TTC CTT GAC GAG         1526

                  Glu Gln Gly Met Lys Gln Phe Leu Asp Glu

                  255                 260 AAA AGC ATC AAG CCG GGC TTG CAG ACC TAC AAG CGC TGA TAAATGCGCC        1575 Lys Ser Ile Lys Pro Gly Leu Gln Thr Tyr Lys Arg 265                 270                 275 276 GGGGCCCTCG CTGCGCCCCC GGCCTTCCAA TAATGACAAT AATGAGGAGT GCCCAATGTT     1635 TCACGTGCCC CTGCTTATTG GTGGTAAGCC TTGTTCAGCA TCTGATGAGC GCACCTTCGA     1695 GCGTCGTAGC CCGCTGACCG GAGAAGTGGT ATCGCGCGTC GCTGCTGCCA GTTTGGAAGA     1755 TGCGGACGCC GCAGTGGCCG CTGCACAGGC TGCGTTTCCT GAATGGGCGG CGCTTGCTCC     1815 GAGCGAACGC CGTGCCCGAC TGCTGCGAGC GGCGGATCTT CTAGAGGACC GTTCTTCCGA     1875 GTTCACCGCC GCAGCGAGTG AAACTGGCGC AGCGGGAAAC TGGTATGGGT TTAACGTTTA     1935 CCTGGCGGCG GGCATGTTGC GGGGAATTC                                       1964 图2k: GAATTCCCCT GGCGACGAAA GGGCGGCAGG CCGCATGGCC ACGGCTGGGC GGTAACTGAT      60 GCTTGCGTTA ATCGTTAACC GTTTGAAATT CCTTGCCAAA TTTCGGCGAG AGAATCATGC     120 GGGTACGCCT TTCCGTGCGC TTTGATCTGC GCTTCCGTGC CTTGAATCAG AAAAATAGTT     180 AATTGACAGA ACTATAGGTT CGCAGTAGCT TTTGCTCACC CACCAAATCC ACAGCACTGG     240 GGTGCACG ATG AAT AGC TAC GAT GGC CGT TGG TCT ACC GTT GAT GTG AAG      290

     Met Asn Ser Tyr Asp Gly Arg Trp Ser Thr Val Asp Val Lys

       1               5                  10 GTT GAA GAA GGT ATC GCT TGG GTC ACG CTG AAC CGC CCG GAG AAG CGC       338 Val Glu Glu Gly Ile Ala Trp Val Thr Leu Asn Arg Pro Glu Lys Arg  15                  20                  25                  30 AAC GCA ATG AGC CCA ACT CTC AAT CGA GAG ATG GTC GAG GTT CTG GAG       386 Asn Ala Met Ser Pro Thr Leu Asn Arg Glu Met Val Glu Val Leu Glu

             35                  40                  45 GTG CTG GAG CAG GAC GCA GAT GCT CGC GTG CTT GTT CTG ACT GGT GCA       434 Val Leu Glu Gln Asp Ala Asp Ala Arg Val Leu Val Leu Thr Gly Ala

         50                  55                  60 GGC GAA TCC TGG ACC GCG GGC ATG GAC CTG AAG GAG TAT TTC CGC GAG       482 Gly Glu Ser Trp Thr Ala Gly Met Asp Leu Lys Glu Tyr Phe Arg Glu

     65                  70                  75 ACC GAT GCT GGC CCC GAA ATT CTG CAA GAG AAG ATT CGT CGC GAG CAG       530 Thr Asp Ala Gly Pro Glu Ile Leu Gln Glu Lys Ile Arg Arg Glu Gln

 80                  85                  90      92 255 GGC ATG AAG CAG TTC CTT GAC GAG AAA AGC ATC AAG CCG GGC TTG CAG       578 Gly Met Lys Gln Phe Leu Asp Glu Lys Ser Ile Lys Pro Gly Leu Gln

        260                 265                 270 ACC TAC AAG CGC TGA TAAATGCGCC GGGGCCCTCG CTGCGCCCCC GGCCTTCCAA       633 Thr Tyr Lys Arg

    275 276 TAATGACAAT AATGAGGAGT GCCCAATGTT TCACGTGCCC CTGCTTATTG GTGGTAAGCC     693 TTGTTCAGCA TCTGATGAGC GCACCTTCGA GCGTCGTAGC CCGCTGACCG GAGAAGTGGT     753 ATCGCGCGTC GCTGCTGCCA GTTTGGAAGA TGCGGACGCC GCAGTGGCCG CTGCACAGGC     813 TGCGTTTCCT GAATGGGCGG CGCTTGCTCC GAGCGAACGC CGTGCCCGAC TGCTGCGAGC     873 GGCGGATCTT CTAGAGGACC GTTCTTCCGA GTTCACCGCC GCAGCGAGTG AAACTGGCGC     933 AGCGGGAAAC TGGTATGGGT TTAACGTTTA CCTGGCGGCG GGCATGTTGC GGGGAATTC      992 图2l: GAATTCCAAT AATGACAATA ATGAGGAGTG CCCA ATG TTT CAC GTG CCC CTG CTT      55

                                  Met Phe His Val Pro Leu Leu

                                    1               5 ATT GGT GGT AAG CCT TGT TCA GCA TCT GAT GAG CGC ACC TTC GAG CGT       103 Ile Gly Gly Lys Pro Cys Ser Ala Ser Asp Glu Arg Thr Phe Glu Arg

     10                  15                  20 CGT AGC CCG CTG ACC GGA GAA GTG GTA TCG CGC GTC GCT GCT GCC AGT       151 Arg Ser Pro Leu Thr Gly Glu Val Val Ser Arg Val Ala Ala Ala Ser

 25                  30                  35 TTG GAA GAT GCG GAC GCC GCA GTG GCC GCT GCA CAG GCT GCG TTT CCT       199 Leu Glu Asp Ala Asp Ala Ala Val Ala Ala Ala Gln Ala Ala Phe Pro  40                  45                  50                  55 GAA TGG GCG GCG CTT GCT CCG AGC GAA CGC CGT GCC CGA CTG CTG CGA       247 Glu Trp Ala Ala Leu Ala Pro Ser Glu Arg Arg Ala Arg Leu Leu Arg

             60                  65                  70 GCG GCG GAT CTT CTA GAG GAC CGT TCT TCC GAG TTC ACC GCC GCA GCG       295 Ala Ala Asp Leu Leu Glu Asp Arg Ser Ser Glu Phe Thr Ala Ala Ala

         75                  80                  85 AGT GAA ACT GGC GCA GCG GGA AAC TGG TAT GGG TTT AAC GTT TAC CTG       343 Ser Glu Thr Gly Ala Ala Gly Asn Trp Tyr Gly Phe Asn Val Tyr Leu

     90                  95                 100 GCG GCG GGC ATG TTG CGG GAA GCC GCG GCC ATG ACC ACA CAG ATT CAG       391 Ala Ala Gly Met Leu Arg Glu Ala Ala Ala Met Thr Thr Gln Ile Gln

105                 110                 115 GGC GAT GTC ATT CCG TCC AAT GTG CCC GGT AGC TTT GCC ATG GCG GTT       439 Gly Asp Val Ile Pro Ser Asn Val Pro Gly Ser Phe Ala Met Ala Val 120                 125                 130                 135 CGA CAG CCA TGT GGC GTG GTG CTC GGT ATT GCG CCT TGG AAT GCT CCG       487 Arg Gln Pro Cys Gly Val Val Leu Gly Ile Ala Pro Trp Asn Ala Pro

            140                 145                 150 GTA ATC CTT GGC GTA CGG GCT GTT GCG ATG CCG TTG GCA TGC GGC AAT       535 Val Ile Leu Gly Val ArG Ala Val Ala Met Pro Leu Ala Cys Gly Asn

        155                 160                 165 ACC GTG GTG TTG AAA AGC TCT GAG CTG AGT CCC TTT ACC CAT CGC CTG       583 Thr Val Val Leu Lys Ser Ser Glu Leu Ser Pro phe Thr His Arg Leu

    170                 175                 180 ATT GGT CAG GTG TTG CAT GAT GCT GGT CTG GGG GAT GGC GTG GTG AAT       631 Ile Gly Gln Val Leu His Asp Ala Gly Leu Gly Asp Gly Val Val Asn

185                 190                 195 GTC ATC AGC AAT GCC CCG CAA GAC GCT CCT GCG GTG GTG GAG CGA CTG       679 Val Ile Ser Asn Ala Pro Gln Asp Ala Pro Ala Val Val Glu ArG Leu 200                 205                 210                 215 ATT GCA AAT CCT GCG GTA CGT CGA GTG AAC TTC ACC GGT TCG ACC CAC       727 Ile Ala Asn Pro Ala Val Arg Arg Val Asn Phe Thr Gly Ser Thr His

            220                 225                 230 GTT GGA CGG ATC ATT GGT GAG CTG TCT GCG CGT CAT CTG AAG CCT GCT       775 Val Gly Arg Ile Ile Gly Glu Leu Ser Ala Arg His Leu Lys Pro Ala

        235                 240                 245 GTG CTG GAA TTA GGT GGT AAG GCT CCG TTC TTG GTC TTG GAC GAT GCC       823 Val Leu Glu Leu Gly Gly Lys Ala Pro Phe Leu Val Leu Asp Asp Ala

    250                 255                 260 GAC CTC GAT GCG GCG GTC GAA GCG GCG GCC TTT GGT GCC TAC TTC AAT       871 Asp Leu Asp Ala Ala Val Glu Ala Ala Ala Phe Gly Ala Tyr Phe Asn

265                 270                 275 CAG GGT CAA ATC TGC ATG TCC ACT GAG CGT CTG ATT GTG ACA GCA GTC       919 Gln Gly Gln Ile Cys Met Ser Thr Glu Arg Leu Ile Val Thr Ala Val 280                 285                 290                 295 GCA GAC GCC TTT GTT GAA AAG CTG GCG AGG AAG GTC GCC ACA CTG CGT       967 Ala Asp Ala Phe Val Glu Lys Leu Ala Arg Lys Val Ala Thr Leu Arg

            300                 305                 310 GCT GGC GAT CCT AAT GAT CCG CAA TCG GTC TTG GGT TCG TTG ATT GAT      1015 Ala Gly Asp Pro Asn Asp Pro Gln Ser Val Leu Gly Ser Leu Ile Asp

        315                 320                 325 GCC AAT GCA GGT CAA CGC ATC CAG GTT CTG GTC GAT GAT GCG CTC GGG      1063 Ala Asn Ala Gly Gln Arg Ile Gln Val Leu Val Asp Asp Ala Leu

    330                 335                 340     342 GACAGCAAGC GAACCGGAAT TGCCAGCTGG GGCGCCCTCT GGTAAGGTTG GGAAGCCCTG    1123 CAAAGTAAAC TGGATGGCTT TCTTGCCGCC AAGGATCTGA TGGCGCAGGG GATCAAGATC    1183 TGATCAAGAG ACAGGATGAG GATCGTTTCG C ATG ATT GAA CAA GAT GGA TTG       1235

                               Met Ile Glu Gln Asp Gly Leu

                                 1               5 CAC GCA GGT TCT CCG GCC GCT TGG GTG GAG AGG CTA TTC GGC TAT GAC      1283 His Ala Gly Ser Pro Ala Ala Trp Val Glu Arg Leu Phe Gly Tyr Asp

     10                  15                  20 TGG GCA CAA CAG ACA ATC GGC TGC TCT GAT GCC GCC GTG TTC CGG CTG      1331 Trp Ala Gln Gln Thr Ile Gly Cys Ser Asp Ala Ala Val Phe Arg Leu

 25                  30                  35 TCA GCG CAG GGG CGC CCG GTT CTT TTT GTC AAG ACC GAC CTG TCC GGT      1379 Ser Ala Gln Gly Arg Pro Val Leu Phe Val Lys Thr Asp Leu Ser Gly  40                  45                  50                  55 GCC CTG AAT GAA CTG CAG GAC GAG GCA GCG CGG CTA TCG TGG CTG GCC      1427 Ala Leu Asn Glu Leu Gln Asp Glu Ala Ala Arg Leu Ser Trp Leu Ala

             60                  65                  70 ACG ACG GGC GTT CCT TGC GCA GCT GTG CTC GAC GTT GTC ACT GAA GCG       1475 Thr Thr Gly Val Pro Cys Ala Ala Val Leu Asp Val Val Thr Glu Ala

         75                  80                  85 GGA AGG GAC TGG CTG CTA TTG GGC GAA GTG CCG GGG CAG GAT CTC CTG       1523 Gly Arg Asp Trp Leu Leu Leu Gly Glu Val Pro Gly Gln Asp Leu Leu

     90                  95                 100 TCA TCT CAC CTT GCT CCT GCC GAG AAA GTA TCC ATC ATG GCT GAT GCA       1571 Ser Ser His Leu Ala Pro Ala Glu Lys Val Ser Ile Met Ala Asp Ala

105                 110                 115 ATG CGG CGG CTG CAT ACG CTT GAT CCG GCT ACC TGC CCA TTC GAC CAC       1619 Met Arg Arg Leu His Thr Leu Asp Pro Ala Thr Cys Pro Phe Asp His 120                 125                 130                 135 CAA GCG AAA CAT CGC ATC GAG CGA GCA CGT ACT CGG ATG GAA GCC GGT       1667 Gln Ala Lys His Arg Ile Glu Arg Ala Arg Thr Arg Met Glu Ala Gly

            140                 145                 150 CTT GTC GAT CAG GAT GAT CTG GAC GAA GAG CAT CAG GGG CTC GCG CCA       1715 Leu Val Asp Gln Asp Asp Leu Asp Glu Glu His Gln Gly Leu Ala Pro

        155                 160                 165 GCC GAA CTG TTC GCC AGG CTC AAG GCG CGC ATG CCC GAC GGC GAG GAT       1763 Ala Glu Leu Phe Ala Arg Leu Lys Ala Arg Met Pro Asp Gly Glu Asp

    170                 175                 180 CTC GTC GTG ACC CAT GGC GAT GCC TGC TTG CCG AAT ATC ATG GTG GAA       1811 Leu Val Val Thr His Gly Asp Ala Cys Leu Pro Asn Ile Met Val Glu

185                 190                 195 AAT GGC CGC TTT TCT GGA TTC ATC GAC TGT GGC CGG CTG GGT GTG GCG       1859 Asn Gly Arg Phe Ser Gly Phe Ile Asp Cys Gly Arg Leu Gly Val Ala 200                 205                 210                 215 GAC CGC TAT CAG GAC ATA GCG TTG GCT ACC CGT GAT ATT GCT GAA GAG       1907 Asp Arg Tyr Gln Asp Ile Ala Leu Ala Thr Arg Asp Ile Ala Glu Glu

            220                 225                 230 CTT GGC GGC GAA TGG GCT GAC CGC TTC CTC GTG CTT TAC GGT ATC GCC       1955 Leu Gly Gly Glu Trp Ala Asp Arg Phe Leu Val Leu Tyr Gly Ile Ala

        235                 240                 245 GCT CCC GAT TCG CAG CGC ATC GCC TTC TAT CGC CTT CTT GAC GAG TTC       2003 Ala Pro Asp Ser Gln Arg Ile Ala Phe Tyr Arg Leu Leu Asp Glu Phe

    250                 255                 260 TTC TGA GCGGGACTCT GGGGTTCGAAATGACCGACC AAGCGACGCC CG GCC CAG         2057 phe                                                   Ala Gln 264                                                   421 CGC GTC GAT TCG GGC ATT TGC CAT ATC AAT GGA CCG ACT GTG CAT GAC       2105 Arg Val Asp Ser Gly Ile Cys His Ile Asn Gly Pro Thr Val His Asp

    425                 430                 435 GAG GCT CAG ATG CCA TTC GGT GGG GTG AAG TCC AGC GGC TAC GGC AGC       2153 Glu Ala Gln Met Pro Phe Gly Gly Val Lys Ser Ser Gly Tyr Gly Ser

440                 445                 450 TTC GGC AGT CGA GCA TCG ATT GAG CAC TTT ACC CAG CTG CGC TGG CTG       2201 Phe Gly Ser Arg Ala Ser Ile Glu His Phe Thr Gln Leu Arg Trp Leu 455                 460                 465                 470 ACC ATT CAG AAT GGC CCG CGG CAC TAT CCA ATC TAA ATCGATCTTC            2247 Thr Ile Gln Asn Gly Pro Arg His Tyr Pro Ile

            475                 480 481 GGGCGCCGCG GGCATCATGC CCGCGGCGCT CGCCTCATTT CAATCTCTAA CTTGATAAAA     2307 ACAGAGCTGT TCTCCGGTCT TGGTGGATCA AGGCCAGTCG CGGAGAGTCT CGAAGAGGAG     2367 AGTACAGTGA ACGCCGAGTC CACATTGCAA CCGCAGGCAT CATCATGCTC TGCTCAGCCA     2427 CGCTACCGCA GTGTGTCGAT TGGTCATCCT CCGGTTGAGG TTACGCAAGA CGCTGGAGGT     2487 ATTGTCCGGA TGCGTTCTCT CGAGGCGCTT CTTCCCTTCC CGGGTGGAAT TC             2539 图2m: GAATTCCAAT AATGACAATA ATGAGGAGTG CCCA ATG TTT CAC GTG CCC CTG CTT      55

                                  Met Phe His Val Pro Leu Leu

                                    1               5 ATT GGT GGT AAG CCT TGT TCA GCA TCT GAT GAG CGC ACC TTC GAG CGT       103 Ile Gly Gly Lys Pro Cys Ser Ala Ser Asp Glu Arg Thr Phe Glu Arg

     10                  15                  20 CGT AGC CCG CTG ACC GGA GAA GTG GTA TCG CGC GTC GCT GCT GCC AGT       151 Arg Ser Pro Leu Thr Gly Glu Val Val Ser Arg Val Ala Ala Ala Ser

 25                  30                  35 TTG GAA GAT GCG GAC GCC GCA GTG GCC GCT GCA CAG GCT GCG TTT CCT       199 Leu Glu Asp Ala Asp Ala Ala Val Ala Ala Ala Gln Ala Ala Phe Pro  40                  45                  50                  55 GAA TGG GCG GCG CTT GCT CCG AGC GAA CGC CGT GCC CGA CTG CTG CGA       247 Glu Trp Ala Ala Leu Ala Pro Ser Glu Arg Arg Ala Arg Leu Leu Arg

             60                  65                  70 GCG GCG GAT CTT CTA GAG GAC CGT TCT TCC GAG TTC ACC GCC GCA GCG       295 Ala Ala Asp Leu Leu Glu Asp Arg Ser Ser Glu Phe Thr Ala Ala Ala

         75                  80                  85 AGT GAA ACT GGC GCA GCG GGA AAC TGG TAT GGG TTT AAC GTT TAC CTG       343 Ser Glu Thr Gly Ala Ala Gly Asn Trp Tyr Gly Phe Asn Val Tyr Leu

     90                  95                 100 GCG GCG GGC ATG TTG CGG GAA GCC GCG GCC ATG ACC ACA CAG ATT CAG       391 Ala Ala Gly Met Leu Arg Glu Ala Ala Ala Met Thr Thr Gln Ile Gln

105                 110                 115 GGC GAT GTC ATT CCG TCC AAT GTG CCC GGT AGC TTT GCC ATG GCG GTT       439 Gly Asp Val Ile Pro Ser Asn Val Pro Gly Ser Phe Ala Met Ala Val 120                 125                 130                 135 CGA CAG CCA TGT GGC GTG GTG CTC GGT ATT GCG CCT TGG AAT GCT CCG       487 Arg Gln Pro Cys Gly Val Val Leu Gly Ile Ala Pro Trp Asn Ala Pro

            140                 145                 150 GTA ATC CTT GGC GTA CGG GCT GTT GCG ATG CCG TTG GCA TGC GGC AAT       535 Val Ile Leu Gly Val Arg Ala Val Ala Met Pro Leu Ala Cys Gly Asn

        155                 160                 165 ACC GTG GTG TTG AAA AGC TCT GAG CTG AGT CCC TTT ACC CAT CGC CTG       583 Thr Val Val Leu Lys Ser Ser Glu Leu Ser Pro Phe Thr His Arg Leu

    170                 175                 180 ATT GGT CAG GTG TTG CAT GAT GCT GGT CTG GGG GAT GGC GTG GTG AAT       631 Ile Gly Gln Val Leu His Asp Ala Gly Leu Gly Asp Gly Val Val Asn

185                 190                 195 GTC ATC AGC AAT GCC CCG CAA GAC GCT CCT GCG GTG GTG GAG CGA CTG       679 Val Ile Ser Asn Ala Pro Gln Asp Ala Pro Ala Val Val Glu Arg Leu 200                 205                 210                 215 ATT GCA AAT CCT GCG GTA CGT CGA GTG AAC TTC ACC GGT TCG ACC CAC       727 Ile Ala Asn Pro Ala Val Arg Arg Val Asn Phe Thr Gly Ser Thr His

            220                 225                 230 GTT GGA CGG ATC ATT GGT GAG CTG TCT GCG CGT CAT CTG AAG CCT GCT       775 Val Gly Arg Ile Ile Gly Glu Leu Ser Ala Arg His Leu Lys Pro Ala

        235                 240                 245 GTG CTG GAA TTA GGT GGT AAG GCT CCG TTC TTG GTC TTG GAC GAT GCC       823 Val Leu Glu Leu Gly Gly Lys Ala Pro Phe Leu Val Leu Asp Asp Ala

    250                 255                 260 GAC CTC GAT GCG GCG GTC GAA GCG GCG GCC TTT GGT GCC TAC TTC AAT       871 Asp Leu Asp Ala Ala Val Glu Ala Ala Ala Phe Gly Ala Tyr Phe Asn

265                 270                 275 CAG GGT CAA ATC TGC ATG TCC ACT GAG CGT CTG ATT GTG ACA GCA GTC       919 Gln Gly Gln Ile Cys Met Ser Thr Glu Arg Leu Ile Val Thr Ala Val 280                 285                 290                 295 GCA GAC GCC TTT GTT GAA AAG CTG GCG AGG AAG GTC GCC ACA CTG CGT       967 Ala Asp Ala Phe Val Glu Lys Leu Ala Arg Lys Val Ala Thr Leu Arg

            300                 305                 310 GCT GGC GAT CCT AAT GAT CCG CAA TCG GTC TTG GGT TCG TTG ATT GAT      1015 Ala Gly Asp Pro Asn Asp Pro Gln Ser Val Leu Gly Ser Leu Ile Asp

        315                 320                 325 GCC AAT GCA GGT CAA CGC ATC CAG GTGGGGAGAG GCGGTTTGCG TATTGGGCGC     1069 Ala Asn Ala Gly Gln Arg Ile Gln

    330                 335 ATGCATAAAA ACTGTTGTAA TTCATTAAGC ATTCTGCCGA CATGGAAGCC ATCACAAACG    1129 GCATGATGAA CCTGAATCGC CAGCGGCATC AGCACCTTGT CGCCTTGCGT ATAATATTTG    1189 CCCATGGACG CACACCGTGG AAACGGATGA AGGCACGAAC CCAGTTGACA TAAGCCTGTT    1249 CGGTTCGTAA ACTGTAATGC AAGTAGCGTA TGCGCTCACG CAACTGGTCC AGAACCTTGA    1309 CCGAACGCAG CGGTGGTAAC GGCGCAGTGG CGGTTTTCAT GGCTTGTTAT GACTGTTTTT    1369 TTGTACAGTC TATGCCTCGG GCATCCAAGC AGCAAGCGCG TTACGCCGTG GGTCGATGTT    1429 TGATGTTATG GAGCAGCAAC G ATG TTA CGC AGC AGC AAC GAT GTT ACG CAG      1480

                    Met Leu Arg Ser Ser Ash Asp Val Thr Gln

                      1               5                  10 CAG GGC AGT CGC CCT AAA ACA AAG TTA GGT GGC TCA AGT ATG GGC ATC      1528 Gln Gly Ser Arg Pro Lys Thr Lys Leu Gly Gly Ser Ser Met Gly Ile

             15                  20                  25 ATT CGC ACA TGT AGG CTC GGC CCT GAC CAA GTC AAA TCC ATG CGG GCT      1576 Ile Arg Thr Cys Arg Leu Gly Pro Asp Gln Val Lys Ser Met Arg Ala

         30                  35                  40 GCT CTT GAT CTT TTC GGT CGT GAG TTC GGA GAC GTA GCC ACC TAC TCC       1624 Ala Leu Asp Leu Phe Gly Arg Glu Phe Gly Asp Val Ala Thr Tyr Ser

     45                  50                  55 CAA CAT CAG CCG GAC TCC GAT TAC CTC GGG AAC TTG CTC CGT AGT AAG       1672 Gln His Gln Pro Asp Ser Asp Tyr Leu Gly Asn Leu Leu Arg Ser Lys

 60                  65                  70 ACA TTC ATC GCG CTT GCT GCC TTC GAC CAA GAA GCG GTT GTT GGC GCT       1720 Thr Phe Ile Ala Leu Ala Ala Phe Asp Gln Glu Ala Val Val Gly Ala  75                  80                  85                  90 CTC GCG GCT TAC GTT CTG CCC AGG TTT GAG CAG CCG CGT AGT GAG ATC       1768 Leu Ala Ala Tyr Val Leu Pro Arg Phe Glu Gln Pro Arg Ser Glu Ile

             95                  100                105 TAT ATC TAT GAT CTC GCA GTC TCC GGC GAG CAC CGG AGG CAG GGC ATT       1816 Tyr Ile Tyr Asp Leu Ala Val Ser Gly Glu His Arg Arg Gln Gly Ile

        110                 115                 120 GCC ACC GCG CTC ATC AAT CTC CTC AAG CAT GAG GCC AAC GCG CTT GGT       1864 Ala Thr Ala Leu Ile Asn Leu Leu Lys His Glu Ala Asn Ala Leu Gly

    125                 130                 135 GCT TAT GTG ATC TAC GTG CAA GCA GAT TAC GGT GAC GAT CCC GCA GTG       1912 Ala Tyr Val Ile Tyr Val Gln Ala Asp Tyr Gly Asp Asp Pro Ala Val

140                 145                 150 GCT CTC TAT ACA AAG TTG GGC ATA CGG GAA GAA GTG ATG CAC TTT GAT       1960 Ala Leu Tyr Thr Lys Leu Gly Ile Arg Glu Glu Val Met His Phe Asp 155                 160                 165                 170 ATC GAC CCA AGT ACC GCC ACC TAA CAATTCGTTC AAGCCGAGAT CGGCTTCCCA      2014 Ile Asp Pro Ser Thr Ala Thr

            175     177 A TTG GCC CAG CGC GTC GAT TCG GGC ATT TGC CAT ATC AAT GGA CCG ACT     2063   Leu Ala Gln Arg Val Asp Ser Gly Ile Cys His Ile Asn Gly Pro Thr   420                 425                 430                 435 GTG CAT GAC GAG GCT CAG ATG CCA TTC GGT GGG GTG AAG TCC AGC GGC       2111 Val His Asp Glu Ala Gln Met Pro Phe Gly Gly Val Lys Ser Ser Gly

            440                 445                 450 TAC GGC AGC TTC GGC AGT CGA GCA TCG ATT GAG CAC TTT ACC CAG CTG       2159 Tyr Gly Ser Phe Gly Ser Arg Ala Ser Ile Glu His Phe Thr Gln Leu

        455                 460                 465 CGC TGG CTG ACC ATT CAG AAT GGC CCG CGG CAC TAT CCA ATC TAA           2204 Arg Trp Leu Thr Ile Gln Asn Gly Pro Arg His Tyr Pro Ile

    470                 475                 480 481 ATCGATCTTC GGGCGCCGCG GGCATCATGC CCGCGGCGCT CGCCTCATTT CAATCTCTAA     2264 CTTGATAAAA ACAGAGCTGT TCTCCGGTCT TGGTGGATCA AGGCCAGTCG CGGAGAGTCT     2324 CGAAGAGGAG AGTACAGTGA ACGCCGAGTC CACATTGCAA CCGCAGGCAT CATCATGCTC     2384 TGCTCAGCCA CGCTACCGCA GTGTGTCGAT TGGTCATCCT CCGGTTGAGG TTACGCAAGA     2444 CGCTGGAGGT ATTGTCCGGA TGCGTTCTCT CGAGGCGCTT CTTCCCTTCC CGGGTGGAAT     2504 TC                                                                    2506 图2n: GAATTCCAAT AATGACAATA ATGAGGAGTG CCCA ATG TTT CAC GTG CCC CTG CTT      55

                                  Met Phe His Val Pro Leu Leu

                                    1               5 ATT GGT GGT AAG CCT TGT TCA GCA TCT GAT GAG CGC ACC TTC GAG CGT       103 Ile Gly Gly Lys Pro Cys Ser Ala Ser Asp Glu Arg Thr Phe Glu Arg

     10                  15                  20 CGT AGC CCG CTG ACC GGA GAA GTG GTA TCG CGC GTC GCT GCT GCC AGT       151 Arg Ser Pro Leu Thr Gly Glu Val Val Ser Arg Val Ala Ala Ala Ser

 25                  30                  35 TTG GAA GAT GCG GAC GCC GCA GTG GCC GCT GCA CAG GCT GCG TTT CCT       199 Leu Glu Asp Ala Asp Ala Ala Val Ala Ala Ala Gln Ala Ala Phe Pro  40                  45                  50                  55 GAA TGG GCG GCG CTT GCT CCG AGC GAA CGC CGT GCC CGA CTG CTG CGA       247 Glu Trp Ala Ala Leu Ala Pro Ser Glu Arg Arg Ala Arg Leu Leu Arg

             60                  65                  70 GCG GCG GAT CTT CTA GAG GAC CGT TCT TCC GAG TTC ACC GCC GCA GCG       295 Ala Ala Asp Leu Leu Glu Asp Arg Ser Ser Glu Phe Thr Ala Ala Ala

         75                  80                  85 AGT GAA ACT GGC GCA GCG GGA AAC TGG TAT GGG TTT AAC GTT TAC CTG       343 Ser Glu Thr Gly Ala Ala Gly Asn Trp Tyr Gly Phe Asn Val Tyr Leu

     90                  95                 100 GCG GCG GGC ATG TTG CGG GAA GCC GCG GCC ATG ACC ACA CAG ATT CAG       391 Ala Ala Gly Met Leu Arg Glu Ala Ala Ala Met Thr Thr Gln Ile Gln

105                 110                 115 GGC GAT GTC ATT CCG TCC AAT GTG CCC GGT AGC TTT GCC ATG GCG GTT       439 Gly Asp Val Ile Pro Ser Asn Val Pro Gly Ser Phe Ala Met Ala Val 120                 125                 130                 135 CGA CAG CCA TGT GGC GTG GTG CTC GGT ATT GCG CCT TGG AAT GCT CCG       487 Arg Gln Pro Cys Gly Val Val Leu Gly Ile Ala Pro Trp Asn Ala Pro

            140                 145                 150 GTA ATC CTT GGC GTA CGG GCT GTT GCG ATG CCG TTG GCA TGC GGC AAT       535 Val Ile Leu Gly Val Arg Ala Val Ala Met Pro Leu Ala Cys Gly Ash

        155                 160                 165 ACC GTG GTG TTG AAA AGC TCT GAG CTG AGT CCC TTT ACC CAT CGC CTG       583 Thr Val Val Leu Lys Ser Ser Glu Leu Ser Pro Phe Thr His Arg Leu

    170                 175                 180 ATT GGT CAG GTG TTG CAT GAT GCT GGT CTG GGG GAT GGC GTG GTG AAT       631 Ile Gly Gln Val Leu His Asp Ala Gly Leu Gly Asp Gly Val Val Asn

185                 190                 195 GTC ATC AGC AAT GCC CCG CAA GAC GCT CCT GCG GTG GTG GAG CGA CTG       679 Val Ile Ser Asn Ala Pro Gln Asp Ala Pro Ala Val Val Glu Arg Leu 200                 205                 210                 215 ATT GCA AAT CCT GCG GTA CGT CGA GTG AAC TTC ACC GGT TCG ACC CAC       727 Ile Ala Asn Pro Ala Val Arg Arg val Asn Phe Thr Gly Ser Thr His

            220                 225                 230 GTT GGA CGG ATC ATT GGT GAG CTG TCT GCG CGT CAT CTG AAG CCT GCT       775 Val Gly Arg Ile Ile Gly Glu Leu Ser Ala Arg His Leu Lys Pro Ala

        235                 240                 245 GTG CTG GAA TTA GGT GGT AAG GCT CCG TTC TTG GTC TTG GAC GAT GCC       823 Val Leu Glu Leu Gly Gly Lys Ala Pro Phe Leu Val Leu Asp Asp Ala

    250                 255                 260 GAC CTC GAT GCG GCG GTC GAA GCG GCG GCC TTT GGT GCC TAC TTC AAT       871 Asp Leu Asp Ala Ala Val Glu Ala Ala Ala Phe Gly Ala Tyr Phe Asn

265                 270                 275 CAG GGT CAA ATC TGC ATG TCC ACT GAG CGT CTG ATT GTG ACA GCA GTC       919 Gln Gly Gln Ile Cys Met Ser Thr Glu Arg Leu Ile Val Thr Ala Val 280                 285                 290                 295 GCA GAC GCC TTT GTT GAA AAG CTG GCG AGG AAG GTC GCC ACA CTG CGT       967 Ala Asp Ala Phe Val Glu Lys Leu Ala Arg Lys Val Ala Thr Leu Arg

            300                 305                 310 GCT GGC GAT CCT AAT GAT CCG CAA TCG GTC TTG GGT TCG TTG ATT GAT      1015 Ala Gly Asp Pro Asn Asp Pro Gln Ser Val Leu Gly Ser Leu Ile Asp

        315                 320                 325 GCC AAT GCA GGT CAA CGC ATC CAG GTT CTG GTC GAT GAT GCG CTC GCA      1063 Ala Asn Ala Gly Gln ArG Ile Gln Val Leu Val Asp Asp Ala Leu Ala

    330                 335                 340 AAA GGC GCG CAATGGAA TTG GCC CAG CGC GTC GAT TCG GGC ATT TGC CAT     1113 Lys Gly Ala           Leu Ala Gln Arg Val Asp Ser Gly Ile Cys His

345 346           420                 425                 430 ATC AAT GGA CCG ACT GTG CAT GAC GAG GCT CAG ATG CCA TTC GGT GGG      1161 Ile Asn Gly Pro Thr Val His Asp Glu Ala Gln Met Pro Phe Gly Gly

            435                 440                 445 GTG AAG TCC AGC GGC TAC GGC AGC TTC GGC AGT CGA GCA TCG ATT GAG      1209 Val Lys Ser Ser Gly Tyr Gly Ser Phe Gly Ser Arg Ala Ser Ile Glu

        450                 455                 460 CAC TTT ACC CAG CTG CGC TGG CTG ACC ATT CAG AAT GGC CCG CGG CAC      1257 His Phe Thr Gln Leu Arg Trp Leu Thr Ile Gln Asn Gly Pro Arg His

    465                 470                 475 TAT CCA ATC TAAATCGATCTTC GGGCGCCGCG GGCATCATGC CCGCGGCGCT           1309 Tyr Pro Ile

480 481 CGCCTCATTT CAATCTCTAA CTTGATAAAA ACAGAGCTGT TCTCCGGTCT TGGTGGATCA    1369 AGGCCAGTCG CGGAGAGTCT CGAAGAGGAG AGTACAGTGA ACGCCGAGTC CACATTGCAA    1429 CCGCAGGCAT CATCATGCTC TGCTCAGCCA CGCTACCGCA GTGTGTCGAT TGGTCATCCT     1489 CCGGTTGAGG TTACGCAAGA CGCTGGAGGT ATTGTCCGGA TGCGTTCTCT CGAGGCGCTT     1549 CTTCCCTTCC CGGGTGGAAT TC                                              1571 图2o: GAATTCCGCG GTCGGCGAAA GTTGATGCGC TGTATCGTGG TGAAGATCAA TCCATGCTGC      60 GTGACGAGGC CACACT GTG AGT TGG TCA GGG GGG GCT TAC TCG GCG TTT TCC     112

              Met Ser Trp Ser Gly Gly Ala Tyr Ser Ala Phe Ser

                1               5                  10 GAC ACT GCG TTG GTT GCG GCA GTG CGC ACC CCC TGG ATT GAT TGC GGG       160 Asp Thr Ala Leu Val Ala Ala Val Arg Thr Pro Trp Ile Asp Cys Gly

    15                  20                  25 GGT GCC CTG TCG CTG GTG TCG CCT ATC GAC TTA GGG GTA AAG GTC GCT       208 Gly Ala Leu Ser Leu Val Ser Pro Ile Asp Leu Gly Val Lys Val Ala

 30                  35                  40 CGC GAA GTT CTG ATG CGT GCG TCG CTT GAA CCA CAA ATG GTC GAT AGC       256 Arg Glu Val Leu Met Arg Ala Ser Leu Glu Pro Gln Met Val Asp Ser 45                   50                  55                  60 GTA CTC GCA GGC TCT ATG GCT CAA GCA AGC TTT GAT GCT TAC CTG CTC       304 Val Leu Ala Gly Ser Met Ala Gln Ala Ser Phe Asp Ala Tyr Leu Leu

             65                  70                  75 CCG CGG CAC ATT GGC TTG TAC AGC GGT GTT CCC AAG TCG GTT CCG GCC       352 Pro Arg His Ile Gly Leu Tyr Ser Gly Val Pro Lys Ser Val Pro Ala

         80                  85                  90 TTG GGG GTG CAG CGC ATT TGC GGC ACA GGC TTC GAA CTG CTT CGG CAG       400 Leu Gly Val Gln Arg Ile Cys Gly Thr Gly Phe Glu Leu Leu Arg Gln

     95                 100                 105 GCC GGC GAG CAG ATT TCC CAA GGC GCT GAT CAC GTG CTG TGT GTC GCG       448 Ala Gly Glu Gln Ile Ser Gln Gly Ala Asp His Val Leu Cys Val Ala

110                 115                 120 GCA GAG TCC ATG TCG CGT AAC CCC ATC GCG TCG TAT ACA CAC CGG GGC       496 Ala Glu Ser Met Ser Arg Asn Pro Ile Ala Ser Tyr Thr His Arg Gly 125                 130                 135                 140 GGG TTC CGC CTC GGT GCG CCC GTT GAG TTC AAG GAT TTT TTG TGG GAG       544 Gly Phe Arg Leu Gly Ala Pro Val Glu Phe Lys Asp Phe Leu Trp Glu

            145                 150                 155 GCA TTG TTT GAT CCT GCT CCA GGA CTC GAC ATG ATC GCT ACC GCA GAA       592 Ala Leu Phe Asp Pro Ala Pro Gly Leu Asp Met Ile Ala Thr Ala Glu

        160                 165                 170 AAC CTG GGGACAGCAA GCGAACCGGA ATTGCCAGCT GGGGCGCCCT CTGGTAAGGT        648 Asn Leu

174 TGGGAAGCCC TGCAAAGTAA ACTGGATGGC TTTCTTGCCG CCAAGGATCT GATGGCGCAG     708 GGGATCAAGA TCTGATCAAG AGACAGGATG AGGATCGTTT CGC ATG ATT GAA CAA       763

                                            Met Ile Glu Gln

                                              1 GAT GGA TTG CAC GCA GGT TCT CCG GCC GCT TGG GTG GAG AGG CTA TTC       811 Asp Gly Leu His Ala Gly Ser Pro Ala Ala Trp Val Glu Arg Leu Phe   5                  10                  15                  20 GGC TAT GAC TGG GCA CAA CAG ACA ATC GGC TGC TCT GAT GCC GCC GTG       859 Gly Tyr Asp Trp Ala Gln Gln Thr Ile Gly Cys Ser Asp Ala Ala Val

             25                  30                  35 TTC CGG CTG TCA GCG CAG GGG CGC CCG GTT CTT TTT GTC AAG ACC GAC       907 Phe Arg Leu Ser Ala Gln Gly Arg Pro Val Leu Phe Val Lys Thr Asp

         40                  45                  50 CTG TCC GGT GCC CTG AAT GAA CTG CAG GAC GAG GCA GCG CGG CTA TCG       955 Leu Ser Gly Ala Leu Asn Glu Leu Gln Asp Glu Ala Ala Arg Leu Ser

     55                  60                  65 TGG CTG GCC ACG ACG GGC GTT CCT TGC GCA GCT GTG CTC GAC GTT GTC      1003 Trp Leu Ala Thr Thr Gly Val Pro Cys Ala Ala Val Leu Asp Val Val

 70                  75                  80 ACT GAA GCG GGA AGG GAC TGG CTG CTA TTG GGC GAA GTG CCG GGG CAG      1051 Thr Glu Ala Gly Arg Asp Trp Leu Leu Leu Gly Glu Val Pro Gly Gln  85                  90                  95                 100 GAT CTC CTG TCA TCT CAC CTT GCT CCT GCC GAG AAA GTA TCC ATC ATG      1099 Asp Leu Leu Ser Ser His Leu Ala Pro Ala Glu Lys Val Ser Ile Met

            105                 110                 115 GCT GAT GCA ATG CGG CGG CTG CAT ACG CTT GAT CCG GCT ACC TGC CCA      1147 Ala Asp Ala Met Arg Arg Leu His Thr Leu Asp Pro Ala Thr Cys Pro

        120                 125                 130 TTC GAC CAC CAA GCG AAA CAT CGC ATC GAG CGA GCA CGT ACT CGG ATG      1195 Phe Asp His Gln Ala Lys His Arg Ile Glu Arg Ala Arg Thr Arg Met

    135                 140                 145 GAA GCC GGT CTT GTC GAT CAG GAT GAT CTG GAC GAA GAG CAT CAG GGG      1243 Glu Ala Gly Leu Val Asp Gln Asp Asp Leu Asp Glu Glu His Gln Gly

150                 155                 160 CTC GCG CCA GCC GAA CTG TTC GCC AGG CTC AAG GCG CGC ATG CCC GAC      1291 Leu Ala Pro Ala Glu Leu Phe Ala Arg Leu Lys Ala Arg Met Pro Asp 165                 170                 175                 180 GGC GAG GAT CTC GTC GTG ACC CAT GGC GAT GCC TGC TTG CCG AAT ATC      1339 Gly Glu Asp Leu Val Val Thr His Gly Asp Ala Cys Leu Pro Asn Ile

            185                 190                 195 ATG GTG GAA AAT GGC CGC TTT TCT GGA TTC ATC GAC TGT GGC CGG CTG      1387 Met Val Glu Asn Gly Arg Phe Ser Gly Phe Ile Asp Cys Gly Arg Leu

        200                 205                 210 GGT GTG GCG GAC CGC TAT CAG GAC ATA GCG TTG GCT ACC CGT GAT ATT      1435 Gly Val Ala Asp Arg Tyr Gln Asp Ile Ala Leu Ala Thr Arg Asp Ile

    215                 220                 225 GCT GAA GAG CTT GGC GGC GAA TGG GCT GAC CGC TTC CTC GTG CTT TAC       1483 Ala Glu Glu Leu Gly Gly Glu Trp Ala Asp Arg Phe Leu Val Leu Tyr

230                 235                 240 GGT ATC GCC GCT CCC GAT TCG CAG CGC ATC GCC TTC TAT CGC CTT CTT       1531 Gly Ile Ala Ala Pro Asp Ser Gln Arg Ile Ala Phe Tyr Arg Leu Leu 245                 250                 255                 260 GAC GAG TTC TTC TGA GCGGGACTCT GGGGTTCGAA ATGACCGACC AAGCGACGCC       1586 Asp Glu phe Phe

        264 CA TTG AGG GCG CAA GAG GAG AAA TGG ATT GAC CAA GAG ATC GTG GCT        1633    Leu Arg Ala Gln Glu Glu Lys Trp Ile Asp Gln Glu Ile Val Ala    197         200                 205                 210 GTT ACG GAT GAA CAG TTC GAT TTA GAG GGC TACAAC AGT CGA GCA ATT        1681 Val Thr Asp Glu Gln Phe Asp Leu Glu Gly Tyr Asn Ser Arg Ala Ile

        215                 220                 225 GAA CTG CCT CGG AAG GCA AAA TTG TTG ATC GTG ACA GTC ATC CGC GGC       1729 Glu Leu Pro Arg Lys Ala Lys Leu Leu Ile Val Thr Val Ile Arg Gly

    230                 235                 240 CTA GCA GTC TTT GAA GCC CTT TCC CGA TTG AAG CCT GTT CAT TCT GGC       1777 Leu Ala Val Phe Glu Ala Leu Ser Arg Leu Lys Pro Val His Ser Gly

245                 250                 255 GGG GTG CAG ACT GCG GGC AAC AGC TGT GCC GTA GTG GAC GGC GCC GCG       1825 Gly Val Gln Thr Ala Gly Asn Ser Cys Ala Val Val Asp Gly Ala Ala 260                 265                 270                 275 GCG GCT TTG GTG GCT CGA GAG TCG TCT GCG ACA CAG CCG GTC TTG GCT       1873 Ala Ala Leu Val Ala Arg Glu Ser Ser Ala Thr Gln Pro Val Leu Ala

            280                 285                 290 AGG ATA CTG GCT ACC TCC GTA GTC GGG ATC GAG CCC GAG CAT ATG GGG       1921 Arg Ile Leu Ala Thr Ser Val Val Gly Ile Glu Pro Glu His Met Gly

        295                 300                 305 CTC GGC CCT GCG CCC GCG ATT CGC CTG CTG CTT GCG CGT AGT GAT CTT       1969 Leu Gly Pro Ala Pro Ala Ile Arg Leu Leu Leu Ala Arg Ser Asp Leu

    310                 315                 320 AGT TTG AGG GAT ATC GAC CTC TTT GAG ATA AAC GAG GCG CAG GCC GCC       2017 Ser Leu Arg Asp Ile Asp Leu Phe Glu Ile Asn Glu Ala Gln Ala Ala

325                 330                 335 CAA GTT CTA GCG GTA CAG CAT GAA TTG GGT ATT GAG CAC TCA AAA CTT       2065 Gln Val Leu Ala Val Gln His Glu Leu Gly Ile Glu His Ser Lys Leu 340                 345                 350                 355 AAT ATT TGG GGC GGG GCC ATT GCA CTT GGA CAC CCG CTT GCC GCG ACC       2113 Asn Ile Trp Gly Gly Ala Ile Ala Leu Gly His Pro Leu Ala Ala Thr

            360                 365                 370 GGA TTG CGT CTC TGC ATG ACC CTC GCT CAC CAA TTG CAA GCT AAT AAC       2161 Gly Leu Arg Leu Cys Met Thr Leu Ala His Gln Leu Gln Ala Asn Asn

        375                 380                 385 TTT CGA TAT GGA ATT GCC TCG GCA TGC ATT GGT GGG GGA CAG GGG ATG       2209 Phe Arg Tyr Gly Ile Ala Ser Ala Cys Ile Gly Gly Gly Gln Gly Met

    390                 395                 400 GCG GTT CTT TTA GAG AAT CCC CAC TTC GGT TCG TCC TCT GCA CGA AGT       2257 Ala Val Leu Leu Glu Asn Pro His Phe Gly Ser Ser Ser Ala Arg Ser

405                 410                 415 TCG ATG ATT AAC AGA GTT GAC CAC TAT CCA CTG AGC TAA CGGGCATCTC        2306 Ser Met Ile Asn Arg Val Asp His Tyr Pro Leu Ser 420                 425                 430 431 CTTTGTTGCT TTGAGGTGGC GCACGAAGGA GGGCTCGAAA ATCTCTGCTA AAAACAAGAA    2366 GAAGGAACAG GGAACATGAT TAGTTTCGCT CGTATGGCAG AAAGTTTAGG AGTCCAGGCT    2426 AAACTTGCCC TTGCCTTCGC ACTCGTATTA TGTGTCGGGC TGATTGTTAC CGGCACGGGT    2486 TTCTACAGTG TACATACCTT GTCAGGGTTG GTGGGAATTC                          2526 图2p: GAATTCCGCG GTCGGCGAAA GTTGATGCGC TGTATCGTGG TGAAGATCAA TCCATGCTGC      60 GTGACGAGGC CACACT GTG AGT TGG TCA GGG GGG GCT TAC TCG GCG TTT TCC     112

              Met Ser Trp Ser Gly Gly Ala Tyr Ser Ala Phe Ser

                1               5                  10 GAC ACT GCG TTG GTT GCG GCA GTG CGC ACC CCC TGG ATT GAT TGC GGG       160 Asp Thr Ala Leu Val Ala Ala Val Arg Thr Pro Trp Ile Asp Cys Gly

     15                  20                  25 GGT GCC CTG TCG CTG GTG TCG CCT ATC GAC TTA GGG GTA AAG GTC GCT       208 Gly Ala Leu Ser Leu Val Ser Pro Ile Asp Leu Gly VaI Lys Val Ala

 30                  35                  40 CGC GAA GTT CTG ATG CGT GCG TCG CTT GAA CCA CAA ATG GTC GAT AGC       256 Arg Glu Val Leu Met Arg Ala Ser Leu Glu Pro Gln Met Val Asp Ser  45                  50                  55                  60 GTA CTC GCA GGC TCT ATG GCT CAA GCA AGC TTT GAT GCT TAC CTG CTC       304 Val Leu Ala Gly Ser Met Ala Gln Ala Ser Phe Asp Ala Tyr Leu Leu

             65                  70                  75 CCG CGG CAC ATT GGC TTG TAC AGC GGT GTT CCC AAG TCG GTT CCG GCC       352 Pro Arg His Ile Gly Leu Tyr Ser Gly Val Pro Lys Ser Val Pro Ala

         80                  85                  90 TTG GGG GTG CAG CGC ATT TGC GGC ACA GGC TTC GAA CTG CTT CGG CAG       400 Leu Gly Val Gln Arg Ile Cys Gly Thr Gly Phe Glu Leu Leu Arg Gln

     95                 100                 105 GCC GGC GAG CAG ATT TCC CAA GGC GCT GAT CAC GTG CTG TGT GTC GCG       448 Ala Gly Glu Gln Ile Ser Gln Gly Ala Asp His Val Leu Cys Val Ala

110                 115                 120 GCA GAG TCC ATG TCG CGT AAC CCC ATC GCG TCG TAT ACA CAC CGG GGC       496 Ala Glu Ser Met Ser Arg Asn Pro Ile Ala Ser Tyr Thr His Arg Gly 125                 130                 135                 140 GGG TTC CGC CTC GGT GCG CCC GTT GAG TTC AAG GAT TTT TTG TGG GAG       544 Gly Phe Arg Leu Gly Ala Pro Val Glu Phe Lys Asp Phe Leu Trp Glu

            145                 150                 155 GCA TTG TTT GAT CCT GCT CCA GGA CTC GAC ATG ATC GCT ACC GCA GAA       592 Ala Leu Phe Asp Pro Ala Pro Gly Leu Asp Met Ile Ala Thr Ala Glu

        160                 165                 170 AAC CTG GGGGAGAGGC GGTTTGCGTA TTGGGCGCAT GCATAAAAAC TGTTGTAATT        648 Asn Leu

174 CATTAAGCAT TCTGCCGACA TGGAAGCCAT CACAAACGGC ATGATGAACC TGAATCGCCA     708 GCGGCATCAG CACCTTGTCG CCTTGCGTAT AATATTTGCC CATGGACGCA CACCGTGGAA     768 ACGGATGAAG GCACGAACCC AGTTGACATA AGCCTGTTCG GTTCGTAAAC TGTAATGCAA     828 GTAGCGTATG CGCTCACGCA ACTGGTCCAG AACCTTGACC GAACGCAGCG GTGGTAACGG     888 CGCAGTGGCG GTTTTCATGG CTTGTTATGA CTGTTTTTTT GTACAGTCTA TGCCTCGGGC      948 ATCCAAGC AGCAAGCGCG TTACGCCGTG GGTCGATGTTTG ATGTTATGGA GCAGCAACG      1007 ATG TTA CGC AGC AGC AAC GAT GTT ACG CAG CAG GGC AGT CGC CCT AAA       1055 Met Leu Arg Ser Ser Asn Asp Val Thr Gln Gln Gly Ser Arg Pro Lys   1               5                  10                  15 ACA AAG TTA GGT GGC TCA AGT ATG GGC ATC ATT CGC ACA TGT AGG CTC       1103 Thr Lys Leu Gly Gly Ser Ser Met Gly Ile Ile Arg Thr Cys Arg Leu

         20                  25                  30 GGC CCT GAC CAA GTC AAA TCC ATG CGG GCT GCT CTT GAT CTT TTC GGT       1151 Gly Pro Asp Gln Val Lys Ser Met Arg Ala Ala Leu Asp Leu Phe Gly

     35                  40                  45 CGT GAG TTC GGA GAC GTA GCC ACC TAC TCC CAA CAT CAG CCG GAC TCC       1199 Arg Glu Phe Gly Asp Val Ala Thr Tyr Ser Gln His Gln Pro Asp Ser

 50                  55                  60 GAT TAC CTC GGG AAC TTG CTC CGT AGT AAG ACA TTC ATC GCG CTT GCT       1247 Asp Tyr Leu Gly Asn Leu Leu Arg Ser Lys Thr Phe Ile Ala Leu Ala  65                  70                  75                  80 GCC TTC GAC CAA GAA GCG GTT GTT GGC GCT CTC GCG GCT TAC GTT CTG       1295 Ala Phe Asp Gln Glu Ala Val Val Gly Ala Leu Ala Ala Tyr Val Leu

             85                  90                  95 CCC AGG TTT GAG CAG CCG CGT AGT GAG ATC TAT ATC TAT GAT CTC GCA       1343 Pro Arg Phe Glu Gln Pro Arg Ser Glu Ile Tyr Ile Tyr Asp Leu Ala

        100                 105                 110 GTC TCC GGC GAG CAC CGG AGG CAG GGC ATT GCC ACC GCG CTC ATC AAT       1391 Val Ser Gly Glu His Arg Arg Gln Gly Ile Ala Thr Ala Leu Ile Asn

    115                 120                 125 CTC CTC AAG CAT GAG GCC AAC GCG CTT GGT GCT TAT GTG ATC TAC GTG       1439 Leu Leu Lys His Glu Ala Asn Ala Leu Gly Ala Tyr Val Ile Tyr Val

130                 135                 140 CAA GCA GAT TAC GGT GAC GAT CCC GCA GTG GCT CTC TAT ACA AAG TTG       1487 Gln Ala Asp Tyr Gly Asp Asp Pro Ala Val Ala Leu Tyr Thr Lys Leu 145                 150                 155                 160 GGC ATA CGG GAA GAA GTG ATG CAC TTT GAT ATC GAC CCA AGT ACC GCC       1535 Gly Ile Arg Glu Glu Val Met His Phe Asp Ile Asp Pro Ser Thr Ala

            165                 170                 175 ACC TAA CAATTCGTTC AAGCCGAGAT CGGCTTCCCA TTG AGG GCG CAA GAG GAG      1589 Thr                                      Leu Arg Ala Gln Glu Glu 177                                      197         200 AAA TGG ATT GAC CAA GAG ATC GTG GCT GTT ACG GAT GAA CAG TTC GAT       1637 Lys Trp Ile Asp Gln Glu Ile Val Ala Val Thr Asp Glu Gln Phe Asp

    205                 210                 215 TTA GAG GGC TAC AAC AGT CGA GCA ATT GAA CTG CCT CGG AAG GCA AAA       1685 Leu Glu Gly Tyr Asn Ser Arg Ala Ile Glu Leu Pro Arg Lys Ala Lys

220                 225                 230 TTG TTG ATC GTG ACA GTC ATC CGC GGC CTA GCA GTC TTT GAA GCC CTT       1733 Leu Leu Ile Val Thr Val Ile Arg Gly Leu Ala Val Phe Glu Ala Leu 235                 240                 245                 250 TCC CGA TTG AAG CCT GTT CAT TCT GGC GGG GTG CAG ACT GCG GGC AAC       1781 Ser Arg Leu Lys Pro Val His Ser Gly Gly Val Gln Thr Ala Gly Asn

            255                 260                 265 AGC TGT GCC GTA GTG GAC GGC GCC GCG GCG GCT TTG GTG GCT CGA GAG       1829 Ser Cys Ala Val Val Asp Gly Ala Ala Ala Ala Leu Val Ala Arg Glu

            270             275                 280 TCG TCT GCG ACA CAG CCG GTC TTG GCT AGG ATA CTG GCT ACC TCC GTA       1877 Ser Ser Ala Thr Gln Pro Val Leu Ala Arg Ile Leu Ala Thr Ser Val

    285                 290                 295 GTC GGG ATC GAG CCC GAG CAT ATG GGG CTC GGC CCT GCG CCC GCG ATT       1925 Val Gly Ile Glu Pro Glu His Met Gly Leu Gly Pro Ala Pro Ala Ile

300                 305                 310 CGC CTG CTG CTT GCG CGT AGT GAT CTT AGT TTG AGG GAT ATC GAC CTC       1973 Arg Leu Leu Leu Ala Arg Ser Asp Leu Ser Leu Arg Asp Ile Asp Leu 315                 320                 325                 330 TTT GAG ATA AAC GAG GCG CAG GCC GCC CAA GTT CTA GCG GTA CAG CAT       2021 Phe Glu Ile Asn Glu Ala Gln Ala Ala Gln Val Leu Ala Val Gln His

            335                 340                 345 GAA TTG GGT ATT GAG CAC TCA AAA CTT AAT ATT TGG GGC GGG GCC ATT       2069 Glu Leu Gly Ile Glu His Ser Lys Leu Asn Ile Trp Gly Gly Ala Ile

        350                 355                 360 GCA CTT GGA CAC CCG CTT GCC GCG ACC GGA TTG CGT CTC TGC ATG ACC       2117 Ala Leu Gly His Pro Leu Ala Ala Thr Gly Leu Arg Leu Cys Met Thr

    365                 370                 375 CTC GCT CAC CAA TTG CAA GCT AAT AAC TTT CGA TAT GGA ATT GCC TCG       2165 Leu Ala His Gln Leu Gln Ala Asn Asn Phe Arg Tyr Gly Ile Ala Ser

380                 385                 390 GCA TGC ATT GGT GGG GGA CAG GGG ATG GCG GTT CTT TTA GAG AAT CCC       2213 Ala Cys Ile Gly Gly Gly Gln Gly Met Ala Val Leu Leu Glu Asn Pro 395                 400                 405                 410 CAC TTC GGT TCG TCC TCT GCA CGA AGT TCG ATG ATT AAC AGA GTT GAC       2261 His Phe Gly Ser Ser Ser Ala Arg Ser Ser Met Ile Asn ArG Val Asp

            415                 420                 425 CAC TAT CCA CTG AGC TAA CGGGCATCTC CTTTGTTGCT TTGAGGTGGC              2309 His Tyr Pro Leu Ser

        430 431 GCACGAAGGA GGGCTCGAAA ATCTCTGCTA AAAACAAGAA GAAGGAACAG GGAACATGAT     2369 TAGTTTCGCT CGTATGGCAG AAAGTTTAGG AGTCCAGGCT AAACTTGCCC TTGCCTTCGC     2429 ACTCGTATTA TGTGTCGGGC TGATTGTTAC CGGCACGGGT TTCTACAGTG TACATACCTT     2489 GTCAGGGTTG GTGGGAATTC                                                 2509 图2q: GAATTCCGCG GTCGGCGAAA GTTGATGCGC TGTATCGTGG TGAAGATCAA TCCATGCTGC       60 GTGACGAGGC CACACT GTG AGT TGG TCA GGG GGG GCT TAC TCG GCG TTT TCC      112

              Met Ser Trp Ser Gly Gly Ala Tyr Ser Ala Phe Ser

                1                5                 10 GAC ACT GCG TTG GTT GCG GCA GTG CGC ACC CCC TGG ATT GAT TGC GGG        160 Asp Thr Ala Leu Val Ala Ala Val Arg Thr Pro Trp Ile Asp Cys Gly

     15                  20                  25 GGT GCC CTG TCG CTG GTG TCG CCT ATC GAC TTA GGG GTA AAG GTC GCT        208 Gly Ala Leu Ser Leu Val Ser Pro Ile Asp Leu Gly Val Lys Val Ala

 30                  35                  40 CGC GAA GTT CTG ATG CGT GCG TCG CTT GAA CCA CAA ATG GTC GAT AGC        256 Arg Glu Val Leu Met Arg Ala Ser Leu Glu Pro Gln Met Val Asp Ser  45                  50                  55                  60 GTA CTC GCA GGC TCT ATG GCT CAA GCA AGC TTT GAT GCT TAC CTG CTC        304 Val Leu Ala Gly Ser Met Ala Gln Ala Ser Phe Asp Ala Tyr Leu Leu

     65                          70                  75 CCG CGG CAC ATT GGC TTG TAC AGC GGT GTT CCC AAG TCG GTT CCG GCC        352 Pro Arg His Ile Gly Leu Tyr Ser Gly Val Pro Lys Ser Val Pro Ala

         80                  85                  90 TTG GGG GTG CAG CGC ATT TGC GGC ACA GGC TTC GAA CTG CTT CGG CAG        400 Leu Gly Val Gln Arg Ile Cys Gly Thr Gly Phe Glu Leu Leu Arg Gln

     95                 100                 105 GCC GGC GAG CAG ATT TCC CAA GGC GCT GAT CAC GTG CTG TGT GTC GCG        448 Ala Gly Glu Gln Ile Ser Gln Gly Ala Asp His Val Leu Cys Val Ala

110                 115                 120 GCA GAG TCC ATG TCG CGT AAC CCC ATC GCG TCG TAT ACA CAC CGG GGC        496 Ala Glu Ser Met Ser Arg Asn Pro Ile Ala Ser Tyr Thr His Arg Gly 125                 130                 135                 140 GGG TTC CGC CTC GGT GCG CCC GTT GAG TTC AAG GAT TTT TTG TGG GAG        544 Gly Phe Arg Leu Gly Ala Pro Val Glu Phe Lys Asp Phe Leu Trp Glu

            145                 150                 155 GCA TTG TTT GAT CCT GCT CCA GGA CTC GAC ATG ATC GCT ACC GCA GAA        592 Ala Leu Phe Asp Pro Ala Pro Gly Leu Asp Met Ile Ala Thr Aia Glu

        160                 165                 170 AAC CTG GCG CGC A TTG AGG GCG CAA GAG GAG AAA TGG ATT GAC CAA GAG      641 Asn Leu Ala Arg   Leu Arg Ala Gln Glu Glu Lys Trp Ile Asp Gln Glu

    175 176   197         200                 205  ATC GTG GCT GTT ACG GAT GAA CAG TTC GAT TTA GAG GGC TAC AAC AGT        689 Ile Val Ala Val Thr Asp Glu Gln Phe Asp Leu Glu Gly Tyr Asn Ser

210                 215                 220 CGA GCA ATT GAA CTG CCT CGG AAG GCA AAA TTG TTG ATC GTG ACA GTC        737 Arg Ala Ile Glu Leu Pro Arg Lys Ala Lys Leu Leu Ile Val Thr Val 225                 230                 235                 240 ATC CGC GGC CTA GCA GTC TTT GAA GCC CTT TCC CGA TTG AAG CCT GTT       785 Ile Arg Gly Leu Ala Val Phe Glu Ala Leu Ser Arg Leu Lys Pro Val

            245                 250                 255 CAT TCT GGC GGG GTG CAG ACT GCG GGC AAC AGC TGT GCC GTA GTG GAC       833 His Ser Gly Gly Val Gln Thr Ala Gly Asn Ser Cys Ala Val Val Asp

        260                 265                 270 GGC GCC GCG GCG GCT TTG GTG GCT CGA GAG TCG TCT GCG ACA CAG CCG       881 Gly Ala Ala Ala Ala Leu Val Ala Arg Glu Ser Ser Ala Thr Gln Pro

    275                 280                 285 GTC TTG GCT AGG ATA CTG GCT ACC TCC GTA GTC GGG ATC GAG CCC GAG       929 Val Leu Ala Arg Ile Leu Ala Thr Ser Val Val Gly Ile Glu Pro Glu

290                 295                 300 CAT ATG GGG CTC GGC CCT GCG CCC GCG ATT CGC CTG CTG CTT GCG CGT       977 His Met Gly Leu Gly Pro Ala Pro Ala Ile Arg Leu Leu Leu Ala Arg 305                 310                 315                 320 AGT GAT CTT AGT TTG AGG GAT ATC GAC CTC TTT GAG ATA AAC GAG GCG      1025 Ser Asp Leu Ser Leu Arg Asp Ile Asp Leu Phe Glu Ile Asn Glu Ala

            325                 330                 335 CAG GCC GCC CAA GTT CTA GCG GTA CAG CAT GAA TTG GGT ATT GAG CAC      1073 Gln Ala Ala Gln Val Leu Ala Val Gln His Glu Leu Gly Ile Glu His

        340                 345                 350 TCA AAA CTT AAT ATT TGG GGC GGG GCC ATT GCA CTT GGA CAC CCG CTT      1121 Ser Lys Leu Asn Ile Trp Gly Gly Ala Ile Ala Leu Gly His Pro Leu

    355                 360                 365 GCC GCG ACC GGA TTG CGT CTC TGC ATG ACC CTC GCT CAC CAA TTG CAA      1169 Ala Ala Thr Gly Leu Arg Leu Cys Met Thr Leu Ala His Gln Leu Gln

370                 375                 380 GCT AAT AAC TTT CGA TAT GGA ATT GCC TCG GCA TGC ATT GGT GGG GGA      1217 Ala Asn Asn Phe Arg Tyr Gly Ile Ala Ser Ala Cys Ile Gly Gly Gly 385                 390                 395                 400 CAG GGG ATG GCG GTT CTT TTA GAG AAT CCC CAC TTC GGT TCG TCC TCT      1265 Gln Gly Met Ala Val Leu Leu Glu Asn Pro His Phe Gly Ser Ser Ser

            405                 410                 415 GCA CGA AGT TCG ATG ATT AAC AGA GTT GAC CAC TAT CCA CTG AGC TAA      1313 Ala Arg Ser Ser Met Ile Asn Arg Val Asp His Tyr Pro Leu Ser

        420                 425                 430 431 CGGGCATCTC CTTTGTTGCT TTGAGGTGGC GCACGAAGGA GGGCTCGAAA ATCTCTGCTA    1373 AAAACAAGAA GAAGGAACAG GGAACATGAT TAGTTTCGCT CGTATGGCAG AAAGTTTAGG    1433 AGTCCAGGCT AAACTTGCCC TTGCCTTCGC ACTCGTATTA TGTGTCGGGC TGATTGTTAC    1493 CGGCACGGGT TTCTACAGTG TACATACCTT GTCAGGGTTG GTGGGAATTC               1543 图2r:

                            序列1 CTGCAGCCAG GGCTGAAAAG GAGGGATTCA GTGAGGTCAT GAAGGGAGGG GACGGCGCCT      60 GGCTCCAATT GCTCGATGGC GCCGCGATTG AGTGTCTTGG GCGCGGTCTT GGAGAGTTCG     120 GCTAGGGAGA TAAATTTGCT GGCCATGGTG GCGGCCCCTG ATGGGTTGGA TGATTTTCTG     180 CATTCTGCAT CATGAAATTC ATGAAATCAT CACTTTTCGG GGGGTGGGTG CACGGGATTG     240 AAGGTTGCTA GGAGAGTGCA TTGCTCGTAA GCCCAGGAAG CACGCGGGTT TCAGGATGGT     300 GCATGGAAAT GGCATGAGCT TTGCTGGATA TGATTAGAGA CATTAACTAT TTTGGCGGAA     360 TGGAAGCACG ATTCCTCGCC CGGTAGAGCG GTAACCGCGA CATTCAGGAC CGTAAAAAGG     420 AAAGAGCATG CAACTGACCA ACAAGAAAAT CGTCGTCACC GGAGTGTCCT CCGGTATCGG     480 TGCCGAAACT GCCCGCGTTC TGCGCTCTCA CGGCGCCACA GTGATTGGCG TAGATCGCAA     540 CATGCCGAGC CTGACTCTGG ATGCTTTCGT TCAGGCTGAC CTGAGCCATC CTGAAGGCAT     600 CGATAAGGCC ATCGGGACAG CAAGCGAACC GGAATTGCCA GCTGGGGCGC CCTCTGGTAA     660 GGTTGGGAAG CCCTGCAAAG TAAACTGGAT GGCTTTCTTG CCGCCAAGGA TCTGATGGCG     720 CAGGGGATCA AGATCTGATC AAGAGACAGG ATGAGGATCG TTTCGCATGA TTGAACAAGA     780 TGGATTGCAC GCAGGTTCTC CGGCCGCTTG GGTGGAGAGG CTATTCGGCT ATGACTGGGC     840 ACAACAGACA ATCGGCTGCT CTGATGCCGC CGTGTTCCGG CTGTCAGCGC AGGGGCGCCC     900 GGTTCTTTTT GTCAAGACCG ACCTGTCCGG TGCCCTGAAT GAACTGCAGG ACGAGGCAGC     960 GCGGCTATCG TGGCTGGCCA CGACGGGCGT TCCTTGCGCA GCTGTGCTCG ACGTTGTCAC    1020 TGAAGCGGGA AGGGACTGGC TGCTATTGGG CGAAGTGCCG GGGCAGGATC TCCTGTCATC    1080 TCACCTTGCT CCTGCCGAGA AAGTATCCAT CATGGCTGAT GCAATGCGGC GGCTGCATAC    1140 GCTTGATCCG GCTACCTGCC CATTCGACCA CCAAGCGAAA CATCGCATCG AGCGAGCACG    1200 TACTCGGATG GAAGCCGGTC TTGTCGATCA GGATGATCTG GACGAAGAGC ATCAGGGGCT    1260 CGCGCCAGCC GAACTGTTCG CCAGGCTCAA GGCGCGCATG CCCGACGGCG AGGATCTCGT    1320 CGTGACCCAT GGCGATGCCT GCTTGCCGAA TATCATGGTG GAAAATGGCC GCTTTTCTGG    1380 ATTCATCGAC TGTGGCCGGC TGGGTGTGGC GGACCGCTAT CAGGACATAG CGTTGGCTAC    1440 CCGTGATATT GCTGAAGAGC TTGGCGGCGA ATGGGCTGAC CGCTTCCTCG TGCTTTACGG    1500 TATCGCCGCT CCCGATTCGC AGCGCATCGC CTTCTATCGC CTTCTTGACG AGTTCTTCTG    1560 AGCGGGACTC TGGGGTTCGA AATGACCGAC CAAGCGACGC CCTGGCCGCG GTGATTGCAT    1620 TCATGTGTGC TGAGGAGTCA CGTTGGATCA ACGGCATAAA TATTCCAGTG GACGGAGGTT    1680 TGGCATCGAC CTACGTGTAA GTTCGTGGAC GCCCTTTGCA CGCGCACTAT ATCTCTATGC    1740 AGCAGCTGAA AGCAGCTTTG GTTTTGATCG GAGGTAGCGG GCGGAAAGGT GCAGAATGTC    1800 TAAATAATAA AGGATTCTTG TGAAGCTTTA GTTGTCCGTA AACGAAAATA AAAATAAAGA    1860 GGAATGATAT GAAAGCAAGT AGATCAGTCT GCACTTTCAA AATAGCTACC CTGGCAGGCG    1920 CCATTTATGC AGCGCTGCCA ATGTCAGCTG CAAACTCGAT GCAGCTGGAT GTAGGTAGCT    1980 CGGATTGGAC GGTGCGTTGG GGACAACACC CTCAAGTATA GCCTTGCCTC TCGCCTGAAT    2040 GAGCAAGACT CAAGTCTGAC AAATGCGCCG ACTGTCAATG GTTATATCCG GATATTCAAA    2100 GTCAGGGTGA TCGTAACTTT GACCGGGGGC TTGGTATCCA ATCGTCTCGA TATTCTGGCT    2160 GCAG                                                                 2164

                            序列2 CTGCAGCCAG GGCTGAAAAG GAGGGATTCA GTGAGGTCAT GAAGGGAGGG GACGGCGCCT      60 GGCTCCAATT GCTCGATGGC GCCGCGATTG AGTGTCTTGG GCGCGGTCTT GGAGAGTTCG     120 GCTAGGGAGA TAAATTTGCT GGCCATGGTG GCGGCCCCTG ATGGGTTGGA TGATTTTCTG     180 CATTCTGCAT CATGAAATTC ATGAAATCAT CACTTTTCGG GGGGTGGGTG CACGGGATTG     240 AAGGTTGCTA GGAGAGTGCA TTGCTCGTAA GCCCAGGAAG CACGCGGGTT TCAGGATGGT     300 GCATGGAAAT GGCATGAGCT TTGCTGGATA TGATTAGAGA CATTAACTAT TTTGGCGGAA     360 TGGAAGCACG ATTCCTCGCC CGGTAGAGCG GTAACCGCGA CATTCAGGAC CGTAAAAAGG     420 AAAGAGCATG CAACTGACCA ACAAGAAAAT CGTCGTCACC GGAGTGTCCT CCGGTATCGG     480 TGCCGAAACT GCCCGCGTTC TGCGCTCTCA CGGCGCCACA GTGATTGGCG TAGATCGCAA     540 CATGCCGAGC CTGACTCTGG ATGCTTTCGT TCAGGCTGAC CTGAGCCATC CTGAGGGGAG     600 AGGCGGTTTG CGTATTGGGC GCATGCATAA AAACTGTTGT AATTCATTAA GCATTCTGCC     660 GACATGGAAG CCATCACAAA CGGCATGATG AACCTGAATC GCCAGCGGCA TCAGCACCTT     720 GTCGCCTTGC GTATAATATT TGCCCATGGA CGCACACCGT GGAAACGGAT GAAGGCACGA     780 ACCCAGTTGA CATAAGCCTG TTCGGTTCGT AAACTGTAAT GCAAGTAGCG TATGCGCTCA     840 CGCAACTGGT CCAGAACCTT GACCGAACGC AGCGGTGGTA ACGGCGCAGT GGCGGTTTTC     900 ATGGCTTGTT ATGACTGTTT TTTTGTACAG TCTATGCCTC GGGCATCCAA GCAGCAAGCG     960 CGTTACGCCG TGGGTCGATG TTTGATGTTA TGGAGCAGCA ACGATGTTAC GCAGCAGCAA     1020 CGATGTTACG CAGCAGGGCA GTCGCCCTAA AACAAAGTTA GGTGGCTCAA GTATGGGCAT     1080 CATTCGCACA TGTAGGCTCG GCCCTGACCA AGTCAAATCC ATGCGGGCTG CTCTTGATCT     1140 TTTCGGTCGT GAGTTCGGAG ACGTAGCCAC CTACTCCCAA CATCAGCCGG ACTCCGATTA     1200 CCTCGGGAAC TTGCTCCGTA GTAAGACATT CATCGCGCTT GCTGCCTTCG ACCAAGAAGC     1260 GGTTGTTGGC GCTCTCGCGG CTTACGTTCT GCCCAGGTTT GAGCAGCCGC GTAGTGAGAT     1320 CTATATCTAT GATCTCGCAG TCTCCGGCGA GCACCGGAGG CAGGGCATTG CCACCGCGCT     1380 CATCAATCTC CTCAAGCATG AGGCCAACGC GCTTGGTGCT TATGTGATCT ACGTGCAAGC     1440 AGATTACGGT GACGATCCCG CAGTGGCTCT CTATACAAAG TTGGGCATAC GGGAAGAAGT     1500 GATGCACTTT GATATCGACC CAAGTACCGC CACCTAACAA TTCGTTCAAG CCGAGATCGG     1560 CTTCCCTGAT TGCATTCATG TGTGCTGAGG AGTCACGTTG GATCAACGGC ATAAATATTC     1620 CAGTGGACGG AGGTTTGGCA TCGACCTACG TGTAAGTTCG TGGACGCCCT TTGCACGCGC     1680 ACTATATCTC TATGCAGCAG CTGAAAGCAG CTTTGGTTTT GATCGGAGGT AGCGGGCGGA     1740 AAGGTGCAGA ATGTCTAAAT AATAAAGGAT TCTTGTGAAG CTTTAGTTGT CCGTAAACGA     1800 AAATAAAAAT AAAGAGGAAT GATATGAAAG CAAGTAGATC AGTCTGCACT TTCAAAATAG     1860 CTACCCTGGC AGGCGCCATT TATGCAGCGC TGCCAATGTC AGCTGCAAAC TCGATGCAGC     1920 TGGATGTAGG TAGCTCGGAT TGGACGGTGC GTTGGGGACA ACACCCTCAA GTATAGCCTT     1980 GCCTCTCGCC TGAATGAGCA AGACTCAAGT CTGACAAATG CGCCGACTGT CAATGGTTAT     2040 ATCCGGATAT TCAAAGTCAG GGTGATCGTA ACTTTGACCG GGGGCTTGGT ATCCAATCGT     2100 CTCGATATTC TGGCTGCAG                                                  2119

                            序列3 CTGCAGCCAG GGCTGAAAAG GAGGGATTCA GTGAGGTCAT GAAGGGAGGG GACGGCGCCT      60 GGCTCCAATT GCTCGATGGC GCCGCGATTG AGTGTCTTGG GCGCGGTCTT GGAGAGTTCG     120 GCTAGGGAGA TAAATTTGCT GGCCATGGTG GCGGCCCCTG ATGGGTTGGA TGATTTTCTG     180 CATTCTGCAT CATGAAATTC ATGAAATCAT CACTTTTCGG GGGGTGGGTG CACGGGATTG     240 AAGGTTGCTA GGAGAGTGCA TTGCTCGTAA GCCCAGGAAG CACGCGGGTT TCAGGATGGT     300 GCATGGAAAT GGCATGAGCT TTGCTGGATA TGATTAGAGA CATTAACTAT TTTGGCGGAA     360 TGGAAGCACG ATTCCTCGCC CGGTAGAGCG GTAACCGCGA CATTCAGGAC CGTAAAAAGG     420 AAAGAGCATG CAACTGACCA ACAAGAAAAT CGTCGTCACC GGAGTGTCCT CCGGTATCGG     480 TGCCGAAACT GCCCGCGTTC TGCGCTCTCA CGGCGCCACA GTGATTGGCG TAGATCGCAA     540 CATGCCGAGC CTGACTCTGG ATGCTTTCGT TCAGGCTGAC CTGAGCCATC CTGAAGGCAT     600 CGATCAACGG CATAAATATT CCAGTGGACG GAGGTTTGGC ATCGACCTAC GTGTAAGTTC     660 GTGGACGCCC TTTGCACGCG CACTATATCT CTATGCAGCA GCTGAAAGCA GCTTTGGTTT     720 TGATCGGAGG TAGCGGGCGG AAAGGTGCAG AATGTCTAAA TAATAAAGGA TTCTTGTGAA     780 GCTTTAGTTG TCCGTAAACG AAAATAAAAA TAAAGAGGAA TGATATGAAA GCAAGTAGAT     840 CAGTCTGCAC TTTCAAAATA GCTACCCTGG CAGGCGCCAT TTATGCAGCG CTGCCAATGT     900 CAGCTGCAAA CTCGATGCAG CTGGATGTAG GTAGCTCGGA TTGGACGGTG CGTTGGGGAC     960 AACACCCTCA AGTATAGCCT TGCCTCTCGC CTGAATGAGC AAGACTCAAG TCTGACAAAT    1020 GCGCCGACTG TCAATGGTTA TATCCGGATA TTCAAAGTCA GGGTGATCGT AACTTTGACC    1080 GGGGGCTTGG TATCCAATCG TCTCGATATT CTGGCTGCAG                          1120

                            序列4 GAATTCCGCG TATCGCCCGG TTCTATCAGC GGGCCGCTTT CGAAAGTCAT GGTGTTAGCC      60 GGTAGGGTCT TTTTCTTGGC CATGCTTGTT GCCTGAACCT TCGTTGACAT AGGGCAGAGG     120 TGCGTTTGCC GCTTCGCTTC GCGATGAACC GCATCGAGAT GCTGAGGTCA GGATTTTTCC     180 TTAACTCGCG TAAGCATTCT GTCATTTTTT TGGTGGCTTT GAACAGCCTG ATGAAAGGTG     240 GTCTCGCCCT TTGAGGCCGA TTCTTGGGCG CTTGGCGGCG TCGAAGCGAT GCTCCACTAC     300 CGATTAAGAT AATTAAAATA AGGAAACCGC ATGGTTTCTT ATGTGAATTT GTCTGGCATA     360 CTCCAGCTCA AGGGCAATTT TTGGGCTATT GGCTGAGCAG TTGCCTCTAT ATGGTTATTC     420 AGAATAACAA TTGACTCCTC AGGAGGTCAG CGATGAGCAT TCTTGGTTTG AATGGTGCCC     480 CGGTCGGAGC TGAGCAGCTG GGCTCGGCTC TTGATCGCAT GAAGAAGGCG CACCTGGAGC     540 AGGGGCCTGC AAACTTGGAG CTGCGTCTGA GTAGGCTGGA TCGTGCGATT GCAATGCTTC     600 TGGAAAATCG TGAAGCAATT GCCGACGCGG TTTCTGCTGA CTTTGGCAAT CGCAGCCGTG     660 AGCAAACACT GCTTTGCGAC ATTGCTGGCT CGGTGGCAAG CCTGAAGGAT AGCCGCGAGC     720 ACGTGGCCAA ATGGATGGAG CCCGAACATC ACAAGGCGAT GTTTCCAGGG GCGGAGGCAC     780 GCGTTGAGTT TCAGCCGCTG GGTGTCGTTG GGGTCATTAG TCCCTGGAAC TTCCCTATCG     840 TACTGGCCTT TGGGCCGCTG GCCGGCATAT TCGCAGCAGG TAATCGCGCC ATGCTCAAGC     900 CGTCCGAGCT TACCCCGCGG ACTTCTGCCC TGCTTGCGGA GCTAATTGCT CGTTACTTCG     960 ATGAAACTGA GCTGACTACA GTGCTGGGCG ACGCTGAAGT CGGTGCGCTG TTCAGTGCTC    1020 AGCCTTTCGA TCATCTGATC TTCACCGGCG GCACTGCCGT GGCCAAGCAC ATCATGCGTG    1080 CCGCGGCGGA TAACCTAGTG CCCGTTACCC TGGAATTGGG TGGCAAATCG CCGGTGATCG    1140 TTTCCCGCAG TGCAGATATG GCGGACGTTG CACAACGGGT GTTGACGGTG AAAACCTTCA    1200 ATGCCGGGCA AATCTGTCTG GCACCGGACT ATGTGCTGCT GCCGGAAGGG ACAGCAAGCG    1260 AACCGGAATT GCCAGCTGGG GCGCCCTCTG GTAAGGTTGG GAAGCCCTGC AAAGTAAACT    1320 GGATGGCTTT CTTGCCGCCA AGGATCTGAT GGCGCAGGGG ATCAAGATCT GATCAAGAGA    1380 CAGGATGAGG ATCGTTTCGC ATGATTGAAC AAGATGGATT GCACGCAGGT TCTCCGGCCG    1440 CTTGGGTGGA GAGGCTATTC GGCTATGACT GGGCACAACA GACAATCGGC TGCTCTGATG    1500 CCGCCGTGTT CCGGCTGTCA GCGCAGGGGC GCCCGGTTCT TTTTGTCAAG ACCGACCTGT    1560 CCGGTGCCCT GAATGAACTG CAGGACGAGG CAGCGCGGCT ATCGTGGCTG GCCACGACGG    1620 GCGTTCCTTG CGCAGCTGTG CTCGACGTTG TCACTGAAGC GGGAAGGGAC TGGCTGCTAT    1680 TGGGCGAAGT GCCGGGGCAG GATCTCCTGT CATCTCACCT TGCTCCTGCC GAGAAAGTAT    1740 CCATCATGGC TGATGCAATG CGGCGGCTGC ATACGCTTGA TCCGGCTACC TGCCCATTCG    1800 ACCACCAAGC GAAACATCGC ATCGAGCGAG CACGTACTCG GATGGAAGCC GGTCTTGTCG    1860 ATCAGGATGA TCTGGACGAA GAGCATCAGG GGCTCGCGCC AGCCGAACTG TTCGCCAGGC    1920 TCAAGGCGCG CATGCCCGAC GGCGAGGATC TCGTCGTGAC CCATGGCGAT GCCTGCTTGC    1980 CGAATATCAT GGTGGAAAAT GGCCGCTTTT CTGGATTCAT CGACTGTGGC CGGCTGGGTG    2040 TGGCGGACCG CTATCAGGAC ATAGCGTTGG CTACCCGTGA TATTGCTGAA GAGCTTGGCG    2100 GCGAATGGGC TGACCGCTTC CTCGTGCTTT ACGGTATCGC CGCTCCCGAT TCGCAGCGCA    2160 TCGCCTTCTA TCGCCTTCTT GACGAGTTCT TCTGAGCGGG ACTCTGGGGT TCGAAATGAC    2220 CGACCAAGCG ACGCCCGCCA TGCCAAGCCT GTTCTCGTGC AAAGTCCTGT GGGTGAGTCG    2280 AACTTGGCGA TGCGCGCACC CTACGGAGAA GCGATCCACG GACTGCTCTC TGTCCTCCTT    2340 TCAACGGAGT GTTAGAACCG TTGGTAGTGG TTTTGGACGG GCCCAGGAGC ATGCGCTTCT    2400 GGGCCCGTTT CTTGAGTATT CATTGGATAG TCACGCGTGG TAGCTTCGAG CCTGCACAGC    2460 TGATGAGCAC CCTGGAAGGC GCGCTGTACG CGGACGACTG GGTTCATCTT CGCCATTCAT    2520 GACGGAACTC CGTTCCCCAG TACCGCGATG ACTATTTTGC CTCTTCCGAT GTCCGATTCC    2580 ACGCCGCCTG ACGCTAAGCG GGGGCGGGGG CGCCCGCATC CCAGCCCAGA CAGCAACAAA    2640 TGAGTAGGCT CTTGGATGCC GCGGCGGCTG AGATTGGTAA CGGCAATTTC GTCAATGTGA    2700 CGATGGATTC GATTGCCCGT GCTGCCGGCG TCTCAAAAAA AACGCTGTAC GTCTTGGTGG    2760 CGAGCAAGGA AGAACTCATT TCCCGGTTAG TGGCTCGAGA CATGTCCAAC CTTGAGGAAT    2820 TC                                                                   2822

                            序列5 GAATTCCGCG TATCGCCCGG TTCTATCAGC GGGCCGCTTT CGAAAGTCAT GGTGTTAGCC      60 GGTAGGGTCT TTTTCTTGGC CATGCTTGTT GCCTGAACCT TCGTTGACAT AGGGCAGAGG     120 TGCGTTTGCC GCTTCGCTTC GCGATGAACC GCATCGAGAT GCTGAGGTCA GGATTTTTCC     180 TTAACTCGCG TAAGCATTCT GTCATTTTTT TGGTGGCTTT GAACAGCCTG ATGAAAGGTG     240 GTCTCGCCCT TTGAGGCCGA TTCTTGGGCG CTTGGCGGCG TCGAAGCGAT GCTCCACTAC     300 CGATTAAGAT AATTAAAATA AGGAAACCGC ATGGTTTCTT ATGTGAATTT GTCTGGCATA     360 CTCCAGCTCA AGGGCAATTT TTGGGCTATT GGCTGAGCAG TTGCCTCTAT ATGGTTATTC     420 AGAATAACAA TTGACTCCTC AGGAGGTCAG CGATGAGCAT TCTTGGTTTG AATGGTGCCC     480 CGGTCGGAGC TGAGCAGCTG GGCTCGGCTC TTGATCGCAT GAAGAAGGCG CACCTGGAGC     540 AGGGGCCTGC AAACTTGGAG CTGCGTCTGA GTAGGCTGGA TCGTGCGATT GCAATGCTTC     600 TGGAAAATCG TGAAGCAATT GCCGACGCGG TTTCTGCTGA CTTTGGCAAT CGCAGCCGTG     660 AGCAAACACT GCTTTGCGAC ATTGCTGGCT CGGTGGCAAG CCTGAAGGAT AGCCGCGAGC     720 ACGTGGCCAA ATGGATGGAG CCCGAACATC ACAAGGCGAT GTTTCCAGGG GCGGAGGCAC     780 GCGTTGAGTT TCAGCCGCTG GGTGTCGTTG GGGTCATTAG TCCCTGGAAC TTCCCTATCG     840 TACTGGCCTT TGGGCCGCTG GCCGGCATAT TCGCAGCAGG TAATCGCGCC ATGCTCAAGC     900 CGTCCGAGCT TACCCCGCGG ACTTCTGCCC TGCTTGCGGA GCTAATTGCT CGTTACTTCG     960 ATGAAACTGA GCTGACTACA GTGCTGGGCG ACGCTGAAGT CGGTGCGCTG TTCAGTGCTC    1020 AGCCTTTCGA TCATCTGATC TTCACCGGCG GCACTGCCGT GGCCAAGCAC ATCATGCGTG    1080 CCGCGGCGGA TAACCTAGTG CCCGTTACCC TGGAATTGGG TGGCAAATCG CCGGTGATCG    1140 TTTCCCGCAG TGCAGATATG GCGGACGTTG CACAACGGGT GTTGACGGTG AAAACCTTCA    1200 ATGCCGGGCA AATCTGTCTG GCACCGGACT ATGTGCTGGG GGAGAGGCGG TTTGCGTATT    1260 GGGCGCATGC ATAAAAACTG TTGTAATTCA TTAAGCATTC TGCCGACATG GAAGCCATCA    1320 CAAACGGCAT GATGAACCTG AATCGCCAGC GGCATCAGCA CCTTGTCGCC TTGCGTATAA    1380 TATTTGCCCA TGGACGCACA CCGTGGAAAC GGATGAAGGC ACGAACCCAG TTGACATAAG    1440 CCTGTTCGGT TCGTAAACTG TAATGCAAGT AGCGTATGCG CTCACGCAAC TGGTCCAGAA    1500 CCTTGACCGA ACGCAGCGGT GGTAACGGCG CAGTGGCGGT TTTCATGGCT TGTTATGACT    1560 GTTTTTTTGT ACAGTCTATG CCTCGGGCAT CCAAGCAGCA AGCGCGTTAC GCCGTGGGTC    1620 GATGTTTGAT GTTATGGAGC AGCAACGATG TTACGCAGCA GCAACGATGT TACGCAGCAG    1680 GGCAGTCGCC CTAAAACAAA GTTAGGTGGC TCAAGTATGG GCATCATTCG CACATGTAGG    1740 CTCGGCCCTG ACCAAGTCAA ATCCATGCGG GCTGCTCTTG ATCTTTTCGG TCGTGAGTTC    1800 GGAGACGTAG CCACCTACTC CCAACATCAG CCGGACTCCG ATTACCTCGG GAACTTGCTC    1860 CGTAGTAAGA CATTCATCGC GCTTGCTGCC TTCGACCAAG AAGCGGTTGT TGGCGCTCTC    1920 GCGGCTTACG TTCTGCCCAG GTTTGAGCAG CCGCGTAGTG AGATCTATAT CTATGATCTC    1980 GCAGTCTCCG GCGAGCACCG GAGGCAGGGC ATTGCCACCG CGCTCATCAA TCTCCTCAAG    2040 CATGAGGCCA ACGCGCTTGG TGCTTATGTG ATCTACGTGC AAGCAGATTA CGGTGACGAT    2100 CCCGCAGTGG CTCTCTATAC AAAGTTGGGC ATACGGGAAG AAGTGATGCA CTTTGATATC    2160 GACCCAAGTA CCGCCACCTA ACAATTCGTT CAAGCCGAGA TCGGCTTCCC TGCAAAGTCC    2220 TGTGGGTGAG TCGAACTTGG CGATGCGCGC ACCCTACGGA GAAGCGATCC ACGGACTGCT    2280 CTCTGTCCTC CTTTCAACGG AGTGTTAGAA CCGTTGGTAG TGGTTTTGGA CGGGCCCAGG    2340 AGCATGCGCT TCTGGGCCCG TTTCTTGAGT ATTCATTGGA TAGTCACGCG TGGTAGCTTC    2400 GAGCCTGCAC AGCTGATGAG CACCCTGGAA GGCGCGCTGT ACGCGGACGA CTGGGTTCAT    2460 CTTCGCCATT CATGACGGAA CTCCGTTCCC CAGTACCGCG ATGACTATTT TGCCTCTTCC    2520 GATGTCCGAT TCCACGCCGC CTGACGCTAA GCGGGGGCGG GGGCGCCCGC ATCCCAGCCC    2580 AGACAGCAAC AAATGAGTAG GCTCTTGGAT GCCGCGGCGG CTGAGATTGG TAACGGCAAT    2640 TTCGTCAATG TGACGATGGA TTCGATTGCC CGTGCTGCCG GCGTCTCAAA AAAAACGCTG    2700 TACGTCTTGG TGGCGAGCAA GGAAGAACTC ATTTCCCGGT TAGTGGCTCG AGACATGTCC    2760 AACCTTGAGG AATTC                                                     2775

                            序列6 GAATTCCGCG TATCGCCCGG TTCTATCAGC GGGCCGCTTT CGAAAGTCAT GGTGTTAGCC      60 GGTAGGGTCT TTTTCTTGGC CATGCTTGTT GCCTGAACCT TCGTTGACAT AGGGCAGAGG     120 TGCGTTTGCC GCTTCGCTTC GCGATGAACC GCATCGAGAT GCTGAGGTCA GGATTTTTCC     180 TTAACTCGCG TAAGCATTCT GTCATTTTTT TGGTGGCTTT GAACAGCCTG ATGAAAGGTG     240 GTCTCGCCCT TTGAGGCCGA TTCTTGGGCG CTTGGCGGCG TCGAAGCGAT GCTCCACTAC     300 CGATTAAGAT AATTAAAATA AGGAAACCGC ATGGTTTCTT ATGTGAATTT GTCTGGCATA     360 CTCCAGCTCA AGGGCAATTT TTGGGCTATT GGCTGAGCAG TTGCCTCTAT ATGGTTATTC     420 AGAATAACAA TTGACTCCTC AGGAGGTCAG CGATGAGCAT TCTTGGTTTG AATGGTGCCC     480 CGGTCGGAGC TGAGCAGCTG GGCTCGGCTC TTGATCGCAT GAAGAAGGCG CACCTGGAGC     540 AGGGGCCTGC AAACTTGGAG CTGCGTCTGA GTAGGCTGGA TCGTGCGATT GCAATGCTTC     600 TGGAAAATCG TGAAGCAATT GCCGACGCGG TTTCTGCTGA CTTTGGCAAT CGCAGCCGTG     660 AGCAAACACT GCTTTGCGAC ATTGCTGGCT CGGTGGCAAG CCTGAAGGAT AGCCGCGAGC     720 ACGTGGCCAA ATGGATGGAG CCCGAACATC ACAAGGCGAT GTTTCCAGGG GCGGAGGCAC     780 GCGTTGAGTT TCAGCCGCTG GGTGTCGTTG GGGTCATTAG TCCCTGGAAC TTCCCTATCG     840 TACTGGCCTT TGGGCCGCTG GCCGGCATAT TCGCAGCAGG TAATCGCGCC ATGCTCAAGC     900 CGTCCGAGCT TACCCCGCGG ACTTCTGCCC TGCTTGCGGA GCTAATTGCT CGTTACTTCG     960 ATGAAACTGA GCTGACTACA GTGCTGGGCG ACGCTGAAGT CGGTGCGCTG TTCAGTGCTC    1020 AGCCTTTCGA TCATCTGATC TTCACCGGCG GCACTGCCGT GCCCAAGCAC ATCATGCGTG    1080 CCGCGGCGGA TAACCTAGTG CCCGTTACCC TGGAATTGGG TGGCAAATCG CCGGTGATCG    1140 TTTCCCGCAG TGCAGATATG GCGGACGTTG CACAACGGGT GTTGACGGTG AAAACCTTCA    1200 ATGCCGGGCA AATCTGTCTG GCACCGTGGG TGAGTCGAAC TTGGCGATGC GCGCACCCTA    1260 CGGAGAAGCG ATCCACGGAC TGCTCTCTGT CCTCCTTTCA ACGGAGTGTT AGAACCGTTG    1320 GTAGTGGTTT TGGACGGGCC CAGGAGCATG CGCTTCTGGG CCCGTTTCTT GAGTATTCAT    1380 TGGATAGTCA CGCGTGGTAG CTTCGAGCCT GCACAGCTGA TGAGCACCCT GGAAGGCGCG    1440 CTGTACGCGG ACGACTGGGT TCATCTTCGC CATTCATGAC GGAACTCCGT TCCCCAGTAC    1500 CGCGATGACT ATTTTGCCTC TTCCGATGTC CGATTCCACG CCGCCTGACG CTAAGCGGGG    1560 GCGGGGGCGC CCGCATCCCA GCCCAGACAG CAACAAATGA GTAGGCTCTT GGATGCCGCG    1620 GCGGCTGAGA TTGGTAACGG CAATTTCGTC AATGTGACGA TGGATTCGAT TGCCCGTGCT    1680 GCCGGCGTCT CAAAAAAAAC GCTGTACGTC TTGGTGGCGA GCAAGGAAGA ACTCATTTCC    1740 CGGTTAGTGG CTCGAGACAT GTCCAACCTT GAGGAATTC                           1779

                            序列7 CTGCAGCCGA GCATCGATTG AGCACTTTAC CCAGCTGCGC TGGCTGACCA TTCAGAATGG      60 CCCGCGGCAC TATCCAATCT AAATCGATCT TCGGGCGCCG CGGGCATCAT GCCCGCGGCG     120 CTCGCCTCAT TTCAATCTCT AACTTGATAA AAACAGAGCT GTTCTCCGGT CTTGGTGGAT     180 CAAGGCCAGT CGCGGAGAGT CTCGAAGAGG AGAGTACAGT GAACGCCGAG TCCACATTGC     240 AACCGCAGGC ATCATCATGC TCTGCTCAGC CACGCTACCG CAGTGTGTCG ATTGGTCATC     300 CTCCGGTTGA GGTTACGCAA GACGCTGGAG GTATTGTCCG GATGCGTTCT CTCGAGGCGC     360 TTCTTCCCTT CCCGGGTCGA ATTCTTGAGC GTCTCGAGCA TTGGGCTAAG ACCCGTCCAG     420 AACAAACCTG CGTTGCTGCC AGGGCGGCAA ATGGGGAATG GCGTCGTATC AGCTACGCGG     480 AAATGTTCCA CAACGTCCGC GCCATCGCAC AGAGCTTGCT TCCTTACGGA CTATCGGCAG     540 AGCGTCCGCT GCTTATCGTC TCTGGAAATG ACCTGGAACA TCTTCAGCTG GCATTTGGGG     600 CTATGTATGC GGGCATTCCC TATTGCCCGG TGTCTCCTGC TTATTCACTG CTGTCGCAAG     660 ATTTGGCGAA GCTGCGTCAC ATCGTAGGTC TTCTGCAACC GGGACTGGTC TTTGCTGCCG     720 ATGCAGCACC TTTCCAGGGG ACAGCAAGCG AACCGGAATT GCCAGCTGGG GCGCCCTCTG     780 GTAAGGTTGG GAAGCCCTGC AAAGTAAACT GGATGGCTTT CTTGCCGCCA AGGATCTGAT     840 GGCGCAGGGG ATCAAGATCT GATCAAGAGA CAGGATGAGG ATCGTTTCGC ATGATTGAAC     900 AAGATGGATT GCACGCAGGT TCTCCGGCCG CTTGGGTGGA GAGGCTATTC GGCTATGACT     960 GGGCACAACA GACAATCGGC TGCTCTGATG CCGCCGTGTT CCGGCTGTCA GCGCAGGGGC    1020 GCCCGGTTCT TTTTGTCAAG ACCGACCTGT CCGGTGCCCT GAATGAACTG CAGGACGAGG    1080 CAGCGCGGCT ATCGTGGCTG GCCACGACGG GCGTTCCTTG CGCAGCTGTG CTCGACGTTG    1140 TCACTGAAGC GGGAAGGGAC TGGCTGCTAT TGGGCGAAGT GCCGGGGCAG GATCTCCTGT    1200 CATCTCACCT TGCTCCTGCC GAGAAAGTAT CCATCATGGC TGATGCAATG CGGCGGCTGC    1260 ATACGCTTGA TCCGGCTACC TGCCCATTCG ACCACCAAGC GAAACATCGC ATCGAGCGAG    1320 CACGTACTCG GATGGAAGCC GGTCTTGTCG ATCAGGATGA TCTGGACGAA GAGCATCAGG    1380 GGCTCGCGCC AGCCGAACTG TTCGCCAGGC TCAAGGCGCG CATGCCCGAC GGCGAGGATC    1440 TCGTCGTGAC CCATGGCGAT GCCTGCTTGC CGAATATCAT GGTGGAAAAT GGCCGCTTTT    1500 CTGGATTCAT CGACTGTGGC CGGCTGGGTG TGGCGGACCG CTATCAGGAC ATAGCGTTGG    1560 CTACCCGTGA TATTGCTGAA GAGCTTGGCG GCGAATGGGC TGACCGCTTC CTCGTGCTTT    1620 ACGGTATCGC CGCTCCCGAT TCGCAGCGCA TCGCCTTCTA TCGCCTTCTT GACGAGTTCT    1680 TCTGAGCGGG ACTCTGGGGT TCGAAATGAC CGACCAAGCG ACGCCCCTGT TTTGCAATGG    1740 CGGTCGGCGA AAGTTGATGC GCTGTATCGT GGTGAAGATC AATCCATGCT GCGTGACGAG    1800 GCCACACTGT GAGTTGGTCA GGGGGGGCTT ACTCGGCGTT TTCCGACACT GCGTTGGTTG    1860 CGGCAGTGCG CACCCCCTGG ATTGATTGCG GGGGTGCCCT GTCGCTGGTG TCGCCTATCG    1920 ACTTAGGGGT AAAGGTCGCT CGCGAAGTTC TGATGCGTGC GTCGCTTGAA CCACAAATGG    1980 TCGATAGCGT ACTCGCAGGC TCTATGGCTC AAGCAAGCTT TGATGCTTAC CTGCTCCCGC    2040 GGCACATTGG CTTGTACAGC GGTGTTCCCA AGTCGGTTCC GGCCTTGGGG GTGCAGCGCA    2100 TTTGCGGCAC AGGCTTCGAA CTGCTTCGGC AGGCCGGCGA GCAGATTTCC CAAGGCGCTG    2160 ATCACGTGCT GTGTGTCGCG GGCTGCAG                                       2188

                           序列8 CTGCAGCCGA GCATCGATTG AGCACTTTAC CCAGCTGCGC TGGCTGACCA TTCAGAATGG      60 CCCGCGGCAC TATCCAATCT AAATCGATCT TCGGGCGCCG CGGGCATCAT GCCCGCGGCG     120 CTCGCCTCAT TTCAATCTCT AACTTGATAA AAACAGAGCT GTTCTCCGGT CTTGGTGGAT     180 CAAGGCCAGT CGCGGAGAGT CTCGAAGAGG AGAGTACAGT GAACGCCGAG TCCACATTGC     240 AACCGCAGGC ATCATCATGC TCTGCTCAGC CACGCTACCG CAGTGTGTCG ATTGGTCATC     300 CTCCGGTTGA GGTTACGCAA GACGCTGGAG GTATTGTCCG GATGCGTTCT CTCGAGGCGC     360 TTCTTCCCTT CCCGGGTCGA ATTCTTGAGC GTCTCGAGCA TTGGGCTAAG ACCCGTCCAG     420 AACAAACCTG CGTTGCTGCC AGGGCGGCAA ATGGGGAATG GCGTCGTATC AGCTACGCGG     480 AAATGTTCCA CAACGTCCGC GCCATCGCAC AGAGCTTGCT TCCTTACGGA CTATCGGCAG     540 AGCGTCCGCT GCTTATCGTC TCTGGAAATG ACCTGGAACA TCTTCAGCTG GCATTTGGGG     600 CTATGTATGC GGGCATTCCC TATTGCCCGG TGTCTCCTGC TTATTCACTG CTGTCGCAAG     660 ATTTGGCGAA GCTGCGTCAC ATCGTAGGTC TTCTGCAACC GGGACTGGTC TTTGCTGCCG     720 ATGCAGCACC TTTCCAGGGG GAGAGGCGGT TTGCGTATTG GGCGCATGCA TAAAAACTGT     780 TGTAATTCAT TAAGCATTCT GCCGACATGG AAGCCATCAC AAACGGCATG ATGAACCTGA     840 ATCGCCAGCG GCATCAGCAC CTTGTCGCCT TGCGTATAAT ATTTGCCCAT GGACGCACAC     900 CGTGGAAACG GATGAAGGCA CGAACCCAGT TGACATAAGC CTGTTCGGTT CGTAAACTGT     960 AATGCAAGTA GCGTATGCGC TCACGCAACT GGTCCAGAAC CTTGACCGAA CGCAGCGGTG    1020 GTAACGGCGC AGTGGCGGTT TTCATGGCTT GTTATGACTG TTTTTTTGTA CAGTCTATGC    1080 CTCGGGCATC CAAGCAGCAA GCGCGTTACG CCGTGGGTCG ATGTTTGATG TTATGGAGCA    1140 GCAACGATGT TACGCAGCAG CAACGATGTT ACGCAGCAGG GCAGTCGCCC TAAAACAAAG    1200 TTAGGTGGCT CAAGTATGGG CATCATTCGC ACATGTAGGC TCGGCCCTGA CCAAGTCAAA    1260 TCCATGCGGG CTGCTCTTGA TCTTTTCGGT CGTGAGTTCG GAGACGTAGC CACCTACTCC    1320 CAACATCAGC CGGACTCCGA TTACCTCGGG AACTTGCTCC GTAGTAAGAC ATTCATCGCG    1380 CTTGCTGCCT TCGACCAAGA AGCGGTTGTT GGCGCTCTCG CGGCTTACGT TCTGCCCAGG    1440 TTTGAGCAGC CGCGTAGTGA GATCTATATC TATGATCTCG CAGTCTCCGG CGAGCACCGG    1500 AGGCAGGGCA TTGCCACCGC GCTCATCAAT CTCCTCAAGC ATGAGGCCAA CGCGCTTGGT    1560 GCTTATGTGA TCTACGTGCA AGCAGATTAC GGTGACGATC CCGCAGTGGC TCTCTATACA    1620 AAGTTGGGCA TACGGGAAGA AGTGATGCAC TTTGATATCG ACCCAAGTAC CGCCACCTAA    1680 CAATTCGTTC AAGCCGAGAT CGGCTTCCCC TGTTTTGCAA TGGCGGTCGG CGAAAGTTGA    1740 TGCGCTGTAT CGTGGTGAAG ATCAATCCAT GCTGCGTGAC GAGGCCACAC TGTGAGTTGG    1800 TCAGGGGGGG CTTACTCGGC GTTTTCCGAC ACTGCGTTGG TTGCGGCAGT GCGCACCCCC    1860 TGGATTGATT GCGGGGGTGC CCTGTCGCTG GTGTCGCCTA TCGACTTAGG GGTAAAGGTC    1920 GCTCGCGAAG TTCTGATGCG TGCGTCGCTT GAACCACAAA TGGTCGATAG CGTACTCGCA    1980 GGCTCTATGG CTCAAGCAAG CTTTGATGCT TACCTGCTCC CGCGGCACAT TGGCTTGTAC    2040 AGCGGTGTTC CCAAGTCGGT TCCGGCCTTG GGGGTGCAGC GCATTTGCGG CACAGGCTTC    2100 GAACTGCTTC GGCAGGCCGG CGAGCAGATT TCCCAAGGCG CTGATCACGT GCTGTGTGTC    2160 GCGGGCTGCA G                                                         2171

                            序列9 CTGCAGCCGA GCATCGATTG AGCACTTTAC CCAGCTGCGC TGGCTGACCA TTCAGAATGG      60 CCCGCGGCAC TATCCAATCT AAATCGATCT TCGGGCGCCG CGGGCATCAT GCCCGCGGCG     120 CTCGCCTCAT TTCAATCTCT AACTTGATAA AAACAGAGCT GTTCTCCGGT CTTGGTGGAT     180 CAAGGCCAGT CGCGGAGAGT CTCGAAGAGG AGAGTACAGT GAACGCCGAG TCCACATTGC     240 AACCGCAGGC ATCATCATGC TCTGCTCAGC CACGCTACCG CAGTGTGTCG ATTGGTCATC     300 CTCCGGTTGA GGTTACGCAA GACGCTGGAG GTATTGTCCG GATGCGTTCT CTCGAGGCGC     360 TTCTTCCCTT CCCGGGTCGA ATTCTTGAGC GTCTCGAGCA TTGGGCTAAG ACCCGTCCAG     420 AACAAACCTG CGTTGCTGCC AGGGCGGCAA ATGGGGAATG GCGTCGTATC AGCTACGCGG     480 AAATGTTCCA CAACGTCCGC GCCATCGCAC AGAGCTTGCT TCCTTACGGA CTATCGGCAG     540 AGCGTCCGCT GCTTATCGTC TCTGGAAATG ACCTGGAACA TCTTCAGCTG GCATTTGGGG     600 CTATGTATGC GGGCATTCCC TATTGCCCGG TGTCTCCTGC TTATTCACTG CTGTCGCAAG     660 ATTTGGCGAA GCTGCGTCAC ATCGTAGGTC TTCTGCAACC GGGACTGGTC TTTGCTGCCG     720 ATGCAGCACC TTTCCAGCGC GCTGTTTTGC AATGGCGGTC GGCGAAAGTT GATGCGCTGT     780 ATCGTGGTGA AGATCAATCC ATGCTGCGTG ACGAGGCCAC ACTGTGAGTT GGTCAGGGGG     840 GGCTTACTCG GCGTTTTCCG ACACTGCGTT GGTTGCGGCA GTGCGCACCC CCTGGATTGA     900 TTGCGGGGGT GCCCTGTCGC TGGTGTCGCC TATCGACTTA GGGGTAAAGG TCGCTCGCGA     960 AGTTCTGATG CGTGCGTCGC TTGAACCACA AATGGTCGAT AGCGTACTCG CAGGCTCTAT    1020 GGCTCAAGCA AGCTTTGATG CTTACCTGCT CCCGCGGCAC ATTGGCTTGT ACAGCGGTGT    1080 TCCCAAGTCG GTTCCGGCCT TGGGGGTGCA GCGCATTTGC GGCACAGGCT TCGAACTGCT    1140 TCGGCAGGCC GGCGAGCAGA TTTCCCAAGG CGCTGATCAC GTGCTGTGTG TCGCGGGCTG    1200 CAG                                                                  1203

                            序列10 GAATTCCCCT GGCGACGAAA GGGCGGCAGG CCGCATGGCC ACGGCTGGGC GGTAACTGAT      60 GCTTGCGTTA ATCGTTAACC GTTTGAAATT CCTTGCCAAA TTTCGGCGAG AGAATCATGC     120 GGGTACGCCT TTCCGTGCGC TTTGATCTGC GCTTCCGTGC CTTGAATCAG AAAAATAGTT     180 AATTGACAGA ACTATAGGTT CGCAGTAGCT TTTGCTCACC CACCAAATCC ACAGCACTGG     240 GGTGCACGAT GAATAGCTAC GATGGCCGTT GGTCTACCGT TGATGTGAAG GTTGAAGAAG     300 GTATCGCTTG GGTCACGCTG AACCGCCCGG AGAAGCGCAA CGCAATGAGC CCAACTCTCA     360 ATCGAGAGAT GGTCGAGGTT CTGGAGGTGC TGGAGCAGGA CGCAGATGCT CGCGTGCTTG     420 TTCTGACTGG TGCAGGCGAA TCCTGGACCG CGGGCATGGA CCTGAAGGAG TATTTCCGCG     480 AGACCGATGC TGGCCCCGAA ATTCTGCAAG AGAAGATTCG TCGGGGACAG CAAGCGAACC     540 GGAATTGCCA GCTGGGGCGC CCTCTGGTAA GGTTGGGAAG CCCTGCAAAG TAAACTGGAT     600 GGCTTTCTTG CCGCCAAGGA TCTGATGGCG CAGGGGATCA AGATCTGATC AAGAGACAGG     660 ATGAGGATCG TTTCGCATGA TTGAACAAGA TGGATTGCAC GCAGGTTCTC CGGCCGCTTG     720 GGTGGAGAGG CTATTCGGCT ATGACTGGGC ACAACAGACA ATCGGCTGCT CTGATGCCGC     780 CGTGTTCCGG CTGTCAGCGC AGGGGCGCCC GGTTCTTTTT GTCAAGACCG ACCTGTCCGG     840 TGCCCTGAAT GAACTGCAGG ACGAGGCAGC GCGGCTATCG TGGCTGGCCA CGACGGGCGT     900 TCCTTGCGCA GCTGTGCTCG ACGTTGTCAC TGAAGCGGGA AGGGACTGGC TGCTATTGGG     960 CGAAGTGCCG GGGCAGGATC TCCTGTCATC TCACCTTGCT CCTGCCGAGA AAGTATCCAT    1020 CATGGCTGAT GCAATGCGGC GGCTGCATAC GCTTGATCCG GCTACCTGCC CATTCGACCA    1080 CCAAGCGAAA CATCGCATCG AGCGAGCACG TACTCGGATG GAAGCCGGTC TTGTCGATCA    1140 GGATGATCTG GACGAAGAGC ATCAGGGGCT CGCGCCAGCC GAACTGTTCG CCAGGCTCAA    1200 GGCGCGCATG CCCGACGGCG AGGATCTCGT CGTGACCCAT GGCGATGCCT GCTTGCCGAA    1260 TATCATGGTG GAAAATGGCC GCTTTTCTGG ATTCATCGAC TGTGGCCGGC TGGGTGTGGC    1320 GGACCGCTAT CAGGACATAG CGTTGGCTAC CCGTGATATT GCTGAAGAGC TTGGCGGCGA    1380 ATGGGCTGAC CGCTTCCTCG TGCTTTACGG TATCGCCGCT CCCGATTCGC AGCGCATCGC    1440 CTTCTATCGC CTTCTTGACG AGTTCTTCTG AGCGGGACTC TGGGGTTCGA AATGACCGAC    1500 CAAGCGACGC CCCGAGCAGG GCATGAAGCA GTTCCTTGAC GAGAAAAGCA TCAAGCCGGG    1560 CTTGCAGACC TACAAGCGCT GATAAATGCG CCGGGGCCCT CGCTGCGCCC CCGGCCTTCC    1620 AATAATGACA ATAATGAGGA GTGCCCAATG TTTCACGTGC CCCTGCTTAT TGGTGGTAAG    1680 CCTTGTTCAG CATCTGATGA GCGCACCTTC GAGCGTCGTA GCCCGCTGAC CGGAGAAGTG    1740 GTATCGCGCG TCGCTGCTGC CAGTTTGGAA GATGCGGACG CCGCAGTGGC CGCTGCACAG    1800 GCTGCGTTTC CTGAATGGGC GGCGCTTGCT CCGAGCGAAC GCCGTGCCCG ACTGCTGCGA    1860 GCGGCGGATC TTCTAGAGGA CCGTTCTTCC GAGTTCACCG CCGCAGCGAG TGAAACTGGC    1920 GCAGCGGGAA ACTGGTATGG GTTTAACGTT TACCTGGCGG CGGGCATGTT GCGGGGAATT    1980 C                                                                    1981

                            序列11 GAATTCCCCT GGCGACGAAA GGGCGGCAGG CCGCATGGCC ACGGCTGGGC GGTAACTGAT      60 GCTTGCGTTA ATCGTTAACC GTTTGAAATT CCTTGCCAAA TTTCGGCGAG AGAATCATGC     120 GGGTACGCCT TTCCGTGCGC TTTGATCTGC GCTTCCGTGC CTTGAATCAG AAAAATAGTT     180 AATTGACAGA ACTATAGGTT CGCAGTAGCT TTTGCTCACC CACCAAATCC ACAGCACTGG     240 GGTGCACGAT GAATAGCTAC GATGGCCGTT GGTCTACCGT TGATGTGAAG GTTGAAGAAG     300 GTATCGCTTG GGTCACGCTG AACCGCCCGG AGAAGCGCAA CGCAATGAGC CCAACTCTCA     360 ATCGAGAGAT GGTCGAGGTT CTGGAGGTGC TGGAGCAGGA CGCAGATGCT CGCGTGCTTG     420 TTCTGACTGG TGCAGGCGAA TCCTGGACCG CGGGCATGGA CCTGAAGGAG TATTTCCGCG     480 AGACCGATGC TGGCCCCGAA ATTCTGCAAG AGAAGATTCG TCGGGGGAGA GGCGGTTTGC     540 GTATTGGGCG CATGCATAAA AACTGTTGTA ATTCATTAAG CATTCTGCCG ACATGGAAGC     600 CATCACAAAC GGCATGATGA ACCTGAATCG CCAGCGGCAT CAGCACCTTG TCGCCTTGCG     660 TATAATATTT GCCCATGGAC GCACACCGTG GAAACGGATG AAGGCACGAA CCCAGTTGAC     720 ATAAGCCTGT TCGGTTCGTA AACTGTAATG CAAGTAGCGT ATGCGCTCAC GCAACTGGTC     780 CAGAACCTTG ACCGAACGCA GCGGTGGTAA CGGCGCAGTG GCGGTTTTCA TGGCTTGTTA     840 TGACTGTTTT TTTGTACAGT CTATGCCTCG GGCATCCAAG CAGCAAGCGC GTTACGCCGT     900 GGGTCGATGT TTGATGTTAT GGAGCAGCAA CGATGTTACG CAGCAGCAAC GATGTTACGC     960 AGCAGGGCAG TCGCCCTAAA ACAAAGTTAG GTGGCTCAAG TATGGGCATC ATTCGCACAT    1020 GTAGGCTCGG CCCTGACCAA GTCAAATCCA TGCGGGCTGC TCTTGATCTT TTCGGTCGTG    1080 AGTTCGGAGA CGTAGCCACC TACTCCCAAC ATCAGCCGGA CTCCGATTAC CTCGGGAACT    1140 TGCTCCGTAG TAAGACATTC ATCGCGCTTG CTGCCTTCGA CCAAGAAGCG GTTGTTGGCG    1200 CTCTCGCGGC TTACGTTCTG CCCAGGTTTG AGCAGCCGCG TAGTGAGATC TATATCTATG    1260 ATCTCGCAGT CTCCGGCGAG CACCGGAGGC AGGGCATTGC CACCGCGCTC ATCAATCTCC    1320 TCAAGCATGA GGCCAACGCG CTTGGTGCTT ATGTGATCTA CGTGCAAGCA GATTACGGTG    1380 ACGATCCCGC AGTGGCTCTC TATACAAAGT TGGGCATACG GGAAGAAGTG ATGCACTTTG    1440 ATATCGACCC AAGTACCGCC ACCTAACAAT TCGTTCAAGC CGAGATCGGC TTCCCCGAGC    1500 AGGGCATGAA GCAGTTCCTT GACGAGAAAA GCATCAAGCC GGGCTTGCAG ACCTACAAGC    1560 GCTGATAAAT GCGCCGGGGC CCTCGCTGCG CCCCCGGCCT TCCAATAATG ACAATAATGA    1620 GGAGTGCCCA ATGTTTCACG TGCCCCTGCT TATTGGTGGT AAGCCTTGTT CAGCATCTGA    1680 TGAGCGCACC TTCGAGCGTC GTAGCCCGCT GACCGGAGAA GTGGTATCGC GCGTCGCTGC    1740 TGCCAGTTTG GAAGATGCGG ACGCCGCAGT GGCCGCTGCA CAGGCTGCGT TTCCTGAATG    1800 GGCGGCGCTT GCTCCGAGCG AACGCCGTGC CCGACTGCTG CGAGCGGCGG ATCTTCTAGA    1860 GGACCGTTCT TCCGAGTTCA CCGCCGCAGC GAGTGAAACT GGCGCAGCGG GAAACTGGTA    1920 TGGGTTTAAC GTTTACCTGG CGGCGGGCAT GTTGCGGGGA ATTC                     1964

                            序列12 GAATTCCCCT GGCGACGAAA GGGCGGCAGG CCGCATGGCC ACGGCTGGGC GGTAACTGAT      60 GCTTGCGTTA ATCGTTAACC GTTTGAAATT CCTTGCCAAA TTTCGGCGAG AGAATCATGC     120 GGGTACGCCT TTCCGTGCGC TTTGATCTGC GCTTCCGTGC CTTGAATCAG AAAAATAGTT     180 AATTGACAGA ACTATAGGTT CGCAGTAGCT TTTGCTCACC CACCAAATCC ACAGCACTGG     240 GGTGCACGAT GAATAGCTAC GATGGCCGTT GGTCTACCGT TGATGTGAAG GTTGAAGAAG     300 GTATCGCTTG GGTCACGCTG AACCGCCCGG AGAAGCGCAA CGCAATGAGC CCAACTCTCA     360 ATCGAGAGAT GGTCGAGGTT CTGGAGGTGC TGGAGCAGGA CGCAGATGCT CGCGTGCTTG     420 TTCTGACTGG TGCAGGCGAA TCCTGGACCG CGGGCATGGA CCTGAAGGAG TATTTCCGCG     480 AGACCGATGC TGGCCCCGAA ATTCTGCAAG AGAAGATTCG TCGCGAGCAG GGCATGAAGC     540 AGTTCCTTGA CGAGAAAAGC ATCAAGCCGG GCTTGCAGAC CTACAAGCGC TGATAAATGC     600 GCCGGGGCCC TCGCTGCGCC CCCGGCCTTC CAATAATGAC AATAATGAGG AGTGCCCAAT     660 GTTTCACGTG CCCCTGCTTA TTGGTGGTAA GCCTTGTTCA GCATCTGATG AGCGCACCTT     720 CGAGCGTCGT AGCCCGCTGA CCGGAGAAGT GGTATCGCGC GTCGCTGCTG CCAGTTTGGA     780 AGATGCGGAC GCCGCAGTGG CCGCTGCACA GGCTGCGTTT CCTGAATGGG CGGCGCTTGC     840 TCCGAGCGAA CGCCGTGCCC GACTGCTGCG AGCGGCGGAT CTTCTAGAGG ACCGTTCTTC     900 CGAGTTCACC GCCGCAGCGA GTGAAACTGG CGCAGCGGGA AACTGGTATG GGTTTAACGT     960 TTACCTGGCG GCGGGCATGT TGCGGGGAAT TC                                   992

                            序列13 GAATTCCAAT AATGACAATA ATGAGGAGTG CCCAATGTTT CACGTGCCCC TGCTTATTGG      60 TGGTAAGCCT TGTTCAGCAT CTGATGAGCG CACCTTCGAG CGTCGTAGCC CGCTGACCGG     120 AGAAGTGGTA TCGCGCGTCG CTGCTGCCAG TTTGGAAGAT GCGGACGCCG CAGTGGCCGC     180 TGCACAGGCT GCGTTTCCTG AATGGGCGGC GCTTGCTCCG AGCGAACGCC GTGCCCGACT     240 GCTGCGAGCG GCGGATCTTC TAGAGGACCG TTCTTCCGAG TTCACCGCCG CAGCGAGTGA     300 AACTGGCGCA GCGGGAAACT GGTATGGGTT TAACGTTTAC CTGGCGGCGG GCATGTTGCG     360 GGAAGCCGCG GCCATGACCA CACAGATTCA GGGCGATGTC ATTCCGTCCA ATGTGCCCGG     420 TAGCTTTGCC ATGGCGGTTC GACAGCCATG TGGCGTGGTG CTCGGTATTG CGCCTTGGAA     480 TGCTCCGGTA ATCCTTGGCG TACGGGCTGT TGCGATGCCG TTGGCATGCG GCAATACCGT     540 GGTGTTGAAA AGCTCTGAGC TGAGTCCCTT TACCCATCGC CTGATTGGTC AGGTGTTGCA     600 TGATGCTGGT CTGGGGGATG GCGTGGTGAA TGTCATCAGC AATGCCCCGC AAGACGCTCC     660 TGCGGTGGTG GAGCGACTGA TTGCAAATCC TGCGGTACGT CGAGTGAACT TCACCGGTTC     720 GACCCACGTT GGACGGATCA TTGGTGAGCT GTCTGCGCGT CATCTGAAGC CTGCTGTGCT     780 GGAATTAGGT GGTAAGGCTC CGTTCTTGGT CTTGGACGAT GCCGACCTCG ATGCGGCGGT     840 CGAAGCGGCG GCCTTTGGTG CCTACTTCAATCAGGGTCAA ATCTGCATGT CCACTGAGCG      900 TCTGATTGTG ACAGCAGTCG CAGACGCCTT TGTTGAAAAG CTGGCGAGGA AGGTCGCCAC     960 ACTGCGTGCT GGCGATCCTA ATGATCCGCA ATCGGTCTTG GGTTCGTTGA TTGATGCCAA    1020 TGCAGGTCAA CGCATCCAGG TTCTGGTCGA TGATGCGCTC GGGGACAGCA AGCGAACCGG    1080 AATTGCCAGC TGGGGCGCCC TCTGGTAAGG TTGGGAAGCC CTGCAAAGTA AACTGGATGG    1140 CTTTCTTGCC GCCAAGGATC TGATGGCGCA GGGGATCAAG ATCTGATCAA GAGACAGGAT    1200 GAGGATCGTT TCGCATGATT GAACAAGATG GATTGCACGC AGGTTCTCCG GCCGCTTGGG    1260 TGGAGAGGCT ATTCGGCTAT GACTGGGCAC AACAGACAAT CGGCTGCTCT GATGCCGCCG    1320 TGTTCCGGCT GTCAGCGCAG GGGCGCCCGG TTCTTTTTGT CAAGACCGAC CTGTCCGGTG    1380 CCCTGAATGA ACTGCAGGAC GAGGCAGCGC GGCTATCGTG GCTGGCCACG ACGGGCGTTC    1440 CTTGCGCAGC TGTGCTCGAC GTTGTCACTG AAGCGGGAAG GGACTGGCTG CTATTGGGCG    1500 AAGTGCCGGG GCAGGATCTC CTGTCATCTC ACCTTGCTCC TGCCGAGAAA GTATCCATCA    1560 TGGCTGATGC AATGCGGCGG CTGCATACGC TTGATCCGGC TACCTGCCCA TTCGACCACC    1620 AAGCGAAACA TCGCATCGAG CGAGCACGTA CTCGGATGGA AGCCGGTCTT GTCGATCAGG    1680 ATGATCTGGA CGAAGAGCAT CAGGGGCTCG CGCCAGCCGA ACTGTTCGCC AGGCTCAAGG    1740 CGCGCATGCC CGACGGCGAG GATCTCGTCG TGACCCATGG CGATGCCTGC TTGCCGAATA    1800 TCATGGTGGA AAATGGCCGC TTTTCTGGAT TCATCGACTG TGGCCGGCTG GGTGTGGCGG    1860 ACCGCTATCA GGACATAGCG TTGGCTACCC GTGATATTGC TGAAGAGCTT GGCGGCGAAT    1920 GGGCTGACCG CTTCCTCGTG CTTTACGGTA TCGCCGCTCC CGATTCGCAG CGCATCGCCT    1980 TCTATCGCCT TCTTGACGAG TTCTTCTGAG CGGGACTCTG GGGTTCGAAA TGACCGACCA    2040 AGCGACGCCC GGCCCAGCGC GTCGATTCGG GCATTTGCCA TATCAATGGA CCGACTGTGC    2100 ATGACGAGGC TCAGATGCCA TTCGGTGGGG TGAAGTCCAG CGGCTACGGC AGCTTCGGCA    2160 GTCGAGCATC GATTGAGCAC TTTACCCAGC TGCGCTGGCT GACCATTCAG AATGGCCCGC    2220 GGCACTATCC AATCTAAATC GATCTTCGGG CGCCGCGGGC ATCATGCCCG CGGCGCTCGC    2280 CTCATTTCAA TCTCTAACTT GATAAAAACA GAGCTGTTCT CCGGTCTTGG TGGATCAAGG    2340 CCAGTCGCGG AGAGTCTCGA AGAGGAGAGT ACAGTGAACG CCGAGTCCAC ATTGCAACCG    2400 CAGGCATCAT CATGCTCTGC TCAGCCACGC TACCGCAGTG TGTCGATTGG TCATCCTCCG    2460 GTTGAGGTTA CGCAAGACGC TGGAGGTATT GTCCGGATGC GTTCTCTCGA GGCGCTTCTT    2520 CCCTTCCCGG GTGGAATTC                                                 2539

                            序列14 GAATTCCAAT AATGACAATA ATGAGGAGTG CCCAATGTTT CACGTGCCCC TGCTTATTGG      60 TGGTAAGCCT TGTTCAGCAT CTGATGAGCG CACCTTCGAG CGTCGTAGCC CGCTGACCGG     120 AGAAGTGGTA TCGCGCGTCG CTGCTGCCAG TTTGGAAGAT GCGGACGCCG CAGTGGCCGC     180 TGCACAGGCT GCGTTTCCTG AATGGGCGGC GCTTGCTCCG AGCGAACGCC GTGCCCGACT     240 GCTGCGAGCG GCGGATCTTC TAGAGGACCG TTCTTCCGAG TTCACCGCCG CAGCGAGTGA     300 AACTGGCGCA GCGGGAAACT GGTATGGGTT TAACGTTTAC CTGGCGGCGG GCATGTTGCG     360 GGAAGCCGCG GCCATGACCA CACAGATTCA GGGCGATGTC ATTCCGTCCA ATGTGCCCGG     420 TAGCTTTGCC ATGGCGGTTC GACAGCCATG TGGCGTGGTG CTCGGTATTG CGCCTTGGAA     480 TGCTCCGGTA ATCCTTGGCG TACGGGCTGT TGCGATGCCG TTGGCATGCG GCAATACCGT     540 GGTGTTGAAA AGCTCTGAGC TGAGTCCCTT TACCCATCGC CTGATTGGTC AGGTGTTGCA     600 TGATGCTGGT CTGGGGGATG GCGTGGTGAA TGTCATCAGC AATGCCCCGC AAGACGCTCC     660 TGCGGTGGTG GAGCGACTGA TTGCAAATCC TGCGGTACGT CGAGTGAACT TCACCGGTTC     720 GACCCACGTT GGACGGATCA TTGGTGAGCT GTCTGCGCGT CATCTGAAGC CTGCTGTGCT     780 GGAATTAGGT GGTAAGGCTC CGTTCTTGGT CTTGGACGAT GCCGACCTCG ATGCGGCGGT     840 CGAAGCGGCG GCCTTTGGTG CCTACTTCAA TCAGGGTCAA ATCTGCATGT CCACTGAGCG     900 TCTGATTGTG ACAGCAGTCG CAGACGCCTT TGTTGAAAAG CTGGCGAGGA AGGTCGCCAC     960 ACTGCGTGCT GGCGATCCTA ATGATCCGCA ATCGGTCTTG GGTTCGTTGA TTGATGCCAA    1020 TGCAGGTCAA CGCATCCAGG TGGGGAGAGG CGGTTTGCGT ATTGGGCGCA TGCATAAAAA    1080 CTGTTGTAAT TCATTAAGCA TTCTGCCGAC ATGGAAGCCA TCACAAACGG CATGATGAAC    1140 CTGAATCGCC AGCGGCATCA GCACCTTGTC GCCTTGCGTA TAATATTTGC CCATGGACGC    1200 ACACCGTGGA AACGGATGAA GGCACGAACC CAGTTGACAT AAGCCTGTTC GGTTCGTAAA    1260 CTGTAATGCA AGTAGCGTAT GCGCTCACGC AACTGGTCCA GAACCTTGAC CGAACGCAGC    1320 GGTGGTAACG GCGCAGTGGC GGTTTTCATG GCTTGTTATG ACTGTTTTTT TGTACAGTCT    1380 ATGCCTCGGG CATCCAAGCA GCAAGCGCGT TACGCCGTGG GTCGATGTTT GATGTTATGG    1440 AGCAGCAACG ATGTTACGCA GCAGCAACGA TGTTACGCAG CAGGGCAGTC GCCCTAAAAC    1500 AAAGTTAGGT GGCTCAAGTA TGGGCATCAT TCGCACATGT AGGCTCGGCC CTGACCAAGT    1560 CAAATCCATG CGGGCTGCTC TTGATCTTTT CGGTCGTGAG TTCGGAGACG TAGCCACCTA    1620 CTCCCAACAT CAGCCGGACT CCGATTACCT CGGGAACTTG CTCCGTAGTA AGACATTCAT    1680 CGCGCTTGCT GCCTTCGACC AAGAAGCGGT TGTTGGCGCT CTCGCGGCTT ACGTTCTGCC    1740 CAGGTTTGAG CAGCCGCGTA GTGAGATCTA TATCTATGAT CTCGCAGTCT CCGGCGAGCA    1800 CCGGAGGCAG GGCATTGCCA CCGCGCTCAT CAATCTCCTC AAGCATGAGG CCAACGCGCT    1860 TGGTGCTTAT GTGATCTACG TGCAAGCAGA TTACGGTGAC GATCCCGCAG TGGCTCTCTA    1920 TACAAAGTTG GGCATACGGG AAGAAGTGAT GCACTTTGAT ATCGACCCAA GTACCGCCAC    1980 CTAACAATTC GTTCAAGCCG AGATCGGCTT CCCAATTGGC CCAGCGCGTC GATTCGGGCA    2040 TTTGCCATAT CAATGGACCG ACTGTGCATG ACGAGGCTCA GATGCCATTC GGTGGGGTGA    2100 AGTCCAGCGG CTACGGCAGC TTCGGCAGTC GAGCATCGAT TGAGCACTTT ACCCAGCTGC    2160 GCTGGCTGAC CATTCAGAAT GGCCCGCGGC ACTATCCAAT CTAAATCGAT CTTCGGGCGC    2220 CGCGGGCATC ATGCCCGCGG CGCTCGCCTC ATTTCAATCT CTAACTTGAT AAAAACAGAG    2280 CTGTTCTCCG GTCTTGGTGG ATCAAGGCCA GTCGCGGAGA GTCTCGAAGA GGAGAGTACA    2340 GTGAACGCCG AGTCCACATT GCAACCGCAG GCATCATCAT GCTCTGCTCA GCCACGCTAC    2400 CGCAGTGTGT CGATTGGTCA TCCTCCGGTT GAGGTTACGC AAGACGCTGG AGGTATTGTC    2460 CGGATGCGTT CTCTCGAGGC GCTTCTTCCC TTCCCGGGTG GAATTC                   2506

                            序列15 GAATTCCAAT AATGACAATA ATGAGGAGTG CCCAATGTTT CACGTGCCCC TGCTTATTGG      60 TGGTAAGCCT TGTTCAGCAT CTGATGAGCG CACCTTCGAG CGTCGTAGCC CGCTGACCGG     120 AGAAGTGGTA TCGCGCGTCG CTGCTGCCAG TTTGGAAGAT GCGGACGCCG CAGTGGCCGC     180 TGCACAGGCT GCGTTTCCTG AATGGGCGGC GCTTGCTCCG AGCGAACGCC GTGCCCGACT     240 GCTGCGAGCG GCGGATCTTC TAGAGGACCG TTCTTCCGAG TTCACCGCCG CAGCGAGTGA     300 AACTGGCGCA GCGGGAAACT GGTATGGGTT TAACGTTTAC CTGGCGGCGG GCATGTTGCG     360 GGAAGCCGCG GCCATGACCA CACAGATTCA GGGCGATGTC ATTCCGTCCA ATGTGCCCGG     420 TAGCTTTGCC ATGGCGGTTC GACAGCCATG TGGCGTGGTG CTCGGTATTG CGCCTTGGAA     480 TGCTCCGGTA ATCCTTGGCG TACGGGCTGT TGCGATGCCG TTGGCATGCG GCAATACCGT     540 GGTGTTGAAA AGCTCTGAGC TGAGTCCCTT TACCCATCGC CTGATTGGTC AGGTGTTGCA     600 TGATGCTGGT CTGGGGGATG GCGTGGTGAA TGTCATCAGC AATGCCCCGC AAGACGCTCC     660 TGCGGTGGTG GAGCGACTGA TTGCAAATCC TGCGGTACGT CGAGTGAACT TCACCGGTTC     720 GACCCACGTT GGACGGATCA TTGGTGAGCT GTCTGCGCGT CATCTGAAGC CTGCTGTGCT     780 GGAATTAGGT GGTAAGGCTC CGTTCTTGGT CTTGGACGAT GCCGACCTCG ATGCGGCGGT     840 CGAAGCGGCG GCCTTTGGTG CCTACTTCAA TCAGGGTCAA ATCTGCATGT CCACTGAGCG     900 TCTGATTGTG ACAGCAGTCG CAGACGCCTT TGTTGAAAAG CTGGCGAGGA AGGTCGCCAC     960 ACTGCGTGCT GGCGATCCTA ATGATCCGCA ATCGGTCTTG GGTTCGTTGA TTGATGCCAA    1020 TGCAGGTCAA CGCATCCAGG TTCTGGTCGA TGATGCGCTC GCAAAAGGCG CGCAATGGAA    1080 TTGGCCCAGC GCGTCGATTC GGGCATTTGC CATATCAATG GACCGACTGT GCATGACGAG    1140 GCTCAGATGC CATTCGGTGG GGTGAAGTCC AGCGGCTACG GCAGCTTCGG CAGTCGAGCA    1200 TCGATTGAGC ACTTTACCCA GCTGCGCTGG CTGACCATTC AGAATGGCCC GCGGCACTAT    1260 CCAATCTAAA TCGATCTTCG GGCGCCGCGG GCATCATGCC CGCGGCGCTC GCCTCATTTC    1320 AATCTCTAAC TTGATAAAAA CAGAGCTGTT CTCCGGTCTT GGTGGATCAA GGCCAGTCGC    1380 GGAGAGTCTC GAAGAGGAGA GTACAGTGAA CGCCGAGTCC ACATTGCAAC CGCAGGCATC    1440 ATCATGCTCT GCTCAGCCAC GCTACCGCAG TGTGTCGATT GGTCATCCTC CGGTTGAGGT    1500 TACGCAAGAC GCTGGAGGTA TTGTCCGGAT GCGTTCTCTC GAGGCGCTTC TTCCCTTCCC    1560 GGGTGGAATT C                                                         1571

                            序列16 GAATTCCGCG GTCGGCGAAA GTTGATGCGC TGTATCGTGG TGAAGATCAA TCCATGCTGC      60 GTGACGAGGC CACACTGTGA GTTGGTCAGG GGGGGCTTAC TCGGCGTTTT CCGACACTGC     120 GTTGGTTGCG GCAGTGCGCA CCCCCTGGAT TGATTGCGGG GGTGCCCTGT CGCTGGTGTC     180 GCCTATCGAC TTAGGGGTAA AGGTCGCTCG CGAAGTTCTG ATGCGTGCGT CGCTTGAACC     240 ACAAATGGTC GATAGCGTAC TCGCAGGCTC TATGGCTCAA GCAAGCTTTG ATGCTTACCT     300 GCTCCCGCGG CACATTGGCT TGTACAGCGG TGTTCCCAAG TCGGTTCCGG CCTTGGGGGT     360 GCAGCGCATT TGCGGCACAG GCTTCGAACT GCTTCGGCAG GCCGGCGAGC AGATTTCCCA     420 AGGCGCTGAT CACGTGCTGT GTGTCGCGGC AGAGTCCATG TCGCGTAACC CCATCGCGTC     480 GTATACACAC CGGGGCGGGT TCCGCCTCGG TGCGCCCGTT GAGTTCAAGG ATTTTTTGTG     540 GGAGGCATTG TTTGATCCTG CTCCAGGACT CGACATGATC GCTACCGCAG AAAACCTGGG     600 GACAGCAAGC GAACCGGAAT TGCCAGCTGG GGCGCCCTCT GGTAAGGTTG GGAAGCCCTG     660 CAAAGTAAAC TGGATGGCTT TCTTGCCGCC AAGGATCTGA TGGCGCAGGG GATCAAGATC     720 TGATCAAGAG ACAGGATGAG GATCGTTTCG CATGATTGAA CAAGATGGAT TGCACGCAGG     780 TTCTCCGGCC GCTTGGGTGG AGAGGCTATT CGGCTATGAC TGGGCACAAC AGACAATCGG     840 CTGCTCTGAT GCCGCCGTGT TCCGGCTGTC AGCGCAGGGG CGCCCGGTTC TTTTTGTCAA     900 GACCGACCTG TCCGGTGCCC TGAATGAACT GCAGGACGAG GCAGCGCGGC TATCGTGGCT     960 GGCCACGACG GGCGTTCCTT GCGCAGCTGT GCTCGACGTT GTCACTGAAG CGGGAAGGGA    1020 CTGGCTGCTA TTGGGCGAAG TGCCGGGGCA GGATCTCCTG TCATCTCACC TTGCTCCTGC    1080 CGAGAAAGTA TCCATCATGG CTGATGCAAT GCGGCGGCTG CATACGCTTG ATCCGGCTAC    1140 CTGCCCATTC GACCACCAAG CGAAACATCG CATCGAGCGA GCACGTACTC GGATGGAAGC    1200 CGGTCTTGTC GATCAGGATG ATCTGGACGA AGAGCATCAG GGGCTCGCGC CAGCCGAACT    1260 GTTCGCCAGG CTCAAGGCGC GCATGCCCGA CGGCGAGGAT CTCGTCGTGA CCCATGGCGA    1320 TGCCTGCTTG CCGAATATCA TGGTGGAAAA TGGCCGCTTT TCTGGATTCA TCGACTGTGG    1380 CCGGCTGGGT GTGGCGGACC GCTATCAGGA CATAGCGTTG GCTACCCGTG ATATTGCTGA    1440 AGAGCTTGGC GGCGAATGGG CTGACCGCTT CCTCGTGCTT TACGGTATCG CCGCTCCCGA    1500 TTCGCAGCGC ATCGCCTTCT ATCGCCTTCT TGACGAGTTC TTCTGAGCGG GACTCTGGGG    1560 TTCGAAATGA CCGACCAAGC GACGCCCATT GAGGGCGCAA GAGGAGAAAT GGATTGACCA    1620 AGAGATCGTG GCTGTTACGG ATGAACAGTT CGATTTAGAG GGCTACAACA GTCGAGCAAT    1680 TGAACTGCCT CGGAAGGCAA AATTGTTGAT CGTGACAGTC ATCCGCGGCC TAGCAGTCTT    1740 TGAAGCCCTT TCCCGATTGA AGCCTGTTCA TTCTGGCGGG GTGCAGACTG CGGGCAACAG    1800 CTGTGCCGTA GTGGACGGCG CCGCGGCGGC TTTGGTGGCT CGAGAGTCGT CTGCGACACA    1860 GCCGGTCTTG GCTAGGATAC TGGCTACCTC CGTAGTCGGG ATCGAGCCCG AGCATATGGG    1920 GCTCGGCCCT GCGCCCGCGA TTCGCCTGCT GCTTGCGCGT AGTGATCTTA GTTTGAGGGA    1980 TATCGACCTC TTTGAGATAA ACGAGGCGCA GGCCGCCCAA GTTCTAGCGG TACAGCATGA    2040 ATTGGGTATT GAGCACTCAA AACTTAATAT TTGGGGCGGG GCCATTGCAC TTGGACACCC    2100 GCTTGCCGCG ACCGGATTGC GTCTCTGCAT GACCCTCGCT CACCAATTGC AAGCTAATAA    2160 CTTTCGATAT GGAATTGCCT CGGCATGCAT TGGTGGGGGA CAGGGGATGG CGGTTCTTTT    2220 AGAGAATCCC CACTTCGGTT CGTCCTCTGC ACGAAGTTCG ATGATTAACA GAGTTGACCA    2280 CTATCCACTG AGCTAACGGG CATCTCCTTT GTTGCTTTGA GGTGGCGCAC GAAGGAGGGC    2340 TCGAAAATCT CTGCTAAAAA CAAGAAGAAG GAACAGGGAA CATGATTAGT TTCGCTCGTA    2400 TGGCAGAAAG TTTAGGAGTC CAGGCTAAAC TTGCCCTTGC CTTCGCACTC GTATTATGTG    2460 TCGGGCTGAT TGTTACCGGC ACGGGTTTCT ACAGTGTACA TACCTTGTCA GGGTTGGTGG    2520 GAATTC                                                               2526

                            序列17 GAATTCCGCG GTCGGCGAAA GTTGATGCGC TGTATCGTGG TGAAGATCAA TCCATGCTGC      60 GTGACGAGGC CACACTGTGA GTTGGTCAGG GGGGGCTTAC TCGGCGTTTT CCGACACTGC     120 GTTGGTTGCG GCAGTGCGCA CCCCCTGGAT TGATTGCGGG GGTGCCCTGT CGCTGGTGTC     180 GCCTATCGAC TTAGGGGTAA AGGTCGCTCG CGAAGTTCTG ATGCGTGCGT CGCTTGAACC     240 ACAAATGGTC GATAGCGTAC TCGCAGGCTC TATGGCTCAA GCAAGCTTTG ATGCTTACCT     300 GCTCCCGCGG CACATTGGCT TGTACAGCGG TGTTCCCAAG TCGGTTCCGG CCTTGGGGGT     360 GCAGCGCATT TGCGGCACAG GCTTCGAACT GCTTCGGCAG GCCGGCGAGC AGATTTCCCA     420 AGGCGCTGAT CACGTGCTGT GTGTCGCGGC AGAGTCCATG TCGCGTAACC CCATCGCGTC     480 GTATACACAC CGGGGCGGGT TCCGCCTCGG TGCGCCCGTT GAGTTCAAGG ATTTTTTGTG     540 GGAGGCATTG TTTGATCCTG CTCCAGGACT CGACATGATC GCTACCGCAG AAAACCTGGG     600 GGAGAGGCGG TTTGCGTATT GGGCGCATGC ATAAAAACTG TTGTAATTCA TTAAGCATTC     660 TGCCGACATG GAAGCCATCA CAAACGGCAT GATGAACCTG AATCGCCAGC GGCATCAGCA     720 CCTTGTCGCC TTGCGTATAA TATTTGCCCA TGGACGCACA CCGTGGAAAC GGATGAAGGC     780 ACGAACCCAG TTGACATAAG CCTGTTCGGT TCGTAAACTG TAATGCAAGT AGCGTATGCG     840 CTCACGCAAC TGGTCCAGAA CCTTGACCGA ACGCAGCGGT GGTAACGGCG CAGTGGCGGT     900 TTTCATGGCT TGTTATGACT GTTTTTTTGT ACAGTCTATG CCTCGGGCAT CCAAGCAGCA     960 AGCGCGTTAC GCCGTGGGTC GATGTTTGAT GTTATGGAGC AGCAACGATG TTACGCAGCA    1020 GCAACGATGT TACGCAGCAG GGCAGTCGCC CTAAAACAAA GTTAGGTGGC TCAAGTATGG    1080 GCATCATTCG CACATGTAGG CTCGGCCCTG ACCAAGTCAA ATCCATGCGG GCTGCTCTTG    1140 ATCTTTTCGG TCGTGAGTTC GGAGACGTAG CCACCTACTC CCAACATCAG CCGGACTCCG    1200 ATTACCTCGG GAACTTGCTC CGTAGTAAGA CATTCATCGC GCTTGCTGCC TTCGACCAAG    1260 AAGCGGTTGT TGGCGCTCTC GCGGCTTACG TTCTGCCCAG GTTTGAGCAG CCGCGTAGTG    1320 AGATCTATAT CTATGATCTC GCAGTCTCCG GCGAGCACCG GAGGCAGGGC ATTGCCACCG    1380 CGCTCATCAA TCTCCTCAAG CATGAGGCCA ACGCGCTTGG TGCTTATGTG ATCTACGTGC    1440 AAGCAGATTA CGGTGACGAT CCCGCAGTGG CTCTCTATAC AAAGTTGGGC ATACGGGAAG    1500 AAGTGATGCA CTTTGATATC GACCCAAGTA CCGCCACCTA ACAATTCGTT CAAGCCGAGA    1560 TCGGCTTCCC ATTGAGGGCG CAAGAGGAGA AATGGATTGA CCAAGAGATC  GTGGCTGTTA   1620 CGGATGAACA GTTCGATTTA GAGGGCTACA ACAGTCGAGC AATTGAACTG CCTCGGAAGG    1680 CAAAATTGTT GATCGTGACA GTCATCCGCG GCCTAGCAGT CTTTGAAGCC CTTTCCCGAT    1740 TGAAGCCTGT TCATTCTGGC GGGGTGCAGA CTGCGGGCAA CAGCTGTGCC GTAGTGGACG    1800 GCGCCGCGGC GGCTTTGGTG GCTCGAGAGT CGTCTGCGAC ACAGCCGGTC TTGGCTAGGA    1860 TACTGGCTAC CTCCGTAGTC GGGATCGAGC CCGAGCATAT GGGGCTCGGC CCTGCGCCCG    1920 CGATTCGCCT GCTGCTTGCG CGTAGTGATC TTAGTTTGAG GGATATCGAC CTCTTTGAGA    1980 TAAACGAGGC GCAGGCCGCC CAAGTTCTAG CGGTACAGCA TGAATTGGGT ATTGAGCACT    2040 CAAAACTTAA TATTTGGGGC GGGGCCATTG CACTTGGACA CCCGCTTGCC GCGACCGGAT    2100 TGCGTCTCTG CATGACCCTC GCTCACCAAT TGCAAGCTAA TAACTTTCGA TATGGAATTG    2160 CCTCGGCATG CATTGGTGGG GGACAGGGGA TGGCGGTTCT TTTAGAGAAT CCCCACTTCG    2220 GTTCGTCCTC TGCACGAAGT TCGATGATTA ACAGAGTTGA CCACTATCCA CTGAGCTAAC    2280 GGGCATCTCC TTTGTTGCTT TGAGGTGGCG CACGAAGGAG GGCTCGAAAA TCTCTGCTAA    2340 AAACAAGAAG AAGGAACAGG GAACATGATT AGTTTCGCTC GTATGGCAGA AAGTTTAGGA    2400 GTCCAGGCTA AACTTGCCCT TGCCTTCGCA CTCGTATTAT GTGTCGGGCT GATTGTTACC    2460 GGCACGGGTT TCTACAGTGT ACATACCTTG TCAGGGTTGG TGGGAATTC                2509

                            序列18 GAATTCCGCG GTCGGCGAAA GTTGATGCGC TGTATCGTGG TGAAGATCAA TCCATGCTGC      60 GTGACGAGGC CACACTGTGA GTTGGTCAGG GGGGGCTTAC TCGGCGTTTT CCGACACTGC     120 GTTGGTTGCG GCAGTGCGCA CCCCCTGGAT TGATTGCGGG GGTGCCCTGT CGCTGGTGTC     180 GCCTATCGAC TTAGGGGTAA AGGTCGCTCG CGAAGTTCTG ATGCGTGCGT CGCTTGAACC     240 ACAAATGGTC GATAGCGTAC TCGCAGGCTC TATGGCTCAA GCAAGCTTTG ATGCTTACCT     300 GCTCCCGCGG CACATTGGCT TGTACAGCGG TGTTCCCAAG TCGGTTCCGG CCTTGGGGGT     360 GCAGCGCATT TGCGGCACAG GCTTCGAACT GCTTCGGCAG GCCGGCGAGC AGATTTCCCA     420 AGGCGCTGAT CACGTGCTGT GTGTCGCGGC AGAGTCCATG TCGCGTAACC CCATCGCGTC     480 GTATACACAC CGGGGCGGGT TCCGCCTCGG TGCGCCCGTT GAGTTCAAGG ATTTTTTGTG     540 GGAGGCATTG TTTGATCCTG CTCCAGGACT CGACATGATC GCTACCGCAG AAAACCTGGC     600 GCGCATTGAG GGCGCAAGAG GAGAAATGGA TTGACCAAGA GATCGTGGCT GTTACGGATG     660 AACAGTTCGA TTTAGAGGGC TACAACAGTC GAGCAATTGA ACTGCCTCGG AAGGCAAAAT     720 TGTTGATCGT GACAGTCATC CGCGGCCTAG CAGTCTTTGA AGCCCTTTCC CGATTGAAGC     780 CTGTTCATTC TGGCGGGGTG CAGACTGCGG GCAACAGCTG TGCCGTAGTG GACGGCGCCG     840 CGGCGGCTTT GGTGGCTCGA GAGTCGTCTG CGACACAGCC GGTCTTGGCT AGGATACTGG     900 CTACCTCCGT AGTCGGGATC GAGCCCGAGC ATATGGGGCT CGGCCCTGCG CCCGCGATTC     960 GCCTGCTGCT TGCGCGTAGT GATCTTAGTT TGAGGGATAT CGACCTCTTT GAGATAAACG    1020 AGGCGCAGGC CGCCCAAGTT CTAGCGGTAC AGCATGAATT GGGTATTGAG CACTCAAAAC    1080 TTAATATTTG GGGCGGGGCC ATTGCACTTG GACACCCGCT TGCCGCGACC GGATTGCGTC    1140 TCTGCATGAC CCTCGCTCAC CAATTGCAAG CTAATAACTT TCGATATGGA ATTGCCTCGG    1200 CATGCATTGG TGGGGGACAG GGGATGGCGG TTCTTTTAGA GAATCCCCAC TTCGGTTCGT    1260 CCTCTGCACG AAGTTCGATG ATTAACAGAG TTGACCACTA TCCACTGAGC TAACGGGCAT    1320 CTCCTTTGTT GCTTTGAGGT GGCGCACGAA GGAGGGCTCG AAAATCTCTG CTAAAAACAA    1380 GAAGAAGGAA CAGGGAACAT GATTAGTTTC GCTCGTATGG CAGAAAGTTT AGGAGTCCAG    1440 GCTAAACTTG CCCTTGCCTT CGCACTCGTA TTATGTGTCG GGCTGATTGT TACCGGCACG    1500 GGTTTCTACA GTGTACATAC CTTGTCAGGG TTGGTGGGAA TTC                      1543

QQ群二维码
意见反馈