一种重组盐单胞菌及其在生产异戊二烯中的应用

申请号 CN202410382936.9 申请日 2024-04-01 公开(公告)号 CN117965414A 公开(公告)日 2024-05-03
申请人 北京微构工场生物技术有限公司; 发明人 张瑶瑶; 李莉; 杜开心; 黄悟哲; 刘絮;
摘要 本 发明 涉及 微 生物 的生物改造技术领域,具体涉及一种重组盐单胞菌及其在生产异戊二烯中的应用。本发明提供了一种重组盐单胞菌,所述的重组盐单胞菌表达IDI‑ISPS 复合体 ,所述的IDI‑ISPS复合体包括异戊烯基焦 磷酸 异构酶和异戊二烯合成酶,其中,异戊烯基焦磷酸异构酶和异戊二烯合成酶通过连接肽连接,并通过增强所述重组盐单胞菌的MEP途径和/或MVA途径以及抑制竞争途径的 碳 通量消耗,从而进一步高效合成异戊二烯。
权利要求

1.一种重组盐单胞菌,其特征在于,所述的重组盐单胞菌表达IDI‑ISPS复合体,所述的IDI‑ISPS复合体包括异戊烯基焦磷酸异构酶和异戊二烯合成酶,其中,异戊烯基焦磷酸异构酶和异戊二烯合成酶通过连接肽连接。
2.根据权利要求1所述的重组盐单胞菌,其特征在于,所述的重组盐单胞菌包含下列一种或两种以上的改造:
A)增强所述重组盐单胞菌的甲基赤藓糖醇磷酸途径,所述的重组盐单胞菌表达甲基赤藓糖醇磷酸途径关键酶;
B)增强所述重组盐单胞菌的甲羟戊酸途径,所述的重组盐单胞菌表达甲羟戊酸途径关键酶;
C)不表达竞争途径支点关键酶,或,表达的竞争途径支点关键酶无功能或功能降低。
3.根据权利要求2所述的重组盐单胞菌,其特征在于,所述的甲基赤藓糖醇磷酸途径关键酶包括1‑脱‑D‑木糖‑5‑磷酸合成酶或5‑磷酸脱氧木酮糖还原异构酶中的一种或两种;
所述的甲羟戊酸关键酶包括乙酰乙酰CoA硫解酶、β‑羟基‑β甲基戊二酰辅酶A合成酶、β‑羟基‑β甲基戊二酰辅酶A还原酶、甲羟戊酸激酶、磷酸甲羟戊酸激酶或二磷酸甲羟戊酸脱羧酶中的一种或两种以上;
所述的竞争途径支点关键酶包括PhaB。
4.根据权利要求1或2所述的重组盐单胞菌,其特征在于,所述的异戊烯基焦磷酸异构酶、异戊二烯合成酶、甲基赤藓糖醇磷酸途径关键酶或甲羟戊酸途径关键酶的表达受启动子的调控;
所述的启动子包括组成型启动子和/或诱导型启动子;
所述的组成型启动子包括Pporin启动子或其突变体或PSp6启动子或其变体。
5.根据权利要求1或2所述的重组盐单胞菌,其特征在于,所述的异戊烯基焦磷酸异构酶、异戊二烯合成酶、甲基赤藓糖醇磷酸途径关键酶或甲羟戊酸关键酶在表达载体上表达,或,整合至重组盐单胞菌的染色体上表达。
6.根据权利要求1所述的重组盐单胞菌,其特征在于,所述的连接肽包含RIDD‑RIAD短肽,所述的RIDD‑RIAD短肽由RIDD和RIAD组成。
7.根据权利要求6所述的重组盐单胞菌,其特征在于,所述的IDI‑ISPS复合体包括下列组中任一种:
A)异戊烯基焦磷酸异构酶和其C端和/或N端连接的RIDD,以及,异戊二烯合成酶和其C端和/或N端连接的RIAD;或,
B)异戊烯基焦磷酸异构酶和其C端和/或N端连接的RIAD,以及,异戊二烯合成酶和其C端和/或N端连接的RIDD。
8.根据权利要求1所述的重组盐单胞菌,其特征在于,所述的重组盐单胞菌的基因组中包含导入基因;
所述的导入基因包括异戊烯基焦磷酸异构酶编码基因和异戊二烯合成酶编码基因;
所述的异戊烯基焦磷酸异构酶编码基因和异戊二烯合成酶编码基因通过编码连接肽的序列连接。
9.根据权利要求8所述的重组盐单胞菌,其特征在于,所述导入基因的拷贝数为单拷贝或两个以上拷贝。
10.根据权利要求1所述的重组盐单胞菌,其特征在于,所述的重组盐单胞菌包括Halomonas bluephagenesis、Halomonas campaniensis、Halomonas desiderata、Halomonas cupida、Halomonas smymensis、Halomonas levan、Halomonas lutescens、Halomonas elongata、Halomonas venusta或Halomonas alkaliantarctica。
11.一种权利要求1‑10任一所述的重组盐单胞菌的制备方法,其特征在于,所述的制备方法包括将异戊烯基焦磷酸异构酶编码基因和异戊二烯合成酶编码基因导入盐单胞菌中;
所述的异戊烯基焦磷酸异构酶编码基因和异戊二烯合成酶编码基因通过编码连接肽的序列连接。
12.根据权利要求11所述的制备方法,其特征在于,所述的制备方法还包括下列组中任一种或两种以上:
A)将甲基赤藓糖醇磷酸途径关键酶编码基因导入盐单胞菌;
B)将甲羟戊酸途径关键酶编码基因导入盐单胞菌;
C)抑制盐单胞菌中的竞争途径支点关键酶。
13.一种生产异戊二烯的方法,其特征在于,所述的方法包括培养权利要求1‑10任一所述的重组盐单胞菌,或,权利要求11‑12任一所述制备方法获得的重组盐单胞菌。
14.一种权利要求1‑10任一所述的重组盐单胞菌,或,权利要求11‑12任一所述制备方法获得的重组盐单胞菌在制备化合物或组合物中的应用,其特征在于,所述的化合物或组合物包括异戊二烯、聚异戊二烯、异戊橡胶、丁基橡胶、苯乙烯‑异戊二烯‑苯乙烯嵌段共聚物弹性体、集成橡胶、定级橡胶、合成异戊烯氯、甲基庚烯酮、芳樟醇、柠檬、月桂烯、薰衣草醇、光刻胶、粘合剂农药、香料、润滑油添加剂、橡胶硫化剂或催化剂中的一种或两种以上。

说明书全文

一种重组盐单胞菌及其在生产异戊二烯中的应用

技术领域

[0001] 本发明涉及生物的生物改造技术领域,具体涉及一种重组盐单胞菌及其在生产异戊二烯中的应用。

背景技术

[0002] 异戊二烯(Isoprene)是一种具有挥发性的共轭二烯,主要用于生产异戊橡胶和定级橡胶,用量约占异戊二烯产量的95%。此外,还可用于合成异戊烯氯、甲基庚烯、芳樟醇、柠檬、月桂烯、薰衣草醇等多种具有高附加值的精细化学品。随着乙烯工业的发展和合成橡胶需求量的增加,异戊二烯的生产和应用受到越来越多的关注。
[0003] 工业生产异戊二烯的方法主要有C5馏分分离法、异戊烷烃或异戊烯烃脱氢法、烯醛法和丙酮法,其原料几乎全部来自于石油产品。虽然石油来源的异戊二烯简单易得,但是这些方法受石油价格和供应波动,以及会对环境造成严重污染。因此,开发一种以可再生资源为原料,利用环保、高效的生物技术来生产异戊二烯成为研究热点。异戊二烯生物合成途径有甲羟戊酸(MVA)途径和甲基赤藓糖醇磷酸(MEP)途径。目前,已在大肠杆菌、酿酒酵母、枯草芽孢杆菌和蓝藻中,通过代谢工程改造MVA和MEP途径构建微生物细胞工程合成异戊二烯。其中,利用工程化大肠杆菌生产异戊二烯的效果最好。然而大肠杆菌作为宿主细胞,其基因表达需要添加昂贵的诱导剂,并且大规模发酵容易染菌,灭菌过程能耗高、工艺操作复杂,生产成本高。而且,有文献显示虽然研究表明来源于粪肠球菌的MVA上游途径转化效率最高,但是将其基因整合到大肠杆菌染色体上之后,MVA途径的转化效率却受到了下游途径的限制。

发明内容

[0004] 本发明的目的是利用下一代工业技术,使用极端微生物盐单胞菌作为底盘菌株,将不能生产异戊二烯的盐单胞菌改造为能高产异戊二烯的盐单胞菌,开发了低成本的异戊二烯生产平台,实现无需灭菌、开放式发酵、节能节、和连续发酵生产异戊二烯,有利于实现异戊二烯的工业化生产。为了实现上述目的,本发明通过从头构建异戊二烯生物合成途径,增强盐单胞菌的甲基赤藓糖醇磷酸途径(过表达MEP途径)和甲羟戊酸途径(引入外源MVA途径),使得MEP途径与MVA途径协同作用,增加前体物质DMAPP的合成,提高前体物质的综合利用率,实现上游与下游通量之间的代谢平衡,菌株生长不受阻;利用连接肽缩短酶与底物之间的距离,设计底物支架,提高底物利用率;以及抑制竞争途径的通量消耗,从而实现高效合成异戊二烯。具体的:本发明的第一方面,提供了一种重组盐单胞菌(Halomonas),所述的重组盐单胞菌
(Halomonas):
A)表达或过表达IDI‑ISPS复合体,所述的IDI‑ISPS复合体包括异戊烯基焦磷酸异
构酶和异戊二烯合成酶,其中,异戊烯基焦磷酸异构酶和异戊二烯合成酶通过连接肽连接;
或者,
B)所述的重组盐单胞菌的基因组中包含导入基因,所述的导入基因包括异戊烯基
焦磷酸异构酶编码基因和异戊二烯合成酶编码基因,其中,异戊烯基焦磷酸异构酶编码基因和异戊二烯合成酶编码基因通过编码连接肽的序列连接。
[0005] 其中,异戊烯基焦磷酸异构酶具有将异戊烯基焦磷酸和二甲基烯丙基焦磷酸相互转化
的功能。
[0006] 异戊二烯合成酶具有将二甲基烯丙基焦磷酸催化合成异戊二烯的功能。
[0007] 本发明所述的IDI‑ISPS复合体具有异戊烯基焦磷酸异构酶和异戊二烯合成酶的功能。
[0008] 优选的,所述的连接肽选自刚性接头、柔性接头或无意义基酸。
[0009] 优选的,所述的连接肽可以缩短酶与底物之间的距离。进一步优选缩短异戊烯基焦磷酸异构酶和异戊二烯合成酶的距离。
[0010] 进一步优选的,所述的连接肽包含RIDD‑RIAD短肽,所述的RIDD‑RIAD短肽由RIDD和RIAD组成。
[0011] 优选的,编码所述RIAD的核苷酸序列包含SEQ ID NO:23,或与SEQ ID NO:23具有60%以上、65%以上、70%以上、75%以上、80%以上或90%以上同源性。
[0012] 优选的,编码所述RIDD的核苷酸序列包含SEQ ID NO:24,或与SEQ ID NO:24具有60%以上、65%以上、70%以上、75%以上、80%以上或90%以上同源性。
[0013] 优选的,所述RIAD的氨基酸序列包含SEQ ID NO:28,或与SEQ ID NO:28具有60%以上、65%以上、70%以上、75%以上、80%以上或90%以上同源性。
[0014] 优选的,所述RIDD的氨基酸序列包含SEQ ID NO:25,或与SEQ ID NO:25具有60%以上、65%以上、70%以上、75%以上、80%以上或90%以上同源性。
[0015] 在本发明的一个具体实施方式中,所述的IDI‑ISPS复合体包括下列组中任一种:A)异戊烯基焦磷酸异构酶和其C端和/或N端连接的RIDD,以及,异戊二烯合成酶和
其C端和/或N端连接的RIAD;或,
B)异戊烯基焦磷酸异构酶和其C端和/或N端连接的RIAD,以及,异戊二烯合成酶和
其C端和/或N端连接的RIDD。
[0016] 优选的,异戊烯基焦磷酸异构酶和其C端和/或N端连接的RIDD之间,以及,异戊二烯合成酶和其C端和/或N端连接的RIAD之间;或,异戊烯基焦磷酸异构酶和其C端和/或N端连接的RIAD之间,以及,异戊二烯合成酶和其C端和/或N端连接的RIDD之间,分别独立的可以为直接连接或间接连接。
[0017] 进一步优选通过GS、(G4S)n、GGGGSGGGGSGGGGCG(SEQ  ID  NO:29)或GGGGSGGGGSGGGGCGS(SEQ ID NO:30)中任一种连接,其中,n为大于0的整数,例如0、1、2、3、
4、5、6、7、8、9、10或以上。
[0018] 优选的,所述的异戊烯基焦磷酸异构酶来源于链球菌属(Streptococcus)。
[0019] 进一步优选的,所述的异戊烯基焦磷酸异构酶来源于炎链球菌(Streptococcus pneumoniae)。
[0020] 在本发明的一个具体实施方式中,所述的异戊烯基焦磷酸异构酶的氨基酸序列包括SEQ ID NO:26或包含与SEQ ID NO:26所示氨基酸序列具有60%以上、65%以上、70%以上、75%以上、80%以上或90%以上同源性的氨基酸序列。
[0021] 优选的,所述的异戊二烯合成酶来源于杨属(Populus)。
[0022] 进一步优选的,所述的异戊二烯合成酶来源于白杨(Populus alba)。
[0023] 在本发明的一个具体实施方式中,所述的异戊二烯合成酶的氨基酸序列包括SEQ ID NO:27所示氨基酸序列或包含与SEQ ID NO:27所示氨基酸序列具有60%以上、65%以上、70%以上、75%以上、80%以上或90%以上同源性的氨基酸序列。
[0024] 优选的,在所述的重组盐单胞菌中,异戊二烯合成酶的表达量大于等于异戊烯基焦磷酸异构酶的表达量。
[0025] 优选的,增强所述重组盐单胞菌的甲基赤藓糖醇磷酸途径。
[0026] 进一步优选的,所述的重组盐单胞菌表达或过表达甲基赤藓糖醇磷酸途径关键酶;优选的,所述的甲基赤藓糖醇磷酸途径关键酶包括1‑脱‑D‑木酮糖‑5‑磷酸合成酶或5‑磷酸脱氧木酮糖还原异构酶中的一种或两种。
[0027] 优选的,所述的1‑脱氧‑D‑木酮糖‑5‑磷酸合成酶来源于芽孢杆菌属(Bacillus)。
[0028] 在本发明的一个具体实施方式中,所述的1‑脱氧‑D‑木酮糖‑5‑磷酸合成酶来源于枯草芽孢杆菌(Bacillus subtilis)。
[0029] 在本发明的一个具体实施方式中,所述的1‑脱氧‑D‑木酮糖‑5‑磷酸合成酶的氨基酸序列包括GenBank Accession:NP_390307.1所示氨基酸序列或包含与GenBank Accession:NP_390307.1所示氨基酸序列具有60%以上、65%以上、70%以上、75%以上、80%以上或90%以上同源性的氨基酸序列。
[0030] 优选的,所述的5‑磷酸脱氧木酮糖还原异构酶来源于芽孢杆菌属(Bacillus)。
[0031] 进一步优选的, 所述的5‑磷酸脱氧木酮糖还原异构酶来源于枯草芽孢杆菌(Bacillus subtilis)。
[0032] 在本发明的一个具体实施方式中,所述的5‑磷酸脱氧木酮糖还原异构酶的氨基酸序列包括GenBank Accession:NP_389537.2所示氨基酸序列或包含与GenBank Accession:NP_389537.2所示氨基酸序列具有60%以上、65%以上、70%以上、75%以上、80%以上或90%以上同源性的氨基酸序列。
[0033] 优选的,增强所述重组盐单胞菌的甲羟戊酸途径。
[0034] 进一步优选的,所述的重组盐单胞菌表达或过表达甲羟戊酸途径关键酶。
[0035] 优选的,所述的甲羟戊酸关键酶包括乙酰乙酰CoA硫解酶、β‑羟基‑β甲基戊二酰辅酶A合成酶、β‑羟基‑β甲基戊二酰辅酶A还原酶、甲羟戊酸激酶、磷酸甲羟戊酸激酶或二磷酸甲羟戊酸脱羧酶中的一种或两种以上。
[0036] 优选的,所述的乙酰乙酰CoA硫解酶为内源的或外源的。
[0037] 在本发明的一个具体实施方式中,所述的乙酰乙酰CoA硫解酶为内源的。
[0038] 优选的,所述的β‑羟基‑β甲基戊二酰辅酶A合成酶来源于肠球菌属(Enterococcus)。
[0039] 进一步优选的,所述的β‑羟基‑β甲基戊二酰辅酶A合成酶来源于粪肠球菌(Enterococcus faecalis)。
[0040] 在本发明的一个具体实施方式中,所述的β‑羟基‑β甲基戊二酰辅酶A合成酶的氨基酸序列包括GenBank Accession:WP_002357756.1所示氨基酸序列或包含与GenBank Accession:WP_002357756.1所示氨基酸序列具有60%以上、65%以上、70%以上、75%以上、80%以上或90%以上同源性的氨基酸序列。
[0041] 优选的,所述的β‑羟基‑β甲基戊二酰辅酶A还原酶来源于鲁杰氏菌属(Ruegeria)。
[0042] 进一步优选的,所述的β‑羟基‑β甲基戊二酰辅酶A还原酶来源于海洋玫瑰杆菌(Ruegeria pomeroyi)。
[0043] 在本发明的一个具体实施方式中,所述的β‑羟基‑β甲基戊二酰辅酶A还原酶的氨基酸序列包括GenBank Accession:OQ890736.1所示氨基酸序列或包含与GenBank Accession:OQ890736.1所示氨基酸序列具有60%以上、65%以上、70%以上、75%以上、80%以上或90%以上同源性的氨基酸序列。
[0044] 优选的,所述的甲羟戊酸激酶来源于链球菌属(Streptococcus)。
[0045] 进一步优选的,所述的甲羟戊酸激酶来源于肺炎链球菌(Streptococcus pneumoniae)。
[0046] 在本发明的一个具体实施方式中,所述的甲羟戊酸激酶的氨基酸序列包括GenBank Accession:WP_000163315.1所示氨基酸序列或包含与GenBank Accession:WP_
000163315.1所示氨基酸序列具有60%以上、65%以上、70%以上、75%以上、80%以上或90%以上同源性的氨基酸序列。
[0047] 优选的,所述的磷酸甲羟戊酸激酶来源于链球菌属(Streptococcus)。
[0048] 进一步优选的,所述的磷酸甲羟戊酸激酶来源于肺炎链球菌(Streptococcus pneumoniae)。
[0049] 在本发明的一个具体实施方式中,所述的磷酸甲羟戊酸激酶的氨基酸序列包括GenBank Accession:WP_000562380.1所示氨基酸序列或包含与GenBank Accession:WP_000562380.1所示氨基酸序列具有60%以上、65%以上、70%以上、75%以上、80%以上或90%以上同源性的氨基酸序列。
[0050] 优选的,所述的二磷酸甲羟戊酸脱羧酶来源于链球菌属(Streptococcus)。
[0051] 进一步优选的,所述的二磷酸甲羟戊酸脱羧酶来源于肺炎链球菌(Streptococcus pneumoniae)。
[0052] 在本发明的一个具体实施方式中,所述的二磷酸甲羟戊酸脱羧酶的氨基酸序列包括GenBank Accession:WP_000373456.1所示氨基酸序列或包含与GenBank Accession:WP_000373456.1所示氨基酸序列具有60%以上、65%以上、70%以上、75%以上、80%以上或90%以上同源性的氨基酸序列。
[0053] 优选的,所述的异戊烯基焦磷酸异构酶、异戊二烯合成酶、甲基赤藓糖醇磷酸途径关键酶或甲羟戊酸途径关键酶的表达受启动子的调控。
[0054] 所述的启动子可以是现有技术中任一常规启动子,只要能调控异戊烯基焦磷酸异构酶、异戊二烯合成酶、甲基赤藓糖醇磷酸途径关键酶或甲羟戊酸途径关键酶中一种或两种以上的表达即可。
[0055] 优选的,所述的启动子包括组成型启动子和/或诱导型启动子。
[0056] 优选的,所述的组成型启动子包括Pporin启动子或其突变体(例如文献:Shen R, Yin J, Ye JW, Xiang RJ, Ning ZY, Huang WZ, Chen GQ. Promoter Engineering for Enhanced P(3HB‑ co‑4HB) Production byHalomonas bluephagenesis. ACS Synth Biol. 2018 Aug 17;7(8):1897‑1906. Doi: 10.1021/acssynbio.8b00102. Epub 2018 Jul 31. PMID: 30024739.中所记载的)或PSp6启动子或其变体。
[0057] 进一步优选的,Pporin启动子或其突变体包括Pporin、Pporin203、Pporin58、Pporin221、Pporin194、Pporin68、Pporin42、Pporin140、Pporin141、Pporin3、Pporin278、Pporin226或Pporin211。
[0058] 优选的,所述的Pporin启动子突变体根据其表达强度可以为低强度启动子、中等强度启动子或高强度启动子。
[0059] 进一步优选的,所述的诱导型启动子包括IPTG(异丙基‑β‑D‑硫代半乳糖苷)诱导型启动子或AHL(高丝氨酸内酯)诱导型启动子。优选的,所述的诱导剂包括但不限于IPTG或AHL。
[0060] 优选的,所述的诱导型启动子选自Pfrm启动子或其突变体、Pluc启动子或其变体、Plac启动子或其变体、Ptrp启动子或其变体、Ptac启动子或其变体、噬菌体启动子或其变体、ParaBAD启动子或其变体、PphaP启动子或其变体或PMmp1启动子或其变体。
[0061] 优选的,调控异戊烯基焦磷酸异构酶、异戊二烯合成酶、甲基赤藓糖醇磷酸途径关键酶(1‑脱氧‑D‑木酮糖‑5‑磷酸合成酶和/或5‑磷酸脱氧木酮糖还原异构酶)或甲羟戊酸途径关键酶(乙酰乙酰CoA硫解酶、β‑羟基‑β甲基戊二酰辅酶A合成酶、β‑羟基‑β甲基戊二酰辅酶A还原酶、甲羟戊酸激酶、磷酸甲羟戊酸激酶或二磷酸甲羟戊酸脱羧酶中的一种或两种以上)的启动子可以为相同的或不同的。
[0062] 在本发明的一个具体实施方式中,所述的重组盐单胞菌表达或过表达异戊烯基焦磷酸异构酶、异戊二烯合成酶,调控异戊烯基焦磷酸异构酶、异戊二烯合成酶的启动子为组成型启动子,所述的组成型启动子为Pporin启动子或其突变体,优选为Pporin140,进一步优选的,Pporin140的核苷酸序列包括SEQ ID NO:9或包含与SEQ ID NO:9所示核苷酸序列具有60%以上、65%以上、70%以上、75%以上、80%以上或90%以上同源性的核苷酸序列。
[0063] 在本发明的一个具体实施方式中,所述的重组盐单胞菌表达或过表达异戊烯基焦磷酸异构酶、异戊二烯合成酶、1‑脱氧‑D‑木酮糖‑5‑磷酸合成酶和5‑磷酸脱氧木酮糖还原异构酶,调控异戊烯基焦磷酸异构酶、异戊二烯合成酶、1‑脱氧‑D‑木酮糖‑5‑磷酸合成酶和5‑磷酸脱氧木酮糖还原异构酶的启动子为组成型启动子,调控异戊烯基焦磷酸异构酶、异戊二烯合成酶的组成型启动子为Pporin启动子或其突变体,优选为Pporin140,进一步优选的,Pporin140的核苷酸序列包括SEQ ID NO:9或包含与SEQ ID NO:9所示核苷酸序列具有60%以上、65%以上、70%以上、75%以上、80%以上或90%以上同源性的核苷酸序列;调控1‑脱氧‑D‑木酮糖‑5‑磷酸合成酶和5‑磷酸脱氧木酮糖还原异构酶的组成型启动子为Pporin启动子或其突变体,优选为Pporin68,进一步优选的,Pporin68的核苷酸序列包括SEQ ID NO:10或包含与SEQ ID NO:10所示核苷酸序列具有60%以上、65%以上、70%以上、75%以上、80%以上或90%以上同源性的核苷酸序列。
[0064] 在本发明的一个具体实施方式中,所述的重组盐单胞菌表达或过表达异戊烯基焦磷酸异构酶、异戊二烯合成酶、1‑脱氧‑D‑木酮糖‑5‑磷酸合成酶、5‑磷酸脱氧木酮糖还原异构酶、乙酰乙酰CoA硫解酶、β‑羟基‑β甲基戊二酰辅酶A合成酶、β‑羟基‑β甲基戊二酰辅酶A还原酶、甲羟戊酸激酶、磷酸甲羟戊酸激酶和二磷酸甲羟戊酸脱羧酶,调控异戊烯基焦磷酸异构酶、异戊二烯合成酶、1‑脱氧‑D‑木酮糖‑5‑磷酸合成酶、5‑磷酸脱氧木酮糖还原异构酶、乙酰乙酰CoA硫解酶、β‑羟基‑β甲基戊二酰辅酶A合成酶、β‑羟基‑β甲基戊二酰辅酶A还原酶、甲羟戊酸激酶、磷酸甲羟戊酸激酶和二磷酸甲羟戊酸脱羧酶的启动子为组成型启动子,其中,调控异戊烯基焦磷酸异构酶和异戊二烯合成酶的组成型启动子为Pporin启动子或
其突变体,优选为Pporin140,进一步优选的,Pporin140的核苷酸序列包括SEQ ID NO:9或包含与SEQ ID NO:9所示核苷酸序列具有60%以上、65%以上、70%以上、75%以上、80%以上或90%以上同源性的核苷酸序列;
调控1‑脱氧‑D‑木酮糖‑5‑磷酸合成酶和5‑磷酸脱氧木酮糖还原异构酶的组成型
启动子为Pporin启动子或其突变体,优选为Pporin68,进一步优选的,Pporin68的核苷酸序列包括SEQ ID NO:10或包含与SEQ ID NO:10所示核苷酸序列具有60%以上、65%以上、70%以上、75%以上、80%以上或90%以上同源性的核苷酸序列;
调控乙酰乙酰CoA硫解酶和β‑羟基‑β甲基戊二酰辅酶A合成酶的组成型启动子为
Pporin启动子或其突变体,优选为Pporin58,进一步优选的,Pporin58的核苷酸序列包括SEQ ID NO:11或包含与SEQ ID NO:11所示核苷酸序列具有60%以上、65%以上、70%以上、75%以上、
80%以上或90%以上同源性的核苷酸序列;
调控β‑羟基‑β甲基戊二酰辅酶A还原酶和甲羟戊酸激酶的组成型启动子为Pporin启动子或其突变体,优选为Pporin68,进一步优选的,Pporin68的核苷酸序列包括SEQ ID NO:10或包含与SEQ ID NO:10所示核苷酸序列具有60%以上、65%以上、70%以上、75%以上、80%以上或
90%以上同源性的核苷酸序列;
调控磷酸甲羟戊酸激酶和二磷酸甲羟戊酸脱羧酶的组成型启动子为Pporin启动子
或其突变体,优选为Pporin226,进一步优选的,Pporin226的核苷酸序列包括SEQ ID NO:12或13或包含与SEQ ID NO:12或13所示核苷酸序列具有60%以上、65%以上、70%以上、75%以上、80%以上或90%以上同源性的核苷酸序列。
[0065] 优选的,异戊烯基焦磷酸异构酶、异戊二烯合成酶、甲基赤藓糖醇磷酸途径关键酶或甲羟戊酸关键酶可以在一个表达载体上表达,也可以分别在多个表达载体上表达。
[0066] 优选的,所述的异戊烯基焦磷酸异构酶、异戊二烯合成酶、甲基赤藓糖醇磷酸途径关键酶或甲羟戊酸关键酶在表达载体上表达,或,整合至重组盐单胞菌的染色体上表达。
[0067] 优选的,异戊烯基焦磷酸异构酶、异戊二烯合成酶、甲基赤藓糖醇磷酸途径关键酶或甲羟戊酸关键酶以全部在表达载体上表达,也可以全部整合至重组盐单胞菌的染色体上表达,当然也可以部分在表达载体上表达,部分整合至重组盐单胞菌的染色体上表达。
[0068] 优选的,所述A)中所述的重组盐单胞菌的基因组中包含导入基因,优选的,所述的导入基因包括异戊烯基焦磷酸异构酶编码基因和异戊二烯合成酶编码基因;所述的异戊烯基焦磷酸异构酶编码基因和异戊二烯合成酶编码基因通过编码连接肽的序列连接。
[0069] 优选的,所述的导入基因还包括甲基赤藓糖醇磷酸途径关键酶编码基因;进一步优选的,所述的导入基因还包括甲羟戊酸途径关键酶编码基因。
[0070] 优选的,所述的导入基因为单拷贝或两个以上拷贝数,例如单拷贝、二拷贝、三拷贝、四拷贝、五拷贝、六拷贝、七拷贝、八拷贝、九拷贝、十拷贝或更多的拷贝数。
[0071] 在本发明的一个具体实施方式中,异戊烯基焦磷酸异构酶编码基因为两个以上拷贝数。
[0072] 在本发明的一个具体实施方式中,异戊二烯合成酶编码基因为两个以上拷贝数。
[0073] 优选的,所述的导入基因采用sgRNA导入重组盐单胞菌。
[0074] 优选的,所述的sgRNA的靶位点包括SEQ ID NO:15‑21或包括与SEQ ID NO:15‑21具有60%以上、65%以上、70%以上、75%以上、80%以上或90%以上同源性的核苷酸序列。
[0075] SEQ ID NO:15:TTCACCTAGCTAGATGAGACSEQ ID NO:16:CGTGCTTTGGTGTAAAGCCA
SEQ ID NO:17:ACACCATTACGGGGGTGTCA
SEQ ID NO:18:AAAGCCCGCTGAGCAATCAG
SEQ ID NO:19:TTGGGTGATATTTAGTTGCC
SEQ ID NO:20:GTGTCCATGTTTTTGACGCG
SEQ ID NO:21:GTGCCACAGTGGCATTGCTT
优选的,所述的导入基因包括使用上游同源臂和/或下游同源臂。
[0076] 优选的,所述的导入基因包括使用表达载体,优选所述的表达载体包含上游同源臂和/或下游同源臂。
[0077] 优选的,所述的上游同源臂包括SEQ ID NO:1、3、4、5、7、8的153‑1152位、SEQ ID NO:2的153‑1154位,或,包括与SEQ ID NO:1、3、4、5、7、8的153‑1152位、SEQ ID NO:2的153‑1154位具有60%以上、65%以上、70%以上、75%以上、80%以上或90%以上同源性的核苷酸序列。
[0078] 优选的,所述的下游同源臂包括SEQ ID NO:1、7、8的4783‑5779位、SEQ ID NO:2的4713‑5729位、SEQ ID NO:3的4129‑5127位、SEQ ID NO:4的3967‑4959位、SEQ ID NO:5的
3757‑4756位,或,包括与SEQ ID NO:1、7、8的4783‑5779位、SEQ ID NO:2的4713‑5729位、SEQ ID NO:3的4129‑5127位、SEQ ID NO:4的3967‑4959位、SEQ ID NO:5的3757‑4756位具有60%以上、65%以上、70%以上、75%以上、80%以上或90%以上同源性的核苷酸序列。
[0079] 优选的,所述的表达载体中还包含sgRNA表达模
[0080] 在本发明的一个具体实施方式中,所述的表达载体包含下列组中任一种:A)所述的sgRNA表达模块包括SEQ ID NO:1的1‑152位,优选的,所述的上游同源臂
包括SEQ ID NO:1的153‑1152位,所述的下游同源臂包括SEQ ID NO:1的4783‑5779位;
B)所述的sgRNA表达模块包括SEQ ID NO:2的1‑152位,优选的,所述的上游同源臂
包括SEQ ID NO:2的153‑1154位,所述的下游同源臂包括SEQ ID NO:2的4713‑5729位;
C)所述的sgRNA表达模块包括SEQ ID NO:3的1‑152位,优选的,所述的上游同源臂
包括SEQ ID NO:3的153‑1152位,所述的下游同源臂包括SEQ ID NO:3的4129‑5127位;
D)所述的sgRNA表达模块包括SEQ ID NO:4的1‑152位,优选的,所述的上游同源臂
包括SEQ ID NO:4的153‑1152位,所述的下游同源臂包括SEQ ID NO:4的3967‑4959位;
E)所述的sgRNA表达模块包括SEQ ID NO:5的1‑152位,优选的,所述的上游同源臂
包括SEQ ID NO:5的153‑1152位,所述的下游同源臂包括SEQ ID NO:5的3757‑4756位;
F)所述的sgRNA表达模块包括SEQ ID NO:7的1‑152位,优选的,所述的上游同源臂
包括SEQ ID NO:7的153‑1152位,所述的下游同源臂包括SEQ ID NO:7的4783‑5779位;
G)所述的sgRNA表达模块包括SEQ ID NO:8的1‑152位,优选的,所述的上游同源臂
包括SEQ ID NO:8的153‑1152位,所述的下游同源臂包括SEQ ID NO:8的4783‑5779位。
[0081] 优选的,所述的重组盐单胞菌不表达竞争途径支点关键酶,或,表达的竞争途径支点关键酶无功能或功能降低。
[0082] 优选的,通过sgRNA敲除或敲低竞争途径支点关键酶的编码基因。
[0083] 优选的,敲除或敲低竞争途径支点关键酶的编码基因的sgRNA的靶位点包括SEQ ID NO:14或包括与SEQ ID NO:14具有60%以上、65%以上、70%以上、75%以上、80%以上或90%以上同源性的核苷酸序列。
[0084] SEQ ID NO:14:TGGGTAACTGGTGGAACTGG优选的,敲除或敲低竞争途径支点关键酶的编码基因还包括导入上游同源臂和/
或下游同源臂。
[0085] 优选的,所述的上游同源臂包括SEQ ID NO:6的153‑1152位,优选的,所述的下游同源臂包括SEQ ID NO:6的1153‑2152位。
[0086] 在本发明的一个具体实施方式中,通过敲除载体制备不表达竞争途径支点关键酶,或,表达的竞争途径支点关键酶无功能或功能降低的重组盐单胞菌。
[0087] 优选的,所述的竞争途径支点关键酶包括PhaB。
[0088] 优选的,所述的敲除载体包含sgRNA表达模块、上游同源臂和/或下游同源臂。在本发明的一个具体实施方式中,所述的敲除载体中,sgRNA表达模块包括SEQ ID NO:6的1‑152位,所述的上游同源臂包括SEQ ID NO:6的153‑1152位,所述的下游同源臂包括SEQ ID NO:6的1153‑2152位。
[0089] 在本发明的一个具体实施方式中,所述的重组盐单胞菌包括下列组中任一种:1)表达或过表达异戊烯基焦磷酸异构酶和异戊二烯合成酶的重组盐单胞菌;
2)表达或过表达异戊烯基焦磷酸异构酶和异戊二烯合成酶、1‑脱氧‑D‑木酮糖‑5‑磷酸合成酶和5‑磷酸脱氧木酮糖还原异构酶的重组盐单胞菌;
3)表达或过表达异戊烯基焦磷酸异构酶和异戊二烯合成酶、1‑脱氧‑D‑木酮糖‑5‑磷酸合成酶、5‑磷酸脱氧木酮糖还原异构酶、乙酰乙酰CoA硫解酶、β‑羟基‑β甲基戊二酰辅酶A合成酶、β‑羟基‑β甲基戊二酰辅酶A还原酶、甲羟戊酸激酶、磷酸甲羟戊酸激酶和二磷酸甲羟戊酸脱羧酶的重组盐单胞菌;
4)表达或过表达异戊烯基焦磷酸异构酶和异戊二烯合成酶的重组盐单胞菌,且所
述的重组盐单胞菌的PhaB不表达,或表达PhaB无功能或功能降低;
5)表达或过表达异戊烯基焦磷酸异构酶和异戊二烯合成酶、1‑脱氧‑D‑木酮糖‑5‑磷酸合成酶和5‑磷酸脱氧木酮糖还原异构酶的重组盐单胞菌,且所述的重组盐单胞菌的PhaB不表达,或表达PhaB无功能或功能降低;
6)表达或过表达异戊烯基焦磷酸异构酶和异戊二烯合成酶、1‑脱氧‑D‑木酮糖‑5‑磷酸合成酶、5‑磷酸脱氧木酮糖还原异构酶、乙酰乙酰CoA硫解酶、β‑羟基‑β甲基戊二酰辅酶A合成酶、β‑羟基‑β甲基戊二酰辅酶A还原酶、甲羟戊酸激酶、磷酸甲羟戊酸激酶和二磷酸甲羟戊酸脱羧酶的重组盐单胞菌,且所述的重组盐单胞菌的PhaB不表达,或表达PhaB无功能或功能降低。
[0090] 优选的,所述的重组盐单胞菌包括Halomonas bluephagenesis或其衍生菌、Halomonas campaniensis或其衍生菌、Halomonas desiderata或其衍生菌、Halomonas cupida或其衍生菌、Halomonas smymensis或其衍生菌、Halomonas levan或其衍生菌、Halomonas lutescens或其衍生菌、Halomonas elongata或其衍生菌、Halomonas venusta或其衍生菌或Halomonas alkaliantarctica或其衍生菌。
[0091] 在本发明的一个具体实施方式中,所述的重组盐单胞菌包括但不限于包括但不限于Halomonas bluephagenesis  TD01、Halomonas campaniensis  LS21、Halomonas aydingkolgenesis M1、Halomonas bluephagenesis WZY254或Halomonas bluephagenesis WZY278。
[0092] 优选的,所述的重组盐单胞菌生产异戊二烯。
[0093] 本发明的第二方面,提供了一种上述第一方面的重组盐单胞菌的制备方法,所述的制备方法包括将异戊烯基焦磷酸异构酶编码基因和异戊二烯合成酶编码基因导入盐单胞菌中,所述的异戊烯基焦磷酸异构酶编码基因和异戊二烯合成酶编码基因通过编码连接肽的序列连接。
[0094] 优选的,所述的制备方法还包括将甲基赤藓糖醇磷酸途径关键酶编码基因导入盐单胞菌;进一步优选的,所述的制备方法还包括将甲羟戊酸途径关键酶编码基因导入盐单
胞菌。
[0095] 优选的,所述的制备方法还包括抑制盐单胞菌中的竞争途径支点关键酶。进一步优选的,所述的制备方法使得竞争途径支点关键酶不表达或表达的竞争途径支点关键酶无功能或功能降低。
[0096] 优选的,所述的竞争途径支点关键酶包括PhaB。
[0097] 优选的,抑制盐单胞菌中的竞争途径支点关键酶包括敲除或敲低竞争途径支点关键酶编码基因。
[0098] 优选的,所述的敲除或敲低包括使用基因编辑的方法(优选包括CRISPR/Cas9技术或组织特异性敲除或使用干扰RNA)。
[0099] 优选的,使用敲除或敲低质粒实现敲除或敲低竞争途径支点关键酶编码基因。
[0100] 所述的敲除或敲低质粒包括靶向PhaB的sgRNA。优选的,靶向PhaB的sgRNA的靶位点序列包括SEQ ID NO:14或包括与SEQ ID NO:14具有60%以上、65%以上、70%以上、75%以上、80%以上或90%以上同源性的核苷酸序列。
[0101] 优选的,所述的敲除或敲低质粒包含敲除或敲低PhaB的sgRNA表达模块,以及上游同源臂和下游同源臂,优选的,所述的表达载体从5’端到3’端依次包含:sgRNA表达模块、上游同源臂和下游同源臂,所述的表达载体的序列包括SEQ ID NO:6或包括与SEQ ID NO:6具有60%以上、65%以上、70%以上、75%以上、80%以上或90%以上同源性的核苷酸序列。
[0102] 在本发明的一个具体实施方式中,所述的制备方法包括将表达载体导入盐单胞菌中。
[0103] 在本发明的一个具体实施方式中,所述的制备方法包括采用接合转化的方式将表达载体导入重组盐单胞菌中。
[0104] 优选的,所述的表达载体游离在重组盐单胞菌中表达,或者,所述的表达载体将上述蛋白的一种或两种以上整合至重组盐单胞菌的染色体上表达。
[0105] 优选的,所述的表达载体中包含异戊烯基焦磷酸异构酶编码基因和异戊二烯合成酶编码基因,进一步优选还包含启动子,对启动子的相关限定同本发明的第一方面。优选的,所述的表达载体从5’端到3’端依次包含:Pporin140、异戊烯基焦磷酸异构酶编码基因、Pporin140、异戊二烯合成酶编码基因,优选的,异戊烯基焦磷酸异构酶编码基因和异戊二烯合成酶编码基因通过编码连接肽的序列连接,优选的,所述的表达载体上还包含sgRNA、上游和/或下游同源臂(对sgRNA、上游和/或下游同源臂的限定同本发明的第一方面),进一步优选的,所述的表达载体的序列包括SEQ ID NO:1、7或8或包括与SEQ ID NO:1、7或8具有60%以上、65%以上、70%以上、75%以上、80%以上或90%以上同源性的核苷酸序列;优选的,所述的表达载体中包含1‑脱氧‑D‑木酮糖‑5‑磷酸合成酶编码基因和5‑磷酸脱氧木酮糖还原异构酶编码基因,进一步优选还包含启动子,对启动子的相关限定同本发明的第一方面。优选的,所述的表达载体从5’端到3’端依次包含:Pporin68、1‑脱氧‑D‑木酮糖‑5‑磷酸合成酶编码基因、Pporin68、5‑磷酸脱氧木酮糖还原异构酶编码基因,优选的,所述的表达载体上还包含sgRNA、上游和/或下游同源臂(对sgRNA、上游和/或下游同源臂的限定同本发明的第一方面),进一步优选的,所述的表达载体的序列包括SEQ ID NO:2或包括与SEQ ID NO:2具有60%以上、65%以上、70%以上、75%以上、80%以上或90%以上同源性的核苷酸序列。
[0106] 优选的,所述的表达载体中包含乙酰乙酰CoA硫解酶编码基因和β‑羟基‑β甲基戊二酰辅酶A合成酶编码基因,进一步优选还包含启动子,对启动子的相关限定同本发明的第一方面。优选的,所述的表达载体从5’端到3’端依次包含:Pporin58、乙酰乙酰CoA硫解酶编码基因、Pporin58、β‑羟基‑β甲基戊二酰辅酶A合成酶编码基因,优选的,所述的表达载体上还包含sgRNA、上游和/或下游同源臂(对sgRNA、上游和/或下游同源臂的限定同本发明的第一方面),进一步优选的,所述的表达载体的序列包括SEQ ID NO:3或包括与SEQ ID NO:3具有60%以上、65%以上、70%以上、75%以上、80%以上或90%以上同源性的核苷酸序列。
[0107] 优选的,所述的表达载体中包含β‑羟基‑β甲基戊二酰辅酶A还原酶编码基因和甲羟戊酸激酶编码基因的核苷酸序列,进一步优选还包含启动子,对启动子的相关限定同本发明的第一方面。优选的,所述的表达载体从5’端到3’端依次包含:Pporin68、β‑羟基‑β甲基戊二酰辅酶A还原酶编码基因、Pporin68、甲羟戊酸激酶编码基因,优选的,所述的表达载体上还包含sgRNA、上游和/或下游同源臂(对sgRNA、上游和/或下游同源臂的限定同本发明的第一方面),进一步优选的,所述的表达载体的序列包括SEQ ID NO:4或包括与SEQ ID NO:4具有60%以上、65%以上、70%以上、75%以上、80%以上或90%以上同源性的核苷酸序列。
[0108] 优选的,所述的表达载体中包含磷酸甲羟戊酸激酶编码基因和二磷酸甲羟戊酸脱羧酶编码基因,进一步优选还包含启动子,对启动子的相关限定同本发明的第一方面。优选的,所述的表达载体从5’端到3’端依次包含:Pporin226、磷酸甲羟戊酸激酶编码基因、Pporin226、二磷酸甲羟戊酸脱羧酶编码基因,优选的,所述的表达载体上还包含sgRNA、上游和/或下游同源臂(对sgRNA、上游和/或下游同源臂的限定同本发明的第一方面),进一步优选的,所述的表达载体的序列包括SEQ ID NO:5或包括与SEQ ID NO:5具有60%以上、65%以上、70%以上、75%以上、80%以上或90%以上同源性的核苷酸序列。
[0109] 优选的,所述的表达载体可以为原核表达载体或真核表达载体,优选为原核表达载体。优选的,所述的表达载体为质粒(例如pSE系列质粒,优选为pSEVA341、pSEVA241、pSEVA321等等)。
[0110] 在本发明的一个具体实施方式中,所述的制备方法包括将上述表达载体与Cas9蛋白表达质粒(例如pQ08质粒,参见Qin Q  , Ling C  , Zhao Y  , et al  . CRISPR/Cas9 editing genome of extremophileHalomonas spp[J]  . Metabolic engineering  ,2018, 47: 219‑229.)一起导入盐单胞菌中。
[0111] 应当理解的是,所述的表达载体能够在宿主细胞中复制、转录和翻译,因此,所述的表达载体中还包含常规的其他表达元件,例如RBS、终止子、酶切位点等等,只要能保证上述蛋白的正常表达即可。
[0112] 本发明的第三方面,提供了一种上述第二方面所述的制备方法获得的重组盐单胞菌。
[0113] 本发明的第四方面,提供了一种生产异戊二烯的方法,所述的方法包括培养上述任一的重组盐单胞菌。
[0114] 优选的,所述的培养可以在开放的条件下进行。
[0115] 优选的,所述的培养使用的设备和/或培养基无需灭菌。
[0116] 本发明的第五方面,提供了一种上述生产异戊二烯的方法在制备化合物或组合物中的应用。
[0117] 优选的,所述的化合物或组合物包括异戊二烯、聚异戊二烯、异戊橡胶、丁基橡胶、苯乙烯‑异戊二烯‑苯乙烯嵌段共聚物弹性体、集成橡胶、定级橡胶、合成异戊烯氯、甲基庚烯酮、芳樟醇、柠檬醛、月桂烯、薰衣草醇、光刻胶、粘合剂农药、香料、润滑油添加剂、橡胶硫化剂或催化剂中的一种或两种以上。
[0118] 本发明的第六方面,提供了一种上述任一所述的重组盐单胞菌在制备化合物或组合物中的应用。
[0119] 优选的,所述的化合物或组合物包括异戊二烯、聚异戊二烯、异戊橡胶、丁基橡胶、苯乙烯‑异戊二烯‑苯乙烯嵌段共聚物弹性体、集成橡胶、定级橡胶、合成异戊烯氯、甲基庚烯酮、芳樟醇、柠檬醛、月桂烯、薰衣草醇、光刻胶、粘合剂、农药、香料、润滑油添加剂、橡胶硫化剂或催化剂中的一种或两种以上。
[0120] 本发明的第七方面,提供了一种上述任一的表达载体。
[0121] 本发明的第八方面,提供了一种包含上述表达载体的细胞。
[0122] 本发明的第九方面,提供了一种上述表达载体或上述细胞在制备重组微生物,或,制备化合物或组合物中的应用。
[0123] 本发明所述的“PHA”为均聚PHA和/或共聚PHA。优选的,所述的PHA选自3‑羟基丁酸(3HB)均聚物PHB,3‑羟基丁酸(3HB)和4‑羟基丁酸(4HB)二元共聚物P3HB4HB,3‑羟基丁酸(3HB)、4‑羟基丁酸(4HB)和3‑羟基戊酸三元共聚物P(3HB‑co‑4HB‑co‑3HV),3‑羟基丁酸(3HB)和3‑羟基己酸二元共聚物PHBHHx,3‑羟基丙酸(3HP)的均聚物或共聚物,进一步优选的,所述的3‑羟基丙酸(3HP)的均聚物为P3HP(聚‑3‑羟基丙酸酯),所述的3‑羟基丙酸(3HP)的共聚物为P(3HB‑co‑3HP)(聚(3‑羟基丁酸酯‑co‑3‑羟基丙酸酯))。
[0124] 在本发明的一个具体实施方式中,所述的PHA选自3‑羟基丁酸均聚物PHB,3‑羟基丁酸和4‑羟基丁酸二元共聚物P3HB4HB,3‑羟基丁酸、4‑羟基丁酸和3‑羟基戊酸三元共聚物PHBV4HB,3‑羟基丁酸和3‑羟基己酸二元共聚物PHBHHx,3‑羟基丙酸的均聚物或共聚物,所述的3‑羟基丙酸的均聚物为P3HP,所述的3‑羟基丙酸的共聚物为P(3HB‑co‑3HP)或PHBHP。
[0125] 本发明所述的“包括”或“包含”是开放式的描述,含有所描述的指定成分或步骤,以及不会实质上影响的其他指定成分或步骤。
[0126] 本发明所述的“过表达”是指目的基因高于其在原始菌株中的表达量,也包括将在原始菌株中不表达的目的基因变为表达。
[0127] 本发明所述的“和/或”包含该术语所连接的项目的所有组合,应视为各个组合已经单独地在本文列出。例如,“A和/或B”包含了“A”、“A和B”以及“B”。又例如,“A、B和/或C”包含了“A”、“B”、“C”、“A和B”、“A和C”、“B和C”以及“A和B和C”。
[0128] 本发明所述“同源性”,是指在使用氨基酸序列或核苷酸序列的方面,本领域技术人员在保证与已知序列相似结构或功能的前提下,可以根据实际工作需要对序列进行调整,使使用序列与现有技术获得的序列相比,具有(包括但不限于)1%,2%,3%,4%,5%,6%,7%,8%,9%,10%,11%,12%,13%,14%,15%,16%,17%,18%,19%,20%,21%,22%,23%,24%,25%,26%,
27%,28%,29%,30%,31%,32%,33%,34%,35%,36%,37%,38%,39%,40%,41%,42%,43%,44%,45%,
46%,47%,48%,49%,50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,70%,80%,81%,82%,
83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,99.1%,
99.2%,99.3%,99.4%,99.5%,99.6%,99.7%,99.8%,99.9%的同一性。
[0129] 本申请中涉及的缩写与全称对照参见表1。
[0130] 表1附图说明
[0131] 图1:异戊二烯生物合成途径示意图。

具体实施方式

[0132] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的部分实施例,而不是全部。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0133] 以下的实施例便于更好地理解本发明,但并不限定本发明。下述实施例中所使用的实验方法如无特殊说明,均为常规方法。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
[0134] 本申请中涉及的部分材料来源及方法如下:异戊二烯生物合成途径(MEP途径和MVA途径)示意图参见图1。
[0135] 大肠杆菌生长在LB培养基上,培养基成分配置含有:10 g/L的氯化钠,10 g/L的蛋白胨(OXID公司,产品目录号LP0042),5 g/L的酵母提取物(OXID公司,产品目录号LP0021)。
[0136] 实施例中使用的培养基:60 LB培养基:60 g/L氯化钠, 5 g/L 酵母提取物,10 g/L胰蛋白胨
基础培养基:20‑40 g/L 葡萄糖, 55‑70 g/L 氯化钠,1 ‑10 g/L 酵母提取物,3‑
6 g/L尿素,1.5‑5.2 g/L磷酸二氢,0.2‑0.4 g/L硫酸镁,8.5‑10 g/L磷酸氢二钠,7‑15 ml/L的组分III,1‑5 ml/L组分IV。
[0137] 组分III:5 g/L柠檬酸铵,2 g/L二水氯化,浓盐酸(12 mol/L)41.7 ml,加水定容至1000 ml。
[0138] 组分IV:100 mg/L七水硫酸锌,30 mg/L 四水氯化锰,300 mg/L酸,200 mg/L六水氯化钴,10 mg/L无水硫酸,20 mg/L六水氯化镍,30 mg/L二水钼酸钠。
[0139] 发酵过程中添加1g/L L‑苯丙氨酸和2g/L丙二酸钠。
[0140] 以上培养基均可以采用标准配制方法制得。
[0141] 异戊二烯检测方法:将含有发酵液的密封的摇瓶,放在60℃的烘箱内,加热30 min,使异戊二烯完全挥
发到摇瓶上空,然后使用气相进样针吸取200 微升气体,进行GC分析。
[0142] GC仪器:岛津GC‑2014型气相色谱仪,设备配置氢火焰检测器(FID);色谱柱:Agilent HP‑5 柱(30 m×0.32 mm,0.25μm,美国安捷伦科技有限公司);GC升温程序:进样口温度 150℃、检测器温度 150℃、柱温50℃(恒温)。
[0143] 配置 30 mg/mL异戊二烯母液,用氯仿稀释配置系列浓度溶液,绘制异戊二烯标准曲线。
[0144] Halomonas bluephagenesis TD01参见Unsterile and continuous production of polyhydroxybutyrate byHalomonas TD01(Tan et al,Bioresource Technology,2011)。
[0145] CRISPR基因组编辑方法参见文献CRISPR/Cas9  editing  genome  of extremophileHalomonas spp(Qin et al,Metabolic Engineering,2018)。
[0146] 本申请所述的基因组编辑位点,参见文献CRISPR/Cas9 editing genome of extremophile Halomonas spp (Qin et al,Metabolic Engineering,2018)。
[0147] 实施例1 重组质粒构建1. 质粒pIS01的构建
pIS01质粒的骨架为pSEVA341(质粒参见文献:Silva‑Rocha ,Rafael  ,et al  ."
The Standard European Vector Architecture(SEVA):a coherent platform for the analysis and deployment of complex prokaryotic phenotypes  ."Nucleic Acids Research 41  .D1(2012):D666‑D675  .中)。插入质粒的序列为SEQ ID NO:1,排列依次为sgRNA表达模块(第1‑152位核苷酸),上游同源臂(第153‑1152位核苷酸),Pporin140启动子模块(第1153‑1328位核苷酸,第2596‑2771位核苷酸),idIRA基因(第1329‑2447位核苷酸,其氨基酸序列为GenBank Accession WP_000210618.1),ispSRD基因(第2772‑4646位核苷酸,其氨基酸序列为不包含信号肽的GenBank Accession XP_034922616.1),下游同源臂(第
4783‑5779位核苷酸)。用于将基因插入Halomonas bluephagenesisTD01基因组G4位点。其中,idIRA基因表示idI连接RIAD短肽,ispSRD基因表示ispS连接RIDD短肽,下同。
[0148] 2. 质粒pIS02的构建pIS02质粒的骨架为pSEVA341。插入质粒的序列为SEQ ID NO:2,排列依次为sgRNA
表达模块(第1‑152位核苷酸),上游同源臂(第153‑1154位核苷酸),Pporin68启动子模块(第1155‑1330,3252‑3427位核苷酸),dxS基因(第1331‑3232位核苷酸,其氨基酸序列为GenBank Accession NP_390307.1),dxR基因(第3428‑4579位核苷酸,其氨基酸序列为GenBank Accession NP_389537.2),下游同源臂(第4713‑5729位核苷酸)。用于将基因插入Halomonas bluephagenesisTD01基因组G1st位点。
[0149] 3. 质粒pIS03的构建pIS03质粒的骨架为pSEVA341。插入质粒的序列为SEQ ID NO:3,排列依次为sgRNA
表达模块(第1‑152位核苷酸),上游同源臂(第153‑1152位核苷酸),Pporin58启动子模块(第1153‑1328位核苷酸,第2665‑2840位核苷酸),phaA基因(第1329‑2516位核苷酸,GenBank Accession CAH1042406.1),hmgS基因(第2841‑3992位核苷酸,其氨基酸序列为GenBank Accession WP_002357756.1),下游同源臂(第4129‑5127位核苷酸)。用于将基因插入Halomonas bluephagenesisTD01基因组G7位点。
[0150] 4. 质粒pIS04的构建pIS04质粒的骨架为pSEVA341。插入质粒的序列为SEQ ID NO:4,排列依次为sgRNA
表达模块(第1‑152位核苷酸),上游同源臂(第153‑1152位核苷酸),Pporin68启动子模块(第1153‑1328位核苷酸,第2279‑2954位核苷酸),hmgR基因(第1329‑2630位核苷酸,GenBank Accession OQ890736.1),mK基因(第2955‑3833位核苷酸,其氨基酸序列为GenBank Accession WP_000163315.1),下游同源臂(第3967‑4959位核苷酸)。用于将基因插入Halomonas bluephagenesis TD01基因组G56位点。
[0151] 5. 质粒pIS05的构建pIS05质粒的骨架为pSEVA341。插入质粒的序列为SEQ ID NO:5,排列依次为sgRNA
表达模块(第1‑152位核苷酸),上游同源臂(第153‑1152位核苷酸),Pporin226启动子模块(第1153‑1334位核苷酸,第2491‑2666位核苷酸),pmK基因(第1335‑2342位核苷酸,其氨基酸序列为GenBank Accession WP_000562380.1),mvD1基因(第2667‑3620位核苷酸,其氨基酸序列为GenBank Accession WP_000373456.1),下游同源臂(第3757‑4756位核苷酸)。用于将基因插入Halomonas bluephagenesis TD01基因组G51位点。
[0152] 6. 质粒pIS06的构建pIS06质粒的骨架为pSEVA341。敲除质粒的序列为SEQ ID NO:6,排列依次为sgRNA
表达模块(第1‑152位核苷酸),上游同源臂(第153‑1152位核苷酸),下游同源臂(第1153‑
2152位核苷酸)。
[0153] 7.质粒pIS07的构建pIS07质粒的骨架为pSEVA341。插入质粒的序列为SEQ ID NO:7,排列依次为sgRNA
表达模块(第1‑152位核苷酸),上游同源臂(第153‑1152位核苷酸),Pporin140启动子模块(第
1153‑1328位核苷酸,第2596‑2771位核苷酸),idIRA基因(第1329‑2447位核苷酸,其氨基酸序列为GenBank Accession WP_000210618.1),ispSRD基因(第2772‑4646位核苷酸,其氨基酸序列为GenBank Accession XP_034922616.1),下游同源臂(第4783‑5779位核苷酸)。用于将基因插入Halomonas bluephagenesis TD01基因组G43位点。
[0154] 8.质粒pIS08的构建pIS08质粒的骨架为pSEVA341。插入质粒的序列为SEQ ID NO:8,排列依次为sgRNA
表达模块(第1‑152位核苷酸),上游同源臂(第153‑1152位核苷酸),Pporin140启动子模块(第
1153‑1328位核苷酸,第2596‑2771位核苷酸),idIRA基因(第1329‑2447位核苷酸,其氨基酸序列为GenBank Accession WP_000210618.1),ispSRD基因(第2772‑4646位核苷酸,其氨基酸序列为GenBank Accession XP_034922616.1),下游同源臂(第4783‑5779位核苷酸)。用于将基因插入Halomonas bluephagenesis TD01基因组G49位点。
[0155] 9.质粒pIS‑1的构建(未使用RIDD‑RIAD短肽组装IDI和ISPS的方案)pIS01质粒的骨架为pSEVA341。插入质粒的序列为SEQ ID No.22,排列依次为
sgRNA表达模块(第1‑152位核苷酸),上游同源臂(第153‑1152位核苷酸),Pporin140启动子模块(第1153‑1328位核苷酸,第2488‑2663位核苷酸),idI基因(第1329‑2339位核苷酸,GenBank Accession WP_000210618.1),ispS基因(第2664‑4340位核苷酸,GenBank Accession XP_034922616.1),下游同源臂(第4477‑5476位核苷酸)。用于将基因插入Halomonas bluephagenesis TD01基因组G4位点。
[0156] 实施例2 构建生产异戊二烯的重组嗜盐菌株具体实验操作如下:
(1)重组盐单胞菌TDIS01构建
实施例使用的pQ08质粒(质粒参见Qin Q  , Ling C  , Zhao Y  , et al  . 
CRISPR/Cas9 editing genome of extremophile Halomonas spp[J]  . Metabolic 
engineering  ,2018, 47: 219‑229.)。将质粒pIS01与pQ08质粒通过接合转化方式分别转入盐单胞菌Halomonas bluephagenesisTD01 中。通过PCR和测序验证ispS和idI基因成功整合到Halomonas bluephagenesisTD01基因组上,获得重组盐单胞菌TDIS01。然后,将编辑成功后的菌株在液体培养基中连续、多次传代,并分别在壮观霉素抗性、氯霉素抗性和无抗性的平板上划线培养,鉴定出CRISPR质粒丢失的菌株,便于下一轮基因组编辑。
[0157] (2)重组盐单胞菌TDIS02菌株构建将质粒pIS02与pQ08质粒通过接合转化方式分别转入重组盐单胞菌TDIS01 中。通
过PCR和测序验证dxS和dxR基因成功整合到重组盐单胞菌TDIS01基因组上,获得重组盐单胞菌TDIS02。然后,将编辑成功后的菌株在液体培养基中连续、多次传代,并分别在壮观霉素抗性、氯霉素抗性和无抗性的平板上划线培养,鉴定出CRISPR质粒丢失的菌株,便于下一轮基因组编辑。
[0158] (3)重组盐单胞菌TDIS03菌株构建将质粒pIS03与pQ08质粒通过接合转化方式分别转入重组盐单胞菌TDIS02 中。通
过PCR和测序验证phaA和hmgS基因成功整合到TDIS02基因组上。然后,将编辑成功后的菌株在液体培养基中连续、多次传代,并分别在壮观霉素抗性、氯霉素抗性和无抗性的平板上划线培养,鉴定出CRISPR质粒丢失的菌株,再将质粒pIS04与pQ08质粒通过接合转化方式分别转入该菌中。通过PCR和测序验证hmgR和mK基因成功整合到基因组上。然后,将编辑成功后的菌株在液体培养基中连续、多次传代,并分别在壮观霉素抗性、氯霉素抗性和无抗性的平板上划线培养,鉴定出CRISPR质粒丢失的菌株,再将质粒pIS05与pQ08质粒通过接合转化方式分别转入该菌中。通过PCR和测序验证pmK和mvD1基因成功整合到基因组上,最终获得重组盐单胞菌TDIS03菌株。然后,将编辑成功后的菌株在液体培养基中连续、多次传代,并分别在壮观霉素抗性、氯霉素抗性和无抗性的平板上划线培养,鉴定出CRISPR质粒丢失的菌株,便于下一轮基因组编辑。
[0159] (4)重组盐单胞菌TDIS04菌株构建将质粒pIS06与pQ08质粒通过接合转化方式分别转入重组盐单胞菌TDIS03 中。通
过PCR和测序验证证明已成功敲除phaB基因,获得重组盐单胞菌TDIS04。
[0160] (5)重组盐单胞菌TDIS05菌株构建将质粒pIS07与pQ08质粒通过接合转化方式分别转入重组盐单胞菌TDIS03中。通
过PCR和测序验证ispS和idI基因成功整合到重组盐单胞菌TDIS03基因组上,获得重组盐单胞菌TDIS05。然后,将编辑成功后的菌株在液体培养基中连续、多次传代,并分别在壮观霉素抗性、氯霉素抗性和无抗性的平板上划线培养,鉴定出CRISPR质粒丢失的菌株,便于下一轮基因组编辑。
[0161] (6)重组盐单胞菌TDIS06菌株构建将质粒pIS08与pQ08质粒通过接合转化方式分别转入重组盐单胞菌TDIS05 中。通
过PCR和测序验证ispS和idI基因成功整合到重组盐单胞菌TDIS05基因组上,获得重组盐单胞菌TDIS06。然后,将编辑成功后的菌株在液体培养基中连续、多次传代,并分别在壮观霉素抗性、氯霉素抗性和无抗性的平板上划线培养,鉴定出CRISPR质粒丢失的菌株,便于下一轮基因组编辑。
[0162] (7)重组菌TDIS‑1构建将质粒pIS‑1与pQ08质粒通过接合转化方式分别转入盐单胞菌Halomonas 
bluephagenesis  TD01中。通过PCR和测序验证ISPS和IDI基因成功整合到Halomonas 
bluephagenesis TD01基因组上,获得TDIS‑1。然后,将编辑成功后的菌株在液体培养基中连续、多次传代,并分别在壮观霉素抗性、氯霉素抗性和无抗性的平板上划线培养,鉴定出CRISPR质粒丢失的菌株,便于下一轮基因组编辑。
[0163] 实施例3 摇瓶验证各重组菌株积累异戊二烯情况在NCBI(https://www.ncbi.nlm.nih.gov)网站上,对Halomonas venusta的MEP途
径上的基因进行blast,发现在Halomonas bluephagenesis TD01中能找到对应的MEP途径上的基因序列且相似度95%以上,推测TD01菌株能够合成异戊二烯所需的前体DMAPP,用于构建异戊二烯合成的底盘菌株。
[0164] 将表达idIRA和ispSRD的重组盐单胞菌TDIS‑1和TDIS01接种到20mL的LB60培养基中,培养12‑16h后按1%的体积比转接到新的20mL的LB60培养基中,继续培养8‑12h。取2.5mL的种子菌液接种到含有47.5mL 基础培养基的500mL锥形瓶中,进行摇瓶实验。 摇床温度为37℃,转速为200 rpm。培养48h后,检测异戊二烯含量,每组实验设三个平行,结果取均值。
[0165] 摇瓶结果显示,野生型Halomonas bluephagenesis  TD01未检测到异戊二烯,重组盐单胞菌TDIS‑1可以产生23.5mg/L的异戊二烯,表明在引入外源异戊二烯合成关键基因ISPS和IDI基因能够实现异戊二烯的积累,证明TD01菌株存在潜在的MEP途径,可用于进一步改造菌株,进行异戊二烯合成;利用短肽支架RIAD和RIDD组装IDI和ISPS,构建的重组盐单胞菌TDIS01的异戊二烯合成量量可达182.3mg/L。
[0166] 实施例4 增强MEP途径合成底物的供给dxS和dxR基因是MEP途径的关键酶基因,通过过表达外源dxS和dxR基因,可以增强
MEP途径的代谢通量,提高生物合成异戊二烯的产量。具体操作:
将重组盐单胞菌TDIS02接种到20mL的LB60培养基中,培养12‑16h后按1%的体积比
转接到新的20mL的LB60培养基中,继续培养8‑12h。取2.5mL的种子菌液接种到含有47.5mL 基础培养基的500mL锥形瓶中,进行摇瓶实验。 摇床温度为37℃,转速为200 rpm。培养48h后,检测异戊二烯含量,每组实验设三个平行,结果取均值。
[0167] 摇瓶结果显示,重组盐单胞菌TDIS02生成异戊二烯984.4 mg/L,与重组盐单胞菌TDIS01相比,产量提高了4.4倍;该实施例表明,通过过表达dxS、dxR基因,能够显著提高异戊二烯生产水平。
[0168] 实施例5 引入外源MVA途径增强底物的供给Halomonas bluephagenesis  TD01可以合成充足的乙酰辅酶A, 乙酰辅酶A是MVA
的前体物质,通过在盐单胞菌中引入MVA途径,可以提高异戊二烯合成前体物质DMAPP的积累量。具体操作如下:
将外源MVA途径的hmgS、hmgR、mK、pmK、mvD1基因,以及内源phaA基因过表达,构建
成重组盐单胞菌TDIS03。将重组盐单胞菌TDIS03接种到20mL的LB60培养基中,培养12‑16h后按1%的体积比转接到新的20mL的LB60培养基中,继续培养8‑12h。取2.5mL的种子菌液接种到含有47.5mL 基础培养基的500mL锥形瓶中,进行摇瓶实验。 摇床温度为37℃,转速为
200 rpm。培养48h后,检测异戊二烯含量,每组实验设三个平行,结果取均值。
[0169] 摇瓶结果显示,重组盐单胞菌TDIS03生成异戊二烯2.26 g/L,与重组盐单胞菌TDIS02相比,产量提高了1.3倍;该实施例表明,通过引入MVA途径与MEP途径协同调控,能够显著提高异戊二烯生产水平。
[0170] 实施例6 抑制竞争途径减少碳通量消耗在Halomonas bluephagenesis TD01菌株中,乙酰辅酶A在PhaA作用下生成乙酰乙
酰辅酶A,乙酰乙酰辅酶A在PhaB和PhaC作用下生成PHB,因此,敲除phaB基因可以减少异戊二烯合成的碳通量消耗。具体操作如下:
将敲除phaB基因的重组盐单胞菌TDIS04接种到20mL的LB60培养基中,培养12‑16h
后按1%的体积比转接到新的20mL的LB60培养基中,继续培养8‑12h。取2.5mL的种子菌液接种到含有47.5mL 基础培养基的500mL锥形瓶中,进行摇瓶实验。 摇床温度为37℃,转速为
200 rpm。培养48h后,检测异戊二烯含量,每组实验设三个平行,结果取均值。
[0171] 摇瓶结果显示,重组盐单胞菌TDIS04生成异戊二烯4.83 g/L,与重组盐单胞菌TDIS03相比,产量提高了1.1倍;该实施例表明,通过敲除竞争途径支点的关键酶基因有益于增加异戊二烯的代谢通量。
[0172] 实施例7 增加ispS和idI基因拷贝数提高异戊二烯产量将重组盐单胞菌TDIS05和重组盐单胞菌TDIS06分别接种到20mL的LB60培养基中,
培养12‑16h后按1%的体积比转接到新的20mL的LB60培养基中,继续培养8‑12h。取2.5mL的种子菌液接种到含有47.5mL 基础培养基的500mL锥形瓶中,进行摇瓶实验。 摇床温度为37℃,转速为200 rpm。培养48h后,检测异戊二烯含量,每组实验设三个平行,结果取均值。
[0173] 摇瓶结果显示,重组盐单胞菌TDIS05经过48h发酵后,异戊二烯的产量达到5.78 g/L,与重组盐单胞菌TDIS04相比,产量提高了19.7%;重组盐单胞菌TDIS06菌株经过48h发酵后,与重组盐单胞菌TDIS04相比,产量提高了35.0%,异戊二烯的产量达到6.52g/L,转化率为26.1%,表明通过代谢改造的盐单胞菌可以实现异戊二烯的高效合成。
[0174] 本申请中使用的序列:SEQ ID NO:1
TTGACAGCTAGCTCAGTCCTAGGTATAATACTAGTTTCACCTAGCTAGATGAGACGTTTTAGAGCTAGA
AATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTTGAACCCGGGGTACCGTGCGCTTGCCACAGCTTCGCGCTCGTTCTGTGGCTCCGGCAGCATCGACGAATAGTAGGCGATTCGCTGGAAACGGTCGGTCGGCTTGACGTTCCCTGGCAGCGGTGTATCGCTGCTTGGGTTTGAAAAGTCTAATTCTTCCAGCAGTGCCAATTGCTGATCGTAAGGCGGATCATTGGTCATGATTCTAAATTCTCTACCGTGGTGAATCATGGATTCACCATCGATATATTCAATGATCGCTGAATCCCCAGTAGCATCTTCAATTGCCAAATGTACGGTTGCCTTACTACCCCGCGCCTCCGCCATGACAATTTGTACATCTTCGAGTATGTCGAGTGCTTCTTCGACAGTGGCTGCGTTGTCGATCACATATTGCCCCCACAAACCTGCCTGCATTCCTGGTTTGCCAGGGTCACGCGGGCCAAAGTCGGTGGCCGTGAGATAGAGCATGTGGAACGCCAGCCCCTTTTCGTTGAATCCATCGGCAGCGCCGATGCCATAAACCGTGGTGACCATGCTGGCGTACTTCGACGTCCATGTTGCTGCGTTCTCCTCCACGACGACTTCCGCGCCCAGCATGCCCCCATTTCGCTCCATGCCACGGGGGAAGACAGTAATAACCGGATCTGTCGATTCGGGCCAGTCCATTGTGCGGGCAACATAAATGCCCTGCTCGTTGTCATTCCATAAGTACCTAGAACACGCCCATGCTGCATTGGCCATTACCATCGCACCAATCACGATGGCAACGCCCCCTCTGTAATACCTACGCATGAATTACTCCTTTAGAGCGTGTAAATCGCCAGCACAACGCCCTTATGAAAAGACGCTTAAATCGAGCGTCTGATTAAAGGCCGATAGCCCAAAGCAGGCTCGAGCAATCAGCCTTCCACCCAAGCTATTTTCGTTAATTCTTTACCCCAGAAAAACTCCACAAATACAAAATATAGTTAACTTTTGAGGCGATGCAAATCCACCTTCCGAGCACATCGATCAATGCCTCCACACCGCTCGTCACATCCTGTTGCGTTCACTGGAATCCCAGTATAAGATTTGACCTGCGAGCAAGCTGTCACCGGATGTGCTTTCCGGTCTGATGAGTCCGTGAGGACGAAACAGCCTCTACAAATAATTTTGTTTAAGAGTTACTAGAGAAAGAGGAGAAATACTAGATGACCACCAACCGCAAAGACGAACACATCCTGTACGCACTGGAACAGAAGTCCTCTTACAACTCTTTCGACGAAGTTGAACTGATCCACTCTTCCCTGCCGCTGTATAACCTGGACGAGATCGACCTGTCCACTGAGTTCGCGGGCCGTAAATGGGACTTCCCGTTCTACATCAATGCTATGACCGGCGGCAGCAACAAAGGCCGTGAAATCAACCAGAAACTGGCGCAGGTGGCGGAATCTTGCGGCATCCTGTTCGTAACCGGCTCCTATTCTGCGGCTCTGAAAAACCCGACTGACGACAGCTTTAGCGTGAAATCTTCTCATCCGAACCTGCTGCTGGGTACGAACATCGGCCTGGATAAACCGGTCGAACTGGGCCTGCAGACTGTTGAGGAAATGAATCCAGTGCTGCTGCAAGTCCACGTCAACGTTATGCAGGAACTGCTGATGCCGGAAGGTGAACGTAAGTTCCGTTCTTGGCAGAGCCACCTGGCTGATTACAGCAAACAGATCCCGGTCCCGATTGTGCTGAAAGAAGTAGGCTTCGGCATGGATGCGAAAACCATCGAACGTGCCTATGAATTCGGCGTACGTACCGTAGATCTGTCCGGTCGTGGTGGTACCTCCTTCGCCTACATCGAGAACCGTCGTTCTGGTCAGCGTGACTACCTGAACCAGTGGGGTCAGTCCACCATGCAGGCTCTGCTGAACGCCCAGGAATGGAAAGACAAGGTCGAGCTGCTGGTAAGCGGCGGTGTGCGTAATCCACTGGATATGATCAAATGCCTGGTTTTTGGCGCAAAAGCGGTAGGCCTGTCCCGCACTGTACTGGAACTGGTAGAAACCTACACTGTGGAAGAGGTGATCGGTATTGTTCAGGGTTGGAAAGCTGATCTGCGTCTGATCATGTGTTCCCTGAACTGTGCTACTATTGCTGACCTGCAGAAAGTTGACTACCTGCTGTACGGCAAACTGAAAGAAGCGAAAGATCAGATGAAGAAAGCGGGTGGTGGTGGTTCAGGTGGTGGTGGTTCAGGTGGTGGTGGTTGTGGTCTGGAACAGTATGCAAATCAGCTGGCAGATCAGATTATCAAAGAAGCAACCGAAGGTTGCTAACTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGCTGAAAGGAGGAACTATATCCGGATTGAGAGGGCTTCACTCAAGATGCCTCCACACCGCTCGTCACATCCTGTTGCGTTCACTGGAATCCCAGTATAAGATTTGACCTGCGAGCAAGCTGTCACCGGATGTGCTTTCCGGTCTGATGAGTCCGTGAGGACGAAACAGCCTCTACAAATAATTTTGTTTAAGAGTTACTAGAGAAAGAGGAGAAATACTAGATGAGCGTTAGCACTGAAAACGTAAGCTTTACCGAAACTGAGACCGAAGCGCGTCGTTCTGCGAACTATGAACCGAACTCTTGGGATTACGATTACCTGCTGTCCAGCGATACGGACGAAAGCATCGAGGTTTACAAAGATAAGGCTAAAAAACTGGAAGCAGAAGTGCGTCGTGAGATCAACAACGAAAAAGCGGAATTCCTGACCCTGCTGGAACTGATCGATAATGTTCAGCGCCTGGGTCTGGGTTATCGTTTTGAATCCGACATCCGTGGCGCGCTGGATCGTTTCGTCTCCTCCGGCGGTTTCGATGCAGTCACGAAAACCAGCCTGCACGGTACTGCACTGTCCTTCCGTCTGCTGCGTCAACATGGTTTCGAAGTCAGCCAGGAAGCCTTCAGCGGTTTTAAAGATCAGAACGGCAATTTCCTGGAGAACCTGAAAGAGGATATCAAAGCGATCCTGTCCCTGTACGAAGCATCCTTTCTGGCCCTGGAAGGCGAAAACATCCTGGATGAAGCGAAGGTCTTCGCCATCAGCCACCTGAAAGAGCTGTCCGAAGAAAAAATCGGCAAGGAACTGGCTGAACAGGTAAACCATGCCCTGGAGCTGCCTCTGCACCGTCGTACCCAGCGCCTGGAAGCCGTATGGTCCATCGAGGCTTACCGTAAAAAAGAGGACGCTAATCAGGTCCTGCTGGAACTGGCGATCCTGGACTATAACATGATTCAGTCTGTATACCAGCGCGACCTGCGTGAGACTTCTCGCTGGTGGCGCCGCGTTGGCCTGGCAACTAAACTGCACTTCGCACGTGACCGTCTGATCGAGAGCTTTTATTGGGCGGTGGGCGTGGCTTTCGAACCACAGTATTCTGACTGCCGCAACTCCGTTGCTAAAATGTTCAGCTTCGTTACCATCATCGACGACATCTATGACGTGTACGGCACCCTGGATGAACTGGAGCTGTTCACCGATGCGGTAGAACGCTGGGACGTCAACGCCATCAACGACCTGCCGGACTACATGAAACTGTGTTTTCTGGCACTGTACAACACCATCAACGAGATTGCTTACGATAACCTGAAAGATAAGGGTGAAAACATCCTGCCATATCTGACTAAAGCGTGGGCTGACCTGTGTAACGCGTTCCTGCAGGAGGCGAAATGGCTGTACAACAAAAGCACCCCTACCTTTGACGACTACTTCGGTAACGCCTGGAAAAGCTCTTCCGGTCCGCTGCAGCTGGTGTTTGCATACTTCGCAGTAGTTCAGAATATTAAGAAAGAAGAAATTGAGAACCTGCAGAAATACCACGACACTATTAGCCGTCCGTCTCACATCTTTCGCCTGTGCAATGACCTGGCGTCCGCAAGCGCTGAAATTGCCCGCGGCGAAACTGCTAACTCCGTAAGCTGCTACATGCGCACCAAAGGTATCAGCGAAGAACTGGCGACTGAATCCGTAATGAACCTGATCGACGAGACCTGGAAAAAGATGAACAAGGAAAAACTGGGCGGCTCTCTGTTCGCTAAACCGTTCGTCGAAACCGCTATCAACCTGGCTCGTCAGTCTCACTGCACTTACCATAACGGCGATGCGCACACTTCTCCGGATGAACTGACTCGTAAACGCGTGCTGTCTGTGATCACTGAACCGATTCTGCCGTTTGAACGTGGTGGTGGTGGTTCAGGTGGTGGTGGTTCAGGTGGTGGTGGTTGTGGTAGCCTGCGTGAATGTGAACTGTATGTTCAGAAACATAATATTCAGGCCCTGCTGAAAGATAGCATTGTTCAGCTGTGTACCGCACGTCCGGAACGTCCGATGGCATTTCTGCGCGAATATTTTGAACGTCTGGAAAAAGAAGAAGCCAAATAATGATAAGCCAGGCATCAAATAAAACGAAAGGCTCAGTCGAAAGACTGGGCCTTTCGTTTTATCTGTTGTTTGTCGGTGAACGCTCTCTACTAGAGTCACACTGGCTCACCTTCGGGTGGGCCTTTCTGCGTTTATACTCACCTTCATTTCCTTATGCTGAACACGGTAAGCTTGGCGATAACACCGCTACTGATGGCTAAAAATCAACGATGACTTCCCATTGGATACTTGGCCCTGGGGCCATTGGTCGCCTGTTGGCGCATTCGCTTTCACCCATTACTGACATCACCTTGATTGGCCGACGTGCATTGCCTGAACAGCAACGCCTGACCACCCCTGAAGGTGAAGAACGAACTCAGCGGCTAGCGAGCGTTACGGTTGCGGAGCTAGCCTCTCACTCACTGCCTGTGCCTGGGTTTGTGCATATCACCACCAAAGCCATGGCCGCCGAGGCGGCGCTTGCCAGCATTGCCGATGTGGTTGCGCCCACGACCCCGCTGGTGCTGTGGCAGAACGGTTTTTTGGCACAGCCACGGCTGACTGATAGGTGGCCAGGGCCAGTGCTGTGTGCGACCACGACTCAAGGCGCTTACTTAACCGGCAGTGATGGCGTGGTTCACGCCGGGCGCGGGCCGACGTTTATTGGTGATCTCAACAATCAACGCGCTGCGCTAGCAAAAACACTGGCGCAGACGTTAGGTGAGGCAGGCTTTACCGCCACGCCGGTAGACGATATTCGCCAACGCCTGTGGCAAAAGCTGGCGGTTAATGCGGCGATCAACCCATTGGTGGCGCTCAATGGCGTGCGCAATGGTGAGCTGCGCGGTGATGCTTATGCAGTCCGTTTGGCAGCGGTGGTAAAGGAAGTCGCGGCGATTTTAAAGCAGGAAAACATTGCACCACCGAATGGTGGCGAAGGTGAAGACGCGTGGTTGGCGCTTGTGTGGCAGGTGGTGGAGAACACCGCTAACAATAAGGCCTCGATGTTGCAGGATGTTGAGGCCAGACGCACCACCGAGCGCGGGGCGATTTTAGGGCCGTTGATTGATAGCGCCGAGCGCCATGGGTTGCCGTGTGGGTTGTTGAAGGAGCTTGATAGCGAATTGGCTAAATTGGAGGCGAAGTTTTAGGGAACA
SEQ ID NO:2
TTGACAGCTAGCTCAGTCCTAGGTATAATACTAGTCGTGCTTTGGTGTAAAGCCAGTTTTAGAGCTAGA
AATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTTGAACCCGGGGTACCCATCACGCGCAAAAATAGAGCCAGAAGAGGCTTTTTTTAACGCCTTGGCAGAAGGGCATAATGCAGAAGCACGTAAGCTAGTAGCGAGTATGCAAGAATTTGAAGATATCTAGGTAAGACTTTGGGAGATATCTAGATAGCGTTCAACAATGGTGCGGTTGCCGACATTGACATACTGGCATGTTATTTGGCTTATTAAAGCACTGACATTTGGTGTGAGAATAGGGTATAACAATTGCCACAAATGCTTTGTTGGCTAGTGATGCTGGCCTATATAGAGAGCGATAACGATGCCTGTAAACCGTCGCCGTTTTTTAGCGTTGGCGCTGGGCTGGCCTGCTGTGGCCAGTGCAGCGACTTCCAGTACCTTAAATAATTACGAACCTACAGATCTTGTTGAGACGCTGCTTTCTCGTGCGAGTCTCCCGCGTCACAGCGATGAGCTGTGGGTGTTAATTGATGATAAAGATGCCACGTTGAGTGTCTACCGGGGTAATGCTTTGGTTGAGCACTATGCACCCATATCTCTTGGGCGTGGTGGAGCGAAAACCCAGCGGATCCGTGGTGATAATGTGACACCGCTTGGCGAGTTTCGAATTAATCGATTTAATTACGAAAGTCAGTGGCATATCTTTATTGGTATCGATTATCCTACGCCACCTCATGCGAGGATGGCGCTCGAAAAAGGCATTTATTCCCAAGCGGATTACGATGCTTATTTTGATCACTATCGGCGCCACGGCTCTCCGCCACAAAATACGGCGTTGGGCGGCGCCATTGGCATACATGGCATCGGTGGTGGTGATCCAGATATTCATGGTCAATACCACTGGACCCAAGGTTGCGTTGCTGTCACCAACGAGCAAATTGAGCGTGTTGCTTCGCTGGTAGGTGTTGGCACTCGCGTGGTGATCCGCTAGGCTATGTCGTTGAAGGAAGTTCAAGGTTTTGAATACGTGGCTATAGACAAGCGCTGTGGTCTATTATAAAACAGCGTTTGACATGCCTCCACACCGCTCGTCACATCCTGTTGCGTTCACTGGAATCCCAGACTAGAGTTTGACCTGCGAGCAAGCTGTCACCGGATGTGCTTTCCGGTCTGATGAGTCCGTGAGGACGAAACAGCCTCTACAAATAATTTTGTTTAAGAGTTACTAGAGAAAGAGGAGAAATACTAGATGGACCTGCTGAGCATTCAAGATCCGTCTTTCCTGAAAAACATGTCTATCGATGAACTGGAGAAACTGAGCGACGAGATCCGTCAGTTCCTGATTACCTCCCTGTCTGCATCCGGTGGCCACATCGGTCCAAACCTGGGTGTAGTCGAACTGACCGTGGCCCTGCATAAAGAATTCAACAGCCCGAAGGACAAATTCCTGTGGGACGTTGGTCACCAGTCCTATGTCCATAAACTGCTGACTGGTCGCGGCAAAGAGTTCGCCACGCTGCGTCAGTATAAAGGTCTGTGCGGCTTTCCGAAACGTTCCGAATCCGAACACGACGTTTGGGAAACCGGCCACTCTTCCACTAGCCTGTCTGGCGCGATGGGCATGGCGGCTGCTCGCGATATCAAAGGTACCGATGAGTATATCATTCCGATCATCGGTGACGGTGCTCTGACCGGTGGTATGGCCCTGGAAGCTCTGAACCACATCGGTGATGAAAAAAAAGATATGATCGTGATCCTGAACGACAACGAAATGAGCATTGCTCCGAACGTAGGTGCAATCCACAGCATGCTGGGCCGTCTGCGTACCGCGGGTAAATATCAGTGGGTGAAAGACGAACTGGAATACCTGTTCAAAAAAATCCCGGCTGTAGGTGGTAAACTGGCAGCCACCGCAGAACGTGTGAAAGATAGCCTGAAGTACATGCTGGTGAGCGGCATGTTCTTTGAAGAGCTGGGTTTTACCTACCTGGGCCCGGTGGATGGCCACTCTTATCACGAGCTGATTGAGAACCTGCAATACGCAAAGAAAACTAAAGGTCCTGTTCTGCTGCATGTCATCACCAAAAAGGGCAAAGGTTACAAACCGGCGGAAACGGATACCATTGGTACCTGGCACGGCACTGGCCCGTACAAAATCAACACCGGTGACTTCGTTAAGCCGAAAGCTGCCGCGCCGTCTTGGTCCGGTCTGGTTAGCGGTACGGTTCAGCGCATGGCGCGCGAAGACGGTCGTATCGTGGCAATCACCCCAGCTATGCCGGTGGGTTCCAAACTGGAAGGCTTTGCAAAGGAGTTCCCTGATCGTATGTTCGACGTAGGTATTGCTGAGCAGCATGCTGCAACCATGGCGGCAGCCATGGCGATGCAGGGCATGAAGCCGTTTCTGGCCATCTACTCTACTTTTCTGCAGCGTGCATATGATCAGGTTGTACACGACATTTGCCGTCAGAACGCTAACGTTTTCATCGGTATCGACCGTGCTGGTCTGGTTGGTGCTGATGGCGAAACCCACCAGGGCGTATTCGATATCGCCTTCATGCGTCACATCCCGAACATGGTGCTGATGATGCCGAAAGACGAGAACGAAGGCCAGCACATGGTACACACTGCTCTGTCCTACGACGAAGGTCCAATTGCGATGCGTTTTCCGCGCGGTAACGGTCTGGGCGTCAAAATGGATGAACAACTGAAAACCATCCCGATCGGCACCTGGGAAGTCCTGCGTCCGGGTAACGATGCAGTTATCCTGACTTTCGGTACGACTATCGAAATGGCGATTGAAGCTGCTGAGGAACTGCAGAAGGAAGGTCTGTCCGTGCGTGTGGTCAACGCTCGCTTCATCAAACCAATCGACGAAAAAATGATGAAATCTATCCTGAAAGAAGGTCTGCCGATCCTGACTATCGAAGAAGCGGTGCTGGAAGGCGGCTTTGGCAGCAGCATCCTGGAGTTTGCGCACGATCAGGGCGAATACCATACTCCGATCGACCGTATGGGTATCCCGGACCGCTTCATTGAACACGGTAGCGTCACTGCGCTGCTGGAGGAAATTGGTCTGACCAAACAGCAGGTTGCAAATCGTATTCGTCTGCTGATGCCTCCGAAGACTCACAAGGGCATCGGCTCTTAATGAGAGGGCTTCACTCAAGATGCCTCCACACCGCTCGTCACATCCTGTTGCGTTCACTGGAATCCCAGACTAGAGTTTGACCTGCGAGCAAGCTGTCACCGGATGTGCTTTCCGGTCTGATGAGTCCGTGAGGACGAAACAGCCTCTACAAATAATTTTGTTTAAGAGTTACTAGAGAAAGAGGAGAAATACTAGATGAAAAACATTTGCCTGCTGGGTGCTACTGGTTCTATCGGTGAACAGACCCTGGATGTCCTGCGTGCTCACCAGGATCAGTTCCAGCTGGTGAGCATGTCTTTTGGTCGTAATATCGACAAGGCGGTACCGATGATCGAGGTCTTCCAACCTAAATTCGTTTCCGTTGGCGACCTGGATACGTACCATAAGCTGAAACAGATGAGCTTCAGCTTCGAATGTCAGATCGGTCTGGGCGAGGAAGGTCTGATCGAAGCGGCGGTGATGGAGGAAGTGGATATCGTGGTGAATGCCCTGCTGGGTTCTGTTGGCCTGATCCCGACCCTGAAAGCGATCGAACAGAAAAAGACCATTGCACTGGCGAACAAAGAAACCCTGGTTACTGCCGGCCACATTGTGAAAGAACATGCGAAAAAATATGATGTGCCGCTGCTGCCGGTAGATTCCGAACATTCCGCTATCTTCCAGGCCCTGCAAGGTGAACAGGCGAAAAACATCGAGCGTCTGATCATTACCGCTTCTGGTGGCTCCTTCCGTGACAAAACCCGCGAAGAGCTGGAAAGCGTGACTGTTGAGGACGCGCTGAAACATCCGAACTGGAGCATGGGCGCTAAGATCACCATCGATAGCGCTACCATGATGAACAAGGGTCTGGAAGTTATTGAAGCCCATTGGCTGTTCGATATCCCATACGAACAGATTGACGTTGTGCTGCACAAAGAAAGCATCATCCACTCTATGGTTGAATTCCATGACAAGTCTGTTATCGCTCAGCTGGGCACCCCGGATATGCGTGTGCCGATCCAATATGCACTGACCTATCCTGATCGTCTGCCACTGCCGGATGCAAAACGTCTGGAACTGTGGGAAATTGGCTCTCTGCACTTCGAAAAAGCAGACTTCGACCGCTTCCGCTGCCTGCAGTTCGCCTTTGAATCTGGTAAGATCGGTGGCACTATGCCAACCGTTCTGAACGCGGCAAACGAAGTGGCGGTAGCGGCATTTCTGGCCGGTAAAATTCCGTTCCTGGCCATCGAAGACTGCATTGAAAAAGCACTGACCCGCCACCAACTGCTGAAAAAACCATCCCTGGCGGATATCCAAGAAGTCGACAAGGATACTCGTGGCTACGTTAACTCCATCCTGACCTGATAAGCCAGGCATCAAATAAAACGAAAGGCTCAGTCGAAAGACTGGGCCTTTCGTTTTATCTGTTGTTTGTCGGTGAACGCTCTCTACTAGAGTCACACTGGCTCACCTTCGGGTGGGCCTTTCTGCGTTTATATCACTGTAAAGAACCTGCACCGCAGGTAGACAAAATTGAGCTAACGCTTTAGCCTTAAATTTGTCATACCCCTAATGTTGTACCCAAGGAAGACTCAAGGAGAACACTATGACTCTGAAGACTGCTCTGAAGATGACTGCCGCTGCCGCTTCACTGGCAATCCTGGCTGGCTGTGCTTCTACCAGCGCTCTGGAAGAAGTTCGCATGACTGCTGAATCTGCACAGGCTGATGCCGCAGAAGCACGCAGCATGGCTTCACAAGCAATGAACACTGCTAACCAAGCTCAGCGCGACGCGCAAGCTGCCCTGCAGATGTCTCAGCAAAACCGTGAAGAAATGAACCGCATGTTCCAGCGTTCCATGCAGAAGTAATTCTGCCTGGGCCCTAAGCGTTAAAACTTAGGGTTGCTGTAGATGTAAAAAAACCCCGCCTCGGCGGGGTTTTTTTTATGTCTTTGGTTATGCCTCTTCTTCGCCTCGAGCAACTGTCGTGAGCTCAATTTCCTCTAATAAACCATCAAGTTCCACAGGCTCTTCAGCGGGAGCTGGTGCTGGTGCTTGGGGGCCATAAAGCGCGATAAGGCGACCATCCGGGTTTTCCACCGCGAGTTTTACCTGGGCATAGTCAACTTCTGCTTGCTCTTCAGCAAGTTCGCTTACTCGCTCGATGGCGTTAAGCAGCGGCTCAAAATCGCCAACGTTTTCTTCAAGCTGTGGGTAAGACTGCACAAACAGTGTGCCGTCCGCTGCCCAGCCTGCTTTAAACGGTGCATCCATCAAGTTGACCTGAGTGCCACTGGGCAAGCGCTCGTAGAGCGACTTGATATCTTCGGGGAACATGCGGATGCACCCGCGGCTGACCCGCATGCCCACACCTTCAGGGCGGTTGGTGCCATGAATCAGGTAGCTAGGCATTGCCAACAAAATGGCGTGCCGACCTAATGGGTTGTTGGGGCCAGCAGGCACAATAGAGGGTGCTGGCTCACCACGTGCTGCTGCTTCGCGACGCATAGAGGC
SEQ ID NO:3
TTGACAGCTAGCTCAGTCCTAGGTATAATACTAGTACACCATTACGGGGGTGTCAGTTTTAGAGCTAGA
AATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTTGAACCCGGGGTACCTATCAAGCTGCCCGTTGCTGACCAGATTTCTGTCTGATACTAGATTTTTGGCCAGATTCTGGTGTAACGCCTGATTGACCGAAGCGTTGTATTCACGCAGCGAATAGAGGCTGATGAAGGTATATAGCAGGCCCACGGCGAGCAATAACAGAAATAAGCCTAAGGCTAGCCGAGTATAGAGTGTTTTCAGCATAACTTATTCGCGGAAGCGATAGCCCACCCCCCCAACGGTTTGGATAAACACCGGGTCAGCGGGGTCCGCTTCGATCTTGCCTCGTAAGCGATTGATATGAGTATTGACGGTATGTTCGTAACCTTCGTGGCTGTAGCCCCACACGGTATCAAGCAGTTGGGCACGGCTAAATACCCGCCCTGGATGTGTGGCAAAGTGCCATAGCAGGTCAAACTCCCGGGCAGTGAGTTCAACAGGCTGGTCTTTTATAAATACCCGCCGACGCAGCGGGTCAATGCGCAGCCCATCGGTGATTAATGCTTGCTGGCTGGGTTCCGTGACTGAGGAAGATGCCATGGCATCTACGCGTCGGAACAAGGCTTTCACCCTTGCTGATAGTTCAGCCACACTGAAAGGTTTGGTGAGGTAATCATCCGCCCCCATTTCCAGGCCCAGCACTCGATCAAGCTCCGTACTTTTGGCGGTTAGCATCAGTACCGGAACGTAACCTGGGCCGGCGCGGATTTCGCGGCAAATTGACAGCCCGTCCAGGCCGGGCAGCATCAGGTCGAGAACCACAAGGTCGATGCCCCCTTCACGAAAACGCTCAAGCCCGGAATCACCGCGCTCGCAAAGAATAGGGTTCATGCCAAGCTCGGCCACATGCATGCGGACGAGTTCACCAATACCCGGGTTATCCTCAATAATCAGTACGTTTCGTGTCATAGGTAGTCGCATTATCTTCTTTTGTGCTTTCGCCTTATGGCTCTAGGCGCTTGGATGCTCGTGATATTTTCCTACTCATTGGTCGGAAGATTCGAGACTATCATGCCTCCACACCGCTCGTCACATCCTGTTGCGTTCACTGGAATCCCAATATAGAGTTTGACCTGCGAGCAAGCTGTCACCGGATGTGCTTTCCGGTCTGATGAGTCCGTGAGGACGAAACAGCCTCTACAAATAATTTTGTTTAAGAGTTACTAGAGAAAGAGGAGAAATACTAGATGAGAGACGTGTATCTCGCCGACTATGCGCGCAGCGCCTTCAGCCGCGCACACCCCCGCAAACCCGAGGTCGATGCCTGGGCCGATACCCGCAGCGATGCCCTGTTGGCCAGCGTGCTCGATGGCTTATTAGCACGTAGCGGCGTTGACGGCGCGGTGGTGGAAGACCTGAGCATTGGCTGCGCCCTGCCAGTAAAAGAGCAGTGGAGCTTTGGTGGGCGTTACCCCCTGTGGCTTGCCCAGCGGCTGGGAGCACATGGCCAGGGCTGCGCAACCCGCCAAATTGATCAGCAATGTGGCTCTGGCCTTGCCGCTCTGCGCAGCACCGCACGGGAGATTCAGTCGGGCGCGGTTGAGGTTGGCATGGCCGGTGGCGTGGAAAACATGACCCGTGTGCCCATGGGCCCGGCACTGTTTAAGGAAGGCGTGCTGACCAGCCCTCAAGCACTGCAAAAAGCCGACTGGCTGGCGCTGGATGTGGTGCTCAATATGGGGCTGACCGCCGAACGGCTGGCCAAAGCAGCCGGCATTTCGCGCGAGGCGATGGATACCCTCGCCCTCAGTTCCCACCAGCGTGCCGCCAAGGCCAACGCAGCAGGTCACTTCGACGCTGAGCGTTTGACCCTGAACAACGCGGCGGGCGAACCGATCAGCGCGGACAGCAATATCCGCGCGGATACCAGCGCTGAGCGCTTGGCAGGGCTGGACCCGGTATTTATGCAAGGCGGCGTAGTGACCGCAGGCAACAGCTCGCCGCTAACCTCGGGTGCTGCTGCCACGCTACTGATGTCTGAATCTGCCCTACGCCAACACGGCATTAGTCCCTTGGCGCGTGTTGTGGCCATCGCCGACTGCGGCGTCAAGCCAGAGGAGATGGGGGCCGGAGCCGCCGCCGCTATTCGACGCGCACTGAAACAGGCCCAGCTGACACCACAGGATATCGGCGTATGGGAAATCAATGAAGCCTTCGCCGCAGTGCCGCTGCATGCCATGGGTGAGCTTTCGATTGATCCTGAAAACGTCAATATCTGGGGCGGCGCTATGGCGCTGGGGCACCCGTTAGGCGCAACCGGCATTCGCCTCGCAGGCACCCTTGGCCGACTTCTTCAACCCCGCCAGCAGCGCTACGGCTGCGCGGCGGCCTGTATTGGCGGCGGACAAGGCATCGCCATCATTTTAGAACGCTAACTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGCTGAAAGGAGGAACTATATCCGGATTGAGAGGGCTTCACTCAAGATGCCTCCACACCGCTCGTCACATCCTGTTGCGTTCACTGGAATCCCAATATAGAGTTTGACCTGCGAGCAAGCTGTCACCGGATGTGCTTTCCGGTCTGATGAGTCCGTGAGGACGAAACAGCCTCTACAAATAATTTTGTTTAAGAGTTACTAGAGAAAGAGGAGAAATACTAGATGACCATCGGCATTGATAAAATCAGCTTTTTCGTTCCGCCTTACTATATCGACATGACTGCTCTGGCGGAAGCACGCAACGTTGATCCAGGCAAATTCCACATCGGTATCGGCCAGGACCAAATGGCAGTAAACCCGATCAGCCAAGATATCGTTACCTTTGCGGCTAACGCAGCTGAGGCTATCCTGACCAAAGAAGACAAGGAAGCTATCGACATGGTTATCGTCGGTACCGAAAGCTCTATTGACGAAAGCAAAGCCGCGGCGGTGGTACTGCATCGTCTGATGGGCATCCAGCCATTCGCTCGCTCTTTCGAAATCAAAGAAGCCTGCTATGGCGCAACTGCAGGTCTGCAGCTGGCAAAGAACCATGTGGCGCTGCATCCGGACAAAAAAGTACTGGTTGTTGCTGCCGATATCGCGAAATACGGTCTGAACTCCGGCGGTGAACCTACTCAGGGTGCAGGTGCGGTTGCCATGCTGGTGGCATCCGAACCGCGTATCCTGGCACTGAAAGAAGATAACGTGATGCTGACTCAGGACATTTACGATTTTTGGCGTCCGACGGGCCACCCGTATCCGATGGTAGATGGTCCGCTGTCCAACGAAACTTACATTCAATCCTTCGCACAGGTGTGGGACGAACACAAAAAACGCACGGGTCTGGACTTCGCGGATTACGATGCTCTGGCGTTTCATATTCCGTATACCAAGATGGGTAAAAAAGCGCTGCTGGCGAAAATCTCTGACCAGACCGAAGCAGAACAGGAACGTATCCTGGCACGTTACGAAGAGAGCATCATTTACAGCCGTCGTGTGGGTAACCTGTACACTGGCTCTCTGTACCTGGGTCTGATCTCTCTGCTGGAAAATGCAACGACTCTGACCGCGGGCAACCAGATTGGTCTGTTCAGCTATGGCAGCGGTGCAGTGGCGGAATTTTTCACCGGCGAACTGGTAGCGGGCTACCAGAACCATCTGCAGAAAGAGACCCACCTGGCACTGCTGGACAACCGCACCGAACTGTCCATTGCTGAATATGAAGCGATGTTCGCAGAAACGCTGGACACGGACATCGATCAGACTCTGGAAGATGAACTGAAGTACTCCATCTCTGCAATCAACAACACCGTGCGTTCTTACCGTAACTAATGATAAGCCAGGCATCAAATAAAACGAAAGGCTCAGTCGAAAGACTGGGCCTTTCGTTTTATCTGTTGTTTGTCGGTGAACGCTCTCTACTAGAGTCACACTGGCTCACCTTCGGGTGGGCCTTTCTGCGTTTATAGTGATATAGAGTGTATCGCGCAAAGTTCACAAATGTGTCACGGGGACTCTAACGATAGGGCGATGTCTGCATTAACGCCTCCCCTCATTTCAATAAGTGTGTTTCAGCAAGGAGAGCGCCCATGGCGACTACACGCCGTAAACTCATGTCGTTAATCGGGCAGGGAGTGATACCTCCTGAGCAAGTGCCGTTAGCGGTTAAAGTGGCGGGGCTGCACCCGTCGCCCCACGCCTGGGCGCTGTTGATTGACCGGCTGCTACTGTGGCTGGGGAGCTTGGCGTTGGCTTGCGCGGTGCTGTTCTTCGTGGCTTTCAATTGGTCGGACATGGGCCGCCTGCCGCGCTTTGCGTTAGTGCAGGCTGCGTTGGTGTTGGCGGCAGGCATCGCGGTGTGGGGCAGCGCGAGCGTGATGCTTTTTCGCGTGACGTTAACTGCTGCGTCTCTATTGATAGGAGTACTACTGGCGCTGGTGGGTCAGATTTACCAAACCGGTGCTGACCCATGGCAGCTGTTTTTCACCTGGGCGCTGCTCACCTTGCCATTGGTATGGATAGCACGCTTTGATGCGCTTTGGTTGGCGTGGTTAGGGCTTTTGAACCTATCCGTGTGGCTGTATAGCAGCACCTGGGGCGGTGTTTTTGGCAATGTGTTCTCTGCCGATAACGCGGGCTTATGGGGACTGGTGCTGATCAACTTAGTGGCTCAAGTCGTGTGGGAGTGGGGCGCGCAGCGCCGAGGTTGGCCGGGGCGTTGGGCGATTTGCTTACTGGCGCTAGGTAGCGGCGTGCCACTGACGCTACTGATGATGGCGTGGGTGAGCGGGGAAACGCATGCGTTGACACCGATTGTGGCGGTTTACCCTGTGTGGTTGGCAGTGCTGTATGGCGTTTATCGTCAGTGGCGGCTTGAGCTATTTATGTTGGCAGGGGGCTGCGTCTCGGTGATTGCGGTGGTCACATTGCTGCTTGCACGCTACATGCTATGGGAAAGCCAATGGAA
SEQ ID NO:4
TTGACAGCTAGCTCAGTCCTAGGTATAATACTAGTAAAGCCCGCTGAGCAATCAGGTTTTAGAGCTAGA
AATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTTGAACCCGGGGTACCCGACACTGTAGAGGTGGCTTACTTGGATGGCGTCGATACCCCTTACCTTGAGCAGCAAGAGGGGTGGAGCGTGGACGGTGTAAGCTACAAGTGCCGCATTGATGCAGGTGTTGCCCCGCTGGACTACCGTGGAATGGTGCGCGGCAGCAAGGCATAAGCTCTTAAAAGTAACGTCACAGCAGGCAGCCAACGCCGTGAATGGAGAGATTCTTTCACGGCTTTTTAGTGCCCAACGGTGGAGCAGACAGCCGCCAAAATAAAAAAGGTACTCCCCCACCCACCCCCCGCAGTACGGGGGCAAACAGTCGCGGAATTCGCCTATGTACGGCAAATTTCCAGGGGTTGGTTGTTGTTTTGTTATCACGCCATCAAGCCGCCGCTGGCACCATACCCGGTATAACGTGGCCAATGCCTCATAAATGCCCCATTCAATGCGCTACCACGCTGTTTTAACTAGCCTTTGGTCAGGCTGGCGCGAAGCCATACAGGTGCCCGACATCCACTAAGGTGGCCACTAAATCACCCCGGCCATAGGCACGCGATACAACAACCCACTACAACCAAACGGCGCATTCTGGCCATGCCTGGTGCGCTGCTGGCGTTATGGTGAATTTGTCACGCTATGATGAAGGCAATTAGTCTGCTGGCGCACTTCACTACCTGGGGGATGGGGCGAAGCCCCATGAAGCGAAGCGGTAACAGACCGGGCACCAAAGCCGCGGCGGTTTGTTGGCCAACCGTCACACGCTAAGCCCAAAGCACCACAGCCCCTTTATTGCCAAACAGGGGGGGTATTAATTGGTGCTAGCTGGGAGAAGGGGAGTTGAATTGCTTAGCAACGGGCTGGCGAGTGAGTTTTATAAGCGCTGTGTGTATGTGAAATAGGCGTTTAACGTTGCATCTGAGCGCAGCCAAGCACTATTATTTATGTTGGGTAGGATGTTGGTGCAATTTGAAATTGTCATTCAAGTTTTTGTTTTTAATATATGGGGCGCGGACTATGCCTCCACACCGCTCGTCACATCCTGTTGCGTTCACTGGAATCCCAGACTAGAGTTTGACCTGCGAGCAAGCTGTCACCGGATGTGCTTTCCGGTCTGATGAGTCCGTGAGGACGAAACAGCCTCTACAAATAATTTTGTTTAAGAGTTACTAGAGAAAGAGGAGAAATACTAGATGACTGGTAAAACTGGCCACATCGACGGTCTGAACAGCCGCATTGAAAAAATGCGTGACCTGGATCCTGCTCAGCGTCTGGTTCGTGTGGCAGAAGCGGCAGGCCTGGAACCGGAAGCTATCTCTGCACTGGCGGGCAACGGCGCTCTGCCGCTGTCCCTGGCTAACGGTATGATTGAAAACGTGATCGGTAAATTCGAACTGCCACTGGGCGTTGCGACCAATTTCACCGTAAACGGTCGCGACTACCTGATCCCGATGGCGGTGGAAGAACCGTCTGTTGTGGCGGCCGCTTCTTACATGGCGCGTATCGCACGTGAAAACGGTGGCTTCACCGCCCACGGCACTGCTCCACTGATGCGCGCACAGATCCAAGTTGTGGGCCTGGGCGATCCAGAAGGTGCTCGCCAGCGTCTGCTGGCTCATAAAGCTGCGTTTATGGAAGCCGCGGACGCTGTGGATCCTGTGCTGGTAGGCCTGGGTGGCGGTTGCCGTGACATTGAGGTGCATGTTTTCCGCGACACTCCTGTCGGTGCGATGGTTGTTCTGCACCTGATCGTGGATGTTCGTGACGCGATGGGTGCGAATACGGTGAATACGATGGCTGAGCGTCTGGCTCCGGAAGTTGAACGTATCGCTGGCGGTACCGTTCGCCTGCGTATTCTGTCTAACCTGGCTGACCTGCGCCTGGTGCGCGCACGTGTAGAACTGGCCCCGGAGACTCTGACTACTCAGGGCTATGACGGTGCAGACGTTGCGCGTGGTATGGTGGAGGCATGCGCGCTGGCTATCGTCGACCCGTATCGTGCTGCCACCCATAACAAAGGTATCATGAACGGCATCGACCCGGTGGTTGTTGCCACGGGCAACGATTGGCGCGCAATCGAAGCCGGTGCACACGCGTATGCTGCACGCACCGGTCACTACACGAGCCTGACCCGTTGGGAACTGGCCAACGACGGTCGCCTGGTAGGTACCATTGAACTGCCGCTGGCTCTGGGTCTGGTTGGTGGTGCTACTAAAACCCACCCGACCGCACGTGCAGCACTGGCCCTGATGCAGGTCGAAACCGCAACCGAGCTGGCCCAAGTAACTGCTGCGGTTGGTCTGGCGCAGAATATGGCCGCGATCCGTGCTCTGGCGACCGAGGGTATCCAGCGTGGCCACATGACTCTGCATGCGCGTAACATCGCGATCATGGCGGGTGCGACTGGTGCCGATATCGACCGCGTCACCCGTGTTATCGTCGAAGCTGGCGATGTGAGCGTGGCCCGCGCTAAGCAGGTCCTGGAAAACACGTAACTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGCTGAAAGGAGGAACTATATCCGGATTGAGAGGGCTTCACTCAAGATGCCTCCACACCGCTCGTCACATCCTGTTGCGTTCACTGGAATCCCAGACTAGAGTTTGACCTGCGAGCAAGCTGTCACCGGATGTGCTTTCCGGTCTGATGAGTCCGTGAGGACGAAACAGCCTCTACAAATAATTTTGTTTAAGAGTTACTAGAGAAAGAGGAGAAATACTAGATGACTAAAAAAGTAGGTGTAGGCCAGGCGCATTCCAAAATCATTCTGATTGGCGAACATGCGGTTGTATACGGTTATCCGGCGATTTCCCTGCCTCTGCTGGAAGTTGAGGTGACTTGCAAAGTCGTACCGGCGGAATCTCCATGGCGCCTGTACGAAGAGGATACTCTGTCCATGGCGGTCTATGCGTCTCTGGAGTACCTGAACATCACCGAAGCGTGCATCCGTTGCGAGATCGATTCTGCAATCCCTGAAAAACGTGGTATGGGTTCTAGCGCGGCGATTAGCATCGCAGCCATTCGCGCTGTGTTCGATTACTACCAGGCCGATCTGCCGCACGATGTTCTGGAAATCCTGGTGAACCGTGCGGAAATGATTGCACACATGAACCCGTCCGGTCTGGACGCGAAAACCTGCCTGTCTGATCAGCCGATTCGCTTCATCAAAAACGTGGGCTTCACTGAACTGGAGATGGACCTGTCCGCCTATCTGGTTATCGCAGACACCGGTGTTTATGGCCATACGCGTGAGGCGATTCAGGTGGTTCAGAACAAAGGCAAAGATGCGCTGCCGTTTCTGCATGCGCTGGGTGAACTGACGCAGCAGGCAGAAATTGCGATTTCTCAGAAAGATGCGGAAGGCCTGGGCCAAATCCTGTCCCAGGCGCACCTGCACCTGAAAGAGATCGGTGTGTCTTCTCTGGAAGCCGATTCTCTGGTTGAAACCGCTCTGAGCCACGGTGCGCTGGGTGCTAAAATGAGCGGTGGTGGTCTGGGTGGCTGTATTATTGCGCTGGTAACCAACCTGACTCACGCGCAGGAGCTGGCTGAACGTCTGGAAGAAAAAGGTGCAGTACAGACGTGGATCGAAAGCCTGTGATAAGCCAGGCATCAAATAAAACGAAAGGCTCAGTCGAAAGACTGGGCCTTTCGTTTTATCTGTTGTTTGTCGGTGAACGCTCTCTACTAGAGTCACACTGGCTCACCTTCGGGTGGGCCTTTCTGCGTTTATACGTGCCTGCCATTTAAGTTATCCACATGCAGTTTGCGCTACGTTAGTCCTGTTTTTGCCCATGCAAGGTGACAAGCGTAGGGTGCTTCGCTACTGTCATCTTAAGAATGGTGAGCAGTTTGGGCGGCTTTTTATCCGGAGTAGATATATGCGCTGAGATTATATATTTACGTGGCCTTTAGCTTTATATGTTGAGCCCTATCGTGCTGAAAAAAAATATGAATCAATAGGTCTTTTAATAAGGCCAATCACGGCGATAGGTAATAGCTTTTTCGTTTTGGCTTCATCTTTACTAAAAAGCTGTGCGTTTTGACAGTTTTAAACACTCAAAAAGGGAAGTCTCATGGATGCCGAACAGAAGGATACAACACAGTTTTTCTTAGATAGTTGGCTTGCAGAAGCAGTTCATCGGTGTAGCTCTTTTTTGCATAGCGCTAATAAGCCATTTTCATTTGATGATGATTTTCATCGGCGACGAATGTTTGAAGAACACTACGCTCTCACGGCTACTGTCATGGGTGTTCGCTTTGCAAAGCAGCTAGTCCATCACACTCCAAAAGAATTAAAGGAGAGCCTGGAATCATTTATTATCGCAACCCAAGATGCGGTTGATGTTCGTGACATGCGTGAACACTCAGATGAATATTTTTTAGGCAGGGGGCGTAAGAAAGAAGAGTTCTTCAAGGGTAGTGGGCAAGGCGTCCAATGTGATATGTCCTCGTCAATTCAGAACGAAAATGGCTACATGCTTGGCAATCTGATAGCCATGGAGACGGTTCGAGATGAGTGTCAAGCTCTGCTCCAGTACATCCGCGACAATGCTTAACAAATCATTCCAGTTTGCTCCGGTCCTGACGGGTCTCCTCTGGACAGCTTTTTCTCCGCTTCGCCACTTAAAAGACTATCGCTAAGTAATGGCGTTATACCACAGTTATCTAACGCACGTTCGTGTCAGTTACATGCTTTAGCAATCCACCCACAGCAGCCCCTCAAT
SEQ ID NO:5
TTGACAGCTAGCTCAGTCCTAGGTATAATACTAGTTTGGGTGATATTTAGTTGCCGTTTTAGAGCTAGA
AATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTTGAACCCGGGGTACCGCTTATCGGCAAGCGGATCACTCTGGAGCAGTCGATTGATGCGCTGATGAGCATGGATAAGTTCGAAGGGGCGGGCGTAACGGTGGTACCGAGTTTTGAGATAACGGGCTTCAGCATCACTGCCCGTTCTAAATTGAAAGGCTTAGGTAAGACTGACGCTAATAGCATCGAGGGCGTTGAATTAGCATCTACTCACGATGTGTGGTGTGCGGTAGGCTCACTAATTGCTTCCAACCTGATTGGACACCCTCATGCTCACCTTGCGCACTGTCACTTTCACGCTTCTGGTCGTTATTCTCGGCATACTGCCCATCAACGCTTACGCAAACGAATCAACTTGGCAGGCGCTGCAGGAAGGCGGCTTGGTGATTCTGATGCGTCACGCACTGGCTCCAGGCATTGGTGATCCGGCTGGGTTTGAGCTTTCTCAGTGCGATACACAGCGTAACCTTTCAGCCCAGGGGCGCGCTCAGGCTGAGGCGATTGGTCGTTCATTTCGTGAGCGGGATGTGCCTATTGCCTCGGTGTATTCGTCTCGCTGGTGCCGGGCGCTGGAAACTGCTGAGCTAATGGCGTTGAGCCGCGTGGAGCCAACCCCATGGTTAGATTCGTTTTTTCGTCAGCGCAGTGAGCGAGGTGCACGCACGCAAACGGCGCGTGAGCACATAGCTGCTTGGCATGGCCCAGGTAATTTGCTGCTGGTGACCCATCAGGTCAATATTACGGCGCTCACAGGCGGTGGAGTGAGCTCAGGCGAAATGATCGTCGTGCGCCCAACGGGCGATTCGTTTCAGATGGTGGGCCGGTTGAACGATGAGTAGGCGATGACCGCTAATCGCTAGCGGGCGTTTTAAGTAGCATTAGTGCTTCCTTAATGGTTTTTATTAGTCAATTAAAAATCAAAGTGTTAAAGAAACACTTTTTAGCAGTTTAATTAATTCATGATTTTTAGCGTTAATTATTAATGCGATAATTGTTTCTTATTGTTTAATTTAAAGCCGAATTCATGCCTCCACACCGCTCGTCACATCCTGTTGCGTTCACTGGAATCCCAGTATAAAGTTTGACCTGCGAGCAAGCTGTCACCGGATGTGCTTTCCGGTCTGATGAGTCCGTGAGGACGAAACAGCCTCTACAAATAATTTTGTTTAAGAGTTACTAGAGAAAGAGGAGAAATACTAGATGATTGCAGTAAAAACCTGTGGCAAACTGTACCTGGCTGGCGAATACGCGATCCTGGAACCGGGTCAGCTGGCGCTGATCAAGGATATCCCTATCTATATGCGCGCGGAAATCGCATTCTCTGATTCCTACCGTATCTATTCCGATATGTTCGATTTCGCGGTTGATCTGCGTCCGAACCCTGACTACTCTCTGATTCAAGAAACCATCGCTCTGATGGGTGACTTCCTGGCTGTACGTGGTCAGAACCTGCGTCCGTTTTCTCTGGAAATCTGCGGTAAGATGGAACGCGAAGGCAAGAAGTTTGGCCTGGGTAGCTCCGGCTCTGTAGTAGTGCTGGTTGTAAAAGCACTGCTGGCTCTGTACAACCTGAGCGTGGACCAGAACCTGCTGTTCAAACTGACCTCTGCGGTGCTGCTGAAGCGTGGTGATAACGGTTCCATGGGTGATCTGGCGTGTATCGTTGCTGAAGATCTGGTTCTGTATCAGTCCTTCGATCGTCAGAAGGTAGCAGCTTGGCTGGAAGAAGAAAACCTGGCTACTGTTCTGGAACGCGACTGGGGCTTCTTCATTTCCCAGGTAAAACCGACCCTGGAGTGCGACTTCCTGGTCGGTTGGACCAAAGAAGTGGCAGTTTCCTCTCATATGGTTCAGCAGATCAAGCAGAACATCAACCAGAACTTCCTGACGTCCTCCAAGGAAACTGTCGTAAGCCTGGTTGAAGCTCTGGAACAGGGTAAAGCTGAAAAAGTGATCGAGCAGGTGGAGGTGGCGTCTAAGCTGCTGGAGGGTCTGAGCACTGACGTTTACACGCCGCTGCTGCGTCAGCTGAAAGAAGCTAGCCAGGACCTGCAGACCGTAGCTAAATCTTCTGGCGCCGGTGGTGGTGACTGCGGTATTGCTCTGTCCTTCGACGCCCAGTCTACCGAAACCCTGAAAAACCGCTGGGCAGATCTGGGTATCGAACTGCTGTACCAGGAACGTATCGGCCACGACGACAAATCCTAACTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGCTGAAAGGAGGAACTATATCCGGATTGAGAGGGCTTCACTCAAGATGCCTCCACACCGCTCGTCACATCCTGTTGCGTTCACTGGAATCCCAGTATAAAGTTTGACCTGCGAGCAAGCTGTCACCGGATGTGCTTTCCGGTCTGATGAGTCCGTGAGGACGAAACAGCCTCTACAAATAATTTTGTTTAAGAGTTACTAGAGAAAGAGGAGAAATACTAGATGGACCGTGAACCTGTAACCGTACGTAGCTACGCTAACATTGCAATTATCAAATACTGGGGTAAGAAAAAGGAAAAAGAGATGGTCCCTGCGACCTCCTCTATTAGCCTGACCCTGGAAAACATGTACACCGAAACGACCCTGTCTCCGCTGCCGGCTAACGTGACTGCTGACGAATTCTATATCAACGGTCAGCTGCAGAACGAAGTTGAACACGCTAAGATGTCCAAAATCATTGATCGTTACCGTCCGGCCGGTGAAGGTTTCGTGCGTATCGATACTCAGAACAACATGCCAACCGCAGCTGGTCTGAGCAGCTCTTCTTCTGGCCTGTCCGCACTGGTTAAAGCGTGCAATGCGTACTTTAAACTGGGCCTGGACCGTAGCCAGCTGGCACAAGAAGCGAAATTCGCATCTGGTAGCTCTTCCCGCTCCTTTTACGGTCCACTGGGTGCTTGGGACAAAGATTCTGGTGAGATCTACCCGGTTGAAACCGATCTGAAACTGGCGATGATTATGCTGGTTCTGGAAGATAAGAAAAAACCGATCTCCTCTCGTGACGGTATGAAACTGTGCGTTGAAACCTCTACCACTTTTGACGATTGGGTCCGCCAGAGCGAGAAAGATTATCAGGACATGCTGATCTACCTGAAAGAAAACGATTTCGCAAAAATCGGCGAACTGACCGAAAAAAACGCTCTGGCGATGCACGCAACTACCAAAACGGCGAGCCCGGCATTCTCTTACCTGACCGACGCGTCTTACGAAGCCATGGCGTTCGTACGTCAGCTGCGCGAAAAAGGCGAAGCGTGCTATTTCACTATGGATGCCGGTCCGAACGTTAAAGTATTCTGCCAAGAAAAGGATCTGGAACACCTGTCTGAAATCTTCGGCCAGCGTTACCGTCTGATCGTAAGCAAAACCAAAGACCTGTCTCAGGACGACTGTTGTTAATGATAAGCCAGGCATCAAATAAAACGAAAGGCTCAGTCGAAAGACTGGGCCTTTCGTTTTATCTGTTGTTTGTCGGTGAACGCTCTCTACTAGAGTCACACTGGCTCACCTTCGGGTGGGCCTTTCTGCGTTTATATTTTAAAGGCTGGTATATAAAAGCTTGTCTTTGTTGTAGGCGATTAGTTGAATGAGTTTTTACACTGAGTCGCTATGACAGAATTTAACAATGTGGTTAGTTTTTAAGAACTAGTTTCTTACTTTTGATTAATTAAACAAGAGTCGTGCACTGAGTGCGCGCATTACTGCGTACACATGAATAAGTGCCTTGTCGGTGCTTAATTAGCTGGCGCGGTGTTCCCAATGGTGCTTGGACATTAGAGGAGTAGGGATATGAAAAAGTACGCAGCGGAGTTAATCGGTACGTTTTGGTTAGTGTTGGGTGGTTGTGGCAGCGCGGTGCTAGCGGCGGCTTTCCCAGACGTAGGTATTGGCCTATTAGGGGTATCGCTGGCCTTTGGTTTAACGGTTGTCACGATGGCGTATGCGATTGGGCATATTTCGGGCTGCCATTTAAACCCTGCGGTATCGATAGGGCTTTGGGTGGGCGGGCGCTTCCCTGCAAAAGAGTTGCCTTACTATATTGGCGCGCAAGTGCTGGGTGCTATTGTTGCCGGCGGTGTGCTGTATCTTATTGCGAGTGGTCAGGCGGGTTTTGATGTGTCGGCTGGATTTGCATCCAATGGGTATGGAGAGCATTCACCCGGCGGTTACAGCATGATGGCAGCACTACTCATTGAAGTCGTGATGACCATGATGTTTATCTTCATCATTATGGGGGCAACCGATGGTCGTGCACCGGCAGGCTTTGCGCCTTTGGCGATTGGCTTGGGCTTAACGCTTATTCACCTGATCAGCATTCCGGTGACCAATACCTCGGTGAATCCAGCGCGCAGTACGGGCGTTGCGCTGTATGTGGGTGATTGGGCGACGGCTCAGCTGTGGTTGTTCTGGGTAGCGCCAATGATCGGTGCGGCGTTAGGGGCATTAGCGTATCGCTTTATTGCTCAGCCTGAGGCACTCATAGCCCCGCCATCGCCTTCTGATCACGATGATGATCTGACGGGTAAGATCGTTCC
SEQ ID NO:6
TTGACAGCTAGCTCAGTCCTAGGTATAATACTAGTTGGGTAACTGGTGGAACTGGGTTTTAGAGCTAGA
AATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTTGAACCCGGGGTACCCAGCCACAAAAAAGCCGTTACCTTTCGGTAACGGCTTTCTCTATGTTGGGTAGCGGGGACCGCCGATGTTAAAACAAAAGCGAACCGATGACCTTCCTAGGGTGGTGAAGAACTGAGTCGATGTTTTTTGTGAGCTTTCTTCACAAAATTTAGACACAAAAAACCGCTACCTTTCGGTAACGGCTTTTTCTATGTTTGGTAGCGGGGACCGCCGATGTTAAAACAAAAGCGAACCGATGACCTTGCTAGGGGGGTGAAGAACTGAGTCGATGTTTTTTGTGAGCTTTCTTCACAAAATTCAGACACAAAAAAACCGCTACCTTTCGGTAACGGCTTTCTCTATGTTTGGTAGCGGGGACCGGCGATGTTAAAACAAAAGCGAACCGATGACCTTGCTAGGGGGGTGAAGAACTGAGTCGATGTTTTTTGTGAGCTTTCTTCACAAAATTCAGACACAAAAAAACCGCTACCTTTCGGTAACGGCTTTCTCTATGTTTGGTAGCGGGGACCGCCGATGTTAAAACAAAAGCGAACCGATGACCTTGCTAGGGGGGTGAAGAACTGAGTCGATATTTTTTTGTGAGCTTTCTTCACAAAATTCAGACACAAAAAAACCGCTACCTTTCGGTAACGGCTTTCTCTATGTTTGGTAGCGGGGACCGGATTTGAACCGATGACCTTCGGGTTATGAGCCCGACGAGCTACCAGACTGCTCCACCCCGCATCAACGTGTGGCGTATTCTACGCATTTTTTACGCTATGTCAACCCTGTCTAGAAAACGTTTTAAAGGTAAGTTGCGACTTTCATCTTGCTGCAACATTGGAAGAGTAAAGCTATGCTTCCAATAGGCATAACAAAAAGCTTACTGTCAGTACGTCGTTCAACTAACAATACGACGTGCTGTGAATGCTAAAGCGCTACGGCGCTTATTTAGAATGGCTTTCGACATCATAATAGTGCTTAGCGTCCAAGCCATTTGTCATATCAGGGAGGTAGTCATCGCCCAAAACGATAAGTTGCTTTATTCATTAAGGTAAAGCGTTAACGGGAGGCTAATCGCCTCCCGTTGCCATTGGTGGGGTGTGAAGTGCTTAAGGATGCGGTACTCGCGCCAGACGACTAAAGAGATTGTCAAACTCTTCCGCTTCCTTGCGCCACAGCTGGTTAGGCATGGGGCCAAGCGCCATGAGCGCTGCTAATATGTCGATAATTTCATCTGGTCGGCTGCGTTCGTTGTTTATCCCTTCATTCAGCCGTTCTACCTGAATCGCCAGCCGGAGAGGTTCATCACGCTGTTTGACGCTACCTAGCGCTAGCAAAGACAGGTGCACTCTTAGGCGAGCCAGCCCATCTTCCAGCTCTGTAAGTTTTTCGGCTGGGAGAGGTATCGAGGCGGTTAGCCGCGCATGATTACGCTGCTGATGAGCCTCTGTAAAAATAGCAGGAAGCCTTTCACTCAGTATCTCTTTCGCATCAACCGCGTGTGGCTCTTCGCCCGCCAGCGCCTGTTGATCTGCAGCGATGTGCGCGTTTACCAGCGGTAACGCGGTATGCCATTGTTGCACTGTATGGGCAATTTCCAGGCGGCTTAAACGCTCGCGTTTGGCTCTTACTATGCCGCTTAGGCGTCGCTGCATGCCGTCACTTCGTCGATTACGAGGCAAAGGCTCAAGTTGGCTAATGCTTTCTAGGTAGGACTCAAGGGTGGCAGACTCGTTGGCATGGGTCGGTTGCCAGCTATCCATTTCGTCAATCAATGTTTGCAGTTGATCGAGTGTTTGTTGCTGGCGTGTTGCCTGCTCATGCTTGTGAGCGTCACGCTGAGCAAAGAGCTGATCGCAGGTATGGCGGAAGGCTTTCCATAGTGCCTGTTCTTCGCCTTTTGGGGCGCGGCCCAGTGCTCGCCACTGCTGCTGTAGCTGCTTTGTACGTGTGATGCGCGCGGCTAAGGGTTGCTCGGCGTCATCCTGTAAGCTTTTTGCTTGTTCGATAAGCATGC
SEQ ID NO:7
TTGACAGCTAGCTCAGTCCTAGGTATAATACTAGTGTGTCCATGTTTTTGACGCGGTTTTAGAGCTAGA
AATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTTGAACCCGGGGTACCTTTTACTTCTTGACACGCTTGGCGAGCGGATAAACAACCTCGCGCCAGCCATGGTGAAAAACGTGTGGAAAAATTAGCCCCCAATAAGCCATTACGGGTTTTCTTGTACGATTCCGCGCCGTTTTGCCGCCAGAGATACTGTTGCAAACGATCACTAGCCGCTGACTCACCTCCCACAAATACAAAGCCCTGGCGATTATCAGGCTGCCAGACAGCACTCTCTTCGCATACTGCCTTGAGCGGGGGAAACCCTCTGGGAGCTGATTCAGGCCATGGAGGAAGTGTTATCGGCGCGGGTTGCGGTGCCAGAAACTCACAATGTTTTTCAACACGCCGTCGAAATGCCGAAAAATTAGGCGGCAACTCACTCAATGCAAAGGGAAGATCGTCTGCAGCAATTAAATAGCCACTATCAGCACAAAAAAACTGACACGCAGGCGGGAGTTGTTCAGCGACGCGCGCAATATGCTGTGACTCTTCATACCCCGAATGCGCTGCCACGCGCACTTCTCGTGCACTCAGCATGTCAGCAGTCTCTAGAACAATACTGGCAGGGTCGCCAATGCGAACTAACAAATCACTGCCACGCTGCAGCAGCTCACCACGTAGCTCCATCAAGCTTTGCCATAAAAAGCGTAATCGAGCAGGGCCCAGCCTGGGAGTGTCATCGCCCGCACTCGAAGGCTCAAACCATCGCTGGTCCAGCACATAGAGACAAAGGAGCTGTTCTGGGGGAGCATCAAAATGTAACAAGGGGTTATCAGCTATCCGCAAATTATCCTGAAGCCATACAATATCAGTCGTGCTGTTCATGCACTTGCCTCCTTGGTGTGCTGTGCTGCTTGGCTTCGCGACGGCATCGTTCACTGCAATAGCGCACTTCGTCCCAGCAGCGCGCCCACTTTTTCCGCCAAGTAAAAGGACGCTGGCATTGAACACAGTCTTTTTGCGGTAAATCTTGCTTGCGTTGCATAGAGGTTATCTCGCTGCCCGACACTTAATGCCTCCACACCGCTCGTCACATCCTGTTGCGTTCACTGGAATCCCAGTATAAGATTTGACCTGCGAGCAAGCTGTCACCGGATGTGCTTTCCGGTCTGATGAGTCCGTGAGGACGAAACAGCCTCTACAAATAATTTTGTTTAAGAGTTACTAGAGAAAGAGGAGAAATACTAGATGACCACCAACCGCAAAGACGAACACATCCTGTACGCACTGGAACAGAAGTCCTCTTACAACTCTTTCGACGAAGTTGAACTGATCCACTCTTCCCTGCCGCTGTATAACCTGGACGAGATCGACCTGTCCACTGAGTTCGCGGGCCGTAAATGGGACTTCCCGTTCTACATCAATGCTATGACCGGCGGCAGCAACAAAGGCCGTGAAATCAACCAGAAACTGGCGCAGGTGGCGGAATCTTGCGGCATCCTGTTCGTAACCGGCTCCTATTCTGCGGCTCTGAAAAACCCGACTGACGACAGCTTTAGCGTGAAATCTTCTCATCCGAACCTGCTGCTGGGTACGAACATCGGCCTGGATAAACCGGTCGAACTGGGCCTGCAGACTGTTGAGGAAATGAATCCAGTGCTGCTGCAAGTCCACGTCAACGTTATGCAGGAACTGCTGATGCCGGAAGGTGAACGTAAGTTCCGTTCTTGGCAGAGCCACCTGGCTGATTACAGCAAACAGATCCCGGTCCCGATTGTGCTGAAAGAAGTAGGCTTCGGCATGGATGCGAAAACCATCGAACGTGCCTATGAATTCGGCGTACGTACCGTAGATCTGTCCGGTCGTGGTGGTACCTCCTTCGCCTACATCGAGAACCGTCGTTCTGGTCAGCGTGACTACCTGAACCAGTGGGGTCAGTCCACCATGCAGGCTCTGCTGAACGCCCAGGAATGGAAAGACAAGGTCGAGCTGCTGGTAAGCGGCGGTGTGCGTAATCCACTGGATATGATCAAATGCCTGGTTTTTGGCGCAAAAGCGGTAGGCCTGTCCCGCACTGTACTGGAACTGGTAGAAACCTACACTGTGGAAGAGGTGATCGGTATTGTTCAGGGTTGGAAAGCTGATCTGCGTCTGATCATGTGTTCCCTGAACTGTGCTACTATTGCTGACCTGCAGAAAGTTGACTACCTGCTGTACGGCAAACTGAAAGAAGCGAAAGATCAGATGAAGAAAGCGGGTGGTGGTGGTTCAGGTGGTGGTGGTTCAGGTGGTGGTGGTTGTGGTCTGGAACAGTATGCAAATCAGCTGGCAGATCAGATTATCAAAGAAGCAACCGAAGGTTGCTAACTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGCTGAAAGGAGGAACTATATCCGGATTGAGAGGGCTTCACTCAAGATGCCTCCACACCGCTCGTCACATCCTGTTGCGTTCACTGGAATCCCAGTATAAGATTTGACCTGCGAGCAAGCTGTCACCGGATGTGCTTTCCGGTCTGATGAGTCCGTGAGGACGAAACAGCCTCTACAAATAATTTTGTTTAAGAGTTACTAGAGAAAGAGGAGAAATACTAGATGAGCGTTAGCACTGAAAACGTAAGCTTTACCGAAACTGAGACCGAAGCGCGTCGTTCTGCGAACTATGAACCGAACTCTTGGGATTACGATTACCTGCTGTCCAGCGATACGGACGAAAGCATCGAGGTTTACAAAGATAAGGCTAAAAAACTGGAAGCAGAAGTGCGTCGTGAGATCAACAACGAAAAAGCGGAATTCCTGACCCTGCTGGAACTGATCGATAATGTTCAGCGCCTGGGTCTGGGTTATCGTTTTGAATCCGACATCCGTGGCGCGCTGGATCGTTTCGTCTCCTCCGGCGGTTTCGATGCAGTCACGAAAACCAGCCTGCACGGTACTGCACTGTCCTTCCGTCTGCTGCGTCAACATGGTTTCGAAGTCAGCCAGGAAGCCTTCAGCGGTTTTAAAGATCAGAACGGCAATTTCCTGGAGAACCTGAAAGAGGATATCAAAGCGATCCTGTCCCTGTACGAAGCATCCTTTCTGGCCCTGGAAGGCGAAAACATCCTGGATGAAGCGAAGGTCTTCGCCATCAGCCACCTGAAAGAGCTGTCCGAAGAAAAAATCGGCAAGGAACTGGCTGAACAGGTAAACCATGCCCTGGAGCTGCCTCTGCACCGTCGTACCCAGCGCCTGGAAGCCGTATGGTCCATCGAGGCTTACCGTAAAAAAGAGGACGCTAATCAGGTCCTGCTGGAACTGGCGATCCTGGACTATAACATGATTCAGTCTGTATACCAGCGCGACCTGCGTGAGACTTCTCGCTGGTGGCGCCGCGTTGGCCTGGCAACTAAACTGCACTTCGCACGTGACCGTCTGATCGAGAGCTTTTATTGGGCGGTGGGCGTGGCTTTCGAACCACAGTATTCTGACTGCCGCAACTCCGTTGCTAAAATGTTCAGCTTCGTTACCATCATCGACGACATCTATGACGTGTACGGCACCCTGGATGAACTGGAGCTGTTCACCGATGCGGTAGAACGCTGGGACGTCAACGCCATCAACGACCTGCCGGACTACATGAAACTGTGTTTTCTGGCACTGTACAACACCATCAACGAGATTGCTTACGATAACCTGAAAGATAAGGGTGAAAACATCCTGCCATATCTGACTAAAGCGTGGGCTGACCTGTGTAACGCGTTCCTGCAGGAGGCGAAATGGCTGTACAACAAAAGCACCCCTACCTTTGACGACTACTTCGGTAACGCCTGGAAAAGCTCTTCCGGTCCGCTGCAGCTGGTGTTTGCATACTTCGCAGTAGTTCAGAATATTAAGAAAGAAGAAATTGAGAACCTGCAGAAATACCACGACACTATTAGCCGTCCGTCTCACATCTTTCGCCTGTGCAATGACCTGGCGTCCGCAAGCGCTGAAATTGCCCGCGGCGAAACTGCTAACTCCGTAAGCTGCTACATGCGCACCAAAGGTATCAGCGAAGAACTGGCGACTGAATCCGTAATGAACCTGATCGACGAGACCTGGAAAAAGATGAACAAGGAAAAACTGGGCGGCTCTCTGTTCGCTAAACCGTTCGTCGAAACCGCTATCAACCTGGCTCGTCAGTCTCACTGCACTTACCATAACGGCGATGCGCACACTTCTCCGGATGAACTGACTCGTAAACGCGTGCTGTCTGTGATCACTGAACCGATTCTGCCGTTTGAACGTGGTGGTGGTGGTTCAGGTGGTGGTGGTTCAGGTGGTGGTGGTTGTGGTAGCCTGCGTGAATGTGAACTGTATGTTCAGAAACATAATATTCAGGCCCTGCTGAAAGATAGCATTGTTCAGCTGTGTACCGCACGTCCGGAACGTCCGATGGCATTTCTGCGCGAATATTTTGAACGTCTGGAAAAAGAAGAAGCCAAATAATGATAAGCCAGGCATCAAATAAAACGAAAGGCTCAGTCGAAAGACTGGGCCTTTCGTTTTATCTGTTGTTTGTCGGTGAACGCTCTCTACTAGAGTCACACTGGCTCACCTTCGGGTGGGCCTTTCTGCGTTTATAATTATCTTATACAGTATAACTATTGTACATAAATCAGCGTACATGTTTTTGACGTTATGCTTTTCCCCTAACTCCCCCCTGCTCTTTCCCCAGTTTTTTCCGGACTTTTCCCAACGACTTTTCTCACAGCGCTTCAAATAAAAAAAACCATCCAGATGGATGGTTTTTCGAAAAGGCAATGCAACAGCAATGAACAACTATGAAAAAAGTATTAGTCGAAATACAACACAGAAAATTATGGTCAATCAATCAGGGTCTGTGGTTCGTGGATGACGCTTAGCATTTTCATGGGTTTCTAGACCGCTTTTAAGCTCGTGAGTGAGTGGATCATAGTTAGGCCTCAGCTCATCTTTTACTGTACCGCTCCAAAGGCGCGAGCCCACAAAGTAACCTGCCCTACCGATGACATGGGCAGCAATCGGTGCTGTGATTAAAATAAAAACAATAATCGCAAACGAACGCGCAACCACGCCAACTTCAGCAAAGTGCATGGCCGATGCCAGCATAATTAAAATAACCCCTAGCGCTGCAGCCTTAGTGGTCGCGTGCATGCGGGTCAGTAGATCCGGTAGCCGCAGCAAACCGATGGCAGCCAGCAACATAAAGCTCGACCCCGTTATCAACAGCGTGCCTTTGATAAACTCAATCATCTCGCGGCCCCCCACGTTCCAGAAAGCGTGCAAAACCAATCGCCGCTAAAAAGCCCATTAAGGCAATCACGATTGCCGCATCAAGAAAACTCGCGACGCCTGATTGAATAGCATAAACGCCAACCAGCCCCACTACGGTTGTAGAAAACAACTCAAGTGCAACGACGCGATCGGGCAAGCTAGGCCCACGCACGACACGCACAAAGGTCAGTACAAGCGCCAACCCCATAATTATCTGGCTTATCAGAATAACGTTATCCATTAACGAAATAGCTCCAATGCACGGTGCTCCATCTCTTTTAAGTTATTTCGAAGCTCTTCTTCATCATCCAAAAACATAGCGTGGATAT
SEQ ID NO:8:
TTGACAGCTAGCTCAGTCCTAGGTATAATACTAGTGTGCCACAGTGGCATTGCTTGTTTTAGAGCTAGA
AATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTTGAACCCGGGGTACCCAACAGAACGCCAGTGAAAATAGTTGAGAATGGCACCTGCTGATCAGGGCCACCCATTGAGTTAAATTTACTCGGGTCGCTCTCTTTCAGAATGCTCCAGCCTTCCATGACACCACTGCCATTGCTCACTGCCTGAAGACCGAAATAAACAATAACAAAACCGCCGATTAGTAGTCCCACCCCATTCAACGTGTCCGATACCGCTACTGTGCGCAGGCCGCCAAATAGCGCGTACACTGCGCCAATTAAACCGACTGCCCATACCGTGGCCCACAGCAGCACCGTGCTCGACTCAATGCCGGTCAGACCCTGGAGGTCTAACATGCCCTGTAAACCGATAGCCCCTGAATAGAGGATAATGGGCAACAGCACGACGGCATAAGCAATCAAGAAAATAACGTTGGCAATCAGTTGAGTGCCGTTATCAAAACGTATTGCTAACAGCTGTGGGAGCGTCGCGATACCGCTTTTAAGAAAGCGCGGTAGGAAAAACAGTGCCAATGCAACCAAGGCAATAACCGCGATCACCTCCCAGGCCATGACACTTAGGCCATCGGTAAACGCTGAACCGTTTAGCCCTACCATCTGCTCGGTAGAGAGGTTAGTCATCAGCATTGAGGCTGCAATCAGCGGAAAGGTTAACGTCCTGCCGGCTAGAAAATAGCCACTTGTACTGCGGTGATCATCTCTGCGCGTAATGCGCCACGTAACAAAGGCCACTAGGCCGGTAAAAAAGATAAACGATGCCAGCGTTAGGGCATGCATGGGAAGGTCCTTGGGAATAGTCGCTTATCGACAGGCGACGCAGTGAATGTAGGTAAAATTACCAATATGCGCGGGCATTCTAAGGAGATGAAACGATTCAACTATTATTCTTTAGTAGCAACAAAGAATAAAAGAGGCGTTTTTTTACTACTTTAGCGCTCTTTTTACAAGGCACTAATGAAGTTGGTCACTACAGTAGGCAAGGCTAAGCCACACAGGCGACGCTACACAGTCAATGCCTCCACACCGCTCGTCACATCCTGTTGCGTTCACTGGAATCCCAGTATAAGATTTGACCTGCGAGCAAGCTGTCACCGGATGTGCTTTCCGGTCTGATGAGTCCGTGAGGACGAAACAGCCTCTACAAATAATTTTGTTTAAGAGTTACTAGAGAAAGAGGAGAAATACTAGATGACCACCAACCGCAAAGACGAACACATCCTGTACGCACTGGAACAGAAGTCCTCTTACAACTCTTTCGACGAAGTTGAACTGATCCACTCTTCCCTGCCGCTGTATAACCTGGACGAGATCGACCTGTCCACTGAGTTCGCGGGCCGTAAATGGGACTTCCCGTTCTACATCAATGCTATGACCGGCGGCAGCAACAAAGGCCGTGAAATCAACCAGAAACTGGCGCAGGTGGCGGAATCTTGCGGCATCCTGTTCGTAACCGGCTCCTATTCTGCGGCTCTGAAAAACCCGACTGACGACAGCTTTAGCGTGAAATCTTCTCATCCGAACCTGCTGCTGGGTACGAACATCGGCCTGGATAAACCGGTCGAACTGGGCCTGCAGACTGTTGAGGAAATGAATCCAGTGCTGCTGCAAGTCCACGTCAACGTTATGCAGGAACTGCTGATGCCGGAAGGTGAACGTAAGTTCCGTTCTTGGCAGAGCCACCTGGCTGATTACAGCAAACAGATCCCGGTCCCGATTGTGCTGAAAGAAGTAGGCTTCGGCATGGATGCGAAAACCATCGAACGTGCCTATGAATTCGGCGTACGTACCGTAGATCTGTCCGGTCGTGGTGGTACCTCCTTCGCCTACATCGAGAACCGTCGTTCTGGTCAGCGTGACTACCTGAACCAGTGGGGTCAGTCCACCATGCAGGCTCTGCTGAACGCCCAGGAATGGAAAGACAAGGTCGAGCTGCTGGTAAGCGGCGGTGTGCGTAATCCACTGGATATGATCAAATGCCTGGTTTTTGGCGCAAAAGCGGTAGGCCTGTCCCGCACTGTACTGGAACTGGTAGAAACCTACACTGTGGAAGAGGTGATCGGTATTGTTCAGGGTTGGAAAGCTGATCTGCGTCTGATCATGTGTTCCCTGAACTGTGCTACTATTGCTGACCTGCAGAAAGTTGACTACCTGCTGTACGGCAAACTGAAAGAAGCGAAAGATCAGATGAAGAAAGCGGGTGGTGGTGGTTCAGGTGGTGGTGGTTCAGGTGGTGGTGGTTGTGGTCTGGAACAGTATGCAAATCAGCTGGCAGATCAGATTATCAAAGAAGCAACCGAAGGTTGCTAACTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGCTGAAAGGAGGAACTATATCCGGATTGAGAGGGCTTCACTCAAGATGCCTCCACACCGCTCGTCACATCCTGTTGCGTTCACTGGAATCCCAGTATAAGATTTGACCTGCGAGCAAGCTGTCACCGGATGTGCTTTCCGGTCTGATGAGTCCGTGAGGACGAAACAGCCTCTACAAATAATTTTGTTTAAGAGTTACTAGAGAAAGAGGAGAAATACTAGATGAGCGTTAGCACTGAAAACGTAAGCTTTACCGAAACTGAGACCGAAGCGCGTCGTTCTGCGAACTATGAACCGAACTCTTGGGATTACGATTACCTGCTGTCCAGCGATACGGACGAAAGCATCGAGGTTTACAAAGATAAGGCTAAAAAACTGGAAGCAGAAGTGCGTCGTGAGATCAACAACGAAAAAGCGGAATTCCTGACCCTGCTGGAACTGATCGATAATGTTCAGCGCCTGGGTCTGGGTTATCGTTTTGAATCCGACATCCGTGGCGCGCTGGATCGTTTCGTCTCCTCCGGCGGTTTCGATGCAGTCACGAAAACCAGCCTGCACGGTACTGCACTGTCCTTCCGTCTGCTGCGTCAACATGGTTTCGAAGTCAGCCAGGAAGCCTTCAGCGGTTTTAAAGATCAGAACGGCAATTTCCTGGAGAACCTGAAAGAGGATATCAAAGCGATCCTGTCCCTGTACGAAGCATCCTTTCTGGCCCTGGAAGGCGAAAACATCCTGGATGAAGCGAAGGTCTTCGCCATCAGCCACCTGAAAGAGCTGTCCGAAGAAAAAATCGGCAAGGAACTGGCTGAACAGGTAAACCATGCCCTGGAGCTGCCTCTGCACCGTCGTACCCAGCGCCTGGAAGCCGTATGGTCCATCGAGGCTTACCGTAAAAAAGAGGACGCTAATCAGGTCCTGCTGGAACTGGCGATCCTGGACTATAACATGATTCAGTCTGTATACCAGCGCGACCTGCGTGAGACTTCTCGCTGGTGGCGCCGCGTTGGCCTGGCAACTAAACTGCACTTCGCACGTGACCGTCTGATCGAGAGCTTTTATTGGGCGGTGGGCGTGGCTTTCGAACCACAGTATTCTGACTGCCGCAACTCCGTTGCTAAAATGTTCAGCTTCGTTACCATCATCGACGACATCTATGACGTGTACGGCACCCTGGATGAACTGGAGCTGTTCACCGATGCGGTAGAACGCTGGGACGTCAACGCCATCAACGACCTGCCGGACTACATGAAACTGTGTTTTCTGGCACTGTACAACACCATCAACGAGATTGCTTACGATAACCTGAAAGATAAGGGTGAAAACATCCTGCCATATCTGACTAAAGCGTGGGCTGACCTGTGTAACGCGTTCCTGCAGGAGGCGAAATGGCTGTACAACAAAAGCACCCCTACCTTTGACGACTACTTCGGTAACGCCTGGAAAAGCTCTTCCGGTCCGCTGCAGCTGGTGTTTGCATACTTCGCAGTAGTTCAGAATATTAAGAAAGAAGAAATTGAGAACCTGCAGAAATACCACGACACTATTAGCCGTCCGTCTCACATCTTTCGCCTGTGCAATGACCTGGCGTCCGCAAGCGCTGAAATTGCCCGCGGCGAAACTGCTAACTCCGTAAGCTGCTACATGCGCACCAAAGGTATCAGCGAAGAACTGGCGACTGAATCCGTAATGAACCTGATCGACGAGACCTGGAAAAAGATGAACAAGGAAAAACTGGGCGGCTCTCTGTTCGCTAAACCGTTCGTCGAAACCGCTATCAACCTGGCTCGTCAGTCTCACTGCACTTACCATAACGGCGATGCGCACACTTCTCCGGATGAACTGACTCGTAAACGCGTGCTGTCTGTGATCACTGAACCGATTCTGCCGTTTGAACGTGGTGGTGGTGGTTCAGGTGGTGGTGGTTCAGGTGGTGGTGGTTGTGGTAGCCTGCGTGAATGTGAACTGTATGTTCAGAAACATAATATTCAGGCCCTGCTGAAAGATAGCATTGTTCAGCTGTGTACCGCACGTCCGGAACGTCCGATGGCATTTCTGCGCGAATATTTTGAACGTCTGGAAAAAGAAGAAGCCAAATAATGATAAGCCAGGCATCAAATAAAACGAAAGGCTCAGTCGAAAGACTGGGCCTTTCGTTTTATCTGTTGTTTGTCGGTGAACGCTCTCTACTAGAGTCACACTGGCTCACCTTCGGGTGGGCCTTTCTGCGTTTATACGACCGCTCTTAACGATTGAAATCATCGAATAGCGCAGCACCTTCGCCACATTATTTGCCTATCGTAGGGTATAGCGTTAATGAGAAAACTGGACAGCCTTCATAAAAGCCGCTGAAATCGTCCTATGATATGTGACTAGTAACGTTTTTTAACGCTAAGCAGCCAGCGTTAACACTTCCCTACTTACTAGCGTCAACGGTTAATTTGGAGCGGAAACGATAATGATAGCGCGTTGGAAATCCTTGCCATTACGGTTACGACTGTTTATCTCGTTTGGAACGGTATTGGCACTGGCTATGTTGCTAGCGCTCTATCTACAGGCCCGCTCACATAGTCAGGCGCGCCTGGAAAACTTGCTTAACGAAGAGCTGCCTACTCAAGTAGAGGGCCTTGCCACCCGGCTAACGCTTAGGTTGAGCCCAGCGCTAGCATTGTCGGAAAGCCTAGCCGACAGCTATTTCATTGAGCAGTGGGTGCGCGACGGGCTGCCAGATACCGATCAGCCGGACATAATGCGCTACTTGTCTCGTTTGATGGCACAGCTCGACACCGAACTGTTGTTTATCGCTGCTCAATATCAAGGACGCGGTTACTACTTTCAGTACCGCGATGGAGAGTTCCTGGAGCGTACGCTGCAAGCCCCTGGCGGCGATGATGACTGGTACTATCAATTTACCGATAGCGATGCTGCTTATAACCTAAACCTAGACAGCGATACGTTTTCACCAGAAGAAGCGTTTGTCTTTTTAAATTTCCGTAGCAGTGAACAAGCACTCAATGGCCGCCCACTTATTGTTGCTGGCGCGGGGTTAGATCTTTCTCGACTAGCGCAGCTAATTGAAGACTTCCGACTAGGCGAAACCGGCCGCGCCGCGTTACTAAATGCGGAAGGTGAGCTGCTTATCCGCAGCGATGAAACATCACTTGCAGCACTGCAGAGCAAAGAGACAAGCGGCCTGCCGCAAGGCGAGCATGAACTTCATGTGCGCGAGATCC
SEQ ID NO:9
ATGCCTCCACACCGCTCGTCACATCCTGTTGCGTTCACTGGAATCCCAGTATAAGATTTGACCTGCGAG
CAAGCTGTCACCGGATGTGCTTTCCGGTCTGATGAGTCCGTGAGGACGAAACAGCCTCTACAAATAATTTTGTTTAAGAGTTACTAGAGAAAGAGGAGAAATACTAG
SEQ ID NO:10:
ATGCCTCCACACCGCTCGTCACATCCTGTTGCGTTCACTGGAATCCCAGACTAGAGTTTGACCTGCGAG
CAAGCTGTCACCGGATGTGCTTTCCGGTCTGATGAGTCCGTGAGGACGAAACAGCCTCTACAAATAATTTTGTTTAAGAGTTACTAGAGAAAGAGGAGAAATACTAG
SEQ ID NO:11
ATGCCTCCACACCGCTCGTCACATCCTGTTGCGTTCACTGGAATCCCAATATAGAGTTTGACCTGCGAG
CAAGCTGTCACCGGATGTGCTTTCCGGTCTGATGAGTCCGTGAGGACGAAACAGCCTCTACAAATAATTTTGTTTAAGAGTTACTAGAGAAAGAGGAGAAATACTAG
SEQ ID NO:12:
GAATTCATGCCTCCACACCGCTCGTCACATCCTGTTGCGTTCACTGGAATCCCAGTATAAAGTTTGACC
TGCGAGCAAGCTGTCACCGGATGTGCTTTCCGGTCTGATGAGTCCGTGAGGACGAAACAGCCTCTACAAATAATTTTGTTTAAGAGTTACTAGAGAAAGAGGAGAAATACTAG
SEQ ID NO:13:
ATGCCTCCACACCGCTCGTCACATCCTGTTGCGTTCACTGGAATCCCAGTATAAAGTTTGACCTGCGAG
CAAGCTGTCACCGGATGTGCTTTCCGGTCTGATGAGTCCGTGAGGACGAAACAGCCTCTACAAATAATTTTGTTTAAGAGTTACTAGAGAAAGAGGAGAAATACTAG
SEQ ID NO:22:
TTGACAGCTAGCTCAGTCCTAGGTATAATACTAGTttcacctagctagatgagacGTTTTAGAGCTAG
AAATAGCAAGTTAAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTTTTTGAAcccggGGTACCgtgcgcttgccacagcttcgcgctcgttctgtggctccggcagcatcgacgaatagtaggcgattcgctggaaacggtcggtcggcttgacgttccctggcagcggtgtatcgctgcttgggtttgaaaagtctaattcttccagcagtgccaattgctgatcgtaaggcggatcattggtcatgattctaaattctctaccgtggtgaatcatggattcaccatcgatatattcaatgatcgctgaatccccagtagcatcttcaattgccaaatgtacggttgccttactaccccgcgcctccgccatgacaatttgtacatcttcgagtatgtcgagtgcttcttcgacagtggctgcgttgtcgatcacatattgcccccacaaacctgcctgcattcctggtttgccagggtcacgcgggccaaagtcggtggccgtgagatagagcatgtggaacgccagccccttttcgttgaatccatcggcagcgccgatgccataaaccgtggtgaccatgctggcgtacttcgacgtccatgttgctgcgttctcctccacgacgacttccgcgcccagcatgcccccatttcgctccatgccacgggggaagacagtaataaccggatctgtcgattcgggccagtccattgtgcgggcaacataaatgccctgctcgttgtcattccataagtacctagaacacgcccatgctgcattggccattaccatcgcaccaatcacgatggcaacgccccctctgtaatacctacgcatgaattactcctttagagcgtgtaaatcgccagcacaacgcccttatgaaaagacgcttaaatcgagcgtctgattaaaggccgatagcccaaagcaggctcgagcaatcagccttccacccaagctattttcgttaattctttaccccagaaaaactccacaaatacaaaatatagttaacttttgaggcgatgcaaatccaccttccgagcacatcgatcaATGCCTCCACACCGCTCGTCACATCCTGttgcgtTCACTGGAATCCCAgtataagatTTGACCTGCGAGCAaGCTGTCACCGGATGTGCTTTCCGGTCTGATGAGTCCGTGAGGACGAAACAGCCTCTACAAATAATTTTGTTTAAgagttactagagaaagaggagaaatactagATGACCACCAACCGCAAAGACGAACACATCCTGTACGCACTGGAACAGAAGTCCTCTTACAACTCTTTCGACGAAGTTGAACTGATCCACTCTTCCCTGCCGCTGTATAACCTGGACGAGATCGACCTGTCCACTGAGTTCGCGGGCCGTAAATGGGACTTCCCGTTCTACATCAATGCTATGACCGGCGGCAGCAACAAAGGCCGTGAAATCAACCAGAAACTGGCGCAGGTGGCGGAATCTTGCGGCATCCTGTTCGTAACCGGCTCCTATTCTGCGGCTCTGAAAAACCCGACTGACGACAGCTTTAGCGTGAAATCTTCTCATCCGAACCTGCTGCTGGGTACGAACATCGGCCTGGATAAACCGGTCGAACTGGGCCTGCAGACTGTTGAGGAAATGAATCCAGTGCTGCTGCAAGTCCACGTCAACGTTATGCAGGAACTGCTGATGCCGGAAGGTGAACGTAAGTTCCGTTCTTGGCAGAGCCACCTGGCTGATTACAGCAAACAGATCCCGGTCCCGATTGTGCTGAAAGAAGTAGGCTTCGGCATGGATGCGAAAACCATCGAACGTGCCTATGAATTCGGCGTACGTACCGTAGATCTGTCCGGTCGTGGTGGTACCTCCTTCGCCTACATCGAGAACCGTCGTTCTGGTCAGCGTGACTACCTGAACCAGTGGGGTCAGTCCACCATGCAGGCTCTGCTGAACGCCCAGGAATGGAAAGACAAGGTCGAGCTGCTGGTAAGCGGCGGTGTGCGTAATCCACTGGATATGATCAAATGCCTGGTTTTTGGCGCAAAAGCGGTAGGCCTGTCCCGCACTGTACTGGAACTGGTAGAAACCTACACTGTGGAAGAGGTGATCGGTATTGTTCAGGGTTGGAAAGCTGATCTGCGTCTGATCATGTGTTCCCTGAACTGTGCTACTATTGCTGACCTGCAGAAAGTTGACTACCTGCTGTACGGCAAACTGAAAGAAGCGAAAGATCAGATGAAGAAAGCGTAActgctaacaaagcccgaaaggaagctgagttggctgctgccaccgctgagcaataaCTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTGctgaaaggaggaactatatccggatTGAGAGGGCTTCACTCAAGATGCCTCCACACCGCTCGTCACAtcctgttgcgtTCACTGGAATCCCAgtatAAGAtTTGACCTGCGAGCAaGCTGTCACCGGATGTGCTTTCCGGTCTGATGAGTCCGTGAGGACGAAACAGCCTCTACAAATAATTTTGTTTAAgagttactagagaaagaggagaaatactagATGAGCGTTAGCACTGAAAACGTAAGCTTTACCGAAACTGAGACCGAAGCGCGTCGTTCTGCGAACTATGAACCGAACTCTTGGGATTACGATTACCTGCTGTCCAGCGATACGGACGAAAGCATCGAGGTTTACAAAGATAAGGCTAAAAAACTGGAAGCAGAAGTGCGTCGTGAGATCAACAACGAAAAAGCGGAATTCCTGACCCTGCTGGAACTGATCGATAATGTTCAGCGCCTGGGTCTGGGTTATCGTTTTGAATCCGACATCCGTGGCGCGCTGGATCGTTTCGTCTCCTCCGGCGGTTTCGATGCAGTCACGAAAACCAGCCTGCACGGTACTGCACTGTCCTTCCGTCTGCTGCGTCAACATGGTTTCGAAGTCAGCCAGGAAGCCTTCAGCGGTTTTAAAGATCAGAACGGCAATTTCCTGGAGAACCTGAAAGAGGATATCAAAGCGATCCTGTCCCTGTACGAAGCATCCTTTCTGGCCCTGGAAGGCGAAAACATCCTGGATGAAGCGAAGGTCTTCGCCATCAGCCACCTGAAAGAGCTGTCCGAAGAAAAAATCGGCAAGGAACTGGCTGAACAGGTAAACCATGCCCTGGAGCTGCCTCTGCACCGTCGTACCCAGCGCCTGGAAGCCGTATGGTCCATCGAGGCTTACCGTAAAAAAGAGGACGCTAATCAGGTCCTGCTGGAACTGGCGATCCTGGACTATAACATGATTCAGTCTGTATACCAGCGCGACCTGCGTGAGACTTCTCGCTGGTGGCGCCGCGTTGGCCTGGCAACTAAACTGCACTTCGCACGTGACCGTCTGATCGAGAGCTTTTATTGGGCGGTGGGCGTGGCTTTCGAACCACAGTATTCTGACTGCCGCAACTCCGTTGCTAAAATGTTCAGCTTCGTTACCATCATCGACGACATCTATGACGTGTACGGCACCCTGGATGAACTGGAGCTGTTCACCGATGCGGTAGAACGCTGGGACGTCAACGCCATCAACGACCTGCCGGACTACATGAAACTGTGTTTTCTGGCACTGTACAACACCATCAACGAGATTGCTTACGATAACCTGAAAGATAAGGGTGAAAACATCCTGCCATATCTGACTAAAGCGTGGGCTGACCTGTGTAACGCGTTCCTGCAGGAGGCGAAATGGCTGTACAACAAAAGCACCCCTACCTTTGACGACTACTTCGGTAACGCCTGGAAAAGCTCTTCCGGTCCGCTGCAGCTGGTGTTTGCATACTTCGCAGTAGTTCAGAATATTAAGAAAGAAGAAATTGAGAACCTGCAGAAATACCACGACACTATTAGCCGTCCGTCTCACATCTTTCGCCTGTGCAATGACCTGGCGTCCGCAAGCGCTGAAATTGCCCGCGGCGAAACTGCTAACTCCGTAAGCTGCTACATGCGCACCAAAGGTATCAGCGAAGAACTGGCGACTGAATCCGTAATGAACCTGATCGACGAGACCTGGAAAAAGATGAACAAGGAAAAACTGGGCGGCTCTCTGTTCGCTAAACCGTTCGTCGAAACCGCTATCAACCTGGCTCGTCAGTCTCACTGCACTTACCATAACGGCGATGCGCACACTTCTCCGGATGAACTGACTCGTAAACGCGTGCTGTCTGTGATCACTGAACCGATTCTGCCGTTTGAACGTtaatgataagccaggcatcaaataaaacgaaaggctcagtcgaaagactgggcctttcgttttatctgttgtttgtcggtgaacgctctctactagagtcacactggctcaccttcgggtgggcctttctgcgtttatactcaccttcatttccttatgctgaacacggtaagcttggcgataacaccgctactgatggctaaaaatcaacgatgacttcccattggatacttggccctggggccattggtcgcctgttggcgcattcgctttcacccattactgacatcaccttgattggccgacgtgcattgcctgaacagcaacgcctgaccacccctgaaggtgaagaacgaactcagcggctagcgagcgttacggttgcggagctagcctctcactcactgcctgtgcctgggtttgtgcatatcaccaccaaagccatggccgccgaggcggcgcttgccagcattgccgatgtggttgcgcccacgaccccgctggtgctgtggcagaacggttttttggcacagccacggctgactgataggtggccagggccagtgctgtgtgcgaccacgactcaaggcgcttacttaaccggcagtgatggcgtggttcacgccgggcgcgggccgacgtttattggtgatctcaacaatcaacgcgctgcgctagcaaaaacactggcgcagacgttaggtgaggcaggctttaccgccacgccggtagacgatattcgccaacgcctgtggcaaaagctggcggttaatgcggcgatcaacccattggtggcgctcaatggcgtgcgcaatggtgagctgcgcggtgatgcttatgcagtccgtttggcagcggtggtaaaggaagtcgcggcgattttaaagcaggaaaacattgcaccaccgaatggtggcgaaggtgaagacgcgtggttggcgcttgtgtggcaggtggtggagaacaccgctaacaataaggcctcgatgttgcaggatgttgaggccagacgcaccaccgagcgcggggcgattttagggccgttgattgatagcgccgagcgccatgggttgccgtgtgggttgttgaaggagcttgatagcgaattggctaaattggaggcgaagttttagggaaca
SEQ ID NO:23:
CTGGAACAGTATGCAAATCAGCTGGCAGATCAGATTATCAAAGAAGCAACCGAAGGTTGCTAA
SEQ ID NO:24:
CTGCGTGAATGTGAACTGTATGTTCAGAAACATAATATTCAGGCCCTGCTGAAAGATAGCATTGTTCAG
CTGTGTACCGCACGTCCGGAACGTCCGATGGCATTTCTGCGCGAATATTTTGAACGTCTGGAAAAAGAAGAAGCCAAATAA
SEQ ID NO:26
mttnrkdehilyaleqkssynsfdevelihsslplynldeidlstefagrkwdfpfyinamtggsnkg
reinqklaqvaescgilfvtgsysaalknptddsfsvksshpnlllgtnigldkpvelglqtveemnpvllqvhvnvmqellmpegerkfrswqshladyskqipvpivlkevgfgmdaktierayefgvrtvdlsgrggtsfayienrrsgqrdylnqwgqstmqallnaqewkdkvellvsggvrnpldmikclvfgakavglsrtvlelvetytveevigivqgwkadlrlimcslncatiadlqkvdyllygklkeakdqmkka
SEQ ID NO:27
msvstenvsftetetearrsanyepnswdydyllssdtdesievykdkakkleaevrreinnekaefl
tllelidnvqrlglgyrfesdirgaldrfvssggfdavtktslhgtalsfrllrqhgfevsqeafsgfkdqngnflenlkedikailslyeasflalegenildeakvfaishlkelseekigkelaeqvnhalelplhrrtqrleavwsieayrkkedanqvllelaildynmiqsvyqrdlretsrwwrrvglatklhfardrliesfywavgvafepqysdcrnsvakmfsfvtiiddiydvygtldelelftdaverwdvnaindlpdymklcflalyntineiaydnlkdkgenilpyltkawadlcnaflqeakwlynkstptfddyfgnawksssgplqlvfayfavvqnikkeeienlqkyhdtisrpshifrlcndlasasaeiargetansvscymrtkgiseelatesvmnlidetwkkmnkeklggslfakpfvetainlarqshctyhngdahtspdeltrkrvlsvitepilpfer
SEQ ID NO:28
LEQYANQLADQIIKEATEGC
[0175] SEQ ID NO:25LRECELYVQKHNIQALLKDSIVQLCTARPERPMAFLREYFERLEKEEAK
[0176] 以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。
QQ群二维码
意见反馈