基因

申请号 CN98809387.1 申请日 1998-05-26 公开(公告)号 CN1162544C 公开(公告)日 2004-08-18
申请人 宝酒造株式会社; 发明人 高山正范; 小山信人; 加藤郁之进; 酒井武;
摘要 一种具有编码一种多肽的DNA序列的分离的基因,该多肽具有降解含硫 酸化 岩藻糖多糖的活性,或该多肽具有与上述多肽功能上相同的活性。
权利要求

1.具有编码以下多肽的DNA序列的分离的基因,所述多肽选自下列 具有含硫酸化岩藻糖多糖降解活性的多肽:
(1)具有序列表中SEQ ID NO:1或SEQ ID NO:2所示基酸序列 的多肽;且所述多肽有降解具有如下理化性质的含硫酸化岩藻糖多糖的 降解活性:
(a)组成糖:含有少量或无糖酸,且
(b)基本上不能被由黄杆菌属的种SA-0082,FERM BP-5402产 生的岩藻多糖酶降解;
(2)具有序列表中SEQ ID NO:3或SEQ ID NO:4所示氨基酸序列 的多肽;或含有所述序列的一部分的多肽;且所述多肽有作用于具有如 下理化性质的含硫酸化岩藻糖多糖的降解活性:
(c)组成糖:含有糖醛酸,且
(d)能被由黄杆菌属的种SA-0082,FERM BP-5402产生的岩藻 多糖酶降解;
并且所述多肽降解所述含硫酸化岩藻糖多糖,籍此,释放出一种或多种 由下式[I]、[II]、[III]和[IV]所示的化合物:


2.根据权利要求1的基因,其中所述多肽获自交替单胞菌属的SN -1009,FERM BP 5747。
3.根据权利要求1的基因,其中所述多肽获自黄杆菌属SA-0082, FERM BP 5402。
4.根据权利要求1的基因,其特征在于所述基因具有由序列表中 SEQ ID NO:5-SEQ ID NO:8中任一项所示DNA序列。
5.基因,其特征在于所述基因在含有6×SSC,1%SDS,5×Denhardt 试剂和100μg/ml鲑精DNA的溶液中在65℃下可与具有由序列表中SEQ ID NO:5-SEQ ID NO:8中任一项所示DNA序列的基因杂交,且编码具有含 硫酸化岩藻糖多糖降解活性的如下(1)或(2)的多肽:
(1)有降解具有如下理化性质的含硫酸化岩藻糖多糖的降解活性的 多肽:
(a)组成糖:含有少量或无糖醛酸,且
(b)基本上不能被由黄杆菌属的种SA-0082,FERM BP-5402产生的 岩藻多糖酶降解;
(2)有作用于具有如下理化性质的含硫酸化岩藻糖多糖的降解活性 的多肽:
(c)组成糖:含有糖醛酸,且
(d)能被由黄杆菌属的种SA-0082,FERM BP-5402产生的岩藻多糖 酶降解;
并且所述多肽降解所述含硫酸化岩藻糖多糖,籍此,释放出一种或多种 由下式[I]、[II]、[III]和[IV]所示的化合物:


6.含有根据权利要求1或5中的基因的重组DNA。
7.表达载体,其中包含根据权利要求6的重组DNA。
8.由根据权利要求7的表达载体转化的转化子。
9.制备具有含硫酸化岩藻糖多糖降解活性的多肽的方法,其特征在 于培养根据权利要求8的转化子,并从培养产物中收集具有含硫酸化岩 藻糖多糖降解活性的多肽。
10.具有由序列表中SEQ ID NO:1-SEQ ID NO:4任一项所示氨基 酸序列的多肽;且所述多肽具有如下含硫酸化岩藻糖多糖(1)或(2) 的降解活性:
(1)有降解具有如下理化性质的含硫酸化岩藻糖多糖的降解活性的 多肽:
(a)组成糖:含有少量或无糖醛酸,且
(b)基本上不能被由黄杆菌属的种SA-0082,FERM BP-5402产 生的岩藻多糖酶降解;
(2)有作用于具有如下理化性质的含硫酸化岩藻糖多糖的降解活性 的多肽:
(c)组成糖:含有糖醛酸,且
(d)能被由黄杆菌属的种SA-0082,FERM BP-5402产生的岩藻 多糖酶降解;
并且所述多肽降解所述含硫酸化岩藻糖多糖,籍此,释放出一种或多种 由下式[I]、[II]、[III]和[IV]所示的化合物:

说明书全文

发明技术领域

本发明涉及编码多肽的基因,该多肽具有降解含硫酸化岩藻糖多糖 的活性,可用于含硫酸化岩藻糖多糖的结构分析,也可用于制备所述多 糖的降解产物;本发明还涉及通过遗传工程方法制备所述多肽的方法, 以及通过该方法获得的多肽。

现有技术

衍生自海藻的含硫酸化岩藻糖多糖是硫酸化多糖与含有周知的半乳 糖、糖酸、木糖、甘露糖、葡萄糖等的物质的混合物,其中硫酸化多 糖是主要由岩藻糖组成的岩藻多糖的总称。作为组成成分的糖的种类及 数量随所用的海藻材料的不同而不同。例如,有报道称由Sigma制造的 市售岩藻多糖可分解为多达13种的分子种类[化合物研究 (Carbohydrate Research),255,213-224(1994)]。可将其大体上分 为两类,一类中基本不含有糖醛酸,主要的组成糖为岩藻糖;另一类含 有糖醛酸,含有岩藻糖和甘露糖作为组成糖。

就含硫酸化岩藻糖多糖的生物活性而言,已报道了多种活性,如巨 噬细胞活化潜、癌症转移抑制以及血液抗凝集活性。然而,由于含硫 酸化岩藻糖多糖具有数种分子种类,需要将含硫酸化岩藻糖多糖分离并 纯化后核查何种分子具有的实际活性。然而,传统方法不可能有效分离, 因此难以制备大量可用作药物的产品。此外,含硫酸化岩藻糖多糖是一 种具有高分子量的硫酸化多糖,用作药物时存在抗原性、均一性、抗凝 血活性等问题,由此需要将含硫酸化岩藻糖多糖进行一定程度的降解。

将含硫酸化岩藻糖多糖酶法降解用以制备低分子量产品的方法十分 有利,因为反应可在温和条件下进行,且由于酶的底物特异性可获得降 解程度一致的产物。已报道awabi(ear shell或鲍鱼(abalone))、扇贝、 海胆、海洋微生物等产生可降解含硫酸化岩藻糖多糖的酶。然而,这类 通常存在于活体生物中的酶量很少,且其中同时含有多种含硫酸化岩藻 糖多糖的降解酶,因此需要进行多种纯化步骤以制备单一的酶。再者, 这些酶的基酸序列和遗传结构尚不明确。

本发明所解决的问题

本发明的一个方面,提供了编码具有含硫酸化岩藻糖多糖降解活性 的多肽的基因,其可用于含硫酸化岩藻糖多糖的制备和结构分析,也可 用于制备降解的含硫酸化岩藻糖多糖。本发明还提供了使用所述基因通 过遗传工程方法可制造的多肽,该多肽具有降解含硫酸化岩藻糖多糖的 活性。

解决问题的方法

为了明确具有含硫酸化岩藻糖多糖降解活性的多肽之氨基酸序列和 基序列,本发明人对产生含硫酸化岩藻糖多糖降解酶的微生物基因进 行了大量研究。结果确定分别衍生自交替单胞菌属(Alteromonas)和黄 杆菌属(Flavobacterium)的细菌之编码多肽的基因各有两种类型,该多 肽具有降解含硫酸化岩藻糖多糖的活性,此外还阐明了其总碱基序列, 第一次确定了所述多肽的氨基酸序列,并成功地开发了利用所述基因工 业化制备具有含硫酸化岩藻糖多糖降解活性的多肽的方法,由此完成了 本发明。

本发明的概述如下:本发明第一方面涉及一种具有编码一种多肽的 DNA序列的分离的基因,该多肽具有降解含硫酸化岩藻糖多糖的活性, 或具有与其功能上相同的活性。

本发明的第二方面涉及一种含有本发明第一方面之基因的重组 DNA。

本发明的第三方面涉及一种表达载体,其中插入了本发明第二方面 的重组DNA,并用微生物、动物细胞或植物细胞作为宿主细胞。

本发明的第四方面涉及一种由本发明第三方面的表达载体转化的转 化子。

本发明的第五方面涉及一种制备具有降解含硫酸化岩藻糖多糖的活 性的多肽,或具有与其功能上相同活性的多肽的方法,其特征在于培养 根据本发明第四方面的转化子,并从培养产物中回收具有降解含硫酸化 岩藻糖多糖的活性的多肽,或具有与其功能上相同活性的多肽。

本发明的第六方面涉及一种由序列表中SEQ ID NO:1-NO:4所示 任一氨基酸序列的多肽,其具有降解含硫酸化岩藻糖多糖的活性的多肽, 或者本发明涉及具有与上述多肽功能上相同的活性的多肽。

附图简述

图1.显示ORF-1和ORF-2的位置

图2.显示含硫酸化岩藻糖多糖的沉淀比例。

图3.显示fdlA的位置。

图4.显示fdlB的位置。

图5.是利用DEAE-Sepharose FF的层析。

本发明的实施方案

以下是对本发明的具体阐述。

本发明涉及编码具有含硫酸化岩藻糖多糖降解活性的多肽的基因。 由所述基因编码的多肽的一个例子是具有内切含硫酸化岩藻糖多糖降解 活性的多肽,其衍生自属于下述交替单胞菌属的细菌:

(1)作用于具有下述理化性质的含硫酸化岩藻糖多糖(以后称为“含 硫酸化岩藻糖多糖-F”)且降解所述含硫酸化岩藻糖多糖:

(a)组成糖:基本上无糖醛酸;且

(b)基本上不能被由黄杆菌属的种SA-0082(FERM BP-5402)产 生的岩藻多糖酶降解。

对于具有含硫酸化岩藻糖多糖降解活性的多肽,可得由交替单胞菌 属SN-1009产生的内切含硫酸化岩藻糖多糖降解酶,所述酶可由参考实 施例1-(3)中所述的方法制备。

上述含硫酸化岩藻糖多糖-F可如参考实施例1所述制备。

由黄杆菌属SA-0082(FERM BP-5402)产生的岩藻多糖酶 (fucoidanase)可如参考实施例5所述制备。

对于其它具有含硫酸化岩藻糖多糖降解活性的多肽,举例说明了一 种衍生自属于黄杆菌属的细菌的,具有如下(2)中所示含硫酸化岩藻糖 多糖降解活性的多肽:

(2)作用于具有下述理化性质的含硫酸化岩藻糖多糖(以后称为“含 硫酸化岩藻糖多糖-U”):

(c)组成糖:含有糖醛酸,且

(d)能被由黄杆菌属的种SA-0082(FERM BP-5402)产生的岩藻 多糖酶降解;

并降解这样的含硫酸化岩藻糖多糖,籍此释放出至少一种选自下面通 式[I]、[II]、[III]和[IV]表示的化合物:

一种具有含硫酸化岩藻糖多糖降解活性的多肽的例子为由黄杆菌属 的种SA-0082(FERM BP-5402)产生的岩藻多糖酶,且所述岩藻多糖可 由参考实施例5所述的方法制备。

以下,将含硫酸化岩藻糖多糖-F和含硫酸化岩藻糖多糖-U的混合物 称为含硫酸化岩藻糖多糖混合物。

本发明中具有含硫酸化岩藻糖多糖降解活性的多肽不仅指天然类型 的含硫酸化岩藻糖多糖降解酶,也指其氨基酸序列是对天然类型的氨基 酸序列通过删除、取代、插入、添加等进行修饰的多肽,只要所述多肽 具有含硫酸化岩藻糖多糖降解活性。

顺便说明,所述天然类型的含硫酸化岩藻糖多糖降解酶是指例如, 衍生自属于交替单胞菌属以及属于黄杆菌属的细菌的酶。然而,本发明 并不限于此,而是涵盖了衍生自其它细菌的酶,衍生自其它微生物,如 酵母、霉菌、子囊菌纲(Ascomycetes)、担子菌纲(Basidiomycetes)等 的酶,以及衍生自如,植物和动物的其它生物的酶。

本发明中,具有功能上相同活性的多肽的涵义如下。

对天然存在的蛋白质,除了编码所述蛋白质的基因之多态性及变体 之外,在体内产生后和在纯化过程中蛋白质可被修饰,结果在氨基酸序 列中的氨基酸残基出现诸如删除、添加、插入取代等变异,尽管如此, 众所周知这些变异蛋白质中的一些仍与未变异的蛋白质具有基本上相同 的生理和生物学活性。因此,结构不同但就其功能而言无很大差异的多 肽称为具有功能上相同活性的多肽。

即使当上述变异是被人为地导入蛋白质的氨基酸序列时也是如此, 在这种情况下可制备更多的变体。但是,只要这些变体与未变异的蛋白 质相比显示基本上相同的生理活性,可将这样的变体称为具有功能上相 同活性的多肽。

例如,存在于在大肠杆菌中表达的蛋白质N-末端的甲硫氨酸在许多 情况下可被甲硫氨酸氨肽酶去除,但是随蛋白质的类型的不同而不同, 可制备含有及不含有甲硫氨酸的产物。事实上,是否存在甲硫氨酸通常 不会影响该蛋白质的活性。同样周知,人白细胞介素2(IL-2)氨基酸序 列中某些半胱氨酸残基被丝氨酸取代后,多肽仍保持白细胞介素2的活 性(科学,(Science),224,1431(1984))。

此外,当通过遗传工程方法制备蛋白质时,通常表达为融合蛋白质。 例如,为了增加目标蛋白质的表达量,将衍生自其它蛋白质N-末端的肽 加至目标蛋白质的N-末端,或者将合适的肽链加至目标蛋白质的N-末端 或C-末端并表达,从而便于使用带有与所添加肽链有亲和力的载体纯化 目标蛋白质。

再者,一般认为,其中对目标蛋白质氨基酸序列的一个或多个氨基 酸残基进行至少一种删除、添加、插入和取代的多肽与目标蛋白质具有 功能上相同的活性。这种多肽和编码所述多肽的基因,无论是天然产生 并分离的还是人工制备的,均被本发明所涵盖。

众所周知,对于每个类型的氨基酸,通常各自有1-6种该氨基酸基 因的简并性密码子(三联密码子)。相应地,根据特定氨基酸序列编码该 氨基酸序列的基因可有许多种类。自然界中基因从不以稳定方式存在, 其核酸中常常存在变异。一些情况中,基因中发生的变异不影响其所编 码的氨基酸序列(这称之为沉默突变),在这种情况下,产生编码相同氨 基酸序列的不同基因。相应地,即使分离了一种编码特定氨基酸序列的 基因,仍旧有可能在含有该基因的活生物体传代过程中产生编码相同氨 基酸序列的许多种基因。

此外,只要应用多种遗传工程手段,可方便地人工制备许多种类的 编码相同氨基酸序列的基因。

例如,有些情况中当编码目标蛋白质的固有基因所用的密码子在所 用宿主中是低频率的时,通过遗传工程方法制备的蛋白质的表达量较低。 在这种情况下,通过人工将密码子转化为在所述宿主中经常使用的密码 子而不改变编码氨基酸序列,尝试目标蛋白质的高表达。显然有许多编 码特定氨基酸序列的基因可如上述人工制备。因此,只要所述基因编码 的氨基酸序列在本发明中公开,本发明也涵盖了人工制备的以及不同的 多肽。

此外,许多情况下具有功能上相同活性的多肽其编码基因有同源性。 因此,本发明也涵盖了在严谨条件下可与本发明所用基因杂交并且编码 具有含硫酸化岩藻糖多糖降解活性的多肽的基因。

以下,本发明以交替单胞菌属的SN-1009和黄杆菌属的SA-0082为 例具体描述本发明。

交替单胞菌属的SN-1009已于1996年2月13日保藏于国立生命科 学和人体技术研究所,工业科技部(1-3,Higashi 1-chome,Tsukuba, Ibaraki,305-8566日本),作为国际保藏的保藏号FERM BP-5747。另一 方面,黄杆菌属的SA-0082已于1995年3月29日保藏于国立生命科学 和人体技术研究所,工业科技部(1-3,Higashi 1-chome,Tsukuba,Ibaraki, 305-8566日本),作为国际保藏的保藏号FERM BP-5402。

为了获得编码具有含硫酸化岩藻糖多糖降解活性的、由交替单胞菌 属的SN-1009或黄杆菌属的SA-0082产生的多肽,可利用例如,杂交法、 PCR法或其组合。在这些方法中,需要可与所述基因杂交的探针,或能 通过PCR方法扩增所述基因或其部分的引物,但是由于由这些菌株产生 的具有含硫酸化岩藻糖多糖降解活性的多肽之氨基酸序列和基因结构未 知,不能制备一种可用作探针或引物的合成寡核苷酸。因此,首先研究 由上述微生物产生的含硫酸化岩藻糖多糖降解酶的部分氨基酸序列,并 制备用作探针或引物的合成寡核苷酸。

首先,培养交替单胞菌属的SN-1009或黄杆菌属的SA-0082,从培 养基中分离并纯化各自产生的含硫酸化岩藻糖多糖降解酶。

获得了各自纯化的含硫酸化岩藻糖多糖降解酶之部分氨基酸序列的 信息。为了确定部分氨基酸序列,例如根据常规方法通过Edman降解法 (例如,可使用Applied Biosystem制造的蛋白质测序仪476A型)对含 硫酸化岩藻糖多糖降解酶进行氨基酸序列测定,籍此可测定含硫酸化岩 藻糖多糖降解酶的N-末端氨基酸序列。或者,通过用高底物特异性的蛋 白质水解酶(例如无色杆菌蛋白酶I、N-甲苯磺酰基-L-苯基丙氨酰基氯 代甲基(TPCK)处理的胰蛋白酶等)处理,将纯化的含硫酸化岩藻糖 多糖降解酶部分水解,通过反相HPLC方法分离并纯化所得的肽片段, 将纯化的肽片段经过氨基酸序列分析,由此获得更多的氨基酸序列信息。

筛选如上获得的特异于含硫酸化岩藻糖多糖降解酶的部分氨基酸序 列之信息,基于所述信息设计并合成简并性寡核苷酸的碱基序列。然后, 需要合成具有较低简并性的长寡核苷酸,或换言之,对于有含硫酸化岩 藻糖多糖降解活性的多肽之编码基因有高特异性的寡核苷酸。寡核苷酸 的设计对于编码具有含硫酸化岩藻糖多糖降解活性的多肽之基因的克隆 十分重要。

其次,需要研究通过Southern杂交,合成寡核苷酸与编码具有含硫 酸化岩藻糖多糖降解活性的多肽之基因特异性杂交的条件。

例如,通过合适的限制性酶将交替单胞菌属的SN-1009或黄杆菌属 的SA-0082的基因组DNA完全消化,由琼脂糖凝胶电泳分离,并通过常 规方法印迹至尼龙膜等。杂交时,首先在含有6×SSC(1×SSC是指通过 于1升水中溶解8.77克氯化钠和4.41克柠檬酸钠制备的产物)、1%十二 烷基硫酸钠(SDS)、100μg/ml鲑精DNA和5×Denhardt试剂(含有各 为1%的血清白蛋白、聚乙烯吡咯烷酮和Ficoll)的杂交溶液中65℃下 静置数小时封闭尼龙膜;然后加入用32P等标记的合成寡核苷酸,将混合 物于42℃温育过夜。用含有0.1%SDS的1×SSC于42℃洗涤尼龙膜30 分钟,进行放射自显影,检测与合成寡核苷酸杂交的DNA片段。通过研 究温育温度、洗涤溶液的盐浓度等,考虑所用合成寡核苷酸长度及与编 码具有含硫酸化岩藻糖多糖降解活性的多肽的基因的互补性,可有效选 择最优条件。

为了获得如上检测的含有编码具有含硫酸化岩藻糖多糖降解活性的 多肽之基因的DNA片段,可采用一种方法,从凝胶中提取直接相应于检 测的条带位置的DNA片段并纯化,在与Southern杂交相同的条件下, 对一个常用宿主载体类型的载体中整合了该片段的文库以及菌落或噬菌 斑进行杂交,以筛选并分离含有目标DNA片段的克隆。或者,用合适的 限制性酶直接消化交替单胞菌属的SN-1009或黄杆菌属的SA-0082的基 因组DNA,制备将所得DNA片段整合入常用宿主载体类型的载体中的 文库,通过相同方法进行杂交,籍此筛选并分离了含有目标DNA片段的 克隆。

就所用的宿主载体系统而言,可使用已知的宿主载体系统,例如质 粒载体,如用大肠杆菌作为宿主的pUC18和pUC19,或如λ噬菌体的噬 菌体载体,虽然本发明并不局限于此。

关于这些宿主载体系统的类型及操作,可使用常用的类型和述及的 方法,例如,J.Sambrook等人,第2版,“分子克隆:实验室手册”,冷 泉港实验室出版,1989。

一旦可筛选含有目标DNA片段的载体,可通过常规方法如双脱法 测定插入载体的目标DNA片段的碱基序列[美国国家科学院院报,74, 5463,(1977)]。将测定的碱基序列与含硫酸化岩藻糖多糖降解酶的N- 末端分析、部分氨基酸序列、分子量等比较时,可了解所得DNA片段中 基因的结构,以及所述基因编码的多肽的氨基酸序列。

此外,利用基于上述含硫酸化岩藻糖多糖降解酶的部分氨基酸序列 所得的寡核苷酸,可用PCR方法制备编码具有含硫酸化岩藻糖多糖降解 活性的多肽之基因。其中,一种方法是利用盒式DNA的PCR方法,籍 此可在短时间内利用较少的氨基酸序列信息获得适用于杂交的目标基因 片段。

例如,用合适的限制酶以常规方法从黄杆菌属的SA-0082的培养细 胞提取基因组DNA,将带有已知序列的合成DNA(盒式DNA)连接入 其中。所得混合物用作模板,利用基于上述部分氨基酸序列信息设计的 所述基因特异性寡核苷酸引物以及与盒式DNA互补的寡核苷酸引物(盒 式引物)进行PCR,籍此扩增目标DNA片段。关于盒式DNA和盒式引 物,可使用由例如Takara Shuzo制造的那些。优选地,盒式DNA含有 相应于两种盒式引物的序列,其可用于首先进行的第一次PCR,其中利 用远离连接的限制性酶切位点的引物;然后进行第二次PCR,利用部分 上述反应液作为模板,采用内部引物。此外,关于所述基因特异性寡核 苷酸引物,当平行设计并合成两种引物,上游引物用于第一次PCR且下 游引物用于第二次PCR时,所述基因的特异性较高,且目标DNA片段 的特异性扩增的可能性较高。

然而,由于目标基因的碱基序列不详,不能肯定用于盒式DNA连接 的限制性酶切位点总位于合适位置,以适合通过PCR的扩增反应从编码 部分氨基酸序列的区域中扩增。因此,需要使用多种限制性酶的盒式 DNA。此外,虽然可在如由H.A.Erlich编辑,Stockton出版社出版,1989, 的“PCR技术”中所述的常用条件进行PCR,需要通过考虑退火温度、 循环次数、镁离子浓度、耐热聚合酶浓度等因素,根据所用合成寡核苷 酸长度以及与编码具有含硫酸化岩藻糖多糖降解活性的多肽之基因的互 补性,选择最佳条件,使非特异性带最少。

将PCR溶液进行例如琼脂糖凝胶电泳,以确证扩增的DNA片段。 通过常用方法提取这些片段并纯化,插入常用克隆载体如pUC18或 pUC19,可通过如双脱氧法分析其碱基序列。或者,可利用用于PCR的 盒式引物将回收的扩增DNA片段直接进行碱基序列分析。一旦除了所得 引物序列之外,获得了一些编码含硫酸化岩藻糖多糖降解酶的已知部分 氨基酸序列的基因后,可得到编码所述酶的基因或该基因的片段中具有 同源性的结论。

当由Southern杂交或PCR法获得的DNA片段为编码目标酶基因 的一部分时,利用所述DNA片段作为探针通过杂交进行基因组文库的筛 查,或利用基于所述DNA片段的碱基序列制备的寡核苷酸作为引物进行 PCR对基因组文库进行筛查,籍此可获得含有编码目标酶的全长基因的 DNA片段。

此外,当利用如上述所得含硫酸化岩藻糖多糖降解酶基因或其部分, 通过Southern杂交对交替单胞菌属的SN-1009或黄杆菌属的SA-0082的 基因组DNA进行分析时,可从检测到的条带位置,获得含有这种基因的 交替单胞菌属SN-1009或黄杆菌属SA-0082基因组DNA限制性酶切片 段的大小的信息,该基因编码具有含硫酸化岩藻糖多糖降解活性的多肽。 再者,也可推测编码具有含硫酸化岩藻糖多糖降解活性的多肽之基因的 数量以及与其互补的基因数量,可通过已知手段分离含有这种基因的DNA 片段。

可通过制备含有在最终阶段分离的所述DNA片段的表达载体,用所 述载体进行宿主转化,培养所述转化子,并测定表达多肽之含硫酸化岩 藻糖多糖降解活性,从而确证如上所制备的DNA片段是否含有编码目标 酶的基因。

本发明中,从交替单胞菌属的SN-1009获得了含有序列表SEQ ID NO:1和NO:2所示氨基酸序列且含有编码具含硫酸化岩藻糖多糖降解 活性的多肽之碱基序列的基因。编码含有由SEQ ID NO:1和NO:2所 示氨基酸序列的多肽之碱基序列的例子分别示于序列表SEQ ID NO:5 和NO:6。

此外,从黄杆菌属的SA-0082分离了含有序列表SEQ ID NO:3和 NO:4所示氨基酸序列且具含硫酸化岩藻糖多糖降解活性的多肽之碱基 序列的基因。编码含有由SEQ ID NO:3和NO:4所示氨基酸序列的多 肽之碱基序列的例子分别示于序列表SEQ ID NO:7和NO:8。

关于利用本发明基因的碱基序列,制备编码具有含硫酸化岩藻糖多 糖降解活性或具有功能上相同活性之多肽的基因的方法,可应用例如如 下方法。

首先,将获自目标基因来源的染色体DNA或由逆转录酶从mRNA 获得的cDNA,通过常规方法连接入质粒或噬菌体载体,导入宿主以制备 文库。于平板上培养文库,将生长的菌落或噬菌斑转移至硝酸纤维膜或 尼龙膜上,变性DNA将其固定于膜上。在含有标记例如,32P标记的探 针的溶液中温育膜(此处所用探针,可为序列表SEQ ID NO:1-NO:4 中所示任一氨基酸序列,或可用编码该氨基酸序列一部分的碱基序列, 以及例如由序列表SEQ ID NO:5-NO:8中所示任一碱基序列或其一部 分的碱基序列),籍此在膜上的DNA与探针之间形成杂交。例如,将固 定DNA的膜与探针在含有6xSSC、1%SDS、100μg/ml鲑精DNA和5× Denhardt试剂的溶液中65℃下杂交20分钟。杂交后,洗去非特异性吸 附的探针,通过例如放射自显影方法鉴定与探针杂交的克隆。重复这个 操作,直到形成杂交的克隆为单一克隆。编码目标多肽的基因插入了如 上所制备的克隆。

通过例如如下方法鉴定所得基因的碱基序列,证实所得基因是否为 编码具有期望的含硫酸化岩藻糖多糖降解活性或具有功能上相同活性的 多肽之基因。

当转化子为用质粒转化的大肠杆菌时,通过将其培养在试管等中并 用常规方法提取质粒,测定碱基序列。用限制性酶切割质粒,取出插入 片段并亚克隆至M13噬菌体载体等中,用双脱氧法测定碱基序列。当噬 菌体载体用于重组时,可用基本上相同的步骤测定碱基序列。关于这种 从培养至碱基序列测定的基本实验方法描述于例如,J.Sambrook等人, “分子克隆,实验室手册”,第2版,冷泉港实验室,1989。

为了确证所得基因是否为编码具有含硫酸化岩藻糖多糖降解活性或 具有功能上相同活性的多肽之基因,将上述所测定的碱基序列或其编码 的氨基酸序列与本发明序列表SEQ ID NO:5-NO:8中所示任一碱基序 列相比较,或与序列表SEQ ID NO:1-NO:4中所示任一氨基酸序列相 比较。

当所得基因不含有编码具有含硫酸化岩藻糖多糖降解活性或具有功 能上相同活性的多肽之所有区域时,基于所得基因制备合成DNA文库, 然后通过PCR扩增缺少的区域,或使用所得基因的片段作为探针进一步 筛查DNA文库或cDNA文库,籍此确定具有含硫酸化岩藻糖多糖降解活 性或具有功能上相同活性的多肽之全部编码区域的碱基序列。

也可从本发明基因的碱基序列设计PCR引物。用所述引物进行PCR 时,可检测与本发明基因具有同源性之基因片段,也可获得完整基因。

然后表达所得基因,测定含硫酸化岩藻糖多糖降解活性,籍此,确 证所得基因的功能。

利用本发明编码具有含硫酸化岩藻糖多糖降解活性的多肽之基因, 下面的方法可方便地用于制备具有含硫酸化岩藻糖多糖降解活性的多 肽。

首先,采用含有编码具有期望的含硫酸化岩藻糖多糖降解活性的多 肽之基因的载体,进行宿主转化,然后将转化子在常用的培养条件下培 养,籍此可制备具有含硫酸化岩藻糖多糖降解活性的多肽。有时,所得 的多肽以包涵体形式产生。对于宿主,可用微生物、动物细胞、植物细 胞等培养的细胞。

可通过例如,测定含硫酸化岩藻糖多糖降解活性方便地证实表达。 可利用例如,重组大肠杆菌细胞提取液作为酶溶液进行活性测定。

当观察到具有期望的含硫酸化岩藻糖多糖降解活性的多肽表达时, 以大肠杆菌作为转化子为例:测定培养基组成成分、pH值、培养温度、 使用诱导剂的量以及阶段、培养时间等的最优条件,籍此可有效制备具 有含硫酸化岩藻糖多糖降解活性的多肽。

使用常规方法从培养的转化子纯化具有含硫酸化岩藻糖多糖降解活 性的多肽。当转化子为大肠杆菌时,具有含硫酸化岩藻糖多糖降解活性 的多肽在细胞内部积累,在完成培养后通过离心收集转化子,采用例如 声波处理破碎细胞,离心收集无细胞提取液。将其经过常规蛋白质纯 化方法,例如盐析或离子交换、凝胶过滤、疏水相层析或亲和层析处理, 可纯化目标多肽。在有些所用的宿主-载体系统中,表达产物可从转化子 中分泌,在这种情况下可类似地纯化上清液。

当具有含硫酸化岩藻糖多糖降解活性的多肽由转化子产生于细胞内 时,该多肽与细胞内存在的多种酶在一起,但是由于这些酶的量与具有 含硫酸化岩藻糖多糖降解活性的多肽的量相比很小,纯化十分方便。此 外,如果选择用作宿主的细胞,可大大降低衍生自宿主的作用于具有含 硫酸化岩藻糖多糖降解活性的多肽的酶的量。再者,当具有含硫酸化岩 藻糖多糖降解活性的多肽被分泌至细胞外时,该多肽与培养基的组成成 分在一起,但这些组成成分可被容易地与具有期望的含硫酸化岩藻糖多 糖降解活性的多肽分离。

此外,宿主为例如大肠杆菌时,产生的表达产物有时可为不溶的包 涵体。在完成培养后通过离心等方法收集细胞,采用例如超声波处理等 方法破碎细胞并离心,籍此收集含有包涵体的不溶性级分。洗涤包涵体 后,用常规用于蛋白质的增溶剂(如尿素、或盐酸胍)使其溶解,用多 种层析方法将其纯化,例如离子交换、凝胶过滤、疏水相层析或亲和层 析处理,如需要可利用例如,透析或稀释将其经重折叠步骤处理,籍此 可制备具有期望的含硫酸化岩藻糖多糖降解活性并保持该活性的多肽。 如需要,可将所得样品进一步通过多种层析手段进行纯化,可获得高纯 度的具有含硫酸化岩藻糖多糖降解活性的多肽。

顺便说明,在制备具有与有含硫酸化岩藻糖多糖降解活性的多肽功 能上相同活性的多肽时,可使用相同的制备方法和纯化方法。

由上所述,本发明提供了具有含硫酸化岩藻糖多糖降解活性的多肽 之一级结构和基因结构。也可通过遗传工程方法制备具有含硫酸化岩藻 糖多糖降解活性的多肽,或具有功能上相同活性的多肽。

使用本发明之遗传工程制备方法,可以低成本制备具有含硫酸化岩 藻糖多糖降解活性的多肽,以及高纯度的具有功能上相同活性的多肽。

在通过培养如下微生物以制备具有含硫酸化岩藻糖多糖降解活性酶 的方法中,所述微生物属于交替单胞菌属或黄杆菌属,可产生含硫酸化 岩藻糖多糖降解酶,且可同时产生蛋白酶及其它多糖降解酶。因此,为 了分离期望的含硫酸化岩藻糖多糖降解酶,需要进行从其它酶中分离纯 化该酶的十分繁杂的工作,也需要在培养过程中添加含硫酸化岩藻糖多 糖以诱导该酶的产生,由此诱导含硫酸化岩藻糖多糖降解酶。然而,根 据本发明,目前可以低成本提供高度纯化的具有含硫酸化岩藻糖多糖降 解活性的多肽。

实施例

以下列实施例进一步阐述本发明,尽管本发明并不局限于下列实施 例。

参考实施例1

(1)用游离磨M-2型(由Nara Kikai Seisakusho制造)研磨2公 斤干燥的Kjellmaniella erassifolia。所得干粉用最多4.5倍80%的乙醇于 80℃处理2小时然后过滤。所得残余物用80%乙醇反复洗涤并如上述方 式过滤三次,乙醇洗后获得1870克残余物。向此残余物加入36升水, 于100℃处理此混合物2小时得到提取液。将提取液的盐浓度调整为与 400mM氯化钠溶液相同。向其中加入5%氯化鲸蜡基吡啶鎓,直至不再 形成沉淀。离心后,用80%乙醇反复洗涤沉淀,将氯化鲸蜡基吡啶鎓完 全除去。然后,将其溶于3升2M氯化钠中。离心除去不溶物,将其悬 浮于已用2M氯化钠平衡过的100ml DEAE-Cellulofine A-800中。搅拌 悬浮液并过滤,除去树脂。将滤液上样于已用2M氯化钠平衡过的 100mlDEAE-Cellulofine A-800中,通过超滤仪(膜排阻分子量为100, 000)将流过的级分脱盐,除去其中的小分子量物质。由此形成的沉淀通 过离心除去。将上清液冷冻干燥,得到82.2克纯化的Kiellmaniella crassifolia含硫酸化岩藻糖多糖混合物。

(2)将来自Kjellmaniella crassifolia的上述含硫酸化岩藻糖多糖混 合物溶于700ml含有0.2M氯化的20mM乙酸钠溶液(pH6.0)中。将 溶液上样于已用含有0.2M氯化钙的20mM乙酸钠溶液(pH6.0)预平衡 的4000ml DEAE-Sepharose FF柱中。用含有0.2M氯化钙的20mM乙 酸钠溶液(pH6.0)彻底洗涤柱,用从0-4M的氯化钠线性梯度洗脱。收 集氯化钠浓度为0.9-1.5M范围中的洗脱级分,利用带有排阻分子量为 100,000的超滤膜之超滤仪脱盐。冷冻干燥后,获得4.7克含硫酸化岩 藻糖多糖-F的冷冻干燥制品。

也收集氯化钠浓度为0.05-0.8M范围中的洗脱级分,利用带有排阻 分子量为100,000的超滤膜之超滤仪脱盐。冷冻干燥后,获得2.1克含 硫酸化岩藻糖多糖-U的冷冻干燥制品。

(3)将交替单胞菌SN-1009(FERM BP-5747)培养于2升Erlenmeyer 烧瓶的600ml培养基中,该培养基包含人造海水(pH8.2,由Jamarin实 验室制造),以及已经高温蒸汽灭菌(120℃,20分钟)的0.25%葡萄糖, 1.0%蛋白胨和0.05%酵母提取物。将菌株于25℃在其中培养25小时得 到种子培养物。向30升发酵罐中加入18升包含人造海水(pH8.0,含有 200克蛋白胨,4克酵母提取物和4ml消泡剂(KM70,Shin-Etsu化学有 限公司制造)的培养基,于120℃高温蒸汽灭菌20分钟。冷却后,培养 基中加入用参考实施例1-(1)方法制备的20克Kjellmaniella crassifolia 含硫酸化岩藻糖多糖-F,其事先已溶于2升人造海水并单独于120℃高温 蒸汽灭菌15分钟,还加入600ml上述种子培养物,随后在速率为10升 /分的通气量、250转/分搅拌下于24℃培养20小时。培养结束后离心培 养液,得到细胞及培养上清液。

利用参考实施例2中所述方法以含硫酸化岩藻糖多糖-F为底物进行 测定,培养上清液显示内切含硫酸化岩藻糖多糖降解酶活性为10mU/ml 培养液。

用排阻分子量为10,000的超滤仪浓缩所得培养上清液,离心除去 由此形成的沉淀。将上清液使用85%的硫酸铵沉淀。离心收集形成的沉 淀,对含有10倍稀释的人造海水(Jamarin S)的20mM Tris盐酸缓冲 液(pH8.2)充分透析。获得400ml粗品酶。

用DEAE-Cellulofine A-800柱(由Seikagaku Kogyo制造)吸附所 得粗品酶溶液,其中DEAE-Cellulotine A-800已事先用含有5mM叠氮 钠和10倍稀释的人造海水(Jamarin S)的20mM Tris盐酸缓冲液 (pH8.2)预平衡。然后用相同缓冲液充分洗涤吸附的物质,用含有 100mM、200mM、300mM、400mM和600mM氯化钠溶液的相同缓冲 液洗脱。合并活性级分。

用参考实施例2所述方法测量,所得酶活性为20,400mU(20.4U)。

用排阻分子量为10,000的超滤仪浓缩所得活性级分,通过向其中 加入含有10mM氯化钙和50mM氯化钠的20mM Tris盐酸缓冲液 (pH8.2)进行超滤,完全取代了缓冲液。

所得酶溶液用事先以相同缓冲液平衡过的DEAE-Sepharose FF柱吸 附,用相同缓冲液充分洗涤吸附物,再进一步用氯化钠浓度为150mM的 相同缓冲液洗涤,并用含有氯化钠150mM至400mM的相同缓冲液进行 氯化钠梯度洗脱。

收集活性级分,利用超滤方法浓缩,用Sephacryl S-200进行凝胶过 滤。使用含有5mM叠氮钠及1/10浓度Jamarin S的10mM Tris盐酸缓 冲液(pH8.0)作为洗脱液。顺便说明,由所述层析测定了分子量,为约 100,000。

收集活性级分,对含有10mM氯化钙、10mM氯化和4.2M氯化 钠的20mM Tris盐酸缓冲液(pH8.2)充分透析,上样于事先以相同缓 冲液(其中氯化钠浓度为4M)平衡过的苯基-Sepharose CL-4B柱,用 含有4M、3M、2M、1M、0.5M或0.15M的相同缓冲液洗脱。

收集所得活性级分,超滤浓缩,通过向其中加入含有10mM氯化钙、 10mM氯化钾和150mM氯化钠的20mM Tris盐酸缓冲液(pH8.2)进行 超滤,完全取代了缓冲液。所得酶溶液上样于事先以相同缓冲液平衡过 的DEAE-Cellulofine A-800柱,用相同缓冲液洗涤,再用氯化钠150mM 至350mM进行氯化钠梯度洗脱。

收集所得活性级分,对含有50mM氯化钠的相同缓冲液充分透析, 用事先以相同缓冲液(含有50mM氯化钠)平衡过的DEAE-Cellulofine A-800柱吸附,用相同缓冲液洗涤,再用氯化钠50mM至150mM进行 氯化钠梯度洗脱。合并所得活性级分得到纯化了的酶。

用SDS(十二烷基硫酸钠)-聚丙烯酰胺凝胶电泳测定了所述纯化酶 的分子量,约为90,000。

参考实施例2

利用由参考实施例1-(2)中的步骤获得的含硫酸化岩藻糖多糖-F, 以下面的方法测定内切含硫酸化岩藻糖多糖降解活性。

即:将12μl 2.5%的含硫酸化岩藻糖多糖-F溶液、6μl 1M氯化钙、 9μl 4M氯化钠、60μl含有50mM乙酸、咪唑和Tris盐酸缓冲液的缓冲 液(pH7.5)、21μl水以及12μl待测定含硫酸化岩藻糖多糖降解活性的 液体混合,于30℃反应3小时。然后将反应液于100℃反应10分钟并离 心。通过HPLC分析100μl反应混合物测量降解程度。

作为对照,用相同方法制备反应混合物(除了待测定降解活性的液 体用该液体中所用的缓冲液替代),以及用相同方法制备另一种反应混合 物(除了用水替代含硫酸化岩藻糖多糖-F溶液)。也用HPLC分析这些 对照。

以1分钟内可将1μmol含硫酸化岩藻糖多糖-F中的岩藻糖基键切 断的酶量为一个单位(U)。根据下面的公式计算如此切割的岩藻糖基键:

活性(U/ml)={(12×2.5)/(100×MF)}×{(MF/M)-1}×{1/ (180×0.01)}×100

(12×2.5)/100:加入反应体系中的含硫酸化岩藻糖多糖-F (mg);

MF:底物(含硫酸化岩藻糖多糖-F)的平均分子量;

M:反应产物的平均分子量;

(MF/M)-1:一分子含硫酸化岩藻糖多糖-F中由酶切割的数 目;

180:反应时间(分);以及

0.01:酶溶液体积(ml)

在如下条件下进行HPLC:

装置:L-6200型(由日立有限公司制造);

柱:OHpak SB-806(8mm×300mm,由Showa Denko K.K.制造);

洗脱液:25mM咪唑缓冲液(pH8),含有5mM叠氮钠, 25mM氯化钙和50mM氯化钠;

检测:分光光度计(Shodex RI-71,由Showa Denko K. K.制造);

流速:1ml/分

柱温:25℃

为了测量反应产物的平均分子量,在与上述相同条件下用HPLC分 析了市售的已知分子量的支链淀粉(STANDARD P-82,由Showa Denko K. K.制造)。由此制备支链淀粉分子量与其在OHpak SB-806柱上的保留时 间之间的关系曲线,并用作测定上述酶反应产物的分子量之标准曲线。

参考实施例3

利用由参考实施例1-(2)中的步骤获得的含硫酸化岩藻糖多糖-U, 以下面的方法测定含硫酸化岩藻糖多糖降解活性。

即:将50μl 2.5%的含硫酸化岩藻糖多糖-U溶液、10μl待测定降 解活性的液体和60μl含有667mM氯化钠的83mM磷酸盐缓冲液 (pH7.5)混合,于37℃反应3小时。然后将105μl反应液与2ml水在 搅拌条件下混合,并于230nm下测量吸光值(AT)。作为对照,用相同 方法制备反应混合物(除了待测定降解活性的液体用该液体中所用的缓 冲液替代),以及用相同方法制备另一种反应混合物(除了用水替代含硫 酸化岩藻糖多糖-U溶液)。也测量这些对照的吸光值(AB1和AB2)。

以1分钟内可将1μmol甘露糖与糖醛酸之间的糖苷键全部切断的酶 量为一个单位(U)。以消除反应中不饱和糖醛酸的毫摩尔分子消光系数 为5.5。根据下面的公式计算测定酶活性:

活性(U/ml)={(AT-AB1-AB2)×2.105×120/5.5×105×0.01×180

2.105:待测吸光值的样品体积(ml);

120:酶反应混合物体积(μl);

5.5:230nm处不饱和糖醛酸的毫摩尔分子消光系数 (/mM);

105:用于稀释的反应混合物体积(μl);

0.01:酶体积(ml);以及

180:反应时间(分)

参考实施例4

(1)使用Sephacryl S-500通过凝胶过滤测定含硫酸化岩藻糖多糖- F和含硫酸化岩藻糖多糖-U的分子量。结果显示,分子量分布在约190, 000左右。

(2)图2显示,过量氯化鲸蜡基吡啶鎓存在时于不同氯化钠浓度下 含硫酸化岩藻糖多糖-U和含硫酸化岩藻糖多糖-F的沉淀率。

图2中,纵坐标显示沉淀率(%),横坐标显示氯化钠浓度(M)。 实线及空心圆表示在不同氯化钠浓度下含硫酸化岩藻糖多糖-U的沉淀 率,点划线及空心三表示在不同氯化钠浓度(M)下含硫酸化岩藻糖 多糖-F的沉淀率。

以如下方法于溶液温度37℃测定沉淀率。

将含硫酸化岩藻糖多糖-U和含硫酸化岩藻糖多糖-F以2%的浓度分 别溶于水和4M氯化钠中。以不同比例混合这些溶液,得到125μl具有 不同氯化钠浓度的含硫酸化岩藻糖多糖-F和含硫酸化岩藻糖多糖-U。然 后以2.5%的浓度将氯化鲸蜡基吡啶鎓溶于水和4M氯化钠中,以不同比 例混合所得的溶液,由此得到不同氯化钠浓度的1.25%氯化鲸蜡基吡啶 鎓。

需要最多3.2倍体积的1.25%氯化鲸蜡基吡啶鎓以彻底沉淀各自以 2%浓度溶于水中的含硫酸化岩藻糖多糖-U和含硫酸化岩藻糖多糖-F。向 125μl具有不同氯化钠浓度的含硫酸化岩藻糖多糖-U和含硫酸化岩藻糖 多糖-F加入400μl的具有不同氯化钠浓度的1.25%氯化鲸蜡基吡啶鎓。 充分搅拌后静置30分钟。离心各个混合物,通过苯酚硫酸法(分析化学 (Analytical Chemistry),28,350(1956))测定上清液中的糖含量,然 后计算每种不同氯化钠浓度的含硫酸化岩藻糖多糖的沉淀率。

(3)其次,以如下方法分析含硫酸化岩藻糖多糖-F的成分。

首先,根据生物化学杂志(Journal of Biological Chemistry),175, 595(1948)所述方法测定岩藻糖含量。

将含硫酸化岩藻糖多糖-F干制品溶于1N盐酸中得到0.5%的浓度, 于110℃处理2小时,籍此将其水解成组成单糖。使用GlycoTAGTM和 GlycoTAGTM试剂盒(均由Takara Shuzo有限公司制造)确定由水解所 得的单糖之还原末端为吡啶基-(2)-胺化的(PA),用HPLC分析组成 单糖。

然后,根据分析生物化学,4,330(1962)所述方法测定糖醛酸含 量。

根据生化杂志(Biochemical Journal),84,106,(1962)所述方法 测定硫酸含量。

发现含硫酸化岩藻糖多糖-F的组成糖为摩尔比约为10∶1的岩藻糖 与半乳糖。其中基本上不含有糖醛酸和任何其它中性糖。岩藻糖与硫酸 的摩尔比约为1∶2。

用上述方法测定含硫酸化岩藻糖多糖-U的组成成分。结果发现,含 硫酸化岩藻糖多糖-U的组成糖为岩藻糖、甘露糖、半乳糖、葡萄糖、鼠 李糖、木糖和糖醛酸,基本上不含有其它中性糖。主要成分的摩尔比如 下:岩藻糖∶甘露糖∶半乳糖∶糖醛酸∶硫酸基团约为10∶7∶4∶5∶20。

(4)用高速、高灵敏度的旋光仪(由Horiba Seisakusho制造),含 硫酸化岩藻糖多糖-F的冻干产物具有-135℃的比旋光度。

另一方面,含硫酸化岩藻糖多糖-U具有-53.6℃的比旋光度。

(5)其次,将16ml 1%的含硫酸化岩藻糖多糖-F溶液、12ml 50mM 磷酸盐缓冲液(pH8.0),4ml 4M氯化钠和8ml述于下面参考实施例5中 的内切岩藻多糖酶(32mU/ml)一起混合,于25℃反应48小时。结果未 形成任何降解产物。

在上述条件下将含硫酸化岩藻糖多糖-U与下面参考实施例5中的岩 藻多糖酶于25℃反应48小时。证实反应混合物的230nm处的吸光值随 反应的进行而增加,由此证明含硫酸化岩藻糖多糖-U正在被该酶降解。

参考实施例5

用下面的方法制备述于参考实施例4的岩藻多糖酶。这并不限制制 备所述岩藻多糖酶过程中所用的菌株,只要它可产生所述酶即可。作为 一个具体的实施例,可引用黄杆菌属SA-0082(FERM BP-5402)为例。

从Aomori的海水检出并收集此菌株。此菌株表示为黄杆菌属SA- 0082,已于1995年3月29日保藏于国立生命科学与人体技术研究所, 工业料技部,作为国际保藏的保藏号FERM BP-5402。

向培养该菌株的培养基中加入的营养物可是任何物质,只要该菌株 可利用它们并产生岩藻多糖酶。碳源的适当的例子包括岩藻多糖、海藻 粉、藻酸、岩藻糖、葡萄糖、甘露醇、甘油、蔗糖、麦芽糖、乳糖和淀 粉,氮源的适当的例子包括酵母提取物、蛋白胨、酪蛋白氨基酸、玉米 浆、肉膏浸提物、脱脂豆粉、硫酸铵和氯化铵。培养基可进一步含有无 机物和金属盐,如钠盐、磷酸盐、钾盐、镁盐和锌盐。

通过培养该菌株产生的岩藻多糖酶之产量随培养条件的不同而不 同。通常,优选的培养温度范围从15-30℃,培养基的pH值范围从5-9。 在通气及搅拌条件下培养该菌株5-72小时达到岩藻多糖酶产量的最大 值。当然,应根据所用的菌株、培养基组成等选择适当的培养条件,以 达到最大产量。

可从细胞及培养上清液中获得岩藻多糖酶。

在适当培养基中培养上述黄杆菌SA-0082,收集细胞,用常规用于 破碎细胞的方法(如超声波)破碎。获得无细胞提取液。

随后,用本领域常规用于纯化的方法纯化提取液。例如,可通过盐 析、离子交换层析、疏水相层析、凝胶过滤等进行纯化,由此得到纯化 的岩藻多糖酶。

通过从上述培养基中除去细胞获得的培养上清液也含有大量该酶(胞 外酶),其可用与纯化胞内酶相同的方法进行纯化。

下面给出一个纯化岩藻多糖酶的纯化例子。

黄杆菌SA-0082(FERM BP-5402)培养于2升Erlenmeyer烧瓶的 600ml培养基中,该培养基包含人造海水(pH7.5,由Jamarin实验室 制造),以及已经高温蒸汽灭菌(120℃,20分钟)的0.25%葡萄糖,1.0% 蛋白胨和0.05%酵母提取物。将菌株于24℃在其中培养24小时得到种子 培养物。向30升发酵罐中加入20升包含人造海水(pH7.5,由Jamarin实 验室制造),含有0.25%葡萄糖、1.0%蛋白胨、0.05%酵母提取物和0.01% 消泡剂(KM70,Shin-Etsu化学有限公司制造)的培养基,于120℃高温 蒸汽灭菌20分钟。冷却后,培养基中加入600ml上述种子培养物,随后 在速率为10升/分的通气量、125转/分搅拌下于24℃培养24小时。培养 结束后离心培养液,收集细胞。

将这些细胞悬浮于含有200mM氯化钠的20mM乙酸盐-磷酸盐缓冲 液(pH7.5)中,超声波破碎细胞并离心,得到细胞提取液。利用参考实 施例3中所述的方法测定此细胞提取液中岩藻多糖酶的活性,为5mU/ml 培养基。顺便说明,活性测定在以后描述。

向此提取液加入硫酸铵以达到最终90%的饱和度。通过搅拌溶解后, 离心混合物,沉淀溶于上述细胞悬浮的相同缓冲液中。将悬浮液对含有 50mM氯化钠的20mM乙酸盐-磷酸盐缓冲液(pH7.5)充分透析。离心 除去透析形成的沉淀,用事先已用含有50mM氯化钠的20mM乙酸盐- 磷酸盐缓冲液(pH7.5)平衡的DEAE-Sepharose FF柱吸附。用相同缓 冲液充分洗涤吸附物,用50mM-600mM的氯化钠浓度线性梯度洗脱。 合并活性级分并向其中加入氯化钠以达到终浓度4M。然后,用已由含有 4M氯化钠的20mM磷酸盐缓冲液平衡的苯基Sepharose CL-4B柱 (Pharmacia制造)吸附。用相同缓冲液充分洗涤吸附物,用4M-1M的氯 化钠浓度线性梯度洗脱。合并活性级分并用超滤仪浓缩。然后,使用已 由含有50mM氯化钠的10mM磷酸盐缓冲液平衡的Sephacryl S-300 (Pharmacia制造)凝胶过滤。合并活性级分。由在Sephacryl S-300中 的保留时间测定该酶的分子量约为460,000。然后,将活性级分对含有 250mM氯化钠的10mM磷酸盐缓冲液(pH7)透析。用已由含有250mM 氯化钠的10mM磷酸盐缓冲液(pH7)平衡的Mono Q HR5/5(Pharmacia 制造)吸附酶溶液。用相同缓冲液充分洗涤吸附物,用250mM-450mM 的氯化钠浓度线性梯度洗脱。合并活性级分得到纯化的酶。表1概述了 上述步骤。顺便说明,在280nm测量酶溶液吸光值以测定蛋白质。以 1mg/ml蛋白质溶液的吸光值为1.0进行计算。

表1 步骤              总蛋白质(mg) 总活性(mU) 比活性(mU/mg) 产率(%) 细胞提取            61,900       101,000    1.63          100 硫酸铵盐析          33,800       88,600     2.62          87.7 DEAE-Sepharose FF   2,190        40,400     18.4          40.0 苯基Sepharose CL-4B 48.2         29,000     601           28.7 Sephacryl S-300     7.24         19,600     2,710         19.4 Mono Q              0.824        15,000     18,200        14.9

此外,可以如下方法纯化岩藻多糖酶。黄杆菌SA-0082(FERM BP-5402)培养于2升Erlenmeyer烧瓶的600ml培养基中,该培养基包 含人造海水(pH7.5,由Jamarin实验室制造),以及已经高温蒸汽灭菌 (120℃,20分钟)的0.1%葡萄糖,1.0%蛋白胨和0.05%酵母提取物。 将菌株于24℃在其中培养20小时得到种子培养物。向30升发酵罐中加 入20升包含人造海水(pH7.5,由Jamarin实验室制造),含有0.3%来 源于Kjellmaniella crassifolia的岩藻多糖、0.5%蛋白胨、0.01%酵母提 取物和0.01%消泡剂(KM70,Shin-Etsu化学有限公司制造)的培养基, 于120℃高温蒸汽灭菌20分钟。冷却后,培养基中加入600ml上述种子 培养物,随后在速率为10升/分的通气量、125转/分搅拌下于24℃培养20 小时。培养结束后离心培养液,得到细胞及培养上清液。将由发酵得到 的细胞悬浮于含有200mM氯化钠的20mM乙酸盐-磷酸盐缓冲液 (pH7.5)中,超声波破碎细胞并离心,得到细胞提取液。分析此细胞提 取液中岩藻多糖酶的活性,为20mU/ml培养基。

另外,通过超滤浓缩上清液(膜排阻分子量为10,000,由Amicon 制造),鉴定岩藻多糖酶。测得活性为6mU/ml培养基。

向上述培养上清液浓缩物加入硫酸铵以达到最终90%的饱和度。通 过搅拌溶解后,离心混合物,沉淀溶于上述细胞悬浮的相同缓冲液中。 将悬浮液对含有50mM氯化钠的20mM乙酸盐-磷酸盐缓冲液(pH7.5) 充分透析。离心除去透析形成的沉淀,用事先已用含有50mM氯化钠的 20mM乙酸盐-磷酸盐缓冲液(pH7.5)平衡的DEAE-Sepharose FF柱吸 附。用相同缓冲液充分洗涤吸附物,用50mM-600mM的氯化钠浓度线 性梯度洗脱。合并活性级分并向其中加入氯化钠以达到终浓度4M。然后, 用已由含有4M氯化钠的20mM磷酸盐缓冲液(pH8.0)平衡的苯基 Sepharose CL-4B柱吸附。用相同缓冲液充分洗涤吸附物,用4M-1M的 氯化钠浓度线性梯度洗脱。合并活性级分并用超滤仪(由Amicon制造) 浓缩。然后,使用已由含有50mM氯化钠的10mM磷酸盐缓冲液平衡的 Sephacryl S-200凝胶过滤。合并活性级分并向其中加入氯化钠以达到终 浓度3.5M。然后,用已由含有3.5M氯化钠的10mM磷酸盐缓冲液 (pH8.0)平衡的苯基Sepharose HP柱吸附。用相同缓冲液充分洗涤吸 附物,用3.5M-1.5M的氯化钠浓度线性梯度洗脱。合并活性级分得到纯 化的酶。由在Sephacryl S-200中的保留时间测定该酶的分子量约为70, 000。

实施例1

(1)将产生内切含硫酸化岩藻糖多糖降解酶的交替单胞菌SN-1009 (FERM BP-5474)接种于2升Erlenmeyer烧瓶的500ml培养基中, 该培养基包含人造海水(pH8.0,由Jamarin实验室制造),以及已经高 温蒸汽灭菌(120℃,20分钟)的0.25%葡萄糖,1.0%蛋白胨和0.05% 酵母提取物。将菌株于25℃在其中培养23小时。培养结束后将培养液离 心收集细胞,将所得细胞的一半悬浮于10ml提取缓冲液中[50mM Tris 盐酸缓冲液(pH8.0)及100mM乙二胺四乙酸(EDTA)],加入溶于1ml 提取缓冲液中的20mg/ml溶菌酶溶液,将混合物置于浴30分钟。然后 加入10ml蛋白酶K溶液[1mg/ml蛋白酶K,50mM Tris盐酸缓冲液 (pH8.0),100mMEDTA和1%SDS],混合物50℃静置2小时。然后冷 却混合物至室温,加入等体积用TE缓冲液[10mM Tris盐酸缓冲液 (pH8.0),1mMEDTA]饱和的苯酚,温和搅拌混合物1小时,于10,000 转/分离心20分钟,回收上相层(此后称此操作为苯酚萃取)。

向此上相层加入等体积用TE缓冲液饱和的苯酚/氯仿(1∶1)混合 物,温和搅拌混合物,于10,000转/分离心20分钟,回收上相层(此后 称此操作为苯酚/氯仿萃取)。再次进行苯酚/氯仿萃取,向水相中加入氯 化钠使其浓度为0.1M,然后加入两倍体积的乙醇以分离DNA,所得DNA 用玻璃棒缠绕,用80%乙醇洗涤,空气中温和干燥。将此基因组DNA 溶于以20μg/ml的量溶解核糖核酸酶A的20mlTE缓冲液,混合物37 ℃保持5小时以降解RNA。苯酚萃取和苯酚/氯仿萃取后,以上述方法加 入乙醇,从中回收DNA,悬浮于5mlTE缓冲液中。经过上述操作得到 约20mg基因组DNA。

(2)由实施例1-(1)制备的基因组DNA(100μg)用10单位限 制性酶Sau3AI于37℃消化1分40秒以部分降解,然后进行苯酚/氯仿萃 取,回收上相层。向上相层加入0.1倍体积的3M乙酸钠(pH5.0)溶液 以及2.5倍体积的乙醇,沉淀DNA。用80%乙醇洗涤所述DNA,空气 干燥(此后,此操作称为乙醇沉淀)。将所得部分降解产物利用1.25M-5M 的氯化钠进行梯度超离心以大小分级分离,通过乙醇沉淀从含有10-20kbp 的级分中回收DNA。将所得部分降解的基因组DNA(0.18μg)与0.6μ gλBlue Star BamHI手臂(Novagene制造)混合,用DNA连接试剂盒 连接(Takara Shuzo制造),用GigaPack II Gold试剂盒(Stratagene制 造)包装入λ噬菌体中,制备交替单胞菌SN-1009的基因组DNA文库。

(3)将经纯化的酶蛋白质(200pmol)上样于已经20mM碳酸氢铵 平衡的柱脱盐(快速脱盐柱PC3.2/10;Pharmacia制造),其中该酶具有 内切含硫酸化岩藻糖多糖降解活性,获自参考实施例1-(3)的交替单胞 菌SN-1009。用相同缓冲液洗脱,置换缓冲液。将洗脱液收集于玻璃小瓶 中浓缩,并蒸发干燥,将样品与玻璃小瓶一起置于大一号的玻璃试管中, 其中含有10μl吡啶、2μl 4-乙烯基吡啶、2μl三-N-丁基膦和10μl水, 密封玻璃试管,于95℃反应10分钟,以进行吡啶基乙基化反应。反应完 成后,取出玻璃小瓶,与水共沸数次除去挥发性成分。

向所得含硫酸化岩藻糖多糖降解酶的吡啶基乙基化蛋白质加入40μl 含有8M尿素的10mM Tris盐酸缓冲液(pH9.0)、90μl 10mM Tris盐酸 缓冲液(pH9.0)和0.5pmol无色杆菌蛋白酶I(Takara Shuzo制造), 于30℃消化过夜。通过HPLC系统(Smart系统,Pharmacia制造)从 所得消化产物中纯化肽片段。使用μRPC C2/C18 SC2.1/10柱(Pharmacia 制造),流速为100μl/分。洗脱时,使用0.12%三氟乙酸水溶液(洗脱液 A)和含有0.1%三氟乙酸的乙腈(洗脱液B)为洗脱液,当洗脱液B比 例为0时加入样品,通过线性浓度梯度方法进行洗脱,90分钟内洗脱液 B的比例从0增加至55%,进行分离和纯化。对每一肽级分进行氨基酸 序列分析,测定部分氨基酸序列F27(SEQ ID NO:9)、F34(SEQ ID NO: 10)、F47(SEQ ID NO:11)和F52(SEQ ID NO:12)。

(4)于37℃下,用100单位每种限制性酶BamHI、EcoRI、HindIII、 PstI、SacI、SalI、SphI和XbaI消化实施例1-(1)中制备的基因组DNA (20μg)4小时,然后用苯酚/氯仿提取。通过乙醇沉淀回收消化产物, 各自取10μg用各50单位的相同限制性酶于37℃处理16小时,用苯酚/ 氯仿萃取,通过乙醇沉淀回收消化产物。各取5μg消化产物用0.8%琼 脂糖凝胶进行电泳,并通过Southern印迹将DNA转移至尼龙膜(商品 名Hybond-N+;Amersham制造)(参见“基因研究方法”,II,218-221, 东京Kagaku Dojin出版)。

关于用于杂交的探针,从由实施例1-(3)测定的部分氨基酸序列载F27 (SEQ ID NO:9)合成混合寡核苷酸pFDA27(SEQ ID NO:13),并 使用该探针。利用Megalabel试剂盒(由Takara Shuzo制造)以32P标 记合成寡核苷酸(20pmol)。

如上制备的滤膜,首先在含有6×SSC、1%SDS、100μg/ml鲑精DNA 和5×Denhardt试剂的溶液中65℃下预杂交3小时,向其中加入标记的 探针达到0.5pmol/ml的浓度,将混合物于42℃杂交过夜。杂交完成后, 用6×SSC于室温下洗涤滤膜10分钟,用含有0.1%SDS的1×SSC于室 温下洗涤10分钟,用含有0.1%SDS的1×SSC于42℃洗涤尼龙膜30分 钟。除去多余水分,将滤膜对成像板曝光(由富士胶片公司制造)30分 钟,用BAS2000成像分析仪(由富士胶片公司制造)检测条带。

结果可见与探针杂交的条带位于用BamHI、EcoRI和SalI消化的产 物之23kbp或更大的位置;用HindIII消化的产物之约4.8、1.4和0.3kbp 的位置;用PstI消化的产物之23kbp或更大以及3.6kbp的位置;用SacI 消化的产物之23kbp或更大以及9.8kbp的位置;用SphI消化的产物之 23kbp或更大、4.9kbp以及3.0kbp的位置;以及用XbaI消化的产物之 约12、5.2和3.5kbp的位置。

根据关于Novagene的λBlue Star的说明,用噬菌斑杂交方法从由 实施例1-(2)制备的交替单胞菌SN-1009基因组DNA文库中筛选带有 含硫酸化岩藻糖多糖降解酶基因的克隆。首先,用噬菌体文库感染大肠 杆菌ER1647,涂布于直径为8.5厘米的4只L培养基平板上,形成约500 个噬菌斑/平板。以如下方法施加尼龙膜(商品名Hybond-N+;Amersham 制造),使得对第1只平板转移约30秒,对第2只平板转移约2分钟, 籍此各自将每个平板的噬菌斑转移至膜上。将尼龙膜于浸入0.5M氢氧化 钠和1.5M氯化钠溶液的滤纸上变性5分钟,然后于浸入0.5M Tris盐酸 缓冲液(pH7.0)和3M氯化钠溶液的滤纸上中和5分钟,用2×SSC漂 洗。用合成寡核苷酸合成混合寡核苷酸pFDA27(SEQ ID NO:13)杂 交尼龙膜,在与上述Southern杂交相同的条件下洗涤并检测,得到18 个阳性信号。将接近阳性信号的噬菌斑从原始平板中刮出,悬浮于SM 缓冲液中,籍此在新平板上重新形成噬菌斑,分别重复上面的操作。结 果分离出14个具有阳性信号的噬菌体。

根据关于Novagene的λBlue Star的说明,用所得噬菌体感染大肠 杆菌BM25.8,筛选抗氨苄青霉素的菌落,将噬菌体转化为质粒形式。将 如此得到的每个菌落接种入含有100μg/ml氨苄青霉素的L培养基(1% 胰蛋白胨、0.5%酵母提取物和0.5%氯化钠),于37℃培养过夜,用碱裂 解法从所得培养物中制备质粒DNA。用所述质粒DNA转化大肠杆菌 JM109(Takara Shuzo制造),将每种所得克隆的菌落分别接种入含有100 μg/ml氨苄青霉素的L培养基,于37℃培养过夜,再次用碱裂解法从所 得培养物中制备各种质粒DNA。每个克隆的所得质粒分别命名为 pSFDA1、2、4、5、6、7、8、10、11、12、13、14、16和pSFDA17。

用限制性酶NotI于λBlue Star载体的克隆位点之两端酶切各个质 粒,用0.3%琼脂糖凝胶电泳分析,籍此发现插入的8.4-17.4kbp的片段。 此外,用限制性酶HindIII消化各个质粒,经过Southern印迹,与合成 寡核苷酸pFDA27(SEQ ID NO:13)杂交并分析,将质粒分为组成如 下的六组:产生约4.8kbp条带的(pSFDA1和pSFDA17)组;产生约 4.8和0.3kbp条带的(pSFDA5、6、7和pSFDA13)组;产生约1.4kbp 条带的(pSFDA10)组;产生约0.3kbp条带和其它大小条带的(pSFDA2 和pSFDA14)组;产生约4.8kbp条带和其它大小条带的(pSFDA16) 组;产生5.0kbp或更大条带的(pSFDA4、8和pSFDA12)组。然而, 除了pSFDA10产生约1.4kbp的条带,当用溴化乙锭染色琼脂糖电泳时 还检测到多个具有类似大小的条带,因此可推定,在每个质粒中,约4.8 和0.3kbp的各个HindIII片段,或其中之一,或其部分被插入基因组DNA 的几乎相同的位置上。还可推定与此pFDA27杂交的约4.8和0.3kbp的 HindIII片段位于基因组上十分接近的位置。因此,所得14种质粒可被 大致上分为产生约1.4kbp条带的质粒pSFDA10和其它质粒,且假定通 过HindIII酶切基因组DNA之Southern杂交,可检测它们有约4.8、1.4 和0.3kbp的任一片段或有约4.8和0.3kbp的片段。所得质粒中,用数种 限制性酶消化质粒pSFDA7和pSFDA10,其中pSFDA7带有约10.2kbp 的插入片段并含有约4.8和0.3kbp的HindHI片段;pSFDA10带有约 8.4kbp的插入片段并含有约1.4kbp的HindIII片段。通过琼脂糖电泳分 析制备限制性酶切图谱。同时,将与合成寡核苷酸pFDA27杂交的区域 亚克隆入质粒pUC119等中,用双脱氧法分析碱基序列。从pSFDA10约 1.4kbp的HindIII片段中发现一段与pFDA27中的17个碱基有14个碱 基相同的序列,但是该序列编码的氨基酸序列与F27不同。因此推定, 尽管所述片段可与pFDA27杂交,但是其与内切含硫酸化岩藻糖多糖降 解酶的基因无关。另一方面,从pSFDA7约4.8和0.3kbp的HindIII片 段中发现一段编码与pFDA27的氨基酸序列之一相同的序列,且包括周 围序列与实施例1-(3)中测定的部分F27氨基酸序列(SEQ ID NO:9) 相同。

此外,约4.8和0.3kbp的HindIII片段在限制性酶切图谱上相距约 3kbp或更多,且大于预期约100,000分子量的所述酶基因的大小,而 如参考实施例1-(3)所述从交替单胞菌SN-1009纯化的内切含硫酸化岩 藻糖多糖降解酶通过凝胶过滤测定的分子量为100,000。籍此,推测至 少有两种类似的基因。

已导入pSFDA7的大肠杆菌JM109表示为大肠杆菌 JM109/pSFDA7。此外,表示为大肠杆菌JM109/pSFDA7之导入pSFDA7 的大肠杆菌JM109已于1997年8月1日保藏于国立生命科学和人体技 术研究所,工业科技部,保藏号FERM P-16362,并于1998年5月6日 转为国际保藏,保藏号为FERM BP-6340。

关于pSFDA7,用引物延伸法通过双脱氧法分析更详细的碱基序列, 测定了pSFDA7之10.2kbp的插入片段中8.3kbp的碱基序列,其中发现 两个开放阅读框架,2646碱基(包括终止密码子)的开放阅读框架1, 此后称为ORF-1;2445碱基(包括终止密码子)的开放阅读框架2,此 后称为ORF-2。通过HindIII酶切基因组DNA之Southern杂交检测的 约4.8和0.3kbp的HindIII片段更精确地说,长度分别为140和4549碱 基对,分别含有部分或全长ORF-1和ORF-2。由ORF-2编码的氨基酸 序列中,除了与内切含硫酸化岩藻糖多糖降解酶的部分氨基酸序列F27 (SEQ ID NO:9)相同的序列外,还可见与部分氨基酸序列F34(SEQ ID NO:10)、F47(SEQ ID NO:11)和F52(SEQ ID NO:12)具有极 高同源性的序列。因此,推定ORF-2基本上编码交替单胞菌SN-1009的 内切含硫酸化岩藻糖多糖降解酶。另一方面,由ORF-1编码的氨基酸序 列中,除了与内切含硫酸化岩藻糖多糖降解酶的部分氨基酸序列F27(SEQ ID NO:9)相同的序列外,还可见与部分氨基酸序列F34(SEQ ID NO: 10)和F52(SEQ ID NO:12)具有极高同源性的序列,而未见与部分 氨基酸序列F47(SEQ ID NO:11)高度同源的序列。当比较ORF-1与 ORF-2编码的氨基酸序列时,未在ORF-2中发现ORF-1中靠近N-末端 的67个氨基酸之插入序列,而在插入序列后的氨基酸序列显示70%或更 高的极高同源性,由此推定,ORF-1也编码具有含硫酸化岩藻糖多糖降 解活性的多肽。如上,测定了据认为编码含硫酸化岩藻糖多糖降解活性 的多肽之基因(ORF-2)的总碱基序列,也测定了与上述基因有极高同 源性的编码据认为具有含硫酸化岩藻糖多糖降解活性的新多肽的基因 (ORF-1)的总碱基序列。

结果示于图1。因此,图1显示了ORF-1和ORF-2的位置。图1中, 黑色箭头显示ORF-1的编码区以及方向,而其中带有虚线的箭头显示 ORF-2的编码区以及方向。ORF-1的碱基序列示于序列表的SEQ ID NO:6,由ORF-1编码的氨基酸序列示于序列表的SEQ ID NO:2。此 外,ORF-2的碱基序列示于序列表的SEQ ID NO:5,由ORF-2编码的 氨基酸序列示于序列表的SEQ ID NO:1。

如上所述,根据本发明分离并纯化了推定的基本上编码内切含硫酸 化岩藻糖多糖降解酶的基因(ORF-2)和推定的编码具有含硫酸化岩藻 糖多糖降解活性的新多肽之基因(ORF-1)。

实施例2

为了构建获自实施例1的、推定基本上编码内切含硫酸化岩藻糖多 糖降解酶的基因(ORF-2)的直接表达载体,使ORF-2的起始密码子与 表达载体上的最优起始密码子相同,构建插入了部分ORF-2的5’区之 质粒pEFDA-N。

首先,合成了合成DNAFDA-N1(SEQ ID NO:14)和FDA-N2(SEQ ID NO:15)。FDA-N1是含有序列表SEQ ID NO:5中碱基序列号1-13序 列的15mer的合成DNA,而FDA-N2是含有序列表SEQ ID NO:5中碱 基序列号4-13序列的15mer的合成DNA。

这些合成DNA70℃下于含有0.2M Tris盐酸缓冲液(pH7.5)和0.3M 氯化钠的溶液中放置10分钟,渐渐冷却至室温以形成双链,由此制备合 成DNA接头FDA-N。所得FDA-N为合成DNA接头,含有序列表SEQ ID NO:5中碱基序列号8-13序列的SnaBI位点,可在起始密码子与NcoI位 点连接,也可与紧邻SnaBI位点下游的BamHI位点连接。

同时,将使用T7启动子的作为表达载体的pET21d(Novagene制 备)在位于T7启动子下游的NcoI位点(含有优化用于表达的起始密码 子)和多克隆位点之BamHI位点切割。使用DNA连接试剂盒(Takara Shuzo制造)将消化产物与预制备的合成DNA接头FDA-N连接,然后 转化大肠杆菌JM109,筛选生长于含有100μg/ml氨苄青霉素的L培养 基平板上的菌落。每个转化子接种于含有100μg/ml氨苄青霉素的L培 养基,37℃培养过夜,通过碱裂解法从培养的细胞中制备质粒DNA。用 SnaBI消化质粒DNA后,进行1%琼脂糖凝胶电泳以筛选可被SnaBI切 割的质粒,然后通过双脱氧法证实插入片段的碱基序列,获得了质粒 pEFDA-N,其中在pET21d的NcoI与BamHI之间插入了从ORF-2的 起始密码子至SnaBI位点的区域。

然后将实施例1中所得约5μg质粒pSFDA7用30单位SnaBI于37 ℃消化2小时,用1%琼脂糖凝胶电泳分离,切下包括接近ORF-2全长 区域的约2.5kbp的SnaBI片段,提取并纯化。将SnaBI片段与已用SnaBI 切割的预先构建的质粒pEFDA-N之消化产物混合,利用DNA连接试剂 盒连接,转化大肠杆菌JM109,筛选于含有100μg/ml氨苄青霉素的L 培养基平板上生长的菌落。用如上方法制备质粒DNA,用SnaBI消化, 经过1%琼脂糖凝胶电泳,筛选释放2.5kbp的SnaBI片段之质粒。此外, 进行双脱氧法以证实插入片段的方向,筛选其中ORF-2插入方向与T7 启动子方向相同的质粒。从pET21d的NcoI位点的起始密码子插入ORF-2 全长的表达质粒称为pEFDAII103。

用如上制备的质粒pEFDAII103转化大肠杆菌菌株BL21(DE3) (Novagene制备)。所得大肠杆菌BL21(DE3)/pEFDAII103接种于含 有100μg/ml氨苄青霉素及5mM氯化钙的5ml L培养基中,37℃震荡培 养,在以O.D.600表示的浊度值为0.8的时候加入IPTG使其终浓度为 1mM,再于15℃震荡培养过夜。培养结束后,培养基离心收集细胞,将 细胞悬浮于1ml用于破碎细胞的缓冲液中(20mM Tris盐酸缓冲液 (pH7.5)),10mM氯化钙,10mM氯化钾和0.3M氯化钠),用超声波 处理破碎。离心并回收上清液,用做大肠杆菌提取液。

作为对照,在相同时间于相同条件下培养用pET21d转化的大肠杆 菌BL21(DE3)/pET21d,所得大肠杆菌提取液用于如下分析。

首先,用SDS聚丙烯酰胺凝胶电泳分析大肠杆菌提取液,籍此在大 肠杆菌BL21(DE3)/pEFDAII103提取液中观察到一个具有分子量约90, 000的条带,该条带未见于大肠杆菌BL21(DE3)/pET21d提取液中。 此分子量与多肽的计算分子量(88,210)十分符合,计算分子量由可被 序列表中SEQ ID NO:1所示ORF-2编码的氨基酸序列计算;也与由SDS 聚丙烯酰胺凝胶电泳方法分析纯化自交替单胞菌SN-1009的内切含硫酸 化岩藻糖多糖降解酶所得的分子量(约90,000)相符合。因此,已证实 大肠杆菌BL21(DE3)/pEFDAII103表达由ORF-2编码的多肽。

用参考实施例2中所述方法测量大肠杆菌提取液的内切含硫酸化岩 藻糖多糖降解活性。

结果从大肠杆菌BL21(DE3)/pEFDAII103提取液检测到内切含硫 酸化岩藻糖多糖降解活性为520mU/ml。由此发现ORF-2编码的多肽具 有含硫酸化岩藻糖多糖降解活性,在含有本发明基因的大肠杆菌BL21 (DE3)/pEFDAII103的1ml培养液中,ORF-2编码的多肽具有约104mU 的含硫酸化岩藻糖多糖降解活性。

相反,从所有大肠杆菌BL21(DE3)/pET21d提取液中未检测到含 硫酸化岩藻糖多糖的内切降解活性。

实施例3

在ORF-1和ORF-2中,从起始密码子至碱基15的序列完全一致, 且在所述区域中存在限制性酶SnaBI位点。因此实施例2中构建的质粒 pEFDA-N中的插入序列与ORF-1和ORF-2中完全相同,因此,pEFDA-N 可用于构建ORF-1的表达载体。

由此,首先将实施例1中所得约5μg质粒pSFDA7用30单位SnaBI 于37℃消化2小时,用1%琼脂糖凝胶电泳分离,切下包括几乎ORF-1 全长区域的约3.2kbp的SnaBI片段,提取并纯化。将SnaBI片段与已用 SnaBI切割的质粒pEFDA-N之消化产物混合,利用DNA连接试剂盒连 接,混合物转化大肠杆菌JM109,筛选于含有100μg/ml氨苄青霉素的 L培养基平板上生长的菌落。

用如实施例2中相同方法制备质粒DNA,用SnaBI消化,经过1% 琼脂糖凝胶电泳,筛选插入3.2kbp的SnaBI片段之质粒。此外,进行双 脱氧法以证实插入片段的方向,筛选其中ORF-1插入方向与T7启动子 方向相同的质粒。从pET21d的NcoI位点的起始密码子插入ORF-1全 长的表达质粒称为pEFDAI103。

通过使用如上制备的质粒pEFDAI103以表达由ORF-1编码的多肽, 并利用与实施例2相同的方法证实多肽的含硫酸化岩藻糖多糖降解活性。

首先用pEFDAI103转化大肠杆菌菌株BL21(DE3)。所得大肠杆 菌BL21(DE3)/pEFDAI103接种于含有100μg/ml氨苄青霉素及5mM 氯化钙的5ml L培养基中,37℃震荡培养。在以O.D.600表示的浊度值 为0.8的时候加入IPTG使其终浓度为1mM,再于15℃震荡培养过夜。 培养结束后,培养基离心收集细胞,将细胞悬浮于1ml用于破碎细胞的 缓冲液中,用超声波处理破碎。离心并回收上清液,用做大肠杆菌提取 液。

用SDS聚丙烯酰胺凝胶电泳分析大肠杆菌提取液,籍此在大肠杆菌 BL21(DE3)/pEFDAI103提取液中观察到一个具有分子量约100,000 的条带,该条带未见于大肠杆菌BL21(DE3)/pET21d提取液中。此分 子量与多肽的计算分子量(94,910)十分符合,计算分子量由可被序列 表中SEQ ID NO:2所示ORF-1编码的氨基酸序列计算。因此,已证实 大肠杆菌BL21(DE3)/pEFDAI103表达由ORF-1编码的多肽。

用参考实施例2中所述方法测量大肠杆菌提取液的内切含硫酸化岩 藻糖多糖降解活性。

结果,从大肠杆菌BL21(DE3)/pEFDAI103提取液检测到内切含 硫酸化岩藻糖多糖降解活性为35.8mU/ml。由此发现ORF-1编码的多肽 具有含硫酸化岩藻糖多糖降解活性,在含有本发明基因的大肠杆菌BL21 (DE3)/pEFDAI103的1ml培养液中,生产的ORF-1编码的多肽具有 约7.2mU的含硫酸化岩藻糖多糖降解活性。

另一方面,从大肠杆菌BL21(DE3)/pET21d提取液中未检测到任 何含硫酸化岩藻糖多糖的内切降解活性。

实施例4

(1)将产生岩藻多糖酶的黄杆菌SA-0082(FERM BP-5402)接种 于2升Erlenmeyer烧瓶的500ml培养基中,该培养基包含已经高温蒸 汽灭菌(120℃,20分钟)的人造海水(由Jamarin实验室制造),其中 含有0.25%葡萄糖,1.0%蛋白胨和0.05%酵母提取物。将菌株于25℃在 其中培养23小时。培养结束后将培养液离心收集细胞,将所得细胞的一 半悬浮于10ml提取缓冲液中[50mM Tris盐酸缓冲液(pH8.0)及100mM 乙二胺四乙酸(EDTA)],加入溶于1ml提取缓冲液中的20mg/ml溶菌 酶溶液,将混合物置于冰浴30分钟。然后加入10ml蛋白酶K溶液[1mg/ml 蛋白酶K,50mM Tris盐酸缓冲液(pH8.0),100mMEDTA和1%SDS], 混合物50℃静置2小时。然后冷却混合物至室温,加入等体积用TE缓 冲液[10mM Tris盐酸缓冲液(pH8.0),1mM EDTA]饱和的苯酚,温和 搅拌混合物1小时,于10,000转/分离心20分钟,回收上层相。向此上 层相加入等体积用TE缓冲液饱和的苯酚/氯仿(1∶1)混合物,温和搅 拌混合物,于10,000转/分离心20分钟,回收上层相。再次进行苯酚/ 氯仿萃取,向水相中加入氯化钠使其浓度为0.1M,然后加入两倍体积的 乙醇以沉淀DNA,所得DNA用玻璃棒缠绕,用80%乙醇洗涤,空气中 温和干燥。将此基因组DNA溶于以20μg/ml的量溶解核糖核酸酶A的 20mlTE缓冲液,37℃保持5小时以降解RNA。苯酚萃取和苯酚/氯仿萃 取后,以上述方法加入乙醇,从中回收DNA,悬浮于5mlTE缓冲液中。 经过上述操作得到约20mg基因组DNA。

(2)由实施例4-(1)制备的基因组DNA(100μg)用10单位限 制性酶Sau3AI于37℃消化1分40秒以部分降解,然后进行苯酚/氯仿萃 取,回收上层相。向上层相加入0.1倍体积的3M乙酸钠(pH5.0)溶液 以及2.5倍体积的乙醇,沉淀DNA。离心回收沉淀,用80%乙醇洗涤所 述DNA,空气干燥。将所得部分降解产物利用1.25M-5M的氯化钠进行 密度梯度超离心以大小分级分离,通过乙醇沉淀从含有10-20kbp的级分 中回收DNA。将所得部分降解的基因组DNA(0.2μg)与0.6μgλBlue Star BamHI手臂(Novagene制造)混合,用DNA连接试剂盒连接(Takara Shuzo制造),用GigaPack II Gold试剂盒(Stratagene制造)包装入λ 噬菌体中,制备黄杆菌SA-0082的基因组DNA文库。

(3)将经纯化的岩藻多糖酶蛋白质(200pmol)上样于已经20mM 碳酸氢铵平衡的柱脱盐(快速脱盐柱PC3.2/10;Pharmacia制造),其中 该酶获自参考实施例5的黄杆菌SA-0082。用相同缓冲液洗脱,置换缓冲 液。将洗脱液收集于玻璃小瓶中浓缩,并蒸发干燥,将玻璃小瓶一起置 于大一号的玻璃试管中,其中含有10μl吡啶、2μl 4-乙烯基吡啶、2μl 三-N-丁基膦和10μl水,密封玻璃试管,于95℃反应10分钟,以进行 吡啶基乙基化反应。反应完成后,取出玻璃小瓶,与水共沸数次除去挥 发性成分。

向所得吡啶基乙基化的岩藻多糖酶蛋白质加入40μl含有8M尿素的 10mM Tris盐酸缓冲液(pH9.0)、90μl 10mM Tris盐酸缓冲液(pH9.0) 和0.5pmol无色杆菌蛋白酶I(Takara Shuzo制造),于30℃消化过夜。 通过HPLC系统(Smart系统,Pharmacia制造)从所得消化产物中纯 化肽片段。使用μRPC C2/C18 SC2.1/10柱(Pharmacia制造),流速为 100μl/分。洗脱时,使用0.12%三氟乙酸水溶液(洗脱液A)和含有0.1% 三氟乙酸的乙腈(洗脱液B)为洗脱液,当洗脱液B比例为0%时加入样 品,通过线性浓度梯度方法进行洗脱,80分钟内洗脱液B的比例从0增 加至55%,进行分离和纯化。从洗脱液B的比例为27%或更高时的洗脱 峰,获得洗脱级分L27,L31和L36。之后,收集分离不佳的洗脱液B 比例为17-27%的级分,浓缩,上样于相同的HPLC系统,用相同的线 性浓度梯度方法洗脱,其中洗脱液B的比例在87分钟内从15%-40%, 得到洗脱级分LR8、LR9、LR14和LR16。对每一肽级分进行氨基酸序 列分析,测定部分氨基酸序列L27(SEQ ID NO:16)、L36(SEQ ID NO: 17)、LR9(SEQ ID NO:18)、LR14(SEQ ID NO:19)和LR16(SEQ ID NO:20)。

(4)于37℃下,用30单位每种限制性酶EcoRI、HindIII、MunI、 SpeI、XbaI和Sau3AI消化实施例4-(1)中制备的基因组DNA(2.4μ g)3小时,然后用苯酚/氯仿提取。通过乙醇沉淀回收消化产物。各取0.5 μg消化产物与EcoRI试剂盒混合用于制备用EcoRI和MunI消化的产 物;与HindIII试剂盒混合用于用HindIII消化的产物;与XbaI试剂盒 混合用于用XbaI和SpeI消化的产物;与Sau3AI试剂盒混合用于用 Sau3AI消化的产物;其中每种情况中使用20ng的试剂盒(Takara Shuzo 制造,Sau3AI的试剂盒为200ng),用DNA连接试剂盒(Takara Shuzo 制造)连接。通过乙醇沉淀回收各个反应产物,溶于10μl水中,产生用 于利用盒式DNA的PCR的模板DNA。

同时,从实施例4-(3)中测定的部分氨基酸序列LR14(SEQ ID NO:19)的氨基酸序列1-6,以如氨基酸序列中的相同方向合成了混合寡 核苷酸pL14F17(SEQ ID NO:21),以相同方法,从同一氨基酸序列的 3-11合成了混合寡核苷酸pL14F26(SEQ ID NO:22)。

制备各个反应混合物:1μl已制备的模板DNA,20pmol盒式引物 C1(Takara Shuzo制造),100pmol混合寡核苷酸pL14F17(SEQ ID NO:21),与无菌水混合至22μl,加热至94℃10分钟然后迅速冷却。向 每个混合物中加入10μl 10倍浓缩的Ex Taq缓冲液(Takara Shuzo制 造)、16μl 1.25mM各个dNTP混合物,2.5单位Takara Ex Taq(Takara Shuzo制造),以及无菌水至100μl,随后上层加矿物油。利用基因自动 化热循环仪(DNA热循环仪480;Takara Shuzo制造)对混合物进行括 增反应。PCR中,一个循环包括94℃变性0.5分钟,45℃退火2分钟以 及72℃合成反应3分钟;进行25个循环,最后,混合物保持在72℃7分 钟完成反应。

然后,利用各个模板DNA(通过用无菌水10倍稀释第一个PCR反 应液制备)进行第二个PCR,加热至94℃10分钟然后迅速冷却。加入10 μl热处理的第一个PCR溶液,20pmol盒式引物C2(Takara Shuzo制 造),100pmol混合寡核苷酸pL14F26(SEQ ID NO:22),10μl 10倍浓 缩的Ex Taq扩增缓冲液、16μl 1.25mM各个dNTP混合液,2.5单位 Iakara Ex Taq,以及无菌水至100μl,随后上层加矿物油。对各种混合 物,一个循环包括94℃变性0.5分钟,55℃退火2分钟以及72℃合成反 应3分钟;进行25个循环,最后,混合物保持在72℃7分钟完成反应。 同时,进行反应溶液仅含有盒式引物C2和仅含有混合寡核苷酸pL14F26 的PCR,作为每个引物非特异性扩增产物的对照。

当反应溶液用琼脂糖凝胶电泳分析时,在许多反应溶液中可见多条 扩增条带,并与非特异性扩增产物的对照反应比较。由此,从第二个PCR 溶液中用MunI消化-EcoRI试剂盒为模板提取并纯化了约0.7kbp的条 带,其背景相对较低,强烈扩增一条带。将此DNA片段与pT7blue T载 体(Novagene制造)混合,用DNA连接试剂盒连接。用连接混合物转 化大肠杆菌JM109,筛选生长于含有100μg/ml氨苄青霉素、0.04%X-gal 及1mM IPTG的L培养基平板上的白色菌落。每个转化子接种于含有100 μg/ml氨苄青霉素的L培养基,37℃培养过夜,通过碱裂解法从培养的 细胞中制备质粒DNA。筛选其中插入约0.7kbp条带的质粒,称为pT7- Mun。然后通过双脱氧法经碱基序列分析证实此pT7-Mun的插入片段的 碱基序列,由此,在用于第二次PCR的pL14F26序列之前发现了一个 编码部分氨基酸序列LR14(SEQ ID NO:19)第12氨基酸及其后的氨基 酸序列区域。此外,在下游,发现一个编码与部分氨基酸序列L27(SEQ ID NO:16)有很高同源性的氨基酸序列的区域。由这些发现,显然约0.7kbp 的DNA片段是岩藻多糖酶基因的一部分。从0.7kbp DNA片段的引物 pL14F26至与EcoRI试剂盒连接点的序列示于SEQ ID NO:23。

(5)各自取获自实施例4-(1)的20μg基因组DNA用各100单位的 限制性酶BamHI、EcoRI、HindIII、PstI、SacI、SalI、SphI或XbaI 于37℃处理4小时,用苯酚/氯仿萃取。通过乙醇沉淀回收消化产物。各 取10μl所得消化产物在用相同的限制性酶于37℃处理16小时,用苯酚/ 氯仿萃取。通过乙醇沉淀回收消化产物。各取5μg消化产物用0.8%琼 脂糖凝胶进行电泳,并通过Southern印迹将DNA转移至尼龙膜(商品 名Hybond-N+;Amersham制造)。

同时,用BamH I和SphI消化实施例4-(4)获得的约4μg载体 pT7-Mun,回收并纯化从该质粒释放的0.7kbp的片段,其含有岩藻多糖 酶基因的一部分。用BcaBEST标记试剂盒(Takara Shuzo制造)以32P标 记DNA片段,制备用于杂交的探针DNA。

将如上制备的滤膜,在含有6×SSC、1%SDS、100μg/ml鲑精DNA 和5×Denhardt试剂的溶液中65℃下预杂交1小时,向其中加入标记的 探针达到1,000,000cpm/ml的浓度,60℃杂交过夜。杂交完成后,用 6×SSC于室温下洗涤滤膜10分钟,用含有0.1%SDS的0.2×SSC于室温 下洗涤10分钟,用含有0.1%SDS的0.2×SSC于室温下洗涤5分钟,用 含有0.1%SDS的0.2×SSC于45℃洗涤尼龙膜30分钟。除去多余水分, 将滤膜对成像板曝光(由富士胶片公司制造)30分钟,用BAS2000成像 分析仪(由富士胶片公司制造)检测条带。

结果,可见一条与探针强烈杂交的条带位于用BamHI、SalI/SphI 和SalI消化的产物中之23kbp或更大的位置;用EcoRI消化的产物中 于约8和3kbp位置的两条带;用HindIII消化的产物中,位于约11和 4kbp位置的两条带;用PstI消化的产物中,位于约12和2.5kbp位置 的两条带;用SacI消化的产物中,位于约10和9.5kbp位置的两条带; 以及用XbaI消化的产物中,位于约6kbp位置的一条带。因此,强烈提 示黄杆菌SA-0082基因组DNA上有两种岩藻多糖酶基因。

(6)根据关于Novagene的λBlue Star的说明,用噬菌斑杂交方 法从由实施例4-(2)制备的黄杆菌SA-0082基因组DNA文库中筛选含 有岩藻多糖酶基因的克隆。

首先,大肠杆菌ER1647用噬菌体文库感染,且在直径为8.5厘米的 5只L培养基平板上形成约300个噬菌斑/平板。每只平板用尼龙膜(商 品名Hybond-N+;Amersham制造)接触约30秒,使每个平板的噬菌斑 转移至膜上。将尼龙膜用0.5M氢氧化钠和1.5M氯化钠溶液处理5分钟 变性,然后用0.5M Tris盐酸缓冲液(pH7.0)和3M氯化钠溶液中和5 分钟,用2×SSC漂洗,空气干燥。用紫外线辐照固定DNA,尼龙膜在与 上述实施例4-(5)Southern杂交相同的条件下杂交、洗涤并检测,得到 36个阳性信号。将接近阳性信号的噬菌斑从原始平板中刮出,悬浮于SM 缓冲液中回收噬菌体。对所得噬菌体溶液在新平板上重新形成噬菌斑, 分别重复上面的操作。结果分离出9个具有阳性信号的噬菌体。

根据关于Novagene的λBlue Star的说明,大肠杆菌BM25.8用所 得噬菌体感染,涂布于含有100μg/ml氨苄青霉素的L培养基平板上, 筛选抗氨苄青霉素的菌落。籍此将噬菌体转化为质粒形式。将如此得到 的每个菌落接种入含有100μg/ml氨苄青霉素的L培养基于37℃培养过 夜,再次用碱裂解法从所得培养物中制备质粒DNA。用所述质粒DNA 转化大肠杆菌JM109(Takara Shuzo制造),将每种所得克隆的菌落分 别接种入含有100μg/ml氨苄青霉素的L培养基,于37℃培养过夜,用 碱裂解法从所得培养物中制备各种质粒DNA。每个克隆的所得质粒分别 命名为pSFLA1、5、10、11、12、13、15、17和pSFLA18。

用限制性酶KpnI、SacI和XbaI的适当组合消化各个质粒,经琼脂 糖凝胶电泳并如上进行Southern杂交,籍此制备并分析各插入片段的限 制性酶切图谱。结果,在琼脂糖凝胶溴化乙锭染色中,在各个泳道中检 出具有相同大小的条带的多重条带,同时,将其分类为两组:一组由 pSFLA1、10、12、15和pSFLA18组成,其在SacI消化片段中可与约0.7kbp 的pT7-Mun插入片段杂交的有两条带;另一组由pSFLA5、11、13、和 pSFLA17组成,其在KpnI消化片段中可与约0.7kbp的pT7-Mun插入 片段杂交的有两条带。进一步明确了通过用XbaI消化三种质粒pSFLA5、 pSFLA10和pSFLA17释放出约6kbp的片段,提示由实施例4-(5) Southern杂交检测的在XbaI消化产物中之约6kbp的片段,是由于两条 带的重叠,因此显然在黄杆菌SA-0082的基因组DNA上有至少两种岩藻 多糖酶基因。

因此,从各组质粒中选出pSFLA10和pSFLA17,进一步进行插入 片段的分析。由此,用XbaI消化3μg的各个质粒,提取并纯化约6kbp 的释放出的片段。将这些XbaI片段与氯霉素抗性载体pHSG399(Takara Shuzo制造)的XbaI消化产物混合,用DNA连接试剂盒(Takara Shuzo 制造)连接。用混合物转化大肠杆菌JM109,挑选生长于L培养基平板 上的白色菌落,L培养基含有30μg/ml氯霉素、0.004%X-gal、和1mM IPTG。将各个转化子接种于含有30μg/ml氯霉素的培养基中,于37℃ 培养过夜。从培养细胞中通过碱裂解法制备质粒DNA,用限制性酶消化 后经琼脂糖凝胶电泳分析。结果,获得了分别以相反方向插入来自 pSFLA10的约6kbpDNA的质粒pH10X6-1和pH10X6-2。类似地,获 得了插入来自pSFLA17的约6kbpDNA的质粒pH17X6-1和pH17X6-2。 导入了pH10X6-1的大肠杆菌JM109称为大肠杆菌JM109/pH10X6-1, 已于1998年2月24日保藏于国立生命科学和人体技术研究所,工业科 技部,MITI,保藏号为FERM P-16659,国际保藏号为FERM BP6341 (申请转为国际保藏的日期:1998年5月6日)。导入了pH17X6-1的大 肠杆菌JM109称为大肠杆菌JM109/pH17X6-1,已于1998年2月24日 保藏于国立生命科学和人体技术研究所,工业科技部,MTTI,保藏号为 FERM P-16660,国际保藏号为FERM BP6342(申请转为国际保藏的 日期:1998年5月6日)。当直接以引物延伸法或用限制性酶消化后进行 亚克隆的方法详细分析这些质粒的碱基序列时,从来自pSFLA10的约 6kbp的DNA片段中发现了2094碱基(包括终止密码子)的阅读框架, 从来自pSFLA17的约6kbp的DNA片段中发现了2115碱基(包括终止 密码子)的阅读框架,这些编码氨基酸序列的阅读框架中,发现与实施 例4-(3)中测定的部分氨基酸序列有很高同源性。

来自pSFLA10的阅读框架称为fdlA,而来自pSFLA17的阅读框架 称为fdlB。

结果示于图3和图4。因此,图3显示pSFLA10中fdlA的位置, 而图4显示pSFLA10中fdlB的位置。图3中的黑箭头显示编码区域及fdlA 的方向,而图4中显示编码区域及fdlB的方向。

在fdlA编码的氨基酸序列中,发现与实施例4-(3)测定的岩藻多 糖酶的部分氨基酸序列L36(SEQ ID NO:17)和LR14(SEQ ID NO:19) 相同,也发现与实施例4-(3)测定的岩藻多糖酶的部分氨基酸序列L27 (SEQ ID NO:16)、LR9(SEQ ID NO:18)和LR16(SEQ ID NO:20) 高度同源的序列。此外,在实施例4-(3)称为LR8的肽片段中,通过 氨基酸序列分析检出每个循环的两个氨基酸衍生物,由此不是无条件地 测定氨基酸序列。然而,当应用于fdlA编码的氨基酸序列中两处的序列 时,可解释每个循环中检测的氨基酸衍生物,由此,显然在所述级分中 有两个肽,每个含有两处序列的一个。将这些序列称为LR8-1(SEQ ID NO:24)和LR8-2(SEQ ID NO:25)。如上,fdlA编码的氨基酸序列与 所有通过实施例4-(3)的岩藻多糖酶部分氨基酸序列分析确定的氨基酸 序列相同或有高度同源性,因此,它们基本上编码黄杆菌SA-0082的岩 藻多糖酶。

同时,fdlB编码的氨基酸序列,也可见与LR14(SEQ ID NO:19) 和LR8-1(SEQ ID NO:24)部分氨基酸序列一致的序列,以及与岩藻多 糖酶部分氨基酸序列LR27(SEQ ID NO:16)和LR8-2(SEQ ID NO:25) 的部分氨基酸序列有高度同源性的序列,尽管没有与部分氨基酸序列 LR36(SEQ ID NO:17)或LR9(SEQ ID NO:18)高度同源的序列。然 而,当比较fdlA和fdlB时,碱基序列和氨基酸序列的同源性分别高达约 67%和约56%,由此,很可能fdlB也编码具有岩藻多糖降解活性的多肽。 如上,测定了推定编码具有岩藻多糖降解活性的多肽之基因(fdlA)以及 与上述基因有高度同源性的基因(fdlB)的总碱基序列。fdlA的碱基序 列示于序列表的SEQ ID NO:7,fdlA编码的氨基酸序列示于序列表的SEQ ID NO:3。fdlB的碱基序列示于序列表的SEQ ID NO:8,fdlB编码的氨 基酸序列示于序列表的SEQ ID NO:4。

如上,依本发明分离并纯化了推定基本上编码岩藻多糖酶的基因 (fdlA),以及另一个推测与上述基因有同源性的基因(fdlB),其编码推 定具有含硫酸化岩藻糖多糖降解活性的多肽。

实施例5

首先,构建了获自实施例4推定基本上编码岩藻多糖酶的基因(fdlA) 的直接表达载体。

在获自实施例4的质粒pH10X6-1中,以如此方向插入来自pSFLA10 的约6kbp的XbaI片段,使基因fdlA与载体上的lac启动子相接。将 pH10X6-1于位于基因fdlA中的SacI位点消化,然后于位于基因fdlA 起始密码子处的BspHI位点消化,通过1%琼脂糖凝胶电泳分离,将编 码fdlA的N-端区域的约400bp的DNA片段切出,提取并纯化。

另一方面,于位于多克隆位点的NcoI位点以及SacI位点切割使用 T7启动子的表达载体pET21d(Novagene制造),其含有最佳表达的起 始密码子且在T7启动子下游,然后将编码以准备好的fdlA的N-末端区 域的约400bp之BspHI-SacI片段插入,构建了质粒pEFLA10-N。

然后,用HindIII于来自载体和fdlA基因内部的HindIII位点切割 质粒pH10X6-1,切出编码包括fdlA基因的C-末端区域(包括终止密码 子)约2kbp的DNA片段,提取并纯化。将该片段与已制备的质粒 pEFLA10-N的HindIII消化产物连接,筛选以适当方向插入所述 2kbpHindIII片段从而重建fdlA基因全长的质粒。从位于pET21d的NcoI 位点的起始密码子插入了全长fdlA基因的表达质粒称为pEFLA10。

用如此制备的pEFLA10转化大肠杆菌BL21(DE3)(由Novagene 制造)。所得大肠杆菌BL21(DE3)/pEFLA10接种于含有100μg/ml 氨苄青霉素的L培养基中,37℃震荡培养。当培养物的O.D.600达到0.8 时,加入IPTG使终浓度达到1mM,再于15℃震荡培养一夜。培养结束 后,离心从培养液中收集细胞,悬浮于0.5ml的细胞裂解缓冲液(20mM 磷酸盐缓冲液(pH7.0)和0.3M氯化钠),超声波处理破碎。取出部分悬 浮液用做大肠杆菌裂解液。将悬浮液进一步离心以除去不溶物,制备大 肠杆菌提取液。

作为对照,于相同条件和时间下培养用pET21d转化的大肠杆菌BL21 (DE3)/pET21d,制备大肠杆菌裂解液和提取液。用于下面的分析。

首先,大肠杆菌裂解液通过SDS聚丙烯酰胺凝胶电泳方法分析,结 果在大肠杆菌BL21(DE3)/pEFLA10的裂解液中可见一条分子量约76, 000的带(未见于大肠杆菌BL21(DE3)/pET21d裂解液中)。此分子量 与从示于序列表SEQ ID NO:3的fdlA所编码的氨基酸序列中计算的多 肽分子量(75,740)十分符合,也与对纯度更好的黄杆菌SA-0082之岩 藻多糖酶(述于实施例5中)通过凝胶过滤分析所得分子量(约70,000) 十分符合。由此证实,大肠杆菌BL21(DE3)/pEFLA10表达fdlA编码 的多肽。

大肠杆菌提取液的含硫酸化岩藻糖多糖降解活性用参考实施例3所 述的方法测量。

结果,大肠杆菌BL21(DE3)/pEFLA10提取液的岩藻多糖降解活 性为2,300mU/ml。由此观察到fdlA编码的多肽具有岩藻多糖降解活性, 以及每1ml含有本发明基因的大肠杆菌BL21(DE3)/pEFLA10提取液 中,产生约230mU的由fdlA编码且具有含硫酸化岩藻糖多糖降解活性 的多肽。

相反,在大肠杆菌BL21(DE3)/pET21d的提取液中未见任何岩藻 多糖降解活性。

实施例6

构建了获自实施例4推定基本上编码含硫酸化岩藻糖多糖降解活性 的新肽之基因fdlB的直接表达载体。在此fdlB起始密码子位置中存在 BspHI识别位点,但由于其上游序列的影响,该位点被甲基化,从用作 宿主的大肠杆菌JM109回收的质粒不能直接被BspHI切割。因此,利用 通过PCR方法扩增的DNA片段进行构建。

在实施例4中所得质粒pH17X6-7中,来自pSFLA17的约6kbp的 XbaI片段被以如载体和fdlB基因上lac启动子相同的方向插入。首先, 将pH17X6-7于来自载体和fdlB基因内部的KpnI位点切割,自连接形 成质粒pH17X6-7K。利用pH17X6-7K作为模板,利用一对合成DNA 引物进行PCR,其中之一为合成DNA引物17X6F4(SEQ ID NO:26), 含有与位于fdlB编码区上游区域的序列相同的序列及方向,以及能与载 体退火的M13引物M4(Takara Shuzo制造)。进行PCR时,在组成成 分如实施例4-(4)的相同反应液中将包括94℃变性0.5分钟,55℃引物 退火0.5分钟以及72℃合成反应1分钟的循环进行25次,最后,将混合 物保持于72℃7分钟以结束反应。用苯酚/氯仿萃取反应液,通过乙醇沉 淀回收约1kbp的扩增片段。于位于fdlB基因起始密码子处的BspHI位 点以及位于其编码区内的MflI位点切割片段,用3%琼脂糖凝胶电泳分 离,提取并纯化,得到编码fdlB的N-末端之约450bp的BspHI-MflI片 段。

另一方面,如实施例5,于位于多克隆位点的NcoI位点以及BamHI 位点切割使用T7启动子的表达载体pET21d(Novagene制造),然后将 已准备好的编码fdlB的N-末端区域约450bp之BspHI-MflI片段插入, 构建了质粒pEFLA17-N。

然后,于位于fdlB基因的NspV位点以及于位于fdlB基因下游的 EcoRI位点切割质粒pH17X6-7,释放出编码fdlA基因的C-末端区域(包 括终止密码子)约2kbp的NspV-EcoRI片段,提取并纯化。将该片段插 入已构建的质粒pEFLA17-N之NspV与EcoRI位点间,构建了于位于 pET21dNcoI位点的起始密码子插入了全长fdlB基因的表达质粒,称为 pEFLA17。

利用如上所得质粒pEFLA17,由如实施例3的相同方法证实fdlB 编码的多肽表达以及该多肽的岩藻多糖降解活性。

首先,用pEFLA17转化大肠杆菌BL21(DE3)(由Novagene制造)。 所得大肠杆菌BL21(DE3)/pEFLA17接种于5ml含有100μg/ml氨苄 青霉素的L培养基中,37℃震荡培养。当培养物的O.D.600达到0.8时, 加入IPTG使终浓度达到1mM,再于15℃震荡培养一夜。培养结束后, 离心从培养液中收集细胞,悬浮于0.5ml的细胞裂解缓冲液,超声波处理 破碎。取出部分悬浮液用做大肠杆菌裂解液。将悬浮液进一步离心以除 去不溶物,制备大肠杆菌提取液。

大肠杆菌裂解液通过SDS聚丙烯酰胺凝胶电泳方法分析,结果在大 肠杆菌BL21(DE3)/pEFLA17的裂解液中可见一条分子量约77,000 的带(未见于大肠杆菌BL21(DE3)/pET21d裂解液中)。此分子量与 从fdlB编码的氨基酸序列(示于序列表SEQ ID NO:4)中计算的多肽分 子量(76,929)十分符合。由此证实,大肠杆菌BL21(DE3)/pEFLA17 表达fdlB编码的多肽。

大肠杆菌提取液的岩藻糖多糖降解活性用参考实施例3所述的方法 测量。

结果,大肠杆菌BL21(DE3)/pEFLA17提取液的岩藻多糖降解活 性为480mU/ml。由此观察到fdlB编码的多肽具有含硫酸化岩藻糖多糖 降解活性,以及每1ml含有本发明基因的大肠杆菌BL21(DE3)/pEFLA17 提取液中,产生约48mU的由fdlB编码且具有含硫酸化岩藻糖多糖降解 活性的多肽。

相反,在大肠杆菌BL21(DE3)/pET21d的提取液中未见任何岩藻 多糖降解活性。

实施例7

研究了实施例5和实施例6所得具有含硫酸化岩藻糖多糖降解活性 的多肽对含硫酸化岩藻糖多糖-U的作用。

将获自实施例5或实施例6的具有含硫酸化岩藻糖多糖降解活性的 多肽10μl加入如下混合物中:50μl 100mM磷酸盐缓冲液(pH7.5),50 μl 2.5%含硫酸化岩藻糖多糖-U,以及10μl 4M氯化钠,混合物保持25 ℃。于反应起始后16、40和65小时取出部分反应液,通过HPLC分析 反应产物。HPLC条件如下:

柱:Shodex SB-802.5(Showa Denko K.K.制造);

洗脱液:50mM氯化钠溶液,含有5mM叠氮钠;

检测:分光光度计(Shodex RI-71,Showa Denko K.K. 制造);

流速:1ml/分

柱温:25℃

就反应产物而言,具有如下目前已知结构的物质用做标准物质。顺 便说明,如下制备并使用具有下面式[I]至[V]的物质。

用游离型破碎机M-2(Nara Kikai Seisakusho制造)破碎干 Kjellmaniella crassifolia,于70℃下10倍体积的85%乙醇中处理2小时 并过滤。向残余物加入20倍量的水,于100℃处理混合物3小时,过滤 得到提取液。将提取液中盐浓度调整为如400mM氯化钠,向其中加入5% 氯化鲸蜡基吡啶鎓,直至无沉淀产生,离心混合物。所得沉淀用乙醇充 分洗涤以彻底除去氯化鲸蜡基吡啶鎓,然后通过超滤仪(滤膜排阻分子 量为:100,000;Amicon制造)脱盐并除去小分子量物质,通过离心除 去由此产生的沉淀。冷冻干燥上清液,从Kjellmaniella crassifolia得到 纯化的岩藻多糖。相对于干Kjellmaniella crassifolia的产率为约40%。

然后,混合600ml所述纯化的Kjellmaniella crassifolia岩藻多糖之 5%溶液、750ml 100mM磷酸盐缓冲液(pH8.0)、150ml 4M氯化钠以及 3.43ml参考实施例5中所述岩藻多糖酶溶液(1750mU/ml),于25℃反 应144小时。反应溶液用具有3500孔径的半透膜透析,收集具有3500 或更小分子量的级分。用Micro Acilyzer G3(Asahi Kasei制造)对级分脱 盐,上样于用10mM乙酸铵平衡的DEAE-Sepharose柱的离子交换层析。 用乙酸铵浓度梯度方法进行洗脱,以50ml为单位收集洗脱液。图5显示 所述层析的洗脱。结果,获得9种级分:(a)-(i),其中级分(a)、(b)、 (c)、(f)用于结构分析。

用常规方法分析级分(a)、(b)、(c)、(f)的结构,证实级分(a)、 (b)、(c)、(f)分别是由如下式[I]、[II]、[III]和[IV]所示的化合物,每 个级分用做上述反应产物的标准。

顺便说明,上述使用DEAE-Sepharose柱的离子交换层析的级分中, 级分编号42-43为(a),84-91为(b),51-52为(c),62-63为(f)。

上述反应产物分析结果表明,当使用获自实施例5中的具有含硫酸 化岩藻糖多糖降解活性的多肽时,产物仅为[I]、[II]和[III];当使用获自 实施例6中的具有含硫酸化岩藻糖多糖降解活性的多肽时,反应产物除 了上述[I]、[II]和[III]之外,还有大量[IV],即使反应进一步进行,[IV] 也不会分解为[I]。

由此发现,获自实施例5由fdlA编码的多肽与含硫酸化岩藻糖多糖- U反应,由此上述三种糖[I]、[II]和[III]被作为终切割单元释放出来;获 自实施例6由fdlB编码的多肽与含硫酸化岩藻糖多糖-U反应释放出如上 [IV]的己糖作为终切割单元。

实施例8

在实施例5和实施例6中,通过各自含有fdlA和fdlB基因的重组 大肠杆菌证实了其分别产生由所述各种基因编码的多肽,证实了从所述 大肠杆菌提取液中检测到含硫酸化岩藻糖多糖降解活性,以及由fdlA和 fdlB基因编码的多肽具有含硫酸化岩藻糖多糖降解活性。然而,当用SDS 聚丙烯酰胺凝胶电泳分析每种大肠杆菌提取液时,与大肠杆菌裂解液相 比仅产生少量重组多肽,提示在每种情况中仅有部分产生的多肽被以可 溶性多肽的形式表达。

黄杆菌SA-0082的岩藻多糖是一种分泌到细胞外的酶,假定是以一 种前体形式被表达,其中用于透过膜的分泌信号被加在N-末端。因此, 研究了fdlA和fdlB基因编码的氨基酸序列N-末端,并假定从起始密码 子至第25和第24个丙氨酸残基分别为分泌信号。由于认为存在这种疏 水性分泌信号与实施例5和实施例6中各个重组多肽的溶解性相关,故 分别构建了其中fdlA和fdlB基因的分泌信号被除去的表达质粒。

(1)首先,为了在自fdlA的起始甲硫氨酸第26位谷氨酰胺的直接 上游导入限制性酶BamHI位点,设计并合成引物FDL-Q-Bam(SEQ ID NO:27)和引物10X6R4(SEQ ID NO:28)。FDL-Q-Bam是一个28mer 的合成DNA,其中BamHI位点排列于序列表SEQ ID NO:7中碱基序列 号76-95的序列之上游;10X6R4是一个21mer的合成DNA,其与序列 表SEQ ID NO:7中碱基序列号1471-1491的序列互补。

利用实施例5中构建的pEFLA10为模板,联合引物FDL-Q-Bam 和10X6R4进行PCR。PCR中,在组成成分如实施例4-(4)的相同反 应液中将包括94℃变性0.5分钟,50℃引物退火1分钟以及72℃合成反 应2分钟的循环进行25次,最后,将混合物保持于72℃7分钟以结束反 应。反应液经琼脂糖凝胶电泳分离,提取并纯化约1.4kbp的扩增DNA 片段。通过与实施例4-(4)中相同的方法制备将所述片段插入pT7 Blue T-Vector(Novagene制造)的质粒DNA,并证实碱基序列。于位于引物 FDL-Q-Bam的BamHI位点及位于fdlA编码区的SnaBI位点切割所得 质粒,由5%聚丙烯酰胺凝胶电泳分离,所得约480bp的BamHI-SnaBI 片段编码自fdlA的起始甲硫氨酸第26位谷氨酰胺的N-末端区域,然后 将其切出、提取并纯化。

另一方面,如实施例5,于位于多克隆位点的HindIII位点切割使用 T7启动子的表达载体pET21a(Novagene制造),然后将编码fdlA基因 的C-末端(包括终止密码子)的实施例5制备的约2kbpHindIII DNA片 段如此插入,使T7启动子和fdlA基因为相同方向,籍此构建质粒 pEFDAL-C。于来自多克隆位点的BamHI位点及位于fdlA编码区中的 SnaBI位点切割质粒pEFDLA-C,以及,将已制备的约480bp的BamHI- SnaBI片段(编码自fdlA的起始甲硫氨酸第26位谷氨酰胺的N-末端区 域)插入,由此制备了质粒pEFDLA101。

此质粒pEFDLA101编码的多肽中,T7启动子下游处,序列表SEQ ID NO:3第26位及其下游与来自pET21a的14个残基之N-末端序列(SEQ ID NO:29)连接。

(2)位于用来设计引物FDL-Q-Bam的fdlA基因之第26位谷氨酰 胺后的20个碱基的序列与fdlB基因之第25位谷氨酰胺后的序列(序列 表SEQ ID NO:8的碱基序列号73-92)相同。因此,通过使用基本上相 同的方法,用于实施例8-(1)的引物FDL-Q-Bam可直接用于构建fdlB 表达载体,构建了fdlB表达载体pEFDLB101。

首先,利用引物FDL-Q-Bam进行PCR,制备了互补于序列表SEQ ID NO:8中碱基序列号1489-1508序列的20mer合成DNA 17X6R1(SEQ ID NO:30)。使用构建于实施例6的pEFLB17为模板,联合使用引物FDL- Q-Bam和17X6R1进行PCR,提取约1.4kbp的扩增DNA片段并纯化。 将片段插入pT7 Blue T-Vector制备质粒DNA,证实了其碱基序列。

然后,于位于引物FDL-Q-Bam的BamHI位点及位于fdlB编码区 的NspV位点切割所得质粒,由5%聚丙烯酰胺凝胶电泳分离,所得约 210bp的BamHI-NspV片段编码自fdlB的起始甲硫氨酸第25位谷氨酰 胺的N-末端区域,然后将其切出、提取并纯化。

另一方面,将获自实施例4的质粒于EcoRI位点切割,释放出约 2.6kbp的EcoRI片段(包括fdlB基因全长),提取并纯化。将此片段插 入pET21a多克隆位点的EcoRI位点,使T7启动子和fdlB基因为相同 方向,籍此构建质粒pEFDLB-W。于来自多克隆位点的BamHI位点及 位于fdlB编码区中的NspV位点切割质粒pEFDLB-W,以及,将已制备 的约210bp的BamHI-NspV片段(编码自fdlB的起始甲硫氨酸第25位 谷氨酰胺的N-末端区域)插入,由此制备了质粒pEFDLB101。

此质粒pEFDLB101编码的多肽中,T7启动子下游处,序列表SEQ ID NO:4第25及其下游与14个残基之N-末端先导序列(SEQ ID NO:29) (其与获自实施例8-(1)质粒pEFDLA101一致)连接。

(3)利用获自实施例8-(1)和(2)的pEFDLA101及pEFDLB101, 通过与实施例5相同的方法,培养重组子并制备细胞提取液。由此,进 行构建于实施例5和实施例6的pEFLA10与pEFLA17各自的重组多肽 之表达量及岩藻多糖降解活性的比较。

因此,用pEFLA10、pEFLA17、pEFDLA101或pEFDLB101转化 大肠杆菌BL21(DE3)。所得转化子分别接种于含有100μg/ml氨苄青 霉素的5ml L培养基中,37℃震荡培养。在培养基O.D.600为0.8的时 候加入IPTG使其终浓度为1mM,再于15℃震荡培养过夜。培养结束后, 培养基离心收集细胞,将细胞悬浮于0.5ml用于破碎细胞的缓冲液中,用 超声波处理破碎。取出部分悬浮液用做大肠杆菌裂解液。进一步离心悬 浮液除去不溶物,获得大肠杆菌提取液。

用SDS聚丙烯酰胺凝胶电泳分析每种大肠杆菌裂解液和提取液,随 后用常规方法考斯亮蓝染色,籍此在所有大肠杆菌裂解液中观察到大 量具有预计分子量的多肽。同时,通过与经过电泳的已知量的牛血清白 蛋白比较,估计表达量。利用参考实施例3所述方法测量每个提取液的 岩藻多糖降解活性。结果见表2。

表2 质粒  基因 每升培养基表达的蛋白质(mg/L) (裂解液)        (提取液)    每ml培养基(mg/ml)的活性    (提取液) pEFLA10  fdlA 5               1    200 pEFDLA101  fdlA 10              10    1300 pEFLA17  fdlB 35              *    34 pEFDLB101  fdlB 75              75    5700

*:无法估计,因为数据低于可检测的极限。  

如表2所示,关于裂解液中所含目标多肽的表达量,pEFDLA101 (fdlA)和pEFDLB101(fdlB)显示较高的产量,对任何基因的表达约 2倍于具有假定的分泌信号的直接表达质粒pEFLA10(fdlA)和pEFLA17 (fdlB),其中对pEFDLA101(fdlA)和pEFDLB101(fdlB)进行了构 建,添加了N-末端先导序列而不是假定的分泌信号序列。

已确证在具有分泌信号时,与裂解液相比在提取液中存在的目标多 肽的量极少,大多数表达的多肽为不溶形式;在除去分泌信号的情况中, 在提取液中检测到的目标多肽的量与在裂解液中的大致相当,大多数表 达多肽以溶解形式存在。此外,相应于目标多肽的存在量,在提取液中 的活性大大提高。

实施例9

研究了实施例2和实施例3所得具有含硫酸化岩藻糖多糖降解活性 的多肽对含硫酸化岩藻糖多糖-F的作用。

将获自实施例2或实施例3的具有含硫酸化岩藻糖多糖降解活性的 多肽溶液(100μl)加入如下混合物中:500μl 50mM咪唑盐酸缓冲液 (pH7.5),述于参考实施例1-(2)的50ml 2.5%含硫酸化岩藻糖多糖-F 溶液,50μl 1M氯化钙,以及75μl 4M氯化钠,加入蒸馏水使总体积为 1ml。反应于25℃进行18小时。通过HPLC分析反应产物。HPLC条件 如下:

柱:Shodex SB-804(Showa Denko K.K制造);

洗脱液:50mM氯化钠溶液,含有5mM叠氮钠;

检测:分光光度计(Shodex RI-71,Showa Denko K.K. 制造);

流速:1ml/分

柱温:25℃

对通过本发明基因编码的多肽之作用产生的反应产物的分析结果表 明,利用获自实施例2和3的具有含硫酸化岩藻糖多糖降解活性的多肽 之所有反应产物中,就HPLC的保留时间而言,检测到8.62和9.30分钟 的两个峰。

顺便说明,当获自实施例2的具有含硫酸化岩藻糖多糖降解活性的 多肽与获自实施例3的具有含硫酸化岩藻糖多糖降解活性的多肽比较时, 实施例3中产生的9.30分钟物质的量比实施例2中的量更多。

发明的优点

根据本发明,首次确定了具有含硫酸化岩藻糖多糖降解活性的多肽 的氨基酸序列和碱基序列,由此可提供具有含硫酸化岩藻糖多糖降解活 性的多肽,同时,通过遗传工程方法提供了工业化有利地制备具有含硫 酸化岩藻糖多糖降解活性的多肽的方法。

根据本发明,不需要向培养基中添加含硫酸化岩藻糖多糖诱导具有 含硫酸化岩藻糖多糖降解活性的酶产生,因此其产量高。此外,不同时 产生诸如蛋白酶和其它多糖降解酶,纯化十分方便。由于提供了具有含 硫酸化岩藻糖多糖降解活性的多肽之氨基酸和碱基序列,可基于氨基酸 序列制备具有含硫酸化岩藻糖多糖降解活性的多肽抗体,也可基于碱基 序列制备特异于具有含硫酸化岩藻糖多糖降解活性的多肽之碱基序列的 探针和引物。

                                       序列表

SEQ.ID.NO.1的信息:

序列长度:814个氨基酸

序列类型:氨基酸

链型:单链

拓扑结构:线性

分子类型:肽

SEQ.ID.NO.1的序列描述:

Met Lys Ile Arg Asn Val Cys Arg Ser Ala Val Leu Leu Gly Leu

1                 5                  10                  15

Met Ser Leu Asn Thr Tyr Ala Glu Thr Lys Ala Asp Trp Met Gln

                 20                  25                  30

Gly Asn Trp Gly Ile Ser Tyr Arg Ile Pro Gly Gly Asp Ile Asn

                 35                  40                  45

Tyr Ser Gly Ser His Val Ala Glu Tyr Asn Val Arg Ala Ala Val

                 50                  55                  60

Glu Gln Ile Ser Ala Ile Pro Gly Leu Lys Trp Val Gln Ile Asn

                 65                  70                  75

Leu Thr Asn Gly Ala Ser Gly Asp Arg Phe Ile Val Pro Val Thr

                 80                  85                  90

Glu Val Glu Ala Ile Asn Pro Leu Ser Ala Pro Asn Ser Ile Asn

                 95                 100                 105

Asp Leu Tyr Asp Pro Thr Leu Pro Gly Arg Asp Leu Phe Glu Gln

                110                 115                 120

Leu Ala Leu Ala Phe Lys Ala Lys Gly Ile Arg Val Val Ala Tyr

                125                 130                 135

Ile Ala Thr Gln Gly Pro Gly Met Leu Lys His Gly Ala Glu Asn

                140                 145                 150

Ser Met Asp Glu Asp Asp Ser Ile Thr Asp Cys Lys Ser Ser Lys

                155                 160                 165

Pro Leu Val Thr Asp Leu Asp Thr Gln Val Tyr Cys Ser Ala Asn

                170                 175                 180

Met Asn Arg Trp Arg Asp Tyr Val Leu Glu Gln Tyr Pro Ser Thr

                185                 190                 195

Ser Leu Tyr Arg Ser Phe Glu Leu Ala Met Val Asn Ile Val Glu

                200                 205                 210

Thr Leu Ser Leu Arg Tyr Gly Ser Thr Ile Asp Gly Trp Trp Phe

                215                 220                 225

Asp His Ser Gly Phe Gly Asp Ser Glu Leu Leu His Ala Ala Ala

                230                 235                 240

Leu Ala Gly Asn Asn Asp Ala Ala Val Ala Phe Asn Glu Gly Asp

                245                 250                 255

Lys Val Pro Leu Val Asn Asn Pro Glu Thr Leu Asp Asp Tyr Thr

                260                 265                 270

Phe Gly His Pro Thr Pro Ile Gly Ser Glu Val Ser Ser Asp Asp

                275                 280                 285

Lys Asn Leu Pro Met Leu Thr Ser Ile Glu Ala Thr Leu Asp Gly

                290                 295                 300

Ile Leu Thr Gly Ser Gly Asp Asp Val Gly Ser Val Gly His Met

                305                 310                 315

Phe Met Pro Leu Gln Glu Ser Trp Asn Gly Gly Thr Val Val Phe

                320                 325                 330

Ser Glu Ala Lys Gly Ser Asp Trp Leu Asn Arg Ala Leu Lys Ala

                335                 340                 345

Gly Gly Ala Phe Thr Trp Ala Leu Ser Gln Asp Ser Asn Asp Glu

                350                 355                 360

Leu Gly Gly Gly Gly Ala Arg Leu Ile Ser Glu Pro Gln Val Lys

                365                 370                 375

Met Leu Glu Arg Met Ser Phe Asn Ile Gly Lys Gln Leu His Met

                380                 385                 390

Asn Leu Asp Gly Ser Asp Gly Asp Thr Ala Tyr Asp Asp Ser Val

                395                 400                 405

Asn Gln Tyr Thr Ala Thr Val Asn Gly Ala Asn Phe Val Asp Asp

                410                 415                 420

Val Thr Arg Gly Lys Val Ala Ser Phe Thr Glu Asp Asp Gln Leu

                425                 430                 435

Glu Leu Asp Asn Tyr Gln Gly Ile Ser Gly Gly Asn Ala Arg Thr

                440                 445                 450

Thr Met Ala Trp Ile Lys Thr Ser Asp Ser Lys Gly Asp Ile Ile

                455                 460                 465

Asp Trp Gly Asn Asn Thr Thr Ser Glu Arg Trp Trp Leu Arg Leu

                470                 475                 480

Val Asp Gly Lys Phe Lys Leu Ile Leu Lys Gly Pro Asn Leu Thr

                485                 490                 495

Gly Thr Thr Thr Leu Asn Asp Asp Gln Trp His His Ile Ala Val

                500                 505                 510

Val Ala Ser Asp Asn Val Val Ala Asn Ile Lys Val Tyr Ile Asp

                515                 520                 525

Gly Val Leu Glu Thr Val Ala Val Asn Asp Asn Ala Ser Thr Thr

                530                 535                 540

Phe Asp Thr Thr Leu Gly Gly Asn Ile Gln Ile Gly Gly Ala Tyr

                545                 550                 555

Thr Gly Leu Ile Asp Lys Val Leu Val His Asp Arg Ala Leu Asp

                560                 565                 570

Glu Ser Glu Ile Glu Tyr Val Val Asn Ser Ser Asn Ala Asp Leu

                575                 580                 585

Asp Leu Glu Val Ala Leu Asp Val Arg Phe Glu Glu Ser Ala Asn

                590                 595                 600

Ser Thr Lys Val Thr Asp Asn Ser Ile Tyr Gly Arg His Gly Thr

                605                 610                 615

Asn Arg Gly Ala Ile Thr Gly Val Phe Asp Ala Glu Arg Asn Ser

                620                 625                 630

Asn Val Tyr Ser Leu Asp Gly Val Asp Ser Gly Glu Asp Ile Asn

                635                 640                 645

Asp Leu Lys Asp Ser Asp Tyr Glu His Glu Val Val Met Thr Thr

                650                 655                 660

Asp Asn Ser Lys Asp Ser Lys Gly Tyr Ser Gly Val Asn Gly Ala

                665                 670                 675

Gly Pro Arg Thr Val Met Ala Trp Ile Lys Thr Thr Phe Gly Gly

                680                 685                 690

Ala Val Ile Ala Gln Trp Gly Asn Lys Asn Ser Val Asp Gly Glu

                695                 700                 705

Gln Tyr Glu Val Arg Leu Lys Asn Gly Ala Leu Arg Leu Asp Ile

                710                 715                 720

Thr Gly Gly Ile Ile Lys Gly Thr Thr Ser Ile Asn Asp Gly Glu

                725                 730                 735

Trp His His Ile Ala Val Val Ser Pro Asp Glu Gln Leu Ala Asn

                740                 745                 750

Thr Lys Leu Tyr Val Asp Gly Val Leu Glu Thr Ala Thr Thr Ser

                755                 760                 765

Gly Ser Gln Ala Thr Ile Asp Thr Lys Thr Leu Asn Gly Asp Ser

                770                 775                 780

Lys Asp Val Ile Ile Gly Ser Thr Phe Val Gly Glu Met Asp Asp

                785                 790                 795

Phe Ile Ile His Gln Arg Ala Leu Arg Gln Phe Glu Val Lys Asn

                800                 805                 810

Ser Ala Gly Leu

SEQ.ID.NO.2的信息:

序列长度:881个氨基酸

序列类型:氨基酸

链型:单链

拓扑结构:线性

分子类型:肽

SEQ.ID.NO.2的序列描述:

Met Lys Ile Arg Asn Met Cys Cys Thr Ala Leu Ile Val Ser Leu

  1               5                  10                  15

Met Gly Cys Gly Gly Ser Gly Ser Glu Ala Ser Ser Pro Glu Val

                 20                  25                  30

Glu Val Asp Asn Gly Val Glu Ile Gln Pro Glu Pro Glu Val Glu

                 35                  40                  45

Pro Glu Pro Glu Val Glu Pro Glu Pro Glu Val Glu Pro Glu Pro

                 50                  55                  60

Glu Val Glu Pro Glu Pro Glu Val Glu Pro Glu Pro Glu Val Glu

                 65                  70                  75

Pro Glu Pro Glu Val Glu Pro Glu Pro Glu Asp Ile Arg Ala Ser

                 80                  85                  90

Trp Met Gln Gly Asn Trp Gly Ile Ser Phe Arg Ile Ser Gly Gly

                 95                 100                 105

Asp Ile Ser Gln Asn Glu Ser His Val Asn Glu Tyr Gln Val Ala

                110                 115                 120

Pro Ala Val Glu Gln Ile Ala Ala Ile Pro Gly Leu Lys Trp Leu

                125                 130                 135

Gln Val Asn Leu Ser Asn Gly Ala Phe Gly Asp Arg Phe Ile Val

                140                 145                 150

Pro Val Pro Glu Val Glu Ala Ile Asn Pro Asn Ser Ala Pro Asn

                155                 160                 165

Ser Ser Ala Asp Leu Phe Asp Pro Ala Leu Pro Gly Asp Asp Leu

                170                 175                 180

Phe Glu Gln Ile Ala Leu Gly Leu Gln Ala Lys Gly Ile Lys Val

                185                 190                 195

Val Ala Tyr Ile Ala Thr Gln Gly Pro Ala Met Leu Lys His Gly

                200                 205                 210

Ala Glu Arg Ser Met Asp Phe Asp Asp Ser Ile Val Asp Glu Ser

                215                 220                 225

Asp Gly Ser Ala Cys Lys Ser Ser Arg Pro Val Val Ser Asp Pro

                230                 235                 240

Asp Thr Gln Val Tyr Cys Ser Ala Asn Met Asn Arg Trp Arg Asp

                245                 250                 255

Tyr Val Leu Gln Gln Tyr Pro Ser Thr Ser Leu His His Ser Phe

                260                 265                 270

Gln Leu Gly Leu Val Asn Ile Val Glu Thr Leu Ser Leu Arg Tyr

                275                 280                 285

Gly Thr Leu Ile Asp Gly Trp Trp Phe Asp His Ser Ile Tyr Gly

                290                 295                 300

Asp Tyr Asn Leu Leu Pro Asp Ala Ala Arg Ala Gly Asn Ser Asn

                305                 310                 315

Ala Ala Val Ser Leu Asn Leu Glu Gly Asp Ile Phe Leu Ser Asn

                320                 325                 330

Asn Pro Glu Val Met Glu Asp Phe Thr Gly Gly His Pro Thr Pro

                335                 340                 345

Ile Ala Arg Val Val Ser Ser Asp Asp Thr Asn Leu Pro Met Leu

                350                 355                 360

Thr Ala Ile Glu Asp Ala Pro Asn Gly Ile Phe Thr Gly Thr Gly

                365                 370                 375

Asp Asp Val Asp Ala Leu Gly His Met Phe Leu Pro Leu Gln Glu

                380                 385                 390

Thr Trp Asn Gly Gly Thr Val Val Phe Ser Glu Ala Lys Gly Thr

                395                 400                 405

Glu Trp Leu Asn Arg Val Thr Arg Ala Gly Gly Ala Leu Thr Trp

                410                 415                 420

Ala Leu Ser His Glu Gly Ser Val Ser Gly Gly Glu Ala Met Leu

                425                 430                 435

Ile Ser Ala Pro Gln Ala Lys Met Leu Ala Arg Met Gln Leu Asn

                440                 445                 450

Ile Gly Lys Gln Leu Asp Met Asp Leu Asp Gly Ala Asp Gly Ala

                455                 460                 465

Thr Ala Tyr Asp Asp Ser Val Asn Gln His Thr Ala Thr Val Thr

                470                 475                 480

Gly Ala Thr Phe Ile Asp Asp Val Thr Arg Glu Lys Val Ala Ser

                485                 490                 495

Phe Thr Glu Thr Asp Leu Ile Thr Leu Asn Asn Phe Thr Gly Ile

                500                 505                 510

Leu Gly Glu Ser Ala Arg Thr Thr Met Ala Trp Ile Lys Thr Ser

                515                 520                 525

Asp Ser Asn Ala Asp Val Ile Gln Trp Gly Lys Gln Glu Thr Ser

                530                 535                 540

Glu Ala Trp Tyr Val Gly Leu Asp Asn Gly Ile Leu Gln Leu Asn

                545                 550                 555

Ile Gln Gly Ser Thr Val Ile Gly Ala Ser Val Leu Asn Asp Asp

                560                 565                 570

Ser Trp His His Ile Ala Val Ile Ala Pro Asp Asn Ser Ile Ala

                575                 580                 585

Asn Thr Gln Val Tyr Ile Asp Gly Val Leu Glu Thr Leu Thr Val

                590                 595                 600

Asn Asp Gly Gly Ser Ser Thr Phe Asn Thr Val Ala Asp Thr Asn

                605                 610                 615

Val Val Ile Gly Gly Glu Phe Thr Gly Leu Ile Asp Lys Thr Val

                620                 625                 630

Val Tyr Asn Arg Ala Leu Glu Glu Ser Glu Ile Asp Tyr Ile Val

                635                 640                 645

Asn Ser Ala Asp Ala Asp Ile Asp Leu Gly Ile Ser Leu Asp Val

                650                 655                 660

Arg Phe Asp Glu Asp Ala Asn Ala Thr Thr Val Ala Asp Asn Ser

                665                 670                 675

Ala Tyr Glu Arg Ser Gly Ile Asn Arg Gly Ala Ile Thr Gly Val

                680                 685                 690

Phe Asp Ala Thr Arg Asn Ser Asn Val Tyr Ser Leu Asp Gly Val

                695                 700                 705

Asp Ser Gly Glu Asp Leu Asp Asp Leu Ile Asp Ser Asp Tyr Glu

                710                 715                 720

His Gln Ile Val Met Thr Thr Asn Asn Lys Arg Asp Asn Lys Gly

                725                 730                 735

Tyr Ser Gly Val Asn Gly Gly Asp Pro Arg Thr Val Met Ala Trp

                740                 745                 750

Ile Lys Thr Thr Phe Gly Gly Ala Val Ile Ala Gln Trp Gly Asn

                755                 760                 765

Lys Asp Ser Val Asp Gly Glu Gln Tyr Glu Val Arg Leu Lys Asn

                770                 775                 780

Gly Glu Leu Arg Val Asp Ile Thr Gly Gly Leu Ile Lys Gly Thr

                785                 790                 795

Thr Leu Ile Asn Asp Gly Glu Trp His His Ile Ala Val Val Ser

                800                 805                 810

Pro Asp Asp Gln Leu Ala Asn Thr Lys Leu Tyr Val Asp Gly Val

                815                 820                 825

Leu Glu Thr Thr Thr Thr Ser Gly Ser Gln Thr Thr Ile Asp Thr

                830                 835                 840

Leu Thr Leu Asn Gly Asp Ser Lys Asp Val Ile Ile Gly Ser Thr

                845                 850                 855

Phe Val Gly Glu Met Asp Asn Phe Val Ile His Gln Arg Ala Leu

                860                 865                 870

Lys Gln Phe Glu Val Lys Val Ala Ala Gly Ile

                875                 880

SEQ.ID.NO.3的信息:

序列长度:697个氨基酸

序列类型:氨基酸

链型:单链

拓扑结构:线性

分子类型:肽

SEQ.ID.NO.3的序列描述:

Met Ile Lys Lys Tyr Asn Leu Ile Lys Thr Gly Val Ile Thr Phe

  1               5                  10                  15

Leu Val Leu Phe Phe Gln Gln Thr Tyr Ala Gln Thr Thr Thr Val

                 20                  25                  30

Tyr Ser Leu Glu Asp Leu Leu Pro Tyr Leu Lys Gln Asp Asn Val

                 35                  40                  45

Asp Val Lys Leu Ala Pro Gly Thr Tyr Asn Val Asn Gly Phe Asp

                 50                  55                  60

Val Gly Glu Asp Arg Leu Phe Ser Thr Thr Pro Leu Phe Leu Phe

                 65                  70                  75

GIu Gly Ser Asn Ser Thr Tyr Asp Phe Thr Asp Val Lys Leu Asn

                 80                  85                  90

Ile Asn Thr Val Val Leu Thr Lys Phe Gly Asn Asn Glu Val Asn

                 95                 100                 105

Glu Ile Gln Ile Leu Gly Asn Asn Asn Val Leu Lys Asn Leu Lys

                110                 115                 120

Leu Glu Asp Ile Gly Thr Thr Ala Pro Ser Asn Arg Ala Gln Ser

                125                 130                 135

Ile Val Ile Asp Gly Arg Asp Asn Arg Ile Glu Gly Phe His Leu

                140                 145                 150

Thr Ile Arg Gly Ser Tyr Pro Tyr Gly Tyr Gly Asp Ala Phe Gly

                155                 160                 165

Lys Gly Gly Gly Ser Val Ile Asn His Arg Lys His Ser Gly Val

                170                 175                 180

Leu Ile Arg Gly Leu Arg Asn His Leu Lys Asp Cys Thr Ile Ile

                185                 190                 195

Ser Arg Ser Tyr Gly His Ile Val Phe Met Gln Ala Ala Ser Tyr

                200                 205                 210

Pro Thr Val Glu Gly Cys Tyr Ile Glu Gly Glu Met Arg Ser Thr

                215                 220                 225

Asp Asp Met Leu Ala Glu Glu Gly Thr Gly Ser Pro Ala Asp Lys

                230                 235                 240

Val Asp Phe Met Thr Val Trp Gly Tyr Lys Leu Pro Ala Gly Tyr

                245                 250                 255

Met Met Ser Leu Gln Glu Gly Gly Ile Arg Ala Tyr Asn Ala Gly

                260                 265                 270

Thr Thr Tyr Ile Asp Gly Val Glu Ile Gln Arg Ala Thr Asp Asn

                275                 280                 285

Pro Thr Val Leu Asn Cys Thr Ile Lys Asn Ala Arg Thr Gly Val

                290                 295                 300

Thr Leu Ala His Ala Asn Gly Thr Lys Tyr Val Glu Gly Cys Thr

                305                 310                 315

Val Leu Gly Cys Glu Asn Gly Tyr Ser Ile Gly Ser Gly Thr Val

                320                 325                 330

Val Asn Cys Gly Ala Asp Ala Ile Tyr Gly Pro Val Phe Lys Asn

                335                 340                 345

Thr Tyr Gly Ser Asp Lys Gly Tyr Asn Ala Asp Ile Thr Ile Leu

                350                 355                 360

Pro Pro Ser Asp Ala Tyr Tyr Asn Gly His Asp Ala Val Ala Tyr

                365                 370                 375

Ile Gly Gly Ser Asn His Asn Leu Thr Phe Arg Ser Glu Ile Thr

                380                 385                 390

Glu Ile Pro Ser Asn Leu Lys Ile Met Val Ser Gly Asp Leu Gln

                395                 400                 405

Gly Leu Arg Val Leu His Gly Ser Asn Pro Ser Gln Asn Asn Phe

                410                 4l5                 420

Ala Gly Thr Asn Ile Val Leu Arg Asn Leu Thr Asn Phe Pro Val

                425                 430                 435

Asp Leu His Ser Asp Ser Ser Asn Ile Thr Val Thr Ser Cys Asp

                440                 445                 450

Thr Asp Asn Ile Thr Asp Asn Gly Thr Asn Asn Ser Ile Glu Ala

                455                 460                 465

Ile Asp Cys Asp Ser Asp Asn Leu Ala Leu Lys Gly Glu Ala Ser

                470                 475                 480

Gln Ser Ser Ser Arg Pro Ser Asp Gly Phe Ala Ala Asn Ala Ile

                485                 490                 495

Asp Gly Asn Thr Asn Gly Ala Trp Ser Asn Asn Ser Val Ser His

                500                 505                 510

Thr Gly Thr Glu Glu Asn Pro Trp Trp Gln Val Asp Leu Gly Thr

                515                 520                 525

Asp Ala Ile Ile Gly Ser Ile Asn Ile Phe Asn Arg Thr Asp Gly

                530                 535                 540

Cys Cys Lys Gly Arg Leu Asp Asn Phe Thr Val Tyr Val Ile Asp

                545                 550                 555

Lys Asp Asp Lys Val Thr Phe Ser Lys Thr Tyr Val Thr Val Pro

                560                 565                 570

Asp Pro Ser Ile Thr Val Asp Ala Gly Gly Val Asn Gly Lys Ile

                575                 580                 585

Val Lys Ile Val Leu Asn Asn Ser Ser Gln Ala Leu Ala Leu Ala

                590                 595                 600

Glu Val Glu Val Tyr Gly Thr Ser Leu Ser Asn Lys Glu Thr Ile

                605                 610                 615

Lys Asn Pro Ile His Phe Tyr Pro Asn Pro Val Glu Asp Glu Val

                620                 625                 630

Thr Ile Ser Leu Glu Ser Ala Asp Leu Asn Leu Asn Glu Thr Arg

                635                 640                 645

Val Val Ile Tyr Asn Ile Lys Gly Gln Lys Ile Leu Glu Thr Thr

                650                 655                 660

Pro Ser Asn Ser Thr Glu Val Asn Leu Asn Leu Ser His Leu Pro

                665                 670                 675

Thr Gly Val Tyr Leu Ile Arg Val Ser Asp Gln Asn Lys Asn Ile

                680                 685                 690

Ile Asn Lys Ile Val Lys Leu

                695

SEQ.ID.NO.4的信息:

序列长度:704个氨基酸

序列类型:氨基酸

链型:单链

拓扑结构:线性

分子类型:肽

SEQ.ID.NO.4的序列描述:

Met Lys Lys Tyr Ser Ile Leu Lys Ile Gly Ile Ile Ala Val Ile

  1               5                  10                  15

Met Leu Phe Val Gln Gln Ser Tyr Ala Gln Thr Thr Thr Val Tyr

                 20                  25                  30

Ser Leu Glu Asp Leu Leu Pro Tyr Leu Lys Gln Asp Asn Val Asp

                 35                  40                  45

Val Lys Leu Ala Pro Gly Thr Tyr Asn Ile Asn Ala Phe Asp Ile

                 50                  55                  60

Thr Gln Gly Lys Phe Ser Asn Pro Leu Phe Leu Phe Glu Gly Ser

                 65                  70                  75

Asn Asn Thr Phe Asp Phe Thr Asp Val Lys Ile Asn Ile Asn Thr

                 80                  85                  90

Leu Val Leu Thr Lys Phe Gly Asn Asn Glu Val Asn Glu Ile Gln

                 95                 100                 105

Ile Leu Gly Asn Asn Asn Val Leu Lys Asn Leu Lys Leu Glu Asp

                110                 115                 120

Ile Gly Thr Thr Ala Pro Ser Asn Arg Ala Gln Ser Ile Ile Met

                125                 130                 135

Asp Gly Arg Asp Asn Arg Ile Glu Gly Phe His Leu Thr Ile Arg

                140                 145                 150

Gly Ser Tyr Pro Tyr Gly Tyr Gly Asp Ala Phe Gly Lys Gly Gly

                155                 160                 165

Gly Ser Val Ile Asn His Arg Lys His Ser Gly Val Leu Ile Arg

                170                 175                 180

Gly Leu Arg Asn His Leu Lys Asp Cys Thr Ile Ile Ser Arg Ser

                185                 190                 195

Tyr Gly His Ile Val Phe Met Gln Ala Ala Ser Tyr Pro Thr Val

                200                 205                 210

Glu Gly Cys Tyr Ile Glu Gly Glu Met Arg Ser Thr Asp Asp Met

                215                 220                 225

Leu Ala Glu Glu Gly Thr Gly Ser Pro Ala Asp Asn Val Asp Phe

                230                 235                 240

Met Thr Val Trp Gly Tyr Lys Leu Pro Ala Gly Tyr Met Met Ser

                245                 250                 255

Leu Gln Glu Gly Gly Ile Arg Ala Tyr Asp Ala Gly Thr Thr Tyr

                260                 265                 270

Ile Asp Gly Glu Val Ile Gln Arg Ala Thr Asp Asn Pro Thr Val

                275                 280                 285

Leu Asn Cys Thr Ile Lys Asn Ala Arg Thr Gly Val Thr Leu Ala

                290                 295                 300

His Ala Lys Gly Thr Lys His Val Glu Asn Val Lys Ala Ile Gly

                305                 310                 315

Cys Glu Gln Gly Tyr Ser Ile Gly Ser Gly Thr Val Ser Asn Cys

                320                 325                 330

Ser Gly Asp Ala Gln Tyr Gly Pro Leu Leu Ser Phe Ala Tyr Ser

                335                 340                 345

Ser Asp Lys Asn Thr Asn Ile Asp Ile Glu Val Leu Pro Ala Glu

                350                 355                 360

Asn Tyr Tyr Asn Gly Ser Glu Thr Ala Ala Tyr Val Gly Gly His

                365                 370                 375

Ser His Asn Ile Thr Leu Arg Gly Gly Asp Pro Asn Ala Asp Leu

                380                 385                 390

Arg Val Gln Val Gly Gly Glu Lys Asn Asn Val Arg Leu Leu Gly

                395                 400                 405

Val Thr Ser Asn Gln Asn Pro Leu Ser Ala Ser Asn Leu Glu Leu

                410                 415                 420

Asn Asn Leu Thr Asn Phe Pro Val Val Leu Asp Glu Met Ser Ser

                425                 430                 435

Asn Ile Ile Val Glu Ser Cys Gly Glu Val Thr Asn Asn Gly Ser

                440                 445                 450

Asn Asn Ser Ile Thr Asp Cys Pro Asp Gly Pro Ile Ser Phe Pro

                455                 460                 465

Asp Ser Ser Lys Ala Tyr Arg Leu Gly Asn Asn Arg Phe Thr Phe

                470                 475                 480

Trp Val Ala Ala Asn Gly Gly Asp His Ala Tyr Ser Ile Lys Tyr

                485                 490                 495

Asn Asp Gly Ile Ser Gly Asn Ile Asn Asp Tyr Glu Asp Leu Phe

                500                 505                 510

Pro Glu Gly Glu Glu Ser Phe Trp Val Phe Thr Pro Val Glu Gly

                515                 520                 525

Arg Asp Gly Tyr Phe Phe Val Asp Cys Val Gly Gly Gly Asp Lys

                530                 535                 540

Gln Arg Leu Ser Ala Thr Thr Asp Ser Gly Leu Pro Val Met Val

                545                 550                 555

Ser Lys Thr Ile Thr Ser Ala Ser Val Gln Trp Ser Val Val Gln

                560                 565                 570

Pro Glu Gly Arg Asp Thr Phe His Ile Thr Asn Asp Tyr Ala Arg

                575                 580                 585

Met Val Gly Ala Asn Thr Thr Thr Asn Gln Thr Ile Leu Ser Thr

                590                 595                 600

Val Gly Asn Thr Ser Asn Gln Ser Arg Phe Glu Val Leu Glu Val

                605                 610                 615

Ser Asn Tyr Ser Leu Ser Ile Lys Asn Asp Ile Leu Asn Asn Asn

                620                 625                 630

Ile Thr Val Phe Pro Ile Pro Thr Ser Asp Ile Leu Asn Ile Asn

                635                 640                 645

Leu Lys Asn Met Glu Ser Val Thr Val Glu Leu Tyr Asn Ser Ile

                650                 655                 660

Gly Gln Lys Ile Leu Ser Lys Glu Ile Lys Gln Gly Glu Asn Thr

                665                 670                 675

Leu Asn Leu Ser Gly Ile Tyr Thr Gly Val Tyr Leu Leu Lys Leu

                680                 685                 690

Asn Asp Gly Gln Asn Ser Tyr Thr Lys Arg Ile Ile Met Lys

                695                 700

SEQ.ID.NO.5的信息:

序列长度:2442个碱基对

序列类型:核酸

链型:双链

拓扑结构:线性

分子类型:DNA(基因组)

初始来源:

  生物:交替单胞菌属的种

  菌株:SN-1009

SEQ.ID.NO.5的序列描述:

ATGAAAATAC GTAATGTTTG TCGTAGTGCG GTGCTTTTAG GCTTGATGTC TTTAAATACA   60

TACGCAGAAA CAAAAGCTGA TTGGATGCAA GGTAACTGGG GGATCAGTTA TCGAATACCT  120

GGAGGAGATA TTAATTACTC AGGTAGTCAT GTTGCAGAAT ACAATGTAAG AGCCGCAGTT  180

GAACAAATCT CAGCAATTCC TGGTTTGAAG TGGGTACAAA TTAATTTAAC CAACGGTGCA  240

TCTGGTGATC GTTTTATAGT CCCTGTAACA GAAGTTGAAG CCATTAATCC TTTATCCGCT  300

CCTAACAGTA TTAATGACTT ATACGATCCT ACTTTACCTG GGCGAGATCT TTTTGAGCAA  360

CTGGCATTAG CCTTCAAAGC TAAAGGCATA AGAGTTGTTG CTTATATTGC GACTCAAGGG  420

CCTGGCATGC TCAAGCATGG TGCTGAAAAC TCGATGGATG AAGATGACTC CATTACTGAC  480

TGTAAATCGT CTAAGCCATT AGTAACCGAT CTTGATACAC AAGTTTACTG TTCAGCAAAT  540

ATGAATCGCT GGAGAGATTA CGTTTTAGAA CAATACCCAT CAACCAGTCT TTATAGAAGT  600

TTTGAATTGG CAATGGTCAA TATTGTAGAA ACATTATCAC TGCGTTATGG AAGTACAATT  660

GATGGCTGGT GGTTTGATCA TTCAGGTTTT GGTGACAGTG AATTACTTCA TGCTGCGGCT   720

CTAGCTGGAA ATAATGATGC GGCAGTAGCC TTTAATGAAG GCGATAAAGT TCCTTTGGTA   780

AATAACCCAG AGACATTAGA CGATTACACC TTTGGTCATC CAACACCTAT AGGTAGTGAG   840

GTTTCTTCTG ATGATAAAAA CCTACCTATG TTAACGTCTA TAGAAGCTAC TTTAGATGGT   900

ATTTTAACTG GTTCAGGTGA TGATGTAGGC TCTGTGGGAC ATATGTTTAT GCCACTTCAA   960

GAAAGTTGGA ATGGTGGCAC TGTTGTATTT TCTGAAGCGA AAGGATCTGA CTGGCTTAAT  1020

CGAGCATTAA AAGCCGGAGG TGCATTTACA TGGGCACTAA GCCAAGACAG TAATGATGAG  1080

TTAGGTGGTG GCGGAGCAAG ATTAATTTCA GAACCGCAGG TAAAAATGCT TGAACGTATG  1140

AGTTTTAATA TAGGTAAACA ATTACATATG AATCTAGATG GTTCAGATGG TGATACTGCT  1200

TATGATGACT CCGTCAACCA ATATACCGCT ACTGTAAACG GTGCTAATTT TGTTGATGAT  1260

GTTACAAGAG GAAAAGTTGC AAGTTTTACT GAAGACGACC AGTTAGAACT AGACAATTAT  1320

CAAGGTATTT CAGGTGGAAA TGCGCGTACA ACCATGGCTT GGATAAAAAC TTCAGACAGC  1380

AAAGGCGATA TTATTGATTG GGGTAATAAC ACAACAAGCG AACGTTGGTG GTTACGTTTA  1440

GTTGACGGTA AATTTAAACT GATATTAAAA GGTCCTAATC TTACAGGAAC TACAACACTT  1500

AATGACGACC AATGGCACCA TATTGCTGTT GTAGCTTCTG ATAACGTAGT TGCTAATATC  1560

AAAGTATACA TTGATGGTGT TTTAGAAACT GTTGCTGTAA ATGACAATGC TTCAACTACC  1620

TTCGATACAA CCTTAGGTGG CAATATACAA ATAGGTGGGG CCTACACCGG ACTTATCGAT  1680

AAAGTGCTTG TGCATGATAG AGCATTAGAT GAAAGCGAGA TTGAGTATGT TGTTAATTCA  1740

TCCAATGCTG ATCTTGATTT AGAGGTTGCA TTAGATGTGC GTTTTGAAGA GTCAGCAAAC  1800

TCAACTAAAG TAACCGATAA TTCTATATAT GGACGTCATG GCACAAATCG AGGTGCTATT  1860

ACTGGCGTGT TTGATGCAGA ACGTAACAGC AATGTGTACT CACTTGATGG TGTTGATAGT  1920

GGCGAAGATA TAAATGATTT AAAAGATAGC GACTACGAAC ATGAAGTTGT AATGACAACA  1980

GATAATTCTA AAGACTCAAA AGGTTATAGT GGAGTTAATG GTGCAGGTCC GCGTACTGTA  2040

ATGGCATGGA TAAAAACAAC TTTTGGCGGT GCTGTTATTG CCCAATGGGG TAATAAAAAT  2100

TCAGTTGATG GCGAACAATA TGAAGTTCGT TTAAAAAATG GTGCACTGAG ATTAGATATT  2160

ACAGGTGGCA TTATTAAAGG CACAACATCA ATTAATGATG GCGAGTGGCA TCATATTGCT  2220

GTGGTTTCAC CTGATGAACA GTTAGCTAAT ACTAAATTGT ATGTTGATGG TGTACTAGAA  2280

ACAGCAACCA CTTCGGGTTC TCAAGCAACG ATTGATACTA AAACTCTTAA TGGCGATAGC  2340

AAAGACGTAA TAATTGGTAG TACGTTTGTT GGCGAGATGG ACGATTTTAT TATTCATCAA  2400

CGCGCTTTAA GACAGTTTGA AGTGAAAAAC TCAGCAGGAC TC                     2442

SEQ.ID.NO.6的信息:

序列长度:2643个碱基对

序列类型:核酸

链型:双链

拓扑结构:线性

分子类型:DNA(基因组)

初始来源:

  生物:交替单胞菌属的种

  菌株:SN-1009

SEQ.ID.NO.6的序列描述:

ATGAAAATAC GTAATATGTG TTGTACTGCT TTAATCGTAA GTTTAATGGG CTGCGGTGGT   60

TCTGGTTCAG AAGCTAGTTC TCCTGAAGTA GAAGTTGATA ATGGAGTAGA AATTCAACCT  120

GAACCAGAAG TTGAACCTGA GCCAGAAGTT GAACCTGAAC CAGAAGTTGA ACCTGAACCA  180

GAAGTTGAAC CTGAACCAGA AGTTGAACCT GAGCCAGAAG TTGAGCCTGA ACCAGAAGTT  240

GAACCTGAAC CAGAAGATAT AAGAGCCTCA TGGATGCAAG GTAACTGGGG AATCAGCTTC  300

AGAATTTCTG GTGGTGACAT CAGTCAAAAT GAAAGTCATG TAAATGAATA CCAAGTAGCA  360

CCAGCTGTTG AGCAAATAGC CGCAATTCCT GGATTAAAGT GGTTACAAGT TAATTTAAGT  420

AACGGGGCTT TTGGCGACCG TTTTATTGTA CCTGTACCTG AAGTAGAAGC TATTAATCCA  480

AATTCAGCGC CAAACAGCTC GGCAGATTTA TTTGATCCTG CATTACCTGG CGATGACTTA  540

TTTGAACAAA TAGCACTAGG ACTTCAAGCC AAAGGCATAA AAGTAGTAGC ATATATTGCG  600

ACTCAAGGTC CTGCAATGCT GAAACATGGC GCAGAAAGAT CGATGGATTT TGATGATTCT  660

ATTGTTGATG AATCAGATGG CAGTGCTTGT AAATCTTCAA GACCTGTCGT TTCTGATCCT  720

GATACGCAAG TTTATTGTTC AGCAAATATG AATCGCTGGA GAGATTATGT GTTACAGCAA  780

TACCCATCAA CAAGTTTGCA TCATAGTTTT CAATTGGGAC TCGTCAATAT TGTAGAAACT  840

TTATCACTAC GTTACGGCAC TCTGATTGAT GGTTGGTGGT TTGATCATTC TATTTACGGT   900

GACTACAACT TACTTCCTGA TGCTGCAAGA GCGGGAAATA GCAATGCTGC GGTTTCTCTT   960

AATTTAGAAG GGGATATTTT CTTAAGTAAT AACCCAGAAG TGATGGAGGA TTTTACCGGC  1020

GGACATCCAA CACCGATTGC TCGAGTTGTT TCATCTGATG ATACCAATTT ACCCATGTTA  1080

ACGGCTATAG AAGATGCTCC AAACGGTATT TTTACAGGAA CAGGTGATGA TGTAGATGCT  1140

TTAGGGCACA TGTTTTTACC GCTGCAAGAA ACCTGGAATG GCGGAACTGT AGTATTTTCA  1200

GAAGCCAAAG GAACTGAGTG GCTTAACAGA GTTACTCGAG CTGGCGGCGC ATTAACTTGG  1260

GCATTAAGCC ATGAAGGCAG TGTTTCTGGT GGTGAGGCTA TGTTGATTTC TGCACCACAA  1320

GCAAAAATGC TTGCACGTAT GCAGCTAAAT ATTGGTAAAC AACTCGATAT GGATTTAGAT  1380

GGTGCCGATG GCGCTACGGC TTATGATGAT TCTGTCAATC AACATACAGC TACGGTTACA  1440

GGTGCGACAT TTATAGATGA TGTTACTCGT GAAAAAGTGG CAAGCTTTAC TGAAACAGAT  1500

CTGATTACGT TAAACAATTT TACTGGTATT TTAGGCGAAA GTGCTCGTAC AACAATGGCT  1560

TGGATAAAAA CATCAGACAG TAACGCAGAT GTTATTCAAT GGGGTAAACA AGAGACGAGT  1620

GAAGCTTGGT ATGTGGGCTT AGACAATGGA ATACTTCAAT TAAATATTCA AGGTTCTACG  1680

GTTATTGGCG CAAGTGTACT TAACGATGAT AGTTGGCATC ATATTGCTGT TATCGCGCCT  1740

GATAATTCAA TTGCCAATAC TCAAGTCTAT ATCGATGGTG TTTTAGAAAC ACTTACCGTG  1800

AATGATGGTG GTTCATCTAC ATTTAATACA GTGGCAGACA CCAACGTTGT AATAGGAGGA  1860

GAGTTTACTG GCCTTATAGA TAAAACCGTT GTGTATAACA GAGCATTAGA AGAAAGCGAG  1920

ATTGATTATA TTGTTAATTC AGCTGACGCA GATATTGATT TAGGTATTTC ACTTGATGTG  1980

AGGTTTGATG AAGATGCTAA TGCAACAACA GTAGCTGATA ATTCTGCCTA TGAACGTTCA  2040

GGTATAAATC GAGGTGCCAT TACGGGCGTT TTTGATGCAA CACGTAACAG CAATGTTTAT  2100

TCACTTGATG GTGTTGATAG CGGCGAAGAT CTAGATGATT TAATAGATAG TGATTATGAG  2160

CATCAAATTG TTATGACAAC CAATAACAAA AGAGATAACA AAGGTTATAG TGGCGTGAAT  2220

GGCGGTGATC CTCGAACTGT TATGGCATGG ATAAAAACAA CCTTTGGTGG TGCTGTTATT  2280

GCTCAATGGG GTAATAAAGA TTCAGTCGAT GGCGAACAAT ATGAAGTGCG CTTGAAAAAT  2340

GGCGAACTTA GAGTCGATAT CACTGGCGGG CTTATTAAAG GAACAACATT AATAAACGAT  2400

GGCGAATGGC ATCATATTGC TGTTGTATCT CCTGATGATC AATTAGCTAA CACTAAACTT  2460

TATGTTGATG GTGTTCTAGA AACGACCACC ACCTCCGGCT CTCAAACAAC AATAGATACG  2520

TTAACCCTTA ACGGTGACAG CAAAGACGTA ATCATTGGAA GTACTTTTGT TGGCGAGATG  2580

GATAACTTTG TTATTCATCA ACGTGCTTTA AAACAATTTG AAGTAAAAGT CGCCGCAGGT  2640

ATT                                                                2643

SEQ.ID.NO.7的信息:

序列长度:2091个碱基对

序列类型:核酸

链型:双链

拓扑结构:线性

分子类型:DNA(基因组)

初始来源:

  生物:黄杆菌属的种

  菌株:SA-0082

SEQ.ID.NO.7的序列描述:

ATGATAAAAA AATACAATTT AATTAAAACA GGAGTTATTA CATTTCTAGT TTTGTTTTTT   60

CAGCAAACTT ACGCACAAAC AACCACAGTA TATTCTTTAG AAGACTTACT ACCCTATTTA  120

AAACAGGATA ATGTAGATGT TAAATTAGCC CCAGGAACTT ATAATGTTAA TGGTTTTGAT  180

GTAGGTGAAG ACAGGTTGTT TTCCACTACT CCACTTTTTT TGTTTGAAGG GTCTAACAGT  240

ACTTATGACT TTACAGATGT AAAGCTTAAC ATCAATACGG TTGTGTTAAC CAAGTTTGGA  300

AATAATGAGG TTAATGAAAT TCAGATTTTA GGAAATAACA ATGTTCTTAA AAACTTAAAA  360

CTAGAAGATA TTGGAACAAC AGCTCCTTCT AACAGAGCTC AGTCTATTGT TATAGATGGG  420

CGAGACAATA GAATAGAAGG TTTTCATTTA ACCATTAGAG GATCTTACCC TTATGGATAT  480

GGAGATGCTT TTGGAAAAGG AGGAGGTTCC GTAATTAATC ACCGAAAACA TTCAGGTGTT  540

TTAATAAGAG GATTACGTAA TCACCTAAAA GATTGTACCA TTATTTCTCG TTCTTATGGG  600

CATATAGTAT TCATGCAAGC AGCAAGTTAC CCAACTGTGG AAGGTTGTTA TATTGAAGGT  660

GAAATGCGTT CAACCGATGA TATGTTGGCA GAAGAAGGAA CAGGTTCTCC AGCAGATAAA  720

GTAGATTTTA TGACGGTTTG GGGATATAAG TTACCAGCTG GTTATATGAT GAGTTTACAA  780

GAAGGAGGAA TTAGAGCATA TAATGCAGGA ACCACTTATA TTGATGGAGT AGAGATTCAA   840

CGAGCAACAG ACAACCCTAC CGTTCTAAAT TGTACTATTA AAAATGCAAG AACAGGAGTA   900

ACATTAGCAC ATGCAAATGG AACAAAATAT GTTGAGGGTT GTACTGTTTT AGGATGTGAA   960

AATGGATACT CCATAGGAAG TGGAACTGTA GTAAACTGTG GAGCAGATGC TATTTATGGA  1020

CCTGTATTTA AAAATACATA CGGAAGCGAT AAAGGGTACA ATGCAGACAT TACCATTTTG  1080

CCACCTAGTG ATGCTTACTA CAACGGACAT GATGCTGTAG CATACATTGG AGGATCAAAT  1140

CATAACCTTA CTTTTAGAAG TGAAATAACA GAAATTCCAA GCAATTTAAA AATTATGGTC  1200

TCTGGAGATT TACAAGGATT AAGAGTATTG CATGGAAGTA ATCCTAGTCA GAATAATTTT  1260

GCTGGAACCA ACATTGTTTT AAGAAATTTA ACAAACTTTC CTGTAGACTT ACATTCAGAC  1320

AGTTCTAATA TAACTGTTAC TTCTTGTGAT ACGGATAATA TTACAGACAA TGGTACAAAT  1380

AATAGTATTG AAGCTATAGA TTGCGATTCG GATAATTTAG CTTTAAAAGG AGAAGCTAGT  1440

CAATCATCCT CTCGTCCAAG TGATGGTTTT GCAGCAAATG CCATTGATGG AAATACAAAT  1500

GGGGCATGGT CAAACAATTC TGTTTCTCAT ACGGGTACAG AAGAAAATCC ATGGTGGCAA  1560

GTAGATTTAG GAACAGATGC TATTATAGGT AGCATCAATA TTTTTAACAG AACAGATGGT  1620

TGTTGTAAAG GTAGATTAGA TAATTTTACT GTTTACGTGA TAGATAAAGA TGATAAGGTT  1680

ACATTTTCTA AAACCTATGT TACCGTTCCA GATCCGTCTA TAACTGTTGA TGCAGGTGGT  1740

GTGAATGGAA AAATTGTAAA AATTGTTTTG AATAACAGTT CACAGGCTTT GGCTTTAGCA  1800

GAGGTAGAAG TGTACGGAAC GTCTTTGTCT AATAAAGAAA CTATAAAGAA TCCTATTCAT  1860

TTTTATCCTA ACCCGGTAGA AGATGAGGTA ACTATTTCTT TAGAGTCAGC CGATTTAAAT  1920

TTAAACGAGA CTCGAGTTGT TATTTATAAT ATAAAAGGTC AAAAAATACT AGAAACAACT  1980

CCAAGTAATT CCACGGAAGT TAATTTAAAC TTATCTCACT TACCAACAGG AGTTTATTTA  2040

ATAAGAGTAA GCGATCAAAA TAAAAATATC ATAAATAAAA TTGTAAAATT A           2091

SEQ.ID.NO.8的信息:

序列长度:2112个碱基对

序列类型:核酸

链型:双链

拓扑结构:线性

分子类型:DNA(基因组)

初始来源:

  生物:黄杆菌属的种

  菌株:S-0082

SEQ.ID.NO.8的序列描述:

ATGAAAAAAT ATTCTATCCT AAAAATAGGA ATTATAGCTG TTATAATGTT GTTTGTTCAG    60

CAGTCTTACG CACAAACAAC CACAGTATAT TCTTTAGAAG ACTTACTACC CTATTTAAAA   120

CAGGATAATG TAGATGTTAA ATTAGCCCCA GGAACTTATA ATATCAATGC ATTTGACATT   180

ACTCAAGGAA AATTTTCGAA CCCCTTATTT CTTTTTGAAG GGTCTAATAA TACTTTTGAT   240

TTTACAGATG TTAAAATAAA CATCAATACT CTGGTGTTAA CAAAGTTTGG GAATAATGAA   300

GTCAATGAAA TTCAGATTTT AGGAAATAAC AATGTTCTTA AAAACTTAAA ACTAGAAGAT   360

ATTGGAACAA CAGCTCCTTC TAACAGAGCC CAGTCAATTA TAATGGATGG GCGAGACAAT   420

AGAATAGAAG GCTTTCATTT AACCATTAGA GGATCTTATC CTTATGGATA TGGAGATGCT   480

TTTGGAAAAG GAGGAGGTTC CGTAATTAAT CACCGAAAAC ATTCAGGTGT TTTAATAAGA   540

GGATTACGTA ATCACCTAAA AGATTGTACT ATTATTTCTC GTTCTTATGG GCATATAGTA   600

TTTATGCAAG CAGCAAGTTA CCCAACTGTA GAAGGTTGTT ATATTGAAGG TGAAATGCGT   660

TCAACCGATG ATATGTTGGC AGAAGAAGGA ACAGGTTCTC CAGCGGATAA TGTAGATTTT   720

ATGACGGTTT GGGGATATAA GTTACCAGCT GGTTATATGA TGAGTTTACA AGAAGGAGGA   780

ATTAGAGCTT ATGATGCTGG TACCACTTAT ATTGATGGAG AAGTAATCCA AAGAGCAACA   840

GATAACCCTA CCGTTCTAAA TTGTACCATT AAAAATGCAA GAACAGGAGT GACTTTAGCA   900

CATGCTAAAG GAACAAAACA CGTAGAAAAT GTTAAGGCTA TTGGGTGTGA GCAAGGATAT   960

TCAATTGGTA GTGGTACAGT GAGTAATTGT AGTGGTGATG CTCAGTATGG TCCGTTGTTA  1020

AGTTTTGCTT ATTCTAGTGA TAAAAATACG AATATAGACA TAGAAGTTTT GCCTGCAGAA  1080

AATTATTATA ACGGTAGTGA AACTGCTGCT TACGTTGGAG GACATTCTCA TAATATTACA  1140

CTAAGAGGAG GTGATCCTAA TGCGGATCTT AGAGTTCAGG TAGGGGGAGA AAAAAATAAC  1200

GTTAGGTTGC TTGGAGTTAC TTCTAATCAA AATCCACTTT CTGCTTCAAA TTTGGAACTG  1260

AATAATTTAA CTAATTTTCC TGTAGTGTTA GATGAAATGA GTTCTAATAT TATTGTGGAG  1320

TCATGTGGGG AGGTTACCAA TAACGGAAGT AATAATAGTA TTACTGACTG CCCAGATGGA  1380

CCAATTAGCT TTCCAGATTC AAGCAAAGCG TATCGTTTAG GAAATAATAG ATTTACATTT  1440

TGGGTTGCGG CCAATGGAGG AGATCATGCT TATTCTATAA AGTATAATGA TGGTATTAGT  1500

GGTAACATTA ATGATTATGA GGATTTGTTT CCAGAAGGAG AAGAGTCTTT TTGGGTTTTT  1560

ACTCCAGTAG AGGGAAGAGA CGGATACTTT TTTGTTGATT GTGTTGGTGG TGGTGATAAA  1620

CAAAGATTGT CAGCTACTAC AGATAGTGGC TTGCCAGTAA TGGTGTCAAA AACCATTACA  1680

AGTGCATCTG TTCAATGGTC TGTAGTGCAA CCAGAAGGAA GAGATACTTT CCATATAACG  1740

AATGATTATG CTAGAATGGT AGGAGCTAAT ACAACTACTA ATCAAACCAT TTTGTCTACT  1800

GTTGGGAACA CCTCAAACCA ATCTCGTTTT GAAGTTCTTG AAGTTTCTAA CTATTCTTTA  1860

AGTATTAAAA ACGACATCTT AAACAATAAT ATTACGGTTT TTCCTATTCC AACATCTGAC  1920

ATTCTTAATA TAAATTTAAA AAATATGGAG TCTGTTACTG TTGAATTATA CAACTCAATA  1980

GGTCAAAAAA TATTATCAAA AGAAATTAAA CAAGGTGAAA ATACCCTAAA CTTGTCTGGT  2040

ATTTATACAG GAGTTTATTT GTTAAAATTG AACGATGGAC AAAATTCTTA TACAAAAAGA  2100

ATTATTATGA AA                                                      2112

SEQ.ID.NO.9的信息:

序列长度:7个氨基酸

序列类型:氨基酸

链型:单链

拓扑结构:线性

分子类型:肽

片段类型:内部片段

SEQ.ID.NO.9的序列描述:

Thr Thr Met Ala Trp Ile Lys

  1               5

SEQ.ID.NO.10的信息:

序列长度:18个氨基酸

序列类型:氨基酸

链型:单链

拓扑结构:线性

分子类型:肽

片段类型:内部片段

SEQ.ID.NO.10的序列描述:

Gly Thr Thr Ser Ile Asn Asp Gly Glu Glu His His His Ala Val

  1               5                  10                  15

Val Ser Pro

SEQ.ID.NO.11的信息:

序列长度:15个氨基酸

序列类型:氨基酸

链型:单链

拓扑结构:线性

分子类型:肽

片段类型:内部片段

SEQ.ID.NO.11的序列描述:

Gly Pro Asn Leu Thr Gly Thr Thr Thr Leu Asn Asp Xaa Gln Thr

  1               5                  10                  15

SEQ.ID.NO.12的信息:

序列长度:24个氨基酸

序列类型:氨基酸

链型:单链

拓扑结构:线性

分子类型:肽

片段类型:内部片段

SEQ.ID.NO.12的序列描述:

Ala Asp Ile Met Xaa Gly Xaa Xaa Gly Ile Ser Tyr Arg Ile Pro

  1               5                  10                  15

Gly Xaa Asp Ile Asn Tyr Ser Gly Ser

                 20

SEQ.ID.NO.13的信息:

序列长度:17个碱基对

序列类型:核酸

链型:单链

拓扑结构:线性

分子类型:其它核酸(合成DNA)

SEQ.ID.NO.13的序列描述:

ACNATGGCNT GGATHAA                                                   17

SEQ.ID.NO.14的信息:

序列长度:15个碱基对

序列类型:核酸

链型:单链

拓扑结构:线性

分子类型:其它核酸(合成DNA)

SEQ.ID.NO.14的序列描述:

CATGAAAATA CGTAG                                                     15

SEQ.ID.NO.15的信息:

序列长度:15个碱基对

序列类型:核酸

链型:单链

拓扑结构:线性

分子类型:其它核酸(合成DNA)

SEQ.ID.NO.15的序列描述:

GATCCTACGT ATTTT                                                     15

SEQ.ID.NO.16的信息:

序列长度:30个氨基酸

序列类型:氨基酸

链型:单链

拓扑结构:线性

分子类型:肽

SEQ.ID.NO.16的序列描述:

Xxx Pro Ala Gly Tyr Met Met Ser Leu Gln Glu Gly Gly Ile Arg

  1               5                  10                  15

Ala Tyr Asn Ala Gly Thr Thr Tyr Ile Xxx Gly Val Glu Ile Gln

                 20                  25                  30

SEQ.ID.NO.17的信息:

序列长度:22个氨基酸

序列类型:氨基酸

链型:单链

拓扑结构:线性

分子类型:肽

SEQ.ID.NO.17的序列描述:

Gly Glu Ala Ser Gln Ser Ser Ser Arg Pro Ser Asp Gly Phe Ala

  1               5                  10                  15

Ala Asn Ala Ile Asp Gly Asn

                 20

SEQ.ID.NO.18的信息:

序列长度:19个氨基酸

序列类型:氨基酸

链型:单链

拓扑结构:线性

分子类型:肽

SEQ.ID.NO.18的序列描述:

Xxx Tyr Val Thr Val Pro Asp Pro Ser Ile Thr Val Asp Ala Gly

  1               5                  10                  15

Gly Val Asn Gly

SEQ.ID.NO.19的信息:

序列长度:18个氨基酸

序列类型:氨基酸

链型:单链

拓扑结构:线性

分子类型:肽

SEQ.ID.NO.19的序列描述:

Phe Gly Asn Asn Glu Val Asn Glu Ile Gln Ile Leu Gly Asn Asn

  1               5                  10                  15

Asn Val Leu

SEQ.ID.NO.20的信息:

序列长度:17个氨基酸

序列类型:氨基酸

链型:单链

拓扑结构:线性

分子类型:肽

SEQ.ID.NO.20的序列描述:

Tyr Val Glu Gly Cys Thr Val Leu Gly Cys Xxx Xxx Gly Tyr Ser

  1               5                  10                  15

Ile Gly

SEQ.ID.NO.21的信息:

序列长度:17个碱基对

序列类型:核酸

链型:单链

拓扑结构:线性

分子类型:其它核酸(合成DNA)

SEQ.ID.NO.21的序列描述:

TTYGGNAAYA AYGARGT                                                  17

SEQ.ID.NO.22的信息:

序列长度:26个碱基对

序列类型:核酸

链型:单链

拓扑结构:线性

分子类型:其它核酸(合成DNA)

SEQ.ID.NO.22的序列描述:

AAYAAYGARG TNAAYGARAT HCARAT                                        29

SEQ.ID.NO.23的信息:

序列长度:675个碱基对

序列类型:核酸

链型:单链

拓扑结构:线性

分子类型:

SEQ.ID.NO.23的序列描述:

AATAATGAGG TTAATGAAAT TCAGATTTTA GGAAATAACA ATGTTCTTAA AAACTTAAAA   60

CTAGAAGATA TTGGAACAAC AGCTCCTTCT AACAGAGCCC AGTCAATTAT AATGGATGGG  120

CGAGACAATA GAATAGAAGG CTTTCATTTA ACCATTAGAG GATCTTATCC TTATGGATAT  180

GGAGATGCTT TTGGAAAAGG AGGAGGTTCC GTAATTAATC ACCGAAAACA TTCAGGTGTT  240

TTAATAAGAG GATTACGTAA TCACCTAAAA GATTGTACTA TTATTTCTCG TTCTTATGGG  300

CATATAGTAT TTATGCAAGC AGCAAGTTAC CCAACTGTAG AAGGTTGTTA TATTGAAGGT  360

GAAATGCGTT CAACCGATGA TATGTTGGCA GAAGAAGGAA CAGGTTCTCC AGCGGATAAT  420

GTAGATTTTA TGACGGTTTG GGGATATAAG TTACCAGCTG GTTATATGAT GAGTTTACAA  480

GAAGGAGGAA TTAGAGCTTA TGATGCTGGT ACCACTTATA TTGATGGAGA AGTAATCCAA  540

AGAGCAACAG ATAACCCTAC CGTTCTAAAT TGTACCATTA AAAATGCAAG AACAGGAGTG  600

ACTTTAGCAC ATGCTAAAGG AACAAAACAC GTAGAAAATG TTAAGGCTAT TGGGTGTGAG  660

CAAGGATATT CAATT                                                   675

SEQ.ID.NO.24的信息:

序列长度:14个氨基酸

序列类型:氨基酸

链型:单链

拓扑结构:线性

分子类型:肽

SEQ.ID.NO.24的序列描述:

His Ser Gly Val Leu Ile Arg Gly Leu Arg Asn His Leu Lys

  1               5                  10

SEQ.ID.NO.25的信息:

序列长度:10个氨基酸

序列类型:氨基酸

链型:单链

拓扑结构:线性

分子类型:肽

SEQ.ID.NO.25的序列描述:

Leu Asn Ile Asn Thr Val Val Leu Thr Lys

  1               5                  10

SEQ.ID.NO.26的信息:

序列长度:21个碱基对

序列类型:核酸

链型:单链

拓扑结构:线性

分子类型:其它核酸(合成DNA)

SEQ.ID.NO.26的序列描述:

GTTCAATAGT AACAGCAAAC C                                              21

SEQ.ID.NO.27的信息:

序列长度:28个碱基对

序列类型:核酸

链型:单链

拓扑结构:线性

分子类型:其它核酸(合成DNA)

SEQ.ID.NO.27的序列描述:

CCGGATCCCA AACAACCACA GTATATTC                                       28

SEQ.ID.NO.28的信息:

序列长度:21个碱基对

序列类型:核酸

链型:单链

拓扑结构:线性

分子类型:其它核酸(合成DNA)

SEQ.ID.NO.28的序列描述:

TCCATCAATG GCATTTGCTG C                                              21

SEQ.ID.NO.29的信息:

序列长度:14个氨基酸

序列类型:氨基酸

链型:单链

拓扑结构:线性

分子类型:肽

SEQ.ID.NO.29的序列描述:

Met Ala Ser Met Thr Gly Gly Gln Gln Met Gly Arg Gly Ser

  1              5                   10

SEQ.ID.NO.30的信息:

序列长度:20个碱基对

序列类型:核酸

链型:单链

拓扑结构:线性

分子类型:其它核酸(合成DNA)

SEQ.ID.NO.30的序列描述:

ATGTTACCAC TAATACCATC                                                20

QQ群二维码
意见反馈