首页 / 专利库 / 生物化学 / 蔗糖合成酶 / 棉子糖合成酶基因、棉子糖的制备方法及其转化的植物

子糖合成酶基因、棉子糖的制备方法及其转化的植物

阅读:581发布:2020-10-05

专利汇可以提供子糖合成酶基因、棉子糖的制备方法及其转化的植物专利检索,专利查询,专利分析的服务。并且通过具有下列性质的 棉 子糖合成酶作用于 蔗糖 和肌醇半乳糖苷来生成棉子糖。(1)作用及底物特异性:由蔗糖和肌醇半乳糖苷生成棉子糖。(2)最适pH:约6~8(3)最适 温度 :约35~40℃(4)分子量:①通过凝胶过滤色谱测定的分子量:约75kDa~95kDa②用聚丙烯酰胺凝胶 电泳 (非变性PAGE)测定的分子量:大约90kDa~100kDa③还原条件下SDS-聚丙烯酰胺凝胶电泳(SDS-PAGE)所测定的分子量为:大约90kDa~100kDa(5)抑制:它能被碘乙酰胺、N-乙基 马 来酰亚胺、肌醇抑制。,下面是子糖合成酶基因、棉子糖的制备方法及其转化的植物专利的具体信息内容。

1.一种子糖合成酶,它具有从蔗糖和肌醇半乳糖苷生成棉子 糖的活性。
2.一种棉子糖合成酶,它是如下面(A)、(B)、(C)或 (D)所示的蛋白质
(A)一种蛋白质,它具有序列表序列号5记载的基酸序列;
(B)一种蛋白质,它包含序列表序列号5记载的氨基酸序列中 有一个或几个氨基酸发生置换、缺失、插入、添加或倒位的氨基酸序 列,且具有从蔗糖和肌醇半乳糖苷生成棉子糖的活性;
(C)一种蛋白质,它具有序列表序列号24记载的氨基酸序列;
(D)一种蛋白质,它包含序列表序列号24记载的氨基酸序列 中有一个或几个氨基酸发生置换、缺失、插入、添加或倒位的氨基酸 序列,且具有由蔗糖和肌醇半乳糖苷生成棉子糖的活性。
3.权利要求1的棉子糖合成酶,它具有下述性质:
(1)作用及底物特异性:由蔗糖和肌醇半乳糖苷生成棉子糖;
(2)最适pH:约6~8;
(3)最适温度:约35~40℃;
(4)分子量:
  ①用凝胶过滤色谱法测定的分子量大约75kDa~95kDa
  ②用聚丙烯酰胺凝胶电泳测定的分子量大约为90kDa~
    100kDa;
  ③由还原条件下进行的SDS-聚丙烯酰胺凝胶电泳测定的
    分子量约为90kDa~100kDa;
(5)抑制:
能被碘乙酰胺、N-乙基来酰亚胺、肌醇所抑制。
4.权利要求1的棉子糖合成酶,它的氨基酸序列中含有序列表 序列号28~30所示的各氨基酸序列。
5.一种棉子糖合成酶,它为下面(C)或(D)中所示的蛋白 质:
(C)一种蛋白质,它具有序列表的序列号24记载的氨基酸序 列;
(D)一种蛋白质,它的氨基酸序列包含序列表的序列号24记 载的氨基酸序列中,有一个或几个氨基酸发生置换、缺失、插入、添 加或倒位的序列,且它具有由蔗糖和肌醇半乳糖苷生成棉子糖的活 性。
6.一种棉子糖的制造方法,其特征在于将权利要求1-5任一 权项中的棉子糖合成酶作用于蔗糖和肌醇半乳糖苷以生成棉子糖。
7.一种DNA,它编码权利要求1~5任一权项的棉子糖合成 酶。
8.一种DNA,它编码下面(A)、(B)、(C)或(D) 中所示的蛋白质:
(A)一种蛋白质,它具有序列表中序列号5记载的氨基酸序列;
(B)一种蛋白质,它的氨基酸序列包含序列表的序列号5中记 载的氨基酸序列有一个或几个氨基酸发生置换、缺失、插入、添加或 倒位的序列,并且它具有由蔗糖和肌醇半乳糖苷生成棉子糖的活性;
(C)一种蛋白质,它具有序列表中序列号24记载的氨基酸序 列;
(D)一种蛋白质,它的氨基酸序列包含序列表的序列号24记 载的氨基酸序列中,有一个或几个氨基酸发生置换、缺失、插入、添 加或倒位的序列,且它具有由蔗糖和肌醇半乳糖苷生成棉子糖的活 性。
9.一种DNA,它编码下面(C)或(D)中所示的蛋白质:
(C)一种蛋白质,它具有序列表中序列号24记载的氨基酸序 列;
(D)一种蛋白质,它的氨基酸序列包含序列表序列号24记载 的氨基酸序列中,有一个或几个氨基酸发生置换、缺失、插入、添加 或倒位的序列,且它具有由蔗糖和肌醇半乳糖苷生成棉子糖的活性。
10.权利要求8的DNA,它是下面(a)、(b)、(c)或 (d)中所示的DNA:
(a)一种DNA,它至少含有序列表序列号4记载的核苷酸序 列中的56~2407号核苷酸序列;
(b)一种DNA,在严格条件下它能与至少包含序列表序列号4 记载的核苷酸序列中56~2407号核苷酸的核苷酸序列进行杂交,并 且它编码的蛋白质具有由蔗糖和肌醇半乳糖苷生成棉子糖的活性;
(c)一种DNA,它至少包含序列表序列号23记载的核苷酸序 列中的156~2405号核苷酸序列;
(d)一种DNA,在严格条件下它能与至少包含序列表序列号 23记载的核苷酸序列中156~2405号核苷酸的核苷酸序列进行杂 交,并且它编码的蛋白质具有由蔗糖和肌醇半乳糖苷生成棉子糖的活 性。
11.权利要求9的DNA,它是下面(c)或(d)中所示的DNA:
(c)一种DNA,它至少含有序列表序列号23记载的核苷酸序 列中的156~2405号核苷酸序列;
(d)一种DNA,在严格条件下,它能与至少包含序列表序列 号23记载的核苷酸序列中156~2405号核苷酸的核苷酸序列进行杂 交,并且它编码的蛋白质具有由蔗糖和肌醇半乳糖苷生成棉子糖的活 性。
12.如下面(e)或(f)所示的DNA:
(e)一种DNA,在严格条件下,它能与至少包含序列表序列 号4记载的核苷酸序列中的56~2407号核苷酸的核苷酸序列或其互 补核苷酸序列进行杂交;
(f)一种DNA,在严格条件下,它能与至少包含序列表序列 号23记载的核苷酸序列中的156~2405号核苷酸的核苷酸序列或其 互补核苷酸序列进行杂交。
13.一种嵌合基因,它包含棉子糖合成酶基因或其一部分,以 及能在植物细胞中表达的转录调控区域。
14.权利要求12的嵌合基因,其中的棉子糖合成酶基因是权利 要求7~11任一权项中的DNA。
15.权利要求13或14的嵌合基因,其中转录调控区域与前述的 DNA相连接,以表达含有前述DNA编码链互补序列的反义RNA。
16.用权利要求13-15任一权项的嵌合基因转化的植物。
17.一种改变前述植物棉子糖家族寡糖含量的方法,它是通过 用权利要求13~15任一权项的嵌合基因转化植物,在植物细胞中表 达该基因而实现的。

说明书全文

技术领域

发明涉及子糖合成酶,应用棉子糖合成酶或含有棉子糖合成 酶的细胞提取物合成棉子糖的方法,编码棉子糖合成酶的DNA以及 该DNA在植物中的利用。棉子糖可作为具有双岐杆菌增殖活性的食 品原料,或者作为脏器保存液等医药品在多种领域中应用。

技术背景

棉子糖是棉子糖家族寡糖的一种,它的半乳糖通过α-1,6连键 与蔗糖葡萄糖基连接。除棉子糖之外棉子糖家族寡糖还有2个半乳 糖基连接的苏糖、3个半乳糖基连接的毛蕊糖等。这些糖广泛存在 于植物中,如以贮存糖存在于豆类、油菜子、棉子等各种植物中,以 转移糖存在于黄瓜和甜瓜等葫芦科植物中,或者存在于获得耐冷性的 玫瑰叶、甜菜(サトウダイコン)等植物中。

棉子糖家族寡糖的生物合成如下:

UDP-半乳糖+肌醇→肌醇半乳糖苷+UDP    …(a)

肌醇半乳糖苷+蔗糖→棉子糖+肌醇       …(b)

肌醇半乳糖苷+棉子糖→水苏糖+肌醇     …(c)

在反应中(a)用肌醇半乳糖苷合成酶(GS:EC2.4.1.123)进 行催化,(b)用棉子糖合成酶(RS:EC2.4.1.82)进行催化,(c) 用水苏糖合成酶(STS:EC2.4.1.67)进行催化。

现在棉子糖可从甜菜提取,在蔗糖的纯化过程中进行分离纯化。 但是,因为棉子糖降低了蔗糖的结晶性,所以以降低棉子糖含量为目 的对甜菜进行了育种、改良,甜菜中棉子糖的含量降低到0.03%到 0.16%(酶微生物学技术,第4卷,5月刊130-135(1982))。因此从 这样低含量的甜菜中不容易有效地得到棉子糖。

如上所述,棉子糖包含在以大豆为代表的豆科植物的成熟种子 中,以及甜菜或黄瓜等葫芦科植物中。作为大豆寡糖,大豆的成熟种 子中含有蔗糖(含量约5%)、水苏糖(约4%)、棉子糖(大约 1%),这些大豆寡糖从脱脂大豆的脱蛋白级分回收,浓缩后可用于 功能性食品,但是在总的寡糖中棉子糖为10%,其量很少。

另一方面,棉子糖的酶合成方法也有报道(糖科学和糖技术的发 展趋势,7.34,149-158(1995))。这就是通过α-半乳糖苷酶的缩合 反应合成半乳二糖,然后该半乳二糖作为半乳糖基的供体,通过半乳 糖基转移反应转移到蔗糖,从而合成棉子糖。但是,该反应中,由 1.9kg乳糖水解物合成350g半乳二糖,由190g半乳二糖和760g蔗 糖可得到100g棉子糖,所生成的棉子糖的产量低,并非有效的合成 方法。

除如上所述的方法外,可考虑通过生物合成系统的酶基因的转化 来培育棉子糖含量高的植物。例如,Kerr等克隆了肌醇半乳糖苷合 成酶基因,转化了油菜子(WO 93/02196)。但是,其结果为GS活 性增加,棉子糖家族寡糖却降低,这没有达到通过导入肌醇半乳糖苷 合成酶基因来增加棉子糖家族寡糖生成的目的。因此,未提供能增加 植物棉子糖家族寡糖含量的方法。

另一方面,也要求减低棉子糖家族的寡糖。如上所述,棉子糖 家族的寡糖主要以贮存糖广泛存在于豆类、油菜子、棉子等各种植 物的种子中,以转移糖存在于黄瓜和甜瓜等葫芦科植物中,或者广 泛存在于获得耐冷性的玫瑰叶、甜菜等植物中,大豆、油菜子、棉 子等榨油后的粗粉中含有这些棉子糖家族的寡糖。几乎所有这些粗 粉都用作饲料,但不具备α-半乳糖苷酶的人和动物不能直接消化 棉子糖家族寡糖。而且,已知由于肠内细菌对它的同化作用产生气 体,棉子糖家族寡糖降低了饲料的代谢能效率。有这样的报道,因 去除了饲料中的棉子糖家族寡糖,提高了饲料效率(Coo, Proceeding Soybean Utilization Alternatives.University of Minnesota,203-211(1989))。由此,期望棉子糖家族寡糖减少的饲 料作物,如大豆、油菜籽、棉子等。

此外,在这些植物中能培育出油含量增多的植物。光合成产物 分布于油脂、蛋白质、含有棉子糖家族寡糖的糖。有报道大豆中油 脂含量与糖含量呈负相关。期望在具有同一光合成能的大豆中, 通过抑制棉子糖家族寡糖的生成能增加油脂含量。

据报道,根据以上观点,Kerr等通过交配选育制备了棉子糖族 寡糖降低了80%-90%的低棉子糖家族寡糖的大豆品种(WO 93/00742)。但是这种品种的制备不能应用于与栽培适应性、抗病性 等相对应的不同品种。另外,也不能广泛应用于多种植物。

已知甜菜、甘蔗等中含有的棉子糖能降低砂糖的结晶性。因此期 待,若不生成棉子糖能提高这些植物中砂糖的生成效率,但是制备不 出不含有棉子糖的甜菜。

如上所述,目前纯化出的棉子糖合成酶只能确证其酶活性,未鉴 定出酶体。而且其活性也低,期待高活性的棉子糖合成酶。此外,到 目前为止,棉子糖的制造方法回收效率低,期待高效率的棉子糖制造 方法。另一方面,也期待培育出棉子糖族寡糖降低了的植物。

发明内容

本发明是在上述观点的基础上形成的,其目标是获得高活性的棉 子糖合成酶及编码该酶的DNA,提供有效的棉子糖的酶合成方法, 以及编码棉子糖合成酶的DNA在植物中的利用方法。
本发明者们为了解决上述问题进行了努力研究,结果成功地从 黄瓜中纯化出棉子糖合成酶。此外,为了克隆编码该棉子糖合成酶 的基因,本发明者们进行了努力研究。结果得到棉子糖合成酶基因 特异的DNA片段,它是以根据黄瓜棉子糖合成酶肽片段的基酸 序列推断出的核苷酸序列为基础化学合成单链DNA,以这一合成 的单链DNA作引物,以用从黄瓜提取出的poly(A)+RNA制备的 cDNA作模板进行PCR而得到的。然后以该DNA片段作探针对黄 瓜来源的cDNA文库进行杂交,采用分离棉子糖合成酶基因的方法 分离棉子糖合成酶基因。此外,为了在黄瓜的棉子糖合成酶基因信 息的基础上克隆出大豆的棉子糖合成酶基因,进行了刻苦研究,结 果分离出大豆来源的棉子糖合成酶基因。应用这一分离的棉子糖合 成酶基因片段制作在植物中能表达的有调控区域的嵌合基因,转化 植物。然后由于导入了棉子糖合成基因就可制备出棉子糖族寡糖降 低了的植物。
也就是说本发明提供具有能由蔗糖和肌醇半乳糖苷生成棉子糖 这一活性的棉子糖合成酶。
优选地,本发明提供下面(A)、(B)、(C)或(D)中 所示棉子糖合成酶蛋白质。
(A)具有序列表中序列号5所记载的氨基酸序列的蛋白质。
(B)一种蛋白质,它含有序列表的序列号5中记载的氨基酸序 列中1个或几个氨基酸发生替换、缺失、插入、添加或倒位的氨基酸 序列,且它具有从蔗糖和肌醇半乳糖苷生成棉子糖的活性。
(C)一种蛋白质,它具有序列表中序列号24记载的氨基酸序 列。
(D)一种蛋白质,它包含序列表的序列号24所记载的氨基酸 序列中有1个或几个氨基酸发生置换、缺失、插入、添加或倒位的氨 基酸序列,且具有由蔗糖和肌醇半乳糖苷合成棉子糖的活性。
另外,本发明提供具有下列性质的棉子糖合成酶。
(1)作用及底物特异性:由蔗糖和肌醇半乳糖苷生成棉子糖;
(2)最适pH:约6~8;
(3)最适温度:约35~40℃;
(4)分子量:
  ①凝胶过滤色谱所测定的分子量为:约75kDa~95kDa;
  ②用聚丙烯酰胺凝胶电泳(非变性PAGE)测定的分子
    量:约90kDa~100kDa;
  ③还原条件下进行的SDS-聚丙烯酰胺电泳(SDS-
    PAGE)测定的分子量:约90kDa~100kDa;
(5)抑制:
被碘乙酰胺、N-乙基来酰乙胺、肌醇抑制。
作为上述棉子糖合成酶的具体形式,本发明提供氨基酸序列中包 含序列表序列号28-30所示的各氨基酸序列的棉子糖合成酶。
另外,本发明提供下面(C)或(D)所示的棉子糖合成酶蛋 白质:
(C)具有序列表的序列号24中记载的氨基酸序列的蛋白质。
(D)一种蛋白质,它包含序列表中序列号24记载的氨基酸序 列中有1个或几个氨基酸发生置换、缺失、插入、添加或倒位的氨基 酸序列,且具有从蔗糖和肌醇半乳糖苷生成棉子糖的活性。
另外,本发明提供棉子糖的制造方法,其特征在于在上述棉子糖 合成酶的作用下由蔗糖和肌醇半乳糖苷生成棉子糖。
此外,本发明还提供编码上述棉子糖合成酶的DNA,以及, 尤其是编码下面(A)、(B)、(C)或(D)中所示蛋白质 的DNA:
(A)具有序列表的序列号5中记载的氨基酸序列的蛋白质。
(B)一种蛋白质,它包含序列表序列5中记载的氨基酸序列中 有1个或几个氨基酸发生替换、缺失、插入、添加或倒位的氨基酸序 列,且具有由蔗糖和肌醇半乳糖苷生成棉子糖的活性。
(C)具有序列表序列号24中记载的氨基酸序列的蛋白质。
(D)一种蛋白质,它包含序列表序列号24记载的氨基酸序列 中有1个或几个氨基酸发生置换、缺失、插入、添加或倒位的氨基酸 序列,且具有从蔗糖和肌醇半乳糖苷生成棉子糖的活性。
作为上述DNA的具体实施方案,本发明提供下面(a)、(b)、 (c)或(d)中所示的DNA:
(a)一种DNA,它至少包含序列表的序列号4所记载的核苷 酸序列中56~2407号核苷酸的核苷酸序列;
(b)一种DNA,在严格条件下,它能与至少包含序列表序列 号4中记载的核苷酸序列中56~2407号核苷酸的核苷酸序列进行杂 交,且能够编码具有能从蔗糖和肌醇半乳糖苷生成棉子糖这一活性的 蛋白质;
(c)一种DNA,它至少包含序列表序列号23记载的核苷酸序 列中第156~2405号核苷酸的核苷酸序列;
(d)一种DNA,在严格条件下,它能与至少包含序列表序列 号23记载的核苷酸序列中第156~2405号核苷酸的核苷酸序列进行 杂交,且它编码的蛋白质具有能从蔗糖和肌醇半乳糖苷生成棉子糖的 活性。
另外,本发明提供能用于表达棉子糖合成酶反义RNA或有义 RNA的DNA,即提供下面(e)或(f)中所示的DNA。
(e)一种DNA,在严格条件下,它能与至少包含序列表序列 号4记载的核苷酸序列中第56~2407号核苷酸的核苷酸序列或其互 补核苷酸序列进行杂交;
(f)一种DNA,在严格条件下,它能与至少包含序列表序列 号23记载的核苷酸序列中第156~2405号核苷酸的核苷酸序列或者 其互补序列进行杂交。
此外,本发明提供包含棉子糖合成酶基因或其一部分和能在植物 细胞中表达的转录调控区域的嵌合基因,以及用该嵌合基因转化的植 物。
另外,本发明提供一种方法,它是用上述的嵌合基因转化植物, 通过在植物细胞中表达该基因来改变前述的植物的棉子糖族寡糖的 含量。
以下将具有上述(1)~(5)中性质的棉子糖合成酶,或者上 面(A)、(B)、(C)和(D)的蛋白质的棉子糖合成酶简单 地称作“棉子糖合成酶”。而将编码棉子糖合成酶的DNA或者编码 棉子糖合成酶并含有非翻译区的DNA叫做“棉子糖合成酶基因”。
以下对本发明进行详细说明。 <1>本发明的棉子糖合成酶
本发明的棉子糖合成酶是下面(A)、(B)、(C)或(D) 中所示的蛋白质。
(A)一种蛋白质,它含有序列表的序列号5记载的氨基酸序列;
(B)一种蛋白质,它包含序列表序列号5记载的氨基酸序列中 有一个或几个氨基酸发生置换、缺失、插入、添加或倒位的氨基酸序 列,且具有从蔗糖和肌醇半乳糖苷生成棉子糖的活性;
(C)一种蛋白质,它具有序列表序列号24中记载的氨基酸序 列;
(D)一种蛋白质,它包含序列表序列号24记载的氨基酸序列 中有一个或几个氨基酸发生置换、缺失、插入、添加或倒位的氨基酸 序列,且具有从蔗糖和肌醇半乳糖苷合成棉子糖的活性。
本发明的棉子糖合成酶包含具有下述性质的物质。
(1)作用及底物特异性:从蔗糖和肌醇半乳糖苷生成棉子糖;
(2)最适pH:约6~8;
(3)最适温度:约35~40℃;
(4)分子量:
  ①用凝胶过滤色谱测定的分子量:约75kDa~95kDa;
  ②用聚丙烯酰胺凝胶电泳(非变性PAGE)测定的分子
    量:约90kDa~100kDa;
  ③还原条件下进行的SDS-聚丙烯酰胺凝胶电泳(SDS-
    PAGE)测定的分子量:约90kDa~100kDa;
(5)抑制:
被碘乙酰胺、N-乙基马来酰乙胺、肌醇所抑制。
具有上述性质的棉子糖合成酶是从黄瓜的叶中分离、纯化出的, 是由本发明者初次鉴定出的。如后面的实施例所示,这种来源于黄瓜 的棉子糖合成酶,其蛋白质的氨基酸序列中含有序列表序列号1- 3,或者28-30中所示的各种氨基酸序列。另外,其全部氨基酸序 列在序列表序列号5中显示。
棉子糖合成酶可从葫芦科植物,例如从甜瓜(Cucumis melo)、 黄瓜(Cucumis sativus)等植物中得到。特别是这些植物的叶、尤其 是叶脉部分,以及种子等组织中棉子糖合成酶的含量高。
下面说明从黄瓜分离、纯化棉子糖合成酶的方法,以作为本发明 棉子糖合成酶的制造方法的例子。
播种后6~10周的黄瓜叶部分收集其叶脉部分,在液氮下用乳 钵等研磨,加入缓冲液提取蛋白质。在这一过程中可加入防止棉子糖 合成酶分解、失活的物质,如PMSF(苯甲基磺酰氟)等蛋白酶抑制 剂和ポリクテ-ルAT(ヤルバ(Serva)公司制造)。通过过滤和 离心可从提取液中除去不溶物,得到粗提液。
可应用常规的蛋白质纯化方法对如上所得的粗提液进行纯化,例 如组合应用阴离子交换色谱,羟磷灰石色谱,凝胶过滤、盐析等方法 进行分级,可纯化棉子糖合成酶。
阴离子交换色谱可这样进行,例如应用填充了HiTrapQ(ファル マシア公司)等强性阴离子交换体和DEAE-TOYOPEARL(东ソ- 公司)等弱碱性阴离子交换体的柱子进行。让含有棉子糖合成酶的提 取液通过该柱,酶吸附于柱上,洗涤柱子后用高盐浓度的缓冲液洗脱 出酶。这时盐浓度可阶段性升高,或可应用浓度梯度。例如,应用 HiTrapQ柱的时候可用0.3M的NaCl洗脱吸附于柱上的棉子糖合成 酶活性。另外,在用DEAE-TOYOPEARL时优选应用0.05M~0.35M 的NaCl浓度梯度作为洗脱液,用羟磷灰石色谱时优选0.01M~0.3M 的磷酸浓度梯度作洗脱液。
上述的操作顺序无特殊限制,各操作可重复2次或更多。另外, 期望在样品液通过各种柱子之前,通过透析等将样品液与适当的缓冲 液进行交换。在各阶段可对样品液进行浓缩。
在纯化的各阶段中,测定各级分中所含有的棉子糖合成酶活性, 优选收集高活性的级分供下面的阶段进行测试。测定棉子糖合成酶活 性的方法,例如可应用Lehle,H等报道的放射性同位素方法(欧洲生 化杂志,38,103-110(1973))。另外作为其变更方法可改变反应温度 和底物浓度。例如向含有终浓度为10mM 14C-蔗糖、20mM肌醇 半乳糖苷、25mM HEPES(2-(4-(2-羟乙基)-1-哌嗪 基)乙烷磺酸)-NaOH,pH 7.0、0.5mM DTT(二硫苏糖醇)的 反应液中加入10μl的酶液使之达到50μl。32℃培养1小时进行反 应,加入200μl的乙醇,95℃加热30秒,停止反应。将该反应液的 离心上清点到ワットマン3mM滤纸上,用正丙醇∶醋酸乙酯∶水=4∶1∶2 进行展开。检测棉子糖中摄入的14C,以之作为棉子糖合成酶活性 (nmol/小时)。
本发明者们开发了一种测定棉子糖合成酶活性的方法以取代上 述的方法,它是通过HPLC(高效液相色谱)对棉子糖合成反应中生 成的棉子糖进行定量。与Lehle.H等的方法进行比较,该方法能简便 且迅速地进行测定,尤其适于纯化操作中活性级分的检测。以下说明 本方法。
棉子糖合成反应是向按照终浓度如下的组分配备的反应液中 加入10~50μl棉子糖合成酶液,使之达到100μl,32℃反应60 分钟。 [反应液组成(终浓度)]
2.5mM    蔗糖
5mM      肌醇半乳糖苷
5mM      DTT
20mM     Tris-盐酸缓冲液(pH 7.0)
如上进行反应后,加入反应液4倍体积的乙醇,95℃加热30秒 终止反应。将之离心,离心上清进行减压干燥后,溶解到蒸馏水中, 由HPLC对反应生成物中的棉子糖进行定量,以估测棉子糖酶活性。 HPLC可应用,例如糖分析系统DX500(CarboPac PAI柱,脉冲电 级分析检测器(ダイオネクス公司))进行。
用上述方法所测定的当反应时间变化时生成的棉子糖含量的结 果如图1所示。从图中可以看出,该方法可线性且简便地测定棉子糖 合成酶活性。
可用凝胶电泳,凝胶过滤色谱等方法来确定纯化的棉子糖合成酶 的纯度及测定其分子量。另外可通过测定改变反应温度或反应pH时 的酶活性,或者向反应液中加入各种酶抑制剂金属离子等测定残存 的酶活性来研究酶学性质。另外通过测定棉子糖合成酶在各种pH条 件下或温度条件下作用一段时间后的酶活性,可检测出稳定pH范围 和稳定的温度范围。
虽然可如下测定上述棉子糖合成酶的性质,但值得注意的是在不 同条件下得到不同的结果。例如用凝胶过滤色谱测定分子量时受所用 凝胶过滤载体和缓冲液的种类,或分子量标志物的影响。另外许多情 况下,虽然为同一pH值,但酶活性因缓冲液的种类或盐浓度不同而 不同。因此,在鉴定棉子糖合成酶时,不要仅限于个体的性质而优选 进行综合检测。
本发明的棉子糖合成酶可如上所述从黄瓜中分离、纯化,但是也 可应用异种蛋白质发酵生产中常用的方法,通过将后面所述的编码来 源于黄瓜、大豆或其它植物的棉子糖合成酶的DNA导入适当的宿主 并使之表达来进行制备。
可应用以大肠杆菌(Escherichia coli)为代表的各种原核细胞和 以酿酒酵母(Saccharomyces cerevisiae)为代表的各种真核细胞作为 表达棉子糖合成酶基因的宿主,但期望应用植物细胞,尤其是来源于 烟草、黄瓜、拟南芥等植物的细胞。
用于转化的重组质粒可通过将编码棉子糖合成酶的DNA插入到 与表达用的细胞种类相对应的表达载体中来制备,植物的表达载体含 有在植物中起作用的启动子DNA序列或者这些启动子的数个组合, 以及在植物中起作用的终止DNA序列,若其间含有能插入外来基因 的序列更好。
这样的启动子有,例如在整个植物体中表达的CaMV 35S RNA 启动子,CaMV 19S RNA启动子、胭脂碱合成酶启动子等,在绿色 组织中表达的RubisCO小亚基启动子等,在种子等部位特异表达的 ナピン(napin)、菜豆蛋白等基因的启动子。作为上述的终止子可 例举胭脂碱合成酶终止子,RubisCO小亚基3′端部位等。
作为植物用的表达载体可应用市售的pBI 121、p35S-GFP (CLONTECH公司)等。应用表达病毒RNA的载体可将其编码外 被膜蛋白质等的基因替换为棉子糖合成酶基因。
可应用转化中所常用的方法转化宿主细胞,如土壤杆菌法、粒子 枪法、电穿孔法、PEG法等。棉子糖合成酶活性的检测可应用在进 行棉子糖合成酶纯化时应用的方法。这一过程中,希望通过将样品通 过阴离子交换柱预先去除α-半乳糖苷酶。
编码黄瓜来源的棉子糖合成酶基因,只要是在表达时产生具有 棉子糖合成酶活性的物质,均包括在内,但是优选这样的基因,它 含有编码序列表中序列号5记载的氨基酸序列的DNA,或含有编 码序列表的序列号4记载的核苷酸序列的DNA。另外,作为编码 大豆来源的棉子糖合成酶的基因,包含所有哪些表达时产生具有棉 子糖合成酶活性物质的基因,但优选这样的基因,它含有编码序列 表的序列号24记载的氨基酸序列的DNA,或含有编码序列表的序 列号23记载的核苷酸序列的DNA,尚需指出的是编码序列表中序 列号5或24记载的氨基酸序列的基因包括考虑到发生密码简并的 各种核苷酸序列。也就是说,在考虑了基因表达系统各要素的基础 上从这些各种核苷酸序列中选择,如依赖于宿主细胞种类的优先密 码子,避免因转录RNA造成的高级结构等要素。所选择的核苷酸 序列既可是从自然界克隆出的DNA,也可是人工化学合成的 DNA。 <2>编码本发明的棉子糖合成酶的DNA
编码棉子糖合成酶的DNA可这样获得,从黄瓜等植物分离出 poly(A)+RNA,用它制备cDNA文库,通过与该cDNA文库进行杂交 来进行筛选。可通过应用以棉子糖合成酶蛋白质的部分氨基酸序列为 基础合成的寡核苷酸作引物所进行的PCR(聚合酶链反应)扩增反 应获得杂交用的探针。
以下将具体说明从来源于黄瓜的poly(A)+RNA获取本发明的 DNA的方法。
只要是表达棉子糖合成酶基因,那么黄瓜的任一部分均可用作 poly(A)+RNA的提取部位,如可从不同生长阶段的叶、茎、蕾、果实、 种子等部位获得poly(A)+RNA,但希望应用结果后的展开叶尤其是叶 脉部分作材料。
从黄瓜组织提取总RNA的方法没有特定的限制,只要是能有效 地、很少损伤的得到RNA即可,例如可应用酚/SDS法、胍异硫氰酸 盐/氯化铯法等任一种众所周知的方法。用Oligo(dT)载体可从所得的 总RNA分离出poly(A)+RNA。另外,也可不用提取总RNA而使用 能得到poly(A)+RNA的试剂盒(MPG Direct mRNA Purification Kit, CPG,INC.公司等)。
在cDNA文库的筛选中应用的探针DNA片段可通过进行PCR而 获得。化学合成单链DNA,它拥有的核苷酸序列是根据已知肽片段 的氨基酸序列,例如依据序列表序列号1~3所示的氨基酸序列来推 定,以该链作引物进行PCR。所得肽片段的氨基酸序列的任一部分 均可用作引物,但希望选择密码简并少、未形成复杂的高级结构的序 列。另外,亦可进行RACE(cDNA末端快速扩增:PCR PROTOCOLS A Guide to Methods and Applications,ACADEMIC press INC.p28~ 38)。
希望应用cDNA文库、单链cDNA作为PCR的模板。PCR中应 用具有逆转录酶活性的耐热性DNA聚合酶时,可应用poly(A)+ RNA,某些情况下可应用总RNA。
为了制备cDNA文库,首先要以poly(A)+RNA为模板,应用Oligo (dT)引物、随机引物等,通过逆转录酶合成单链cDNA,然后应用グ ブラ-ボフマン(Gubler and Hoffman)法、オカヤマ-バ-グ (Okayama-Berg法)(分子克隆第2版,冷泉港出版,1989)合成 双链cDNA,当棉子糖合成酶基因的表达量少的时候可应用利用PCR 的cDNA文库制作试剂盒(Capfinder PCR cDNA Library Constrution Kit(CLONTECH)等),通过PCR扩增cDNA。将这样 合成的cDNA平端化,添加接头,用PCR添加限制性酶切位点后可 克隆到噬菌体载体,质粒等克隆载体中。
可从上面的PCR中得到的DNA片段中选择棉子糖合成酶cDNA 特征的部分用作杂交的探针。另外希望选择靠近5′末端的DNA片段。 可从PCR反应液中纯化出如此选择的扩增DNA片段。这时应用质粒 亚克隆扩增的DNA片段,大量制备质粒后用限制性酶酶切,然后从 电泳后的胶中切出,进行纯化。另外,可以质粒为模板进行PCR, 只扩增应用目的部分。此外,当最初扩增的DNA片段的量很多时, 可不对扩增的DNA片段进行亚克隆而进行电泳,切出含有目的DNA 片段带的凝胶片段,从中进行纯化。
为了从cDNA文库获得目的克隆而进行的筛选通过杂交进行。 可标记上述方法中所得的DNA片段用作杂交的探针,可用放射性 同位素、生物素等多种物质进行标记,但希望应用随机引物法进行 标记,另外,筛选时可用PCR而不进行杂交,也可将杂交与PCR 联合应用。
序列表序列号4中显示了如上得到的编码黄瓜的棉子糖合成酶 的DNA核苷酸序列以及由该核苷酸序列推断的氨基酸序列。只有该 氨基酸序列在序列号5中显示。根据布达佩斯条约,携带有质粒 pMossIoxCRS的大肠杆菌JM 109的转化体AJ 13263,于1996年11 月19日保藏于通商产业省工业技术院生命工学工业技术研究所(邮 编305日本国茨城县つくば市东一丁目1番3号),保藏号为FERM BP-5748,该质粒含有后面实施例3中获得的包含编码棉子糖合成酶 DNA的DNA片段。
此外,利用如上面所述的从一植物获得的棉子糖合成基因可从 其它植物获得棉子糖合成酶基因。作为用于获得棉子糖合成酶的植 物,只要是如前所述的能合成棉子糖的植物均可,例如大豆、蚕豆、 油菜子、向日葵、棉花、甜菜等。可以应用编码来源于黄瓜的棉子 糖合成酶的DNA来获得编码大豆棉子糖合成酶的DNA为例进行说 明。
大豆棉子糖合成酶基因的获得是:从大豆的poly(A)+RNA制备 cDNA文库,应用以编码黄瓜棉子糖合成酶的DNA核苷酸序列为基 础而选择的探针对cDNA文库进行筛选。
只要是能表达棉子糖合成酶那么大豆植株的任一部分均可作为 RNA的提取部位,但希望应用种子,尤其是棉子糖族寡糖生成时期 的开花后未成熟种子。
对于从大豆未成熟种子提取总RNA的方法没有特殊限定,只要 是能有效地得到低损伤的RNA即可,前面所述的与黄瓜相关的任何 一种方法均可应用。
杂交的探针具有与大豆的棉子糖合成酶基因高度同源的序列是 必要的。杂交中应用的探针可以是来源于黄瓜的棉子糖合成酶基因, 但希望是该基因中棉子糖合成酶保守的区域作探针。但是,从来源于 黄瓜的棉子糖合成酶基因的信息来看,未确定出如上的序列。有必要 参照如下的任一种方法来得到具有如此序列的杂交探针。简便地是, 用适当的限制性酶酶切从黄瓜中得到的棉子糖合成酶基因,将所得片 段分别与大豆的RNA进行Northern杂交,将与之杂交的DNA片段 用作探针。另外,也可以黄瓜棉子糖合成酶的氨基酸序列为基础合成 引物,应用此引物,以大豆RNA作模板,通过RT-PCR来获得探针。 另外,也可在与编码黄瓜棉子糖合成酶的DNA具有同源性的拟南芥 EST序列的基础上合成寡核苷酸,以此作用引物,通过拟南芥RNA 的RT-PCR来获得。
优选如下来获得与目的基因具有高同源性的序列。首先,用 Genetix Mac软件从GenBank数据库检索对黄瓜棉子糖合成酶基因具 有同源性的拟南芥等的EST序列。所得序列与黄瓜棉子糖合成酶基 因间的高同源性区域包含在各种种子来源的棉子糖合成酶间保守的 序列。该区域DNA片段的获得是,例如,以由拟南芥RNA制备的单 链DNA为模板,以在高度同源性区域序列的基础上合成的寡核苷酸 作引物,通过PCR进行扩增而得到。分析该扩增片段的核苷酸序列, 选择与黄瓜具有高度同源性序列的片段。如前面所记载的,标记所得 的DNA片段,作为探针应用。
为了从cDNA文库获得目的克隆所进行的筛选,可按黄瓜基因克 隆的方法进行杂交。
如上所得到的编码大豆来源的棉子糖合成酶的DNA核苷酸序 列,以及从该核苷酸序列推出的氨基酸序列显示于序列表序列号23 中。序列号24中只显示了氨基酸序列。在考虑缺口的情况下,通 过最大匹配,上述方法中取得的大豆来源的棉子糖合成酶与黄瓜来 源的棉子糖合成酶的氨基酸序列的同源性为38%,核苷酸序列的 同源性为50%。携带有质粒pMOSSloxSRS的大肠杆菌JM 109的 转化体AJ 13379于1997年10月20日按照布达佩斯条约保藏于通 商产业省工业技术院生命工学工业技术研究所(邮编305日本国茨 城县つくば市东一丁目1番3号),保藏号为FERM BP-6149,而 该质粒包含后面实施例4中得到的含有编码棉子糖合成酶的DNA 的DNA片段。
利用黄瓜来源的棉子糖合成酶和大豆来源的棉子糖合成酶的 有关信息可从其它植物获得棉子糖合成酶基因。可合成这样的单链 DNA,它含有的核苷酸序列是从在两种蛋白质中保存的氨基酸序列 推断出的,例如从序列表序列号28(序列号24的氨基酸序号199~ 208)、29(序列号24的氨基酸序号302~314)、30(序列号 24的氨基酸序号513~527)等推断出;也可合成具有与推断的核 苷酸序列互补的核苷酸序列的单链DNA,用它们作引物进行RT- PCR。上述序列的任一部分均可用作引物,但希望选择密码简并 少、未形成复杂的高级结构的序列。可用要获得基因的植物的总 RNA,某些情况下用poly(A)+RNA合成cDNA,以此作模板进行 PCR。将所得DNA片段克隆到适宜的载体中,分析其核苷酸序列, 确证该核苷酸序列与黄瓜或大豆来源的棉子糖合成酶基因是否有 同源性,或者翻译的氨基酸序列与黄瓜和大豆来源的棉子糖合成酶 的氨基酸序列是否有同源性。所得的DNA片段可用于cDNA文库 的筛选。另外,也可用要获得基因的植物的总RNA合成单链 cDNA,某些情况下用poly(A)+RNA合成,以cDNA作模板进行 RACE。
本发明的DNA能编码棉子糖合成酶蛋白质,只要具有棉子糖合 成酶活性,即由蔗糖和肌醇半乳糖苷生成棉子糖的活性不被破坏,可 包含在1个或多个位置有1个或数个氨基酸发生置换、缺失、插入、 添加或倒位的蛋白质。这里的“数个”依据氨基酸残基在蛋白质三维 结构中的位置和种类而有所不同。如同异亮氨酸和缬氨酸,氨基酸间 存在相似性高的氨基酸,象这些氨基酸的差异对蛋白质的三维结构不 会有很大的影响。因此只要是与构成黄瓜来源的棉子糖合成酶的总共 784个氨基酸有35~40%以上的同源性,且具有棉子糖合成酶活性的 均可,优选的是与510~610号氨基酸间有65%以上同源性的。再有 “数个”为2-40个,优选2-20个,更优选2-10个。另外,与 构成大豆来源的棉子糖合成酶的750个氨基酸同样有35-40%以上 的同源性且具有棉子糖合成糖合成酶活性的亦可。优选的是与478- 577号氨基酸间有65%以上同源性的。这里所讲的同源性是考虑到缺 口进行最大匹配的数值。
本发明包括基因全长中约有50%以上的同源性,且其中300个 核苷酸的区域具有65%以上同源性的基因。象这样的基因,可应用 GenBank等数据库,通过检索与黄瓜来源的棉子糖合成酶基因具有同 源性的基因而得到其核苷酸序列的信息。可应用采纳了Lipman- Pearson法的GENETIX-MAC(基因情报处理软件,软件开发公司) 进行同源性分析,也可应用在因特网上公开的程序。用这样的方法所 得到的核苷酸序列有包含基因全长的时候,也有不包含基因全长的时 候。当不含有基因全长的时候,可以从目的植物组织中提取出的RNA 为模板,与黄瓜来源的棉子糖合成酶基因同源性高的区域相对应的部 分作引物,应用5′RACE法、3′RACE法,可容易地获得全长基因。 按前面所讲的,将所得的全长基因重组到Soluble Protein Expression System(INVITROGEN公司)、Tight Control Expression System (INVITROGEN公司)和QIAexpress System(QIAGEN公司)等 试剂盒提供的适宜表达载体中,使基因表达,用记载的方法测定棉子 糖合成酶活性,选择有活性的克隆。关于基因的表达方法,在《植物 分子生物学,实验手册》(Melody S.Clark(Ed.),Springer)中有详 细记载。
编码与该棉子糖合成酶基本上为同一蛋白质的DNA可通过改变 核苷酸序列而获得,例如,应用位点特异的诱变法使特定部位的氨基 酸发生置换、缺失、插入、添加等。另外也可应用目前已知的突变处 理来获得如上面改变的DNA。作为突变处理的方法可例举用羟胺体 外处理编码棉子糖合成酶的DNA的方法,以及应用紫外线照射或N -甲基-N′-硝基-亚硝基胍(NTG)或亚硝酸等在通常的人工突 变中应用的突变剂处理携带有编码棉子糖合成酶DNA的埃希氏菌属 细菌的方法。
上面所讲的核苷酸置换、缺失、插入、添加或倒位等情况也包含 自然发生的突变,如基于黄瓜或大豆的个体差异、品种间差异、基因 的多拷贝化、各器官组织的差异而形成的突变。
在适当的细胞中表达具有上述变异的DNA,通过检测表达产 物的棉子糖合成酶活性得到编码与棉子糖合成酶基本上为同一蛋 白质的DNA。或者,通过在严格条件下与含有序列表序列号4记 载的核苷酸序列中的56~2407号核苷酸序列或序列表序列号23记 载的核苷酸序列中的156~2405号核苷酸序列的DNA进行杂交, 并且分离出编码具有棉子糖合成酶活性的蛋白质的DNA,可从具 有突变的编码棉子糖合成酶的DNA或携带它的细胞中获得编码与 棉子糖合成酶蛋白质基本上为同一蛋白质的DNA。这里所讲的“严 格条件”是指形成所谓的特异杂交,而不形成非特异杂交。该条件 很难明确用数值表示,但如果用一例来表示的话就是同源性高的 DNA,如同源性达50%以上的DNA彼此杂交,而同源性低的DNA 间不进行杂交,或者在相当于通常Southern杂交洗涤条件60℃, 1×SSC,0.1%SDS,优选0.1×SSC、0.1%SDS的盐浓度下进行杂 交。在该条件下进行杂交的基因中包含中间位置生成终止密码的基 因,和因活性中心的突变而失活的基因,但通过用前面所述的方法 测定与市售的活性表达载体连接的棉子糖合成酶活性可容易地去 除这些基因。
当本发明的DNA用于表达棉子糖合成酶的反义RNA时,该DNA 没有必要编码有活性的棉子糖合成酶,应用反义RNA能抑制具有同 源性的内源性基因的功能。这种情况下,DNA不必要编码有活性的 棉子糖合成酶基因,而且也可不含有其全长。优选同源性达60%以 上的翻译区有500个核苷酸对。例举下面(e)或(f)的DNA作为 这样DNA的例子。
(e)在严格条件下能与序列表序列号4记载的核苷酸序列中至 少由56~2407号核苷酸组成的核苷酸序列或其互补核苷酸序列进行 杂交的DNA;
(f)在严格条件下能与序列表序列号23记载的核苷酸序列中 至少由156~2405号核苷酸组成的核苷酸序列或其互补序列进行杂交 的DNA。
如上介绍了本发明者们从黄瓜或大豆成功地克隆棉子糖合成酶 的目的cDNA的方法,下面介绍其它的方法。
(1)分离纯化黄瓜或大豆来源的棉子糖合成酶,在所测定的氨 基酸序列或在序列号5或24中所示的氨基酸序列的基础上化学合成 全部核苷酸序列。
(2)从黄瓜或大豆植株中制备染色体DNA,应用质粒载体制 备染色体DNA文库,通过杂交或PCR从该文库中获得棉子糖合成酶 基因。此外,预想到来源于染色体的棉子糖合成酶基因,其编码区域 中含有内含子,如此被内含子隔断的DNA只要能编码棉子糖合成酶 也包含在本发明的DNA中。
(3)根据分子量对poly(A)+RNA进行分级,用小麦胚或兔网织 红细胞提供体外翻译系统,确定存在编码具有棉子糖合成酶活性的多 肽的mRNA的级分,由它来制备,获得目的cDNA片段。
(4)制备抗黄瓜棉子糖合成酶抗体或抗大豆棉子糖合成酶抗 体,将cDNA文库装载到蛋白质表达载体中,感染适当的宿主,表达 cDNA所编码的蛋白质,用前面的抗体筛选目的cDNA。
(5)根据肽片段的氨基酸序列合成适当的引物,通过RACE法 扩增包含末端的序列,将之克隆化。
棉子糖合成酶基因的表达,就是将编码酶区域的DNA重组到 各种表达载体中使基因表达,详细地记载于《植物分子生物学—实 验手册》(M.S.Clark(eds.),Springer)中。可应用市售的表达载 体作载体。可根据本说明书中描述的方法通过检测活性来确定表达 情况。
作为例子对由大豆来源的棉子糖合成酶基因产生的棉子糖合 成酶的活性表达方法进行说明。应用为包含各限制性酶位点而设计 的引物进行PCR,以在包含pMOSS lox SRS的棉子糖合成酶基因 的第156位核苷酸ATG的正上游加入NdeI限制性酶位点,或在第 2405号核苷酸的下游加入BamHI位点。然后用NdeI、BamHI消 化用酚-氯仿纯化的棉子糖合成酶基因和pET3a。通过琼脂糖凝胶 电泳纯化消化的各种DNA。因为大豆来源的棉子糖合成酶基因的 内部存在BamHI位点,所以通过PCR等预先导致了突变,或通过 琼脂糖电泳可选择目的大小的片段。将纯化的棉子糖合成酶片段与 载体连接,用凝胶电泳进行确认。然后通过核苷酸序列分析来确认 棉子糖合成酶基因是从ATG密码开始的。将该载体转化E.Coli BL21(DE3)pLysE,在含有氯霉素和氨苄西林的LB培养基上 进行选择。通过PCR等来确认转化体中插入的片段,在LB培养基 上培养目的转化体,得到菌体。在含有SDS的凝胶加样缓冲液中将 菌体于100℃温育3分钟,进行SDS聚丙烯酰胺凝胶电泳,确认目 的大小的蛋白质的带。培养这样选出的菌体,用声波等破坏菌 体,提取蛋白质。用本说明书中记载的方法来测定该蛋白质提取液 的棉子糖合成酶活性。 <3>本发明棉子糖的制造方法
在本发明的棉子糖的制造方法中,将上述的棉子糖合成酶作用于 蔗糖和肌醇半乳糖苷以生成棉子糖。棉子糖合成酶作用于蔗糖和肌醇 半乳糖苷的时候,构成肌醇半乳糖苷的半乳糖残基转移到蔗糖,生成 棉子糖。此时生成构成肌醇半乳糖苷的肌醇。
棉子糖的制造中所使用的棉子糖合成酶,既可以是从植物中提 取出的酶,也可以是应用本发明的DNA通过基因重组法而制造的 酶。
为使棉子糖合成酶作用于蔗糖和肌醇半乳糖苷,可将棉子糖合成 酶或有棉子糖合成酶生产能力的细胞固定于藻酸胶和聚丙烯酰胺凝 胶等载体上,用固定了的酶或细胞填充柱子,让含有蔗糖和肌醇半乳 糖苷的溶液通过柱子。载体和将棉子糖合成酶或细胞固定于载体的方 法可应用在普通的生物反应中所应用的材料和方法。
棉子糖合成反应可这样进行,例如向含有蔗糖和肌醇半乳糖苷的 水溶液或缓冲液等溶液中加入棉子糖合成酶。上述溶液的pH约在6~ 8的范围内,尤其优选的是调整到pH 7左右。另外,反应温度为大约 28-42℃,优选35-40℃的范围内,特别优选的是在38℃左右。 此外,本发明的棉子糖合成酶在pH 5-8的范围特别是在pH 6附近 稳定。本酶至少在大约40℃以下的温度范围内稳定。
因为本发明的棉子糖合成酶其酶活性能被碘乙酰胺、N-乙基 马来酰亚胺、MnCl2、ZnCl2、NiCl2等所抑制,所以希望反应液中 不含有这些物质。
反应液中加入的肌醇半乳糖苷和蔗糖的浓度为,肌醇半乳糖苷在 5mM以上、蔗糖在1.5mM以上为宜。另外反应液中加入的棉子糖 合成酶的量可根据底物的量而进行添加。
从反应液中包含的未反应的蔗糖、肌醇半乳糖苷以及酶反应生成 的肌醇中分离棉子糖的方法可应用,例如凝胶过滤色谱法。 <4>本发明的嵌合基因及转基因植物
本发明的嵌合基因包含棉子糖合成酶基因或其一部分和在植物 细胞中能表达的转录控制区域。可例举前面<2>中记载的编码本发 明的棉子糖合成酶的DNA作为棉子糖合成酶基因。另外当应用本发 明的嵌合基因作为反义基因的时候,除编码棉子糖合成酶的DNA之 外,也可应用棉子糖合成酶基因的非翻译区或其一部分。非翻译区包 括,例如序列表序列号4中的1~55号核苷酸(5′非翻译区)、或2407 ~2517号序列(3′非翻译区),或者序列表序列号23中的1~155号 核苷酸或2406~2765号核苷酸。
本发明的嵌合基因中,当转录控制区域与编码棉子糖合成酶的 DNA连接以表达与该DNA编码链同源的mRNA(有义RNA)的时 候,导入了该嵌合基因的植物细胞表达棉子糖合成酶,棉子糖家族寡 糖的含量增高。另一方面,当为了表达有前述的DNA编码链互补序 列的RNA(反义RNA),前述的转录控制区域与前述的DNA连接 的时候,以及为了表达与棉子糖合成酶基因的一部分片段,优选与上 游编码区约200个核苷酸对以上的区域相对应的有义RNA而进行连 接的时候,导入了这些嵌合基因的植物细胞,其内源性棉子糖合成酶 的表达受到抑制,棉子糖家族寡糖降低。
如上所述,用本发明的嵌合基因转化植物,通过让该基因在植物 细胞内表达可改变上述植物中棉子糖家族寡糖的含量。
适于本发明应用的植物可例举,油类作物,如大豆、油菜子、棉 花、生产砂糖的甜菜、甘蔗,以拟南芥为代表的模型植物等。
另外在植物细胞中能表达的转录控制区域可例举:如前所述的在 整个植物中表达的CaMV 35S RNA启动子、CaMV 19S RNA启动 子、胭脂碱合成酶启动子等,在绿色植物中表达的Rubis Co小亚基 启动子等,在种子等部位特异表达的ナピン(napin)、菜豆蛋白等 基因的启动子区域。另外,嵌合基因的3′末端可连接胭脂碱合成酶的 终止子、Rubis CO小亚基3′侧部位的终止子。
可用通常应用的方法,如土壤杆菌法、粒子枪法、电穿孔法、 PEG法等,用嵌合基因转化植物,要根据宿主细胞进行选用。
作为将嵌合基因导入植物的转化法可例举:土壤杆菌法、粒子枪 法、电穿孔法、PEG法等。
具体地讲,土壤杆菌法是应用双载体的方法。也就是说,用含有 来源于Ti质粒的T-DNA、在大肠杆菌等微生物中发挥作用的复制起 点、和用于选择保持有载体的植物细胞或微生物细胞的标记基因的载 体转染植物,采集植物的种子使其发育,以标记基因的表达为指标来 选择导入了载体的植物。对所得植物测定其棉子糖合成酶活性,或通 过选择棉子糖家族寡糖含量发生变化的植物来获得目的性转化植 物。
以下对将嵌合基因导入大豆的方法进行说明。大豆的转化可应用 粒子枪法(美国国家科学院院刊,86,145(1989);TIBTECH,8,145 (1990);生物/技术,6,923,(1988);植物生理,87,671(1988);发育 遗传学,11,289(1990);植物细胞组织和器官培养,33,227(1993);土 壤杆菌法(植物生理学,91,1212(1989);WO 94/02620;植物分子生物 学,9,135(1987);生物/技术,6,915(1988));电穿孔法(植物生理 学,99,81(1992);植物生理学,84,856(1989);植物细胞报道,10,97 (1991))中的任何一种方法。
粒子枪方法中优选应用胚胎(embryogenic)组织或开花后30~ 40天未成熟种子的胚轴。将大约1g的胚胎组织铺展到皮氏平皿中, 发射包被了目的嵌合基因的金粒子、钨粒子等。1小时~2小时后将 组织移入液体培养基进行培养。2周后移到为选择转化体而加入了 抗生素的培养基中,进行培养。6周后因得到了绿色的耐性不定胚, 所以将之移到新培养基中进行培养,再生成植物体。或者在应用胚轴 的时候,无菌条件下取出胚轴,用粒子枪处理后,在含有高浓度细胞 因子的MS培养基(Murashige and Skoog,Physiologia Plantrum,15, 473-497(1962))中进行培养。在黑暗中培养2周后,再在细胞因子含 量降低了的MS培养基上,在光线照射的条件下于室温培养12~16 小时。此时优选向培养基中加入作为选择标记应用的抗生素。当多芽 体从移植组织形成后,移行到未添加激素的培养基中,在其中生根。 将该幼体植株移到温室中进行培养。
在应用土壤杆菌的方法中,优选应用子叶节作为植物组织。土壤 杆菌可应用市售的LBA4404、C58、Z707等,但优选应用Z707。 载体可应用pMON530(Monsanto Co.)中插入了目的基因的质粒 等。可根据直接冻融(Direct freeze thaw)法(An等,植物分子生 物学手册A3:1-19,1988)将质粒导入根瘤土壤杆菌(Agrobacterium tumefaciens)Z707(Hepburn等,普通微生物学杂志,131,2961 (1985))。将用该嵌合基因转化的土壤杆菌培养一晚,5000rpm离心 5分钟,悬浮于B5悬浮培养基中。将大豆种子在灭菌的1/10浓度的 B5培养基中培养3天,使之发芽。切出子叶,在土壤杆菌的悬浮液 中培养2小时。将子叶移到B5培养基(含有ガンボルグ(Gamborg) B5盐(Exp.Cell.Res.,50,151(1968),ガンボルグB5维生素,3% 蔗糖,5μM苄氨基嘌呤,10μM IBA,10μM乙酰基丁香),25 ℃,光照23小时(60μEm-2S-1)的条件下培养3天。然后,为了去 除土壤杆菌,在B5培养基(5μM苄氨基嘌呤、100mg/L羧苄西林、 100mg/L万古霉素、500mg/L头孢噻肟)中25℃培养4天,每天更 换培养基。然后在B5培养基(200mg/L卡那霉素)上培养。1-2个 月形成多个幼芽。在B5培养基(0.58mg/L赤霉素,50mg/L卡那霉 素)中使幼芽延伸。然后移到B5培养基(10μM IBA)中使其生根。 驯化生根的幼植株,通过在温室中栽培获得转化体。
导入了棉子糖合成酶基因的转化体植物的确认可通过从转化体 中提取DNA,以棉子糖合成酶基因作探针进行Southern杂交来很容 易地进行确认。
附图简述
图1表示由棉子糖合成反应而生成的棉子糖的生成量与反应时 间的关系。
图2表示棉子糖合成酶的SDS-聚丙烯酰胺凝胶电泳的结果。 M表示分子量标记,S表示含有棉子糖合成酶的样品。数字表示分子 量(kDa)。
图3表示反应温度对棉子糖合成酶活性的影响。
图4表示反应pH对棉子糖合成酶活性的影响。
图5表示肌醇对棉子糖合成酶活性的影响。
图6表示棉子糖合成酶的稳定pH范围。
图7表示合成引物与肽的氨基酸序列的关系。R表示A或G, Y代表C或T,M代表A或C,K代表G或T,D代表G、A、 或T,H代表A、T或C,B代表G、T或C,N代表G、A、 T或C,I代表肌醇。
实施本发明的最佳方式
以下通过实施例对本发明进行具体说明。
首先,说明棉子糖合成酶活性的测定方法,在以下的实施例中, 它用于确定各纯化步骤中的活性级分以及检测酶的特性。 <棉子糖合成酶活性测定法>
棉子糖合成酶的活性通过应用HPLC(高效液相色谱)对棉子糖 合成反应中生成的棉子糖进行定量来测定。应用糖分析系统DX 500 (CarboPac PAI柱,脉冲电级分析检测器,ダイオネクス公司)进 行HPLC。
棉子糖合成反应是:用终浓度如下的各组分配制反应液,向反应 液中加入10~50μl的棉子糖合成酶溶液,使体积达100μl,32℃反 应进行60分钟。 [反应液组成(终浓度)]
2.5mM    蔗糖
5mM      肌醇半乳糖苷
5mM      DTT
20mM     Tris-盐酸缓冲液(pH 7.0)
如上进行反应后,向反应液中加入4倍体积的乙醇,95℃加热 30秒终止反应。离心,将离心上清减压干燥后溶解到蒸馏水中,用 糖分析系统对反应生成物中的棉子糖进行定量,作为棉子糖酶活性。 实施例1从黄瓜纯化棉子糖合成酶 <1>从黄瓜提取棉子糖合成酶
从播种后6~10周的黄瓜(品种“SUYOU”)实叶收集叶脉部 分,液氮中冻结,-80℃保存。在液氮中用乳钵将200g冻结的叶脉研 磨碎,加入缓冲液1(40mM Tris-盐酸缓冲液(pH 7.0),5mM DTT,1mM PMSF(苯甲基磺酰氟),1%ポリクラ-ルAT;ヤ ルバ公司),提取蛋白质。用纱布和ミラクロス(カルバイオケム- ノボバイオケム(Calbiochem-Novobiochem)公司)等滤器将提取 液过滤,将滤液于4℃、30,000×g离心60分钟。所得离心上清为粗 提液。 <2>阴离子交换色谱(1)
将上面所得到的粗提取液约560ml加到用缓冲液2(20mM Tris 盐酸缓冲液(pH 7.0)、5mM DTT)平衡的5个连结的强碱性阴 离子交换色谱柱(HiTrapQ;ファルマシア公司,1.6cm×2.5cm) 上,将棉子糖合成酶活性吸附到柱上。接着用5倍柱体积的缓冲液3 (20mM Tris-盐酸缓冲液(pH 7.0),0.2M NaCl,5mM DTT) 洗涤柱子,洗出非吸附的蛋白质之后,用50ml的缓冲液4(20mM Tris-HCl缓冲液(pH 7.0),0.3M NaCl,5mM DTT)从柱上洗脱 棉子糖合成酶活性。 <3>阴离子交换色谱(2)
将上面的洗脱液约75ml放置到透析管(Pormembranes MWCO:10,000;スペクトラ(Spectra)公司),对10L的缓冲液5 (20mM Tris-HCl缓冲液(pH 7.0)、0.05M NaCl,5mM DTT) 于4℃透析一晚。将透析的样品加到用缓冲液5平衡的弱碱性阴离子 交换色谱柱(DEAE-TOYOPEARL;东-ン,2.2×20cm),棉子糖 合成酶活性吸附于柱上。接着用5倍柱体积的缓冲液5洗涤柱子,洗 出非附着的蛋白质后,用20倍柱体积的0.05M~0.35M线性NaCl浓度梯度洗脱出酶活性级分。 <4>凝胶过滤色谱
用浓缩器(ヤントリプレップ10,Amicon公司)将上面得到的 洗脱液约160ml浓缩为6.5ml。每3ml上样于凝胶过滤色谱柱 (Superdex×200pg:ファルマシア公司,2.6cm×60cm)。用缓冲 液6(20mM Tris-HCl缓冲液(pH 7.0)、0.1M NaCl,5mM DTT,0.02%吐温20)平衡和洗脱柱子。从分级的各部分中收集具 有棉子糖合成酶活性的部分。 <5>羟磷灰石色谱
用ヤントリプレップ10浓缩凝胶过滤中分级出的棉子糖合成酶 活性部分约25ml,再用缓冲液7(0.01M磷酸钠缓冲液(pH 7.0)、 5mM DTT,0.02%吐温20)交换缓冲液。将所得的浓缩液约1.2ml 上样于预先用同一缓冲液平衡了的羟磷灰石色谱柱(Bio-Scale CHT-1,バイオラッド公司,0.7×5.2),吸附棉子糖合成酶活性。用 5倍柱体积(10ml)的同一缓冲液洗涤柱子后,用20倍柱体积的线 性0.01M~0.3M磷酸浓度梯度洗脱柱子得到酶活性部分。 <6>羟磷灰石再次色谱法
对如上由羟磷灰石色谱法得到的活性部分进行同样的色谱分 析,得到纯化的棉子糖合成酶级分(约2ml)。
本活性部分的蛋白质量约200μg。另外,总活性为5700nmol/ 小时,平均的蛋白质比活性约28μmol/小时/mg。该活性部分只含有 蛋白质,该蛋白质在后面所述的电泳上显示分子量约90kDa~100 kDa的单一带。所得纯化酶标准品的比活性大约为粗提取液的2000 倍,相对于用HiTrapQ进行强碱性阴离子交换色谱后的酶量,其回 收率为12%。纯化的结果总结于表1。
                           表1
                 总蛋白质     总活性      比活性     产率
                    mg        nmol/h     nmol/h/mg    %
粗提取液           1915       20700         11        -
HiTrapQ            1092       48800         45        100
DEAE-TOYOPERAL     540        33000         61        68
Superdex 200pg     1.79       26500         14800     54
羟磷灰石色谱(1)    0.51       12600         24700     26
羟磷灰石色谱(2)    0.20       5700          28500     12 实施例2棉子糖合成酶特性的研究
研究实施例1中得到的纯化棉子糖合成酶的特性。 <1>分子量的测定 (1)凝胶过滤色谱法
取10μl纯化的棉子糖合成酶,将该样品及分子量标记(凝胶过 滤用分子量标记试剂盒:ファルマシア公司)上样于凝胶过滤色谱柱 (Superdex 200pg;ファルマシア公司)。用缓冲液6(20mM Tris-HCl缓冲液(pH 7.0)、0.1M NaCl,5mM DTT,0.02%吐 温20)平衡和洗脱柱子。结果推定棉子糖合成酶的分子量约为75kDa ~95kDa。 (2)聚丙烯酰胺凝胶电泳(非变性PAGE)
取10μl纯化的棉子糖合成酶,加入等量的样品缓冲液(0.0625 M Tris-HCl(pH 6.8)、15%甘油,0.001%BPB)作为电泳样品。 将该样品10μl加到10%聚丙烯酰胺凝胶(第一化学制品厂,マル チゲル10),在0.025M Tris-0.192M甘氨酸缓冲液(pH 8.4)中, 40mA电泳60分钟。电泳后,用シルベストステイン染色试剂盒 (ナカライテスク公司)进行染色。结果,推定其分子量约90kDa~ 100kDa。 (3)SDS-聚丙烯酰胺凝胶电泳(SDS-PAGE)
取10μl纯化的棉子糖合成酶,加入等量的样品缓冲液(0.0625 Tris-HCl(pH 6.8),2%SDS,10%甘油,5%巯基乙醇,0.001% BPB),沸水浴中加热1分钟,作为电泳样品。将该样品10μl加到 10-20%梯度聚丙烯酰胺凝胶(第一化学药品厂),在含有0.1% SDS的0.025M Tris-0.192M甘氨酸缓冲液(pH 8.4)中,40mA电 泳70分钟。电泳后用シルベストステイン银染色试剂盒(ナカライ テスク公司)进行染色。结果如图2所示。结果推定分子量约为90kDa ~100kDa。 <2>反应的最适温度
按照前面的棉子糖合成酶活性的测定方法,在不同温度条件下 (28℃、32℃、36℃、40℃、44℃、48℃、52℃)测定棉子糖 合成酶活性。各反应液中加入的酶液为2μl。把32℃的酶活性作为 100时,各温度的相对活性如图3所示。结果表示棉子糖合成酶在25 ~42℃范围内显示活性,反应的最佳温度为35~40℃。 <3>最佳反应pH
按照前面所讲的棉子糖合成酶活性测定法测定不同pH条件下 (pH 4~11)棉子糖合成酶活性。各反应中应用50mM柠檬酸缓冲 液(pH 4~6),50mM磷酸缓冲液(pH 5.5~7.5),50mM Bis-Tris缓冲液(pH 6~7),20mM Tris-HCl缓冲液(pH 7~ 8.5),50mM甘氨酸-NaOH缓冲液(pH 9~11)。另外,各反 应液中加入的酶液为2μl。结果如图4所示。
结果显示棉子糖合成酶在pH 5~10的范围内具有活性,反应的 最佳pH根据所用缓冲液的种类而不同,为6~8左右。 <4>抑制剂及金属离子的研究
向纯化的棉子糖合成酶的反应液中加入终浓度为1mM的各种酶 抑制剂或金属离子,与前面同样地测定棉子糖合成酶活性。相对于未 添加抑制剂或金属离子时的酶活性的残存活性如表2所示。碘乙酰胺 显著抑制酶活性,N-乙基马来酰亚胺也有抑制效果。另外, CaCl2、CuCl2、MgCl2几乎无抑制效果,而MnCl2、ZnCl2、NiCl2显示抑制效果。
                             表2
              抑制剂或金属离子       残存活性(%)
              未加入                    100
              碘乙酰胺                  0
              N-乙基马来酰亚胺          40
              CaCl2                    115
              CuCl2                    101
              MgCl2                    96
              MnCl2                    32
              ZnCl2                    42
              NiCl2                    68 <5>肌醇的抑制
检测棉子糖合成反应的反应生成物-肌醇引起的抑制。向反应液 中加入各种浓度的肌醇,测定棉子糖合成酶活性。结果如图5所示。 随添加肌醇浓度的升高酶活性受到抑制。 <6>稳定pH
将在前面阴离子交换色谱(2)中得到的棉子糖合成酶级分在50 mM Bis-Tris HCl缓冲液(pH 5~8,含有0.5mM DTT)或20mM Tris-HCl缓冲液(pH 7~8,含0.5mM DTT)中,4℃培养4小时 后测定棉子糖合成酶活性。相对于培养中所用缓冲液pH的酶活性如 图6所示。在任一培养条件下均可看到棉子糖合成酶活性,尤其在 pH 5~7.5的范围内稳定。 <7>稳定温度
在20mM Tris-HCl缓冲液(pH7,含有5mM DTT)中培养在 前面阴离子交换色谱(2)中得到的棉子糖合成酶级分,28℃、32 ℃、37℃或40℃培养60分钟后测定棉子糖合成酶活性。结果,与 上述未进行培养处理的对照相比,在28-40℃范围内,本酶具有80% ~100%活性,在该范围内稳定。 <8>氨基酸序列的分析
将纯化棉子糖合成酶的半胱氨酸残基还原吡啶乙基化后,脱盐。 用赖氨酸肽链内切酶(无色杆菌蛋白酶1,和光纯药)将之消化,37 ℃消化12小时,形成肽片段。将所得肽片段混合液上样于反相HPLC (柱:ウオ-タ-ズμBondasphere(Φ2.1×150mm,C18,300A), ウォ-タ-ズ公司(ミリポア)),分离,获得各肽片段。用0.1%TFA (三氟醋酸)作溶剂,用乙腈的浓度梯度进行洗脱。用蛋白质测序仪 对所得肽片段中的3个片段测定其氨基酸序列。测定的各肽段的氨基 酸序列显示于序列表序列号1~3中。以下按顺序将这些肽分别叫做 肽1,2和3。 实施例3从黄瓜获得编码棉子糖合成酶的DNA <1>通过PCR法分离棉子糖合成酶cDNA的部分片段
在液氮中用乳钵将22g黄瓜的主叶脉磨碎。将研磨物加入到预热 到80℃的提取缓冲液(100mM氯化锂,100mM Tris-HCl(pH8.0),10mM EDTA,1%SDS)与等体积酚的混合液中, 搅拌后加入酚和等量的氯仿∶异戊醇(24∶1)的混合物,再进行搅拌, 将该混合液于4℃,9250×g离心15分钟,吸取上清。对该上清反复 进行酚处理,氯仿∶异戊醇处理,离心,得到上清。向上清中加入等 量的4M氯化锂,-70℃静置1小时。
室温解冻后,于4℃ 9250×g离心30分钟,得到沉淀。用2M氯 化锂、80%乙醇洗涤沉淀物各1次,干燥后溶解到2ml焦酸二乙 酯处理水中,作为总RNA。所得总RNA为2.38mg。
将全部总RNA用于应用Oligo(dT)纤维素柱的poly(A)+RNA纯化 试剂盒(STRATAGENE CLONING SYSTEMS公司),纯化poly(A)+ RNA,得到42.5μg的poly(A)+RNA。
应用逆转录酶Super Script lI(GIBCO BRL公司)从上面所得的 poly(A)+RNA合成单链cDNA。为了从该cDNA混合物分离出棉子糖 合成酶cDNA,用PCR法进行扩增。PCR中应用的引物是:在实施 例2中测定的黄瓜来源的棉子糖合成酶的肽片段氨基酸序列的基础 上,按图7所示合成单链寡核苷酸(序列号6~22)。各引物的序列 中,各字母分别代表:R为A或G,Y为C或T,M为A或C, K为G或T、D为G、A或T,H为A、T或C,B为G、T或 C,N为G、A、T或C,I为肌醇(核苷酸为次黄嘌呤)。
当5′端引物为A(A1(序列号6)、A2(序列号7)、A3(序 列号8)、A4(序列号9))和3′引物为D′(D′1(序列号21)、 D′2(序列号22)),联合应用时,或5′引物为C2(序列号14)), 3′引物为B′1(序列号18)或B′2(序列号19)时,可扩增出大约 540个核苷酸对。用TA克隆试剂盒(INVITROGENBV公司制)将 该片段克隆到质粒pCRII中,分析核苷酸序列后发现,编码肽1、2 氨基酸序列的核苷酸序列存在于两末端引物序列的内侧,由此可知前 面的扩增片段为来源于棉子糖合成酶基因的DNA片段。
为了明确克隆的上述PCR扩增的DNA片段在棉子糖合成酶基因 上的位置,用RACE试剂盒(3′Ampifinder RACE Kit(CLONTECH 公司制))进行3′RACE。
以前面的cDNA混合物作模板,应用C作5′引物(C1(序列号 13),C2(序列号14)),应用含有Oligo(dT)和锚定序列的引物为 3′引物进行PCR,然后再以如此所得的扩增片段作模板,应用位于C 内侧的D(D1(序列号15)、D2(序列号16))作5′引物,应 用Oligo(dT)-锚定引物作3′引物,进行PCR。结果,只有应用用C1 (序列号13)或C2(序列号14)和Oligo(dT)-锚定引物扩增出的 DNA作模板,用D2(序列号16)和Oligo(dT)-锚定引物进行PCR 时,扩增出约2400个核苷酸对的DNA片段。再应用C(C1(序列 号13)、C2(序列号14)作5′引物,应用Oligo(dT)-锚定引物作3′ 引物进行PCR,再将所得的扩增片段作模板,用E(序列号17)作 5′引物,用Oligo(dT)-锚定引物作3′引物进行PCR。结果,无论在 哪种情况均扩增出约300bp的DNA片段。
同样以前面的cDNA混合物作模板,用A(A1(序列号6)、 A2(序列号7)、A3(序列号8)或A4(序列号9))作5′引 物,用含有Oligo(dT)和锚定序列的引物作3′引物进行PCR,再以 所得扩增片段作模板,用位于A内侧的B(B1(序列号10)、 B2(序列号11)或B3(序列号12))作5′引物,用同一Oligo(dT) 锚定引物作3′引物进行PCR。结果应用任一种A引物的同时应用 B2引物的时候可得到大约2000bp的DNA片段。因此克隆应用 A2、B2引物扩增出的DNA片段。对核苷酸序列进行分析时发现 5′端存在编码肽片段1的氨基酸序列的核苷酸序列,而该片段用于 制备引物。另外,在3′端存在poly(A)序列和与其上游的肽片段3 相对应的核苷酸序列。
结合先前的PCR结果发现棉子糖合成酶肽片段从N末端以2、 1、3的顺序排列,先前PCR中所得的约540bp的DNA片段是接近 棉子糖合成酶基因5′末端的部分。为了筛选含有棉子糖合成酶基因全 长的cDNA克隆,希望应用能检测出接近5′末端部分的DNA作探针, 因此用所得DNA片段作探针进行cDNA文库的筛选。 <2>棉子糖合成酶cDNA编码区全长的克隆
首先,如下制作cDNA文库。应用Time Saver cDNA合成试剂盒 (Pharmacia Biotech公司制),由<1>中得到的poly(A)+RNA 3.8μg 合成双链cDNA。将所得cDNA插入到λ噬菌体载体λMOSSlox (Amersham公司制)的EcoR I限制性酶切位点后,应用Gigapack II Gold包装试剂盒(STRATAGENE CLONING SYSTEM公司制)包 装进噬菌体蛋白质中,制备成黄瓜的cDNA文库。该文库的滴度为1.46 ×107pfu/μg载体。
用上述黄瓜cDNA文库中相当于1.4×105pfu的噬菌体感染宿主 细胞大肠杆菌ER1647后,以每平皿1.0×104pfu铺到14枚直径90mm 的琼脂板上。37℃培养6.5小时后,将板上形成的噬菌斑转移到尼龙 膜上(Amersham公司Hybond-N+)。
接着,用碱处理上述尼龙膜,将转移的DNA变性、中和后洗净。 然后于80℃将该尼龙膜处理2小时,使DNA固定于膜上。
用<1>中所得的约540bp的DNA片段作探针在所得的尼龙膜上 筛选阳性克隆。用限制性酶EcoRI消化上述的约540bp的DNA片段 后进行电泳,只切出约540bp的插入部分并进行纯化。用DNA标记 和检测系统(Gene Images标记、检测系统(Amersham公司制)), 使用荧光素进行标记,用作探针。将前面的尼龙膜60℃预杂交30分 钟,然后加入标记的探针,60℃杂交16小时。将用于检测标记的 DNA的抗体(碱性磷酸酶标记的抗荧光素抗体)稀释50000倍后应 用。这次筛选中得到阳性克隆的候补株。将所得候补株同上再重复筛 选2次,得到纯化的阳性克隆。
用上述的阳性克隆感染大肠杆菌BM 25.8,在含有羧苄西林的 选择培养基上进行培养,切出含有cDNA的质粒载体pMOSSlox- CRS。该质粒的插入cDNA的长度约2.5kb。再用该质粒转化大肠 杆菌JM109,从转化体中制备质粒DNA,作为用于分析核苷酸序 列的样品。
应用Taq DyeDeoxy Terminator Cycle Sequencing Kit (Perkin-Elmer公司制),用目前已知的方法分析插入cDNA的核 苷酸序列。
结果阐明了如序列表序列号4所示的由2352对核苷酸构成的核 苷酸序列。该序列中存在与本发明者们应用的DNA探针核苷酸序列 一致的部分。另外,由核苷酸序列翻译的氨基酸序列显示于序列号4 及序列号5中。该氨基酸序列中存在与本发明者们得到的黄瓜来源的 棉子糖合成酶的肽1(序列号5中,氨基酸序号215~244)、2(序 列号5中,氨基酸序号61~79)和3(序列号5中,氨基酸序号756 ~769)相一致的部分,由此可以证实它编码棉子糖合成酶。
携带质粒pMOSSIoxCRS的大肠杆菌JM109的转化体AJ13263 (该质粒包含编码如上所得的棉子糖合成酶的DNA)于1996年11 月19日根据布达佩斯条约保藏于通商产业省工业技术院生命工学工 业技术研究所(邮编号305日本国茨城县つくば市东-丁目1番3 号),保藏号FERM BP-5748。 实施例4从大豆获得编码棉子糖合成酶的DNA <1>检索用于克隆大豆来源的棉子糖合成酶基因的探针
用黄瓜来源的棉子糖合成酶基因的全长作探针,对大豆总RNA 进行Northern杂交。探针是含有黄瓜来源的棉子糖合成酶基因的 DNA片段,其获得是用限制性酶NotI消化实施例3中得到的质粒 pMOSSlox CRS,进行琼脂糖凝胶电泳,分离插入的片段,用α-P32 dCTP标记分离的DNA片段。总RNA是应用SDS-酚法从大豆的未 成熟种子(开花后5~6周)制备的30μg总RNA。预杂交30分钟后, 加入探针,42℃杂交一晚上。1×SSC、0.1%SDS,60℃的条件下洗 涤。可以看到作为对照的黄瓜来源的棉子糖合成酶的信号,但未得到 与大豆来源的RNA相对的明确信号。由此可以判断希望应用更保守 区域作探针而非用黄瓜基因全长作探针。 <2>分离拟南芥棉子糖合成酶基因的部分片段
在液氮中用乳钵将拟南芥开花后17~20日的荚125mg研碎。向 该研碎物中加入3ml 2×CTAB(2%三甲基十六烷基溴化铵,0.1M Tris-HCl(pH 9.5),1.4M NaCl,0.5%巯基乙醇)使之扩散,65℃振 荡10分钟。将之移到フアルコンチュ-ブ的ブル-マッウス(50 ml)中。加入3ml的氯仿∶异戊醇(24∶1(v/v)轻轻混和,12000rpm 离心10分钟。用3ml氯仿∶异戊醇(24∶1 v/v)再将上清抽提,10000 rpm离心25分钟。1.8ml离心上清中加入1.5ml异戊醇,混和,12000 rpm,4℃离心15分钟得到沉淀。用70%乙醇洗涤沉淀后,将沉淀 干燥,溶解到1ml TE缓冲液中。加入1/4的10M氯化锂溶液,混 和,中静置4小时,12000rpm,4℃离心15分钟。用2M氯化锂、 70%乙醇将沉淀洗涤、干燥后,溶解到100μl的TE缓冲液中。加入 酚∶氯仿(1∶1(v/v)),搅拌,12000rpm,4℃离心15分钟,得到水 相。乙醇沉淀水相,用70%乙醇洗涤沉淀后干燥,溶解于10μl焦碳 酸二乙酯处理水中,作为总RNA。所得总RNA为18.7μg。用逆转 录酶Super Script II(GIBCO BRL公司制)由总RNA合成单链 cDNA。
为了通过PCR从该cDNA混和物中扩增棉子糖合成酶基因部分 片段,合成引物。在GenBank中检索与黄瓜棉子糖合成酶基因具有 同源性的DNA,在保守区域的基础上合成单链寡核苷酸(序列号25、 26)作探针。以前面的单链cDNA作模板,应用该引物进行PCR, 扩增出约250bp的DNA片段。用TA克隆试剂盒(INVITROGEN BV 公司制)将该片段克隆到质粒pCR2.1中,分析其核苷酸序列,结果 得到序列号27所示的核苷酸序列。由此断定得到与黄瓜棉子糖合成 酶具有同源性的拟南芥棉子糖合成酶cDNA的部分片段。 <3>大豆棉子糖合成酶cDNA的克隆
在液氮中用乳钵研磨大豆开花后5-6周的种子4.5g。用SDS -酚法从研磨物中提取出1.3mg的总RNA。将提取物过Oligo-dT纤 维素柱(poly(A)+RNA纯化试剂盒:STRATAGENE CLONING SYSTEM公司制),分离出约6μg的poly(A)+RNA。应用Time Saver cDNA合成试剂盒(Pharmacia biotech公司制),通过应用Oligo-dT 引物,从其中的2μg poly(A)+RNA合成双链cDNA。将所得cDNA 整合到λ噬菌体载体λMOSS lox(Amersham公司制)的EcoRI限制 性酶切位点后,用Gigapack II Gold包装试剂盒(STRATAGENE CLONING SYSTEM公司)包装入噬菌粒中,制备大豆的cDNA文库。 本文库的效价为1.42×107pfu/μg载体DNA。
将大豆的cDNA文库中,相当于1.5×105pfu的噬菌体,与黄瓜 cDNA文库同样地转移固定到尼龙膜(Hybond-N+;Amersham公司) 上。一板转移2块膜以制备2组。用<2>中得到的拟南芥棉子糖合 成酶基因cDNA的部分片段对尼龙膜进行筛选,用Gene Images标记 检测系统(Amersham公司)对该DNA片段进行荧光素标记。杂交 及检测与黄瓜cDNA文库的筛选相同。但是膜的洗涤是1组用 1×SSC、0.1%SDS,一组用0.1×SSC、0.1%SDS,60℃进行。两种 条件下得到15个阳性克隆候补株,对候补株进行与上面同样的筛 选,再重复1次,得纯化的克隆5株。
用上述阳性克隆感染E.coli BM 25.8,切出含cDNA的质粒。再 用该质粒转化E.coli JM109,从转化体制备质粒DNA,作为核苷酸 序列分析用的样品。核苷酸序列的分析与黄瓜棉子糖合成酶基因的相 同。对5克隆中的一个—pMOSS lox SRS进行了核苷酸序列分析, 结果证实它含有大豆来源的棉子糖合成酶基因全长。
pMOSS lox SRS的插入片段含有如序列号23所示的2780对核 苷酸构成的序列,编码由750个氨基酸构成的棉子糖合成酶。其它 克隆的插入片段较pMOSS lox SRS的短,缺失棉子糖合成酶基因的 5′端。
携带质粒pMOSS lox SRS的大肠杆菌JM109的转化体AJ 13379 (该质粒含有编码如上所得的棉子糖合成酶的DNA的片段)于1997 年10月20日,按照布达佩斯条约保藏于通商产业省工业技术院生命 工学工业技术研究所(邮编305,日本国茨城县つくば市东-丁目1 番3号),保藏号为FERM BP-6149。 实施例5含有编码棉子糖合成酶的DNA的嵌合基因及其转化植物 <1>含有嵌合基因质粒的构建
用LBA 4404作土壤杆菌,用pBI 121(CLONTECH公司)作双 载体,将棉子糖合成酶的DNA片段导入拟南芥。pBI 121是来源于 pBIN19的质粒,连接有胭脂碱合成酶基因启动子、新霉素磷酸转移 酶结构基因(NPT II)、胭脂碱合成酶终止子(Nos-ter)、CaMV 35S启动子、GUS(β-葡糖苷酸酶)基因、及Nos-ter,其两侧有可 转座进入植物的序列。CaMV 35S启动子的下游有SmaI位点,插入 该位点的插入子在该启动子的调控下表达。
将实施例3中得到的黄瓜棉子糖合成酶基因片段插入双载体pBI 121。用DraI消化棉子糖合成酶基因,通过琼脂糖凝胶电泳可制备出 含有序列表序列号4中1382~2529号核苷酸的DNA片段。将该片段 连接到pBI 121的Sma I位点。用该连接反应液转化大肠杆菌HB101, 由转化体制备重组质粒。从所得重组质粒中选择2种棉子糖合成酶 DNA片段与CaMV 35S启动子逆向连接的质粒(反义),正向连接 的质粒(有义),分别命名为pBIcRS1和pBIcRS9。
另外,构建含有表达棉子糖合成酶的嵌合基因的质粒。用NotI 消化含有棉子糖合成酶的pMOSS lox CRS,通过琼脂糖凝胶电泳制 备棉子糖合成酶基因片段。用dNTP,通过Taq聚合酶反应补齐该 DNA片段的NotI酶切位点,得到3′端A核苷酸突出的CRS片段。另 一方面,用Sma I消化pBI121,通过琼脂糖凝胶电泳纯化直链DNA, 用dTTP,通过Taq聚合酶反应得到3′端添加了T核苷酸的 pBI121/SmaI。纯化后,将CRS片段连接到pBI121/Sma I。用该连 接反应液转化大肠杆菌HB 101。从所得转化体中制备质粒DNA,分 别用限制性酶EcoRI、BamHI、XhoI或联合应用进行消化。用琼脂 糖电泳测定所得片段的分子量,制成物理图。在制备的物理图的基础 上,从重组质粒中选择棉子糖合成酶基因与CaMV 35S启动子正向连 接的质粒,命名为pBIs RS1。
通过含有如上所得质粒的大肠杆菌HB101与土壤杆菌LBA 4404 的三亲交配,将该质粒导入土壤杆菌LBA 4404中。 <2>转化
拟南芥的转化如下进行。将拟南芥(Arabidopsis thaliana)的种 子进行吸水处理后,在含有1%吐温20的80%乙醇中处理5分钟, 在同样含有1%吐温20的10%次氯酸钠中处理10分钟,用灭菌水 洗涤5次进行灭菌。将之悬浮到1%低融点琼脂糖中,铺到MS培养 基(MS基本培养基(Murashige and Skoog,Physiologia Plantrum, 15,473-497(1962))、维生素B5,10g/L蔗糖,0.5g/L MES,pH8.5)。 在22℃光照16小时,黑暗8小时的条件下,在培养室中培养1周, 当双叶展开的时候,用ロツクウ-ル固定植株。在同样的条件下继续 培养3周,植物抽苔,当苔的高度达数厘米的时候,摘心。摘心后1 周,植物培育至伸长的侧枝最初的花开花的状态。
在2ml LB培养基上预培养导入了含有棉子糖合成酶基因的重组 质粒的土壤杆菌。将之接种到含有50mg/L卡那霉素、25mg/L链霉 素的LB培养基上,28℃培养1日左右。室温下收集细菌,悬浮到浸 润用的悬浮培养基(1/2 MS盐,1/2ガンボルゲ(Gamborg)维生 素B5,5%蔗糖,0.5g/L MES,pH5.7(KOH),使用前加入终浓度 为0.044μM的苄氨基嘌呤和シルウェット(Silwet L77),200μ/L (终浓度为0.02%),使菌液的OD600为0.8。
从植株上摘下开花并结果的花进行浸润。颠倒ロックウ-ル,将 未结果实的花浸到上述土壤杆菌悬浮液中,加到干燥器中,40mm HG下减压15分钟。2-4周后收集种子。在干燥器中保存收集的种 子。
接着在选择培养基上选择转化体。按先前所述的方法对种子进行 灭菌,在选择培养基(MS盐,ガンボルゲ维生素B5,1%蔗糖, 0.5g/L MES,pH 5.8、0.8%琼脂;高压灭菌后加入选择用的抗生素: 羧苄西林(终浓度100mg/L),卡那霉素(终浓度50mg/L))中22 ℃进行培养,选择抗性植物。将抗性植物移到新培养基上,培育到真 叶展开。从这些植物收获种子。重复同样的选择,获得T3种子。按 前面讲述的方法测定T3种子中棉子糖的含量,结果如表3所示。
                         表3
            植物(质粒)           棉子糖含量(mg/g)
            野生株                  0.20
            转化体(pBIcRS1)         0.00
            转化体(pBIcRS9)         0.00
            转化体(pBIsRS1)         0.22
工业实用性
本发明提供纯化的棉子糖合成酶,棉子糖合成酶基因,含有棉子 糖合成酶基因和能在植物中表达的调控区域的嵌合基因,以及导入了 该嵌合基因的植物。
通过应用本发明的棉子糖合成酶可从蔗糖和肌醇半乳糖苷有效 地合成棉子糖,另外,通过应用本发明的棉子糖合成酶基因或嵌合基 因可改变植物中棉子糖家族寡糖的含量。
                          序列表 (1)一般情况    (i)申请人:味の素株式会社    (ii)发明名称:棉子糖合成酶基因、棉子糖的制备方法及其转化
             的植物    (iii)序列数:30    (iv)联络地址:
  (A)收信人:味の素株式会社
  (B)街道:京桥一丁目15番1号
  (C)市:中央区
  (D)州:东京都
  (E)国:日本国
  (F)ZIP:104    (v)计算机可读形式
  (A)介质类型:软盘
  (B)计算机:IBM PC兼容机
  (C)操作系统:PC-DOS/MS-DOS
  (D)软件:PatentIn    (vi)本申请数据
  (A)申请号:
  (B)申请日期:24.10.97
  (C)分类:
  (D)参考号:B368AW20P628    (vii)在先申请数据
  (A)申请号:JP 1997111124
  (B)申请日期:28.04.97 (2)与序列1相关的情报    (i)序列的性质
  (A)长度:30
  (B)种类:氨基酸
  (D)拓扑学:直链
(ii)序列的种类:肽
(v)片段类型:中间的肽
(xi)序列:序列编号1   Phe Gly Trp Cys Thr Trp Asp Ala Phe Tyr Leu Thr Val His Pro Gln
1               5                  10                  15   Gly Val Ile Glu Gly Val Arg His Leu Val Asp Gly Gly Cys
           20                  25                  30 (2)与序列2相关的情报    (i)序列的性质
  (A)长度:19
  (B)种类:氨基酸
  (D)拓扑学:直链    (ii)序列的种类:肽    (v)片段类型:中间的肽    (xi)序列:序列编号2   Pro Val Ser Val Gly Cys Phe Val Gly Phe Asp Ala Ser Glu Pro Asp
1               5                  10                  15   Ser Arg His (2)与序列3相关的情报    (i)序列的性质
  (A)长度:14
  (B)种类:氨基酸
  (D)拓扑学:直链    (ii)序列的种类:肽    (v)片段类型:中间的肽    (xi)序列:序列编号3   Tyr Asp Gln Asp Gln Met Val Val Val Gln Val Pro Trp Pro
1               5                  10 (2)与序列4相关的情报    (i)序列的性质
  (A)长度:2569
  (B)种类:核酸
  (C)链数:双链
  (D)拓扑学:直链    (ii)序列的种类:cDNA到mRNA    (vi)起源
  (A)生物名:黄瓜(Cucumis sativus)    (ix)序列的特征
  (A)表示特征的符号:CDS
  (B)存在位置:56..2407    (xi)序列:序列编号4 AAAAAACAAC CCTTCTTTTA GTTTTTTGGG TTTGTTTCTT CTTTTCTTCT CACAA ATG      58
                                                         Met
                                                           1 GCT CCT AGT TTT AAA AAT GGT GGC TCC AAC GTA GTT TCA TTT GAT GGC      106 Ala Pro Ser Phe Lys Asn Gly Gly Ser Asn Val Val Ser Phe Asp Gly
          5                  10                  15 TTA AAT GAC ATG TCG TCA CCG TTT GCA ATC GAC GGA TCG GAT TTC ACT      154 Leu Asn Asp Met Ser Ser Pro Phe Ala Ile Asp Gly Ser Asp Phe Thr
     20                  25                  30 GTG AAC GGT CAT TCG TTT CTG TCC GAT GTT CCT GAG AAC ATT GTT GCT      202 Val Asn Gly His Ser Phe Leu Ser Asp Val Pro Glu Asn Ile Val Ala
 35                  40                  45 TCT CCT TCT CCG TAC ACT TCG ATA GAC AAG TCC CCG GTT TCG GTT GGT      250 Ser Pro Ser Pro Tyr Thr Ser Ile Asp Lys Ser Pro Val Ser Val Gly  50                  55                  60                  65 TGC TTT GTT GGA TTC GAC GCG TCG GAA CCT GAT AGC CGA CAT GTT GTT      298 Cys Phe Val Gly Phe Asp Ala Ser Glu Pro Asp Ser Arg His Val Val
             70                  75                  80 TCG ATT GGG AAG CTG AAG GAT ATT CGG TTT ATG AGT ATT TTC AGG TTT      346 Ser Ile Gly Lys Leu Lys Asp Ile Arg Phe Met Ser Ile Phe Arg Phe
         85                  90                  95 AAG GTT TGG TGG ACT ACA CAC TGG GTT GGT CGA AAT GGT GGG GAT CTT      394 Lys Val Trp Trp Thr Thr His Trp Val Gly Arg Asn Gly Gly Asp Leu
    100                 105                 110 GAA TCG GAG ACT CAG ATT GTG ATC CTT GAG AAG TCA GAT TCT GGT CGA      442 Glu Ser Glu Thr Gln Ile Val Ile Leu Glu Lys Ser Asp Ser Gly Arg
115                 120                 125 CCG TAT GTT TTC CTT CTT CCG ATC GTT GAG GGA CCG TTC CGA ACC TCG      490 Pro Tyr Val Phe Leu Leu Pro Ile Val Glu Gly Pro Phe Arg Thr Ser 130                 135                 140                 145 ATT CAG CCT GGG GAT GAT GAC TTT GTC GAT GTT TGT GTC GAG AGT GGT      538 Ile Gln Pro Gly Asp Asp Asp Phe Val Asp Val Cys Val Glu Ser Gly
            150                 155                 160 TCG TCG AAA GTT GTT GAT GCA TCG TTC CGA AGT ATG TTG TAT CTT CAT      586 Ser Ser Lys Val Val Asp Ala Ser Phe Arg Ser Met Leu Tyr Leu His
        165                 170                 175 GCT GGT GAT GAT CCC TTT GCA CTT GTT AAA GAG GCG ATG AAG ATC GTG      634 Ala Gly Asp Asp Pro Phe Ala Leu Val Lys Glu Ala Met Lys Ile Val
    180                 185                 190 AGG ACC CAT CTT GGA ACT TTT CGC TTG TTG GAG GAG AAG ACT CCA CCA      682 Arg Thr His Leu Gly Thr Phe Arg Leu Leu Glu Glu Lys Thr Pro Pro
195                 200                 205 GGT ATC GTG GAC AAA TTC GGT TGG TGC ACG TGG GAC GCG TTT TAC CTA      730 Gly Ile Val Asp Lys Phe Gly Trp Cys Thr Trp Asp Ala Phe Tyr Leu 210                 215                 220                 225 ACG GTT CAT CCA CAG GGC GTA ATA GAA GGC GTG AGG CAT CTC GTC GAC      778 Thr Val His Pro Gln Gly Val Ile Glu Gly Val Arg His Leu Val Asp
            230                 235                 240 GGC GGT TGT CCT CCC GGT TTA GTC CTA ATC GAC GAT GGT TGG CAA TCC      826 Gly Gly Cys Pro Pro Gly Leu Val Leu Ile Asp Asp Gly Trp Gln Ser
        245                 250                 255 ATC GGA CAC GAT TCG GAT CCC ATC ACC AAA GAA GGA ATG AAC CAA ACC      874 Ile Gly His Asp Ser Asp Pro Ile Thr Lys Glu Gly Met Asn Gln Thr
    260                 265                 270 GTC GCC GGC GAG CAA ATG CCC TGC CGT CTT TTG AAA TTC CAA GAG AAT      922 Val Ala Gly Glu Gln Met Pro Cys Arg Leu Leu Lys Phe Gln Glu Asn
275                 280                 285 TAC AAA TTC CGT GAC TAC GTC AAT CCC AAG GCC ACC GGC CCC CGA GCC      970 Tyr Lys Phe Arg Asp Tyr Val Asn Pro Lys Ala Thr Gly Pro Arg Ala 290                 295                 300                 305 GGC CAG AAG GGG ATG AAG GCG TTT ATA GAT GAA CTC AAA GGA GAG TTT     1018 Gly Gln Lys Gly Met Lys Ala Phe Ile Asp Glu Leu Lys Gly Glu Phe
            310                 315                 320 AAG ACT GTG GAG CAT GTT TAT GTT TGG CAT GCT TTG TGT GGA TAT TGG     1066 Lys Thr Val Glu His Val Tyr Val Trp His Ala Leu Cys Gly Tyr Trp
        325                 330                 335 GGT GGC CTT CGC CCG CAG GTG CCT GGC TTG CCT GAG GCA CGT GTG ATT     1114 Gly Gly Leu Arg Pro Gln Val Pro Gly Leu Pro Glu Ala Arg Val Ile
    340                 345                 350 CAG CCA GTG CTT TCA CCA GGG CTG CAG ATG ACG ATG GAG GAT TTG GCG     1162 Gln Pro Val Leu Ser Pro Gly Leu Gln Met Thr Met Glu Asp Leu Ala
355                 360                 365 GTG GAT AAG ATT GTT CTT CAT AAG GTC GGG CTG GTC CCG CCG GAG AAG     1210 Val Asp Lys Ile Val Leu His Lys Val Gly Leu Val Pro Pro Glu Lys 370                 375                 380                 385 GCT GAG GAG ATG TAC GAA GGA CTT CAT GCT CAT TTG GAA AAA GTT GGG     1258 Ala Glu Glu Met Tyr Glu Gly Leu His Ala His Leu Glu Lys Val Gly
            390                 395                 400 ATC GAC GGT GTT AAG ATT GAC GTT ATC CAC CTA TTG GAG ATG TTG TGT     1306 Ile Asp Gly Val Lys Ile Asp Val Ile His Leu Leu Glu Met Leu Cys
        405                 410                 415 GAA GAC TAT GGA GGG AGA GTG GAT TTG GCA AAG GCA TAT TAC AAA GCA     1354 Glu Asp Tyr Gly Gly Arg Val Asp Leu Ala Lys Ala Tyr Tyr Lys Ala
    420                 425                 430 ATG ACC AAA TCA ATA AAT AAA CAT TTT AAA GGA AAT GGA GTC ATT GCA     1402 Met Thr Lys Ser Ile Asn Lys His Phe Lys Gly Asn Gly Val Ile Ala
435                 440                 445 AGT ATG GAA CAT TGT AAC GAC TTC ATG TTC CTT GGC ACG GAA GCT ATC     1450 Ser Met Glu His Cys Asn Asp Phe Met Phe Leu Gly Thr Glu Ala Ile 450                 455                 460                 465 TCT CTT GGT CGT GTT GGT GAT GAC TTT TGG TGC ACG GAC CCC TCT GGT     1498 Ser Leu Gly Arg Val Gly Asp Asp Phe Trp Cys Thr Asp Pro Ser Gly
            470                 475                 480 GAT CCA AAC GGT ACG TTT TGG CTC CAA GGA TGT CAC ATG GTT CAT TGT     1546 Asp Pro Asn Gly Thr Phe Trp Leu Gln Gly Cys His Met Val His Cys
        485                490                  495 GCC AAC GAC AGC TTG TGG ATG GGG AAC TTC ATC CAC CCT GAC TGG GAT     1594 Ala Asn Asp Ser Leu Trp Met Gly Asn Phe Ile His Pro Asp Trp Asp
    500                 505                 510 ATG TTC CAA TCC ACC CAC CCT TGT GCC GCC TTC CAT GCT GCC TCT CGA     1642 Met Phe Gln Ser Thr His Pro Cys Ala Ala Phe His Ala Ala Ser Arg
515                 520                 525 GCC ATC TCT GGT GGC CCG ATC TAT GTT AGT GAT TCT GTG GGA AAG CAT     1690 Ala Ile Ser Gly Gly Pro Ile Tyr Val Ser Asp Ser Val Gly Lys His 530                 535                 540                 545 AAC TTT GAT CTT CTG AAA AAA CTA GTG CTT CCT GAT GGA TCG ATC CTT     1738 Asn Phe Asp Leu Leu Lys Lys Leu Val Leu Pro Asp Gly Ser Ile Leu
            550                 555                 560 CGA AGT GAG TAC TAT GCA CTC CCG ACT CGC GAT TGT TTG TTT GAA GAC     1786 Arg Ser Glu Tyr Tyr Ala Leu Pro Thr Arg Asp Cys Leu Phe Glu Asp
        565                 570                 575 CCT TTG CAT AAT GGA GAA ACT ATG CTT AAG ATT TGG AAT CTC AAC AAG     1834 Pro Leu His Asn Gly Glu Thr Met Leu Lys Ile Trp Asn Leu Asn Lys
    580                 585                 590 TTC ACT GGA GTG ATT GGT GCA TTC AAC TGC CAA GGA GGA GGA TGG TGT     1882 Phe Thr Gly Val Ile Gly Ala Phe Asn Cys Gln Gly Gly Gly Trp Cys
595                 600                 605 CGT GAG ACA CGC CGC AAC CAA TGC TTT TCA CAA TAC TCA AAA CGA GTG     1930 Arg Glu Thr Arg Arg Asn Gln Cys Phe Ser Gln Tyr Ser Lys Arg Val 610                 615                 620                 625 ACA TCC AAA ACT AAC CCA AAA GAC ATA GAA TGG CAC AGT GGA GAA AAC     1978 Thr Ser Lys Thr Asn Pro Lys Asp Ile Glu Trp His Ser Gly Glu Asn
            630                 635                 640 CCT ATC TCT ATT GAA GGC GTT AAA ACC TTT GCG CTT TAC CTC TAT CAA     2026 Pro Ile Ser Ile Glu Gly Val Lys Thr Phe Ala Leu Tyr Leu Tyr Gln
        645                 650                 655 GCC AAA AAA CTT ATC CTC TCC AAG CCC TCT CAA GAT CTT GAC ATA GCT     2074 Ala Lys Lys Leu Ile Leu Ser Lys Pro Ser Gln Asp Leu Asp Ile Ala
    660                 665                 670 CTT GAC CCA TTC GAA TTC GAG CTC ATC ACT GTT TCA CCA GTG ACC AAA     2122 Leu Asp Pro Phe Glu Phe Glu Leu Ile Thr Val Ser Pro Val Thr Lys
675                 680                 685 CTC ATC CAA ACT TCT CTA CAC TTT GCC CCA ATT GGG CTG GTG AAC ATG     2170 Leu Ile Gln Thr Ser Leu His Phe Ala Pro Ile Gly Leu Val Asn Met 690                 695                 700                 705 CTT AAC ACT AGT GGA GCC ATC CAA TCT GTG GAC TAT GAC GAT GAC CTA     2218 Leu Asn Thr Ser Gly Ala Ile Gln Ser Val Asp Tyr Asp Asp Asp Leu
            710                 715                 720 AGC TCA GTC GAG ATT GGT GTC AAA GGG TGT GGT GAG ATG CGA GTA TTT     2266 Ser Ser Val Glu Ile Gly Val Lys Gly Cys Gly Glu Met Arg Val Phe
        725                 730                 735 GCA TCG AAA AAA CCA AGG GCT TGT CGT ATT GAT GGG GAG GAT GTT GGG     2314 Ala Ser Lys Lys Pro Arg Ala Cys Arg Ile Asp Gly Glu Asp Val Gly
    740                 745                 750 TTC AAG TAT GAT CAG GAC CAA ATG GTG GTG GTT CAA GTG CCA TGG CCA     2362 Phe Lys Tyr Asp Gln Asp Gln Met Val Val Val Gln Val Pro Trp Pro
755                 760                 765 ATT GAT TCT TCA TCG GGT GGC ATT TCG GTT ATC GAG TAC TTG TTT         2407 Ile Asp Ser Ser Ser Gly Gly Ile Ser Val Ile Glu Tyr Leu Phe 770                 775                 780 TAATTTTTAT TTATGTARAG CTCAATGATT GTTGTTGTTG TCGCTGTTGT TGCTATCAAT   2467 GTATTTCTCT CCAAAAGAAA ATTATGTGTA ATTTGGAGAG TAATTAAGTG AGTKAAATTT   2527 TAAATAARAC TACTTTTAAT TATTTATCAA AAAAAAAAAA AA                      2569 (2)与序列5相关的情报    (i)序列的性质
  (A)长度:784
  (B)种类:核酸
  (D)拓扑学:直链    (ii)序列的种类:蛋白质    (xi)序列:序列编号5 Met Ala Pro Ser Phe Lys Asn Gly Gly Ser Asn Val Val Ser Phe Asp   1               5                  10                  15 Gly Leu Asn Asp Met Ser Ser Pro Phe Ala Ile Asp Gly Ser Asp Phe
         20                  25                  30 Thr Val Asn Gly His Ser Phe Leu Ser Asp Val Pro Glu Asn Ile Val
     35                  40                  45 Ala Ser Pro Ser Pro Tyr Thr Ser Ile Asp Lys Ser Pro Val Ser Val
 50                  55                  60 Gly Cys Phe Val Gly Phe Asp Ala Ser Glu Pro Asp Ser Arg His Val  65                  70                  75                  80 Val Ser Ile Gly Lys Leu Lys Asp Ile Arg Phe Met Ser Ile Phe Arg
             85                  90                  95 Phe Lys Val Trp Trp Thr Thr His Trp Val Gly Arg Asn Gly Gly Asp
        100                 105                 110 Leu Glu Ser Glu Thr Gln Ile Val Ile Leu Glu Lys Ser Asp Ser Gly
    115                 120                 125 Arg Pro Tyr Val Phe Leu Leu Pro Ile Val Glu Gly Pro Phe Arg Thr
130                 135                 140 Ser Ile Gln Pro Gly Asp Asp Asp Phe Val Asp Val Cys Val Glu Ser 145                 150                 155                 160 Gly Ser Ser Lys Val Val Asp Ala Ser Phe Arg Ser Met Leu Tyr Leu
            165                 170                 175 His Ala Gly Asp Asp Pro Phe Ala Leu Val Lys Glu Ala Met Lys Ile
        180                 185                 190 Val Arg Thr His Leu Gly Thr Phe Arg Leu Leu Glu Glu Lys Thr Pro
    195                 200                 205 Pro Gly Ile Val Asp Lys Phe Gly Trp Cys Thr Trp Asp Ala Phe Tyr
210                 215                 220 Leu Thr Val His Pro Gln Gly Val Ile Glu Gly Val Arg His Leu Val 225                 230                 235                 240 Asp Gly Gly Cys Pro Pro Gly Leu Val Leu Ile Asp Asp Gly Trp Gln
            245                 250                 255 Ser Ile Gly His Asp Ser Asp Pro Ile Thr Lys Glu Gly Met Asn Gln
        260                 265                 270 Thr Val Ala Gly Glu Gln Met Pro Cys Arg Leu Leu Lys Phe Gln Glu
    275                 280                 285 Asn Tyr Lys Phe Arg Asp Tyr Val Asn Pro Lys Ala Thr Gly Pro Arg
290                 295                 300 Ala Gly Gln Lys Gly Met Lys Ala Phe Ile Asp Glu Leu Lys Gly Glu 305                 310                 315                 320 Phe Lys Thr Val Glu His Val Tyr Val Trp His Ala Leu Cys Gly Tyr
            325                 330                 335 Trp Gly Gly Leu Arg Pro Gln Val Pro Gly Leu Pro Glu Ala Arg Val
        340                 345                 350 Ile Gln Pro Val Leu Ser Pro Gly Leu Gln Met Thr Met Glu Asp Leu
    355                 360                 365 Ala Val Asp Lys Ile Val Leu His Lys Val Gly Leu Val Pro Pro Glu
370                 375                 380 Lys Ala Glu Glu Met Tyr Glu Gly Leu His Ala His Leu Glu Lys Val 385                 390                 395                 400 Gly Ile Asp Gly Val Lys Ile Asp Val Ile His Leu Leu Glu Met Leu
            405                 410                 415 Cys Glu Asp Tyr Gly Gly Arg Val Asp Leu Ala Lys Ala Tyr Tyr Lys
        420                 425                 430 Ala Met Thr Lys Ser Ile Asn Lys His Phe Lys Gly Asn Gly Val Ile
    435                 440                 445 Ala Ser Met Glu His Cys Asn Asp Phe Met Phe Leu Gly Thr Glu Ala
450                 455                 460 Ile Ser Leu Gly Arg Val Gly Asp Asp Phe Trp Cys Thr Asp Pro Ser 465                 470                 475                 480 Gly Asp Pro Asn Gly Thr Phe Trp Leu Gln Gly Cys His Met Val His
            485                 490                 495 Cys Ala Asn Asp Ser Leu Trp Met Gly Asn Phe Ile His Pro Asp Trp
        500                 505                 510 Asp Met Phe Gln Ser Thr His Pro Cys Ala Ala Phe His Ala Ala Ser
    515                 520                 525 Arg Ala Ile Ser Gly Gly Pro Ile Tyr Val Ser Asp Ser Val Gly Lys
530                 535                 540 His Asn Phe Asp Leu Leu Lys Lys Leu Val Leu Pro Asp Gly Ser Ile 545                 550                 555                 560 Leu Arg Ser Glu Tyr Tyr Ala Leu Pro Thr Arg Asp Cys Leu Phe Glu
            565                 570                 575 Asp Pro Leu His Asn Gly Glu Thr Met Leu Lys Ile Trp Asn Leu Asn
        580                 585                 590 Lys Phe Thr Gly Val Ile Gly Ala Phe Asn Cys Gln Gly Gly Gly Trp
    595                 600                 605  Cys Arg Glu Thr Arg Arg Asn Gln Cys Phe Ser Gln Tyr Ser Lys Arg
610                 615                 620 Val Thr Ser Lys Thr Asn Pro Lys Asp Ile Glu Trp His Ser Gly Glu 625                 630                 635                 640 Asn Pro Ile Ser Ile Glu Gly Val Lys Thr Phe Ala Leu Tyr Leu Tyr
            645                 650                 655 Gln Ala Lys Lys Leu Ile Leu Ser Lys Pro Ser Gln Asp Leu Asp Ile
        660                 665                 670 Ala Leu Asp Pro Phe Glu Phe Glu Leu Ile Thr Val Ser Pro Val Thr
    675                 680                 685 Lys Leu Ile Gln Thr Ser Leu His Phe Ala Pro Ile Gly Leu Val Asn
690                 695                 700 Met Leu Asn Thr Ser Gly Ala Ile Gln Ser Val Asp Tyr Asp Asp Asp 705                 710                 715                 720 Leu Ser Ser Val Glu Ile Gly Val Lys Gly Cys Gly Glu Met Arg Val
            725                 730                 735 Phe Ala Ser Lys Lys Pro Arg Ala Cys Arg Ile Asp Gly Glu Asp Val
        740                 745                 750 Gly Phe Lys Tyr Asp Gln Asp Gln Met Val Val Val Gln Val Pro Trp
    755                 760                 765 Pro Ile Asp Ser Ser Ser Gly Gly Ile Ser Val Ile Glu Tyr Leu Phe
770                 775                 780 (2)与序列6相关的情报    (i)序列的性质
  (A)长度:23
  (B)种类:核酸
  (C)链数:单链
  (D)拓扑学:直链    (ii)序列的种类:其它核酸
  (A)说明:合成DNA    (xi)序列:序列编号6 TTYTAYCTBA CHGTNCAYCC TCA                                             23 (2)与序列7相关的情报    (i)序列的性质
  (A)长度:23
  (B)种类:核酸
  (C)链数:单链
  (D)拓扑学:直链    (ii)序列的种类:其它核酸
  (A)说明:合成DNA    (xi)序列:序列编号7 TTYTAYCTBA CHGTNCAYCC CCA                                             23 (2)与序列8相关的情报    (i)序列的性质
  (A)长度:23
  (B)种类:核酸
  (C)链数:单链
  (D)拓扑学:直链    (ii)序列的种类:其它核酸
  (A)说明:合成DNA    (xi)序列:序列编号8 TTYTAYCTBA CHGTNCAYCC ACA                                            23 (2)与序列9相关的情报    (i)序列的性质
  (A)长度:23
  (B)种类:核酸
  (C)链数:单链
  (D)拓扑学:直链    (ii)序列的种类:其他核酸
  (A)说明:合成DNA    (xi)序列:序列编号9 TTYTAYCTBA CHGTNCAYCC GCA                                            23 (2)与序列10相关的情报    (i)序列的性质
  (A)长度:26
  (B)种类:核酸
  (C)链数:单链
  (D)拓扑学:直链    (ii)序列的种类:其它核酸
  (A)说明:合成DNA    (ix)序列特征
  (D)其他情报:6号及11号的核苷酸N为肌醇,其它的N
               代表A、G、C或T。    (xi)序列:序列编号10 GARGGNGTNM GNCAYCTRGT NGAYGG                                         26 (2)与序列11相关的情报    (i)序列的性质
  (A)长度:26
  (B)种类:核酸
  (C)链数:单链
  (D)拓扑学:直链    (ii)序列的种类:其它核酸
  (A)说明:合成DNA    (ix)序列特征
  (D)其他情报:6号及11号的核苷酸N为肌醇,其它的N
               代表A、G、C或T。    (xi)序列:序列编号11 GARGGNGTNM GNCAYCTYGT NGAYGG                                         26 (2)与序列12相关的情报    (i)序列的性质
  (A)长度:26
  (B)种类:核酸
  (C)链数:单链
  (D)拓扑学:直链    (ii)序列的种类:其它核酸
  (A)说明:合成DNA    (ix)序列特征
  (D)其他情报:6号及11号的核苷酸N为肌醇,其它的N
               代表A、G、C或T。    (xi)序列:序列编号12 GARGGNGTNM GNCAYTTRGT NGAYGG                                         26 (2)与序列13相关的情报    (i)序列的性质
  (A)长度:26
  (B)种类:核酸
  (C)链数:单链
  (D)拓扑学:直链    (ii)序列的种类:其它核酸
  (A)说明:合成DNA    (ix)序列特征
  (D)他の情报:3号的核苷酸N为肌醇,其它的N
               为A、G、C或T。    (xi)序列:序列编号13 GTNGGNTGYT TYGTNGGYTT YGAYGC                                         26 (2)与序列14相关的情报    (i)序列的性质
  (A)长度:26
  (B)种类:核酸
  (C)链数:单链
  (D)拓扑学:直链    (ii)序列的种类:肽    (v)片段类型:其它核酸
  (A)说明:合成DNA    (ix)序列特征
  (D)他の情报:3号的核苷酸N为肌醇,其它的N
               为A、G、C或T。    (xi)序列:序列编号14 GTNGGNTGYT TYGTNGGRTT YGAYGC                                         26 (2)与序列15相关的情报    (i)序列的性质
  (A)长度:29
  (B)种类:核酸
  (C)链数:单链
  (D)拓扑学:直链    (ii)序列的种类:其它核酸
  (A)说明:合成DNA    (ix)序列特征
  (D)其他情报:9号及11号的核苷酸N为肌醇,其它的N
               为A、G、C或T。    (xi)序列:序列编号15 TTYGAYGCNT CNGARCCHGA YTCDCGNCA                                      29 (2)与序列16相关的情报    (i)序列的性质
  (A)长度:30
  (B)种类:核酸
  (C)链数:单链
  (D)拓扑学:直链    (ii)序列的种类:其它核酸
  (A)说明:合成DNA    (ix)序列特征
  (D)其他情报:9号及11号的核苷酸N为肌醇,其它的N
               为A、G、C或T。    (xi)序列:序列编号16 TTYGAYGCNT CNGARCCHGA YTCDAGYCAY                                     30 (2)与序列17相关的情报    (i)序列的性质
  (A)长度:20
  (B)种类:核酸
  (C)链数:单链
  (D)拓扑学:直链    (ii)序列的种类:其它核酸
  (A)说明:合成DNA    (xi)序列:序列编号17 GAYCARGAYC TRATGGTNGT                                                20 (2)与序列18相关的情报    (i)序列的性质
  (A)长度:26
  (B)种类:核酸
  (C)链数:单链
  (D)拓扑学:直链    (ii)序列的种类:其它核酸
  (A)说明:合成DNA    (ix)序列特征
  (D)其他情报:6号及15号的核苷酸N为肌醇,其它的N
               为A、G、C或T。    (xi)序列:序列编号18 CCRTCNACYA GRTGNCKNAC NCCYTC                                         26 (2)与序列19相关的情报    (i)序列的性质
  (A)长度:26
  (B)种类:核酸
  (C)链数:单链
  (D)拓扑学:直链    (ii)序列的种类:其它核酸
  (A)说明:合成DNA    (ix)序列特征
  (D)其他情报:6号及15号的核苷酸N为肌醇,其它的N
               为A、G、C或T。    (xi)序列:序列编号19 CCRTCNACRA GRTGNCKNAC NCCYTC                                         26 (2)与序列20相关的情报    (i)序列的性质
  (A)长度:26
  (B)种类:核酸
  (C)链数:单链
  (D)拓扑学:直链    (ii)序列的种类:其它核酸
  (A)说明:合成DNA    (ix)序列特征
  (D)其他情报:6号及15号的核苷酸N为肌醇,其它的N
               为A、G、C或T。    (xi)序列:序列编号20 CCRTCNACYA TRTGNCKNAC NCCYTC                                          26 (2)与序列21相关的情报    (i)序列的性质
  (A)长度:29
  (B)种类:核酸
  (C)链数:单链
  (D)拓扑学:直链    (ii)序列的种类:其它核酸
  (A)说明:合成DNA    (ix)序列特征
  (D)其他情报:3号及18号的核苷酸N为肌醇,其它的N
               为A、G、C或T。    (xi)序列:序列编号21 TGNCGHGART CDGGYTCNGA NGCRTCRAA                                       29 (2)与序列22相关的情报    (i)序列的性质
  (A)长度:30
  (B)种类:核酸
  (C)链数:单链
  (D)拓扑学:直链    (ii)序列的种类:其它核酸
  (A)说明:合成DNA    (ix)序列特征
  (D)其他情报:19号的核苷酸N为肌醇,其它的N
               为A、G、C或T。    (xi)序列:序列编号22 RTGRCTHGAR TCDGGYTCNG ANGCRTCRAA                                      30 (2)与序列23相关的情报    (i)序列的性质
  (A)长度:2780
  (B)种类:核酸
  (C)链数:双链
  (D)拓扑学:直链    (ii)序列的种类:cDNA到mRNA    (vi)起源
  (A)生物名:大豆(Glycine max cv.Clark63)    (ix)序列特征
  (A)表示特征的符号:CDS
  (B)存在位置:156..2405    (xi)序列:序列编号23 TCTTCCATTG GAGGACCATT TCCTCCTGGA ATAGAAATAC TACCACACTT TTCTTTTTTC    60 ACTTCTCTAA GTTGCTAAGT TAATTGCTCC TTCATTTTTT CACTCTTCGT TCTCGCGTAC   120 CCGTGTCACG GTAACTCGTG GTGAAGTGTT CGAAA ATG ACT GTC ACA CCT AAG      173
                                   Met Thr Val Thr Pro Lys
                                     1               5 ATC TCA GTT AAC GAT GGG AAA CTT GTT GTC CAT GGT AAG ACC ATT CTG     221 Ile Ser Val Asn Asp Gly Lys Leu Val Val His Gly Lys Thr Ile Leu
         10                  15                  20 ACT GGA GTG CCA GAC AAC GTT GTG CTG ACT CCA GGT TCT GGA AGG GGT     269 Thr Gly Val Pro Asp Asn Val Val Leu Thr Pro Gly Ser Gly Arg Gly
     25                  30                  35 CTT GTG ACT GGT GCT TTT GTT GGT GCC ACA GCT TCA CAC AGC AAA AGT     317 Leu Val Thr Gly Ala Phe Val Gly Ala Thr Ala Ser His Ser Lys Ser
 40                  45                  50 CTC CAT GTG TTT CCA ATG GGT GTT TTA GAG GGG CTC CGG TTC ATG TGT     365 Leu His Val Phe Pro Met Gly Val Leu Glu Gly Leu Arg Phe Met Cys  55                  60                  65                  70 TGT TTC CGG TTC AAG TTA TGG TGG ATG ACT CAG AGA ATG GGA ACT TGT     413 Cys Phe Arg Phe Lys Leu Trp Trp Met Thr Gln Arg Met Gly Thr Cys
             75                  80                  85 GGG AGG GAT GTT CCT CTG GAG ACT CAA TTC ATG CTT ATT GAG AGC AAA      461 Gly Arg Asp Val Pro Leu Glu Thr Gln Phe Met Leu Ile Glu Ser Lys
         90                  95                 100 GAG AGT GAA ACT GAT GGG GAG AAT TCT CCA ATC ATC TAC ACT GTC TTG     509 Glu Ser Glu Thr Asp Gly Glu Asn Ser Pro Ile Ile Tyr Thr Val Leu
    105                 110                 115 CTT CCT CTC CTC GAA GGT CAA TTC CGA GCT GTT CTT CAA GGC AAT GAC     557 Leu Pro Leu Leu Glu Gly Gln Phe Arg Ala Val Leu Gln Gly Asn Asp
120                 125                 130 AAG AAC GAG ATA GAG ATT TGC CTC GAG AGT GGG GAT AAT GCA GTT GAG     605 Lys Asn Glu Ile Glu Ile Cys Leu Glu Ser Gly Asp Asn Ala Val Glu 135                 140                 145                 150 ACT GAC CAA GGC CTT CAC ATG GTT TAC ATG CAT GCT GGG ACC AAT CCC     653 Thr Asp Gln Gly Leu His Met Val Tyr Met His Ala Gly Thr Asn Pro
            155                 160                 165 TTT GAA GTC ATC AAT CAA GCT GTC AAG GCT GTG GAA AAA CAC ATG CAA     701 Phe Glu Val Ile Asn Gln Ala Val Lys Ala Val Glu Lys His Met Gln
        170                 175                 180 ACT TTT CTT CAT CGT GAG AAG AAA AGG TTG CCA TCT TGT CTT GAC TGG     749 Thr Phe Leu His Arg Glu Lys Lys Arg Leu Pro Ser Cys Leu Asp Trp
    185                 190                 195 TTT GGA TGG TGC ACA TGG GAT GCT TTC TAT ACT GAT GTC ACA GCT GAG     797 Phe Gly Trp Cys Thr Trp Asp Ala Phe Tyr Thr Asp Val Thr Ala Glu
200                 205                 210 GGT GTT GAG GAA GGC CTG AAA AGT CTA TCA CAG GGA GGT ACA CCT CCA     845 Gly Val Glu Glu Gly Leu Lys Ser Leu Ser Gln Gly Gly Thr Pro Pro 215                 220                 225                 230 CGA TTC CTC ATC ATA GAT GAT GGT TGG CAA CAG ATT GAA AAT AAA GCA     893 Arg Phe Leu Ile Ile Asp Asp Gly Trp Gln Gln Ile Glu Asn Lys Ala
            235                 240                 245 AAG GAT GCT ACT GAA TGT TTG GTA CAA GAA GGA GCA CAG TTT GCT ACT     941 Lys Asp Ala Thr Glu Cys Leu Val Gln Glu Gly Ala Gln Phe Ala Thr
        250                 255                 260 AGG TTG ACT GGT ATT AAA GAG AAT ACT AAA TTT CAA AAG AAA TTA CAG     989 Arg Leu Thr Gly Ile Lys Glu Asn Thr Lys Phe Gln Lys Lys Leu Gln
    265                 270                 275 AAC AAT GAG CAG ATG TCA GGT CTG AAG CAT CTA CTA CAT GGA GCA AAG   1037 Asn Asn Glu Gln Met Ser Gly Leu Lys His Leu Val His Gly Ala Lys
280                 285                 290 CAG CAT CAC AAT GTG AAA AAT GTA TAT GTA TGG CAT GCA CTA GCT GGT   1085 Gln His His Asn Val Lys Asn Val Tyr Val Trp His Ala Leu Ala Gly 295                300                  305                 310 TAT TGG GGT GGA GTG AAG CCA GCA GCA ACC GGC ATG GAA CAT TAT GAC   1133 Tyr Trp Gly Gly Val Lys Pro Ala Ala Thr Gly Met Glu His Tyr Asp
            315                 320                 325 ACT GCC TTG GCA TAT CCA GTG CAG TCA CCA GGC GTG CTA GGA AAC CAA   1181 Thr Ala Leu Ala Tyr Pro Val Gln Ser Pro Gly Val Leu Gly Asn Gln
        330                 335                 340 CCA GAC ATT GTC ATG GAC AGC TTG GCT GTA CAT GGC CTT GGC CTA GTG   1229 Pro Asp Ile Val Met Asp Ser Leu Ala Val His Gly Leu Gly Leu Val
    345                 350                 355 CAC CCA AAG AAG GTT TTC AAT TTC TAC AAC GAG CTC CAT GCT TAC TTA   1277 His Pro Lys Lys Val Phe Asn Phe Tyr Asn Glu Leu His Ala Tyr Leu
360                 365                 370 GCT TCT TGT GGA GTA GAT GGA GTG AAG GTT GAT GTG CAG AAC ATT ATT   1325 Ala Ser Cys Gly Val Asp Gly Val Lys Val Asp Val Gln Asn Ile Ile 375                 380                 385                 390 GAG ACC CTT GGT GCG GGA CAT GGT GGC CGA GTG TCA CTT ACT CGC AGC   1373 Glu Thr Leu Gly Ala Gly His Gly Gly Arg Val Ser Leu Thr Arg Ser
            395                 400                 405 TAT CAT CAC GCG CTT GAG GCT TCC ATT GCT AGC AAT TTT ACT GAT AAC   1421 Tyr His His Ala Leu Glu Ala Ser Ile Ala Ser Asn Phe Thr Asp Asn
        410                 415                 420 GGA TGC ATT GCG TGT ATG TGT CAC AAC ACT GAT GGA CTT TAT AGT GCT   1469 Gly Cys Ile Ala Cys Met Cys His Asn Thr Asp Gly Leu Tyr Ser Ala
    425                 430                 435 AAG CAG ACT GCT ATT GTG AGA GCT TCT GAT GAT TTT TAC CCT CGT GAT   1517 Lys Gln Thr Ala Ile Val Arg Ala Ser Asp Asp Phe Tyr Pro Arg Asp
440                 445                 450 CCT GCT TCC CAT ACC ATC CAT ATT TCT TCT GTT GCA TAC AAC TCA CTA   1565 Pro Ala Ser His Thr Ile His Ile Ser Ser Val Ala Tyr Asn Ser Leu 455                 460                 465                 470 TTC CTT GGA GAA TTC ATG CAA CCT GAC TGG GAC ATG TTT CAT AGT TTA   1613 Phe Leu Gly Glu Phe Met Gln Pro Asp Trp Asp Met Phe His Ser Leu
            475                 480                 485 CAC CCA GCA GCA GAT TAT CAT GCT GCA GCT CGT GCA ATT GGT GGA TGT    1661 His Pro Ala Ala Asp Tyr His Ala Ala Ala Arg Ala Ile Gly Gly Cys
        490                 495                 500 CCT ATT TAT GTT AGT GAC AAG CCA GGC AAT CAC AAT TTT GAT CTT CTT    1709 Pro Ile Tyr Val Ser Asp Lys Pro Gly Asn His Asn Phe Asp Leu Leu
    505                 510                 515 AAG AAG CTG GTT CTC CCG GAT GGT TCG GTT CTC CGT GCT CAG TTA CCT    1757 Lys Lys Leu Val Leu Pro Asp Gly Ser Val Leu Arg Ala Gln Leu Pro
520                 525                 530 GGC AGG CCA ACT CGT GAT TCT CTA TTT GTG GAT CCA GCC AGA GAT AGG    1805 Gly Arg Pro Thr Arg Asp Ser Leu Phe Val Asp Pro Ala Arg Asp Arg 535                 540                 545                 550  ACT AGC TTG CTC AAA ATA TGG AAC CTG AAC AAA TGC TCT GGA GTT GTT    1853 Thr Ser Leu Leu Lys Ile Trp Asn Leu Asn Lys Cys Ser Gly Val Val
            555                 560                 565 GGT GTA TTT AAC TGC CAA GGT GCT GGA TGG TGC AAG ATA GAG AAG AAA    1901 Gly Val Phe Asn Cys Gln Gly Ala Gly Trp Cys Lys Ile Glu Lys Lys
        570                 575                 580 ACC CGC ATC CAT GAT ACA TCT CCT GGT ACA CTC ACC GCC TCT GTC TGC    1949 Thr Arg Ile His Asp Thr Ser Pro Gly Thr Leu Thr Ala Ser Val Cys
    585                 590                 595 GCC TCT GAT GTT GAC CTC ATC ACA CAA GTA GCA GGT GCT GAA TGG CTT    1997 Ala Ser Asp Val Asp Leu Ile Thr Gln Val Ala Gly Ala Glu Trp Leu
600                 605                 610 GGA GAT ACA ATT GTT TAT GCT TAC AGA TCA GGT GAG GTG ATT CGG CTA    2045 Gly Asp Thr Ile Val Tyr Ala Tyr Arg Ser Gly Glu Val Ile Arg Leu 615                 620                 625                 630 CCA AAA GGG GTT TCA ATT CCA GTG ACA CTA AAA GTT CTG GAG TTT GAG    2093 Pro Lys Gly Val Ser Ile Pro Val Thr Leu Lys Val Leu Glu Phe Glu
            635                 640                 645 CTT TTC CAC TTC TGT CCA ATC CAA GAA ATA GCT CCA AGT ATA TCA TTT    2141 Leu Phe His Phe Cys Pro Ile Gln Glu Ile Ala Pro Ser Ile Ser Phe
        650                 655                 660 GCA GCA ATA GGG CTA CTG GAT ATG TTC AAC ACT GGA GGA GCA GTG GAG    2189 Ala Ala Ile Gly Leu Leu Asp Met Phe Asn Thr Gly Gly Ala Val Glu
    665                 670                 675 CAG GTT GAG ATT CAT AAC CGA GCA GCA ACG AAA ACA ATA GCT CTT AGT    2237 Gln Val Glu Ile His Asn Arg Ala Ala Thr Lys Thr Ile Ala Leu Ser
680                 685                 690 GTA AGG GGA AGA GGC AGA TTT GGA GTT TAC TCC TCC CAG AGA CCA CTG    2285 Val Arg Gly Arg Gly Arg Phe Gly Val Tyr Ser Ser Gln Arg Pro Leu 695                 700                 705                 710 AAG TGT GTG GTA GGT GGC GCT GAA ACC GAC TTC AAC TAT GAC TCA GAG    2333 Lys Cys Val Val Gly Gly Ala Glu Thr Asp Phe Asn Tyr Asp Ser Glu
            715                 720                 725 ACC GGG TTG ACA ACC TTC TCC ATT CCA GTT TCT CCA GAG GAG ATG TAC    2381 Thr Gly Leu Thr Thr Phe Ser Ile Pro Val Ser Pro Glu Glu Met Tyr
        730                 735                 740 AGA TGG TCA ATA GAG ATC CAA GTT TGAGTCCTTT TTAAGACTTG GTGTTTGATG   2435 Arg Trp Ser Ile Glu Ile Gln Val
    745                 750 CATTGTTGTA TCAGGAGAAG GGTTTTGTTG TAATTAAGCA TTGAGGGAAT TGTTGGAGTC  2495 AGGCAGAGAG AGAGGGGGGA GGTTTGTTGT AAGACACCTA GTATTAGTAT CATGTAGTGG  2555 AGAAAAAGGG TTGTTGATCC TAATAGCTAG ACAAGGCATG TTGTAGTAGT CATGGGGTGG  2615 GGAAGTCCTT TTGTTGTAGC ATGTAATTTG GTTTAGACTT GTAGTATGTC ATCAATTAGA  2675 TGGATAAAGA GAGAATATTG TTATCTACCC GAGGATGTAA CAATGTTTGT TTCTCTGAAT  2735 AAAAAGTTCA CATCTGTCTT TTGGAATAAT AAAAAAAAAA AAAAA                  2780 (2)与序列24相关的情报    (i)序列的性质
  (A)长度:750
  (B)种类:氨基酸
  (D)拓扑学:直链    (ii)序列的种类:蛋白质    (xi)序列:序列编号24 Met Thr Val Thr Pro Lys Ile Ser Val Asn Asp Gly Lys Leu Val Val   1               5                  10                  15 His Gly Lys Thr Ile Leu Thr Gly Val Pro Asp Asn Val Val Leu Thr
         20                  25                  30 Pro Gly Ser Gly Arg Gly Leu Val Thr Gly Ala Phe Val Gly Ala Thr
     35                  40                  45 Ala Ser His Ser Lys Ser Leu His Val Phe Pro Met Gly Val Leu Glu
 50                  55                  60 Gly Leu Arg Phe Met Cys Cys Phe Arg Phe Lys Leu Trp Trp Met Thr 65                   70                  75                  80 Gln Arg Met Gly Thr Cys Gly Arg Asp Val Pro Leu Glu Thr Gln Phe
             85                  90                  95 Met Leu Ile Glu Ser Lys Glu Ser Glu Thr Asp Gly Glu Asn Ser Pro
        100                 105                 110 Ile Ile Tyr Thr Val Leu Leu Pro Leu Leu Glu Gly Gln Phe Arg Ala
    115                 120                 125 Val Leu Gln Gly Asn Asp Lys Asn Glu Ile Glu Ile Cys Leu Glu Ser
130                 135                 140 Gly Asp Asn Ala Val Glu Thr Asp Gln Gly Leu His Met Val Tyr Met 145                 150                 155                 160 His Ala Gly Thr Asn Pro Phe Glu Val Ile Asn Gln Ala Val Lys Ala
            165                 170                 175 Val Glu Lys His Met Gln Thr Phe Leu His Arg Glu Lys Lys Arg Leu
        180                 185                 190 Pro Ser Cys Leu Asp Trp Phe Gly Trp Cys Thr Trp Asp Ala Phe Tyr
    195                 200                 205 Thr Asp Val Thr Ala Glu Gly Val Glu Glu Gly Leu Lys Ser Leu Ser
210                 215                 220 Gln Gly Gly Thr Pro Pro Arg Phe Leu Ile Ile Asp Asp Gly Trp Gln 225                 230                 235                 240 Gln Ile Glu Asn Lys Ala Lys Asp Ala Thr Glu Cys Leu Val Gln Glu
            245                 250                 255 Gly Ala Gln Phe Ala Thr Arg Leu Thr Gly Ile Lys Glu Asn Thr Lys
        260                 265                 270 Phe Gln Lys Lys Leu Gln Asn Asn Glu Gln Met Ser Gly Leu Lys His
    275                 280                 285 Leu Val His Gly Ala Lys Gln His His Asn Val Lys Asn Val Tyr Val
290                 295                 300 Trp His Ala Leu Ala Gly Tyr Trp Gly Gly Val Lys Pro Ala Ala Thr 305                 310                 315                 320 Gly Met Glu His Tyr Asp Thr Ala Leu Ala Tyr Pro Val Gln Ser Pro
            325                 330                 335 Gly Val Leu Gly Asn Gln Pro Asp Ile Val Met Asp Ser Leu Ala Val
        340                 345                 350 His Gly Leu Gly Leu Val His Pro Lys Lys Val Phe Asn Phe Tyr Asn
    355                 360                 365 Glu Leu His Ala Tyr Leu Ala Ser Cys Gly Val Asp Gly Val Lys Val
370                 375                 380 Asp Val Gln Asn Ile Ile Glu Thr Leu Gly Ala Gly His Gly Gly Arg 385                 390                 395                 400 Val Ser Leu Thr Arg Ser Tyr His His Ala Leu Glu Ala Ser Ile Ala
            405                 410                 415 Ser Asn Phe Thr Asp Asn Gly Cys Ile Ala Cys Met Cys His Asn Thr
        420                 425                 430 Asp Gly Leu Tyr Ser Ala Lys Gln Thr Ala Ile Val Arg Ala Ser Asp
    435                 440                 445 Asp Phe Tyr Pro Arg Asp Pro Ala Ser His Thr Ile His Ile Ser Ser
450                 455                 460 Val Ala Tyr Asn Ser Leu Phe Leu Gly Glu Phe Met Gln Pro Asp Trp 465                 470                 475                 480 Asp Met Phe His Ser Leu His Pro Ala Ala Asp Tyr His Ala Ala Ala
            485                 490                 495 Arg Ala Ile Gly Gly Cys Pro Ile Tyr Val Ser Asp Lys Pro Gly Asn
        500                 505                 510 His Asn Phe Asp Leu Leu Lys Lys Leu Val Leu Pro Asp Gly Ser Val
    515                 520                 525 Leu Arg Ala Gln Leu Pro Gly Arg Pro Thr Arg Asp Ser Leu Phe Val
530                 535                 540 Asp Pro Ala Arg Asp Arg Thr Ser Leu Leu Lys Ile Trp Asn Leu Asn 545                 550                 555                 560 Lys Cys Ser Gly Val Val Gly Val Phe Asn Cys Gln Gly Ala Gly Trp
            565                 570                 575 Cys Lys Ile Glu Lys Lys Thr Arg Ile His Asp Thr Ser Pro Gly Thr
        580                 585                 590 Leu Thr Ala Ser Val Cys Ala Ser Asp Val Asp Leu Ile Thr Gln Val
    595                 600                 605 Ala Gly Ala Glu Trp Leu Gly Asp Thr Ile Val Tyr Ala Tyr Arg Ser
610                 615                 620 Gly Glu Val Ile Arg Leu Pro Lys Gly Val Ser Ile Pro Val Thr Leu 625                 630                 635                 640 Lys Val Leu Glu Phe Glu Leu Phe His Phe Cys Pro Ile Gln Glu Ile
            645                 650                 655 Ala Pro Ser Ile Ser Phe Ala Ala Ile Gly Leu Leu Asp Met Phe Asn
        660                 665                 670 Thr Gly Gly Ala Val Glu Gln Val Glu Ile His Asn Arg Ala Ala Thr
    675                 680                 685 Lys Thr Ile Ala Leu Ser Val Arg Gly Arg Gly Arg Phe Gly Val Tyr
690                 695                 700 Ser Ser Gln Arg Pro Leu Lys Cys Val Val Gly Gly Ala Glu Thr Asp 705                 710                 715                 720 Phe Asn Tyr Asp Ser Glu Thr Gly Leu Thr Thr Phe Ser Ile Pro Val
            725                 730                 735 Ser Pro Glu Glu Met Tyr Arg Trp Ser Ile Glu Ile Gln Val
        740                 745                 750 (2)与序列25相关的情报    (i)序列的性质
  (A)长度:26
  (B)种类:核酸
  (C)链数:单链
  (D)拓扑学:直链    (ii)序列的种类:其它核酸
  (A)说明:合成DNA    (xi)序列:序列编号25 ATSCAVCCTG ACTGGGATAT GTTCCA                                          26 (2)与序列26相关的情报    (i)序列的性质
  (A)长度:26
  (B)种类:核酸
  (C)链数:单链
  (D)拓扑学:直链    (ii)序列的种类:其它核酸
  (A)说明:合成DNA    (xi)序列:序列编号26 CGAAGGAYYG AWCCATCAGG AARHAM                                          26 (2)与序列27相关的情报    (i)序列的性质
  (A)长度:253
  (B)种类:核酸
  (C)链数:双链
  (D)拓扑学:直链    (ii)序列的种类:cDNA到mRNA    (vi)起源:
  (A)生物名:拟南芥(Arabidopsis thaliana)
(xi)序列:序列编号27 GGCTTATGCA  ACCTGACTGG  GAATGTTCCA  TAGTCTACAC  CCAACTGCAG  AGTACCATGC       60 TGCAGCGCGT  GCAGTGGGTG  GATGCGCAAT  CTATGTCAGT  GATAAGCCAG  GCAACCACAA      120 CTTTGATCTA  TTGAGGAAGC  TGGTTCTTCC  TGATGGTTCA  GTTCTTCGGG  CTAAGCTCCC      180 GGGTAGGCCT  ACCCGTGACT  GCTTATTCGC  TGATCCAGCT  AGAGATGGGA  TCAGCTTGCT      240 CAAGATCTGG  AAC                                                             253 (2)与序列28相关的情报    (i)序列的性质
  (A)长度:10
  (B)种类:氨基酸
  (D)拓扑学:直链    (ii)序列的种类:肽    (xi)序列:序列编号28 Phe Gly Trp Cys Thr Trp Asp Ala Phe Tyr   1               5                  10 (2)与序列29相关的情报    (i)序列的性质
  (A)长度:13
  (B)种类:氨基酸
  (D)拓扑学:直链    (ii)序列的种类:肽    (ix)序列特征
  (D)他の情报:8号的氨基酸Xaa代表Ala或Cys。    (xi)序列:序列编号29 Val Tyr Val Trp His Ala Leu Xaa Gly Tyr Trp Gly Gly   l               5                  10 (2)与序列30相关的情报    (i)序列的性质
  (A)长度:15
  (B)种类:氨基酸
  (D)拓扑学:直链    (ii)序列的种类:肽    (xi)序列:序列编号30 His Asn Phe Asp Leu Leu Lys Lys Leu Val Leu Pro Asp Gly Ser   1               5                  10                  15
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈