首页 / 专利库 / 作物管理 / 环境胁迫 / 生物逆境 / 海藻糖生物合成基因在植物中的表达

海藻糖生物合成基因在植物中的表达

阅读:484发布:2020-11-05

专利汇可以提供海藻糖生物合成基因在植物中的表达专利检索,专利查询,专利分析的服务。并且本 发明 提供例如在诱导型启动子控制下表达海藻糖 生物 合成基因的正常发育的新型转基因 植物 ,同时提供了提高所述植物逆境耐性的方法,提高食物 质量 的方法,和制备和使用本发明的植物的其他方法。本发明也提供核苷酸序列编码的新海藻糖生物合成酶。,下面是海藻糖生物合成基因在植物中的表达专利的具体信息内容。

1.一种表达海藻糖生物合成酶的异源基因的植物
2.权利要求1的植物,在其核基因组中含有异源表达盒或其部分, 其中含有在诱导型启动子控制下的编码海藻糖生物合成酶的核苷酸序 列。
3.根据权利要求2的植物,其在第一种异源表达盒或其部分中含 有在诱导型启动子控制下的编码海藻糖-6-磷酸合酶的核苷酸序列,并 在第二种异源表达盒或其部分中含有在诱导型启动子控制下的编码海 藻糖-6-磷酸磷酸酶的核苷酸序列。
4.根据权利要求2或3的植物,其中所述启动子是一种化学或创伤 诱导型启动子。
5.权利要求1的植物,在其质体基因组中含有异源表达盒或其部 分,其中含有编码海藻糖生物合成酶的核苷酸序列,该序列处于一种 能引导该核苷酸序列在该植物质体中表达的启动子控制之下。
6.根据权利要求5的植物,其含有一种编码海藻糖-6-磷酸合酶的 核苷酸序列,该序列处于一种能引导该核苷酸序列在该植物质体中表 达的启动子控制之下,并且含有一种编码海藻糖-6-磷酸磷酸酶的核苷 酸序列,该序列处于一种能引导该核苷酸序列在该植物质体中表达的 启动子控制之下。
7.权利要求6的植物,其中所述编码海藻糖-6-磷酸合酶的核苷酸 序列和所述编码海藻糖-6-磷酸磷酸酶的核苷酸序列由操纵子样多顺反 子基因中的单启动子开始转录,其中该启动子能引导该操纵子样多顺 反子基因在该植物的质体中表达。
8.权利要求5-7中任一项的植物,其中所述启动子包括一种反式激 活蛋白调节的启动子,其中相应反式激活蛋白的表达处于一种能引导 该反式激活蛋白在该植物中表达的启动子控制之下。
9.一种根据权利要求8的植物,其含有:
(a)一种异源核表达盒或其部分,其包含与编码反式激活蛋白的核 苷酸序列有效连接的启动子,其中该启动子能引导该反式激活蛋白在 该植物中的表达,其中该反式激活蛋白与质体导向序列相融合;和
(b)一种异源质体表达盒或其部分,其包含由反式激活蛋白调节并 与编码至少一种海藻糖生物合成酶的核苷酸序列有效连接的反式激活 蛋白介导的启动子。
10.权利要求8或9的植物,其中所述反式激活蛋白调节的启动子 包含一种T7基因10启动子,而所述相应反式激活蛋白包含一种T7 RN A聚合酶。
11.权利要求8或9的植物,其中能引导所述反式激活蛋白在该植 物中表达的所述启动子是一种诱导型启动子、组织特异性启动子或组 成型启动子。
12.权利要求11的植物,其中所述诱导型启动子是化学或创伤诱 导型启动子。
13.权利要求5-12中任一项的植物,其中所述启动子由正常存在于 该植物质体中的RNA聚合酶转录。
14.权利要求13的植物,其中所述RNA聚合酶是一种核编码的聚 合酶或质体编码的聚合酶。
15.权利要求14的植物,其中所述启动子是clpP启动子、16S r-R NA基因启动子、psbA启动子或rbcL启动子。
16.一种植物,在其质体基因组中含有两种或多种从操纵子样多 顺反子基因中的单启动子开始转录的基因,其中该启动子能引导该操 纵子样多顺反子基因在该植物的质体中表达,其中该操纵子样多顺反 子基因进一步含有一种位于该操纵子样多顺反子基因中两个基因之间 的间插DNA序列。
17.一种根据权利要求16的植物,其中位于所述间插DNA序列直 接下游的基因的表达得到增强。
18.根据权利要求17的植物,其中所述间插DNA序列在该植物的 质体基因组中不存在。
19.根据权利要求18的植物,其中所述间插DNA序列含有非真核5’ UTR的一部分。
20.根据权利要求16-19中任一项的植物,其中修饰所述间插DNA 序列以防止在所述操纵子样多顺反子基因的转录中形成RNA二级结 构。
21.根据权利要求16-20中任一项的植物,其中所述操纵子样多顺 反子基因含有一种包含编码至少一种海藻糖生物合成酶的核苷酸序列 的基因。
22.根据权利要求21的植物,其中所述操纵子样多顺反子基因含 有一种包含编码海藻糖磷酸合酶的核苷酸序列的基因和一种包含编码 海藻糖磷酸磷酸酶的核苷酸序列的基因。
23.根据前述权利要求中任一项的植物的种子
24.一种产生根据权利要求7的植物的方法,包括:
(a)一种含有异源核表达盒或其部分的植物,此表达盒包含一种 与编码能调节反式激活蛋白介导启动子的反式激活蛋白的核苷酸序列 有效连接的启动子,其中该启动子与编码能引导该反式激活蛋白在该 植物中表达的反式激活蛋白的DNA序列有效连接,用该植物的花粉对 一种含有包含反式激活蛋白介导启动子的异源质体表达盒或其部分的 植物传粉,该启动子与编码至少一种海藻糖生物合成酶的核苷酸序列 或操纵子样多顺反子基因有效连接;
(b)从这样传粉的植物中回收种子;和
(c)由所述种子培育上述植物。
25.一种在植物中产生海藻糖的方法,方法是在诱导型启动子的 控制下,从该植物的核基因组表达至少一种编码海藻糖生物合成酶的 核苷酸序列,或者在能在该植物的质体中表达该核苷酸序列的启动子 的控制下,从该植物的质体基因组表达至少一种编码海藻糖生物合成 酶的核苷酸序列。
26.一种保护植物免于干旱、高盐度、渗透压协迫和极端温度影 响的方法,方法是在诱导型启动子的控制下,从该植物的核基因组表 达至少一种编码海藻糖生物合成酶的核苷酸序列,或者在能在该植物 的质体中表达该核苷酸序列的启动子的控制下,从该植物的质体基因 组表达至少一种编码海藻糖生物合成酶的核苷酸序列。
27.一种提高收获植物的耐贮性的方法,方法是在诱导型启动子 的控制下,从该植物的核基因组表达至少一种编码海藻糖生物合成酶 的核苷酸序列,或者在能在该植物的质体中表达该核苷酸序列的启动 子的控制下,从该植物的质体基因组表达至少一种编码海藻糖生物合 成酶的核苷酸序列。
28.一种延长果实和蔬菜贮存时间和保存花的方法,方法是在诱 导型启动子的控制下,从该植物的核基因组表达至少一种编码海藻糖 生物合成酶的核苷酸序列,或者在能在该果实、蔬菜和花中表达该基 因的启动子的控制下,从该植物的质体基因组表达至少一种编码海藻 糖生物合成酶的核苷酸序列。
29.一种稳定转基因植物中表达的蛋白质的方法,方法是在诱导 型启动子的控制下,从该植物的核基因组表达至少一种编码海藻糖生 物合成酶的核苷酸序列,或者在能在该植物的质体中表达该基因的启 动子的控制下,从该植物的质体基因组表达至少一种编码海藻糖生物 合成酶的核苷酸序列。
30.一种在植物质体中从单一启动子开始表达两种或多种基因的 方法,包括向该植物的质体基因组中引入一种操纵子样多顺反子基因, 该基因包含与能在该植物质体中表达该操纵子样多顺反子基因的启动 子有效连接的所述两种或多种基因,其中该操纵子样多顺反子基因另 外含有一种位于两个基因之间的间插DNA序列。
31.根据权利要求30的方法,其中位于所述间插DNA序列直接 下游的基因的表达得到增强。
32.一种DNA分子,其含有编码海藻糖生物合成酶或其部分的核 苷酸序列。
33.根据权利要求32的DNA分子,其中所述核苷酸序列编码海 藻糖-6-磷酸合酶或其部分。
34.根据权利要求32的DNA分子,其中所述核苷酸序列编码海 藻糖-6-磷酸磷酸酶或其部分。
35.含有海藻糖生物合成酶或其部分的蛋白质分子。
36.根据权利要求35的蛋白质,其中该蛋白质含有海藻糖-6-磷酸 合酶或其部分。
37.根据权利要求35的蛋白质,其中该蛋白质含有海藻糖-6-磷酸 磷酸酶或其部分。
38.一种植物,其含有包含根据权利要求32-34中任一项的DNA 分子的表达盒或其部分,其中该表达盒稳定整合于该植物的基因组中。
39.根据权利要求38的植物,其中该植物耐受逆境如干旱、渗透 或温度逆境。
40.一种植物表达盒,其含有在诱导型启动子如创伤诱导型或化 学诱导型启动子控制下的编码海藻糖生物合成酶如海藻糖-6-磷酸合酶 和/或海藻糖-6-磷酸磷酸酶的核苷酸序列。
41.一种植物表达盒,其含有编码海藻糖生物合成酶如海藻糖-6- 磷酸合酶和/或海藻糖-6-磷酸磷酸酶的核苷酸序列,所述核苷酸处于能 引导该核苷酸序列在该植物质体中表达的启动子的控制之下。
42.一种质体表达盒,其含有一种由正常存在于质体中的RNA聚 合酶如核编码聚合酶或质体编码聚合酶转录,并与编码至少一种海藻 糖生物合成酶如海藻糖-6-磷酸合酶和/或海藻糖-6-磷酸磷酸酶的核苷酸 序列有效连接的启动子。
43.一种质体表达盒,其含有一种能使海藻糖生物合成基因在植 物质体中表达的启动子,例如由正常存在于质体中的RNA聚合酶如核 编码聚合酶或质体编码聚合酶转录的启动子,或由反式激活蛋白调节 的反式激活蛋白介导启动子(例如,当反式激活蛋白是T7 RNA聚合 酶时为T7启动子),它与一种含有编码两种海藻糖生物合成酶的核苷 酸序列的操纵子样多顺反子基因有效连接。
44.一种含有根据权利要求40-43中任一项的表达盒的载体。

说明书全文

发明涉及海藻糖生物合成基因和耐旱性在植物中的表达。特别 是,本发明涉及高等植物中海藻糖积累和耐旱性的问题,和构建这种 性状的新方法。也涉及对收获植物的改进的贮存性质、果实和花的延 长的保存期以及转基因植物中表达的外源蛋白质的稳定的需要。在一 个优选实施方案中,本发明描述了海藻糖生物合成基因在植物中的表 达,优选地在诱导型启动子的控制之下,这赋予耐旱性而没有与不受 控制的海藻糖积累有关的有害作用。

海藻糖(α-D-吡喃葡糖基-[1,1]-α-D-吡喃葡糖苷)是在低等生物如 细菌、真菌和昆虫中常见的二糖,它常常在静止期或稳定期细胞和器 官中积累。海藻糖生物合成需要两种酶活性:海藻糖-6-磷酸合酶催化 UDP-葡萄糖和葡萄糖-6-磷酸缩合为海藻糖-6-磷酸,海藻糖-6-磷酸磷 酸酶使海藻糖-6-磷酸磷酸化,成为海藻糖。

尽管海藻糖能作为还原的贮存形式,但它可作为对抗多种非生 物协迫(尤其是热和干燥)的有害作用的保护剂起更重要的作用。无论在 体内还是在体外,海藻糖积累都与保护生物大分子(特别是膜和蛋白 质)免于脱、极端温度和渗透压休克有关。发酵产生的海藻糖在商 业上用于酶的保存和脱水及加工食品的稳定。

长期以来认识到,海藻糖可以作为共生微生物的产物存在于植物 中,而通常认为脊椎动物和高等植物不能合成海藻糖。高等植物家族 中特异海藻糖异化酶(海藻糖酶)的普遍存在是一种生物学奇观,主 要归因于存在从共生或附生植物的微生物和真菌来源进入植物细胞的 外源海藻糖。重要的例外是粗略地归类为“更苏植物”种类的低等植 物和被子植物,它们能在特别长时间的干燥下存活。这些植物,包括 卷柏属(Selaginella)和Myrothamnus的种,能在发生干旱之后积累 高达10%干重的海藻糖。

由于海藻糖与耐旱性的相关性和微生物海藻糖发酵的历史上不佳 的经济状况,也已经设法改造了转基因植物来积累这种二糖。虽然已 经成功地获得了这些植物(使用细菌和酵母海藻糖合成基因),但显然 植物细胞溶胶中的组成型海藻糖产生伴随着明显的有害作用。当在根 组织中或在早期发育阶段发生海藻糖表达时,这些表型(矮化的生长、 异常的叶、未发育的根)是特别严重的,因为使用绿色组织特异性植 物启动子驱动海藻糖产生基因改进了某些但不是全部这些作用。

由这些事实,能使海藻糖积累并且导致耐旱性而对植物无有害作 用的海藻糖生物合成基因的诱导型表达系统将是十分有实际用途的, 并且有经济效益。

因此本发明涉及海藻糖生物合成基因和耐旱性在植物中的表达。

在一个优选实施方案中,本发明描述了海藻糖生物合成基因在植 物中表达,该基因优选地在诱导型启动子的控制下在植物中的表达, 其导致耐旱性而没有与失控的海藻糖积累有关的有害作用。一种优选 的启动子是化学诱导型启动子,如烟草PR-1a启动子,它能被化学诱 导物的叶施用而激活。

另外,本发明描述了在不同细胞区室中表达的海藻糖生物合成基 因的表达。在第一个实施方案中,海藻糖生物合成基因在植物胞质中 表达。在另一个实施方案中,海藻糖生物合成基因从植物核基因组中 表达,而由其编码的海藻糖生物合成酶例如通过使用质体转运肽被导 向到质体中。在另一个实施方案中,海藻糖生物合成基因从植物质体 基因组中表达。在一个优选实施方案中,将含有海藻糖生物合成基因 的载体转化到质体基因组中,该海藻糖生物合成基因与一个能引导海 藻糖生物合成基因在植物质体中表达的启动子相融合。在一个优选实 施方案中,将含有与海藻糖生物合成基因融合的噬菌体启动子的载体 转化到质体基因组中。使得到的植物系与一种转基因系杂交,该转基 因系含有噬菌体RNA酶的核编码区,其添加有质体导向序列并与植物 启动子(如诱导型启动子、组织特异性启动子或组成型启动子)有效连 接。在另一个优选实施方案中,能引导海藻糖生物合成基因在植物质 体中表达的启动子是由质体中正常存在的RNA聚合酶如核编码聚合酶 或质体编码聚合酶所转录的启动子。这些启动子包括但不限于例如clpP 启动子、16S r-RNA基因启动子、psbA启动子或rbcL启动子。

在本发明中,优选使用大肠杆菌的海藻糖生物合成基因,但也可 使用来源于其他生物包括但不限于酵母、其他低等生物或高等生物的 基因。例如,大肠杆菌OtsA和/或大肠杆菌OtsB基因;酵母TPS1、 TSL1或TSL2基因(美国专利5,792,921)、拟南芥(Arabidopsis)海 藻糖合酶基因(TPS1,保藏号Y08568,Blazquez等人,植物杂志(Plant J)(1998)13:685-9)、拟南芥海藻糖磷酸磷酸酶(Vogel等人,植物 杂志(1998)13:673-83)或编码双功能海藻糖磷酸合酶/磷酸酶的鳞 叶卷柏(Selaginella lepidophylla)基因(保藏号U96736)。

在一个优选实施方案中,编码海藻糖磷酸合酶的核苷酸序列和编 码海藻糖磷酸磷酸酶的核苷酸序列都在植物中表达。在另一个优选实 施方案中,编码海藻糖磷酸合酶的核苷酸序列在植物中表达,或者编 码海藻糖磷酸磷酸酶的核苷酸序列在植物中表达。本发明也涉及从操 纵子样多顺反子基因中单启动子开始转录的两种海藻糖生物合成基因 从质体基因组中的表达。

本发明也公开了来源于重要经济作物尤其是来源于玉米的编码海 藻糖生物合成酶的新核苷酸序列。这些核苷酸序列被转化到植物中提 高其海藻糖含量及其耐旱性。本发明也提供使用这些核苷酸序列作为 标记通过常规培育技术产生具有提高的逆境抗性的植物系的方法。

本发明因此提供:

一种表达编码海藻糖生物合成酶的核苷酸序列的植物,例如一种 含有编码海藻糖-6-磷酸合酶和/或海藻糖-6-磷酸磷酸酶的核苷酸序列 (如大肠杆菌OtsA和/或大肠杆菌OtsB基因)的植物。这些核苷酸序列 例如稳定地整合于核或质体DNA中,优选地处于诱导型启动子(如创 伤诱导型或化学诱导型启动子)的控制之下,或者处于能引导海藻糖生 物合成基因在植物质体中表达的启动子(如反式激活蛋白调节启动子)的 控制之下,其中相应的反式激活蛋白处于诱导型启动子、组织特异性 启动子或组成型启动子的控制之下;

也包括这种植物的子代和种子,种子被任选地处理(如装填或包 被)和/或包装,例如与使用说明书一起放于袋子中。

本发明特别提供:

根据本发明的植物,在其基因组中含有包含编码海藻糖-6-磷酸合 酶的核苷酸序列的第一种异源表达盒或其部分,所述核苷酸序列处于 诱导型启动子的控制之下,或者处于能引导该核苷酸序列在该植物质 体中表达的启动子的控制之下,如反式激活蛋白调节的启动子,其中 相应的反式激活蛋白优选地处于诱导型启动子、组织特异性启动子或 组成型启动子的控制之下,该植物中还含有包含编码海藻糖-6-磷酸磷 酸酶的核苷酸序列的第二种异源表达盒或其部分,所述核苷酸序列处 于诱导型启动子的控制之下,或者处于能引导该核苷酸序列在该植物 质体中表达的启动子的控制之下,如反式激活蛋白调节的启动子,其 中相应的反式激活蛋白优选地处于诱导型启动子、组织特异性启动子 或组成型启动子的控制之下。本发明也包括这种植物的子代和种子, 种子被任选地处理(如装填或包被)和/或包装,例如与使用说明书一 起放于袋子中。

本发明进一步提供:

一种植物表达盒,其含有编码海藻糖-6-磷酸合酶的核苷酸序列, 优选地所述核苷酸序列处于诱导型启动子如创伤诱导型或化学诱导型 启动子的控制之下;

一种含有这种植物可表达盒的载体;和

一种用这种载体转化的植物。

本发明进一步提供:

一种植物表达盒,其含有编码海藻糖-6-磷酸磷酸酶的核苷酸序列, 优选地所述核苷酸序列处于诱导型启动子如创伤诱导型或化学诱导型 启动子的控制之下;

一种含有这种植物可表达盒的载体;和

一种用这种载体转化的植物。

本发明进一步提供:

一种植物表达盒,其含有编码海藻糖-6-磷酸合酶的核苷酸序列, 优选地该核苷酸序列处于诱导型启动子如创伤诱导型或化学诱导型启 动子的控制之下,还含有编码海藻糖-6-磷酸磷酸酶的核苷酸序列,优 选地该核苷酸序列处于诱导型启动子如创伤诱导型或化学诱导型启动 子的控制之下;

一种含有这种植物可表达盒的载体;和

一种用这种载体转化的植物。

在另一个实施方案中,本发明包括编码海藻糖生物合成酶的核苷 酸序列在反式激活蛋白调节启动子控制下在质体中的表达,并且反式 激活蛋白基因位于核DNA中,受植物启动子的控制。例如,质体转化 载体一般用噬菌体启动子如噬菌体T7基因10启动子构建,其转录激 活依赖于RNA聚合酶如噬菌体T7 RNA聚合酶。得到的植物系与转 基因系杂交,该转基因系含有噬菌体RNA聚合酶的核编码区,其中添 加了叶绿体导向序列,并与植物启动子有效连接,所述植物启动子优 选地为诱导型启动子、组织特异性启动子或组成型启动子,优选地化 学诱导型启动子如烟草PR-1a启动子。

本发明因此另外提供:

一种植物,其含有

一种异源核表达盒或其部分,其优选地含有一种诱导型启动子、 组织特异性启动子或组成型启动子,更优选地含有一种诱导型启动子, 例如创伤诱导型或化学诱导型启动子,例如烟草PR-1a启动子,该启 动子与编码反式激活蛋白(优选的是不在植物中天然存在的反式激活 蛋白,优选地RNA聚合酶或DNA结合蛋白,如T7 RNA聚合酶)的 DNA序列有效连接,该反式激活蛋白任选地与质体导向序列如叶绿体 导向序列(例如,上述可在植物中表达的表达盒)融合;和

一种异源质体表达盒或其部分,其含有由反式激活蛋白调节并与 编码至少一种海藻糖生物合成酶(如海藻糖-6-磷酸合酶)的核苷酸序列 有效连接的反式激活蛋白介导启动子(例如,当反式激活蛋白是T7 RNA聚合酶时为T7启动子);还包括这种植物的子代和种子,种子 被任选地处理(如装填或包被)和/或包装,例如与使用说明书一起放 于袋子或其他容器中。

此外本发明提供:

一种植物,其含有

一种异源核表达盒或其部分,其优选地含有一种诱导型启动子、 组织特异性启动子或组成型启动子,更优选地含有一种诱导型启动子, 例如创伤诱导型或化学诱导型启动子,例如烟草PR-1a启动子,该启 动子与编码反式激活蛋白(优选的是不在植物中天然存在的反式激活 蛋白,优选地RNA聚合酶或DNA结合蛋白,如T7 RNA聚合酶)的 核苷酸序列有效连接,该反式激活蛋白任选地与质体导向序列如叶绿 体导向序列(例如,上述可在植物中表达的表达盒)融合;和

一种异源质体表达盒或其部分,其含有由反式激活蛋白调节并与 编码海藻糖-6-磷酸磷酸酶的核苷酸序列有效连接的反式激活蛋白介导 启动子(例如,当反式激活蛋白是T7 RNA聚合酶时为T7启动子);

还包括这种植物的子代和种子,种子被任选地处理(如装填或包 被)和/或包装,例如与使用说明书一起放于袋子或其他容器中。

此外本发明提供:

一种植物,其含有

一种异源核表达盒或其部分,其优选地含有一种诱导型启动子、 组织特异性启动子或组成型启动子,更优选地含有一种诱导型启动子, 例如创伤诱导型或化学诱导型启动子,例如烟草PR-1a启动子,该启 动子与编码反式激活蛋白(优选的是不在植物中天然存在的反式激活 蛋白,优选地RNA聚合酶或DNA结合蛋白,如T7 RNA聚合酶)的 DNA序列有效连接,该反式激活蛋白任选地与质体导向序列如叶绿体 导向序列(例如,上述可在植物中表达的表达盒)融合;和

一种异源质体表达盒或其部分,其含有由反式激活蛋白调节并与 编码海藻糖-6-磷酸合酶的核苷酸序列有效连接的反式激活蛋白介导启 动子(例如,当反式激活蛋白是T7 RNA聚合酶时为T7启动子), 和由反式激活蛋白调节并与编码海藻糖-6-磷酸磷酸酶的核苷酸序列有 效连接的反式激活蛋白介导启动子(例如,当反式激活蛋白是T7 RNA 聚合酶时为T7启动子);

还包括这种植物的子代和种子,种子被任选地处理(如装填或包 被)和/或包装,例如与使用说明书一起放于袋子或其他容器中。

在另一个实施方案中,本发明包括编码海藻糖生物合成酶的核苷 酸序列在一个启动子控制下在质体中的表达,该启动子由正常存在于 质体中的RNA聚合酶(如核编码的聚合酶或质体编码的聚合酶)所转 录。这些启动子包括但不限于clpP启动子、16S r-RNA基因启动子、 psbA启动子或rbcL启动子。

本发明因此另外提供:

一种植物,其含有

一种异源核表达盒或其部分,其优选地含有一种能使编码海藻糖 生物合成酶的核苷酸序列在植物质体中表达的启动子,例如由正常存 在于质体中的RNA聚合酶(如核编码的聚合酶或质体编码的聚合酶)所 转录的启动子,它与至少一种编码海藻糖生物合成酶如海藻糖-6-磷酸 合酶的核苷酸序列有效连接;还包括这种植物的子代和种子,种子被 任选地处理(如装填或包被)和/或包装,例如与使用说明书一起放于 袋子或其他容器中。

此外本发明提供:

一种植物,其含有

一种异源核表达盒或其部分,其优选地含有一种能使编码海藻糖 生物合成酶的核苷酸序列在植物质体中表达的启动子,例如由正常存 在于质体中的RNA聚合酶(如核编码的聚合酶或质体编码的聚合酶)所 转录的启动子,它与编码海藻糖-6-磷酸磷酸酶的核苷酸序列有效连 接;

还包括这种植物的子代和种子,种子被任选地处理(如装填或包 被)和/或包装,例如与使用说明书一起放于袋子或其他容器中。

此外本发明提供:

一种植物,其含有

一种异源核表达盒或其部分,其优选地含有一种能使编码海藻糖 生物合成酶的核苷酸序列在植物质体中表达的启动子,例如由正常存 在于质体中的RNA聚合酶(如核编码的聚合酶或质体编码的聚合酶)所 转录的启动子,它与编码海藻糖-6-磷酸合酶的核苷酸序列有效连接, 以及由由正常存在于质体中的RNA聚合酶(如核编码的聚合酶或质体 编码的聚合酶)所转录的启动子,它与编码海藻糖-6-磷酸磷酸酶的核苷 酸序列有效连接;

还包括这种植物的子代和种子,种子被任选地处理(如装填或包 被)和/或包装,例如与使用说明书一起放于袋子或其他容器中。

在另一个实施方案中,本发明包括操纵子样多顺反子基因中两种 或多种基因在植物质体中由单一启动子开始的表达。在一个优选实施 方案中,操纵子样多顺反子基因包含两种或多种基因,例如包含编码 海藻糖生物合成酶的核苷酸序列的基因,其与能引导操纵子样多顺反 子基因在质体中表达的启动子有效连接,并将该多顺反子基因插入质 体基因组中。在一个优选实施方案中,操纵子样多顺反子基因含有一 个位于操纵子样多顺反子基因中两个基因之间的间插DNA序列,优选 的其是在质体基因组中不存在的DNA序列。在另一个优选实施方案 中,间插DNA序列来源于非真核基因的5’非翻译(UTR)区,优选 地病毒5’UTR,优选地来源于噬菌体如T7、T3或SP6噬菌体的5’ UTR。在一个优选实施方案中,修饰该DNA序列从而防止形成能阻 止或抑制位于间插DNA序列直接下游的基因翻译的二级结构。在一个 优选实施方案中,位于间插DNA序列直接下游的基因的表达-优选地 翻译-得到增强。

此外,本发明因此提供:

一种植物,其含有

一种异源核表达盒或其部分,其优选地含有一种诱导型启动子、 组织特异性启动子或组成型启动子,更优选地一种诱导型启动子,例 如创伤诱导型或化学诱导型启动子,例如烟草PR-1a启动子,该启动 子与编码反式激活蛋白(优选的是不在植物中天然存在的反式激活蛋 白,优选地RNA聚合酶或DNA结合蛋白,如T7 RNA聚合酶)的核 苷酸序列有效连接,该反式激活蛋白任选地与质体导向序列如叶绿体 导向序列(例如,上述可在植物中表达的表达盒)融合;和

一种异源质体表达盒或其部分,其含有由反式激活蛋白调节并与 操纵子样多顺反子基因有效连接的反式激活蛋白介导启动子(例如, 当反式激活蛋白是T7 RNA聚合酶时为T7启动子),该多顺反子基 因含有至少一种包含编码海藻糖生物合成酶的核苷酸序列的基因。在 一个优选实施方案中,该操纵子样多顺反子基因含有一种包含编码海 藻糖磷酸合酶的核苷酸序列的基因,和一种编码编码海藻糖磷酸磷酸 酶的核苷酸序列的基因。在一个优选实施方案中,操纵子样多顺反子 基因含有一种位于操纵子样多顺反子基因中两个基因之间的间插DNA 序列,优选的是在质体基因组中不存在的DNA序列。在一个优选实施 方案中,该DNA序列来源于非真核基因的5’非翻译(UTR)区,优 选地病毒5’UTR,优选地来源于噬菌体如T7、T3或SP6噬菌体的5’ UTR。在一个优选实施方案中,修饰该DNA序列从而防止形成能阻 止或抑制位于间插DNA序列直接下游的基因翻译的二级结构。在一个 优选实施方案中,位于间插DNA序列直接下游的基因的表达-优选地 翻译-得到增强。

还包括这种植物的子代和种子,种子被任选地处理(如装填或包 被)和/或包装,例如与使用说明书一起放于袋子或其他容器中。

此外本发明提供:

一种植物,其含有

一种异源核表达盒或其部分,其优选地含有一种能使编码海藻糖 生物合成酶的核苷酸序列在植物质体中表达的启动子,例如由正常存 在于质体中的RNA聚合酶(如核编码的聚合酶或质体编码的聚合酶)所 转录的启动子,该启动子与一种操纵子样多顺反子基因有效连接,该 基因含有至少一种包含编码海藻糖生物合成酶的核苷酸序列的基因。 在一个优选实施方案中,该操纵子样多顺反子基因含有一种包含编码 海藻糖磷酸合酶的核苷酸序列的基因,和一种编码编码海藻糖磷酸磷 酸酶的核苷酸序列的基因。在一个优选实施方案中,该操纵子样多顺 反子基因含有一种位于操纵子样多顺反子基因中两个基因之间的间插 DNA序列,优选的是在质体中不存在的DNA序列。在一个优选实施 方案中,该DNA序列来源于非真核基因的5’非翻译(UTR)区,优 选地病毒5’UTR,优选地来源于噬菌体如T7、T3或SP6噬菌体的5’ UTR。在一个优选实施方案中,修饰该DNA序列从而防止形成能阻 止或抑制位于间插DNA序列直接下游的基因翻译的二级结构。在一个 优选实施方案中,位于间插DNA序列直接下游的基因的表达-优选地 翻译-得到增强。

还包括这种植物的子代和种子,种子被任选地处理(如装填或包 被)和/或包装,例如与使用说明书一起放于袋子或其他容器中。

此外本发明提供:

一种可在植物中表达的表达盒,其优选地含有一种诱导型启动子 例如创伤诱导型或化学诱导型启动子,例如例如烟草PR-1a启动子, 该启动子与编码反式激活蛋白(优选的是不在植物中天然存在的反式 激活蛋白,优选地RNA聚合酶或DNA结合蛋白,如T7 RNA聚合酶) 的核苷酸序列有效连接,该反式激活蛋白与质体导向序列如叶绿体导 向序列融合;

一种含有这种植物表达盒的载体;和

一种用这种载体转化的植物,或其基因组中含有这种植物可表达 表达盒的转基因植物。

本发明也提供:

一种异源质体表达盒,其含有一种由反式激活蛋白调节并与编码 至少一种海藻糖生物合成酶(如海藻糖-6-磷酸合酶和/或海藻糖-6-磷酸 磷酸酶)的核苷酸序列有效连接的反式激活蛋白介导启动子(例如,当 反式激活蛋白是T7 RNA聚合酶时为T7启动子)。

本发明也提供:

一种异源质体表达盒,其含有一种由正常存在于质体中的RNA聚 合酶(如核编码聚合酶或质体编码聚合酶)转录并与编码至少一种海藻糖 生物合成酶(如海藻糖-6-磷酸合酶和/或海藻糖-6-磷酸磷酸酶)的核苷酸 序列有效连接的启动子。

本发明也提供:

一种异源质体表达盒,其含有一种能使海藻糖生物合成基因在植 物质体中表达的启动子,例如由正常存在于质体中的RNA聚合酶如核 编码聚合酶或质体编码聚合酶转录的启动子,或由反式激活蛋白调节 的反式激活蛋白介导启动子(例如,当反式激活蛋白是T7 RNA聚合 酶时为T7启动子),它与一种含有编码两种海藻糖生物合成酶的核苷 酸序列的操纵子样多顺反子基因有效连接。在一个优选实施方案中, 该操纵子样多顺反子基因含有一种位于操纵子样多顺反子基因中两个 基因之间的间插DNA序列,优选的是在质体中不存在的DNA序列。 在一个优选实施方案中,该DNA序列含有非真核基因的5’非翻译 (UTR)区的一部分,优选地病毒5’UTR,优选地来源于噬菌体如T7、 T3或SP6噬菌体的5’UTR。在一个优选实施方案中,修饰该DNA 序列从而防止形成能阻止或抑制位于间插DNA序列直接下游的基因翻 译的二级结构。在一个优选实施方案中,位于间插DNA序列直接下游 的基因的表达-优选地翻译-得到增强。

本发明也包括:

一种产生上述植物的方法,包括

一种含有异源核表达盒或其部分的植物,此表达盒包含一种诱导 型启动子、组织特异性启动子或组成型启动子,更优选地诱导型启动 子,该启动子与编码能调节反式激活蛋白介导启动子的反式激活蛋白 的核苷酸序列有效连接,用该植物的花粉对一种含有包含反式激活蛋 白介导启动子的异源质体表达盒或其部分的植物传粉,该启动子由反 式激活蛋白调节并与目的核苷酸序列(优选地编码至少一种海藻糖生物 合成酶如海藻糖-6-磷酸合酶和/或海藻糖-6-磷酸磷酸酶)的核苷酸序列 有效连接;

从这样传粉的植物中回收种子;和

由所述种子培育上述植物。

本发明进一步提供:

一种在植物中产生海藻糖的方法,方法是在该植物中,在上述任 一种启动子如诱导型启动子(如创伤诱导型或化学诱导型启动子)的控制 下,从该植物的核基因组表达至少一种编码海藻糖生物合成酶的核苷 酸序列,或者在能在该植物的质体中表达该核苷酸序列的启动子的控 制下或在上述任一种表达盒中,从该植物的质体基因组表达至少一种 编码海藻糖生物合成酶的核苷酸序列。

一种保护植物免于干旱、高盐度、渗透压协迫和极端温度影响的 方法,方法是在该植物中,在诱导型启动子(如创伤诱导型或化学诱导 型启动子)的控制下,从该植物的核基因组表达至少一种编码海藻糖生 物合成酶的核苷酸序列,或者在能在该植物的质体中表达该核苷酸序 列的启动子的控制下,从该植物的质体基因组表达至少一种编码海藻 糖生物合成酶的核苷酸序列。

一种提高收获植物的耐贮性的方法,方法是在该植物中,在诱导 型启动子(如创伤诱导型或化学诱导型启动子)的控制下,从该植物的核 基因组表达至少一种编码海藻糖生物合成酶的核苷酸序列,或者在能 在该植物的质体中表达该核苷酸序列的启动子的控制下,从该植物的 质体基因组表达至少一种编码海藻糖生物合成酶的核苷酸序列。

一种延长果实和蔬菜贮存时间和保存花的方法,方法是在该果实、 蔬菜和花中,在诱导型启动子(如创伤诱导型或化学诱导型启动子)的控 制下,从该植物的核基因组表达至少一种编码海藻糖生物合成酶的核 苷酸序列,或者在能在该植物的质体中表达该核苷酸序列的启动子的 控制下,从该植物的质体基因组表达至少一种编码海藻糖生物合成酶 的核苷酸序列。

一种稳定转基因植物中表达的蛋白质的方法,方法是在该植物中, 在诱导型启动子(如创伤诱导型或化学诱导型启动子)的控制下,从该植 物的核基因组表达至少一种编码海藻糖生物合成酶的核苷酸序列,或 者在能在该植物的质体中表达该核苷酸序列的启动子的控制下,从该 植物的质体基因组表达至少一种编码海藻糖生物合成酶的核苷酸序列。

本发明进一步提供:

一种在植物质体中从单一启动子开始表达两种或多种基因的方 法,包括向该植物的质体基因组中引入一种操纵子样多顺反子基因, 该基因包含与能在该植物质体中表达该操纵子样多顺反子基因的启动 子有效连接的所述两种或多种基因,其中该操纵子样多顺反子基因另 外含有一种位于两个基因之间的间插DNA序列。在一个优选实施方案 中,DNA序列在质体基因组中不存在。在一个优选实施方案中,该DNA 序列包含非真核基因的5’非翻译(UTR)区的一部分,优选地病毒5’ UTR,优选地来源于噬菌体如T7、T3或SP6噬菌体的5’UTR。在一 个优选实施方案中,修饰该DNA序列从而防止形成能阻止或抑制位于 间插DNA序列直接下游的基因翻译的二级结构。在一个优选实施方案 中,位于间插DNA序列直接下游的基因的表达-优选地翻译-得到增 强。

在一个优选实施方案中,操纵子样多顺反子基因含有至少一种包 含编码海藻糖生物合成基因的核苷酸序列的基因。在另一个优选实施 方案中,操纵子样多顺反子基因含有一种包含编码海藻糖磷酸合酶的 核苷酸序列的基因和一种包含编码海藻糖磷酸磷酸酶的核苷酸序列的 基因。

本发明进一步提供:

一种分离的DNA分子,其含有与SEQ ID NO:45、47、49或51 所示任一种核苷酸序列相同或基本上相似的核苷酸序列。在一个优选 实施方案中,该核苷酸序列编码一种具有与SEQ ID NO:46、48、50 或52所示任一种基酸序列相同或基本上相似的氨基酸序列的多肽。 在一个优选实施方案中,该DNA分子与SEQ ID NO:45、47、49或 51所示任一种核苷酸序列相同或基本上相似,或者编码一种具有与 SEQ ID NO:46、48、50或52所示任一种氨基酸序列相同或基本上 相似的氨基酸序列的多肽。在一个优选实施方案中,该DNA分子来源 于一种单子叶植物,优选地来源于玉米。在一个优选实施方案中,该 核苷酸序列编码一种海藻糖生物合成基因或其部分,优选地海藻糖-6- 磷酸合酶或海藻糖-6-磷酸磷酸酶。

本发明进一步提供:

一种分离的蛋白质,其含有一种由SEQ ID NO:45、47、49或51 所示任一种核苷酸序列编码的多肽,或者含有一种具有与SEQ ID NO:46、48、50或52所示任一种氨基酸序列相同或基本上相似的氨 基酸序列的多肽。在一个优选实施方案中,该蛋白质由SEQ ID NO: 45、47、49或51所示任一种核苷酸序列编码,或者与SEQ ID NO: 46、48、50或52所示任一种氨基酸序列编码的多肽相同或基本上相 似。在一个优选实施方案中,该多肽优选地来源于一种单子叶植物, 优选地来源于玉米。在一个优选实施方案中,该多肽包含海藻糖生物 合成酶或其部分,优选地海藻糖-6-磷酸合酶或海藻糖-6-磷酸磷酸酶。

本发明进一步提供:

一种植物,其含有一种包含SEQ ID NO:45、47、49或51所示 任一种核苷酸序列或其部分的表达盒,其中该DNA分子可在该植物中 表达。在一个优选实施方案中,该表达盒稳定地整合于该植物的基因 组中。在一个优选实施方案中,该植物耐受逆境,优选地干旱、渗透 压及温度逆境。

本发明进一步提供:

一种培育对逆境优选地干旱、渗透压及温度逆境有增强抗性的植 物的方法,包括下列步骤:

a)使用SEQ ID NO:45、47、49或51所示任一种核苷酸序列或 其部分,鉴定植物种不同品种中的分子多态性,和

b)使该多态性与显示对逆境优选地干旱、渗透压及温度逆境有增 强抗性的植物种的一个品种相关联,和

c)利用该多态性通过标准培育技术将该逆境抗性引入该植物种的 希望的系中。

本发明进一步提供:

一种通过上述任一种方法获得的植物,其中该植物耐受逆境,优 选地干旱、渗透压及温度逆境。 定义

为了确保对本说明书和权利要求书的清楚和一致的理解,提供下 列定义:

“耐旱性”是一种生理状态,此时植物能持续长期地接受少于正 常所需的水或不被浇水,而不显示叶子枯萎或脱水的其他特征。

在此使用时,“基因”包含任选地与核苷酸序列之前或之后的DNA 序列有效连接的核苷酸序列。该核苷酸序列一般被转录为RNA如 mRNA(有义RNA或反义RNA)、rRNA、tRNA或snRNA。基因 中的核苷酸序列任选地包含一种能被翻译为一种多肽的编码序列。核 苷酸序列之前或之后的DNA序列的实例包括5’和3’非翻译序列、终 止信号和核糖体结合位点(rbs),或其部分。基因中也可能存在的其 他元件是例如内含子。

在此使用的“表达盒”意思是一种DNA构建体,它设计为使得插 入其中的核苷酸序列能在适当宿主细胞中转录,任选地翻译。表达盒 一般含有调节元件,例如能引导与该核苷酸序列有效连接的核苷酸序 列表达的启动子,其本身任选地与3’序列(如3’调节序列)或终止信号 有效连接。表达盒也可含有核苷酸序列中所含编码序列的正确翻译所 需的序列。该核苷酸序列通常含有一种蛋白质的编码序列,但也可编 码一种目的功能RNA,例如反义RNA或非翻译RNA,它们以有义或 反义方向抑制特定基因的表达如反义RNA。含有目的核苷酸序列的表 达盒可以是嵌合的,意思是其至少一种成分对于其至少另一种成分而 言是异源的。表达盒也可以是天然存在但已经以用于异源表达的重组 形式获得的。然而一般而言,表达盒对于宿主是异源的,即表达盒的 特定DNA序列不是天然存在于宿主细胞中,必须被引入宿主细胞或宿 主细胞的祖先中。表达盒中核苷酸序列的表达可以受组成型启动子或 诱导型启动子的控制,该启动子只有在宿主细胞接触某种特定外部刺 激物时才起始转录。对于多细胞生物,如植物,启动子也可能是对特 定组织或器官或发育阶段特异的。核表达盒通常被插入植物的核基因 组中,并且能引导该植物核基因组的特定核苷酸序列的表达。质体表 达盒通常被插入植物的质体基因组中,并且能引导该植物质体基因组 的特定核苷酸序列的表达,例如,由正常存在于质体中的RNA聚合酶 (如核编码聚合酶或质体编码聚合酶)转录的启动子,或反式激活蛋白介 导的启动子。此处所述的质体表达盒可以任选地含有一种操纵子样多 顺反子基因。

“调节元件”是指参与核苷酸序列表达的DNA序列。调节元件含 有一种与目的核苷酸序列有效连接的启动子,也可包含5’和3’非翻译 区(UTR)或终止信号。它们一般也包含核苷酸序列适当翻译所需的 序列,例如,在质体表达的情况中,包含核糖体结合位点(rbs)。

在此使用的“异源的”意思是“不同自然来源的”,或代表一种 非天然状态。例如,如果用来源于另一种生物尤其来源于另一个种的 核苷酸序列转化宿主细胞,则该核苷酸序列对于该宿主细胞是异源的, 并且对于该宿主细胞的携带该基因的后代也是异源的。同样,异源是 指一种来源于和插入相同天然、原始细胞型的核苷酸序列,但它以非 天然状态存在,例如,不同拷贝数,或处于不同调节元件控制之下。 转化的核苷酸序列可以含有一种异源编码序列,或异源调节序列。此 外,转化的核苷酸序列也可能是完全异源的,或者可能包括异源和内 源核酸序列的任一可能的组合。

“表达”是指核苷酸序列(如内源基因或异源基因)在宿主生物如微 生物或植物中的转录和/或翻译。例如,对于反义构建体,表达可以仅 指反义DNA的转录。

“操纵子样多顺反子基因”含有两种或多种目的基因,它们受能 引导这种操纵子样多顺反子基因在植物质体中表达的单个启动子控 制。操纵子样多顺反子基因中的每一种基因任选地含有一种与核苷酸 序列5’端有效连接的核糖体结合位点(rbs)。操纵子样多顺反子基因 中的每种rbs优选地是不同的。操纵子样多顺反子基因一般也包含与 操纵子样多顺反子基因中第一种基因rbc的5’端有效连接的5’UTR, 和与操纵子样多顺反子基因中最后一种基因3’端有效连接的3’UTR。 操纵子样多顺反子基因中的两种基因也可包含在两种基因间重叠的几 种核酸。

“同质体的”指一种植物、植物组织或植物细胞,其中所有的质 体是遗传学上相同的。当质体未被转化、突变或其他遗传改变时,这 在植物中是正常状态。在不同的组织或发育阶段中,质体可能有不同 的形式,例如叶绿体、前质体、黄化质体、造粉体、色质体等等。

“标记基因”:一种编码选择性或可筛选性状的基因。

“诱导型启动子”:“诱导型启动子”是仅当植物接触某些特定 的外部刺激物时才起始转录的启动子,其不同于组成型启动子或对特 定组织或器官或发育阶段特异的启动子。对于本发明特别优选的是化 学诱导型启动子和创伤诱导型启动子。化学诱导型启动子包括植物衍 生的启动子,如系统获得的耐受途径中的启动子,例如PR启动子, 如PR-1、PR-2、PR-3、PR-4和PR-5启动子,尤其是烟草PR-1a启 动子和拟南芥PR-1启动子,当植物接触BTH和相关化学物时它们才 起始转录。见美国专利5,614,395,在此引用作为参考,以及WO 98/03536,在此引用作为参考。化学诱导型启动子也包括受体介导的 系统,如来源于其他生物的系统,如类固醇依赖的基因表达、依赖 的基因表达、四环素依赖的基因表达,尤其是应用保幼生长激素及其 拮抗剂介导的果蝇(Drosophila)USP受体的表达系统,这在EP-A 0859 851中有述,在此引用作为参考,以及使用受体组合的系统,如EP-A 0 813 604中所述,在此引用作为参考。创伤诱导型启动子包括蛋白酶抑 制剂的启动子,如铃著的蛋白酶抑制剂Ⅱ启动子,及其他参与创伤 应答途径的植物衍生的启动子,如多酚化酶、LAP和TD的启动子。 总的见C.Gatz,“基因表达的化学调控”,植物生理学与植物分子生 物学年报,(Annu.Rev.Plant Physiol.Plant Mol.Biol.)(1997)48: 89-108,其内容在此引用作为参考。

“有效连接/相关”:如果两种序列位于某处使得DNA序列影响 核苷酸序列的表达,那么该DNA序列,例如含有一种调节元件,认为 与该核苷酸序列“有效连接”或“相关”。

“表型性状”:由一种或多种基因的表达引起的可检测性质。

“植物”:“植物”是指处于任一发育阶段的任一植物或植物的 部分。在本发明的某些实施方案中,植物可能被致死性创伤以诱导表 达,或者可诱导表达致死水平的希望蛋白质,因此在此使用的术语“植 物”特别是指包括被严重损伤或杀死的植物和植物材料,以及存活的 植物、插条、细胞或组织培养物和种子。优选地,本发明的植物不同 之处在于,直到海藻糖生物合成基因诱导时仍是发育正常的。

“植物细胞”:植物的结构和生理学单位,包括原生质体和细胞 壁。植物细胞可能为分离的单细胞或培养细胞的形式,或者作为高级 组织单位的一部分,如植物组织或植物器官。

“植物材料”:是指叶、茎、根、花或花部分、果实、花粉、花 粉管、胚珠、胚囊、卵细胞、合子、胚、种子、质体、线粒体、插条、 细胞或组织培养物、或植物的其他任何部分或产物。

“启动子”:起始相关DNA序列转录的DNA序列。启动子区也 可包含作为基因表达调节物如激活物、增强剂和/或阻抑物的元件。

“原生质体”:细胞壁被全部或部分去除的分离的植物细胞。

“重组DNA分子”:用重组DNA技术连接在一起的DNA序列 的组合。

“重组DNA技术”:用来连接DNA序列的方法,例如,如Sambrook 等人,1989,冷泉港,NY:冷泉港实验室出版社所述。

“可筛选的标记基因”:一种基因,其表达不能赋予转化细胞选 择性优势,但其表达使转化细胞在表型上不同于未转化的细胞。

“选择性标记基因”:一种基因,其在植物细胞中的表达给予该 细胞一种选择性优势。与未转化的细胞的生长相比,用选择性标记基 因转化的细胞所具有的选择性优势可能是由于其在负选择剂如抗生素 或除草剂存在下生长的能。与未转化细胞相比,转化细胞具有的选 择性优势也可能是由于其利用添加的化合物作为养分、生长因子或能 源的增强的或新的能力。选择性标记基因也指其在植物细胞中的表达 给予细胞负选择和正选择优势的基因或基因组合。

最广义地来说,当在此对于核苷酸序列使用时,术语“基本上类 似”意思是一种对应于参照核苷酸序列的核苷酸序列,其中相应的序 列编码一种与参照核苷酸序列编码的多肽有基本上相同的结构和功能 的多肽,例如,只发生不影响多肽功能的氨基酸改变。希望地,基本 上相似的核苷酸序列编码参照核苷酸序列编码的多肽。基本上类似的 核苷酸序列与参照核苷酸序列之间同一性的百分数希望地为至少 80%,更希望地为至少85%,优选地至少90%,更优选地至少95%, 再更优选地至少99%。使用Smith-Waterman序列对比算法进行序列 对比(见,例如,Waterman,M.S.《计算生物学介绍:图谱、序列 与基因组》。Chapman & Hall.伦敦:1995.ISBN 0-412-99391-0,或 http://www-hto.usc.edu/software/seqaln/index.html)。localS程序1.16 版使用下列参数:匹配:1,罚错配:0.33,开放罚区间(open-gap): 2,扩展罚区间(extended-gap):2。与参照序列“基本上类似的” 核苷酸序列在下列条件下可与参照核苷酸序列杂交:7%十二烷基硫酸 钠(SDS)、0.5M NaPO4、lmM EDTA,50℃,用2×SSC、0.1%SDS 在50℃下洗涤,更希望的是7%十二烷基硫酸钠(SDS)、0.5M NaPO4、 1mM EDTA,50℃,用1×SSC、0.1%SDS在50℃下洗涤,更希望的 是7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA,50℃, 用0.5×SSC、0.1%SDS在50℃下洗涤,优选的是7%十二烷基硫酸钠 (SDS)、0.5M NaPO4、1mM EDTA,50℃,用0.1×SSC、0.1%SDS 在50℃下洗涤,更优选的是7%十二烷基硫酸钠(SDS)、0.5M NaPO4、 1mM EDTA,50℃,用0.1×SSC、0.1%SDS在65℃下洗涤。

当在此对于蛋白质使用时,术语“基本上类似”意思是一种对应 于参照蛋白质的蛋白质,其中该蛋白质与参照蛋白质有基本上相同的 结构和功能,例如,只发生不影响多肽功能的氨基酸变化。当用于蛋 白质或氨基酸序列时,基本上类似的与参照蛋白质或氨基酸序列之间 的同一性百分数希望地至少为80%,更希望地85%,优选地至少90%, 更优选地至少95%,再更优选地至少99%。

“反式激活蛋白”:“反式激活蛋白”是一种蛋白质,其本身或 与一种或多种其他蛋白质结合,能使编码区的转录受相应反式激活蛋 白介导启动子的控制。反式激活蛋白系统的实例包括噬菌体T7基因10 启动子,其转录激活依赖于特异的RNA聚合酶如噬菌体T7 RNA聚 合酶。反式激活蛋白一般是一种RNA聚合酶或DNA结合蛋白,它能 通过直接激活启动子或灭活阻遏基因,例如,抑制阻遏蛋白的表达或 积累,与特定的启动子相互作用而起始转录。DNA结合蛋白可以是一 种包含与适当转录激活蛋白结构域连接的结合区(如GAL4结合区) 的嵌合蛋白。某些反式激活蛋白系统可能具有多种反式激活蛋白,例 如对于启动子识别、DNA结合、或转录激活不仅需要聚合酶而且需要 特定亚单位(sigma因子)的启动子。反式激活蛋白优选地对于植物 是异源的。

“转化”:核苷酸序列向细胞中的引入。特别是,DNA分子向目 的生物基因组中的稳定整合。

“海藻糖生物合成酶”是如此处所述参与由葡萄糖生物合成海藻 糖的多肽,特别是催化UDP-葡萄糖和葡萄糖-6-磷酸缩合为海藻糖-6- 磷酸的海藻糖-6-磷酸合酶,或使海藻糖-6-磷酸磷酸化为海藻糖的海藻 糖-6-磷酸磷酸酶。编码海藻糖生物合成酶的核苷酸序列包含于海藻糖 生物合成基因中。

“海藻糖”是一种D-吡喃葡糖基-[1,1]-D-吡喃葡糖苷。本发明中 海藻糖的优选形式是α,α-海藻糖(α-D-吡喃葡糖基-[1,1]-α-D-吡喃葡糖 苷)。

本发明也包括含有本发明的DNA分子的细胞,其中该DNA分子 不存在于其天然细胞环境中。在一个优选实施方案中,这些细胞是植 物细胞。在另一个优选实施方案中,本发明的DNA分子可在这些细胞 中表达,并包含于使其能在这些细胞中表达的表达盒中。在一个优选 实施方案中,表达盒稳定地整合于这种宿主细胞的DNA中。在另一个 优选实施方案中,表达盒包含于能在细胞中复制并作为染色体外分子 存在于细胞中的载体中。

本发明也包括含有上述植物细胞的植物。在另一个实施方案中, 本发明的DNA分子可在植物中表达,本发明的任一种DNA分子或其 功能部分或其衍生物在转基因植物中的表达使得海藻糖产生,并导致 耐旱性、提高的食物质量、可用于工业生产的高水平海藻糖及此处所 述的其他特征。因此本发明也包括由于本发明的任一种DNA分子或其 功能部分或衍生物表达而表达海藻糖的转基因植物。

根据本发明转化的植物可以是单子叶植物或双子叶植物,包括但 不限于:玉米、小麦、大麦、黑麦、甘薯、菜豆、豌豆、菊苣、莴苣、 洋白菜、花椰菜、硬花球花椰菜、萝卜、小萝卜、菠菜、芦笋、洋葱、 大蒜、胡椒、芹菜、笋瓜、南瓜、大麻、夏南瓜、苹果、梨、温柏、 甜瓜、李子、樱桃、桃、油桃、杏、草莓、葡萄、木莓、黑莓、菠萝、 鳄梨、番木瓜,芒果、香蕉、大豆、番茄、高粱甘蔗、甜菜、向日 葵、油籽油菜、三叶草、烟草、胡萝卜、花、苜蓿、水稻、马铃薯、 茄子、黄瓜、拟南芥(Arabidopsis thaliana),和木本植物如松柏类 和落叶类树。

优选的是选自玉米、小麦、大麦、黑麦、高粱和水稻的单子叶植 物。

进一步优选的是选自菊苣、莴苣、洋白菜、花椰菜、硬花球花椰 菜、胡椒、笋瓜、南瓜、夏南瓜、甜瓜、大豆、番茄、甘蔗、甜菜、 向日葵、油籽油菜、棉花和苜蓿的双子叶植物。

一旦希望的核苷酸序列被转化到特定的植物种中,即可用传统的 培育技术,例如通过轮回选择培育(如回交),使其在该种中繁殖或移至 相同种的其他变种中,尤其包括商业变种。在此情况中,首先使欲渐 渗希望的转基因的回归亲本与带有所述转基因的非回归亲本杂交。然 后使该杂交的子代与回归亲本回交,之后在得到的子代中选择欲从非 回归亲本转移出的转基因。与回归亲本回交选择转基因三代、优选地 四代、更优选地五代或更多代之后,对所转移的转基因而言子代将是 杂合的,但在大多数或几乎所有其他基因而言类似于回归亲本。

对于在转基因植物中的表达,DNA分子可能需要修饰和优化,特 别是在DNA分子是原核来源时。本领域中公知,所有生物都具有密码 子使用的特殊偏好性,并且能改变本发明的DNA分子中所含核苷酸序 列中的密码子,使之符合特殊的植物偏好性,而保留由此编码的氨基 酸。此外,由至少具有35%优选地超过45%GC含量的编码序列可最 佳地实现在植物中的高表达。由于存在可能使信息去稳定的ATTTA 基元和可引起不适当聚腺苷酸化的AATAAA基元,具有低GC含量 的核苷酸序列可能表达较差。虽然优选的基因序列在单子叶植物和双 子叶植物种中都可以充分表达,但是可以修饰这些序列来适应单子叶 植物或双子叶植物的特殊密码子偏好性和GC含量偏好性,因为发现 这些偏好性各不相同(Murray等人,核酸研究(Nucl.Acids Res.)17: 477-498(1989))。另外,对导致信息截断的非常规剪接位点的存在 进行核苷酸序列筛选。用公开的专利申请EP 0385962(Monsanto)、 EP 0359472(Lubrizol)和WO 93/07278(Ciba-geigy)所述的方法, 利用众所周知的定点诱变、PCR和合成基因构建,进行如上所述需要 在核苷酸序列内进行的所有改变。

为了翻译的有效起始,与起始甲硫氨酸相邻的序列可能需要修饰。 例如,可通过使之含有已知在植物中有效的序列进行修饰。Joshi曾经 提出了适当的植物共有区(NAR 15:6643-6653(1987)),Clontech 提出另一种共有翻译起始区(1993/1994目录,第210页)。这些共有 区适于与本发明的核苷酸序列一起使用。将这些序列掺入含有该核苷 酸序列的构建体中,直到并包含ATG(在第二个氨基酸未被修饰时), 或者直到并包含在ATG之后的GTC(具有修饰转基因的第二个氨基 酸的可能性)。

在转基因植物中,本发明的DNA分子,例如海藻糖生物合成基因 或编码一种反式激活蛋白的基因,由在植物中显示有功能的启动子所 引导。启动子的选择将随表达的时间和空间需要而不同,也随目标种 而不同。虽然多种双子叶植物启动子显示在单子叶植物中也是有效的 并且反之亦然,但理想的是,对于双子叶植物中的表达选择双子叶植 物启动子,对于单子叶植物中的表达选择单子叶植物启动子。然而, 对于所选择启动子的来源没有限制;只要它们在引导DNA分子在希望 的细胞中表达这一方面有效就足够了。

组成型表达的优选启动子包括CaMV 35S和19S启动子、来源于 编码肌动蛋白或遍在蛋白的基因的启动子和来源于农杆菌属 (Agrobacteriuim)的启动子,例如PCT/US94/12946中所述的合成 启动子。然而,本发明的DNA分子优选地在化学调节的启动子的调节 下表达。这使得只有在用诱导性化学制剂处理作物时才合成海藻糖, 由此避免了秧苗的发育异常。在公开申请EP 0332104(Ciba-Geigy) 和美国专利5,614,395中详述了用于化学诱导基因表达的优选技术。用 于化学诱导的一种优选启动子是烟草PR-1a启动子。

第二种优选的诱导型启动子种类是,当植物受到损伤例如收获或 青贮或其他加工时使海藻糖生物合成酶表达的创伤诱导型启动子。曾 经描述了在创伤部位表达的多种启动子。该种类的优选启动子包括以 下所述的启动子:Stanford等人,分子普通遗传学(Mol.Gen.Genet.) 215:200-208(1989),Xu等人,植物分子生物学(Plant Molec.Biol.) 22:573-588(1993),Logemann等人,植物细胞(Plant Cell)1:151-158 (1989),Rohrmeier和Lehle,植物分子生物学22:783-792(1993), Firek等人,植物分子生物学22:129-142(1993),和Warner等人, 植物杂志(Plant J.)3:191-201(1993)。

优选的组织特异性表达模式包括:绿色组织特异性、根特异性、 茎特异性和花特异性表达。适于在绿色组织中表达的启动子包括调节 参与光合作用的基因的多种启动子,其中许多已经从单子叶植物和双 子叶植物中克隆。一种优选启动子是来源于磷酸烯醇羧化酶基因的玉 米PEPC启动子(Hudspeth和Grula,植物分子生物学12:579-589 (1989))。一种用于根特异性表达的优选启动子是de Framond(FEBS 290:103-106(1991);授予Ciba-Geigy的EP 0452269)所述的启 动子,另一种优选的根特异性启动子是本发明提供的T-1基因的启动 子。一种优选的茎特异性启动子是美国专利5,625,136(Ciba-Geigy) 所述并引导玉米trpA基因表达的启动子。

除了适当启动子的选择之外,用于蛋白质在植物中表达的构建还 任选地需要一种与异源核苷酸序列下游连接的适当转录终止子。几种 这样的终止子在本领域中是可获得的和公知的(例如CaMV的tm1和 rbcS的E9)。在本发明中能使用已知在植物中起作用的任一可获得 的启动子。能将多种其他序列掺入本发明的DNA分子的表达盒中。这 包括显示增强表达的序列如(例如Adh1和bronze1的)内含子序列 和(例如,TMV、MCMV和AMV的)病毒前导序列。

将DNA分子的表达导向到植物的不同细胞部位是优选的。在某些 情况中,在细胞溶胶中的定位可能是希望的,而在另一些情况中,在 某些亚细胞器中的定位可能是优选的。能用本领域众所周知的技术进 行转基因编码酶的亚细胞定位。一般而言,操作编码已知细胞器导向 基因产物的引导肽的DNA,并使其与核苷酸序列上游融合。对于叶绿 体已知多种这类导向序列,并且证明了其在异源构建中的作用。优选 的一类导向序列是液泡导向序列,例如,在植物壳多糖酶和蛋白酶中 发现的。

在本说明书中另外叙述了适用于植物转化的载体。对于农杆菌介 导的转化,二元载体或携带至少一种T-DNA边界序列的载体是合适 的,而对于直接基因转移,任何载体都是合适的,仅含有目的构建体 的线性DNA可能是优选的。在直接基因转移的情况中,能使用单DNA 种转化或共转化(Schocher等人,生物技术(Biotechnology)4: 1093-1096(1986))。对于直接基因转移和农杆菌介导的转移,通常 (但不是必须)用可提供对抗生素(卡那霉素、潮霉素或氨甲喋呤) 或除草剂(basta)抗性的选择性标记进行转化。然而,选择性标记的 选择对于本发明是不重要的。

在另一个优选实施方案中,直接将本发明的DNA分子转化到质体 基因组中。在美国专利号5,451,513、5,545,817、5,545,818和5,576,198; PCT申请号WO 95/16783和WO 97/32977;和McBride等人,美国 国家科学院院报(Proc.Natl.Acad.Sci.USA)91:7301-7305(1994) 中广泛描述了质体转化技术,在此全部引用作为参考。经biolistics的 质体转化最初在单细胞绿藻莱因哈德衣藻(Chlamydomonas reinhardtii)中进行(Boynton等人(1988)科学(Science)240: 1534-1537,在此引用作为参考),很快将利用选择顺式作用抗生素抗 性基因座(壮观霉素/链霉素抗性)或非光合作用突变表型互补的该方 法扩展到烟草(Nicotiana tabacum)(Svab等人(1990)美国国家科 学院院报87:8526-8530,在此引用作为参考)。

烟草质体转化的基本技术包括,对叶或愈伤组织的粒子轰击,或 PEG介导的原生质体质粒DNA摄取,该质粒具有侧翼为选择性抗生 素抗性标记的克隆质体DNA区。1-1.5kb侧翼区称为导向序列,其利 于与质体基因组的同源重组,因此允许156kb烟草质体基因组特定区 的置换或修饰。开始时,用赋予壮观霉素和/或链霉素抗性的质体16S rRNA和rps12基因中的点突变作为转化的选择性标记(Svab,Z., Haidukiewicz,P.和Maliga,P.(1990)美国国家科学院院报87, 8526-8530;Staub,J.M.和Maliga,P.(1992)植物细胞4,39-45, 在此引用作为参考)。这产生稳定的同质转化体,频率为每100次轰 击靶叶产生大约一个。这些标记之间克隆位点的存在使得能产生用于 外源基因引入的质体导向载体(Staub,J.M.和Maliga,P.,欧洲分 子生物学会杂志(EMBO J.)12:601-606(1993),在此引用作为参 考)。通过用显性选择标记,编码壮观霉素解毒酶氨基糖苷-3’-腺苷转 移酶的细菌aadA基因,置换隐性rRNA或r-蛋白抗生素抗性基因, 能实现转化频率的大大提高(Svab,Z.和Maliga,P.(1993)美国 国家科学院院报90,913-917,在此引用作为参考)。以前,该标记 曾成功地用于绿藻莱因哈德衣藻质体基因组的高频转化 (Goldschmidt-Clermont,M.(1991)核酸研究19,4083-4089, 在此引用作为参考)。最近,用聚乙二醇(PEG)介导的DNA摄取 实现了烟草和藓类Physcomitrella patens的原生质体的质体转化 (O’Neill等人(1993)植物杂志3:729-738;Koop等人(1996)Planta 199:193-201,两者在此都引用作为参考)。粒子轰击和原生质体转 化这两种方法在本发明中都是适合的。

将本发明的DNA分子插入包含一种能在植物质体中表达DNA分 子的启动子的质体表达盒中。一种能在植物质体中表达的优选启动子 是从质体基因编码区上游5’侧翼区分离的启动子,它可能来源于相同 的或不同的种,其天然产物一般存在于大多数质体类型中,包括非绿 色组织中存在的质体中。质体中的基因表达不同于核基因表达,并且 与原核生物中的基因表达有关(如Stern等人(1997)植物科学趋势 (Trends in Plant Sciences)2:308-315所述,在此引用作为参考)。 质体启动子通常含有原核启动子典型的-35和-10元件,一些质体启动 子由主要在质体基因组中编码的大肠杆菌样RNA聚合酶识别,称为 PEP(质体编码的RNA聚合酶)启动子,而其他质体启动子由核编码 的RNA聚合酶识别(NEP启动子)。两种类型的质体启动子都适用 于本发明。质体启动子的实例包括clpP基因的启动子、如烟草clpP 基因启动子(WO 97/06250,在此引用作为参考)和拟南芥clpP基因 启动子。

能在植物质体中表达DNA分子的另一种启动子来源于质体16S核 糖体RNA操纵子的调节区(Harris等人,微生物学综述(Microbiol. Rev.)58:700-754(1994),Shinozaki等人,欧洲分子生物学会杂 志5:2043-2049(1986),两篇在此都引用作为参考)。能在植物质 体中表达DNA分子的启动子的其他实例是psbA启动子或rbcL启动 子。质体表达盒优选地也另外含有与本发明的DNA分子有效连接的质 体基因3’非翻译序列(3’UTR)。非翻译序列的作用优选地是引导转 录RNA的3’加工,而不是转录终止。优选地,3’UTR是质体rps16 基因3’非翻译序列或拟南芥质体psbA基因3’非翻译序列。在另一个 优选实施方案中,质体表达盒含有一个poly-G序列段代替3’非翻译序 列。质体表达盒优选地还含有与本发明的DNA分子有效连接的、在植 物质体中有功能的5’非翻译序列(5’UTR)。

质体表达盒包含于质体转化载体中,该载体优选地还含有用于通 过同源重组向质体基因组中整合的侧翼区。质体转化载体可任选地含 有至少一个质体复制起点。本发明也包括用这种质体转化载体转化的 植物质体,其中DNA分子可在植物质体中表达。本发明也包括一种包 含该植物质体的植物或植物细胞,包括其后代。在一个优选实施方案 中,该植物或植物细胞(包括其后代)就转基因质体而言是同质的。

能在植物质体中表达DNA分子的其他启动子是反式激活蛋白调节 的启动子,优选地对于其中实现表达的植物或亚细胞器或植物细胞成 分是异源的。在这些情况中,将编码反式激活蛋白的DNA分子插入一 种适当的核表达盒中,并将其转化到植物核DNA中。用质体转运肽将 反式激活蛋白导向到质体中。使反式激活蛋白和反式激活蛋白驱使的 DNA分子集合在一起,方法是使选择的质体转化系与一种转基因系杂 交,该转基因系含有编码反式激活蛋白的DNA分子,并补充有质体导 向序列,并且其与一个核启动子有效连接,或者将含有希望的DNA分 子的质体转化载体直接转化到一种转基因系中,该转基因系含有编码 反式激活蛋白的DNA分子,并补充有质体导向序列,并且其与一个核 启动子有效连接。如果该核启动子是一种诱导型启动子,特别化学诱 导型启动子,则DNA分子在植物质体中的表达由化学诱导物的叶施用 而激活。这种反式激活蛋白介导的诱导型质体表达系统优选地是可紧 密调节的,在诱导之前无可检测的表达,在诱导之后有异常高的蛋白 质表达和积累。一种优选的反式激活蛋白是例如病毒RNA聚合酶。该 类型的优选启动子是由单亚基RNA聚合酶识别的启动子,如T7基因 10启动子,它被噬菌体T7 DNA依赖的RNA聚合酶识别。优选地将 编码T7聚合酶的基因转化到核基因组中,并用质体转运肽将T7聚合 酶导向到质体中。在下文或上文中描述了适用于核表达基因如编码病 毒RNA聚合酶如T7聚合酶的基因的启动子。DNA分子在质体中的 表达可以是组成型的或是诱导型的。DNA分子在质体中的表达也可以 是器官或组织特异的。在WO 98/11235中广泛描述了这些不同的实施 方案,在此引用作为参考。因此,一方面,本发明使叶绿体导向的噬 菌体T7 RNA聚合酶在化学诱导型烟草PR-1a启动子控制下在核基因 组中的表达(US 5,614,395,引用作为参考)与T7基因10启动子/终 止序列调节的叶绿体报道转基因结合起来。例如,当用在核中表达T7 聚合酶的植物系传粉给就母体遗传的海藻糖生物合成基因而言同质的 质体转化体时,获得带有两种转基因构建体但不表达它们的F1植物。 只在叶施用PR-1a诱导化合物苯并(1,2,3)噻二唑-7-硫代羧酸S-甲酯 (BTH)后,才在这些植物的质体中引发大量酶活性蛋白质的合成。

在一个优选实施方案中,在操纵子样多顺反子基因中从单启动子 开始由质体基因组转录两种或多种基因,如海藻糖生物合成基因。

在一个优选实施方案中,操纵子样多顺反子基因含有位于该操纵 子样多顺反子基因中两个基因之间的间插DNA序列。在一个优选实施 方案中,该DNA序列在质体基因组中不存在,以避免与质体序列的同 源重组。在另一个优选实施方案中,该DNA序列来源于非真核基因的 5’非翻译(UTR)区,优选地来源于病毒5’UTR,优选地来源于噬菌 体如T7、T3或SP6噬菌体的5’UTR。在一个优选实施方案中,修饰 该DNA序列,从而防止在操纵子样多顺反子基因的RNA转录中,例 如在该DNA序列与下游基因rbs之间形成RNA二级结构。这些二级 结构将阻止或抑制下游基因的表达,特别是其翻译的起始。利用计算 机模型和程序如“mfold”程序第3版(Zuker和Turner,华盛顿医 学院,St-Louis,MO)和本领域技术人员众所周知的其他方法,通过 测定其解链温度,预测这些RNA二级结构。以下例举了这种DNA序 列。

间插DNA序列在操纵子样多顺反子基因中的存在提高了下游基因 的rbs的可接近性,从而导致更高的表达率。这种策略适用于欲在操 纵子样嵌合基因中从单启动子开始从质体基因组转录的任何两种或多 种基因。这些基因可能是代谢途径的一部分,或者是编码输入(input) 或输出(output)性状的基因。代谢途径的实例是例如糖生物合成途径, 如海藻糖或果聚糖。

在另一个实施方案中,用称为体外重组或DNA重排(shuffling) 的技术,通过随机突变的引入来修饰本发明的DNA分子。Stemmer 等人,自然(Nature)370:389-391(1994)和美国专利5,605,793 中描述了该技术,在此引用作为参考。根据此处所述原始核苷酸序列, 能产生上百万的核苷酸序列突变拷贝,并能得到具有改进的性质如活 性提高或特异性改变的变体。该方法包括由含有本发明的核苷酸序列 的双链多核苷酸的模板形成诱变的双链多核苷酸,其中模板双链多核 苷酸被切割为希望大小的双链随机片段,该方法还包括下列步骤:向 得到的双链随机片段群添加一种或多种单链或双链寡核苷酸,其中该 寡核苷酸具有与双链模板多核苷酸的同一性区和异源性区;将得到的 双链随机片段和寡核苷酸的混合物变性为单链片段;将得到的单链片 段群与聚合酶在一定条件下温育,使得该单链片段在同一性区退火, 形成退火片段对,该同一性区对于片段对的一个成员而言足以引起另 一个的复制,由此形成诱变的双链多核苷酸;再重复第二步和第三步 至少两个循环,其中在另一循环第二步中得到的混合物包含从前一循 环第三步得到的诱变双链多核苷酸,而再一循环形成另一种诱变的双 链多核苷酸。在一个优选实施方案中,双链随机片段的一个种在双链 随机片段群体中的浓度低于总DNA重量的1%。在另一个优选实施方 案中,模板双链多核苷酸包含至少约100个种的多核苷酸。在另一个 实施方案中,双链随机片段的大小为约5bp-5kb。在另一个实施方案 中,该方法的第四步包括重复第二步和第三步至少10个循环。

多种转化载体可用于植物转化,并且本发明的基因可与任何这些 载体结合使用。所用载体的选择取决于优选的转化技术和用于转化的 目标物种。对于一定的目标物种,可优选不同的抗生素或除草剂选择 标记。转化中常规应用的选择标记包括:赋予卡那霉素和相关抗生素 抗性的nptⅡ基因(Messing和Vierra,基因(Gene)19:259-268(1982); Benvan等人,自然304:184-187(1983))、赋予除草剂phosphino thricin抗性的bar基因(White等人,核酸研究18:1062(1990), Spencer等人,理论应用遗传学(Theor Appl Genet)79:625-631 (1990))、赋予抗生素潮霉素抗性的hpt基因(Blochinger和 Diggelmann,分子细胞生物学(Mol Cell Biol)4:2929-2931)和赋 予氨甲喋呤抗性的dhfr基因(Bourouis等人,欧洲分子生物学会杂志2 (7):1099-1104(1983))。

多种载体可用于应用根癌农杆菌(Agrobacterium tumefaciens) 的转化。它们一般携带至少一种T-DNA边界序列,并且包括如pbIN19 (Bevan,核酸研究(1984))和pXYZ的载体。以下描述了两种典 型载体的构建。

pCIB200和pCIB2001的构建:二元载体pCIB200和pCIB2001 用于构建农杆菌使用的重组载体,按以下方法构建。通过用NarⅠ消化 pTJS75产生pTJS75kan(Schmidhauser和Helinski,细菌学杂志(J Bacteriol.)164:446-455(1985)),它使得四环素抗性基因被切除, 随后插入一个来源于pUC4K的携带NPTⅡ的AccⅠ片段(Messing和 Vierra,基因19:259-268(1982);Bevan等人,自然304:184-187 (1983);McBride等人,植物分子生物学14:266-276(1990))。 XhoⅠ接头与pCIB7的EcoRⅤ片段连接,此片段包含左和右T-DNA 边界、植物选择性nos/nptⅡ嵌合基因和pUC多接头(Rothstein等人, 基因53:153-161(1987)),将XhoⅠ消化的片段克隆到SalⅠ消化的 pTJS75kan中产生pCIB200(参见EP 0332104,实施例19)。pCIB200 包含下列单一多接头限制位点:EcoRⅠ、SstⅠ、KpnⅠ、BglⅡ、XbaⅠ和 SalⅠ。pCIB2001是pCIB200的衍生物,它是通过向多接头中插入其 他限制位点而产生的。pCIB2001多接头中的单一限制位点是EcoRⅠ、 SstⅠ、KpnⅠ、BglⅡ、XbaⅠ、SalⅠ、MluⅠ、BclⅠ、AvrⅡ、ApaⅠ、HpaⅠ 和StuⅠ。除包含这些单一限制位点外,pCIB2001也有植物和细菌卡 那霉素的选择性、用于农杆菌介导的转化的左和右T-DNA边界、在大 肠杆菌和其他宿主之间转移的RK2衍生的trfA功能以及也是来源于 RK2的OriT和OriV功能。pCIB2001多接头适用于包含其自身调节 信号的植物表达盒的克隆。

pCIB10及其潮霉素筛选衍生物的构建:二元载体pCIB10含有用 于在植物中筛选的编码卡那霉素抗性的基因、T-DNA右和左边界序 列,并且引入了宽宿主范围的质粒pRK252的序列,使其可在大肠杆 菌和农杆菌中复制。Rothstein等人(基因53:153-161(1987))描 述了它的构建。已经构建了pCIB10的多种衍生物,它们引入了Gritz 等人(基因25:179-188(1983))描述的潮霉素B磷酸转移酶基因。 这些衍生物使得能在仅有潮霉素(pCIB743)或同时有潮霉素和卡那 霉素(pCIB715、pCIB717)时筛选转基因植物细胞。

不使用根癌农杆菌的转化避免了对所选的转化载体中T-DNA序列 的需要,所以除如上描述的包含T-DNA序列的载体外,可使用缺乏这 些序列的载体。不依赖于农杆菌的转化技术包括通过粒子轰击、原生 质体摄取(如PEG和电穿孔)和显微注射的转化。载体的选择主要取 决于对所转化的种的优选。下面,描述了某些典型载体的构建。

pCIB3064的构建:pCIB3064是一种pUC衍生载体,适用于与除 草剂basta(或phosphino thricin)筛选结合的直接基因转移技术。质 粒pCIB246包含与大肠杆菌GUS基因有效融合的CaMV 35S启动子 和CaMV 35S转录终止子,在PCT公开的申请WO 93/07278中有描 述。该载体的35S启动子含有两个ATG序列的起始位点5′端。这些 位点用标准PCR技术突变以去除ATG,产生SspⅠ和PvuⅡ限制位点。 新限制位点距唯一的SalⅠ位点96和37bp远,距实际起始位点101和 42bp远。产生的pCIB246的衍生物命名为pCIB3025。然后通过用SalⅠ 和SacⅠ消化从pCIB3025上切下GUS基因,末端变为平端且再连接 产生质粒pCIB3060。质粒pJIT82从John Innes Centre,Norwich获 得,切下含有产绿色链霉菌(Streptomyces viridochromogenes)bar 基因的400bp SmaⅠ片段,将其插入pCIB3060的HpaⅠ位点(Thompson 等人,欧洲分子生物学会杂志6:2519-2523(1987))。这产生了 pCIB3060,它含有位于CaMV 35S启动子和用于除草剂筛选的终止子 控制下的bar基因、氨苄青霉素抗性基因(用于在大肠杆菌中筛选) 和具有单一SphⅠ、PstⅠ、HindⅢ、BamHⅠ位点的多接头。该载体适 用于含有自身调节信号的植物表达盒的克隆。

pSOG19和pSOG35的构建:pSOG35是一种应用大肠杆菌基因 二氢叶酸还原酶(DHFR)作为选择性标记提供氨甲喋呤抗性的转化 载体。用PCR扩增35S启动子(~800bp)、玉米Adh1基因的内含子 6(~550bp)和pSOG10的18bp GUS非翻译前导序列。编码大肠杆 菌二氢叶酸还原酶Ⅱ型基因的250bp片段也用PCR扩增,这两个PCR 片段与包含pUC19载体骨架和胭脂氨酸合酶终止子的pBI221 (Clontech)的SacⅠ-PstⅠ片段装配。这些片段的装配产生pSOG19, 它含有与内含子6序列融合的35S启动子、GUS前导序列、DHFR基 因和胭脂氨酸合酶终止子。用玉米萎黄病斑点病毒(MCMV)的前导 序列替换pSOG19的GUS前导序列产生载体pSOG35。pSOG19和 pSOG35携带氨苄青霉素抗性的pUC基因,并且具有可用于外源序列 克隆的HindⅢ、SphⅠ、PstⅠ和EcoRⅠ位点。

首先将准备在转基因植物中表达的基因序列装配于位于适当启动 子之后和适当转录终止子上游的表达盒中。然后可将这些表达盒容易 地转移至上述植物转化载体中。

在表达盒中使用的启动子的选择将决定转基因在转基因植物中的 空间和时间表达模式。所选的启动子将在特定的细胞型(如叶表皮细 胞、叶肉细胞、根皮细胞)或在特定组织或器官(如根、叶或花)中 表达转基因,此选择将反映酶生物合成的希望的定位。另外,所选的 启动子可在光诱导的或其他时间调节启动子之下引导基因的表达。另 一种(并优选的)选择是,所选的启动子可被外部刺激如特异化学诱 导物的施用或创伤诱导。这将提供仅当希望时才诱导海藻糖生物合成 基因转录的可能性。

多种转录终止子均可在表达盒中使用。它们负责转基因之外的转 录终止和其正确的聚腺苷酸化。合适的和已知在植物中起作用的转录 终止子包括CaMV 35S终止子、tml终止子、胭脂氨酸合酶终止子、 豌豆rbcS E9终止子。它们可在单子叶植物和双子叶植物中使用。

已发现许多序列能增强转录单位内的基因表达,这些序列可与本 发明的基因结合使用以增强其在转基因植物中的表达。

多种内含子序列显示能增强表达,尤其在单子叶植物细胞中的表 达。例如,发现当引入玉米细胞时,玉米Adh1基因的内含子显著增 强位于同源启动子之下的野生型基因的表达。发现内含子1特别有效, 且增强在与氯霉素乙酰转移酶基因的融合构建体中的表达(Callis等 人,基因发育(Genes Develep)1:1183-1200(1987))。在相同 的实验系统中,玉米青铜1基因的内含子在增强表达方面具有相似的 效果。内含子序列已被常规引入植物转化载体中,一般在非翻译前导 序列中。

已知多种由病毒衍生的非翻译前导序列也可增强表达,且其在双 子叶植物细胞中特别有效。特别是,烟草花叶病毒(TMV,“Ω-序列”)、 玉米萎黄病斑点病毒(MCMV)和苜蓿花叶病毒(AMV)的前导序 列在增强表达方面已证明有效(如Gallie等人,核酸研究15:8693-8711 (1987);Skuzeski等人,植物分子生物学15:65-79(1990))。

已知植物中存在导向基因产物的多种机制,也已比较详细地表征 了控制这些机制作用的序列。例如,基因产物向叶绿体的导向由在多 种蛋白质氨基末端发现的信号序列控制,该信号序列在叶绿体输入期 间被切除产生成熟蛋白质(如,Comai等人,生物化学杂志263: 15104-15109(1988))。这些信号序列可与异源基因产物融合,实现 异源产物向叶绿体中的输入(van den Broeck等人,自然313:358-363 (1985))。可从编码RUBISCO蛋白、CAB蛋白、EPSP合酶、GS2 蛋白和已知定位于叶绿体的许多其他蛋白质的cDNA的5′末端分离编 码适当信号序列的DNA。

其他基因产物定位于其他细胞器如线粒体和过氧化物酶体(如 Unger等人,植物分子生物学13:411-418(1989))。也可使用编 码这些产物的cDNA完成异源基因产物向这些细胞器的导向。这些序 列的实例包括核编码的ATP酶和线粒体特异的天冬氨酸氨基转移酶同 工酶。Rogers等人(美国国家科学院院报82:6512-6516(1985)) 描述了对细胞蛋白质体的导向。

另外,已经表征了使基因产物导向于其他细胞区室的序列。氨基 端序列负责向内质网、质外体的导向和从糊粉细胞的胞外分泌(Koehler 和Ho,植物细胞2:769-783(1990))。另外,氨基端序列联合羧 基端序列负责基因产物的液泡导向(Shinshi等人,植物分子生物学 14:357-368(1990))。

通过将上述适当导向序列与目的转基因序列融合,可以将转基因 产物引导至任一细胞器或细胞区室中。例如,为了叶绿体导向, RUBISCO基因、CAB基因、EPSP合酶基因或GS2基因的叶绿体信 号序列与转基因的氨基端ATG在框架内融合。所选的信号序列应该包 含已知的切割位点,构建的融合体应考虑切割所需的切割位点之后的 任何氨基酸。在某些情况中,可通过在切割位点与转基因ATG之间添 加少量氨基酸,或替换转基因序列内的某些氨基酸来满足这一需要。 使用(Bartlett等人,在:Edelmann等人(编)《叶绿体分子生物学 之方法》,Elsevier.第1081-1091页(1982);Wasmann等人,分 子普通遗传学205:446-453(1986))描述的技术,通过体外转录结 构的体外翻译,随后是体外叶绿体摄取,能测试为叶绿体输入而构建 的融合体的叶绿体摄取的效能。这些构建技术在本领域众所周知,并 且同样可用于线粒体和过氧化物酶体。海藻糖生物合成基因所需的导 向选择将取决于作为给定途径的起点所需的前体的细胞定位。这通常 是胞质的或叶绿体的,尽管某些情况中可能是线粒体的或过氧化物酶 体的。

上述细胞导向机制不仅可与其同源启动子结合使用,而且可与异 源启动子结合使用,从而实现在启动子转录调节下的特定细胞导向目 的,该启动子具有与衍生导向信号的启动子不同的表达模式。

本发明包括海藻糖生物合成基因在植物中可表达的任一启动子调 节下的表达,而不论启动子的来源如何。

此外,本发明还包括任一植物可表达的启动子与海藻糖生物合成 基因表达所需或选择的任何其他序列的结合使用。这些序列包括但不 限于:转录终止子、增强表达的外部序列(如内含子[如Adh内含子1]、 病毒序列[如TMV-Ω])、以及旨在将基因产物导向于特定细胞器和细 胞区室的序列。

合适的植物可表达的启动子是那些组成型表达的启动子,如CaMV 35S启动子、肌动蛋白启动子或遍在蛋白启动子。

含有“双”35S启动子的质粒pCGN1761的构建在公开的专利申 请EP 0392225(实施例23)中有述。pCGN1761含有“双”35S启 动子和tml转录终止子和在启动子与终止子之间的唯一EcoRⅠ位点, 并且具有pUC型骨架。构建了pCGN1761的一种衍生物,其具有一 个除了已有的EcoRⅠ位点之外还包含NotⅠ和XhoⅠ位点的修饰过的多 接头。该衍生物被命名为pCGN1761ENX。pCGN1761ENX可用于其 多接头内cDNA序列或基因序列(包括微生物开放阅读框序列)的克 隆,其目的是在35S启动子控制下在转基因植物中表达。该结构的完 整的35S启动子-基因序列-tml终止子盒可被从启动子5’侧的HindⅢ、 SphⅠ、SalⅠ和XbaⅠ位点以及终止子3’侧的XbaⅠ、BamHⅠ和BglⅠ位 点切割,用于如上所述向转化载体中的转移。此外,通过用HindⅢ、 SphⅠ、SalⅠ、XbaⅠ或PstⅠ进行5′切割,及用任何多接头限制位点 (EcoRⅠ、NotⅠ或XhoⅠ)进行3′切割以替换为另一启动子,能去除双 35S启动子片段。

对于本部分所述的任何结构,可通过引入能增强翻译的序列进行 克隆位点周围的修饰。当将来源于微生物的基因引入植物表达盒时这 种修饰特别有用,因为这些基因可能不包含适于植物中翻译起始的与 起始甲硫氨酸相邻的序列。在将来源于微生物的基因克隆到植物表达 盒的ATG处的情况中,可能需要修饰其插入位点以优化表达。通过优 化翻译起始位点对pCGN1761ENX的修饰以实施例的形式描述,引入 用于植物表达的几种优化序列之一(如Joshi,出处同前)。在本发明 范围内能适当使用的其他植物可表达启动子是如下文所述的化学调节 型启动子。例如,本部分描述了用所选的任一启动子对pCGN1761ENX 中双35S启动子的替换;化学调节型PR-1a启动子以实施例的形式在 美国专利5,614,395中描述,在此完全引用作为参考,以及化学调节型 拟南芥PR-1启动子。选择的启动子优选地用限制酶从其来源切下,但 另外也可用携带适当末端限制位点的引物进行PCR扩增。如果进行 PCR扩增,在靶载体中克隆扩增的启动子之后,应该对启动子重新测 序以检查扩增错误。从质粒pCIB1004(见EP 0332104,实施例21, 构建)上切下化学调节型烟草PR-1a启动子,转移至质粒 pCGN1761ENX中。用NcoⅠ酶切pCIB1004,产生的线性片段的3′突 出端通过T4 DNA聚合酶处理提供平端。然后用HindⅢ酶切该片段, 凝胶纯化所得的包含PR-1a启动子的片段,并克隆到已去除双35S启 动子的pCGN1761ENX中。实现方法是用XhoⅠ酶切,用T4 DNA聚 合酶产生平端,随后用HindⅢ酶切,分离较大的含有载体终止子的 片段,其中克隆有pCIB1004启动子片段。这产生了一种 pCGN1761ENX衍生物,它具有PR-1a启动子和tml终止子和具有唯 一EcoRⅠ和NotⅠ位点的间隔多接头。可将选择的海藻糖生物合成基 因插入该载体中,随后可将融合产物(即启动子-基因-终止子)转移到 选择的任一转化载体中,包括本申请中所述的转化载体。

可使用多种化学调节剂来诱导海藻糖生物合成编码序列在根据本 发明转化的植物中的表达。在本公开内容的上下文中,“化学调节剂” 包括已知在植物中是PR-1a启动子的诱导物的化学试剂,或其相关的 衍生物。用于本发明的化学可诱导海藻糖生物合成基因的一组优选调 节剂基于苯并-1,2,3-噻二唑(BTH)结构,包括但不限于下列类型的 化合物:苯并-1,2,3-噻二唑羧酸、苯并-1,2,3-噻二唑硫代羧酸、氰基苯 并-1,2,3-噻二唑、苯并-1,2,3-噻二唑羧酸胺、苯并-1,2,3-噻二唑羧酸酰 肼、苯并-1,2,3-噻二唑-7-羧酸、苯并-1,2,3-噻二唑-7-硫代羧酸、7-氰 基-苯并-1,2,3-噻二唑、苯并-1,2,3-噻二唑-7-羧酸胺、苯并-1,2,3-噻二 唑-7-羧酸酰肼、苯并-1,2,3-噻二唑羧酸烷基酯,其中烷基含有一至六 个碳原子、苯并-1,2,3-噻二唑-7-羧酸甲酯、苯并-1,2,3-噻二唑-7-羧酸 正丙基酯、苯并-1,2,3-噻二唑-7-羧酸苄酯、苯并-1,2,3-噻二唑-7-羧酸 仲丁基酰肼,及其合适的衍生物。其他化学诱导物包括,例如,苯甲 酸、水杨酸(SA)、聚丙烯酸及其取代的衍生物;合适的取代物包括 低级烷基、低级烷氧基、低级硫代烷基和卤素。用于本发明的化学可 诱导DNA序列的另一组调节剂基于吡啶羧酸结构,如异烟酸结构,优 选地是卤代异烟酸结构。优选的是二氯异烟酸及其衍生物,如低级烷 基酯。该类化合物的合适的调节剂是,例如,2,6-二氯异烟酸(INA) 及其低级烷基酯,尤其是甲酯。

用肌动蛋白启动子也能实现组成型表达。已知肌动蛋白的几个同 种型能在大多数细胞型中表达,因此肌动蛋白启动子是组成型启动子 的良好选择。尤其是,已经克隆和表征了水稻ActⅠ基因的启动子 (McElroy等人,植物细胞2:163-171(1990))。发现该启动子的 1.3kb片段包含在水稻原生质体中表达所需的所有调节元件。此外,已 经构建了基于Actl启动子的特别用于单子叶植物的许多表达载体 (McElroy等人,分子普通遗传学231:150-160(1991))。它们掺 入了Actl-内含子1、Adhl 5′侧翼序列和(玉米醇脱氢酶基因的)Adhl- 内含子1和CaMV 35S启动子的序列。显示最高表达的载体是35S和 Actl内含子或Actl 5′侧翼序列和Actl内含子的融合体。(GUS报道 基因的)起始ATG附近序列的优化也能增强表达。McElroy等人(分 子普通遗传学231:150-160(1991))描述的启动子表达盒可被方便 地修饰以用于海藻糖生物合成基因的表达,尤其适用于单子叶植物宿 主中。例如,可从McElroy结构中去除包含启动子的片段,用来替换 pCGN1761ENX中的双35S启动子,然后可用于特异基因序列的插入。 然后可将这样构建的融合基因转移到合适的转化载体中。在个别报道 中,也发现含有第一个内含子的水稻Actl启动子引导在培养的大麦细 胞中的高表达(Chibbar等人,植物细胞报道(Plant Cell Rep.)12: 506-509(1993))。

遍在蛋白是已知在许多细胞型中积累的另一种基因产物,已从几 个种中克隆了它的启动子,在转基因植物中用于组成型表达(如向日 葵-Binet等人,植物科学79:87-94(1991),玉米-Christensen等人, 植物分子生物学12:619-632(1989))。玉米遍在蛋白启动子已在 转基因单子叶系统中加以研究,并且其序列和为单子叶植物转化构建 的载体公开于专利公开文本EP 0342926(Lubrizol)中。此外,Taylor 等人(植物细胞报道12:491-495(1993))描述了一种载体(pAHC25), 它包含玉米遍在蛋白启动子和第一个内含子,经微粒轰击引入时其在 许多单子叶植物细胞悬液中有高活性。遍在蛋白启动子适用于海藻糖 生物合成基因在转基因植物尤其单子叶植物中的表达。合适的载体是 pAHC25的衍生物或本申请中描述的通过引入合适的遍在蛋白启动子 和/或内含子序列被修饰的任何转化载体。

本发明的酶的另一种表达模式是根表达。一种合适的根启动子是de Framond(FEBS 290:103-106(1991))描述、也在公开的专利申 请EP 0452269(Ciba-Geigy)中描述的启动子。该启动子被转移到 合适的载体如pCGN1761ENX中,用于插入海藻糖生物合成基因及随 后将完整的启动子-基因-终止子盒转移到目的转化载体中。

创伤诱导型启动子也适用于海藻糖生物合成基因的表达。已经描 述了许多这样的启动子(例如,Xu等人,植物分子生物学22:573-588 (1993),Logemann等人,植物细胞1:151-158(1989),Rohrmeier 和Lehle,植物分子生物学22:783-792(1993),Firek等人,植物 分子生物学22:129-142(1993),Warner等人,植物杂志3:191- 201(1993)),并且均都适用于本发明。Logemann等人描述了双子 叶马铃薯Wunl基因的5′上游序列。Xu等人证明双子叶植物马铃薯的 创伤诱导型启动子(pin2)在单子叶植物水稻中有活性。此外,Rohrmeier 和Lehle也描述了为创伤诱导型且可用于使用标准技术分离同源启动 子的玉米Wipl cDNA的克隆。相似地,Firek等人和Warner等人描 述了单子叶植物药用芦笋(Asparagus officinalis)的创伤诱导型基因, 该基因在局部创伤和病原体侵入部位表达。使用本领域众所周知的克 隆技术,可将这些启动子转移到合适的载体中,与本发明的海藻糖生 物合成基因融合,并用来在植物创伤部位表达这些基因。

专利申请WO 93/07278(Ciba-Geigy)描述了玉米trpA基因的分 离,该基因优先在木髓细胞中表达。介绍了该基因序列和从转录起点 延伸至-1726的启动子。应用标准分子生物学技术,可将此启动子或其 部分转移到载体如pCGN1761中,能替换35S启动子,并用来以木髓 偏好的方式引导外源基因的表达。实际上,含有木髓偏好的启动子或 其部分的片段可被转移到任何载体中并为应用于转基因植物而修饰。

Hudspeth和Grula(植物分子生物学12:579-589(1989))曾 描述了一种编码磷酸烯醇羧化酶(PEPC)的玉米基因。应用标准分子 生物学技术,该基因的启动子能用来引导任一基因以叶特异的方式在 转基因植物中表达。

Chen和Jagendorf(生物化学杂志268:2363-2367(1993))曾 描述了用叶绿体转运肽来输入异源转基因的成功应用。所使用的肽是 Nicotiana plumbaginifolia的rbcS基因的转运肽(Poulsen等人,分 子普通遗传学205:193-200(1986))。使用限制酶DraⅠ和SphⅠ, 或Tsp509Ⅰ和SphⅠ,能从质粒prbcS-8B上切下编码该转运肽的DNA 序列,操作后与上述任何结构一起使用。DraⅠ-SphⅠ片段从相对于起 始rbcS ATG的-58延伸至,并且包括,紧接输入切割位点之后的成熟 肽的第一个氨基酸(也是甲硫氨酸),而Tsp509Ⅰ-SphⅠ片段从相对于 起始rbcS ATG的-8延伸至,并且包括,成熟肽的第一个氨基酸。因 此,可将这些片段适当地插入所选的任一表达盒的多接头中,产生与 所选启动子(如35S、PR-1a、肌动蛋白、遍在蛋白等)的非翻译前导 序列融合的转录融合基因,而能使海藻糖生物合成基因插入转运肽下 游的正确的融合基因中。这种构建在本领域中是常规的。例如,DraⅠ 末端本来就是平端,而5′Tsp509Ⅰ位点可经T4聚合酶处理产生平端, 或者另外可与接头或衔接头序列连接,以便于它与所选择的启动子融 合。可照此保留3′SphⅠ位点,或者另外可与接头序列的衔接头连接, 以便于它插入所选择的载体,这样使可得的合适的限制位点可用于随 后所选的海藻糖生物合成基因的插入。理想的是保留SphⅠ位点的 ATG,并包含所选的海藻糖生物合成基因的第一个ATG。Chen和 Jagendorf提供了用于叶绿体输入的理想切割的共有序列,在所有情况 中甲硫氨酸优选地位于成熟蛋白质的第一个位点。在随后的位点上有 更多的变化,并且氨基酸可能不如此关键。在任何情况中,可用Bartlett 等人(在:Edelmann等人(编)《叶绿体分子生物学方法》,Elsevier, 1081-1091页(1982))和Wasmann等人(分子普通遗传学205:446-453 (1986))所述的方法,评估融合构建体的体外输入效率。一般而言, 最好的方法可能是用在氨基端未修饰的所选海藻糖生物合成基因产生 融合基因,并仅当融合基因显然不以高效率输入叶绿体时才引入修饰, 在这种情况中可根据已有的文献(Chen和Jagendorf;Wasmann等 人;Ko和Ko,生物化学杂志267:13910-13916(1992))进行修饰。

通过将prbcS-8B的DraⅠ-SphⅠ转运肽编码片段转移至克隆载体 pCGN1761ENX/Sph-中构建一种优选的载体。该质粒用EcoRⅠ酶切, 经T4 DNA聚合酶处理使末端变为平端。用SphⅠ酶切质粒prbc-8B, 连接至退火的分子衔接头。通过T4激酶处理使所得产物5′端磷酸化。 随后用DraⅠ酶切,释放连接于上述修饰载体的平端前EcoRⅠ位点的 转运肽编码片段。通过测序鉴定带有方向为插入片段5′端的与35S启 动子3′端相邻的克隆。这些克隆携带35S前导序列与rbcS-8A启动子- 转运肽序列的DNA融合基因,其从相对于rbcS ATG的-58延伸至成 熟蛋白质的ATG,并且在此位点包含唯一的SphⅠ位点、一个新产生 的EcoRⅠ位点和已有的pCGN1761ENX的NotⅠ和XhoⅠ位点。这个 新载体被命名为pCGN1761/CT。为了方便构建,可能需要改变克隆 基因的第二个氨基酸,然而在几乎所有情况中,与标准定点诱变一起 使用PCR,能构建在成熟蛋白质的酶切位点和第一个甲硫氨酸附近的 任一希望的序列。

另一种优选载体的构建方法是,用prbcS-8A的BamHⅠ-SphⅠ片段 替换pCGN1761ENX的双35S启动子,前者包含全长的光调节rbcS-8A 启动子,它从-1038(相对于转录开始位点)直到成熟蛋白质的第一个 甲硫氨酸。用PstⅠ和EcoRⅠ酶切带有破坏的SphⅠ位点的经修饰的 pCGN1761,并用T4 DNA聚合酶处理产生平端。用SphⅠ酶切 prbcS-8A,连接于上述序列的退火的分子衔接头上。所得产物经T4 激酶处理使5′-端磷酸化。随后用BamHⅠ酶切释放启动子-转运肽,它 包含经T4 DNA聚合酶处理产生BamHⅠ平端的片段。将如此产生的 启动子-转运肽片段克隆到制备的pCGN1761ENX载体中,产生一种 包含rbcS-8A启动子和转运肽并在用来插入异源基因的切割位点处有 一个SphⅠ位点的结构。此外,SphⅠ位点下游有EcoRⅠ(重新产生的)、 NotⅠ和XhoⅠ克隆位点。这个结构被命名为pCGN1761rbcS/CT。

可以应用其他来源(单子叶和双子叶的)和其他基因的其他GS2 叶绿体转运肽编码序列进行相似的操作。另外,可按相似的方法来完 成向其他亚细胞区室如线粒体的导向。

对双子叶植物的转化技术在本领域中众所周知,包括基于农杆菌 的技术和不需要农杆菌的技术。非农杆菌的技术包括原生质体或细胞 对外源遗传物质的直接摄取。这可通过PEG或电穿孔介导的摄取、粒 子轰击介导的运输或显微注射来完成。这些技术的实例描述于 Paszkowski等人,欧洲分子生物学会杂志3:2717-2722(1984), Potrykus等人,分子普通遗传学199:169-177(1985),Reich等人, 生物技术4:1001-1004(1986),和Klein等人,自然327:70-73 (1987)。在每种情况中,用本领域公知的标准技术使转化的细胞再 生为整个植物。

由于其高转化效率和对许多不同种的广泛应用,农杆菌介导的转 化是用于转化双子叶植物的优选技术。用农杆菌常规转化的许多作物 种包括:烟草、蕃茄、向日葵、棉花、油籽油菜、马铃薯、大豆、苜 蓿和白杨(EP 0317511(棉花[1313]),EP 0249432(蕃茄,Calgene), WO 87/07299(芸苔属,Calgene),US 4,795,855(白杨))。农杆 菌转化一般包括将携带目的外源DNA的二元载体(如pCIB200或 pCIB2001)转移至合适的农杆菌菌株中,这依赖于在共生Ti质粒上 或染色体上由宿主农杆菌菌株携带的vir基因的完整性(如对于 pCIB200和pCIB2001的CIB542株(Uknes等人,植物细胞5:159-169 (1993))。重组二元载体向农杆菌的转移通过三亲本交配方法完成, 使用携带重组二元载体的大肠杆菌、携带质粒如pRK2013并能将重组 二元载体转移至目标农杆菌株的辅助大肠杆菌菌株。另外,可通过DNA 转化将重组二元载体转移到农杆菌中(Hofgen和Willmitzer,核酸研 究16:9877(1988))。

用重组农杆菌对目标植物种的转化通常包括农杆菌与植物外植体 的共培育,且依照本领域众所周知的方案。转化的组织在带有在二元 质粒T-DNA边界之间存在的抗生素或除草剂抗性标记的选择培养基上 再生。

大多数单子叶植物种的转化现也已成为常规。优选的技术包括使 用PEG或电穿孔技术直接将基因转移到原生质体中,以及使用粒子轰 击转移到愈伤组织中。可用单种DNA或多种DNA(即共转化)进行 转化,这两种方法都适用于本发明。共转化的优点在于避免了复杂的 载体构建,以及产生具有目的基因和选择性标记的非连基因座的转 基因植物,如果希望的话,能使选择性标记在后代中去除。然而,使 用共转化的一个缺点是个别DNA种整合入基因组中的频率低于100% (Schocher等人,生物技术4:1093-1096(1986))。

专利申请EP 0292435(Ciba-Geigy)、EP 0392225(Ciba Geigy) 和WO 93/07278(Ciba-Geigy)描述了从玉米的一个优良近交系制备 愈伤组织和原生质体、用PEG或电穿孔法转化原生质体、以及从转化 的原生质体再生玉米植物的技术。Gordon-Kamm等人(植物细胞2: 603-618(1990))和Fromm等人(生物技术8:833-839(1990)) 发表了使用粒子轰击转化A188-衍生的玉米株系的技术。此外,申请 WO 93/07278(Ciba-Geigy)和Koziel等人(生物技术11:194-200 (1993))描述了经粒子轰击转化玉米的优良近交系的技术。该技术 使用传粉后14-15天从玉米穗上切下的1.5-2.5mm长的未成熟玉米胚 和PDS-1000He Biolistics装置用于轰击。

水稻的转化也可使用应用原生质体或粒子轰击的直接基因转移技 术来进行。对于Japonica型和Indica型的原生质体介导的转化已有描 述(Zhang等人,植物细胞报道7:379-384(1988);Shimamoto 等人,自然338:274-277(1989);Datta等人,生物技术8:736-740 (1990))。使用粒子轰击均可常规转化这两种类型(Christou等人, 生物技术9:957-962(1991))。

专利申请EP 0 332 581(Ciba-Geigy)描述了Pooideae原生质体 的产生、转化和再生的技术。这些技术允许鸭茅属(Dactylis)和小麦 的转化。此外,Vasil等人(生物技术10:667-674(1992))描述了 应用粒子轰击转入C型长期可再生愈伤组织细胞的小麦转化,Vasil等 人(生物技术11:1553-1558(1993))和Weeks等人(植物生理(Plant Physiol.)102:1077-1084(1993))也描述了应用粒子轰击未成熟胚 和未成熟胚衍生的愈伤组织的小麦转化。然而,一种优选的小麦转化 技术包括通过粒子轰击未成熟胚转化小麦,并包括基因输运前的高蔗 糖或高麦芽糖步骤。轰击前,将任意数量的胚(长0.75-1mm)置于含 3%蔗糖(Murashiga和Skoog,Physiologia Plantarum 15:473-497 (1962))和3mg/l 2,4-D的MS培养基上,用于可在暗处进行的体细 胞胚的诱导。在选定的轰击日,从诱导培养基中取出胚,将其置于渗 压剂上(即含有希望浓度一般是15%的蔗糖或麦芽糖的诱导培养基)。 将胚质壁分离2-3小时,然后轰击。一般是每个靶平板二十个胚,但 这不是必需的。按标准方法在微米大小的金颗粒上沉淀合适的携带基 因的质粒(如pCIB3064或pSG35)。每个胚平板用DuPont Biolistics 氦装置轰击,使用约1000psi的爆发压力,使用标准的80目的筛子。 轰击后,将胚放回暗处回复约24小时(仍在渗压剂上)。24小时后, 从渗压剂中取出胚,将其放回诱导培养基上,在再生之前放置约一个 月。大约一个月后,将具有发育的胚发生愈伤组织的胚外植体转移到 再生培养基中(MS+1mg/l NAA,5mg/l GA),该培养基另外含有适 当的选择剂(在pCIB3064的情况中是10mg/l basta,在pSOG35的 情况中是2mg/l氨甲喋呤)。约一个月后,将发育的苗转移至更大的 被称为“GA7s”的无菌容器中,其中含有半强度的MS、2%蔗糖和相 同浓度的选择剂。EP专利申请0 674 715描述了小麦转化的方法,在 此引用作为参考。

描述了来源于玉米的三种核苷酸序列(实施例32)。当用BLAST 检索(BLASTN 2.0.7[1998年12月21日],Altschul等人(1997)核 酸研究25:3389-3402)比较时,这些核苷酸序列显示与其他海藻糖 磷酸合酶在DNA和蛋白质水平上有高匹配得分和显著同源性。

用作筛查玉米c-DNA文库的探针的片段Be3,与酵母海藻糖磷酸 合酶(TPS1,保藏号Q00764)在氨基酸水平上在基519-1之间显 示例如60%的同一性,在碱基831-463之间显示58%的同一性,两者 都与酵母基因方向相反。Be3与拟南芥海藻糖磷酸合酶(保藏号 Y08568)在氨基酸水平上在碱基471-1之间也显示89%的同一性,在 碱基830-462之间显示84%的同一性,两者都与拟南芥基因方向相反。

克隆4.11与Be3在克隆4.11的碱基4-129(Be3的碱基706-831) 之间在核苷酸水平上几乎相同(4个错配)。克隆6与Be3在克隆6 的碱基4-218(Be3的碱基10-224)之间在核苷酸水平上几乎相同(9 个错配),方向与Be3相反。克隆9与Be3在克隆9的碱基4-95(Be3 的碱基447-568)之间在核苷酸水平上几乎相同(1个错配)。

克隆4.11长1686bp,包含预测的1413个碱基对的部分编码序列。 克隆6长1558bp,包含预测的1092bp的全长编码序列。克隆9长 735bp,包含预测的735bp的部分编码序列。

克隆4.11和克隆6在位点448-1600(克隆4.11)和300-1439(克 隆6)之间在核苷酸水平上几乎相同。

克隆4.11与酵母TPS1有例如55%的氨基酸同一性(碱基4-279), 与大肠杆菌OtsA有44%的同一性(碱基4-282),与拟南芥海藻糖磷 酸合酶有76%的氨基酸同一性(碱基4-1047)和59%的氨基酸同一性 (碱基1240-1371)。克隆6与曲霉属海藻糖磷酸合酶有例如63%的 氨基酸同一性(碱基3-311,相反方向),与酵母TPS1有46%的氨 基酸同一性(碱基293-3,相反方向),与拟南芥海藻糖磷酸合酶有67% 的氨基酸同一性(碱基300-998)和86%的氨基酸同一性(碱基3-302, 相反方向)。克隆9与酵母TPS1基因有61%的氨基酸同一性(碱基 4-96),与拟南芥海藻糖磷酸合酶有80%的氨基酸同一性(碱基4-96)。

将参照下列详细实施例进一步描述本发明。这些实施例的目的仅 仅是为了说明,除非另外指明而不意在限制。

实施例

A.海藻糖-6-磷酸合酶和海藻糖-6-磷酸磷酸酶基因在植物胞质溶 胶中的表达 实施例1:包含与烟草PR-1a启动子融合的大肠杆菌海藻糖-6-磷酸合 酶基因的嵌合基因的制备

质粒pCGN4467(获自Calgene,Davis,CA)含有受双35S启动 子控制并与tml 3’聚腺苷酸化信号融合的大肠杆菌海藻糖-6-磷酸合酶 基因编码序列(OtsA,Kaasen等人(1994)基因145(1),9-15, EMBL/GenBank保藏号X69160)(pCGN4467是pCGN1761的一种 衍生物,EP 0392225),用其作为PCR模板,使用一条由左至右的“顶 链(topstrand)”引物,其包含之前为GCC密码子、之后为新添加 的GCA密码子的ATG,从而在ATG处产生一个NcoⅠ位点,并且包 含OstA基因的前24个碱基(引物TREA+:GTC AGC CAT GGC AAG TCG TTT AGT CGT AGT ATC TAA C,SEQ ID No:1),并使用 一条与新ATG下游位点392-416同源的由右至左的“底链 (bottomstrand)”引物(引物TREA-:GCA AAT GGC AAC AGG TGA TAA TCG,SEQ ID No:2)。按厂商推荐用AmpliTaq DNA 聚合酶进行该PCR反应(Perkin Elmer/Roche,Branchburg,NJ), 94℃(30s)、40℃(60s)和72℃(30s)五个循环,随后94℃(30s), 55℃(60s)和72℃(30s)25个循环,这产生一种423bp的产物,它 在左端包含一个NcoⅠ位点,在右端包含一个BamHⅠ位点。用标准方 法凝胶纯化该片段,用NcoⅠ和BamHⅠ酶切(所有限制酶均购自 Promega,Madison,WI),并连接于pUC21的NcoⅠ和BamHⅠ位 点,获得pUCOTSA,pUC21是一种pUC衍生物,含有具有下列限 制位点的多接头:SpeⅠ/StuⅠ/XhoⅠ/BglⅡ/ClaⅠ/NsiⅠ/SphⅠ/NcoⅠ/KpnⅠ/ XmaⅠ/SmaⅠ/SacⅠ/EcoRⅠ/BstlBⅠ/HindⅢ/PstⅠ/MluⅠ/SalⅠ/AatⅡ/NdeⅠ/Ba mHⅠ/EcoRⅤ/NotⅠ/EagⅠ/XbaⅠ/SpeⅠ。

然后用SpeⅠ和BamHⅠ消化质粒pUCOTSA,凝胶纯化含有OtsA 基因5′端的400bp片段,并与事先用XbaⅠ和BamHⅠ消化的pCGN4467 连接,获得含有完整OtsA基因的pCGNOTSA。用NcoⅠ和SacⅠ消化 质粒pCGNOTSA,凝胶纯化包含OtsA基因的1.4kb长片段,并连接 于pJG203的在903bp长之烟草PR-1a启动子和nos基因终止信号之 间的NcoⅠ和SacⅠ位点(Uknes等人(1993),植物细胞5,159-169)。 质粒pJG203是pBSGus1.2的一种衍生物(Uknes等人(1993),植 物细胞5,159-169),包含与GUS基因融合的烟草PR-1a启动子和 nos聚腺苷酸化信号。在pJG203中,通过用SacⅠ部分消化、补平突 出端并再连接,去除在nos聚腺苷酸化信号末端处的第二个SacⅠ位点。 从而获得含有与烟草PR-1a启动子融合的OtsA基因的质粒 pPR1OTSA。 实施例2:包含与烟草PR-1a启动子融合的大肠杆菌海藻糖-6-磷酸磷 酸酶基因的嵌合基因的制备

质粒pCGN4452(获自Calgene,Davis,CA)含有受双35S启动 子控制并与tml 3’聚腺苷酸化信号融合的大肠杆菌海藻糖-6-磷酸磷酸 酶基因编码序列(OtsB,Kaasen等人(1994)基因145(1),9-15, EMBL/GenBank保藏号X69160)(pCGN4452是pCGN1761的一种 衍生物,EP 0392225),用其作为PCR模板,使用一条由左至右的“顶 链”引物,其在原始GTG起始密码子之前含有一个新产生的ATG密 码子,之前为GCC密码子,从而在ATG处产生一个NcoⅠ位点,并 且包含OstA基因的前23个碱基(引物TREB+:GTC AGC CAT GGT GAC AGA ACC GTT AAC CGA AAC,SEQ ID No:3),并使用一 条与新ATG下游位点181-205同源的由右至左的“底链”引物(引物 TREB-:GTG CGT CAA GCT CCA CCA TTG AGC,SEQ ID No: 4)。按厂商推荐用AmpliTaq DNA聚合酶进行该PCR反应(Perkdn Elmer/Roche,Branchburg,NJ),94℃(30s)、40℃(60s)和72 ℃(30s)五个循环,随后94℃(30s),55℃(60s)和72℃(30s) 25个循环,这产生一种212bp的产物,它在左端包含一个NcoⅠ位点, 在右端包含一个EcoRⅤ位点。用标准方法凝胶纯化该片段,用NcoⅠ 和EcoRⅤ酶切,并连接于pUC21的NcoⅠ和EcoRⅤ位点,获得 pUCOTSB。

然后用SpeⅠ和EcoRⅤ消化质粒pUCOTSB,凝胶纯化含有OtsB 基因5′端的210bp片段,并与事先用XbaⅠ和EcoRⅤ消化的pCGN4467 连接,获得含有完整OtsB基因的pCGNOTSB。用NcoⅠ和SacⅠ消化 质粒pCGNOTSB,凝胶纯化包含OtsB基因的0.8kb长片段,并连接 于pJG203的在903bp长之烟草PR-1a启动子和nos基因终止信号之 间的NcoⅠ和SacⅠ位点,产生含有与烟草PR-1a启动子融合的OtsB 基因的pPR1OTSB。 实施例3:包含与烟草PR-1a启动子融合的OtsA基因和与烟草PR-1a 启动子融合的OtsB基因的二元载体的制备

用XhoⅠ消化质粒pPR1OTSA,其突出端用Klenow DNA聚合酶 (Promega,Madison,WI)补平,然后再用SpeⅠ消化。凝胶纯化得到 的2.6kb长片段,连接于pPR1OTSB的补平的EcoRⅠ位点和SpeⅠ位 点,获得pPR1OTSAB,其含有与烟草PR-1a启动子融合的OtsA基 因和与烟草PR-1a启动子融合的OtsB基因。

用ApaⅠ和XbaⅠ消化质粒pPR1OTSAB,凝胶纯化含有与烟草 PR-1a启动子融合的OtsA基因和与烟草PR-1a启动子融合的OtsB基 因的4.6kb长片段,并连接于pBHYGM的ApaⅠ和XbaⅠ位点,获得 二元载体pEGL502(pBHYGM是一种修饰的pGPTV-Hyg(Becker 等人(1992)植物分子生物学20,1195-1197)载体,它是通过将含 有BfrⅠ/ApaⅠ/ClaⅠ/SmaⅠ/BfrⅠ/XbaⅠ/SalⅠ/PstⅠ/SphⅠ/HindⅢ限制位点的 多接头插入pGPTV-Hyg的EcoRⅠ和XbaⅠ位点而产生的)。 实施例4:包含与烟草PR-1a启动子融合的OtsA基因的二元载体的 制备

用ApaⅠ和XbaⅠ消化质粒pPR1OTSA,凝胶纯化含有与烟草PR- 1a启动子融合的OtsA基因的2.6kb长片段,连接于pBHYGM的ApaⅠ 和XbaⅠ位点,获得含有与烟草PR-1a启动子融合的OtsA基因的二元 载体。 实施例5:包含与烟草PR-1a启动子融合的OtsB基因的二元载体的制 备

用ApaⅠ和XbaⅠ消化质粒pPR1OTSB,凝胶纯化含有与烟草PR- 1a启动子融合的OtsB基因的2.0kb长片段,连接于pBHYGM的ApaⅠ 和XbaⅠ位点,获得含有与烟草PR-1a启动子融合的OtsB基因的二元 载体。 实施例6:用根癌农杆菌对烟草叶盘的转化

通过电穿孔(Dower,W.J.(1987),分子生物学报道1∶5)将 二元载体构建体转化到根癌农杆菌菌株GV3101中(Bechtold,N.等人 (1993),CR Acad.Sci.Paris,Science de la vie,316:1194-1199)。 将过量表达水杨酸羟化酶基因的烟草cv′Xanthi nc′和转基因系 “NahG”的叶盘(Gaffney等人(1993)科学261:754-756)与包 含上述构建体的农杆菌克隆共培育(Horsch等人(1985)科学227: 1229-1231),用对50mg/ml潮霉素B的抗性来筛选转化体。每个构 建体筛选出大约50个独立的潮霉素系(T0系),并根植于不含激素的 培养基上。 实施例7:具有诱导型海藻糖生物合成基因表达的转基因系的筛选

对于每个转基因系,将大约2-3cm2的叶钻孔在3ml苯并(1,2,3)噻 二唑-7-硫代羧酸S-甲酯(BTH,5.6mg/10ml)中,于约300mmol/m-2s-1 照射下温育2天。收获叶物质,速冻并在液氮中磨碎。提取总RNA (Verwoerd等人(1989)NAR 17,2362),使用对OtsA和OtsB基 因特异的放射性标记探针如述(Ward等人(1991)植物细胞3, 1085-1094)进行Northern印迹分析。筛选在化学诱导物存在下具有 海藻糖生物合成基因高水平诱导型表达而在无化学诱导物时具有低背 景表达的转基因系。特别是,筛选出两个转基因系N5和N6,并自花 传粉,其子代用于进一步分析。 实施例8:玉米的转化

Koziel等人(生物技术11:194-200,1993)描述了利用粒子轰击 未成熟胚细胞而用于玉米转化的方法。用至少一种此处所述的质粒对 玉米的转化可通过微粒轰击未成熟合子胚或可连续繁殖的Ⅰ型胚发生 愈伤组织来实现。

专有基因型CG00526和CG00714的Ⅰ型胚发生愈伤组织培养 (Green等人,迈阿密冬季研讨会20,1983)从温室生长物质的1.5- 2.5mm长的未成熟胚开始。传粉大约14天后从表面消毒的穗上无菌 切下胚。将CG00526的胚置于含有2%蔗糖和5mg/L草灭畏的D愈 伤组织起始培养基上(Duncan等人,Planta 165:322-332,1985), 而将CG00714的胚置于含有3%蔗糖和0.75mg/L 2,4-D的KM愈伤 组织起始培养基上(Kao和Michayluk,Planta 126:105-110,1975)。 随后在暗处培养胚和胚发生培养物。大约14天后从外植体上切下胚发 生反应物。将CG00526反应物置于含有2%蔗糖和0.5mg/L 2,4-D的 D愈伤组织维持培养基上,而将CG00714的反应物置于含有2%蔗糖 和5mg/L麦草畏的KM愈伤组织维持培养基上。每周向新鲜维持培养 基中选择性传代培养,3-8周后建立高质量密集胚发生培养物。选择活 跃生长的胚发生愈伤组织片作为基因送递的靶组织。在基因送递之前 大约4小时,将这些愈伤组织片置于含有含12%蔗糖的维持培养基的 靶平板上。这些愈伤组织片以环形排列,半径为距靶平板中心8mm和 10mm.。

如DuPont Biolistics手册所述使质粒DNA沉淀于金微载体上。在 每次6次轰击的微载体制备中使用2-3μg的每种质粒。用PDS-1000He Biolistics装置向靶组织细胞送递基因。Biolistics装置的设置如下:破 裂片与巨载体之间8mm,巨载体与终止筛之间10mm,终止筛与目标 之间7cm。每个靶平板用650psi破裂片轰击两次。在终止筛与靶组织 之间放置一个200×200的不锈筛(McMaster-Carr,New Brunswick, NJ)。

基因送递7天后,将靶组织片从高渗培养基中转移到高水平选择 性培养基中。从选择性培养基中去除所有氨基酸。5-8周后,将在这些 高水平选择性培养基上生长的全部CG00526愈伤组织传代培养到由低 到高水平的培养基中。

由原始靶组织片筛选的存活组织传代培养为单个集落,并称为独 立的转化事件。

在这一点上,将在选择性培养基上筛选的集落转移到含有3%蔗糖 而不含选择剂的改良MS培养基(MS3S)中(Murashige和Skoog, 植物生理学(Physiol.Plant),15:473-497,1962),置于光下。对 于CG00526,向该培养基中加入0.25mg/L环丙嘧啶醇和0.5mg/L细 胞分裂素来诱导胚萌发,对于CG00714,加入2mg/L苄基腺嘌呤。

2周后将再生的集落转移到不合环丙嘧啶醇和细胞分裂素或苄基腺 嘌呤的MS3S培养基中。将所有集落的有根或无根的再生苗转移到含 有MS3S培养基的Magenta盒中,最后回收有根的小植物,并转移到 温室中的土壤中。

也曾经使用以标准培养技术用从未成熟合子胚获得的Ⅰ型愈伤组织 产生转化事件。为进行基因送递,在基因送递前1-2天通过向新鲜培 养基中传代培养制备大约300mgⅠ型愈伤组织,筛选靶组织片,并将 其以距靶平板中心10mm的环形方式置于含有12%蔗糖的培养基上。 大约4小时后,用DuPont的PDS-1000/He Biolistic装置轰击该组织。 用DuPont的标准方案使质粒沉淀于1μm金颗粒上。每个靶平板以 650psi两次轰击送递基因。基因送递大约16小时后,将愈伤组织转移 到含2%蔗糖不含选择剂的标准培养基中。在基因送递后的第12或13 天,将靶组织片转移到含40mg/lphosphino thricin作为Basta或双丙 氨膦的选择性培养基中。该愈伤组织选择传代培养12-16周,之后将 存活的和生长的愈伤组织转移到标准再生培养基中。

实施例9:小麦的转化

使用粒子轰击转化未成熟胚和未成熟胚衍生的愈伤组织,已由Vasil 等人(生物技术11:1553-1558,1993)和Weeks等人(植物生理102: 1077-1084,1993)描述。

小麦转化的一种优选技术包括对未成熟小麦胚的粒子轰击,并包 括基因送递前的高蔗糖或高麦芽糖步骤。在轰击前,将任一数量的胚 (0.75-1mm长)平板接种于含3%蔗糖(Murashige和Skoog,1962) 和3mg/l 2,4-D的MS培养基上,进行可在暗处进行的体胚诱导。在所 选的轰击当天,从诱导培养基中取出胚,置于渗压剂(即,以希望的 浓度,一般15%,加入蔗糖或麦芽糖的诱导培养基)上。使胚质壁分 离2-3小时,然后轰击。每个靶平板20个胚是常用的,但不是必需的。 用标准技术使合适的含基因质粒沉淀于微米大小的金颗粒上。用约 1000psi的破裂压力并使用标准80目筛子,用DuPont Biolistic氦装置 轰击每一平板的胚。轰击后,将胚放回暗处恢复约24小时(仍在渗压 剂上)。24小时后,从渗压剂上取下胚,放回诱导培养基上,在再生 前放置大约一个月。大约一个月后,将形成胚发生愈伤组织的胚外植 体转移到另外含有适当选择剂的再生培养基(MS+1mg/升NAA,5mg/ 升GA)中。约一个月后,将形成的幼苗转移到被称为GA7s的较大无 菌容器中,其中含有半量强度的MS、2%蔗糖和相同浓度的选择剂。 专利申请EP 0674715中详细描述了小麦的稳定转化。

实施例10:水稻的转化

将Japonica水稻品种“Taipei 309”的具有乳状胚乳的未成熟小 穗脱壳,用70%(v/v)乙醇表面消毒1分钟,6%次氯酸20分钟, 随后用无菌蒸馏水洗三次。在含有3%蔗糖、2mg/l 2,4-二氯苯氧基乙 酸(2,4-滴),pH5.8的0.35%琼脂糖凝固的MS培养基(Murashige 和Skoog,1962)上28℃培养分离的未成熟胚。一周后,通过每周转 移到新鲜培养基上分开并培养由盾盖(scutella)产生的愈伤组织物质。 开始4周后,将3-4个愈伤组织转移到含有20ml R2培养基(R2盐和 维生素[Ohira等人,1973]、1mg/l 2,4-滴、500mg/l 2-吗啉代乙烷磺酸 [MES]、3%蔗糖,pH5.8)的50ml培养瓶中。培养物在暗光下28℃保 存于220转每分的旋转式摇床上,每周将培养基替换为等量的新鲜培 养基。选择快速分裂、脆的愈伤组织,通过将2ml细愈伤组织悬液转 移到20ml R2培养基中将其传代培养到一个新容器中。

预先传代培养3-4天的2-3月龄悬乳培养物作为轰击的靶细胞。粒 子轰击前4小时,将大约500mg细胞在5.5cm培养皿所含的0.35%琼 脂糖凝固的质壁分离培养基(R2盐和维生素、1mg/l 2,4-滴、3%蔗糖、 0.5M蔗糖,pH5.8)上平铺为2cm直径的单层。用粒子流入枪(Finer 等人,1992)将DNA包被的金颗粒(Aldrich Cat.#32,658-5,球形金 粉1.5-3.0μm)传送给胚发生悬浮细胞。颗粒包被基本上如Vain等人 (1993)所述进行:将5μl等份质粒溶液分到0.5ml反应管中,置于 上。颗粒以100mg/ml悬浮于96%乙醇中,涡旋振荡2分钟。将乙 醇替换为等体积的无菌ddH2O,振荡该悬液1分钟。该洗涤步骤必须 重复一次。最后将颗粒以100mg/ml重悬浮于无菌ddH2O中。向每一 DNA等份中加入25μl颗粒悬液,将管振荡1分钟,随后立即加入25μl 无菌、冰预冷的CaCl2(2.5M溶于ddH2O)继续振荡1分钟。加入10μl 无菌亚精胺(0.1M溶于ddH2O),再次振荡悬液,置于冰上5分钟, 其间颗粒沉淀。移出50μl无颗粒上清液,剩余的悬液(15μl)进行5 次轰击。在每次轰击之前,颗粒需要通过剧烈移液重悬浮。

使细胞覆盖500μm网状隔板,将其置于含有颗粒的过滤单元之下 14cm。在部分真空(2×104pa)下用50毫秒的单次8巴压力脉冲释放 颗粒。

用所述转化载体之一轰击24小时后,将细胞转移到含有适当选择 剂如30mg/l巴龙霉素的0.3%琼脂糖凝固的选择性愈伤组织增强培养 基R2I(R2盐、1mg/l 2,4-滴、1mg/l硫胺素-HCl、500mg/l MES、6% 蔗糖,pH5.8)上,于28℃在暗处保存3周,直到巴龙霉素抗性(PamR) 集落在立体显微镜下成为可见的。将PamR集落转移到含有40mg/l巴 龙霉素的新鲜R2I培养基上,在暗处培养(每周传代培养)。2周后, 将PamR集落转移到含有40mg/l巴龙霉素的0.5%琼脂糖凝固的R2I 中,在暗处培养1周。为了再生,然后将集落转移到0.8%琼脂糖凝固 的幼苗诱导培养基上(R2R:R2盐、MS维生素、2%蔗糖、3%山梨 糖醇、1mg/l玉米素、0.5mg/l IAA、40mg/l巴龙霉素),在光下培养 直到形成幼苗。平行地,将愈伤组织物质保持于含有40mg/l巴龙霉素 的R2I培养基上,在暗处培养,每周传代培养,以获得同质的细胞系。

B.海藻糖-6-磷酸合酶和海藻糖-6-磷酸磷酸酶基因在植物质体中 的表达

B1.诱导型表达 实施例11:用于向质体基因组中同源重组的载体pAT236的构建

为了经同源重组插入嵌合基因,修饰烟草质体基因组的trnⅤ和 rps12/7基因间隔区。由烟草质体基因组PCR扩增1.78kb区(位点 139255-141036,Shinozaki等人(1986)欧洲分子生物学会杂志5: 2043-2049),并在位点140169之后插入一个PstⅠ位点,产生915bp 和867bp的位于PstⅠ插入位点5’和3’的侧翼质体DNA。用在位点 139255之前插入一个BsiEⅠ位点(5’-TAA CGG CCG CGC CCA ATC ATT CCG GAT A-3’,SEQ ID No:5)和在位点140169之后插入一 个PstⅠ位点(5’-TAA CTG CAG AAA GAA GGC CCG GCT CCA A-3’,SEQ ID No:6)的引物对进行PCR扩增(Pfu Turbo DNA聚 合酶,Stratagene,La Jolla,CA)。也用在位点140170之前插入一个 PstⅠ位点(5’-CGC CTG CAG TCG CAC TAT TAC GGA TAT G-3’, SEQ ID No:7)和在位点141036之后插入一个BsiWⅠ位点(5’-CGC CGT ACG AAA TCC TTC CCG ATA CCT C-3’,SEQ ID No:8) 的引物对进行PCR扩增。将PstⅠ-BsiEⅠ片段插入pbluescript SK+ (Stratagene)的PstⅠ-SacⅡ位点,产生pAT216,并将PstⅠ-BsiWⅠ 片段插入pbluescript SK+的PstⅠ-Acc65Ⅰ位点,产生pAT215。pAT218 含有1.78kb的质体DNA,含有PstⅠ位点用于嵌合基因和选择性标记 的插入,通过将pAT215的2.0kb PstⅠ-ScaⅠ片段与pAT216的2.7kb PstⅠ-ScaⅠ带连接而构建。

Ⅰ.烟草16S rRNA启动子和rbcL基因的rbs的扩增

由烟草DNA(烟草cv.Xanthi)PCR扩增16S rRNA启动子,并 与烟草质体rbcL基因的合成核糖体结合位点(rbs)融合。“顶链” 引物在位点102568之前在16S rRNA启动子5’末端插入一个EcoRⅠ 位点(5’-GCC AGA ATT CGC CGT CGT TCA ATG AGA ATG-3’, SEQ ID No:9)。“底链”引物扩增到16SrRNA启动子的位点102675, 通过改变位点102661(A改为C)和102670(A改为C)除去两个上 游ATG,加入rbcL基因的rbs(位点57569-57584)作为引物的5’延 伸,并在rbs的3’末端插入一个BspHⅠ位点(5’-GCC TTC ATG ATC CCT CCC TAC AAC TAT CCA GGC GCT TCA GAT TCG-3’,SEQ ID NO:10)。凝胶纯化142bp扩增产物,用EcoRⅠ和BspHⅠ酶切, 产生含有与rbcL基因的rbs融合的烟草16S rRNA启动子的128bp片 段。

Ⅱ.烟草质体rps16基因3’非翻译RNA序列(3’UTR)的扩增

使用下列寡核苷酸对由烟草DNA(烟草cv.Xanthi)PCR扩增烟 草质体rps16 3’UTR:用“顶链引物”(5’-CGC GAC TAG TTC AAC CGA AAT TCA AT-3’,SEQ ID NO:11),在紧接编码核糖体蛋白 S16的质体rps16基因的终止密码子之后加入一个SpeⅠ位点,用“底 链”引物(5’-CGC TCT GCA GTT CAA TGG AAG CAA TG-3’,SEQ ID No:12)在rps16 3’UTR的3’末端加入一个PstⅠ位点,。凝胶纯 化扩增产物,用SpeⅠ和PstⅠ消化,产生含有烟草rps16 3’UTR的163bp 片段(烟草质体基因组的位点4941-5093,Shinozaki等人,1986), 其5’侧翼为一个SpeⅠ位点,3’为一个PstⅠ位点。

Ⅲ.用于质体转化筛选的16S rRNA启动子∷aadA基因∷rps16 3’UTR盒的构建

从pRL277中分离aadA基因的编码序列,aadA基因是一种编码 提供壮观霉素和链霉素抗性的氨基糖苷3’腺苷转移酶的细菌基因 (Black等人(1993)分子生物学9:77-84和Prentki等人(1991) 基因103:17-23)。分离aadA编码序列的5’主要部分作为pRL227 的724bp BspHⅠ-BssHⅡ片段(起始密码子位于BspHⅠ位点),用pRL277 作为模板,通过PCR扩增在终止密码子20bp之后加入一个SpeⅠ位点 来修饰aadA基因的3’剩余部分,其中使用下列寡核苷酸对:“顶链” 引物(5’-ACC GTA AGG CTT GAT GAA-3’,SEQ ID NO:13)和 加入一个SpeⅠ位点的“底链”引物(5’-CCC ACT AGT TTG AAC GAA TTG TTA GAC-3’,SEQ ID NO:14)。凝胶纯化658bp扩增产物, 用BssHⅡ、SpeⅠ消化,将89bp片段与724bp BspHⅠ-BssHⅡ片段上 带有的aadA基因5’部分、128bp EcoRⅠ-BspHⅠ PCR扩增片段上带有 的16S rRNA启动子和rbcL的rbs及EcoRⅠ-SpeⅠ消化的pLITMUS28 载体(New England Biolabs)相连接,产生pAT223。对pAT223的 EcoRⅠ-SpeⅠ0.94kb片段,该片段含有16S rRNA启动子-rbs引导的 aadA基因、163bp含有rps16 3’UTR的SpeⅠ、PstⅠ消化PCR片段、 和EcoRⅠ、PstⅠ酶切的pUC19(New England Biolabs)进行三路连接, 获得含有引导aadA基因的16S rRNA启动子和rps16 3’UTR的 pAT229。

Ⅳ.噬菌体T7基因10启动子的扩增

从pET-3d(Statagene)PCR扩增噬菌体T7基因10启动子,其 中使用下列寡核苷酸对:在T7启动子5’末端插入一个EcoRⅠ位点的 “顶链”引物(5’-CCC GAA TTC ATC CCG CGA AAT TAA TA-3’, SEQ ID NO:15),和在3’末端插入一个NcoⅠ位点的“底链”引物 (5’-CGG CCA TGG GTA TAT CTC CTT CTT AAA GTT AAA-3’, SEQ ID NO:16)。凝胶纯化扩增产物,用EcoRⅠ、NcoⅠ酶切,产生 含有T7启动子的96bp片段。

Ⅴ.噬菌体T7基因10终止子的扩增

从pET-3d(Stratagene)PCR扩增噬菌体T7基因10终止子,其 中使用下列寡核苷酸对:“顶链”引物在终止子的5’末端插入一个 HindⅢ位点(5’-GCG AAG CTT GCT GAG CAA TAA CTA GCA TAA-3’,SEQ ID NO:17),“底链”引物在终止子的3’末端插入一 个PstⅠ位点(5’-GCG CTG CAG TCC GGA TAT AGT TCC TCC T- 3’,SEQ ID NO:18)。凝胶纯化扩增产物,用HindⅢ-PstⅠ酶切, 产生含有T7终止子的86bp片段。

Ⅵ.拟南芥质体psbA 3’非翻译RNA序列的扩增

从拟南芥DNA(生态型Landsburg)PCR扩增拟南芥质体psbA 3’UTR,其中使用下列寡核苷酸对:“顶链”引物向3’UTR的5’端添 加了一个SpeⅠ位点,并通过将G突变为A(下划线标出)除去了天 然序列中的一个XbaⅠ位点(5’-GCG ACT AGT TAG TGT TAG TCT AAA TCT AGT T-3’,SEQ ID NO:19),“底链”引物向UTR的3’ 端添加了一个HindⅢ位点(5’-CCG CAA GCT TCT AAT AAA AAA TAT ATA GTA-3’,SEQ ID NO:20)。扩增区域从GenBank保藏 号X79898的位点1350延伸到1552。凝胶纯化218bp PCR产物,用 SpeⅠ和HindⅢ消化,并与带有T7终止子的HindⅢ-PstⅠ酶切PCR 片段连接引入pbluescript sk-(Stratagene)的SpeⅠ-PstⅠ位点,产生 pPH171.与GenBank保藏号X79898相比,pPH171的psbA 3’UTR 区的序列分析显示在位点1440和1452处缺失了A。

Ⅶ.含有与噬菌体T7基因10启动子和终止子及拟南芥质体psbA 3’UTR融合的GUS报道基因的嵌合基因在质体转化载体中的制备

通过含有T7启动子的96bp EcoRⅠ、NcoⅠ PCR片段,含有GUS 基因的pC8的1.86kb NcoⅠ、XbaⅠ片段,含有拟南芥psbA 3’UTR和 T7终止子的pPH171的295XbaⅠ、PstⅠ片段,向pGEM-3Z(Stratagene) 的EcoRⅠ、PstⅠ位点中的四路连接,构建噬菌体T7基因10启动子∷GUS 基因∷拟南芥psbA 3’UTR∷T7终止子盒,产生质粒pAT221。通过将 含有16S rRNA启动子-rbs∷aadA∷rps16 3’UTR盒的pAT229的1.1kb HindⅢ、EcoRⅠ片段,和带有T7启动子∷GUS∷psbA 3’UTR∷T7终 止子盒的2.26kb EcoRⅠ、PstⅠ pAT221片段,克隆到pbluescript sk+ (Stratagene)的HindⅢ、PstⅠ位点,将T7启动子引导的GUS基因 盒与aadA选择性标记盒相连接,产生质粒pAT232。质体转化载体 pAT236的构建方法是,含有GUS和选择性标记盒的pAT232的3.36kb PstⅠ带连接到pAT218的PstⅠ位点,并对GUS基因以与rps12/7ORF 相同方向转录时的插入方向进行筛选。 实施例12:用聚苷序列段作为3’UTR替代者的载体构建

聚鸟苷序列段显示可在体内替代质体atpB基因3’UTR(Drager 等人(1996)RNA 2:652-663)。含有18个连续鸟苷残基、在5’和 3’末端侧翼分别为SpeⅠ、HindⅢ粘端的polyG序列段是通过使下列 两种激酶处理的寡核苷酸退火而装配成的:(5’-CTA GTG GGG GGG GGG GGG GGG GGA-3’,SEQ ID NO:21)和(5’-AGC TTC CCC CCC CCC CCC CCC CCA-3’,SEQ ID NO:22)。含有SpeⅠ、HindⅢ 粘端的polyG18序列段与含有T7终止子的HindⅢ、PstⅠ消化的PCR 片段相连接,引入pBluescript SK+(Stratagene)的SpeⅠ、PstⅠ位点。 实施例13:含有与噬菌体T7基因10启动子融合的大肠杆菌海藻糖-6- 磷酸合酶基因(OtsA)的嵌合基因在质体转化载体中的制备

用大肠杆菌DH5α株的基因组DNA作为OtsA基因5’部分PCR 扩增的模板,使用一条顶链引物(其中引入了ATG起始密码子,随后 是一个新添加的GCA密码子),从而产生一个NcoⅠ限制位点(引物 pOTSAN+:5’-TGA CCA TGG CAA GTC GTT TAG TCG TAG T- 3’,SEQ ID NO:23),并使用一条在OtsA唯一SfuⅠ限制位点下游 的底链引物(引物pOTSAN-:5’-AGC AAC GCT TCA TAG-3’,SEQ ID NO:24)。用480型DNA热循环仪(Perkin Elmer/Roche, Branchburg,NJ)按厂商推荐用PFU DNA聚合酶(Promega)在50μ 体积中进行PCR反应,94℃(30s)、40℃(60s)和72℃(30s)五 个循环,随后94℃(30s),55℃(60s)和72℃(30s)25个循环。 用标准方法凝胶纯化850bp PCR产物,用NcoⅠ(除非另外指出,否 则所有限制酶都获自New England Biolabs)和SfuⅠ(Boehringer Mannheim,Corp.,Indianapolis)酶切,释放661bp的DNA片段。以 与上述相似的方法获得OtsA的3’部分,其中使用位于OtsA SfuⅠ位 点上游的顶链引物(pOTSAX+:5’-GCG TTC CTG GAT TGT C-3’, SEQ ID NO:25),和一条底链引物(pOTSAX-:5’-GGG TCT AGA GAT TCA CGC GAG CTT TGG AAA GGT AGC A-3’,SEQ ID NO: 26),其通过将CTT Leu密码子改变为CTC,在终止密码子下游引 入了一个XbaⅠ限制位点,并破坏了在OtsA 3’末端存在的HindⅢ限 制位点。凝胶纯化861bp的扩增产物,用SfuⅠ和XbaⅠ消化,得到的 772bp DNA片段与5’OtsA NcoⅠ/SfuⅠ片段在用NcoⅠ和XbaⅠ消化的 pLitmus28(Promega)中连接,产生pOTSA。

pAT236(实施例11)的质粒DNA,在质体转化载体中含有pET3a (Novagen)的噬菌体T7基因10启动子盒,用NcoⅠ和SphⅠ消化(产 生1646bp片段)和SphⅠ和XbaⅠ消化(产生4514bp片段)。这些载 体片段以三路反应与含有完整OtsA基因的pOTSA的1433bp NcoⅠ/XbaⅠ片段连接,产生质体转化载体pT7-OTSA。 实施例14:含有与噬菌体T7基因10启动子融合的大肠杆菌海藻糖-6- 磷酸磷酸酶基因(OtsB)的嵌合基因在质体转化载体中的制备

如上所述由大肠杆菌基因组DNA扩增OtsB基因的5’部分,其中 使用顶链引物pOTSBN+:5’-GTC GCC ATG GTG ACA GAA CCG TTA ACC-3’,SEQ ID NO:27,其使OtsB的GTG起始密码子转变 为ATG,并在第二个位点添加了一个GTG Val密码子,并使用位于 OtsB唯一BglⅡ位点下游的底链引物pOTSBN-:5’-GTT CGC CCG ATA AAG GGA G-3’,SEQ ID NO:28。凝胶纯化584bp产物,用 NcoⅠ和BglⅡ消化,分离产生的459bp片段。类似地扩增OtsB的3’ 部分,其中使用位于OtsB BglⅡ位点上游的顶链引物pOTSBX+:5’- TAG CGC AAC GTA TTA CTC-3’,SEQ ID NO:29,和底链引物 pOTSBX-:5’-GCC TCT AGA CTC ATC ATT AGA TAC TAC GAC TAA AC-3’,SEQ ID NO:30,其在OtsB终止密码子下游引入了一 个XbaⅠ限制位点。用BglⅡ和XbaⅠ消化凝胶纯化的381bp产物,得 到的354bp BglⅡ/XbaⅠ限制片段与5’OtsB NcoⅠ/BglⅡ限制片段连接, 引入用NcoⅠ和XbaⅠ消化的载体pLitmus28中,产生pOTSB。

然后用NcoⅠ和XbaⅠ消化质粒pOTSB,如上所述使得到的含有完 整OtsB基因的820bp片段与质粒pAT236的NcoⅠ/SphⅠ和SphⅠ/XbaⅠ 片段以三路反应连接,产生质体转化载体pT7 OTSB。 实施例15:含有操纵子样嵌合基因构建体的质体转化载体的制备,该 构建体含有与噬菌体T7启动子和终止子融合的OtsA基因和OtsB基 因

用NcoⅠ和SpeⅠ消化质粒pOTSB,分离并去磷酸化3534bp载体 骨架/OtsB片段。该片段与合成寡核苷酸接头连接,该接头含有噬菌 体T7基因10 5’UTR的一部分和嵌合共有质体核糖体结合位点,其制 备方法是退火然后用T4激酶磷酸化顶链寡核苷酸5’-CTA GTG GGA GAC CAC AAC GGT TTC CCT CTA GAA ATA ATT TTG TTT AAG TTT AAG AAG GGG AGA GAA T-3’,SEQ ID NO:31(SpeⅠ 限制位点突出端以下划线标出)和底链寡核苷酸5’-CAT GAT TCT CTC CCC TTC TTA AAC TTA AAC AAA ATT ATT TCT AGA GGG AAA CCG TTG TGG TCT CCC A-3’,SEQ ID NO:32(BspHⅠ 限制位点突出端以下划线标出)。用SpeⅠ消化得到的质粒pOTSBL, 连接于以方向SpeⅠ--OtsA∷接头∷OtsB筛选的pOTSA的1516 bp SpeⅠ/XbaⅠ片段,产生pOTSABL。然后用NcoⅠ和XbaⅠ(部分)消化 质粒pOTSABL,使得到的含有完整OtsA∷T75’/RBS∷OtsB盒的 2313bp片段与如上所述的质粒pAT236的NcoⅠ/SphⅠ和SphⅠ/XbaⅠ片 段以三路反应连接,产生质体转化载体pT7_OTSAB。

用分子生物学标准方法也产生一种省略了噬菌体T7基因10 5’UTR 部分的类似的质体转化载体。

B2.组成型表达 实施例16:烟草质体clpP基因启动子和完整5’非翻译RNA(5’UTR) 的扩增

烟草c.v.“Xanthi NC”的总DNA用作PCR模板,使用一条由左 至右的“顶链”引物,其在相对于组成型表达质体clpP基因ATG起 始密码子的位点-197处含有一个引入的EcoRⅠ限制位点(引物 Pclp_P1a:5’-GCG GAA TTC ATA CTT ATT TAT CAT TAG AAA G-3’(SEQ ID No:33);EcoRⅠ限制位点以下划线标出),并使用一条 由右至左的“底链”引物,它与相对于clpP启动子ATG起始密码子 的-21到-1区域同源,并在翻译起点处掺入了一个引入的NcoⅠ限制位 点(引物Pclp-P2b:5’-GCG CCA TGG TAA ATG AAA GAA AGA ACT AAA-3’(SEQ ID No:34);NcoⅠ限制位点以下划线标出)。 按厂商推荐用(Perkin Elmer/Roche,Branchburg,NJ)Perkin Elmer 480型热循环仪用Pfu热稳定DNA聚合酶(Stratagene,La Jolla CA) 如下进行该PCR反应:95℃7分钟,随后95℃1分钟/43℃2分钟/72 ℃1分钟4个循环,然后95℃ 1分钟/55℃ 2分钟/72℃ 1分钟25个 循环。用标准方法凝胶纯化213bp的扩增产物,其含有clpP基因的启 动子和5’非翻译区,在左端包含一个EcoRⅠ位点,在右端包含一个NcoⅠ 位点,并对应于烟草质体DNA序列的核苷酸74700-74505(Shinozaki 等人,欧洲分子生物学会杂志5:2043-2049(1986)),并用EcoRⅠ 和NcoⅠ消化该产物(所有限制酶都购自New England Biolabs,Beverly, MA)。 实施例17:烟草质体rps16基因3’非翻译RNA序列的扩增

如上所述用烟草c.v.“Xanthi NC”的总DNA作为PCR模板,使 用一条由左至右的“顶链”引物,其在编码核糖体蛋白S16的质体rps16 基因的TAA终止密码子之后含有一个引入的XbaⅠ限制位点(引物 rps16P 1a:5’-GCG TCT AGA TCA ACC GAA ATT CAA TTA AGG-3’(SEQ ID NO:35);XbaⅠ限制位点以下划线标出),并使用 一条由右至左的“底链”引物,它与相对于rps16的TAA终止密码子 的+134到+151区域同源,并在rps16 3’UTR的3’末端掺入了一个引 入的HindⅢ限制位点(引物rps16P_1b:5’-CGC AAG CTT CAA TGG AAG CAA TGA TAA-3’(SEQ ID NO:36);HindⅢ限制位点以下 划线标出)。凝胶纯化169bp的扩增产物,其含有rps16基因的3’ 非翻译区,在左端包含一个XbaⅠ位点,在右端包含一个HindⅢ位点, 并含有对应于烟草质体DNA序列核苷酸4943-5093的区域(Shinozaki 等人,1986),并用XbaⅠ和HindⅢ消化。 实施例18:含有与clpP基因启动子和5’和3’UTR连接的GUS报道 基因片段的质体转化载体的制备

通过用NcoⅠ和XbaⅠ消化产生1864bp β-半乳糖酸酶(GUS) 报道基因片段,其来源于质粒pRAJ275(Clontech),在ATG起始 密码子处含有一个NcoⅠ限制位点,在天然3’UTR后含有一个XbaⅠ 位点。该片段与201bp EcoRⅠ/NcoⅠ clpP启动子片段、157bp XbaⅠ/HindⅢ rps16 3’UTR片段、克隆载体pGEM3Zf(-)(Promega, Madison WI)的3148bp EcoRⅠ/HindⅢ片段以四路反应连接,构建 质粒pPH138。质体转化载体pPH140的构建方法是,用EcoRⅠ和 HindⅢ消化质粒pPRV111a(Zoubenko等人(1994)核酸研究22: 3819-24),并将得到的7287bp片段与pPH138的2222bp EcoRⅠ/HindⅢ 片段连接。 实施例19:含有与clpP基因启动子和5’和3’UTR连接的OtsA基因 的质体转化载体的制备

含有完整OtsA基因的pOTSA的1433bp NcoⅠ/XbaⅠ片段以四路 反应与201bp EcoRⅠ/NcoⅠclpP启动子片段、157bp XbaⅠ/HindⅢ rps16 3’UTR片段、克隆载体pGEM3Zf(-)(Promega,Madison WI)的3148bp EcoRⅠ/HindⅢ片段连接,构建质粒pclpOtsA。质体转化载体的构建 方法是,用EcoRⅠ和HindⅢ消化质粒pPRV111a,并将得到的7287bp 片段与pclpOtsA的1791bp EcoRⅠ/HindⅢ片段连接。 实施例20:含有与clpP基因启动子和5’和3’UTR连接的OtsB基因 的质体转化载体的制备

用NcoⅠ和XbaⅠ消化质粒pOTSB,得到的含有完整OtsB基因的 820bp片段以四路反应与201bp EcoRⅠ/NcoⅠclpP启动子片段、157bp XbaⅠ/HindⅢ rps16 3’UTR片段、克隆载体pGEM3Zf(-)(Promega, Madison WI)的3148bp EcoRⅠ/HindⅢ片段连接,构建质粒 pclpOtsB。质体转化载体的构建方法是,用EcoRⅠ和HindⅢ消化质 粒pPRV111a,并将得到的7287bp片段与pclpOtsB的1178bp EcoRⅠ/HindⅢ片段连接。 实施例21:含有一种操纵子样嵌合基因构建体的质体转化载体的制备, 该构建体含有与clpP基因启动子和5’和3’UTR连接的OtsA基因和 OtsB基因

用NcoⅠ和XbaⅠ(部分)消化质粒pOTSABL,得到的含有完整 OtsA∷T7 5’/RBS∷OtsB盒的2313bp片段以四路反应与201bp EcoRⅠ/NcoⅠclpP启动子片段、157bp XbaⅠ/HindⅢ rps16 3’UTR片 段、克隆载体pGEM3Zf(-)(Promega,Madison WI)的3148bp EcoRⅠ/HindⅢ片段连接,构建质粒pclpOtsAB。质体转化载体pPH140 的构建方法是,用EcoRⅠ和HindⅢ消化质粒pPRV111a(Zoubenko 等人,1994),并将得到的7287bp片段与pclpOtsAB的2671bp EcoRⅠ/HindⅢ片段连接。 实施例22:烟草质体基因组的Biolistic转化

每板七个,以1″环形排列于T琼脂培养基上,使烟草c.v.′Xanthi nc′ 的种子萌发,播种12-14天后,基本如所述(Svab,Z.和Maliga,P. (1993)PNAS 90,913-917),用质粒pC8E5和pC+E5的DNA包 被的1μm钨颗粒(M10,Biorad,Hercules,CA)轰击。将轰击的 秧苗在T培养基上温育两天之后切下叶子,远轴侧朝上置于亮光下 (350-500μmol光子/m2/s),于含有500μg/ml壮观霉素二盐酸盐 (Sigma,St.Louis,MO)的RMOP培养基板上(Svab,Z., Hajdukiewicz,P.和Maliga,P.(1990)PNAS 87,8526-8530)。轰 击三至八周后在漂白叶下出现的抗性苗被亚克隆至相同的选择培养基 上,使之形成愈伤组织,分离并亚克隆第二批苗。独立亚克隆中完全 分离的转化的质体基因组拷贝(同质体状态),用Southern印迹标 准技术(Sambrook等人(1989)《分子克隆:实验室手册》,冷泉 港实验室,冷泉港)评价。BamHⅠ/EcoRⅠ消化的总细胞DNA(Mettler, I.J.(1987)植物分子生物学报告5,346-349)在1%Tris-酸(TBE) 琼脂糖凝胶上分离,转移至尼龙膜上(Amersham),用32P-标记的随 机引物DNA序列探查,该序列对应于包含一部分rps7/12质体导向序 列的pC8的0.7kb BamHⅠ/HindⅢ DNA片段。同质体苗在包含壮观 霉素的MS/IBA培养基(McBride,K.E.等人(1994)PNAS 91, 7301-7305)上无菌生根,并将其转移到温室中。 实施例23:表达化学诱导型、质体导向的T7 RNA聚合酶的转基因烟 草的制备

一种合成寡核苷酸接头,其含有一个NcoⅠ限制位点和ATG起始 密码子,随后是rbcS基因(编码核糖二磷酸羧化酶的小亚基)的前 7个质体转运肽密码子和内源PstⅠ限制位点(顶链:5’-CAT GGC TTC CTC AGT TCT TTC CTC TGC A-3’,SEQ ID NO:37;底链:5’-GAG GAA AGA ACT GAG GAA GC-3’,SEQ ID NO:38),pCGN4205 (McBride,K.E.等人(1994),PNAS 91,7301-7305)的2.8kb PstⅠ/SacⅠ DNA片段,其含有与rbcS基因转运肽编码序列3’部分在框架内融合 的噬菌体T7 RNA聚合酶基因(T7 Pol),pCIB296的一个0.9kb NcoⅠ/KpnⅠDNA片段,其含有烟草PR-1a启动子,在起始密码子处有 一个引入的NcoⅠ限制位点(Uknes等人(1993)植物细胞5,159-169), 和二元农杆菌转化载体pSGCGC1(pGPTV-Hyg的衍生物,含有克隆 到SacⅠ/HindⅢ位点的pGEM4(Promega,Madison WI)的多接头) 的4.9kb SfiⅠ/KpnⅠ和6.6kb SacⅠ/SfiⅠ片段,将以上片段连接,构建 pPH110。

将烟草‘Xanthi’和“NahG”的叶盘与带有pPH110二元载体的 GV3101农杆菌共培育,如述从由此获得的幼苗再生为潮霉素抗性 NT-pPH110烟草植物。对于每个转基因系,大约2-3cm2的双重叶钻 孔在3ml BTH(5.6mg/10ml)或无菌蒸馏水中,于约300μmol/m2/s 照射下温育2天。收获叶物质,急冻,并在液氮中磨碎。提取总RNA (Verwoerd等人(1989)NAR 17,2362).使用放射性标记的T7 RNA 聚合酶基因探针如述(Ward等人(1991)植物细胞3,1085-1094) 进行Northern印迹分析。将显示一定程度T7 Pol表达的十九个NT- 110X(Xanthi遗传背景)和七个NT-110N(NahG遗传背景)的T1 系植物转移到温室中并自花传粉。连锁的潮霉素抗性标记3∶1分离的 子代自体受精,选择纯合的T2系。 实施例24:玉米的质体转化

专有基因型CG00526和CG00714的Ⅰ型胚发生愈伤组织培养 (Green等人(1983),于:A.Fazelahmad,K.Downey,J.Schultz,R.W. Voellmy,编,基因技术进展:植物与动物的分子遗传学。迈阿密冬季 研讨会,第20卷,Academic Press,N.Y.)从温室生长物质的1.5-2.5mm 长的未成熟胚开始。传粉大约14天后从表面消毒的稳上无菌切下胚。 将CG00526的胚置于含有2%蔗糖和5mg/L草灭畏的D愈伤组织起 始培养基上(Duncan等人(1985)Planta 165:322-332),而将CG00714 的胚置于含有3%蔗糖和0.75mg/L 2,4-滴的KM愈伤组织起始培养基 上(Kao和Michayluk(1975)Planta 126:105-110)。随后在暗处 培养胚和胚发生培养物。大约14天后从外植体上切下胚发生反应物。 将CG00526反应物置于含有2%蔗糖和0.5mg/L 2,4-滴的D愈伤组织 维持培养基上,而将CG00714的反应物置于含有2%蔗糖和5mg/L麦 草畏的KM愈伤组织维持培养基上。每周向新鲜维持培养基中选择性 传代培养,3-8周后建立高质量密集胚发生培养物。选择活跃生长的胚 发生愈伤组织片作为基因送递的靶组织。在基因送递前大约4小时, 将这些愈伤组织片置于含有含12%蔗糖的维持培养基的靶平板上。这 些愈伤组织片以环形排列,半径为距靶平板中心8mm和10mm.。如 DuPont Biolistics手册所述使质粒DNA沉淀于金微载体上。在每次6 次轰击的微载体制备中使用2-3μg的每种质粒。用PDS-1000He Biolistics装置向靶组织细胞送递基因。Biolistics装置的设置如下:破 裂片与巨载体之间8mm,巨载体与终止筛之间10mm,终止筛与目标 之间7cm。每个靶平板用650psi破裂片轰击两次。在终止筛与靶组织 之间放置一个200×200的不锈钢筛(McMaster-Carr,New Brunswick, NJ)。

5天后,将轰击的愈伤组织片转移到含有2%蔗糖和0.5mg/L 2,4- 滴而不含氨基酸及含有750或1000nM通式ⅩⅦ的维持培养基中。 转移4-5小时后或第二天将愈伤组织片置于光架上1小时,于27℃在 暗处贮存5-6周。5-6周初次筛选阶段后,将黄色到白色的组织转移到 含有补加有500或750nM通式ⅩⅦ的相同培养基的新鲜平板上。转 移4-5小时后或在第二天,将组织置于光架上1小时,在暗处27℃贮 存3-4周。3-4周二次筛选阶段后,将组织转移到含有补加有500nM 通式ⅩⅦ的相同培养基的平板上。将健康生长的组织置于光架上1 小时,并在暗处27℃贮存。每两周传代培养一次,直到集落大到足以 再生时为止。

在这一点上,将集落转移到含有3%蔗糖而不含选择剂的改良MS 培养基(MS3S)中(Murashige和Skoog(1962)植物生理学15: 473-497),置于光下。对于CG00526,向该培养基中加入0.25mg/L 环丙嘧啶醇和0.5mg/L细胞分裂素来诱导胚的萌发,对于CG00714, 加入2mg/L苄基腺嘌呤。2周后,对于CG00526和CG00714,分别 将再生的集落转移到不含环丙嘧啶醇和细胞分裂素或不含苄基腺嘌呤 的MS3S培养基中。将生根或无根的再生苗转移到含有MS3S培养基 的盒中,最后回收生根的小植物,并转移到温室中的土壤中。

C.海藻糖生物合成基因的化学诱导和植物中海藻糖含量的测定 实施例25:海藻糖生物合成基因的化学诱导

在温室中使种子萌发并使植物生长3-6周。然后喷施1.2mM BTH (或者如Friedrich等人(1996)植物杂志10,61-70进一步说明的) 或湿粉。在不同时间点收获植物物质的样品并急冻。进行Northern印 迹分析监测BTH处理后海藻糖生物合成基因表达的诱导。 实施例26:可溶性糖和多元醇从冻干的烟草组织中的提取

加入40mg甘露庚酮糖(内部标准)后用400ml 80%甲醇65℃10 分钟抽提10-20mg冻干组织3次。合并的上清液(在Eppendorff台 式离心机中13000转每分离心5分钟后)在25℃下在Speedvac中真 空干燥。然后将干燥的提取物重悬浮于700ml milipor水中,并加入50ml 混合床离子交换树脂(Serdolit micro blue和red 2∶1[v/v])脱盐。以 13000转每分离心沉淀离子交换树脂,并用300ml Milipore水洗涤。 合并的上清液再次在25℃下在Speedvac中真空干燥。主要含有糖和 多元醇的残余物现在准备用于HPLC分析,或者用于随后毛细管GC 分析的衍生。

实施例27:HPLC分析

将干燥的残余物重悬浮于200ml水中,以15000转每分离心15分 钟。使用配备有脉冲电流检测仪的Dionex的HPLC系统,在Dionex P100离子交换柱上用100mM NaOH溶液等度分离10ml等份。 实施例28:毛细管气相层析

将干燥的残余物重悬浮于200ml 50%甲醇中,以15000转每分离 心15分钟。将80ml上清液转移到200ml GC注射瓶中。糖和多元醇 在Speedvac中真空干燥。然后通过在80℃的加热上加入甲醇重复 蒸发,使残余物成为无水的。无水残余物用具有螺旋瓶盖的隔片密封。 然后将样品溶解于含有625mg羟胺和50mg苯基-b-吡喃葡糖苷的无水 吡啶中。该混合物在80℃下温育30分钟。加入50ml含有1%三甲基 氯烷(v/v)的N-甲基-N-三甲基硅烷基-七氟-丁酰胺后,在80℃下 进行衍生反应30分钟。糖和多元醇的TMS-(三甲基硅烷基)-衍生物准 备用于GC分析。1-3ml该反应混合物的分离用装备有FID检测器的 Carlo Erba GC进行,使用下列条件:毛细管:SW Scientific,30m, ID 0.323mm,液相DB-17。温度程序:70℃,2分钟,25℃/分钟到170 ℃,70℃/分钟到340℃,340℃,5分钟。 实施例29:用HPLC对转基因植物中海藻糖含量的测定

如实施例25所述培养并用BTH处理两个独立转基因系的子代(转 基因系N5的N5/3和N5/4,转基因系N6的N6/1、N6/2、N6/7和N6/8)。 如实施例26所述收集并提取样品。用HPLC测定海藻糖含量(实施 例27)。

表1显示用BTH处理后或用湿粉(WP)作为对照处理后样品的 海藻糖含量。也显示了野生型Xanthi海藻糖含量的测定。数值表示为 mg/g测定样品的干重(DW)。在野生型Xanthi中和在BTH处理后 第0天的转基因植物中未检测到海藻糖,而在BTH处理后检测到海藻 糖。

 海藻糖       葡萄糖    果糖     蔗糖 (mg/gDW)   (mg/gDW)   (mg/gDW)   (mg/gDW)  Xanthi BTH后0天     0     18.1     3.7     17.6  Xanthi BTH后3天     0     6.7     1.5     9.1  Xanthi BTH后7天     0     11.9     2.2     16.4  N5/3 BTH后0天     0     3     0.6     8.2  N5/3 BTH后3天     痕量     2.4     0.2     7  N5/3 BTH后7天     0.5     8.4     1.6     19.5  N5/3 WP后7天     0     6.9     1.5     12.9  N5/4 BTH后0天     0     7.3     1.8     16.7  N5/4 BTH后3天     痕量     1.3     0.4     7.7  N5/4 BTH后7天     0.6     9.5     2.2     19.7  N5/4 BTH后22天     2.3     24     4.7     17.6  N5/4 WP后7天     0     24.9     4     10.1  N6/1 BTH后0天     0     9.7     1.9     18.1  N6/1 BTH后3天     0     1.7     0.5     10.3  N6/1 BTH后7天     痕量     10.7     2.4     23.6  N6/1 BTH后22天     0.7     31.7     6.2     13.2  N6/2 BTH后0天     0     3.6     0.6     11.1  N6/2 BTH后3天     0     4     1.1     8.6  N6/2 BTH后7天     痕量     6.1     1.3     20.1  N6/7 BTH后0天     0     2.1     0.4     13.6  N6/7 BTH后3天     0.1     1.5     0.4     9.1  N6/7 BTH后7天     1.2     12.7     2.9     25.8  N6/7 BTH后22天     2.6     37     6.5     17.1  N6/8 BTH后0天     0     4     0.8     10.4  N6/8 BTH后3天     0     2.4     0.4     7.9  N6/8 BTH后7天     0.2     14.9     3.3     16.1 实施例30:用HPLC/GC对转基因植物中海藻糖含量的测定

如实施例25所述培养并用BTH处理两个独立转基因系的子代(转 基因系N5的N5/3和N5/4,转基因系N6的N6/1、N6/2、N6/7和N6/8)。 如实施例26所述收集并提取样品。用HPLC/GC测定海藻糖含量(实 施例28)。

表2显示用BTH处理后或用湿粉(WP)作为对照处理后样品的 海藻糖含量。也显示了野生型Xanthi海藻糖含量的测定。数值表示为 mg/g测定样品的干重(DW)。在BTH处理后的转基因植物中观察 到海藻糖积累的诱导。

mg 海藻糖 葡萄糖 果糖 蔗糖 甘露醇 肌醇 甘露庚酮 糖 提取 (内标 40pg) Xanthi BTH后0天 5.6 面积 0 130626 137761 122625  0  50850  98724 mg/gDW 0 8.11 9.24 13.99  0  316 Xanthi BTH后3天 5.5 面积 0 23971 26108 50252  0  67458  48803 mg/gDW 0 3.06 3.61 11.61  0  9.18 Xanthi BTH后7天 8.7 面积 0 103175 86735 252532  0  156339  78786 mg/gDW 0 5.16 4.69 23.24  0  8.33 N5/3 BTH后0天 4.6 面积 0 25664 26357 42743  2139  23091  76831 mg/gDW 0 2.49 2.82 7.63  0.23  2.39 N5/3 BTH后3天 8.3 面积 2522 32522 25992 91395  2556  85370  78343 mg/gDW 0.25 1.72 1.48 8.87  0.15  4.8 N5/3 BTH后7天 10.6 面积 7341 115732 109582 461342  10312  156336  89033 mg/gDW 0.49 4.21 4.3 30.84  0.42  6.05 N5/3 WP后7天 6.2 面积 1053 46576 50861 106758  4329  91251  81008 mg/gDW 0.13 3.18 3.75 13.41  0.33  6.64 N5/4 BTH后0天 6 面积 124 63822 75278 136497  6640  46626  98401 mg/gDW 0.01 3.71 4.73 14.59  0.43  2.88 N5/4 BTH后3天 6.7 面积 1737 32083 34104 120958  6740  128468  103019 mg/gDW 0.16 1.59 1.83 11.06  0.37  6.8 N5/4 BTH后7天 6.2 面积 3518 71221 83701 255283  3762  115824  97553 mg/gDW 0.37 4.04 5.13 26.63  0.24  7 N5/4 BTH后22天 10 面积 17725 250258 265768 360298  14192  206874  107392 mg/gDW 1.04 7.99 9.17 21.17  0.5  7.04 N5/4 WP后7天 7.9 面积 1266 230792 189040 149745  8927  134969  102634 mg/gDW 0.1 9.76 8.64 11.65  0.42  6.08 N6/1 BTH后0天 5.9 面积 68 104570 109361 155436  6623  40609  108035 mg/gDW 0.01 5.63 6.36 15.39  0.4  2.33 N6/1 BTH后3天 9.6 面积 171 28576 32618 189668  7263  203269  99197 mg/gDW 0.01 1.03 1.27 12.57  0.29  7.8 N6/1 BTH后7天 8.4 面积 718 93789 109060 390133  7781  177790  113543 mg/gDW 0.05 3.37 4.24 25-81  0.31  6.81 N6/1 BTH后22天 10.8 面积 3012 633512 599460 426678  15985  386790  124721 mg/gDW 0.14 16.13 16.5 19.99  0.45  10.49 N6/2 BTH后0天 5.7 面积 0 31891 33610 73092  6854  21324  69201 mg/gDW 0 2.77 3.16 11.69  0.66  1.97 N6/2 BTH后3天 6.8 面积 0 21575 35235 82293  9340  90009  78756 mg/gDW 0 1.38 2.44 9.69  0.66  6.14 N6/2 BTH后7天 8.5 面积 447 47653 53238 290368  9295  105943  74862 mg/gDW 0.04 2.57 3.1 28.79  0.56  6.08 N6/7 BTH后0天 4.8 面积 158 51929 46536 102388  8893  63254  108621 mglgDW 0.02 3.42 3.31 12.39  0.65  4.43 N6/7 BTH后3天 4.9 面积 2261 10420 13317 139589  3870  120264  117476 mg/gDW 0.25 0.62 0.86 15.3  0.26  7.63 N6/7 BTH后7天 8 面积 7813 107748 116835 464737  0  179686  102089 mg/gDW 0.61 4.53 5.3 35.9  0  8.04 N6/7 BTH后22天 14.1 面积 31445 609847 642550 761211  24765  601151  122289 mg/gDW 1.15 12.13 13.81 27.85  0.55  12.74 N6/8 BTH后0天 6.8 面积 40 49010 51848 111978  6328  26476  76039 mg/gDW 0 3.25 3.72 13.66  0.47  1.87 N6/8 BTH后3天 6.1 面积 447 12368 16802 74009  7182  117838  83366 mg/gDW 0.06 0.83 1.22 9.18  0.54  8.46 N6/8 BTH后7天 7.9 面积 3051 147316 164133 297760  5728  125094  89794 mg/gDW 0.27 7.12 8.58 26.48  0.31  6.44 实施例31:转基因植物耐旱性的测定

BTH或湿粉处理(见实施例25)7天后,使植物离开灌溉系统, 不再浇水。使其再生长,并观察其表型。14天后BTH处理的植物继 续生长,看起来象灌溉的对照植物,而用湿粉处理的植物完全干枯。BTH 处理的植物继续生长,并可以产种子。因此耐旱性与海藻糖生物合成 基因的表达和海藻糖的积累有关。 实施例32:玉米海藻糖-6-磷酸合酶基因的分离

选择简并寡核苷酸AFOR、BFOR和EREV,因为它们位于拟南 芥海藻糖-6-磷酸合酶和酵母海藻糖-6-磷酸合酶之间保守的序列中。简 并寡核苷酸AFOR:5’-TIT GGC CIT(A/C)TIT TT(C)C AC(T)T AC(T)-3’,SEQ ID NO:39,(I代表肌苷,括号中的碱基代表简并 寡核苷酸中括号前位点的另外的碱基),编码肽L(I)WPL(I)FHY,SEQ ID NO:40,(括号中的氨基酸代表肽中括号之前位点的另外氨基酸), 简并寡核苷酸EREV:5’-CCA IGG G(A)TT IAC IC(A)T(G)T(G/A)AT IGC ICC-3’,SEQ ID NO:41,互补于编码肽GAIR(I)VNPW,SEQ ID NO:42的DNA序列,在PCR反应中使用它们从切割的玉米c-DNA 文库(Stratagene,La Jolla,CA,Cat Nr.937005)中扩增海藻糖-6-磷 酸合酶。PCR条件根据厂商(Perkin Elmer),使用4mM MgCl2,30”/90 ℃、2’/60℃、2’/72℃25个循环。扩增大约1000bp的片段,用标准 技术从琼脂糖凝胶中纯化,用TOPO TA克隆试剂盒(Invitrogen)将 其克隆到载体中。用简并寡核苷酸BFOR进行相似的反应:5’-TGG G(A)TI CAI GAC(T)TAC(T)CAC(T)T(C)TI ATG-3’,SEQ ID NO: 43,编码肽WV(I)H(Q)DYHLM,SEQ ID NO:44。扩增大约850bp 的DNA片段,用标准技术从琼脂糖凝胶中纯化,用TOPO TA克隆试 剂盒(Invitrogen)将其克隆到载体中。用引物BFOR和EREV反应 获得的片段称为BE3,并测序(SEQ ID NO:45)。基于BE3核苷酸 序列的预测的翻译多肽(SEQ ID NO:46)含有保守的氨基酸结构域。

用BE3探针按照标准技术筛查玉米c-DNA文库(例如,Sambrook 等人,编,《分子克隆》,冷泉港实验室出版社(1989))。以大约 10000个噬斑的密度将该文库平板接种于培养皿上,并在37℃生长过 夜后制备噬斑的过滤片(lift)。用随机引物法用32P-dCTP标记的BE3 探针之一探查该噬斑片。杂交条件是7%十二烷基硫酸钠(SDS)、0.5M NaPO4 pH7.0、1mM EDTA,50℃。杂交过夜后,用0.2×SSC、1%SDS 洗涤滤片。用放射自显影术检测阳性杂交噬斑。纯化为单噬斑后,分 离cDNA插入片段,并测定其序列。

分离出三个独立的c-DNA克隆,其包含SEQ ID NO:47(克隆 4.11)、SEQ ID NO:49(克隆6)和SEQ ID NO:51(克隆9)所 示的核苷酸序列。 实施例33:玉米海藻糖-6-磷酸合酶基因的Southern印迹分析

用标准方法从无菌条件下生长的小植物中纯化基因组玉米DNA。 纯化的DNA用EcoRⅠ、HindⅢ和SpeⅠ消化,进行琼脂糖凝胶电泳, 并转移到膜上。该膜用放射性标记的BE3片段探针杂交。检测到的几 条带显示BE3对应于至少一种玉米基因。

上述公开的实施方案是说明性的。本发明的公开内容将使本领域 的技术人员知道本发明的多种变化。所有这些明显且可预测的变化都 包括于附加的权利要求书中。

序列表 <110>Novartis AG <120>海藻糖生物合成基因在植物中的表达 <130>S-30427/A/CGC 1990 <140> <141> <150>US 60/077665 <151>1998-03-11 <160>52 <170>PatentIn Ver.2.0 <210>1 <211>37 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>1 gtcagccatg gcaagtcgtt tagtcgtagt atctaac                        37 <210>2 <211>24 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>2 gcaaatggca acaggtgata atcg                                      24 <210>3 <211>33 <212>DNA <213>人序列 <220> <223>人工序列描述:寡核苷酸 <400>3 gtcagccatg gtgacagaac cgttaaccga aac                            33 <210>4 <211>24 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>4 gtgcgtcaag ctccaccatt gagc                                      24 <210>5 <211>28 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>5 taacggccgc gcccaatcat tccggata                                  28 <210>6 <211>28 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>6 taactgcaga aagaaggccc ggctccaa                                  28 <210>7 <211>28 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>7 cgcctgcagt cgcactatta cggatatg                                  28 <210>8 <211>28 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>8 cgccgtacga aatccttccc gatacctc                                  28 <210>9 <211>30 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>9 gccagaattc gccgtcgttc aatgagaatg                                30 <210>10 <211>45 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>10 gccttcatga tccctcccta caactatcca ggcgcttcag attcg               45 <210>11 <211>26 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>11 cgcgactagt tcaaccgaaa ttcaat                                    26 <210>12 <211>26 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>12 cgctctgcag ttcaatggaa gcaatg                                    26 <210>13 <211>18 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>13 accgtaaggc ttgatgaa                                             18 <210>14 <211>27 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>14 cccactagtt tgaacgaatt gttagac                                   27 <210>15 <211>26 <212>DNA  <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>15 cccgaattca tcccgcgaaa ttaata                                    26 <210>16 <211>33 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>16 cggccatggg tatatctcct tcttaaagtt aaa                            33 <210>17 <211>30 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>17 gcgaagcttg ctgagcaata actagcataa                                30 <210>18 <211>28 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>18 gcgctgcagt ccggatatag ttcctcct                                  28 <210>19 <211>31 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>19 gcgactagtt agtgttagtc taaatctagt t                              31 <210>20 <211>30 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>20 ccgcaagctt ctaataaaaa atatatagta                                30 <210>21 <211>24 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>21 ctagtggggg gggggggggg ggga                                      24 <210>22 <211>24 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>22 agcttccccc cccccccccc ccca                                      24 <210>23 <211>28 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>23 tgaccatggc aagtcgttta gtcgtagt                                  28 <210>24 <211>15 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>24 agcaaccgctt catag                                               15 <210>25 <211>16 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>25 gcgttcctgg attgtc                                               16 <210>26 <211>37 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>26 gggtctagag attcacgcga gctttggaaa ggtagca                        37 <210>27 <211>27 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>27 gtcgccatgg tgacagaacc gttaacc                                   27 <210>28 <211>19 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>28 gttcgcccga taaagggag                                            19 <210>29 <211>18 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>29 tagcgcaacg tattactc                                             18 <210>30 <211>35 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>30 gcctctagac tcatcattag atactacgac taaac                          35 <210>31 <211>67 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>31 ctagtgggag accacaacgcg tttccctcta gaaataattt tgtttaagtt taagaagggg   60 agagaat                                                              67 <210>32 <211>67 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>32 catgattctc tccccttctt aaacttaaac aaaattattt ctagagggaa accgttgtgg    60 tctccca                                                              67 <210>33 <211>31 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>33 gcggaattca tacttattta tcattagaaa g                              31 <210>34 <211>30 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>34 gcgccatggt aaatgaaaga aagaactaaa                                30 <210>35 <211>30 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>35 gcgtctagat caaccgaaat tcaattaagg                                30 <210>36 <211>27 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>36 cgcaagcttc aatggaagca atgataa                                   27 <210>37 <211>28 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>37 catggcttcc tcagttcttt cctctgca                                  28 <210>38 <211>20 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <400>38 gaggaaagaa ctgaggaagc                                           20 <210>39 <211>20 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <220> <221>修饰的碱基 <222>(2) <223>i <220> <221>修饰的碱基 <222>(8) <223>i <220> <221>修饰的碱基 <222>(11) <223>i <400>39 tntggccnht nttycaytay                                           20 <210>40 <211>7 <212>PRT <213>人工序列 <220> <223>人工序列描述:肽 <220> <221>肽 <222>(1) <223>Xaa是Leu或Ile <220> <221>肽 <222>(4) <223>Xaa是Leu或Ile <400>40 Xaa Trp Pr0 Xaa Phe His Tyr   1               5 <210>41 <211>24 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <220> <221>修饰的碱基 <222>(4) <223>i <220> <221>修饰的碱基 <222>(10) <223>i <220> <221>修饰的碱基 <222>(13) <223>i <220> <221>修饰的碱基 <222>(19) <223>i <220> <221>修饰的碱基 <222>(22) <223>i <400>41 ccanggrttn acnmkdatng cncc                                       24 <210>42 <211>8 <212>PRT <213>人工序列 <220> <223>人工序列描述:肽 <220> <221>肽 <222>(4) <223>Xaa是Arg或Ile <400>42 Gly Ala Ile Xaa Val Asn Pro Trp   1               5 <210>43 <211>24 <212>DNA <213>人工序列 <220> <223>人工序列描述:寡核苷酸 <220> <221>修饰的碱基 <222>(6) <223>i <220> <221>修饰的碱基 <222>(9) <223>i <220> <221>修饰的碱基 <222>(21) <223>i <400>43 tggrtncang aytaycayyt natg                                      24 <210>44 <211>8 <212>PRT <213>人工序列 <220> <223>人工序列描述:肽 <220> <221>肽 <222>(2) <223>Xaa是Val或Ile <220> <221>肽 <222>(3) <223>Xaa是His或Gln <400>44 Trp Xaa Xaa Asp Tyr His Leu Met   1               5 <210>45 <211>831 <212>DNA <213>玉蜀黍 <220> <221>misc_feature <222>(1)..(24) <223>引物BFOR中的保守基元(如序列

BE3:WVQDYHIM) <220> <221>misc_feature <222>(808)..(831) <223>引物EREV中的保守基元(如序列

BE3:GAILVNPW) <220> <221>CDS <222>(1)..(831) <400>45 tgg gtg cag gac tac cac ctg atg ttt ctg ccc aag tgc ctc aag gac   48 Trp Val Gln Asp Tyr His Leu Met Phe Leu Pro Lys Cys Leu Lys Asp   1               5                  10                  15 cat gac atc aat atg aag gtc ggg tgg ttc ctg cac acg ccg ttc ccg   96 His Asp Ile Asn Met Lys Val Gly Trp Phe Leu His Thr Pro Phe Pro

         20                  25                  30 tca tca gag att tac cgg aca ctg ccg tcc cgc ttg gag ctg ctt cgg   144 Ser Ser Glu Ile Tyr Arg Thr Leu Pro Ser Arg Leu Glu Leu Leu Arg

     35                  40                  45 tcg gtg ctg tgt gcc gat tta gtt gga ttt cat act tac gac tat gcg   192 Ser Val Leu Cys Ala Asp Leu Val Gly Phe His Thr Tyr Asp Tyr Ala

 50                  55                  60 agg cat ttt gtg agt gct tgc act aga ata ctt gga ctt gag ggt acc   240 Arg His Phe Val Ser Ala Cys Thr Arg Ile Leu Gly Leu Glu Gly Thr  65                  70                  75                  80 cct gag ggc gtt gaa gat caa gga agg cta acc agg gtt gca gcg ttt   288 Pro Glu Gly Val Glu Asp Gln Gly Arg Leu Thr Arg Val Ala Ala Phe

             85                  90                  95 cct att ggg ata gac tct gat cgt ttc aag cga gca ttg gag ctt cca   336 Pro Ile Gly Ile Asp Ser Asp Arg Phe Lys Arg Ala Leu Glu Leu Pro

        100                 105                 110 gca gtg aaa agg cac gtc agt gaa ttg aca gaa cgt ttt gcc ggt cga   384 Ala Val Lys Arg His Val Ser Glu Leu Thr Glu Arg Phe Ala Gly Arg

    115                 120                 125 aag gta atg ctt ggt gtt gac cga ctc gac atg att aag gga att ccg   432 Lys Val Met Leu Gly Val Asp Arg Leu Asp Met Ile Lys Gly Ile Pro

130                 135                 140 caa aag att ttg gcc ttt gaa aag ttt ctt gag gaa aac cca gac tgg   480 Gln Lys Ile Leu Ala Phe Glu Lys Phe Leu Glu Glu Asn Pro Asp Trp 145                 150                 155                 160 aac aac aaa gtt gtt cta ctg cag att gct gtg cca aca aga act gac   528 Asn Asn Lys Val Val Leu Leu Gln Ile Ala Val Pro Thr Arg Thr Asp

            165                 170                 175 gtc cct gaa tat caa aag cta acg agc caa gtg cat gaa att gtt ggg   576 Val Pro Glu Tyr Gln Lys Leu Thr Ser Gln Val His Glu Ile Val Gly

        180                 185                 190 cgc ata aac ggt cga ttt gga acg ttg act gct gtc cct att cat cat   624 Arg Ile Asn Gly Arg Phe Gly Thr Leu Thr Ala Val Pro Ile His His

    195                 200                 205 ctg gac cga tct ctt gat ttc cat gcc ttg tgt gct ctt tat gca gtc   672 Leu Asp Arg Ser Leu Asp Phe His Ala Leu Cys Ala Leu Tyr Ala Val

210                 215                 220 act gat gtt gct ctt gta aca tca ctg aga gat ggg atg aac ctt gtg   720 Thr Asp Val Ala Leu Val Thr Ser Leu Arg Asp Gly Met Asn Leu Val 225                 230                 235                 240 agc tat gaa tat gtt gca tgc caa ggg tct aag aaa gga gtt ctg ata   768 Ser Tyr Glu Tyr Val Ala Cys Gln Gly Ser Lys Lys Gly val Leu Ile

            245                 250                 255 ctt agc gag ttt gct ggg gca gca caa tca ctt gga gct ggc gcc att   816 Leu Ser Glu Phe Ala Gly Ala Ala Gln Ser Leu Gly Ala Gly Ala Ile

        260                 265                 270 ctc gtc aac ccc tgg                                               831 Leu Val Asn Pro Trp

    275 <210>46 <211>277 <212>PRT <213>玉蜀黍 <400>46 Trp Val Gln Asp Tyr His Leu Met Phe Leu Pro Lys Cys Leu Lys Asp   1               5                  10                  15 His Asp Ile Asn Met Lys Val Gly Trp Phe Leu His Thr Pro Phs Pro

         20                  25                  30 Ser Ser Glu Ile Tyr Arg Thr Leu Pro Ser Arg Leu Glu Leu Leu Arg

     35                  40                  45 Ser Val Leu Cys Ala Asp Leu Val Gly Phe His Thr Tyr Asp Tyr Ala

 50                  55                  60 Arg His Phe Val Ser Ala Cys Thr Arg Ile Leu Gly Leu Glu Gly Thr  65                  70                  75                  80 Pro Glu Gly Val Glu Asp Gln Gly Arg Leu Thr Arg Val Ala Ala Phe

             85                  90                  95 Pro Ile Gly Ile Asp Ser Asp Arg Phe Lys Arg Ala Leu Glu Leu Pro

        100                 105                 110 Ala Val Lys Arg His Val Ser Glu Leu Thr Glu Arg Phe Ala Gly Arg

    115                 120                 125 Lys Val Met Leu Gly Val Asp Arg Leu Asp Met Ile Lys Gly Ile Pro

130                 135                 140 Gln Lys Ile Leu Ala Phe Glu Lys Phe Leu Glu Glu Asn Pro Asp Trp 145                 150                 155                 160 Asn Asn Lys Val Val Leu Leu Gln Ile Ala Val Pro Thr Arg Thr Asp

            165                 170                 175 Val Pro Glu Tyr Gln Lys Leu Thr Ser Gln Val His Glu Ile Val Gly

        180                 185                 190 Arg Ile Asn Gly Arg Phe Gly Thr Leu Thr Ala Val Pro Ile His His

    195                 200                 205 Leu Asp Arg Ser Leu Asp Phe His Ala Leu Cys Ala Leu Tyr Ala Val

210                 215                 220 Thr Asp Val Ala Leu Val Thr Ser Leu Arg Asp Gly Met Asn Leu Val 225                 230                 235                 240 Ser Tyr Glu Tyr Val Ala Cys Gln Gly Ser Lys Lys Gly Val Leu Ile

            245                 250                 255 Leu Ser Glu Phe Ala Gly Ala Ala Gln Ser Leu Gly Ala Gly Ala Ile

        260                 265                 270 Leu Val Asn Pro Trp

    275 <210>47 <211>1753 <212>DNA <213>玉蜀黍 <220> <221>misc feature <222>(106)..(129) <223>引物EREV中的保守基元 <220> <221>CDS <222>(1)..(1413) <223>部分推断的编码序列 <400>47 cgg ggg atg aac ctt gtg agc tat gaa tat gtt gca tgc caa ggg tct   48 Arg Gly Met Asn Leu Val Ser Tyr Glu Tyr Val Ala Cys Gln Gly Ser   1               5                  10                  15 aag aaa gga gtt ctg ata ctt agc gag ttt gct ggg gca gca caa tca   96 Lys Lys Gly Val Leu Ile Leu Ser Glu Phe Ala Gly Ala Ala Gln Ser

         20                  25                  30 ctt gga gct ggt gcc att cta gta aac cct tgg aat att aca gaa gtt   144 Leu Gly Ala Gly Ala Ile Leu Val Asn Pro Trp Asn Ile Thr Glu Val

     35                  40                  45 gca gac tca ata cgg cat gct tta acg atg cca tcc gat gag aga gag   192 Ala Asp Ser Ile Arg His Ala Leu Thr Met Pro Ser Asp Glu Arg Glu

 50                  55                  60 aaa cga cac aga cac aac tac gca cat gtc aca act cac acg gct caa   240 Lys Arg His Arg His Asn Tyr Ala His Val Thr Thr His Thr Ala Gln  65                  70                  75                  80 gat tgg gct gaa act ttt gta ttt gag cta aat gac acg gtt gct gaa   288 Asp Trp Ala Glu Thr Phe Val Phe Glu Leu Asn Asp Thr Val Ala Glu

             85                  90                  95 gca cta ctg agg aca aga caa gtt cct cct ggt ctt cct agt caa atg   336 Ala Leu Leu Arg Thr Arg Gln Val Pro Pro Gly Leu Pro Ser Gln Met

        100                 105                 110 gca att cag caa tat ttg cgc tct aaa aat cgt ctg ctc ata ttg ggt   384 Ala Ile Gln Gln Tyr Leu Arg Ser Lys Asn Arg Leu Leu Ile Leu Gly

    115                 120                 125 ttc aat tcg aca ttg act gag cca gtc gaa tcc tct ggg aga agg ggt   432 Phe Asn Ser Thr Leu Thr Glu Pro Val Glu Ser Ser Gly Arg Arg Gly

130                 135                 140 ggt gac caa atc aag gaa atg gsa ctc aag ttg cat cct gactta aag   480 Gly Asp Gln Ile Lys Glu Met Glu Leu Lys Leu His Pro Asp Leu Lys 145                 150                 155                 160 ggt cct ctg aga gcc ctc tgt gag gat gag cgc act aca gtt att gtt   528 Gly Pro Leu Arg Ala Leu Cys Glu Asp Glu Arg Thr Thr Val Ile Val

            165                 170                 175 ctt agc ggc agt gac agg agt gtt ctt gat gaa aat ttt gga gaa ttt   576 Leu Ser Gly Ser Asp Arg Ser Val Leu Asp Glu Asn Phe Gly Glu Phe

        180                 185                 190 aaa atg tgg ttg gcg gca gag cat ggg atg ttt tta cgc ccg act tac   624 Lys Met Trp Leu Ala Ala Glu His Gly Met Phe Leu Arg Pro Thr Tyr

    195                 200                 205 gga gaa tgg atg aca aca atg cct gag cat ctg aac atg gat tgt gtt   672 Gly Glu Trp Met Thr Thr Met Pro Glu His Leu Asn Met Asp Cys Val

210                 215                 220 gac agc gta aag cat gtt ttt gaa tac ttt aca gaa aga acc cca aga   720 Asp Ser Val Lys His Val Phe Glu Tyr Phe Thr Glu Arg Thr Pro Arg 225                 230                 235                 240 tcc cat ttc gaa cat cgt gaa aca tca ttt gtg tgg aac tat aag tat   768 Ser His Phe Glu His Arg Glu Thr Ser Phe Val Trp Asn Tyr Lys Tyr

            245                 250                 255 gct gat gtt gag ttc gga agg cta caa gca aga gat atg ctg cag cac   816 Ala Asp Val Glu Phe Gly Arg Leu Gln Ala Arg Asp Met Leu Gln His

        260                 265                 270 ttg tgg aca ggt ccg atc tca aat gca gct gtt gat gtt gtt caa ggg   864 Leu Trp Thr Gly Pro Ile Ser Asn Ala Ala Val Asp Val Val Gln Gly

    275                 280                 285 agt cga tca gtt gaa gtt cgg tct gtt gga gtt acc aag ggt gct gca   912 Ser Arg Ser Val Glu Val Arg Ser Val Gly Val Thr Lys Gly Ala Ala

290                 295                 300 att gat cgt att tta ggg gag ata gtt cac agc gaa aac atg att act   960 Ile Asp Arg Ile Leu Gly Glu Ile Val His Ser Glu Asn Met Ile Thr 305                 310                 315                 320 cca att gac tat gtc ctg tgc ata ggg cat ttc ctt ggg aag gat gag   1008 Pro Ile Asp Tyr Val Leu Cys Ile Gly His Phe Leu Gly Lys Asp Glu

            325                 330                 335 gac atc tac gtc ttc ttt gat ccc gag tac cct tct gaa tcc aaa gta   1056 Asp Ile Tyr Val Phe Phe Asp Pro Glu Tyr Pro Ser Glu Ser Lys Val

        340                 345                 350 aag cca gag ggc ggc tca gca tca ctt gac cgg agg ccg aac ggg agg   1104 Lys Pro Glu Gly Gly Ser Ala Ser Leu Asp Arg Arg Pro Asn Gly Arg

    355                 360                 365 cca cca tcg aat ggc agg agt aac tcc agg aac cca cag tcc agg aca   1152 Pro Pro Ser Asn Gly Arg Ser Asn Ser Arg ASn Pro Gln Ser Arg Thr

370                 375                 380 cag aag gcg cag cag gct gca tcc gag agg tca tcc tca tca agt cac   1200 Gln Lys Ala Gln Gln Ala Ala Ser Glu Arg Ser Ser Ser Ser Ser His 385                 390                 395                 400 agc agc acg agc agc aac cac gac tgg cgc gaa ggg tcc tcg gtc ctt   1248 Ser Ser Thr Ser Ser Asn His Asp Trp Arg Glu Gly Ser Ser Val Leu

            405                 410                 415 gat ctc aag ggc gag aac tac ttc tcc tgc gcc gtc ggg agg aag cgg   1296 Asp Leu Lys Gly Glu Asn Tyr Phe Ser Cys Ala Val Gly Arg Lys Arg

        420                 425                 430 tct aac gcc cgc tac ttg ctg agc tcg tcg gag gag gtt gtc tcc ttc   1344 Ser Asn Ala Arg Tyr Leu Leu Ser Ser Ser Glu Glu Val Val Ser Phe

    435                 440                 445 ctc aaa gag ttg gcg aca gcg aca gct ggc ttc cag gcc acc tgt gct   1392 Leu Lys Glu Leu Ala Thr Ala Thr Ala Gly Phe Gln Ala Thr Cys Ala

450                 455                 460 gac tac atg cat gtt ctt gga taggcagtaa atagactgaa gttgaagcct      1443 Asp Tyr Met His Val Leu Gly 465                 470 ccgtgcttta ccagagacag agagaagaag aatattcatt cctcgtatgc gcgacagagc 1503 tacacccgta gctagtcagc gtgctgtaca atcatgtaca aaatttatgc tcgtgataaa 1563 actgcgagag gggagctagc aaatgggaaa ggataaagga gtttagttgc ttctggtacg 1623 agacacaatc gcctgatttt gagttctctt taaaaaaaaa cccaaaaaaa aaaaaaaaaa 1683 aaactcgagg gggggcccgg taancnttcg cggttttgcg aaatgatttc aacgnngatn 1743 ngcctccgct                                                        1753 <210>48 <211>471 <212>PRT <213>玉蜀黍 <400>48 Arg Gly Met Asn Leu Val Ser Tyr Glu Tyr Val Ala Cys Gln Gly Ser   1               5                  10                  15 Lys Lys Gly Val Leu Ile Leu Ser Glu Phe Ala Gly Ala Ala Gln Ser

         20                  25                  30 Leu Gly Ala Gly Ala Ile Leu Val Asn Pro Trp Asn Ile Thr Glu Val

     35                  40                  45 Ala Asp Ser Ile Arg His Ala Leu Thr Met Pro Ser Asp Glu Arg Glu

 50                  55                  60 Lys Arg His Arg His Asn Tyr Ala His Val Thr Thr His Thr Ala Gln  65                  70                  75                  80 Asp Trp Ala Glu Thr Phe Val Phe Glu Leu Asn Asp Thr Val Ala Glu

             85                  90                  95 Ala Leu Leu Arg Thr Arg Gln Val Pro Pro Gly Leu Pro Ser Gln Met

        100                 105                 110 Ala Ile Gln Gln Tyr Leu Arg Ser Lys Asn Arg Leu Leu Ile Leu Gly

    115                 120                 125 Phe Asn Ser Thr Leu Thr Glu Pro Val Glu Ser Ser Gly Arg Arg Gly

130                 135                 140 Gly Asp Gln Ile Lys Glu Met Glu Leu Lys Leu His Pro Asp Leu Lys 145                 150                 155                 160 Gly Pro Leu Arg Ala Leu Cys Glu Asp Glu Arg Thr Thr Val Ile Val

            165                 170                 175 Leu Ser Gly Ser Asp Arg Ser Val Leu Asp Glu Asn Phe Gly Glu Phe

        180                 185                 190 Lys Met Trp Leu Ala Ala Glu His Gly Met Phe Leu Arg Pro Thr Tyr

    195                 200                 205 Gly Glu Trp Met Thr Thr Met Pro Glu His Leu Asn Met Asp Cys Val

210                 215                 220 Asp Ser Val Lys His Val Phe Glu Tyr Phe Thr Glu Arg Thr Pro Arg 225                 230                 235                 240 Ser His Phe Glu His Arg Glu Thr Ser Phe Val Trp Asn Tyr Lys Tyr

            245                 250                 255 Ala Asp Val Glu Phe Gly Arg Leu Gln Ala Arg Asp Met Leu Gln His

        260                 265                 270 Leu Trp Thr Gly Pro Ile Ser Asn Ala Ala Val Asp Val Val Gln Gly

    275                 280                 285 Ser Arg Ser Val Glu Val Arg Ser Val Gly Val Thr Lys Gly Ala Ala

290                 295                 300 Ile Asp Arg Ile Leu Gly Glu Ile Val His Ser Glu Asn Met  Ile Thr 305                 310                 315                 320 Pro Ile Asp Tyr Val Leu Cys Ile Gly His Phe Leu Gly Lys Asp Glu

            325                 330                 335 Asp Ile Tyr Val Phe Phe Asp Pro Glu Tyr Pro Ser Glu Ser Lys Val

        340                 345                 350 Lys Pro Glu Gly Gly Ser Ala Ser Leu Asp Arg Arg Pro Asn Gly Arg

    355                 360                 365 Pro Pro Ser Asn Gly Arg Ser Asn Ser Arg Asn Pro Gln Ser Arg Thr

370                 375                 380 Gln Lys Ala Gln Gln Ala Ala Ser Glu Arg Ser Ser Ser Ser Ser His 385                 390                 395                 400 Ser Ser Thr Ser Ser Asn His Asp Trp Arg Glu Gly Ser Ser Val Leu

            405                 410                 415 Asp Leu Lys Gly Glu Asn Tyr Phe Ser Cys Ala Val Gly Arg Lys Arg

        420                 425                 430 Ser Ash Ala Arg Tyr Leu Leu Ser Ser Ser Glu Glu Val Val Ser Phe

    435                 440                 445 Leu Lys Glu Leu Ala Thr Ala Thr Ala Gly Phe Gln Ala Thr Cys Ala

450                 455                 460 Asp Tyr Met His Val Leu Gly 465                 470 <210>49 <211>1558 <212>DNA <213>玉蜀黍 <220> <221>CDS <222>(177)..(1268) <223>推断的编码序列 <400>49     cggagtattc tagtgcaagc actcacaaaa tgcctcgcat agtcgtaagt atggaatcca 60 actaaatcag cacatagcac cgaccgaagc agctccaagc gggacggaag tgtccggtaa  120 atctctgatg acgggaatgg tgtgtgcagg aaccacccga ccttcatatt gatgtc atg  179

                                                          Met

                                                            1 gtc ctt gag gca ctt ggg cag gaa cat gag gtg gta gtc atg aca cca    227 Val Leu Glu Ala Leu Gly Gln Glu His Glu Val Val Val Met Thr Pro

          5                  10                  15 gat tac atc ccc ctc ctg gta gtg ctg gta cac gac atc agc gaa cat    275 Asp Tyr Ile Pro Leu Leu Val Val Leu Val His Asp Ile Ser Glu His

     20                  25                  30 ctg gtt agc acg ctt ata cgc gtc gaa atg gaa ctc aag ttg cat cct    323 Leu Val Ser Thr Leu Ile Arg Val Glu Met Glu Leu Lys Leu His Pro

 35                  40                  45 gac tta aag ggt cct ctg gga gcc ctc tgt gag gat gag cgc act aca    371 Asp Leu Lys Gly Pro Leu Gly Ala Leu Cys Glu Asp Glu Arg Thr Thr  50                  55                  60                  65 gtt att gtt ctt agt ggc agt gac agg agt gtt ctt gat gaa aat ttt    419 Val Ile Val Leu Ser Gly Ser Asp Arg Ser Val Leu Asp Glu Asn Phe

             70                  75                  80 gga gaa ttc aaa atg tgg ttg gca gca gag cat ggg atg ttt tta cgc    467 Gly Glu Phe Lys Met Trp Leu Ala Ala Glu His Gly Met Phe Leu Arg

         85                  90                  95 ccg act tat gga gaa tgg atg aca aca atg cct gag cat ctg aac atg    515 Pro Thr Tyr Gly Glu Trp Met Thr Thr Met Pro Glu His Leu Asn Met

    100                 105                 110 gat tgg gta gac agc gta aag cat gtt ttc gaa tac ttt aca gaa aga   563 Asp Trp Val Asp Ser Val Lys His Val Phe Glu Tyr Phe Thr Glu Arg

115                 120                 125 acc cca aga tcc cat ttt gaa cat cgt gaa aca tca ttt gtg tgg aac   611 Thr Pro Arg Ser His Phe Glu His Arg Glu Thr Ser Phe Val Trp Asn 130                 135                 140                 145 tac aag tat gct gat gtt gaa ttt gga agg cta caa gca aga gat atg   659 Tyr Lys Tyr Ala Asp Val Glu Phe Gly Arg Leu Gln Ala Arg Asp Met

            150                 155                 160 ctg cag cac ttg tgg aca ggt ccg atc tca aat gca gct gtt gat gtt   707 Leu Gln His Leu Trp Thr Gly Pro Ile Ser Asn Ala Ala Val Asp Val

        165                 170                 175 gtt caa ggg agt cgg tca gtt gaa gtc cgg tct gtt gga gtt aca aag   755 Val Gln Gly Ser Arg Ser Val Glu Val Arg Ser Val Gly Val Thr Lys

    180                 185                 190 ggt gct gca att gat cgt att tta ggg gag ata gtt cac agc gaa aac   803 Gly Ala Ala Ile Asp Arg Ile Leu Gly Glu Ile Val His Ser Glu Asn

195                 200                 205 atg gtt act cca att gat tat gtc ctg tgt ata ggg cat ttc ctt ggg   851 Met Val Thr Pro Ile Asp Tyr Val Leu Cys Ile Gly His Phe Leu Gly 210                 215                 220                 225 aag gat gag gac atc tat gtc ttt ttt gat ccg gsa tac cct tct gaa   899 Lys Asp Glu Asp Ile Tyr Val Phe Phe Asp Pro Glu Tyr Pro Ser Glu

            230                 235                 240 tcc aaa gta aaa cca gag ggt ggg tca gca tca ctt gac cgg agg cca   947 Ser Lys Val Lys Pro Glu Gly Gly Ser Ala Ser Leu Asp Arg Arg Pro

        245                 250                 255 aat gga agg ccg gca tcg aat ggc aga agc aat tca agg aac cca cag   995 Asn Gly Arg Pro Ala Ser Asn Gly Arg Ser Asn Ser Arg Asn Pro Gln

    260                 265                 270 tcc agg cca cag aag gcg cag cag gct gca tcc gag agg tcg tcc tca   1043 Ser Arg Pro Gln Lys Ala Gln Gln Ala Ala Ser Glu Arg Ser Ser Ser

275                 280                 285 tca agt cac agc agc act agc agc aac cac gac tgg cgc gaa ggg tcc   1091 Ser Ser His Ser Ser Thr Ser Ser Asn His Asp Trp Arg Glu Gly Ser 290                 295                 300                 305 tcg gtc ctc gat ctc aag gcc gag aac tac ttc tcc tgc gcc gtc gga   1139 Ser Val Leu Asp Leu Lys Ala Glu Asn Tyr Phe Ser Cys Ala Val Gly

            310                 315                 320 agg aag cgg tcc aac gcc cgt tac ctg ctg agt tcg tcg gag gag gtc   1187 Arg Lys Arg Ser Asn Ala Arg Tyr Leu Leu Ser Ser Ser Glu Glu Val

        325                 330                 335 gtc tcc ttc ctc aaa gag ttg gca acg gaa aca gct ggc ttc cag tcc   1235 Val Ser Phe Leu Lys Glu Leu Ala Thr Glu Thr Ala Gly Phe Gln Ser

    340                 345                 350 agc tgt gct gat tac atg ttc ttg gat agg cag taaatagatt ggagcctccg 1288 Ser Cys Ala Asp Tyr Met Phe Leu Asp Arg Gln

355                 360 tgctttgcca gacaagcaca ctggaggggg ggaaaaccca ttcattcctc aaatgcgcga 1348 cggagttaca cccagcgtgt tgtacaatcc tgtacaaaat ttatgctcgt gataaaactg 1408 cgagagggtg gagcaaatgg aaaaggataa aattagttta gatttagggt ctgttcgtcg 1468 caccaaaaat tgttccagtt gatcaaaatt tatacaaatt agagaagtaa tccgactcgg 1528 aacagttccg gtaaaaaaaa aaaaaaaaaa                                  1558 <210>50 <211>364 <212>PRT <213>玉蜀黍 <400>50 Met Val Leu Glu Ala Leu Gly Gln Glu His Glu Val Val Val Met Thr   1               5                  10                  15 Pro Asp Tyr Ile Pro Leu Leu Val Val Leu Val His Asp Ile Ser Glu

         20                  25                  30 His Leu Val Ser Thr Leu Ile Arg Val Glu Met Glu Leu Lys Leu His

     35                  40                  45 Pro Asp Leu Lys Gly Pro Leu Gly Ala Leu Cys Glu Asp Glu Arg Thr

 50                  55                  60 Thr Val Ile Val Leu Ser Gly Ser Asp Arg Ser Val Leu Asp Glu Asn  65                  70                  75                  80 Phe Gly Glu Phe Lys Met Trp Leu Ala Ala Glu His Gly Met Phe Leu

             85                  90                  95 Arg Pro Thr Tyr Gly Glu Trp Met Thr Thr Met Pro Glu His Leu Asn

        100                 105                 110 Met Asp Trp Val Asp Ser Val Lys His Val Phe Glu Tyr Phe Thr Glu

    115                 120                 125 Arg Thr Pro Arg Ser His Phs Glu His Arg Glu Thr Ser Phe Val Trp

130                 135                 140 Asn Tyr Lys Tyr Ala Asp Val Glu Phe Gly Arg Leu Gln Ala Arg Asp 145                 150                 155                 160 Met Leu Gln His Leu Trp Thr Gly Pro Ile Ser Asn Ala Ala Val Asp

            165                 170                 175 Val Val Gln Gly Ser Arg Ser Val Glu Val Arg Ser Val Gly Val Thr

        180                 185                 190 Lys Gly Ala Ala Ile Asp Arg Ile Leu Gly Glu Ile Val His Ser Glu

    195             200                     205 Asn Met Val Thr Pro Ile Asp Tyr Val Leu Cys Ile Gly His Phe Leu

210                 215                 220 Gly Lys Asp Glu Asp Ile Tyr Val Phe Phe Asp Pro Glu Tyr Pro Ser 225                 230                 235                 240 Glu Ser Lys Val Lys Pro Glu Gly Gly Ser Ala Ser Leu Asp Arg Arg

            245                 250                 255 Pro Asn Gly Arg Pro Ala Ser Asn Gly Arg Ser Asn Ser Arg Asn Pro

        260                 265                 270 Gln Ser Arg Pro Gln Lys Ala Gln Gln Ala Ala Ser Glu Arg Ser Ser

    275                 280                 285 Ser Ser Ser His Ser Ser Thr Ser Ser Asn His Asp Trp Arg Glu Gly

290                 295                 300 Ser Ser Val Leu Asp Leu Lys Ala Glu Asn Tyr Phe Ser Cys Ala Val 305                 310                 315                 320 Gly Arg Lys Arg Ser Asn Ala Arg Tyr Leu Leu Ser Ser Ser Glu Glu

            325                 330                 335 Val Val Ser Phe Leu Lys Glu Leu Ala Thr Glu Thr Ala Gly Phe Gln

        340                 345                 350 Ser Ser Cys Ala Asp Tyr Met Phe Leu Asp Arg Gln

    355                 360 <210>51 <211>935 <212>DNA <213>玉蜀黍 <220> <221>CDS <222>(1)..(735) <223>推断的部分编码序列 <400>51 cgg tgg aac aac aaa gtt gtt cta ctg cag att gct gtg cca aca aga   48 Arg Trp Asn Asn Lys Val Val Leu Leu Gln Ile Ala Val Pro Thr Arg   1               5                  10                  15 act gac gtc cct gaa tat caa aag cta acg agc caa gtg cat gaa atg   96 Thr Asp Val Pro Glu Tyr Gln Lys Leu Thr Ser Gln Val His Glu Met

         20                  25                  30 gcc act gtc acc gag ctc cag cgt ccc tca cgc gtc cag gcg gtg tcc   144 Ala Thr Val Thr Glu Leu Gln Arg Pro Ser Arg Val Gln Ala Val Ser

     35                  40                  45 gcc tac ttg tgg aag gtc ctc gcc gcc gtc gtg gcc gcg tgc cgc gtg   192 Ala Tyr Leu Trp Lys Val Leu Ala Ala Vel Val Ala Ala Cys Arg Val

 50                  55                  60 ccc gag gag cgg tgc tgc atg ggc tgg atg gtg gac gct cgg cgg cgg   240 Pro Glu Glu Arg Cys Cys Met Gly Trp Met Val Asp Ala Arg Arg Arg  65                  70                  75                  80 gtg aag tcg ccc gag ctg atc ccc gcg atg cgc aac tac ttc ggc aac   288 Val Lys Ser Pro Glu Leu Ile Pro Ala Met Arg Asn Tyr Phe Gly Asn

             85                  90                  95 gtc acg gcc tac gcg ctg ggc ggc gcg gcc gtg gag gag atc cgg cgg   336 Val Thr Ala Tyr Ala Leu Gly Gly Ala Ala Val Glu Glu Ile Arg Arg

        100                 105                 110 aag ccg ctg gcc gag gtg gcg gcc atg gtg cgg gat acc atc acg tcc   384 Lys Pro Leu Ala Glu Val Ala Ala Met Val Arg Asp Thr Ile Thr Ser

    115                 120                 125 ata gac tac gac gag tac ctg cag gag ctg gtg gac tgg gtg gag gtg   432 Ile Asp Tyr Asp Glu Tyr Leu Gln Glu Leu Val Asp Trp Val Glu Val

130                 135                 140 cac aag acg gag cac gtg atg gag aag ggc gtc ctc ggg ctg ggc tcg   480 His Lys Thr Glu His Val Met Glu Lys Gly Val Leu Gly Leu Gly Ser 145                 150                 155                 160 ccg acg ttg aac cag acc gtg ttc gcg tcg ttc ccg ctc gac acg aac   528 Pro Thr Leu Asn Gln Thr Val Phe Ala Ser Phe Pro Leu Asp Thr Asn

            165                 170                 175 ttc ggc ttc ggc gac gcc gcg ctc gcg ctg ccc atc tgc gac tat ggg   576 Phe Gly Phe Gly Asp Ala Ala Leu Ala Leu Pro Ile Cys Asp Tyr Gly

        180                 185                 190 agg ctt tgt tcg ggc tac ctg tcc gtc gga gcg cgg cct gga ggc gac   624 Arg Leu Cys Ser Gly Tyr Leu Ser Val Gly Ala Arg Pro Gly Gly Asp

    195                 200                 205 ggc tcc tgg ctc ctc agc gcc tac att tgg ccg cag atg gcg gcg gcg   672 Gly Ser Trp Leu Leu Ser Ala Tyr Ile Trp Pro Gln Met Ala Ala Ala

210                 215                 220 ctg gag tcg gac ggc gtc ttt aag cct ctc acg gcg gag tat ctc ggt   720 Leu Glu Ser Asp Gly Val Phe Lys Pro Leu Thr Ala Glu Tyr Leu Gly 225                 230                 235                 240 ctc aca gtc aca ccc tagcggcgac gtggtcgatc tacatgcgct gcatgcatat   775 Leu Thr Val Thr Pro

            245 cagatcagaa tcagatatcg ttcgtattgc tcattgttga ttgcatgatt gcgcgctacc 835 ttgtattgtg tacgtcgttc gtgtaataat gttgcatggt ctcgggccag tgctaaataa 895 aaatctctgt taattttctt caaaaaaaaa aaaaaaaaaa                       935 <210>52 <211>245 <212>PRT <213>玉蜀黍 <400> 52 Arg Trp Asn Asn Lys Val Val Leu Leu Gln Ile Ala Val Pro Thr Arg   1               5                  10                  15 Thr Asp Val Pro Glu Tyr Gln Lys Leu Thr Ser Gln Val His Glu Met

         20                  25                  30 Ala Thr Val Thr Glu Leu Gln Arg Pro Ser Arg Val Gln Ala Val Ser

     35                  40                  45 Ala Tyr Leu Trp Lys Val Leu Ala Ala Val Val Ala Ala Cys Arg Val

 50              55                      60 Pro Glu Glu Arg Cys Cys Met Gly Trp Met Val Asp Ala Arg Arg Arg  65                  70                  75                  80 Val Lys Ser Pro Glu Leu Ile Pro Ala Met Arg Asn Tyr Phe Gly Asn

             85                  90                  95 Val Thr Ala Tyr Ala Leu Gly Gly Ala Ala Val Glu Glu Ile Arg Arg

        100                 105                 110 Lys Pro Leu Ala Glu Val Ala Ala Met Val Arg Asp Thr Ile Thr Ser

    115                 120                 125 Ile Asp Tyr Asp Glu Tyr Leu Gln Glu Leu Val Asp Trp Val Glu Val

130                 135                 140 His Lys Thr Glu His Val Met Glu Lys Gly Val Leu Gly Leu Gly Ser 145                 150                 155                 160 Pro Thr Leu Ash Gln Thr Val Phe Ala Ser Phe Pro Leu Asp Thr Asn

            165                 170                 175 Phe Gly Phe Gly Asp Ala Ala Leu Ala Leu Pro Ile Cys Asp Tyr Gly

        180                 185                 190 Arg Leu Cys Ser Gly Tyr Leu Ser Val Gly Ala Arg Pro Gly Gly Asp

    195                 200                 205 Gly Ser Trp Leu Leu Ser Ala Tyr Ile Trp Pro Gln Met Ala Ala Ala

210                 215                 220 Leu Glu Ser Asp Gly Val Phe Lys Pro Leu Thr Ala Glu Tyr Leu Gly 225                 230                 235                 240 Leu Thr Val Thr Pro

            245

高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈