虾青素合成酶

申请号 CN00103755.2 申请日 2000-03-08 公开(公告)号 CN1266101A 公开(公告)日 2000-09-13
申请人 霍夫曼-拉罗奇有限公司; 发明人 端野立夫; 小岛一之; 世户口丰;
摘要 本 发明 涉及对从β胡萝卜素制备虾青素有用的遗传物质,比如具有虾青素合酶活性的多肽、编码虾青素合酶的DNA 片段 ,重组 生物 体等。这些新的遗传物质可以来源于Phaffia rhodozyma。本发明还提供了一种用于生产虾青素的方法。
权利要求

1.一种分离的DNA,所述DNA含有编码一种酶的核苷酸序列,所述 的酶具有优选在P.rhodozyma中催化β胡萝卜素到虾青素的反应的虾青素合 成酶的活性。
2.根据权利要求1的分离的DNA,它的特征是(a)所说的核苷酸序列 编码具有SEQ ID NO:1所示的基酸序列的所说的酶,或
(b)所说的核苷酸序列编码选自(i)等位基因变体或(ii)具有一个或多个 氨基酸的添加、插入、缺失和/或取代但仍然具有相同类型的酶活性的酶的 所说酶的变体。
3.根据权利要求1的分离的DNA,其特征在于所说的核苷酸序列是:
(i)SEQ ID NO:2中表示的核苷酸序列;
(ii)由于遗传密码的简并性,编码具有与所述核苷酸序列(i)编码的相同 的氨基酸序列的虾青素合成酶的核苷酸序列;和
(iii)在标准杂交条件下,与来自(i)或(ii)的所述核苷酸序列的互补序列杂 交的核苷酸序列。
4.根据权利要求1的分离的DNA,其特征在于所说的核苷酸序列是:
(i)SEQ ID NO:3中表示的核苷酸序列;
(ii)由于遗传密码的简并性,编码具有与所述核苷酸序列(i)编码的相同 的氨基酸序列的虾青素合成酶的核苷酸序列;和
(iii)在标准杂交条件下,与来自(i)或(ii)的核苷酸序列的互补序列杂交的 核苷酸序列。
5.一种载体或质粒,所述的载体或质粒含有如权利要求1到4的任何 一个所要求保护的分离的DNA。
6.一种宿主细胞,所述的宿主细胞是由如权利要求1到4的任何一个 所要求保护的分离的DNA或如权利要求5要求保护的载体或质粒转化或转 染的。
7.一种多肽,所述多肽是由如权利要求1到4的任何一个要求保护的 分离的DNA编码的。
8.一种用于生产具有虾青素合成酶活性的多肽的方法,该方法包括在 指导所说的酶的生产的条件下,培养如权利要求5中要求保护的转化的宿 主细胞。
9.一种用于生物生产虾青素的方法,该方法包括向合适的宿主生物体 中导入一个或多个如权利要求1到4的任何一个要求保护的分离的DNA, 在指导生产虾青素的条件下培养所获得的生物体,并且从培养物中回收虾 青素。
10.一种用于生产虾青素的方法,该方法包括在含有合适的再构成膜的 合适的反应混合物中,在有合适的电子供体存在下,将β胡萝卜素与具有虾 青素合成酶活性的多肽接触
11.根据权利要求10的方法,其中所述的多肽以再构成膜的形式存 在,而所述再构成膜是从生物膜、如微粒体或线粒体膜制备的。
12.根据权利要求10的方法,其中所述的多肽的再构成的人工膜、如 脂质体的形式存在。
13.根据权利要求10的方法,其中所说的电子供体是可以还原其反应 中心的合适的电子供体、如细胞色素P450还原酶。

说明书全文

发明涉及重组生产类胡萝卜素和其中有用的生物物质。

Phaffia rhodozyma(P.rhodozyma)是生产虾青素的生成胡萝卜素的酵母 菌株。虾青素分布于各种种类的生物体中,如动物(如火烈鸟和scarlet ibis,和鱼如虹鳟和鲑鱼),藻类和微生物。同样认识到虾青素具有强烈的 抵抗自由基的抗氧化特性,氧自由基可期望用于药物用途以保护活细胞 抵抗一些疾病、如癌症。另外,虾青素作为色剂的工业需要增加了,特别 是在养殖鱼(如鲑)的工业中,因为虾青素给予动物明显的桔红色,并且能够 满足市场上消费者的要求。

已知P.rhodozyma是作为生产虾青素的生成胡萝卜素的(carotenogenic) 酵母菌株。不同于其它生成胡萝卜素的酵母、红酵母属的种,P.rhodozyma 可以发酵一些糖如D-葡萄糖。这是来自工业应用的观点的重要特征。在最 近的分类学研究中,发现了P.rhodozyma的有性循环,并且以 Xanthophyllomyces dendrorhous的名称命名了它的远距离刺激变形态 (W.I.Golubev;酵母11,101-110,1995)。已经进行了从P.rhodozyma获得虾青 素的超级生产者的一些菌株的改良研究,但在这十年中,已经限制这样的 努为利用常规诱变和原生质体融合的方法。最近,Wery等人利用 P.rhodozyma开发了宿主载体系统,其中利用非复制质粒以多拷贝整合进入 P.rhodozyma的核糖体DNA的基因组(Wery等人,基因,184,89-97,1997)。 Verdoes等人报道了更加改良的载体以便获得P.rhodozyma的转化体以及它 的编码催化从香叶焦磷酸到β-胡萝卜素的反应的酶的三个胡萝卜素生成 基因(WO97/23633)。

胡萝卜素生成的特异的生物合成途径在重要的中间产物,法尼焦磷酸 (FPP)的点从一般的类异戊二烯途径中分支(图1)。通过P.rhodozyma中由crtE 编码的香叶焦磷酸(GGPP)合酶缩合FPP和IPP以便生成GGPP。然后,通 过起到八氢番茄红素合酶和由crtBY编码的番茄红素环化酶和crtI由编码的 八氢番茄红素去饱和酶的双倍作用的酶的连续反应将GGPP转化成β-胡 萝卜素。

在细菌中,已经分离了参与叶黄素形成的酶和基因并且详细地鉴定了 特征。由crtZ编码的β-胡萝卜素羟化酶参与了β-胡萝卜素的β紫罗环 的两个末端的两个羟化步骤。从各种生物体如噬夏孢欧文氏菌,(Misawa等 人,细菌学杂志,172,6704-6712,1990),黄杆菌的种(L.Pasamontes等人, 185(1),35-41,1997)和Agrobacterium aurantiacum(Misawa等人,细菌学杂 志,177(22),6575-6584,1995)中克隆了crtZ基因。由crtW编码的β-胡萝 卜素酮酶催化了将氧代基团导入β-胡萝卜素的β-紫罗酮环的两个末端的 两个步骤。Kajiwara等人从Haematococcus bluvialis克隆和测定了对应于真 细菌中crtW的bkt基因的序列(Kajiwara等人,P.Mol.Biol.,29,343- 352,1995)。Harker等人也从聚球蓝细菌PCC7942克隆和测定了对应于真细 菌中的crtW的crtO基因的序列(Harker等人,FEBS通讯,404,129-134, 1997)。羟化酶和酮酶这两种酶具有广泛的底物特异性,并且这保证了在两 种酶依据反应条件在同时反应的情况中,形成各种叶黄素(图1)。

如上所述,分离参与从FPP形成β-胡萝卜素的所有基因,但在 P.rhodozyma中在蛋白质和DNA的平上还没有鉴定出参与从β-胡萝卜素 形成叶黄素的最后步骤的酶和基因。虽然Johnson等人 (Crit.Rev.Biotechnol,11(4),297-326,191)通过假设由它们分离的一些叶黄素化 合物是虾青素生物合成的中间产物而提出存在两条独立的生成虾青素的途 径,但不能证明这两条独立的途径,因为不能分离出参与这样的途径的酶 和基因。另外,不能排除的是,这些叶黄素化合物可能已经产生于这些化 合物的分离步骤中的实验的人为现象。不能从P.rhodozyma分离出在由β- 胡萝卜素到虾青素的生物合成途径中积累中间产物的突变体使得难于澄清 从β-胡萝卜素到虾青素的生物合成途径。

本发明涉及参与由β-胡萝卜素到虾青素的虾青素生物合成的最后步 骤的基因和酶。

本发明提供了分离的DNA,特别是cDNA,所述DNA含有编码参与 在P.rhodozyma中由β-胡萝卜素到虾青素的反应的虾青素合酶的核苷酸序 列,类似于AST基因。

在一个优选的实施方案中,可以鉴定克隆的DNA片段的特征在于(a) 所说的核苷酸序列编码具有SEQ ID NO:1中所述的基酸序列的所说的 酶,或

(b)所说的核苷酸序列编码选自(i)等位基因变体或(ii)具有一个或多 个氨基酸的添加、插入、缺失和/或取代并具有所述的酶活性的酶的所说酶 的变体。

在另一个优选的实施方案中,分离的cDNA片段可以来源于Phaffia rhodozyma的基因,并且选自:

(i)SEQ ID NO:2表示的cDNA序列;

(ii)SEQ ID NO:2表示的cDNA序列的同类编码或等位基因变体;和

(iii)具有一个或多个核苷酸的添加、插入、缺失和/或取代并且编码具有 所说酶活性的多肽的SEQ ID NO:2表示的cDNA序列的衍生物。

在本发明的另一个优选的实施方案中涉及了如上所述的分离的 cDNA,其特征在于所说的核苷酸序列是:

(i)SEQ ID NO:2表示的核苷酸序列;

(ii)由于遗传密码的简并性,编码具有与由核苷酸序列(i)编码的相同的 氨基酸序列的虾青素合成酶的核苷酸序列;和

(iii)在标准杂交条件下与来自i)或ii)的核苷酸序列的互补序列杂交的核 苷酸序列。

仍然在另一个优选的实施方案中,分离的基因组DNA片段可以起源于 Phaffia rhodozyma的基因,并且选自:

(i)SEQ ID NO:3表示的基因组DNA序列;

(ii)SEQ ID NO:3表示的基因组DNA序列的同类编码或等位基因变 体;和

(iii)具有一个或多个核苷酸的添加、插入、缺失和/或取代并且编码具有 所述酶活性的多肽的SEQ ID NO:3表示的基因组DNA序列的衍生物。

在本发明的另一个优选的实施方案中涉及了如上所述的分离的基因组 DNA,其特征在于所说的核苷酸序列是:

(i)SEQ ID NO:3表示的核苷酸序列;

(ii)由于遗传密码的简并性,编码具有与由核苷酸序列(i)编码的相同的 氨基酸序列的虾青素合成酶的核苷酸序列;和

(iii)在标准杂交条件下与来自i)或ii)的核苷酸序列的互补序列杂交的核 苷酸序列。

本发明的另一方面提供了通过如上所述的克隆的DNA片段表达可得 的具有参与P.rhodozyma中β-胡萝卜素到虾青素的反应的虾青素合成酶活 性的重组多肽。

本发明的重组多肽的一个优选的实施方案的特征在于

(a)所说的多肽具有如SEQ ID NO:1所述的氨基酸序列,或

(b)所说的多肽是(a)中定义的肽的变体,所述多肽选自(i)等位基因变 体或(ii)具有一个或多个氨基酸的添加、插入、缺失和/或取代并且具有所述 的酶活性的酶。

所以,本发明也涉及本案件中的多肽的变体。这样的变体是在本发明 的氨基酸序列的基础上通过添加,插入,缺失和/或取代一个或多个所述序 列的氨基酸残基来定义的,其中这样的衍生物仍然具有与本发明相应的多 肽相同的酶活性类型,或它们是公知的等位基因变异现象的结果。通过本 领域已知的任何测试或本文的具体叙述可以测量这样的活性。通过本领域 已知的化学肽合成,或通过现有技术中已知的方法如Sambrook等人(分子克 隆,冷泉港实验室出版社,纽约,美国,第二版,1989)公开的,采用在如 本文公开的DNA序列的基础上的重组手段可以生产这样的变体。通常不改 变所述分子活性的蛋白质和肽中氨基酸的交换是本领域已知的并且例如 H.Neurath和R.L.Hill在“蛋白质”(学术出版社,纽约,1979,特别参见 图6,14页)中叙述的。最常发生的交换是Ala/Ser,Val/Ile,Asp/Glu,Thr/Ser, Ala/Gly,Ala/Thr,Ser/Asn,Ala/Val,Ser/Gly,Thy/Phe,Ala/Pro,Lys/Art.Asp/Asn,Leu /Ile,Leu/Val,Ala/Glu,Asp/Gly以及相反的交换。

另外,本发明不仅涉及如在序列表中公开的DNA序列及其互补链,而 且涉及包括这些序列的那些序列,所述的这些序列为在标准条件下与所述 序列或其片段杂交的DNA序列和由于遗传密码的简并性,在标准条件下与 所述序列不杂交但却编码确实具有相同的氨基酸序列的多肽的DNA序列。

在这篇文章中杂交的“标准条件”是指本领域的技术人员通常用于检 测特异性杂交信号并且如Sambrook等人(s.a.)所述的条件,或优选的所谓的 严格杂交和非严格洗涤条件,或更优选本领域技术人员熟悉的所谓的严格 杂交和严格洗涤条件,以及如Sambrook等人(s.a.)所述的条件,或更优选所 谓的中等严格条件,例如遵照制造商给出的方案使用DIG(洋地黄毒苷)标记 试剂盒和Boehringer Mannheim(Mannheim,德国)的发光检测试剂盒并且用杂 交溶液:

甲酰胺(WAKO,大阪,日本)50%(V/V)

5×SSC

封闭试剂(Boehringer)2%(W/V)

N-月桂酰肌氨酸0.1%(W/V)

SDS0.3%(W/V)

在42℃的温度下过夜,随后如制造商指示的那样进行洗涤和检测。

即如PCR反应所示,或通过定点诱变(参见,例如 Smith,Ann.Rev.Genet.19,423(1985))或如EP747 483所述的合成法,或如 Sambrook等人(s.a.)所述的常用分子克隆方法可以制备起源于本发明DNA 序列的DNA序列,因为它们与所述DNA序列(参见上面)杂交或可以利用根 据所述DNA序列设计的引物通过聚合酶链式反应来构建。

本发明也涉及含有如上所述的DNA的载体或质粒,和由如上所述的 DNA或如上所述的载体或质粒转化或转染的宿主细胞。

本发明也提供了通过利用携带如上所述的DNA的重组DNA转化宿主 可得的重组生物体。

本发明也涉及用于生产能够催化从β-胡萝卜素到虾青素的反应的多 肽的方法,其中包括在指导生产所述的多肽的条件下培养如上所述的重组 生物体。

在本发明的其它方面提供了用于生产虾青素的方法,该方法包括在适 当的宿主生物体中导入一个或多个如上所述的DNA,并且在指导生产虾青 素的条件下培养该转化的生物体。

本发明的多肽也可用于生产虾青素的方法,该方法包括将β-胡萝卜素 与具有如上所述的参与从β-胡萝卜素到虾青素的反应的虾青素合成酶活 性的重组肽在含有合适重建膜的合适反应混合物中存在合适电子供体的情 况下接触。在这一方法中,所说的重组多肽可以以从生物膜如微粒体或线 粒体膜制备的再构成膜的形式存在。重组多肽也可以以再构成人工膜、如 脂质体的形式存在。电子供体、如细胞色素P450还原酶是可以还原本发明 的酶反应中心的适当的电子供体。

为了进一步说明本发明,包括了下面的附图以及下面给出的详细描 述。

图1显示了在P.rhodozyma中从乙酰-CoA到虾青素的生物合成途径。

图2显示了含有部分基因组的AST基因的质粒pR16的限制图。

图3显示了在除去跨膜结构域时,在氨基末端加入6×His的AST基 因的表达研究。将来自0.1毫升肉汤的细胞进行10%十二烷基硫酸钠-聚 丙烯酰胺凝胶电泳(SDS-PAGE)。泳道1,分子量标记(105千道尔顿,82.0 千道尔顿,49.0千道尔顿和33.3千道尔顿,从上到下,Bio-RAD,Richmond, 美国);泳道2,大肠杆菌(BL21(DE3)(pLysS)(pAST315)没有IPTG);泳道3, 大肠杆菌(BL21(DE3)(pLysS)(pAST315)含有1.5毫摩尔/升IPTG);泳道4, 分子量标记)。

通常,存在大量克隆编码生物合成酶的基因的方法。例如,可以利用 简并PCR。简并PCR是一种克隆其所编码的氨基酸序列与具有相同或相似 功能的来自其它物种的一种已知酶具有高度同源性的感兴趣的基因的方 法。通过逆翻译氨基酸序列成对应的核苷酸(“简并”)来设计在简并PCR中 用作引物系列的简并引物。在这样的简并引物中,通常使用由任意的A, C,G或T组成的混合引物或在不明确的密码中含有肌苷的引物。在克隆感 兴趣基因的部分片段后,通过使用克隆的和标记的部分DNA片段作为探针 可以筛选含有整个基因的遗传片段。

在克隆编码其活性可以通过酶测定测量的酶的基因的情况中,通过检 测酶活性纯化这样的酶和测定酶的氨基酸序列是好的方法。这样获得的氨 基酸序列容易反向翻译成对应的核苷酸序列。在体外利用DNA合成仪可以 合成具有对应的核苷酸序列的DNA片段并且进行标记以直接用作杂交探 针。获得杂交探针的另一可替代的方法是利用氨基酸序列信息的简并PCR 方法。

为了克隆其功能不能通过酶法鉴定的基因,已经采用了称为鸟枪 (shot-gun)筛选的方法作为常规的克隆方法。这一方法包括分离缺乏编码任 何感兴趣的生物合成酶的特异性基因的突变菌株,和通过从具有对应于如 此突变的基因的完整基因的生物体制备的DNA转化该突变菌株。为了分离 这样的突变体,经常采用常规的诱变。通过检测其辅源营养等可以进行同 亲代菌株一样的获得性表现型的证明。在供体DNA含有对应于突变菌株中 的突变基因的基因的情况下,这样的基因的转化体获得了与亲代菌株相同 的表现型作为遗传互补的结果。

作为载体,不管在克隆宿主中是否能够复制的任何形式的载体都可以 用于鸟枪克隆。为了使用复制载体,互补的能力是必不可少的,并且这样 的载体不必含有与受体基因组同源的序列。在使用非复制载体的情况中, 这样的载体必须含有与宿主基因组同源的序列以便使供体与受体DNA之间 进行重组。

为了克隆本发明的DNA,可以采用称为“颜色互补”的方法。由于通 过可以从胡萝卜素生成生物体如噬夏孢欧文氏菌,草生欧文氏菌等克隆的 胡萝卜素生成基因转化的结果,非胡萝卜素生成生物体如大肠杆菌可以获 得胡萝卜素生成的能力。含有crtE,crtB,crtI和crtY的大肠杆菌可以生产β胡 萝卜素并使细胞成黄色。开发这样的特征时,已经从各种生成胡萝卜素的 生物体如细菌和植物中克隆许多胡萝卜素生成基因。例如,为了克隆编码 番茄红素环化酶的crtY基因,制备在相对于pUC载体的亲和载体上含有 crtE,crtB和crtI的大肠杆菌作为转化宿主。这样的宿主变成红色,这表明积 累了番茄红素。其次,利用pUC载体可以构建来自胡萝卜素生成生物体的 cDNA或基因组文库。如果对应于供体胡萝卜素生成生物体中的crtY的基 因存在于转化的质粒中的话,将发生遗传互补,并且大肠杆菌将变成黄色, 这表明获得了生产β胡萝卜素的能力。事实上,通过这一方法从P.rhodozyma 克隆了crtE,crtBY和crtI基因(Verdoes等人,WO97/23633)。

关于参与从β胡萝卜素到虾青素的反应的基因的克隆,Kajiwara等人 在含有来自噬夏孢欧文氏菌的crtE,crtB,crtI和crtY基因的宿主大肠杆 菌中构建了来自P.rhodozyma的cDNA表达文库(Kajiwara等人, WO96/28545,1996)。在这样的克隆系统中,通过判断表明黄素或虾青 素积累的红色素形成,从P.rhodozyma理论上可以克隆出参与β胡萝卜素到 虾青素的反应的基因。但是,迄今还没有报道这样的基因。许多研究者推 测了膜结合的胡萝卜素生成酶将会形成酶复合物的可能性。在这样的模型 中,在胡萝卜素生成酶之间的亲和力将是有效地生成胡萝卜素所必须的。 根据这样的假设,这一颜色互补方法不适于克隆参与虾青素生物合成的最 后步骤,即从β胡萝卜素到虾青素这一步骤的酶,因为外源酶在生成胡萝卜 素的连续反应中可能与Phaffia的胡萝卜素生成酶不具有亲和力。

在本发明中,将已于1999年2月18日以登记号74486作为布达佩斯 条约保藏物再保藏在美国模式培养物保藏所(ATCC)的并且针对从β胡萝卜 素到虾青素的反应进行了阻断的P.rhodozymaATCC96815用作转化宿主 (Schroeder,W.A.和Johnson,E.A.,J.Ind.Mocrobiol.14,502-507,1995)。将从已经 在1998年4月8日在美国模式培养物保藏所(ATCC)以登记号74438作为布 达佩斯条约保藏物再保藏的P.rhodozymaATCC96594的野生型菌株的染色 体制备的基因组文库转化这一突变体用于分离生产虾青素的克隆。在本发 明中,分离出补充P.rhodozym中从β胡萝卜素到虾青素的反应的这样的遗 传片段,并且测定它的核苷酸序列。

通过利用基因扩增或启动子修饰的基因剂量效应而不是阻断的突变的 补充可以将本发明的这样的基因/DNA用于超量生产虾青素。

通常,基因由具有不同功能的几个部分组成。在真核生物中,将编码 对应的蛋白质的基因转录成早熟的信使RNA(pre-mRNA),这区别于核糖体 RNA(rRNA),核小RNA(snRNA)和转移RNA(tRNA)的基因。虽然在这一转 录事件中RNA聚合酶II(PolII)起中心作用,但没有覆盖含有启动子的上游 区和上游激活序列(UAS)的顺式元件和反式作用的蛋白质因子,PolII不能 单独起始转录。首先,由几个基本蛋白质成分组成的转录起始复合物识别 待表达的基因的5’邻接区中的启动子序列。在这一事件中,在一些特异的 调节下如热激反应、或适应营养饥饿等等时表达的基因的情况中,需要一 些其它的参与者。在这样的情况中,需要UAS存在于启动子序列周围的5’ 未翻译上游区中,并且一些阳性或阴性调节蛋白识别和结合UAS。转录起 始复合物与启动子序列的结合长度受到启动子周围的反式作用因子的结合 的影响,并且这能够调节转录活性。

在由磷酸化激活转录起始复合物后,转录起始复合物从转录起始位点 启动转录。从基因的3’方向的启动子区分离出转录起始复合物的一些部分 作为延长复合物(这一步骤称为启动子清除事件),并且延长复合物继续转录 直到它到达位于基因的3’邻接下游区中的终止序列。在核中通过在时对应 于转录起始位点的帽位点处加入帽结构,和通过在位于3’邻接下游区的 polyA信号处加入polyA序列来修饰这样产生的Pre-mRNA。其次,从编码 区除去内含子结构,并结合外显子部分以产生其序列对应于相应蛋白质的 初级氨基酸序列的开放读码框架。对稳定的基因表达而言,其中产生成熟 mRNA的这一修饰是必须的。在一般意义上,cDNA对应于从这种成熟 mRNA序列逆转录的DNA序列。利用成熟mRNA作为模板通过来源于病 毒种类的逆转录酶可以用实验方法合成它。

在本发明中,确定了使P.rhodozyma野生型菌株生产β-胡萝卜素的 P.rhodozymaATCC96815菌株的突变点。从测序的结果,表明在AST基因的 第8内含子的剪接序列中基的变化引起这样的表现型,如通过mRNA的 不恰当的剪接特异性地积累β胡萝卜素。RT-PCR分析检测出AST基因 的不恰当的剪接产物,并强烈地支持了突变点的鉴定。

本发明也提供了可以在不同的宿主生物体、如大肠杆菌中表达的重组 AST基因。在本发明中,在大肠杆菌中表达这样的重组AST基因,并证实 AST基因编码其大小对应于推测的分子量的蛋白质产物。通过利用新的 AST基因和这样的重组DNA技术可以实现虾青素的生物生产。

根据本发明,从P.rhodozyma的cDNA文库中克隆了编码参与虾青素生 物合成的最后步骤的酶的基因,并且确定了它们的核苷酸序列。另外,克 隆包括启动子和终止子的基因组DNA的部分并且可用于克隆包括启动子和 终止子区的它的整个基因。

通过采用标记的cDNA片段作为筛选探针筛选已经在适当宿主中的噬 菌体或质粒载体中构建的基因组文库可以克隆出含有它的编码区,它的内 含子以及它的调节区、如启动子和终止子的完整基因。通常,用于构建基 因组文库的一种最常用的宿主菌株是大肠杆菌。作为载体,可以使用噬菌 体载体、如λ噬菌体载体,或质粒载体如pUC载体。通过使用含有感兴趣 的基因部分的标记的DNA片段作为探针可以筛选以这种方式、例如从 P.rhodozymaDNA构建的基因组文库。然后,可以挑选杂交的噬菌斑或菌落, 并且用于亚克隆和/或测定其核苷酸序列。

通过利用其DNA序列存在几种增强感兴趣的蛋白质的所期望的酶活 性的方案。

一个方案是利用呈其天然形式的基因本身。最简单的途径是扩增包括 它的调节序列、如启动子和终止子的基因组序列。通过将编码感兴趣的酶 的基因组片段克隆到含有在P.rhodozyma中起作用的选择标记的适当载体中 可以进行这一方案。将编码使宿主在存在有毒的抗生素时能存活的酶的药 物抗性基因经常用作选择标记。含于pGB-Ph9中的G418抗性基因(Wery等 人,基因,184,89-97,1997)是这样的载体结构的例子。作为载体, 通常可以使用两种类型的载体。这些类型中的一种是不具有自主复制序列 的整合载体。质粒pGB-Ph9是这一类型的载体的例子。因为这样的载体不 具有自我复制序列,所以上述载体本身不能复制,并且作为使用载体与染 色体之间的同源序列的单交重组的结果,上述载体只以宿主染色体上的整 合形式存在。通过在选择培养基中增加对应的药物的浓度,只有其中在染 色体上扩增整合基因的菌株能够生存。载体的另一种类型是具有自我复制 序列的可复制载体。这样的载体可以多拷贝的状态存在。在这一类型的载 体中,在具有适当的辅源营养标记的宿主中也可以使用营养互补标记。生 长需要胞苷的P.rhodozyma ATCC24221菌株是这种营养缺陷体的一个例 子。通过使用CTP合成酶作为ATCC24221的供体DNA,可以确立利用营 养互补的宿主载体系统。

超量表达感兴趣的酶的另一个方案是将感兴趣的基因布置于强启动子 下。在这样的方案中,感兴趣的基因不必是多拷贝状态。另外,也可以使 用在适当的生长期和适当的培养时期诱导其启动子活性的启动子。在生长 的后期、如次级代谢物的生产期,虾青素的生产加速。例如,通过在植物 启动子的控制下布置胡萝卜素生成基因,在指数生长期可以诱导这些基因 的基因表达,并且虾青素的生产可以变得与生产菌株的生长有关。

在本发明中,作为这样的组成型启动子和终止子的一个例子,从 P.rhodozyma中克隆丙糖磷酸异构酶(TPI)基因的启动子和终止子片段。另 外,在转化体中证实了虾青素生产的恢复,其中在该转化体中,在生产β胡 萝卜素的P.rhodozyma ATCC96815的染色体上的不同基因座(位于淀粉酶基 因上的AMY基因座)上由来源于TPI基因的组成型启动子和终止子驱动表 达AST基因。

超量表达感兴趣的酶的再一个方案是在其调节元件中突变。针对这一 目的,将一种报道基因(如β半乳糖苷酶基因,萤光素酶基因,编码绿色荧 光蛋白质的基因等)插入到需要的基因的启动子和终止子序列之间,以致包 括启动子、终止子和报道基因的所有部分融合在一起并且一起发挥作用。 在体内可以对其中在染色体上或在载体上导入所说报道基因的转化的 P.rhodozyma进行诱变处理,以便在需要的基因的启动子区内诱导突变。通 过检测由报道基因编码的活性的变化可以监测突变。如果在基因的顺式元 件中发生突变,那么通过拯救诱变的基因并且测序将确定出突变点。然后, 通过在天然的和突变的启动子序列之间重组,可以向染色体上的启动子区 导入这一突变。以同样的方式,可以产生编码反式作用因子的基因中的突 变。

通过启动子区中的顺式元件的体外诱变也可以诱导突变。在这一途径 中,诱变处理含有报道基因的基因盒,其中将所述报道基因融合到来源于 感兴趣基因的5’-端的启动子区和来自感兴趣基因3’-端的终止子区,然后将 其导入P.rhodozyma中。通过检测报道基因的活性的差异,将筛选有效的突 变。通过同样于体内突变途径情况的方法,在染色体上的天然启动子区的 序列中可以导入这样的突变。

作为供体DNA,可以导入编码催化从β胡萝卜素到虾青素的反应的酶 的基因。可以使用与它的天然序列相同的编码序列及其等位基因变体、即 有一个或多个氨基酸的添加、缺失和/或取代、但其对应的酶具有相同类型 的酶活性的序列。然后,通过转化可以向P.rhodozyma中导入这样的载体, 并且通过在适当的选择培养基(如在pGB-Ph9的情况中含有遗传霉素的 YPD琼脂培养基,或在使用营养缺陷型ATCC24221作为受体的情况中不含 胞苷的基本琼脂培养基)上涂布转化的细胞可以选择转化体。

在适当的培养基中可以培养这样的基因工程化的P.rhodozyma并且评 价它的虾青素的生产率。鉴于它的生产率和通过所述的遗传工程方法导入 的基因或蛋白质表达的水平之间的关系,将证实这样选择的虾青素的超级 生产者。

实施例

在如下所述的具体的实施例中采用了下列材料和方法:

菌株:

P.rhodozymaATCC96594(在1998年4月8日以登记号74438作为布达佩 斯条约保藏物已经再保藏了这一菌株)。

P.rhodozyma ATCC96815(在1999年2月18日以登记号74486作为布达 佩斯条约保藏物已经再保藏了这一菌株) E.coli DH5alpha F,phi80d,lacZdeltaM15,delta(lacZYA-argF)U169, hsd(rK-,mK+),recA1,endA1,deoR,thi-1,supE44,gyrA96,relA1 (Toyobo,Osaka,Japan) E.coli XL1-Blue MRF’:delta(mcrA)183,delta(mcrCB-hsdSMR- mrr)173,endA1,supE44,thi-1,recA1,gyrA96,relA1,lac[F’proAB, lacIqZdeltaM15,Tn10(tetr)](Stratagene,La Jolla,USA) E.coli SOLR:e14(mcrA),delta(mcrCB-hsdSMR-mrr)171,sbcC,recB, recJ,umuC::Tn5(kanr),uvrC,lac,gyrA96,relA1,thi-1,endA1, lambdaR,[F’proAB,lacIqZdeltaM15]Su(nonsuppressing)(Stratagene) E.coli TOP10:F,mcrA,delta(mrr-hsdRMS-mcrBC),phi80,delta(lacZ M15),delta(lacX74),recA1,deoR,araD139,(ara-leu)7697,galU,galK, rpsL(Str),endA1,nupG(Invitrogen,NV Leek,Netherlands)   E.coli BL21(DE3)(pLysS):dcm,ompTrBmB,lon lambda(DE3),pLysS   (Stratagene) 载体:   pUC19(Takara Shuzo,Otsu,Japan)   lambdaZAPII(Stratagene)   pCR2.1-TOPO(Invitrogen)   pET11c(Stratagene)

培养基

在YPD培养基(DIFCO,底特律,美国)中常规维持P.rhodozyma的菌株。 在LB培养基(10克细菌用胰蛋白胨,5克酵母提取物(DIFCO)和5克NaCl/ 升)中维持大肠杆菌菌株。当制备琼脂培养基时,补充的1.5%琼脂 (WAKO,Osaka,日本)。

方法

根据《分子克隆:实验室手册》第2版(冷泉港实验室出版社,1989)中 叙述的方法进行常用的分子生物学方法。从TakaraShuzo购买了限制酶和 T4DNA连接酶。

根据制造商提供的方案,通过使用QIAGEN基因组试剂盒 (QIAGEN,Hilden,德国)从P.rhodozyma中进行染色体DNA的分离。利用自动 DNA分离系统(PI-50,Kurabo有限公司,Osaka,日本)进行来自转化的大肠杆 菌的质粒DNA的小量制备。通过使用QIAGEN柱(QIAGEN)进行来自大肠 杆菌转化体的质粒DNA的中量制备(midi-prep)。通过使用QIAquick或 QIAEXII(QIAGEN)从琼脂糖分离和纯化DNA片段。

从Pharmacia购买用于DNA测序的荧光DNA引物。利用自动荧光DNA 测序仪(ALFred,Pharmacia,Uppsala,瑞士)进行DNA测序。

从Toyobo购买DH5α的感受态细胞。

从Nippon Bio-Rad实验室(东京,日本)购买用于biolistic转化 P.rhodozyma的仪器和试剂。

实施例1

从P.rhodozyma分离基因组DNA

为了从P.rhodozyma ATCC96594分离出基因组DNA,根据制造商详细 说明的方法使用QIAGEN基因组试剂盒。

首先,通过离心(1500×g,10分钟)从100毫升的YPD培养基中的过夜 培养物中收获P.rhodozymaATCC96594的细胞,并且用TE缓中液(含有1毫 摩尔/升EDTA的10毫摩尔/升Tris/HCl(pH8.0))洗涤一次。在QIAGEN基因 组试剂盒的8毫升Y1缓冲液中悬浮后,以2毫克/毫升的浓度加入溶细胞酶 (SIGMA,圣路易斯,美国)以便通过酶降解使细胞破裂,并且在30℃下温育 反应混合物90分钟,然后进行接下来的提取步骤。最后,获得20微克基因 组DNA。

实施例2

从P.rhodozymaATCC96594构建基因组文库

如“本发明的详细描述”部分中所述,通过在甘油-3-磷酸脱氢酶 (GAP)的基因的启动子和终止子区之间插入G418抗性结构基因并且将该盒 连接到KpnI和HindIII消化的pUC19上来构建含有药物抗性标记盒的质粒。 将这一质粒命名为pUC-G418并且进一步使用。然后,将ClaI接头连接到 pUC-G418载体特有的EcoRI位点,并且获得质粒pUC-G418Cl512,并且在 Phaffia基因组文库的构建中用作载体主链。

然后,在37℃下利用1.6单位的HpaII部分消化如以上实施例1中所述 的由P.rhodozyma ATCC96594制备的10微克染色体DNA45分钟,并且进行 琼脂糖凝胶电泳。在用溴化乙锭染色后,通过使用透析膜的电洗脱回收4到 10kb的部分消化的DNA物质。在乙醇沉淀出回收的HpaII片段后,获得1.215 微克DNA。

接下来,在37℃下用10个单位的ClaI消化3微克的pG418Cl512共1 小时,并且用乙醇沉淀。然后使用小小肠碱性磷酸酶使ClaI消化的 pG418Cl512去磷酸化。然后,使ClaI消化的并脱磷酸的pG418Cl512载体进 行琼脂糖凝胶电泳,并且根据制造商的说明采用QIAquick方案回收DNA片 段。最后获得2.62微克ClaI消化的并脱磷酸的pG418Cl512。

将2.62微克ClaI消化的并脱磷酸的pG418Cl512在16℃过夜连接到1.22 微克HpaII部分消化的Phaffia基因组DNA上,并且将得到的连接溶液用作 用于转化大肠杆菌DH5α菌株的供体DNA。将总的连接混合物(270微升) 转移到1毫升感受态DH52细胞(Toyobo)中。在42℃下热激处理45秒、接 着在上维持30分钟后,将转化的细胞放置于冰上2分钟,然后在37℃下 在加入5毫升SOC培养基的情况下温育1小时。

SOC培养基:0.5%酵母提取物(DIFCO)

2%胰化蛋白胨(DIFCO)

10毫摩尔/升NaCl

2.5毫摩尔/升Kcl

10毫摩尔/升MgCl2

20毫摩尔/升MgSO4

20毫摩尔/升葡萄糖

将这样温育的细胞转移到100毫升含有100微克/毫升氨苄青霉素的LB 培养基中。在37℃继续过液培养,然后收获细胞用于质粒的中量制备。

根据制造商提供的方法,使用QIAGEN中量制备柱从收获的细胞制备 质粒文库。最后,在5毫升的总体积中获得0.3毫克/毫升的Phaffia基因组文 库,并且在进一步的研究中用作基因组文库。

实施例3

采用biolistic方法转化P.rhodozymaATCC96815

根据《分子生物学中的方法》中所述的方法进行转化(Johnston等人, 53:147-153,1996)。作为宿主菌株,在YPD培养基中培养 P.rhodozymaATCC96815到稳定期。在离心肉汤后,用无菌水浓缩细胞10倍, 在含有100微克/毫升遗传霉素及0.75摩尔/升甘露糖醇和山梨醇的YPD培养 基上涂布200微升细胞悬浮液。将如实施例2中所述制备的5微克基因组文 库包衣在1.5毫克0.9微米的金颗粒上,并用作biolistic转化的供体DNA。 在20℃温育1星期后,产生约2万个遗传霉素抗性克隆(300到500个菌落/ 平板)。尽管大多数转化体显示了黄色(如宿主菌株ATCC96815一样),但有 三个菌落变成红色,并且进一步加以使利用。

实施例4

从变成红色的转化体获得的类胡萝卜素的分析

在试管中,在20℃下,在10毫升YPD培养基中培养从 P.rhodozymaATCC96815获得的变成红色的转化体。然后,从0.5毫升肉汤中 收获细胞,并用于从细胞中提取类胡萝卜素。在通过利用所述的玻璃珠破碎 来从P.rhodozyma的细胞中提取类胡萝卜素后,通过HPLC测量P.rhodozyma 的类胡萝卜素含量。在提取后,然后通过离心收集破碎的细胞,并采用HPLC 分析得到的上清液的类胡萝卜素含量。

HPLC柱;Chrompack Lichrosorb si-60(4.6毫米,250毫米)

温度;室温

洗脱液:丙酮/己烷(18/82),并向洗脱液中加入1毫升/升的水

注射体积:10微升

流速:2.0毫升/分钟

检测:紫外,在450纳米处

从SIGMA购买β-胡萝卜素的样品,从Hoffman La-Roche(Basel,瑞士) 获得虾青素。

作为HPLC分析的结果,证实尽管宿主菌株ATCC96815只生产β-胡 萝卜素,但所有的三个红色转化体都特异性地生产虾青素。

实施例5

从生产虾青素的红色转化体的染色体进行的质粒拯救

从所有生产虾青素的转化体制备染色体DNA。为了这一目的,根据制 造商详细说明的方法,如实施例1所述使用QIAGEN基因组试剂盒。通过 HindIII消化这样制备的5微克的染色体DNA,然后根据QIAquick方案纯 化。通过连接DNA溶液转化大肠杆菌DH5α感受态细胞,然后涤布在含有 100微克/毫升氨苄青霉素的LB琼脂培养基上。从质粒的序列分析判断,所 有转化体在它们的质粒中都具有相同的插入片段。这表明通过在基因组文库 的供体DNA和染色体DNA之间的相同类型的重组事件产生了起源于 P.rhodozymaATCC96815的三种独立的红色转化体。将一种这样拯救的质粒 命名为pR2-4并且进一步加以使用。

实施例6

通过使用pR2-4作为杂交探针筛选原始的基因组文库

因为根据产生P.rhodozyma的红色转化体的重组事件的取方,在pR2-4 中拯救的片段可能有突变,所以通过使用pR2-4作为杂交探针进行原始基因 组文库的筛选。

为了这一目的,将如实施例2中所述的原始基因组文库的2万个大肠杆 菌转化体转移到尼龙膜过滤器(Hybond-N+,Amersham,Buckinghamshire,英 国)上并且进行菌落杂交。分离出在其插入片段中含有与pR2-4相同的核苷酸 序列的三个转化体。将从这些转化体分离的质粒命名为pR3,pR5.1和pR16。

接下来,通过pR3,pR5.1和pR16转化P.rhodozymaATCC96815。所有 转化体都变成红色。这一结果表明分离的质粒可能含有编码参与P.rhodozyma 中的β胡萝卜素到虾青素的反应的酶的基因。我们命名这一基因为AST基 因。在这些质粒中,进一步使用pR16。

实施例7

从P.rhodozyma分离出mRNA用于cDNA分析

为了分析来自P.rhodozyma的转录物的模式,通过苯酚提取并结合用玻 璃珠进行细胞破碎从P.rhodozymaATCC96594和ATCC96815分离出总 RNA,并且使用mRNA分离试剂盒(Clontech,Palo Alto,美国)纯化mRNA。

首先,通过离心(1500×g,10分钟)从10毫升YPD培养基中的两天培养 物中收获ATCC96594和ATCC96815菌株的细胞,并用提取缓冲液含有0.1 摩尔/升LiCl和0.1毫摩尔/升EDTA的100毫摩尔/升Tris/HCl(pH7.5))洗涤一 次。在50毫升一次性离心管(IWAKI Glass,Tokyo,日本)中用同样的提取缓冲 液填充到5.0毫升的细胞悬浮液后,加入1.5毫升isogen-LS(Nippon基因, Toyama,日本)和10克玻璃珠。用水平台式摇床振荡含有isogen-LS和玻璃珠 的细胞悬浮液的离心管1小时。在这一步骤中,回收300微克的总RNA。

然后,通过使用mRNA分离试剂盒(Clontech)纯化mRNA。获得8.0微 克来自P.rhodozyma ATCC96594和ATCC96815菌株的mRNA。

为了合成cDNA,根据制造商详细描述的方法,我们使用了 SMARTcDNA构建试剂盒(Clontech)。我们应用2微克纯化的mRNA用于第 一条链的合成,接着进行PCR扩增,并且获得1毫克cDNA。

实施例8

pR16的亚克隆及其插入片段的功能分析

在图2中描绘了pR16的限制图。将长度为0.7和2.7kb的每个EcoRI 片段亚克隆到pUC-G418中并且分别命名为pRS913和pRLR913。

然后,用pRS913转化生产虾青素的P.rhodozyma ATCC96594菌株。作 为这一转化研究的结果,产生了黄色转化体。这表明0.7kb的EcoRI片段可 能含有截短的AST基因,并且通过0.7kb的EcoRI片段与其在P.rhodozyma 染色体上的同源序列之间的单交重组的转化将导致P.rhodozyma染色体上的 AST基因的基因破坏。

接下来,用pRLR913转化生产β胡萝卜素的ATCC96815菌株,并且产 生了红色转化体。这表明导致生产虾青素的野生型菌株生产β胡萝卜素的菌 株ATCC96815的突变点位于最初邻接pR16中的0.7kbEcoRI片段的2.7kb 的EcoRI片段中。

将实施例7中制备的200微克cDNA进行琼脂糖凝胶电泳,以用于有效 的Northern分析。在从ATCC96594和96815制备的cDNA的情况中,通过 使用pRLR913的2.7kb的EcoRI片段作为杂交探针,在这两种情况下都与 3.2和2.0kb的两个带杂交。这表明ATCC96815的ast突变将是不影响mRNA 的长度变化的点突变如错义突变。

在使用pRS913的0.7kb EcoRI片段作为杂交探针的情况中,杂交了2.0kb 的带。从这一研究可见似乎AST基因可能在P.rhodozyma中提供2.0kb的转 录物。

实施例9

克隆AST基因的cDNA

为了克隆来自P.rhodozyma的AST基因的cDNA,我们从 P.rhodozymaATCC96594构建了cDNA文库。通过如实施例7所述的苯酚提 取并结合用玻璃珠进行的细胞破碎来分离总RNA。

首先,通过离心(1500×g,10分钟)从50毫升YPD培养基中的2天培养 物中收获ATCC96594菌株的细胞,并用提取缓冲液(含有0.1摩尔/升LiCl和0.1毫摩尔/升EDTA的100毫摩尔/升Tris/HCl(pH7.5))洗涤一次。在50毫 升一次性离心管(IWAKI Glass)中用同样的提取缓冲液填充到5.0毫升的细胞 悬浮液后,加入1.5毫升isogen-LS(Nippon基因)和10克玻璃珠。用水平台 式摇床振荡含有isogen-LS和玻璃珠的细胞悬浮液的离心管1小时。在这一 步骤中,回收1.8毫克的总RNA。

然后,根据制造商详细说明的方法,通过使用PolyATractmRNA分离系 统(Promega公司,麦迪生,美国)纯化mRNA。最后,我们从P.rhodozyma ATCC96594菌株获得了8.0微克mRNA。

为了构建cDNA文库,采用制造商详细说明的方案,在COPY试剂盒 (Invitrogen,Carlsbad,美国)中使用8.0微克纯化的mRNA。在连接EcoRI衔接 头(Stratagene)后,将合成的cDNA进行琼脂糖凝胶电泳。在切下覆盖了1.9 到2.3kb的cDNA长度的琼脂糖凝胶片后,通过QIAEX II(QIAGEN)纯化收 集的cDNA物质。将这种按大小进行了分级分离的cDNA与EcoRI消化的并 脱磷酸的λZAP II(Stratagene)连接。用GigapackIII金提取物(Stratagene)体外 包装过夜连接的混合物并且用于感染大肠杆菌XL1-BlueMRF’菌株。

使用如实施例8所述的2.7和0.7kb的EcoRI片段作为杂交探针对6000 个噬菌斑进行常规的噬菌斑筛选。根据制造商详细说明的方法,一个噬菌斑 与这些探针强烈地杂交,用无菌牙签挑出该噬菌斑,并将洗脱的噬菌体颗粒 用于体内切除。最后,分离出显示了抗氨苄青霉素抗性的感染的大肠杆菌 SOLR细胞的转化体。在测定了从这些转化体获得的分离的质粒的序列后, 原来是这些质粒含有与实施例6中所述的pR16序列的一部分相同的片段。

测定了AST基因的cDNA序列的完整,并且表示为SEQ ID NO:2,它 的推导的氨基酸序列为SEQ ID NO:1。

实施例10

在大肠杆菌中AST基因的表达

为了证实AST基因的ORF真正编码了蛋白质,在大肠杆菌表达系统中 进行了AST基因的表达研究。首先,为了使下面的纯化步骤容易,在AST 产物的羧基末端加入6×组氨酸(His)标记。合成了在表1中列出其序列的 PCR引物。

                          表1

用于克隆问其中加入6×His标记的AST基因的3’部分的PCR引物

ast13;GTTCAAAGTTCATTTATGGA(有意义引物)(SEQ ID NO:4)

ast14;GGATCCTCAGTGGTGGTGGTGGTGGTGTTCGACCGGCTTGA CCTGCA(反义引物)(SEQ ID NO:5)

接下来,将pAST1207的1.5kb的NdeIEcoRI片段和pAST114的0.3kb 的EcoRIBamHI片段连接到用NdeI和BamHI消化的pET11c上,并且将连 接的DNA转化到大肠杆菌JM109菌株中。通过限制酶切分析检测6个独立 的氨苄青霉素抗性克隆,并且发现6个克隆中的5个具有包含AST基因的重 组表达质粒的正确结构。选择其中的一个进行进一步的研究(pAST120),然 后将其转化到大肠杆菌BL21(DE3)(pLysS)菌株中。表明由限制酶切分析检测 的所有氨苄青霉素抗性克隆适当地具有pAST120。接下来,当在600纳米处 的光密度(OD)达到0.8时,通过向大肠杆菌BL21(DE3)(pLysS)(pAST120)生 长培养物中加入1毫摩尔/升IPTG来进行表达研究。在37℃连续培养4小 时后,通过离心收获细胞,并通过在SDS样品缓冲液(125毫摩尔/升 Tris-HCl,pH6.8,20%甘油,4%SDS,0.005%溴酚兰,5%巯基乙醇)中煮沸来 溶解。然后,使该溶胞产物进行SDS-聚丙烯酰胺凝胶电泳(PAGE)。在由 考斯亮兰染色(快速染色CBB试剂盒,nacalai tesque,Kyoto,日本)后,没有 观察到表达的蛋白质(数据未显示)。

通常,据报道需要在P450蛋白质的氨基末端区中的氨基酸序列进行一 些修饰,以便在大肠杆菌表达系统中表达P450蛋白质。事实上,在大肠杆 菌中没有表达具有完整序列的AST基因(数据未显示),并且发现在AST基因 以及其它P450酶的情况中氨基末端序列的一些修饰是必须的。作为重组AST 基因表达的下一步方案,进行了构建,其中在位于AST基因氨基末端的疏水 的锚序列缺失的基础上,将6×His标记序列加入AST蛋白质的氨基末端 上。

为了在氨基末端缺失的锚序列的基础上,在AST蛋白质的氨基末端加 入6×His标记序列,合成了下面的PCR引物并且用于PCR克隆。

                        表2

用于克隆在加入6×His标记的5’部分缺乏锚序列的AST基因的PCR 引物

ast32;CATATGCACCACCACCACCACCACCTGTATAACCTTCAGGGG CCC(用于克隆AST基因5’端的有意义引物)(SEQ ID NO:6)

ast2;GTAACAACACCATCTCCGGT(用于克隆AST基因5’端的反义引 物)(SEQ ID NO:7)

ast13;GTTCAAAGTTCATTTATGGA(用于克隆AST基因3’端的有意义 引物)(SEQ ID NO:4)

ast3 3;GGATCCTCAACTCATTCGACCGGCTT(用于克隆AST基因3’端 的反义引物)(SEQ ID NO:8)

PCR的条件如下:在94℃下25次循环共15秒,在55℃下循环30秒, 在72℃下循环30秒。使用质粒pAST1207作为PCR模板。将具有所需长度 的PCR片段克隆到pCR2.1-TOPO(Invitrogen)中,并测定具有预期插入片段 的6个独立的克隆的插入序列。结果,所述克隆中的两个克隆分别具有准确 的插入序列,选择一个克隆,并用于进一步的研究(针对AST基因的3’末端 为pAST228,而针对AST基因的5’末端为pAST302#3202)。将来自 pAST302#3202的0.2kb的NdeISphI片段、来自pAST1207的1.5kb的 SphIEcoRI片段和来自pAST228的0.05kb的KpnIBamHI片段连接到由NdeI 和BamHI消化的pET11c中,并将连接的混合物转化到大肠杆菌DH5α中。 作为对6个独立的克隆进行限制分析的结果,发现所有的克隆都具有针对其 表达的含有AST基因的正确结构。选择一个克隆,并用于进一步的研究 (pAST315)。接下来,将pAST315转移到表达宿主大肠杆菌BL21(DE3)(pLysS) 中。作为限制分析的结果,证实了所有6个转化体都准确地具有pAST315。

接下来,当在600纳米处的光密度(OD)达到0.93时,通过向大肠杆菌 BL21(DE3)(pLysS)(pAST315)生长培养物中加入1.5毫摩尔/升的IPTG进行表 达研究。在37℃连续培养4小时后,通过离心收获细胞,通过在SDS样品 缓冲液中煮沸来溶解细胞。然后,将溶胞产物进行PAGE。在考马斯亮兰染 色后,观察到分子量恰好对应于其推定的氨基酸序列(约60千道尔顿)的表达 的蛋白质(图3)。从这一结果,证实了AST基因编码由它的推定的开放读码 框架预期的蛋白质。

实施例11

AST基因产物的体外特性记述

对于AST基因产物的酶的特性记述,可以使用用于描述P450酶的特性 的标准测定。为了这一目的,需要反应混合物含有再构成膜。作为再构成膜, 经常使用天然的分离物(如线粒体膜或微粒体)和人工膜。在任何情况中必须 在电子受体和供体之间发生电子转移。作为电子供体,向反应混合物中经常 加入细胞色素P450还原酶。作为电子受体,加入氧分子。在存在电子来源(如 还原的NADPH+)的情况下,可以将作为虾青素合成酶底物的,β胡萝卜素转 化成虾青素。用HPLC分析可以定性和定量地测定产生的虾青素。

实施例12

含有AST基因的基因组片段的克隆

为了测定含有AST基因的基因组序列,通过使用引物步查行方法进行 测序实验。pRS913的测序分析显示pRS913不含AST基因的3’末端。为了 获得靠近AST基因的3’邻接基因组片段,进行了基因组步查实验。为此,根 据制造商详细说明的方法采用了通用的基因组行走试剂盒(Clontech)。作为 PCR的模板,使用了在实施例1中制备的染色体DNA。合成了如表3中所 列序列的基因特异性引物ast15,并且用作PCR引物;

                        表3

用于AST基因的基因组行走的引物的序列

ast15;TAGAGAGAAGGAGGGGTACCAGATGC(SEQ ID NO:9)

从EcoRV和StuI文库获得了具有适当长度(小于1kb)的PCR片段,将 其纯化并且克隆到pCR2.1-TOPO(Invitrogen)中。作为测序的结果,发现这两 个片段都含有包含AST基因的基因组片段。根据位于AST基因中离开polyA 位点200bp的序列,设计出如表4所列的PCR引物。

                        表4

用于克隆靠近AST基因的3’邻接片段的引物的序列

ast18;CCCCGGATTGTGGAGAAACT(SEQ ID NO:10)

通过使用ast15和ast18引物作为PCR引物和实施例1中制备的染色体 DNA作为PCR模板,进行PCR。校正聚合酶(HF聚合酶,Clontech)保证了 具有准确序列的PCR片段的扩增。PCR条件如下;在94℃下25次循环其 15秒,55℃下循环30秒,72℃下循环30秒。具有400bp插入片段的6 个独立的克隆显示出相同的序列。

通过结合pRS913和pRL913的序列,测定了含有包含474bp的启动子 区和269bp的终止子区的AST基因的3.9kb的序列(SEQ ID NO:3)。结果, AST基因显示出了富含内含子的结构(17个内含子)。

实施例13

确定β胡萝卜素生产菌株P.rhodozymaATCC96815中的突变点

为了证实由AST基因内的突变引起了P.rhodozymaATCC96815菌株产生 β胡萝卜素的事实,测定了含有从ATCC96815及其亲代菌株 P.rhodozymaATCC24230获得的AST基因的基因组序列。为此,合成了如表 5中所列序列的PCR引物,并且用于PCR克隆;

                          表5

用于克隆整个基因组AST基因的PCR引物;

ast21;ATGTTCATCTTGGTCTTGCT(有意义引物)(SEQ ID NO:11)

ast4;ACGTAGAAGTCATAGCGCCT(反义引物)(SEQ ID NO:12)

通过使用HF聚合酶(Clontech)作为PCR聚合酶和使用通过与实施例1 同样的方法从菌株ATCC96815和ATCC24230制备的染色体DNA作为PCR 模板,在如下的条件下进行PCR:94℃下循环25次共15秒,55℃下循环 30秒,和72℃下循环4分钟。将所得的长度约为3.5kb的PCR片段克隆列 pCR2.1-TOPO中,并且通过引物行走方法测定它们的整个序列。在 P.rhodozymaATCC96594菌株和ATCC24230菌株的序列之间发现了7个碱基 的变化。在它的外显子序列中发现了4个碱基的变化,但那些变化没有造成 任何氨基酸的变化。在它的内含子结构中发现了3个碱基的变化。在β胡萝 卜素生产菌株ATCC96815和它的亲代菌株ATCC24230之间的比较,发现位 于第8个内含子中的5’剪接序列上的一个碱基的变化(GTAAGT>GTAAAT)。 这可能表明赋予生产虾青素的P.rhodozyma积累β胡萝卜素的表现型的突变 是由AST基因的mRNA的不恰当剪接引起的。

为了证实这一假设,通过使用从P.rhodozymaATCC96815制备的cDNA 作为PCR模板进行RT-PCR。通过与实施例9相同的方案,从 P.rhodozymaATCC96815分离出mRNA,并且用于cDNA的合成。为了通过 PCR方法从由ATCC96815制备的这种mRNA获得cDNA,根据供应商详细说 明的方法,使用SMART PCR cDNA文库构建试剂盒(Clontech)。合成了如表 6中所列序列的,并且覆盖了第8个内含子的下列引物,并且用作PCR引物。

                            表6

用于检测AST基因的不恰当剪接产物的RT-PCR的PCR引物

ast7;TTTGACTCAAGGATTAGCAG(有意义引物)(SEQ ID NO:13)

ast26;TGTCTTCTGAGAGTCGGTGA(反义引物)(SEQ ID NO:14)

RT-PCR条件如下;94℃下25次循环共15秒,55℃下循环30秒, 72℃下循环30秒。作为PCR的结果,扩增了300bp的PCR产物,并且克 隆到pCR2.1-TOPO中。测定了具有300bp插入片段的两个独立的克隆的序 列。结果,证实在P.rhodozymaATCC96815菌株中合成了AST基因的不恰当 的剪接产物。AST基因的第8个内含子的不恰当的剪接可能造成比正确剪接 的AST蛋白质更短的截短的AST蛋白质的产生,因为终止密码子位于第8 个内含子中。这一结果表明突变点位于不能正确剪接的AST基因内。

实施例14

在生产β胡萝卜素的Phaffia rhodozyma中AST基因的表达

为了证实AST基因编码参与从β胡萝卜素到虾青素的转化的酶的事实, 将AST基因克隆到β胡萝卜素生产菌株中。为了排除在染色体上的AST基 因的天然基因座上重组的可能性,构建在Phaffia rhodozyma染色体的AMY 基因座上的AST基因的表达质粒。为此,需要从Phaffia rhodozyma克隆一 些遗传元件。

1)从Phaffia rhodozyma克隆组成型启动子和终止子

为了从Phaffia rhodozyma克隆组成型启动子和终止子,采用了简并PCR 方法。在经常在酵母遗传学中用作组成型启动子和终止子的基因之中,尝试 克隆编码丙糖磷酸异构酶的TPI基因。在Blocks数据库 (http://www.blocks.fhcrc.org/)中登记的保守的氨基酸序列之中,选择两个基元 序列(Arg-Thr-Phe-Phe-Val-Gly-Gly-Asn和Asp-Val-Asp-Gly-Phe-Leu-Val-Gly- Gly-Ala)并且如下合成了它们的简并引物。

                            表7

用于从P.rhodozyma克隆TPI基因的简并PCR引物

tp1;MGNACNTTYTTYGTNGGNGGNAAY(有意义引物)(SEQ ID NO:15)

tp6;GCNCCNCCNACNARRAANCCRTCNACRTC(反义引物)(SEQ ID NO:16)

(M=A或C;N=A,C,G或T;Y=C或T;R=A或G)

PCR条件如下:94℃下25次循环共15秒,46℃下循环30秒,72 ℃下循环15秒。将ExTaq聚合酶(TakaraShuzo)用作PCR聚合酶。作为PCR 模板,通过使用SMART PCR cDNA文库构建试剂盒(Clontech)从由 P.rhodozymaATCC96594分离出的mRNA制备cDNA库。纯化0.7kb的PCR 片段,并将其克隆到pCR2.1-TOPO中。从限制分析判断,6个独立的克隆 具有所需长度的插入片段。测定其中两个的序列,并且证实它们都具有与来 自不同生物体的已知的TPI基因具有显著的同源性的插入序列。选择其中一 个用于进一步的研究(pTPI923)。

接下来,根据pTPI923的插入序列,合成了表8中所列序列的几个PCR 引物用于基因组行走,以便克隆TPI基因的启动子和终止子。对于这一实验, 根据制造商详细说明的方法使用了通用的基因组行走试剂盒(Clontech)。

                        表8

用于基因组行走以克隆TPI启动子和终止子的PCR引物

tp9;GCTTACCTCGCTTCCAACGTTTCCCAG(终止子克隆,初级)(SEQ ID NO:17)

tp10;GGATCTGTCTCTGCCTCCAACTGCAAG(终止子克隆,嵌套)(SEQ ID NO:18)

tp11;GGGTCAATGTCGGCAGCGAGAAGCCCA(启动子克隆,初 级)(SEQ ID NO:19)

tp12;ATGTACTCGGTAGCACTGATCAAGTAG(启动子克隆,嵌套)(SEQ ID NO:20)

PCR条件如下;在94℃下循环7次共4秒,74℃下循环3分钟,接着 在94℃下循环32次共4秒,69℃下循环3分钟并且在69℃连续延伸4分 钟。将KOD聚合酶(TOYOBO)用作PCR聚合酶。将从P.rhodozymaATCC96594 制备的染色体DNA用作PCR模板。结果,从EcoRV和StuI文库获得了终 止子区的候选物。对这些候选物的测序分析表明两个克隆都具有含有TPI结 构基因的推定了3’末端和终止子区的TPI基因的下游序列。在克隆启动子区 的情况中,从EcoRV文库获得的候选物含有TPI结构基因的推定的5’末端和 启动子区。

然后,为了构建来源于TPI基因的启动子盒与终止子盒,合成了表9中 所列序列的PCR引物。

                        表9

构建TPI启动子和TPI终止子盒子的PCR引物

tp13;GCGGCCGCATCCGTCTCGCCATCAGTCT(启动子盒子的有义引 物)(SEQ ID NO:21)

tp14;CCTGCAGGTCTAGAGATGAATAAATATAAAGAGT(启动子盒子 的反义引物)(SEQ ID NO:22)

tp15;CCTGCAGGTAAATATATCCAGGGATTAACCCCTA(终止子盒子 的有义引物)(SEQ ID NO:23)

tp16;GGTACCCGTGCGCAGTCGACCGAGACAT(终止子盒子的反义引 物)(SEQ ID NO:24)

PCR条件如下;在94℃下循环25次共15秒,55℃下循环30秒和72 ℃下循环30秒。将HF聚合酶(Clontech)用作PCR聚合酶,并将产生的PCR 片段克隆到pCR2.1-TOPO中。作为限制酶切和测序分析的结果,发现获得 了具有相同序列的克隆。各选择一个克隆用于进一步的研究(启动子盒子选择 pTPIP1104,而终止子盒子选择pTPIT1104)。

2)从Phaffia rhodozyma克隆部分的淀粉酶基因

为了在P.rhodozyma的染色体上定位和表达外源基因,从P.rhodozyma 克隆淀粉酶基因。在基本将会克隆外源基因的表达载体可能含有与 P.rhodozyma的染色体序列(如淀粉酶基因)同源的遗传片段的情况中,在单交 重组后,在P.rhodozyma的染色体的同源区上可以整合表达载体。

从Entrez数据库(http://www.ncbi.nlm.nih.gov/Entrez/)选择来自不同生 物体的淀粉酶的11个氨基酸序列,并且通过Clustal W用于氨基酸的对比 (Thompson,J.D.,Higgins,D.G.和Gibson,T.J.,核酸研究,22:4673-4680, 1994)。表10中列出了在该数据库登记了其淀粉酶序列的11种生物体。

                        表10

用于Clustal W分析的在数据库登记的各种淀粉酶基因

黑色曲霉泡盛变种amyA基因(登记号X52755)

黑色曲霉泡盛变种amyB基因(登记号X52756)

川地曲霉酸稳定性α淀粉酶基因(登记号AB008370)

米曲霉amyl基因(登记号X12725)

Aspergillus shirousamiiα-淀粉酶基因(登记号P30292)

隐球酵母属的种的α淀粉酶基因(登记号D83541)

Lipomyces kononenkoae subsp.spencermartinsiae α-淀粉酶基因(登记号 U30376)

Debaryomyces occidentalis amyl基因(登记号X16040)

肋状复膜孢糖酵母ALP1基因(登记号X05791)

粟酒裂殖糖酵母α-淀粉酶基因(登记号Z64354)

选择淀粉酶的两个保守的氨基酸序列(Asp-Tyr-Ile-Gln-Gly-Met-Gly-Phe- Asp/Thr-Ala-Ile-Trp和Asp-Gly-Ile-Pro-Ile-Ile-Tyr-Tyr-Gly-Thr-Glu-Gln),以便 通过简并PCR方法从P.rhodozyma克隆淀粉酶基因。然后,合成在表11中 所列序列的PCR引物用于从P.rhodozyma克隆AMY基因。

                            表11

用于从P.rhodozyma克隆淀粉酶(AMY)基因的简并PCR引物

amy1;GAYTAYATHCARGGNATGGGNTTYRMNGCNATHTG(有意义引 物)(SEQ ID NO:25)

amy2;TGYTCNGTNCCRTARTADATDATNGGDATNCCRTC(反义引 物)(SEQ ID NO:26)

(Y=C或T;H=A,C或T;R=A或G;N=A,C,G或T;M=A或C; D=A,G或T)

PCR条件如下;在94℃下循环25次共15秒,50℃下循环30秒和72 ℃下循环2分钟。使用ExTaq聚合酶(Takara Shuzo)作为PCR聚合酶。作为 PCR模板,使用了实施例1中制备的染色体DNA和通过使用SMART PCR cDNA文库构建试剂盒(Clontech)从由P.rhodozymaATCC96594分离出的 mRNA制备的cDNA库。当使用染色体和cDNA作为PCR模板时,分别产 生了1.7kb和0.9kb的PCR片段。纯化这两个片段并且克隆到pCR2.1-TOPO 中。从限制分析判断,6个独立的克隆具有所需长度的插入片段。测定其中 两个的序列,并证实它们都具有与来自不同生物体的已知的淀粉酶基因具有 显著的同源性的插入序列。选择其中含有染色体AMY片段的一个克隆用于 进一步的研究(pAMY216)。为了构建部分淀粉酶盒,根据pAMY216的插入 片段的内部序列,合成了表12中所列序列的两个PCR引物。

                            表12

构建部分AMY盒子的PCR引物

amy101;CCGCGGCATTGATACCTCTACCCCGT(AMY盒子的有义引 物)(SEQ ID NO:27)

amy102;GCGGCCGCCTGCAATCCTGGATCCACCG(AMY盒子的反义 引物)(SEQ ID NO:28)

PCR条件如下;在94℃下循环25次共15秒,55℃下循环30秒,及 72℃下循环2分钟。将HF聚合酶(Clontech)和染色体DNA分别用作PCR 聚合酶和PCR模板。将产生的PCR片段克隆进pCR2.1-TOPO中。作为限制 酶切和测序分析的结果,发现获得了具有正确序列的克隆。选择一个克隆用 于进一步的研究(pAMY1113)。

3)构建在Phaffia rhodozyma中起作用的AST基因的表达载体

通过限制酶切消化和连接每个遗传成分来构建AST基因的表达质粒。 首先,将来自pTPIT1104的0.3kb的KpnIPstI片段和来自pG418Sa512的1.7kb 的SacIKpnI片段连接到由用SacI和PstI消化的pGEM-T质粒中。发现作为 限制酶切消化的结果,12个转化体中有9个克隆具有正确的结构,选择其 中一个用于进一步的研究(pTPITG1120)。

接下来,进行AST基因的PCR克隆,以便在两个末端加入适当的限制 位点。合成了在表13中所列序列的PCR引物。

                        表13

克隆整个AST基因盒的PCR引物

ast11;TCTAGAATGTTCATCTTGGTCTTGCTCA(有义引物)(SEQ ID NO:29)

ast12;CCTGCAGGTCATTCGACCGGCTTGACCT(反义引物)(SEQ ID NO:30)

PCR条件如下;在94℃下循环25次共15秒,55℃下循环30秒,及 在72℃下循环2分钟。将HF聚合酶(Clontech)和pAST1207分别用作PCR 聚合酶和PCR模板。将产生的PCR片段克隆到pCR2.1-TOPO中。作为限制 酶切和测序分析的结果,发现获得了具有正确序列的一个克隆。选择这个克 隆用于进一步的研究(pAST113)。

最后,来自pAMY1113的将1.6kb的SacIINotI片段、来自pTPIP1104 的0.3kb的NotIXbaI片段和来自pAST113的1.5kb的XbaISse8387I片段连 接进入利用SacII和Sse8387I消化的pTPITG1120。作为限制分析的结果, 证实了所有5个测试的转化体都具有正确的结构,并且选择其中一个用于进 一步的研究(pAATG123)。

4)在生产β胡萝卜素的Phaffia rhodozyma中恢复虾青素的生产

将AST基因的表达质粒(pAATG123)转化进入生产β胡萝卜素的Phaffia rhodozymaATCC96815中。如实施例3所述进行biolistic转化。挑选出变成 红色的两个遗传霉素抗性菌落,进行选择用于进一步的研究。为了证实在 P.rhodozyma染色体上AMY基因座上的整合,合成了其序列列于表14的PCR 引物。

                        表14

证实在P.rhodozyma染色体上的AMY基因座上整合表达质粒的PCR引 物

amy5;CTCTCCTGTTCACAAAAACA(有义引物)(SEQ ID NO:31)

从这些转化体制备染色体,并将其用作PCR模板。PCR条件如下;94 ℃下循环25次共15秒,55℃下循环30秒,及72℃下循环2分钟。将ExTaq 聚合酶(Takara Shuzo)用作PCR聚合酶。在将从变成红色的转化体获得的染 色体用作模板DNA的PCR反应中产生了阳性2.0kb的PCR带。在将起源于 宿主菌株P.rhodozyma ATCC96815的染色体用作PCR模板的PCR反应混合 物中没有观察到PCR带。

5)通过在生产β胡萝卜素的P.rhodozyma的染色体上整合了重组AST基 因的重组体的烧瓶发酵

在烧瓶发酵中评价虾青素的生产率。烧瓶发酵的培养基配方如下。

                            表15

用于烧瓶发酵的种子培养基配方

葡萄糖                         30.0克/升

NH4Cl                         4.83克/升

KH2PO4                       1.0克/升

MgSO4-7H2O                   0.88克/升

NaCl                           0.06克/升

CaCl2-2H2O                   0.2克/升

邻苯二甲酸KH phthalate     20.0克/升

FeSO4-7H2O                   28毫克/升

柠檬酸-1H2O                   15.0毫克/升

ZnSO4-7H2O                   40.0毫克/升

CuSO4-5H2O                   0.75毫克/升

MnSO4-4,5H2O                0.6毫克/升

H3BO3                        0.6毫克/升

Na2MoO4-2H2O                0.6毫克/升

KI                             0.15毫克/升

肌醇                           60.0毫克/升

烟酸                           3.0毫克/升

D-泛酸                       3.0毫克/升

维生素B1(盐酸硫胺素)           3.0毫克/升

对氨基苯甲酸                   1.8毫克/升

维生素B6(盐酸吡哆醇)           0.3毫克/升

生物素                         0.048毫克/升

7毫升/试管(直径21毫米)

                            表16

用于烧瓶发酵的培养基配方

MgSO4-7H2O                   2.1克/升

CaCl2-2H2O                   0.865克/升

(NH4)2SO4                   3.7克/升

FeSO4-7H2O                   0.28克/升

葡萄糖(单独灭菌)               22克/升

KH2PO4(单独灭菌)         14.25克/升

柠檬酸-1H2O               0.21克/升

ZnSO4-7H2O               70.14毫克/升

CuSO4-5H2O               10.5毫克/升

MnSO4-4,5H2O            8.4毫克/升

H3BO3                    8.4毫克/升

Na2MoO4-2H2O            8.4毫克/升

KI                         2.1毫克/升

肌醇                       0.374克/升

烟酸                       18.7毫克/升

D-泛酸钙                   28.05毫克/升

维生素B1(盐酸硫胺素)       18.7毫克/升

对氨基苯甲酸               11.22毫克/升

维生素B6(盐酸吡哆醇)       1.87毫克/升

生物素                     1.122毫克/升

CaCO3                     10克/升

向每个烧瓶中加入1滴Actcol(Takeda化学工业有限公司,Osaka,日 本)。

在发酵7天后从发酵肉汤中收获含有缓冲(buffles)细胞的50毫升(含有5 %接种物的最后体积)/500毫升烧瓶,并且通过如实施例4所述的HPLC分析 其虾青素和β胡萝卜素的积累。结果概括在表17中。

                            表17

通过其中整合了AST基因的重组体导致虾青素生产的恢复(将数据表示 为相对于由P.rhodozymaATCC96815积累的β胡萝卜素的效价的虾青素和β 胡萝卜素的相对效价)

                    相对效价(%) 菌株                    虾青素       β胡萝卜素 ATCC96815::pR16        34.0%        18.6% ATCC96815::pAATG123    16.3%        56.3% ATCC96815                0%           100% 由ATCC96815:pAATG123生产虾青素的部分恢复表明TPI启动子的启动 子强度对于虾青素生产的完全恢复是不够强的。

                序列表 <110>F.HOFFMANN-LAROCHE.AG <120>虾青素生产的改进和其中利用的生物物质 <130>P450ast <140> <141> <160>32 <170>PatentIn Ver2.0 <210>1 <211>557 <212>PRT <213>Phaffia rhodozyma <220> <221>TRANSIT <222>(1)..(26) <400>1

 Met Phe Ile Leu Val Leu Leu Thr Gly Ala Leu Gly Leu Ala Ala Phe 30   1          5           10          15

 Ser Trp Ala Ser Ile Ala Phe Phe Ser Leu Tyr Leu Ala Pro Arg Arg

         20            25          30 35   Ser Ser Leu Tyr Asn Leu Gln Gly Pro Asn His Thr Asn Tyr Phe Thr

      35           40          45

 Gly Asn Phe Leu Asp Ile Leu Ser Ala Arg Thr Gly Glu Glu His Ala

    50          55           60 40

 Lys Tyr Arg Glu Lys Tyr Gly Ser Thr Leu Arg Phe Ala Gly Ile Ala

 65           70           75           80

 Gly Ala Pro Val Leu Asn Ser Thr Asp Pro Lys Val Phe Asn His Val 45             85          90          95

 Met Lys Glu Ala Tyr Asp Tyr Pro Lys Pro Gly Met Ala Ala Arg Val

  100           105           110 Leu Arg Ile Ala Thr Gly Asp Gly Val Val Thr Ala Glu Gly Glu Ala

115           120          125 His Lys Arg His Arg Arg Ile Met Ile Pro Ser Leu Ser Ala Gln Ala   130           135          140 Val Lys Ser Met Val Pro Ile Phe Leu Glu Lys Gly Met Glu Leu Val 145          150            155          160 Asp Lys Met Met Glu Asp Ala Ala Glu Lys Asp Met Ala Val Gly Glu

     165          170          175 Ser Ala Gly Glu Lys Lys Ala Thr Arg Leu Glu Thr Glu Gly Val Asp

   180           185         190 Val Lys Asp Trp Val Gly Arg Ala Thr Leu Asp Val Met Ala Leu Ala

 195          200           205 Gly Phe Asp Tyr Lys Ser Asp Ser Leu Gln Asn Lys Thr Asn Glu Leu   210          215           220 Tyr Val Ala Phe Val Gly Leu Thr Asp Gly Phe Ala Pro Thr Leu Asp 225          230          235           240 Ser Phe Lys Ala Ile Met Trp Asp Phe Val Pro Tyr Phe Arg Thr Met

     245           250          255 Lys Arg Arg His Glu Ile Pro Leu Thr Gln Gly Leu Ala Val Ser Arg

   260          265           270 Arg Val Gly Ile Glu Leu Met Glu Gln Lys Lys Gln Ala Val Leu Gly

275           280          285 Ser Ala Ser Asp Gln Ala Val Asp Lys Lys Asp Val Gln Gly Arg Asp   290           295          300 Ile Leu Ser Leu Leu Val Arg Ala Asn Ile Ala Ala Asn Leu Pro Glu 305           310          315           320 Ser Gln Lys Leu Ser Asp Glu Glu Val Leu Ala Gln Ile Ser Asn Leu

     325          330           335 Leu Phe Ala Gly Tyr Glu Thr Ser Ser Thr Val Leu Thr Trp Met Phe

  340           345          350 His Arg Leu Ser Glu Asp Lys Ala Val Gln Asp Lys Leu Arg Glu Glu

 355           360          365 Ile Cys Gln Ile Asp Thr Asp Met Pro Thr Leu Asp Glu Leu Asn Ala    370           375         380 Leu Pro Tyr Leu Glu Ala Phe Val Lys Glu Ser Leu Arg Leu Asp Pro 385          390          395          400 Pro Ser Pro Tyr Ala Asn Arg Glu Cys Leu Lys Asp Glu Asp Phe Ile

     405           410          415 Pro Leu Ala Glu Pro Val Ile Gly Arg Asp Gly Ser Val Ile Asn Glu

  420           425           430 Val Arg Ile Thr Lys Gly Thr Met Val Met Leu Pro Leu Phe Asn Ile

 435          440           445 Asn Arg Ser Lys Phe Ile Tyr Gly Glu Asp Ala Glu Glu Phe Arg Pro   450          455           460 Glu Arg Trp Leu Glu Asp Val Thr Asp Ser Leu Asn Ser Ile Glu Ala 465          470          475          480 Pro Tyr Gly His Gln Ala Ser Phe Ile Ser Gly Pro Arg Ala Cys Phe

     485           490           495 Gly Trp Arg Phe Ala Val Ala Glu Met Lys Ala Phe Leu Phe Val Thr

   500          505          510 Leu Arg Arg Val Gln Phe Glu Pro Ile Ile Ser His Pro Glu Tyr Glu

515           520         525 His Ile Thr Leu Ile Ile Ser Arg Pro Arg Ile Val Gly Arg Glu Lys   530           535            540 Glu Gly Tyr Gln Met Arg Leu Gln Val Lys Pro Val Glu 545          550           555 <210>2 <211>1932 <212>DNA <213>Phaffia rhodozyma <220> <221>CDS <222>(33)..(1706) <220> <221>polyA-位点 <222>(1871) <220> <221>mRNA <222>(14)..(1891) <400>2  10  gaattcggca cgaggccacc tactttctcc at atg ttc atc ttg gtc ttg ctc  53

                      Met Phe Ile Leu Val Leu Leu

                       1         5

 aca ggt gct tta ggc ctg gct gct ttc tca tgg gca tcc ata gcg ttc  101  15  Thr Gly Ala Leu Gly Leu Ala Ala Phe Ser Trp Ala Ser Ile Ala Phe

      10          15           20

 ttc agt ctt tac ctc gct ccg agg cga tct tca ctg tat aac ctt cag  149

 Phe Ser Leu Tyr Leu Ala Pro Arg Arg Ser Ser Leu Tyr Asn Leu Gln 20     25           30           35

 ggc ccg aat cat acc aac tac ttt aca ggc aat ttt tta gac atc ctc  197

 Gly Pro Asn His Thr Asn Tyr Phe Thr Gly Asn Phe Leu Asp Ile Leu

 40           45          50           55 25

 tca gct cgt aca ggt gaa gag cat gcg aag tac aga gaa aaa tac gga  245

 Ser Ala Arg Thr Gly Glu Glu His Ala Lys Tyr Arg Glu Lys Tyr Gly

           60          65           70 30   agc acc ctc cgg ttt gct ggg atc gct gga gca ccc gtc ttg aac tcg  293

 Ser Thr Leu Arg Phe Ala Gly Ile Ala Gly Ala Pro Val Leu Asn Ser

        75           80           85

 acc gat ccg aaa gtc ttc aac cat gtg atg aaa gaa gcc tac gac tat  341 35   Thr Asp Pro Lys Val Phe Asn His Val Met Lys Glu Ala Tyr Asp Tyr

      90          95          100 ccg aaa cct ggt atg gcc gct cga gtg ctc aga att gct acc gga gat 389 Pro Lys Pro Gly Met Ala Ala Arg Val Leu Arg Ile Ala Thr Gly Asp   105           110          115 ggt gtt gtt acg gcg gaa ggt gaa gct cat aag cga cat cga agg atc 437 Gly Val Val Thr Ala Glu Gly Glu Ala His Lys Arg His Arg Arg Ile 120           125          130           135 atg atc ccc tct ctg tcc gct cag gcc gtt aag tcg atg gtc cca att 485 Met Ile Pro Ser Leu Ser Ala Gln Ala Val Lys Ser Met Val Pro Ile

     140           145           150 ttc tta gaa aaa ggt atg gaa ctt gtc gac aag atg atg gag gat gcg 533 Phe Leu Glu Lys Gly Met Glu Leu Val Asp Lys Met Met Glu Asp Ala

  155           160         165 gct gag aag gat atg gcc gtg gga gag tcg gcc ggt gaa aag aag gca 581 Ala Glu Lys Asp Met Ala Val Gly Glu Ser Ala Gly Glu Lys Lys Ala

 170         175           180 acc aga ctc gag acc gaa gga gtc gat gta aag gat tgg gtc ggt cga 629 Thr Arg Leu Glu Thr Glu Gly Val Asp Val Lys Asp Trp Val Gly Arg   185          190          195 gct act ctg gac gtc atg gct ctt gca gga ttt gac tat aag agc gac 677 Ala Thr Leu Asp Val Met Ala Leu Ala Gly Phe Asp Tyr Lys Ser Asp 200          205           210         215 tcg ctc cag aac aag acc aat gag ctc tat gtc gct ttt gtc gga ctt 725 Ser Leu Gln Asn Lys Thr Asn Glu Leu Tyr Val Ala Phe Val Gly Leu

     220          225         230 acc gat ggg ttt gct cct acc ttg gac tcg ttc aag gct atc atg tgg 773 Thr Asp Gly Phe Ala Pro Thr Leu Asp Ser Phe Lys Ala Ile Met Trp

  235           240          245 gat ttt gta cct tac ttc cga act atg aaa cgg aga cat gag ata cct 821 Asp Phe Val Pro Tyr Phc Arg Thr Met Lys Arg Arg His Glu Ile Pro

250           255         260 ttg act caa gga tta gca gtt tcc cga cga gtt ggg atc gag ctt atg 869 Leu Thr Gln Gly Leu Ala Val Ser Arg Arg Val Gly Ile Glu Leu Met   265          270           275 gag caa aag aag cag gcc gtg ctt ggc tca gct tcc gat cag gct gtt 917 Glu Gln Lys Lys Gln Ala Val Leu Gly Ser Ala Ser Asp Gln Ala Val 280          285          290           295 gat aaa aag gat gtt caa ggt cgg gat ate cta agt ctc cta gtg aga  965 Asp Lys Lys Asp Val Gln Gly Arg Asp Ile Leu Ser Leu Leu Val Arg

     300          305           310 gca aac atc gcc gcc aac ctg cct gaa tct caa aag ctg tcc gat gag  1013 Ala Asn Ile Ala Ala Asn Leu Pro Glu Ser Gln Lys Leu Ser Asp Glu

  315            320         325 gag gta ctc gct cag atc agt aac ctg tta ttt gct gga tat gaa act  1061 Glu Val Leu Ala Gln Ile Ser Asn Leu Leu Phe Ala Gly Tyr Glu Thr

330           335           340 tct tcg aca gtc ttg aca tgg atg ttt cac cga ctc tca gaa gac aaa  1109 Ser Ser Thr Val Leu Thr Trp Met Phe His Arg Leu Ser Glu Asp Lys   345           350          355 gcc gtt cag gat aaa ctt cga gaa gaa att tgt cag atc gac acg gat  1157 Ala Val Gln Asp Lys Leu Arg Glu Glu Ile Cys Gln Ile Asp Thr Asp 360          365          370           375 atg cct acg cta gac gaa ctt aat gcg ttg cct tat ctc gaa gcg ttt  1205 Met Pro Thr Leu Asp Glu Leu Asn Ala Leu Pro Tyr Leu Glu Ala Phe

     380          385          390 gtt aag gag tct ctt cgt cta gac cct cct agt ccg tat gct aac cgt  1253 Val Lys Glu Ser Leu Arg Leu Asp Pro Pro Ser Pro Tyr Ala Asn Arg

   395          400          405 gaa tgc tta aag gat gaa gac ttc atc cca ctt gcc gag cct gtc att  1301 Glu Cys Leu Lys Asp Glu Asp Phe Ile Pro Leu Ala Glu Pro Val Ile

410          415           420 ggt cga gat ggg tcg gtc atc aac gag gtc cgg atc acg aaa gga acg  1349 Gly Arg Asp Gly Ser Val Ile Asn Glu Val Arg Ile Thr Lys Gly Thr   425          430           435 atg gtc atg ctt ccg ttg ttc aac atc aat cgt tca aag ttc att tat  1397 Met Val Met Leu Pro Leu Phe Asn Ile Asn Arg Ser Lys Phe Ile Tyr 440          445         450           455 gga gaa gat gca gaa gaa ttc aga ccg gag agg tgg ctt gag gac gta  1445 Gly Glu Asp Ala Glu Glu Phe Arg Pro Glu Arg Trp Leu Glu Asp Val

     460          465          470 aca gac tcg ctc aac agt att gaa gca ccc tat gga cac cag gcg agc  1493 Thr Asp Ser Leu Asn Ser Ile Glu Ala Pro Tyr Gly His Gln Ala Ser

  475           480          485 ttt atc tct gga ccc aga gct tgc ttt ggt tgg cga ttt gct gtc gcc   1541 Phe Ile Ser Gly Pro Arg Ala Cys Phe Gly Trp Arg Phe Ala Val Ala

 490           495          500 gag atg aag gcc ttc ttg ttt gtc act ctc cgt cgg gtc cag ttc gag   1589 Glu Met Lys Ala Phe Leu Phe Val Thr Leu Arg Arg Val Gln Phe Glu   505          510          515 ccc atc atc tct cat cca gag tac gag cac atc acc ttg atc att tcc   1637 Pro Ile Ile Ser His Pro Glu Tyr Glu His Ile Thr Leu Ile Ile Ser 520            525          530            535 cgt cct cga atc gtt ggt aga gag aag gag ggg tac cag atg cgt ttg   1685 Arg Pro Arg Ile Val Gly Arg Glu Lys Glu Gly Tyr Gln Met Arg Leu

     540            545           550 cag gtc aag ccg gtc gaa tga gttgattctt catatgttaa gagaagttct      1736 Gln Val Lys Pro Val Glu

  555 atatctgaga atgtgtgact aggacaatgc cttctttgta tcgatttgtt tctcataccc 1796 gggcaggcgc tatgacttct acgtcgtcta tcgtcgctct ggactctctt cttaccctat 1856 atattattcc atccgaaaaa aaaaaaaaaa aaaaaaaaaa aaaaagcggc cgctcgagcc 1916 ggctcgtgccgaattc                            1932 <210>3 <211>3969 <212>DNA <213>Phaffia rhodozyma <220> <221>5’UTR <222>(517)…(518) <223>实验 <220> <221>外显子 <222>(535)..(652) <220> <221>内含子 <222>(653)..(734) <220> <221>外显子 <222>(735)..(783) <220> <221>内含子 <222>(784)..(898) <220> <221>外显子 <222>(899)..(1015) <220> <221>intron <222>(1016)..(1087) <220> <221>exon <222>(1088)..(1179) <220> <221>intron <222>(1180)..(1302) <220> <221>exon <222>(1303)..(1517) <220> <221>intron <222>(1518)..(1600) <220> <221>exon <222>(1601)..(1634) <220> <221>intron <222>(1635)..(1723) <220> <221>exon <222>(1724)..(1866) <220> <221>intron <222>(1867)..(1939) <220> <221>exon <222>(1940)..(1999) <220> <221>intron <222>(2000)..(2081) <220> <221>exon <222>(2082)..(2181) <220> <221>intron <222>(2182)..(2257) <220> <221>exon <222>(2258)..(2354) <220> <221>intron <222>(2355)..(2431) <220> <221>exon <222>(2432)..(2542) <220> <221>intron <222>(2543)..(2618) <220> <221>exon <222>(2619)..(2652) <220> <221>intron <222>(2653)..(2742) <220> <221>exon <222>(2743)..(2814) <220> <221>intron <222>(2815)..(2962) <220> <221>exon <222>(2963)..(3050) <220> <221>intron <222>(3051)..(3113) <220> <221>exon <222>(3114)..(3171) <220> <221>intron <222>(3172)..(3247) <220> <221>exon <222>(3248)..(3321) <220> <221>intron <222>(3322)..(3398) <220> <221>exon <222>(3399)..(3423) <220> <221>intron <222>(3424)..(3513) <220> <221>exon <222>(3514)..(3700) <220> <221>polyA_site <222>(3865)..(3866) <223>EXPERIMENTAL <400>4 cggaccgaag cctcgccagc agttgatcaa gcgaaccaag ccgaacaatc ctggcgcgcc 60 tggaggagcg ggagcgggag gagcagcagg tgatgcatcg ggtggacaga atcagtagtg 120 tgtgtgtatg tgtgtagtgt agttgggttg tcccatgtgc ttcttcttat catcatcatt 180 tctttaaaat ctctacattg aatgtttacc ggaacgggct ttgatgatac tacggaccac 240 gttgtgtaac cagttcgatt gagattacga ttagatagcc gatccgtcga tcagatctcg 300 atctagagcg acatctggct cgatcggtcc ttgccgaaaa tcagggcacc gatcagggca 360 gaggaacgcc gaggccgaac gagacagaca caccatcatc atcagccatg tcttttttgt 420 gatcgttttt acatactacc cgtcgattct aaccttcttt cttcttctct tgccatcttt 480 gcattctcta tctcgtgtaa catcgatccg attcttgcca cctactttct ccat atg   537 ttc atc ttg gtc ttg ctc aca ggt gct tta ggc ctg gct gct ttc tca   585 tgg gca tcc ata gcg ttc ttc agt ctt tac ctc gct ccg agg cga tct   633 tca ctg tat aac ctt cag g gtaagaattg agctctggaa tcatgcttgt        682 gtaaatccta taatctcatt catcctattc ctcttcttca tcctctcttc ag gc ccg  739 aat cat acc aac tac ttt aca ggc aat ttt tta gac atc ctc tc        783 gtgagttttc atcattggct cagtcgtcca atcttaacga tcatcgctaa cgacctttcg 843 gacgcgttct tctttctatg tgaaatctga tctttggttt gttacgagag cacag a    899 gct cgt aca ggt gaa gag cat gcg aag tac aga gaa aaa tac gga agc   947 acc ctc cgg ttt gct ggg atc gct gga gca ccc gtc ttg aac tcg acc   995 gat ccg aaa gtc ttc aac ca gtttgtccat ccgaaccctc atcctcctct       1045 gctgatcaat tcaactgtag ttaacgcact ttgaatggac ag t gtg atg aaa gaa  1100 gcc tac gac tat ccg aaa cct ggt atg gcc gct cga gtg ctc aga att   1148 gct acc gga gat ggt gtt gtt acg gcg gaa g gtgcttttca agttctctta   1199 tatcacatct aatccactcg gcgcgattga actcaacatt tctgacgagc ctgtcacctt 1259 gttttcactt catggtctcg gtgcatcttg tctcatctca tag gt gaa gct cat    1313 aag cga cat cga agg atc atg atc ccc tct ctg tcc gct cag gcc gtt   1361 aag tcg atg gtc cca att ttc tta gaa aaa ggt atg gaa ctt gtc gac   1409 aag atg atg gag gat gcg gct gag aag gat atg gcc gtg gga gag tcg   1457 gcc ggt gaa aag aag gca acc aga ctc gag acc gaa gga gtc gat gta   1505 aag gat tgg gtc gtgagtaccc gcctattcct tcaccttgat ggacgaagca       1557 tatcaaggaa aggttcattg actgacaaac actatcttac cag ggt cga gct act   1612 ctg gac gtc atg gct ctt gca g gtcagtctac tctctcttat aaatgctcca    1664 catatgtatg catgtactga catgctcttc ctatattcga tacgacgtca tatgtccag  1723 ga ttt gac tat aag agc gac tcg ctc cag aac aag acc aat gag ctc    1770 tat gtc get ttt gtc gga ctt acc gat ggg ttt gct cct acc ttg gac   1818 tcg ttc aag gct atc atg tgg gat ttt gta cct tac ttc cga act atg   1866 gtatgtctgc cattctttga tatccaaaga ttatggatag gttacttgct aaaatttcac 1926 ctatcgtgaa cag aaa cgg aga cat gag ata cct ttg act caa gga tta    1975 gca gtt tcc cga cga gtt ggg atc gtaagtgcca gatcaagcct ctctgaatat  2029 tcttggtcat catcttaacc tcctaggctc attcatccat ggtgcgcaat ag gag ctt 2087 atg gag caa aag aag cag gcc gtg ctt ggc tca gct tcc gat cag gct   2135 gtt gat aaa aag gat gtt caa ggt cgg gat atc cta agt ctc cta g     2181 gttagtaacg tttttaaacg tatatacaga gcggcgacat tctttccctg acaactgtca 2241 acatgctcgt tactag tg aga gca aac atc gcc gcc aac ctg cct gaa tct  2292 caa aag ctg tcc gat gag gag gta ctc gct cag atc agt aac ctg tta   2340 ttt gct gga tat ga gtgtgtatcc tttcccctct ctatccttag ctgattaaaa    2394 gcactaatag aggtctttat gtttcctgtt tgatcag a act tct tcg aca gtc    2447 ttg aca tgg atg ttt cac cga ctc tca gaa gac aaa gcc gtt cag gat   2495 aaa ctt cga gaa gaa att tgt cag atc gac acg gat atg cct acg ct    2542 gtgaggatgt ttttgatgct aaattacttc ttcttgcaaa tgactaaaac ggccttccat 2602 tcttgatcca ttttag a gac gaa ctt aat gcg ttg cct tat ctc gaa gcg   2652 gttggttctc gattcttggt cttgtcttcc aaatacaata cggattattg ctcatctgat 2712 ttgcgtctac gggctgtgga atttaactag ttt gtt aag gag tct ctt cgt cta  2766 gac cct cct agt ccg tat gct aac cgt gaa tgc tta aag gat gaa gac   2814 gtatgttggc ttcatcacgc ataattttca tttcatattc ctttgtacat acgcatacag 2874 gctgaccgag ctcaaattcc ggcttcctct tctgtgcttc tttttctggc ctttcttatc 2934 ttcattcttc aaccaaaatt tgtcacag ttc atc cca ctt gcc gag cct gtc    2986 att ggt cga gat ggg tcg gtc atc aac gag gtc cgg atc acg aaa gga   3034 acg atg gtc atg ctt c gtaagttttc ctttatttca tctcgtccat gaaatagttt 3090 ctgatagacg cggaccaatt cag cg ttg ttc aac atc aat cgt tca aag ttc  3142 att tat gga gaa gat gca gaa gaa ttc ag gtacaattcg ttttctttta      3191 aaagccaatc ggtttcgtat cgtaattgac cgggctctct tttaatttct cgaaag a   3248 ccg gag agg tgg ctt gag gac gta aca gac tcg ctc aac agt att gaa   3296 gca ccc tat gga cac cag gcg agc t gtatgtttta ttgattttat           3341 ctttgtgaat tttgcaaaac gttgaacttc gcgcttccct tgttgttgaa atcccag tt 3400 atc tct gga ccc aga gct tgc tt gtaagtttct tctcatctgg cgccttagca   3453 gtatccgatc agccatctag ttctttgtac gattgtttct gactctctcg actttcgcag 3513 t ggt tgg cga ttt gct gtc gcc gag atg aag gcc ttc ttg ttt gtc act 3562 ctc cgt cgg gtc cag ttc gag ccc atc atc tct cat cca gag tac gag   3610 cac atc acc ttg atc att tcc cgt cct cga atc gtt ggt aga gag aag   3658 gag ggg tac cag atg cgt ttg cag gtc aag ccg gtc gaa tga           3700 gttgattctt catatgttaa gagaagttct atatctgaga atgtgtgact aggacaatgc 3760 cttctttgta tcgatttgtt tctcataccc gggcaggcgc tatgacttct acgtcgtcta 3820 tcgtcgctct ggactctctt cttaccctat atattattcc atccgtctgt atatttgtct 3880 atcacgacgt ctgtgtcgtc aactcaatat tcagcctctt catgcttctg tgtctccata 3940 gatgtgatct tcatgtttgt cgactgcag                        3969

<210>4

<211>20

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述:用于在大肠杆菌中表达AST基因的有意义引物

<400>4

gttcaaagtt catttatgga                                  20

<210>5

<211>47

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述:用于在大肠杆菌中表达AST基因的反义引物

<400>5

ggatcctcag tggtggtggt ggtggtgttc gaccggcttg acctgca    47

<210>6

<211>45

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述:用于在大肠杆菌中表达修饰的AST基因的5’ 有意义引物

<400>6

catatgcacc accaccacca ccacctgtat aaccttcagg ggccc     45

<210>7

<211>20

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述:用于在大肠杆菌中表达修饰的AST基因的5’ 反义引物

<400>7

gtaacaacac catctccggt           20

<210>8

<211>26

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述:用于在大肠杆菌中表达修饰的AST基因的3’ 反义引物

<400>8

ggatcctcaa ctcattcgac cggctt    26

<210>9

<211>26

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述:用于克隆AST基因的基因组行走引物

<400>9

tagagagaag gaggggtacc agatgc    26

<210>10

<211>20

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述:用于克隆AST基因的终止子区的反义引物

<400>10

ccccggattg tggagaaact           20

<210>11 <211>20 <212>DNA <213>人工序列 <220> <223>人工序列的描述:用于克隆基因组AST基因的有意义引物 <400>11 atgttcatct tggtcttgct                            20 <210>12 <211>20 <212>DNA <213>人工序列 <220> <223>人工序列的描述:用于克隆基因组AST基因的反义引物 <400>12 acgtagaagt catagcgcct                    20 <210>13 <211>20 <212>DNA <213>人工序列 <220> <223>人工序列的描述:用于AST基因的RT-PCR的有意义引物 <400>13 tttgactcaa ggattagcag                20 <210>14 <211>20 <212>DNA <213>人工序列 <220> <223>人工序列的描述:用于AST基因的RT-PCR的反义引物 <400>14 tgtcttctga gagtcggtga              20 <210>15 <211>24 <212>DNA <213>人工序列 <220> <223>人工序列的描述:用于克隆TPI基因的简并有意义引物 <400>15 mgnacnttyt tygtnggngg naay         24 <210>16 <211>29 <212>DNA <213>人工序列 <220> <223>人工序列的描述:用于克隆TPI基因的简并反义引物 <400>16 gcnccnccna cnarraancc rtcnacrtc    29 <210>17 <211>27 <212>DNA <213>人工序列 <220> <223>人工序列的描述:用于克隆TPI终止子的初级行走引物 <400>17 gcttacctcg cttccaacgt ttcccag     27 <210>18 <211>27 <212>DNA <213>人工序列 <220> <223>人工序列的描述:用于克隆TPI终止子的嵌套行走引物 <400>18 ggatctgtct ctgcctccaa ctgcaag        27 <210>19 <211>27 <212>DNA <213>人工序列 <220> <223>人工序列的描述:用于克隆TPI启动子的初级行走引物 <400>19 gggtcaatgt cggcagcgag aagccca        27 <210>20 <211>27 <212>DNA <213>人工序列 <220> <223>人工序列的描述:用于克隆TPI启动子的嵌套行走引物 <400>20 atgtactcgg tagcactgat caagtag        27 <210>21 <211>28 <212>DNA <213>人工序列 <220> <223>人工序列的描述:用于构建TPI启动子盒子的有意义引物 <400>21 gcggccgcat ccgtctcgcc atcagtct       28 <210>22 <211>34 <212>DNA <213>人工序列 <220> <223>人工序列的描述:用于构建TPI启动子盒子的反义引物 <400>22 cctgcaggtc tagagatgaa taaatataaa gagt    34 <210>23 <211>34 <212>DNA <213>人工序列 <220> <223>人工序列的描述:用于构建TPI终止子盒的有意义引物 <400>23 cctgcaggta aatatatcca gggattaacc ccta    34 <210>24 <211>28 <212>DNA <213>人工序列 <220> <223>人工序列的描述:用于构建TPI终止子盒子的反义引物 <400>24 ggtacccgtg cgcagtcgac cgagacat           28 <210>25 <211>35 <212>DNA <213>人工序列 <220> <223>人工序列的描述:用于克隆AMY基因的简并有意义引物 <400>25 gaytayathc arggnatggg nttyrmngcn athtg   35 <210>26 <211>35 <212>DNA <213>人工序列 <220> <223>人工序列的描述:用于克隆AMY基因的简并反义引物 <400>26 tgytcngtnc crtartadat datnggdatn ccrtc    35 <210>27 <211>26 <212>DNA <213>人工序列 <220> <223>人工序列的描述:用于构建部分AMY盒子的有意义引物 <400>27 ccgcggcatt gatacctcta ccccgt              26 <210>28 <211>28 <212>DNA <213>人工序列 <220> <223>人工序列的描述:用于构建部分AMY盒子的反义引物 <400>28 gcggccgcct gcaatcctgg atccaccg            28 <210>29 <211>28 <212>DNA <213>人工序列 <220> <223>人工序列的描述:用于构建AST盒子的有意义引物 <400>29 tctagaatgt tcatcttggt cttgctca            28 <210>30 <211>28

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述:用于构建AST盒子的反义引物

<400>30

cctgcaggtc attcgaccgg cttgacct        28

<210>31

<211>20

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述:通过PCR分析证实在AMY基因座上的整合的 有意义引物

<400>31

ctctcctgtt cacaaaaaca                 20

QQ群二维码
意见反馈