首页 / 专利库 / 植物油脂 / 植物油 / 月见草油 / 产量提高的植物

产量提高的植物

阅读:109发布:2021-07-22

专利汇可以提供产量提高的植物专利检索,专利查询,专利分析的服务。并且本 发明 一般涉及通过在 植物 中提高或产生中间体 磷酸 核糖焦磷酸(PRPP)相关多肽的一种或多种活性而与相应未转化野生型植物细胞相比具有提高的产量的植物细胞和/或植物。特别地,本发明涉及通过提高或产生磷酸核糖焦磷酸合酶(PRPP合成酶,PRS)的一种或多种活性而与相应未转化野生型植物细胞相比具有提高的产量的植物细胞和/或植物。本发明还涉及这些植物细胞和/或植物的产生、筛选和育种方法。,下面是产量提高的植物专利的具体信息内容。

1.用于产生与相应未转化野生型植物细胞、植物或其部分相比具有提 高的产量的转基因植物细胞、植物或其部分的方法,该方法通过在所述植 物细胞或植物或其部分中提高或产生选自磷酸核糖焦磷酸合酶的一种或多 种活性来实现。
2.用于产生与相应未转化野生型植物细胞、植物或其部分相比具有提 高的产量的转基因植物细胞、植物或其部分的方法,该方法通过在所述植 物细胞或植物或其部分中提高或产生至少一种多肽的一种或多种活性来实 现,所述多肽包括选自以下的多肽:
(i)包含选自SEQ ID NO:2、4、13、51、52、53、54、55、56、57、 58、59、60、61、62、63、7、8、9、10、11、14、15、16、17、18、64、 65、66、67、68、69、70、71、72、73之多肽、共有序列或至少一种多肽 基序的多肽,或者
(ii)包含选自SEQ ID NO:1、3、12、38、39、40、41、42、43、44、 45、46、47、48、49、50之多核苷酸的核酸分子的表达产物,
(iii)或者(i)或(ii)的功能等同物。
3.用于产生与相应未转化野生型植物细胞、植物或其部分相比具有提 高的产量的转基因植物细胞、植物或其部分的方法,该方法通过提高至少 一种核酸分子的表达而在所述植物细胞或植物或其部分中提高或产生一种 或多种活性来实现,所述核酸分子包括选自以下的核酸分子:
(a)编码选自SEQ ID NO:2、4、13、51、52、53、54、55、56、57、 58、59、60、61、62、63之多肽的核酸分子;
(b)选自SEQ ID NO:1、3、12的核酸分子;
(c)核酸分子,其由于遗传密码的简并性而可以衍生自选自SEQ ID NO: 2、4、13、51、52、53、54、55、56、57、58、59、60、61、62、63之多 肽序列,并赋予与相应的未转化野生型植物细胞、植物或其部分相比提高 的产量;
(d)核酸分子,其与包含选自SEQ ID NO:1、3、12之核酸分子的多核 苷酸的核酸分子序列具有至少30%同一性,并赋予与相应的未转化野生型 植物细胞、植物或其部分相比提高的产量;
(e)核酸分子,其编码与(a)至(c)核酸分子所编码多肽的基酸序列具有 至少30%同一性的多肽,并具有包含选自SEQ ID NO:1、3、12、38、39、 40、41、42、43、44、45、46、47、48、49、50的多核苷酸的核酸分子所 代表的活性,并赋予与相应的未转化野生型植物细胞、植物或其部分相比 提高的产量;
(f)核酸分子,其在严格杂交条件下与(a)至(c)的核酸分子杂交,并赋予 与相应的未转化野生型植物细胞、植物或其部分相比提高的产量;
(g)核酸分子,其编码可借助于针对(a)至(e)核酸分子之一所编码多肽产 生的单克隆或多克隆抗体来分离并具有磷酸核糖焦磷酸合酶的活性的多 肽,优选由包含选自SEQ ID NO:1、3、12、38、39、40、41、42、43、 44、45、46、47、48、49、50的多核苷酸的核酸分子所代表;
(h)核酸分子,其编码多肽,该多肽包含选自SEQ ID NO:7、8、9、 10、11、14、15、16、17、18、64、65、66、67、68、69、70、71、72、 73之共有序列或一种或多种多肽基序,并优选地具有磷酸核糖焦磷酸合酶 的活性,优选由包含选自SEQ ID NO:2、4、7、8、9、10、11、13、14、 15、16、17、18、64、65、66、67、68、69、70、71、72、73之多肽的多 肽所代表;
(i)核酸分子,其编码具有磷酸核糖焦磷酸合酶活性、优选由选自SEQ ID NO:2、4、13、51、52、53、54、55、56、57、58、59、60、61、62、 63之蛋白质所代表的活性的多肽,并赋予与相应的未转化野生型植物细 胞、植物或其部分相比提高的产量;
(j)核酸分子,其包含可通过使用选自SEQ ID NO:5、6的引物扩增 cDNA文库或基因组文库获得的多核苷酸,该核酸分子在其5’末端不以核 苷酸ATA开始,并优选地具有磷酸核糖焦磷酸合酶的活性,优选由包含 选自SEQ ID NO:1、3、12、38、39、40、41、42、43、44、45、46、47、 48、49、50的多核苷酸的核酸分子所代表;

(k)核酸分子,其可通过严格杂交条件下筛选合适的核酸文库而获得, 所述筛选中使用包含(a)或(b)的核酸分子之互补序列的探针或者使用其片 段,所述探针或其片段具有(a)至(e)所表征核酸分子序列之互补核酸分子的 至少15nt,优选20nt、30nt、50nt、100nt、200nt或500nt,并且该核 酸分子编码具有磷酸核糖焦磷酸合酶活性的多肽、优选由包含选自SEQ ID NO:2、4、13、51、52、53、54、55、56、57、58、59、60、61、62、63 之多肽的蛋白质所代表的多肽。
4.权利要求1、2或3中任一项的方法,其包括以下步骤:
a)将编码磷酸核糖焦磷酸合酶的核酸序列引入植物细胞、植物或其部 分中,和
b)在植物细胞、植物或其部分中表达该核酸所编码的磷酸核糖焦磷酸 合酶,和
c)选择植物细胞、植物或其部分,其中与相应未转化野生型植物细胞、 植物或其部分对比或相比,该植物细胞、植物或其部分或其繁殖材料中的 产量得到提高。
5.权利要求1至3中任一项的方法,其中所述编码磷酸核糖焦磷酸合 酶的核酸序列来源于选自子囊菌、丝状真菌的真菌,优选选自曲霉属 (Aspergillus)、木霉属(Trichoderma)、阿舒囊霉属(Ashbya)、假囊酵母属 (Eremothecium)、脉孢菌属(Neurospora)、镰孢霉属(Fusarium)、白僵菌属 (Beauveria)、被孢霉属(Mortierella)、霉属(Saprolegnia)、腐霉属(Pythium) 的真菌。
6.权利要求1至3中任一项的方法,其中与相应未转化野生型植物细 胞、植物或其部分相比,该转化的植物细胞、植物或其部分中的总含油量 提高了。
7.权利要求1至3中任一项的方法,其中与相应未转化野生型植物相 比,该转化植物的种子中的总含油量提高了。
8.权利要求9或10的方法,其中在培养后收获所述转化的植物细胞、 植物或其部分,并在适当时分离该转化植物细胞、植物或其部分中存在的 油。
9.权利要求1至3中任一项的方法,其中与相应未转化野生型植物细 胞、植物或其部分相比,该转化的植物细胞、植物或其部分的生物量增加 了。
10.权利要求12的方法,其中在培养后收获所述转化的植物细胞、植 物或其部分,并在适当时分离该转化的植物细胞、植物或其部分中存在的 生物量。
11.权利要求1至3中任一项的方法,其中对单子叶作物植物,特别 是禾本科物种进行转化。
12.权利要求1至3中任一项的方法,其中对双子叶作物植物,特别 是选自紫莞科(Asteraceae)、十字花科(Brassicacea)、菊科(Compostiae)、 十字花科(Cruciferae)、葫芦科(Cucurbitaceae)、豆科(Leguminosae)、茜草 科(Rubiaceae)、茄科(Solanaceae)、梧桐科(Sterculiaceae)、山茶科(Theaceae) 和伞形科(Umbelliferae)的植物进行转化。
13.权利要求1至3中任一项的方法,其中所述植物选自腰果 (Anacardium occidentale)、花生(Arachis hypogaea)、琉璃苣(Borago officinalis)、芸苔(Brassica campestris)、欧洲油菜(Brassica napus)、芜青 (Brassica rapa)、芥菜(Brassica juncea)、亚麻荠(Camelina sativa)、大麻 (Cannabis sativa)、红花(Carthamus tinctorius)、椰子(Cocos nucifera)、 Crambe abyssinica、Cuphea ciliata、油棕(Elaeis guineensis)、大豆(Glycine max)、陆地(Gossypium hirsitum)、海岛棉(Gossypium barbadense)、草 棉(Gossypium herbaceum)、向日葵(Helianthus annus)、亚麻(Linum usitatissimum)、月见草(Oenothera biennis)、油橄榄(Olea europaea)、蓖 麻(Ricinus communis)、玉米(Zea mays)、核桃(Juglans regia)、Prunus dulcis、玉米(玉蜀黍)、小麦、黑麦、燕麦、黑小麦、稻、大麦、黄豆、大 豆、花生、棉花、油菜,包括芸苔和冬季油菜、木薯、胡椒、向日葵、亚 麻、琉璃苣、红花、亚麻子、报春花、油菜籽、球茎甘蓝、万寿菊;茄科 植物,包括铃薯、烟草、茄子、番茄;蚕豆属物种、豌豆、苜蓿、咖啡、 可可、茶、柳属物种、油棕榈、椰子、多年生草本、饲料作物、烟草(Nicotiana tabacum)和拟南芥(Arabidopsis thaliana)。
14.包含至少一种核酸分子的转化的宿主细胞,所述核酸分子包含选 自权利要求3.a)、3.b)、3.c)、3.d)、3.e)、3.f)、3.g)、3.h)、3.i)、3.j)或3.k) 所述的核酸分子。
15.通过权利要求1至15中任一项的方法产生的与相应未转化野生型 植物细胞、植物或其部分相比具有提高的产量的转基因植物细胞、植物或 其部分。
16.由权利要求19的转基因植物产生的种子,其中所述种子对赋予与 相应未转化野生型植物细胞、植物或其部分相比提高的产量的转基因是遗 传纯合的。
17.包含权利要求19的宿主细胞的植物组织、繁殖材料、收获的材料 或植物。
18.包含至少一种选自权利要求3.a)、3.b)、3.c)、3.d)、3.e)、3.f)、3.g)、 3.h)、3.i)、3.j)或3.k)所述核酸分子的核酸分子用于制备转基因植物细胞、 植物或其部分的用途,所述转基因植物细胞、植物或其部分与相应未转化 的野生型植物细胞、植物或其部分相比具有提高的产量。
19.包含至少一种选自权利要求3.a)、3.b)、3.c)、3.d)、3.e)、3.f)、3.g)、 3.h)、3.i)、3.j)或3.k)所述核酸分子的核酸分子作为选择植物或植物细胞的 标记的用途,所述植物或植物细胞与相应未转化的野生型植物细胞、未转 化的野生型植物或其部分相比具有提高的产量。

说明书全文

发明一般涉及植物细胞和/或植物,其与相应的未转化野生型植物细 胞相比,通过在植物中提高或产生一种或多种与中间体磷酸核糖焦磷酸 (PRPP)相关多肽的活性而具有提高的产量。具体地,本发明涉及植物细胞 和/或植物,其与相应的未转化野生型植物细胞相比,通过提高或产生磷酸 核糖焦磷酸合酶(PRPP合酶,PRS)的一种或多种活性而具有提高的产量。 本发明还涉及产生以及筛选和培育这些植物细胞和/或植物的方法。

植物是光合自养的生物,能产生发育和生长所需的所有有机化合物。 在过去几年中,已经鉴定了许多影响植物细胞和器官生长的因子,生长相 关蛋白的分子功能也开始得以阐明。鉴于发育过程与代谢途径使用共同的 资源库,并且这两个过程都应答于环境能量和资源供应,很显然资源可用 性可能对细胞增殖和生长具有直接影响。Baldet及其同事最近证明了这种 密切的相关关系(J.Exp.Bot.57,961-970,2006),其显示番茄植株的果实负 荷降低在所有其他植物器官(包括根、茎、叶、花和其他果实)中导致光同 化作用提高和生长速率提高。另一方面,之前的实验已显示,在核苷酸从 头合成降低的情况下,铃薯和烟草植株的生长降低,而没有进一步的多 效性(等,Plant Physiol.138,1926-1938,2005)。

对植物代谢途径的靶向调控(优选通过重组方法实现)使得可以有利的 方式改变植物代谢,这在使用传统育种方法时只有在复杂的操作之后才能 实现,或者根本无法实现。因此,罕见的脂肪酸(例如特定的多不饱和脂肪 酸)仅在某些植物中合成或在植物中根本不合成,因此只能通过在转基因植 物中表达相关的酶来产生(例如Millar等Trends Plant Sci 5:95-101, 2000)。

三酰甘油和其他脂质是由脂肪酸合成的。脂肪酸生物合成和三酰甘油 生物合成由于区室作用而可以认为是独立的生物合成途径,但就终产物而 言则是一个生物合成途径。脂质合成可分成两个部分机制,一个可称为“原 核的”,另一个可称为“真核的”(Browse等Biochemical J 235:25-31,1986; Ohlrogge&Browse Plant Cell 7:957-970,1995)。该合成的原核机制位于 质体中,包括生物合成游离的脂肪酸,它们被输出到胞质溶胶中,在此以 脂肪酸酰基CoA酯的形式进入真核机制,并与甘油-3-磷酸(G3P)酯化得到 磷脂酸(PA)。PA是合成中性和极性脂质的起点。中性脂质在内质网上通过 Kennedy途径等合成(Voelker Genetic Engineering,Setlow(ed.)18:111-113, 1996;Shankline&Cahoon,Annu Rev Plant Physiol Plant Mol Biol 49:611-649,1998;Frentzen等,Lipids 100:161-166,1998)。除了三酰甘油的 生物合成以外,G3P也在甘油合成中发挥作用。

该合成所必需的G3P通过以甘油-3-磷酸脱氢酶(G3PDH,也称为二羟 丙磷酸还原酶)还原二羟丙酮磷酸(DHAP)来合成。通常,NADH作为还 原性同底物(EC 1.1.1.8)。另一类甘油-3-磷酸脱氢酶(EC 1.1.99.5)利用FAD 作为同底物。这一类别的酶催化DHAP到G3PDH的反应。在真核细胞中, 这两类酶分布在不同区室中,NAD依赖性的酶位于胞质溶胶中,FAD依 赖性的酶位于线粒体中(就酿酒酵母而言,参阅如Larsson等,Yeast 14:347-357,1998)。

WO 2003/095655公开了通过表达来自酵母的甘油-3-磷酸脱氢酶 (G3PDH)来提高转基因植物的总含油量。

此外,WO 2004/039946公开了基于改变FAD2mRNA或FAD2蛋白 的浓度来提高植物的含油量的方法。

WO2004/057946描述了通过使用表达豆血红蛋白和/或血红蛋白的转 化植物来改变植物中贮藏物质含量的方法。

磷酸核糖焦磷酸合酶(PRS;EC 2.7.6.1)催化5-磷酸核糖基α-1-焦磷酸 (PRPP)的形成,其中焦磷酸基从ATP转移至核糖5-磷酸(R5P)(Kronberg 等,1955)。该反应通过R5P中C1-OH基对ATP中β-磷酰基的亲核攻击来 进行。就其本身而言,5-磷酸核糖α-1-焦磷酸(PRPP)在从头合成和补救途 径(再循环)中都作为合成所有其他核苷酸的中心化合物而是必需的,因此 是整个细胞代谢中重要的中间体。

由于在代谢中的这种中心作用,所有的生命形式中都具有编码PRS的 至少一个PRS基因拷贝也就不足为奇了(Krath等,1999)。PRS已在分子和 生化平在多种生物中进行了表征,如(Fox&Kelly,1971)、大肠杆菌 (Hove-Jensen等,1986)、枯草芽孢杆菌(Bacillus subtilis)(Arnvig等,1990)、 酿酒酵母(Saccharomyces cervisiae)(Carter等,1994)和拟南芥(A. thaliana)(Krath等,1999)等。原核生物仅有一个PRS基因拷贝,而真核生 物则含有多种同工型。大鼠和人分别具有两个和三个PRS基因(Taira等, 1987),菠菜中可鉴定出四种同工型(Krath&Hove-Jensen,1999),拟南芥 中有五种同工型,白杨树(Populus trichocarpa)中甚至有6种同工型。菠菜 的四种同工型中有两种位于细胞器中,另一种在胞质溶胶中(Krath等, 1999)。

PRS蛋白可分为两类。第I类(“经典”PRS)代表例如大肠杆菌、枯草芽 孢杆菌、哺乳动物的酶以及一些植物同工型。相反,第二类看来是植物特 异性的,包括如菠菜的PRS同工型3和4(Krath等,1999)。这两类是基于 其酶特性来区分的。I类PRS的活性和稳定性取决于Pi的供给,而II类 酶的活性则不然。与第二类PRS相反,第一类“经典”酶被ADP(腺苷5’- 二磷酸)别构抑制。还发现了底物特异性的差异:“经典”酶特别地使用 ATP(腺苷5’-三磷酸)作为底物,在一些情况下也使用dATP,而II类酶具 有更宽的底物谱。除了ATP和dATP以外,它们还接受GTP、CTP和UTP。 这两类酶的这些重大的酶特性差异还反映在其基酸序列的低相似性 (Krath等,1999;Krath&Hove-Jensen,1999;2001)。

美国申请20050176033公开了使用来自大肠杆菌的磷酸核糖焦磷酸合 酶(PRPP合酶)的反馈抗性突变体来制备L-组氨酸。5-磷酸核糖α-1-焦磷酸 (PRPP)和腺苷5’-三磷酸(ATP)是组氨酸生物合成的起始材料。

美国申请20020137169还公开了过表达编码PRPP合酶的PRS基因(登 录号U76387)。这时,将PRS基因与编码烟酸核苷酸焦磷酸化酶蛋白的 nadC基因一起过表达,用于制备烟酸及其衍生物。

迄今为止,还没有发现核苷酸可用性在脂质合成中的重要性。

如上文所述,对于植物中生长与产生防御化合物或贮藏产物之间的关 系还没有重要的发现。

但基于目前的知识,可以推测,植物中在生长、产生防御化合物和贮 藏产物之间存在对代谢物分布的严谨调节。

例如,根冠干重比提高主要是由于枝条干重相对降低。种子产量与地 上部分干重的比值在许多环境条件下都相对稳定,因此经常可在植物大小 与籽粒产量之间获得强相关性。这些过程之间存在内在联系,因为大部分 籽粒生物量取决于当前植物的叶和茎中贮藏的光合作用生产

需要鉴定植物中能提高产量的基因。本发明的一个目的是鉴定赋予植 物或植物细胞提高的产量的新方法。

本发明的另一目的是提出提高植物产量的生物技术方法作为替代性的 可再生能源

还非常需要提高可栽培植物的产量,优选这些植物的种子产量。除了 提高植物产量(优选为所用植物生物的高收获产量)以外,应从该种子中培 养迅速且强健地生长的幼苗。此外,除了产生期望特征的改变(例如产量提 高,优选生物量或总含油量提高,以及本发明方法所产生种子长出的幼苗 生长更为迅速)以外,这样的方法不应给植物生物带来任何其他不期望或负 面的特性。因此,例如为了提高转基因植物的总含油量,应向植物中引入 尽可能少的基因。此外,该方法应该简单且经济。

因此,在第一个实施方案中,本发明提供用于产生转基因植物细胞或 植物的方法,所述转基因植物细胞或植物与相应的(未转化)野生型或起始 植物细胞相比,通过提高或产生一种或多种活性而具有提高的产量,所述 活性选自磷酸核糖焦磷酸合酶。

就本发明的描述而言,增强或提高的“产量”指选自以下的一个或多个 产量参数:生物量、干生物量产量、地上部分生物量产量、地下部分干生 物量产量、鲜重生物量产量、地上部分鲜重生物量产量、地下部分鲜重生 物量产量;提高的可收获部分产量,其可以是干重或鲜重或二者皆有,地 上部分或地下部分或二者皆有;增加的作物果实,其可以是干重或鲜重或 二者皆有,地上部分或地下部分或二者皆有;优选提高的种子产量,其可 以是干重或鲜重或二者皆有,地上部分或地下部分或二者皆有;幼苗的鲜 重积累、花结(rosette)鲜重、植物高度、总氨基酸含量、总核苷酸含量、总 含油量、总含脂量。

“产量”的含义主要取决于目的作物,应该理解,每个特定情况下,本 领域技术人员会明白在本说明书中的含义。

在一个实施方案中,通过提高一种或多种蛋白质的量和/或活性来提高 所述活性,所述蛋白质具有选自以下的活性:磷酸核糖焦磷酸合酶,以及 包含选自SEQ ID NO:2,4,13,51,52,53,54,55,56,57,58,59,60,61,62, 63,51,52,53,54,55,56,57,58,59,60,61,62,63,7,8,9,10,11,14,15,16, 17,18的多肽的多肽。

在一个实施方案中,与相应(未转化)野生型或起始植物细胞相比通过 提高或产生选自磷酸核糖焦磷酸合酶的一种或多种活性而具有提高的产量 的转基因植物细胞、植物或其部分与相应(未转化)野生型或起始光合活性 生物相比显示出提高的生物量产量。

在一个实施方案中,与相应(未转化)野生型或起始植物细胞相比通过 提高或产生选自磷酸核糖焦磷酸合酶的一种或多种活性而具有提高的产量 的转基因植物细胞、植物或其部分与相应(未转化)野生型或起始光合活性 生物相比显示出提高的干生物量产量。

在一个实施方案中,与相应(未转化)野生型或起始植物细胞相比通过 提高或产生选自磷酸核糖焦磷酸合酶的一种或多种活性而具有提高的产量 的转基因植物细胞、植物或其部分与相应(未转化)野生型光合活性生物相 比显示出提高的地上部分干生物量产量。

在一个实施方案中,与相应(未转化)野生型或起始植物细胞相比通过 提高或产生选自磷酸核糖焦磷酸合酶的一种或多种活性而具有提高的产量 的转基因植物细胞、植物或其部分与相应(未转化)野生型光合活性生物相 比显示出提高的地下部分干生物量产量。

在一个实施方案中,与相应(未转化)野生型或起始植物细胞相比通过 提高或产生选自磷酸核糖焦磷酸合酶的一种或多种活性而具有提高的产量 的转基因植物细胞、植物或其部分与相应(未转化)野生型光合活性生物相 比显示出提高的鲜重生物量产量。

在一个实施方案中,与相应(未转化)野生型或起始植物细胞相比通过 提高或产生选自磷酸核糖焦磷酸合酶的一种或多种活性而具有提高的产量 的转基因植物细胞、植物或其部分与相应(未转化)野生型光合活性生物相 比显示出提高的地上部分鲜重生物量产量。

在一个实施方案中,与相应(未转化)野生型或起始植物细胞相比通过 提高或产生选自磷酸核糖焦磷酸合酶的一种或多种活性而具有提高的产量 的转基因植物细胞、植物或其部分与相应(未转化)野生型光合活性生物相 比显示出提高的地下部分鲜重生物量产量。

在一个实施方案中,与相应(未转化)野生型或起始植物细胞相比通过 提高或产生选自磷酸核糖焦磷酸合酶的一种或多种活性而具有提高的产量 的转基因植物细胞、植物或其部分与相应(未转化)野生型光合活性生物相 比显示出提高的植物可收获部分产量。

在一个实施方案中,与相应(未转化)野生型或起始植物细胞相比通过 提高或产生选自磷酸核糖焦磷酸合酶的一种或多种活性而具有提高的产量 的转基因植物细胞、植物或其部分与相应(未转化)野生型光合活性生物相 比显示出提高的植物干可收获部分产量。

在一个实施方案中,与相应(未转化)野生型或起始植物细胞相比通过 提高或产生选自磷酸核糖焦磷酸合酶的一种或多种活性而具有提高的产量 的转基因植物细胞、植物或其部分与相应(未转化)野生型光合活性生物相 比显示出提高的植物地上部分干可收获部分产量。

在一个实施方案中,与相应(未转化)野生型或起始植物细胞相比通过 提高或产生选自磷酸核糖焦磷酸合酶的一种或多种活性而具有提高的产量 的转基因植物细胞、植物或其部分与相应(未转化)野生型光合活性生物相 比显示出提高的植物地下部分干可收获部分产量。

在一个实施方案中,与相应(未转化)野生型或起始植物细胞相比通过 提高或产生选自磷酸核糖焦磷酸合酶的一种或多种活性而具有提高的产量 的转基因植物细胞、植物或其部分与相应(未转化)野生型光合活性生物相 比显示出提高的植物鲜重可收获部分产量。

在一个实施方案中,与相应(未转化)野生型或起始植物细胞相比通过 提高或产生选自磷酸核糖焦磷酸合酶的一种或多种活性而具有提高的产量 的转基因植物细胞、植物或其部分与相应(未转化)野生型光合活性生物相 比显示出提高的植物地上部分鲜重可收获部分产量。

在一个实施方案中,与相应(未转化)野生型或起始植物细胞相比通过 提高或产生选自磷酸核糖焦磷酸合酶的一种或多种活性而具有提高的产量 的转基因植物细胞、植物或其部分与相应(未转化)野生型光合活性生物相 比显示出提高的植物地下部分鲜重可收获部分产量。

在一个实施方案中,与相应(未转化)野生型或起始植物细胞相比通过 提高或产生选自磷酸核糖焦磷酸合酶的一种或多种活性而具有提高的产量 的转基因植物细胞、植物或其部分与相应(未转化)野生型光合活性生物相 比显示出提高的作物果实产量。

在一个实施方案中,与相应(未转化)野生型或起始植物细胞相比通过 提高或产生选自磷酸核糖焦磷酸合酶的一种或多种活性而具有提高的产量 的转基因植物细胞、植物或其部分与相应(未转化)野生型光合活性生物相 比显示出提高的鲜作物果实产量。

在一个实施方案中,与相应(未转化)野生型或起始植物细胞相比通过 提高或产生选自磷酸核糖焦磷酸合酶的一种或多种活性而具有提高的产量 的转基因植物细胞、植物或其部分与相应(未转化)野生型光合活性生物相 比显示出提高的干作物果实产量。

在一个实施方案中,与相应(未转化)野生型或起始植物细胞相比通过 提高或产生选自磷酸核糖焦磷酸合酶的一种或多种活性而具有提高的产量 的转基因植物细胞、植物或其部分与相应(未转化)野生型光合活性生物相 比显示出提高的籽粒干重。

在一个实施方案中,与相应(未转化)野生型或起始植物细胞相比通过 提高或产生选自磷酸核糖焦磷酸合酶的一种或多种活性而具有提高的产量 的转基因植物细胞、植物或其部分与相应(未转化)野生型光合活性生物相 比显示出提高的种子产量。

在一个实施方案中,与相应(未转化)野生型或起始植物细胞相比通过 提高或产生选自磷酸核糖焦磷酸合酶的一种或多种活性而具有提高的产量 的转基因植物细胞、植物或其部分与相应(未转化)野生型光合活性生物相 比显示出提高的鲜重种子产量。

在一个实施方案中,与相应(未转化)野生型或起始植物细胞相比通过 提高或产生选自磷酸核糖焦磷酸合酶的一种或多种活性而具有提高的产量 的转基因植物细胞、植物或其部分与相应(未转化)野生型光合活性生物相 比显示出提高的干种子产量。

在一个实施方案中,与相应(未转化)野生型或起始植物细胞相比通过 提高或产生选自磷酸核糖焦磷酸合酶的一种或多种活性而具有提高的产量 的转基因植物细胞、植物或其部分与相应(未转化)野生型光合活性生物相 比显示出提高的幼苗鲜重产量。

在一个实施方案中,与相应(未转化)野生型或起始植物细胞相比通过 提高或产生选自磷酸核糖焦磷酸合酶的一种或多种活性而具有提高的产量 的转基因植物细胞、植物或其部分与相应(未转化)野生型光合活性生物相 比显示出提高的花结鲜重产量。

在一个实施方案中,与相应(未转化)野生型或起始植物细胞相比通过 提高或产生选自磷酸核糖焦磷酸合酶的一种或多种活性而具有提高的产量 的转基因植物细胞、植物或其部分与相应(未转化)野生型光合活性生物相 比显示出提高的植物高度。

在一个实施方案中,与相应(未转化)野生型或起始植物细胞相比通过 提高或产生选自磷酸核糖焦磷酸合酶的一种或多种活性而具有提高的产量 的转基因植物细胞、植物或其部分与相应(未转化)野生型光合活性生物相 比显示出提高的总氨基酸含量产量。

在一个实施方案中,与相应(未转化)野生型或起始植物细胞相比通过 提高或产生选自磷酸核糖焦磷酸合酶的一种或多种活性而具有提高的产量 的转基因植物细胞、植物或其部分与相应(未转化)野生型光合活性生物相 比显示出提高的总核苷酸含量产量。

在一个实施方案中,与相应(未转化)野生型或起始植物细胞相比通过 提高或产生选自磷酸核糖焦磷酸合酶的一种或多种活性而具有提高的产量 的转基因植物细胞、植物或其部分与相应(未转化)野生型光合活性生物相 比显示出提高的总含油量产量。

在一个实施方案中,与相应(未转化)野生型或起始植物细胞相比通过 提高或产生选自磷酸核糖焦磷酸合酶的一种或多种活性而具有提高的产量 的转基因植物细胞、植物或其部分与相应(未转化)野生型光合活性生物相 比显示出提高的总脂类含量产量。

本发明的光合活性生物包括植物细胞、植物或其部分;起始植物细胞 以及植物的某些组织、器官和部分;植物的繁殖材料(如种子、茎和果实) 或种子;以及植物的所有表现形式,例如花药、纤维、根毛、茎、叶、胚、 愈伤组织、子叶、叶柄、枝、幼苗、收获材料、植物组织;来自实际转基 因植物和/或可用于产生转基因植物的生殖组织和细胞培养物。还包括成熟 植物。成熟植物应理解为幼苗之后任何发育阶段的植物。幼苗是早期发育 阶段的年幼未成熟植物。

在一个实施方案中,术语“提高的产量”指该光合活性生物(特别是植物) 与相应的野生型光合活性生物相比显示出提高的生长速率。提高的生长速 率可通过以下方面来反映:完整植物的生物量产生提高,或植物地上部分 的生物量产生提高,或者植物地下部分的生物量产生提高,或植物部分(如 茎、叶、花、果实和/或种子)的生物量产生提高等。

在一个实施方案中,提高的产量包括更高的果实产量、更高的种子产 量、更高的鲜物质产生和/或更高的干物质产生。

在另一实施方案中,本发明满足了对鉴定能在表达或过表达内源和/ 或外源基因后赋予光合活性生物(特别是植物)产量提高的新的独特基因的 需要。

在另一实施方案中,本发明满足了对鉴定能在表达或过表达内源基因 后赋予光合活性生物(特别是植物)产量提高的新独特基因的需要。

在另一实施方案中,本发明满足了对鉴定能在表达或过表达外源基因 后赋予光合活性生物(特别是植物)产量提高的新独特基因的需要。

在一个实施方案中,本发明涉及产生转基因光合活性生物或其部分(优 选植物细胞、植物或其部分)的方法,所述光合活性生物或其部分与相应的 未转化野生型光合活性生物或其部分(优选植物细胞、植物或其部分)相比 具有提高的产量,该方法包括

(a)在光合活性生物或其部分(优选植物细胞、植物或其部分)中提高或 产生选自磷酸核糖焦磷酸合酶的一种或多种活性,和

(b)在允许与相应的未转化野生型光合活性生物或其部分(优选植物细 胞、植物或其部分)相比具有提高的产量的光合活性生物或其部分(优选植 物细胞、植物或其部分)发育的条件下,培养所述光合活性生物或其部分(优 选植物细胞、植物或其部分)。

在一个实施方案中,本发明涉及产生转基因光合活性生物或其部分(优 选植物细胞、植物或其部分)的方法,所述光合活性生物或其部分与相应的 未转化野生型光合活性生物或其部分(优选植物细胞、植物或其部分)相比 具有提高的产量,该方法包括

(a)在光合活性生物细胞的质体中提高或产生选自磷酸核糖焦磷酸合 酶的一种或多种活性,和

(b)在允许与相应的未转化野生型光合活性生物或其部分(优选植物细 胞、植物或其部分)相比具有提高的产量的光合活性生物或其部分(优选植 物细胞、植物或其部分)发育的条件下,培养所述光合活性生物或其部分(优 选植物细胞、植物或其部分)。

在一个实施方案中,本发明涉及产生转基因光合活性生物或其部分(优 选植物细胞、植物或其部分)的方法,所述光合活性生物或其部分与相应的 未转化野生型光合活性生物或其部分(优选植物细胞、植物或其部分)相比 具有提高的产量,该方法包括

(a)在光合活性生物细胞的胞质中提高或产生选自磷酸核糖焦磷酸合 酶的一种或多种活性,和

(b)在允许与相应的未转化野生型光合活性生物或其部分(优选植物细 胞、植物或其部分)相比具有提高的产量的光合活性生物或其部分(优选植 物细胞、植物或其部分)发育的条件下,培养所述光合活性生物或其部分(优 选植物细胞、植物或其部分)。

在一个实施方案中,本发明涉及产生转基因光合活性生物或其部分(优 选植物细胞、植物或其部分)的方法,所述光合活性生物或其部分与相应的 未转化野生型光合活性生物或其部分(优选植物细胞、植物或其部分)相比 具有提高的产量,该方法包括

(a)在光合活性生物或其部分(优选植物细胞、植物或其部分)中提高或 产生蛋白质的活性,所述蛋白质选自SEQ ID NO:2,4,13,51,52,53,54,55, 56,57,58,59,60,61,62,63,51,52,53,54,55,56,57,58,59,60,61,62,63或 其同源物,和

(b)在允许与相应的未转化野生型光合活性生物或其部分(优选植物)相 比具有提高的产量的光合活性生物或其部分(优选植物细胞、植物或其部分) 发育的条件下,培养所述光合活性生物或其部分(优选植物细胞、植物或其 部分)。

在一个实施方案中,本发明涉及产生转基因光合活性生物或其部分(优 选植物细胞、植物或其部分)的方法,所述光合活性生物或其部分与相应的 未转化野生型光合活性生物或其部分(优选植物细胞、植物或其部分)相比 具有提高的产量,该方法包括

(a)在光合活性生物细胞的质体中提高或产生蛋白质的活性,所述蛋白 质选自SEQ ID NO:2,4,13,51,52,53,54,55,56,57,58,59,60,61,62,63, 51,52,53,54,55,56,57,58,59,60,61,62,63或其同源物,和

(b)在允许与相应的未转化野生型光合活性生物或其部分(优选植物)相 比具有提高的产量的光合活性生物或其部分(优选植物细胞、植物或其部分) 发育的条件下,培养所述光合活性生物或其部分(优选植物细胞、植物或其 部分)。

在一个实施方案中,本发明涉及产生转基因光合活性生物或其部分(优 选植物细胞、植物或其部分)的方法,所述光合活性生物或其部分与相应的 未转化野生型光合活性生物或其部分(优选植物细胞、植物或其部分)相比 具有提高的产量,该方法包括

(a)在光合活性生物的胞质中提高或产生蛋白质的活性,所述蛋白质选 自SEQ ID NO:2,4,13,51,52,53,54,55,56,57,58,59,60,61,62,63,51, 52,53,54,55,56,57,58,59,60,61,62,63或其同源物,和

(b)在允许与相应的未转化野生型光合活性生物或其部分(优选植物)相 比具有提高的产量的光合活性生物或其部分(优选植物细胞、植物或其部分) 发育的条件下,培养所述光合活性生物或其部分(优选植物细胞、植物或其 部分)。

因此,本发明涉及产生转基因植物细胞、植物或其部分的方法,所述 转基因植物细胞、植物或其部分与相应的未转化野生型转基因植物细胞、 植物或其部分相比具有增强的营养限制耐性和/或提高的产量,该方法包括

(a)在植物细胞的质体中提高或产生选自磷酸核糖焦磷酸合酶的一种 或多种活性,和

(b)在允许与相应的未转化野生型植物相比具有增强的营养限制耐性 和/或提高的产量的植物发育的条件下,培养所述植物细胞。

在另一实施方案中,本发明涉及产生转基因植物细胞、植物或其部分 的方法,所述植物细胞、植物或其部分与相应的未转化野生型植物细胞、 植物或其部分相比具有增强的营养限制耐性和/或提高的产量,该方法包括

(a)在植物细胞的胞质中提高或产生选自磷酸核糖焦磷酸合酶的一种 或多种活性,和

(b)在允许与相应的未转化野生型植物相比具有增强的营养限制耐性 和/或提高的产量的植物发育的条件下,培养所述植物细胞。

在另一实施方案中,本发明涉及产生转基因植物细胞、植物或其部分 的方法,所述光合活性生物或其部分与相应的未转化野生型植物细胞、植 物或其部分相比具有增强的营养限制耐性和/或提高的产量,该方法包括

(a)在植物细胞的质体中提高或产生蛋白质的活性,所述蛋白质选自 SEQ ID NO:2,4,13,51,52,53,54,55,56,57,58,59,60,61,62,63,51,52, 53,54,55,56,57,58,59,60,61,62,63或其同源物,和

(b)在允许与相应的未转化野生型植物相比具有增强的营养限制耐性 和/或提高的产量的植物发育的条件下,培养所述植物细胞。

在一个实施方案中,本发明涉及产生转基因植物细胞、植物或其部分 的方法,所述光合活性生物或其部分与相应的未转化野生型植物细胞、植 物或其部分相比具有增强的营养限制耐性和/或提高的产量,该方法包括

(a)在植物细胞的胞质中提高或产生蛋白质的活性,所述蛋白质选自 SEQ ID NO:2,4,13,51,52,53,54,55,56,57,58,59,60,61,62,63,51,52, 53,54,55,56,57,58,59,60,61,62,63或其同源物,和

(b)在允许与相应的未转化野生型植物相比具有增强的营养限制耐性 和/或提高的产量的植物发育的条件下,培养所述植物细胞。

在另一实施方案中,本发明涉及产生转基因植物细胞、植物或其部分 的方法,所述植物细胞、植物或其部分与相应的未转化野生型植物细胞、 植物或其部分相比具有提高的产量,该方法包括

(a)在植物细胞的细胞器中提高或产生选自磷酸核糖焦磷酸合酶的一 种或多种活性,或者

(b)在植物细胞中提高或产生蛋白质的活性,所述蛋白质选自由选自 SEQ ID NO:1,3,12,38,39,40,41,42,43,44,45,46,47,48,49,50或其同 源物的核酸序列所编码的SEQ ID NOs:2,4,13,51,52,53,54,55,56,57, 58,59,60,61,62,63或其同源物,所述核酸序列与编码转运肽的核酸序列 连接,或者

(c)在植物细胞中提高或产生蛋白质的活性,所述蛋白质选自由选自 SEQ ID NO:1,3,12,38,39,40,41,42,43,44,45,46,47,48,49,50或其同 源物的核酸序列所编码的SEQ ID NOs:2,4,13,51,52,53,54,55,56,57, 58,59,60,61,62,63或其同源物,所述核酸序列与编码叶绿体定位序列的 核酸序列连接,和

(d)在允许与相应的未转化野生型植物相比具有提高的产量的植物发 育的条件下,培养所述植物细胞。

在另一实施方案中,本发明涉及产生转基因植物细胞、植物或其部分 的方法,所述植物细胞、植物或其部分与相应的未转化野生型植物细胞、 植物或其部分相比具有提高的产量,该方法包括

(a)通过转化细胞器而在植物的细胞器中提高或产生蛋白质的活性,所 述蛋白质选自由选自SEQ ID NO:1,3,12,38,39,40,41,42,43,44,45,46, 47,48,49,50或其同源物的核酸序列所编码的SEQ ID NOs:2,4,13,51,52, 53,54,55,56,57,58,59,60,61,62,63或其同源物,或者

(b)通过转化质体而在植物或其一个或多个部分的质体中提高或产生 蛋白质的活性,所述蛋白质选自由选自SEQ ID NO:1,3,12,38,39,40,41, 42,43,44,45,46,47,48,49,50或其同源物的核酸序列所编码的SEQ ID NOs:2,4,13,51,52,53,54,55,56,57,58,59,60,61,62,63或其同源物,和

(c)在允许与相应的未转化野生型植物相比具有提高的产量的植物发 育的条件下,培养所述植物细胞。

原则上,编码转运肽的核酸序列可分离自每种生物,例如微生物,例 如含有质体(优选叶绿体)的藻类或植物。“转运肽”是一种氨基酸序列,其 编码核酸序列与相应的结构基因一起被翻译。这意味着转运肽是翻译后蛋 白质的整体部分,形成了蛋白质的氨基酸端延伸。这两者一起翻译成所谓 的“前蛋白”。一般而言,转运肽在蛋白质运输进正确的细胞器(如质体)的 过程中或运输后立即被切下,得到成熟蛋白。转运肽通过协助蛋白质转运 穿过胞内膜而确保了成熟蛋白的正确定位。

编码转运肽的优选核酸序列来自最终位于质体并且来自于选自以下的 生物的核酸序列:伞藻属(Acetabularia)、拟南芥属(Arabidopsis)、芸苔属 (Brassica)、辣椒属(Capsicum)、衣藻属(Chlamydomonas)、南瓜属 (Cururbita)、杜氏藻属(Dunaliella)、裸藻属(Euglena)、黄花菊属(Flaveria)、 大豆属(Glycine)、向日葵属(Helianthus)、大麦属(Hordeum)、浮萍属 (Lemna)、黑麦草属(Lolium)、番茄属(Lycopersion)、苹果属(Malus)、苜 蓿属(Medicago)、日中花属(Mesembryanthemum)、烟草属(Nicotiana)、月 见草属(Oenotherea)、稻属(Oryza)、牵属(Petunia)、菜豆属(Phaseolus)、 剑叶藓属(Physcomitrella)、松属(Pinus)、豌豆属(Pisum)、萝卜属 (Raphanus)、蝇子草属(Silene)、芥属(Sinapis)、茄属(Solanum)、菠菜属 (Spinacea)、甜菊属(Stevia)、集球藻属(Synechococcus)、小麦属(Triticum) 和玉蜀黍属(Zea)。

有利地,有益地用于本发明方法中的这些转运肽来自编码选自以下蛋 白质的核酸序列:核酮糖二磷酸羧化酶/加酶、5-烯醇式丙酮酰莽草酸-3- 磷酸合酶、乙酰乳酸合酶、叶绿体核糖体蛋白CS17、Cs蛋白、氧还蛋 白、质体蓝素、核酮糖二磷酸羧化酶活化酶、色氨酸合酶、酰基载体蛋白、 质体陪伴蛋白-60、细胞色素c552、22-kDA热休克蛋白、33-kDa氧相关增 强子蛋白1(Oxygen-evolving enhancer protein 1)、ATP合酶γ亚基、ATP 合酶δ亚基、叶绿素-a/b-结合蛋白II-1、氧相关增强子蛋白2、氧相关增 强子蛋白3、光系统I:P21、光系统I:P28、光系统I:P30、光系统I:P35、 光系统I:P37、甘油-3-磷酸酰基转移酶、叶绿素a/b结合蛋白、CAB2蛋 白、羟甲基胆色烷合酶、丙酮酸-正磷酸双激酶、CAB3蛋白、质体铁蛋白、 铁蛋白、早期光诱导蛋白、谷氨酸-1-半氨基转移酶、原叶绿素还原酶、 淀粉粒结合的淀粉酶合酶(starch-granule-bound amylase synthase)、光系统 II的光收获叶绿素a/b结合蛋白、主要花粉变应原Lol p 5a、质体ClpB ATP 依赖性蛋白酶、超氧化物歧化酶、铁氧还蛋白NADP氧化还原酶、28-kDa 核糖核蛋白、31-kDa核糖核蛋白、33-kDa核糖核蛋白、乙酰乳酸合酶、 ATP合酶CF0亚基1、ATP合酶CF0亚基2、ATP合酶CF0亚基3、ATP 合酶CF0亚基4、细胞色素f、ADP-葡萄糖焦磷酸化酶、谷氨酰胺合酶、 谷氨酰胺合酶2、酸酐酶、GapA蛋白、热休克蛋白hsp21、磷酸易位酶、 质体ClpA ATP依赖性蛋白酶、质体核糖体蛋白CL24、质体核糖体蛋白 CL9、质体核糖体蛋白PsCL18、质体核糖体蛋白PsCL25、DAHP合酶、 淀粉磷酸化酶、根酰基载体蛋白II、甜菜醛脱氢酶、GapB蛋白、谷氨酰 胺合成酶2、磷酸核酮糖激酶、亚硝酸还原酶、核糖体蛋白L12、核糖体 蛋白L13、核糖体蛋白L21、核糖体蛋白L35、核糖体蛋白L40、磷酸丙 糖-3-磷酸甘油酸-磷酸易位蛋白、铁氧还蛋白依赖性谷氨酸合酶、甘油醛-3- 磷酸脱氢酶、NADP依赖性苹果酸酶和NADP苹果酸脱氢酶。

编码转运肽的更优选核酸序列来自编码最终位于质体并且来自于选自 以下生物的蛋白质的核酸序列:地中海伞藻(Acetabularia mediterranea)、 拟南芥(Arabidopsis thaliana)、芸苔(Brassica campestris)、欧洲油菜 (Brassica napus)、辣椒(Capsicum annuum)、雷氏衣藻(Chlamydomonas reinhardtii)、南瓜(Cururbita moschata)、盐生杜氏藻(Dunaliella salina)、 杜氏藻(Dunaliella tertiolecta)、细小裸藻(Euglena gracilis)、Flaveria trinervia、大豆(Glycine max)、向日葵(Helianthus annuus)、大麦(Hordeum vulgare)、浮萍(Lemna gibba)、黑麦草(Lolium perenne)、番茄(Lycopersion esculentum)、苹果(Malus domestica)、野苜蓿(Medicago falcata)、紫苜蓿 (Medicago sativa)、叶日中花(Mesembryanthemum crystallinum)、白花 丹叶烟草(Nicotiana plumbaginifolia)、美花烟草(Nicotiana sylvestris)、烟 草(Nicotiana tabacum)、月见草(Oenotherea hookeri)、稻(Oryza sativa)、 碧冬茄(Petunia hybrida)、菜豆(Phaseolus vulgaris)、展叶剑叶藓 (Physcomitrella patens)、黑松(Pinus tunbergii)、豌豆(Pisum sativum)、萝 卜(Raphanus sativus)、白花蝇子草(Silene pratensis)、白芥(Sinapis alba)、 马铃薯(Solanum tuberosum)、菠菜(Spinacea oleracea)、甜菊(Stevia rebaudiana)、聚球藻属(Synechococcus)、集胞藻属(Synechocystis)、小麦 (Triticum aestivum)和玉米(Zea mays)。

更优选的核酸序列编码如von Heijne等(Plant Molecular Biology Reporter,9(2),104,(1991))所述的转运肽,该文献通过参考并入本文。表 V显示了von Heiine等所述转运肽的一些实例。根据本发明特别是实施例 中的公开内容,本领域技术人员能够将vonHeijne等所公开的其他核酸序 列与表I第5列和第7列中所述核酸序列连接起来。最优选的编码转运肽 的核苷酸序列来自菠菜属,例如叶绿体30S核糖体蛋白PSrp-1、根酰基载 体蛋白II、酰基载体蛋白、ATP合酶:γ亚基、ATP合酶:δ亚基、细胞色 素f、铁氧还蛋白I、铁氧还蛋白NADP氧化还原酶(=FNR)、亚硝酸还原 酶、磷酸核酮糖激酶、质体蓝素或碳酸酐酶。本领域技术人员会理解,可 以从质体定位蛋白中容易地分离编码转运肽的多种其他核酸序列,所述蛋 白从核基因中表达为前体,接着靶向至质体。这样的转运肽编码序列可用 于构建其他表达构建体。有利地用于本发明方法并且作为本发明核酸序列 和蛋白质的一部分的转运肽一般长度为20至120个氨基酸,优选25至110、 30至100或35至90个氨基酸,更优选40至85个氨基酸,最优选45至 80个氨基酸,并在翻译后发挥将蛋白质引导至质体(优选叶绿体)的功能。 编码这些转运肽的核酸序列位于编码成熟蛋白的核酸序列的上游。为了将 转运肽编码核酸与编码待靶向蛋白质的核酸正确地进行分子连接,有时必 须在连接位置引入额外的基对,其形成可用于对不同核酸分子进行分子 连接的限制酶识别序列。该方法可导致成熟输入蛋白的N端出现很少的额 外氨基酸,它们通常(并且优选)不干扰蛋白质的功能。在任何情况下,连 接位置处形成限制酶识别序列的额外碱基对都必须慎重选择,以避免形成 终止密码子或编码对蛋白质折叠产生强烈影响的氨基酸(如脯氨酸)的密码 子。优选地,这些额外的密码子编码结构柔软的小氨基酸,例如甘氨酸或 丙氨酸。

因此,如上述,可将编码选自SEQ ID NO:2、4、13、51、52、53、 54、55、56、57、58、59、60、61、62、63或其同源物的蛋白质(由SEQ ID NO:1、3、12、38、39、40、41、42、43、44、45、46、47、48、49、50 或其同源物的核酸序列编码)的核酸序列与编码转运肽的核酸序列连接。这 种编码转运肽的核酸序列确保将该蛋白质运输至质体。待表达基因的核酸 序列与编码转运肽的核酸序列有效连接。因此,转运肽与编码选自SEQ ID NO:2、4、13、51、52、53、54、55、56、57、58、59、60、61、62、63 或其同源物的蛋白质(由SEQ ID NO:1、3、12、38、39、40、41、42、43、 44、45、46、47、48、49、50或其同源物的核酸序列编码)的核酸序列框内 融合。

本发明的术语“细胞器”表示例如“线粒体”或优选地表示“质体”。本发 明的术语“质体”旨在包括多种形式的质体,包括前质体、叶绿体、色质体、 gerontoplast、白色体、造粉体、油质体和黄化质体,优选叶绿体。它们都 具有共同的祖先——前述的前质体。

Schmidt等(J.Biol.Chem.268(36),27447(1993))、Della-Cioppa等 (Plant.Physiol.84,965(1987))、de Castro Silva Filho等(Plant Mol.Biol. 30,769(1996))、Zhao等(J.Biol.Chem.270(11),6081(1995))、等 (Biochem.Biophys.Res.Commun.196(3),1414(1993))、Keegstra等 (Annu.Rev.Plant Physiol.Plant Mol.Biol.40,471(1989))、Lubben等 (Photosynthesis Res.17,173(1988))和Lawrence等(J.Biol.Chem.272 (33),20357(1997))描述了其他转运肽。Kermode Allison R.在Critical Reviews in Plant Science 15(4),285(1996)中以“Mechanisms of Intracellular Protein Transport and Targeting in Plant Cells.”为题描述了 关于靶向的一般性综述。

用于本发明方法中并构成本发明核酸序列一部分的有利的转运肽序列 一般富含羟基化氨基酸残基(丝氨酸和苏氨酸),这两种残基一般构成了总 数的20至35%。它们经常具有不含Gly、Pro和带电残基的氨基末端区域。 此外,它们含有大量小疏水氨基酸,例如缬氨酸和丙氨酸,一般缺少酸性 氨基酸。此外,它们一般具有富含Ser、Thr、Lys和Arg的中间区域。总 体而言,它们通常带有正的净电荷。

或者,可以根据本领域已公开转运肽序列的结构,部分或完全地化学 合成编码转运肽的核酸序列。所述天然或化学合成的序列可以与编码成熟 蛋白的序列直接连接,或者通过接头核酸序列连接,所述接头的长度一般 小于500个碱基对,优选小于450、400、350、300、250或200个碱基对, 更优选小于150、100、90、80、70、60、50、40、或30个碱基对,最优 选小于25、20、15、12、9、6或3个碱基对,并与编码序列符合读框。此 外,编码转运肽的有利的核酸序列可包含来自一种以上生物和/或化学来源 的序列,并可包括在天然状态下与该转运肽相连的来自成熟蛋白氨基端区 域的核酸序列。在本发明的一个优选实施方案中,所述成熟蛋白的氨基端 区域的长度一般小于150个氨基酸,优选小于140、130、120、110、100 或90个氨基酸,更优选小于80、70、60、50、40、35、30、25或20个氨 基酸,最优选小于19、18、17、16、15、14、13、12、11或10个氨基酸。 但更短或更长的节段也是可能的。此外,靶向序列也可以是本发明核酸序 列的一部分,所述靶向序列有利于将蛋白质转运至其他细胞区室,例如液 泡、内质网、高尔基复合体乙醛酸循环体、过氧化物酶体或线粒体。由 所述本发明核酸序列翻译成的蛋白质是一种融合蛋白,这意味着编码转运 肽的核酸序列(例如表I所示,优选该表中的最后一个)与选自SEQ ID NO: 1、3、12、38、39、40、41、42、43、44、45、46、47、48、49、50或其 同源物的核酸序列连接。本领域技术人员能够以功能性方式连接所述序列。 有利地,在转运(优选转运至质体)过程中将转运肽部分从选自SEQ ID NO: 2、4、13、51、52、53、54、55、56、57、58、59、60、61、62、63或其 同源物的蛋白质部分上切下。表I最后一行所示优选转运肽的所有切割产 物均优选地在选自SEQ ID NO:2、4、13、51、52、53、54、55、56、57、 58、59、60、61、62、63或其同源物的蛋白质的起始甲硫氨酸之前具有N 端氨基酸序列QIA CSS或QIA EFQLTT。在选自SEQ ID NO:2、4、13、 51、52、53、54、55、56、57、58、59、60、61、62、63或其同源物的蛋 白质的起始甲硫氨酸之前还可以存在1至20个氨基酸、优选2至15个氨 基酸、更优选3至10个氨基酸、最优选4至8个氨基酸的其他短氨基酸序 列。对于氨基酸序列QIA CSS的情况,起始甲硫氨酸之前的三个氨基酸来 自于LIC=(ligatation independent cloning,连接独立的克隆)盒。所述短氨 基酸序列在表达大肠杆菌基因时是优选的。对于氨基酸序列QIA EFQLTT 的情况,起始甲硫氨酸之前的六个氨基酸来自于LIC盒。所述短氨基酸序 列在表达酿酒酵母基因时是优选的。本领域技术人员了解,其他短序列也 可用于表达选自SEQ ID NO:1、3、12、38、39、40、41、42、43、44、 45、46、47、48、49、50或其同源物的基因。此外,本领域技术人员理解, 这些短序列不是基因表达中必需的。

表I:von Heijne等公开的转运肽实例

  转   运   肽   生物   转运肽   SEQ   ID   NO:   参考文献   1   地中   海伞   藻   MASIMMNKSVVLSKECAKPLATPK   VTLNKRGFATTIATKNREMMVWQP   FNNKMFETFSFLPP   19   Mol.Gen.   Genet.218,   445(1989)   2   拟南   芥   MAASLQSTATFLQSAKIATAPSRG   SSHLRSTQAVGKSFGLETSSARLT   CSFQSDFKDFTGKCSDAVKIAGFA   LATSALVVSGASAEGAPK   20   EMBO J.8,   3187(1989)   3   拟南   芥   MAQVSRICNGVQNPSLICNLSKSS   QRKSPLSVSLKTQQHPRAYPISSS   WGLKKSGMTLIGSELRPLKVMSSV   STAEKASEIVLQPIREISGLIKLP   21   Mol.Gen.   Genet.210,   437(1987)   4   拟南   芥   MAAATTTTTTSSSISFSTKPSPSS   SKSPLPISRFSLPFSLNPNKSSSS   SRRRGIKSSSPSSISAVLNTTTNV   TTTPSPTKPTKPETFISRFAPDQP   RKGA   22   Plant   Physiol.85,   1110(1987)   5   拟南   芥   MITSSLTCSLQALKLSSPFAHGST   PLSSLSKPNSFPNHRMPALVPV   23   J.Biol.   Chem.265,   2763(1990)   6   拟南   芥   MASLLGTSSSAIWASPSLSSPSSKPSSS   PICFRPGKLFGSKLNAGIQI   24   EMBO J.9,   1337(1990)

  转   运   肽   生物  转运肽   SEQ   ID   NO:   参考文献  RPKKNRSRYHVSVMNVATEINSTE  QVVGKFDSKKSARPVYPFAAI   7   拟南   芥  MASTALSSAIVGTSFIRRSPAPISL  RSLPSANTQSLFGLKSGTARGG  RVVAM   25   Plant   Physiol.93,   572(1990)   8   拟南   芥  MAASTMALSSPAFAGKAVNLSPAA  SEVLGSGRVTNRKTV   26   Nucl.Acids   Res.14,   4051(1986)   9   拟南   芥  MAAITSATVTIPSFTGLKLAVSSK  PKTLSTISRSSSATRAPPKLALKS  SLKDFGVIAVATAASIVLAGNAMA  MEVLLGSDDGSLAFVPSEFT   27   Gene 65,59   (1988)   10   拟南   芥  MAAAVSTVGAINRAPLSLNGSGSG  AVSAPASTFLGKKVVTVSRFAQSN  KKSNGSFKVLAVKEDKQTDGDRWR  GLAYDTSDDQIDI   28   Nucl.Acids   Res.17,   2871(1989)   11   拟南   芥  MKSSMLSSTAWTSPAQATMVAPF  TGLKSSASFPVTRKANNDITSITS  NGGRVSC   29   Plant Mol.   Biol.11.   745(1988)   12   拟南   芥  MAASGTSATFRASVSSAPSSSSQL  THLKSPFKAVKYTPLPSSRSKSSS  FSVSCTIAKDPPVLMAAGSDPALW  QRPDSFGRFGKFGGKYVPE   30   Proc.Natl.   Acad.Sci.   USA,86,   4604(1989)   13   芸苔  MSTTFCSSVCMQATSLAATTRISF  QKPALVSTTNLSFNLRRSIPTRFS   31   Nucl.Acids   Res.15,

  转   运   肽   生物   转运肽   SEQ   ID   NO:   参考文献   ISCAAKPETVEKVSKIVKKQLSLK   DDQKVVAE   7197(1987)   14   欧洲   油菜   MATTFSASVSMQATSLATTTRISF   QKPVLVSNHGRTNLSFNLSRTRLSISC   32   Eur.J.Bio-   chem.174,   287(1988)   15   雷氏   衣藻   MQALSSRVNIAAKPQRAQRLVVRA   EEVKAAPKKEVGPKRGSLVK   33   Plant Mol.   Biol.   12,   463(1989)   16   南瓜   MAELIQDKESAQSAATAAAASSGY   ERRNEPAHSRKFLEVRSEEELLSCIK   K   34   FEBS  Lett.   238,424   (1988)   17   菠菜   MSTINGCLTSISPSRTQLKNTSTL   RPTFIANSRVNPSSSVPPSLIRNQ   PVFAAPAPIITPTL   35   J.Biol.   Chem.265,   (10)5414   (1990)   18   菠菜   MTTAVTAAVSFPSTKTTSLSARCS   SVISPDKISYKKVPLYYRNVSATG   KMGPIRAQIASDVEAPPPAPAKVEKM   S   36   Curr.   Genet.13,   517(1988)   19   菠菜   MTTAVTAAVSFPSTKTTSLSARSS   SVISPDKISYKKVPLYYRNVSATG   KMGPIRA   37

作为借助于例如表I所述靶向序列(单独或与其他靶向序列结合,优选 靶向质体中的序列)对选自SEQ ID NO:2、4、13、51、52、53、54、55、 56、57、58、59、60、61、62、63或其同源物的序列(优选一般而言在核中 编码的序列)进行靶向的替代,也可以将本发明的核酸直接引入质体基因组 中。因此在一个优选的实施方案中,将选自SEQ ID NO:1、3、12、38、 39、40、41、42、43、44、45、46、47、48、49、50或其同源物的核酸序 列直接引入质体中并表达。

本说明书上下文中的术语“引入”指通过“转染”、“转导”或优选通过“转 化”将核酸序列插入生物中。

如果核酸序列被引入质体中(即,该序列已穿过该质体的膜),则该质 体(例如叶绿体)被该外源(优选外来的)核酸序列“转化”。所述外源DNA可 整合进(共价连接进)组成该质体基因组的质体DNA中,或者可以保持不被 整合(例如,通过包含叶绿体复制起点)。“稳定”整合的DNA序列是这样的 序列,它们在质体复制中遗传,从而将带有所整合DNA序列之特征的新 质体转移至后代中。

为进行表达,本领域技术人员熟悉将核酸序列引入不同细胞器(例如优 选的质体)的不同方法。这些方法公开于例如Maiga P.(Annu.Rev.Plant Biol.55,289(2004)),Evans T.(WO 2004/040973),McBride K.E.等(US 5,455,818),Daniell H.等(US 5,932,479和US 5,693,507)以及Straub J.M. 等(US 6,781,033)。优选的方法是转化小孢子来源的下胚轴或子叶组织(是 绿色的,因此含有大量质体)叶组织,其后在选择培养基上从所述转化的植 物材料再生嫩枝。用于对植物材料进行转化轰击的方法以及独立复制穿梭 载体的使用为本领域技术人员所熟知。还可以进行质体的PEG介导转化, 或者用双元载体进行农杆菌转化。用于质体转化的有用标记是阳性选择标 记,例如氯霉素、链霉素、卡那霉素、新霉素、阿米霉素、大观霉素、三 嗪和/或林可霉素耐性基因。通常作为第二标记的本领域中已知的其他标 记,编码针对除草剂耐性的基因可用于进一步选择,例如膦丝菌素(=草铵 膦,BASTATM,LibertyTM,由bar基因编码)、草甘膦(=N-(膦酰基甲基)甘 氨酸,RoundupTM,由5-烯醇式丙酮基莽草酸-3-磷酸合酶基因=epsps编 码)、磺脲类(如StapleTM,由乙酰乳酸合酶(ALS)基因编码)、咪唑啉酮[=IMI, 如咪草烟,imazamox,ClearfieldTM,由乙酰羟酸合酶(AHAS,也称为乙酰乳 酸合酶(ALS))编码或者溴草腈(=BuctrilTM,由oxy基因编码)或者编码抗生 素(如潮霉素或G418)的基因。这些第二标记在转化多数基因组拷贝的情况 下是有用的。此外,阴性选择标记(如细菌胞嘧啶脱氨酶,由codA基因编 码)也可用于转化质体。

为了提高鉴定转化体的可能性,还期望使用报告基因作为上述耐性基 因的替代或补充。报告基因为例如β-半乳糖苷酶、β-葡糖醛酸糖苷酶(GUS)、 碱性磷酸酶和/或绿色荧光蛋白基因(GFP)。

就本发明方法而言,通过转化质体来阻断种内特异性转基因流是非常 有利的,因为许多物种(例如玉米、花和水稻)具有严格的质体母系遗传。 通过替换植物质体中选自SEQ ID NO:1、3、12、38、39、40、41、42、 43、44、45、46、47、48、49、50或其同源物或活性片段的基因,这些基 因将不会存在于所述植物的花粉中。

本发明的另一优选实施方案涉及使用所谓的“叶绿体定位序列”,其中 第一RNA序列或分子能将第二RNA序列从细胞内的外部环境中或质体外 转运或“陪伴”至叶绿体中,所述第二RNA序列为例如转录自SEQ ID NO: 1、3、12、38、39、40、41、42、43、44、45、46、47、48、49、50或其 同源物的序列,或者是编码选自SEQ ID NO:2、4、13、51、52、53、54、 55、56、57、58、59、60、61、62、63或其同源物的蛋白质的序列。在一 个实施方案中,所述叶绿体定位信号与完整或完好的类病毒序列基本相似 或互补。叶绿体定位信号可由转录成叶绿体定位RNA的DNA序列编码。 术语“类病毒”指天然的单链RNA分子(Flores,C.R.Acad Sci III.324(10), 943(2001))。类病毒通常含有约200-500个核苷酸,并一般作为环状分子存 在。含有叶绿体定位信号的类病毒实例包括但不仅限于ASBVd、PLMVd、 CChMVd和ELVd。类病毒序列或其功能性部分可与选自SEQ ID NO:1、 3、12、38、39、40、41、42、43、44、45、46、47、48、49、50或其同 源物的序列或与编码选自SEQ ID NO:2、4、13、51、52、53、54、55、 56、57、58、59、60、61、62、63或其同源物的蛋白质的序列融合,其融 合方式使得该类病毒序列将选自SEQ ID NO:1、3、12、38、39、40、41、 42、43、44、45、46、47、48、49、50或其同源物的序列或与编码选自SEQ ID NO:2、4、13、51、52、53、54、55、56、57、58、59、60、61、62、 63或其同源物的蛋白质的序列转运进叶绿体中。优选的实施方案使用经修 饰的ASBVd(Navarro等,Virology.268(1),218(2000))。

在另一具体实施方案中,待在质体中表达的蛋白质(例如选自SEQ ID NO:2、4、13、51、52、53、54、55、56、57、58、59、60、61、62、63 或其同源物的蛋白质)由不同的核酸编码。这样的方法公开于WO 2004/040973,其通过参考并入本文。WO 2004/040973教导了这样的方法, 其涉及通过叶绿体定位序列将对应于基因或基因片段的RNA转运进叶绿 体中。将应在植物或植物细胞中表达的基因分成引入植物不同区室(例如 核、质体和/或线粒体)的核酸片段。此外,描述了这样的植物细胞,其中 叶绿体含有在一个末端与编码本发明方法所用蛋白质片段的RNA融合的 核酶,从而该核酶可以将转运的融合RNA反式剪接成编码基因片段的 RNA,以形成核酸片段并可能将其再结合成完整mRNA,其编码选自SEQ ID NO:2、4、13、51、52、53、54、55、56、57、58、59、60、61、62、 63或其同源物的功能蛋白质。

在本发明的一个优选的实施方案中,将本发明方法中所用的选自SEQ ID NO:2、4、13、51、52、53、54、55、56、57、58、59、60、61、62、 63或其同源物的核酸序列转化进有代谢活性的质体中。这些质体应优选地 在目的植物或植物组织中维持高拷贝数,最优选可见于绿色植物组织(例如 叶或子叶或种子)中的叶绿体。

为在质体中良好表达,使用在质体中有活性的优选的启动子和终止子 (优选叶绿体启动子)将选自SEQ ID NO:2、4、13、51、52、53、54、55、 56、57、58、59、60、61、62、63的核酸序列引入表达盒中。这些启动子 的实例包括来自菠菜或豌豆基因的psbA启动子、rbcL启动子以及来自玉 米的atpB启动子。

在本说明书中使用时,“包含/包括”应理解为指存在所述特征、整数、 步骤或组分或其组,但不排除存在或添加一种或多种其他特征、整数、步 骤、组分或其组。

根据本发明,术语“植物细胞”或术语“生物”在本文中理解为总是指植 物的细胞或其细胞器,优选质体,更优选叶绿体。

本文使用的“植物”旨在不仅包括完整植物,而且还包括其部分,即一 种或多种细胞和组织,包括如叶、茎、嫩枝、根、花、果实和种子。

在一个实施方案中,编码磷酸核糖焦磷酸合酶的核酸序列来源于和/ 或分离自选自子囊菌、丝状真菌的真菌,优选选自曲霉属(Aspergillus)、木 霉属(Trichoderma)、阿舒囊霉属(Ashbya)、假囊酵母属(Eremothecium)、 脉孢菌属(Neurospora)、镰孢霉属(Fusarium)、白僵菌属(Beauveria)、被孢 霉属(Mortierella)、水霉属(Saprolegnia)、腐霉属(Pythium)的真菌。

在一个实施方案中,编码磷酸核糖焦磷酸合酶的核酸序列来源于和/ 或分离自选自以下的生物:棉阿舒囊霉(Ashbya gossypii)、烟曲霉 (Aspergillus fumigatus)、黑曲霉(Aspergillus niger)、光滑假丝酵母(Candida glabrata)、粗球孢子菌(Coccidioides immitis)、汉逊德巴利酵母 (Debaryomyces hansenii)、乳酸克鲁维酵母(Kluyveromyces lactis)、洛德酵 母(Lodderomyces elongisporus)、Neosartorya fischeri、树干毕赤酵母 (Pichia stipitis)、酿酒酵母(Saccharomyces cerevisiae)、核盘菌(Sclerotinia sclerotiorum)和Vanderwaltozyma polyspora。

在一个实施方案中,编码磷酸核糖焦磷酸合酶的核酸序列来源于和/ 或分离自棉阿舒囊霉种的真菌。

在本发明的另一变型中,该方法的特征在于编码磷酸核糖焦磷酸合酶 的基因在ADP结合位点区域中含有至少一个点突变。如果可能的话,该 ADP结合位点中的点突变应防止对酶活性不利的别构调节。

在一个优选的实施方案中,将SEQ ID NO:3的核酸序列或其功能等 同物用于该目的。优选地,发现了以下点突变:Leu133Ile和His196Glu。

在一个实施方案中,编码磷酸核糖焦磷酸合酶的核酸序列来源于和/ 或分离自:玉米(玉蜀黍)、小麦、黑麦、燕麦、黑小麦、水稻、大麦、大 豆、花生、棉花、油菜籽(包括芸苔和冬季油菜籽)、木薯、胡椒、向日葵、 亚麻、琉璃苣、红花、亚麻子、报春花、油菜籽、球茎甘蓝、万寿菊;茄 科植物,包括马铃薯、烟草、茄子、西红柿;蚕豆属物种、豌豆、苜蓿、 咖啡、可可、茶、柳属物种、油棕榈、椰子、多年生草本植物、饲料作物 和拟南芥,优选玉米。

出人意料的是,在植物(如拟南芥或烟草(Nicotiana tabacum))中转基因 表达SEQ ID NO:2所示棉阿舒囊霉蛋白和/或转基因表达SEQ ID NO:4 所示的突变棉阿舒囊霉蛋白赋予该转基因植物细胞、植物或其部分与相应 未转化野生型植物细胞、植物或其部分相比提高的产量。

因此,在一个实施方案中,对于在植物细胞、植物或其部分(优选细胞 的胞质)中提高或产生分别包含核酸SEQ ID NO:1或多肽SEQ ID NO:2 的棉阿舒囊霉核酸分子或多肽的活性的情况(例如提高或产生这样的核酸 分子或多肽的活性:分别包含选自SEQ ID NO:7、8、9、10、11的ADP 结合位点的核酸或多肽或多肽基序,或者包含选自SEQ ID No.64、65、66、 67、68、69、70、71、72、73之基序的多肽),赋予了与相应未转化野生型 植物细胞、植物或其部分相比提高的产量。

因此,在一个实施方案中,对于在植物细胞、植物或其部分(优选细胞 的胞质)中提高或产生分别包含核酸SEQ ID NO:3或多肽SEQ ID NO:4 的棉阿舒囊霉核酸分子或多肽的活性的情况(例如提高或产生这样的核酸 分子或多肽的活性:分别包含选自SEQ ID NO:14、15、16、17、18的 ADP结合位点的核酸或多肽或多肽基序,或者包含选自SEQ ID No.64、 65、66、67、68、69、70、71、72、73之基序的多肽),赋予了与相应未转 化野生型植物细胞、植物或其部分相比提高的产量。

因此,在一个实施方案中,对于在植物细胞、植物或其部分(优选细胞 的质体)中提高或产生分别包含核酸SEQ ID NO:1或多肽SEQ ID NO:2 的棉阿舒囊霉核酸分子或多肽的活性的情况(例如提高或产生这样的核酸 分子或多肽的活性:分别包含选自SEQ ID NO:7、8、9、10、11的ADP 结合位点的核酸或多肽或多肽基序,或者包含选自SEQ ID No.64、65、66、 67、68、69、70、71、72、73之基序的多肽),赋予了与相应未转化野生型 植物细胞、植物或其部分相比提高的产量。

因此,在一个实施方案中,对于在植物细胞、植物或其部分(优选细胞 的质体)中提高或产生分别包含核酸SEQ ID NO:3或多肽SEQ ID NO:4 的棉阿舒囊霉核酸分子或多肽的活性的情况(例如提高或产生这样的核酸 分子或多肽的活性:分别包含选自SEQ ID NO:14、15、16、17、18的 ADP结合位点的核酸或多肽或多肽基序,或者包含选自根据SEQ ID No. 64、65、66、67、68、69、70、71、72、73之基序的多肽),赋予了与相应 未转化野生型植物细胞、植物或其部分相比提高的产量。

除非另外指明,否则术语“多核苷酸”、“核酸”和“核酸分子”在本文中 可互换使用。除非另外指明,否则术语“肽”、“多肽”和“蛋白质”在本文中 可互换使用。术语“序列”可涉及多核苷酸、核酸、核酸分子、肽、多肽和 蛋白质,这取决于使用术语“序列”的上下文。本文使用的术语“基因”、“多 核苷酸”、“核酸序列”、“核苷酸序列”或“核酸分子”指任何长度的核苷酸(核 糖核苷酸或脱氧核糖核苷酸)聚合形式。该术语仅涉及分子的一级结构。

因此,本文使用的术语“基因”、“多核苷酸”、“核酸序列”、“核苷酸序 列”或“核酸分子”包括双链或单链的DNA和/或RNA。它们还包括已知类 型的修饰,例如甲基化、“加帽”、将一个或多个天然核苷酸替换为类似物。 优选地,所述DNA或RNA序列包含编码本文所述多肽的编码序列。

“编码序列”是核苷酸序列,其转录成RNA,例如调节性RNA(例如 miRNA、ta-siRNA、共抑制分子、RNAi、核酶等),或者转录成mRNA, 其在置于适当调节序列控制下时翻译成多肽。编码序列的边界由5’端的翻 译起始密码子和3’端的翻译终止密码子决定。编码序列可包括但不仅限于 mRNA、eDNA、重组核苷酸序列或基因组DNA,在某些情况下也可存在 内含子。

本文使用的“核酸分子”还可包括位于编码基因区3’和5’末端的非翻译 序列,例如编码区5’末端上游的至少500个、优选200个、特别优选100 个核苷酸的序列,以及编码基因区3’末端下游至少100个、优选50个、特 别优选20个核苷酸的序列。对于例如反义、RNAi、snRNA、dsRNA、siRNA、 miRNA、ta-siRNA、共抑制分子、核酶等技术的情况,可以有利地使用编 码区以及5’和/或3’区。

然而,仅选择编码区用于克隆和表达目的经常是有利的。

“多肽”指氨基酸的多聚体(氨基酸序列),不涉及该分子的具体长度。 因此,肽和寡肽包括在多肽的定义之内。该术语还包括多肽的翻译后修饰, 例如糖基化、乙酰化、磷酸化等。该定义包括例如含有一个或多个氨基酸 类似物(包括如非天然氨基酸)的多肽、具有取代键以及本领域已知的其他 修饰(天然或非天然的)的多肽。

在本说明书中使用时,术语“包含”或“包括”应理解为指存在所述特征、 整数、步骤或组分或其组,但不排除存在或添加一种或多种其他特征、整 数、步骤、组分或其组。

根据本发明,如果蛋白质或多肽的新活性或其表达提高直接或间接导 致并赋予与相应未转化野生型植物细胞、植物或其部分相比提高的产量, 并且该蛋白质具有上述磷酸核糖焦磷酸合酶的活性,则该蛋白质或多肽具 有“选自SEQ ID NO:2、4、13、51、52、53、54、55、56、57、58、59、 60、61、62、63或其同源物之蛋白质的活性”。在本说明书全篇中,如果 蛋白质或多肽或者编码这些蛋白质或多肽的核酸分子或序列仍具有选自 SEQ ID NO:2、4、13、51、52、53、54、55、56、57、58、59、60、61、 62、63或其同源物的蛋白质的生物活性或酶活性,或者与棉阿舒囊霉磷酸 核糖焦磷酸合酶相比具有原始酶活性的至少10%、优选20%、30%、40 %、50%、特别优选60%、70%、80%、最优选90%、95%、98%、99 %,则它们的活性(优选生物活性)是相同或相似的。

术语“提高”、“升高”、“延长”、“增强”、“改善”或“扩增”涉及植物、 生物、生物部分(例如组织、种子、根、叶、花等)或细胞中特性的相应改 变,并可互换使用。优选地,如果提高或增强涉及基因产物活性的提高或 增强,则体积中的总活性是提高或增强的,无论基因产物的量或者基因产 物的比活性或二者同时是否提高或增强,还是编码该基因产物的核酸序列 或基因的量、稳定性或翻译效率是否提高或增强。

术语“提高”涉及植物、生物(例如组织、种子、根、叶、花等)或细胞 中特性的相应改变。优选地,在提高涉及基因产物活性提高的情况下,体 积中的总活性是提高的,无论基因产物的量或者基因产物的比活性或二者 同时是否提高或产生,或者编码该基因产物的核酸序列或基因的量、稳定 性或翻译效率是否提高。

“特性的改变”应理解为特定体积中基因产物的活性、表达水平或量相 对于相应体积的对照、参照或野生型相比发生改变,包括从头产生活性或 表达。

术语“提高”包括所述特性仅在本发明受试者的一部分中改变,例如, 修饰可见于细胞区室(如细胞器)中或植物的一部分(如组织、种子、根、叶、 花等)中,但在测试整体受试者(即完整的细胞或植物)时则检测不到。

因此,术语“提高”指酶的比活性以及化合物或代谢物(例如本发明的多 肽、核酸分子或者编码mRNA或DNA)可在一定体积中提高。

通过该方法,植物生物的产量提高至少20、21、22、23、24、25、26、 27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、 43、44、45、46、47、48、49或50%(以重量计),有利地提高至少51、52、 53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、 69、70、71、72、73、74、75、76、77、78、79或80%(以重量计),特别 有利地提高至少81、82、83、84、85、86、87、88、89、90、91、92、93、 94、95、96、97、98、99或100%(以重量计),非常特别有利地提高至少 101、102、103、104、105、106、107、108、109、110、111、112、113、 114、115、116、117、118、119、120、121、122、123、124、125、126、 127、128、129、130、131、132、133、134、135、136、137、138、139、 140、145、150、160、170、180、190or 200、300、400或500%(以重量 计)。

在一个实施方案中,转基因植物细胞、植物或其部分的产量提高是与 相应未转化野生型植物细胞、植物或其部分相比通过t检验或未配对双侧t 检验测定的显著提高。

术语“活性”描述酶将底物转化成产物的能力。可在所谓的活性测试中, 通过以产物的增加、底物(或起始材料)的减少或者特定辅因子的减少或者 通过至少两种以上参数的组合作为时间的函数来测定活性。

根据本发明,磷酸核糖焦磷酸合酶的活性是将核糖5-磷酸(R5P)催化转 化成5-磷酸核糖基α-1-焦磷酸(PRPP)的能力,优选为IUPAC名EC 2.7.6.1 所定义的酶。

根据本发明,活性、产量或浓度的提高或降低;物质、产物、起始材 料或底物的提高和降低指与在相同条件下进行的比较实验中本发明的EC 2.7.6.1酶活性未提高的野生型相比。

术语“野生型”、“对照”或“参照”可互换使用,并可以是未根据本发明 所述方法进行修饰或处理的细胞或生物部分(例如细胞器,如叶绿体)或组 织或生物,特别是植物。因此,用作野生型、对照或参照的细胞或生物部 分(例如细胞器,如叶绿体)或组织或生物(特别是植物)尽可能地与该细胞、 生物、植物或其部分一致,并且在除本发明方法之结果以外的任何其他方 面均尽可能地与本发明的主题相同。因此,相同或尽可能相同地处理所述 野生型、对照或参照,即,仅有不影响测试特性的品质的条件或特性可以 不同。

优选地,在类似条件下进行任何比较。术语“类似条件”指所有条件(例 如培养条件或生长条件、土壤、养分、土壤含水量温度、周围空气或土 壤的湿度、测定条件(如缓冲液组成、温度、底物、病原体菌株、浓度等)) 在待比较的实验之间均保持一致。

以有限养分进行培养的植物是以一定含量的盐、N、P2O5、K2O进行 培养,其量为正常培养条件所用盐含量的50、49、48、47、46、45、44、 43、42、41、40%。

“参照”、“对照”或“野生型”优选为这样的受试者,例如细胞器、细胞、 组织、器官,特别是植物:其未以本发明方法进行修饰或处理,并且任何 其他特性均尽可能地与本发明的主题相似。参照、对照或野生型在其基因 组、转录物组、蛋白组或代谢物组方面与本发明的主题尽可能地相似。优 选地,术语“参照”、“对照”或“野生型”细胞器、细胞、组织或生物(特别是 植物)指这样的细胞器、细胞、组织或生物(特别是植物):其与本发明的细 胞器、细胞、组织或生物(特别是植物)或其部分在遗传上近乎相同,优选 95%,更优选98%,甚至更优选99.00%,特别是99.10%、99.30%、99.50 %、99.70%、99.90%、99.99%、99.999%或更高。最优选地,“参照”、“对 照”或“野生型”是与本发明方法中所用生物(特别是植物)、细胞、组织或细 胞器在遗传上相同的细胞器、细胞、组织或生物(特别是植物),只是导致 或赋予活性的核酸分子或它们编码的基因产物根据本发明方法被修改、操 作、改变或引入。

在无法提供与本发明主题的差异仅为不是本发明方法之受试者的对 照、参照或野生型的情况下,对照、参照或野生型可以是这样的生物,其 中赋予与相应未转化野生型植物细胞、植物或其部分相比产量提高的活性 调节的原因或者本发明核酸分子的表达已被调回或关闭,例如通过敲除负 责基因产物的表达,例如通过反义抑制,通过使激活剂或激动剂失活,通 过使抑制剂或拮抗剂活化,通过加入抑制性抗体实现抑制,通过加入活性 化合物(如激素),通过引入负显性突变体等。例如,基因产生可通过引入 失活性点突变来进行敲除,所述点突变导致酶活性抑制或者去稳定或者抑 制结合辅因子的能力等。

因此,优选的参照受试者是本发明方法的起始受试者。优选地,本发 明的参照和主题在标准化和归一化后进行比较,例如以总RNA、DNA或 蛋白质的量或者参照基因(如持家基因,如泛蛋白、肌动蛋白或核糖体蛋白) 的表达进行标准化和归一化。

本发明的提高或调节可以是组成型的,例如由于稳定的永久性转基因 表达,或者编码本发明核酸分子的相应内源基因中的稳定突变,或者调节 赋予本发明多肽表达之基因的表达或行为;或者可以是暂时的,例如由于 瞬时转化或者暂时加入调节剂(如激动剂或拮抗剂);或者可以是诱导型的, 例如用带有诱导型启动子控制之下的本发明核酸分子的诱导型构建体转 化,并加入诱导物,例如四环素或下文所述。

优选地,细胞、组织、细胞器或生物(特别是植物)或其部分中多肽量 的活性提高与对照、参照或野生型相比至少为5%,优选至少20%或至少 50%,特别优选至少70%、80%、90%或更高,非常特别优选至少100%、 150%或200%,最优选至少250%或更高。

在一个实施方案中,术语“提高”指相对于所述生物或其部分之重量的 量提高(重量/重量)。

在一个实施方案中,细胞器(如质体)中多肽量的活性提高。

在一个实施方案中,胞质中多肽量的活性提高。

本发明核酸分子所编码多肽或本发明多肽的比活性可如实施例中所述 进行测试。具体地,将细胞(例如植物细胞)中目的蛋白的表达与对照进行 比较是简单的测试,并可如本领域所述进行。

术语“提高”包括将化合物或活性(特别是活性)从头引入细胞、胞质或 亚细胞区室或细胞器中,或者该化合物或活性(特别是活性)之前检测不到, 换言之,“产生”了该化合物或活性。

因此,在下文中,术语“提高”还包括术语“产生”或“刺激”。提高的活 性表现为与相应的未转化野生型植物细胞、植物或其部分相比产量提高。

令人惊奇的是,观察到在细胞(优选拟南芥)的胞质中提高或产生至少 一种赋予棉阿舒囊霉核酸分子或多肽(分别包含核酸SEQ ID NO:1或多肽 SEQ ID NO:2)的活性赋予了提高的产量,优选与相应的未转化野生型植物 细胞、植物或其部分相比苗鲜重为1.1倍至1.3倍或更高。

令人惊奇的是,观察到在细胞(优选烟草)的胞质中提高或产生至少一 种赋予棉阿舒囊霉核酸分子或多肽(分别包含核酸SEQ ID NO:1或多肽 SEQ ID NO:2)的活性赋予了提高的产量,优选与相应的未转化野生型植物 细胞、植物或其部分相比苗鲜重为1.1倍至1.25倍或更高。

令人惊奇的是,观察到在细胞(优选拟南芥)的胞质中提高或产生至少 一种赋予突变棉阿舒囊霉核酸分子或多肽(分别包含核酸SEQ ID NO:3或 多肽SEQ ID NO:4)的活性赋予了提高的产量,优选与相应的未转化野生 型植物细胞、植物或其部分相比苗鲜重为1.1倍至1.6倍或更高。

令人惊奇的是,观察到在细胞(优选烟草)的胞质中提高或产生至少一 种赋予突变棉阿舒囊霉核酸分子或多肽(分别包含核酸SEQ ID NO:3或多 肽SEQ ID NO:4)的活性赋予了提高的产量,优选与相应的未转化野生型 植物细胞、植物或其部分相比苗鲜重为1.1倍至1.5倍或更高。

令人惊奇的是,观察到在细胞(优选拟南芥)的胞质中提高或产生至少 一种赋予棉阿舒囊霉核酸分子或多肽(分别包含核酸SEQ ID NO:1或多肽 SEQ ID NO:2)的活性赋予了提高的产量,优选与相应的未转化野生型植物 细胞、植物或其部分相比总核苷酸为1.1倍至1.15倍或更高。

令人惊奇的是,观察到在细胞(优选拟南芥)的胞质中提高或产生至少 一种赋予突变棉阿舒囊霉核酸分子或多肽(分别包含核酸SEQ ID NO:3或 多肽SEQ ID NO:4)的活性赋予了提高的产量,优选与相应的未转化野生 型植物细胞、植物或其部分相比总核苷酸为1.1倍至1.15倍或更高。

令人惊奇的是,观察到在细胞(优选拟南芥)的胞质中提高或产生至少 一种赋予棉阿舒囊霉核酸分子或多肽(分别包含核酸SEQ ID NO:1或多肽 SEQ lD NO:2)的活性赋予了提高的产量,优选与相应的未转化野生型植物 细胞、植物或其部分相比总氨基酸为1.1倍至1.15倍或更高。

令人惊奇的是,观察到在细胞(优选拟南芥)的胞质中提高或产生至少 一种赋予突变棉阿舒囊霉核酸分子或多肽(分别包含核酸SEQ ID NO:3或 多肽SEQ ID NO:4)的活性赋予了提高的产量,优选与相应的未转化野生 型植物细胞、植物或其部分相比总氨基酸为1.1倍至1.15倍或更高。

令人惊奇的是,观察到在细胞(优选拟南芥)的胞质中提高或产生至少 一种赋予棉阿舒囊霉核酸分子或多肽(分别包含核酸SEQ ID NO:1或多肽 SEQ ID NO:2)的活性赋予了提高的产量,优选与相应的未转化野生型植物 细胞、植物或其部分相比花结鲜重为1.1倍至1.2倍或更高。

令人惊奇的是,观察到在细胞(优选拟南芥)的胞质中提高或产生至少 一种赋予突变棉阿舒囊霉核酸分子或多肽(分别包含核酸SEQ ID NO:3或 多肽SEQ ID NO:4)的活性赋予了提高的产量,优选与相应的未转化野生 型植物细胞、植物或其部分相比花结鲜重为1.1倍至1.2倍或更高。

令人惊奇的是,观察到在细胞(优选烟草)的胞质中提高或产生至少一 种赋予突变棉阿舒囊霉核酸分子或多肽(分别包含核酸SEQ ID NO:3或多 肽SEQ ID NO:4)的活性赋予了提高的产量,优选与相应的未转化野生型 植物细胞、植物或其部分相比植物高度为1.1倍至1.2倍或更高。

令人惊奇的是,观察到在细胞(优选烟草)的胞质中提高或产生至少一 种赋予突变棉阿舒囊霉核酸分子或多肽(分别包含核酸SEQ ID NO:3或多 肽SEQ ID NO:4)的活性赋予了提高的产量,优选与相应的未转化野生型 植物细胞、植物或其部分相比鲜重为1.1倍至1.2倍或更高。

令人惊奇的是,观察到在细胞(优选拟南芥)的质体中提高或产生至少 一种赋予棉阿舒囊霉核酸分子或多肽(分别包含核酸SEQ ID NO:1或多肽 SEQ ID NO:2)的活性赋予了提高的产量,优选与相应的未转化野生型植物 细胞、植物或其部分相比种子总脂类含量为1.1倍至1.3倍或更高。

令人惊奇的是,观察到在细胞(优选拟南芥)的胞质中提高或产生至少 一种赋予突变棉阿舒囊霉核酸分子或多肽(分别包含核酸SEQ ID NO:3或 多肽SEQ ID NO:4)的活性赋予了提高的产量,优选与相应的未转化野生 型植物细胞、植物或其部分相比种子总脂类含量为1.1倍至1.5倍或更高。

令人惊奇的是,观察到在细胞(优选拟南芥)的质体中提高或产生至少 一种赋予棉阿舒囊霉核酸分子或多肽(分别包含核酸SEQ ID NO:1或多肽 SEQ ID NO:2)的活性赋予了提高的产量,优选与相应的未转化野生型植物 细胞、植物或其部分相比种子总含油量为1.1倍至1.5倍或更高。

令人惊奇的是,观察到在细胞(优选拟南芥)的胞质中提高或产生至少 一种赋予突变棉阿舒囊霉核酸分子或多肽(分别包含核酸SEQ ID NO:3或 多肽SEQ ID NO:4)的活性赋予了提高的产量,优选与相应的未转化野生 型植物细胞、植物或其部分相比种子总含油量为1.1倍至2.3倍或更高。

令人惊奇的是,观察到在以有限养分培养的细胞(优选拟南芥)的胞质 中提高或产生至少一种赋予棉阿舒囊霉核酸分子或多肽(分别包含核酸 SEQ ID NO:1或多肽SEQ ID NO:2)的活性赋予了提高的产量,优选与相 应的未转化野生型植物细胞、植物或其部分相比花结鲜重为1.1倍至1.15 倍或更高。

令人惊奇的是,观察到在以有限养分培养的细胞(优选拟南芥)的胞质 中提高或产生至少一种赋予突变棉阿舒囊霉核酸分子或多肽(分别包含核 酸SEQ ID NO:3或多肽SEQ ID NO:4)的活性赋予了提高的产量,优选与 相应的未转化野生型植物细胞、植物或其部分相比花结鲜重为1.1倍至1.2 倍或更高。

有利地,用于本发明方法的植物具有高收获油产量/公顷。这种油收获 产量为至少100、110、120、130、140或150kg油/公顷,有利地为至少 250、300、350、400、450或500kg油/公顷,优选至少550、600、650、 700、750、800、850、900或950kg油/公顷,特别优选至少1000kg油/ 公顷或更高。

在另一变型中,转化植物以使其在贮藏器官中特异性表达磷酸核糖焦 磷酸合酶。

在一个实施方案中,本发明方法提高植物种子中的总含油量。特别优 选地,在培养后收获植物,并且适当时分离种子中所包含的油。

在本发明方法中,在拟南芥中异源表达来自棉阿舒囊霉的PRS基因 (PRS)导致(特别是在种子中)含油量显著提高,如上述。这时,与野生型对 照植物相比,含油量优选提高约20-60%,特别优选25-55%,特别是28-52 %(基于种子干重)(图1)。在本发明方法中,在拟南芥中异源表达突变的PRS 基因(PRSM:Leu133Ile,His196Glu)导致(特别是在种子中)含油量显著提 高,如上述。这时,与野生型对照植物相比,含油量优选提高约60-150%, 尤其优选70-140%,特别优选75-132%(基于种子干重)(图1)。有利地,磷 酸核糖焦磷酸合酶的转基因表达对转化植物的生长或其他特性无不利影 响。

在一个实施方案中,通过本发明方法产生的含油量提高的植物可直接 上市,而无需分离所合成的油。在本发明的方法中,植物应理解为指完整 植物以及所有的植物部分、植物器官或植物部分,例如来自转基因植物和/ 或可用于产生转基因植物的叶、柄、种子、根、块茎、花药、纤维、根毛、 茎、胚、愈伤组织、子叶、叶柄、收获材料、植物组织、再生组织、细胞 培养物。此时,种子包括种子的所有部分,例如种皮、表皮细胞和种子细 胞、胚乳或胚组织。然而,也可以以油、脂肪、脂质和/或游离脂肪酸的形 式从植物中分离根据本发明方法产生的油。可通过从其生长的培养基或大 田中收获植物来获得本发明方法所产生的油。这可通过压榨或萃取植物部 分(优选植物种子)来进行。这时,可使用“冷打浆(cold beating)”或“冷压榨 (cold pressing)”通过压榨来获得油而无需热输入。这样,植物部分(特别是 种子)可以更容易地消化,将其预先捣碎、蒸汽处理或烘烤。接着可对以该 方式预处理的种子进行压榨或使用溶剂(如温的己烷)进行萃取。接着再除 去溶剂。这样,通过该方法可分离所产生油的96%以上。接着将这样获得 的产品进一步加工,即精制。这时,首先除去例如植物黏液和导致混浊的 固体。黏液的除去可以酶促方式进行,或者可例如通过添加酸(如磷酸)以 化学/物理方式进行。接着用碱(例如氢氧化钠水溶液)处理除去游离脂肪酸。 为了除去仍留在产品中的碱,将所得产品用水彻底清洗并干燥。为了除去 仍留在产品中的染料,使用如漂白土或活性碳对产品进行漂白。最后,使 用如蒸汽将产品除臭。

本发明的一个实施方案是通过本发明制备的油或通过将这些油与动 物、微生物或植物油、脂质或脂肪酸混合而获得的油在饲料、食品、化妆 品或药物中的用途。通过本发明方法制备的油可以本领域技术人员已知的 方式使用,用于与动物来源的其他油、脂质、脂肪酸或脂肪酸混合物(如鱼 油)混合。通过碱处理从本发明方法制备的油中释放的脂肪酸也可以惯用量 直接加入饲料、食品、化妆品和/或药物中,或者在与动物来源的其他油、 脂质、脂肪酸或脂肪酸混合物(如鱼油)混合后加入。

在本发明方法中制备的油含有化合物,例如鞘脂、磷酸甘油酯、脂质、 糖脂、磷脂、单酰甘油、二酰甘油、三酰甘油或其他脂肪酯,优选三酰甘 油(见表1)。

可以从根据本发明方法制备的油中释放其中包含的饱和及不饱和的脂 肪酸,例如通过碱处理(例如使用KOH或NaOH水溶液)或酸水解(有利地 在醇如甲醇或乙醇存在下进行)或通过酶切割来释放,并通过如相分离来分 离,其后使用如H2SO4来酸化。可以直接释放脂肪酸而无需上述处理步骤。

术语“油”应理解为还包括“脂质”或“脂肪”或“脂肪酸混合物”,其包含 不饱和的、饱和的(优选酯化的)脂肪酸,其有利地附着于甘油三酯上。这 对于油来说是优选的。油还可包含多种其他饱和或不饱和的脂肪酸,例如 软脂酸、棕榈油酸、硬脂酸、油酸、亚油酸或α-亚麻酸等。特别地,取决 于原始植物,油中多种脂肪酸的含量可以不同。

“总含油量”指所有油、脂质、脂肪或脂肪酸混合物的总和,优选为所 有三酰甘油的总和。

“油”包括中性和/或极性的脂质及其混合物。例如但不仅限于表II中提 到的那些。

表II:植物脂质的类别

中性脂质    三酰甘油(TAG)

            二酰甘油(DAG)

            单酰甘油(MAG)

极性脂质    单半乳糖基二酰甘油(MGDG)

            二半乳糖基二酰甘油(DGDG)

            磷脂酰甘油(PG)

            磷脂酰胆碱(PC)

            磷脂酰乙醇胺(PE)

            磷脂酰肌醇(PI)

            磷脂酰丝氨酸(PS)

            磺基异鼠李糖基二酰甘油

中性脂质优选指三酰甘油。中性及极性脂质均可包含多种脂肪酸。例 如但不仅限于表2中提到的脂肪酸。

表III:多种脂肪酸的概述(选登)

1链长:双键数

+仅在少数植物属中出现

*不在植物中天然出现

命名1      名称

14:0       豆蔻酸

16:0       软脂酸

16:1       棕榈油酸

16:3       十六碳三烯酸

18:0       硬脂酸

18:1       油酸

18:2       亚油酸

α-18:3    亚麻酸

γ-18:3    γ-亚麻酸+

20:0       花生酸

20:1       二十碳一烯酸

22:6       二十二碳六烯酸(DHA)*

20:2       二十碳二烯酸

20:4       花生四烯酸(AA)+

20:5       二十碳五烯酸(EPA)+

22:1       芥酸

因此,根据本发明,术语“油”指一种或多种上述三酰甘油、脂质、脂 肪酸、脂肪和/或脂肪酸酯本身,或者2、3、4、5、6、7、8、9或10种或 更多种这些化合物的混合物。

优选地,油指种子油。

术语“表达”指编码基因区段或基因的转录和/或翻译。通常,所得产物 是mRNA或蛋白质。然而,表达产物还可包括功能性RNA,例如反义、 核酸、tRNA、snRNA、rRNA、RNAi、siRNA、核酶等。表达可以是全身 性的,局部的或时间性的,例如局限于某些细胞类型、组织器官或细胞器 或时间段。

在一个实施方案中,本发明的方法包括以下步骤中的一个或多个:

(a)使蛋白质稳定,所述蛋白质赋予本发明核酸分子所编码蛋白质或本 发明多肽提高的表达,所述本发明多肽具有选自磷酸核糖焦磷酸合酶的本 文所述活性,并且与相应的未转化野生型植物细胞、植物或其部分相比赋 予提高的产量;

(b)使mRNA稳定,所述mRNA赋予本发明核酸分子或其同源物所编 码的蛋白质或编码本发明多肽的mRNA提高的表达,所述本发明多肽具有 选自磷酸核糖焦磷酸合酶的本文所述活性,并且与相应的未转化野生型植 物细胞、植物或其部分相比赋予提高的产量;

(c)提高蛋白质的比活性,所述蛋白质赋予本发明核酸分子所编码蛋白 质或本发明多肽提高的表达,或者降低本发明多肽的抑制性调节;

(d)产生或提高介导蛋白质表达的内源或人工转录因子的表达,所述蛋 白质赋予本发明核酸分子所编码蛋白质或本发明多肽提高的表达,所述本 发明多肽具有选自磷酸核糖焦磷酸合酶的本文所述活性,并且与相应的未 转化野生型植物细胞、植物或其部分相比赋予提高的产量;

(e)通过向生物或其部分添加一种或多种外源诱导因子来刺激蛋白质 的活性,所述蛋白质赋予本发明核酸分子所编码蛋白质或本发明多肽提高 的表达,所述本发明多肽具有选自磷酸核糖焦磷酸合酶的本文所述活性, 并且与相应的未转化野生型植物细胞、植物或其部分相比赋予提高的产量;

(f)表达编码蛋白质的转基因,所述蛋白质赋予本发明核酸分子所编码 蛋白质或本发明多肽提高的表达,所述本发明多肽具有选自磷酸核糖焦磷 酸合酶的本文所述活性,并且与相应的未转化野生型植物细胞、植物或其 部分相比赋予提高的产量;

(g)提高基因的拷贝数,所述基因赋予本发明核酸分子所编码蛋白质或 本发明多肽提高的表达,所述本发明多肽具有选自磷酸核糖焦磷酸合酶的 本文所述活性,并且与相应的未转化野生型植物细胞、植物或其部分相比 赋予提高的产量;

(h)通过加入正表达元件或除去负表达元件来提高编码本发明多肽或 其同源物的内源基因的表达,例如,可使用同源重组将正调节元件(例如用 于植物的35S增强子)引入启动子中,或者从调节区中除去阻抑物元件。可 以使用其他基因转换方法来破坏阻抑物元或增强正元件的活性——可通过 T-DNA或转座子诱变向植物中随机引入正元件,并鉴定其中正元件已整合 进本发明基因附近从而增强其表达的株系;

和/或

(i)调节植物的生长条件,以使编码本发明蛋白质的基因或该蛋白质本 身的表达或活性被增强;

(j)从天然来源或从诱变来源中选择具有特别高活性的本发明蛋白质的 生物,并将其培育成靶生物,例如良种作物。

优选地,所述mRNA是本发明的核酸分子和/或赋予本发明核酸分子 所编码蛋白质提高表达的蛋白质,它们是单独的或者与转运核酸序列或转 运肽编码核苷酸序列或者多肽相连,所述多肽具有本文所述活性(例如在提 高所编码多肽的表达或活性后赋予与相应未转化野生型植物细胞、植物或 其部分相比提高的产量),或者具有选自SEQ ID NO:2、4、13、51、52、 53、54、55、56、57、58、59、60、61、62、63或其同源物的蛋白质的活 性。

一般而言,生物的细胞或区室中mRNA或多肽的量与所编码蛋白质的 量相关,因此与所述体积中所编码蛋白质的总体活性相关。所述相关性并 不总是线性的,该体积中的活性取决于分子的稳定性或者激活或抑制性辅 因子的存在情况。此外,酶的产物抑制和离析物抑制(educt inhibition)为本 领域所熟知,并描述于教科书中,例如Stryer,Biochemistry。

一般而言,生物的细胞或区室中mRNA、多核苷酸或核酸分子的量与 所编码蛋白质的量相关,因此与所述体积中所编码蛋白质的总体活性相关。 所述相关性并不总是线性的,该体积中的活性取决于分子的稳定性、分子 的降解或者激活或抑制性辅因子的存在情况。此外,酶的产物抑制和离析 物抑制为本领域所熟知,例如Zinser等“Enzyminhibitoren”/Enzyme inhibitors“。

可以多种方式提高上述本发明核酸分子所编码蛋白质和/或多肽的活 性。例如,通过提高基因产物数(例如通过提高表达率,例如引入强启动子, 或者通过提高所表达mRNA的稳定性,从而提高翻译率)和/或提高基因产 物的稳定性从而减少被破坏的蛋白质,来提高生物或其部分(如细胞)中的 活性。此外,可以实现降低或提高反应速率或改变(降低或提高)对所得底 物的亲和力的方式影响酶的活性或更新。本发明多肽(例如酶)催化中心中 的突变可改变酶的更新率,例如敲除必要氨基酸可导致降低或完全敲除酶 活性,或者调节子结合位点的缺失或突变可降低负调节,如反馈抑制(或者 底物水平也提高时的底物抑制)。可以提高本发明酶的比活性,从而提高更 新率或改善辅因子结合。改善编码mRNA或蛋白质的稳定性也可提高基因 产物的活性。对活性的刺激也在术语“提高的活性”的范围之内。

此外,可以改变对上述核酸序列的调节,从而提高基因表达。这可有 利地通过异源调节序列或通过改变(例如突变)已有的天然调节序列来实 现。有利的方法还可彼此组合。

一般而言,可以通过提高生物或其部分(特别是植物细胞或植物细胞细 胞器、植物或植物组织或其部分或微生物)中特定编码mRNA或相应蛋白 质的量来提高所述生物或其部分中基因产物的活性。“蛋白质或mRNA的 量”应理解为指生物(特别是植物)、组织、细胞或细胞区室中多肽或mRNA 分子的分子数。蛋白量的“提高”指与野生型、对照或参照相比,生物(特别 是植物)、组织、细胞或细胞区室(例如细胞器如质体或线粒体或其部分)中 所述蛋白质分子数的定量提高,例如通过下述方法之一提高。

分子数量的提高优选为至少1%,优选高于10%,更优选30%或更高, 特别优选50%、70%或更高,非常特别优选100%,最优选500%或更高。 然而从头产生的表达也认为是本发明的主题。

修饰(如提高)可通过内源或外源因子来实现。例如,生物或其部分中 活性的提高可通过向培养基或养分中加入基因产物或前体或激活剂或激动 剂来实现,或者可通过将所述对象瞬时或稳定地引入生物中来实现。此外, 这样的提高可通过使用转化和/或靶向将本发明的核酸序列或所编码蛋白 引入正确的细胞区室(例如分别引入核或胞质或引入质体)来实现。就本发 明说明书的目的而言,术语“胞质的”应表示在未加入非天然转运肽编码序 列的情况下表达本发明的核酸。非天然转运肽编码序列是这样的序列,它 不是本发明核酸的天然部分,而是通过分子操作步骤(例如“质体靶向表达” 中所述)加入的。因此,术语“胞质”不应排除通过其天然序列特性将本发明 核酸序列的产物靶向定位至任何细胞区室。

在一个实施方案中,植物或其部分(例如细胞、组织、器官、细胞器、 胞质等)中与相应的未转化野生型植物细胞相比产量的增强通过提高本发 明多肽的内源水平来实现。因此,在本发明的一个实施方案中,本发明涉 及一种方法,其中编码本发明多核苷酸或核酸分子的基因的基因拷贝数被 提高。此外,可通过修饰多肽的转录或翻译调节来提高本发明多肽的内源 水平。

在一个实施方案中,植物或其部分中产量的提高可通过对本发明内源 基因进行靶向诱变或随机诱变来实现。例如,可使用同源重组将正调节元 件(如用于植物的35S增强子)引入启动子中,或者从调节区中除去阻抑物 元件。此外,可以使用Kochevenko和Willmitzer(Plant Physiol.132(1),174 (2003))及其参考文献中描述的类似于基因转换的方法来破坏阻抑物元件或 者增强正调节元件的活性。

此外,可通过T-DNA或转座子诱变向(植物)基因组中随机引入正元件, 并可筛选正元件整合进本发明基因附近从而增强其表达的株系。通过随机 整合增强子元件来激活植物基因的方法描述于Hayashi等(Science 258,1350(1992))或Weigel等(Plant Physiol.122,1003(2000))以及其中的 其他参考文献。

已在多种情况下描述了用于鉴定目的基因附近的插入(最终带有激活 元件)的反向遗传策略,例如Krysan等(Plant Cell 11,2283(1999)); Sessions等(Plant Cell 14,2985(2002));Young等(Plant Physiol.125,513 (2001));Koprek等(Plant J.24,253(2000));Jeon等(Plant J.22,561 (2000));Tissier等(Plant Cell 11,1841(1999));Speulmann等(Plant Cell 11,1853(1999))。简言之,收获来自大T-DNA或转座子诱变植物群中所有 植物的材料,并制备基因组DNA。接着按照Krysan等(Plant Cell 11,2283 (1999))所述的特定结构合并基因组DNA。接着通过检测插入诱变原(如 T-DNA或转座子)与目的基因之组合的特异性多重PCR反应来筛选基因组 DNA库。因此,用T-DNA或转座子边界引物与基因特异性引物的特定组 合对DNA库进行PCR反应。引物设计的一般原则也可得自Krysan等 (Plant Cell 11,2283(1999))。对低水平DNA库再次进行筛选,导致鉴定出 目的基因被插入诱变原激活的个体植物。

正调节元件的增强或者负调节元件的破坏或弱化也可通过常用诱变技 术来实现:产生化学或放射诱变的群体是一种常用技术,并为本领域技术 人员所知。用于植物的方法描述于Koorneef等(Mutat Res.Mar.93(1) (1982))及其参考文献,以及Lightner和Caspar“Methods in Molecular Biology”Vol.82。这些技术一般诱导点突变,可使用诸如TILLING (Colbert等,Plant Physiol,126,(2001))的方法在任何已知基因中鉴定所述 点突变。

因此,如果通过同源重组、Tilling法或基因转换修饰了编码赋予编码 本发明多肽表达提高之多肽的内源基因(特别是包含本发明核酸分子的基 因),则可提高表达水平。还可以如本文所述向本发明核酸序列中加入靶向 序列。

需要时,除了靶向序列或其部分以外,调节序列也可与内源蛋白的编 码区有效连接,并控制其转录和翻译或者编码mRNA或所表达蛋白的稳定 性或衰退。为了修饰和控制表达,可以改变、加入或修改启动子、UTR、 剪接位点、加工信号、多腺苷酸化位点、终止子、增强子、阻抑物、转录 后或翻译后修饰位点。例如,Hayashi等(Science 258,1350(1992))或Weigel 等(Plant Physiol.122,1003(2000))描述了通过随机整合增强子元件来激 活植物基因。例如,可通过将内源启动子替换为更强的转基因启动子或通 过将内源3’UTR替换为提供更高稳定性而不改变编码区的3’UTR来调节 内源蛋白的表达水平。此外,可通过引入人工转录因子(如实施例中所述) 来改变转录调节。替代性启动子、终止子和UTR描述于下文。

还可以通过引入与编码表II第3列之蛋白质的基因的编码区紧密结合 并激活其转录的合成转录因子增加内源多肽的激活,所述内源多肽具有上 述活性,例如具有编码表II第3列之蛋白质或本发明多肽的活性,例如在 胞质和/或细胞器(如质体)中提高表达或活性后赋予与相应未转化野生型植 物细胞、植物或其部分相比提高的产量。可以构建嵌合锌指蛋白,其包含 特异性DNA结合结构域和激活结构域,例如单纯疱疹病毒的VP16结构域。 特异性结合结构域可与编码表II第3列蛋白质之基因的调节区结合。嵌合 转录因子在生物(特别是植物)中的表达导致表II第3列所示蛋白质的特异 性表达。其方法为本领域技术人员所知和/或描述于例如WO01/52620,Oriz, Proc.Natl.Acad.Sci.USA,99,13290(2002)或Guan,Proc.Natl.Acad.Sci. USA 99,13296(2002)。

在本发明方法的另一实施方案中,使用这样的生物,其中上述基因之 一或上述核酸之一被突变,以使得与所编码基因产物的活性与未突变蛋白 相比受细胞因子的影响较小,或者完全不受其影响。例如,熟知的酶活性 调节机制是底物抑制或反馈调节机制。用于引入相应序列的一个或多个碱 基、核苷酸或氨基酸的替换、缺失和添加的方法和技术描述于下文相应段 落中以及列出的参考文献中,例如Sambrook等,Molecular Cloning,Cold Spring Habour,NY,1989。本领域技术人员能够通过将本发明核酸分子或 其表达产物的序列与本领域现状进行比较来鉴定调节结构域和调节因子结 合位点,这通过包含用于鉴定结合位点和调节结构域之算法的计算机软件 方法来实现,或者通过向核酸分子或蛋白质中系统性地引入突变并测定导 致比活性提高或每单位体积(特别是细胞)中活性提高的突变来实现。

因此,在生物中表达来自在进化上关系较远的生物的本发明核酸分子 或本发明多肽可能是有利的,例如在真核宿主中使用原核基因,因为在这 些情况下宿主细胞的调节机制可能不会弱化该基因或其表达产物的活性 (细胞活性或比活性)。

所述突变以不对产量提高产生不良影响的方式引入。

对基因或其基因产物的调节影响较低应理解为该降低的酶活性调节导 致该基因或其产物的比活性或细胞活性提高。酶活性提高应理解为指酶活 性与起始生物相比提高至少10%,有利地至少20、30或40%,特别有利 地至少50、60或70%。这导致与相应的未转化野生型植物细胞、植物或 其部分相比的产量提高。

本发明提供了,可以实施上述方法以提高产量。

本发明不仅限于特定的核酸、特定多肽、特定细胞类型、特定宿主细 胞、特定条件或特定方法等本身,而是可以改变,其多种修改和变化对本 领域技术人员来说是很明显的。应该理解,本文使用的术语仅用于描述具 体实施方案的目的,而不旨在限制。

本发明还涉及分离的核酸,其包含选自以下的核酸分子:

(a)编码选自SEQ ID NO:2、4、13、51、52、53、54、55、56、57、 58、59、60、61、62、63之多肽的核酸分子;

(b)选自SEQ ID NO:1、3、12、38、39、40、41、42、43、44、45、 46、47、48、49、50的核酸分子;

(c)核酸分子,其由于遗传密码的简并性而衍生自选自SEQ ID NO:2、 4、13、51、52、53、54、55、56、57、58、59、60、61、62、63之多肽 序列,并赋予与相应的未转化野生型植物细胞、植物或其部分相比提高的 产量;

(d)核酸分子,其与包含选自SEQ ID NO:1、3、12、38、39、40、41、 42、43、44、45、46、47、48、49、50之核酸分子的多核苷酸的核酸分子 序列具有至少30%同一性,优选至少40%、50%、60%、70%、75%、80%、 85%、90%、95%、96%、97%、98%、99%、99.5%同一性,并赋予与 相应的未转化野生型植物细胞、植物或其部分相比提高的产量;

(e)核酸分子,其编码与(a)、(b)、(c)或(d)核酸分子所编码多肽的氨基 酸序列具有至少30%同一性、优选至少40%、50%、60%、70%、75%、 80%、85%、90%、95%、96%、97%、98%、99%、99.5%同一性的多 肽,并具有包含选自SEQ ID NO:1、3、12、38、39、40、41、42、43、 44、45、46、47、48、49、50的多核苷酸的核酸分子所代表的活性,并赋 予与相应的未转化野生型植物细胞、植物或其部分相比提高的产量;

(f)核酸分子,其在严格杂交条件下与(a)、(b)、(c)、(d)或(e)的核酸分 子杂交,并赋予与相应的未转化野生型植物细胞、植物或其部分相比提高 的产量;

(g)核酸分子,其编码可借助于针对(a)、(b)、(c)、(d)、(e)或(f)核酸分 子之一所编码多肽产生的单克隆或多克隆抗体来分离的多肽,并具有包含 选自SEQ ID NO:1、3、12、38、39、40、41、42、43、44、45、46、47、 48、49、50的多核苷酸的核酸分子所代表的活性;

(h)核酸分子,其编码包含选自SEQ ID NO:7、8、9、10、11、14、 15、16、17、18之ADP的多肽基序的多肽或者包含选自SEQ ID No.64、 65、66、67、68、69、70、71、72、73之基序的多肽,并优选地具有包含 选自SEQ ID NO:1、3、12、38、39、40、41、42、43、44、45、46、47、 48、49、50的多核苷酸的核酸分子所代表的活性;

(i)多核苷酸,其编码具有选自SEQ ID NO:2、4、13、51、52、53、 54、55、56、57、58、59、60、61、62、63之蛋白质所代表的活性的多肽, 并赋予与相应的未转化野生型植物细胞、植物或其部分相比提高的产量;

(j)核酸分子,其包含可通过使用选自SEQ ID NO:5、6的引物扩增 cDNA文库或基因组文库获得的多核苷酸,该核酸分子在其5’末端不以核 苷酸ATA开始,并优选地以包含选自SEQ ID NO:1、3、12、38、39、40、 41、42、43、44、45、46、47、48、49、50的多核苷酸的核酸分子所代表 的活性;

(k)核酸分子,其可通过严格杂交条件下筛选合适的核酸文库(特别是 cDNA文库和/或基因组文库)获得,所述筛选中使用包含(a)或(b)核酸分子 之互补序列的探针或者使用其片段,所述探针或其片段具有(a)至(e)所表征 核酸分子序列之互补核酸分子的至少15nt,优选20nt、30nt、50nt、100 nt、200nt、500nt、750nt或1000nt,并且该核酸分子编码多肽,该多肽 具有包含选自SEQ ID NO:2、4、13、51、52、53、54、55、56、57、58、 59、60、61、62、63之多肽的蛋白质所代表的活性;

其中(a),(b)、(c)、(d)、(e)、(f)、(g)、(h)、(i)、(j)和(k)的核酸分子至 少在一个或多个核苷酸上不同于选自SEQ ID NO:1、3、12、38、39、40、 41、42、43、44、45、46、47、48、49、50的序列,并优选地编码至少在 一个或多个氨基酸上不同于选自SEQ ID NO:2、4、13、51、52、53、54、 55、56、57、58、59、60、61、62、63的蛋白质序列的蛋白质。 在一个实施方案中,本发明涉及上述序列同源物,它们可有利地分离自酵 母、真菌、病毒、藻类、细菌,例如醋化醋杆菌(Acetobacter aceti,醋杆 菌亚属);Acidithiobacillus ferrooxidans;不动杆菌属(Acinetobacter);放 线杆菌属(Actinobacillus);杀鲑气单胞菌(Aeromonas salmonicida);根癌 农杆菌(Agrobacterium tumefaciens);Aquifex aeolicus;化脓隐秘杆菌 (Arcanobacterium pyogenes);翠菊黄化植原体(Aster yellows phytoplasma);芽孢杆菌属(Bacillus);双岐杆菌属(Bifidobacterium);布氏 疏螺旋体(Borrelia burgdorferi);扩展短杆菌(Brevibacterium linens);马 尔他布鲁氏菌(Brueella melitensis);巴克纳氏菌属(Buchnera);溶纤维丁 酸弧菌(Butyrivibrio fibrisolvens);空肠弯曲杆菌(Campylobacter jejuni); 新月柄杆菌(Caulobacter crescentus);衣原体(Chlamydia sp.); Chlamydophila sp.;泥生绿菌(栖泥绿菌)(Chlorobium limicola); Citrobacter rodentium;梭菌(梭状芽孢杆菌)(Clostridium sp.);睾丸酮丛 毛单胞菌(Comamonas testosteroni);棒杆菌(棒状菌)(Corynebacterium sp.);伯氏考克斯氏体(Q热病原体,伯氏立克次氏体)(Coxiella burnetii); 耐放射异常球菌(Deinococcus radiodurans);节瘤偶形菌(Dichelobacter nodosus);鲶鱼爱德华氏菌(Edwardsiella ictaluri);肠杆菌(Enterobacter sp.);猪红斑丹毒丝菌(Erysipelothrix rhusiopathiae);大肠杆菌(Escherichia coli);黄杆菌(Flavobacterium sp.);土拉热弗朗西丝氏菌(Francisella tularensis);弗兰克氏菌(Frankia sp.CpI1);具核梭杆菌(Fusobacterium nucleatum);Geobacillus stearothermophilus;氧化葡糖杆菌 (Gluconobacter oxydans);嗜血菌(Haemophilus sp.);幽螺杆菌 (Helicobacter pylori);炎克雷伯氏菌(Klebsiella pneumoniae);乳杆菌 (Lactobacillus sp.);乳酸乳球菌(Lactococcus lactis);利斯特氏菌(Listeria sp.);Mannheimia haemolytica;Mesorhizobium loti;深海噬甲基菌 (Methylophaga thalassica);绿微囊蓝细菌(Microcystis aeruginosa);微 颤蓝细菌(Microscilla sp.PRE1);莫拉氏菌(Moraxella sp.TA144);分枝杆 菌(Mycobacterium sp.);枝原体(Mycoplasma sp.);奈瑟氏球菌(Neisseria sp.);亚硝化单胞菌(Nitrosomonas sp.);念珠蓝细菌(Nostoc sp.PCC 7120); Novosphingobium aromaticivorans;酒酒球菌(Oenococcus oeni);柠檬泛 菌(Pantoea citrea);多杀巴斯德氏菌(Pasteurella multocida);戊糖片球菌 (Pediococcus pentosaceus);坑形席蓝细菌(Phormidium foveolarum); Phytoplasma sp.;Plectonema boryanum;栖瘤胃普雷沃氏菌(Prevotella ruminicola);丙酸杆菌(Propionibacterium sp.);普通变形菌(Proteus vulgaris);假单胞菌(Pseudomonas sp.);Ralstonia sp.;根瘤菌(Rhizobium sp.);马红球菌(Rhodococcus equi);海洋红嗜热盐菌(Rhodothermus marinus);立克次氏体(Rickettsia sp.);鸭瘟立默氏菌(Riemerella anatipestifer);生黄瘤胃球菌(Ruminococcus flavefaciens);沙门氏菌 (Salmonella sp.);反刍月形单胞菌(Selenomonas ruminantium);嗜虫沙雷 氏菌(Serratia entomophila);希瓦氏菌(Shigella sp.);苜蓿中华根瘤菌 (Sinorhizobium meliloti);葡萄球菌(Staphylococcus sp.);链球菌 (Streptococcus sp.);链霉菌(Streptomyces sp.);聚球蓝细菌 (Synechococcus sp.);集胞蓝细菌(Synechocystis sp.PCC 6803);海栖热袍 菌(Thermotoga maritima);密螺旋体(Treponema sp.);解脲枝原体 (Ureaplasma urealyticum);霍乱弧菌(Vibrio cholerae);副溶血弧菌 (Vibrio parahaemolyticus);苛养木杆菌(Xylella fastidiosa);耶尔森氏菌 (Yersinia sp.);运动发酵单胞菌(Zymomonas mobilis),优选沙门氏菌 (Salmonella)或大肠杆菌或植物,优选分离自酵母,例如分离自酵母属 (Saccharomyces)、毕赤酵母属(Pichia)、假丝酵母属(Candida)、汉逊酵母 属(Hansenula)、球拟酵母属(Torulopsis)或裂殖酵母属 (Schizosaccharomyces)或者植物,如拟南芥、玉米、小麦、黑麦、燕麦、 黑小麦、水稻、大麦、大豆、花生、棉花、琉璃苣、向日葵、亚麻子、报 春花、油菜籽、芸苔和球茎甘蓝、木薯、胡椒、向日葵、万寿菊;茄科植 物包括马铃薯、烟草、茄子、西红柿;蚕豆属物种、豌豆、苜蓿;灌木植 物如咖啡、可可、茶;柳属物种;树木如油棕榈、椰子;多年生草本植物 如黑麦草和羊茅草;饲料作物如苜蓿和三叶草;以及分离自例如杉、松 或冷杉。更优选地,上述序列的同源物可分离自酿酒酵母(Saccharomyces cerevisiae)、大肠杆菌或集胞蓝细菌属(Synechocystis)或植物,优选欧洲油 菜、大豆、玉米、棉花或稻。

本发明的蛋白质优选通过重组DNA技术产生。例如,将编码该蛋白 的核酸分子克隆进表达载体中,例如克隆进双元载体中,将该表达载体引 入宿主细胞,例如拟南芥野生型NASC N906或下文实施例中所述任何其 他植物细胞,蛋白质在所述宿主细胞中表达。双元载体的实例为pBIN19, pBI101、pBinAR、pGPTV、pCAMBIA、pBIB-HYG、pBecks、pGreen 或pPZP(Hajukiewicz,P.等,Plant Mol.Biol.25,989(1994),和Hellens等, Trends in Plant Science 5,446(2000))。

在一个实施方案中,本发明蛋白质优选在细胞区室(更优选质体)中产 生。将核酸引入质体并在该区室中产生蛋白质的方法为本领域技术人员已 知,并描述于本申请中。

在另一实施方案中,本发明蛋白质优选在细胞的胞质中产生。在胞质 中产生蛋白质的方法为本领域技术人员已知。

有利地,本发明的核酸序列或基因构建体与至少一个报告基因一起克 隆进表达盒中,该表达盒通过载体引入生物中,或者直接引入基因组中。 该报告基因应允许通过生长、荧光、化学物质、生物发光或耐性测定或通 过光度测量而容易地进行检测。可以提到的报告基因的实例为抗生素或除 草剂耐性基因、水解酶基因、荧光蛋白基因、生物发光基因、糖或核苷酸 代谢基因或生物合成基因,例如Ura3基因、Ilv2基因、萤光素酶基因、β- 半乳糖苷酶基因、gfp基因、2-去氧葡萄糖-6-磷酸磷酸酶基因、β-葡糖醛酸 糖苷酶基因、β-内酰胺酶基因、新霉素磷酸转移酶基因、潮霉素磷酸转移 酶基因、突变的乙酰羟酸合酶(AHAS)基因(也称为乙酰乳酸合酶(ALS)基 因)、D-氨基酸代谢酶基因或BASTA(=草铵膦耐性)基因。这些基因允许 容易地测量和定量转录活性,从而测量和定量基因表达。这样,可以鉴定 显示不同生产力的基因组位置。

在一个优选的实施方案中,核酸构建体(例如表达盒)包含编码序列上 游(即5’末端)的启动子和下游(即3’末端)的多腺苷酸化信号,以及任选的其 他调节元件,它们与选自SEQ ID NO:1,3,12,38,39,40,41,42,43,44,45, 46,47,48,49,50的间插编码序列有效连接。有效连接指启动子、编码序列、 终止子和任选的其他调节元件依次排列,以使得每个调节元件可以正确的 方式在编码序列的表达中发挥其功能。在一个实施方案中,优选用于有效 连接的序列为确保亚细胞定位至质体的靶向序列。然而,也可以利用确保 亚细胞定位至线粒体、内质网(=ER)、细胞核、油小体或其他区室的靶向 序列,以及翻译启动子例如烟草花叶病毒的5’前导序列(Gallie等,Nucl. Acids Res.158693(1987))。

例如,核酸构建体(例如表达盒)可以含有组成型启动子或组织特异性 启动子(优选USP或油菜籽蛋白启动子)、待表达基因和ER滞留信号。就 ER滞留信号而言,优选使用KDEL氨基酸序列(赖氨酸、天冬氨酸、谷氨 酸、亮氨酸)或KKX氨基酸序列(赖氨酸-赖氨酸-X-停止,其中X表示每一 种其他已知的氨基酸)。

为在宿主生物(例如植物)中进行表达,有利地将表达盒插入载体中, 例如质粒、噬菌体或其他允许该基因在宿主生物中最佳表达的DNA。合适 的质粒的实例为:大肠杆菌中的pLG338、pACYC184、pBR系列如 pBR322、pUC系列如pUC18或pUC19、M113mp系列、pKC30、pRep4、 pHS1、pHS2、pPLc236、pMBL24、pLG200、pUR290、pIN-III113-B1、λgt11 或pBdCI;链霉菌中的pIJ101、pIJ364、pIJ702或pIJ361;芽孢杆菌中的 pUB110、pC194或pBD214;棒杆菌中的pSA77或pAJ667;真菌中的 pALS1、pIL2或pBB116;其他有利的真菌载体描述于Romanos M.A.等, Yeast 8,423(1992)和van den Hondel,C.A.M.J.J.等[(1991)”Heterologous gene expression in filamentous fungi“]以及“More Gene Manipulations” in”Fungi”Bennet J.W.&Lasure L.L.编辑,396-428页,Academic Press, San Diego,和”Gene transfer systems and vector development for filamentous fungi“[van den Hondel,C.A.M.J.J.&Punt,P.J.(1991): Applied Molecular Genetics of Fungi,Peberdy,J.F.等编辑,1-28页, Cambridge University Press:Cambridge]。有利的酵母启动子的实例为 2μM、pAG-1、YEp6、YEp13或pEMBLYe23。藻类或植物启动子的实例 为pLGV23、pGHlac+、pBIN19、pAK2004、pVKH或pDH51(参阅Schmidt, R.和Willmitzer,L.,Plant Cell Rep.7,583(1988)))。上文指出的载体或者上 文所指出载体的衍生物仅为可能的质粒中的一部分。其他质粒为本领域技 术人员所熟知,并可见于例如”Cloning Vectors”(Pouwels P.H.等编辑 Elsevier,Amsterdam-New York-Oxford,1985,ISBN 0444904018)。合适的 植物载体描述于“Methods in Plant Molecular Biology and Biotechnology”(CRC Press,Ch.6/7,71-119页)等。有利的载体已知为能在 大肠杆菌和农杆菌中复制的穿梭载体或双元载体。

载体指除质粒以外本领域技术人员已知的所有其他载体,例如噬菌体; 病毒如SV40、CMV、杆状病毒、腺病毒;转座子;IS元件;噬粒;噬菌 粒;粘粒;线性或环状DNA。这些载体可在宿主细胞中自主复制或随染色 体复制,优选随染色体复制。

在载体的另一实施方案中,本发明的表达盒还可有利地以线性DNA 的形式引入生物中,并通过异源或同源重组整合进宿主生物的基因组中。 这种线性DNA可由线性化的质粒构成,或者仅由作为载体的表达盒或本 发明核酸序列构成。

在另一有利的实施方案中,本发明的核酸序列还可以其自身引入生物 中。

如果除了本发明核酸序列外还向生物中引入其他基因,则在单个载体 与报告基因一起或者每个基因在载体中带有一个报告基因均可引入,其中 不同载体可同时或连续引入。

所述载体有利地含有至少一个拷贝的本发明核酸序列和/或本发明的 表达盒(=基因构建体)。

本发明还提供分离的重组表达载体,其包含编码选自SEQ ID NO:2、 4、13、51、52、53、54、55、56、57、58、59、60、61、62、63的多肽 的核酸,其中该载体在宿主细胞中的表达导致与宿主细胞的野生型品种相 比提高的产量。

本文使用的术语“载体”指能运输与其相连的其他核酸的核酸分子。载 体的一种类型是“质粒”,指其中可连接其他DNA区段的双链DNA环。另 一种类型的载体是病毒载体,其中其他DNA区段可连接到病毒基因组中。 某些载体能在其所引入的宿主细胞中自主复制(例如,具有细菌复制起点的 细菌载体和附加型哺乳动物载体)。其他载体(例如非附加型哺乳动物载体) 在引入宿主细胞后整合进宿主细胞或细胞器的基因组中,从而与宿主或细 胞器的基因组一起复制。此外,某些载体能知道与其有效连接的基因表达。 这样的载体称为“表达载体”。一般而言,重组DNA技术中使用的表达载 体一般为质粒形式。在本说明书中,“质粒”和“载体”可互换使用,因为质 粒是最普遍使用的载体形式。然而,本发明旨在包括发挥相同功能的这些 其他形式表达载体,例如病毒载体(例如复制缺陷型逆转录病毒、腺病毒和 腺伴随病毒)。

本发明的重组表达载体包含本发明的核酸,其为适于在宿主细胞中表 达该核酸的形式,这意味着,重组表达载体包含基于用于表达的宿主细胞 选择的与待表达核酸序列有效连接的一个或多个调节序列。在本文中涉及 重组表达载体使用时,“有效连接”旨在表示目的核苷酸序列与调节序列以 允许表达该核苷酸序列(例如,在体外转录/翻译系统中或当该载体引入宿 主细胞的情况下为在宿主细胞中)的方式连接。术语“调节序列”旨在包括启 动子、增强子和其他表达控制元件(例如多腺苷酸化信号)。这些调节序列 描述于例如Goeddel,Gene Expression Technology:Methods in Enzymology 185,Academic Press,San Diego,CA(1990)以及Gruber和 Crosby,:Methods in Plant Molecular Biology and Biotechnology,Glick 和Thompson编辑,第7章,89-108,CRC Press;Boca Raton,Florida,包括 其参考文献。调节序列包括指导核苷酸序列在许多宿主细胞类型中组成型 表达的调节序列以及指导核苷酸序列仅在某些宿主细胞或在某些条件下表 达的调节序列。本领域技术人员应该理解,表达载体的设计可取决于诸如 待转化宿主细胞的选择、期望的多肽表达水平等因素。本发明的表达载体 可引入宿主细胞中,从而产生本文所述核酸(例如编码磷酸核糖焦磷酸合酶) 所编码的多肽或肽,包括融合多肽或肽。

本发明的重组表达载体可设计成在植物细胞中表达本发明的多肽。例 如可在植物细胞中表达PRS基因(参阅Schmidt R.,和Willmitzer L.,Plant Cell Rep.7(1988);Plant Molecular Biology and Biotechnology,C Press, Boca Raton,Florida,第6/7章,71-119页(1993);White F.F.,Jenes B.等, Techniques for Gene Transfer,:Transgenic Plants,Vol.1,Engineering and Utilization,Kung和Wu R.编辑,128-43,Academic Press:1993; Potrykus,Annu.Rev.Plant Physiol.Plant Molec.Biol.42,205(1991),及其 参考文献)。合适的宿主细胞还讨论于Goeddel,Gene Expression Technology:Methods in Enzymology 185,Academic Press:San Diego,CA (1990)。或者,重组表达载体可以体外转录和翻译,例如使用T7启动子调 节序列和T7聚合酶。

经常使用含有指导融合或非融合多肽表达的组成型或诱导型启动子的 载体在原核生物中表达多肽。融合载体在其中所编码多肽中加入多个氨基 酸,一般在重组多肽的氨基端加入,但也可在C端加入,或者融合进多肽 的合适区域中。这些融合载体一般用于三个目的:1)提高重组多肽的表达; 2)提高重组多肽的溶解度;和3)通过作为亲和纯化中的配体而帮助纯化重 组多肽。在融合表达载体中,经常在融合部分与重组多肽的连接处引入蛋 白酶切割位点,以允许在纯化融合多肽后将重组多肽与融合部分分离。这 些酶及其相应的识别序列包括因子Xa、凝血酶和肠激酶。

例如,可将植物表达盒装入pRT转化载体中((a)Toepfer等,Methods Enzymol.217,66(1993),(b)Toepfer等,Nucl.Acids.Res.15,5890(1987))。

或者,还可以在体外转录和翻译重组载体(=表达载体),例如使用T7 启动子和T7RNA聚合酶。

用于原核生物的表达载体经常利用含有或不含融合蛋白或融合寡肽的 诱导型系统,其中这些融合可同时以N端和C端方式发生,或者在蛋白质 的其他有用结构域中发生。这些融合载体一般具有以下目的:1)提高RNA 的表达率;2)提高可获得的蛋白质合成率;3)提高蛋白质的溶解度;4)或通 过可用于亲和层析的结合序列来简化纯化。还经常通过融合蛋白引入蛋白 酶切割位点,这允许切割融合蛋白部分和纯化。这些蛋白酶识别序列是已 知的,例如因子Xa、凝血酶和肠激酶。

典型的有利融合物和表达载体为pGEX(Pharmacia Biotech Inc; Smith D.B.和Johnson K.S.,Gene 67,31(1988))、pMAL(New England Biolabs,Beverly,MA)和pRIT5(Pharmacia,Piscataway,NJ),其含有谷胱 甘肽S-转移酶(GST)、麦芽糖结合蛋白或蛋白A。

在一个实施方案中,将本发明多肽的编码序列克隆进pGEX表达载体 中,以产生编码融合多肽的载体,所述融合多肽从N端到C端包含GST- 凝血酶切割位点-X多肽。该融合多肽可使用谷胱甘肽-琼脂糖树脂通过亲 和层析来纯化。可通过用凝血酶切割融合多肽来回收不融合GST的重组 PK PRS。

大肠杆菌表达载体的其他实例为pTrc(Amann等,Gene 69,301(1988)) 和pET载体(Studier等,Gene Expression Technology:Methods in Enzymology 185,Academic Press,San Diego,California(1990)60-89; Stratagene,Amsterdam,The Netherlands)。

从pTrc载体表达靶基因依赖于从杂合trp-lac融合启动子转录宿主 RNA聚合酶。从pET 11d载体表达靶基因依赖于由共表达的病毒RNA聚 合酶(T7gn1)介导的从T7gn10-lac融合启动子的转录。该病毒聚合酶由宿 主菌株BL21(DE3)或HMS174(DE3)从固有的l原噬菌体提供,其带有 lacUV 5启动子转录控制之下的T7gn1基因。

在本发明的一个优选实施方案中,PRS在植物和植物细胞中表达,例 如单细胞植物细胞(如藻类)(参阅Falciatore等,Marine Biotechnology 1(3), 239(1999)及其参考文献)和来自高等植物(例如种子植物,如作物植物)的植 物细胞。可通过任何方法将编码选自SEQ ID NO:1,3,12,38,39,40,41,42, 43,44,45,46,47,48,49,50的PRS的核酸分子“引入”植物细胞中,所述方 法包括转染、转化或转导、电穿孔、微粒轰击、农杆菌感染等。本领域技 术人员已知的一种转化方法是将开花植物浸入农杆菌溶液中(其中所述农 杆菌含有本发明的核酸),然后对转化配子进行育种。

用于转化或转染宿主细胞(包括植物细胞)的其他合适方法可见于 Sambrook等,Molecular Cloning:A Laboratory Manual.第二版,Cold Spring Harbor Laboratory,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY,1989以及其他实验手册如Methods in Molecular Biology,1995,Vol.44,Agrobacterium protocols,Gartland和Davey编辑, Humana Press,Totowa,New Jersey。产量提高是希望在多种植物中遗传的 一种一般性状,所述植物例如玉米、小麦、黑麦、燕麦、黑小麦、水稻、 大麦、大豆、花生、棉花、油菜籽和芸苔、木薯、胡椒、向日葵和万寿菊; 茄科植物如马铃薯、烟草、茄子和番茄;蚕豆属物种、豌豆、苜蓿;灌木 植物(咖啡、可可、茶);柳属物种;树木(油棕榈、椰子);多年生草本植物 和饲料作物,这些作物植物也是本发明另一实施方案中遗传改造的优选靶 植物。饲料作物包括但不仅限于冰草(wheatrass)、虉草(Canarygrass)、雀 麦草(Bromegrass)、披碱草(Wildrye Grass)、早熟禾(Bluegrass)、鸭茅 (Orchardgrass)、苜蓿、Salfoin、百脉根(Birdsfoot Trefoil)、杂三叶(Alsike clover)、红三叶(red clover)和草木樨(Sweet clover)。

在本发明的一个实施方案中,通过农杆菌介导的基因转移将编码选自 SEQ ID NO:2、4、13、51、52、53、54、55、56、57、58、59、60、61、 62、63的PRS的核酸分子转染进植物中。农杆菌介导的植物转化可使用 例如GV3101(pMP90)(Koncz和Schell,Mol.Gen.Genet.204,383(1986)) 或LBA4404(Clontech)根癌农杆菌菌株来进行。转化可通过标准转化和再 生技术来进行(Deblaere等,Nucl.Acids Res.13,4777(1994),Gelvin, Stanton B.和Schilperoort Robert A,Plant Molecular Biology Manual,第 二版-Dordrecht:Kluwer Academic Publ.,1995.-Sect.,Ringbuc Zentrale Signatur:BT11-P ISBN 0-7923-2731-4;Glick Bernard R.,Thompson John E.,Methods in Plant Molecular Biology and Biotechnology,Boca Raton: CRC Press,1993360S.,ISBN 0-8493-5164-2)。例如,可通过子叶或下胚轴 转化来转化油菜籽(Moloney等,Plant Cell Report 8,238(1989);De Block 等,Plant Physiol.91,694(1989))。用于农杆菌和植物选择的抗生素的使用 取决于用于转化的双元载体和农杆菌菌株。一般使用卡那霉素作为植物选 择标记来进行油菜籽的选择。可使用如Mlynarova等,Plant Cell Report 13, 282(1994)所述技术通过农杆菌介导基因转移进亚麻中。此外,可以使用如 欧洲专利号424047、美国专利号5,322,783、欧洲专利号397687、美国专 利号5,376,543或美国专利号5,169,770所述的技术来转化大豆。可通过微 粒轰击、聚乙二醇介导的DNA摄取或通过碳化纤维技术来实现玉米转 化(参阅如Freeling和Walbot“The maize handbook”Springer Verlag: New York(1993)ISBN 3-540-97826-7)。玉米转化的具体实例可见于美国专 利号5,990,387,小麦转化的具体实例可见于PCT申请号WO 93/07256。

在本发明的一个实施方案中,有利地将所用的核酸序列引入转基因表 达构建体中,该构建体确保在植物生物或所述植物生物的组织、器官、部 分、细胞或繁殖材料中实现来自棉阿舒囊霉的磷酸核糖焦磷酸合酶的转基 因表达。

在该表达构建体中,编码磷酸核糖焦磷酸合酶的核酸分子优选地与至 少一个遗传控制元件(例如启动子和/或终止子)有效连接,所述遗传控制元 件确保在植物生物或其组织、器官、部分、细胞或繁殖材料中实现表达。

有效连接应理解为例如启动子与编码待表达磷酸核糖焦磷酸合酶的核 酸序列(如SEQ ID NO:1所示序列)以及适当时的其他调节元件(如终止子) 依次排列,以使在重组表达该核酸序列时每个调节元件可发挥其功能。该 目的不一定需要化学意义上的直接连接。遗传控制序列(如增强子序列)也 可对在移动至更远的位置上或者事实上从其他DNA分子中对靶序列发挥 其功能。优选的排列是待重组表达的核酸序列位于作为启动子的序列之后, 以使两序列彼此共价连接。启动子序列与待重组表达的核酸序列之间的距 离优选小于200个碱基对,特别优选小于100个碱基对,非常特别优选小 于50个碱基对。

有效连接和表达盒均可通过常规重组方法和克隆技术来实现,它们描 述于例如Maniatis T,Fritsch EF和Sambrook J(1989)Molecular Cloning: A Laboratory Manual,Cold Spring Harbor Laboratory,Cold Spring Harbor(NY);Silhavy TJ,Berman ML和Enquist LW(1984)Experiments with Gene Fusions,Cold Spring Harbor Laboratory,Cold Spring Harbor (NY);Ausubel FM等(1987)Current Protocols in Molecular Biology, Greene Publishing Assoc.and Wiley Interscience以及Gelvin等(1990): Plant Molecular Biology Manual。然而,这两个序列之间还可以安放可作 为带有限制性酶特异性切割位点的接头的其他序列或者信号肽。另外,序 列的插入可导致表达融合蛋白。优选地,由与待表达核酸连接的启动子组 成的表达盒可以是载体整合的形式,并可插入植物基因组中,例如通过转 化来实现。

然而,表达盒也应理解为指这样的构建体,其中编码来自棉阿舒囊霉 的磷酸核糖焦磷酸合酶的核酸序列置于内源启动子之后,以使后者引起表 达来自棉阿舒囊霉的磷酸核糖焦磷酸合酶。

优选引入转基因表达盒中的启动子是在植物生物或其组织、器官、部 分、细胞或繁殖材料中有功能的启动子。在植物生物中有功能的启动子应 理解为指能在植物或植物部分、植物细胞、植物组织或植物培养物中决定 基因(特别是外源基因)表达的任何启动子。在这种情况下,表达可以是例 如组成型的,诱导型的或者发育依赖性的。

以下是优选的:

a)组成型启动子

“组成型”启动子指确保在植物发育的大部分阶段(优选植物发育中的 所有时间)在多种(优选全部)组织中表达的启动子(Benfey等(1989)EMBO J 8:2195-2202)。特别优选使用植物启动子或来源于植物病毒的启动子。特 别优选CaMV(花椰菜花叶病毒)35S转录物(Franck等(1980)Cell 21:285-294;Odell等(1985)Nature 313:810-812;Shewmaker等(1985) Virology 140:281-288;Gardner等(1986)Plant Mol Biol 6:221-228)的启 动子或19S CaMV启动子(US 5,352,605;WO 84/02913;Benfey等(1989) EMBO J 8:2195-2202)。其他合适的组成型启动子为核酮糖二磷酸羧化酶/ 加氧酶小亚基(SSU)启动子(US 4,962,028)、leguminB启动子(GenBank Acc. No.X03677)、来自农杆菌的胭脂碱合酶启动子、TR双启动子、来自农杆 菌的OCS(章鱼碱合酶)启动子、泛蛋白启动子(Holtorf S等(1995)Plant Mol Biol 29:637-649)、泛蛋白1启动子(Christensen等(1992)Plant Mol Biol 18:675-689;Bruce等(1989)Proc Natl Acad Sci USA 86:9692-9696)、 Smas启动子、肉桂醇脱氢酶启动子(US 5,683,439)、液泡ATP酶亚基启动 子、拟南芥腈水解酶-1基因启动子(GenBank Acc.No.:U38846,核苷酸 3862至5325或5342)和来自小麦富脯氨酸蛋白的启动子(WO 91/13991), 在植物在组成型表达的其他基因的启动子为本领域技术人员所知。优选 CaMV 35S启动子和拟南芥腈水解酶-1启动子。

在一个实施方案中,使用GOS-2启动子。

b)组织特异性启动子

此外,优选对种子具有特异性的启动子,例如菜豆蛋白启动子(US 5,504,200;Bustos MM等(1989)Plant Cell 1(9):839-53)、2S白蛋白基因的 启动子(Joseffson LG等(1987)J Biol Chem 262:12196-12201)、豆球蛋白 启动子(Shirsat A等(1989)Mol Gen Genet 215(2):326-331)、USP(未知种 子蛋白)启动子(H等(1991)Mol Gen Genet 225(3):459-67)、油菜 籽蛋白基因启动子(US 5,608,152;Stalberg K等(1996)L Planta 199:515-519)、蔗糖结合蛋白启动子(WO 00/26388)或豆球蛋白B4启动子 (LeB4;H等(1991)Mol Gen Genet 225:121-128;等 (1992)Plant Journal 2(2):233-9;Fiedler U等(1995)Biotechnology(NY) 13(10):1090f)、拟南芥油质蛋白启动子(WO 98/45461)和芸苔Bce4启动子 (WO 91/13980)。

其他合适的种子特异性启动子是以下基因的启动子:编码高分子量麦 谷蛋白(HMWG)的基因、麦醇溶蛋白、分支酶、ADP葡萄糖焦磷酸酶(AGP 酶)或淀粉合酶。其他优选的是允许在单子叶植物(如玉米、大麻、小麦、 黑麦、稻等)中实现种子特异性表达的启动子。可以有利地使用lpt2或lpt1 基因的启动子(WO 95/15389,WO 95/23230)或者WO 99/16890中所述启动 子(大麦醇溶蛋白基因、谷蛋白基因、水稻素基因、谷醇溶蛋白基因、麦醇 溶蛋白基因、谷蛋白基因、玉米醇溶蛋白基因、蓖麻素(casirin)基因或裸麦 醇溶蛋白基因的启动子)。

c)化学诱导型启动子

表达盒还可含有化学诱导型启动子(综述文章:Gatz等(1997)Annu Rev Plant Physiol Plant Mol Biol 48:89-108),由此可将植物中外源基因的 表达控制在特定的时间点。可以类似地使用这些启动子,例如PRP1启动 子(Ward等(1993)Plant Mol Biol 22:361-366)、水杨酸诱导型启动子(WO 95/19443)、苯磺酰胺诱导型启动子(EP 0388186)、四环素诱导型启动子 (Gatz等(1992)Plant J 2:397-404)、脱落酸诱导型启动子(EP 0335528)或 乙醇-环己酮诱导型启动子(WO 93/21334)。合适的还有谷胱甘肽S转移酶 同工型II基因的启动子(GST-II-27),它可被外源应用的安全剂(如N,N-二 烯丙基-2,2-二氯乙酰胺)激活(W093/01294),并且在单子叶植物和双子叶植 物的多种组织中有活性。特别优选组成型启动子,更特别优选种子特异性 启动子,特别是油菜籽蛋白启动子和USP启动子。

此外,允许在其他植物组织或其他生物(如大肠杆菌)中表达的其他启 动子可与待表达的核酸序列有效连接。原则上,合适的植物启动子是所有 上述启动子。

表达盒或载体中存在的核酸序列可与除启动子以外的其他遗传控制序 列有效连接。术语“遗传控制序列”应以广义理解,指对本发明表达盒的建 立或功能有影响的所有序列。例如,遗传控制序列改变在原核或真核生物 中的转录和翻译。本发明的表达盒优选在各种情况下均包括待重组表达核 酸序列5’上游的植物特异性启动子,以及作为额外遗传控制序列的3’下游 终止子序列,并在适当时还包含惯用的调节元件,它们均与待重组表达的 核酸序列有效连接。

遗传控制序列还包括能改变表达控制特性的其他启动子、启动子元件 或最小启动子。因此,遗传控制序列可以例如产生额外依赖于某些胁迫条 件的组织特异性表达。例如,已对水胁迫、脱落酸(Lam E和Chua NH,J Biol Chem 1991;266(26):17131-17135)和热胁迫(Schoffl F等(1989)Mol Gen Genetics 217(2-3):246-53)描述了这些元件。

其他有利的控制序列为例如革兰氏阳性启动子amy和SPO2,以及酵 母或真菌启动子ADC1、MFa、AC、P-60、CYC1、GAPDH、TEF、rp28、 ADH。

原则上,所有带有其调节序列的天然启动子(如上文所述)均可用于本 发明的方法。此外,可以有利地使用合成启动子。

遗传控制序列还包括基因的5’非翻译区、内含子或非编码3’区,例如 肌动蛋白-1内含子或Adh1-S内含子1、2和6(一般性综述参阅如The Maize Handbook,Chapter 116,Freeling和Walbot编辑,Springer,New York (1994))。已经证明,它们可在基因表达的调节中发挥重要作用。因此,已 经证明,5’非翻译序列可增强异源基因的瞬时表达。可以提到的翻译增强 子为例如烟草花叶病毒5’前导序列(Gallie等(1987)Nucl Acids Res 15:8693-8711)等。它们还可促进组织特异性(Rouster J等(1998)Plant J 15:435-440)。

表达盒还可有利地含有与启动子有效连接的已知为增强子序列的序 列,它们使得可以提高核酸序列的重组表达。还可以在待重组表达的核酸 序列的3’末端插入其他有利的序列,例如其他调节元件或终止子。基因构 建体中可以存在待重组表达核酸序列的一个或多个拷贝。

适于作为控制序列的多腺苷酸化信号为植物多腺苷酸化信号,优选与 根癌农杆菌T-DNA多腺苷酸化信号特别是Ti质粒pTiCHS中T-DNA基 因3(章鱼碱合酶)或其功能等同物基本一致的那些(Gielen等(1984)EMBO J 3:835等等)。特别合适的终止子序列的实例是OCS(章鱼碱合酶)终止子 和NOS(胭脂碱合酶)终止子。

控制序列还应理解为允许发生同源重组或插入宿主生物基因组或从基 因组中移除的序列。例如,对于同源重组的情况,可以定向方式将特定内 源基因的编码序列替换为编码dsRNA的序列。诸如cre/lox技术的方法允 许从宿主生物基因组中组织特异性(可能为诱导型)地移除表达盒(Sauer B (1998)Methods.14(4):381-92)。这时,将某些侧翼序列加入靶基因中(lox 序列),这使得可以在其后的时间点通过cre重组酶进行移除。

表达盒和由其产生的载体可包含其他功能元件。术语“功能元件”应以 广义理解,指对本发明表达盒、载体或转基因生物的产生、复制或功能有 影响的所有元件。可以提到的实例包括但不仅限于:

a)选择标记,其赋予对以下物质的抗性:代谢抑制剂如2-脱氧葡萄糖 -6-磷酸(WO 98/45456)、抗生素或杀生物剂(优选除草剂),例如卡那霉素、 G418、博来霉素、潮霉素或膦丝菌素等。特别优选的选择标记是赋予对除 草剂的抗性的那些。例如:编码膦丝菌素乙酰转移酶(PAT)并使谷氨酰胺 合酶抑制剂失活的DNA序列(bar和pat基因)、赋予草甘(N-(膦酰甲 基)甘氨酸)抗性的5-烯醇式丙酮基莽草酸-3-磷酸合酶基因(EPSP合酶基 因)、编码草甘降解酶(草甘膦氧化还原酶)的gox基因、deh基因(编码 使茅草枯失活的脱卤素酶)、使磺酰脲和咪唑啉酮失活的乙酰乳酸合酶,以 及编码降解溴草腈的腈水解酶的bxn基因、赋予抗生素大观霉素抗性的 aasa基因、产生链霉素抗性的链霉素磷酸转移酶(SPT)基因、赋予卡那霉 素或遗传霉素抗性的新霉素磷酸转移酶(NPTII)基因、赋予潮霉素抗性的潮 霉素磷酸转移酶(HPT)基因、赋予磺酰脲除草剂抗性的乙酰乳酸合酶基因 (ALS)(例如带有如S4和/或Hra突变的突变ALS变体)。

b)报告基因,其编码易于定量的蛋白质,并允许通过其颜色或酶活性 来评价转化效率或表达部位或时间。这种情况下非常特别优选的是报告蛋 白(Schenborn E,Groskreutz D.Mol Biotechnol.1999;13(1):29-44),如绿色 荧光蛋白(GFP)(Sheen等(1995)Plant Journal 8(5):777-784)、氯霉素转移 酶、萤光素酶(Ow等(1986)Science 234:856-859)、水母发光蛋白基因 (Prasher等(1985)Biochem Biophys Res Commun 126(3):1259-1268)、β- 半乳糖苷酶,非常特别优选的是β-葡糖醛酸糖苷酶(Jefferson等(1987) EMBO J 6:3901-3907)。

c)复制起点,其允许本发明的表达盒或载体在例如大肠杆菌中复制。 可以提到的实例为ORI(DNA复制起点)、pBR322起点或P15A起点 (Sambrook等:Molecular Cloning.A Laboratory Manual,第二版.Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY,1989)。

d)农杆菌介导的植物转化所需的元件,例如T-DNA的右边界或左边 界,或者vir区。

为了选择成功发生同源重组的细胞或者成功转化的细胞,一般需要额 外引入选择标记,其赋予成功发生重组的细胞对杀生物剂(如除草剂)、代 谢抑制剂(如2-脱氧葡萄糖-6-磷酸)(WO 98/45456)或抗生素的抗性。选择标 记允许将转化细胞从未转化细胞中选择出来(McCormick等(1986)Plant Cell Reports 5:81-84)。

此外,重组表达盒或表达载体还可包含这样的核酸序列,其不编码来 自棉阿舒囊霉的磷酸核糖焦磷酸合酶,其重组表达导致进一步提高脂肪酸 的生物合成(例如由于proOIL)。额外重组表达的proOIL核酸序列可选自 例如但不仅限于编码乙酰辅酶A羧化酶(ACCase)、甘油-3-磷酸酰基转移酶 (GPAT)、溶血磷脂酰基转移酶(LPAT)、二酰甘油酰基转移酶(DAGAT)和 磷脂:二酰甘油酰基转移酶(PDAT)的核酸。这些序列为本领域技术人员已 知,并可容易地得自数据库或相应植物的适当eDNA文库。

本发明的表达盒可通过使用存在该表达盒的载体而有利地引入生物或 其细胞、组织、器官、部分或种子(优选植物或植物细胞、组织、器官、部 分或种子)中。因此,本发明还涉及所述重组载体,其包含来自棉阿舒囊霉 的磷酸核糖焦磷酸合酶的重组表达盒。

例如,载体可以是质粒、粘粒、噬菌体、病毒或农杆菌。表达盒可通 过适当的限制性切割位点引入载体(优选质粒载体)中。所得的载体首先引 入大肠杆菌中。选择正确转化的大肠杆菌,培养并通过本领域技术人员已 知的方法获得重组载体。可以使用限制酶分析和测序来验证克隆步骤。优 选的载体是使得可以将表达盒稳定整合进宿主基因组中的那些。

例如,通过转化或转染相应的蛋白质或核酸来产生这样的转基因植物。 转化生物(或转化的细胞或组织)的产生需要将目的DNA(例如表达载体)、 RNA或蛋白质引入目的宿主细胞。有多种方法可用于称为转化(或转导或 转染)的这一过程(Keown等(1990)Methods in Enzymology 185:527-537)。 因此,DNA或RNA可通过如显微注射或以包被有DNA的微粒进行的生 物射弹直接引入。还可对细胞进行化学透化处理,例如用聚乙二醇进行处 理,以使DNA可通过扩散到达细胞。还可使用其他含有DNA的单位如小 细胞、细胞、溶酶体或脂质体通过原生质体融合来实施DNA引入。电穿 孔是引入DNA的另一种合适方法,这时,通过电脉冲使细胞可逆地透化。 还可以将植物部分浸入DNA溶液中,以及花粉或花粉管转化。这些方法 已被描述(例如Bilang等(1991)Gene 100:247-250;Scheid等(1991)Mol Gen Genet 228:104-112;Guerche等(1987)Plant Science 52:111-116; Neuhause等(1987)Theor Appl Genet 75:30-36;Klein等(1987)Nature 327:70-73;Howell等(1980)Science 208:1265;Horsch等(1985)Science 227:1229-1231;DeBlock等(1989)Plant Physiology 91:694-701;Methods for Plant Molecular Biology (Weissbach和Weissbach编辑)Academic Press Inc.(1988);以及Methods in Plant Molecular Biology(Schuler和 Zielinski,eds.)Academic Press Inc.(1989))。

在植物中,已描述的用于转化植物组织或植物细胞和由其再生植物的 方法已被利用于瞬时转化或稳定转化。具体地,合适的方法是通过聚乙二 醇诱导的DNA摄取实现的原生质体转化、使用基因枪进行的生物射弹法 (也称为微粒轰击法)、电穿孔、将干胚在含有DNA的溶液中孵育以及显微 注射。

除了这些“直接”转化技术以外,还可以通过细菌感染来实现转化,这 通过根癌农杆菌或发根农杆菌和相应重组Ti质粒或Ri质粒的转移来实现, 或者通过转基因植物病毒感染来实现。农杆菌介导的转化最适合于双子叶 植物细胞。该方法描述于例如Horsch RB等(1985)Science 225:1229t)。

当使用农杆菌时,表达盒将整合进特定的质粒(穿梭载体或双元载体) 中。如果将Ti或Ri质粒用于转化,将Ti或Ri质粒T-DNA的至少右边界 (多数情况下为右边界和左边界)作为侧翼区与待引入的表达盒连接。

优选使用双元载体。双元载体在大肠杆菌和农杆菌中都能复制。它们 通常含有选择标记基因以及侧翼为T-DNA序列右边界和左边界的接头或 多聚接头。它们可直接转化进农杆菌中(Holsters等(1978)Mol Gen Genet 163:181-187)。选择标记基因(例如赋予卡那霉素抗性的nptII基因)允许选 择转化的农杆菌。在这种情况下作为宿主生物的农杆菌应已包含带有vir 区的质粒。vir区是向植物细胞转移T-DNA所需的。这样转化的农杆菌可 用于转化植物细胞。T-DNA用于转化植物细胞的用途已被广泛研究和描述 (EP 120516;Hoekema,The Binary Plant Vector System,Offsetdrukkerij Kanters B.V.,Alblasserdam,Chapter V;An等(1985)EMBO J 4:277-287)。已知多种双元载体,其中一些是市售的,例如pBI101.2或 pBIN19(Clontech Laboratories,Inc.USA)。

已经描述了其他适于植物表达的启动子(Rogers等(1987)Meth in Enzymol 153:253-277;Schardl等(1987)Gene 61:1-11;Berger等(1989) Proc Natl Acad Sci USA 86:8402-8406)。

直接转化技术适用于任何生物和细胞类型。在将DNA或RNA注射或 电穿孔进植物细胞的情况下,所用的质粒不一定满足任何特定要求。可以 使用简单的质粒,例如来自pUC系列的质粒。如果将从转化细胞再生完整 植物,则质粒中有必要存在额外的选择标记基因。

当选择标记是所插入DNA的一部分时,可以将稳定转化细胞(即含有 已整合进宿主细胞DNA中的插入DNA的细胞)从未转化细胞中选择出来。 例如,能赋予对抗生素或除草剂(如卡那霉素、G418、博来霉素、潮霉素 或膦丝菌素等)的抗性的任何基因都可作为标记(见上文)。表达这样的标记 基因的转化细胞能在存在杀死未转化野生型的抗生素或除草剂浓度的情况 下存活。实例如上述,优选包括赋予除草剂膦丝菌素抗性的bar基因 (Rathore KS等(1993)Plant Mol Biol 21(5):871-884)、赋予卡那霉素抗性 的nptII基因、赋予潮霉素抗性的hpt基因,或者赋予除草剂草甘膦抗性 的EPSP基因。选择标记允许将转化细胞从未转化细胞中选择出来 (McCormick等(1986)Plant Cell Reports 5:81-84)。可以惯用的方式对所 得植物进行育种和杂交。应培养两代或更多代以确保基因组整合是稳定并 且可遗传的。

上述方法描述于例如Jenes B等(1993)Techniques for Gene Transfer, Transgenic Plants,Vol.1,Engineering and Utilization,SD Kung和R Wu 编辑,Academic Press,128-143页,以及Potrykus(1991)Annu Rev Plant Physiol Plant Molec Biol 42:205-225。优选将待表达的构建体克隆进适于转 化根癌农杆菌的载体(如pBin19)中(Bevan等(1984)Nucl Acids Res 12:8711f)。

一旦产生了转化的植物细胞,就可使用本领域技术人员已知的方法获 得完整植物。例如,使用愈伤组织培养物作为起始材料。可以已知方式在 这种尚未分化的细胞生物量中诱导嫩枝和根的发育。可将所得的小植物移 出并用于育种。

本领域技术人员熟悉这些用于从植物细胞再生植物部分和完整植物的 方法。可以用于此目的的方法例如为Fennell等(1992)Plant Cell Rep.11: 567-570;Stoeger等(1995)Plant Cell Rep.14:273-278;Jahne等(1994) Theor Appl Genet 89:525-533所述的方法。

“转基因”或“重组”(例如对于核酸序列、表达盒或者包含所述核酸序列 的载体或者转化有所述核酸序列、表达盒或载体的生物的情况)指所有通过 重组方法构建的构建体,其中

a)编码磷酸核糖焦磷酸合酶的核酸序列,或

b)与a)所述核酸序列有效连接的遗传控制序列,例如在植物生物中有 功能的启动子,或

c)a)和b)

不在其天然遗传环境中,或者已通过重组方法进行了修饰,所述修饰 可以是例如替换、添加、缺失、倒位或插入一个或多个核苷酸残基。天然 遗传环境指来源生物中的天然染色体基因座或者在基因组文库中存在。对 于基因组文库的情况,核酸序列的天然遗传环境优选至少在一定程度上保 留。该环境在核酸序列的至少一侧,并且序列长度为至少50bp,优选至 少500bp,更优选至少1000bp,非常特别优选至少5000bp。天然表达盒 (例如启动子与编码酵母G3PDH的基因的天然组合)在后者经非天然合成 (“人工”)方法(例如诱变)修饰时成为转基因表达盒。已经描述了这样的方法 (US 5,565,350;WO 00/15815;见上文)。

特别地,优选作为转基因生物的宿主或起始生物是与上文定义一致的 植物。本发明的目的包括植物界中所有属和种的单子叶植物和双子叶植物, 特别是用于获得油的植物,例如油菜、向日葵、芝麻、红花、橄榄树、大 豆、玉米和坚果物种。还包括成熟植物、种子、嫩枝和苗,以及由此产生 的部分、繁殖材料和培养物(例如细胞培养物)。成熟植物指处于苗阶段之 后的任何期望的发育阶段的植物。苗指早期发育阶段的年幼未成熟植物。

可以用上文所述用于转化或转染生物的方法来产生转基因植物。

根据本发明,如果整合进非染色体自主复制子或整合进植物染色体或 细胞器基因组中,则所引入的编码选自SEQ ID NO:2、4、13、51、52、 53、54、55、56、57、58、59、60、61、62、63之PRS的核酸分子可在 植物细胞中稳定维持。或者,所引入的PRS可存在于染色体外的非复制型 载体中,并瞬时表达或具有瞬时活性。

在一个实施方案中,可以产生其中PRS已整合进基因组中的异源重组 微生物,制备载体,其含有编码选自SEQ ID NO:2、4、13、51、52、53、 54、55、56、57、58、59、60、61、62、63之PRS的核酸分子的至少一 部分,其中引入了缺失、添加或替换,以改变(例如功能性破坏)该基因。 优选地,所述PRS基因为酵母、大肠杆菌基因,但也可以是来自相关植物 或甚至来自哺乳动物或昆虫来源的同源物。载体可设计成使得在同源重组 时编码PRS的内源核酸分子被突变或以其他方式改变,但仍编码功能性多 肽(例如,可以改变上游调节区,从而改变内源PRS的表达)。在一个优选 的实施方案中,本发明蛋白质的生物活性在同源重组后提高。为了通过同 源重组产生点突变,可以在称为嵌合修复术(chimeraplasty)的技术中使用 DNA-RNA杂交体(Cole-Strauss等,Nucleic Acids Research 27(5),1323 (1999)和Kmiec,Gene Therapy American Scientist.87(3),240(1999))。展 叶剑叶藓(Physcomitrella paten)中的同源重组操作也是本领域技术人员所 熟知的,并考虑用于本文中。

而在同源重组载体中,编码选自SEQ ID NO:2、4、13、51、52、53、 54、55、56、57、58、59、60、61、62、63之PRS的核酸分子中改变的 部分在其5’和3’末端的侧翼为额外的PRS基因核酸分子,以允许在该载体 所携带的外源PRS基因与微生物或植物中的内源PRS基因之间发生同源 重组。所述额外的侧翼PRS核酸分子为足以与内源基因发生成功的同源重 组的长度。载体中一般包含数百个碱基对至数千碱基对的侧翼DNA(5’和3’ 端都是如此)。对同源重组载体的描述参阅如Thomas K.R.,和Capecchi M.R.,Cell 51,503(1987),或者对展叶剑叶藓中基于cDNA的重组参阅 Strepp等,PNAS,95(8),4368(1998)。将该载体引入微生物或植物细胞中 (例如通过聚乙二醇介导的DNA),并使用本领域已知的技术选择所引入 RPS基因已与内源PRS基因发生同源重组的细胞。

无论是存在于染色体外非复制型载体中还是存在于整合进染色体的载 体中,编码选自SEQ ID NO:2、4、13、51、52、53、54、55、56、57、 58、59、60、61、62、63的PRS的核酸分子均优选存在于植物表达盒中。 植物表达盒优选地含有调节序列,所述调节序列能在植物细胞中驱动与其 有效连接的基因表达,以使每个序列可发挥其功能,例如通过聚腺苷酸化 信号来终止转录。优选的多腺苷酸化信号是来源于根癌农杆菌t-DNA(例如 Ti质粒pTiACH5中称为章鱼碱合酶的基因3)的那些(Gielen等,EMBO J.3, 835(1984))或其功能等同物,但在植物中具有功能活性的其他终止子也是 合适的。由于植物基因表达经常不仅受限于转录水平,因此植物表达盒优 选含有其他有效连接的序列,如翻译增强子,如含有提高多肽/RNA比值 的烟草花叶病毒5’非翻译前导序列的超驱动序列(Gallie等,Nucl.Acids Research 15,8693(1987))。植物表达载体的实例包括Becker D.等,Plant Mol.Biol.20,1195(1992)以及Bevan M.W.,Nucl.Acid.Res.12,8711 (1984);和“Vectors for Gene Transfer in Higher Plants”Transgenic Plants, Vol.1,Engineering and Utilization,Kung和Wu R.,Academic Press,1993, S.15-38中详细描述的那些。

“转化”在本文中定义为将异源DNA引入植物细胞、植物组织或植物 的方法。这可在天然或人工条件下使用本领域熟知的多种方法来进行。转 化可依赖于将外源核酸序列插入原核或真核宿主细胞的任何已知方法。基 于所转化的宿主细胞来选择方法,包括但不仅限于病毒感染、电穿孔、脂 转染和微粒轰击。这些“转化”细胞包括稳定转化的细胞,其中所插入的 DNA能作为自主复制质粒复制,或作为宿主染色体的一部分复制。它们包 括在有限的时间内瞬时表达所插入DNA或RNA的细胞。转化的植物细胞、 植物组织或植物应理解为不仅包括转化方法的终产物,而且还包括其转基 因后代。

术语“转化的”、“转基因的”和“重组的”指已引入异源核酸分子的宿主 生物,例如细菌或植物。所述核酸分子可稳定整合进宿主的基因组中,或 者该核酸分子也可作为染色体外的分子存在。这样的染色体外分子可以自 主复制。转化的细胞、组织或植物应理解为不仅包括转化方法的终产物, 而且还包括其转基因后代。“非转化的”、“非转基因的”或“非重组的”宿主 指不含有异源核酸分子的野生型生物,例如细菌或植物。

本文使用的“转基因植物”指含有插入其核基因组或细胞器基因组的外 源核苷酸序列的植物。其还包括后代,例如T1、T2和后续世代,或者BC1、 BC2和后续世代,及其与非转基因植物或其他转基因植物的杂种。

宿主生物(=转基因生物)有利地含有至少一个拷贝的本发明核酸和/或 本发明的核酸构建体。

原则上,所有植物均可用作宿主生物。优选的转基因植物为例如选自 以下科:槭树科(Aceraceae)、漆树科(Anacadiaceae)、伞形科(Apiaceae)、 菊科(Asteraceae)、十字花科(Brassicaceae)、仙人掌科(Cactaceae)、葫芦科 (Cucurbitaceae)、大戟科(Euphorbiaceae)、豆科(Fabaceae)、锦葵科 (Malvaceae)、睡莲科(Nymphaeaceae)、罂粟科(Papaveraceae)、蔷薇科 (Rosaceae)、杨柳科(Salicaceae)、茄科(Solanaceae)、棕榈科(Arecaceae)、 凤梨科(Bromeliaceae)、莎草科(Cyperaceae)、鸢尾科(Iridaceae)、百合科 (Liliaceae)、兰科(Orchidaceae)、龙胆科(Gentianaceae)、唇形科(Labiaceae)、 木兰科(Magnoliaceae)、毛莨科(Ranunculaceae)、Carifolaceae、茜草科 (Rubiaceae)、玄参科(Scrophulariaceae)、石竹科(Caryophyllaceae)、杜鹃 花科(Ericaceae)、蓼科(Polygonaceae)、堇菜科(Violaceae)、灯心草科 (Juncaceae)或禾本科(Poaceae)并优选来源于选自槭树科、漆树科、十字花 科、葫芦科、豆科、罂粟科、蔷薇科、茄科、百合科或禾本科植物。优选 作物植物,如有利地选自如下属的植物:花生、欧洲油菜、卡诺拉油菜、 向日葵属、红花、橄榄(olive)、芝麻(sesame)、榛子(hazelnut)、扁桃(almond)、 鳄梨(avocado)、月桂(bay)、南瓜(pumpkin/squash)、胡麻、大豆(soya)、 阿月混子(pistachio)、琉璃苣、玉米、小麦、黑麦、燕麦、高粱(sorghum) 和粟(millet)、黑小麦、稻、大麦、木薯(cassava)、马铃薯、甜菜、茄子、 苜蓿和多年生草本和饲用植物、油棕榈、蔬菜(芸苔属植物、根用蔬菜、块 茎类蔬菜、荚果蔬菜、果类蔬菜、葱蒜类蔬菜、叶用蔬菜和茎用蔬菜)、荞 麦(buckwheat)、菊芋(Jerusalem artichoke)、蚕豆(broad bean)、野豌豆 (vetches)、小扁豆(lentil)、四季豆(dwarf bean)、羽扇豆、三叶草和紫花苜 蓿,此处仅提到它们中的某些。

在本发明的一个实施方案中,转基因植物选自谷类、大豆、油菜籽(包 括油菜,特别是芸苔和冬季油菜)、棉花、甘蔗和马铃薯,特别是玉米、大 豆、油菜籽(包括油菜,特别是芸苔和冬季油菜)、棉花、小麦和水稻。

在本发明的另一实施方案中,转基因植物为裸子植物,特别是云杉、 松树或冷杉。

在一个优选的实施方案中,宿主植物选自槭树科、漆树科、伞形科、 菊科、十字花科、仙人掌科、葫芦科、大戟科、豆科、锦葵科、睡莲科、 罂粟科、蔷薇科、杨柳科、茄科、棕榈科、凤梨科、莎草科、鸢尾科、百 合科、兰科、龙胆科、唇形科、木兰科、毛莨科、Carifolaceae、茜草科、 玄参科、石竹科、杜鹃花科、蓼科、堇菜科、灯心草科或禾本科并优选来 源于选自槭树科、漆树科、十字花科、葫芦科、豆科、罂粟科、蔷薇科、 茄科、百合科或禾本科植物。优选作物植物并且特别是本文中以上提到的 植物作为宿主植物,如以上提到的科和属,例如优选的物种是腰果 (Anacardium occidentale)、金盏花(Calendula officinalis)、红花(Carthamus tinctorius)、菊芋(Cichorium intybus)、洋蓟(Cynara scolymus)、向日葵 (Helianthus annus)、香叶万寿菊(Tagetes lucida)、万寿菊(Tagetes erecta)、 细叶万寿菊(Tagetes tenuifolia);胡萝卜(Daucus carota);欧洲榛(Corylus avellana)、土其榛(Corylus colurna)、琉璃苣(Borago officinalis);欧洲 油菜、芜青(Brassica rapa ssp.)、野欧白芥(Sinapis arvensis)、芥菜(Brassica juncea)、芥菜原变种(Brassica juncea var.juncea)、皱叶芥菜(Brassica juncea var.crispifolia)、大叶芥菜(Brassica juncea var.foliosa)、黑芥 (Brassica nigra、Brassica sinapioides、Melanosinapis communis)、甘蓝 (Brassica oleracea)、拟南芥菜、凤梨(Anana comosus)、Ananas ananas、 Bromelia comosa、番木瓜(Carica papaya)、大麻(Cannabis sative)、甘薯 (lpomoea batatus)、提琴叶牵牛花(lpomoea pandurata)、Convolvulus batatas、Convolvulus tiliaceus、甘薯(lpomoea fastigiata)、lpomoea tiliacea、 三裂叶薯(lpomoea triloba)、Convolvulus panduratus、甜菜(Beta vulgaris)、 甜萝卜(Beta vulgaris var.altissima)、甜菜(原变种)(Beta vulgaris var. vulgaris)、沿海甜菜(Beta maritima)、Beta vulgaris var.perennis、Beta vulgaris var.conditiva、Beta vulgaris var.esculenta、笋瓜(Cucurbita mixta)、西葫芦(Cucurbita pepo)、南瓜(Cucurbita moschata)、油橄榄(Olea europaea)、木薯(Manihot utilissima)、Janipha Manihot、Jatropha manihot、 Manihot aipil、Manihot dulcis、Manihot manihot、Manihot melanobasis、 木薯(Manihot esculenta)、蓖麻(Ricinus communis)、豌豆(Pisum sativum)、饲料豌豆(Pisum arvense)、早生矮豌豆(Pisum humile)、紫花苜 蓿(Medicago sativa)、野苜蓿(Medicago falcata)、杂交苜蓿(Medicago varia)、大豆、Dolichos soja、宽叶蔓豆(Glycine gracilis)、Glycine hispida、 Phaseolus max、Soja hispida、Soja max、椰子(Cocos nucifera)、茶簏子天 竺葵(Pelargonium grossularioides)、Oleum cocoas、月桂(Laurus nobilis)、 鳄梨(Persea americana)、花生(Arachis hypogaea)、亚麻(linum usitatissimum)、linum humile、奥地利亚麻(linum austriacum)、linum bienne、窄叶亚麻(linum angustifolium)、泻亚麻(linum catharticum)、金 黄亚麻(linum flavum)、大花亚麻(linum grandiflorum、Adenolinum grandiflorum)、刘易斯亚麻(linum lewisii)、那旁亚麻(linum narbonense)、 宿根亚麻(linnm perenne)、刘易斯宿根亚麻(linum perenne var.lewisii)、 linum pratense、linum trigynum、石榴(Punica granatum)、陆地棉 Gossypium hirsutum、树棉(Gossypium arboreum)、海岛棉(Gossypium barbadense)、草棉(Gossypium herbaceum)、瑟伯氏棉(Gossypium thurberi)、香蕉(Musa nana)、小果野蕉(Musa acuminata)、大蕉(Musa paradisiaca)、芭蕉(Musa spp.)、油棕(Elaeis guineensis)、东方罂粟(Papaver orientale)、虞美人(Papaver rhoeas)、Papaver dubium、胡麻(Sesamum indicum)、树胡椒(Piper aduncum)、Piper amalago、狭叶胡椒(Piper angustifolium)、Piper auritum、萎叶(Piper betel)、毕澄茄(Piper cubeba)、 荜菝(Piper longum)、胡椒(Piper nigrum)、假荜菝(Piper retrofractum)、 Artanthe adunca、Artanthe elongata、Peperomia elongata、Piper elongatum、Steffensia elongata、大麦(Hordeum vulgare)、芒颖大麦草 (Hordeum jubatum)、鼠大麦(Hordeum murinum)、黑麦状大麦草 (Hordeum secalinum)、栽培二棱大麦(Hordeum distichon)、三叉大麦 (Hordeum aegiceras)、栽培六棱大麦(Hordeum hexastichon.、Hordeum hexastichum)、Hordeum irregulare、大麦(Hordeum sativum)、黑麦状大 麦草(Hordeum secalinum)、燕麦(Avena sativa)、野燕麦(Avena fatua)、比 赞燕麦(Avena byzantina)、野燕麦(原变种)(Avena fatua var.sativa)、杂种 野燕麦(Avena hybrida)、双色高粱(Sorghum bicolor)、石茅高粱(Sorghum halepense)、甜高粱(Sorghum saccharatum)、高粱(Sorghum vulgare)、 Andropogon drummondii、Holcus bicolor、Holcus sorghum、Sorghum aethiopicum、Sorghum arundinaceum、卡佛尔高粱(Sorghum caffrorum)、 垂穗高粱草(Sorghum cernuum)、甜高粱(Sorghum dochna)、Sorghum drummondii、硬高粱草(Sorghum durra)、Sorghum guineense、Sorghum lanceolatum、多脉高粱草(Sorghum nervosum)、甜高粱(Sorghum saccharatum)、Sorghum subglabrescens、Sorghum verticilliflorum、高粱 (Sorghum vulgare)、石茅高粱(Holcus halepensis)、黍(Sorghum miliaceum)(谷子(millet))、稷(Panicum militaceum)、玉米、普通小麦 (Triticum aestivum)、硬粒小麦(Triticum durum)、圆柱小麦(Triticum turgidum)、Triticum hybernum、马卡小麦(Triticum macha)、普通小麦 (Triticum sativum)或普通小麦(Triticum vulgare)、咖啡(Cofea spp.)、小果 咖啡(Coffea arabica)、中果咖啡(Coffea canephora)、大果咖啡(Coffea liberica)、辣椒(Capsicum annuum)、Capsicum annuum var. glabriusculum、小米椒(Capsicum frutescens)、辣椒(Capsicum annuum)、 烟草(Nicotiana tabacum)、马铃薯(Solanum tuberosum)、茄(Solanum melongena)、番茄(Lycopersicon esculentum)、番茄(Lycopersicon lycopersicum.)、梨形番茄(Lycopersicon pyriforme)、红茄(Solanum integrifolium)、番茄(Solanum lycopersicum)、可可树(Theobroma cacao) 或大叶茶(Camellia sinensis)。

漆树科如黄连木属(Pistacia)、芒果属(Mangifera)、腰果属 (Anacardium)例如物种阿月混子(Pistacia vera)[pistachios、Pistazie]、芒 果(Mangifer indica)[Mango]或腰果(Anacardium occidentale)[Cashew];菊 科如金盏花属(Calendula)、红蓝花属(Carthamus)、矢车菊属(Centaurea)、 菊苣属(Cichorium)、菜蓟属(Cynara)、向日葵属(Helianthus)、莴苣属 (Lactuca)、Locusta、万寿菊属、缬草属(Valeriana)例如物种金盏花 [Marigold]、红花[safflower]、矢车菊(Centaurea cyanus)[cornflower]、菊 苣(Cichorium intybus)[blue daisy]、洋蓟[Artichoke]、向日葵[sunflower]、 莴苣(Lactuca sativa)、皱叶莴苣(Lactuca crispa)、Lactuca esculenta、 Lactuca scariola L.ssp.sativa、Lactuca scariola L.var.integrata、Lactuca scariola L.var.integrifolia、Lactuca sativa subsp.romana、Locusta communis、莴苣缬草(Valeriana locusta)[lettuce]、香叶万寿菊、万寿菊或 细叶万寿菊[Marigold];伞形科如胡萝卜属(Daucus)例如物种胡萝卜 [carrot];桦木科(Betulaceae)如榛属(Corylus)例如物种欧洲榛或土耳其榛 [hazelnut];紫草科(Boraginaceae)如琉璃苣属(Borage)例如物种琉璃苣 [borage];十字花科如芸苔属、Melanosinapis、白芥属(Sinapis)、拟南芥菜 属例如物种欧洲油菜、芜青[卡诺拉油菜、欧洲油菜、甘蓝型油菜]、野欧 白芥、芥菜、芥菜(原变种)、皱叶芥菜、大叶芥菜、黑芥、黑芥(Brassica sinapioides)、黑芥(Melanosinapis communis)[mustard]、甘蓝[fodder beet] 或拟南芥菜;凤梨科如the genera凤梨属(Anana)、Bromelia例如物种凤 梨、Ananas ananas或Bromelia comosa[菠萝];番木瓜科如番木瓜属例如 物种番木瓜[papaya];大麻科(Cannabaceae)如大麻属例如物种大麻 [hemp]、旋花科(Convolvulaceae)如番薯属、旋花属例如物种甘薯、提琴叶 牵牛花、Convolvulus batatas、Convolvulus tiliaceus、甘薯(lpomoea fastigiata)、lpomoea tiliacea、三裂叶薯或Convolvulus panduratus[sweet potato、Man of the Earth、wild potato]、藜科(Chenopodiaceae)如甜菜属 即物种甜菜、甜萝卜、甜菜(原变种)、沿海甜菜、Beta vulgaris var.perennis、 Beta vulgaris var.conditiva或Beta vulgaris var.esculenta[sugar beet];葫 芦科如南瓜属(Cucurbita)例如物种笋瓜、灰籽南瓜(Cucurbita mixta)、西 葫芦或南瓜[pumpkin、squash];胡颓子科(Elaeagnaceae)如胡颓子属例如 物种油橄榄[olive];杜鹃花科如山月桂属(Kalmia)例如物种宽叶山月桂 (Kalmia latifolia)、窄叶山月桂(Kalmia angustifolia)、小叶山月桂(Kalmia microphylla)、沼泽山月桂(Kalmia polifolia)、Kalmia occidentalis、Cistus chamaerhodendros或Kalmia lucida[American laurel、阔叶月桂、calico bush、spoon wood、sheep laurel、alpine laurel、bog laurel、western bog-laurel、swamp-laurel];大戟科如木薯属、Janipha、麻疯树属(Jatropha)、 蓖麻属(Ricinus)例如物种木薯、Janipha manihot、Jatropha manihot、 Manihot aipil、Manihot dulcis、Manihot manihot、Manihot melanobasis、 Manihot esculenta[Manihot、arrowroot、tapioca、cassava]或蓖麻[castor bean、Castor Oil Bush、Castor Oil plant、Palma Christi、Wonder Tree]; 豆科如豌豆属(Pisum)、合欢属(Albizia)、Cathormion、Feuillea、因加属 (Inga)、围涎树属(Pithecolobium)、金合欢属(Acacia)、含羞草属(Mimosa)、 苜蓿属(Medicago)、大豆属(Glycine)、扁豆属(Dolichos)、菜豆属(Phaseolus)、 Soja例如物种豌豆、饲料豌豆、早生矮豌豆[pea]、Albizia berteriana、合 欢(Albizia julibrissin)、大叶合欢(Albizia lebbeck)、Acacia berteriana、 Acacia littoralis、Albizia berteriana、Albizzia berteriana、Cathormion berteriana、Feuillea berteriana、Inga fragrans、Pithecellobium berterianum、Pithecellobium fragrans、Pithecolobium berterianum、 Pseudalbizzia berteriana、Acacia julibrissin、Acacia nemu、Albizia nemu、 Feuilleea julibrissin、Mimosa julibrissin、Mimosa speciosa、Sericanrda julibrissin、Acacia lebbeck、Acacia macrohylla、Albizia lebbek、Feuilleea lebbeck、Mimosa lebbeck、Mimosa speciosa[bastard logwood、silk tree、 East Indian Walnut]、紫花苜蓿、野苜蓿、杂交苜蓿[苜蓿]、大豆、Dolichos soja、宽叶蔓豆、Glycine hispida、Phaseolus max、Soja hispida或Soja max[大豆];牻牛儿苗科如天竺葵属(Pelargonium)、椰子属(Cocos)、Oleum 例如物种椰子、茶簏子天竺葵或Oleum cocois[椰子];禾本科如甘蔗属例 如物种甘蔗(Saccharum officinarum);核桃科(Juglandaceae)如核桃属、 Wallia例如物种核桃(Juglans regia)、Juglans ailanthifolia、山核桃Juglans sieboldiana、灰核桃(Juglans cinerea)、Wallia cinerea、Juglans bixbyi、加 州黑核桃(Juglans californica)、印度黑核桃(Juglans hindsii)、Juglans intermedia、Juglans jamaicensis、大核桃(Juglans major)、Juglans microcarpa、黑核桃(Juglans nigra)或Wallia nigra[胡桃、黑胡桃、common walnut、Persian walnut、白胡桃、灰胡桃、黑胡桃];樟科如鳄梨属、月 桂属例如物种月桂[bay、laurel、bay laurel、sweet bay]、鳄梨、鳄梨(Persea gratissima)或鳄梨(Persea persea)[avocado];豆科如落花生属(Arachis)例如 物种花生[peanut];亚麻科(Linaceae)如亚麻属(Linum)、Adenolinum例如 物种亚麻(linum usitatissimum)、linum humile、奥地利亚麻(linum austriacum)、linum bienne、窄叶亚麻(linum angustifolium)、泻亚麻(linum catharticum)、金黄亚麻(linum flavum)、大花亚麻(linum grandiflorum、 Adenolinum grandiflorum)、刘易斯亚麻(linum lewisii)、那旁亚麻(linum narbonense)、宿根亚麻(linum perenne)、刘易斯宿根亚麻(linum perenne var.lewisii)、linum pratense、linum trigynum[亚麻属、胡麻];Lythrarieae 如石榴属(Punica)例如物种石榴[pomegranate];锦葵科如棉花属 (Gossypium)例如物种陆地棉、树棉、海岛棉、草棉或瑟伯氏棉(Gossypium thurberi)[棉花];芭蕉科(Musaceae)如芭蕉属(Musa)例如物种香蕉、小果野 蕉、大蕉、芭蕉[banana];柳叶菜科(Onagraceae)如Camissonia、月见草 属(Oenothera)例如物种月见草(Oenothera biennis)或Camissonia brevipes[primose、evening primose];棕榈科如油棕属(Elacis)例如物种油 棕榈(Elaeis guineensis)[oil plam];罂粟科如罂粟属(Papaver)例如物种东方 罂粟、虞美人、长果罂粟(Papaver dubium)[poppy、oriental poppy、corn poppy、field poppy、shirley poppies、field poppy、long-headed poppy、 long-pod poppy];胡麻科(Pedaliaceae)如胡麻属例如物种胡麻[sesame];胡 椒科(Piperaceae)如胡椒属(Piper)、Artanthe、草胡椒属(Peperomia)、 Steffensia例如物种树胡椒、Piper amalago、狭叶胡椒、Piper auritum、 萎叶、毕澄茄、荜菝、胡椒、假荜菝、Artanthe adunca、Artanthe elongata、 Peperomia elongata、Piper elongatum、Steffensia elongata[Cayenne pepper、wild pepper];禾本科如大麦属(Hordeum)、黑麦属(Secale)、燕麦 属(Avena)、高粱属(Sorghum)、须芒草属(Andropogon)、绒毛草属(Holcus)、 黍(Panicum)、稻属(Oryza)、玉蜀黍属、小麦属(Triticum)例如物种大麦、 芒颖大麦草、鼠大麦、黑麦状大麦草、栽培二棱大麦、三叉大麦、栽培六 棱大麦、栽培六棱大麦(Hordeum hexastichum)、Hordeum irregulare、大 麦(Hordeum sativum)、黑麦状大麦草[barley、pearl barley、foxtail barley、 wall barley、meadow barley]、黑麦(Secale cereale)[rye]、燕麦、野燕麦、 比赞燕麦、野燕麦(原变种)、杂种野燕麦、双色高粱、石茅高粱(Sorghum halepense)、甜高粱(Sorghum saccharatum)、高粱(Sorghum vulgare)、 Andropogon drummondii、Holcus bicolor、Holcus sorghum、Sorghum aethiopicum、Sorghum arundinaceum、卡佛尔高粱、垂穗高粱草、甜高 粱(Sorghum dochna)、Sorghum drummondii、硬高粱草、Sorghum guineense、Sorghum lanceolatum、多脉高粱草、甜高粱、Sorghum subglabrescens、Sorghum verticilliflorum、高粱、石茅高粱(Holcus halepensis)、黍(Sorghum miliaceum millet)、稷(Panicum militaceum)[Sorghum、millet]、稻、玉米[corn、maize]、普通小麦(Triticum aestivum)、硬粒小麦、圆柱小麦、Triticum hybernum、马卡小麦、普通 小麦(Triticum sativum)或普通小麦(Triticum vulgare)[wheat、bread wheat、common wheat]、山龙眼科(Proteaceae)如澳洲坚果黍(Macadamia) 例如物种澳洲坚果(Macadamia intergrifolia)[macadamia];茜草科如咖啡 属例如物种咖啡(Cofea spp.)、小果咖啡(Coffea arabica)、中果咖啡(Coffea canephora)或大果咖啡(Coffea liberica)[coffee];玄参科如毛蕊花属 (Verbascum)例如物种毛瓣毛蕊花(Verbascum blattaria)、南欧毛蕊花 (Verbascum chaixii)、Verbascum densiflorum、Verbascum lagurus、 Verbascumlongifolium、Verbascum lychnitis、Verbascum nigrum、奥林 匹克毛蕊花(Verbascum olympicum)、Verbascum phlomoides、紫花毛蕊花 (Verbascum phoenicum)、Verbascum pulverulentum或毛蕊花(Verbascum thapsus)[mullein、white moth mullein、nettle-leaved mullein、密花毛蕊花 (dense-flowered mullein)、silver mullein、长叶毛蕊花、white mullein、dark mullein、希腊毛蕊花(greek mullein)、橙色毛蕊花(orange mullein)、紫花 毛蕊花(purple mullein)、hoary mullein、great mullein];茄科如辣椒属、 烟草属(Nicotiana)、茄属(Solanum)、番茄属(Lycopersicon)例如物种辣椒、 Capsicum annuum var.glabriusculum、小米椒[辣椒]、辣椒[红辣椒 (paprika)]、烟草、花烟草(Nicotiana alata)、Nicotiana attenuate、光烟草 (Nicotiana glauca)、Nicotiana langsdorffii、Nicotiana obtusifolia、Nicotiana quadrivalvis、Nicotiana repanda、黄花烟草(Nicotiana rustica)、林烟草 (Nicotiana sylvestris)[烟草]、马铃薯[potato]、茄[egg-plant]、番茄、番茄、 梨形番茄、红茄或番茄[番茄];梧桐科(Ste rculiaceae)如可可属例如物种可 可树[可可];山茶科(Theaceae)如山茶属(Camellia)例如物种茶(Camellia sinensis)[茶]。

在本发明的一个实施方案中,宿主生物是植物,特别是选自单子叶作 物植物,例如禾本科,例如玉米。

在本发明的一个实施方案中,宿主生物是植物,特别是选自以下:

-紫菀科,例如向日葵、万寿菊或金盏花等,

-菊科,特别是莴苣属,更特别是莴苣等,

-十字花科,特别是芸苔属,更特别是欧洲油菜(油菜)、napus var.napus 或rapa ssp.oleifera(芸苔)、juncea(芥菜)、亚麻荠(Camelina sative)(假亚 麻)等,

-葫芦科,例如西瓜、南瓜/西葫芦或胡瓜等,

-豆科,特别是大豆属,更特别是大豆、黄豆和苜蓿、豌豆、豆或花生 等,

以及亚麻子、大豆、棉花或大麻。

此外,用于本发明目的的植物生物还包括有光合成活性的其他生物, 例如藻类、蓝细菌和藓类。优选的藻类是绿藻,例如红球藻科 (Haematococcus)、三褐指藻(Phaedactylum tricornatum)、团藻属(Volvox) 或杜氏藻属(Dunaliella)的藻类。特别优选集胞藻属(Synechocystis)。

更优选油料作物,即已天然具有高含油量和/或可用于油的工业生产的 植物。这些植物可具有高含油量和/或有工业意义的特定脂肪酸组成。优选 的植物是含脂量为至少1%(重量)的植物。油料作物包括如:Bovago oficinalis(琉璃苣);芸苔例如芸苔(B.campestris)、欧洲油菜(B.napus)、芜 青(B.rapa)(芥菜或油菜);Cannabis sativa(大麻);Carthamus tinctorius(红 花);Cocos nucifera(椰子);Crambe abyssinica(crambe);萼距花属 (Cuphea)种(萼距花种获得中等链长的脂肪酸,特别是用于工业应用);油棕 (Elaeis guinensis)(非洲油棕榈);Elaeis oleifera(美洲油棕榈);Glycine max (大豆);Gossypium hirisfum(美洲棉);海岛棉(Gossypium barbadense)(埃及 棉);草棉(Gossypium herbaceum)(亚洲棉);Helianthus annuus(向日葵); Linum usitatissimum(亚麻子或亚麻);Oenothera biennis(月见草);油橄榄 (Olea europaea)(橄榄);Oryza sativa(稻);Ricinus communis(蓖麻); Sesamum indicum(芝麻);Glycine max(大豆);小麦属(Triticum)物种(小 麦);Zea mays(玉米)以及多种其他物种,例如胡桃或杏。

原则上,可通过本领域技术人员已知的所有方法向生物(如植物)中引 入本发明的核酸、表达盒或载体。核酸序列的引入产生了重组生物或转基 因生物。

除非另外指明,否则术语“多核苷酸”、“核酸”和“核酸分子”在本文中 可互换使用。除非另外指明,否则术语“肽”、“多肽”和“蛋白质”在本文中 可互换使用。术语“序列”可涉及多核苷酸、核酸、核酸分子、肽、多肽和 蛋白质,这取决于使用术语“序列”的上下文。本文使用的术语“基因”、“多 核苷酸”、“核酸序列”、“核苷酸序列”或“核酸分子”指任何长度的核苷酸(核 糖核苷酸或脱氧核糖核苷酸)的聚合形式。该术语仅涉及分子的一级结构。

因此,本文使用的术语“基因”、“多核苷酸”、“核酸序列”、“核苷酸序 列”或“核酸分子”包括双链和单链的DNA和RNA。它们还包括已知类型的 修饰,例如甲基化、“加帽”、将一个或多个天然核苷酸替换为类似物。优 选地,本发明的DNA或RNA序列包含编码本文所述多肽的编码序列。

编码选自磷酸核糖焦磷酸合酶的活性的本发明基因也称为“PRS基 因”。

“编码序列”是核苷酸序列,其在置于适当调节序列控制之下时转录成 mRNA和/或翻译成多肽。编码序列的边界由5’端的翻译起始密码子和3’ 端的翻译终止密码子决定。编码序列可包括但不仅限于mRNA、cDNA、 重组核苷酸序列或基因组DNA,在某些情况下也可存在内含子。

将外源基因转移进植物基因组中称为转化。为此,使用就转化植物组 织或植物细胞并再生植物方面描述的方法进行瞬时或稳定转化。合适的方 法是通过聚乙二醇诱导的DNA摄取进行的原生质体转化、使用基因枪进 行的“生物射弹”法(称为微粒轰击法)电穿孔、干胚在DNA溶液中温育、显 微注射和农杆菌介导的基因转移。所述方法描述于例如Jenes B.等, Techniques for Gene Transfer,Transgenic Plants,第一卷,Engineering and Utilization,Kung S.D和Wu R.编辑,Academic Press(1993)128-143以 及Potrykus,Annu.Rev.Plant Physiol.Plant Molec.Biol.42,205(1991)。优 选将待表达的核酸或构建体克隆进适用于转化根癌农杆菌的载体(例如 pBin19)中(Bevan等,Nucl.Acids Res.12,8711(1984))。转化有这些载体的 农杆菌接着可以已知方式用于转化植物,特别是作物植物,例如烟草植物, 例如通过将擦伤或剪断的叶浸泡在农杆菌溶液中,接着在合适的培养基中 培养它们。通过根癌农杆菌进行的植物转化描述于例如和 Willmitzer Nucl.Acid Res.16,9877(1988),或者可从White F.F.,Vectors for Gene Transfer in Higher Plants;in Transgenic Plants,Vol.1, Engineering and Utilization,Kung S.D.和Wu R.编辑,Academic Press, 1993,15-38页等中获知。

通过本发明表达载体转化的农杆菌可类似地以已知方式(例如将擦伤 或剪断的叶浸泡在农杆菌溶液中,接着在合适的培养基中培养它们)用于转 化植物,例如实验植物如拟南芥,或者作物植物如谷类作物、玉米、燕麦、 黑麦、大麦、小麦、大豆、稻、棉花、甜菜、芸苔、向日葵、亚麻、大麻、 马铃薯、烟草、番茄、胡萝卜、红辣椒、油菜、树薯、木薯、竹芋、万寿 菊、苜蓿、莴苣和多种树木、坚果和藤本物种,特别是含油作物植物,例 如大豆、花生、蓖麻植物、向日葵、玉米、棉花、亚麻、油菜、椰子、油 棕榈、红花(Carthamus tinctorius)或可可豆,或者特别是玉米、小麦、大 豆、稻、棉花和芸苔。

可以通过本领域技术人员已知的所有方法产生经遗传修饰的植物细 胞。合适的方法可见于上文提到的Kung S.D.和Wu R.,Potrykus或者 和Willmitzer的出版物。

因此,本发明的另一方面涉及以至少一种本发明的核酸序列、表达盒 或载体转化的转基因生物,以及来自这些生物的细胞、细胞培养物、组织、 部分(例如对于植物生物的情况为叶、根等)或繁殖材料。术语“宿主生物”、 “宿主细胞”、“重组(宿主)生物”和“转基因(宿主)细胞”可互换使用。当然, 这些术语不仅涉及特定的宿主生物或具体的靶细胞,而且还涉及这些生物 或细胞的后代或潜在后代。由于突变或环境效应,可以在后续世代中产生 某些改变,因此这些后代不一定与亲本细胞相同,但仍包括在本文使用的 该术语中。

就本发明目的而言,“转基因”或“重组”指例如含有本发明核酸序列的 核酸序列、表达盒(=基因构建体、核酸构建体)或载体,或者以本发明核酸 序列、表达盒或载体转化的生物,所有通过遗传工程方法产生的构建体, 其中

(a)选自SEQ ID NO:1,3,12,38,39,40,41,42,43,44,45,46,47,48,49, 50的核酸序列或其衍生物或部分;或

(b)与(a)所述核酸序列有效连接的遗传控制序列,例如3’和/或5’遗传 控制序列,例如启动子或终止子,和

(c)(a)和(b)

不在其天然遗传环境中,或者已通过重组方法进行了修饰,所述修饰 可以是例如替换、添加、缺失、倒位或插入一个或多个核苷酸残基。天然 遗传环境指来源生物或宿主生物中的天然基因组或染色体基因座或者在基 因组文库中存在。对于基因组文库的情况,核酸序列的天然遗传环境优选 至少在一定程度上保留。该环境在核酸序列的至少一侧,并且序列长度为 至少50bp,优选至少500bp,更优选至少1000bp,最优选至少5000bp。 天然表达盒(例如本发明核酸序列的天然启动子与相应基因的天然组合)在 所述基因经非天然合成(“人工”)方法(例如诱变)修饰时成为转基因表达盒。 已经描述了这样的方法,例如US 5,565,350或WO 00/15815;。

用于本发明核酸、表达盒或载体的合适的生物或宿主生物有利地为基 本上所有适于表达上述重组基因的生物。可以提到的其他实例为植物,例 如拟南芥,紫菀科例如金盏花,或者作物植物如大豆、花生、蓖麻油植物、 向日葵、亚麻、玉米、棉花、亚麻、油菜、椰子、油棕榈、红花(Carthamus tinctorius)或可可豆。

在本发明的一个实施方案中,用于本发明核酸、表达盒或载体的宿主 植物选自玉米、大豆、油菜(包括芸苔和冬季油菜)、棉花、小麦和稻。

本发明的另一目的涉及核酸构建体(例如表达盒)用于转化植物细胞、 组织或植物部分的用途,所述核酸构建体含有编码选自SEQ ID NO:2、4、 13、51、52、53、54、55、56、57、58、59、60、61、62、63的多肽的 DNA序列或者与其杂交的DNA序列。

为此,取决于启动子的选择,可以在叶、种子、根瘤、根、茎或其他 植物部分中特异性表达表I所示序列。这些过量产生表I所示序列的转基 因植物、其繁殖材料及其植物细胞、组织或部分是本发明的另一目的。

此外,含有本发明序列的本发明表达盒或核酸序列或构建体还可用于 转化例如上文提到的生物,例如细菌、酵母、丝状真菌和植物。

在本发明的框架内,增强的产量表示例如在至少一代植物的时间内与 未遗传修饰的起始植物相比,在本发明生物(有利的为本发明的转基因植物) 中由于功能性过表达由选自SEQ ID NO:1、3、12、38、39、40、41、42、 43、44、45、46、47、48、49、50的核酸分子和/或同源物编码的表II多 肽序列而人工获得了产量增强的性状。

此外,组成型表达由选自SEQ ID NO:1、3、12、38、39、40、41、 42、43、44、45、46、47、48、49、50的核酸分子和/或同源物编码的表 II多肽序列是有利的。然而,另一方面,也可能期望诱导型表达。本发明 多肽序列的表达可导向宿主细胞(优选植物细胞)的胞质或细胞器,优选质 体。

可通过如嫩枝分生组织繁殖来测定由选自SEQ ID NO:1、3、12、38、 39、40、41、42、43、44、45、46、47、48、49、50的核酸分子和/或同源 物编码的表II序列的表达效率。此外,可在温室试验中对测试植物测试在 性质和水平上发生了改变的由选自SEQ ID NO:1、3、12、38、39、40、 41、42、43、44、45、46、47、48、49、50的核酸分子和/或同源物编码的 表II序列的表达及其对代谢途径性能的影响。

本发明的另一目的包括转化有包含选自本发明SEQ ID NO:1、3、12、 38、39、40、41、42、43、44、45、46、47、48、49、50之序列或与其杂 交之DNA序列的表达盒的转基因生物,例如转基因植物,以及这些植物 的转基因细胞、组织、部分和繁殖材料。这种情况下特别优选转基因作物 植物,例如大麦、小麦、黑麦、燕麦、玉米、大豆、稻、棉花、甜菜、油 菜和芸苔、向日葵、亚麻、大麻、大蓟、马铃薯、烟草、番茄、树薯、木 薯、竹芋、苜蓿、莴苣以及多种树木、坚果和藤本物种。

在本发明的一个实施方案中,转化有包含选自本发明SEQ ID NO:1、 3、12、38、39、40、41、42、43、44、45、46、47、48、49、50之序列 或与其杂交之DNA序列的表达盒的转基因植物选自玉米、大豆、油菜(包 括芸苔和冬季油菜)、棉花、小麦和稻。

就本发明而言,植物是单子叶植物和双子叶植物、藓类或藻类,特别 是植物,优选是单子叶植物,或者优选是双子叶植物。

本发明的另一对象是如上述的转基因植物,其含有本发明的核酸序列 或构建体或者本发明的表达盒。

然而,转基因也指本发明的核酸位于其在生物基因组中的天然位置, 但该序列与天然序列相比进行了修饰和/或天然序列的调节序列已被修饰。 优选地,转基因/重组应理解为指本发明核酸的转录存在于基因组中非天然 位置,即,该核酸的表达是同源的,或者优选是异源的。这种表达可以是 瞬时的,或者是稳定整合进基因组的序列的表达。

本发明使用的术语“转基因植物”还指转基因植物的后代,例如T1、T2、 T3、T4和后续的植物世代或者BC1、BC2、BC3和后续的植物世代。因此, 可以产生本发明的转基因植物,并且自交或者与其他个体杂交,以获得其 他本发明的转基因植物。还可通过无性繁殖转基因植物细胞来获得转基因 植物。本发明还涉及来自于本发明转基因植物群的转基因植物材料。这些 材料包括植物细胞和某些组织、器官和植物部分的所有表现形式,例如种 子、叶、花药、纤维、块茎、根、根毛、茎、胚、愈伤组织、子叶、叶柄、 收获材料、植物组织、繁殖组织和细胞培养物,它们来自于实际的转基因 植物和/或可用于产生转基因植物。

根据本发明获得的任何转化植物可用于常规育种方案或体外植物繁 殖,以产生更多具有相同特征的转化植物和/或可用于将同一特征引入相同 或相关物种的其他变种中。这些植物也可以是本发明的一部分。得自转化 植物的种子一般也含有相同的特征,并且也是本发明的一部分。如上文所 述,本发明基本上可用于可以本领域技术人员已知的任何转化方法进行转 化的任何植物和作物。

有利的诱导型植物启动子为例如PRP1启动子(Ward等,Plant.Mol. Biol.22361(1993))、苯磺酰胺诱导型启动子(EP 0388186)、四环素诱导型 启动子(Gatz等,Plant J.2,397(1992))、水杨酸诱导型启动子(WO 95/19443)、脱落酸诱导型启动子(EP 335528)或乙醇或环己酮诱导型启动子 (WO 93/21334)。可以有利地使用的植物启动子的其他实例为来自马铃薯的 胞质FBPas启动子、来自马铃薯的ST-LSI启动子(Stockhaus等,EMBO J. 8,2445(1989))、来自大豆的磷酸核糖焦磷酸转酰胺酶启动子(还参阅gene bank登记号U87999)或)EP 249676所述的nodiene特异性启动子。特别 优选的是确保在低温条件开始(例如开始冷冻和/或冰冻温度,如上述)时表 达的启动子。

在一个实施方案中,可以对单子叶植物或双子叶植物使用种子特异性 启动子。

原则上,所有带有其调节序列的天然启动子均可使用,例如上文针对 本发明表达盒和本发明方法所描述的那些。除此以外,还可以有利地使用 合成启动子。

在表达盒的制备中,可以操作多种DNA片段以获得核苷酸序列,其 有用地以正确方向阅读并带有正确的读码框。为了将DNA片段(=本发明核 酸)彼此连接,可在片段上附着衔接头或接头。

启动子和终止子区可以有用地在转录方向上带有接头或多聚接头,其 包含用于插入此序列中的一个或多个限制性位点。接头一般含有1至10 个、常为1至8个、优选2至6个限制酶位点。一般而言,调节区中的接 头的大小小于100bp,经常小于60bp,但至少为5bp。启动子可以与宿 主生物(例如宿主植物)是天然或同源的,是外源或异源的也可。在5’-3’转 录方向上,表达盒含有启动子、表I所示DNA序列以及用于终止转录的区 域。不同的终止区可以任何期望的方式彼此交换。

本文使用的术语“核酸”和“核酸分子”旨在包括DNA分子(如cDNA或 基因组DNA)和RNA分子(如mRNA)以及使用核苷酸类似物产生的DNA 或RNA类似物。该术语还包括位于基因编码区3’和5’末端的非翻译序 列——基因编码区5’末端上游至少约1000个核苷酸的序列以及编码区3’ 末端下游至少约200个核苷酸的序列。核酸分子可以是单链的或双链的, 但优选双链DNA。

“分离的”核酸分子是与该核酸天然来源中存在的其他核酸分子基本分 开的核酸分子。这意味着,所存在的其他核酸分子为所需核酸重量的少于 5%,优选少于2%重量,更优选少于1%重量,最优选少于0.5%重量。优 选地,“分离的”核酸不含该核酸来源生物的基因组DNA中天然位于该核 酸侧翼的一些序列(即位于该核酸5’和5’末端的序列)。例如,在多个实施 方案中,分离的低温抗性和/或耐性相关蛋白的编码核酸分子可含有该核酸 来源细胞的基因组DNA中天然位于该核酸分子侧翼的少于约5kb、4kb、 3kb、2kb、1kb、0.5kb或0.1kb核苷酸序列。此外,“分离的”核酸分子 (例如cDNA分子)可不含与其天然相关的其他细胞材料,或者在通过重组 技术产生的情况下不含培养基,或者在化学合成的情况下不含化学前体或 其他化学物质。

可以使用标准分子生物学技术和本文提供的序列信息来分离本发明的 核酸分子,例如编码在植物中赋予产量提高的PRS或其部分的核酸分子。 例如,可以使用表I所示序列之一的全部或部分,从拟南芥cDNA文库中 分离拟南芥PRS的编码cDNA,或者从集胞藻、欧洲油菜、大豆、玉米或 水稻的cDNA文库中分别分离集胞藻、欧洲油菜、大豆、玉米或水稻的PRS 编码cDNA。此外,可以使用基于表I序列设计的寡核苷酸引物,通过聚 合酶链式反应分离包含表I序列的全部或部分的核酸分子。例如,可以从 植物细胞中分离mRNA(例如通过Chirgwin等,Biochemistry 18,5294 (1979)的硫氰酸胍提取法),并可使用逆转录酶(例如Moloney MLV逆转录 酶,可得自Gibco/BRL,Bethesda,MD;或者AMV逆转录酶,可得自 Seikagaku America,Inc.,St.Petersburg,FL)制备cDNA。可以基于表I所 示核苷酸序列之一设计用于聚合酶链式反应扩增的合成的寡核苷酸引物。 可以使用cDNA或基因组DNA作为模板,并使用适当的寡核苷酸引物根 据标准PCR扩增技术来扩增本发明的核酸分子。这样扩增的核酸分子可克 隆进适当的载体中,并通过DNA序列分析进行表征。此外,可以通过标 准合成技术(如使用自动化DNA合成仪)来制备对应于PRS编码核苷酸序 列的寡核苷酸。

在一个优选的实施方案中,本发明的分离的核酸分子包含编码PRS的 表I所示核苷酸序列之一(即“编码区”)以及5’非翻译序列和3’非翻译序列。

此外,本发明的核酸分子可仅包含表I核酸序列之一的编码区的一部 分,例如可用作探针或引物的片段或者编码PRS的生物活性部分的片段。

本发明的PRS编码核酸分子所编码的蛋白质的部分优选为本文所述 的生物活性部分。本文使用的术语PRS的“生物活性部分”旨在包括参与植 物中NUE效率增强和/或产量提高的低温抗性和/或耐性相关蛋白的部分 (例如结构域/基序)。为了确定PRS或其生物活性部分是否在植物中导致 NUE效率增强和/或产量提高,可对包含该PRS的植物进行分析。这些分 析方法为本领域技术人员所熟知,并详细描述于实施例中。更具体地,可 以如下制备编码PRS之生物活性部分的核酸片段:分离表I核酸序列之一 的一部分,表达所编码的PRS或肽的部分(例如通过体外重组表达),以及 评估所编码的PRS或肽的部分的活性。

PRS的生物活性部分包括在本发明之中,并包括含有来自PRS编码基 因之氨基酸序列的氨基酸序列或者与PRS同源之蛋白质的氨基酸序列的 肽,其包含比全长PRS或与PRS同源的全长蛋白更少的氨基酸,并显示 PRS的至少某种酶活性或生物活性。一般地,生物活性部分(例如长度为 5,10,15,20,30,35,36,37,38,39,40,50,100或更多个氨基酸的肽)包含具 有至少一种PRS活性的结构域或基序。此外,可以通过重组技术制备缺失 了该蛋白质中另一些部分的其他生物活性部分,并评估本文所述的一种或 多种活性。优选地,PRS的生物活性部分包括其具有生物活性的一种或多 种选定的结构域/基序或其部分。

术语“生物活性部分”或“生物活性”指表II第3列所示多肽,或者所述 多肽中仍具有该天然或起始酶或蛋白之酶活性或生物活性的至少10%或 20%,优选30%、40%、50%或60%,特别优选70%、75%、80%、90 %或95%的部分。

在本发明的方法中,可以使用适当时含有可掺入DNA或RNA中的合 成、非天然或修饰核苷酸碱基的核酸序列。例如,所述合成、非天然或修 饰碱基可提高该核酸分子在细胞外或细胞内的稳定性。本发明的核酸分子 可含有与上述相同的修饰。

本文使用的术语“核酸分子”还可包含位于基因编码区3’和5’末端的非 翻译序列,例如编码区5’末端上游至少500个、优选200个、特别优选100 个核苷酸的序列,以及基因编码区3’下游至少100个、优选50个、特别优 选20个核苷酸的序列。仅选择编码区用于克隆和表达目的经常是有利的。

优选地,用于本发明方法的核酸分子或本发明的核酸分子是分离的核 酸分子。

“分离的”多核苷酸或核酸分子与该核酸分子天然来源中所存在的其他 多核苷酸或核酸分子分开。分离的核酸分子可以是若干kb的染色体片段, 或者优选是仅包含基因编码区的分子。因此,本发明的分离的核酸分子可 包含5’和3’的相邻染色体区或其他相邻染色体区,但优选不包含该核酸来 源生物的基因组或染色体环境中天然位于该核酸分子序列侧翼的这些序列 (例如编码该核酸分子5’和3’UTR的区域附近的序列)。例如,在多个实施 方案中,用于本发明方法的分离的核酸分子可以包含该核酸分子来源细胞 的基因组DNA中天然位于该核酸分子侧翼的少于约5kb、4kb、3kb、2kb、 1kb、0.5kb或0.1kb的核苷酸序列。

用于本方法的核酸分子(例如本发明的多核苷酸或其部分)可使用分子 生物学标准技术和本文提供的序列信息来分离。还可以例如借助于比较算 法来鉴定在DNA或氨基酸水平上的同源序列或同源保守序列区。前者可 在标准杂交技术中用作杂交探针(例如Sambrook等,Molecular Cloning:A Laboratory Manual.第二版,Cold Spring Harbor Laboratory,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY,1989所述),用 于分离可用于该方法的其他核酸序列。

还可以通过聚合酶链式反应分离包含本方法所用核酸分子(例如本发 明的多核苷酸)的完整序列或其部分的核酸分子,其中使用基于该序列或其 部分的寡核苷酸引物。例如,可以使用基于该特定序列产生的寡核苷酸引 物,通过聚合酶链式反应分离包含完整序列或其部分的核酸分子。例如, 可以从细胞中分离mRNA(例如通过Chirgwin等,Biochemistry 18, 5294(1979)所述的硫氰酸胍提取法),并可通过逆转录酶(例如Moloney MLV逆转录酶,可得自Gibco/BRL,Bethesda,MD,或者AMV逆转录酶, 可得自Seikagaku America,Inc.,St.Petersburg,FL)产生cDNA。

用于通过聚合酶链式反应进行扩增的合成寡核苷酸引物(例如选自 SEQ ID NO:5、6)可基于本文所示序列产生,例如基于选自SEQ ID NO:1、 3、12、38、39、40、41、42、43、44、45、46、47、48、49、50的序列 或者衍生自选自SEQ ID NO:2、4、13、51、52、53、54、55、56、57、 58、59、60、61、62、63之序列的序列。

此外,可以通过与本发明核酸分子所编码多肽(特别是与选自SEQ ID NO:1、3、12、38、39、40、41、42、43、44、45、46、47、48、49、50 的本发明核酸分子所编码的序列)进行蛋白质序列比对来鉴定保守蛋白,由 此可以产生保守区并进而产生简并引物。

保守区是在来自不同来源的若干同源物中一个特定位置上的氨基酸极 少显示变异的区域。共有的序列和多肽基序来自于所述比对。此外,可以 通过与本发明核酸分子所编码的多肽(特别是与选自SEQ ID NO:2、4、13、 51、52、53、54、55、56、57、58、59、60、61、62、63的多肽分子所编 码的序列)进行蛋白质序列比对来从多种生物中鉴定保守区,由此可以产生 保守区并进而产生简并引物。

在一个有利的实施方案中,在本发明方法中提高了多肽的活性,所述 多肽包含选自SEQ ID No.64,65,66,67,68,69,70,71,72,73的共有序列或 多肽基序或者由其组成,在另一实施方案中,本发明涉及多肽,其包含共 有序列或多肽基序或者由其组成,或者包含选自SEQ ID No.64,65,66,67, 68,69,70,71,72,73之基序的多肽,其中所标明氨基酸位置中少于20个, 优选少于15或10个,优选少于9、8、7或6个,更优选少于5或4个, 甚至更优选少于3个,甚至更优选少于2个,甚至更优选0个可被任何氨 基酸替换。在一个实施方案中,以字母标出的氨基酸位置中的不超过15%, 优选10%,甚至更优选5%、4%、3%或2%,最优选1%或0%被另一氨 基酸替换。在一个实施方案中,共有序列或蛋白质基序中插入了少于20 个氨基酸,优选少于15或10个,优选少于9、8、7或6个,更优选少于 5或4个,甚至更优选少于3个,甚至更优选少于2个,甚至更优选0个 氨基酸。

共有序列来自于SEQ ID NO:51至63所列序列的多重比对。

保守性图谱使用软件工具MEME3.5.1版鉴定,或者人工鉴定。MEME 由美国加利福尼亚大学圣地亚哥分校计算机科学与工程学院的Timothy L. Bailey和Charles Elkan开发,并由Timothy L.Bailey和Charles Elkan描 述(Fitting a mixture model by expectation maximization to discover motifs in biopolymers,Proceedings of the Second International Conference on Intelligent Systems for Molecular Biology,28-36页,AAAI Press,Menlo Park,California,1994)。公众可在圣地亚哥超级计算机中心 (http://meme.sdsc.edu)获得该独立程序的源代码。

为了使用软件工具MEME鉴定所有序列中的共有基序,使用以下设 置:-maxsize 500000,-nmotifs 15,-evt 0.001,-maxw 60,-distance 1e-3, -minsites分析中所用的序列数。MEME的输入序列是Fasta格式的非比 对序列。其他参数可以本版软件中的默认设置使用。

保守性结构域的Prosite图谱使用软件工具Pratt 2.1版产生,或者人 工产生。Pratt由挪威Bergen大学信息学院的Inge Jonassen开发,并由 Jonassen等描述(I.Jonassen,J.F.Collins和D.G.Higgins,Finding flexible patterns in unaligned protein sequences,Protein Science 4(1995), 1587-1595页;I.Jonassen,Efficient discovery of conserved patterns using a pattern graph,Submitted to CABIOS Febr.1997]。该独立程序的源代码 (ANSI C)是公众可获得的,例如在已建立的生物信息学中心如EBI(欧洲生 物信息学研究所)。

为了使用软件工具Pratt产生图谱,使用以下设置:PL(最大Pattern 长度):100,PN(最大图谱标记数):100,PX(最大连续x数):30,FN(最大 柔性间隔区数):5,FL(最高柔性):30,FP(最高柔性产物):10,ON(最大图 谱数):50。Pratt的输入序列是由软件工具MEME鉴定的显示高度相似性 的蛋白质序列的不同区域。必须与所产生图谱匹配的最小序列数(CM,最 小匹配序列数)设置为所提供序列的至少80%。此处未提及的参数以其默认 设置使用。

可以使用保守性结构域的Prosite图谱来检索与该图谱匹配的蛋白质 序列。多个已建立的生物信息学中心提供在数据库检索中使用这些图谱的 公众互联网入口(例如PIR(Protein Information Resource,位于乔治城大 学医学中心)或ExPASy(Expert Protein Analysis System))。或者,有独立 软件可以使用,如Fuzzpro程序,它是EMBOSS软件包的一部分。例如, Fuzzpro程序不仅允许检索准确的图谱-蛋白质匹配,还允许在所进行的检 索中设置多种模糊度。

比对使用ClustalW软件(1.83版)进行,并描述于Thompson等 (Nucleic Acids Research 22,4673(1994))。公众可从德国海德堡的欧洲分子 生物学实验室获得该独立程序的源代码。使用ClustalW v1.83的默认参数 进行分析(缺口罚分:10.0;缺口延伸罚分:0.2;蛋白质矩阵:Gonnet;蛋 白质/DNA endgap:-1;蛋白质/DNA gapdist:4)。

接着可以使用简并引物通过PCR扩增新的蛋白质的片段,所述蛋白质 具有上述活性,例如在提高表达或活性后与相应的未转化野生型植物细胞、 植物或其部分相比赋予提高的产量,或者具有选自SEQ ID NO:2、4、13、 51、52、53、54、55、56、57、58、59、60、61、62、63之蛋白质或来自 其他生物的其他本发明多肽功能同源物的活性。

接着,这些片段可作为杂交探针用于分离完整基因序列。或者,可以 通过RACE-PCR分离缺少的5’和3’序列。可以使用cDNA或基因组DNA 作为模板,使用合适的引物,按照标准PCR扩增技术来扩增本发明的核酸 分子。这样扩增的核酸分子可克隆进合适的载体中,并通过DNA序列分 析进行表征。可以通过标准合成法(例如使用自动化DNA合成仪)产生对应 于本方法所用核酸分子之一的寡核苷酸。

有利地用于本发明方法的核酸分子可基于其与本文所述核酸分子的同 源性来分离,其中使用该序列或其部分作为探针,并遵循标准杂交技术在 严格杂交条件下进行。在这种情况下,可以使用例如在严格条件下与上述 核酸分子杂交(特别是与这样的核酸分子杂交:其包含本发明方法所用核酸 分子的核苷酸序列,或者编码本发明所用蛋白质的核苷酸序列,或者本发 明核酸分子的核苷酸序列)的长度为至少15、20、25、30、35、40、50、60 或更多个核苷酸(优选至少15、20或25个核苷酸)的分离的核酸分子。还 可以使用含有30、50、100、250或更多个核苷酸的核酸分子。

术语“同源性”指各个核酸分子或所编码的蛋白质在功能和/或结构上 是等同的。例如,与上述核酸分子同源或者作为所述核酸分子之衍生物的 核酸分子是所述核酸分子的变异,其中代表具有相同生物功能(特别是编码 具有相同或基本相同的生物功能的蛋白质)的修饰。它们可以是天然的变 异,例如来自其他植物变种或物种的序列,或者是突变。这些突变可天然 发生,或者可通过诱变技术获得。等位基因变异可以天然的等位基因变异 以及合成产生的或遗传工程产生的变体。例如,结构等同物可通过测试所 述多肽与抗体的结合或者通过基于计算机的预测来鉴定。结构等同物具有 相似的免疫学特征,例如包含相似的表位。

“杂交”指这些核酸分子在常规杂交条件下杂交,优选在严格条件下杂 交,如Sambrook(Molecular Cloning;A Laboratory Manual,第二版,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY(1989))或 Current Protocols in Molecular Biology,John Wiley&Sons,N.Y.(1989), 6.3.1-6.3.6所述。

根据本发明,可使用本发明核酸的DNA和RNA分子作为探针。此外, 作为用于鉴定功能同源物的模板,可以进行Northern印迹测定和Southern 印迹测定。Northern印迹测定有利地提供了关于所表达基因产物的进一步 信息:例如表达谱、加工步骤(如剪接和加帽)的存在情况等。Southern印 迹测定提供了关于编码本发明核酸分子之基因染色体定位和组织的进一步 信息。

严格杂交条件的一个优选的非限制性实例为在约45℃下在6×氯化钠/ 柠檬酸钠(=SSC)中杂交,然后在50至65℃(例如50℃、55℃或60℃)下在 0.2×SSC、0.1%SDS中进行一次或多次洗涤步骤。本领域技术人员了解, 这些杂交条件作为核酸类型的函数而变化,并且例如在存在有机溶剂时随 温度和缓冲液浓度而变化。例如,“标准杂交条件”下的温度作为核酸类型 的函数在0.1×、0.5×、1×、2×、3×、4或5×SSC(pH 7.2)浓度的水性缓冲 液中可为42℃至58℃不等,优选45℃和50℃。如果上述缓冲液中存在有 机溶剂,例如50%甲酰胺,则标准条件下的温度约为40℃、42℃或45℃。 DNA:DNA杂交分子的杂交条件优选为0.1×SSC和20℃、25℃、30℃、35℃、 40℃或45℃,优选30℃至45℃。DNA:RNA杂交分子的杂交条件优选为 例如0.1xSSC和30℃、35℃、40℃、45℃、50℃或55℃,优选45℃到55℃。 上述杂交温度是在例如不存在甲酰胺的情况下对长度约100bp(=碱基对) 且G+C含量为50%的核酸确定的。本领域技术人员了解借助于教科书来 确定杂交条件,所述教科书为例如上文提到的那些,或者以下教科书: Sambrook等,”Molecular Cloning”,Cold Spring Harbor Laboratory,1989; Hames和Higgins编辑1985,”Nucleic Acids Hybridization:A Practical Approach”,IRL Press at Oxford University Press,Oxford;Brown编辑 1991,”Essential Molecular Biology:A Practical Approach”,IRL Press at Oxford University Press,Oxford。

一个这种严格杂交条件的另一实例是在65℃下在4×SSC中杂交,其 后在65℃下以0.1×SSC洗涤1小时。或者,一个示例性严格杂交条件为 50%甲酰胺、4×SSC,42℃。此外,洗涤步骤过程中的条件可以在划分为 低严格条件(约2×SSC,50℃)至高严格条件(约0.2×SSC,50℃,优选65℃) 的范围内选择(20×SSC:0.3M柠檬酸钠、3M NaCl,pH 7.0)。此外,洗 涤步骤过程中的温度可从室温(约22℃)下的低严格条件提高至约65℃的高 严格条件。盐浓度和温度这两个参数可同时改变,或者可将这两个参数之 一保持恒定而改变另一个。杂交过程中还可以使用变性剂,例如甲酰胺或 SDS。在50%甲酰胺存在下,杂交优选在42℃下进行。可在各个情况下组 合相关的因素例如1)处理的长度、2)盐条件、3)洗涤剂条件、4)竞争DNA、 5)温度和6)探针的选择,因此本文无法提及所有的可能性。

因此,在一个优选的实施方案中,在68℃下将Northern印迹在 Rothi-Hybri-Quick缓冲液(Roth,Karlsruhe)中预杂交2小时。与放射性标 记探针的杂交在68℃进行过夜。其后在68℃下用1×SSC进行洗涤步骤。

对于Southern印迹测定,在68℃下将膜在Rothi-Hybri-Quick缓冲液 (Roth,Karlsruhe)中预杂交2小时。与放射性标记探针的杂交在68℃进行 过夜。其后弃去杂交缓冲液,并用2×SSC、0.1%SDS短暂地洗涤滤器。弃 去洗涤缓冲液后,加入新的2×SSC、0.1%SDS缓冲液并在68℃下孵育15 分钟。将该洗涤步骤进行两次,其后在68℃下使用1×SSC、0.1%SDS进 行10分钟的额外洗涤步骤。

用于DNA杂交(Southern印迹测定)和洗涤步骤的一些条件实例在下 文给出:

(1)杂交条件可选自例如以下条件:

(a)4×SSC,65℃,

(b)6×SSC,45℃,

(c)6×SSC,100mg/ml变性的片段化鱼精DNA,68℃,

(d)6×SSC,0.5%SDS,100mg/ml变性的鲑精DNA,68℃,

(e)6×SSC,0.5%SDS,100mg/ml变性的片段化鲑精DNA,50%甲酰 胺,42℃,

(f)50%甲酰胺,4×SSC,42℃,

(g)50%(v/v)甲酰胺,0.1%牛血清白蛋白,0.1%Ficoll,0.1%聚乙烯 吡咯烷酮,50mM磷酸钠缓冲液pH 6.5,750mM NaCl,75mM柠檬酸钠, 42℃,

(h)2×或4×SSC,50℃(低严格条件),或

(i)30到40%甲酰胺,2×或4×SSC,42℃(低严格条件)。

(2)洗涤步骤可选自例如以下条件:

(a)0.015M NaCl/0.0015M柠檬酸钠/0.1%SDS,50℃。

(b)0.1×SSC,65℃。

(c)0.1×SSC,0.5%SDS,68℃。

(d)0.1×SSC,0.5%SDS,50%甲酰胺,42℃。

(e)0.2×SSC,0.1%SDS,42℃。

(f)2×SSC,65℃(低严格条件)。

来自其他生物的具有上述活性(即,赋予与相应的未转化野生型植物细 胞、植物或其部分相比提高的产量)的多肽可由其他DNA序列编码,所述 DNA序列在宽松的杂交条件下与选自SEQ ID NO:1、3、12、38、39、40、 41、42、43、44、45、46、47、48、49、50的序列杂交,并且在表达时编 码赋予与相应的未转化野生型植物细胞、植物或其部分相比增强的低温耐 性和/提高产量的肽。

此外,一些应用必须在低严格杂交条件下进行,而对杂交特异性无任 何影响。例如,可以用本发明核酸分子检测总DNA的Southern印迹分析, 并低严格洗涤(55℃下,2×SSPE、0.1%SDS)。杂交分析可显示出仅编码本 发明多肽或本发明方法所用多肽(即具有与相应未转化野生型植物细胞、植 物或其部分相比提高产量的上述活性)的基因的简单图谱。这些低严格杂交 条件的另一实例是4×SSC,50℃,或者在42℃下用30至40%甲酰胺进行 杂交。这些分子包括这样的分子:其为本发明多肽或本发明方法所用多肽 的片段、类似物或衍生物,其差异为氨基酸和/或核苷酸的缺失、插入、替 换、添加和/或重组或者本领域技术人员已知的单独或组合地对上述氨基酸 序列或其内在核苷酸序列的任何其他修饰。然而,优选使用高严格杂交条 件。

杂交应有利地以至少5、10、15、20、25、30、35或40bp的片段进 行,有利地为至少50、60、70或80bp,优选至少90、100或110bp。最 优选至少15、20、25或30bp的片段。还优选至少100bp或200bp、更 特别优选至少400bp长度的杂交。在一个特别优选的实施方案中,杂交应 以上述条件用整个核酸序列进行。

术语“片段”、“序列片段”或“序列部分”表示所指代原始序列的截短序 列。截短序列(核酸或蛋白质序列)的长度可广泛变化,最小尺寸是这样的 序列,其大小足以为序列提供与所指代原始序列至少相当的功能和/或活 性,或者在严格杂交条件下与本发明核酸分子或本发明方法所用核酸分子 杂交,而最大尺寸则不是关键性的。在一些应用中,最大尺寸一般不显著 大于提供原始序列的期望活性和/或功能所需的大小。

截短的氨基酸序列的长度一般为约5至约310个氨基酸。然而,更一 般地,序列长度最高将约为250个氨基酸,优选最高约200或100个氨基 酸。经常期望选择至少约10、12或15个氨基酸上至最高约20或25个氨 基酸的序列。

术语“表位”涉及抗原中的特异性免疫反应性位点,也称为抗原决定簇。 这些表位可以是多聚组合物中单体(如蛋白质中的氨基酸)的线性排列,或 者包含更复杂的二级结构或三级结构或者由其组成。本领域技术人员会认 识到,免疫原(即能引发免疫应答的物质)是抗原,但一些抗原(如半抗原) 则不是免疫原,而是可能通过与载体分子偶联而具有免疫原性。术语“抗原” 包括提及可对针对其产生抗体和/或抗体对其具有特异免疫反应性的物质。

在一个实施方案中,本发明涉及本发明多肽或本发明方法中所用并赋 予与相应未转化野生型植物细胞、植物或其部分相比提高的产量的多肽的 表位。

术语“一个或多个氨基酸”指至少一个氨基酸,但不多于将导致同源性 低于50%同一性的氨基酸数。优选地,同一性高于70%或80%,更优选 85%、90%、91%、92%、93%、94%或95%,甚至更优选96%、97%、 98%或99%的同一性。

此外,本发明的核酸分子包括作为上述核酸分子的核苷酸序列之一或 其部分之互补序列的核酸分子。与选自SEQ ID NO:1、3、12、38、39、 40、41、42、43、44、45、46、47、48、49、50的核苷酸序列之一互补的 核酸分子是这样的核酸分子,其与选自SEQ ID NO:1、3、12、38、39、 40、41、42、43、44、45、46、47、48、49、50的核苷酸序列之一充分互 补,以使其能与选自SEQ ID NO:1、3、12、38、39、40、41、42、43、 44、45、46、47、48、49、50的核苷酸序列之一杂交,从而形成稳定的双 链体。优选地,所述杂交在严格条件下进行。然而,本文所述序列之一的 互补序列优选是根据本领域技术人员熟知的碱基配对与其互补的序列。例 如,碱基A和G分别与碱基T以及U或C碱基配对,反之亦然。对碱基 的修饰可能影响碱基配对的配偶体。

本发明的核酸分子包括这样的核苷酸序列,其与选自SEQ ID NO:1、 3、12、38、39、40、41、42、43、44、45、46、47、48、49、50的核苷 酸序列或其部分具有至少约30%、35%、40%或45%的同源性,优选至少 约50%、55%、60%或65%,更优选至少约70%、80%或90%,甚至更 优选至少约95%、97%、98%、99%或更高的同源性,并且优选地具有上 述活性,特别是通过如在胞质溶胶或细胞器(如质体或线粒体或这两者,优 选质体)中表达而提高选自SEQ ID NO:2、4、13、51、52、53、54、55、 56、57、58、59、60、61、62、63的基因产物的活性后具有提高的产量。

本发明的核酸分子包括这样的核苷酸序列,其与选自SEQ ID NO:1、 3、12、38、39、40、41、42、43、44、45、46、47、48、49、50的核苷 酸序列或其部分杂交,优选在本文所述的严格条件下杂交,并且编码具有 上述活性的蛋白质,例如通过如在胞质溶胶或细胞器(如质体或线粒体或这 两者,优选质体)中表达而赋予与相应未转化野生型植物细胞、植物或其部 分相比提高的产量,并且任选地,该活性选自磷酸核糖焦磷酸合酶。

此外,本发明的核酸分子可以仅包含选自SEQ ID NO:1、3、12、38、 39、40、41、42、43、44、45、46、47、48、49、50序列之一的一部分编 码区,例如可用作探针或引物的片段或者编码本发明多肽或本发明方法中 所用多肽的生物活性部分的片段,即具有上述活性,例如通过如在胞质溶 胶或细胞器(如质体或线粒体或这两者,优选质体)中表达而赋予与相应未 转化野生型植物细胞、植物或其部分相比提高的产量。从本发明蛋白质编 码基因的克隆中测定的核苷酸序列允许产生用于在其他细胞类型和生物中 鉴定和/或克隆其同源物的探针和引物。所述探针/引物一般包含基本纯化的 寡核苷酸。该寡核苷酸一般包含这样的核苷酸序列区域,其在严格条件下 与所示序列之一的有义链的至少约12、15个、优选至少约20或25个、更 优选约40、50或75个连续核苷酸杂交,例如选自SEQ ID NO:1、3、12、 38、39、40、41、42、43、44、45、46、47、48、49、50;所述序列之一(例 如选自SEQ ID NO:1、3、12、38、39、40、41、42、43、44、45、46、 47、48、49、50)的反义序列或其天然突变体。基于本发明核苷酸的引物可 用于PCR反应中来克隆本发明多肽或本发明方法所用多肽的同源物,例如 作为本发明实施例中所述的引物,例如实施例中所示。用选自SEQ ID NO: 5、6的引物进行的PCR将产生选自SEQ ID NO:2、4、13、51、52、53、 54、55、56、57、58、59、60、61、62、63的基因产物的片段。

引物组可互换。本领域技术人员了解组合所述引物来产生期望的产物, 例如全长克隆或部分序列。基于本发明核酸分子或本发明方法中所用核酸 分子的探针可用于检测编码相同或同源蛋白质的转录物或基因组序列。探 针还可包含其上附着的标记基团,例如所述标记基团可以是放射性同位素、 荧光化合物、酶或酶辅因子。这些探针可作为基因组标志物试剂盒的一部 分,用于鉴定表达本发明多肽或本发明方法中所用多肽的细胞(例如通过测 量细胞样品中编码核酸分子的水平(例如检测mRNA水平)),或者用于确定 包含本发明多核苷酸序列或本发明方法中所用多核苷酸序列的基因组基因 是否已突变或缺失。

本发明的核酸分子编码多肽或其部分,其包括与选自SEQ ID NO:2、 4、13、51、52、53、54、55、56、57、58、59、60、61、62、63的氨基 酸序列充分同源的氨基酸序列,从而该蛋白质或其部分保持参与与相应未 转化野生型植物细胞、植物或其部分相比产量提高的能力,特别是在所述 植物中提高上文所述活性或实施例中所述活性。

本文使用的术语“充分同源”指蛋白质或其部分,其具有这样的氨基酸 序列,其包含最少数目的与选自SEQ ID NO:2、4、13、51、52、53、54、 55、56、57、58、59、60、61、62、63的氨基酸序列相同或等同的氨基酸 残基(例如与本发明多肽序列之一中的氨基酸残基具有相似侧链的氨基酸 残基),以使该蛋白质或其部分能参与与相应未转化野生型植物细胞、植物 或其部分相比产量的提高。例如,具有本文所述的磷酸核糖焦磷酸合酶活 性。

在一个实施方案中,本发明的核酸分子包括编码本发明蛋白质的一部 分的核酸。所述蛋白质与选自SEQ ID NO:2、4、13、51、52、53、54、 55、56、57、58、59、60、61、62、63的完整氨基酸序列具有至少约30%、 35%、40%、45%或50%的同源性,优选至少约55%、60%、65%或70%, 更优选至少约75%、80%、85%、90%、91%、92%、93%或94%,最优 选至少约95%、97%、98%、99%或更高的同源性,并且具有上述活性, 例如通过如在胞质溶胶或细胞器(如质体或线粒体或这两者,优选质体)中 表达而赋予与相应未转化野生型植物细胞、植物或其部分相比提高的产量。

本发明核酸分子所编码蛋白质的部分优选具有生物活性,优选具有上 述生物活性,例如在提高活性后赋予与相应未转化野生型植物细胞、植物 或其部分相比提高的产量。

如本文所述,术语“生物活性部分”旨在包括这样的部分(例如结构域/ 基序),其赋予与相应未转化野生型植物细胞、植物或其部分相比提高的产 量,或者具有免疫活性,从而与抗体结合,所述抗体特异性结合本发明多 肽或本发明方法中用于赋予与相应未转化野生型植物细胞、植物或其部分 相比提高的产量的多肽。

本发明还涉及这样的核酸分子,其由于遗传密码的简并性而不同于选 自SEQ ID NO:1、3、12、38、39、40、41、42、43、44、45、46、47、 48、49、50的核苷酸序列之一(及其部分),并因而编码本发明的多肽,特 别是具有上述活性的多肽,例如选自SEQ ID NO:2、4、13、51、52、53、 54、55、56、57、58、59、60、61、62、63或其功能同源物的多肽。有利 地,本发明的核酸分子包含(或在另一些方案中具有)编码蛋白质的核苷酸 序列,所述蛋白质包含(或在另一些实施方案中具有)选自SEQ ID NO:2、 4、13、51、52、53、54、55、56、57、58、59、60、61、62、63或其功 能同源物的氨基酸序列。在另一些实施方案中,本发明的核酸分子编码全 长蛋白,其与选自SEQ ID NO:2、4、13、51、52、53、54、55、56、57、 58、59、60、61、62、63或其功能同源物的氨基酸序列基本同源。然而, 在一个优选的实施方案中,本发明的核酸分子不由选自SEQ ID NO:1、3、 12、38、39、40、41、42、43、44、45、46、47、48、49、50的序列组成。

此外,本领域技术人员会理解,在种群中可能存在导致氨基酸序列改 变的DNA序列多态性。编码本发明多肽或包含本发明核酸分子的基因中 的这种遗传多态性可由于天然变异而在种群的个体中存在。

本文使用的术语“基因”和“重组基因”指这样的核酸分子,其包含编码 本发明多肽的可读框,或者包含本发明的核酸分子,或者编码本发明方法 中所用的多肽,优选来自作物植物或者来自可用于本发明方法的微生物。 这些天然变异一般可导致基因的核苷酸序列中1至5%的变异。本发明范 围中旨在包括编码本发明多肽或包含本发明核酸分子的基因中的任何及所 有核苷酸变异及其引起的氨基酸多态性,这些变异由于天然变异而产生, 并且不改变所述功能活性。

可以基于其与本文所述核酸分子的同源性,使用本发明核酸分子或其 部分作为杂交探针,根据标准杂交技术在严格杂交条件下分离与本发明核 酸分子同源之天然变体的相应核酸分子,其也可以是cDNA。

因此,在另一实施方案中,本发明的核酸分子长度至少为15、20、25 或30个核苷酸。优选地,其在严格条件下与包含本发明核酸分子或本发明 方法中所用核酸分子之核苷酸序列(例如包含选自SEQ ID NO:1、3、12、 38、39、40、41、42、43、44、45、46、47、48、49、50的序列)的核酸分 子杂交。所述核酸分子的长度优选为至少20、30、50、100、250或更多个 核苷酸。

上文定义了术语“在严格条件下杂交”。在一个实施方案中,术语“在严 格条件下杂交”旨在描述这样的杂交和洗涤条件,在所述条件下彼此具有至 少30%、40%、50%或65%同一性的核苷酸序列一般保持彼此杂交。优选 地,该条件使得彼此具有至少约70%、更优选至少约75%或80%、甚至 更优选至少约85%、90%或95%或更高同一性的序列一般保持彼此杂交。

优选地,在严格条件下与选自SEQ ID NO:1、3、12、38、39、40、 41、42、43、44、45、46、47、48、49、50的序列杂交的本发明核酸分子 对应于本发明的天然核酸分子。本文使用的术语“天然”核酸分子指具有在 自然界中存在的核苷酸序列(例如编码天然蛋白质)的RNA或DNA分子。 优选地,该核酸分子编码具有上述活性的天然蛋白质,所述活性为例如在 提高其表达或活性或者通过如在胞质溶胶或细胞器(如质体或线粒体或这 两者,优选质体)中表达基因产物的核酸序列提高本发明蛋白质或本发明方 法中所用蛋白质之活性后赋予提高的产量。

除了本发明多肽或核酸分子以及本发明方法中所用多肽或核酸分子之 序列的天然变体以外,本领域技术人员会认识到,可通过诱变向编码本发 明多肽或本发明方法中所用多肽的核酸分子的核苷酸序列中引入改变,从 而导致所编码多肽的氨基酸改变,而不改变该多肽的功能能力,优选不降 低所述活性。

例如,可以在本发明核酸分子或本发明方法中所用核酸分子(例如选自 SEQ ID NO:1、3、12、38、39、40、41、42、43、44、45、46、47、48、 49、50)的序列中产生导致在“非关键”氨基酸残基处发生氨基酸替换的核苷 酸替换。

“非关键”氨基酸残基是在野生型序列中发生变化而不改变所述多肽之 活性的残基,而“关键”氨基酸残基是上述活性(例如在提高该多肽的活性后 导致与相应未转化野生型植物细胞、植物或其部分相比提高的产量)所需的 氨基酸残基。然而,其他氨基酸残基(例如在具有所述活性的结构域中不保 守或仅半保守的残基)可能不是活性所必需的,因此很可能适于进行改变而 不改变所述活性。

此外,本领域技术人员了解,生物之间的密码子使用可能不同。因此, 可以使本发明核酸分子中的密码子使用适用于表达所述多核苷酸或多肽的 生物或细胞区室(例如质体或线粒体)中的使用。

因此,本发明涉及编码多肽的核酸分子,所述多肽通过如在胞质溶胶 或细胞器(如质体或线粒体或这两者,优选质体)中表达而在生物或其部分 中具有上述活性,并在所述活性的非关键氨基酸残基中含有改变。这些多 肽在氨基酸序列上不同于选自SEQ ID NO:2、4、13、51、52、53、54、 55、56、57、58、59、60、61、62、63之序列的序列,但仍保留本文所述 活性。所述核酸分子可包含编码多肽的核苷酸序列,其中所述多肽包含与 选自SEQ ID NO:2、4、13、51、52、53、54、55、56、57、58、59、60、 61、62、63的氨基酸序列具有至少约50%同一性的氨基酸序列,并且能在 通过如在胞质溶胶或细胞器(如质体或线粒体或这两者,优选质体)中表达 而提高其活性(例如其表达)后参与与相应未转化野生型植物细胞、植物或 其部分相比产量的提高。优选地,该核酸分子所编码的蛋白质与选自SEQ ID NO:2、4、13、51、52、53、54、55、56、57、58、59、60、61、62、 63的序列具有至少约60%的同一性,更优选与选自SEQ ID NO:2、4、13、 51、52、53、54、55、56、57、58、59、60、61、62、63的序列之一具有 至少约70%的同一性,甚至更优选与表II第5列和第7列所示序列具有至 少约80%、90%、95%的同源性,最优选与选自SEQ ID NO:2、4、13、 51、52、53、54、55、56、57、58、59、60、61、62、63的序列具有至少 约96%、97%、98%或99%的同一性。

为了测定两氨基酸序列或两核酸分子之间的百分比同源性(=同一性, 本文中可互换使用),将序列一个写在另一个下方用于最佳比较(例如,可 以向蛋白质或核酸中插入缺口,以产生与另一蛋白质或另一核酸的最佳比 对)。

接着比较相应氨基酸位置或核苷酸位置上的氨基酸残基或核酸分子。 如果一个序列中的位置被与另一序列中相应位置上相同的氨基酸残基或相 同的核酸分子占据,则所述分子在此位置上是同源的(即,本文中使用的氨 基酸或核酸“同源性”对应于氨基酸或核酸“同一性”)。两序列间的百分比同 源性是所述序列间共有的相同位置数的函数(即,%同源性=相同位置数/总 位置数×100)。因此,术语“同源性”和“同一性”应认为是同义的。

为了确定两个或更多个氨基酸或者两个或更多个核苷酸序列之间的百 分比同源性(=同一性),已经开发了若干计算机软件程序。两个或更多个序 列的同一性可以使用例如fasta软件来计算,该软件目前使用的版本是 fasta3(W.R.Pearson和D.J.Lipman,PNAS 85,2444(1988);W.R. Pearson,Methods in Enzymology 183,63(1990);W.R.Pearson和D.J. Lipman,PNAS 85,2444(1988);W.R.Pearson,Enzymology 183,63 (1990))。另一种可用于计算不同序列间同源性的程序是标准blast程序,其 包括在Biomax pedant软件中(Biomax,Munich,Federal Republic of Germany)。遗憾的是,这有时产生非最优的结果,因为blast不总是包括 主题和查询的完整序列。尽管如此,该程序非常高效,可用于比较大量序 列。一般在这样的序列比较中使用以下设置:

-p程序名[字符串];-d数据库[字符串];默认=nr;-i检索文件 [File In];默认=stdin;-e期望值(E)[实数];默认=10.0;-m比对视图 选项:0=配对;1=查询固定,显示名称;2=查询固定,无名称;3=平查 询固定,显示名称;4=平查询固定,无名称;5=查询固定,无名称,平末 端;6=平查询固定,无名称,平末端;7=XML Blast输出;8=列表;9有 注解行的表[整数];默认=0;-o BLAST报告输出文件[File Out]可选; 默认=stdout;-F过滤查询序列(DUST使用blastn,SEG使用其他)[字 符串];默认=T;-G打开缺口的消耗(0调用默认行为)[整数];默认=0; -E延伸缺口的消耗(0调用默认行为)[整数];默认=0;-X X缺口比对 的降低值(比特)(0调用默认行为);blastn 30,megablast 20,tblastx 0,其他 均为15[整数];默认=0;-I Show GI′s in deflines[T/F];默认=F;-q核 苷酸错配罚分(仅用于blastn)[整数];默认=-3;-r核苷酸匹配奖分(仅用 于blastn)[整数];默认=1;-v对(V)显示一行描述的数据库序列数[整数]; 默认=500;-b对(B)显示比对的数据库序列数[整数];默认=250;-f延 伸命中的阈值,0为默认;blastp 11,blastn 0,blastx 12,tblastn 13;tblastx 13,megablast 0[整数];默认=0;-g进行缺口比对(tblastx不提供)[T/F]; 默认=T;-Q使用的查询遗传密码[整数];默认=1;-D DB遗传密码(仅 用于tblast[nx])[整数];默认=1;-a使用的处理器数[整数];默认=1;-O 序列比对文件[File Out]可选;-J相信查询defline[T/F];默认=F;-M 矩阵[字符串];默认=BLOSUM62;-W字号,0为默认(blastn 11, megablast 28,其他均为3)[整数];默认=0;-z数据库有效长度(实际大小 使用0)[实数];默认=0;-K区域中保留的最佳命中数(默认关闭,如果使 用则推荐值为100)[整数];默认=0;-P多个命中使用0,单个命中使用 1[整数];默认=0;-Y检索空间有效长度(实际大小使用0)[实数];默认= 0;-S针对数据库检索的查询链(用于blast[nx]和tblastx);3为都是,1为上 2为下[整数];默认=3;-T产生HTML输出[T/F];默认=F;-l将数据 库检索限制在GI列表[字符串]可选;-U使用FASTA序列的小写过滤 [T/F]可选;默认=F;-y无缺口延伸的X降低值(比特)(0.0调用默认行 为);blastn 20,megablast 10,其他均为7[实数];默认=0.0;-Z最终缺口 比对的X降低值(比特)(0.0调用默认行为);blastn/megablast 50,tblastx 0, 其他均为25[整数];默认=0;-R PSI-TBLASTN checkpoint file[File In] 可选;-n MegaBlast search[T/F];默认=F;-L查询序列上的位置[字符 串]可选;-A多重命中的窗口大小,0为默认(blastn/megablast 0,其他 均为40[整数];默认=0;-w移码罚分(blastx使用OOF算法)[整数];默 认=0;-ttblastn中用于连接HSP的最大允许内含子长度(0不进行连接) [整数];默认=0。

使用Needleman和Wunsch或者Smith或Waterman的算法得到了高 质量的结果。因此,优选基于所述算法的程序。有利地,序列比较可以使 用PileUp程序(J.Mol.Evolution.,25,351(1987),Higgins等,CABIOS 5, 151(1989))或优选使用“Gap”和“Needle”程序来进行,它们都基于 Needleman和Wunsch的算法(J.Mol.Biol.48;443(1970)),还有“BestFit”, 它基于Smith和Waterman的算法(Adv.Appl.Math.2;482(1981))。 “Gap”和“BestFit”是GCG软件包的一部分(Genetics Computer Group, 575Science Drive,Madison,Wisconsin,USA 53711(1991);Altschul等, (Nucleic Acids Res.25,3389(1997)),“Needle”是The European Molecular Biology Open Software Suite(EMBOSS)的一部分(Trends in Genetics 16 (6),276(2000))。因此,优选地,在完整序列范围内使用“Gap”或“Needle” 程序进行用于确定序列同源性百分比的计算。对“Needle”使用以下标准调 整用于核酸序列比较:矩阵:EDNAFULL,缺口罚分:10.0,延伸罚分:0.5。 对“Gap”使用以下标准调整用于核酸序列比较:缺口权重:50,长度权重: 3,评价匹配:10.000,评价错配:0.000。

例如,在核酸水平上与SEQ ID NO:1具有80%同源性的序列应理解 为在以上述参数通过上述程序“Needle”与序列SEQ ID NO:1比较后具有 80%的同源性。

两多肽间的同源性应理解为完整序列长度上氨基酸序列的同一性,通 过借助上述程序“Needle”进行比较来计算,其中使用矩阵:EBLOSUM62, 缺口罚分:8.0,延伸罚分:2.0。

例如,在蛋白质水平上与序列SEQ ID NO:2具有80%同源性的序列 应理解为在以上述参数通过上述程序“Needle”与序列SEQ ID NO:2比较 后具有80%的同源性。

通过对选自本发明SEQ ID NO:1、3、12、38、39、40、41、42、43、 44、45、46、47、48、49、50的核酸序列进行替换、插入或缺失而产生的 功能等同物与选自本发明SEQ ID NO:2、4、13、51、52、53、54、55、 56、57、58、59、60、61、62、63的多肽之一具有至少30%、35%、40%、 45%或50%,优选至少55%、60%、65%或70%,优选至少80%,特别 优选至少85%或90%、91%、92%、93%或94%,非常特别优选至少95%、 97%、98%或99%的同源性,并且编码与选自SEQ ID NO:2、4、13、51、 52、53、54、55、56、57、58、59、60、61、62、63的多肽具有基本相同 特性的多肽。

通过对选自本发明SEQ ID NO:2、4、13、51、52、53、54、55、56、 57、58、59、60、61、62、63的多肽之一进行替换、插入或缺失而产生的 功能等同物与选自本发明SEQ ID NO:2、4、13、51、52、53、54、55、 56、57、58、59、60、61、62、63的多肽之一具有至少30%、35%、40%、 45%或50%,优选至少55%、60%、65%或70%,优选至少80%,特别 优选至少85%或90%、91%、92%、93%或94%,非常特别优选至少95%、 97%、98%或99%的同源性,并且与选自SEQ ID NO:2、4、13、51、52、 53、54、55、56、57、58、59、60、61、62、63的多肽具有基本相同特性。

功能等同物的“基本相同的特性”首先应理解为指该功能等同物具有上 述活性,例如在胞质溶胶或细胞器(如质体或线粒体或这两者,优选质体) 中表达而提高所述功能等同物在生物(如微生物、植物或植物组织或动物组 织、植物或动物细胞或其部分)中的蛋白量、活性或功能。

可以这样产生编码选自SEQ ID NO:2、4、13、51、52、53、54、55、 56、57、58、59、60、61、62、63之蛋白质序列的同源物的核酸分子:向 本发明核酸分子(特别是选自SEQ ID NO:1、3、12、38、39、40、41、42、 43、44、45、46、47、48、49、50)的核苷酸序列中引入一个或多个核苷酸 替换、添加或缺失,以使所编码蛋白质中引入一个或多个氨基酸替换、添 加或缺失。可以通过标准技术(如定点诱变和PCR介导的诱变)向选自SEQ ID NO:1、3、12、38、39、40、41、42、43、44、45、46、47、48、49、 50的编码序列中引入突变。

优选地,在一个或多个预测的非关键氨基酸残基处产生保守性氨基酸 替换。“保守性氨基酸替换”是这样的氨基酸替换,其中氨基酸残基被具有 相似侧链的氨基酸残基替换。具有相似测量的氨基酸残基家族已在本领域 中定义。这些家族包括带有以下侧链的氨基酸:碱性侧链(例如赖氨酸、精 氨酸、组氨酸)、酸性侧链(例如天冬氨酸、谷氨酸)、不带电的极性侧链(例 如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、 非极性侧链(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、 甲硫氨酸、色氨酸)、β-分支侧链(例如苏氨酸、缬氨酸、异亮氨酸)和芳香 侧链(例如酪氨酸、苯丙氨酸、色氨酸、组氨酸)。

因此,本发明多肽或本发明方法所用多肽中预测的非关键氨基酸残基 优选被来自同一家族的另一氨基酸残基替换,或者,在另一实施方案中, 可在本发明核酸分子或本发明方法所用核酸分子的编码序列的全部或部分 中随机引入突变,例如通过饱和诱变引入,并可在所得突变体中筛选本文 所述活性,以鉴定保留或甚至提高上述活性(例如赋予与相应未转化野生型 植物细胞、植物或其部分相比提高的产量)的突变体。

在诱变本文所示序列之一后,可以重组表达所编码的蛋白质并可使用 如本文所述的测定(见实施例)来测定蛋白质的活性。

通过Gap检索在以下数据库条目中发现本发明方法所用核酸分子的最 高同源性。

具有选自SEQ ID NO:1、3、12、38、39、40、41、42、43、44、45、 46、47、48、49、50的序列的所用核酸序列的同源物还包括等位基因变体, 其与所示核苷酸序列之一或上述衍生的核酸序列或其同源物、衍生物或类 似物或其部分具有至少约30%、35%、40%或45%,优选至少约50%、 60%或70%,更优选至少约90%、91%、92%、93%、94%或95%,甚 至更优选至少96%、97%、98%或99%的同源性。特别地,等位基因变体 包括功能变体,其可通过在所示序列(优选选自SEQ ID NO:1、3、12、38、 39、40、41、42、43、44、45、46、47、48、49、50或衍生的核酸序列) 中缺失、插入或替换核苷酸来获得,然而,其目的是所合成的蛋白质的酶 活性或生物活性有利地被保留或提高。

在本发明的一个实施方案中,本发明的核酸分子或本发明方法所用核 酸分子包含选自SEQ ID NO:1、3、12、38、39、40、41、42、43、44、 45、46、47、48、49、50的序列。优选地,该核酸分子包含尽可能少的在 选自SEQ ID NO:1、3、12、38、39、40、41、42、43、44、45、46、47、 48、49、50的任何序列中未显示的其他核苷酸。在一个实施方案中,所述 核酸分子包含少于500、400、300、200、100、90、80、70、60、50或40 个其他核苷酸。在另一实施方案中,所述核酸分子包含少于30、20或10 个其他核苷酸。在一个实施方案中,本发明方法所用的所述核酸分子与选 自SEQ ID NO:1、3、12、38、39、40、41、42、43、44、45、46、47、 48、49、50的序列相同。

还优选本发明方法所用核酸分子编码包含选自SEQ ID NO:2、4、13、 51、52、53、54、55、56、57、58、59、60、61、62、63之序列的多肽。 在一个实施方案中,所述核酸分子编码少于150、130、100、80、60、50、 40或30个其他氨基酸。在另一实施方案中,所编码的多肽包含少于20、 15、10、9、8、7、6或5个其他氨基酸。在用于本发明方法的一个实施方 案中,所编码的多肽与选自SEQ ID NO:2、4、13、51、52、53、54、55、 56、57、58、59、60、61、62、63的序列相同。

在一个实施方案中,本发明的核酸分子或者本发明方法中所用核酸分 子编码包含选自SEQ ID NO:2、4、13、51、52、53、54、55、56、57、 58、59、60、61、62、63的序列的多肽,并包含少于100个其他核苷酸。 在另一实施方案中,所述核酸分子包含少于30个其他核苷酸。在一个实施 方案中,本发明方法中所用核酸分子与选自SEQ ID NO:1、3、12、38、 39、40、41、42、43、44、45、46、47、48、49、50之序列的编码序列相 同。

仍具有本发明多肽赋予与相应未转化野生型植物细胞、植物或其部分 相比提高的产量之必要生物活性或酶活性(即,其活性基本未降低)的多肽(= 蛋白质)的多肽是具有野生型生物活性或酶活性的至少10%或20%、优选 30%或40%、特别优选50%或60%、非常特别优选80%或90或更高的多 肽,有利地,该活性与在相同条件下表达的选自SEQ ID NO:2、4、13、 51、52、53、54、55、56、57、58、59、60、61、62、63的多肽之活性相 比基本未降低。

表I第5列和第7列的同源物或者选自SEQ ID NO:2、4、13、51、 52、53、54、55、56、57、58、59、60、61、62、63的衍生序列的同源物 还指编码和非编码DNA序列的截短序列、cDNA、单链DNA或RNA。所 述序列的同源物还应理解为指衍生物,其包含非编码区,例如UTR、终止 子、增强子或启动子变体。所述核苷酸序列上游的启动子可通过一个或多 个核苷酸替换、插入和/或缺失进行修饰,但却不干扰该启动子、可读框 (=ORF)或远离ORF的3’调节区(如终止子或其他3’调节区)的功能或活性。 还可以如下提高启动子的活性:修饰其序列,或者将其完全替换为活性更 高的启动子,甚至来自异源生物的启动子。合适的启动子为本领域技术人 员已知,并在下文提及。

除了上述编码PRS的核酸分子以外,本发明的另一方面涉及对选自 SEQ ID NO:1、3、12、38、39、40、41、42、43、44、45、46、47、48、 49、50的核酸分子之活性的负调节物。认为其反义多核苷酸抑制这些负调 节物的下调活性,这是通过与靶标多核苷酸特异性结合以及干扰靶标多核 苷酸的转录、剪接、转运、翻译和/或稳定性来实现的。本领域中描述了用 于将反义多核苷酸靶向至染色体DNA、初级RNA转录物或经加工mRNA 的方法。优选地,靶标区包括剪接位点、翻译起始密码子、翻译终止密码 子和可读框中的其他序列。

就本发明目的而言,术语“反义”指这样的核酸,其包括多核苷酸,上 述多核苷酸与基因、原始转录物或经加工mRNA的全部或部分充分互补, 从而干扰内源基因的表达。“互补”多核苷酸是能根据标准Watson-Crick 互补原则碱基配对的多核苷酸。具体而言,嘌呤与嘧啶碱基配对,形成鸟 嘌呤与胞嘧啶配对(G:C)和腺嘌呤与胸腺嘧啶(A:T)(DNA的情况)或者腺嘌 呤与尿嘧啶(A:U)(RNA的情况)的组合。应该理解,两个多核苷酸即便不彼 此完全互补也能彼此杂交,只要各自具有彼此基本互补的至少一个区域即 可。术语“反义核酸”包括单链RNA以及能转录产生反义RNA的双链DNA 表达盒。“活性”反义核酸是能与核酸分子活性的负调节物选择性杂交的反 义RNA分子,所述核酸分子编码与选自SEQ ID NO:2、4、13、51、52、 53、54、55、56、57、58、59、60、61、62、63的多肽具有至少80%序列 同一性的多肽。

反义核酸可以与完整的负调节物链互补,或者仅与其一部分互补。在 一个实施方案中,反义核酸分子与编码PRS的核苷酸序列的编码链中的 “非编码区”反义。术语“非编码区”指编码区侧翼不翻译成氨基酸的5’和3’ 序列(即,也称为5’和3’非翻译区)。反义核酸分子可以仅与PRS mRNA的 非编码区的一部分互补。例如,反义寡核苷酸可以与PRS mRNA翻译起 始位点周围的区域互补。例如,反义寡核苷酸的长度可以为约5、10、15、 20、25、30、35、40、45或50个核苷酸。本发明的反义分子一般包含与 选自SEQ ID NO:1、3、12、38、39、40、41、42、43、44、45、46、47、 48、49、50的核酸之一的非编码区中至少14个连续核苷酸具有60-100% 序列同一性的RNA。优选地,所述序列同一性将为至少70%,更优选至 少75%、80%、85%、90%、95%、98%,最优选99%。

可以使用本领域已知的方法,使用化学合成和酶连接反应来构建本发 明的反义核酸。例如,反义核酸(例如反义寡核苷酸)可以使用天然核苷酸 或多种修饰核苷酸来化学合成,所述修饰核苷酸设计用于提高分子的生物 稳定性或提高反义与有义核酸之间所形成双链体的物理稳定性,例如,可 以使用硫代磷酸酯衍生物和吖啶取代的核苷酸。可用于产生反义核酸的修 饰核苷酸的实例包括5-氟尿嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-碘尿嘧啶、 次黄嘌呤、黄嘌呤、4-乙酰胞嘧啶、5-(羧基羟甲基)-尿嘧啶、5-羧甲基氨基 甲基-2-硫代尿苷、5-羧甲基氨甲基尿嘧啶、二氢尿嘧啶、β-D-半乳糖基 queosine、肌苷、N6-异戊烯基腺嘌呤、1-甲基鸟嘌呤、1-甲基肌苷、2,2- 二甲基鸟嘌呤、2-甲基腺嘌呤、2-甲基鸟嘌呤、3-甲基胞嘧啶、5-甲基胞嘧 啶、N6-腺嘌呤、7-甲基鸟嘌呤、5-甲基氨甲基尿嘧啶、5-甲氧基氨甲基-2- 硫尿嘧啶、β-D-甘露糖基queosine、5’-甲氧基羧甲基尿嘧啶、5-甲氧基尿 嘧啶、2-甲硫基-N6-异戊烯基腺嘌呤、尿嘧啶-5-氧乙酸(v)、wybutoxosine、 假尿嘧啶、queosine、2-硫代胞嘧啶、5-甲基-2-尿嘧啶、2-硫尿嘧啶、4-硫 尿嘧啶、5-甲基尿嘧啶、尿嘧啶-5-氧乙酸甲酯、5-甲基-2-硫尿嘧啶、3-(3- 氨基-3-N-2-羧基丙基)-尿嘧啶、acp3和2,6-二氨基嘌呤。或者,可以使用 已经将核酸以反义方向亚克隆(即,从所插入核酸转录的RNA将为目的靶 核酸的反义取向,以下章节中进一步描述)的表达载体通过生物方法产生反 义核酸。

在另一实施方案中,本发明的反义核酸分子是α-端基异构核酸分子。 α-端基异构效应核酸分子与互补RNA形成特定的双链杂交体,其中与通常 的b单元相反,链彼此平行排列(Gaultier等,Nucleic Acids.Res.15,6625 (1987))。反义核酸分子还可包含2’-o-甲基核糖核苷酸(Inoue等,Nucleic Acids Res.15,6131(1987))或嵌合RNA-DNA类似物(Inoue等,FEBS Lett. 215,327(1987))。

本发明的反义核酸分子一般对细胞施用或者原位产生,以使其与细胞 mRNA和/或基因组DNA杂交或结合。杂交可通过常规核苷酸互补性进行, 以形成稳定双链体,或者例如对于与DNA双链体结合的反义核酸分子的 情况,通过双螺旋大沟中的特异性相互作用进行。可以修饰反义分子,以 使其特异性结合选定细胞表面上表达的受体或抗原,例如将该反义核酸分 子与结合细胞表面受体或抗原的肽或抗体连接在一起。也可以使用本文所 述载体将反义核酸分子递送至细胞中。为了实现足够的反义分子胞内浓度, 优选其中将反义核酸分子置于强原核、病毒或真核(包括植物)启动子控制 之下的载体构建体。

作为反义多核苷酸的备选,可以使用核酶、有义多核苷酸或双链 RNA(dsRNA)以减少PRS多肽表达。“核酶”意指具有核糖核酸酶活性的基 于催化性RNA的酶,其能够切割与之具有互补区域的单链核酸如mRNA。 可以使用核酶(例如Haselhoff和Gerlach,Nature 334,585(1988)所述的锤 头状核酶)以催化性切割PRS mRNA转录物以便因此抑制PRS mRNA的 翻译。对编码PRS的核酸呈特异性的核酶可以基于如本文中所公开的PRS cDNA的核苷酸序列或基于根据本发明中已教授的方法而分离的异源序列 设计。例如,可以构建四膜虫(Tetrahymena)L-19IVS RNA的衍生物,在 其中活性位点的核苷酸序列与编码PRS的mRNA中待受到切割的核苷酸 序列互补。参见例如Cech等的美国专利号4,987,071和5,116,742。备选地, 可以使用PRS mRNA以在RNA分子库内选择具有特异性核糖核酸酶活性 的催化性RNA。。参阅如Bartel D.和Szostak J.W.,Science 261,1411 (1993)。在优选的实施方案中,核酶将含有具备至少7、8、9、10、12、14、 16、18或20个核苷酸并且更优选地7或8个核苷酸的与靶RNA的部分具 有100%互补性的部分。用于产生核酶的方法对本领域技术人员为已知。 例如参见美国专利号6,025,167;5,773,260和5,496,698。

本文使用的术语“dsRNA”指包含两个RNA链的RNA杂交体。dsRNA 的结构可以是线性或环状的。在一个优选的实施方案中,dsRNA对多核苷 酸具有特异性,所述多核苷酸编码选自SEQ ID NO:2、4、13、51、52、 53、54、55、56、57、58、59、60、61、62、63的多肽,或者编码与选自 SEQ ID NO:2、4、13、51、52、53、54、55、56、57、58、59、60、61、 62、63的多肽具有至少70%序列同一性的多肽。杂交的RNA可以是基本 互补或完全互补。“基本互补”意指当使用如上所述的BLAST程序优化比 对两种杂交的RNA时,杂交的部分至少95%互补。优选地,dsRNA的长 度将是至少100个碱基对。一般地,杂交的RNA长度相同,没有突出的 5′或3′端并且没有缺口。然而,达100个核苷酸的具有5′或3′突出端的 dsRNA可以用于本发明的方法中。

dsRNA可以包含核糖核苷酸或核糖核苷酸类似物如2′-O-甲基核糖基 或其组合。例如,参见美国专利号4,130,641和4,024,222。dsRNA聚核糖 次黄苷酸:聚核糖胞苷酸在美国专利4,283,393中描述。用于产生和使用 dsRNA的方法在本领域已知。一个方法包括在体内或在体外单个反应混合 物内同时转录两条互补的DNA链。例如,参见美国专利号5,795,715。在 一个实施方案中,dsRNA可以通过标准技术直接导入植物或植物细胞。或 者,dsRNA可以在植物细胞中通过转录两种互补的RNA得到表达。

用于抑制内源基因表达的其他方法如三螺旋形成(Moser等,Science 238,645(1987),以及Cooney等,Science 241,456(1988))和共抑制(Napoli 等,The Plant Cell 2,279,1990,)为本领域已知。已经将部分或全长的cDNA 用于共抑制内源植物基因。参阅如美国专利号4,801,340、5,034,323、 5,231,020和5,283,184;Van der Kroll等,The Plant Cell 2,291,(1990); Smith等,Mol.Gen.Genetics 224,477(1990),以及Napoli等,The Plant Cell 2,279(1990)。

对于有义抑制,认为导入有义多核苷酸封闭相应靶基因的转录。有义 多核苷酸具有与靶植物基因或靶RNA至少65%的序列同一性。优选地, 同一性百分数是至少80%、90%、95%或更高。导入的有义多核苷酸不必 在全长上与靶基因或转录物相关。优选地,有义多核苷酸与选自SEQ ID NO:1、3、12、38、39、40、41、42、43、44、45、46、47、48、49、50 的核酸之一的至少100个连续核苷酸具有至少65%的序列同一性。同一性 的区域可以包含内含子和/或外显子和非翻译区域。导入的有义多核苷酸可 以短暂存在于植物细胞中,或可以稳定整合至植物染色体或染色体外复制 子。

此外,本发明的目的是包含核酸分子的表达载体,所述核酸分子包含 选自以下的核酸分子:

(a)编码选自SEQ ID NO:2、4、13、51、52、53、54、55、56、57、 58、59、60、61、62、63的多肽的核酸分子;

(b)选自SEQ ID NO:1、3、12、38、39、40、41、42、43、44、45、 46、47、48、49、50的核酸分子;

(c)核酸分子,其由于遗传密码的简并性而可以衍生自选自SEQ ID NO: 2、4、13、51、52、53、54、55、56、57、58、59、60、61、62、63之多 肽序列,并赋予与相应的未转化野生型植物细胞、植物或其部分相比提高 的产量;

(d)核酸分子,其与包含选自SEQ ID NO:1、3、12、38、39、40、41、 42、43、44、45、46、47、48、49、50之核酸分子的多核苷酸的核酸分子 序列具有至少30%同一性,优选至少40%、50%、60%、70%、75%、80%、 85%、90%、95%、96%、97%、98%、99%、99.5%同一性,并赋予与 相应的未转化野生型植物细胞、植物或其部分相比提高的产量;

(e)核酸分子,其编码与(a)、(b)、(c)或(d)核酸分子所编码多肽的氨基 酸序列具有至少30%同一性、优选至少40%、50%、60%、70%、75%、 80%、85%、90%、95%、96%、97%、98%、99%、99.5%同一性的多 肽,并具有包含选自SEQ ID NO:1、3、12、38、39、40、41、42、43、 44、45、46、47、48、49、50的多核苷酸的核酸分子所代表的活性,并赋 予与相应的未转化野生型植物细胞、植物或其部分相比提高的产量;

(f)核酸分子,其在严格杂交条件下与(a)、(b)、(c)、(d)或(e)的核酸分 子杂交,并赋予与相应的未转化野生型植物细胞、植物或其部分相比提高 的产量;

(g)核酸分子,其编码可借助于针对(a)、(b)、(c)、(d)、(e)或(f)核酸分 子之一所编码多肽产生的单克隆或多克隆抗体来分离的多肽,并具有包含 选自SEQ ID NO:1、3、12、38、39、40、41、42、43、44、45、46、47、 48、49、50的多核苷酸的核酸分子所代表的活性;

(h)核酸分子,其编码包含选自SEQ ID NO:7、8、9、10、11、14、 15、16、17、18之ADP结合位点的多肽基序的多肽或者包含选自SEQ ID No.64、65、66、67、68、69、70、71、72、73之基序的多肽,并优选地 具有包含选自SEQ ID NO:1、3、12、38、39、40、41、42、43、44、45、 46、47、48、49、50的多核苷酸的核酸分子所代表的活性;

(i)核酸分子,其编码具有选自SEQ ID NO:2、4、13、51、52、53、 54、55、56、57、58、59、60、61、62、63之蛋白质所代表的活性的多肽, 并赋予与相应的未转化野生型植物细胞、植物或其部分相比提高的产量;

(j)核酸分子,其包含可通过使用选自SEQ ID NO:5、6的引物扩增 cDNA文库或基因组文库获得的多核苷酸,该核酸分子在其5’末端不以核 苷酸ATA开始,并优选地具有包含表II或表IV的第5列申请号1中所示 多核苷酸的核酸分子代表的活性;

(k)核酸分子,其可通过严格杂交条件下筛选合适的核酸文库(特别是 cDNA文库和/或基因组文库)获得,所述筛选中使用包含(a)或(b)核酸分子 之互补序列的探针或者使用其片段,所述探针或其片段具有(a)至(e)所表征 核酸分子序列之互补核酸分子的至少15nt,优选20nt、30nt、50nt、100 nt、200nt、500nt、750nt或1000nt,并且该核酸分子编码多肽,该多肽 具有包含选自SEQ ID NO:2、4、13、51、52、53、54、55、56、57、58、 59、60、61、62、63之多肽的蛋白质所代表的活性。

本发明还提供分离的重组表达载体,其包含如上述的PRS编码核酸, 其中该载体或PRS编码核酸分别在宿主细胞中的表达导致与宿主细胞的 相应未转化的野生型相比提高的产量。如本文中所用,术语“载体”指能够 转运与之连接的另一种核酸分子的核酸分子。一个类型的载体实例是“质 粒”,其指向其中可以连接额外DNA节段的环状双链DNA环。另一类型 的载体是病毒载体,其中可以将额外DNA节段连接至病毒的基因组内。 其它类型的载可以是线性化的核酸序列,如转座子,其是可以拷贝并自我 插入的DNA片段。存在两种类型的已知转座子:称作插入序列的简单转 座子以及组合转座子,其可以具有数种基因以及为转座所需要的基因。

某些载体能够在导入这些载体的宿主细胞内自主复制(例如具有细菌 复制起点的细菌载体和附加型哺乳动物载体)。其它载体(非附加型哺乳动 物载体)在导入宿主细胞后整合至宿主细胞基因组,并且因此随宿主基因组 一起复制。此外,某些载体能够指导与它们有效连接的基因表达。此类载 体在本文中称为“表达载体”。通常,用于DNA重组技术的表达载体通常 是质粒的形式。在本说明书中,“质粒”和“载体”可互换使用,因为质粒是 载体的最常用形式。然而,本发明意图包含表达载体的其它形式,如病毒 载体(例如复制缺陷型逆转录病毒、腺病毒和腺相关病毒),其发挥等效功 能。

植物表达盒优选地包含调节序列,此类调节序列能够在植物细胞中驱 动基因表达并有效地连接以至每一序列可以充分实现它的功能,如通过聚 腺苷酸化信号终止转录。优选的聚腺苷酸化信号不但是源自根瘤农杆菌 t-DNA如Ti质粒pTiACH5(Gielen等(1984)EMBO J 3:835)中称作章鱼碱 合酶的基因3或其功能等同物的那些聚腺苷酸化信号,而且在植物中呈功 能活性的所有其它终止子也适合。

由于植物基因表达并不总是在翻译水平受限,因此植物表达盒优选地 含有有效连接的其它序列,如转录增强子,如含有来自烟草花叶病毒的5’ 非翻译前导序列的增强每RNA对多肽比率的超驱动序列(Gallie等,Nucl. Acids Research 15,8693(1987))。

基因表达必须有效地连接至赋予基因以时间、细胞或组织特异性方式 表达的适宜启动子。优选的启动子是驱动组成型表达的启动子(Benfey等, EMBO J.8,2195(1989)),如那些衍生自植物病毒如35S CaMV((Franck 等,Cell 21,285(1980))、19S CaMV(还参阅美国专利号5,352,605和PCT 申请号WO 84/02913)的启动子,或植物启动子,如那些在美国专利号 4,962,028中所述来自Rubisco小亚基的启动子。

额外有利的调节序列例如包含在植物启动子如CaMV/35S(Franck等, Cell 21285(1980))、PRP1(Ward等,Plant.Mol.Biol.22,361(1993))、SSU、 OCS、Iib4、usp、STLS1、B33、LEB4、nos中或者包含在泛蛋白、油菜 籽蛋白或菜豆蛋白启动子内。诱导型启动子在本上下文中也有利,如在 EP-A-O 388186(苯磺酰胺诱导型)、Plant J.2,1992:397-404(Gatz等,四 环素诱导型)、EP-A-O 335528(脱落酸诱导型)或WO 93/21334(乙醇或环己 酮诱导型)中描述的启动子。额外有利的植物启动子是马铃薯的胞浆FBP 酶启动子或马铃薯的ST-LSI启动子(Stockhaus等,EMBO J. 8(1989)2445-245)、大豆的磷酸核糖焦磷酸酰胺转移酶启动子(还参见 Genebank登录号U87999)或如EP-A-O 249676中所述节特异性启动子。 额外特别有利的启动子是可以用于单子叶植物或双子叶植物并且在US 5,608,152(来自欧洲油菜的油菜籽蛋白启动子)、WO 98/45461(来自拟南芥 菜属的油质蛋白启动子)、US 5,504,200(来自菜豆的菜豆蛋白启动子)、WO 91/13980(来自芥属的Bce4启动子)和Baeumlein等,Plant J.,2,2,1992:233 -239(来自豆科植物的LEB4启动子)中描述的种子特异性启动子。所述启 动子用于双子叶植物中。如下启动子用于例如单子叶植物:来自大麦中Ipt2 或Ipt1启动子(WO 95/15389和WO 95/23230)或来自大麦的大麦醇溶蛋白 启动子。其它有用的启动子在WO99/16890中描述。

原则上,可以使用具有其调节序列的所有天然启动子,如以上提及的 用于新方法的那些天然启动子。除此之外,还可能并且可以有利地使用合 成性启动子。

基因构建体还可含有待插入生物中并例如参与产量提高的其他基因。 在宿主生物中插入并表达调节基因是可能的并且是有利的,例如编码诱导 物、阻遏物或通过其酶活性干预调节作用的酶的基因,或者生物合成途径 中一种或多种或全部酶的基因。这些基因在来源上可以是异源或同源的。 插入的基因可以具有它们自己的启动子或处于如与表I核酸序列或其同源 物的相同启动子控制下。

为了表达存在的其它基因,基因构建体有利地包含根据已选择的宿主 生物和基因选择用于最佳表达的3′和/或5′末端调节序列以增强表达。

这些调节序列用于使如上所述的基因特异性表达和蛋白质表达成为可 能。根据宿主生物,这可以意指例如仅在诱导后基因才得以表达或过量表 达或基因立即得以表达和/或过量表达。

调节序列或因子还可以优选地有益影响导入的基因的表达并且因此提 高表达。有可能通过使用强转录信号,如启动子和/或增强子以这种方式有 利地在转录水平增强调节元件。然而,除此此外,还有可能例如通过改善 mRNA的稳定性增强翻译。

优选用于植物基因表达盒的其它序列是指导基因产物进入适宜细胞区 室所需要的靶向序列(综述参阅Kermode,Crit.Rev.Plant Sci.15(4),285 (1996)及其参考文献),如进入液泡、细胞核、所有类型的质粒如淀粉体、 叶绿体、细胞外空间、线粒体、色质体、内质网、油体、过氧化物酶体和 植物细胞的其它区室。

植物基因表达还可以通过诱导型启动子进行促进(综述参阅Gatz, Annu.Rev.Plant Physiol.Plant Mol.Biol.48,89(1997))。当基因表达需要 以时间特异性方式发生时,化学诱导型启动子特别合适。

表IV列出了可用于调节本发明核酸编码序列的转录的一些启动子实 例。

表IV:植物中组织特异性启动子和诱导型启动子的实例

其他启动子例如超级启动子(Ni等,.Plant Journal 7,661(1995))、泛蛋 白启动子(Callis等,J.Biol.Chem.,265,12486(1990);US 5,510,474;US 6,020,190;Kawalleck等,Plant.Molecular Biology,21,673(1993))或34S启 动子(GenBank登记号M59930和X16673)可类似地用于本发明,并为本领 域技术人员已知。

发育阶段优选的启动子在发育的某个阶段优先受到表达。组织和器官 优选的启动子包括在特定组织或器官如叶、根、种子或木质部中优先受到 表达的那些启动子。组织优选的启动子包括但不限于果实优选的、胚珠优 选的、雄性组织优选的、种子优选的、珠被优选的、块茎优选的、柄优选 的、果皮优选的和叶优选的、柱头优选的、花粉优选的、花药优选的、花 瓣优选的、萼片优选的、花梗优选的、长角果优选的、茎优选的、根优选 的启动子等。种子优选的启动子在种子繁育和/或萌发期间优先受到表达。 例如,种子优选地启动子可以是胚优选的、胚乳优选和种衣优选的启动子。 参阅Thompson等,BioEssays 10,108(1989)。种子优选的启动子实例包括 但不限于纤维素合成酶(celA)、Cim1、γ-玉米醇溶蛋白、球蛋白-1、玉米 19kD玉米醇溶蛋白(cZ19B1)等。

其它在本发明表达盒中有用的启动子包括但不限于主要叶绿素a/b结 合蛋白启动子、组蛋白启动子、Ap3启动子、β-伴大豆球蛋白启动子、油 菜籽蛋白启动子,大豆凝集素启动子、玉米15kD玉米醇溶蛋白启动子、22kD 玉米醇溶蛋白启动子、27kD玉米醇溶蛋白启动子、g-玉米醇溶蛋白启动 子、蜡质、萎缩1、萎缩2和青铜色启动子、Zm13启动子(美国专利号 5,086,169)、玉米多聚半乳糖醛酸酶启动子(PG)(美国专利号5,412,085和 5,545,546)和SGB6启动子(美国专利号5,470,359)以及合成性或其它的天然 启动子。

额外灵活地在植物中控制异源基因表达可以通过使用来自异源的 DNA结合结构域和反应元件(即来自非植物的DNA结合结构域)达到。异 源DNA结合结构域的实例是LexA DNA结合结构域(Brent和Ptashne,Cell 43,729(1985))。

本发明还提供包含以反义方向克隆至该表达载体的本发明PRS DNA 分子的重组表达载体。即DNA分子以如此方式有效连接至调节序列,该 方式允许(通过DNA分子转录)与PRS mRNA呈反义的RNA分子表达。 可以选择有效地连接至以反义方向克隆的核酸分子的调节序列,其指导反 义RNA分子在多种细胞类型中连续表达。例如,可以选择指导反义RNA 组成型、组织特异性或细胞类型特异性表达的病毒启动子和/或增强子,或 调节序列。反义表达载体可以是重组质粒、噬菌粒或减毒病毒的形式,在 其中反义核酸在高效调节区域的控制下产生。调节区域的活性可以通过向 其中导入载体的细胞类型加以测定。对于使用反义基因调节基因表达的讨 论,参阅Weintraub H.等,Reviews-Trends in Genetics,Vol.1(1),23(1986) 和Mol等,FEBS Letters 268,427(1990)。

本发明的另一方面涉及分离的PRS、及其生物活性部分。“分离的”或 “纯化的”多肽或其生物活性部分在通过重组DNA技术产生时基本不含某 些细胞性材料,或在通过化学合成时基本不含化学前体或其它化学品。词 组“基本不含细胞性材料”包括这样的PRS制品,在所述PRS制品中该多 肽与从其中天然或重组地产生此多肽的细胞的某些细胞器分开。在一个实 施方案中,词组“基本不含细胞材料”包括这样的PRS制品,其具有少于大 约30%(干重)的非PRS材料(本文中也称作“杂质多肽”)、优选地少于大约 20%的非PRS材料、仍更优选地少于大约10%的非PRS材料并且最优选 地少于大约5%的非PRS材料。

当重组产生PRS或其生物学活性部分时,它还优选地基本不含培养 基,即培养基占蛋白质制品的体积少于大约20%、更优选地少于大约10 %并且最优选地少于大约5%。词组“基本不含化学前体或其它化学品”包 括PRS制品,在其中该多肽与参与合成此多肽的化学前体或其它化学品分 开。词组“基本不含化学前体或其它化学品”包括PRS制品,其具有少于大 约30%(干重)的化学性前体或非PRS化学品、更优选地少于大约20%的化 学性前体或非PRS化学品、仍更优选地少于大约10%的化学性前体或非 PRS化学品并且最优选地少于大约5%的化学性前体或非PRS化学品。在 优选的实施方案中,分离的多肽或其生物活性部分没有来自在其中衍生 PRS的同一生物的杂质多肽。这样的多肽一般通过重组表达来产生,例如 酿酒酵母、大肠杆菌或欧洲油菜、大豆、玉米或水稻的PRS在微生物(如 酿酒酵母、大肠杆菌、谷氨酸棒杆菌、纤毛虫、藻类、真菌)或植物中产生, 只要该多肽在与其来源生物不同的生物中重组表达即可。

本文所述的核酸分子、多肽、多肽同源物、融合多肽、引物、载体和 宿主细胞可用于一种或多种以下方法:鉴定酿酒酵母、大肠杆菌或欧洲油 菜、大豆、玉米或水稻及相关生物;对酿酒酵母、大肠杆菌相关生物的基 因组进行作图;鉴定和定位酿酒酵母、大肠杆菌或欧洲油菜、大豆、玉米 或水稻的目的序列;进化研究;确定功能所需的PRS区;调节PRS活性; 调节一个或多个细胞功能的代谢;调节一种或多种化合物的跨膜转运;调 节产量;以及调节PRS核酸的表达。

本发明的PRS核酸分子还用于进化和多肽结构研究。本发明分子所参 与的代谢过程和转运过程由种类广泛的原核细胞和真核细胞所利用;通过 将本发明核酸分子的序列与来自其它生物的编码类似酶的核酸分子的序列 比较,可以评估生物的进化相关性。类似地,此类比较研究允许评估序列 的哪些区域保守而哪些区域不保守,这可能有助于确定多肽的哪个区域对 酶的功能关键。这种类型的确定对于多肽工程研究极有意义并且可以提供 多肽可以耐受何种诱变而不丧失功能的线索。

对本发明PRS核酸分子的操作可导致产生与野生型PRS有功能差异 的PRS。这些多肽可具有提高的效率或活性,可以比通常更高的数量存在 于细胞中,或者可以具有降低的效率或活性。

本发明PRS的改变可通过多种机制直接影响产量。

可以如下评估植物中的遗传修饰在提高产量方面的效果:在比合适更 差的条件下培养修饰的植物,接着分析该植物的生长特征和/或代谢。此类 分析技术对本领域技术人员而言众所周知,并且包括干重、鲜重、多肽合 成、糖合成、脂类合成、蒸发蒸腾速率、整体的植物和/或作物产量、开花、 繁殖、结种、根生长、呼吸速率、光合作用速率等(Applications of HPLC in Biochemistry:Laboratory Techniques in Biochemistry and Molecular Biology,Vol.17;Rehm等,1993Biotechnology,Vol.3,Chapter III: Product recovery and purification,469-714页,VCH:Weinheim;Belter P.A.等,1988,Bioseparations:downstream processing for biotechnology, John Wiley and Sons;Kennedy J.F.,和Cabral J.M.S.,1992,Recovery processes for biological materials,John Wiley and Sons;Shaeiwitz J.A.和 Henry J.D.,1988,Biochemical separations,Ulmann’s Encyclopedia of Industrial Chemistry,Vol.B3,Chapter 11,page 1-27,VCH:Weinheim;以 及Dechow F.J.,1989,Separation and purification techniques in biotechnology,Noyes Publications)。

例如,可以使用标准方法构建包含本文所述核酸或其片段的酵母表达 载体并转化进酿酒酵母中。接着对所得转基因细胞测定产量的产生或改变。 类似地,可以使用标准方法构建包含本文所述核酸或其片段的植物表达载 体并转化进适当的植物细胞中,例如拟南芥、大豆、油菜、玉米、棉花、 稻、小麦、蒺藜苜蓿(Medicago truncatula)等。接着对所得转基因细胞和/ 或由其产生的植物测定产量的产生或改变。

对选自SEQ ID NO:1、3、12、38、39、40、41、42、43、44、45、 46、47、48、49、50并编码选自本发明SEQ ID NO:2、4、13、51、52、 53、54、55、56、57、58、59、60、61、62、63的PRS的一个或多个基 因进行的改造还可产生改变了活性的PRS,其间接和/或直接影响植物产 量。

此外,本文所述序列或其片段可用于在多种生物(如细菌、哺乳动物细 胞、酵母细胞和植物细胞)的基因组中产生敲除突变(Girke,T.,The Plant Journal 15,39(1998))。接着可对所得的敲除细胞评估其提高产量的能力以 及对该突变的表型和/或基因型的影响。基因失活的其他方法参阅美国专利 号6,004,804和Puttaraju等,Nature Biotechnology 17,246(1999)。

导致产量提高增强的上述用于PRS的诱变策略并不意在限制,这些策 略的修改对于本领域技术人员来说是很明显的。使用这些策略并结合本文 公开的机制,本发明的核酸及多肽分子可用于产生表达突变PRS核酸及多 肽分子从而提高产量的藻类、植物、真菌。

本发明还提供特异性结合至如由本文中所述的核酸编码的PRS或其 部分的抗体。抗体可以通过众多众所周知的方法产生(参见例如Harlow和 Lane,“Antibodies;A Laboratory Manual”,Cold Spring Harbor Laboratory,Cold Spring Harbor,New York,(1988))。简而言之,可以将纯 化的抗原以足以激发免疫反应的量和间隔期注射至动物。可以直接纯化抗 体,或可以自该动物获得脾脏细胞。随后将此细胞与永生细胞系融合并对 抗体分泌进行筛选。抗体可用于对核酸克隆文库筛选针分泌抗原的细胞。 随后可以将那些阳性克隆测序。参阅如Kelly等,Bio/Technology 10,163 (1992);Bebbington等,Bio/Technology 10,169(1992)。

短语与多肽“选择性结合”和“特异性结合”指可确定多肽在异源多肽群 体和其它生物中存在的结合反应。因此,在指定的免疫分析条件下,结合 至特定多肽的指定抗体不以显著量结合至样品中存在的其它多肽。抗体在 如此条件下的选择性结合可能需要因其对特定多肽的特异性而选择的抗 体。多种免疫方法可以用于选择与特定多肽选择性结合的抗体。例如固相 ELISA免疫分析常规地用于选择与多肽发生选择性免疫反应的抗体。对于 可以用于测定选择性结合的免疫方法和条件的描述,参见Harlow和Lane, “Antibodies,A Laboratory Manual,”Cold Spring Harbor Publications, New York,(1988)。

在某些情况下,需要制备来自多种宿主的单克隆抗体。用于制备此类 单克隆抗体的技术的描述可以在Stites等编辑,“Basic和Clinical Immunology,”(Lange Medical Publications,Los Altos,Calif.,第五版和及 其中引用的参考文献,和在Harlow和Lane,“Antibodies,A Laboratory Manual,”Cold Spring Harbor Publications,New York,(1988)中找到。

植物中的基因表达受蛋白质转录因子与基因调节区域内特定核苷酸序 列相互作用的调节。转录因子的一个实例是含有锌指(ZF)基序的多肽。每 一ZF模块的长度是大约30个氨基酸,在锌离子周围折叠。ZF蛋白质的 DNA识别结构域是插入DNA双螺旋大沟内的α-螺旋结构。模块含有结合 至DNA的三个氨基酸,每一氨基酸接触靶DNA序列中的单个碱基对。ZF 基序以模块重复方式排列以形成一套识别连续DNA序列的指。例如,三 指ZF基序将识别DNA的9个bp。已证实数百个蛋白质含有ZF基序,每 一蛋白质中有2至37个ZF模块(Isalan M.等,Biochemistry 37(35),12026 (1998);Moore M.等,Proc.Natl.Acad.Sci.USA 98(4),1432(2001)以及 Moore M.等,Proc.Natl.Acad.Sci.USA 98(4),1437(2001);美国专利US 6,007,988和US 6,013,453)。

植物基因的调节区域含有众多起到识别包括ZF蛋白在内的转录因子 的短DNA序列(顺式作用元件)。不同基因中类似的识别结构域允许通过常 见转录因子在代谢途径中协同表达数个编码酶的基因。基因家族成员的识 别结构域中的变化有利于同一基因家族内部在基因表达的差异,例如在组 织和发育阶段以及对环境条件的反应中。

常见ZF蛋白不仅含有DNA识别结构域,还含有使ZF蛋白激活或抑 制特定基因转录的功能域。实验上,已经将激活域用于激活靶基因转录(美 国专利5,789,538和专利申请WO 95/19431),不过还有可能将转录阻遏物 域连接至ZF并且因而抑制转录(专利申请WO 00/47754和WO 01/002019)。已报道酶的功能如核酸切割可以与ZF联合(专利申请WO 00/20622)。

本发明提供了使得本领域技术人员能够从植物细胞基因组中分离一种 或多种PRS编码基因的调节区,并能设计与功能结构域连接的锌指转录因 子,所述功能结构域与该基因的调节区相互作用。可以以改变该基因表达 (并优选由此赋予产量提高)的方式来设计锌指蛋白与植物基因的相互作 用。

具体地,本发明提供了产生含有PRS编码核酸的转基因植物的方法, 其中该核酸在该植物中的表达导致与野生型植物相比提高的产量,该方法 包括:(a)用包含PRS编码核酸的表达载体转化植物细胞,和(b)从该植物 细胞产生与野生型植物相比具有提高的产量的转基因植物。就这样的植物 转化而言,可以使用双元载体,如pBinAR(和Willmitzer,Plant Science 66,221(1990))。其他合适的双元载体为例如pBIN19、pBI101、 pGPTV或pPZP(Hajukiewicz P.等,Plant Mol.Biol.,25,989(1994))。

双元载体的构建可以通过将cDNA连接至T-DNA进行。位于该cDNA 5′端的植物启动子激活cDNA的转录。聚腺苷酸化序列位于cDNA的3′端。 组织特异性表达可以通过使用如上所列的组织特异性启动子实现。此外, 可以使用任何其它启动子元件。对于在完整植物中的组成型表达,可以使 用CaMV 35S启动子。可以使用信号肽将表达的蛋白质靶向至细胞区室例 如质体、线粒体或内质网(Kermode,Crit.Rev.Plant Sci.4(15),285 (1996))。将信号肽以符合cDNA读框方式克隆至5’端以实现融和蛋白的亚 细胞定位。本领域技术人员认识到所用的启动子应当有效地连接至核酸以 至该启动子引起核酸的转录,导致合成编码多肽的mRNA。

另一种转染方法包括通过电穿孔或农杆菌介导的基因转移将DNA直 接转移至发育的花中。农杆菌介导的植物转化可以使用例如 GV3101(pMP90)(Koncz and Schell,Mol.Gen.Genet.204,383(1986))或 LBA4404(Ooms等,Plasmid,7,15(1982);Hoekema等,Nature,303,179 (1983))根瘤农杆菌菌株开展。转化可以通过标准转化和再生技术(Deblaere 等,Nucl.Acids.Res.13,4777(1994);Gelvin和Schilperoort,Plant Molecular Biology Manual,第二版.-Dordrecht:Kluwer Academic Publ., 1995.-in Sect.,Ringbuc Zentrale Signatur:BT11-P ISBN 0-7923-2731-4; Glick B.R.和Thompson J.E.,Methods in Plant Molecular Biology and Biotechnology,Boca Raton:CRC Press,1993.-360S.,ISBN 0-8493-5164-2)开展。例如,油菜可以通过子叶或下胚轴转化作用加以转化 (Moloney等,Plant Cell Reports 8,238(1989);De Block等,Plant Physiol. 91,694(1989))。用于农杆菌的抗生素以及植物选择取决于转化所用的双元 载体和农杆菌菌株。油菜的选择通常使用作为可选择植物标记的卡那霉素 开展。农杆菌介导至亚麻属植物的基因转移可以使用例如由Mlynarova等, Plant Cell Report 13,282(1994)描述的技术开展。此外,大豆的转化可以 使用例如由欧洲专利号424047、美国专利号5,322,783、欧洲专利号397 687、美国专利号5,376,543或美国专利号5,169,770描述的技术开展。玉米 的转化可以通过粒子轰击、聚乙二醇介导的DNA摄取或碳化硅纤维技术 (参阅如Freeling和Walbot“The maize handbook”Springer Verlag:New York(1993)ISBN 3-540-97826-7)实现。转化玉米的具体实例在美国专利号 5,990,387中找到并且转化小麦的具体实例在PCT申请号WO 93/07256中 找到。

在确定的N条件下培养修饰植物,接着筛选和分析生长特征和/或代谢 活性,这评估了植物中基因修饰对产量提高的影响。这些分析技术为本领 域技术人员所熟知。它们包括筛选(Lexikon Biotechnologie, Stuttgart/New York:Georg Thieme Verlag 1992,″screening″701页)干重、 鲜重、蛋白质合成、碳水化合物合成、脂类合成、蒸发蒸腾速率、总体植 物和/或作物产量、开花、繁殖、结籽、根生长、呼吸速率、光合作用速率 等。(Applications of HPLC in Biochemistry,Laboratory Techniques in Biochemistry and Molecular Biology,Vol.17;Rehm等,1993 Biotechnology,Vol.3,Chapter III:Product recovery and purification, 469-714页,VCH:Weinheim;Belter,P.A.等,1988Bioseparations: downstream processing for biotechnology,John Wiley and Sons;Kennedy J.F.和Cabral J.M.S.,1992Recovery processes for biological materials, John Wiley and Sons;Shaeiwitz J.A.和Henry J.D.,1988Biochemical separations,Ullmann’s Encyclopedia of Industrial Chemistry,Vol.B3, Chapter 11,1-27页,VCH:Weinheim;以及Dechow F.J.(1989) Separation and purification techniques in biotechnology,Noyes Publications)。

在一个实施方案中,本发明涉及用于在生物(例如植物)的细胞中鉴定 基因产物的方法,所述基因产物赋予与相应未转化野生型植物细胞相比提 高的产量,该方法包括以下步骤:

(a)将含有编码赋予产量提高之候选基因的样品(例如细胞、组织、植物 或微生物或核酸文库)与选自SEQ ID NO:1、3、12、38、39、40、41、42、 43、44、45、46、47、48、49、50的核酸分子或其功能同源物接触(例如杂 交);

(b)鉴定在宽松的严格条件下与所述核酸分子(特别是选自SEQ ID NO: 1、3、12、38、39、40、41、42、43、44、45、46、47、48、49、50的核 酸分子序列)杂交的核酸分子,并任选地分离全长cDNA克隆或完整的基因 组克隆;

(c)在宿主细胞(优选植物细胞)中鉴定该候选核酸分子或其片段;

(d)在期望提高产量的宿主细胞中提高所鉴定核酸分子的表达;

(e)测定该宿主细胞的产量提高水平;和

(f)鉴定核酸分子及其基因产物,其在宿主细胞中的表达提高赋予与野 生型相比提高的产量。

宽松的杂交条件为:在标准杂交操作之后,洗涤步骤可在低至中等严 格条件下进行,通常使用这样的洗涤条件:40℃-55℃,盐浓度为2×SSC 至0.2×SSC以及0.1%SDS,相比之下,严格洗涤条件为例如60℃至68℃ 以及0.1%SDS。严格杂交条件的其他实例可见于上文列出的参考文献。通 常以提高的严格度和长度重复洗涤步骤,直至检测到有用的信噪比,这取 决于许多因素,例如靶标(例如其纯度、GC含量、大小等)、探针(例如其 长度,是RNA还是DNA探针)、盐条件、洗涤或杂交温度、洗涤或杂交 时间等。

在另一实施方案中,本发明涉及用于鉴定基因产物的方法,所述基因 产物的表达在细胞中赋予提高的产量,该方法包括以下步骤:

(a)在生物中鉴定核酸分子(例如通过在数据库中进行同源性检索来鉴 定),该核酸分子与编码以下蛋白质的核酸分子具有至少20%的同源性,优 选20%,更优选30%,甚至更优选35%、40%或50%,甚至更优选60%、 70%或80%,最优选90%或95%或更高同源性,所述蛋白质包含选自SEQ ID NO:2、4、13、51、52、53、54、55、56、57、58、59、60、61、62、 63的多肽分子,或者包含编码含有选自SEQ ID NO:7、8、9、10、11、 14、15、16、17、18的ADP结合位点的多肽基序之多肽的核酸分子,或 者包含具有选自SEQ ID No:64、65、66、67、68、69、70、71、72、73 之基序的多肽,并优选具有由包含选自SEQ ID NO:1、3、12、38、39、 40、41、42、43、44、45、46、47、48、49、50之多核苷酸的核酸分子所 代表的活性,或者由包含选自SEQ ID NO:1、3、12、38、39、40、41、 42、43、44、45、46、47、48、49、50之多核苷酸的核酸分子或其同源物 编码,如本文所述;

(b)增强所鉴定核酸分子在宿主细胞中的表达;

(c)评价宿主细胞中的产量提高水平;和

(d)鉴定宿主细胞,其中所述增强的表达在该宿主细胞中赋予与野生型 相比提高的产量。

此外,本文所述核酸分子(特别是选自SEQ ID NO:1、3、12、38、39、 40、41、42、43、44、45、46、47、48、49、50的核酸分子)可与相关物种 的序列充分同源,从而这些核酸分子可作为标志物用于在相关生物中构建 基因组图谱或用于关联作图。此外,本文所述核酸(特别是选自SEQ ID NO: 1、3、12、38、39、40、41、42、43、44、45、46、47、48、49、50或其 同源物的核酸分子)相应的基因组区中的天然变异可导致本文所述蛋白质 活性的变异,并由此导致产量的天然变异,所述蛋白质尤其是这样的蛋白 质,其包含选自SEQ ID NO:2、4、13、51、52、53、54、55、56、57、 58、59、60、61、62、63的多肽,或者包含编码含有选自SEQ ID NO:7、 8、9、10、11、14、15、16、17、18的ADP结合位点多肽基序之多肽的 核酸分子,或者包含具有选自SEQ ID No:64、65、66、67、68、69、70、 71、72、73之基序的多肽,并优选具有由包含选自SEQ ID NO:1、3、12、 38、39、40、41、42、43、44、45、46、47、48、49、50和其同源物之多 核苷酸的核酸分子所代表的活性。

因此,天然变异最终也以更具活性的等位基因变体的形式存在,其导 致产量增强相对提高。可以鉴定对应于不同产量提高水平的本文所述核酸 分子(尤其是包含选自SEQ ID NO:1、3、12、38、39、40、41、42、43、 44、45、46、47、48、49、50的核酸分子的核酸)的不同变体,并用于标记 辅助的育种,以提高产量。

因此,本发明涉及用于培育产量提高的植物的方法,包括

(a)基于本文所述核酸(尤其是包含选自SEQ ID NO:1、3、12、38、39、 40、41、42、43、44、45、46、47、48、49、50的核酸分子的核酸分子) 或者多肽的表达提高来选择产量提高的第一种植物品种,所述多肽包含选 自SEQ ID NO:2、4、13、51、52、53、54、55、56、57、58、59、60、 61、62、63的多肽,或者包含编码含有选自SEQ ID NO:7、8、9、10、 11、14、15、16、17、18的ADP结合位点多肽基序之多肽的核酸分子, 或者包含具有选自SEQ ID No:64、65、66、67、68、69、70、71、72、 73之基序的多肽,并优选具有由包含选自SEQ ID NO:1、3、12、38、39、 40、41、42、43、44、45、46、47、48、49、50之多核苷酸或其同源物的 核酸分子所代表的活性,如本文所述;

(b)将产量增强水平与编码所述多肽或所述核酸分子的基因的表达水 平或基因组结构相关联;

(c)将所述第一种植物品种与产量增强水平存在显著差异的第二种植 物品种杂交;和

(d)通过所述多肽或所述核酸分子的表达水平或者编码所述多肽或本 发明核酸分子的基因的基因组结构来鉴定哪种后代品种获得了提高的产量 增强水平。

在一个实施方案中,步骤(b)的基因的表达水平是提高的。

本发明的另一实施方案涉及用于鉴定化合物的方法,所述化合物赋予 与相应未转化野生型植物细胞、植物或其部分相比在植物细胞、植物或其 部分中提高的产量,该方法包括以下步骤:

(a)培养植物细胞、植物或其部分,维持植物,该植物表达选自SEQ ID NO:2、4、13、51、52、53、54、55、56、57、58、59、60、61、62、63 的多肽,或者由包含选自本文所述SEQ ID NO:1、3、12、38、39、40、 41、42、43、44、45、46、47、48、49、50或其同源物之多核苷酸的核酸 分子编码的多肽,或者表达编码所述多肽并赋予与相应未转化野生型植物 细胞、植物或其部分相比提高的产量的多核苷酸;并且提供读出系统,该 读出系统能在允许该多肽在化合物或包含多种化合物的样品存在下与此读 出系统发生相互作用的合适条件下与该多肽相互作用,并能在一定条件下 应答于化合物与所述多肽的结合而提供检测信号,该条件允许表达所述读 出系统和蛋白质,该蛋白质选自SEQ ID NO:2、4、13、51、52、53、54、 55、56、57、58、59、60、61、62、63,或者由包含选自本文所述SEQ ID NO:1、3、12、38、39、40、41、42、43、44、45、46、47、48、49、50 或其同源物之多核苷酸的核酸分子编码;和

(b)通过所述读出系统所产生信号的存在与否或者升降情况来鉴定该 化合物是否是有效的激动剂。

所述化合物可以是化学合成的或者是微生物产生的和/或包含于例如 来自如植物、动物或微生物(如病原体)的样品(如细胞提取物)中。此外,所 述化合物可以是本领域已知的,但还不了解其能够抑制本发明的多肽。反 应混合物可以是无细胞提取物,或者可包含细胞或组织培养物。用于鉴定 本发明化合物的方法的合适设置为本领域技术人员已知,并且一般性地描 述于例如Alberts等,Molecular Biology of the Cell,第三版(1994),特别是 第17章。所述化合物可以例如添加到反应混合物、培养基中,注射到细胞 中或者喷洒到植物上。

如果在该方法中鉴定含有化合物的样品,则可以从鉴定为含有能激活 或增强与相应未转化野生型相比的产量提高的化合物的原始样品中分离该 化合物,或者可以将原始样品进一步细分(例如如果由多种不同化合物组 成),从而减少每个样品中的不同物质数,并以原始样品的细分重复该方法。 取决于样品的复杂度,上述步骤可以重复若干次,优选直至根据所述方法 鉴定的样品仅含有数目有限的物质或仅含一种物质。优选地,所述样品含 有具有相似化学和/或物理特性的物质,最优选地,所述物质是相同的。优 选地,将根据上述方法鉴定的化合物或其衍生物进一步配制成适于在植物 育种或植物细胞和组织培养中应用的形式。

可根据所述方法测试和鉴定的化合物可以是表达文库(例如cDNA表 达文库)、肽、蛋白质、核酸、抗体、小有机化合物、激素、拟肽、PNA 等(Milner,Nature Medicine 1,879(1995);Hupp,Cell 83,237(1995); Gibbs,Cell 79,193(1994),及上文引用的参考文献)。所述化合物也可以是 已知抑制剂或激活剂的功能衍生物或类似物。用于制备化学衍生物和类似 物的方法为本领域技术人员所熟知,并描述于例如Beilstein,Handbook of Organic Chemistry,Springer,New York Inc.,175Fifth Avenue,New York, N.Y.10010U.S.A.以及Organic Synthesis,Wiley,New York,USA。此外, 可根据本领域已知的方法测试所述衍生物和类似物的效果。此外,可以使 用拟肽和/或计算机辅助设计合适的衍生物或类似物,例如根据上文所述的 方法。该方法中可使用的细胞或组织为上文实施方案中所述的本发明宿主 细胞、植物细胞或植物组织。

因此,在另一实施方案中,本发明涉及可根据用于鉴定本发明激动剂 的方法获得或鉴定的化合物,所述化合物是本发明多肽的拮抗剂。

或者,在一个实施方案中,本发明还涉及通过用于鉴定本发明化合物 的方法鉴定的化合物。

在一个实施方案中,本发明涉及特异性识别本发明化合物或激动剂的 抗体。

本发明还涉及诊断组合物,其包含至少一种上述本发明核酸分子、反 义核酸分子、RNAi、snRNA、dsRNA、siRNA、miRNA、ta-siRNA、共 抑制分子、核酶、载体、蛋白质、抗体或化合物,并任选地包含合适的检 测手段。

本发明的诊断组合物适用于从细胞中分离mRNA,并在杂交条件下使 这样获得的mRNA接触包含上述核酸探针的探针,检测与该探针杂交的 mRNA的存在情况,从而检测细胞中该蛋白质的表达。检测本发明蛋白质 存在与否的其他方法包括本领域熟知的免疫技术,例如酶联免疫吸附测定。 此外,可以在植物育种中使用本发明的核酸分子作为分子标记或引物。合 适的检测方法为本领域技术人员所熟知,例如,描述于Sambrook等的用 于杂交测定的缓冲液和溶液(例如上述溶液和缓冲液)以及用于Southern、 Western、Northern等印迹的方法是已知的。在一个实施方案中,诊断组 合物含有PCR引物,其设计成特异性检测待在本发明方法中降低的核酸分 子(例如本发明的核酸分子)的存在或表达水平,或者设计成区分本发明核 酸分子的不同变体或等位基因或者待在本发明方法中降低其活性的变体或 等位基因

在另一实施方案中,本发明涉及试剂盒,其包含核酸分子、载体、宿 主细胞、多肽或反义、RNAi、snRNA、dsRNA、siRNA、miRNA、ta-siRNA、 共抑制分子或核酶分子或病毒核酸分子、抗体、植物细胞、植物或植物组 织、可收获部分、繁殖材料和/或根据本发明方法鉴定的化合物和/或激动剂。

本发明试剂盒中的化合物可包装在容器(例如小瓶)中,任选地与缓冲 液和/或溶液一起或者在缓冲液和/或溶液中。如果合适,所述组分的一种或 多种可以包装在一个和相同的容器中。作为补充或替代,可将一种或多种 所述组分吸附至固相支持体,例如硝酸纤维素滤膜、玻璃板、芯片或尼龙 膜或其微量滴定板的孔。该试剂盒可用于任何本文所述方法和实施方案, 例如用于产生宿主细胞、转基因植物、药物组合物;检测同源序列;鉴定 拮抗剂或激动剂;作为食品或饲料或其补充剂;或者作为处理植物的补充 剂等。

此外,该试剂盒可包含将该试剂盒用于任何所述实施方案的说明书。

在一个实施方案中,所述试剂盒还包含编码一种或多种所述蛋白质的 核酸分子,和/或抗体、载体、宿主细胞、反义核酸、植物细胞或植物组织 或植物。在另一实施方案中,所述试剂盒包含用于检测和区分待在本发明 方法中降低的核酸分子(例如本发明核酸分子)的PCR引物。

在另一实施方案中,本发明涉及用于产生农用组合物的方法,所述农 用组合物提供用于本发明方法的核酸分子,本发明的核酸分子,本发明的 载体,本发明的反义、RNAi、snRNA、dsRNA、siRNA、miRNA、ta-siRNA、 共抑制分子、核酶或抗体,本发明的病毒核酸分子或本发明的多肽;或者 包含用于鉴定所述化合物或激动剂的本发明方法的步骤;以及制备本发明 的核酸分子、载体或多肽;或者根据本发明方法鉴定或可用于本发明主题 的激动剂或化合物,它们均为可用作植物农用组合物的形式。

在另一实施方案中,本发明涉及用于产生植物培养组合物的方法,其 包括本发明方法的步骤,以及将所鉴定的化合物制备成可用作农用组合物 的形式。

“可用作农用组合物”应理解为这样的组合物符合规定杀真菌剂、植物 养分、除草剂等含量的法律。优选地,这样的组合物对所保护的植物和所 喂饲的动物(包括人)无任何害处。

在本申请中,参考了多篇出版物。这些出版物以及这些出版物中引用 的参考文献的公开内容作为参考整体并入本文,以更完整地描述本发明所 属领域的现状。

应该理解,上文涉及本发明的一些优选实施方案,可对其进行大量改 变和更改,而不偏离本发明的范围。还通过以下实施例展示本发明,它们 不应理解为以任何方式进行限制。相反,应该清楚地理解,本领域技术人 员在阅读本说明书后能提出多种其他实施方案、其修改和等同方案,而不 偏离本发明的构思和/或权利要求的范围。

参考实施例更详细地描述本发明:

一般性方法:

除非另外指明,否则所有化学物质均来自Fluka(Buchs)、Merck (Darmstadt)、Roth(Karlsruhe)、Serva(Heidelberg)和Sigma (Deisenhofen)。限制性酶、DNA修饰酶和分子生物学试剂盒来自 Amersham-Pharmacia(Freiburg)、BiometraRoche (Mannheim)、New England Biolabs(Schwalbach)、Novagen(Madison、 Wisconsin、USA)、Perkin Elmer(Weiterstadt)、Qiagen(Hilden)、Stratagen (Amsterdam,Netherlands)、Invitrogen(Karlsruhe)和Ambion (Cambridgeshire,United Kingdom)。试剂根据生产商的说明使用。

例如,可以使用亚磷酰胺法,以已知方式化学合成寡核苷酸(Voet,Voet, 第二版,Wiley Press New York,896-897页)。为本发明目的进行的克隆步骤 (例如限制性切割、琼脂糖凝胶电泳、DNA片段纯化、将核酸转移至纤维 素和尼龙膜、连接DNA片段、转化大肠杆菌细胞、细菌培养、噬菌体增 殖和重组DNA的序列分析)如Sambrook等(1989)Cold Spring Harbor Laboratory Press;ISBN 0-87969-309-6所述进行。按照Sanger(Sanger等 (1977)Proc Natl Acad Sci USA 74:5463-5467)的方法,使用ABI激光荧光 DNA测序仪对重组DNA分子进行测序。

植物培养

根据Scheible等(2004)进行拟南芥苗培养。对拟南芥种子(100-120个) 进行表面灭菌,并在完全黑暗下在5℃吸胀3天。转移种子并在30ml培 养基中,在定轨摇床上以恒定均匀的荧光(瓶中的光子通量密度约为50 μmol*m-2*s-1)和恒定的温度(22℃)无菌液体培养基中培养(250ml Erlenmeyer玻璃瓶)。无菌全营养培养基含有:2mM KNO3,1mM NH4NO3, 1mM Gln,3mM KH2PO4/K2HPO4pH 5.8,4mM CaCl2,1mM MgSO4,2 mM K2SO4,3mM 2-[N-吗啉代]乙磺酸(MES)pH 5.8(KOH),0.5%(w/v)蔗 糖,50mgl-1卡那霉素,40μM Na2FeEDTA,60μM H3BO3,14μM MnSO4, 1μM ZnSO4,0.6μM CuSO4,0.4μM NiCl2,0.3μM HMoO4,20nM CoCl2。 摇床速度在前3天为低速(30rpm),然后提高至80rpm。7天后通过在液 氮中速冻来收获苗。如下在土壤中培养拟南芥植物:将种子表面灭菌,并 在含有1/2浓度Murashige和Skoog盐(微量元素和大量元素,包括维生素)、 0.25mM 2-[N-吗啉代]乙磺酸(MES)pH 5.8(KOH)、50mg*l-1卡那霉素、 0.5%(w/v)蔗糖和0.8%(w/v)琼脂的培养基上无菌培养。将种子在完全黑 暗中在5℃吸胀3天,并以12小时光周期(光子通量密度150μmol*m-2*s-1, 22℃光照,18℃黑暗)培养。两周后,将植物转移至6cm直径盆中的土壤 里。对于充分营养条件,在盆中装入GS90土(组成:泥炭、粘土、椰子纤 维、2g/l盐、160mg/l N、190mg/lP2O5、230mg/l K2O,pH 6,由Werner Tantau GmbH&Co.KG,Germany提供)与蛭石(Gebrüder Patzer, Germany)的2∶1(v/v)混合物,并在短日照条件(8小时光照,16小时黑暗) 下以145μmol*m-2*s-1的光密度、60%的相对湿度、20℃(白天)和18℃(晚 上)的温度下进行培养。对于有限养分条件,将GS90土替换为GS90土与 ″Null-soil″(组成:泥炭、粘土、椰子纤维、0.8g/l盐、50mg/l N、80mg/l P2O5、80mg/lK2O,pH 6,由Werner Tantau GmbH&Co.KG供应)的1∶10 (v/v)混合物。在与充分营养条件相同的条件下培养植物。

对于表达分析以及种子产生和分析,将在高氮条件下在长日照(16小时 光照,8小时黑暗)下以145μmol*m-2*s-1的光密度和80%的相对湿度在 20℃(白天)和18℃(夜晚,50%相对湿度)的温度下培养植物。

与拟南芥苗培养相同地进行烟草苗的培养,但在8天后收获苗,并使 用不同类型的营养液。烟草全营养培养基含有:Murashige和Skoog盐(微 量元素及大量元素,包括维生素)、0.25mM 2-[N-吗啉代]乙磺酸(MES)pH 5.8(KOH)、50mg*l-1卡那霉素、0.5%(w/v)蔗糖。如下进行烟草植物培 养:将种子表面灭菌,并在含有Murashige和Skoog盐(微量元素和大量元 素,包括维生素)、0.25mM 2-[N-吗啉代]乙磺酸(MES)pH 5.8(KOH)、50 mg*l-1卡那霉素、0.5%(w/v)蔗糖和0.8%(w/v)琼脂的培养基上无菌培 养。

将种子在完全黑暗中在5℃吸胀3天,并以12小时光周期(光子通量密 度150μmol*m-2*s-1,22℃)培养。四周后,将植物转移至16小时光周期(光 子通量密度200μmol*m-2*s-1,25℃(光照)和20℃(黑暗)、60%相对湿度) 温室中的20cm直径盆中的土壤里,盆中装有GS90土与沙子的2∶1(v/v) 混合物。通过每天向每个盆中滴加100-250ml富肥料水(Hakaphos spezial (16%N,8%P,22%K,3%Mg),浓度为1g*l-1)对植物进行连续浇水。或 者在组织培养四周后将植物转移至12小时光周期(光子通量密度350μmol *m-2*s-1,23℃(光照)和20℃(黑暗)、60%相对湿度)温室中的16cm直径盆 中的石英砂上(0.3-0.8与0.6-1.2mm大小颗粒的1∶1混合物,Dorsolit)。每 天在光照约3小时后对盆浇水,向盆中加入营养液并允许其渗出,留下沙 粒之间存留的液体(田间持水量)。营养液含有:4mM KNO3,4mM Mg(NO3)2,3mM KH2PO4/K2HPO4pH 5.8,2mM MgSO4,1mM NaCl,40 μM Na2FeEDTA,90μM H3BO3,20μM MnSO4,1.5μM ZnSO4,0.9μM CHSO4,0.6μM NiCl2,0.45μM HMoO4,30nM CoCl2。

克隆操作和质粒构建

使用标准方法培养大肠杆菌菌株XL-1Blue和含有pGV2260的根癌农 杆菌菌株C58C1(Sambrock和Russel,2001)。使用标准方法,用测序引物 AgPRSv(GGA TCC AAT ATG TCG TCC AAT)和AgPRSh(GGA TCC TAC ATG ACA GCG)从质粒pJRAgprs1486中扩增野生型PRS,并从 pJRAgprs1404(突变体)中扩增突变体PRS。根据供应商提供的方案亚克隆 进pCR Script(Stratagene)中。通过序列分析来验证克隆。将编码全长蛋 白的965bp BamHI片段克隆进经BamHI限制性处理的双元载体pBinAR (和Willmitzer,1990)。通过SalI消化以及使用引物35Shv(TAT AGA GGA AGG GTC TTG CG)和AgPRSh进行的PCR分析来检查有义 方向的插入。最后通过序列分析来验证确定用于转化植物的质粒。

植物转化和表达分析

农杆菌介导的基因转移对于烟草植物像Rosahl等(1989)那样进行, 对于拟南芥则像Bent和Clough(1998)那样进行。使用全长野生型PRS作 为探针,像Giermann等那样(2002)通过Northern杂交来分析转基因的表 达。

代谢物分析

使用球磨机在液氮中将冷冻的植物材料磨碎。像等2005那 样提取并测量碳水化合物、氨基酸和核苷酸。根据Bligh和Dyer(1959)的 方法提取脂肪酸,使用十五烷酸作为内标,通过脂肪酸甲酯的GC来测量 含脂量(Benning和Somerville,1992)。

酶活性

使用球磨机在液氮中将冷冻的植物材料磨成粉末。通过以500至1000 μL提取缓冲液剧烈涡旋来提取10至20mg鲜重的等分试样。提取缓冲液 的组成为50mM KH2PO4/K2HPO4pH 7.5、10%(v/v)甘油、0.1%(v/v) Triton X-100、5mM MgCl2、1mM EDTA、1mM EGTA、1mM苯甲基 磺酰氟和5mM DTT。在4℃下将提取物以16,000*g离心10分钟。通过 将10μl酶提取物上清液与100至200μl测量缓冲液(KH2PO4/K2HPO4pH 7.5,5mM MgCl2,3.75mM核糖-5-磷酸,2mM ATP,3.75mM磷酸烯醇 式丙酮酸,0.2mM NADH,1.5U肌激酶,3U丙酮酸激酶,1.5U乳酸脱氢酶) 混合而在微孔板中进行测量。使用染料结合测定法来测定上清液中的可溶 蛋白含量(Bradford,1976)。

实施例1:

为了将野生型PRS基因(PRS)和突变体PRS基因(PRSM;Leu133Ile, His196Glu)从棉阿舒囊霉克隆进植物表达载体中,将全长cDNA序列用于 以寡核苷酸引物AgPRSv和AgPRSh进行的PCR反应中。

序列引物AgPRSv:5‘-5’-GGA TCC AAT ATG TCG TCC AAT-3’ (SEQ ID NO 5)

序列引物AgPRSh:5‘-5’-GGA TCC TAC ATG ACA GCG-3’(SEQ ID NO 6)

PCR反应物的组成(50μl):

5.00μl 10ng质粒DNA

5.00μl 10×缓冲液(Pfu聚合酶)

5.00μl 2mM dNTP

1.25μl 每种引物(10pmol/μL)

0.50μl Pfu聚合酶。

所用的Pfu聚合酶来自Stratagene。

PCR程序:

95℃初始变性2分钟,接着是95℃45秒、55℃45秒和72℃2分钟的 35个循环。最后在72℃延伸5分钟。

根据生产商的说明,将PCR产物克隆进pCR Script(Stratagene),产 生载体pCR-PRS和pCR-PRPM,并通过测序来验证序列。

向农杆菌转化载体pBIN中的克隆包括将0.5μg载体pCR-PRS和 pCR-PRSM与限制性酶BamHI(New England Biolabs)孵育2小时并通过 凝胶电泳分离DNA片段。从凝胶上切下PRS序列相应的971bp片段,根 据生产商的说明用来自Qiagen的“凝胶纯化”试剂盒进行纯化,并用50μl 洗脱缓冲液洗脱。首先用限制性酶BamHI将0.1μg载体pBIN19消化1 小时,接着使用凝胶电泳进行分离,根据生产商的说明用来自Qiagen的“凝 胶纯化”试剂盒进行纯化,并用50μl洗脱缓冲液洗脱。接着将相应的DNA 片段克隆进双元载体pBIN中35S终止子和核酮糖二磷酸羧化酶小亚基的 质体信号序列之后。接着在每种情况下将10μl PRS片段的洗脱液与10ng 经处理的pBIN19载体在16℃下连接过夜(T4连接酶,New England Biolabs)。接着根据生产商的说明将连接产物转化进TOP10细胞 (Stratagene)并适当地进行选择,产生载体pBIN-PRS和pBIN-PRSM。通 过测序和使用引物AgPRSv和AgPRSh进行的PCR来验证阳性克隆。

实施例2:用于转化植物的质粒

可以使用双元载体如pBIN19来转化植物(和Willmitzer(1990) Plant Science 66:221-230)。可以通过将cDNA以有义和反义方向连接进 T-DNA中来构建双元载体。cDNA 5’的植物启动子激活该cDNA转录。多 腺苷酸化序列位于cDNA的3’。

可以使用组织特异性启动子来实现组织特异性表达。例如,可通过将 油菜籽蛋白或LeB4或USP启动子克隆进cDNA的5’来实现种子特异性表 达。还可以使用任何其他种子特异性启动子元件。CaMV 35S启动子可用 于在整个植物中实现组成型表达。

基因产物(蛋白质)的亚细胞定位由蛋白质序列末端或内部的多种氨基 酸序列基序来决定。因此,例如,通过将PRS基因序列克隆到编码质体信 号序列的核酮糖1,5-二磷酸羧化酶大亚基的5’区域之后来实现PRS合酶的 质体定位。

双元载体的另一实例是载体pSUN-USP和pGPTV-油菜籽蛋白。载体 pSUN-USP含有USP启动子和OCS终止子。载体pGPTV-油菜籽蛋白含 有油菜籽蛋白启动子的截短形式以及NOS终止子。

将实施例1的片段克隆进载体pBIN19中35S启动子和核酮糖1,5-二 磷酸羧化酶质体信号肽序列之后的多克隆位点中,以使得可能进行种子特 异性表达PRS基因和基因产物的质体定位。

实施例3:转化农杆菌

农杆菌介导的植物转化可例如通过根癌农杆菌菌株GV3101(pMP90) (Koncz和Schell(1986)Mol Gen Genet 204:383-396)或LBA4404 (Clontech)来进行。可使用标准转化技术来进行转化(Deblaere等(1984) Nucl Acids Res 13:4777-4788)。

实施例4:转化植物

可以使用标准转化和再生技术来实现农杆菌介导的植物转化(Gelvin, Stanton B.,Schilperoort,Robert A.,Plant Molecular Biology Manual,第 二版,Dordrecht:Kluwer Academic Publ.,1995,in Sect.,Ringbuch Zentrale Signatur:BT11-P ISBN 0-7923-2731-4;Glick,Bernard R., Thompson,John E.,Methods in Plant Molecular Biology and Biotechnology,Boca Raton:CRC Press,1993,360页,ISBN 0-8493-5164-2)。

通过Bechthold等,1993(C.R.Acad.Sci.Ser.III Sci.Vie.,316, 1194-1199)的方法通过农杆菌来转化拟南芥。

例如,可通过子叶或下胚轴转化来转化油菜(Moloney等(1989)Plant Cell Report 8:238-242;De Block等(1989)Plant Physiol 91:694-701)。用于 农杆菌和植物选择的抗生素的使用取决于用于转化的双元载体和农杆菌菌 株。一般使用卡那霉素作为植物选择标记来进行油菜籽的选择。

可使用如Mlynarova等,(1994)Plant Cell Report 13:282-285所述技术 通过农杆菌介导基因转移进亚麻中。

此外,可以使用如EP-A-00424047(Pioneer Hi-Bred International)或 EP-A-00397687、US 5,376,543、US 5,169,770(University of Toledo)所述 的技术来转化大豆。

使用微粒轰击、聚乙二醇介导的DNA摄取或通过碳化硅纤维技术进 行的植物转化描述于例如Freeling和Walbot“The Maize Handbook” (1993)ISBN 3-540-97826-7,Springer Verlag New York)。

实施例5:研究重组基因产物在转化生物中的表达

用于测定基因转录水平(代表可用于翻译基因产物的RNA量)的合适方 法是如下文所述进行Northern印迹(参阅如Ausubel等(1988)Current Protocols in Molecular Biology,Wiley:New York,或以上实施例部分),其 中将设计成与目的基因结合的引物用可检测标记(通常为放射性标记或化 学发光标记)进行标记,从而在生物培养物的总RNA被提取、在凝胶上分 离、转移至稳定基质并与此探针孵育后,该探针的结合和结合程度指示该 基因mRNA的存在和量。该信息表明了转化基因的转录程度。可以使用多 种方法从细胞、组织或器官中制备细胞总RNA,这些方法都是本领域技术 人员已知的,例如Bormann,E.R.,等(1992)Mol.Microbiol.6:317-326的 方法。

Northern杂交:

为进行RNA杂交,使用甲醛并按照Amasino(1986,Anal.Biochem. 152,304)所述方法,在1.25%浓度琼脂糖凝胶中通过凝胶电泳分离20μg 总RNA或1μg poly(A)+RNA,使用10×SSC通过毛细作用力转移至带正 电的尼龙膜(Hybond N+,Amersham,Brunswick),通过UV光固定并使用 杂交缓冲液(10%硫酸葡聚糖w/v,1M NaCl,1%SDS,100mg鲱精DNA) 在68℃下预杂交3小时。在预杂交步骤中使用α-32p-dCTP用Highprime DNA标记试剂盒(Roche,Mannheim,Germany)来标记DNA探针。在相同 缓冲液中加入经标记的DNA探针后在68℃进行杂交过夜。在68℃下,使 用2×SSC将洗涤步骤以15分钟进行两次,并用1×SSC、1%SDS以30分 钟进行两次。将密封的滤膜在-70℃下曝光1至14天。

为了研究由此mRNA翻译的蛋白质的存在和相对量,可以使用标准技 术,如Western印迹(参阅如Ausubel等(1988)Current Protocols in Molecular Biology,Wiley:New York)。在此方法中,提取细胞总蛋白,通 过凝胶电泳分离,转移至基质(如硝酸纤维素)并与探针(如特异性结合期望 蛋白的抗体)孵育。这种探针一般具有可容易地进行检测的化学发光或比色 标记。所观察到的标记存在情况和量表明了细胞中存在的期望突变蛋白的 存在情况和量。

实施例6:分析重组蛋白对期望产物之产生的影响

遗传修饰在植物、真菌、藻类、纤毛虫的影响或者对期望化合物(如脂 肪酸)产生的影响可通过以下来测定:在合适的条件下(如上文所述)培养修 饰的微生物或修饰的植物,并对培养基和/或细胞组分检查期望产物(即, 脂类或脂肪酸)生产的提高。这些分析技术为本领域技术人员已知,包括光 谱法、薄层层析、多种染色方法、酶和微生物方法以及分析型层析,例如 高效液相层析(参阅如Ullmann,Encyclopedia of Industrial Chemistry,vol. A2,89-90页和443-613页,VCH:Weinheim(1985);Fallon A等(1987) “Applications of HPLC in Biochemistry”in:Laboratory Techniques in Biochemistry and Molecular Biology,vol.17;Rehm等(1993) Biotechnology,vol.3,chapter III:“Product recovery and purification”, 469-714页,VCH:Weinheim;Belter PA等(1988)Bioseparations: downstream processing for Biotechnology,John Wiley and Sons;Kennedy J.F.和Cabral J.M.S.(1992)Recovery processes for biological Materials, John Wiley and Sons;Shaeiwitz J.A.和Henry J.D.(1988)Biochemical Separations,Ullmann’s Encyclopedia of Industrial Chemistry,vol.B3; chapter 11,1-27页,VCH:Weinheim;以及Dechow,F.J.(1989) Separation and purification techniques in biotechnology,Noyes Publications)。

除了上述方法以外,如Cahoon等(1999)Proc.Natl.Acad.Sci.USA 96 (22):12935-12940和Browse等(1986)Analytic Biochemistry 152:141-145 所述从植物材料中提取植物脂类。定性和定量的脂类或脂肪酸分析描述于 Christie,William W.,Advances in Lipid Methodology,Ayr/Scotland:Oily Press(Oily Press Lipid Library;2);Christie,William W.,Gas Chromatography and Lipids.A Practical Guide-Ayr,Scotland:Oily Press, 1989,Repr.1992,IX,307pp.(Oily Press Lipid Library;1);“Progress in Lipid Research,Oxford:Pergamon Press,1(1952)-16(1977)题目为: Progress in the Chemistry of Fats and Other Lipids CODEN。

除了测量发酵的终产物以外,还可以分析用于产生期望化合物的代谢 途径中的其他组分,例如中间产物和次级产物,以测定化合物产生的总体 效率。分析方法包括测量培养基中的养分量(例如糖、碳水化合物、氮源、 磷酸盐和其他离子),测量生物量的组成和生长,分析生物合成途径中常规 代谢物的产生,以及测量发酵中产生的气体。用于这些测量的标准方法描 述于Applied Microbial Physiology;A Practical Approach,P.M.Rhodes 以及P.F.Stanbury编辑,IRL Press,103-129;131-163和165-192页(ISBN: 0199635773)及其引用的参考文献。

一个实例是脂肪酸分析(缩写:FAME,脂肪酸甲酯;GC-MS,气-液 层析/质谱法;TAG,三酰甘油;TLC,薄层层析)。

可以通过分析型标准方法:GC、GC-MS或TLC,通过分析重组生物 来获得脂肪酸产物存在的模糊证据,如广泛描述于Christie及其引用的参 考文献(1997,Advances on Lipid Methodology,第四版:Christie,Oily Press,Dundee,119-169;1998, Gaschromatographie-Massenspektrometrie-Verfahren[气相层析/质谱法], Lipide 33:343-353)。

可以通过超声处理、在玻璃研磨机中研磨、液氮和碾磨或其他可用方 法来破碎待分析的材料。破碎后,材料必须离心。将沉淀重悬于蒸馏水, 在100℃加热10分钟,在冰上冷却并再次离心,其后以甲醇中的0.5M硫 酸(含有2%二甲氧基丙烷)在90℃提取1小时,得到水解的油和脂类化合 物,其产生转甲基脂类。在石油醚中提取这些脂肪酸甲酯,最后使用毛细 柱(Chrompack,WCOT Fused Silica,CP-Wax-52CB,25mm,0.32mm)在 170℃到240℃的温度梯度下进行GC分析20分钟并在240℃下分析5分钟。 必须使用可从商业来源(即Sigma)获得的标准品来定义所得脂肪酸甲酯的 身份。

使用以下方案对转化有PRS基因的拟南芥植物进行定量油分析:

通过Bligh&Dyer(1959)Can J Biochem Physiol 37:911的方法从种子 中提取脂类。为此,数出10个拟南芥种子到1.2ml Qiagen微型管中(Qiagen, Hilden)。

接着在来自Retsch(Haan)的MM300Retsch研磨机中将种子材料匀浆 用于以500μl氯仿/甲醇(2∶1;含有来自Sigma的单C17-甘油作为内标) 进行提取,并在室温下孵育20分钟。在添加500μl 50mM磷酸缓冲液 pH 7.5后进行相分离。将有机相浓缩至干,为了脂肪酸的转甲基作用,加 入2ml硫酸甲醇(1N)和2%(v/v)二甲氧基丙烷,并将混合物在80℃孵育30 分钟。接着向冷却的样品中加入2×2ml己烷,涡旋样品。在新试管中合并 目的上层有机相,并用2ml 100mM碳酸氢钠溶液和2ml蒸馏水纯化一次。 在氩气中将所得上层有机相浓缩至干,将以此方式获得的脂肪酸甲酯溶于 确定体积的己烷中。

最后在毛细柱(Chrompack,WCOT Fused Silica,CP-Wax-52CB,25 m,0.32mm)上通过气相层析(HP 6890,Agilent Technologies)分离2μl脂肪 酸甲酯,并使用火焰电离检测器进行分析。通过将所衍生脂肪酸的信号强 度与内标的进行比较来对油进行定量。接着通过总脂肪酸与种子重量或种 子的关系来确定各自的含油量。

图1以示例性方式显示了对分别转化有表达构建体pBIN19-PRSM和 pBIN-PRS的4个独立转基因拟南芥株系(Mp2、Mp12、Mp14和Mp15, 也称为Pp11、Pp13、Pp15和Pp19)的T3种子的含油量进行定量测定(基 于种子重量)。还列出了对照植物V72和V75的种子重量。

从每个株系中使用3株植物,在每个情况下使用10个种子进行3次独 立的提取,并独立测量提取物。对这三次独立测量计算平均值和标准差。 基于种子重量,两个对照植物V7-2和V7-5的含脂量分别为21和23%。 转化有构建体pBIN-PRS并表达野生型PRS序列的株系Pp中的含脂量为 28至33%。这对应于转基因株系中含油量提高28至52%。转化有构建体 pBIN-PRSM并表达PRS突变序列的Mp株系中的含脂量为38至50%。 这对应于该转基因株系中含油量提高75至132%。

图2以示例性方式显示了对分别转化有表达构建体pBIN19-PRSM和 pBIN-PRS的4个独立转基因拟南芥株系(Mp2、Mp12、Mp14和Mp15, 也称为Pp11、Pp13、Pp15和Pp19)的T3种子的含油量进行定量测定(基 于种子)。还列出了对照植物V72和V75的种子重量。在两个对照植物V7-2 和V7-5中,液体含量(基于种子)分别为3.5和4.1μg。转化有构建体 pBIN-PRS并表达野生型PRS序列的株系Pp中的含脂量为4.6至5.2μg。 这对应于转基因株系中含油量提高20至38%。转化有构建体pBIN-PRSM 并表达PRS突变序列的Mp株系中的含脂量为5.7至6.6μg。这对应于该 转基因株系中含油量提高50至74%。

结果清楚地显示,磷酸核糖焦磷酸合酶的过表达导致含油量显著提高。 通过过表达不再受到ADP别构抑制的突变磷酸核糖焦磷酸合酶实现了进 一步提高。

实施例7:测定种子重量

为了测定种子重量,从每个转基因株系或对照株系的各3株植物中收 集3×100个种子,并计算结果的平均值。

图3显示了测定分别转化有表达构建体pBIN19-PRSM和pBIN-PRS 的转基因株系Mp2、Mp12、Mp14和Mp15和转基因株系Pp11、Pp13、 Pp15和Pp19的T3种子重量的结果。还列出了对照植物V72和V75的种 子重量。

实施例8:拟南芥苗的生长分析

为了分析拟南芥苗的生长,在恒定光照(150μE)下将T4苗在液体培养 基(2mM KNO3,1mM NH4NO3,3mM K2HPO4,4mM CaCl2,1mM MgSO4,2mM K2SO4,3mM MES,微量元素,0.5蔗糖,1mM谷氨酰胺,10 mg/l卡那霉素)中培养8天。接着通过称重来测定鲜重。总共分析对照植物 及4种转基因株系(过表达野生型及无质体靶向的突变PRS)中每一种的各3 个培养物与各100个苗。

图4显示了生长分析的结果。生长培养8天后,对照苗的平均鲜重为 2.5mg。相反,转基因植物的鲜重分别为2.8mg(PRS)和3.6mg(PRSM)。 这分别对应于为12%(PRS)和41%的鲜重提高。

实施例9:产生和选择表达棉阿舒囊霉磷酸核糖焦磷酸合酶基因(PRS) 的转基因植物

使用真菌来源的两种不同PRS基因在植物中进行表达。一种编码棉阿 舒囊霉ATCC10895(AGR371Cp)的野生型PRSI类活性,另一种代表突变 体形式。突变体变体带有三个点突变,导致亮氨酸133改变成异亮氨酸, 组氨酸196改变成谷氨酰胺。

因此,这一棉阿舒囊霉PRS蛋白的突变体形式类似于PRS II类活性 蛋白。选择棉阿舒囊霉PRS基因是因为可以获得与植物基因高度异源的两 种变体基因。用于转化烟草或拟南芥植物的所有构建体均使用双元载体 pBinAR(和Willmitzer,1990)来制备,它是pBin19载体的衍生物, 含有用于靶基因组成型表达的花椰菜花叶病毒35S启动子和章鱼碱合酶多 聚腺苷酸化信号。在含有50mg*l-1卡那霉素的选择培养基上培养原代转 化体(T1)。将卡那霉素抗性小植物转移至土壤并在标准培养条件下在培养 室中培养。就每次转化而言,再生约30株在选择过程中存活的植物并进一 步进行分析。在转移后3至5周在这些植物的叶中分析转基因表达(图5)。 收集种子,再在培养基上培养T2后代。当约四分之一的后代无法在选择 过程中存活时选择T2代的抗性植物。将这些植物在土壤中转移至培养室 中,并在最佳条件下进一步培养并收获种子(T3)。再将T3种子置于选择板 上,以鉴定所有植物均为卡那霉素抗性并可认为对至少一个T-DNA功能 性插入是纯合子的种子组。所有实验均使用通过此选择过程的T3或T4代 种子来进行。每个实验选择来源于不同个体原代转化体的的3至4个株系。 所有实验均与在转化空载体后通过相同选择标准的对照植物一起进行。

图5:棉阿舒囊霉PRS基因在拟南芥和烟草转化体的叶中的表达。

在选择培养基上培养植物,将抗性小植物转移至土壤中并在标准培养 条件下培养。在转移3至5周后使用编码PRS的全长cDNA作为杂交探针 来分析这些植物的叶中稳态PRS mRNA水平。AtP:以表达棉阿舒囊霉野 生型PRS基因的构建体转化的拟南芥;NtP:以表达棉阿舒囊霉野生型PRS 基因的构建体转化的烟草;AtM:以表达棉阿舒囊霉突变体形式PRS基因 的构建体转化的拟南芥;NtM:以表达棉阿舒囊霉突变体形式PRS基因的 构建体转化的烟草;数字表示各个原代转化体的身份;星号表示进一步选 择的株系;C:以空载体转化的对照植物。

实施例10:PRS表达导致可提取的PRS活性显著提高

通过使用标准化的酶联分光光度测定法测定PRS活性而证实了PRS 基因的表达导致酶活性提高。

在拟南芥和烟草苗的可溶性蛋白提取物中测定总PRS活性,所述苗在 各自生长培养基中培养7或8天后在液体培养基中培养(图6)。基于植物鲜 重,以各自对照转化体的百分比来计算所有数据(烟草,2.17±0.31μmol* min-1*(g鲜重)-1;拟南芥,2.83±0.14μmol*min-1*(g鲜重)-1。

结果显示,野生型PRS基因的表达将PRS活性在拟南芥中显著提高 1.2-1.4倍,在烟草中提高1.4-1.6倍。

突变PRS基因的表达将PRS活性在拟南芥中提高1.3倍,在烟草中提 高1.4倍。除了ATM-2以外,所有值均在所分析的各个种子批次之间显示 强的差异,并且显著高于各自的对照转化体。

图6:拟南芥和烟草苗中的PRS活性

将植物在各自的生长培养基中在液体苗培养基中培养7或8天。以T4 代植物进行实验。数值为来源于不同于个体原代转化体的3至4个株系的 平均值±标准差。数据以各自对照转化体的百分比给出,烟草为2.17±0.31 μmol*min-1*(g鲜重)-1,拟南芥为2.83±0.14μmol*min-1*(g鲜重)-1。 使用非配对双尾t检验。以星号标出显著差异值(P<0.05)。

(a)拟南芥的PRS活性。AtP:表达野生型PRS基因的拟南芥;AtM: 表达突变体形式PRS基因的拟南芥;数字表示各个原代转化体的身份。

(b)烟草的PRS活性。NtP:表达野生型PRS基因的烟草;NtM:表 达突变体形式PRS基因的烟草;数字表示各个原代转化体的身份。

实施例11:代谢物分析揭示了蔗糖含量与生物量累积之间的负相关性

分析苗提取物的碳水化合物、核苷酸及氨基酸的含量和组成。代谢物 水平总是基于鲜重(以分析浓度差异)和总苗重(以描述生产力)二者来计算。

可以发现个体糖水平的显著差异。己糖浓度在拟南芥或烟草苗中提高。

由于在液体培养基中培养后具有额外PRS活性的苗的鲜重累积提高, 因此在拟南芥或烟草苗中存在更高的总碳水化合物量(基于苗)(数据未显 示)。

细胞分裂和生长所需的其他重要前体是核苷酸和氨基酸。因此,测定 拟南芥及烟草苗培养物中的这些中间体。仅显示了拟南芥苗的数据(图7), 因为仅在此品种中可观察到与PRS活性提高相关的显著改变,而多数烟草 苗显示出可比较但不显著的倾向。

核苷酸浓度分析显示,PRS活性提高的拟南芥苗中UDP-葡萄糖(图7a) 和游离核苷酸(图7b)提高,但仅有一些UDP-葡萄糖的值与对照存在显著 差异。

此外,在一些拟南芥苗中,ATP/ADP比值显著提高(图7c),而该比值 在PRS活性提高的烟草苗中是下降的(数据未显示)。

这些结果提示,总体核苷酸库的提高不是过表达PRS之植物生长速率 提高的主要原因。

总氨基酸浓度的分析显示了拟南芥苗的增加,其与PRS活性提高良好 相关(图7d),但仅有一些值与对照存在显著差异。更详细的氨基酸组成分 析显示了拟南芥和烟草苗中相同的行为,但仅有一些来自拟南芥的结果导 致显著改变。尽管氨基酸总量在所有PRS活性提高的苗中均提高,但次要 氨基酸的比例降低了(图7e)。

其他改变包括PRS活性提高的拟南芥苗中主要氨基酸丝氨酸和甘氨 酸的提高(数据未显示)以及支链氨基酸(BCAA)比例的相关降低(图7f)。在 这一点上,推测特定氨基酸种类相对于总氨基酸库之比例的改变是由于在 各个氨基酸生物合成途径中的协同调控。

图7:拟南芥苗的代谢物分析。

如图2所述将植物在液体苗培养物中培养7天。数值以3至4次重复 的平均值和标准误给出。使用非配对双尾t检验。以红色星号标记显著差 异(P<0.05)。进行线性相关性分析,并给出各自的相关系数。总核苷酸: AMP,ADP,UDP,GDP,UTP,ATP和GTP。总氨基酸:除脯氨酸和半胱氨 酸以外的所有L-α-氨基酸,包括β-丙氨酸、γ-氨基丁酸、瓜氨酸和鸟氨酸。 次要氨基酸:精氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、 苯丙氨酸、色氨酸、酪氨酸和缬氨酸。BCAA:分支氨基酸:异亮氨酸、 亮氨酸和缬氨酸。

(a)-(c)PRS活性与核苷酸累积之间的关系。灰色:表达野生型PRS 基因的拟南芥;黑色:表达突变体形式的拟南芥;黑色方形:空载体对照。

(d)-(f)PRS活性与氨基酸累积之间的关系。灰色:表达野生型PRS 基因的拟南芥;黑色:表达突变体形式的拟南芥;黑色方形:空载体对照。

实施例12:在不同的标准化培养条件下更高的生物量累积也是明显的

PRS活性提高使在液体培养基中在优化条件下的拟南芥和烟草苗的生 长提高(图8)。

图8:PRS活性与鲜重累积之间的相关性。

在图6所述的各个生长培养基中在液体苗培养中将植物培养7或8天。 数值为来源于不同于个体原代转化体的3至4个株系的平均值±标准误。数 据以相应对照转化体的百分比给出,烟草为49.6±9.03mg*苗-1,拟南芥 为2.7±0.48mg*苗-1。使用非配对双尾t检验。除AtP-9以外的所有鲜重 值均与对照存在显著差异(P<0.05)。进行线性相关性分析并给出各自的相 关系数。

(a)PRS活性与拟南芥鲜重累积之间的关系。灰色:表达野生型PRS 基因的拟南芥;黑色:表达突变体形式的拟南芥;黑色方形:空载体对照。

(b)PRS活性与烟草鲜重累积之间的关系。灰色:表达野生型PRS基 因的拟南芥;黑色:表达突变体形式的拟南芥;黑色方形:空载体对照。

进行了进一步实验来研究在更自然且优化程度较低的条件下培养的拟 南芥和烟草中是否也存在生长增强。

在培养室中用两种不同营养方案在土壤上培养拟南芥植物,烟草植物 在培养室中在中等光强度下以营养液灌溉的石英砂上培养,或者在温室里 在低光强度的土壤中培养。拟南芥(图9)或烟草(图10)中PRS基因的表达 和突变体形式的表达导致所有测试的培养条件下的生长提高。在高和低营 养可用度下,表达PRS基因的拟南芥植物与各自对照相比显示出更大的花 结直径(数据未显示)和更高的花结鲜重(图9),而叶数未改变(数据未显示)。 表达PRS基因的烟草植物还显示出基于鲜重和干重的生物量累积提高(图 10)和叶面积增加(数据未显示)。独立地分析了根和嫩枝的鲜重累积,但未 发现根与嫩枝比值的显著改变(数据未显示)。这也表明了两种器官中生长 平行地提高。在任何所分析的生长条件下,随机化的表达PRS基因的烟草 植物均由于其植物高度提高而可容易地与对照转化体区分。总之,所有这 些方法均显示,提高的PRS活性在多种生长条件下提高植物的生物量累 积。

图9拟南芥植物的生长分析。

如所示在不同条件下培养植物。以T4代植物进行实验。数值为三个 生物学重复(各6至12个样品)的平均值±标准误。使用非配对双尾t检验。 以星号标出显著差异的值(P<0.05)。AtP:表达野生型PRS基因的拟南 芥;AtM:表达突变体形式PRS基因的拟南芥;数字表示各个原代转化体 的身份。

(a)以充足营养培养的拟南芥植物的花结鲜重。在8小时日照145μE、 20℃、60%相对湿度和16小时黑暗18℃的培养室中,在装有含高养分浓 度之基质的6cm直径盆中培养植物。在转移至土壤5周后收获植物。

(b)以有限营养培养的拟南芥植物的花结鲜重。将植物在与(a)植物相同 的生长条件下平行培养,但基质混合物含有实验方法中所述的低养分浓度。 在转移至土壤5周后收获植物。

图10:烟草植物的生长分析。

以T4代植物进行实验。数值为三个生物重复(各4个样品)的平均值± 标准误。使用非配对双尾t检验。以星号标出显著差异的值(P<0.05)。 NtP:表达野生型PRS基因的烟草;NtM:表达突变体形式PRS基因的烟 草;数字表示各个原代转化体的身份。

(a)鲜重提高。在12小时日照350μE(23℃)和12小时黑暗(20℃)和60 %相对湿度的培养室中,在16cm直径盆中在石英砂培养基中培养植物, 并每天以营养液灌溉。在转移至沙培养基后3和4周收获植物,从这些测 量中计算每天的生长率。

(b)如(a)中所述培养的烟草植物的干重提高。

(c)烟草植物的高度。在16小时日照200μE(25℃)和8小时黑暗(20℃) 和60%相对湿度的温室中,在装有土壤的20cm直径盆中培养植物。在转 移至土壤上5周后测量植物。

实施例13

通过过表达磷酸核糖焦磷酸合酶来改造出具有提高的生物量生产的苜 蓿植物

使用现有方法(例如McKersie等,Plant Physiol 119,839(1999))转化苜 蓿(Medicago sativa)的再生克隆。苜蓿的再生和转化是基因型依赖性的,因 此需要再生植物。获得再生植物的方法已有描述。例如,它们可选自 Rangelander栽培种(Agriculture Canada)或者Brown D.C.W.和Atanassov A.(Plant Cell Tissue Organ Culture 4,111(1985))描述的任何商品苜蓿品 种。或者,选择RA3品种(University of Wisconsin)用于组织培养(Walker 等,Am.J.Bot.65,654(1978))。

将叶柄外植体与含有双元载体的根癌农杆菌C58C1pMP90 (McKersie等,Plant Physiol 119,839(1999))或LBA4404的过夜培养物共培 养。已经描述了用于植物转化的许多不同的双元载体系统(例如An G., Agrobacterium Protocols,Methods in Molecular Biology,Vol 44,47-62页, Gartland K.M.A.和Davey M.R编辑.Humana Press,Totowa,New Jersey)。许多都是基于Bevan(Nucleic Acid Research.12,8711(1984))所述 的载体pBIN19,其包括侧翼为根癌农杆菌Ti质粒的左边界和右边界序列 的植物基因表达盒。植物基因表达盒由至少两个基因组成——选择标记基 因和调节性状基因的cDNA或基因组DNA转录的植物启动子。可以使用 多种选择标记基因,包括编码突变的乙酰羟酸合酶(AHAS)的拟南芥基因 (美国专利5,7673,666和6,225,105)。类似地,可以使用多种启动子来调节 性状基因,以提供基因转录的组成型、发育、组织或环境型调节。在本实 施例中,使用34S启动子(GenBank登记号M59930和X16673)来提供性状 基因的组成型表达。

在含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/L K2SO4和100 μm乙酰丁香酮的SH诱导培养基上在黑暗中将外植体共培养3天。以半强 度的Murashige-Skoog培养基(Murashige和Skoog,1962)洗涤外植体,并 平板接种到相同的SH诱导培养基上,但其中不含乙酰丁香酮,而是含有 合适的选择剂和合适的抗生素以抑制农杆菌生长。几周后,将体细胞胚转 移至无生长调节剂、无抗生素并含有50g/L蔗糖的BOi2Y发育培养基。 其后使体细胞胚在半强度的Murashige-Skoog培养基上萌发。将生根的苗 移植到盆中并在温室中培养。

如上述产生T1或T2代植物并分析。

实施例14

通过过表达磷酸核糖焦磷酸合酶来改造出具有提高的生物量生产的黑 麦草植物。

可将来自若干不同黑麦草品种的种子作为外植体来源用于转化,包括 商品品种Gunne(可得自Weibull种子公司)或者Affinity品种。将种 子依次用1%Tween-20表面灭菌1分钟,以100%漂白剂表面灭菌60分钟, 用去离子水和蒸馏水漂洗3次(每次5分钟),接着在黑暗中在湿润的无菌 滤纸上萌发3-4天。将苗再用1%Tween-20灭菌1分钟,以75%漂白剂灭 菌5分钟,并用双蒸水漂洗3次,每次5分钟。

将经表面灭菌的种子置于含有Murashige和Skoog基础盐和维生素、 20g/L蔗糖、150mg/L天冬酰胺、500mg/L酪蛋白水解物、3g/L Phytagel、 10mg/L BAP和5mg/二氯甲氧苯酸的愈伤组织诱导培养基上。将平板在 黑暗中以25℃孵育4天以进行种子萌发和胚胎发生愈伤组织诱导。

在愈伤组织诱导培养基上4周后,剪去苗的嫩枝和根,将愈伤组织转 移至新鲜培养基,再培养4周,接着转移至MSO培养基在光照下培养2 周。将一些愈伤组织片(11-17周龄)通过10目筛并置于愈伤组织诱导培养 基上,或者在250ml瓶中的100ml液体黑麦草愈伤组织诱导培养基(与用 琼脂诱导愈伤组织的培养基相同)中培养。将瓶用箔裹住,并在黑暗中在 23℃下以175rpm摇动1周。用40目筛将液体培养基过筛来收集细胞。将 筛上收集的级分置于固体黑麦草愈伤组织诱导培养基并在黑暗中以25℃ 培养1周。接着将愈伤组织转移至含有1%蔗糖的MS培养基并培养2周。

转化可通过农杆菌或微粒轰击法来实现。产生在pUC载体中含有组成 型植物启动子和基因cDNA的表达载体。使用Qiagen试剂盒,根据生产 商的说明从大肠杆菌细胞中制备质粒DNA。将约2g胚胎发生愈伤组织涂 在培养皿中无菌滤纸的中心。在滤纸上添加含有10g/L蔗糖的液体MSO 等分试样。根据Sanford等,1993的方法用质粒DNA包裹金微粒(大小为 1.0μm),并使用以下参数递送至胚胎发生愈伤组织:每次轰击500μg微 粒和2μg DNA,1300psi,挡板到愈伤组织平板的距离为8.5cm,每个愈 伤组织轰击1次。

轰击后,将愈伤组织转移回新鲜的愈伤组织发育培养基中,并在室温 下在黑暗中维持1周时间。接着将愈伤组织转移至25℃下光照的生长条件, 以用合适的选择剂(例如250nM Arsenal、5mg/L PPT或50mg/L卡那霉 素)起始胚分化。出现了对选择剂有抗性的嫩枝,一旦枯萎就转移至土壤中。

通过PCR分析原代转基因植物(T0)的样品,以证实T-DNA的存在。 通过Southern杂交证实这些结果,其中将DNA在1%琼脂糖凝胶上电泳 并转移至带正电的尼龙膜(Roche Diagnostics)。使用PCR DIG Probe Synthesis Kit(Roche Diagnostics),通过PCR制备以洋地黄毒苷标记的探 针,并如生产商的推荐来使用。

通过剪下分蘖对转基因T0黑麦草植物进行无性繁殖。将移植的分蘖 在温室中维持2个月,直至已良好建立。除下嫩枝并培养2周。

如所述产生并分析T1或T2代植物。

实施例15

通过过表达磷酸核糖焦磷酸合酶来改造出具有提高的生物量生产的大 豆植物

根据对Texas A&M专利US 5,164,310所述方法的以下修改来转化大 豆。一些商品大豆品种适于通过该方法进行转化。通常使用栽培种Jack(可 得自Illinois Seed Foundation)进行转化。通过将种子浸入70%(v/v)乙醇6 分钟和补充有0.1%(v/v)Tween的25%商业漂白剂(NaOCl)20分钟而进行 消毒,然后用无菌双蒸水漂洗4次。通过从每个苗上除去胚根、下胚轴和 一个子叶来繁殖7日龄的苗。接着,将带有一个子叶的上胚轴转移至培养 皿中新鲜的萌发培养基,并在16小时光周期(约100μmol/m2s)下以25℃孵 育3周。从3-4周龄植物上剪下叶腋节(约4mm长)。切下叶腋节并在农杆 菌LBA4404培养基中孵育。

已经描述了用于植物转化的许多不同的双元载体系统(例如An G., Agrobacterium Protocols.Methods in Molecular Biology Vol.44,47-62页, Gartland K.M.A.和Davey M.R.编辑.Humana Press,Totowa,New Jersey)。许多都是基于Bevan(Nucleic Acid Research.12,8711(1984))所述 的载体pBIN19,其包括侧翼为根癌农杆菌Ti质粒的左边界和右边界序列 的植物基因表达盒。植物基因表达盒由至少两个基因组成——选择标记基 因和调节性状基因cDNA或基因组DNA转录的植物启动子。可以使用多 种选择标记基因,包括编码突变的乙酰羟酸合酶(AHAS)的拟南芥基因(美 国专利5,7673,666和6,225,105)。类似地,可以使用多种启动子来调节性状 基因以提供基因转录的组成型、发育、组织或环境型调节。在本实施例中, 可以用34S启动子(GenBank登记号M59930和X16673)来提供性状基因的 组成型表达。

共培养处理后,洗涤外植体并转移至补充有500mg/L泰门汀的选择培 养基。剪下嫩枝并置于嫩枝延长培养基上。在移植至土壤之前,将长于1cm 的嫩枝置于生根培养基上2至4周。

通过PCR分析原代转基因植物(T0),以证实T-DNA的存在。通过 Southern杂交证实这些结果,其中将DNA在1%琼脂糖凝胶上电泳并转 移至带正电的尼龙膜(Roche Diagnostics)。使用PCR DIG Probe Synthesis Kit(Roche Diagnostics),通过PCR制备以洋地黄毒苷标记的探针,并如 生产商的推荐来使用。

如上述产生并分析T1或T2代植物。

实施例16

通过过表达磷酸核糖焦磷酸合酶来改造出具有提高的生物量产生的油 菜籽/芸苔

使用5-6日龄幼苗的子叶柄和下胚轴作为外植体用于组织培养并根据 Babic等(Plant Cell Rep 17,183(1998))转化。商品栽培种Westar (Agriculture Canada)是用于转化的标准品种,但也可使用其他品种。

可使用含有双元载体的根癌农杆菌LBA4404用于芸苔转化。已经描述 了用于植物转化的许多不同的双元载体系统(例如An G.,Agrobacterium Protocols.Methods in Molecular Biology Vol.44,47-62页,Gartland K.M.A.和Davey M.R.编辑.Humana Press,Totowa,New Jersey)。许多都 是基于Bevan(Nucleic Acid Research.12,8711(1984))所述的载体 pBIN19,其包括侧翼为根癌农杆菌Ti质粒的左边界和右边界序列的植物 基因表达盒。植物基因表达盒由至少两个基因组成——选择标记基因和调 节性状基因cDNA或基因组DNA转录的植物启动子。可以使用多种选择 标记基因,包括编码突变的乙酰羟酸合酶(AHAS)的拟南芥基因(美国专利 5,7673,666和6,225,105)。类似地,可以使用多种启动子来调节性状基因以 提供基因转录的组成型、发育、组织或环境型调节。在本实施例中,可以 用34S启动子(GenBank登记号M59930和X16673)来提供性状基因的组成 型表达。

将芸苔种子在70%乙醇中表面灭菌2分钟,接着在含有一滴Tween-20 的30%Clorox中表面灭菌10分钟,其后用无菌蒸馏水漂洗3次。接着将 种子在含有1%蔗糖、0.7%Phytagar的无激素的半强度MS培养基上以 23℃、16小时光照体外萌发5天。从体外苗上剪下附有子叶的子叶柄外植 体,并通过将叶柄外植体的切口末端浸入细菌悬液中来接种农杆菌。接着 将外植体在含有3mg/L BAP、3%蔗糖、0.7%Phytagar的MSBAP-3培养 基上以23℃、16小时光照培养2天。与农杆菌共培养2天后,将叶柄外植 体转移至含有3mg/L BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/L)的 MSBAP-3培养基上7天,接着在含有头孢噻肟、羧苄青霉素或泰门汀以及 选择剂的MSBAP-3培养基上培养,直至再生出嫩枝。当嫩枝为5-10mm 长时,将其剪下并转移至嫩枝延长培养基(MSBAP-0.5,含有0.5mg/L BAP)。将长度约2cm的嫩枝转移至生根培养基(MSO)用于根诱导。

通过PCR分析原代转基因植物(T0)的样品,以证实T-DNA的存在。 通过Southern杂交证实这些结果,其中将DNA在1%琼脂糖凝胶上电泳 并转移至带正电的尼龙膜(Roche Diagnostics)。使用PCR DIG Probe Synthesis Kit(Roche Diagnostics),通过PCR制备以洋地黄毒苷标记的探 针,并如生产商的推荐来使用。

如上述产生并分析T1或T2代植物。

实施例17

通过过表达磷酸核糖焦磷酸合酶来改造出具有提高的生物量产生的玉 米植物

使用对Ishida等(Nature Biotech 14745(1996))所述方法的修改来进 行玉米(Zea Mays L.)转化。玉米中的转化是基因型依赖性的,仅有特定的 基因型适于转化和再生。近交株系A188(University of Minnesota)或以 A188为亲本的杂种是转化供体材料的良好来源(Fromm等Biotech 8,833 (1990)),但也可成功地使用其他基因型。在授粉后约11天(DAP)从玉米植 物上收获穗,这时未成熟胚的长度约为1至1.2mm。将未成熟胚与带有“超 级二元”载体的根癌农杆菌共培养,并通过器官发生获得转基因植物。 Japan Tobacco的超级双元载体系统描述于WO专利WO 94/00977和WO 95/06722。如所述构建载体。可以使用多种选择标记基因,包括编码突变 的乙酰羟酸合酶(AHAS)的玉米基因(美国专利6,025,541)。类似地,可以使 用多种启动子来调节性状基因,以提供基因转录的组成型、发育、组织或 环境型调节。在本实施例中,使用34S启动子(GenBank登记号M59930 和X16673)来提供性状基因的组成型表达。

将剪下的胚在愈伤组织诱导培养基上培养,接着在含有咪唑啉酮作为 选择剂的玉米再生培养基上培养。将培养皿在光照下以25℃孵育2-3周, 或者直至发育出嫩枝。将绿色的嫩枝从每个胚上转移至玉米生根培养基, 并以25℃孵育2-3周,直至发育出根。将生根的嫩枝移植到温室中的土壤 里。从显示咪唑啉酮除草剂耐性并对转基因为PCR阳性的植物产生T1种 子。

接着根据实施例1所述方法对T1转基因植物评价其增强的胁迫耐性 (例如对低温的耐性)和/或提高的生物量产生。单基因座T-DNA插入的T1 代将以3∶1的比例分离该转基因。含有1或2个转基因拷贝的后代对咪唑 啉酮除草剂有耐性,并显示出与缺少该转基因的后代相比增强的胁迫耐性 (如低温耐性)和/或提高的生物量产生。

如上述产生并分析T1或T2代植物。

纯合T2植物显示相似的基因型。纯合转基因植物与非转基因植物的 杂种植物(F1后代)也显示该性状。

实施例18

通过过表达磷酸核糖焦磷酸合酶来改造出具有提高的生物量产生的小 麦植物

以Ishida等(Nature Biotech.14745(1996))所述方法进行小麦转化。 Bobwhite栽培种(可得自CYMMIT,Mexico)常用于转化。将未成熟胚与带 有“超级二元”载体的根癌农杆菌共培养,并通过器官发生获得转基因植物。 Japan Tobacco的超级双元载体系统描述于WO专利WO 94/00977和WO 95/06722。如所述构建载体。可以使用多种选择标记基因,包括编码突变 的乙酰羟酸合酶(AHAS)的玉米基因(美国专利6,025,541)。类似地,可以使 用多种启动子来调节性状基因,以提供基因转录的组成型、发育、组织或 环境型调节。在本实施例中,使用34S启动子(GenBank登记号M59930 和X16673)来提供性状基因的组成型表达。

与农杆菌孵育后,将胚在愈伤组织诱导培养基上培养,接着在含有咪 唑啉酮作为选择剂的再生培养基上培养。将培养皿在光照下以25℃孵育2-3 周,或者直至发育出嫩枝。将绿色的嫩枝从每个胚上转移至生根培养基, 并以25℃孵育2-3周,直至发育出根。将生根的嫩枝移植到温室中的土壤 里。从显示咪唑啉酮除草剂耐性并对转基因为PCR阳性的植物产生T1种 子。

接着根据上述方法对T1转基因植物评价其提高的生物量产生。单基 因座T-DNA插入的T1代将以3∶1的比例分离该转基因。含有1或2个转 基因拷贝的后代对咪唑啉酮除草剂有耐性,并显示出与缺少该转基因的后 代相比提高的生物量产生。

实施例19

鉴定相同和异源的基因

可以使用基因序列从cDNA或基因组文库中鉴定相同或异源的基因。 可以使用如cDNA文库,通过核酸杂交分离相同基因(例如全长cDNA克 隆)。取决于目的基因的丰度,将100,000至1,000,000个重组噬菌体涂板并 转移至尼龙膜。以碱变性后,通过如UV交联将DNA固定在膜上。杂交 在高严格条件下进行。在水溶液中,杂交和洗涤以1M NaCl的离子强度 和68℃的温度进行。通过如放射性(32P)缺口转录标记(High Prime,Roche, Mannheim,Germany)来产生杂交探针。通过放射自显影来检测信号。

可以与上述类似的方式使用低严格杂交和洗涤调节来鉴定相关但不相 同的部分相同或异源基因。就水溶液杂交而言,离子强度一般保持在1M NaCl,而温度逐渐从68℃降低至42℃。

可以通过使用合成的放射性标记寡核苷酸探针来分离仅在不同结构域 (例如10-20个氨基酸)中具有同源性(或序列同一性/相似性)的基因序列。通 过用T4多核苷酸激酶将两个互补寡核苷酸的5’末端磷酸化来制备放射性 标记的寡核苷酸。所述互补寡核苷酸退火并连接形成多联体。接着通过如 缺口转录对双链多联体进行放射性标记。杂交一般使用高寡核苷酸浓度在 低严格条件下进行。

寡核苷酸杂交液:

6×SSC

0.01M磷酸钠

1mM EDTA(pH 8)

0.5%SDS

100μg/ml变性鲑精DNA

0.1%脱脂奶粉

在杂交过程中,将温度逐渐降低至估计的寡核苷酸Tm以下5-10℃, 或者降低至室温,然后进行洗涤步骤和放射自显影。洗涤以低严格度进行, 例如使用4×SSC洗涤3次。其他细节描述于Sambrook J.等,1989, “Molecular Cloning:A Laboratory Manual,”Cold Spring Harbor Laboratory Press或者Ausubel F.M.等,1994,“Current Protocols in Molecular Biology,”John Wiley&Sons。

实施例20

通过用抗体筛选表达文库来鉴定相同基因

cDNA克隆可用于产生重组多肽,例如在大肠杆菌中产生(例如Qiagen QIAexpress pQE系统)。接着一般通过Ni-NTA亲和层析(Qiagen)对重组多 肽进行亲和纯化。接着使用重组多肽产生特异性抗体,例如使用标准技术 免疫兔子。如Gu等,BioTechniques 17,257(1994)所述,使用以重组抗原 饱和的Ni-NTA柱对抗体进行亲和纯化。接着可使用抗体通过免疫筛选来 筛选表达cDNA文库,以鉴定相同或异源的基因(Sambrook,J.等,1989, “Molecular Cloning:A Laboratory Manual,”Cold Spring Harbor Laboratory Press或者Ausubel,F.M.等,1994,“Current Protocols in Molecular Biology”,John Wiley&Sons)。

实施例21

体内诱变

可通过以维持其遗传信息完整性之能力受损的大肠杆菌或其他微生物 (例如芽孢杆菌或者酵母,如酿酒酵母)传代质粒(或其他载体)DNA来进行 微生物的体内诱变。典型的增变菌株在其DNA修复系统的基因中含有突 变(例如mutHLS、mutD、mutT等,参阅Rupp W.D.,DNA repair mechanisms,Escherichia coli and Salmonella,2277-2294页,ASM,1996, Washington)。这些菌株为本领域技术人员所熟知。这些菌株的使用展示于 例如Greener A.和Callahan M.,Strategies 7,32(1994)。优选在微生物中选 择并测试后将突变DNA分子转移进植物。根据本文实例的多个实施例产 生转基因植物。

实施例22

通过使用组织特异性启动子或胁迫诱导型启动子过表达PRS编码基 因(例如来自欧洲油菜、大豆、玉米或水稻)来改造出具有提高的生物量生 产的拟南芥植物。

如实施例1所述产生过表达低温抗性和/或耐性相关蛋白编码基因(例 如来自欧洲油菜、大豆、玉米和水稻)的转基因拟南芥植物以表达在组织特 异性启动子或胁迫诱导型启动子控制下的编码PRS蛋白的转基因。与非转 基因野生型植物相比,T2代植物显示出提高的生物量产生和/或干物质产 生和/或种子产量。

实施例23

通过过表达PRS基因(例如来自欧洲油菜、大豆、玉米或水稻)来改造 出具有提高的生物量产生的苜蓿植物

使用McKersie等(Plant Physiol.119,839(1999))的方法转化苜蓿 (Medicago sativa)的再生克隆。苜蓿的再生和转化是基因型依赖性的,因此 需要再生植物。已经描述了获得再生植物的方法。例如,可以如Brown和 Atanassov(Plant Cell Tissue Organ Culture 4,111(1985))所述,从栽培种 (Agriculture Canada)或任何其他商品苜蓿品种中对其进行选择。或者,选 择RA3品种(University of Wisconsin)用于组织培养(Walker等,Am.J.Bot. 65,54(1978))。

将叶柄外植体与含有双元载体的根癌农杆菌C58C1pMP90 (McKersie等,Plant Physiol 119,839(1999))或LBA4404的过夜培养物共培 养。已经描述了将用于植物转化的许多不同的双元载体系统(例如An G., Agrobacterium Protocols,Methods in Molecular Biology,Vol 44,47-62页, Gartland K.M.A.和Davey M.R编辑.Humana Press,Totowa,New Jersey)。许多都是基于Bevan(Nucleic Acid Research.12,8711(1984))所述 的载体pBIN19,其包括侧翼为根癌农杆菌Ti质粒的左边界和右边界序列 的植物基因表达盒。植物基因表达盒由至少两个基因组成——选择标记基 因和调节性状基因的cDNA或基因组DNA转录的植物启动子。可以使用 多种选择标记基因,包括编码突变的乙酰羟酸合酶(AHAS)的拟南芥基因 (美国专利5,7673,666和6,225,105)。类似地,可以使用多种启动子来调节 性状基因,以提供基因转录的组成型、发育、组织或环境型调节。在本实 施例中,使用34S启动子(GenBank登记号M59930和X16673)来提供性状 基因的组成型表达。

在含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/L K2SO4和100 μm乙酰丁香酮的SH诱导培养基上在黑暗中将外植体培养3天。以半强度 的Murashige-Skoog培养基(Murashige和Skoog,1962)洗涤外植体,并涂 板到相同的SH诱导培养基上,但其中不含乙酰丁香酮,而是含有合适的 选择剂和合适的抗生素以抑制农杆菌生长。几周后,将体细胞胚转移至无 生长调节剂、无抗生素并含有50g/L蔗糖的BOi2Y发育培养基。其后使 体细胞胚在半强度的Murashige-Skoog培养基上萌发。将生根的苗移植到 盆中并在温室中培养。

通过节剪切繁殖T0转基因植物,并在Turface生长培养基中生根。如 上文实施例中所述分析T1或T2代植物。与非转基因野生型植物相比,植 物具有提高的生物量产生和/或干物质产生和/或种子产量。

实施例24

通过过表达PRS基因(例如来自欧洲油菜、大豆、玉米或水稻)来改造 出具有提高的生物量产生的黑麦草植物

可将来自若干不同黑麦草品种的种子作为外植体来源用于转化,包括 商品品种Gunne(可得自Weibull种子公司)或者Affinity品种。将种 子依次用1%Tween-20表面灭菌1分钟,以100%漂白剂表面灭菌60分钟, 用去离子水和蒸馏水漂洗3次(每次5分钟),接着在黑暗中在湿润的无菌 滤纸上萌发3-4天。将苗再用1%Tween-20灭菌1分钟,以75%漂白剂灭 菌5分钟,并用双蒸水漂洗3次,每次5分钟。

将经表面灭菌的种子置于含有Murashige和Skoog基础盐和维生素、 20g/L蔗糖、150mg/L天冬酰胺、500mg/L酪蛋白水解物、3g/L Phytagel、 10mg/L BAP和5mg/二氯甲氧苯酸的愈伤组织诱导培养基上。将平板在 黑暗中以25℃孵育4天以进行种子萌发和胚胎发生愈伤组织诱导。

在愈伤组织诱导培养基上4周后,剪去苗的嫩枝和根,将愈伤组织转 移至新鲜培养基,再培养4周,接着转移至MSoMSO培养基在光照下培 养2周。将一些愈伤组织片(11-17周龄)通过10目筛并置于愈伤组织诱导 培养基上,或者在250ml瓶中的100ml液体黑麦草愈伤组织诱导培养基(与 用琼脂诱导愈伤组织的培养基相同)中培养。将瓶用箔裹住,并在黑暗中在 23℃下以175rpm摇动1周。用40目筛将液体培养基过筛来收集细胞。将 筛上收集的级分置于固体黑麦草愈伤组织诱导培养基并在黑暗中以25℃ 培养1周。接着将愈伤组织转移至含有1%蔗糖的MS培养基并培养2周。

转化可通过农杆菌或微粒轰击法来实现。产生在pUC载体中含有组成 型植物启动子和基因cDNA的表达载体。使用Qiagen试剂盒,根据生产 商的说明从大肠杆菌细胞中制备质粒DNA。将约2g胚胎发生愈伤组织涂 在培养皿中无菌滤纸的中心。在滤纸上添加含有10g/L蔗糖的液体MSO 等分试样。根据Sanford等,1993的方法用质粒DNA包裹金微粒(大小为 1.0μm),并使用以下参数递送至胚胎发生愈伤组织:每次轰击500μg微 粒和2μg DNA,1300psi,挡板到愈伤组织平板的距离为8.5cm,每个愈 伤组织轰击1次。

轰击后,将愈伤组织转移回新鲜的愈伤组织发育培养基中,并在室温 下在黑暗中维持1周时间。接着将愈伤组织转移至25℃下光照的生长条件, 以用合适的选择剂(例如250nM Arsenal、5mg/L PPT或50mg/L卡那霉 素)起始胚分化。出现了对选择剂有抗性的嫩枝,一旦枯萎就转移至土壤中。

通过PCR分析原代转基因植物(T0)的样品,以证实T-DNA的存在。 通过Southern杂交证实这些结果,其中将DNA在1%琼脂糖凝胶上电泳 并转移至带正电的尼龙膜(Roche Diagnostics)。使用The PCR DIG Probe Synthesis Kit(Roche Diagnostics),通过PCR制备以洋地黄毒苷标记的探 针,并如生产商的推荐来使用。

通过剪下分蘖对转基因T0黑麦草植物进行无性繁殖。将移植的分蘖 在温室中维持2个月,直至已良好建立。

如上述产生并分析T1或T2代植物并分析。

实施例25

通过过表达PRS基因(例如来自欧洲油菜、大豆、玉米或水稻)来改造 出具有提高的生物量生产的大豆植物

根据对Texas A&M专利US 5,164,310所述方法的以下修改来转化大 豆。一些商品大豆品种适于通过该方法进行转化。通常使用栽培种Jack(可 得自Illinois Seed Foundation)进行转化。通过将种子浸入70%(v/v)乙醇6 分钟和补充有0.1%(v/v)Tween的25%商业漂白剂(NaOCl)20分钟而进行 消毒,然后用无菌双蒸水漂洗4次。通过从每个苗上除去胚根、下胚轴和 一个子叶来繁殖7日龄的苗。接着,将带有一个子叶的上胚轴转移至培养 皿中新鲜的萌发培养基,并在16小时光周期(约100μmol/m2s)下以25℃孵 育3周。从3-4周龄植物上剪下叶腋节(约4mm长)。切下叶腋节并在农杆 菌LBA4404培养基中孵育。

已经描述了用于植物转化的许多不同的双元载体系统(例如An G., Agrobacterium Protocols.Methods in Molecular Biology Vol.44,47-62页, Gartland K.M.A.和Davey M.R.编辑.Humana Press,Totowa,New Jersey)。许多都是基于Bevan(Nucleic Acid Research.12,8711(1984))所述 的载体pBIN19,其包括侧翼为根癌农杆菌Ti质粒的左边界和右边界序列 的植物基因表达盒。植物基因表达盒由至少两个基因组成——选择标记基 因和调节性状基因cDNA或基因组DNA转录的植物启动子。可以使用多 种选择标记基因,包括编码突变的乙酰羟酸合酶(AHAS)的拟南芥基因(美 国专利5,7673,666和6,225,105)。类似地,可以使用多种启动子来调节性状 基因以提供基因转录的组成型、发育、组织或环境型调节。在本实施例中, 用34S启动子(GenBank登记号M59930和X16673)来提供性状基因的组成 型表达。

共培养处理后,洗涤外植体并转移至补充有500mg/L泰门汀的选择培 养基。剪下嫩枝并置于嫩枝延长培养基上。在移植至土壤之前,将长于1cm 的嫩枝置于生根培养基上2至4周。

通过PCR分析原代转基因植物(T0),以证实T-DNA的存在。通过 Southern杂交证实这些结果,其中将DNA在1%琼脂糖凝胶上电泳并转 移至带正电的尼龙膜(Roche Diagnostics)。使用PCR DIG Probe Synthesis Kit(Roche Diagnostics),通过PCR制备以洋地黄毒苷标记的探针,并如 生产商的推荐来使用。

过表达例如来自欧洲油菜、大豆、玉米或水稻的低温抗性和/或耐性相 关基因的大豆植物具有更高的种子产量。

如所述产生并分析T1或T2代植物,将干物质产生和/或种子产量与 非转基因野生型植物进行比较。

实施例26

通过过表达PRS基因(例如来自欧洲油菜、大豆、玉米或水稻)来改造 出具有提高的生物量产生的油菜籽/芸苔植物

使用5-6日龄幼苗的子叶柄和下胚轴作为外植体用于组织培养并根据 Babic等(Plant Cell Rep 17,183(1998))转化。商品栽培种Westar (Agriculture Canada)是用于转化的标准品种,但也可使用其他品种。

可使用含有双元载体的根癌农杆菌LBA4404用于芸苔转化。已经描述 了用于植物转化的许多不同的双元载体系统(例如An G.,Agrobacterium Protocols.Methods in Molecular Biology Vol.44,47-62页,Gartland K.M.A.和Davey M.R.编辑.Humana Press,Totowa,New Jersey)。许多都 是基于Bevan(Nucleic Acid Research.12,8711(1984))所述的载体 pBIN19,其包括侧翼为根癌农杆菌Ti质粒的左边界和右边界序列的植物 基因表达盒。植物基因表达盒由至少两个基因组成——选择标记基因和调 节性状基因cDNA或基因组DNA转录的植物启动子。可以使用多种选择 标记基因,包括编码突变的乙酰羟酸合酶(AHAS)的拟南芥基因(美国专利 5,7673,666和6,225,105)。类似地,可以使用多种启动子来调节性状基因以 提供基因转录的组成型、发育、组织或环境型调节。在本实施例中,可以 用34S启动子(GenBank登记号M59930和X16673)来提供性状基因的组成 型表达。

将芸苔种子在70%乙醇中表面灭菌2分钟,接着在含有一滴Tween-20 的30%Clorox中表面灭菌10分钟,其后用无菌蒸馏水漂洗3次。接着将 种子在含有1%蔗糖、0.7%Phytagar的无激素的半强度MS培养基上以 23℃、16小时光照体外萌发5天。从体外苗上剪下附有子叶的子叶柄外植 体,并通过将叶柄外植体的切口末端浸入细菌悬液中来接种农杆菌。接着 将外植体在含有3mg/L BAP、3%蔗糖、0.7%Phytagar的MSBAP-3培养 基上以23℃、16小时光照培养2天。与农杆菌共培养2天后,将叶柄外植 体转移至含有3mg/L BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/L)的 MSBAP-3培养基上7天,接着在含有头孢噻肟、羧苄青霉素或泰门汀以及 选择剂的MSBAP-3培养基上培养,直至再生出嫩枝。当嫩枝为5-10mm 长时,将其剪下并转移至嫩枝延长培养基(MSBAP-0.5,含有0.5mg/L BAP)。将长度约2cm的嫩枝转移至生根培养基(MSO)用于根诱导。

通过PCR分析原代转基因植物(T0)的样品,以证实T-DNA的存在。 通过Southern杂交证实这些结果,其中将DNA在1%琼脂糖凝胶上电泳 并转移至带正电的尼龙膜(Roche Diagnostics)。使用PCR DIG Probe Synthesis Kit(Roche Diagnostics),通过PCR制备以洋地黄毒苷标记的探 针,并如生产商的推荐来使用。

接着根据上文所述方法对转基因植物评估其提高的生物量产生。发现 过表达来自欧洲油菜、大豆、玉米或水稻的PRS具有的转基因油菜籽/芸 苔与非转基因对照植物相比具有提高的生物量产生。

实施例27

通过过表达PRS基因(例如来自欧洲油菜、大豆、玉米或水稻)来改造 出具有提高的生物量产生的玉米植物

使用对Ishida等(Nature Biotech 14745(1996))所述方法的修改来进 行玉米(Zea Mays L.)转化。玉米中的转化是基因型依赖性的,仅有特定的 基因型适于转化和再生。近交株系A188(University of Minnesota)或以 A188为亲本的杂种是转化供体材料的良好来源(Fromm等Biotech 8,833 (1990)),但也可成功地使用其他基因型。在授粉后约11天(DAP)从玉米植 物上收获穗,这时未成熟胚的长度约为1至1.2mm。将未成熟胚与带有“超 级二元”载体的根癌农杆菌共培养,并通过器官发生获得转基因植物。 Japan Tobacco的超级双元载体系统描述于WO专利WO 94/00977和WO 95/06722。如所述构建载体。可以使用多种选择标记基因,包括编码突变 的乙酰羟酸合酶(AHAS)的玉米基因(美国专利6,025,541)。类似地,可以使 用多种启动子来调节性状基因,以提供基因转录的组成型、发育、组织或 环境型调节。在本实施例中,使用34S启动子(GenBank登记号M59930 和X16673)来提供性状基因的组成型表达。

将剪下的胚在愈伤组织诱导培养基上培养,接着在含有咪唑啉酮作为 选择剂的玉米再生培养基上培养。将培养皿在光照下以25℃孵育2-3周, 或者直至发育出嫩枝。将绿色的嫩枝从每个胚上转移至玉米生根培养基, 并以25℃孵育2-3周,直至发育出根。将生根的嫩枝移植到温室中的土壤 里。从显示咪唑啉酮除草剂耐性并对转基因为PCR阳性的植物产生T1种 子。

接着根据上述方法对T1转基因植物评价其提高的生物量产生。单基 因座T-DNA插入的T1代将以1∶2∶1的比例分离该转基因。含有1或2个 转基因拷贝的后代(3/4的后代)对咪唑啉酮除草剂有耐性,并显示出与缺少 该转基因的后代相比提高的生物量产生。这些植物具有更高的种子产量。 纯合T2植物显示出相似的表型。纯合转基因植物与非转基因植物的杂交 植物(F1后代)也显示提高的生物量产生。

实施例28

通过过表达PRS基因(例如来自欧洲油菜、大豆、玉米或水稻)来改造 出具有提高的生物量产生的小麦植物

以Ishida等(Nature Biotech.14745(1996))所述方法进行小麦转化。 Bobwhite栽培种(可得自CYMMIT,Mexico)常用于转化。将未成熟胚与带 有“超级二元”载体的根癌农杆菌共培养,并通过器官发生获得转基因植物。 Japan Tobacco的超级双元载体系统描述于WO专利WO 94/00977和WO 95/06722。如所述构建载体。可以使用多种选择标记基因,包括编码突变 的乙酰羟酸合酶(AHAS)的玉米基因(美国专利6,025,541)。类似地,可以使 用多种启动子来调节性状基因,以提供基因转录的组成型、发育、组织或 环境型调节。在本实施例中,使用34S启动子(GenBank登记号M59930 和X16673)来提供性状基因的组成型表达。

与农杆菌孵育后,将胚在愈伤组织诱导培养基上培养,接着在含有咪 唑啉酮作为选择剂的再生培养基上培养。将培养皿在光照下以25℃孵育2-3 周,或者直至发育出嫩枝。将绿色的嫩枝从每个胚上转移至生根培养基, 并以25℃孵育2-3周,直至发育出根。将生根的嫩枝移植到温室中的土壤 里。从显示咪唑啉酮除草剂耐性并对转基因为PCR阳性的植物产生T1种 子。

接着根据上述方法对T1转基因植物评价其提高的生物量产生。单基 因座T-DNA插入的T1代将以1∶2∶1的比例分离该转基因。含有1或2个 转基因拷贝的后代(3/4的后代)与缺少该转基因的后代相比显示出提高的生 物量产生。

实施例29

通过过表达PRS基因改造出具有提高的生物量产生的水稻植物

水稻转化

使用含有表达载体的农杆菌转化水稻植物。将水稻日本栽培种 Nipponbare的成熟干种子脱皮。如下进行灭菌:在70%乙醇中孵育1分 钟,随后在0.2%HgCl2中孵育30分钟,然后用无菌蒸馏水洗涤6次(各15 分钟)。接着将灭菌的种子在含有2,4-D的培养基(愈伤组织诱导培养基)上 萌发。在黑暗中诱导4周后,剪下胚胎发生的盾片来源愈伤组织,并在相 同的培养基上繁殖。两周后,通过在相同培养基上传代培养2周来增殖或 繁殖愈伤组织。在共培养之前,将胚胎发生愈伤组织片在新鲜培养基上传 代培养3天(以增强细胞分裂活性)。

使用含有表达载体的农杆菌菌株LBA4404进行共培养。以农杆菌接种 含有适当抗生素的AB培养基并以28℃培养3天。接着收集细菌并悬浮于 液体共培养培养基中,至密度(OD600)约为1。接着将悬液转移至培养皿, 并将愈伤组织浸没在悬液中15分钟。接着将愈伤组织在滤纸上吸干并转移 至固化的共培养培养基,并在黑暗中以25℃孵育3天。在选择剂存在下, 将共培养的愈伤组织在含有2,4-D的培养基上在黑暗中以28℃培养4周。 在此期间,发育出了迅速生长的抗性愈伤组织岛。将此材料转移至再生培 养基并在光照下孵育后,在接下来的4至5周中释放胚胎发生势并发育出 嫩枝。从愈伤组织上剪下嫩枝并在含有生长素的培养基上孵育2至3周, 再转移至土壤里。将变硬的嫩枝在温室中以高湿度和短日照进行培养。

从每个构建体产生了约35个独立的T0水稻转化体。将原代转化体从 组织培养室转移至温室中。以定量PCR分析验证T-DNA插入片段的拷贝 数后,保留显示选择剂耐受性的仅含有单个拷贝的转基因植物用于收获T1 种子。接着在移植3至5个月后收获种子。该方法以超过50%的比率获得 单基因座转化体(Aldemita和Hodges1996,Chan等1993,Hiei等1994)。

水稻表型评价方法

1.评价设置

保留了T1后代对转基因存在/不存在以3∶1分离的8个事件中的5个。 对于每个这些事件,通过监测视觉标记的表达来选择含有转基因的约10 个T1苗(杂合子和纯合子)和不含转基因的约10个T1苗(失效合子)。在随 机位置将转基因植物和相应的失效合子并列培养。温室条件为短日照(12 小时光照),光照期28℃,黑暗期22℃,相对湿度为70%。

播种阶段到植物成熟阶段,使植物数次穿过数字成像柜。在每个时 间点对每株植物获取至少6个不同角度的数字图像(2048×1536像素,16百 万色)。

2.统计学分析:F检验

使用双因素ANOVA(方差分析)作为统计学模型对植物表型特征进行 总体评价。对所有本发明基因转化事件的所有植物中所有测量参数进行F 检验。进行F检验以检查基因对所有转化事件的影响,以及验证该基因的 总体效果(也称为全局性基因效果)。F检验的真实全局基因效果的显著性阈 值设置为%概率水平。显著的F检验值代表基因效果,表示不仅仅是基因 的存在或位置导致了表型的差异。

3.测量的参数

3.1生物量相关参数的测量

从播种阶段到植物成熟阶段,使植物数次穿过数字成像柜。在每个时 间点对每株植物获取至少6个不同角度的数字图像(2048×1536像素,16百 万色)。

通过对以背景区分的地上植物部分的数字图像的总像素数进行计数来 测定植物的地上面积(或叶生物量)。该数值在同一时间点取自不同角度的 图像之间进行平均,并通过校准转换为以平方毫米表示的物理表面值。实 验显示,这样测量的地上植物面积与地上植物部分的生物量相关。地上面 积是在植物到达其最高叶生物量的时间点测量的面积。早期活力是萌发后 3周的植物(苗)地上面积。根生物量的提高表示为根总生物量(以植物生命 期中观察到的最高根生物量测量),或者表示为根冠指数(以根和嫩枝活跃 生长期中根生物量与嫩枝生物量之间的比值来衡量)的增加。

3.2种子相关参数的测量

收获成熟的一级圆锥花序,计数,装袋,用条形码标记,接着在烘箱 中以37℃干燥3天。接着脱粒花序,收集所有的种子并计数。使用吹气设 备将饱满的籽实与空壳分开。弃去空壳,对剩余部分再次计数。在分析天 平上对饱满的种子称重。通过计数在分离步骤后剩余的饱满籽实数来确定 饱满种子数。通过对从一株植物收获的所有饱满籽实进行称重来测量每株 植物的种子总重。通过对收获自一株植物的籽实数进行计数来测量每株植 物的种子总数。从计数的饱满种子数及其总重外推出千粒重(TKW)。本发 明的收获指数(HI)定义为每株植物的种子总重与地上面积(mm2)的比值再 乘以因数106。每个圆锥花序的总花数在本发明中定义为种子总数与成熟 一级圆锥花序数的比值。种子饱满率在本发明中定义为饱满种子数与种子 (或小花)总数的比值(表达为%)。

序列表

<110>巴斯福植物科学有限公司

马克思-普朗克科学促进协会公司

<120>产量提高的植物

<130>PF 58477

<160>37

<170>PatentIn版本3.3

<210>1

<211>957

<212>DNA

<213>棉阿舒囊霉

<220>

<221>CDS

<222>(1)..(957)

<400>1

atg tcg tcc aat agc ata aag ctg cta gca ggt aac tcg cac ccg gac     48

Met Ser Ser Asn Ser Ile Lys Leu Leu Ala Gly Asn Ser His Pro Asp

1               5                   10                  15

cta gct gag aag gtc tcc gtt cgc cta ggt gta cca ctt tcg aag att     96

Leu Ala Glu Lys Val Ser Val Arg Leu Gly Val Pro Leu Ser Lys Ile

            20                  25                  30

gga gtg tat cac tac tct aac aaa gag acg tca gtt act atc ggc gaa    144

Gly Val Tyr His Tyr Ser Asn Lys Glu Thr Ser Val Thr Ile Gly Glu

        35                  40                  45

agt atc cgt gat gaa gat gtc tac atc atc cag aca gga acg ggg gag    192

Ser Ile Arg Asp Glu Asp Val Tyr Ile Ile Gln Thr Gly Thr Gly Glu

    50                  55                  60

cag gaa atc aac gac ttc ctc atg gaa ctg ctc atc atg atc cat gcc    240

Gln Glu Ile Asn Asp Phe Leu Met Glu Leu Leu Ile Met Ile His Ala

65                  70                  75                  80

tgc cgg tca gcc tct gcg cgg aag atc aca gcg gtt ata cca aac ttc    288

Cys Arg Ser Ala Ser Ala Arg Lys Ile Thr Ala Val Ile Pro Asn Phe

                85                  90                  95

cct tac gca aga caa gac aaa aag gac aag tcg cga gca ccg ata act    336

Pro Tyr Ala Arg Gln Asp Lys Lys Asp Lys Ser Arg Ala Pro Ile Thr

            100                 105                 110

gcc aag ctg gtg gcc aag atg cta gag acc gcg ggg tgc aac cac gtt    384

Ala Lys Leu Val Ala Lys Met Leu Glu Thr Ala Gly Cys Asn His Val

        115                 120                 125

atc acg atg gat ttg cac gcg tct caa att cag ggt ttc ttc cac att    432

Ile Thr Met Asp Leu His Ala Ser Gln Ile Gln Gly Phe Phe His Ile

    130                 135                 140

cca gtg gac aac cta tat gca gag ccg aac atc ctg cac tac atc caa    480

Pro Val Asp Asn Leu Tyr Ala Glu Pro Asn Ile Leu His Tyr Ile Gln

145                 150                 155                 160

cat aat gtg gac ttc cag aat agt atg ttg gtc gcg cca gac gcg ggg    528

His Asn Val Asp Phe Gln Asn Ser Met Leu Val Ala Pro Asp Ala Gly

                165                 170                 175

tcg gcg aag cgc acg tcg acg ctt tcg gac aag ctg aat ctc aac ttc    576

Ser Ala Lys Arg Thr Ser Thr Leu Ser Asp Lys Leu Asn Leu Asn Phe

            180                 185                 190

gcg ttg atc cac aaa gaa cgg cag aag gcg aac gag gtc tcg cgg atg    624

Ala Leu Ile His Lys Glu Arg Gln Lys Ala Asn Glu Val Ser Arg Met

        195                 200                 205

gtg ttg gtg ggt gat gtc gcc gac aag tcc tgt att att gta gac gac    672

Val Leu Val Gly Asp Val Ala Asp Lys Ser Cys Ile Ile Val Asp Asp

    210                 215                 220

atg gcg gac acg tgc gga acg cta gtg aag gcc act gac acg ctg atc    720

Met Ala Asp Thr Cys Gly Thr Leu Val Lys Ala Thr Asp Thr Leu Ile

225                 230                 235                 240

gaa aat ggg gcg aaa gaa gtg att gcc att gtg aca cac ggt ata ttt    768

Glu Asn Gly Ala Lys Glu Val Ile Ala Ile Val Thr His Gly Ile Phe

                245                 250                 255

tct ggc ggc gcc cgc gag aag ttg cgc aac agc aag ctg gca cgg atc    816

Ser Gly Gly Ala Arg Glu Lys Leu Arg Asn Ser Lys Leu Ala Arg Ile

            260                 265                 270

gta agc aca aat acg gtg cca gtg gac ctc aat cta gat atc tac cac    864

Val Ser Thr Ash Thr Val Pro Val Asp Leu Asn Leu Asp Ile Tyr His

        275                 280                 285

caa att gac att agt gcc att ttg gcc gag gca att aga agg ctt cac    912

Gln Ile Asp Ile Ser Ala Ile Leu Ala Glu Ala Ile Arg Arg Leu His

    290                 295                 300

aac ggg gaa agt gtg tcg tac ctg ttc aat aac gct gtc atg tag        957

Asn Gly Glu Ser Val Ser Tyr Leu Phe Asn Asn Ala Val Met

305                 310                 315

<210>2

<211>318

<212>PRT

<213>棉阿舒囊霉

<400>2

Met Ser Ser Asn Ser Ile Lys Leu Leu Ala Gly Asn Ser His Pro Asp

1               5                   10                  15

Leu Ala Glu Lys Val Ser Val Arg Leu Gly Val Pro Leu Ser Lys Ile

            20                  25                  30

Gly Val Tyr His Tyr Ser Asn Lys Glu Thr Ser Val Thr Ile Gly Glu

        35                  40                  45

Ser Ile Arg Asp Glu Asp Val Tyr Ile Ile Gln Thr Gly Thr Gly Glu

    50                  55                  60

Gln Glu Ile Asn Asp Phe Leu Met Glu Leu Leu Ile Met Ile His Ala

65                  70                  75                  80

Cys Arg Ser Ala Ser Ala Arg Lys Ile Thr Ala Val Ile Pro Asn Phe

                85                  90                  95

Pro Tyr Ala Arg Gln Asp Lys Lys Asp Lys Ser Arg Ala Pro Ile Thr

            100                 105                 110

Ala Lys Leu Val Ala Lys Met Leu Glu Thr Ala Gly Cys Asn His Val

        115                 120                 125

Ile Thr Met Asp Leu His Ala Ser Gln Ile Gln Gly Phe Phe His Ile

    130                 135                 140

Pro Val Asp Asn Leu Tyr Ala Glu Pro Asn Ile Leu His Tyr Ile Gln

145                 150                 155                 160

His Asn Val Asp Phe Gln Asn Ser Met Leu Val Ala Pro Asp Ala Gly

                165                 170                 175

Ser Ala Lys Arg Thr Ser Thr Leu Ser Asp Lys Leu Asn Leu Asn Phe

            180                 185                 190

Ala Leu Ile His Lys Glu Arg Gln Lys Ala Asn Glu Val Ser Arg Met

        195                 200                 205

Val Leu Val Gly Asp Val Ala Asp Lys Ser Cys Ile Ile Val Asp Asp

    210                 215                 220

Met Ala Asp Thr Cys Gly Thr Leu Val Lys Ala Thr Asp Thr Leu Ile

225                 230                 235                 240

Glu Asn Gly Ala Lys Glu Val Ile Ala Ile Val Thr His Gly Ile Phe

                245                 250                 255

Ser Gly Gly Ala Arg Glu Lys Leu Arg Asn Ser Lys Leu Ala Arg Ile

            260                 265                 270

Val Ser Thr Asn Thr Val Pro Val Asp Leu Asn Leu Asp Ile Tyr His

        275                 280                 285

Gln Ile Asp Ile Ser Ala Ile Leu Ala Glu Ala Ile Arg Arg Leu His

    290                 295                 300

Asn Gly Glu Ser Val Ser Tyr Leu Phe Asn Asn Ala Val Met

305                 310                 315

<210>3

<211>957

<212>DNA

<213>人工的

<220>

<223>具有点突变的PRS

<220>

<221>CDS

<222>(1)..(957)

<400>3

atg tcg tcc aat agc ata aag ctg cta gca ggt aac tcg cac ccg gac     48

Met Ser Ser Asn Ser Ile Lys Leu Leu Ala Gly Asn Ser His Pro Asp

1               5                   10                  15

cta gct gag aag gtc tcc gtt cgc cta ggt gta cca ctt tcg aag att     96

Leu Ala Glu Lys Val Ser Val Arg Leu Gly Val Pro Leu Ser Lys Ile

            20                  25                  30

gga gtg tat cac tac tct aac aaa gag acg tca gtt act atc ggc gaa    144

Gly Val Tyr His Tyr Ser Asn Lys Glu Thr Ser Val Thr Ile Gly Glu

        35                  40                  45

agt atc cgt gat gaa gat gtc tac atc atc cag aca gga acg ggg gag    192

Ser Ile Arg Asp Glu Asp Val Tyr Ile Ile Gln Thr Gly Thr Gly Glu

    50                  55                  60

cag gaa atc aac gac ttc ctc atg gaa ctg ctc atc atg atc cat gcc    240

Gln Glu Ile Asn Asp Phe Leu Met Glu Leu Leu Ile Met Ile His Ala

65                  70                  75                  80

tgc cgg tca gcc tct gcg cgg aag atc aca gcg gtt ata cca aac ttc    288

Cys Arg Ser Ala Ser Ala Arg Lys Ile Thr Ala Val Ile Pro Asn Phe

                85                  90                  95

cct tac gca aga caa gac aaa aag gac aag tcg cga gca ccg ata act    336

Pro Tyr Ala Arg Gln Asp Lys Lys Asp Lys Ser Arg Ala Pro Ile Thr

            100                 105                 110

gcc aag ctg gtg gcc aag atg cta gag acc gcg ggg tgc aac cac gtt    384

Ala Lys Leu Val Ala Lys Met Leu Glu Thr Ala Gly Cys Asn His Val

        115                 120                 125

atc acg atg gat atc cac gcg tct caa att cag ggt ttc ttc cac att    432

Ile Thr Met Asp Ile His Ala Ser Gln Ile Gln Gly Phe Phe His Ile

    130                 135                 140

cca gtg gac aac cta tat gca gag ccg aac atc ctg cac tac atc caa    480

Pro Val Asp Asn Leu Tyr Ala Glu Pro Asn Ile Leu His Tyr Ile Gln

145                 150                 155                 160

cat aat gtg gac ttc cag aat agt atg ttg gtc gcg cca gac gcg ggg    528

His Asn Val Asp Phe Gln Asn Ser Met Leu Val Ala Pro Asp Ala Gly

                165                 170                 175

tcg gcg aag cgc acg tcg acg ctt tcg gac aag ctg aat ctc aac ttc    576

Ser Ala Lys Arg Thr Ser Thr Leu Ser Asp Lys Leu Asn Leu Asn Phe

            180                 185                 190

gcg ttg atc cag aaa gaa cgg cag aag gcg aac gag gtc tcg cgg atg    624

Ala Leu Ile Gln Lys Glu Arg Gln Lys Ala Asn Glu Val Ser Arg Met

        195                 200                 205

gtg ttg gtg ggt gat gtc gcc gac aag tcc tgt att att gta gac gac    672

Val Leu Val Gly Asp Val Ala Asp Lys Ser Cys Ile Ile Val Asp Asp

    210                 215                 220

atg gcg gac acg tgc gga acg cta gtg aag gcc act gac acg ctg atc    720

Met Ala Asp Thr Cys Gly Thr Leu Val Lys Ala Thr Asp Thr Leu Ile

225                 230                 235                 240

gaa aat ggg gcg aaa gaa gtg att gcc att gtg aca cac ggt ata ttt    768

Glu Asn Gly Ala Lys Glu Val Ile Ala Ile Val Thr His Gly Ile Phe

                245                 250                 255

tct ggc ggc gcc cgc gag aag ttg cgc aac agc aag ctg gca cgg atc    816

Ser Gly Gly Ala Arg Glu Lys Leu Arg Asn Ser Lys Leu Ala Arg Ile

            260                 265                 270

gta agc aca aat acg gtg cca gtg gac ctc aat cta gat atc tac cac    864

Val Ser Thr Asn Thr Val Pro Val Asp Leu Asn Leu Asp Ile Tyr His

        275                 280                 285

caa att gac att agt gcc att ttg gcc gag gca att aga agg ctt cac    912

Gln Ile Asp Ile Ser Ala Ile Leu Ala Glu Ala Ile Arg Arg Leu His

    290                 295                 300

aac ggg gaa agt gtg tcg tac ctg ttc aat aac gct gtc atg tag        957

Asn Gly Glu Ser Val Ser Tyr Leu Phe Asn Asn Ala Val Met

305                 310                 315

<210>4

<211>318

<212>PRT

<213>人工的

<220>

<223>合成的构建体

<400>4

Met Ser Ser Asn Ser Ile Lys Leu Leu Ala Gly Asn Ser His Pro Asp

1               5                   10                  15

Leu Ala Glu Lys Val Ser Val Arg Leu Gly Val Pro Leu Ser Lys Ile

            20                  25                  30

Gly Val Tyr His Tyr Ser Asn Lys Glu Thr Ser Val Thr Ile Gly Glu

        35                  40                  45

Ser Ile Arg Asp Glu Asp Val Tyr Ile Ile Gln Thr Gly Thr Gly Glu

    50                  55                  60

Gln Glu Ile Asn Asp Phe Leu Met Glu Leu Leu Ile Met Ile His Ala

65                  70                  75                  80

Cys Arg Ser Ala Ser Ala Arg Lys Ile Thr Ala Val Ile Pro Asn Phe

                85                  90                  95

Pro Tyr Ala Arg Gln Asp Lys Lys Asp Lys Ser Arg Ala Pro Ile Thr

            100                 105                 110

Ala Lys Leu Val Ala Lys Met Leu Glu Thr Ala Gly Cys Asn His Val

        115                 120                 125

Ile Thr Met Asp Ile His Ala Ser Gln Ile Gln Gly Phe Phe His Ile

    130                 135                 140

Pro Val Asp Asn Leu Tyr Ala Glu Pro Asn Ile Leu His Tyr Ile Gln

145                 150                 155                 160

His Asn Val Asp Phe Gln Asn Ser Met Leu Val Ala Pro Asp Ala Gly

                165                 170                 175

Ser Ala Lys Arg Thr Ser Thr Leu Ser Asp Lys Leu Asn Leu Asn Phe

            180                 185                 190

Ala Leu Ile Gln Lys Glu Arg Gln Lys Ala Asn Glu Val Ser Arg Met

        195                 200                 205

Val Leu Val Gly Asp Val Ala Asp Lys Ser Cys Ile Ile Val Asp Asp

    210                 215                 220

Met Ala Asp Thr Cys Gly Thr Leu Val Lys Ala Thr Asp Thr Leu Ile

225                 230                 235                 240

Glu Asn Gly Ala Lys Glu Val Ile Ala Ile Val Thr His Gly Ile Phe

                245                 250                 255

Ser Gly Gly Ala Arg Glu Lys Leu Arg Asn Ser Lys Leu Ala Arg Ile

            260                 265                 270

Val Ser Thr Asn Thr Val Pro Val Asp Leu Asn Leu Asp Ile Tyr His

        275                 280                 285

Gln Ile Asp Ile Ser Ala Ile Leu Ala Glu Ala Ile Arg Arg Leu His

    290                 295                 300

Asn Gly Glu Ser Val Ser Tyr Leu Phe Asn Asn Ala Val Met

305                 310                 315

<210>5

<211>21

<212>DNA

<213>人工的

<220>

<223>引物

<400>5

ggatccaata tgtcgtccaa t                                                       21

<210>6

<211>18

<212>DNA

<213>人工的

<220>

<223>引物

<400>6

ggatcctaca tgacagcg                                                       18

<210>7

<211>64

<212>PRT

<213>棉阿舒囊霉

<400>7

Leu His Ala Ser Gln Ile Gln Gly Phe Phe His Ile Pro Val Asp Asn

1               5                   10                  15

Leu Tyr Ala Glu Pro Asn Ile Leu His Tyr Ile Gln His Asn Val Asp

            20                  25                  30

Phe Gln Asn Ser Met Leu Val Ala Pro Asp Ala Gly Ser Ala Lys Arg

        35                  40                  45

Thr Ser Thr Leu Ser Asp Lys Leu Asn Leu Asn Phe Ala Leu Ile His

    50                  55                  60

<210>8

<211>81

<212>PRT

<213>棉阿舒囊霉

<400>8

Thr Met Asp Leu His Ala Ser Gln Ile Gln Gly Phe Phe His Ile Pro

1               5                   10                  15

Val Asp Asn Leu Tyr Ala Glu Pro Asn Ile Leu His Tyr Ile Gln His

            20                  25                  30

Asn Val Asp Phe Gln Asn Ser Met Leu Val Ala Pro Asp Ala Gly Ser

        35                  40                  45

Ala Lys Arg Thr Ser Thr Leu Ser Asp Lys Leu Asn Leu Asn Phe Ala

    50                  55                  60

Leu Ile His Lys Glu Arg Gln Lys Ala Asn Glu Val Ser Arg Met Val

65                  70                  75                  80

Leu

<210>9

<211>91

<212>PRT

<213>棉阿舒囊霉

<400>9

Leu Glu Thr Ala Gly Cys Asn His Val Ile Thr Met Asp Leu His Ala

1               5                   10                  15

Ser Gln Ile Gln Gly Phe Phe His Ile Pro Val Asp Asn Leu Tyr Ala

            20                  25                  30

Glu Pro Asn Ile Leu His Tyr Ile Gln His Asn Val Asp Phe Gln Asn

        35                  40                  45

Ser Met Leu Val Ala Pro Asp Ala Gly Ser Ala Lys Arg Thr Ser Thr

    50                  55                  60

Leu Ser Asp Lys Leu Asn Leu Asn Phe Ala Leu Ile His Lys Glu Arg

65                  70                  75                  80

Gln Lys Ala Asn Glu Val Ser Arg Met Val Leu

                85                  90

<210>10

<211>111

<212>PRT

<213>棉阿舒囊霉

<400>10

Pro Ile Thr Ala Lys Leu Val Ala Lys Met Leu Glu Thr Ala Gly Cys

1               5                   10                  15

Asn His Val Ile Thr Met Asp Leu His Ala Ser Gln Ile Gln Gly Phe

            20                  25                  30

Phe His Ile Pro Val Asp Asn Leu Tyr Ala Glu Pro Asn Ile Leu His

        35                  40                  45

Tyr Ile Gln His Asn Val Asp Phe Gln Asn Ser Met Leu Val Ala Pro

    50                  55                  60

Asp Ala Gly Ser Ala Lys Arg Thr Ser Thr Leu Ser Asp Lys Leu Asn

65                  70                  75                  80

Leu Asn Phe Ala Leu Ile His Lys Glu Arg Gln Lys Ala Asn Glu Val

                85                  90                  95

Ser Arg Met Val Leu Val Gly Asp Val Ala Asp Lys Ser Cys Ile

            100                 105                 110

<210>11

<211>131

<212>PRT

<213>棉阿舒囊霉

<400>11

Arg Gln Asp Lys Lys Asp Lys Ser Arg Ala Pro Ile Thr Ala Lys Leu

1               5                   10                  15

Val Ala Lys Met Leu Glu Thr Ala Gly Cys Asn His Val Ile Thr Met

            20                  25                  30

Asp Leu His Ala Ser Gln Ile Gln Gly Phe Phe His Ile Pro Val Asp

        35                  40                  45

Asn Leu Tyr Ala Glu Pro Asn Ile Leu His Tyr Ile Gln His Asn Val

    50                  55                  60

Asp Phe Gln Asn Ser Met Leu Val Ala Pro Asp Ala Gly Ser Ala Lys

65                  70                  75                  80

Arg Thr Ser Thr Leu Ser Asp Lys Leu Asn Leu Asn Phe Ala Leu Ile

                85                  90                  95

His Lys Glu Arg Gln Lys Ala Asn Glu Val Ser Arg Met Val Leu Val

            100                 105                 110

Gly Asp Val Ala Asp Lys Ser Cys Ile Ile Val Asp Asp Met Ala Asp

        115                 120                 125

Thr Cys Gly

    130

<210>12

<211>1456

<212>DNA

<213>玉蜀黍

<220>

<221>CDS

<222>(79)..(1278)

<400>12

ttcgtataga ccggattaaa accctaggcc ctagccaccg cccaccgtcg cctcagcaaa     60

tcctcctccc gtttcacc atg ccg ccc tgc tgc tcc ccc acc acc tcc gcc      111

                    Met Pro Pro Cys Cys Ser Pro Thr Thr Ser Ala

                    1               5                   10

gtc acc gct gcg gcg gca tct ccc ggc gcc tcg cgc agc ggg ggc ctc      159

Val Thr Ala Ala Ala Ala Ser Pro Gly Ala Ser Arg Ser Gly Gly Leu

            15                  20                  25

ctg cgc cgc tcg cgc cca gcc ccc gcc gcc gtg aat tgt aaa aag att      207

Leu Arg Arg Ser Arg Pro Ala Pro Ala Ala Val Asn Cys Lys Lys Ile

        30                  35                  40

gat tct ctg agg tca atc aat gga gca cca cct tgc att ccg gtg tcc      255

Asp Ser Leu Arg Ser Ile Asn Gly Ala Pro Pro Cys Ile Pro Val Ser

    45                  50                  55

aac agg tcg tta ttg act cct gta acc ttg cca gtt ttc cgg gat cca      303

Asn Arg Ser Leu Leu Thr Pro Val Thr Leu Pro Val Phe Arg Asp Pro

60                  65                  70                  75

aac atg agg aac gac acg agg ctg cgc atc ttc tca ggc aca gcc aat      351

Asn Met Arg Asn Asp Thr Arg Leu Arg Ile Phe Ser Gly Thr Ala Asn

                80                  85                  90

cct tcc ctt tcc cag gag ata gca agt tac ttg ggg cta gaa ctt ggg      399

Pro Ser Leu Ser Gln Glu Ile Ala Ser Tyr Leu Gly Leu Glu Leu Gly

            95                  100                 105

aag ata acc ata aag agg ttt gct gat ggt gaa ata tat gtt cag ttg      447

Lys Ile Thr Ile Lys Arg Phe Ala Asp Gly Glu Ile Tyr Val Gln Leu

        110                 115                 120

caa gaa agt gta cgg ggc tgt gat gtt ttc ctt gtg caa ccg tcg tgt      495

Gln Glu Ser Val Arg Gly Cys Asp Val Phe Leu Val Gln Pro Ser Cys

    125                 130                 135

cct cca gca aat gaa aat ctt atg gag ctt ctg atc atg att gat gcc     543

Pro Pro Ala Asn Glu Asn Leu Met Glu Leu Leu Ile Met Ile Asp Ala

140                 145                 150                 155

tgt agg aga gca tct gct aag aat atc act gca gtt atc cct tat ttt     591

Cys Arg Arg Ala Ser Ala Lys Asn Ile Thr Ala Val Ile Pro Tyr Phe

                160                 165                 170

ggt tat gca agg gct gac agg aag tcc cag ggc agg gaa tct ata gct     639

Gly Tyr Ala Arg Ala Asp Arg Lys Ser Gln Gly Arg Glu Ser Ile Ala

            175                 180                 185

gca aaa ctt gta gct aat atg att acc gaa gct ggt gcc aac cgt gtc     687

Ala Lys Leu Val Ala Asn Met Ile Thr Glu Ala Gly Ala Asn Arg Val

        190                 195                 200

ctt gtt tgt gat ctt cat tct agt caa gca atg gga tac ttt gac atc     735

Leu Val Cys Asp Leu His Ser Ser Gln Ala Met Gly Tyr Phe Asp Ile

    205                 210                 215

cca gta gat cac gtt tat ggc cag cct gtt att ctt gat tat ctc gcc     783

Pro Val Asp His Val Tyr Gly Gln Pro Val Ile Leu Asp Tyr Leu Ala

220                 225                 230                 235

agc aag aca ata tgt tca gat gac ttg gta gtt gta tct cct gat gtt     831

Ser Lys Thr Ile Cys Ser Asp Asp Leu Val Val Val Ser Pro Asp Val

                240                 245                 250

gga ggt gtt gcc agg gca cgt gcc ttt gcc aaa aag ctg tca gat gca     879

Gly Gly Val Ala Arg Ala Arg Ala Phe Ala Lys Lys Leu Ser Asp Ala

            255                 260                 265

cct cta gct att gta gat aaa aga agg caa gga cat aat gtc gct gag     927

Pro Leu Ala Ile Val Asp Lys Arg Arg Gln Gly His Asn Val Ala Glu

        270                 275                 280

gtg atg aat ctt att gga gac gtg aga gga aaa gtg gct gtt atg atg     975

Val Met Asn Leu Ile Gly Asp Val Arg Gly Lys Val Ala Val Met Met

    285                 290                 295

gat gat atg atc gac aca gca ggt acc att tcc aaa gga gct gag cta    1023

Asp Asp Met Ile Asp Thr Ala Gly Thr Ile Ser Lys Gly Ala Glu Leu

300                 305                 310                 315

ctg cac cag gaa ggc gcc cga gaa gta tat gct tgc tgc aca cat ggt    1071

Leu His Gln Glu Gly Ala Arg Glu Val Tyr Ala Cys Cys Thr His Gly

                320                 325                 330

gtt ttt agc cca ccc gcc atc gaa agg cta tca agt gga ttg ttc caa    1119

Val Phe Ser Pro Pro Ala Ile Glu Arg Leu Ser Ser Gly Leu Phe Gln

            335                 340                 345

gaa gta atc atc aca aac acc atc cct ctg aag gag gag aag agt ttt    1167

Glu Val Ile Ile Thr Asn Thr Ile Pro Leu Lys Glu Glu Lys Ser Phe

        350                 355                 360

ccg cag ctg act att ctt tcg gtt gct aac ctc ttg ggg gaa aca atc    1215

Pro Gln Leu Thr Ile Leu Ser Val Ala Asn Leu Leu Gly Glu Thr Ile

    365                 370                 375

tgg cgc gtt cac gat gat tgc tcg gtt ggt cat gag cca tac tcc agc    1263

Trp Arg Val His Asp Asp Cys Ser Val Gly His Glu Pro Tyr Ser Ser

380                 385                 390                 395

ttg gat att gac tga tgcttaagga atagttgtgg cagctcgcaa ccttctcttt    1318

Leu Asp Ile Asp

cttttctttt ggcctcggtt tttgtctgtg cgtgtaataa gcaatgtttt tgtggaattc  1378

tgttagcgca gaacctcagc cttgtatttg agtgacagca cataagatga cattccagat  1438

tcaaaaaaaa aaaaaaaa                                                1456

<210>13

<211>399

<212>PRT

<213>玉蜀黍

<400>13

Met Pro Pro Cys Cys Ser Pro Thr Thr Ser Ala Val Thr Ala Ala Ala

1               5                   10                  15

Ala Ser Pro Gly Ala Ser Arg Ser Gly Gly Leu Leu Arg Arg Ser Arg

            20                  25                  30

Pro Ala Pro Ala Ala Val Asn Cys Lys Lys Ile Asp Ser Leu Arg Ser

        35                  40                  45

Ile Asn Gly Ala Pro Pro Cys Ile Pro Val Ser Asn Arg Ser Leu Leu

    50                  55                  60

Thr Pro Val Thr Leu Pro Val Phe Arg Asp Pro Asn Met Arg Asn Asp

65                  70                  75                  80

Thr Arg Leu Arg Ile Phe Ser Gly Thr Ala Asn Pro Ser Leu Ser Gln

                85                  90                  95

Glu Ile Ala Ser Tyr Leu Gly Leu Glu Leu Gly Lys Ile Thr Ile Lys

            100                 105                 110

Arg Phe Ala Asp Gly Glu Ile Tyr Val Gln Leu Gln Glu Ser Val Arg

        115                 120                 125

Gly Cys Asp Val Phe Leu Val Gln Pro Ser Cys Pro Pro Ala Asn Glu

    130                 135                 140

Asn Leu Met Glu Leu Leu Ile Met Ile Asp Ala Cys Arg Arg Ala Ser

145                 150                 155                 160

Ala Lys Asn Ile Thr Ala Val Ile Pro Tyr Phe Gly Tyr Ala Arg Ala

                165                 170                 175

Asp Arg Lys Ser Gln Gly Arg Glu Ser Ile Ala Ala Lys Leu Val Ala

            180                 185                 190

Asn Met Ile Thr Glu Ala Gly Ala Asn Arg Val Leu Val Cys Asp Leu

        195                 200                 205

His Ser Ser Gln Ala Met Gly Tyr Phe Asp Ile Pro Val Asp His Val

    210                 215                 220

Tyr Gly Gln Pro Val Ile Leu Asp Tyr Leu Ala Ser Lys Thr Ile Cys

225                 230                 235                 240

Ser Asp Asp Leu Val Val Val Ser Pro Asp Val Gly Gly Val Ala Arg

                245                 250                 255

Ala Arg Ala Phe Ala Lys Lys Leu Ser Asp Ala Pro Leu Ala Ile Val

            260                 265                 270

Asp Lys Arg Arg Gln Gly His Asn Val Ala Glu Val Met Asn Leu Ile

        275                 280                 285

Gly Asp Val Arg Gly Lys Val Ala Val Met Met Asp Asp Met Ile Asp

    290                 295                 300

Thr Ala Gly Thr Ile Ser Lys Gly Ala Glu Leu Leu His Gln Glu Gly

305                 310                 315                 320

Ala Arg Glu Val Tyr Ala Cys Cys Thr His Gly Val Phe Ser Pro Pro

                325                 330                 335

Ala Ile Glu Arg Leu Ser Ser Gly Leu Phe Gln Glu Val Ile Ile Thr

            340                 345                 350

Asn Thr Ile Pro Leu Lys Glu Glu Lys Ser Phe Pro Gln Leu Thr Ile

        355                 360                 365

Leu Ser Val Ala Asn Leu Leu Gly Glu Thr Ile Trp Arg Val His Asp

    370                 375                 380

Asp Cys Ser Val Gly His Glu Pro Tyr Ser Ser Leu Asp Ile Asp

385                 390                 395

<210>14

<211>64

<212>PRT

<213>人工的

<220>

<223>来自具有点突变的PRS的ADP结合位点

<400>14

Ile His Ala Ser Gln Ile Gln Gly Phe Phe His Ile Pro Val Asp Asn

1               5                   10                  15

Leu Tyr Ala Glu Pro Asn Ile Leu His Tyr Ile Gln His Asn Val Asp

            20                  25                  30

Phe Gln Asn Ser Met Leu Val Ala Pro Asp Ala Gly Ser Ala Lys Arg

        35                  40                  45

Thr Ser Thr Leu Ser Asp Lys Leu Asn Leu Asn Phe Ala Leu Ile Gln

    50                  55                  60

<210>15

<211>81

<212>PRT

<213>人工的

<220>

<223>来自具有点突变的PRS的ADP结合位点

<400>15

Thr Met Asp Ile His Ala Ser Gln Ile Gln Gly Phe Phe His Ile Pro

1               5                   10                  15

Val Asp Asn Leu Tyr Ala Glu Pro Asn Ile Leu His Tyr Ile Gln His

            20                  25                  30

Asn Val Asp Phe Gln Asn Ser Met Leu Val Ala Pro Asp Ala Gly Ser

        35                  40                  45

Ala Lys Arg Thr Ser Thr Leu Ser Asp Lys Leu Asn Leu Asn Phe Ala

    50                  55                  60

Leu Ile Gln Lys Glu Arg Gln Lys Ala Asn Glu Val Ser Arg Met Val

65                  70                  75                  80

Leu

<210>16

<211>91

<212>PRT

<213>人工的

<220>

<223>来自具有点突变的PRS的ADP结合位点

<400>16

Leu Glu Thr Ala Gly Cys Asn His Val Ile Thr Met Asp Ile His Ala

1               5                   10                  15

Ser Gln Ile Gln Gly Phe Phe His Ile Pro Val Asp Asn Leu Tyr Ala

            20                  25                  30

Glu Pro Asn Ile Leu His Tyr Ile Gln His Asn Val Asp Phe Gln Asn

        35                  40                  45

Ser Met Leu Val Ala Pro Asp Ala Gly Ser Ala Lys Arg Thr Ser Thr

    50                  55                  60

Leu Ser Asp Lys Leu Asn Leu Asn Phe Ala Leu Ile Gln Lys Glu Arg

65                  70                  75                  80

Gln Lys Ala Asn Glu Val Ser Arg Met Val Leu

                85                  90

<210>17

<211>111

<212>PRT

<213>人工的

<220>

<223>来自具有点突变的PRS的ADP结合位点

<400>17

Pro Ile Thr Ala Lys Leu Val Ala Lys Met Leu Glu Thr Ala Gly Cys

1               5                   10                  15

Asn His Val Ile Thr Met Asp Ile His Ala Ser Gln Ile Gln Gly Phe

            20                  25                  30

Phe His Ile Pro Val Asp Asn Leu Tyr Ala Glu Pro Asn Ile Leu His

        35                  40                  45

Tyr Ile Gln His Asn Val Asp Phe Gln Asn Ser Met Leu Val Ala Pro

    50                  55                  60

Asp Ala Gly Ser Ala Lys Arg Thr Ser Thr Leu Ser Asp Lys Leu Asn

65                  70                  75                  80

Leu Asn Phe Ala Leu Ile Gln Lys Glu Arg Gln Lys Ala Asn Glu Val

                85                  90                  95

Ser Arg Met Val Leu Val Gly Asp Val Ala Asp Lys Ser Cys Ile

            100                 105                 110

<210>18

<211>131

<212>PRT

<213>人工的

<220>

<223>来自具有点突变的PRS的ADP结合位点

<400>18

Arg Gln Asp Lys Lys Asp Lys Ser Arg Ala Pro Ile Thr Ala Lys Leu

1               5                   10                  15

Val Ala Lys Met Leu Glu Thr Ala Gly Cys Asn His Val Ile Thr Met

            20                  25                  30

Asp Ile His Ala Ser Gln Ile Gln Gly Phe Phe His Ile Pro Val Asp

        35                  40                  45

Asn Leu Tyr Ala Glu Pro Asn Ile Leu His Tyr Ile Gln His Asn Val

    50                  55                  60

Asp Phe Gln Asn Ser Met Leu Val Ala Pro Asp Ala Gly Ser Ala Lys

65                  70                  75                  80

Arg Thr Ser Thr Leu Ser Asp Lys Leu Asn Leu Asn Phe Ala Leu Ile

                85                  90                  95

Gln Lys Glu Arg Gln Lys Ala Asn Glu Val Ser Arg Met Val Leu Val

            100                 105                 110

Gly Asp Val Ala Asp Lys Ser Cys Ile Ile Val Asp Asp Met Ala Asp

        115                 120                 125

Thr Cys Gly

    130

<210>19

<211>62

<212>PRT

<213>地中海伞藻

<400>19

Met Ala Ser Ile Met Met Asn Lys Ser Val Val Leu Ser Lys Glu Cys

1               5                   10                  15

Ala Lys Pro Leu Ala Thr Pro Lys Val Thr Leu Asn Lys Arg Gly Phe

            20                  25                  30

Ala Thr Thr Ile Ala Thr Lys Asn Arg Glu Met Met Val Trp Gln Pro

        35                  40                  45

Phe Asn Asn Lys Met Phe Glu Thr Phe Ser Phe Leu Pro Pro

    50                  55                  60

<210>20

<211>90

<212>PRT

<213>拟南芥

<400>20

Met Ala Ala Ser Leu Gln Ser Thr Ala Thr Phe Leu Gln Ser Ala Lys

1               5                   10                  15

Ile Ala Thr Ala Pro Ser Arg Gly Ser Ser His Leu Arg Ser Thr Gln

            20                  25                  30

Ala Val Gly Lys Ser Phe Gly Leu Glu Thr Ser Ser Ala Arg Leu Thr

        35                  40                  45

Cys Ser Phe Gln Ser Asp Phe Lys Asp Phe Thr Gly Lys Cys Ser Asp

    50                  55                  60

Ala Val Lys Ile Ala Gly Phe Ala Leu Ala Thr Ser Ala Leu Val Val

65                  70                  75                  80

Ser Gly Ala Ser Ala Glu Gly Ala Pro Lys

                85                  90

<210>21

<211>96

<212>PRT

<213>拟南芥

<400>21

Met Ala Gln Val Ser Arg Ile Cys Asn Gly Val Gln Asn Pro Ser Leu

1               5                   10                  15

Ile Cys Asn Leu Ser Lys Ser Ser Gln Arg Lys Ser Pro Leu Ser Val

            20                  25                  30

Ser Leu Lys Thr Gln Gln His Pro Arg Ala Tyr Pro Ile Ser Ser Ser

        35                  40                  45

Trp Gly Leu Lys Lys Ser Gly Met Thr Leu Ile Gly Ser Glu Leu Arg

    50                  55                  60

Pro Leu Lys Val Met Ser Ser Val Ser Thr Ala Glu Lys Ala Ser Glu

65                  70                  75                  80

Ile Val Leu Gln Pro Ile Arg Glu Ile Ser Gly Leu Ile Lys Leu Pro

                85                  90                  95

<210>22

<211>100

<212>PRT

<213>拟南芥

<400>22

Met Ala Ala Ala Thr Thr Thr Thr Thr Thr Ser Ser Ser Ile Ser Phe

1               5                   10                  15

Ser Thr Lys Pro Ser Pro Ser Ser Ser Lys Ser Pro Leu Pro Ile Ser

            20                  25                  30

Arg Phe Ser Leu Pro Phe Ser Leu Asn Pro Asn Lys Ser Ser Ser Ser

        35                  40                  45

Ser Arg Arg Arg Gly Ile Lys Ser Ser Ser Pro Ser Ser Ile Ser Ala

    50                  55                  60

Val Leu Asn Thr Thr Thr Asn Val Thr Thr Thr Pro Ser Pro Thr Lys

65                  70                  75                  80

Pro Thr Lys Pro Glu Thr Phe Ile Ser Arg Phe Ala Pro Asp Gln Pro

                85                  90                  95

Arg Lys Gly Ala

            100

<210>23

<211>46

<212>PRT

<213>拟南芥

<400>23

Met Ile Thr Ser Ser Leu Thr Cys Ser Leu Gln Ala Leu Lys Leu Ser

1               5                   10                  15

Ser Pro Phe Ala His Gly Ser Thr Pro Leu Ser Ser Leu Ser Lys Pro

            20                  25                  30

Asn Ser Phe Pro Asn His Arg Met Pro Ala Leu Val Pro Val

        35                  40                  45

<210>24

<211>93

<212>PRT

<213>拟南芥

<400>24

Met Ala Ser Leu Leu Gly Thr Ser Ser Ser Ala Ile Trp Ala Ser Pro

1               5                   10                  15

Ser Leu Ser Ser Pro Ser Ser Lys Pro Ser Ser Ser Pro Ile Cys Phe

            20                  25                  30

Arg Pro Gly Lys Leu Phe Gly Ser Lys Leu Asn Ala Gly Ile Gln Ile

        35                  40                  45

Arg Pro Lys Lys Asn Arg Ser Arg Tyr His Val Ser Val Met Asn Val

    50                  55                  60

Ala Thr Glu Ile Asn Ser Thr Glu Gln Val Val Gly Lys Phe Asp Ser

65                  70                  75                  80

Lys Lys Ser Ala Arg Pro Val Tyr Pro Phe Ala Ala Ile

                85                  90

<210>25

<211>52

<212>PRT

<213>拟南芥

<400>25

Met Ala Ser Thr Ala Leu Ser Ser Ala Ile Val Gly Thr Ser Phe Ile

1               5                   10                  15

Arg Arg Ser Pro Ala Pro Ile Ser Leu Arg Ser Leu Pro Ser Ala Asn

            20                  25                  30

Thr Gln Ser Leu Phe Gly Leu Lys Ser Gly Thr Ala Arg Gly Gly Arg

        35                  40                  45

Val Val Ala Met

    50

<210>26

<211>39

<212>PRT

<213>拟南芥

<400>26

Met Ala Ala Ser Thr Met Ala Leu Ser Ser Pro Ala Phe Ala Gly Lys

1               5                   10                  15

Ala Val Asn Leu Ser Pro Ala Ala Ser Glu Val Leu Gly Ser Gly Arg

            20                  25                  30

Val Thr Asn Arg Lys Thr Val

        35

<210>27

<211>92

<212>PRT

<213>拟南芥

<400>27

Met Ala Ala Ile Thr Ser Ala Thr Val Thr Ile Pro Ser Phe Thr Gly

1               5                   10                  15

Leu Lys Leu Ala Val Ser Ser Lys Pro Lys Thr Leu Ser Thr Ile Ser

            20                  25                  30

Arg Ser Ser Ser Ala Thr Arg Ala Pro Pro Lys Leu Ala Leu Lys Ser

        35                  40                  45

Ser Leu Lys Asp Phe Gly Val Ile Ala Val Ala Thr Ala Ala Ser Ile

    50                  55                  60

Val Leu Ala Gly Asn Ala Met Ala Met Glu Val Leu Leu Gly Ser Asp

65                  70                  75                  80

Asp Gly Ser Leu Ala Phe Val Pro Ser Glu Phe Thr

                85                  90

<210>28

<211>85

<212>PRT

<213>拟南芥

<400>28

Met Ala Ala Ala Val Ser Thr Val Gly Ala Ile Asn Arg Ala Pro Leu

1               5                   10                  15

Ser Leu Asn Gly Ser Gly Ser Gly Ala Val Ser Ala Pro Ala Ser Thr

            20                  25                  30

Phe Leu Gly Lys Lys Val Val Thr Val Ser Arg Phe Ala Gln Ser Asn

        35                  40                  45

Lys Lys Ser Asn Gly Ser Phe Lys Val Leu Ala Val Lys Glu Asp Lys

    50                  55                  60

Gln Thr Asp Gly Asp Arg Trp Arg Gly Leu Ala Tyr Asp Thr Ser Asp

65                  70                  75                  80

Asp Gln Ile Asp Ile

                85

<210>29

<211>54

<212>PRT

<213>拟南芥

<400>29

Met Lys Ser Ser Met Leu Ser Ser Thr Ala Trp Thr Ser Pro Ala Gln

1               5                   10                  15

Ala Thr Met Val Ala Pro Phe Thr Gly Leu Lys Ser Ser Ala Ser Phe

            20                  25                  30

Pro Val Thr Arg Lys Ala Asn Asn Asp Ile Thr Ser Ile Thr Ser Asn

        35                  40                  45

Gly Gly Arg Val Ser Cys

    50

<210>30

<211>91

<212>PRT

<213>拟南芥

<400>30

Met Ala Ala Ser Gly Thr Ser Ala Thr Phe Arg Ala Ser Val Ser Ser

1               5                   10                  15

Ala Pro Ser Ser Ser Ser Gln Leu Thr His Leu Lys Ser Pro Phe Lys

            20                  25                  30

Ala Val Lys Tyr Thr Pro Leu Pro Ser Ser Arg Ser Lys Ser Ser Ser

        35                  40                  45

Phe Ser Val Ser Cys Thr Ile Ala Lys Asp Pro Pro Val Leu Met Ala

    50                  55                  60

Ala Gly Ser Asp Pro Ala Leu Trp Gln Arg Pro Asp Ser Phe Gly Arg

65                  70                  75                  80

Phe Gly Lys Phe Gly Gly Lys Tyr Val Pro Glu

                85                  90

<210>31

<211>80

<212>PRT

<213>芸苔

<400>31

Met Ser Thr Thr Phe Cys Ser Ser Val Cys Met Gln Ala Thr Ser Leu

1               5                   10                  15

Ala Ala Thr Thr Arg Ile Ser Phe Gln Lys Pro Ala Leu Val Ser Thr

            20                  25                  30

Thr Asn Leu Ser Phe Asn Leu Arg Arg Ser Ile Pro Thr Arg Phe Ser

        35                  40                  45

Ile Ser Cys Ala Ala Lys Pro Glu Thr Val Glu Lys Val Ser Lys Ile

    50                  55                  60

Val Lys Lys Gln Leu Ser Leu Lys Asp Asp Gln Lys Val Val Ala Glu

65                  70                  75                  80

<210>32

<211>51

<212>PRT

<213>欧洲油菜

<400>32

Met Ala Thr Thr Phe Ser Ala Ser Val Ser Met Gln Ala Thr Ser Leu

1               5                   10                  15

Ala Thr Thr Thr Arg Ile Ser Phe Gln Lys Pro Val Leu Val Ser Asn

            20                  25                  30

His Gly Arg Thr Asn Leu Ser Phe Asn Leu Ser Arg Thr Arg Leu Ser

        35                  40                  45

Ile Ser Cys

    50

<210>33

<211>44

<212>PRT

<213>雷氏衣藻

<400>33

Met Gln Ala Leu Ser Ser Arg Val Asn Ile Ala Ala Lys Pro Gln Arg

1               5                   10                  15

Ala Gln Arg Leu Val Val Arg Ala Glu Glu Val Lys Ala Ala Pro Lys

            20                  25                  30

Lys Glu Val Gly Pro Lys Arg Gly Ser Leu Val Lys

        35                  40

<210>34

<211>51

<212>PRT

<213>南瓜

<400>34

Met Ala Glu Leu Ile Gln Asp Lys Glu Ser Ala Gln Ser Ala Ala Thr

1               5                   10                  15

Ala Ala Ala Ala Ser Ser Gly Tyr Glu Arg Arg Asn Glu Pro Ala His

            20                  25                  30

Ser Arg Lys Phe Leu Glu Val Arg Ser Glu Glu Glu Leu Leu Ser Cys

        35                  40                  45

Ile Lys Lys

    50

<210>35

<211>62

<212>PRT

<213>菠菜

<400>35

Met Ser Thr Ile Asn Gly Cys Leu Thr Ser Ile Ser Pro Ser Arg Thr

1               5                   10                  15

Gln Leu Lys Asn Thr Ser Thr Leu Arg Pro Thr Phe Ile Ala Asn Ser

            20                  25                  30

Arg Val Asn Pro Ser Ser Ser Val Pro Pro Ser Leu Ile Arg Asn Gln

        35                  40                  45

Pro Val Phe Ala Ala Pro Ala Pro Ile Ile Thr Pro Thr Leu

    50                  55                  60

<210>36

<211>75

<212>PRT

<213>菠菜

<400>36

Met Thr Thr Ala Val Thr Ala Ala Val Ser Phe Pro Ser Thr Lys Thr

1               5                   10                  15

Thr Ser Leu Ser Ala Arg Cys Ser Ser Val Ile Ser Pro Asp Lys Ile

            20                  25                  30

Ser Tyr Lys Lys Val Pro Leu Tyr Tyr Arg Ash Val Ser Ala Thr Gly

        35                  40                  45

Lys Met Gly Pro Ile Arg Ala Gln Ile Ala Ser Asp Val Glu Ala Pro

    50                  55                  60

Pro Pro Ala Pro Ala Lys Val Glu Lys Met Ser

65                  70                  75

<210>37

<211>55

<212>PRT

<213>菠菜

<400>37

Met Thr Thr Ala Val Thr Ala Ala Val Ser Phe Pro Ser Thr Lys Thr

1               5                   10                  15

Thr Ser Leu Ser Ala Arg Ser Ser Ser Val Ile Ser Pro Asp Lys Ile

            20                  25                  30

Ser Tyr Lys Lys Val Pro Leu Tyr Tyr Arg Asn Val Ser Ala Thr Gly

        35                  40                  45

Lys Met Gly Pro Ile Arg Ala

    50                  55

<210>38

<211>957

<212>DNA

<213>棉阿舒囊霉ATCC 10895

<400>38

atgtcgtcca atagcataaa gctgctagca ggtaactcgc acccggacct agctgagaag     60

gtctccgttc gcctaggtgt accactttcg aagattggag tgtatcacta ctctaacaaa    120

gagacgtcag ttactatcgg cgaaagtatc cgtgatgaag atgtctacat catccagaca    180

ggaacggggg agcaggaaat caacgacttc ctcatggaac tgctcatcat gatccatgcc    240

tgccggtcag cctctgcgcg gaagatcaca gcggttatac caaacttccc ttacgcaaga    300

caagacaaaa aggacaagtc gcgagcaccg ataactgcca agctggtggc caagatgcta    360

gagaccgcgg ggtgcaacca cgttatcacg atggatttgc acgcgtctca aattcagggt    420

ttcttccaca ttccagtgga caacctatat gcagagccga acatcctgca ctacatccaa    480

cataatgtgg acttccagaa tagtatgttg gtcgcgccag acgcggggtc ggcgaagcgc    540

acgtcgacgc tttcggacaa gctgaatctc aacttcgcgt tgatccacaa agaacggcag    600

aaggcgaacg aggtctcgcg gatggtgttg gtgggtgatg tcgccgacaa gtcctgtatt    660

attgtagacg acatggcgga cacgtgcgga acgctagtga aggccactga cacgctgatc    720

gaaaatgggg cgaaagaagt gattgccatt gtgacacacg gtatattttc tggcggcgcc    780

cgcgagaagt tgcgcaacag caagctggca cggatcgtaa gcacaaatac ggtgccagtg    840

gacctcaatc tagatatcta ccaccaaatt gacattagtg ccattttggc cgaggcaatt    900

agaaggcttc acaacgggga aagtgtgtcg tacctgttca ataacgctgt catgtag       957

<210>39

<211>963

<212>DNA

<213>烟曲霉Af293

<400>39

atggccacaa attcaatcaa gcttctgact ggtaacagtc accctgaact tgcgaatctc     60

gttgctgctc ggctcggcat cgagctgacc aagatcatgg tcctgcagta ttcgaattcg    120

gaaacaagtg tcacaattgg tgaaagtgta cgagacgagg atgtgttcat cttgcagtcc    180

acgaaaccga acgatatcaa tgacggatta atggagcttc ttatcatgat caacgcctgc    240

aagactgcct cggcccgccg catcacggct gtcattccca acttccccta cgcccgtcaa    300

gataagaaag acaagagccg tgcgccgatc accgcgaaat tgatggcgaa catgctccaa    360

accgctggtt gcaaccatgt catcacaatg gatcttcacg ccagtcagat tcagggcttc    420

tttaatgtcc ctgtagataa cttgtatgcc gagcctagca tgttgaagtg gatccgggaa    480

cacttggatg tgaagaattg cgtcatcgtc agtcccgatg ccggtggtgc gaagcgtgct    540

acggggattg cggaccgcct tgacctgcaa ttcgctctca ttcacaagga acgccctcgt    600

cctaacgagg tctcgcgcat ggttctcgtt ggaaacgtca aggacaagat tgcgatcatc    660

gttgacgaca tggctgatac atgcggtact ctcgtcaagg ccgctgacac tgtcatgcag    720

cacggtgcca aggaagtcaa cgccattgtc gtacacggca ttctctccgg caatgctatt    780

gagaacatca acaacagttg cttaaaacgt ctcgtcgtga ctaacacagt gccccacaag    840

gagaagaagg agctttgtga caagattgac accattgata tcagccctac gttggcggag    900

gcttgcaggc gcacacacaa tggtgaatct gtcagtttcc tgttttcgca cgctgtcgcg    960

tag                                                                  963

<210>40

<211>963

<212>DNA

<213>黑曲霉

<400>40

atggcttcga actcgatcaa gctcttgact ggtaacagtc accctgagct tgcaaacctc     60

gtggcagctc ggcttggcat tgaactgacc aagatcatgg tcctccaata ttcgaaccag    120

gaaacgagtg tcacaatcgg agagagtgta cgagatgagg atgttttcat cttgcagtcg    180

acgcggccca atgatatcaa cgatggactg atggagctgc tcatcatgat caatgcttgc    240

aagaccgcct ccgcaagacg tatcacggcc gtcattccca actttcccta tgcgcgccaa    300

gataagaagg ataagagccg tgctcctatc actgccaagc ttatggcaaa catgctccag    360

actgctggtt gcaaccacgt catcaccatg gacctccatg ccagccagat ccaaggcttc    420

ttcaacgttc ccgtcgataa cctgtatgcc gagcctagta tactgaagtg gattcgcgaa    480

cacctggatg tgagcaactg tatcattgtc agtcctgacg ctggtggtgc taagcgtgcc    540

actgccatcg ccgatcgcct cgatctccag tttgcgctca tccacaagga gcgcccccgc    600

cccaacgagg tctcgcgcat ggttctcgtt ggtagcgtca aggacaagat tgctatcatc    660

gttgacgaca tggctgatac ctgcggtact cttgtcaagg ccgccgatac tgtgatgcag    720

cacggagcta aggaagtcaa cgcgattgtt gtccacggta tcctttccgg caaggctact    780

cagaacatca acaacagctg cttgagccgt gttgttgtga ccaacactgt tcctcacgaa    840

gacaagaagg agcagtgcga taagatcgag acgatcgaca tcagccccac ccttgcagag  900

gcctgcagac gtacgcacaa cggcgagtct gtgagcttcc tgttctcgca cgctgttgcc  960

taa                                                                963

<210>41

<211>960

<212>DNA

<213>光滑假丝酵母CBS138

<400>41

atgtctacaa atagcattaa actgttggca ggtaactcgc accctgagct tgctgagctt     60

ttgtcgagaa gactgggcat tccattgtcg aaggtcggtg tgtatcagta ctcgaacacc    120

gagacttcag ttactattgg tgaaagtata cgtgatgagg atgtgtacat tatacagacg    180

ggtattggtg cacaagaggt gaacgatttt ctgatggagc tgctgattct tatccatgct    240

tgcaaaaccg catcagtgag gagaatcaca gcggttatcc caaacttccc ttacgctaga    300

caggacaaaa aagataaatc acgtgcgcca attactgcca agctaatcgc taagatgttg    360

gagactgcag gatgtgacca tgtcatcacc atggacctac acgcctctca gatacaaggt    420

ttcttccaca tccctgtgga taacctgtat gcagagccaa gtgtcctaaa ttacataaga    480

aetaagaccg atttgaagaa cactatactg gtgtccccag atgccggtgg tgcgaagagg    540

gttgcttctc ttgcagacaa gctggacttg aactttgctt tgattcacaa ggagaggcaa    600

aaggccaatg aagtttccag gatggtcctt gtcggtgatg ttcaaggtaa atcatgtctc    660

ttgattgacg atatggcgga cacttgtggt acattggtga aggcttgtga tactttactt    720

gaacacggtg ccaaggaagt tattgccatt gtaacacatg gtatattttc tggttcagca    780

agagaaaagt tagctaacag taaactgtcc aagatcgtat gcacaaatac agttcctgtg    840

gatatcgatc ttccgattgt agaccaagtt gatataagtc caactttagc agaagccata    900

aaaagattac ataacggtga atccgtgtct tatcttttca ctcacgctcc accagcctga    960

<210>42

<211>963

<212>DNA

<213>粗球孢子菌RS

<400>42

atggctacga attctatcaa gctattgact ggaaacagtc acccggagct agcgcagctg     60

gttgccgata ggcttgggat cgagttgacg cgggtcatgg tttcgcagta ttcaaaccag    120

gagaccagcg tcactattgg agaaagtgtg agagatgaag atgtttttat tttacaatcg    180

acacgaccta atgatatcaa tgacggcctt atggaactcc ttattatgat aaacgcttgc    240

aaaactgctt ctgcgagacg catcactgct gtcattccca acttccccta tgctcgccaa    300

gacaaaaagg ataagagtcg cgcacccatc acagccaaac tcatggccaa tatgctccag    360

actgctgggt gcaatcacgt tatcaccatg gatctccatg ccagtcagat tcaaggattt    420

ttcaatgtgc ctgtggacaa cctctacgct gagccaagca tgttgcgatg gattcgtcag    480

aaccttgatg tatccaactg cgttatcgtc agtccagatg ctggtggtgc caaacgtgcc    540

actgccattg cagatcggct tgatctccag ttcgctctta ttcataagga acgaccacgg    600

ccaaatgagg tctctcgcat ggttcttgta ggcagcgtta aggataagat tgctattatt    660

gttgatgaca tggccgatac ttgcggtaca ctggtcaaag ctgctagcac cctcatcgac    720

aacggtgcga aggaagtcct cgctattgtg acacacggca ttcttagtgg gaaggccatt    780

gagacgctga ataccgggcg attgagtcgt attgtcgtta cgaatacagt gccgcatgag    840

gaaaagaagt tactctgtga taagatcgag actatcgaca tcagtcctgt gttggcggag    900

gcatgtcgac gaacgcataa cggggagtca gttagcttcc tgttttcgca tgcggtgtcc    960

taa                                                                  963

<210>43

<211>972

<212>DNA

<213>汉逊德巴利酵母CBS767

<400>43

atgacagcat ctcagaacgc tataaagctc ttacacggta attctcaccc tgaacttgcc     60

aagttaattt cgaaaaaatt aggtataggt ttagctaagg tgggtgcttt ccaatataca    120

aataaagaga cagccgttgc agtaggagaa tccgtaagag atgaagacgt ttacattatc    180

caaacaggat gtggtgaagg agaaataaat gattttttaa tggaactact tattattata    240

aatgcttgta aaactgctag tgcaagaaga atcactgctg ttataccaaa tttcccttac    300

gccagacaag ataaaaaaga taaatcaaga gctcctatca ccgcaaaatt gatagcaaat    360

ctcttgcaaa cagcaggatg taaccatgtt ataacattag atttgcatgc atctcaaatt    420

caagggtttt tcagagtgcc ggttgataac ttgtatgctg aaccctccgt attaagacat    480

atcaaagata attatggtaa agaggactta attattgttt ctcctgatgc tggcggtgcc    540

aagagagttg catcgattgc tgataaatta gatgttaatt ttgctttgat tcataaagaa    600

agacaaaaag ccaatgaagt ttcaaaaatg gttctcgtag gtgatgtcac taataagtca    660

tgtttattaa ttgacgatat ggctgatact tgtggtactt tggttaaagc agctgatgtt    720

ttattaaaaa atggtgctaa gaaggtagtc gcaataatca cacacggtat attctcttcg    780

aatgcaattg aaaaacttaa taattcgaat ctcgataaaa tcatatgtac caattctatg    840

ccattagaga ataagttatc ccaatgtccc aaattagaga taatagatat aagtgctact    900

ttagctgagg ctattagaag gttacataac ggtgaaagtg tgtcttattt atttaacaac    960

gctcctgctt ga                                                        972

<210>44

<211>975

<212>DNA

<213>乳酸克鲁维酵母

<400>44

atggaaacga gtaaaagaat gagtaccaat agcatcaaat tattggctgg taactctcat     60

cccgagctag ctcagaatat tgctagaacc cttgggttgc gcttgtccaa catcggagtt    120

taccagtact ctaatcagga aacttctgtc actatcgggg agagtatacg tgatgaggac    180

gtgtacatta ttcaaactgg tacaggggag caagagatta acgatttctt gatggaatta    240

ttgattataa ttcatgcatg cagaacagct tctgctagaa gaatcactgc cgtgattccg    300

aattttccat atgcaagaca ggataaaaag gataaatctc gtgctccaat cacagcgaaa    360

ttagtagcac agatgttgga aactgctgga tgtgatcacg tcatcactat ggacctacat    420

gcttctcaaa ttcaaggttt cttccatatt cctgtggata atctttacgc cgaaccaagt    480

gttctaaaat atattcaaca taaaactgac atcggtaatg cgatccttgt atcgcctgat    540

gccggcggtg ctaagagagt tgcttctctg gcagataagc tagatttgaa cttcgcgtta    600

atccataagg aaagacaaaa ggctaacgag gtttctcgta tggtgcttgt gggtgatgtt    660

acagggaagt catgtctatt gatcgatgac atggctgata catgtggtac cttggttaag    720

gcgtcagata cactattaga gcatggtgct aaggaggtat tggccattgt cactcatggt    780

atcttctctg gatctgcaga acagaaattg aagaatagta aactatcaag gatcgtgtgc    840

actaatacag ttcctgtcga cttggacgtt aatattctgg accaaattga tatcagccct    900

accctagcgg aggcgatcag aagattgcat aatggggaaa gtgtgtcata tctatttaca    960

catgcggcta tatag                                                     975

<210>45

<211>969

<212>DNA

<213>洛德酵母NRRL YB-4239

<400>45

atgcatcaac gattaccaaa ctcaatcaag attctagctg ggaactcgca tatagattta     60

tgtgaaaaaa ttgcaaagag attaggtata aacatagcaa gggttggtgc ctttcaatac    120

acaaacacag agacagccat cgctatcggt gaatctgttc gagatgagga cgtttacatt    180

gttcaaaccg gatgtggcga aatcaacgat tttttaatgg aattactatt catgatcaat    240

gcttgtagaa ctgcaagtgc tcgaaggata actgcagtta taccaaattt cccctatgcg    300

agacaagaca aaaaggacaa gtcaagagca ccaattactg caaaattgat tgcaaacttg    360

ttacaaacgg caggatgcga tcatgtgatt acgatggact tgcatgcgag tcagatccaa    420

gggttcttta gagtccctgt cgataacttg tatgctgaac cgattgtatt gaggtatatt    480

cgcgaaaatt tcaacaaaga cgatattatc atggtgagcc ccgatgcagg aggagctaaa    540

agggttgcga gtctagcaga taaattggat gtccagtttg cattgatcca taaagaaaga    600

caaaaggcca acgaaatctc aagaatggtg ctcgttggtg atgtcaagga caaaatctgt    660

atactagttg acgacattgc tgatacttgt ggtactctat gtaaagctgc cgatatccta    720

cttgataacg gcgccaaaaa cgttgtttgc atggtgacac atgcaatctt ttctgggaat    780

gctattgaac gactcaacaa ctcgagattg gatagagtag ttgctacaaa ctcgttgcct    840

attgaggata aacttgcaaa gtgcaagaaa ttggaaatct tggacatcag cccgacatta    900

gctgaggcca taaggagatt gcataatggt gaaagtgtca gctacttgtt caacaatgtg    960

cctgaataa                                                            969

<210>46

<211>963

<212>DNA

<213>Neosartorya fischeri NRRL 181

<400>46

atggccacaa attcgatcaa acttctgact ggtaacagtc accctgaact tgcgaacctc     60

gttgctgctc ggctcggcat cgagttgacc aagatcatgg tcctgcagta ttcgaattct    120

gaaacaagtg tcacaattgg tgaaagtgta cgagacgagg atgtgttcat cttgcagtcc    180

acgaaaccga acgatatcaa tgacggattg atggagcttc ttatcatgat caacgcttgc    240

aagactgcct cggcccgtcg catcacggct gtcatcccca acttccccta cgcccgtcaa    300

gataagaaag acaagagccg tgcgccgatc accgcgaaat tgatggcgaa catgctccaa    360

accgctggct gcaaccatgt cattacaatg gatctccacg ccagtcagat tcagggtttc    420

tttaatgtcc ctgtagataa cttgtatgcc gagcctagca tgttgaagtg gatccgggaa    480

cacttggatg tgaagaactg cgtcatcgtc agtcccgatg ccggtggtgc gaagcgtgct    540

acggggattg cggaccgtct tgacctgcaa ttcgctctca ttcacaagga acgccctcgt    600

cccaacgagg tctcgcgcat ggttctcgtt ggaaacgtca aggacaagat tgcgatcatc    660

gttgacgaca tggctgatac atgtggtact ctcgtcaagg ccgccgacac tgtcatgcag    720

cacggtgcca aggaagtcaa cgccattgtc gtacacggca ttctctccgg caatgccatt    780

gagaacatca acaacagttg cttaaaccgt ctcgtcgtga ccaacacagt gccccataag    840

gagaagaagg agatgtgtga caagattgac accattgata tcagccctac gttggcggag    900

gcttgcagac gcacacacaa tggtgaatct gtcagtttcc tgttctcaca cgctgtcgcg    960

tag                                                                  963

<210>47

<211>972

<212>DNA

<213>树干毕赤酵母CBS 6054

<400>47

atgcctgcta cacccaactc catcaagttg ataggcggga actcgcaccc tgagttgtgt     60

gaaaaggtgt ccaagaaact tggtctaagt ttggccaagg taggagcttt ccagtacacc    120

aataaggaaa cagctgtagc agtaggagaa tctgtcagag atgaagatgt ctatattatc    180

cagactggat gtggagaaca agacatcaac gactttgtca tggagctctt gatcataatc    240

aatgcctgta aaatagccag tgccagaaga atcacagcag tggttcccaa ctttccctat    300

gctagacaag acaagaagga taagctgaga gcacccatta cggccaagtt gatggcgaac    360

ttgttgcaaa cggccggttg taaccatgtt atcaccatgg atttacacgc ttcacagatt    420

cagggctttt tccgtgtccc cgtagacaac ttgtatgctg aacctctggt gttgagatat    480

atcaccaaca actttgacaa aaaggactta attatcgtat caccagatgc gggaggagcc    540

aaaagagtag cgtccatagc tgacaagttg gatgtccagt ttgctttgat ccacaaggaa    600

aggcagaaag ccaacgaagt gtcaagaatg gtgcttgtgg gagacgtctc agacaaggtg    660

tgtatcttga tagatgatat ggccgatacc tgtggaacat tatgtaaggc tgcagacatc    720

ttgctcgaca atggtgctca gaaggttgta gccatggtca cacacggtat catgtcgtca    780

aatgctacag aaaagttgaa caactccaag ttggaccgga tcgtatgtac taattcccta    840

ccattgaatg ataagcttgc ccagtgtccc aagctagaag tgattgatat cgctcctact    900

ttggctgagg ctatcaggag acttcacaac ggtgaaagtg tcagctattt attcaacaac    960

atccccgagt ag                                                        972

<210>48

<211>1065

<212>DNA

<213>酿酒酵母

<400>48

atggtcatcg accttgagca tgtggtagac tacataatgc acatagactc tcagcttcaa     60

ctcaaaaagg cttctccagc aaaaatgaat tcagagtctc gagaagatat ggctataaat    120

agtatcaaat tgctagcggg aaactcccat cctgatttgg ctgaacaaat atcgaaaaag    180

ttaggtattc cactttccaa agttggtgtg taccagtatt ctaataaaga aacctctgtc    240

accataggtg agagccttcg cgacgaagat gtgtatatta tccaaactgg aataggtgaa    300

caagaaatta atgatttctt gatggaatta ttaattttaa ttcatgcttg caaaattgca     360

tctgcaagaa agatcactac tgtaataccc aattttccat atgcaagaca agacaagaaa     420

gataaatccc gggcgcccat taccgcaaag ttggttgcca atttattgca aactgctggt     480

gctgatcatg tcatcacaat ggatctccat gcctcccaaa ttcaagggtt tttccatatc     540

ccggttgaca acctatatgc agaaccaagt gttttaaatt atattagaac gaaaacagat     600

ttcgacaatg ctattttggt gtcgcctgat gcaggtggtg ctaagagagt agctgctttg     660

gctgacaagt tagatttaaa ttttgctttg attcacaaag agaggcaaaa agctaacgag     720

gtttcaaaaa tggtgcttgt tggtgatgtt accaataaat catgtttatt agttgatgat     780

atggcggata cttgtggtac gttggtaaaa gcttgtgata cgttgatgga gcatggtgcc     840

aaagaagtta tagctattgt tacacacggt attttctccg gttcagcaag agaaaagcta     900

agaaatagta gattgtctag aattgtttgc acaaataccg ttccggtaga tttggattta     960

cctattgctg accagatcga tattagtccc acgttcgctg aagctataag aagactacac    1020

aatggtgaat ccgtgtcata tttgttcacc catgctccag tatag                    1065

<210>49

<211>966

<212>DNA

<213>核盘菌1980

<400>49

atggcgacga attctattaa gttgcttacg ggcaatagcc acccgcaatt ggcgaagttg     60

gttgctgata gattgggtat tgaacttgca aagactatga gcttgaacta ttcaaatcaa    120

gaaaccagcg tcacagtggg agagagtgtc agagatgagg atgttttcat cctccaatcc    180

actgcacctg gcgatattaa cgatggactc atggaactgc tcatcatgat caatgcctgc    240

aaaaccgcat ccgcacgccg cattacagct gtcatcccca acttcccata cgcacgtcaa    300

gacaagaaag ataaatcccg cgctcctatc tcggctaaac ttatcgcgaa tatgttgcaa    360

actgccggtt gtaatcatgt tattactatg gatttacatg caagtcagat tcaagggttc    420

ttcaatgttc cagtggataa cttgtatgcg gagccaagta ctttgaggtg gattagagag    480

aacttggagg ttagcaagtg tgtggttgtt agtccggatg ccggtggtgc taagagagca    540

acctccatag ccgaccgtct cgatctcggt tttgccctca tccacaaaga gcgcgcccgc    600

cctaacgaag tatcccgcat ggtcctcgtc ggtgacgtcg tcgataaaat cgccatcctt    660

gtagacgaca tggccgatac ttgcggaacc ctcgtcaaag ctgccgagac agtcatggaa    720

cacggcgcta aagaagtcgt cgccatcgtc acccacggta tcctaagcgg agctgcaatc    780

gaaaccttaa acaagagtaa attgagcaga gtagtagtta caaacacagt accactcaga    840

ggaaaggagg aacaatgtgg gagattgagg gttatggata ttagtgctac gttagctgag    900

gcaattagga ggacgcataa tggcgagagt gtgagctttt tgtttacgca tgcacctatg    960

gactaa                                                               966

<210>50

<211>1020

<212>DNA

<213>Vanderwal tozyma polyspora DSM 70294

<400>50

atggatcata atttagaatt acagttacaa gaatccgatt taaaattacg tagtggtgaa     60

catatgtctt ctaatagtat caagctaatc tctgggaatt cccatccaga acttgctgag    120

ctaatatcta agaaattggc tatcccatta tcaaaagtgg gtgtatacca atattctaat    180

atggagactt ctgtcaccat cggtgaaagt attagagatg aagatgttta tatcattcaa    240

actggtactg gtgaacagga aattaacgat ttcctaatgg agttgttaat aatgatacat    300

gcttgtaaaa ctgcttctgt tagaagaatc actgcagtta tcccaagttt cccttatgca    360

agacaagata agaaggataa atcgcgtgcc ccaatcactg ccaagttgat tgcaaattta    420

ttggaaactg caggctgtga ccatgtcatc acaatggacc tacacgcttc tcaaattcaa     480

gggttcttcc atattccagt agacaattta tatgctgaac caagtgtatt aaactatatt     540

agaaatcata caaatctagc aaacgcaatt ctagtctcac cagatgctgg tggtgctaag     600

agagtagcct ctattgctga taagcttgat ttaaatttcg ctttgattca taaggaaaga     660

caaaaggcaa acgaagtttc aagaatggtc ctggtcggtg atgtcaaggg gaaatcatgt     720

ttattgatcg atgacatggc tgacacttgt ggtactttag taaaagcttg tgatactttg     780

ttagatcacg gtgctgaaga agttattgca atcgttactc atggtatctt ctccggttct     840

gctagagaaa aattgaaaaa cagtagatta tcaaagatcg tttgtaccaa tacagtacca     900

atagacttag atttagatat tgtagatcaa gttgatatca gtccaacttt ggcagaagcc     960

ataaggagat tacataacgg tgaatcggtc tcctacttat ttactcacgc tccagtatga    1020

<210>51

<211>318

<212>PRT

<213>棉阿舒囊霉ATCC 10895

<400>51

Met Ser Ser Asn Ser Ile Lys Leu Leu Ala Gly Asn Ser His Pro Asp

1               5                   10                  15

Leu Ala Glu Lys Val Ser Val Arg Leu Gly Val Pro Leu Ser Lys Ile

            20                  25                  30

Gly Val Tyr His Tyr Ser Asn Lys Glu Thr Ser Val Thr Ile Gly Glu

        35                  40                  45

Ser Ile Arg Asp Glu Asp Val Tyr Ile Ile Gln Thr Gly Thr Gly Glu

    50                  55                  60

Gln Glu Ile Asn Asp Phe Leu Met Glu Leu Leu Ile Met Ile His Ala

65                  70                  75                  80

Cys Arg Ser Ala Ser Ala Arg Lys Ile Thr Ala Val Ile Pro Asn Phe

                85                  90                  95

Pro Tyr Ala Arg Gln Asp Lys Lys Asp Lys Ser Arg Ala Pro Ile Thr

            100                 105                 110

Ala Lys Leu Val Ala Lys Met Leu Glu Thr Ala Gly Cys Asn His Val

        115                 120                 125

Ile Thr Met Asp Leu His Ala Ser Gln Ile Gln Gly Phe Phe His Ile

    130                 135                 140

Pro Val Asp Asn Leu Tyr Ala Glu Pro Asn Ile Leu His Tyr Ile Gln

145                 150                 155                 160

His Asn Val Asp Phe Gln Asn Ser Met Leu Val Ala Pro Asp Ala Gly

                165                 170                 175

Ser Ala Lys Arg Thr Ser Thr Leu Ser Asp Lys Leu Asn Leu Asn Phe

            180                 185                 190

Ala Leu Ile His Lys Glu Arg Gln Lys Ala Asn Glu Val Ser Arg Met

        195                 200                 205

Val Leu Val Gly Asp Val Ala Asp Lys Ser Cys Ile Ile Val Asp Asp

    210                 215                 220

Met Ala Asp Thr Cys Gly Thr Leu Val Lys Ala Thr Asp Thr Leu Ile

225                 230                 235                 240

Glu Asn Gly Ala Lys Glu Val Ile Ala Ile Val Thr His Gly Ile Phe

                245                 250                 255

Ser Gly Gly Ala Arg Glu Lys Leu Arg Asn Ser Lys Leu Ala Arg Ile

            260                 265                 270

Val Ser Thr Asn Thr Val Pro Val Asp Leu Asn Leu Asp Ile Tyr His

        275                 280                 285

Gln Ile Asp Ile Ser Ala Ile Leu Ala Glu Ala Ile Arg Arg Leu His

    290                 295                 300

Asn Gly Glu Ser Val Ser Tyr Leu Phe Asn Asn Ala Val Met

305                 310                 315

<210>52

<211>320

<212>PRT

<213>烟曲霉Af293

<400>52

Met Ala Thr Asn Ser Ile Lys Leu Leu Thr Gly Asn Ser His Pro Glu

1               5                   10                  15

Leu Ala Asn Leu Val Ala Ala Arg Leu Gly Ile Glu Leu Thr Lys Ile

            20                  25                  30

Met Val Leu Gln Tyr Ser Asn Ser Glu Thr Ser Val Thr Ile Gly Glu

        35                  40                  45

Ser Val Arg Asp Glu Asp Val Phe Ile Leu Gln Ser Thr Lys Pro Asn

    50                  55                  60

Asp Ile Asn Asp Gly Leu Met Glu Leu Leu Ile Met Ile Asn Ala Cys

65                  70                  75                  80

Lys Thr Ala Ser Ala Arg Arg Ile Thr Ala Val Ile Pro Asn Phe Pro

                85                  90                  95

Tyr Ala Arg Gln Asp Lys Lys Asp Lys Ser Arg Ala Pro Ile Thr Ala

            100                 105                 110

Lys Leu Met Ala Asn Met Leu Gln Thr Ala Gly Cys Asn His Val Ile

        115                 120                 125

Thr Met Asp Leu His Ala Ser Gln Ile Gln Gly Phe Phe Asn Val Pro

    130                 135                 140

Val Asp Asn Leu Tyr Ala Glu Pro Ser Met Leu Lys Trp Ile Arg Glu

145                 150                 155                 160

His Leu Asp Val Lys Asn Cys Val Ile Val Ser Pro Asp Ala Gly Gly

                l65                 170                 175

Ala Lys Arg Ala Thr Gly Ile Ala Asp Arg Leu Asp Leu Gln Phe Ala

            180                 185                 190

Leu Ile His Lys Glu Arg Pro Arg Pro Asn Glu Val Ser Arg Met Val

        195                 200                 205

Leu Val Gly Asn Val Lys Asp Lys Ile Ala Ile Ile Val Asp Asp Met

    210                 215                 220

Ala Asp Thr Cys Gly Thr Leu Val Lys Ala Ala Asp Thr Val Met Gln

225                 230                 235                 240

His Gly Ala Lys Glu Val Asn Ala Ile Val Val His Gly Ile Leu Ser

                245                 250                 255

Gly Asn Ala Ile Glu Asn Ile Asn Asn Ser Cys Leu Lys Arg Leu Val

            260                 265                 270

Val Thr Asn Thr Val Pro His Lys Glu Lys Lys Glu Leu Cys Asp Lys

        275                 280                 285

Ile Asp Thr Ile Asp Ile Ser Pro Thr Leu Ala Glu Ala Cys Arg Arg

    290                 295                 300

Thr His Asn Gly Glu Ser Val Ser Phe Leu Phe Ser His Ala Val Ala

305                 310                 315                 320

<210>53

<211>320

<212>PRT

<213>黑曲霉

<400>53

Met Ala Ser Asn Ser Ile Lys Leu Leu Thr Gly Asn Ser His Pro Glu

1               5                   10                  15

Leu Ala Asn Leu Val Ala Ala Arg Leu Gly Ile Glu Leu Thr Lys Ile

            20                  25                  30

Met Val Leu Gln Tyr Ser Asn Gln Glu Thr Ser Val Thr Ile Gly Glu

        35                  40                  45

Ser Val Arg Asp Glu Asp Val Phe Ile Leu Gln Ser Thr Arg Pro Asn

    50                  55                  60

Asp Ile Asn Asp Gly Leu Met Glu Leu Leu Ile Met Ile Asn Ala Cys

65                  70                  75                  80

Lys Thr Ala Ser Ala Arg Arg Ile Thr Ala Val Ile Pro Asn Phe Pro

                85                  90                  95

Tyr Ala Arg Gln Asp Lys Lys Asp Lys Ser Arg Ala Pro Ile Thr Ala

            100                 105                 110

Lys Leu Met Ala Asn Met Leu Gln Thr Ala Gly Cys Asn His Val Ile

        115                 120                 125

Thr Met Asp Leu His Ala Ser Gln Ile Gln Gly Phe Phe Asn Val Pro

    130                 135                 140

Val Asp Asn Leu Tyr Ala Glu Pro Ser Ile Leu Lys Trp Ile Arg Glu

145                 150                 155                 160

His Leu Asp Val Ser Asn Cys Ile Ile Val Ser Pro Asp Ala Gly Gly

                165                 170                 175

Ala Lys Arg Ala Thr Ala Ile Ala Asp Arg Leu Asp Leu Gln Phe Ala

            180                 185                 190

Leu Ile His Lys Glu Arg Pro Arg Pro Asn Glu Val Ser Arg Met Val

        195                 200                 205

Leu Val Gly Ser Val Lys Asp Lys Ile Ala Ile Ile Val Asp Asp Met

    210                 215                 220

Ala Asp Thr Cys Gly Thr Leu Val Lys Ala Ala Asp Thr Val Met Gln

225                 230                 235                 240

His Gly Ala Lys Glu Val Asn Ala Ile Val Val His Gly Ile Leu Ser

                245                 250                 255

Gly Lys Ala Thr Gln Asn Ile Asn Asn Ser Cys Leu Ser Arg Val Val

            260                 265                 270

Val Thr Asn Thr Val Pro His Glu Asp Lys Lys Glu Gln Cys Asp Lys

        275                 280                 285

Ile Glu Thr Ile Asp Ile Ser Pro Thr Leu Ala Glu Ala Cys Arg Arg

    290                 295                 300

Thr His Asn Gly Glu Ser Val Ser Phe Leu Phe Ser His Ala Val Ala

305                 310                 315                 320

<210>54

<211>319

<212>PRT

<213>光滑假丝酵母CBS138

<400>54

Met Ser Thr Asn Ser Ile Lys Leu Leu Ala Gly Asn Ser His Pro Glu

1               5                   10                  15

Leu Ala Glu Leu Leu Ser Arg Arg Leu Gly Ile Pro Leu Ser Lys Val

            20                  25                  30

Gly Val Tyr Gln Tyr Ser Asn Thr Glu Thr Ser Val Thr Ile Gly Glu

        35                  40                  45

Ser Ile Arg Asp Glu Asp Val Tyr Ile Ile Gln Thr Gly Ile Gly Ala

    50                  55                  60

Gln Glu Val Asn Asp Phe Leu Met Glu Leu Leu Ile Leu Ile His Ala

65                  70                  75                  80

Cys Lys Thr Ala Ser Val Arg Arg Ile Thr Ala Val Ile Pro Asn Phe

                85                  90                  95

Pro Tyr Ala Arg Gln Asp Lys Lys Asp Lys Ser Arg Ala Pro Ile Thr

            100                 105                 110

Ala Lys Leu Ile Ala Lys Met Leu Glu Thr Ala Gly Cys Asp His Val

        115                 120                 125

Ile Thr Met Asp Leu His Ala Ser Gln Ile Gln Gly Phe Phe His Ile

    130                 135                 140

Pro Val Asp Asn Leu Tyr Ala Glu Pro Ser Val Leu Asn Tyr Ile Arg

145                 150                 155                 160

Thr Lys Thr Asp Leu Lys Asn Thr Ile Leu Val Ser Pro Asp Ala Gly

                165                 170                 175

Gly Ala Lys Arg Val Ala Ser Leu Ala Asp Lys Leu Asp Leu Asn Phe

            180                 185                 190

Ala Leu Ile His Lys Glu Arg Gln Lys Ala Asn Glu Val Ser Arg Met

        195                 200                 205

Val Leu Val Gly Asp Val Gln Gly Lys Ser Cys Leu Leu Ile Asp Asp

    210                 215                 220

Met Ala Asp Thr Cys Gly Thr Leu Val Lys Ala Cys Asp Thr Leu Leu

225                 230                 235                 240

Glu His Gly Ala Lys Glu Val Ile Ala Ile Val Thr His Gly Ile Phe

                245                 250                 255

Ser Gly Ser Ala Arg Glu Lys Leu Ala Asn Ser Lys Leu Ser Lys Ile

            260                 265                 270

Val Cys Thr Asn Thr Val Pro Val Asp Ile Asp Leu Pro Ile Val Asp

        275                 280                 285

Gln Val Asp Ile Ser Pro Thr Leu Ala Glu Ala Ile Lys Arg Leu His

    290                 295                 300

Asn Gly Glu Ser Val Ser Tyr Leu Phe Thr His Ala Pro Pro Ala

305                 310                 315

<210>55

<211>320

<212>PRT

<213>粗球孢子菌RS

<400>55

Met Ala Thr Asn Ser Ile Lys Leu Leu Thr Gly Asn Ser His Pro Glu

1               5                   10                  15

Leu Ala Gln Leu Val Ala Asp Arg Leu Gly Ile Glu Leu Thr Arg Val

            20                  25                  30

Met Val Ser Gln Tyr Ser Asn Gln Glu Thr Ser Val Thr Ile Gly Glu

        35                  40                  45

Ser Val Arg Asp Glu Asp Val Phe Ile Leu Gln Ser Thr Arg Pro Asn

    50                  55                  60

Asp Ile Asn Asp Gly Leu Met Glu Leu Leu Ile Met Ile Asn Ala Cys

65                  70                  75                  80

Lys Thr Ala Ser Ala Arg Arg Ile Thr Ala Val Ile Pro Asn Phe Pro

                85                  90                  95

Tyr Ala Arg Gln Asp Lys Lys Asp Lys Ser Arg Ala Pro Ile Thr Ala

            100                 105                 110

Lys Leu Met Ala Asn Met Leu Gln Thr Ala Gly Cys Asn His Val Ile

        115                 120                 125

Thr Met Asp Leu His Ala Ser Gln Ile Gln Gly Phe Phe Asn Val Pro

    130                 135                 140

Val Asp Asn Leu Tyr Ala Glu Pro Ser Met Leu Arg Trp Ile Arg Gln

145                 150                 155                 160

Asn Leu Asp Val Ser Asn Cys Val Ile Val Ser Pro Asp Ala Gly Gly

                165                 170                 175

Ala Lys Arg Ala Thr Ala Ile Ala Asp Arg Leu Asp Leu Gln Phe Ala

            180                 185                 190

Leu Ile His Lys Glu Arg Pro Arg Pro Asn Glu Val Ser Arg Met Val

        195                 200                 205

Leu Val Gly Ser Val Lys Asp Lys Ile Ala Ile Ile Val Asp Asp Met

    210                 215                 220

Ala Asp Thr Cys Gly Thr Leu Val Lys Ala Ala Ser Thr Leu Ile Asp

225                 230                 235                 240

Asn Gly Ala Lys Glu Val Leu Ala Ile Val Thr His Gly Ile Leu Ser

                245                 250                 255

Gly Lys Ala Ile Glu Thr Leu Asn Thr Gly Arg Leu Ser Arg Ile Val

            260                 265                 270

Val Thr Asn Thr Val Pro His Glu Glu Lys Lys Leu Leu Cys Asp Lys

        275                 280                 285

Ile Glu Thr Ile Asp Ile Ser Pro Val Leu Ala Glu Ala Cys Arg Arg

    290                 295                 300

Thr His Asn Gly Glu Ser Val Ser Phe Leu Phe Ser His Ala Val Ser

305                 310                 315                 320

<210>56

<211>323

<212>PRT

<213>汉逊德巴利酵母CBS767

<400>56

Met Thr Ala Ser Gln Asn Ala Ile Lys Leu Leu His Gly Asn Ser His

1               5                   10                  15

Pro Glu Leu Ala Lys Leu Ile Ser Lys Lys Leu Gly Ile Gly Leu Ala

            20                  25                  30

Lys Val Gly Ala Phe Gln Tyr Thr Asn Lys Glu Thr Ala Val Ala Val

        35                  40                  45

Gly Glu Ser Val Arg Asp Glu Asp Val Tyr Ile Ile Gln Thr Gly Cys

    50                  55                  60

Gly Glu Gly Glu Ile Asn Asp Phe Leu Met Glu Leu Leu Ile Ile Ile

65                  70                  75                  80

Asn Ala Cys Lys Thr Ala Ser Ala Arg Arg Ile Thr Ala Val Ile Pro

                85                  90                  95

Asn Phe Pro Tyr Ala Arg Gln Asp Lys Lys Asp Lys Ser Arg Ala Pro

            100                 105                 110

Ile Thr Ala Lys Leu Ile Ala Asn Leu Leu Gln Thr Ala Gly Cys Asn

        115                 120                 125

His Val Ile Thr Leu Asp Leu His Ala Ser Gln Ile Gln Gly Phe Phe

    130                 135                 140

Arg Val Pro Val Asp Asn Leu Tyr Ala Glu Pro Ser Val Leu Arg His

145                 150                 155                 160

Ile Lys Asp Asn Tyr Gly Lys Glu Asp Leu Ile Ile Val Ser Pro Asp

                165                 170                 175

Ala Gly Gly Ala Lys Arg Val Ala Ser Ile Ala Asp Lys Leu Asp Val

            180                 185                 190

Asn Phe Ala Leu Ile His Lys Glu Arg Gln Lys Ala Asn Glu Val Ser

        195                 200                 205

Lys Met Val Leu Val Gly Asp Val Thr Asn Lys Ser Cys Leu Leu Ile

    210                 215                 220

Asp Asp Met Ala Asp Thr Cys Gly Thr Leu Val Lys Ala Ala Asp Val

225                 230                 235                 240

Leu Leu Lys Asn Gly Ala Lys Lys Val Val Ala Ile Ile Thr His Gly

                245                 250                 255

Ile Phe Ser Ser Asn Ala Ile Glu Lys Leu Asn Asn Ser Asn Leu Asp

            260                 265                 270

Lys Ile Ile Cys Thr Asn Ser Met Pro Leu Glu Asn Lys Leu Ser Gln

        275                 280                 285

Cys Pro Lys Leu Glu Ile Ile Asp Ile Ser Ala Thr Leu Ala Glu Ala

    290                 295                 300

Ile Arg Arg Leu His Asn Gly Glu Ser Val Ser Tyr Leu Phe Asn Asn

305                 310                 315                 320

Ala Pro Ala

<210>57

<211>324

<212>PRT

<213>乳酸克鲁维酵母

<400>57

Met Glu Thr Ser Lys Arg Met Ser Thr Asn Ser Ile Lys Leu Leu Ala

1               5                   10                  15

Gly Asn Ser His Pro Glu Leu Ala Gln Asn Ile Ala Arg Thr Leu Gly

            20                  25                  30

Leu Arg Leu Ser Asn Ile Gly Val Tyr Gln Tyr Ser Asn Gln Glu Thr

        35                  40                  45

Ser Val Thr Ile Gly Glu Ser Ile Arg Asp Glu Asp Val Tyr Ile Ile

    50                  55                  60

Gln Thr Gly Thr Gly Glu Gln Glu Ile Asn Asp Phe Leu Met Glu Leu

65                  70                  75                  80

Leu Ile Ile Ile His Ala Cys Arg Thr Ala Ser Ala Arg Arg Ile Thr

                85                  90                  95

Ala Val Ile Pro Asn Phe Pro Tyr Ala Arg Gln Asp Lys Lys Asp Lys

            100                 105                 110

Ser Arg Ala Pro Ile Thr Ala Lys Leu Val Ala Gln Met Leu Glu Thr

        115                 120                 125

Ala Gly Cys Asp His Val Ile Thr Met Asp Leu His Ala Ser Gln Ile

    130                 135                 140

Gln Gly Phe Phe His Ile Pro Val Asp Asn Leu Tyr Ala Glu Pro Ser

145                 150                 155                 160

Val Leu Lys Tyr Ile Gln His Lys Thr Asp Ile Gly Asn Ala Ile Leu

                165                 170                 175

Val Ser Pro Asp Ala Gly Gly Ala Lys Arg Val Ala Ser Leu Ala Asp

            180                 185                 190

Lys Leu Asp Leu Asn Phe Ala Leu Ile His Lys Glu Arg Gln Lys Ala

        195                 200                 205

Asn Glu Val Ser Arg Met Val Leu Val Gly Asp Val Thr Gly Lys Ser

    210                 215                 220

Cys Leu Leu Ile Asp Asp Met Ala Asp Thr Cys Gly Thr Leu Val Lys

225                 230                 235                 240

Ala Ser Asp Thr Leu Leu Glu His Gly Ala Lys Glu Val Leu Ala Ile

                245                 250                 255

Val Thr His Gly Ile Phe Ser Gly Ser Ala Glu Gln Lys Leu Lys Asn

            260                 265                 270

Ser Lys Leu Ser Arg Ile Val Cys Thr Asn Thr Val Pro Val Asp Leu

        275                 280                 285

Asp Val Asn Ile Leu Asp Gln Ile Asp Ile Ser Pro Thr Leu Ala Glu

    290                 295                 300

Ala Ile Arg Arg Leu His Asn Gly Glu Ser Val Ser Tyr Leu Phe Thr

305                 310                 315                 320

His Ala Ala Ile

<210>58

<211>322

<212>PRT

<213>洛德酵母NRRL YB-4239

<400>58

Met His Gln Arg Leu Pro Asn Ser Ile Lys Ile Leu Ala Gly Asn Ser

1               5                   10                  15

His Ile Asp Leu Cys Glu Lys Ile Ala Lys Arg Leu Gly Ile Asn Ile

            20                  25                  30

Ala Arg Val Gly Ala Phe Gln Tyr Thr Asn Thr Glu Thr Ala Ile Ala

        35                  40                  45

Ile Gly Glu Ser Val Arg Asp Glu Asp Val Tyr Ile Val Gln Thr Gly

    50                  55                  60

Cys Gly Glu Ile Asn Asp Phe Leu Met Glu Leu Leu Phe Met Ile Asn

65                  70                  75                  80

Ala Cys Arg Thr Ala Ser Ala Arg Arg Ile Thr Ala Val Ile Pro Asn

                85                  90                  95

Phe Pro Tyr Ala Arg Gln Asp Lys Lys Asp Lys Ser Arg Ala Pro Ile

            100                 105                 110

Thr Ala Lys Leu Ile Ala Asn Leu Leu Gln Thr Ala Gly Cys Asp His

        115                 120                 125

Val Ile Thr Met Asp Leu His Ala Ser Gln Ile Gln Gly Phe Phe Arg

    130                 135                 140

Val Pro Val Asp Asn Leu Tyr Ala Glu Pro Ile Val Leu Arg Tyr Ile

145                 150                 155                 160

Arg Glu Asn Phe Asn Lys Asp Asp Ile Ile Met Val Ser Pro Asp Ala

                165                 170                 175

Gly Gly Ala Lys Arg Val Ala Ser Leu Ala Asp Lys Leu Asp Val Gln

            180                 185                 190

Phe Ala Leu Ile His Lys Glu Arg Gln Lys Ala Asn Glu Ile Ser Arg

        195                 200                 205

Met Val Leu Val Gly Asp Val Lys Asp Lys Ile Cys Ile Leu Val Asp

    210                 215                 220

Asp Ile Ala Asp Thr Cys Gly Thr Leu Cys Lys Ala Ala Asp Ile Leu

225                 230                 235                 240

Leu Asp Asn Gly Ala Lys Asn Val Val Cys Met Val Thr His Ala Ile

                245                 250                 255

Phe Ser Gly Asn Ala Ile Glu Arg Leu Asn Asn Ser Arg Leu Asp Arg

            260                 265                 270

Val Val Ala Thr Asn Ser Leu Pro Ile Glu Asp Lys Leu Ala Lys Cys

        275                 280                 285

Lys Lys Leu Glu Ile Leu Asp Ile Ser Pro Thr Leu Ala Glu Ala Ile

    290                 295                 300

Arg Arg Leu His Asn Gly Glu Ser Val Ser Tyr Leu Phe Asn Asn Val

305                 310                 315                 320

Pro Glu

<210>59

<211>320

<212>PRT

<213>Neosartorya fischeri  NRRL 181

<400>59

Met Ala Thr Asn Ser Ile Lys Leu Leu Thr Gly Asn Ser His Pro Glu

1               5                   10                  15

Leu Ala Asn Leu Val Ala Ala Arg Leu Gly Ile Glu Leu Thr Lys Ile

            20                  25                  30

Met Val Leu Gln Tyr Ser Asn Ser Glu Thr Ser Val Thr Ile Gly Glu

        35                  40                  45

Ser Val Arg Asp Glu Asp Val Phe Ile Leu Gln Ser Thr Lys Pro Asn

    50                  55                  60

Asp Ile Asn Asp Gly Leu Met Glu Leu Leu Ile Met Ile Asn Ala Cys

65                  70                  75                  80

Lys Thr Ala Ser Ala Arg Arg Ile Thr Ala Val Ile Pro Asn Phe Pro

                85                  90                  95

Tyr Ala Arg Gln Asp Lys Lys Asp Lys Ser Arg Ala Pro Ile Thr Ala

            100                 105                 110

Lys Leu Met Ala Asn Met Leu Gln Thr Ala Gly Cys Asn His Val Ile

        115                 120                 125

Thr Met Asp Leu His Ala Ser Gln Ile Gln Gly Phe Phe Asn Val Pro

    130                 135                 140

Val Asp Asn Leu Tyr Ala Glu Pro Ser Met Leu Lys Trp Ile Arg Glu

145                 150                 155                 160

His Leu Asp Val Lys Asn Cys Val Ile Val Ser Pro Asp Ala Gly Gly

                165                 170                 175

Ala Lys Arg Ala Thr Gly Ile Ala Asp Arg Leu Asp Leu Gln Phe Ala

            180                 185                 190

Leu Ile His Lys Glu Arg Pro Arg Pro Asn Glu Val Ser Arg Met Val

        195                 200                 205

Leu Val Gly Asn Val Lys Asp Lys Ile Ala Ile Ile Val Asp Asp Met

    210                 215                 220

Ala Asp Thr Cys Gly Thr Leu Val Lys Ala Ala Asp Thr Val Met Gln

225                 230                 235                 240

His Gly Ala Lys Glu Val Asn Ala Ile Val Val His Gly Ile Leu Ser

                245                 250                 255

Gly Asn Ala Ile Glu Asn Ile Asn Asn Ser Cys Leu Asn Arg Leu Val

            260                 265                 270

Val Thr Asn Thr Val Pro His Lys Glu Lys Lys Glu Met Cys Asp Lys

        275                 280                 285

Ile Asp Thr Ile Asp Ile Ser Pro Thr Leu Ala Glu Ala Cys Arg Arg

    290                 295                 300

Thr His Asn Gly Glu Ser Val Ser Phe Leu Phe Ser His Ala Val Ala

305                 310                 315                 320

<210>60

<211>323

<212>PRT

<213>树干毕赤酵母CBS 6054

<400>60

Met Pro Ala Thr Pro Asn Ser Ile Lys Leu Ile Gly Gly Asn Ser His

1               5                   10                  15

Pro Glu Leu Cys Glu Lys Val Ser Lys Lys Leu Gly Leu Ser Leu Ala

            20                  25                  30

Lys Val Gly Ala Phe Gln Tyr Thr Asn Lys Glu Thr Ala Val Ala Val

        35                  40                  45

Gly Glu Ser Val Arg Asp Glu Asp Val Tyr Ile Ile Gln Thr Gly Cys

    50                  55                  60

Gly Glu Gln Asp Ile Asn Asp Phe Val Met Glu Leu Leu Ile Ile Ile

65                  70                  75                  80

Asn Ala Cys Lys Ile Ala Ser Ala Arg Arg Ile Thr Ala Val Val Pro

                85                  90                  95

Asn Phe Pro Tyr Ala Arg Gln Asp Lys Lys Asp Lys Ser Arg Ala Pro

            100                 105                 110

Ile Thr Ala Lys Leu Met Ala Asn Leu Leu Gln Thr Ala Gly Cys Asn

        115                 120                 125

His Val Ile Thr Met Asp Leu His Ala Ser Gln Ile Gln Gly Phe Phe

    130                 135                 140

Arg Val Pro Val Asp Asn Leu Tyr Ala Glu Pro Ser Val Leu Arg Tyr

145                 150                 155                 160

Ile Thr Asn Asn Phe Asp Lys Lys Asp Leu Ile Ile Val Ser Pro Asp

                165                 170                 175

Ala Gly Gly Ala Lys Arg Val Ala Ser Ile Ala Asp Lys Leu Asp Val

            180                 185                 190

Gln Phe Ala Leu Ile His Lys Glu Arg Gln Lys Ala Asn Glu Val Ser

        195                 200                 205

Arg Met Val Leu Val Gly Asp Val Ser Asp Lys Val Cys Ile Leu Ile

    210                 215                 220

Asp Asp Met Ala Asp Thr Cys Gly Thr Leu Cys Lys Ala Ala Asp Ile

225                 230                 235                 240

Leu Leu Asp Asn Gly Ala Gln Lys Val Val Ala Met Val Thr His Gly

                245                 250                 255

Ile Met Ser Ser Asn Ala Thr Glu Lys Leu Asn Asn Ser Lys Leu Asp

            260                 265                 270

Arg Ile Val Cys Thr Asn Ser Leu Pro Leu Asn Asp Lys Leu Ala Gln

        275                 280                 285

Cys Pro Lys Leu Glu Val Ile Asp Ile Ala Pro Thr Leu Ala Glu Ala

    290                 295                 300

Ile Arg Arg Leu His Asn Gly Glu Ser Val Ser Tyr Leu Phe Asn Asn

305                 310                 315                 320

Ile Pro Glu

<210>61

<211>354

<212>PRT

<213>酿酒酵母

<400>61

Met Val Ile Asp Leu Glu His Val Val Asp Tyr Ile Met His Ile Asp

1               5                   10                  15

Ser Gln Leu Gln Leu Lys Lys Ala Ser Pro Ala Lys Met Asn Ser Glu

            20                  25                  30

Ser Arg Glu Asp Met Ala Ile Asn Ser Ile Lys Leu Leu Ala Gly Asn

        35                  40                  45

Ser His Pro Asp Leu Ala Glu Gln Ile Ser Lys Lys Leu Gly Ile Pro

    50                  55                  60

Leu Ser Lys Val Gly Val Tyr Gln Tyr Ser Asn Lys Glu Thr Ser Val

65                  70                  75                  80

Thr Ile Gly Glu Ser Leu Arg Asp Glu Asp Val Tyr Ile Ile Gln Thr

                85                  90                  95

Gly Ile Gly Glu Gln Glu Ile Asn Asp Phe Leu Met Glu Leu Leu Ile

            100                 105                 110

Leu Ile His Ala Cys Lys Ile Ala Ser Ala Arg Lys Ile Thr Thr Val

        115                 120                 125

Ile Pro Asn Phe Pro Tyr Ala Arg Gln Asp Lys Lys Asp Lys Ser Arg

    130                 135                 140

Ala Pro Ile Thr Ala Lys Leu Val Ala Asn Leu Leu Gln Thr Ala Gly

145                 150                 155                 160

Ala Asp His Val Ile Thr Met Asp Leu His Ala Ser Gln Ile Gln Gly

                165                 170                 175

Phe Phe His Ile Pro Val Asp Asn Leu Tyr Ala Glu Pro Ser Val Leu

            180                 185                 190

Asn Tyr Ile Arg Thr Lys Thr Asp Phe Asp Asn Ala Ile Leu Val Ser

        195                 200                 205

Pro Asp Ala Gly Gly Ala Lys Arg Val Ala Ala Leu Ala Asp Lys Leu

    210                 215                 220

Asp Leu Asn Phe Ala Leu Ile His Lys Glu Arg Gln Lys Ala Asn Glu

225                 230                 235                 240

Val Ser Lys Met Val Leu Val Gly Asp Val Thr Asn Lys Ser Cys Leu

                245                 250                 255

Leu Val Asp Asp Met Ala Asp Thr Cys Gly Thr Leu Val Lys Ala Cys

            260                 265                 270

Asp Thr Leu Met Glu His Gly Ala Lys Glu Val Ile Ala Ile Val Thr

        275                 280                 285

His Gly Ile Phe Ser Gly Ser Ala Arg Glu Lys Leu Arg Asn Ser Arg

    290                 295                 300

Leu Ser Arg Ile Val Cys Thr Asn Thr Val Pro Val Asp Leu Asp Leu

305                 310                 315                 320

Pro Ile Ala Asp Gln Ile Asp Ile Ser Pro Thr Phe Ala Glu Ala Ile

                325                 330                 335

Arg Arg Leu His Asn Gly Glu Ser Val Ser Tyr Leu Phe Thr His Ala

            340                 345                 350

Pro Val

<210>62

<211>321

<212>PRT

<213>核盘菌1980

<400>62

Met Ala Thr Asn Ser Ile Lys Leu Leu Thr Gly Asn Ser His Pro Gln

1               5                   10                  15

Leu Ala Lys Leu Val Ala Asp Arg Leu Gly Ile Glu Leu Ala Lys Thr

            20                  25                  30

Met Ser Leu Asn Tyr Ser Asn Gln Glu Thr Ser Val Thr Val Gly Glu

        35                  40                  45

Ser Val Arg Asp Glu Asp Val Phe Ile Leu Gln Ser Thr Ala Pro Gly

    50                  55                  60

Asp Ile Asn Asp Gly Leu Met Glu Leu Leu Ile Met Ile Asn Ala Cys

65                  70                  75                  80

Lys Thr Ala Ser Ala Arg Arg Ile Thr Ala Val Ile Pro Asn Phe Pro

                85                  90                  95

Tyr Ala Arg Gln Asp Lys Lys Asp Lys Ser Arg Ala Pro Ile Ser Ala

            100                 105                 110

Lys Leu Ile Ala Asn Met Leu Gln Thr Ala Gly Cys Asn His Val Ile

        115                 120                 125

Thr Met Asp Leu His Ala Ser Gln Ile Gln Gly Phe Phe Asn Val Pro

    130                 135                 140

Val Asp Asn Leu Tyr Ala Glu Pro Ser Thr Leu Arg Trp Ile Arg Glu

145                 150                 155                 160

Asn Leu Glu Val Ser Lys Cys Val Val Val Ser Pro Asp Ala Gly Gly

                165                 170                 175

Ala Lys Arg Ala Thr Ser Ile Ala Asp Arg Leu Asp Leu Gly Phe Ala

            180                 185                 190

Leu Ile His Lys Glu Arg Ala Arg Pro Asn Glu Val Ser Arg Met Val

        195                 200                 205

Leu Val Gly Asp Val Val Asp Lys Ile Ala Ile Leu Val Asp Asp Met

    210                 215                 220

Ala Asp Thr Cys Gly Thr Leu Val Lys Ala Ala Glu Thr Val Met Glu

225                 230                 235                 240

His Gly Ala Lys Glu Val Val Ala Ile Val Thr His Gly Ile Leu Ser

                245                 250                 255

Gly Ala Ala Ile Glu Thr Leu Asn Lys Ser Lys Leu Ser Arg Val Val

            260                 265                 270

Val Thr Asn Thr Val Pro Leu Arg Gly Lys Glu Glu Gln Cys Gly Arg

        275                 280                 285

Leu Arg Val Met Asp Ile Ser Ala Thr Leu Ala Glu Ala Ile Arg Arg

    290                 295                 300

Thr His Asn Gly Glu Ser Val Ser Phe Leu Phe Thr His Ala Pro Met

305                 310                 315                 320

Asp

<210>63

<211>339

<212>PRT

<213>Vanderwaltozyma polyspora DSM 70294

<400>63

Met Asp His Asn Leu Glu Leu Gln Leu Gln Glu Ser Asp Leu Lys Leu

1               5                   10                  15

Arg Ser Gly Glu His Met Ser Ser Asn Ser Ile Lys Leu Ile Ser Gly

            20                  25                  30

Asn Ser His Pro Glu Leu Ala Glu Leu Ile Ser Lys Lys Leu Ala Ile

        35                  40                  45

Pro Leu Ser Lys Val Gly Val Tyr Gln Tyr Ser Asn Met Glu Thr Ser

    50                  55                  60

Val Thr Ile Gly Glu Ser Ile Arg Asp Glu Asp Val Tyr Ile Ile Gln

65                  70                  75                  80

Thr Gly Thr Gly Glu Gln Glu Ile Asn Asp Phe Leu Met Glu Leu Leu

                85                  90                  95

Ile Met Ile His Ala Cys Lys Thr Ala Ser Val Arg Arg Ile Thr Ala

            100                 105                 110

Val Ile Pro Ser Phe Pro Tyr Ala Arg Gln Asp Lys Lys Asp Lys Ser

        115                 120                 125

Arg Ala Pro Ile Thr Ala Lys Leu Ile Ala Asn Leu Leu Glu Thr Ala

    130                 135                 140

Gly Cys Asp His Val Ile Thr Met Asp Leu His Ala Ser Gln Ile Gln

145                 150                 155                 160

Gly Phe Phe His Ile Pro Val Asp Asn Leu Tyr Ala Glu Pro Ser Val

                165                 170                 175

Leu Asn Tyr Ile Arg Asn His Thr Asn Leu Ala Asn Ala Ile Leu Val

            180                 185                 190

Ser Pro Asp Ala Gly Gly Ala Lys Arg Val Ala Ser Ile Ala Asp Lys

        195                 200                 205

Leu Asp Leu Asn Phe Ala Leu Ile His Lys Glu Arg Gln Lys Ala Asn

    210                 215                 220

Glu Val Ser Arg Met Val Leu Val Gly Asp Val Lys Gly Lys Ser Cys

225                 230                 235                 240

Leu Leu Ile Asp Asp Met Ala Asp Thr Cys Gly Thr Leu Val Lys Ala

                245                 250                 255

Cys Asp Thr Leu Leu Asp His Gly Ala Glu Glu Val Ile Ala Ile Val

            260                 265                 270

Thr His Gly Ile Phe Ser Gly Ser Ala Arg Glu Lys Leu Lys Asn Ser

        275                 280                 285

Arg Leu Ser Lys Ile Val Cys Thr Asn Thr Val Pro Ile Asp Leu Asp

    290                 295                 300

Leu Asp Ile Val Asp Gln Val Asp Ile Ser Pro Thr Leu Ala Glu Ala

305                 310                 315                 320

Ile Arg Arg Leu His Asn Gly Glu Ser Val Ser Tyr Leu Phe Thr His

                325                 330                 335

Ala Pro Val

<210>64

<211>60

<212>PRT

<213>人工的

<220>

<223>共有序列

<220>

<221>misc_feature

<222>(2)..(2)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(19)..(19)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(23)..(23)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(25)..(26)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(32)..(32)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(38)..(38)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(50)..(51)

<223>Xaa可以是任何天然存在的氨基酸

<400>64

Pro Xaa Phe Pro Tyr Ala Arg Gln Asp Lys Lys Asp Lys Ser Arg Ala

1               5                   10                  15

Pro Ile Xaa Ala Lys Leu Xaa Ala Xaa Xaa Leu Glx Thr Ala Gly Xaa

            20                  25                  30

Asx His Val Ile Thr Xaa Asp Leu His Ala Ser Gln Ile Gln Gly Phe

        35                  40                  45

Phe Xaa Xaa Pro Val Asp Asn Leu Tyr Ala Glu Pro

    50                  55                  60

<210>65

<211>25

<212>PRT

<213>人工的

<220>

<223>共有序列

<220>

<221>misc_feature

<222>(9)..(11)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(14)..(14)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(16)..(16)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(22)..(22)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(24)..(24)

<223>Xaa可以是任何天然存在的氨基酸

<400>65

Phe Ala Leu Ile His Lys Glu Arg Xaa Xaa Xaa Asn Glu Xaa Ser Xaa

1               5                   10                  15

Met Val Leu Val Gly Xaa Val Xaa Lys

            20                  25

<210>66

<211>13

<212>PRT

<213>人工的

<220>

<223>共有序列

<220>

<221>misc_feature

<222>(3)..(3)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(11)..(11)

<223>Xaa可以是任何天然存在的氨基酸

<400>66

Asp Asp Xaa Ala Asp Thr Cys Gly Thr Leu Xaa Lys Ala

1              5                   10

<210>67

<211>13

<212>PRT

<213>人工的

<220>

<223>共有序列

<220>

<221>misc_feature

<222>(4)..(4)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(10)..(10)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(12)..(12)

<223>Xaa可以是任何天然存在的氨基酸

<400>67

Gly Glu Ser Xaa Arg Asp Glu Asp Val Xaa Ile Xaa Gln

1               5                   10

<210>68

<211>17

<212>PRT

<213>人工的

<220>

<223>共有序列

<220>

<221>misc_feature

<222>(4)..(5)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(7)..(7)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(15)..(15)

<223>Xaa可以是任何天然存在的氨基酸

<400>68

Ala Glu Ala Xaa Xaa Arg Xaa His Asn Gly Glu Ser Val Ser Xaa Leu

1               5                   10                  15

Phe

<210>69

<211>16

<212>PRT

<213>人工的

<220>

<223>共有序列

<400>69

Phe Pro Tyr Ala Arg Gln Asp Lys Lys Asp Lys Ser Arg Ala Pro Ile

1               5                   10                  15

<210>70

<211>11

<212>PRT

<213>人工的

<220>

<223>共有序列

<400>70

Asp Leu His Ala Ser Gln Ile Gln Gly Phe Phe

1               5                   10

<210>71

<211>9

<212>PRT

<213>人工的

<220>

<223>共有序列

<400>71

Pro Val Asp Asn Leu Tyr Ala Glu Pro

1               5

<210>72

<211>8

<212>PRT

<213>人工的

<220>

<223>共有序列

<400>72

Phe Ala Leu Ile His Lys Glu Arg

1               5

<210>73

<211>352

<212>PRT

<213>人工的

<220>

<223>共有序列

<220>

<221>misc_feature

<222>(2)..(36)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(38)..(38)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(41)..(43)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(48)..(49)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(51)..(57)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(59)..(68)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(70)..(70)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(72)..(72)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(75)..(78)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(82)..(82)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(88)..(88)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(90)..(90)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(92)..(99)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(102)..(103)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(108)..(109)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(111)..(111)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(114)..(115)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(118)..(118)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(120)..(120)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(123)..(123)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(125)..(125)

<222>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(127)..(127)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(144)..(144)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(148)..(148)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(150)..(151)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(157)..(157)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(163)..(163)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(175)..(176)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(186)..(187)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(189)..(190)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(192)..(202)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(204)..(204)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(209)..(209)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(213)..(217)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(219)..(219)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(222)..(223)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(232)..(234)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(237)..(237)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(239)..(239)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(245)..(245)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(247)..(247)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(249)..(253)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(256)..(256)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(264)..(264)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(267)..(273)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(276)..(277)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(279)..(283)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(285)..(285)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(287)..(287)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(289)..(290)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(292)..(292)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(294)..(299)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(301)..(304)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(307)..(308)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(310)..(323)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(326)..(329)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(333)..(334)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(336)..(336)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(344)..(344)

<223>Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(347)..(352)

<223>Xaa可以是任何天然存在的氨基酸

<400>73

Met Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

1               5                   10                  15

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

            20                  25                  30

Xaa Xaa Xaa Xaa Asn Xaa Ile Lys Xaa Xaa Xaa Gly Asn Ser His Xaa

        35                  40                  45

Xaa Leu Xaa Xaa Xaa Xaa Xaa Xaa Xaa Leu Xaa Xaa Xaa Xaa Xaa Xaa

    50                  55                  60

Xaa Xaa Xaa Xaa Tyr Xaa Asn Xaa Glu Thr Xaa Xaa Xaa Xaa Gly Glu

65                  70                  75                  80

Ser Xaa Arg Asp Glu Asp Val Xaa Ile Xaa Gln Xaa Xaa Xaa Xaa Xaa

                85                  90                  95

Xaa Xaa Xaa Asn Asp Xaa Xaa Met Glu Leu Leu Xaa Xaa Ile Xaa Ala

            100                 105                 110

Cys Xaa Xaa Ala Ser Xaa Arg Xaa Ile Thr Xaa Val Xaa Pro Xaa Phe

        115                 120                 125

Pro Tyr Ala Arg Gln Asp Lys Lys Asp Lys Ser Arg Ala Pro Ile Xaa

    130                 135                 140

Ala Lys Leu Xaa Ala Xaa Xaa Leu Glx Thr Ala Gly Xaa Asx His Val

145                 150                 155                 160

Ile Thr Xaa Asp Leu His Ala Ser Gln Ile Gln Gly Phe Phe Xaa Xaa

                165                 170                 175

Pro Val Asp Asn Leu Tyr Ala Glu Pro Xaa Xaa Leu Xaa Xaa Ile Xaa

            180                 185                 190

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Val Xaa Pro Asp Ala Gly

        195                 200                 205

Xaa Ala Lys Arg Xaa Xaa Xaa Xaa Xaa Asp Xaa Leu Asx Xaa Xaa Phe

    210                 215                 220

Ala Leu Ile His Lys Glu Arg Xaa Xaa Xaa Asn Glu Xaa Ser Xaa Met

225                 230                 235                 240

Val Leu Val Gly Xaa Val Xaa Lys Xaa Xaa Xaa Xaa Xaa Asp Asp Xaa

                245                 250                 255

Ala Asp Thr Cys Gly Thr Leu Xaa Lys Ala Xaa Xaa Xaa Xaa Xaa Xaa

            260                 265                 270

Xaa Gly Ala Xaa Xaa Val Xaa Xaa Xaa Xaa Xaa His Xaa Ile Xaa Ser

        275                 280                 285

Xaa Xaa Ala Xaa Glx Xaa Xaa Xaa Xaa Xaa Xaa Leu Xaa Xaa Xaa Xaa

    290                 295                 300

Thr Asn Xaa Xaa Pro Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

305                 310                 315                 320

Xaa Xaa Xaa Asp Ile Xaa Xaa Xaa Xaa Ala Glu Ala Xaa Xaa Arg Xaa

                325                 330                 335

His Asn Gly Glu Ser Val Ser Xaa Leu Phe Xaa Xaa Xaa Xaa Xaa Xaa

            340                 345                 350

高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈