首页 / 专利库 / 植物油脂 / 植物油 / 棉籽油 / 改良的棉籽油及应用

改良的籽油及应用

阅读:551发布:2020-05-11

专利汇可以提供改良的籽油及应用专利检索,专利查询,专利分析的服务。并且本 发明 涉及 棉 株和棉籽以及由它们制备得到的具有提高的油酸 水 平以及降低的棕榈酸和亚油酸水平的 棉籽油 的生产。此外,本发明描述了具有降低的环丙烷和/或环丙烯 脂肪酸 水平和/或降低的棉酚水平的棉籽。本发明还描述了来源于棉花的FatB和CPA-FAS的核苷酸和 氨 基酸序列,以便对,尤其是 植物 油 含量和/或组成进行直接改良。,下面是改良的籽油及应用专利的具体信息内容。

1.在其籽油中具有改良的脂肪酸成分的棉籽,其中棉籽油中总脂肪酸含量的
72%~88%为油酸,4%~16%为棕榈酸,4%~15%为亚油酸。
2.如权利要求1所述的棉籽,其中棉籽油中总脂肪酸含量的74%~86%为油酸。
3.如权利要求1或2所述的棉籽,其中4%~10%为棕榈酸。
4.如权利要求1、2或3所述的棉籽,其中4%~12%为亚油酸。
5.如权利要求1-4任一项所述的棉籽,其中总脂肪酸含量中反式脂肪酸≤0.5%,优选≤0.1%。
6.如权利要求5所述的棉籽,其中所述反式脂肪酸为反油酸。
7.如权利要求1-6任一项所述的棉籽,其中棉籽油中总脂肪酸含量的0.1%~0.5%为环丙烷脂肪酸(CPA)或环丙烯脂肪酸(CPE)或其组合。
8.如权利要求7所述的棉籽,其中所述环丙烷或环丙烯脂肪酸为锦葵酸、萍婆酸、二氢萍婆酸或它们任意两者的组合或三者的组合。
9.如权利要求1-8任一项所述的棉籽,其中总脂肪酸含量中≤0.5%,优选≤0.1%的为在C9或C10上带有支链的脂肪酸。
10.如权利要求1-9任一项所述的棉籽,其中棉籽进一步具有降低的棉酚平,其中棉籽中棉酚的水平相对于棉花品种Coker中棉酚的水平至少降低10%。
11.如权利要求1-10任一项所述的棉籽或由它们获得的棉籽油,其中棉籽为转基因的,其基因基因构建体编码抑制ghFAD2-1和ghFatB-2两个基因或ghFAD2-1、ghFatB-2和ghCPA-FAS-2三个基因表达的一个或多个RNA分子。
12.如权利要求1-11任一项所述的棉籽,其为陆地棉或海岛棉的棉籽。
13.制备改良的棉籽油的方法,该方法包括步骤(i)获得如权利要求1-12任一项所述的棉籽,(ii)从棉籽中提取油,以及(iii)回收棉籽油,其中所述棉籽油具有改良的脂肪酸组成,如棉籽油中总脂肪酸含量的72%~88%为油酸,4%~16%为棕榈酸,4%~15%为亚油酸。
14.如权利要求13所述的方法,其中步骤(i)进一步包括从棉株中收获含有棉籽的籽棉和/或从含有棉籽的籽棉中轧出棉籽,和/或其中步骤(ii)包括压碎棉籽,和/或其中步骤(iii)包括纯化棉籽油,和/或其中所述方法不包括氢化棉籽油的步骤。
15.从权利要求1-12任一项所述的棉籽中回收的或通过权利要求13或14所述方法制备的棉籽油。
16.制备权利要求1-12任一项所述棉籽的方法,包括从棉株收获籽棉并进行轧棉,由此得到棉籽。
17.获得棉株的方法,包括播种权利要求1-12任一项所述的棉籽并使棉籽生长为棉株。
18.能够产生权利要求1-12任一项所述棉籽的棉株。
19.从权利要求18的棉株中获得的皮棉。
20.鉴定棉籽油中具有改良的脂肪酸成分的棉籽的方法,包括(i)获得转基因棉籽,(ii)测定棉籽油的脂肪酸组成,以及(iii)挑取棉籽油中总脂肪酸含量的72%~88%为油酸,4%~16%为棕榈酸,4%~15%为亚油酸的棉籽。
21.如权利要求20所述的方法,进一步包括在步骤(i)之前,用基因基因构建体转化棉花细胞并再生出转基因棉株。
22.如权利要求20或21所述的方法,其中步骤(i)的棉籽为转基因的,其基因基因构建体编码抑制ghFAD2-1和ghFatB-2两个基因或ghFAD2-1、ghFatB-2和ghCPA-FAS-2三个基因表达的一个或多个RNA分子。
23.如权利要求16、17或20-22任一项所述的方法,进一步包括挑取棉籽油中具有改良的脂肪酸组成或具有权利要求2-12任一项所述的特征的棉籽,其中棉籽油中总脂肪酸含量的72%~88%为油酸,4%~16%为棕榈酸,4%~15%为亚油酸。
24.权利要求16、17或20-23任一项所述的方法,进一步包括从所述棉籽获得棉株的步骤,以及将所述棉株与优选具有不同遗传背景的第二个棉株杂交的步骤。
25.权利要求1-12任一项所述的棉籽在生产分离油或棉籽粕中的应用。
26.权利要求1-12任一项所述的棉籽或由其制备的棉籽粕作为动物饲料的应用。
27.权利要求1-12任一项所述的棉籽油在生产食品或燃料中的应用。
28.如权利要求27所述的应用,其为增加食品的油酸含量或降低棕榈酸含量。
29.如权利要求25-28任一项所述的应用,其为增加食品中单饱和脂肪酸的水平,或降低饱和脂肪酸或反式脂肪酸的水平,或增加动物对单饱和脂肪酸的摄入量,或降低动物对饱和脂肪酸或反式脂肪酸的摄入量。
30.含有权利要求11或15所述棉籽油作为食物成分的食品。
31.制备油炸食品的方法,该方法包括在权利要求11或15所述的棉籽油中油炸食品。
32.治疗预防个体疾病的方法,包括使个体口服权利要求11或15所述的棉籽油,权利要求1-12任一项所述的棉籽或权利要求30所述的食品,其中所述疾病优选为肥胖、心脏病、高血清三酰甘油含量(high serum TAG content)、高血清胆固醇、高血清低密度脂蛋白、低血清高密度脂蛋白、高血压、癌症、糖尿病或它们的任意组合。
33.如权利要求32所述的方法,其中个体为人。
34.编码基因沉默核酸的嵌合核酸分子,其中基因沉默核酸降低棉株中两种或多种选自棉FatB、棉FAD2和棉CPA-FAS基因的表达。
35.如权利要求34所述的嵌合核酸分子,其中基因沉默核酸降低棉FAD2-1和棉FatB-2或棉FAD2-1、棉FatB-2和CPA-FAS-2基因的表达。
36.如权利要求34或35所述的嵌合核酸分子,包括:(i)如SEQ IDNO:17所示的连续核苷酸序列或其互补序列,或与其具有90%序列同一性或在严格杂交条件下与其互补序列杂交的序列,或(ii)缺失编码CPA-FAS-2多肽或其片段的序列的(i)的核酸分子的突变体。
37.如权利要求34-36任一项所述的嵌合核酸分子,其中基因沉默核酸分子为发夹RNA。
38.含有权利要求34-36任一项所述核酸的嵌合基因基因构建体,并进一步含有图12中所示的结构或图13中所示的A、E、F、G和H片段的序列,或它们的功能突变体。
39.含有权利要求34-37任一项所述嵌合核酸分子或权利要求38所述嵌合核酸基因构建体的宿主细胞。
40.含有权利要求34-37任一项所述嵌合核酸分子或权利要求38所述嵌合核酸基因构建体的植物或其组织或细胞。
41.如权利要求34-37任一项所述嵌合核酸分子或权利要求38所述嵌合核酸基因构建体在降低棉株的棉FAD2-1和棉FatB-2和/或棉CPA-FAS-2基因表达中的应用。
42.含有降低水平的选自棉FAD2、棉FatB和CPA-FAS的一个或多个内源基因的改良的棉株或由其获得的棉籽,优选含有两个或多个所述基因或全部三个基因,其中所含棉籽油或由其获得的棉籽油具有提高的油酸水平以及降低的棕榈酸和亚油酸水平。
43.权利要求42所述的棉株或棉籽,其棉籽油显示出降低的环丙烯和/或环丙烷脂肪酸或棉酚水平。
44.含有编码具有棉FatB活性的多肽,或其功能性片段或其突变体或其互补形式的核苷酸序列的分离的核酸分子,所述核苷酸序列选自下组:
(i)与SEQ ID NO:5或7所示的核苷酸序列的蛋白编码区核苷酸序列具有至少90%同一性的核苷酸序列;
(ii)编码与SEQ ID NO:6或7所示的基酸序列具有至少80%同一性的多肽序列的核苷酸序列;
(iii)在至少中度严格杂交条件下,与来源于SEQ ID NO:5或7的至少30个连续核苷酸杂交的核苷酸序列;
(iv)与(i)、(ii)或(iii)互补的核苷酸序列,如反义、核酶或双链RNA或其它基因沉默因子;
(v)含有SEQ ID NO:5的548-843核苷酸的核苷酸序列;以及
(vi)含有来源于SEQ ID NO:5或SEQ ID NO:7或它们的互补序列的至少15个连续核苷酸的分离的探针或引物。
45.含有编码具有棉CPA-FAS活性的多肽,或其功能性片段或其突变体或其互补形式的核苷酸序列的分离的核酸分子,所述核苷酸序列选自下组:
(i)与SEQ ID NO:10、12或14所示的核苷酸序列的蛋白编码区核苷酸序列具有至少
90%同一性的核苷酸序列;
(ii)编码与SEQ ID NO:11、13或15所示的氨基酸序列具有至少80%同一性的多肽序列的核苷酸序列;
(iii)在至少中度严格杂交条件下,与来源于SEQ ID NO:10、12或14的至少30个连续核苷酸杂交的核苷酸序列;
(iv)与(i)、(ii)或(iii)互补的核苷酸序列,如反义、核酶或双链RNA或其它基因沉默因子;
(v)含有编码如图13的B片段中所示序列的CPA-FAS-2的442个核苷酸的核苷酸序列;以及
(vi)含有来源于SEQ ID NO:10、SEQ ID NO:12或SEQ ID NO:14或它们的互补序列的至少15个连续核苷酸的分离的探针或引物。

说明书全文

改良的籽油及应用

技术领域

[0001] 本发明涉及棉株和棉籽以及由它们制备得到的具有提高的油酸平以及降低的棕榈酸和亚油酸水平的棉籽油的生产。此外,本发明描述了具有低水平的环丙烷和/或环丙烯脂肪酸和/或低水平棉酚的棉籽。本发明还描述了来源于棉花的FatB和CPA-FAS的核苷酸和基酸序列,以便对,尤其是植物油含量和/或组成进行直接改良。

背景技术

[0002] 棉花是一种两用作物,能同时产生纤维和有价值的初级农产品种子。通常情况下,棉籽产品,包括荚(26%)、棉绒(9%)、棉籽油(16%)和棉籽粕(45%)代表了约15%棉花作物的农用价值(Cherry and Leffler,Seed.In″Cotton,agronomy monograph No.24 ″ (eds RJ Kohel,CFLewis)pp.511-569.Crop Science Society of America,Madison,WI,USA,1984),而皮棉提供了其余85%的价值中的大部分。棉籽油是从棉籽中得到的最有价值的产品。
[0003] 在食品加工中使用棉籽油具有悠久的历史。由于棉籽油具有温和的、中性的味道,不会掩盖食物固有的味道,因此是快餐食品和食品服务部中用于深度油炸的受欢迎的和广泛使用的油(Jones and King,Cottonseed Oil.National Cottonseed Products Associations,Inc.and the Cotton Foundation,Memphis,TN,USA,1993)。棉籽油也常用作卤汁、调料、糕点、人造黄油和酥油的成分。
[0004] 与其它植物油一样,棉籽油的营养和工业价值受油中脂肪酸组成的影响,即油中各脂肪酸的相对水平,并受各脂肪酸的链长度和不饱和程度所决定的性质的影响。
[0005] 分离纯化的棉籽油主要(95%)由三酰甘油(TAGs)组成,在种子发育过程中合成并沉积。TAG分子由甘油骨架上酯化三个脂肪酸成分,指定为sn-1、sn-2和sn-3位组成。简言之,棉籽中脂肪酸的重新生物合成,与其它油籽中一样,发生于种子发育和生长过程中,即成熟前的质体的基质中。然后脂肪酸由质体中以酰基辅酶A硫酯的形式导出到细胞质内膜系统(内质网,ER),通过酰基转移酶的作用,在将酰基从辅酶A硫酯转移至磷脂上后,进行脂肪酸的修饰。然后是TAG在油质体中的组装及贮存。
[0006] 通过添加羧基将乙酰辅酶A活化为三碳中间体,丙二酰辅酶A,含生物素的乙酰辅酶A羧化酶(ACCase)催化该途径中的第一步关键反应。然后将丙二酰基从辅酶A转移至作为延长脂肪酸链载体的酰基载体蛋白(ACP)上。丙二酰-ACP与第二个乙酰辅酶A缩合酶,基酰基-ACP合成酶III(KASIII)反应,得到四个碳链。由KASI催化在延长的脂肪酸链上反复添加二碳单元,生成棕榈酰-ACP。KASII催化棕榈酰-ACP延长为硬脂酰-ACP。可溶性硬脂酰-ACP Δ9-去饱和酶将第一个双键引入硬脂酰-ACP中,将其转化为细胞质中的油酰-ACP。延长的饱和脂肪酰链和单不饱和油酸酯分别通过特异性硫酯酶FatB或FatA从ACP上去掉,使它们能够从质体进入细胞质中。释放至细胞质中的饱和脂肪酸没有被进一步修饰。然而,通过膜结合的去饱和作用,油酸可在内质网(ER)膜上被进一步修饰。磷酸卵磷脂(PC)结合的脂酰基作为用于ER定位的底物,脂修饰酶如脂肪酸去饱和酶2(FAD2),其将双键引入油酸中PC的sn-2位上以生成亚油酸。然后全部修饰的和未修饰的脂肪酰基形成带有辅酶A的池(pool)。在棉花而不是其它温带油籽中,油酸可用作由环丙烷脂肪酸合酶催化的环丙烷化的底物以生成二氢苹婆酸。随后该脂肪酸去饱和生成苹婆酸,然后在α-化酶作用下生成锦葵酸。最后,脂肪酰基经肯尼迪(Kennedy)途径在一系列TAG组装酶的作用下,通过连续的甘油-3-磷酸酯化作用整合到贮存脂类中。
[0007] 酰基-ACP硫酯酶(FatB)(EC 3.1.2.14)催化酰基-ACP中酰基团和ACP之间硫酯键的水解,并在质体中释放游离脂肪酸。然后游离脂肪酸中质体外膜中被重新酯化至辅酶A上,运输到质体外。FatB属于一类核编码的、可溶的脂肪酸硫酯酶(FAT),其首先被翻译成前体蛋白。因此,质体中FAT酶的底物特异性决定了从质体中运输的脂肪酸的链长和饱和程度的范围。基于它们的底物特异性和核苷酸序列,FAT酶可分为两类,Fat A和FatB(Jones等,Plant Cell 7:359-371,1995)。Fat A以油酰-ACP作为底物,而FatB对不同链长的饱和酰基-ACPs显示出较高的活性。编码FatB酶的基因由累积中等链长的饱和脂肪酸的植物品种如加利福尼亚桂树(Umbellularia californica)的月桂酸(C12:0)中首次分离得到。U.californica FatB1基因在转基因芸苔中的过表达产生了占油中总脂肪酸50%的高月桂酸酯油(Voelker等,Plant Journal9:229-241,1996)。后来的研究表明FatB的几个同源基因存在于植物的组织中,包括种子中,底物特异性范围从C8:0-ACP至C18:0-ACP。
[0008] 由常规(野生型)陆地棉(G.hirsutum)制得的棉籽油一般含有约26%棕榈酸(范围22-28%)、2%硬脂酸、15%油酸(范围13-18%)和58%亚油酸(范围52-60%)(Cherry,J.Am.Oil Chem.Soc.60:360-367,1983;O ′ Brien,Cottonseed Oil.In:F.D.Gunstone(Ed.)Vegetable Oils in Food Technology:Composition,Properties and Uses.Blackwell Publishing,Oxford,pp.203-230,2002)。除了这些在大多数其它温带油籽作物中也存在脂肪酸,未氢化的棉籽油还含有低水平(0.5-1%)的环丙烷或环丙烯脂肪酸,主要是锦葵酸、苹婆酸和二氢苹婆酸(Shenstone and Vickery,Nature 190:68-169,
1961;Cherry,1983(同上))。在锦葵目和一些裸子植物的籽油中发现环丙烷(CPA)和环丙烯(CPE)脂肪酸。两个无患子科品种,荔枝(Litchi chinensis)和龙眼(Euphoria longan)的籽油中含高达40%的CPA脂肪酸,主要为二氢苹婆酸(DHS)。香苹婆(Sterculia foetida)的籽油含高达78%的CPE脂肪酸,主要为苹婆酸(STC)和锦葵酸(MVL)。未氢化的棉籽油含相对少量(0.5-1.0%)的CPE和CPA脂肪酸,主要在胚轴中。还发现在棉花根和下胚轴中也累积了低水平的STC和MVL。除了棉花以外,在大部分油籽作物中检测不到CPA和CPE,包括棕榈油、大豆、玉米、油菜、芥菜、向日葵、红花、花生、亚麻籽、其它芸苔属等。
[0009] 生产这些稀有脂肪酸的第一个关键步骤是由环丙烷脂肪酸合酶(CPA-FAS)催化的,其在油酸的双键处增加亚甲基以生成DHS(图2)。在棉花中,大部分DHS通过CPA去饱和酶进行去饱和生成STC,大部分STC通过α-氧化作用进一步修饰形成MVL(图2)。MVL是野生型棉籽油中主要的环丙烯型脂肪酸。
[0010] 与来自大多数其它温带油籽作物的油相比,棉籽油中相对高水平的饱和脂肪酸,主要是棕榈酸,通过抵消其它更不稳定的不饱和脂肪酸成分,有助于棉籽油的氧化稳定性。它还具有生产产品如人造黄油和酥油所需的高熔点。另一方面,由于能够提高人体与心血管心脏病(CHD)的险增加有关的低密度脂蛋白胆固醇,高水平的棕榈酸营养价值较低(Lindsey等,Exp.Biol.Med.195:261-269,1990)。除了棕榈油,在主要商品植物油中,棉籽含有最高的棕榈酸水平(26%)。棕榈酸和其它更短链的饱和脂肪酸被广泛报道能够提高血浆总胆固醇和低密度脂蛋白胆固醇水平(Kris-Etherton等,Nutrition-today(USA).28:30-38,1993)。棉籽油还含有高水平的氧化不稳定的亚油酸,因此限制了油的货架期,使它不适合用于某些食品。
[0011] 因此常规棉籽油通常经过部分氢化加工,在该过程中多不饱和亚油酸转化为更多稳定的单不饱和(油酸)及饱和(硬脂酸)脂肪酸。部分氢化的结果是使部分脂肪酸的许多结构发生改变,包括双键的移位。这可能导致形成天然存在的不饱和脂肪酸的异构体,反式脂肪酸(TFA)的产生。在大多数天然存在的不饱和脂肪酸如油酸中,两个氢原子加入位于碳链同侧的双键碳原子中,称为顺式双键。然而,部分氢化重构了某些双键,使得两个氢原子位于碳碳双键的两侧,由于它是低能量形式,称为反式构型。因此,部分氢化产生反式脂肪酸,如从油酸得到反油酸。油酸和反油酸含有相同的碳原子数(C18:1),双键在相同的位置,但双键的构象将它们区分开来。含反油酸的具有反式双键构型的TAG比油酸具有更高的熔点。近年来,已逐渐认识到TFA能够显著提高人体中低密度脂蛋白胆固醇并降低高密度脂蛋白胆固醇,因此根据从流行病学和临床研究得出的证据,它增加了心血管疾病的风险(Oomen等,Lancet 357:746-751,2001;Mozaffarian等,N.Engl.J.Med.354:1601-1613,2006)。部分氢化还通过打开环丙烷环,将环丙烷或环丙烯脂肪酸转化为支链脂肪酸,产生的支链脂肪酸中脂肪酸碳链的C9或C10位上连有添加的甲基。
[0012] 与多不饱和脂肪酸相比,油酸在常温贮藏温度及烹饪和油炸食品所用的高温下对于氧化作用是更稳定的。用许多植物油如红花和大豆油研究表明,与含大量多不饱和脂肪酸的油相比,高油酸植物油在储存期间酸败发展较慢,或在煎炸或其它用途中氧化分解较慢(Fuller等,J.FoodSci.31:All-Am,1966;Mounts等,J.Am.Oil Chem.Soc.65:624-628,1998)。
[0013] 如上所述,棉籽油的特征还在于含有少量的锦葵酸、苹婆酸和二氢苹婆酸,由油酸获得的一组环丙烷脂肪酸。已知锦葵酸和苹婆酸是动物Δ9-硬脂酰辅酶A去饱和酶的强效抑制剂。虽然CPA和CPE脂肪酸并不稳定且大多在油加工过程中被消除,特别是通过氢化,但在用餐中剩余的油和饲料工业中使用的全部棉籽可能对动物的健康产生负面影响。以过量的棉籽饲喂养殖动物,可能引起一些动物的健康问题,并可能影响到动物产品的质量,如蛋黄和奶中的脂肪硬化(Johnson等,Nature 214:1244-1245,1967;Roehm等,Lipids5:80-84,1970)。已开发出通过专门的部分氢化步骤灭活环丙烯型脂肪酸。Merker和Mattil,1965年报道了一种氢化方法,其中通过镍催化剂,锦葵酸和苹婆酸有选择性地被还原为它们的二氢或四氢衍生物,该方法没有显著减少亚油酸或反式酸的形成。Hutchins等,Journal of American Oil Chemists Society 45:397-399,1968年发现通过填充床反应器和镍催化剂,在温和条件下,棉籽油中的类环丙烯表现出选择性氢化。然而,这些氢化过程增加了油加工的额外费用,是不可取的。
[0014] 在二十世纪七十年代,加州Acala SJ系列的棉花育种计划(Cherry,1983(同上))将棉籽油中的棕榈酸从23.3%降至22.7%,将油酸从16.6%升至17.3%,并将环状脂肪酸油酸总量从0.9%降至0.8%。然而,相对于在其它油籽作物中取得的成就,这些变化只是轻微的,反映出由于对棉花性状而不是油品质进行持续选择,导致过窄的优良棉花品种的遗传基础
[0015] 从棉花中分离出编码FAD2的四个不同的cDNAs(Liu等,Australian Journal of Plant Physiology 26:101-106,1999a;Liu 等,Plant Physiol.120:339,1999b;Pirtle等,Biochim.Biophys.Acta 1522:122-129,2001,全部通过引用并入于此),其中ghFAD2-l被认为在棉籽油的亚油酸产生中起重要作用。基因表达分析表明ghFAD2-l基因在发育的种子中特异表达,在种子发育的成熟阶段中期表达量最大(Liu等,1999a(同上))。
[0016] 美国专利No.6974898(以参阅的方式并入于此)描述了通过RNA干扰(RNAi)的方法下调微粒体Δ12-去饱和酶(FAD2)产生含高达77%油酸的棉籽油。
[0017] Chapman等,J.Am.Oil Chem.Soc.78:941-947,2001,以参阅的方式并入于此,用从油菜籽中获得的编码非功能性的fad2突变等位基因的基因构建体转化棉株,并从种子特异性菜豆蛋白启动子中正向表达。产生的约一半的43株转基因系显示出籽油中油酸含量略增加,为24%~30%。在后代中,鉴定出具有更高水平的达40%油酸的种子。
[0018] 具有低水平棕榈酸籽油的拟南芥fatB突变株在常温下显示生长缓慢(Bonaventure等,Plant Cell 15:1020-1033,2003)。然而,在之前的研究中用反义基因构建体下调拟南芥中的AtFatB,用CaMV35S启动子表达反义RNA,仅观察到在花和种子中棕榈酸水平降低,在叶片和根中没有下降,且无明显的可视表型(Dormann等,Plant Physiol.123:637-644,2000,以参阅的方式并入于此)。
[0019] 在棉花中,象在许多温带植物中一样,FatB酶似乎由多基因家族编码。Yoder等,Biochimica et Biophysica Acta 1446:403-413,1999,以参阅的方式并入于此,分离出被认为编码棉花中酰基-ACP硫酯酶的基因组DNA序列。
[0020] Wilson 等,J.Am.Oil Chem.Soc.78:335-340,2001 和 Buhr 等,Plant J.30:155-163,2002,均以参阅的方式并入于此,分别使用反义和核酶的方法降低大豆种子中的棕榈酸。
[0021] 近来,基于EST法从香苹婆中分离出CPA-FAS基因(Bao等,Proc.Natl.Acad.Sci.U.S.A.99:7172-7177,2002)。来自陆地棉的两个EST序列通过接种镰刀霉侵染棉花的根/胚轴,鉴定出是差异表达的(Dowd等,Molecular Plant-Microbe Interactions.17:654-667,2004,以参阅的方式并入于此)。
[0022] 因此,需要一种改良的棉籽油。
[0023] 发明概述
[0024] 在本发明通篇说明书中,除需其它说明,词语“含有(comprise)”或变化形式如“含有(comprises)”或“含有(comprising)”应被理解为表示含有所述成分或整体或成分或整体的组,但不排除任何其它成分或整体或成分或整体的组。除非另有明确说明,每个实施方案比照适用于本发明的每一个其它实施方案。
[0025] 此处使用的单数形式“一个,一种(a)”、“一个,一种(an)”和“这个(the)”包含复数含义,除非文中另有清楚的规定。因此,例如参考“一个突变(a mutation)”包括单个突变以及两个或多个突变;参考“一种试剂(an agent)”包括一种试剂以及两种或多种试剂;等等。
[0026] 本发明中作者提到的出版物的目录详情列于说明书末尾。
[0027] 本发明中参考的任何之前的出版物(或来自于它的信息),或任何已知情况不被且不应当被当做对之前出版物(或来自于它的信息)或已知情况形成本发明所属领域的部分公知常识的承认或允许或任何形式的建议。
[0028] 术语“衍生自(derived from)”表示特定整体从特定来源获得,尽管不必直接从该来源获得。
[0029] 示例性氨基酸序列的指定列于表5中。
[0030] 核苷酸和氨基酸序列参考序列识别号(SEQ ID NO:)。SEQ IDNos:数字对应于序列识别号<400>1(SEQ ID NO:1),<400>2(SEQ IDNO:2),等。序列识别号概括于表4中。序列表列于权利要求之后。
[0031] 本文的基因和其它遗传物质(例如mRNA,核酸基因构建体等)以斜体表示,而它们的蛋白表达产物以非斜体形式表示。
[0032] 在一个实施方案中,本发明描述了制备改良的棉籽油的方法,包括步骤(i)获得棉籽,(ii)从棉籽中提取油,以及(iii)回收棉籽油,其中所述棉籽油具有改良的脂肪酸组成,如棉籽油中总脂肪酸含量的72%~88%为油酸,4%~16%为棕榈酸,4%~15%为亚油酸。在一些实施方案中,棉籽油总脂肪酸含量的74%~86%为油酸。在另一些实施方案中,4%~10%为棕榈酸。在其它实施方案中,4%~12%为亚油酸。关于反式脂肪酸,在某些实施方案中,棉籽油具有≤0.5%,优选≤0.1%的总脂肪酸含量的反式脂肪酸。在某些实施方案中,反式脂肪酸为反油酸。在某些实施方案中,棉籽油中总脂肪酸含量的0.1%~0.5%为环丙烷脂肪酸(CPA)或环丙烯脂肪酸(CPE)。在特定的实施方案中,环丙烷或环丙烯脂肪酸为锦葵酸、苹婆酸、二氢苹婆酸或它们任意二者的组合或三者的组合。在其它实施方案中,总脂肪酸含量中≤0.5%,优选≤0.1%为C9或C10位上的支链脂肪酸。在优选实施方案中,籽油的总脂肪酸含量组成为74%~86%油酸,4%~10%棕榈酸,4%~12%亚油酸,反式脂肪酸环丙烷脂肪酸(CPA)和环丙烯脂肪酸(CPE)总量任选为总脂肪酸含量的
0.1%~0.5%,任选≤1.0%,优选≤0.5%,更优选≤0.1%。
[0033] 在某些实施方案中,制备方法进一步包括从棉株收获含有棉籽的籽棉和/或轧含有棉籽的籽棉。或者或此外,步骤(ii)包括粉碎棉籽和/或用溶剂提取粉碎的棉籽。在进一步的实施方案中,步骤(iii)包括纯化棉籽油。纯化籽油可包括油脱胶、油脱色、油脱臭、改变油的pH值、油水解或它们的任意组合。
[0034] 有利地,在某些实施方案中,所述方法不包括棉籽油的氢化或部分氢化步骤。不限于任何特定的作用模式,低水平的亚油酸和相对高水平的油酸省却了需要稳定脂肪酸的步骤,从而避免了由某些氢化形式诱导的反式脂肪酸的从头合成。
[0035] 因此,在另一个方面,本发明提供了具有改良的脂肪酸组成的棉籽油,其中棉籽油中总脂肪酸含量的72%~88%为油酸,4%~16%为棕榈酸,4%~15%为亚油酸。在某些实施方案中,棉籽油总脂肪酸含量的74%~86%为油酸。在其它实施方案中,4%~10%为棕榈酸。在其它实施方案中,4%~12%为亚油酸。在某些实施方案中,棉籽油中总脂肪酸含量的0.1%~0.5%为环丙烷脂肪酸(CPA)或环丙烯脂肪酸(CPE)。在特定的实施方案中,环丙烷或环丙烯脂肪酸为锦葵酸、苹婆酸、二氢苹婆酸或它们任意二者的组合或三者的组合。在优选实施方案中,籽油的总脂肪酸含量组成为74%~86%油酸,4%~10%棕榈酸,4%~12%亚油酸,反式脂肪酸环丙烷脂肪酸(CPA)和环丙烯脂肪酸(CPE)总量任选为总脂肪酸含量的0.1%~0.5%,任选≤1.0%,优选≤0.5%,更优选≤0.1%。
[0036] 在另一个方面,本发明提供了棉籽油中具有改良脂肪酸组成的棉籽,其中棉籽油中总脂肪酸含量的72%~88%为油酸,4%~16%为棕榈酸,4%~15%为亚油酸。在某些实施方案中,棉籽油总脂肪酸含量的74%~86%为油酸。在其它实施方案中,4%~10%为棕榈酸。在其它实施方案中,4%~12%为亚油酸。在进一步的实施方案中,棉籽油中总脂肪酸含量的0.1%~0.5%为环丙烷脂肪酸(CPA)。在更进一步的实施方案中,棉籽具有降低水平的棉酚,其中棉籽中棉酚的水平相对于棉花品种Coker中的棉酚水平下降了至少10%。在优选实施方案中,籽油的总脂肪酸含量组成为74%~86%油酸,4%~10%棕榈酸,4%~12%亚油酸,反式脂肪酸环丙烷脂肪酸(CPA)和环丙烯脂肪酸(CPE)总量任选为总脂肪酸含量的0.1%~0.5%,任选≤1.0%,优选≤0.5%,更优选≤0.1%。
[0037] 在某些实施方案中,本发明提供了棉籽或由它们获得的棉籽油,其中棉籽为转基因的,其基因基因构建体编码抑制选自FAD2、FatB-2和CPA-FAS-2的两个或多个基因表达的RNA分子。在某些实施方案中,所述基因为ghFAD2-1、ghFatB-2和ghCPA-FAS-2。在一个例举的实施方案中,所述基因基因构建体包括图12中所示的MonoCott结构。在另一个实施方案中,所述棉籽为转基因的,其基因基因构建体编码抑制两个基因ghFAD2-1和ghFatB-2表达RNA分子。在另一个例举的实施方案中,所述棉籽为陆地棉或海岛棉的棉籽。
[0038] 本发明的另一方面描述了生产本发明所述棉籽的方法,包括从棉株收获籽棉并轧籽棉,由此获得棉籽。在另一个实施方案中,所述方法包括播种本发明所述的棉籽并使棉籽生长成棉株。
[0039] 本发明提供了能够产生本发明所述棉籽的棉株以及从所述棉株获得的皮棉。
[0040] 依据本发明,本发明提供了鉴定棉籽油中具有改良的脂肪酸成分的棉籽的方法,包括(i)获得转基因棉籽,(ii)测定棉籽油的脂肪酸成分,以及(iii)挑取棉籽油中总脂肪酸含量的72%~88%为油酸,4%~16%为棕榈酸,4%~15%为亚油酸的棉籽。在某些实施方案中,步骤(i)的棉籽为转基因的,其基因基因构建体编码抑制两个基因ghFAD2-1和ghFatB-2或三个基因ghFAD2-1、ghFatB-2和ghCPA-FAS-2表达的RNA分子。在某些实施方案中,所述方法包括挑取棉籽油中具有改良的脂肪酸组成的棉籽,其中棉籽油中总脂肪酸含量的72%~88%为油酸,4%~16%为棕榈酸,4%~15%为亚油酸。在某些实施方案中,所述方法进一步包括由所述棉籽获得棉株的步骤,以及将所述棉株与优选具有不同遗传背景的第二个棉株杂交的步骤。
[0041] 因此,本说明书提供了本文所述棉籽的在制备分离油或棉籽粕中的应用,以及棉籽作为动物饲料或在生产食品或燃料中的应用。设想将所述棉籽油用于提高食品的油酸含量或降低棕榈酸含量。或者或此外,所述棉籽油用于降低食品中或由动物摄入的饱和脂肪酸或反式脂肪酸水平。应理解为这是相对于等量的未改良棉籽、油或棉籽粕的应用。
[0042] 在特定的实施方案中,本发明提供了含有此处所述棉籽油为食物成分的食品。
[0043] 本发明的另一方面提供了制备油炸食品的方法,包括在本文所述的棉籽油中油炸食品。
[0044] 所述目标产品可用于治疗,本发明提供治疗或预防个体疾病的方法,包括对个体口服给药本文所述的棉籽油、棉籽或食品。在某些实施方案中,所述疾病为肥胖、心脏病、高血清三酰甘油含量(high serumTAG content)、高血清胆固醇、高血清低密度脂蛋白、低血清高密度脂蛋白、高血压、癌症、糖尿病或它们的任意组合。包括任何受益于本发明方法或组合物的个体。术语“个体”包括但不限于人类、非人类的灵长类动物、家畜动物、伴侣动物(companion animals)、实验动物、圈养野生动物、爬行类和两栖类、鱼类、类和其它生物。不管是否为人类或非人类生物的个体均可作为患病体、个人、个体、动物、宿主或受体。在特定的实施方案中,所述个体为人。
[0045] 在某一方面,本发明描述了编码嵌合基因沉默核酸的核酸分子,所述基因沉默核酸降低棉株中来自棉FatB、棉FAD2和棉CPA-FAS的两个或多个基因的基因表达。在某些实施方案中,所述基因沉默核酸降低棉FAD2-1和棉FatB-2,或棉FAD2-1和棉FatB-2和CPA-FAS-2的基因表达。在某些实施方案中,所述核酸分子包括:(i)如SEQ ID NO:17所示的连续核苷酸序列或其互补序列,或与其具有90%序列同一性或在严格杂交条件下与其互补序列杂交的序列,或(ii)缺失编码CPA-FAS-2多肽的序列的(i)的核酸分子的突变体或它们的互补形式。在一个例举的实施方案中,所述基因沉默核酸分子为发夹RNA。在某些实施方案中,所述核酸分子在基因基因构建体中提供。
[0046] 在某些实施方案中,所述基因基因构建体包括核酸并进一步包括图12中所示的结构或图13中所示的A、E、F、G和H片段的序列,或它们的功能突变体。在其它实施方案中,提供含有目的核酸的植物或其组织或细胞。在某些实施方案中,所述核酸分子用于降低棉株中棉FAD2-1和棉FatB-2和/或棉CPA-FAS-2基因的表达。因此,本发明提供含有降低水平的选自棉FAD2、棉FatB和CPA-FAS的一个或多个内源基因的改良的棉株或由其获得的棉籽,优选含有两个或多个所述基因或全部三个基因,其中所含棉籽油或由其获得的棉籽油具有提高的油酸水平以及降低的棕榈酸和亚油酸水平。
[0047] 在另一实施方案中,棉籽油显示降低的环丙烷和/或环丙烯脂肪酸,或棉子酚水平。
[0048] 在进一步的实施方案中,本发明提供含有编码具有棉FatB活性的多肽,或其功能性片段或其突变体或其互补形式的核苷酸序列的分离的核酸分子,所述核苷酸序列选自由下列组成的组:(i)与SEQ ID NO:5或7所示的核苷酸序列的蛋白编码区核苷酸序列具有至少90%同一性的核苷酸序列;(ii)编码与SEQ ID NO:6或7所示的氨基酸序列具有至少80%同一性的多肽的核苷酸序列;(iii)在至少中度严格杂交条件下,与来自于SEQ ID NO:
5或7的至少30个连续核苷酸杂交的核苷酸序列;(iv)与(i)、(ii)或(iii)互补的核苷酸序列;以及(v)含有SEQ ID NO:5的548-843位上的核苷酸的核苷酸序列。在某些实施方案中,核酸特别是RNA或其功能性突变体或其片段为正义、反义、核酶、共抑制或双链RNA或其它基因沉默试剂。因此,本发明提供含有表达的且能降低棉FatB基因表达的上述(i)~(v)任一片段的反义或共抑制分子。
[0049] 在另一个实施方案中,提供的分离的探针或引物含有来自于SEQID NO:5或SEQ ID NO:7或它们互补形式的至少15个连续核苷酸。
[0050] 在另一方面,本发明提供含有编码具有棉CPA-FAS活性的多肽,或其功能性片段或其突变体或其互补形式的核苷酸序列的分离的核酸分子,所述核苷酸序列选自由下列组成的组:(i)与SEQ ID NO:10、12或14所示的核苷酸序列的蛋白编码区核苷酸序列具有至少90%同一性的核苷酸序列;(ii)编码与SEQ ID NO:11、13或15所示的氨基酸序列具有至少80%同一性的多肽的核苷酸序列;(iii)在至少中度严格杂交条件下,与来自于SEQ ID NO:10、12或14的至少30个连续核苷酸杂交的核苷酸序列;(iv)与(i)、(ii)或(iii)互补的核苷酸序列;以及(v)含有如图13的B片段中所示序列的CPA-FAS-2的442个核苷酸的核苷酸序列。在某些实施方案中,核酸特别是RNA或其功能性突变体或其片段为正义、反义、核酶、共抑制或双链RNA或其它基因沉默试剂。因此,本发明提供含有上述(i)~(v)任一片段的反义或共抑制分子,所述片段是表达得到的并能降低棉CPA-FAS-2基因的表达。
[0051] 在另一个实施方案中,分离的探针或引物为含有来自于SEQ IDNO:10、SEQ ID NO:12或SEQ ID NO:14或它们的互补形式的至少15个连续核苷酸。
[0052] 以上概述不是且不应该以任何方式被看作是对本发明所有实施方案的详尽描述。附图说明
[0053] 图1为发育棉籽中脂肪酸合成的简化示意图,示出了重要的酶催化步骤:1.酮酰合酶III(KASIII),2.酮酰合酶I(KASI),3.酮酰合酶II(KASII),4.Δ9-硬脂酰-ACP去饱和酶(SAD),5.油酰基-ACP硫酯酶,6.酰基-ACP硫酯酶,7.Δ12-油脂去饱和酶(FAD2),8.环丙烷脂肪酸合酶(CPA-FAS),9.环丙烷脂肪酸去饱和酶(CPA-FAD),10.α-氧化酶。
DHS:二氢苹婆酸;STC,苹婆酸;MVL,锦葵酸。
[0054] 图2为发育棉籽中环丙烷(CPA)和环丙烯(CPE)脂肪酸的生物合成示意图。油酸为环丙烷脂肪酸合酶的脂肪酸底物(CPA-FAS)。S-腺苷-L-甲硫氨酸是亚甲基供体,油酸的环丙烷化由CPA-FAS催化,生成二氢苹婆酸(DHS)。DHS可进一步通过CPA去饱和酶进行去饱和修饰,生成苹婆酸(STC)。随后,由氧化酶催化STC的α-氧化作用生成锦葵酸(MVL)。
[0055] 图3为ghFAD2-l基因对应的cDNA核苷酸序列,以及预测的编码ghFAD2-1多肽前体的氨基酸序列。蛋白编码区是从核苷酸第73位~1227位(TAA终止密码子)。
[0056] 图4为棉花酰基-ACP硫酯酶(ghFatB-2)cDNA的核苷酸序列,以及预测的由cDNA编码的前体ghFatB-2多肽的氨基酸序列。蛋白编码区是从核苷酸第210位~1472位(TAG终止密码子)。
[0057] 图5为棉花酰基-ACP硫酯酶(ghFatB-3)cDNA的核苷酸序列,以及预测的由cDNA编码的前体ghFatB-3多肽的氨基酸序列。蛋白编码区是从核苷酸第97位~(TAG终止密码子)。
[0058] 图6为实施例4中EST序列CD486555的DNA序列。
[0059] 图7为ghCPA-FAS-1的DNA序列及推定的其编码的多肽。
[0060] 图8为ghCPA-FAS-2的DNA序列及推定的其编码的多肽。
[0061] 图9为ghCPA-FAS-3的DNA序列及推定的其编码的多肽。
[0062] 图10为棉花中的CPA-FAS基因的Southern印迹分析。用HindIII消化来自不同的二倍体或四倍体棉花品种的基因组总DNAs。1道,海岛棉(A+D基因组);2道,陆地棉品种岱字棉-16(A+D基因组);3道,陆地棉品种Sicala-V4(A+D基因组);4道,草棉(A基因组);5道,雷蒙德氏棉(D基因组)。
[0063] 图11为棉花中表达的ghCPA-FAS-1(A)ghCPA-FAS-2(B)基因的RNANorthern印迹分析。杂交至膜上的RNA样品来自于:1道,子叶;2,胚轴;3,叶片;4,根;5~9,分别为开花后第25、30、35、40、45天发育的棉花胚;10,胚轴。
[0064] 图12为棉花中用于产生三重基因沉默的嵌合转基因(MonoCott基因构建体)。图11中详细描述了标记在该基因构建体顶部的片段的DNA序列。(缩写:LB:T-DNA左侧;
LecP:大豆凝集素启动子;ghFAD2-l:棉花微粒体油酰Δ12去饱和酶cDNA;ghCPA-FAS-2:
棉花环丙烷脂肪酸合酶;ghFatB-1:棉花棕榈酰-ACP硫酯酶;lec-T:大豆凝集素终止子;
RB2:T-T-DNA右侧2;S1:地三叶草矮化病毒片段1启动子;S3:地三叶草矮化病毒片段3终止子;NPTII:新霉素磷酸转移酶基因。还标注了形成RNAi结构中cDNA全长及选择的各靶基因的大小)。
[0065] 图13为用于形成图12中所示RNAi结构的DNA序列。片段A为种子特异性Lec1启动子;片段B为3个靶基因的嵌合片段,包括ghFAD2-l(下划线)、ghCPA-FAS-2(斜体)和ghFatB-2(粗体);片段C为用于分离反向重复序列的ghFAD2-l内含子。片段D为片段B的反向重复序列;片段E为凝集素基因转录终止子/多腺苷酸化序列;片段F为控制可选择标记基因(F+G+H)表达的s1启动子;片段G为带有可作为选择标记的卡那霉素抗性的NPTII虿白编码区;片段H,s3转录终止子/多腺苷酸化序列.
[0066] 图14图表所示为棕榈酸和油酸在DCS9-34的三代种子中的累积量:T2代种子为初级转基因系的后代(A);T3代种子为选择的T2代株的后代(B)和T4代种子为选择的T3代株的后代(C)。
[0067] 图15图表所示为切下的各棉花种子胚轴中总脂肪酸的累积量。DCS9-34为具有HO、LP和低环状脂肪酸特征的MonoCott系;Coker315为常规的或对照棉花。
[0068] 发明详述
[0069] 本发明基于改良棉株的生产,其中所述棉株用嵌合发夹RNA基因沉默基因构建体进行修饰。稳定后代的特征是,含有的油具有高品质,包括比对照及一般从商用棉花品种中提取的棉籽油具有显著更低的棕榈酸和亚油酸水平,以及显著更高的油酸水平。CPA-FAS-2基因表达的下降促使棉籽油中环丙烯型脂肪酸水平以及CPA和/或CPE的降低。虽然使用了发夹RNA基因沉默基因构建体本阐述本发明,但不限于此,其它的如本文描述的本领域技术人员已知的方法也可用于生产本发明所公开的优势棉株和由其衍生的产品。
[0070] 本发明中提到的棉籽油为内源棉籽油,其由来自于本发明所述改良的棉株的棉籽中提取得到。因此,本发明不涉及以实质上改变脂肪酸组成的方式对提取后棉籽油的改良。
[0071] 本发明包括基因活性及结构的修饰以及嵌合基因的应用。本文使用的术语“基因”包括任何脱氧核糖核酸序列,其包括编码蛋白编码区或在胞内转录但不翻译的区,以及相关的非编码区和调控区。这些相关区一般位于距离5′和3′端每一侧约2kb的邻近编码区或转录区的位置上。在这方面,基因可包括天然与给定基因相关的调控信号如启动子、增强子、终止子和/或多腺苷酸化信号或异源调控信号,在这种情况下,基因为嵌合“基因”。位于编码区5′端且存在于mRNA上的序列为5′非翻译序列。位于3′端或编码区下游且存在于mRNA上的序列为3′非翻译序列。术语“基因”包括cDNA及基因的基因组形式。
[0072] 本文使用的“棉花FAD2-1基因”、“ghFAD2-l基因”等为棉花中编码油酰-Δ12-去饱和酶的核苷酸序列,其表达于发育的棉籽中。本领域技术人员可容易地将ghFAD2-l基因与编码其它油酰-Δ12-去饱和酶或其它蛋白的基因区分开,特别是与ghFAD2-2基因,例如SEQ ID NO:26区分开。棉花FAD2-1基因包括天然存在的等位基因或棉花中存在的突变体,包括那些由四倍体棉花A和D基因组编码的基因以及非天然存在的可通过本领域技术人员进行基因修饰而产生的突变体。天然存在的棉花ghFAD2-1的突变体的实例,其序列如SEQ ID NO:24所示,具有与SEQ ID NO:1全长序列约96%的序列同一性。在优选的实施方案中,ghFAD2-1基因是指存在于棉花中或分离自棉花或由其衍生的核酸分子,包括具有与SEQ ID NO:1所示的cDNA序列的蛋白编码区约90%序列同一性的核苷酸。
[0073] 本文使用的“棉花FatB-2基因”、“ghFatB-2基因”等为棉花中编码酰基-ACP硫酯酶的核苷酸序列,其表达于发育的棉籽中。本领域技术人员可容易地将ghFatB-2基因与编码其它酰基-ACP硫酯酶或其它蛋白的基因区分开,特别是与ghFatB-1基因,例如SEQ ID NO:3或与ghFatB-3基因,例如SEQ ID NO:7区分开。棉花FatB-2基因包括天然存在的等位基因或棉花中存在的突变,包括那些由四倍体棉花A和D基因组编码的基因以及非天然存在的可通过本领域技术人员进行基因修饰而产生的突变。在优选的实施方案中,ghFatB-2基因指存在于棉花中或分离自棉花或由其衍生的核酸分子,包括具有与SEQ IDNO:5所示的cDNA序列的蛋白编码区约90%序列同一性的核苷酸。
[0074] 本文使用的“棉花CPA-FAS-2基因”、“ghCPA-FAS-2基因”等为棉花中编码CPA脂肪酸合酶的核苷酸序列,其表达于发育的棉籽中。本领域技术人员可容易地将ghCPA-FAS-2基因与编码其它CPA脂肪酸合酶或其它蛋白的基因区分开,特别是与ghCPA-FAS-1基因,例如SEQID NO:10或与ghCPA-FAS-3基因,例如SEQ ID NO:14区分开。棉花CPA-FAS-2基因包括天然存在的等位基因或棉花中存在的突变,包括那些由四倍体棉花A和D基因组编码的基因以及非天然存在的可通过本领域技术人员进行基因修饰而产生的突变。在优选的实施方案中,ghCPA-FAS-2基因指存在于棉花中或分离自棉花或由其衍生的核酸分子,包括具有与SEQ ID NO:12所示的cDNA序列的蛋白编码区约90%序列同一性的核苷酸。
[0075] 含有转录区的基因的基因组形式或其克隆可被称为“内含子”或“间隔区(intervening regions)”或“间隔序列(intervening sequences)”的非编码序列隔开。本文使用的“内含子”为基因片段,其作为初级RNA转录的一部分但不存在于成熟的mRNA分子中。从核或初级转录物中去掉或“剪接出(spliced out)”内含子;因此内含子在信使RNA(mRNA)中是不存在的。内含子可含有调控元件如增强子。本文使用的“外显子”为与RNA序列相对应的DNA区,存在于成熟mRNA中或RNA分子不翻译的成熟RNA分子中。mRNA在翻译过程中发挥作用,确定新生多肽的氨基酸序列或顺序。术语“基因”包括编码全部或部分本发明所述蛋白的合成的或融合分子以及上述任一的互补核苷酸序列。可将基因导入适合的载体中用于细胞中染色体外存在或整合至宿主基因组中。
[0076] 本文使用的“嵌合基因”指任何不在其天然位置上的基因。嵌合基因一般包括天然状态下不在一起的调控序列和转录序列或蛋白编码序列。因此,嵌合基因可包括不同来源的调控序列和编码序列,或一致来源但以不同于天然方式排列的调控序列和编码序列。本文使用的术语“内源的”指在与所研究的植株处于相同发育阶段的未修饰的植株中正常存在的或发生的物质。“内源基因”指在生物体基因组中天然位置上的天然基因。本文使用的“重组核酸分子”指通过重组DNA技术构建或修饰的核酸分子。术语“外来多核苷酸”或“外源多核苷酸”或“异源多核苷酸”等是指通过实验操作导入细胞基因组中的任何核酸。这些包括相对于天然存在的基因,在细胞中导入的基因含有某些修饰(例如,突变,选择标记基因的存在等)的基因序列。外来或外源基因可以是插入非天然生物体中的基因。“转基因”是指基因通过转化过程导入基因组中。术语“遗传修饰”包括通过转化或转导将基因导入细胞,突变细胞中的基因,改变或调解细胞或生物体或它们的后代中的基因。
[0077] 多核苷酸
[0078] 本发明涉及不同的多核苷酸。本文使用的“多核苷酸”或“核酸”或“核酸分子”表示核苷酸的聚合物,其可以是DNA或RNA或它们的组合,包括mRNA、cRNA、cDNA、tRNA、siRNA、shRNA和hpRNA。它可以是本领域技术人员熟知的细胞、基因组或合成来源的DNA或RNA,例如在自动合成仪上生成的,可与碳水化合物、脂、蛋白或其它物质结合,用荧光或其它基团标记,或附着在固体支持物上形成特定活性,或包括一个或多个自然界中没有发现的修饰的核苷酸。所述聚合物可以是单链、完整双链或部分双链。部分双链RNA分子的实例为发夹RNA(hpRNA)、短发夹RNA(shRNA)或自我互补RNA,其包括通过核苷酸和其互补序列之间配对形成的双链茎,以及共价结合所述核苷酸和其互补序列的环状序列。本文使用的碱基配对是指核苷酸之间的标准碱基配对,包括G:U碱基对。“互补”表示两个多核苷酸能够沿着它们全长的一部分或沿着一个全长或两个全长进行碱基配对(杂交)。“杂交的多核苷酸”表示多核苷酸实际上与其互补序列碱基配对。本文的术语“多核苷酸”可与术语“核酸”互换使用。
[0079] 通过“分离的”表示物质完全或基本上从其天然状态下共同存在的成分中释放出来。本文使用的“分离的多核苷酸”或“分离的核酸分子”表示多核苷酸从其天然状态下共同存在的或连接的相同类型的多核苷酸序列中至少部分地分离出来,优选地完全或基本上释放出来。例如,“分离的多核苷酸”包括将核苷酸从天然状态下其侧翼序列中纯化或分离出来,例如将DNA片段从相邻片段的序列中去掉。优选地,所述分离的多核苷酸至少90%不含其它成分,如蛋白、碳水化合物、脂等。本文使用的术语“重组多核苷酸”指多核苷酸通过核酸操作在体外形成自然界中没有发现的形式。例如,重组核酸可以是表达载体的形式。通常,这类表达载体含有与核苷酸序列可操作连接的转录和翻译调节核酸。
[0080] 本发明涉及寡核苷酸的应用。本文使用的“寡核苷酸”为长达50个核苷酸的多核苷酸。它们可以是RNA、DNA或它们的组合或二者之一的衍生物。寡核苷酸一般为10~30个核苷酸的相对短的单链分子,一般为15~25个核苷酸长。当用作探针或扩增反应中的引物时,该寡核苷酸的最小长度为在寡核苷酸和互补的靶核酸分子之间形成所需稳定杂交的长度。优选地,所述寡核苷酸为至少15个核苷酸,更优选为至少18个核苷酸,更优选为至少19个核苷酸,更优选为至少20个核苷酸,甚至更优选为至少25个核苷酸长。
[0081] 用作探针的多核苷酸一般与检测标记如放射性同位素、酶、生物素、荧光分子或化学发光分子共轭连接。本发明的寡核苷酸在检测ghFAD2-l、ghFatB-2和ghCPA-FAS-2的等位基因或与其它目标性状,例如改良的油组成有关的基因的方法中是有用的。例如核酸杂交的方法,在许多实例中包括通过合适的聚合酶(PCR中使用)延伸寡核苷酸引物。
[0082] 本发明的寡核苷酸突变体包括不同大小的分子,和/或例如本发明所述的能够与棉花基因组相近的序列进行杂交的特异性寡核苷酸分子。例如,只要能与靶区域杂交,突变可包括其它的核苷酸(如1、2、3、4或更多)或减少的核苷酸。此外,只要不影响寡核苷酸与靶区域的杂交能,可将几个核苷酸进行取代。此外,可将突变体设计成50个以内的核苷酸,其能够与本发明所述的寡核苷酸与植物基因组杂交的区域相近的序列进行杂交。
[0083] 术语“多核苷酸突变体”和“突变体”等是指具有与对照多核苷酸序列大体一致的多核苷酸或它们的互补形式。这些术语还包括通过添加、缺失或取代至少一个核苷酸所形成的区别于对照多核苷酸的多核苷酸。因此,术语“多核苷酸突变体”和“突变体”包括其序列中一个或多个核苷酸被不同的核苷酸通过添加或缺失或取代所形成的多核苷酸。在这方面,本领域熟知,对照核苷酸可通过某些变化包括突变、添加、缺失和取代,据此改变的多核苷酸仍保持了参照的多核苷酸的功能或活性。因此,这些术语包括编码具有酶活性或其它调节活性的多肽的多核苷酸,或能用作筛选探针或其它杂交试剂的多核苷酸。特别是,这其中包括编码相同多肽或氨基酸序列但由于冗余的遗传密码子而具有不同核苷酸序列的多核苷酸。术语“多核苷酸突变体”和“突变体”还包括自然发生的等位基因突变。
[0084] 所谓“对应(corresponds to)”或“对应于(corresponding to)”是指多核苷酸(a)具有与对照多核苷酸序列的全部或大部分大体一致的或与其互补的核苷酸序列或(b)编码与肽或蛋白中氨基酸序列一致的氨基酸序列。该词还包括其范围内,具有与对照肽或蛋白中氨基酸序列大体一致的氨基酸序列的肽或多肽。用于描述两个或多个多核苷酸之间序列关系的术语包括“对照序列”、“比较窗口”、“序列同一性”、“序列同一性百分数”、“基本一致”和“一致”,是根据核苷酸或氨基酸残基或全长的最小数目定义的。本文的“序列同一性”和“同一性”可互换使用,表示基于核苷酸-核苷酸或氨基酸-氨基酸窗口比较得出的序列一致的程度。因此,“序列同一性百分数”是通过窗口比较两个最佳排列的序列计算得到的,确定出现在两条序列中的相同核酸碱基(例如,A、T、C、G、U)或相同氨基酸残基(例如,Ala、Pro、Ser、Thr、GIy、VaI、Leu、Ile、Phe、Tyr、Tip、Lys、Arg、His、Asp、GIu、Asn、GIn、Cys和Met)位置的数量,生成匹配位置的数量,用窗口比较得出的总位置数(即,窗口大小)除匹配位置数,将得到的结果乘以100得到序列同一性百分数。
[0085] 通过空位(GAP)(Needleman and Wunsch,J MoI.Biol.48:443-4531970)分析(GCG程序),空位生成罚分(gap creation penalty)=5,空位延伸罚分(gap extension penalty)=0.3,确定多核苷酸同一性百分数。除非另有说明,查询序列的长度至少有45个核苷酸,GAP分析跨越至少45个核苷酸对齐的两条序列。优选地,查询序列的长度至少有150个核苷酸,GAP分析跨越至少150个核苷酸对齐的两条序列。更优选地,查询序列的长度至少有300个核苷酸,GAP分析跨越在各种情况下,至少300个、或至少400个、或至少500个或至少600个核苷酸对齐的两条序列。BLAST程序可参考例如Altschul等,Nucleic AcidsRes.25:3389,1997公开的程序。序列分析的详细内容可参考Unit 19.3of Ausubel等,Current Protocols in Molecular Biology,John Wiley &Sons Inc,1994-1998,第15章。
[0086] 当序列同一性为至少90%,特别为至少95%,更特别为一致时,核苷酸或氨基酸序列为“基本一致”。很清楚地是当描述RNA序列基本相似时,或相当于,与DNA序列具有一定程度的同一性时,DNA序列中的胸腺嘧啶(T)等同于RNA序列中的尿嘧啶(U)。
[0087] 关于确定的多核苷酸,同一性百分数的数值高于上述提供的数值将作为优选的实施方案。因此,应用时根据同一性百分数的最小数值,优选多核苷酸含有的多核苷酸序列具有与相关的以SEQ ID NO命名的序列至少70%、优选至少80%、更优选至少85%、更优选至少90%、更优选至少91%、更优选至少92%、更优选至少93%、更优选至少94%、更优选至少95%、更优选至少96%、更优选至少97%、更优选至少98%、更优选至少99%、更优选至少99.1%、更优选至少99.2%、更优选至少99.3%、更优选至少99.4%、更优选至少99.5%、更优选至少99.6%、更优选至少99.7%、更优选至少99.8%,和甚至更优选至少
99.9%的同一性。
[0088] 优选地,编码具有ghFAD2-1、ghFatB-2或ghCPA-FAS-2活性的多肽的本发明的多核苷酸,其长度大于800、优选大于900和更优选大于1000个核苷酸。
[0089] 与天然存在的分子相比,本发明的多核苷酸可具有一个或多个由核苷酸残基的缺失、插入或取代而形成的突变体。突变体可以是天然存在(即,分离自天然来源)或合成(例如,通过在核酸上进行定点突变)。
[0090] 本发明用杂交条件的严格性限定两条多核苷酸的互补程度。本文使用的“严格性”是指杂交和洗涤过程中的温度和离子强度条件、特定有机溶剂的存在或缺少。严格性越高,靶核苷酸序列和标记的多核苷酸序列(探针)之间的互补程度越高。“严格条件”是指在温度和离子强度的条件下,只有具有互补程度高的碱基的核苷酸序列能够杂交。本文使用的术语“在低严格性、中度严格性、高严格性或非常高严格性条件下杂交”描述的是杂交和洗涤的条件。杂交反应可参考Ausubel等,(eds.),Current Protocols in Molecular Biology,John Wiley &Sons,NY,6.3.1-6.3.6.,1989。参考书中描述了水法和非水法,可择一使用。本文提到的特殊条件如下:1)低严格杂交条件为45℃下,在6X氯化钠/柠檬酸钠(SSC)中杂交,然后50-55℃下在0.2X SSC,0.1%SDS中洗两次;2)中度严格杂交条件为45℃下,在6X SSC中杂交,然后60C下在0.2X SSC,0.1%SDS中洗一次或多次;3)高严格杂交条件为45℃下,在6X SSC中杂交,然后65℃下在0.2X SSC,0.1%SDS中洗一次或多次;以及4)非常高严格杂交条件为65℃下,在0.5M硫酸钠缓冲液,7%SDS中杂交,然后65℃下在0.2X SSC,0.1%SDS中洗一次或多次。
[0091] 多肽
[0092] 术语“多肽”和“蛋白”一般可互换使用。本文使用的术语“蛋白”和“多肽”还包括本发明所述多肽的变异体、突变体、修饰物、类似物和/或衍生物。本文使用的“基本纯化的多肽”是指已经从在自然状态下与其相连的脂、核酸、其它肽和其它分子中分离出来。优选地,基本纯化的多肽为至少90%从自然状态下与其相连的其它成分中释放出来。所谓“重组多肽”是指使用重组技术,即通过在细胞,优选为植物细胞,更优选为谷类植物细胞中表达重组多核苷酸而生成的多肽。
[0093] 多肽相对于另一条多肽的同一性百分数可通过GAP(Needleman and Wunsch,1970{同上))分析(GCG程序),空位生成罚分=5,空位延伸罚分=0.3而确定。查询序列的长度为至少15个氨基酸,GAP分析跨越至少15个氨基酸对齐的两条序列。更优选地,查询序列的长度为至少50个氨基酸,GAP分析跨越至少50个氨基酸对齐的两条序列。更优选地,查询序列的长度为至少100个氨基酸,GAP分析跨越至少100个氨基酸对齐的两条序列。甚至更优选地,查询序列的长度为至少250个氨基酸,GAP分析跨越至少250个氨基酸对齐的两条序列。
[0094] 本文使用的多肽的“生物活性”片段为本发明所述多肽的一部分,小于全长,其保持了全长多肽的活性。只要生物活性片段保持了确定的活性,它们可以是任何大小,但优选至少200或至少250个氨基酸残基长。
[0095] 关于确定的多肽,同一性百分数的数值高于上述提供的数值将作为优选的实施方案。因此,应用时根据同一性百分数的最小数值,优选多肽含有的氨基酸序列具有与相关的以SEQ ID NO命名的序列至少80%、更优选至少85%、更优选至少90%、更优选至少91%、更优选至少92%、更优选至少93%、更优选至少94%、更优选至少95%、更优选至少96%、更优选至少97%、更优选至少98%、更优选至少99%、更优选至少99.1%、更优选至少99.2%、更优选至少99.3%、更优选至少99.4%、更优选至少99.5%、更优选至少99.6%、更优选至少99.7%、更优选至少99.8%,和甚至更优选至少99.9%的同一性。
[0096] 本发明所述多肽的氨基酸序列突变体可通过向本发明所述核酸中引入适当的核苷酸突变体,或体外合成所需的多肽而制备得到。这类突变包括,例如在氨基酸序列中残基的缺失、插入或取代。若使最终的多肽产物具有想要的特征,可进行缺失、插入和取代的组合以得到最终的基因构建体。
[0097] 可使用本领域已知的任何技术制备突变(改变的)肽。例如,可将本发明所述的多核苷酸进行体外诱变。这类体外诱变技术包括将多核苷酸亚克隆至合适的载体中,转化载体至“突变”株如大肠杆菌XL-I红(Stratagene)中并传代所述转化的细菌至适当的代数。在另一个实例中,将本发明所述的多核苷酸进行DNA洗牌(DNA shuffling),该技术由Harayama,Trends Biotechnol.16:76-82,1998进行了大致描述。这些DNA洗牌技术可包括与本发明相关的那些基因,如除了棉花,来自于其它植物品种的基因,和/或包括来自于相同植物编码相似蛋白的不同基因。由突变的/改变的DNA得到的产物可采用本发明所述的技术容易地筛选,以确定它们是否具有,例如FAD2活性。
[0098] 在设计氨基酸序列突变体中,突变位点的定位及突变的性质取决于要被改性的特征。突变位点可逐一修饰或串联修饰,例如通过(1)先选择用保守氨基酸取代,然后根据想要得到的结果选用更激进的方法,(2)缺失靶残基,或(3)在相邻的位点插入其它残基。
[0099] 通常氨基酸序列缺失的数目范围是约1~15个残基,更优选约1~10个残基,一般约1~5个连续残基。
[0100] 取代突变去除多肽分子中的至少一个氨基酸残基并使不同的残基插入该位置。取代诱变的目标位点包括鉴定的活性位点。其它目标位点是那些在不同株或品种中获得的相同的特定残基。这些位置可能对生物活性很重要。这些位点,特别是落在至少三个其它相同保守的位点中的那些,优选以相对保守的方式进行取代。这类保守的取代如表5中所示,标题为“示例性取代”。
[0101] 本发明的多肽可通过不同的方式制备,包括天然多肽的生产和回收,重组多肽的生产和回收。在一个实施方案中,本发明分离的多肽是通过在有效产生多肽的条件下培养能够表达多肽的细胞,并回收多肽而制备得到的。优选的用于培养的细胞为本发明所述的重组细胞。
[0102] 本发明提到的元件是可操作连接或结合的。“可操作连接”或“可操作结合”等是指在功能关系中的多核苷酸元件的连接。一般地,可操作连接的核酸序列是连续连接的,必要时在阅读框中加入两个连续的蛋白编码区。当RNA聚合酶将两条编码序列转录为单一RNA时,编码序列与另一条编码序列“可操作连接”,如果进行翻译,则随后该单一RNA被翻译为具有来自两条编码序列氨基酸的单一多肽。只要表达的序列最终加工得到想要的蛋白,编码序列不必是彼此连续的。
[0103] 本文使用的术语“顺式作用序列”、“顺式作用元件”或“顺式调控区”或“调控区”或类似的术语应被理解为当位于适当的位置并与可表达的基因序列相连时,能够至少部分地调节基因序列表达的任何核苷酸序列。本领域技术人员知晓,顺式调控区能够在转录或转录后水平上激活、沉默、增强、抑制或其它改变基因序列表达和/或细胞型特异性和/或发育特异性(developmental specificity)水平。在本发明一些实施方案中,顺式作用序列为能够增强或刺激可表达基因序列表达的激活序列。
[0104] 将启动子或增强子元件与可转录的多核苷酸“可操作连接”表示将所述可转录的多核苷酸(例如,编码蛋白的多核苷酸或其它转录物)置于启动子的调节控制下,然后控制所述多核苷酸的转录。在构建异源启动子/结构基因组合中,一般优选将启动子或其变体置于离可转录的多核苷酸的转录起始位点与其天然情况下启动子和蛋白编码区之间的距离相同的位置上;即,从中获得启动子的基因上。本领域已知,只要不丧失功能,可调节距离上的变化。同样,位于调控序列元件控制下的可转录的多核苷酸,其调控序列元件(例如,操纵子、增强子等)的优选位置为天然情况下所述元件的位置;即,在调控序列元件作用下得到所述基因。
[0105] 本文使用的“启动子”或“启动子序列”通常是指RNA编码区(5′)上游的基因区域,其控制靶细胞中转录的起始和转录水平。“启动子”包括典型基因组基因的转录调控序列,包括TATA盒和CCAAT盒序列,以及根据发育和/或环境刺激,或以组织特异性或细胞型特异性的方式改变基因表达的其它调控元件(即,上游激活序列,增强子和沉默基因)。通常,但不是必须的(例如,某些PolIII启动子)启动子,位于结构基因的上游,调控其表达。此外,含有启动子的调控元件通常位于基因转录起始位点的2kb位置上。启动子可含有其它特异性调控元件,位于起始位点更远的位置上,以进一步增强在细胞中的表达,和/或改变与其可操作连接的结构基因表达的时间或诱导性。
[0106] “组成型启动子”是指能够指导植物中许多或全部组织的可操作连接的转录序列表达的启动子。本文使用的术语组成型不是指基因在所有细胞类型中以相同的水平表达,而是表示基因在广泛的细胞类型中表达,尽管经常检测到水平差异。本文使用的“选择性表达”是指几乎只在植物的特定器官中表达,例如,胚乳、胚、叶片、果实、茎或根。在优选的实施方案中,启动子选择性地或优先地在植物发育的种子中表达,优选为棉花。该术语还可以指在器官的特定发育阶段表达,如在胚发生的早期、中期或晚期或成熟的不同阶段,或指通过某些环境条件或处理诱导的表达。因此,选择性表达可以与组成型表达相比较,其是指在植物经历的大部分或全部条件下在植物的许多或全部组织中的表达。
[0107] 选择性表达还可在植物的特定组织、器官或发育阶段中形成基因表达产物的区室化。特定亚细胞,如质体、细胞质、液泡或质外体中的区室化作用,可通过基因产物结构中含有的适合的信号而实现,例如信号肽,运输到所需的细胞室,或在半自主的细胞器中(质体线粒体)通过将转基因与适当的调控序列直接整合到细胞器基因组中。
[0108] “组织特异性启动子”或“器官特异性启动子”是指相对于许多其它组织或器官,优先表达于一种组织或器官中,优选植物中大多数的组织或器官中。一般地,启动子在特定组织或器官中以10倍与其它组织或器官中的水平进行表达。一个示例性的组织特异性启动子为凝集素基因的启动子(SEQ ID NO:16),其优选在双子叶植物如棉花的发育的种子中表达。其它种子特异性启动子为本领域所熟知的。
[0109] 本发明提供的启动子可以来源于被转化的宿主植物或其它来源,其中该区域在宿主植物中行使功能。其它来源包括土壤杆菌T-DNA基因,如合成胭脂碱、章鱼碱(octapine)、甘露碱或其它冠瘿碱基因的启动子(例如,见美国专利No.5,459,252,Conkling等;WO 91/13992,Advanced Technologies);病毒启动子(包括宿主特异性病毒),或部分或全合成的启动子。大量在单子叶和双子叶植物中行使功能的启动子是本领域熟知的(例如,见Greve,J.MoI.Appl.Genet.,1:499-511,1983;Salomon等,EMBO J.,3:141-146,1984; 等,Cell,27:143-153,1983;Barker等,Plant MoI.Biol,2:
235-350,1983);包括各种分离自植物和病毒如花椰菜花叶病毒启动子(CaMV 35S,19S)。
许多组织特异性启动子区域是已知的。其它转录起始区域,它们优先在特定组织中或在特定生长条件下转录,包括那些编码油菜籽蛋白(napin)、种子ACP、玉米蛋白或其它种子贮藏蛋白。检测启动子活性的方法不限于Medberry等,Plant Cell,4:185-192,1992,Medberry等,Plant J.3:619-626,1993,Sambrook等,Molecular Cloning:ALaboratory Manual(2nd Ed).Cold Spring Harbour Laboratory,ColdSpring Harbour,N.Y.I 989 and McPherson等,(美国专利No.5,164,316)中公开的方法。
[0110] 另外地或其它地,所述启动子可以是诱导型启动子或发育调节型启动子,其能够驱动导入的多核苷酸在植物适当的发育阶段的表达。可使用的其它顺式作用序列包括转录和/或翻译增强子。增强子区是本领域技术人员熟知的,包括ATG翻译起始密码子及相邻序列。当增强子中含有起始密码子时,起始密码子应与外来的或外源的多核苷酸的编码序列的阅读框在一起,确保翻译时全序列的翻译。翻译起始区可以来源于转录起始区,或来自于外来的或外源的多核苷酸。所述序列还可以来源于驱动转录的选择性启动子,且能够进行特异性修饰以增强mRNA的翻译。
[0111] 本发明的核酸结构可包括3′非翻译序列的从约50~1000个核苷酸碱基对,其可含有转录终止序列。3′非翻译序列可含有转录终止信号,其可含有或不含有多腺苷酸化信号和然后其它能够影响mRNA加工的调控信号。多腺苷酸化信号的作用是添加多腺苷酸尾巴至mRNA前体的3′末端。多腺苷酸化信号的识别通常为类似于常规形式5′-AATAAA-3′的形式,尽管变化形式并不少见。不含多腺苷酸化信号的转录终止序列包括含有四个或更多的胸腺嘧啶脱氧核苷的Pol I或PolIII RNA聚合酶终止子。适当的3′非翻译序列实例为来自凝集素基因(SEQ ID NO:20)、地下三叶草病毒的S3基因(SEQ ID NO:23)或根癌农杆菌的胭脂碱合酶(nos)基因的含有多腺苷酸化信号的3′转录非翻译区(Bevan等,Nucl.Acid Res.,11:369,1983)。适当的3′非翻译序列还可来自于植物基因如铃薯或番茄的蛋白酶抑制剂I或II基因、大豆贮藏蛋白基因和小亚基核酮糖-1,5-二磷酸羧化酶(ssRUBISCO)基因的3′末端,还可使用本领域技术人员已知的其它3′元件。
[0112] 由于插入转录起始位点和起始编码序列之间的DNA序列,即非翻译的5′前导序列(5′UTR)能影响翻译和转录时基因的表达,我们还可使用特定的前导序列。适当的前导序列包括那些含有能够指导外来的或内源DNA序列最佳表达的序列。例如,含有共有序列的前导序列,其能够增强或保持mRNA的稳定性和防止不适当的起始翻译,例如Joshi,Nucl.Acid Res.15:6643,1987中所描述的。
[0113] 另外,靶序列可用于将外来的或外源的多核苷酸编码的酶定位至胞内室,例如定位至叶绿体,在植物细胞内或胞外环境。例如,编码运输或信号肽序列的核酸序列通过可操作连接与编码本发明酶的序列相连,在进行翻译时,运输或信号肽能够将酶转运至特定的胞内或胞外目的地,然后在翻译后被任意去掉。运输或信号肽使转运的蛋白易于通过胞内膜,例如内质网、液泡、泡、质体、线粒体和质膜的膜。例如,靶序列能够指导目的蛋白到特定的细胞器,如液泡或质体(例如,叶绿体)上,而不到细胞质中。因此,本发明的核酸结构进一步包括编码质体运输肽的核酸序列,其可操作地连接于启动子区和外来的或外源多核苷酸之间。编码这类信号肽的序列通常存在于天然存在的基因中且可以使用,例如本文描述的ghFatB基因中。
[0114] 载体
[0115] 本发明包括载体在操纵或转移基因基因构建体中的应用。所谓“载体”表示核酸分子,优选来自于例如质粒、噬菌体或植物病毒的DNA分子,核酸序列可以插入或克隆至载体中。优选载体为双链DNA且含有一个或多个唯一的限制位点,能够在宿主细胞中自主复制,所述宿主细胞包括靶细胞或组织或祖细胞或其组织,或能够整合至宿主的基因组中,使克隆的序列能够复制。因此,载体可以是自主复制的载体,即载体作为存在于染色体外的实体,其复制独立于染色体复制,例如线性或环状质粒,染色体外元件、微型染色体或人工染色体。所述载体可含有任何用以确保自我复制的手段。另外,所述载体可以是一个,当导入细胞内时,整合至受体细胞的基因组中并随其所整合的染色体一起复制。载体系统可包括单一载体或质粒,两个或多个载体或质粒,它们共同含有导入宿主细胞或转座子基因组中的总DNA。载体的选择一般取决于载体与其所要导入的细胞的相容性。所述载体还含有选择标记如抗生素抗性基因、除草剂抗性基因或其它能用于筛选正确转化子的基因。这类基因的实例是本领域技术人员熟知的。
[0116] 本发明的核酸基因构建体可导入到载体如质粒中。质粒载体一般含有其它的核酸序列,该序列使表达盒在原核及真核细胞中易于筛选、扩增及转化,例如pUC载体、pSK载体、pGEM载体、pSP载体、pBS载体或含有一个或多个T-DNA区的二元载体。其它的核酸序列包括用于使载体能够自主复制的复制起始位点,,选择性标记基因,优选编码抗生素或除草剂抗性基因,为多个位点提供的唯一的多克隆位点以插入在核酸基因构建体中编码的核酸序列或基因,以及增强原核和真核(特别是植物)细胞转化的序列。
[0117] 所谓“标记基因”表示能够将不同的表型传递给表达所述标记基因的细胞的基因,从而使转化的细胞与不具有该标记的细胞区分开来。选择性标记基因的特征在于,我们能够基于对选择试剂(例如,除草剂、抗生素、辐射、热或其它破坏未转化的细胞的处理)的抗性进行“筛选”。筛选标记基因(或报告基因)的特征在于,我们能够通过观察或测试,即通过“筛选”(例如,β-葡萄糖酸酶、荧光酶、GFP或其它在未转化的细胞中不存在酶活性的酶)进行鉴定。所述标记基因和目的核苷酸序列不必是连接的。一个选择标记基因的实例是图12中所示的Sl-NptII-S3终止子基因,包括SEQ ID NOs:21-23。
[0118] 为方便转化的鉴定,理想的核酸基因构建体包括选择或筛选标记基因,或除此之外,外来的或外源多核苷酸。实际选择的标记不是至关重要的,主要是它能够与选择的植物细胞一起发挥作用(即,选择性)。所述标记基因和外来的或外源目的多核苷酸不必是连接的,因为例如描述于美国专利No.4,399,216中的未连接的基因的共转化也是植物转化中一种有效的方法。
[0119] 细菌选择性标记的实例为具有抗生素抗性,如氨苄青霉素、红霉素、氯霉素或四环素抗性,优选卡那霉素抗性的标记物。典型的用于筛选植物转化子的选择性标记包括但不限于,编码潮霉素B抗性的hyg基因,具有卡那霉素、巴龙霉素、G418抗性的新霉素磷酸转移酶(nptII)基因;来自大鼠肝脏的具有耐受来自于除草剂的谷胱甘肽抗性的谷胱甘肽-S-转移酶基因,例如EP-A 256223中描述的;过表达后具有谷氨酰胺合酶抑制剂如草胺膦,例如WO87/05327中描述的抗性的谷氨酰胺合酶基因,具有选择性试剂草胺膦,例如EP-A 275957中描述的抗性的来自于绿色产色链霉菌的乙酰转移酶基因,具有耐N-膦酰基甲基甘氨酸,例如Hinchee等,Biotech.6:915,1988中描述的编码5-烯醇式丙酮莽草酸-3-磷酸合成酶(EPSPS)的基因,具有双丙氨磷,例如WO91/02071中描述的抗性的bar基因;具有溴草腈(Stalker等,Science,242:419,1988)抗性的如来自克雷伯氏菌的bxn腈水解酶基因;具有甲氨蝶呤(Thillet等,J.Biol.Chem.263:12500,1988)抗性的二氢叶酸还原酶(DHFR)基因;具有咪唑啉酮、磺酰脲类或其它ALS-抑制化学物质(EP-A-154204)抗性的乙酰乳酸合酶突变基因(ALS);具有5-甲基色氨酸抗性的邻氨基苯甲酸合酶突变基因;或具有除草剂抗性的茅草枯脱卤素酶(dalapon dehalogenase)基因。
[0120] 优选的筛选标记包括但不限于编码β-葡萄糖醛缩酶(GUS)的uidA基因,各种发色底物是已知的,编码β-牛乳糖的基因,各种发色底物是已知的,水母发光蛋白基因(Prasher等,Biochem.Biophys.Res.Comm.126:1259-68,1985),可用于敏感的生物发光检测;绿色荧光蛋白基因(Niedz等,Plant Cell Reports,14:403,1995.)或其衍生物;荧光酶(luc)基因(Ow等,Science,234:856,1986),可用于生物发光检测和其它本领域已知的用途。本发明中使用的“报告分子”表示分子的化学性质提供了可分析识别的信号,通过对照蛋白产物,有利于检测启动子的活性。
[0121] 改变基因表达的方法
[0122] 蛋白水平,例如,植物发育种子中的油合成过程中所包含的酶可通过提高植物细胞中编码所述蛋白的核苷酸序列的表达水平进行调节,或降低植物中编码所述蛋白基因的表达水平,得到改良的油组成的成熟种子。基因的表达水平可通过改变其在每个细胞中的拷贝数进行调节,例如通过引入可操作连接的,且在胞内发挥功能的含有编码序列和转录调控元件的合成的基因基因构建体。大多数的转化子可进行选择或筛选,选择或筛选那些受转基因整合位点邻近的内源序列影响而引起的可观水平和./或特异性的转基因表达。可观的转基因水平和模式带来了大致修饰的油组成。可通过简单测试来自转化子的籽油进行测定。另外,可对大量的诱变谷物或繁育植株进行筛选,获得具有改变的油含量或组成的单株系。
[0123] 减少基因表达可通过向植物细胞中导入和转录“基因沉默嵌合基因”而实现。所述基因沉默嵌合基因可稳定地导入植物细胞的基因组中,优选核基因组中,或可以瞬间导入,例如病毒载体上。本文使用的“基因沉默效应”是指减少靶核酸在植物细胞中的表达,这可以通过导入沉默RNA而实现。这种减少可能是包括经由染色质重塑的甲基化转录减少的结果,,或包括经由RNA降解,RNA分子的转录后修饰减少结果,,或经由两种途径。基因沉默包括取消靶核酸或基因的表达,并且部分影响到基因表达的程度或持续时间。充分的证据表明沉默RNA存在时的靶核酸表达水平比缺少沉默RNA时的靶核酸表达水平低。表达水平可降低至少约40%,或至少约50%,或至少约60%,或至少约70%,或至少约80%,或至少约90%,或至少约95%,或至少约99%。在优选的实施方案中,种子中棉花ghCPA-FAS-2基因的表达相对于缺少基因沉默嵌合DNA的种子降低至少约60%,更优选至少80%。靶核酸可以是参与油生物合成,油累积的基因,如参与TAG组装的基因,包括但不限于酰基转移酶或Kennedey途径中的其它酶,或参与油代谢的基因,或可以是任何其它内源基因、转基因或外源基因,如病毒基因,其可能不存在于导入转基因时的植物细胞中。在某些实施方案中,本发明提供改良棉株内源性油的方法,包括生产其基因基因构建体中含有脂肪酸生物合成基因或其基因片段的核苷酸序列的转基因棉株,其中所述基因或基因片段与启动子序列可操作连接,能够在棉株的种子中表达所述基因或基因片段,其中所述脂肪酸生物合成基因为两个或多个FAD2去饱和酶、FatB硫酯酶和CPA-FAS-2脂肪酸合酶基因。本文所述降低的基因表达提高了内源性油和提取油的脂肪酸含量。
[0124] 反义RNA分子
[0125] 根据本发明,反义技术可用于降低基因表达。术语“反义RNA”应理解为至少与特定的mRNA分子部分互补,且能够降低编码mRNA基因的表达的RNA分子。这种降低一般以序列依赖的方式发生,被认为通过干扰转录后事件,如mRNA从细胞核转运至细胞质中,mRNA稳定性或翻译抑制发生。反义方法的使用是本领域熟知的(见例如Hartmann and Endres,Manual of Antisense Methodology,Kluwer,1999)。反义技术在植物中的使用见Bourque,Plant Science,105:125-149,1995 and Senior,Biotech.Genet.Engin.Revs.15:79-119,1998.Bourque,1995(同上)中的描述,其中列举了大量的反义序列用于植物系统中基因失活的实例。她还指出,实现任何酶活性的100%抑制可能不是必须的,因为部分抑制更容易给系统带来可检测到的变化。Senior,1998(同上)指出,反义方法现在是基因表达操作中非常完善的技术。
[0126] 本文使用的术语“在生理条件下杂交的反义核苷酸”表示在细胞的正常条件下,所述核苷酸(其为全部或部分单链)至少能够与要被抑制的基因的RNA产物形成双链多核苷酸,一般地,所述mRNA编码如本发明所述的蛋白。反义分子可包括对应于结构基因的序列或影响控制基因表达或剪切事件的序列。例如,反义序列可对应于靶基因编码,或5′-非翻译区(UTR)或3′-UTR或它们的组合。它可以是与内含子序列部分互补的,其在转录过程中或转录后被剪切掉,但优选仅与靶基因的内含子序列互补。鉴于UTRs通常具有很大的不同,需要大基因抑制特异性来靶向到这些区域。
[0127] 反义序列的长度应为至少19个连续的核苷酸,优选至少25或30或50个核苷酸,更优选至少100、200、500或1000个核苷酸,至要抑制的基因全长的最大值。可使用与整条基因转录物互补的全长序列。长度最优选为100~2000个核苷酸。反义序列与目标转录物的相似度应为至少90%,更优选95~100%。优选的反义序列包括至少30个与任何来自SEQ ID NOs:1、5或12序列互补的连续的核苷酸。反义RNA分子当然可以包括用于稳定分子的不相关序列。
[0128] 可将启动子序列在“反义”方向上加入到靶基因区中,生成表达反义RNA的基因基因构建体,本文是指相对于植物细胞的靶基因中序列的转录和翻译(如果发生)方向的相反方向。因此,本发明还提供编码所述反义RNA的核酸分子如嵌合DNA,包括含有所述核酸分子的细胞、组织、器官、植株、种子,特别是棉株或棉籽等。
[0129] 核酶
[0130] 本文使用的术语“核酶”是指特异性识别不同RNA底物并催化其断裂的RNA分子。一般地,核酶含有一段与靶RNA序列互补的核苷酸,能够使核酶在生理条件下与靶RNA特异性杂交,例如在核酶作用的细胞中,本文提到的酶区为“催化域”。本发明中特别有用的核酶类型是锤头状核酶(Haseloff and Gerlach,Nature 334:585-591,1988,Perriman等Gene,113:157-163,1992)和发夹核酶(Shippy等,MoIBiotech.12:117-129,1999)。DNA编码的核酶可采用本领域熟知的方法合成,且可整合至基因基因构建体或表达载体中,在目的细胞中表达。因此,本发明还提供核酸分子如编码核酶的嵌合DNA,包括含有所述核酸分子的细胞、组织、器官、植株、谷类等。DNA编码的核酶一般插入到细胞中受启动子和转录终止信号控制的表达盒中。任何潜在的靶RNA中的核酶特异切割位点可通过检测含有三核苷酸序列GUA、GUU和GUC的核酶切割位点的靶分子而识别。一旦识别,对应于切割位点的靶基因5′和3′区的约第5和20位核糖核苷酸之间的短RNA序列可通过预测的使寡核苷酸序列不适合的结构特征如二级结构而测定。使用核酶时,应选自由锤头状核酶、发夹核酶、斧头状核酶、纽特卫星核酶、四膜虫核酶和核糖核酸酶P核酶组成的组,根据本领域已知的方法基于靶基因的序列而设计(例如,见美国专利No.5,741,679)。也可采用核糖核酸酶保护试验,通过测试候选目标与互补寡核苷酸杂交的容易程度来评价候选目标的适合性。
[0131] 与本文所述的反义多核苷酸一样,本发明的核酶在“生理条件”下应该能够与靶核酸分子(例如SEQ ID NOs:1、5或12)杂交,即在细胞中,特别是植物细胞如小麦或大麦细胞中的那些条件。
[0132] RNA干扰/二倍体RNA(duplex RNA)
[0133] 本文使用的“人工导入dsRNA分子”是指导入dsRNA分子,其可通过在细胞中转录编码如dsRNA分子的嵌合基因而制备,然而不是指将单链RNA分子反向插入到真核或植物细胞的dsRNA中。RNA干扰(RNAi)特别适于降低基因表达或抑制特定蛋白的产生。虽然不希望受到理论限制,但Waterhouse等,Proc.Natl.Acad.ScL U.S.A.95:13959-13964,1998已经提出了一种模型,用于解释dsRNA能够用于降低基因表达或蛋白产生的机制。该技术依赖于存在的dsRNA分子,其含有的序列与目的基因或其部分的mRNA基本一致。方便地,dsRNA可由重组载体或宿主细胞中的单一启动子制备得到,其中正义和反义序列转录生成发夹RNA,其中正义和反义序列杂交形成带有间插序列(intervening sequence)或空位区(spacer region)的dsRNA区,形成环状结构,因此发夹RNA含有茎环结构。本发明适合的dsRNA分子的设计和制备是本领域技术人员能够做到的,特别参考Waterhouse等,1998(同上),Smith等,Nature,407:319-320,2000,WO 99/53050,WO99/49029和WO 01/34815。因此,本发明还提供核酸分子,如编码二倍体RNA如本发明发夹RNA的嵌合DNA,包括含有所述核酸分子的细胞、组织、器官、植物、种子,特别是棉株或棉籽等。在优选的实施方案中,嵌合DNA具有图12中所示的结构,含有图13中所示的序列,本文提到的MonoCott结构。
[0134] 在一个实施例中,导入DNA,它指导与被灭活的靶基因同源的至少部分双链RNA产物的合成。因此,DNA包括正义和反义序列,当转录成RNA时,能够杂交生成双链RNA区。在优选的实施方案中,正义和反义序列被含有内含子的间隔区分开,当转录成RNA时被剪切。优选的内含子是来自ghFAD2-l基因的内含子,例如SEQ ID NO:18。这种排列能够形成高效的基因沉默(Smith等,2000(同上))。双链区可包含一个或两个RNA分子,转录自一个DNA区或两个DNA区。dsRNA可被归于长hpRNA,具有长的可大部分互补的正义和反义区,但不必完全互补(一般形成的碱基对区≥约100bp,优选范围在200~1000bp之间)。hpRNA其双链部分的大小还可以≤约30~约50bp,或约30~约100bp(见WO04/073390,通过引用并入于此)。双链RNA区的存在被认为引发内源植物系统的反应,将双链RNA加工成21~
24个核苷酸长的寡核苷酸,并用这些寡核苷酸进行靶植物基因同源RNA转录物的序列特异性切割,有效地降低或减弱靶基因的活性。
[0135] 每条进行杂交的正义和反义序列的长度应至少为19个连续的核苷酸,优选为至少27或30或50个核苷酸,更优选至少100、200或500个核苷酸,至完整基因转录物的全长序列。最优选长度为100~2000个核苷酸。正义和反义序列与靶转录物的相似度应至少为85%,优选至少90%,更优选95~100%。序列越长,对全序列同一性的要求越低。当然RNA分子可含有不相关的序列,其可用于稳定所述分子。所述RNA分子可以是不同序列定位的不同靶RNAs的杂合体,可降低≥1个靶基因的表达,或它可以是对应于相关靶基因家族如多基因家族的一条序列。在优选的实施方案中,RNA分子靶向至少三个不同的靶基因,更优选为棉花中的ghFAD2-l、ghFatB-2和ghCPA-FAS-2基因。优选dsRNA中使用的序列对应于靶基因的外显子序列,可对应于5′和/或3′非翻译序列或蛋白编码序列或任何它们的组合。用于表达生成dsRNA结构的启动子可以是任何类型的启动子,只要获得的dsRNA对于要破坏的细胞谱系中的基因产物是特异性的。另外,启动子可以是谱系特异性的,它只表达于特定发育谱系的细胞中。这可能是有利的,当观察到某些重叠与表达于非靶细胞谱系中的基因是同源的。启动子还可以是受外界调控因子或胞内环境因子诱导的。一般地,RNA分子是在RNA聚合酶II或RNA聚合酶III启动子的控制下表达的。后者的实例包括tRNA或snRNA启动子。
[0136] 实施例5中提供了编码dsRNA分子的基因基因构建体的实例,可用于下调棉籽中用于改良油组成的多肽的产生。
[0137] 其它的沉默RNA可以是“未腺苷酸化的RNA”,含有至少20个连续的核苷酸,与靶基因RNA转录物的核苷酸序列的互补序列具有至少95%的序列同一性,如WO01/12824或US6423885(均通过引用并入于此)中描述的。然而,另一种类型的沉默RNA是描述于WO03/076619(通过引用并入于此)中的RNA分子,含有至少20个连续的核苷酸,具有与靶核酸或其互补序列的序列95%的序列同一性,进一步含有WO03/076619中描述的大部分双链区。
[0138] 微RNA调节是从基因调节进化而来的RNA沉默途径的一条特殊支链,与传统RNAi/PTGS不同。微RNA是一类特殊的小RNAs,在以部分反向重复为特征组织的类基因元件中进行编码。当转录时,微RNA基因产生部分碱基对茎-环前体RNAs,随后加工得到微RNAs。加工的RNAs一般长度为21个或21~23个连续的核苷酸,具有与靶基因RNA转录物的互补序列的21个连续的核苷酸至少95%的序列同一性。释放的miRNAs整合至含Argonaute蛋白的特殊亚族的类RISC复合物上,产生序列特异的基因抑制(见,例如Millar and Waterhouse,FundIntegr Genomics,5:129-135,2005;Pasquinelli等,Curr Opin Genet Develop 15:200-205,2005;Almeida and Allshire,Trends Cell Biol.15:251-258,
2005,通过引用并入于此)。
[0139] 共抑制
[0140] 另一种可用于特异性降低基因表达的分子生物方法是共抑制。共抑制的机制还不是很清楚,但认为它包含转录后基因沉默(PTGS),在这方面可能与许多反义抑制的实例非常相似。它包括将基因或其片段的额外拷贝在启动子表达的“正向”上导入植物中,本文是指与靶基因序列的转录和翻译(如果发生)相同的方向上,正义片段的大小对应于靶基因区,它与靶基因的同源程度同上述反义序列。在某些实施例中,基因序列的额外拷贝干扰了植物靶基因的表达。参考专利WO 97/20936和欧洲专利0465572中实现的共抑制的方法。反义、共抑制或双链RNA分子还含有大双链RNA区,优选含有核定位信号,如WO 03/076619中描述的。
[0141] 这些用于降低基因表达的技术中的任一种可用于协同降低多基因活性。例如,通过定位基因共有的区,一个RNA分子可由相关的基因家族定位。另外,不相关的基因可通过包括于一条RNA分子中的多个区来定位,每个区定位不同的基因。这可以通过在单一启动子的控制下融合多个区而实现,如实施例5。
[0142] 将核酸导入植物细胞的方法/转化
[0143] 可采用许多本领域技术人员熟知的技术将核酸分子导入植物宿主细胞中。术语“转化”表示生物体基因型的改变,例如细菌或植物,通过导入外来的或外源核酸。所谓“转化体”表示改变的生物体。本文使用的“转基因”是指导入外来的或外源基因或序列的遗传修饰的植物,其中内源基因组通过整合进行补充或修饰,或以非整合的可复制形式稳定的存在。所谓“转基因”是指导入到植物基因组中的外来的或外源基因或序列。所述核酸分子可稳定地整合至植物基因组中,或作为染色体外元件进行复制。所谓“基因组”表示细胞、植物或植物部位的总遗传物质,包括染色体DNA、质体DNA、线粒体DNA和染色体外DNA分子。本文使用的与植物材料有关的术语“再生”表示从植物细胞、植物细胞群、植物部位,例如胚、胚鳞、原生质体、愈伤组织或其它组织生长成为完整的、分化的植物,但不包括从种子生长得到的植物。
[0144] 转化技术的特殊选择由转化特定植物品种的效率以及实施发明的操作者的经验和在本发明中选用特定方法的喜好而确定。显而易见,对于本领域技术人员而言,假使能够达到可接受的核酸转化水平,将核酸结构导入植物细胞中的转化体系的特殊选择不是必须的或限于本发明。用于改良植物的转化体系的操作指南参考Birch,Ann RevPlant Physiol Plant MoI Biol.48:297-326,1997。
[0145] 原则上,适于转化的双子叶植物和单子叶植物都能够通过将本发明的核酸基因构建体导入到受体细胞中并生长成为新的具有和表达本发明多核苷酸的植株而进行改良。
[0146] 已表明可以使用根癌农杆菌的肿瘤诱导T-DNA(Ti)质粒在双子叶植物如棉花、马铃薯、番茄和豆类或单子叶植物如谷类,包括小麦、大麦、水稻、玉米、燕麦、黑麦和高粱中导入并表达外来的或外源多核苷酸(参见,例如Umbeck,美国专利No.5,004,863和国际申请PCT/US93/02480)。本发明的基因构建体可以使用含Ti质粒的根癌农杆菌导入植物细胞中。用根癌农杆菌培养物作为转化介质,最有利的是使用农杆菌的非抗癌株作为载体,使转化组织可以具有正常的非抗癌差异。优选农杆菌具有二元Ti质粒体系。该二元体系包括(1)具有对将转移DNA(T-DNA)导入到植物中必须的毒力区的第一Ti质粒,以及(2)嵌合质粒。所述嵌合质粒含有至少一个与要转移的核酸侧接的野生型Ti质粒T-DNA区的边界区。已表明二元Ti质粒体系对转化植物细胞是有效的,例如De Framond,Biotechnology,1:262,1983和Hoekema等,Nature,303:179,1983中所述。尤其是因为无需整合Ti质粒至农杆菌中,该二元体系是优选的。
[0147] 有关农杆菌使用的方法包括但不限于用农杆菌转化植物细胞或组织如种子、根尖或分生组织用农杆菌转化,或植物接种如Bechtold等,CR.Acad.Sci.Paris,316:1194,1993中描述的花浸蘸法。该法基于农杆菌细胞悬浮液的浸润。另外,可以使用农杆菌的根诱导(Ri)质粒作为载体导入嵌合基因构建体。
[0148] 通过导入外源核酸转化棉株的方法以及通过体细胞胚胎发生从细胞再生植株的方法是本领域熟知的。
[0149] 将核酸结构导入植物细胞的其它方法为通过电穿孔或小粒子高速轰击渗透(又称粒子轰击或基因枪法),将需导入的核酸包含于小珠或粒子的基质中或其表面,例如Klein等,Nature,327:70,1987中所述。
[0150] 本文使用的“诱导突变”是人工诱导基因变异,其可由化学、辐射或基于生物的诱变所致,例如转座子或T-DNA插入。优选的突变为无效突变如非正义突变、移码突变、插入突变或使目的基因完全失活的剪切位点变异。核苷酸插入的衍生物包括5′和3′末端融合以及单或多核苷酸插入序列内部。插入的核苷酸序列变异是指将一个或多个核苷酸导入核苷酸序列中得到的那些,可通过随机插入用适当的方法筛选得到的产物获得。缺失变异的特征是从序列中除去一个或多个核苷酸。优选地,相对于野生型基因,突变基因只有核苷酸序列的单一插入或缺失。取代型核苷酸变异是指那些其序列中至少有一个核苷酸被去掉并由不同的核苷酸插入到该位置。相对于野生型基因,突变基因中取代的核苷酸数目优选最大为10个核苷酸,更优选最大为9、8、7、6、5、4、3或2,或仅1个核苷酸。这类取代可以是“沉默的”,取代并不改变由密码子定义的氨基酸。另外,设计保守取代物将一个氨基酸改变成另一个相似作用的氨基酸。
[0151] 本文使用的术语“突变”不包括沉默的核苷酸取代,其并不影响到基因的活性,因此,仅包括影响到基因活性的基因序列的改变。术语“多态性”是指包括这类沉默的核苷酸取代的任何核苷酸序列的变化。
[0152] 诱变可通过化学的或辐射方法实现,例如用本领域熟知的EMS或叠氮化钠(Zwar and Chandler,Planta 197:39-48,1995)处理种子,或γ照射。突变体的分离可通过筛选突变的植株或种子而实现。在多倍体植物如棉花中,优选在缺少一种酶活性的基因型中进行筛选,找到完全没有功能活性的突变体。另外,可使用“定向诱导基因组局部突变(tilling)”技术对使用如试剂EMS诱变的群体进行鉴定(Slade and Knauf,Transgenic Res.14:109-115,2005)。然后通过将突变株与理想基因背景的植株杂交将突变导入理想基因背景中,进行适当数量的回交,去掉最初不需要的亲本背景。本发明明确延伸到生产或鉴定这类植物或由这类植物产生的种子的方法。
[0153] 生产本发明植物的过程可包括诱变和/或筛选步骤如定向诱导基因组局部突变(Targeting Induced Local Lesions IN Genomes,TILLING)。在第一步中,导入的突变如用化学诱变剂或辐射处理细胞、种子、花粉或其它植物部位在植物群体中诱导新的单碱基对改变,然后将植物传代使突变能够稳定地遗传。提取DNA,保存全部群体成员的种子,建立资源库,便于今后能够重复获得。TILLING测定,设计PCR引物特异扩增单一的目的基因。如果靶序列是基因家族中的一员或多倍体基因组中的一部分,特异性是尤其重要的。其次,染色标记的引物可用于扩增汇集多个个体DNA的PCR产物。将这些PCR产物变性并退火,生成错配的碱基对。错配或异源双链表示天然存在的单核苷酸多态性(SNPs)(即,群体中的几株可能带有相同的多态性)和诱导的SNPs(即,仅极少数个别株可能显示突变)。异源双链形成后,应用识别并切割错配的DNA的核酸内切酶如Cel I,是在TILLING群体中发现新SNPs的关键。
[0154] 采用该方法,筛选到数以千计的带有单一碱基变化的植株以及在基因或基因组的特定区域中带有少量插入或缺失(1~30bp)的植株。进行测试的基因片段大小范围是0.3~1.6kb。建立8倍池,各测试为1.4kb(去掉因噪音引起的SNP检测有困难的片段末端)和96道,该组合使每个单一测试筛选到基因组DNA的数以百万个碱基对,使TILLING成为高通量技术。TILLING进一步描述于Slade and Knauf,2005(同上),and Henikoff等,Plant Physiol.135:630-636,2004,通过引用并入于此。
[0155] 除了能够高效检测突变,高通量TILLING技术还能够理想地检测自然多态性。因此,通过与已知序列进行异源杂交询问(interrogating)未知的同源DNA,确定多态位点的数量和位置。可检测到核苷酸的变化和少量插入及缺失,包括至少某些重复数量的多态性。这被称为Ecotilling技术(Comai等,Plant J.37:778-786,2004)。
[0156] 本文使用的术语“遗传连接的”是指一个标记基因座和第二个基因座在染色体上足够靠近,它们在≥50%的减数分裂中共同遗传,例如不是随机的。该定义包括形成相同基因一部分的标记基因座和第二个基因座的位置。此外,该定义包括用于目的性状的具有多态性的标记基因座的位置(换言之,标记基因座直接与表型“相连”)。因此,观察到的每代基因座之间的重组百分数(厘摩(cM))为≤50。在本发明特定的实施方案中,染色体上遗传连接的基因座的距离可以是45、35、25、15、10、5、4、3、2、1或不到cM。优选地,标记基因座的距离为≤5cM或2cM,更优选为约0cM。
[0157] 本文使用的“其它遗传标记”可以是任何与棉株的期望性状有关的分子。这些标记是本领域技术人员熟知的,包括与基因决定性状如抗病、产量、植物多态、籽棉质量,有关的分子标记。能够检测目的基因的等位基因的本领域已知的任何分子生物技术可用于本发明的方法中。这些方法包括但不限于,使用核酸扩增、核酸测序、用适合的标记探针进行核酸杂交、单链构象分析(SSCA)、变性梯度凝胶电泳(DGGE)、异源分析(HET)、化学切割分析(CCM)、催化核酸切割或它们的组合。本发明还包括使用分子标记技术检测与等位基因有关的多态性。所述方法包括限制片段长度多态性(RFLP)、随机扩增多态性(RAPD)、扩增片段长度多态性(AFLP)和微卫星(简单重复序列,SSR)多态性的检测或分析。紧密相连的标记可通过本领域熟知的方法容易地获得,如分群分析法。
[0158] “聚合酶链式反应”(“PCR”)是指在反应中,用由“上游”和“下游”引物组成的“引物对”或“引物组”以及聚合反应的催化剂,如DNA聚合酶,一般为热稳定的聚合酶,生成目标多核苷酸的重复拷贝。PCR方法为本领域已知的方法,例如“PCR”(McPherson and Moller(Ed),BIOS Scientific Publishers Ltd,Oxford,2000)中描述的。PCR可以从表达SS II基因的植物细胞中分离的mRNA反转录或从植株中分离的基因组DNA得到的cDNA上进行。本文中的引物是能够以序列特异的方式与靶序列进行杂交并在PCR过程中延伸的寡核苷酸序列。扩增子或PCR产物或PCR片段或扩增产物为含有引物和新合成的靶序列拷贝的延伸产物。引物可以与靶序列完全匹配或含有内部错配碱基,能够在特定的靶序列中引入限制酶或催化核酸识别/断裂位点。引物还可含有易于捕获或检测扩增子的额外序列和/或含有修饰的或标记的核苷酸。DNA的热变性重复循环,互补序列引物的退火及在聚合酶作用下,退火引物的延伸形成靶序列的指数扩增。术语目的基因或靶序列或模板是指进行扩增的核酸序列。
[0159] 核苷酸序列直接测序的方法是本领域技术人员熟知的,例如Ausubel等(同上)和Sambrook等,1989(同上)中描述的。测序可采用任何适合的方法进行,例如双脱氧测序、化学测序或它们的变化形式。直接测序具有确定特定序列的任何碱基对变化的优势。
[0160] 植物
[0161] 本文使用的术语“植物”为名词,是指全部植物或植物界的任何成员,作为形容词使用时是指存在于、来自、衍生自或与植物相关的任何物质,例如植物器官(例如叶子、茎、根、花)、单细胞(例如花粉)、种子、植物细胞等。由小植株和发芽的种子产生的根和芽也包括在“植物”中。本文使用的术语“植物部位”是指由植物获得的一个或多个植物组织或器官,其含有植物的基因组DNA。植物部位包括营养结构(例如叶、茎)、根、花器官/结构、种子(包括胚、子叶和种皮)、植物组织(例如维管组织、基本组织等)、细胞及其后代。本文使用的术语“植物细胞”是指从植物中获得的或植物中的细胞,包括原生质体或其它来自植物的细胞、产配子细胞和可再生为植株的细胞。植物细胞可以是培养物中的细胞。所谓“植物组织”是指植物中分化的组织或来自植物(“外植体”)或由未成熟的或成熟的胚、种子、根、芽、果实、茎、花粉、肿瘤组织如冠瘿以及培养物中植物细胞的聚合物的各种形式如愈伤组织获得的未分化的组织。典型的种子中的或来自种子的植物组织为子叶、胚和胚轴。因此,本发明包括植物和植物部位以及它们的产品,特别是含有改良的油组成的种子。
[0162] 本文使用的术语“种子”是指植物“成熟的种子”,或是准备从植物中收获的种子或是已经从植物中收获的种子,如本领域中通常商业收获的种子或产生于植物受精后和种子休眠期之前以及收获前的作为“发育的种子”。
[0163] 本文使用的“转基因植物”是指含有在相同品种、种类或栽培品种的野生型植物中未发现基因基因构建体的植物。也就是说,转基因植物(转化植物)含有在转化前它们不含有的遗传物质(转基因)。转基因可包括由植物细胞、另一个植物细胞或非植物来源获得的或来自于它们的基因序列或合成的序列。一般地,转基因通过人工操作,例如本领域技术人员使用的任何转化方法导入植物中。优选遗传物质稳定地整合至植物基因组中。导入的遗传物质可包括天然存在于相同品种中但重新排序或元件不同排列的序列。含有这种序列的植物本文归于“转基因植物”。“非转基因植物”是指没有通过重组DNA技术导入遗传物质进行遗传修饰的植物。在优选的实施方案中,每一个被导入(转基因)基因的转基因植物为纯合子,因此它们的后代不需分离所需的表型。
[0164] 本文使用的术语“相应的非转基因植物”是指与转基因植物同基因的但不含目的转基因的植物。优选地,相应的非转基因植物为相同品种或种类,作为目的转基因植物的原始株或缺少所述基因构建体的同胞株系,通常称为“分离子”,或以“空质粒”基因构建体转化的相同品种或种类的植物,可以是非转基因植物。本文使用的“野生型”是指根据本发明没有被修饰的细胞、组织或植物。野生型细胞、组织或植物可用作对照,比较外源核酸的表达水平或本文描述的细胞、组织或植物的性状修饰的程度和性质。一般的野生型棉花品种为“Coker”。
[0165] 本发明上下文所述的转基因植物包括用重组技术进行遗传修饰的植物后代,其中所述后代含有目的转基因。所述后代可以是初代转基因植物自花受精或将植物与另一株相同品种的植物杂交得到的。调节本文所述的所需植物或植物器官中的至少一个蛋白/酶的产生。转基因植物部位包括所述转基因植物的所有部位和细胞,例如培养的组织、愈伤组织和原生质体。
[0166] 可使用几种方法中的任何一种确定转化植物中转基因的存在。例如,聚合酶链式反应(PCR)可用于扩增转化植物的独有的序列,通过凝胶电泳或其它方法检测扩增产物。用常规方法从植物中提取DNA,进行PCR反应,用引物扩增特定DNA,DNA的存在能将转化植物和未转化植物区分开来。例如,引物可设计成扩增读入所述结构的转化载体的DNA区并根据目的基因设计反向引物。这些引物仅扩增成功转化的植物的片段。另一种确定阳性转化体的方法是本领域熟知的Southern印迹。还可鉴别转化的植物,即通过它们的表型与非转化或野生型植物区分开来,例如可选择性标记基因的存在,或植物种子改良的油组成的表型,或相关的表型如改变的酶活性。
[0167] 本文使用的“发芽”是指吸胀后根尖从种皮中出现。“发芽率”是指吸胀后经过一段时间,例如14或21天,群体中发芽的种子百分数。数天后可对种子群体进行评估,确定发芽率。根据本发明的种子,本文使用的术语“发芽率大致相同”是指转基因种子的发芽率至少为同基因野生型种子的80%。
[0168] 本发明提供的或设计的使用的植物包括被子植物,既包括单子叶植物,又包括双子叶植物。在优选的实施方案中,本发明植物为作物(例如谷类和豆类(pulses)、玉米、小麦、马铃薯、木薯(tapioca)、水稻、高粱、小米、木薯(cassava)、大麦或豌豆)或其它豆类(legumes)。可种植所述植物用于生产可食性根、块茎、叶、茎、花或果实。优选地,所述植物为棉花。谷类植物的实例包括但不限于,小麦、大麦、水稻、玉米(玉米(corn))、高粱、燕麦和黑麦。在一个实施方案中,棉株为DCS9系(实施例7)的后代,且基因组中相同位置上含有相同的转基因。
[0169] 参考“棉株”是指任何棉属的植株,或相关的野生型、原始品种、种质、栽培品种或它们的变化形式。例如,棉株包括品种如:脉似棉(G.anapoides)、异常棉(G.anomalum)、亚洲棉(G.arboreum)、亚雷西棉(G.areysianum)、旱地棉(G.aridum)、辣根棉(G.armourianum)、澳洲棉(G.australe)、海岛棉(G.barbadense)、澳 洲棉(G.barbosanum)、贝纳狄尔棉(G.benadirense)、比克氏棉(G.bickii)、G.briccetti、绿顶棉(G.capitis-viridis)、皱壳棉(G.costulatum)、G.cunningharnii、达尔文氏棉(G.darwinii)、戴维逊氏棉(G.davidsonii)、林地棉(G.enthyle)、矮小棉(G.exiguum)、拟似棉(G.gossypioides)、哈克尼西棉(G.harknessii)、草棉(G.herbaceum)、陆地棉(G.hirsutum)、灰白棉(G.incanum)、克劳茨基棉(G.klotzschianum)、茅叶棉(G.laxum)、裂片棉(G.lobatum)、伦敦德里棉(G.londonderriense)、长萼棉(G.longicalyx)、马全特氏棉(G.marchantii)、黄褐棉(G.mustelinum)、南岱华棉(G.nandewarense)、纳 尔 逊 氏 棉(G.nelsonii)、G nobile、稀 毛 棉 (G.pilosum)、G.populifoliurn、小丽棉(G.pulchellum)、雷蒙德氏棉(G.raimondii)、鲁宾 逊氏棉(G.robinsonii)、G.rotundifoliurn、G.schwendimantii、索马里棉(G somalense)、苏丹棉(G.soudanense)、马笃克氏端(G.stocksii)、斯特提棉(G.sturtianum)、瑟伯氏棉(G.thurberi)、帝汶棉(G.timorense)、毛棉(G.tomentosum)、三裂棉(G.trilobum)、三叶棉(G.triphyllum)和G.vindis。特殊的品种为陆地棉(gh)和海岛棉(gb)。本领域技术人员应理解,一个适宜的品种、栽培品种或突变体可以是遗传修饰的并通过标准培育技术培养成相关种类或品种。提及的“原始体”是指作为植物来源的任何种类、品种、栽培品种或种质。本领域技术人员应知晓,最具有商业用途的棉花是通过原始二倍体亲本之间的杂交自然产生的四倍体。基于本文的描述,本领域技术人员易于在一个或多个二倍体或四倍体棉株中实现本发明方法,在转基因植株之间产生有性杂种。
[0170] 本文使用的术语“衍生种、种质或品种”应理解为用所述棉花种类、品种、栽培品种或种质,用标准的杂交方法、重组DNA技术、组织培养、诱变或所述方法的任一或多个组合产生的任何植物种类、种质或品种。特别地,在不同的重要棉花品种如海岛棉和陆地棉之间进行种间杂交,及在特定二倍体品种之间进行种间杂交,以及生产这些种间杂种为本领域技术人员的常规技术。
[0171] 本文使用的术语“棉花”是指棉属的任何品种,优选品种为陆地棉或海岛棉。在某些优选的实施方案中,适当的对照或参照植株为大体上非转化的同基因棉株,与“测试”株采用相同的处理。棉籽油可通过其中的CPE和/或CPA脂肪酸的存在区分开来。
[0172] 粮食生产
[0173] 另一方面,本发明提供棉株和棉籽以及从籽粒中获得的含油产品,特别是棉籽油,对于粮食生产或饲料生产是有用的,与野生型籽粒相比,所述籽粒具有改良的籽油组成。优选获得籽粒的植株在发育过程中,籽粒中具有降低的ghFAD2-1、ghFatB-2和ghCPA-FAS-2活性水平。本发明的棉籽油在粮食生产中,特别在商业粮食生产中是有用的。所述粮食生产可包括在粮食生产中将棉籽油作为一种成分与其它成分混合。在优选的实施方案中,理想的用于粮食生产中的棉籽油具有本文所述的改良的组成。
[0174] 用标准方法可容易地从本发明洁净的、脱绒的和脱壳的籽粒中分离出油,例如高温蒸煮、压榨、用螺旋压力机制粉(高压)和/或用溶剂、蒸汽和/或高压力提取油的方法。棉籽的油成分或棉籽油中的任何脂肪酸成分可通过本文描述的或本领域熟知的方法进行测定。还可使用Folch等,J.Biol.Chem.226:497,1957中描述的方法或其它描述的变化形式(见例如Liu等,2002(同上))。棉籽油的脂肪酸成分和/或组成可使用针对已知标准脂肪酸的气液色谱法,通过比较标准对照和待测样品的脂肪酸甲酯的峰和保留时间,以及通过整合得到的峰,方便地进行测定,然而,本发明不限于测定棉籽油的含量和/或组成的方法,特别是测定脂肪酸或其它脂类含量的方法。油几乎完全由三酰基甘油(TAGs)组成,三酰基甘油包括酯化到甘油骨架上的三个脂肪酸。为测定油的TAG含量,油可以通过如固相萃取(SPE)在胶盒上进行纯化。TAG组成可通过反相高分辨率液相色谱法(HPLC),用折光检测器以丙腈为流动相进行定性检测。从纯化的油中,制备得到脂肪酸甲酯(FAMEs),如用冷的含KOH的甲醇溶液进行甲基化,通过毛细管气相色谱法(GC),用高极性柱分析产生的酯。根据脂肪酸的组成,可通过计算机程序,用棉籽油的三酰基甘油中脂肪酸的一般分布计算得出理论的TAG组成。根据理论和实验(HPLC)的三酰基甘油组成得出数学公式,将得到的值与含有基于不同标准油分析得出的数据组的数据库进行比较。
[0175] 食品
[0176] 本发明还包括用棉籽油产品生产的食物、饮料或药物制剂。本发明植物或由其得到的含油或籽棉的产品可用于各种供人使用或消费的各种应用。本文使用的“人”是指人类(Homo sapiens)。棉籽油可方便地用于食品加工过程,特别是油炸食品。油可被添加到食品中如人造黄油、起酥油、沙拉酱、蛋黄酱、乳制品如淇淋、酸奶或奶酪中,或作为一种成分加入到其它食品或食品原料,如面包、蛋糕、饼干、糕点、早餐谷类食品、通心粉、面条或调味汁中。
[0177] 本发明植物的其它可食用的部位可作为食物供人类食用或作为动物饲料使用。例如,叶、茎、根、块茎、果实、豆荚或提取物或含有本发明细胞的任何部位,可供人类或动物食用。改良含油量及组成的本发明植物及其部位可作为动物饲料使用,例如作为猪、牛、马、家禽如小鸡和其它动物的饲料。
[0178] 食品或饮料或药物制剂可以进行包装以备出售或为散装的形式。本发明还提供了制备本发明所述食物、饮料或药物制剂方法,以及制备这些食物或饮料的配方或说明。该方法可包括破碎、提取、加工、烹饪、油炸、装罐、包装或其它本领域已知的处理步骤。所述方法或配方或说明可包括加工本发明油和/或与其它食物成分混合的处理步骤,如将所述混合物或产品加热或烘烤至,例如至少100℃。该方法可包括包装产品的步骤,使其易于出售。
[0179] 方法
[0180] 本发明产品可配制成药用组合物,其可按照常规药剂配制技术制备。例如,参见thRemington′s Pharmaceutical Sciences,18 Ed.(1990,Mack Publishing,Company,Easton,PA,U.S.A.)。所述组合物可含有活性剂或药用衍生活性剂。除了一种活性物质,这些组合物可包括药用赋形剂、载体、缓冲系、稳定剂或其它本领域熟知的物质。这些物质应无毒,且不影响活性成分的效力。载体可采用多种形式,这取决于给药所需的制剂形式。
[0181] 对于口服给药而言,可将化合物配制成液体制剂,如胶囊。在制备口服剂型的组合物中,可采用任何常用的药用介质,例如水、乙二醇、油类、酒精、调味剂防腐剂着色剂、悬浮剂等口服液制剂的介质(例如,悬浮液、酏剂和溶液);或载体如淀粉、糖、稀释剂、造粒剂、润滑剂粘合剂
[0182] 活性剂优选按照治疗有效的量给药。实际给药量和速率以及给药时间取决于需要治疗的病情的性质和严重程度。治疗处方,例如给药剂量、时间等的确定是普通医生或专家的职责,通常需要考虑待治疗的疾病,患者个体的症状、给药地点、给药方法及医生熟知的其它因素。技术和方案的实例可参见Remington′s Pharmaceutical Sciences,(同上)。
[0183] 工业用途
[0184] 植物产品,优选油,可用于生产工业产品,例如乙醇
[0185] 通过以下非限制性实施例进一步描述本发明。
[0186] 实施例1:示例方法和材料
[0187] RNA的分离
[0188] 将用液氮冷冻的2g棉花胚或叶片组织用研钵和研杵研磨成细粉,转移至含22ml冷提取缓冲液的烧杯中并不断搅拌。所述提取缓冲液含200mM Tris-HCl pH8.5,1.5%十二烷基硫酸锂,300mM LiCl,10mMNa2EDTA,1%脱氧胆酸钠,1%诺乃洗涤剂(Nonidet)P-40。然后加入5%不溶的PVP,90mM巯基乙醇,10mM DTT(二硫苏糖醇),0.1%DEPC,在转移至Corex管之前搅拌10min。然后加入3M醋酸铵18.4ml并混匀。4℃,6,000x rpm离心20min。转移上清液至新管中,用1/10体积的3M NaAc,pH5.2和1/2终体积的冷异丙醇沉淀,离心前在-20℃下贮藏1h,然后用转子6,000x rpm离心30min。将沉淀重新悬浮于1mldH2O中并转移至两个Eppendorf管(每管500μl)中。用等体积的苯/氯仿/异戊醇溶液(25∶24∶1)提取悬浮液,4℃离心5min分离所述相。将上方水层小心转移至新Eppendorf管中,按上述方法再次用氯仿提取。向水样中加入二分之一体积的5M LiCl,混匀,置于冰上3hs,然后4℃ 12,000x rpm离心15min。沉淀重悬于50μl dH2O中。最后,加入5μlNaAc和138μl冷乙醇沉淀RNA样品,在干冰上孵育30min,然后4℃离心15min。真空干燥所述RNA沉淀,然后溶于30μl不含核糖核酸酶的H2O中。
[0189] 棉籽cDNA文库的构建
[0190] 用mRNA纯化试剂盒(Pharmacia),按照厂商说明,从上述制备的总RNA中分离出棉花多聚腺苷酸RNA。用cDNA合成试剂盒(Pharmacia),按照厂商说明,以1~5μg多聚腺苷酸RNA为起始物制备cDNA。用标准程序将双链cDNA产物的平末端与EcoR I/Not I接头连接。然后去掉过量的未连接的接头,将cDNA克隆至噬菌体载体Lambda ZAPII(Stratagene,USA)中,用市售包装系统(Stratagene,USA),按照厂商说明进行包装。
[0191] 本文所述的cDNA文库在总计约1.5×107噬斑形成单位(pfu)/ml非扩增文库中,一般含约92%的重组噬菌体颗粒。
[0192] 噬斑纯化阳性杂交的噬斑后,用ExAssist/SOLR系统(Stratagene,USA),按照厂商说明,从λZAPII载体上切除pBluescript SK(-)噬菌粒。
[0193] 所有其它方法如凝胶电泳,转移核酸至膜进行杂交,标记DNA探针的制备和cDNA文库的筛选为标准方法(Ausubel等,(同上))。除非另有说明,其它杂交条件如Khandjian,Bio/Technology,5:165-167,1987中所述的条件,通过引用并入于此,在42℃下,用50mM Tris-HClpH7.5,1M NaCl,50%甲酰胺,10x Denhardt′s液,10%硫酸葡聚糖,1%SDS,0.1%焦磷酸钠,0.1mg/ml鲱鱼精DNA。然后在65℃下,在0.2x SSC,0.1%SDS中短暂洗涤,然后在65℃下,在0.2x SSC,0.1%SDS中进一步洗涤两次,每次15min(高严格性)。
[0194] 实施例2:从棉花中分离FAD2基因
[0195] 从棉花中分离出四个不同的FAD2基因,每一个基因编码可能的微粒体油酰-Δ12去饱和酶,该去饱和酶能将油酸去饱和生成亚油酸(Liu等,1999a(同上),Liu等,1999b(同上);Kargiotidou等,Journal ofExperimental Botany 2008 5P(8):
2043-2056,2008,均通过引用并入于此)。第一个基因称为ghFAD2-l,大概在活性油生物合成的同时,特异表达于发育的种子中(Liu等1999a(同上))。两条ghFAD2-l核苷酸序列描述于此(SEQ ID Nos:1和24),它们全长具有96%的同一性,因此,可能代表对应于不同的等位基因的cDNAs或更可能是对应于四倍体棉花中同源FAD2-1基因的cDNAs。第二个基因,ghFAD2-2,(登录号Y10112)具有低的组成型表达水平,且在种子发育过程始终以低水平表达(Pirtle等,2001(同上))。ghFAD2-2的核苷酸序列(SEQ ID No:26)具有ghFAD2-1(SEQ ID No:1)中央序列一半的约72%的序列同一性。第三个和第四个成员是ghFAD2-3(登录号AF331163)和ghFAD2-4(登录号AY279314),它们在叶子和其它棉花组织中比在种子中表达量更高(Kargiotidou等,2008(同上))。ghFAD2-3和ghFAD2-4与ghFAD2-1(SEQ ID No:1)序列具有约72%的序列同一性。
[0196] 基于这些观察以及之前由RNAi下调的ghFAD2-1(Liu等,PlantPhysiol.129:1732-1743,2002;美国专利No.6974898)产生的高油酸棉籽油,认为该基因编码棉籽中主要的FAD2活性。因此,选择具有SEQ ID No:1的第5~354位核苷酸的ghFAD2-1基因构建下调基因表达的RNAi结构。这与Liu等,2002(同上)描述的区域相同,其对ghFAD2-1具有特异性。同样地,可选择该基因的其它区域。例如,美国专利No.6974898使用ghFAD2-1
5′-UTR的92bp区,以及Liu等,2002(同上),使用该基因转录部位5′端的540bp。FAD2-1的核苷酸和氨基酸序列如图3中所示。
[0197] 实施例3:棉花FATB基因的分离
[0198] 按照以下方法从培育的棉籽cDNA文库(实施例1)中鉴别和分离出棉花中编码与FatB同源的蛋白的两个cDNA克隆。对应于ghFatB-1基因第一外显子的约480bp的PCR片段(Yoder等,1999(同上);登录号:AF076535),用正向(正义)和反向(反义)引物:5′-atggttgctactgctgtgac-3′(SEQ ID NO:29和5′-ctgtaaatgattcattagtgt-3′(SEQ ID NO:30),以从发育的棉花胚中获得的RNA为模板,扩增SEQID NO:3的210~713位上的核苷酸序列。该PCR片段用于在高严格条件下检测cDNA文库,分离出两个不同的类FatB cDNAs。它们被命名为ghFatB-2和ghFatB-3。由于5′和3′端具有非翻译区,两条序列显示为cDNAs全长序列。ghFatB-2cDNA长为1647bp(SEQ ID NO:5),预测编码的蛋白为421个氨基酸(SEQ ID NO:6),其包括用于将蛋白转移至质体中的信号序列。ghFatB-3cDNA长为1498bp(SEQ ID NO:7),预测编码的蛋白为419个氨基酸(SEQ ID NO:8)。
[0199] 预测的ghFatB-2和ghFatB-3的氨基酸序列与几个报道的FatB硫酯酶,如来自拟南芥和大豆(登录号DQ418764)以及芥菜(DQ856315)的那些具有全长75%的序列同一性,而与来自双子叶植物,如拟南芥(AK 176105).的FatA硫酯酶仅有30~40%的同源性。由ghFatB-2和ghFatB-3编码区编码的推测的多肽彼此间显示出89%的同一性。由于它们的3′UTR序列大不相同,认为它们衍生自棉花FatB基因家族的两个不同的基因。Pirtle等,Plant Cell Physiology,40:155-163,1999,通过引用并入于此(cDNA:登录号AF034266;结构基因:AF076535).分离出编码FatB的cDNA及其相关的结构基因。与之前分离的ghFatB-1(Yoder等,1999(同上);登录号:AF076535)相比,ghFatB-2具有约87%的同一性,ghFatB-3具有约84%的同一性。正如所有的酰基-ACP硫酯酶具有的特征,棉花FatB硫酯酶在N-末端具有运输肽序列,指导蛋白进入质体中。确切的运输肽切割位点是未知的,但推测其位于植物FatB序列特有的高度保守的疏水区的起始位置上(Jones等,
1995(同上))。图4和图5分别示出了ghFatB-2和ghFatB-3的核苷酸序列以及推测的多肽序列。
[0200] 之前推测植物FatB基因为组成型表达(Dormann等,Arch.Biochem.Biophys.316:612-618,1995)。与此相一致地是,表达分析表明ghFatB-1基因表达于胚、幼苗和成熟棉株的叶片(Pirtle等,1999(同上))中。由于能够从上述棉籽的cDNA文库中分离出,认为ghFatB-2和ghFatB-3表达于发育的种子中,也可能是其它组织中。ghFatB-2在种子中的表达水平高于ghFatB-3,因此认为前者编码棉籽中主要的FatB活性。然而,为确定是ghFatB-2基因而非其它的两个基因编码棉籽中主要的FatB活性,有必要表明它的灭活将导致硫酯酶活性降低以及从质体中释放的棕榈酸减少。也可能是需要将所述基因的两个或三个组合沉默,降低棕榈酸水平。因此,用具有来自ghFatB-2的SEQ IDNO:5的458~843位上的核苷酸序列形成基因沉默结构。
[0201] 实施例4:编码棉花环丙烷脂肪酸合酶(CPA-FAS)基因的克隆
[0202] CPA-FAS催化环丙烷脂肪酸制备中的第一个关键步骤,将油酸转化成DHS。用尖孢镰刀菌感染棉花的根和胚轴后,鉴别出陆地棉的两个EST序列是差异表达的。其中一个EST序列,CD486555用作探针筛选由培育的棉籽形成的cDNA文库(实施例1)以及由来自棉花根部的RNA形成的第二个cDNA文库。探针DNA的序列如图6中所示(SEQ IDNO:9)。
[0203] 在高严格条件下与探针杂交后,两个不同的带有独特的5′和3′UTR序列的全长cDNAs从由棉花根部RNA形成的cDNA文库中分离出来。第三个cDNA克隆从棉籽cDNA文库中分离出来。分别命名为ghCPA-FAS-1、ghCPA-FAS-2和ghCPA-FAS-3。其DNA序列及预测的编码多肽的氨基酸序列如图7~9中所示(SEQ ID NO:10~15)。
[0204] 推得的ghCPA-FAS多肽各含有865~873个氨基酸,计算分子量为约99kDa。由于内质网中的CPA-FAS酶具有活性,这可能表明成熟的蛋白被认为不具有5′信号肽。与来自香苹婆的CPA-FAS以及根据基因组序列推测的来自拟南芥(登录号AT23510)和水稻(AK069115)的同源蛋白近似,编码的ghCPA-FAS蛋白具有融合C-末端结构域的N-末端FAD-结合域,与各种甲基转移酶具有同源性。与预测的蛋白CPA-FAS活性相一致。在N-末端,ghCPA-FAS蛋白的前20个氨基酸似乎为疏水的,认为其与膜锚定有关。
[0205] 将推得的三个不同的ghCPA-FAS cDNAs的氨基酸序列与来自香苹婆、拟南芥和水稻的同源DNA序列相比较,检测到ghCPA-FAS-1(AY574036)和ghCPA-FAS-2(AY574037)具有97%的氨基酸同一性,与ghCPA-FAS-3(AY574038)仅有64~65%的同一性。相比之下,ghCPA-FAS-3显示出更高的序列特异性,与拟南芥At23510基因的氨基酸具有74%的同一性,与At23530的氨基酸具有75%的同一性。这表明ghCPA-FAS-3在棉花物种形成以前演化分离。已知拟南芥和水稻不累积CPA或CPE脂肪酸,因此测定这些植物中CPA-FAS基因的功能。
[0206] 用ghCPA-FAS-1的蛋白编码区作为探针通过Southern印迹分析研究棉花CPA-FAS基因的基因组组成。在HindIII消化的二倍体棉花DNA中检测到至少三条杂交带,而在四倍体棉花中为两倍的杂交带(图10)。得出的结论是,三个ghCPA-FAS基因中的每一个基因由二倍体棉花中的单一基因座表示,在四倍体棉花中为两个同源的基因座。这表明异源四倍体棉花含有存在于A-和D-基因组二倍体前体中的三个基因中的各基因的两个拷贝。
[0207] 分析棉花CPA-FAS基因的表达,寻找棉花组织中的差异表达。如图11所示,对从开花后各时期的不同棉花组织包括根、胚轴、叶片和发育的胚中提取的总RNA的分析表明ghCPA-FAS-1转录水平在根和子叶中较高,但在叶片和发育的胚中未发现表达,而检测到ghCPA-FAS-2在所有测试的组织,除了叶片中表达。在发育的胚中,ghCPA-FAS-2在胚中的最高转录水平是在种子发育的中间时期,开花后约20~40天。这是发育的棉花胚中产生油的主要时期。因此,预测ghCPA-FAS-2在决定棉籽中环丙烯脂肪酸的生物合成中起关键作用,是用于下调以降低棉籽油中CPA和CPE脂肪酸的候选目标基因。
[0208] 实施例5:同时下调棉籽中GHFAD2-1、GHCPA-FAS-2和GHFATB-2的基因基因构建体
[0209] 按照以下方法生成用于RNAi介导的降低基因表达的表达嵌合发夹RNA分子的基因基因构建体。设计RNAi沉默结构,同时定位三个不同的基因,以达到最大程度地降低棉籽油中棕榈酸和环丙烷脂肪酸,同时最大程度地提高油酸的目的。所述结构如图12所示,含有由ghFAD2-l的350bp、ghCPA-FAS-2的442bp和ghFatB-1的358bp融合在一起组成的反向嵌合重复序列。该嵌合序列的反向重复单元被来自ghFad2-l基因的长度为1120bp的内含子1间隔开,具有完整的5′和3′外显子/内含子边界(图13,片段C)。内含子作为间隔区,稳定所述反向重复序列,因此使质粒载体中的反向重复序列在大肠杆菌中易于克隆。为实现种子的特异表达,将反向重复序列置于大豆凝集素启动子(Lec-P)和转录终止子/多腺苷酸序列(Lec-T)(Cho等,Plant Molecular Biology Reporter 13:255-269,1995)的调控之下。发夹RNA-表达基因位于靠近选择性标记基因的3′端位置上,所述选择性标记基因包括NPT II蛋白编码区,其受地三叶草矮病毒启动子(Sc1-P)和终止子(Sc3-T)调控。
使用的特异序列如图13所示(SEQ ID NOs:16~23)。该基因基因构建体命名为MonoCott结构。
[0210] 还生成了第二个基因基因构建体,称为LY-2。除了ghCPA-FAS-2基因的442bp片段被编码杜松烯羟化酶的棉花基因区取代,该酶是培育的种子中棉酚合成所必须的酶,其与MonoCott结构相同。为生成LY-2,将来自编码(+)-δ-杜松烯-8-羟化酶的ghCAD-H基因(登录号:AF332974)的401bp的DNA片段,对应于SEQ ID NO:28的1420~1821的核苷酸序列,用引物S1:5′-cctgagaggttcttgactgatcatg-3′(SEQ ID NO:31)和A1:5′-gcttatgatgtataataaacacattat-3′(SEQ ID NO:32)进行PCR扩增。用该片段取代MonoCott结构中的ghCPA-FAS-2部分,生成LY-2。
[0211] 实施例6:用MonoCott结构转化棉花
[0212] 将MonoCott和LY-2基因基因构建体分别插入二元载体中并导入根癌农杆菌AGL1株中。转化的细菌用于转化棉花品种Coker315,如Liu等,2002(同上)中描述的。简言之,从10天大的无菌生长的棉花幼苗上剪切子叶作为外植体,感染并与根癌农杆菌转化体共培养两天。然后在含0.1mg/l 2,4-D、0.1mg/l激动素、50mg/l硫酸卡那霉素和25mg/l头孢噻肟的MS培养基(Murashige and Skoog,Physiologia Plantarum.15:473-497,1962)上筛选六周。然后将来自子叶外植体的健康的愈伤组织转移至含5mg/l 6-(γ,γ-二甲基烯丙基氨基)-嘌呤核苷(2ip)、0.1mg/l乙酸(NAA)、25mg/l卡那霉素和250mg/l头孢噻肟的MS培养基中在28℃下再培养六周。培养约六周~十周后开始形成体细胞胚,转移至新鲜的但不添加植物激素或抗生素的平皿中,直至它们发芽。随后,当叶片和根发育出来后,将从体细胞胚发育来的小植株转移至土壤中并置于温室中,生长温度28/20℃(昼/夜)。
[0213] 用MonoCott RNAi结构转化六个单独的棉花系由愈伤组织再生,正常地在温室中发育成熟、开花并产生种子。转基因株和非转基因(野生型)亲本株Coker315之间无明显的表型差别。用LY-2RNAi结构转化十个单独的棉花系由愈伤组织再生并以类似的方式处理。
[0214] 实施例7:棉花转化株的表型分析
[0215] 从由原代T1代转基因植株获得的T2代种子中切下成熟种子子叶的约1/8部分,每一部分用FAME和GC-MS进行脂肪酸成分分析。用Bligh等,Canadian Journal of Biochemistry and Physiology 37:911-917,1959的方法分离总脂类,用如Liu等,2002(同上)所述的标准方法制备脂肪酸甲酯(FAMEs)。随后用气相色谱(GC)分离FAMEs,采用配有合适GC毛细管柱(30m×0.25mm)的Agilent 6890GC。参照FAME标准物鉴定脂肪酸。
[0216] 转基因系DCS9-34的籽粒,其脂肪酸成分中油酸水平显著提高,同时棕榈酸和环丙烷脂肪酸水平降低。筛选该转基因系,培育为纯合子。后代籽油中脂肪酸成分的遗传性数据示于表1。如表1中所示,DCS9-34系的籽油中油酸含量提高至约75%~80%,棕榈酸含量降至10%以下。在以前研究的高油酸系(Liu等,2002(同上))中,由于RNAi介导的下调ghFAD2-l(Liu等,2002(同上))的多效性,籽油中棕榈酸水平降至总脂肪酸的16%。MonoCott结构引起的棕榈酸含量进一步降至7%,可能是由于ghFAD2-l和ghFatB-2的联合下调效应。用MonoCott结构转化的其它植物中观察到类似的表型,但程度更低。
[0217] 在由原代转基因DCS9-34株获得的T2代种子中,十粒种子中有三粒是无效分离子。因此,分离的转基因为孟德尔遗传模式的单一主导基因。在T3代植株中,15粒种子中有3粒为无效/不含转基因的分离子。在30粒分析的T4种子中,没有发现无效的种子;因此,这些代表了纯合群体。T2和T3种子子叶的仅约1/8用于脂肪酸分析,由于它们主要存在于种子的幼根中,因此未检测到环状脂肪酸。又如图14所示,三代中的每一代的脂肪酸成分的特征是提高的油酸和降低的棕榈酸水平。这些水平是持续且在杂合或纯合的转基因植物中稳定遗传,如表2所示。这种关系清楚地表明同时定位三个基因ghFAD2-l、ghCPA-FAS-2和ghFcttB-2的MonoCott RNAi结构的转基因表达,实现了脂肪酸成分的基因改变的稳定遗传。
[0218] 在LY-2转基因种子中,油酸水平也提高至80%以上,在一些种子中高于85%。在许多种子中的棕榈酸水平为约7%,亚油酸水平为约6~10%(表2)。这些改变的水平作为孟德尔基因座随转基因一起稳定地遗传(表2)。
[0219] 环丙烷脂肪酸,包括DHS、STC和MVL,在成熟棉籽的棉花子叶中的水平不明显,但在成熟种子的胚轴中浓集。为分析转基因系中的环丙烷脂肪酸水平,切下胚轴,进行脂肪酸成分的分析。DCS9-34胚轴的全部脂肪酸含量,未转化的对照株Coker315以及用LY-2结构转化的转基因系列于表3中,如图15中所示。分析LY-2转化的种子。如上所示,LY-2转化的种子显示出与DCS9-34转化的种子相似的改良的低棕榈酸水平和高油酸水平。如表3中所示,未转化的棉花胚轴,代表为未转化的Coker315,含总的环丙烷脂肪酸为总脂肪酸水平的11.5%(23个随机种子样品的平均值)。在LY-2种子中,得到基本升高的油酸,其为CPA-FAS酶的底物,三个环丙烷脂肪酸各为DHS、STC和MVL,以及与未转化的对照相比,基本升高的总环丙烷脂肪酸百分数。这与MonoCott系,DCS9-34形成鲜明对照,DCS9-34的三种环丙烷脂肪酸基本降低,在26个随机筛选的种子中,其总的环状脂肪酸水平平均仅为3.8%。这表明与野生型相比,总的环丙烷脂肪酸降低了≥60%,与LY-2转基因种子相比,降低了≥80%.
[0220] 本领域技术人员应理解,除了那些具体描述,可以对本发明作一些修改和改进。应理解,本发明包括所有的这些修改和改进。本发明还包括说明书中所述的所有步骤、特征、组成和化合物的单个或集合,以及任意所述步骤或特征的两个或多个组合。
[0221] 表1
[0222] 三代中转基因系DCS9-34棉籽中的籽油脂肪酸组成。高于20%的棕榈酸含量的种子为无效分离子,基本与野生型水平相同。
[0223]
[0224]
[0225]
[0226] ND:未检测
[0227] 表2
[0228] 表达LY-2RNAi结构的转基因棉花的三代脂肪酸组成,所述LY-2RNAi基因构建体靶向三个基因,即ghFad2-l、ghCAD-H和ghFatB-2。LY2-1、LY2-8和
[0229] LY2-9显示为野生型脂肪酸组成,可能为未转化的“逃逸(escapes)”。
[0230]
[0231]
[0232]
[0233] T4纯合子DCS9-34种子的棉花胚轴中的环丙烷脂肪酸减少
[0234] 表3
[0235] 三种类型的棉花中胚轴的脂肪酸组成,包括具有HO、LP和低环状脂肪酸特征的DCS9-34(MonoCott),具有HO和LP以及升高的环状脂肪酸特征的LY-2,Coker315为常规棉花对照。
[0236]
[0237]
[0238]
[0239]
[0240]
[0241] 表4
[0242] 序列识别概要
[0243]
[0244]
[0245]
[0246] 表5
[0247] 示例及优选的氨基酸取代
[0248]
[0249]
[0250] 参考书目
[0251] Almeida and Allshire,Trends Cell Biol.15:251-258,2005.
[0252] Altschul et al,Nucleic Acids Res.25:3389,1997.
[0253] Ausubel et al.,(eds.),Current Protocols in Molecular Biology,John Wiley & Sons,NY,6.3.1-6.3.6.,1989.
[0254] Ausubel et al.,Current Protocols in Molecular Biology,John Wiley & Sons Inc,1994-1998,Chapter 15.
[0255] Bao et al,Proc.Natl.Acad.ScL U.S.A.99:1X12-1X11,2002.
[0256] Barker et al,Plant MoI.Biol,2:235-350,1983.
[0257] Bechtold et al,CR.Acad.Sci.Paris,316:1194,1993.
[0258] Bevan et al,Nucl.Acid Res.,11:369,1983.
[0259] Birch,Ann Rev Plant Physiol Plant MoI Biol 48:297-326,1997.
[0260] Bligh et α/.,Canadian Journal of Biochemistry and Physiology 37:911-917,1959.
[0261] Bonaventure et al,Plant Cell 15:1020-1033,2003.
[0262] Bowque,Plant Science,105:125-149,1995.
[0263] Bvhi et al,Plant J.30:155-163,2002.
[0264] Chapman et al,J.Am.Oil Chem.Soc.78:941-947,2001.
[0265] Cherry and Leffler,Seed.In″Cotton,agronomy monograph No.24″(eds RJ Kohel,CF Lewis)pp.511-569.Crop Science Society of America,Madison,WI,USA,1984.[0266] Cherry,J.Am.Oil Chem.Soc.60:360-367,1983.
[0267] Cho et al,Plant Molecular Biology Reporter 13:255-269,1995.
[0268] Comai et al,Plant J.37:778-786,2004.
[0269] De Framond,Biotechnology,1:262,1983.
[0270] Dormann et al,Plant Physiol.123:637-644,2000.
[0271] Dormann et al,Arch.Biochem.Biophys.316:612-618,1995.
[0272] Dowd et al,Molecular Plant-Microbe Interactions.17:654-661,2004.[0273] Folch et al,J.Biol Chem.226:497,1957.
[0274] Fuller et al,J.Food Sci.31:477-480,1966.
[0275] Garfinkel et α/.,Cell,27:143-153,1983.
[0276] Greve,J.MoI Appl Genet,1:499-511,1983.
[0277] Harayama,Trends Biotechnol.16:76-82,1998.
[0278] Hartmann and Endres,Manual of Antisense Methodology,Kluwer,1999.[0279] Haseloff and Gerlach,Nature 334:585-591,1988.
[0280] Henikoff et al,Plant Physiol.135:630-636,2004.
[0281] Hinchee et al,Biotech.6:915,1988.
[0282] Hoekema et al,Nature,303:179,1983.
[0283] Hutchins et al,Journal of American Oil Chemists Society 45:397-399,1968.
[0284] Johnson et al,Nature 214:1244-1245,1967.
[0285] Jones and King,Cottonseed Oil.National Cottonseed ProductsAssociations,Inc.and the Cotton Foundation,Memphis,TN,USA,1993.
[0286] Jones et al,Plant Cell 7:359-371,1995.
[0287] Joshi,JVwc/.Acid Res.15:6643,1987.
[0288] Kargiotidou et al,Journal of Experimental Botany 200859(S):2043-2056,2008.
[0289] Khandj ian,Bio/Technology,5:165-167,1987.
[0290] Klein et al,Nature,327:70,1987.
[0291] Kris-Etherton et al,Nutrition-today(USA).28:30-38,1993.
[0292] Lindsey et al,Exp.Biol.Med.195:261-269,1990.
[0293] Liu et al,Plant Physiol.120:339,1999b.
[0294] Liu et al,Plant Physiol.129:1732-1743,2002.lAλx et al,Australian Journal of PlantPhysiology 26:101-106,1999a.
[0295] McPherson and Moller(Ed),BIOS Scientific Publishers Ltd,Oxford,2000.[0296] Medberry e/α/.,Plant Cell,4:185-192,1992.
[0297] Medberry et al,Plant J.3:619-626,1993.
[0298] Merker and Mattil,1965.U.S.Patent 3,201,431.
[0299] Millar and Waterhouse,Funct Integr Genomics,5:129-135,2005.[0300] Mounts et al,J Am.Oil Chem.Soc.65:624-628,1998.
[0301] Mozaffarian et al,N Engl J.Med.354:1601-1613,2006.
[0302] Murashige and Skoog,Physiologia Plantarum.15:473-497,1962.
[0303] Needleman and Wunsch,J.MoI Biol 48:443-453,1970.
[0304] Niedz et al,Plant Cell Reports,14:403,1995.
[0305] O′Brien,Cottonseed Oil.In:F.D.Gunstone(Ed.)Vegetable Oils in Food Technology:Composition,Properties and Uses.Blackwell Publishing,Oxford,pp.203-230,2002.
[0306] OGTR DIR-039/2003 Field evaluation of genetically modifiedhigh-oleic(HO)cottonOomen et al,Lancet 357:746-751,2001.
[0307] Ow et al,Science,234:856,1986.
[0308] Pasquinelli et al,Curr Opin Genet Develop 15:200-205,2005.
[0309] Perriman et al,Gene,113:157-163,1992.
[0310] Pirtle et al,Plant Cell Physiology,40:155-163,1999.
[0311] Pirtle et al,Biochim.Biophys.Acta 1522:122-129,2001.
[0312] Prasher et al,Biochem.Biophys.Res.Comm.126:1259-68,1985.
[0313] Roehm et al,Lipids 5:80-84,1970.
[0314] Salomon et al,EMBOJ.,3:141-146,1984.
[0315] Sambrook et al,Molecular Cloning:A Laboratory Manual(2nd Ed).Cold SpringHarbour Laboratory,Cold Spring Harbour,N.Y.I 989.
[0316] Senior,Biotech.Genet.Engin.Revs.15:79-119,1998.
[0317] Shenstone and Vickery,Nature 190:68-169,1961.
[0318] Shippy et α/.,MoI Biotech.12:117-129,1999.
[0319] Slade and Knauf,Transgenic Res.14:109-115,2005.
[0320] Smith et al,Nature,407:319-320,2000.
[0321] Stalker et al,Science,242:419,1988.
[0322] Thillet et α/.,J Biol.Chem.263:12500,1988.
[0323] Voelker et al,Plant Journal 9:229-241,1996.
[0324] Waterhouse et al,Proc.Natl.Acad.Sci.U.S.A.95:13959-13964,1998.[0325] Wilson et al,J.Am.Oil Chem.Soc.78:335-340,2001.
[0326] Yoder et al,Biochimica et Biophysica Acta 1446:403-413,1999.[0327] Zwar and Chandler,Planta 197:39-48,1995.
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈