用于生产α-檀香萜的方法

申请号 CN201410063345.1 申请日 2009-03-04 公开(公告)号 CN103923947B 公开(公告)日 2017-12-12
申请人 弗门尼舍有限公司; 发明人 M·沙尔克;
摘要 本 发明 提供一种生产α‑檀香萜的方法,所述方法包括使至少一种多肽与法呢基焦 磷酸 酯(FPP) 接触 。尤其是,所述方法可以在体外或在体内进行以生产α‑檀香萜,其在香料和 调味品 领域中是很有效的化合物。本发明还提供可用于本发明方法的多肽的 氨 基酸序列。编码本发明多肽的核酸和包含所述核酸的表达载体也是本发明的一部分。经转化以用于生产α‑檀香萜的方法的非人宿主 生物 体或细胞也是本发明的目的。
权利要求

1.一种生产α-檀香萜的方法,包括:
a)使法呢基焦磷酸酯与至少一种具有α-檀香萜合酶活性的多肽接触,该多肽的基酸序列与SEQ ID NO:1有至少98%的同一性,并且该多肽是从黄皮中分离的;
b)非强制选择地,分离在步骤a)中产生的α-檀香萜。
2.权利要求1的方法,其中步骤a)包括在有利于生产α-檀香萜的条件下,培养能够生产法呢基焦磷酸酯并且经转化以表达至少一种具有α-檀香萜合酶活性的多肽的非人宿主生物体或细胞,所述多肽的氨基酸序列与SEQ ID NO:1有至少98%的同一性。
3.权利要求2的方法,其中该方法在步骤a)之前还包括用编码具有α-檀香萜合酶活性的多肽的至少一种核酸转化能够生产法呢基焦磷酸酯的非人宿主生物体或细胞以便使所述生物体表达所述多肽,所述多肽的氨基酸序列与SEQ ID NO:1有至少98%的同一性。
4.权利要求3的方法,其中编码该α-檀香萜合酶的该至少一种核酸的核苷酸序列与SEQ ID NO:2或其互补序列有至少98%的同一性。
5.权利要求2~4中任一项的方法,其中该非人宿主生物体是植物、原核生物或真菌
6.权利要求2~4中任一项的方法,其中该非人宿主生物体是微生物
7.权利要求2~4中任一项的方法,其中该非人宿主生物体是细菌或酵母
8.权利要求7的方法,其中所述细菌是大肠杆菌(E.coli),所述酵母是酿酒酵母(Saccharomyces cerevisiae)。
9.权利要求2~4中任一项的方法,其中所述非人宿主细胞是植物细胞或真菌细胞。
10.权利要求2~4中任一项的方法,用于生产作为主要产物的α-檀香萜。
11.权利要求10的方法,其中α-檀香萜占所获得的倍半萜的至少60%。
12.权利要求11的方法,其中α-檀香萜占所获得的倍半萜的至少80%。
13.权利要求12的方法,其中α-檀香萜占所获得的倍半萜的至少90%。
14.权利要求2~4中任一项的方法,用于生产(+)-α-檀香萜,并且其中具有α-檀香萜合酶活性的多肽具有(+)-α-檀香萜合酶活性。
15.权利要求14的方法,其中(+)-α-檀香萜是作为主要产物获得的。
16.权利要求15的方法,其中(+)-α-檀香萜占所获得的倍半萜的至少60%。
17.权利要求16的方法,其中(+)-α-檀香萜占所获得的倍半萜的至少80%。
18.权利要求17的方法,其中(+)-α-檀香萜占所获得的倍半萜的至少90%。
19.一种多肽,其具有α-檀香萜合酶活性并且该多肽的氨基酸序列与SEQ ID NO:1有至少98%的同一性,并且该多肽是从黄皮中分离的。
20.权利要求19的多肽生产作为主要产物的α-檀香萜的用途。
21.权利要求20的用途,其中所述多肽能够生产倍半萜的混合物,其中α-檀香萜占所生产的倍半萜的至少60%。
22.权利要求21的用途,其中α-檀香萜占所生产的倍半萜的至少80%。
23.权利要求22的用途,其中α-檀香萜占所生产的倍半萜的至少90%。
24.权利要求20的用途,其中所述多肽具有(+)-α-檀香萜合酶活性。
25.权利要求24的用途,其中所述多肽能够生产作为主要产物的(+)-α-檀香萜。
26.权利要求25的用途,其中所述多肽能够生产倍半萜的混合物,其中(+)-α-檀香萜占所生产的倍半萜的至少60%。
27.权利要求26的用途,其中(+)-α-檀香萜占所生产的倍半萜的至少80%。
28.权利要求27的用途,其中(+)-α-檀香萜占所生产的倍半萜的至少90%。
29.一种编码权利要求19的多肽的核酸,该核酸是从黄皮中分离的。
30.权利要求29的核酸,其核苷酸序列与SEQ ID NO:2或其互补序列有至少98%的同一性。
31.一种表达载体,其包含权利要求29或30的核酸。
32.权利要求31的表达载体,其是病毒载体、噬菌体或质粒的形式。
33.权利要求31或32的表达载体,包含权利要求29的核酸,该核酸可操作地连接到至少一种控制转录、翻译的起始或终止的调节序列;并且非强制选择地包含至少一种选择标记。
34.权利要求33的表达载体,所述调节序列为转录的启动子、操纵子或增强子,或mRNA核糖体结合部位。
35.一种非人宿主生物体,其用权利要求29或30的至少一种核酸转化,以便使其异源表达或过表达权利要求19的至少一种多肽,其中所述非人宿主生物体是原核生物或真菌。
36.一种非人宿主生物体,其用权利要求29或30的至少一种核酸转化,以便使其异源表达或过表达权利要求19的至少一种多肽,其中所述非人宿主生物体是微生物。
37.权利要求36的非人宿主生物体,其中所述微生物是细菌或酵母。
38.权利要求37的非人宿主生物体,其中所述细菌是大肠杆菌,所述酵母是酿酒酵母。
39.一种真菌细胞,其用权利要求29或30的至少一种核酸转化,以便使其异源表达或过表达权利要求19的至少一种多肽。
40.一种生产权利要求19的至少一种多肽的方法,包括:
a)培养用权利要求31~34中任一项的表达载体转化的非人宿主生物体或细胞,以便使其具有权利要求29或30的核酸并且表达或过表达权利要求19的多肽;
b)从在步骤a)中培养的非人宿主生物体或细胞中分离该多肽。
41.权利要求40的方法,在步骤a)之前,还包括用权利要求31~34中任一项的表达载体转化非人宿主生物体或细胞,以便使其具有权利要求29或30的核酸并且表达或过表达权利要求19的多肽。

说明书全文

用于生产α-檀香萜的方法

[0001] 本发明是2009年03月04日申请发明名称为“用于生产α-檀香萜的方法”的第200980107571.2号发明专利申请的分案申请。

技术领域

[0002] 本发明提供一种生产α-檀香萜的方法,所述方法包括将至少一种多肽与法呢基焦磷酸酯(FPP)接触。特别是,所述方法可以在体外或体内进行以产生α-檀香萜,其是一种在香料和调味料领域中非常有用的化合物。本发明还提供可用于本发明方法的多肽的基酸序列。编码本发明多肽的核酸和含有所述核酸的表达载体也是本发明的一部分。本发明的另一个目的是一种经转化以在生产α-檀香萜的方法中使用的非人宿主生物体或细胞。

背景技术

[0003] 已经在大多数生物体(微生物、动物和植物)中发现了萜。这些化合物由称为异戊二烯单元的五单元组成,并按由结构之中存在的这些单元的数目来进行划分。因此单萜、倍半萜和双萜分别是包含10、15和20个碳原子的萜。例如,倍半萜已广泛见于植物界。许多倍半萜分子因它们的调味料和香味性质以及它们的美容、医药和抗菌效果而众所周知。已经鉴定出了300多种倍半萜类和3000多种倍半萜化合物,并且每年还鉴定出许多新的结构。将通过不同方式如蒸汽蒸馏或溶剂萃取获得的植物提取物用作萜源。萜分子往往原样使用,但是有时候使用化学反应将该萜转化成其它的高价值分子。
[0004] 萜的生物合成生产涉及的酶被称为萜合酶。事实上植物界中存在大量的倍半萜合酶,其全部使用相同的底物(法呢基焦磷酸酯,FPP)但是具有不同的产物分布。已经克隆了编码倍半萜合酶的基因和cDNA并且描述了相应的重组体酶。在植物中及其他生物体中的萜的生物合成已经被广泛研究,在此不另外详述,但可参考Dewick的Nat.Prod.Rep.,2002,19,181-222,其回顾了萜生物合成路径的现有技术的状况。
[0005] α-檀香萜是天然存在的倍半萜分子。(+)-异构体可被用作化学合成或生物合成(Z)-(+)-α-檀香醇的原材料,该檀香醇是檀香油的重要成分。通过蒸馏檀香物种的心材获得的檀香油是重要的香料成分。檀香也被大量用于熏香和传统医学。该油包含90%的倍半萜醇。(Z)-(+)-α檀香醇和(Z)-(-)-β-檀香醇表示主要组分(分别为45~47%和20~30%)并且主要是形成一般檀香油的甜木香和香脂气味的原因。还存在其它组分如表-β-檀香醇和反-α-香柠檬醇并且其可能有助于檀香香调。
[0006] 通常,植物天然提取物的价格和可用性取决于植物的丰度、油的收率和地理来源。另外,天然提取物的可获性和品质极大地依赖于导致每年差异化的气候及其他当地条件,使得某些年在高品质香料中使用上述成分非常困难,甚至不可能使用。由于过度开发自然资源、难以耕作、檀香植物的缓慢生长,在过去的十年期间檀香原料的可获性已经显著地减少。因此,有利的是提供一种(Z)-(+)-α-檀香醇的来源,其更少地受可获性和品质的波动的影响。檀香倍半萜组分的化学合成迄今为止是不可利用的。因此合成(+)-α-檀香萜(然后其可被用于生产(Z)-(+)-α-檀香醇)的生物化学途径引起极大的兴趣。考虑到控制在檀香物种中生产倍半萜的困难,寻求可替代的植物来源。
[0007] 在若干植物品种中确定了檀香烷类倍半萜、特别是具有α-檀香烷骨架的倍半萜。已经报道了黄皮(clausena lansium)(来自芸香科的植物)在其树叶中包含了大量的檀香烷倍半萜。Zhao和合作者(Zhao等,Z.Naturforsch,2004,59c,153-156)分析了来自中国的黄皮树叶并且发现了α-檀香醇和β-檀香醇的存在。对源自古巴的黄皮树叶进行分析,发现了(Z)-α-檀香醇、表-β-檀香醇、(Z)-β-檀香醇和(E)-β-檀香醇的存在(Pino等,J.Essent.Oil Res.,2006,18,139-141)。令人惊讶地,对源自泰国产地的黄皮的不同部分进行分析,显示不存在具有檀香烷骨架的倍半萜(Chokeprasert等,Journal of Food Composition and Analysis,2007,20(1),52-56)。
[0008] 在国际专利申请WO2006/134523中公开了一种能够合成至少一种双环和/或三环的具有檀香烷碳骨架的倍半萜的倍半萜合酶、相应的核酸和一种上述具有檀香烷碳骨架的化合物的制备方法。例举了(+)-表-β-檀香萜、(-)-β-檀香萜、(+)-β-檀香萜、(+)-α-檀香萜和(-)-α-檀香萜作为具有檀香烷碳骨架的化合物的实例。然而,在实施例中提供的倍半萜合酶不产生α-檀香萜。仅仅产生表-β-檀香萜。该化合物的性质与α-檀香萜的性质悬殊。特别是,在合成(Z)-(+)-α-檀香醇的过程中表-β-檀香萜不是重要的。此外,在WO2006/134523中公开的倍半萜合酶仅仅与本发明序列共有37%的同一性。
[0009] 在序列数据库中还发现了与本发明α-檀香萜合酶的序列具有一定百分比的序列同一性的萜合酶。然而,在已知的倍半萜合酶与本发明多肽之间的同一性的百分比是非常低的。与本发明(+)-α-檀香萜合酶最接近的蛋白质序列是来源于香橙(Citrus junos)的(E)-β-法呢烯合酶(NCBI检索号AAK54279;Maruyama等,Biol.Pharm.Bull.,2001,24(10),1171-1175),其与本发明的α-檀香萜合酶共有67~68%的氨基酸序列同一性。
[0010] 除序列本身之间的差异之外,还应指出的是,由上述酶合成的产物的结构和性质与α-檀香萜的结构和性质相差悬殊。特别是,(E)-β-法呢烯不适合作为合成作为香料领域中非常有效的成分的(Z)-(+)-α-檀香醇的原材料。
[0011] 在WO2008/142318中公开了α-檀香萜合酶。在本申请的优先权日期,该文献还没有公布。其描述了一种能够催化使Z,Z-法呢基焦磷酸酯转化成α-檀香萜的酶。因此,由现有技术的酶催化的反应不同于本发明合酶催化的由E,E-法呢基焦磷酸酯起始的反应。此外,本发明的α-檀香萜合酶与在WO2008/142318中描述的酶仅仅共有23.8%的序列同一性。
[0012] 尽管广泛研究了萜的环化,但是由于它们的低丰度、通常的瞬时表达模式和在其表达组织中从树脂和酚类化合物的混合物中纯化它们的复杂性的原因,萜合酶的分离和特征化仍然是困难的,尤其是在植物中。
[0013] 本发明的目的是,如上所指出的,提供以经济的方式生产(+)-α-檀香萜的方法。因此,本发明的目的是生产(+)-α-檀香萜,同时有极少的浪费的方法、其节约能源和资源并同时减少了对化石燃料的依赖性。本发明的另一目的是提供能够合成可用作香料和/或芳香成分的α-檀香萜的酶。
[0014] 使用的缩写
[0015] Bp             基对
[0016] Kb             千碱基
[0017] BSA            血清清蛋白
[0018] DMAPP          二甲基烯丙基焦磷酸酯
[0019] DNA            脱核糖核酸
[0020] cDNA           互补DNA
[0021] dT             脱氧胸腺嘧啶
[0022] dNTP           脱氧核苷三磷酸
[0023] DTT            二硫苏糖醇
[0024] FPP            法呢基焦磷酸酯
[0025] GC             气相色谱
[0026] idi            异戊烯焦磷酸酯异构酶
[0027] IPP            异戊烯焦磷酸酯
[0028] IPTG           异丙基-D-硫代半乳糖苷
[0029] LB             溶菌肉汤
[0030] MOPSO          3-(N-吗啉代)-2-羟基丙烷磺酸
[0031] MS             质谱
[0032] mvaK1          甲羟戊酸激酶
[0033] mvaK2          甲羟戊酸焦磷酸酯激酶
[0034] PCR            聚合酶链式反应
[0035] RMCE           重组酶介导的盒式交换
[0036] 3’-/5’-RACE   3’和5’cDNA末端快速扩增
[0037] RNA            核糖核酸
[0038] mRNA           信使核糖核酸

发明内容

[0039] 本发明提供一种以经济、可靠并且是可再现的方式通过生物合成来生产α-檀香萜的方法。
[0040] 在这里“倍半萜合酶”或“具有倍半萜合酶活性的多肽”是指能够催化从无环萜前体FPP合成倍半萜分子或倍半萜分子混合物的多肽。
[0041] 对于“α-檀香萜合酶”或“具有α-檀香萜合酶活性的多肽”,此处我们是指能够催化从FPP开始合成任何立体异构体或其混合物形式的α-檀香萜的多肽。α-檀香萜可以是唯一的产物或可以是倍半萜混合物的一部分。
[0042] 对于“(+)-α-檀香萜合酶”或“具有(+)-α-檀香萜合酶活性的多肽”,此处我们是指能够催化从FPP开始合成(+)-α-檀香萜的多肽。(+)-α-檀香萜可以是唯一的产物或可以是倍半萜混合物的一部分。该(+)-α-檀香萜合酶是α-檀香萜合酶的特定实例。
[0043] 多肽催化合成特定倍半萜(例如(+)-α-檀香萜)的能可以简单地通过进行如实施例4所详述的酶活性测定来确认。
[0044] 根据发明的优选方案,FPP为(2E,6E)-FPP的形式。
[0045] 根据本发明,多肽也意味着包括截短的多肽,条件是它们能够保持如任何上述实施方案所定义的倍半萜合酶活性,而且它们与SEQ ID NO:1的相应片段共有至少规定百分数的同一性。
[0046] 如本文以下所指出的,“通过修饰SEQ ID NO:2而获得的核苷酸序列”包含已经通过使用本领域公知的任何方法(例如通过引入任何类型的突变如缺失、插入或取代的突变)改变SEQ ID NO:2序列所获得的任何序列。在与变体多肽及其制备方法有关的描述部分列举了上述方法的实例。
[0047] 在两个肽或核苷酸序列之间的同一性百分比是在已经生成的这两个序列的比对时,在这两个序列中相同的氨基酸或核苷酸残基数目的函数。相同的残基定义为在这两个序列中在给定的比对位置上相同的残基。在此处使用的序列同一性的百分比是由最优比对,通过将在两个序列之间的相同残基的数目除以在最短的序列中的残基的总数然后乘以100而计算得到的。该最佳比对是同一性百分比可能是最高的比对。在该比对的一个或多个位置中的一或两个序列中引入间隙以便获得最佳比对。然后在序列同一性的百分比计算中将这些间隙作为不相同的残基来考虑。
[0048] 以测定氨基酸或核酸序列同一性百分比为目的的比对可以使用计算机程序以多种方式来实现,例如在万维网上可获得的公开可用的计算机程序。优选,可使用来自National Center for Biotechnology Information(NCBI)的地址为http://www.ncbi.nlm.nih.gov/BLAST/bl2seq/wblast2.cgi的BLAST程序(Tatiana等,FEMS Microbiol Lett.,1999,174:247-250,1999),其参数设为默认,来获得肽或核苷酸序列的最优比对,以及来计算序列同一性的百分比。
[0049] 因此,本发明的一个目的提供一种生产α-檀香萜的方法,其包括:
[0050] a)使FPP与至少一种具有α-檀香萜合酶活性的多肽接触,该多肽包含与SEQ ID NO:1有至少50%同一性的氨基酸序列;
[0051] b)非强制选择地,分离在步骤a)中产生的α-檀香萜。
[0052] 根据优选实施方案,该方法是生产α-檀香萜作为主要产物的方法。根据一个更加优选的实施方案,α-檀香萜占由本发明方法生产的产物的至少60%、优选至少80%、优选至少90%、优选至少92%。
[0053] 根据一更优选的实施方案,该方法是生产(+)-α-檀香萜的方法,并且具有α-檀香萜合酶活性的多肽具有(+)-α-檀香萜合酶活性。
[0054] 根据又一更加优选的实施方案,该方法是生产(+)-α-檀香萜作为主要产物的方法。根据最优选的实施方案,(+)-α-檀香萜占由本发明方法生产的产物的至少60%、优选至少80%、优选至少90%、优选至少92%。
[0055] 如将在下文中所详述的,该方法可以在体外以及在体内进行。
[0056] 要与FPP在体外接触的多肽可以通过使用标准蛋白质或酶提取技术从表达它的任何生物体中提取来获得。如果宿主生物体是将本发明多肽释放到培养基内的单细胞生物或细胞,可以简单地从该培养基内收集该多肽,例如通过离心法、非强制选择地随后进行洗涤步骤和在适合的缓冲溶液中再悬浮。如果该生物体或细胞将该多肽聚集在它的细胞之内,该多肽可以通过分裂或溶解该细胞并进一步自该细胞溶解产物提取该多肽来获得。
[0057] 然后可以将具有α-檀香萜合酶活性的多肽(以分离形式或与其它蛋白质一起,例如以从培养细胞或微生物中获得的粗蛋白提取物的方式)悬浮在最佳pH下的缓冲溶液中。如果适当,可以添加盐、BSA及其他种类的酶的辅助因子以便优化酶活性。适当的条件将在下文的实施例中更详细地描述。
[0058] 然后可以将前体FPP添加到该悬浮液或溶液中,然后将其在最佳的温度下培养,例如在15和40°C之间、优选在25和35°C之间、更优选在30°C下。在培养之后,可以通过标准分离工序如溶剂萃取和蒸馏将产生的α-檀香萜从该培养的溶液中分离出来,非强制选择地在自该溶液去除多肽之后。
[0059] 根据另一个优选方案,任何上述实施方案中的方法是在体内进行的。在这种情况下,步骤a)包括在有利于生产α-檀香萜的条件下培养能够生产FPP并且经转化以表达至少一种多肽的非人宿主生物体或细胞,其中该多肽包含与SEQ ID NO:1有至少50%同一性的氨基酸序列并且具有α-檀香萜合酶活性。
[0060] 根据更优选的实施方案,该方法在步骤a)之前还包括用编码多肽的至少一种核酸将能够生产FPP的非人生物体或细胞转化以使所述生物体表达所述多肽,该编码多肽的核酸包含与SEQ ID NO:1有至少50%同一性的氨基酸序列并且具有α-檀香萜合酶活性。
[0061] 本发明的这些实施方案是特别有益的,因为有可能在体内进行该方法,无需预先分离该多肽。在经转化以表达所述多肽的生物体或细胞之内直接发生该反应。
[0062] 根据本发明特定的实施方案,至少一种编码α-檀香萜合酶的核酸包括与SEQ ID NO:2或其互补序列有至少50%、优选至少55%、优选至少60%、优选至少65%、优选至少70%、优选至少75%、优选至少80%、优选至少85%、优选至少90%、更优选至少95%和更加优选至少98%同一性的核苷酸序列。根据更优选的实施方案,所述核酸包括核苷酸序列SEQ ID NO:2或其互补序列。在更加优选的实施方案中,所述核酸由SEQ ID NO:2或其互补序列组成。
[0063] 根据一更优选的实施方案,在任何上述实施方案中所使用的至少一种核酸包括已经通过修饰SEQ ID NO:2获得的核苷酸序列。根据更加优选的实施方案,所述至少一种核酸由已经通过修饰SEQ ID NO:2获得的核苷酸序列组成。
[0064] 根据另一个实施方案,至少一种核酸是从黄皮中分离的。
[0065] 该生物体或细胞是指“表达”多肽,条件是该生物体或细胞被转化以包藏编码所述多肽的核酸,该核酸被转录成mRNA并且在该宿主生物体或细胞中发现该多肽。术语“表达”包含“异源表达”和“过表达”,后者是指mRNA、多肽和/或酶活性的平超过在非转化生物体或细胞内测量得到的水平。随后在致力于将上述转化的非人宿主生物体或细胞作为本发明特定目的的说明书部分和实施例中对转化非人宿主生物体或细胞的适合方法作更详细地描述。
[0066] 特定的生物体或细胞,当其天然产生FPP时,或当其并不天然产生FPP但可经转化以产生FPP时,不管是用描述于此的核酸转化之前还是与所述核酸一起都意味着“能够产生FPP”。经转化的与天然存在的生物体或细胞相比产生更高量FPP的生物体或细胞也包括在“能够产生FPP的生物体或细胞”内。转化生物体(例如微生物)以便它们产生FPP的方法已经是本领域公知的。这些方法可以例如在文献中找到,例如在下列出版物中:Martin,V.J.,Pitera,D.J.,Withers,S.T.,Newman,J.D.和Keasling,J.D.Nat Biotechnol.,2003,21(7),796-802(大肠杆菌的转化);Wu,S.,Schalk,M.,Clark,A.,Miles,R.B.,Coates,R.和Chappell,J.,Nat Biotechnol.,2006,24(11),1441-1447(植物的转化);Takahashi,S.,Yeo,Y.,Greenhagen,B.T.,McMullin,T.,Song,L.,Maurina-Brunker,J.,Rosson,R.,Noel,J.,Chappell,J,Biotechnology and Bioengineering,2007,97(1),170-181(酵母的转化)。
[0067] 为了在体内进行本发明,在有利于生产α-檀香萜的条件下培养宿主生物体或细胞。因此,如果该宿主是转基因植物,则提供最佳的生长条件,例如,如最佳的光、水和营养条件。如果该宿主是单细胞生物,有利于生产α-檀香萜的条件可以包括在宿主的培养基内添加适合的辅助因子。另外,可以选择培养基,以便最佳化α-檀香萜的合成。在下列实施例中更详细地描述了最佳的培养条件。
[0068] 适合于在体内进行本发明方法的非人宿主生物体可以是任何非人的多细胞或单细胞生物体。在优选的实施方案中,用于在体内进行本发明的非人宿主生物体是植物、原核生物或真菌。可以使用任何植物、原核生物或真菌。特别地,可使用的植物是天然产生高数量萜的植物。在更优选的方案中,该植物选自茄科(Solanaceae)、禾本科(Poaceae)、十字花科(Brassicaceae)、碟形花科(Fabaceae)、锦葵科(Malvaceae)、菊科(Asteraceae)或唇形科(Lamiaceae)。例如,该植物选自烟草属(Nicotiana)、茄属(Solanum)、高粱属(Sorghum)、拟南芥属(Arabidopsis)、芸苔属(Brassica(油菜))、苜蓿属(Medicago(紫花)苜蓿)、属(Gossypium(棉花))、蒿属(Artemisia)、鼠尾草属(Salvia)和薄荷属(Mentha)。优选,该植物属于烟草(Nicotiana tabacum)种。
[0069] 在更优选的实施方案中,用于在体内进行本发明方法的非人宿主生物体是微生物。可以使用任何微生物,但是根据更加优选的实施方案,所述微生物是细菌或酵母。最优选,所述细菌是大肠杆菌(E.coli),所述酵母是酿酒酵母(Saccharomyces cerevisiae)。
[0070] 这些生物体中的一些天然不会产生FPP。为了适于进行本发明的方法,必须将这些生物体转化以产生所述前体。如以上所述,它们可以用上述任何实施方案描述的用核酸修饰之前或者同时,
[0071] 可以将它们如是转化。
[0072] 还可以使用分离的高等真核细胞代替完整生物体作为宿主以便在体内实施本发明的方法。适合的真核细胞可以是任何非人的细胞,但是优选是植物细胞或真菌细胞。
[0073] 根据一个优选实施方案,具有α-檀香萜合酶活性并在上述任何实施方案中使用的至少一种多肽或由用于任何上述实施方案中的核酸编码的至少一种多肽包括与SEQ ID NO:1有至少55%、优选至少60%、优选至少65%、优选至少70%、优选至少75%、优选至少80%、优选至少85%、优选至少90%、更优选至少95%和更加优选至少98%同一性的氨基酸序列。根据更优选的实施方案,所述多肽包括氨基酸序列SEQ ID NO:1。在更加优选的实施方案中,所述多肽由SEQ ID NO:1组成。
[0074] 根据另一个优选实施方案,具有α-檀香萜合酶活性并在上述任何实施方案中使用的至少一种多肽或由用于上述任何实施方案的核酸编码的至少一种多肽包括由遗传工程获得的SEQ ID NO:1的变体氨基酸序列。在其它形式中,所述多肽包括由已经通过修饰SEQ ID NO:2获得的核苷酸序列编码的氨基酸序列。根据一个更优选的实施方案,具有α-檀香萜合酶活性并在上述任何实施方案中使用的至少一种多肽或由用于上述任何实施方案的核酸编码的至少一种多肽由这样一种氨基酸序列组成,该氨基酸序列是由遗传工程获得的SEQ ID NO:1的变体,即由已经通过修饰SEQ ID NO:2获得的核苷酸序列编码的氨基酸序列。
[0075] 在此处所使用的多肽指的是包含于此处标明的氨基酸序列的多肽或肽片段、以及截短的或变体多肽,条件是它们保持如以上定义的活性,而且它们与相应的SEQ ID NO:1片段共有至少所定义的百分比的同一性。
[0076] 变体多肽的实例是由选择性mRNA剪接或如此处所述形成多肽蛋白酶剪切而得到的天然存在的蛋白质。可归因于蛋白水解的变体包括,例如,当在不同类型的宿主细胞中表达时,由于从本发明多肽上蛋白水解移除一个或多个末端氨基酸而导致在N-或C-末端的差异。本发明也包含如其后所描述的用由本发明核酸的天然或人工突变而获得的核酸编码的多肽。
[0077] 由在氨基和羧基末端融合另外的肽序列而产生的多肽变体也可用于本发明的方法。尤其是这样的融合可以提高多肽的表达,在期望的环境或表达系统中利于蛋白质的提纯或多肽酶活性的改善。这种另外的肽序列可以例如是信号肽。因此,本发明包含使用变体多肽的方法,例如通过与其它寡肽或多肽融合而获得的多肽和/或与信号肽连接的多肽。在本发明的方法中有利地还可以使用由与另外的功能蛋白(例如来源于萜生物合成路径的另外的蛋白质)融合而产生的多肽。
[0078] 根据另外的实施方案,具有α-檀香萜合酶活性并在上述任何实施方案中使用的至少一种多肽或由用于任何上述实施方案的核酸编码的至少一种多肽是从黄皮中分离的。
[0079] 进行本发明方法的重要手段是该多肽本身。因此,具有α-檀香萜合酶活性且包含与SEQ ID NO:1有至少50%同一性的氨基酸序列的多肽是本发明的另一个目的。
[0080] 根据优选的实施方案,该多肽能够产生α-檀香萜作为主要产物。根据一更加优选的实施方案,其能够产生倍半萜的混合物,其中α-檀香萜占所产生倍半萜的至少60%、优选至少80%、优选至少90%、优选至少92%。
[0081] 根据更优选的实施方案,该多肽具有(+)-α-檀香萜合酶活性。
[0082] 根据更加优选的实施方案,该多肽能够产生(+)-α-檀香萜作为主要产物。根据更加优选的实施方案,其能够产生倍半萜的混合物,其中(+)-α-檀香萜占所产生倍半萜的至少60%、优选至少80%、优选至少90%、优选至少92%。
[0083] 根据优选的实施方案,该多肽包含与SEQ ID NO:1有至少55%、优选至少60%、优选至少65%、优选至少70%、优选至少75%、优选至少80%、优选至少85%、优选至少90%、更优选至少95%和更加优选至少98%同一性的氨基酸序列。根据更优选的实施方案,该多肽包含氨基酸序列SEQ ID NO:1。根据更加优选的实施方案,该多肽由SEQ ID NO:1组成。
[0084] 根据另一个优选实施方案,至少一种多肽包含氨基酸序列,其是由遗传工程获得的SEQ ID NO:1的变体。在其它形式中,所述多肽包含由已经通过修饰SEQ ID NO:2获得的核苷酸序列编码的氨基酸序列。根据更优选的实施方案,至少一种具有α-檀香萜合酶活性的多肽由这样一种氨基酸序列组成,该氨基酸序列是由遗传工程获得的SEQ ID NO:1的变体,即由已经通过修饰SEQ ID NO:2获得的核苷酸序列编码的氨基酸序列。
[0085] 根据另外的实施方案,该多肽是从黄皮中分离的。
[0086] 此处所使用的多肽指的是含有此处确定的氨基酸序列的多肽或肽片段、以及截短的或变体多肽,条件是它们保持如上定义的活性,而且它们与SEQ ID NO:1的相应片段有至少所定义百分比的同一性。
[0087] 变体多肽的实例是由选择性mRNA剪接或此处所述形成多肽蛋白酶剪切而得到的天然存在的蛋白质。可归因于蛋白水解的变体包括,例如,当在不同类型的宿主细胞中表达时,由于从本发明多肽上蛋白水解去移除一个或多个末端氨基酸而导致在N-或C-末端的差异。如其后所描述本发明还包含用由本发明核酸的天然或人工突变而获得的核酸编码的多肽。
[0088] 由另外的肽序列在氨基和羧基末端融合而产生的多肽变体也包含于本发明的多肽之中。尤其是这样的融合可以在期望的环境或表达系统中提高多肽的表达,利于蛋白质的提纯或多肽酶活性的改善。这种另外的肽序列可以例如为信号肽。因此,本发明包括本发明的多肽变体,例如通过与其它寡肽或多肽融合而获得的多肽变体和/或与信号肽连接的那些多肽变体。本发明的多肽还可以包括由与另外的功能蛋白(例如来源于萜生物合成路径的另外的蛋白质)融合而产生的多肽。
[0089] 如上所述,编码本发明多肽的核酸是修饰在体内进行该方法时意欲使用的非人宿主生物体或细胞的有效手段。
[0090] 因此,编码根据任何上述实施方案的多肽的核酸也是本发明的目的之一。
[0091] 根据优选的实施方案,该核酸包含与SEQ ID NO:2或其互补序列有至少50%、优选至少55%、优选至少60%、优选至少65%、优选至少70%、优选至少75%、优选至少80%、优选至少85%、优选至少90%、更优选至少95%和更加优选至少98%同一性的核苷酸序列。根据更优选的实施方案,该核酸包括核苷酸序列SEQ ID NO:2或其互补序列。根据更加优选的实施方案,该核酸由SEQ ID NO:2或其互补序列组成。
[0092] 根据另外的实施方案,该核酸是从黄皮中分离的。
[0093] 本发明的核酸可以定义为包括单链或双链形式的脱氧核糖核苷酸或核糖核苷酸聚合物(DNA和/或RNA)。术语“核苷酸序列”也应该被理解为包括分离片段形式或作为较大核酸组分的聚核苷酸分子或寡核苷酸分子。本发明的核酸还包含某些分离的核苷酸序列,其包括基本上不污染内源材料的那些核苷酸序列。本发明的核酸可以是截短的,条件是其编码本发明包含的如上所述的多肽。
[0094] 根据更优选的实施方案,根据任何上述实施方案的至少一种核酸包含已经通过修饰SEQ ID NO:2获得的核苷酸序列。优选所述核酸由已经通过修饰SEQ ID NO:2获得的核苷酸序列组成。
[0095] 包含由SEQ ID NO:2或其互补序列突变而获得的序列的核酸也包括在本发明之内,条件是该序列与SEQ ID NO:2的相应片段或与其互补序列有至少所定义百分比的同一性,并且它们编码如上任何实施方案所定义的具有α-檀香萜合酶活性的多肽。突变可以是这些核酸任何种类的突变,如点突变、缺失突变、插入突变和/或阅读框移位突变。可以制备变体核酸以便使其核苷酸序列适应特异性表达系统。例如,已知细菌的表达系统在由优选的密码子编码氨基酸时更有效地表达多肽。由于该遗传密码的简并性,其中多于一个的密码子可以编码相同的氨基酸,多个DNA序列可以编码相同的多肽,本发明包含所有这些DNA序列。
[0096] 另一个用于转化适于在体内实施本发明方法的宿主生物体或细胞的重要工具是包括本发明任何实施方案的核酸的表达载体。因此这种载体也是本发明的目的之一。
[0097] 如此处所使用的“表达载体”包括任何直线的或环状的重组载体,其包括但不限于病毒载体、噬菌体和质粒。技术人员能够根据表达系统选择适合的载体。在一个实施方案中,该表达载体包括本发明的核酸,其可操作地连接到至少一种控制转录、翻译、开始和终止的调节序列,如转录的启动子、操纵子或增强子,或mRNA核糖体的结合部位,并且非强制选择地包括至少一种选择标记。当该调节序列功能上与本发明的核酸相关时,该核苷酸序列是“可操作地连接的”。
[0098] 本发明的表达载体可在如下进一步公开的用于在包藏本发明核酸的宿主生物体和/或细胞中制备遗传转化的宿主生物体和/或细胞的方法和生产或制造具有α-檀香萜合酶活性的多肽的方法中使用。
[0099] 经转化以包藏本发明至少一种核酸以便使其异源表达或过表达本发明至少一种多肽的重组非人宿主生物体和细胞也是实施本发明方法的十分有用的手段。因此,这种非人宿主生物体和细胞是本发明的另一个目的。
[0100] 根据任何上述实施方案的核酸可用于转化该非人宿主生物体和细胞并且所表达的多肽可以是任何上述的多肽。
[0101] 本发明的非人宿主生物体可以是任何非人的多细胞或单细胞生物体。在优选的实施方案中,该非人宿主生物体是植物、原核生物或真菌。根据本发明任何植物、原核生物或真菌是适合于转化的。特别有用的植物是天然产生高数量萜的植物。在更优选的实施方案中,该植物选自茄科、禾本科、十字花科、蝶形花科、锦葵科、菊科或唇形科类。例如,该植物选自烟草属、茄属、高粱属、拟南芥属、芸苔属(油菜)、苜蓿属(紫花苜蓿)、棉属(棉花)、蒿属、鼠尾草属和薄荷属。优选地,该植物属于烟草种。
[0102] 在更优选的实施方案中,该非人宿主生物体是微生物。任何微生物都适合于本发明,但是根据更加优选的实施方案,所述微生物是细菌或酵母。最优选,所述细菌是大肠杆菌,而所述酵母是酿酒酵母。
[0103] 还可以将分离的高等真核细胞转化以代替完整的生物体。作为高等真核细胞,这里我们是指任何除酵母细胞之外的非人真核细胞。优选的高等真核细胞是植物细胞或真菌细胞。
[0104] 术语“经转化”是指宿主经过遗传工程以便使其含有上述任何实施方案中所需要的每个核酸的一个、两个或更多个拷贝。优选地,术语“经转化”涉及异源表达由该核酸编码的多肽(该多肽使用所述核酸转化)以及过表达所述多肽的宿主。因此,在实施方案中,本发明提供了经转化的生物体,其中该多肽的表达量高于未经如此转化的相同生物体的表达量。
[0105] 现有技术中已知有多种方法用于生成转基因宿主生物体或细胞,如植物、真菌、原核生物或高等真核生物体的细胞培养物。适用于细菌、真菌、酵母、植物和哺乳动物细胞宿主的克隆和表达载体的描述参见,例如,Pouwels等的Cloning Vectors:A Laboratory Manual,1985,Elsevier,New York和Sambrook等的Molecular Cloning:A Laboratory Manual,第二版,1989,Cold Spring Harbor Laboratory Press。尤其用于高等植物和/或植物细胞的克隆和表达载体是技术人员可以得到的。参见例如Schardl等的Gene61:1-11,1987。
[0106] 转化宿主生物体或细胞以使其包藏转基因核酸的方法为技术人员所熟知。对于生产转基因植物,例如通用的方法包括:植物原生质体的电穿孔法、脂质体介导的转化法、土壤杆菌介导的转化法、聚乙二醇介导的转化法、粒子轰击法、植物细胞的显微注射法和应用病毒的转化法。
[0107] 在一个实施方案中,转化的DNA被整合到非人宿主生物体和/或细胞的染色体中,从而得到稳定的重组体系统。现有技术中任何公知的染色体整合方法可以应用于本发明的实践中,包括但不限定为重组酶介导的盒式交换(RMCE),病毒位点特异性染色体插入法,腺病毒法和核内注射法。
[0108] 为了实施如上所述在体外生产α-檀香萜的方法,提供一种制备如本发明任何实施方案所述的至少一种具有α-檀香萜合酶活性的多肽的方法是非常有利的。因此,本发明提供一种根据本发明任何实施方案的至少一种多肽的生产方法,该方法包括:
[0109] a)培养用本发明表达载体转化的非人宿主生物体或细胞,以便使其包藏本发明的核酸并且表达或过表达本发明的多肽;
[0110] b)从在步骤a)中培养的非人宿主生物体或细胞中分离该多肽。
[0111] 根据优选实施方案,在步骤a)之前,所述方法还包括用本发明的表达载体转化非人宿主生物体或细胞,以便使其包藏本发明的核酸并且表达或过表达本发明的多肽;
[0112] 可以使用根据任何上述实施方案的核酸。
[0113] 对于在体内生产α-檀香萜的方法,可以如上所述来实施该非人宿主生物体或细胞的转化和培养。可使用本领域公知的自生物体或细胞中分离特定多肽的任何技术来实施步骤b)。
[0114] “多肽变体”这里指的是这样一种多肽,其具有α-檀香萜合酶活性且基本上与根据任何上述实施方案的多肽同源,但是其具有的氨基酸序列因为一处或多处缺失、插入或取代而不同于由本发明任一核酸所编码的氨基酸序列。
[0115] 变体可以包括保守取代序列,意味着某一特定氨基酸残基被一具有类似理化特性的残基所取代。保守取代的实例包括:用一个脂肪族残基取代另一个脂肪族残基,例如,Ile、Val、Leu或Ala之间相互取代;或者用一个极性残基取代另一个极性残基,例如在Lys和Arg之间、Glu和Asp之间或Gln和Asn之间相互取代。参见Zubay,Biochemistry,1983,Addison-Wesley Pub.Co.。这类取代的效果可以用取代打分矩阵,如Altschul,J.Mol.Biol.,1991,219,555-565中所述的PAM-120、PAM-200和PAM-250来计算。其他这类保守取代,例如具有近似疏水特性的完整区域的取代,已为本领域熟知。
[0116] 天然生成的肽变体也包含在本发明范围之内。这种变体的实例是由于选择性mRNA剪接或者本文所述多肽的蛋白酶剪切而得到的蛋白质。蛋白水解引起的变体包括,例如,在不同类型宿主细胞中表达时,由本发明序列编码的多肽由于蛋白水解移除了一个或多个末端氨基酸而导致N-或C-末端的差异。
[0117] 本发明多肽的变体可以用于获得例如酶活性期望的增强或减弱、区域化学(regiochemistry)或立体化学的修饰、或者底物利用或者产物分配的改变、对于底物的亲和力的增加、一种或多种想得到化合物的产量的改进的特异性、酶反应速率的增加、在特定环境(pH、温度、溶剂等等)中的更高活性或稳定性、或者在想要的表达系统中的改进的表达水平。变体或定位突变体可以通过现有技术已知的任何方法来生成。天然多肽的变体和衍生物能够通过分离其它或相同植物品系或物种的天然产生的变体或者变体的核苷酸序列来获得,或者通过对编码本发明多肽的核苷酸序列进行人工规划突变来获得。天然氨基酸序列的改变可通过多种传统方法中的任一种完成。
[0118] 由附加肽序列在本发明多肽的氨基和羧基末端融合产生的多肽变体可被用于增强多肽的表达,在期望的环境或表达系统中利于蛋白的纯化或提高多肽的酶活性。这种附加肽序列例如可为信号肽。因此,本发明包含本发明多肽的变体,例如通过与其它寡肽或多肽和/或连接到信号肽上的多肽融合获得的那些变体。包含在本发明范围内的融合多肽还包括由融合其它功能蛋白质如来自萜生物合成路径的其它蛋白质而产生的融合多肽。
[0119] 因此,在实施方案中,本发明提供一种如在上述任何实施方案中所述的具有α-檀香萜合酶活性的变体多肽的制备方法,该方法包括步骤:
[0120] (a)选择如上公开的任何实施方案的核酸;
[0121] (b)修饰所选择的核酸以获得至少一种突变核酸;
[0122] (c)用突变核酸序列转化宿主细胞或单细胞生物以表达用该突变核酸序列编码的多肽;
[0123] (d)按照至少一种修饰的性质筛选该多肽;和,
[0124] (e)非强制选择地,如果该多肽不具有期望的变体α-檀香萜合酶活性,则重复步骤(a)至(d)直到获得具有所期望的变体α-檀香萜合酶活性的多肽;
[0125] (f)非强制选择地,如果在步骤(d)中鉴别出具有所期望的变体α-檀香萜合酶活性的多肽,则分离在步骤(c)中获得的相应突变核酸。
[0126] 根据优选的实施方案,制备的变体多肽能够生产作为主要产物的α-檀香萜。根据更加优选的实施方案,其能够生产倍半萜的混合物,其中α-檀香萜占所生产倍半萜的至少60%、优选至少80%、优选至少90%、优选至少92%。
[0127] 根据更优选的实施方案,制备的变体多肽具有(+)-α-檀香萜合酶活性。
[0128] 根据更加优选的实施方案,该变体多肽能够生产(+)-α-檀香萜作为主要产物。根据更加优选的实施方案,其能够生产倍半萜的混合物,其中(+)-α-檀香萜占所生产倍半萜的至少60%、优选至少80%、优选至少90%、优选至少92%。
[0129] 在步骤(b)中,例如通过随机诱变,位点特异性诱变或DNA改组方法可生成大量的突变核酸序列。基因改组的详细的步骤可在Stemmer的DNA shuffling by random fragmentation and reassembly:in vitro recombination for molecular evolution.Proc Natl Acad Sci USA.,1994,91(22):10747-1075中发现。总之,DNA改组指的是已知序列在体外的随机重组的方法,其包括选择至少两种核酸用于重组。例如能够通过合成含有突变序列的寡聚核苷酸在特定位点引入突变,与能够连接到天然序列片段的限制性位点侧面相连。连接之后,得到的重构序列编码具有期望的氨基酸插入、置换或缺失的类似物。另外,可使用寡聚核苷酸-定位位点特异性诱变步骤以提供改变的基因,其中预先确定的密码子可通过置换、缺失或插入来改变。
[0130] 因此,包含SEQ ID NO:1的多肽可与任何其它编码核酸的倍半萜合酶例如从除黄皮之外的有机体中分离出来的倍半萜合酶进行重组。因此,可获得并分离出突变核酸,其可根据例如本实施例公开的标准步骤来转化宿主细胞。
[0131] 在步骤(d)中,对步骤(c)中获得的多肽进行至少一种修饰的特性例如期望改变的酶活性的筛选。对表达的多肽进行活性筛选所期望的酶活性的实例包括由KM或Vmax值度量的增强或减弱的酶活性、修饰的区域化学或立体化学、和改变的底物利用或产物分布。酶活性的筛选可根据本领域的技术人员熟知的步骤以及在本实施例中公开的步骤来实施。
[0132] 提供步骤(e)以重复步骤(a)~(d)的过程,优选其可平行操作。因此,通过生成大量的突变核酸,可同时用不同的突变核酸将多个宿主细胞转化,使较多数量的多肽进行随后的筛选。因此获得期望的多肽变体的机会随技术人员意愿增加。
[0133] 本申请中提及的所有出版物均以参照的方式并入于此,以公开并描述与所引用出版物有关的方法和/或材料。附图说明
[0134] 图1:从由黄皮文库的测序获得的倍半萜合酶片段而推断出的氨基酸序列,其与NCBI数据库编号为AAK54279的倍半萜合酶氨基酸序列比对。
[0135] 图2:从E,E-FPP中获得的产物分布图与Cont2-1、Cont2B_22、Cont2B_26和Cont2B_29重组体蛋白质的比较。该分析是通过GC-MS获得的,并且显示了总离子色谱图。
[0136] 图3:通过将从在12.63分钟保留时间下的峰值的质谱与α-檀香萜真实标准品的质谱来比较进行α-檀香萜的鉴定。

具体实施方式

[0137] 现在将通过下列实施例进一步详细地描述本发明。
[0138] 实施例1
[0139] 植物材料和cDNA文库构建
[0140] 黄皮(wampee)的种子是从位于中国海南省、特别是福山镇(澄迈县)和永兴镇(海口市)的农民获得的。使种子发芽并且在温室中培养该植物。
[0141] 收集新叶(1到2cm长)并且将其用于构建cDNA文库。使用来自Invitrogen(Carlsbad,CA)的ConcertTM植物RNA试剂从该叶中提取总RNA,根据制造商手册,使用2.0mRNA分离试剂盒(Invitrogen,Carlsbad,CA)通过oligodT-纤维素亲和层
析法对mRNA进行纯化。cDNA文库是由该mRNA并使用MarathonTMcDNA扩增试剂盒(Clontech,Mountain View,CA)而构建的。
[0142] 实施例2
[0143] 黄皮叶cDNA文库的大规模并行测序
[0144] 我们使用由Illumina(San Diego,California)开发的小DNA片段的大规模并行测序技术以获得由黄皮小叶制成的全部cDNA文库的序列信息。该测序技术采用了基于可逆终止的测序化学和由Solexa和Illumina(www.illumina.com)开发的簇生成工作站(Cluster Station)以及基因组测序仪。
[0145] 首先将该cDNA文库(1μg)加载在琼脂糖凝胶上并切除相当于在1.5和3Kb之间大小的条带,并将其洗提和用于测序。这种大小丰富的文库避免了用一些编码涉及主要新陈代谢(如例如核糖-1,5-二磷酸羧化酶)的蛋白质的cDNA稀释该文库,这些cDNA往往以高比例存在于由植物组织特别是绿色组织制成的文库中。编码倍半萜合酶的目标cDNA一般大小在1.8和2.5Kb之间,因而其被包括在大小丰富的文库内。
[0146] 该Ilumina技术和装备由Fasteris SA(日内瓦,瑞士)准备,并且由Fasteris SA进行DNA样品的制备和测序。使用基因组样品制备试剂盒(Illumina)处理该cDNA文库。简言之,通过雾化使DNA片段化,修补末端以产生平端,将接头连接至该DNA片段的末端上,并且通过PCR对接头修饰的DNA片段扩增。在用凝胶电泳控制该文库的质量后,在流动池上形成DNA簇,并且在簇生成工作站(Cluster Station)和基因组测序仪设备上进行测序反应。使用该技术能够获得具有至少35个碱基的190万个短序列(read)。
[0147] Edena软件(Dr David Hernandez,Genomic Research Laboratory,University of Geneva Hospitals,Geneva,Switzerland,未发表的结果)用来重新拼接邻近的序列。因为由于在测序过程的最后周期中较低的保真度而导致的可能的错失插入,因此首先从每个read中移除最后五个碱基。产生几组contig(邻近的序列)。对于每组,保留最小长度为50个碱基的contig。首先将软件参数设置成允许用25个碱基最小值重叠和严谨(100%)同一性或者不严谨(2个碱基错配)同一性下进行拼接。由此分别产生各为3634和3756个contig的两组。通过允许用18个碱基的最小值和非严谨重叠来拼接,从而产生了4540个contig的另一组。使用这些contig的序列用Blastx算法(Altschul等,J.Mol.Biol.215,403-410,1990;http://www.ncbi.nlm.nih.gov/blast/Blast.cgi)来在公众可用的蛋白质数据库中搜查与萜合酶的同源性。从这三组contig中选择14、15和14个contig。通过分析从黄皮cDNA文库中获得的序列,观察到与来自柑桔属物种的序列具有高的序列同源性,观测结果与黄皮和柑桔属物种(两者均属于芸香科)的动植物种类史的关系一致。由此,使用Eland软件(Illumina)以检索非拼接read与来自柑桔属的倍半萜合酶(NCBI数据库No.CQ813507,CQ813505,CQ813508,CQ813506)的DNA序列同一性。由该分析,选出了117个read。
[0148] 然后使用CAP程序(Huang,Genomics14(1),18-25,1992)对所选择的contig和read进行处理并且产生新的contig。在证实与倍半萜合酶具有序列同源性之后,保留长度为30~436个碱基的17个contig(参见SEQ ID NO:3~19)。将推导出的序列与柑桔属倍半萜合酶(香橙β-法呢烯合酶,NCBI数据库编号AAK54279)序列比对以便沿着倍半萜合酶序列的全长标准它们的相对位置并且评估存在的不同倍半萜cDNA的数目(图1)。从大概由不同的倍半萜合酶cDNA产生的19个contig中的6个中设计一组特定的寡聚核苷酸。
[0149] 实施例3
[0150] 全长倍半萜合酶cDNA的扩增
[0151] 从大规模并行测序(实施例2)推导出的倍半萜合酶特异性引物与cDNA接头引物一起用于3’/5’RACE型PCR扩增。使用如上在实施例1中制备的黄皮cDNA文库和2PolymerseMix(Clontech)根据MarathonTMcDNA扩增试剂盒规程(Clontech,Mountain View,CA)进行扩增。热循环条件如下:94℃下1分钟;94℃下1分钟和68℃下3分钟共32个循环;68℃下3分钟。
[0152] 使用FS2_cont2_F1引物(SEQ ID NO:20),获得1049bp的DNA序列。对从该扩增中获得的几个克隆序列进行分析,表明存在具有96%序列同一性的两个序列变体(Cont2_RACE_F1(SEQ ID NO:23)和Cont2_RACE_F2(SEQ ID NO:25))。这两个序列中的每一个与倍半萜合酶cDNA的3’端相对应且包含735bp的编码区。两条推导出的氨基酸序列(SEQ ID NO:24和SEQ ID NO:26)彼此具有92%的序列同一性。用引物FS2_cont2_R1(SEQ ID NO:21)扩增得到1101bp的片段(Cont2_RACE_R,SEQ ID NO:27)),其包含起始密码子并且编码与contig2对应的倍半萜的349个N-末端氨基酸。将来自3’RACE的两条序列(Cont2_RACE_F1和Cont2_RACE_F2,SEQ ID NO:23和SEQ ID NO:25)与来自5’RACE的序列(Cont2_RACE_R,SEQ ID NO:
27)进行比对,表明132个碱基重叠。在这个重叠区中,Cont2_RACE_F2和Cont2_RACE_R序列(SEQ ID NO:25和SEQ ID NO:27)几乎是相同的(仅一个碱基的差异),而在Cont2_RACE_F1与Cont2_RACE_R序列(SEQ ID NO:23和SEQ ID NO:27)之间观察到9个碱基的差异。因此,使用序列Cont2_RACE_F2(SEQ ID NO:25)和Cont2_RACE_R(SEQ ID NO:27)重组编码551个氨基酸的蛋白质(SEQ ID NO:29)的全长cDNA序列(Cont2_RACE_1,SEQ ID NO:28)。
[0153] 用FS2_Cont10_F引物(SEQ ID NO:22)获得了两条1342bp的序列(Cont10_RACE_Fa和Cont10_RACE_Fb,SEQ ID NO:30和SEQ ID NO:31),这两个序列显示出显著的差别(67bp,表示95%的DNA序列同一性)并暗示存在两个紧密相关的倍半萜合酶cDNA。这两个序列包含1135bp的编码区。令人感兴趣的是,Cont10_RACE_Fa序列(SEQ ID NO:30)与Cont2_RACE_F2序列(SEQ ID NO:25,在1Kb的比对上仅仅具有1个碱基的差异)具有99.9%的同一性,而Cont10_RACE_Fb序列(SEQ ID NO:31)与Cont2_RACE_F1序列(SEQ ID NO:23,在1Kb的比对上仅仅具有8个碱基的差异)具有99%的同一性,因此这暗示用Cont2和Cont10引物对两个相关的序列进行扩增的DNA片段没有真正的区别。为了同时扩增这两个或更多个相应的全长cDNA,设计了两个引物(Cont2_start(SEQ ID NO:32)和Cont2_stop(SEQ ID NO:33)),这两个引物特异性针对来自cont2和cont10片段的5’RACE和3’RACE的序列的起始和终止密码子的区域。用CACC序列将引物Cont2_start(SEQ ID NO:32)延长以便使其同向插入pET101/D-TOPO质粒(Invitrogen)内。首先使用 2Polymerase Mix(Clontech)进行扩增。
每个PCR混合物以50μL的总体积计包含5μL的 2PCR缓冲剂,200μL的dNTP,每个寡聚核苷酸引物200nM,5μL的100倍稀释的cDNA和1μL的 2Polymerase Mix。
热循环条件如下:95℃下2分钟;95℃下30秒、60℃下30秒和72℃下4分钟共35个循环;72℃下10分钟。然后使用5μl来自第一轮扩增的纯化PCR产物并且使用Pfu DNA聚合酶(Promega)进行第二轮扩增,其中Pfu DNA聚合酶,以50μl的最终体积计,包含5μl的Pfu DNA聚合酶10X缓冲剂,200μM的各dNTP,正反向引物各0.4μM,2.9单位的Pfu DNA聚合酶。热循环条件与第一轮使用的条件相同。按照制造商的手册(Invitrogen)将纯化的PCR产物连接到pET1001/D-TOPO载体内。选择几个克隆系并且在对插入物测序之后,观察到序列的一些变体。选择以下克隆系:Cont2-1(SEQ ID NO:2)、Cont2B_22(SEQ IDNO:38)、Cont2B_26(SEQ ID NO:39)和Cont2B_29(SEQ IDNO:40)。在SEQ ID NO:1和SEQ ID NO:41~43中分别提供了用这些克隆系编码的蛋白质序列。
[0154] 实施例4
[0155] 重组体倍半萜合酶的异源表达和酶活性
[0156] 将如实施例3所述制备的带有Cont2_1(SEQ ID NO:2)、Cont2B_22(SEQ ID NO:38)、Cont2B_26(SEQ ID NO:39)和Cont2B_29(SEQ ID NO:40)的质粒pET101转化到Bl21(DE3)大肠杆菌细胞中。使用经转化细胞的单一菌落来接种5ml LB培养基。在37℃下培养5到6小时之后,将培养物转移到20℃的恒温箱内并且放置1小时以达到平衡。然后通过添加
1mM IPTG引发蛋白质的表达并将培养物在20℃下培养过夜。第二天,通过离心法收集细胞,并将其在以0.1体积计的50mM的MOPSO pH7、10%甘油、1mM DTT中再悬浮并由超声处理使细胞溶解。通过离心法澄清该提取物(以20,000g进行30min),并且将包含可溶解蛋白质的上清液用于进一步的实验。
[0157] 使用粗蛋白提取物评估酶活性。在聚四氟乙烯密封的玻璃管内使用50至100μl的蛋白质提取物在以1ml最终体积的50mMMOPSO pH7、补充有1mM DTT、20mM MgCl2和50至200μM纯化的E,E-法呢基焦磷酸酯(FPP)(如由Keller和Thompson的J.Chromatogr645(1),161-167,1993所述制备的)的10%甘油中进行酶的测定。将该管在30℃下培养18至24小时并且用
1体积的戊烷萃取酶产物两次。在氮回流下浓缩之后,用GC分析萃取物并且通过GC-MS根据保留指数与真实标准质谱的一致性证实产物的同一性。在配备有火焰电离检测器的Hewlett-Packard6890系列GC系统上使用0.25mm内径的30m SPB-1毛细管柱(Supelco,Bellefonte,PA)进行GC-MS分析。载气是1.5ml/min恒流的He。最初炉温是80℃,随后以10℃/min的梯度增至280℃。用2200V的电子倍增器电压记录在70eV的光谱
[0158] 该测定显示作为主要产物的(+)-α-檀香萜(占所产生的总倍半萜的92.7%)和微量的五种附加倍半萜的形成,该附加倍半萜占酶产物的量为4.8至0.95%。用GC-MS分析根据质谱和保留指数公布值(Joulain,D.,and W.A.The Atlas of Spectral Data of Sesquiterpene Hydrocarbons,EB Verlag,Hamburg,1998)的一致性来鉴定(+)-α-檀香萜。(+)-α-檀香萜的鉴定进一步通过1H NMR、13C NMR和旋光性的测量来确认。为了产生对于这些测量而言足够的量,将如上所述的酶测定的体系增大至1L。用等体积的戊烷提取该酶产物、将其浓缩,以及通过在短胶柱上过滤来纯化该倍半萜烃类馏分(5.5mg)。在图2中提供了用Cont2_1得到的光谱数据。
[0159] 在Bruker-Avance-500光谱仪上记录NMR光谱。NMR数据如下:
[0160] 1H NMR(500.13MHz,CDCl3):δ0.82(s,2H),0.83(s,3H),0.99(s,3H),1.00-1.08(m,2H),1.08-1.26(m,2H),1.57-1.63(m,6H),1.68(s,3H),5.12(t×q,J=7.2,1.4Hz,1H)[0161] 13C NMR(125.76MHz,CDCl3):δ10.7(q),17.5(q),19.6(d),23.3(t),25.7(q),27.4(s),31.0(t),31.5(t),34.6(t),38.2(d),45.9(s),125.5(d),130.8(s);
[0162] 通过测量旋光性(在Perkin-elmer241旋光计上所测量的),已经证明产生了(+)-α-檀香萜立体异构体的事实:
[0163]
[0164] 实施例5
[0165] (+)-α-檀香萜在大肠杆菌中的体内生产
[0166] 通过共表达倍半萜合酶与FPP合酶和允许甲羟戊酸转化成FPP的四步生物合成路径的酶来评估黄皮檀香萜合酶在大肠杆菌细胞中体内生产倍半萜的应用。甲戊二羟酸路径基因以单一操纵子调控并且编码甲羟戊酸激酶(mvaK1)、磷酸甲羟戊酸激酶(mvaK2)、甲羟戊酸焦磷酸酯脱羧酶(MvaD)和异戊烯焦磷酸酯异构酶(idi),所有的酶使外源的甲羟戊酸转换成异戊烯焦磷酸酯(IPP)和二甲基丙烯基焦磷酸酯(DMAPP),这是FPP合酶的两个底物。这种部分的甲戊二羟酸路径的共表达用来增加可用于倍半萜合酶的胞内FPP的数值并且由此产生大量的倍半萜。
[0167] 使用引物FPPy_NcoI(SEQ ID NO:34)和FPPy-Eco(SEQ ID NO:35)自酿酒酵母(S.cerevisiae)基因组DNA扩增出酵母FPP合酶基因(编号J05091)。使用Qiagen RNA/DNA Maxi Kit(Qiagen AG,Basel,瑞士)从酿酒酵母中分离该基因组DNA。用Pfu DNA聚合酶(Promega AG,Dubendorf,瑞士)进行PCR,其最终体积为50μl,包含0.4μl的每一引物、200μm的dNTP、0.5μl的DNA聚合酶、5μl的酿酒酵母基因组DNA。该PCR循环条件如下:95℃下90秒;95℃下45秒、54℃下30秒和72℃下4分钟共28个循环;72℃下10分钟。将扩增的DNA作为NdeI-EcoRI片段连接至pACYCDuet-1质粒(Novagen,Madison,WI)的第一多克隆位点(MCS1)中,以便在T7启动子的控制下提供包藏FPP基因的质粒pACYCDuet-FPP。
[0168] 自炎链球菌(Streptococcus pneumoniae)(ATCC BAA-334,LGC标准品,Molsheim,法国)用引物MVA-up1-start(SEQ ID NO:36)和MVA-up2-stop(SEQ ID NO:37)扩增包含编码mvaK1、mvaK2、MvaD和idi的基因的操纵子。使用PfuUltraTMII Fusion HSDNA聚合酶(Stratagene,Agilent Technologies Inc.,Santa Clara,CA,USA)进行PCR。根据制造商手册来组成PCR混合物。热循环条件是95℃下2分钟;95°C下20秒、58℃下20秒和72℃下90秒共30个循环;72℃下3分钟。在琼脂糖凝胶上纯化该3.8Kb片段并且使用In-FusionTMDry-Down PCR克隆试剂盒(Clontech实验室)将其连接至用NdeI和XhoI消化后的pACYCDuet-FPPs质粒的第二MCS内,从而获得质粒pACYCDuet-4506。对这两个插入物的序列进行完整测序以排除任何突变。
[0169] 用如实施例3所述制备的质粒pET101-cont2_1(SEQ ID NO:2)和质粒pACYCDuet-TM4506来转化BL21Star (DE3)大肠杆菌细胞(Invitrogen,Carlsbad,CA)。在羧苄青霉素(50μg/ml)和氯霉素(34μg/ml)LB-琼脂板上对转化后的细胞进行选择。使用单一的菌落来接种补充有相同抗生素的5mL液体LB培养基。将该培养物在37℃下培养过夜。第二天将补充有相同抗生素的2ml TB培养基用0.2mL过夜培养物接种。在37℃下培养6小时后,将该培养物冷却至28℃并且向每个管内添加1mM IPTG、2mg/mL甲羟戊酸(通过将1g/mL浓度的甲羟戊酸内酯(Sigma)溶于0.5N NaOH中并在37℃下将该溶液培养30min而制备的)和0.2ml癸烷。将该培养物在28℃下培养48小时。然后用2体积的乙酸乙酯萃取该培养物两次,将有机相浓缩至
500μl并且如实施例4所述用GC-MS对其进行分析。在这些条件下,该细胞在48小时内以
250mg/L培养物的形式产生了(+)-α-檀香萜。
[0170] 该实施例表明,用如本发明所定义的α-檀香萜合酶转化的大肠杆菌细胞能够生产α-檀香萜。用来转化大肠杆菌细胞的其它酶对生产α-檀香萜来说不是必要的。实际上当仅仅用α-檀香萜合酶转化大肠杆菌细胞时也产生了α-檀香萜,但是产生的量很低。添加用来转化大肠杆菌细胞的其它酶的目的仅仅是为了增加可得到α-檀香萜合酶的前体的量。
QQ群二维码
意见反馈