用于萜底物烯丙基化的人工烷氧化系统

申请号 CN202280054846.6 申请日 2022-08-06 公开(公告)号 CN117795088A 公开(公告)日 2024-03-29
申请人 艾瑟拜奥尼克斯公司; 发明人 M·J·贝克威尔德; M·Q·斯泰尔斯; S·E·鲍麦斯特; H·J·博施;
摘要 一种人工烷 烃 氧 化系统,其包含以下组分:a. 氧化酶 ;和b.提供一种或多种烷烃的一种或多种酶。该人工烷烃氧化系统任选地具有c.适于将至少一个 电子 转移至该氧化酶的电子转移化合物;并且进一步任选地具有d.电子转移化合物再生酶,该d.电子转移化合物再生酶适于将处于氧化状态的c.电子转移化合物还原。该氧化酶是与SEQ ID NO:1、10、11、23至43中的任一个或其 片段 或其变体具有至少70%序列同一性的 氨 基酸序列。
权利要求

1.一种人工烷化系统,该系统包含以下组分:
a.氧化酶;和
b.提供一种或多种烷烃的一种或多种酶;
以及
c.任选地,适于将至少一个电子转移至该氧化酶的电子转移化合物;以及
d.任选地电子转移化合物再生酶,其适于将该电子转移化合物从氧化状态还原;
其中该氧化酶是与SEQ ID NO:1、10、11、23至43中的任一个或其片段具有至少70%序列同一性的基酸序列。
2.如权利要求1所述的人工烷烃氧化系统,其中该烷烃具有至少五个原子,或具有至少一个五碳结构单元,或者
其中该组分b是至少一种萜合酶蛋白,并且该至少一种烷烃是萜。
3.如权利要求1或2中任一项所述的人工烷烃氧化系统,其中该电子转移化合物是电子转移蛋白,或/并且该电子转移化合物再生酶是电子转移蛋白还原酶。
4.一种合成核酸序列,其与SEQ ID NO:4、12、17、18、19或44中的任一个具有至少70%序列同一性,其中该合成核酸序列包含编码如权利要求1所定义的氧化酶、和任选地如权利要求3所定义的电子转移蛋白和/或电子转移蛋白还原酶的核酸序列。
5.一种用于该人工烷烃氧化系统的试剂盒,该试剂盒包含
编码如权利要求1所定义的氧化酶的第一分离的核酸序列;和
编码电子转移蛋白的第二分离的核酸序列,优选地不与第一核酸物理连接;以及
任选地编码电子转移蛋白还原酶的第三核酸序列,其中该第三核酸序列可以与该第一和/或第二核酸序列融合。
6.一种表达盒,其包含:
如权利要求4所述的合成核酸序列;或
编码如权利要求1、2或3所述的烷烃氧化系统的核酸序列;或
包括以下的烷烃氧化系统的一种或多种核酸序列:
a.氧化酶的核酸序列:
与SEQ ID NO:20具有至少70%序列同一性,或
编码与SEQ ID NO:1、10、11、23至43中的任一个具有至少70%序列同一性的氧化酶;和b.红素氧还蛋白肽的核酸序列:
与SEQ ID NO:21具有至少70%序列同一性,或
编码SEQ ID NO:2或SEQ ID NO:45的红素氧还蛋白,以及任选地
c.红素氧还蛋白还原酶肽的核酸序列:
与SEQ ID NO:22具有至少70%序列同一性,或
编码SEQ ID NO:3的红素氧还蛋白还原酶肽。
7.一种用于氧化至少一种烷烃底物的方法,该方法包括:
a.提供
i.如权利要求1至3中任一项所述的人工烷烃氧化酶系统,和/或
ii.如权利要求4所述的合成核酸序列或如权利要求6所述的表达盒的表达,和/或
iii.编码氧化酶的核酸序列的表达,该氧化酶具有与SEQ ID NO:1、10、11、23至43中的任一个或其片段或其变体具有至少70%序列同一性的氨基酸序列,和/或
iv.如权利要求6所述的表达盒,其用于产生编码的多肽;以及
v.任选地,一种或多种烷烃底物,
用于该至少一种烷烃底物的氧化;
b.对该烷烃底物进行烯丙基氧化以产生至少一种氧化烷烃产物;以及
c.任选地提取该至少一种氧化烷烃产物。
8.如权利要求7所述的方法,其中至少一种烷烃底物选自二萜、单萜或倍半萜,包括α法呢烯、β法呢烯、α红没药烯、β红没药烯、α佛手柑油烯、β佛手柑油烯、α檀香萜、β檀香萜、巴伦西亚橘烯、α愈创木烯、单萜香叶醇、橙花醇单萜、香叶基丙、乙酸芳樟酯、苧烯、β‑蒎烯或其组合。
9.一种通过氧化烷烃底物生产至少一种氧化烷烃产物的方法,该方法包括如权利要求
7所述的步骤a.至c,优选地其中该烷烃底物是如权利要求8所定义的萜。
10.一种非人宿主细胞,其包含:
如权利要求1至3中任一项所述的人工烷烃氧化系统,或
如权利要求4所述的合成核酸、如权利要求6所述的表达盒,或
通过如权利要求7或8所述的方法氧化该烷烃底物,或
通过如权利要求9所述的方法生产烷烃氧化产物。
11.一种组合物,其通过如权利要求7至9所述的方法或通过如权利要求10所述的非人宿主细胞产生,其中该组合物包含:
如前述权利要求中任一项所定义的氧化酶;以及
至少一种选自以下的氧化萜产物:月桂烯、α甜橙醛、β甜橙醛、反式α檀香醇、反式β檀香醇、澳檀醇‑醛、圆柚酮、香根酮、莎草薁酮、瑞鲍迪甙、8‑羟基香叶醇、8‑羟基橙花醇、9,
10‑环氧香叶基丙酮、十六碳烯醛、法尼醇、黑蚁素双环‑辛二醇、氧化α愈创木烯或氧化β愈创木烯或其组合;以及
任选地,一种或多种萜底物。
12.一种发酵组合物,其包含:
在培养基中培养的如权利要求10所述的非人宿主细胞;以及
由该非人宿主细胞产生的作为主要化合物的至少一种氧化烷烃产物,
其中该发酵组合物包括烷烃底物,并且任选地一种或多种副产物是次要化合物。
13.一种发酵生产至少一种氧化烷烃产物的方法,该方法包括:
提供具有如前述权利要求中任一项所述的氧化酶系统或表达盒的非人宿主细胞,
任选地向该宿主细胞提供至少一种烷烃合酶用于烷烃底物生产;
在适合该宿主细胞产生呈活性形式的编码的多肽的条件下,在培养基中培养该非人宿主细胞;
任选地,产生一种或多种烷烃底物和/或向该宿主细胞提供一种或多种烷烃底物;以及产生至少一种氧化烷烃产物;以及
任选地,纯化该至少一种氧化烷烃产物。
14.如权利要求7至9或13中任一项所述的方法,或如权利要求11或12所述的组合物,其中该氧化烷烃产物选自醇或醛或两者,包括月桂烯醛、α甜橙醛、β甜橙醛、反式α檀香醇、反式β檀香醇、澳檀醇‑醛、圆柚酮、香根酮、莎草薁酮、瑞鲍迪甙、8‑羟基香叶醇、8‑羟基橙花醇、9,10‑环氧香叶基丙酮、十六碳烯醛、法尼醇、黑蚁素、双环‑辛二醇、氧化α愈创木烯、氧化β愈创木烯或其组合。
15.一种用于制备具有氧化酶活性的变体多肽的方法,该方法包括以下步骤:
a)选择如权利要求4所述的合成核酸或编码与SEQ ID NO:1、10、11、23至43中的任一个或其片段具有至少70%序列同一性的氨基酸序列的核酸;
b)修饰所选核酸以获得至少一种突变体核酸;
c)用突变体核酸序列转化该非人宿主细胞以表达由该突变体核酸序列编码的氧化酶;
d)除了由a)的所选核酸编码的氧化酶的功能之外,筛选该氧化酶的至少一种修饰的特性;以及,
e)任选地,重复工艺步骤(a)至(d)以获得具有所需变体功能的氧化酶;
f)任选地,从步骤(c)中获得的转化的非人宿主细胞中分离突变体核酸序列。

说明书全文

用于萜底物烯丙基化的人工烷氧化系统

技术领域

[0001] 本发明涉及人工烷烃氧化系统,合成核酸序列,其表达盒,氧化至少一种烷烃、优选地烯烃、更优选地萜的方法,由此产生的氧化萜产物,以及人工烷烃氧化系统的用途。

背景技术

[0002] 萜广泛用于食品加工、个人护理和护理化学产品。萜是从它们的天然来源(例如柑橘类果、树皮等中的油)中提取的。萜也通过化学和生物合成途径产生。
[0003] 许多柑橘油(包括橙子油和橘子(mandarin)油)通常含有萜,更特定地倍半萜,称为α甜橙醛(sinensal)和β甜橙醛。甜橙醛是橙子油醛级分的一部分,被认为是质量参数,特别是感官特性的质量参数。β甜橙醛气味被描述为橙子味‑甜的‑新鲜的‑蜡味的(waxy)‑果汁味的,而α甜橙醛气味被描述为柑橘味‑橙子味‑橘子味。甜橙醛用作柑橘产品的调味剂
[0004] 油的醛级分的化学合成路线是本领域已知的。Büchi(1974;JACS 96,7573‑4)描述了α甜橙醛的合成,从(E)‑3‑甲基‑2,4‑戊二烯‑1‑醇开始,使用吡啶和三溴化磷。尤其在以下描述了β甜橙醛的合成:Bertele和Schudel(US 3699169;US 3974226),使用臭氧解从β法呢烯(farnesene)开始;以及Hiyama(1978,Tetrahedron letters[四面体通讯]19,3051‑4),从三烯醛开始。
[0005] 然而,化学合成的化合物或通过合成路线制备的化合物与天然产生的醛级分分开分类。生物合成获得的化合物通常被标记为天然的,并且具有价格优势。然而,到目前为止,并非所有的萜化合物都被披露适合生物合成生产。
[0006] 例如,甜橙醛的生物合成在本领域中是未知的。在结构上,α和β甜橙醛与倍半萜烃α和β法呢烯相关。与法呢烯相比,这两种甜橙醛均带有烯丙基醛基。α和β法呢烯均是柑橘油中熟知的组分。然而,以下生物合成途径在本领域中是未知的,其中通过氧化酶如单加氧酶将法呢烯烯丙基氧化成烯丙醇,并通过醇脱氢酶进一步氧化成甜橙醛来制备甜橙醛。此外,本领域还没有描述对法呢烯进行适当的烯丙基氧化的单加氧酶或任何其他氧化酶。
[0007] Arfmann(Biocatalys[生物催化剂],1988,第2卷,第59‑67页)提出可以由橙花叔醇生产甜橙醛。与反式橙花叔醇一起孵育的微生物产生12‑羟基‑反式橙花叔醇,该12‑羟基‑反式橙花叔醇进一步氧化为反式橙花叔醇的12‑羧酸。披露了使用微生物对橙花叔醇的不同立体异构体进行烯丙基氧化(或“ω氧化”),得到12‑羟基橙花叔醇(Hrdlicka,
Biotechnol.Prog.[生物技术进展]2004,20,368‑376)。然而,本领域没有披露12‑羟基橙花叔醇的进一步转化。
[0008] Abraham(Z.Naturforsch.47c,851‑858,1992)披露了法呢烯的磺化衍生物,该法呢烯的二烯丙基基团被诺卡氏菌属物种(Nocardia sp.)DSM 43130和猝倒假单胞菌
(Pseudomonas lapsa)DSM 50274氧化。然而,本领域并未披露用于法呢烯非磺化形式的菌
株的活性。
[0009] Iurescia Sandra等人(Applied and Environmental Microbiology[应用与环境微生物学],American Society For Microbiology[美国微生物学会],美国,第65卷,第7
期,1999年7月1日(1999‑07‑01),第2871‑2876页)披露了分离的以及生物转化的假单胞菌(Pseudomonas)M1和4个开放阅读框(ORF),命名为myrA(醛脱氢酶)、myrB(醇脱氢酶)、myrC(酰基辅酶A(CoA)合成酶)和myrD(烯酰‑CoA水合酶)。Iurescia等人提出了涉及这四种蛋白质的假单胞菌属物种菌株M1中13‑月桂烯分解代谢的途径。根据Iurescia及其同事的说法,这四种酶以月桂烯醇开始其分解代谢工作。然而,Iurescia及其同事当时并未披露催化将
月桂烯转化为月桂烯醇的第一步骤的酶。
[0010] 在另一个研究项目中,作者报道了假单胞菌菌株M1的枪法测序项目的结果(Iurescia等人1999,Soares‑Castro和Santos 2013)。作者披露了假单胞菌属物种M1中的
大于6000个试验性基因。在6000个试验性基因中,有一个编码具有UniProt数据库标识符
W5IZV3的蛋白质的基因,该蛋白质被指定脂肪酸脱饱和酶。其与本发明SEQ ID NO:1的蛋白质相同。需要注意的是,数据库条目被标记有该序列是初步数据的提醒。此外,该脂肪酸脱饱和酶不与作者的其他工作(报道于Applied And Environmental Microbiology[应用
与环境微生物学],1999年7月1日第2871‑2876页)相关联,因为在所述关于月桂烯分解代谢的首次研究中鉴定的四个基因myrA至myrD分别是UniProt数据库条目Q9XD59、Q9XD58、
Q9XD57和Q9XD60。此外,这四个月桂烯分解代谢相关序列与本发明的SEQ ID NO:1具有小于
35%序列同一性。
[0011] 其他萜(如紫穗槐二烯(amorphadiene)(Ro等人2006,Nature[自然]440:940‑943)、大根香叶烯(germacrene)A(https://doi.org/10.1104/pp.19.00629)和檀香萜
(Diaz‑Chavez PLoS One.[公共科学图书馆:综合]2013年9月18日;8(9):e75053.))的烯丙基氧化被披露为由植物细胞色素P450酶介导。然而,没有一种酶被披露介导法呢烯的烯丙
基氧化以得到甜橙醛。
[0012] DEGENHARDT J等人,PHYTOCHEMISTRY[植物化学],ELSEVIER[爱思唯尔出版公司],阿姆斯特丹,荷兰,第70卷,第15‑16期,2009年10月1日(2009‑10‑01),第1621‑1637页提供了单萜和倍半萜合酶的综述。
[0013] EP 2 706 111 A1披露了在光能自养型生物体中产生基于的目的产物(如乙醇、乙烯、化学品、聚合物、正烷烃、类异戊二烯、药物产品或其中间体)的途径和机制,使得这些生物体有效地将二氧化碳和光转化为基于碳的目的产物,以及特别地这样的生物体用于乙
醇、乙烯、化学品、聚合物、正烷烃、类异戊二烯、药物产品或其中间体的商业生产的用途。
[0014] 在Williams Shoshana C等人,Journal Of Inorganic Biochemistry[无机生物化学杂志],Elsevier Inc[爱思唯尔],美国,第219卷,2021年3月16日(2021‑03‑16),ISSN:
0162‑0134中,作者报道了来自肉桂迪茨氏菌(Dietzia cinnamea)的红素氧还蛋白融合的
烷烃单加氧酶基因,其能够氧化细胞裂解物中的长链完全饱和烷烃,如庚烷、辛烷、壬烷、癸烷、十一烷、十三烷。作者提供了对红素氧还蛋白融合的烷烃单加氧酶类和该类烷烃单加氧酶在细胞壁生物合成中的作用的关系分析。此外,在来自肉桂迪茨氏菌的全长蛋白中引入
的点突变导致比以完全饱和的烷烃(庚烷、辛烷、壬烷、癸烷、十一烷、十三烷)为底物产生的野生型更少的环氧化物产物。突变体产生大约等量的醛产物和环氧化物产物。
[0015] 本发明的目的是提供基于萜的醛和/或醇产物的完全生物合成方法。本发明的另一目的是提供用于基于萜的醛和/或醇产物的发酵生产系统,例如基于第一次发酵的甜橙
醛生产。

发明内容

[0016] 令人惊奇的是,已发现通过提供以下来实现上述目的:人工烷烃氧化系统,合成核酸序列,其表达盒,氧化至少一种烷烃、优选地烯烃、更优选地萜的方法,其产生的氧化萜产物以及人工烷烃氧化系统的用途。
[0017] 因此,在一方面,本发明涉及人工烷烃氧化系统,其包含:
[0018] a.氧化酶,该氧化酶具有与SEQ ID NO:1、10、11、23至43中的任一个或其片段具有至少62%、66%、69%、70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性的基酸序列,以及
[0019] b.提供至少一种烷烃的一种或多种酶,优选地萜合酶蛋白,
[0020] 任选地以及
[0021] c.适于将至少一个电子转移至该氧化酶的电子转移化合物,以及进一步任选地
[0022] d.电子转移化合物再生酶,其适于将处于氧化状态的c.电子转移化合物还原;
[0023] 其中该氧化酶和该提供至少一种烷烃的一种或多种酶在自然界中未发现组合。
[0024] 使人工烷烃氧化系统保持在适于生产至少一种烷烃的条件下和/或在适于氧化所述至少一种烷烃的条件下与至少一种烷烃接触。在后一种情况下,在一个实施例中,烷烃氧化系统可以是组分a.加c.和任选地d.,但缺乏b.。
[0025] 在另一方面,当前要求保护的发明涉及与SEQ ID NO:4、SEQ ID NO:12、SEQ ID NO:17、SEQ ID NO:18、SEQ ID NO:19或SEQ ID NO:44中的任一个具有至少62%、66%、
69%、70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性的合成核酸序列,其中该合成核酸序列包含编码上述氧化酶和任选地红素氧还蛋白肽和/或红素氧还蛋白还原
酶肽的核酸序列。
[0026] 在另一方面,当前要求保护的发明涉及试剂盒,其包含
[0027] 编码与SEQ ID NO:1、10、11、23至43中的任一个具有至少62%、66%、69%、70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性的蛋白质的第一分离的核酸序列,其中该第一核酸序列包含编码氧化酶的核酸序列,以及
[0028] 不与编码电子转移蛋白的第一核酸物理连接的第二分离的核酸序列,以及
[0029] 任选地编码电子转移蛋白还原酶的第三核酸序列,其中该第三核酸序列可以与该第一和/或第二核酸序列融合。
[0030] 在另一方面,当前要求保护的发明涉及表达盒,其包含:
[0031] 合成核酸序列;或
[0032] 编码烷烃氧化系统的核酸序列;或
[0033] 包括以下的烷烃氧化系统的一种或多种核酸序列:
[0034] a.氧化酶的核酸序列:
[0035] 与SEQ ID NO:20具有至少70%序列同一性,或
[0036] 编码与SEQ ID NO:1、10、11、23至43中的任一个具有至少70%序列同一性的氧化酶;和
[0037] b.红素氧还蛋白肽的核酸序列:
[0038] 与SEQ ID NO:21具有至少70%序列同一性,或
[0039] 编码SEQ ID NO:2或SEQ ID NO:45的红素氧还蛋白,以及任选地
[0040] c.红素氧还蛋白还原酶肽的核酸序列:
[0041] 与SEQ ID NO:22具有至少70%序列同一性,或
[0042] 编码SEQ ID NO:3的红素氧还蛋白还原酶肽。
[0043] 在另一方面,当前要求保护的发明涉及分离的表达盒,其包含烷烃氧化系统的核酸序列,这些核酸序列包含:
[0044] a.氧化酶的核酸序列,与SEQ ID NO:20具有至少62%、66%、69%、70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性,或编码与SEQ ID NO:1、10、11、23至
43中的任一个具有至少62%、66%、69%、70%、75%、80%、85%、90%、94%、95%、98%或
99%序列同一性的氧化酶,以及
[0045] b.红素氧还蛋白肽的核酸序列,与SEQ ID NO:21具有至少62%、66%、69%、70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性,或编码与SEQ ID NO:2具有至少62%、66%、69%、70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性的红素氧还蛋白,以及任选地
[0046] c.红素氧还蛋白还原酶肽的核酸序列,与SEQ ID NO:22具有至少62%、66%、69%、70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性,或b和c与a的组合。
[0047] 在另一方面,当前要求保护的发明涉及氧化至少一种烷烃底物、优选地烯烃底物、更优选地萜底物的方法,该方法包括:
[0048] a.在适于氧化一种或多种萜底物的条件下提供
[0049] i.以上披露的人工烷烃氧化酶系统,和/或
[0050] ii.以上披露的合成核酸序列或以上披露的表达盒的表达,和/或
[0051] iii.编码氧化酶的核酸序列的表达,该氧化酶具有与SEQ ID NO:1、SEQ ID NO:10、SEQ ID NO:11、SEQ ID NO:23至43中的任一个或其片段或其变体具有至少62%、66%、
69%、70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性的氨基酸序列,以及[0052] iv.任选地至少一种烷烃、优选地烯烃、更优选地萜底物,如果不是由烷烃氧化系
统产生;
[0053] 用于该至少一种烷烃、优选地烯烃、更优选地萜底物的氧化,
[0054] b.对该烷烃、优选地烯烃、更优选地萜底物进行烯丙基氧化以产生至少一种氧化烷烃、优选地烯烃、更优选地萜产物
[0055] c.任选地提取该至少一种氧化烷烃、优选地烯烃、更优选地萜产物。
[0056] 在另外的方面,当前要求保护的发明涉及生产如本文定义的至少一种氧化烷烃产物、优选地烯烃产物、更优选地萜产物的方法,该方法包括:
[0057] a.在适于氧化烷烃、优选地烯烃、更优选地一种或多种萜底物的条件下提供
[0058] i.以上披露的人工烷烃氧化酶系统,和/或
[0059] ii.以上披露的合成核酸序列或以上披露的表达盒的表达,和/或
[0060] iii.编码氧化酶的核酸序列的表达,该氧化酶具有与SEQ ID NO:1、10、11、23至43中的任一个或其片段或其变体具有至少62%、66%、69%、70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性的氨基酸序列,以及
[0061] iv.任选地至少一种烷烃、优选地烯烃、更优选地萜底物,如果不是由烷烃氧化系统产生;
[0062] 用于该至少一种烷烃、优选地烯烃、更优选地萜底物的氧化,
[0063] b.对该烷烃、优选地烯烃、更优选地萜底物进行烯丙基氧化以产生至少一种氧化萜产物
[0064] c.任选地提取该至少一种氧化烷烃、优选地烯烃、更优选地萜产物。
[0065] 如果本发明的烷烃氧化酶系统产生一种或多种烷烃、优选地烯烃、更优选地萜底物,或者该烷烃氧化酶系统与产生一种或多种底物的系统一起存在或者包含在产生至少一
种底物的宿主细胞中,则不需要添加底物。尽管如此,即使在这样的情况下,仍然可以添加一种或多种底物,例如以使一种或多种底物可用,或提供烷烃氧化系统和本发明方法中以
前不存在的所需底物。
[0066] 在另一方面,当前要求保护的发明涉及以上披露的烷烃氧化系统、或本发明的非人宿主细胞、如本文披露的发酵组合物、或以上披露的核酸序列或以上披露的表达盒的表
达用于氧化萜底物并因此产生一种或多种氧化萜产物的用途。
[0067] 在另一方面,当前要求保护的发明涉及非人宿主细胞,其包含人工烷烃氧化系统、合成核酸、表达盒或通过所述方法生产烷烃氧化产物。
[0068] 在另一方面,当前要求保护的发明涉及通过上述方法或通过非人宿主细胞产生的组合物,其中该组合物包含月桂烯醛、α甜橙醛、β甜橙醛、反式α檀香醇和反式β檀香醇、澳檀醇(lanceol)‑醛、圆柚、香根酮、莎草薁酮(rotundone)、瑞鲍迪甙(rebaudioside)、8‑羟基香叶醇、8‑羟基橙花醇、9,10‑环氧香叶基丙酮、十六碳烯醛、法尼醇、黑蚁素
(denderalasin)和双环‑辛二醇、氧化α愈创木烯(guaiene)、氧化β愈创木烯或其组合,以及任选地所述的一种或多种萜底物和任选地氧化酶。
[0069] 在另一方面,当前要求保护的发明涉及发酵组合物,其包含:
[0070] 在培养基中培养的非人宿主细胞;和
[0071] 由该非人宿主细胞产生的作为主要化合物的至少一种氧化萜产物,
[0072] 其中该发酵组合物包括萜底物,并且任选地一种或多种副产物是次要化合物。
[0073] 在实施例中,发酵组合物是进行进一步加工的中间产物,该进一步加工包括但不限于提取、浓缩、纯化、干燥、热处理、压处理、真空处理或其组合。
[0074] 在另一实施例中,发酵组合物是未进行进一步加工或进行进一步加工的最终产物。
[0075] 在另一方面,当前要求保护的发明涉及发酵生产至少一种氧化萜产物的方法,该方法包括:
[0076] 提供具有氧化酶系统的非人宿主细胞;
[0077] 在培养基中培养该非人宿主细胞以产生至少一种氧化萜产物。
[0078] 在另一方面,本发明涉及用于制备具有氧化酶活性的变体多肽的方法,该方法包括以下步骤:
[0079] a)选择如本文所述的合成核酸(与SEQ ID NO:4、12、17、18、19或44中的任一个具有至少70%序列同一性,其中该合成核酸序列包含编码如本文定义的氧化酶、以及任选地电子转移蛋白和/或电子转移蛋白还原酶的核酸序列)或编码与SEQ ID NO:1、10、11、23至
43中的任一个或其片段具有至少62%、66%、69%、70%、75%、80%、85%、90%、94%、
95%、98%或99%序列同一性的氨基酸序列的核酸;
[0080] b)修饰所选核酸以获得至少一种突变体核酸;
[0081] c)用突变体核酸序列转化该非人宿主细胞以表达由该突变体核酸序列编码的氧化酶;
[0082] d)除了由a)的所选核酸编码的氧化酶的功能之外,筛选该氧化酶的至少一种修饰的特性;以及,
[0083] e)任选地,重复工艺步骤(a)至(d)以获得具有所需变体功能的氧化酶;
[0084] f)任选地,从步骤(c)中获得的转化的非人宿主细胞中分离突变体核酸序列。附图说明
[0085] 图1a示出了通过大肠杆菌BL21转化月桂烯的实施例,其中pET‑DUET作为对照,pET‑M1‑alkB‑rr‑rrr携带烷烃氧化系统。
[0086] 图1b是用于示范目的的质谱的副本,其发现于:Soares‑Castro P,Montenegro‑Silva P,Heipieper HJ,Santos PM.2017.Functional characterization of a 28‑
kilobase catabolic island from Pseudomonas sp.strain M1 involved in 
biotransformation ofβ‑myrcene and related plant‑derived volatiles.[来自参与β‑月桂烯和相关植物来源挥发物的生物转化的假单胞菌属物种菌株M1的28‑千基分解代谢
岛的功能表征]Appl Environ Microbiol[应用环境微生物学]83:e03112‑16.图S2。
[0087] 图1c示出了在与图1b中的参考文献进行比较之后,鉴定为从图1a中所示的月桂烯转化的月桂烯醛的质谱。
[0088] 图2示出了通过大肠杆菌BL21转化β法呢烯的实施例,其中pET‑DUET作为对照,pET‑M1‑alkB‑rr‑rrr携带烷烃氧化系统。
[0089] 图3a示出了由携带烷烃氧化系统的红杆菌属(Rhodobacter)菌株Rs265‑9c‑pBBR‑MVA‑AaBFS‑M1‑alkB‑rr‑rrr产生的甜橙醛的实施例。
[0090] 图3b示出了通过与甜橙醛标准品比较证实的由红杆菌属菌株Rs265‑9c‑pBBR‑MVA‑AaBFS‑M1‑alkB‑rr‑rrr产生的甜橙醛的实施例。
[0091] 图3c.示出了用Rs265‑9c‑pBBR‑MVA‑AaBFS‑M1‑alkB‑rr‑rrr产生的甜橙醛的质谱。
[0092] 图3d.示出了甜橙醛标准品的质谱。
[0093] 图4示出了显示使用烷烃氧化系统生产α甜橙醛的质谱。详见实例部分。
[0094] 图5.示出了显示使用烷烃氧化系统生产红没药烯(Bisabolene)和澳檀醇醛的质谱。详见实例部分。
[0095] 图6.示出了当使用烷烃氧化系统时发现了显示檀香萜和檀香醇的质谱。详见实例部分。
[0096] 图7a和7b本发明的多肽与所示位置处的保守氨基酸的比对。保守氨基酸位置在图中用黑色背景上白色字体的字母表示

具体实施方式

[0097] 在描述本发明的组合物和配制品之前,应当理解,本发明并不限于所描述的特定组合物和配制品,因为这样的组合物和配制品当然可以发生变化。还应当理解的是,因为本发明的范围将仅由所附权利要求书限定,所以本文中所使用的术语不旨在是限制性的。
[0098] 如本文所用,术语“包含(comprising或comprises)”和“由……组成(comprised of)”与“包括(including或includes)”或“含有(containing或contains)”同义,并且是包括性的或开放式的并且不排除其他未叙述的成员、要素或方法步骤。应当理解,如本文所用,术语“包含(comprising或comprises)”和“由……组成(comprised of)”包含术语
“由……组成(consisting of或consists of)”和“组成(consists)”。更特定地,如本文所用,术语“包含”意指权利要求涵盖所有列出的要素或方法步骤,但也可以包括附加的、未命名的要素或方法步骤。例如,包括步骤a)、b)和c)的方法在其最狭义上涵盖由步骤a)、b)和c)组成的方法。短语“由……组成”意指组合物(或装置、或方法)仅具有叙述的要素(或步骤)。相反,术语“包含”可以涵盖除了步骤a)、b)和c)之外还包括另外的步骤,例如步骤d)和e)的方法。
[0099] 此外,说明书和权利要求书中的术语“第一”、“第二”、“第三”或“(a)”、“(b)”、“(c)”、“(d)”等用于区分相似要素,而不一定用于描述顺序或时间次序。应当理解的是,如此使用的术语在适当的情况下是可互换的,并且本文描述的本发明的实施例能够以除了本文描述或展示的其他顺序进行操作。如果术语“第一”、“第二”、“第三”或“(A)”、“(B)”和“(C)”或“(a)”、“(b)”、“(c)”、“(d)”、“i”、“ii”等涉及方法或用途或测定的步骤,这些步骤之间没有时间或时间间隔连贯性,也就是说,这些步骤可以同时进行或这些步骤之间可以
有秒、分钟、小时、天、周、月甚至年的时间间隔,除非在上文或下文所述的申请中另外指出。
[0100] 在以下段落中,更加详细地定义本发明的不同方面。除非明确地指示相反,否则如此定义的每个方面可以与任何一个或多个其他方面组合。特别地,指示为优选或有利的任何特征可以与指示为优选或有利的任何一个或多个其他特征组合。
[0101] 贯穿本说明书引用“一个实施例(one embodiment或an embodiment)”意指结合该实施例描述的特别的特征、结构或特性包括在本发明的至少一个实施例中。因此,贯穿本说明书在不同地方中出现短语“在一个实施例中(in one embodiment或in an embodiment)”并不一定都指同一实施例,但是可以指同一实施例。此外,特别的特征、结构或特性可以按任何适合的方式组合,如将从本披露,在一个或多个实施例中,对于本领域普通技术人员来说是显而易见的。此外,尽管本文所述的一些实施例包括其他实施例中包括的一些但不是
其他特征,但是不同实施例的特征的组合也意在本发明的范围内,并且形成不同实施例,如将会被本领域普通技术人员理解的那样。例如,在所附权利要求中,要求保护的实施例中的任一个可以按任何组合来使用。
[0102] 此外,贯穿本说明书定义的范围也包括终值,即1至10的范围,1至10之间意味着1和10两者都包括在该范围内。为避免疑义,申请人有权根据适用法律获得任何等效方式。
[0103] 如本文所用,当限定所述项目、数量、百分比或术语的值时,术语“约”是指所述项目、数量、百分比或术语的值的正负10%、9%、8%、7%、6%、5%、4%、3%、2%或1%的范围。优选的范围是正负10%。
[0104] 在本文使用如“浓度在1与5微摩尔之间”的数值范围的情况下,该范围不仅包括1和5微摩尔,还包括1与5微摩尔之间的任何数值,例如2、3和4微摩尔。
[0105] 如本文所用,术语“体外”表示在动物或人体之外或外部。如本文所用,术语“体外”应当理解为包括“离体”。术语“离体”典型地是指从动物或人体中取出并在体外(例如在培养容器中)维持或繁殖的组织或细胞。如本文所用,术语“体内”表示在动物或人体之内或内部。
[0106] 如本文所用,术语“蛋白质”或“多肽”或“(多)肽”或“肽”(如果没有另外说明,所有术语可互换使用)涵盖基本上不含其他宿主细胞多肽的分离的和/或纯化的和/或重组的(多)肽。如本文所指的术语“肽”包含至少两个、三个、四个、五个、六个、七个、八个、九个、十个、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、
35、36、37、38、39、40、45、50、60、70、80、90、100、150、200、250、300或甚至更多个氨基酸残基,其中一个的α羧基基团与另一个的α氨基基团结合。本文所使用和设想的蛋白质或肽的翻译后修饰是新形成的蛋白质或肽的修饰,并且可以涉及氨基酸的缺失、取代或添加,某些氨基酸的化学修饰,例如酰胺化、乙酰化、磷酸化、糖基化、焦谷氨酸酯的形成、甲硫氨酸上磺胺基团的氧化/还原,或者向某些氨基酸中添加类似的小分子。
[0107] “同源物”意指可用于本发明的氧化酶或红素氧还蛋白或红素氧还蛋白还原酶的细菌、真菌、植物或动物同源物,优选地植物同源物,但也包括编码和非编码DNA序列的截短序列、单链DNA或RNA。
[0108] 序列同一性、同源性或相似性在本文中定义为通过序列比较所确定的两个或更多个氨基酸序列或者两个或更多个核酸序列之间的关系。通常,在序列的整个长度上比较序
列同一性或相似性,但也可以仅比较与彼此比对的序列的一部分。优选地,本文中在序列的整个长度上比较序列同一性或相似性。在本领域中,“同一性”或“相似性”还意指视情况而定,通过多肽序列或核酸序列之间的匹配而确定的这样的序列之间的序列相关性程度。
[0109] 可以使用许多软件工具生成序列比对,如:
[0110] ‑Needleman‑Wunsch算法‑Needleman,Saul B.和Wunsch,Christian D.(1970)."A general method applicable to the search for similarities in the amino acid sequence of two proteins[适用于寻找两种蛋白质氨基酸序列相似性的通用方法]"
.Journal of Molecular Biology[分子生物学杂志]48(3):443‑453。
[0111] 例如,该算法被实现到“NEEDLE”程序中,该程序执行两个序列的全局比对。NEEDLE程序包含在例如欧洲分子生物学开放软件套件(European Molecular Biology Open Software Suite,EMBOSS)中。
[0112] ‑EMBOSS‑a collection of various programs:The European Molecular Biology Open Software Suite(EMBOSS)[EMBOSS‑各种程序的集合:欧洲分子生物学开放
软件套件(EMBOSS)],Trends in Genetics[遗传学趋势]16(6),276(2000)。
[0113] ‑BLOSUM(BLOcks替代矩阵)‑典型地基于保守区域(例如,蛋白质结构域)的比对而生成(Henikoff S,Henikoff JG:Amino acid substitution matrices from protein blocks.[来自蛋白质嵌段的氨基酸取代矩阵]Proceedings of the National Academy of 
Sciences of the USA.[美国国家科学院院刊]1992年11月15日;89(22):10915‑9)。许多
BLOSUM中的一个是“BLOSUM62”,其通常是许多程序在比对蛋白质序列时的“默认”设置。
[0114] ‑BLAST(基本局部比对搜索工具)‑由几个单独的程序(BlastP、BlastN)组成,主要用于在大型序列数据库中搜索相似的序列。BLAST程序还创建局部比对。通常使用的是由NCBI(美国国家生物技术信息中心(National Centre for Biotechnology Information))
提供的“BLAST”界面,它是改进版本(“BLAST2”)。“原始”BLAST:Altschul,S.F.,Gish,W.,Miller,W.,Myers,E.W.和Lipman,D.J.(1990)"Basic local alignment search tool.[基
本局部比对搜索工具]"J.Mol.Biol.[分子生物学杂志]215:403‑410;BLAST2:Altschul,
Stephen F.,Thomas L.Madden,Alejandro A.Schaffer,Jinghui Zhang,Zheng Zhang,
Webb Miller,和David J.Lipman(1997),"Gapped BLAST and PSI‑BLAST:a new 
generation of protein database search programs[空位型BLAST和PSI‑BLAST:新一代
蛋白质数据库搜索程序]",Nucleic Acids Res.[核酸研究]25:3389‑3402。
[0115] 如本文所用,序列同一性优选地是通过EMBOSS成对比对算法“Needle”确定的值。特别地,可以使用EMBOSS包中的NEEDLE程序(版本2.8.0或更高版本,EMBOSS:欧洲分子生物学开放软件套件‑Rice,P.,等人Trends in Genetics[遗传学趋势](2000)16:276‑277;
http://emboss.bioinformatics.nl),使用NOBRIEF选项(与NO的‘简化同一性和相似性’)计算“最高同一性(longest‑identity)”。两个比对序列之间的同一性、同源性或相似性计算如下:在比对中显示两个序列中相同氨基酸的对应位置的数量除以减去比对中空位总数
后的比对总长度。对于氨基酸序列的比对,默认参数为:矩阵=Blosum62;开放空位罚分=
10.0;空位延伸罚分=0.5。对于核酸序列的比对,默认参数为:矩阵=DNAfull;开放空位罚分=10.0;空位延伸罚分=0.5。
[0116] 序列同一性通常以“%序列同一性”或“%同一性”的形式提供。为了在第一步中确定两个氨基酸序列之间的同一性百分比,在这两个序列之间生成成对序列比对,其中这两个序列在它们的完整、全部或全长上比对(即,成对全局比对)。比对是用本文所述的程序或软件生成的。用于本发明目的的优选比对是可以从中确定最高序列同一性的比对。
[0117] 一方面,本发明涉及人工烷烃氧化系统,其包含至少一种烷烃,例如但不限于烯烃,例如但不限于萜,以及以下作为另外的组分:
[0118] a.氧化酶,该氧化酶具有与SEQ ID NO:1、10、11、23至43中的任一个或其片段或其变体具有至少62%、66%、69%、70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性的氨基酸序列,以及
[0119] b.提供至少一种烷烃的一种或多种酶,优选地萜合酶蛋白,
[0120] 任选地以及
[0121] c.适于将至少一个电子转移至该氧化酶的电子转移化合物,以及进一步任选地
[0122] d.电子转移化合物再生酶,其适于将处于氧化状态的c.电子转移化合物还原。
[0123] 有可能具有a.多于一种类型的氧化酶作为组分。
[0124] 使人工烷烃氧化系统保持在适于生产至少一种烷烃的条件下和/或在适于氧化所述至少一种烷烃的条件下与至少一种烷烃接触。
[0125] 在后一种情况下,在一个实施例中,烷烃氧化系统可以是组分a.加c.和任选地d.,但缺乏b.。
[0126] 适于将至少一个电子转移到氧化酶(参见上文的c)的电子转移化合物能以这样的方式存在于烷烃氧化系统附近,即它可以与烷烃氧化系统功能性地相互作用,尽管它不是
特意包括在人工烷烃氧化系统中。例如,如果烷烃氧化系统包括在宿主细胞中,则该宿主细胞可以提供合适的电子转移化合物,而不需要在该烷烃氧化系统中另外包含一种化合物。
另一个实例可以是破坏具有合适电子转移化合物的细胞,然后将包含合适电子转移化合物
的细胞膜部分与本身不包含合适的电子转移化合物的本发明烷烃氧化系统组合。
[0127] 典型地,有利的是包括合适的电子转移化合物作为烷烃氧化系统的一部分,这也已被证明。
[0128] 人工烷烃氧化系统:
[0129] 烷烃应理解为包括烯烃。在一个实施例中,烷烃氧化系统也可互换地称为烯烃氧化系统。
[0130] “烯烃”应理解为含有碳‑碳双键的烃,优选地萜化合物。在本发明的一方面,烯烃是具有一个或多个烯丙基基团的单萜、倍半萜或二萜。在本发明的另外的方面,烯烃是二烯丙基烯烃,例如二烯丙基倍半萜。
[0131] 因此,本发明的一方面是指人工烷烃氧化系统、本发明的方法以及可用于本发明方法的表达盒和宿主细胞,其中该至少一种烷烃由至少五个碳原子组成或具有至少一个C5
(五碳结构单元),它们以1至6的整数存在,即每个烷烃分子的碳原子计数分别为5、10、15、
20、25或30。至少一种烷烃包括直链烯烃和非直链烯烃。在实施例中,至少一种烷烃是非直链烯烃。在优选的实施例中,非直链烯烃是萜。提及烷烃优选地应理解为是指烯烃,并且更优选地是指萜;因此,对烷烃底物的任何提及优选地是对烯烃底物的提及,更优选地是对萜底物的提及,并且对烷烃产物的任何提及优选地是对烯烃产物的提及,更优选地是对萜产
物的提及。
[0132] 因此,在实施例中,本发明的烷烃氧化系统应理解为萜氧化系统。
[0133] 组分a:氧化酶
[0134] 披露的烷烃氧化系统包括适于氧化至少一种烷烃、至少一种异源倍半萜合酶蛋白、任选地红素氧还蛋白肽、或/和红素氧还蛋白还原酶肽的一种或多种氧化酶。
[0135] 在本发明的另一方面,氧化酶是适于氧化至少一种烷烃并且优选地在其中心部分携带PFAM结构域A_脱饱和酶(PF00487)的酶(使用PFAM的版本34.0进行分析,关于PFAM的细
节参见“Pfam:The protein families database in 2021[2021年Pfam蛋白家族数据库]:
J.Mistry,S.Chuguransky,L.Williams,M.Qureshi,G.A.Salazar,E.L.L.Sonnhammer,
S.C.E.Tosatto,L.Paladin,S.Raj,L.J.Richardson,R.D.Finn,A.Nucleic Acids 
Research[核酸研究](2020)doi:10.1093/nar/gkaa913 and http://pfam.xfam.org/)。
[0136] 在本发明的一方面,氧化酶适于氧化至少一种烷烃以及酶类别1.14.19.x的氧化还原酶。在本发明的另外的方面,氧化酶是酶类别1.14.19.1的酶。
[0137] 在一个实施例中,氧化酶或单加氧酶或烷烃氧化酶被定义为整合膜二蛋白。在另外的实施例中,氧化酶基于来自细菌的酶,该细菌例如但不限于在Smits 2002,J 
Bacteriol[细菌学杂志]184,1733‑1742中进一步描述的那些。烷烃氧化alkB酶已在大范围的细菌中进行了描述(Smits2002,J Bacteriol[细菌学杂志]184,1733‑1742)。然而,未证明alkB酶对法呢烯或任何其他倍半萜的活性。
[0138] 在一个实施例中,氧化酶是来自自然地不与红素氧还蛋白融合的亚类的烯烃单加氧酶。非限制性实例是如SEQ ID NO:1和43提供的那些。本领域技术人员可以通过例如蛋白质的长度容易地确定其是与红素氧还蛋白自然地融合的烯烃单加氧酶类别,还有不与红素
氧还蛋白自然地融合的烯烃单加氧酶类别。
[0139] 优选地,氧化酶是与已知的假单胞菌M1 alkB羟化酶(Soares‑Castro2017Appl Environ Microbiol[应用环境微生物学]83:e03112‑16.;SEQ ID NO:1),例如SEQ ID NO:
23至43中的任一个或SEQ ID NO:10、11中所示的人工蛋白质中的任一个或其片段或变体具
有至少50%同一性的烷烃氧化酶。在一个实施例中,氧化酶源自假单胞菌属物种,例如但不限于假单胞菌M1细菌,或基于这些生物体形成的那些酶。这种M1能够在月桂烯上生长,月桂烯是一种单萜,其结构与法呢烯相似,但缺少一个异戊二烯单元。
[0140] 更优选地,氧化酶是烷烃氧化alk B酶,其氨基酸序列与SEQ ID NO:1、10、11或23至42中的任一个(PM1_0216370)具有至少62%、66%、69%、70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性,例如来自不动杆菌属的一种,如在Uniprot条目
A0A077KZY1下披露的吉洛不动杆菌(Acinetobacter guillouiae)蛋白或披露为
A0A2S9EQI7的不动杆菌属物种酶(分别为SEQ ID NO:23和24)。在另一个更优选的实施例
中,烷烃氧化系统的氧化酶是烷烃氧化alk B酶,其氨基酸序列与编码CMR5c氧化酶蛋白/
AlkB氧化酶(假单胞菌属物种CMR5c)的SEQ ID NO.43具有至少62%、66%、69%、70%、
75%、80%、85%、90%、94%、95%、98%或99%序列同一性。SEQ ID NO:44编码SEQ ID NO:
43以及SEQ ID NO:45的红素氧还蛋白。
[0141] 更优选地,氧化酶是具有在氨基酸水平上与SEQ ID NO:1、10、11、23至43中的任一个或其片段具有至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或甚至100%序列同一性的氨基酸序列的蛋白质。
[0142] 在一个实施例中,氧化酶的变体是SEQ ID NO:10、11、23至43中的任一个的多肽或与SEQ ID NO:1、10、11、23至43中的任一个具有至少70%、75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列同一性的氨基酸序列,并且具有氧化酶活性。优选地,变体是保守修饰的变体。更优选地,变体具有如图7a、7b中SEQ ID NO:1、33、36、37、39、40、41和42所示的保守氨基酸。
[0143] 如本文所指的氧化酶片段可以是由上述序列和序列变体的任何氨基酸序列组成的多肽,其长度足以表现出本文指定的烷烃氧化酶活性。
[0144] 典型地,片段由以本文提及的序列或序列变体的长度计至少20、至少30、至少40、至少50、至少100、至少150或至少200个连续氨基酸组成。在优选的实施例中,片段具有全长序列的至少20%、或至少30%、或至少40%或至少50%或至少60%或至少70%或至少80%或至少90%或100%的活性。
[0145] 在本发明的一个实施例中,氧化酶的片段是表现出能够将至少一种萜底物转化成如本文所定义的氧化萜产物的烷烃氧化酶活性的多肽。因此,优选地设想具有多肽的上述
生物活性的片段优选地在其中心部分包含PFAM结构域A_脱饱和酶(PF00487)。
[0146] 萜:
[0147] 根据定义,术语“萜”仅包含由碳和氢组成的烃。术语“萜类(terpenoids)”是指含有另外的官能团的萜,可产生醇、醛、酮和酸等衍生物;参见例如,Flavours and Fragrances[香精和香料]:Chemistry,Bioprocessing and Sustainability[化学、生物加
工和可持续性]RG Berger;Black等人,Terpenoids and their role in wine flavour:
recent advances.[萜类及其在葡萄酒味中的作用:最新进展]Australian Journal of 
Grape and Wine Research[澳大利亚葡萄与葡萄酒研究杂志]21,582‑600,2015;Zhou和
Pichersky,More is better:the diversity of terpene metabolismin plants.[越多越
好:植物中萜代谢的多样性]Current Opinion in Plant Biology[现代植物生物学观点]
2020,55:1‑10;Degenhardt J,  TG,Gershenzon J(2009)Monoterpene and 
sesquiterpene synthases and the origin of terpene skeletal diversity in 
plants.[单萜和倍半萜合酶以及植物中萜骨架多样性的起源]Phytochemistry[植物化学]
70(15):1621‑1637)。根据其结构中通过头至尾添加连接的异戊二烯单元的数量,萜分别根据其碳原子或倍半萜部分的数量进行分类:单萜(C10)、倍半萜(C15)、二萜(C20)、三萜
(C30)或具有多达30,000个连接的异戊二烯单元的多萜。就像萜一样,萜类同样根据组成它们的异戊二烯单元的数量进行分类,并进一步用后缀“‑oids”命名,如单萜类(C10)或倍半萜类(C15)。在科学文献中,术语萜经常与术语萜类互换使用,尽管它们具有不同的含义。如本文所用,术语“萜”包含烃及其官能化衍生物,优选地烃。典型地,当用作本发明烷烃氧化系统的底物时,萜不是氧化形式,因此可以不包括本文在说明书中其他地方定义的氧化萜
产物,尽管一些例外(像如本文定义的DETA)是可能的。
[0148] 如本文所用,“单萜”是C10萜。单萜典型地由C10香叶基二磷酸(GPP)作为中间体制成,并且可以是环状或直链的。
[0149] “倍半萜”是由三个异戊二烯单元构建的C15‑萜。像单萜一样,倍半萜可能是无环的或含有环,包括许多独特的组合。它们特别存在于高等植物和许多其他生命系统中,如海洋生物体和真菌。天然地,它们以烃或氧化形式存在,包括内酯、醇、酸、醛和酮。倍半萜还包括具有多种药理活性的精油和芳香成分。
[0150] “二萜”是C‑20萜,天然存在于植物和微生物中。二萜分子具有商业价值,因为它们可以转化为琥珀香调(amber note),应用于香料工业。典型地,当用作本发明烷烃氧化系统的底物时,倍半萜不是氧化形式,因此可以不包括本文在说明书中其他地方定义的氧化萜产物,尽管一些例外(像如本文定义的DETA)是可能的。
[0151] 组分b:萜合酶蛋白:
[0152] 萜合酶蛋白包括具有从单一底物或多种底物形成一种或几种萜的能力的萜合酶蛋白。
[0153] 下文提及的萜合酶蛋白包括单萜、二萜合酶和/或倍半萜合酶。单萜合酶与由底物的二价金属离子依赖性电离引发的常见碳阳离子反应机制相关。所得阳离子中间体经历一
系列环化、氢化物移位或其他重排,直到反应因质子损失或添加亲核试剂而终止。  
Degenhardt(Phytochemistry[植物化学]70(2009)1621‑1637)中进一步描述了单萜合酶。
通常,单萜合酶蛋白促进单萜的形成,如月桂烯、蒎烯、莰烯、水芹烯、萜品油烯、苧烯、罗勒烯、芳樟醇、桉树脑、香叶醇、萜品烯、萜品醇、葑醇、蒈烯、桧烯、龙脑基二磷酸等及其结构变体、异构体、衍生物等。
[0154] 编码二萜合酶的基因已被广泛描述(Zerbe,Trends Biotechnol[生物技术趋势]2015年7月;33(7):419‑28.),并且这些化合物的微生物生产已得到证实(例如Schalk 
J.Am.Chem.Soc.[美国化学学会杂志]2012,134,18900‑18903)。
[0155] 倍半萜合酶蛋白是指促进无环异戊二烯基二磷酸和鲨烯转化为多种环状和无环形式的蛋白质。
[0156] 倍半萜合酶蛋白采用与单萜合酶类似的基于碳阳离子的反应机制催化法尼基二磷酸形成倍半萜。通常,倍半萜合酶蛋白促进倍半萜(下文中可互换地称为倍半萜底物)的
形成;这些是具有15个碳原子(三个异戊二烯单元)的萜,如长叶烯、法呢烯、红没药烯、姜黄烯(Curcumene)、大根香叶烯A/D/D‑4‑醇、广霍香醇、巴伦西亚橘烯、倍半萜侧柏烯
(Sesquithujene)、大果烯(Macrocarpene)、石竹烯、蛇麻烯、桉叶油醇、橙花叔醇、巴巴烯(Barbatene)、紫穗槐‑4,11‑二烯、8‑表‑柏木脑、5‑表‑兜铃烯(Aristolochene)、杜松烯、杜松烯岩兰螺旋二烯(Cadinene Vetispiradiene)、佛手柑油烯(bergamotene)、榄香烯、毕澄茄烯、荜澄茄醇、依兰油(Muurola)‑3,5‑二烯、芹子烯、姜烯、法尼醇、甜橙醛、檀香萜、巴伦西亚橘烯(valencene)、愈创木烯、二萜等及其结构变体、异构体、衍生物等。
[0157] 萜底物:
[0158] 萜底物应理解为涵盖单萜、倍半萜和/二萜,例如但不限于作为氧化反应底物的萜烃分子。在本发明的一方面,一种或多种萜底物是一种或多种倍半萜底物。例如,一种或多种倍半萜底物包括α法呢烯、β法呢烯、甜橙醛、α红没药烯、β红没药烯、α佛手柑油烯、β佛手柑油烯、α檀香萜、β檀香萜、巴伦西亚橘烯、α愈创木烯、二萜、单萜、香叶醇、橙花醇单萜、乙酸芳樟酯、苧烯、β‑蒎烯、或香叶基丙酮(geranylactone)或其混合物。典型地,一种或多种萜底物不是本文说明书中其他地方定义的氧化萜产物,尽管一些例外(像如本文定义的
DETA)是可能的。
[0159] 组分c:电子转移化合物:
[0160] 电子转移化合物将至少一个电子转移至氧化酶。
[0161] 优选地,电子转移化合物包括a)具有可溶性电子转移剂的蛋白质,b)电子转移链的膜结合组分,c)金属酶等。
[0162] 在一个实施例中,电子转移化合物是电子转移蛋白,优选地F1‑S0型蛋白。
[0163] 更优选地,电子转移化合物是红素氧还蛋白肽,其氨基酸序列与SEQ ID NO:2或UniProt数据库条目A0A3G7A099中已知的氨基酸序列(SEQ ID NO:45)或其片段具有至少
62%、66%、69%、70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性。
[0164] 红素氧还蛋白肽是电子转移所需的可溶性低分子量含铁肽。红素氧还蛋白与其他非血红素铁蛋白如铁氧还蛋白、蚯蚓血红蛋白、顺乌头酸酶等一样,含有与硫附接的强结合功能性铁原子,但它们不含卟啉。单个铁原子通过四个四面体排列的硫原子与蛋白质的其
余部分结合。电子转移由与四个半胱氨酰硫醇盐配位的单个Fe氧化还原中心处理。这两种
氧化还原态的形式为Fe(II)和Fe(III)。
[0165] 优选地,红素氧还蛋白肽是与SEQ ID NO:2或来自UniProt数据库称为A0A3G7A099的多肽或其片段具有至少62%、66%、69%、70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性的氨基酸序列。
[0166] 更优选地,红素氧还蛋白肽是在氨基酸水平上与SEQ ID NO:2或45或其片段具有至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少
99%或甚至100%序列同一性的氨基酸序列。
[0167] 如本文所指的红素氧还蛋白肽片段可以是由上述序列和序列变体的任何氨基酸序列组成的多肽,其长度足以表现出能够还原氧化烷烃氧化酶以使其再生的电子转移活
性。
[0168] 典型地,红素氧还蛋白肽片段由以上文提及的序列或序列变体的长度计至少20、至少25、至少30、至少40、至少45或至少50个连续氨基酸组成。
[0169] 组分d:电子转移化合物再生酶:
[0170] 电子转移化合物再生酶适于将处于氧化状态的本文所述的电子转移化合物还原并典型地使其再生。
[0171] 电子转移化合物再生酶是电子转移蛋白还原酶,优选地红素氧还蛋白还原酶蛋白。
[0172] 红素氧还蛋白还原酶通常是NADH依赖性的,并且在电子转移后需要循环红素氧还蛋白。在红素氧还蛋白还原酶催化的反应中,红素氧还蛋白在催化循环期间被NADH还原为
亚铁态,并被ω‑羟化酶再氧化为三价铁形式。
[0173] 优选地,红素氧还蛋白还原酶肽是与SEQ ID NO:3或其片段具有至少62%、66%、69%、70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性的氨基酸序列。
[0174] 更优选地,红素氧还蛋白肽是在氨基酸水平上与SEQ ID NO:3或其片段具有至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或甚至100%序列同一性的氨基酸序列。
[0175] 如本文所指的红素氧还蛋白还原酶肽片段可以是由上述序列和序列变体的任何氨基酸序列组成的多肽,其长度足以表现出能够还原氧化红素氧还蛋白以使其再生的电子
转移活性。
[0176] 典型地,红素氧还蛋白还原酶肽片段由以上文提及的序列或序列变体的长度计至少20、至少30、至少40、至少50、至少100、至少150或至少200个连续氨基酸组成。
[0177] 在优选的实施例中,人工烷烃氧化系统包括一种或多种电子转移蛋白作为电子转移化合物,优选地F1‑S0型,更优选具有与SEQ ID NO:2或SEQ ID NO:45或其片段或其变体具有至少62%、66%、69%、70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性的氨基酸序列的一种或多种红素氧还蛋白肽,或/并且至少一种电子转移化合物再生酶
是电子转移蛋白还原酶,优选地红素氧还蛋白还原酶,更优选地与SEQ ID NO:3或其片段具有至少62%、66%、69%、70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性的红素氧还蛋白还原酶肽。
[0178] 在更优选的实施例中,烷烃氧化系统包括由与SEQ ID NO:20具有至少70%序列同一性的核酸序列编码的氧化酶、由与SEQ ID NO:21具有至少70%序列同一性的核酸序列编
码的红素氧还蛋白肽、和/或由与SEQ ID NO:22具有至少70%序列同一性的核酸序列编码
的红素氧还蛋白还原酶肽。
[0179] 优选地,氧化酶由与SEQ ID NO:20具有至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或甚至100%序列同一性的核酸序列编码。
[0180] 优选地,红素氧还蛋白肽由与SEQ ID NO:21具有至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或甚至100%序列同一性的核酸序列编码。
[0181] 优选地,红素氧还蛋白还原酶肽由与SEQ ID NO:22或其片段具有至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或甚至
100%序列同一性的核酸序列编码。
[0182] 本发明的烷烃氧化系统可应用于宿主细胞,但无细胞应用也是可能的。例如,来自破碎细胞的细胞膜部分、人工膜系统、重构细胞膜等可以与本发明的烷烃氧化系统组合使用。
[0183] 本发明的另一个方面涉及与SEQ ID NO:4、SEQ ID NO:12、SEQ ID NO:17、SEQ ID NO:18、或SEQ ID NO:19或SEQ ID NO:44具有至少62%、66%、69%、70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性的合成核酸,其中该合成核酸序列包含编码氧化酶和任选地红素氧还蛋白肽和/或红素氧还蛋白还原酶肽的核酸序列。
[0184] 优选地,合成核酸序列编码人工烷烃氧化系统,其中括号中列出的组分由SEQ ID NO:4(组分a、c和d)、SEQ ID NO:12(a、c和d)、SEQ ID NO:17(a、c和d)、SEQ ID NO:18(a、c和d)或SEQ ID NO:19(仅a和c)的核酸序列编码。
[0185] 优选地,人工烷烃氧化系统具有由与SEQ ID NO:4、SEQ ID NO:12、或SEQ ID NO:17、SEQ ID NO:18具有至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少
97%、至少98%、至少99%或甚至100%序列同一性的核酸序列编码的组分a、c和d。
[0186] 优选地,人工烷烃氧化系统仅具有由与SEQ ID NO:19具有至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或甚至100%序列同一性的核酸序列编码的组分a和c。
[0187] 在一个实施例中,a至d组分中的至少一种多肽与标签肽融合。在一个实施例中,组分a至d中使用的多肽中的一种或多种包含含有标签肽的第一区段和含有根据本发明的相应组分的相应多肽的第二区段。包含所述第一区段和所述第二区段的多肽在本文中可称为
‘标记的多肽’。
[0188] 标签肽优选地选自下组:氮利用蛋白(NusA)、硫氧还蛋白(Trx)、麦芽糖结合蛋白(MBP)、谷胱甘肽S‑转移酶(GST)、小泛素样修饰物(SUMO)或结合蛋白(Fh8)及其功能同源物。如本文所用,标签肽的功能同源物是与未标记的酶相比对标记的酶的溶解度具有至少
约相同影响的标签肽。典型地,同源物的不同之处在于,一个或多个氨基酸已被插入、取代、缺失或延伸至其作为同源物的肽。特别地,同源物可以包含亲水性氨基酸对另一种亲水性
氨基酸的一个或多个取代,或疏水性氨基酸对另一种疏水性氨基酸的一个或多个取代。特
别地,同源物可以与NusA、Trx、MBP、GST、SUMO或Fh8的序列具有至少40%,更特别地至少
50%,优选地至少55%,更优选地至少60%、至少70%、至少75%、至少80%、至少85%、至少
90%、至少95%、至少98%或至少99%序列同一性。
[0189] 在优选的实施例中,标签肽是来自大肠杆菌的麦芽糖结合蛋白或其功能同源物。
[0190] 使用根据本发明的标记的多肽是特别有利的,因为它可能有助于增加至少一种氧化萜产物的产量,尤其是增加细胞产量。
[0191] 为了改善标记的多肽的溶解度(与没有标签的多肽相比),多肽的第一区段优选地在其C‑末端与第二区段的N‑末端结合。可替代地,标记的多肽的第一区段在其N‑末端与第二区段的C‑末端结合。
[0192] 此外,本披露涉及包含编码多肽的核苷酸序列的核酸,该多肽包含含有标签肽(优选地MBP、NusA、Trx、GST、SUMO或Fh8‑标签或这些中任一种的功能同源物)的第一区段,以及含有任何组分a至d的多肽的第二区段。第二区段可以例如包含如SEQ ID NO:1、10、11或23至43中所示的氨基酸序列或其功能类似物。
[0193] 此外,本披露涉及包含编码所述一种或多种标记的多肽的所述核酸的宿主细胞。编码标记的多肽的根据本发明的特定核酸显示于SEQ ID NO:4、12、17、18、19或44中。宿主细胞特别地可以包含含有这些序列中的任一个或其功能类似物的基因。
[0194] 此外,本披露涉及多肽,该多肽包含含有标签肽的第一区段和含有任何组分a至d的多肽的第二区段,该标签肽优选地选自下组:MBP、NusA、Trx或SET。
[0195] 本发明的核酸(或多核苷酸)包含编码本发明的烷烃氧化系统的核酸序列。编码本发明的烷烃氧化系统的核酸序列优选地是重组的和/或分离的和/或纯化的核酸序列。编码
本发明的烷烃氧化系统的核酸序列可以使用已知的分子生物学标准技术、本文提供的序列
信息和生物体来产生和分离。如本文所用,术语“核酸”包括指处于单链或双链形式的脱氧核糖核苷酸或核糖核苷酸聚合物,即多核苷酸,并且除非另外限制,涵盖在以下方面具有天然核苷酸的基本性质的已知类似物:其以与天然存在的核苷酸(例如肽核酸)相似的方式杂
交至单链核酸。多核苷酸可以是天然或异源结构基因或调控基因的全长序列或子序列。除
非另外指示,否则该术语包括指指定的序列以及其互补序列。因此,出于稳定性或其他原因而对主链进行了修饰的DNA或RNA是如该术语在本文所意指的“多核苷酸”。此外,仅举两个例子,包含稀有碱基(如肌苷)或修饰碱基(如三苯甲基化的碱基)的DNA或RNA是如该术语在
本文使用的“多核苷酸”。应认识到,已对DNA和RNA进行了很多种修饰,这些修饰起到本领域技术人员已知的许多有用目的。如本文使用的术语“多核苷酸”涵盖多核苷酸的这样的化学修饰、酶修饰或代谢修饰形式,以及病毒和细胞(除此之外包括简单细胞以及复杂细胞)所
特有的DNA和RNA的化学形式。本文中编码多肽如氧化酶或红素氧还蛋白或红素氧还蛋白还
原酶的每个核酸序列还通过参考遗传密码描述了该核酸的每个可能的沉默变异。术语“保
守修饰的变体”适用于氨基酸和核酸序列二者。关于特定的核酸序列,术语“保守修饰的变体”如果使用的话,可以是指由于遗传密码的简并性而编码相同氨基酸序列或氨基酸序列
的保守修饰的变体的那些核酸。术语“遗传密码的简并性”是指大量功能相同的核酸编码任何给定的蛋白质的事实。例如,密码子GCA、GCC、GCG和GCU都编码氨基酸丙氨酸。因此,在密码子指定丙氨酸的每个位置,该密码子可以改变为任何所述的相应密码子而不改变编码的
多肽。这样的核酸变异是“沉默变异”,并且代表保守修饰变异中的一种。术语“多肽”、“肽”和“蛋白质”在本文可互换地使用,以指代氨基酸残基的聚合物。
[0196] 术语“多肽”、“肽”和“蛋白质”还适用于其中一个或多个氨基酸残基是相应天然存在的氨基酸的人工化学类似物的氨基酸聚合物,且适用于天然存在的氨基酸聚合物。天然存在的氨基酸的这样的类似物的基本性质是,当整合到蛋白质中时,该蛋白质对由相同蛋
白质引发但完全由天然存在的氨基酸组成的抗体具有特异性反应。术语“多肽”、“肽”和“蛋白质”还包括修饰,这些修饰包括但不限于糖基化、脂质附着、硫酸化、谷氨酸残基的γ‑羧化、羟基化和ADP核糖基化。在本申请的上下文中,寡聚物(如寡核苷酸、寡肽)被认为是聚合物组中的一种。在实例中,寡聚物具有相对较低数量的单体单元,通常为2‑100个,特别地6‑
100个,包括例如引物序列,如用于克隆本发明中有用的氧化酶或红素氧还蛋白或红素氧还蛋白还原酶的引物序列。
[0197] 当关于本发明的核酸(DNA或RNA)或蛋白质使用时,术语“异源”是指不作为其存在的生物体、细胞、基因组或DNA或RNA序列的一部分天然存在的核酸或蛋白质,或者在不同于其在自然界中发现的细胞或基因组或DNA或RNA序列中的一个或多个位置中发现的核酸或蛋白质。本发明的异源核酸或蛋白质对于它们所引入的细胞来说不是内源性的,而是从另
一细胞获得的或者合成或重组产生的。通常,尽管不是必需的,这样的核酸编码通常不由表达DNA的细胞产生的蛋白质。对于特定宿主细胞而言是内源性的,但已通过例如使用DNA改
组对其天然形式进行修饰的基因也称为异源基因。术语“异源”还包括天然存在的DNA序列的非天然存在的多个拷贝。因此,术语“异源”可能是指这样的DNA片段,其相对于细胞而言是外来的或异源的,或相对于细胞而言是同源的但区段处在不常见于该宿主细胞核酸内的
位置和/或数量。表达了外源性DNA区段以产生外源性多肽。
[0198] 本发明的“同源”DNA序列是与将DNA序列引入其中的宿主细胞天然地关联的DNA序列。本领域技术人员认为对于其表达的细胞而言是异源或外来的任何核酸或蛋白质在本文
中均涵盖在术语异源核酸或蛋白质中。
[0199] 与另一种蛋白质或多肽相比,如本文所用的关于蛋白质或多肽的术语“修饰的”、“修饰”、“突变的”或“突变”在必要时适用于核苷酸或核酸序列。所提及的术语用于表示编码蛋白质或多肽的修饰的核苷酸或核酸序列与与其比较的蛋白质或多肽的核苷酸或核酸序列相比在核苷酸或核酸序列上具有至少一个差异。术语使用不考虑修饰或突变的蛋白质
实际上是通过编码这些氨基酸的核酸的诱变或多肽或蛋白质的修饰获得的,还是以另一种
方式,例如使用人工基因合成方法获得的。诱变是本领域中熟知的方法,并且包括例如通过PCR或通过寡核苷酸介导的诱变进行的定点诱变,如Sambrook,J.,和Russell,
D.W.Molecular Cloning:A Laboratory Manual.[分子克隆:实验室手册]第3版,Cold 
Spring Harbor Laboratory Press[冷泉港实验室出版社],冷泉港,纽约,(2001)中所述。
如本文所用的关于基因的术语“修饰的”、“修饰”、“突变的”或“突变”用于表示该基因的核苷酸序列或其调控序列中的至少一个核苷酸不同于它所比较的核苷酸序列。修饰或突变特
别地可以是用不同的核苷酸替换、核苷酸缺失或核苷酸插入。
[0200] 试剂盒:
[0201] 本发明的另一个方面涉及用于人工烷烃氧化系统的试剂盒,该试剂盒包含
[0202] 与SEQ ID NO:1、10、11、23至43具有至少62%、66%、69%、70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性的第一分离的核酸序列,其中该第一核酸序列包含编码氧化酶的核酸序列,以及
[0203] 编码电子转移蛋白的第二分离的核酸序列,优选地不与第一核酸物理连接,以及
[0204] 任选地编码电子转移蛋白还原酶的第三核酸序列,其中该第三核酸序列可以与该第一和/或第二核酸序列融合。
[0205] 在实施例中,应用试剂盒的生物体包括编码如本文所述的烷烃合酶、优选地萜合酶、更优选地倍半萜合酶的核酸序列。
[0206] 在另一实施例中,试剂盒包括编码如本文所述的烷烃合酶、优选地萜合酶、更优选地倍半萜合酶的第四核酸序列。当生物体不产生相应的烷烃合酶时,试剂盒包括该第四核酸序列。
[0207] 在实施例中,试剂盒用于鉴定或检测人工烷烃氧化系统的存在。
[0208] 在另一个实施例中,试剂盒用于制备人工烷烃氧化系统。
[0209] 在另一方面,本发明涉及表达盒,其包含:
[0210] 合成核酸序列;或
[0211] 编码烷烃氧化系统的核酸序列;或
[0212] 包括以下的烷烃氧化系统的一种或多种核酸序列:
[0213] a.氧化酶的核酸序列:
[0214] 与SEQ ID NO:20具有至少70%序列同一性,或
[0215] 编码与SEQ ID NO:1、10、11、23至43中的任一个具有至少70%序列同一性的氧化酶;和
[0216] b.红素氧还蛋白肽的核酸序列:
[0217] 与SEQ ID NO:21具有至少70%序列同一性,或
[0218] 编码SEQ ID NO:2或SEQ ID NO:45的红素氧还蛋白,以及任选地
[0219] c.红素氧还蛋白还原酶肽的核酸序列:
[0220] 与SEQ ID NO:22具有至少70%序列同一性,或
[0221] 编码SEQ ID NO:3的红素氧还蛋白还原酶肽。
[0222] 本发明的另一个方面涉及表达盒,其包含与SEQ ID NO:4、12、17、18或19中的任一个具有至少70%序列同一性的合成核酸序列,其中该合成核酸序列包含编码氧化酶、萜合酶蛋白(如果需要,在预期宿主细胞中不具备所需萜合酶功能的情况下)以及任选地红素氧
还蛋白肽和/或红素氧还蛋白还原酶肽的核酸序列。
[0223] 在另一实施例中,本发明涉及如上文披露的编码烷烃氧化系统的核酸序列。
[0224] 在另一实施例中,本发明涉及包含烷烃氧化系统的核酸序列的表达盒,这些核酸序列包含:
[0225] a.氧化酶的核酸序列,与SEQ ID NO:20中的任一个具有至少62%、66%、69%、70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性,或编码与SEQ ID NO:1、
10、11、23至43中的任一个具有至少62%、66%、69%、70%、75%、80%、85%、90%、94%、
95%、98%或99%序列同一性的氧化酶,以及
[0226] b.红素氧还蛋白肽的核酸序列,与SEQ ID NO:21中的任一个具有至少62%、66%、69%、70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性,或
[0227] c.红素氧还蛋白还原酶肽的核酸序列,与SEQ ID NO:22具有至少62%、66%、69%、70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性,或b和c与a的组合。
[0228] 优选地,氧化酶的核酸序列是与SEQ ID NO:20具有至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或甚至100%序列同一性的核酸序列。
[0229] 优选地,红素氧还蛋白肽的核酸序列是与SEQ ID NO:21具有至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或甚至100%序列同一性的核酸序列。
[0230] 优选地,红素氧还蛋白还原酶肽的核酸序列是与SEQ ID NO:22具有至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或甚至
100%序列同一性的核酸序列。
[0231] 在一个实施例中,人工烷烃氧化系统是倍半萜氧化系统,该倍半萜氧化系统包含与SEQ ID NO:1、10、11、23至43中的任一个具有至少70%、75%、80%、85%、90%、91%、
92%、93%、94%、95%、96%、97%、98%或99%序列同一性的一种或多种氧化酶,一种或多种倍半萜合酶,以及任选地具有与SEQ ID NO:2具有至少70%、75%、80%、85%、90%、
91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性的氨基酸序列的红素氧还蛋白肽,以及进一步任选地与SEQ ID NO:3具有至少70%、75%、80%、85%、90%、91%、
92%、93%、94%、95%、96%、97%、98%或99%序列同一性的红素氧还蛋白还原酶肽。
[0232] 本发明的另一个方面涉及氧化一种或多种烷烃底物、优选萜底物、更优选地倍半萜底物的方法,该方法包括:
[0233] a.提供
[0234] i.如上文披露的人工烷烃氧化系统组分a和c以及任选地b和/或d,或者
[0235] ii.编码氧化酶和任选地红素氧还蛋白肽和/或红素氧还蛋白还原酶肽的如上文披露的合成核酸序列、或如上文披露的其表达盒、或包含如上文披露的人工氧化系统的表
达盒的表达,
[0236] iii.编码氧化酶的核酸序列的表达,该氧化酶具有与SEQ ID NO:1、10、11、23至43中的任一个或其片段或其变体具有至少70%序列同一性的氨基酸序列,以及
[0237] iv.任选地,至少一种烷烃底物、优选地萜底物(如果不是由烷烃氧化系统产生‑在萜合酶、优选地倍半萜合酶不存在或不起作用的情况下‑萜底物)、优选地倍半萜底物;
[0238] 用于烷烃底物、优选地萜底物、更优选地倍半萜底物的氧化,
[0239] b.用烷烃氧化系统对烷烃底物、优选地萜底物、更优选地倍半萜底物进行烯丙基氧化,以产生至少一种氧化烷烃产物、优选地萜产物,包括一种或多种醛和/或醇产物;
[0240] c.任选地提取至少一种氧化烷烃底物、优选地萜产物,包括一种或多种醛和/或醇产物。
[0241] 在本发明方法的另一个优选实施例中,在异源表达本发明的烷烃氧化系统组分a和c以及任选地b(如果不存在内源性萜合酶)和/或d的宿主细胞或非人转基因生物中制备
至少一种氧化烷烃、优选地烯烃、更优选地萜产物。
[0242] 在另一实施例中,根据本发明的宿主细胞可以在工业上用于上述一种或多种氧化萜产物的发酵生产。
[0243] 例如,本发明的宿主细胞或非人转基因生物体可以用于一种或多种氧化萜产物的发酵生产。
[0244] 优选地,至少一种氧化萜产物在发酵过程中产生,即在包括在表达本发明的烷烃氧化系统的条件下,在培养基中培养例如微生物宿主细胞如红杆菌属宿主细胞的方法中产
生。用烷烃氧化系统对一种或多种萜底物进行烯丙基氧化产生一种或多种氧化萜产物的实
际反应通常发生在细胞内。应该注意的是,术语“发酵的”在本文中广义地用于其中使用生物体培养物由合适的原料(例如碳水化合物、氨基酸来源、脂肪酸来源)合成化合物的方法。
因此,本文所指的发酵过程不限于厌氧条件,并延伸至需氧条件下的过程。对于红杆菌属宿主细胞,合适的原料通常是已知的。合适的条件可以基于红杆菌属宿主细胞的已知方法,例如描述于WO 2011/074954或WO 2014/014339中。
[0245] 可以通过本领域已知的方法从宿主细胞或非人转基因生物中分离或提取通过氧化一种或多种萜底物产生的至少一种氧化萜产物(对于植物,参见例如Jiang等人,Curr 
Protoc  Plant Biol.[植物生物学的当前方案]2016;1:345‑358.Doi:10.1002/
cppb.20024;对于红杆菌属,参见例如WO 2014/014339)。
[0246] 通常,这些方法包括以下步骤:1)破坏细胞以释放它们的化学成分,包括氧化萜产物;2)使用合适的溶剂(或通过蒸馏或捕获化合物)提取包括氧化萜产物的样品;3)将所需的氧化萜产物与干扰分析和定量的提取物的其他不需要的内容物分离;以及4)使用适当的
分析方法(例如薄层色谱法(TLC)、气相色谱法(GC)或液相色谱法(LC)或本文所述的另一种
方法)。
[0247] 在实施例中,氧化萜产物在细胞外产生,并且继续进行提取,其中使用合适的溶剂提取样品。
[0248] 萜底物:
[0249] 萜底物在上文定义。
[0250] 优选地,一种或多种萜底物包括α法呢烯、β法呢烯、α红没药烯、β红没药烯、α佛手柑油烯、β佛手柑油烯、α檀香萜、β檀香萜、巴伦西亚橘烯、α愈创木烯、二萜、单萜、香叶醇、橙花醇单萜、或香叶基丙酮、乙酸芳樟酯、苧烯、β‑蒎烯或其混合物。
[0251] 在实施例中,至少一种萜底物是选自α法呢烯、β法呢烯、α红没药烯、β红没药烯、α佛手柑油烯、β佛手柑油烯、α檀香萜、β檀香萜、巴伦西亚橘烯或α愈创木烯的倍半萜底物。
[0252] 在一个实施例中,萜底物包括一种或多种远端萜醇。远端萜醇(DETA)在碳链的末端带有醇基团,该醇基团在氧化成醇之前被认为是萜的远端。这些萜底物的非限制性实例
对于萜月桂烯是具有式I的化合物,对于萜β‑法呢烯是如下式II和III中所示的化合物:
[0253] 式I:
[0254]
[0255] 式II:
[0256]
[0257] 式III:
[0258]
[0259] 氧化萜产物:
[0260] 通过对萜底物进行氧化,优选地烯丙基氧化产生至少一种氧化萜产物。
[0261] 优选地,至少一种氧化萜产物是基于萜的,并且通过氧化一种或多种萜底物产生。它们可以包含通过烷烃氧化系统组分a和c以及任选地d的作用引入的醛基、醇基团和/或烯
丙醇基团。在一个实施例中,氧化萜产物包括以下中的至少一种:月桂烯醛、α甜橙醛、β甜橙醛、反式α檀香醇和反式β檀香醇、澳檀醇‑醛、圆柚酮、香根酮、莎草薁酮、瑞鲍迪甙、8‑羟基香叶醇、8‑羟基橙花醇、9,10‑环氧香叶基丙酮、十六碳烯醛、法尼醇、黑蚁素和双环‑辛二醇、氧化α愈创木烯、氧化β愈创木烯。
[0262] 在一个实施例中,一种或多种氧化萜产物包括如上所定义的远端萜醇DETA。DETA可以是相应萜氧化成氧化萜产物的中间体,这些氧化萜产物如但不限于月桂烯醛、α甜橙
醛、β甜橙醛、反式α檀香醇和反式β檀香醇、澳檀醇‑醛、圆柚酮、香根酮、莎草薁酮、瑞鲍迪甙、8‑羟基香叶醇、8‑羟基橙花醇或9,10‑环氧香叶基丙酮。当氧化不继续到更高氧化水平的氧化萜产物,例如醛时,DETA本身可以是氧化萜产物。如上所述,DETA可以具有双重功能,因为在一个实施例中,本发明的烷烃氧化系统可以将它们用作萜底物,以产生更高氧化水
平的氧化萜底物,或者DETA可以是本发明的烷烃氧化系统的产物。
[0263] 在实施例中,单萜底物月桂烯用于生产月桂烯醛。
[0264] 在另一实施例中,倍半萜底物α‑金合欢烯(farnescene)和β‑金合欢烯分别用于产生α甜橙醛和β甜橙醛。
[0265] 在另一实施例中,倍半萜底物檀香萜用于生产檀香醇。
[0266] 在另一实施例中,倍半萜底物巴伦西亚橘烯用于生产圆柚酮或香根酮。
[0267] 在另一实施例中,倍半萜底物α愈创木烯用于生产莎草薁酮。
[0268] 在另一实施例中,倍半萜底物二萜用于生产瑞鲍迪甙。
[0269] 在另一实施例中,倍半萜底物香叶醇或橙花醇单萜用于生产8‑羟基香叶醇或8‑羟基橙花醇。
[0270] 在另一实施例中,香叶基丙酮用于生产9,10‑环氧香叶基丙酮。
[0271] 在优选的实施例中,至少一种烷烃底物选自二萜、单萜或倍半萜,包括α法呢烯、β法呢烯、α红没药烯、β红没药烯、α佛手柑油烯、β佛手柑油烯、α檀香萜、β檀香萜、巴伦西亚橘烯、α愈创木烯、单萜香叶醇、橙花醇单萜、香叶基丙酮、乙酸芳樟酯、苧烯、β‑蒎烯或其组合。
[0272] 在另一方面,本发明涉及通过氧化烷烃底物产生至少一种氧化烷烃产物的方法。
[0273] 本发明的另一方面涉及非人宿主细胞。非人宿主细胞包含:
[0274] 人工烷烃氧化系统,或
[0275] 合成核酸、表达盒,或
[0276] 烷烃底物的氧化,或
[0277] 烷烃氧化产物的生产。
[0278] 非人宿主细胞适于氧化如上文披露的萜底物。
[0279] 非人宿主细胞是非哺乳动物细胞,优选地非脊椎动物细胞,更优选地分离的宿主细胞。
[0280] 优选地,本发明的转基因非人生物体是细菌、酵母、真菌、原生生物、藻类或蓝细菌、非人动物或非人哺乳动物、或植物。
[0281] 非宿主细胞包括细菌、真菌等宿主细胞。
[0282] 本发明还涉及包含本发明的核酸的载体或基因构建体。
[0283] 本发明的核酸与表达控制序列可操作地连接,从而允许在载体或基因构建体中在原核或真核宿主细胞或其分离的级分中表达。因此,在一方面,载体是表达载体。本发明核酸的表达包括将多核苷酸转录成可翻译的mRNA。确保在原核或真核宿主细胞中表达的调控
元件是本领域众所周知的。在一方面,它们包含确保转录起始的调控序列和/或确保转录终止和转录物稳定的聚A信号。另外的调控元件可包括转录以及翻译增强子。允许在原核宿主细胞中表达的可能调控元件包括例如大肠杆菌中的lac‑、trp‑或tac‑启动子,或红杆菌属启动子(https://doi.org/10.1073/pnas.2010087117),并且允许在真核宿主细胞中表达
的调控元件的实例是酵母中的AOX1‑或GAL1‑启动子或哺乳动物和其他动物细胞中的CMV‑、SV40‑、RSV‑启动子(劳斯肉瘤病毒)、CMV‑增强子、SV40‑增强子或球蛋白内含子。植物启动子描述于例如Plant Biotechnology:Principles and Applications[植物生物技术:原理
与应用],第117‑172页,2017中。此外,可在表达载体中使用诱导型表达控制序列。这样的诱导型载体可包含tet或lac操纵子序列或可通过热休克或其他环境因素诱导的序列。合适的
表达控制序列是本领域众所周知的。除了负责转录起始的元件之外,这样的调控元件还可
以包含多核苷酸下游的转录终止信号,如SV40‑聚A位点或tk‑聚A位点。在这种上下文中,合适的表达载体是本领域已知的,如Okayama‑Berg cDNA表达载体pcDV1(法玛西亚公司
(Pharmacia))、pBluescript(斯图特基因公司(Stratagene))、pCDM8、pRc/CMV、pcDNA1、pcDNA3(英杰公司(Invitrogen))或pSPORT1(英杰公司)。源自病毒如反转录病毒、痘苗病
毒、腺相关病毒、疱疹病毒或乳头瘤病毒的表达载体可用于将多核苷酸或载体递送至靶
细胞群中。
[0284] 可使用本领域技术人员众所周知的方法来构建包含本发明的核酸的载体或基因构建体;参见例如,以下中描述的技术:Sambrook,Molecular Cloning A Laboratory 
Manual[分子克隆:实验室手册],Cold Spring Harbor Laboratory[冷泉港实验室](2001)
纽约,和Ausubel,Current Protocols in Molecular Biology[当前分子生物学方案],
Green Publishing Associates and Wiley Interscience[格林出版协会和维利科学公
司],纽约(1994)。
[0285] 如本文所用,术语“基因”广泛地用来指与生物学功能相关联的核酸(如本发明的核酸)的任何区段。因此,基因包括编码序列和/或其表达所需的调控序列。例如,“基因”是指表达mRNA或功能性RNA、或编码特异性蛋白的核酸片段,并且包括调控序列。基因还包括例如形成用于其他蛋白质的识别序列的非表达DNA区段。基因可由多种来源获得,包括从目的来源克隆或从已知或预测的序列信息合成,并且可以包括设计为具有所需参数的序列。
[0286] 如本文所用,术语“嵌合基因”是指含有以下的任何基因:1)DNA序列,包括在自然界中未同时发现的调控和编码序列,或2)编码非天然邻接的蛋白质部分的序列,或3)非天然邻接的启动子部分。因此,嵌合基因可以包含源自不同来源的调控序列和编码序列,或包含源自相同来源的、但以与在自然界中所发现的不同的方式排列的调控序列和编码序列。
[0287] 如本文所用,“基因构建体”的复杂性可以根据目的插入而变化。该构建体可以被设计成随机插入到生物体的基因组中,这称为通过添加的转基因,或者可以被设计成在特定的靶向位点处插入到基因组中,插入到确定的染色体的正确位置,这称为通过同源重组
的转基因。在这两种情况下,构建体都必须是完美的,具有控制基因表达的结构,如启动子、转录起始位点、聚腺苷酸化位点和转录终止位点。也就是说,插入受体基因组的信息有开
头、中间和结尾,从而避免了在宿主细胞或生物体中不受控制的表达的问题。
[0288] 如本文所用,术语“开放阅读框”和“ORF”是指在编码序列的翻译起始和终止密码子之间编码的氨基酸序列。术语“起始密码子”和“终止密码子”是指编码序列中三个相邻的核苷酸(‘密码子’)的一个单位,该编码序列分别指定蛋白合成(mRNA翻译)的起始和链终止。
[0289] 如本文所用,“编码序列”是指编码特定氨基酸序列且排除非编码序列的DNA或RNA序列。它可以构成“不间断的编码序列”,即缺乏内含子,如在cDNA中,或者它可以包括由适当的剪接连接结合的一个或多个内含子。“内含子”是包含在初级转录物中的RNA序列,但通过细胞内RNA的切割和重新连接而被去除,以产生可翻译成蛋白质的成熟mRNA。
[0290] 如本文所用,“调控序列”是指位于编码序列上游(5’非编码序列)、内部或下游(3’非编码序列),并且影响转录、RNA加工或稳定性或相关编码序列的翻译的核苷酸序列。调控序列包括增强子、启动子、翻译前导序列、内含子和聚腺苷酸化信号序列。它们包括自然序列和合成序列以及可能是合成序列与自然序列的组合的序列。如上所述,术语“合适的调控序列”不限于启动子。调控序列的实例包括启动子(如转录启动子、组成型启动子、诱导型启动子)、操纵子、增强子、mRNA核糖体结合位点以及控制转录和翻译起始和终止的适当序列。当调节序列在功能上与本发明的DNA或cDNA序列相关时,核酸序列是“可操作地连接”的。如本文所用,术语“可操作地连接(operably linked或operatively linked)”是指并置,其中如此描述的组分处于容许它们以其预期方式起作用的关系。与另一个控制序列和/或编码
序列“可操作地连接”的控制序列以这样的方式连接,从而使得编码序列的转录和/或表达在与控制序列相容的条件下完成。通常,可操作地连接意味着连接的核酸序列是毗邻的,且在需要连接两个蛋白编码区时这些连接的核酸序列是毗邻的并处在同一阅读框中。每个调
控序列可以独立地选自异源和同源调控序列。
[0291] 如本文所用,“启动子”是指核苷酸序列,通常在其编码序列的上游(5’),它通过提供对适当的转录所要求的RNA聚合酶和其他因子的识别来控制所述编码序列的表达。“启动子”包括最小启动子,其是由TATA‑盒和用于指定转录起始位点的其他序列组成的短DNA序列,在该转录起始位点处添加用于控制表达的调控元件。“启动子”也是指包括最小启动子和能够控制编码序列或功能性RNA的表达的调控元件的核苷酸序列。此类型的启动子序列由近端元件和更远端的上游元件组成,后者的元件通常被称为增强子。因此,“增强子”是DNA序列,它可以促进启动子活性,并且可以是该启动子或插入的异源元件的固有元件以增强启动子的水平或组织特异性。它能够在两个方向(正常或翻转)上进行操作,并且甚至当
移动到该启动子的上游或下游时还能够发挥作用。增强子以及其他上游启动子元件均结合
了介导它们的作用的序列特异性DNA结合蛋白。启动子可以全部衍生自天然基因,或者由衍生自在自然界中发现的不同启动子的不同元件构成,或者甚至包含合成DNA区段。启动子可能还含有参与蛋白因子的结合的DNA序列,这些蛋白因子控制了响应于生理学的或发育状
况的转录起始的有效性。
[0292] 如本文所用,“表达盒”意指能够在如本文定义的适当宿主细胞中指导特定核苷酸序列(例如,编码可用于本发明的氧化酶和任选地红素氧还蛋白以及任选地红素氧还蛋白还原酶的核苷酸序列)的表达的DNA序列,包括可操作地连接到目的核苷酸序列的启动子,
该目的核苷酸序列可操作地连接到终止信号上。它还典型地包含正确翻译核苷酸序列所需
要的序列。编码区通常对目的蛋白质进行编码,但是还可以对目的功能性RNA进行编码,例如在正义或反义方向上的反义RNA或非翻译RNA。包含目的核苷酸序列的表达盒可以是嵌合
的,意指其组分中的至少一种相对于其他组分中的至少一种是异源的。表达盒还可以是天
然存在的、但是已经按照用于异源表达的重组形式来获得的一种表达盒。核苷酸序列在该
表达盒中的表达可以是在组成型启动子或诱导型启动子的控制之下,该启动子仅在该宿主
细胞暴露于一些特定的外部刺激物时才启动转录。在多细胞生物的情况下,启动子还可以
是对特定的组织、或器官、或发育阶段特异的,例如在植物发育中。
[0293] 如本文所用,术语“载体”是指由设计用于指导靶细胞转化的遗传物质组成的构建体。载体含有多个在位置和顺序上定向的遗传元件,即与其他必需元件可操作地连接,这样使得核酸盒中的核酸可以被转录,并且必要时,在这些转化细胞中进行翻译。特别地,载体可以选自下组:病毒载体、(细菌)噬菌体、黏粒或质粒。载体还可以是酵母人工染色体(YAC)、细菌人工染色体(BAC)或农杆菌属(Agrobacterium)二元载体。载体可以是双链或单链直链或环状形式,其可以是或可以不是自我传递或可移动的,并且可以通过整合到细胞
基因组中或以额外的染色体(例如具有复制起点的自主复制质粒)存在来转化宿主生物体,
如红杆菌属。特定地包括穿梭载体,这些穿梭载体意指能够天然或通过设计在如本文定义
的两种不同的宿主生物体中复制的DNA载体。优选地,载体中的核酸处于用于在如本文指定的宿主细胞中进行转录的适当启动子或其他调控元件的控制下,并与其可操作地连接。载
体可以是双功能性表达载体,在多种宿主中发挥作用。在基因组DNA的情况下,这可以含有它所拥有的启动子或其他调控元件;而在cDNA的情况下,这可以是在用于在该宿主细胞中
表达的适当启动子或其他调控元件的控制下。可以基于本领域已知的方法制备含有核酸的
载体。例如,可以使用编码可用于本发明的氧化酶或红素氧还蛋白或红素氧还蛋白还原酶
的cDNA序列,该cDNA序列可操作地连接到合适的调控元件,如转录或翻译调控核酸序列。
[0294] 如本文所用,术语“载体”包括用于标准克隆工作的载体(“克隆载体”)以及更专类型的载体,如(常染色体)表达载体和用于整合到宿主细胞染色体中的克隆载体(“整合载体”)。
[0295] “克隆载体”典型地含有一个或少量限制性核酸内切酶识别位点(在这些位点上可以按照可确定的方式将外来DNA序列插入而没有损失该载体的实质性生物学功能)、以及标
记基因(该标记基因适于鉴定以及对用该克隆载体所转化的细胞的选择)。
[0296] 如本文所用,术语“表达载体”是指直链或环状的DNA分子,其包含编码目的多肽的区段,该区段在提供其转录的额外核酸区段的控制下(即可操作地连接)。这样的额外区段可包括启动子和终止子序列,并且可任选地包括一个或多个复制起点、一个或多个选择标
记、增强子、聚腺苷酸化信号等。表达载体通常可以衍生自质粒或病毒DNA,或可以含有这两者的元件。特定地,表达载体包含核苷酸序列,该核苷酸序列在5’至3’方向上包含以下且与其可操作地连接:(a)被宿主生物体识别的转录和翻译起始区,(b)目的多肽的编码序列,和(c)被宿主生物体识别的转录和翻译终止区。“质粒”是指自主复制的染色体外DNA,其不整合到微生物的基因组中,并且本质上通常是环状的。
[0297] “整合载体”是指直链或环状的DNA分子,其可以整合到例如微生物的基因组(如细菌的基因组)中,并提供编码目的多肽的基因的稳定遗传,该目的多肽如烷烃氧化系统,例如氧化酶和萜合酶(如果需要),以及可用于本发明的任选地红素氧还蛋白和任选地红素氧还蛋白还原酶。整合载体通常包含一个或多个区段,该一个或多个区段包含编码目的多肽
的基因序列,该基因序列在提供其转录的额外核酸区段的控制下(即可操作地连接)。
[0298] 这样的额外的区段可以包括启动子和终止子序列,以及通常通过同源重组过程驱动目的基因掺入靶细胞基因组中的一个或多个区段。典型地,整合载体将是一种可以被转
移到靶细胞中的载体,但其具有在该生物体中无功能的复制子。如果包含目的基因的区段
中包含适当的标记,则可以选择该区段的整合。编码不与本发明宿主细胞中待表达的多肽
天然相关的适当信号肽的一个或多个核酸序列可整合到(表达)载体中。例如,信号肽前导
序列的DNA序列可以框内融合至本发明的核酸,使得可用于本发明的氧化酶或红素氧还蛋
白或红素氧还蛋白还原酶初始翻译为包含信号肽的融合蛋白。根据信号肽的性质,表达的
多肽将被不同地靶向。例如,在预期宿主细胞中起作用的分泌信号肽增强表达的多肽的细
胞外分泌。其他信号肽将表达的多肽引导至某些细胞器,如叶绿体、线粒体和过氧化物酶
体。信号肽可以在运输到预期细胞器上时从多肽上裂解或从细胞上裂解。在多肽的氨基或
羧基末端提供额外的肽序列的融合物是可能的。
[0299] 此外,本发明涉及包含本发明的载体或基因构建体的宿主细胞。
[0300] 用本发明的载体或基因构建体转化宿主细胞。熟练的技术人员熟知必须存在于遗传构建体中以成功转化、选择以及繁殖含有本发明的载体或基因构建体的宿主细胞的遗传
元件。本发明的宿主细胞能够表达包含在本发明的载体或基因构建体中的烷烃氧化系统的
一种或多种多肽。
[0301] 如本文所用,“转化(Transformation和transforming)”是指将异源核苷酸序列,如编码烷烃氧化系统(例如可用于本发明的氧化酶和任选地红素氧还蛋白以及任选地红素氧还蛋白还原酶)的核苷酸序列引入宿主细胞,而不考虑用于插入的方法,例如直接摄取、转导、缀合、f‑配合或电穿孔。外源性多核苷酸可维持为非整合载体,例如质粒,或可替代地可以整合到宿主细胞基因组中。
[0302] 根据本发明的宿主细胞可以基于本领域公知的标准遗传和分子生物学技术来生产,例如如以下中所述:Sambrook,J.,和Russell,D.W“.Molecular Cloning:A Laboratory Manual[分子克隆:实验室手册]”第3版,Cold Spring Harbor Laboratory Press[冷泉港
实验室出版社],冷泉港,纽约,(2001);和F.M.Ausubel等人编辑“, Current protocols in molecular biology[当前分子生物学方案]”,John Wiley and Sons,Inc.[约翰威利父子
公司],纽约(1987),以及后者的增刊。
[0303] 宿主细胞可以是选自微生物细胞的任何细胞,例如细菌细胞、古细菌细胞、真菌细胞如酵母细胞和原生生物细胞。宿主细胞也可以是藻类细胞或蓝细菌细胞、非人动物细胞或哺乳动物细胞、或植物细胞。
[0304] 特定地,宿主细胞可以选自以下生物体中的任一种:
[0305] 细菌:
[0306] 细菌宿主细胞可以例如选自由以下组成的组:埃希氏菌属、克雷白氏菌属、螺杆菌属、芽孢杆菌属、乳杆菌属、链球菌属、拟无枝酸菌属、红杆菌属、假单胞菌属、副球菌属、泛菌属或乳球菌属。
[0307] 革兰氏阳性:芽孢杆菌属、链霉菌属:
[0308] 有用的革兰氏阳性细菌宿主细胞包括但不限于芽孢杆菌属细胞,例如,嗜碱芽孢杆菌(Bacillus alkalophius)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢
杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、克劳氏芽孢杆菌
(Bacillus clausii)、凝结芽孢杆菌(Bacillus coagulans)、坚强芽孢杆菌(Bacillus 
firmus)、Jautus芽孢杆菌、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacillus 
licheniformis)、巨大芽孢杆菌(Bacillus megaterium)、短小芽孢杆菌(Bacillus 
pumilus)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)和苏金芽孢杆菌(Bacillus thuringiensis)。最优选的原核生物是芽孢杆菌
属细胞,优选地枯草芽孢杆菌、短小芽孢杆菌、地衣芽孢杆菌或迟缓芽孢杆菌的芽孢杆菌属细胞。
[0309] 一些其他优选的细菌包括放线菌目的菌株,优选地链霉菌属,优选地类球形链霉菌(Streptomyces  spheroides)(ATTC 23965)、热紫链霉菌(Streptomyces 
thermoviolaceus)(IFO 12382)、浅青紫链霉菌(Streptomyces lividans)或鼠灰链霉菌
(Streptomyces  murinus)或轮丝链轮丝菌物种轮枝菌(Streptoverticillum 
verticillium ssp.Verticillium)。其他优选的细菌包括类球红杆菌(Rhodobacter 
sphaeroides)、沼泽红单胞菌(Rhodomonas palustri)、乳链球菌(Streptococcus 
lactis)。进一步优选的细菌包括属于粘球菌属(Myxococcus)的菌株,例如变绿粘球菌
(M.virescens)。
[0310] 革兰氏阴性:大肠杆菌、假单胞菌属、红杆菌属、副球菌属或泛菌属物种
[0311] 优选的革兰氏阴性细菌是大肠杆菌、假单胞菌属物种,优选地,吡咯菌素假单胞菌(Pseudomonas purrocinia)(ATCC 15958)或荧光假单胞菌(Pseudomonas fluorescens)(NRRL B‑11)、荚膜红杆菌(Rhodobacter capsulatus)或类球红杆菌、产类胡萝卜素副球菌(Paracoccus carotinifaciens)或玉米黄质副球菌(Paracoccus zeaxanthinifaciens)或
菠萝泛菌(Pantoea ananatis)。
[0312] 真菌:
[0313] 曲霉属、镰刀菌属、木霉属
[0314] 宿主细胞可以是真菌细胞。如本文所用,“真菌”包括子囊菌门、担子菌门、壶菌门和接合菌门、以及卵菌门和半知菌亚门、和所有的丝分孢子(mitosporic)真菌。子囊菌门的代表性群体包括例如脉孢菌属、正青霉属(=青霉属)、翘孢霉属(=曲霉属)、散囊菌属(=曲霉属)和下面列出的真酵母。担子菌门的实例包括蘑菇、锈菌和黑粉菌。壶菌门的代表性群体包括例如异水霉属、芽枝霉属(Blastocladiella)、雕蚀菌属(Coelomomyces)和水生真菌。卵菌门的代表性群体包括例如水霉属(Saprolegniomycetous)水生真菌(水霉菌(water molds)),如绵霉属(Achlya)。丝分孢子真菌的实例包括曲霉属、青霉属、念珠菌属和链格孢属。接合菌门的代表性群体包括例如根霉属和毛霉属。
[0315] 一些优选的真菌包括属于半知菌亚门,丝孢纲的菌株,例如镰刀菌属、腐质霉属(Humicola)、木霉属(Tricoderma)、漆斑菌属(Myrothecium)、轮枝孢属(Verticillum)、
Arthromyces、卡尔黑霉属(Caldariomyces)、单格孢属(Ulocladium)、埃里砖格孢属
(Embellisia)、枝孢属(Cladosporium)或德氏霉属(Dreschlera),特别是尖孢镰刀菌
(Fusarium oxysporum)(DSM 2672)、特异腐质霉(Humicola insolens)、里氏木霉
(Trichoderma resii)、疣孢漆斑菌(Myrothecium verrucana)(IFO 6113)、黑白轮枝孢
(Verticillum alboatrum)、大丽轮枝孢(Verticillum dahlia)、Arthromyces ramosus
(FERM P‑7754)、卡尔黑霉(Caldariomyces fumago)、纸单格孢(Ulocladium 
chartarum)、大蒜埃里砖格孢(Embellisia alli)或halodes德氏霉菌。
[0316] 其他优选的真菌包括属于担子菌亚门,担子菌纲的菌株,例如鬼伞属、平革菌属(Phanerochaete)、革盖菌属(Coriolus)或栓菌属,特别是灰盖鬼伞f.微孢(Coprinus 
cinereus f.microsporus)(IFO 8371)、长根鬼伞(Coprinus macrorhizus)、黄孢原毛平革菌(Phanerochaete chrysosporium)(例如,NA‑12)或栓菌属(先前称为多孔菌属),例如变色栓菌(T.versicolor)(例如,PR4 28‑A)。
[0317] 进一步优选的真菌包括属于接合菌亚门,毛霉(Mycoraceae)纲的菌株,例如根霉属或毛霉属,特别是冻土毛霉(Mucor hiemalis)。
[0318] 酵母:
[0319] 毕赤酵母属
[0320] 酵母属
[0321] 真菌宿主细胞可以是酵母细胞。如本文所用的酵母包括产子囊酵母(内孢霉目)、产担子酵母和属于半知菌类(芽孢纲)的酵母。产子囊酵母分为蚀精霉科
(Spermophthoraceae)和酵母科(Saccharomycetaceae)。后者由四个亚科组成:裂殖酵母亚科(Schizosaccharomycoideae)(例如,裂殖酵母属)、拿逊酵母亚科(Nadsonioideae)、油脂酵母亚科(Lipomycoideae)和类酵母亚科(Saccharomycoideae)(例如,克鲁维酵母属、毕赤酵母属和酵母属)。产担子酵母包括白冬孢酵母属、红冬孢酵母属、掷酵母属
(Sporidiobolus)、线黑粉酵母属(Filobasidium)和线黑粉菌属(Filobasidiella)。属于半知菌类的酵母分为两个科:掷孢酵母科(例如,掷孢酵母属和布勒掷孢酵母属(Bullera))和隐球酵母科(例如,念珠菌属)。
[0322] 真核生物:
[0323] 真核宿主细胞进一步包括但不限于非人动物细胞、非人哺乳动物细胞、禽类细胞、爬行动物细胞、昆虫细胞或植物细胞。
[0324] 在优选的实施例中,宿主细胞是选自以下的宿主细胞:
[0325] a)革兰氏阴性细菌组的细菌细胞,如红杆菌属(例如,类球红杆菌或荚膜红杆菌)、副球菌属(例如,产类胡萝卜素副球菌(P.carotinifaciens)、玉米黄质副球菌(P.zeaxanthinifaciens))、埃希氏菌属或假单胞菌;
[0326] b)选自革兰氏阳性细菌组的细菌细胞,如芽孢杆菌属、棒状杆菌属、短杆菌属、无枝酸菌属(Amycolatopis);
[0327] c)选自以下组的真菌细胞:曲霉属、布拉霉属(Blakeslea)、青霉属、法夫酵母属(Phaffia、Xanthophyllomyces)、毕赤酵母属、酵母属、克鲁维酵母属、耶氏酵母属和汉逊酵母属;
[0328] d)转基因植物细胞或包含转基因植物细胞的培养物,其中该细胞是选自以下的转基因植物的细胞:拟南芥属物种(Arabidopsis spp.)、烟草属物种(Nicotiana spp)、菊苣(Cichorumintybus)、莴苣(lacuca sativa)、薄荷属物种、黄花蒿(Artemisia annua)、茎形成植物、油料作物,例如芸苔属物种或欧洲油菜(Brassica napus)、产生果实的开花植物(被子植物)和树木;
[0329] 或e)转基因蘑菇或包含转基因蘑菇细胞的培养物,其中微生物选自裂褶菌属(Schizophyllum)、伞菌属(Agaricus)和侧属(Pleurotisi)。
[0330] 来自生物体的更优选的宿主细胞是来自属于以下的微生物的宿主细胞:埃希氏菌属、酵母菌属、毕赤酵母属、红杆菌属、假单胞菌属、泛菌属或副球菌属(例如,产类胡萝卜素副球菌、玉米黄质副球菌),以及甚至更优选的以下物种的微生物:大肠杆菌、酿酒酵母、类球红杆菌、荚膜红杆菌、菠萝泛菌或无枝酸菌属物种。
[0331] 优选地,载体或基因构建体适于在如本文定义的微生物细胞中编码和产生本发明的烷烃氧化系统组分a和c以及任选的b和/或d。
[0332] 在一个实施例中,宿主细胞是选自荚膜红杆菌和类球红杆菌的组的红杆菌属宿主细胞。
[0333] 本发明的转基因非人生物体包含本发明的核酸、本发明的载体或基因构建体或本发明的宿主细胞。在优选的实施例中,本发明的转基因非人生物体用于制备如本文定义的
一种或多种氧化萜产物,如但不限于α甜橙醛、β甜橙醛、反式α檀香醇和反式β檀香醇、澳檀醇‑醛、圆柚酮、香根酮、莎草薁酮、瑞鲍迪甙、8‑羟基香叶醇、8‑羟基橙花醇或9,10‑环氧香叶基丙酮,如本说明书其他地方更详细描述的。通过用本发明的烷烃氧化系统对萜底物进
行烯丙基氧化来制备一种或多种氧化萜产物。
[0334] 优选地,本发明的转基因非人生物体是细菌、酵母、真菌、原生生物、藻类或蓝细菌、非人动物或非人哺乳动物、或植物。特定地,与本发明的宿主细胞有关的提及的生物体也可以用于生成本发明的转基因非人生物体。
[0335] 优选的是,细菌是革兰氏阴性细菌,优选红杆菌属、埃希氏菌属、假单胞菌属、泛菌属或副球菌属。
[0336] 如本文所用,转基因生物体或转基因细胞的术语“转基因”是指含有非天然存在于该生物体或细胞中的核酸的生物体或细胞(该细胞可以是生物体本身或从中分离出该细胞的多细胞生物体的细胞),并且该核酸已经使用本领域已知的重组DNA技术引入该生物体或
细胞中(即,已经引入该生物体或细胞本身或该生物体的祖先或该细胞已分离出的生物体
的祖先生物体中)。或者换种说法:该核酸对于转基因生物体或转基因细胞是异源的。
[0337] “转基因”是指基因,如氧化酶或红素氧还蛋白或红素氧还蛋白还原酶基因等基因,该基因已经通过转化被引入基因组中并且优选地被稳定地维持。优选地,转基因包括与待转化的特定细胞或生物体的基因异源的基因。此外,转基因可以包含被插入非天然生物
体中的天然基因或嵌合基因。术语“内源基因”是指位于生物体基因组的其天然位置中的天然基因。“外来”基因是指不是正常地发现于宿主生物体中但通过基因转移被引入的基因。
[0338] 用于生产转基因非人生物体的方法是本领域众所周知的;参见例如Lee‑Yoon Low等人,Transgenic Plants:Gene constructs,vector and transformation method.[转基
因植物:基因构建体、载体和转化方法]2018.DOI.10.5772/intechopen.79369;Pinkert,
C.A.(编辑)1994.Transgenic animal technology:A laboratory handbook.[转基因动物
技术:实验室手册]Academic Press,Inc.[学术出版社公司],圣地亚哥,加利福尼亚州;
Monastersky G.M.和Robl,J.M.(编辑)(1995)Strategies in Transgenic Animal 
Science.[转基因动物科学策略]ASM Press.[ASM出版社]华盛顿特区;Sambrook,上述引
文,Ausubel,上述引文。
[0339] 本发明的另一方面涉及通过上述方法或通过非人宿主细胞产生的组合物,其中该组合物包含:
[0340] 如本文定义的氧化酶;和
[0341] 至少一种选自以下的氧化萜产物:月桂烯醛、α甜橙醛、β甜橙醛、反式α檀香醇、反式β檀香醇、澳檀醇‑醛、圆柚酮、香根酮、莎草薁酮、瑞鲍迪甙、8‑羟基香叶醇、8‑羟基橙花醇、9,10‑环氧香叶基丙酮、十六碳烯醛、法尼醇、黑蚁素双环‑辛二醇、氧化α愈创木烯或氧化β愈创木烯或其组合;以及
[0342] 任选地,一种或多种萜底物。
[0343] 本发明的另一方面涉及通过如上文披露的方法产生的组合物。
[0344] 优选地,组合物包括至少一种氧化萜产物。该至少一种氧化萜产物包括α甜橙醛、β甜橙醛、反式α檀香醇和反式β檀香醇、澳檀醇‑醛、圆柚酮、香根酮、莎草薁酮、瑞鲍迪甙、8‑羟基香叶醇、8‑羟基橙花醇或9,10‑环氧香叶基丙酮。
[0345] 优选地该氧化萜产物选自α甜橙醛、β甜橙醛、反式α檀香醇、反式β檀香醇、圆柚酮和法尼醇。
[0346] 本发明的另一方面包括发酵组合物,其包含:
[0347] 在培养基中培养的如上文定义的非人宿主细胞;以及
[0348] 由该非人宿主细胞产生的作为主要化合物的至少一种氧化萜产物,其中该发酵组合物包括萜底物,并且任选地一种或多种副产物是次要化合物。
[0349] 术语“发酵”是指利用碳源(如糖)作为能源来生产所需产品的培养微生物。
[0350] 术语“培养基”是指允许生物质生长和产生微生物代谢物的培养基。它含有碳源,并且可以进一步含有氮源、磷源、维生素源、矿物质源等。
[0351] 如本文所用,术语“发酵培养基”可以与“培养基”同义使用。通常,术语“发酵培养基”可用于指适于长时间培养微生物以从微生物产生所需化合物的培养基。
[0352] 术语“培养基”是指培养基和/或发酵培养基。“培养基”可以是液体或半固体。给定的培养基可以是培养基和发酵培养基两者。
[0353] 术语“全细胞培养液”是指容器(例如烧瓶、板、发酵罐等)的全部内容物,包括细胞、水相、化合物(烃相和/或乳液中产生的)。因此,全细胞培养液包括培养基的混合物,该培养基包含水、碳源(例如糖)、矿物质、维生素、其它溶解或悬浮的物质、微生物、微生物产生的代谢物和化合物、以及保存在容器中的物质的所有其它成分,由微生物在该容器中产生一种或多种萜底物和/或氧化萜产物,包括例如氧化倍半萜产物。
[0354] 术语“发酵组合物”与“全细胞培养液”可互换使用。如果在发酵期间将发酵组合物添加到容器中,则发酵组合物还可以包括覆盖物。
[0355] 发酵过程可以分两个阶段进行‑构建阶段和生产阶段。构建阶段进行足以产生一定量的细胞生物质的一段时间,该细胞生物质可以支持萜底物的产生,并因此在生产阶段
期间支持氧化萜产物的产生。构建阶段进行一段时间,足以使接种时存在的群体经历多次
倍增,直到达到所需的细胞密度
[0356] 生产萜底物并因此生产氧化萜产物的方法可以包括通常在足以允许经遗传修饰的宿主细胞生长和维持的需氧条件下进行经遗传修饰的宿主细胞的发酵;然后随后提供足
以诱导产生萜底物(如月桂烯或其它萜,副产物)的微需氧发酵条件,并在整个发酵过程中
维持微需氧条件。微需氧条件可用于整个发酵过程。可以在生产阶段期间添加诱导剂以激
活启动子或减轻转录调节因子的抑制,从而促进萜底物和/或氧化萜产物的生产。
[0357] 生产萜底物以及烷烃氧化系统以及由此产生的氧化萜产物的方法可以包括在单独的构建和生产培养基中培养至少一种微生物宿主细胞。例如,该方法可以包括在构建阶
段培养至少一种经遗传修饰的微生物宿主细胞,其中在非生产条件(例如,非诱导条件)下
培养细胞以产生接种物,然后在适于诱导萜底物生产的条件(例如,诱导条件)下将接种物
转移到第二发酵培养基中,以及在第二发酵阶段维持稳态条件以产生含有萜底物以及烷烃
氧化系统并由此产生的氧化萜产物的细胞培养物。
[0358] 在另一实施例中,萜底物由一个宿主细胞产生,而另一个宿主细胞提供人工烷烃氧化酶系统。
[0359] 在一个实施例中,由一个宿主细胞产生的萜底物和由另一个宿主细胞提供的人工烷烃氧化酶系统属于相同物种,例如这两个宿主细胞来自红杆菌属物种。
[0360] 在另一实施例中,在混合发酵过程中提供两种宿主细胞。
[0361] 在发酵过程期间,宿主细胞中的人工烷烃氧化酶系统提供氧化酶、萜合酶(如果需要)、任选地电子转移化合物和进一步任选地电子转移化合物再生酶。至少一种萜底物的烯丙基氧化产生氧化萜产物。
[0362] 用于微生物培养物的维持和生长的培养基和培养条件对于微生物学或发酵科学领域的技术人员来说是众所周知的(参见例如,Bailey等人,Biochemical Engineering 
Fundamentals[生物化学工程基础],第二版,McGraw Hill[麦格劳‑希尔公司],纽约,
1986)。根据微生物宿主细胞、发酵和工艺的特定要求,可以选择合适的培养基、pH、温度以及对需氧、微需氧或厌氧条件的要求。
[0363] 在本文提供的生产氧化萜产物的方法中使用的培养基可以包括能够产生萜的经遗传修饰的微生物可以在其中生存的任何培养基,即支持和维持生长和生存力。培养基还
可以促进产生所需萜底物并因此产生氧化萜产物所必需的生物合成途径。
[0364] 培养基可以是包含可同化碳源、氮源和磷源的水溶液。这样的培养基还可以包括适当的盐、矿物质、金属和其他营养物。碳源和每种必需的细胞营养物可以递增或连续地添加到发酵培养基中,并且每种所需的营养物基本上维持在生长细胞有效同化所需的最低水
平,例如,根据基于将碳源转化为生物质的细胞的代谢或呼吸功能的预定细胞生长曲线。
[0365] 碳源可以是单糖(简单糖)、二糖、多糖、不可发酵的碳源或其一种或多种组合。合适的单糖的非限制性实例包括葡萄糖、半乳糖、甘露糖、果糖、核糖及其组合。合适的二糖的非限制性实例包括蔗糖、乳糖、麦芽糖、海藻糖、纤维二糖及其组合。合适的多糖的非限制性实例包括淀粉、糖原、纤维素、壳多糖及其组合。合适的不可发酵的碳源的非限制性实例包括乙酸盐和甘油。碳源可源自多种作物和来源。合适的作物或来源的一些非限制性实例包括甘蔗、甘蔗渣、芒草、甜菜、高粱、粮食高粱(grain sorghum)、柳枝稷、大麦、大麻、洋麻、马铃薯、甘薯、木薯、向日葵、水果、糖蜜、乳清脱脂乳、玉米、秸秆、谷物、小麦、木材、纸张、稻草、花、许多类型的纤维素废物和其他生物质。合适的作物或来源可包括甘蔗、甜菜和玉米。糖源可以是甘蔗汁或糖蜜。可以使用上述碳源的任何组合。
[0366] 合适的培养基可以补充有一种或多种另外的药剂,例如诱导剂(例如,当编码基因产物的一种或多种核苷酸序列受诱导型启动子控制时)、阻遏物(例如,当编码基因产物的
一种或多种核苷酸序列受阻遏型启动子控制时)或选择剂(例如,用于选择包含遗传修饰的
微生物的抗生素)。
[0367] 在发酵的生产阶段期间,可以将液体有机覆盖物添加到培养基中。液体有机覆盖物可以是与水性培养基接触的不混溶的有机液体,并且萜底物和其他副产物以及从微生物
分泌的氧化萜产物可以被捕获在该液体有机覆盖物中。液体有机覆盖物可以减少挥发性单
萜从发酵容器蒸发,并减少潜在的萜底物和/或氧化萜产物对微生物的毒性。覆盖物的实例包括但不限于肉豆蔻酸异丙酯(IPM)或其他烃类液体,如白色矿物油或聚α‑烯烃。
[0368] 发酵方法可以在合适的容器(container或vessel)中进行,包括但不限于细胞培养板、烧瓶或发酵罐。发酵可以在封闭系统中进行,以将萜截留在气相中。例如,封闭系统可以包括一系列彼此连接的容器,以捕获包括气相中的单萜在内的废气。例如,第一容器可以含有包含水性培养基和经遗传修饰的微生物的培养基。包含有机覆盖物的第二容器可以与
第一容器串联连接,以捕获挥发性萜。一个或多个另外的容器可以串联和/或并联连接至第一容器,以捕获包含萜底物和其他萜副产物以及氧化萜产物的气态组合物。
[0369] 此外,该方法可以以本领域已知的任何发酵规模进行以支持微生物产品的工业生产。可以使用任何合适的发酵罐,包括搅拌罐发酵罐、气升式发酵罐、鼓泡发酵罐或其任何组合。
[0370] 此外,这些方法可以在任何发酵体积下进行,例如从实验室规模(例如,10ml至20L)到中试规模(例如,20L至500L)再到工业规模(例如,500L至≥500,000L)的发酵。
[0371] 本文披露的是发酵组合物,其包含本文所述的经遗传修饰的微生物宿主细胞、培养基、和萜底物以及由经遗传修饰的微生物宿主细胞产生的氧化萜产物。在本文提供的发
酵组合物中,氧化萜产物典型地是主要化合物,并且包含备用萜底物以及作为次要化合物
的一种或多种副产物(与萜同时产生)。
[0372] 在实施例中,基于单萜的GC色谱图中显示的萜峰的相对面积%,与萜底物总量相比,发酵组合物包含相对于萜至少约50%的主要化合物和小于约50%的次要化合物。
[0373] 在另一实施例中,与培养基中萜底物的总量相比,发酵组合物包含相对于萜至少55%或60%或65%或70%或75%或80%或85%或90%或95%的主要化合物。
[0374] 在另一实施例中,与培养基中萜底物的总量相比,发酵组合物包含相对于萜至少45%或40%或35%或30%或25%或20%或15%或10%或5%的次要化合物。
[0375] 在另一实施例中,主要化合物包括至少两种氧化萜产物。在另外的实施例中,至少两种氧化萜产物包括反式α檀香醇和反式β檀香醇。
[0376] 在另一实施例中,使用产生多于一种萜(例如α愈创木烯和β愈创木烯的混合物)的萜合酶,该至少两种氧化萜产物也是氧化萜产物的混合物,例如氧化α愈创木烯和氧化β愈创木烯,作为主要化合物形成。
[0377] 本发明的另一个方面涉及发酵生产至少一种氧化萜产物的方法,该方法包括:
[0378] 提供具有如本文所述的氧化酶系统或表达盒的非人宿主细胞,
[0379] 任选地向该宿主细胞提供至少一种烷烃合酶用于烷烃底物生产;
[0380] 在该宿主细胞产生呈活性形式的编码的多肽的条件下,在培养基中培养非人宿主细胞;
[0381] 任选地,产生一种或多种烷烃底物和/或向该宿主细胞提供一种或多种烷烃底物;以及
[0382] 产生至少一种氧化烷烃产物;以及
[0383] 任选地,纯化该至少一种氧化烷烃产物。
[0384] 在实施例中,发酵生产至少一种氧化萜产物的方法包括提供细菌宿主细胞、优选地红杆菌属菌株。
[0385] 在另一实施例中,发酵生产至少一种氧化萜产物的方法包括生产甜橙醛。
[0386] 在另一实施例中,发酵生产至少一种氧化萜产物的方法包括氧化酶系统,该氧化酶系统包含
[0387] a.氧化酶;和
[0388] b.提供一种或多种烷烃的一种或多种酶
[0389] 以及任选地,
[0390] c.适于将至少一个电子转移至该氧化酶的电子转移化合物;以及进一步任选地
[0391] d.电子转移化合物再生酶,其适于将处于氧化状态的c.电子转移化合物还原;
[0392] 其中该氧化酶是与SEQ ID NO:1、10、11、23至43中的任一个或其片段或其变体具有至少62%、66%、69%、70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性的氨基酸序列。
[0393] 本发明的另一个方面涉及如披露的烷烃氧化系统的用途;或核酸序列或其表达盒的表达,其中合成核酸序列包含编码氧化酶和任选地红素氧还蛋白肽和/或红素氧还蛋白
还原酶肽的核酸序列;或用于氧化萜底物和产生一种或多种氧化萜产物的烷烃氧化系统的
表达盒。
[0394] 本发明的另一方面涉及生产烷烃氧化产物或组合物的方法,其中该氧化烷烃产物选自醇或醛或两者,包括月桂烯醛、α甜橙醛、β甜橙醛、反式α檀香醇和反式β檀香醇、澳檀醇‑醛、圆柚酮、香根酮、莎草薁酮、瑞鲍迪甙、8‑羟基香叶醇、8‑羟基橙花醇、9,10‑环氧香叶基丙酮、十六碳烯醛、法尼醇、黑蚁素和双环‑辛二醇、氧化α愈创木烯、氧化β愈创木烯或其组合。优选地该氧化产物选自α甜橙醛、β甜橙醛、反式α檀香醇、反式β檀香醇、圆柚酮和法尼醇。
[0395] 本发明的另一个方面涉及由本发明的烷烃氧化系统、本发明的方法或本发明的非人宿主细胞产生的组合物,其中该组合物包含一种或多种氧化萜产物,例如但不限于α甜橙醛、β甜橙醛、反式α檀香醇和反式β檀香醇、澳檀醇‑醛、圆柚酮、香根酮、莎草薁酮、瑞鲍迪甙、8‑羟基香叶醇、8‑羟基橙花醇、或9,10‑环氧香叶基丙酮或其组合,以及任选地一种或多种萜底物(优选地与其相应的氧化萜产物的重量比为3:1至1:10000),以及任选地如上定义
的氧化酶。在本发明的一方面,本发明的组合物还包含一种或多种电子转移化合物(优选地包括红素氧还蛋白)、和任选地适于将处于氧化状态的电子转移化合物还原的至少一种电
子转移化合物再生酶(优选地红素氧还蛋白还原酶)。
[0396] 在一个实施例中,萜底物与一种或多种氧化萜产物的重量比是250:1、或220:1、或200:1、或180:1、170:1、160:1。在优选的实施例中,该重量比是150:1、130:1、或120:1、110:
1、100:1。在更优选的实施例中,该重量比是99或更小:1,但大于0.1:1;例如,法呢烯与氧化萜产物的重量比是99:1至10:1,优选地31或更小:1,例如20、18、17或14:1。
[0397] 在实施例中,形成至少0.3%(w/w)的氧化萜产物。在优选的实施例中,形成0.6%(w/w)甜橙醛作为氧化萜产物。
[0398] 在例如通过提供α‑和β法呢烯产生多于一种氧化萜产物的情况下,在一个实施例中,第一氧化萜产物与第二氧化萜产物的比率为0.8:1至1:0.8,优选地0.9:1至1:0.9,更优选地1:1。
[0399] 本发明的另一个方面涉及用于制备具有氧化酶活性的变体多肽的方法,该方法包括以下步骤:
[0400] a)选择如本文披露的合成核酸序列或编码与SEQ ID NO:1、10、11、23至43中的任一个(优选地1、23、24、43)或其片段具有至少62%、66%、69%、70%、75%、80%、85%、
90%、94%、95%、98%或99%序列同一性的氨基酸序列的核酸;
[0401] b)修饰所选核酸以获得至少一种突变体核酸;
[0402] c)用突变体核酸序列转化该非人宿主细胞以表达由该突变体核酸序列编码的氧化酶;
[0403] d)除了由a)的所选核酸编码的氧化酶的功能之外,筛选该氧化酶的至少一种修饰的特性;以及,
[0404] e)任选地,重复工艺步骤(a)至(d)以获得具有所需变体功能的氧化酶;
[0405] f)任选地,从步骤(c)中获得的转化的非人宿主细胞中分离突变体核酸序列。
[0406] 该功能可以是SEQ ID NO:1、10、11、23、24或SEQ ID NO:25至43中的任一个,优选地SEQ ID NO:1、10、11或25至43的氧化酶。
[0407] 如本文所指的“多肽变体”/“变体多肽”意指具有氧化酶活性并与根据上述氧化酶实施例中的任一个的多肽基本同源的多肽,但由于一个或多个缺失、插入或取代,其氨基酸序列不同于由本发明的核酸序列中的任一个编码的氨基酸序列。
[0408] 变体可以包含保守取代的序列,这意味着给定的氨基酸残基被具有相似物理化学特征的残基取代。保守取代的实例包括一个脂肪族残基取代另一个脂肪族残基,如He、VaI、Leu或Ala彼此取代,或者一个极性残基取代另一个极性残基,如Lys和Arg之间;GIu和Asp之间;或GIn和Asn之间。参见Zubay,Biochemistry[生物化学],1983,Addison‑Wesley 
Pub.Co.[迪生‑威斯利出版公司]。这样的取代的效果可以使用取代评分矩阵(如PAM‑
120、PAM‑200和PAM‑250)来计算,如在Altschul,J.MoI.Biol.[分子生物学杂志],1991,
219,555‑565中讨论的。其他这样的保守取代,例如具有相似疏水性特征的整个区域的取
代,是众所周知的。本发明还涵盖天然存在的肽变体。这样的变体的实例是由交替的mRNA剪接事件或由本文所述的多肽的蛋白水解切割产生的蛋白质。可归因于蛋白水解的变异包
括,例如,在不同类型的宿主细胞中表达时N‑或C‑末端的差异,这是由于蛋白水解从由本发明的序列编码的多肽中去除了一个或多个末端氨基酸。
[0409] 表:下面的变体提供了允许交换的保守氨基酸位置(相对于SEQ ID NO:1)。
[0410] 表:变体
[0411]
[0412]
[0413] 本发明多肽的变体可用于获得例如所需的增强或降低的酶活性、修饰的区域化学或立体化学、或改变的底物利用或产物分布、增加的对底物的亲和力、改善的用于生产一种或多种所需化合物的特异性、增加的酶反应速度、在特定环境(pH、温度、溶剂等)中更高的活性或稳定性、或所需表达系统中改善的表达水平。变体或定点突变体可以通过本领域已
知的任何方法制备。天然多肽的变体和衍生物可以通过分离其他或相同植物品系或物种的
天然存在的变体或变体的核苷酸序列,或通过对编码本发明多肽的核苷酸序列的突变进行
人工编程来获得。天然氨基酸序列的改变可以通过多种常规方法中的任何一种来完成。
[0414] 由本发明多肽的氨基和羧基末端的额外肽序列融合产生的多肽变体可用于增强多肽的表达,可用于蛋白质的纯化或改善多肽在所需环境或表达系统中的酶活性。例如,这样的额外的肽序列可以是信号肽。因此,本发明涵盖本发明的多肽的变体,如通过与其他寡肽或多肽融合获得的变体和/或与信号肽连接的那些变体。本发明涵盖的融合多肽还包含
由其他功能性蛋白质(如来自萜生物合成途径的其他蛋白质)融合产生的融合多肽。
[0415] 因此,在实施例中,本发明提供了用于制备如上述实施例中任一个所述的具有氧化酶活性的变体多肽的方法,该方法包括以下步骤:
[0416] (a)选择如本文披露的合成核酸序列或编码与SEQ ID NO:1、10、11、23至43中的任一个或其片段具有至少62%、66%、69%、70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性的氨基酸序列的核酸;
[0417] (b)修饰所选核酸以获得至少一种突变体核酸;
[0418] (c)用突变体核酸序列转化宿主细胞或单细胞生物体以表达由该突变体核酸序列编码的多肽;
[0419] (d)筛选该多肽的至少一种修饰的特性;以及,
[0420] (e)任选地,如果多肽不具有所需变体氧化酶活性,则重复工艺步骤(a)至(d),直到获得具有所需变体氧化酶活性的多肽;
[0421] (f)任选地,如果在步骤(d)中鉴定出具有所需变体氧化酶活性的多肽,则分离在步骤(c)中获得的相应突变体核酸。
[0422] 根据优选的实施例,所制备的变体多肽能够产生作为主要化合物的氧化萜产物。
[0423] 根据甚至更优选的实施例,其能够产生主要化合物和次要化合物的混合物。氧化萜产物是主要化合物,并且一种或多种副产物是次要化合物,其中氧化萜产物占混合物的
至少60%、优选地至少80%、优选地至少90%。
[0424] 在步骤(b)中,可以例如通过随机诱变、位点特异性诱变或DNA改组来产生大量的突变体核酸序列。基因改组的详细过程见Stemmer,DNA  shuffling by random 
fragmentation and reassembly:in vitro recombination for molecular evolution.
[通过随机片段化和重装配进行的DNA改组:分子进化的体外重组]Proc Natl Acad Sci 
USA.[美国国家科学院院刊],1994,91(22):10747‑1075。简而言之,DNA改组是指在体外对已知序列进行随机重组的过程,涉及至少两个被选择用于重组的核酸。例如,可以通过合成含有突变体序列的寡核苷酸在特定基因座引入突变,其侧翼是能够与天然序列的片段连接
的限制位点。连接后,所得重建序列编码具有所需氨基酸插入、取代或缺失的类似物。可替代地,可以采用寡核苷酸定向的位点特异性诱变程序来提供改变的基因,其中可以通过取
代、缺失或插入来改变预定的密码子。
[0425] 因此,包含SEQ ID NO:1的多肽可以与编码核酸(例如从假单胞菌属物种以外的生物体分离)的任何其他氧化酶重组。因此,可以获得并分离突变体核酸,其可以用于根据标准程序(例如本发明实例中披露的程序)转化宿主细胞。
[0426] 在步骤(d)中,筛选步骤(c)中获得的多肽的至少一种修饰的特性,例如所需的修饰的酶活性。可以筛选表达的多肽的所需酶活性的实例包括增强或降低的酶活性(如通过
KM或Vmaχ值测量的)、修饰的区域化学或立体化学以及改变的底物利用或产物分布。
[0427] 酶活性的筛选可以根据技术人员熟悉的程序和本发明实例中披露的程序进行。步骤(e)提供了工艺步骤(a)‑(d)的重复,其可优选地并行进行。因此,通过产生大量的突变体核酸,可以同时用不同的突变体核酸转化许多宿主细胞,从而允许随后筛选升高数量的多
肽。因此,根据技术人员的判断,可以增加获得所需变体多肽的机会。
[0428] 优点:
[0429] 从葡萄糖的微生物培养物中生产氧化萜产物如甜橙醛是具有挑战性的,并且迄今为止还没有已知介导萜、优选地倍半萜上二烯丙基位置处氧化的酶。所披露的方法适用于
多种具有二烯丙基基团的萜底物,如檀香萜、巴伦西亚橘烯等。
[0430] 方法A
[0431] 气相色谱质谱(GC&MS)
[0432] 用1ml二氯甲烷(DCM)提取培养物。收集DCM相,经无水Na2SO4干燥,然后将其注入配备有质量选择检测器(型号5975C,安捷伦公司(Agilent))的7890A气相色谱仪(安捷伦公
司)中,在45‑450m/z范围内扫描。在250℃下,在Zebron ZB‑5MS柱(30m×0.25mm,厚度0.25μm;菲罗门公司(Phenomenex))上以1ml/min的氦气流速不分流进样1μl样品。温度程序为45℃下2.25min,然后以40℃/min升至300℃,然后300℃下3min。在月桂烯转化实验的情况下,MS检测器在室温下关闭8min以防止饱和,在法呢烯实验的情况下关闭14min。通过将化合物的保留指数和质谱与NIST 8数据库或文献数据进行比较来鉴定化合物。
[0433] 通过以下实施例以及由相应的从属引用和链接产生的实施例的组合来更详细地说明本发明:
[0434] I.一种人工烷烃氧化系统,其包含
[0435] a.氧化酶,和
[0436] b.提供至少一种烷烃的一种或多种酶,优选地萜合酶蛋白;
[0437] 任选地以及
[0438] c.适于将至少一个电子转移至该氧化酶的电子转移化合物,以及进一步任选地
[0439] d.电子转移化合物再生酶,其适于将处于氧化状态的c.电子转移化合物还原,
[0440] 其中该氧化酶是与SEQ ID NO:1、10、11、23至43中的任一个或其片段或其变体具有至少62%、66%、69%、70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性的氨基酸序列。
[0441] II.如实施例I所述的人工烷烃氧化系统,其中该烷烃由五碳结构单元组成,具有一至五个这样的结构单元;优选地萜,并且其中至少一种烷烃是萜,以及至少一种萜合酶蛋白作为组分b。
[0442] III.如实施例I或II所述的人工烷烃氧化系统,其中该电子转移化合物是电子转移蛋白,优选地F1‑S0型,更优选具有与SEQ ID NO:2或45中的任一个或其片段或其变体具有至少62%、66%、69%、70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性的氨基酸序列的红素氧还蛋白肽,或/并且电子转移化合物再生酶是电子转移蛋白还原酶,优选地红素氧还蛋白还原酶,更优选地与SEQ ID NO:3或其片段具有至少62%、66%、69%、
70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性的红素氧还蛋白还原酶肽。
[0443] IV.一种合成核酸序列,其与SEQ ID NO:4、SEQ ID NO:12、SEQ ID NO:17、SEQ ID NO:18、或SEQ ID NO:19或SEQ ID NO:44中的任一个具有至少62%、66%、69%、70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性,其中该合成核酸序列包含编码如实施例I所定义的氧化酶和任选地如实施例II所述的红素氧还蛋白肽和/或红素氧还蛋白还
原酶肽的核酸序列。
[0444] V.一种表达盒,其包含如实施例IV所述的合成核酸序列。
[0445] VI.一种表达盒,其包含编码如实施例I、II或III所述的烷烃氧化系统的核酸序列。
[0446] VII.一种表达盒,其包含烷烃氧化系统的核酸序列,这些核酸序列包含:
[0447] a.氧化酶的核酸序列,与SEQ ID NO:20中的任一个具有至少62%、66%、69%、70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性,或编码与SEQ ID NO:1、
10、11、23至43中的任一个具有至少62%、66%、69%、70%、75%、80%、85%、90%、94%、
95%、98%或99%序列同一性的氧化酶,以及
[0448] b.红素氧还蛋白肽的核酸序列,与SEQ ID NO:21中的任一个具有至少62%、66%、69%、70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性,以及任选地[0449] c.红素氧还蛋白还原酶肽的核酸序列,与SEQ ID NO:22具有至少62%、66%、
69%、70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性,或b和c与a的组合。
[0450] VIII.一种氧化至少一种萜底物的方法,该方法包括:
[0451] a.提供
[0452] i.如实施例I至III中任一项所述的人工烷烃氧化系统,或
[0453] ii.如实施例IV所述的合成核酸序列或如实施例V至VII所述的表达盒的表达,或
[0454] iii.编码氧化酶的核酸序列的表达,该氧化酶具有与SEQ ID NO:1、10、11、23至43中的任一个或其片段或其变体具有至少62%、66%、69%、70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性的氨基酸序列,以及
[0455] iv.任选地至少一种萜底物,如果不是由烷烃氧化系统产生;
[0456] 用于该至少一种萜底物的氧化;
[0457] b.对该萜底物进行烯丙基氧化以产生至少一种氧化萜产物;
[0458] c.提取该至少一种氧化萜产物。
[0459] IX.如实施例VIII所述的方法,其中该萜底物包括二萜、单萜或倍半萜,例如但不限于α法呢烯、β法呢烯、α红没药烯、β红没药烯、α佛手柑油烯、β佛手柑油烯、α檀香萜、β檀香萜、巴伦西亚橘烯、α愈创木烯、单萜香叶醇、橙花醇单萜、香叶基丙酮或其组合。
[0460] X.如实施例VIII或IX所述的方法,其中该氧化萜产物是醇或醛或两者。
[0461] XI.如实施例VIII至X中任一项所述的方法,其中该至少一种氧化萜产物选自月桂烯醛、α甜橙醛、β甜橙醛、反式α檀香醇和反式β檀香醇、澳檀醇‑醛、圆柚酮、香根酮、莎草薁酮、瑞鲍迪甙、8‑羟基香叶醇、8‑羟基橙花醇、9,10‑环氧香叶基丙酮、十六碳烯醛、法尼醇、黑蚁素和双环‑辛二醇、氧化α愈创木烯、氧化β愈创木烯或其组合。
[0462] XII.一种非人宿主细胞,其包含如实施例I至III中任一项所述的人工烷烃氧化系统、如实施例IV所述的合成核酸、如实施例V至VII所述的表达盒或适于通过如实施例VIII
至XI所述的方法氧化该萜底物。
[0463] XIII.如实施例XII所述的非人宿主细胞,其中该宿主细胞是红杆菌属物种。
[0464] XIV.一种组合物,其通过如实施例VIII至XI所述的方法或如实施例XII或XIII所述的非人宿主细胞产生,其中该组合物包含α甜橙醛、β甜橙醛、反式α檀香醇和反式β檀香醇、澳檀醇‑醛、圆柚酮、香根酮、莎草薁酮、瑞鲍迪甙、8‑羟基香叶醇、8‑羟基橙花醇、或9,
10‑环氧香叶基丙酮或其组合,以及任选地如前述实施例中任一项所定义的一种或多种萜
底物和任选地氧化酶。
[0465] XV.一种发酵组合物,其包含:
[0466] 在培养基中培养的实施例XII或XIII所述的非人宿主细胞;以及
[0467] 由该非人宿主细胞产生的作为主要化合物的至少一种氧化萜产物,
[0468] 其中该发酵组合物包括萜底物,并且任选地一种或多种副产物是次要化合物。
[0469] XVI.如实施例I至III所述的烷烃氧化系统、或如实施例IV所述的核酸序列或如实施例V至VII所述的表达盒的表达、如实施例XII所述的非人宿主细胞、或如实施例XV所述的发酵组合物用于氧化该萜底物的用途。
[0470] XVII.如实施例I至III所述的烷烃氧化系统,其中该氧化酶由SEQ ID NO:20编码,红素氧还蛋白肽由SEQ ID NO:21,并且/或该红素氧还蛋白还原酶肽由SEQ ID NO:22编码。
[0471] XVIII.一种烷烃氧化系统,其包含
[0472] a.氧化酶,该氧化酶具有与SEQ ID NO:1、10、11、23至43中的任一个或其片段或其变体具有至少62%、66%、69%、70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性的氨基酸序列,以及
[0473] b.异源倍半萜合酶蛋白,任选地以及
[0474] c.红素氧还蛋白肽,该红素氧还蛋白肽具有与SEQ ID NO:2中的任一个或其片段具有至少62%、66%、69%、70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性的氨基酸序列,或/和
[0475] d.与SEQ ID NO:3或其片段具有至少62%、66%、69%、70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性的红素氧还蛋白还原酶肽,或b和c与a的组合。
[0476] XIX.一种表达盒,其包含编码如实施例XVII和XVIII所述的烷烃氧化系统的核酸序列。
[0477] XX.一种氧化至少一种萜底物,优选地倍半萜底物的方法,该方法包括:
[0478] a.提供
[0479] i.如实施例I或II或XVII或XVIII所述的烷烃氧化系统,或
[0480] ii.如实施例IV所述的核酸序列或如实施例V或VII所述的表达盒的表达,或
[0481] iii.编码氧化酶的核酸序列的表达,该氧化酶具有与SEQ ID NO:1、10、11、23至43(alkB)中的任一个或其片段或其变体具有至少70%序列同一性的氨基酸序列,以及
[0482] iv.任选地萜,优选地倍半萜底物;
[0483] 用于该萜,优选地倍半萜底物的羟基化,
[0484] b.用该烷烃氧化系统对该萜,优选地倍半萜底物进行烯丙基氧化以产生一种或多种氧化萜产物
[0485] c.提取该一种或多种氧化萜产物。
[0486] XXI.一种通过如实施例VIII至XII中任一项所述的方法生产至少一种氧化萜产物的方法。
[0487] XXII.如实施例XII所述的非人宿主细胞或如实施例XV所述的发酵组合物用于氧化萜产物的用途。
[0488] XXIII.一种发酵生产至少一种氧化萜产物的方法,该方法包括:
[0489] 提供具有如前述实施例中任一项所述的氧化酶系统的非人宿主细胞;
[0490] 在培养基中培养该非人宿主细胞以产生至少一种氧化萜产物。XXIV.一种用于该人工烷烃氧化系统的试剂盒,该试剂盒包含
[0491] 与SEQ ID NO:1、10、11、23至43中的任一个具有至少62%、66%、69%、70%、75%、80%、85%、90%、94%、95%、98%或99%序列同一性的第一分离的核酸序列,其中该第一核酸序列包含编码如实施例I所定义的氧化酶的核酸序列,以及
[0492] 不与编码电子转移蛋白的第一核酸物理连接的第二分离的核酸序列,以及
[0493] 任选地编码电子转移蛋白还原酶的第三核酸序列,其中该第三核酸序列可以与该第一和/或第二核酸序列融合。
[0494] XXV.一种用于制备具有其用作任何组分a至d所需功能的变体多肽的方法,该方法包括以下步骤:
[0495] a)选择本发明的核酸或编码本发明的多肽的核酸;
[0496] b)修饰所选核酸以获得至少一种突变体核酸;
[0497] c)用突变体核酸序列转化宿主细胞或单细胞生物体以表达由该突变体核酸序列编码的多肽;
[0498] d)除了由a)的所选核酸编码的多肽的功能之外,筛选该多肽的至少一种修饰的特性;以及,
[0499] e)任选地,如果多肽不具有所需的多肽功能,则重复工艺步骤(a)至(d),直到获得作为任何组分a至d的具有所需的变体功能的多肽;
[0500] f)任选地,如果在步骤(d)中鉴定出具有所需变体功能的多肽,则分离在步骤(c)中获得的相应突变体核酸。
[0501] 实例
[0502] 结合以下实施例来进一步说明本发明。提供这些实例是为了举例说明本发明,但不旨在以任何方式限制当前要求保护的本发明的范围。实例中的术语和缩写具有其共同含
义。例如,“%”、“Eq.wt.”、“Eq.”、“℃”、“wt.%”、“%w/w”、“%w/v”和“gm”分别表示“百分比”、“当量重量”、“当量”、“摄氏度”、“重量百分比”、“重量比重量的百分比(percent weight by weight)”、“重量比体积的百分比”和“克”。
[0503] 本发明涉及第三方公布的生物材料的数字序列信息。例如,对于SEQ ID NO:1至3和20至21的序列,披露了作为公布的数字序列信息来源的生物材料来源于荷兰。(Soares‑Castro 2017Appl Environ Microbiol[应用环境微生物学]83:e03112‑16.)。
[0504] 序列
[0505]
[0506]
[0507]
[0508]
[0509] 化合物、组合物、组分
[0510] 载体
[0511] 标准方法和仪器
[0512]
[0513] 实例1:在大肠杆菌中表达M1‑alkB的构建体
[0514] 设计构建体用于在大肠杆菌中表达M1‑alkB(PM1_0216370)、M1‑红素氧还蛋白(PM1_0216365)和M1‑红素氧还蛋白还原酶(分别为SEQ ID NO:20至22)。M1 alkB位于假单
胞菌M1基因组重叠群2上的位置3472570‑3471680处,并且M1‑红素氧还蛋白紧邻M1‑alkB下游编码。M1‑红素氧还蛋白还原酶不与M1‑alkB共定位,而是位于假单胞菌M1基因组重叠群2上的位置438956‑437814处(Soares‑Castro和Santos,2014,Genome Biol.Evol.[基因组生物学与进化]7(1):1‑17),并使用来自荧光假单胞菌的红素氧还蛋白还原酶(登录号
SUD34760.1)作为诱饵,通过blast鉴定。
[0515] M1‑alkB、M1‑红素氧还蛋白和M1‑红素氧还蛋白还原酶的蛋白质序列分别为SEQ ID NO:1、SEQ ID NO:2、和SEQ ID NO:3。
[0516] 为了在大肠杆菌中表达M1蛋白,使用标准计算机工具对开放阅读框进行密码子优化,以便在类球红杆菌中进行表达,并使用标准服务提供商合成人工DNA片段,其中编码M1‑alkB、M1‑红素氧还蛋白和M1红素氧还蛋白还原酶。
[0517] SEQ ID NO:4的合成核酸序列提供了M1‑alkB‑红素氧还蛋白‑红素氧还蛋白还原酶构建体。
[0518] 使用XbaI和NotI限制位点将SEQ ID NO:4克隆到载体pET‑DUET1中,产生用于表达的pET‑M1‑alkB‑rr‑rrr。
[0519] 在替代实例1a中,SEQ ID NO:43中所示的CMR5c蛋白代表CMR5氧化酶/AlkB氧化酶。SEQ ID NO.44的合成DNA序列编码SEQ ID NO:43的蛋白质(组分a)以及SEQ ID NO:45中
所示的红素氧还蛋白肽(组分c)。SEQ ID NO.44具有覆盖ATG和TGA的“ATGA”重叠区域,在TG处重叠。重叠部分中的ATG在888bp位置处充当红素氧还蛋白肽(组分c)的起始密码子。
[0520] 实例2:测试M1‑alkB转化月桂烯和β法呢烯的能力
[0521] 将构建体pET‑DUET‑1和pET‑M1‑alkB‑rr‑rrr转化至大肠杆菌BL21‑DE3,并在含有1%葡萄糖和100ug/ml氨苄青霉素的LB‑琼脂上进行选择。将携带pET‑M1‑alkB‑rr‑rrr和pET‑DUET1的转化体接种在含有100ug/ml氨苄青霉素的LB中,并在37℃和225rpm下生长过
夜。随后,将培养物在10ml 2xYT+Amp液体培养基中以1:20稀释,并在37℃和225rpm下孵育2小时,直到A600为0.6。然后添加1mM IPTG,并在30℃ 225rpm下将培养物孵育2h。随后,将
3ml培养物与10ul月桂烯或10ulβ法呢烯混合,或不与任何产物混合,封闭在带螺旋盖的4ml玻璃小瓶中,并在225rpm和30℃下孵育3小时。随后,提取后,通过方法A从培养物中鉴定化合物。
[0522] 图1a中示出了用pET‑DUET比较菌株(CS1)和pET‑M1‑alkB‑rr‑rrr(即具有人工烷烃氧化系统的菌株或本发明菌株)(IS1)通过大肠杆菌BL21进行的月桂烯转化。
[0523] 当比较表达pET‑DUET1(CS1)和pET‑M1‑alkB‑rr‑rrr(IS1)的细菌培养物时,观察到月桂烯的氧化产物。值得注意的是,观察到10.7min后洗脱的化合物(参见化合物2,图1c),通过与文献的化合物1(参见图1b)比较,通过质谱将其鉴定为月桂烯醛。此外,还鉴定出了几种苧烯的氧化产物,这些产物可能源自月桂烯批次中5%的苧烯污染。苧烯产物的峰强度与月桂烯醛的强度在相同的范围内,表明苧烯比月桂烯更适合作为底物。月桂烯醛形
成的观察显示,当M1‑alkB与M1‑红素氧还蛋白和M1‑红素氧还蛋白还原酶共表达时,可以介导月桂烯在其二烯丙基位置处的氧化。
[0524] 参考图2,当β法呢烯用作表达pET‑DUET1(CS1)和pET‑M1‑alkB‑rr‑rrr(IS1)的细菌培养物的底物时,也观察到特异性转化产物,但不太明显(参见图2)。产物对应于十六碳烯醛(14.1min)、法尼醇(14.8min))、黑蚁素(15.3min)和双环‑辛二醇(16.0min)。特别是对法尼醇和黑蚁素的观察表明,法呢烯被M1‑alkB用作底物,但在二烯丙基位置以外的其他位置进行了修饰,这显示出其广泛的萜氧化能力。
[0525] 实例3:红杆菌属中alkB表达的构建
[0526] 以下合成DNA的片段由用于定制DNA合成的标准服务提供商合成,并在载体pUC57中克隆获得。
[0527] 编码SEQ ID NO:6、SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9的蛋白质序列的DNA是烷烃氧化系统组分b的实例:(AaBFS)β‑法呢烯合酶、(MdAFS)α‑法呢烯合酶、(ZoBBS)生姜‑(S)‑β‑红没药烯合酶、(CiCaSSy)来自龙脑樟树(Cinnamomum camphora)的植物萜合酶。
[0528] SEQ ID NO:10和SEQ ID NO:11分别是突变的烷烃氧化系统组分a、由F93S的发明人引入的具有点突变的alkB(M1‑alkB‑F93S)和由W189S的发明人引入的具有点突变的(M1‑alkB‑W189S)烷烃氧化系统的序列,作为另外的组分a的实例。
[0529] 分别对应于(AaBFS)黄花蒿β‑法呢烯合酶、(M1‑alkB‑rr‑rrr)烷烃氧化系统组分a、c和d、以及(D000)空白序列的SEQ ID NO:5、SEQ ID NO:12、SEQ ID NO:13的核酸序列由标准服务提供商合成。
[0530] 这些序列作为pUC57的一部分递送。
[0531] 随后,使用限制酶EcoRI和HindIII消化质粒pUC57‑AaBFS。根据标准程序,将质粒pUC57‑M1‑alkB‑rr‑rrr和pUC57‑D000各自用BamHI和HindIII消化,并在连接反应中与BamHI‑EcoRI消化的p‑m‑LPppa‑CiCaSSy‑mpmii alt组合(描述于US2020/0010822中)。将连接物转化到大肠杆菌S17‑1中,并在含有100ug/ml新霉素的LB上进行选择。
[0532] 所得大肠杆菌S17‑1菌落携带质粒pBBR‑AaBFS‑M1‑alkB‑rr或pBBR‑MVA‑AaBFS‑D000。使用国际专利申请WO 2011074954(参见第64至67页)中披露的方法将这些质粒与类球红杆菌菌株Rs265‑9c缀合,并使用含有 培养基和100ug/ml新霉素的板选择反式缀合
物。选择携带质粒pBBR‑MVA‑AaBFS‑M1‑alkB‑rr或pBBR‑MVA‑AaBFS‑D000的红杆菌属菌落。
所得菌株以其质粒命名。
[0533] 基本上如WO 2018160066 A1中所述,将菌株Rs265‑9c‑pBBR‑MVA‑AaBFS‑M1‑alkB‑rr‑rrr(IS2)(携带β‑法呢烯合酶、氧化酶alkB和红素氧还蛋白以及红素氧还蛋白还原酶)和作为对照的Rs265‑9c‑pBBR‑MVA‑AaBFS‑D000(CS2)在20ml RS102培养基中培养,使用2ml正十二烷作为覆盖物。培养72h后收获正十二烷层,并基本上如WO 2018160066 A1中所述通过GC‑MS进行分析(参见图3a)。
[0534] 培养物Rs265‑9c‑pBBR‑MVA‑AaBFS‑D000(CS2)的正十二烷含有β‑法呢烯作为主峰,洗脱时间为16.81min。来自Rs265‑9c‑pBBR‑MVA‑AaBFS‑M1‑alkB‑rr‑rrr(IS2)的十二烷在22.23min处显示出额外的峰,而(CS2)Rs265‑9c‑pBBR‑MVA‑AaBFS‑D000中没有该峰(参见图3b)。将22.23min洗脱的峰的质谱和保留时间与甜橙醛标准品(Aroma Uden公司)的质谱和保留时间进行比较,揭示该峰代表β甜橙醛(参见图3c的(IS2)Rs265‑9c‑pBBR‑MVA‑
AaBFS‑M1‑alkB‑rr‑rrr,并参见图3d的甜橙醛标准品)。
[0535] 定量分析揭示,每kg十二烷产生15.2g法呢烯,而每kg十二烷产生0.38g甜橙醛。
[0536] 实例4:
[0537] 测试了M1‑alkB模块是否能够将α法呢烯氧化为α甜橙醛。首先,从标准服务提供商处订购表达来自苹果(Malus domesticus)的α法呢烯合酶的合成构建体,并以质粒pUC57形式递送。
[0538] SEQ ID NO:14的核酸序列对应于(MdAFS)α‑法呢烯合酶的核酸。
[0539] 随后,使用限制酶EcoRI和HindIII消化质粒pUC57‑MdAFS。根据标准程序,将质粒pUC57‑M1‑alkB‑rr‑rrr和pUC57‑D000各自用BamHI和HindIII消化,并在连接反应中与BamHI‑EcoRI消化的p‑m‑LPppa‑CiCaSSy‑mpmii alt pDEST4组合。将连接物转化到大肠杆菌S17‑1中,并在含有100ug/ml新霉素的LB上进行选择。
[0540] 所得大肠杆菌S17‑1菌落携带质粒pBBR‑MVA‑MdAFS‑M1‑alkB‑rr‑rrr或pBBR‑MVA‑MdAFS‑D000。使用如国际专利申请WO 2011074954中的标准程序将这些质粒与类球红杆菌菌株Rs265‑9c缀合,并使用含有 培养基和100ug/ml新霉素的板选择反式缀合物。选择携
带质粒pBBR‑MVA‑MdAFS‑M1‑alkB‑rr‑rrr或pBBR‑MVA‑MdAFS‑D000的红杆菌属菌落。所得菌株以其质粒命名。
[0541] 基本上如WO 2018160066 A1中所述,将不含酶的菌株(IS3)Rs265‑9c‑pBBR‑MVA‑MdAFS‑M1‑alkB‑rr‑rrr和(CS3)Rs265‑9c‑pBBR‑MVA‑MdAFS‑D000在20ml RS102培养基中培养,使用2ml正十二烷作为覆盖物。培养72h后收获正十二烷层,并基本上如WO 2018160066A1中所述通过GC‑MS进行分析。
[0542] 对照培养物(CS3)Rs265‑9c‑pBBR‑MVA‑MdAFS‑D000的正十二烷含有α‑法呢烯作为主峰,洗脱时间为19.28min。来自(IS3)Rs265‑9c‑pBBR‑MVA‑AaBFS‑M1‑alkB‑rr‑rrr的十二烷在24.88min处显示出额外的峰,而(CS3)Rs265‑9c‑pBBR‑MVA‑MdAFS‑M1‑D000中没有该峰(参见图4)。将24.883min洗脱的峰的质谱和保留时间与甜橙醛标准品(Aroma Uden公司)的质谱和保留时间进行比较,揭示该峰代表α甜橙醛。
[0543] 实例5:
[0544] 测试了M1‑alkB模块是否能够将其他倍半萜氧化为醛。首先,由标准服务提供商合成表达来自生姜(BAI67934.1)的β红没药烯合酶(ZoBBS)的合成构建体和表达来自龙脑樟树(QNV69588.1)的檀香萜合酶(CiCaSSy)的合成构建体,并以质粒pUC57形式递送。
[0545] SEQ ID NO:15和SEQ ID NO:16的核酸序列对应于生姜‑(S)‑β‑红没药烯合酶(ZoBBS)和来自龙脑樟树的植物萜合酶(CiCaSSy)。
[0546] 随后,使用限制酶EcoRI和HindIII消化质粒pUC57‑ZoBBS和pUC57‑CiCaSSy。根据标准程序,将质粒pUC57‑M1‑alkB‑rr‑rrr和pUC57‑D000各自用BamHI和HindIII消化,并在连接反应中与BamHI‑EcoRI消化的p‑m‑LPppa‑CiCaSSy‑mpmii alt组合。将连接物转化到大肠杆菌S17‑1中,并在含有100ug/ml新霉素的LB上进行选择。
[0547] 所得大肠杆菌S17‑1菌落携带质粒pBBR‑MVA‑ZoBBS‑M1‑alkB‑rr‑rrr或pBBR‑MVA‑ZoBBS‑D000、以及BBR‑MVA‑CiCaSSy‑M1‑alkB‑rr‑rrr或pBBR‑MVA‑CiCaSSy‑D000。使用标准方法将这些质粒与类球红杆菌菌株Rs265‑9c缀合,并使用含有 培养基和100ug/ml新霉素的板选择反式缀合物。选择携带质粒pBBR‑MVA‑ZoBBS‑M1‑alkB‑rr‑rrr或pBBR‑MVA‑ZoBBS‑D000、以及BBR‑MVA‑CiCaSSy‑M1‑alkB‑rr‑rrr或pBBR‑MVA‑CiCaSSy‑D000的红杆菌属菌落。所得菌株以其质粒命名。
[0548] 基本上如WO 2018160066 A1中所述,将菌株(IS4)Rs265‑9c‑pBBR‑MVA‑ZoBBS‑M1‑alkB‑rr‑rrr和作为对照的(CS4)Rs265‑9c‑pBBR‑MVA‑ZoBBS‑D000,(IS5)Rs265‑9c‑pBBR‑MVA‑CiCaSSy‑M1‑alkB‑rr‑rrr和作为对照的(CS5)Rs265‑9c‑pBBR‑MVA‑CiCaSSy‑D000在20ml RS102培养基中培养,使用2ml正十二烷作为覆盖物。培养72h后收获正十二烷层,并基本上如WO 2018160066 A1中所述通过GC‑MS进行分析。
[0549] 参考图6,培养物Rs265‑9c‑pBBR‑MVA‑CiCaSSy‑D000的正十二烷含有β‑α檀香萜、佛手柑油烯和β檀香萜作为主峰,保留时间分别为17.23min和18.23min。来自Rs265‑9c‑pBBR‑MVA‑CiCaSSy‑M1‑alkB‑rr‑rrr的十二烷在23.75min和24.66min处显示出额外的峰,而(CS5)Rs265‑9c‑pBBR‑MVA‑CiCaSSy‑M1‑D000中没有这些峰。将23.75min和24.66min洗脱的峰的质谱和保留时间与NIST文库和檀香标准品的质谱和保留时间进行比较,揭示这些峰对应于反式α檀香醇和反式β檀香醇。
[0550] 参考图5,培养物(CS4)Rs265‑9c‑pBBR‑MVA‑ZoBBS‑D000的正十二烷含有β‑红没药烯作为主峰,洗脱时间为19.37min。来自(IS4)Rs265‑9c‑pBBR‑MVA‑ZoBBS‑M1‑alkB‑rr‑rrr的十二烷在25.16min处显示出额外的峰,而(CS4)Rs265‑9c‑pBBR‑MVA‑ZoBBS‑M1‑D000中没有该峰。GC MS分析揭示,该峰代表澳檀醇‑醛、来自β红没药烯的烯丙基氧化产物。
[0551] 实例6:
[0552] M1‑alkB突变的影响
[0553] 设计了M1‑alkB蛋白的两个突变体,产生M1‑alkB‑F93S变体和M1‑alkB‑W189S。这两种突变体的表达构建体由标准服务提供商合成。
[0554] 随后,使用限制酶EcoRI和HindIII消化质粒pUC57‑AaBFS。根据标准程序,将质粒pUC57‑M1‑alkB‑F93S‑rr‑rrr(携带SEQ ID NO:17的序列)和pUC57‑M1‑alkB‑W189S‑rr‑rrr(携带SEQ ID NO:18的序列)各自用BamHI和HindIII消化,并在连接反应中与BamHI‑EcoRI消化的p‑m‑LPppa‑CiCaSSy‑mpmii alt组合(描述于US2020/0010822中)。将连接物转化到大肠杆菌S17‑1中,并在含有100ug/ml新霉素的LB上进行选择。
[0555] 所得大肠杆菌S17‑1菌落携带质粒pBBR‑AaBFS‑M1‑alkB‑F93S‑rr‑rrr或pBBR‑MVA‑AaBFS‑M1‑alkB‑W189S‑rr‑rrr。使用标准方法将这些质粒与类球红杆菌菌株Rs265‑9c缀合,并使用含有 培养基和100ug/ml新霉素的板选择反式缀合物。选择携带质粒pBBR‑MVA‑AaBFS‑M1‑alkB‑F93S‑rr‑rrr或pBBR‑MVA‑AaBFS‑M1‑alkB‑W189S‑rr‑rrr的红杆菌属菌落。所得菌株以其质粒命名。
[0556] 如实例3中所述,将菌株(IS6a)Rs265‑9c‑pBBR‑MVA‑AaBFS‑M1‑alkB‑F93S‑rr‑rrr和(IS6b)Rs265‑9c‑pBBR‑MVA‑AaBFS‑M1‑alkB‑W189S‑rr‑rrr在20ml RS102培养基中培养,使用2ml正十二烷作为覆盖物。培养72h后收获正十二烷层,并通过GC‑MS进行分析。
[0557] 定量分析揭示,对于两种菌株(IS6a)Rs265‑9c‑pBBR‑MVA‑AaBFS‑M1‑alkB‑F93S‑rr‑rrr和(IS6b)Rs265‑9c‑pBBR‑MVA‑AaBFS‑M1‑alkB‑W189S‑rr‑rrr,每kg十二烷产生16.0g法呢烯。对于菌株(IS6a)Rs265‑9c‑pBBR‑MVA‑AaBFS‑M1‑alkB‑F93S‑rr‑rrr,每kg十二烷产生0.81g甜橙醛,而对于(IS6b)Rs265‑9c‑pBBR‑MVA‑AaBFS‑M1‑alkB‑W189S‑rr‑rrr,每kg十二烷产生0.51g甜橙醛。因此,M1‑alkB中的两种突变似乎都有助于提高甜橙醛产量。
[0558] SEQ ID NO:17和SEQ ID NO:18的核酸序列对应于a中具有F93S点突变的烷烃氧化系统组分a和c(即M1‑alkB‑F93S‑rr‑rrr)和a中具有W189S点突变的烷烃氧化系统组分a和c(即M1‑alkB‑W189S‑rr‑rrr)。
[0559] 表1:实例2至7中转化的菌株、底物和产物。
[0560]
[0561]
[0562] 实例7:点突变
[0563] alkB蛋白的位置93编码苯丙氨酸。F93位置被改变为丝氨酸,并且M1‑alkB与β法呢烯合酶、红素氧还蛋白和任选地红素氧还蛋白还原酶组合引入。点突变与β甜橙醛生产力提高相关。点突变还与作为副产物的法尼醇以及氧化萜终产物的形成有关。
[0564] 在位置93处观察到的点突变包括F93V、F93I、F93A、F93R、F93W、F93T、F93G。其中,当与β法呢烯合酶组合时,F93A产生最高量的β甜橙醛。对于F93A突变体,没有观察到法尼醇的形成。
[0565] 表2:F93点突变。
[0566]
[0567] 上表2提供了在72小时内通过alkB蛋白中第93位的残基处的点突变获得的β法呢烯和β甜橙醛的量。最初第93个残基是“F”。与第93位具有F的原始alkB相比,与菌株(IS7a)即Rs265‑9c‑pBBR‑MVA‑AaBFS‑M1‑alkB‑F93S‑rr‑rrr‑2、(IS7b)即Rs265‑9c‑pBBR‑MVA‑AaBFS‑M1‑alkB‑F93V‑rr‑rrr、(IS7c)即Rs265‑9c‑pBBR‑MVA‑AaBFS‑M1‑alkB‑F93G‑rr‑rrr和(IS7d)即Rs265‑9c‑pBBR‑MVA‑AaBFS‑M1‑alkB‑F93A‑rr‑rrr相关的F93S、F93V、F93G、F93A的点突变与β法呢烯和β甜橙醛产量的提高相关。
[0568] 然而,F93R、F93I、F93W、F93T的点突变与氧化萜产物产量的提高无关,这种提高是相对于最初的第93个残基即“F”而言的。
[0569] 实例8:在没有组分d且没有MVA的情况下的甜橙醛生产
[0570] 类似于上文的实例3,测试了携带构建体Rs265‑9c‑pBBR‑AaBFS‑M1‑alkB‑rr‑rrr的菌株IS8。与实例3的差异在于,菌株IS8不包含红素氧还蛋白还原酶或另一种外源性组分d,并且也不包含异源MVA途径。所产生的甜橙醛的量与IS2的甜橙醛产量相当,证明单独的组分a、b和c足以产生氧化萜产物甜橙醛。
[0571] 实例9
[0572] 类似于上文实例3中alkB构建体的测试,测试了SEQ ID NO:44的构建体。结果显示CMR5c蛋白也适合作为烷烃氧化系统中的氧化酶。
[0573] 实例10
[0574] 基于如上所述的变体多肽的制备方法,可以获得SEQ ID NO.25至42的变体多肽。图7a和7b示出了本发明的多肽与所示位置处的保守氨基酸的比对。本发明的多肽变体在图
7a和7b所示的位置处包含保守氨基酸。保守氨基酸位置在图中用黑色背景上白色字体的字
母表示
[0575] 实例11
[0576] 基于上文披露的方法,对上述红杆菌属物种的菌株进行了另外的实验分析。开发了一种菌株,使得该菌株携带烷烃氧化系统的所有组分a、b、c和d。开发了另一种菌株,使得该菌株仅携带组分a(氧化酶)和组分b(萜合酶),而不携带组分c(红素氧还蛋白)和组分d
(红素氧还蛋白还原酶)。两种菌株均显示出β法呢烯对β甜橙醛的氧化。
[0577] 下表3提供了72小时后菌株的β法呢烯和β甜橙醛的量。
[0578] 表3
[0579]
QQ群二维码
意见反馈