首页 / 专利库 / 专利权 / 申请 / 国际申请 / 权利要求 / 制备高强度甜味剂的方法

制备高强度甜味剂的方法

阅读:787发布:2020-06-12

专利汇可以提供制备高强度甜味剂的方法专利检索,专利查询,专利分析的服务。并且本文提供的方法包括制备 罗汉果 苷化合物(例如化合物1)的方法,用于制备罗汉果苷化合物的组合物(例如宿主细胞),以及通过本文公开的方法制备的罗汉果苷化合物,以及包含罗汉果苷化合物的组合物(例如,细胞裂解物)和重组细胞。本文还提供了新的葫芦二烯醇合酶及其用途。,下面是制备高强度甜味剂的方法专利的具体信息内容。

1.一种产生具有以下结构的化合物1的方法:
该方法包括:
使罗汉果苷IIIE与能够催化从罗汉果苷IIIE产生化合物1的第一酶接触
2.如权利要求1所述的方法,其中,使罗汉果苷IIIE与第一酶接触包括使罗汉果苷IIIE与包含编码该第一酶的第一基因的重组宿主细胞接触。
3.如权利要求2所述的方法,其中,所述第一基因与所述重组宿主细胞是异源的。
4.如权利要求2或3所述的方法,其中罗汉果苷IIIE存在于所述重组宿主细胞中和/或由所述重组宿主细胞产生。
5.如权利要求2-4中任一项所述的方法,包括在表达第一酶的条件下在培养基中培养
该重组宿主细胞。
6.如权利要求1-5中任一项所述的方法,其中,所述第一酶是UDP糖基转移酶、环麦芽糊精葡聚糖转移酶(CGTases)、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。
7.如权利要求1-6中任一项所述的方法,其中,所述第一酶是CGTase。
8.如权利要求7所述的方法,其中,所述CGTase包含与SEQ ID NO:1、3、78-101、148和
154中任何一者的序列具有至少70%序列同一性的基酸序列。
9.如权利要求7所述的方法,其中,所述CGTase包含SEQ ID NO:1、3、78-101、148和154中任何一者的氨基酸序列。
10.如权利要求7所述的方法,其中,所述CGTase由SEQ ID NO:1、3、78-101或154的氨基酸序列组成。
11.如权利要求1-6中任一项所述的方法,其中,所述第一酶为葡聚糖蔗糖酶。
12.如权利要求11所述的方法,其中所述葡聚糖蔗糖酶包含与SEQ ID NO:2、103、106-
110、156、159-162和896中所示任一序列具有至少70%序列同一性的氨基酸序列。
13.如权利要求11所述的方法,其中所述葡聚糖蔗糖酶由与SEQ ID NO:104、105、157、
158和895中任何一者具有至少70%序列同一性的核酸序列编码。
14.如权利要求1-6中任一项所述的方法,其中所述第一酶是转葡糖苷酶。
15.如权利要求14所述的方法,其中所述转葡糖苷酶包含与SEQ ID NO:163-291和723
中任何一者的序列具有至少70%序列同一性的氨基酸序列。
16.如权利要求14所述的方法,其中所述转葡糖苷酶包含SEQ ID NO:163-291和723中
任何一者的氨基酸序列。
17.如权利要求1-6中任一项所述的方法,其中,所述第一酶是β-葡糖苷酶。
18.如权利要求17所述的方法,其中所述β-葡糖苷酶包含与SEQ ID NO:102、292、354-
374和678-741中任何一者的序列具有至少70%序列同一性的氨基酸序列。
19.如权利要求1-18中任一项所述的方法,其中包括将罗汉果苷IIA与能够催化从罗汉
果苷IIA产生罗汉果苷IIIE的第二酶接触。
20.如权利要求19所述的方法,其中将罗汉果苷IIA与第二酶接触包括将罗汉果苷IIA
与重组宿主细胞接触以产生罗汉果苷IIIE,并且其中所述重组宿主细胞包含编码所述第二酶的第二基因。
21.如权利要求20所述的方法,其中罗汉果苷IIA由所述重组宿主细胞产生和/或存在
于所述重组宿主细胞中。
22.如权利要求20或21所述的方法,其中第二酶是UDP糖基转移酶、CGTase、糖基转移
酶、葡聚糖蔗糖酶、纤维素酶、β--葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶(中的一种或多种。
23.如权利要求22所述的方法,其中第二酶是尿苷二磷酸-葡萄糖基转移酶(UGT)。
24.如权利要求23所述的方法,其中所述UGT是UGT73C3(SEQ ID NO:4)、UGT73C6(SEQ 
ID NO:5)、UGT85C2(SEQ ID NO:6)、UGT73C5(SEQ ID NO:7)、UGT73E1(SEQ ID NO:8)、UGT98(SEQ ID NO:9或407)、UGT1576(SEQ ID NO:15)、UGT SK98(SEQ ID NO:16)、UGT430(SEQ ID NO:17)、UGT1697(SEQ ID NO:NOT:18)、UGT11789(SEQ ID NO:19),或包含与SEQ ID NO:4-
9、15-19、125、126、128、129、293-307、407、409、411、413、439、441和444中任何一者具有至少70%序列同一性的氨基酸序列。
25.如权利要求24所述的方法,其中所述UGT由包含与UGT1495(SEQ ID NO:10)、
UGT1817(SEQ ID NO:11)、UGT5914(SEQ ID NO:12)、UGT8468(SEQ ID NO:13)、UGT10391(SEQ ID NO:14)和SEQ ID NO:116-124、127、130、408、410、412、414、440、442、443和445中所示任一序列具有至少70%序列同一性的核酸序列编码。
26.如权利要求1-25中任一项所述的方法,其中包括使罗汉果醇与一种或多种能够催
化从罗汉果醇产生罗汉果苷IIIE的酶接触。
27.如权利要求2-26中任一项所述的方法,其中使罗汉果醇与一种或多种能够催化从
罗汉果醇产生罗汉果苷IIE和/或IIIE的酶接触包括使罗汉果醇与重组宿主细胞接触以产生罗汉果苷IIE和/或IIIE,其中所述重组宿主细胞包含一种或多种基因,其编码一种或多种能够催化从罗汉果醇产生罗汉果苷IIE和/或IIIE的酶。
28.如权利要求27所述的方法,其中所述罗汉果醇由所述重组宿主细胞产生和/或存在
于所述重组宿主细胞中。
29.如权利要求27-28中任一项所述的方法,其中所述一种或多种能够催化从罗汉果醇
产生罗汉果苷IIE和/或IIIE的酶中的至少一种包含与SEQ ID NO:315、316、420、422、424、
426、430、431、446、871、845-949和951-1012中任何一者的序列具有至少70%序列同一性的序列,或者由与SEQ ID NO:315、316、420、422、424、426、430、431、446、871、845-949和951-
1012中任何一者的序列具有至少70%序列同一性的序列编码。
30.如权利要求27-29中任一项所述的方法,其中,所述一种或多种酶包括UDP糖基转移酶、CGTase、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。
31.如权利要求27-30中任一项所述的方法,其中,所述一种或多种酶中的至少一种是
尿苷二磷酸-葡萄糖基转移酶(UGT)。
32.如权利要求31所述的方法,其中所述UGT是UGT73C3、UGT73C6、85C2、UGT73C5、
UGT73E1、UGT98、UGT1495、UGT1817、UGT5914、UGT8468、UGT10391、UGT1576、UGT SK98、UGT430、UGT1697或UGT11789,或包含与SEQ ID NO:4-9、15-19、125、126、128、129、293-307、
405、406、407、409、411、413、439、441和444中任何一者具有至少70%序列同一性的氨基酸序列。
33.如权利要求1-32中任一项所述的方法,其包括使罗汉果苷化合物与一种或多种能
够催化从罗汉果苷化合物产生罗汉果苷IIIE以产生罗汉果苷IIIE的酶接触,其中所述罗汉果苷化合物是罗汉果苷IA1、罗汉果苷IE1、罗汉果苷IIA1、罗汉果苷IIE、罗汉果苷IIA、罗汉果苷IIIA1、罗汉果苷IIIA2、罗汉果苷III、罗汉果苷IV、罗汉果苷IVA、罗汉果苷V和赛苷中的一种或多种。
34.如权利要求33所述的方法,其中使罗汉果苷化合物与一种或多种能够催化从罗汉
果苷化合物产生罗汉果苷IIIE以产生罗汉果苷IIIE的酶接触包括使罗汉果苷化合物与重组宿主细胞接触,其中所述重组宿主细胞包括一种或多种编码一种或多种能够催化从罗汉果苷化合物产生罗汉果IIIE的酶的基因。
35.如权利要求34所述的方法,其中所述罗汉果苷化合物由所述重组宿主细胞产生和/
或存在于所述重组宿主细胞中。
36.权如利要求33-35中任一项所述的方法,其中所述一种或多种能够催化从所述罗汉
果苷化合物产生罗汉果苷IIIE的酶包括UDP糖基转移酶、CGTase、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。
37.如权利要求33-36中任一项所述的方法,其中所述罗汉果苷化合物是罗汉果苷IIE。
38.如权利要求33-37中任一项所述的方法,其中所述一种或多种能够催化由所述罗汉
果苷化合物产生罗汉果苷IIIE的酶包含与SEQ ID NO:1、3、78-101、106-109、147、154、163-
303、405、411、354-405、447-723、770、776和782中任何一者具有至少70%序列同一性的氨基酸序列。
39.如权利要求33-38中任一项所述的方法,其中所述罗汉果苷化合物是罗汉果苷IIA
或罗汉果苷IIE,并且其中与一种或多种酶的接触产生了罗汉果苷IIIA、罗汉果苷IVE和罗汉果苷V中的一种或多种。
40.如权利要求33-37中任一项所述的方法,其中所述一种或多种酶包含SEQ ID NO:
304、405、411、872、874、978、880、882、884、886、886、888、890、892、894和896中任何一者所示的氨基酸。
41.如权利要求33-37中任一项所述的方法,其中所述一种或多种酶由SEQ ID NO:305、
406、412、873、875、877、879、881、883、885、887、889、891、893和895中任何一者所示的序列编码。
42.如权利要求2-41中任一项所述的方法,包括使罗汉果苷IA1与重组宿主细胞接触,
其中所述重组宿主细胞包含编码UGT98或UGT SK98酶的基因。
43.如权利要求42所述的方法,其中所述UGT98或UGT SK98酶包含与SEQ ID NO:9、407、
16或306具有至少70%序列同一性的氨基酸序列。
44.如权利要求42所述的方法,其中所述UGT98由SEQ ID NO:307所示的序列编码。
45.如权利要求42-44中任一项所述的方法,其中所述接触导致在所述细胞中产生罗汉
果苷IIA。
46.如权利要求2-45中任一项所述的方法,其中所述方法包括使11-羟基-24,25环
芦二烯醇与所述重组宿主细胞接触,其中所述重组宿主细胞包含编码环氧化物解酶的第三基因。
47.如权利要求46所述的方法,其中所述11-羟基-24,25环氧葫芦二烯醇存在于所述重
组宿主细胞中和/或由所述重组宿主细胞产生。
48.如权利要求2-47中任一项所述的方法,其中所述方法包括使11-羟基-葫芦二烯醇
与所述重组宿主细胞接触,其中所述重组宿主细胞包含编码细胞色素P450或环氧化物水解酶的第四基因。
49.如权利要求48所述的方法,其中所述11-羟基-葫芦二烯醇由所述重组宿主细胞产
生和/或存在于所述重组宿主细胞中。
50.如权利要求1-49中任一项所述的方法,其中所述方法包括使3,24,25-三羟基葫芦
二烯醇与所述重组宿主细胞接触,其中所述重组宿主细胞包含编码细胞色素P450的第五基因。
51.如权利要求50所述的方法,其中所述3,24,25-三羟基葫芦二烯醇存在于所述重组
宿主细胞中和/或由所述重组宿主细胞产生。
52.如权利要求47-51中任一项所述的方法,其中所述接触导致在所述重组宿主细胞中
产生罗汉果醇。
53.如权利要求50-52中任一项所述的方法,其中所述细胞色素P450包含与SEQ ID NO:
20、49、308、315、430、872、874、876、878、880、882、884、886、888、889和892中任何一者具有至少70%序列同一性的氨基酸序列;或所述细胞色素P450由与SEQ ID NO:31-48、316、431、
871、873、875、877、879、881、881、883、885、887、890和891中任何一者具有至少70%序列同一性的核酸序列编码。
54.如权利要求46-53中任一项所述的方法,其中所述环氧化物水解酶包含与SEQ ID 
NO:21-30和309-314中任何一者具有至少70%序列同一性的氨基酸序列,或所述环氧化物水解酶由与SEQ ID NO:114和115中任何一者具有至少70%序列同一性的核酸序列编码。
55.如权利要求2-54中任一项所述的方法,其中所述方法包括使葫芦二烯醇与所述重
组宿主细胞接触,并且其中所述重组宿主细胞包含编码细胞色素P450的基因。
56.如权利要求55所述的方法,其中所述接触导致产生11-羟基葫芦二烯醇。
57.如权利要求55或56所述的方法,其中所述葫芦二烯醇由所述重组宿主细胞产生和/
或存在于所述重组宿主细胞中。
58.如权利要求55-57中任一项所述的方法,其中所述细胞色素P450由与SEQ ID NO:
31-48、316、431、871、873、875、877、879、881、883、885、887、889和892中任何一者具有至少
70%序列同一性的核酸序列编码。
59.权利要求55-57中任一项所述的方法,其中所述细胞色素P450包含与SEQ ID NO:
20、31、49、308、315、430、872、874、876、878、880、882、884、886、888、890和891中任何一者具有至少70%序列同一性的氨基酸序列。
60.如权利要求2-59中任一项所述的方法,其中所述方法包括使2,3-氧化鲨烯、二氧化角鲨烯和二环氧角鲨烯中的一种或多种与所述重组宿主细胞接触,其中所述重组宿主细胞包含第七基因,所述第七基因编码具有葫芦二烯醇合酶活性的多肽。
61.如权利要求60所述的方法,其中所述具有葫芦二烯醇合酶活性的多肽是包含与葫
芦二烯醇合酶融合的融合结构域的融合蛋白。
62.如权利要求61所述的方法,其中所述融合蛋白包含与葫芦二烯醇合酶的N-末端区
域、C-末端区域或两者融合的融合结构域。
63.如权利要求62所述的方法,其中所述融合结构域长约3至约1000个氨基酸。
64.如权利要求62所述的方法,其中所述融合结构域长约5至约50个氨基酸。
65.如权利要求62所述的方法,其中所述融合结构域是功能蛋白的主要部分或整个序
列。
66.如权利要求61所述的方法,其中所述具有葫芦二烯醇合酶活性的多肽包含与SEQ 
ID NO:70-73、75-77、319、321、323、325、327-333、417、420、422、424、426、446、902、904或
906具有至少70%序列同一性的氨基酸序列。
67.如权利要求61或62所述的方法,其中具有葫芦二烯醇合酶活性的多肽由与SEQ ID 
NO:74、320、322、324、326、328、418、421、423、425、427、897、899、901、903或905具有至少
70%序列同一性的核酸序列编码。
68.如权利要求60-67中任一项所述的方法,其中所述接触导致生成葫芦二烯醇和/或
24,25-环氧葫芦二烯醇。
69.如权利要求60-68中任一项所述的方法,其中2,3-氧化角鲨烯、二氧化角鲨烯和二
环氧角鲨烯中的一种或多种由所述重组宿主细胞产生和/或存在于所述重组宿主细胞中。
70.如权利要求69所述的方法,其中所述2,3-氧化角鲨烯或二环氧角鲨烯是由包含SEQ ID NO:898或900所示序列的酶产生的。
71.如权利要求69所述的方法,其中2,3-氧化角鲨烯、二氧化角鲨烯和二环氧角鲨烯中的一种或多种的产生涉及由SEQ ID NO:897或899所示核酸序列编码的酶。
72.如权利要求60所述的方法,其中所述具有葫芦二烯醇合酶活性的多肽包含与SEQ 
ID NO:70-73、75-77、319、321、323、325、327、329-333、420、422、424、426、446、902、904和
906中任何一者具有至少70%序列同一性的氨基酸序列。
73.如权利要求60所述的方法,其中所述具有葫芦二烯醇合酶活性的多肽由基因编码,所述基因包含与SEQ ID NO:74、320、322、324、326、328、418、421、423、425、427、897、899、
901、903和905中任何一者具有70%序列同一性的核酸序列。
74.如权利要求56-73中任一项所述的方法,其中所述11-羟基葫芦二烯醇由所述重组
宿主细胞产生和/或存在于所述重组宿主细胞中。
75.如权利要求74所述的方法,其中该重组宿主细胞包含编码CYP87D18或SgCPR蛋白质
的基因。
76.如权利要求75所述的方法,其中所述CYP87D18或SgCPR蛋白包含与SEQ ID NO:872
或SEQ ID NO:874具有至少70%序列同一性的氨基酸序列。
77.如权利要求75的方法,其中所述CYP87D18或SgCPR蛋白由与SEQ ID NO:871或SEQ 
ID NO:873具有至少70%序列同一性的核酸序列编码。
78.如权利要求2-77中任一项所述的方法,其中所述方法包括使角鲨烯与重组宿主细
胞接触,其中所述重组宿主细胞包含编码角鲨烯环氧酶的第八基因。
79.如权利要求78所述的方法,其中所述接触导致2,3-氧化角鲨烯的产生。
80.如权利要求78或79所述的方法,其中所述角鲨烯由所述重组宿主细胞产生和/或存
在于所述重组宿主细胞中。
81.如权利要求78-80中任一项所述的方法,其中所述角鲨烯环氧酶包含与SEQ ID NO:
50-56、60、61、334和335中任何一者具有至少70%序列同一性的氨基酸序列。
82.如权利要求78-80中任一项所述的方法,其中所述角鲨烯环氧酶由与SEQ ID NO:
335具有至少70%序列同一性的核酸序列编码。
83.如权利要求2-82中任一项所述的方法,其中所述方法包括使法呢基焦磷酸与所述
重组宿主细胞接触,其中所述重组宿主细胞包含编码角鲨烯合酶的第九基因。
84.如权利要求83所述的方法,其中所述接触导致角鲨烯的产生。
85.如权利要求83或84所述的方法,其中所述法呢基焦磷酸由所述重组宿主细胞产生
和/或存在于所述重组宿主细胞中。
86.如权利要求83-85中任一项所述的方法,其中所述角鲨烯合酶包含与SEQ ID NO:69
和336中任何一者具有至少70%序列同一性的氨基酸序列。
87.如权利要求83-85中任一项所述的方法,其中所述角鲨烯合酶由包含与SEQ ID NO:
337具有至少70%序列同一性的核酸序列的序列编码。
88.权利要求2-87中任一项的方法,其中所述方法包括使香叶基-PP与重组宿主细胞接
触,其中所述重组宿主细胞包含编码法呢基-PP合酶的第十基因。
89.如权利要求88所述的方法,其中所述接触导致法呢基-PP的产生。
90.如权利要求88或89所述的方法,其中,所述香叶基-PP由所述重组宿主细胞产生和/或存在于所述重组宿主细胞中。
91.如权利要求88-90中任一项的方法,其中所述法呢基-PP合酶包含与SEQ ID NO:338
具有至少70%序列同一性的氨基酸序列。
92.如权利要求88-90中任一项的方法,其中所述法呢基-PP合酶由与SEQ ID NO:339具
有至少70%序列同一性的核酸序列编码。
93.如权利要求2-92中任一项所述的方法,其中所述第一、第二、第三、第四、第五、第六、第七、第八、第九和第十基因中的一个或多个与异源启动子可操作地连接。
94.如权利要求93所述的方法,其中所述异源启动子是CMV、EF1a、SV40、PGK1、人β-肌动蛋白、CAG、GAL1、GAL10、TEF1、GDS、ADH1、CaMV35S、Ubi、T7、T7lac、Sp6、araBAD、trp、lac、Ptac、pL启动子或其组合。
95.如权利要求93或94所述的方法,其中所述启动子是诱导型、阻遏型或组成型启动
子。
96.如权利要求2-95中任一项所述的方法,其中在重组宿主细胞中丙酸、乙酰辅酶A、柠檬酸盐和TCA循环中间体中的一种或多种的产生已被上调。
97.如权利要求2-96中任一项所述的方法,其中在重组宿主细胞中细胞质定位已经被
上调。
98.如权利要求2-97中任一项所述的方法,其中所述第一、第二、第三、第四、第五、第六、第七、第八、第九和第十基因中的一个或多个包含至少一个编码2A自裂肽的序列。
99.如权利要求2-98中任一项的方法,其中所述重组宿主细胞是植物、双壳类、鱼类、真菌、细菌或哺乳动物的细胞。
100.如权利要求99所述的方法,其中所述植物选自罗汉果属(Siraitia)、苦瓜属
(Momordica)、绞股蓝属(Gynostemma)、南瓜属(Cucurbita)、黄瓜属(Cucumis)、拟南芥属(Arabidopsis)、蒿属(Artemisia)、甜菊属(Stevia)、人参属(Panax)、睡茄属(Withania)、大戟属(Euphorbia)、苜蓿属(Medicago)、吊兰属(Chlorophytum)、五加属
(Eleutherococcus)、楤木属(Aralia)、桑属(Morus)、苜蓿属(Medicago)、桦木属(Betula)、黄芪属(Astragalus)、麻疯树属(Jatropha)、山茶属(Camellia)、韧伞属(Hypholoma)、曲霉属(Aspergillus)、茄属(Solanum)、石杉属(Huperzia)、孩儿参属(Pseudostellaria)、黄麻属(Corchorus)、常春藤属(Hedera)、地钱属(Marchantia)和桑属(Morus)。
101.如权利要求99所述的方法,其中,所述真菌选自毛癣菌属(Trichophyton)、桑黄孔菌属(Sanghuangporus)、台芝属(Taiwanofungus)、链疫孢属(Moniliophthora)、盘二孢属(Marssonina)、色二孢属(Diplodia)、微香菇属(Lentinula)、法夫酵母
(Xanthophyllomyces)、普可尼亚属(Pochonia)、炭疽菌属(Colletotrichum)、间座壳属(Diaporthe)、组织胞浆菌属(Histoplasma)、球孢子菌属(Coccidioides)、组织胞浆菌属(Histoplasma)、桑黄孔菌属(Sanghuangporus)、短梗霉属(Aureobasidium)、普可尼亚属(Pochonia)、青霉属(Penicillium)、孢子丝菌属(Sporothrix)、黑僵菌属(Metarhizium)、曲霉属(Aspergillus)、耶氏酵母属(Yarrowia)、油脂酵母属(Lipomyces)。
102.如权利要求99所述的方法,其中,所述真菌是构巢曲霉(Aspergillus nidulans)、解脂耶氏酵母(Yarrowia lipolytica)或圆红冬孢酵母菌(Rhodosporin toruloides)。
103.如权利要求99所述的方法,其中所述重组宿主细胞是酵母细胞。
104.如权利要求103所述的方法,其中所述酵母选自假丝酵母属(Candida)、酵母属
(Sacccharaomyces)、酵母亚门(Saccharomycotina)、外囊菌亚门(Taphrinomycotina)、裂殖酵母纲(Schizosaccharomycetes)、毕赤酵母属(Komagataella)、担子菌门
(Basidiomycota)、伞菌亚门(Agaricomycotina)、纲(Tremellomycetes)、柄锈菌亚门(Pucciniomycotina)、短梗霉属(Aureobasidium)、锥毛壳属(Coniochaeta)、红冬孢酵母属(Rhodosporidium)和微球黑粉菌纲(Microboryomycetes)。
105.如权利要求99所述的方法,其中所述细菌选自弗兰克氏菌属(Frankia)、放线菌门(Actinobacteria)、链霉菌属(Streptomyces)和肠球菌属(Enterococcus)。
106.如权利要求99所述的方法,其中,所述重组宿主细胞是酿酒酵母(Saccharomyces cerevisiae)细胞或解脂耶氏酵母(Yarrowia lipolytica)细胞。
107.如权利要求2-106中任一项所述的方法,其中所述第一、第二、第三、第四、第五、第六、第七、第八、第九和第十基因中的一个或多个是用于在细菌、哺乳动物、植物、真菌和/或昆虫细胞中表达密码子优化的基因。
108.如权利要求2-107中任一项所述的方法,其中所述第一、第二、第三、第四、第五、第六、第七、第八、第九和第十基因中的一个或多个包含对所编码的酶的活性增加的功能性突变。
109.如权利要求5-108中任一项所述的方法,其中培养所述重组宿主细胞包括监测所
述培养条件的pH、溶解氧水平、氮水平或其组合。
110.如权利要求1-109中任一项所述的方法,包括分离化合物1。
111.如权利要求110所述的方法,其中分离化合物1包括裂解所述重组宿主细胞和/或
从所述培养基分离化合物1。
112.如权利要求1-111中任一项所述的方法,包括纯化化合物1。
113.如权利要求112所述的方法,其中纯化化合物1包括HPLC、固相萃取或其组合。
114.如权利要求112或113所述的方法,其中所述纯化包括:收获所述重组宿主细胞;保存上清液;以及裂解重组宿主细胞。
115.如权利要求114的方法,其中所述裂解包括使细胞经受剪切去污剂洗涤,从而获得裂解物。
116.如权利要求115所述的方法,其中,所述剪切力来自超声法、高压细胞裂解或珠子。
117.如权利要求115或116所述的方法,其中使所述裂解物经历过滤和纯化步骤。
118.如权利要求117所述的方法,其中将所述裂解物通过固相萃取进行过滤和纯化。
119.如权利要求1-118中任一项所述的方法,包括在使罗汉果苷IIIE与第一酶接触之
前,使第一罗汉果苷与一种或多种水解酶接触以产生罗汉果苷IIIE。
120.如权利要求119所述的方法,其中所述水解酶是β-葡聚糖水解酶。
121.如权利要求119所述的方法,其中所述水解酶是EXG1或EXG2。
122.如权利要求119所述的方法,其中所述水解酶包含氨基酸序列,所述氨基酸序列与SEQ ID NO:292、366-368、372、376-398、447-520、524-845、1013、1014和1023中任何一者具有至少70%的序列同一性。
123.权利要求119-122中任一项所述的方法,其中所述第一罗汉果苷选自罗汉果苷IV、罗汉果苷V、罗汉果苷VI及其组合。
124.权利要求119-122中任一项所述的方法,其中所述第一罗汉果苷选自罗汉果苷V、
赛门苷I、罗汉果苷IVE、罗汉果苷VI、罗汉果苷IVA及其组合。
125.权利要求119-124中任一项所述的方法,其中使所述第一罗汉果苷与一种或多种
水解酶接触包括使所述第一罗汉果苷与包含编码所述水解酶的基因的宿主细胞接触。
126.如权利要求125的方法,其中包含编码所述水解酶的基因的宿主细胞是重组宿主
细胞。
127.如权利要求125所述的方法,其中包含编码所述水解酶的基因的宿主细胞不是包
含编码能够催化化合物1产生的第一酶的第一基因的重组宿主细胞。
128.权利要求125-127中任一项所述的方法,其中所述第一罗汉果苷由所述宿主细胞
产生和/或存在于所述宿主细胞中。
129.权利要求125-128中任一项的方法,其中编码所述水解酶的基因与宿主细胞同源。
130.权利要求125-129中任一项所述的方法,其中编码所述水解酶的基因在所述宿主
细胞中以正常水平表达。
131.如权利要求125-130中任一项的方法,其中编码所述水解酶的基因在宿主细胞中
过表达。
132.如权利要求125-131中任一项所述的方法,其中编码所述水解酶的基因与宿主细
胞异源。
133.如权利要求2至132中任一项所述的方法,其中所述重组细胞进一步包含氧化角鲨
烯环化酶例如环阿屯醇合酶或β-香树酯醇合酶,或编码氧化角鲨烯环化酶例如环阿屯醇合酶或β-香树酯醇合酶的核酸序列,并且其中氧化角鲨烯环化酶、环阿屯醇合酶或β-香树酯醇合酶已被修饰以生产葫芦二烯醇或环氧葫芦二烯醇。
134.如权利要求133所述的方法,其中所述氧化角鲨烯环化酶包含SEQ ID NO:341、343和346-347中任何一者所示的序列。
135.如权利要求2-134中任一项所述的方法,其中所述重组细胞包含细胞色素P450还
原酶或编码细胞色素P450还原酶的基因。
136.如权利要求135所述的方法,其中所述细胞色素P450还原酶包含SEQ ID NO:318所
示的序列。
137.一种具有化合物1的结构的化合物:
其中所述化合物通过权利要求1-136中任一项所述的方法制备。
138.一种细胞裂解物,其包含具有以下结构的化合物1:
139.一种重组细胞,其包含:具有以下结构的化合物1:
和编码能够催化从罗汉果苷IIIE产生化合物1的酶的基因。
140.如权利要求139所述的重组细胞,其中所述基因是重组细胞的异源基因。
141.一种重组细胞,其包含第一基因,该第一基因编码能够催化从罗汉果苷IIIE产生
具有以下结构的化合物1的第一酶:
142.如权利要求141所述的细胞,其特征在于,所述第一酶是UDP糖基转移酶、环麦芽糊精葡聚糖转移酶(CGTases)、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。
143.如权利要求141所述的细胞,其中所述第一酶是CGTase。
144.如权利要求143的细胞,其中所述CGTase包含与SEQ ID NO:1、3、78-101、148和154中任何一者的序列具有至少70%序列同一性的氨基酸序列。
145.如权利要求141所述的细胞,其中所述CGTase包含SEQ ID NO:1、3、78-101、148和
154中任何一者的氨基酸序列。
146.如权利要求141所述的细胞,其中所述第一酶是葡聚糖蔗糖酶。
147.如权利要求146所述的细胞,其中,所述葡聚糖蔗糖酶包含与SEQ ID NO:2、103、
106-110、156和896中所示任一序列具有至少70%序列同一性的氨基酸序列。
148.如权利要求146所述的细胞,其中,所述葡聚糖蔗糖酶由与SEQ ID NO:104、105、
157、158和895中任何一者具有至少70%序列同一性的核酸序列编码。
149.如权利要求141所述的细胞,其中所述第一酶是转葡糖苷酶。
150.如权利要求149所述的细胞,其中,所述转葡糖苷酶包含与SEQ ID NO:163-291和
723中任何一者的序列具有至少70%序列同一性的氨基酸序列。
151.如权利要求149所述的细胞,其中所述转葡糖苷酶包含SEQ ID NO:3、95-102、163-
291和723中任何一者的氨基酸序列。
152.如权利要求141所述的细胞,其中所述第一酶是β-葡糖苷酶。
153.如权利要求152的细胞,其中所述β-葡糖苷酶包含与SEQ ID NO:102、292、354-376和678-741具有至少70%序列同一性的氨基酸序列。
154.如权利要求141-153中任一项所述的细胞,其包含编码尿苷二磷酸-葡萄糖基转移
酶(UGT)的第二基因。
155.如权利要求154所述的细胞,其中,所述UGT包含与SEQ ID NO:4-9、15-19、125、
126、128、129、293-307、407、409、411、413、439、441或444具有至少70%序列同一性的氨基酸序列。
156.如权利要求154所述的细胞,其中所述UGT由与SEQ ID NO:116-124、127、130、408、
410、412、414、440、442、443和445中任何一者具有至少70%序列同一性的核酸序列编码。
157.如权利要求154所述的细胞,其中,所述UGT由UGT1495(SEQ ID NO:10)、UGT1817
(SEQ ID NO:11)、UGT5914(SEQ ID NO:12)、UGT8468(SEQ ID NO:13)或UGT10391(SEQ ID NO:14)中所示的序列编码。
158.如权利要求141-157中任一项所述的细胞,其包含编码UGT98或UGT SK98的第三基
因。
159.如权利要求158所述的细胞,其中UGT98或UGT SK98包含与SEQ ID NO:9、407、16或
306具有至少70%序列同一性的氨基酸序列。
160.如权利要求158所述的细胞,其中UGT98由SEQ ID NO:307所示的核酸序列编码。
161.如权利要求141-160中任一项所述的细胞,其包含编码环氧化物水解酶的第四基
因。
162.如权利要求161所述的细胞,其中所述环氧化物水解酶包含与SEQ ID NO:21-30和
309-314中任何一者具有至少70%序列同一性的氨基酸序列,或由与SEQ ID NO:114和115中任何一者具有至少70%序列同一性的核酸序列编码。
163.如权利要求141-162中任一项所述的细胞,其包含编码P450的第五序列。
164.如权利要求163所述的细胞,其中所述P450包含与SEQ ID NO:20、49、308、315、
430、872、874、876、878、880、882、884、886、888、890和891中任何一者具有至少70%序列同一性的氨基酸序列;或由与SEQ ID NO:31-48、316、431、871、873、875、877、879、881、883、
885、887、889和892中任何一者具有至少70%序列同一性的核酸序列编码。
165.如权利要求163所述的细胞,其中所述P450由包含SEQ ID NO:31-48、316和318中
任何一者所示序列的基因编码。
166.如权利要求141-165中任一项所述的细胞,其包含编码具有葫芦二烯醇合酶活性
的多肽的第六序列。
167.如权利要求166所述的方法,其中具有葫芦二烯烯合酶活性的多肽是融合蛋白。
168.如权利要求167所述的方法,其中,所述融合蛋白包含与葫芦二烯烯合酶的N-末
端、C-末端或两者融合的融合结构域。
169.如权利要求168所述的方法,其中所述融合结构域长约3至约1000个氨基酸。
170.如权利要求169所述的方法,其中所述融合结构域长约5至约50个氨基酸。
171.如权利要求168或169所述的方法,其中所述融合结构域是功能蛋白的主要部分或
整个序列。
172.如权利要求166所述的细胞,其中所述具有葫芦二烯醇合酶活性的多肽包含与SEQ ID NO:70-73、75-77、319、321、323、325、327-333、417、420、422、424、426、446、902、904、
906、851、854、856、1024、859、862、865、867、915、920、924、928、932、936、940、944、948、952、
956、959、964、967、971、975、979、983、987、991、995、999、1003、1007和1011中任何一者具有至少70%序列同一性的氨基酸序列。
173.如权利要求166所述的细胞,其中所述具有葫芦二烯醇合酶活性的多肽由与SEQ 
ID NO:74、320、322、324、326、328、418、421、423、425、427、897、899、901、903和905中任何一者具有至少70%序列同一性的核酸序列编码。
174.如权利要求141-173中任一项所述的细胞,其包含编码角鲨烯环氧酶的第七基因。
175.如权利要求174所述的细胞,其中所述角鲨烯环氧酶包含与SEQ ID NO:50-56、60、
61、334和335中任何一者具有至少70%序列同一性的氨基酸序列。
176.如权利要求174所述的细胞,其中所述角鲨烯环氧酶由与SEQ ID NO:335具有至少
70%序列同一性的核酸序列编码。
177.如权利要求141-176中任一项所述的细胞,其包含编码角鲨烯合酶的第八基因。
178.如权利要求177所述的细胞,其中所述角鲨烯合酶包含与SEQ ID NO:69或336具有
至少70%序列同一性的氨基酸序列。
179.如权利要求177所述的细胞,其中所述角鲨烯合酶由包含SEQ ID NO:337所示核酸
序列的序列编码。
180.如权利要求141-179中任一项所述的细胞,其包含编码法呢基-PP合酶的第九基
因。
181.如权利要求180所述的细胞,其中所述法呢基-PP合酶包含与SEQ ID NO:338具有
至少70%序列同一性的氨基酸序列。
182.如权利要求180所述的细胞,其中所述法呢基-PP合酶由与SEQ ID NO:339具有至
少70%序列同一性的核酸序列编码。
183.如权利要求141-182中任一项所述的细胞,其中所述细胞是哺乳动物、植物、细菌、真菌或昆虫的细胞。
184.如权利要求141-182中任一项所述的细胞,其中所述细胞是酵母细胞,其中所述酵母选自假丝酵母属(Candida)、酵母属(Sacccharaomyces)、酵母亚门(Saccharomycotina)、外囊菌亚门(Taphrinomycotina)、裂殖酵母纲(Schizosaccharomycetes)、毕赤酵母属(Komagataella)、担子菌门(Basidiomycota)、伞菌亚门(Agaricomycotina)、银耳纲
(Tremellomycetes)、柄锈菌亚门(Pucciniomycotina)、短梗霉属(Aureobasidium)、锥毛壳属(Coniochaeta)和微球黑粉菌纲(Microboryomycetes)。
185.如权利要求183所述的细胞,其中,所述植物选自罗汉果属(Siraitia)、苦瓜属
(Momordica)、绞股蓝属(Gynostemma)、南瓜属(Cucurbita)、黄瓜属(Cucumis)、拟南芥属(Arabidopsis)、蒿属(Artemisia)、甜菊属(Stevia)、人参属(Panax)、睡茄属(Withania)、大戟属(Euphorbia)、苜蓿属(Medicago)、吊兰属(Chlorophytum)、五加属
(Eleutherococcus)、楤木属(Aralia)、桑属(Morus)、苜蓿属(Medicago)、桦木属(Betula)、黄芪属(Astragalus)、麻疯树属(Jatropha)、山茶属(Camellia)、韧伞属(Hypholoma)、曲霉属(Aspergillus)、茄属(Solanum)、石杉属(Huperzia)、孩儿参属(Pseudostellaria)、黄麻属(Corchorus)、常春藤属(Hedera)、地钱属(Marchantia)和桑属(Morus)。
186.如权利要求183所述的细胞,其中所述真菌是毛癣菌属(Trichophyton)、桑黄孔菌属(Sanghuangporus)、台芝属(Taiwanofungus)、链疫孢属(Moniliophthora)、盘二孢属(Marssonina)、色二孢属(Diplodia)、微香菇属(Lentinula)、法夫酵母属
(Xanthophyllomyces)、普可尼亚属(Pochonia)、炭疽菌属(Colletotrichum)、间座壳属(Diaporthe)、组织胞浆菌属(Histoplasma)、球孢子菌属(Coccidioides)、组织胞浆菌属(Histoplasma)、桑黄孔菌属(Sanghuangporus)、短梗霉属(Aureobasidium)、普可尼亚属(Pochonia)、青霉属(Penicillium)、孢子丝菌属(Sporothrix)、或黑僵菌属
(Metarhizium)。
187.如权利要求141-186中任一项所述的细胞,其中所述重组细胞包含编码至少一种
能够水解罗汉果苷V的水解酶的基因。
188.如权利要求141-187中任一项所述的细胞,其中化合物1显示出对重组细胞中水解
酶的耐受性,其中所述水解酶显示出将罗汉果苷VI、罗汉果苷V、罗汉果苷IV水解为罗汉果苷IIIE的能力。
189.如权利要求141-188中任一项所述的细胞,其中所述重组细胞进一步包含氧化角
鲨烯环化酶例如环阿屯醇合酶或β-香树酯醇合酶,或编码氧化角鲨烯环化酶例如环阿屯醇合酶或β-香树酯醇合酶的核酸序列,并且其中氧化角鲨烯环化酶、环阿屯醇合酶或β-香树酯醇合酶经修饰以产生葫芦二烯醇或环氧葫芦二烯醇。
190.如权利要求189所述的细胞,其中所述氧化角鲨烯环化酶包含与SEQ ID NO:341、
343和346-347中任何一者具有至少70%序列同一性的氨基酸序列。
191.如权利要求141-190中任一项所述的细胞,其中所述细胞包含细胞色素P450还原
酶或编码细胞色素P450还原酶的基因。
192.如权利要求191所述的细胞,其中所述细胞色素P450还原酶再生细胞色素P450活
性。
193.如权利要求191所述的细胞,其中所述细胞色素P450还原酶包含与SEQ ID NO:318
具有至少70%序列同一性的序列。
194.如权利要求141-193中任一项所述的细胞,其中所述细胞包含SEQ ID NO:897、
899、909、911、913、418、421、423、425、427、871、873、901、903或905中所示的序列。
195.如权利要求141-193中任一项所述的细胞,其中,所述细胞包含酶,所述酶包含SEQ ID NO:315、316、420、422、424、426、430、431、446、871、845-949或951-1012所示的序列,或由SEQ ID NO:315、316、420、422、424、426、430、431、446、871、845-949或951-1012所示的序列编码。
196.如权利要求141-195中任一项所述的细胞,其包含编码能够水解第一罗汉果苷以
产生罗汉果苷IIIE的水解酶的基因。
197.如权利要求196所述的细胞,其中所述水解酶是β-葡聚糖水解酶。
198.如权利要求196所述的细胞,其中所述水解酶是EXG1或EXG2。
199.如权利要求196所述的细胞,其中所述水解酶包含氨基酸序列,所述氨基酸序列与SEQ ID NO:292、366-368、372、376-398、447-520、524-845、1013、1014和1023中任何一者具有至少70%的序列同一性。
200.如权利要求196-199中任一项所述的细胞,其中所述第一罗汉果苷选自罗汉果苷
IV、罗汉果苷V、罗汉果苷VI及其组合。
201.如权利要求196-200中任一项所述的细胞,其中所述第一罗汉果苷选自罗汉果苷
V、赛门苷I、罗汉果苷IVE、罗汉果苷VI、罗汉果苷IVA及其组合。
202.如权利要求196-201中任一项所述的细胞,其中编码所述水解酶的基因与重组宿
主细胞同源。
203.如权利要求196-202中任一项所述的细胞,其中编码所述水解酶的基因以正常水
平表达。
204.如权利要求196-202中任一项所述的细胞,其中编码所述水解酶的基因是过表达
的。
205.如权利要求196-204中任一项所述的细胞,其中编码所述水解酶的基因与该细胞
是异源的。
206.如权利要求196-205中任一项所述的细胞,其中所述细胞是酵母细胞。
207.如权利要求206所述的细胞,其中所述细胞是酿酒酵母(Saccharomyces 
cerevisiae)或解脂耶氏酵母(Yarrowia lipolytica)。
208.一种产生具有以下结构的化合物1的方法:
该方法包括:
使第一罗汉果苷与一种或多种水解酶接触以产生罗汉果苷IIIE;和
使罗汉果苷IIIE与能够催化从罗汉果苷IIIE产生化合物1的酶接触。
209.如权利要求208所述的方法,其中所述水解酶是β-葡聚糖水解酶。
210.如权利要求208所述的方法,其中所述水解酶是EXG1。
211.如权利要求210所述的方法,其中所述EXG1包含与SEQ ID NO:1012或1014具有至
少70%序列同一性的氨基酸序列。
212.如权利要求208所述的方法,其中所述水解酶是EXG2。
213.如权利要求210所述的方法,其中所述EXG2包含与SEQ ID NO:1023具有至少70%
序列同一性的氨基酸序列。
214.如权利要求208-213中任一项所述的方法,其中所述第一罗汉果苷选自罗汉果苷
IV、罗汉果苷V、罗汉果苷VI及其组合。
215.如权利要求214所述的方法,其中第一罗汉果苷选自罗汉果苷V、赛门苷I、罗汉果苷IVE、罗汉果苷VI、罗汉果苷IVA及其组合。
216.如权利要求208-215中任一项所述的方法,其中使所述第一罗汉果糖苷与一种或
多种水解酶接触包括使所述第一罗汉果糖苷与重组宿主细胞接触,所述重组宿主细胞包含编码所述水解酶的第一基因和编码能够催化化合物1产生的酶的第二基因。
217.如权利要求208-216中任一项所述的方法,其中所述第一罗汉果苷在重组宿主细
胞中接触所述一种或多种水解酶,所述重组宿主细胞包含编码所述水解酶的第一基因和编码能够催化化合物1产生的酶的第二基因。
218.如权利要求208-217中任一项所述的方法,其中所述第一罗汉果苷由所述重组宿
主细胞产生。
219.如权利要求208-218中任一项所述的方法,其中所述第一基因对于所述重组宿主
细胞是天然的。
220.如权利要求208-219中任一项所述的方法,其中所述第一基因以正常水平表达或
过表达。
221.如权利要求208-218中任一项所述的方法,其中所述第一基因与所述重组宿主细
胞是异源的或异源的。
222.如权利要求208-221中任一项所述的方法,其中所述能够催化化合物1产生的酶是
UDP糖基转移酶、环麦芽糊精葡聚糖转移酶(CGTases)、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。
223.一种重组细胞,其包含:
第一基因,其编码能够水解第一罗汉果苷以产生罗汉果苷IIIE的水解酶;和
第二基因,其编码能够催化从罗汉果苷IIIE产生化合物1的酶,其中化合物1具有以下结构:
224.如权利要求223所述的细胞,其中,所述水解酶是β-葡聚糖水解酶。
225.如权利要求223所述的细胞,其中所述水解酶是EXG1或EXG2。
226.如权利要求228所述的细胞,其中所述EXG2蛋白包含与SEQ ID NO:1023具有至少
70%序列同一性的氨基酸序列。
227.如权利要求223-226225中任一项所述的细胞,其中,所述第一罗汉果苷选自罗汉
果苷IV、罗汉果苷V、罗汉果苷VI及其组合。
228.如权利要求223-226227中任一项所述的细胞,其中所述第一罗汉果苷选自罗汉果
苷V、赛门苷I、罗汉果苷IVE、罗汉果苷V、罗汉果苷IVA及其组合。
229.如权利要求223-228中任一项所述的细胞,其中所述第一基因与所述重组宿主细
胞是同源的或异源的。
230.如权利要求223-229中任一项所述的细胞,其中所述第一基因以正常水平表达或
过表达。
231.如权利要求223-230中任一项所述的细胞,其中所述细胞是酵母细胞。
232.如权利要求231所述的细胞,其中所述细胞是酿酒酵母(Saccharomyces 
cerevisiae)或解脂耶氏酵母(Yarrowia lipolytica)。
233.一种具有葫芦二烯醇合酶活性的融合多肽,其中所述融合多肽包含与葫芦二烯醇
合酶融合的融合结构域。
234.如权利要求233所述的融合多肽,其中所述融合结构域与葫芦二烯醇合酶的N-末
端融合。
235.如权利要求233所述的融合多肽,其中所述融合结构域与葫芦二烯醇合酶的C-末
端融合。
236.如权利要求233-235中任一项所述的融合多肽,其中所述融合结构域长约3至约
1000个氨基酸。
237.如权利要求233-236中任一项所述的融合多肽,其中所述融合结构域长约5至约50
个氨基酸。
238.如权利要求233-236中任一项所述的融合多肽,其中所述融合结构域包含功能蛋
白的主要部分或整个序列。
239.如权利要求233-236中任一项所述的融合多肽,其中所述融合结构域是功能蛋白
的主要部分或整个序列。
240.如权利要求233-239中任一项所述的融合多肽,其中所述融合结构域包含酵母蛋
白的一部分或全部序列。
241.如权利要求233-239中任一项所述的融合多肽,其中所述融合结构域是酵母蛋白
的一部分或全部序列。
242.如权利要求241所述的融合多肽,其中所述融合多肽包含与SEQ ID NO:851、854、
856、1024、859、862、865、867、915、920、924、928、932、936、940、944、948、952、956、959、964、
967、971、975、979、983、987、991、995、999、1003、1007和1011中任何一者具有至少70%序列同一性的氨基酸序列。
243.如权利要求241所述的融合多肽,其中所述融合多肽包含SEQ ID NO:851、854、
856、1024、859、862、865、867、915、920、924、928、932、936、940、944、948、952、956、959、964、
967、971、975、979、983、987、991、995、999、1003、1007和1011中任何一者所示的氨基酸序列。
244.如权利要求233-235中任一项所述的融合多肽,其中所述融合多肽的融合结构域
包含与SEQ ID NO:866、870、917、921、925、929、933、937、941、945、949、953、957、961、968、
972、976、980、984、988、992、996、1000、1004、1008和1012中任何一者具有至少70%序列同一性的氨基酸序列。
245.如权利要求233-235中任一项所述的融合多肽,其中所述融合多肽的融合结构域
包含SEQ ID NO:866、870、917、921、925、929、933、937、941、945、949、953、957、961、968、
972、976、980、984、988、992、996、1000、1004、1008和1012中任何一者所示的氨基酸序列。
246.如权利要求233-241、244和245中任一项所述的融合多肽,其中所述葫芦二烯醇合酶包含与SEQ ID NO:70-73、75-77、319、321、323、325、327、329-333、420、422、424、426、
446、902、904和906中任何一者具有至少70%序列同一性的氨基酸序列。
247.如权利要求233-241、244和245中任一项所述的融合多肽,其中所述葫芦二烯醇合酶包含SEQ ID NO:70-73、75-77、319、321、323、325、327、329-333、420、422、424、426、446、
902、904和906中任何一者所示的氨基酸序列。
248.如权利要求233-241、244和245中任一项所述的融合多肽,其中所述葫芦二烯醇合酶由包含与SEQ ID NO:74、320、322、324、326、328、418、421、423、425、427、897、899、901、
903和905中任何一者具有70%序列同一性的核酸序列的基因编码。
249.如权利要求233-241、244和245中任一项所述的融合多肽,其中所述葫芦二烯醇合酶由包含SEQ ID NO:74、320、322、324、326、328、418、421、423、425、427、897、899、901、903和905中任何一者核酸序列的基因编码。
250.一种重组核酸分子,其包含编码权利要求233-249中任一项的融合多肽的核酸序
列。
251.一种重组细胞,其包含权利要求233-249中任一项的融合多肽或权利要求250的重
组核酸分子。
252.一种方法,其包括使葫芦二烯醇合酶的底物与权利要求233-249中任一项的具有
葫芦二烯醇合酶活性的融合多肽接触。
253.如权利要求252所述的方法,其中所述接触导致产生葫芦二烯醇、24,25-环氧葫芦二烯醇或其组合。
254.如权利要求252或253所述的方法,其中所述葫芦二烯醇合酶的底物包含2,3-氧化
角鲨烯、二氧化角鲨烯和二环氧角鲨烯中的一种或多种。
255.如权利要求252-254中任一项所述的方法,其中所述接触包括使所述底物与重组
宿主细胞接触,所述重组宿主细胞包含编码所述融合多肽的核酸序列。
256.如权利要求255所述的方法,其中所述底物存在于所述重组宿主细胞中和/或由所
述重组宿主细胞产生。

说明书全文

制备高强度甜味剂的方法

[0001] 背景

技术领域

[0002] 本公开涉及用于生产甜味化合物的方法、系统和组合物,以及包含该甜味化合物的组合物。

背景技术

[0003] 味觉系统提供了关于外界化学组成的感官信息。味觉传导是动物的化学诱发感觉的最复杂的形式之一。在整个动物界中,从简单的后生动物到最复杂的脊椎动物,味觉信号遍布整个动物界。哺乳动物被认为具有五种基本的味觉形式:甜、苦、酸、咸和鲜味(谷酸单钠的味道,又名鲜美味道)。
[0004] 几个世纪以来,向可摄取组合物(包括食品和饮料)和/或口服施用的医药成分添加了各种天然和非天然成分和/或化合物,以改善它们的味道。虽然很早就了解到仅存在几种基本类型的“味道”,但对于味觉的生物基础和生物化学基础却了解很少,并且大部分味道改善剂或味道改性剂主要通过简单的试错过程来发现。
[0005] 对于甜味而言,糖尿病和心血管疾病是在全球范围增加的健康问题,但在美国它们正在以令人担忧的速率发展。糖和卡路里是可以被限制以得到对健康具有积极营养作用的关键组分。高强度甜味剂可以提供糖的甜味,并具有各种味道品质。因为它们比糖甜很多倍,所以取代糖所需的甜味剂要少得多。
[0006] 高强度甜味剂具有多种不同的化学结构,并且因此具有不同的性质,例如但不限于气味、味、口感和回味。这些性质,尤其是风味和回味,通常被认为是随着品尝的时间而改变的,使得各个时间曲线(temporal profile)是甜味剂特异性的。
[0007] 最近在鉴定有用的天然调味剂的方面具有显著的进展,所述调味剂例如甜味剂,例如蔗糖、果糖、葡萄糖、赤藓糖醇、异麦芽糖醇、乳糖醇、甘露糖醇、山梨糖醇、木糖醇、某些已知的天然萜类、类黄酮、或蛋白质甜味剂。参见例如Kinghom等人,“Noncariogenic Intense Natural Sweeteners”,Med.Res.Rev.18(5)347-360(1998)(讨论了相比诸如蔗糖、果糖等的常见天然甜味剂在强度上甜得多的经发现的天然物质)。类似地,最近在新型人造甜味剂的鉴定和商业化方面取得了进展,所述新型人造甜味剂例如阿斯巴甜、糖精、乙酰舒泛、环己氨磺酸盐(cyclamate)、三氯蔗糖等。参见,例如,Ager等人,Angew.Chem.Int.Ed.37,1802-1817(1998)。上述文献的全部公开内容通过引用整体并入本文。
[0008] 诸如糖精和6-甲基-1,2,3-噁噻嗪-4(3H)-酮-2,2-二化物钾盐(乙酰舒泛钾)的甜味剂通常特征为具有苦味和/或金属回味。使用2,4-二羟基苯甲酸制备的产品据称表现出减少的与甜味剂有关的不期望的回味,并且在低于它们自身的味道可察觉的那些浓度的浓度下正是如此。并且,诸如三氯蔗糖和阿斯巴甜的高强度甜味剂被报导具有甜味递送问题,即,甜味的延迟起效和残留。参见S.G.Wiet等人,J.Food Sci.,58(3):599-602,666(1993)。
[0009] 需要具有改善的味道和递送特性的新型增甜化合物、甜味增强剂、以及含有此类化合物和增强剂的组合物。另外,需要含有具有此类期望特性的新型增甜化合物和/或甜味增强剂的食品。发明内容
[0010] 本发明提供了一种产生具有以下结构的化合物1的方法:
[0011]
[0012] 在一些实施方案中,该方法包括使罗汉果苷IIIE与能够催化从罗汉果苷IIIE产生化合物1的第一酶接触。在一些实施方案中,该方法包括使罗汉果苷IIIE与能够催化从罗汉果苷IIIE产生化合物1的第一酶接触。在某些实施方案中,与第一酶接触的罗汉果苷IIIE包含与重组宿主细胞接触的罗汉果苷IIIE,该重组宿主细胞包含编码第一酶的第一基因。例如,第一基因可以是重组宿主细胞的外源基因。
[0013] 在一些实施方案中,罗汉果苷IIIE在包含编码第一酶的第一多核苷酸的重组宿主细胞中与第一酶接触。罗汉果苷IIIE可以例如提供给重组细胞,存在于重组宿主细胞中,由重组宿主细胞产生,或其任何组合产生。在一些实施方案中,该方法包括在表达第一酶的条件下在培养基中培养重组宿主细胞。第一酶可以是例如UDP糖基转移酶(UDP glycosyltransferases)、环麦芽糊精葡聚糖转移酶(CGTase)、糖基转移酶
(glycotransferases)、葡聚糖蔗糖酶(dextransucrases)、纤维素酶(cellulases)、β-葡糖苷酶(β-glucosidases)、淀粉酶(amylases)、转葡糖苷酶(transglucosidases)、果胶酶(pectinases)和葡聚糖酶(dextranases)中的一种或多种。
[0014] 在一些实施方案中,第一酶是CGTase。在一些实施方案中,CGTase包含一种氨基酸序列,该氨基酸序列与SEQ ID NO:1、3、78-101、148和154中任一个的序列具有或具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,CGTase包含SEQ ID NO:1、3、78-101、148和154中任一个序列。
在一些实施方案中,CGTase由SEQ ID NO:1、3、78-101、148和154中的氨基酸序列组成。
[0015] 在一些实施方案中,第一酶是葡聚糖蔗糖酶。例如,葡聚糖蔗糖酶可包含一种氨基酸序列,该氨基酸序列与SEQ ID NO:2、103、106-110、156、159-162和896中所示的任一序列具有或具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,葡聚糖蔗糖酶由核酸序列编码,该核酸序列与SEQ ID NO:104、105、157、158和895中任何一个具有至少70%的序列同一性。
[0016] 在一些实施方案中,第一酶是转葡糖苷酶。例如,转葡糖苷酶可包含一种氨基酸序列,该氨基酸序列与SEQ ID NOs:163-291和723中任何一个序列具有或具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,转葡糖苷酶包含SEQ ID NOs:163-291和723中任何一个的氨基酸序列。
[0017] 在一些实施例中,第一酶是β-葡糖苷酶β-。例如,β-葡糖苷酶可包含一种氨基酸序列,该氨基酸序列与SEQ ID NOs:102、292、354-374和678-741中任何一个所示的序列具有或具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。
[0018] 在一些实施方案中,该方法包括使罗汉果苷IIA与能够催化罗汉果苷IIA产生罗汉果苷IIIE的酶接触。在一些实施方案中,将罗汉果苷IIA与所述酶接触包括将罗汉果苷IIA与重组宿主细胞接触以产生罗汉果苷IIIE,其中重组宿主细胞包含编码能够催化罗汉果苷IIA产生罗汉果IIIE的酶的基因。罗汉果苷IIA可以例如提供给重组宿主细胞,由重组宿主细胞产生,存在于重组宿主细胞中,或其任何组合。能够催化从罗汉果糖苷IIA产生罗汉果糖苷IIIE的酶可以是例如UDP糖基转移酶、CGTase、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。
[0019] 在一些实施方案中,第二酶是尿苷二磷酸-葡萄糖基转移酶(UGT)。例如,UGT可以是UGT73C3(SEQ ID NO:4)、UGT73C6(SEQ ID NO:5)、UGT 85C2(SEQ ID NO:6)、UGT73C5(SEQ ID NO:7)、UGT73E1(SEQ ID NO:8)、UGT98(SEQ ID NO:9或407)、UGT1576(SEQ ID NO:15)、UGT SK98(SEQ ID NO:16)、UGT430(SEQ ID NO:17)、UGT1697(SEQ ID NO:18)、UGT11789(SEQ ID NO:19)。在一些实施方案中,UGT包含一种氨基酸序列,该氨基酸序列与SEQ ID NOs:4-9、15-19、125、126、128、129、293-307、407、409、411、413,439、441和444中任何一个的序列具有或具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。UGT由一种核酸序列编码,该核酸序列与UGT1495(SEQ ID NO:10)、UGT1817(SEQ ID NO:11)、UGT5914(SEQ ID NO:12)、UGT8468(SEQ ID NO:13)、UGT10391(SEQ ID NO:14)、SEQ ID NOs:116-124、127、130、408、410、412、414、440、442、443和445中任何一个中所示的序列具有或具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。
[0020] 在一些实施方案中,该方法包括使罗汉果醇与一种或多种能够催化从罗汉果醇产生罗汉果苷IIIE和/或IIE的酶接触。在一些实施方案中,使罗汉果醇与一种或多种酶接触包括使罗汉果醇与重组宿主细胞接触,以产生罗汉果苷IIIE和/或罗汉果苷IIE,其中重组宿主细胞包含一种或多种编码一种或多种能够催化其产生罗汉果苷IIIE和/或罗汉果苷IIE的酶的基因。例如,罗汉果醇可以提供给重组宿主细胞,由重组宿主细胞产生,存在于重组宿主细胞中,或其任何组合。
[0021] 在一些实施方案中,能够催化罗汉果醇产生罗汉果苷IIE和/或罗汉果苷IIIE的一种或多种酶中的至少一种包括一种序列,该序列与SEQ ID NOs:315、316、420、422、424、426、430、431、446、871、845-949和951-1012中任何一个的序列具有或具有至少70%、80%、
85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的同一性,或由一种序列编码,该序列与SEQ ID NOs:315、316、420、422、424、426、430、431、446、871、845-949和
951-1012中任何一个的序列具有或具有至少70%、80%、85%、90%、95%、98%、99%、
100%或这些数字中任何两个之间的范围的同一性。在一些实施例中,能够催化罗汉果醇产生罗汉果苷IIE和/或罗汉果苷IIIE包括一种或多种UDP糖基转移酶、CGTase、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶。在一些实施方案中,一种或多种酶中的至少一种是尿苷二磷酸-葡萄糖基转移酶(UGT)。例如,UGT可以是UGT73C3、UGT73C6、85C2、UGT73C5、UGT73E1、UGT98、UGT1495、UGT1817、UGT5914、UGT8468、UGT10391、UGT1576、UGT SK98、UGT430、UGT1697或UGT11789,或UGT包含氨基酸序列,该序列与SEQ ID NOs:4-9、15-19、125、126、128、129、293-307、405、406、407、409、411、
413、439、441和444中任一个具有或具有至少70%、80%、85%、90%、95%、98%、99%、
100%或这些数字中任何两个之间的范围的序列同一性。
[0022] 在一些实施方案中,该方法包括使罗汉果苷化合物与一种或多种能够催化罗汉果苷化合物产生罗汉果苷IIIE的酶接触以产生罗汉果苷IIIE,其中罗汉果苷化合物是罗汉果苷IA1、罗汉果苷IE1、罗汉果苷IIA1、罗汉果苷IIE、罗汉果苷IIA、罗汉果苷IIIA1、罗汉果苷IIIA2、罗汉果苷III、罗汉果苷IV、罗汉果苷IVA、罗汉果苷V和赛苷(siamenoside)中的一种或多种。在一些实施方案中,使罗汉果苷化合物与能够催化罗汉果苷IIIE产物的一种或多种酶接触包括使罗汉果苷化合物与重组宿主细胞接触,其中重组宿主细胞包含一种或多种编码所述一种或多种能够催化从罗汉果糖苷化合物产生罗汉果糖苷IIIE的酶的基因。罗汉果苷化合物可以例如提供给重组宿主细胞,由重组宿主细胞产生,存在于重组宿主细胞中,及其任何组合。在一些实施方案中,一种或多种能够催化罗汉果苷产生罗汉果苷化合物的IIIE的酶包括UDP糖基转移酶、CGTase、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。在一些实施方案中,罗汉果苷化合物是罗汉果苷IIE。
[0023] 在一些实施方案中,一种或多种能够催化罗汉果苷化合物产生罗汉果苷IIIE的酶包含一种氨基酸序列,该序列与SEQ ID NO:1、3、78-101、106-109、147、154、163-303、405、411、354-405、447-723、770、776和782中任一个具有或具有至少70%、80%、85%、90%、
95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,罗汉果苷化合物是罗汉果苷IIA或罗汉果苷IIE。在一些实施方案中,与一种或多种酶接触产生罗汉果苷IIIA、罗汉果苷IVE和罗汉果苷V中的一种或多种。
[0024] 在一些实施方案中,一种或多种酶包含一种氨基酸序列,该序列与SEQ ID NO:304、405、411、872、874、978、880、882、884、886、888、890、892、894和896中任何一个具有或具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,所述一种或多种酶由一种序列编码,该序列与SEQ ID NO:305、406、412、873、875、877、879、881、883、885、887、889、891、893和895中的任何一个具有或具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。
[0025] 在一些实施方案中,该方法包括使罗汉果苷IA1与重组宿主细胞接触,其中该重组宿主细胞包含编码UGT98或UGT SK98酶的基因。在一些实施方案中,UGT98或UGT SK98酶包含与SEQ ID NO:9、407、16或306具有至少70%序列同一性的氨基酸序列。在一些实施方案中,UGT98由SEQ ID NO:307所示的序列编码。在一些实施方案中,接触导致细胞中罗汉果苷IIA的产生。
[0026] 在一些实施方案中,该方法包括使11-羟基-24,25环氧葫芦二烯醇与重组宿主细胞接触,其中所述重组宿主细胞包含编码环氧化物解酶的基因。在一些实施方案中,将11-羟基-24,25环氧葫芦二烯醇提供给重组宿主细胞、存在于重组宿主细胞中、由重组宿主细胞产生,及其任何组合。
[0027] 在一些实施方案中,该方法包括使11-羟基葫芦二烯醇与重组宿主细胞接触,其中所述重组宿主细胞包含编码细胞色素P450或环氧化物水解酶的基因。所述11-羟基葫芦二烯醇可以提供给重组宿主细胞,由重组宿主细胞产生,和/或存在于重组宿主细胞中。
[0028] 在一些实施方案中,该方法包括使3,24,25-三羟基葫芦二烯醇与重组宿主细胞接触,其中所述重组宿主细胞包含编码细胞色素P450的基因。在一些实施方案中,将3,24,25-三羟基葫芦二烯醇提供给重组宿主细胞,存在于重组宿主细胞中,由重组宿主细胞产生,或其任何组合。接触导致重组宿主细胞中产生罗汉果醇。在一些实施方案中,细胞色素P450包含一种氨基酸序列,该序列与SEQ ID NO:20、49、308、315、430、872、874、876、878、880、882、884、886、888、889和892中的任何一个具有或具有至少70%、80%、85%、90%、95%、98%、
99%、100%或这些数字中任何两个之间的范围的序列同一性;或细胞色素P450由一种核酸序列编码,该序列与SEQ ID NO:31-48、316、431、871、873、875、877、879、881、883、885、887、
890和891中任何一个的序列具有或具有至少70%、80%、85%、90%、95%、98%、99%、
100%或这些数字中任何两个之间的范围的序列同一性。
[0029] 在一些实施方案中,环氧化物水解酶包含一种氨基酸序列,该序列与SEQ ID NO:21-30和309-314中任何一个的序列具有或具有至少70%、80%、85%、90%、95%、98%、
99%、100%或这些数字中任何两个之间的范围的序列同一性;或环氧化物水解酶由一种核酸序列编码,该序列与SEQ ID Nos:114和115中任何一个的序列具有或具有至少70%、
80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。
[0030] 在一些实施方案中,该方法包括使葫芦二烯醇与重组宿主细胞接触,其中该重组宿主细胞包含编码细胞色素P450的基因。在一些实施方案中,该接触导致产生11-羟基葫芦二烯醇。在一些实施方案中,葫芦二烯醇被提供至重组宿主细胞,由重组宿主细胞产生和/或存在于重组宿主细胞中。在一些实施方案中,细胞色素P450由一种核酸序列编码,该序列与SEQ ID NO:31-48、316、431、871、873、875、877、879、881、883、885、887、889和892中的任何一个具有或具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,细胞色素P450包含一种氨基酸序列,该氨基酸序列与SEQ ID NO:20、31、49、308、315、430、872、874、876、878、880、882、884、886、888、890和891具有或具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,该方法还包括将2,3-氧化鲨烯、二氧化角鲨烯和二环氧角鲨烯中的一种或多种与重组宿主细胞接触,其中所述重组宿主细胞包含编码具有葫芦二烯醇合酶活性的多肽的基因。
[0031] 在一些实施方案中,该方法包括使罗汉果苷中间体与重组宿主细胞接触,其中该重组宿主细胞包含编码具有葫芦二烯醇合酶活性的多肽的基因。在一些实施方案中,具有葫芦烯醇合成酶活性的多肽是一种融合蛋白,其包含一个或多个融合到葫芦烯醇合成酶上的融合结构域。在一些实施方案中,所述融合蛋白包含融合至葫芦二烯醇合酶的N-末端、C-末端或两者的融合结构域。在一些实施方案中,融合结构域长约3至约1000个氨基酸。在一些实施方案中,融合结构域长约5至约50个氨基酸。在一些实施方案中,融合结构域是功能蛋白的主要部分或整个序列。
[0032] 在一些实施方案中,具有葫芦二烯醇合酶活性的融合多肽包含一种氨基酸序列,该序列与SEQ ID NOs:70-73、75-77、319、321、323、325、327-333、417、420、422、424、426、446、902、904或906具有或具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,葫芦二烯醇合酶由一种核酸序列编码,该序列与SEQ ID NOs:74、320、322、324、326、328、418、421、423、425、427、897、
899、901、903和905具有或具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。
[0033] 在一些实施方案中,接触导致葫芦二烯醇的产生。在一些实施方案中,将2,3-氧化角鲨烯和二环氧角鲨烯提供给重组宿主细胞,由重组宿主细胞产生和/或存在于重组宿主细胞中。在一些实施方案中,2,3-氧化角鲨烯和二环氧角鲨烯中的一种或多种是由包含一种序列的酶产生,该序列与SEQ ID NO:898或900具有或具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,2,3-氧化角鲨烯、二环氧角鲨烯和二环氧角鲨烯中的一种或多种由一种酶产生,该酶由一种核酸序列编码,该序列与SEQ ID NO:897或899具有或具有至少70%、80%、85%、90%、
95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,葫芦二烯醇合酶包含一种氨基酸序列,该序列与SEQ ID NO:70-73、75-77、319、321、
323、325、327,329-333、420、422、424、426、446、902、904和906中任何一个具有至少70%的序列同一性。在一些实施方案中,包含葫芦二烯醇合酶活性的多肽由包含核酸序列的基因编码,该序列与SEQ ID NO:74、320、322、324、326、328、418、421、423、425、427、897、899、
901、903和905中任一个具有或具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。
[0034] 在一些实施方案中,将11-羟基葫芦二烯醇提供给重组宿主细胞、由重组宿主细胞产生和/或存在于重组宿主细胞中。在一些实施方案中,11-羟基葫芦二烯醇在包含编码CYP87D18和/或SgCPR蛋白的基因的细胞(例如重组宿主细胞)中表达。在一些实施方案中,CYP87D18或SgCPR蛋白包含一种氨基酸序列,该序列与SEQ ID NO:872或874具有或具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,CYP87D18或SgCPR蛋白由一种核酸序列编码,该序列与SEQ ID NO:871或873具有或具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。
[0035] 在一些实施方案中,该方法包括使角鲨烯与重组宿主细胞接触,其中重组宿主细胞包含编码角鲨烯环氧酶的基因。在一些实施方案中,通过接触产生2,3-氧化角鲨烯。在一些实施方案中,角鲨烯被提供给重组宿主细胞,由重组宿主细胞产生和/或存在于重组宿主细胞中。在一些实施方案中,角鲨烯环氧酶包含一种氨基酸序列,该序列与SEQ ID NO:50-56、60、61、334或335中任一个具有或具有至少70%、80%、85%、90%、95%、98%、99%、
100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,角鲨烯环氧酶由一种核酸序列编码,该序列与SEQ ID NO:335具有或具有至少70%、80%、85%、90%、
95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。
[0036] 在一些实施方案中,所述方法包括使法呢基焦磷酸与重组宿主细胞接触,其中所述重组宿主细胞包含编码角鲨烯合酶的基因。在一些实施方案中,通过接触导致角鲨烯的产生。在一些实施方案中,法呢基焦磷酸被提供给重组宿主细胞、由重组宿主细胞产生和/或存在于重组宿主细胞中。在一些实施方案中,角鲨烯合酶包含一种氨基酸序列,该氨基酸序列与SEQ ID NO:69和336中任一个具有或具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,角鲨烯合酶由包含一种核酸序列的序列编码,该核酸序列与SEQ ID NO:337具有或具有至少70%、
80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。
[0037] 在一些实施方案中,该方法包括使香叶基-PP与重组宿主细胞接触,其中所述重组宿主细胞包含编码法呢基-PP合酶的基因。在一些实施方案中,通过接触导致法呢基-PP的产生。在一些实施方案中,香叶基-PP被提供给重组宿主细胞,由重组宿主细胞产生,和/或存在于重组宿主细胞中。在一些实施方案中,法呢基-PP合酶包含一种氨基酸序列,其与SEQ ID NO:338具有或具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,法呢基-PP合酶被一种核酸序列编码,该核酸序列与SEQ ID NO:339具有或具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。
[0038] 在一些实施方案中,一种或多种基因可操作地连接至异源启动子,该基因编码(1)能够催化从罗汉果苷IIIE产生化合物I的第一酶,(2)能够催化从罗汉果苷IIA产生罗汉果苷IIIE的酶,(3)环氧化物水解酶,(4)细胞色素P450,(5)具有葫芦二烯醇合酶活性的多肽,(6)角鲨烯环氧化物酶,(7)法呢基-PP合酶。在一些实施方案中,异源启动子是CMV、EF1a、SV40、PGK1、人β-肌动蛋白(human beta actin)、CAG、GAL1、GAL10、TEF1、GDS、ADH1、CaMV35S,Ubi、T7、T7lac、Sp6、araBAD、trp、lac、Ptac、pL启动子或其组合。在一些实施方案中,启动子是诱导型、阻遏型或组成型启动子。在一些实施方案中,在重组宿主细胞中丙酮酸、乙酰辅酶A、柠檬酸盐和TCA循环中间体的一个或多个的产生已被上调。在一些实施方案中,在重组宿主细胞中细胞质定位已被上调。在一些实施方案中,第一、第二、第三、第四、第五、第六、第七、第八、第九和第十基因中的一个或多个包含编码2A自裂肽的至少一个序列。
[0039] 在一些实施方案中,重组宿主细胞是植物、双壳类、鱼类、真菌、细菌或哺乳动物的细胞。在一些实施方案中,所述植物选自罗汉果属(Siraitia)、苦瓜属(Momordica)、绞股蓝属(Gynostemma)、南瓜属(Cucurbita)、黄瓜属(Cucumis)、拟南芥属(Arabidopsis)、蒿属(Artemisia)、甜菊属(Stevia)、人参属(Panax)、睡茄属(Withania)、大戟属(Euphorbia)、苜蓿属(Medicago)、吊兰属(Chlorophytum)、五加属(Eleutherococcus)、楤木属(Aralia)、桑属(Morus)、苜蓿属(Medicago)、桦木属(Betula)、黄芪属(Astragalus)、麻疯树属(Jatropha)、山茶属(Camellia)、韧伞属(Hypholoma)、曲霉属(Aspergillus)、茄属(Solanum)、石杉属(Huperzia)、孩儿参属(Pseudostellaria)、黄麻属(Corchorus)、常春藤属(Hedera)、地钱属(Marchantia)和桑属(Morus)。在一些实施方案中,真菌选自毛癣菌属(Trichophyton)、桑黄孔菌属(Sanghuangporus)、台芝属(Taiwanofungus)、链疫孢属(Moniliophthora)、盘二孢属(Marssonina)、色二孢属(Diplodia)、微香菇属(Lentinula)、法夫酵母属(Xanthophyllomyces)、普可尼亚属(Pochonia)、炭疽菌属(Colletotrichum)、间座壳属(Diaporthe)、组织胞浆菌属(Histoplasma)、球孢子菌属(Coccidioides)、组织胞浆菌属(Histoplasma)、桑黄孔菌属(Sanghuangporus)、短梗霉属(Aureobasidium)、普可尼亚属(Pochonia)、青霉属(Penicillium)、孢子丝菌属(Sporothrix)、黑僵菌属
(Metarhizium)、曲霉属(Aspergillus)、耶氏酵母属(Yarrowia)和油脂酵母属
(Lipomyces)。在一些实施方案中,真菌为构巢曲霉(Aspergillus nidulans)、解脂耶氏酵母(Yarrowia lipolytica)或圆红冬孢酵母菌(Rhodosporin toruloides)。在一些实施方案中,重组宿主细胞是酵母细胞。在一些实施方案中,酵母选自假丝酵母属(Candida)、酵母属(Sacccharaomyces)、酵母亚门(Saccharomycotina)、外囊菌亚门(Taphrinomycotina)、裂殖酵母纲(Schizosaccharomycetes)、毕赤酵母属(Komagataella)、担子菌门
(Basidiomycota)、伞菌亚门(Agaricomycotina)、纲(Tremellomycetes)、柄锈菌亚门(Pucciniomycotina)、短梗霉属(Aureobasidium)、锥毛壳属(Coniochaeta)、红冬孢酵母属(Rhodosporidium)和微球黑粉菌纲(Microboryomycetes)。在一些实施方案中,该细菌选自弗兰克氏菌属(Frankia)、放线菌门(Actinobacteria)、链霉菌属(Streptomyces)和肠球菌属(Enterococcus)。在一些实施方案中,重组宿主细胞是酿酒酵母(Saccharomyces 
cerevisiae)细胞或解脂耶氏酵母(Yarrowia lipolytica)细胞。在一些实施方案中,第一、第二、第三、第四、第五、第六、第七、第八、第九和第十基因中的一个或多个是用于在细菌、哺乳动物、植物、真菌和/或昆虫细胞中表达的密码子优化的基因。在一些实施方案中,第一、第二、第三、第四、第五、第六、第七、第八、第九和第十基因中的一个或多个包含对编码的酶的活性增加的功能性突变。在一些实施方案中,培养重组宿主细胞包括监测培养条件的pH、溶解氧水平、氮水平或其组合。
[0040] 在一些实施方案中,该方法包括分离化合物1。在一些实施方案中,分离化合物1包括裂解重组宿主细胞,和/或从培养基中分离化合物1。在一些实施方案中,该方法包括纯化化合物1。纯化化合物1包括HPLC、固相萃取或其组合。在一些实施方案中,纯化包括获取重组宿主细胞、保存上清液、和裂解重组宿主细胞。在一些实施方案中,裂解包括使细胞经受剪切洗涤剂洗涤,从而获得裂解物。剪切力可以例如来自超声处理法、高压细胞裂解(french pressurized cells)、或珠子(beads)。在一些实施方案中,将裂解物进行过滤和纯化步骤。在一些实施方案中,通过固相萃取来过滤和纯化裂解物。
[0041] 在一些实施方案中,该方法还包括在将第一罗汉果苷IIIE与第一酶接触之前,使第一罗汉果苷与一种或多种水解酶接触以产生罗汉果苷IIIE。例如,该水解酶可以是β-葡聚糖水解酶。在一些实施方案中,水解酶为EXG1或EXG2。在一些实施方案中,水解酶包含氨基酸序列,该氨基酸序列与SEQ ID NO:292、366-368、372、376-398、447-520、524-845、1013、1014和1023中任何一者具有或具有至少70%、80%、85%、90%、95%、98%、99%、
100%或这些数字中任何两个之间的范围的序列同一性。
[0042] 在一些实施方案中,第一罗汉果苷是罗汉果苷IV、罗汉果苷V、罗汉果苷VI或其组合。在一些实施方案中,第一罗汉果苷是罗汉果苷V、赛门苷I、罗汉果苷IVE、罗汉果苷VI、罗汉果苷IVA或其组合。
[0043] 在一些实施方案中,使第一罗汉果糖苷与一种或多种水解酶接触包括使第一罗汉果糖苷与包含编码水解酶的基因的宿主细胞接触。在一些实施方案中,第一罗汉果苷接触宿主细胞中的一种或多种水解酶,所述宿主细胞包含编码水解酶的基因和编码能够催化化合物1产生的酶的基因。所述宿主细胞可以是重组宿主细胞,其包含编码第一酶的第一基因,该第一酶能够催化从罗汉果苷IIIE产生化合物1。在一些实施方案中,宿主细胞不是包含编码第一酶的第一基因的重组宿主细胞,该第一酶能够催化从罗汉果苷IIIE产生化合物1。在一些实施方案中,第一罗汉果苷被提供给宿主细胞,由宿主细胞产生和/或存在于宿主细胞中。编码水解酶的基因可以与宿主细胞是异源的或同源的。在一些实施方案中,编码水解酶的基因在宿主细胞中以正常水平表达。在一些实施方案中,编码水解酶的基因在宿主细胞中过表达。
[0044] 在一些实施方案中,重组宿主细胞包含氧化角鲨烯环化酶例如环阿屯醇合酶(cycloartenol synthase)或β-香树酯醇合酶(β-amyrin synthase),或编码氧化角鲨烯环化酶例如环阿屯醇合酶或β-香树酯醇合酶β-的核酸序列,并且其中所述氧化角鲨烯环化酶、环阿屯醇合酶或β-香树酯醇合酶β-经修饰以产生葫芦二烯醇或环氧葫芦二烯醇。氧化角鲨烯环化酶可以例如包含一种序列或由一种序列组成,该序列与SEQ ID NO:341、343和
346-347中任一者具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。
[0045] 在一些实施方案中,重组宿主细胞包含细胞色素P450还原酶或编码细胞色素P450还原酶的基因。在一些实施方案中,细胞色素P450还原酶包含一种序列或由一种序列组成,该序列与SEQ ID NO:318具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。
[0046] 本发明公开包括具有化合物1的结构的化合物,
[0047]
[0048] 其中所述化合物由本文公开的任何方法产生。
[0049] 本发明公开了一种细胞裂解物,其包含具有以下结构的化合物1:
[0050]
[0051] 本发明还公开了一种重组细胞,其包含:具有以下结构的化合物1:
[0052]
[0053] 以及基因,该基因编码能够催化罗汉果苷IIIE产生化合物1的酶的。在一些实施方案中,该基因是重组细胞的异源基因。
[0054] 本发明包括一种重组细胞,其包含编码第一酶的第一基因,所述第一酶能够催化由罗汉果苷IIIE产生具有以下结构的化合物1:
[0055]
[0056] 第一酶可以是,例如,UDP糖基转移酶、环麦芽糊精葡聚糖转移酶(CGTases)、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。在一些实施方案中,第一酶是CGTase。例如,CGTase可包含一种氨基酸序列,该序列与SEQ ID NOs:1、3、78-101、148和154中的任一个具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,CGTase包含或由SEQ ID NOs:1、3、78-101、148和154中任何一个的氨基酸序列组成。在一些实施方案中,第一酶是葡聚糖蔗糖酶。例如,葡聚糖蔗糖酶可包含一种氨基酸序列,该氨基酸序列与SEQ ID NOs:2、103、106-110、156和896中所示任一序列具有至少70%、80%、
85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,葡聚糖蔗糖酶由一种核酸序列编码,该序列与SEQ ID NOs:104、105、157、
158和895中的任何一个具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,第一酶是转葡萄糖苷酶。例如,转葡萄糖苷酶可包含例如一种氨基酸序列,该序列与SEQ ID NOs:163-291和723中任何一个的序列具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,转葡萄糖苷酶包含或由SEQ ID NOs:3、
95-102、163-291和723中任何一个的氨基酸序列组成。在一些实施方案中,第一种酶是β-葡萄糖苷酶。在一些实施方式中,β-葡萄糖苷酶包含一种氨基酸序列,该氨基酸序列与SEQ ID NOs:102、292、354-376和678-741中的任何一个具有至少70%、80%、85%、90%、95%、
98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。
[0057] 在一些实施方案中,该细胞还包括一种编码尿苷二磷酸-葡萄糖基转移酶(UGT)的第二基因。在一些实施方案中,UGT包含一种氨基酸序列,该序列与SEQ ID NOs:4-9、15-19、125、126、128、129、293-307、407、409、411、413、439、441和444中的任何一个具有至少70%、
80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,UGT由一种核酸序列编码,该核酸序列与SEQ ID NOs:116-124、127、
130、408、410、412、414、440、442、443和445中的任何一个具有至少70%、80%、85%、90%、
95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,UGT由UGT 1495(SEQ ID NO:10)、UGT 1817(SEQ ID NO:11)、UGT 5914(SEQ ID NO:12)、UGT 8468(SEQ ID NO:13)或UGT 10391(SEQ ID NO:14)中所示的序列编码。在一些实施方案中,细胞还包括编码UGT 98或UGT SK98的第三基因。在一些实施例中,UGT 98或UGT SK98包含一种氨基酸序列,该序列与SEQ ID NO:9、407、16或306具有至少70%、80%、85%、
90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,UGT 98由SEQ ID NO:307中所述的核酸序列编码。
[0058] 在一些实施方案中,细胞包含编码环氧化物水解酶的第四基因。在一些实施方案中,环氧化物水解酶包含一种氨基酸序列,该序列与SEQ ID NO:21-30和309-314中任一者具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性;或者由一种核酸序列编码,该核酸序列与SEQ ID NO:114和115中任何一者具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。
[0059] 在一些实施方案中,细胞包含编码P450的第五序列。在一些实施方案中,P450包含一种氨基酸序列,该序列与SEQ ID NOs:20、49、308、315、430、872、874、876、878、880、882、884、886、888、890和891中的任何一个具有至少70%、80%、85%、90%、95%、98%、99%、
100%或这些数字中任何两个之间的范围的序列同一性;或由一种核酸序列编码,该核酸序列与SEQ ID NOs:31-48、316、431、871、873、875、877、879、881、883、885、887、889和892中的任何一个具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,P450由一种基因编码,该基因包含或由SEQ ID NOs:31-48、316和318中任何一个所示的序列组成。
[0060] 在一些实施方案中,该细胞包含编码具有葫芦二烯醇合酶活性的多肽的第六序列。在一些实施方案中,具有葫芦二烯醇合酶活性的多肽是融合蛋白。在一些实施方案中,融合蛋白包含一个或多个融合结构域,其融合到葫芦二烯醇合酶的N-末端、C-末端或两者。融合结构域的长度可以变化,例如从约3到约1000个氨基酸长,或约5到约50个氨基酸长。在一些实施方案中,融合结构域是功能蛋白的主要部分或整个序列。在一些实施方案中,具有葫芦二烯醇合成酶活性的多肽包含一种氨基酸序列,该序列与SEQ ID NOs:70-73、75-77、
319、321、323、325、327-333、417、420、422、424、426、446、902、904、906,906、851、854、856、
1024、859、862、865、867、915、920、924、928、932、936、940、944、948、952、956、959、964、967、
971、975、979、983、987、991、995、999、1003、1007和1011中的任何一个具有至少70%、80%、
85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,具有葫芦二烯醇合成酶活性的多肽由与SEQ ID NOs:74、320、322、324、326、
328、418、421、423、425、427、897、899、901、903和905中任何一个具有至少70%序列同一性的核酸序列编码。
[0061] 在一些实施方案中,该细胞还包括编码角鲨烯环氧化酶的第七基因。在一些实施方案中,角鲨烯环氧化酶包含一种氨基酸序列,该序列与SEQ ID NOs:50-56、60、61、334和335中的任何一个具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,角鲨烯环氧化酶由一种核酸序列编码,该核酸序列与SEQ ID NO:335具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。
[0062] 在一些实施方案中,细胞还包含编码角鲨烯合酶的第八基因。在一些实施方案中,角鲨烯合酶包含一种氨基酸序列,该序列与SEQ ID NO:69或336具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,角鲨烯合酶由包含SEQ ID NO:337所示核酸序列或由SEQ ID NO:337所示核酸序列组成的序列编码。
[0063] 在一些实施方案中,细胞还包含编码法呢基-PP合酶的第九基因。在一些实施方案中,法呢基-PP合酶包含一种氨基酸序列,该序列与SEQ ID NO:338具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,法呢基-PP合酶由与SEQ ID NO:339具有至少70%、80%、85%、90%、95%、
98%、99%、100%或这些数字中任何两个之间的范围的序列同一性的核酸序列编码。
[0064] 在一些实施方案中,细胞是哺乳动物,植物,细菌,真菌或昆虫的细胞。例如,细胞可以是酵母细胞。在一些实施方案中,所述酵母选自假丝酵母属(Candida)、酵母属(Sacccharaomyces)、酵母亚门(Saccharomycotina)、外囊菌亚门(Taphrinomycotina)、裂殖酵母纲(Schizosaccharomycetes)、毕赤酵母属(Komagataella)、担子菌门
(Basidiomycota)、伞菌亚门(Agaricomycotina)、银耳纲(Tremellomycetes)、柄锈菌亚门(Pucciniomycotina)、短梗霉属(Aureobasidium)、锥毛壳属(Coniochaeta)、红冬孢酵母属(Rhodosporidium)和微球黑粉菌纲(Microboryomycetes)。在一些实施方案中,所述植物选自罗汉果属(Siraitia)、苦瓜属(Momordica)、绞股蓝属(Gynostemma)、南瓜属
(Cucurbita)、黄瓜属(Cucumis)、拟南芥属(Arabidopsis)、蒿属(Artemisia)、甜菊属(Stevia)、人参属(Panax)、睡茄属(Withania)、大戟属(Euphorbia)、苜蓿属(Medicago)、吊兰属(Chlorophytum)、五加属(Eleutherococcus)、楤木属(Aralia)、桑属(Morus)、苜蓿属(Medicago)、桦木属(Betula)、黄芪属(Astragalus)、麻疯树属(Jatropha)、山茶属
(Camellia)、韧伞属(Hypholoma)、曲霉属(Aspergillus)、茄属(Solanum)、石杉属
(Huperzia)、孩儿参属(Pseudostellaria)、黄麻属(Corchorus)、常春藤属(Hedera)、地钱属(Marchantia)和桑属(Morus)。在一些实施方案中,该真菌选自毛癣菌属
(Trichophyton)、桑黄孔菌属(Sanghuangporus)、台芝属(Taiwanofungus)、链疫孢属(Moniliophthora)、盘二孢属(Marssonina)、色二孢属(Diplodia)、微香菇属(Lentinula)、法夫酵母属(Xanthophyllomyces)、普可尼亚属(Pochonia)、炭疽菌属(Colletotrichum)、间座壳属(Diaporthe)、组织胞浆菌属(Histoplasma)、球孢子菌属(Coccidioides)、组织胞浆菌属(Histoplasma)、桑黄孔菌属(Sanghuangporus)、短梗霉属(Aureobasidium)、普可尼亚属(Pochonia)、青霉属(Penicillium)、孢子丝菌属(Sporothrix)、或黑僵菌属
(Metarhizium)。
[0065] 在一些实施方案中,细胞包含编码至少一种能够水解罗汉果苷V的水解酶的基因。在一些实施方案中,化合物1在重组细胞中显示出对水解酶的耐受性,其中水解酶显示出水解罗汉果苷VI、罗汉果苷V、罗汉果苷IV至罗汉果苷IIIE的能力。
[0066] 在一些实施方案中,重组细胞包含氧化角鲨烯环化酶例如环阿屯醇合酶或β-香树酯醇合酶β-,或编码氧化角鲨烯环化酶例如环阿屯醇合酶或β-香树酯醇合酶的核酸序列,其中氧化角鲨烯环化酶、环阿屯醇合酶或β-香树酯醇合酶β-经修饰以产生葫芦二烯醇或环氧葫芦二烯醇。
[0067] 在一些实施方案中,氧化角鲨烯环化酶包含一种氨基酸序列,该序列与SEQ ID NO:341、343和346-347中的任一个具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,细胞包含细胞色素P450还原酶或编码细胞色素P450还原酶的基因。在一些实施方案中,细胞色素P450还原酶再生细胞色素P450活性。在一些实施方案中,细胞色素P450还原酶包含与SEQ ID NO:318具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性的序列。
[0068] 在一些实施方案中,细胞包含SEQ ID NO:897、899、909、911、913、418、421、423、425、427、871、873、901、903和905中任何一个所示的序列。在一些实施方案中,细胞包含一种酶,该酶包含SEQ ID NO:315、316、420、422、424、426、430、431、446、871、845-949和951-
1012所示的序列,或由SEQ ID NO:315、316、420、422、424、426、430、431、446、871、845-949和951-1012中任何一个的序列编码。
[0069] 在一些实施方案中,该细胞包含编码能够水解第一罗汉果苷以产生罗汉果苷IIIE的水解酶的基因。在一些实施方案中,水解酶是β-葡聚糖水解酶。在一些实施方案中,水解酶为EXG1或EXG2。在一些实施方案中,水解酶包含一种氨基酸序列,该氨基酸序列与SEQ ID NO:292、366-368、372、376-398、447-520、524-845、1013、1014和1023中任何一个具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。
[0070] 在一些实施方案中,第一罗汉果苷是罗汉果苷IV、罗汉果苷V、罗汉果苷VI或其组合。在一些实施方案中,第一罗汉果苷是罗汉果苷V、赛门苷I、罗汉果苷IVE、罗汉果苷VI、罗汉果苷IVA或其组合。
[0071] 编码水解酶的基因与重组宿主细胞可以是异源或同源的。编码水解酶的基因可以在重组宿主细胞中以正常水平表达或过表达。在一些实施方案中,细胞是一种酵母细胞。在一些实施方案中,细胞是酿酒酵母(Saccharomyces cerevisiae)或解脂耶氏酵母(Yarrowia lipolytica)。
[0072] 本发明还公开了产生具有以下结构的化合物1的方法:
[0073]
[0074] 在一些实施方案中,该方法包括:使第一罗汉果苷与一种或多种水解酶接触以产生罗汉果苷IIIE;使罗汉果苷IIIE与能够催化从罗汉果苷IIIE产生化合物1的酶接触。
[0075] 在一些实施方案中,水解酶是一种β-葡聚糖水解酶。在一些实施方案中,水解酶是EXG1,例如EXG1包含一种氨基酸序列,该序列与SEQ ID NO:1012或1014具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,水解酶是EXG2,例如EXG2包含一种氨基酸序列,该序列与SEQ ID NO:1023具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。
[0076] 在一些实施方案中,第一罗汉果苷是罗汉果苷IV、罗汉果苷V、罗汉果苷VI或其组合。在一些实施方案中,第一罗汉果苷是罗汉果苷V、赛门苷I、罗汉果苷IVE、罗汉果苷VI、罗汉果苷IVA或其组合。
[0077] 在一些实施方案中,使第一罗汉果糖苷与一种或多种水解酶接触包括使第一罗汉果糖苷与重组宿主细胞接触,所述重组宿主细胞包含编码水解酶的第一基因和编码能够催化化合物1产生的酶的第二基因。在一些实施方案中,第一罗汉果苷与重组宿主细胞中的一种或多种水解酶接触,所述重组宿主细胞包含编码水解酶的第一基因和编码能够催化化合物1产生的酶的第二基因。在一些实施方案中,第一罗汉果苷由重组宿主细胞产生。在一些实施方案中,第一基因对于重组宿主细胞是天然的。在一些实施方案中,第一基因以正常水平表达。在一些实施方案中,第一基因对于重组宿主细胞是异源的。在一些实施方案中,第一基因过表达。在一些实施方案中,第二基因对于重组宿主细胞是异源的。在一些实施方案中,能够催化化合物1产生的酶是UDP糖基转移酶、环麦芽糊精葡聚糖转移酶(CGTases)、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。
[0078] 本发明公开了一种重组细胞,其包含:第一基因,其编码能够水解第一罗汉果苷以产生罗汉果苷IIIE的水解酶;和第二基因,其编码能够催化从罗汉果苷IIIE产生化合物1的酶,其中化合物1具有以下结构:
[0079]
[0080] 在一些实施方案中,水解酶是一种β-葡聚糖水解酶。例如,水解酶可以是EXG1或EXG2。在一些实施方案中,EXG2蛋白包含一种氨基酸序列,该序列与SEQ ID NO:1023具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,第一罗汉果苷是罗汉果苷IV、罗汉果苷V、罗汉果苷VI或其组合。在一些实施方案中,第一罗汉果苷是罗汉果苷V、赛门苷I、罗汉果苷IVE、罗汉果苷VI、罗汉果苷IVA或其组合。第一基因可以与重组宿主细胞是异源的或同源的。第一基因可以在宿主细胞中过表达或正常表达。该细胞可以是例如酵母细胞。在一些实施方案中,细胞是酿酒酵母(Saccharomyces cerevisiae)或解脂耶氏酵母(Yarrowia lipolytica)。
[0081] 本发明还公开了一种具有葫芦二烯醇合酶活性的融合多肽,其中所述融合多肽包含与葫芦二烯醇合酶融合的融合结构域。融合结构域可与葫芦二烯醇合酶的N-末端、C-末端或两者融合。融合结构域可以是例如约3至约1000个氨基酸长,或约5至约50个氨基酸长。在一些实施方案中,融合结构域包含功能蛋白的主要部分或整个序列。在一些实施方案中,融合结构域是功能蛋白的主要部分或整个序列。在一些实施方案中,融合结构域包含酵母蛋白的一部分或全部序列。在一些实施方案中,融合结构域是酵母蛋白的一部分或全部序列。在一些实施方案中,融合多肽包含一种氨基酸序列,该序列与SEQ ID NO:851、854、856、
1024、859、862、865、867、915、920、924、928、932、936、940、944、948、952、956、959,964、967、
971、975、979、983、987、991、995、999、1003、1007和1011中的任一个具有至少70%、80%、
85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,融合多肽包含或由以下任一项所示的氨基酸序列组成:SEQ ID NO:851、
854、856、1024、859、862、865、867、915、920、924、928、932、936、940、944、948、952、956、959、
964、967、971、975、979、983、987、991、995、999、1003、1007和1011。在一些实施方案中,融合多肽的融合结构域包含一种氨基酸序列,该序列与SEQ ID NOs:866、870、917、921、925、
929、933、937,941、945、949、953、957、961、968、972、976、980、984、988、992、996、1000、
1004、1008和1012中的任何一个具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,融合多肽的融合结构域包含或由以下任一序列组成:SEQ ID NO:866、870、917、921、925、929、933、937、941、945、
949、953、957、961、968、972、976、980、984、988、992、996、1000、1004、1008和1012。
[0082] 在一些实施方案中,葫芦二烯醇合酶包含一种氨基酸序列,该序列与SEQ ID NOs:70-73、75-77、319、321、323、325、327、329-333、420、422、424、426、446、902、904和906中的任一个具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,葫芦二烯醇合酶包含或由以下任一序列中所示的氨基酸序列组成:SEQ ID NOs:70-73、75-77、319、321、323、325、327、329-329、420、
422、424、426、446、902、904和906。在一些实施方案中,葫芦二烯醇合酶由包含核酸序列的基因编码,该核酸序列与SEQ ID NO:74、320、322、324、326、328、418、421、423、425、427、
897、899、901、903和905中任一个具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,葫芦二烯醇合酶由包含或由以下所示任一核酸序列组成的基因编码:SEQ ID NO:74、320、322、324、326、328、
418、421、423、425、427、897、899、901、903和905。
[0083] 本发明公开了一种重组核酸分子,其包含编码本发明公开且具有葫芦二烯醇合酶活性的任何融合多肽的核酸序列。本发明公开了一种重组细胞,其包含本发明公开且具有葫芦二烯醇合酶活性的任何一种融合多肽和/或本发明公开且编码具有葫芦二烯醇合酶活性的融合多肽的任何重组核酸分子。本发明还公开了一种方法,该方法使用本文公开的具有葫芦二烯醇合酶活性的任何融合多肽。该方法可包括使葫芦二烯醇合酶的底物与具有葫芦二烯醇合酶活性的融合多肽接触。在一些实施方案中,该接触导致产生葫芦二烯醇(curcurbitadienol)、24,25-环氧葫芦二烯醇或其组合。在一些实施方案中,葫芦二烯醇合酶的底物包含2,3-氧化角鲨烯、二氧化角鲨烯和二环氧角鲨烯中的一种或多种。在一些实施方案中,接触包括使底物与包含编码融合多肽的核酸序列的重组宿主细胞接触。重组宿主细胞能够例如表达融合多肽。在一些实施方案中,底物提供给重组宿主细胞,存在于重组宿主细胞中和/或由重组宿主细胞产生。
附图说明
[0084] 图1显示了用CGTase处理罗汉果苷IIIE后产生的化合物1的HPLC数据和质谱数据(插图)。
[0085] 图2显示了用变形链球菌(Streptococcus mutans)Clarke ATCC 25175葡聚糖转移酶处理罗汉果苷IIIE后产生的化合物1的HPLC数据和质谱数据(插图)。
[0086] 图3显示了在木聚糖存在下用Celluclast处理后,罗汉果苷糖基化反应的HPLC数据和质谱数据(插图)。
[0087] 图4和图5显示了用UDP-糖基转移酶处理后的罗汉果苷糖基化反应的HPLC数据和质谱数据(插图)。
[0088] 图6显示了用UDP-糖基转移酶UGT73C6处理罗汉果苷I后的罗汉果醇的HPLC数据和质谱数据(插图)。
[0089] 图7-图9显示了罗汉果苷I、罗汉果苷IIA和两种不同罗汉果苷III产品经UDP-糖基转移酶(338)(SEQ ID NO:405)处理后的罗汉果醇的HPLC数据和质谱数据(插图)。
[0090] 图10和图11显示了用UDP-糖基转移酶处理罗汉果苷IIIE以生产赛门苷I和罗汉果苷V产物的HPLC数据和质谱数据(插图)。
[0091] 图12-图14显示了经UDP-糖基转移酶(339)(SEQ ID NO:409)处理罗汉果醇、赛门苷I或化合物1以分别产生罗汉果苷I、异罗汉果苷V和化合物1衍生物的HPLC数据和质谱数据(插图)。
[0092] 图15-图20显示了用UDP-糖基转移酶(330)(SEQ ID NO:411)处理罗汉果苷IIA、罗汉果苷IIE、罗汉果苷IIIE、罗汉果苷IVA或罗汉果苷IVE以分别产生罗汉果苷IIIA、罗汉果苷IVE、罗汉果苷V的HPLC数据和质谱数据(插图)。
[0093] 图21和图22显示了反应产物罗汉果苷IVE和罗汉果苷V的质谱图。
[0094] 图23显示了用葫芦二烯合酶(SgCbQ)(SEQ ID NO:417)产生葫芦二烯醇。
[0095] 图24显示了使用酶Cpep2(SEQ ID NO:420)产生葫芦二烯醇。
[0096] 图25显示了使用酶Cpep4(SEQ ID NO:422)产生葫芦二烯醇。
[0097] 图26显示了由环氧水解酶(SEQ ID NO:428)的催化产生二羟基葫芦二烯醇。
[0098] 图27A-B显示了化合物1对微生物酶水解的耐受性。
[0099] 图28显示了来自Hilic_80_20_method的α-罗汉果糖苷异构体混合物的UPLC色谱图。
[0100] 图29显示了在Hilic_80_20_method上通过UPLC分析得到的样品纯度。
[0101] 图30示出了用于产生化合物1的非限制性示例性途径的流程图
[0102] 图31示出图30所示的步骤1的二环氧化合物的紫外吸光度,以增强氧化角鲨烯。
[0103] 图32示出了用厚皮甜瓜(Cucumis melo)和笋瓜(Cucurbita maxima)的酶在步骤2中生产葫芦二烯醇的方法。
[0104] 图33显示了在步骤2中使用来自豌豆(Pisum sativum)的酶生产葫芦二烯醇。
[0105] 图34显示了在步骤2中,使用来自盘基网柄菌(Dictyostelium sp.)的酶生产葫芦二烯醇。
[0106] 图35显示了图30所示路线中步骤3的中间体。
[0107] 图36显示了图30所示路线步骤4即罗汉果醇合成的中间产物的质谱数据。
[0108] 图37显示了如图30所示的路线步骤7即化合物1合成的中间体。
[0109] 图38是一个示意图,显示了通过糖基化酶产生高糖基化罗汉果苷,然后可以水解回罗汉果苷IIIE。
[0110] 图39是一个示意图,展示了如何利用水解来水解高糖基化罗汉果苷以产生罗汉果苷IIIE,然后将其转化为化合物1。
[0111] 图40A-B显示在温育2天后,在酿酒酵母(S.cerevisiae)或解脂耶氏酵母(Y.lipolytica.)中,基本上所有的罗汉果苷都转化为罗汉果苷IIIE。
[0112] 图41显示未从酿酒酵母(S.cerevisiae)或解脂耶氏酵母(Y.lipolytica.)中检测到来自化合物1的水解产物。
[0113] 图42显示了在酿酒酵母(S.cerevisiae)中产生化合物1,该酿酒酵母经修饰以过表达葡聚糖蔗糖酶(DexT)。
[0114] 图43显示311酶(UDP-糖基转移酶)催化的酶反应。

具体实施方式

[0115] 定义
[0116] 除非另外定义,本文使用的所有技术术语和科学术语具有与本公开所属领域普通技术人员通常理解相同的含义。所有的专利申请、公开申请和其他公开文本通过引用整体并入。在本文的术语存在多个定义的情况下,以本节的定义为准,除非另外说明。
[0117] “溶剂化物”是指由溶剂与本文所述的化合物或其盐的相互作用而形成的化合物。适合的溶剂化物是生理可接受的溶剂化物,包括水合物。
[0118] 如本文使用的“甜味剂”、“甜味调味剂”、“甜味调味料实体”、“甜化合物”或“甜味化合物”是指在对象中引起可察觉的甜味的化合物或其生理可接受的盐。
[0119] 如本文所用,术语“可操作地连接”用于描述调节元件(regulatory elements)与基因或其编码区之间的连接。通常,基因表达置于一种或多种调节元件的控制下,例如但不限于组成型或诱导型启动子、组织特异性调节成分和增强子。一个基因或编码区被称为“可操作地连接”或“可操作的连接”或“可操作地与”调控元件相关联,这意味着该基因或编码区受调控元件控制或影响。例如,如果启动子影响编码序列的转录或表达,则启动子可操作地连接到编码序列。基因或编码区与调节元件“可操作地连接”或“能操作地连接”或“可操作地关联”调节元件,意味着基因或编码区由调节元件控制或影响。例如,如果启动子影响编码序列的转录或表达,则称其与编码序列可操作地连接。
[0120] 术语“调节元件”和“表达控制元件”(expression control element)可互换使用,并且是指可影响特定宿主生物体中可操作连接的编码序列表达的核酸分子。这些术语被广泛用于涵盖和覆盖所有促进或调节转录的元件,包括启动子、增强子序列、响应元件、蛋白质识别位点、诱导元件、蛋白质结合序列、5'和3'非翻译区(UTR)、转录起始位点、终止序列、聚腺苷酸化序列、反式(intrans)、RNA聚合酶与转录因子基本相互作用所需的核心元件、上游元件、增强子、反应元件(参见,例如Lewin,“Genes V”(津,牛津大学出版社),第847-873页)及其任意组合。原核生物中的示例性调控元件包括启动子,操纵子序列和核糖体结合位点。真核细胞中使用的调节元件可以包括但不限于转录和翻译控制序列,例如启动子、增强子、剪接信号、聚腺苷酸化信号、终止子、蛋白质降解信号、内部核糖体进入元件(IRES)、2A序列,在宿主细胞中提供和/或调节编码序列的表达和/或编码的多肽的产生等。
在本文的一些实施方案中,本文所述的重组细胞包含可操作地连接于调节元件的基因。
[0121] 如本文所用,2A序列或元件是指一种小肽,其作为两个蛋白质之间的连接引入,从而允许多蛋白的自主核糖体内自我处理(参见例如de Felipe.Genetic Vaccines and Ther.2:13(2004);de Felipe et al.Traffic5:616-626(2004))。这些短肽允许从单个载体共表达多种蛋白质。许多2A元件是本领域已知的。可以在本文公开的方法和系统中使用的2A序列的实例包括但不限于,包括来自疫病毒(F2A),鼻炎A病毒(E2A),明脉扁刺蛾(Thosea asigna)病毒(T2A)和如美国专利公开号20070116690中所述的猪细小病毒1
(P2A)。
[0122] 如本文所用,术语“启动子”是允许RNA聚合酶结合并指导基因转录的核苷酸序列。通常,启动子位于基因的5'非编码区中,靠近基因的转录起始位点。启动子中在转录起始中起作用的序列元件通常以一致的核苷酸序列为特征。启动子的实例包括但不限于来自细菌、酵母、植物、病毒和哺乳动物(包括人)的启动子。启动子可以是诱导型、阻遏型和/或组成型的。响应于培养条件的某些变化(例如温度变化),诱导型启动子在其控制下启动DNA转录水平的提高。
[0123] 如本文所使用的,术语“增强子”是指一种能够提高转录效率的一种调控元件,而不管增强子相对于转录起始位点的距离或方向如何。
[0124] 如本文所用,术语“转基因”是指通过人为干预整合到靶细胞的一个或多个染色体中的任何核苷酸或DNA序列。在一些实施方案中,转基因包含编码目标蛋白质的多核苷酸。编码蛋白质的多核苷酸通常可操作地连接至可用于获得目标基因的期望表达的其他序列,例如转录调控序列。在一些实施方案中,转基因可以另外包含用于标记整合了染色体的核酸或其他分子。
[0125] 在本文中,关于多核苷酸或多肽序列的“百分比(%)序列同一性”,用作在将两个序列对齐后,比对后候选序列中的基或氨基酸残基与另一序列中的碱基或氨基酸残基相同的百分比。如果需要,可以将空隙引入序列比对中,以实现最大的序列同一性百分比。保守取代不被视为序列同一性的一部分。为了确定百分比(%)序列同一性的目的,比对可以通过本领域技术范围内的各种方式来实现,例如,使用公开可用的计算机方法和程序,例如BLAST、BLAST-2、ALIGN、FASTA(美国威斯康星州麦迪逊市的遗传学计算组(GCG)软件包)或Megalign(DNASTAR)。本领域技术人员可以确定用于测量比对的合适参数,包括在所比较的序列的全长上实现最大比对所需的任何算法
[0126] 例如,可使用WU-BLAST-2计算机程序(描述在例如Altschul等人,《酶学方法》,1996,266:460-480)获得氨基酸序列的百分比值。本领域技术人员可以调整WU-BLAST-2计算机程序中的许多搜索参数。例如,可以使用以下值设置某些可调参数:重叠跨度=1、重叠分数=0.125、单词(word)阈值(t)=11和评分矩阵=BLOSUM62。当使用WU-BLAST-2时,氨基酸序列同一性%值通过以下方式确定:将(a)第一目标蛋白质的氨基酸序列与第二目标蛋白质的氨基酸序列之间匹配的相同氨基酸残基的数量除以通过WU-BLAST-2确定的(b)第一目标蛋白质的氨基酸残基的总数。
[0127] 氨基酸序列同源性百分比也可以使用序列比较程序NCBI-BLAST2(例如描述在Altschul等人,《核酸研究》,1997,25:3389-3402)来确定。NCBI-BLAST2序列比较程序可从http://www.ncbi.nlm.nih.gov下载,或从马里兰州贝塞斯达国家卫生研究所获得。NCBI-BLAST2使用多个可调搜索参数。这些可调搜索参数中的一些默认值是,例如,unmask=yes,strand=all,预期出现次数=10,最小低复杂度长度=15/5,多通E值(multi-pass e-value)=0.01,多通常数=25,最终间隙对齐的drop-off=25和得分矩阵=BLUSOM62。
[0128] 在使用NCBI-BLAST2进行氨基酸序列比较的情况下,给定氨基酸序列A与或对给定氨基酸序列B的%氨基酸序列同一性(也可以称为给定氨基酸序列A,其具有或包含与给定氨基酸序列B相同的氨基酸序列的百分比)的计算如下:
[0129] X/Y的100倍
[0130] 其中X是根据序列比对程序NCBI-BLAST2,在A和B比对中评分为相同匹配的氨基酸残基的数目,其中Y是B中氨基酸残基的总数。当氨基酸序列A的长度不等于氨基酸序列B的长度时,可以理解为A与B的氨基酸序列同一性百分比将不等于B与A的氨基酸序列同一性的百分比。
[0131] 如本文使用的,“分离的”意指所示化合物已从其天然环境中分离,使得天然状态中与该化合物一同存在的一种或多种其他化合物或生物试剂不再存在。
[0132] 如本文使用的,“纯化的”意指所示化合物以相对于通常与所示化合物一起存在的其他化合物(例如,在其天然环境中)更高的量存在。在一些实施方案中,纯化的化合物的相对量提高了大于1%、5%、10%、20%、30%、40%、50%、80%、90%、100%、120%、150%、200%、300%、400%或1000%。在一些实施方案中,相对于与纯化的化合物结合的其他化合物,纯化的化合物以大于1%、5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、
95%、98%、99%或99.5%的重量百分比水平存在。在一些实施方案中,相对于与纯化的化合物结合的其他化合物,由本文的实施方案产生的化合物1以大于1%、5%、10%、20%、
30%、40%、50%、60%、70%、80%、90%、95%、98%、99%或99.5%的重量百分比水平存在。
[0133] 如本文所述的“纯化”可以指从细胞裂解物和/或上清液中提取化合物1的方法,其中细胞正在分泌产物化合物1。如本文所述,“裂解物”包括细胞壁和细胞膜破裂后的细胞内容物,例如可以包括蛋白质、糖和罗汉果苷。纯化可包括硫酸铵沉淀以去除蛋白质、盐析以去除蛋白质、疏水分离(HPLC)和使用亲和柱。考虑到通过本文的方法生产的产物,用吸附树脂除去特定的罗汉果苷时考虑用亲和介质。
[0134] 如本文所述,“HPLC”是指液相色谱法,其可用于分离溶解在溶液中的化合物。不受限制,HPLC仪器可以包括流动相储液罐、注射器、分离柱和检测器。然后可以通过将样品混合物注入色谱柱来分离化合物。由于在流动液相和固定相之间的分配行为不同,混合物中的不同组分可以以不同的速率通过色谱柱。有几种柱子可以使用。柱子可以是正相柱、反相柱、尺寸排阻(size exclusion)类型柱和离子交换柱,而没有限制。
[0135] 还考虑使用固相萃取和分馏,其可用于使蛋白质和糖样品脱盐。其他方法可以包括使用HPLC,液相色谱法分析样品以及液-液萃取,如Auréa Andrade-Eiroa等人(TrAC在分析化学中的趋势,第80卷,2016年6月,第641-654页)所述;文献全文以引用方式并入本文。
[0136] 如本文所述,用于纯化的“固相萃取”(SPE)是指根据其物理和化学性质将溶解或悬浮在液体混合物中的化合物与混合物中的其他化合物分离的样品制备过程。例如,分析实验室可以使用固相萃取来浓缩和纯化分析用样品。固相萃取也可用于从多种基质中分离出感兴趣的分析物,例如尿液、血液、水、饮料、土壤和动物组织。在本文的实施方案中,可以通过固相萃取纯化位于细胞裂解物或细胞介质中的化合物1。
[0137] SPE利用溶解或悬浮在液体(称为流动相)中的溶质对固体的亲和力,使样品通过该固体(称为固定相),从而将混合物分离为所需成分和需要的成分。SPE还可以直接用于气相-固相和液相-固相中,或通过使用例如热脱附和随后的色谱分析而间接应用于固体样品。这可能导致所需的目标分析物或样品中的不良杂质被保留在固定相上。这可能导致需要的分析物或样品中不需要的杂质保留在固定相上。通过固定相的部分可以被收集或丢弃,这取决于它是否含有所需的分析物或不需要的杂质。如果保留在固定相上的部分包括所需的分析物,则可在附加步骤中将其从固定相上移除以进行收集,该附加步骤中,用适当的洗脱液冲洗固定相。
[0138] 固相萃取的方法不受限制。在不受限制的情况下,可以包括:正相固相萃取、反相固相萃取、离子交换固相萃取、阴离子交换固相萃取、阳离子交换固相萃取和固相微萃取。固相萃取在Sajid等人和 Wasylka J等人。(Anal Chim Acta.2017 May 1;965:36-
53,Crit Rev Anal Chem.2017 Apr 11:1-11)中有描述,文献全文以引用方式并入本文。
[0139] 在一些实施方案中,通过固相萃取纯化由细胞产生的化合物1。在一些实施方案中,化合物1的纯度,例如通过固相萃取纯化的纯度为70%、80%、90%或100%,或由任何上述值定义的任何纯度水平。
[0140] 如本文所述的“发酵”,广义上指宿主细胞在宿主培养基中大量生长以产生特定产物。在这里的实施方案中,所产生的最终产物是化合物1。这也可以包括在有空气或没有空气的情况下实施的方法,例如可以在厌氧环境中进行。整个细胞(重组宿主细胞)可以在发酵液或反应缓冲液中。
[0141] 化合物1和用于生产化合物1的中间罗汉果苷化合物,可通过从重组细胞裂解物或上清液中收集中间罗汉果苷化合物和化合物1来分离。裂解液可以在收集细胞并通过剪切力(高压细胞裂解(French press cell)或声波)或通过洗涤剂处理使细胞裂解后获得。然后用硫酸铵过滤和处理裂解物以去除蛋白质,并在C18 HPLC(5x10cm Atlantis Prep T3 OBD柱,5um,Waters)上进行分离,并在30分钟内使用10→30%B的A/B梯度(A=水B=乙腈)进行注射,用95%B洗涤,然后重新平衡在1%(总运行时间=42分钟)。可在去皮重的试管(12馏分/板,每次3板)中以30ml/馏分的速度收集。还可以离心裂解液以除去固体和颗粒物。
[0142] 然后将板在Geneva HT12/HT24中干燥。预期目标化合物将与其他异构体一起在馏分21中洗脱。合并的馏分可以在氟苯基HPLC柱(3x10cm,Xselect氟苯基OBD柱,5um,Waters)上,在35分钟内使用15→30%B的A/B梯度(A=水,B=乙腈),用95%B洗涤,然后重新平衡在15%(总运行时间=45分钟),在47次运行中进一步分馏。每一次在12个去皮重的试管(12馏分/板,每次1个板)中以30ml/馏分收集。可以根据UPLC分析合并含有所需峰和所需纯度的馏分,并在减压下干燥,得到白色粉末状固体。可以将纯化合物重新悬浮/溶解在10mL水中,然后冻干以获得至少95%的纯度。
[0143] 如本文使用的,“糖苷键”是指将两个呋喃糖和/或吡喃糖基团连接在一起的共价键。通常,糖苷键是一个呋喃糖部分或吡喃糖部分的异头与另一个呋喃糖部分或吡喃糖部分的氧之间的键。使用连接的碳原子的编号以及α/β定向来命名糖苷键。根据环中离C1最远的异头位置和立构中心的相对立体化学来区分α-糖苷键和β-糖苷键。例如,蔗糖是由通过α1-2糖苷键连接的一个分子的葡萄糖和一个分子的果糖组成的二糖,如下文所示。
[0144]
[0145] β1-4糖苷键的实例可以见于纤维素中:
[0146]
[0147] 必须注意,如本说明书和所附权利要求书中使用的,单数形式“一种(a)”、“一个(an)”和“该/所述(the)”包括复数指代物,除非上下文中另外明确指明。因此,例如,提及“一种芳香族化合物”包括芳香族化合物的混合物。
[0148] 通常,范围在本文表述为从“约”一个具体值,和/或至“约”另一个具体值。当表述此类范围时,另一个实施方案包括从一个具体值和/或至另一个具体值。类似地,当值通过使用前缀“约”表述为近似值时,应理解具体的值形成了另一个实施方案。还应理解,各个范围的端点均对于另一个端点是重要的,并且独立于另一个端点。
[0149] 如本文所述,“密码子优化”是指将密码子改变为已知可增加最大蛋白质表达效率的密码子的设计过程。在一些替代方案中,描述了用于在细胞中表达的密码子优化,其中可以通过使用本领域技术人员已知的算法来进行密码子优化,以便产生针对人的高mRNA和蛋白质产量而优化的合成遗传转录本。例如,可以优化密码子以在细菌细胞、哺乳动物细胞、酵母细胞、昆虫细胞或植物细胞中表达蛋白质。包含用于人类密码子优化算法的程序很容易获得。这样的程序可以包括例如OptimumGeneTM或 算法。另外,密码子优化的序列可以例如从Integrated DNA Technologies商购获得。在本文的一些实施方案中,用于产生化合物1的重组细胞包含编码用于合成的酶的基因,其中基因被密码子优化以用于表达。在一些实施方案中,对基因进行密码子优化以在细菌、酵母、真菌或昆虫细胞中表达。
[0150] 如本文所使用的,术语“核酸”、“核酸分子”和“多核苷酸”是可互换的,并且是指任何核酸,无论是由磷酸二酯键或改性键组成,例如磷酸三酯、磷酰胺(phosphoramidate)、氧烷、碳酸盐、羧甲基酯、乙酰亚胺酯、氨基甲酸酯、硫醚、桥连磷酰胺、桥连亚甲基膦酸盐、桥连磷酰胺、桥连磷酰胺、桥连亚甲基膦酸盐、硫代磷酸酯、甲基膦酸盐、桥连二硫代磷酸酯、桥连硫代磷酸酯或磺酸内酯(sultone)键,以及这些键的组合。术语“核酸”和“多核苷酸”还具体包括由五种生物发生的碱基(腺嘌呤、嘌呤、胸腺嘧啶、胞嘧啶和尿嘧啶)以外的碱基组成的核酸。
[0151] 多核苷酸的非限制性实例包括脱氧核糖核酸(DNA)或核糖核酸(RNA)、寡核苷酸、聚合酶链反应(PCR)产生的片段以及任何连接、切断、内切酶作用和外切酶作用产生的片段。核酸分子可以由天然核苷酸的单体(如DNA和RNA)或天然核苷酸的类似物(如天然核苷酸的对映体形式)或两者的组合组成。修饰核苷酸可在糖部分和/或嘧啶或嘌呤碱部分发生改变。糖修饰包括例如用卤素、烷基、胺和叠氮基替换一个或多个羟基,或者糖可以功能化为醚或酯。此外,整个糖部分可以替换为空间和电子上类似的结构,如氮杂糖和碳环糖类似物。碱基部分中的修饰示例包括烷基化嘌呤和嘧啶、酰化嘌呤或嘧啶,或其他众所周知的杂环替代物。核酸单体可通过磷酸二酯键或此类键的类似物连接。磷酸二酯键的类似物包括硫代磷酸酯、二硫代磷酸酯、硒代磷酸酯、二硒代磷酸酯、苯胺硫代磷酸酯(phosphoroanilothioate)、苯胺磷酸酯(phosphoroanilidate)、磷酰胺
(phosphoramidate)等。术语“核酸分子”还包括所谓的“肽核酸”,其包含附着在聚酰胺主链上的自然存在的或经修饰的核酸碱。核酸可以是单链或双链。在一些替代方案中,提供了编码融合蛋白的核酸序列。在一些替代方案中,核酸是RNA或DNA。在一些实施方案中,核酸包含SEQ ID NO:1-1023中的任何一个。
[0152] 这里使用“编码”(“Coding for")或“编码”(“encoding”),指的是多核苷酸中核苷酸的特定序列的性质,例如基因、cDNA或mRNA,用作合成其他大分子(例如已定义的氨基酸序列)的模板。因此,如果与该基因对应的mRNA的转录和翻译在细胞或其他生物系统中产生蛋白质,则该基因编码蛋白质。在本文的一些实施方案中,提供重组细胞,其中重组细胞包含编码酶的基因,所述酶例如葡聚糖蔗糖酶、UDP糖基转移酶、CGTase、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶和/或UGT。在一些实施方案中,转葡糖苷酶包含由SEQ ID NO:163-290和723中的任何一个所示的氨基酸序列。在一些实施方案中,CGTase由SEQ ID NO:1、3、78-101、147和154中的任何一个编码或具有其序列。在一些实施方案中,编码酶如葡聚糖蔗糖酶、UDP糖基转移酶、CGTase、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶和/或UGT的基因为了在宿主细胞中表达而进行了密码子优化。“编码多肽的核酸序列”包括彼此为简并形式(degenerate versions)并且编码相同氨基酸序列的所有核苷酸序列。
[0153] 还可以进行优化以减少多核苷酸中二级结构的出现。在该方法的一些替代方案中,还可以对载体中的序列进行优化以降低总GC/AT比。严格的密码子优化可能会导致不想要的二级结构,或者导致二级结构的GC含量过高。这样,二级结构影响转录效率。密码子使用优化之后,可以使用诸如GeneOptimizer之类的程序进行二级结构避免和GC含量优化。这些附加程序可在初始密码子优化后用于进一步的优化和故障排除,以限制在第一轮优化后可能出现的二级结构。优化的替代程序很容易获得。在该方法的一些替代方案中,载体包含针对二级结构避免而优化的序列、和/或针对减少总GC/AT比而优化的序列、和/或针对在细菌或酵母细胞中表达而优化的序列。
[0154] “载体”、“表达载体”或“构建体”是用于将异源核酸引入细胞的核酸,其具有调节元件以提供异源核酸在细胞中的表达。载体包括但不限于质粒、小环、酵母和病毒基因组。在一些替代方案中,载体是质粒、小环、酵母或基因组。在一些替代方案中,载体用于在细菌系统例如大肠杆菌中表达蛋白质。在一些替代方案中,载体用于在细菌系统例如大肠杆菌中表达蛋白质。在一些替代方案中,该载体用于在酵母系统中表达蛋白质。在一些实施方案中,用于表达的载体是病毒载体。在一些实施方案中,载体是重组载体,其包含用于上调基因表达的启动子序列。“调控元件”可以指具有核苷酸序列的核酸,该核苷酸序列可以影响转录或翻译的起始以及转录或翻译产物的速率、稳定性迁移性
[0155] 如本文所述,“重组宿主”或“重组宿主细胞”是宿主,其基因组已被至少一个掺入的DNA序列增强。所述掺入的DNA序列可以是编码一种或多种多肽的异源核酸。这样的DNA序列包括但不限于非天然存在的基因,通常不转录成RNA或翻译成蛋白质(“表达的”)的DNA序列,以及希望引入非结合宿主的其他基因或DNA序列。在一些实施方案中,重组宿主细胞用于防止诸如密码子偏倚(codon-bias)之类的表达问题。存在用于表达蛋白质的商业宿主,例如BL21-CodonPlusTM细胞,用于表达异源基因的tRNA补充宿主菌株,用于增强蛋白质表达的RosettaTM(DE3)感受态菌株以及在酵母属(genera Saccharomyces)、毕赤酵母(Pichia)、克鲁维酵母(Kluyveromyces)、汉逊酵母(Hansenula)和耶氏酵母(Yarrowia)中的商业酵母表达系统。
[0156] 重组宿主可以是可商购获得的细胞,例如用于表达可能具有稀有密码子的酶的Rosetta细胞。
[0157] 在一些实施方案中,重组细胞包含用于产生细胞色素P450多肽的重组基因,所述细胞色素P450多肽包含CYP533CYP937、CYP1798、CYP1994、CYP2048、CYP2740、CYP3404、CYP3968、CYP4112、CYP4149、CYP4491、CYP5491、CYP6479、CYP7604、CYP8224、CYP8728、CYP10020和CYP10285中的任何一个的氨基酸序列。在一些实施方案中,P450多肽在包含SEQ ID Nos:31-48、316、431、871、873、875、877、879、881、883、885887和891中任一个所示序列的基因中编码。
[0158] 在一些实施方案中,P450酶由至少一种CYP激活剂例如CPR4497辅助。在一些实施方案中,重组宿主细胞进一步包含编码CPR4497的基因,其中该基因包含SEQ ID NO:112所示的核酸序列。在一些实施方案中,重组宿主细胞进一步包含编码CPR4497的基因,其中氨基酸CPR4497的氨基酸序列如SEQ ID NO:113所示。
[0159] 在其中重组宿主细胞是酵母细胞的一些实施方案中,重组细胞具有EXG1基因和/或EXG2基因的缺失以防止葡聚糖酶活性的降低,葡聚糖酶活性的降低可导致罗汉果苷的去糖基化。
[0160] 宿主细胞的类型可以不同。例如,宿主细胞可以选自:伞菌属(Agaricus)、曲霉属(Aspergillus)、芽孢杆菌属(Bacillus)、假丝酵母属(Candida)、棒状杆菌属(corynebacterium)、埃希氏菌属(Escherichia)、镰刀菌属/赤霉菌属(Fusarium/
Gibberella)、克鲁维酵母属(Kluyveromyces)、硫磺菌属(Laetiporus)、香菇属
(Lentinus)、红法夫酵母属(Phaffia)、平革菌属(Phanerochaete)、毕赤酵母属(Pichia)、小立碗藓属(Physcomitrella)、红酵母属(Rhodoturula)、酵母属(Saccharomyces)、裂殖酵母纲(Schizosaccharomycetes)、痂圆孢属(Sphaceloma)、法夫酵母属
(Xanthophyllmoyces)、耶氏酵母属(Yarrowia)、虎皮香菇(Lentinus tigrinus)、硫磺菌(Laetiporus sulphureus)、黄孢原毛平革菌(Phanerochaete chrysosporium)、巴斯德毕赤酵母(Pichia pastoris)、小立碗藓(Physcomitrella patens)、粘红酵母(Rhodoturula glutinis)、胶红酵母(Rhodoturula mucilaginosa)、红法夫酵母(Phaffia rhodozyma)、红法夫酵母(Xanthophyllomyces dendrorhous)、藤仓镰刀菌(Fusarium fujikuroi)/藤仓赤霉(Gibberella fujikuroi)、产朊假丝酵母(Candida utilis)、解脂耶氏酵母(Yarrowia lipolytica)、罗汉果属(Siraitia)、苦瓜属(Momordica)、绞股蓝属(Gynostemma)、南瓜属(Cucurbita)、黄瓜属(Cucumis)、拟南芥属(Arabidopsis)、蒿属(Artemisia)、甜菊属(Stevia)、人参属(Panax)、睡茄属(Withania)、大戟属(Euphorbia)、苜蓿属(Medicago)、吊兰属(Chlorophytum)、五加属(Eleutherococcus)、楤木属(Aralia)、桑属(Morus)、苜蓿属(Medicago)、桦木属(Betula)、黄芪属(Astragalus)、麻疯树属(Jatropha)、山茶属
(Camellia)、韧伞属(Hypholoma)、曲霉属(Aspergillus)、茄属(Solanum)、石杉属
(Huperzia)、孩儿参属(Pseudostellaria)、黄麻属(Corchorus)、常春藤属(Hedera)、地钱属(Marchantia)和桑属(Morus)、毛癣菌属(Trichophyton)、桑黄孔菌属
(Sanghuangporus)、台芝属(Taiwanofungus)、链疫孢属(Moniliophthora)、盘二孢属(Marssonina)、色二孢属(Diplodia)、微香菇属(Lentinula)、法夫酵母属
(Xanthophyllomyces)、普可尼亚属(Pochonia)、炭疽菌属(Colletotrichum)、间座壳属(Diaporthe)、组织胞浆菌属(Histoplasma)、球孢子菌属(Coccidioides)、组织胞浆菌属(Histoplasma)、桑黄孔菌属(Sanghuangporus)、短梗霉属(Aureobasidium)、普可尼亚属(Pochonia)、青霉属(Penicillium)、孢子丝菌属(Sporothrix)、黑僵菌属(Metarhizium)、曲霉属(Aspergillus)、耶氏酵母属(Yarrowia)、油脂酵母属(Lipomyces)、构巢曲霉
(Aspergillus nidulans)、解脂耶氏酵母(Yarrowia lipolytica)、圆红冬孢酵母菌
(Rhodosporin toruloides)、假丝酵母属(Candida)、酵母属(Sacccharaomyces)、酵母亚门(Saccharomycotina)、外囊菌亚门(Taphrinomycotina)、裂殖酵母纲
(Schizosaccharomycetes)、毕赤酵母属(Komagataella)、担子菌门(Basidiomycota)、伞菌亚门(Agaricomycotina)、银耳纲(Tremellomycetes)、柄锈菌亚门(Pucciniomycotina)、短梗霉属(Aureobasidium)、锥毛壳属(Coniochaeta)、红冬孢酵母属(Rhodosporidium)和微球黑粉菌纲(Microboryomycetes)、藤仓赤霉(Gibberella fujikuroi)、乳酸克鲁维酵母(Kluyveromyces lactis)、粟酒裂殖酵母(Schizosaccharomyces pombe)、黑曲霉
(Aspergillus niger)、酿酒酵母(Saccharomyces cerevisiae)、大肠杆菌(Escherichia coli)、类球红细菌(Rhodobacter sphaeroides),和荚膜红细菌(Rhodobacter 
capsulatus)。以酿酒酵母为例,介绍了提高产品收率的方法。制造重组微生物的方法是众所周知的。
[0161] WO2014086842中描述了从曲霉属(Aspergillus spp.)中制备重组宿主细胞的方法,文献全文以引用方式并入本文。基因组的核苷酸序列可以通过公开提供的基因数据库获得,并允许合理设计和修改途径,以提高和提高产品产量。
[0162] 如本文所述的“培养基”,可以是用于细胞在其生产阶段的生长和维持的营养丰富的肉汤。用于维持和繁殖各种菌株的酵母培养物,可能需要用于克隆和蛋白质表达的复杂介质的特定配方,并且本领域技术人员理解。例如,可以从ThermoFisher获得使用市售的培养基。培养基可以是YPD肉汤或可以具有酵母氮碱基。酵母可以在30℃的YPD或合成培养基中生长。
[0163] 溶源性肉汤(LB)通常用于细菌细胞。用于酶和罗汉果苷生长的细菌细胞可以具有抗生素抗性,以防止培养基中其他细胞的生长和污染。这些细胞可以具有对抗生素例如氯霉素、青霉素、卡那霉素和氨苄青霉素具有抗性的抗生素基因盒。
[0164] 如本文所述,“融合蛋白”是通过将两个或更多个核酸序列连接在一起而产生的蛋白质,所述两个或更多个核酸序列最初编码分离蛋白的一部分或全部氨基酸序列。例如,融合蛋白可包含功能蛋白(例如酶(包括但不限于葫芦二烯醇合酶))和一个或多个融合结构域。如本文所述,融合结构域可以是蛋白质(例如,包括但不限于酶、转录因子、毒素和翻译因子的功能性蛋白)的全长或部分/片段。融合蛋白中一个或多个融合结构域的位置可以变化。例如,一个或多个融合结构域可以在融合蛋白的N-和/或C-末端区域(例如,N-和/或C-末端)。一个或多个融合结构域也可以在融合蛋白的中心区域。融合结构域不需要位于融合蛋白的末端。可以选择融合结构域以赋予期望的性质。例如,融合结构域可影响(例如,增加或减少)其融合到的酶的酶活性,或影响(例如,增加或减少)其融合到的蛋白质的稳定性。融合结构域可以是多聚(例如,二聚和四聚)域和/或功能域。在一些实施方案中,融合结构域可以增强或减少与其融合的蛋白质的多聚化。作为非限制性实例,融合蛋白可包含全长蛋白A和融合至全长蛋白A的N末端区域和/或C末端区域的融合结构域。在一些示例中,融合蛋白包含融合到N-末端区域和/或C-末端区域的部分蛋白A序列和融合结构域(例如,蛋白质A的部分序列的N-末端和C-末端)。融合结构域可以是例如蛋白质A的一部分或全部序列,或与蛋白质A不同的蛋白质的一部分或全部序列。在一些实施方案中,一种或多种适合在本文公开的方法、体系和组合物中使用的酶可为融合蛋白。在一些实施方案中,融合蛋白由与表1中所列核酸序列之一具有至少70%、80%、90%、95%或99%序列同一性的核酸序列编码。在一些实施方案中,融合蛋白包含与表1中所列氨基酸序列之一具有至少70%、80%、
90%、95%或99%序列同一性的氨基酸序列。在一些实施方案中,融合蛋白包含与表1中所列氨基酸序列之一具有至少80%、90%、95%或99%序列同一性的氨基酸蛋白质序列,以及在融合蛋白的N-、C-或两个末端区域的融合结构域。在一些实施方案中,融合蛋白包含表1中所列的氨基酸蛋白序列之一,以及位于融合蛋白的N、C或两个末端区域的融合结构域。
[0165] 融合结构域的长度可以变化,例如,3、4、5、6、7、8、9、10、12、15、20、25、30、40、50、60、70、80、90、100、125、150、200、300、400、500、600、700、800、900、1000、1100、1200、1300、
1400、1500个或这些数字中任何两个之间的范围数量的氨基酸。在一些实施方案中,融合结构域的长度约为3、4、5、5、6、7、8、9、10、12、15、20、25、30、40、50个,或这些数字中任何两个之间的范围数量的氨基酸。在一些实施方案中,融合结构域是功能蛋白(例如,酶、转录因子或翻译因子)的主要部分或整个序列。在一些实施方案中,融合蛋白是具有葫芦二烯醇合酶活性的蛋白质。
[0166] 还考虑了在培养基中优化细胞生长和蛋白质表达技术。对于培养基中的生长,诸如酵母之类的细胞可能对低pH值敏感(Narendranath et  al.,Appl Environ Microbiol.2005 May;71(5):2239–2243;文献全文以引用方式并入本文)。在生长过程中,酵母必须保持恒定的细胞内pH。在生长和代谢过程中,酵母细胞内有许多酶在起作用。每种酶都在其最佳pH值下发挥最佳作用,由于酵母本身具有嗜酸性质,因此该酶呈酸性。当细胞外pH偏离最佳水平时,酵母细胞需要投入能量以抽入或抽出氢离子,以维持最佳的细胞内pH。这样,包含用于控制pH的缓冲液的培养基将是最佳的。或者,如果监测的pH值很高,也可以将细胞转移到新的培养基中。
[0167] 细菌和酵母细胞的生长优化也可以通过向培养基中添加营养物质和补充剂来实现。或者,培养物可以在设计用于温度、pH值控制和控制曝气速率的发酵罐中生长。必要时,溶解氧和氮气可流入培养基。
[0168] 本文中使用的术语“可操作地连接”是指调节序列和导致后者表达的异源核酸序列之间的功能连接。
[0169] “罗汉果苷”和“罗汉果苷化合物”在本文可互换使用,并且是指三萜糖苷家族。罗汉果苷的非限制性示例性实例包括例如罗汉果苷V、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇(Mogrol)、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III,这些都是从罗汉果(Siraitia grosvenorii)(Swingle)的果实中鉴定出来的,它们是造成果实甜味的原因。在本文的实施方案中,罗汉果苷中间体可用于体内、离体或体外产生具有以下结构的化合物1:
[0170]
[0171] 在一些实施方案中,用于产生化合物1的重组细胞进一步产生罗汉果苷,并且包含编码用于产生罗汉果苷的酶的基因。WO2014086842中进一步描述了能够产生罗汉果苷的重组细胞,文献全文以引用方式并入本文。在一些实施方案中,重组细胞在培养基中生长以允许酶的表达以及化合物1和罗汉果苷中间体的产生。在一些实施方案中,化合物1通过用剪切力(即高压细胞裂解或超声处理)裂解细胞或通过洗涤剂裂解方法获得。在一些实施方案中,在生长培养基中向细胞补充前体分子例如罗汉果醇以促进化合物1的产生。
[0172] 如本文所用,“启动子”是指指导结构基因转录的核苷酸序列。在一些替代方案中,启动子位于基因的5'非编码区中,最接近结构基因的转录起始位点。启动子内在转录起始中起作用的序列元件通常以共有核苷酸序列为特征。不受限制地,这些启动子元件可包括RNA聚合酶结合位点、TATA序列、CAAT序列、分化特异性元件(DSE;McGehee等人,Mol.Endocrinol.7:551(1993);文献全文以引用方式并入本文)、环状AMP反应元件(CREs)、血清反应元件(SREs;Treismanet等人,Seminars in Cancer Biol.1:47(1990);文献全文以引用方式并入本文),糖皮质激素反应元件(GREs)和结合其他转录因子的位点,例如CRE/ATF(O'Reilly等人,J.Biol.Chem.267:19938(1992);文献全文以引用方式并入本文)、AP2(Ye et等人,J.Biol.Chem.269:25728(1994);文献全文以引用方式并入本文)、SP1、cAMP反应元件结合蛋白(CREB;Loeken等人,Gene Expr.3:253(1993);文献全文以引用方式并入本文)和八聚体因子(一般参见Watson等编辑,Molecular Biology of the Gene,4th ed.(The Benjamin/Cummings Publishing Company,Inc.1987;文献全文以引用方式并入本文)),以及Lemaigre和Rousseau,Biochem.J.303:1(1994);文献全文以引用方式并入本文)。如本文所使用的,启动子可以是组成型活性的、可抑制的或可诱导的。如果一个启动子是一个可诱导的启动子,那么转录速率会随着诱导剂的反应而增加。相反,如果启动子是组成性启动子,则转录速率不受诱导剂的调节。
[0173] 如本文所述,“核糖体跳跃(skip)序列”是指在翻译过程中迫使核糖体“跳跃”核糖体跳跃序列并在核糖体跳跃序列之后翻译该区域而不形成肽键的序列。例如,一些病毒具有核糖体跳跃序列,该序列允许在单个核酸上顺序翻译几种蛋白质,而无需通过肽键连接蛋白质。如本文所述,这是“接头”(“linker”)序列。在本文提供的核酸的一些替代方案中,核酸在本文描述的酶的基因的序列之间包含核糖体跳跃序列,使得蛋白质被共表达并且不通过肽键连接。在一些替代方案中,核糖体跳跃序列是T2A序列。
[0174] 化合物1
[0175] 如本文所公开的,化合物1是具有以下结构(1)的化合物或其盐:
[0176]
[0177] 化合物1是一种高强度甜味剂,其可以用于需要甜味的多种产品中。化合物1与蔗糖或果糖等其他甜味剂相比具有低热量优势。
[0178] 在一些实施方案中,化合物1为分离和纯化的形式。在一些实施方案中,化合物1存在于组合物中,在该组合物中,化合物1被基本上纯化。
[0179] 在一些实施方案中,化合物1或其盐是分离的并且为固体形式。在一些实施方案中,固体形式是无定形的。在一些实施方案中,固体形式是晶体。在一些实施方案中,该化合物为冻干剂形式。在一些实施方案中,化合物1是分离的并且在缓冲液内。
[0180] 本领域技术人员将认识到,本文描述的一些结构可以是化合物的共振形式或互变异构体,即使在动力学上也可以由其他化学结构合理地代表;本领域技术人员认识到,此类结构可能仅代表此类化合物样品的很小一部分。此类化合物被认为在所描述的结构的范围内,尽管本文中未示出此类共振形式或互变异构体。
[0181] 化合物1中可能存在同位素。以化合物结构表示的每个化学元素都可以包括该元素的任何同位素。例如,在化合物结构中,氢原子可以被明确公开或理解为存在于化合物中。在化合物可以存在氢原子的任何位置,氢原子可以是氢的任何同位素,包括但不限于氢-1(氕)和氢-2(氘)。因此,除非上下文另外明确指出,否则本文中提及的化合物涵盖所有潜在的同位素形式。在一些实施方案中,相对于此类同位素的自然普遍性,本文所述的化合物富含一种或多种同位素。在一些实施方案中,本文所述的化合物富含氘。在一些实施方案中,本文描述的化合物中大于0.0312%的氢原子是氘。在一些实施方案中,本文描述的化合物中大于0.05%、0.08%或0.1%的氢原子是氘。
[0182] 在一些实施方案中,化合物1由于存在氨基和/或羧基或与其类似的基团而能够形成酸和/或碱盐。
[0183] 在一些实施方案中,化合物1是基本上分离的。在一些实施方案中,化合物1是基本上纯化的。在一些实施方案中,该化合物为冻干剂形式。在一些实施方案中,该化合物是结晶的。在一些实施方案中,该化合物是无定形的。
[0184] 产品组合物
[0185] 在一些实施方案中,产品组合物不含有不期望的化合物,或者含有小于某一量的不期望的化合物。在一些实施方案中,组合物不含有罗汉果苷I、罗汉果苷II和罗汉果苷III的一种或多种异构体。在一些实施方案中,组合物含有小于5%、3%、2%、1%、0.5%、0.3%、0.1%、800ppm、500ppm、200ppm或100ppm的重量百分比的罗汉果苷I、罗汉果苷II和罗汉果苷III的所有异构体。在一些实施方案中,组合物不含有罗汉果苷IIIE、11-氧代-罗汉果苷IIIE、罗汉果苷IIIA2、罗汉果苷IE、罗汉果苷IIE和11-氧代-罗汉果醇中的一种或多种。在一些实施方案中,组合物含有小于5%、3%、2%、1%、0.5%、0.3%、0.1%、800ppm、
500ppm、200ppm或100ppm的重量百分比的罗汉果苷IIIE、11-氧代-罗汉果苷IIIE、罗汉果苷IIIA2、罗汉果苷IE、罗汉果苷IIE和11-氧代-罗汉果醇中的一种或多种。在一些实施方案中,组合物含有小于5%、3%、2%、1%、0.5%、0.3%、0.1%、800ppm、500ppm、200ppm或
100ppm的重量百分比的罗汉果苷IIIE。在一些实施方案中,组合物含有小于5%、3%、2%、
1%、0.5%、0.3%、0.1%、800ppm、500ppm、200ppm或100ppm的重量百分比的11-氧代-罗汉果苷IIIE。在一些实施方案中,组合物含有小于5%、3%、2%、1%、0.5%、0.3%、0.1%、
800ppm、500ppm、200ppm或100ppm的重量百分比的11-氧代-罗汉果醇。
[0186] 在一些实施方案中,产品组合物为固体形式,其可以是结晶的或无定形的。在一些实施方案中,组合物为颗粒形式。可以使用任何适合的技术产生组合物的固体形式,所述适合的技术包括但不限于重结晶、过滤、溶剂蒸发研磨、碾磨、喷雾干燥、喷雾团聚、流化床团聚、湿法粒化或干法粒化及其组合。在一些实施方案中,提供了可流动的颗粒组合物以便于进一步用于食品制造过程。在一些此类实施方案中,得到50μm至300μm、80μm至200μm、或者80μm至150μm的粒径。
[0187] 一些实施方案提供了溶液形式的产品组合物。例如,在一些实施方案中,通过本文所述的生产方法之一生产的溶液在未经进一步纯化的情况下使用。在一些实施方案中,溶液中期望化合物的浓度以重量计大于300ppm、500ppm、800ppm、0.1%、0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%或20%。在一些实施方案中,罗汉果苷I、罗汉果苷II和罗汉果苷III的所有异构体的浓度小于5%、3%、2%、1%、0.5%、0.3%、0.1%、800ppm、
500ppm、200ppm或100ppm。在一些实施方案中,罗汉果苷IIIE、11-氧代-罗汉果苷IIIE、罗汉果苷IIIA2、罗汉果苷IE、罗汉果苷IIE和11-氧代-罗汉果醇中的一种或多种的浓度小于
5%、3%、2%、1%、0.5%、0.3%、0.1%、800ppm、500ppm、200ppm、100ppm、50ppm、30ppm、
20ppm、10ppm、5ppm、1ppm或0.1ppm。在一些实施方案中,罗汉果苷IIIE的浓度小于5%、3%、
2%、1%、0.5%、0.3%、0.1%、800ppm、500ppm、200ppm、100ppm、50ppm、30ppm、20ppm、
10ppm、5ppm、1ppm或0.1ppm。在一些实施方案中,11-氧代-罗汉果苷IIIE的浓度小于5%、
3%、2%、1%、0.5%、0.3%、0.1%、800ppm、500ppm、200ppm、100ppm、50ppm、30ppm、20ppm、
10ppm、5ppm、1ppm或0.1ppm。在一些实施方案中,11-氧代-罗汉果醇的浓度小于5%、3%、
2%、1%、0.5%、0.3%、0.1%、800ppm、500ppm、200ppm、100ppm、50ppm、30ppm、20ppm、
10ppm、5ppm、1ppm或0.1ppm。
[0188] 生产化合物1和中间体罗汉果苷化合物的方法
[0189] 在一些实施方案中,化合物1是由各种起始和/或中间化合物与一种或多种酶接触而产生的。接触可以是在体内(例如,在重组细胞中)或在体外。用于生产化合物1的起始化合物和中间化合物可包括但不限于罗汉果苷V、罗汉果苷IIE、罗汉果苷IIIE、罗汉果苷I、罗汉果苷VI异构体、罗汉果苷IIA、罗汉果苷IVE或罗汉果苷IVA。
[0190] 在一些实施方案中,如本文所述的化合物1在体内的重组宿主细胞中产生,或通过对这些方法的调整而产生。调整方法的方法包括,尤其包括本领域技术人员已知的温度、溶剂、试剂等。本文所示和描述的方法仅为说明性的,不打算也不应将其解释为以任何方式限制权利要求的范围。本领域技术人员将能够识别对所公开的方法的调整,并基于本文中的公开设计替代路线;所有这些调整和替代路线都在权利要求的范围内。
[0191] 在一些实施方案中,本文公开的化合物1通过从重组细菌细胞,酵母细胞,植物细胞或昆虫细胞中纯化和/或分离而获得。在一些实施方案中,重组细胞来自罗汉果(Siraitia grosvenorii)。在一些这样的实施方案中,使用合适的纯化技术将得自罗汉果(Siraitia grosvenorii)的提取物分级分离。在一些实施方案中,使用HPLC对提取物进行分级分离,并收集适当的级分以获得分离和纯化形式的所需化合物。
[0192] 在一些实施方案中,化合物1是通过对从罗汉果(Siraitia grosvenorii)分离的化合物进行酶改性而产生的。例如,在一些实施方案中,从罗汉果(Siraitia grosvenorii)中分离的化合物1与一种或多种酶接触以获得所需化合物。接触可以是在体内(例如,在重组细胞中)或在体外。制备化合物1的起始和中间化合物包括但不限于罗汉果苷V、罗汉果苷IIE、罗汉果苷IIIE、罗汉果苷I、罗汉果苷VI异构体、罗汉果苷IIA、罗汉果苷IVE或罗汉果苷IVA。这些化合物中的一种或多种可以在体内制备。适合用于产生本文所述化合物的酶可包括但不限于果胶酶、β-半乳糖苷酶(例如Aromase)、纤维素酶(例如Celluclast)、环磷酰胺转移酶(例如Toruzyme)、转化酶、葡萄糖转移酶(例如UGT76G1)、右旋糖酶、乳糖酶、arabanse、木聚糖酶,半纤维素、淀粉酶或其组合。在一些实施方案中,该酶是Toruzyme,其包含SEQ ID NO:89-94中任一个所示的氨基酸序列。
[0193] 一些实施方案提供了制备化合物1的方法,
[0194]
[0195] 该方法包括在HPLC柱上分离罗汉果(Siraitia grosvenorii)的提取物,并收集包含化合物1的洗脱级分。
[0196] 一些实施方案提供了制备化合物1的方法,
[0197]
[0198] 其中该方法包括用葡萄糖转移酶UGT76G1处理罗汉果苷IIIE。在一些实施方案中,UGT76G1由SEQ ID NO:440所示的序列编码。在一些实施方案中,UGT76G1包含SEQ ID NO:439所示的氨基酸序列。
[0199] 各种罗汉果苷化合物可用作生产化合物1的中间体。此类罗汉果苷化合物的非限制性实例是具有以下结构的化合物3:
[0200]
[0201] 在一些实施方案中,制备化合物3的方法包括使罗汉果苷IIIE与表达一种或多种环麦芽糊精葡聚糖转移酶的细胞(例如,重组宿主细胞)接触。在一些实施方案中,所述环麦芽糊精葡聚糖转移酶包含SEQ ID NO:95所示的氨基酸序列。
[0202] 各种罗汉果苷化合物可用作生产化合物1的中间体。此类罗汉果苷化合物的一个非限制性实例是具有以下结构的化合物12:
[0203]
[0204] 在一些实施方案中,用于产生化合物12的方法包括使罗汉果苷VI与表达一种或多种转化酶的细胞(例如重组宿主细胞)接触。
[0205] 各种罗汉果苷化合物可用作生产化合物1的中间体化合物。此类罗汉果苷化合物的一个非限制性实例是具有以下结构的化合物5:
[0206]
[0207] 在一些实施方案中,产生化合物5的方法包括将罗汉果苷IIIE与表达一种或多种环麦芽糊精葡聚糖转移酶的细胞(例如重组宿主细胞)接触。在一些实施方案中,该方法在淀粉存在下进行。
[0208] 各种罗汉果苷化合物可用作生产化合物1的中间体化合物。此类罗汉果苷化合物的一个非限制性实例是具有以下结构的化合物4:
[0209]
[0210] 在一些实施方案中,生产化合物4的方法包括使罗汉果苷IIIE与表达一种或多种环麦芽糊精葡聚糖转移酶的细胞(例如重组宿主细胞)接触。在一些实施方案中,该方法在淀粉存在下进行。
[0211] 高糖基罗汉果苷的水解
[0212] 在一些实施方案中,通过与一种或多种水解酶接触,将一种或多种高糖基化罗汉果苷水解成罗汉果苷。在一些实施方案中,高糖基化罗汉果苷选自罗汉果苷IV、罗汉果苷V、罗汉果苷VI及其组合。在一些实施方案中,高糖基化罗汉果苷选自罗汉果苷V、赛门苷I、罗汉果苷IVE、异罗汉果苷V、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IVE及其组合。
[0213] 令人惊讶地发现,化合物1显示出对某些水解酶水解的耐受性,即使这种酶显示出将高糖基化罗汉果苷水解为罗汉果苷IIIE的能力。化合物1中存在的α-键的糖苷由于其对水解的耐受性而提供了优于其他罗汉果苷(例如,β-连接的糖苷)的独特优势。在一些实施方案中,在化合物1的微生物生产期间,微生物宿主将不需要的β-连接的罗汉果糖苷水解回到罗汉果糖苷IIIE。由于以下原因,这将提高化合物1的纯度:1)降低不需要的罗汉果苷VI、罗汉果苷V和罗汉果苷IV的水平,2)水解将增加可用作生产化合物前体的罗汉果苷IIIE的量。
[0214] 图38说明了通过糖基化酶产生的高糖基化罗汉果苷,然后可以水解回罗汉果苷IIIE。结果是罗汉果苷的混合物具有低于期望的高糖基化罗汉果苷的产率。这种水解酶可以被去除,但是仍然会得到一种罗汉果苷的混合物,并且生产有机体的寿命可能会缩短。然而,由于化合物1具有抗水解性,水解可用于将高糖基化的罗汉果苷转化为罗汉果苷IIIE,后者随后可转化为化合物1(如图39所示)。
[0215] 在一些实施方案中,水解酶是β-葡聚糖水解酶。在一些实施方案中,水解酶是EXG1。EXG1蛋白可包含与SEQ ID NO:1013或1014具有至少70%、80%、90%、95%、98%、99%或更多序列同一性的氨基酸序列。在一些实施方案中,EXG1蛋白包含SEQ ID NO:1013或1014所示的氨基酸序列或由SEQ ID NO:1013或1014所示的氨基酸序列组成。在一些实施方案中,水解酶是EXG2。EXG2蛋白可包含与SEQ ID NO:1023具有至少70%、80%、90%、
95%、98%、99%或更多序列同一性的氨基酸序列。在一些实施方案中,EXG2蛋白包含SEQ ID NO:1023所示的氨基酸序列或由其组成。水解酶可以是例如本文公开的任何一种水解酶。
[0216] 从罗汉果苷IIIE生产化合物1
[0217] 化合物1可由罗汉果苷IIIE通过与一种或多种能够将罗汉果苷IIIE转化为化合物1的酶接触而产生。在一些实施方案中,能够催化化合物1的产生的酶是UDP糖基转移酶、环麦芽糊精葡聚糖转移酶(CGTases)、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。
[0218] 在一些实施方案中,能够催化化合物1产生的酶是CGTase。在一些实施方案中,CGTase包含一种氨基酸序列,该氨基酸序列与SEQ ID NO:1、3、78-101、148和154中任何一个具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。在一些实施方案中,CGTase包含SEQ ID NO:1、3、78-101、148和154的氨基酸序列。在一些实施方案中,能够催化化合物1产生的酶是葡聚糖酶。在一些实施方案中,葡聚糖酶包含一种氨基酸序列,该序列与SEQ ID NO:2、103、106-110、156和896中任一个具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。在一些实施方案中,葡聚糖酶包含或由以下任一序列的氨基酸序列组成:SEQ ID NO:2、103、106-110、156和896。在一些实施方案中,葡聚糖酶由核酸序列编码,该核酸序列与SEQ ID NO:104、105、157、158和895中的任何一个具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。在一些实施方案中,葡聚糖酶由核酸序列编码,该核酸序列包含或或由以下任一序列组成:SEQ ID NO:104、105、
157、158和895中的任何一个。在一些实施方案中,能够催化化合物1的产生的酶是转葡糖苷酶。在一些实施方案中,转葡糖苷酶包含一种氨基酸序列,该序列与SEQ ID NO:163-290和
723中的任一个具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。在一些实施方案中,转葡糖苷酶包含SEQ ID NO:163-292和
723中的任一个的氨基酸序列或由其组成。序列同一性可使用BLAST检索(ncbi.nih.gov)的CLUSTALW软件来进行。这些程序的使用可以确定蛋白质同系物之间的同一性。
[0219] 在一些实施方案中,能够催化化合物1产生的酶是尿苷二磷酸-葡萄糖基转移酶(UGT)。UGT可包含例如一种氨基酸序列,该序列与SEQ ID NOs:4-9、15-19、125、126、128、129、293-307、407、409、411、413、439、441和444中任何一个的序列具有至少70%、80%、
85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。在一些实施方案中,UGT包含或由以下任一序列的氨基酸序列组成:SEQ ID NOs:4-9、10-14、125、
126、128、129、293-304、306、407、409、411、413、439、441和444。在一些实施方案中,UGT由一种核酸序列编码,该核酸序列与UGT1495(SEQ ID NO:10)、UGT1817(SEQ ID NO:11)、
UGT5914(SEQ ID NO:12)、UGT8468(SEQ ID NO:13)、UGT10391(SEQ ID NO:14)和SEQ ID NO:116-124、127、130、408、410、412、414、440、442、443和445具有至少70%、80%、85%、
90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。在一些实施方案中,UGT由核酸序列编码,所述核酸序列包含UGT1495(SEQ ID NO:10)、UGT1817(SEQ ID NO:11)、UGT5914(SEQ ID NO:12)、UGT8468(SEQ ID NO:13)、UGT10391(SEQ ID NO:14)和SEQ ID NO:116-124、127、130、408、410、412、414、440、442、443和445中任一个。在一些实施方案中,酶可以是UGT98或UGT SK98。例如,如本文所述,能够产生化合物1的重组宿主细胞可以包含编码UGT98和/或UGT SK98的第三基因。在一些实施方案中,UGT98或UGT SK98包含与SEQ ID NO:9或16具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性的序列。在一些实施方案中,UGT包含一种氨基酸序列,该序列与UGT73C3(SEQ ID NO:4)、UGT73C6(SEQ ID NO:5)、UGT85C2(SEQ ID NO:6)、UGT73C5(SEQ ID NO:7)、UGT73E1(SEQ ID NO:8)、UGT98(SEQ ID NO:9)、UGT1576(SEQ ID NO:15)、UGT SK98(SEQ ID NO:16)、UGT430(SEQ ID NO:17)、UGT1697(SEQ ID NO:18)和UGT11789(SEQ ID NO:19)具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。在一些实施方案中,UGT包含或由以下任一种的氨基酸序列组成:UGT73C3(SEQ ID NO:4)、UGT73C6(SEQ ID NO:5)、85C2(SEQ ID NO:6)、UGT73C5(SEQ ID NO:7)、UGT73E1(SEQ ID NO:8)、UGT98(SEQ ID NO:9)、UGT1576(SEQ ID NO:15)、UGT SK98(SEQ ID NO:16)、UGT430(SEQ ID NO:17)、UGT1697(SEQ ID NO:18)和UGT11789(SEQ ID NO:19)。在一些实施方案中,UGT由一种核酸序列编码,该序列与UGT1495(SEQ ID NO:
10)、UGT1817(SEQ ID NO:11)、UGT5914(SEQ ID NO:12)、UGT8468(SEQ ID NO:13)或
UGT10391(SEQ ID NO:14)具有至少70%、80%、90%、95%、98%、99%或更多的序列同一性。在一些实施方案中,UGT由核酸序列编码,该核酸序列包含UGT1495(SEQ ID NO:10)、UGT1817(SEQ ID NO:11)、UGT5914(SEQ ID NO:12)、UGT8468(SEQ ID NO:13)和UGT10391(SEQ ID NO:14)中的任何一个序列或由其组成。如本文所公开的,能够催化化合物1产生的酶,可以包含与本文公开的任何一种UGT酶具有至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或更多的序列同一性的氨基酸序列。此外,能够产生化合物1的重组宿主细胞可以包含一种酶,该酶包含或由一种序列组成,该序列与本文公开的任何一种UGT酶具有至少70%、至少80%、至少90%、至少95%、至少98%、至少具有99%或更高的序列同一性。在一些实施方案中,重组宿主细胞包含酶,其包含本文公开的UGT酶中的任一种或由其组成。
[0220] 在一些实施方案中,产生化合物1的方法包括用葡萄糖转移酶UGT76G1处理罗汉果苷IIIE,使用的UGT76G1例如SEQ ID NO:439的UGT76G1和由SEQ ID NO:440的核酸序列编码的UGT76G1。
[0221] 生产罗汉果苷化合物和化合物1的酶
[0222] 如本文所述,UDP糖基转移酶、环麦芽糊精葡聚糖转移酶(CGTases)、糖基转移酶、葡聚糖蔗糖酶、纤维素、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的酶可以包含本文序列表中描述的氨基酸序列,并且也可以由序列表中描述的核酸序列编码。另外,这些酶还可以包括与序列表中描述的氨基酸序列具有至少70%序列同一性的功能同系物。可以使用Blast检索(ncbi.nih.gov)的ClustalW软件执行确定序列同一性百分比的参数。这些程序的使用可以确定蛋白质同系物之间的一致性。
[0223] 在一些实施方案中,转葡糖苷酶包含一种氨基酸序列,该序列与SEQ ID NO:163-290和723中的任何一个具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。在一些实施方案中,CGTase酶包含或由一种氨基酸序列组成,该氨基酸序列与SEQ ID NO:1、3、78-101和154中任何一个具有至少70%、80%、
85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。在一些实施方案中,转葡糖苷酶包含一种氨基酸序列或由一种核酸序列编码,该序列与SEQ ID NO:163-290和723中任何一个具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。
[0224] 本文中的方法还包括将基因结合到重组细胞中以产生中间体,例如丙酮酸、乙酰辅酶A、柠檬酸盐和其他TCA中间体(柠檬酸循环)。中间体可进一步用于生产用于生产化合物1的罗汉果苷化合物。gruchattka等人和Rodriguez等人(PLoS One.2015 Dec 23;10(12;Microb Cell Fact.2016 Mar 3;15:48;文献全文以引用方式并入本文)介绍了提高角鲨烯含量的方法以引用方式并入。
[0225] 进一步考虑了产生氧化角鲨烯和二环氧角鲨烯的酶的表达。利用角鲨烯合酶和/或角鲨烯环氧化酶,可使用酶产生氧化角鲨烯和二环氧角鲨烯来促进角鲨烯合成。例如,Suet等描述了编码SgSQS的基因,SgSQS是一种来自罗汉果(Siraitia grosvenorii)的角鲨烯合酶的一种417个氨基酸的蛋白质((Biotechnol Lett.2017 Mar 28;文献全文以引用方式并入本文)。对重组细胞进行基因工程改造以表达HMG CoA还原酶,也可用于角鲨烯合成(Appl Environ Microbiol.1997 Sep;63(9):3341-4.;Front Plant Sci.2011 Jun 30;2:25;FEBS J.2008Apr;275(8):1852-9.;文献全文以引用方式并入本文)。在一些实施方案中,2,3-氧化角鲨烯或二环氧角鲨烯是由包含一种序列的酶产生,该序列与SEQ ID NO:898或900具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。在一些实施方案中,2,3-氧化角鲨烯或二环氧角鲨烯是由一种核酸序列编码的酶产生,该序列与SEQ ID NO:897或899具有至少70%、80%、85%、90%、95%、
98%、99%、100%或这些数字中任何两个之间范围的序列同一性。
[0226] 还考虑了制备葫芦二烯醇/环氧葫芦二烯醇的酶的表达。还考虑将来自美洲南瓜(C PEPO)、罗汉果(S grosvenorii)、厚皮甜瓜(C melo)、中国南瓜(C moschata)和笋瓜(C maxim)的葫芦二烯醇合酶用于通过表达载体进入重组细胞。还考虑了在重组细胞中表达的用于三萜(titerpene)生物合成的氧化角鲨烯环化酶,这将导致无环底物环化成各种多环三萜,也可以用作产生化合物1的中间体(Org Biomol Chem.2015 Jul 14;13(26):7331-6;文献以引用方式并入本文)。
[0227] 还考虑了表现出环氧水解酶活性以制备羟基-葫芦二烯醇的酶的表达。在本文的一些实施方案中,用于生产化合物1的重组细胞还包括编码显示环氧化物水解酶活性的酶的基因,所述酶被提供以制备羟基环化酶。此类酶由Itkin等人描述,通过引用将其全部内容并入本文。本文提供的序列表表1提供了Itkin等人描述的酶。Ikin等人还描述了用于制备关键的罗汉果苷、UGS族、糖基转移酶和水解酶的酶,可以对其进行遗传修饰以用于诸如糖基化的逆反应。
[0228] 还考虑了在重组细胞中针对羟基化罗汉果苷化合物的酶的表达以产生罗汉果醇。这些酶可以包括CAZY族的蛋白,UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、转葡糖苷酶、果胶酶和葡聚糖酶、酵母和真菌水解酶。此类酶可用于例如将罗汉果苷V水解为罗汉果苷IIIE,其中罗汉果IIIE可被进一步处理以例如在体内产生化合物1。在一些实施方案中,真菌乳糖酶包含一种氨基酸序列,该序列与SEQ ID NO:678-722中任何一个具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个序列之间范围的序列同一性。
[0229] 在一些实施方案中,制备了罗汉果醇前体例如角鲨烯或氧化角鲨烯(oxidosqualine)、罗汉果醇或罗汉果苷。前体可以在化合物1的生产中用作前体。角鲨烯可以用角鲨烯合酶从法呢基焦磷酸(famesyl pyrophosphate)中产生,可以使用角鲨烯环氧化酶从角鲨烯生产氧化角鲨烯。角鲨烯合酶可以是来自葫芦科植物绞股蓝(Gynostemma pentaphyllum)(蛋白质登记编号:C4P9M2)的角鲨烯合酶。角鲨烯合酶还可包括来自以下的角鲨烯合酶:拟南芥(Arabidopsis thaliana)(蛋白质登记编号C4P9M3),甘蓝型油菜(甘蓝型油菜(Brassica napus)),大叶莱檬(Citrus macrophylla),绿玉树(Euphorbia 
tirucalli)(蛋白质登记编号B9WZW7),大豆(Glycine max),光果甘草(Glycyrrhiza 
glabra)(蛋白质登记编号Q42760,Q42760),甘草(Glycrrhiza uralensis)(蛋白质登记编号:D6QX40、D6QX41、D6QX42、D6QX43、D6QX44、D6QX45、D6QX47、D6QX39、D6QX55、D6QX38、D6QX53、D6QX37、D6QX35、B5AID5、B5AID4、B5AID3、C7EDD0、C6KE07、C6KE08、C7EDC9),百脉根(Lotus japonicas)(蛋白质登记编号Q84LE3)、蒺藜苜蓿(Medicago truncatula)(蛋白质登记编号Q8GSL6),豌豆(Pisum sativum),蓖麻(Ricinus communis)(蛋白质登记编号B9RHC3)。WO 2016/050890中描述了各种角鲨烯合酶,其内容以引用方式并入本文。
[0230] 重组宿主细胞
[0231] 本文公开的任何一种酶可以在体外、离体或体内产生。例如,编码该酶的核酸序列(包括但不限于UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶、细胞色素P450、环氧化物水解酶、葫芦二烯醇合酶、角鲨烯环氧酶、角鲨烯合酶、水解酶和氧化角鲨烯环化酶)可以引入宿主重组细胞,例如在体内以包含编码核酸序列的表达载体的形式引入。可以通过例如标准转化技术(例如,热转化)或通过转染将表达载体引入宿主细胞。表达系统可以产生用于生产罗汉果苷和化合物1的酶,以便在体内细胞中产生化合物1。有用的表达系统包括但不限于细菌、酵母和昆虫细胞系统。例如,昆虫细胞系统可以感染用于表达感兴趣酶的重组病毒表达系统。在一些实施方案中,对基因进行密码子优化以在特定细胞中表达。在一些实施方案中,基因与启动子可操作地连接以驱动酶蛋白的转录和翻译。如本文所述,可以获得密码子优化,然后可以将优化的序列设计成用于转化重组宿主细胞的载体。
[0232] 表达载体可进一步包含转录或翻译调节序列,转录或翻译因子的编码序列或各种启动子(例如,GPD1启动子)和/或增强子,以促进酵母细胞中目的基因的转录。
[0233] 在一些实施方案中,如本文所述的重组细胞经基因修饰以在体内产生化合物1。另外,可以在细胞生长期间或细胞生长后向细胞提供罗汉果醇前体或罗汉果苷前体,以提高用于体内产生化合物1的途径(pathway)的特定中间体的产生速率。细胞可以悬浮或固定。该细胞可以在发酵液中或在反应缓冲液中。在一些实施方案中,渗透剂用于将罗汉果醇前体或罗汉果苷前体转移至细胞中。在一些实施方案中,可以纯化形式或作为组合物或提取物的一部分提供罗汉果醇前体或罗汉果苷前体。
[0234] 重组宿主细胞可以是例如植物、双壳类、鱼类、真菌、细菌或哺乳动物的细胞。例如,该植物可选自罗汉果属(Siraitia)、苦瓜属(Momordica)、绞股蓝属(Gynostemma)、南瓜属(Cucurbita)、黄瓜属(Cucumis)、拟南芥属(Arabidopsis)、蒿属(Artemisia)、甜菊属(Stevia)、人参属(Panax)、睡茄属(Withania)、大戟属(Euphorbia)、苜蓿属(Medicago)、吊兰属(Chlorophytum)、五加属(Eleutherococcus)、楤木属(Aralia)、桑属(Morus)、苜蓿属(Medicago)、桦木属(Betula)、黄芪属(Astragalus)、麻疯树属(Jatropha)、山茶属(Camellia)、韧伞属(Hypholoma)、曲霉属(Aspergillus)、茄属(Solanum)、石杉属
(Huperzia)、孩儿参属(Pseudostellaria)、黄麻属(Corchorus)、常春藤属(Hedera)、地钱属(Marchantia)和桑属(Morus)。真菌可选自毛癣菌属(Trichophyton)、桑黄孔菌属
(Sanghuangporus)、台芝属(Taiwanofungus)、链疫孢属(Moniliophthora)、盘二孢属(Marssonina)、色二孢属(Diplodia)、微香菇属(Lentinula)、法夫酵母属
(Xanthophyllomyces)、普可尼亚属(Pochonia)、炭疽菌属(Colletotrichum)、间座壳属(Diaporthe)、组织胞浆菌属(Histoplasma)、球孢子菌属(Coccidioides)、组织胞浆菌属(Histoplasma)、桑黄孔菌属(Sanghuangporus)、短梗霉属(Aureobasidium)、普可尼亚属(Pochonia)、青霉属(Penicillium)、孢子丝菌属(Sporothrix)、黑僵菌属(Metarhizium)、曲霉属(Aspergillus)、耶氏酵母属(Yarrowia)和油脂酵母属(Lipomyces)。在一些实施方案中,真菌为构巢曲霉(Aspergillus nidulans)、解脂耶氏酵母(Yarrowia lipolytica)或圆红冬孢酵母菌(Rhodosporin toruloides)。在一些实施方案中,重组宿主细胞是酵母细胞。在一些实施方案中,酵母选自假丝酵母属(Candida)、酵母属(Sacccharaomyces)、酵母亚门(Saccharomycotina)、外囊菌亚门(Taphrinomycotina)、裂殖酵母纲
(Schizosaccharomycetes)、毕赤酵母属(Komagataella)、担子菌门(Basidiomycota)、伞菌亚门(Agaricomycotina)、银耳纲(Tremellomycetes)、柄锈菌亚门(Pucciniomycotina)、短梗霉属(Aureobasidium)、锥毛壳属(Coniochaeta)、红冬孢酵母属(Rhodosporidium)、耶氏酵母属(Yarrowia)和微球黑粉菌纲(Microboryomycetes)。在一些实施方案中,该细菌选自弗兰克氏菌属(Frankia)、放线菌门(Actinobacteria)、链霉菌属(Streptomyces)和肠球菌属(Enterococcus)。在一些实施方案中,细菌为粪肠球菌(Enterococcus faecalis)。
[0235] 在一些实施方案中,对重组基因进行密码子优化以在细菌、哺乳动物、植物、真菌或昆虫的细胞中表达。在一些实施方案中,一个或多个基因包含对所编码酶的活性增加的功能性突变。在一些实施方案中,培养重组宿主细胞包括监测培养条件的pH、溶解氧水平、氮水平或其组合。
[0236] 从角鲨烯生产罗汉果醇
[0237] 产生化合物1的方法的一些实施方案包括产生用于产生化合物1的中间体。具有以下结构的化合物1在重组宿主体内产生。
[0238]
[0239] 在一些实施方案中,化合物在重组宿主细胞中,被分泌到重组细胞生长的培养基中,或两者都在其中生长的培养基中。在一些实施方案中,重组细胞在体内进一步产生诸如罗汉果苷化合物的中间体。在表达本文公开的基因的条件下,重组细胞可以生长在培养基中。本文描述了生长细胞的方法的一些实施方案。
[0240] 在一些实施方案中,该中间体是或包含角鲨烯、氧化角鲨烯、葫芦二烯醇、罗汉果醇和罗汉果苷中的至少一种。在一些实施方案中,罗汉果苷是罗汉果苷IIE。如本文所述,罗汉果苷是可例如从植物或水果天然分离的罗汉果苷家族。如本文所述,罗汉果苷可以由重组宿主细胞产生。
[0241] 在本文描述的方法的一些替代方案中,重组宿主细胞包含多核苷酸或包含以下一种或多种的序列:
[0242] 编码角鲨烯环氧酶的基因;
[0243] 编码葫芦二烯醇合酶的基因;
[0244] 编码细胞色素P450的基因;
[0245] 编码细胞色素P450还原酶的基因;和
[0246] 编码环氧化物水解酶的基因。
[0247] 在一些实施方案中,角鲨烯环氧酶包含一种序列,该序列与SEQ ID NO:54具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。在一些实施方案中,角鲨烯环氧酶包含一种序列,该序列来自拟南芥(Arabidopsis thaliana)(蛋白质登记编号:Q9SM02、065403、065402、065404、081000或Q9T064)、甘蓝型油菜(甘蓝型油菜(Brassica napus))(蛋白质登记编号:10065727、065726)、绿玉树(Euphorbia tirucalli)(蛋白质登记编号:A7VJN1)、蒺藜苜蓿(Medicago truncatula)(蛋白质登记编号:Q8GSM8,Q8GSM9)、豌豆(Pisum sativum)和蓖麻(Ricinus communis)(蛋白质登记编号:B9R6VO、B9S7W5、B9S6Y2、B9TOY3、B9S7TO和B9SX91)和与它们具有至少70%、例如至少80%、例如至少90%、例如至少95%、例如至少98%序列同一性的上述任一种的功能同系物。在一些实施方案中,鲨烯环氧酶包含或由以下氨基酸序列组成:该氨基酸序列与SEQ ID NO:50-56、60、61、334或335具有至少70%、80%、85%、90%、95%、98%、99%、
100%或这些数字中任何两个之间范围的序列同一性。
[0248] 在一些实施方案中,细胞包含编码ERG7(羊毛甾醇合酶)的基因。在一些实施方案中,羊毛甾醇合酶包含一种序列,该序列与SEQ ID NO:111具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。在一些实施方案中,P450多肽在基因中编码,所述基因包含一种序列,该序列与权利要求31-48中任何一项的序列具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。在一些实施方案中,可以通过核糖体跳跃序列来分离这些序列以制备分离的蛋白质。
[0249] 在一些实施方案中,重组宿主细胞包含编码具有葫芦二烯醇合酶活性的多肽的基因。在一些实施方案中,具有葫芦二烯醇合酶活性的多肽包含如SEQ ID NO:70-73、75-77、319、321、323、325、327-333、420、422、424、426、446、902、904和906中任一个所示的氨基酸序列。在一些实施方案中,具有葫芦二烯醇合酶活性的多肽包含一种序列,该序列与SEQ ID NO:70-73、75-77、319、321、323、325、327-333、420、422、424、426、446、902、904和906中任何一个的序列具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。在一些实施方案中,具有葫芦二烯醇合酶活性的多肽包含C端部分,该C端部分包含SEQ ID NO:73所示的序列。在一些实施方案中,编码具有葫芦二烯醇合酶活性的多肽的基因是密码子优化的。在一些实施方案中,密码子优化的基因包含SEQ ID NO:74所示的核酸序列。
[0250] 在一些实施方案中,具有葫芦二烯醇合酶活性的多肽是包含与葫芦二烯醇合酶融合的融合结构域的融合多肽。融合结构域可以融合至例如葫芦二烯醇合酶的N-末端或C-末端。融合结构域可以位于例如融合多肽的N-末端区域或C-末端区域。融合结构域的长度可以变化。例如,融合结构域可以是或约为3、4、5、6、7、8、9、10、12、15、20、25、30、40、50、100、150、200、300、400、500、600、700、800、900、1000、1500、2000或这些数字中任意两个氨基酸之间的范围长。在一些实施方案中,融合结构域长3至1000个氨基酸。在一些实施方案中,融合结构域长5至50个氨基酸。在一些实施方案中,融合结构域包含功能蛋白的主要部分或全部序列。在一些实施方案中,融合结构域包含酵母蛋白的一部分或全部序列。例如,具有葫芦二烯醇合酶活性的融合多肽可包含与SEQ ID NO:851、854、856、1024、859、862、865、867、
915、920、924、928、932、936、940、944、948、952、956、959、964、967、971、975、979、983、987、
991、995、999、1003、1007和1011中任一个序列具有或具有至少70%、80%、85%、90%、
95%、98%、99%或100%序列同一性的氨基酸序列。在一些实施方案中,融合多肽包含或由以下任一序列中所示的氨基酸序列组成:SEQ ID Nos:851、854、856、1024、859、862、865、
867、915、920、924、928、932、936、940、944、948、952、956、959、959、964、967、971、975、979、
983、987、991、995、999、1003、1007和1011。在一些实施方案中,融合多肽的融合结构域包含一种氨基酸序列,该序列与SEQ ID NO:866、870、917、921、925、929、933、937、941、941、945、
949、953、957,961、968、972、976、980、984、988、992、996、1000、1004、1008和1012具有或具有至少70%、80%、85%、90%、95%、98%、99%或100%的序列同一性。在一些实施方案中,所述融合多肽的融合结构域包含或由以下任一序列中所示的氨基酸序列组成:SEQ ID NO:
866、870、917、921、925、929、933、937、941、945、949、953、957、961、968、972、976、980、984、
988、992、996、1000、1004、1008和1012。在一些实施方案中,与融合结构域融合的葫芦二烯醇合酶包含一种氨基酸序列,所述氨基酸序列与SEQ ID NO:70-73、75-77、319、321、323、
325、327、329-333、420、422、424、426、446、902、904和906中任一个具有或具有至少70%、
80%、85%、90%、95%、98%、99%或100%的同一性。在一些实施方案中,与融合结构域融合的葫芦二烯醇合酶包含或由SEQ ID NO:70-73、75-77、319、321、323、325、327、329-333、
420、422、424、426、446、902、904和906中任一个所示的氨基酸序列组成。在一些实施方案中,与融合结构域融合的葫芦二烯醇合酶是由包含下述核酸序列的基因编码:该核酸序列与SEQ ID NOs:74、320、322、324、326、328、418、421、423、425、427、897、899、901、903和905中的任何一个序列具有或具有至少70%、80%、85%、90%、95%、98%、99%或100%的同一性。在一些实施方案中,与融合结构域融合的葫芦二烯醇合酶由一种基因编码,该基因包含或由SEQ ID NOs:74、320、322、324、326、328、418、421、423、425、427、897、897、901、903和
905中任一序列中所示核酸序列组成。本发明包括一种重组核酸分子,其包含编码具有葫芦二烯醇合酶活性的融合多肽的核酸序列。还公开了一种重组细胞,其包含具有葫芦二烯醇合酶活性的融合多肽或编码该融合多肽的重组核酸分子。
[0251] 本文公开的具有葫芦二烯醇合酶活性的融合多肽可以用于催化葫芦二烯醇合酶的酶反应。例如,葫芦二烯醇合酶的底物可以与这些融合多肽中的一种或多种接触以产生反应产物。反应产物的非限制性实例包括葫芦二烯醇(curcurbitatedienol)、24,25-环氧葫芦二烯醇及其任何组合。葫芦二烯醇合酶的底物的非限制性实例包括2,3-氧化角鲨烯、二氧化角鲨烯、二环氧角鲨烯及其任意组合。在一些实施方案中,可使底物与重组宿主细胞接触,所述重组宿主细胞包含编码具有葫芦二烯醇合酶活性的一种或多种融合多肽的核酸序列。可以将底物提供给重组宿主细胞、在重组宿主细胞中存在、由重组宿主细胞产生、或其任何组合。
[0252] 在一些实施方案中,细胞色素P450是CYP5491。在一些实施方案中,细胞色素P540包含一种氨基酸序列,该氨基酸序列与SEQ ID NO:44和/或SEQ ID NO:74具有或具有至少50%、60%、70%、80%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。在一些实施方案中,P450还原酶多肽包含一种氨基酸序列,该氨基酸序列与SEQ ID NO:46具有或具有至少50%、60%、70%、80%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。在一些实施方案中,P450多肽由包含一种序列的基因编码,该序列与SEQ ID NO:31-48、316、431、871、873、875、877、879、881、883、885、887和891中任何一个具有或具有至少50%、60%、70%、80%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。
[0253] 在一些实施方案中,环氧化物水解酶包含一种序列,该序列与SEQ ID NO:38或40具有或具有至少70%、80%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。在一些实施方案中,环氧化物水解酶包含或由SEQ ID NO:38或40所示的序列组成。
[0254] 为产生罗汉果醇而产生角鲨烯的几种方法
[0255] 角鲨烯是一种天然的30碳有机分子,可以在动植物中产生,是类固醇家族的生化前体。此外,角鲨烯可以作为在宿主重组细胞体内合成罗汉果醇的前体。角鲨烯的末端双键之一的氧化(通过角鲨烯单加氧酶)产生2,3-角鲨烯氧化物,其经历酶催化环化以提供羊毛甾醇,然后将其精制为胆固醇和其它甾体。如Gruchattkaet等人所述(“In Vivo Validation of In Silico Predicted Metabolic Engineering Strategies in Yeast:
Disruption ofα-Ketoglutarate Dehydrogenase and Expression of ATP-Citrate 
Lyase for Terpenoid Production.”PLOS ONE December 23,2015;文献以引用方式并入本文),角鲨烯的合成可以从糖酵解循环的前体开始制备角鲨烯。反过来,角鲨烯可以通过ATP-柠檬酸裂解酶的过度表达来上调,从而增加角鲨烯的产量。本文公开的一些实施方案包括在重组宿主细胞(例如重组酵母细胞中)用于产生角鲨烯和/或促进角鲨烯产生的酶。
在酵母中发现,ATP柠檬酸裂解酶还可以介导可用于角鲨烯和甲羟戊酸酯制备的乙酰辅酶A的合成,其可见于酵母酿酒酵母(S.cerevisiae)(Rodrigues等人“. ATP citrate lyase mediated cytosolic acetyl-CoA biosynthesis increases mevalonate production in Saccharomyces cerevisiae”Microb Cell Fact.2016;15:48.;文献以引用方式并入本文)。一种编码用于介导乙酰辅酶A合成的酶的基因的实例在SEQ ID NO:130中列出。在本文的一些实施方案中,重组细胞包含用于介导乙酰辅酶A合成的序列。
[0256] 本文公开的一些实施方案提供了产生具有以下结构的化合物1的方法:
[0257]
[0258] 在一些实施方案中,所述方法还包括在体内产生化合物1的途径中产生中间体。在一些实施方案中,产生化合物1的重组宿主细胞包含至少一种能够将双氧化角鲨烯转化为24,25环氧葫芦二烯醇,将氧化角鲨烯转化为葫芦二烯醇,催化24,25环氧葫芦二烯醇羟化为11-羟基-24,25环氧葫芦二烯醇的酶,催化将葫芦二烯醇羟化为11-羟基-葫芦二烯醇的酶,将葫芦二烯醇环氧化为24,25环氧葫芦二烯醇的酶,能催化11-羟基-葫芦二烯醇环氧化生成11-羟基-24,25环氧葫芦二烯醇的酶,将11-羟基-葫芦二烯醇转化为11-羟基-24,25环氧葫芦二烯醇的酶,催化11-羟基-24,25环氧葫芦二烯醇转化以产生罗汉果醇的酶和/或催化罗汉果苷前体的糖基化以产生罗汉果苷化合物。在一些实施方案中,用于糖基化的酶由SEQ ID NO:121、122、123和124中任一个所示的序列编码。
[0259] 在一些实施方案中,用于催化24,25环氧葫芦二烯醇形成11-羟基-24,25环氧葫芦二烯醇的羟基化的酶是CYP5491。在一些实施方案中,CYP5491包含SEQ ID NO:49所示的序列。在一些实施方案中,角鲨烯环氧酶包含一种序列,该序列与SEQ ID NO:54的序列具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。
[0260] 在一些实施方案中,能够环氧化11-羟基-葫芦二烯醇的酶包含SEQ ID NO:74所示的氨基酸序列。
[0261] 在一些替代方案中,重组细胞包含表达酶的基因,该酶能够将二氧化角鲨烯转化为24,25环氧葫芦二烯醇,将氧化角鲨烯转化为葫芦二烯醇,将24,25环氧葫芦二烯醇羟基化为11-羟基-24,25环氧葫芦二烯醇,葫芦二烯醇的羟基化以产生11-羟基-葫芦二烯醇,葫芦二烯醇的环氧化以产生24,25环氧葫芦二烯醇,和/或11-羟基葫芦二烯醇的环氧化以产生11-羟基-24,25环氧葫芦二烯醇。在本文的这些实施方案中,中间体和罗汉果苷是在体内产生的。
[0262] 在一些实施方案中,产生化合物1的方法进一步包括产生一种或多种罗汉果苷化合物和中间体,例如氧化角鲨烯、二氧化角鲨烯、葫芦二烯醇、24,25环氧葫芦二烯醇、11-羟基-葫芦二烯醇、11-羟基24,25种环氧葫芦二烯醇、罗汉果醇和罗汉果苷化合物。
[0263] 罗汉果苷化合物的生产方法
[0264] 本文描述了生产罗汉果苷化合物的方法,例如,罗汉果化合物中的一种在WO2014086842中描述(文献以引用方式并入本文)。罗汉果苷化合物可以被细胞用作中间体,以进一步产生本文公开的化合物1。
[0265] 重组宿主,例如微生物、植物细胞或植物,可用于表达对罗汉果醇(三萜核)和各种罗汉果醇糖苷(罗汉果苷)的生物合成有用的多肽。
[0266] 在一些实施方案中,该生产方法可以以任何顺序包括以下一个或多个步骤:
[0267] (1)增强氧化角鲨烯的水平
[0268] (2)增强二氧化角鲨烯的水平
[0269] (3)氧化角鲨烯->葫芦二烯醇
[0270] (4)二氧化角鲨烯->24,25环氧葫芦二烯醇
[0271] (5)葫芦二烯醇->11-羟基葫芦二烯醇
[0272] (6)24,25环氧葫芦二烯醇->11-羟基-24,25环氧葫芦二烯醇
[0273] (7)11-羟基葫芦二烯醇->罗汉果醇
[0274] (8)11-羟基-24,25环氧葫芦二烯醇->罗汉果醇
[0275] (9)罗汉果醇->各种罗汉果苷化合物。
[0276] 在本文的实施方案中,还可以通过重组细胞产生氧化角鲨烯、二氧化角鲨烯、葫芦二烯醇、24,25环氧葫芦二烯醇或罗汉果醇。该方法可以包括在培养基中生长重组微生物,所述培养基中表达本发明方法的一个或多个酶催化步骤,例如合成酶、水解酶、CYP450s和/或UGTs。重组微生物可以分批或连续培养。通常,重组微生物在规定的温度下在发酵罐中生长一段所需的时间,以增加化合物1的产量。
[0277] 在一些实施方案中,可以使用整个细胞来生产罗汉果苷化合物,对所述整个细胞提供含有前体分子的原料以增加化合物1的产率。可以在细胞生长期间或细胞生长后提供原料。整个细胞可以悬浮或固定。整个细胞可以在发酵液中或在反应缓冲液中。
[0278] 在一些实施方案中,重组宿主细胞可以包含异源核酸,所述异源核酸编码一种酶或酶的混合物,该酶或酶的混合物能够催化氧化-角鲨烯至葫芦二烯醇,将葫芦二烯醇转化为11-羟基葫芦二烯醇,将11-羟基-葫芦二烯醇转化为罗汉果醇和/或罗汉果醇到罗汉果苷。在一些实施方案中,细胞可进一步包含异源核酸,所述异源核酸编码一种酶或酶的混合物,该酶或酶的混合物能够催化二氧化角鲨烯催化24,25环氧葫芦二烯醇,24,25环氧葫芦二烯醇至羟基-24,25环氧葫芦二烯醇,11-羟基-24,25环氧葫芦二烯醇到罗汉果醇,和/或罗汉果醇到罗汉果苷。
[0279] 宿主细胞可包含编码葫芦二烯醇合酶的重组基因和/或编码细胞色素P450多肽的重组基因。
[0280] 在一些实施方案中,细胞包含一种蛋白质,该蛋白质与SEQ ID NO:70-73、75-77、319、321、323、325、327-333、420、422、424、426、446、902、904和906(葫芦二烯醇合酶)中任一个具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。
[0281] 在一些实施方案中,将氧化-角鲨烯转化为葫芦二烯醇,是通过SEQ ID NO:70-73、75-77、319、321、323、325、327-333、420、422、424、426、446、902、904和906中任一项的葫芦二烯醇合酶或其功能同系物催化,所述同系物与上述合酶具有至少70%、例如至少80%、例如至少90%、例如至少95%、例如至少98%的序列同一性。在一些实施方案中,葫芦二烯醇合酶多肽包含C末端部分,其包含SEQ ID NO:73所示的序列。在一些实施方案中,编码葫芦二烯醇合酶多肽的基因是密码子优化的。在一些实施方案中,密码子优化的基因包含SEQ ID NO:74所示的核酸序列。
[0282] 在一些实施方案中,将葫芦二烯醇转化为11-羟基葫芦二烯醇,是由SEQ ID NO:49的CYP5491或其功能同系物催化,CYP5491与其功能同系物具有至少70%、例如至少80%、例如至少90%、例如至少95%、例如至少98%的序列同一性。
[0283] 在一些实施方案中,11-羟基-葫芦二烯醇向罗汉果醇的转化包含一种多肽,该多肽选自SEQ ID NO:29的环氧化物水解酶1、SEQ ID NO:30的环氧化物水解酶2和它们的功能同系物,以上水解酶与它们的同系物具有至少70%、例如至少80%、例如至少90%、例如至少95%、例如至少98%的序列同一性。在一些实施方案中,将编码环氧化物水解酶1和环氧化物水解酶2的基因密码子优化用于表达。在一些实施方案中,用于环氧化物水解酶的密码子优化的基因包含SEQ ID NO:114或115所示的核酸序列。
[0284] 在一些实施方案中,环氧化物水解酶包含如SEQ ID NO:21-28(Itkin等,以引用方式并入本文)中列出的氨基酸序列。
[0285] 在一些实施方案中,在宿主重组细胞中,一个或多个UGT催化罗汉果醇转化为罗汉果苷,所述UGT选自:SEQ ID NO:15的UGT1576、SEQ ID NO:9的UGT98、SEQ ID NO:68的UGT SK98,和与它们具有至少70%、例如至少80%、例如至少90%、例如至少95%、例如至少98%序列同一性的功能同系物。
[0286] 在一些实施方案中,宿主重组细胞包含编码细胞色素P450多肽的重组基因,所述细胞色素P450多肽由SEQ ID NO:31-48、316、431、871、873、875、877、879、881、883、885、887和891中的任一序列编码。
[0287] 在一些实施方案中,宿主重组细胞包含编码角鲨烯环氧酶多肽的重组基因,该多肽包含SEQ ID NO:50中的序列。
[0288] 在一些实施方案中,宿主重组细胞包含一种重组基因,该基因编码SEQ ID NO:70-73、75-77、319、321、323、325、327-333、420、422、424、426、446、902、904和906中任一项的葫芦二烯醇合酶多肽。在一些实施方案中,葫芦二烯醇合酶多肽包含C端部分,该C端部分包含SEQ ID NO:73所示的序列。在一些实施方案中,编码葫芦二烯醇合酶多肽的基因是密码子优化的。在一些实施方案中,密码子优化的基因包含SEQ ID NO:74所示的核酸序列。
[0289] 从罗汉果醇产生罗汉果苷化合物
[0290] 在一些实施方案中,产生化合物1的方法包括使罗汉果苷IIIE与能够催化从罗汉果苷IIIE产生化合物1的第一酶接触。在一些实施方案中,该方法在体内进行,其中重组细胞包含编码第一酶的基因,该第一酶能够催化从罗汉果苷IIIE生产化合物1。在一些实施方案中,细胞进一步包含编码能够催化从罗汉果醇产生罗汉果苷IE1的酶的基因。在一些实施方案中,该酶包含SEQ ID NO:4-8中任一项所示的序列。
[0291] 在一些实施方案中,细胞还包含将罗汉果苷IIE转化为罗汉果苷IV、罗汉果苷V、11-氧代罗汉果苷V和赛门苷I的酶。在一些实施方案中,用于将罗汉果苷IIE转化为罗汉果苷IV、罗汉果苷V、11-氧代-罗汉果苷V和赛门苷I的酶由包含SEQ ID NO:9-14和116-120中所示核酸序列的基因编码。在一些实施方案中,产生化合物1的方法包括用葡萄糖转移酶UGT76G1处理罗汉果苷IIIE。
[0292] 在一些实施方案中,该方法包括在HPLC柱上分离来自重组细胞的裂解物,并收集包含化合物1的洗脱级分。
[0293] 在一些实施方案中,该方法包括使罗汉果苷IIIE与能够催化由罗汉果苷IIIE产生化合物1的第一酶接触。在一些实施方案中,使罗汉果苷IIIE与第一酶接触包括,将罗汉果苷IIIE与包含编码第一酶的第一基因的重组宿主细胞接触。在一些实施方案中,第一基因对于重组宿主细胞是异源的。在一些实施方案中,罗汉果苷IIIE与重组宿主细胞中的第一酶接触,重组宿主细胞包含编码第一酶的第一多核苷酸。在一些实施方案中,罗汉果苷IIIE存在于重组宿主细胞中。在一些实施方案中,罗汉果苷IIIE由重组宿主细胞产生。在一些实施方案中,该方法包括在表达第一酶的条件下,在培养基中培养重组宿主细胞。在一些实施方案中,第一酶是UDP糖基转移酶、环麦芽糊精葡聚糖转移酶(CGTases)、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。在一些实施方案中,第一酶是CGTase。在一些实施方案中,CGTase包含一种氨基酸序列,该序列与SEQ ID NO:1、3、78-101、148和154中任一个的序列具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。在一些实施方案中,转葡糖苷酶由SEQ ID NO:163-290和723中的任一个编码。在一些实施方案中,CGT酶包含SEQ ID NO:1、3、78-101、148和154中任何一个所示的序列或由其组成。在一些实施方案中,第一酶是葡聚糖蔗糖酶。在一些实施方案中,葡聚糖蔗糖酶包含一种氨基酸序列,该序列与SEQ ID NO:2、103、106-110、156和896中的任何一个的序列具有至少70%、80%、
85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。在一些实施方案中,DexT包含SEQ ID NO:2、103、106-110、156和896中任何一个的氨基酸序列。在一些实施方案中,DexT包含SEQ ID NO:104或105所示的核酸序列。在一些实施方案中,葡聚糖蔗糖酶包含SEQ ID NO:2或106-110的氨基酸序列。在一些实施方案中,第一酶是转葡糖苷酶。在一些实施方案中,转葡糖苷酶包含一种氨基酸序列,该序列与SEQ ID NO:3163-291和723中任一个的序列具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。在一些实施方案中,转葡糖苷酶包含SEQ ID NO:163-
291和723的氨基酸序列。在一些实施方案中,转葡糖苷酶由SEQ ID NO:163-291和723中任何一个编码。在一些实施方案中,转葡糖苷酶包含SEQ ID NO:163-290和723任一个所示的氨基酸序列。在一些实施方案中,基因编码CGTase,CGTase包含SEQ ID NOs:1、3、78-101和
154中序列的任何一个。
[0294] 在一些实施方案中,所述方法包括使罗汉果苷IIA与重组宿主细胞接触以产生罗汉果苷IIIE,其中所述重组宿主细胞还包含编码第二酶的第二基因,所述第二酶能够催化从罗汉果苷IIA产生罗汉果苷IIIE。在一些实施方案中,罗汉果苷IIA由重组宿主细胞产生。在一些实施方案中,第二种酶是UDP糖基转移酶、CGTase、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。在一些实施方案中,第二酶是尿苷二磷酸-葡萄糖基转移酶(UGT)。在一些实施方案中,转葡糖苷酶包含SEQ ID NO:163-290和723中任一个所示的氨基酸序列。在一些实施方案中,基因编码
CGTase,CGTase包含SEQ ID NO:1、3、78-101、148和154中所示的氨基酸序列。在一些实施方式中,UGT是UGT73C3(SEQ ID NO:4)、UGT73C6(SEQ ID NO:5、444或445),85C2(SEQ ID NO:
6)、UGT73C5(SEQ ID NO:7)、UGT73E1(SEQ ID NO:8)、UGT98(SEQ ID NO:9或407)、UGT1576(SEQ ID NO:15)、UGT SK98(SEQ ID NO:16)、UGT430(SEQ ID NO:17)、UGT1697(SEQ ID NO:
18)或UGT11789(SEQ ID NO:19)或SEQ ID NO:4、5、7-9、15-19、125、126、128、129、293-304、
306、307、407、439、441和444中的任何一个。在一些实施方案中,UGT由UGT1495(SEQ ID NO:
10)、UGT1817(SEQ ID NO:11)、UGT5914(SEQ ID NO:12),UGT8468(SEQ ID NO:13)或
UGT10391(SEQ ID NO:14)中所示的基因编码。
[0295] 在一些实施方案中,所述方法包括使罗汉果醇与重组宿主细胞接触以产生罗汉果苷IIIE,其中重组宿主细胞进一步包含一种或多种基因,该基因编码一种或多种能够催化从罗汉果醇产生罗汉果苷IIIE的酶。在一些实施方案中,罗汉果醇是由重组宿主细胞产生的。在一些实施方案中,一种或多种酶包括UDP糖基转移酶)、CGTase、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。在一些实施方案中,第二酶是尿苷二磷酸-葡萄糖基转移酶(UGT)。在一些实施方案中,UGT是UGT73C3、UGT73C6、85C2、UGT73C5、UGT73E1、UGT98、UGT1495、UGT1817、UGT5914、UGT8468、UGT10391、UGT1576、UGT SK98、UGT430、UGT1697或UGT11789。
[0296] 在一些实施方案中,该方法包括使罗汉果苷化合物与重组宿主细胞接触以产生罗汉果苷IIIE,其中重组宿主细胞还包含一种或多种基因,该基因编码一种或多种能够催化从罗汉果苷化合物中产生罗汉果苷IIIE的酶,其中罗汉果苷化合物是罗汉果苷IA1、罗汉果苷IE1、罗汉果苷IIA1、罗汉果苷IIE,罗汉果苷IIIA1、罗汉果苷IIIA2、罗汉果苷III、罗汉果苷IV、罗汉果苷IVA、罗汉果苷V或赛门苷中的一种或多种。在一些实施方案中,罗汉果苷化合物由重组宿主细胞产生。在一些实施方案中,所述一种或多种酶包括UDP糖基转移酶、CGTase、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。在一些实施方案中,转葡糖苷酶包含SEQ ID NO:163-290和723中任一个所示的氨基酸序列。在一些实施方案中,基因编码CGTase,其包含SEQ ID NO:1、3、78-101、148和154中所示的氨基酸序列。在一些实施方案中,该方法包括使罗汉果苷IA1与重组宿主细胞接触,其中所述重组宿主细胞包含编码UGT98或UGT SK98的基因。在一些实施方案中,UGT98或UGT SK98酶包含一种氨基酸序列,该序列与SEQ ID NO:9、407或16具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,接触导致在细胞中产生罗汉果苷IIA。在一些实施方案中,一种或多种酶包含由SEQ ID NO:1、3、78-101、106-109、147、154、163-303、405、411、354-405、
447-723、770、776和782中任一个所示的氨基酸。
[0297] 在一些实施方案中,该方法进一步包括使11-羟基-24,25环氧葫芦二烯醇与重组宿主细胞接触,其中所述重组宿主细胞还包含编码环氧化物水解酶的第三基因。在一些实施方案中,11-羟基-24,25环氧葫芦二烯醇是由重组宿主细胞产生。在一些实施方案中,该方法进一步包括使11-羟基-葫芦二烯醇与重组宿主细胞接触,其中所述重组宿主细胞包含编码细胞色素P450或环氧化物水解酶的第四基因。在一些实施方案中,P450多肽在包含SEQ ID NO:31-48、316、431、871、873、875、877、879、881、883、885、887和891中任一序列的基因中编码,在一些实施方案中,所述11-羟基-葫芦二烯醇是由重组宿主细胞产生。
[0298] 在一些实施方案中,该方法进一步包括使3,24,25三羟基葫芦二烯醇与重组宿主细胞接触,其中该重组宿主细胞还包含编码细胞色素P450的第五基因。在一些实施方案中,P450多肽由包含SEQ ID NO:31-48、316和318中任一个所示序列的基因中编码。在一些实施方案中,由重组宿主细胞产生3,24,25三羟基葫芦二烯醇。在一些实施方案中,接触导致在重组宿主细胞中产生罗汉果醇。在一些实施方案中,细胞色素P450包含一种氨基酸序列,该序列与SEQ ID NO:20、308或315的序列具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。在一些实施方案中,P450多肽在基因中编码,该基因包含SEQ ID NO:31-48、316、431、871、873、875、877、879、881、883、885、887和891中任何一个所示的序列。在一些实施方案中,环氧化物水解酶包括与SEQ ID NO:21-
30和309-314中的任何一个具有至少70%序列同一性的氨基酸序列。
[0299] 在一些实施方案中,该方法进一步包括使葫芦二烯醇与重组宿主细胞接触,其中该重组宿主细胞包含编码细胞色素P450的基因。在一些实施方案中,接触导致产生11-葫芦二烯醇。在一些实施方案中,11-羟基葫芦二烯醇在包含编码CYP87D18或SgCPR蛋白的基因的细胞中表达。在一些实施方案中,CYP87D18或SgCPR包含SEQ ID NO:315、872或874中列出的序列。在一些实施方案中,CYP87D18或SgCPR由SEQ ID NO:316、871或873编码。在一些实施方案中,葫芦二烯醇由重组宿主细胞产生。在一些实施方案中,编码细胞色素P450的基因包含一种核酸序列,该序列与SEQ ID NO:31-48、316、431、871、873、875、877、879、881、883、885、887和891中任何一个的序列具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,细胞色素P450包含一种氨基酸序列,该序列与SEQ ID NO:31-48、316、431、871、873、875、877、879、881、883、
885、887和891具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,P450多肽编码在基因中编码,该基因包含SEQ ID NOs:31-48、316、431、871、873、875、877、879、881、883、885、887和891中任何一个所示的序列。
[0300] 在一些实施方案中,该方法进一步包括将2,3-氧化角鲨烯与重组宿主细胞接触,其中该重组宿主细胞包含编码葫芦二烯醇合酶的第七基因。在一些实施方案中,葫芦二烯醇合酶包含SEQ ID NO:70-73、75-77、319、321、323、325、327-333、420、422、424、426、446、902、904或906中所示的一种氨基酸序列。在一些实施方案中,葫芦二烯醇合酶由SEQ ID NO:74、320、322、324、326、328、418、421、423、425、427、897、899、901、903和905中所示的任何一个序列编码。在一些实施方案中,接触产生葫芦二烯醇。在一些实施方案中,由重组宿主细胞产生2,3-氧化角鲨烯。在一些实施方案中,2,3-氧化鲨烯或二环氧角鲨烯由包含SEQ ID NO:898或900中所示的序列的酶产生。在一些实施方案中,通过由SEQ ID NO:897或899所示的核酸序列编码的酶产生2,3-氧化角鲨烯或二环氧角鲨烯。
[0301] 在一些实施方案中,葫芦二烯醇合酶由包含SEQ ID NO:74所示序列的基因编码。在一些实施方案中,葫芦二烯醇合酶由包含以下任一核酸序列的基因编码:SEQ ID NO:74、
320、322、324、326、328、418、421、423、425、427、897、899、901、903和905。在一些实施方案中,细胞产生11-羟基葫芦二烯醇。在一些实施方案中,11-羟基葫芦二烯醇在包含编码CYP87D18或SgCPR蛋白的基因的细胞中表达。在一些实施方案中,CYP87D18或SgCPR包含SEQ ID NO:315、872或874中的序列。在一些实施方案中,CYP87D18或SgCPR由SEQ ID NO:316、
871或873编码。在一些实施方案中,葫芦二烯醇合酶多肽包含C末端部分,其包含SEQ ID NO:73所示的序列。在一些实施方案中,编码葫芦二烯醇合酶多肽的基因是密码子优化的。
在一些实施方案中,密码子优化的基因包含SEQ ID NO:74所示的核酸序列。在一些实施方案中,葫芦二烯醇合酶包含与SEQ ID NO:70-73、75-77、319、321、323、325、327-333、420、
422、424、426、446、902、904和906(例如包括来自美洲南瓜(C pepo)、罗汉果(S 
grosvenorii)、黄瓜(C sativus)、厚皮甜瓜(C melo)、中国南瓜(C moschata)和笋瓜(C maxim)的葫芦二烯醇合酶)中的任一个具有至少70%序列同一性的氨基酸序列。在一些实施方案中,葫芦二烯醇合酶多肽包含C末端部分,该C末端部分包含SEQ ID NO:73所示的序列。在一些实施方案中,编码葫芦二烯醇合酶多肽的基因是密码子优化的。在一些实施方案中,密码子优化的基因包含SEQ ID NO:74中列出的核酸序列。在一些实施方案中,葫芦二烯醇合酶包含一种氨基酸,该氨基酸包含来自百脉根(Lotus japonicas)(BAE53431)、毛果杨(Populus trichocarpa)(XP_002310905)、黑升麻(Actaea racemosa)(ADCWO84219)、白桦(Betula platyphylla)(BAB83085)、光果甘草(Glycyrrhiza glabra)(BAA76902)、葡萄(Vitis vinifera)(XP_002264289)、积草(Centella asiatica)(AAS01524)、人参(Panax ginseng)(BAA33460)和白桦(Betula platyphylla)(BAB83086)的多肽,如WO 2016/050890中描述,在此其全部内容以引用方式并入。
[0302] 在一些实施方案中,该方法包括使角鲨烯与重组宿主细胞接触,其中该重组宿主细胞包含编码角鲨烯环氧酶的第八基因。在一些实施方案中,接触产生2,3-氧化角鲨烯。在一些实施方案中,角鲨烯由重组宿主细胞产生。在一些实施方案中,角鲨烯环氧酶包含一种氨基酸序列,该序列与SEQ ID NO:50-56、60、61、334或335具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。
[0303] 在一些实施方案中,该方法包括使法呢基焦磷酸与重组宿主细胞接触,其中该重组宿主细胞包含编码鲨烯合酶的第九基因。在一些实施方案中,接触导致角鲨烯的产生。在一些实施方案中,法呢基焦磷酸由重组宿主细胞产生。在一些实施方案中,角鲨烯合酶包含一种氨基酸序列,该序列与SEQ ID NO:69或336具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。
[0304] 在一些实施方案中,该方法进一步包括使香叶基-PP与重组宿主细胞接触,其中所述重组宿主细胞包含编码法呢基-PP合酶的第十基因。在一些实施方案中,接触导致法呢基-PP的产生。在一些实施方案中,香叶基-PP由重组宿主细胞产生。在一些实施方案中,法呢基-PP合酶包含与SEQ ID NO:338具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围序列同一性的氨基酸序列。在一些实施方案中,第一、第二、第三、第四、第五、第六、第七、第八、第九和第十基因中的一个或多个与异源启动子可操作地连接。在一些实施方案中,异源启动子是CMV、EF1a、SV40、PGK1、人β-肌动蛋白、CAG、GAL1、GAL10、TEF1、GDS、ADH1、CaMV35S、Ubi、T7、T7lac、Sp6、araBAD、trp、Lac、Ptac、pL启动子或其组合。在一些实施方案中,启动子是诱导型、阻遏型或组成型启动子。在一些实施方案中,在重组宿主细胞中丙酮酸,乙酰基辅酶A,柠檬酸和TCA循环中间体中的一种或多种的产生被上调。在一些实施方案中,在重组宿主细胞中细胞质定位已被上调。在一些实施方案中,第一、第二、第三、第四、第五、第六、第七、第八、第九和第十基因中的一个或多个包含编码2A自裂肽的至少一个序列。如本文所使用的,术语第一、第二、第三、第四、第五、第六、第七、第八、第九、第十等和类似的术语,不推断特定顺序和/或存在较早编号的要求。例如,本文所述的重组宿主细胞可包含第一基因和第三基因,但不包含第二基因。作为另一个例子,重组宿主细胞可包含第一基因、第五基因和第十基因,但不包含第二基因、第三基因、第四基因、第六基因、第七基因、第八基因和第九个基因。重组宿主细胞可以是例如植物、双壳类、鱼类、真菌、细菌或哺乳动物的细胞。例如,植物选自罗汉果属(Siraitia)、苦瓜属(Momordica)、绞股蓝属(Gynostemma)、南瓜属(Cucurbita)、黄瓜属(Cucumis)、拟南芥属(Arabidopsis)、蒿属(Artemisia)、甜菊属(Stevia)、人参属(Panax)、睡茄属(Withania)、大戟属(Euphorbia)、苜蓿属(Medicago)、吊兰属(Chlorophytum)、五加属
(Eleutherococcus)、楤木属(Aralia)、桑属(Morus)、苜蓿属(Medicago)、桦木属(Betula)、黄芪属(Astragalus)、麻疯树属(Jatropha)、山茶属(Camellia)、韧伞属(Hypholoma)、曲霉属(Aspergillus)、茄属(Solanum)、石杉属(Huperzia)、孩儿参属(Pseudostellaria)、黄麻属(Corchorus)、常春藤属(Hedera)、地钱属(Marchantia)和桑属(Morus)。在一些实施方案中,真菌选自毛癣菌属(Trichophyton)、桑黄孔菌属(Sanghuangporus)、台芝属
(Taiwanofungus)、链疫孢属(Moniliophthora)、盘二孢属(Marssonina)、色二孢属
(Diplodia)、微香菇属(Lentinula)、法夫酵母属(Xanthophyllomyces)、普可尼亚属
(Pochonia)、炭疽菌属(Colletotrichum)、间座壳属(Diaporthe)、组织胞浆菌属
(Histoplasma)、球孢子菌属(Coccidioides)、组织胞浆菌属(Histoplasma)、桑黄孔菌属(Sanghuangporus)、短梗霉属(Aureobasidium)、普可尼亚属(Pochonia)、青霉属
(Penicillium)、孢子丝菌属(Sporothrix)、黑僵菌属(Metarhizium)、曲霉属
(Aspergillus)、耶氏酵母属(Yarrowia)和油脂酵母属(Lipomyces)。在一些实施方案中,所述真菌是构巢曲霉(Aspergillus nidulans)、解脂耶氏酵母(Yarrowia lipolytica)或圆红冬孢酵母菌(Rhodosporin toruloides)。在一些实施方案中,重组宿主细胞是酵母细胞。
在一些实施方案中,所述酵母选自假丝酵母属(Candida)、酵母属(Sacccharaomyces)、酵母亚门(Saccharomycotina)、外囊菌亚门(Taphrinomycotina)、裂殖酵母纲
(Schizosaccharomycetes)、毕赤酵母属(Komagataella)、担子菌门(Basidiomycota)、伞菌亚门(Agaricomycotina)、银耳纲(Tremellomycetes)、柄锈菌亚门(Pucciniomycotina)、短梗霉属(Aureobasidium)、锥毛壳属(Coniochaeta)、红冬孢酵母属(Rhodosporidium)和微球黑粉菌纲(Microboryomycetes)。在一些实施方案中,细菌选自弗兰克氏菌属(Frankia)、放线菌门(Actinobacteria)、链霉菌属(Streptomyces)和肠球菌属(Enterococcus)。在一些实施方案中,细菌是粪肠球菌(Enterococcus faecalis)。在一些实施方案中,已经对第一、第二、第三、第四、第五、第六、第七、第八、第九和第十基因中的一个或多个进行密码子优化,以在细菌、哺乳动物、植物、真菌或昆虫的细胞中表达。在一些实施方案中,第一、第二、第三、第四、第五、第六、第七、第八、第九和第十基因中的一个或多个包含对所编码酶的活性增加的功能性突变。在一些实施方案中,培养重组宿主细胞包括监测培养条件的pH、溶解氧水平、氮水平或其组合。在一些实施方案中,该方法包括分离化合物1。在一些实施方案中,分离化合物1包括裂解重组宿主细胞。在一些实施方案中,分离化合物1包括从培养基分离化合物1。在一些实施方案中,该方法包括纯化化合物1。在一些实施方案中,纯化化合物1包括HPLC、固相萃取或其组合。在一些实施方案中,纯化包括收获重组细胞,保存上清液并裂解细胞。在一些实施方案中,裂解包括使细胞经受剪切力或洗涤剂洗涤,从而获得裂解物。在一些实施方案中,剪切力来自超声法、高压细胞裂解(french pressurized cells)或珠子。在一些实施方案中,包括将裂解物进行过滤和纯化步骤。在一些实施方案中,通过固相萃取来过滤和纯化裂解物。
[0305] 在一些实施方案中,提供了具有以下结构(1)的化合物1:
[0306]
[0307] 其中该化合物通过本文提供的任一种替代方法产生。
[0308] 在一些实施方案中,细胞裂解物包含具有以下结构(1)的化合物1:
[0309]
[0310] 在一些实施方案中,重组细胞包含具有以下结构(1)的化合物1:
[0311]
[0312] 以及一种编码酶的基因,该酶能够催化从罗汉果苷IIIE产生化合物1。在一些实施方案中,该基因是重组细胞的异源基因。
[0313] 在一些实施方案中,重组细胞包含编码第一酶的第一基因,该第一酶能够催化从罗汉果苷IIIE产生具有以下结构(1)的化合物1:
[0314]
[0315] 在一些实施方案中,第一酶包含一种氨基酸序列,该序列与SEQ ID NO:1、3、78-101、148或154(CGTase)的序列具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。在一些实施方案中,第一酶包含SEQ ID NO:
1、3、78-101、148或154(CGTase)的氨基酸序列。在一些实施方案中,第一酶是葡聚糖蔗糖酶。在一些实施方案中,葡聚糖蔗糖酶包含或由一种氨基酸序列组成,所述氨基酸序列与SEQ ID NO:2、103、106-110、156和896中的任何一个具有至少70%、80%、85%、90%、95%、
98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,葡聚糖蔗糖酶包含或由SEQ ID NO:2、103、104或105的氨基酸序列组成。在一些实施方案中,葡聚糖蔗糖酶包含或由SEQ ID NO:2、103-110和156-162和896中任一个的氨基酸序列组成。在一些实施方案中,DexT包含SEQ ID NO:104或105所示的核酸序列。在一些实施方案中,第一酶是转葡糖苷酶。在一些实施方案中,转葡糖苷酶包含一种氨基酸序列,该氨基酸序列与SEQ ID NO:201或SEQ ID NO:291的序列具有至少70%、80%、85%、90%、95%、
98%、99%、100%或这些数字中任何两个序列之间范围的序列同一性。在一些实施方案中,重组细胞还包含编码尿苷二磷酸-葡萄糖基转移酶(UGT)的第二基因。在一些实施方案中,UGT包含一种氨基酸序列,该序列与SEQ ID NO:4、5、6、7、8、9、15、16、17、18和19中的任何一个具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个序列之间范围的序列同一性。在一些实施方案中,UGT包含或由SEQ ID NO:4、5、6、7、8、9、15、16、17和18任何一个组成。在一些实施方案中,UGT由UGT1495(SEQ ID NO:10),UGT1817(SEQ ID NO:11),UGT5914(SEQ ID NO:12),UGT8468(SEQ ID NO:13)或UGT10391(SEQ ID NO:14)中所示的序列编码。在一些实施方案中,细胞包含编码UGT98或UGT SK98的第三基因。在一些实施方案中,UGT98或UGT SK98包含一种氨基酸序列,该序列与SEQ ID NO:9、407或16的序列具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。在一些实施方案中,细胞包含编码环氧化物水解酶的第四基因。在一些实施方案中,环氧化物水解酶包含一种氨基酸序列,该序列与SEQ ID NO:21-30和309-314中任一项的序列具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。在一些实施方案中,细胞包含编码P450的第五序列。在一些实施方案中,P450包含一种氨基酸序列,该序列与SEQ ID NO:20、49、308、315或317序列具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。在一些实施方案中,P450由包含SEQ ID NO:31-48、316、431、871、873、875、877、
879、881、883、885、887和891中任一个序列的基因编码。在一些实施方案中,还包含编码葫芦二烯醇合酶的第六序列。在一些实施方案中,葫芦二烯醇合酶包含一种氨基酸序列,该序列与SEQ ID NO:70-73、75-77、319、321、323、325、327-333、420、422、424、426、446、902、904和906中的任何一个的序列具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。在一些实施方案中,葫芦二烯醇合酶多肽包含一个C端部分,该C端部分包含SEQ ID NO:73所示的序列。在一些实施方案中,编码葫芦二烯醇合酶多肽的基因是密码子优化的。在一些实施方案中,密码子优化的基因包含SEQ ID NO:
74所示的核酸序列。在一些实施方案中,细胞还包含编码角鲨烯环氧酶的第七基因。在一些实施方案中,角鲨烯环氧酶包含一种氨基酸序列,该序列与SEQ ID NO:50-56、60、61、334和
335中的任一个的序列具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。在一些实施方案中,细胞进一步包含编码角鲨烯合酶的第八基因。在一些实施方案中,第八基因包含一种氨基酸序列,该序列与SEQ ID NO:69或SEQ ID NO:336的序列具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。在一些实施方案中,细胞进一步包含编码法呢基-PP合酶的第九基因。在一些实施方案中,法呢基-PP合酶包含与SEQ ID NO:338序列具有至少
70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围序列同一性的氨基酸序列。在一些实施方案中,细胞是哺乳动物、细菌、真菌或昆虫的细胞。在一些实施方案中,所述细胞是酵母细胞。酵母的非限制性实例包括假丝酵母属(Candida)、酵母属(Sacccharaomyces)、酵母亚门(Saccharomycotina)、外囊菌亚门(Taphrinomycotina)、裂殖酵母纲(Schizosaccharomycetes)、毕赤酵母属(Komagataella)、担子菌门
(Basidiomycota)、伞菌亚门(Agaricomycotina)、银耳纲(Tremellomycetes)、柄锈菌亚门(Pucciniomycotina)、短梗霉属(Aureobasidium)、锥毛壳属(Coniochaeta)和微球黑粉菌纲(Microboryomycetes)。在一些实施方案中,所述植物选自由罗汉果属(Siraitia)、苦瓜属(Momordica)、绞股蓝属(Gynostemma)、南瓜属(Cucurbita)、黄瓜属(Cucumis)、拟南芥属(Arabidopsis)、蒿属(Artemisia)、甜菊属(Stevia)、人参属(Panax)、睡茄属(Withania)、大戟属(Euphorbia)、苜蓿属(Medicago)、吊兰属(Chlorophytum)、五加属
(Eleutherococcus)、楤木属(Aralia)、桑属(Morus)、苜蓿属(Medicago)、桦木属(Betula)、黄芪属(Astragalus)、麻疯树属(Jatropha)、山茶属(Camellia)、韧伞属(Hypholoma)、曲霉属(Aspergillus)、茄属(Solanum)、石杉属(Huperzia)、孩儿参属(Pseudostellaria)、黄麻属(Corchorus)、常春藤属(Hedera)、地钱属(Marchantia)和桑属(Morus)。在一些实施方案中,真菌为毛癣菌属(Trichophyton)、桑黄孔菌属(Sanghuangporus)、台芝属
(Taiwanofungus)、链疫孢属(Moniliophthora)、盘二孢属(Marssonina)、色二孢属
(Diplodia)、微香菇属(Lentinula)、法夫酵母属(Xanthophyllomyces)、普可尼亚属
(Pochonia)、炭疽菌属(Colletotrichum)、间座壳属(Diaporthe)、组织胞浆菌属
(Histoplasma)、球孢子菌属(Coccidioides)、组织胞浆菌属(Histoplasma)、桑黄孔菌属(Sanghuangporus)、短梗霉属(Aureobasidium)、普可尼亚属(Pochonia)、青霉属
(Penicillium)、孢子丝菌属(Sporothrix)或黑僵菌属(Metarhizium)。
[0316] 在一些实施方案中,细胞包含SEQ ID NO:897、899、909、911、913、418、421、423、425、427、871、873、901中任一个所示酶的序列。在一些实施方案中,该酶包含SEQ ID NO:
420、422、424、426、446、872、874-896、898、900、902、904、906、908、910、912和951-1012中的序列或由该序列编码的序列。
[0317] 在一些实施方案中,可以通过基因合成获得DNA。例如,可以通过Genescript或IDT执行此操作。可以通过标准分子生物学技术将DNA克隆到过表达载体中,例如:pQE1,pGEX-4t3,pDest-17,pET系列,pFASTBAC。大肠杆菌宿主菌株可用于产生酶(即Top10或BL21系列+/-密码子plus),使用1mM IPTG在OD600为1时诱导。大肠杆菌菌株可在37℃,250rpm繁殖并在诱导过程中切换到室温或30℃(150转/分)。当指示时,也可以使用pFASTBAC和优化的MOI通过SF9昆虫细胞系表达某些酶。含酶的粗提物可通过超声处理产生,并用于本文所述的反应。所有的UDP-糖基转移酶反应都含有蔗糖合酶,可以通过基因合成从拟南芥
(A.thaliana)中获得并在大肠杆菌中表达。
[0318] 高糖基化罗汉果苷水解以产生化合物1
[0319] 在一些实施方案中,高糖基化罗汉果苷可以被水解以产生化合物1。高糖基化罗汉果苷的非限制性实例包括罗汉果苷V、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果VI、11-氧代罗汉果IIIE、11-氧代罗汉果IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III。
能够催化水解过程以产生化合物1的酶可以是,例如,CGT酶(例如,显示出没有淀粉的水解)、纤维素酶、β-葡糖苷酶、转葡糖苷酶、淀粉酶、果胶酶、葡聚糖酶和真菌乳糖酶。表1列出了其中一些酶的氨基酸序列和编码其中一些酶的核酸序列。
[0320] 在一些实施方案中,化合物1显示出对重组细胞中水解酶的耐受性,其中所述水解酶显示出将罗汉果苷VI、罗汉果苷V、罗汉果苷IV水解为罗汉果苷IIIE的能力。由于其对水解的耐受性,化合物1中存在的α-连接的糖苷相对于其他罗汉果苷(β-连接的糖苷)具有独特的优势。在化合物1的微生物生产过程中,重组宿主细胞(例如,微生物宿主细胞)可以将不需要的β-连接的罗汉果糖苷水解回罗汉果糖苷IIIE。不受任何特定理论的束缚,我们认为,宿主细胞的水解可由于以下原因而提高化合物1的纯度:1)降低不需要的罗汉果苷VI、罗汉果苷V和罗汉果苷IV的水平,和/或2)水解将会增加可用于生产化合物1的前体的罗汉果苷IIIE的量。
[0321] 罗汉果苷化合物的纯化
[0322] 一些实施方案包括分离罗汉果苷化合物,例如化合物1。在一些实施方案中,分离化合物1包括裂解重组宿主细胞。在一些实施方案中,分离化合物1包括从培养基分离化合物1。在一些实施方案中,该方法进一步包括纯化化合物1。在一些实施方案中,纯化化合物1包括HPLC、固相萃取或其组合。在一些实施方案中,纯化包括收获重组细胞,保存上清液并裂解细胞。在一些实施方案中,裂解包括使细胞经受剪切力或洗涤剂洗涤,从而获得裂解物。在一些实施方案中,剪切力来自超声法、高压细胞裂解或珠子。在一些实施方案中,将裂解物进行过滤和纯化步骤。在一些实施方案中,通过固相萃取过滤和纯化裂解物。然后可以将裂解物过滤并用硫酸铵处理以除去蛋白质,并C18 HPLC(5X10cm Atlantis prep T3 OBD色谱柱,5um,Waters)过滤,在30分钟内使用10→30%B的A/B梯度(A=水B=乙腈)进行注射,并用95%B洗涤,然后重新平衡在1%(总运行时间=42分钟)。可以以30mL/馏分的速度将其收集在去皮重的试管中(12馏分/板,每次3板)。裂解物也可以离心去除固体和颗粒物。然后将板在Geneva HT12/HT24中干燥。预期所需化合物与其他异构体一起在馏分21中洗脱。合并的馏分可以在在氟苯基HPLC柱(3x10cm,Xselect氟苯基OBD柱,5um,Waters)上,在
35分钟内使用15→30%B的A/B梯度(A=水,B=乙腈)用95%B洗涤,然后重新平衡在15%(总运行时间=45分钟),在47次运行中进一步分馏。每次运行以30mL/馏分收集在12个去皮重的试管中(12馏分/板,每次1个板)。可以根据UPLC分析合并含有所需峰和所需纯度的馏分,并在减压下干燥,得到白色粉末状固体。可以将纯化合物重新悬浮/溶解在10mL水中,然后冻干以获得至少95%的纯度。
[0323] 为了纯化化合物1,在一些实施方案中,可以通过固相萃取来纯化化合物,可以不需要HPLC。可以将化合物1纯化至例如约70%、80%、90%、95%、98%、99%或100%的纯度或在任何上述两个值所描述的范围内的任何纯度。在一些实施方案中,通过固相萃取纯化的化合物1与HPLC纯化的纯度相同或基本相同。在一些实施方案中,该方法包括在HPLC柱上分离来自重组细胞的裂解物,并收集包含化合物1的洗脱级分。
[0324] 发酵
[0325] 宿主细胞可以如本文所述进行发酵以生产化合物1。这还可以包括例如在有空气或没有空气的情况下进行,并且可以在例如厌氧环境中进行的方法。整个细胞(例如重组宿主细胞)可以在发酵液中或在反应缓冲液中。
[0326] 僧果(Monk fruit(Siraitia grosvenorii))提取物也可以用于接触细胞以制备化合物1。在一些实施方案中,提供了产生化合物1的方法。该方法可以包括使僧果提取物与能够催化从罗汉果苷产生化合物1的第一酶接触。罗汉果苷例如罗汉果苷V、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-罗汉果苷IIIE、11-罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III。在一些实施方案中,接触包括使罗汉果醇提取物与包含编码第一酶的第一基因的重组宿主细胞接触。在一些实施方案中,第一基因对于重组宿主细胞是异源的。在一些实施方案中,罗汉果醇提取物在包含编码第一酶的第一多核苷酸的重组宿主细胞中与第一酶接触。在一些实施方案中,罗汉果苷IIIE在罗汉果醇提取物中。在一些实施方案中,罗汉果苷IIIE也由重组宿主细胞产生。在一些实施方案中,该方法进一步包括在表达第一酶的条件下在培养基中培养重组宿主细胞。在一些实施方案中,第一酶是UDP糖基转移酶、环麦芽糊精葡聚糖转移酶(CGTases)、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。在一些实施方案中,第一酶是CGTase。例如,CGTase可包含一种氨基酸序列,该序列与SEQ ID NO:SEQ ID NO:1、3、78-101、148和154中任何一个具有至少70%、至少80%、至少90%、至少95%、至少
98%、至少99%或更多的序列同一性。在一些实施方案中,CGTase包含SEQ ID NO:SEQ ID NO:1、3、78-101、148和154中任一个的氨基酸序列。在一些实施方案中,CGTase包含SEQ ID NO:78-101中任一个的氨基酸序列。在一些实施方案中,第一酶是葡聚糖蔗糖酶。在一些实施方案中,葡聚糖蔗糖酶包含一种氨基酸序列,该序列与SEQ ID NO:2、103、106-110、156和
896中所示的任何一个序列具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,葡聚糖蔗糖酶包含SEQ ID NO:2、103、106-110、156和896中任何一个的氨基酸序列。在一些实施方案中,第一酶是转葡糖苷酶。在一些实施方案中,转葡糖苷酶包含一种氨基酸序列,该序列与SEQ ID NO:163-
290和723中任一个具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,转葡糖苷酶包含SEQ ID NO:163-
290和723中任一个的氨基酸序列。在一些实施方案中,第一酶是β-葡糖苷酶。在一些实施方案中,β-葡糖苷酶包含一种氨基酸序列,该序列与SEQ ID NO:292具有至少70%、80%、
85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,罗汉果醇提取物包含罗汉果苷IIA,重组宿主细胞包含第二基因,其编码能够催化罗汉果苷IIA以产生罗汉果苷IIIE的第二酶。在一些实施方案中,罗汉果苷IIA也由重组宿主细胞产生。在一些实施方案中,第二酶是UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。在一些实施方案中,第二酶是尿苷二磷酸-葡萄糖基转移酶(UGT)。在一些实施方案中,UGT是UGT73C3(SEQ ID NO:4)、UGT73C6(SEQ ID NO:5、444或445)、85C2(SEQ ID NO:6)、UGT73C5(SEQ ID NO:7)、UGT73E1(SEQ ID NO:8)、UGT98(SEQ ID NO:9或407)、UGT1576(SEQ ID NO:15)、UGT SK98(SEQ ID NO:16)、UGT430(SEQ ID NO:17)、UGT1697(SEQ ID NO:18)、UGT11789(SEQ ID NO:19),或包含一种氨基酸序列,该序列与UGT73C3(SEQ ID NO:4)、UGT73C6(SEQ ID NO:5、444或445)、85C2(SEQ ID NO:6)、UGT73C5(SEQ ID NO:7)、UGT73E1(SEQ ID NO:8)、UGT98(SEQ ID NO:9或407)、UGT1576(SEQ ID NO:15)、UGT SK98(SEQ ID NO:16)、UGT430(SEQ ID NO:17)、UGT1697(SEQ ID NO:NO:18),UGT11789(SEQ ID NO:19)具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。在一些实施方案中,UGT由UGT1495(SEQ ID NO:10)、UGT1817(SEQ ID NO:11)、UGT5914(SEQ ID NO:12)、UGT8468(SEQ ID NO:13)或UGT10391(SEQ ID NO:14)中的基因编码。在一些实施方案中,僧果提取物包含罗汉果醇。在一些实施方案中,该方法进一步包括使僧果提取物的罗汉果醇接触,其中重组宿主细胞进一步包含一种或多种编码一种或多种能够催化从罗汉果醇产生罗汉果苷IIIE的酶的基因。在一些实施方案中,罗汉果醇也由重组宿主细胞产生。在一些实施方案中,所述一种或多种酶包括UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。在一些实施方案中,第二酶是尿苷二磷酸-葡萄糖基转移酶(UGT)。在一些实施方案中,UGT是UGT73C3、UGT73C6、85C2、UGT73C5、UGT73E1、UGT98、UGT1495、UGT1817、UGT5914、UGT8468、UGT10391、UGT1576、UGT SK98、UGT430、UGT1697或UGT11789,或包含一种氨基酸序列,该序列与上述UGT的序列具有至少70%、80%、85%、90%、95%、98%、99%、
100%或这些数字中任何两个数字之间的范围的序列同一性。在一些实施方案中,该方法进一步包括使僧果提取物与重组宿主细胞接触以产生罗汉果苷IIIE,其中重组宿主细胞还包含一种或多种编码一种或多种能够催化从罗汉果苷化合物产生罗汉果IIIE的酶的基因,其中罗汉果苷化合物是罗汉果苷IA1、罗汉果苷IE1、罗汉果苷IIA1、罗汉果苷IIE、罗汉果苷IIA、罗汉果苷IIIA1、罗汉果苷IIIA2、罗汉果苷III、罗汉果苷IV、罗汉果苷IVA、罗汉果苷V或赛门苷中的一种或多种。在一些实施方案中,重组宿主细胞还产生罗汉果苷化合物。在一些实施方案中,所述一种或多种酶包括UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。在一些实施方案中,罗汉果苷化合物是罗汉果苷IIE。在一些实施方案中,一种或多种酶包含由SEQ ID NO:293-303中的任一个所示的氨基酸。在一些实施方案中,罗汉果苷化合物是罗汉果苷IIA或罗汉果苷IIE,其中使僧果提取物与表达一种或多种酶的重组细胞接触可产生罗汉果苷IIIA、罗汉果苷IVE和罗汉果苷V。在一些实施方案中,一种或多种酶包含SEQ ID NO:
304中所示的氨基酸。在一些实施方案中,一种或多种酶由SEQ ID NO:305中所示的序列编码。在一些实施方案中,僧果提取物包含罗汉果苷IA1。在一些实施方案中,该方法进一步包括使僧果提取物与重组宿主细胞接触,其中重组宿主细胞包含编码UGT98或UGT SK98的基因。在一些实施方案中,UGT98或UGT SK98酶包含氨基酸序列,该氨基酸序列与SEQ ID NO:
9、407、16或306具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,UGT98由SEQ ID NO:307所示的序列编码。在一些实施方案中,接触导致产生罗汉果苷IIA在细胞中。在一些实施方案中,僧果提取物包含11-羟基-24,25环氧葫芦二烯醇。在一些实施方案中,该方法进一步包括使僧果提取物与重组宿主细胞接触,其中该重组宿主细胞还包含编码环氧化物水解酶的第三基因。在一些实施方案中,重组宿主细胞也产生11-羟基-24,25环氧葫芦二烯醇。在一些实施方案中,该方法进一步包括使僧果提取物与重组宿主细胞接触,其中该重组宿主细胞包含编码细胞色素P450或环氧化物水解酶的第四基因。在一些实施方案中,所述11-羟基-葫芦二烯醇也由重组宿主细胞产生。在一些实施方案中,僧果提取物包含3,24,25三羟基葫芦二烯醇。在一些实施方案中,该方法进一步包括使僧果提取物与重组宿主细胞接触,其中该重组宿主细胞进一步包含编码细胞色素P450的第五基因。在一些实施方案中,3,24,25三羟基葫芦二烯醇也由重组宿主细胞产生。在一些实施方案中,与罗汉果醇提取物接触导致在重组宿主细胞中产生罗汉果醇。在一些实施方案中,细胞色素P450包含一种氨基酸序列,该序列与SEQ ID NO:20或308具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。在一些实施方案中,环氧化物水解酶与SEQ ID NO:21-
30和309-314中任何一个具有至少70%、70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。在一些实施方案中,僧果提取物包含葫芦二烯醇。在一些实施方案中,该方法进一步包括使葫芦二烯醇与重组宿主细胞接触,其中该重组宿主细胞包含编码细胞色素P450的基因。在一些实施方案中,所述接触导致产生11-羟基葫芦二烯醇。在一些实施方案中,所述11-羟基葫芦二烯醇在包含编码CYP87D18或SgCPR蛋白的基因的细胞中表达。在一些实施方案中,CYP87D18或SgCPR包含SEQ ID NO:315、872或
874中的序列。在一些实施方案中,CYP87D18或SgCPR由SEQ ID NO:316、871或873编码。在一些实施方案中,葫芦二烯醇也由重组宿主细胞产生。在一些实施方案中,编码细胞色素P450的基因包含一种核酸序列,该序列与SEQ ID NO:31-48、316、431、871、873、875、877、879、
881、883、885、887和891中的任何一个具有至少70%、80%、85%、90%、95%、98%、99%、
100%或这些数字中任何两个之间范围的序列同一性。在一些实施方案中,细胞色素P450包含一种氨基酸序列,该序列与SEQ ID NO:20或49具有至少70%、80%、85%、90%、95%、
98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,僧果提取物包含2,3-氧化角鲨烯。在一些实施方案中,该方法进一步包括使僧果提取物的2,
3-氧化角鲨烯与重组宿主细胞接触,其中所述重组宿主细胞包含编码葫芦二烯醇合酶的第七基因。在一些实施方案中,葫芦二烯醇合酶包含一种氨基酸序列,该序列与SEQ ID NO:
70-73、75-77、319、321、323、325、327-333、420、422、424、426、446、902、904或906具有至少
70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,葫芦二烯醇合酶被一种序列编码,该序列与SEQ ID NO:74、
320、322、324、326、328、418、421、423、425、427、897、899、901、903或905具有至少70%、
80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,僧果提取物包含罗汉果苷中间体,例如罗汉果苷V、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果苷、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III。在一些实施方案中,所述方法进一步包括使罗汉果苷中间体与重组宿主细胞接触,其中所述重组宿主细胞包含编码葫芦二烯醇合酶的第七基因。在一些实施方案中,葫芦二烯醇合酶包含一种氨基酸序列。该序列与SEQ ID NO:70-73、75-77、
319、321、323、325、327-333、420、422、424、426、446、902、904或906具有至少70%、80%、
85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。在一些实施方案中,葫芦二烯醇合酶由一种序列编码,该序列与SEQ ID NO:74、320、322、324、326、
328、418、421、423、425、427、897、899、901、903或905具有至少70%、80%、85%、90的%、
95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性。在一些实施方案中,接触产生葫芦二烯醇。在一些实施方案中,2,3-氧化鲨烯和二环氧角鲨烯也由重组宿主细胞产生。在一些实施方案中,2,3-氧化鲨烯或二环氧角鲨烯由包含一种序列的酶产生,该序列与SEQ ID NO:898或900具有与至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性,或包含SEQ ID NO:898或900所示的序列。
在一些实施方案中,2,3-氧化角鲨烯或二环氧角鲨烯由一种核酸序列编码的酶产生,该核酸序列与SEQ ID NO:897或899具有至少70%、80%、85%、90%、95%、98%、99%、99%、
100%或这些数字中任何两个之间范围的序列同一性,或由SEQ ID NO:897或899所示的核酸编码。
[0327] 在一些实施方案中,葫芦二烯醇合酶包含一种氨基酸序列,该序列与SEQ ID NO:70-73、75-77、319、321、323、325、327-333、420、422、424、426、446、902、904和906中的任何一个,至少具有70%、80%、85%、90%、95%、98%、99%、100%或其中任何两个数字之间范围的同一性。在一些实施方案中,葫芦二烯醇合酶是来自美洲南瓜(C pepo)、罗汉果(S grosvenorii)、黄瓜(C sativus)、厚皮甜瓜(C melo)、中国南瓜(C moschata)或笋瓜(C maxim)的葫芦二烯醇合酶。在一些实施方案中,葫芦二烯醇合成酶由包含核酸序列的基因编码,所述核酸序列与SEQ ID NO:74、320、322、324、326、328、418、418、421、423、425、427、
897、899、901、903和905中的任何一个具有至少、70%、80%、85%、90%、95%、98%、99%、
100%或这些数字中任何两个之间范围的序列同一性,或由SEQ ID NO:74、320、322、324、
326、328、418、421、423、425、427、897、899、901、903和905中任一序列所示的核酸序列编码。
在一些实施方案中,11-OH葫芦二烯醇由该细胞产生。在一些实施方案中,11-OH葫芦二烯醇在包含编码CYP87D18或SgCPR的基因的细胞中表达。在一些实施方案中,CYP87D18或SgCPR包含一种序列,该序列与SEQ ID NO:315、872或874具有至少70%、80%、85%、90%、95%、
98%、99%、100%或这些数字中任何两个之间的范围的序列同一性,或包含SEQ ID NO:
315、872或874中所示的序列。在一些实施方案中,CYP87D18或SgCPR由一种序列编码,该序列与SEQ ID NO:316、871或873具有至少70%、80%、85%、90%、95%、98%、99%、100%或这些数字中任何两个之间范围的序列同一性,或由SEQ ID NO:316、871或873中所示的序列编码。在一些实施方案中,僧果提取物含有角鲨烯。在一些实施方案中,由包含与SEQ ID NO:898或900具有至少70%、80%、85%、90%、95%、98%、99%或更高序列同一性的序列的酶产生2,3-氧化角鲨烯或二环氧角鲨烯,或由SEQ ID NO:898或900编码的酶产生。在一些实施方案中,2,3-氧化鲨烯或二环氧角鲨烯由一种核酸序列编码的酶产生,该序列与SEQ ID NO:897或899具有至少70%、80%、85%、90%、95%、98%、99%、100%或者在这些数字中任何两个之间范围的序列同一性,或由SEQ ID NO:897或897编码的酶。在一些实施方案中,该方法进一步包括使角鲨烯与重组宿主细胞接触,其中重组宿主细胞包含编码角鲨烯环氧酶的第八基因。在一些实施方案中,接触产生2,3-氧化角鲨烯。在一些实施方案中,角鲨烯也由重组宿主细胞产生。在一些实施方案中,角鲨烯环氧酶包含一种氨基酸序列,该序列与SEQ ID NO:50-56、60、61、334或335中的任何一个具有至少70%、80%、85%、90%、
95%、98%、99%、100%或这些数字中任何两个之间的范围的序列同一性。在一些实施方案中,角鲨烯环氧化合物由SEQ ID NO:335中列出的核酸序列编码。在一些实施方案中,僧果提取物包含法呢基焦磷酸。在一些实施方案中,该方法进一步包括使法呢基焦磷酸与重组宿主细胞接触,其中该重组宿主细胞包含编码角鲨烯合酶的第九个基因。在一些实施方案中,接触产生角鲨烯。在一些实施方案中,法呢基焦磷酸也由重组宿主细胞产生。在一些实施方案中,角鲨烯合酶包含与SEQ ID NO:69和336中任何序列具有至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或更多的序列同一性的氨基酸序列。在一些实施方案中,角鲨烯合酶由包含SEQ ID NO:337所示核酸序列的序列编码。在一些实施方案中,僧果提取物包含香叶基-PP。在一些实施方案中,该方法还包括使香叶基-PP与重组宿主细胞接触,其中重组宿主细胞包括编码法呢基-PP合成酶的第十基因。在一些实施方案中,接触导致法呢基-PP的产生。在一些实施方案中,香叶基-PP也由重组宿主细胞产生。在一些实施方案中,法呢基-PP合成酶包含氨基酸序列,该氨基酸序列与SEQ ID No:338具有至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或更多的序列同一性。在一些实施方案中,法呢基-PP合酶由SEQ ID No:339中所示的核酸序列编码。在一些实施方案中,第一、第二、第三、第四、第五、第六、第七、第八、第九和第十基因中的一个或多个可操作地连接到异源启动子。在一些实施方案中,异源启动子是CMV、EF1A、SV40、PGK1、人β-肌动蛋白、CAG、GAL1、GAL10、TEF1、GDS、ADH1、CaMV35s、Ubi、T7、T7lac、Sp6、araBAD、trp、lac、Ptac、pL启动子或其组合。在一些实施方案中,启动子是可诱导、可抑制或构成性(或称组成性)启动子。
在一些实施方案中,丙酮酸、乙酰辅酶A、柠檬酸盐和TCA循环中间产物的一个或多个的产生在重组宿主细胞中被上调。在一些实施方案中,重组宿主细胞中的细胞质定位被上调。在一些实施方案中,第一、第二、第三、第四、第五、第六、第七、第八、第九和第十基因中的一个或多个包含编码2A自裂肽的至少一个序列。在一些实施方案中,重组宿主细胞是植物、双壳类、鱼类、真菌、细菌或哺乳动物的细胞。在一些实施方案中,植物选自罗汉果属
(Siraitia)、苦瓜属(Momordica)、绞股蓝属(Gynostemma)、南瓜属(Cucurbita)、黄瓜属(Cucumis)、拟南芥属(Arabidopsis)、蒿属(Artemisia)、甜菊属(Stevia)、人参属(Panax)、睡茄属(Withania)、大戟属(Euphorbia)、苜蓿属(Medicago)、吊兰属(Chlorophytum)、五加属(Eleutherococcus)、楤木属(Aralia)、桑属(Morus)、苜蓿属(Medicago)、桦木属
(Betula)、黄芪属(Astragalus)、麻疯树属(Jatropha)、山茶属(Camellia)、韧伞属
(Hypholoma)、曲霉属(Aspergillus)、茄属(Solanum)、石杉属(Huperzia)、孩儿参属(Pseudostellaria)、黄麻属(Corchorus)、常春藤属(Hedera)、地钱属(Marchantia)和桑属(Morus)。在一些实施方案中,真菌选自毛癣菌属(Trichophyton)、桑黄孔菌属
(Sanghuangporus)、台芝属(Taiwanofungus)、链疫孢属(Moniliophthora)、盘二孢属(Marssonina)、色二孢属(Diplodia)、微香菇属(Lentinula)、法夫酵母属
(Xanthophyllomyces)、普可尼亚属(Pochonia)、炭疽菌属(Colletotrichum)、间座壳属(Diaporthe)、组织胞浆菌属(Histoplasma)、球孢子菌属(Coccidioides)、组织胞浆菌属(Histoplasma)、桑黄孔菌属(Sanghuangporus)、短梗霉属(Aureobasidium)、普可尼亚属(Pochonia)、青霉属(Penicillium)、孢子丝菌属(Sporothrix)、黑僵菌属(Metarhizium)、曲霉属(Aspergillus)、耶氏酵母属(Yarrowia)和油脂酵母属(Lipomyces)。在一些实施方案中,该真菌为构巢曲霉(Aspergillus nidulans)、解脂耶氏酵母(Yarrowia lipolytica)或圆红冬孢酵母菌(Rhodosporin toruloides)。在一些实施方案中,重组宿主细胞是酵母细胞。在一些实施方案中,酵母选自假丝酵母属(Candida)、酵母属(Sacccharaomyces)、酵母亚门(Saccharomycotina)、外囊菌亚门(Taphrinomycotina)、裂殖酵母纲
(Schizosaccharomycetes)、毕赤酵母属(Komagataella)、担子菌门(Basidiomycota)、伞菌亚门(Agaricomycotina)、银耳纲(Tremellomycetes)、柄锈菌亚门(Pucciniomycotina)、短梗霉属(Aureobasidium)、锥毛壳属(Coniochaeta)、红冬孢酵母属(Rhodosporidium)和微球黑粉菌纲(Microboryomycetes)。在一些实施方案中,所述细菌选自由弗兰克氏菌属(Frankia)、放线菌门(Actinobacteria)、链霉菌属(Streptomyces)和肠球菌属
(Enterococcus)。在一些实施方案中,所述细菌为粪肠球菌(Enterococcus faecalis)。在一些实施方案中,第一、第二、第三、第四、第五、第六、第七、第八、第九和第十基因中的一个或多个已被优化以在细菌、哺乳动物、植物、真菌或昆虫细胞中表达。在一些实施方案中,第一、第二、第三、第四、第五、第六、第七、第八、第九和第十基因中的一个或多个包含对所编码酶的活性增加的功能突变。在一些实施方案中,培养重组宿主细胞包括监测培养的pH、溶解氧水平、氮水平或培养条件的组合。在一些实施方案中,该方法包括分离化合物1。在一些实施方案中,分离化合物1包括裂解重组宿主细胞。在一些实施方案中,分离化合物1包括从培养基分离化合物1。在一些实施方案中,该方法还包括纯化化合物1。在一些实施方案中,纯化化合物1包括HPLC、固相萃取或其组合。在一些实施方案中,纯化进一步收获重组细胞,保存处理细胞的上清液并裂解细胞。在一些实施方案中,溶解包括使细胞受到剪切力或洗涤剂洗涤,从而获得溶解物。在一些实施方案中,剪切力来自超声法、高压细胞裂解(french pressurized cells)或珠子。在一些实施方案中,对裂解物进行过滤和纯化步骤。在一些实施方案中,通过固相萃取过滤和纯化裂解产物。在一些实施方案中,该方法还包括将僧果提取物第二或第三次添加到重组宿主细胞的生长培养基中。此外,该方法可通过将僧果提取物与重组细胞裂解物接触来进行,其中重组细胞裂解物包含本文所列的经表达的酶。
[0328] 一般而言,本文中所公开和描述的化合物,单独或组合地可在诸如可摄取的组合物之类的组合物中提供。在一个实施方案中,如本文所公开和描述的化合物,单独或组合地可向可摄取组合物提供甜味。在其他实施方案中,本文中公开和描述的化合物可单独或组合地作为甜味剂以增强另一甜味剂的甜味性。通过将本文公开和描述的一种或多种化合物与甜味剂组合物中的一种或多种其他甜味剂组合,本文公开的化合物赋予甜味剂组合物更类似于糖的时间特性和/或风味特性。在另一个实施方案中,如本文所公开和描述的化合物,单独或组合地可通过将其组合物与如本文所公开和描述的化合物接触以形成经改性的组合物,从而增加或增强组合物的甜味。在另一个实施方案中,如本文所公开和描述的化合物,单独或组合地可以用在一种组合物中,该组合物调制在味蕾以外的身体中表达的甜味受体和/或其配体。
[0329] 本文所用的“可摄取组合物”包括打算用于或不用于食用且可单独或与另一物质一起经口服用的任一物质。可摄取组合物包括“食物或饮料产品”和“非食物性产品”二者。“食物或饮料产品”意指打算供人类或动物食用的任一食物性产品,包括固体、半固体或液体(例如,饮料),还包括功能性食品(例如:任何声称具有促进健康和/或预防疾病特性的新鲜或加工食品,其营养功能超出了提供营养的基本营养功能)。术语“非食物性产品”或“非食性组合物”包括可出于除食用或作为食物或饮料以外的目的由人类或动物服用的任一产品或组合物。例如,非食物性产品或非食性组合物包括补充品、营养品、药品和非处方药、口腔护理产品(如牙膏和漱口水)和口香糖。
[0330] 含罗汉果苷化合物的组合物
[0331] 本文公开还包括组合物,例如可摄取组合物,其包含本文所公开的罗汉果苷化合物中的一种或多种,包括但不限于化合物1和图43中所示的化合物。在一些实施方案中,可摄取组合物可以是饮料。例如,饮料可以选自增强型起泡饮料,可乐、柠檬-酸橙味起泡饮料、橙子味起泡饮料、葡萄味起泡饮料、草莓味起泡饮料、菠萝味起泡饮料、姜汁啤酒、根啤酒、果汁、水果味果汁、果汁饮料、蜜汁饮料、蔬菜汁、蔬菜味汁、运动饮料、能量饮料、强化水饮料、含维生素强化水、近水饮料、椰子水、茶类饮料、咖啡、可可饮料、含牛奶成分的饮料、含谷类提取物的饮料和沙。在一些实施方案中,饮料可以是软饮料。
[0332] 一种“摄取可接收成分”是一种适于口服的物质,可与本文所述化合物结合形成可摄取组合物。取决于产品的预期用途,摄取可接收成分可以是任何形式,例如固体、半固体、液体、糊状物、凝胶、乳液、奶油、泡沫材料、悬浮液、溶液或其任何组合(例如含有固体成分的液体)。摄取可接收成分可以是人工的或天然的。摄取可接收成分包括许多常见的食物成分,如中性、酸性或碱性pH的水、水果或蔬菜汁、醋、腌料、啤酒、葡萄酒、天然水/脂肪乳液(如牛奶或炼乳)、食用油和起酥油、脂肪酸及其烷基酯,低分子量的丙二醇寡聚物、脂肪酸甘油酯和此类疏水物质在水介质中的分散液或乳液、盐(如氯化钠)、小麦粉、溶剂(如乙醇)、固体食用稀释剂(如植物粉或面粉)或其他液体载体;分散或悬浮助剂;表面活性剂;等渗剂;增稠剂或乳化剂、防腐剂;固体粘合剂润滑剂等。
[0333] 其他摄取可接受成分包括酸,包括但不限于柠檬酸、磷酸、抗坏血酸、硫酸钠、乳酸或酒石酸;苦味成分,包括例如咖啡因、奎宁、绿茶、儿茶素、多酚、罗布斯塔咖啡生豆提取物、咖啡生豆提取物,乳清蛋白分离物,或氯化钾着色剂,包括例如焦糖色、红色#40、黄色#5、黄色#6、蓝色#1、红色#3、紫色胡萝卜、黑胡萝卜汁、紫甘薯、蔬菜汁、果汁、β胡萝卜素、姜黄姜黄素或二氧化;防腐剂,包括例如苯甲酸钠、苯甲酸钾、山梨酸钾、偏硫酸氢钠、山梨酸或苯甲酸;抗氧化剂,包括例如抗坏血酸、乙二胺四乙酸二钠、α-生育酚、混合生育酚、迷迭香提取物、葡萄籽提取物、白藜芦醇或六偏磷酸钠;维生素或功能性成分,包括例如白藜芦醇、Co-Q10、ω3脂肪酸、茶氨酸、氯化胆碱(胞磷胆碱(Citocoline))、纤维醇、菊粉(菊苣根)、牛磺酸、人参提取物、瓜拉那提取物、生姜提取物、L-苯丙氨酸、L-肉碱、L-酒石酸盐、D-葡萄糖酸内酯、肌醇、生物类黄酮、紫锥菊、银杏(Ginkgo Biloba)、马黛茶(yerba mate)、亚麻籽油、藤黄果(Garcinia cambogia)皮提取物、白茶提取物、核糖、奶蓟草(milk thistle)提取物、葡萄籽提取物、盐酸吡多醇(维生素B6)、氰钴胺(维生素B12)、烟酰胺(维生素B3)、生物素、乳酸、泛酸钙(泛酸)、磷酸钙、碳酸钙、氯化铬、多烟酸铬、硫酸、叶酸、焦磷酸、铁、乳酸镁、碳酸镁、硫酸镁、磷酸一钾、磷酸一钠、磷、碘化钾、磷酸钾、核黄素、硫酸钠、葡萄糖酸钠、聚磷酸钠、碳酸氢钠硝酸硫胺、维生素D3、维生素A棕榈酸酯、葡萄糖酸锌、乳酸锌或硫酸锌;起剂,包括例如酯胶、溴化植物油(BVO)或蔗糖乙酸异丁酸酯(SAIB);缓冲液,包括例如柠檬酸钠、柠檬酸钾或盐;调味料,包括例如丙二醇、乙醇、甘油、阿拉伯树胶(阿拉伯胶)、麦芽糊精、改性玉米淀粉,右旋糖,天然调味料,具有其他天然调味料的天然调味料(天然调味料WONF),天然和人造调味料,人造调味料,二氧化硅,碳酸镁,或磷酸三钙;稳定剂,包括例如果胶,黄原胶,羧甲基纤维素(CMC),聚山梨酯60,聚山梨酯80,中链甘油三酯,纤维素凝胶,纤维素胶,酪蛋白酸钠,改性食品淀粉,阿拉伯树胶(阿拉伯胶),或卡拉胶。
[0334] 实施例
[0335] 在下面的实施例中进一步详细地公开了上述实施方案的一些形态,这些实施例绝不旨在限制本公开的范围。
[0336] 实施例1:赛门苷I的产生
[0337]
[0338] 如本文所公开的,赛门苷I可以是用于产生本文所公开的化合物1的中间体罗汉果苷化合物。例如,可以将赛门苷I水解以产生罗汉果苷IIIE,然后可用于制备化合物1。例如,用于制备赛门苷I的方法可以包括:使罗汉果醇与表达一种或多种UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的重组宿主细胞接触。例如,可以使用表达来自棘孢曲霉(Aspergillus 
aculeatus)的果胶酶的重组细胞。
[0339] 作为另一实例,用于产生赛门苷I的方法可包括:使罗汉果苷V、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。例如,可以使用来自棘孢曲霉(Aspergillus aculeatus)的果胶酶。
[0340] 实施例2:罗汉果苷IVE的产生
[0341]
[0342] 如本文公开的,罗汉果苷IVE可以是用于产生本文公开的化合物1的中间体罗汉果苷化合物。例如,然后可以使用来自罗汉果苷V的罗汉果苷IVE来产生化合物1。例如,用于产生罗汉果苷IVE的方法可以包括:使罗汉果苷V与表达一种或多种UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的重组宿主细胞接触。作为另一个例子,重组细胞可以包含编码果胶酶的基因。果胶酶可以由来自棘孢曲霉(Aspergillus aculeatus)的一个基因编码。
[0343] 作为另一实例,用于产生罗汉果苷IVE的方法可包括:使罗汉果苷V、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。例如,可以使用来自棘孢曲霉(Aspergillus aculeatus)的果胶酶。
[0344] 实施例3:罗汉果苷IIIE的产生
[0345]
[0346] 如本文公开的,罗汉果苷IIIE可以是用于产生本文公开的化合物1的中间体罗汉果苷化合物。例如,可以将罗汉果苷IIA糖基化以产生罗汉果苷IIIE,然后用它来产生化合物1。
[0347] 作为另一实例,用于产生罗汉果苷IIIE的方法可包括:使罗汉果苷V、罗汉果苷IIA、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。例如,来自棘孢曲霉(Aspergillus aculeatus)的果胶酶可以由重组宿主细胞内的基因编码。
[0348] 实施例4:罗汉果苷IVA的产生
[0349]
[0350] 如本文公开的,罗汉果苷IVA可以是用于产生本文公开的化合物1的中间体罗汉果苷化合物。例如,然后可以使用来自罗汉果苷V的罗汉果苷IVA来产生化合物1。
[0351] 例如,用于产生罗汉果苷IVA的方法可以包括:使罗汉果苷V与表达一种或多种UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的重组宿主细胞接触。作为另一个例子,酶可以是一种来自米曲霉(Aspergillus oryzae)的β-半乳糖苷酶。
[0352] 作为另一实例,用于产生罗汉果苷IVA的方法可包括:使罗汉果苷V、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。例如,以上来自米曲霉(Aspergillus oryzae)的β-半乳糖苷酶可以使用在该方法中。
[0353] 实施例5:罗汉果苷IIA的产生
[0354]
[0355] 如本文公开的,罗汉果苷IIA可以是用于产生本文公开的化合物1的中间体罗汉果苷化合物。例如,用于产生罗汉果苷IIA的方法可以包括:使罗汉果苷IA1与表达一种或多种UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的重组宿主细胞接触。
[0356] 作为另一实例,用于产生罗汉果苷IIA的方法可包括:使罗汉果苷IA1、罗汉果苷V、赛门苷I、罗汉果苷IVE、罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。例如,也可以使用celluclast。
[0357] 实施例6:从Aromase产生罗汉果苷IIIA1
[0358]
[0359] 如本文公开的,罗汉果苷IIIA1可以是用于产生本文公开的化合物1的中间体罗汉果苷化合物。例如,罗汉果苷IIIA1可以是产生罗汉果苷IVA的中间体,其然后可以用作产生化合物1的中间体。例如,用于产生罗汉果苷IIIA1的方法可以包括:使赛门苷I与表达一种或多种UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的重组宿主细胞接触。例如,酶可以是Aromase。作为另一实例,用于产生罗汉果苷IIIA1的方法可包括:使罗汉果苷V、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。
[0360] 实施例7:化合物3的产生
[0361]
[0362] 如本文所公开的,化合物3可以是用于产生本文所公开的化合物1的中间体罗汉果苷化合物。例如,用于产生化合物3的方法可以包括:使罗汉果醇与表达一种或多种UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的重组宿主细胞接触。例如,可以使用来自地衣芽孢杆菌(Bacillus lichenformis)的环麦芽糊精葡聚糖转移酶和/或Toruzyme。
[0363] 作为另一实例,用于生产化合物3的方法可包括:使罗汉果苷V、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IIIE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。例如,可以使用CTGase酶。
[0364] 实施例8:化合物4的产生
[0365]
[0366] 如本文所公开的,在本文公开的化合物1的产生过程中产生化合物4。例如,产生化合物4的方法也可以导致化合物1的产生,该方法可以包括使罗汉果苷IIIE与表达一种或多种UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的重组宿主细胞接触。
[0367] 作为另一实例,用于产生化合物4的方法可包括:使罗汉果苷V、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IIIE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。例如,该酶可以是来自地衣芽孢杆菌(Bacillus lichenformis)的环麦芽糊精葡聚糖转移酶和/或
Toruzyme。
[0368] 实施例9:化合物5的产生
[0369]
[0370] 如本文所公开的,化合物5可以是用于产生本文所公开的化合物1的中间体罗汉果苷化合物。例如,产生化合物5的方法也可以导致化合物1的产生,该方法可以包括使罗汉果苷IIIE与表达一种或多种UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的重组宿主细胞接触。
[0371] 作为另一实例,用于产生化合物5的方法可包括:使罗汉果苷V、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。例如,可以使用来自地衣芽孢杆菌(Bacillus lichenformis)的CGTase和/或Toruzyme。
[0372] 实施例10:化合物6的产生
[0373]
[0374] 如本文所公开的,化合物6可以是用于产生本文所公开的化合物1的中间体罗汉果苷化合物。例如,产生化合物6的方法也可以导致产生化合物1,该方法可以包括使罗汉果苷IIIE与表达一种或多种UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的重组宿主细胞接触。
[0375] 作为另一实例,用于产生化合物6的方法可包括:使罗汉果苷V、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。例如,可以使用来自地衣芽孢杆菌(Bacillus lichenformis)的CGTase或Toruzyme。
[0376] 实施例11:化合物7的产生
[0377]
[0378] 如本文所公开的,化合物7可以是用于产生本文所公开的化合物1的中间体罗汉果苷化合物。例如,产生化合物7的方法也可以导致产生化合物1,该方法可以包括使罗汉果苷IIIE与表达一种或多种UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的重组宿主细胞接触。
[0379] 作为另一实例,用于产生化合物7的方法可包括:使罗汉果苷V、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。例如,可以使用来自地衣芽孢杆菌(Bacillus lichenformis)的CGTase或Toruzyme。
[0380] 实施例12:化合物8的产生
[0381]
[0382] 如本文所公开的,化合物8可以是用于产生本文所公开的化合物1的中间体罗汉果苷化合物。例如,产生化合物8的方法也可以导致产生化合物1,该方法可以包括使罗汉果苷IIIE与表达一种或多种UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的重组宿主细胞接触。
[0383] 作为另一实例,用于产生化合物8的方法可包括:使罗汉果苷V、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。例如,可以使用来自地衣芽孢杆菌(Bacillus lichenformis)的CGTase或Toruzyme。
[0384] 实施例13:化合物9的产生
[0385]
[0386] 如本文所公开的,化合物9可以是用于产生本文所公开的化合物1的中间体罗汉果苷化合物。例如,产生化合物9的方法也可以导致产生化合物1,该方法可以包括使罗汉果苷IIIE与表达一种或多种UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的重组宿主细胞接触。
[0387] 作为另一实例,用于产生化合物9的方法可包括:使罗汉果苷V、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。例如,可以使用来自地衣芽孢杆菌(Bacillus lichenformis)的CGTase或Toruzyme。
[0388] 实施例14:化合物10的产生
[0389]
[0390] 如本文所公开的,化合物10可以是用于产生本文所公开的化合物1的中间体罗汉果苷化合物。例如,产生化合物10的方法也可以导致产生化合物1,该方法可以包括使罗汉果苷IIIE与表达一种或多种UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的重组宿主细胞接触。
[0391] 作为另一实例,用于产生化合物10的方法可包括:使罗汉果苷V、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。例如,可以使用来自地衣芽孢杆菌(Bacillus lichenformis)的CGTase或Toruzyme。
[0392] 实施例15:化合物11的产生
[0393]
[0394] 如本文所公开的,化合物11可以是用于产生本文所公开的化合物1的中间体罗汉果苷化合物。例如,产生化合物11的方法也可以导致产生化合物1,该方法可以包括使罗汉果苷IIIE或11-氧代-MIIIE与表达一种或多种UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的重组宿主细胞接触。
[0395] 作为另一实例,用于生产化合物11的方法可包括:使罗汉果苷V、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。例如,可以使用来自地衣芽孢杆菌(Bacillus lichenformis)的CGTase或Toruzyme。
[0396] 实施例16:化合物12的产生
[0397]
[0398] 如本文所公开的,化合物12可以是用于产生本文所公开的化合物1的中间体罗汉果苷化合物。例如,产生化合物12的方法也可以导致产生化合物1,该方法可以包括使罗汉果苷VI异构体与表达一种或多种UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的重组宿主细胞接触。例如,该酶可以是面包酵母中的转化酶。
[0399] 作为另一实例,用于产生化合物12的方法可包括:使罗汉果苷V、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶、转化酶和葡聚糖酶中的一种或多种。
[0400] 实施例17:化合物13的产生
[0401]
[0402] 如本文所公开的,化合物13可以是用于产生本文所公开的化合物1的中间体罗汉果苷化合物。例如,该方法可以包括使罗汉果苷IIIE与表达一种或多种UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的重组宿主细胞接触。所表达的酶也可以是例如celluclast。
[0403] 作为另一实例,用于产生化合物13的方法可包括:使罗汉果苷V、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。例如,可以使用celluclast。
[0404] 实施例18:化合物14的产生
[0405]
[0406] 如本文所公开的,化合物14可以是用于产生本文所公开的化合物1的中间体罗汉果苷化合物。例如,该方法可以包括使罗汉果苷IIIE与表达一种或多种UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的重组宿主细胞接触。所表达的酶也可以是例如celluclast。
[0407] 作为另一实例,用于产生化合物14的方法可包括:使罗汉果苷V、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。例如,可以使用celluclast。
该方法还可需要糖例如α-乳糖的存在。
[0408] 实施例19:化合物15的产生
[0409]
[0410] 如本文所公开的,化合物15可以是用于产生本文所公开的化合物1的中间体罗汉果苷化合物。例如,该方法可以包括使罗汉果苷IIA与表达一种或多种UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的重组宿主细胞接触。
[0411] 作为另一实例,用于生产化合物15的方法可包括:使罗汉果苷V、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。例如,可以使用Toruzyme。
[0412] 实施例20:化合物16的产生
[0413]
[0414] 如本文所公开的,化合物16可以是用于产生本文所公开的化合物1的中间体罗汉果苷化合物。例如,该方法可以包括使罗汉果苷IIA与表达一种或多种UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的重组宿主细胞接触。
[0415] 作为另一实例,用于生产化合物16的方法可包括:使罗汉果苷V、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。例如,可以使用Toruzyme。
[0416] 例如,这种酶可以是Toruzyme。重组细胞还可包括编码环麦芽糊精葡聚糖转移酶(例如Toruzyme)、转化酶、葡糖转移酶(例如UGT76G1)的基因。
[0417] 实施例21:化合物17的产生
[0418]
[0419] 如本文所公开的,化合物17可以是用于产生本文所公开的化合物1的中间体罗汉果苷化合物。例如,可将化合物17水解以产生罗汉果苷IIIE,然后可将其用于产生化合物1。例如,用于产生化合物17的方法可包括:使赛门苷I与表达一种或多种UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的重组宿主细胞接触。例如,可以使用表达UDP糖基转移酶的重组细胞。
[0420] 作为另一实例,用于产生化合物17的方法可包括:使罗汉果苷V、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。例如,可以使用UDP糖基转移酶。
[0421] 实施例22:化合物18的产生
[0422]
[0423] 如本文所公开的,化合物18可以是用于产生本文所公开的化合物1的中间体罗汉果苷化合物。例如,可将化合物18水解以产生罗汉果苷IIIE,然后可将其用于产生化合物1。例如,用于制备化合物18的方法可包括:使罗汉果苷IIIE与表达一种或多种UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的重组宿主细胞接触。例如,酶可以是Sus1和UGT76G1。
[0424] 作为另一实例,用于产生化合物18的方法可包括:使罗汉果苷V、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。例如,酶可以是UGT76G1。
[0425] 实施例23:化合物19的产生
[0426]
[0427] 如本文所公开的,化合物19可以是用于产生本文所公开的化合物1的中间体罗汉果苷化合物。例如,可将化合物19水解以制备化合物1。例如,用于制备化合物19的方法可包括:使罗汉果苷IIIE与表达一种或多种UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的重组宿主细胞接触。例如,酶可以是Sus1和UGT76G1。
[0428] 作为另一实例,用于产生化合物19的方法可包括:使罗汉果苷V、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。该酶可以是例如UGT76G1。该酶例如也可以是蔗糖合酶Sus1。
[0429] 实施例24:化合物20的产生
[0430]
[0431] 如本文所公开的,化合物20可以是用于产生本文所公开的化合物1的中间体罗汉果苷化合物。例如,可将化合物20进一步水解以产生化合物1。例如,用于产生化合物20的方法可包括:使罗汉果苷IIIE与表达一种或多种UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的重组宿主细胞接触。例如,酶可以是Sus1和UGT76G1。
[0432] 作为另一实例,用于产生化合物20的方法可包括:使罗汉果苷V、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。该酶可以是例如UGT76G1。酶也可以是例如蔗糖合酶Sus1。该酶可以是例如蔗糖合酶Sus1和UGT76G1。
[0433] 实施例25:化合物21的产生
[0434]
[0435] 如本文所公开的,化合物21可以是用于产生本文所公开的化合物1的中间体罗汉果苷化合物。例如,可将化合物21进一步水解以产生化合物1。例如,用于产生化合物21的方法也能导致产生化合物1,该方法可包括:使罗汉果苷IVE与表达一种或多种UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的重组宿主细胞接触。该酶可以是例如Sus1和UGT76G1。
[0436] 作为另一实例,用于产生化合物21的方法可包括:使罗汉果苷V、罗汉果苷IVE、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。该酶可以是例如UGT76G1。酶也可以是例如蔗糖合酶Sus1。这些酶可以是例如蔗糖合酶Sus1和GT76G1。
[0437] 实施例26:化合物22的产生
[0438]
[0439] 如本文所公开的,化合物22可以是用于产生本文所公开的化合物1的中间体罗汉果苷化合物。例如,可将化合物22进一步水解以产生化合物1。例如产生化合物22的方法也可导致产生化合物1,该方法可以包括:使罗汉果苷IVA与表达一种或多种UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的重组宿主细胞接触。该酶可以是例如Sus1和UGT76G1。
[0440] 作为另一实例,用于产生化合物22的方法可包括:使罗汉果苷V、罗汉果苷IVE、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。该酶可以是例如UGT76G1。该酶例如也可以是蔗糖合酶Sus1。该酶可以是例如蔗糖合酶Sus1和GT76G1。
[0441] 实施例27:化合物23的产生
[0442]
[0443] 如本文所公开的,化合物23可以是用于产生本文所公开的化合物1的中间体罗汉果苷化合物。例如,可将化合物23进一步水解以产生化合物1。例如,用于产生化合物22的方法也可以导致产生化合物1,该方法包括:使罗汉果苷IVE与表达一种或多种UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的重组宿主细胞接触。例如,该酶可以是葡聚糖蔗糖酶。
[0444] 作为另一实例,用于产生化合物23的方法可包括:使罗汉果苷V、罗汉果苷IVE、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。该酶可以是例如葡聚糖蔗糖酶,其将高糖基化的罗汉果苷IVE异构体水解成所需的罗汉果苷V异构体。
[0445] 实施例28和29:由真菌乳糖酶产生罗汉果苷IIA1和罗汉果苷IIA2
[0446]
[0447] 如本文所公开的,罗汉果苷IIA1和罗汉果苷IIA2可以是用于产生本文所公开的化合物1的中间体罗汉果苷化合物。例如,可将罗汉果苷IIA1和罗汉果苷IIA2进一步水解以产生化合物1。例如,用于产生罗汉果苷IIA1和罗汉果苷IIA2的方法也可以导致产生化合物1,该方法包括:使罗汉果苷IVE与表达一种或多种UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的重组宿主细胞接触。该酶可以是例如来自真菌的乳糖酶。
[0448] 作为另一实例,用于产生罗汉果苷IIA1和罗汉果苷IIA2的方法可包括:使罗汉果苷V、罗汉果苷IVE、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。
[0449] 实施例30:由Viscozyme产生罗汉果苷化合物IA
[0450]
[0451] 如本文所公开的,罗汉果苷IA可以是用于产生本文所公开的化合物1的中间体罗汉果苷化合物。例如,可将罗汉果苷IA进一步水解以产生化合物1。例如,用于产生罗汉果苷IA的方法也可以导致产生化合物1,该方法可包括:使罗汉果苷IIA与表达一种或多种UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的重组宿主细胞接触。例如,该酶可以是例如Viscozyme。
[0452] 作为另一实例,用于产生罗汉果苷IA的方法可包括:使罗汉果苷V、罗汉果苷IVE、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。例如,该酶可以是Viscozyme。
[0453] 实施例31:化合物24的产生
[0454]
[0455] 如本文所公开的,化合物24可以是用于产生本文所公开的化合物1的中间体罗汉果苷化合物。例如,可将化合物24进一步水解以产生化合物1。用于产生化合物24的方法也可以导致产生化合物1,该方法可包括:使罗汉果苷IIIE与表达一种或多种UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的重组宿主细胞接触。例如,酶可以是葡聚糖蔗糖酶DexT。
[0456] 作为另一实例,用于产生化合物24的方法可包括:使罗汉果苷V、罗汉果苷IVE、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。例如,酶可以是葡聚糖蔗糖酶DexT。
[0457] 实施例32:化合物25的产生
[0458]
[0459] 如本文所公开的,化合物25可以是用于产生本文所公开的化合物1的中间体罗汉果苷化合物。例如,可将化合物25进一步水解以产生化合物1。用于产生化合物25的方法也可以导致产生化合物1,该方法可包括:使罗汉果苷IIIE与表达一种或多种UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的重组宿主细胞接触。例如,该酶可以是葡聚糖蔗糖酶DexT。
[0460] 作为另一实例,用于产生化合物25的方法可包括:使罗汉果苷V、罗汉果苷IVE、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。例如,该酶可以是葡聚糖蔗糖酶DexT。
[0461] 实施例33:化合物26的产生
[0462]
[0463] 如本文所公开的,化合物26可以是用于产生本文所公开的化合物1的中间体罗汉果苷化合物。例如,可将化合物26进一步水解以产生化合物1。产生化合物26的方法也可以导致产生化合物1,该方法可包括:使罗汉果苷IIIE与表达一种或多种UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的重组宿主细胞接触。例如,该酶可以是葡聚糖蔗糖酶DexT。
[0464] 作为另一实例,用于产生化合物26的方法可包括:使罗汉果苷V、罗汉果苷IVE、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。例如,该酶可以是葡聚糖蔗糖酶DexT。
[0465] 实施例34和35:用果胶酶产生罗汉果醇和罗汉果苷IE
[0466]
[0467] 如本文所公开的,罗汉果醇和罗汉果苷IE可以是用于产生本文所公开的化合物1的中间体罗汉果苷化合物。例如,罗汉果醇可以用作产生罗汉果苷IA1的底物,将其进一步水解以形成化合物1,而罗汉果苷IE也可以进一步水解以产生化合物1。用于产生罗汉果醇和罗汉果苷IE的方法可用于产生化合物1,该方法包括:使罗汉果苷V与表达一种或多种UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的重组宿主细胞接触。例如,该酶可以是来自棘孢曲霉(Aspergillus aculeatus)的果胶酶。
[0468] 作为另一实例,用于产生罗汉果醇和罗汉果苷IE的方法可包括:使罗汉果苷V、罗汉果苷IVE、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。
[0469] 实施例36:罗汉果苷IIE的产生
[0470]
[0471] 如本文所公开的,罗汉果苷IIE可以是用于产生本文所公开的化合物1的中间体罗汉果苷化合物。例如,可将罗汉果苷IIE进一步水解以产生化合物1。例如,用于产生罗汉果苷IIE的方法可以导致产生化合物1,该方法包括:使罗汉果苷V与表达一种或多种UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的重组宿主细胞接触。例如,该酶可以是来自棘孢曲霉(Aspergillus aculeatus)的果胶酶。
[0472] 作为另一实例,用于产生罗汉果苷IIE的方法可包括:使罗汉果苷V、罗汉果苷IVE、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。
[0473] 实施例37和38:化合物32和33的产生
[0474]
[0475]
[0476] 如本文所公开的,化合物32和33可以是用于产生本文所公开的化合物1的中间体罗汉果苷化合物。例如,可将化合物32和33进一步水解以产生化合物1。用于产生化合物32和33的方法也可以导致产生化合物1,该方法可包括:使罗汉果苷V、罗汉果苷IVE、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。例如,该酶可以是来自棘孢曲霉(Aspergillus aculeatus)的果胶酶。
[0477] 作为另一实例,用于产生化合物32和33的方法可包括:使罗汉果苷V、罗汉果苷IVE、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、
11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。
[0478] 实施例39和40:化合物34和35的产生
[0479]
[0480] 如本文所公开的,化合物34和35可以是用于产生本文所公开的化合物1的中间体罗汉果苷化合物。例如,可将化合物32和33进一步水解以产生化合物1。用于产生化合物34和35的方法也可以导致产生化合物1,该方法可包括:使罗汉果苷IIIE与表达一种或多种UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶的重组宿主细胞接触。例如,可以酶可以是celluclast。
[0481] 作为另一实例,用于产生化合物34和35的方法可包括:使罗汉果苷V、罗汉果苷IVE、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、
11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。
[0482] 实施例41和42:罗汉果苷IIIA2和罗汉果苷III的产生
[0483]
[0484] 如本文所公开的,罗汉果苷IIIA2和罗汉果苷III可以是用于产生本文所公开的化合物1的中间体罗汉果苷化合物。例如,可将罗汉果苷IIIA2和罗汉果苷III进一步水解以产生化合物1。
[0485] 例如,罗汉果苷IIIA2和罗汉果苷III可以与UGT接触形成罗汉果苷IVA,罗汉果苷IVA是另一种用来制备罗汉果苷IIIE的罗汉果苷化合物,罗汉果苷IIIE可进一步水解以形成化合物1。
[0486] 用于产生罗汉果苷IIIA2和罗汉果苷III的方法也可以导致产生化合物1,该方法可包括:使罗汉果苷IIIE与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。例如,该酶可以是celluclast。
[0487] 作为另一实例,用于产生罗汉果苷IIIA2和罗汉果苷III的方法可包括:使罗汉果苷V、罗汉果苷IVE、赛门苷I、罗汉果苷IVE、异罗汉果苷V、罗汉果苷IIIE、11-脱氧罗汉果苷V、11-氧代罗汉果苷V、罗汉果苷VI、罗汉果苷IVA、罗汉果苷IIA、罗汉果苷IIA1、罗汉果苷IIA2、罗汉果苷IA、11-氧代罗汉果苷VI、11-氧代罗汉果苷IIIE、11-氧代罗汉果苷IVE、罗汉果苷IE、罗汉果醇、11-氧代罗汉果醇、罗汉果苷IIE、罗汉果苷IIIA2和罗汉果苷III中的一种或多种与一种重组宿主细胞接触,该重组宿主细胞表达UDP糖基转移酶、CGTases、糖基转移酶、葡聚糖蔗糖酶、纤维素酶、β-葡糖苷酶、淀粉酶、转葡糖苷酶、果胶酶和葡聚糖酶中的一种或多种。
[0488] 实施例43:使用CGT-SL酶以产生化合物1
[0489] 在1ml反应体积中,将5mg罗汉果苷IIIE、50mg可溶性淀粉、0.1M NaOAC pH 5.0、125ul CGT-SL酶(来自嗜热脂肪芽孢杆菌(Geobaccilus thermophillus))和水混合,并用搅拌棒混合并在50℃下孵育。取时间点样品用于HPLC分析。
[0490] HPLC数据:如图1所示的化合物1的产生的质谱。在一些实施方案中,CTG-SL可包含SEQ ID NO:3、148或154所示的一种序列。
[0491] 实施例44:克隆:从嗜柠檬酸明串珠菌(Leuconostoc citreum)ATCC11449中PCR扩增出编码葡聚糖蔗糖酶的基因,并将其克隆到pET23a中
[0492] 生长条件:将BL21 Codon Plus RIL菌株在37℃,250rpm的2xYT中生长,直到OD600为1。加入10mM乳糖诱导,在室温下以150rpm孵育过夜。用于反应的粗提取物是通过超声或渗透冲击获得的。
[0493] 在一些实施方案中,葡聚糖蔗糖酶包含或由SEQ ID NOs:2、103、106-110、156和896中任一个的氨基酸序列组成。在一些实施方案中,DexT包含SEQ ID NO:103中所示的氨基酸序列。在一些实施方案中,DexT包含SEQ ID NO:104或SEQ ID NO:105所示的核酸序列。
[0494] 实施例45:罗汉果苷IIIE与变形链球菌(Smutans)Clarke ATCC25175葡聚糖蔗糖酶的反应以产生化合物1
[0495] 生长条件:如Wenham、Henessey和Cole(1979)所述,通过添加葡萄糖使上述菌株厌氧生长,以刺激葡聚糖蔗糖酶的产生。向生长培养基中加入5mg/ml罗汉果苷IIIE。取时间点样品用于HPLC分析。HPLC数据在图2中以化合物1的产生的质谱图表示。
[0496] 实施例46:罗汉果苷IIIE与CGTase的反应
[0497] 在1ml反应体积中,用搅拌棒混合5mg的罗汉果苷IIIE、50mg的可溶性淀粉、0.1M的NaOAC pH 5.0、125ul的酶和水,用搅拌棒下混合,并在50℃下孵育。取时间点样品用于HPLC分析。使用的酶是CGTase。如图1所示,在HPLC数据和质谱数据中可以看到化合物1产物。质量峰对应于化合物1的大小。
[0498] 实施例47:罗汉果苷IIIE与Celluclast的反应
[0499] 用罗汉果苷IIIE和来自天然宿主里氏木霉(Trichoderma reesei)的celluclast进行Celluclast糖基化
[0500] 反应条件:将5mg的罗汉果苷IIIE、100mg的木聚糖、50ul的Celluclast以1ml的总体积与0.1M的乙酸钠pH 5.0混合,在50℃下搅拌孵育。取时间点样品用于HPLC分析。
[0501] 木糖基化产物如图3高亮所示。来自木糖基化的产物可以用作化合物1的产生中的中间体。Celluclast的序列包含在表1中,并且在本文中用于木糖基化产物的产生。
[0502] 实施例48:糖基转移酶(麦芽三糖基转移酶)(天然宿主:芽孢杆菌(Geobacillus sp.)APC9669)
[0503] 在该实施例中,使用了糖基转移酶AGY15763.1(Amano Enzyme U.S.A.Co.,Ltd.,伊利诺伊州;SEQ ID NO:434,参见表1)。将20mL去离子水、0.6ml 0.5M MES pH 6.5、6g可溶性淀粉、150mg罗汉果苷IIIE和3ml酶添加到40ml平底螺旋盖小瓶中。将小瓶用黑帽密封,在30℃下孵育,并使用磁力棒以500rpm的转速搅拌。以600mg的罗汉果苷IIIE为原料,又进行了3个相同的反应。24小时后停止反应。通过离心(4000rpm 5分钟,Eppendorf)除去不溶性淀粉。在搅拌(500rpm)下,将上清液加热至80℃30分钟,然后离心(4000rpm 10分钟,Eppendorf)。将上清液通过250毫升0.22微米PES过滤并通过LC-MS检查(Sweet Naturals 
2016-Enzymatic_2016Q4_A.SPL,第1254行)以获得HPLC数据。
[0504] AGY15763.1蛋白(SEQ ID NO:434)可以由天然gDNA(SEQ ID NO:437)或经密码子优化的(对于大肠杆菌)DNA序列(SEQ ID NO:438)编码。
[0505] 预期反应性类似的其他糖基转移酶的实例来自甜叶菊(Stevia rebaudiana)(SEQ ID NO:439)的UGT76G1蛋白,其可以在大肠杆菌中表达。SEQ ID NO:440提供了UGT76G1(SEQ ID NO:439)的天然编码序列。
[0506] 实施例49:在罗汉果醇存在下的UDP-糖基转移酶UGT73C5
[0507] 罗汉果醇与UDP-糖基转移酶反应,产生了罗汉果苷I和罗汉果苷II。将1mg/ml的罗汉果醇与200ul含UGT73C5(拟南芥(A.thaliana))(334)的粗提物、2ul含蔗糖合酶的粗提物、5mM UDP、1x M221蛋白酶抑制剂、200mM蔗糖、0.5mg/ml大观霉素的粗提物在0.1M Tris-HCl pH7.0中反应,在30℃下孵育。2天后取样用于HPLC分析。如图4和图5所示,反应产物从罗汉果醇到罗汉果苷I和罗汉果苷II。
[0508] UGT73C5的蛋白质序列示于SEQ ID NO:441,UGT73C5的天然DNA编码序列(SEQ ID NO:441)示于SEQ ID NO:442,UGT73C5编码序列(针对大肠杆菌优化的密码子))示于SEQ ID NO:443。
[0509] 实施例50:在罗汉果醇存在下的UDP-糖基转移酶(UGT73C6)以产生罗汉果苷I
[0510] 反应条件:使1mg/ml的罗汉果醇与200ul含有UGT73C6的粗提物、2ul含蔗糖合酶的粗提物、5mM UDP、1x M221蛋白酶抑制剂、200mM的蔗糖、0.5mg/ml的大观霉素在0.1M Tris-HCl pH7.5中反应,在30℃下孵育。2天后取样用HPLC分析。反应产物是来自罗汉果醇的罗汉果苷I。如图6的HPLC数据和质谱数据所示。
[0511] 蛋白和编码拟南芥(A.thaliana)UGT73C6的gDNA序列分别示于SEQ ID NO:444和SEQ ID NO:445。
[0512] 实施例51:在罗汉果醇存在下的UDP-糖基转移酶(338)以产生罗汉果苷I、罗汉果苷IIA和两种不同罗汉果苷III产物
[0513] 反应条件:使1mg/ml的罗汉果醇或罗汉果苷IIA与200ul含有338的粗提物、2ul含蔗糖合酶的粗提物、5mM UDP、1x M221蛋白酶抑制剂、200mM蔗糖、0.5mg/ml大观霉素在0.1M Tris-HCl pH8.5中反应,在30℃下孵育。2天后取样品进行HPLC分析。
[0514] 罗汉果醇与芽孢杆菌(Bacillus sp.)UDP-糖基转移酶(338)的反应(在Pandey等人,2014中描述;文献以引用方式并入本文)得到反应产物:罗汉果苷I、罗汉果苷IIA和两种不同的罗汉果苷III产物。图7-9显示了反应后获得的产物的HPLC和质谱数据。图8显示了与罗汉果醇IIA大小相关的峰。
[0515] 蛋白和编码UGT 338的gDNA序列分别在SEQ ID NO:405和SEQ ID NO:406中示出。
[0516] 实施例52:在罗汉果苷IIIE存在下的UDP-糖基转移酶(301(UGT98))以产生赛门苷I和罗汉果苷V
[0517] 反应条件:使1mg/ml的罗汉果苷IIIE与200ul含有301的粗提物、2ul含蔗糖合酶的粗提物、5mM UDP、1x M221蛋白酶抑制剂、200mM蔗糖、0.5mg/ml大观霉素在0.1M Tris-HCl pH7.0中反应,在30℃下孵育。2天后取样以进行HPLC和质谱分析。如图10-11所示,罗汉果苷IIIE的反应产物是赛门苷I和罗汉果苷V。
[0518] 蛋白和编码罗汉果(S grosvenorii)301UGT98的gDNA序列分别在SEQ ID NO:407和SEQ ID NO:408中示出。
[0519] 实施例53:在罗汉果醇、赛门苷I或化合物1存在下的UDP-糖基转移酶(339)以由罗汉果醇产生罗汉果苷I、由赛门苷I产生异罗汉果苷V、以及由化合物1产生化合物1衍生物[0520] 反应条件:使1mg/ml的罗汉果醇l、赛门苷I或化合物1与200ul含339的粗提物(在Itkin等人中描述,文献以引用方式并入本文)、2ul含蔗糖合酶的粗提物、5mM UDP、1x M221蛋白酶抑制剂、200mM蔗糖、0.5mg/ml大观霉素在0.1M Tris-HCl pH7.0中反应,在30℃下孵育。2天后取样品进行HPLC分析。
[0521] 来自罗汉果醇的反应产物得到罗汉果苷I,赛门苷I获得异罗汉果苷V,并且化合物1得到化合物1衍生物(图12-14)。
[0522] 蛋白和编码罗汉果(S.grosvenorii)UGT339的DNA序列分别在SEQ ID NO:409和SEQ ID NO:410中示出。
[0523] 实施例54:在罗汉果苷IIA、罗汉果苷IIE、罗汉果苷IIIE、罗汉果苷IVA或罗汉果苷IVE存在下的UDP-糖基转移酶(330)以产生罗汉果苷IIIA、罗汉果苷IVE和罗汉果苷V
[0524] 如本文所述,使用如Noguchi等人,2008(文献以引用方式并入本文)所述的UDP-糖基转移酶(330)获得反应产物罗汉果苷IIIA、罗汉果苷IVE、罗汉果苷V。天然宿主为芝麻(Sesamum indicum),生产宿主为SF9。对于该反应,将1mg/ml的罗汉果苷IIA、罗汉果苷IIE,罗汉果苷IIIE、罗汉果苷IVA或罗汉果苷IVE与200ul含330的粗提物、2ul含蔗糖合酶的粗提物、5mM UDP、1x M221蛋白酶抑制剂、200mM蔗糖、0.5mg/ml大观霉素在0.1M Tris-HCl pH7.0中反应,在30℃下孵育。2天后取样用HPLC分析。
[0525] 反应产生令人惊讶的产物,例如罗汉果苷IIIA、罗汉果苷IVE、罗汉果苷V。如图15-20所示,所产生的化合物的大小对应于罗汉果苷IIIA、罗汉果苷IVE和罗汉果苷V。
[0526] 蛋白和编码罗汉果(S.grosvenorii)UGT330蛋白的gDNA序列分别在SEQ ID NO:411和SEQ ID NO:412中示出。
[0527] 实施例55:在罗汉果苷IIA、罗汉果苷IIE、罗汉果苷IIIE、罗汉果苷IVA或罗汉果苷IVE存在下的UDP-糖基转移酶(328)(描述于Itkin等人中)以产生罗汉果苷IIIA、罗汉果苷IVE和罗汉果苷V
[0528] 反应条件:使1mg/ml的罗汉果苷IIIE与200ul含有330的粗提物、2ul含蔗糖合酶的粗提物、5mM UDP、1x M221蛋白酶抑制剂、200mM蔗糖、0.5mg/ml大观霉素在0.1ul Tris-HCl pH7.0中反应,在30℃下孵育。2天后取样品进行HPLC分析。
[0529] 反应产物是罗汉果苷IVE和罗汉果苷V。如图21-22所示,质谱数据中的产物大小对应于罗汉果苷IVE和罗汉果苷V。罗汉果(S.grosvenorii)UGT328蛋白(糖基转移酶)和其编码序列分别在SEQ ID NO:413和414中示出。
[0530] 蔗糖合酶AtSus1蛋白序列和编码AtSus1蛋白的gDNA分别在SEQ ID NO:415和416中示出。
[0531] 实施例56:酵母中的罗汉果醇的产生
[0532] DNA是通过基因合成获得的,无论是通过Genescript还是IDT。对于某些葫芦二烯醇合酶,通过10~60日龄的幼苗获得cDNA或基因组DNA,然后使用特异性和简并引物(degenerate primers)进行PCR扩增。通过标准分子生物学技术将DNA克隆到以下过表达载体之一中:pESC-Ura,pESC-His或pESC-LEU。酿酒酵母菌株YHR072(erg7的杂合子)购自GE Dharmacon。使用Zymo酵母转化试剂盒II转化/共转化含有罗汉果醇合成基因的质粒(pESC载体)。菌株在含有2%葡萄糖或2%半乳糖的适当选择的标准培养基(YPD或SC)中培养,在
30℃、220rpm下诱导异源基因。当指示时,加入羊毛甾醇合酶)抑制剂Ro48-8071(Cayman Chemicals)(50ug/ml)。诱导2天后,产生了罗汉果醇及其前体的酵母,然后进行裂解(Yeast Buster)、乙酸乙酯萃取、干燥、并悬浮于甲醇中。通过HPLC分析样品。
[0533] 葫芦二烯醇合酶罗汉果(S grosvernorii)SgCbQ在无抑制剂的生长条件下催化葫芦二烯醇的产生。
[0534] 在HPLC和质谱数据中显示了葫芦二烯醇的产生,其显示了所指示产物的质量峰(图23)。蛋白序列和编码罗汉果(S.grosvernorii)SgCbQ的DNA序列分别在SEQ ID NO:446和418中示出。
[0535] Cpep2也用于在酵母中产生葫芦二烯醇。如图24所示,质谱图显示了与葫芦二烯醇相对应的峰和特征片段。Cpep2的蛋白序列和编码Cpep2蛋白的DNA序列分别在SEQ ID NO:420和421中示出。
[0536] 美洲南瓜(Cucurbita pepo)(Jack O’Lantern)Cpep4也用于在没有抑制剂的生长条件下制备葫芦二烯醇。在图24和图25所示的质谱数据中显示了葫芦二烯醇的产生。如图所示,峰和片段与葫芦二烯醇对应。蛋白序列和编码Cpep4的DNA序列分别在SEQ ID NO:422和423中提供。
[0537] 代表Cmax的葫芦二烯醇合酶蛋白序列是从天然宿主笋瓜(C maxima)中获得的。推导的编码DNA序列将用于基因合成和表达。蛋白质的葫芦二烯醇合酶序列和编码葫芦二烯醇合酶的DNA如下所示:
[0538] 下面的蛋白质和DNA编码序列是通过将基因组DNA PCR产物序列与可从公共数据库(Pubmed)获得的已知葫芦二烯醇合酶序列进行比对而获得的。预期这些Cmax蛋白中的任何一种均可用于本文公开的方法、体系、组合物(例如宿主细胞)中,以产生化合物1。非限制性示例性Cmax蛋白是由Cmax1(DNA)(SEQ ID NO:424)编码的Cmax1(蛋白)(SEQ ID NO:425)。
[0539] 代表Cmos1的推测的葫芦二烯醇合酶蛋白序列获自天然宿主中国南瓜(Cucurbita moschata)。推导的编码DNA序列用于基因合成和表达。通过将基因组DNA PCR产物序列与可从公共数据库(Pubmed)获得的已知葫芦二烯醇合酶序列进行比对,可以获得以下所示的蛋白质和DNA编码序列。这些Cmos蛋白中的任何一种均可用于本文公开的方法,系统、组分(例如宿主细胞)中,以产生化合物1。非限制性示例性Cmos1蛋白为由Cmos1(DNA)(SEQ ID NO:427)编码的Cmos1(蛋白)(SEQ ID NO:426)。
[0540] 实施例57:酵母(葫芦二烯醇合酶和环氧化物水解酶)中二羟基葫芦二烯醇的产生[0541] 考虑使用葫芦二烯醇合酶和环氧化物水解酶在酵母中产生二羟基葫芦二烯醇。这些酶的天然宿主是罗汉果(S.grosvenorii)。
[0542] 生长条件:在羊毛甾醇合酶抑制剂的存在下,SgCbQ与环氧水解酶(EPH)共表达。
[0543] 可能的二羟基葫芦二烯醇产品如图26所示。
[0544] EPH蛋白序列和编码EPH蛋白的DNA(密码子优化的酿酒酵母)分别在SEQ ID NO:428和429中示出。
[0545] 实施例58:由葫芦二烯醇合酶、环氧化物水解酶、细胞色素P450和细胞色素P450还原酶产生罗汉果醇
[0546] 在酿酒酵母中共表达四种酶,包括葫芦二烯醇合酶、环氧化物水解酶、细胞色素P450和细胞色素P450还原酶。对于生长条件,在羊毛甾醇合酶抑制剂存在下,共表达了SgCbQ、EPH、CYP87D18和AtCPR(来自拟南芥的细胞色素P450还原酶)。预计通过酿酒酵母产生罗汉果醇。蛋白序列和编码SgCbQ、EPH、CYP87D18和AtCPR(来自拟南芥的细胞色素P450还原酶)的DNA序列是:CYP87D18(蛋白)(SEQ ID NO:430)和CYP87D18(DNA)(SEQ ID NO:431);和AtCPR(蛋白)(SEQ ID NO:432)和AtCPR(DNA)(SEQ ID NO:433)。
[0547] 实施例59:化合物1能耐受微生物水解
[0548] 在补充有1mg/ml罗汉果苷V或化合物1的YPD中孵育酵母菌株酿酒酵母(Saccharomyces cerevisiae)、解脂耶氏酵母(Yarrowia lipolytica)和熊蜂生假丝酵母(Candida bombicola)。3天后,通过HPLC分析上清液。
[0549] 如HPLC数据所示,环氧化物水解酶将罗汉果苷V水解为罗汉果苷IIIE。化合物1未观察到水解产物(图37)。
[0550] 实施例60:变形链球菌(Streptococcus mutans)Clarke ATCC 25175葡聚糖蔗糖酶
[0551] 变形链球菌(Streptococcus mutans)Clarke可通过补充葡萄糖而厌氧生长。生长条件的一个例子可以在Wenham、Henessey和Cole(1979)中找到,其中该方法用于刺激例如葡聚糖蔗糖酶的产生。向生长培养基中加入5mg/ml罗汉果苷IIIE。例如,可以采用HPLC监测时间点样品。各种葡聚糖蔗糖酶的序列可在表1中找到,其包括葡聚糖蔗糖酶的蛋白序列和编码葡聚糖蔗糖酶的核酸序列(例如,SEQ ID NO:157-162)。在一些实施方案中,葡聚糖蔗糖酶包含或由SEQ ID NO:2、103、106-110、156和896中任一个的氨基酸序列组成。在一些实施方案中,DexT包含SEQ ID NO:103所示的氨基酸序列。在一些实施方案中,DexT包含SEQ ID NO:104或105所示的核酸序列。在一些实施方案中,本文的重组细胞编码包含SEQ ID NO:156-162中任一个所示序列的蛋白质,和/或包含编码葡聚糖蔗糖酶的核酸序列。本实施例用于产生化合物1。
[0552] 实施例61:90%纯的化合物1的产生步骤和感官评估
[0553] 通过用葡聚糖蔗糖酶/葡聚糖酶反应处理罗汉果苷IIIE(MIIIE),然后进行SPE分馏,获得包含3种α-罗汉果苷异构体的混合物的馏分。基于UPLC分析,该混合物分别具有5:90:5%比例的3种异构体,即11-氧代化合物1、化合物1和罗汉果苷V异构体。对通过LC-MS、
1D和2D NMR光谱不同馏分/来源进行的纯化以及通过对文献中报道的罗汉果苷系列中密切相关的异构体的对比表征了这三种异构体。通过使用三角检验(triangle test)与纯的化合物1样品进行比较,进一步评估该样品的感官。
[0554] 酶反应及纯化步骤
[0555] 将100mL的pH 5.51M乙酸钠缓冲液、200g的蔗糖、100mL的葡聚糖这样酶DexT(1mg/ml的粗提物、pET23a、BL21-Codon Plus-RIL、在2X YT中生长)、12.5g的罗汉果苷IIIE和600mL水加入到2.8L摇瓶中,并在30℃、200rpm下摇瓶。通过LC-MS定期监测反应进程。72小时后,反应用2.5mL葡聚糖酶(Amano)处理,并在30℃下继续摇动烧瓶。24小时后,将反应混合物在80℃加热下淬灭,并以5000rpm离心5分钟,然后过滤上清液,直接加到400g C18 SPE柱上,并使用MeOH:H2O 5/25/50/75/100梯度洗涤。梯度的每个步骤收集在6个广口瓶中,每个广口瓶收集225mL。将目标产物在第二个罐中用75%MeOH馏分(SPE 75_2)洗脱,并在减压下干燥。将其进一步悬浮/溶解在7mL H2O中,冷冻并冻干小瓶3天,得到1.45g白色固体。
[0556] 根据UPLC分析(图28和图29),混合物分别以5:90:5%的比率具有3种特征化的α-罗汉果苷异构体;11-氧代化合物1、化合物1和罗汉果苷V异构体。根据1H和13C-NMR(吡啶-d5+D2O)分析,未观察到残留的溶剂和/或结构上无关的杂质。
[0557] 感官评估
[0558] 在2016年11月10日进行了纯的化合物1与90%纯的化合物1的三角检验。对两种不同的组成:(1)LSB+175ppm纯的化合物1(标准)和(2)LSB+175ppm 90%纯的化合物1进行了测试。用pH约7.1并包含0%乙醇的低钠缓冲液(LSB)制备组合物的所有样品。
[0559] 结论:专家们发现,组成(1)LSB+175ppm纯的化合物1(标准)与组成(2)LSB+175ppm的90%纯的化合物1(测试)并无显著差异(p>0.05)。表2-4列出了一些测试分析结果。
[0560] 表2.正确选择其他样品的小组成员(panelists)的频率。n=38(19小组成员x2 reps)。
[0561]样品 总计
错误 24
正确 14
总计 38
选出的正确样品(p-value) 0.381
[0562] 表3.分析结果:测试日
[0563] 理论#(μM) 观察(μM)175ppm(155.51uM)纯_化合物1(标准) 132.20±1.54(n=2)
175ppm(155.56uM)90%_纯_化合物1(测试) 157.62±0.63(n=2)
[0564] 表4.分析结果:试验前一天
[0565]理论#(μM) 观察(μM)
175ppm(155.51uM)纯_化合物1(标准) 134.48±7.31(n=2)
175ppm(155.56uM)90%_纯_化合物1(测试) 140.69±4.34(n=2)
[0566] 实施例62:重组酵母细胞中的基因表达
[0567] DNA是通过基因合成获得的,无论是通过Genescript、IDT还是Genewiz。对于某些葫芦二烯合酶,通过10~60日龄的幼苗获得cDNA或基因组DNA,然后使用特异性和简并引物进行PCR扩增。通过标准分子生物学技术或酵母缺口修复克隆(Joska等,2014)将DNA克隆到以下过表达载体之一:pESC-Ura,pESC-His或pESC-LEU。基因表达受到以下启动子之一的调控:Gal1,Gal10,Tef1或GDS。使用Zymo酵母转化试剂盒II进行酵母转化。酵母菌株在标准培养基(YPD或SC)中生长,该培养基含有适当选择的2%葡萄糖或2%半乳糖以诱导异源基因。酵母菌株在30℃、140-250rpm的摇瓶或96孔板中生长。当指示时,加入羊毛甾醇合酶抑制剂Ro 48-8071(Cayman Chemicals)(50ug/ml)。通过裂解(Yeast Buster)、乙酸乙酯萃取、干燥、并悬浮在甲醇中,产生了罗汉果醇及其前体的酵母。使用A/B梯度(A=H2O,B=乙腈),通过下述LCMS方法分析样品:
[0568] 为了分析二环氧角鲨烯,LCMS方法包括使用C18 2.1x50mm色谱柱,5%B持续1.5min,梯度5%至95%B或5.5min,95%B持续6min,100%B持续进行3分钟,5%B持续1.5分钟,所有流速均为0.3ml/min。
[0569] 为了分析葫芦二烯醇,第一种LCMS方法包括使用C4 2.1x100mm色谱柱、梯度1至95%B持续6分钟、流速为0.55ml/min。第二种LCMS方法包括使用Waters Acquity UPLC蛋白BEH C4 2.1x100mM、1.7um,带防护罩,62%至67%B持续2分钟,100%B持续1分钟,流速为
0.9ml/min。
[0570] 为了分析11-OH葫芦二烯醇,LCMS方法包括使用C8 2.1x100mm色谱柱,以60%至90%B的梯度以0.55ml/min的流速进行6分钟。
[0571] 为了分析罗汉果醇,LCMS方法包括使用C8 2.1x100mm色谱柱,以50至90%B梯度以0.55ml/min的流速进行6分钟
[0572] 为了分析罗汉果苷IIIE和化合物1,LCMS方法包括使用氟苯基2.1x100mm色谱柱,以15%至30%B的梯度以0.55ml/min的流速进行6分钟。
[0573] 实施例63:
[0574] 第一步:提高氧化角鲨烯的利用率
[0575] 酿酒酵母菌株YHR072(羊毛甾醇合酶erg7的杂合子)购自GE Dharmacon。通过用cup1替换启动子,可降低活性erg7基因的表达(Peng等,2015)。在GDS启动子的控制下截短的酵母HMG-CoA还原酶(tHMG-CoA)和在Tef1启动子的控制下酵母角鲨烯环氧酶(erg1)被整合到基因组中。如HPLC和UV吸光度所示,通过生成二环氧角鲨烯来监测氧化角鲨烯的增强作用(图31)。
[0576] tHMG-CoA(蛋白质)SEQ ID NO:898(途径1)
[0577] tHMG-CoA(DNA)SEQ ID NO:897(途径1)
[0578] Erg1(蛋白质)SEQ ID NO:900;Erg1(DNA)SEQ ID NO:899
[0579] 在一些实施方案中,tHMG-CoA酶用于生产二环氧角鲨烯。
[0580] 选择罗汉果(S.grosvenorii)(Itkins等人,2016)中所假定的角鲨烯环氧化酶的基因,以促进氧化氧化鲨烯/二环氧角鲨烯的产生。表1中列出了3种角鲨烯环氧酶的氨基酸序列和编码序列(SEQ ID NO:50-56、60、61、334或335)。适用于在本文中公开的方法、体系和组合物中的角鲨烯环氧化酶的其他序列包括:SQE1(蛋白质)SEQ ID NO:908,SQE1(DNA)SEQ ID NO:909;SQE2(蛋白质)SEQ ID NO:910,SQE2(DNA)SEQ ID NO:911;SQE3(蛋白质)SEQ ID NO:912,和SQE3(DNA)SEQ ID NO:913,上述方法、体系和组合物是用于产生氧化角鲨烯和/或二环氧角鲨烯、和用于提高氧化角鲨烯和/或二环氧角鲨烯的产量。
[0581] 第2步.葫芦二烯醇的的产生
[0582] 葫芦二烯醇合酶
[0583] 将含有罗汉果(S.grosvernorii)葫芦二烯醇合酶基因(SGCBQ)的质粒转化到提高了氧化角鲨烯的酵母菌株中。菌株在30℃、150-250rpm下生长1-3天。葫芦二烯醇的产生在HPLC和质谱数据中显示,该数据显示了所示产物的质量峰(图23)。SEQ ID NO:446和SEQ ID NO:418分别提供了SgCbQ蛋白和编码SgCbQ的gDNA。美洲南瓜(Cucurbita pepo)(Jack O’Lantern)蛋白Cpep2也用于在酵母中产生葫芦二烯醇。图24显示了质谱图,其中包含与葫芦二烯醇相对应的峰和特征片段。Cpep2蛋白和编码Cpep2的DNA分别在SEQ ID NO:420和SEQ ID NO:421中提供。美洲南瓜(Cucurbita pepo)(Jack O’Lantern)蛋白Cpep4也用于产生葫芦二烯醇。在无抑制剂的生长条件下培养宿主细胞。在图25所示的质谱数据中证明了葫芦二烯醇的产生。如图所示,峰和片段对应于葫芦二烯醇。Cpep4蛋白和编码Cpep4的DNA分别在SEQ ID NO:422和SEQ ID NO:423中提供。笋瓜(Cucurbita maxima)蛋白Cmax也用于在酵母中产生南瓜二烯醇。图32显示了质谱图,其中包含与葫芦二烯醇相对应的峰和特征片段。Cmax1蛋白序列在SEQ ID NO:424中提供,并且Cmax1(DNA)的编码序列在SEQ ID NO:425中提供。厚皮甜瓜Cucumis meloCmelo也用于在酵母中生产葫芦二烯醇。图32显示了质谱图,其中包含与葫芦二烯醇相对应的峰和特征性片段。Cmelo蛋白序列在SEQ ID NO:902中提供,Cmelo(DNA)的编码序列在SEQ ID NO:901中提供。预期中国南瓜(Cucurbita moschata)蛋白Cmos1也可用于重组宿主细胞例如酵母细胞中的葫芦二烯醇的产生。Cmos1序列Cmos1(蛋白质)(SEQ ID NO:426)和Cmos1(DNA)(SEQ ID NO:427)是通过将基因组DNA PCR产物序列与已知的葫芦二烯醇合酶序列进行比对而获得的,该序列可通过公共数据库(Pubmed)获得。预期Cmost1蛋白(SEQ ID NO:426)可用于重组宿主细胞例如酵母细胞中的葫芦二烯醇的产生。
[0584] 将其他氧化角鲨烯环化酶转化为葫芦二烯醇合酶
[0585] 将含有修饰的氧化角鲨烯基因的质粒转化为提高了氧化角鲨烯的酵母菌株。菌株在30℃,150-250rpm下生长1-3天。
[0586] 来自天然宿主豌豆(Pisum sativum)的蛋白质PSX Y118L也用于在酵母中生产葫芦二烯醇。图33示出了质谱图,其包含当位置118处的酪氨酸转化为亮氨酸时对应于葫芦二烯醇的峰和特征片段。蛋白质和编码修饰的氧化角鲨烯环化酶的DNA的序列为:PSXY118L(蛋白质)(SEQ ID NO:904)和PSXY118L(DNA,密码子优化)(SEQ ID NO:903)。
[0587] 来自盘基网柄菌(Dictyostelium sp.)的氧化角鲨烯环化酶也用于酵母中葫芦二烯醇的产生。如图34所示,葫芦二烯醇的HPLC峰是在80位酪氨酸转化为亮氨酸时出现的。蛋白质和编码修饰的氧化角鲨烯环化酶的DNA的序列是:DdCASY80L(蛋白质)(SEQ ID NO:906)和DdCASY80L(DNA)(SEQ ID NO:905)。
[0588] 改善葫芦二烯醇合酶活性
[0589] 对编码厚皮甜瓜(Cucumis melo)形式的葫芦二烯醇合酶的基因(SEQ ID:907)进行密码子优化,并用作产生修饰库的起点。通过标准分子生物学技术引入修饰,该技术由位于酶N端(即5')或C端(即3')末端的融合肽组成。将经修饰的葫芦二烯醇合酶基因的质粒库转化到提高了氧化角鲨烯的酵母菌株中。使用上述LCMS方法2,通过在葫芦二烯醇与内标的预期保留时间处峰高或409和427阳性质量碎片的峰高或面积之比进行酶活性的测量。酶性能的评分为:相对于母体酶的平均活性(n=8)的平均活性%。酶的步骤1序列和编码该酶的序列可以在SEQ ID Nos:951-1012中找到。步骤1序列还包括融合体SS2c-G10,SS2e-A7b,SS2d-G11,SS2e-A7a,SS4d-G5,SS4d-C7,SS3b-D8和SS2c-A10a,如表1所述。
[0590] 第三步11-OH葫芦二烯醇的产生
[0591] CYP87D18(CYP450,罗汉果(S.grosvenorii))和SgCPR(CYP450还原酶,罗汉果(S.grosvenorii))在酿酒酵母菌株中产生葫芦二烯醇。使用HPLC和质谱数据观察到11-OH葫芦二烯醇(即11-羟基葫芦二烯醇)(图36)。罗汉果(S.grosvenorii)CYP87D18蛋白质序列显示在SEQ ID NO:872中,而CYP87D18(密码子优化的DNA)编码序列显示在SEQ ID NO:871中。罗汉果(S.grosvenorii)SgCPR蛋白序列示于SEQ ID NO:874中,SgCPR1(密码子优化的DNA)编码序列示于SEQ ID NO:873中。
[0592] 来自罗汉果(S.grosvenorii)和甘草(Glycyrrhiza)(CYP88D6)的其他CYP450(CYP88D6)在由酿酒酵母菌株中产生的葫芦二烯醇中表达。酶的蛋白质序列和DNA编码序列在SEQ ID NO:875-890中提供。
[0593] 步骤4.罗汉果醇的产生
[0594] CYP1798(CYP450酶,罗汉果(S.grosvenorii))和EPH2A(环氧水解酶,罗汉果(S.grosvenorii))在酿酒酵母菌株中表达以产生11-OH葫芦二烯醇。使用HPLC和质谱数据观察到了罗汉果醇(图36)。对于序列,酶的DNA编码和蛋白质序列在SEQ ID NO:891-894中提供。
[0595] 葫芦二烯醇和/或11-OH葫芦二烯醇的环氧化
[0596] 来自罗汉果(S.grosvenorii)和甘草(Glycyrrhiza)(CYP88D6)的其他CYP450和SQEs(CYP88D6)也在由酿酒酵母菌株中产生的葫芦二烯醇或11-OH葫芦二烯醇中表达,以测试环氧化反应。
[0597] 对于SQE,该酶的蛋白质和DNA编码序列在SEQ ID NO:882-888中提供。对于CYP450,酶的蛋白质和DNA编码序列在SEQ ID NO:875-890中提供。
[0598] 步骤7:在酿酒酵母中从罗汉果苷IIIE产生化合物1。
[0599] 将表达截短的葡聚糖蔗糖酶(tDexT)的酿酒酵母菌株在含有7mg/ml罗汉果苷V的YPD(30C,250rpm)中孵育1-2天,从而水解成罗汉果苷IIIE。收获酿酒酵母细胞,裂解,然后与含有罗汉果苷IIIE的YPD上清液混合。为了开始葡聚糖蔗糖酶反应,加入蔗糖至终浓度为200g/L,然后在30℃,250rpm下孵育2天。使用HPLC观察到化合物1的产生(图37)。tDexT的蛋白质序列在SEQ ID NO:896中显示,而tDexT的DNA编码序列在SEQ ID NO.895中显示。
[0600] 实施例64
[0601] 酿酒酵母(S.cerevisiae)或解脂耶氏酵母(Y.lipolytica.)在罗汉果苷V存在下生长,以使酵母中的水解酶产生罗汉果苷IIIE。1或2天后,通过HPLC分析裂解细胞以确定罗汉果苷含量。孵育1天后,酿酒酵母产生了罗汉果苷V、罗汉果苷IV和罗汉果IIIE的混合物。孵育2天后,基本上所有的罗汉果苷都转化为罗汉果苷IIIE,如图40A所示。
[0602] 类似地,孵育2天后,解脂耶氏酵母(Y.lipolytica.)主要产生罗汉果苷IIIE(如图40B所示)。
[0603] 实施例65
[0604] 酿酒酵母(S.cerevisiae)或解脂耶氏酵母(Y.lipolytica.)在化合物1的存在下生长。与其他罗汉果苷(参见实施例64)不同,未观察到由于化合物1的水解而产生的水解产物,如图41所示。
[0605] 实施例66
[0606] 酿酒酵母(S.cerevisiae)被修饰以过表达葡聚糖蔗糖酶(DexT)。该修饰的菌株在罗汉果苷混合物的存在下生长,以使酿酒酵母中的水解酶产生罗汉果苷IIIE。孵育2天后,裂解细胞以释放DexT酶,并补充蔗糖。24小时后,产生了大量化合物1(如图42所示)
[0607] 实施例67:具有葫芦二烯醇合酶活性的融合蛋白的产生
[0608] 制备了葫芦二烯醇合酶基因(SEQ ID NO:907中提供的DNA编码序列,以及SEQ ID NO:902中提供的蛋白序列)的酿酒酵母(S.cerevisiae)框内(in-frame)融合多核苷酸的集合或库。将框内融合多核苷酸克隆到酵母载体分子中以产生融合蛋白。
[0609] 产生了多种融合蛋白并测试了葫芦二烯醇合酶的活性。表2显示了该实施例中产生的一些融合蛋白的测试结果。
[0610] 表2融合蛋白的葫芦二烯醇合酶活性
[0611]
[0612] 实施例68:在罗汉果苷IIIE、罗汉果苷IVE或罗汉果苷IVA存在下的UDP-糖基转移酶(311酶,SEQIDs:436-438)以产生罗汉果苷IV和罗汉果苷V异构体
[0613] 反应条件:向装有17ml水、3ml pH 7.01M Tris-HCl、0.12g UDP(Carbosynth)、3g蔗糖、300ul蛋白酶抑制剂100x M221、150ul卡那霉素(50mg/ml)的50ml Falcon管中加入1.185ml蔗糖合酶Sus1(1mg/ml粗提物)、150mg起始罗汉果苷和6ml 311酶(1mg/ml粗提物),并在30℃、150rpm下孵育。通过LC-MS定期监测反应进程。3天后,通过在搅拌(500rpm)下加热至80℃、30分钟来终止反应。然后离心反应(4000rpm10分钟,Eppendorf),并将上清液通过50ml 0.22微米PVDF过滤。所识别的反应产物如图43所示。
[0614] 表1:本文公开的一些蛋白质和DNA序列
[0615]
[0616]
[0617]
[0618]
[0619]
[0620]
[0621]
[0622]
[0623]
[0624]
[0625]
[0626]
[0627]
[0628]
[0629]
[0630]
[0631]
[0632]
[0633]
[0634]
[0635]
[0636]
[0637]
[0638]
[0639]
[0640]
[0641]
[0642]
[0643]
[0644]
[0645]
[0646]
[0647]
[0648]
[0649]
[0650]
[0651]
[0652]
[0653]
[0654]
[0655]
[0656]
[0657]
[0658]
[0659]
[0660]
[0661]
[0662]
[0663]
[0664]
[0665]
[0666]
[0667]
[0668]
[0669]
[0670]
[0671]
[0672]
[0673]
[0674]
[0675]
[0676]
[0677]
[0678]
[0679]
[0680]
[0681]
[0682]
[0683]
[0684]
[0685]
[0686]
[0687]
[0688]
[0689]
[0690]
[0691]
[0692]
[0693]
[0694]
[0695]
[0696]
[0697]
[0698]
[0699]
[0700]
[0701]
[0702]
[0703]
[0704]
[0705]
[0706]
[0707]
[0708]
[0709]
[0710]
[0711]
[0712]
[0713]
[0714]
[0715]
[0716]
[0717]
[0718]
[0719]
[0720]
[0721]
[0722]
[0723]
[0724]
[0725]
[0726]
[0727]
[0728]
[0729]
[0730]
[0731]
[0732]
[0733]
[0734]
[0735]
[0736]
[0737]
[0738]
[0739]
[0740]
[0741]
[0742]
[0743]
[0744]
[0745]
[0746]
[0747]
[0748]
[0749]
[0750]
[0751]
[0752]
[0753]
[0754]
[0755]
[0756]
[0757]
[0758]
[0759]
[0760]
[0761]
[0762]
[0763]
[0764]
[0765]
[0766]
[0767]
[0768]
[0769]
[0770]
[0771]
[0772]
[0773]
[0774]
[0775]
[0776]
[0777]
[0778]
[0779]
[0780]
[0781]
[0782]
[0783]
[0784]
[0785]
[0786]
[0787]
[0788]
[0789]
[0790]
[0791]
[0792]
[0793]
[0794]
[0795]
[0796]
[0797]
[0798]
[0799]
[0800]
[0801]
[0802]
[0803]
[0804]
[0805]
[0806]
[0807]
[0808]
[0809]
[0810]
[0811]
[0812]
[0813]
[0814]
[0815]
[0816]
[0817]
[0818]
[0819]
[0820]
[0821]
[0822]
[0823]
[0824]
[0825]
[0826]
[0827]
[0828]
[0829]
[0830]
[0831]
[0832]
[0833]
[0834]
[0835]
[0836]
[0837]
[0838]
[0839]
[0840]
[0841]
[0842]
[0843]
[0844]
[0845]
[0846]
[0847]
[0848]
[0849]
[0850]
[0851]
[0852]
[0853]
[0854]
[0855]
[0856]
[0857]
[0858]
[0859]
[0860]
[0861]
[0862]
[0863]
[0864]
[0865]
[0866]
[0867]
[0868]
[0869]
[0870]
[0871]
[0872]
[0873]
[0874]
[0875]
[0876]
[0877]
[0878]
[0879]
[0880]
[0881]
[0882]
[0883]
[0884]
[0885]
[0886]
[0887]
[0888]
[0889]
[0890]
[0891]
[0892]
[0893]
[0894]
[0895]
[0896]
[0897]
[0898]
[0899]
[0900]
[0901]
[0902]
[0903]
[0904]
[0905]
[0906]
[0907]
[0908]
[0909]
[0910]
[0911]
[0912]
[0913]
[0914]
[0915]
[0916]
[0917]
[0918]
[0919]
[0920]
[0921]
[0922]
[0923]
[0924]
[0925]
[0926]
[0927]
[0928]
[0929]
[0930]
[0931]
[0932]
[0933]
[0934]
[0935]
[0936]
[0937]
[0938]
[0939]
[0940]
[0941]
[0942]
[0943]
[0944] 尽管本发明已就其优选的实施方案进行了具体显示和描述,但本领域技术人员应该理解的是,在不脱离本发明的真实精神和范围的情况下,可以做出各种改变并且可以用等同方案代替。这包括不提供本文阐述的所有益处和特征的实施方案。另外,可以做出许多修改以使特定情况、材料、物质组成、过程,一个或多个工艺步骤适应本发明的目的、精神和范围。所有这些修改旨在落入所附权利要求的范围内。因此,本发明的范围仅通过参考所附权利要求来限定。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈