首页 / 专利库 / 生物化学 / 脂肪酸 / 游离脂肪酸 / 包含4-羟基苯甲酰基-COA硫酯酶的遗传改造的微生物以及使用其的方法

包含4-羟基苯甲酰基-COA硫酯酶的遗传改造的生物以及使用其的方法

阅读:189发布:2020-05-13

专利汇可以提供包含4-羟基苯甲酰基-COA硫酯酶的遗传改造的生物以及使用其的方法专利检索,专利查询,专利分析的服务。并且本 发明 提供表达4‑羟基苯甲酰基‑CoA硫酯酶的包括光合 微 生物 在内的遗传改造的微生物以及使用所述遗传改造的微生物产生游离 脂肪酸 和/或脂肪酸衍生物的方法。,下面是包含4-羟基苯甲酰基-COA硫酯酶的遗传改造的生物以及使用其的方法专利的具体信息内容。

1.一种生物,其包含编码4-羟基苯甲酰基-辅酶A(CoA)硫酯酶的重组核酸分子,所述
4-羟基苯甲酰基-CoA硫酯酶选自由SEQ ID NO:1和SEQ ID NO:2组成的群组,其中所述4-羟基苯甲酰基-CoA硫酯酶解酰基-酰基载体蛋白(酰基-ACP),以及其中所述4-羟基苯甲酰基-CoA硫酯酶在所述微生物中的表达使得产生至少一种游离脂肪酸、至少一种脂肪酸衍生物,至少一种烷和/或至少一种烯烃,以及其中至少30重量%的由所述微生物产生的所述游离脂肪酸是酰基链长度为8个、10个碳、12个碳、14个碳、16个碳、18个碳的游离脂肪酸或其任一混合物,以及其中所述至少一种脂肪酸衍生物包含至少一种脂肪、至少一种脂肪醇、至少一种蜡酯或其组合。
2.根据权利要求1所述的微生物,其中每种脂肪酸衍生物的总碳数为7到36。
3.根据权利要求1所述的微生物,其中所述微生物能产生至少一种酰基链长度为8到24个碳的脂肪酸。
4.根据权利要求1所述的微生物,其中所述微生物能产生至少一种酰基链长度为8到18个碳的脂肪酸。
5.根据权利要求1所述的微生物,其中编码所述4-羟基苯甲酰基-CoA硫酯酶的所述核酸分子被稳定整合到所述微生物的染色体中。
6.根据权利要求1所述的微生物,其中编码所述4-羟基苯甲酰基-CoA硫酯酶的所述核酸分子位于表达构筑体中。
7.根据权利要求6所述的微生物,其中所述表达构筑体包含可操作地连接到编码所述
4-羟基苯甲酰基-CoA硫酯酶的所述核酸分子的启动子,且其中所述启动子在所述微生物中发挥功能。
8.根据权利要求1所述的微生物,其中所述微生物进一步包含至少一种编码至少一种额外多肽的额外核酸分子,其中所述额外核酸分子在所述微生物中的表达促进产生游离脂肪酸和/或脂肪酸衍生物。
9.根据权利要求8所述的微生物,其中所述至少一种额外核酸分子编码乙酰-CoA羧化酶或β-酰基合酶KAS。
10.根据权利要求1所述的微生物,其中所述微生物具有减弱的至少一种编码包含酰基-酰基载体蛋白ACP合酶、酰基-CoA脱氢酶、甘油-3-磷酸脱氢酶、乙醛-CoA脱氢酶、丙酮酸脱氢酶、乙酸激酶和其组合的蛋白质的基因的表达。
11.根据权利要求1所述的微生物,其中所述微生物是光合微生物。
12.根据权利要求11所述的微生物,其中所述光合微生物是真核微藻或蓝细菌。
13.一种用于在培养物中产生游离脂肪酸或脂肪酸衍生物的方法,所述方法包含在生长培养基中培养微生物,
其中所述微生物包含至少一种编码4-羟基苯甲酰基-CoA硫酯酶的重组核酸分子,所述
4-羟基苯甲酰基-CoA硫酯酶选自由SEQ ID NO:1和SEQ ID NO:2组成的群组;
其中所述微生物是在容许在培养阶段期间在所述微生物中表达所述4-羟基苯甲酰基-CoA硫酯酶的条件下生长;
其中所述4-羟基苯甲酰基-CoA硫酯酶在所述微生物中的表达使得产生至少一种游离脂肪酸、至少一种脂肪酸衍生物、至少一种烷烃和/或至少一种烯烃;且其中所述4-羟基苯甲酰基-CoA硫酯酶水解酰基-ACP;其中所述至少一种脂肪酸衍生物包含至少一种脂肪醛、至少一种脂肪醇、至少一种蜡酯或其组合;以及其中至少30重量%的由所述微生物产生的所述游离脂肪酸是酰基链长度为8个碳、10个碳、12个碳、14个碳、16个碳、18个碳的游离脂肪酸或其任一混合物。
14.根据权利要求13所述的方法,其中由所述微生物产生的每种脂肪酸衍生物的总碳数为7到36。
15.根据权利要求13所述的方法,其中由所述微生物产生的每种游离脂肪酸的酰基链长度为8到24个碳。
16.根据权利要求13所述的方法,其中由所述微生物产生的每种游离脂肪酸的酰基链长度为8到18个碳。
17.根据权利要求13所述的方法,其中编码所述4-羟基苯甲酰基-CoA硫酯酶的所述核酸分子是SEQ ID NO:3或SEQ ID NO:4。
18.根据权利要求13所述的方法,其中所述微生物进一步包含至少一种编码至少一种额外多肽的额外核酸分子,其中所述额外核酸分子在所述微生物中的表达促进产生游离脂肪酸和/或脂肪酸衍生物。
19.根据权利要求18所述的方法,其中所述至少一种额外核酸分子编码乙酰-CoA羧化酶或β-酮酰基合酶KAS。
20.根据权利要求13所述的方法,其中所述微生物具有减弱的至少一种编码包含酰基-酰基载体蛋白ACP合酶、酰基-CoA脱氢酶、甘油-3-磷酸脱氢酶、乙醛-CoA脱氢酶、丙酮酸脱氢酶、乙酸激酶和其组合的蛋白质的基因的表达。
21.根据权利要求13所述的方法,其中编码所述4-羟基苯甲酰基-CoA硫酯酶的所述核酸分子被稳定整合到所述微生物的染色体中。
22.根据权利要求13所述的方法,其中编码所述4-羟基苯甲酰基-CoA硫酯酶的所述核酸分子位于表达构筑体中。
23.根据权利要求22所述的方法,其中所述表达构筑体包含可操作地连接到编码所述
4-羟基苯甲酰基-CoA硫酯酶的所述核酸分子的启动子,其中所述启动子在所述微生物中发挥功能。
24.根据权利要求13所述的方法,其中至少一部分所述游离脂肪酸和/或脂肪酸衍生物被分泌到所述生长培养基中。
25.根据权利要求13所述的方法,其中所述微生物是光合微生物。
26.根据权利要求25所述的方法,其中所述生长培养基不包括在不存在另一能源时可支持培养物生长的量的还原性碳源。
27.根据权利要求25所述的方法,其中所述培养物提供有至少一种无机碳源。
28.根据权利要求25所述的方法,其中在至少一部分所述培养阶段中使所述培养物暴露于光。
29.根据权利要求25所述的方法,其中所述光合微生物是微藻。
30.根据权利要求25所述的方法,其中所述光合微生物是蓝细菌。
31.根据权利要求13所述的方法,其中所述方法进一步包含从所述微生物、所述生长培养基或全培养物分离至少一种游离脂肪酸和/或衍生物。
32.一种分离或重组核酸分子,其包含编码根据SEQ ID NO:1所示的多肽的序列。
33.一种分离或重组核酸分子,其包含编码根据SEQ ID NO:2所示的多肽的序列。

说明书全文

包含4-羟基苯甲酰基-COA硫酯酶的遗传改造的生物以及使

用其的方法

[0001] 相关申请案交叉参考
[0002] 本申请案主张优先于2010年12月23日申请的具有相同标题的美国临时专利申请案第61/426,568号的权益,所述申请案全文以引用方式并入本文中。
[0003] 序列表参考
[0004] 本申请案含有对基酸序列和/或核酸序列的参考,其作为标题为“2010EM383(PM0010)sequences.TXT”的序列表文本文件与本文同时提交,文件大小为71.1千字节
(KB),于2011年12月12日创建。依照37C.F.R.§1.52(e)(5)将上文所提到的序列表全文以引用方式并入本文中。

技术领域

[0005] 本发明涉及用于在微生物(包括光合微生物,例如蓝细菌和微藻)中产生游离脂肪酸和脂肪酸衍生物的组合物和方法。

背景技术

[0007] 生物燃料代表来自活生物体(例如高等植物真菌和细菌)的可再生能源。光合生命形式捕捉光能且随后使用作为最终电子供体将其转化为基于固定CO2的有机化合物的
自由能。目前,采用两种主要技术使用光养性生物体来生成生物燃料:第一种技术,通过将植物糖内含物发酵乙醇来生产基于植物的生物燃料;及采用程度显著较低的第二种技
术,通过从大规模培养的生物质提取脂质来生产源自藻类的生物柴油(安格迈尔
(Angermayr)等人,2009,生物技术新见(Curr Opin Biotechnol),20(3):257-263)。
[0008] 脂质
[0009] 生物脂质是一类化学上多变的化合物,其共同的定义性特征是其不溶于水。脂质的生物功能同样多变。在多种生物体中,脂肪和油是主要储能形式,且磷脂和甾醇大约占生物膜物质的一半。其它脂质尽管以相对较少量存在,但仍作为以下成份发挥关键作用:酶辅因子、电子载体、光吸收色素、疏水锚、乳化剂、激素和细胞内信使(罗迪士,H.(Lodish,H.),分子细胞生物学(Molecular Cell Biology),第6版,圣丁出版社(St.Martin′s Press)(2008))。
[0010] 脂肪酸
[0011] 脂肪酸是具有4到36个链的羧酸。在一些脂肪酸中,此链完全饱和(意味着其不含双键)且无分支;其它脂肪酸含有一个(单不饱和)或一个以上双键(多不饱和)。少数脂肪酸含有三碳环或羟基。这些化合物的简称详细说明链长度和双键数,通过冒号隔开;16碳饱和棕榈酸简写为16∶0,且具有一个双键的18碳油酸是18∶1。任一双键的位置通过Δ
(delta)后的上标数字来详细说明;例如,在C-9与C-10(C-1是羧基碳)之间具有一个双键且在C-12与C-13之间具有另一个双键的20碳脂肪酸命名为20∶2(Δ9,12)。最常见脂肪酸在12到24个碳的无分支链中具有偶数个碳原子。偶数个碳源自这些化合物的合成模式,其涉及
乙酸(二碳)单元的缩合。(伦宁格(Lehninger)等人,生物化学原理(Principles of 
Biochemistry),第1卷,麦克米伦(Macmillan),2005)。
[0012] 双键在不饱和脂肪酸中的位置也是不规律的;在大多数单不饱和脂肪酸中,双键介于C-9与C-10之间(Δ9),且多不饱和脂肪酸的其它双键一般为Δ12和Δ15。多不饱和脂肪酸的双键几乎从不共轭(交替的单键和双键),但一般通过亚甲基隔开(-CH=CH-CH2-CH=
CH-)。脂肪酸和含有它们的化合物的物理性质主要取决于烃链的长度和其不饱和程度,即
脂肪酰基链越长且双键越少,在水中的溶解度越低。(伦宁格等人,生物化学原理,第1卷,麦克米伦,2005)。
[0013] 脂肪酸生物合成
[0014] 乙酰-CoA羧化酶催化从乙酰-CoA不可逆地形成丙二酰-CoA,这被认为是脂肪酸生物合成中的第一个关键步骤(图1)。乙酰-CoA羧化酶含有生物素作为其辅基,所述生物素通过酰胺键联共价键结到酶分子三个亚单元中的一个亚单元上的赖氨酸残基的ε-氨基。首先在ATP依赖性反应中将源自碳酸氢根(HCO3-)的羧基转移到生物素。生物素基团用作CO2的临时载体,在第二步骤中将其转移到乙酰-CoA以产生丙二酰-CoA。(伦宁格等人,生物化学原理,第1卷,麦克米伦,2005)。
[0015] 与必须将培养基中的葡萄糖代谢为乙酰-CoA以起始脂肪酸合成的其它异养细菌(例如大肠杆菌(E.coli)相反,在蓝细菌中,用于脂肪酸合成的前驱物(即乙酰-CoA)直接源自卡尔文-本森(Calvin-Benson)循环,所述循环使用光合作用的光反应提供的能量和还原
来固定二化碳。
[0016] 装配脂肪酸中碳原子长链的反应序列由以下四个步骤组成:(1)缩合;(2)还原;(3)脱水;和(4)还原。使在此系列反应期间产生的饱和酰基再循环以成为与丙二酰基的另
一缩合中的底物。每进行一次循环,脂肪酰基链延长两个碳。在多种细胞中,链延长在链达到16个碳时结束,且产物(棕榈酸根,16∶0)离开循环。乙酰基的甲基和羧基碳原子分别成为棕榈酸根的C-16和C-15;其余碳原子源自丙二酰-CoA。合成过程中的所有反应都是通过多
酶复合物(脂肪酸合酶)催化(伦宁格等人,生物化学原理,第1卷,麦克米伦,2005)。
[0017] 脂肪酸合成中的延长循环
[0018] 脂肪酸合成代表关键保守过程,通过所述过程产生酰基链用于多种终产物,例如生物膜。催化从乙酰CoA、丙二酰-CoA和NADPH合成饱和长链脂肪酸的酶系统称为脂肪酸合
酶(FAS)(图1)。可将脂肪酸合酶(FAS)分为两类(I型和II型),其分别主要存于真核生物中
以及存于细菌和植物中。其特征在于由大型多功能多肽组成(在I型情形中)或由分散表达
的单功能蛋白质组成(在II型系统中)。(陈D.(Chan D.)和沃格尔H(Vogel H),生物化学杂
志(Biochem J.),2010,430(1):1-19)。脂肪酸合酶含有6种催化活性且含有β-酰基合酶(KS)、乙酰/丙二酰酰基转移酶(AT/MT)、β-羟基酰基脱水酶(DH)、烯酰基还原酶(ER)、β-酮酰基还原酶(KR)、酰基载体蛋白(ACP)和硫酯酶(TE)(吉罗拉(Chirala)和瓦克尔(Wakil),
脂质(Lipids),2004,39(11):1045-53)。已显示,在高等生物中导致脂肪酸合成的反应与细菌中的那些反应非常相似(伯格(Berg)等人,生物化学(Biochemistry),第6版,麦克米伦,
2008)。
[0019] 脂肪酸生物合成是通过脂肪酸合酶组份酶乙酰基转移酶来起始,所述酶将来自辅酶A(CoA)的酰基引物(通常是乙酸根)加载到脂肪酸合酶(FAS)上的特定结合位点。在所述
过程结束时,通过转酯到适宜受体或通过水解将产物从脂肪酸合酶(FAS)移除来结束链延
长。各别酶通常为棕榈酰基转移酶和硫酯酶。介于起始与终止之间的反应序列涉及通过一
组独特反应步骤的若干次反复循环来延长酶结合中间体。每一循环包括(i)通过丙二酰转
移酶将丙二酰从CoA转酰基到酶;(ii)通过3-酮酰基合酶将酰基-酶与酶结合丙二酸缩合为
3-酮酰基-酶,(iii)通过酮酰基还原酶将3-酮基-还原为3-羟基酰基中间体,(iv)通过脱水酶使3-羟基酰基酶脱水为2,3-反式-烯酸,和(v)最后,通过烯酰基还原酶将烯酸还原为饱和酰基-酶。辅基4’-磷酸泛酰巯基乙胺在底物结合、中间体处理和中间体在脂肪酸合酶
(FAS)之各个催化中心之间之沟通中具有关键作用。这种辅因子共价键结到ACP结构域的特
定丝氨酸羟基或根据FAS系统共价键结到FAS的ACP组份。在一些细菌中,延长循环的反复序列可在10个碳的链长度处夹杂一个涉及内在异构酶将2-反式-癸烯酰基中间体转化为3-顺
式-癸烯酰基中间体的循环,随后所述中间体不经还原且进一步延长为长链单不饱和脂肪
酸(史威泽(Schweizer)和霍夫曼(Hofmann),微生物学与分子生物学评论(Microbiol Mol 
Biol Rev.),2004,68(3):501-17)。
[0020] 酰基载体蛋白(ACP)
[0021] 酰基载体蛋白(ACP)是在合成过程期间通过磷酸泛酰巯基乙胺连接体共价键结脂肪酰基中间体的辅因子蛋白,其对脂肪酸合成至关重要。其为在脂肪酸合成期间携载酰基
中间体的高度保守蛋白质。ACP为脂质和硫辛酸合成以及为群体感应(quorum sensing)、生物发光和毒素活化供应酰基链。此外,ACP或PCP(肽基载体蛋白)还用于多肽和非核糖体肽
合成,所述合成产生重要的次级代谢产物,例如脂肽抗生素达托霉素(daptomycin)和载
的铁载体肠菌素(陈(Chan)和沃格尔,生物化学杂志,2010,430:1-19)。
[0022] 在酵母哺乳动物中,ACP作为单独结构域存于大型多功能脂肪酸合酶多聚蛋白(I型FAS)内,而在细菌和植物中其为小型单体蛋白质(II型FAS)(拜尔斯(Byers)和龚
(Gong),生物化学与细胞生物学(Biochem Cell Biol.),2007,85(6):649-62)。
[0023] 在大肠杆菌中,ACP含量极高,占所有可溶蛋白质的约0.25%,且其代表四种主要蛋白质-蛋白质相互作用中枢之一,其余中枢是DNA和RNA聚合酶以及核糖体相关蛋白。在I
型FAS系统中,ACP是大型多结构域多肽的一部分,所述多肽还以线性方式携载用于FA合成
的其它蛋白质结构域。尽管I型FAS系统的构造和序列一致性不同于II型解离酶,但所述复
合物中多个功能性单元是相似的。另一方面,在Ia型、Ib型与II型系统之间,诸如烯酰基还原酶和脱水酶等其它结构域显著不同(陈和沃格尔,生物化学杂志,2010,430:1-19)。
[0024] 酰基-ACP硫酯酶
[0025] 在真核生物中,脂肪酸生物合成的主要终止反应是由酰基-酰基载体蛋白(酰基-ACP)硫酯酶催化的。先前研究已显示,酰基-ACP硫酯酶通过水解脂肪酸上的酰基来终止脂
肪酰基的酰基延长。在植物中,酰基-ACP硫酯酶通过水解酰基-ACP硫酯来终止酰基延长过
程;然后从脂肪酸合酶释放游离脂肪酸。在大肠杆菌中,通过甘油-3-磷酸酰基转移酶将长链酰基从ACP直接转移到甘油-3-磷酸,且通常发现游离脂肪酸并非在脂质生物合成中作为
中间体。如在大多数其它生物体中,植物和大肠杆菌脂肪酸合酶的主要终产物通常是16碳
脂肪酸或18碳脂肪酸。在大肠杆菌中,链长度取决于3-酮酰基-ACP合酶I和II以及甘油-3-
磷酸酰基转移酶。(沃尔克(Voelker)和戴维斯(Davies),细菌学杂志(J.Bacteriol),1994,
17:7320-7327)。
[0026] 4-羟基苯甲酰基-CoA硫酯酶(4-HBT)
[0027] 在上世纪期间,已有大量工业生产的4-氯苯甲酸酯(4-CBA)和4-CBA前体(除草剂和多氯联苯杀虫剂)释放到环境中(科克,D.(Cork,D.)和克鲁格,J.(Krueger,J.)(1991)应用微生物学进展(Adv.Appl.Microbiol.),36:1-66;古川,K.(Furukawa,K.)(1994)生物降解(Biodegradation),5:289-300;黑格布卢姆,M.(Haggblom,M.)(1992)欧洲微生物学会联合会微生物学评论(FEMS Microbiol.Rev.),9:29-71;格森,F.(Higson,F.)(1992)应用微生物学进展,37:135-164;和庄,Z.(Zhuang,Z.)等人,(2003)应用与环境微生物学(Applied and Environmental Microbiology),69:2707-2711)。近年来已鉴别出多种降解4-CBA的土壤微生物,其催化环境中出现的卤代烃并使用其作为主要碳源(希尔曼,B.(Hileman,B.)
(1993)化学与工程新闻(Chem.Eng.News),71:11-20)。
[0028] 用CoA使4-氯苯甲酸酯硫酯化的生物化学方案中的第一个步骤需要一个Mg2+-ATP分子且通过4-氯苯甲酰基-CoA连接酶催化。第二个步骤是通过4-氯苯甲酰基-CoA脱卤酶催
化且涉及用羟基水解取代芳香环对位处的氯基。在第三个也是最后一个步骤中,通过4-羟
基苯甲酰基-CoA硫酯酶(4-HBT)裂解介于CoA部分与4-羟基苯甲酰基之间的硫酯键联。编码
这三种酶的基因组织于操纵子中处于4-氯苯甲酰基-CoA的正控制下(唐纳维-马利安诺,D.
(Dunaway-Mariano,D.)和巴比特,P.(Babbitt,P.)(1994)生物降解,5:259-276)。
[0029] 美国专利第5,455,167号揭示用于表达编码高等植物酰基-ACP硫酯酶的基因的基因和构筑体以及用于在高等植物中表达编码属于Pfam PF02273的哈维氏弧菌(Vibrio 
harveyi)LuxD酰基转移酶(YP_001448362.1GI:156977456)的基因的构筑体。PCT公开案第
WO2007/136762号揭示经改造用于发酵产生脂肪酸衍生物(尤其例如脂肪醇和蜡酯)的重组
微生物,其中宿主菌株可表达高等植物硫酯酶或大肠杆菌TesA酰基-CoA硫酯酶。PCT公开案第WO2008/100251号阐述改造包括编码合成纤维体的基因的微生物以产生烃产物(所述烃
产物尤其可为烷烃、烯烃、炔烃、二烯烃、脂肪酸、类异戊二烯、脂肪醇、脂肪酸酯、聚羟基烷酸酯、有机酸或诸如此类)的方法。含有一种或一种以上编码合成纤维体的外源核酸序列的微生物还可包括可在宿主细胞中表达的外源硫酯酶基因,例如大肠杆菌TesA酰基-CoA硫酯
酶或植物硫酯酶基因。

发明内容

[0030] 本发明的一个方面是包含至少一种编码4-羟基苯甲酰基-CoA硫酯酶(4-HBT)的重组核酸分子的微生物。所述微生物可表达编码4-羟基苯甲酰基-CoA硫酯酶的基因以促进产
生一种或一种以上脂肪酸或脂肪酸衍生物或其组合。在本发明的一个实施例中,4-羟基苯
甲酰基-CoA硫酯酶水解酰基-ACP。优选地但并非必需地,微生物是光合微生物。
[0031] 在本发明的大多数实施例中,所述微生物包括编码4-羟基苯甲酰基-CoA硫酯酶的重组核酸分子且还产生至少一种游离脂肪酸和/或脂肪酸衍生物,所产生的量大于不含重
组核酸分子的相同微生物可产生的量。例如,在一些实施例中,微生物在6小时到10天阶段期间产生至少5mg/升(例如至少10mg/升、至少20mg/升、至少30mg/升、至少40mg/升或至少
50mg/升)游离脂肪酸和/或衍生物。
[0032] 或者或另外,微生物包括编码4-羟基苯甲酰基-CoA硫酯酶的重组核酸分子且可产生至少一种酰基链长度介于8到24个碳范围内(例如,酰基链长度为8到18个碳或酰基链长
度为12到16个碳)的游离脂肪酸和/或衍生物。例如,由所述微生物产生的至少一种游离脂
肪酸和/或衍生物的酰基链长度可为8、10、12、14、16、18、20、22和/或24个碳。倘若脂肪酸衍生物包含蜡酯,那么所述蜡酯应包含酯碳(A碳)以及酰基链碳(B碳)。倘若脂肪酸衍生物包
含一种或一种以上不展现羰基的化合物(例如,脂肪醇、烷烃和烯烃),那么所述化合物的
“酰基”链长度在本文中应理解为对应于所述分子中的总碳数。
[0033] 此外,或者或另外,微生物包括至少一种编码4-羟基苯甲酰基-CoA硫酯酶的重组基因且可产生至少一种脂肪酸衍生物,例如(但不限于)一种或一种以上脂肪、脂肪醇、蜡酯、烷烃、烯烃和/或其组合。例如,微生物可产生至少一种总碳数为7到36(例如,7到34或11到32个碳)的脂肪酸衍生物。或者或另外,由微生物产生的至少一种脂肪酸衍生物的总碳数可为7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、26、28、30、32、34和/或36。
[0034] 此外,或者或另外,微生物包括至少一种编码4-羟基苯甲酰基-CoA硫酯酶的重组基因且由微生物产生的游离脂肪酸和/或衍生物中至少30重量%(例如至少40wt%、至少
50wt%或至少60wt%)是酰基链长度为8、10、12、14、16和/或18个碳的游离脂肪酸和/或总碳数为7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、26、28、30、32、34和/或
36的脂肪酸衍生物。
[0035] 此外,或者或另外,微生物包括编码4-羟基苯甲酰基-CoA硫酯酶的重组核酸分子,所述酶是Pfam家族PF03061的成员。此外,或者或另外,微生物编码包括Pfam结构域PF03061的4-羟基苯甲酰基-CoA硫酯酶,且微生物可产生酰基链长度为8、10、12、14、16和/或18个碳的脂肪酸和/或总碳数为7到36的脂肪酸衍生物。
[0036] 或者或另外,微生物包括至少一种编码4-羟基苯甲酰基-CoA硫酯酶的重组基因,所述酶与SEQ ID NO:1或SEQ ID NO:2具有至少50%氨基酸一致性(例如,至少55%、至少
60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或约100%序列一致性)。此外,或者或另外,微生物可产生酰基链长度为8、10、12、14、16和/或18个碳的脂肪酸和/或总碳数为7到36的脂肪酸衍生物。在一些实施例中,微生物含有包括核苷酸序列SEQ ID NO:3或SEQ ID NO:4的核酸分子。
[0037] 本文另外提供分离或重组核酸分子,其包含编码氨基酸序列与SEQ ID NO:1具有至少97%一致性的多肽的序列。例如,本发明分离或重组核酸分子可包含编码氨基酸序列
与SEQ ID NO:1具有至少97%、至少98%、至少99%或约100%序列一致性的多肽的序列。本发明还提供分离或重组核酸分子,其包含编码包括与SEQ ID NO:1具有至少70%、至少
75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或约100%序列一致性一致性的氨基酸序列的多肽的序列,其中所述多肽可水解酰基-ACP
底物。或者或另外,分离或重组核酸分子包含编码包括与SEQ ID NO:1具有至少70%、至少
75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或约100%序列一致性一致性的氨基酸序列的多肽的序列,且所述多肽当在宿主微生物中
表达时导致宿主微生物产生游离脂肪酸或脂肪酸衍生物。例如,序列与SEQ ID NO:1具有至少70%一致性的多肽的表达可导致产生的游离脂肪酸或脂肪酸衍生物的量是在所有方面
都与宿主微生物相同只是不表达氨基酸序列与SEQ ID NO:1至少70%一致的多肽的微生物
所产生量的至少两倍。
[0038] 本文另外提供分离或重组核酸分子,其包含编码氨基酸序列与SEQ ID NO:2具有至少70%一致性的多肽的序列。例如,本发明分离或重组核酸分子可包含编码氨基酸序列
与SEQ ID NO:2具有至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少
97%、至少98%、至少99%或约100%序列一致性一致性的多肽的序列。本发明还提供分离或重组核酸分子,其包含编码包括与SEQ ID NO:2具有至少50%一致性的氨基酸序列的多
肽的序列,其中所述多肽可水解酰基-ACP底物。例如,分离或重组核酸分子包含编码包括与SEQ ID NO:2具有至少50%一致性(例如,至少55%、至少60%、至少65%、至少70%、至少
75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或约100%一致性)的氨基酸序列的多肽的序列,其中所述多肽可水解酰基-ACP底物。或者
或另外,本发明分离或重组核酸分子可包含与SEQ ID NO:2具有至少50%氨基酸一致性(例如,至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或约100%序列一致性)的序列,其中核酸序列在宿主微生物中的表达导致产生至少一种游离脂肪酸或脂肪酸衍生物。序列与SEQ ID NO:2具有至少50%一致性的多肽的表达可导致产生的游离脂肪酸或脂肪酸衍生物的量是
在所有方面都相同只是不表达包括与SEQ ID NO:2至少50%一致的氨基酸序列的多肽的微
生物所产生量的至少两倍。
[0039] 在一些实施例中,可将编码4-羟基苯甲酰基-CoA硫酯酶的核酸分子稳定地整合到微生物的染色体中。或者或另外,编码4-羟基苯甲酰基-CoA硫酯酶的核酸可位于自主复制
附加体中。例如,存于附加体上和/或整合到微生物基因组中的编码4-羟基苯甲酰基-CoA硫酯酶的核酸可为引入宿主微生物(或宿主微生物的前体)中的外源核酸分子,且还可为通过
遗传改造产生的重组核酸分子。
[0040] 此外,或者或另外,遗传改造的微生物可包括表达构筑体,其包括编码4-羟基苯甲酰基-CoA硫酯酶的重组核酸分子以及一种或一种以上调节4-羟基苯甲酰基-CoA硫酯酶基因的表达的额外序列。例如,表达构筑体可包括在宿主细胞中有效的启动子,其中所述启动子可为(例如)细菌、病毒、噬菌体或真核启动子。或者,启动子可为合成启动子。此外,包括编码4-羟基苯甲酰基-CoA硫酯酶的基因的表达构筑体中的启动子可为组成型启动子,或在
备选实施例中可为诱导型启动子。例如,诱导型启动子可受金属或化合物(例如乳糖或乳糖类似物)控制和/或可受光控制,且可为(例如)lac、tac或trc启动子、secA启动子、rbc启动子、psaAB启动子或psbA启动子。
[0041] 此外,或者或另外,本发明微生物包括编码4-羟基苯甲酰基-CoA硫酯酶的重组核酸分子且另外包含编码乙酰-CoA羧化酶的重组核酸分子和/或编码β-酮酰基合酶(KAS)的
重组核酸分子。此外,或者或另外,本发明微生物具有一种或一种以上编码以下酶的基因的减弱/中断的表达:酰基-ACP合酶、酰基-CoA合酶、酰基-CoA脱氢酶、甘油-3-磷酸脱氢酶、乙醛-CoA脱氢酶、丙酮酸脱氢酶或乙酸激酶。例如,任一所述基因可通过插入诱变来敲除和/或通过RNA干扰或通过反义RNA介导的基因沉默来下调。
[0042] 在本文提供的任一实施例中,遗传改造的微生物可为(例如)真细菌、古细菌、真菌、酵母、不等鞭毛藻(heterokont)、蓝细菌或藻类。根据本发明的一些实施例,宿主微生物是光合微生物,例如光合细菌或藻类,包括真核微藻物种。例如,遗传修饰微生物可为微藻属,包括(但不限于)曲壳藻属(Achnanthes)、茧形藻属(Amphiprora)、双眉藻属(Amphora)、纤维藻属(Ankistrodesmus)、星胞藻属(Asteromonas)、布克罗亚藻属(Boekelovia)、鲍罗定藻属(Borodinella)、葡萄藻(Botryococcus)、苞球藻属(Bracteococcus)、毛藻属
(Chaetoceros)、四鞭藻属(Carteria)、衣藻属(Chlamydomonas)、绿球藻属
(Chlorococcum)、绿梭藻属(Chlorogonium)、小球藻属(Chlorella)、蓝隐藻属
(Chroomonas)、金球藻属(Chrysosphaera)、球板藻属(Cricosphaera)、隐甲藻属
(Crypthecodinium)、隐藻属(Cryptomonas)、小环藻属(Cyclotella)、杜氏藻属
(Dunaliella)、后棘藻属(Ellipsoidion)、圆石藻属(Emiliania)、独球藻属
(Eremosphaera)、厄诺迪木藻属(Ernodesmius)、眼虫藻属(Euglena)、被刺藻属
(Franceia)、脆杆藻属(Fragilaria)、粘灌木状藻属(Gloeothamnion)、红球藻属
(Haematococcus)、盐猎食性藻属(Halocafeteria)、膜胞藻属(Hymenomonas)、等鞭金藻属(Isochrysis)、鳞孔藻属(Lepocinclis)、微芒藻属(Micractinium)、单针藻属
(Monoraphidium)、微绿球藻属(Nannochloris)、微拟球藻属(Nannochloropsis)、舟形藻属(Navicula)、新绿藻(Neochloris)、肾鞭藻属(Nephrochloris)、肾藻属(Nephroselmis)、菱形藻属(Nitzschia)、棕鞭藻属(Ochromonas)、鞘藻属(Oedogonium)、卵囊藻属(Oocystis)、蚝球藻(Ostreococcus)、巴夫藻属(Pavlova)、拟小球藻属(Parachlorella)、佩斯基耶拉藻属(Pascheria)、褐指藻属(Phaeodactylum)、扁裸藻亚属(Phagus)、微微型绿藻
(Picochlorum)、扁藻属(Platymonas)、颗石藻属(Pleurochrysis)、宽球藻属
(Pleurococcus)、无绿藻属(Prototheca)、拟绿球藻属(Pseudochlorella)、拟新绿藻属
(Pseudoneochloris)、塔胞藻属(Pyramimonas)、桑椹藻属(Pyrobotrys)、栅藻属
(Scenedesmus)、骨条藻属(Skeletonema)、水绵属(Spyrogyra)、裂丝藻属(Stichococcus)、四爿藻属(Tetraselmis)、海链藻属(Thalassiosira)、韦瑞迪拉藻属(Viridiella)和团藻
属(Volvox)。
[0043] 更具体来说,微生物可为原核光合微生物。例如,光合微生物可为蓝细菌属,包括(但不限于)阿格氏藻属(Agmenellum)、鱼腥藻属(Anabaena)、项圈藻属(Anabaenopsis)、组囊藻属(Anacystis)、束丝藻属(Aphanizomenon)、节旋藻属(Arthrospira)、星球藻属(Asterocapsa)、博氏藻属(Borzia)、眉藻属(Calothrix)、管孢藻属(Chamaesiphon)、拟绿胶蓝细菌属(Chlorogloeopsis)、拟色球藻属(Chroococcidiopsis)、色球藻属
(Chroococcus)、发毛针藻属(Crinalium)、蓝细菌属(Cyanobacterium)、蓝菌属
(Cyanobium)、蓝囊藻属(Cyanocystis)、蓝螺藻属(Cyanospira)、蓝杆藻属(Cyanothece)、拟柱孢藻属(Cylindrospermopsis)、筒孢藻属(Cylindrospermum)、蓝纤维藻属
(Dactylococcopsis)、包皮藻属(Dermocarpella)、侧生藻属(Fischerella)、夫列藻属
(Fremyella)、吉特勒氏蓝细菌属(Geitleria)、吉特勒氏线状蓝细菌属(Geitlerinema)、胶菌藻属(Gloeobacter)、粘球藻属(Gloeocapsa)、粘杆藻属(Gloeothece)、盐螺旋藻属
(Halospirulina)、伊延藻属(Iyengariella)、细鞘丝藻属(Leptolyngbya)、湖丝藻属
(Limnothrix)、鞘丝藻属(Lyngbya)、微鞘藻属(Microcoleus)、微囊藻属(Microcystis)、粘囊藻属(Myxosarcina)、节球藻属(Nodularia)、念珠藻属(Nostoc)、拟念珠藻属
(Nostochopsis)、颤藻属(Oscillatoria)、席藻属(Phormidium)、浮丝藻属
(Planktothrix)、宽球藻属(Pleurocapsa)、原绿球藻属(Prochlorococcus)、原绿藻
(Prochloron)、原绿发藻属(Prochlorothrix)、假鱼腥藻属(Pseudanabaena)、胶须藻属
(Rivularia)、裂须藻属(Schizothrix)、伪枝藻属(Scytonema)、螺旋藻属(Spirulina)、直毛藻属(Stanieria)、斯塔尔氏蓝细菌属(Starria)、真枝藻属(Stigonema)、束藻属
(Symploca)、聚球藻属(Synechococcus)、集胞藻属(Synechocystis)、嗜热藻
(Thermosynechococcus)、单岐藻属(Tolypothrix)、束毛藻属(Trichodesmium)、常丝藻属(Tychonema)和异球藻属(Xenococcus)。
[0044] 根据另一方面,本发明提供产生游离脂肪酸和/或衍生物的培养物,其包含可包含编码4-羟基苯甲酰基-CoA硫酯酶的重组核酸分子的微生物群。在某些优选实施例中,微生
物是光合微生物且培养物的生长培养基不包括还原性碳源或不包括至少实质量的还原性
碳源,其中实质量是在不存在另一能源时可支持培养物生长的量。
[0045] 在一个优选实施例中,本发明培养物中的微生物可产生(可任选地但优选地释放和/或分泌)至少一种游离脂肪酸和/或脂肪酸衍生物。或者或另外,培养物中的微生物产生的脂肪酸和/或脂肪酸衍生物的量大于不包括编码4-羟基苯甲酰基-CoA硫酯酶的重组核酸
分子的相同微生物的培养物(其中所述培养物在其它方面相同)。此外,或者或另外,培养物中的微生物包括编码4-羟基苯甲酰基-CoA硫酯酶的重组核酸分子,其中培养物可在介于6
小时到10天范围内的阶段期间进一步包括至少5mg/升(例如至少10mg/升、至少20mg/升、至少30mg/升、至少40mg/升或至少50mg/升)游离脂肪酸和/或脂肪酸衍生物。脂肪酸和/或脂
肪酸衍生物可存于培养基中,例如以沉淀物形式存于培养基表面或附近,以包括悬浮微滴
(例如,乳液)在内的微滴形式与培养基容器相结合,以相对不可混溶的层形式漂浮于水性
培养基顶部上,以可分散、悬浮或夹带于培养基内的“浮渣(scum)”、薄膜、凝胶、半固体、胶体、细微粒、微粒、固体或聚集体形式存在,与宿主微生物的细胞相结合,以另外某种方式相分离或其组合。
[0046] 或者或另外,宿主微生物可为光合微生物且培养物的生长培养基可不包括实质量的还原性碳源,其中实质量是在不存在另一能源时可支持培养物生长的量。此外,或者或另外,培养物可提供有至少一种无机碳源,例如碳酸氢盐或二氧化碳(CO2),和/或可在至少一部分培养阶段中使培养物中的光合微生物暴露于光。
[0047] 另外,可将游离脂肪酸和/或衍生物从培养物分离,例如从细胞、生长培养基或全培养物分离。例如,分离可通过全细胞和/或裂解细胞的有机萃取、通过移除呈沉淀物形式的游离脂肪酸和/或衍生物(例如,从培养基上层移除,也称为“撇脂”)、通过使用可结合脂肪酸或脂肪酸衍生物的微粒吸附剂、泡沫和/或基质或其组合来实施。
附图说明
[0048] 图1显示产生游离脂肪酸和脂肪酸衍生物的生物合成路径的示意图。
[0049] 图2显示用于构筑宏基因组文库的表达载体(RB-RS1)的物理图谱。
[0050] 图3显示从表达340-64基因(SEQ ID NO:3)的大肠杆菌细胞的培养物分离的游离脂肪酸(FFA)与高等植物酰基-ACP硫酯酶(25对照)相比的概况。
[0051] 图4是从表达3-1基因(SEQ ID NO:4)的大肠杆菌细胞的培养物分离的游离脂肪酸(FFA)与对照(25对照)相比的图表。
[0052] 图5是从表达340-64基因(SEQ ID NO:3)的大肠杆菌(缺少功能性酰基-CoA合成酶的K19菌株)的培养物分离的游离脂肪酸(FFA)与对照(RBRS1空载体(EV)对照)相比的图表。
将游离脂肪酸(FFA)的浓度正规化为大肠杆菌培养物的OD。
[0053] 图6显示酰基-ACP底物在含有2.5M尿素的20%天然丙烯酰胺凝胶中的迁移模式。将酰基-ACP底物(C16-ACP)与从表达不同克隆(PE0045(对照提取物)、3-14-HBT(SEQ ID 
NO:4)或340-644-HBT(SEQ ID NO:3))的大肠杆菌获得的细胞提取物一起培育。

具体实施方式

[0054] 本发明提供用于产生一种或一种以上游离脂肪酸和/或其衍生物的组合物和方法,其包含在微生物中表达4-羟基苯甲酰基-CoA硫酯酶(例如,表达编码4-羟基苯甲酰基-
CoA硫酯酶的重组核酸分子)。
[0055] 词汇表
[0056] 本文中用于氨基酸的缩写是常用缩写:A=Ala=丙氨酸;R=Arg=精氨酸;N=Asn=天冬酰胺;D=Asp=天冬氨酸;C=Cys=半胱氨酸;Q=Gln=谷氨酰胺;E=Glu=谷氨酸;G=Gly=甘氨酸;H=His=组氨酸;I=Ile=异亮氨酸;L=Leu=亮氨酸;K=Lys=赖氨酸;
M=Met=甲硫氨酸;F=Phe=苯丙氨酸;P=Pro=脯氨酸;S=Ser=丝氨酸;T=Thr=苏氨酸;W=Trp=色氨酸;Y=Tyr=酪氨酸;V=Val=缬氨酸。氨基酸可为L-氨基酸或D-氨基酸。
可用合成氨基酸替代氨基酸,所述合成氨基酸经改变以延长肽的半衰期或提高肽的效能,
或提高肽的生物利用度。
[0057] 本文所用词组“保守氨基酸取代”或“保守突变”是指用氨基酸替代另一具有共性的氨基酸。定义个别氨基酸之间的共性的功能性方式是分析同源生物体中相应蛋白质之间的氨基酸变化的正规化频率(舒尔茨,G.E.(Schulz,G.E.)和R.H.希尔默(R.H.Schirmer),蛋白质结构原理(Principles of Protein Structure),施普林格(Springer-Verlag))。根据所述分析可定义多个氨基酸群组,其中群组内氨基酸优先彼此交换,且因此主要在对蛋
白质总体结构的影响方面彼此相似(舒尔茨,G.E.和R.H.希尔默,蛋白质结构原理,施普林格)。以此方式定义的氨基酸群组的实例可包括“带电荷/极性群组”,包括Glu、Asp、Asn、Gln、Lys、Arg和His;“芳香族或环状群组”,包括Pro、Phe、Tyr和Trp;以及“脂肪族群组”,包括Gly、Ala、Val、Leu、Ile、Met、Ser、Thr和Cys。在每个群组内,还可鉴别子群组。例如,可将带电荷/极性氨基酸群组细分为多个子群组,包括:“带正电荷的子群组”,包含Lys、Arg和His;“带负电荷的子群组”,包含Glu和Asp;以及“极性子群组”,包含Asn和Gln。在另一个实例中,可将芳香族或环状群组细分为多个子群组,包括:“氮环子群组”,包含Pro、His和Trp;
以及“苯基子群组”,包含Phe和Tyr。在另一个实例中,可将脂肪族群组细分为多个子群组,包括:“大型脂肪族非极性子群组”,包含Val、Leu和Ile;“脂肪族弱极性子群组”,包含Met、Ser、Thr和Cys;以及“小型残基子群组”,包含Gly和Ala。保守突变的实例包括上述子群组内的氨基酸的氨基酸取代,例如(但不限于):
[0058] 丙氨酸(A)、丝氨酸(S)、苏氨酸(T);
[0059] 天冬氨酸(D)、谷氨酸(E);
[0060] 天冬酰胺(N)、谷氨酸(Q);
[0061] 精氨酸(R)、赖氨酸(K);
[0062] 异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、缬氨酸(V);和
[0063] 苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W)。
[0064] 本文所用术语“酰基-酰基载体蛋白硫酯酶”或“酰基-ACP硫酯酶”是指优先于其它底物(例如酰基-CoA底物和/或羟基苯甲酰基-CoA底物,例如,4-羟基苯甲酰基-CoA、2,5-二羟基苯甲酰基-CoA或诸如此类)水解酰基-ACP酯键联的硫酯酶,且可包括属于蛋白质家族(Pfam)PF01643(位于pfam.cgb.ki.se/;位于pfam.janelia.org/;位于
pfam.sanger.ac.uk)的酰基-ACP硫酯酶。
[0065] 本文所用术语“酰基-辅酶A硫酯酶”、“酰基-CoA硫酯酶”和“酰基-CoA水解酶”是指催化存于酰基-CoA酯分子内的硫酯键水解以产生辅酶A(CoASH)和相应非酯化脂肪酸的硫酯酶。
[0066] 本文所用术语“减弱”意味着削弱或降低力、强度、活性、效应或数量。
[0067] 本文所用术语“自养生物”是指使用光能(通过光合作用)或无机化学反应从简单无机分子产生复杂有机化合物(碳水化合物、脂肪和蛋白质)的生物体。其通常能制备自己
的食物。一些自养生物可固定二氧化碳。
[0068] 本文所用术语“自养的”是指生物体能使用光能(通过光合作用)和/或无机化学反应从简单无机分子产生复杂有机化合物(碳水化合物、脂肪和蛋白质)。本文所用术语“光合自养的”是指生物体能使用光能(通过光合作用)从简单无机分子产生复杂有机化合物(碳
水化合物、脂肪和蛋白质)。“光养性生长”是使用光作为能源的生长。
[0069] 本文所用术语“生物燃料”是指从可再生生物资源获得的任何燃料。
[0070] 本文所用术语“碳源”是指提供合成新有机分子所需的碳骨架的化合物。
[0071] 本文所用术语“进化枝”是指共享从共同祖先继承的特征的生物分类群或物种。进化枝包括祖先世系和所述祖先的所有后代。术语进化枝还用于指基因或蛋白质依照其序列的亲缘关系(同源性)的分组。
[0072] 对于在生物体中的表达经“密码子优化”的基因是核苷酸序列已相对于原始核苷酸序列有所改变而使得核苷酸序列的一个或一个以上密码子已变为编码相同氨基酸的不
同密码子的基因,其中新密码子在所关注生物体的基因中的使用比原始密码子更频繁。遗
传密码的简并性使除了甲硫氨酸和色氨酸以外的所有氨基酸都由一个以上密码子编码。例
如,精氨酸、亮氨酸和丝氨酸由6个不同密码子编码;且甘氨酸、丙氨酸、缬氨酸、苏氨酸和脯氨酸由4个不同密码子编码。多种生物体比其它密码子更频繁地使用某些密码子来编码具
体氨基酸。在不将本发明的任何方面限制于任何具体机制的情形下,人们相信在具体生物
体内给定氨基酸的一些tRNA比其它tRNA更普遍,且需要稀有tRNA来翻译所编码蛋白质的基
因部分由于所述稀有tRNA的量有限而以低水平表达。因此,为了以足够或最佳水平表达所
编码蛋白质,基因可经“密码子优化”以将一个或一个以上密码子改变为在宿主生物体的基因中使用更频繁(称为生物体的“密码子优先性”)的新密码子(“优选密码子”)。如本发明上下文中所使用的本发明的“密码子优化”的基因或核酸分子不需要使每个密码子都改变以
符合所计划宿主生物体的密码子优先性,也不需要使经“密码子优化”的基因或核酸分子的经改变密码子改变为所关注生物体所使用最普遍的密码子。例如,密码子优化的基因可有
一个或一个以上密码子改变为比原始密码子使用更频繁的密码子,而不论所述密码子在生
物体中是否最频繁地用于编码具体氨基酸。
[0073] 本文所用术语“可控制调节元件”或“调节元件”是指能影响核酸表达或其肽或蛋白质产物的核酸序列。可控制调节元件可以可操作方式连接到本发明的核酸、肽或蛋白质。可控制调节元件(例如(但不限于)控制序列)不需要邻接由其控制表达的核酸、肽或蛋白
质,只要其可起作用引导所述核酸、肽或蛋白质的表达即可。因此,例如,在启动子序列与本发明核酸之间可存在已转录但尚未翻译的插入序列,且所述启动子序列仍可视为“可操作
地连接到”编码序列。其它所述控制序列包括(但不限于)增强子序列、调节翻译的序列、调节mRNA稳定性的序列、多聚腺苷酸化信号、终止信号和核糖体结合位点。
[0074] 本文所用术语“内源的”是指在生物体内起源或产生的物质。“内源”基因或蛋白质是指驻留在某物种中且也是源自所述物种的基因或蛋白质。
[0075] “附加体”是未整合到细胞染色体中且在细胞中自主复制的核酸分子。“附加型”核酸分子或序列是整合到附加体中的基因、核酸分子或核酸序列。附加体的实例是质粒,其为包括复制起点且在细胞内自主复制的位于染色体外的环状DNA分子。
[0076] “表达构筑体”是指已通过人类介入(包括通过重组方式或直接化学合成)生成的具有一系列允许在宿主细胞中转录和/或翻译具体核酸的指定核酸元件的核酸。表达构筑
体可为质粒、病毒或核酸片段的一部分。
[0077] 本文所用术语“外源的”是指在生物体外起源或产生的物质或分子。本文所用术语“外源基因”或“外源核酸分子”是指编码表达已引入(“转化到”)细胞或细胞前体中的RNA和/或蛋白质的核酸。外源基因可相对于所转化细胞来自不同物种(且因此为“异源”基因)或来自相同物种(且因此为“同源”基因)。经转化细胞可称为重组细胞。“内源”核酸分子、基因或蛋白质在其天然由生物体产生时可代表所述生物体自身的基因或蛋白质。
[0078] 本文所用术语“表达(expressing或expression)”意味着细胞转录并翻译核酸分子。表达可为(例如)组成型或通过(例如)诱导型启动子(例如,lac操纵子,其可由异丙基β-D-1-硫代半乳糖吡喃糖苷(IPTG)触发)来调节。
[0079] 本文所用术语“脂肪酸”欲指具有至少3个碳的烷基链(即至少4个碳的酰基链)的非酯化羧酸或其相应羧酸根阴离子,分别表示为RCOOH或RCOO-,其中R是介于3个碳与23个
碳之间的烷基链。“游离脂肪酸”在生物体内或生物体外实质上不与(例如)蛋白质结合(例如,生物体内未酯化的球形和/或胶束存储仍可定性为游离脂肪酸)。因此,本发明游离脂肪酸不需要一定是严格的酸或在结构上“游离”,但特定来说游离脂肪酸不包括羧基氧共价连接到除了氢原子以外的任何其它部分的酰基部分,这意味着特定来说脂肪酸酯不包括在游
离脂肪酸内。然而,游离脂肪酸可有利地包括含有至少4个碳(例如,至少6个碳、例如至少8个碳)的酰基部分,其中所述酰基部分(i)共价连接到氢原子,(ii)具有反荷离子可结合(即使是松散结合和/或溶剂分离的结合)的离子电荷,和/或(iii)可以其它方式结合(非共价
方式)除了氢以外的部分,例如通过酯键结合,从而使得游离脂肪酸可相对易于转化为相应酸形式或相应离子形式(例如,通过氢键或类似方式结合)。反荷离子的非限制性实例可包
括金属盐(例如钙、钠、、铁和诸如此类和其组合)、其它无机离子(例如铵、单-、二-、三-和四-烷基铵、锍、鏻和诸如此类和其组合)、有机离子(例如碳正离子)和诸如此类和其组合。本文所用术语“游离脂肪酸”还是指脂肪酸未共价键结到除了氢以外的任何其它部分(通过羧酸基团键结)的脂肪酸。例如,游离脂肪酸不结合其它分子,例如ACP、辅酶A(CoA)或甘油(例如,作为甘油三酯、甘油二酯、甘油单酯或磷脂分子的一部分)。游离脂肪酸含有可离子化为羧酸根阴离子形式(R-COO-;R:烃)的羧基(-COOH)。
[0080] 脂肪酸可具有偶数或奇数个碳原子(例如,十七烷酸=C17)且还可具有分支链(例如,异棕榈酸、反异十九烷酸(anteisononadecanoic acid))或碳环单元(例如,苹婆酸
(sterculic acid)、大子油酸(chaulmoogric acid))。
[0081] 在一些脂肪酸中,烃链完全饱和(意味着不含双键)且无分支;其它烃链含有一个(单不饱和)或一个以上双键(不饱和)。这些化合物的简称详细说明链长度和双键数,通过
冒号隔开;16碳饱和棕榈酸简写为16∶0,且具有一个双键的18碳油酸是18∶1。任一双键的位置通过Δ(delta)后的上标数字来详细说明;例如,在C-9与C-10(C-1是羧基碳)之间具有一个双键且在C-12与C-13之间具有另一个双键的20碳脂肪酸命名为20∶2(Δ9,12)。最常见脂肪酸在12到24个碳的无分支链中具有偶数个碳原子。偶数个碳源自这些化合物的合成模
式,其涉及乙酸(二碳)单元的缩合。双键的位置也是有规律的;在大多数单不饱和脂肪酸,双键介于C-9与C-10之间(Δ9),且多不饱和脂肪酸的其它双键一般是Δ12和Δ15。几乎所有天然存在的不饱和脂肪酸的双键都呈顺式构型。(伦宁格等人,生物化学原理,第1卷,麦克米伦,2005)
[0082] 饱和脂肪酸的实例包括(但不限于)丁酸(酪酸)(C4)、己酸(羊油酸)(C6)、辛酸(羊脂酸)(C8)、癸酸(羊蜡酸)(C10)、十二烷酸(月桂酸)(C12)、十四烷酸(肉豆蔻酸)(C14)、十六烷酸(棕榈酸)(C16)、十八烷酸(硬脂酸)(C18)和二十烷酸(花生酸)(C20)、二十二酸(山
嵛酸)(C22)、二十四烷酸(木蜡酸)(C24)。不饱和脂肪酸的实例包括(但不限于)肉豆蔻脑酸(C14∶1,顺式Δ9)、棕榈油酸(C16∶1,顺式Δ9)、十六碳烯酸(C16∶1,顺式Δ6)、油酸(C18∶1,顺式Δ9)、亚油酸(C18∶2,顺式Δ9、顺式’Δ12)、α-亚油酸(C18∶3,顺式Δ9、顺式Δ12、顺式Δ15)、花生四烯酸(C20∶4,顺式Δ5、顺式Δ8、顺式Δ11、顺式Δ14)、二十碳五烯酸(C20∶5,顺式Δ5、顺式Δ8、顺式Δ11、顺式Δ14、顺式Δ17)、芥酸(C22∶1、顺式-Δ13)和二十二碳六烯酸(C22∶6,顺式Δ4、顺式Δ7、顺式Δ10、顺式Δ13、顺式Δ16、顺式Δ19)。长链脂肪酸还可通过适宜链延长程序从更容易获得的短链脂肪酸(C12-C18)来制备。
[0083] 天然存在的分支链脂肪酸的非限制性实例包括异脂肪酸(主要具有偶数个碳原子)和反异脂肪酸(主要具有奇数个碳原子)、细菌脂质中的聚甲基分支酸和基于叶绿醇的
酸。
[0084] 最常见环状酸含有环丙烷、环丙烯或环戊烯单元。环丙烷酸存在于细菌膜磷脂中且主要为C17或C19酸(乳杆菌酸)。环丙烷单元如顺式双键一般在分子中引入不连续性且提
高膜中的流动性。
[0085] 脂肪酸和含有它们的化合物的物理性质主要是通过烃链的长度和不饱和程度来确定。非极性烃链导致脂肪酸在水中的低溶解度。脂肪酰基链越长且双键越少,在水中的溶解度越低。羧酸基团为极性(且在中性pH下离子化)并导致短链脂肪酸在水中的微弱溶解
度。脂肪酸和含有它们的化合物的熔点也受到烃链长度和不饱和程度的强烈影响。在完全
饱和的化合物中,围绕每一碳-碳键自由转动使烃链具有高柔性;最稳定构象是这种完全延长的形式,其中相邻原子的位阻降到最低。这些分子可以接近结晶的阵列紧密填塞在一起,且原子都延其长度与相邻分子的原子呈范德华(van der Waals)接触。顺式双键迫使烃链
扭结。具有一个或若干个所述扭结的脂肪酸不能像完全饱和脂肪酸那样紧密地填塞在一
起,且其与彼此的相互作用因而较弱。由于扰乱不饱和脂肪酸的这些有序性较差的阵列所
热能较少,其熔点低于具有相同链长度的饱和脂肪酸(伦宁格等人,生物化学原理,第1
卷,麦克米伦,2005)。
[0086] 本文所用术语“脂肪酸衍生物”是指衍生自脂肪酸的有机分子。脂肪酸衍生物的实例包括(但不限于)C1-C5脂肪酸酯(例如脂肪酸甲基酯和脂肪酸乙基酯)、蜡酯、脂肪醇、脂肪醛、烷烃和烯烃。
[0087] 本文所用术语“脂肪醇”是指由脂肪酸或脂肪酸衍生物制备且具有式ROH的醇。脂肪醇的烃链可为直链或分支链。所述烃链可为饱和或不饱和的。
[0088] 本文所用术语“脂肪醛”是指由脂肪酸或脂肪酸衍生物制备且具有式RCHO的醛。脂肪醛的烃可为饱和或不饱和的。
[0089] 本文所用术语“基因”是指编码蛋白质或功能性RNA(例如,tRNA)的核酸分子。基因可包括不编码最终蛋白质或RNA产物的区域,例如5’或3’非翻译区域、内含子、核糖体结合位点、启动子或增强子区域,或其它相关和/或调节序列区域。
[0090] 在本文中术语“基因表达”与“表达”可互换使用,且是指使来自基因(例如DNA序列)的可遗传的信息成为功能性基因产物(例如蛋白质或RNA)的过程。
[0091] 本文所用术语“遗传改造”是指使用分子生物学方法操作核酸序列并将核酸分子引入宿主生物体中。本文所用术语“经遗传改造”意味着细胞已经受重组DNA操作(例如引入外源核酸分子),从而产生呈最初在自然界中未发现的形式的细胞。
[0092] 本文所用术语“生长”是指变大、变长或甚至变多的过程,或可指示细胞群中细胞的大小、数目或体积的增加。
[0093] 本文所用术语“异养的”是指生长需要还原性碳底物。
[0094] 本文所用术语“异养生物”是指不产生自己的食物且必须从环境获取其一些营养物(例如,呈还原性碳形式)的生物体。
[0095] 基因或蛋白质的“同系物”是指其在另一物种中的功能等效物。
[0096] 本文所用术语“烃”是指仅由氢和碳以不同比率构成的任何有机化合物。
[0097] 术语“杂交”是指两个单股核酸分子通过配对彼此结合。核苷酸在正常条件下将结合其补体,所以两个完全互补的股将易于彼此结合(或‘复性’)。然而,由于核苷酸的不同分子几何结构,两个股之间的单一不一致性将使其之间的结合在能量上更不利。通过对两个股复性的比率进行定量来测量碱基不相容性的效应可提供关于所复性两个股之间碱
基序列的相似性的信息。
[0098] 本文所用术语“4-羟基苯甲酰基-CoA硫酯酶”、“羟基苯甲酰基-CoA硫酯酶”、“4-羟基苯甲酸酯硫酯酶”和“4-HBT”是指可催化4-羟基苯甲酰基-CoA的硫酯键裂解以形成羟基苯甲酸酯的硫酯酶(EC3.1.2.23),所述路径中三个步骤的最后一步将4-氯苯甲酸酯转化为羟基苯甲酸酯。
[0099] 本文所用术语“诱导剂”是指可起始受诱导型启动子控制的基因转录的分子。
[0100] 本文所用术语“诱导型启动子”是指启动其可操作地连接的基因转录的活性受环境条件(例如,温度、光或诸如此类)或诸如特定化合物或生物分子等因素的存在控制的启
动子。术语“组成型启动子”是指在生物体所有细胞中活性都维持在相对恒定的水平且几乎不受或不受细胞环境条件(如底物浓度)影响的启动子。
[0101] 本文所用术语“抑制(inhibiting、inhibit和inhibition)”是指降低过程的数量或速率,完全停止过程或减小、限制或阻断其作用或功能。抑制可包括与参考物质相比将数量、速率、作用、功能或过程降低或减小至少5%,例如至少10%、至少15%、至少20%、至少
25%、至少30%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%或至少99%,其中所述参考物质是不受抑制的物质。
[0102] “无机碳”是无法被生物体用作能源的含碳化合物或分子。“无机碳”通常呈CO2(二氧化碳)、碳酸、碳酸氢盐或碳酸盐形式,其无法被生物体进一步氧化供能或无法用作还原力来源。
[0103] 本文所用术语“插入诱变”是指通过将外源DNA插入基因中来诱变DNA。
[0104] 本文所用术语“分离”是指获得物质、分子、蛋白质、肽、核酸或抗体的过程,所述各项以对于其计划用途实用且适当的程度实质上不含其在自然界或活体内系统中通常一起被发现的其它物质。
[0105] 术语“分离的”是指诸如核酸肽或蛋白质等材料,其:(1)实质上或基本上不含在其天然存在的环境中发现通常伴随其或与其相互作用的组份,或(2)如果所述材料位于其自然环境中,那么可通过有意的人类干预以合成方式(非天然方式)将所述材料改变为组合物
和/或将其置于细胞中对于在所述环境中发现的材料非天然的位置(例如,基因组或亚细胞
器)处。所用术语“实质上或基本上不含”是指材料至少80%不含、例如至少90%不含、至少
95%不含或至少99%不含(其中百分比仅在适用时是重量百分比)在其天然存在的环境中
发现通常伴随其或与其相互作用的组份。分离材料任选地包含未发现在其自然环境中与所
述材料一起的材料。
[0106] 本文所用术语“异源的”是指核酸源自与引入所述核酸的物种或与所述核酸通过对生物体或其祖先进行遗传改造而驻留在其中的物种不同的物种。异源蛋白质源自与产生
或引入所述蛋白质的物种不同的物种。异源核酸序列、基因或蛋白质是源自与引入其或其
所驻留的生物体不同的生物体的核酸序列、基因或蛋白质。
[0107] 在提到基因调节元件时,“异源的”是指基因调节元件与其在自然界中不结合的基因可操作地连接。本文所用术语“异源表达”意味着将编码蛋白质(例如,酶)的异源核酸置入通常不制备(即表达)所述蛋白质的细胞中。
[0108] 本文所用术语“乳糖类似物”是指用作乳糖代用品的化合物,其中乳糖的葡萄糖部分经另一化学基团替代。乳糖类似物的实例包括(但不限于)异丙基-β-D-硫代-半乳糖苷(IPTG)、苯基-β-D-半乳糖(苯基-Gal)和异乳糖。
[0109] 本文所用术语“脂质”是指一类化学上多变的化合物,其共同的定义性特征是其不溶于水。
[0110] 本文所用术语“代谢改造”一般是指定向且有目的的改变在生物体中发现的代谢路径以更好地理解和利用用于化学转化、能量转导和超分子装配的细胞路径。
[0111] 本文所用术语“代谢中间体”是指通过一系列酶促反应产生的前驱物分子,其通过后续酶促反应而改变。
[0112] 术语“微生物”是指大小小到只有在显微镜帮助下才可见的活生物体。
[0113] 本文所用术语“兼养的”是指细胞或生物体能使用不同能源和碳源的混合,例如使用光营养(意味着生长使用光能)和化学营养(意味着生长使用电子供体氧化的能量),或介于化学自养与异养之间。
[0114] 本文所用术语“核酸”是指呈单股或双股形式的脱氧核糖核苷酸或核糖核苷酸聚合物,且除非另外限制,其涵盖因为以类似于天然存在的核苷酸的方式与单股核酸杂交而
具有天然核苷酸的基本性质的类似物(例如,肽核酸)。
[0115] 本文所用术语“核苷酸”是指由杂环碱基、糖和一个或一个以上磷酸基团组成的化学化合物。在大多数常见核苷酸中,碱基是嘌呤或嘧啶的衍生物,且糖是戊糖(脱氧核糖或核糖)。核苷酸是核酸的单体,且三个或三个以上键结在一起形成核酸。核苷酸是RNA、DNA和若干种辅因子(包括(但不限于)CoA、FAD、DMN、NAD和NADP)的结构单元。嘌呤包括腺嘌呤(A)和嘌呤(G);嘧啶包括胞嘧啶(C)、胸腺嘧啶(T)和尿嘧啶(U)。
[0116] 本文所用术语“可操作地连接”是指遗传调节元件或区域与另一核酸序列之间的功能性连接,其中所述遗传调节元件或区域促进、抑制、终止、起始或介导对应于另一序列的核酸序列的转录、翻译、更新、处理或运输。
[0117] 本文所用术语“复制起点”是指基因组、染色体或附加体中起始DNA复制的具体序列。
[0118] 本文所用术语“开放阅读框”是指DNA分子中编码氨基酸序列且未夹杂终止密码子的核苷酸序列,其可能编码肽或蛋白质的至少一部分。完整的开放阅读框始于起始密码子
(通常是ATG),之后是一串各自编码氨基酸的密码子,且以终止密码子(TAA、TAG或TGA)结
束。开放阅读框通常可通过将其序列与已测序基因或已表达序列标志(EST)匹配来确认。
[0119] 本文所用术语“过表达”是指基因或基因产物的量相对于所述基因或基因产物在正常条件下的量有所增加。
[0120] 本文所用术语“肽”是指从以确定顺序连接在一起的氨基酸形成的生物聚合物。已知一个氨基酸残基与下一个氨基酸残基之间的连接是酰胺键或肽键。本文所用术语“多肽”是指氨基酸单链,且“蛋白质”是指一个或一个以上多肽。术语多肽、肽和蛋白质还包括修饰,包括(但不限于)糖基化、脂质附接、硫酸化、谷氨酸残基的γ-羧基化、羟基化和ADP-核糖基化。多肽可并非完全是直链。例如,多肽可因泛素化而有分支,且其一般可因翻译后事件(包括天然处理事件和因并非天然发生的人类操作引起的事件)而为环形且具有或不具有分支。
[0121] 术语“Pfam”是指蛋白质结构域和蛋白质家族的大型集合,其是由Pfam协会(Pfam Consortium)维护且可在若干个赞助商万维网站点获得,包括:pfam.sanger.ac.uk/(韦尔科姆基金会桑格学院研究所(Welcome Trust,Sanger Institute));pfam.sbc.su.se/(斯
德哥尔摩生物信息中心(Stockholm Bioinformatics Center));pfam.janelia.org/(珍利
亚农场,霍华德·休斯医学研究所(Janelia Farm,Howard Hughes Medical Institute));
pfam.jouy.inra.fr/(国立农学研究学院(Institut national de la Recherche 
Agronomique));和pfam.ccbb.re.kr/。Pfam的最新版是基于UniProt蛋白质数据库15.6版
(Swiss-Prot57.6版与TrEMBL40.6版的复合库)的Pfam24.0(2009年10月,11912个家族)。
Pfam结构域和家族是使用多种序列比对和隐藏式马可夫模型(hidden Markov model,HMM)
来鉴别。基于高质量赋值的Pfam-A家族是通过使用蛋白质家族代表性成员的精选种子比对
和基于所述种子比对的剖面隐藏式马可夫模型来生成。然后使用经鉴别属于所述家族的所
有序列自动生成对所述家族的完全比对(松哈默(Sonnhammer)等人(1998)核酸研究
(Nucleic Acids Research)26:320-322;贝特曼(Bateman)等人(2000)核酸研究26:263-
266;贝特曼等人(2004)核酸研究32,数据库期号:D138-D141;芬恩(Finn)等人(2006)核酸研究数据库期号34:D247-251;芬恩等人(2010)核酸研究数据库期号38:D211-222)。通过使用(例如)上文提到的任一网站访问pfam数据库,可对照隐藏式马可夫模型(HMM)使用HMMER
同源性搜索软件(例如,HMMER3,hmmer.janelia.org/)查询蛋白质序列。鉴别所查询蛋白质属于pfam家族(或具有具体pfam结构域)的显著匹配是二进制分值大于或等于Pfam结构域
的收集阈值的匹配。本文所用术语“收集阈值(GA)”或“收集截止值”是指用于构建完全比对的搜索阈值。收集阈值是序列要属于Pfam条目的完全比对所必须达到的最低分值。4-羟基
苯甲酰基-CoA硫酯酶家族(PF03061)的收集阈值是20.6。还可使用期望值(e值)作为在pfam
中包括所查询蛋白质的判据或用于确定所查询蛋白质是否具有具体pfam结构域,其中低e
值(远低于1.0,例如低于0.1,或低于或等于0.01)代表偶然性匹配的低概率。
[0122] 本文所用术语“光养生物”是指使用阳光作为其主要能源的生物体。“光养性”生长或培养意味着生物体使用光而非有机分子功能的生长或培养。
[0123] 本文所用术语“光合微生物”包括(但不限于)可光养性生长的所有藻类、微藻和光合细菌。
[0124] 本文所用术语“质粒”是指与细胞的染色体DNA分离且可独立于染色体DNA复制的DNA分子。其为双股且在多种情形中是环形。
[0125] 本文所用术语“多肽”是指含有约10个到约1000个以上氨基酸的肽。
[0126] 术语“多核苷酸”或“核酸分子”是指脱氧核糖多核苷酸、核糖多核苷酸或其类似物,所述类似物因为在严格杂交条件下与跟天然存在的核苷酸实质上相同的核苷酸序列杂交和/或容许翻译为与天然存在的核苷酸相同的氨基酸而具有天然脱氧核糖多核苷酸或核
糖核苷酸的基本性质。多核苷酸可为天然或异源结构或调节基因的全长序列或子序列。除
非另外指明,否则所述术语包括参考指定序列以及其互补序列。因此,主链因稳定性或其它原因经修饰的DNA或RNA是“多核苷酸”,如所述术语在本文中所希望的那样。此外,包含罕见碱基(例如肌苷)或经修饰碱基(例如三苯甲基化碱基)(仅列举两个实例)的DNA或RNA是多
核苷酸,如所述术语在本文所使用的那样。应了解,已对DNA和RNA进行众多种修饰,其用于多种有用目的且为所属领域技术人员已知。如本文中所采用的术语多核苷酸包括多核苷酸
的所述化学、酶或代谢修饰形式,以及病毒和细胞(尤其包括简单和复杂细胞)特有的DNA和RNA的化学形式。
[0127] 术语“引物”是指在与DNA或RNA股杂交时能用作底物的核酸分子,在延长产物的合成中在适宜聚合剂(例如,DNA聚合酶)存在下将核苷酸添加到所述底物。在一些情形中,引物足够长以仅与DNA或RNA股的特定区域杂交。
[0128] 本文所用术语“启动子”是指DNA中靠近转录起始位点的区域,其参与RNA聚合酶和其它蛋白质的识别和结合以起始转录。给定启动子可与其它调节区域(增强子、沉默子、边界元件/绝缘子)协同工作以引导给定基因的转录水平。
[0129] 本文所用术语“lac启动子”是指lac操纵子的启动子,其转录活性受阻遏蛋白(即由lacI基因编码的LacI蛋白质)阻遏但由诱导剂(例如乳糖或其类似物,例如,异丙基-β-D-硫代半乳糖苷(IPTG))解除。诱导剂结合阻遏蛋白并防止其阻遏基因转录。
[0130] 本文所用术语“tac启动子”是指由trp启动子的-35位区域和lacUV5启动子/操纵基因的-10位区域组成的强杂合启动子。tac启动子的表达受LacI蛋白质阻遏。lacIq等位基因是启动子突变,其提高LacI阻遏剂的细胞内浓度,从而引发tac启动子的强阻遏。tac启动子的转录活性受乳糖或其类似物控制。
[0131] 本文所用术语“trc启动子”是指lac和trp启动子的杂合启动子序列。trc启动子的转录活性也受乳糖或其类似物控制。trc启动子的一个实例是trcY启动子(5’-CTGAAATGAGCTGTTGACAATTAATCATCCGGCTCGTAT
[0132] AATGTGTGGAATTGTGAGCGGATAACAATTTCACACTAAGGAGGAAAA AAA-3’;SEQ ID NO:52)。
[0133] 本文所用术语“重组”是指打散并重组DNA各部分的过程。本文所用术语“同源重组”是指一类遗传重组,其中在两个相似或相同DNA分子之间交换核苷酸序列。
[0134] “重组”或“经改造”核酸分子是已通过人类操作经改变的核酸分子。作为非限制性实例,重组核酸分子包括任何如下核酸分子:1)已在活体外使用(例如)化学或酶促技术(例如,通过使用化学核酸合成,或通过使用用于核酸分子的复制、聚合、消化(核酸外切或核酸内切)、连接、反转录、转录、碱基修饰(例如,包括甲基化)、整合或重组(包括同源和位点特异性重组)的酶)部分或完全合成或修饰;2)包括在自然界未连结的连结核苷酸序列,3)已使用分子克隆技术改造以使其相对于天然存在的核酸分子序列缺少一个或一个以上核苷
酸,和/或4)已使用分子克隆技术进行操作以使其相对于天然存在的核酸序列具有一个或
一个以上序列变化或重排。作为非限制性实例,cDNA是重组DNA分子,其为任何已通过活体外聚合酶反应生成、或已附接有连接体、或已整合到载体(例如克隆载体或表达载体)中的
核酸分子。
[0135] 在应用于生物体时,术语重组、经改造或经遗传改造是指已通过将外源或重组核酸序列引入生物体中来操作的生物体,且包括具有基因敲除、定向突变和基因替代、启动子替代、缺失或插入的生物体,以及具有已引入生物体中的外源基因的生物体。可将外源或重组核酸分子整合到重组/经遗传改造生物体的基因组中,或在其它情况下可不将其整合到
重组/经遗传改造生物体的基因组中。
[0136] 本文所用术语“重组蛋白质”是指通过遗传改造产生的蛋白质。
[0137] 本文所用术语“重组酶”是指催化遗传重组的酶。
[0138] “还原性碳”或“还原性碳化合物”或“还原性碳源”是指基于碳的分子,其包括碳和氢且可由生物体通过氧化或糖酵解用作能源。还原性碳的非限制性实例是糖(包括多糖和淀粉)、醇(包括甘油和糖醇)、有机酸形式(例如,乙酸盐、柠檬酸盐、琥珀酸盐等)、氨基酸、蛋白质、脂质和脂肪酸。还原性碳有时称作“有机碳”。
[0139] 术语“调节序列”(还称作“调节区域”或“调节元件”)是指启动子、增强子、5’非翻译区域、3’非翻译区域、核糖体结合位点或DNA或RNA中调节邻近基因的表达的其它片段。
[0140] 术语“氨基酸残基”与“氨基酸”可互换使用且是指纳入蛋白质、多肽或肽中的氨基酸,包括(但不限于)天然存在的氨基酸以及可以与天然存在的氨基酸类似的方式发挥功能的天然氨基酸的已知类似物。
[0141] 在本文中使用以下术语来阐述两个或两个以上核酸或多核苷酸之间的序列关系:(a)“参考序列”、(b)“比较窗”、(c)“序列一致性”、(d)“序列一致性百分比”和(e)“实质一致性”。
[0142] 术语“参考序列”是指用作序列比较的依据的序列。参考序列可为指定序列的子集或整体;例如,呈全长cDNA或基因序列的片段或完整cDNA或基因序列。
[0143] 术语“比较窗”是指多核苷酸序列的邻接的指定片段,其中可将所述多核苷酸序列与参考序列作比较且其中所述多核苷酸序列在比较窗中的部分与参考序列(其不包含添加或缺失)相比可包含添加或缺失(即空位)以达成两个序列的最佳比对。一般来说,比较窗长度为至少20个邻接核苷酸,且可任选地长度为至少30个邻接核苷酸,例如长度为至少40个
邻接核苷酸,长度为至少50个邻接核苷酸,长度为至少100个邻接核苷酸或更长。所属领域技术人理解,为避免因多核苷酸序列中包括空位而具有对参考序列的高相似性,通常引入
空位罚分且从匹配数中减去所述罚分。
[0144] 用于比较的序列比对方法为业内所熟知。用于比较的序列的最佳比对可通过以下方式来实施:局部同源性算法,史密斯(Smith)和沃特曼(Waterman),应用数学进展
(Adv.Appl.Math.)2:482(1981);同源性比对算法,尼德曼(Needleman)和翁施(Wunsch),分子生物学杂志(J.Mol.Biol.)48:443(1970);相似性搜索方法,皮尔森(Pearson)和利普曼(Lipman),国家科学院院刊(Proc.Natl.Acad.Sci.)85:2444(1988);所述算法的计算机化实施,包括(但不限于):PC/基因程序中的CLUSTAL,智能遗传(Intelligenetics)山景城,加利福尼亚州;威斯康星州遗传学(Wisconsin Genetics)软件包中的GAP、BESTFIT、BLAST、FASTA和TFASTA,遗传学计算机集团(Genetics Computer Group,GCG),科学驱动路
(Science  Dr.)575号,麦迪逊,威斯康星州,美国;CLUSTAL程序详细阐述于希金斯
(Higgins)和夏普(Sharp),基因(Gene)73:237-244(1988)中;希金斯和夏普,计算机生物应用(CABIOS)5:151-153(1989);科尔佩(Corpet)等人,核酸研究16:10881-90(1988);黄
(Huang)等人,计算机生物应用8:155-65(1992);以及皮尔森等人,分子生物学方法
(Methods in Molecular Biology)24:307-331(1994)。可用于数据库相似性搜索的BLAST
程序家族包括:BLASTN,其用于对照核苷酸数据库序列查询核苷酸序列;BLASTX,其用于对照蛋白质数据库序列查询核苷酸序列;BLASTP,其用于对照蛋白质数据库序列查询蛋白质
序列;TBLASTN,其用于对照核苷酸数据库序列查询蛋白质序列;和TBLASTX,其用于对照核苷酸数据库序列查询核苷酸序列。参见最新分子生物学实验方法(Current Protocols in 
Molecular Biology),第19章,奥苏贝尔(Ausubel)等人编辑,格林出版与威利跨学科
(Greene Publishing and Wiley-Interscience),纽约(1995)。
[0145] 除非另外说明,否则本文提供的序列一致性/相似性值是指使用BLAST2.0程序套件使用默认参数获得的值。阿特舒尔(Altschul)等人,核酸研究25:3389-3402(1997)。用于执行BLAST分析的软件可在ncbi.nlm.nih.gov通过(例如)国家生物技术信息中心
(National Center for Biotechnology-Information)公开获得。这种算法首先涉及通过
鉴别查询序列中长度W的短字来鉴别高评分序列对(HSP),所述短字在与数据库序列中具有
相同长度的字码比对时匹配或符合某一正阈值分值T。T称作相邻字码分值阈值(阿特舒尔
等人,见上文)。所述初始相邻命中字码起种子作用,用于起始发现含有所述字码的更长HSP的搜索。然后将命中字码沿每一序列在两个方向上延伸,以尽可能地增加累积比对分值。对于核苷酸序列,累积分值是使用参数M(匹配残基对的奖励分值;始终>0)和N(错配残基的
罚分分值;始终<0)来计算。对于氨基酸序列,使用评分矩阵来计算累积分值。命中字码在每一方向上的延伸在以下情况下停止:累积比对分值从其所达到的最大值降低X数量;累积分值由于一种或一种以上负评分残基比对的积累而变为零或更低;或达到任一序列的端
点。BLAST算法参数W、T和X决定比对的灵敏度和速度。BLASTN程序(对于核苷酸序列)默认使用字码长度(W)11、期望值(E)10、截止值100、M=5、N=-4和两条股的比较。对于氨基酸序列,BLASTP程序默认使用字码长度(W)3、期望值(E)10和BLOSUM62评分矩阵(参见赫尼科夫
(Henikoff)和赫尼科夫,美国国家科学院院刊,1989,89:10915)。
[0146] 除了计算序列一致性百分比以外,BLAST算法还对两个序列之间的相似性执行统计学分析(例如,参见卡尔林(Karlin)和阿特舒尔,美国国家科学院院刊,1993,90:5873-
5787)。BLAST算法提供的一种相似性量度是最小和概率(P(N)),其指示两个核苷酸或氨基
酸序列之间偶然发生匹配的概率。BLAST搜索假定可将蛋白质建模为随机序列。然而,许多真实蛋白质包含非随机序列区域,所述区域可为同聚束、短周期重复序列或富集一种或一
种以上氨基酸的区域。即使无关蛋白质的其它区域完全不同,也可比对所述蛋白质之间的
所述低复杂性区域。可采用多种低复杂性过滤程序来减少所述低复杂性比对。例如,可以单独或组合方式采用SEG(伍滕(Wooten)和费德亨(Federhen),计算机与化学
(Comput.Chem.),1993,17:149-163)和XNU(克拉弗里(Claverie)和斯泰特(States),计算机与化学,1993,17:191-201)低复杂性过滤器
[0147] 本文所用“序列一致性”或“一致性”在两个核酸或多肽序列背景下是指两个序列中在指定比较窗中以最大对应性比对时相同的残基。在关于蛋白质使用序列一致性百分比时应认识到,不一致残基位置的不同之处通常在于保守氨基酸取代(即,其中用具有相似化学性质(例如,电荷和/或疏水性)的氨基酸残基取代其它氨基酸残基且因此不改变分子的
功能性质)。如果序列的不同之处在于保守取代,那么可上调序列一致性百分比以针对取代的保守性进行校正。称不同之处在于所述保守取代的序列具有“序列相似性”或“相似性”。
进行此调节的方式为所属领域技术人员所熟知。此调节通常涉及将保守取代评为部分而非
完全错配,由此提高序列一致性百分比。因此,例如,如果相同氨基酸得分为1且非保守取代得分为0,那么保守取代的得分在0与1之间。保守取代的评分是根据(例如)迈耶斯(Meyers)和米勒(Miller)的算法(计算机生物科学应用(Computer Applic.Biol.Sci.),1988,4:11-
17)来计算,例如,如在程序PC/基因(智能遗传,山景城,加利福尼亚州,美国)中所实施。
[0148] 本文所用“序列一致性百分比”意味着通过在比较窗中比较两个最佳比对序列来测定的值,其中多核苷酸序列在比较窗中的部分与参考序列(其不包含添加或缺失)相比可
包含添加或缺失(即空位)以达成两个序列的最佳比对。所述百分比是通过以下方式来计
算:测定两个序列中出现相同核酸碱基或氨基酸残基的位置数以得到匹配位置数,将匹配
位置数除以比较窗中的位置总数,并将结果乘以100,从而得到序列一致性百分比。除非另外说明,否则序列的同源性%跨越查询序列(比较窗)的全长。
[0149] 术语多核苷酸序列的“实质一致性”意味着在使用所述比对程序中的一种使用标准参数与参考序列相比时,多核苷酸包含具有至少70%序列一致性(例如至少80%序列一
致性、至少85%序列一致性、至少90%序列一致性、至少95%序列一致性、至少96%序列一致性、至少97%序列一致性、至少98%序列一致性或至少99%序列一致性)的序列。所属领域技术人员将认识到,这些值可通过考虑密码子简并度、氨基酸相似性、阅读框定位和诸如此类加以适当调节,以确定由两个核苷酸序列编码的蛋白质的相应一致性。出于所述目的,氨基酸序列的实质一致性通常意味着至少60%、例如至少70%、至少80%、至少85%、至少
90%或至少95%的序列一致性。核苷酸序列实质上一致的另一指示是两个分子在严格条件
下彼此杂交。然而,如果所编码多肽实质上一致,那么在严格条件下彼此不杂交的核酸仍实质上一致。在(例如)使用遗传密码所允许的最大密码子简并度产生核酸拷贝时可发生这种
情况。两个核酸序列实质上一致的一个指示是,第一个核酸编码的多肽与第二个核酸编码
的多肽在免疫学上交叉反应。
[0150] 在肽背景下术语“实质一致性”指示,在指定比较窗中,肽包含与参考序列具有至少70%序列一致性,例如与参考序列具有至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%或至少99%序列一致性的序列。任选地,最佳比对是使用同源性比对算法(尼德曼和翁施,分子生物学杂志,48:443(1970))来实施。两个肽序列实质上一致的指示是,一个肽与针对另一个肽产生的抗体具有免疫反应性。因此,例如,如果一个肽与另一个肽的不同之处仅在于保守取代,那么这两个肽实质上一致。“实质上相似”的肽共有如上文所述的序列,只是不一致的残基位置的不同之处可在于保守氨基酸变化。
[0151] 基因或核酸序列的“变体”是与参考基因或核酸序列具有至少65%一致性的序列,且相对于参考序列可包括一个或一个以上碱基缺失、添加或取代。这些序列的差异可由序列或结构的天然或设计的变化所致。天然变化可在特定核酸序列在自然界中的正常复制或
倍增过程期间发生。设计的变化可出于特定目的而专门设计并引入序列中。所述特定变化
可在体外使用多种诱变技术来产生。所述专门产生的序列变体可称作原始序列的“突变
体”。
[0152] 肽或蛋白质的“变体”是相对于参考肽或蛋白质在一个或一个以上氨基酸位置处变化的肽或蛋白质序列。变体可为天然存在的变体或可为编码变体肽或蛋白质的核酸分子
的自发、诱导或经遗传改造突变的结果变体肽也可为化学合成变体。
[0153] 多肽的“保守变体”是相对于参考多肽具有一个或一个以上保守氨基酸取代的多肽,其中所述多肽的活性、底物亲和性、结合亲和性与参考多肽并无显著不同。
[0154] 所属领域技术人员也可制造具有单一或多个氨基酸取代、缺失、添加和/或替代的多肽变体。这些变体尤其可包括:(a)其中一个或一个以上氨基酸残基经保守或非保守氨基酸取代的变体;(b)其中添加一个或一个以上氨基酸的变体;(c)其中至少一个氨基酸包括
取代基的变体;(d)其中来自一个物种的氨基酸残基在保守或非保守位置处取代另一个物
种中的相应残基的变体;和(e)其中靶蛋白质与可赋予靶蛋白质可用性质(例如用于抗体的
表位)的另一肽或多肽融合的变体(例如融合配偶体、蛋白质标志或其它化学部分)。用于获得所述变体的技术(包括遗传(抑制、缺失、突变等)、化学和酶技术)为所属领域技术人员已知。本文所用术语“突变”是指生物体的基因或染色体内DNA序列的变化,其导致产生在亲代类型中未发现的新特征或性状;或在染色体中通过改变编码基因的DNA的核苷酸序列或通
过改变染色体的物理排列发生此一变化的过程。三种突变机制包括取代(用一个碱基对交
换另一个碱基对)、添加(将一个或一个以上碱基插入序列)和缺失(损失一个或一个以上碱
基对)。
[0155] 本文所用术语“特异性杂交”是指核酸与至少一股最初与所述核酸不成对的核酸靶序列的互补区域特殊地或决定性地形成碱基对的过程。选择性杂交的核酸在严格杂交条
件下经历核酸序列与指定核酸靶序列的杂交,其杂交程度显著比其与非靶核酸序列的杂交
高(例如,超过背景至少2倍)且以实质上排除非靶核酸。选择性杂交序列通常彼此具有约至少80%序列一致性、至少85%序列一致性、至少90%序列一致性、至少95%序列一致性、至少96%序列一致性、至少97%序列一致性、至少98%序列一致性、至少99%序列一致性或约
100%序列一致性(即互补)。
[0156] 本文所用术语“稳定整合”意味着将外源或异源遗传材料整合到宿主基因组中且由细胞的后代继承。
[0157] 本文所用术语“硫酯酶(TE)”或“硫酯水解酶”是指一大类酶,其成员水解羰基与硫原子之间的硫酯键。国际生物化学与分子生物学联盟的命名委员会(Nomenclature Committee of the International Union of Biochemistry and Molecular Biology,
NC-IUBMB)将所述酶分类为EC(酶学委员会)3.1.2.1到EC3.1.2.27,以及EC3.1.2.(对于未
分类TE)。所述27个分组中15个分组的底物含有辅酶A(CoA),两个底物含有酰基载体蛋白
(ACP),4个底物具有谷胱甘肽或其衍生物,一个底物具有泛素,且两个底物含有其它部分。
另外,3个分组已被删除(坎图(Cantu)等人(2010)蛋白质科学(Protein Science),19:
1281-1295)。
[0158] 本文所用术语“三酰基甘油”或“甘油三酯”是指一类由经脂肪酸通过酯键连接到三个OH基团中的每一个的甘油(三碳三羟基醇)组成的化合物。
[0159] 本文所用术语“转运肽”是指通常位于前驱物蛋白质N-末端的肽序列,其将基因产物引导到其特定细胞目的地(例如质体)。
[0160] 本文所用术语“过低表达”是指基因或基因产物的量相对于基因或基因产物在正常条件下的量有所降低。
[0161] 本文所用术语“载体”是指用作载体或转运体的任何试剂(例如噬菌体、质粒、粘粒、杆粒、噬菌体或病毒),另一遗传序列或元件(DNA或RNA)可附接到所述试剂以使得可将所述序列或元件运输到宿主细胞中。
[0162] 本文所用术语“表达载体”一般是指已构筑核酸分子,其构筑方式使得在插入DNA分子后,所述DNA分子的编码序列正确地转录为RNA分子且所述RNA分子可任选地翻译成蛋
白质。可作为载体的核酸构筑体通常经改造以含有用作增强子和启动子区域的调节序列,
其使得可有效转录携载于表达载体上的开放阅读框。
[0163] “Uniprot”或通用蛋白质资源(Universal Protein Resource)蛋白质数据库包括得自Swiss-Prot、TrEMBL(翻译EMBL核苷酸序列数据文库)和蛋白质序列数据库(Protein 
Sequence Database)的综合蛋白质数据库。可在uniprot.org对照Uniprot数据库搜索蛋白
质序列。
[0164] 本文所用术语“蜡”或“蜡酯”是指长链脂肪酸与直链脂肪族一元醇的酯,其在一组经鉴别的物理条件下形成固体或柔韧物质。
[0165] 本文所用术语“野生型”是指在自然界中发现的生物体或表型。
[0166] I.用于产生游离脂肪酸和/或衍生物的遗传改造的微生物
[0167] 本发明提供包含编码4-羟基苯甲酰基-CoA硫酯酶(4-HBT)的重组核酸分子用于产生游离脂肪酸和/或游离脂肪酸衍生物的微生物。4-羟基苯甲酰基-CoA硫酯酶基因是通过
针对游离脂肪酸的产生增加进行功能筛选来鉴别且通过使用酰基-ACP作为底物的特异性
生物化学分析来验证。4-羟基苯甲酰基-CoA硫酯酶家族由蛋白质家族的Pfam生物信息学注
释数据库命名为PF03061(贝特曼等人(2000)核酸研究28:263-266;贝特曼等人(2006)核酸研究32:D138-D141;芬恩等人(2010)核酸研究38:D211-222)。在如本文所提供的光合微生物中表达的原核硫酯酶可具有酶学委员会(EC)名称EC3.1.2.23。
[0168] 先前已在公共数据库中注释4-羟基苯甲酰基-CoA硫酯酶超家族针对4-羟基苯甲酰基-CoA的水解活性。基于生物信息学分析、生物化学表征和所鉴别序列在微生物中的表
达,本发明提供,4-羟基苯甲酰基-CoA硫酯酶还具有针对酰基-ACP底物的水解活性且因此
可用于在微生物中产生游离脂肪酸和/或衍生物。
[0169] 根据一个方面,本发明提供包括包含编码4-羟基苯甲酰基-CoA硫酯酶的序列的重组核酸分子的微生物。遗传改造的微生物可产生至少一种游离脂肪酸和/或脂肪酸衍生物。
4-羟基苯甲酰基-CoA硫酯酶当在微生物中表达时可水解酰基-ACP分子。
[0170] 或者或另外,由遗传改造的微生物产生的至少一种游离脂肪酸和/或脂肪酸衍生物的量可为由不包括外源4-羟基苯甲酰基-CoA硫酯酶基因的相同微生物产生的游离脂肪
酸和/或脂肪酸衍生物的量的至少两倍。例如,包括编码4-羟基苯甲酰基-CoA硫酯酶的重组核酸分子的光合微生物可产生至少30mg/升、例如至少40mg/升或至少50mg/升游离脂肪酸
和/或衍生物。例如,宿主微生物可表达硫酯酶以使得可产生一种或一种以上脂肪酸和/或
脂肪酸衍生物。
[0171] 遗传改造的微生物可为任何微生物,包括(但不限于)不等鞭毛藻(包括破囊壶菌)、真菌、细菌、微藻或蓝细菌。用于本发明的适宜微生物宿主的实例包括(但不限于)以下属的成员:梭菌属(Clostridium)、发酵单胞菌属(Zymomonas)、埃希氏菌属(Escherichia)、沙门菌属(Salmonella)、红球菌属(Rhodococcus)、假单胞菌属(Pseudomonas)、芽孢杆菌属(Bacillus)、乳杆菌属(Lactobacillus)、肠球菌属(Enterococcus)、产碱菌属
(Alcaligenes)、克雷伯氏菌属(Klebsiella)、类芽孢杆菌属(Paenibacillus)、节杆菌属
(Arthrobacter)、棒状杆菌属(Corynebacterium)、短杆菌属(Brevibacterium)、毕赤氏酵母属(Pichia)、念珠菌属(Candida)、汉逊氏酵母属(Hansenula)和酵母菌属
(Saccharomyces)。具体破囊壶菌宿主的实例包括(但不限于)裂殖壶菌属(Schizochytrium sp.)和破囊壶菌属(Thraustochytrium sp.)。
[0172] 或者或另外,遗传改造的宿主生物体可为光合微生物,例如微藻。可用作宿主生物体的代表性真核藻类可包括(但不限于)绿藻(green algae、chlorophyte),红藻(red algae、rhodophyte)、藻(diatom、bacillariophyte)、绿枝藻、灰胞藻、绿蜘藻
(chlorarachniophyte)、裸藻、杂色藻和甲藻。可含有编码原核酰基-ACP硫酯酶的外源核酸分子的微藻属的非限制性实例包括(但不限于)曲壳藻属、茧形藻属、双眉藻属、纤维藻属、星形隐藻属、布克罗亚藻属、鲍罗定藻属、葡萄藻、苞球藻属、角毛藻属、四鞭藻属、衣藻属、绿球藻属、绿梭藻属、小球藻属、蓝隐藻属、金球藻属、球钙板藻属、隐甲藻属、隐藻属、小环藻属、杜氏藻属、后棘藻属、圆石藻属、独球藻属、厄诺迪木藻属、眼虫藻属、被刺藻属、脆杆藻属、粘灌木状藻属、红球藻属、盐猎食性藻属、膜胞藻属、等鞭金藻属、鳞孔藻属、微芒藻属、单针藻属、微绿球藻属、微拟球藻属、舟形藻属、新绿藻、肾鞭藻属、肾藻属、菱形藻属、棕鞭藻属、鞘藻属、卵囊藻属、蚝球藻、巴夫藻属、拟小球藻属、佩斯基耶拉藻属、褐指藻属、扁裸藻亚属、微微型绿藻、扁藻属、颗石藻属、宽球藻属、无绿藻属、假小球藻属、假新绿藻属、塔胞藻属、桑椹藻属、栅藻属、骨条藻属、水绵属、裂丝藻属、四爿藻属、海链藻属、韦瑞迪拉藻属和团藻属。
[0173] 或者,微生物可为蓝细菌物种。可包括编码4-羟基苯甲酰基-CoA硫酯酶的外源核酸分子的蓝细菌属的非限制性实例包括(但不限于)阿格门氏藻属、鱼腥藻属、项圈藻属、组囊藻属、束丝藻属、节旋藻属、星球藻属、博氏藻属、眉藻属、管孢藻属、拟绿胶蓝细菌属、拟色球藻属、色球藻属、发毛针藻属、蓝细菌属、蓝菌属、蓝囊藻属、蓝螺藻属、蓝杆藻属、拟柱孢藻属、筒孢藻属、蓝纤维藻属、包皮藻属、侧生藻属、夫列藻属、吉特勒氏蓝细菌属、吉特勒氏线状蓝细菌属、胶菌藻属、粘球藻属、粘杆藻属、盐螺旋藻属、伊延藻属、细鞘丝藻属、湖丝藻属、鞘丝藻属、微鞘藻属、微囊藻属、粘囊藻属、节球藻属、念珠藻属、拟念珠藻属、颤藻属、席藻属、浮丝藻属、宽球藻属、原绿球藻属、原绿藻、原绿发藻属、假鱼腥藻属、胶须藻属、裂须藻属、伪枝藻属、螺旋藻属、直毛藻属、斯塔尔氏蓝细菌属、真枝藻属、束藻属、聚球藻属、集胞藻属、嗜热藻、单岐藻属、束毛藻属、常丝藻属和异球藻属。例如,光合微生物可为聚球藻属、集胞藻属或嗜热藻属。或者,微生物可为蓝菌属、蓝杆藻属或蓝细菌属,或另外或者,微生物可为胶菌藻属、鞘丝藻属或细鞘丝藻属。
[0174] 4-羟基苯甲酰基-CoA硫酯酶基因可为任何4-羟基苯甲酰基-CoA硫酯酶基因,当其在微生物中表达时可使微生物产生游离脂肪酸和/或衍生物。认为可用于本文中的4-羟基
苯甲酰基-CoA硫酯酶可包括4-羟基苯甲酰基-CoA硫酯酶家族(例如,PF03061;参见
pfam.cgb.kise/或pfam.janelia.org/或pfam.sanger.ac.uk/)的成员,其在对照蛋白质家
族的Pfam生物信息学注释数据库查询时可显示以高于阈值收集分值的二进制分值(例如,
高于20.6的二进制分值)与Pfam4-羟基苯甲酰基-CoA硫酯酶家族(PF03061)匹配,和/或可
以小于0.01的期望值(e值)显示与Pfam4-羟基苯甲酰基-CoA硫酯酶家族的Pfam-A匹配(贝
特曼等人(2000)核酸研究28:263-266;贝特曼等人(2006)核酸研究32:D138-D141;芬恩等人(2010)核酸研究38:D211-222)。在如本文所提供光合微生物中表达的4-羟基苯甲酰基-
CoA硫酯酶可具有酶学委员会(EC)名称EC3.1.2.23。
[0175] 本发明进一步涉及包括编码4-羟基苯甲酰基-CoA硫酯酶变体的核酸分子的微生物,例如,其中所述变体对通过基因库(Genbank)登录号(例如本文所提供的基因库登录号)访问的氨基酸序列具有至少70%一致性、例如至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或约100%一致性,其中所述变体具有酰基-ACP水解活性,且所述变体在微生物中的表达可导致产生游离脂肪酸和/或衍生物,所产生的量大于(例如至少两倍大)不包括编码4-羟基苯甲酰基-CoA硫酯酶的核酸分子的微生
物所产生的量。近年来硫酯酶的序列-结构-功能关系已获得显著进展(例如,参见狄龙
(Dillon)和贝特曼,英国医学委员会生物信息学(BMC Bioinformatics)2004,5:109;迈尔(Mayer)和尚克林(Shanklin),生物化学杂志,2005,280:3621-3627;迈尔和尚克林,英国医学委员会植物生物学(BMC Plant Biology),2007,7∶1)。
[0176] 或者或另外,包括编码4-羟基苯甲酰基-CoA硫酯酶的核酸分子的遗传改造的微生物可产生至少一种酰基链长度为8个碳、10个碳、12个碳、14个碳、16个碳、18个碳、20个碳、
22个碳和/或24个碳的游离脂肪酸。此外,或者或另外,遗传改造的微生物可产生至少一种酰基链长度为8到18个碳、例如12到16个碳的游离脂肪酸。
[0177] 尽管4-羟基苯甲酰基-CoA硫酯酶水解4-羟基苯甲酰基-CoA底物的活性已为人所知(如本文实例中所揭示),但现在展示4-羟基苯甲酰基-CoA硫酯酶也能水解具有多种不同
酰基链长度的酰基-ACP底物。例如,本发明涵盖使用可对一种或一种以上酰基链长度为8、
10、12、14、16、18、20、22和/或24个碳的酰基-ACP底物具有底物优先性的4-羟基苯甲酰基-CoA硫酯酶。或者或另外,4-羟基苯甲酰基-CoA硫酯酶可水解一种或一种以上酰基链长度为
8到18个碳、例如12到16个碳的酰基-酰基载体蛋白(ACP)底物。此外,或者或另外,在一些实施例中,本发明4-羟基苯甲酰基-CoA硫酯酶可对酰基链长度为8、10、12、14、16和/或18个碳的酰基-ACP底物具有其最高水平活性。
[0178] 在一些实施例中,具有表达4-羟基苯甲酰基-CoA硫酯酶的重组基因的微生物可主要产生酰基链长度为8、10、12、14、16和/或18个碳的游离脂肪酸和/或总碳数为8、10、12、
14、16、18、20、22、24、26、28、30、32、34和/或36个碳的脂肪酸衍生物。或者或另外,至少
30wt%、例如至少40wt%、至少50wt%、至少60wt%、至少70wt%、至少80wt%、至少90wt%或至少95wt%的如本文所揭示的遗传改造的微生物产生的游离脂肪酸可为酰基链长度为
8、10、12、14、16和/或18个碳的脂肪酸和/或总碳数为8、10、12、14、16、18、20、22、24、26、28、
30、32、34和/或36个碳的脂肪酸衍生物。遗传改造的微生物产生的一种或一种以上游离脂肪酸或脂肪酸衍生物可饱和或可具有一个或一个以上双键。
[0179] 在一些实施例中,表达4-羟基苯甲酰基-CoA硫酯酶的遗传改造的微生物可产生具有一种以上酰基链长度的游离脂肪酸和/或脂肪酸衍生物,例如两种或两种以上酰基链长
度为8、10、12、14、16、18、20、22和/或24个碳的游离脂肪酸和/或脂肪酸衍生物的任一组合。
在一个所述实施例中,至少50wt%、例如至少60wt%、至少70wt%、至少80wt%、至少90wt%或至少95wt%的如本文所揭示的遗传改造的微生物产生的游离脂肪酸和/或衍生物的酰基
链长度可为8、10、12、14、16、18、20、22和/或24个碳。或者或另外,在所述实施例中,至少
50wt%、例如至少60wt%、至少70wt%、至少80wt%、至少90wt%或至少95wt%的如本文所揭示的遗传改造的微生物产生的游离脂肪酸可为:C8和C24脂肪酸、C8和C22脂肪酸、C8和
C20脂肪酸、C8和C18脂肪酸、C8和C16脂肪酸、C8和C14脂肪酸、C8和C12脂肪酸或C8和C10脂肪酸;C10和C24脂肪酸、C10和C22脂肪酸、C10和C20脂肪酸、C10和C18脂肪酸、C10和C16脂肪酸、C10和C14脂肪酸或C10和C12脂肪酸;C12和C24脂肪酸、C12和C22脂肪酸、C12和C20脂肪酸、C12和C18脂肪酸、C12和C16脂肪酸或C12和C14脂肪酸;C14和C24脂肪酸、C14和C22脂肪酸、C14和C20脂肪酸、C14和C18脂肪酸或C14和C16脂肪酸;C16和C24脂肪酸、C16和C22脂肪酸、C16和C20脂肪酸以及C16和C18脂肪酸;或诸如此类。
[0180] 或者或另外,遗传改造的微生物可包括编码4-羟基苯甲酰基-CoA硫酯酶的核酸分子,所述酶的氨基酸序列与SEQ ID NO:1具有至少70%一致性、例如至少75%、至少80%、至少85%、至少90%或至少95%一致性,且微生物可产生酰基链长度为8、10、12、14、16和/或
18个碳的脂肪酸(任选地有至少50wt%的所产生脂肪酸的酰基链长度为8到18个碳)和/或
总碳数为7到36(例如7到32;11到30;和/或7、8、9、10、11、12、13、14、15、16、17、18、20、22、
24、26、28、30、32、34和/或36个碳)的脂肪酸衍生物。
[0181] 与SEQ ID NO:1具有至少85%一致性的硫酯酶的非限制性实例包括:地衣芽孢杆菌(Bacillus licheniformis)(DSM13)推测硫酯酶YneP(SEQ ID NO:6),其具有基因库登录号AAU23580和基因信息标识(GenInfo Identifier)GI:52003638;枯草芽孢杆菌(Bacillus subtilis)(纳豆亚种BEST195)假定蛋白质BSNT_02984(SEQ ID NO:7),其具有基因库登录
号BAI85489和基因信息标识GI:291484414;枯草芽孢杆菌未表征蛋白质yneP(SEQ ID NO:
8),其具有基因库登录号Q45061和基因信息标识GI:257096998;枯草芽孢杆菌(斯皮兹仁
(spizizenii)亚种W23菌株)推测酰基-CoA硫酯酶(SEQ ID NO:9),其具有基因库登录号YP_
003866210和基因信息标识GI:305674538;解淀粉芽胞杆菌(Bacillus 
amyloliquefaciens)DSM7推测酰基-CoA硫酯酶(SEQ ID NO:10),其具有基因库登录号YP_
003920487和基因信息标识GI:308173782;解淀粉芽胞杆菌FZB42YneP(SEQ ID NO:11),其具有基因库登录号YP_001421379和基因信息标识GI:154686218;枯草芽孢杆菌枯草
(subtilis)亚种168YneP菌株(SEQ ID NO:12),其具有基因库登录号CAA97601和基因信息
标识GI:1405456;萎缩芽孢杆菌(Bacillus atrophaeus)1942推测酰基-CoA硫酯酶(SEQ ID NO:13),其具有基因库登录号ADP32363和基因信息标识GI:310868888;短小芽孢杆菌
(Bacillus pumilus)ATCC7061YneP(SEQ ID NO:14),其具有基因库登录号ZP_03053441和
基因信息标识GI:194014824;短小芽孢杆菌SAFR-0324-羟基苯甲酰基-CoA硫酯酶(SEQ ID NO:15),其具有基因库登录号YP_001486942和基因信息标识GI:157692480;芽孢杆菌属SG-
1假定蛋白质BSG1_15910(SEQ ID NO:16),其具有基因库登录号ZP_01858961和基因信息标识GI:149180457;巨大芽孢杆菌(Bacillus megaterium)DSM319硫酯酶家族蛋白质(SEQ ID NO:17),其具有基因库登录号YP_003597734和基因信息标识GI:295704659;巨大芽孢杆菌QM B1551硫酯酶家族蛋白质(SEQ ID NO:18),其具有基因库登录号YP_003563005和基因信息标识GI:294499305;凝结芽胞杆菌(Bacillus coagulans)36D1硫酯酶超家族蛋白质(SEQ ID NO:19),其具有基因库登录号ZP_04433271和基因信息标识GI:229544212;嗜热葡糖苷酶地芽孢杆菌(Geobacillus thermoglucosidasius)C56-YS93硫酯酶超家族蛋白质(SEQ 
ID NO:20),其具有基因库登录号ZP_06810002和基因信息标识GI:295400022;地芽孢杆菌属(Geobacillus sp.)C56-T3硫酯酶超家族蛋白质(SEQ ID NO:21),其具有基因库登录号
ADI26934和基因信息标识GI:297253488;地芽孢杆菌属Y412MC61硫酯酶超家族蛋白质(SEQ ID NO:22),其具有基因库登录号ACX79004和基因信息标识GI:261376261;地芽孢杆菌属WCH70硫酯酶超家族蛋白质(SEQ ID NO:23),其具有基因库登录号YP_002949888和基因信
息标识GI:239827264;嗜热地芽孢杆菌(Geobacillus kaustophilus)HTA426假定蛋白质
GK1562(SEQ ID NO:24),其具有基因库登录号YP147415和基因信息标识GI:56420097;地芽孢杆菌属G11MC16硫酯酶超家族蛋白质(SEQ ID NO:25),其具有基因库登录号ZP_03147050和基因信息标识GI:196248349;嗜热脱氮地芽孢杆菌(Geobacillus 
thermodenitrificans)NG80-2 4-羟基苯甲酰基-CoA硫酯酶样蛋白质(SEQ ID NO:26),其
具有基因库登录号YP_001125525和基因信息标识GI:138895072;以及芽孢杆菌属NRRL B-
14911假定蛋白质B14911_12282(SEQ ID NO:27),其具有基因库登录号ZP_01171315和基因信息标识GI:89098431。
[0182] 此外,或者或另外,遗传改造的微生物可包括编码4-羟基苯甲酰基-CoA硫酯酶的核酸分子,所述酶的氨基酸序列与SEQ ID NO:2具有至少70%一致性、例如至少75%、至少
80%、至少85%、至少90%或至少95%一致性,且微生物可产生游离酰基链长度为8、10、12、
14、16和/或18个碳的脂肪酸(例如酰基链长度为8、12、16和/或18个碳和/或任选地有至少
50wt%的所产生脂肪酸的酰基链长度为12到16个碳)和/或总碳数为7到36(例如7到32;11
到30;和/或7、8、9、10、11、12、13、14、15、16、17、18、20、22、24、26、28、30、32、34和/或36个碳)的脂肪酸衍生物。
[0183] 与SEQ ID NO:2具有至少30%一致性的硫酯酶的非限制性实例包括:趋磁螺菌(Magnetospirillum magneticum)AMB-1硫酯酶(SEQ ID NO:28),其具有基因库登录号YP_
422578和基因信息标识GI:83312314;淡水趋磁螺菌(Magnetospirillum 
magnetotacticum)MS-1COG0824:预测硫酯酶(SEQ ID NO:29),其具有基因库登录号ZP_
00055337和基因信息标识GI:23015565;新洋葱伯克霍尔德菌(Burkholderia 
cenocepacia)MC0-3tol-pal系统相关酰基-CoA硫酯酶(SEQ ID NO:30),其具有基因库登录号ACA89951和基因信息标识GI:169815368;沼泽红假单胞菌(Rhodopseudomonas 
palustris)BisA534-羟基苯甲酰基-CoA硫酯酶(SEQ ID NO:31),其具有基因库登录号YP_
782882和基因信息标识GI:115525971;新洋葱伯克霍尔德菌HI2424 4-羟基苯甲酰基-CoA
硫酯酶(SEQ ID NO:32),其具有基因库登录号ABK07557和基因信息标识GI:116646916;新洋葱伯克霍尔德菌PC1844-羟基苯甲酰基-CoA硫酯酶(SEQ ID NO:33),其具有基因库登录
号ZP_04939537和基因信息标识GI:254246216;格瑞菲斯瓦尔德磁螺菌(Magnetospirillum gryphiswaldense)MSR-14-羟基苯甲酰基-CoA硫酯酶(SEQ ID NO:34),其具有基因库登录
号CAM73991和基因信息标识GI:144897127;不明确伯克霍尔德菌(Burkholderia 
ambifaria)MEX-5tol-pal系统相关酰基-CoA硫酯酶(SEQ ID NO:35),其具有基因库登录号ZP_02911196和基因信息标识GI:171322375;不明确伯克霍尔德菌MC40-6tol-pal系统相关酰基-CoA硫酯酶(SEQ ID NO:36),其具有基因库登录号ACB63194和基因信息标识GI:
171992275;不明确伯克霍尔德菌AMMD4-羟基苯甲酰基-CoA硫酯酶(SEQ ID NO:37),其具有基因库登录号YP_772574和基因信息标识GI:115350735;致病乙酸细菌(Granulibacter 
bethesdensis)CGDNIH1短链酰基-CoA水解酶(SEQ ID NO:38),其具有基因库登录号YP_
744923和基因信息标识GI:114327766;睡眠嗜血杆菌(Haemophilus somnus)129PT硫酯酶
(SEQ ID NO:39),其具有基因库登录号YP_718466和基因信息标识GI:113460404;睡眠嗜血杆菌2336Pol-Pal系统相关酰基-CoA硫酯酶(SEQ ID NO:40),其具有基因库登录号YP_
001783484和基因信息标识GI:170717543;奇异变形杆菌(Proteus mirabilis)HI4320硫酯酶(SEQ ID NO:41),其具有基因库登录号YP_002150349和基因信息标识GI:197284477;不明确伯克霍尔德菌IOP40-10 tol-pal系统相关酰基-CoA硫酯酶(SEQ ID NO:42),其具有基因库登录号ZP_02892046和基因信息标识GI:170701069;奇异变形杆菌ATCC29906硫酯酶
(SEQ ID NO:43),其具有基因库登录号ZP_03841041和基因信息标识GI:227356655;沼泽红假单胞菌BisB18 4-羟基苯甲酰基-CoA硫酯酶(SEQ ID NO:44),其具有基因库登录号YP_
531800和基因信息标识GI:90423430;固氮螺菌属(Azospirillum sp.)B510酰基-CoA硫酯
水解酶(SEQ ID NO:45),其具有基因库登录号YP_003448162和基因信息标识GI:
288957821;tol-pal系统相关酰基-CoA硫酯酶(SEQ ID NO:46),其具有基因库登录号ZP_
06358294和基因信息标识GI:283840748;慢生根瘤菌属(Bradyrhizobium sp.)BTAi1硫酯
酶超家族(SEQ ID NO:47),其具有基因库登录号ABQ38791和基因信息标识GI:146410285;
世纪红螺菌(Rhodospirillum centenum)SW推测小型硫酯酶样酶亚单元(SEQ ID NO:48),
其具有基因库登录号YP_002298014和基因信息标识GI:209965099;发孢甲基弯菌
(Methylosinus trichosporium)OB3b tol-pal系统相关酰基-CoA硫酯酶(SEQ ID NO:49),其具有基因库登录号ZP_06889725和基因信息标识GI:296447812;沼泽红假单胞菌HaA24-
羟基苯甲酰基-CoA硫酯酶(SEQ ID NO:50),其具有基因库登录号YP_487867和基因信息标
识GI:86751371;以及扭脱甲基杆菌(Methylobacterium extorquens)PA1 tol-pal系统相
关酰基-CoA硫酯酶(SEQ ID NO:51),其具有基因库登录号ABY33133和基因信息标识GI:
163665766。
[0184] 在一些实施例中,包括4-羟基苯甲酰基-CoA硫酯酶的遗传改造的微生物可产生脂肪醛、脂肪醇和/或蜡酯,且可任选地包括一种或一种以上编码酰基-CoA还原酶、羧酸还原酶、酰基-ACP还原酶、脂肪醛还原酶、蜡合酶或其组合的核酸分子。蜡酯包括在酯键羰基侧上的酰基链(A链)和连接到酯键中的氧的酯链(B链),其中的一者或二者可源自通过(例如)
硫酯酶(例如4-羟基苯甲酰基-CoA硫酯酶)生成的脂肪酸。蜡酯的总碳数(A+B“链长度”)可为(例如)10到36个碳、例如16到36个碳、16到32个碳或24到32个碳。
[0185] 或者或另外,包括4-羟基苯甲酰基-CoA硫酯酶的遗传改造的微生物可产生烷烃和/或烯烃且可任选地包括至少一种编码脂肪酸脱羧酶、脂肪醛脱羰基酶、酰基-CoA还原
酶、羧酸还原酶、酰基-ACP还原酶或其组合的核酸分子。由包括编码4-羟基苯甲酰基-CoA硫酯酶的核酸分子的光合微生物产生和/或源自所述光合微生物的烷烃和/或烯烃的链长度
可为(例如)7、9、11、13、15、17、19、21和/或23个碳(例如,一种或一种以上7到17个碳、7到15个碳或11到15个碳的奇数链长度)。
[0186] 此外,或者或另外,可产生脂肪醇、脂肪醛、蜡酯、烷烃或烯烃的遗传改造的微生物可任选地包括编码酰基-CoA合成酶的核酸分子。
[0187] 有利地,可将编码4-羟基苯甲酰基-CoA硫酯酶的核酸分子在自主复制附加体、表达构筑体或其组合中稳定整合到宿主微生物的染色体中。或者或另外,可通过引入适当核
酸表达构筑体用来自原核生物的外源基因转化遗传改造的微生物,所述构筑体除了所关注
基因以外还可包括基因表达序列和任选地可介导到宿主染色体中的重组的序列。
[0188] 可通过常用转化或转染技术将表达构筑体引入原核和真核细胞中。本文所用术语“转化”和“转染”、接合和转导计划包含多种业内已知用于将外来核酸(例如DNA)引入宿主细胞中的方法,包括(但不限于)磷酸钙或氯化钙共沉淀、DEAE-葡聚糖介导的转染、脂转染、自然感受态、化学介导的转移、电穿孔和/或粒子轰击。用于转化或转染宿主细胞的适宜方法可参见分子克隆——实验室手册(Molecular Cloning-A Laboratory Manual)(2010),
冷泉港实验室出版社(Cold Spring Harbor Laboratory Press),其内容以引用方式并入
本文中。
[0189] 例如,藻类和光合细菌可通过任何适宜方法来转化,非限制性实例包括自然DNA摄取(钟(Chung)等人(1998)欧洲微生物学会联合会微生物学快报(FEMS Microbiol.Lett.)
164:353-361;弗利格德(Frigaard)等人(2004)分子生物学方法274:325-40;臧(Zang)等人(2007)微生物学杂志(J.Microbiol.)45:241-245)、接合、转导、玻璃珠转化(库德尔
(Kindle)等人(1989)细胞生物学杂志(J.Cell Biol.)109:2589-601;冯(Feng)等人(2009)分子生物学导报(Mol.Biol.Rep.)36:1433-9;美国专利第5,661,017号)、碳化硅晶须转化(丹纳黑(Dunahay)等人(1997)分子生物学方法(1997)62:503-9)、生物弹道学(道森
(Dawson)等人(1997)当代微生物学(Curr.Microbiol.)35:356-62;霍尔曼(Hallmann)等人(1997)94:7469-7474;雅库比亚克(Jakobiak)等人(2004)原生生物(Protist)155:381-93;
谭(Tan)等人(2005)微生物学杂志43:361-365;史坦布瑞纳(Steinbrenner)等人(2006)应
用与环境微生物学(Appl Environ.Microbiol.)72:7477-7484;克罗特(Kroth)(2007)分子生物学方法390:257-267;美国专利第5,661,017号)、电穿孔(贾鲁尔夫(Kjaerulff)等人
(1994)光合作用研究(Photosynth.Res.)41:277-283;岩井(Iwai)等人(2004)植物与细胞
生理学(Plant Cell Physiol.)45:171-5;拉文德兰(Ravindran)等人(2006)微生物学方法杂志(J.Microbiol.Methods)66:174-6;孙(Sun)等人(2006)基因377:1340-649;王(Wang)等人(2007)应用微生物学与生物技术(Appl.Microbiol.Biotechnol.)76:651-657;查拉西亚(Chaurasia)等人(2008)微生物学方法杂志73:133-141;路德维格(Ludwig)等人(2008)
应用微生物学与生物技术78:729-35)、激光介导的转化或在以下中的任一者存在下或在用其预处理后用DNA培育:聚(酰胺基胺)树枝状聚合物(帕苏帕西(Pasupathy)等人(2008)生
物技术杂志(Biotechnol.J.)3:1078-82)、聚乙二醇(欧努马(Ohnuma)等人(2008)植物与细胞生理学49:117-120)、阳离子脂质(村川(Muradawa)等人(2008)生物科学与生物工程杂志(J.Biosci.Bioeng.)105:77-80)、葡聚糖、磷酸钙或氯化钙(门德斯-阿尔瓦雷兹(Mendez-Alvarez)等人(1994)细菌学杂志.176:7395-7397),任选地在用细胞壁降解酶处理细胞后
用DNA培育(佩罗内(Perrone)等人(1998)细胞分子生物学(Mol.Biol.Cell)9:3351-3365)。
还可在(例如)移除或破坏藻类细胞壁之后对藻类细胞执行土壤杆菌(Agrobacterium)介导
的转化(例如,国际公开案第WO2000/62601号;库马尔(Kumar)等人(2004)植物科学(Plant Sci.)166:731-738)。生物弹道学方法可用于转化植物和真核藻类物种的叶绿体(例如,参见拉梅什(Ramesh)等人(2004)分子生物学方法274:355-307;德意茨(Doestch)等人(2001)当代遗传学(Curr.Genet.)39:49-60;美国专利第7,294,506号;以及国际公开案第WO2003/
091413号、第WO2005/005643号和第WO2007/133558号(所引用每一参考文献都是全文以引
用方式并入)。
[0190] 对于重组蛋白质的最佳表达,在多种情况下,有益地可采用可产生具有打算转化的宿主细胞优先使用的密码子的mRNA的编码序列。因此,为促进转基因的表达,转基因的密码子使用可与其中表达所述转基因的生物体的特殊密码子偏好相匹配。例如,用于在微藻
中表达的重编码基因的方法阐述于美国专利第7,135,290号中,其内容是以引用方式并入。
基因密码子的全部或子集可经改变以纳入宿主生物体使用的优选密码子。关于密码子优化
的其它信息可在(例如)基因库的密码子使用数据库获得。
[0191] 在一些实施例中,在经包括编码4-羟基苯甲酰基-CoA硫酯酶的核酸序列的分离核酸分子转化的微生物中,可将编码硫酯酶的核苷酸序列可操作地连接到一种或一种以上表
达控制元件且可任选地经密码子优化以供在微生物中表达。
[0192] 或者或另外,可将如本文所揭示的外源核酸分子克隆到表达载体中以供转化到微生物(例如微藻或光合细菌)中。所述载体可包括促进所关注转基因(例如,外源4-羟基苯甲酰基-CoA硫酯酶基因)表达的序列,例如异源启动子,且对于在真核细胞中的表达可任选地包括(但不限于)内含子序列、具有多聚腺苷酸化信号的序列等。或者,如果载体不含与所关注基因可操作地连接的启动子,那么可将基因转化到细胞中以使其通过同源重组或载体整
合可操作地连接到内源启动子。
[0193] 经设计用于在微藻中表达基因的载体可包括可操作地连接到所引入外源基因的在微藻中有活性的启动子。多种在微藻中发挥功能的基因启动子和终止子可用于表达载体
中,包括(但不限于)来自原核生物或真核生物(例如(但不限于)衣藻和其它藻类)的启动子
和终止子(例如,参见植物与细胞生理学49:625-632,2008)、来自病毒的启动子和终止子以及合成启动子和终止子。
[0194] 对于硅藻的转化,多种在硅藻中发挥功能的基因启动子可用于所述表达载体中,包括(但不限于):来自海链藻和其它不等鞭毛藻的启动子、来自病毒的启动子以及合成启
动子。可适合用于表达载体中的来自假微型海链藻(Thalassiosira pseudonana)的启动子
包括(但不限于)α-微管蛋白启动子、β-微管蛋白启动子和肌动蛋白启动子。可适合用于表达载体中的来自三角褐指藻(Phaeodactylum tricornutum)的启动子包括(但不限于)α-微
管蛋白启动子、β-微管蛋白启动子和肌动蛋白启动子。可使用与所述基因、其它硅藻基因或具体异源基因相关的终止子来停止转录并提供用于多聚腺苷酸化的适宜信号。
[0195] 如果需要,为了在质体中(其中在微藻中进行脂肪酸生物合成)表达外源核酸分子(例如4-羟基苯甲酰基-CoA硫酯酶),可将编码叶绿体转运肽的核苷酸序列添加到外源核酸
分子的N-末端。或者,可将编码4-羟基苯甲酰基-CoA硫酯酶的外源核酸分子直接引入微藻
的质体染色体中而不中断质体的光合能力。众所周知用于质体转化的方法可用于将核酸分
子引入植物细胞叶绿体中(例如,参见国际公开案第WO2010/019813号和第WO95/16783号;
美国专利第5,451,513号、第5,545,817号和第5,545,818号;以及麦克布莱德(McBride)等
人,美国国家科学院院刊91:7301-7305(1994),其各自以引用方式并入本文中)。
[0196] 在一些情况下,有利地,可在遗传改造的宿主生物体生长期间的某一点表达酶(例如(但不限于)4-羟基苯甲酰基-CoA硫酯酶),以使对所述生物体生长的任何有害效应最小
化和/或使所关注脂肪酸产物的产生最大化。在所述情况下,可将引入经遗传改造生物体中的一种或一种以上编码4-羟基苯甲酰基-CoA硫酯酶的外源核酸分子可操作地连接到诱导
型启动子。启动子可为(例如,但不限于)lac启动子、tet启动子(例如,美国专利第5,851,
796号)、包括tet或lac启动子的一部分或两部分的杂合启动子、激素反应性启动子(例如,蜕皮激素反应性启动子;参见美国专利第6,379,945号)、金属硫蛋白(metallothionien)启动子(美国专利第6,410,828号)和/或可对化学品(例如水杨酸、乙烯、硫胺或BTH有反应的
病程相关(PR)启动子(美国专利第5,689,044号)。诱导型启动子可对光或暗(美国专利第5,
750,385号和第5,639,952号)、温度(美国专利第5,447,858号;亚伯(Abe)等人,植物与细胞生理学49:625-632(2008);斯罗达(Shroda)等人植物学杂志(Plant J.)21:121-131
(2000))或诸如此类或其组合有反应。上述列表打算具有实例性而非限制性。启动子序列可来自任何生物体,条件是其在宿主生物体中可发挥功能。如在本发明构筑体中使用的诱导
型启动子可使用上文所提到的启动子和/或其它诱导型启动子的一个或一个以上部分/结
构域,所述其它诱导型启动子与在宿主生物体中操作的不同启动子的至少一部分融合以赋
予对在宿主物种中操作的启动子的可诱导性。
[0197] 例如,对于蓝细菌的转化,可利用多种在蓝细菌中发挥功能的启动子,包括(但不限于)lac、tac和trc启动子和可通过添加异丙基β-D-1-硫代半乳糖吡喃糖苷(IPTG)诱导的衍生物、与转座子产生的或细菌染色体产生的抗生素抗性基因(新霉素(neomycin)磷酸转
移酶、氯霉素(chloramphenicol)乙酰基转移酶、大观霉素(spectinomycin)腺苷酰转移酶
等)天然相关的启动子、与各种异源细菌基因和天然蓝细菌基因相关的启动子、来自病毒和噬菌体的启动子以及合成启动子。所述启动子的一个实施例包括IPTG可诱导的trcY启动子
(SEQ ID NO:52)。从蓝细菌分离的可使用的启动子可包括(但不限于)secA(分泌;受细胞的氧化还原态控制)、rbc(Rubisco操纵子)、psaAB(PS I反应中心蛋白;光调节)和psbA(PSII的Dl蛋白;光可诱导)。
[0198] 同样,众多种转录终止子可用于构筑表达载体。可能的终止子的实例包括(但不限于)psbA、psaAB、rbc、secA和T7外壳蛋白。
[0199] 转化载体还可任选地包括可选标记,例如(但不限于)抗药性基因、除草剂抗性基因、宿主存活所需的代谢酶或因子(例如,营养缺陷标记)和诸如此类以及其组合。可任选地基于在可选标记存在下在其中缺少抗性盒或营养缺陷标记的细胞无法生长的条件下生长
的能力来选择经转化细胞。或者,在载体上可存在非可选标记,例如编码荧光蛋白或生成可检测反应产物的酶的基因。
[0200] 可通过标准方法将表达载体引入微生物中,所述标准方法包括(但不限于)自然DNA摄取、接合、电穿孔、粒子轰击以及用玻璃珠、SiC纤维或其它粒子研磨。例如,载体可(1)通过包括使得能同源重组到染色体中的侧翼序列经定向以供整合到宿主染色体中,(2)通
过包括使得能同源重组到内源质粒中的侧翼序列经定向以供整合到内源质粒中,和/或(3)
经设计以使得表达载体在所选宿主中复制。
[0201] 遗传改造的微生物可进一步包含一种或一种以上可促进产生脂肪酸和/或脂肪酸衍生物的额外重组核酸分子,例如编码乙酰-CoA羧化酶的基因和/或编码β-酮酰基合酶
(KAS,例如KAS III、KAS II或KAS I酶)的基因。或者或另外,微生物可具有减弱的编码酰基-ACP合酶、酰基-CoA合酶、酰基-CoA脱氢酶、甘油-3-磷酸脱氢酶、乙醛-CoA脱氢酶、丙酮酸脱氢酶、乙酸激酶或诸如此类或其组合的基因的表达。
[0202] 在一些实施例中,经改造微生物可为光合微生物且培养基可为不包括用于向经遗传改造光合微生物供能的还原性碳化合物的培养基,且包含微生物的培养物可包括至少
5mg/升、例如至少10mg/升、至少20mg/升、至少30mg/升、至少40mg/升或至少50mg/升的由微生物产生的游离脂肪酸和/或脂肪酸衍生物。
[0203] 编码4-羟基苯甲酰基-CoA硫酯酶的重组核酸分子可为上文所述的任何重组核酸分子,例如Pfam家族PF03061的成员,和/或在对照Pfam数据库查询时以大于20.6的收集阈
值的二进制分值与PF03061匹配。在一些实例中,微生物可包括编码以大于20.6的二进制分值和小于0.1的e值招募到pfam PF03061的多肽的重组核酸分子,其中所述多肽的氨基酸序
列与SEQ ID NO:2具有至少50%一致性、至少55%一致性、至少60%一致性、至少65%一致性、至少70%一致性、例如至少75%、至少80%、至少85%、至少90%或至少95%一致性,其中微生物产生至少一种游离脂肪酸或至少一种脂肪酸衍生物。在一些实例中,微生物可包
括编码以大于20.6的二进制分值和小于0.1的e值招募到pfam PF03061的多肽的重组核酸
分子,其中所述多肽的氨基酸序列与SEQ ID NO:1具有至少70%一致性、至少75%一致性、至少80%一致性、至少85%一致性、至少90%一致性、例如至少95%一致性、至少96%一致性、至少97%一致性、至少98%一致性、至少99%一致性或约100%一致性,其中微生物产生至少一种游离脂肪酸或至少一种脂肪酸衍生物。
[0204] 如本文所提到的,可将核酸分子可操作地连接到在光合微生物中有活性的启动子和任选地一种或一种以上其它核酸调节序列(例如转录终止子序列)。或者或另外,核酸分
子可存于引入光合微生物中和/或可整合到光合微生物基因组中的自我复制质粒上。
[0205] 在一些实施例中,脂肪酸和/或脂肪酸衍生物可存于培养基中,例如以沉淀物形式存于培养基中或培养基上、存于培养基表面或附近,以包括悬浮微滴(例如,乳液)在内的微滴形式与培养基容器相结合,以相对不可混溶的层形式漂浮于水性培养基顶部,以可分散、悬浮或夹带于培养基内的“浮渣”、薄膜、凝胶、半固体、胶体、细微粒、微粒、固体或聚集体形式存在,与光合微生物的细胞相结合,以另外某种方式相分离或其组合。
[0206] 在优选实施例中,由如本文所揭示的培养物产生的至少一种游离脂肪酸的酰基链长度可为8到24个碳、例如8到18个碳、12到16个碳或8、10、12、14、16、18、20、22和/或24个碳。在至少一种脂肪酸衍生物(例如一种或一种以上脂肪醇、脂肪醛、蜡酯、烷烃和烯烃)是由如本文所揭示的培养物产生的实施例中,至少一种脂肪酸衍生物的总碳数可为7到36、例如11到34、12到32或7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、26、28、30、
32、34和/或36。
[0207] 有利地,培养基可为任何适于光合宿主微生物生长的培养基。在一个实施例中,培养物可包括还原性碳源,例如一种或一种以上可由微生物用于生长的糖或有机酸,以使得微生物可以异养方式或兼养方式生长。或者或另外,培养基不包括实质量的可在生物体中
用作能源的还原性碳化合物,和/或包括无机碳源,例如CO2或碳酸氢盐。
[0208] II.产生游离脂肪酸和/或衍生物的方法
[0209] 本发明的一个方面涉及用于在培养物中产生游离脂肪酸和/或衍生物的方法,所述方法包含在生长培养基中在容许表达4-羟基苯甲酰基-CoA硫酯酶的条件下培养包括至
少一种编码4-羟基苯甲酰基-CoA硫酯酶的重组核酸序列的微生物。外源4-羟基苯甲酰基-
CoA硫酯酶基因在微生物中的表达可导致产生至少一种游离脂肪酸和/或脂肪酸衍生物。
[0210] 在一个实施例中,包括具有表达4-羟基苯甲酰基-CoA硫酯酶的重组基因的微生物的培养物可产生的脂肪酸和/或衍生物的量是在所有方面都相同只是微生物不包括编码4-
羟基苯甲酰基-CoA硫酯酶的重组核酸序列的培养物的至少两倍。例如,包括编码4-羟基苯
甲酰基-CoA硫酯酶的重组核酸分子的微生物可产生(且任选地但优选地释放和/或分泌)至
少5mg/升、例如至少10mg/升、至少20mg/升、至少30mg/升、至少40mg/升或至少50mg/升的游离脂肪酸和/或脂肪酸衍生物。
[0211] 所述方法可进一步包含从培养基(例如从细胞、生长培养基或全培养物)分离/移除游离脂肪酸和/或衍生物。例如,分离可通过全细胞或裂解细胞的有机萃取、移除呈沉淀物形式的游离脂肪酸或脂肪酸衍生物或从培养基上层将其移除(“撇脂”),通过使用结合脂肪酸和/或衍生物的微粒吸附剂、泡沫或基质或诸如此类或其任一组合来实施。
[0212] 遗传改造的微生物可为如本文所述包括编码4-羟基苯甲酰基-CoA硫酯酶的重组核酸分子的任一微生物,所述重组核酸分子的表达可导致产生游离脂肪酸和/或脂肪酸衍
生物。4-羟基苯甲酰基-CoA硫酯酶可由微生物在培养光合微生物期间和/或在将诱导剂投
与培养物后的至少一部分时间中表达。诱导剂的非限制性实例包括乳糖或乳糖类似物(例
如异丙基β-D-1-硫代半乳糖吡喃糖苷)和光(其可以阳光或人造光(例如荧光灯)形式来提
供)。
[0213] 或者或另外,遗传改造的微生物可为光合微生物且可以光养性方式生长,在所述情形中生长培养基通常不包括实质量的(例如,不包括)还原性碳源。在以光养性方式生长
时,光合微生物使用光作为其能源,且使用无机碳源(例如CO2或碳酸氢盐)用于由微生物合成生物分子。或者,可在以光养性方式生长的微生物的培养基中提供有机碳分子或化合物,但其无法被细胞吸收或代谢以供能或不以有效提供足够用于细胞培养物生长的能量的量
存在。
[0214] 在多个实施例中,培养物可包括无机碳源,包括(但不限于)碳酸氢盐、碳酸钙和/或存于空气中的或以相对于环境CO2富集的形式(例如,呈空气中的5vol%CO2形式)提供的
CO2。或者或另外,可在至少一部分培养阶段中将光合微生物暴露于光。可使用人造光源作为唯一光源或增强或扩展自然光。
[0215] “培养”是指通过使用所选择和/或受控条件有意促进一种或一种以上细胞的生长(细胞大小、细胞内容物和/或细胞活性的增加)和/或繁殖(细胞数通过(例如)有丝分裂而
增加)。生长与繁殖二者的组合可称为“增殖”。所选择和/或受控条件的实例可尤其包括使用确定成份培养基(具有已知特征,例如pH、离子强度和碳源)、指定温度、氧张力、二氧化碳含量和在生物反应器中生长。
[0216] 光合微生物(例如微藻或蓝细菌)可在不存在实质量的固定碳源的情况下以光养性方式培养;或以兼养方式培养,其中在一天至少一部分时间中向培养物供应光,且还供应还原性碳源,例如糖(例如,葡萄糖、果糖、半乳糖、甘露糖、鼠李糖、阿拉伯糖、木糖、乳糖、蔗糖、麦芽糖)、有机酸形式(例如,乙酸盐、柠檬酸盐、琥珀酸盐)和/或甘油。或者,光合微生物可以兼养方式培养,从而使得生物体在一天至少一部分时间中在光存在下生长,且还提供
一种或一种以上还原性碳源。或者,细胞可以异养方式生长,其中在培养基中提供还原性碳源用于供能和生物化学合成。光合生物体可以兼养方式生长一段时间,之后一段时间光养
性生长,或反过来也一样。
[0217] 多种用于藻类和蓝细菌的光养性和/或兼养性生长的培养基为业内已知,且对于具体物种可优化培养基以促进生长或脂肪酸产物的产生。
[0218] 可根据本发明方法使用的微生物可发现于世界各地的不同地区和环境中。由于其係自其它物种分离以及其产生的进化趋异性,用于最佳生长以及脂质和/或烃成份的生成
的具体生长培养基可变。在一些情形中,由于存在一些抑制性组份或不满足微生物的具体
菌株所需要的一些必需的营养要求,微生物的某些菌株可能不能在具体生长培养基上生
长。
[0219] 固体和液体生长培养基一般可从众多种来源获得,用于制备适用于微生物的众多种菌株的具体培养基的指导也可从众多种来源获得。例如,各种淡水和盐水培养基可包括
以下文献中所述的培养基:巴尔桑蒂,L.(Barsanti,L.)和盖立特里,P.(Gualtieri,P.)(2005)藻类:解剖学、生物化学与生物技术(Algae:Anatomy,Biochemistry,and 
Biotechnology),CRC出版社,泰勒弗朗西斯集团(Taylor&Francis Group),博卡拉顿,佛罗里达州,美国,其关于培养藻类的培养基和方法的内容是以引用方式并入本文中。藻类培养基配方还可发现于各种藻类培养物保藏网站,非限制性实例包括UTEX藻类培养物保藏
(UTEX Culture Collection of Algae,sbs.utexas.edu/utex/media.aspx);藻类和原生
生物培养物保藏(Culture Collection of Algae and Protozoa,ccap.ac.uk/media/
pdfrecipes);以及大教堂植物学(Katedra Botaniky,/botany.natur.cuni.cz/algo/
caup-media.html)。
[0220] 在一些实施例中,用于培养产生脂肪酸的生物体的培养基可包括相对于标准培养基配方(例如,标准BG-11培养基(ATCC培养基616,实例6))或经修饰培养基(例如ATCC培养
基854(经修饰含有维生素B12的BG-11)或ATCC培养基617(经修饰用于海洋蓝细菌的BG-11,
含有额外NaCl和维生素B12))浓度有所提高的金属(通常以盐和/或离子形式来提供),例
如,钠、钾、镁、钙、锶、钡、铍、铅、铁、镍、钴、、铬、铝、锌、或诸如此类或其组合(特别是多价金属,例如镁、钙和/或铁)。
[0221] 例如,用于产生游离脂肪酸的微生物生长的培养基与标准培养基相比可包括至少2倍、例如至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、介于
2倍与10倍之间和/或介于10倍与100倍之间的量的金属(例如,钙)。用于可产生游离脂肪酸的微生物生长的培养基可在调配物中包括(例如)至少约0.5mM、介于约0.5mM与约1mM之间、介于约1mM与约2mM之间、介于约2mM与约5mM之间、介于约5mM与约10mM之间、介于约10mM与约25mM之间和大于25mM金属(例如,钙)。
[0222] 在其它实施例中,通过在培养基中使用过量金属(例如,钙),可以肥皂沉淀物形式隔离至少一部分脂肪酸,从而可降低游离脂肪酸的毒性效应。或者或另外,在培养基中添加金属(例如,钙)可提高微生物在具有相对高浓度游离脂肪酸的培养基中的耐受性。或者或另外,有利地,在过量金属(例如,钙)含量下产生脂肪酸的菌株可更稳健。尽管过量组份在本文中阐述为金属,但预计所述组份更一般来说可阐述为羧酸根反荷离子源(例如形成肥
皂的反荷离子源)、金属离子源(本文中称为“金属”)、多价(即具有+2或更高化合价)反荷离子源、二价反荷离子源或某一组合。对于脂肪酸和/或脂肪酸衍生物的产生,光合微生物可在室内(例如,在光生物反应器中、在摇瓶、试管、小瓶、微量滴定盘、皮氏培养皿(petri dish)或诸如此类中)或在室外(例如,在池塘、渠道、沟渠、跑道、槽或诸如此类中)生长。或者或另外,可向光合微生物供应无机碳(例如(但不限于)CO2)源,包括(但不限于)空气、富集CO2的空气或烟道气
[0223] 或者或另外,本发明可包括以下实施例中的一个或一个以上。
[0224] 实施例1.一种微生物,其包含编码4-羟基苯甲酰基-CoA硫酯酶的重组核酸分子,其中所述4-羟基苯甲酰基-CoA硫酯酶在所述微生物中的表达导致产生至少一种游离脂肪
酸和/或脂肪酸衍生物。
[0225] 实施例2.根据实施例1所述的微生物,其中所述4-羟基苯甲酰基-CoA硫酯酶水解酰基-ACP。
[0226] 实施例3.根据前述实施例中任一实施例所述的微生物,其中所述至少一种脂肪酸衍生物包含至少一种脂肪醛、至少一种脂肪醇、至少一种蜡酯、至少一种烷烃、至少一种烯烃或其组合和/或总碳数为7到36。
[0227] 实施例4.根据前述实施例中任一实施例所述的微生物,其中所述微生物能产生至少一种酰基链长度为8到24个碳或8到18个碳的脂肪酸。
[0228] 实施例5.根据前述实施例中任一实施例所述的微生物,其中至少30wt%的由所述微生物产生的所述游离脂肪酸是酰基链长度为8个碳、10个碳、12个碳、14个碳、16个碳、18个碳的游离脂肪酸或其任一混合物。
[0229] 实施例6.根据前述实施例中任一实施例所述的微生物,其中所述4-羟基苯甲酰基-CoA硫酯酶是原核酶和/或与SEQ ID NO:1或SEQ ID NO:2具有至少70%氨基酸序列一致性、例如至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少
98%、至少99%或约100%序列一致性。
[0230] 实施例7.根据前述实施例中任一实施例所述的微生物,其中编码所述4-羟基苯甲酰基-CoA硫酯酶的所述核酸分子包含核苷酸序列SEQ ID NO:3或SEQ ID NO:4。
[0231] 实施例8.根据前述实施例中任一实施例所述的微生物,其中编码所述4-羟基苯甲酰基-CoA硫酯酶的所述核酸分子稳定整合到所述微生物的染色体中和/或位于表达构筑体
中。
[0232] 实施例9.根据实施例8所述的微生物,其中所述表达构筑体包含可操作地连接到编码所述4-羟基苯甲酰基-CoA硫酯酶的所述核酸分子的启动子,其中所述启动子在所述微
生物中发挥功能。
[0233] 实施例10.根据前述实施例中任一实施例所述的微生物,其中所述微生物进一步包含至少一种编码至少一种诸如乙酰-CoA羧化酶或β-酮酰基合酶(KAS)等额外多肽的额外
核酸分子,其中所述额外核酸分子在光合微生物中的表达促进游离脂肪酸和/或脂肪酸衍
生物的产生。
[0234] 实施例11.根据前述实施例中任一实施例所述的微生物,其中所述微生物具有减弱的至少一种编码包含酰基-酰基载体蛋白(ACP)合酶、酰基-CoA脱氢酶、甘油-3-磷酸脱氢酶、乙醛-CoA脱氢酶、丙酮酸脱氢酶、乙酸激酶和其组合的蛋白质的基因的表达。
[0235] 实施例12.根据前述实施例中任一实施例所述的微生物,其中所述微生物是细菌、不等鞭毛藻、破囊壶菌或真菌,且可为以下属的成员:梭菌属、发酵单胞菌属、埃希氏菌属、沙门菌属、红球菌属、假单胞菌属、芽孢杆菌属、乳杆菌属、肠球菌属、产碱菌属、克雷伯氏菌属、类芽孢杆菌属、节杆菌属、棒状杆菌属、短杆菌属、毕赤氏酵母属、念珠菌属、汉逊氏酵母属或酵母菌属。
[0236] 实施例13.根据实施例1到11中任一实施例所述的微生物,其中所述微生物是光合微生物,且可为微藻或蓝细菌。
[0237] 实施例14.一种用于在培养物中产生游离脂肪酸和/或脂肪酸衍生物的方法,所述方法包含在生长培养基中培养微生物,其中所述微生物包含至少一种编码根据前述实施例
中任一实施例所述的4-羟基苯甲酰基-CoA硫酯酶的重组核酸分子;且其中使所述微生物在
容许在培养阶段期间表达外源4-羟基苯甲酰基-CoA硫酯酶基因的条件下生长。
[0238] 实施例15.根据实施例14所述的方法,其中至少一部分所述游离脂肪酸和/或脂肪酸衍生物被分泌到所述生长培养基中。
[0239] 实施例16.根据实施例14或实施例15所述的方法,其中所述微生物是光合微生物,且另外其中所述生长培养基不包括实质量的还原性碳源,其中所述培养物提供有至少一种
无机碳源和/或其中在至少一部分培养阶段中使所述培养物暴露于光。
[0240] 实施例17.根据实施例14到16中任一实施例所述的方法,其中所述方法进一步包含从所述微生物、所述生长培养基或全培养物分离至少一种游离脂肪酸和/或衍生物。
[0241] 实施例18:一种分离或重组核酸分子,其包含编码氨基酸序列与SEQ ID NO:2至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少95%、至少97%或约100%一致的多肽的序列。
[0242] 实施例19:一种分离或重组核酸分子,其包含编码氨基酸序列与SEQ ID NO:1至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或约100%一致的多肽的序列。
[0243] 实施例20:根据实施例18或19所述的分离或重组核酸分子,其中所述多肽具有酰基-ACP硫酯酶活性。
[0244] 除非另外定义,否则本文所用所有技术和科学术语都具有与本发明所属领域技术人员一般所了解相同的含义。尽管在本发明的实践或测试中也可使用与本文中所述相似或
等效的方法和材料,但现在阐述优选方法和材料。本文所提到的所有公开案都是全文以引
用方式并入本文中。
[0245] 通过登录号或基因信息标识鉴别的核酸和氨基酸序列也是以引用方式并入本文中。登录号是可在由美国国立卫生研究院(United States National Institutes of 
Health)维护的国家生物技术信息中心(National Center for Biotechnology 
Information)网站公开获得的序列记录的唯一标识,所述网站可在ncbi.nlm.nih.gov访
问。“基因信息标识”(GI)序列标识号是核苷酸或氨基酸序列所特有的。如果序列以任何方式改变,就分配新的GI号。可利用序列修订记录(Sequence Revision History)工具来追踪在特定基因库记录中出现的序列的不同GI号、版本号和变更日期。基于登录号和GI号搜索
并获得核酸或基因序列或蛋白质序列在细胞生物学、生物化学、分子生物学和分子遗传学
领域众所周知。
[0246] 还必须注意,除非上下文中另外明确说明,否则在本文和随附权利要求书中使用的单数形式“a”、“an”和“所述”包括复数含义。在两个或两个以上物项的列表中使用“或”指示涵盖所述物项的任一组合,例如“A或B”指示计划涵盖单独的A、单独的B或A与B二者。本文所用所有技术和科学术语都具有相同含义。
[0247] 本文所用所有技术和科学术语都具有相同含义。
[0248] 本文所讨论的公开案仅因为其揭示内容先于本申请案的申请日期而提供。不能由于所述公开案为先前发明而将本文中的任何内容视为承认本发明无权先于所述公开案。此
外,所提供的公开日期可能与实际公开日期不同,所述实际公开日期可能需要单独确认。
[0249] 实例
[0250] 阐述以下实例以为所属领域技术人员提供制备和使用本发明的完整揭示内容和说明,且其既不计划限制发明者认为属于本发明的范围,也不计划表示以下实验是所执行
的所有或唯一实验。人们已经努力确保所用数字(例如数量、温度等)的精确性,但应考虑到一些实验误差和偏差。除非另外指明,否则份数是重量份数,分子量是重量平均分子量,温度是摄氏度,且压力是大气压或接近大气压。
[0251] 实例1.宏基因组文库的生成
[0252] 1.1.宏基因组DNA的分离
[0253] 为了分离可含有新颖硫酯酶基因的宏基因组DNA,从位于南加州沙顿海(Salton Sea)北部的太平洋水场(Pacific Aquafarms)的鱼塘收集约20升全水样品。
[0254] 使用微孔不锈过滤系列通过约20μm、约3μm、约0.8μm和约0.1μm滤纸从上述地点过滤约8L水。将约0.1μm滤纸置于气密性 冷冻袋(S.C.约翰逊(S.C.Johnson),拉辛,威斯康辛州)中。将一部分滤纸添加到培养基中以供扩增用于产生宏基因组文库的微生物群。使一个滤纸样品在约225rpm振荡下在约30℃下在路尼亚肉汤(Luria Broth,LB)培养基中生长,且使另一滤纸样品在约225rpm振荡下在约40℃下在路尼亚肉汤(LB)培养基中生
长,二者都生长过夜。在出芽期(grow-out period)后,通过在室温(约20-25℃)下以约4,
000g离心约10min收集细胞悬浮液。使细胞沉淀再悬浮于约50mM Tris-Cl(pH约8.0,含有约
10mM EDTA、约100μg/ml RNA酶A、约4mg/ml溶菌酶、约100μg/ml溶葡萄球菌酶和约500U/mi变溶菌素)中,且在约37℃和搅动(约100rpm)下培育。通过在约4℃下以约16,000g离心约
30min使匀浆物沉积。将上清液转移到新管中并与等体积的冷(约-20℃)100%乙醇混合以
使DNA沉淀。通过在约4℃下以约16,000g离心来收集沉淀物或将其缠绕到无菌可弃式接种
环上。然后在约75%乙醇中洗涤DNA并在室温下干燥,且将其再悬浮于约50mM Tris-Cl(pH
约8.0)中以供分级分离和文库构筑。
[0255] 1.2宏基因组DNA文库的构筑和功能筛选
[0256] 用限制性内切核酸酶Sau3AI部分消化从约30℃扩增宏基因组样品和约40℃扩增宏基因组样品分离的宏基因组DNA并将其连接到细菌/蓝细菌表达/整合载体RB-RS1(SEQ 
ID NO:5;图2)的BamHI位点中以生成约30℃和约40℃宏基因组文库。RB-RS1表达载体是使用缺失赋予氨苄西林(ampicillin)抗性的内酰胺酶基因的pUC主链来构筑。构建所述载体
以使得lac启动子、lac Z α基因和卡那霉素(kanamycin)抗性基的侧翼为RS1“上升(up)”序列和RS1“下降(down)”序列以供同源重组到RS1位点中集胞藻基因组中(威廉姆(Williams)等人(1988)酶学方法(Methods in Enzymology),167:766-778)。将约30℃和约40℃文库转化到感受态大肠杆菌K19细胞中,且通过尼罗蓝(Nile Blue)板分析针对游离脂肪酸的产生
筛选卡那霉素抗性集落。
[0257] 在含有约10μg/mL尼罗蓝A(阿尔法埃萨(Alfa Aesar)A17174号)的固体培养基上使用基于板的分析来鉴别产生游离脂肪酸的重组大肠杆菌集落。尼罗蓝将极性脂质(脂肪
酸、磷脂)染成蓝色。通过将板置于标准光源灯箱上通过目测检验来检查集落的染色。选择相对于背景对照显示高水平尼罗蓝A染色的集落,使其长大并进一步筛选以确定非酯化游
离脂肪酸(FFA)的总量使用游离脂肪酸检测试剂盒(SFA-1号,森拜(Zenbio)公司,研究三角公园(Research Triangle Park),北卡罗来纳州)。
[0258] 通过气相色谱(GC)和火焰离子化检测(GC-FID)进一步分析在尼罗蓝板分析和游离脂肪酸检测试剂盒分析中相对于背景对照展现升高的游离脂肪酸水平的样品的游离脂
肪酸内容物。选择200个在GC-FID分析中相对于背景对照显示升高的游离脂肪酸水平的克
隆,且测定所述克隆的核苷酸序列。在DNA测序后,移除多余克隆,并观察生物信息学分析,即属于4-羟基苯甲酰基-CoA硫酯酶基因家族的克隆的重复发生的模式。在4-羟基苯甲酰
基-CoA硫酯酶基因家族中,更详细地表征两个克隆340-64(SEQ ID NO:3)和3-1(SEQ ID 
NO:4)。
[0259] 实例2.宏基因组DNA在大肠杆菌中的表达
[0260] 对于原核硫酯酶基因在大肠杆菌中的表达,在玻璃管中用每一细菌菌株的约30微升饱和培养物接种约1.2mL含有约50μg/ml大观霉素和约1mM异丙基β-D-1-硫代半乳糖吡喃糖苷(IPTG)的2×YT培养基并培养约24小时。移除约0.6mL培养物用于生物化学分析。
[0261] 实例3.来自大肠杆菌的脂肪酸样品的分析
[0262] 对于由转化大肠杆菌菌株产生的脂肪酸的鉴别和定量,将约0.6mL大肠杆菌培养物添加到具有PTFE(聚四氟乙烯)内塞盖(国家科技(National Scientific))的约2mL气相
色谱玻璃小瓶中中。50微升于己烷中的内标组(包括酰基链长度为9个碳(C9∶0)、13个碳
(C13∶0)和17个碳(C17∶0)的游离脂肪酸,各自浓度为约600μg/ml)添加到培养物样品中,之后添加约50微升约50%H2SO4、约100微升约5M NaCl和约850微升己烷。每一内标的最终浓度为约50μg/ml。构成内标组的脂肪酸购自弗卢卡(Fluka)或努茶制剂(Nu Chek Prep)。然后将培养物在多管涡旋器上以约2,500rpm涡旋约30min。最后将小瓶以约2500rpm离心约3min
以提供有机相与水相之间的良好分离。通过Gerstel MPS2L自动采样器对己烷层采样。
[0263] 使用安捷伦(Agilent)7890A型气相色谱仪分析大肠杆菌脂肪酸样品,所述气相色谱仪配备有FID(火焰离子化检测器),包括J&W科技(J&W Scientific)DB-FFAP毛细管柱(长
约15m,内径约0.25mm,薄膜厚度约0.25μm)并与安捷伦5975C质谱分光光度计偶联。GC炉的程序如下:在约140℃下约0.5min.,然后以约20℃/min.加热到约230℃(保持约5min)。将进样器温度保持在约250℃,且使用约40∶1分流的约1μl进样。以约1.2ml/min的流速使用氦作为载气。通过比较保留时间对个别进样的标准品来鉴别分析物。对于链长度为8个碳(C8∶0)到16个碳且具有一个双键(C16∶1)的脂肪酸,分析物的校准范围是约2μg/ml到约200μg/ml,且对于链长度为18个碳且无双键(C18∶0)到18个碳且具有两个双键(C18∶2)的脂肪酸,校准范围是约0.5μg/ml到约50μg/ml。在全细胞培养物中进行的加标(Spiking)和回收实验显
示,提取方法在每一分析物的约85%到115%范围内持续恢复。
[0264] 如图3、4和5中所示,4-羟基苯甲酰基-CoA硫酯酶在大肠杆菌中的表达导致增加培养物中产生的游离脂肪酸,且游离脂肪酸水平与由表达来自萼距花属(Cuphea)的高等植物
硫酯酶(标记为25对照)的大肠杆菌细胞产生的脂肪酸水平一样高或更高。如图3中所示,4-羟基苯甲酰基-CoA硫酯酶340-64(SEQ ID NO:3)在大肠杆菌中的表达导致产生酰基链长度
为8、10、12、16和18个碳的游离脂肪酸。
[0265] 如图4中所示,4-羟基苯甲酰基-CoA硫酯酶3-1(SEQ ID NO:2)在大肠杆菌中的表达也导致产生酰基链长度为8、10、12、16和18个碳的游离脂肪酸,且在含有表达SEQ ID NO:
2的细胞的培养物中酰基链长度为8、10、16和18个碳的游离脂肪酸的量高于含有表达萼距
花属高等植物硫酯酶(标记为25对照)的细胞的对照培养物。
[0266] 图5显示由表达340-644-羟基苯甲酰基硫酯酶(SEQ ID NO:3)或空载体对照(RBRS1EV对照)的大肠杆菌K-19细胞(其缺少功能性酰基-CoA合成酶,一种作用于脂肪酸降
解路径的酶)产生的游离脂肪酸的水平。将游离脂肪酸的量正规化为K19细胞的O.D.。340-
644-羟基苯甲酰基-CoA硫酯酶(SEQ ID NO:3)在K19细胞中的表达也提高由所述菌株产生
的酰基链长度为8、10、12、14、16和18个碳的游离脂肪酸的水平。
[0267] 实例4.酰基-ACP硫酯酶分析
[0268] 由于用编码4-HBT(已知不从酰基-ACP产生游离脂肪酸)的基因转化产生游离脂肪酸的细胞,使酶在产生所述酶的大肠杆菌菌株中表达以供用于活体外分析中来测定其对酰
基-ACP底物的硫酯酶活性。
[0269] 为此,用340-64(SEQ ID NO:3)、3-1(SEQ ID NO:4)或用作为对照的空载体(SEQ ID NO:5)转化大肠杆菌细胞,且通过在大肠杆菌培养物的培养基中添加异丙基β-D-1-硫代半乳糖吡喃糖苷(IPTG)来诱导表达。用单一集落接种培养物(约10ml)并培育直到培养物的OD达到约0.6,此时将IPTG添加到约1mM的最终浓度,且使细胞生长过夜。然后使细胞沉淀,将细胞沉淀用1×磷酸盐缓冲盐水(PBS)洗涤,并通过将沉淀再悬浮于约0.5mL裂解缓冲液
xTractor细胞裂解缓冲液(科隆技术(Clontech),山景城,加利福尼亚州)中来制备细胞提
取物。
[0270] 如下来执行酰基-ACP硫酯酶分析:将约5μl于缓冲液(约100mM Tris-HCl,pH约8.0,约100mM NaCl)中的约10μM酶促合成的C16酰基-ACP底物与约3μl来自3-1HBT产生细
胞、340-64HBT产生细胞或不表达硫酯酶(PE0045)的大肠杆菌细胞的对照提取物的细胞提
取物混合。将混合物培育约5min、约10min和约30min,且通过在约70℃下加热约5min来停止反应。将约10μl2.5×天然尿素加载染料添加到反应混合物中。将样品加载到约20%约2.5M尿素天然丙烯酰胺凝胶上,且在非变性条件下在约120伏特下运行约60min。用SimplyblueTM凝胶染剂(英杰(Invitrogen),卡尔斯巴德,加利福尼亚州)对凝胶进行染色。
[0271] 图6显示酰基-ACP底物在天然丙烯酰胺凝胶中的迁移模式,将所述底物与从表达不同克隆或对照提取物(PE0045)的大肠杆菌细胞制备的细胞提取物一起培育。泳道1-3显
示酰基-ACP底物(约5μl,约10μM)的迁移模式,将所述底物与约3μl xTractor细胞裂解缓冲液(泳道1)或与从含有对照载体(PE0045,约3μl)的细胞制备的裂解物一起培育约5min(泳
道2)或约10min(泳道3)。泳道4指示蛋白质大小标记。泳道5到7(标记为3-1)显示酰基-ACP
底物的迁移模式,将所述底物与约3μl从表达3-14-羟基苯甲酰基硫酯酶(SEQ ID NO:2)的细胞制备的提取物(约5mg/ml)分别一起培育约5min(泳道5)、约10min(泳道6)和约30min
(泳道7)。泳道8到10显示酰基-ACP底物的迁移模式,将所述底物与从表达340-644-羟基苯
甲酰基硫酯酶(SEQ ID NO:1)的细胞制备的提取物分别一起培育约5min(泳道8)、约10min
(泳道9)和约30min(泳道10)。
[0272] 如图6中所示,与对照(酰基-ACP底物与PE0045提取物)相比,将酰基-ACP底物与从表达340-64(SEQ ID NO:1)或3-1(SEQ ID NO:2)4-羟基苯甲酰基-CoA硫酯酶的大肠杆菌细胞制备的细胞提取物一起培育导致游离ACP的量显著增加,同时降低接合到脂肪酸的ACP底
物(C16-ACP)的量。所述结果表明,3-1(SEQ ID NO:1)与340-64(SEQ ID NO:2)二者具有针对酰基-ACP底物的水解活性。
[0273] 实例5.蓝细菌的转化
[0274] 将含有4-羟基苯甲酰基-CoA硫酯酶340-64和3-1基因的质粒引入蓝细菌宿主集胞藻中。PCC6803细胞基本上是根据臧等人(微生物学杂志,2007,45:241-245,其内容是全文以引用方式并入本文中)来转化。简单来说,使细胞在恒定光下生长到约0.7到0.9的光密度
730(O.D.730,约0.25的OD730对应于约1×108个细胞/ml),并通过在室温下以约2,000g离心约15min来采集。使细胞沉淀再悬浮于约0.3倍生长体积的新鲜BG-11培养基中并立即用于
转化。将约1微克质粒DNA(含有4-羟基苯甲酰基-CoA硫酯酶基因)添加到约0.3ml细胞中,温和混合,并在照明下在约30℃下无搅动培育约约5小时。将细胞涂施在置于约50ml BG-11琼脂板上的滤纸(沃特曼努(Whatmann Nuclepore)聚碳酸酯径迹蚀刻膜,PC约47mm,约0.2微
米)上并使其在光下恢复约16到24小时,此后抬起滤纸并将其置于含有大观霉素(约20μg/
ml)的新鲜BG-11板上以选择转化体。通过PCR针对4-羟基苯甲酰基-CoA硫酯酶基因的存在
进一步筛选所得集落。
[0275] 实例6.培养蓝细菌
[0276] 在不存在还原性碳源时使用光作为能源以光养性方式培养用包含340-64(SEQ ID NO:3)和3-1(SEQ ID NO:4)基因的表达构筑体转化的集胞藻细胞。将约20mL玻璃小瓶中的约10ml含有约1mM IPTG的BG-11培养基在约0.6的OD730nm下接种且在约30℃和恒定照明(约
40微爱因斯坦m-2sec-1)下使其生长约6.5天(约150rpm)。移除约0.6ml培养物以供生物化学分析。BG-11培养基(ATCC培养基:用于蓝绿藻的616培养基BG-11)中的成份如下:
[0277] NaNO3.........................1.5g
[0278] K2HPO4.........................40mg
[0279] MgSO4.7H2O.....................75mg
[0280] CaCl2.2H2O.....................36mg
[0281] 柠檬酸.........................6mg
[0282] 柠檬酸铁铵.....................6mg
[0283] EDTA...........................1mg
[0284] Na2CO3..........................20mg
[0285] 痕量金属混合物A5(参见下文).....1ml
[0286] 琼脂(如果需要).................10g
[0287] 蒸馏水.........................1L
[0288] 将最终pH调节到约7.1
[0289] 在约121℃下高压灭菌约15分钟。
[0290] 痕量金属混合物A5组成:
[0291] H3BO3..................................2.86g
[0292] MnCl2.4H2O.............................1.81g
[0293] ZnSO4.7H2O.............................0.22g
[0294] Na2MoO4.2H2O...........................0.39g
[0295] CuSO4.5H2O.............................79.0mg
[0296] Co(NO3)2.6H2O..........................49.4mg
[0297] 蒸馏水................................1L
[0298] 实例7.来自蓝细菌(集胞藻)的脂肪酸样品的分析
[0299] 在安捷伦7890A型气相色谱仪上分析集胞藻脂肪酸样品,所述气相色谱仪配备有FID(火焰离子化检测器),包括J&W科技DB-FFAP毛细管柱(长约15m,内径约0.25mm,薄膜厚度约0.25μm)并与安捷伦5975C质谱分光光度计偶联。气相色谱炉的程序如下:在约140℃下约0.5min,然后以约20℃/min.加热到约230℃(保持约5min)。将进样器温度保持在约250
℃,且使用约40∶1分流的约1.0μl进样。以约1.2mL/min的流速使用氦作为载气。通过比较保留时间对个别进样的标准品来鉴别分析物。
[0300] 尽管已参考本发明的特定实施例阐述本发明,但所属领域技术人员应了解,可对其做出多种改变并且可取代多种等效物,而不背离本发明的真实精神和范围。另外,可做出多种修改以使具体情况、材料、物质组成、方法、方法的步骤适应本发明的目的、精神和范围。所有所述修改都涵盖于随附权利要求书的范围中。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈