首页 / 专利库 / 植物油脂 / 植物油 / 葵花籽油 / 水解酶、编码它们的核酸及制备和使用它们的方法

解酶、编码它们的核酸及制备和使用它们的方法

阅读:999发布:2022-04-11

专利汇可以提供解酶、编码它们的核酸及制备和使用它们的方法专利检索,专利查询,专利分析的服务。并且提供了 水 解 酶,包括脂肪酶、饱和酶、棕榈酸酶和/或 硬脂酸 酶,以及编码这些酶的多核苷酸,以及制备和使用这些多核苷酸和多肽的方法。进一步提供了具有水解酶活性的多肽,例如酶,诸如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶;以及制备低 饱和度 或低反式脂肪油的方法,例如低饱和度或低反式脂肪动物或 植物 油 ,例如,大豆或 菜籽油 。,下面是解酶、编码它们的核酸及制备和使用它们的方法专利的具体信息内容。

1.一种解油或脂肪的方法,包括以下步骤:
(a)获得一种包含油或脂肪的组合物,其中该油或脂肪能够被具有水解酶活性的多肽水解,所述多肽选自具有水解酶活性的分离的、合成的和重组的多肽,且所述多肽i.由下述核酸编码
(1)一种核酸,其包含与SEQ ID NO:1具有至少50%序列同一性的核酸序列,且其中1、
2、3、4、5、6、7、8、9、10、11或12或更多、或全部基残基发生改变,如表3或表4所示,其中该核酸编码至少一种具有水解酶活性的多肽,或者
(2)一种核酸,其包含在严格条件下与包含SEQ ID NO:1且具有如表3或表4所示的
1、2、3、4、5、6、7、8、9、10、11或12或更多或全部碱基残基变化的核酸序列杂交的序列,其中该核酸编码具有水解酶活性的多肽;或
ii.在至少约100个残基的区域内与SEQ ID NO:2具有至少50%的序列同一性,且其中1、2、3、4、5、6、7、8、9、10、11或12或更多或全部基酸残基发生改变,如表3或表4所示,或
iii.包含如SEQ ID NO:2所示的氨基酸序列,并且包含至少一种下列氨基酸残基修饰:D61A;D61E;R72E;R72K;E116A;E116Q;E116R;E116T;E116V;S133A;I151G;I151A;
V163R;D164R,或其组合,或
iv.包含如SEQ ID NO:2所示的氨基酸序列,并且包含至少一种下列氨基酸残基修饰:
I20L;V62S;G77P;V83C;D88H;Y113G;E116T;E116G;H140K;K146S;I167S;L180E;E194M;
A211Q;S212Y;G215C;G215V;G215W;A218H;A218S;V223A;A225M;A225Q,或其组合;
(b)在足以造成所述油或脂肪水解的条件下,在包含所述油或脂肪的组合物中添加足够量的步骤(a)的多肽,从而水解该油或脂肪。
2.权利要求1的方法,其中所述水解的油或脂肪较之所述水解前的油或脂肪具有更低的饱和脂肪含量。
3.权利要求1或2的方法,其中所述水解的油或脂肪较之所述水解前的油或脂肪具有更低的反式脂肪含量。
4.权利要求1或2的方法,其中所述油或脂肪包括藻类油、动物油植物油、具有改变的脂肪酸组成的油、低饱和油、鱼油或其组合。
5.权利要求4的方法,其中所述油包括Neochloris oleoabundans藻油、二形栅藻油、眼虫藻油、三褐指藻油、颗石藻油、小定鞭金藻油、扁藻油、四爿藻油、绿光等鞭金藻油、微拟球藻油、丛粒藻油、杜氏藻油、微球藻油、螺旋藻油、绿藻油、藻油、菜籽油蓖麻油椰子油、香菜油、玉米油、籽油、榛子油、其它坚果油、大麻籽油、亚麻籽油、池花籽油、橄榄油棕榈油、棕榈仁油、花生油油菜籽油、米糠油、红花油、油茶油、芝麻油、大豆油葵花籽油妥尔油、山茶油、油、猪油、乳脂、鸡脂,或所述任何脂肪或油的混合物。
6.权利要求4的方法,其中所述改变的脂肪酸包含高油酸油、低亚麻酸油或其组合。
7.权利要求4的方法,其中所述低饱和油包含高油酸菜籽油、低亚麻酸大豆油、高硬脂酸向日葵油或其组合。
8.权利要求4的方法,其中所述鱼油包含烛鱼油、鱼肝油、金狮油、沙丁鱼油、鲱油、油鲱鱼油或其组合。
9.权利要求1的方法,其中所述油或脂肪包含具有甘油三酯骨架的分子,且其中在所述水解期间,从至少一些所述甘油三酯骨架上去除脂肪酸。
10.权利要求9的方法,其中所述脂肪酸包含一种或更多的乙酸、丁酸、己酸、辛酸、十一酸、月桂酸、肉豆蔻酸、十五烷酸、棕榈酸、十七烷酸、硬脂酸、花生酸或二十二酸。
11.权利要求9的方法,其中从所述甘油三酯骨架上的Sn1、Sn2或Sn3位点上选择性去除所述脂肪酸。
12.权利要求1的方法,其中所述油或脂肪存在于饲料或食品中,且所述水解在所述饲料或食品被动物或个体消耗之前完成。
13.权利要求1的方法,其中所述油或脂肪包括一种或更多的甘油三酯、甘油二酯、或甘油单酯,且其中所述步骤(a)的多肽与所述油或脂肪在一定条件下接触,在所述条件下,所述多肽水解一种或更多的所述甘油三酯、甘油二酯或甘油单酯。
14.权利要求13的方法,其中所述水解导致组合物中甘油三酯、甘油二酯或甘油单酯的量降低。
15.权利要求1的方法,其中所述油或脂肪包括多不饱和脂肪酸甘油酯。
16.权利要求1的方法,其中所述水解的油或脂肪包含任何一种或更多种以下物质:
低饱和油或脂肪、无-反式的油或脂肪、含有必需脂肪酸的脂质、含有单不饱和脂肪酸的脂质、含有磷酸-胆碱的脂质、含有磷酸-丝氨酸的脂质、含有植物甾醇的脂质、1,3-甘油二酯、2-甘油单酯、和甘油三酯。
17.权利要求1的方法,其中所述组合物包括基于乳或蔬菜的食品组合物,其中该多肽能够水解所述组合物中的油或脂肪,从而降低其脂肪含量。
18.一种生物催化合成结构化脂质的方法,该方法包括以下步骤:
(a)提供一种具有水解酶活性的多肽,所述多肽选自具有水解酶活性的分离的、合成的和重组的多肽,且所述多肽
i.由下述核酸编码
(1)一种核酸,其包含与SEQ ID NO:1具有至少50%序列同一性的核酸序列且其中1、
2、3、4、5、6、7、8、9、10、11或12或更多、或全部碱基残基发生改变,如表3或表4所示,其中该核酸编码至少一种具有水解酶活性的多肽,或
(2)一种核酸,其包含在严格条件下与包含SEQ ID NO:1且具有如表3或表4所示的
1、2、3、4、5、6、7、8、9、10、11或12或更多或全部碱基残基改变的核酸序列杂交的序列,其中该核酸编码具有水解酶活性的多肽;或
ii.在至少约100个残基的区域内与SEQ ID NO:2具有至少50%的序列同一性,且其中1、2、3、4、5、6、7、8、9、10、11或12或更多或全部氨基酸残基发生改变,如表3或表4所示,或
iii.包含一种如SEQ ID NO:2所示的氨基酸序列,并且包含至少一种下列氨基酸残基修 饰:D61A;D61E;R72E;R72K;E116A;E116Q;E116R;E116T;E116V;S133A;I151G;I151A;
V163R;D164R,或其组合,或
iv.包含一种如SEQ ID NO:2所示的氨基酸序列,并且包含至少一种下列氨基酸残基修 饰:I20L;V62S;G77P;V83C;D88H;Y113G;E116T;E116G;H140K;K146S;I167S;L180E;
E194M;A211Q;S212Y;G215C;G215V;G215W;A218H;A218S;V223A;A225M;A225Q,或 其 组合;
(b)提供一种包含甘油三酯(TAG)的组合物;
(c)将步骤(a)的多肽与步骤(b)的组合物在一定条件下接触,在该条下,该多肽水解位于所述甘油三酯(TAG)的Sn2位点的酰基残基,从而生成1,3-甘油二酯(DAG);
(d)提供一种R1酯;
(e)提供一种R1特异性水解酶,和
(f)将步骤(c)的1,3-DAG与步骤(d)的R1酯和步骤(e)的R1特异性水解酶在一定
条件下进行接触,在该条件下,所述R1特异性水解酶催化Sn2位点的酯化,从而生成结构化脂质。
19.权利要求18的方法,其中所述R1特异性水解酶为Sn2-特异性脂肪酶。
20.权利要求18的方法,其中所述结构化脂质选自代可可脂(CBA)、合成可可脂、天然可可脂、1,3-二棕榈酰-2-油酰甘油(POP)、1,3-二硬脂酰-2-油酰甘油(SOS)、1-棕榈酰-2-油酰-3-硬脂酰甘油(POS)和1-油酰-2,3-二肉豆蔻酰甘油(OMM)。
21.权利要求18的方法,其中所述R1酯包含比所述水解的酰基残基饱和度低的脂肪酸。
22.权利要求18的方法,其中所述R1酯可含包括一种或更多种以下物质:ω-3脂肪酸、ω-6脂肪酸、ω-9脂肪酸、单不饱和脂肪酸、磷酸基团、植物甾醇酯、或谷维素。
23.权利要求18的方法,其中所述R1酯包含选自α-亚麻酸、十八四烯酸、二十碳五烯酸、二十二碳六烯酸、γ-亚麻酸、二高-γ-亚麻酸、花生四烯酸、油酸、棕榈油酸、胆碱、丝氨酸、β-谷甾醇、香豆雌酚、以及二乙基己烯雌酚的部分。
24.权利要求18的方法,其中所述合成的结构化脂质具有比所述甘油三酯更低的饱和脂肪含量。
25.权利要求18的方法,其中所述合成的结构化脂质具有比所述甘油三酯更低的反式脂肪含量。
26.一种生物催化合成结构化脂质的方法,该方法包括以下步骤:
(a)提供一种具有水解酶活性的多肽,所述多肽选自具有水解酶活性的分离的、合成的和重组的多肽,且所述多肽
i.由下述核酸编码
(1)一种核酸,其包含与SEQ ID NO:1具有至少50%序列同一性的核酸序列且其中1、
2、3、4、5、6、7、8、9、10、11或12或更多、或全部碱基残基发生改变,如表3或表4所示,其中该核酸编码至少一种具有水解酶活性的多肽,或
(2)一种核酸,其包含在严格条件下与包含SEQ ID NO:1且具有如表3或表4所示的
1、2、3、4、5、6、7、8、9、10、11或12或更多或全部碱基残基改变的核酸序列杂交的序列,其中该核酸编码具有水解酶活性的多肽;或
ii.在至少约100个残基的区域内与SEQ ID NO:2具有至少50%的序列同一性,且其中1、2、3、4、5、6、7、8、9、10、11或12或更多或全部氨基酸残基发生改变,如表3或表4所示,或
iii.包含一种如SEQ ID NO:2所示的氨基酸序列,并且包含至少一种下列氨基酸残基修 饰:D61A;D61E;R72E;R72K;E116A;E116Q;E116R;E116T;E116V;S133A;I151G;I151A;
V163R;D164R,或其组合,或
iv.包含一种如SEQ ID NO:2所示的氨基酸序列,并且包含至少一种下列氨基酸残基修 饰:I20L;V62S;G77P;V83C;D88H;Y113G;E116T;E116G;H140K;K146S;I167S;L180E;
E194M;A211Q;S212Y;G215C;G215V;G215W;A218H;A218S;V223A;A225M;A225Q,或 其 组合;
(b)提供一种包含甘油三酯(TAG)的组合物;
(c)将步骤(a)的多肽与步骤(b)的组合物在一定条件下接触,在该条件下,所述多肽水解所述甘油三酯(TAG)的Sn1或Sn3位点的酰基残基,从而生成1,2-DAG或2,3-DAG;和(d)在动学控制条件下促进步骤(c)的1,2-DAG或2,3-DAG的酰基转移,从而生成
1,3-DAG。
27.权利要求26的方法,其进一步包括如下步骤:提供一种R1酯和一种R1特异性脂肪酶,并将步骤(d)的1,3-DAG与所述R1酯和所述R1特异性脂肪酶在一定条件下进行接触,在该条件下,所述R1特异性脂肪酶催化Sn2位点的酯化,从而生成结构化脂质。
28.权利要求27的方法,其中所述R1-特异性脂肪酶为Sn1或Sn3特异性脂肪酶。
29.权利要求27的方法,其中所述结构化脂质选自代可可脂(CBA)、合成可可脂、天然可可脂、1,3-二棕榈酰-2-油酰甘油(POP)、1,3-二硬脂酰-2-油酰甘油(SOS)、1-棕榈酰-2-油酰-3-硬脂酰甘油(POS)或1-油酰-2,3-二肉豆蔻酰甘油(OMM)。
30.权利要求27的方法,其中所述R1酯包含比所述水解的酰基残基饱和度低的脂肪酸。
31.权利要求30的方法,其中所述R1酯可以包含一种或更多以下物质:ω-3脂肪酸、ω-6脂肪酸、单-不饱和脂肪酸、磷酸基团、植物甾醇酯、以及谷维素。
32.权利要求30的方法,其中所述R1酯包含选自α-亚麻酸、二十碳五烯酸、二十二碳六烯酸、γ-亚麻酸、二高-γ-亚麻酸、花生四烯酸、油酸、棕榈油酸、胆碱、丝氨酸、β-谷甾醇、香豆雌酚、二乙基己烯雌酚、以及谷维素的部分。
33.权利要求26的方法,其中步骤(d)进一步包括使用离子交换树脂
34.权利要求26的方法,其中所述步骤(d)的动力学控制的条件包括非平衡条件,其导致生成具有1,3-DAG与2,3-DAG之比大于2∶1的比例的终产物。
35.权利要求27的方法,其中所述合成的结构化脂质具有比所述甘油三酯更低的饱和脂肪含量。
36.权利要求27的方法,其中所述合成的结构化脂质具有比所述甘油三酯更低的反式脂肪含量。
37.一种催化酯交换反应生成新型甘油三酯的方法,该方法包括以下步骤:
(a)提供一种包含具有1,3-特异性脂肪酶活性的多肽的组合物,所述多肽选自具有水解酶活性的分离的、合成的或重组的多肽,且所述多肽
i.由下述核酸编码
(1)一种核酸,其包含与SEQ ID NO:1具有至少50%序列同一性的核酸序列且其中1、
2、3、4、5、6、7、8、9、10、11或12或更多、或全部碱基残基发生改变,如表3或表4所示,其中该核酸编码至少一种具有水解酶活性的多肽,或
(2)一种核酸,其包含在严格条件下与包含SEQ ID NO:1且具有如表3或表4所示的
1、2、3、4、5、6、7、8、9、10、11或12或更多或全部碱基残基改变的核酸序列杂交的序列,其中该核酸编码具有水解酶活性的多肽;或
ii.在至少约100个残基的区域内与SEQ ID NO:2具有至少50%的序列同一性,且其中1、2、3、4、5、6、7、8、9、10、11或12或更多或全部氨基酸残基发生改变,如表3或表4所示,或
iii.包含一种如SEQ ID NO:2所示的氨基酸序列,并且包含至少一种下列氨基酸残基修 饰:D61A;D61E;R72E;R72K;E116A;E116Q;E116R;E116T;E116V;S133A;I151G;I151A;
V163R;D164R,或其组合,或
iv.包含一种如SEQ ID NO:2所示的氨基酸序列,并且包含至少一种如下氨基酸残基修 饰:I20L;V62S;G77P;V83C;D88H;Y113G;E116T;E116G;H140K;K146S;I167S;L180E;
E194M;A211Q;S212Y;G215C;G215V;G215W;A218H;A218S;V223A;A225M;A225Q,或 其 组合;
(b)提供甘油三酯和游离脂肪酸的混合物;
(c)在一定条件下用多肽处理步骤(b)的组合物,在所述条件下,所述多肽能够催化游离脂肪酸与甘油三酯的酰基发生交换,从而生成富含所述脂肪酸的新甘油三酯。
38.权利要求37的方法,其中所述步骤(b)的组合物包含1,3-二棕榈酰-2-油酸单甘油酯(POP),且步骤(c)的新甘油三酯包含1-棕榈酰-3-硬脂酰-2-油酸单甘油酯(POSt)和1,3-二硬脂酰-2-油酸单甘油酯(StOSt)之一或两者。
39.权利要求37的方法,其中步骤(c)的所述新甘油三酯具有比步骤(b)的所述甘油三酯更低的饱和脂肪含量。
40.权利要求37的方法,其中步骤(c)的所述新甘油三酯具有比步骤(b)的所述甘油三酯更低的反式脂肪含量。
41.一种用于制备食品、饲料或油的酯交换方法,该方法包括以下步骤:
(a)提供一种酯交换反应混合物,其包含硬脂酸来源的材料,该材料选自硬脂酸、低分子量一元醇的硬脂酸单酯及其混合物;
(b)提供一种含有甘油三酯的食品、饲料或油;
(c)提供一种具有水解酶活性的多肽,所述多肽选自具有水解酶活性的分离的、合成的和重组的多肽,且所述多肽
i.由下述核酸编码
(1)一种核酸,其包含与SEQ ID NO:1具有至少50%序列同一性的核酸序列且其中1、
2、3、4、5、6、7、8、9、10、11或12或更多、或全部碱基残基发生改变,如表3或表4所示,其中该核酸编码至少一种具有水解酶活性的多肽,或
(2)一种核酸,其包含在严格条件下与包含SEQ ID NO:1且具有如表3或表4所示的
1、2、3、4、5、6、7、8、9、10、11或12或更多或全部碱基残基改变的核酸序列杂交的序列,其中该核酸编码具有水解酶活性的多肽;或
ii在至少约100个残基的区域内与SEQ ID NO:2具有至少50%的序列同一性,且其中
1、2、3、4、5、6、7、8、9、10、11或12或更多或全部氨基酸残基发生改变,如表3或表4所示,或iii.包含一种如SEQ ID NO:2所示的氨基酸序列,并且包含至少一种下列氨基酸残基修 饰:D61A;D61E;R72E;R72K;E116A;E116Q;E116R;E116T;E116V;S133A;I151G;I151A;
V163R;D164R,或其组合,或
iv.包含一种如SEQ ID NO:2所示的氨基酸序列,并且包含至少一种下列氨基酸残基修 饰:I20L;V62S;G77P;V83C;D88H;Y113G;E116T;E116G;H140K;K146S;I167S;L180E;
E194M;A211Q;S212Y;G215C;G215V;G215W;A218H;A218S;V223A;A225M;A225Q,或 其 组合;
(d)对所述硬脂酸来源的材料和所述食品、饲料、或油的甘油三酯进行酯交换,和(e)从所述酯交换混合物中的酯交换后的甘油酯组分中分离游离脂肪酸组分,以提供酯交换后的油产品和脂肪酸混合物,所述脂肪酸混合物包含从食品、饲料或油中释放出的脂肪酸、脂肪酸单酯、或其混合物。
42.权利要求41的方法,其中所述酯交换反应持续进行,直至所述甘油酯组分的1-,
3-位点的酯基团与所述反应混合物的非甘油酯脂肪酸组分基本达到平衡。
43.权利要求41的方法,该方法包括进一步氢化所述脂肪酸混合物的步骤。
44.权利要求41的方法,其中所述酯交换后的甘油三酯具有比步骤(b)的所述甘油三酯更低的饱和脂肪含量。
45.权利要求41的方法,其中所述酯交换后的甘油三酯具有比步骤(b)的所述甘油三酯更低的反式脂肪含量。
46.一种生成DAG的方法,该方法包括如下步骤:
(a)提供一种包含一定量TAG的油组合物,
(b)提供一种具有水解酶活性的多肽,所述多肽选自具有水解酶活性的分离的、合成的和重组的多肽,且所述多肽
i.由下述核酸编码
(1)一种核酸,其包含与SEQ ID NO:1具有至少50%序列同一性的核酸序列且其中1、
2、3、4、5、6、7、8、9、10、11或12或更多、或全部碱基残基发生改变,如表3或表4所示,其中该核酸编码至少一种具有水解酶活性的多肽,或
(2)一种核酸,其包含在严格条件下与包含SEQ ID NO:1且具有如表3或表4所示的
1、2、3、4、5、6、7、8、9、10、11或12或更多或全部碱基残基改变的核酸序列杂交的序列,其中该核酸编码具有水解酶活性的多肽;或
ii.在至少约100个残基的区域内与SEQ ID NO:2具有至少50%的序列同一性,且其中1、2、3、4、5、6、7、8、9、10、11或12或更多或全部氨基酸残基发生改变,如表3或表4所示,或
iii.包含一种如SEQ ID NO:2所示的氨基酸序列,并且包含至少一种下列氨基酸残基修 饰:D61A;D61E;R72E;R72K;E116A;E116Q;E116R;E116T;E116V;S133A;I151G;I151A;
V163R;D164R,或其组合,或
iv.包含一种如SEQ ID NO:2所示的氨基酸序列,并且包含至少一种下列氨基酸残基修 饰:I20L;V62S;G77P;V83C;D88H;Y113G;E116T;E116G;H140K;K146S;I167S;L180E;
E194M;A211Q;S212Y;G215C;G215V;G215W;A218H;A218S;V223A;A225M;A225Q,或 其 组合;
(c)将步骤(a)的所述油组合物与步骤(b)的所述多肽在足以使所述多肽水解TAG的
酰基残基形成DAG的条件下接触。
47.权利要求46的方法,其中所述多肽是Sn2特异性的且所述DAG是1,3-DAG。
48.权利要求46的方法,其中所述多肽是Sn1或Sn3特异性的且所述DAG是1,2-DAG
或2,3-DAG。
49.权利要求46的方法,其中所述酰基残基包含饱和脂肪酸且所述DAG是比所述TAG更低饱和的脂肪。
50.权利要求46的方法,其中所述酰基残基包括反式脂肪酸且所述DAG是比所述TAG更低反式的脂肪。
51.一种组合物,其包含通过权利要求1的方法水解的油或脂肪。
52.权利要求51的组合物,其中所述组合物选自人造黄油、起酥油、蛋黄酱、可倾倒调料、可匙取调料、酱、卤汁、调味品、喷油、烹饪油、煎炸油、色拉油、糖果、代可可脂、可可脂取代物、可可脂替代物、可可脂等价物、食品、食品添加剂,或生产前述任一组合物的任何中间体。
53.一种水解油或脂肪的方法,该方法包括将所述油或脂肪在具有HLB大于12的乳化剂的存在下与棕榈酸酶反应,其中棕榈酸酶由具有与SEQ IDNO:1至少50%序列同一性的核酸序列编码,且具有i)在编码氨基酸残基位点95(或其等价物)处的核苷酸改变(或其等价物),如表9所示;ii)在编码氨基酸残基位点85和172(或其等价物)处的核苷酸发生改变(或其等价物),如表15所示;iii)在编码氨基酸残基位点83(或其等价物)处的核苷酸改变(或其等价物),如表16所示;以及iv)以下沉默突变:35GCT、102GTT、108AGT、
117CTT、126AGG、133TCT、以及188ACG。
54.权利要求53的方法,其中该核酸序列是SEQ ID NO:1的序列,且具有i)在编码氨基酸残基位点95(或其等价物)处的核苷酸改变(或其等价物),如表9所示;ii)在编码氨基酸残基位点85和172(或其等价物)处的核苷酸改变(或其等价物),如表15所示;
iii)在编码氨基酸残基位点83(或其等价物)处的核苷酸改变(或其等价物),如表16所示;以及iv)以下沉默突变:35GCT、102GTT、108AGT、117CTT、126AGG、133TCT、以及188ACG。
55.权利要求53或54的方法,其中所述乳化剂选自油酸钠、油酸、亚油酸钠、亚油酸钾、亚麻酸钠、亚麻酸钾、月桂酸钠、月桂酸钾、硬脂酸钠、硬脂酸钾、棕榈酸钠、棕榈酸钾、棕榈油酸钠、棕榈油酸钾或其组合。
56.权利要求53-55中任一权利要求的方法,其中所述反应在约20至70℃下进行。
57.权利要求53-56中任一权利要求的方法,其中所述反应混合物包含基于所述反应物总重量约1至20%的水。
58.权利要求53-57中任一权利要求的方法,其中所述反应产生包含基于所述油或脂肪总重量约5%的棕榈酸的油或脂肪。
59.权利要求53-57中任一权利要求的方法,其中所述反应产生包含基于所述油或脂肪总重量约1%的棕榈酸的油或脂肪。
60.权利要求53-59中任一权利要求的方法,其中所述油是精炼油。
61.权利要求53-60中任一权利要求的方法,其中所述反应进一步包括添加磷脂。
62.一种水解油或脂肪的方法,该方法包括以下步骤:
(a)获得包含油或脂肪的组合物,其中所述油或脂肪能够被具有水解酶活性的多肽水解,所述多肽选自具有水解酶活性的分离的、合成的和重组的多肽,且所述多肽
i.由下述核酸编码
(1)一种核酸,其包含与SEQ ID NO:1具有至少50%序列同一性的核酸序列且其中1、
2、3、4、5、6、7、8、9、10、11或12或更多、或全部碱基残基发生改变,如表3、表4、表9、表10、表11、表16或表23所示,其中该核酸编码至少一种具有水解酶活性的多肽,或
(2)一种核酸,其包含在严格条件下与包含SEQ ID NO:1且具有如表3、表4、表9、表
10、表11、表16或表23所示的1、2、3、4、5、6、7、8、9、10、11或12或更多或全部碱基残基改变的核酸序列杂交的序列,其中该核酸编码具有水解酶活性的多肽;或
ii.在至少约100个残基的区域内与SEQ ID NO:2具有至少50%的序列同一性,且其中1、2、3、4、5、6、7、8、9、10、11或12或更多或全部氨基酸残基发生改变,如表3、表4、表9、表10、表11、表16或表23所示,或
iii.包含一种如SEQ ID NO:2所示的氨基酸序列,并且包含至少一种下列氨基酸残基修 饰:D61A;D61E;R72E;R72K;E116A;E116Q;E116R;E116T;E116V;S133A;I151G;I151A;
V163R;D164R,或其组合,或
iv.包含一种如SEQ ID NO:2所示的氨基酸序列,并且包含至少一种下列氨基酸残基修 饰:I20L;V62S;G77P;V83C;D88H;Y113G;E116T;E116G;H140K;K146S;I167S;L180E;
E194M;A211Q;S212Y;G215C;G215V;G215W;A218H;A218S;V223A;A225M;A225Q,或 其 组合;
(b)在足以造成所述油或脂肪水解的条件下,将步骤(a)的所述多肽以足够的量添加至包含所述油或脂肪的组合物,从而水解所述油或脂肪。
63.一种生物催化合成结构化脂质的方法,该方法包括以下步骤:
(a)提供一种具有水解酶活性的多肽,所述多肽选自具有水解酶活性的分离的、合成的和重组的多肽,且所述多肽
i.由下述核酸编码
(1)一种核酸,其包含与SEQ ID NO:1具有至少50%序列同一性的核酸序列且其中1、
2、3、4、5、6、7、8、9、10、11或12或更多、或全部碱基残基发生改变,如表3、表4、表9、表10、表11、表16或表23所示,其中该核酸编码至少一种具有水解酶活性的多肽,或
(2)一种核酸,其包含在严格条件下与包含SEQ ID NO:1且具有如表3、表4、表9、表
10、表11、表16或表23所示的1、2、3、4、5、6、7、8、9、10、11或12或更多或全部碱基残基改变的核酸序列杂交的序列,其中该核酸编码具有水解酶活性的多肽;或
ii.在至少约100个残基的区域内与SEQ ID NO:2具有至少50%的序列同一性,且其中1、2、3、4、5、6、7、8、9、10、11或12或更多或全部氨基酸残基发生改变,如表3、表4、表9、表10、表11、表16或表23所示,或
iii.包含一种如SEQ ID NO:2所示的氨基酸序列,并且包含至少一种下列氨基酸残基修 饰:D61A;D61E;R72E;R72K;E116A;E116Q;E116R;E116T;E116V;S133A;I151G;I151A;
V163R;D164R,或其组合,或
iv.包含一种如SEQ ID NO:2所示的氨基酸序列,并且包含至少一种下列氨基酸残基修 饰:I20L;V62S;G77P;V83C;D88H;Y113G;E116T;E116G;H140K;K146S;I167S;L180E;
E194M;A211Q;S212Y;G215C;G215V;G215W;A218H;A218S;V223A;A225M;A225Q,或 其 组合;
(b)提供含有甘油三酯(TAG)的组合物;
(c)将步骤(a)的所述多肽与步骤(b)的所述组合物在一定条件下接触,在所述条
件下,所述多肽水解所述甘油三酯(TAG)Sn2位点处的酰基残基,从而生成1,3-甘油二酯(DAG);
(d)提供一种R1酯;
(e)提供一种R1特异性水解酶,和
(f)将步骤(c)的所述1,3-DAG与步骤(d)的所述R1酯和步骤(e)的所述R1特异性
水解酶在一定条件下进行接触,在所述条件下,所述R1特异性水解酶催化Sn2位点的酯化,从而生成结构化脂质。
64.一种生物催化合成结构化脂质的方法,该方法包括以下步骤:
(a)提供一种具有水解酶活性的多肽,所述多肽选自具有水解酶活性的分离的、合成的和重组的多肽,且所述多肽
i.由下述核酸编码
(1)一种核酸,其包含与SEQ ID NO:1具有至少50%序列同一性的核酸序列且其中1、
2、3、4、5、6、7、8、9、10、11或12或更多、或全部碱基残基发生改变,如表3、表4、表9、表10、表11、表16或表23所示,其中该核酸编码至少一种具有水解酶活性的多肽,或
(2)一种核酸,其包含在严格条件下与包含SEQ ID NO:1且具有如表3、表4、表9、表
10、表11、表16或表23所示的1、2、3、4、5、6、7、8、9、10、11或12或更多或全部碱基残基改变的核酸序列杂交的序列,其中该核酸编码具有水解酶活性的多肽;或
ii.在至少约100个残基的区域内与SEQ ID NO:2具有至少50%的序列同一性,且其中1、2、3、4、5、6、7、8、9、10、11或12或更多或全部氨基酸残基发生改变,如表3、表4、表9、表10、表11、表16或表23所示,或
iii.包含一种如SEQ ID NO:2所示的氨基酸序列,并且包含至少一种下列氨基酸残基修 饰:D61A;D61E;R72E;R72K;E116A;E116Q;E116R;E116T;E116V;S133A;I151G;I151A;
V163R;D164R,或其组合,或
iv.包含一种如SEQ ID NO:2所示的氨基酸序列,并且包含至少一种下列氨基酸残基修 饰:I20L;V62S;G77P;V83C;D88H;Y113G;E116T;E116G;H140K;K146S;I167S;L180E;
E194M;A211Q;S212Y;G215C;G215V;G215W;A218H;A218S;V223A;A225M;A225Q,或 其 组合;
(b)提供含有甘油三酯(TAG)的组合物;
(c)将步骤(a)的所述多肽与步骤(b)的所述组合物在一定条件下接触,在所述条件下,所述多肽水解所述甘油三酯(TAG)的Sn1或Sn3位点的酰基残基,从而生成1,2-DAG或
2,3-DAG;和
(d)在动力学控制条件下促进步骤(c)的1,2-DAG或2,3-DAG的酰基转移,从而生成
1,3-DAG。
65.一种催化酯交换反应生成新甘油三酯的方法,该方法包括以下步骤:
(a)提供包含具有1,3-特异性脂肪酶活性的多肽的组合物,所述多肽选自具有水解酶活性的分离的、合成的或重组的多肽,且所述多肽
i.由下述核酸编码
(1)一种核酸,其包含与SEQ ID NO:1具有至少50%序列同一性的核酸序列且其中1、
2、3、4、5、6、7、8、9、10、11或12或更多、或全部碱基残基发生改变,如表3、表4、表9、表10、表11、表16或表23所示,其中该核酸编码至少一种具有水解酶活性的多肽,或
(2)一种核酸,其包含在严格条件下与包含SEQ ID NO:1且具有如表3、表4、表9、表
10、表11、表16或表23所示的1、2、3、4、5、6、7、8、9、10、11或12或更多或全部碱基残基改变的核酸序列杂交的序列,其中该核酸编码具有水解酶活性的多肽;或
ii.在至少约100个残基的区域内与SEQ ID NO:2具有至少50%的序列同一性,且其中1、2、3、4、5、6、7、8、9、10、11或12或更多或全部氨基酸残基发生改变,如表3、表4、表9、表10、表11、表16或表23所示,或
iii.包含一种如SEQ ID NO:2所示的氨基酸序列,并且包含至少一种下列氨基酸残基修 饰:D61A;D61E;R72E;R72K;E116A;E116Q;E116R;E116T;E116V;S133A;I151G;I151A;
V163R;D164R,或其组合,或
iv.包含一种如SEQ ID NO:2所示的氨基酸序列,并且包含至少一种下列氨基酸残基修 饰:I20L;V62S;G77P;V83C;D88H;Y113G;E116T;E116G;H140K;K146S;I167S;L180E;
E194M;A211Q;S212Y;G215C;G215V;G215W;A218H;A218S;V223A;A225M;A225Q,或 其 组合;
(b)提供甘油三酯和游离脂肪酸的混合物;
(c)在一定条件下用所述多肽处理步骤(b)的所述组合物,在所述条件下,所述多肽能够催化游离脂肪酸与甘油三酯的酰基发生交换,从而生成富含所述脂肪酸的新甘油三酯。
66.一种用于制备食品、饲料或油的酯交换方法,该方法包括以下步骤:
(a)提供一种酯交换反应混合物,其包含硬脂酸来源的材料,所述材料选自硬脂酸、低分子量一元醇的硬脂酸单酯及其混合物;
(b)提供一种含有甘油三酯的食品、饲料或油;
(c)提供一种具有水解酶活性的多肽,所述多肽选自具有水解酶活性的分离的、合成的和重组的多肽,且所述多肽
i.由下述核酸编码
(1)一种核酸,其包含与SEQ ID NO:1具有至少50%序列同一性的核酸序列且其中1、
2、3、4、5、6、7、8、9、10、11或12或更多、或全部碱基残基发生改变,如表3、表4、表9、表10、表11、表16或表23所示,其中该核酸编码至少一种具有水解酶活性的多肽,或
(2)一种核酸,其包含在严格条件下与包含SEQ ID NO:1且具有如表3、表4、表9、表
10、表11、表16或表23所示的1、2、3、4、5、6、7、8、9、10、11或12或更多或全部碱基残基改变的核酸序列杂交的序列,其中该核酸编码具有水解酶活性的多肽;或
ii.在至少约100个残基的区域内与SEQ ID NO:2具有至少50%的序列同一性,且其中1、2、3、4、5、6、7、8、9、10、11或12或更多或全部氨基酸残基发生改变,如表3、表4、表9、表10、表11、表16或表23所示,或
iii.包含一种如SEQ ID NO:2所示的氨基酸序列,并且包含至少一种下列氨基酸残基修 饰:D61A;D61E;R72E;R72K;E116A;E116Q;E116R;E116T;E116V;S133A;I151G;I151A;
V163R;D164R,或其组合,或
iv.包含一种如SEQ ID NO:2所示的氨基酸序列,并且包含至少一种下列氨基酸残基修 饰:I20L;V62S;G77P;V83C;D88H;Y113G;E116T;E116G;H140K;K146S;I167S;L180E;
E194M;A211Q;S212Y;G215C;G215V;G215W;A218H;A218S;V223A;A225M;A225Q,或 其 组合;
(d)对所述硬脂酸来源的材料和所述食品、饲料、或油的甘油三酯进行酯交换,和(e)从酯交换混合物中的酯交换后的甘油酯组分中分离游离脂肪酸组分,以提供酯交换后的油产品和脂肪酸混合物,所述脂肪酸混合物包含从所述食品、饲料或油中释放的脂肪酸、脂肪酸单酯,或其混合物。
67.一种生成DAG的方法,该方法包括如下步骤:
(a)提供一种包含一定量的TAG的油组合物,
(b)提供一种具有水解酶活性的多肽,所述多肽选自具有水解酶活性的分离的、合成的和重组的多肽,且所述多肽
i.由下述核酸编码
(1)一种核酸,其包含与SEQ ID NO:1具有至少50%序列同一性的核酸序列且其中1、
2、3、4、5、6、7、8、9、10、11或12或更多、或全部碱基残基发生改变,如表3、表4、表9、表10、表11、表16或表23所示,其中该核酸编码至少一种具有水解酶活性的多肽,或
(2)一种核酸,其包含在严格条件下与包含SEQ ID NO:1且具有如表3、表4、表9、表
10、表11、表16或表23所示的1、2、3、4、5、6、7、8、9、10、11或12或更多或全部碱基残基发生改变的核酸序列杂交的序列,其中该核酸编码具有水解酶活性的多肽;或
ii.在至少约100个残基的区域内与SEQ ID NO:2具有至少50%的序列同一性,且其中1、2、3、4、5、6、7、8、9、10、11或12或更多或全部氨基酸残基发生改变,如表3、表4、表9、表10、表11、表16或表23所示,或
iii.包含一种如SEQ ID NO:2所示的氨基酸序列,并且包含至少一种下列氨基酸残基修 饰:D61A;D61E;R72E;R72K;E116A;E116Q;E116R;E116T;E116V;S133A;I151G;I151A;
V163R;D164R,或其组合,或
iv.包含一种如SEQ ID NO:2所示的氨基酸序列,并且包含至少一种下列氨基酸残基修 饰:I20L;V62S;G77P;V83C;D88H;Y113G;E116T;E116G;H140K;K146S;I167S;L180E;
E194M;A211Q;S212Y;G215C;G215V;G215W;A218H;A218S;V223A;A225M;A225Q,或 其 组合;
(c)将步骤(a)的所述油组合物与步骤(b)的所述多肽在一定条件下进行接触,所述条件足以使所述多肽水解所述TAG的酰基残基形成DAG。

说明书全文

解酶、编码它们的核酸及制备和使用它们的方法

[0001] 相关申请的交叉参考
[0002] 本申请要求于2008年8月29日提交的美国专利申请号12/202,204的权益,其由本发明全文引入作为参考。
[0003] 序列表
[0004] 本申请同时提交了文件名为011631-0045-228_SeqListing.txt的序列表文件,其大小为46,086字节,创建于2009年8月25日。该序列表由本发明完整引入作为参考。

技术领域

[0005] 本发明提供了具有水解酶活性(包括脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性)的多肽,编码这些多肽的多核苷酸,以及制备和使用这些多核苷酸和多肽的方法。本发明还提供了具有水解酶活性的肽和多肽,例如酶,诸如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶;以及使用这些肽和多肽处理脂肪和油以制备水解的油产品(例如低饱和动物油
植物油,例如,大豆或菜籽油)的方法、经过该种处理的油产品、以及包含经过该种处理的油的产品。

背景技术

[0006] 水解酶,例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶的主要工业应用,包括在食品和饮料工业作为焙烤食品的保鲜剂,和生成人造黄油和其它 具有天然黄油味的糊状食品;用于垃圾(处理)系统;以及在医药工业中用于消化助剂。
[0007] 加工过的油和脂肪是食品、食品添加剂食品加工助剂的主要组分,也是重要的可再生的化工原材料。其可以通过加工植物(例如米糠、玉米、油菜籽、芸苔、向日葵、橄榄、棕榈或大豆)油料种子而大量获得。其它有价值的油和脂肪的来源包括鱼、餐厨垃圾、和提取的动物脂肪。这些脂肪和油是甘油三酯或脂质的混合物,即在甘油支架上酯化的脂肪酸
(FA)。每种油或脂肪包含大量不同的脂质结构,其由FA含量及其在甘油骨架上的区域化学
分布来定义。各脂质的这些性质决定了纯甘油三酯的物理性质。因此,脂肪或油的甘油三
酯含量在很大程度上决定了该油的物理、化学和生物学性质。脂质的价值随着其纯度而大
大增加。可以通过分级色谱或蒸馏将需要的甘油三酯从脂肪或油源的混合背景中进行分离
而获得高纯度。然而,此法是很昂贵的且其产率通常受到天然存在的低水平的甘油三酯的
的限制。另外,产物纯化过程也常常由于油中存在很多在结构上、和物理或化学性质上相似的甘油三酯而受到影响。
[0008] 从天然来源中纯化甘油三酯或其它脂质的替代方法是合成脂质。该工艺的产物被称为结构化脂质,因为它们含有一组确定的脂肪酸,这些脂肪酸以确定的方式分布于甘油
骨架上。通过控制脂质内的脂肪酸含量和分布也可以大大增加脂质的价值。从甘油三酯、
脂肪或油中去除不需要的FA,或将具有不需要的性质的FA替换为具有更好或更需要的化
学、物理或生物学性质的脂肪酸,能够增加脂质的价值。特别地,需要能够水解例如选择性水解饱和脂肪酸的脂肪酶(“饱和酶”),或特别地,能够从甘油骨架上水解例如选择性水解棕榈酸(“棕榈酸酶”)或硬脂酸(“硬脂酸酶”)的脂肪酶。脂肪酶,例如饱 和酶,例如棕榈酸酶和/或硬脂酸酶,可以被用于实现这种控制,其中被去除、添加或替换的FA是饱和脂肪酸,例如,棕榈酸或硬脂酸。
[0009] 发明概述
[0010] 本发明提供了具有水解酶活性(包括脂肪酶活性)的多肽。一方面,本发明提供了新类型的脂肪酶,命名为“饱和酶(saturase)”、“棕榈酸酶(palmitase)”和“硬脂酸酶(stearatase)”。同样提供了编码具有饱和酶活性、例如棕榈酸酶和/或硬脂酸酶活性的多肽的多核苷酸,以及制备和使用这些多核苷酸和多肽的方法。一方面,本发明提供了具有水解酶活性(例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性)、具有热稳定性和/或耐热
性的酶(催化)活性的多肽,例如酶。本发明提供的多肽和肽的酶活性包括(包含或由其
组成)饱和酶活性或脂肪酶活性,包括脂质水解、酸水解反应(例如,将酯化脂肪酸替换为
游离脂肪酸)、转酯化反应(例如,在甘油三酯之间进行脂肪酸交换)、酯合成、酯交换反应和脂质酰基水解酶(LAH)活性。另一方面,本发明提供的多肽被用于合成对映体纯的手性
产物。
[0011] 本发明提供的多肽可被用于医药、农业和工业的各种情形中,包括化妆品和保健品生成。另外,本发明提供的多肽可被用于食品加工、酿造、沐浴液添加剂、酒精生成、肽合成、对映体选择、皮革工业的皮革制备、废料管理和动物废物降解、摄影工业中的回收、医疗、丝绸脱胶、生物膜降解、生物质转化为乙醇、生物防卫、抗菌剂和消毒剂、个人护理和化妆品、生物技术试剂、增加玉米湿磨的淀粉产量、以及作为药品例如消化助剂和抗-炎症
(抗-炎)试剂。
[0012] 在一些实施方式中,本发明提供了组合物(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)和制备低饱和油(例如具有更低的脂肪酸含量的油)的方法,包括棕榈酸、硬脂酸、肉豆蔻酸、月桂酸或丁酸脂肪酸和/或辛酸含量低的油。可以使用本发明提供的组合物或方法进行处理任何植物油(例如菜籽油、大豆油)或动物油或脂肪(例如油)。任何
食品、可食用物品、或烘烤/油炸或蒸煮产品(例如,酱、卤汁、调味品、喷油、人造黄油、烘焙油、蛋黄酱、烹调油、色拉油、可匙取和可倾倒的调料等,以及由此制成的产品)都可以包含已经使用本发明提供的组合物或方法处理过的植物油或动物脂肪。被修饰为低饱和油的植
物油可被用于任何食品、可食用物品、或烘烤/油炸或蒸煮产品(例如,酱、卤汁、调味品、喷油、人造黄油、烘焙油、蛋黄酱、烹调油、色拉油、可匙取和可倾倒的调料等)。在一个实施方式中,本发明提供了油,例如植物油(例如,菜籽油或大豆油),以及食品、或烘焙或烹饪产品,包括酱、卤汁、调味品、喷油、人造黄油、烘焙油、蛋黄酱、烹调油、煎炸油、色拉油、可匙取和可倾倒的调料等,其中油或食品、烘焙或烹饪产品已经由本发明提供的酶进行了修饰。一方面,这些植物油(例如,菜籽油、蓖麻油椰子油、香菜油、玉米油、籽油、榛子油、大麻籽油、亚麻籽油、池花籽油、橄榄油棕榈油、棕榈仁油、花生油、菜籽油、米糠油、红花油、油茶油、大豆油、葵花籽油、妥尔(tall)油、山茶油、经过遗传修饰的微生物(GMO)和传统的“育种”而具有改变的脂肪酸组分的各种“天然”油(例如高油酸、低亚麻酸、或低饱和油(高
油酸菜籽油、低亚麻酸大豆油或高硬脂酸葵花籽油)))、动物脂肪(牛油、猪油、黄油脂肪和鸡脂肪)、鱼油(烛鱼油、鳕鱼肝油,金狮油、沙丁鱼油、鲱鱼油、和油鲱鱼油),或上述任何油的共混物,以及食品或烘焙、煎炸或烹饪产品中包含了使用本发明提供的组合物或方法加 工的具有更低的脂肪酸含量的油,包括棕榈酸、肉豆蔻酸、月桂酸、硬脂酸、辛酸等含量低的油。
[0013] 一方面,本发明提供了具有水解酶活性(例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性)的多肽,例如酶和催化抗体,其包括热稳定和耐热酶活性,以及脂肪酸特异性或脂肪酸选择性活性,和低或高的pH耐受酶活性;以及编码这些多肽的多核苷酸,包括载
体、宿主细胞、转基因植物和非人动物;以及制备和使用这些多核苷酸和多肽的方法。
[0014] 另一方面,本发明提供了分离的、合成的或重组的核酸,其包含:
[0015] (a)一种核酸(多核苷酸),其编码至少一种多肽,其中该核酸包含与下述序列具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、
63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、
78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、
93%、94%、95%、96%、97%、98%、99%、或更多、或完全(100%)的序列同一性的序列: [0016] (i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQID NO:17、SEQ ID NO:19、SEQ ID NO:22或SEQ ID NO:23,或
[0017] (ii)SEQ ID NO:1的核酸,其具有一个或更多个核苷酸发生改变(或其等价物),其编码1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或更多或全部基酸的改变(或其等价物),如表3、表4、表9、表10、表11、表16或表23所示,
[0018] 其中(i)或(ii)的核酸编码至少一种具有水解酶活性(例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性)的多肽,或编码能够产生水解酶(例如脂肪酶、饱和酶、棕榈
酸酶和/或硬脂酸酶)特异性抗体的多肽或肽(作为表位或免疫原的多肽或肽),
[0019] (b)(a)的核酸(多核苷酸),其中序列同一性如下确定:(A)用序列比对算法进行分析或通过目视检查,或(B)跨越以下区域:至少约10、15、20、25、30、35、40、45、50、55、60、
65、70、75、100、125、150、175、200、250、300、350、400、450、500、550、600、650、700、750、800、
850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550或更多残基,或全长cDNA、转录(mRNA)或基因,
[0020] (c)(a)或(b)的核酸(多肽),其中,序列比对算法是BLAST 2.2.2版算法,其中过滤设置被设定为blastall-p blastp-d“nr pataa”-F F,其它选项均设置为缺省,
[0021] (d)一种核酸(多核苷酸),其编码至少一种具有水解酶活性(例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性)的多肽或肽,其中该核酸包含在严格条件下与核酸(a)、(b)或(c)的互补序列杂交的序列,其中严格条件包括洗涤步骤,其包括在约65℃的温度
用0.2×SSC洗涤约15分钟,
[0022] (e)一种核酸(多核苷酸),其编码至少一种具有水解酶活性(例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性)的多肽,其中该多肽包含序列SEQ ID NO:2或其酶活
片段,其具有至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、
24、或更多 或全部氨基酸的改变(或其等价物),如表3、表4、表9、表10、表11、表16或表
23所示,
[0023] (f)一种核酸(多核苷酸),其编码至少一种具有水解酶活性(例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性)的多肽,其中该多肽包含序列SEQ IDNO:2、SEQ ID NO:
4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQID NO:12、SEQ ID NO:14、SEQ ID NO:
16、SEQ ID NO:18、或SEQ IDNO:20或其酶活性片段,
[0024] (g)(A)(a)至(f)的任一核酸(多核苷酸),且编码一种具有至少一个保守的氨基酸取代并保留其水解酶活性(例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性)的多
肽,或,
[0025] (B)(g)(A)的核酸,其中该至少一个保守的氨基酸取代包括将一种氨基酸替换为具有相似特征的另一氨基酸;或保守取代包括:替换一种脂肪族氨基酸为另一脂肪族氨基
酸;替换丝氨酸为苏氨酸或反之亦然;替换一种酸性残基为另一酸性残基;替换一种带有
酰胺基的残基为另一带有酰胺基的残基;将一种性残基与另一碱性残基互换;或替换一
种芳香族残基为另一芳香族残基,
[0026] (h)(a)至(g)的任一核酸(多核苷酸),其编码一种具有水解酶活性(例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性),但缺少信号序列的多肽,
[0027] (i)(a)至(h)的任一核酸(多核苷酸),其编码一种具有水解酶活性(例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性),且进一步包含异源序列的多肽,
[0028] (j)(i)的核酸(多核苷酸),其中异源序列包含或由编码以下序列的序列组成:(A)异源信号序列;(B)(A)的序列,其中异源信号序列来源于异源酶;或,(C)标签、表位、靶向肽、可裂解序列、可检测部分或酶,或
[0029] (k)与(a)至(j)的任何序列完全互补的核酸序列(多核苷酸)。
[0030] 一方面,分离的、合成的或重组的核酸编码具有水解酶活性(例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性)的多肽或肽,其是热稳定的。由本发明提供的核酸编
码的多肽和肽,或本发明提供的任何多肽或肽,能够在包括以下温度范围的条件下保留酶
或结合活性(例如,底物结合):约-100℃至约-80℃、约-80℃至约-40℃、约-40℃至
约-20℃、约-20℃至约0℃、约0℃至约5℃、约5℃至约15℃、约15℃至约25℃、约25℃至
约37℃、约37℃至约45℃、约45℃至约55℃、约55℃至约70℃、约70℃至约75℃、约75℃
至约85℃、约85℃至约90℃、约90℃至约95℃、约95℃至约100℃、约100℃至约105℃、
约105℃至约110℃、约110℃至约120℃、或95℃、96℃、97℃、98℃、99℃、100℃、101℃、
102℃、103℃、104℃、105℃、106℃、107℃、108℃、109℃、110℃、111℃、112℃、113℃、
114℃、115℃或更高温度。本发明提供了在上述温度范围下,且在约pH 3.0、约pH 3.5、约pH 4.0、约pH 4.5、约pH 5.0、约pH5.5、约pH 6.0、约pH 6.5、约pH 7.0、约pH 7.5、约pH
8.0、约pH 8.5、约pH 9.0、约pH 9.5、约pH 10.0、约pH 10.5、约pH 11.0、约pH 11.5、约pH12.0或更高pH的条件下保留水解酶活性(例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸
酶活性)的热稳定多肽。
[0031] 一方面,本发明提供的多肽可以是耐热的,且在暴露于以下范围内的温度下之后仍然能够保留水解酶活性,例如脂肪酶、饱和酶、棕榈酸酶和/或硬 脂酸酶活性:约-100℃至约-80℃、约-80℃至约-40℃、约-40℃至约-20℃、约-20℃至约0℃、约0℃至约5℃、约
5℃至约15℃、约15℃至约25℃、约25℃至约37℃、约37℃至约45℃、约45℃至约55℃、约
55℃至约70℃、约70℃至约75℃、约75℃至约85℃、约85℃至约90℃、约90℃至约95℃、
约95℃至约100℃、约100℃至约105℃、约105℃至约110℃、约110℃至约120℃、或95℃、
96℃、97℃、98℃、99℃、100℃、101℃、102℃、103℃、104℃、105℃、106℃、107℃、108℃、
109℃、110℃、111℃、112℃、113℃、114℃、115℃或更高温度。
[0032] 在一些实施方式中,耐热多肽在暴露于上述范围的温度后,在约pH3.0、约pH3.5、约pH 4.0、约pH 4.5、约pH 5.0、约pH 5.5、约pH 6.0、约pH 6.5、约pH 7.0、约pH
7.5、约pH 8.0、约pH 8.5、约pH 9.0、约pH9.5、约pH 10.0、约pH 10.5、约pH 11.0、约pH
11.5、约pH 12.0或更高pH的条件下,仍然保留水解酶活性,例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性。
[0033] 在一个实施方式中,分离的、合成的或重组的核酸包含在严格条件下与本发明提供的核酸杂交的序列,例如,本发明提供的示例性核酸包含如下所示的序列:SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ IDNO:17、SEQ ID NO:19、SEQ ID NO:22或SEQ ID NO:23,或如SEQ IDNO:1所示的序列并具有1、2、3、4、5、6、7、8、9、10、11或12或更多残基或全部残基的改变(对SEQ ID NO:1进行序列修饰),如表3、表4、表9、表10、表11、表16或表23所示,或其片段或子序列,以及与之(完全)互补的序列。一方面,该核酸编码具有水解酶活性(例如
脂肪酶、饱和酶、棕 榈酸酶和/或硬脂酸酶活性)的多肽。该核酸可以是包含SEQ ID NO:1的基因或转录物的至少约10、15、20、25、30、35、40、45、50、55、60、65、70、75、100、125、150、
175、200、250、300、350、400、450、500、550、600、650、700个或更多残基或其全长,且具有如SEQ ID NO:1所示的序列并相对于SEQ ID NO:1具有1、2、3、4、5、6、7、8、9、10、11或12或更多残基或全部残基的改变(氨基酸序列修饰),如表3、表4、表9、表10、表11、表16或表
23所示;以及与之(完全)互补的序列。一方面,严格条件包括洗涤步骤,其包括在约65℃
的温度下用0.2×SSC洗涤约15分钟。
[0034] 在一个实施方式中,核酸探针,例如,用于识别编码具有水解酶活性(例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性)的多肽的核酸的探针,包括包含以下碱基或
由其组成的探针:本发明提供的序列或其片段或子序列的至少约10、15、20、25、30、35、40、
45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600、
650、700、750、800、850、900、950、1000个或更多连续碱基,其中该探针通过结合或杂交来识别核酸。探针可以包含寡核苷酸,其包含至少约10至50、约20至60、约30至70、约40至
80、或约60至100个包含本发明提供的序列或其片段或子序列的序列的连续碱基。探针可
以包含寡核苷酸,其包含本发明提供的核酸序列或其子序列的至少约10至50、约20至60、
约30至70、约40至80、或约60至100个连续碱基。
[0035] 在一个实施方式中,用于扩增编码具有水解酶活性(例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性)的多肽的核酸的扩增引物序列对包含引物对,该引物对包含能够扩增含有本发明提供的序列或其片段或子序列的核酸 的引物对,或由其组成。扩增引物序列对的一个或每个成员可以包含寡核苷酸,其包含该序列中的至少约10至50个连续碱基。 [0036] 在一个实施方式中,扩增编码具有水解酶活性(例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性)的多肽的核酸的方法,包括用能够扩增本发明提供的核酸序列或其片
段或子序列的扩增引物序列对扩增模板核酸。
[0037] 在一个实施方式中,表达框包含本发明提供的核酸或其子序列。一方面,表达框可包含与启动子可操作地连接的核酸。启动子可以是病毒、细菌、哺乳动物或植物启动子。一方面,植物启动子可以是铃著、水稻、玉米、小麦、烟草大麦启动子。启动子可以是组成型启动子。组成型启动子可包含CaMV35S。另一方面,启动子可以是诱导型启动子。一方面,启动子可以是组织特异性启动子或环境调控的或发育调控的启动子。因此,启动子可以是例如种子特异性、叶特异性、根特异性、主干特异性或脱落诱导的启动子。一方面,表达框可进一步包含植物或植物病毒表达载体。
[0038] 在一个实施方式中,克隆载体包含本发明提供的表达框(例如载体)或本发明提供的核酸。克隆载体可以是病毒载体、质粒、噬菌体、噬菌粒、粘粒、F黏粒(fosmid)、细菌噬菌体或人工染色体。病毒载体可以包括腺病毒载体、逆转录病毒载体或腺相关的病毒载体。
克隆载体可以包括细菌人工染色体(BAC)、质粒、细菌噬菌体P1-衍生的载体(PAC)、酵母人工染色体(YAC)、或哺乳动物人工染色体(MAC)。
[0039] 在一个实施方式中,转化细胞含有本发明提供的核酸或本发明提供的表达框(例如载体),或本发明提供的克隆载体。一方面,转化细胞可以是细菌细胞、哺乳动物细胞、真菌细胞、酵母细胞、昆虫细胞或植物细胞。一方面,植物细胞可以是马铃著、小麦、水稻、玉米、烟草或大麦细胞。转化细 胞可以是任何一种本领域技术人员熟知的宿主细胞,包
括原核细胞、真核细胞,例如细菌细胞、真菌细胞、酵母细胞、哺乳动物细胞、昆虫细胞、或植物细胞。示例性的细菌细胞包括下列属中的任何种:埃希氏杆菌属(Escherichia)、芽
孢杆菌属(Bacillus)、链霉菌属(Streptomyces)、沙氏菌属(Salmonella)、假单胞菌属
(Pseudomonas)和葡萄球菌属(Staphylococcus),其包括,例如,大肠杆菌(Escherichia
coli)、乳酸球菌(Lactococcus lactis)、枯草芽孢杆菌(Bacillus subtilis)、蜡状芽
胞杆菌(Bacillus cereus)、鼠伤寒沙门氏菌(Salmonella typhimurium)、荧光假单胞
菌(Pseudomonas fluorescens)。示例性的真菌细胞包括曲霉菌属(Aspergillus)的
任何种。示例性的酵母细胞包括以下属中的任何种:毕赤酵母属(Pichia)、酵母菌属
(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、或许旺酵母属(Schwanniomyces),包括毕赤酵母(Pichia pastoris)、啤酒酵母(Saccharomyces cerevisiae)、或裂殖酵母
(Schizosaccharomyces pombe)。示例性的昆虫细胞包括斜纹夜蛾属(Spodoptera)或果蝇
属(Drosophila)中的任何种,包括果蝇S2和斜纹夜蛾Sf9。示例性的动物细胞包括CHO、
COS或黑色素瘤或任何小鼠或人细胞系。
[0040] 在一个实施方式中,转基因植物含有本发明提供的核酸或本发明提供的表达框(例如,载体)。转基因植物可以是玉米植物、马铃著植物、西红柿植物、小麦植物、油料种子植物、油菜籽植物、大豆植物、水稻植物、大麦植物或烟草植物。
[0041] 在一个实施方式中,转基因种子含有本发明提供的核酸或本发明提供的表达框(例如,载体)。转基因种子可以是水稻、玉米种子、小麦仁、油料种子、油菜籽、大豆种子、棕榈仁、向日葵籽、芝麻种子、花生或烟草植物种子。
[0042] 在一个实施方式中,分离的、合成的或重组的多肽具有水解酶活性,例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性,或多肽能够产生针对水解酶(例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)的特异性免疫应答(例如,表位);且在可选的方面,本发明提供的肽和多肽包含以下序列:
[0043] (a)与以下序列具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、
74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、
89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或更多、或具有100%(完全)的序列同一性:
[0044] (i)SEQ ID NO:2的氨基酸序列,或其酶活性片段,且具有至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或更多或全部氨基酸残基的改变(或其等价物),如表3、表4、表9、表10、表11、表16或表23所示,或
[0045] (ii)SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQID NO:18、或SEQ ID NO:20的氨基酸序列, [0046] 其中(i)或(ii)的多肽或肽具有水解酶活性,例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性,或多肽或肽能够产生水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)的特异性抗体(作为表位或免疫原的多肽或肽),
[0047] (b)(a)的多肽或肽,其中序列同一性如下确定:(A)用序列比对算法进行分析或通过目视检查,或(B)跨越以下区域:至少约20、25、30、35、40、 45、50、55、60、75、100、150、
200、250、300或更多氨基酸残基、或全长的多肽或肽或酶,和/或其酶活性的子序列(片
段),
[0048] (c)(b)的多肽或肽,其中序列比对算法是BLAST2.2.2版算法,其中过滤设置被设定为blastall-p blastp-d″nr pataa″-F F,其它选项均设置为缺省;
[0049] (d)由本发明提供的核酸编码的氨基酸序列,其中该多肽具有(i)水解酶活性,例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性,或(ii)具有免疫原活性,其能够产生特异性结合具有(a)的序列和/或其酶活性子序列(片段)的多肽的抗体;
[0050] (e)(a)至(d)的任一氨基酸序列,并包含至少一个保守性氨基酸残基取代,且多肽或肽保留水解酶活性,例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性;
[0051] (f)(e)的氨基酸序列,其中保守性取代包括替换一种脂肪族氨基酸为另一脂肪族氨基酸;替换丝氨酸为苏氨酸或反之亦然;替换一种酸性残基为另一酸性残基;替换一种
带有酰胺基的残基为另一带有酰胺基的残基;将一种碱性残基与另一碱性残基互换;或替
换一种芳香族残基为另一芳香族残基,或其组合,
[0052] (g)(f)的氨基酸序列,其中脂肪性残基包括丙氨酸、缬氨酸、亮氨酸、异亮氨酸或其合成的等价物;酸性残基包括天冬氨酸、谷氨酸或其合成的等价物;包含酰胺基的残基包括天冬酰胺、谷氨酰胺或其合成的等价物;碱性残基包括赖氨酸、精氨酸、组氨酸或其合成的等价物;或芳香族残基包括苯丙氨酸、酪氨酸、色氨酸或其合成的等价物;
[0053] (h)具有水解酶活性(例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性)但缺少信号序列的(a)至(f)的任一多肽,
[0054] (i)具有水解酶活性(例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性)且进一步包含异源序列的(a)至(h)的任一多肽;
[0055] (j)(i)的多肽,其中所述异源序列包含以下序列或由其组成:(A)异源信号序列;(B)(A)的序列,其中异源信号序列来源于异源酶;和/或(C)标签、表位、靶向肽、可裂解序列、可检测部分或酶;或
[0056] (m)包含由本发明提供的任何核酸序列编码的氨基酸序列。
[0057] 本发明提供的示例性的多肽或肽的序列包括SEQ ID NO:2及其子序列及其变体,例如,至少约30、35、40、45、50、75、100、150、200、250、300、350、400、450、500或更多残基长度或全长的酶,其均具有1、2、3、4、5、6、7、8、9、10、11或12或更多或全部氨基酸残基的改变(对SEQ ID NO:2的氨基酸进行序列修饰),如表3、表4、表9、表10、表11、表16或表23所示。本发明提供的示例性的多肽或肽的序列包括由本发明提供的核酸编码的序列。本发明
提供的示例性的多肽或肽序列包括由本发明提供的抗体特异性结合的多肽或肽。一方面,
本发明提供的多肽具有至少一种水解酶活性,例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性。一方面,该活性是区域选择和/或化学选择活性。
[0058] 一方面,分离的、合成的或重组的多肽可包含本发明提供的多肽,其缺少信号(肽)序列,例如缺少其同源信号序列,且一方面,包含异源信号(肽)序列。一方面,分离
的、合成的或重组的多肽可包含本发明提供的多肽,其包含异源信号序列,例如异源水解酶或非水解酶(例如,非脂肪酶、非饱和酶或非棕榈酸酶)信号序列。一方面,嵌合蛋白质
含含有本发明提供的信号序列的第一结构域和至少一个第二结构域。该蛋白可以是融合蛋
白。第二结构域 可以包含酶。该酶可以是本发明提供的水解酶(例如脂肪酶、饱和酶、棕
榈酸酶和/或硬脂酸酶),或另一种水解酶。
[0059] 一方面,水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)活性包括在约37℃下约100至约1000单位每毫克蛋白范围内的比活性。另一方面,水解酶(例如,脂肪
酶、饱和酶、棕榈酸酶和/或硬脂酸酶)活性包括从约500至约750单位每毫克蛋白的比活
性。可选地,水解酶活性包括在37℃下约500至约1200单位每毫克蛋白范围内的比活性。
一方面,水解酶活性包括在37℃下约750至约1000单位每毫克蛋白范围内的比活性。另一
方面,耐热性包括在37℃下被加热至升高的温度后保留水解酶至少一半的比活性。可选地,耐热性可包括在被加热至升高的温度后保留了在37℃下约500至约1200单位每毫克蛋白
范围内的比活性。
[0060] 在一个实施方式中,本发明提供的分离的、合成的或重组的多肽包括至少一个糖基化位点。一方面,糖基化可以是N-连接的糖基化。一方面,多肽可以在毕赤酵母或裂殖
酵母中或在植物中表达后进行糖基化,例如产油植物,例如,大豆、油菜、水稻、向日葵、或遗传修饰的(GMO)这些植物的变体。
[0061] 一方面,多肽可以在包括约pH 6.5、pH 6、pH 5.5、pH 5、pH 4.5或pH4.0或更低pH的条件下保留水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)活性。另一方面,多肽可以在包括约pH 7、pH 7.5、pH 8.0、pH8.5、pH 9、pH 9.5、pH 10、pH 10.5、pH 11、pH 11.5、pH 12.0或更高pH的条件下保留水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或
硬脂酸酶)活性。
[0062] 在一个实施方式中,蛋白制剂包括本发明提供的多肽,其中蛋白制剂包括液体、固体或凝胶。
[0063] 一方面,本发明提供的异二聚体包括多肽和第二结构域。一方面,第二结构域可以是多肽且异二聚体可以是融合蛋白。一方面,第二结构域可以是表位或标签。一方面,本发明提供的同二聚体包括本发明提供的多肽。
[0064] 在一个实施方式中,本发明提供的固定化多肽具有水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)活性,其中该多肽包括本发明提供的多肽、由本发明提供的
核酸编码的多肽、或包含本发明提供的多肽和第二结构域的多肽。一方面,本发明提供的
多肽可以被固定化在细胞、囊泡、脂质体、胶片、薄膜、金属、树脂聚合物、陶瓷、玻璃、微电极石墨颗粒、珠子、凝胶、平板、晶体、片剂、丸剂、胶囊、粉末、团、表面、多孔结构、阵列或毛细管上,或例如谷物、糠、树皮、皮肤、头发、珐琅、骨头、贝壳的材料以及源自它们的材料上。本发明提供的多核苷酸、多肽和酶可以被制成固体形式,例如粉末、冻干制剂、颗粒剂、片剂、棒状体、晶体、胶囊、丸剂、小球;或液体形式,例如水溶液、气雾剂、凝胶、膏剂、浆体、水/油乳剂、乳膏、胶囊、或囊泡或胶束的悬液。
[0065] 在一个实施方式中,动物食品添加剂包含本发明提供的多肽,例如,由本发明提供的核酸编码的多肽。一方面,食品添加剂中的多肽可被糖基化。在一个实施方式中,食用酶的递送基质包括本发明提供的多肽,例如,由本发明提供的核酸编码的多肽。一方面,递送基质包括小球。一方面,多肽可被糖基化。一方面,水解酶活性是耐热的。另一方面,水解酶活性是热稳定的。
[0066] 在一个实施方式中,分离或识别具有水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)活性的多肽的方法包括以下步骤:(a)提供本发明提供的抗体;(b)提供包含多肽的样品;和(c)在抗体能够特异性结合多肽的条件下将步骤(b)的样品与步骤(a)的
抗体接触,从而分离或识别具有水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)活性的多肽。
[0067] 在一个实施方式中,抗水解酶抗体的制备方法包括将本发明提供的核酸或本发明提供的多肽或其子序列以足够的量施用给非人动物以产生体液的免疫应答,从而制备抗水
解酶抗体。本发明提供了抗水解酶抗体的制备方法,其包括以足够的量给非人动物施用本
发明提供的核酸或本发明提供的多肽或其子序列以产生免疫应答。
[0068] 在一个实施方式中,制备重组多肽的方法包括以下步骤:(a)提供本发明提供的核酸,其可操作地与启动子连接;和(b)在允许该多肽表达的条件下表达步骤(a)的核酸,
从而制备重组多肽。一方面,该方法可以进一步包括用步骤(a)的核酸转化宿主细胞,然后表达步骤(a)的核酸,从而在转化细胞中制备重组多肽。
[0069] 在一个实施方式中,识别具有水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)活性的多肽的方法包括以下步骤:(a)提供本发明提供的多肽,或由本发明提供的核酸编码的多肽;(b)提供水解酶底物;和(c)将步骤(a)的多肽或其片段或变体与步骤(b)
的底物接触,并检测底物量的减少或反应产物量的增加,其中检测出底物量的减少或反应
产物量的增加表示多肽具有水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)活
性。
[0070] 在一个实施方式中,识别水解酶底物的方法包括以下步骤:(a)提供本发明提供的多肽;或由本发明提供的核酸编码的多肽;(b)提供待测底物;和(c) 将步骤(a)的多肽
与步骤(b)的待测底物接触,并检测底物量的减少或反应产物量的增加,其中底物量的减
少或反应产物量的增加确定待测底物是水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬
脂酸酶)的底物。
[0071] 在一个实施方式中,确定待测化合物是否特异性结合多肽的方法包括以下步骤:(a)在允许核酸翻译为多肽的条件下表达核酸或包含核酸的载体,其中核酸包括本发明提
供的核酸,或提供本发明提供的多肽;(b)提供待测化合物;(c)将待测化合物与多肽接触;
和(d)确定步骤(b)的待测化合物是否特异性结合多肽。
[0072] 在一个实施方式中,识别水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)活性调节物的方法包括以下步骤:(a)提供本发明提供的多肽或由本发明提供的核酸
编码的多肽;(b)提供待测化合物;(c)将步骤(a)的多肽与步骤(b)的待测化合物接触并
测量水解酶的活性,其中与不含待测化合物时的活性相比,在待测化合物存在下检测到的
水解酶的活性的变化可以确定待测化合物调节水解酶活性。一方面,水解酶(例如,脂肪
酶、饱和酶、棕榈酸酶和/或硬脂酸酶)活性可以通过提供水解酶底物并检测底物量的减少
或反应产物量的增加或检测底物量的增加或反应产物量的减少来进行测定。与不含待测化
合物的底物或反应产物的量相比,使底物量减少或反应产物量增加的待测化合物被确定为
水解酶活性的活化剂。与不含待测化合物的底物或反应产物的量相比,使底物量增加或反
应产物量减少的待测化合物被确定为水解酶活性的抑制剂
[0073] 在一个实施方式中,计算机系统包括处理器和数据存储装置,其中所述数据存储装置存储了本发明提供的多肽序列或核酸序列(例如,由本发明提供的核酸编码的多肽)。
一方面,计算机系统可以进一步包括序列比对算法以及 储存了至少一个参比序列的数据
存储装置。另一方面,序列比对算法包括计算机程序,其表明多态性。一方面,计算机系统可以进一步包括标识符,其识别所述序列的一种或更多特征。在一个实施方式中,计算机可读介质储存了本发明提供的多肽序列或核酸序列。
[0074] 在一个实施方式中,识别序列特征的方法包括以下步骤:(a)使用能够识别序列中的一种或更多特征的计算机程序读取序列,其中序列包括本发明提供的多肽序列或核酸
序列;和(b)用该计算机程序识别序列中的一种或更多特征。
[0075] 在另一个实施方式中,本发明提供了将第一序列与第二序列进行比对的方法,包括以下步骤:(a)使用比对序列的计算机程序读取第一序列和第二序列,其中第一序列包
括本发明提供的多肽序列或核酸序列;和(b)使用计算机程序确定第一序列和第二序列之
间的不同。确定第一序列和第二序列之间不同的步骤可以进一步包括识别多态性的步骤。
一方面,该方法可以进一步包括标识符以识别序列中的一种或更多特征。另一方面,该方法可以包括使用计算机程序读取第一序列并识别该序列中的一种或更多特征。
[0076] 在一个实施方式中,用于从样品中分离或回收编码具有水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)活性多肽的核酸的方法包括以下步骤:(a)提供用于扩增编码具有水解酶活性的多肽的核酸的扩增引物序列对,其中该引物对能够扩增本发明提供
的核酸;(b)从样品中分离核酸或处理样品,由此样品中的核酸能够与扩增引物对杂交;以及(c)将步骤(b)的核酸与步骤(a)的扩增引物对混合并从样品中扩增核酸,从而从样品
中分离或回收编码具有水解酶活性的多肽的核酸。在一个实施方式中,样品是一种环境样
品,例如,水样品、液体样品、土壤样品、空气样品或生物样品,例如,细 菌细胞、原生动物细胞、昆虫细胞、酵母细胞、植物细胞、真菌细胞或哺乳动物细胞。扩增引物序列对的一个或每个成员可以包括寡核苷酸,其包含本发明提供的序列的至少约10至50或更多个连续碱基。 [0077] 在一个实施方式中,增强水解酶多肽耐热性或热稳定性的方法包括糖基化水解酶
多肽,其中该多肽包括本发明给出多肽的至少30个连续氨基酸;或由本发明提供的核酸序
列编码的多肽,从而增强水解酶多肽的耐热性或热稳定性。一方面,水解酶比活性在高于约
37℃至约95℃的温度范围内可以是热稳定或耐热的。
[0078] 在一个实施方式中,用于在细胞中过量表达重组水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)多肽的方法包括表达包含本发明提供的核酸或本发明提供的核酸序列的载体,其中序列同一性采用序列比对算法进行分析或通过目视检查来确定,其中
过量表达通过使用高活性启动子、双顺反子载体或载体的基因扩增来实现。
[0079] 在一个实施方式中,去污剂组合物包含本发明提供的多肽或由本发明提供的核酸编码的多肽,其具有水解酶活性,例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性。一方面,水解酶可以是非表面活性水解酶。另一方面,水解酶可以是表面活性水解酶。
[0080] 在一个实施方式中,用于洗涤靶标的方法包括以下步骤:(a)提供包括具有水解酶活性(例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性)的多肽的组合物,其中该多
肽包括本发明提供的多肽或由本发明提供的核酸编码的多肽;(b)提供靶标;和(c)在组合
物能够洗涤靶标的条件下将步骤(a)的多肽和步骤(b)的靶标接触。
[0081] 在一个实施方式中,转基因植物的制备方法包括以下步骤:(a)在植物细胞中引入异源核酸序列,其中异源核酸序列包括本发明提供的核酸序列,从而制备转化的植物细
胞;和(b)从转化细胞制备转基因植物。一方面,步骤(a)可以进一步包括通过向植物细胞
原生质体的电穿孔或微注射引入异源核酸序列。另一方面,步骤(a)可以进一步包括通过
DNA颗粒轰击直接向植物组织引入异源核酸序列。或者,步骤(a)可以进一步包括使用根
瘤农杆菌(Agrobacterium tumefaciens)宿主在植物细胞DNA中引入异源核酸序列。一方
面,植物细胞可以是马铃著、玉米、水稻、小麦、烟草、或大麦细胞。
[0082] 在一个实施方式中,在植物细胞中表达异源核酸序列的方法包括以下步骤:(a)使用与启动子可操作地连接的异源核酸序列转化植物细胞,其中异源核酸序列包含本发明
提供的核酸;(b)在异源核酸序列能够在植物细胞中表达的条件下培育植物。
[0083] 在一个实施方式中,生物催化合成结构化脂质的第一种方法包括以下步骤:(a)提供本发明提供的多肽(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶);(b)提供包含
甘油三酯(TAG)的组合物;(c)将步骤(a)的多肽与步骤(b)的组合物在该多肽水解甘油
三酯(TAG)Sn2位点的酰基残基的条件下接触,从而生成1,3-甘油二酯(DAG);(d)提供R1
酯;(e)提供R1特异性水解酶,和(f)在R1特异性水解酶催化Sn2位点酯化的条件下将
步骤(c)的1,3-DAG与步骤(d)的R1酯和步骤(e)的R1特异性水解酶接触,从而生成结
构化脂质。本发明提供的水解酶可以是Sn2-特异性脂肪酶。结构化脂质可包括代可可脂
(CBA)、合成可可脂、天然可可脂、1,3-二棕榈酰-2-油酰甘油(POP)、1,3-二硬脂酰-2-油酰甘油(SOS)、1-棕榈酰-2-油酰-3-硬脂酰甘油(POS)或1-油酰-2,3-二肉豆蔻酰甘油
(OMM)。
[0084] 在一个实施方式中,第二种生物催化合成结构化脂质的方法包括以下步骤:(a)提供本发明提供的水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶);(b)提供包
含甘油三酯(TAG)的组合物;(c)将步骤(a)的多肽与步骤(b)的组合物在一定条件下接
触,其中该多肽水解甘油三酯(TAG)的Sn1或Sn3位点的酰基残基,从而生成1,2-DAG或2,
3-DAG;和(d)在动学控制条件下促使步骤(c)的1,2-DAG或2,3-DAG的酰基发生转移,
从而生成含有1,3-DAG的组合物。
[0085] 该第二种方法可以进一步包括提供R1酯和R1特异性脂肪酶,且在R1特异性脂肪酶催化Sn2位点酯化的条件下将步骤(d)的1,3-DAG与R1酯和R1特异性脂肪酶接触,从而
生成结构化脂质。本发明提供的水解酶(例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)
可以是Sn1或Sn3-特异性酶。结构化脂质可以包括任何植物油,例如,大豆油、菜籽油、代可可脂(CBA)、合成可可脂、天然可可脂、1,3-二棕榈酰-2-油酰甘油(POP)、1,3-二硬脂酰-2-油酰甘油(SOS)、1-棕榈酰-2-油酰-3-硬脂酰甘油(POS)或1-油酰-2,3-二肉豆
蔻酰甘油(OMM)。
[0086] R1酯可以含有比水解的酰基残基饱和度更低的部分,在该情况下这样生成的结构化脂质是比原始TAG更低饱和的脂肪或油。R1酯可以包括一种或更多的ω-3脂肪酸、
ω-6脂肪酸、单-不饱和脂肪酸、多-不饱和脂肪酸、磷酸基团、植物甾醇酯、以及谷维素。
更具体地,R1酯可以包括选自α-亚麻酸、二十五烯酸、二十二碳六烯酸、γ-亚麻酸、二高-γ-亚麻酸、花生四烯酸、油酸、棕榈油酸、胆碱、丝氨酸、β-谷甾醇、香豆雌酚、二乙基己烯雌酚、以及谷维素的部分。
[0087] 在该第二种方法的一个方面,步骤(d)进一步包括使用离子交换树脂。动力学控制条件可以包括非平衡条件以生成具有大于2∶1的1,3-DAG∶2,3-DAG比率的终产物。
步骤(b)的组合物可以包括荧光脂肪酸(FA)。步骤(b)的组合物可以包括伞形FA酯。
终产物可以是对映体纯的。
[0088] 在一个实施方式中,制备较低饱和度的脂肪或油的方法包括以下步骤:(a)提供本发明提供的多肽(水解酶,例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶);(b)提供油或脂肪;和(c)将步骤(a)的多肽与步骤(b)的油或脂肪在一定条件下接触,其中水解酶能
够修饰油或脂肪,例如,去除至少一个饱和脂肪酸,例如,棕榈酸、硬脂酸、月桂酸、辛酸等。
修饰可以包括水解酶催化水解脂肪或油。水解可以是脂肪或油的完全或部分水解。水解的
油可以包括多不饱和脂肪酸甘油酯,其可以替代去除的饱和脂肪酸,或鱼油、动物油、或植物油。植物油可以包括橄榄油、菜籽油、葵花籽油、棕榈油、大豆油或月桂酸油、或米糠油,或其组合。
[0089] 在一个实施方式中,制备可以较低饱和度脂肪或油(其可包含必需脂肪酸)的方法包括以下步骤:(a)提供本发明提供的多肽(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶);(b)提供含有甘油三酯(TAG)的组合物;(c)将步骤(a)的多肽与步骤(b)的组合
物在一定条件下接触,其中该多肽水解甘油三酯(TAG)的Sn1或Sn3位点的酰基残基,从而
生成1,2-DAG或2,3-DAG;和(d)在动力学控制条件下促进步骤(c)的1,2-DAG或2,3-DAG
的酰基发生转移,从而生成1,3-DAG。
[0090] 该方法可以进一步包括提供R1酯和R1-特异性脂肪酶,且在R1-特异性脂肪酶催化Sn2位点酯化的条件下将步骤(d)的1,3-DAG与R1酯和R1-特异性脂肪酶接触,从而生
成结构化脂质。R1酯可以含有比水解的酰基残基饱和 度更低的部分,在该情况下这样生成的结构化脂质是比原始TAG更低饱和的脂肪或油。R1酯可以包括ω-3脂肪酸(α-亚麻酸、
二十碳五烯酸(EPA)、二十二碳六烯酸(DHA))、ω-6脂肪酸(γ-亚麻酸、二高-γ-亚麻酸
(DGLA)、或花生四烯酸)、单-不饱和脂肪酸(油酸、棕榈油酸等)、磷酸基团(胆碱和丝氨
酸)、植物甾醇酯(β-谷甾醇、香豆雌酚、和二乙基己烯雌酚)、和谷维素。本发明提供的水解酶(例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)可以是Sn1或Sn3-特异性酶。较
低饱和度的脂肪或油可以通过上述方法对任何的藻类油、植物油、或动物脂肪或油进行水
解来制备,例如,Neochloris oleoabundans藻油、二形栅藻(Scenedesmus dimorphus)油、眼虫藻(Euglena gracilis)油、三褐指藻(Phaeodactylum tricornmutum)油、颗石藻
(Pleurochrysis carterae)油、小定鞭金藻(Prymnesium parvum)油、扁藻(Tetraselmis
chui)油、四爿藻(Tetraselmis suecica)油、绿光等鞭金藻(Isochrysis galbana)油、
微拟球藻(Nannochloropsis salina)油、丛粒藻(Botryococcus braunii)油、杜氏藻
(Dunaliella tertiolecta)油、微球藻(Nannochloris)油、螺旋藻(Spirulina)油、绿藻
(Chlorophycease)油、以及藻(Bacilliarophy)油、菜籽油、蓖麻油、椰子油、香菜油、玉米油、棉籽油、榛子油、大麻籽油、亚麻籽油、池花籽油、橄榄油、棕榈油、棕榈仁油、花生油、菜籽油、米糠油、红花油、油茶油、大豆油、葵花籽油、妥尔油、山茶油、经过遗传修饰的微生物(GMO)或传统“育种”而具有改变的脂肪酸组合物的各种“天然”油,例如高油酸、低亚麻酸、或低饱和油(高油酸菜籽油、低亚麻酸大豆油或高硬脂酸葵花油);动物脂肪(牛油、猪油、乳脂、以及鸡脂肪),鱼油(烛鱼油、鱼肝油、金狮油、沙丁鱼油、鲱鱼油、以及油鲱鱼油),或上述任何油的共混物。如此制备的较低饱和度的脂肪或油可被用于食品或包含具有低脂
肪酸含量的 油或脂肪的烘焙、煎炸或烹饪产品,采用本发明提供的组合物或方法进行加工的包括低含量的棕榈酸、油酸、月桂酸、硬脂酸、辛酸等的油。
[0091] 在一个实施方式中,精炼润滑油的方法包括以下步骤:(a)提供含有本发明提供的水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)的组合物;(b)提供润滑油;
和(c)用水解酶在一定条件下处理润滑油,其中本发明提供的水解酶(例如,脂肪酶、饱和
酶、棕榈酸酶和/或硬脂酸酶)能够选择性水解润滑油中的油,从而对其进行精炼。润滑油
可以是液压油。
[0092] 在一个实施方式中,处理织物的方法包括以下步骤:(a)提供包含本发明提供的水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)的组合物,其中水解酶能够选择性水解羧酸酯;(b)提供织物;和(c)用水解酶在一定条件下处理织物,其中水解酶能够选
择性水解羧酸酯从而处理织物。织物处理可以包括改进最终织物的手感和下垂度、染色、获得耐燃性、获得防水性、获得光亮度、或获得树脂涂饰。织物可以包括棉、纤维胶、人造丝、天丝纤维、麻布、亚麻、苎麻、其全部共混物,或其与聚酯、羊毛、聚酰胺或聚丙烯酸等的共混物。在一个实施方式中,含有本发明提供的水解酶的织物、纱线或纤维可以被吸附、吸收或固定在织物、纱线或纤维表面。
[0093] 在一个实施方式中,去除食品或油渍或降低其含量的方法包括用本发明提供的水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)在一定条件下接触食品或油渍,其中水解酶能够水解油渍中的油或脂肪。本发明提供的水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)可以具有对表面活性剂的变性和热变性失活具有增强的稳定性。本
发明提供的水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)可以具有去污剂或
洗衣溶液。
[0094] 在一个实施方式中,食品组合物包括本发明提供的水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)。食品组合物可以进一步包括营养基,其包含脂肪。水解酶
可以被胆盐活化。食品组合物可以进一步包括基于牛奶的婴儿配方。水解酶能够水解长链
脂肪酸。
[0095] 在一个实施方式中,降低基于乳品或蔬菜的食品组合物中的脂肪含量的方法包括以下步骤:(a)提供包含本发明提供的水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)的组合物;(b)提供包含乳品或植物油的组合物,和(c)用水解酶在一定条件下处理
步骤(b)的组合物,其中水解酶能够水解组合物中的油或脂肪。在一个实施方式中,用于
人或非反刍动物的食品组合物包括营养基,其中营养基包括脂肪且不包括或很少包括水解
酶;以及有效量的本发明提供的水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)以增加脂肪吸收和人或非反刍动物的生长。
[0096] 在一个实施方式中,催化酯交换反应生成新型甘油三酯的方法包括以下步骤:(a)提供包含本发明提供的多肽(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)的组合物,其中该多肽能够催化酯交换反应;(b)提供甘油三酯和游离脂肪酸的混合物;(c)用多肽在一定条件下处理步骤(b)的混合物,其中该多肽能够催化甘油三酯的酰基与游离脂肪酸进
行交换,从而生成新型甘油三酯,其中富含添加的脂肪酸。多肽可以是Sn1,3-特异性脂肪酶。
[0097] 在一个实施方式中,用于制备具有低含量反式酸和低含量中链脂肪酸的酯交换方法包括以下步骤:(a)提供酯交换反应混合物,其包含选自硬脂酸、低分子量一元醇的硬脂酸单酯及其混合物的硬脂酸来源的材料,(b)提供液体植物油;(c)提供本发明提供的多肽
(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶),其中该多肽具有1,3-特异性脂肪酶活性;(d)对硬脂酸来源的材 料和植物油甘油三酯进行酯交换,(e)从酯交换混合物的甘油
酯组分中分离酯交换的游离脂肪酸组分,以提供酯交换的人造黄油产品和含有从植物油中
释放的脂肪酸、脂肪酸单酯或其混合物的脂肪酸混合物,和(f)氢化该脂肪酸混合物。在酯交换方法的一个实施方式中,酯交换反应持续至反应混合物中甘油酯组分1-,3-位点的酯
基团与非甘油酯脂肪酸组分基本达到平衡为止。
[0098] 在一个实施方式中,制备含有1-棕榈酰-3-硬脂酰-2-油酸单甘油酯(POSt)和1,3-二硬脂酰-2-油酸单甘油酯(StOSt)组合物的方法包括提供本发明提供的多肽(例
如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶),其中该多肽能够使1,3-二棕榈酰-2-油酸单甘油酯(POP)和硬脂酸或三硬脂酸甘油酯实现1,3-特异性脂肪酶催化的酯交换,并将所
述多肽与包含所述POP的组合物在例如硬脂酸或三硬脂酸甘油酯等的硬脂酸甘油酯来源
的存在下进行接触,以制备富含1-棕榈酰-3-硬脂酰-2-油酸单甘油酯(POSt)或1,3-二
硬脂酰-2-油酸单甘油酯(StOSt)的产物。
[0099] 在一个实施方式中,改善或预防脂多糖(LPS)介导的毒性的方法包括对患者施用含有本发明提供的水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)的药物组合
物。在一个实施方式中,内毒素解毒的方法包括将内毒素与本发明提供的水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)进行接触。在一个实施方式中,从脂质A将2’或
3’脂肪酸侧链去酰基化的方法包括将脂质A与本发明提供的多肽接触。
[0100] 在一个实施方式中,改变具有对应于SEQ ID NO:2中的氨基酸序列的氨基酸序列的亲代脂肪酶(脂肪酸水解酶)的底物特异性或底物偏好性的方法包括以下步骤:在SEQ
ID NO:2中产生(插入)至少1、2、3、4、5、6、7、8、9、10、11或12或更多的氨基酸残基突变,如表3、表4、表9、表10、表 11、表16或表23所示,从而产生新型水解酶,其相对于亲代脂肪酶(脂肪酸水解酶)SEQ ID NO:2具有修饰的氨基酸序列和改变的底物特异性或底物偏
好性。一方面,新型脂肪酶(脂肪酸水解酶)的底物特异性或底物偏好性包括从油中优先
或增加棕榈酸的水解,或者,新型脂肪酶(脂肪酸水解酶)的底物特异性或底物偏好性包括
从油中优先或增加硬脂酸的水解。
[0101] 一方面,修饰的氨基酸序列(相对于“亲代”SEQ ID NO:2)包括至少一个氨基酸 修 饰:A48C;D49R;D61A;D61E;R72E;R72K;V83M;R85Y;E95K;E116A;E116I;E116L;
E116N;E116Q;E116R;E116T;E116V;S133A;A144I;E149H;A150I;I151G;I151A;P162G;
P162K;V163R;D164R;R172H;R172L;或A225S,或其等价物,或其组合,和/或至少一个密码子修饰:(GCG)35(GCT);(GGC)45(GGA);(GCG)92(GCT),(GTG)102(GTT);(AGC)108(AGT);
(CTG)117(CTT);(CTG)124(TTG);(CGG)126(AGG);(GTC)128(GTG);(AGT)133(TCT);
(TTC)135(TTT);(GTG)183(GTT);(ACC)188(ACG),或其等价物,或其组合,且新型脂肪酶(脂肪酸水解酶)的底物特异性或底物偏好性包括从油中优先或增加棕榈酸的水解。一方
面,修饰的氨基酸序列(相对于“亲代”SEQ ID NO:2)包括I20L;V62S;G77P;V83C;D88H;
Y113G;E116T;E116G;H140K;K146S;I167S;L180E;E194M;A211Q;S212Y;G215C;G215V;
G215W;A218H;A218S;V223A;A225M;A225Q,或其组合,且新型脂肪酶(脂肪酸水解酶)的底物特异性或底物偏好性包括从油中优先或增加硬脂酸的水解。
[0102] 在一个实施方式中,制备具有底物特异性或底物偏好性(包括从油中优先或增加棕榈酸的水解)的酶的方法包括以下步骤:(a)提供具有从油中优先水 解棕榈酸的底物特
异性或底物偏好性的亲代水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶),其中亲代水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)具有本发明提供的序列;和(b)在亲代水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)上制造至少1、2、3、
4、5、6、7、8、9、10、11或12或更多氨基酸残基修饰,其中氨基酸残基修饰对应于SEQ ID NO:
2的氨基酸序列突变,如表3、表4、表9、表10、表11、表16或表23所示,从而产生具有从油中优先或增加棕榈酸的水解的底物特异性或底物偏好性的酶。
[0103] 在一个实施方式中,制备具有底物特异性或底物偏好性(包括从油中优先或增加硬脂酸的水解)的酶的方法包括以下步骤:(a)提供具有从油中优先水解硬脂酸的底物特
异性或底物偏好性的亲代水解酶(例如,脂肪酶、饱和酶、硬脂酸酶和/或硬脂酸酶),其中亲代水解酶(例如,脂肪酶、饱和酶、硬脂酸酶和/或硬脂酸酶)具有本发明提供的序列;和(b)在亲代水解酶(例如,脂肪酶、饱和酶、硬脂酸酶和/或硬脂酸酶)上制造至少1、2、3、
4、5、6、7、8、9、10、11或12或更多氨基酸残基修饰,其中氨基酸残基修饰对应于SEQ ID NO:
2的氨基酸序列突变,如表3、表4、表9、表10、表11、表16或表23所示,从而产生具有从油中优先或增加硬脂酸的水解的底物特异性或底物偏好性的酶。
[0104] 在一个实施方式中,制备具有底物特异性或底物偏好性(包括优先水解特定脂肪酸)的脂肪酸水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)的方法包括以下
步骤:(a)提供本发明提供的脂肪酸水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)序列;(b)在核酸中产生(插入)至少1、2、3、4、5、6、7、8、9、10、11或12或更多碱基突变,其中突变对应于如表 3、表4、表9、表10、表11、表16或表23所示的序列的改变;以及(c)检测新生成的酶的底物特异性或底物偏好性(包括优先水解特定脂肪酸)的活性,从而
制备具有底物特异性或底物偏好性(包括优先水解特定脂肪酸)的新型脂肪酸水解酶(例
如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)。一方面,脂肪酸水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)包括如SEQ ID NO:2所示的序列。一方面,脂肪酸是亚麻
酸、亚油酸、油酸、棕榈酸或硬脂酸。
[0105] 在一个实施方式中,制备具有底物特异性或底物偏好性(包括优先水解特定脂肪酸)的脂肪酸水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)的方法包括以下
步骤:(a)提供本发明提供的脂肪酸水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)的编码核酸序列;(b)在核酸中产生(插入)至少1、2、3、4、5、6、7、8、9、10、11或12或更多碱基突变,其中该突变对应于如表3、表4、表9、表10、表11、表16或表23所示的序列的改变;以及(c)表达得到的核酸以制备新型脂肪酸水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶),从而制备具有底物特异性或底物偏好性(包括优先水解特殊脂肪酸)
的脂肪酸水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)。
[0106] 一方面,脂肪酸水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)的编码序列包含如SEQ ID NO:1所示的序列。一方面,脂肪酸是亚麻酸、亚油酸、油酸、棕榈酸或硬脂酸。一方面,相对于亲代脂肪酸水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)的对硬脂酸的底物特异性或底物偏好性,新型脂肪酸水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)的底物特异性或底物偏好性是棕榈酸,或相对于亲代脂肪酸水解酶 (例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)对棕榈酸的底物特异性或底物偏好
性,新型脂肪酸水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)的底物特异性或底物偏好性是硬脂酸。
[0107] 在一个实施方式中,脂肪酶包含如SEQ ID NO:2所示的氨基酸序列,并且包含至少以下氨基酸残基修饰:A48C;D49R;D61A;D61E;R72E;R72K;V83M;R85Y;E95K;E116A;
E116I;E116L;E116N;E116Q;E116R;E116T;E116V;S133A;A144I;E149H;A150I;I151G;
I151A;P162G;P162K;V163R;D164R;R172H;R172L;或A225S,或其等价物,或其组合,和/或至少一个密码子修饰:(GCG)35(GCT);(GGC)45(GGA);(GCG)92(GCT),(GTG)102(GTT);
(AGC)108(AGT);(CTG)117(CTT);(CTG)124(TTG);(CGG)126(AGG);(GTC)128(GTG);
(AGT)133(TCT);(TTC)135(TTT);(GTG)183(GTT);(ACC)188(ACG),或其等价物,或其组合。 [0108] 一方面,相对于“亲代”SEQ ID NO:2,新型脂肪酶的底物特异性或底物偏好性包括从油中优先或增加水解脂肪酸。一方面,脂肪酸是亚麻酸、亚油酸、油酸、棕榈酸或硬脂酸。 [0109] 本发明提供的一个或更多实施方式的细节如下述附图说明书所示。本发明提供
的其它特征、靶标和优点可以从说明书和附图以及权利要求中明显得出。
[0110] 本发明引用的全部出版物、专利、专利申请、GenBank序列和ATCC保藏本发明出于各种目的而全文引入作为参考。
[0111] 附图简述
[0112] 以下附图是对本发明提供的实施方式的示例,其并不意味着对权利要求的范围进行限制。
[0113] 本专利或申请文件包含至少一个彩图。带有彩色附图的本专利或专利申请的出版物副本将根据请求和缴纳必需费用后由官方提供。
[0114] 图1是计算机系统的框图
[0115] 图2是流程图,其说明了将新型核苷酸或蛋白序列与序列数据库进行比对以确定新序列和数据库中序列之间的同源水平的流程的一个方面。
[0116] 图3是流程图,其说明了计算机确定两个序列是否同源的流程的一个方面。
[0117] 图4是流程图,其说明了用于检测序列中存在的特征的识别程序300的一个方面。 [0118] 图5显示了本发明提供的示例性的方法,包括使用本发明提供的脂肪酶加工脂质(例如大豆油脂质),以选择性水解棕榈酸生成“降低棕榈酸的大豆油”。
[0119] 图6a显示了与亲代SEQ ID NO:2相比,示例性的棕榈酸酶GSSMSM突变对棕榈酸和硬脂酸水解的影响,如以下实施例4中详述。图6b显示了与亲代SEQ ID NO:2相比,示
SM
例性的硬脂酸酶GSSM 突变对棕榈酸和硬脂酸水解的影响,如以下实施例4中详述。
[0120] 图7显示了SEQ ID NO:2,并用粗体大字号显示了具体的棕榈酸和硬脂酸突变位点。加下划线的突变(例如,61A,E)是改进棕榈酸水解的可选的氨基酸残基位点(可选实
施方式中的可选序列)。斜体表示的突变(例如, )是改进硬脂酸水解的可选的氨基
酸残基位点(可选实施方式中的可选序列)。位 点116是同时改进棕榈酸和硬脂酸水解的
可选的氨基酸残基突变位点(可选实施方式的可选序列)。
[0121] 图8显示了从棕榈酸酶文库选定克隆的确认性大豆油的分析数据。
[0122] 在不同附图中的相似参考符表示相似元素。
[0123] 发明详述
[0124] 可选的实施方式包括多肽,其包括脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶;编码它们的多核苷酸;以及制备和使用这些多核苷酸和多肽的方法。可选的实施方式包括多肽,例如酶,其具有水解酶活性,例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性,其包括热稳定和耐热的水解酶活性;以及编码这些酶的多核苷酸;以及制备和使用这些多核苷
酸和多肽的方法。本发明提供的多肽和肽的水解酶活性包括脂肪酶活性(脂质水解)、酯交
换反应、酯合成、酯交换反应、脂质酰基水解酶(LAH)活性和相关的酶活性。为了本专利申请的目的,酯交换反应可以包括酸水解反应(涉及脂肪酸和甘油三酯的反应)、醇解(涉及
醇和甘油三酯的反应)、甘油解(涉及甘油和甘油三酯的反应)以及转酯化反应(涉及酯和
甘油三酯的反应)。本发明提供的多肽可被用于多种医药、农业和工业用途,包括生产化妆品和保健食品。另一方面,本发明提供的多肽被用于合成对映体纯手性产品。
[0125] 在一些实施方式中,本发明提供的酶可以是高选择性催化剂。其可以具有常规合成化学中不可能发生的立体、区域和化学选择性催化反应的能力。在一个实施方式中,本发明提供的酶可以是多方面的。在多个方面,其可以在有机溶剂中作用,在极端pH(例如,高pH和低pH)、极端温度(例如,高 温度和低温度)、极端盐度(例如,高盐度和低盐度)下工
作,并催化与其天然的、生理的底物在结构上不相关的化合物发生反应。
[0126] 一方面,本发明提供的多肽包括具有脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性的水解酶,且可以被用于例如生物催化合成结构化脂质(在甘油骨架上按照确定的分布方式含有一组确定的脂质),包括任何植物油,例如,菜籽油、大豆油、代大豆油、代可可脂,
1,3-甘油二酯(DAG)、2-甘油单酯(MAG)和甘油三酯(TAG),例如1,3-二棕榈酰-2-油酰甘
油(POP)、1,3-二硬脂酰-2-油酰甘油(StOSt)、1-棕榈酰-2-油酰-3-硬脂酰甘油(POSt)
或1-油酰-2,3-二肉豆蔻酰甘油(OMM)、多-不饱和脂肪酸(PUFA),长链多不饱和脂肪酸
例如花生四烯酸、二十二碳六烯酸(DHA)和二十碳五烯酸(EPA)。
[0127] 在某个实施方式中,本发明提供的酶和方法可以被用于从组合物中去除、添加或交换任何脂肪酸,例如制备具有更低的饱和脂肪酸含量的油(例如,“低饱和度”油)或具
有不同脂肪酸的含量的油(例如,将包含“饱和”脂肪酸的油转化为包含替代性的“不饱和”脂肪酸的油)。
[0128] 可以使用酶或者通过采用本发明提供的方法在脂质上去除、添加或“重排”的饱和脂肪酸的示例包括:
[0129] 乙酸:CH3COOH
[0130] 丁酸:CH3(CH2)2COOH
[0131] 己酸:CH3(CH2)4COOH
[0132] 辛酸:CH3(CH2)6COOH
[0133] 癸酸:CH3(CH2)8COOH
[0134] 十一酸:CH3(CH2)9COOH
[0135] 月桂酸:(十二酸):CH3(CH2)10COOH
[0136] 肉豆蔻酸:(十四酸):CH3(CH2)12COOH
[0137] 十五烷酸:CH3(CH2)13COOH
[0138] 棕榈酸:(十六酸):CH3(CH2)14COOH
[0139] 十七烷酸:CH3(CH2)15COOH
[0140] 硬脂酸(十八酸):CH3(CH2)16COOH
[0141] 花生酸(二十酸):CH3(CH2)18COOH
[0142] 二十二酸:CH3(CH2)20COOH
[0143] 可以使用酶或者通过采用本发明提供的方法在脂质上去除、添加或“重排”的ω-3不饱和脂肪酸的示例包括:
[0144] α-亚麻酸(ALA):CH3CH2CH=CHCH2CH=CHCH2CH=CH(CH2)7COOH
[0145] 硬脂四烯酸(十八碳四烯酸):
[0146] CH3CH2CH=CHCH2CH=CHCH2CH=CHCH2CH=CH(CH2)4COOH
[0147] 二十碳五烯酸(EPA):
[0148] CH3CH2CH=CHCH2CH=CHCH2CH=CHCH2CH=CHCH2CH=CH(CH2)3COOH
[0149] 二十二碳六烯酸(DHA):
[0150] CH3CH2CH=CHCH2CH=CHCH2CH=CHCH2CH=CHCH2CH=CHCH2CH=CH(CH2)2COOH
[0151] 可以使用酶或者通过采用本发明提供的方法在脂质上去除、添加或“重排”的ω-6不饱和脂肪酸的示例包括:
[0152] 亚油酸(9,12-十八碳二烯酸):CH3(CH2)4CH=CHCH2CH=CH(CH2)7COOH
[0153] γ-亚麻酸(6,9,12-十八碳三烯酸):
[0154] CH3(CH2)4CH=CHCH2CH=CHCH2CH=CH(CH2)4COOH
[0155] 二十碳二烯酸(11,14-二十碳二烯酸):
[0156] CH3(CH2)4CH=CHCH2CH=CH(CH2)9COOH
[0157] 二高-γ-亚麻酸(8,11,14-二十碳三烯酸):
[0158] CH3(CH2)4CH=CHCH2CH=CHCH2CH=CH(CH2)6COOH
[0159] 花生四烯酸(5,8,11,14-二十碳四烯酸):
[0160] CH3(CH2)4CH=CHCH2CH=CHCH2CH=CHCH2CH=CH(CH2)3COOH
[0161] 二十二碳二烯酸(13,16-二十二碳二烯酸):
[0162] CH3(CH2)4CH=CHCH2CH=CH(CH2)11COOH
[0163] 肾上腺酸(7,10,13,16-二十二碳四烯酸):
[0164] CH3(CH2)4CH=CHCH2CH=CHCH2CH=CHCH2CH=CH(CH2)5COOH
[0165] 二十二碳五烯酸(4,7,10,13,16-二十二碳五烯酸):
[0166] CH3(CH2)4CH=CHCH2CH=CHCH2CH=CHCH2CH=CHCH2CH=CH(CH2)2COOH
[0167] 同样可以使用酶或者通过采用本发明提供的方法在脂质(例如油上)去除、添加或“重排”的ω-9脂肪酸的示例包括:
[0168] 油酸(9-十八碳烯酸):CH3(CH2)7CH=CH(CH2)7COOH
[0169] 二十碳烯酸(11-二十碳烯酸)CH3(CH2)7CH=CH(CH2)9COOH
[0170] 蜂蜜酸(5,8,11-二十碳三烯酸):
[0171] CH3(CH2)7CH=CHCH2CH=CHCH2CH=CH(CH2)3COOH
[0172] Euric酸(13-二十二碳烯酸):CH3(CH2)7CH=CH(CH2)11COOH
[0173] 神经酸(15-二十四碳烯酸):CH3(CH2)7CH=CH(CH2)13COOH
[0174] 棕榈油酸:CH3(CH2)7CH=CH(CH2)5COOH
[0175] 一方面,本发明提供了新类型的脂肪酶命名为“饱和酶”,例如,“棕榈酸酶”和“硬脂酸酶”。之前的文献中使用的术语“饱和酶”描述了在代谢途径中对特定的键进行饱和的酶,例如,对双键进行加氢(Moise等人,J Biol Chem,2005,280(30):27815-27825)。然而,本发明提供了新的、之前没有 描述过的“饱和酶”,其中本发明描述的饱和酶能水解饱和的脂肪酸酯,其中水解的酯可以是饱和脂肪酸与甘油、伞形醇或其它醇形成的酯。
[0176] 本发明还提供了之前没有描述的“棕榈酸酶”和“硬脂酸酶”,其中棕榈酸酶和硬脂酸酶分别从例如甘油骨架上水解棕榈酸和硬脂酸。本发明描述的“饱和酶”还可以命名为“饱和水解酶”。类似地,本发明描述的“棕榈酸酶”还可以命名为“棕榈酸水解酶”以及本发明描述的“硬脂酸酶”还可以命名为“硬脂酸水解酶”。
[0177] 另一方面,本发明描述的饱和酶选择性水解至少60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、
80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、
95%、96%、97%、98%、99%或100%的饱和脂肪酸。另一方面,本发明描述的棕榈酸酶选择性水解脂肪酸,从而至少60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、
71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、
86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的被水解的脂肪酸是棕榈酸。另一方面,本发明描述的硬脂酸酶选择性水解脂肪酸,从而至少60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、
75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、
90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的被水解的脂肪酸是硬脂酸。
[0178] 一方面,如图5所示,本发明提供的酶的方法可以用于加工脂质,例如,来自大豆或其它植物油的脂质,以(例如,从含有这些饱和脂肪酸的油中)选择性水解饱和脂肪酸,例如,棕榈酸或硬脂酸,以生成“低(或更低)饱和度油”,例如,“棕榈酸减少的油”,例如“棕榈酸减少的植物油”,例如“棕榈酸减少的大豆油”。本发明提供的酶还可以用于从甘油骨架上选择性水解任何脂肪酸,特别是饱和脂肪酸,以生成“低(或更低)饱和度油”,包括从甘油骨架的Sn1或Sn2位点处选择性水解饱和脂肪酸,例如,棕榈酸或硬脂酸,以及从Sn3位
点处进行水解(例如,从图5所示的Sn3位点处水解棕榈酸)。
[0179] 一方面,提供了低饱和度甘油三酯、油或脂肪的示例性合成。取决于所用的酶,该示例性的合成可以使用游离脂肪酸或脂肪酸酯。一方面,本发明提供的水解酶(例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)被用于从甘油三酯、油或脂肪中去除或水解饱和脂
肪酸,例如乙酸、丁酸、己酸、辛酸、癸酸、十一酸、月桂酸、肉豆蔻酸、十五烷酸、棕榈酸、十七烷酸、硬脂酸、花生酸、或二十二酸。一方面,去除或水解的脂肪酸被替换为具有改进的健康益处(例如降低的心血管疾病相关性)、或改进的化学性质(例如化稳定性或反应活性)
或改进的物理性质(例如熔点,或口感)的脂肪酸。一方面,添加的脂肪酸是ω-3不饱和
脂肪酸,例如α-亚麻酸、十八碳四烯酸、二十碳五烯酸(EPA)、或二十二碳六烯酸(DHA)、或PUFA或鱼油脂肪酸。一方面,添加的脂肪酸是ω-6不饱和脂肪酸,例如亚油酸、γ-亚
油酸、二十碳二烯酸、二高-γ-亚油酸、花生四烯酸、二十二碳二烯酸、肾上腺酸、或二十二碳五烯酸。一方面,添加的脂肪酸是ω-9不饱和脂肪酸,例如油酸、二十碳烯酸、蜂蜜酸、芥酸、神经酸、或棕榈油酸。一方面,在通过本发明提供的水解酶(例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)去除或水解饱和脂肪 酸之后,添加的脂肪酸(例如,ω-3、ω-6、或
ω-9)通过脂肪酸与甘油三酯、油或脂肪的反应进行添加。一方面,通过本发明提供的水解酶(例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)来去除或水解饱和脂肪酸之后,添加
的脂肪酸(例如,ω-3、ω-6、或ω-9)通过脂肪酸酯(包括甘油酯或乙基或甲基酯)与甘
油三酯、油或脂肪的反应进行添加。一方面,添加脂肪酸(例如,ω-3、ω-6、或ω-9)的反应由水解酶或脂肪酶催化,例如非特异性脂肪酶(包括非区域特异性和非脂肪酸特异性)、
或Sn1,3-特异性脂肪酶、或Sn1-特异性脂肪酶、或Sn3特异性脂肪酶、或Sn2特异性脂肪
酶、或脂肪酸-特异性脂肪酶。
[0180] 本发明提供的方法和组合物(水解酶,例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)可被用于生产保健食品(例如,多不饱和脂肪酸和油)、不同的食品和食品添加剂
(例如,乳化剂、脂肪替代物、人造黄油和糊状食品)、化妆品(例如,乳剂、霜剂)、药物和药物递送试剂(例如,脂质体、片剂、制剂)、以及动物饲料添加剂(例如,多不饱和脂肪酸,例如亚油酸)。
[0181] 一方面,本发明提供的脂肪酶可以作用于荧光脂肪酸(FA)酯,例如,伞形酮FA酯。一方面,通过本发明提供的方法制备或修饰的脂肪酶FA特异性可以通过测量其对于一系
列的伞形酮FA酯(例如棕榈酸酯、硬脂酸酯、油酸酯、月桂酸酯、PUFA酯、或丁酸酯)的相
对活性来获得。
[0182] 一方面,用于这些反应的本发明提供的多肽(例如,抗体或酶-例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)是固定的,例如如下所述。在可选的方面,本发明提供的方法不需要有机溶剂,其可以相对较快的反应速率进行。参见,例如,美国专利号5,552,317;
5,834,259。
[0183] 在一些实施方式中,本发明提供的方法和组合物(脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)可以被用于水解(包括选择性水解)油,例如鱼油、动物 油和植物油;以及
脂质,例如多-不饱和脂肪酸。一方面,本发明提供的多肽被用于制备低饱和油,例如,通过从油中去除(水解)至少一种脂肪酸;且水解可以是选择性水解,例如,只去除特定的脂肪
酸,例如棕榈酸、硬脂酸或其它饱和脂肪酸,或只从一个位点去除脂肪酸,例如,Sn1、Sn2或Sn3位点。一方面,本发明提供的多肽被用于加工脂肪酸(例如多-不饱和脂肪酸),例如,
鱼油脂肪酸,例如,用于或作为食品或饲料添加剂,或烹饪、煎炸、烘焙或食用油。在另一个实施方式中,本发明提供的方法和组合物(脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)可
以被用于选择性水解饱和酯而不水解不饱和酯,形成酸或醇。在另一个实施方式中,本发明提供的方法和组合物(脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)可以出于多种目的被用
于处理乳胶,例如,处理用于头发定型的组合物以除去不良气味。在另一个实施方式中,本发明提供的方法和组合物(脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)可被用于处理动物
中的脂肪酶缺陷,例如,哺乳动物,例如人。在另一个实施方式中,本发明提供的方法和组合物(脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)可以被用于制备润滑油,例如液压油。在
另一个实施方式中,本发明提供的方法和组合物(脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸
酶)可被用于制备和使用去污剂。在另一个实施方式中,本发明提供的方法和组合物(脂
肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)可被用在对织物、纤维或纱线的化学表面修饰的
工艺中。一方面,本发明提供的方法和组合物(脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)可以被用于在织物中获得阻燃性,其中使用例如卤代羧酸或其酯,即氟化、氯化、或溴化的羧酸或其酯。一方面,提供了从环境文库中产生脂肪酶的方法。
[0184] 在一个实施方式中,本发明提供的“水解酶”包括具有任何水解酶活性的多肽(例如,抗体,酶)和肽(例如,“活性位点”),即本发明提供的多肽可以具有任何水解酶活性,包括例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性。在另一个实施方式中,本发明提供的“水解酶”包括具有任何脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性(包括脂合成或脂质水解活性)的全部多肽,即本发明提供的多肽可以具有任何的脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性。在另一个实施方式中,本发明提供的脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶包括具有通过对水解、醇解、酸解、酯化和胺解反应的催化在生物转化脂质中具有活性的酶。一方面,本发明提供的水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)能够水解脂质乳液。一方面,本发明提供的酶能够优先作用于甘油三酯的Sn-1、Sn-2
和/或Sn-3键以从甘油骨架上释放一种或更多脂肪酸。例如,本发明提供的多肽的水解酶、脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性包括合成可可脂、多-不饱和脂肪酸(PUFA)、
1,3-甘油二酯(DAG)、2-甘油单酯(MAG)和甘油三酯(TAG)。在另一个实施方式中,本发明
提供的多肽的脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性还包括通过去除脂肪酸(例如
棕榈酸、油酸、月桂酸或硬脂酸)来生成低饱和油,例如,大豆油或菜籽油。在可选的方面,本发明提供的酶还能够在高温、低温、碱性pH和酸性pH下水解和/或异构化化学键。一
方面,本发明提供的水解酶(例如脂肪酶)是催化水解、醇解、酸解、酯化和胺解反应的饱和酶,其中在形成的或反应的分子中的羧酸或脂肪酸是饱和脂肪酸,例如乙酸、丁酸、月桂酸、肉豆蔻酸、棕榈酸、硬脂酸或花生酸。一方面,本发明提供的水解酶(例如脂肪酶或饱和酶)是催化水解、醇解、酸解、酯化和胺解反应的棕榈酸酶,其中在形成的或反应的分子中的羧酸或脂肪酸是棕 榈酸。一方面,本发明提供的水解酶(例如脂肪酶或饱和酶)是催化水解、醇解、酸解、酯化和胺解反应的硬脂酸酶,其中在形成的或反应的分子中的羧酸或脂肪酸是硬脂酸。
[0185] 在一些实施方式中,本发明提供的酶包含本发明提供的酶的水解酶变体(例如,“脂肪酶变体”、“饱和酶变体”、“棕榈酸酶变体”或“硬脂酸酶变体”);这些酶可以具有来源于“前体”的氨基酸序列。前体可以包括天然存在的水解酶和/或重组水解酶。水解酶变
体的氨基酸序列通过替换、缺失或插入前体氨基酸序列的一个或更多氨基酸而“衍生自”前体水解酶氨基酸序列。该修饰是对编码前体脂肪酶的氨基酸序列的“前体DNA序列”的修
饰,而不是操作前体水解酶自身。对前体DNA序列的此种操作的适当的方法包括本发明公
开的方法,以及本领域技术人员已知的方法。
[0186] 生成和操作核酸
[0187] 一方面,本发明提供了编码多肽(例如,水解酶,例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶,和抗体)的核酸,包括表达框,例如表达载体。另一方面,本发明提供的核酸具有如SEQ ID NO:1所示的序列且具有至少1、2、3、4、5、6、7、8、9、10、11或12或更多或全部碱基残基的改变,如表3、表4、表9、表10、表11、表16或表23所示(或其等价物)。在一个实施方式中,本发明提供的核酸编码具有如SEQ ID NO:2所示序列的多肽,且具有至少
1、2、3、4、5、6、7、8、9、10、11或12或更多或全部氨基酸残基的改变,如表3、表4、表9、表10、表11、表16或表23所示(或其等价物)。
[0188] SEQ ID NO:1
[0189]CGGCTGGTCGCGGCGCGGCTCTAG
[0190] SEQ ID NO:2(由SEQ ID NO:1编码):
[0191] 单字母编码:
[0192] MLKPPPYGRLLRELADIPAIVTAPFRGAAKMGKLADGEPVLVLPGFLADDNATSVLRKTFDVAGFACSGWERGFNLGIRGDLVDRLVDRLRAVSEAAGGQKVIVVGWSLGGLYARELGHKAPELIRMVVTLGSPFAGDLHANHAWK
IYEAINSHTVDNLPIPVDFQIKPPVRTIAVWSPLDGVVAPETSEGSPEQSDERLELAVTHMGFAASKTGAEAVVRLV
AARL-
[0193] 三字母编码:
[0194] Met Leu Lys Pro Pro Pro Tyr Gly Arg Leu Leu Arg Glu Leu Ala Asp
[0195] Ile Pro Ala Ile Val Thr Ala Pro Phe Arg Gly Ala Ala Lys Met Gly
[0196] Lys Leu Ala Asp Gly Glu Pro Val Leu Val Leu Pro Gly Phe Leu Ala
[0197] Asp Asp Asn Ala Thr Ser Val Leu Arg Lys Thr Phe Asp Val Ala Gly
[0198] Phe Ala Cys Ser Gly Trp Glu Arg Gly Phe Asn Leu Gly Ile Arg Gly
[0199] Asp Leu Val Asp Arg Leu Val Asp Arg Leu Arg Ala Val Ser Glu Ala
[0200] Ala Gly Gly Gln Lys Val Ile Val Val Gly Trp Ser Leu Gly Gly Leu
[0201] Tyr Ala Arg Glu Leu Gly His Lys Ala Pro Glu Leu Ile Arg Met Val
[0202] Val Thr Leu Gly Ser Pro Phe Ala Gly Asp Leu His Ala Asn His Ala
[0203] Trp Lys Ile Tyr Glu Ala Ile Asn Ser His Thr Val Asp Asn Leu Pro
[0204] Ile Pro Val Asp Phe Gln Ile Lys Pro Pro Val Arg Thr Ile Ala Val
[0205] Trp Ser Pro Leu Asp Gly Val Val Ala Pro Glu Thr Ser Glu Gly Ser
[0206] Pro Glu Gln Ser Asp Glu Arg Leu Glu Leu Ala Val Thr His Met Gly
[0207] Phe Ala Ala Ser Lys Thr Gly Ala Glu Ala Val Val Arg Leu Val Ala
[0208] Ala Arg Leu
[0209] SEQ ID NO:3:
[0210] ATGGCCGGCCACCAGGGCGCGCGGGGCCCCAAAGACGGTCCGCCGGCGATGGTGATCCCGGGCTTCCTCGCCCACGACAGGCACACGACACGATTGCGCCGGGAACTCGCCGAGGCGGGGTTCAGGGTTCACCCCTGGCGGCAGGG
CTGGAACATGGGAGCGCGTGCCGACACGCTCGAGAAATTGAAGCGGGCAGTGGACCAGTGCGGTCATGACGAGCCGA
TCCTGCTGGTCGGCTGGAGTCTGGGCGGGCTCTACGCGAGGGAGGTCGCGCGCGCCGAGCCGGATCAGGTGCGGGCG
GTGGTCACTCTTGGTTCCCCGGTGTCGGGCGACCGGCGCCGCTACACCAACGTGTGGAAGCTGTACGAATGGGTGGC
GGGTCACCCGGTGGACGACCCGCCGATCCCCGACAAGGAGGAAAAGCCGCCGGTGCCGACCCTGGCTTTGTGGTCGG
CGGATGACGGGATCGTCGGCGCCCCGTCGGCGCGCGGGACTCAGTTATCTCACGACAAGGCGGTCGAGATGCGAACG
AGCCACATGGGCTTTGCCATGTCGGCGAAGAGCGCACGCTTTGTTGTCGCCGAGATCGTGAAGTTCCTGAAGAAAAC
CGAAGGTTCCGAGTCGCACGATTGA
[0211] SEQ ID NO:4(由SEQ ID NO:3编码):
[0212] MAGHQGARGPKDGPPAMVIPGFLAHDRHTTRLRRELAEAGFRVHPWRQGWNMGARADTLEKLKRAVDQCGHDEPILLVGWSLGGLYAREVARAEPDQVRAVVTLGSPVSGDRRRYTNVWKLYEWVAGHPVDDPPIPDKEEKPPVPT
LALWSADDGIVGAPSARGTQLSHDKAVEMRTSHMGFAMSAKSARFVVAEIVKFLKKTEGSESHD
[0213] SEQ ID NO:5:
[0214] GTGAGCGAGAAAGGCGCACCCAAGGGAAGGCAGCGGCTGAAGGAGATCGGCGCGCTTCTGTTCCACGCGCCTCGCAGCTTGGGCCATCTGGGCGCGCGCGGCCCCAAGGACGGTCCTCCGGTGATGGTCATCCCGGGATTCCTCGC
GCACGACTTGCATACGACGCAGTTGCGCCGGGCGCTCGCGAAGGCAGGCTTCCGAGTGCATCCGTGGCGGCAGGGGA
TGAACCTTGGAGCGCGCGCCGATACGCTCGAAATTCTGAAGCGCGCGGTGGATTCCTGCGGCTCGAGCGAGCCGATG
CTGCTCGTCGGCTGGAGCCTGGGCGGTCTCTATGCCCGGGAGATCGCGCGTGCGGAGCCGGACCGGGTGCGGGCGGT
GGTGACGATGGGATCGCCGGTGTGGGGCGACCGCAGGCGCTACACCAACGTGTGGAAGCTGTACGAACGGATTGCCG
GCCATCCGGTCGACAAGCCGCCGATCCCGGACAAGAGCCAGAAGCCGCCGGTGCCGACTCTGGCTTTGTGGTCGCAG
CATGATGGCATCGTCGGCGCGCCCTCGGCGAGAGGGACGAAGAAGACCCGCGACAAGGCGGTCGCCATCGACACGAC
TCACATGGGGTTTGCCATGTCGCCCAAGACGACGCGCGCGGCAGTGCGTGAGATCGTGGGCTTTTTGAATGAAGTCG
AAGGCGGTTCGTCACCCCGGGCGTGA
[0215] SEQ ID NO:6(由SEQ ID NO:5编码):
[0216] MSEKGAPKGRQRLKEIGALLFHAPRSLGHLGARGPKDGPPVMVIPGFLAHDLHTTQLRRALAKAGFRVHPWRQGMNLGARADTLEILKRAVDSCGSSEPMLLVGWSLGGLYAREIARAEPDRVRAVVTMGSPVWGDRRRYTNVWKL
YERIAGHPVDKPPIPDKSQKPPVPTLALWSQHDGIVGAPSARGTKKTRDKAVAIDTTHMGFAMSPKTTRAAVREIVG
FLNEVEGGSSPRA
[0217] SEQ ID NO:7:
[0218] ATGAGGCTGCGCGAGGGGGGCGCGCTCGTATCGCGGGCCTATCGCGCCTTCGGGCGCCTCGGCGAGCGCGGCCCGGCGGACGGGCCGCCGCTGATGGTGATCCCGGGCTTCCTCGCCACCGATCGCACCACTTTGGGGCTGCAGCG
GGCGCTGGCCAAGGGCGGCTACAAGGTGACCGGATGGGGCATGGGCCTCAACAGCGGCGTCACCGAAGACATAGTCG
ACCGCATCGCCGCTCGGGTCGAAAGGTTTGGAGCCGGCCGCAAAGTGATCCTCGTCGGCTGGAGCCTCGGCGGACTC
TACGCGCGCGTGGTCGCGCAGGAGCGGCCGGATCTCGTCGACAAGGTGGTCACGCTCGGCTCGCCCTTTTCGGGCGA
CAGGCGCCGCAACAACAATGTCTGGCGGCTCTACGAGTTCGTC
[0219] GCCGGCCATCCGGTCAACAGCCCGCCGATCGACAAGGACCCCGAGGTGAAGCCGCCGGTGCCGACGCTCGCTATCTGGTCGCGGCGCGACGGCATCGTCTCTCCGGCGGGCGCGCGCGGGCGGGAGGGAGAGCGCGACGCCGAGCT
CGAGCTCGACTGCAGCCACATGGGCTTTGCGGTCAGCGCCAGGGCTTATCCCAAGATCGTGGAGGCGGTGCGGGCGT
TTCCGGAAAACATCCGTTCGCGCTGA
[0220] SEQ ID NO:8(由SEQ ID NO:7编码):
[0221] MRLREGGALVSRAYRAFGRLGERGPADGPPLMVIPGFLATDRTTLGLQRALAKGGYKVTGWGMGLNSGVTEDIVDRIAARVERFGAGRKVILVGWSLGGLYARVVAQERPDLVDKVVTLGSPFSGDRRRNNNVWRLYEFVAGHPVN
SPPIDKDPEVKPPVPTLAIWSRRDGIVSPAGARGREGERDAELELDCSHMGFAVSARAYPKIVEAVRAFPENIRSR
[0222] SEQ ID NO:9:
[0223] ATGAAGCCGCCGCCCGGATGGATGAAGATCCGGGAGGCGGGCTCGCTCCTCGCGCGCTTCTACCGCGCGTTCGGCAAGCTCGAGCCGCGCGGGCCGGCGGACGGGCCGAAGCTGATGGTGATCCCGGGTTTCCTCGCGGGCGAC A
GGACGACGCTCGGGCTGCAGCGAGCGCTGGCCGGCGGCGGCTACCGGGTCGCCGGCTGGGGGCTGGGGGTGAACCGC
GGCGTTTCGGAGGACGTGGTCGACCGGATCGGCCAGCAAGTCGCGCGGTTCGGGGCGGGCGAGAAGGTGATCCTGGT
CGGCTGGAGCCTTGGCGGGCTTTATGCGCGCGTGGTGGCGCAGGAGCGGCCCGACCTCGTCGAGAAGGTGGTGACCT
TGGGCTCGCCGTTTTCGGGCGACCGGCGGCGCAACAACAATGTGTGGCGGCTCTATGAGTGGGTGGCTGGGCATCCG
GTGAACGATCCGCCGATCGACAAGGACCCGGCGAAGAAGCCCCCGGTGCCGACGCTCGCGATCTGGTCGCGGCGTGA
TGGGATCGTGGCGGTCGAAGGCGCGCGGGGGCGGCCGGAGGAGCGGGATGCCGAGCTGGAGATCGATTGCAGCCACA
TGGGGTTTGGGGTCAGCGGCAAGGCGTTTCCCCGAATCGTAGAGGCGGTGAAGGGGTTCTAA
[0224] SEQ ID NO:10(由SEQ ID NO:9编码):
[0225] MKPPPGWMKIREAGSLLARFYRAFGKLEPRGPADGPKLMVIPGFLAGDRTTLGLQRALAGGGYRVAGWGLGVNRGVSEDVVDRIGQQVARFGAGEKVILVGWSLGGLYARVVAQERPDLVEKVVTLGSPFSGDRRRNNNVWRLYEW
VAGHPVNDPPIDKDPAKKPPVPTLAIWSRRDGIVAVEGARGRPEERDAELEIDCSHMGFGVSGKAFPRIVEAVKGF
[0226] SEQ ID NO:11:
[0227] GTGTTGGTGCTGCCGGCGTTCCTCGCCAACGACCTTCCCACTTCGCTTCTCCGCAGGACGCTGAAGGCGAACGGGTTTCGCCCGTTCGGCTGGGCGAACGGTTTCAACTTAGGTGCACGGCCGGACACGCTCCAGCGCCTGAGCGC
ACGGCTCGATGCGGTGGTTCAGGAAGCGGGCAGGCCGGTTGCATTGATCGGCTGGAGCCTTGGCGGGCTTTATGCCC
GAGAGCTGGCGAAACGCAGGTCGGCTGAGGTGTCGGCAGTGATCACGCTCGGCACGCCCTTCTCGGTTGACCTCAGA
CGCAACAACGCCTGGAAGCTGTACGAGCTCATCAACGATCATCCTGTCGATGCCCCTCCCTTGGATGTTCAGGTCGA
CGCGAAGCCACCCGTCCGAACCTTCGCTTTGTGGTCGCGTCGCGACGGGATCGTAGCGCC CGCGAGCGCGCACGGC
ATGGAGGGCGAGTTCGACCAGGCGATCGAGCTGCAGTGCACGCACAACGAGATGGTCAGTGATCCGGAGGCCCTCTC
CACGATCGTTACCTTGCTGCGGGAAAATGTTGGCTCCTGA
[0228] SEQ ID NO:12(由SEQ ID NO:11编码):
[0229] MLVLPAFLANDLPTSLLRRTLKANGFRPFGWANGFNLGARPDTLQRLSARLDAVVQEAGRPVALIGWSLGGLYARELAKRRSAEVSAVITLGTPFSVDLRRNNAWKLYELINDHPVDAPPLDVQVDAKPPVRTFALWSRRDGIVAP
ASAHGMEGEFDQAIELQCTHNEMVSDPEALSTIVTLLRENVGS
[0230] SEQ ID NO:13:
[0231] GTGAATACAGCCGACCTATTGAAGCCACCACCCGCAAGCATGACAGTTCTCGAGGCGAGAGCGCTGCTGGACATATGCAAGATGAGCGCCCCATTGGCGCGCTTGCTATTCAAAAAGAACTCGCCCTGGCGCAAACAACGGGTTCT
CGTAATACCTGGCTTTGGCGCTGATGATCGCTACACCTGGCCGTTGCGCAATTTCGTCCAGGCACAGGGCTATGCCA
CGACTGGCTGGGGCCTGGGCACCAACAAGGCAGGTCTCAATATGCCGCATCAACTATCCGACGTCCACCCCAGATGG
AAGCTAAAACCCAAGACGCCGTACCGTGGTGAGGCGGGCGTACCTTACGTGATTGACCGCTTGATCGAACGGTTTGA
CGAATTGGCATCGACGGATCCGCAACCCATCGCACTTATAGGTTGGAGTCTGGGTGGTTTCATGGCCCGTGAAGTTG
CCCGAGAGCGCCCAAACCAGGTGAGTCAGGTTATTACCCTCGGTTCTCCTGTCATCGGAGGCCCAAAATACACCCTC
GCTGCATCGGCTTTCATCCGGCGCAAATACGATTTGGACTGGGTGGAGCAAGTGATCGCGGAGCGGGAAGATCGCCC
CATTACTGTTCCTATTACAGCAATAGTCAGCCAGTCTGATGGCATCGTCGGATATTCAGCGGCAATCGATCACCACA
GTCCCGCTGTGCAGCATTTACATATGGATGTTGCCCATTTGGGCTTTCCTTACAACACGAGGGTTTGGTCAGAAATC
GCCAATGCGCTCAACTCTTTAGAGGTGGAGAAGGAGCGTGTTTAG
[0232] SEQ ID NO:14(由SEQ ID NO:13编码):
[0233] MNTADLLKPPPASMTVLEARALLDICKMSAPLARLLFKKNSPWRKQRVLVIPGFGADDRYTWPLRNFVQAQGYATTGWGLGTNKAGLNMPHQLSDVHPRWKLKPKTPYRGEAGVPYVIDRLIERFDELASTDPQPIALIGWSLGGF
MAREVARERPNQVSQVITLGSPVIGGPKYTLAASAFIRRKYDLDWVEQVIAEREDRPITVPITAIVSQSDGIVGYSA
AIDHHSPAVQHLHMDVAHLGFPYNTRVWSEIANALNSLEVEKERV
[0234] SEQ ID NO:15:
[0235] ATGGAGCTCGCCAAGGTCACCGCCCTGATGAAGGCCACCGCCCTCGAGATCGCGATCCTCACCGGCCACCTCGTCCTCTACCCCTCCGGGATCGTGGCCGAGCGCCTCGCGGCCGCCCCCTCTTCACCGTCCTCCCCGTCCGCGGG
CCCGACGGGCCGACGTCCGGTCGTCCTGCTGCACGGTTTCGTGGACAACCGCTCGGTCTTCGTCCTGCTGCGCCGTG
CCCTCACCCGGAGCGGCCGTGACTGCGTCGAGTCGCTCAACTACTCGCCGCTCACCTGCGACCTGCGGGCCGCCGCC
GAACTGCTGGGGCGCCGGGTGGACGAGATCCGCGCCCGGACCGGACACGCCGAGGTCGACATCGTCGGCCACAGCCT
GGGCGGGCTCATCGCCCGTTATTACGTACAGCGTCTCGGCGGTGACAGCCGGGTGCGCACCCTGGTCATGCTCGGCA
CCCCGCACTCCGGCACCACCGTGGCCCGGCTCGCCGACGCGCATCCGCTGGTGCGGCAGATGCGGCCGGGTTCGGAG
GTGCTGCGGGAGCTCGCCGCGCCCTCGCCCGGCTGCCGTACCCGGTTCGTGAGCTTCTGGAGCGACCTCGACCAGGT
GATGGTGCCGGTGGACACGGCCTGCCTGGACCACCCCGACCTGCTGGTGCACAACGTCCGGGTCAGCGGGATCGGTC
ATCTCGCGCTGCCGGTCCATCCCACGGTGGCGGCCGGGGTCCGGGAGGCCCTCGACGCGAGCGGCGCGGGGGTCCCG
GGGGTGCGGGAGGAGGGGCCCGGCGCCGGCGCCGTGGCGTGA
[0236] SEQ ID NO:16(由SEQ ID NO:15编码):
[0237] MELAKVTALMKATALEIAILTGHLVLYPSGIVAERLAAAPSSPSSPSAGPTGRRPVVLLHGFVDNRSVFVLLRRALTRSGRDCVESLNYSPLTCDLRAAAELLGRRVDEIRARTGHAEVDIVGHSLGGLIARYYVQRLGGDSRVRT
LVMLGTPHSGTTVARLADAHPLVRQMRPGSEVLRELAAPSPGCRTRFVSFWSDLDQVMVPVDTACLDHPDLLVHNVR
VSGIGHLALPVHPTVAAGVREALDASGAGVPGVREEGPGAGAVA
[0238] SEQ ID NO:17:
[0239] GTGGCCGCCGCGGACAGCGGGACGGCGGAAGGGCAAAGGCTTCGGCCGCCGAGCCTGTTCCTGATGCTGGCCGAGGCGAGGGGCTTGCTCGAACTGAACTCGAGCCTGTTGTTGTCGCCGCTGTTGTTGCGGGCGCCGAAGGGCGA
CGGACATCCGGTGCTGGCGCTGCCGGGCTTTCTCGCCAGCGATCTGTCGATGGCGCCGATGCGGCGCTATCTGAAAG
AACTCGGCTACGATGCCCATGCGTGGAACATGGGCCGCAATCTCGGCGGCGTCGCGTCCAAGCGCGAAGCCTTGCGC
GACCTGTTGCGGCGCATTTACAGCCAGACGGGCCGCAAGGTCAGCCTGGTCGGCTGGAGTCTCGGCGGCGTCTATGC
GCGCGATCTCGCTTTGCAGGCGCCCGACATGGTGCGTTCCGTGATCACGCTCGGCAGTCCGTTTGCCAGCGACATCA
GGGCGACCAACGCCACGCGGCTCTACGAGGCGCTGTCGGGAGAAAGGGTCGACGACAATCCGGAGTTAACAGCGGCG
ATCGCCGGCGACCTGCCGGTGCCGGCGACCTCGATCTATTCCCGTACCGACGGTATCGTGAACTGGCACACCAGCCT
GCTGCGTCCTTCCGCAACGGCTGAAAACATCGAGGTTTACTTCGCCAGCCATATCGGGCTCGGCGTCAACCCGGCAG
CGCTGTGGGCGGTGGCCGACCGCCTGGCGCAGCCCGAGGGGGAATTTAAGCATTTTGACCGGTCGGGTCCCTTTGCC
ATTGCCTATGGCCCCCCTGAAAATGCACAATCCTGA
[0240] SEQ ID NO:18(由SEQ ID NO:17编码):
[0241] MAAADSGTAEGQRLRPPSLFLMLAEARGLLELNSSLLLSPLLLRAPKGDGHPVLALPGFLASDLSMAPMRRYLKELGYDAHAWNMGRNLGGVASKREAL RDLLRRIYSQTGRKVSLVGWSLGGVYARDLALQAPDMVRSVITLGS
PFASDIRATNATRLYEALSGERVDDNPELTAAIAGDLPVPATSIYSRTDGIVNWHTSLLRPSATAENIEVYFASHIG
LGVNPAALWAVADRLAQPEGEFKHFDRSGPFAIAYGPPENAQS
[0242] SEQ ID NO:19:
[0243] ATGCCGGAGCGAAACGAAGCGCAGGCCCCGCCGCGTCTTCGTCCGCCGGGGCTCGGGCTGTTCCTCGCCGAAGCGCGGGGCATTTTCGAGCTCAACGCGAGCCTGTTGCTGTCGCCGCTTCTGTTGCGCGCGCCGCGCGGCGACGG
CCATCCGGTGCTGGCGTTGCCGGGCTTTCTTGCCAGTGATCTATCGATGGCGCCGTTGCGCCGCTACCTCACCGAGC
TCGGCTACGACACCCACGCCTGGCGCATGGGCCGCAATGTCGGCGGCATCGCGAAGATGCGGATCGCGCTGCTCGAG
CGGCTCACGCAGATCCATGCCGAGTGCGGCCGCAAGGTCTCGATTGTCGGCTGGAGTCTCGGCGGCGTCTATGCGCG
CGACCTCGCGTTGCAGGCGCCCGAGATGGTGCGCTACGTCGTCACCCTCGGCAGCCCCTTCGCCAGCGACGTCCGCG
CCACCAATGCGACGCGGCTCTATGAGGCGATGTCGGGCGAAACGGTCGGCGACAATGTCGACCTCGTGCAGGCGATT
GCCGGCGACCTGCCGGTTCCCGTGACCTCGATCTATTCGAAGAGCGACGGCATCGTGAACTGGCGGACCTGCCTGCT
GCGCCCGTCCGCGACCGCCGAGAATATCGAGGTCTATTTCGCGAGCCATGTCGGCATCGGCGTCAATCCGGCCGCGC
TGTGGGCGATCGCGGACCGGCTGGCCCAGCGGGAAGGCGAATTCCGCCCCTTCGACCGGTCCGGTCCTTTTGCCATT
GCCTACGCGCCCCCGGAACAGGCACAATCGATCTGA
[0244] SEQ ID NO:20(由SEQ ID NO:19编码):
[0245] MPERNEAQAPPRLRPPGLGLFLAEARGIFELNASLLLSPLLLRAPRGDGHPVLALPGFLASDLSMAPLRRYLTELGYDTHAWRMGRNVGGIAKMRIALLERLTQIHAECGRKVSIVGWSLGGVYARDLALQAPEMVRYVVTLGSPF
ASDVRATNATRLYEAMSGETVGDNVDLVQAIAGDLPVPVTSIYSKSDGIVNWRTCL LRPSATAENIEVYFASHVGI
GVNPAALWAIADRLAQREGEFRPFDRSGPFAIAYAPPEQAQSI
[0246] 本发明提供了使用本发明提供的核酸发现新的水解酶序列的方法。本发明还提供SM SM
了通过例如GSSM 和基因再组装 技术修饰本发明提供的核酸的方法。本发明提供的核酸
可以通过例如克隆和表达cDNA文库、用PCR进行信使或基因组DNA扩增等方法制备、分离
和/或操作。
[0247] 选定的示例性的多肽和核酸的最初来源是:
[0248]SEQ ID NO: 来源
1,2 从环境样品中获得
3,4 从环境样品中获得
5,6 从环境样品中获得
7,8 从环境样品中获得
9,10 从环境样品中获得
11,12 从环境样品中获得
13,14 从环境样品中获得
15,16 细菌
17,18 从环境样品中获得
19,20 从环境样品中获得
[0249] 在进行本发明提供的方法时,如文中所述,可以通过操作模板核酸修饰同源基因。主张的对象可以与本领域已知的任何方法或规程或设备一起使用,其在科技和专利文献中
已有详细描述。
[0250] 一般性技术
[0251] 在一些实施方式中,本发明提供的核酸包括RNA、RNAi(例如,siRNA、miRNA)、反义核酸、cDNA、基因组DNA、载体、病毒或其杂交体,分离自多种来源的、遗传工程改造的、扩增的、和/或重组表达/生成的核酸。从这些核酸生成的重组多肽可以被单独分离或克隆,并检测其目标活性(例如,水解酶,例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性)。 可以使用任何重组表达系统,包括细菌、哺乳动物、酵母、真菌、昆虫或植物细胞表达系统。 [0252] 可选地,这些核酸可以通过已知的化学合成技术进行体外合成,如下列文献
中 所 述:例 如,Adams(1983)J.Am.Chem.Soc.105:661;Belousov(1997)Nucleic Acids Res.25:3440-3444;Frenkel(1995)Free Radic.Biol.Med.19:373-380;Blommers(1994)Biochemistry 33:7886-7896;Narang(1979)Meth.Enzymol.68:90;Brown(1979)Meth.
Enzymol.68:109;Beaucage(1981)Tetra.Lett.22:1859;美国专利号4,458,066。
[0253] 核酸操作技术,例如,亚克隆、标记探针(例如,用Klenow聚合酶进行随机引物标记、缺口翻译、扩增)、测序、杂交等在科技和专利文献中已有详细描述,参见,例如,Sambrook编,MOLECULAR CLONING:A LABORATORY MANUAL(第2版),第1-3卷,Cold Spring Harbor Laboratory,(1989);CURRENT PROTOCOLS IN MOLECULAR BIOLOGY,Ausubel 编
John Wiley&Sons,Inc.,New York(1997);LABORATORY TECHNIQUES IN BIOCHEMISTRY AND MOLECULAR BIOLOGY:HYBRIDIZATION WITH NUCLEIC ACID PROBES,Part I.Theory and
Nucleic Acid Preparation,Tijssen编,Elsevier,N.Y.(1993)。
[0254] 另一种获得和操作用于本发明提供的方法的核酸的有效手段是从基因组样品进行克隆,并且如果需要的话,对从例如基因组克隆或cDNA克隆中分离或扩增的插入物进行
筛选和再克隆。用于本发明提供的方法的核酸的来源包括基因组或cDNA文库,其包含于例
如哺乳动物人工染色体(MAC)中,参见例如美国专利号5,721,118、6,025,155;人人工染色体,参见例如Rosenfeld(1997)Nat.Genet.15:333-335;酵母人工染色体(YAC);细菌人工染色体(BAC);P1人工染色体,参见例如Woon(1998)Genomics 50:306- 316;P1-衍生的载体(PAC),参见例如Kern(1997)Biotechniques 23:120-124;粘粒;重组病毒;噬菌体或质粒。
[0255] 短语“核酸”或“核酸序列”可以包括寡核苷酸、核苷酸、多核苷酸、或任何这些的片段、可以是单链或双链且可以代表正义或反义链的基因组或合成来源的DNA或RNA(例如,mRNA、rRNA、tRNA、RNAi)、肽核酸(PNA),或任何天然或合成来源的DNA-样或RNA-样
材料,包括例如RNAi(双链“干扰”RNA)、核糖核蛋白(例如,iRNP)。该术语涵盖核酸,即寡核苷酸,其含有已知的天然核苷酸类似物。该术语还涵盖具有合成骨架的核酸-样结
构,参见例如Mata(1997)Toxicol.Appl.Pharmacol.144:189-197;Strauss-Soukup(1997)Biochemistry 36:8692-8698;Samstag(1996)Antisense Nucleic Acid Drug Dev 6:
153-156。
[0256] 本发明使用的术语“启动子”包括能够驱动细胞例如植物细胞中编码序列转录的所有序列。因此,用于本发明提供的构建体的启动子包括参与调节或调控基因转录时间和
/或速率的顺式转录控制元件和调控序列。例如,启动子可以是顺式转录控制元件,包括增强子、启动子、转录终止子、复制原点、染色体整合序列、5’和3’未翻译区域、或内含子序列,其参与转录调节。这些顺式序列通常与蛋白或其它生物分子相互作用(开/关、调节、调控
等)以进行转录。“组成型”启动子是在大多数环境条件和发育状态或细胞分化状态下都持续驱动表达的启动子。“可诱导的”或“可调节的”启动子在环境条件或发育条件的影响下引导本发明提供的核酸的表达。能够影响可诱导的启动子转录的环境条件的示例包括厌氧
条件、升高的温度、干旱、或光的存在。
[0257] “组织-特异性”启动子是只有在特定细胞或组织或器官(例如在植物或动物中)内才有活性的转录控制元件。组织-特异性调节可以通过某些固有因素 获得,其确保针对
给定组织具有特异性的编码蛋白的基因被表达。已知这些因素存在于哺乳动物和植物中,
从而允许特定组织的发育。
[0258] 术语“植物”包括完整植物、植物的部分(例如,叶、干、花、根等)、植物原生质体、种子和植物细胞及其果实。可用于本发明提供的方法的植物种类一般与可进行转化技术的高等植物一样多,包括被子植物(单子叶和双子叶植物)、和裸子植物。其包括各种倍体
水平的植物,包括多倍体、二倍体、单倍体和半合体状态。本发明使用的术语“转基因植物”包括插入了异源核酸序列的植物或植物细胞,例如,本发明提供的核酸和各种重组构建体
(例如,表达框)。
[0259] 一方面,编码本发明提供的多肽的核酸以合适的方式与能够引导翻译后的多肽或其片段分泌的前导序列组装。
[0260] 在一个实施方式中,本发明提供了融合蛋白和编码它们的核酸。本发明提供的多肽可以融合于异源肽或多肽,例如提供理想特性(如增加的稳定性或简化纯化)的N-端鉴
别肽。本发明提供的肽和多肽也可以与额外的一种或更多结构域相连接作为融合蛋白进
行合成和表达,用于例如生成更加具有免疫原性的肽、更容易分离重组合成的肽、识别和分离抗体和抗体-表达B细胞等。有助于检测和纯化的结构域包括,例如,允许在经固定的金
属上纯化的金属螯合肽例如聚组氨酸束和组氨酸-色氨酸模块、允许在经固定的免疫球蛋
白上纯化的蛋白A结构域、以及用于FLAGS扩展/亲和纯化系统(Immunex Corp,Seattle
WA)的结构域。在纯化结构域和含有基序的肽或多肽之间加入可裂解的接头序列,例如因
子Xa或肠激酶裂解序列(Invitrogen,San Diego CA),能够有助于纯化。例如,表达载体可以包含表位-编码核酸序列,其与六个组氨酸残基相连,然后连接硫氧还蛋白和肠激酶裂
解位点(参见例如, Williams(1995)Biochemistry 34:1787-1797;Dobeli(1998)Protein Expr.Purif.12:404-414)。组氨酸残基有助于检测和纯化,而肠激酶裂解位点提供了从剩余的融合蛋白中纯化表位的方法。关于编码融合蛋白的载体的技术和融合蛋白的应用在科
技和专利文献中已有详细描述,参见例如,Kroll(1993)DNACell.Biol.,12:441-53。
[0261] 转录和翻译控制序列
[0262] 在另一个实施方式中,本发明提供了与表达(例如转录或翻译)调控序列(例如引导或调控RNA合成/表达启动子或增强子)可操作连接的核酸(例如DNA、iRNA)序列。
表达控制序列可以位于表达载体中。示例性的细菌启动子包括lacI、lacZ、T3、T7、gpt、λPR、PL和trp。示例性的真核启动子包括CMV即刻早期、HSV胸苷激酶、早期和晚期SV40、反转录病毒的LTR、以及小鼠金属硫蛋白。
[0263] 适于在细菌中表达多肽的启动子包括大肠杆菌lac或trp启动子、lacI启动子、lacZ启动子、T3启动子、T7启动子、gpt启动子、λPR启动子、λPL启动子、编码糖酵解酶例如3-磷酸甘油酸酯激酶(PGK)操纵子的启动子、以及酸性磷酸酶启动子。真核启动子包
括CMV即刻早期启动子、HSV胸苷激酶启动子、热休克启动子、早期和晚期SV40启动子、反
转录病毒的LTR、以及小鼠金属硫蛋白-I启动子。还可以使用已知在原核或真核细胞或其
病毒中调控基因表达的其它启动子。
[0264] 组织-特异性植物启动子
[0265] 在一个实施方式中,本发明提供了可以以组织-特异性方式表达的表达框,例如可以以组织-特异性方式表达本发明提供的水解酶。在另一个实施方式中,本发明提供了
以组织-特异性方式表达本发明提供的水解酶的植物或种 子。组织-特异性可以是种子
特异性、主干特异性、叶特异性、根特异性、果实特异性等等。
[0266] 一方面,组成型启动子例如CaMV 35S启动子可以被用于在植物或种子的特定部位或全植物中表达。例如,为了过量表达本发明提供的水解酶,可以使用植物启动子片
段,其在植物(例如再生植物)的一些或全部组织中引导表达核酸。该“组成型”启动子
在大多数环境条件和发育状态或细胞分化状态下都具有活性。组成型启动子的示例包括
花椰菜花叶病毒(CaMV)35S转录起始区域、衍生自根瘤农杆菌T-DNA的1’-或2’-启动
子、以及本领域技术人员已知的来自各种植物基因的其它转录起始区域。这些基因包括,
例如,拟南芥属(Arabidopsis)的ACT11(Huang(1996)Plant Mol.Biol.33:125-139);
拟 南 芥 属 的 Cat3(Genbank 号:U43147,Zhong(1996)Mol.Gen.Genet.251:196-203);
油菜(Brassica napus)的编码硬脂酰-酰基载体蛋白去饱和酶的基因(Genbank号:
X74782,Solocombe(1994)Plant Physiol.104:1167-1176);玉 蜀 黍GPc1(Genbank 号:
X15596;Martinez(1989)J.Mol.Biol 208:551-565);玉蜀黍Gpc2(Genbank号:U45855,
Manjunath(1997)Plant Mol.Biol.33:97-112);描述于美国专利号4,962,028;5,633,440的植物启动子。
[0267] 在一个实施方式中,本发明提供了衍生自病毒的组织-特异性或组成型启动子,其可以包括,例如,烟草花叶病毒亚基因组启动子(Kumagai(1995)Proc.Natl.Acad.Sci.
USA 92:1679-1683);水稻东格鲁杆状病毒(RTBV),其只在被感染的水稻植物的韧皮细
胞中进行复制,其启动子驱动韧皮-特异性报告基因的高强度表达;木著叶脉花叶病毒
(CVMV)启动子,其在脉管元件、叶肉细胞、和根尖处具有最高活性(Verdaguer(1996)Plant Mol.Biol.31:1129-1139)。
[0268] 可选地,植物启动子可以在特定组织、器官或细胞类型中引导水解酶-表达核酸的表达(即组织-特异性启动子),或可以在其它更具体的环境或发育控制或在诱导型启
动子的控制下进行。可能影响转录的环境条件的示例包括厌氧条件、升高的温度、光的存
在、或化学品/激素喷雾。在一个实施方式中,本发明提供了玉蜀黍的干旱-诱导型启动子
(Busk(1997)如上);马铃著的寒冷、干旱、和高盐诱导型启动子(Kirch(1997)Plant Mol.
Biol.33:897909)。
[0269] 组织-特异性启动子只能在发育阶段的某一时间框架内促进该组织中的转录。参见,例如,Blazquez(1998)Plant Cell 10:791-800,其描述了拟南芥属LEAFY基因启动子。
还参见Cardon(1997)Plant J 12:367-77,其描述了转录因子SPL3,其识别A.thaliana
的花分生组织识别基因AP1的启动子区域中的保守序列基序;以及Mandel(1995)Plant
Molecular Biology,第29卷,第995-1004页,其描述了分生组织启动子eIF4。可以使用在整个生命周期内对特定组织都具有活性的组织特异性启动子。一方面,本发明提供的核酸
与主要仅在棉纤维细胞中才有活性的启动子可操作地连接。一方面,本发明提供的核酸与
主要在棉纤维细胞延伸阶段中有活性的启动子可操作地连接,例如,如上Rinehart(1996)
所述。核酸可以可操作地连接于Fbl2A基因启动子,以在棉纤维细胞中优先表达(同上)。
还参见,John(1997)Proc.Natl.Acad.Sci.USA 89:5769-5773;John等人,美国专利号
5,608,148和5,602,321,其描述了棉纤维-特异性启动子和构建转基因棉花植物的方法。
根-特异性启动子也可以用于表达本发明提供的核酸。根-特异性启动子的示例包括来自
醇脱氢酶基因的启动子(DeLisle(1990)Int.Rev.Cytol.123:39-60)。其它可用于表达本
发明提供的核酸的启动子包括例如胚珠-特异性、胚芽-特异性、胚乳-特异性、外皮-特
异性、种皮-特异性启动子,或其组合;叶-特异性启动子(参 见,例如,Busk(1997)Plant J.11:12851295,其描述了玉蜀黍的叶-特异性启动子);毛根农杆菌(Agrobacterium
rhizogenes)ORF13启动子(其表现出高的根部活性,参见,例如,Hansen(1997)如上);玉
蜀黍花粉特异性启动子(参见,例如,Guerrero(1990)Mol.Gen.Genet.224:161168);可以使用番茄启动子,其在果实成熟、叶子以及更低程度的花的衰老和脱落过程中有活性(参
见,例如,Blume(1997)Plant J.12:731746);马铃著SK2基因的雌蕊-特异性启动子(参
见,例如,Ficker(1997)Plant Mol.Biol.35:425431);豌豆Blec4基因,其在转基因紫花苜蓿营养性的和花梗的苗端表皮组织处有活性,导致其成为能够使外源基因在活跃生长的嫩
芽或纤维的表皮层中表达的有用工具;胚珠-特异性BEL1基因(参见,例如,Reiser(1995)
Cell 83:735-742,Genbank号:U39944);和/或,Klee,美国专利号5,589,583中的启动子,其描述了能够赋予分生组织和/或快速分裂细胞高转录水平的植物启动子区域。
[0270] 可选地,可通过暴露于植物激素例如植物生长素进行诱导的植物启动子被用于表达本发明提供的核酸。在一个实施方式中,本发明提供的启动子包括大豆(Glycine
max L.)中的生长素-响应元件E1启动子片段(AuxRE)(Liu(1997)Plant Physiol.115:
397-407);生长素响应的拟南芥属GST6启动子(同样响应水杨酸和过氧化氢)(Chen(1996)
Plant J.10:955-966);来自烟草的生长素诱导型parC启动子(Sakai(1996)37:906-913);
植物生物素响应元件(Streit(1997)Mol.Plant Microbe Interact.10:933-937);和响应
应激激素脱落酸的启动子(Sheen(1996)Science 274:1900-1902)。
[0271] 本发明提供的核酸也可以与植物启动子可操作地连接,后者可通过暴露于化学试剂进行诱导,其中化学试剂例如除草剂或抗生素可以被施用于植 物。例如,可以使用
玉蜀黍In2-2启动子,其被苯磺酰胺除草剂安全剂所活化(De Veylder(1997)Plant Cell
Physiol.38:568-577);使用不同除草剂安全剂诱导不同的基因表达模式,包括表达于根
部、排水器、以及苗尖分生组织。编码序列可以受到下述序列控制,例如,四环素-诱导的启动子,例如,如结合含有燕麦(Avena sativa L.)精氨酸脱羧酶基因的转基因烟草植物所
描述的(Masgrau(1997)Plant J.11:465-473);或水杨酸-响应元件(Stange(1997)Plant
J.11:1315-1324)。通过使用化学(例如,激素或杀虫剂)诱导的启动子,即响应可被施用
于田野中的转基因植物的化学品的启动子,本发明提供的多肽可以在植物发育的特定阶段
进行诱导表达。在一些实施方式中,本发明提供的转基因植物含有编码本发明提供的多肽
的诱导型基因,其宿主的范围限于目标植物物种,例如玉米、水稻、大麦、小麦、马铃著或其它作物,其可在作物发育的任何阶段被诱导。
[0272] 组织-特异性植物启动子可以驱动可操作连接序列在靶标组织以外的组织中表达。因此,组织-特异性启动子是在靶标组织或细胞类型中优先驱动表达,但同时也可以引导在其它组织中的一些表达的启动子。
[0273] 本发明提供的核酸也可以被可操作地连接于植物启动子,其可通过暴露于化学试剂而被诱导。这些试剂包括,例如除草剂、合成植物生长素、或抗生素,其可被施用例如喷雾至转基因植物上。本发明提供的产水解酶核酸的诱导表达能够允许栽培者选择具有最优淀
粉:糖比例的植物。从而可以控制植物各部分的发育。
[0274] 在一个实施方式中,本发明提供了有助于收获植物和植物各部分的方法。例如,在各种实施方式中,使用了由苯磺酰胺除草剂安全剂活化的玉蜀黍In2-2启动子(De
Veylder(1997)Plant Cell Physiol.38:568-577);不同除草 剂安全剂的应用诱导了不同的基因表达模式,包括在根部、排水器、以及苗尖分生组织的表达。本发明提供的编码序列同样受到四环素诱导的启动子的控制,例如,结合含有燕麦(Avena sativa L.)精氨酸脱羧酶基因的转基因烟草植物所描述的(Masgrau(1997)Plant J.11:465-473);或水杨酸-响
应元件(Stange(1997)Plant J.11:1315-1324)。
[0275] 如果需要合适的多肽表达,应当在编码区域的3’末端包含多聚腺苷酸化区域。该多聚腺苷酸化区域可以源自天然基因、多种其它植物基因、或农杆菌T-DNA基因。
[0276] 表达载体和克隆载体
[0277] 在一个实施方式中,本发明提供了包含核酸(例如编码水解酶和抗体的序列)的表达载体、表达框和克隆载体。本发明提供的表达载体和克隆载体可以包括病毒颗
粒、杆状病毒、噬菌体、质粒、噬菌粒、粘粒、fosmid、细菌人工染色体、病毒DNA(例如,牛痘、腺病毒、禽痘病毒、假性狂犬病和SV40衍生物)、基于P1的人工染色体、酵母质粒、酵母人工染色体、和其它任何针对感兴趣的特定宿主(例如芽孢杆菌、曲霉菌和酵母)具
有特异性的载体。本发明提供的载体可以包括染色体、非染色体和合成DNA序列。大
量的合适载体是本领域技术人员已知的,以及可购得的。示例性的载体包括:细菌:pQE
TM
载体(Qiagen)、pBLUESCRIPT 质粒、pNH载体、(λ-ZAP载体(Stratagene);ptrc99a、
pKK223-3、pDR540、pRIT2T(Pharmacia);真 核:pXT1、pSG5(Stratagene)、pSVK3、pBPV、pMSG、pSVLSV40(Pharmacia)。然而,任何其它质粒或其它载体都可以使用,只要其在宿主中是可复制和能存活的。可以使用低拷贝数或高拷贝数载体。
[0278] 在一个实施方式中,本发明提供的“表达框”包含核苷酸序列,其能够在与该序列相容的宿主中实现结构基因(即蛋白编码序列,例如本发明提供的水解酶)的表达。表达框包括至少一个与多肽编码序列可操作地连接且任选地与其他序列(例如转录终止信号)
相连的启动子。也可以使用其它实现表达所需要的或有帮助的因子,例如增强子。本发明
使用的“可操作地连接”表示在DNA序列上游连接启动子,由此启动子介导DNA序列的转录。
从而,表达框还包括质粒、表达载体、重组病毒、任何形式的重组“裸露DNA”载体等。“载体”包括可以感染、转染、瞬时性或永久性转导细胞的核酸。人们将认识到,载体可以是裸露核酸,或与蛋白或脂质复合的核酸。载体任选地包含病毒或细菌核酸和/或蛋白,和/或膜
(例如,细胞膜、病毒脂质包膜等)。载体包括但不限于复制子(例如,RNA复制子、细菌噬
菌体),DNA片段可与其结合并被复制。因此,载体包括但不限于RNA、自主的自我复制的环状或线性DNA或RNA(例如质粒、病毒等,参见例如美国专利号5,217,879)、以及包括表达和非表达质粒。当重组微生物或细胞培养物被描述为“表达载体”的宿主时,其包括已被结合入宿主染色体的外-染色体环状和线性DNA。当载体被宿主细胞维持时,该载体可以在有丝
分裂中作为自主结构被细胞稳定复制,或被结合入宿主的基因组中。
[0279] 表达载体可以包括启动子、翻译起始的核糖体结合位点、和转录终止子。载体还可以包含合适的用于扩增表达的序列。哺乳动物表达载体可以包括复制原点、任何必需的核糖体结合位点、多聚腺苷酸化位点、剪接供体和受体位点、转录终止序列、以及5’侧翼非转录序列。在一些方面,可使用源自SV40剪接和多聚腺苷酸化位点的序列以提供所需的非转
录遗传元件。
[0280] 一方面,表达载体含有一种或更多选择性标记基因以实现对含有载体的宿主细胞的选择。此类选择性标记包括编码二氢叶酸还原酶的基因或在真核细胞培养中提供新霉
素抗性的基因、在大肠杆菌中提供四环素或氨苄青霉素抗性的基因、以及啤酒酵母TRP1基
因。可以使用带有选择性标记的氯霉素转移酶(CAT)载体或其它载体从任何期望的基因中
选择启动子区域。
[0281] 在真核细胞中表达多肽或其片段的载体还可以含有增强子以增强表达水平。增强子是DNA的顺式作用元件,通常长度为约10至约300bp,其作用于启动子以增强转录。其示
例包括位于复制原点后bp100至270的SV40增强子、巨细胞病毒早期启动子增强子、位于
复制原点后的多瘤增强子、以及腺病毒增强子。
[0282] DNA序列可以通过多种工艺被插入载体。通常,DNA序列被连接至载体上的期望位点,然后使用合适的限制性核酸内切酶对插入物和载体进行消化。可选地,可将插入物和载体的平端进行连接。多种克隆技术是本领域已知的,例如,描述于Ausubel和Sambrook。这些和其它工艺被认为是在本领域技术的范围内的。
[0283] 载体可以是质粒、病毒颗粒、或噬菌体的形式。其它载体包括染色体、非染色体和合成DNA序列、SV40衍生物;细菌质粒、噬菌体DNA、杆状病毒、酵母质粒、源生自质粒和噬菌体DNA组合的载体、病毒DNA例如牛痘、腺病毒、禽痘病毒、以及假性狂犬病。用于原核和真核宿主的多种克隆和表达载体描述于例如Sambrook。
[0284] 可使用的具体细菌载体包括可购得的含有以下众所周知的克隆载体的遗传元件的质粒:pBR322(ATCC 37017)、pKK223-3(Pharmacia Fine Chemicals,Uppsala,Sweden)、TM
GEM1 (Promega Biotec,Madison,WI, USA)、pQE70、pQE60、pQE-9(Qiagen)、pD10、psiX174 TM
Pbluescript IIKS 、pNH8A、pNH16a、pNH18A、pNH46A(Stratagene)、ptrc99a、pKK223-3、pKK233-3、DR540、pRIT5(Pharmacia)、pKK232-8和pCM7。具体的真核载体包括pSV2CAT、
pOG44、pXT1、pSG(Stratagene)pSVK3、pBPV、pMSG、以及pSVL(Pharmacia)。然而,其它任何载体都可以使用,只要其在宿主细胞中可以复制且能存活的。
[0285] 本发明提供的核酸可以在表达框、载体或病毒中表达,以及在植物细胞和种子中瞬时或稳定表达。一个示例性的瞬时表达系统使用附加型表达系统,例如,通过转录含有超螺旋DNA的附加型微型染色体在核中产生花椰菜花叶病毒(CaMV)的病毒RNA,参见,例如,
Covey(1990)Proc.Natl.Acad.Sci.USA 87:1633-1637。可选地,编码序列,即本发明提供的序列的全部或子片段可以被插入植物宿主细胞基因组,成为宿主染色体DNA的整合部分。
可以用该方式表达正义或反义转录物。含有来自本发明提供的核酸的序列(例如,启动子
或编码区域)的载体可以含有标记基因,其赋予了植物细胞或种子的选择性表型。例如,标记可以编码杀生剂抗性,特别是抗生素抗性,例如对卡那霉素、G418、博来霉素、潮霉素的抗性,或除草剂抗性,例如对氯磺隆或草铵膦的抗性。
[0286] 能够在植物中表达核酸和蛋白的表达载体是本领域公知的,其可以包括,例如,以下来源的载体:农杆菌属、马铃著病毒X(参见例如Angell(1997)EMBO J.16:3675-3684)、烟草花叶病毒(参见例如Casper(1996)Gene173:69-73)、番茄丛矮病毒(参见例如Hillman(1989)Virology 169:42-50)、烟草蚀纹病毒(参见例如Dolja(1997)Virology
234:243-252)、菜豆金色花叶病毒(参见,例如,Morinaga(1993)Microbiol Immunol.37:
471-476)、花椰菜花 叶病毒(参见例如Cecchini(1997)Mol.Plant Microbe Interact.10:
1094-1101)、玉 蜀 黍Ac/Ds转 位因 子(参 见 例如 Rubin(1997)Mol.Cell.Biol.17:
6294-6302;Kunze(1996)Curr.Top.Microbiol.Immunol.204:161-194)、以及玉蜀黍抑制
剂-突变子(Spm)转位因子(参见例如Schlappi(1996)Plant Mol.Biol.32:717-725);及
其衍生物。
[0287] 一方面,表达载体可以具有两套复制系统以允许其存在于两种生物中,例如在哺乳动物、酵母、真菌或昆虫细胞中用于表达以及在原核宿主中用于克隆和扩增。此外,为了整合表达载体,表达载体可以含有至少一种与宿主细胞基因组同源的序列。其可以在表达
构建体的两个侧翼包含两个同源序列。可以通过选择合适的包含入载体的同源序列将整合
载体导入宿主细胞的特定位点。用于整合载体的构建体是本领域公知的。
[0288] 本发明提供的表达载体还可以包括选择性标记基因从而能够筛选出已经被转化的细菌菌株,例如导致细菌耐受药物例如氨苄青霉素、氯霉素、红霉素、卡那霉素、新霉素和四环素的基因。选择性标记还可以包括生物合成基因,例如组氨酸、色氨酸和亮氨酸生物合成途径中的基因。
[0289] 宿主细胞和转化细胞
[0290] 在一个实施方式中,本发明提供了包含核酸序列的转化细胞,例如编码本发明提供的水解酶或抗体或载体的序列。宿主细胞可以是本领域技术人员熟知的任何宿主细胞,
包括原核细胞、真核细胞,例如细菌细胞、真菌细胞、酵母细胞、哺乳动物细胞、昆虫细胞、或植物细胞。
[0291] 本发明提供的酶可以在任何宿主细胞中表达,例如任何细菌细胞、任何酵母细胞、任何酵母菌属或裂殖酵母属、任何毕赤酵母属,例如,毕赤酵母、啤酒酵母或裂殖酵母。示例性的细菌细胞包括任何链霉菌属或芽孢杆菌 属,例如大肠杆菌、乳酸球菌、枯草芽孢杆菌、蜡状芽胞杆菌、鼠伤寒沙门氏菌或下列属中的任何种:芽孢杆菌属、链霉菌属和葡萄球菌属。示例性的昆虫细胞包括果蝇S2和斜纹夜蛾Sf9。示例性的动物细胞包括CHO、COS或
Bowes黑色素瘤或任何小鼠或人细胞系。选择合适的宿主在本领域技术人员的能力范围内。
转化多种高等植物品种的技术是公知的,并描述于科技文献。参见例如Weising(1988)Ann.Rev.Genet.22:421-477,美国专利号5,750,870。
[0292] 可以使用任何的各种技术将载体引入宿主细胞,包括转化、转染、转导、病毒感染、基因枪、或Ti-介导的基因转移。具体方法包括磷酸转染、DEAE-葡聚糖介导的转染、脂转染、或电穿孔(Davis,L.,Dibner,M.,Battey,I.,Basic Methods in Molecular Biology,(1986))。
[0293] 如果合适,可以在经改良的适合活化启动子的常规营养培养基中培养工程改造的宿主细胞,筛选转化子或扩增本发明提供的基因。在转化适当的宿主菌株并使宿主菌株生
长至合适的细胞密度后,可以通过合适的方式诱导(例如,改变温度或化学诱导)选定的启
动子,且可将细胞进一步培养一段时间以允许其生成所需的多肽或其片段。
[0294] 一方面,本发明提供的核酸或载体被引入细胞用于筛选,由此,核酸以适于该核酸后续表达的方式进入细胞。该引入方法主要取决于靶标细胞类型。示例性的方法包括CaPO4TM沉淀、脂质体融合、脂转染(例如,LIPOFECTIN )、电穿孔、病毒感染等。候选核酸可以稳定地整合入宿主细胞的基因组(例如,通过反转录病毒导入)或可以瞬时性或稳定存在于细
胞质中(即通过使用传统质粒、利用标准调控序列、选择性标记等)。可选的实施 方式包括能够转染这些靶标(例如哺乳动物、人细胞)的反转录病毒载体,因为,例如,很多药学上重要的筛选需要人或模型哺乳动物细胞靶标。
[0295] 可以离心收获细胞,通过物理或化学方法将其破碎,以及保留得到的粗提物用于进一步纯化。用于蛋白表达的微生物细胞可以通过任何便利的方法进行破碎,包括冻融循
环、超声、机械破碎、或使用细胞裂解剂。这些方法是本领域技术人员熟知的。可以使用多种方法从重组细胞培养物中回收和纯化表达的多肽或其片段,所述方法包括硫酸铵或乙醇
沉淀、酸萃取、阴离子或阳离子交换层析、磷酸纤维素层析、疏水作用层析、亲和层析、羟基磷灰石层析和凝集素层析。如果必要,可以使用蛋白重折叠步骤用于完成多肽构型。如果
需要,可以采用高效液相色谱(HPLC)进行最终纯化步骤。
[0296] 也可以使用各种哺乳动物细胞培养系统表达重组蛋白。哺乳动物表达系统的示例包括猴肾成纤维细胞COS-7细胞系和其它能够从兼容性载体中表达蛋白的细胞系,例如
C127、3T3、CHO、HeLa和BHK细胞系。
[0297] 可以以常规方式使用宿主细胞的构建体以生成由重组序列编码的基因产物。取决于重组制备过程中所用的宿主,由含有载体的宿主细胞生成的多肽可以是糖基化的或非糖
基化的。本发明提供的多肽还可以包含或不包含初始的甲硫氨基酸残基。
[0298] 也可以使用无细胞翻译系统生成本发明提供的多肽。无细胞翻译系统可以使用mRNA,其转录自包含了可操作地连接于编码多肽的核酸或其片段的启动子的DNA构建体。
在一些方面,DNA构建体可以在进行体外转录反应前被线性化。然后将转录的mRNA与合适
的无细胞翻译提取物例如兔网织红细胞提取物进行孵育,以生成期望的多肽或其片段。
[0299] 表达载体可以含有一种或更多选择性标记基因以提供表型特征用于转化的宿主细胞的筛选,例如对于真核细胞培养而言的二氢叶酸还原酶或新霉素抗性,或例如在大肠
杆菌中的四环素或氨苄青霉素抗性。
[0300] 核酸扩增
[0301] 在另一实施方式中,本发明提供了编码多肽的核酸或修饰的核酸,其可以通过例如扩增进行复制。在一个实施方式中,本发明提供了用于扩增编码水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)的核酸的扩增引物对,其中该引物对能够扩增本发明提
供的核酸序列。本领域技术人员可以为这些序列的任何部分或全长设计扩增引物序列对。 [0302] 还可以使用扩增反应对样品中的核酸定量(例如细胞样品中的信息含量)、标记
核酸(例如将其用于阵列或印迹)、检测核酸、或对样品中的特定核酸定量。在本发明提供
的一个方面,对分离自细胞或cDNA文库的信息进行扩增。本领域技术人员能够选择并设
计适当的寡核苷酸扩增引物。扩增方法同样是本领域熟知的,其包括例如聚合酶链式反应
PCR(参见例如PCRPROTOCOLS,A GUIDE TO METHODS AND APPLICATIONS,ed.Innis,Academic Press,N.Y.(1990)和PCR STRATEGIES(1995),ed.Innis,Academic Press,Inc.,N.Y.);连接酶链式反应(LCR)(参见例如Wu(1989)Genomics 4:560;Landegren(1988)Science 241:
1077;Barringer(1990)Gene89:117);转录扩增(参见例如Kwoh(1989)Proc.Natl.Acad.
Sci.USA86:1173);以及自我维持的序列复制(参见例如Guatelli(1990)Proc.Natl.Acad.
Sci.USA 87:1874);Q-β复制酶扩增(参见例如Smith(1997)J.Clin.Microbiol.35:
1477-1491);自动Q-β复制酶扩增分析(参见例如Burg(1996)Mol.Cell.Probes 10:
257-271)和其它RNA聚合酶介导的技术(例如, NASBA,Cangene,Mississauga,Ontario);
还参见Berger(1987)Methods Enzymol.152:307-316;Sambrook;Ausubel;美国专利号
4,683,195和4,683,202;Sooknanan(1995)Biotechnology 13:563-564。
[0303] 在一个实施方式中,本发明提供了包含本发明提供的序列的扩增引物对,例如,其中引物对包括第一成员和第二成员,该第一成员具有本发明提供的核酸的大约前(5’
端 )12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、
36、37、38、39或40或更多个残基的序列,且第二成员具有第一成员互补链的大约前(5’
端 )12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、
36、37、38、39或40或更多个残基的序列。
[0304] 确定序列同一性程度
[0305] 在一个实施方式中,本发明提供了核酸,其具有至少一种本发明提供的核酸或与该核酸具有完全(100%)的序列同一性,例如,本发明提供的示例性的核酸(例如,具有如
下所示的序列:SEQ ID NO:1、SEQ ID NO:3、SEQ IDNO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:22或SEQ IDNO:23;或修饰的SEQ ID NO:1,其编码1、2、3、4、5、6、7、8或更多(几个)或全部碱基变化,如表3、表4、表9、表10、表11、表16或表23所示,或其等价物);以及与本发明提供的多肽具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、
62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、
77%、78%、79%、80%、81%、82%、83%、84%、85%、 86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%、或更多、或完全(100%)序列同一性的多肽,例如,示例性的多肽具有如下所示的序列:SEQ ID NO:2、SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQID NO:16、SEQ ID NO:18、或SEQ ID NO:20;或具有1、2、3、4、5、6、7、8或更多(几个)或全部氨基酸变化的SEQ ID NO:
2,如表3、表4、表9、表10、表11、表16或表23所述,或其等价物。在可选的方面,序列同一性可以是跨越核酸或多肽的至少约5、10、20、30、40、50、100、150、200、250、300、350、400、
450、500、550、600、650、700、750、800、850、900、950、1000、或更多个连续残基的区域或其全长。序列同一性(同源性)的程度可以使用任何计算机程序和相关参数进行测定,包括本
发明描述的,例如BLAST 2.2.2.或FASTA 3.0t78版本,采用缺省参数。本发明使用的术语
“计算机”、“计算机程序”和“处理器”根据其最广的常规含义进行使用,并包括所有这些设备,如下详述。
[0306] 下述表格描述了本发明提供的示例性的核酸和多肽的部分特征,包括示例序列与公共数据库进行序列同一性比对以通过同源性(序列同一性)分析识别本发明提供的酶的
活性。在两套数据库中对表中描述的全部序列(本发明提供的全部示例性的序列)进行了
BLAST搜索(如下详述)。第一套数据库可从NCBI(美国国家生物技术信息中心)获得。在
这些数据库检索得到的所有结果呈现在题为“NR描述”、“NR登录号”、“NR的E值”或“NR生物体”的栏中。“NR”表示NCBI维护的非冗余核苷酸数据库。该数据库是GeneBank、GeneBank更新、以及EMBL更新的组合。“NR描述”栏中的内容为任何给定的NCBI记录中的定义行,其包括对序列的描述,例如来源生物体、基因名 称/蛋白名称、或对序列功能的一些描述——由此通过同源性(序列同一性)分析确定所列举的本发明提供的示例酶的活性。“NR登录
号”栏中的内容为给予每个序列记录的独一无二的标识符。“NR的E值”栏中的内容代表期望值(E值),其表示在目前的BLAST搜索中,在将随机序列进行相同数量的比对后获得的分
值与将查询序列(本发明提供的序列)和序列数据库比对所得到的分值相同的概率。“NR
生物体”栏中的内容表示被认定为最接近的BLAST(序列同源性)序列的来源生物体。第二
TM
套数据库总称为GENESEQ 数据库,其可通过Thomson Derwent(Philadelphia,PA)获得。
TM TM
在这些数据库中得到的所有检索结果呈现在题为“GENESEQ 蛋白描述”、“GENESEQ 蛋白登TM TM TM TM
录号”、“GENESEQ 蛋白E值”、“GENESEQ DNA描述”、“GENESEQ DNA登录号”或“GENESEQ TM
DNA的E值”的栏中。这些栏中的信息与上述NR栏中的信息相当,只是其获自对GENESEQ
数据库而不是NCBI数据库的BLAST搜索。“查询DNA长度”和“查询蛋白长度”栏分别表示
TM
在NCBI或GENESEQ 数据库中检索或查询的本发明提供的序列的核苷酸或氨基酸的数量。
TM TM
“GENESEQ 或NR DNA长度”和“GENESEQ 或NR蛋白长度”栏分别表示BLAST搜索得到的最
TM
佳匹配序列中核苷酸或氨基酸的数量。这些栏中提供的是在NCBI数据库或GENESEQ 数据
TM TM
库中搜索返回较低E值的结果。“GENESEQ /NR%ID蛋白”和“GENESEQ /NR%ID DNA”栏
表示本发明提供的序列和BLAST最佳匹配序列的序列同一性百分比。这些栏中提供的是在
TM
NCBI数据库或GENESEQ 数据库中搜索返回较低E值的结果。
[0307]
[0308]
[0309]
[0310]
[0311]
[0312]
[0313]
[0314] 同源序列还包括在核酸序列中由尿嘧啶代替了胸腺嘧啶的RNA序列。同源序列可以使用任何本发明所述的工艺获得,或可以来自对测序错误的纠正。可以理解本发明所述
的核酸序列可以采用传统的单字母形式表示(参见例如,Stryer,Lubert.Biochemistry,
3rd Ed.,W.H Freeman&Co.,New York)或采用任何其它能够准确记录核苷酸序列的形式。 [0315] 本发明识别的和本领域技术人员已知的各种序列比对程序都可以用于比对序
列。蛋白和/或核酸序列同一性(同源性)可以使用任何本领域已知的序列比对算法
和程序进行估值。这些算法和程序包括但不限于,TBLASTN、BLASTP、FASTA、TFASTA、
以 及 CLUSTALW(Pearson 和 Lipman,Proc.Natl.Acad.Sci.USA 85(8):2444-2448,
1988;Altschul 等,J.Mol.Biol.215(3):403-410,1990;Thompson 等,Nucleic Acids Res.22(2):4673-4680,1994;Higgins等,Methods Enzymol.266:383-402,1996;Altschul等,J.Mol.Biol.215(3):403-410,1990;Altschul 等,Nature Genetics 3:266-272,
1993)。
[0316] 同源性或同一性可以使用序列分析软件进行检测(例如,Genetics ComputerGroup的序列分析软件包,University of Wisconsin Biotechnology Center,1710
University Avenue,Madison,WI 53705)。这些软件通过指定各种缺失、取代和其它修饰的同源性程度将相似序列进行配对。在涉及两种或更多核酸或多肽序列时,术语“同源性”和“同一性”表示当使用任何序列比对算法或手工比对和视觉检查,在比对窗口或指定区域中进行比较并进行最大对应性比对时,完全相同或具有特定百分比的氨基酸或核苷酸残基
相同的两种或更多序列或子序列。在序列比对中,一条序列可以作为参比序列(例如,本发明提供的示例性的核酸或多肽序列),并将待测序列与之进行比 对。当使用序列比对算法
时,将待测和参比序列输入计算机,如果需要的话指定子序列坐标,并指定序列算法程序参数。可以使用缺省程序参数,或可指定备选参数。然后序列比对算法基于程序参数计算待
测序列相对于参比序列的序列同一性百分比。
[0317] 本发明使用的“比对窗口”包括任何数量的连续残基片段。例如,在本发明提供的可选的方面,在将两条序列进行最优化比对后,将范围为任何20个至全长的示例性的多
肽或核酸序列的连续残基与参比序列的相同数量的连续位点进行比较。如果参比序列相
对于示例性的多肽或核酸序列具有需要的序列同一性,例如,在可选的方面,相对于本发明提供的示例性的多肽或核酸序列具有50%、51%、52%、53%、54%、55%、56%、57%、58%、
59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、
74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、
89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或更多、或完全(100%)的序列同一性,那么该序列即在本发明提供的范围内。在可选的实施方式中,在将两序列进行最优化比对后,将约20至600、约50至200、以及约100至150的子序列与参比序列的
相同数量的连续位点进行了比较。为了比较的序列比对方法是本领域公知的。用于比较
的最佳序列比对可以采用例如Smith和Waterman的局部同源性算法,Adv.Appl.Math.2:
482,1981;Needleman和Wunsch的同源性比对算法,J.Mol.Biol.48:443,1970;Person和Lipman的搜索相似度方法,Proc.Nat’l.Acad.Sci.USA 85:2444,1988,并通过计算机实行这些算法来实现(Wisconsin遗传软件包中的GAP、BESTFIT、FASTA、以及TFASTA,Genetics Computer Group,575 Science Dr.,Madison,WI),或通过手工比对和视觉检查。除了
BLAST程序(国家生物信息中心的基本局部比对搜索工具)外,其它测定同源性或同一性的
算法还包括,例如,ALIGN、AMAS(多比对序列分析)、AMPS(蛋白多序列比对)、ASSET(比对片段统计估值工具)、BANDS、BESTSCOR、BIOSCAN(生物序列比较分析节点)、BLIMPS(BLocks IMProved Searcher)、FASTA、Intervals和Points、BMB、CLUSTAL V、CLUSTAL W、CONSENSUS、LCONSENSUS、WCONSENSUS、Smith-Waterman算法、DARWIN、LasVegas算法、FNAT(强力核酸比对工具)、Framealign、Framesearch、DYNAMIC、FILTER、FSAP(Fristensky序列分析包)、GAP(全局比对程序)、GENAL、GIBBS、GenQuest、ISSC(敏感性序列比对)、LALIGN(局部序
列比对)、LCP(局部内容程序)、MACAW(多比对构建和分析工作台)、MAP(多比对程序)、
MBLKP、MBLKN、PIMA(模式诱导的多序列比对)、SAGA(遗传算法的序列比对)和WHAT-IF。
这些比对程序还可以被用于筛选基因组数据库,以识别具有基本上同一的序列的多核苷
酸序列。许多基因组数据库是可获得的,例如,人基因组的大部分都可以在人基因组测序
项目(Gibbs,1995)中获得。一些基因组已被测序,例如,生殖道支原体(M.Genitalium)
(Fraser等,1995)、甲烷球菌(M.Jannaschii)(Bult等,1996)、流感嗜血菌(H.Influenzae)(Fleischmann等,1995)、大肠杆菌(Blattner等,1997)、和酵母(啤酒酵母)(Mewes等,
1997)、以及黑腹果蝇(D.Melanogaster)(Adams等,2000)。对于模型生物测序同样已有了
显著进步,例如小鼠,秀丽线虫(C.elegans),以及十字花科(Arabadopsis sp.)。带有一些功能信息注解的基因组信息的数据库由不同组织进行维护,并通过登录因特网进行获得。 [0318] 还 使 用 了BLAST、BLAST 2.0和 BLAST 2.2.2算 法。 其 描 述 于,例 如,
Altschul(1977)Nuc.Acids Res.25:3389-3402;Altschul(1990)J.Mol.Biol.215:
403-410。进行BLAST分析的软件可以通过美国国家生物技术信息中心获得。该算法涉及
首先通过在查询序列中识别长度W的短字符来识别高分值序列对(HSP),当其与序列数据
库相同长度字符对齐后,其匹配或满足某些正向值分数T。T表示临近字符分数阀值(如
上Altschul(1990))。这些初始命中临近字符作为种子用于启动搜索,以发现含有它们的更长的HSP。命中字符沿着每条序列的两个方向进行延伸,只要累积比对值增加则延伸继续进行。对于核苷酸序列的累积分值使用参数M(对于一对匹配残基的回报分值;恒>0)进行
计算。对于氨基酸序列,采用评分矩阵计算累积分值。命中字符沿着两个方向进行延伸的
终止条件为:累积比对分值从其获得的最大值下降数值X;由于一个或更多的负分值残基
比对的积累,累积分值降至0或小于0;或到达任何一个序列的末端。BLAST算法参数W、T、和X决定了比对的敏感度和速度。BLASTN程序(用于核苷酸序列)使用缺省字长(W)11,期
望值(E)10,M=5,N=-4和双链比对。对于氨基酸序列,BLASTP程序使用缺省字长3,期
望值(E)10,以及BLOSUM62评分矩阵(参见Henikoff和Henikoff(1989)Proc.Natl.Acad.
Sci.USA 89:10915)比对(B)50,期望值(E)10,M=5,N=-4,和双链比对。BLAST算法还进行两条序列间相似度的统计分析(参见例如,Karlin和Altschul(1993)Proc.Natl.Acad.
Sci.USA 90:5873)。BLAST算法提供的计算相似度的方法是最小总数概率(P(N)),其提供
了两条核苷酸或氨基酸序列间偶然发生匹配的概率。例如,如果待测核酸与参比核酸进行
比对得到的最小总数概率小于约0.2,或可选 的小于约0.01,或可选的小于约0.001,那么该核酸被认为是与参比序列相似。
[0319] 一方面,使用基本局部比对搜索工具(“BLAST”)评价了蛋白和核酸序列的同源性。例如,5种特异性BLAST程序可以被用于执行以下任务:(1)BLASTP和BLAST3将氨基酸
查询序列与蛋白序列数据库进行比对;(2)BLASTN将核苷酸查询序列与核苷酸序列数据库
进行比对;(3)BLASTX将查询核苷酸序列(双链)的6种读框概念上的翻译产物与蛋白序列
数据库进行比对;(4)TBLASTN将查询蛋白序列与全部6种读框翻译的核苷酸序列(双链)
数据库进行比对;以及,(5)TBLASTX将核苷酸查询序列的6种读框翻译与核苷酸序列数据
库的6种读框翻译进行比对。
[0320] 一方面,BLAST程序通过识别相似片段来识别同源序列,其在本发明中被称为查询氨基酸或核酸序列和可选的来自蛋白或核酸序列数据库的测试序列间的“高分值片段
对”。高分值片段对可选地可以通过评分矩阵进行识别(即比对),其很多是本领域已知
的。一方面,所用的评分矩阵是BLOSUM62矩阵(Gonnet等,Science 256:1443-1445,1992;
Henikoff和Henikoff,Proteins 17:49-61,1993)。一方面,也可以采用PAM或PAM250
矩阵(参见,例如,Schwartz和Dayhoff,eds.,1978,Matrices for Detecting Distance Relationships:Atlas of Protein Sequence and Structure,Washington:National
Biomedical Research Foundation)。
[0321] 一方面,为了测定核酸是否具有本发明提供的范围所要求的序列同一性,使用了NCBI BLAST 2.2.2程序,采用缺省设置进行blastp。BLAST2.2.2程序共有约38个设置选
项。在本发明提供的该示例性的方面中,使用全部缺省值,除了缺省过滤设定(即,全部参数设定为缺省,除了过滤设定 为OFF);在该处采用“-F F”设定,其中取消了过滤。由于是短序列,因此缺省的过滤设定经常导致Karlin-Altschul错误。
[0322] 本发明提供的该示例性的方面中使用的缺省值包括:
[0323] “低复杂度过滤:ON
[0324] 字长:3
[0325] 矩阵:Blosum62
[0326] 缺口成本:存在:11
[0327] 延伸:1”
[0328] 其它缺省设定为:低复杂度过滤OFF,用于蛋白的字长3,BLOSUM62矩阵,缺口存在惩罚-11和缺口延伸惩罚-1。一方面,“-W”选项缺省为0。这表示如果不设定的话,用于蛋白的字长缺省为3,用于核苷酸的为11。
[0329] 计算机系统和计算机程序产品
[0330] 为了在计算机中(in silico)检测和确定序列同一性、结构同源性、基序等,本发明提供的序列可以被储存、记录以及操作于任何介质中,其可以通过计算机进行阅读和获取。在一些实施方式中,本发明提供了计算机、计算机系统、计算机可读介质、计算机程序产品等等,其中含有(包含)本发明提供的核酸和多肽序列,后者在其中记录或储存。本发明
使用的词语“记录”和“储存”表示在计算机介质上储存信息的过程。本领域技术人员能够很容易的采用任何已知方法来在计算机可读介质上记录信息,以产生包含本发明提供的一
种或更多的核酸和/或多肽序列的产品。
[0331] 本发明提供的另一个方面是计算机可读介质,其中记录有本发明提供的至少一种核酸和/或多肽序列。计算机可读介质包括磁性可读介质、光学可读介质、电学可读介质和磁/电介质。例如,计算机可读载体可以是硬盘、软 盘、磁带、光盘、数字多功能磁盘(DVD)、随机存取存储器(RAM)、或只读存储器(ROM)以及本领域技术人员公知的其它类型的其它
介质。
[0332] 本发明提供的方面包括系统(例如,基于因特网的系统),特别是计算机系统,其储存并操作本发明描述的序列和序列信息。计算机系统100的一个示例见于图1的框图
中。本发明使用的“计算机系统”表示硬件部分、软件部分、和数据储存部分,用于分析本发明提供的核苷酸或多肽序列。计算机系统100可以包括用于加工、存取和操作序列数据的
处理器。处理器105可以是任何公知类型的中央处理单元,例如,Intel公司的奔腾III,或来自Sun、Motorola、Compaq、AMD或IBM的类似处理器。计算机系统100是一种通用目的
的系统,其包括处理器105和用以存储数据的一种或更多内置数据存储装置110,以及用以
读取存储在数据存储装置中数据的一种或更多数据读取装置。本领域技术人员可以很容易
地理解任何一种目前可获得的计算机系统都是合适的。
[0333] 一方面,计算机系统100包括连接于总线的处理器105,其连接于主存储器115(可选的使用RAM)和一种或更多内置数据存储装置110,例如硬盘驱动器和/或其它记录数据
的计算机可读介质。计算机系统100可以进一步包括一种或更多数据读取装置118,用以
读取存储在内置数据存储装置110中的数据。数据读取装置118可以表示,例如,软盘驱动
器、光盘驱动器、磁带驱动器、或能够连接远程数据存储系统的调制解调器(例如,通过因特网)等。在一些实施方式中,内置数据存储装置110是可移动的计算机可读介质,例如含
有控制逻辑和/或数据记录的软盘、光盘、磁带等。计算机系统100可以更优选地包括合适
的软件或被该软件程序化,用于当插入数据读取装置时从数据存储装置读取控制逻辑和/
或数据。计算机系统100包括显示器 120,其用于对计算机用户显示输出。还应当注意计
算机系统100可以在网络或大面积网络中连接至其它计算机系统125a-c,以提供对计算机
系统100的集中存取。用于存取和处理本发明提供的核苷酸或氨基酸序列的软件在执行时
可以位于主存储器115。在一些方面,计算机系统100可以进一步包括序列比对算法,用于
比对本发明提供的核酸序列。算法和序列可以储存于计算机可读介质。“序列比对算法”表示一种或更多应用于(本地或远程地)计算机系统100的程序,其用于将核苷酸序列与以
数据存储方式储存的其它核苷酸序列和/或化合物进行比对。例如,序列比对算法可以将
本发明提供的存储于计算机可读介质的核苷酸序列与存储于计算机可读介质的参比序列
进行比对以识别同源性或结构基序。
[0334] 上述算法所用参数可以根据研究的序列长度和同源性程度进行调整。在一些方面,参数可以是不含使用者指令的缺省参数。图2是说明程序200的一个方面的流程图,
其中将新核苷酸或蛋白序列与序列数据库进行比对,以确定新序列与序列数据库同源性
水平。序列数据库可以是一种储存于计算机系统100的私人数据库,或公共数据库例如
GENEBANK,其整个可从互联网获得。程序200开始于起始状态201,然后移动至状态202,其中需要比对的新序列储存于计算机系统100的存储器中。如上所述,存储器可以是任何类
型的存储器,包括RAM或内置存储装置。然后程序200移动至状态204,其中序列数据库被
打开用于分析和比对。然后程序200移动至状态206,其中存储于数据库的第一序列被读
取至计算机存储器中。然后在状态210下进行比对以确定第一序列是否与第二序列相同。
一定要注意该步骤并不限于对新序列和数据库中的第一序列进行精确比对。用于比对两种
核苷酸或蛋白序列的公知方法是本领域技术人员已知的,虽然其不是完全相同的。 例如,可以将缺口引入一种序列中以提高两条待测序列的同源性水平。在比对过程中控制缺口或
其它特征是否被引入序列的参数通常由计算机系统用户输入。一旦两个序列的比对已经在
状态210下执行完毕,即在判定状态210下进行确定两条序列是否相同。当然,术语“相同”并不限于绝对相同的序列。在用户输入的同源性参数范围内的序列都在程序200中被标记
为“相同”。如果判定两个序列相同,则程序200移动至状态214,其中数据库的序列名称显示给用户。该状态提醒用户具有所示名称的序列符合输入的同源性限制。一旦将储存的序
列名称显示给用户,程序200移动至判定状态218,其中进行判定是否更多序列存在于数据
库中。如果没有更多序列存在于数据库中,那么程序200终止于终止状态220。然而,如果
更多序列的确存在于数据库中,那么程序200移动至状态224,其中指针移动至数据库的下
一序列从而其可以与新序列进行比对。在该方式中,新序列与数据库中的序列进行比对和
比较。应注意如果在判定状态212中已经判断序列并不同源,那么程序200将立即移动至
判定状态218以确定数据库中是否存在任何其它序列用以比对。因此,本发明提供的一个
方面是包括处理器、储存有本发明提供的核酸序列的数据存储装置和用于进行比对的序列
比对器的计算机系统。序列比对器可显示所比对序列的同源性水平或所识别的结构基序,
或其可以在序列中识别结构基序,其被用于与这些核酸编码或多肽编码进行比对。图3是
描述计算机中的程序250的实施方式的流程图,其中测定两个序列是否是同源的。程序250
开始于起始状态252,然后移动至状态254,其中要比对的第一序列储存于存储器。然后要
比对的第二序列在状态256下储存于存储器。然后程序250移动至状态260,其中读取第一
序列的首字符,然后移动至状态262,其中读取第二序列的首字符。应当理解如果序列是核苷酸序 列,那么字符通常应当是A、T、C、G或U。如果序列是蛋白序列,那么其可以是一种单字母氨基酸编码,从而第一和第二序列可以很容易比对。然后在判定状态264进行判断
两个字符是否相同。如果它们是相同的,那么程序250移动至状态268,其中读取第一和第
二序列的下一字符。然后判断下一字符是否相同。如果它们是相同的,那么程序250继续
该循环直至两个字符不相同。如果判定下两个字符不相同,程序250移动至判定状态274
以确定在任一序列中是否还有更多字符需要读取。如果没有更多字符需要读取,那么程序
250移动至状态276,其中第一和第二序列的同源性水平被显示给用户。同源性水平通过计
算序列中的相同字符占第一序列总数的比例来进行判定。因此,如果前100比对的核苷酸
序列的每个字符都能与第二序列中的每个字符对应,那么同源性水平将是100%。
[0335] 可选地,计算机程序可以将参比序列与本发明提供的序列进行比对以判断两序列是否在一种或更多位点不同。程序能够记录对于参比序列或本发明提供的序列而言插入、
缺失或取代的核苷酸或氨基酸残基的长度和同一性。计算机程序可以是一种程序,其判断
参比序列对于本发明提供的序列是否含有单核苷酸多态性(SNP),或者,本发明提供的序列是否包括已知序列的SNP。因此,在一些方面,计算机程序是识别SNP的程序。该方法可以
应用于上述计算机系统以及图3描述的方法。该方法可以通过使用计算机程序读取本发明
提供的序列和参比序列和使用计算机程序识别差别度。
[0336] 在其它方面计算机系统包括用于识别本发明提供的核酸或多肽的特征的识别器。“识别器”表示一种或更多程序,其识别核酸序列的某些特征。例如,识别器可以包括识别核酸序列的开放式阅读框(ORF)的程序。图4是说明用于检测是否存在序列特征的识别器程
序300一个方面的流程图。程序 300开始于起始状态302,然后移动至状态304,其中待检
测特征的第一序列储存于计算机系统100的存储器115中。然后程序300移动至状态306,
其中打开序列数据库特征。该数据库包括带有特征名称的一系列特征属性。例如,特征名
称可以是“起始密码子”且属性可以是“ATG”。另一个例子是特征名称“TAATAA盒”且属性是“TAATAA”。该数据库的一个示例是由University of Wisconsin Genetics Computer
Group生成的。可选地,特征可以是结构多肽基序例如α螺旋、β折叠、或功能性多肽基序例如酶活性位点、螺旋-转角-螺旋基序或本领域技术人员已知的其它基序。一旦在状态
306下打开特征数据库,即将程序300移动至状态308,其中从数据库中读取第一特征。然
后在状态310下比对第一特征的属性与第一序列。然后在判定状态316下进行判断在第一
序列中是否发现特征的属性。如果发现该属性,那么程序300移动至状态318,其中所发现
的特征名称显示给用户。程序300然后移动至判定状态320,其中进行判断数据库是否存在
更多的特征。如果没有更多特征存在,然后程序300终止于终止状态324。然而,如果更多
特征存在于数据库,那么程序300在状态326下读取下一序列特征并返回循环的状态310,
其中将下一特征的属性与第一序列进行比对。如果在判定状态316下在第一序列中没有发
现特征属性,程序300直接移动至判定状态320,以判断是否任何更多特征存在于数据库。
从而,一方面,计算机程序识别开放式阅读框(ORF)。
[0337] 本发明提供的多肽或核酸序列可以多种格式储存和操作于多种数据处理器程序。例如,序列可以用文字处理文件储存为文本,例如MICROSOFTWORDTM或WORDPERFECTTM
或在本领域技术人员熟悉的多种数据库程序中作为ASCII文件,例如DB2、SYBASE、
或ORACLETM。另 外,很多计算机程序和数据库可以被用作序列比对算法、识别器、或
参比核苷酸序列或多肽序列的来源用于比对本发明提供的核酸序列。程序和数据库
TM TM
可 以 包 括:MACPATTERN (EMBL)、DISCOVERYBASE (Molecular Applications Group)、
TM TM
GENEMINE (Molecular Applications Group)、LOOK (Molecular Applications
TM
Group)、MACLOOK (Molecular Applications Group)、BLAST 和 BLAST2(NCBI)、
BLASTN 和 BLASTX(Altschul 等,J.Mol.Biol.215:403,1990)、FASTA(Pearson 和
TM
Lipman,Proc.Natl.Acad.Sci.USA,85:2444,1988)、FASTDB (Brutlag 等,Comp.App.
TM
Biosci.6:237-245,1990)、CATALYST (Molecular Simulations Inc.)、CATALYSTTM/
TM TM
SHAPE (Molecular Simulations Inc.)、CERIUS2.DBACCESS (Molecular Simulations
TM
Inc.)、HYPOGEN (Molecular Simulations Inc.)、Insight II(Molecular Simulations
TM TM
Inc.)、DISCOVER (Molecular Simulations Inc.)、CHARMm (Molecular Simulations
TM TM
Inc.)、FELIX (Molecular Simulations Inc.)、DELPHI s(Molecular Simulations
TM TM
Inc.)、QUANTEMM 、(Molecular Simulations Inc.)、HOMOLOGY (Molecular Simulations TM TM
Inc.)、MODELER (Molecular Simulations Inc.)、ISIS (Molecular Simulations
TM
Inc.)、Quanta/Protein Design(Molecular Simulations Inc.)、WEBLAB (Molecular
TM
Simulations Inc.)、WEBLAB Diversity Explorer(Molecular Simulations Inc.)、GENE TM TM
EXPLORER (Molecular Simulations Inc.)、SEQFOLD (Molecular Simulations Inc.)、MDL Available Chemicals Directory数据库、MDL Drug Data Report数据库、Comprehensive Medicinal Chemistry数据库、Derwent’sWorld Drug Index数据库、BioByteMasterFile
数据库、Genbank数据库、以及 Genseqn数据库。在本发明公开的内容下很多其它程序和数据库对于本领域技术人员而言将是显而易见的。
[0338] 可以使用上述程序进行检测的基序包括编码亮氨酸拉链、螺旋-转角-螺旋基序、糖基化位点、泛素化位点、α螺旋和β折叠的序列,引导编码蛋白质分泌的信号肽编码序
列,涉及转录调控的序列如同源异形盒、酸性延伸、酶活性位点、底物结合位点、和酶裂解位点的序列。
[0339] 核酸杂交
[0340] 在一些实施方式中,本发明提供了分离的、合成的或重组的核酸,其在严格条件下与本发明提供的核酸杂交,例如,本发明提供的示例性序列,例如,如SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ IDNO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:22或SEQ ID NO:23所示的序列,或经修饰的SEQ ID NO:1,其编码1、2、3、4、5、6、7、8或更多(几个)或全部碱基的变化,如表3、表4、表9、表10、表11、表16或表23所示,或其等价物,以及子序列及其互补序列,或编码本发明提供的多肽的核酸。严格条件可以是高严格条件、中严格条件、低严格条件,包括本发明描述的升高的或降低的严格条件。
[0341] “杂交”表示核酸链通过碱基配对结合互补链的过程。杂交反应可以是敏感和选择性的,从而可以从样品中识别特定的感兴趣的序列,即使其浓度很低。严格条件可以由以下条件定义,例如,预杂交和杂交液中的盐和甲酰胺浓度、或杂交温度,其是本领域公知的。例如,严格度可以通过降低盐浓度、增加甲酰胺浓度或升高杂交温度、改变杂交时间来提高,如下详述。在 可选的方面,本发明提供的核酸由其在各种严格条件(例如,高、中、和低)下杂交的能力进行定义,如本发明所示。
[0342] 在可选的实施方式中,按照严格条件下杂交的能力进行定义的本发明提供的核酸可以是本发明提供的核酸的约5个残基至全长;例如,其可以是至少5、10、15、20、25、
30、35、40、50、55、60、65、70、75、80、90、100、150、200、250、300、350、400、450、500、550、600、
650、700、750、800、850、900、950、1000、或更多残基长度。还包括比全长短的核酸。这些核酸可以用作,例如,杂交探针、标记探针、PCR寡核苷酸探针、iRNA、反义序列,或编码抗体结合肽(表位)、基序、活性位点等的序列。
[0343] 一方面,本发明提供的核酸由其在高严格条件下杂交的能力进行定义,包括条件为约50%甲酰胺、约37℃至42℃。一方面,本发明提供的核酸由其在降低的严格条件下杂
交的能力进行定义,包括条件为约35%至25%甲酰胺、约30℃至35℃。
[0344] 可选地,本发明提供的核酸由其在高严格条件下杂交的能力进行定义,包括条件为42℃下,50%甲酰胺、5×SSPE、0.3%SDS、以及重复序列阻断核酸例如cot-1或鲑精
DNA(例如,200ug/ml剪切和变性的鲑精DNA)。一方面,本发明提供的核酸由其在降低的严
格条件下杂交的能力进行定义,包括35%甲酰胺和在降低的35℃的温度下。
[0345] 杂交后,滤纸可以在50℃下用6×SSC、0.5%SDS洗涤。这些条件在高于25%甲酰胺时被认为是“温和”条件,在低于25%甲酰胺时为“低严格”条件。“温和”杂交条件的具体例子是于30%甲酰胺下进行上述杂交。“低严格”杂交条件的具体例子是于10%甲酰胺
下进行上述杂交。
[0346] 特定严格水平对应的温度范围可以通过计算感兴趣的核酸的嘌呤嘧啶比来进一步缩小,并据此调节温度。本发明提供的核酸还由其在如Ausubel和Sambrook所示的高、
中、和低严格条件下杂交的能力进行定义。上述范围和条件的变化是本领域公知的。杂交
条件进一步讨论如下。
[0347] 可以对上述过程进行改变以识别相对于探针序列具有降低同源性水平的核酸。例如,为获得相对于检测探针具有降低同源性的核酸,可以使用较低的严格条件。例如,在具+
有Na 浓度约1M的杂交缓冲液中,杂交温度可以以5℃的梯度从68℃降低至42℃。杂交后,
滤纸可以在杂交温度下用2×SSC,0.5%SDS洗涤。这些条件在高于50℃时被认为是“温
和”条件,在低于50℃时是“低严格”条件。“温和”杂交条件的具体例子是于55℃进行上述杂交。“低严格”杂交条件的具体例子是于45℃进行上述杂交。
[0348] 可选地,杂交可以是在42℃温度下在缓冲液中进行,例如含有甲酰胺的6×SSC。在这种情况下,杂交缓冲液的甲酰胺浓度可以以5%的梯度从50%降低至0%,以识别相对
于探针具有降低同源性水平的克隆。杂交后,滤纸可以用6×SSC,0.5%SDS在50℃下洗
涤。这些条件在高于25%甲酰胺下被认为是“温和”条件,低于25%甲酰胺时是“低严格”条件。“温和”杂交条件的具体例子是于30%甲酰胺下进行上述杂交。“低严格”杂交条件的具体例子是于10%甲酰胺下进行上述杂交。
[0349] 然而,杂交形式的选择并非最关键的,洗涤条件的严格度才能决定核酸是否属于本发明提供的范围。用于识别核酸是否属于本发明提供的范围的洗涤条件包括,例如:在
pH 7和至少约50℃或约55℃至约60℃的温度下,盐浓度约0.02摩尔;或在72℃下约15分
钟,盐浓度约0.15M NaCl;或在至少约50℃或约55℃至约60℃温度下,盐浓度约0.2×SSC
中洗涤约15 至约20分钟;或杂交复合物用盐浓度约2×SSC且含有0.1%SDS的溶液室温
下洗涤两次,各15分钟,然后用0.1×SSC含有0.1%SDS的溶液在68℃洗涤两次,各15分
钟;或等价条件。参见Sambrook、Tijssen和Ausubel对于SSC缓冲液和等价条件的描述。
[0350] 这些方法可用于分离本发明提供的核酸。
[0351] 寡核苷酸探针及其使用方法
[0352] 在一些实施方式中,本发明提供了核酸探针用于识别编码具有水解酶活性(例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性)的多肽的核酸。一方面,探针包括本发明提供的核酸的至少10个连续碱基。可选地,本发明提供的探针可以是至少约5、6、7、8、9、10、
15、20、25、30、35、40、45、50、60、70、80、90、100、110、120、130、150、160、170、180、190、200或更多,或约10至50、约20至60、约30至70个本发明提供的核酸序列的连续碱基。探针通
过结合和/或杂交识别核酸。探针可被用于本发明提供的阵列,参见下文讨论,包括例如毛细管阵列。本发明提供的探针还可以被用于分离其它核酸或多肽。
[0353] 本发明提供的探针可以被用于测定生物样品(例如土壤样品)是否含有包含本发明提供的核酸序列(例如水解酶-编码核酸)的生物体或从中可以得到该核酸的生物体。
在该过程中,得到了潜在地含有可从其中分离出核酸的生物体的生物样品以及从样品中得
到了核酸。将核酸与探针在一定条件下接触,该条件允许探针特异性杂交至样品中存在的
任何互补序列。如果需要的话,允许探针特异性杂交至互补序列的条件可以通过将探针与
已知含有互补序列的样品中的互补序列以及不含互补序列的对照序列接触进行测定。可以
改变杂交条件,例如杂交缓冲液的盐浓度、杂交缓冲液的甲酰胺浓度、或杂交温 度,以识别允许探针特异性杂交至互补核酸的条件(参见特异性杂交条件的讨论)。
[0354] 如果样品含有可以从其中分离出核酸的生物体,则检测探针的特异性杂交。杂交可以通过用可检测试剂标记探针进行检测,例如具有放射性同位素、荧光染料或能够催化
形成可检测产物的酶。用于标记探针以检测样品中是否存在互补核酸的很多方法都是本领
域技术人员熟知的。其包括Southern印迹、Northern印迹、菌落杂交程序、以及斑点印迹。
这些方法的规程公开于Ausubel和Sambrook。
[0355] 可选地,在扩增反应中可以使用多于一种探针(至少一种能够特异性杂交至核酸样品中的任何互补序列)以判断样品是否包含含有本发明提供的核酸序列的生物体(例
如,可从中分离出核酸的生物体)。一方面,探针包括寡核苷酸。一方面,扩增反应可以包括PCR反应。PCR规程描述于Ausubel和Sambrook(参见扩增反应的讨论)。在该过程中,将
样品中的核酸与探针接触,进行扩增反应,并检测任何得到的扩增产物。扩增产物可以通过进行反应产物的凝胶电泳并使用例如溴乙啶的嵌入剂来染色凝胶进行检测。可选地,可以
用放射性同位素标记一种或更多的探针且可以在凝胶电泳后通过放射自显影术检测放射
性扩增产物的存在。
[0356] 源自本发明提供的核酸序列的近3’或5’端序列的探针还可以用于染色体步移过程,以识别含有另外的例如基因组序列的克隆。该方法允许从宿主生物体中分离编码另外
的感兴趣的蛋白的基因。
[0357] 一方面,本发明提供的核酸序列被用作探针以识别和分离相关核酸。在一些方面,如上识别的相关核酸可以是来自生物体的cDNA或基因组DNA,所述生物体不同于本发明提供的核酸被首次分离的来源。在该过程 中,将核酸样品与探针在一定条件下接触,该条件允许探针特异性杂交至相关序列。然后使用任何上述方法检测探针杂交至相关生物体的核
酸。
[0358] 在核酸杂交反应中,根据被杂交核酸的性质,用于获得特定严格水平的条件将有所不同。例如,可以在选择杂交条件时考虑核酸杂交区域的长度、互补程度、核苷酸序列组成(例如,GC或AT含量)、和核酸类型(例如,RNA或DNA)。另外的考虑是核酸之一是否被固
定在例如滤纸上。杂交可以进行的条件为低严格、中严格或高严格。作为核酸杂交的示例,含有被固定的变性核酸的聚合物膜首先在45℃下、含有0.9M NaCl、50mM NaH2PO4、pH 7.0、
5.0mM Na2EDTA、0.5%SDS、10×Denhardt试剂、以及0.5mg/ml多核糖腺苷酸的溶液中预杂
7 8 32
交30分钟。然后将约2×10cpm(比活性4-9×10cpm/ug)的 P末端标记的寡核苷酸探针加
至溶液中。12-16小时的孵育后,将膜在室温(RT)下含有0.5%SDS的1×SET(150mM NaCl、
20mM Tris盐酸、pH 7.8,1mM Na2EDTA)中洗涤30分钟,然后在寡核苷酸探针的Tm-10℃温
度下在新鲜的1×SET中洗涤30分钟。然后将膜露置于放射自显影膜以检测杂交信号。
[0359] 通过改变杂交条件的严格性以识别核酸,例如杂交至可探测探针的cDNA或基因组DNA,可以识别和分离与探针具有不同同源性水平的核酸。严格性可以通过在探
针融解温度之下的不同温度进行杂交发生改变。融解温度,Tm,是50%的靶标序列杂
交至优选的互补探针的温度(在给定的离子强度和pH下)。非常严格条件被选择为
等于特别的探针的Tm或低于约5℃。探针的融解温度可以是使用以下示例性的公式
进行计算。对于14到70核苷酸长度的探针而言,融解温度(Tm)使用以下公式进行
计算:Tm=81.5+16.6(log[Na+])+0.41(G+C分数)-(600/N),其中N是探针长度。如
果 在含有甲酰胺的溶液中进行杂交,融解温度可以使用以下公式进行计算:Tm=
81.5+16.6(log[Na+])+0.41(G+C分数)-(0.63%甲酰胺)-(600/N),其中N是探针长度。
预杂交可以在6×SSC、5×Denhardt试剂、0.5%SDS、100μg鲑精DNA变性片段或6×SSC、
5×Denhardt试剂、0.5%SDS、100μg鲑精DNA变性片段、50%甲酰胺中进行。SSC和
Denhardt试剂和其它溶液的配方见于例如Sambrook。
[0360] 一方面,通过将可检测探针添加至上述预杂交液进行杂交。其中探针包括双链DNA,其在添加前进行变性。将滤纸与杂交液接触足够量的时间,以允许探针杂交至含有其互补序列或同源序列的cDNA或基因组DNA上。对于长度超过200核苷酸的探针而言,杂交
可以在Tm以下15-25℃下进行。对于更短的探针,例如寡核苷酸探针,杂交可以在Tm以下
5-10℃下进行。一方面,在6×SSC中的杂交在约68℃下进行。一方面,在含有50%甲酰胺
溶液中的杂交在约42℃下进行。所有前述杂交在高严格条件下进行。
[0361] 一方面,杂交后,洗涤滤纸以去除任何非特异性结合的可探测探针。用于洗涤滤纸的严格性也可以根据所杂交核酸的性质、核酸杂交的长度、互补程度、核苷酸序列组成(例如,GC或AT含量)、和核酸类型(例如,RNA或DNA)而改变。逐渐增高的严格条件洗涤的示例如下:2×SSC、0.1%SDS室温下15分钟(低严格);0.1×SSC,0.5%SDS室温下30分
钟至1小时(中严格);0.1×SSC,0.5%SDS在杂交温度和68℃之间的温度下15至30分
钟(高严格);以及0.15M NaCl 72℃下15分钟(极高严格)。最终的低严格洗涤可以在
0.1×SSC室温下进行。上述示例仅仅是对可以被用于洗涤滤纸的一组条件进行的说明。本
领域技术人员知晓还有为数众多的不同严格性的洗涤方法。
[0362] 杂交至探针的核酸可以通过溴乙啶或其它常规技术进行识别。可以对上述过程进行修饰以识别相对于探针序列具有降低同源性水平的核酸。例如,为获得相对于检测探针
+
具有降低同源性的核酸,可以使用较低的严格条件。例如,在具有Na 浓度约1M的杂交缓
冲液中,杂交温度可以以5℃的梯度从68℃降低至42℃。杂交后,滤纸可以在杂交温度下
用2×SSC,0.5%SDS洗涤。这些条件在高于50℃时被认为是“温和”条件,在低于50℃时
是“低严格”条件。“温和”杂交条件的例子是于55℃进行上述杂交。“低严格”杂交条件的例子是于45℃进行上述杂交。
[0363] 可选地,杂交可以是在42℃温度下在缓冲液(例如含有甲酰胺的6×SSC)中进行。在这种情况下,杂交缓冲液的甲酰胺浓度可以以5%的梯度从50%降低至0%,以识别相对
于探针具有降低同源性水平的克隆。杂交后,滤纸可以用6×SSC,0.5%SDS在50℃下洗涤。
这些条件在高于25%甲酰胺时被认为是“温和”条件,在低于25%甲酰胺时是“低严格”条件。“温和”杂交条件的具体例子是于30%甲酰胺下进行上述杂交。“低严格”杂交条件的具体例子是于10%甲酰胺下进行上述杂交。
[0364] 这些本发明提供的探针和方法可以被用于分离或识别(例如,使用阵列)核酸,其序列相对于本发明提供的包含至少约10、15、20、25、30、35、40、50、75、100、150、200、250、
300、350、400、500、550、600、650、700、750、800、850、900、950、1000、或其更多连续碱基的核酸序列及其互补序列而言,具有至少约50%、51%、52%、53%、54%、55%、56%、57%、
58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、
73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、
88%、 89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或更高的序列同一性。如本发明所述,同源性可以使用比对算法进行测算。例如,同源多核苷酸可以具有本发明描述的编码序列之一的天然存在的等位变体的编码序列。该等位变体相对于本发明提供
的核酸可以具有一种或更多核苷酸的取代、缺失或添加。
[0365] 另外,本发明提供的探针和方法可用于分离或识别(例如,使用阵列)核酸,如使用序列比对算法(例如FASTA 3.0t78算法采用缺省参数,或BLAST2.2.2程序采用本发明
所述的示例性的设置)所确定的,该核酸编码的多肽相对于本发明提供的包含至少5、10、
15、20、25、30、35、40、50、75、100、或150或更多连续氨基酸的多肽而言具有至少约50%、
51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、
66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、
81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、
96%、97%、98%、99%、或更高的序列同一性(同源性)。
[0366] 水解酶的表达抑制
[0367] 在一些实施方式中,本发明提供了与本发明提供的核酸序列(例如水解酶-编码序列)互补的核酸(例如反义序列)。反义序列能够抑制水解酶-编码基因的转运、剪接或
转录。抑制可以通过靶向基因组DNA或信使RNA实现。抑制可以通过使用包含本发明提供
的序列的DNA(例如抑制性核酶)或RNA(例如双链iRNA)实现。靶标核酸的转录或功能可
以通过例如杂交和/或裂解被抑制。本发明提供了一组抑制剂,包括能够结合水解酶基因
和/或信息的寡核苷酸,在任一情况下均能防止或抑制水解酶的生成或功能。可以通过 序
列特异性杂交来进行结合。另一组有用的抑制剂包括导致水解酶信息失活或裂解的寡核苷
酸。寡核苷酸可以具有导致该裂解的酶活性,例如核酶。寡核苷酸可以是化学修饰的或被
偶联至能够裂解互补核酸的酶或组合物。可以筛选含有很多不同此类寡核苷酸的库得到那
些具有所需活性的寡核苷酸。
[0368] 反义寡核苷酸
[0369] 在一些实施方式中,本发明提供了反义寡核苷酸,其能够结合水解酶信息并通过靶向mRNA或基因组DNA抑制水解酶活性。设计反义寡核苷酸的策略在科技和专利文献中已
有详细描述,且本领域技术人员能够使用本发明提供的新试剂来设计该水解酶寡核苷酸。
例如,用于筛选有效的反义寡核苷酸的基因步移法/RNA定位(RNA mapping)法是本领域
公知的,参见例如Ho(2000)Methods Enzymol.314:168-183,其描述RNA定位分析,该分析基于标准分子技术以提供简单可靠的选择潜在反义序列的方法。还参见Smith(2000)Eur.
J.Pharm.Sci.11:191-198。
[0370] 一方面,将重组生成的、或经分离的天然存在的核酸用作反义寡核苷酸。反义寡核苷酸可以是任何长度;例如,在可选的方面,反义寡核苷酸的长度为约5至100、约10至
80、约15至60、约18至40。反义寡核苷酸可以是单链或双链RNA或DNA。最佳长度可以
通过常规筛选进行测定。反义寡核苷酸可以以任何浓度存在。最佳浓度可以通过常规筛
选进行测定。各种各样的合成的、非天然存在的核苷酸和核酸类似物是已知的,其可以解
决该潜在问题。例如,可以使用含有非离子骨架例如N-(2-氨基乙基)甘氨酸单元的肽核
酸(PNA)。也可以使用具有硫代磷酸酯连接的反义寡核苷酸,如描述于WO 97/03211;WO
96/39154;Mata(1997)Toxicol Appl Pharmacol144:189-197;Antisense Therapeutics,ed.Agrawal(Humana Press,Totowa, N.J.,1996)。本发明提供了具有合成DNA骨架类似物的反义寡核苷酸,其还可以包括二硫代磷酸、甲基磷酸酯、氨基磷酸酯、烷基磷酸三酯、氨基磺酸、3’-硫缩、亚甲基(甲亚氨基)、3’-N-氨基甲酸酯、以及吗啉基氨基甲酸酯核酸,如上所述。
[0371] 可以使用组合化学法制备大量寡核苷酸,其可以被快速筛选得到对任何靶标具有合适的结合亲和性和特异性的特定寡核苷酸,例如本发明提供的正义和反义水解酶序列
(参见,例如,Gold(1995)J.of Biol.Chem.270:13581-13584)。
[0372] 抑制性核酶
[0373] 在一些实施方式中,本发明提供了能够结合水解酶信息的核酶,其可以通过靶向mRNA抑制水解酶活性。设计核酶和选择用于靶向的水解酶-特异性反义序列的策略在科技
和专利文献中已有详细描述,且本领域技术人员能够使用本发明提供的新型试剂来设计该
核酶。核酶通过其靶标RNA结合部分结合至靶标RNA,结合部分紧邻能裂解靶标RNA的RNA
酶活性部分,从而发挥作用。由此,核酶通过互补碱基配对识别并结合靶标RNA,且一旦结合至正确位点,即进行酶催化裂解和灭活靶标RNA。如果裂解发生于编码序列中,那么以该方式进行的靶标RNA裂解能够破坏其引导合成编码蛋白的能力。当核酶结合并裂解其RNA靶
标后,其一般从RNA上进行释放并从而重新结合和裂解新的靶标。
[0374] 在一些情况下,核酶的酶学性质相对于其它技术例如反义技术(其中核酸分子简单地结合至核酸靶标以阻断其转录、翻译或与另一分子结合)可以是有优势的,因为实现
治疗所需要的有效核酶浓度可以比反义寡核苷酸的低。该潜在优势反映了核酶进行酶催化
的能力。因此,单个核酶分子能够裂解很 多靶标RNA的分子。另外,核酶一般是高特异性的抑制剂,其抑制特异性不仅取决于结合的碱基配对机制,还取决于该分子抑制其结合的RNA表达的机制。即抑制是由RNA靶标的裂解导致的,因此,特异性定义为靶标RNA裂解速率与
非靶标RNA裂解速率之间的比率。该裂解机制依赖于除涉及碱基配对之外的因素。因此,
核酶的特异性表现可以比反义寡核苷酸结合相同RNA位点更显著。
[0375] 酶活性核酶RNA分子可以形成锤头状基序,还可以形成发夹状、丁型肝炎病毒、I组内含子或RNA酶P-样RNA(与RNA引导序列结合)基序。该锤头状基序的示
例描述于Rossi(1992)Aids Research and Human Retroviruses8:183;发夹状基序
描述 于Hampel(1989)Biochemistry 28:4929,以及 Hampel(1990)Nuc.Acids Res.18:
299;丁型肝炎病毒基序描述于Perrotta(1992)Biochemistry 31:16;RNA酶基序描述
于Guerrier-Takada(1983)Cell 35:849;以及I组内含子描述于Cech(美国专利号
4,987,071)。提及这些特异性基序并不用于进行限制;本领域技术人员应当认识到,本发明提供的酶RNA分子可以具有互补于一种或更多靶标基因RNA区域的特异性底物结合位点,
且在该底物结合位点内部或附近具有核苷酸序列,其赋予该分子RNA裂解活性。
[0376] RNA干扰(RNAi)
[0377] 在一些实施方式中,本发明提供了RNA抑制分子,所谓的“RNAi”分子,其包含本发明提供的水解酶序列。RNAi分子可以包括双链RNA(dsRNA)分子,例如,siRNA和/或miRNA。RNAi可以抑制水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)基因的表达或
转录。在一方面中,RNAi分子(例如siRNA和/或miRNA)是长度约10、11、12、13、14、15、
16、17、18、19、20、21、22、23、24、25、26、27、28、29或30或更多的双链核苷酸。虽然本发明并不限于任何特别的作用机制,但是RNAi可以进入细胞并导致具有相似或同一序列的单链
RNA(ssRNA)包括内源性mRNA的降解。当细胞被暴露于双链RNA(dsRNA)时,来自同源基因
的mRNA通过被称为RNA干扰(RNAi)的过程被选择性降解。RNAi背后的一种可能的基本机
制是将与特定基因序列匹配的双链RNA(dsRNA)破坏成短的部分,称为短链干扰RNA,其触
发了与该序列匹配的mRNA的降解。
[0378] 一方面,本发明提供的RNAi被用于基因-沉默治疗,参见,例如,Shuey(2002)Drug Discov.Today 7:1040-1046。在一些实施方式中,本发明提供了使用RNAi选择性降解RNA的方法。该方法可以在体外、离体或体内进行。一方面,本发明提供的RNAi分子可以被用
于在细胞、器官或动物中产生功能缺失突变。制备和使用选择性降解RNA的RNAi分子的方
法是本领域公知的,参见例如美国专利号6,506,559;6,511,824;6,515,109;6,489,127。 [0379] 核酸修饰
[0380] 在一些实施方式中,本发明提供了生成核酸变体的方法,例如编码本发明提供的水解酶或抗体的核酸。这些方法可以重复进行或以各种组合方式进行,以生成相对于由模
板核酸编码的水解酶或抗体而言具有改变的或不同的活性、或改变的或不同的稳定性的水
解酶或抗体。这些方法还可以重复进行或以各种组合方式进行,从而例如产生基因/信息
表达、信息翻译或信息稳定性的变化。另一方面,细胞的遗传组分通过例如离体的同源基因修饰然后重新插入细胞中而发生改变。
[0381] 术语“变体”可以包括本发明提供的多核苷酸或多肽,其在一或更多碱基对、密码子、内含子、外显子、或氨基酸残基处(分别)被修饰,但是仍然保留本发明提供的水解酶的生物学活性。变体可以由任何方法生成,包括方法例如,易错PCR、重排、寡核苷酸-定向诱变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归全体诱变、指数全体诱变、位点-特异SM性诱变、基因再组装、GSSM 及其任意组合。本发明包括生成在某pH或温度下具有例如不
同于野生型水解酶的活性的变体水解酶的技术。
[0382] 本发明提供的核酸可以通过任何方式进行改变。例如,随机方法或非随机方法,或“定向进化”方法,参见例如美国专利号6,361,974。基因随机突变方法是本领域公知的,参见例如美国专利号5,830,696。例如,诱变剂可以被用于随机突变基因。诱变剂包括例如紫外线或γ射线照射,或化学诱变剂,例如丝裂霉素、亚硝酸、光活化补骨脂素,其单独使用或组合使用,以诱导DNA断裂从而进行重组修复。其它化学诱变剂包括例如,亚硫酸氢
钠、亚硝酸、羟胺、肼或甲酸。其它诱变剂是核苷酸前体类似物,例如亚硝基胍、5-溴脲嘧啶、
2-氨基嘌呤、或吖啶。这些试剂可以被加入至PCR反应中代替核苷酸前体从而突变序列。
还可以使用嵌入剂例如原黄素、吖啶黄素、奎纳克林等。
[0383] 可以使用任何分子生物学技术,例如随机PCR诱变,参见例如Rice(1992)Proc.Natl.Acad.Sci.USA 89:5467-5471;或组合多种盒式诱变,参见例如Crameri(1995)
Biotechniques 18:194-196。可选的,核酸(例如基因)可以在随机片段化后进行再
组装,参见例如美国专利号6,291,242;6,287,862;6,287,861;5,955,358;5,830,721;
5,824,514;5,811,238;5,605,793。在可选的方面,通过以下方法引入修饰、添加或缺失:
易错PCR、重排、寡核苷 酸-定向诱变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归SM SM
全体诱变、指数全体诱变、位点-特异性诱变、基因位点饱和诱变 (GSSM )、合成连接再组装(SLR或基因再组装)、重组、递归序列重组、硫代磷酸酯-修饰的DNA诱变、含尿嘧啶模板诱变、缺口双链体诱变、点错配修复诱变、修复缺失型宿主菌株诱变、化学诱变、辐射诱变、缺失诱变、限制性-选择诱变、限制性-纯化诱变、人工基因合成、全体诱变、嵌合核酸多体建立、和/或各种方法的组合。
[0384] 下述出版物描述了多种递归重组过程和/或方法,其可被结合进本发明提 供 的 方 法:Stemmer(1999)“Molecular breeding of viruses for targeting
and other clinical properties”Tumor Targeting 4:1-4;Ness(1999)Nature
Biotechnology 17:893-896;Chang(1999)“Evolution of a cytokine using DNA
family shuffling”Nature Biotechnology 17:793-797;Minshull(1999)“Protein
evolution by molecular breeding”Current Opinion in Chemical Biology 3:284-290;
Christians(1999)“Directed evolution of thymidine kinase for AZT phosphorylation using DNA family shuffling”Nature Biotechnology 17:259-264;Crameri(1998)“DNA shuffling of a family of genes from diverse species accelerates directed
evolution”Nature 391:288-291;Crameri(1997)“Molecular evolution of an arsenate detoxification pathway by DNA shuffling,”Nature Biotechnology 15:436-438;
Zhang(1997)“Directed evolution of an effective fucosidase from a galactosidase by DNA shuffling and screening”Proc.Natl.Acad.Sci.USA 94:4504-4509;Patten等人(1997)“Applications of DNA Shuffling to Pharmaceuticals and Vaccines”Current Opinion in Biotechnology 8:724-733;Crameri 等 人 (1996)“Construction and
evolution of antibody-phage libraries by DNA shuffling”Nature Medicine 2:
100-103;Gates等人(1996)“Affinity selective isolation of ligands from peptide libraries through display on a lac repressor `headpiece dimer`”Journal of
Molecular Biology 255:373-386;Stemmer(1996)“Sexual PCR and Assembly PCR”In:
The Encyclopedia of Molecular Biology.VCH Publishers,New York.pp.447-457;
Crameri和Stemmer(1995)“Combinatorial multiple cassette mutagenesis creates all the permutations of mutant and wildtype cassettes”BioTechniques 18:194-195;
Stemmer等人(1995)“Single-step assembly of a gene and entire plasmid form
large numbers of oligodeoxyribonucleotides”Gene,164:49-53;Stemmer(1995)“The Evolution of Molecular Computation”Science 270:1510;Stemmer(1995)“Searching Sequence Space”Bio/Technology 13:549-553;Stemmer(1994)“Rapid evolution of a protein in vitro by DNA shuffling”Nature 370:389-391;以及Stemmer(1994)“DNA shuffling by random fragmentation and reassembly:In vitro recombination for
molecular evolution.”Proc.Natl.Acad.Sci.USA91:10747-10751。
[0385] 产生多样性的突变方法包括,例如位点-定向诱变(Ling等人(1997)“Approaches to DNA mutagenesis:an overview”Anal Biochem.254(2):157-178;Dale 等 人(1996)“Oligonucleotide-directed random mutagenesis using the phosphorothioate method”Methods Mol.Biol.57:369-374;Smith(1985)“In vitro mutagenesis”Ann.
Rev.Genet.19:423-462;Botstein 和 Shortle(1985)“Strategies and applications
of in vitro mutagenesis”Science 229:1193-1201;Carter(1986)“Site-directed
mutagenesis”Biochem.J.237:1-7; 和 Kunkel(1987)“The efficiency of
oligonucleotide directed mutagenesis”in Nucleic Acids&Molecular
Biology(Eckstein,F.和 Lilley,D.M.J.eds.,Springer Verlag,Berlin));含 尿 嘧
啶 模 板 诱 变 (Kunkel(1985)“Rapid and efficient site-specific mutagenesis
without phenotypic selection”Proc.Natl.Acad.Sci.USA 82:488- 492;Kunkel 等
人 (1987)“Rapid and efficient site-specific mutagenesis without phenotypic
selection”Methods in Enzymol.154,367-382;和 Bass 等 人 (1988)“Mutant Trp
repressors with new DNA-binding specificities”Science 242:240-245);寡核苷
酸 定 向 诱 变 (Methods in Enzymol.100:468-500(1983);Methods in Enzymol.154:
329-350(1987);Zoller和Smith(1982)“Oligonucleotide-directed mutagenesis using M13-derived vectors:an efficient and general procedure for the production of
point mutations in any DNA fragment”Nucleic Acids Res.10:6487-6500;Zoller
和 Smith(1983)“Oligonucleotide-directed mutagenesis of DNA fragments cloned
into M13 vectors”Methods in Enzymol.100:468-500; 和 Zoller 和 Smith(1987)
Oligonucleotide-directed mutagenesis:a simple method using two oligonucleotide primers and a single-stranded DNA template”Methods in Enzymol.154:329-350);硫代磷酸酯修饰的DNA诱变(Taylor等人(1985)“The use of phosphorothioate-modified
DNA in restriction enzyme reactions to prepare nicked DNA”Nucl.Acids Res.13:
8749-8764;Taylor等人(1985)“The rapid generation of oligonucleotide-directed
mutations at high frequency using phosphorothioate-modified DNA”Nucl.
Acids Res.13:8765-8787(1985);Nakamaye(1986)“Inhibition of restriction
endonuclease Nci I cleavage by phosphorothioate groups and its application to
oligonucleotide-directed mutagenesis”Nucl.Acids Res.14:9679-9698;Sayers 等
人(1988)“Y-TExonucleases in phosphorothioate-based oligonucleotide-directed
mutagenesis”Nucl.Acids Res.16:791-802;和Sayers等人(1988)“Strand specific
cleavage of phosphorothioate-containing DNA by reaction with restriction
endonucleases in the presence of ethidium bromide”Nucl.Acids Res.16:
803-814);使用缺口双链体DNA进行诱变(Kramer等人(1984)“The gapped duplex DNA
approach to oligonucleotide-directed mutation construction”Nucl.Acids Res.12:
9441-9456; Kramer 和 Fritz(1987)Methods in Enzymol.“Oligonucleotide-directe
d construction of mutations via gapped duplex DNA”154:350-367;Kramer 等 人
(1988“) Improved enzymatic in vitro reactions in the gapped duplex DNA approach to oligonucleotide-directed construction of mutations”Nucl.Acids Res.16:7207;
和Fritz等人(1988)“Oligonucleotide-directed construction of mutations:a gapped duplex DNA procedure without enzymatic reactions in vitro”Nucl.Acids Res.16:
6987-6999)。
[0386] 用于本发明提供的方法的其它方法包括点错配修复(Kramer(1984)“PointMismatch Repair”Cell 38:879-887);使用修复缺失型宿主细胞进行诱变(Carter
等 人 (1985)“Improved oligonucleotide site-directed mutagenesis using
M13 vectors”Nucl.Acids Res.13:4431-4443; 和 Carter(1987)“Improved
oligonucleotide-directed mutagenesis using M13 vectors”Methods in Enzymol.154:
382-403);缺失诱变(Eghtedarzadeh(1986)“Use of oligonucleotides to generate
large deletions”Nucl.Acids Res.14:5115);限制性选择和限制性纯化(Wells等人
(1986)“Importance of hydrogen-bond formation in stabilizing the transition
state of subtilisin”Phil.Trans.R.Soc.Lond.A 317:415-423);全基因合成诱变
(Nambiar等 人 (1984)“Total synthesis and cloning of a gene coding for the
ribonuclease S protein”Science 223:1299-1301;Sakamar和Khorana(1988)“Total
synthesis and expression of a gene for the a-subunit of bovine rod outer segment guanine nucleotide-binding protein(transducin)”Nucl.Acids Res.14:6361-6372;
Wells 等 人 (1985)“Cassette mutagenesis:an efficient method for generation
of multiple mutations at defined sites”Gene 34:315-323;和Grundstrom 等 人
(1985)“Oligonucleotide-directed mutagenesis by microscale‘shot-gun’gene
synthesis”Nucl.Acids Res.13:3305-3316);双 链 断 裂 修 复 (Mandecki(1986);
Arnold(1993)“Protein engineering for unusual environments”Current Opinion in Biotechnology 4:450-455.“Oligonucleotide-directed double-strand break repair in plasmids of Escherichia coli:a method for site-specific mutagenesis”Proc.
Natl.Acad.Sci.USA,83:7177-7181)。上述很多方法的其它细节见于Methods in
Enzymology Volume 154,其还描述了排除各种诱变方法存在的问题的有效控制法。
[0387] 用于本发明提供的方法的其它方法包括描述于Stemmer的美国专利号5,605,793(1997年2月25日),“Methods for In Vitro Recombination;”Stemmer等人
的美国专利号5,811,238(1998年9月22日)“Methods for Generating Polynucleotides
having Desired Characteristics by Iterative Selection and Recombination”;
Stemmer等人的美国专利号5,830,721(1998年11月3日),“DNA Mutagenesis by
Random Fragmentation and Reassembly”;Stemmer等人的美国专利号5,834,252(1998
年11月10日)“End-Complementary Polymerase Reaction”;Minshull等人的美国
专利号5,837,458(1998年11月17日),“Methods and Compositions for Cellular
and Metabolic Engineering”;Stemmer 和 Crameri 的 WO 95/22625,“Mutagenesis by Random Fragmentation and Reassembly”;Stemmer和Lipschutz的WO 96/33207,“End
Complementary Polymerase Chain Reaction”;Stemmer 和 Crameri 的 WO 97/20078,
“Methods for Generating Polynucleotides having Desired Characteristics by
Iterative Selection and Recombination”;Minshull 和 Stemmer 的 WO 97/35966,
“Methods and Compositions for Cellular and Metabolic Engineering”;Punnonen
等人的WO 99/41402“Targeting of Genetic Vaccine Vectors”;Punnonen等人的WO
99/41383“Antigen Library Immunization”;Punnonen等人的WO 99/41369“Genetic
Vaccine Vector Engineering”;Punnonen 等 人 的 WO 99/41368 “Optimization of
Immunomodulatory Properties of Genetic Vaccines”;Stemmer 和 Crameri 的 EP
752008,“DNA Mutagenesis by Random Fragmentation and Reassembly”;Stemmer的EP
0932670“Evolving Cellular DNA Uptake by Recursive Sequence Recombination”;
Stemmer等人的WO 99/23107,“Modification of Virus Tropism and Host Range by
Viral Genome Shuffling”;Apt等人的WO 99/21979,“Human Papillomavirus Vectors”;
del Cardayre等人的WO 98/31837,“Evolution of Whole Cells and Organisms by
Recursive Sequence Recombination”;Patten 和 Stemmer 的 WO 98/27230,“Methods and Compositions for Polypeptide Engineering”;Stemmer 等 人 的 WO 98/27230,
“Methods for Optimization of Gene Therapy by Recursive Sequence Shuffling and Selection”;WO 00/00632,“Methods for Generating Highly Diverse Libraries”;WO
00/09679,“Methods for Obtaining in Vitro Recombined Polynucleotide Sequence
Banks and Resulting Sequences”;Arnold 等 人 的 WO98/42832,“Recombination of Polynueleotide Sequences using Random or Defined Primers”;Arnold等 人 的 WO
99/29902,“Method for Creating Polynucleotide and Polypeptide Sequences”;Vind的WO 98/41653,“An in Vitro Method for Construction of a DNA Library”;Borchert等人的WO98/41622,“Method for Constructing a Library using DNA Shuffling”;和Pati和Zarling的WO 98/42727,“Sequence Alterations using Homologous Recombination”。 [0388] 可以被使用的方法(提供关于产生各种多样性的方法的细节)描述于,例
如美国专利申请系列号(USSN)09/407,800,“SHUFFLING OF CODON ALTERED GENES”,
Patten等人,提交于1999年9月28日;“EVOLUTION OF WHOLE CELLS AND ORGANISMS
BY RECURSIVE SEQUENCE RECOMBINATION”,del Cardayre等人,美国专利号6,379,964;
“OLIGONUCLEOTIDE MEDIATED NUCLEIC ACID RECOMBINATION”,Crameri等人,美国 专
利 号 6,319,714;6,368,861;6,376,246;6,423,542;6,426,224 和 PCT/US00/01203;
“USE OF CODON-VARIED OLIGONUCLEOTIDE SYNTHESIS FOR SYNTHETIC SHUFFLING”,
Welch 等 人,美 国 专 利 号6,436,675;“METHODS FOR MAKING CHARACTER STRINGS,
POLYNUCLEOTIDES&POLYPEPTIDES HAVING DESIRED CHARACTERISTICS”,Selifonov等人,提交于2000年1月18日,(PCT/US00/01202);以及例如,“METHODS FOR MAKING CHARACTER
STRINGS,POLYNUCLEOTIDES&POLYPEPTIDES HAVING DESIRED CHARACTERISTICS”,Selifonov等,提交于2000年7月18日(美国系列号09/618,579);“METHODS OF POPULATING DATA
STRUCTURES FOR USE IN EVOLUTIONARY SIMULATIONS”,Selifonov和Stemmer,提交于2000年1月18日(PCT/US00/01138);和“SINGLE-STRANDED NUCLEIC ACID TEMPLATE-MEDIATED
RECOMBINATION AND NUCLEIC ACID FRAGMENT ISOLATION”,Affholter,提交于2000年9月
6日,(美国专利申请系列号09/656,549);以及美国专利号6,177,263;6,153,410。
[0389] 非随机的或“定向进化”方法包括例如,使用基因位点饱和诱变SM(GSSMSM)、合成连接再组装(SLR或基因再组装)、或其组合来修饰本发明提供的核酸以产生具有新的或改变的性质的水解酶(例如,在高酸碱性、高温等条件下具有活性)。由修饰的核酸编码的多肽
在检测其蛋白水解或其它活性之前可以进行活性筛选。可以采用任何检测模型或方法,例
如,毛细管阵列平台。参见例如,美国专利号6,361,974;6,280,926;5,939,250。
[0390] 饱和诱变或GSSMSM技术
[0391] 在本发明提供的一个方面,非随机的基因修饰,“定向进化过程”,被用以生成具有新的或改变的性质的水解酶和抗体。该方法的变型被命名为“基因位点饱和诱变”、“位SM点-饱和诱变”、“饱和诱变”或简单的“GSSM ”。其可与其它诱变处理的过程联用。一方SM
面,本发明提供了使用GSSM 技术制备酶和抗体的方法,例如,如本发明描述的以及美国专利号6,171,820;6,579,258;6,238,884。
[0392] 一方面,GSSMSM技术包括提供模板多核苷酸和多种寡核苷酸,其中各寡核苷酸包括模板多核苷酸的同源序列,由此其靶向模板多核苷酸的特定序列,以及包括同源基因的
变体序列;通过采用寡核苷酸复制模板多核苷酸以产生包含非随机序列变化的子代多核苷
酸,从而产生包含同源基因序列变化的多核苷酸。
[0393] 一方面,含有简并N,N,G/T序列的密码子引物被用于向多核苷酸中引入点突变,从而产生一组子代多肽,其中在每个氨基酸位点具有完整范围的单点氨基酸取代,例如,在待修饰的目标酶活性位点或配体结合位点的氨基酸残基。这些寡核苷酸可以包括连续的第一同源序列,简并N,N,G/T序列,且可选的包括第二同源序列。使用该寡核苷酸得到的下游子代翻译产品包括多肽上每个氨基酸位点处所有可能的氨基酸发生改变,因为N,N,G/T序列的简并性包括全部20种氨基酸的密码子。一方面,一种此类简并寡核苷酸(包括例如,
一种简并N,N,G/T盒)被用于进行亲代多核苷酸模板中的各初始密码子的完整范围的密码
子取代。另一方面,使用了至少两种简并盒其位于相同或不同的寡核苷酸,用于进行亲代多核苷酸模板中的至少两种初始密码子的完整范围的密码子取代。例如,多于一种的N,N,G/T序列可以是被包含在一 种寡核苷酸内,以在多于一个位点处引入氨基酸突变。该多种N,N,G/T序列可以是直接相邻的,或由一个或更多另外的核苷酸序列所隔开。另一方面,适用于引入添加和缺失的寡核苷酸可以被单独使用或与含有N,N,G/T序列的密码子组合使用,以引入任何组合或变更的氨基酸添加、缺失、和/或取代。
[0394] 一方面,使用含有相邻的N,N,G/T三联体,即简并(N,N,G/T)n序列的寡核苷酸同时诱变两个或更多相邻的氨基酸位点。另一方面,使用了具有简并性低于N,N,G/T序列的简并盒。例如,可能在一些情况下(例如,在寡核苷酸中)需要使用包括只有一个N的简并三联体序列,其中所述N可以位于三联体的第一、第二或第三位点。包括其任何组合和变更的任何其它碱基都可被用于三联体剩余的两个位点。可选地,可能在一些情况下(例如,在寡核苷酸中)需要使用简并N,N,N三联体序列。
[0395] 一方面,简并三联体(例如,N,N,G/T三联体)的使用允许系统方便地在多肽的每个氨基酸位点产生完整范围的可能的天然氨基酸(全部20种氨基酸)(在可选的方面,方法还包括在每个氨基酸残基、或密码子、位点产生小于所有可能的取代)。例如,对于100个氨基酸的多肽,可以产生2000个不同种类(即,每位点20种可能的氨基酸×100氨基酸位
点)。通过使用寡核苷酸或含有简并N,N,G/T三联体的系列寡核苷酸,32种不同序列可以
编码全部20种可能的天然氨基酸。因此,在使用至少一种该寡核苷酸对亲代多核苷酸序列
进行饱和诱变的反应管中含有产生的编码20种不同多肽的32种不同子代多核苷酸。相反,
在位点-定向诱变中使用非简并寡核苷酸导致每个反应管中只有一种子代多肽产物。非简
并寡核苷酸可以可选的与公开的简并引物联用;例如,非简并寡核苷酸可以被用于在工作
多核苷酸中产生特定点突变。 其提供了一种方法以产生特异性沉默点突变、导致相应氨基酸发生改变的点突变、以及导致产生终止密码子和多肽片段相应表达的点突变。
[0396] 一方面,各饱和诱变反应管含有编码至少20种子代多肽(例如,水解酶,例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)的多核苷酸分子,由此,在对应于经诱变处理的亲代多核苷酸中的密码子位点的特定氨基酸位点出现全部20种天然氨基酸(在其它方面中,使用小于全部20种天然组合)。可以克隆扩增各饱和诱变反应管中生成的32倍简并子代
多肽(例如,使用例如表达载体克隆入适当的宿主,例如大肠杆菌宿主),并进行表达筛选。
当通过筛选将一种子代多肽识别为能表现出有利的性质变化(与亲代多肽相比,例如相对
于水解油酸酯增加的水解棕榈酸酯选择性),该多肽可以被测序以识别其中所含的相应的
有利氨基酸取代。
[0397] 一方面,亲代多肽每个氨基酸位点使用本发明公开的饱和诱变进行诱变处理后,可以在多于一个氨基酸位点处识别有利的氨基酸改变。可以产生一种或更多新的子代分
子,其含有全部或部分的这些有利的氨基酸取代的组合。例如,如果在多肽的3个氨基酸
位点中的每一个位点识别出2个有利的特定氨基酸发生改变,则数学排列包括在每个位点
的3种可能性(对于初始氨基酸无改变,以及二种有利改变之一)和3个位点。由此,共有
3×3×3或27种可能性,包括7种之前检验过的——6种单点突变(即,3个位点中每个位
点的2种突变)和在任何位点均没有改变。
[0398] 另一方面,可以将位点-饱和诱变与另外的随机或非随机方式联用以改变序列,例如合成连接再组装(参见下文)、重排、嵌合、重组和其它诱变处理方法和诱变处理试剂。
本发明提供了诱变处理方法,包括以迭代方式使用的饱和诱变。
[0399] 合成连接再组装(SLR)
[0400] 一方面,本发明提供了非随机基因修饰系统,命名为“合成连接再组装”或简单的“SLR”,其也被称为“基因再组装”技术、“定向进化方法”,其用于产生多肽,例如,本发明提供的具有新的或改变的性质的酶(例如水解酶,例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)或抗体。SLR是非随机性连接寡核苷酸片段的方法。该方法不同于随机寡核苷酸重排,其核酸嵌段(block)没有进行随机重排、连接或嵌合,而是非随机性地进行组装。参见例如,美国专利号6,773,900;6,740,506;6,713,282;6,635,449;6,605,449;6,537,776。 [0401] 一方面,SLR包括以下步骤:(a)提供模板多核苷酸,其中模板多核苷酸包括同源
基因的编码序列;(b)提供多种嵌段多核苷酸,其中嵌段多核苷酸被设计为按照预定的序
列与模板多核苷酸进行交叉再组装,且嵌段多核苷酸包括同源基因变体序列和与变体序列
两侧模板多核苷酸同源的序列;(c)将嵌段多核苷酸与模板多核苷酸组合,由此嵌段多核
苷酸与模板多核苷酸进行交叉再组装,以生成包含同源基因序列变体的多核苷酸。
[0402] SLR不依赖于待重排的多核苷酸的高水平同源性。因此,该方法可以被用于非随机100
产生子代分子包括超过10 种不同的嵌合体的库(或集合)。SLR可以被用于产生包括超
1000
过10 种不同子代嵌合体的库。一方面,本发明提供了非随机的方法生成一系列最终的嵌
合核酸分子,其具有设计选择的整体装配顺序。该方法包括步骤如下:设计产生多种特定的核酸嵌段,其具有合适的相互兼容的连接末端,以及组装这些核酸嵌段,从而获得设计的整体装配顺序。
[0403] 如果待组装的核酸嵌段的相互兼容的连接末端能够将嵌段按照预定的顺序进行偶联,那么其被认为“适合”用于该类型的顺序装配。因此,可以偶联核酸嵌段的整体装配顺序由连接末端的设计来确定。如果使用多于一个装配步骤,那么可以偶联核酸嵌段的整
体装配顺序还由装配步骤的顺序确定。一方面,用酶例如连接酶(例如,T4 DNA连接酶)处
退火的嵌段,以获得共价键合的嵌段。
[0404] 一方面,寡核苷酸嵌段的设计是通过分析一组前体核酸序列模板获得的,后者作为生成子代系列最终的嵌合多核苷酸的基础。因此,这些亲代寡核苷酸模板作为序列信息
的来源,在对待诱变(例如嵌合或重排)的核酸嵌段的设计中提供帮助。在该方法的一个
方面,对多种亲代核酸模板序列进行比对来选择一种或更多分界点。分界点可以位于同源
性区域,且包含一个或更多个核苷酸。这些分界点可选地由至少两种前体模板共享。从而
分界点可以被用于描绘要产生的寡核苷酸嵌段的边界以重排亲代多核苷酸。在前体分子中
识别和选择的分界点作为最终嵌合的子代分子装配的潜在嵌合点。分界点可以是一种由至
少两种亲代多核苷酸序列共享的同源区域(包括至少一个同源核苷酸碱基)。可选地,分界
点可以是一种由亲代多核苷酸序列的至少一半共享的同源区域,或者,其可以是一种由亲
代多核苷酸序列的至少三分之二共享的同源区域。在可选的实施方式中,合适的分界点是
由亲代多核苷酸序列的至少四分之三共享的同源区域,或其可以是由亲代多核苷酸序列的
几乎全部所共享的。一方面,分界点是由亲代多核苷酸序列的全部所共享的同源区域。
[0405] 一方面,完全进行连接再组装过程以产生子代嵌合多核苷酸的详尽库。换而言之,核酸嵌段的所有可能的顺序组合都被呈现在一组最终的嵌合核酸 分子中。同时,另一方面,在每个组合中的装配顺序(即在各个最终的嵌合核酸的5’至3’序列中装配各嵌段的
顺序)按照如上所述进行设计(或非随机)。本发明提供了降低不想要的副产物出现的非
随机方法。
[0406] 另一方面,系统性地进行连接再组装方法。例如,进行该方法以产生系统性的子代分子的区划库,其各部分可以系统性地(例如依次)被筛选。本发明提供了包括选择性和判断性地使用特异性核酸嵌段的方法,其伴随着选择性和判断性地使用顺序步骤装配反应。
可以在几个反应管中的每一个中进行设计制备特定系列子代产物。其允许进行系统性地检
验和筛选过程。因此,这些方法容许潜在的非常巨大数量的子代分子按照较小的组进行系
统性检验。由于这些方法能够以高度灵活但却穷尽和系统性的方式进行嵌合(特别是当前
体分子间具有低同源性的时候),因此其提供生成了包括大量子代分子的库(或集合)。由
于目前的连接再组装方法的非随机性质,产生的子代分子可以包括完成的嵌合核酸分子文
库,其具有根据设计选定的整体装配顺序。还可以使用饱和诱变和最优化的定向进化方法
产生不同子代分子种类。
[0407] 一方面,本发明的方法提供了对于选择分界点、核酸嵌段的大小和数量、以及偶联的大小和设计进行自由地选择和控制。分子间同源性的需求可以是高度宽松的。事实上,甚至可以在分子间同源性很小或不存在的区域选择分界点。例如,由于密码子摇摆,即密
码子简并性,可以向核酸嵌段中引入核苷酸取代而不改变相应前体模板中原始编码的氨基
酸。可选地,密码子可以被改变,由此初始氨基酸的编码发生改变。一方面,可以在核酸嵌段中引入取代以增强分子间同源分界点的发生,并从而允许在嵌段之间得到更多数量的偶
联,其进一步允许产生更多子代嵌合分子。
[0408] 另一方面,产生嵌段的步骤的性质决定了其允许设计和引入核苷酸(例如,一种或更多的核苷酸,其可以是例如密码子或内含子或调控序列),该核苷酸可以在接下来的体外过程(例如,通过诱变)或体内过程(例如,通过利用宿主生物体的基因剪接能力)中可
选地被去除。可以理解,除了创建合适分界点这一潜在优点外,引入这些核苷酸在很多情况下还可以出于很多其它原因的考虑。
[0409] 在一方面中,使用核酸嵌段以引入内含子。因此,功能性内含子被引入根据本发明描述的方法制备的人造基因。人工引入的内含子可以在宿主细胞具有基因剪接功能,其与天然存在的内含子的基因剪接功能非常相似。
[0410] 最优化的定向进化系统
[0411] 在一些实施方式中,本发明提供了非随机基因修饰系统,命名为“最优化的定向进化系统”,以产生具有新的或改变的性质的水解酶和抗体。最优化的定向进化针对减少的重配、重组和选择的重复循环的使用,其允许通过重组进行核酸的定向分子进化。最优化的定向进化允许产生大量的进化嵌合序列,其中产生的序列群中显著富集了具有预定数量的交叉事件的序列。
[0412] 交叉事件是嵌合序列中的一个点,在此点处,发生了从一个亲代变体到另一个亲代变体的序列转换。所述点通常位于两种亲代寡核苷酸连接形成单一序列的结合处。该方
法允许计算寡核苷酸序列的正确浓度,从而最终嵌合的序列群根据选定的交叉事件数量进
行富集。其对于选择具有预定数量的交叉事件的嵌合变体提供了更强的控制性。
[0413] 另外,该方法提供了一种较其它系统更为便利的方法用以搜索巨大数量的可能的13
蛋白变体空间。之前,如果在一个反应中产生了例如10 个嵌合分子,那么检测该大量的嵌合变体的特定活性将会是非常困难的。另外,很大 部分的子代群体将会具有非常高的交叉事件数量,其结果是蛋白较不可能具有增加的特定活性水平。通过使用这些方法,嵌合分子的群体中可以富集具有特定数量的交叉事件的变体。因此,虽然在一个反应中还是产生了
13
10 个嵌合分子,选择每种分子进一步分析的过程大部分可能仅具有例如三个交叉事件。由于得到的子代群体可倾向于具有预定数量的交叉事件,嵌合分子之间的功能多样性边界被
降低。在计算哪一种初始亲代多核苷酸的寡核苷酸可能导致对特定特征发生影响的时候,
其提供了更加可控的变量数量。
[0414] 一种用于创建嵌合子代多核苷酸序列的方法是创建对应于各亲代序列的片段或部分的寡核苷酸。在可选的实施方式中,各寡核苷酸包括独特的重叠区域,由此将寡核
苷酸一起混合产生了一种新变体,其中各寡核苷酸片段以正确顺序装配。用于实现这些
本发明提供的方法的可选方法可以见于美国专利号6,773,900;6,740,506;6,713,282;
6,635,449;6,605,449;6,537,776;6,361,974。
[0415] 每种亲代变体产生寡核苷酸的数量与在最终创建的嵌合分子中得到的交叉总数有关。例如,可以提供3个亲代核苷酸序列变体进行连接反应用于发现嵌合变体,其具有例如在高温下更强的活性。作为示例,可以制备一组50个寡核苷酸序列对应于每种亲代变体
的每个部分。因此,在连接再组装过程中,在每个嵌合序列中可能有多达50的交叉事件。产生的每种嵌合多核苷酸中都含有改变顺序的来自各亲代变体的寡核苷酸的概率非常低。如
果每种寡核苷酸片段以等摩尔数量进行连接反应,那么可能在一些位点处来自相同亲代多
核苷酸的寡核苷酸将会逐一相互连接,从而不产生交叉事件。如果在该例子的任何连接步
骤中,来自各亲代的每种寡核苷酸的浓度保留不变,那 么有1/3的机会(假设3个亲代)
来自相同亲代变体的寡核苷酸将会在嵌合序列内连接而不产生交叉。
[0416] 因此,当给定了亲代变体的数量、对应于各变体的核苷酸数量、以及以及在连接反应的各步骤中各变体的浓度时,可以通过测定概率密度函数(PDF)以预测在连接反应的各步骤中可能发生交叉事件的群体。测定PDF背后的统计学和数学原理在下文中描述。通过
使用这些方法,人们可以计算这样一种概率密度函数,并由此富集来自特定连接反应的具
有预定数量的交叉事件的嵌合子代群体。此外,交叉事件的目标数量可以是预定的,该系统然后按照程序计算连接反应的各步骤中的各亲代寡核苷酸的起始数量,以产生预定的交叉
事件数量的集中概率密度函数。这些方法使用减少的重配、重组和选择的重复循环,其允
许通过重组进行编码多肽的核酸的定向分子进化。该系统进化允许产生大量进化的嵌合序
列,其中产生的数量中显著富集了具有预定数量的交叉事件的序列。交叉事件是嵌合序列
中的一个点,在该点发生从一个亲代变体到另一个亲代变体的序列转换。所述点通常位于
两种亲代寡核苷酸连接形成单一序列的结合处。该方法允许计算寡核苷酸序列的正确浓
度,由此最终的嵌合序列群根据选定的交叉事件数量进行富集。其对于选择具有预定数量
的交叉事件的嵌合变体提供了更强的控制性。
[0417] 确定交叉事件
[0418] 本发明提供的方面包括接受输入的所需交叉概率密度函数(PDF)、待组装的亲代基因数量、以及再组装中的片段数量的系统和软件。该程序输出的是“片段PDF”,其可以被用于确定生成再组装基因的方法,以及这些基因的交叉PDF。本发明描述的方法可选的采
TM
用MATLAB (The Mathworks,Natick,Massachusetts),其是一种用于技术计算的程序语言和开发环境。
[0419] 迭代过程
[0420] 在一些实施方式中,本发明提供了可迭代重复的过程。例如,对于有关改变的水解酶或抗体表型的核酸(或,核酸)进行识别、再分离、再修饰、再检测活性。该过程可迭代重复,直至工程改造为所需表型。例如,全部生物化学合成代谢或分解代谢途径可以被工程改造进入细胞,包括蛋白水解活性。
[0421] 类似地,如果确定特定的寡核苷酸对于所需的特征(例如新的水解酶表型)完全没有影响,其可以通过合成包含待去除的序列的更大亲代寡核苷酸进行去除。由于在更大
的序列中引入该序列阻碍交叉事件的发生,因此在子代多核苷酸中该序列不会有任何改
变。该测定何种寡核苷酸与所学特征最相关、以及何种不相关的迭代过程允许更有效地搜
索全部可能的可提供特定特征或活性的蛋白变体。
[0422] 体内重排
[0423] 本发明提供的方法中使用了分子体内重排,其提供本发明提供的多肽的变体,例如,抗体、水解酶等。体内重排可以利用细胞的天然性质来进行重组多体。虽然体内重组已经提供了分子多样性的主要天然途径,遗传重组仍然是相对复杂的过程,其涉及:1)同源
性确认;2)链裂解、链侵入、以及导致生成重组染色体交叉的代谢步骤;以及最后3)染色体交叉分解进入分离的重组分子。染色体交叉的形成需要识别同源序列。
[0424] 在一些实施方式中,本发明提供了用于从至少一种第一多核苷酸和一种第二多核苷酸生成杂交多核苷酸的方法。在其它的实施方式中,本发明提供了通过在适当的宿主细
胞中引入在至少一个区域享有部分序列同源性的至少一种第一多核苷酸和第二多核苷酸
来生成杂交多核苷酸的方法。部分序列同 源性的区域促进了序列重组生成杂交多核苷酸
的过程。一方面,术语“杂交多核苷酸”包括本发明提供的方法所产生的任何核苷酸序列,以及在一个实施方式中包括来自至少两种初始多核苷酸序列的序列。该杂交多核苷酸可以
来自分子间重组事件,其促进DNA分子间的序列整合。另外,该杂交多核苷酸可以来自分子内减少重配过程,其利用重复的序列以改变DNA分子中的核苷酸序列。
[0425] 生成序列变体
[0426] 在一些实施方式中,本发明提供了本发明提供的核酸和水解酶和抗体序列的变体序列的制备方法,或使用本发明提供的核酸和多肽的分离水解酶的方法。在一些实施方式
中,本发明提供了本发明提供的水解酶基因的变体,其可以通过任何方式进行改变,包括例如随机方法或非随机或“定向进化”方法,如上所述。
[0427] 本发明提供了生成编码具有水解酶活性(例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性)的多肽的核酸变体的方法,包括以下步骤:(a)提供包含本发明提供的核酸的
模板核酸;和(b)在该模板序列中修饰、缺失或添加一种或更多核苷酸或其组合,以产生模板核酸变体。一方面,该方法可以进一步包括表达变体核酸以产生变体水解酶,例如脂肪
酶、饱和酶、棕榈酸酶和/或硬脂酸酶多肽。修饰、添加或缺失可以通过以下方法进行引入,包括易错PCR、重排、寡核苷酸-定向诱变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递SM SM
归全体诱变、指数全体诱变、位点-特异性诱变、基因位点饱和诱变 (GSSM )、合成连接再组装(SLR或基因再组装)或其组合。在另一方面中,修饰、添加或缺失通过以下方法进行
引入,包括重组、递归序列重组、硫代磷酸酯修饰的DNA诱变、含尿嘧啶模板诱变、缺口双链体诱变、 点错配修复诱变、修复缺失型宿主菌株诱变、化学诱变、辐射诱变、缺失诱变、限制性选择诱变、限制性纯化诱变、人工基因合成、全体诱变、建立嵌合核酸多体及其组合。 [0428] 一方面,该方法可以迭代重复至产生与模板核酸编码的多肽相比具有改变的或不
同的活性或改变的或不同的稳定性的水解酶,例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶。一方面,变体水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶多肽)是耐热的,且在暴露于升高的温度后仍保留一些活性。另一方面,变体水解酶(例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶多肽)与模板核酸编码的水解酶(例如脂肪酶、饱和酶、棕榈酸酶
和/或硬脂酸酶)相比具有增加的糖基化。可选地,变体水解酶(例如脂肪酶、饱和酶、棕
榈酸酶和/或硬脂酸酶多肽)在高温下具有水解酶(例如脂肪酶、饱和酶、棕榈酸酶和/或
硬脂酸酶)活性,其中由模板核酸编码的水解酶(例如脂肪酶、饱和酶、棕榈酸酶和/或硬
脂酸酶)在高温下没有活性。一方面,该方法可以迭代重复至产生与模板核酸编码的相比
具有改变的密码子应用的水解酶,例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶。另一方面,该方法可以迭代重复至产生与模板核酸编码的相比具有更高或更低信息表达或稳定性
水平的水解酶基因,例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶基因。另一方面,水解酶终产品的制剂(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶产品)能够增强或调控
产品中水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)的性能。
[0429] 分离的变体可以是天然存在的。变体也可以体外构建。变体可以使用遗传工程技术例如位点定向诱变、随机化学诱变、核酸外切酶III缺失过程、以及标准克隆技术进行构建。可选地,该变体、片段、类似物、或衍生物可 以使用化学合成或修饰过程进行构建。其它制备变体的方法也是本领域技术人员熟知的。其包括对天然分离的核酸序列进行修饰以
产生编码具有增强的工业或实验室应用价值的多肽的核酸的过程。在该过程中,产生并识
别了大量具有一处或多处不同于天然分离的核苷酸的变体序列。这些核苷酸差异可能导致
氨基酸相对于由天然分离的核酸所编码的多肽发生改变。
[0430] 例如,变体可以使用易错PCR进行构建。在易错PCR中,PCR在DNA聚合酶的复制保真度很低的条件下进行,从而在PCR产物全长中获得高频率的点突变。易错PCR描述于,
例如,Leung,D.W.等人,Technique,1:11-15,1989)和Caldwell,R.C.和Joyce G.F.,PCR Methods Applic.,2:28-33,1992。简而言之,在该过程中,进行诱变处理的核酸与PCR引物、反应缓冲液、MgCl2、MnCl2、Taq聚合酶和合适浓度的dNTP混合用于在PCR产物全长中获得高频率的点突变。例如,反应中可以使用20飞摩尔的待诱变的核酸;30皮摩尔的各PCR
引物;包含50mM KCl、10mM Tris HCl(pH 8.3)和0.01%明胶、7mM MgCl2、0.5mM MnCl2、5单位的Taq聚合酶、0.2mMdGTP、0.2mM dATP、1mM dCTP、以及1mM dTTP的反应缓冲液。PCR可以以94℃1分钟、45℃1分钟、以及72℃1分钟进行30个循环。然而,可以理解这些参数
可以根据需要进行变化。经诱变处理的核酸被克隆入合适的载体中,并检测了由诱变处理
核酸编码的多肽活性。
[0431] 还可以使用寡核苷酸定向诱变创建变体以在任何感兴趣的克隆DNA中产生位点特异性突变。寡核苷酸诱变描述于,例如,Reidhaar-Olson(1988)Science 241:53-57。简而言之,在该过程中合成了要引入克隆DNA的具有一种或更多突变的多种双链寡核苷酸,
并将其插入克隆DNA进行诱变处理。含有诱变处理DNA的克隆被回收,并评价其编码多肽
的活性。
[0432] 另一种用于产生变体的方法是装配PCR。装配PCR涉及来自小DNA片段混合物的PCR产物的装配。大量的不同PCR反应在相同的管中平行进行,一种反应的产物引导另一反
应的产物。装配PCR被描述于,例如,美国专利号5,965,408。
[0433] 另一种产生变体的方法是有性PCR诱变。在有性PCR诱变中,因为基于序列同源性的DNA分子随机片段化,不同但是高相关DNA序列的DNA分子之间进行强迫的体外同源
重组,然后在PCR反应中通过引物延伸进行交叉的固定。有性PCR诱变被描述于,例如,
Stemmer(1994)Proc.Natl.Acad.Sci.USA 91:10747-10751。简而言之,在该过程中将待重组的多种核酸进行DNA酶消化以产生具有平均大小为50-200核苷酸的片段。具有所需平
均大小的片段被纯化并重悬于PCR混合物。在利于核酸片段重组的条件下进行PCR。例
如,PCR可以如下进行:以10-30ng/l的浓度将纯化片段重悬于含有0.2mM的各dNTP、2.2mM MgCl2、50mM KCL、10mM Tris HCl,pH9.0、以及0.1%Triton X-100的溶液中。在每100∶1的反应混合物中加入2.5单位的Taq聚合酶,PCR按照如下方式进行:94℃60秒、94℃30
秒、50-55℃30秒、72℃30秒(30-45次)和72℃5分钟。然而,可以理解这些参数可以根
据需要进行变化。在一些方面,寡核苷酸可以被包括于PCR反应。在其它方面,可以在第一系列的PCR反应中使用DNA聚合酶I的Klenow片段,并在随后的系列PCR反应中使用Taq
聚合酶。分离重组序列并测定其编码的多肽活性。
[0434] 变体还可以通过体内诱变进行创建。在一些方面,通过在细菌菌株(例如大肠杆菌菌株)中扩增感兴趣的序列在感兴趣的序列中产生随机突变,所述菌株在一种或更多的
DNA修复途径中存在突变。该“突变体”菌株含有比野生 型亲本更高的随机突变率。在这
些菌株中增殖DNA最终产生DNA中的随机突变。适用于体内诱变的突变体菌株描述于,例
如,PCT公开号WO91/16427。
[0435] 变体还可以通过盒式诱变产生。在盒式诱变中,小的双链DNA分子区域被替换为不同于原始序列的合成寡核苷酸“盒”。寡核苷酸通常含有完全和/或部分的随机化的原始序列。
[0436] 还可以使用递归全体诱变产生变体。递归全体诱变是一种蛋白质工程(蛋白诱变)的算法,其开发用于生成多样性群体的表现型相关突变体,其成员在氨基酸序列方面
不同。该方法使用反馈机制以控制连续轮次的组合盒式诱变。递归全体诱变被描述于,例
如,Arkin(1992)Proc.Natl.Acad.Sci.USA89:7811-7815。
[0437] 在一些方面,使用指数全体诱变创建变体。指数全体诱变是一种用于产生具有高百分比的独特和功能性突变体的组合文库的方法,其中小群体的残基被平行随机
化以识别在各改变的位点中形成功能性蛋白的氨基酸。指数全体诱变被描述于,例如,
Delegrave(1993)Biotechnology Res.11:1548-1552。随机和位点定向诱变被描述于,例
如,Arnold(1993)Current Opinion in Biotechnology 4:450-455。
[0438] 在一些方面,使用重排过程创建变体,其中编码不同多肽的多种核酸的一部分被融合在一起产生嵌合核酸序列,其编码嵌合多肽,如描述于,例如,美国专利号5,965,408;
5,939,250。
[0439] 本发明提供了多肽变体,其包含的序列中的一个或更多的氨基酸残基(例如示例性多肽的残基,例如SEQ ID NO:2、SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8、SEQ ID NO:
10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、或SEQ ID NO:20,或具有1、2、3、4、5、6、7、8或更多(几个)或全部氨基酸变化的SEQ ID NO:2,如表3、表4、表9、表10、表11、表16或表23所示,或其等价物)被保守或非保守氨基酸残基(例如,保守氨
基酸残基)取代,且该取代的氨基酸残基可以或可以不被遗传密码编码。保守性取代指在
多肽中的给定氨基酸被另一相似性质的氨基酸取代。因此,本发明的多肽包括具有保守性
取代序列,例如,本发明提供的示例性序列(例如,SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:
6、SEQ IDNO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:
18、或SEQ ID NO:20,或具有1、2、3、4、5、6、7、8或更多(几个)或全部氨基酸变化的SEQ ID NO:2,如表3、表4、表9、表10、表11、表16或表23所示,或其等价物),包括但不限于以下替换:替换脂肪族氨基酸例如丙氨酸、缬氨酸、亮氨酸和异亮氨酸为另一脂肪族氨基酸;替换丝氨酸为苏氨酸或反之亦然;替换酸性残基例如天冬氨酸和谷氨酸为另一酸性残基;替
换带有酰胺基的残基,例如天冬酰胺和谷氨酰胺为另一带有酰胺基的残基;替换碱性残基
例如赖氨酸和精氨酸为另一碱性残基;以及替换芳香族残基例如苯丙氨酸、酪氨酸、或色氨酸为另一芳香族残基。其它变体中,本发明提供的多肽的一种或更多的氨基酸残基包括取
代基。
[0440] 在本发明提供的范围内的其它变体中,多肽与另一化合物结合,例如用于增加多肽半衰期的化合物,例如聚乙二醇。在本发明提供的范围内的其它变体中,额外的氨基酸与多肽融合,例如前导序列、分泌序列、前蛋白序列或利于多肽纯化、富集或稳定化的序列。在一些方面,本发明提供的多肽的变体、片段、衍生物和类似物保留与示例性的多肽相同的生物功能或活性,例如,蛋白水解活性,如文中所述。在其它方面,变体、片段、衍生物或类 似物包括前蛋白,因此变体、片段、衍生物或类似物可以通过裂解前蛋白部分进行活化以产生活性多肽。
[0441] 最优化密码子以获得宿主细胞中高水平的蛋白表达
[0442] 在一些实施方式中,本发明提供了用于修饰水解酶-编码核酸以改变密码子使用的方法。在一个实施方式中,本发明提供了用于在编码水解酶的核酸中改变密码子,以增加或降低其在宿主细胞(例如,细菌、昆虫、哺乳动物、酵母或植物细胞)中的表达的方法。进一步地,本发明提供了编码经修饰增加其在宿主细胞中表达的水解酶的核酸、该修饰的水
解酶、以及修饰的水解酶的制备方法。该方法包括在水解酶-编码核酸中识别“非优选的”或“较差优选的”密码子,并替换一种或更多的这些非优选的或较差优选的密码子为“优选的密码子”,其与被替换的密码子编码相同的氨基酸,且在核酸中至少一个非优选的或较差优选的密码子被替换为编码相同氨基酸的优选的密码子。优选的密码子是过量存在于宿主
细胞基因编码序列中的密码子,非优选的或较差优选的密码子是少量存在于宿主细胞基因
编码序列的密码子。
[0443] 本发明提供的用于表达核酸、表达框和载体的宿主细胞包括细菌、酵母、真菌、植物细胞、昆虫细胞和哺乳动物细胞。在一些实施方式中,本发明提供了用于将最优化密码子应用于全部这些细胞、密码子改变的核酸和由密码子-改变的核酸制备的多肽的方
法。示例性的宿主细胞包括革兰氏阴性细菌,例如大肠杆菌和荧光假单胞菌;革兰氏阳性
细菌,例如加氏乳杆菌(Lactobacillus gasseri)、乳酸球菌、乳脂乳球菌(Lactococcus
cremoris)、枯草芽孢杆菌。示例性的宿主细胞还包括真核生物体,例如,各种酵母,例
如酵母菌属,包括啤酒酵母、裂殖酵母、毕赤酵母、以及乳酸克鲁维酵母(Kluyveromyces lactis)、多形汉逊酵母(Hansenula polymorpha),黑曲霉;和哺 乳动物细胞和细胞系以及昆虫细胞和细胞系。其它示例性的宿主细胞包括细菌细胞,例如大肠杆菌、链霉菌、枯草芽孢杆菌、蜡状芽胞杆菌、鼠伤寒沙门氏菌,以及假单胞菌、链霉菌和葡萄球菌属的各个种;真菌细胞,例如曲霉菌,酵母例如任何种的毕赤酵母属、酵母菌属、裂殖酵母属、许旺酵母属,包括毕赤酵母、啤酒酵母、或裂殖酵母;昆虫细胞,例如果蝇S2和斜纹夜蛾Sf9;动物细胞例如CHO、COS或黑色素瘤和腺病毒。合适宿主的选择是在本领域技术人员能力范围内的。在
一些实施方式中,本发明提供了最优化的核酸和多肽用于在这些生物体和物种中表达。
[0444] 例如,对编码分离自细菌细胞的水解酶的核酸的密码子进行了修饰,从而核酸在与水解酶的来源细菌不同的细菌细胞、酵母、真菌、植物细胞、昆虫细胞或哺乳动物细胞中被最优表达。最优化密码子的方法是本领域公知的,参见例如,美国专利号5,795,737;
Baca(2000)Int.J.Parasitol。30:113-118;Hale(1998)Protein Expr.Purif.12:
185-188;Narum(2001)Infect.Immun.69:7250-7253。 还 参 见 Narum(2001)Infect.
Immun.69:7250-7253,其描述了小鼠系统中的最优化密码子;Outchkourov(2002)Protein Expr.Purif.24:18-24,其描述了酵母中的最优化密码子;Feng(2000)Biochemistry 39:
15399-15409,其描述了大肠杆菌中的最优化密码子;Humphreys(2000)Protein Expr.
Purif.20:252-264,其描述了影响大肠杆菌分泌的最优化密码子的用途。
[0445] 转基因非人动物
[0446] 在一些实施方式中,本发明提供了包含本发明提供的核酸、多肽(例如,本发明提供的水解酶或抗体)、表达框、载体、转染或转化细胞的转基因非人动物。转基因非人动物可以是,例如,山羊、兔、羊、猪、牛、大鼠和小鼠,其包含本发明提供的核酸。这些动物可以被用于,例如,作为体内模型 研究水解酶活性,或作为模型筛选能在体内改变水解酶活性的试剂。在转基因非人动物中要表达的多肽的编码序列可以被设计为组成型的,或在组织-特异性、发育-特异性或可诱导的转录调控因子的调控下。转基因非人动物可以使用
本领域已知的任何方法进行设计和产生;参见,例如,美国专利号6,211,428;6,187,992;
6,156,952;6,118,044;6,111,166;6,107,541;5,959,171;5,922,854;5,892,070;
5,880,327;5,891,698;5,639,940;5,573,933;5,387,742;5,087,571,其描述了制备和使用转化细胞和卵以及转基因的小鼠、大鼠、兔、羊、猪和牛。还参见例如,Pollock(1999)J.Immunol.Methods 231:147-157,其描述了在转基因产奶动物的乳品中生成重组蛋白;
Baguisi(1999)Nat.Biotechnol.17:456-461,其描述了转基因山羊的生成;美国专利号
6,211,428,其描述了转基因非人哺乳动物的制备和使用,其在脑部表达包含DNA序列的核
酸构建体;美国专利号5,387,742,其描述了在受精的小鼠卵中注射克隆重组或合成DNA序
列,将该注射的卵植入假孕的雌性体内并发育成为转基因小鼠,其细胞表达与阿尔茨海默
病理相关的蛋白;美国专利号6,187,992,其描述了转基因小鼠的制备和使用,其基因组包括破坏的编码淀粉样前蛋白(APP)的基因。
[0447] “敲除动物”也可以被用于实现本发明提供的方法。例如,一方面,本发明提供的转基因或修饰的动物包括“敲除动物”,例如,“敲除小鼠”,其被工程化从而不表达内源性基因,后者被替换为水解酶或包含本发明提供的水解酶融合蛋白的表达基因。如上所述,还可以使用本发明提供的反义序列,例如,双链RNAi分子来产生功能性敲除。
[0448] 转基因植物和种子
[0449] 在一些实施方式中,本发明提供了转基因植物和种子,其包含本发明提供的核酸、多肽(例如,本发明提供的水解酶或抗体)、表达框或载体或转染或转化的细胞。转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。在一个实施方式中,本发明
提供了制备和使用这些转基因植物和种子的方法。表达本发明提供的多肽的转基因植物或
植物细胞可以按照本领域已知的任何方法进行构建。参见,例如,美国专利号6,309,872。 [0450] 本发明提供的核酸和表达构建体可以通过任何方式被引入植物细胞。例如,核酸
或表达构建体可以被引入所需的植物宿主的基因组,或者,核酸或表达构建体可以是游离
基因。引入所需的植物的基因组可以使得宿主的水解酶生成受到内源性转录或翻译控制元
件的调控。一方面,本发明提供了“敲除植物”,其中通过例如,同源重组插入基因序列破坏了内源性基因的表达。产生“敲除”植物的方法是本领域熟知的,参见例如,Strepp(1998)Proc Natl.Acad.Sci.USA 95:4368-4373;Miao(1995)Plant J 7:359-365。参见如下转基因植物的讨论。
[0451] 本发明提供的核酸可用于在几乎任何植物中提供所需特征,例如,油料种子生成植物,包括米糠、油菜籽(芸苔)、向日葵、橄榄、棕榈或大豆等,或葡萄糖或淀粉生成植物,例如玉米、马铃著、小麦、水稻、大麦等。本发明提供的核酸可以被用于操作植物的代谢途径,以最优化或改变宿主表达水解酶或底物或水解酶产物,例如,油、脂质,例如甘油单酯、甘油二酯或甘油三酯等。其能够改变植物中的脂质比率、脂质转化率和转化数。其能够有
利于工业加工植物。可选地,本发明提供的水解酶可被用于生成转基因植物以通过该植物
进行生成非天然化合物。其能够降低生成成本或创造新产品。
[0452] 一方面,生成转基因植物的第一步涉及制备表达构建体,其用于在植物细胞中表达。这些技术是本领域公知的。其可以包括选择和克隆启动子有利于核糖体与mRNA有效
结合的编码序列,以及选择合适的基因终止子序列。一个示例性的组成型启动子是来自花
椰菜花叶病毒的CaMV35S,其一般在植物中产生高表达。其它启动子是更加特异性的,响应植物的内外环境的启动。示例性的光-诱导的启动子是来自甘蓝(cab)基因的启动子,其
编码主叶绿素a/b结合蛋白。
[0453] 一方面,核酸被进行修饰以获得在植物细胞中更高的表达。例如,本发明提供的序列可能相对于植物具有更高的A-T核苷酸对百分比,其中一些植物优选G-C核苷酸对。因此,编码序列中的A-T核苷酸可以被替换为G-C核苷酸而不显著改变氨基酸序列,以增强基
因产物在植物细胞中的生成。
[0454] 可以在基因构建体中加入选择性标记基因以识别已成功整合了该转基因的植物细胞或组织。这可能是必需的,因为在植物细胞中能够结合并表达基因是小概率事件,其只有在少数靶标组织或细胞中才发生。选择性标记基因编码提供试剂抗性的蛋白,所述试剂
通常对植物而言是有毒的,例如抗生素或除草剂。在含有合适的抗生素或除草剂的培养基
上生长时,只有整合了选择性标记基因的植物细胞能够存活。和其它插入基因一样,标记基因同样需要启动子和终止序列以实现正常的功能。
[0455] 一方面,转基因植物或种子的制备包括在目标表达构建体(例如,质粒,噬菌体)中引入本发明提供的序列和(任选地)标记基因,并放置启动子和终止子序列。其可以
涉及通过适当方法将经修饰的基因转移至植物。例如,构建体可以使用例如电穿孔和植
物细胞原生质体微注射技术直接导入植物细胞基因组DNA,或构建体可以使用轰击方法
直接导入植物组织,例如DNA颗粒 轰击。例如,参见例如,Christou(1997)Plant Mol.
Biol.35:197-203;Pawlowski(1996)Mol.Biotechnol.6:17-30;Klein(1987)Nature 327:
70-73;Takumi(1997)Genes Genet.Syst.72:63-69,其中讨论了使用颗粒轰击在小麦中
引入转基因;以及如上Adam(1997),使用颗粒轰击以在植物细胞中引入YAC。例如,如上
Rinehart(1997),使用颗粒轰击以产生转基因棉花植物。加速颗粒的设备描述于美国专
利号5,015,580;以及可以购得的BioRad(Biolistics)PDS-2000颗粒加速装置;还参见,
John,美国专利号5,608,148;和Ellis,美国专利号5,681,730,其中描述了颗粒-介导的
裸子植物转化。
[0456] 一方面,可以将原生质体固定化并注入核酸(例如表达构建体)。虽然从原生质体的植物再生对于谷物而言并不容易,但通过来自原生质体衍生的愈合组织进行体浆胚胎发
生,植物再生可能在豆类中实现。可以使用基因枪技术对有机体组织进行裸露DNA的转化,其中DNA被包裹于钨微粒中并以细胞大小的1/100射入,其携带DNA深入细胞和细胞器。然
后一般通过体浆胚胎发生来诱导转化组织再生。该技术已成功应用于几种谷物,包括玉蜀
黍和水稻。
[0457] 还可以使用重组病毒将核酸(例如表达构建体)导入植物细胞。植物细胞可以使用病毒载体进行转化,例如,烟草花叶病毒衍生的载体(Rouwendal(1997)Plant Mol.
Biol.33:989-999),参见Porta(1996)“Use of viral replicons for the expression of genes in plants,”Mol.Biotechnol.5:209-221。
[0458] 可选地,核酸(例如表达构建体)可以与适当的T-DNA侧区域结合并导入常规的根瘤农杆菌宿主载体。当细胞被该细菌感染时,根瘤农杆菌宿主的毒性功能将构建体和
邻近的标记插入植物细胞DNA中。根瘤农杆菌-介导的转化技术,包括消除防御和二元
载体的使用,被充分描述于科技文献。参见, 例如,Horsch(1984)Science 233:496-498;
Fraley(1983)Proc.Natl.Acad.Sci.USA 80:4803(1983);Gene Transfer to Plants,
Potrykus,ed.(Springer-Verlag,Berlin 1995)。根瘤农杆菌细胞中的DNA被包含于细菌
染色体以及另一种称为Ti(肿瘤-诱导的)质粒的结构中。Ti质粒含有伸长的DNA称为
T-DNA(~20kb长),其在感染过程中被转移入植物细胞;以及一系列的vir(毒性)基因,
其引导感染过程。根瘤农杆菌只能通过伤口感染植物:当植物的根或干受到损伤,其释放某些化学信号,为了响应这些信号,根瘤农杆菌的vir基因被活化并引导一系列将T-DNA从Ti
质粒转移到植物的染色体所必需的事件。然后T-DNA通过伤口进入植物细胞。一种推测是
T-DNA等到植物DNA被复制或转录之后才插入暴露的植物DNA。为了使用根瘤农杆菌作为
转基因载体,需要去除T-DNA的肿瘤-诱导部分,同时保留T-DNA边界区域和vir基因。然
后将所述转基因插入T-DNA边界区域之间,其从该处被转移至植物细胞并整合入植物的染
色体。
[0459] 在一些实施方式中,本发明提供了使用本发明提供的核酸转化单子叶植物的方法,包括重要的谷物,参见Hiei(1997)Plant Mol.Biol.35:205-218。还参见例如,
Horsch,Science(1984)233:496;Fraley(1983)Proc.Natl.Acad.Sci USA 80:4803;如上Thykjaer(1997);Park(1996)Plant Mol.Biol.32:1135-1148,其讨论了将T-DNA整合入基因组DNA。还参见D’Halluin,美国专利号5,712,135,其描述了稳定整合包含谷物或其它
单子叶植物细胞功能性基因的DNA的过程。
[0460] 一方面,第三步可以包括选择和再生能够将导入的靶基因传递至下一代的完整植物。该再生技术依赖于对组织培养的生长培养基中的一些植物激素进行操作,通常依赖于
与所需核苷酸序列一起被导入的杀虫剂和/或除草剂标 记。培养的原生质体中的植物
再生描述于Evans等,Protoplasts Isolation and Culture,Handbook of Plant Cell
Culture,pp.124-176,MacMillilan Publishing Company,New York,1983;和Binding,Regeneration of Plants,Plant Protoplasts,pp.21-73,CRC Press,Boca Raton,1985。
再生还可以通过植物愈合组织、外植体、器官、或其部分来获得。该再生技术大致描述于
Klee(1987)Ann.Rev.of Plant Phys.38:467-486。为了从转基因组织例如未成熟胚中获
得完整植物,所述组织可以在受控的环境条件下在一系列含有营养物和激素的培养基中生
长,该过程被称为组织培养。一旦生成了完整植物并生成了种子,即开始对子代进行评价。 [0461] 在表达框被稳定导入转基因植物后,其可以通过有性杂交被导入其它植物。任何
各种标准育种技术都可以使用,其取决于要杂交的品种。由于本发明提供的核酸的转基因
表达导致表型发生改变,包含本发明提供的重组核酸的植物可以与第二植物进行有性杂交
以获得最终产物。因此,本发明提供的种子可以衍生自两种本发明提供的转基因植物的杂
交,或本发明提供的植物和另一植物的杂交。当两种亲代植物都表达本发明提供的多肽时,所需效果(例如,表达本发明提供的多肽以产生具有改变的、增加和/或降低的脂质或油含
量的植物)可以被增强。所需效果可以通过标准繁殖方式被传递至植物后代。
[0462] 本发明提供的核酸和多肽被表达于或插入任何植物或种子。本发明提供的转基因植物可以是双子叶或单子叶的。本发明提供的单子叶转基因植物的示例是草类,例如
草甸草(蓝草,Poa);饲料草例如羊茅、黑麦草;温带草,例如剪股草(Agrostis);以及谷物,例如,小麦、燕麦、黑麦、大麦、水稻、高粱、以及玉蜀黍(玉米)。本发明提供的双子叶转基因植物的示例是烟草, 豆类例如羽扇豆、马铃著、甜菜、豌豆、豆和大豆,以及十字花科(Brassicaceae)植物,例如花椰菜、油菜籽,以及密切相关的模型生物拟南芥(Arabidopsis thaliana)。因此,本发明提供的转基因植物和种子包括大范围的植物,包括但不限于以
下属的各种:腰果(Anacardium)、花生(Arachis)、芦笋(Asparagus)、颠茄(Atropa)、
燕麦(Avena)、油菜(Brassica)、柑橘(Citrus)、西瓜(Citrullus)、辣椒(Carthamus)、
红花(Capsicum)、茯苓(Cocos)、咖啡(Coffea)、黄瓜(Cucumis)、南瓜(Cucurbita)、胡
萝卜(Daucus)、油棕(Elaeis)、草莓(Fragaria)、大豆(Glycine)、棉花(Gossypium)、
向日葵(Helianthus)、萱草(Heterocallis)、大麦(Hordeum)、莨菪(Hyoscyamus)、莴苣
(Lactuca)、亚麻(Linum)、黑麦草(Lolium)、羽扇豆(羽扇豆us)、番茄(Lycopersicon)、苹果(Malus)、木著(Manihot)、马约喇纳(Majorana)、苜蓿(Medicago)、烟草(Nicotiana)、木犀(Olea)、水稻(Oryza)、稷(Panieum)、狼尾草(Pannisetum)、鳄梨(Persea)、绿
豆(Phaseolus)、阿月浑子(Pistachia)、豌豆(Pisum)、梨(Pyrus)、樱桃(Prunus)、萝
卜(Raphanus)、蓖麻(Ricinus)、黑麦(Secale)、千里光(Senecio)、芥(Sinapis)、茄
(Solanum)、高粱(Sorghum)、可可(Theobromus)、胡芦(Trigonella)、小麦(Triticum)、蚕豆(Vicia)、葡萄(Vitis)、豇豆(Vigna)、和玉蜀黍(Zea)。
[0463] 在可选的实施方式中,本发明提供的核酸在含有纤维细胞的植物中表达,包括例如,棉花、丝光木棉(木棉花、Ceiba pentandra)、沙漠柳、木馏油灌木、winterfat、筏、苎麻、红麻、大麻、洛神葵、黄麻、剑麻蕉麻和亚麻。在可选的实施方式中,本发明提供的转基因植物可以是棉花属的成员,包括任何棉属,例如亚洲棉(G.arboreum)、草棉(G.herbaceum)、海岛棉(G.barbadense)、以及陆地棉(G.hirsutum)的成员。
[0464] 在一些实施方式中,本发明的转基因植物可以被用于生成大量的本发明提供的多肽(例如,抗体、水解酶)。例如参见Palmgren(1997)Trends Genet.13:348;Chong(1997)Transgenic Res.6:289-296(在转基因马铃著植物中使用生长素-诱导的双向甘露碱合酶
(mas1’,2’)启动子与根瘤农杆菌-介导的叶盘转化方法进行生成人乳蛋白β-酪蛋白)。 [0465] 使用已知方法,本领域技术人员能够通过检测转基因植物中转基因mRNA或蛋白
的增加或降低来筛选得到本发明提供的植物。检测和定量mRNA或蛋白的方法是本领域公
知的。
[0466] 本发明提供了来自本发明提供的转基因植物的脂肪酸或脂肪酸衍生物,例如,转基因油脂性植物。一方面,生成了包含至少一种本发明提供的水解酶的转基因油脂性植物。
一方面,转基因植物包括一种可操作地连接于启动子的水解酶基因,其允许在细胞内、细胞外或那些不积累植物脂质的组织部件中表达基因,或允许水解酶的外源性诱导。一方面,收集了含有植物脂质的种子和/或果实,(如果需要的话,在水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)基因诱导处理后)破碎种子和/或果实,从而将脂质与种子和/
或果实中包含的本发明提供的水解酶接触。混合物可以进行孵育,以允许通过破碎材料中
包含的本发明提供的脂肪酶的催化反应进行破碎材料的脂质的酶水解。一方面,对水解形
成的脂肪酸进行萃取和/或转化,以得到所需的脂肪酸衍生物。
[0467] 该本发明提供的酶水解过程使用温和的操作条件且可以是小规模的且使用廉价设备。在这个方面本发明提供的植物被诱导产生水解酶以转化植物脂质。使用该策略中,
预防了酶与存储的植物脂质发生接触,从而避免了在收 获前发生早熟性水解(“植物自降
解”)的任何风险。破碎和孵育单元可以是小规模的;其很多是农业生成中熟知的且可以在植物收获地点进行。
[0468] 一方面,本发明提供的转基因植物通过转化天然油脂性植物进行生成。本发明提供的遗传转化植物然后进行有性繁殖,从而产生本发明提供的转基因种子。这些种子可以
被用于获得子代转基因植物。
[0469] 一方面,水解酶基因被可操作地连接于诱导型启动子以预防任何水解酶和植物脂质的过早接触。该启动子能够引导基因在不同于脂质积累的部分进行表达,或启动子能够
在需要的时间通过外源性诱导启动水解酶表达。
[0470] 多肽和肽
[0471] 在一些实施方式中,本发明提供了分离的、合成的或重组的多肽,其具有与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ IDNO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、或SEQ ID NO:20的序列同一性(例如、至少50%序列同一性),或具有1、2、3、4、5、6、7、8或更多(几个)或全部氨基酸变化的SEQ ID NO:2,如表
3、表4、表9、表10、表11、表16或表23所示,或其等价物。在一些实施方式中,本发明提供了编码具有如下所示序列的多肽的核酸:SEQ IDNO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、或SEQ IDNO:20,或具有1、2、3、4、5、6、7、8或更多(几个)或全部氨基酸变化的SEQ ID NO:2,如表3、表4、表9、表10、表11、表16或表23所示,或其等价物。
[0472] 序列同一性可以是全长的多肽,或者,同一性可以是跨越以下区域:至少约50、60、70、80、90、100、150、200、250、300、350、400、450、 500、550、600、650、700或更多残基。
本发明提供的多肽也可以短于示例性的全长多肽。一方面,本发明提供了仅包含本发明提
供的序列的子序列的多肽,示例性的子序列可以是约5、10、15、20、25、30、35、40、45、50、55、
60、65、70、75、80、85、90、100、125、150、175、200、250、300、350、400、450、500、550、600、650、
700、或更多残基。在可选的方面,多肽(肽,片段)的大小可以在约5至全长的多肽的范围
内,例如本发明提供的酶;示例性的大小为约5、10、15、20、25、30、35、40、45、50、55、60、65、
70、75、80、85、90、100、125、150、175、200、250、300、350、400、450、500、550、600、650、700、或更多残基,例如,本发明提供的示例性的水解酶的连续残基。本发明提供的肽可以用作,例如,标记探针、抗原、耐受原、基序、水解酶活性位点。
[0473] 本发明提供的多肽还包括能够结合本发明提供的水解酶的抗体。
[0474] 本发明提供的多肽还包括与本发明提供的序列“基本上相同”的氨基酸序列,包括与参比序列相比经过一种或更多保守或非保守氨基酸取代、缺失、或插入的序列,特别是该取代发生于分子的非活性位点的时候,并且保证多肽基本上保留其功能属性。保守氨基酸取代,例如,将一种氨基酸取代为另一相同类的氨基酸(例如,将一种疏水性氨基酸,例如异亮氨酸、缬氨酸、亮氨酸、或甲硫氨酸,取代为另一种疏水性氨基酸;或将一种极性氨基酸取代为另一种极性氨基酸,例如将精氨酸替换为赖氨酸,谷氨酸替换为天冬氨酸或谷氨酰
胺替换为天冬酰胺)。可以(例如从水解酶中)删除一种或更多氨基酸,得到多肽结构修
饰,而不显著改变其生物学活性。例如,可以去除对于水解酶活性不是必需的氨基-或羧
基-端氨基酸。
[0475] “氨基酸”或“氨基酸序列”可以包括寡肽、肽、多肽、或蛋白序列,或包括任何上述这些的片段、部分、或亚单位,以及天然产生的或合成的分子。
[0476] 术语“多肽”和“蛋白”可以包括通过肽键或修饰的肽键相互连接的氨基酸,即肽等配物,以及可以含有修饰的、不同于20种基因-编码氨基酸的氨基酸。术语“多肽”还包括肽和多肽片段、基序等等。术语还包括糖基化多肽。本发明提供的肽和多肽还包括所有“模拟物”和“模拟肽”形式,如下详述。
[0477] 本发明提供的多肽包括活性形式或非活性形式的水解酶。例如,本发明提供的多肽包括“成熟”之前或最前原(prepro)序列进行加工之前的前蛋白,例如,通过前蛋白-加工酶(例如前蛋白转化酶)以产生“活性”成熟蛋白。本发明提供的多肽包括由于其他原因
而失活的水解酶,例如,在被翻译后加工事件“活化”前,所述翻译后加工事件例如,内-或外-肽酶或蛋白酶作用、磷酸化事件、酰胺化、糖基化或硫酸化、二聚化事件等。识别“前原”结构域序列和信号序列的方法是本领域公知的,参见,例如,Van de Ven(1993)Crit.Rev.Oncog.4(2):115-136。例如,为了识别前原序列,从胞外空间纯化蛋白并测定N-端蛋白序列,并将其与未加工的形式进行比较。
[0478] 本发明提供的多肽包括全部活性形式,包括活性子序列,例如,本发明提供的酶的催化结构域或活性位点。在一些实施方式中,本发明提供了催化结构域或活性位点,
如下所示。在其它的实施方式中,本发明提供了包含或含有活性位点结构域的肽或多
肽,如应用数据库例如Pfam(其为涵盖多种常规蛋白家族的多序列比对和隐马尔可夫模
型的集合,The Pfam protein families database,A.Bateman,E.Birney,L.Cerruti,
R.Durbin,L.Etwiller,S.R.Eddy,S.Griffiths-Jones,K.L.Howe,M.Marshall,以及E.L.L. Sonnhammer,Nucleic Acids Research,30(1):276-280,2002)所预测的那样,或其等价物。 [0479] 在一些实施方式中,本发明提供了具备或不具备信号序列和/或前原序列的多
肽。在一个实施方式中,本发明提供了具有异源信号序列和/或前原序列的多肽。前原序
列(包括本发明提供的用作异源前原结构域的一种序列)可以位于蛋白的氨基末端或羧基
末端。在另一个实施方式中,本发明提供了包含或含有本发明提供的序列的分离的、合成
的或重组的信号序列、前原序列和催化结构域(例如,“活性位点”)。本发明提供的信号序列、前原结构域和/或催化结构域可以是融合蛋白的一部分,例如,在嵌合蛋白中作为异源结构域。在一些实施方式中,本发明提供了编码这些催化结构域(CD)、前原结构域和信号
序列(SP,例如,具有包含/含有本发明提供的多肽的氨基末端残基序列的肽)的核酸。在
一些实施方式中,本发明提供了包含如下所示序列或由其组成的肽的信号序列:本发明提
供的多肽的残基1至12、1至13、1至14、1至15、1至16、1至17、1至18、1至19、1至20、
1至21、1至22、1至23、1至24、1至25、1至26、1至27、1至28、1至28、1至30、1至31、
1至32、1至33、1至34、1至35、1至36、1至37、1至38、1至39、1至40、1至41、1至42、1
至43、1至44、1至45、1至46、1至47、1至48、1至49或1至50。
[0480] 本发明提供的多肽和肽可以是分离自天然来源的、合成的、或重组产生的多肽。肽和蛋白可以在体外或体内重组表达。本发明提供的肽和多肽可以使用本领域已
知的任何方法进行制备和分离。本发明提供的多肽和肽还可以使用本领域熟知的化
学方法进行合成,全合成或是部分合成。参见例如,Caruthers(1980)Nucleic Acids
Res.Symp.Ser.215-223;Horn(1980)Nucleic Acids Res.Symp.Ser.225-232;Banga,
A.K.,Therapeutic Peptides and Proteins,Formulation,Processing and Delivery
Systems(1995)Technomic Publishing Co.,Lancaster,PA。例如,肽合成可以使用各
种固相技术(参见例如,Roberge(1995)Science 269:202;Merrifield(1997)Methods
Enzymol.289:3-13)和自动合成可以例如根据生成商的说明使用ABI 431A肽合成器
(Perkin Elmer)来进行。
[0481] 本发明提供的肽和多肽还可以被糖基化。糖基化可以在翻译后通过化学方法或细胞生物合成机理进行添加,其中后者包括使用已知的糖基化基序,其对于序列而言可以是
自身的或可以作为肽添加或加入至核酸编码序列。糖基化可以是O-连接的或N-连接的。
[0482] “重组”多肽或蛋白表示由重组DNA技术生成的多肽或蛋白;即由编码所需多肽或蛋白的外源性DNA构建体转化的细胞进行生成。本发明提供的“合成”核酸(包括寡核苷酸)、多肽或蛋白包括由任何化学合成制备的,例如,如下所述。
[0483] 本发明使用的“片段”是天然存在的蛋白的一部分,其可以以至少两种不同构象存在。片段可以具有与天然存在的蛋白相同或基本上相同的氨基酸序列。本发明使用的“酶促活性片段”是氨基酸序列(编码蛋白)的一部分,其保留与之相关的蛋白的至少一种功能
活性。“基本上相同”表示氨基酸序列在很大程度上相同,但不是完全相同,但是保留与之相关的序列的至少一种功能活性。通常如果两种氨基酸序列是至少约85%同一的,那么它们
是“基本上相同”或“基本上同源”的。还包括了与天然存在的蛋白具有不同三维结构结构的片段。一个示例是“前-形成(pro-form)”分子,例如可以通过裂解修饰生成具有显著提高活性的成熟酶的低活性前蛋白。
[0484] 本发明提供的肽和多肽,如上述定义,包括全部“模拟物”和“模拟肽”形式。术语“模拟物”和“模拟肽”表示一种合成化学化合物,其具有与本发明提供的多肽基本上相同的结构和/或功能性质。模拟物可以全部由合成的氨基酸非天然类似物组成,或者是部分天然肽氨基酸和部分非天然氨基酸类似物的嵌合分子。模拟物还可以包括任何数量的天然氨
基酸保守性取代,只要该取代同样基本上不改变模拟物的结构和/或活性。对于本发明提
供的保守变体多肽而言,进行常规实验即可测定模拟物是否属于本发明提供的范围,即其
结构和/或功能基本上不改变。因此,在一方面,如果模拟物组合物具有水解酶活性,那么其属于本发明提供的范围。
[0485] 本发明提供的多肽模拟物组合物可以含有任何非天然结构组分的组合。在可选的方面,本发明提供的模拟物组合物包括以下三种结构基团的一种或全部:a)不同于天然酰
胺键(“肽键”)连接的残基连接基团;b)非天然残基代替天然存在的氨基酸残基;或c)诱
导二级结构模拟的残基,即诱导或稳定二级结构,例如,β转角、γ转角、β折叠、α螺旋构象等。例如,当本发明提供的多肽的全部或一些残基通过不同于天然肽键的化学方式进行
连接时,其可以是被认为是模拟物。个别的模拟肽残基可以通过肽键、其它化学键或偶联方式连接,例如,戊二醛、N-羟基琥珀酰亚胺酯、双功能性马来酰亚胺、N,N’-二环己基碳二亚胺(DCC)或N,N’-二异丙基碳化二亚胺(DIC)。可代替传统酰胺键(“肽键”)连接的连接基团包括,例如,羰基亚甲基(例如,-C(=O)-CH2-代替-C(=O)-NH-)、氨基亚甲基(CH2-NH)、乙烯基、烯基(CH=CH)、醚(CH2-O)、硫醚(CH2-S)、四唑(CN4-)、噻唑、逆向酰胺、硫酰胺、或酯(参见例如,Spatola(1983),Chemistry and Biochemistry of Amino Acids,Peptides and Proteins,Vol.7,pp 267-357,“Peptide Backbone Modifications,”Marcell Dekker,NY)。
[0486] 本发明提供的多肽还可以通过含有全部或一些非天然残基代替天然产生的氨基酸残基而被作为模拟物。非天然残基在科技和专利文献中已有详细描述;一些示例性的非
天然组合物作为天然氨基酸残基的模拟物和方法如下所述。芳香族氨基酸的模拟物可以产
生自被下述替换,例如,D-或L-基丙氨酸;D-或L-苯基甘氨酸;D-或L-2噻吩丙氨酸;
D-或L-1、-2、3-、或4-芘丙氨酸;D-或L-3噻吩丙氨酸;D-或L-(2-吡啶基)-丙氨酸;
D-或L-(3-吡啶基)-丙氨酸;D-或L-(2-吡嗪基)-丙氨酸;D-或L-(4-异丙基)-苯基甘
氨酸;D-(三氟甲基)-苯基甘氨酸;D-(三氟甲基)-苯丙氨酸;D-对-氟-苯丙氨酸;D-或
L-对-二苯基苯丙氨酸;D-或L-对-甲氧基-二苯基苯丙氨酸;D-或L-2-吲哚(烷基)
丙氨酸;且,D-或L-烷基丙氨酸,其中烷基可以是取代或未取代的甲基、乙基、丙基、己基、丁基、戊基、异丙基、异丁基、仲-isotyl、异戊基、或非酸性氨基酸。非天然氨基酸的芳香环族的包括,例如,噻唑基、硫苯基、吡唑基、苯并咪唑基、萘基、呋喃基、吡咯基、以及吡啶基芳香族环。
[0487] 酸性氨基酸的模拟物可以产生自以下取代,例如,保留负电荷的非羧化氨基酸;(膦酰基)丙氨酸;硫酸化苏氨酸。羧基侧链基团(例如,天冬氨酰或谷氨酰)可以通过与
碳化二亚胺(R’-N-C-N-R’)反应进行选择性修饰,例如,1-环己基-3(2-吗啉基-(4-乙
基)碳化二亚胺或1-乙基-3(4-氮阳离子-4,4-二甲氧基戊基)碳化二亚胺。天冬氨酰
或谷氨酰还可以通过与铵离子反应转化为天冬酰胺酰和谷氨酰基残基。基本氨基酸的模拟
物可以产生自下述取代,例如,(除了赖氨酸和精氨酸外的)氨基酸氨酸,瓜氨酸,或(胍基)-乙酸,或 (胍基)烷基-乙酸,其中烷基如上述定义。腈衍生物(例如,含有CN-部分
代替COOH)可以用于取代天冬酰胺或谷氨酰胺。天冬酰胺酰和谷氨酰基残基可以被去氨基
化为相应的天冬氨酰或谷氨酰残基。精氨酸残基模拟物可以通过精氨酰反应产生,例如,与一种或更多常规试剂(包括例如苯基乙二醛、2,3-丁二酮、1,2-环-己二酮、或茚三酮)可选地在碱性条件下反应。酪氨酸残基模拟物可以通过将酪氨酰与例如芳香族的重氮化合物
或四硝基甲烷反应产生。N-乙酰咪唑和四硝基甲烷可以分别用于形成O-乙酰酪氨酰化合
物和3-硝基衍生物。半胱氨酸残基模拟物可以通过将半胱氨酰残基与例如α-卤素乙酸
酯(例如2-氯乙酸或氯乙酰胺)和相应胺类反应以得到羧甲基或羧氨基甲基衍生物而产
生;半胱氨酸残基模拟物还可以通过将半胱氨酰残基与下述物质反应得到,例如,溴-三氟丙酮,α-溴-β-(5-咪唑)丙酸;氯乙酰磷酸,N-烷基马来酰亚胺,3-硝基-2-吡啶基二
硫;甲基2-吡啶基二硫;对氯汞苯甲酸;2-氯汞-4硝基苯酚;或,氯-7-硝基苯并-氧-1,
3-二唑。赖氨酸模拟物可以(和氨基末端残基可以进行改变)通过将赖氨酰与例如琥珀酸
或其它羧酸酐反应产生。赖氨酸和其它含α-氨基残基模拟物还可以通过与亚胺酯反应产
生,例如甲基吡啶亚胺甲酯、磷酸吡哆醛、吡哆醛、氢化氯、三硝基苯磺酸、O-甲基异脲、2,
4戊二酮,以及酰氨基转移酶催化的乙醛酸反应。甲硫氨酸的模拟物可以通过与例如甲硫氨酸亚砜的反应产生。脯氨酸的模拟物包括例如,哌啶酸、四氢噻唑羧酸、3-或4-羟脯氨酸、脱水脯氨酸、3-或4-甲基脯氨酸,或3,3-二甲基脯氨酸。组氨酸残基模拟物可以通过将
组氨酰与例如二乙基焦碳酸酯或对溴苯酰甲基溴的反应得到。其它模拟物包括例如,脯氨
酸和赖氨酸羟基化产物;丝氨酰或苏氨酰残基的羟基基团磷酸化;赖氨酸、精氨酸和组 氨酸的α-氨基基团甲基化;N-端胺基的乙酰化;骨架酰胺残基甲基化或被N-甲基氨基酸取
代;或C-端羧基的酰胺化。
[0488] 本发明提供的多肽的残基(例如氨基酸)还可以为相反手性的氨基酸(或模拟肽残基)。因此,任何天然产生的L构型氨基酸(其还可以表示为R或S构型,取决于化学本
体的结构)可以被替换为相同化学结构类型、但是相反手性的氨基酸或模拟肽,其中该氨
基酸指D-氨基酸,还可以是指R-或S-构型。
[0489] 在一些实施方式中,本发明提供了通过天然加工,例如后翻译加工(例如,磷酸化、酰化等)或通过化学修饰技术对本发明提供的多肽进行修饰的方法,以及所得到的修
饰多肽。修饰可以发生于多肽的任何位置,包括肽骨架、氨基酸侧链和氨基或羧基末端。可以理解相同类型的修饰可以相同或不同程度地存在于给定多肽的几个位点处。给定多肽
还可以具有很多类型的修饰。修饰包括乙酰化、酰化、ADP-核糖基化、酰胺化、共价结合黄素、共价结合血红素基、共价结合核苷酸或核苷酸衍生物、共价结合脂质或脂质衍生物、共价结合磷脂酰肌醇、交联环化、形成二硫键、去甲基化、形成共价交联、形成半胱氨酸、形成焦谷氨酸、甲酰化、γ-羧基化、糖基化、形成GPI锚定、羟基化、碘化、甲基化、十四烷基化、氧化、聚乙二醇化、蛋白水解加工、磷酸化、异戊烯化、消旋化、硒化、硫酸化、以及转移-RNA介导的添加氨基酸至蛋白例如精氨酰化。参见例如,Creighton,T.E.,Proteins-Structure and Molecular Properties 2nd Ed.,W.H.Freeman 和 Company,New York(1993);
Posttranslational Covalent Modification of Proteins,B.C.Johnson,Ed.,Academic Press,New York,pp.1-12(1983)。
[0490] 还可以使用固相化学肽合成方法合成本发明提供的多肽或其片段。该方法自从上世纪60年代初期已经是本领域公知的(Merrifield,R.B.,J.Am. Chem.Soc.,85:
2149-2154,1963)(还参见Stewart,J.M.和Young,J.D.,固相Peptide Synthesis,2nd
Ed.,Pierce Chemical Co.,Rockford,Ill.,pp.11-12)),最近其可以在可购得的实验室肽设计和合成试剂盒(Cambridge Research Biochemicals)中进行。该可购得的实验室试剂
盒已被广泛应用于H.M.Geysen等,Proc.Natl.Acad.Sci.,USA,81:3998(1984)的教导中,并提供了在许多连接在单一平板上的“棒”或“针”的尖端上进行肽合成。当使用该系统时,将具有棒或针的平板倒置插入具有相应孔或槽的第二平板,其含有将合适的氨基酸连接或
锚定至棒或针尖端的溶液。通过重复该处理步骤,即将棒或针倒置插入合适的溶液中,氨
基酸被构建成为所需的肽。另外,可以使用许多可获得的FMOC肽合成系统。例如,多肽或
TM
片段可以在固相载体上使用Applied Biosystems,Inc.Model 431A 自动肽合成仪进行装
配。该设备提供了本发明提供的肽的简易获得方法,其可以直接合成,也可以合成能够使用其它已知技术进行偶联的一系列片段来获得。
[0491] 酶
[0492] 在一些实施方式中,本发明提供了水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶,例如,相对于本发明提供的示例性的多肽(例如,SEQID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、或SEQ IDNO:20,或具有1、2、3、4、5、6、7、8或更多(几个)或全部氨基酸变化的SEQ ID NO:2,如表3、表4、表9、表10、表11、表16或表23所示,或其等价物)而言,包括至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、
79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、
94%、95%、96%、97%、98%、99%、或更多、或完全(100%)序列同一性的蛋白)、其结合的抗体、以及制备和使用它们的方法。本发明提供的多肽可以具有任何水解酶活性,例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性。在可选的方面,本发明提供的酶活性包括水解或合成脂质或油。本发明提供的水解酶能够通过水解、酸解、醇解、甘油解、酯化、转酯化和/或酯交换,包括“被迫迁移”等反应来进行油的修饰。
[0493] 在可选的方面,本发明提供的水解酶可以具有相对于本发明描述的示例性的水解酶或活性而言修饰的或新的活性。本发明提供了具备和不具备信号序列的水解酶和信号序
列自身。本发明提供了固定化水解酶、抗-水解酶抗体及其片段。本发明提供了抑制水解
酶活性的蛋白,例如,结合水解酶活性位点的抗体。本发明提供了包含本发明提供的水解酶的同二聚体和杂络物,例如,融合蛋白,异二聚体等。本发明提供了在广泛的高温和低温以及pH(例如,酸性和碱性的含水条件)范围下具有活性的水解酶。
[0494] 一方面,本发明提供的一种或更多水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)被用于生物催化合成结构化脂质,即在甘油骨架上含有以确定方式分布的一组确定的脂质,包括代可可脂、多-不饱和脂肪酸(PUFA)、1,3-甘油二酯(DAG)、2-甘油单酯(MAG)和甘油三酯(TAG)。
[0495] 本发明提供了产生具有改变的(更高或更低)Kcat/Km的酶的方法。一方面,使用位点-定向诱变创建具有改变的底物特异性的其它水解酶。其可以通过例如重设计酶的底物结合区域或活性位点来实现。一方面,本发明提供的水解酶相对于来自常规或常温生物体
的水解酶在高温下(例如在80℃至85℃至90℃至95℃下)更加稳定。
[0496] 本发明提供的各种蛋白在各种条件下具有水解酶活性,例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶活性。本发明提供了制备根据温度、氧化剂和pH条件而具有不同催化效率和稳定性水解酶的方法。这些方法可以利用例如位点-定向诱变和/或随机诱变技
术。一方面,定向进化可以被用于生成具有改变的特异性和稳定性的水解酶。
[0497] 本发明提供的蛋白被用于识别水解酶调控剂(例如活化剂或抑制剂)的方法中。简而言之,将待测样品(例如,化合物,例如肽或组合文库的成员、肉汤、提取物等)加入水解酶分析以测定其调控能力,例如,抑制或活化、底物裂解能力。这些抑制剂可被用于工业和研究中,以降低或防止不需要的异构化。使用本发明提供的方法发现的调控剂可以被用
于改变(例如,降低或增加)水解酶的活性谱。
[0498] 一方面,本发明提供了使用本发明提供的核酸、多肽和抗体发现水解酶的方法。一方面,筛选了λ噬菌体文库以基于表达发现水解酶。本发明提供了λ噬菌体文库,其用于筛选以允许检测毒性克隆;改进的底物结合;对于工程化宿主的降低的需求,避免了由于
大规模切除文库导致的任何偏见的可能性;以及在低克隆密度下的快速生长。筛选λ噬菌
体文库可以是在液相或在固相中进行。本发明提供了用于液相筛选的方法。其可以提供比
固相筛选更大的分析条件弹性;额外的底物灵活性;弱克隆的更高敏感性;以及简化自动
操控。
[0499] 在其它的实施方式中,本发明提供了使用涉及机器人自动化的本发明提供的蛋白和核酸的筛选方法。其允许在短时间内(例如每天)进行数千个生物催化反应和筛选分
析,以及保证高水平的精确性和可复制性(参见下述关于阵列的讨论)。因此,衍生物化合
物库可以在几周左右生成。
[0500] 在一些实施方式中,本发明提供了水解酶,其为非天然存在的水解酶,具有相对于非天然存在的水解酶不同的水解酶活性、稳定性、底物特异性、pH谱和/或行为特性。这些水解酶具有在自然中没有发现的氨基酸序列。其可以源于将前体水解酶的多种氨基酸残基取代为不同氨基酸。前体水解酶可以是天然存在的水解酶或重组水解酶。一方面,水解酶
变体包括在指定氨基酸残基位点取代任何天然存在的L-氨基酸。
[0501] 水解酶信号序列、前原和催化结构域
[0502] 在一些实施方式中,本发明提供了信号序列(例如信号肽(SP))、前原结构域和催化结构域(CD)。本发明提供的SP、前原结构域和/或CD可以是分离的、合成的或重组的肽,或可以是融合蛋白的一部分,例如,嵌合蛋白中的异源结构域。在一些实施方式中,本发明提供了编码这些催化结构域(CD)、前原结构域和信号序列(SP,例如,包含/含有本发明提
供的多肽的氨基末端残基序列的肽)的核酸。在一些实施方式中,本发明提供了信号序列,其包含含有如下所示序列或由其组成的肽:本发明提供的多肽的1至12、1至13、1至14、
1至15、1至16、1至17、1至18、1至19、1至20、1至21、1至22、1至23、1至24、1至25、
1至26、1至27、1至28、1至28、1至30、1至31、1至32、1至33、1至34、1至35、1至36、1
至37、1至38、1至39、1至40、1至41、1至42、1至43、1至44残基(或更长肽)。在一个
实施方式中,本发明提供了分离的、合成的或重组的信号序列,其包含本发明提供的衍生自本发明提供的另一种酶、或另一种类型的酶或多肽的信号序列,或由其组成。
[0503] 本发明提供的水解酶信号序列(SP)、CD、和/或前原序列可以是分离的肽,或连接另一水解酶或非水解酶多肽的序列,例如作为融合(嵌合)蛋白。 在一些实施方式中,本发明提供了包含本发明提供的水解酶信号序列的多肽。一方面,包含本发明提供的水解酶
信号序列SP、CD、和/或前原序列的多肽包括异源于本发明提供的水解酶的序列(例如,融
合蛋白,其包含本发明提供的SP、CD、和/或前原序列和来自另一水解酶或非水解酶蛋白的序列)。本发明提供了具有本发明提供的异源SP、CD、和/或前原序列的水解酶,例如,具有酵母信号序列的序列。本发明提供的水解酶可以在载体中包括异源SP和/或前原序列,例
如,pPIC系列载体(Invitrogen,Carlsbad,CA)。
[0504] 一方面,在识别新水解酶多肽后识别本发明提供的SP、CD、和/或前原序列。将蛋白分选和转移至其合适的细胞位置的途径通常被称为蛋白靶向途径。所有这些靶向系统的一种最重要的元件是位于新合成的多肽的氨基末端的短氨基酸序列,称为信号序列。该信
号序列引导蛋白到其合适的细胞位置,且其在转运过程中或当细胞抵达其终点时被去除。
大多数溶酶体、膜、或分泌蛋白都具有氨基端信号序列,其将这些蛋白转运至内质网的腔体内。信号序列可以有不同长度,从13至45或更多氨基酸残基。各种识别信号序列的方法
是本领域技术人员已知的。例如,一方面,通过称为信号P的方法识别新水解酶信号肽。信号P使用同时识别信号肽及其裂解位点的组合神经网络。(Nielsen等人,“Identification of prokaryotic and eukaryotic signal peptides and prediction of their cleavage sites.”Protein Engineering,vol.10,no.1,p.1-6(1997)。
[0505] 应当理解在一些方面本发明提供的水解酶可以不含SP和/或前原序列和/或催化结构域(CD)。一方面,本发明提供了缺失全部或部分SP、CD和/或前原结构域的多肽
(例如,水解酶)。另一方面,本发明提供了编码来自一种可操作地连接于不同水解酶核酸
序列的水解酶的信号序列(SP)、CD、和/或 前原序列,任选地,可能需要来自非水解酶蛋白的信号序列(SP)和/或前原结构域。
[0506] 在一些实施方式中,本发明提供了分离的、合成的或重组的包含本发明提供的信号序列(SP)、前原结构域和/或催化结构域(CD)和异源序列的多肽。异源序列是天然状
态下不与SP、前原结构域和/或CD结合的序列(例如,水解酶)。天然不与SP、前原结构
域和/或CD结合的序列可以位于SP、前原结构域和/或CD的氨基末端、羧基末端、和/或
SP和/或CD二者的末端。在一些实施方式中,本发明提供了分离的、合成的或重组的包含
本发明提供的信号序列(SP)、前原结构域和/或催化结构域(CD)的多肽,条件为其不与任
何其天然连接的序列(例如,水解酶序列)相连。本发明提供了编码这些多肽的分离的或
重组的核酸。从而,一方面,本发明提供的分离的、合成的或重组的核酸包括本发明提供的信号序列(SP)、前原结构域和/或催化结构域(CD)的编码序列和异源序列(即非天然连接
于本发明提供的所述信号序列(SP)、前原结构域和/或催化结构域(CD)的序列)。异源序
列可以是位于SP、前原结构域和/或CD编码序列的3’末端、5’末端、和/或两端。
[0507] 在一些实施方式中,本发明提供了将本发明提供的酶的N-端或C-端子序列(例如,信号序列,前原序列)与其它多肽、活性蛋白或蛋白片段进行融合。本发明提供的酶
(例如,水解酶,例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)还可以通过将酶表达为无活性的融合蛋白来生成,后者随后通过蛋白水解裂解事件(使用内源性或外源性蛋白酶活
性,例如,胰蛋白酶)被活化,其导致融合蛋白伴侣与成熟酶(例如,本发明提供的水解酶)发生分离。一方面,本发明提供的融合蛋白表达自杂交核苷酸构建体,其编码一个单独的
开放式阅读框,含有以下元件:融合蛋白的核苷酸序列、接头序列 (定义为编码连接两种弹性较差的蛋白结构域的弹性氨基酸序列的核苷酸序列)、蛋白酶裂解识别位点、以及成熟酶(例如,任何本发明提供的酶,例如,水解酶)序列。在可选的方面,融合蛋白可以包括果胶裂解酶序列、木聚糖酶序列、磷酸磷脂酸序列,或另一种序列,例如,之前已显示在感兴趣的宿主系统中过量表达的序列。可以采用任何宿主系统(参见上述讨论),例如,大肠杆菌或
毕赤酵母。核苷酸序列在嵌合核苷酸构建体中的排列可以根据各融合构建体所获得的蛋白
表达水平来进行测定。按照从核苷酸构建体的5’末端至构建体的3’末端,一方面,核苷酸序列按照如下方式进行组装:信号序列/融合蛋白/接头序列/蛋白酶裂解识别位点/成
熟酶(例如,任何本发明提供的酶,例如,水解酶)或信号序列/前序列/成熟酶/接头序
列/融合蛋白。酶作为无活性融合蛋白的表达(例如,任何本发明提供的酶,例如,水解酶)可以改善酶序列的整体表达,可以减少活性酶过量表达带来的任何潜在毒性和/或可以增
加酶在使用前的保质期,因为直到融合蛋白(例如果胶裂解酶)与酶(例如本发明提供的
水解酶)分离之前,酶是无活性的。
[0508] 在一个实施方式中,本发明提供了用于活化本发明提供的作为融合蛋白表达的水解酶的具体制剂。一方面,通过联合应用蛋白水解活性或潜在的蛋白水解活性以及氨
基-端或羧基-端肽酶(肽酶可以是本发明提供的酶,或另一种酶)来活化初始表达的无
活性融合蛋白的水解酶活性。该活化事件可以在油脱胶应用之前的生成/存储过程的各时
间点通过多种方式进行。本发明提供的示例性的过程包括:由生成宿主表达的内源活性裂
解分泌到发酵培养基中的融合构建体;由被活化的或通过细胞破碎而能够接触到胞内表达
的融合构建体的内源性蛋白酶活性进行裂解;将粗提的或纯化的融合构建体移至固定化蛋
白酶活性的柱子以在酶形成前完成裂解和酶活化(例如,本发明提供的水解 酶,例如,脂
肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶);用可溶的蛋白水解活性来源物处理粗提的或纯
化的融合构建体;在油精炼厂使用可溶或不溶的蛋白水解活性来源物在用于工艺之前即刻
活化水解酶(例如,本发明提供的水解酶);和/或,在降低的温度下(例如,任何约4℃至
20℃之间的温度)通过在固定化蛋白酶活性柱中连续循环融合构建体组分来活化水解酶
活性(例如,本发明提供的脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)。该活化事件可以在运输至应用位置之前或在油精炼厂中现场完成。
[0509] 糖基化
[0510] 本发明提供的肽和多肽(例如,水解酶、抗体)还可以被糖基化,例如,一方面,包含至少一个糖基化位点,例如,N-连接的或O-连接的糖基化。一方面,多肽可以在毕赤酵母或裂殖酵母中表达后被糖基化。糖基化可以在翻译后通过化学方法或细胞生物合成机制
进行添加,其中后者包括使用已知的糖基化基序,其对于序列而言可以是自身的或可以是
作为肽添加或被添加至核酸编码序列。
[0511] 杂交水解酶和肽文库
[0512] 在一些实施方式中,本发明提供了杂交的水解酶(例如,合成蛋白)和融合蛋白,包括肽文库,其包含本发明提供的序列。本发明提供的肽文库可以被用于分离靶标的肽调
控剂(例如,活化剂或抑制剂)。本发明提供的肽文库可以被用于识别靶标的正式结合伴
侣,例如配体,例如,细胞因子、激素等等。
[0513] 一方面,本发明提供的融合蛋白(例如,肽部分)是构象稳定的(相对于线性肽),以允许对靶标的更高结合亲和性。另一方面,本发明提供了融合本发明提供的水解酶和其
它肽,包括已知的和随机的肽。其可以按照下述方式融 合:不严重扰乱酶或抗体(例如,水解酶)的结构,且肽在代谢上或结构构象上是稳定的。其允许建立肽文库,后者在细胞中的存在及其数量都是容易监控的。
[0514] 本发明提供的氨基酸序列变体可以具有预定的变体性质,一种将其与天然形式区分的特征,例如,水解酶序列的等位或种间变异。一方面,本发明提供的变体表现出与天然发生的类似物相同的定性生物学活性。可选的,可以选择具有改变特征的变体。一方面,虽然引入氨基酸序列变异的位点或区域是预定的,但是突变自身并不需要预定。例如,为了最优化给定位点处突变的表现,可以在靶标密码子或区域进行随机诱变并筛选具有所需活性
最佳组合的表达水解酶变体。用于在具有已知序列的DNA预定位点产生取代突变的技术是
公知的,如本发明描述的例如M13引物诱变和PCR诱变。突变体的筛选可以使用蛋白水解
活性分析。在可选的方面,氨基酸取代可以是单残基的;插入可以是约1至20氨基酸的数
量级,虽然也可以进行非常大的插入。缺失可以是约1至约20、30、40、50、60、70残基或更多。为了获得具有最佳性质的最终衍生物,可以使用取代、缺失、插入或其任意组合。通常,这些改变只发生于一些氨基酸,以最少地改变分子。然而,在一些情况下也可以允许发生更大的改变。
[0515] 在一些实施方式中,本发明提供了水解酶,其中多肽骨架结构、二级或三级结构(例如,α-螺旋或β-折叠结构)被修饰。一方面,电荷或疏水性被修饰。一方面,侧链大
小被修饰。功能或免疫特性的主要改变是通过选择保守性较差的取代完成的。例如,可以
进行对下述影响更大的取代:在改变部位的多肽骨架的结构,例如α-螺旋或β-折叠结
构;分子的电荷或疏水性位点,其可以是活性位点;或侧链。在其它的实施方式中,本发明提供了包含本发 明提供的序列取代的蛋白,例如,其中(a)亲水性残基,例如,丝氨酰或苏氨酰,被取代为疏水性残基,例如,亮氨酰、异亮氨酰、苯丙氨酰、缬氨酰或丙氨酰;(b)半胱氨酸或脯氨酸被取代为任何其它残基;(c)具有正电侧链的残基,例如,赖氨酰、精氨酰、或组氨酰,被取代为负电残基,例如,谷氨酰或天冬氨酰;或(d)具有较大侧链的残基,例如,苯丙氨酸,被取代为不具有侧链的残基,例如,甘氨酸。变体可以表现出相同性质的生物学活性(即,水解酶活性),虽然其可以被选择为根据需要进行性质改变的水解酶。
[0516] 一方面,本发明提供的水解酶包括表位或纯化标签、信号序列或其它融合序列等。一方面,本发明提供的水解酶可以融合于随机肽形成融合多肽。本发明“融合的”或“可操作地连接”表示随机肽和水解酶连接到一起,其中连接方式能够最小化对水解酶结构稳定
性的破坏,例如,其保留水解酶活性。融合多肽(或融合多核苷酸编码的融合多肽)还可以
包括进一步的组分,其在多个环(loop)上包括多种肽。
[0517] 一方面,肽(例如,水解酶子序列)和编码其的核酸被随机化,抑或完全随机化或其随机过程中有偏好,例如总体上或在每个位点上的核苷酸/残基频率存在偏好。“随机化”表示各核酸和肽分别包含基本上随机的核苷酸和氨基酸。一方面,生成肽的核酸可以化学
合成,且因此可以在任何位点包括任何核苷酸。因此,当核酸被表达形成肽时,任何氨基酸残基可以被包括于任何位点。可以设计合成过程以产生随机化核酸,以允许在核酸全长形
成全部或大多数的可能的组合,从而形成随机化核酸库。该文库可以提供结构上足够多样
化的随机表达产物群,以影响概率上足够大范围的细胞响应来提供表现出所需响应的一种
或更多细胞。本发明提供了足够大的相互作用文库,由此至少一个成员具有对于一些分子、蛋白或其它因子产生亲和性的结构。
[0518] 筛选方法和“在线”监控设备
[0519] 在实现本发明提供的方法时,可以将本发明提供的多肽和核酸与多种设备和方法结合以例如筛选水解酶活性多肽,从作为水解酶活性潜在活化剂或抑制剂的化合物(例
如,用于潜在药物筛选)中筛选出结合本发明提供的多肽的抗体、与本发明提供的核酸杂
交的核酸,筛选表达本发明提供的多肽的细胞等。参见例如,美国专利号6,337,187。
[0520] 毛细管阵列
[0521] 毛细管阵列,例如GIGAMATRIXTM,Diversa Corporation,San Diego,CA,可以被用于本发明提供的方法。本发明提供的核酸或多肽可以被固定化或用于一种阵列,包括毛细管阵列。阵列可以被用于筛选或调控组合物的文库(例如,小分子、抗体、核酸等),其针对其结合或调控本发明提供的核酸或多肽的活性的能力。毛细管阵列提供了保存和筛选样品
的另一种系统。例如,样品筛选设备可以包括多个与相邻毛细管形成阵列的毛细管,其中各毛细管至少包括形成腔体保存样品的管壁。该设备可以进一步包括间质材料,其位于阵列
中的相邻毛细管之间,以及一种或更多形成于间质材料中的参考标记。用于筛选样品的毛
细管,其中毛细管适于在毛细管阵列中结合,可以包括一种定义样品保存腔的第一管壁,以及一种过滤材料形成的第二管壁,以过滤提供给腔体以激发样品的激发能。
[0522] 多肽或核酸,例如,配体或底物,可以包含于一种第一组分中进入毛细管阵列中至少一部分毛细管。毛细管阵列的各毛细管都可以包括至少一种定义第一组分保存腔的第一管壁。在引入第一组分后可以在毛细管中引入气泡。一种第二组分可以被引入毛细管,其
中第二组分通过气泡从第一组分中分离。感兴趣的样品可以作为被可探测颗粒标记的第一
液体被引入毛细管阵 列的毛细管,其中毛细管阵列的各毛细管包括至少一种定义第一液
体和可探测颗粒保存腔的第一管壁,及其中至少一种管壁用结合材料进行包裹以结合可探
测颗粒至所述至少一种管壁。该方法可以进一步包括从毛细管去除第一液体,其中结合的
可探测颗粒留在毛细管中,并引入一种第二液体至毛细管。
[0523] 毛细管阵列可以包括多种独立的毛细管,其包含至少一个定义腔体的外管壁。毛细管的外管壁可以是一个或更多管壁融合在一起的。类似的,管壁可以定义一种腔体,其
为圆柱形、方形、六角形或或任何其它几何形状,只要管壁能够形成腔体保留液体或样品即可。毛细管阵列的毛细管可以非常近地结合在一起形成平面结构。毛细管可以通过被一起
融合(例如,其中毛细管是玻璃质地的)、胶合、键合或固支进行结合。毛细管阵列可以形成任何数量的各毛细管,例如,从100至4,000,000范围的毛细管。毛细管阵列可以形成微滴
板,其中含有约100,000或更多各毛细管相互结合。
[0524] 阵列或“生物芯片”
[0525] 本发明提供的核酸或多肽可以被固定化或用于一种阵列。阵列可以被用于筛选或调控组合物的文库(例如,小分子、抗体、核酸,等),其针对其结合或调控本发明提供的核酸或多肽的活性的能力。例如,一方面,本发明提供的一种监控参数是转录表达水解酶基
因。一种或更多、或全部细胞转录物可以通过以下方式检测:包含细胞转录物的样品,或,代表或互补于细胞转录物的核酸进行杂交,其中通过杂交于阵列或“生物芯片”上固定化的核酸。通过在微芯片上使用核酸“阵列”,部分或全部细胞转录物可以同时进行定量。可选地,包含基因组核酸的阵列还可以用于测定通过本发明提供的方法制备得到的新型工程化
菌株的基因型。“多肽阵列”还可以用于同时定量多种 蛋白。本发明可以使用任何已知的“阵列”,其也被称为“微阵列”或“核酸阵列”或“多肽阵列”或“抗体阵列”或“生物芯片”或其变异。阵列通常为多个“点”或“靶标元件,”各靶标元件包含给定数量的一种或更多生物学分子,例如寡核苷酸,其固定化于给定的底物表面区域用于特异性结合样品分子,例如,mRNA转录物。
[0526] 本发明提供的“阵列”或“微阵列”或“生物芯片”或“芯片”可以包括多种靶标元件,各靶标元件包含给定数量的一种或更多多肽(包括抗体)或核酸,其固定化于给定的底物表面区域。
[0527] 一方面,水解酶被用作固定化形式。任何固定化方法可以被用于,例如,固定化于惰性载体,例如二乙基氨基乙基-纤维素、多孔玻璃、壳多糖或细胞。表达本发明提供的水解酶的细胞可以通过交联固定化,例如,用戊二醛交联基质表面。
[0528] 在实现本发明提供的方法时,任何已知的阵列和/或制备和使用阵列的方法或其变型可以被完整或部分地结合入本发明,例如以下文献所描述:美国专利号6,277,628;
6,277,489;6,261,776;6,258,606;6,054,270;6,048,695;6,045,996;6,022,963;
6,013,440;5,965,452;5,959,098;5,856,174;5,830,645;5,770,456;5,632,957;
5,556,752;5,143,854;5,807,522;5,800,992;5,744,305;5,700,637;5,556,752;
5,434,049;还参见例如,WO99/51773;WO 99/09217;WO 97/46313;WO 96/17958;还参
见 例 如,Johnston(1998)Curr.Biol.8:R171-R174;Schummer(1997)Biotechniques23:
1087-1092;Kern(1997)Biotechniques 23:120-124;Solinas-Toldo(1997)Genes,
Chromosomes&Cancer 20:399-407;Bowtell(1999)Nature Genetics Supp.21:25-32。
还参见出版的美国专利申请号20010018642;20010019827;20010016322;20010014449;
20010014448;20010012537;20010008765。
[0529] 抗体和基于抗体的筛选方法
[0530] 在一些实施方式中,本发明提供了分离的、合成的或重组的抗体,其特异性结合本发明提供的水解酶。这些抗体可以被用于分离、识别或定量本发明提供的水解酶或相关多肽。这些抗体可以被用于分离其它本发明提供的多肽或其它相关水解酶。
[0531] 本发明提供的“抗体”可以包括肽或多肽其衍生自、模仿、或基本上由免疫球蛋白基因或多种免疫球蛋白基因或其片段所编码,其能够特异性结合抗原或表位,参见,例如,Fundamental Immunology,Third Edition,W.E.Paul,ed.,Raven Press,N.Y.(1993);Wilson(1994)J.Immunol.Methods175:267-273;Yarmush(1992)J.Biochem.Biophys.
Methods 25:85-97。术语抗体包括抗原-结合部分,即,“抗原结合位点”(例如,片段、子序列、互补决定区(CDR)),其保留抗原结合能力,包括(i)Fab片段,含有VL、VH、CL和CH1结构域的单价片段;(ii)F(ab’)2片段,包含两个通过二硫桥在铰链区结合的Fab片段的二价片段;(iii)含有VH和CHl结构域的Fd片段;(iv)含有抗体单臂的VL和VH结构域的Fv
片段;(v)dAb片段(Ward等,(1989)Nature 341:544-546),其包含VH结构域;和(vi)分
离的互补决定区(CDR)。单链抗体同样被包括于术语“抗体”中。本发明提供了抗体,其包括特异性结合本发明提供的水解酶的抗原结合位点和单链抗体。在实现本发明提供的方法
时,还可以使用具有水解酶活性的多肽。
[0532] 抗体可被用于免疫沉淀、染色、免疫亲和柱等。如果需要,编码特异性抗原的核酸序列可以免疫产生,然后分离多肽或核酸,扩增或克隆并将多肽 固定化于本发明提供的阵列上。可选地,本发明提供的方法可以被用于修饰通过待修饰细胞产生的抗体的结构,例如,可以增加或减少抗体的亲和性。此外,制备或修饰抗体的能力可以通过本发明提供的方法进行表型工程化至细胞中。
[0533] 免疫、生成和分离抗体(多克隆和单克隆)的方法是本领域技术人员已知的,并描述于科技文献,参见例如,Coligan,CURRENT PROTOCOLS IN IMMUNOLOGY,Wiley/
Greene,NY(1991);Stites(eds.)BASIC AND CLINICAL IMMUNOLOGY(7th ed.)Lange
Medical Publications,Los Altos,CA(“Stites”);Goding,MONOCLONAL ANTIBODIES:
PRINCIPLES AND PRACTICE(2d ed.)Academic Press,New York,NY(1986);Kohler(1975)Nature 256:495;Harlow(1988)ANTIBODIES,A LABORATORY MANUAL,Cold Spring Harbor Publications,New York。除了传统的使用动物的体内方法外,抗体还可以体外产生,例
如,使用表达重组抗体结合位点的噬菌体展示文库。参见,例如,Hoogenboom(1997)Trends Biotechnol.15:62-70;Katz(1997)Annu.Rev.Biophys.Biomol.Struct.26:27-45。
[0534] 多肽或肽可以被用于产生抗体,其特异性结合本发明提供的多肽。得到的抗体可以用于免疫亲和性层析过程以分离或纯化多肽或判断多肽是否存在于生物样品中。在该过
程中,蛋白制剂例如抽提物或生物样品与能够特异性结合本发明提供的一种多肽的抗体接
触。
[0535] 在免疫亲和性过程,抗体被结合至固相载体,例如小球或其它柱状基质。蛋白制剂与抗体接触,其条件为抗体特异性结合本发明提供的一种多肽。在洗涤去除非特异性结合蛋白后,将特异性结合多肽进行洗脱。
[0536] 生物样品中的蛋白质结合抗体的能力可以使用本领域技术人员熟知的任何过程进行测定。例如,可以通过用可探测标签,例如荧光剂、酶标签、或放射性同位素标记抗体来测定结合。可选地,抗体与样品的结合可以使用具有该可探测标签的第二抗体进行测定。特别的分析包括ELISA分析法、夹心分析法、放射免疫分析法、以及蛋白质印迹。
[0537] 本发明提供的多肽的多克隆抗体可以通过直接注射多肽至动物体或施用多肽至非人动物获得。如此获得的抗体然后结合到多肽自身。在该方式中,甚至是只编码多肽片
段的序列也可以被用于产生抗体,其可能结合完整的自体多肽。该抗体可以然后被用于从
表达多肽的细胞中分离多肽。
[0538] 为了制备单克隆抗体,可以采用任何能够提供产生自连续细胞系培养物的抗体的技术。示例包括杂交瘤技术、三源杂交瘤技术、人B细胞杂交瘤技术、以及EBV-杂交瘤技术(参见,例如,Cole(1985),Monoclonal Antibodies and Cancer Therapy,Alan R.Liss,Inc.,pp.77-96)。
[0539] 可以采用单链抗体生成技术(参见,例如,美国专利号4,946,778)以生成本发明提供的多肽的单链抗体。可选的,转基因小鼠可以被用于表达这些多肽或其片段的人源化
抗体。
[0540] 本发明提供的多肽的抗体(包括抗-个体基因型抗体)可以用于从其它生物体和样品中筛选相似多肽。在该技术中,生物体中的多肽与抗体进行接触,并检测这些特异性结合抗体的多肽。任何如上所述的过程可用于检测抗体结合。
[0541] 固定化水解酶
[0542] 一方面,本发明提供的水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)作为固定化形式被使用以例如在结构化脂质合成中加工脂质、消化 蛋白等。本发明提供的固定化脂肪酶可以被用于,例如,甘油三酯、甘油二酯或酯的水解,或脂肪酸、甘油二酯或甘油三酯的酯化或转酯化,或脂肪的酯交换。一方面,脂肪酶特异性地用醇酯化脂肪酸,1,
3-特异性或特异性地水解部分甘油酯、酯或甘油三酯。本发明提供的固定化脂肪酶可被用
于填充床,以连续转酯化无溶剂脂肪。参见,例如,美国专利号4,818,695;5,569,594。 [0543] 可以使用任何固定化方法或载体形式,例如,阵列、小球、毛细管载体等,如上所述。一方面,水解酶固定化可以发生于惰性载体上,例如二乙基氨基乙基-纤维素、多孔玻璃、壳多糖或细胞。表达本发明提供的水解酶的细胞可以通过交联进行固定化,例如,通过戊二醛交联至基质表面。本发明提供的固定化水解酶可以通过将水解酶结合至干燥、多孔
的微粒疏水性载体进行制备,其中使用表面活性剂,例如聚氧乙烯基山梨聚糖脂肪酸酯或
聚甘油脂肪酸酯。载体可以是一种脂肪族烯基聚合物,例如聚乙烯或聚丙烯,苯乙烯的单共聚物或多共聚物或其混合,或预处理的无机载体。这些载体可以选自脂肪族烯基聚合物,氧化聚合物,这些聚合物的共混物或预处理的无机载体,以使得这些载体具有疏水性。该预处理可以包括用有机硅化合物进行硅烷化。无机材料可以是二氧化硅、氧化、玻璃或陶瓷。
载体可以制备自聚苯乙烯、苯乙烯共聚物、聚乙烯、聚丙烯或来自(甲基)丙烯酸衍生的共
聚物。参见,例如,美国专利号5,773,266。
[0544] 水解酶、其片段和编码酶和片段的核酸可以被固定于固体载体。其在工业过程使用水解酶中经常是经济有效的。例如,用于特异性化学反应中的联合或混合的水解酶(或
其活性片段)可以被结合于固体载体并浸入反应釜,即可以发生酶反应,然后,固体载体可以与其固定的酶一起被取出反应釜用于 重复使用。在一个本发明提供的实施方式中,本发明提供的分离的核酸被固定于固体载体。在另一个本发明提供的实施方式中,固体载体选
自凝胶、树脂、聚合物、陶瓷、玻璃、微电极及其任意组合。
[0545] 例如,本发明提供的固体载体包括凝胶。凝胶的一些示例包括EPHAROSETM(GEHealthcare,Piscataway,NJ)、明胶、戊二醛、壳聚糖一处理的戊二醛、白蛋白-戊二醛、壳聚糖-黄原胶、toyopearl凝胶(聚合物凝胶)、海藻酸钠、海藻酸钠-聚赖氨酸、卡拉胶、
琼脂、乙醛酰琼脂糖、磁性琼脂糖、葡聚糖-琼脂糖、聚(甲酰磺酸盐)水凝胶、牛血清白蛋白-聚乙二醇水凝胶、磷酸化聚乙烯醇(PVA)、单氨基乙基-N-氨基乙基(MANA)、氨基,或其任何组合。
[0546] 本发明提供的其它固体载体包括树脂或聚合物。树脂或聚合物的一些示例包括TM TM
纤维素、丙烯酰胺、尼龙、人造丝、聚酯、阴离子交换树脂、AMBERLITE XAD-7、AMBERLITE TM TM
XAD-8、AMBERLITE IRA-94、AMBERLITE IRC-50(Rohm和Haas、Philadelphia、PA)、聚乙烯、聚丙烯、聚甲基丙烯酸酯,或其任意组合。
[0547] 本发明提供的另一种类型的固体载体包括陶瓷。一些示例包括非多孔陶瓷、多孔陶瓷、SiO2、Al2O3。本发明中另一种有用类型的固体载体是玻璃。一些示例包括非多孔玻璃、多孔玻璃、氨基丙基玻璃或其任意组合。可以使用的另一种类型的固体载体是微电极。
一个示例是聚乙烯基亚胺-包被的磁。石墨颗粒可以被用作固体载体。
[0548] 另一种类型的本发明提供的固体载体包括硅藻土产品和硅酸盐。一些示例包括硅藻土和MICRO-
TM
SILASORB 、以及 (World Minerals Inc.,Santa Barbara,CA)
合成钙和硅酸镁。
[0549] 固体载体的另一种示例是或包括细胞,例如红细胞。
[0550] 试剂盒
[0551] 在一些实施方式中,本发明提供了试剂盒,其包含组合物,例如,本发明提供的核酸、表达框、载体、细胞、转基因种子或植物或植物部分、多肽(例如、水解酶)和/或抗体。试剂盒还可以含有说明性材料,其教导本发明提供的方法和工业应用,如文中所述。
[0552] 工业和医疗应用
[0553] 本发明提供的水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)具有很多工业应用和医疗应用,且一些示例性的应用和组合物描述如下。本发明提供的工艺包括
转化非水合的磷酸脂为水合的形式,油料脱胶,食品加工,来自植物、鱼、藻类等的油料加工(例如,制备低饱和油),本发明仅列举一些应用。
[0554] 加工食品和饲料
[0555] 在一些实施方式中,本发明提供了使用本发明提供的水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)的奶酪制备工艺。在其它的实施方式中,本发明提供了包含水解酶的奶酪。一方面,本发明提供的酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂
酸酶或其组合)被用于加工奶酪以增加风味、提高产率和/或用于“稳定化”奶酪,例如,
通过降低“脱油”的倾向,或者,一方面,本发明提供的酶被用于从奶酪乳生成奶酪。这些本发明提供的工艺可以包括任何方法或过程,例如,描述于例如美国专利号6,551,635和
6,399,121、WO 03/070013、WO 00/054601。例如,一方面,本发明提供的水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)被用于在乳或含乳组 合物中稳定例如乳霜中的脂
肪乳液,以及被用于稳定乳组合物,例如,用于生成乳霜或乳霜酒。在一个实施方式中,本发明提供了使用至少一种本发明提供的酶以增强奶酪风味的工艺,其包括将蛋白、脂肪和蛋
白酶和脂肪酶(例如,本发明提供的)在水介质中一起孵育,条件为其中产生增强的奶酪风
味(例如,降低的苦味),例如,描述于WO 99/66805。一方面,本发明提供的脂肪酶被用于增强奶酪(例如,凝乳)风味,其与水、蛋白酶以及磷酸脂肪酶在升高的温度,例如约75oC
至95oC下进行混合,描述于例如美国专利号4,752,483。一方面,本发明提供的脂肪酶被用于加速奶酪老化,其中在添加凝结剂至乳液之前添加本发明提供的酶至奶酪(例如,奶酪
乳),或在加工前添加本发明提供的酶(例如,脂肪酶)至具有盐的凝乳,例如,描述于例如美国专利号4,707,364。一方面,本发明提供的脂肪酶被用于降解乳脂肪中的甘油三酯以释放游离脂肪酸,得到风味增强。本发明提供的酶还可被用于任何本发明提供的这些工艺,参见例如,Brindisi(2001)J.of Food Sci.66:1100-1107。
[0556] 结构化合成和油料加工
[0557] 在一些实施方式中,本发明提供了使用本发明提供的水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)结构化合成油、脂质等的方法。本发明提供的方法包括生物催化合成结构化脂质,即骨架上按照确定的方式分布有确定的一组脂肪酸的脂质,例如
甘油骨架。使用水解酶和使用本发明提供的方法产生的产品包括低饱和油,例如,来自蔬
菜(例如,大豆、油菜)、动物、植物、鱼、藻类的油,其中使用本发明提供的多肽对油进行加工或处理;和通过使用本发明提供的方法和/或组合物(例如,酶)制备的含有低饱和油的
食品、饲料、添加剂、药物等等。使用本发明提供的水解酶和方法得到 的产品还包括代可可脂、含有多-不饱和脂肪酸(PUFA)的脂质、含有必需脂肪酸的脂质、含有单不饱和脂肪酸的脂质、含有磷酸-胆碱和磷酸-丝氨酸的脂质、含有植物甾醇、1,3-甘油二酯(DAG)、2-甘油单酯(MAG)和甘油三酯(TAG)的脂质。
[0558] 本发明提供的方法能够合成具备确定的区域选择性和立体选择性的脂质或脂肪酸。本发明提供了油、脂质等等,且可被用作食品和饲料和烹饪材料的油(例如,烹饪油、煎炸油、烘焙油、酱、卤汁、调味品、喷油、人造黄油、蛋黄酱、可匙取和可倾倒的调料酱、代可可脂等)已经使用本发明提供的多肽或肽(例如,水解酶,例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)进行了加工或处理。在一些实施方式中,本发明提供了药物、保健食品和化妆品,其包含本发明提供的多肽(例如,水解酶,例如脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶;或肽或抗体)。
[0559] 在一些实施方式中,本发明提供了使用本发明提供的水解酶用于加工(修饰)油、脂质等的方法。该方法可以被用于加工来自植物、动物、微生物的油。本发明提供的方法
可被用于类似于植物、动物、和微生物中发现的油的结构化合成,其类似于植物、动物、和微生物中发现的油。脂质和油可以进行加工以获得期望的特性。可以采用本发明提供的方
法(使用本发明提供的水解酶)进行加工的脂质和油包括代可可脂、含有多-不饱和脂肪
酸(PUFA)的脂质、含有必需脂肪酸的脂质、含有单不饱和脂肪酸的脂质、含有磷酸-胆碱
和磷酸-丝氨酸的脂质、含有植物甾醇、1,3-甘油二酯(DAG)、2-甘油单酯(MAG)和甘油三
酯(TAG)的脂质。一方面,本发明提供的经加工和合成的油和脂肪(例如,可可脂代替物
和植物油)可被用于多种应用,例如,用于生成食品(例如,糖果,糕饼)和药物、保健食品和化妆品的制剂。本发明提供了使用本发 明提供的水解酶加工脂肪和油的方法,例如,油料种子,来自植物,包括,例如,油菜、蓖麻、椰子、香菜、玉米、棉籽、榛子、大麻籽、亚麻籽、池花籽、橄榄、棕榈、棕榈仁、花生、油菜籽、米糠、红花、油茶、大豆、向日葵、妥尔(tall)、山茶;
经过遗传修饰的微生物(GMO)和传统的“育种”而具有改变的脂肪酸组合物的各种“天然
的”油,例如高油酸、低亚麻酸、或低饱和油(高油酸菜籽油,低亚麻酸大豆油或高硬脂酸葵花籽油),或上述任何油的共混物。
[0560] 在一些实施方式中,本发明提供了使用本发明提供的水解酶加工动物油的方法,例如,鱼油(烛鱼、鱼肝、罗非鱼、沙丁鱼、鲱鱼、油鲱鱼等)、哺乳动物油(猪肉、牛肉,等等)和家禽油(鸡,等等)。在一些实施方式中,本发明提供了使用本发明提供的水解酶用于结
构化合成类似动物油的方法,例如,鱼、家禽、以及哺乳动物和微生物。一方面,这些合成或加工的油被用于饲料添加剂、食品、药物制剂成分、保健食品或化妆品。例如,一方面,本发明提供的水解酶被用于水解从鱼油中分离的脂肪酸,从而可以回收脂肪酸并用作饲料添加
剂。一方面,本发明提供的水解酶可以被用于加工来自餐厅废弃物的油并提供动物脂肪。 [0561] 在其它的实施方式中,本发明提供了加工脂肪和油的方法,例如,来自藻类油的脂肪或和油,包括例如,Neochloris oleoabundans藻油、二形栅藻油、眼虫藻油、三角褐指藻油、颗石藻油、小定鞭金藻油、扁藻油、四爿藻油、绿光等鞭金藻油、微拟球藻油、丛粒藻油、杜氏藻油、微球藻油、螺旋藻油、绿藻油、以及硅藻油或所述任何脂肪和油的共混物。
[0562] 一方面,本发明提供的水解酶在有机合成中是多用途生物催化剂,例如,用于结构化合成油、脂质等。本发明提供的酶(包括水解酶,例如,脂肪 酶、饱和酶、棕榈酸酶和/或硬脂酸酶)可以接受大范围的底物,包括二级和三级醇,例如,来自天然产物例如α-松油醇、沉香醇等。在一些方面,本发明提供的水解酶具有良好至优秀的对映体特异性(例如,立体特异性)。
[0563] 在一些实施方式中,本发明提供了油(例如,植物油、可可脂等)转化工艺,其包括本发明提供的至少一种酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)。一方面,油转化工艺包括控制的水解和酰化,例如,甘油酰化,其可以产生高纯度的多种产品。一方面,本发明提供的水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)被用以生成甘油二酯和结构化营养油。在一些实施方式中,本发明提供了使用本发明提供的酶酯化丙二醇
的工艺,例如,使用区域-和/或化学-选择性脂肪酶进行Sn-1位点单-取代酯化。本发
明提供了使用本发明提供的酶对具有目标饱和或不饱和脂肪酸谱的油进行结构化合成的
工艺,例如,使用区域-和/或化学-选择性脂肪酶进行饱和脂肪酸的去除,或靶向添加脂
肪酸至甘油骨架。
[0564] 一方面,本发明提供的方法进一步包括使用本发明提供的一种水解酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)从油中选择性去除脂肪酸(例如,不需要的脂肪
酸)的工艺,例如,从油中分离饱和和/或不饱和脂肪酸。本发明提供的工艺可以从任何油,例如,大豆油中分离饱和和/或不饱和脂肪酸。酶可以具有化学选择性和/或对映体选择
性。一方面,这些工艺产生高稳定性脂肪和油,例如,“健康”煎炸油。本发明提供的该示例性的工艺可以被用于生成硫含量低的油,例如,使用包括从粗油中去硫的工艺。本发明提供的酶还可以被用于酯交换工艺,其用于这些和其它目的。
[0565] 一方面,使用本发明提供的酶以产生“无-反式”脂肪油。一方面,“无-反式”油产生自部分氢化的油以生成全顺式的油。酶可以是化学选择性和/或对映体选择性的。
[0566] 在另一个实施方式中,本发明提供了使用本发明提供的酶修饰可可脂的工艺。约80%的可可脂包括POP、SOS和POS甘油三酯(P为棕榈酸脂肪酸,O为油酸脂肪酸,S为硬
脂酸脂肪酸)。可可脂的饱和-不饱和-饱和脂肪酸结构导致了其特有的融解曲线,例如,
在巧克力中。一方面,本发明提供的结构化和直接合成工艺被用于可可脂以降低可可脂变
异或产生合成可可脂(“代可可脂”)。一方面,使用本发明提供的化学选择和/或对映体
选择性(例如,区域-选择性)的水解酶(例如,脂肪酶或酯酶)来制备代可可脂,例如,可
可脂取代物,可可脂替代物和/或可可脂等价物。本发明提供了代可可脂,包括可可脂取代物、可可脂替代物和可可脂等价物及其包含本发明提供的酶的生成中间体。本发明提供的
(使用本发明提供的酶)代可可脂制备工艺可以包括将植物油,例如,棕榈油,与乳木果油
或其等价物、雾草脂或其等价物和Sal固醇或其等价物一起混合,并使用本发明提供的
多肽处理混合的油。一方面,本发明提供的工艺包括使用酯交换。本发明提供的工艺能够
产生组合或结晶的形式,其模拟“天然”可可脂。
[0567] 在一些实施方式中,本发明提供了(使用本发明提供的酶)使用植物油例如低成本油来生成甘油二酯(DAG)例如1,3甘油二酯的工艺。酶可以是化学选择性和/或对映体
选择性的。本发明提供的工艺可以产生具有良好稳定性、长保质期和高温良好表现的含DAG组合物。
[0568] 本发明提供的酶(水解酶,例如,脂肪酶,饱和酶棕榈酸酶和/或硬脂酸酶)和本发明提供的方法还可以被用于酶处理食用油,其描述于,例如,美国 专利号6,025,171。在该示例性的方法中,本发明提供的酶进行固定化,其中通过制备含有连续疏水相的乳液,例如甘油三酯油;和含有两性分子的酶的分散水相,例如本发明提供的脂肪酶;以及在水相
中部分溶解部分不溶的载体材料,并从水相去除水直到该相变为固体酶包被的载体颗粒为
止。载体材料的不溶部分可以是不溶于水和油的材料,或以不溶形式存在的水溶性材料,因为水相已经被水溶性材料所饱和。水相可以形成自含有发酵残渣和可以作为载体材料的生
物质的粗脂肪酶发酵液。固定化脂肪酶可用于油中的酯重排和脱酸。反应后,可以添加水
获得部分溶解的载体,并将得到的含水酶和载体分散在蒸发水的疏水相中以再次获得酶包
被的载体颗粒,从而再生固定化酶以用于随后的反应。
[0569] 本发明提供的酶(例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)和本发明提供的方法还可以被用于制备转酯化的油,其描述于例如美国专利号5,288,619。本发明提供了用于酶促转酯化制备同时具有低反式-酸和低中链脂肪酸含量的人造黄油的方法。该方
法包括步骤如下:提供转含有硬脂酸来源的材料和食用液体植物油的酯化反应混合物,使
用1-,3-位点特异性脂肪酶促转酯化硬脂酸来源的材料和植物油,以及最后氢化脂肪酸混
合物以提供循环的硬脂酸来源的材料用于与植物油循环反应。本发明提供了用于制备转酯
化的油逆流方法。该方法包括步骤如下:提供含有1-,3-位点特异性脂肪酶的转酯化反应
区域,将植物油引入转酯化区,引入硬脂酸来源的材料,逆向通入超临界气体或亚临界液化气体,进行甘油三酯流与反应区中的硬脂酸或硬脂酸单酯流的转酯化反应,抽出转酯化的
甘油三酯人造黄油流,抽出逆流相,氢化转酯化的硬脂酸或硬脂酸单酯以提供氢化的循环
硬脂酸来源的材料,并将氢化的循环硬脂酸来源的材料引入反应区。
[0570] 一方面,为了能使本发明提供的酶起作用,油相和含酶水相这两相必须进行充分混合。仅仅搅拌可能是不够的。如果酶溶解在少量水例如0.5-5重量%(相对于油)中,那
么可以帮助进行酶在油中的良好分散,并将油在该形式中乳化,形成直径小于10微米(均
重)的液滴。液滴可以小于1微米。可进行径向速度大于100cm/秒的湍流搅拌。油还可
以使用外置旋转在反应器中循环。含有酶的水相还可以通过超声进行良好分散。可以使
用分散设备。
[0571] 一方面,本发明提供的酶反应发生于油相和水相之间的边界表面。全部这些措施的目标是为了混合获得含酶水相的最大可能的表面。添加表面活性剂增加了水相的微分
散。从而,在一些情况下,在酶溶液中添加HLB值大于9的表面活性剂,例如十二烷基硫酸
钠,其描述于,例如,EP-A 0513709。改善乳化的相似方法是添加溶血卵磷脂。添加量相对于油可以为0.001%至1%。酶处理的温度并不重要。可以采用20℃和80℃之间的温度,
但是后者只能短时间应用。在该方面,使用了本发明提供的脂肪酶,其具有良好的温度和/或低pH耐受性。30℃至50℃的应用温度是最佳的。处理时间取决于温度,且可以通过增加
温度进行缩短。通常0.1至10小时或1至5小时是足够的。反应发生于反应器中,其可以
被分成不同阶段。因此可以采用连续操作以及批次操作。反应可以在不同温度阶段下进行。
例如,可以在40℃下孵育3小时,然后60℃下1小时。如果反应按阶段进行,其还允许在各
阶段调整不同pH值。例如,通过添加柠檬酸或其它适当的酸,在第一阶段溶液可以将pH调
节为7,例如,以及在第二阶段至2.5。然而,在至少一个阶段,酶溶液的pH必须低于4,或,低于3。如果pH随后被调节为低于该水平,将会发现效果变差。因此柠檬酸可以在酶溶液
与油混合之前加入至酶溶液。
[0572] 本发明提供的酶(水解酶,例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶)和本发明提供的方法还可以被用于制备油,其描述于,例如,美国专利申请号11/567,318,本发明全文引入作为参考。本发明提供了酶处理脂质的连续工艺。该方法涉及使用多种固定床反应器进行含脂质组合物的连续酶促酯交换的工艺和设备,其中含脂质组合物在设备中的
流动可以基本上保留恒定,即使固定床的酶活性随着时间降低,以及固定床被取下线用于,例如维修、更换或补充。
[0573] 在一个实施方式中,本发明提供了通过将油或脂肪与棕榈酸酶反应水解油或脂肪的方法。在一个实施方式中,在具有HLB大于12的乳化剂中进行水解。在一个实施方式
中,棕榈酸酶由具有至少相对于SEQ ID NO:1的50%、60%、70%、75%、80%、85%、90%、
95%、97%、99%、99.5%或100%的序列同一性的核酸序列编码,且具有i)在编码氨基酸残基位点95(或其等价物)处的核苷酸改变(或其等价物),如表9所示;ii)在编码氨基
酸残基位点85和172(或其等价物)处的核苷酸发生改变(或其等价物),如表15所示;
iii)在编码氨基酸残基位点83(或其等价物)处的核苷酸改变(或其等价物),如表16所
示;以及iv)以下沉默突变:35GCT、102GTT、108AGT、117CTT、126AGG、133TCT、以及188ACG。
在一个实施方式中,核酸序列是序列SEQ ID NO:1,且具有i)在编码氨基酸残基位点95(或其等价物)处的核苷酸改变(或其等价物),如表9所示;ii)在编码氨基酸残基位点85和
172(或其等价物)处的核苷酸发生改变(或其等价物),如表15所示;iii)在编码氨基酸
残基位点83(或其等价物)处的核苷酸改变(或其等价物),如表16所示;以及iv)以下
沉默突变:35GCT、102GTT、108AGT、117CTT、126AGG、133TCT、以及188ACG。在一个实施方式中,棕榈酸酶是表9所 示耐热性的命中(hit)29,且具有i)在编码氨基酸残基位点95(或
其等价物)处的核苷酸改变(或其等价物),如表9所示;ii)在编码氨基酸残基位点85和
172(或其等价物)处的核苷酸发生改变(或其等价物),如表15所示;iii)在编码氨基
酸残基位点83(或其等价物)处的核苷酸改变(或其等价物),如表16所示;以及iv)以
下沉默突变:35GCT、102GTT、108AGT、117CTT、126AGG、133TCT、以及188ACG。在一个实施方式中,用于本发明提供的方法的棕榈酸酶是酶29SM,其具有以下沉默突变:35GCT、102GTT、
108AGT、117CTT、126AGG、133TCT、以及188ACG,如实施例12所示。
[0574] 在一些实施方式中,乳化剂具有HLB大于12、14、16、或18。在一些实施方式中,乳化剂选自油酸钠、油酸、亚油酸钠、亚油酸钾、亚麻酸钠、亚麻酸钾、月桂酸钠、月桂酸钾、硬脂酸钠、硬脂酸钾、棕榈酸钠、棕榈酸钾、棕榈油酸钠、棕榈油酸钾或其组合。在一些实施方式中,反应混合物包括基于反应物总重量的约1至20%的水。在一个实施方式中,反应混合物包括基于反应物总重量的约1、3、5、7、10、15、17或20%的水。
[0575] 在一些实施方式中,加入棕榈酸酶之前将油或脂肪与乳化剂进行混合。在一些实施方式中,添加棕榈酸酶之前和/或之后对油/脂肪和乳化剂混合物进行匀浆,以保证均一
的乳液。
[0576] 在一些实施方式中,反应在约20至70℃下进行。在一些实施方式中,反应在约20、30、40、50、60或70℃下进行。在一些实施方式中,本发明提供的棕榈酸酶降低油/脂肪的棕榈酸含量至约5%或更低。在一些实施方式中,本发明提供的棕榈酸酶降低油/脂肪的棕
榈酸含量至约5、4、3、2、1%或更低。在一些实施方式中,所需的棕榈酸含量降低发生于约或小于约48 h、24h、20h、16h、12h、10h、5h或3h。在一些实施方式中,该方法进一步包括预处理,或油/脂肪被脱胶和脱水并降低游离脂肪酸。可以使用本领域技术人员认为合适的任
何预处理方法。在一些实施方式中,该方法进一步包括添加碱基(烧灼添加)形成肥皂。
[0577] 在一些实施方式中,反应用油是精炼油或粗油。在一个实施方式中,反应进一步包括添加磷酸脂。本领域技术人员认为合适的任何磷酸脂都可用于反应。在一个实施方式中,磷酸脂是卵磷脂。在一个实施方式中,本发明提供的反应用油是精炼油且反应包括添加磷酸脂。
[0578] 保健食品
[0579] 一方面,本发明提供的组合物和方法可以被用于制备保健食品,其通过使用本发明提供的酶加工或合成脂质和油,例如,水解酶,例如,本发明提供的脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶。一方面,加工的或合成的脂质或油包括多不饱和脂肪酸(PUFA),甘
油二酯,例如,1,3-甘油二酯(DAG),甘油单酯,例如,2-甘油单酯(MAG)和甘油三酯(TAG)。
一方面,保健食品通过加工来自植物(例如,油料种子)来源或来自动物(例如,鱼油)来
源的甘油二酯(例如1,3-甘油二酯(DAG))、甘油单酯(例如2-甘油单酯(MAG))和/或甘
油三酯(TAG)进行制备。在一些实施方式中,本发明提供了包含本发明提供的多肽(例如,
酶、肽、抗体)的保健食品(例如,食品组合物)。
[0580] 一方面,本发明提供的组合物和方法可以被用于强化食品组合物,特别是基于牛乳的产品,例如,基于牛乳的婴儿配方,其具有胆盐活化的水解酶。由本发明提供的方法和组合物制备的组合物可以被用于喂养新生儿和成熟前的婴儿,其包括施用本发明提供的胆
盐活化的水解酶以增加脂肪消化, 并从而增加生长速率。在一些实施方式中,本发明提供了组合物和用于处理个体中胰酶生成不足的方法,其通过施用与脂肪摄入相关的胆盐活化
的水解酶来进行;另外参见以下讨论。
[0581] 在一些实施方式中,本发明提供了食品组合物,其包含水解酶,例如,本发明提供的胆盐活化的水解酶。在一些实施方式中,本发明提供了食品组合物,其包括含有脂肪的营养基和有效量的本发明提供的胆盐活化的水解酶。在一个实施方式中,本发明提供了基于牛乳的婴儿配方,其包含水解酶,例如,本发明提供的胆盐活化的水解酶。一方面,本发明提供的水解酶在消化长链脂肪酸中具有活性,例如,C12至C22,其在大多数乳品中占有非常高的百分比,例如,99%的人乳。参见例如,美国专利号5,000,975。
[0582] 在一些实施方式中,本发明提供了食品组合物,其包含植物油脂肪和本发明提供的水解酶。在其它的实施方式中,本发明提供了加工乳产品和/或含植物油组合物以制
备食品组合物的方法。一方面,加工的组合物包括月桂酸油、油酸油、棕榈酸油和/或亚油酸油。一方面,米糠油、向日葵油酸油和/或菜籽油可以被用作油酸油。一方面,脂肪和
油,例如,油料种子,其来自植物,包括,例如,油菜、蓖麻、椰子、香菜、玉米、棉籽、榛子、大麻籽、亚麻籽、池花籽、橄榄、棕榈、棕榈仁、花生、油菜籽、米糠、红花、油茶、大豆、向日葵、妥尔(tall)、山茶,经过遗传修饰的微生物(GMO)和传统的“育种”而具有改变的脂肪酸组合物的各种“天然的”油,例如高油酸、低亚麻酸,或低饱和油(高油酸菜籽油,低亚麻酸大豆油或高硬脂酸葵花籽油),用于保健食品和食品组合物的上述任何油的共混物使用本发明提
供的水解酶进行加工或制备。参见,例如,美国专利号4,944,944。
[0583] 一方面,本发明提供的酶按照以在制剂或胃部储存中稳定的形式提供,但是当制剂抵达胃肠道部分时酶具有活性,在此处该制剂通常被消化。用于肠部释放的制剂(例如,微胶囊)是本领域公知的,例如,生物可降解聚合物例如多乳酸化合物和聚乙醇酸交酯,其描述于,例如,美国专利号4,767,628;4,897,268;4,925,673;5,902,617。
[0584] 糖果、可可脂和食品
[0585] 一方面,本发明提供的组合物和方法可以用于制备和加工硬质黄油,例如可可脂(cocao butter)。另一方面,本发明提供了包含本发明提供的多肽(例如,酶,肽,抗体)的糖果、可可脂和食品。
[0586] 本发明提供的组合物和方法可以用于通过“结构化”合成技术制备代可可脂,其中使用酶,例如,水解酶,例如,本发明提供的脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶。例如,一方面,本发明提供的方法加工或合成甘油三酯、甘油二酯和/或甘油单酯用作,例如,代可可脂。一方面,本发明提供的方法产生具有给定的“塑性区”以在低于室温或室温下维持足够硬度的硬质黄油。一方面,加工的或合成的脂质被设计为具有非常窄的“塑性区”,例如,一方面,其在人体温度下迅速熔解。天然可可脂在约30℃至32℃开始变软,以及在约36℃完全融解。天然可可脂可以含有70wt%或更多的三种1,3-二饱和-2-油酰甘油,其为
1,3-二棕榈酰-2-油酰甘油(POP)、1-棕榈酰-2-油酰-3-硬脂酰甘油(POSt)和1,3-二
硬脂酰-2-油酰甘油(StOSt)。这三种甘油酯表现出彼此相似的融解表现,其与可可脂的融
解性质有关,表现出非常窄的塑性区。在一些实施方式中,本发明提供了合成的可可脂或加工的可可脂(使用本发明提供的水解酶合成或加工的,所有可能的组合物都表示可可脂代
替物)具有改变的1,3-二棕榈酰-2-油酰甘油(POP)、1-棕榈酰-2-油酰甘油(POSt) 和
1,3-二硬脂酰-2-油酰甘油(StOSt)含量,取决于合成可可脂的所需性质,以及具有大于或小于70wt%的三种1,3-二饱和-2-油酰甘油的合成可可脂。本发明提供的合成可可脂可
以部分或完全地替代天然或未加工的可可脂,并可以保留或改进必要的硬质黄油属性。
[0587] 在一些实施方式中,本发明提供了合成可可脂或加工的可可脂(使用本发明提供的水解酶合成或加工的),其具有适于在糖果、烘焙和药物产品中应用的期望性质。在其它的实施方式中,本发明提供了糖果、烘焙和药物产品,等等,其包含本发明提供的水解酶。一方面,本发明提供的方法从甜食(例如,巧克力)中制备或加工脂质(脂肪)或将其用于甜
食中。一方面,脂质被进行制备或加工,从而巧克力表现出比从天然可可脂中制备的巧克力更低的指印性,而仍具有在口中快速融解的性质。一方面,脂质被进行制备或加工,从而甜食(例如,巧克力)可以在相对高的环境温度下进行制备,使用冷却水在相对高的温度下制
备。一方面,脂质被进行制备或加工,从而甜食(例如,巧克力)可以储存于相对较热的条
件下,例如,热带或半热带条件或在中央供暖的建筑物中。一方面,脂质被进行制备或加工,从而甜食(例如,巧克力)具备含有坚实的组合物含量和质量的脂质(脂肪)。本发明提供
的酶可以被用于提供可可脂的取代组合物,其可以显著改善其热稳定性并在广泛的用途中
将其替代。
[0588] 人造黄油和起酥油生产
[0589] 在一些实施方式中,本发明提供了合成或加工的脂肪,例如,人造黄油和起酥油,其使用本发明提供的水解酶进行合成或加工。在其它的实施方式中,本发明提供了合成或加工的脂肪,例如,人造黄油和起酥油,其包含本发明提供的多肽(例如,酶、肽、抗体)。 [0590] 在一个实施方式中,本发明提供了加工的脂肪,其包含植物油,例如油菜、蓖麻、椰子、香菜、玉米、棉籽、榛子、大麻籽、亚麻籽、池花籽、橄榄、棕榈、棕榈仁、花生、油菜籽、米糠、红花、油茶、芝麻、大豆、向日葵、妥尔(tall)、山茶,经过遗传修饰的微生物(GMO)和传统的“育种”而具有改变的脂肪酸组合物的各种“天然的”油,例如高油酸、低亚麻酸、或低饱和油(高油酸油菜、低亚麻酸大豆、或高硬脂酸向日葵)类的使用本发明提供的水解酶合成
或加工的油。合成或加工的脂肪,例如,人造黄油和起酥油,被设计为具有期望的“塑性”。很多塑性脂肪产品,例如人造黄油和起酥油,使用硬化油(hard stock)和液体油作为原材料
进行生成。例如,液体油例如油菜、蓖麻、椰子、香菜、玉米、棉籽、榛子、大麻籽、亚麻籽、池花籽、橄榄、棕榈、棕榈仁、花生、油菜籽、米糠、红花、油茶、芝麻、大豆、向日葵、妥尔(tall)、山茶,经过遗传修饰的微生物(GMO)和传统的“育种”而具有改变的脂肪酸组合物的各种“天然的”油,例如高油酸、低亚麻酸、或低饱和油(高油酸油菜,低亚麻酸大豆,或高硬脂酸向日葵),被与其硬化油(hard stock)进行混合,混合物被调整为具有合适的硬度(塑性)。
如此生成的塑性脂肪产品例如人造黄油和起酥油容易形成相对粗的结晶,因为作为原材料
使用的脂肪和油是由具有几乎相同碳链长度的脂肪酸构成的。换而言之,其具有高均一化
的脂肪酸组合物。由于该原因,只要在窄的温度范围内,这些产品的塑性可以维持合适的程度,从而其含有的液体油倾向于溶出。本发明提供了设计的脂肪的制备或加工方法,从而其具有改变的(以及给定的)脂肪酸组合物。得到的油,例如,人造黄油或起酥油,可以具有
更大范围的塑性。
[0591] 一方面,本发明提供的方法和组合物被用于制备或加工植物油,例如油菜、蓖麻、椰子、香菜、玉米、棉籽、榛子、大麻籽、亚麻籽、池花籽、橄 榄、棕榈、棕榈仁、花生、油菜籽、米糠、红花、油茶、芝麻、大豆、向日葵、妥尔(tall)、山茶,经过遗传修饰的微生物(GMO)和传统的“育种”而具有改变的脂肪酸组合物的各种“天然的”油,例如高油酸、低亚麻酸、或低饱和油(高油酸油菜,低亚麻酸大豆,或高硬脂酸向日葵)类的使用本发明提供的水解酶的油,包括酯交换和酶促转酯化,参见例如,美国专利号5,288,619和美国专利申请系列号
11/567,318。本发明提供的方法和组合物可被用于代替随机酯交换,参见例如,美国专利号
3,949,105。一方面,本发明提供的方法和组合物被用于酶促转酯化以制备油,例如,人造黄油,其同时具有低反式酸和低中链脂肪酸含量。
[0592] 一方面,将油(例如棕榈酸或月桂酸类油)的对称结构修饰成例如随机结构。因此,本发明提供的方法可以被用于修饰塑性脂肪产品的性质。一方面,通过本发明提供的
方法进行油的修饰可以被设计以预防或减缓油随着时间的逐渐硬化,特别当储存产品的时
候。
[0593] 一方面,本发明提供的方法和组合物是包含硬脂酸来源的材料和食用液体植物油的转酯化反应混合物,其中使用本发明提供的1-,3-位点特异性脂肪酶转酯化硬脂酸来源
的材料和植物油,并随后氢化脂肪酸混合物以提供循环的硬脂酸来源的材料,用于与植物
油的循环反应。参见例如,美国专利号5,288,619。
[0594] 一方面,使用本发明提供的脂肪酶进行了酯交换反应。一方面,本发明提供的脂肪酶具有甘油三酯1-和3-位点的选择性以减缓或抑制三-饱和甘油三酯在油中的含量增加。该本发明提供的反应可以克服常规随机酯交换的缺陷以及与非特异性脂肪酶进行酯交
换的难度,因为酯交换是由本发明提供的具有甘油三酯1-和3-位点特异性的酶来进行的。
一方面,通过反应温度增加 来进行减缓或预防产品含有的液体油的溶出,其抑制由三饱和甘油三酯含量的增加导致的熔点升高。这就解决了长期储存中产品硬化的问题。
[0595] 药物组合物和治疗水解酶缺陷
[0596] 在一些实施方式中,本发明提供了方法和组合物(本发明提供的酶,例如,本发明提供的酯酶、酰化酶、脂肪酶、磷酸脂酶或蛋白酶),其可被用于处理动物中的水解酶缺陷,例如,哺乳动物,例如人。例如,一方面,本发明提供的方法和组合物被用于治疗患有胰脂肪酶缺陷的患者。一方面,脂肪酶口服给药。本发明提供的酶可以是进行给药以代替或协同猪胰腺酶制剂使用。
[0597] 在一些实施方式中,本发明提供了包含本发明提供的多肽(例如,酶,肽,抗体)的药物组合物。这些药物组合物可以是以下剂型:片剂、丸剂、凝胶、胶囊、水凝胶、喷雾剂、粉剂、气雾剂、植入物、脂质体、乳霜、药膏、液体、微球、多颗粒核心颗粒、乳剂、悬液、纳米结构等等。包含本发明提供的多肽(例如,酶,肽,抗体)的药物组合物可以任何形式进行给药,例如,口服、皮下、腹腔、静脉、局部等等。一方面,本发明提供的药物组合物被制剂化用于局部、舌下、口服、静脉、皮下、肌肉内、透皮、动脉内、关节内、或皮内给药。
[0598] 一方面,用于这些治疗的本发明提供的组合物在酸性条件下具有活性。一方面,本发明提供的组合物在制剂中(例如,片剂、丸剂、凝胶、胶囊、水凝胶、喷雾剂、粉剂、气雾剂)口服给药,其通过胃部的酸性区域并只在相对碱性环境的空肠内释放酶。一方面,本发明提供的水解酶加入载体进行制剂,例如乳糖、蔗糖、山梨醇、甘露醇、淀粉、纤维素衍生物或明胶或任何其它赋形剂。可以添加润滑油例如硬脂酸镁、硬脂酸钙或聚乙二醇蜡。可以 添加浓缩的糖溶液作为包衣,其可以含有添加剂例如滑石粉、二氧化、明胶或阿拉伯胶。
可以使用软胶囊或硬胶囊将水解酶胶囊化成为液体或固体制剂。参见,例如,美国专利号
5,691,181;5,858,755。
[0599] 去污剂
[0600] 在一些实施方式中,本发明提供了方法和组合物(酶,例如,本发明提供的脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶),其可被用于制备和使用去污剂。本发明提供的水
解酶可以被添加至,例如,被混合于,任何已知的去污剂组合物,无论固体或液体,具备或不具备去污剂组合物的改变的组合物。例如,本发明提供的水解酶可以被添加至任何肥皂,例如,脂肪族硫酸盐例如直链或支链烷基或烯基硫酸盐、酰胺硫酸盐、烷基或烯基醚硫酸盐,其具有直链或支链烷基或烯基,其中加入一种或更多的环氧乙烷、环氧丙烷和环氧丁烷;脂肪族磺酸盐例如烷基磺酸盐、酰胺磺酸盐、二基磺基丁二酸盐、α-烯基、亚乙烯基-型烯基和内烯基磺酸盐;芳香族的磺酸盐例如直链或支链烷基苯磺酸盐、烷基或烯基醚碳酸盐
或酰胺,其具有直链或支链烷基或烯基,其中加入一种或更多的环氧乙烷、环氧丙烷和环氧丁烷;或酰胺、α-磺基-脂肪酸盐或酯、氨基酸型表面活性剂、磷酸表面活性剂例如烷基或烯基酸性磷酸、以及烷基或烯基磷酸、磺酸型两性表面活性剂、甜菜碱型两性表面活性剂、烷基或烯基醚或醇,其具有直链或支链烷基或烯基,其中加入一种或更多的环氧乙烷、环氧丙烷和环氧丁烷;聚氧-乙烯烷基苯基醚,其具有直链或支链烷基,其中加入一种或更多的环氧乙烷、环氧丙烷和环氧丁烷;高级脂肪酸链烷醇酰胺或其烯烃氧化物加合物、蔗糖脂肪酸酯、脂肪酸甘油单酯、烷基-或烯基-胺基氧化物、四烷基-铵盐型阳离子表面活性剂,或其组合。参见,例如,美国专利号5,827,718。
[0601] 在一些实施方式中,本发明提供了包含本发明提供的一种或多种多肽(水解酶)的去污剂组合物。其可以使用表面活性和/或非表面活性形式。一方面,水解酶、表面活性和/或非表面活性的总量,可以是从约0.0001%至约1.0%,或从约0.0002%至约0.5%,
以重量计的去污剂组合物。一方面,对于去污剂组合物而言,在酶混合物中,表面活性水解酶为从约5%至约67%且非表面活性水解酶为从约33%至约95%的总水解酶活性。一方
面,总的酶混合物的最适pH为约5至约10.5。
[0602] 一方面,本发明提供的去污剂组合物包括本发明提供的碱性水解酶,其在碱性pH值下发挥功能,这是因为洗涤溶液的pH在常规洗涤条件下可以是在碱性pH范围。参见例
如,美国专利号5,454,971。
[0603] 本领域公知本发明提供的多肽(本发明提供的酶)可被用于任何去污剂组合物,参见例如,美国专利号5,069,810;6,322,595;6,313,081。例如,一方面,提供了洗衣用去污剂组合物。其可以包括0.8ppm至80ppm的本发明提供的脂肪酶。
[0604] 任何制备和使用去污剂组合物的方法可以被用于本发明提供的酶,参见例如,美国专利号6,413,928;6,399,561;6,365,561;6,380,147。去污剂组合物可以是一个和二个部分的含水组合物、无水液体组合物、模铸(cast)固体、颗粒形式、微粒形式、压缩片形式、凝胶形式、粉末、凝胶、水凝胶、脂质体、气雾剂、糊剂和/或膏剂的形式。本发明提供的水解酶还可以固体或液体形式作为洗涤添加剂产品。该添加剂产品被用于补充或增强常规去污
剂组合物的表现,其可以在清洗过程的任何阶段添加。
[0605] 在一些实施方式中,本发明提供了能够使用这些去污剂组合物清除大量的食品污垢、食品残渣膜和其它小量的食品组合物的方法。本发明提供的水 解酶可以催化脂质、脂肪或油水解,便于去除污渍。本发明提供的水解酶可被用于洗碗盘去污剂和纺织品衣物去
污剂。
[0606] 实际活性酶含量取决于该去污剂组合物的生成方法,其并不重要,只要去污剂组合物具有所需的酶活性。一方面,水解酶在最终的组合物中的含量为从约0.001mg至0.5mg
的每克去污剂组合物。选择用于本发明提供的过程和产品的特别的酶取决于最终使用条
件,包括产品的物理形式、使用pH、使用温度以及要降解或改性的污垢类型。对于任何给定系列的应用条件,可以选择酶以提供最优的活性和稳定性。一方面,本发明提供的水解酶在pH范围从约4至约12和温度范围从约20℃至约95℃下具有活性。本发明提供的去污剂可
以包括阳离子、半极性非离子或两性离子表面活性剂;或其混合物。
[0607] 在一个实施方式中,本发明提供的酶可以制成粉末和液体去污剂,其具有pH 4.0至12.0,水平为约0.01至约5%(可选的0.1%至0.5%)以重量计。这些去污剂组合物
还可以包括其它酶例如蛋白酶、纤维素酶、脂肪酶或内切糖苷酶、内切β-1,4-葡聚糖酶、β-葡聚糖酶、内切β-1,3(4)-葡聚糖酶、角质蛋白酶、过氧化物酶、漆酶、淀粉酶、葡糖淀粉酶、果胶酶、还原酶、氧化酶、碳酸氧化酶、木质酶、支链淀粉酶、阿拉伯糖内切酶、半纤维素酶、甘露聚糖酶、木葡聚糖酶、木聚糖酶、果胶乙酰酯酶、鼠李糖半乳糖醛酸聚糖乙酰酯酶、多聚半乳糖醛酸酶、鼠李糖半乳糖醛酸聚糖酶、半乳聚糖酶、果胶裂解酶、果胶甲基酯酶、纤维二糖水解酶和/或转谷酰胺酶。这些去污剂组合物还可以包括增洁剂和稳定剂。
[0608] 在常规清洁组合物中添加本发明提供的水解酶不会产生任何特别的应用限制。换而言之,适合去污剂的任何温度和pH同样适合本发明提供的组合 物,只要在所需用途的
pH和/或温度中酶具有活性或耐受性即可。另外,本发明提供的水解酶可被用于不含去污
剂的清洁组合物,同样的,其可以单独使用或与增洁剂和稳定剂组合使用。
[0609] 在一些实施方式中,本发明提供了清洁组合物,其包括清洁硬表面的去污剂组合物、清洁织物的去污剂组合物、洗碗盘的组合物、口腔清洁组合物、牙齿清洁组合物,以及隐形眼镜清洁溶液。
[0610] 在一些实施方式中,本发明提供了用于洗涤靶标的方法,包括在足以洗涤的条件下接触靶标与本发明提供的多肽。本发明提供的水解酶可以作为洗涤添加剂。本发明提
供的去污剂组合物可以,例如,配制为手洗或机洗的洗衣用去污剂组合物,其中包含本发明提供的多肽。适合印染织物预处理的洗衣添加剂可以包括本发明提供的多肽。织物柔软
剂组合物可以包括本发明提供的水解酶。可选的,本发明提供的水解酶可以被制成去污剂
组合物用于平常家庭用硬表面清洁操作。在可选的方面,去污剂添加剂和本发明提供的去
污剂组合物可以包括一种或更多其它酶,例如蛋白酶、脂肪酶、角质蛋白酶、另一种蛋白酶、糖酶、纤维素酶、果胶酶、甘露聚糖酶、阿拉伯糖酶、半乳聚糖酶、木聚糖酶、氧化酶例如乳糖酶、和/或过氧化物酶(还参见,如上)。本发明提供的酶的性质选择为适合选定的去污剂
(即,pH-最优化,适合其它酶和非酶成份,等),且酶量充足。一方面,本发明提供的酶被用于去除织物中的恶臭材料。可以采用的各种去污剂组合物和用于制备其的方法描述于,
例如,美国专利号6,333,301;6,329,333;6,326,341;6,297,038;6,309,871;6,204,232;
6,197,070;5,856,164。
[0611] 当配制为适合洗衣机洗涤方法使用的组合物后,本发明提供的水解酶可以包括表面活性剂和增洁剂化合物。其还可以另外包括一种或更多去污剂组 分,例如,有机聚合物、漂白剂、另外的酶、抑泡剂、分散剂、石灰皂分散剂、污垢悬浮和抗-再沉淀剂和腐蚀抑制剂。本发明提供的洗衣组合物还可以含有柔软剂作为另外的去污剂组分。当被配制成洗衣
去污剂组合物的时候,含有本发明提供的水解酶的组合物可以提供织物清洁、污渍去除、维持洁白、柔软、颜色外观、防脱色和卫生功用。
[0612] 本发明提供的洗衣去污剂组合物的密度可以是从约200至1500g/升、或约400至1200g/升、或约500至950g/升、或600至800g/升的组合物;该密度可以在约20℃测量。
[0613] 本发明提供的“压缩”形式的洗衣去污剂组合物最好地体现在密度和(对于组合物而言)无机填充盐的数量上。无机填充盐是粉末状去污剂组合物的常规成份。在常规去
污剂组合物中,填充盐占重要部分,一般为17%至35%重量的全组合物。在压缩组合物的
一个方面,填充盐的含量不超过15%的全组合物、或不超过10%、或不超过5%重量的组合物。无机填充盐可以选自碱金属和碱土金属的硫酸盐和氯化物,例如硫酸钠。
[0614] 本发明提供的液体去污剂组合物还可以是“浓缩形式”。一方面,液体去污剂组合物可以含有与常规液体去污剂相比较低含量的水。在可选的方面,浓缩的液体去污剂的水含量小于40%、或小于30%、或小于20%重量的去污剂组合物。本发明提供的去污剂化合
物可以包括描述于WO 97/01629的制剂。
[0615] 本发明提供的水解酶可以用于配制各种清洁组合物。许多已知化合物是适当的表面活性剂,包括非离子、阴离子、阳离子、或两性离子去污剂,例如,公开于美国专利号
4,404,128;4,261,868;5,204,015。另外,本发明提供的酶可以被用于,例如,条状或液体肥皂应用、碗盘护理制剂、隐形眼镜清 洁溶液或产品、肽水解、垃圾处理、织物应用、作为蛋白生成的融合-裂解酶等。本发明提供的水解酶可以对去污剂组合物提供相对于另一去污
剂蛋白酶的增强的表现,即酶基团可以增加一些酶敏感性污渍的清洁,如草渍或血渍,其在标准洗涤过程后进行常规测定。本发明提供的水解酶可以被配制为已知的粉末和液体去污
剂,其具有pH在6.5和12.0之间,水平为约0.01至约5%(例如,约0.1%至0.5%)重
量。这些去污剂清洁组合物还可以包括其它酶,例如其它已知的酯酶、磷酸脂酶、蛋白酶、淀粉酶、纤维素酶、脂肪酶或内切糖苷酶,以及增洁剂和稳定剂。
[0616] 食品处理和食品加工
[0617] 本发明提供的水解酶可以被用于分离植物细胞材料的组分。例如,本发明提供的水解酶可被用于将富含蛋白的材料(例如,植物细胞)分离为组分,例如,来自甜菜或淀粉
的蔗糖或来自马铃著、果肉或外壳部分的糖。一方面,本发明提供的水解酶可以被用于分离富含蛋白的或富含油的作物为有价值的蛋白和油和外壳部分。分离过程可以通过使用本领
域已知的方法来进行。
[0618] 本发明提供的水解酶可被用于制备水果或蔬菜汁、糖浆、提取物等以增加产率。本发明提供的水解酶可被用于酶处理(例如,水解蛋白)各种植物细胞壁衍生的材料或垃圾材料,例如,来自葡萄酒或果汁生成,或农业残留物如蔬菜壳、豆壳、甜菜浆、橄榄浆、马铃著浆等。本发明提供的水解酶可以被用于修饰加工的水果或蔬菜的浓度和外观。本发明提供
的水解酶可以被用于处理植物材料以利于包括食品的植物材料加工,利于纯化或提取植物
组分。本发明提供的水解酶可以被用于改善饲料价值、降低水结合能力、改进废水植物的降解度植物和/或改进植物材料转化为青贮饲料等。
[0619] 动物饲料和食品或饲料添加剂
[0620] 在一些实施方式中,本发明提供了使用本发明提供的水解酶处理动物饲料和食品和食品或饲料添加剂的方法,动物包括哺乳动物(例如,人)、禽、鱼等。在其它的实施方式中,本发明提供了动物饲料、食品、饲料和食品添加剂,以及包含本发明提供的水解酶的添加剂。
[0621] 在一些实施方式中,本发明提供了水解酶用于修饰动物饲料或食品,例如,在体外(通过修饰饲料或食品的组分)或体内加工食品或饲料。另一方面,本发明提供的水解酶可以通过直接在转基因饲料作物(例如,转基因植物、种子等)中表达酶进行提供,例如玉米、大豆、油菜籽、羽扇豆等等。一方面,本发明提供了包含编码本发明提供的多肽的核酸序列的转基因植物、植物部分和植物细胞。一方面,对核酸进行表达,从而本发明提供的水解酶以可回收的量产生。水解酶可以从很多植物或植物部分回收。可选的,含有重组多肽的植物或植物部分可以被用于改进食品或饲料的质量,例如,改进营养价值、风味、以及流变性质,或破坏抗营养因子
[0622] 酯交换
[0623] 一方面,本发明提供的方法和组合物可以被用于修饰甘油三酯混合物的性质,且在一方面,可以用于修饰其稠度。一方面,本发明提供的酶可在催化剂存在的情况下使用,例如金属钠或甲醇钠,以促进甘油酯分子之间的酰基转移,从而该产品含有甘油酯混合物,其中脂肪酰基残基随机分布于甘油酯分子之间。
[0624] 一方面,本发明提供的酶可以被用于生成酯交换产品,其反应条件为脂肪水解被最小化从而脂肪酶催化的酯交换变为主反应。这些条件可以包括,例如,限制系统中的水含量。
[0625] 一方面,本发明提供的酶可以被用于使用甘油三酯和游离脂肪酸混合物催化酯交换反应,其描述于例如,EP 0093602B2。在这些例子中,游离脂肪酸可以与甘油三酯的酰基进行交换,以生成富含添加的脂肪酸的新型甘油三酯。一方面,本发明提供的脂肪酶的1,
3-特异性可以被用于限制反应在甘油酯的1-和3-位点,其允许获得通过与非特异性脂肪
酶的化学酯交换或反应所无法获得的甘油三酯的混合物。一方面,非特异性脂肪酶被用于
获得相似于化学酯交换的结果。
[0626] 使用本发明提供的位点特异性脂肪酶生成新型甘油三酯混合物的能力可用于油和脂肪工业,因为这些混合物中的某些具有有价值的性质。一个示例是1,3-特异性脂肪酶催化作为棕榈油中间成分的主要甘油三酯的1,3-二棕榈酰-2-油酸单甘油酯(POP)与硬
脂酸或三硬脂酸甘油酯的酯交换,以产生富含有价值的1-棕榈酰-3-硬脂酰-2-油酸单甘
油酯(POSt)和1,3-二硬脂酰-2-油酸单甘油酯(StOSt)的产品。POSt和StOSt是可可脂
的重要组分。从而,本发明提供的一个方面提供了酯交换反应以从廉价起始材料生成可可
脂等价物。
[0627] 一方面,本发明提供了使用本发明提供的1,3-特异性脂肪酶生成硬脂肪替代物的方法。一方面,硬脂肪替代物包括至少85%纯度的棕榈中间成分和StOSt、POSt或StOSt/POSt的混合物。
[0628] 本发明将参考以下实施例进行进一步描述;然而,应当理解本发明并不限于这些实施例。
实施例
[0629] 实施例1:示例性的脂肪酶-饱和酶分析
[0630] 以下实施例描述了示例性的分析筛选水解酶例如,脂肪酶、饱和酶、棕榈酸酶和/或硬脂酸酶的活性。一方面,这些示例性的分析可以被用作常规筛选以测定一种多肽是否属于本发明提供的范围。该分析包括使用pH指示剂化合物以检测脂肪酸从甘油三酯中
的裂解、分光光度法方法、HPLC、GC、MS、TLC及其它方法。Jaeger(1994)FEMS Microbiol.Rev.15:29-63;Ader(1997)Methods Enzymol.286:351-386;Vorderwülbecke(1992)
Enzyme Microb.Technol.14:631-639;Renard(1987)Lipids 22:539-541.
[0631] 脂肪酶/酯酶活性筛选
[0632] 用消毒牙签挑取菌落用于单独接种96-孔微孔板的每个孔。孔中含有250μL的LB培养基,其中含有100μg/mL氨苄青霉素、80μg/mL羧苄青霉素、以及10%v/v甘油(LB
Amp/Meth,甘油)。细胞在37℃下不振荡培养过夜。从而每个孔含有大肠杆菌细胞的储存
TM
培养物,其分别含有具有独特DNA插入物的pBLUESCRIPT 。
[0633] 使用96-孔板用于在一块单独的板(“浓缩板”)上进行复数接种,其中在每个TM
孔中含有200μL的LB Amp/Meth,甘油。该步骤使用BIOMEK (Beckman Coulter,Inc.,
Fullerton,CA)的高密度复制工具(HDRT),其中在每次接种之间含有1%漂白剂、水、异
丙醇、风干灭菌的循环。浓缩板的各个孔从而含有来自各来源库平板的10至12个不同
TM
pBLUESCRIPT 克隆。浓缩板在37℃下生长16小时,然后用于接种两个白色96孔微滴子
板(Polyfiltronics,Inc.,Rockland MA),其在各个孔中含有250μL的LBAmp/Meth(无甘
油)。将原始的浓缩板置于-80℃保存。两块浓缩子板在37℃孵育18小时。
[0634] 短链酯酶‘600μM底物储存溶液’如下述制备:将25mg的每种以下化合物溶解于合适体积的DMSO产生25.2mM溶液。所用的化合物是4-甲基伞形酮丙酸、4-甲基伞形酮丁
酸、以及4-甲基伞形酮庚酸。将250微升的各DMSO溶液添加至9mL的50mM、pH 7.5HEPES缓
冲液,其含有0.6%的Triton X-100和0.6mg/mL的十二烷基麦芽糖苷(Anatrace,Maumee,
OH)。用上述HEPES缓冲液将体积补充至10.5mL,产生微混浊的悬液。
[0635] 长链‘600μM底物储存溶液’如下述制备:将25mg的每种以下化合物溶解于DMSO至25.2mM,如上所述。所用的化合物是4-甲基伞形酮反油酸、4-甲基伞形酮棕榈酸、4-甲
基伞形酮油酸、以及4-甲基伞形酮硬脂酸。其全部需要进行70℃水浴的短预热以进行溶
解。将250微升的各DMSO溶液添加至HEPES缓冲液并稀释至10.5mL,如上。全部七种伞形
酮衍生物来自Sigma Chemical Co.(St.Louis,MO)。
[0636] 50μL的长链酯酶或短链酯酶‘600μM底物储存溶液’被加至白色浓缩板的各个TM
孔中,其中使用BIOMEK 以形成底物终浓度约100μM。添加底物后立即在读板荧光计上记
录荧光值(激发=326nm,发射=450nm)。对于长链底物将板在70℃下孵育60分钟,对短
链底物在室温下30分钟。再次记录荧光值。初始和最终荧光值进行比较以确定是否存在
活性克隆。
[0637] 为了分离带有活性的单克隆,将来源的GenBank板进行解冻,各孔被用于单独接种一块含有LB Amp/Meth的新板。如上所述,将在37℃下孵育生长细胞,添加50μL的
TM
600μM底物储存溶液,使用BIOMEK 以及测定荧光。一旦来自来源板的活性孔被识别,即
在37℃下将来自该活性孔的细胞在含有LB/Amp/Meth的琼脂上划线培养过夜以获得单菌
落。用消毒牙签挑取了8个单菌落用于分别接种96孔微滴板的孔。孔中含有250μL的LB
Amp/Meth。细胞在37℃下不振荡培养过夜。从各孔中去除200μL整分试样,并使用合适
的长或短链底物进行分析,如上所述。识别活性最强的克隆,剩下的50μL培养物用于在含有LB/Amp/Meth的琼脂板上划线培养。挑取8个单菌落,培养和分析如上。活性最强的克
隆用于接种3mLLB/Amp/Meth培养物,其进行培养过夜。将质粒DNA从培养物中分离用于测
序。
[0638] 实施例2:用LCMS判断酶水解植物油释放的脂肪酸的分布的示例性流程
[0639] 以下实施例描述了进行酶水解植物油的示例性方法(流程),例如(在该实施例中使用的)大豆油使用(包括酶制剂),例如,本发明提供的酶。本实施例还描述了用于检测
和定量从油中释放的脂肪酸的示例性的方法(流程)。该方法被描述于使用脂肪酶SEQ ID
NO:2,但是其同样适于其它酶,包括本发明提供的酶,例如,示例性的酶具有如SEQ ID NO:
2所示的序列且具有1、2、3、4、5、6、7、8、9、10、11或12或更多或全部氨基酸残基修饰,如表
3、表4、表9、表10、表11、表16或表23所示。
[0640] 96深孔板中表达蛋白:
[0641] 1.在30℃下96深孔板中,在1mL含有羧苄青霉素(100μg/mL)的TB培养基中过夜培养大肠杆菌脂肪酶克隆。记录克隆的位置和编号。
[0642] 2.在新的含TB培养基(1mL;100μg/mL羧苄青霉素)的96深孔板中接种液体培养物(10μL/孔)。
[0643] 3.30℃过夜孵育培养物,并在200rpm下进行振荡。
[0644] 4.通过转移500μL的各过夜培养物至含有TB培养基(500μL/孔;100μg/mL羧苄青霉素)和无水四环素(200ng/mL)的新鲜96孔板诱导蛋白表达。
[0645] 5.在30℃孵育2小时并在200rpm下进行振荡。
[0646] 6.对每块板3000×g离心10分钟收获细胞。去除上清液。细胞沉淀可以直接用于油分析或储存于-20℃以后使用。
[0647] 酶促油水解反应:
[0648] 1.添加100μL的B-PERTM(Pierce Chemical,Rockford,IL)至各细胞沉淀。如果TM
沉淀储存于-20℃,则在添加B-PER 之前室温解冻10min。
[0649] 2.添加400μL大豆油至96深孔板的各个孔。
[0650] 3.在各孔中添加一些小珠子(玻璃710-1180μm)。用CAPMATSTM(Whatman,Florham Park,NJ)密封板。
[0651] 4.使用混合磨碎机(Retsch Inc.,Newtown,PA)裂解细胞产生油/酶/缓冲液乳液。将一对密封的板置于混合磨碎机中振荡30秒,频率为30循环/秒。
[0652] 5.将CAPMATSTM封口膜替换为透气性封口膜。
[0653] 6.在37℃孵育板2小时并在200rpm下进行振荡。
[0654] 脂肪酸萃取:
[0655] 1.添加1mL的萃取溶剂(CHCl3∶MeOH∶4N HCl(2∶1∶0.075))至96深孔板的各个孔。
[0656] 2.上下吹吸混合物数次,直到其呈现均质化。
[0657] 3.用铝箔密封覆盖板。
[0658] 4.3000×g离心5分钟。使用刀片切开封口。
[0659] 5.将吸管头穿透上相并吸取5μL的下相至新的96深孔板,其含有995μL/孔的MeOH(即,下相的1/200稀释液)。小心不要污染上相。在4℃储存分离的萃取混合物。
[0660] 6.将150μL全部样品的上述1/200稀释液转移至聚苯乙烯96孔板。
[0661] 7.为防止蒸发,热封口板。确保封口不接触MeOH,否则其会阻止正确的黏合。
[0662] 8.用LC/MS分析样品。
[0663] LC/MS分析:
[0664] 1.将96-孔板形式的样品通过HTCPALTM自动采样器(LEAPTechnologies,Carrboro,NC)注射至H2O/MeCN(10/90,v/v)和0.1%甲酸的等度混合物,其通过
TM
LC-10ADVP 泵(Shimadzu,Kyoto,Japan)在1.2mL/min下进行传递。
[0665] 2.通过SYNERGI MAX-RPTM(Phenomenex,Sutter Creek CA)150×2.00mm柱进行分TM
离和检测。使用API 4000 三重四级杆串联质谱(Applied Biosystems,Foster,CA)完成
定量,其中使用电喷雾离子化(ESI)并在负离子模式下进行多离子监控质量277,279,281,
255,283。
[0666] 3.通过ANALYST 1.3TM软件(Applied Biosystems,Foster,CA)完成设备控制和数据产生。
[0667] 4.使用标准样品(Sigma)对各脂肪酸在0.5至50μg的范围内进行LC/MS校正。该范围最适合二次回归标准曲线,其用于计算各酶样品中脂肪酸释放的含量。
[0668] 实施例3:HTP筛选脂肪酶进化文库中相对于油酸酯对棕榈酸或硬脂酸酯具有增加的水解选择性的示例性的流程
[0669] 以下实施例描述了高通量(HTP)筛选脂肪酶“进化文库”中相对于油酸酯对棕榈酸或硬脂酸酯具有增加的水解选择性的示例性的方法(流程)。该示例 性的方法(流程/
HTP筛选)描述了筛选衍生自SEQ ID NO:2的脂肪酶进化文库,但是其适用于其它酶,包括
本发明提供的酶,例如,示例性的酶具有如SEQ ID NO:2所示的序列且具有1、2、3、4、5、6、
7、8、9、10、11或12或更多或全部氨基酸残基被修饰,如表3或表4所示;且该示例性的方法(流程)适用于其它文库类型。
[0670] 这些示例性的HTP筛选使用了两种荧光底物:棕榈酸或硬脂酸甲基伞形酮酯,相对于油酸甲基伞形酮酯。
[0671] HTP筛选流程:
[0672] 1.将文库克隆阵列于微滴板并进行初级HTP筛选分析。
[0673] 2.经识别为具有改进的选择性的克隆被指定为初级命中。
[0674] 3.将初级命中重新阵列于微滴板,并在次级HTP筛选中进行分析。
[0675] 4.确认具有改进的选择性的克隆被指定为次级命中。
[0676] 5.对次级命中进行测序以识别序列突变,并对其在油中进行分析(参见分离流程)。
[0677] HTP分析流程
[0678] 1.条形码标记黑色384-孔分析板;条形码标记384-孔生长板并填充30μL/孔LB培养基(100μg/mL羧苄青霉素)。
[0679] 2.针挑(pintool)或挑选克隆至生长板中并在30℃下的增湿培养器中培养过夜。
[0680] 3.添加含有4μg/ml无水四环素的30μL/孔LB培养基(100μg/mL羧苄青霉素)诱导脂肪酶表达并在30℃孵育2小时。
[0681] 4.添加20μl/孔的B-PERTM(Pierce Chemical,Rockford,IL)裂解细胞;室温下保留至置于机器人。
[0682] 5.机器人运行脂肪酶活性分析(参见下文)。
[0683] 6.经识别为具有相对于油酸MeUMB酯增加的棕榈酸或硬脂酸MeUMB酯选择性的克隆被指定为命中。
[0684] 7.挑选命中克隆至含有LB培养基(1mL/孔;100μg/mL羧苄青霉素)的96深孔板在30℃生长过夜。
[0685] 8.对于初级命中,重新阵列于384-孔板并重复次级筛选的步骤1-8;指定命中克隆为次级命中。
[0686] 9.对于步骤8后的次级命中进行测序。
[0687] 自动化HTP筛选流程示例
[0688] 1.Apricot:混合并转移来自“生长板”(参见上述步骤1-4)的裂解细胞整分试样(10μL)至两个分离的分析板(1和2)。
[0689] 2.MULTIDROPTM(Thermo Electron Corporation,Milford,MA):添加70μL底物1(UMB-16:0)至分析板1;添加70μL底物2(UMB-18:1)至分析板2。
[0690] 3.在37℃下孵育分析板20分钟。
[0691] 4.荧光光度计读数:活化360nm和发射465nm。
[0692] 经测定具有独特序列的次级命中克隆进行阵列并在96-孔板生长和进行大豆油分析(参见下文)。
[0693] HTP筛选使用的荧光底物的结构
[0694]SM
[0695] 实施例4:使用GSSM 技术对改进的棕榈酸或硬脂酸酯水解的示例性进化
[0696] 以下实施例描述和总结了示例性的“酶进化”和筛选规程的结果,其中识别了本发明提供的示例性的酶,例如具有如SEQ ID NO:2所示的序列且具有残基修饰如表3或表4所示的酶;或由具有如SEQ ID NO:1所示的序列的核酸编码且具有残基修饰如表3或表4
所示的酶。一方面,使用大豆油作为底物进行了示例性的筛选分析以识别这些本发明提供
的示例性的酶,且对从大豆油释放(水解的)脂肪酸进行了表征,例如,亚麻酸、亚油酸、油酸、棕榈酸或硬脂酸。
[0697] 大豆油具有以下脂肪酸分布:亚麻酸=8%;亚油酸=53%;油酸=23%;棕榈酸=12%;硬脂酸=4%。从而,如果通过一种本发明提供的示例性的酶从大豆油中释放的(水解的)棕榈酸为大于12%,那么该酶具有水解(释放)棕榈酸偏好性。
[0698] 棕榈酸酶筛选:制备“棕榈酸酶文库”SM
[0699] 通过GSSM 技术(专利号6,171,820)制备了SEQ ID NO:2的变体的棕榈酸酶文库。使用简并寡核苷酸引入点突变,一次一个氨基酸位点,从而各初始密码子被20种天然
编码氨基酸的每一种所取代。将突变的变体转化入大肠杆菌宿主TOP10(Invitrogen,USA)
用于表达和筛选。在表达载体pASK-5中构建文库,其为载体pASK-IBA(IBA GmbH,Germany)进行修饰得到的。为了制备pASK-5,初始克隆接头被替换为新的克隆位点,特别的,从XbaI到HindIII的pASK-IBA序列被替换为以下序列:
[0700]
[0701] 当达到最佳宿主细胞密度后用无水四环素诱导GSSMSM变体表达。
[0702] 对具有产生自GSSMSM技术的氨基酸序列的酶通过高-通量(HTP)筛选流程进行了筛选,例如,描述于实施例3的流程,其测定了何种脂肪酸被从脂肪-在本分析中为大豆
油-中优先水解。进化过程的目标是改进亲代序列,SEQ ID NO:2,在油中的棕榈酸选择
性。该分析包括将新的/序列修饰的酶接触大豆油,其含有各种脂肪酸,包括亚麻酸、亚油酸、油酸、棕榈酸和硬脂酸(参见分布%,如上所述),和检测由各修饰的酶所水解的各脂肪酸的量。识别了促使酶从大豆油中优先水解棕榈酸(或硬脂酸,参见下文)的序列的“文
库”(所谓的“棕榈酸文库”):
[0703] ·使用HTP筛选进行初级和次级筛选,例如,描述于实施例3的方法;
[0704] ·对次级命中识别的氨基酸突变进行测序,与例如亲代序列SEQ IDNO:2相比,其在HTP筛选中产生了相对于油酸的改进的棕榈酸水解选择性。
[0705] ·对于各编码氨基酸突变的密码子变体,分别挑选一个克隆并阵列于96-孔板用于油分析;
[0706] ·从油分析中获得突变体酶对于棕榈酸或硬脂酸或其它脂肪酸的选择性(表3)
[0707] ·相对于(vs)相同分析中SEQ ID NO:2的43%,最佳命中产生了59%棕榈酸的释放脂肪酸(FA);其对应的选择性因子从3.6增加到4.9;
[0708] ·另有几个克隆表现出硬脂酸选择性增加。
[0709] 表1,如下,总结了选自要通过基因再组装SM技术(参见实施例5)进行组合的“棕SM
榈酸文库”的包含物的GSSM 突变(参见上文)。在示例性的分析中,识别了14个单点氨
基酸突变,其在油分析中产生棕榈酸水解的最大增加(还参见表1、3和4,如下)。根据残
基发生于亲代SEQ ID NO:2(参见图7)中的顺序进行了标记,其在油分析中产生棕榈酸或
硬脂酸水解的显著增加。给出了SEQ ID NO:2中的“初始氨基酸”和有益突变(“新氨基
酸”),即,本发明提供的示例性的序列。一方面,可以可选地包括残基位点163和164处的精氨酸(R)的单突变,从而该示例性的文库包括序列163V-164D(SEQ IDNO:2)、163R-164D、以及163V-164R的克隆,但是不包括序列163R-164R。
[0710] 表1
[0711]残基 初始氨基酸 新氨基酸
61 D A,E
72 R E,K
116 E A,Q,R,T,V
133 S A
151 I G,A
163 V R
164 D R
SM
[0712] 图6a显示了示例性的棕榈酸酶GSSM 突变相对于亲代SEQ ID NO:2对于棕榈酸SM
和硬脂酸的水解的影响。对于选自棕榈酸酶基因再组装 文库的各14个单点氨基酸突变,
其释放的棕榈酸和硬脂酸相对于亲代SEQ ID NO:2 的百分比变化进行了绘图。这些突变
很多产生了棕榈酸水解的显著增加,以及硬脂酸水解的少量至显著增加。然而,几个突变导致了硬脂酸水解的轻微降低。星号表示经识别具有增加的饱和酶-类型选择性突变。
[0713] 硬脂酸筛选:制备“硬脂酸(硬脂酸酶)文库”
[0714] 通过GSSMSM技术(专利号6,171,820)制备了SEQ ID NO:2的变体的硬脂酸酶文库。使用简并寡核苷酸引入点突变,一次一个氨基酸位点,从而各初始密码子被20种天然
编码氨基酸的每一种所取代。将突变的变体转化入大肠杆菌宿主TOP10(Invitrogen,USA)
用于表达和筛选。在表达载体pASK-5中构建文库(如上所述)。达到最佳宿主细胞密度后
SM
用无水四环素诱导GSSM 变体表达。
[0715] 对具有产生自GSSMSM技术的氨基酸序列的酶通过高-通量(HTP)筛选流程进行了筛选,例如,描述于实施例3的流程,其测定了何种脂肪酸被从脂肪-在本分析中为大豆
油-中优先水解。该分析包括将新的/序列修饰的酶接触大豆油,其含有各种脂肪酸,包括
亚麻酸、亚油酸、油酸、棕榈酸和硬脂酸(参见分布%,如上所述),和检测由各修饰的酶所水解的各脂肪酸的量。识别了促使酶从大豆油中优先水解硬脂酸(或棕榈酸,参见上文)
的序列的“文库”(所谓的“硬脂酸文库”):
[0716] ·使用HTP筛选进行初级和次级筛选,例如,描述于实施例3的方法;
[0717] ·对次级命中识别的氨基酸突变进行测序,与例如亲代序列SEQ IDNO:2相比,其在HTP筛选中产生了相对于油酸的改进的硬脂酸水解选择性。
[0718] ·对于各编码氨基酸突变的密码子变体,分别挑选一个克隆并阵列于96-孔板用于油分析;
[0719] ·对产生棕榈酸或硬脂酸或其它脂肪酸的选择性的经测序的次级命中进行油分析(表3);
[0720] ·相对于相同分析中SEQ ID NO:2的9%,最佳命中产生了22%硬脂酸的释放FA;其对应的选择性因子从2.3增加到5.5;
[0721] ·另有几个克隆表现出棕榈酸选择性增加。
[0722] 表2,如下,总结了选自要通过基因再组装SM技术进行组合的“硬脂酸酶文库”的SM包含物的GSSM 突变(参见上文)。在示例性的分析中,识别了22个单点氨基酸突变,其
在油分析中产生硬脂酸水解的最大的增加(还参见表2、3和4,如下)。根据残基发生于亲
代SEQ ID NO:2(参见图7)中的顺序进行了标记,其在油分析中产生棕榈酸或硬脂酸水解
的显著增加。给出了SEQ ID NO:2中的“初始氨基酸”和有益突变(“新氨基酸”),即,本发明提供的示例性的序列。一方面,其包括了残基位点223的丙氨酸(A)单突变作为固定
突变,从而在该示例性的文库中的每个克隆都含有该突变。
[0723] 表2
[0724]残基 初始氨基酸 新氨基酸
20 I L
62 V S
77 G P
83 V C
88 D H
113 Y G
116 E G,T
140 H K
146 K S
167 I S
180 L E
194 E M
211 A Q
212 S Y
215 G C,V,W
218 A H,S
223 V A
225 A Q,M
[0725]
[0726] 图6b(同样参见上文)显示了22个中的12个引导硬脂酸酶GSSMSM突变相对于亲代SEQ ID NO:2对于棕榈酸和硬脂酸水解的影响。对于图6b给出的和选自硬脂酸酶基因再
SM
组装 文库的每种12个单点氨基酸突变,其释放的棕榈酸和硬脂酸相对于亲代SEQ ID NO:
2的百分比变化进行了绘图。这些突变大部分产生了硬脂酸水解的显著增加,但是对于棕
榈酸水解产生了少量至显著降低。星号表示经识别具有增加的饱和酶-类型选择性突变,
即,相对于水解油中的不饱和脂肪酸,例如,油酸、亚油酸和亚麻酸,棕榈酸和硬脂酸的水解选择性增加。
[0727] ·总结
[0728] ·筛选基于亲代SEQ ID NO:2的“GSSMSM文库”(参见上文,其中详述了GSSMSM技术)产生了单点氨基酸突变体克隆,其具有显著改进的棕榈酸和硬脂酸选择性,以及饱和
选择性即,水解棕榈酸和硬脂酸的选择性(例如,从大豆油中选择性水解棕榈酸和/或硬脂
酸);
[0729] ·发现了具有显著改进的硬脂酸选择性(选择性水解硬脂酸相对于其它脂肪酸)的克隆;
[0730] ·发现了相对于SEQ ID NO:2的酶具有增加的棕榈酸选择性(选择性水解棕榈酸SM
相对于其它脂肪酸)的GSSM 突变体。
[0731] 表3和表4,如下,描述了(进一步总结了)本发明提供的示例性的水解酶序列,例如,示例性的酶具有如SEQ ID NO:2所示的序列且具有至少一个(一个、几个或全部)氨基
酸残基发生改变,如表中所示。表3和表4还总结了所选择的示例性的酶活性数据;该数据
包括将特别的示例性的酶与其正向 水解酶活性进行匹配,包括从大豆油催化水解(释放)
棕榈酸或硬脂酸脂肪酸,其通过高通量(HTP)筛选流程进行识别,如上所述。
[0732] 在表3和表4中,术语“初始氨基酸”表示“亲代”酶SEQ ID NO:2(要改变的“靶标”)中的靶标氨基酸残基(表示为“氨基酸残基”);术语“新氨基酸”表示本发明提供的示例性的(新)酶中的新设计的氨基酸残基(其替换在“旧序列”中相应的“靶标”残基)。列在“硬脂酸”栏相对于“棕榈酸”栏下的“新氨基酸”残基表示两种高通量(HTP)脂肪酸筛选(即,在一种筛选中的棕榈酸释放,以及在其它筛选中的硬脂酸释放,参见实施例3)的哪一种被用于检测(识别)具有特征残基变异(新酶序列,“新氨基酸”位置)的特别的酶。
[0733] 例如,在表3第一排,在第7个氨基酸残基处,来自“亲代”酶SEQ IDNO:2的酪氨酸(或“Y”)被替换为精氨酸(或“R”)氨基酸残基,以及该新酶(Y7R)具有不同于亲代酶的活性(参见表3);例如,“油数据”总结了新酶(例如,Y7R酶)的底物(脂肪酸)偏好
性,其中列出了当酶被暴露于(接触)大豆油时释放的(水解的)脂肪酸(如上所述的分
析),注意底物大豆油具有几种可能的可水解脂肪酸组成基团,包括亚麻酸、亚油酸、油酸、棕榈酸、硬脂酸。
[0734] 例如,在第一排,对于Y7R酶,8.3%的(从反应的大豆油中)释放脂肪酸是亚麻酸,22.1%的释放脂肪酸是亚油酸;19.7%的释放脂肪酸是油酸;41.5%的释放脂肪酸是
棕榈酸;8.4%的释放脂肪酸是硬脂酸(该四个数字之和为100%)。
[0735] P+S栏对于P和S的数据点进行了加和,以总结有多少释放的总脂肪酸是棕榈酸和硬脂酸(41.5%加8.4%=49.9%的水解脂肪酸是棕榈酸和硬脂酸,或“P+S”)。
[0736] 表3
[0737]
[0738]
[0739]
[0740]
[0741]
[0742]
[0743]
[0744]
[0745]
[0746] 表3(续)
[0747]
[0748]
[0749]
[0750]
[0751]
[0752]
[0753]
[0754]
[0755]
[0756] 表4是对表3(上文)中数据的总结或进一步编译。例如,术语“位点”表示SEQID NO:2中的氨基酸残基位点;术语“初始氨基酸”,如表3所示,表示未改变的“亲代”残基,而表3所示的术语“新型氨基酸”表示在该位点处改变的(新型)氨基酸残基。术语“WT_
P”和“WT_S”表示“亲代”酶的底物(脂肪酸释放)偏好性,例如SEQ ID NO:2对于特别的底物(脂肪酸)的偏好性,其通过从大豆油中释放的(水解的)脂肪酸的量来指示(如表
3所示),其中“P”为棕榈酸,以及“S”为硬脂酸。
[0757] “棕榈酸”和“硬脂酸”栏表示从大豆油中释放棕榈酸和硬脂酸(通过酶水解)的量,其中包括亚麻酸、亚油酸、油酸、棕榈酸、硬脂酸,如上所述。“P+S”表示水解脂肪酸的组合的量,其为棕榈酸和硬脂酸,或“P+S”。术语“δ_P”和“δ_S”表示本发明提供的示例性的酶(例如,第一排的D61A)相对于SEQ ID NO:2的相应活性分别对于水解棕榈酸和硬脂
酸的偏好性的改变。术语“δP+S”表示本发明提供的示例性的酶(例如,第一排的D61A)相对于SEQID NO:2的相应活性分别对于水解棕榈酸和硬脂酸的偏好性总的或加和的改变。
[0758] “棕榈酸突变”部分总结了本发明提供的示例性的酶,其具有相对于其它脂肪酸优先释放棕榈酸的偏好活性(脂肪酸水解)。“硬脂酸突变”部分总结了本发明提供的示例性的酶,其具有相对于其它脂肪酸优先释放硬脂酸的偏好活性(来自大豆油,分析如上所
述)。
[0759] 表4
[0760] 示例性的棕榈酸突变
[0761]
[0762] 表4(续)
[0763] 硬脂酸突变
[0764]
[0765] 表4(续)
[0766] 棕榈酸突变
[0767]
[0768] 表4(续)
[0769] 硬脂酸突变
[0770]
[0771] 实施例5:使用基因再组装SM技术对改进棕榈酸水解的示例性进化
[0772] 对于GSSMSM筛选识别的覆盖7个氨基酸位点的14个单点氨基酸突变通过基因再SM
组装 技术(美国专利号6,605,449)进行组合。基因再组装阶段产生的全长核酸序列被
克隆入表达载体pASK-5(参见上文)用于在大肠杆菌宿主HMS175(Novagen,USA)中表达。
当达到最佳宿主细胞密度后用无水四环素诱导基因再组装变体的表达。
[0773] 表2中识别的14个产生棕榈酸水解最大增加的突变被选定包含于由上述方法产生的棕榈酸酶基因再组装文库中。初始克隆用进行伞形酮棕榈酸活性筛选,产生了约145
个序列独特的克隆,分析了其对于大豆油的活性,如上所述。
[0774] 图8显示了对棕榈酸酶文库的克隆进行大豆油分析的初级和次级筛选数据。在初级分析中(在分析方法的标准初始比率条件下)产生大于70%的水解FA的棕榈酸的克隆
被选定进行大豆油的重新分析。对于每个大豆油分析,将萃取的FA稀释50倍和100倍用于
进行LCMS或GC分析。其中另外的,发现了非靶向突变,其同样被指出了。给出了检测到的
FA水解比率和各FA的量。在图中,“高”和“低”表示超出标准曲线范围的值。对于各排按照次级分析中棕榈酸释放的百分比进行了归类,并随后根据棕榈酸释放总量进行归类。很
多克隆表现出显著增加的棕榈酸选择性(高达100%),相对于亲代SEQID NO:2(61.2%)。 [0775] 根据如上所述的次级分析进行选择的前25个棕榈酸酶命中被亚克隆入假单胞菌
系统(Dow Global Technologies Inc.,美国专利公开申请号20050130160和Dow Global
Technologies Inc.,美国专利公开申请号20050186666)。将编码酶或多肽的核酸序列插
入pMYC载体(Dow Global Technologies Inc.,美国专利公开申请号20050130160)或
pDOW1169载体(Dow Global Technologies Inc.,美国专利公开申请号20080058262),然后通过电穿孔导入荧光假单胞菌宿主。对于pDOW1169构建体通过在基本培养基中生长选择
转化细胞,对于pMYC构建体通过在丰富培养基添加四环素中生长选择转化细胞。达到最佳
宿主细胞密度后用IPTG诱导表达酶或多肽。
[0776] 表5显示了假单胞菌系统表达的前25个命中的大豆油分析数据,其中进行两组重复实验。pDOW1169载体中构建的4个命中用粗体下划线字体列出,其它命中全部构建于
pMYC载体。添加酶至5g粗油得到20%的最终水含量。然后用7mm探针匀浆化混合物并在
25℃下搅拌棒搅拌孵育40小时。取出整分试样,通过将FA转化为FAME并用GC定量FAME
对FA进行分析,其描述于实施例8。基于相等的UMB-棕榈酸活性单位将25种酶上样至5g
大豆油。在这些反应中,油中的棕榈酸从未处理的油中的11%显著降低至酶处理的油中的
5%或更低,显示了相对于亲代酶SEQ ID NO:2的增加的棕榈酸水解偏好性。
[0777]
[0778]
[0779] 下述表6显示了基于上述次级分析选定的前25个棕榈酸酶命中的热稳定性数据。这些数据是通过使用大肠杆菌HMS174宿主中表达所述命中来获得的。将克隆阵列于96-孔
板并在室温(RT)、45、50或55℃下孵育10分钟,然后在室温下分析MeUMB-棕榈酸。通过
将各温度下孵育后的活性除以室温下孵育后的活性来测定残余活性百分比。同时显示了各
棕榈酸酶存在的突变,及其对大豆油中的棕榈酸的选择性和活性的示例。SEQ ID NO:2在
50℃下孵育10min后保留约15%的活性,但是在55℃下孵育后失去活性。
[0780]
[0781]
[0782] 实施例6:评价候选棕榈酸酶、硬脂酸酶或饱和酶的实验室流程
[0783] 本发明提供的示例性的酶和多肽被表达于假单胞菌系统(Dow GlobalTechnologies Inc.,美国专利公开申请号20050130160)。编码酶或多肽的核酸被插入pMYC载体(Dow Global Technologies Inc.,美国专利公开申请号20050130160)并然后通过电
穿孔导入营养缺陷型荧光假单胞菌宿主。通过在基本培养基中培养选择转化细胞。在获得
最佳宿主细胞密度后用IPTG诱导表达酶或多肽。
[0784] 采用以下过程评价本发明提供的酶或其它多肽水解油样品的能力。棕榈酸酶被添加至1kg的粗油得到20%的最终水含量。然后将混合物用高架混合器进行匀浆化并在室温
下用搅拌桨不停搅拌进行孵育。在0h、21h、43h、65h、以及72h移出整分试样(0.5mL)并进行处理用于FAME转化和GC分析,如实施例8所描述的那样。
[0785] 用SEQ ID NO:2进行了上述过程,油样品为粗大豆油。72h后未处理的油和酶处理的油的样品所产生的结果列于表7。
[0786] 表7
[0787]
[0788] 结果显示棕榈酸(C16:0)的量显著降低,该降低是期望的。
[0789] 实施例7:脂肪酶、饱和酶或棕榈酸酶对于示例性的多肽SEQ ID NO:2的序列同源性评价
[0790] 通过ξ-克隆方法(Genlantis,USA)将几种同源脂肪酶序列亚克隆入pMAL-c2x载体(New England Biolabs,USA)。含有SEQ ID NO:2、SEQ IDNO:6、SEQ ID NO:14、或SEQ ID NO:16的构建体被转化至大肠杆菌宿主ArcticExpress RP(Stratagene,USA)用于表
达。表达脂肪酶在启动子调控下,其在获得最佳宿主细胞密度后用IPTG进行诱导。对重组
酶进行了大豆油分析检测FA选择性(表8)。包含SEQ ID NO:2、SEQ ID NO:6、SEQ IDNO:
14、或SEQ ID NO:16的脂肪酶进行表达并使用标准条件从MBP融合标签进行了裂解。将一
个单菌落接种至含有20μg/ml庆大霉素的LB培养基并在30℃、200rpm下振荡过夜。将过
夜培养物接种至含有20μg/ml庆大霉素的新鲜LB培养基至OD600读取为0.05。该培养物
在30℃、200rpm下振荡至得到OD600读取为0.5。将培养物转移至12℃,200rpm振荡并平
衡至该较低温度,继而添加0.5mM IPTG诱导表达脂肪酶,然后进一步生长24小时。离心收
集细胞,悬浮于pH8的Tris缓冲液,其含有NaCl、CaCl2、DNaseI、以及溶菌酶,并随后超声裂解。细胞裂解物离心澄清。将脂肪酶-MBP融合物与因子Xa一起室温下孵育6小时、12℃
下另外孵育18小时,将酶从MBP中进行裂解。进行大豆油分析时,澄清的裂解物同完整的
活性重组酶都表现出相对于其它FA的强烈的和相似的水解棕榈酸偏好性(表8)。
[0791] 表8
[0792]
[0793]
[0794] 实施例8:用于将游离脂肪酸或甘油三酯转化为脂肪酸甲基酯(FAME)和用气相色谱定量FAME的方法
[0795] 在脂肪酶,例如,饱和酶、棕榈酸酶和/或硬脂酸酶的作用下从脂质、甘油三酯、脂肪或油中释放的脂肪酸可以通过使用LCMS的方法进行定量,如实施例2所述。这些水解的脂肪酸可选的可以通过酸催化的甲醇分解反应转化为脂肪酸甲基酯(FAME),并随后用气相
色谱(GC)定量。在本实施例中:
[0796] ·用脂肪酶,例如,饱和酶、棕榈酸酶和/或硬脂酸酶反应后的油通过添加1mL萃取溶剂(CHCl3∶MeOH∶4N HCl(2∶1∶0.075))/0.5mL反应体积进行处理。
[0797] ·在萃取后的油中取45μL整分试样至4mL螺旋塞管。在每个管中加入小搅拌棒,并加入2mL正己烷和400μL 20%(v/v)MeOH的HCl溶液。
[0798] ·然后将管密封并搅拌加热15分钟。停止加热并冷却,然后添加800μLH2O。
[0799] ·然后漩涡振荡混合物,并将顶部的含FAME的正己烷层样品(500μL)转移至GC的自动取样管。在每个样品中加入500μL的0.5mg/mL C15:0FAME作为内标。
[0800] 然后使用以下操作参数对该方法合成的FAME进行气相色谱分析:
[0801] ·设备为具有自动取样器的Hewlett Packard 6890系列GC。
[0802] ·所用的柱子是Supelco SP-2380 Fused Silica Capillary Column,30mx0.25mm与0.2μm膜厚。
[0803] ·进样器和检测器设定为260℃;氦气载体流设定为0.6mL/min;炉初始温度设定为150℃。
[0804] ·样品(1mL)进样比10∶1。所用GC方法具有:
[0805] ■Ramp 1:4C/min 10min=190℃
[0806] ■Ramp 2:15C/min 4min=250℃
[0807] ■维持:250℃2min
[0808] 甘油三酯FA还可以通过转换为FAME进行分析,甚至是在水解脂肪酸的存在下。组合使用上述方法和以下方法可以用于测定脂肪酶的脂肪酸选择性,例如,饱和酶、棕榈酸酶、和/或硬脂酸酶,以及酶对于油的作用效果。该用于分析FA结合甘油(或其它醇)的
方法中利用了碱催化的甲醇分解:
[0809] ·用脂肪酶,例如,饱和酶、棕榈酸酶和/或硬脂酸酶反应后的油通过添加1mL萃取溶剂(CHCl3∶MeOH∶4N HCl(2∶1∶0.075))/0.5mL反应体积进行处理。
[0810] ·在萃取后的油中取45μL整分试样至微量离心管。加入500μL正己烷和50μL的2N甲醇KOH。
[0811] ·剧烈漩涡振荡混合物30秒后离心。
[0812] ·将顶部的含FAME的正己烷层整分试样(50μL)转移至GC的自动取样管,并将其混合入含有C15:0内标的450μL正己烷。
[0813] ·用GC分析FAME,如上所述。
[0814] 实施例9:使用GSSMSM技术对改进的棕榈酸酶耐热性的示例性进化
[0815] 从之前的几轮进化中(实施例4和5,如上)选择包括SEQ ID NO:2(酶17,表5,如上)突变D61E、R72K、以及V163R的本发明的示例性棕榈酸酶作为前导选择性突变体。使
用GSSM技术(参见,例如,美国专利号 6,171,820)对前导选择性酶(SEQ ID NO:2,具有突变D61E、R72K、以及V163R)进行了进一步的进化以改进耐热性。
[0816] 简而言之,使用简并寡核苷酸引入点突变进行GSSM进化,一次一个氨基酸位点,从而各初始密码子可以被20种天然编码氨基酸的每一种所取代。在pDOW-Kan载体中构
建文库,琼脂糖凝胶分析,DPNI处理,然后转化至XL1Blue大肠杆菌感受态细胞。培养菌
落,挑取并测序。将菌落进行混合并使用Qiagen微型制备试剂盒(目录#27106,Qiagen,
Valencia,CA)制备DNA。然后用DNA转化荧光假单胞菌感受态细胞。荧光假单胞菌宿主来
自Dow Global Technologies Inc.(美国专利公开申请号20050130160,美国专利公开申请
号20050186666和美国专利公开申请号20060110747)。pDOW-Kan载体通过在pDOW1169(Dow
Global Technologies Inc.,美国专利公开申请号20080058262)中添加卡那霉素抗性标记
进行构建。细胞培养于补充尿嘧啶和卡那霉素的M9基本培养基(Dow Global Technologies Inc.,美国专利公开申请号20050186666)。所述应用pDOW-kan载体、荧光假单胞菌、以及
M9培养基的全部实施例均表示相同的pDOW-kan载体、荧光假单胞菌、以及M9培养基,如上
所述。
[0817] 用384-孔形式进行GSSM文库的筛选。使用UMB-棕榈酸(如上实施例3所述)进行初级和次级HTP筛选。为了识别在升高的温度下保留酶活性的突变,通过将荧光底物
与完整细胞裂解物在54℃下孵育30分钟进行了分析,分析之前将完整细胞裂解物在缓冲
液中54℃下孵育30分钟,以确保酶在加入底物之前已经达到54℃。对各突变体的荧光进
行了检测(参见表9,栏2),任何具有比对照高出大于2个标准偏差的荧光读数的突变体被
确认为“命中”-即具有足够增加的耐热性突变体。从UMB-棕榈酸筛选中识别了 117个具
有独特氨基酸变化的命中(参见表9,如下)。117个单突变命中的氨基酸改变发生于50个
残基;22%的蛋白显示氨基酸发生改变。在25℃和45℃下,对117个命中进一步评价了其
在标准的5g分析(参见实施例5)中对于粗油的表现。结果见表10,如下所述。
[0818] 表9:
[0819]
[0820]
[0821]
[0822]
[0823]
[0824]
[0825]
[0826]
[0827] 在给定残基上不导致氨基酸变化的密码子变化称为沉默突变。由于相对于亲代酶的增强的表达,将沉默突变确定为命中,且其在GSSM筛选中在37个位点被发现(表11,如
下)。
[0828] 表11
[0829]初始密码子 新密码子 氨基酸 氨基酸 氨基酸位点
GCG GCT A A 35
GGC GGT G G 37
CTG CTT L L 41
GGC GGA G G 45
GCC GCT A A 52
CGG CGA R R 89
GCC GCT A A 97
GTG GTT V V 102
AGC AGT S S 108
CTC TTG L L 109
GCG GCT A A 114
CGC CGG R R 115
CTG CTT L L 117
CTG TTG L L 124
CGG AGG R R 126
GTC GTG V V 128
GTC GTG V V 129
AGT TCT S S 133
GGC GGT G G 137
GAC GAT D D 138
CTC CTT L L 139
AAC AAT N N 142
CGC AGG R R 172
GTG GTT V V 183
ACC ACG T T 188
TCG AGT S S 192
CCC CCT P P 193
CTG CTT L L 202
GCG GCT A A 203
ACC ACT T T 205
CAC CAT H H 206
GGC GGT G G 208
TCG TCT S S 212
CTG CTT L L 222
GTC GTG V V 223
CGG AGG R R 226
CTC TTG L L 227
[0830] 实施例10:使用TMCASM技术改进棕榈酸酶的耐热性的进化示例
[0831] GSSM进化(实施例9,如上)中识别的表现最优的突变被用于TMCA进化中的包含物的初级和次级油分析进行评价。进行了5g的粗油分析,如实施例5的描述,但是采用
10%水含量,在25℃和45℃识别了该117个独特的命中。反应24和48小时后评价了油的
分布。在25℃、45℃和55℃下对初级命中进行次级油分析。在3、24、以及48小时取整分
试样进行评价油的分布。表现最优者列于下表12,其中列出了油中剩余的棕榈酸相对于总
的结合脂肪酸的百分比。为了评价苛性精炼中间体的影响,在45℃的分析中通过添加11%
NaOH(约为7%的FFA)并在60℃下连续搅拌加热进行苛性精炼。将新鲜的酶添加至该20%
水含量的精炼油,匀浆化并在45℃下搅拌进行24小时的油反应。苛性精炼样品的最终棕榈
酸含量列于最后一栏,“CR24H”。
[0832] 在表12中表现最佳者中,选定了15个突变体(表12中粗斜体表示)使用TMCA技术进行组合。TMCA文库根据PCT公开号WO 2009/018449的描述进行构建,并进一步如下
所述。该文库包括9216个独特的变体。
[0833]
[0834]
[0835] 特定多位点组合装配(TMCA)技术,TMCA技术(参见PCT公开号WO09/018449),包括生成在多位点处具有多种突变的不同组合的多种子代多核苷酸的方法。该方法可以部分
地通过至少一种或更多的以下步骤的组合来进行:
[0836] 获得(“第一”或“模板”)多核苷酸的序列信息。例如,第一或模板序列可以是野生型(例如,具有突变D61E、R72K、以及V163R的SEQ ID NO:2)或突变的序列。序列信息可以关于完全多核苷酸的(例如,基因或开放式阅读框)或关于部分感兴趣的区域的,例如
编码用于结合、结合特异性、催化、或底物-特异性的位点的序列。
[0837] 沿着第一或模板多核苷酸序列识别三种或更多感兴趣的突变。例如,突变可以位于第一或模板序列中的3、4、5、6、8、10、12、20或更多位点。位点可以根据绝对位点或通过残基或同源性的背景环境进行预定。例如,对于棕榈酸酶多肽的TMCA,产生改进的酶表现
的最优耐热性氨基酸改变被包括在内作为有益突变。突变位点两侧的序列在任何一侧都可
以是已知的。每个突变位点可以含有两种或更多突变,例如用于产生不同氨基酸。该突变
SM SM
可以使用基因位点饱和诱变 (GSSM )技术进行识别,如本发明描述的和例如,美国专利号
6,171,820;6,562,594;和6,764,835。
[0838] 提供包含感兴趣的突变的引物(例如,合成寡核苷酸)。在一个实施方式中,对于每种有益突变提供了引物。从而,具有3处有益突变的第一或模板多核苷酸可以在该位点
使用3种引物。还可以用含有简并位点的引物集合的方式提供引物,从而有益突变为任何
核苷酸或天然产生的氨基酸的范围,或该范围的子集。例如,可以提供偏好脂肪族氨基酸残基突变的引物集合。可以将引物制备为正向或反向引物,或可以将引物制备为至少一个正
向引物和 至少一个反向引物。当突变位于相近的位点时,可以很方便地使用含有多于一个位点的突变或在多位点的不同突变组合的引物。
[0839] 提供含有模板序列的多核苷酸。第一或模板多核苷酸可以是环状的,或可以是超螺旋的,例如用于克隆、测序或表达的质粒或载体。多核苷酸可以是单链的(“ssDNA”),或可以是双链的(“dsDNA”)。例如,TCMA方法中将超螺旋(“sc”)dsDNA模板用于95℃、
1min的加热步骤(参见Levy,Nucleic Acid Res.,28(12):e57(i-vii)(2000))。
[0840] 将引物添加至在反应混合物中的模板多核苷酸。将引物和模板多核苷酸进行了结合,其中条件为允许引物退火于模板多核苷酸。在TMCA流程的一个实施方式中将引物添加
至在单一反应混合物中的多核苷酸,但是其可以被添加至多元反应中。
[0841] 进行聚合酶延伸反应。延伸产物(例如,“子代”或“修饰的延伸多核苷酸”)可以通过常规方式扩增。可以分析产物的长度、序列、所需核酸性质、或作为多肽的表达。其它分析方法包括原位杂交、序列筛选或表达筛选。分析可以包括一个或更多轮的筛选和选择用以得到所需属性。
[0842] 产物还可以被转化入细胞或其它表达系统,例如无细胞系统。无细胞系统可以含有用于DNA复制、修复、重组、转录、或翻译的相关酶。示例性的宿主包括细菌、酵母、植物和动物细胞和细胞系,并包括大肠杆菌、荧光假单胞菌、毕赤酵母和黑曲霉。例如,大肠杆菌XL1-Blue或Stb12菌株可以被用作宿主。
[0843] 该本发明的方法可以在不同反应条件下使用相同或不同引物来实现,以促进产生具有不同突变组合或数量的产物。
[0844] 通过采用上述示例性的方法,本流程还提供了由该TMCA进化方法生成的一种或更多的多核苷酸,其可以接下来进行目标属性的筛选或选择。一种或更多的子代多核苷酸
可以作为多肽进行表达,且可选地进行目标属性的筛选或选择。从而,该TMCA进化流程的
实施方式提供了多核苷酸及其编码的多肽,以及该编码多肽的多核苷酸的文库。该TMCA进
化流程的实施方式进一步提供了通过筛选或选择该文库,以获得编码一种或更多具有目标
活性的多肽的一种或更多的多核苷酸。
[0845] TMCA进化流程的另一种实施方式描述于PCT公开号WO2009/018449,其中包括生成多修饰的多核苷酸的方法。该方法通常包括(a)添加至少3种引物至在单一反应混合物
中的双链模板多核苷酸,其中所述至少3种引物不相互重叠,且其中所述至少3种引物的每
一种都包括至少一个不同于其它引物的突变,其中至少一种引物是能够退火结合模板负链
的正向引物且至少一种引物是能够退火结合模板正链的反向引物,和(b)对反应混合物进
行聚合酶延伸反应以从至少3种引物中产生多种延伸修饰的多核苷酸。
[0846] TMCA进化流程的另一种实施方式描述于PCT公开号WO2009/018449,包括使用未经连接酶处理的多种延伸产物转化细胞的方法。在本发明的另一个实施方式中,从细胞中
回收多种延伸修饰的多核苷酸。在另一个实施方式中,对回收的多种延伸修饰的多核苷酸
进行了分析,例如,通过量表达至少一个多种延伸修饰的多核苷酸并对此表达的多肽进行
分析。在另一个实施方式中,选定了包含有益突变的多种延伸修饰的多核苷酸。
[0847] 在TMCA进化流程的另一种实施方式中,获取了关于模板多核苷酸的序列信息,并可以识别沿着模板多核苷酸的3种或更多的有益突变。在另一个 实施方式中,在用多种延
伸修饰的产物转化细胞之前可以对聚合酶延伸产物进行分析。
[0848] 在TMCA进化流程的一个实施方式中,聚合酶延伸产物使用酶进行处理,例如,限制性酶,例如DpnI限制性酶,从而破坏模板多核苷酸序列。处理的产物可以用于转化细胞,例如,E.coli细胞。
[0849] 在TMCA进化流程的一个实施方式中,可以使用至少2、或至少3、或至少4、或至少5、或至少6、或至少7、或至少8、或至少9、或至少10、或至少11、或至少12、或更多种引物。
在一个实施方式中,每种引物包括一个单点突变。在另一个实施方式中,两种正向或两种反向引物在模板多核苷酸相同位点处包括不同的改变。在另一个实施方式中,至少一种引物
包括模板多核苷酸不同位点处的至少两种改变。在另一个实施方式中,至少一种引物包括
至少两种不同位点处的改变,且至少两种正向或两种反向引物在模板多核苷酸相同位点处
包括不同改变。
[0850] 在TMCA进化流程的一个实施方式中,正向引物聚集于正向组,反向引物聚集于反向组,且相互独立的正向组中的引物和反向组中的引物被归一化为相应组的相同浓度,而
不考虑模板多核苷酸的位点,且其中归一化后在反应中添加等量的正向和反向引物。在该
归一化方法中,一些位点组合可以是偏好性的。该偏好性可以是由于,例如,含有单引物的位点相对于含有多引物的位点的相对低的引物浓度。“位点偏好性”表示得到的多核苷酸在其正向或反向引物组的某单一位点处表现出相对于其它位点的强的引物结合偏好性。这导
致了产生修饰的多核苷酸的组合,其可能在其正向或反向引物组中的单一引物位点处具有
高百分比的突变,但是在另一位点具有低百分比的突变。当TMCA的目标是产生包括所有可
能的模板变化的组合的子代多核苷酸 的时候,该偏好性是不利的。该偏好性可以通过例如对每个位点的引物集合归一化使其相等来进行校正。
[0851] 在TMCA进化流程的一个实施方式中,通过将引物组成多个组进行引物归一化,其取决于其在模板多核苷酸中的位置,其中覆盖模板上相同选定区域的引物在一个组;将各
组中的分组引物归一化为相等浓度;合并一个组中的正向引物为正向组,并将各正向引物
组之间的浓度归一化为相等浓度;合并一个组中的反向引物为反向组,并将各反向引物组
之间的浓度归一化为相等浓度;以及在反应中添加等量的合并后的正向和反向引物。对于
位点组合没有观察到偏好性。
[0852] 在TMCA进化流程的一个实施方式中,提供了一系列各自包含简并位点的一系列简并引物,其中有益突变为简并位点处的不同核苷酸范围。在另一个实施方式中,提供了一系列简并引物,其包含相应于模板多核苷酸的至少一个密码子的至少一个简并密码子,和
与模板多核苷酸序列密码子的相邻序列同源的至少一个相邻序列。在另一个实施方式中,
简并密码子是N,N,N,其编码任何一种的20种天然产生的氨基酸。在另一个实施方式中,简并密码子编码小于20种天然产生的氨基酸。
[0853] TMCA进化流程的另一种实施方式描述于PCT公开号WO2009/018449,其包括生成包含有益突变的多种修饰的多核苷酸的方法。该方法通常包括(a)加入至少两种引物至单
一反应混合物中的双链模板多核苷酸,其中所述至少两种引物不相互重叠,且其中所述至
少两种引物的每一种都包括至少一个不同于其它引物的突变,其中至少一种引物是能够退
火结合模板负链的正向引物且至少一种引物是能够退火结合模板正链的反向引物,(b)对
反应混合物进行聚合酶延伸反应以从至少两种引物中产生多种延伸修饰 的多核苷酸,(c)
聚合酶延伸产物使用酶进行处理,从而破坏模板多核苷酸序列,(d)用未被连接酶处理的处理后的延伸修饰的多核苷酸转化细胞,(e)从细胞中回收多种延伸修饰的多核苷酸,和(f)
选择包含有益突变的多种延伸修饰的多核苷酸。
[0854] 在本实施例中,选自耐热TMCA文库的15个突变见于表13,如下。使用了6种DNA模板:具有突变D61E、R72K、以及V163R的SEQ ID NO:2(亲代)、具有E95K突变的亲代、具有P162G突变的亲代、具有P162K突变的亲代、具有E95K和P162G突变的亲代、以及具有
E95K和P162K突变的亲代。具有E95K突变的亲代、具有P162G突变的亲代、具有P162K突
变的亲代的质粒通过大肠杆菌XL1Blue感受态细胞以甲基化DNA。进行了6种分别的TMCA
进化,每种对应于6个模板中的一个,其结合列于下表14的寡核苷酸。
[0855] 表13:
[0856]突变 新密码子
A48C TGT
D49R CGT
R85Y TAT
E95K AAG
E116I ATT
E116L CTT
E116N AAT
A144I ATT
E149H CAT
A150I ATT
P162G GGT
P162K AAG
R172H CAT
R172L CTT
A225S TCT
[0857]
[0858] 在pDOW-kan载体中对文库成员进行了扩增,琼脂糖凝胶分析,并用DPNI处理。然后用样品转化XL1Blue大肠杆菌感受态细胞。挑取菌落,培养并测序。测序结果显示突变
E116L和氨基酸144、149和150处的突变相对于理论最高限度未被充分代表。因此,使用
归一化的全部6个模板混合物创建了另一种TMCA文库。使用表14中列出的全部寡核苷酸
重复进行TMCA反应,除了那些对应于E116I和E116N突变的。用于E116L突变和用于区域
4(氨基酸144、149和150)的引物的量加倍。在pDOW-kan载体中对样品进行了扩增,琼脂
糖凝胶分析,并用DPNI处理。然后用样品DNA转化XL1Blue大肠杆菌感受态细胞。挑取菌
落,培养并测序。位于氨基酸144、149、以及150的突变引入是改进的,但是E116L相对于理论最高限度仍然未被充分代表。用来自两种文库的DNA转化XL1Blue大肠杆菌感受态细胞。
将菌落合并,使用Qiagen微量制备试剂盒制备DNA。然后用该DNA转化荧光假单胞菌感受
态细胞。在补充尿嘧啶(750μg/ml)和卡那霉素(50μg/ml)的LB培养基中培养细胞。获
得足够的菌落以10倍过取样(oversample)文库。对文库进行10倍过取样以补偿未被充
分代表的E116L。
[0859] 得到的耐热性TMCA文库在补充尿嘧啶(750μg/ml)和卡那霉素(50μg/ml)的M9基本培养基中进行培养并使用描述于上述实施例3的HTP筛选进行筛选。添加UMB-棕
榈酸之前和之后,将文库在60℃下各孵育30分钟。然后读取384-孔板,活化365nm和发
射460nm。离心迅速冷却各板,预热分光光度计以最小化读取的人工误差。每块384孔板的
荧光值进行了展示。识别命中为那些具有高于阳性对照的>2标准偏差(E116L单突变)。
对初级HTP命中在两种温度60℃和63℃下进行了次级HTP筛选分析。次级命 中定义为在
63℃板中高于平均阳性对照的>4标准偏差并在60℃和63℃之间保留>50%的活性。
[0860] 识别了318个独特序列的次级HTP命中。这些命中含有2至9个突变。对318个命中的澄清的裂解物进行了标准的5g粗油分析(如描述于实施例5)。对于该318个次级
HTP命中,那些在升高的温度下(45℃或60℃)比在25℃下更有效地在油分析中降低棕榈
酸的命中被选定为耐热性“油命中”。通过另外的油分析识别和表征了57个初级耐热性油
命中(参见表15和16,如下)。进行了进一步的5g油分析,并识别了9个油命中,其具有
优选的温度表现分布以及改变的总活性水平(参见表17,如下)。
[0861]
[0862]
[0863]
[0864]
[0865] 实施例11:使用TMCASM技术对增强棕榈酸酶表达的示例性进化
[0866] 在GSSM筛选(参见表11,实施例9,如上)中识别的37个沉默突变进行了表达评价(参见表18,如下)。在250mL摇瓶中的补充尿嘧啶和卡那霉素的M9培养基中表达了
50mL培养物。在用0.3mM IPTG进行诱导之前和之后,将各命中在30℃下培养16至20小
时。离心沉淀细胞并使用B-PERTM(目录号78248,Pierce Protein Research Products,
Rockford,IL)进行裂解。将一部分全裂解物离心澄清。对全细胞裂解物和澄清的裂解物
使用基于Bradford方法的Bio-Rad蛋白分析(Bio-Rad,Hercules,CA,目录号#500-0006)
进行全蛋白浓度分析,以及用荧光底物UMB-棕榈酸分析活性,并进行SDS-PAGE。对测量值
进行归一化,亲代值设定为100%。识别了16个命中,其相对于亲代表现出增加的活性。
[0867] 表18:
[0868]
[0869] 使用TMCA技术将前11个沉默突变(表19,如下)进行了组合,其描述于PCT公开号WO 2009/018449和以下的进一步描述。
[0870] 表19:
[0871]初始密码子 新密码子 氨基酸位点
GCG GCT 35
GGC GGA 45
GTG GTT 102
AGC AGT 108
CTG CTT 117
CTG TTG 124
CGG AGG 126
GTC GTG 128
AGT TCT 133
GTG GTT 183
ACC ACG 188
[0872] 对于TMCA进化,使用了四种DNA模板:(1)“亲代A”棕榈酸酶(具有突变D61E、R72K、以及V163R的SEQ ID NO:2),(2)“亲代B”棕榈酸酶(具有另外的突变(GGC)45(GGA)和(CTG)117(CTT)的亲代A),(3)“亲代C”棕榈酸酶(具有另外的突变(GGC)45(GGA)的亲
代A),和(4)“亲代D”(具有另外的突变(CTG)117(CTT)的亲代A)。注意:突变列出的顺序
是先提供初始密码子,然后是氨基酸修饰的位点号,然后是新密码子。例如,(GGC)45(GGA)表示SEQ ID NO:2位点45处的氨基酸密码子从(GGC)变为(GGA)。
[0873] 用关于区域1和4的各四种DNA模板和引物完成了第一轮TMCA反应(参见表20,如下;区域1:氨基酸35;区域4:氨基酸183和188),从而创建了4个亚文库。使用Qiagen PCR提纯试剂盒纯化亚文库产物。然后含有纯化产物的混合物以及从而含有多个模板的各
亚文库被用于单一的第二轮 TMCA反应,每个亚文库使用针对区域2和3的引物(参见表
21,如下;区域2:氨基酸102和108;区域3:氨基酸124、126、128和133)。
[0874]
[0875]
[0876] 在pDOW-kan载体中对样品进行了扩增,琼脂糖凝胶分析,DPNI处理,然后转化XL1Blue大肠杆菌感受态细胞。对菌落进行培养、挑取和测序。将菌落进行合并,使用
Qiagen微量制备试剂盒(目录号#27106,Qiagen,Valencia,CA)制备各亚文库的DNA。然
后用DNA转化荧光假单胞菌感受态细胞。在补充尿嘧啶(750μg/ml)和卡那霉素(50μg/
ml)的LB培养基中培养细胞。获得了足够量的菌落,其为7倍过采样文库(至少14,000菌
落)。
[0877] 对文库进行阵列,在补充尿嘧啶(750μg/ml)和卡那霉素(50μg/ml)的M9基本培养基中培养,并使用400μM 4-甲基伞形酮棕榈酸的80mM HEPES溶液,pH7.5进行分析。
底物添加之前和之后在54℃将样品孵育30分钟。在Ex360nm和Em465nm下读取荧光值。46
个沉默突变样品产生了独特的序列(参见表22,如下)。46个沉默突变样品每一种的的荧
光值同样列在表22,第一栏“UMB活性”。沉默突变样品2、7、9、10、13、16、23、25、40、以及44具有沉默突变以外的氨基酸(AA)发生改变(参见表23,如下)。
[0878]
[0879]
[0880]
[0881]
[0882] 表23:
[0883]
[0884] 将该46个独特的沉默突变样品培养于250mL摇瓶中。使用基于Bradford方法的Bio-Rad蛋白分析(Bio-Rad,Hercules,CA,目录#500-0006)对澄清的裂解物进行定量,然后对于总的蛋白表达进行归一化。用SDS-PAGE分析表达。
[0885] 亲代(具有突变D61E、R72K、以及V163R的SEQ ID NO:2)、阴性对照、以及前4个沉默突变命中以1L的规模进行了表达。使用微流体器(microfluidizer)或在去污剂
BPER存在下对各样品进行裂解。使用基于Bradford方法的Bio-Rad蛋白分析(Bio-Rad,
Hercules,CA,目录#500-0006)对于粗的和澄清的裂解物进行了蛋白浓度定量。然后在
SDS-PAGE凝胶的每一道上样等量的总蛋白。在检测的全部溶解和裂解条件下都观察到相
似的棕榈酸酶水平。沉默突变命中26、34、35和37(表22和23,如上)表现出相对于亲代
(具有突变D61E、R72K、以及V163R的SEQ ID NO:2)更高百分比的棕榈酸酶表达。沉默突变命中35具有最高百分比的棕榈酸酶表达。沉默突变命中35具有以下7个相对于亲代的沉
默突变:(GCG)35(GCT)、 (GTG)102(GTT)、(AGC)108(AGT)、(CTG)117(CTT)、(CGG)126(AGG)、(AGT)133(TCT)、和(ACC)188(ACG)。
[0886] 实施例12:增强耐热棕榈酸酶表达的示例性进化
[0887] 为了评价9个候选前导耐热棕榈酸酶的表达(实施例10,表15、16、以及17),将前7个沉默突变(实施例11)引入各耐热前导中,如下所述。结果为各耐热前导(耐热性
命中29、40、41、74、81、202、204、238、以及244)在每一种中引入了以下沉默突变:(35GCT、
102GTT、108AGT、117CTT、126AGG、133TCT、188ACG)。对引入沉默突变的各耐热前导重新命名,在其耐热命中号的末端添加了“SM”。例如,引入沉默突变的耐热命中29重命名为
“29SM”。类似的,命中40成为“40SM”,命中41成为“41SM”,命中74成为“74SM”,命中81成为“81SM”,命中202成为“202SM”,命中204成为“204SM”,命中238成为“238SM”,以及命中244成为“244SM”。
[0888] 为了在9个耐热前导中引入前7个沉默突变,使用了描述于PCT公开号WO2009/018449和以下进一步描述的TMCA技术。
[0889] 对于第一轮TMCA进化,前9个耐热前导和前导表达命中(沉默突变命中#35)经过大肠杆菌XL1Blue感受态细胞进行DNA甲基化。沉默突变命中#35被用作DNA模板。使
用列于下表24的寡核苷酸在DNA模板中引入突变组合。
[0890]
[0891] 在pDOW-kan载体中对样品进行了扩增,琼脂糖凝胶分析,并用DPNI处理。用样品转化大肠杆菌XL1Blue感受态细胞。挑取菌落,培养并测序。测序识别了几种突变组合。然而,一些组合是未被充分代表的。因此,从第一轮TMCA进化中选择了一些新构建体用作模
板进行下一轮TMCA进化。所用的模板列于下表25。
[0892] 表25:
[0893]模板名称 具有所需突变的氨基酸
F8 48,92,95,162,172
H10 48,116L,162,172
A8 85,92,95
C11 116N,172
[0894] 用于第二轮TMCA进化的模板和寡核苷酸组合列于下表26。对于表26中的每一排进行了单独的TMCA反应,产生了每一排各自的文库。例如,一轮包括模板F8和引物2For
和7Rev。第二轮包括模板F8和引物2For和6Rev。注意,在第一轮中使用了几种相同的引
物。在第二轮PCR使用了两种另外的引物。这些寡核苷酸命名为116LF和162F。寡核苷酸
116LF具有寡核苷酸4-Alt2-RevJC的反向和互补序列。寡核苷酸162F具有5-RevJC的反
向和互补序列。
[0895] 表26:
[0896]
[0897]
[0898] 在pDOW-kan载体中对样品进行了扩增,琼脂糖凝胶分析,并用DPNI处理。用样品转化大肠杆菌XLlBlue感受态细胞。挑取菌落,培养并测序。测序以足够高的代表性识别
了9种所需构建体中的7种。然而,由于其它两种构建体是未被充分代表的,需要进行额外
的TMCA进化轮次以获得剩下的耐热前导与该7种沉默突变的组合。使用两种新构建体作为
模板用于第三轮TMCA进化。这些模板列于下表27。在第三轮中使用的模板和寡核苷酸组
合列于下表28。对于表28中的每一排进行了单独的TMCA反应,产生了每一排各自的文库。
例如,一轮包含模板F3和引物162F和7Rev。第二轮包含模板B5和引物162F和6Rev。
[0899] 表27:
[0900]模板名称 具有所需突变的氨基酸
F3 85,116N,172
B5 85,116I,162
[0901] 表28:
[0902]
[0903] 在pDOW-kan载体中对样品进行了扩增,琼脂糖凝胶分析,并用DPNI处理。用样品转化大肠杆菌XL1Blue感受态细胞。挑取菌落,培养并测序。对于剩下的两种构建体得到
了充分的代表性。制备了全部所需大肠杆菌XL1Blue构建体的DNA,并转化荧光假单胞菌感
受态细胞。在补充尿嘧啶 (750μg/ml)和卡那霉素(50μg/ml)的LB培养基中培养细胞。
对样品进行测序确认。
[0904] 用于筛选的文库在补充尿嘧啶(750μg/ml)和卡那霉素(50μg/ml)的M9基本培养基中进行培养。通过上样澄清的裂解物进行了标准油分析,其中裂解物使用磷酸缓冲液
且具有10%水含量,其列于表29左栏的UMB-棕榈酸活性水平的粗油分析。油分析物进行
上载,匀浆化并随后连续混合用于25℃、45℃、以及60℃下的标准反应。在3和20小时对于各油反应加入11%NaOH的50μL整分试样然后匀浆化。在20、44、以及68小时取出整分
试样并用于标准氯仿甲醇萃取和全甲醇分解,然后GC分析FAME(描述于实施例8,如上)。
各整分试样中的油中剩余棕榈酸列于表29。耐热沉默突变命中29SM在25℃时间进程中强
烈降低棕榈酸(表29)。
[0905] 表29:
[0906]
[0907] 实施例13:作为乳化剂的油酸钾盐使得酶产生1%的棕榈酸油
[0908] 将油样品与10%油酸钾一起孵育以评价该乳化剂对棕榈酸酶促油反应的影响。命中29SM或阴性对照的澄清的裂解物以5%水含量上样至预处理的油(A和B)和粗油(C)进
行分析。预处理通过对油进行酶处理、加热、离心、然后过滤,以脱胶和脱水,减少游离脂肪酸,如描述于实施例14,以产生无胶的<5%棕榈酸油。在添加酶之前和之后将油匀浆化以确保均一乳液。称取0.5g可商购的油酸钾盐至5g油,在60℃混合溶解,然后匀浆化。用于
中和的1%FFA苛性添加物被加至下述“苛性”反应。上载酶进行油分析,重新匀浆化并随
后连续搅拌进行标准反应。在3、24、48、72、以及120小时取出整分试样并用于标准氯仿甲醇萃取和全甲醇分解,然后GC分析FAME(描述于实施例8,如上)。各整分试样中的油中剩
余棕榈酸列于表30。预处理的油成功地达到1%的棕榈酸水平。
[0909] 表30:
[0910]
[0911] 实施例14:进行中间离心和油酸乳化的2kg油得到1%的棕榈酸油
[0912] 以小试规模评价了多肽、中间过滤步骤、以及添加油酸钾达到1%棕榈酸油的组合效应。在5%水含量下用29SM反应2kg粗油。油反应物用IKA速度6匀浆化1分钟达到温度25℃。将搅拌桨装在高架搅拌器上,390rpm下搅拌油反应。反应1小时后,搅拌速度增
加到530rpm。监控反应温度并间歇性用加热块加热使之在21℃至29℃范围波动。伴随着
油分布的改变移出样品。28小时后,将油反应加热到66℃并用gyrotester离心。将油组
分冷却至室温,用搅拌桨搅拌过夜,然后冰浴至小于10℃。添加硅藻土,并通过预冷的布氏漏斗用Whatman滤纸将TAG和DAG从游离脂肪酸中进行分离。
[0913] 1kg的该降低棕榈酸的油被用于启动反应,其中添加油酸钾作为乳化剂。在油中添加100g油酸钾。将反应搅拌加热至60℃以确保溶解。将油冷却至23℃,然后加入50ml的酶得到5%水含量。在添加29SM酶之前和之后对该油进行匀浆化以确保形成均一乳液。在
过滤后和添加油酸后的6、21、24、28小时,新分析的起始,第二轮分析的3、20、以及22小时,取出整分试样。将整分试样进行标准氯仿甲醇萃取和全甲醇分解,然后GC分析FAME(描述
于实施例8,如上)。各整分试样中的油中剩余结合的脂肪酸列于下表31。命中29SM能够
使油中的棕榈酸水平达到1%。
[0914] 表31:
[0915]
[0916]
[0917] 实施例15:双重离心和过滤产生低棕榈酸油
[0918] 油反应后分离油酸钾的能力描述如下。在5%水含量下用29SM反应2kg粗油。油反应物用IKA速度6匀浆化1分钟达到温度25℃。将搅拌桨装在高架搅拌器上,390rpm下
搅拌油反应。反应1小时后,搅拌速度增加到530rpm。监控反应温度并间歇性用加热块加
热使之在21℃至29℃范围波动。伴随着油分布的改变移出样品。28小时后,将油反应加热
到80℃并用gyrotester离心。将油组分冷却至室温,用搅拌桨搅拌过夜,然后冰浴至小于
10℃。添加硅藻土,并通过预冷的布氏漏斗用Whatman滤纸将TAG和DAG从游离脂肪酸中
进行分离。
[0919] 1kg的该处理的油被用于启动反应,其中添加油酸钾作为乳化剂。在油中添加100g油酸钾。加入50g油酸钾至达到5%。对其进行混合和匀浆化。然后加入50ml的酶
得到5%水含量,用IKA速度6匀浆化1分钟达到26.6℃。对该油反应物用安装在高架搅
拌器上的搅拌桨400rpm搅拌进行混合。间歇性用加热块加热。在3、20、24小时,以及第二轮分析开始后的8、28、以及48小时取出整分试样。将整分试样进行标准氯仿甲醇萃取和全甲醇分解,然后GC分析FAME(描述于实施例8,如上)。各整分试样中的油中剩余结合的脂
肪酸列于下表32。29SM使油中的棕榈酸水平达到1.5%。将该油加热至85℃并离心去除
蛋白碎片。搅拌桨搅拌冷却油组分至6℃,添加硅藻土并用布氏漏斗分离该材料。在25℃
下持续过滤。
[0920] 表32:
[0921]
[0922] 实施例16:密码子最优化
[0923] 前导耐热沉默突变命中29SM(实施例12)在荧光假单胞菌中表达的密码子最优化的版本通过两种不同方法进行设计。第一种密码子最优化的版本将命中29SM的全部密码
子替换为那些被荧光假单胞菌优选的,包括引入的7个最佳沉默突变(实施例12)。该版
本命名为29SM-Pf(SEQ ID NO:22)。荧光假单胞菌优选的密码子应用通过检索Kazusa DNA Research Institute网站的密码子应用数据库(2-6-7 Kazusa-kamatari,Kisarazu,Chiba
292-0818 JAPAN,来自互联网2009)
进行确定。特别的,使用了荧光假单胞菌PfO-1密码子应用模式(来自互联网2009http://www.kazusa.or.jp/codon/cgi-bin/showcodon.cgi?species=205922>)和荧
光假单胞菌Pf-5密码子应用模式(来自互联网2009codon/cgi-bin/showcodon.cgi?species=220664>)用于设计密码子最优化序列,SEQ
ID NO:22。
[0924] 第二种密码子最优化的版本同样将命中29SM的全部密码子替换为那些被荧光假单胞菌优选的,但保留了7种前导沉默突变(实施例11)。该版本命名为29SM-Pf+SM(SEQ
ID NO:23)。29SM-Pf+SM(SEQ ID NO:23)是29SM-Pf(SEQ ID NO:22)的最优候选。
[0925] SEQ ID NO:22:
[0926]
[0927] SEQ ID NO:23:
[0928]
[0929] 两种版本的密码子最优化基因序列被送至DNA 2.0 Incofporated(Menlo Park,CA)进行DNA合成。基因被合成于pJ201载体中,在该基因的两侧添加SpeI和XhoI限制性
位点。当合成的基因送达后,用限制性酶切开质粒。pDOW-Kan载体DNA也用相同限制性酶
切开,然后用牛小肠碱性磷酸酶(New England Biolabs产品#M0290L)进行处理。对全部
样品使用QIAquick凝胶萃取试剂盒(Qiagen,产品#28706)进行凝胶纯化和提取。然后将
载体和插入物使用Roche Rapid连接试剂盒(Roche,产品#11635379001)进行连接。然后
用连接产物转化E.coli XL1Blue感受态细胞。挑取菌落,培养,并使用Qiagen微量制备试
剂盒制备DNA。对DNA样品进行测序识别,然后使用该DNA转化荧光假单胞菌。
[0930] 然后在250mL摇瓶中培养并诱导29SM-Pf(SEQ ID NO:22)、29SM-Pf+SM(SEQ IDNO:23)、29SM、亲代(具有突变D61E、R72K、以及V163R的SEQ ID NO:2)和宿主/载体对
照。对澄清的裂解物中的蛋白浓度使用基于Bradford方法的Bio-Rad蛋白分析(Bio-Rad,
Hercules,CA,目录#500-0006)进行定量,然后归一化于总蛋白表达。用SDS-PAGE分析表
达,SDS-PAGE凝胶的每一道都上样等量的总蛋白。29SM-Pf和29SM-Pf+SM相对于29SM和
亲代具有较高的棕榈酸酶蛋白表达百分比。29SM-Pf+SM具有比29SM-Pf稍高的棕榈酸酶表
达百分比。从而表达的改进在沉默突变存在下稍微地更加显著。
[0931] 已经描述了本发明提供的许多实施方式。但是,应当理解可以进行各种修饰而不偏离本发明提供的精神和范围。因此,其它实施方式同样属于以下权利要求的范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈