首页 / 国际专利分类库 / 化学;冶金 / 生物化学;啤酒;烈性酒;果汁酒;醋;微生物学;酶学;突变或遗传工程 / / 用于合成色胺和色胺类似物的衍生物的生物催化剂和方法

用于合成色胺和色胺类似物的衍生物的生物催化剂和方法

申请号 CN201380026594.7 申请日 2013-03-22 公开(公告)号 CN104508126B 公开(公告)日 2017-06-30
申请人 科德克希思公司; 发明人 约瓦娜·纳佐尔; 德里克·史密斯; 迈克尔·A·克罗; 宋士玮; 史蒂文·J·科利尔;
摘要 本公开内容提供了用于产生胺的工程化转 氨 酶多肽、编码该工程化转氨酶的多核苷酸、能够表达该工程化转氨酶的宿主细胞、以及使用该工程化转氨酶制备在产生活性药物 试剂 中有用的化合物的方法。本公开内容提供了具有转氨酶活性的工程化多肽、编码该多肽的多核苷酸、制备该多肽的方法、和使用该多肽用于将 酮 底物 生物 催化转化为胺产物的方法。本 发明 的酶已被工程化为具有与河流弧菌(Vibrio fluvialis)的天然存在的转氨酶的氨基酸序列相比的一个或更多个残基差异。特别是,本公开内容的转氨酶已被工程化为从其相应的前 手性 酮底物有效形成手性色胺衍生物。
权利要求

1.一种具有转酶活性的工程化多肽,所述工程化多肽的序列基于SEQ ID NO:4并且
与SEQ ID NO:4相比,所述工程化多肽中的残基差异是X163L/I/V,任选地与选自以下的一个或更多个残基差异组合:X14V、X26R、X31S、X33T、X41L、X57F/Y、X86Y、X88L/A、X107P、X113L/V、X132F、X148Q、X168S/K、X173A、X203S、X284A、X314N、X315G、X324H、X346L、X383A、X395P、X398V/W/L、X400G、X417M、X419S、X420N、X423I、X424V、X448E和X451D。
2.如权利要求1所述的工程化多肽,其中所述工程化多肽中的残基差异是X163L/I/V与
选自以下的一个或更多个残基差异的组合:X14V;X26R;X33T;X41L;X88A;X88L;X107P;
X132F;X148Q;X173A;X203S;X284A;X315G;X346L;X395P;X400G;X419S;X423I;X448E;和X451D。
3.如权利要求1所述的工程化多肽,其中所述工程化多肽中的残基差异是X163L/I/V与
选自X14V;X26R;X33T;X41L;X88A;X88L;X107P;X132F;X148Q;X173A;X203S;X284A;X315G;
X346L;X395P;X400G;X419S;X423I;X448E;和X451D的一个或更多个残基差异以及选自X57F;X113L;X113V;X168K;X420N;和X424V的一个或更多个残基差异的组合。
4.如权利要求1所述的工程化多肽,其中所述工程化多肽中的残基差异是X163I/L/V与
选自以下的至少一个或更多个残基差异的组合:X14V;X26R;X31S;X284A;X315G;X398L/V/W;和X400G。
5.如权利要求1所述的工程化多肽,其中所述工程化多肽中的残基差异是选自以下的
残基差异组合:
X14V和X163I/L/V;
X57F/Y和X163I/L/V;
X14V、X113L/V、X163I/L/V、X284A、和X424V;
X31S、X57F/Y、X163I/L/V、X315G、X346L、和X398L/V/W;
X14V、X113L、X163L、X284A、和X424V;
X14V、X26R、X163L、X284A、和X400G;
X57F、X163L、X168K、X314N、X315G、X346L、和X398V;
X14V、X163L、X173A、X400G、和X420N;
X14V、X113L、X163L、和X284A;
X14V、X26R、X163L、X284A、和X400G;以及
X14V、X33T、X57F、X113L、和X163L。
6.如权利要求1所述的工程化多肽,其中所述工程化多肽具有与SEQ ID NO:4的多肽相
比至少1.2倍增加的稳定性,其中所述工程化多肽中的残基差异是X163I/L/V与选自以下的一个或更多个的组合:X14V;X26R;X31S;X33T;X41L;X88A/L;X284A;X324H;X419S;和X423I。
7.如权利要求1所述的工程化多肽,其中所述工程化多肽的序列选自:SEQ ID NO:6、8、
14、16、22、24、28、30、32、48、52、56、62、64、86、88、90、92、98、100、104、106、108、110、112、
114、116、118、120、124、126、128、132、134、136、142、144、148和154。
8.如权利要求1所述的工程化多肽,其中所述工程化多肽固定在固体支持物上。
9.一种多核苷酸,所述多核苷酸编码权利要求1所述的工程化多肽。
10.一种表达载体,所述表达载体包含权利要求9所述的多核苷酸。
11.如权利要求10所述的表达载体,所述表达载体还包含控制序列。
12.一种宿主细胞,所述宿主细胞包括权利要求9所述的多核苷酸或权利要求10或11所
述的表达载体。
13.一种制备工程化多肽的方法,所述方法包括在适合于表达所述工程化多肽的条件
下培养权利要求12所述的宿主细胞。
14.如权利要求13所述的方法,所述方法还包括分离所述工程化多肽。
15.一种用于制备式(I)的化合物的方法,
其中
R1选自由以下组成的组:氢、羧基、羧基(C1-C6)烷基、任选地取代的(C1-C6)烷基、任选地取代的(C2-C6)烯基、任选地取代的烷基羰基、任选地取代的芳基羰基、任选地取代的芳基磺酰基、和保护基团;
R2选自由以下组成的组:氢、氧代、卤代、羟基、氨基、硫代、任选地取代的(C1-C6)烷基、(C1-C6)烷基氨基、(C1-C6)二烷基氨基、(C1-C6)烷基硫代、(C1-C6)烷基磺酰基、(C1-C6)烷基亚磺酰基、和任选地取代的(C1-C6)烷氧基;
R4、R6和R7各自彼此独立地选自由以下组成的组:氢、卤代、羟基、氨基、羧基、氰基、硝基、硫代、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的(C1-C6)烷氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫代、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基、氨基羰基(C1-C6)烷基、任选地取代的环烷基、任选地取代的杂环烷基、任选地取代的芳基、任选地取代的杂芳基、任选地取代的芳氧基、任选地取代的芳基氨基、任选地取代的芳基硫代、任选地取代的芳基磺酰基、任选地取代的芳基亚磺酰基、任选地取代的芳基氧基羰基、任选地取代的芳基羰基氧基、任选地取代的杂芳基氧基、任选地取代的杂芳基氨基、任选地取代的杂芳基硫代、任选地取代的杂芳基磺酰 基、任选地取代的杂芳基亚磺酰基、任选地取代的杂芳基氧基羰基、任选地取代的杂芳基羰基氧基、烷基氨基磺酰基(C1-C6)烷基、芳基磺酰基(C1-C6)烷基、和杂芳基磺酰基(C1-C6)烷基;
R5选自由以下组成的组:氢、卤代、羟基、氨基、羧基、氰基、硝基、硫代、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的(C1-C6)烷氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫代、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基、氨基羰基(C1-C6)烷基、任选地取代的环烷基、任选地取代的杂环烷基、任选地取代的芳基、任选地取代的杂芳基、任选地取代的芳氧基、任选地取代的芳基氨基、任选地取代的芳基硫代、任选地取代的芳基磺酰基、任选地取代的芳基亚磺酰基、任选地取代的芳基氧基羰基、任选地取代的芳基羰基氧基、任选地取代的杂芳基氧基、任选地取代的杂芳基氨基、任选地取代的杂芳基硫代、任选地取代的杂芳基磺酰基、任选地取代的杂芳基亚磺酰基、任选地取代的杂芳基氧基羰基、任选地取代的杂芳基羰基氧基、烷基氨基磺酰基(C1-C6)烷基、芳基磺酰基(C1-C6)烷基、和杂芳基磺酰基(C1-C6)烷基、或与R4一起形成5至8元任选地取代的环烷基或任选地取代的杂环;
R8选自由以下组成的组:任选地取代的(C1-C6)烷基、任选地取代的(C1-C6)烷氧基、任选地取代的环烷基、任选地取代的杂环烷基、任选地取代的芳基、和任选地取代的杂芳基、或与R2一起形成任选地取代的5至8元环烷基或杂环;以及
n是1或2;
条件是
2
(a)当R是氢时,则以下的至少一个适用:
(i)R1不是氢、甲基、4-(甲氧基)苯基羰基-、4-(三氟甲氧基)苯磺酰基-、3-溴苯基羰
基-、3-氨基丙基、或3-(甲基羰基氨基)丙基-;
(ii)R4和R7各自彼此独立地不是氢或氯;
5
(iii)R不是氢、羟基、甲基、甲氧基、氟、氯、三氟甲基、或氰基;
(iv)R6不是氢、羟基、甲氧基、氟或氯;或
(v)R8不是甲基、乙基、羟甲基、或三氟甲基-;以及
(b)当n是1,R2和R8一起形成环己基环,并且R1、R4、R6、和R7是氢时,则R5不是氟;
所述方法包括在适当的反应条件下在氨基供体的存在下,使式(II)的底物化合物与权
利要求1至8的任一项所述的工程化多肽接触
其中R1、R2、R4、R5、R6、R7、R8和n如以上所定义。
16.如权利要求15所述的方法,其中式(I)的化合物包括在以*标记的原子上具有指
定的立体化学的式(IS)的化合物,
其中化合物(IS)以对映体过量来形成。
17.一种用于制备式(Ia)的化合物的方法,
其中,
R1选自由以下组成的组:氢、羧基、羧基(C1-C6)烷基、任选地取代的(C1-C6)烷基、任选地取代的(C2-C6)烯基、任选地取代的烷氧基羰基、任选地取代的芳基羰基、任选地取代的芳基磺酰基、和保护基团;
2
R选自由以下组成的组:氢、氧代、卤代、羟基、氨基、硫代、任选地取代的(C1-C6)烷基、(C1-C6)烷基氨基、(C1-C6)二烷基氨基、(C1-C6)烷基硫代、(C1-C6)烷基磺酰基、(C1-C6)烷基亚磺酰基、和任选地取代的(C1-C6)烷氧基;
R4、R5、R6和R7各自彼此独立地选自由以下组成的组:氢、卤代、羟基、氨基、羧基、氰基、硝基、硫代、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的(C1-C6)烷氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫代、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基、氨基羰基(C1-C6)烷基、任选地取代的环烷基、任选地取代的杂环烷基、任选地取代的芳基、任选地取代的杂芳基、任选地取代的芳氧基、任选地取代的芳基氨基、任选地取代的芳基硫代、任选地取代的芳基磺酰基、任选地取代的芳基亚磺酰基、任选地取代的芳基氧基羰基、任选地取代的芳基羰基氧基、任选地取代的杂芳基氧基、任选地取代的杂芳基氨基、任选地取代的杂芳基硫代、任选地取代的杂芳基磺酰基、任选地取代的杂芳基亚磺酰基、任选地取代的杂芳基氧基羰基、任选地取代的杂芳基羰基氧基、烷基氨基磺酰基(C1-C6)烷基、芳基磺酰基(C1-C6)烷基、和杂芳基磺酰基(C1-C6)烷基;以及
R8选自由以下组成的组:任选地取代的(C1-C6)烷基、任选地取代的(C1-C6)烷氧基、任选地取代的环烷基、任选地取代的杂环烷基、任选地取代的芳基、和任选地取代的杂芳基;
2
条件是当R是氢时,则以下的至少一个适用:
(i)R1不是氢、甲基、4-(甲氧基)苯基羰基-、4-(三氟甲氧基)苯磺酰基-、3-溴苯基羰
基-、3-氨基丙基、或3-(甲基羰基氨基)丙基-;
(ii)R4和R7各自彼此独立地不是氢或氯;
(iii)R5不是氢、羟基、甲基、甲氧基、氟、氯、三氟甲基、或氰基;
(iv)R6不是氢、羟基、甲氧基、氟或氯;或
(v)R8不是甲基、乙基、羟甲基-、或三氟甲基-;
所述方法包括在适当的反应条件下在氨基供体的存在下,使式(IIa)的底物化合物与
权利要求1至8的任一项的工程化多肽接触,
其中R1、R2、R4、R5、R6、R7、和R8如以上所定义。
18.如权利要求17所述的方法,其中式(Ia)的化合物包括在以*标记的碳原子上具有指
定的立体化学的式(IaS)的化合物,
其中化合物(IaS)以对映体过量来形成。
19.一种用于制备式(Ia1)的化合物的方法,
其中
R1选自由以下组成的组:氢和(C1-C6)烷基;
R2选自由以下组成的组:氢、卤代、和(C1-C6)烷基;
R4、R5、R6、和R7各自彼此独立地选自由以下组成的组:氢、卤代、羟基、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、(C1-C6)烷基;氨基、(C1-C6)烷基氨基、和(C1-C6)二烷基氨基;以及
R9选自由以下组成的组:卤代、羟基、羟基(C1-C6)烷基、氨基、(C1-C6)烷基氨基、和(C1-C6)二烷基氨基;
条件是当R2是氢时,则以下的至少一个适用:
(i)R1不是氢或甲基;
(ii)R4和R7各自彼此独立地不是氢或氯;
(iii)R5不是氢、羟基、甲基、甲氧基、氟、氯、或三氟甲基;
(iv)R6不是氢、羟基、甲氧基、氟或氯;或
9
(v)R不是羟基;
所述方法包括在适当的反应条件下在氨基供体的存在下,使式(IIa1)的底物化合物与
权利要求1至8的任一项所述的工程化多肽接触,
其中R1、R2、R4、R5、R6、R7、和R9如以上所定义。
20.一种用于制备式(Ia2)的化合物的方法,
其中L是离去基团;
10
R 的每次出现彼此独立地选自由以下组成的组:卤代、羟基、氨基、羧基、氰基、硝基、硫代、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的(C1-C6)烷氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫代、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基、氨基羰基(C1-C6)烷基、任选地取代的环烷基、任选地取代的杂环烷基、任选地取代的芳基、任选地取代的杂芳基、任选地取代的芳氧基、任选地取代的芳基氨基、任选地取代的芳基硫代、任选地取代的芳基磺酰基、任选地取代的芳基亚磺酰基、任选地取代的芳基氧基羰基、任选地取代的芳基羰基氧基、任选地取代的杂芳基氧基、任选地取代的杂芳基氨基、任选地取代的杂芳基硫代、任选地取代的杂芳基磺酰基、任选地取代的杂芳基亚磺酰基、任选地取代的杂芳基氧基羰基、任选地取代的杂芳基羰基氧基、烷基氨基磺酰基(C1-C6)烷基、芳基磺酰基(C1-C6)烷基、和杂芳基磺酰基(C1-C6)烷基;
k为从3至5的整数;
n是1或2;以及
w是从0至4的整数;
所述方法包括在适当的反应条件下在氨基供体的存在下,使式(IIa2)的底物化合物与
权利要求1至8的任一项所述的工程化多肽接触,
其中
L、R10、k、n和w如以上所定义。
21.如权利要求20所述的方法,其中L是Cl或Br且k是3。
22.一种用于制备式(Ib)的化合物的方法,
其中
Z选自由以下组成的组:O、S、NH或-(CH2)m-,其中m是0、1、2或3;
R1选自由以下组成的组:氢、羧基、羧基(C1-C6)烷基、任选地取代的(C1-C6)烷基、任选地取代的(C2-C6)烯基、任选地取代的烷氧基羰基、任选地取代的芳基羰基、任选地取代的芳基磺酰基、和保护基团;
R4、R5、R6和R7各自彼此独立地选自由以下组成的组:氢、卤代、 羟基、氨基、羧基、氰基、硝基、硫代、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的(C1-C6)烷氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫代、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基、氨基羰基(C1-C6)烷基、任选地取代的环烷基、任选地取代的杂环烷基、任选地取代的芳基、任选地取代的杂芳基、任选地取代的芳氧基、任选地取代的芳基氨基、任选地取代的芳基硫代、任选地取代的芳基磺酰基、任选地取代的芳基亚磺酰基、任选地取代的芳基氧基羰基、任选地取代的芳基羰基氧基、任选地取代的杂芳基氧基、任选地取代的杂芳基氨基、任选地取代的杂芳基硫代、任选地取代的杂芳基磺酰基、任选地取代的杂芳基亚磺酰基、任选地取代的杂芳基氧基羰基、任选地取代的杂芳基羰基氧基、烷基氨基磺酰基(C1-C6)烷基、芳基磺酰基(C1-C6)烷基、和杂芳基磺酰基(C1-C6)烷基;
条件是当Z为-(CH2)m-,m为1,并且R1、R4、R6和R7为氢时,则R5不是氟;
所述方法包括在适当的反应条件下在氨基供体的存在下,使式(IIb)的底物化合物与
权利要求1至8的任一项所述的工程化多肽接触,
其中Z、R1、R4、R5、R6、和R7如以上所定义。
23.一种用于制备式(Ib1)的化合物的方法,
其中
R1选自由以下组成的组:氢、羧基(C1-C6)烷基、和(C1-C6)烷基;
R11的每次出现彼此独立地选自由以下组成的组:氯、溴、碘、羟基、氨基、羧基、氰基、硝基、硫代、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的(C1-C6)烷氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫代、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基、氨基羰基(C1-C6)烷基、任选地取代的环烷基、任选地取代的杂环烷基、任选地取代的芳基、任选地取代的杂芳基、任选地取代的芳氧基、任选地取代的芳基氨基、任选地取代的芳基硫代、任选地取代的芳基磺酰基、任选地取代的芳基亚磺酰基、任选地取代的芳基氧基羰基、任选地取代的芳基羰基氧基、任选地取代的杂芳基氧基、任选地取代的杂芳基氨基、任选地取代的杂芳基硫代、任选地取代的杂芳基磺酰基、任选地取代的杂芳基亚磺酰基、任选地取代的杂芳基氧基羰基、任选地取代的杂芳基羰基氧基、烷基氨基磺酰基(C1-C6)烷基、芳基磺酰基(C1-C6)烷基、和杂芳基磺酰基(C1-C6)烷基;以及
w为从0至4的整数;
所述方法包括在适当的反应条件下在氨基供体的存在下,使式(IIb1)的底物化合物与
权利要求1至8的任一项所述的工程化多肽接触,
其中
R1、R11和w如以上所述定义。
24.如权利要求15至23的任一项所述的方法,其中所述底物化合物的载量为0.5g/L至
200g/L。
25.如权利要求15至23的任一项所述的方法,其中所述底物化合物的载量为1g/L至
200g/L。
26.如权利要求15至23的任一项所述的方法,其中所述底物化合物的载量为5g/L至
150g/L。
27.如权利要求15至23的任一项所述的方法,其中所述底物化合物的载量为10g/L至
100g/L。
28.如权利要求15至23的任一项所述的方法,其中所述底物化合物的载量为20g/L至
100g/L。
29.如权利要求15至23的任一项所述的方法,其中所述氨基供体为异丙胺(IPM)。
30.如权利要求15至23的任一项所述的方法,其中所述适当的反应条件包括选自以下
的共溶剂:多元醇、二甲亚砜、DMSO、或低级醇。
31.如权利要求30所述的方法,其中所述多元醇是聚乙二醇(PEG)。
32.如权利要求30所述的方法,其中所述多元醇是PEG200。
33.如权利要求15所述的方法,其中所述适当的反应条件包括:(a)以5g/L至200g/L的
底物载量;(b)0.1至50g/L的转氨酶多肽;(c)0.1至3M的异丙胺(IPM);(d)0.1至10g/L的磷酸吡哆(PLP)辅因子;(e)6至9的pH;以及(f)30℃至60℃的温度
34.如权利要求15所述的方法,其中所述适当的反应条件包括:(a)25至100g/L的底物
载量;(b)0.5至10g/L的转氨酶多肽;(c)1至10%v/v的PEG200;(d)1至2M的异丙胺(IPM);
(e)0.1至1g/L的磷酸吡哆醛(PLP)辅因子;(f)0.1至0.5M的三乙醇胺(TEA);(g)6至8的pH;
以及(h)45℃至55℃的温度。

说明书全文

用于合成色胺和色胺类似物的衍生物的生物催化剂和方法

1.技术领域

[0001] 本公开内容涉及转酶生物催化剂以及使用该生物催化剂制备色胺和色胺类似物的衍生物的方法。
[0002] 2.对序列表、表格或计算机程序的引用
[0003] 序列表的正式文本作为ASCII格式文本文件与说明书经EFS-Web同时被提交,文件名为“CX2-105USP1_ST25.txt”,创建日期为2012年3月23日,且大小为457,542千字节。经EFS-Web提交的序列表为本说明书的一部分,并且通过引用以其整体并入本文。
[0004] 3.背景
[0005] 色胺类化合物具有核心通式
[0006]
[0007] 色胺和色胺类似物的衍生物,诸如同质色胺(homotryptamine),可对胺上的α-、β-碳和吲哚环进行取代。因为此类衍生物与神经递质血清素和褪黑激素在结构上相似,许多具有精神活性属性。例如,5-羟基-N,N-二甲基色胺、N,N-二甲基色胺、4-羟基-N,N-二甲基色胺、5-甲基-α-甲基色胺、α-甲基色胺、和α-乙基色胺具有致幻性质并在美国被规定为列表1管制物质(Schedule 1 Controlled Substances)。色胺、色胺类似物及其衍生物还形成了许多药物化合物的骨架,例如致幻剂麦酰二乙胺(LSD)、抗疟原虫药螺吲哚(Yeung等人,2010,J Med Chem.53:5155–5164),痛觉螺环己烷衍生物(美国专利公布号
20100240897),以及法尼酯X受体拮抗剂氮杂卓并吲哚(azepinoindole)衍生物(美国专利
公布号20100173824)。
[0008] 在α-碳处具有取代基的色胺衍生物,例如α-甲基色胺、或以及α-乙基色胺,导致手性中心,并且这些对映体已显示了展示不同的生物活性。例如,α-甲基色胺的S-异构体显示比R-异构体更大的效(参见,例如,D.B.Repke等人,1976,J Heterocycl Chem.13:775)。具有手性α-甲基色胺或α-甲基同质色胺组分的抗疟原虫药螺吲哚酮的不同异构体,也显示不同的效力,例如(1R,3S)异构体显示比(1R,3R)异构体更高的抗疟原虫活性(参见上述
Yeung;WO2009/132921):
[0009]
[0010] 制备手性α-碳取代的色胺和色胺类似物,诸如α-甲基色胺和α-甲基同质色胺,可采用分离/隔离期望的异构体或使用采用手性起始化合物用于不对称合成的化学合成途径。后者的示例是合成抗疟原虫药螺吲哚酮,其可使用D-色氨醇作为起始化合物用于合成
手性中间体S-α-甲基色胺(上述Yeung等人)。
[0011] 用于制备手性化合物的其他一般方法包括与保留手性的无手性试剂连续反应,使用掺入了对映体纯的手性中心的试剂或催化剂以转换对映体为具有不同反应性的非对映
体,使用化学手性催化剂以及手性助剂化合物。
[0012] 分离并隔离对映体可以是费时的,而化学不对称合成策略可受限于分子可经历的可能反应,需要苛刻的反应条件和/或复杂的合成路线。实例是D-色氨醇在合成螺吲哚酮中的可用性,其由于其合成需要的复杂的合成步骤而受限。因此,期望开发用于制备α-取代的色胺及结构上相关的类似物的合成方法,该方法使用温和条件,导致期望的手性化合物的
高对映体过量,具有起始原料至期望的产物的高转化,并且是成本有效的。
[0013] 4.概述
[0014] 本公开内容提供了具有转氨酶活性的工程化多肽、编码该多肽的多核苷酸、制备该多肽的方法、以及使用该多肽用于生物催化转化酮底物为胺产物的方法。与河流弧菌
(Vibrio fluvialis)的天然存在的转氨酶的氨基酸序列(SEQ ID NO:2)和具有增强的溶剂
稳定性热稳定性的参考工程化转氨酶的氨基酸序列(SEQ ID NO:4)相比,本发明的酶已
被工程化为具有一个或更多个残基差异,其中残基差异存在于影响以下各种酶特性的残基
位置上:包括活性、立体选择性、稳定性、表达、和产物耐受性,以及其他。特别地,本公开内容的转氨酶已被工程化为从其相应的前手性酮底物有效形成手性色胺衍生物。因此,本文
公开的工程化多肽展示了在从相应的前手性酮底物形成色胺衍生物中,特别是在底物化合
物(2),1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-酮向产物化合物(1),(S)-1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺的转化中,增加的活性、溶剂稳定性和热稳定性、增加的产物耐受性、以及高立体选择性,以及其他,
[0015]
[0016] 因此,在一个方面,本公开内容提供了具有转氨酶活性的工程化多肽,其中该工程化多肽包括具有与SEQ ID NO:2或4的至少80%同一性和与SEQ ID NO:4相比在选自以下的残基位置上的一个或更多个残基差异的氨基酸序列:X14;X26;X31;X33;X41;X47;X57;X70;
X86;X88;X107;X132;X148;X163;X168;X173;X203;X250;X284;X314;X315;X324;X346;
X395;X398;X400;X417;X419;X423;X448;和X451,其中在残基位置X31;X57;X86;X163;
X168;X314;X324;X398;和X417处的残基差异选自:X31S;X57Y;X86D;X163I;X163L;X163R;
X163V;X168S;X314N;X324H;X398L;X398V;X398W;和X417M。
[0017] 在一些实施方案中,在残基位置X14;X26;X33;X41;X47;X70;X88;X107;X132;X148;X173;X203;X250;X284;X315;X346;X395;X400;X419;X423;X448;和X451处的残基差异选自X14V;X26R;X33T;X41L;X47N;X70A;X88A;X88L;X107P;X132F;X148Q;X148R;X173A;
X203S;X250A;X284A;X315G;X346L;X395P;X400G;X419S;X423I;X448E;和X451D。
[0018] 如本文所提供,在一些实施方案中,公开的残基差异可单独或以各种组合被用于产生具有改进的酶特性的工程化多肽。在本文详细的说明书中提供了关于残基差异的选择
和对酶特性的影响的指导。在一些实施方案中,工程化转氨酶多肽包括具有与参考序列SEQ ID NO:4的至少80%序列同一性和与SEQ ID NO:4相比在选自以下的残基位置上至少一个
残基差异的氨基酸序列:X14、X86、X163、或X400。在一些实施方案中,氨基酸序列具有在位置X163上的至少一个残基差异,其中氨基酸残基选自I、L、R和V。
[0019] 在一些实施方案中,工程化转氨酶多肽包括具有与SEQ ID NO:4相比选自以下的残基差异的组合的氨基酸序列:(a)X14V和X163I/L/R/V;(b)X86D和X400G;(c)X57F/Y和
X163I/L/R/V;(d)X57F/Y和X398L/V/W;(e)X14V、X113L/V、X163I/L/R/V、X284A、和X424V;以及(f)X31S、X57F/Y、X163I/L/R/V、X315G、X346L、和X398L/V/W。
[0020] 在一些实施方案中,工程化转氨酶多肽包括具有与SEQ ID NO:4相比选自以下的残基差异的组合的氨基酸序列:(a)X14V、X113L、X163L、X284A、和X424V;(b)X14V、X26R、X163L、X284A、和X400G;(c)X14V、X26R、X88L、和X113L;(d)X57F、X163L、X168K、X314N、X315G、X346L、和X398V;(e)X14V、X163L、X173A、X400G、和X420N;(f)X14V、X113L、X163L、和X284A;(g)X14V、X26R、X163L、X284A、和X400G;以及(h)X14V、X33T、X57F、X113L、和X163L。
[0021] 在一些实施方案中,工程化转氨酶多肽能够在适当的反应条件下以至少90%对映体过量将底物化合物(2),1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-酮转化为产物化合物(1),
(S)-1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺。
[0022] 在一些实施方案中,工程化转氨酶多肽在将底物化合物(2)转化为产物化合物(1)中具有SEQ ID NO:4的至少1.2倍活性,其中氨基酸序列包括选自以下的一个或更多个残基
差异:X14V、X26R;X31S;X33T;X41L;X70A;X86D;X88A/L;X163I/L;X284A;和X419S。在一些实施方案中,工程化转氨酶多肽在将底物化合物(2)转化为产物化合物(1)中具有SEQ ID NO:
4的至少5倍活性,其中氨基酸序列包括选自以下的一个或更多个残基差异:X14V、X26R;
X33T;X88A/L;X163I/L;和X284A。
[0023] 在一些实施方案中,与SEQ ID NO:4相比,工程化转氨酶多肽在在适当的反应条件下将底物化合物(2)转化为产物化合物(1)中具有对产物化合物(1)抑制的至少1.2倍增加
的耐受性,其中氨基酸序列包括选自以下的一个或更多个残基差异:X26R;X70A;X86D;
X88A/L;X132F;X163L;X315G;X395P;X398L;和X419S。在一些实施方案中,与SEQ ID NO:4相比,工程化转氨酶多肽在在适当的反应条件下将底物化合物(2)转化为产物化合物(1)中具
有对产物化合物(1)抑制的至少5倍增加的耐受性,其中氨基酸序列包括选自以下的一个或
更多个残基差异:X26R;X88L;和X163L。
[0024] 在一些实施方案中,工程化转氨酶多肽可具有在其他残基位置上的另外的残基差异。在一些实施方案中,工程化转氨酶可具有与SEQ ID NO:2或4相比的1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-15个、1-20个、1-21个、1-22个、1-23个、1-
24个、1-25个、1-30个、1-35个、1-40个、1-45个、或1-50个另外的残基差异。在一些实施方案中,工程化转氨酶可具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、
14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个、或50个另外的残基差异。在一些实施方案中,氨基酸序列另外具有与SEQ ID NO:2或4相比的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、18个、20个、21个、22个、23个、24个、或25个残基差异。
[0025] 在表2A和2B、以及实施例中公开了掺入残基差异、包括其各种组合、并具有改进的特性(例如,能够在适当的反应条件下以至少90%对映体过量将化合物(2)转化为化合物(1))的示例性工程化多肽。氨基酸序列提供于序列表中并且包括SEQ ID NO:6、8、10、12、
14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、
64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、
110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、
148、150、152、和154。
[0026] 在另一个方面,本公开内容提供了编码具有转氨酶活性的工程化多肽的多核苷酸、以及包含该多核苷酸的表达载体、和能够表达编码工程化多肽的多核苷酸的宿主细胞。
示例性多核苷酸序列提供于通过引用并入本文的序列表中并且包括SEQ ID NO:5、7、9、11、
13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、
63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、
111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、
149、151、和153。
[0027] 在一些实施方案中,本公开内容还提供了制造工程化转氨酶多肽的方法,其中该方法可包括在适合于表达多肽的条件下培养能够表达编码工程化转氨酶多肽的多核苷酸
的宿主细胞。在一些实施方案中,制造工程化转氨酶多肽的方法还可包括:(a)合成编码多肽的多核苷酸,所述多肽包括选自以下的氨基酸序列:SEQ ID NO:6、8、10、12、14、16、18、
20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、
70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、
116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、和154,并且具有与SEQ ID NO:4相比在选自以下的残基位置上的一个或更多个残基差异:
X14;X26;X31;X33;X41;X47;X57;X70;X86;X88;X107;X132;X148;X163;X168;X173;X203;
X250;X284;X314;X315;X324;X346;X395;X398;X400;X417;X419;X423;X448;和X451,其中在残基位置X31;X57;X86;X163;X168;X314;X324;X398;和X417上的残基差异选自:X31S;
X57Y;X86D;X163I;X163L;X163R;X163V;X168S;X314N;X324H;X398L;X398V;X398W;和X417M;以及(b)表达由多核苷酸编码的转氨酶多肽。如以上所注,在残基位置X14;X26;X33;
X41;X47;X70;X88;X107;X132;X148;X173;X203;X250;X284;X315;X346;X395;X400;X419;
X423;X448;和X451上的残基差异可选自X14V;X26R;X33T;X41L;X47N;X70A;X88A;X88L;
X107P;X132F;X148Q;X148R;X173A;X203S;X250A;X284A;X315G;X346L;X395P;X400G;
X419S;X423I;X448E;和X451D。如在详细描述中进一步提供的,在合成多核苷酸期间可掺入另外的变异,以制备在表达的氨基酸序列中具有相应差异的工程化转氨酶。
[0028] 在另一个方面,工程化转氨酶多肽可被用于从其相应的酮底物制备色胺和色胺类似物的各种衍生物,诸如取代的同质色胺的方法中。因此,在一些实施方案中,工程化转氨酶多肽可被用于将式(II)的底物化合物转化为式(I)的产物化合物的方法中,如下所示:
[0029]
[0030] 其中
[0031] R1选自由以下组成的组:氢、羧基、羧基(C1-C6)烷基、任选地取代的(C1-C6)烷基、任选地取代的(C2-C6)烯基、任选地取代的烷氧基羰基、任选地取代的芳基羰基、任选地取代的芳基磺酰基、和保护基团;
[0032] R2选自由以下组成的组:氢、氧代、卤代、羟基、氨基、硫代、任选地取代的(C1-C6)烷基、(C1-C6)烷基氨基、(C1-C6)二烷基氨基、(C1-C6)烷基硫代、(C1-C6)烷基磺酰基、(C1-C6)烷基亚磺酰基、和任选地取代的(C1-C6)烷氧基;
[0033] R4、R6和R7各自彼此独立地选自由以下组成的组:氢、卤代、羟基、氨基、羧基、氰基、硝基、硫代、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的(C1-C6)烷氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫代、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基、氨基羰基(C1-C6)烷基、任选地取代的环烷基、任选地取代的杂环烷基、任选地取代的芳基、任选地取代的杂芳基、任选地取代的芳氧基、任选地取代的芳基氨基、任选地取代的芳基硫代、任选地取代的芳基磺酰基、任选地取代的芳基亚磺酰基、任选地取代的芳基氧基羰基、任选地取代的芳基羰基氧基、任选地取代的杂芳基氧基、任选地取代的杂芳基氨基、任选地取代的杂芳基硫代、任选地取代的杂芳基磺酰基、任选地取代的杂芳基亚磺酰基、任选地取代的杂芳基氧基羰基、任选地取代的杂芳基羰基氧基、烷基氨基磺酰基(C1-C6)烷基、芳基磺酰基(C1-C6)烷基、和杂芳基磺酰基(C1-C6)烷基;
[0034] R5选自由以下组成的组:氢、卤代、羟基、氨基、羧基、氰基、硝基、硫代、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的(C1-C6)烷氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫代、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基、氨基羰基(C1-C6)烷基、任选地取代的环烷基、任选地取代的杂环烷基、任选地取代的芳基、任选地取代的杂芳基、任选地取代的芳氧基、任选地取代的芳基氨基、任选地取代的芳基硫代、任选地取代的芳基磺酰基、任选地取代的芳基亚磺酰基、任选地取代的芳基氧基羰基、任选地取代的芳基羰基氧基、任选地取代的杂芳基氧基、任选地取代的杂芳基氨基、任选地取代的杂芳基硫代、任选地取代的杂芳基磺酰基、任选地取代的杂芳基亚磺酰基、任选地取代的杂芳基氧基羰基、任选地取代的杂芳基羰基氧基、烷基氨基磺酰基(C1-C6)烷基、芳基磺酰基(C1-C6)烷基、和杂芳基磺酰基(C1-C6)烷基、或与R4一起形成5至8元任选地取代的环烷基或任选地取代的杂环;
[0035] R8选自由以下组成的组:任选地取代的(C1-C6)烷基、任选地取代的(C1-C6)烷氧基、任选地取代的环烷基、任选地取代的杂环烷基、任选地取代的芳基、和任选地取代的杂芳基、或与R2一起形成任选地取代的5至8元环烷基或杂环;以及
[0036] n是1或2;
[0037] 条件是
[0038] (a)当R2是氢时,则以下的至少一个适用:
[0039] (i)R1不是氢、甲基、4-(甲氧基)苯基羰基-、4-(三氟甲氧基)苯磺酰基-、3-溴苯基羰基-、3-氨基丙基、或3-(甲基羰基氨基)丙基-;
[0040] (ii)R4和R7各自彼此独立地不是氢或氯;
[0041] (iii)R5不是氢、羟基、甲基、甲氧基、氟、氯、三氟甲基、或氰基;
[0042] (iv)R6不是氢、羟基、甲氧基、氟或氯;或
[0043] (v)R8不是甲基、乙基、羟甲基、或三氟甲基-;以及
[0044] (b)当n是1,R2和R8一起形成环己基环,并且R1、R4、R6、和R7是氢时,则R5不是氟。
[0045] 因此,在一些实施方案中,用于制备结构式(I)的化合物的方法可包括在适当的反应条件下在胺供体的存在下,使结构式(II)的化合物与本公开内容的任何工程化转氨酶接
触。
[0046] 在一些实施方案中,转氨酶的立体选择性可被用于制备在以*标记的碳原子上具有指定的立体化学的式(IS)的手性化合物,
[0047]
[0048] 其中R1、R2、R4、R5、R6、R7、R8和n如以上所定义,并且
[0049] 其中式(IS)的化合物以对映体过量来形成。在方法的一些实施方案中,式(IS)的化合物可以以至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大的对映体过量来形成。
[0050] 在一些实施方案中,工程化转氨酶多肽可被用于将式(IIb)的底物化合物转化为结构式(Ib)的产物化合物的方法中,如下所示:
[0051]
[0052] 其中,
[0053] Z选自由以下组成的组:O、S、NH、或-(CH2)m-、其中m为0、1、2或3;
[0054] R1选自由以下组成的组:氢、羧基、羧基(C1-C6)烷基、任选地取代的(C1-C6)烷基、任选地取代的(C2-C6)烯基、任选地取代的烷氧基羰基、任选地取代的芳基羰基、任选地取代的芳基磺酰基、和保护基团;
[0055] R4、R5、R6和R7各自彼此独立地选自由以下组成的组:氢、卤代、羟基、氨基、羧基、氰基、硝基、硫代、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的(C1-C6)烷氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫代、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基、氨基羰基(C1-C6)烷基、任选地取代的环烷基、任选地取代的杂环烷基、任选地取代的芳基、任选地取代的杂芳基、任选地取代的芳氧基、任选地取代的芳基氨基、任选地取代的芳基硫代、任选地取代的芳基磺酰基、任选地取代的芳基亚磺酰基、任选地取代的芳基氧基羰基、任选地取代的芳基羰基氧基、任选地取代的杂芳基氧基、任选地取代的杂芳基氨基、任选地取代的杂芳基硫代、任选地取代的杂芳基磺酰基、任选地取代的杂芳基亚磺酰基、任选地取代的杂芳基氧基羰基、任选地取代的杂芳基羰基氧基、烷基氨基磺酰基(C1-C6)烷基、芳基磺酰基(C1-C6)烷基、和杂芳基磺酰基(C1-C6)烷基;
[0056] 条件是当Z为-(CH2)m-,m为1,并且R1、R4、R6和R7为氢时,则R5不是氟。
[0057] 因此,在一些实施方案中,制备结构式(Ib)的化合物的方法可包括在适当的反应条件下在胺供体的存在下,使结构式(IIb)的化合物与本公开内容的任何工程化转氨酶接
触。
[0058] 在一些实施方案中,转氨酶的立体选择性可被用于制备在以*标记的碳原子上具有指定的立体化学的式(IbS)的手性化合物,
[0059]
[0060] 其中Z、R1、R4、R5、R6、和R7如以上所定义,并且其中式(IbS)的化合物以对映体过量来形成。在方法的一些实施方案中,式(IbS)的化合物可以以至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大的对映体过量来形成。
[0061] 如本文所提供,使用工程化转氨酶的方法可在适当的反应条件的范围下来进行,反应条件包括胺供体、pH、温度、缓冲液、溶剂系统、底物载量、多肽载量、辅因子载量、压力、和反应时间的范围,以及其他。
[0062] 在一些实施方案中,用于氨基转移方法的适当的反应条件可包括:(a)以约5g/L至200g/L的底物载量;(b)约0.1至50g/L的工程化转氨酶多肽;(c)约0.1至4M的异丙胺(IPM);
(d)约0.1至10g/L的磷酸吡哆(PLP)辅因子;(e)约6至9的pH;以及(f)约30℃至60℃的温
度。
[0063] 在一些实施方案中,用于氨基转移方法的适当的反应条件可包括:(a)以约5至约20g/L的底物载量;(b)约0.05至2g/L的工程化转氨酶多肽;(c)约1至10%v/v的PEG200;(d)约1至2M的异丙胺(IPM);(e)约0.1至1g/L的磷酸吡哆醛(PLP)辅因子;(f)约0.1至约0.5M的三乙醇胺(TEA);(g)约6至8的pH;以及(h)约45℃至55℃的温度。
[0064] 在一些实施方案中,用于氨基转移方法的适当的反应条件可包括:(a)约25至约100g/L的底物载量;(b)约0.5至10g/L的转氨酶多肽;(c)约1至10%v/v的PEG200;(d)约1至
2M的异丙胺(IPM);(e)约0.1至1g/L的磷酸吡哆醛(PLP)辅因子;(f)约0.1至约0.5M的三乙
醇胺;(g)约6至8的pH;以及(h)约45℃至55℃的温度。
[0065] 关于选择工程化转氨酶、制备生物催化剂、选择酶底物、以及进行方法的参数的指导进一步被描述于以下的详细说明中。
[0066] 5.详述
[0067] 除非上下文另外清楚地指明,否则如该说明书和所附的权利要求书中使用的单数形式“一(a)”、“一(an)”和“该(the)”包括复数指示物。因此,例如,提及“一种多肽”包括多于一种多肽。
[0068] 类似地,“包括(comprise)”、“包括(comprises)”、“包括(comprising)”、“包括(include)”、“包括(includes)”、和“包括(including)”是可互换的,且不意图为限制性的。
[0069] 还应理解的是,当各个实施方案的描述使用术语“包括(comprising)”时,本领域技术人员将理解,在一些特定情况下,一种实施方案可替代地利用措辞“基本上由…组成”或“由…组成”来描述。
[0070] 应理解的是,上述的一般说明,包括附图和以下详述两者都只是示例性和说明性的,而不是限制本公开内容。
[0071] 本文所用的章节标题仅用于组织目的,且不应当被解释为限制所描述的主题。
[0072] 5.1缩写
[0073] 用于遗传编码的氨基酸的缩写是常规的,并如下:
[0074]
[0075]
[0076] 当使用三字母缩写时,除非前面明确加有“L”或“D”或从使用缩写的上下文明显,否则氨基酸可为关于α-碳(Cα)成L-构型或D-构型。例如,尽管“Ala”表示丙氨酸,而没有指明关于α-碳的构型,但“D-Ala”与“L-Ala”分别表示D-丙氨酸与L-丙氨酸。当使用单字母缩写时,大写字母表示关于α-碳的L-构型的氨基酸,而小写字母表示关于α-碳的D-构型的氨基酸。例如,“A”表示L-丙氨酸而“a”表示D-丙氨酸。当多肽序列被呈现为一串单字母或三字母缩写(或其混合)时,根据通常惯例,序列以氨基(N)至羧基(C)方向呈现。
[0077] 用于基因编码的核苷的缩写是常规的,并且是如下:腺苷(A);苷(G);胞苷(C);胸苷(T);以及尿苷(U)。除非特别描绘,否则缩写的核苷可为核糖核苷或2’-脱氧核糖核苷。
核苷可以单个计或以聚集体计被指定为核糖核苷或2’-脱氧核糖核苷。当核酸序列被呈现
为一串单字母缩写时,根据通常惯例,序列以5’至3’方向呈现,且没有显示磷酸盐
[0078] 5.2定义
[0079] 关于本公开内容,除非另外具体指明,否则本文的说明书中使用的技术术语和科学术语将具有本领域普通技术人员通常理解的含义。因此,以下术语意为具有以下含义。
[0080] “蛋白”、“多肽”和“肽”在本文中可互换使用,表示通过酰胺键共价连接的至少两个氨基酸的聚合物,而不论长度或翻译后修饰(例如,糖基化、磷酸化、脂化、肉豆蔻化(myristilation)、泛素化等等)。在这一定义中包括D-氨基酸和L-氨基酸,以及D-氨基酸和L-氨基酸的混合物。
[0081] “多核苷酸”或“核酸”是指共价地连接在一起的两个或更多个核苷。多核苷酸可完全由核糖核苷(即,RNA)组成,完全由2’-脱氧核糖核苷酸(即,DNA)组成或由核糖核苷和2’-脱氧核糖核苷的混合物组成。尽管核苷将通常通过标准磷酸二酯键合连接在一起,但多核苷酸可包括一个或多个非标准的键合。多核苷酸可以是单链的或双链的,或可包括单链区
和双链区两者。此外,虽然多核苷酸将通常由天然存在的编码核基(即,腺嘌呤、鸟嘌呤、尿嘧啶、胸腺嘧啶和胞嘧啶)组成,但其可包括一个或更多个修饰的和/或合成的核碱基,诸如,例如,肌苷、黄嘌呤、次黄嘌呤等。优选地,这种修饰的或合成的核碱基将为编码核碱基。
[0082] “转氨酶”或“氨基转移酶”在本文可互换使用,以指具有从伯胺将氨基(NH2)转移至受体分子的羰基(C=O)的酶促能力的多肽。如本文所用的转氨酶包括天然存在的(野生型)转氨酶以及由人工操作产生的非天然存在的工程化多肽。
[0083] “氨基受体”和“胺受体”、“酮底物”、“酮基”、和“酮”在本文可互换使用以指接受来自供体胺的氨基基团的羰基(酮基、或酮)化合物。在一些实施方案中,氨基受体是以下通式的分子,
[0084]
[0085] 其中,Rα与Rβ中的每一个当独立地被采用时,是烷基、环烷基、杂环烷基、芳基或杂芳基,其可以是未被取代的或用一个或更多个酶学上可接受的基团取代的。Rα可在结构或手性上与Rβ相同或不同。在一些实施方案中,Rα与Rβ,一起可形成为未被取代的、取代的或稠合至其他环的环。氨基受体包括酮基羧酸和链烷酮(酮)。典型的酮基羧酸是α-酮基羧酸诸如乙醛酸、丙酮酸、草酰乙酸和类似的酮基羧酸,以及这些酸的盐。氨基受体还包括由其他酶或全细胞进程转化为氨基受体的物质,诸如富酸(其可被转化为草酰乙酸)、葡萄糖(其可被转化为丙酮酸盐)、乳酸盐、马来酸以及其他。可被使用的氨基受体包括,通过举例的方式而非限制,3,4-二氢-1(2H)-酮、1-苯基丁-2-酮、3,3-二甲基丁-2-酮、辛-2-酮、3-氧代丁酸乙酯、4-苯基丁-2-酮、1-(4-溴苯基)乙酮、2-甲基-环己酮、7-甲氧基-2-四氢萘酮、1-羟基丁-2-酮、丙酮酸、苯乙酮、3’-羟基苯乙酮、2-甲氧基-5-氟苯乙酮、乙酰丙酸、1-苯基丙-1-酮、1-(4-溴苯基)丙-1-酮、1-(4-硝基苯基)丙-1-酮、1-苯基丙-2-酮、2-氧代-3-甲基丁酸、1-(3-三氟甲基苯基)丙-1-酮、羟基丙酮、甲氧基氧基丙酮(methoxyoxypropanone)、1-苯基丁-1-酮、1-(2,5-二甲氧基-4-甲基苯基)丁-2-酮、1-(4-羟基苯基)丁-3-酮、2-乙酰基萘、苯基丙酮酸、2-酮戊二酸和2-酮丁二酸,包括可能的(R)和(S)单异构体二者。
[0086] “氨基供体”或“胺供体”是指向氨基受体给予氨基,因此成为羰基物质的氨基化合物。在一些实施方案中,氨基供体是以下通式的分子,
[0087]
[0088] 其中,Rε与Rδ中的每一个当独立地被采用时,是烷基、环烷基、杂环烷基、芳基或杂ε芳基,其是未被取代的或用一个或更多个酶学上非抑制基团取代的。R 可在结构或手性上
与Rδ相同或不同。在一些实施方案中,Rε与Rδ,一起可形成为未被取代的、取代的或稠合至其他环的环。可使用的典型的氨基供体包括手性与非手性氨基酸、以及手性与非手性胺。可使用的氨基供体包括,通过举例的方式而非限制,异丙胺(也称为2-氨基丙烷)、α-苯乙胺(也称为1-苯乙胺)以及其对映异构体(S)-1-苯乙胺与(R)-1-苯乙胺、2-氨基-4-苯基丁烷、甘
氨酸、L-谷氨酸、L-谷氨酸盐、谷氨酸单钠、L-丙氨酸、D-丙氨酸、D,L-丙氨酸、L-天冬氨酸、L-赖氨酸、D,L-鸟氨酸、β-丙氨酸、磺酸、正辛胺、环己胺、1,4-丁二胺(也被称为腐胺)、1,
6-己二胺、6-氨基己酸、4-氨基丁酸、酪胺和苄胺、2-氨基丁烷、2-氨基-1-丁醇、1-氨基-1-苯基乙烷、1-氨基-1-(2-甲氧基-5-氟苯基)乙烷、1-氨基-1-苯基丙烷、1-氨基-1-(4-羟基苯基)丙烷、1-氨基-1-(4-溴苯基)丙烷、1-氨基-1-(4-硝基苯基)丙烷、1-苯基-2-氨基丙
烷、1-(3-三氟甲基苯基)-2-氨基丙烷、2-氨基丙醇、1-氨基-1-苯基丁烷、1-苯基-2-氨基丁烷、1-(2,5-二甲氧基-4-甲基苯基)-2-氨基丁烷、1-苯基-3-氨基丁烷、1-(4-羟基苯基)-3-氨基丁烷、1-氨基-2-甲基环戊烷、1-氨基-3-甲基环戊烷、1-氨基-2-甲基环己烷、1-氨基-
1-(2-萘基)乙烷、3-甲基环戊胺、2-甲基环戊胺、2-乙基环戊胺、2-甲基环己胺、3-甲基环己胺、1-氨基四氢化萘、2-氨基四氢化萘、2-氨基-5-甲氧基四氢化萘和1-氨基茚满,包括可能的(R)和(S)单异构体二者且包括该胺的所有可能的盐。
[0089] “手性胺”是指通式Rα-CH(NH2)-Rβ的胺并且以其最广泛的意义在本文中使用,包括多种不同和混合的官能类型的脂族和脂环族化合物,特征在于与仲碳原子结合的伯氨基的存在,该仲碳原子除了氢原子之外还携带(i)形成手性环状结构的二价基团,或(ii)在结构或手性上彼此不同的两个取代基(除了氢)。形成手性环状结构的二价基团包括,例如,2-甲基丁烷-1,4-二基、戊烷-1,4-二基、己烷-1,4-二基、己烷-1,5-二基、2-甲基戊烷-1,5-二基。在仲碳原子上的两种不同的取代基(上述Rα和Rβ)还可广泛地变化,且包括烷基、芳烷基、芳基、卤代、羟基、低级烷基、低级烷氧基、低级烷基硫、环烷基、羧基、烷氧羰基
(carbalkoxy)、氨基甲酰基、单(低级烷基)取代的氨基甲酰基和二(低级烷基)取代的氨基
甲酰基、三氟甲基、苯基、硝基、氨基、单(低级烷基)取代的氨基和二(低级烷基)取代的氨基、烷基磺酰基、芳基磺酰基、烷基甲酰胺基、芳基甲酰胺基等,以及由前述基团取代的烷基、芳烷基或芳基。
[0090] “吡哆醛磷酸”、“PLP”、“吡哆醛-5’-磷酸”、“PYP”和“P5P”在本文中可互换使用以指在转氨酶反应中充当辅酶的化合物。在一些实施方案中,吡哆醛磷酸由结构1-(4’-甲酰基-3’-羟基-2’-甲基-5’-吡啶基)甲氧基膦酸定义,CAS号[54-47-7]。吡哆醛-5’-磷酸可通过吡哆醇(也被称为维生素B6)的磷酸化和氧化在体内产生。在使用转氨酶类的氨基转移反应中,氨基供体的胺基被转移到辅酶以产生酮基副产物,同时吡哆醛-5’-磷酸被转化成磷酸吡哆胺。吡哆醛-5’-磷酸通过与不同的酮基化合物(氨基受体)反应而被再生。胺基从磷酸吡哆胺向氨基受体的转移产生胺并再生辅酶。在一些实施方案中,吡哆醛-5’-磷酸可以被维生素B6家族的其它成员代替,包括吡哆醇(PN)、吡哆醛(PL)、吡哆胺(PM),和它们的磷酸化的对应物;磷酸吡哆醇(PNP)和磷酸吡哆胺(PMP)。
[0091] “编码序列”是指编码蛋白的氨基酸序列的核酸部分(例如,基因)。
[0092] “天然存在的”或“野生型”是指在自然界发现的形式。例如,天然存在的或野生型多肽或多核苷酸序列是生物体中存在的序列,其可从天然来源分离且未通过人为操纵而被有意识地修改
[0093] 当关于例如细胞、核酸或多肽使用时,“重组的”或“工程化的”或“非天然存在的”指如下材料或与该材料的自然或天然形式相应的材料:已经以天然本来不存在的方式被修饰或与其相同但由合成的材料产生或衍生和/或通过使用重组技术操作产生。非限制性实
例包括,表达在细胞的天然(非重组的)形式中未发现的基因或表达另外以不同的平被表
达的天然基因的重组细胞以及其他。
[0094] “序列同一性的百分比”和“同源性百分比”在本文可互换使用以指多核苷酸和多肽之间的对比,并通过跨比较窗比较两条最佳比对的序列来确定,其中多核苷酸或多肽序列在比较窗中的部分参考序列相比可以包括添加或缺失(即,缺口),以用于两条序列的最
佳比对。百分比可以如下计算:通过确定两个序列中出现相同的核酸碱基或氨基酸残基的
位置的数目,以产生匹配位置的数目,将匹配位置的数目除以比较窗中位置的总数目,并将结果乘以100以得到序列同一性的百分比。可选地,百分比可以如下计算:通过确定两个序列中出现相同的核酸碱基或氨基酸残基或者核酸碱基或氨基酸残基与缺口对齐的位置的
数目,以产生匹配位置的数目,将匹配位置的数目除以比较窗中位置的总数目,并将结果乘以100以得到序列同一性的百分比。本领域的技术人员理解,存在许多可用于比对两个序列的已建立的算法。用于比较的最佳序列比对可如下进行,例如,通过Smith和Waterman,
1981,Adv.Appl.Math.2:482的局部同源性算法,通过Needleman和Wunsch,1970,
J.Mol.Biol.48:443的同源性比对算法,通过Pearson和Lipman,1988,
Proc.Natl.Acad.Sci.USA 85:2444的相似度检索方法,通过这些算法的计算机实现(在GCG Wisconsin软件包中的GAP、BESTFIT、FASTA和TFASTA),或通过目测(通常参见,Current 
Protocols in Molecular Biology,F.M.Ausubel等人编著,Current Protocols,a joint 
venture between Greene Publishing Associates,Inc.and John Wiley&Sons,Inc.,
(1995增刊)(Ausubel))。适合用于确定序列同一性百分比和序列相似性的算法的实例是
BLAST和BLAST 2.0算法,其被分别描述于Altschul等人,1990,J.Mol.Biol.215:403-410以
及Altschul等人,1977,Nucleic Acids Res.3389-3402中。用于进行BLAST分析的软件为通
过美国国家生物技术信息中心网站公共可获得的。这一算法包括首先通过识别查询序列
(query sequence)中具有长度W的短字来确定高评分序列对(HSP),当其与数据库序列中相
同长度的字比对时,所述短字匹配或满足某个正值阈值评分T。T被称为邻近字评分阈值
(Altschul等人,如上述)。这些最初的邻近字匹配(word hit)用作启动检索的种子以找到
更长的包括它们的HSP。然后字匹配沿着每个序列的两个方向延伸到累积比对评分不能增
加的程度。对于核苷酸序列,累积评分使用参数M(用于一对匹配残基的奖励评分;总是>0)和N(用于错配残基的惩罚评分;总是<0)来计算。对于氨基酸序列,使用评分矩阵以计算累积评分。当发生以下情况时字匹配在每个方向的延伸停止:累积比对评分从其最大获得的
值下降了量X时;由于一个或多个负评分残基比对的累积,累积评分变成零或以下时;或达到任一序列的末端。BLAST算法参数W、T和X决定比对的灵敏度和速度。BLASTN程序(对于核苷酸序列)使用11的字长(W)、10的期望值(E)、M=5、N=-4、以及两个链的比较作为缺省参数。对于氨基酸序列,BLASTP程序使用3的字长(W)、10的期望值(E),和BLOSUM62评分矩阵作为缺省(参见Henikoff和Henikoff,1989,Proc Natl Acad Sci USA 89:10915)。序列比对
与%序列同一性的示例性确定可使用GCG Wisconsin软件包(Accelrys、Madison WI)中的
BESTFIT或GAP程序,使用提供的缺省参数。
[0095] “参考序列”是指用作序列比较的基础的确定序列。参考序列可以是更大序列的子集,例如,全长基因或多肽序列的区段。通常,参考序列为至少20个核苷酸或氨基酸残基的长度,至少25个残基的长度,至少50个残基的长度,或核酸或多肽的全长。因为两种多核苷酸或多肽可以各自(1)包括两个序列之间相似的序列(即,完整序列的一部分),且(2)还可包括在两种序列之间不同的序列,所以两种(或更多种)多核苷酸或多肽之间的序列比较通
常通过在“比较窗”内比较两种多核苷酸或多肽的序列来进行,以确定和比较具有序列相似性的局部区域。在一些实施方案中,“参考序列”可基于基本氨基酸序列,其中参考序列为可在基本序列中具有一个或更多个变化的序列。例如,“基于SEQ ID NO:4、在相应于X14的残基处具有缬氨酸的参考序列”或X14V是指在SEQ ID NO:4中X14处相应的残基(是酪氨酸)已
经改变成缬氨酸的参考序列。
[0096] “比较窗”是指至少约20个连续核苷酸位置或氨基酸残基的概念性片段,其中序列可与至少20个连续的核苷酸或氨基酸的参考序列进行比较,并且其中在比较窗中序列的一部分与用于两个序列的最佳比对的参考序列相比,可以包括20%或更少的添加或缺失(即,空位)。比较窗可以比20个连续的残基更长,并任选地包括30、40、50、100或更长的窗。
[0097] “基本同一性”指以下的多核苷酸或多肽序列,其与参考序列相比,在至少20个残基位置的比较窗内,经常在至少30-50个残基的比较窗内,具有至少80%序列同一性、至少85%同一性和89%至95%序列同一性、更通常至少99%序列同一性,其中序列同一性百分
比通过在比较窗内比较参考序列与包括总计参考序列的20%或更少的缺失或添加的序列
来计算。在应用于多肽的特定的实施方式中,术语“基本同一性”指当最佳比对时,如通过程序GAP或BESTFIT使用缺省空位权重,两种多肽序列共有至少80%的序列同一性,优选地至
少89%的序列同一性,至少95%的序列同一性或更多(例如99%的序列同一性)。优选地,不相同的残基位置通过保守的氨基酸取代而不同。
[0098] 当在给定的氨基酸或多核苷酸序列编号的上下文中使用时,“对应于”、“关于”或“相对于”指当给定的氨基酸或多核苷酸序列与指定的参考序列相比时,参考序列的残基编号。换言之,给定的聚合物的残基数目或残基位置关于参考序列被指定,而不是通过给定的氨基酸或多核苷酸序列内的残基的实际的数字位置被指定。例如,给定的氨基酸序列,如工程化转氨酶的氨基酸序列,可以通过引入空位以优化两个序列之间的残基匹配,与参考序列比对。在这些情况中,虽然存在空位,给定的氨基酸或多核苷酸序列中残基的编号是关于与其比对的参考序列作出。
[0099] “氨基酸差异”或“残基差异”是指相对于参考序列中在相应位置上的氨基酸残基,在多肽序列的位置上的氨基酸残基中的变化。氨基酸差异的位置通常在本文中称为“Xn”,其中n是指残基差异基于其的参考序列中的相应位置。例如,“与SEQ ID NO:4相比在位置X14上的残基差异”是指相应于SEQ ID NO:4的位置14的多肽位置上的氨基酸残基的变化。
因此,如果SEQ ID NO:4的参考多肽在位置14上具有酪氨酸,那么“与SEQ ID NO:4相比在位置X14上的残基差异”,在相应于SEQ ID NO:4的位置14的多肽位置上的酪氨酸以外的任何
残基的氨基酸置换。在本文大多数情况下,位置上的特定氨基酸残基差异表示为“XnY”,其中“Xn”指定如上所述的相应位置,且“Y”是工程化多肽中发现的氨基酸的单字母标识符(即,与参考多肽相比的不同残基)。在一些实施方案中,当多于一个氨基酸可出现在特定残基位置中时,备选的氨基酸可以形式XnY/Z列出,其中Y和Z表示替代的氨基酸残基。在一些情况下(例如,在表2A和2B中),本公开内容还提供了由常规表示法“AnB”表示的特定氨基酸差异,其中A是参考序列中残基的单字母标识符,“n”是参考序列中的残基位置的数目,且B是工程化多肽的序列中的残基置换的单字母标识符。此外,在一些情况下,本公开内容的多肽相对于参考序列可包括一个或更多个氨基酸残基差异,这由相对于参考序列做出变化的
一列特定位置指示。
[0100] “保守氨基酸置换”指用具有相似侧链的不同残基置换残基,并且因此,通常涉及用在相同或相似定义类别的氨基酸内的氨基酸置换多肽中的氨基酸。通过示例的方式而非限制,具有脂族侧链的氨基酸可被另一个脂族氨基酸置换,例如,丙氨酸、缬氨酸、亮氨酸和异亮氨酸;具有羟基侧链的氨基酸被具有羟基侧链的另一个氨基酸置换,例如,丝氨酸和苏氨酸;具有芳香族侧链的氨基酸被具有芳香族侧链的另一个氨基酸置换,例如,苯丙氨酸、酪氨酸、色氨酸和组氨酸;具有碱性侧链的氨基酸被具有碱性侧链的另一个氨基酸置换,例如,赖氨酸和精氨酸;具有酸性侧链的氨基酸被具有酸性侧链的另一个氨基酸置换,例如,天冬氨酸或谷氨酸;且疏水性氨基酸或亲水性氨基酸分别被另一个疏水性氨基酸或亲水性
氨基酸置换。示例性保守置换被提供在下面的表1中。
[0101] 表1
[0102]
[0103]
[0104] “非保守置换”是指用具有显著差异侧链性质的氨基酸置换多肽中的氨基酸。非保守置换可以利用限定组之间,而不是它们之内的氨基酸,并影响(a)置换的区域中肽骨架的结构(例如,脯氨酸置换甘氨酸)(b)电荷或疏水性,或(c)侧链的体积。通过示例的方式而非限制,示例性的非保守置换可以是酸性氨基酸被碱性或脂族氨基酸置换;芳香族氨基酸被小氨基酸置换;以及亲水性氨基酸被疏水性氨基酸置换。
[0105] “缺失”是指通过从参考多肽去除一个或多个氨基酸而对多肽进行的修饰。缺失可以包括除去1个或多个氨基酸、2个或更多个氨基酸、5个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸、或20个或更多个氨基酸、多至组成参考酶的氨基酸总数的10%、或多至氨基酸总数的20%,同时保留酶活性和/或保留工程化转氨酶的改进特性。缺失可以涉及多肽的内部和/或端部。在各个实施方案中,缺失可以包括连续的区段或可以是不连续的。
[0106] “插入”是指通过向参考多肽添加一个或多个氨基酸而对多肽进行的修饰。在一些实施方案中,改进的工程化转氨酶类包括一个或多个氨基酸插入天然存在的转氨酶多肽,以及一个或多个氨基酸插入其它改进的转氨酶多肽。插入可以是在多肽的内部或到羧基或
氨基末端。如本文所用的插入包括如本领域已知的融合蛋白。插入可以是氨基酸的连续区
段或由参考多肽中的一个或更多个氨基酸分隔。
[0107] 如本文所用的“片段”是指如下多肽:所述多肽具有氨基端和/或羧基端缺失,但剩余的氨基酸序列与该序列中相应位置相同。片段可以是至少14个氨基酸长、至少20个氨基酸长、至少50个氨基酸长或更长,以及多至全长转氨酶多肽,例如SEQ ID NO:2的多肽或SEQ ID NO:34的工程化转氨酶的70%、80%、90%、95%、98%和99%。
[0108] “分离的多肽”是指如下多肽:所述多肽与其天然伴随的其它污染物,例如,蛋白、脂质和多核苷酸基本上分离。术语包括已从它们天然存在环境或表达系统(例如,宿主细胞或体外合成)中除去或纯化的多肽。改进的转氨酶类可以存在于细胞内,存在于细胞培养基中,或以各种形式制备,诸如溶解产物或分离的制剂。因此,在一些实施方案中,改进的转氨酶类可以是分离的多肽。
[0109] “基本上纯的多肽”是指如下组合物,在所述组合物中多肽物质是存在的优势物质(即,在摩尔基础或重量基础上,它比在该组合物中的任何其它个体大分子物质更丰富),并且当目标物质构成存在的大分子物质的按摩尔或%重量计至少约50%时,一般是基本上纯化的组合物。一般而言,基本上纯的转氨酶组合物将构成该组合物中存在的所有大分子物
质的按摩尔或%重量计约60%或更多、约70%或更多、约80%或更多、约90%或更多、约
95%或更多以及约98%或更多。在一些实施方案中,将目标物质纯化至基本的均一性(即,通过常规检测方法不能在组合物中检测出污染物质),其中组合物基本上由单一大分子物
质组成。溶剂物质、小分子(<500道尔顿)、以及元素离子物质不被认为是大分子物质。在一些实施方案中,分离的改进的转氨酶多肽是基本上纯的多肽组合物。
[0110] “立体选择性”是指在化学反应或酶促反应中一种立体异构体比另一种立体异构体优先形成。立体选择性可以是部分的,其中一种立体异构体的形成优于另一种立体异构
体的形成,或立体选择性可以是完全的,其中只形成一种立体异构体。当立体异构体是对映体时,立体选择性被称为对映体选择性,即一种对映体在两种对映体的总和中的分数(通常被报告为百分比)。它在本领域通常可选择地被报告为(通常为百分比)对映体过量(e.e.),其根据以下式计算[主要对映体-次要对映体]/[主要对映体+次要对映体]。当立体异构体
是非对映异构体时,立体选择性被称为非对映选择性,即一种非对映体在两种非对映体的
混合物中的分数(通常被报告为百分比),通常可选择地报告为非对映体过量(d.e.)。对映
体过量和非对映体过量是立体异构体过量的类型。
[0111] “高立体选择性”是指能够将底物例如化合物(2)转化为其对应的具有至少约85%立体异构体过量的手性胺产物例如化合物(1)的化学或酶促反应。
[0112] “改进的酶特性”是指相比于参考转氨酶表现出任何酶特性的改进的转氨酶多肽。对于本文描述的工程转化氨酶多肽,通常对野生型转氨酶进行比较,虽然在一些实施方案
中,参考转氨酶可以是另一工程化转氨酶。期望改进的酶特性包括,但不限于,酶活性(其可以底物的转化百分比的方式被表示)、热稳定性、溶剂稳定性、pH活性特征、辅因子需求、对抑制剂的耐受性(例如,底物或产物抑制)、和立体选择性(包括对映体选择性)。
[0113] “增加的酶活性”是指工程化转氨酶多肽的改进特性,其可被表示为与参考转氨酶相比,增加的比活性(例如,产生的产物/时间/重量蛋白),或底物至产物的增加的转化率百分比(例如,在指定的时间段使用指定量的转氨酶,起始量的底物至产物的转化率百分比)。确定酶活性的示例性方法被提供于实施例中。可影响与酶活性相关的任何特性,包括经典
的酶特性Km、Vmax或kcat,它们的改变能够导致增加的酶活性。酶活性的改进可以是从相应的野生型转氨酶的酶活性的约1.2倍,到相比于天然存在的转氨酶或从其衍生转氨酶多肽的
另一种工程化转氨酶的多达2倍、5倍、10倍、20倍、25倍、50倍、75倍、100倍或更大的酶活性。
转氨酶活性可通过标准测定中的任何一个来测量,诸如通过监测反应物或产物的分光光度
法性质中的变化。在一些实施方案中,产生的产物的量可以通过高效液相色谱法(HPLC)分
离结合诸如o-酞二醛(OPA)衍生化后的UV吸光度或荧光检测来测量。使用确定的酶制剂、在设定条件下的确定的测定(defined assay)、和一种或更多种确定的底物进行酶活性的比
较,如本文进一步详细地描述的。通常,当比较溶解产物时,细胞的数目和测定的蛋白的量被确定,并使用相同的表达系统和相同的宿主细胞以将由宿主细胞产生的和溶解产物中存
在的酶的量的变化最小化。
[0114] “转化率”是指底物至相应的产物的酶促转化率。“转化率百分比”是指在指定条件下一段时间内被转化为产物的底物的百分比。因此,转氨酶多肽的“酶活性”或“活性”可表示为底物至产物的“转化率百分比”。
[0115] “热稳定的”是指与野生型酶相比,转氨酶多肽在暴露于高温(例如,40℃-80℃)持续一段时间(例如,0.5-24小时)之后维持相似活性(例如,大于60%至80%)。
[0116] “溶剂稳定的”指与野生型酶相比,转氨酶多肽在暴露于不同浓度(例如5-99%)的溶剂(乙醇、异丙醇、二甲基亚砜(DMSO)、四氢呋喃、2-甲基四氢呋喃、丙酮、甲苯、乙酸丁酯、甲基叔丁基醚等)持续一段时间(例如0.5-24小时)之后维持相似的活性(多于例如60%至80%)。
[0117] “热且溶剂稳定的”指热稳定的且溶剂稳定的转氨酶多肽。
[0118] 本文使用的“严格杂交”指核酸杂交体在其下稳定的条件。如本领域技术人员已知,杂交体的稳定性通过杂交体的熔化温度(Tm)反映。大体上,杂交体的稳定性是离子强
度、温度、G/C含量和离液剂存在的函数。使用预测熔化温度的已知的方法可以计算多核苷酸的Tm值(参见例如Baldino等人,Methods Enzymology 168:761-777;Bolton等人,1962,Proc.Natl.Acad.Sci.USA 48:1390;Bresslauer等人,1986,Proc.Natl.Acad.Sci USA 83:
8893-8897;Freier等人,1986,Proc.Natl.Acad.Sci USA 83:9373-9377;Kierzek等人,
Biochemistry 25:7840-7846;Rychlik等人,1990,Nucleic Acids Res 18:6409-6412(勘误,1991,Nucleic Acids Res 19:698);Sambrook等人,上文);Suggs等人,1981,于
Developmental Biology Using Purified Genes(Brown等人,编),683-693页,Academic Press;和Wetmur,1991,Crit Rev Biochem Mol Biol 26:227-259.所有出版物通过引用并入本文)。在一些实施方式中,多核苷酸编码本文公开的多肽并且在定义的条件下,诸如适度地严格的或高度严格的条件下与编码本公开内容的工程化转氨酶的序列的互补序列杂
交。
[0119] “杂交严格性”涉及核酸杂交中的杂交条件,诸如洗涤条件。通常,杂交反应在较低严格性的条件下进行,随后是不同的但较高严格性的洗涤。术语“中度地严格杂交”指允许靶-DNA结合以下互补的核酸的条件,所述互补的核酸具有与靶DNA约60%的同一性、优选地约75%的同一性、约85%的同一性,与靶-多核苷酸的大于约90%的同一性。示例性中度严格的条件是等同于以下的条件:在50%甲酰胺、5×Denhart溶液、5×SSPE、0.2%SDS中在42℃杂交,随后在0.2×SSPE、0.2%SDS中在42℃洗涤。“高度严格的杂交”通常指以下的条件:偏离对于定义的多核苷酸序列在溶液条件下确定的热熔化温度Tm约10℃或更少。在一些实
施方式中,高度严格的条件指以下的条件,其仅允许在0.018M NaCl在65℃形成稳定的杂交体的那些核酸序列的杂交(即,如果杂交体在0.018M NaCl在65℃是不稳定的,其将在高度
严格的条件下是不稳定的,如本文所考虑)。可以例如通过以下提供高度严格条件:在与
50%甲酰胺、5×Denhart溶液、5×SSPE、0.2%SDS在42℃等同的条件杂交,随后在0.1×
SSPE和0.1%SDS在65℃洗涤。另一高度严格的条件是在与以下等同的条件中杂交:在包含
0.1%(w:v)SDS的5X SSC中在65℃杂交并在包含0.1%SDS的0.1x SSC中在65℃洗涤。其他
高度严格的杂交条件,以及中度地严格的条件是以上引用的文献中描述的。
[0120] “异源的”多核苷酸指通过实验技术被引入宿主细胞的任何多核苷酸,且包括从宿主细胞取出,接受实验处理并然后再引入宿主细胞的多核苷酸。
[0121] “密码子优化”指编码蛋白的多核苷酸的密码子变化为具体的生物体中优先使用的那些,以使编码的蛋白在受关注的生物体中被有效地表达。尽管遗传密码是简并的,即大多数氨基酸由称为“同义的(synonyms)”或“同义(synonymous)”密码子的几个密码子表示,但熟知的是:具体的生物体的密码子使用是非随机的并且偏向特定的密码子三联体。对于
给定的基因、共同功能或遗传起源的基因、高度表达的蛋白对低拷贝数(low copy number)蛋白、和生物体基因组的聚集蛋白编码区、这一密码子使用偏好可以更高。在一些实施方案中,编码转氨酶的多核苷酸可以为表达选择的宿主生物体的最佳生产而进行密码子优化。
[0122] “优选地、最佳的、高度密码子使用偏好密码子”互换地指以下的密码子,其以比编码相同的氨基酸的其它密码子更高的频率在蛋白编码区中被使用。优选的密码子可以根据单个基因、共同功能或起源的一组基因、高度表达的基因中的密码子使用、整个生物体的聚集蛋白编码区中的密码子频率、相关的生物体的聚集蛋白编码区中的密码子频率、或其组
合确定。频率随着基因表达水平增加的密码子通常是用于表达的最佳密码子。已知多种方
法用于确定特定的生物体中的密码子频率(例如密码子使用、相对的同义密码子的使用)和
密码子偏好,包括多变量分析,例如,使用聚类分析或对应分析,和基因中使用的密码子的有效数目(参见GCG CodonPreference,Genetics Computer Group Wisconsin Package;
CodonW,John Peden,University of Nottingham;McInerney,J.O,1998,Bioinformatics 
14:372-73;Stenico等人,1994,Nucleic Acids Res.222437-46;Wright,F.,1990,Gene 
87:23-29)。对于增长的生物体列表密码子使用表是可获得的(参见,例如,Wada等人,1992,Nucleic Acids Res.20:2111-2118;Nakamura 等人,2000,Nucl.Acids Res.28:292;
Duret,等人,如上述;Henaut和Danchin,“Escherichia coli and Salmonella,”1996,Neidhardt,等人编,ASM Press,Washington D.C.,2047-2066页。用于获得密码子使用的数据来源可以依赖于能够编码蛋白的任何可获得的核苷酸序列。这些数据集合包括实际上已
知编码表达的蛋白(例如完整的蛋白编码序列-CDS)、表达的序列标签(ESTS)、或预测的基
因组序列的编码区的核酸序列(参见,例如,Mount,D.,Bioinformatics:Sequence and 
Genome Analysis,第8章,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,2001;Uberbacher,E.C.,1996,Methods Enzymol.266:259-281;Tiwari等,1997,Comput.Appl.Biosci.13:263-270)。
[0123] “控制序列”在本文被定义为包括对于本公开内容的多核苷酸和/或多肽的表达是必需的或有利的所有组分。对于编码多肽的核酸序列,每个控制序列可以是天然的或外来
的。这些控制序列包括但不限于:前导序列(leader)、多腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。控制序列至少包括启动子、和转录和翻译终止信号。控制序列可以与连接子一起被提供,以用于引入促进控制序列与编码多肽的核酸序列的编码区域的连
接的特定的限制位点。
[0124] “可操作地连接”在本文被定义为以下的构型,其中控制序列被适当地置于(即,处于功能性关系)与受关注的多核苷酸有关的位置以使控制序列指导或调节受关注的多核苷酸和/或多肽的表达。
[0125] “启动子序列”指被宿主细胞识别用于受关注的多核苷酸诸如编码序列的表达的核酸序列。启动子序列包含转录控制序列,其介导受关注的多核苷酸的表达。启动子可以是在选择的宿主细胞中显示转录活性的任何核酸序列,其包括突变体、截短的和杂合启动子,并且可以获自编码对于宿主细胞同源的或异源的细胞外或细胞内多肽的基因。
[0126] “适当的反应条件”是指在生物催化反应溶液中的那些条件(例如,酶载量、底物载量、辅因子载量、温度、pH、缓冲液、共溶剂等的范围),在上述条件下本公开内容的转氨酶多肽能够将底物化合物转化为产物化合物(例如,将化合物(2)转化为化合物(1))。示例性的“适当的反应条件”被提供在详细说明中,并通过实施例说明。
[0127] “载量”,诸如在“化合物载量”或“酶载量”或“辅因子载量”中是指在反应开始时反应混合物中组分的浓度或量。
[0128] 在生物催化剂介导的方法的上下文中的“底物”是指由生物催化剂作用的化合物或分子。例如,在本文中所公开的方法中的转氨酶生物催化剂的示例性底物是化合物(2)。
[0129] 在生物催化剂介导的方法的上下文中的“产物”是指由生物催化剂的作用产生的化合物或分子。例如,在本文中所公开的方法中的转氨酶生物催化剂的示例性产物是化合
物(1)。
[0130] “烷基(alkyl)”是指1个至18个(含)碳原子,直链的或支链的,更优选地1个至8个(含)碳原子,且最优选地1个至6个(含)碳原子的饱和基。具有指定数目的碳原子的烷基被表示在括号中,例如,(C1-C6)烷基是指1个至6个碳原子的烷基。低级烷基是指(C1-C6)烷基。
[0131] “烯基”是指包含至少一个双键,但任选地包含多于一个双键的2个至12个(含)碳原子的直链或支链的基团。
[0132] “炔基”是指含有至少一个三键,但任选地含有多于一个三键,并且另外任选地含有一个或多个双键部分的2个至12个(含)碳原子的直链或支链的基团。
[0133] “杂烷基”、“杂烯基”和“杂炔基”是指其中一个或更多个碳原子各自独立地被相同或不同的杂原子或杂原子基团代替的如本文所定义的烷基、烯基和炔基。可代替碳原子的杂原子和/或杂原子基团包括,但不限于,-O-、-S-、-S-O-、-NRγ-、-PH-、-S(O)-、-S(O)2-、-S(O)NRγ-、-S(O)2NRγ-以及类似的,包括其组合,其中每一Rγ独立地选自氢、烷基、杂烷基、环烷基、杂环基、芳基、杂芳基、以及其他适当的取代基。
[0134] “芳基”是指具有单环(例如,苯基)或多个稠环(例如,萘基或蒽基)的6个至12个(含)碳原子的不饱和芳香族碳环基团。示例性芳基包括苯基、吡啶基、萘基以及类似的。
[0135] “芳基烷基”是指被芳基取代的烷基,即芳基-烷基-基团,优选地具有在烷基部分的1个至6个(含)碳原子和在芳基部分的6个至12个(含)碳原子。此类芳基烷基基团由苯甲基、苯乙基以及类似的举例说明。
[0136] “芳基烯基”是指被芳基取代的烯基,即,芳基-烯基-基团,优选地具有在烯基部分的2个至6个(含)碳原子和在芳基部分的6个至12个(含)碳原子。
[0137] “芳基炔基”是指被芳基取代的炔基,即,芳基-炔基-基团,优选具有在炔基部分的2个至6个碳原子(含)和在芳基部分的6个至12个(含)碳原子。
[0138] “环烷基”是指具有可任选地被1个至3个烷基基团取代的单环或多个稠环的3个至12个(含)碳原子的环状烷基基团。示例性的环烷基基团包括,但不限于,单环结构诸如环丙基、环丁基、环戊基、环辛基、1-甲基环丙基、2-甲基环戊基、2-甲基环辛基以及类似的,或多环结构,包括桥环系统,诸如金刚烷基以及类似的。
[0139] “环烷基烷基”是指被环烷基取代的烷基,即,环烷基-烷基-基团,优选具有在烷基部分中的1个至6个(含)碳原子和在环烷基部分中的3个至12个(含)碳原子。此类环烷基烷基基团由环丙基甲基、环己基乙基以及类似的举例说明。
[0140] “环烷基烯基”是指被环烷基取代的烯基,即,环烷基-烯基-基团,优选具有在烯基部分中的2个至6个(含)碳原子和在环烷基部分中的3个至12个(含)碳原子。
[0141] “环烷基炔基”是指被环烷基取代的炔基,即,环烷基-炔基-基团,优选具有在炔基部分中的2个至6个(含)碳原子和在环烷基部分中的3个至12个(含)碳原子。
[0142] “氨基”是指基团-NH2。取代的氨基是指基团-NHRη、NRηRη和NRηRηRη,其中各Rη独立地选自取代的或未被取代的烷基、环烷基、环杂烷基、烷氧基、芳基、杂芳基、杂芳基烷基、酰基、烷氧基羰基、硫烷基、亚磺酰基、磺酰基,以及类似的。典型的氨基基团包括但不限于二甲基氨基、二乙基氨基、三甲基铵、三乙基铵、甲基磺酰基氨基(methylysulfonylamino)、呋喃基-氧基-磺氨基以及类似的。
[0143] “烷基氨基”是指-NHRζ基团,其中Rζ是烷基、N-氧化物衍生物、或其保护的衍生物,例如,甲氨基、乙氨基、正丙氨基、异丙基氨基、正丁基氨基、异丁基氨基、叔丁基氨基、或甲氨基-N-氧化物以及类似的。
[0144] “芳基氨基”是指NHRλ,其中Rλ是芳基基团,其可任选地被取代。
[0145] “杂芳基氨基”是指NHRσ,其中Rσ是杂芳基基团,其可任选地被取代。
[0146] “氨基烷基”是指其中氢原子中的一个或更多个被氨基,包括取代的氨基,取代的烷基基团。
[0147] “氧代”是指=O。
[0148] “氧基”是指二价基团-O-,其可具有各种取代基以形成不同的氧基基团,包括醚和酯。
[0149] “烷氧基(alkoxy)”或“烷氧基(alkyloxy)”在本文可互换使用以指基团–ORζ,其中Rζ是烷基基团,包括任选取代的烷基基团,如本文还所定义的。
[0150] “芳氧基”是指–ORλ,其中Rλ是芳基基团,其可任选地被取代。
[0151] “杂芳基氧基”是指-ORσ,其中Rσ是杂芳基基团,其可任选地被取代。
[0152] “羧基”是指-COOH。
[0153] “羧基烷基”是指被羧基基团取代的烷基。
[0154] “羰基”是指-C(O)-,其可具有多种取代基以形成不同的羰基基团,包括酸、酰基卤、醛、酰胺、酯和酮。
[0155] “烷基羰基”是指-C(O)Rζ,其中Rζ是烷基基团,其可任选地被取代。
[0156] “芳基羰基”是指-C(O)Rλ,其中Rλ是芳基基团,其可任选地被取代。
[0157] “杂芳基羰基”是指-C(O)Rσ,其中Rσ是杂芳基基团,其可任选地被取代。
[0158] “烷氧基羰基”是指-C(O)ORζ,其中Rζ是烷基基团,其可任选地被取代。
[0159] “芳基氧基羰基”是指-C(O)ORλ,其中Rλ是芳基基团,其可任选地被取代。
[0160] “杂芳基氧基羰基”是指-C(O)ORσ,其中Rσ是杂芳基基团,其可任选地被取代。
[0161] “芳基烷氧基羰基”是指-C(O)ORρ,其中Rρ为芳基-烷基-基团,其可任选地被取代。
[0162] “烷基羰基氧基”是指–OC(O)-Rζ,其中R是烷基基团,其可任选地被取代。
[0163] “芳基羰基氧基”是指-OC(O)Rλ,其中R是芳基基团,其可任选地被取代。
[0164] “杂芳基烷氧基羰基”是指-C(O)ORω,其中Rω是杂芳基烷基基团,其可任选地被取代。
[0165] “杂芳基羰基氧基”是指-OC(O)Rσ,其中Rσ是杂芳基基团,其可任选地被取代。
[0166] “氨基羰基”是指-C(O)NH2。取代的氨基羰基是指-C(O)NRηRη,其中氨基NRηRη如本文所定义。
[0167] “氨基羰基烷基”是指被氨基羰基基团取代的烷基。
[0168] “卤素”或“卤代”是指氟、氯、溴和碘。
[0169] “卤代烷基”是指被一个或更多个卤素取代的烷基基团。如此,术语“卤代烷基”意指包括单卤代烷基、二卤代烷基、三卤代烷基等,直至全卤代烷基。例如,表述“(C1C2)卤代烷基”包括1-氟甲基、二氟甲基、三氟甲基、1-氟乙基、1,1-二氟乙基、1,2-二氟乙基、1,1,1三氟乙基、全氟乙基等。
[0170] “羟基”是指-OH。
[0171] “羟基烷基”是指被一个或更多个羟基基团取代的烷基。
[0172] “氰基”是指-CN。
[0173] “硝基”是指-NO2。
[0174] “硫代”或“硫烷基”是指-SH。取代的硫代或硫烷基是指-S-Rη,其中Rη是烷基、芳基或其他适当的取代基。
[0175] “烷基硫代”是指-SRζ,其中Rζ是烷基,其可任选地被取代。典型的烷基硫代基团包括,但不限于,甲基硫代、乙基硫代、正丙基硫代,以及类似的。
[0176] “芳基硫代”是指-SRλ,其中Rλ是芳基,其可任选地被取代。典型的芳基硫代基团包括,但不限于,苯基硫代、(4-甲基苯基)硫代、吡啶基硫代,以及类似的。
[0177] “杂芳基硫代”是指-SRσ,其中Rσ是杂芳基,其可任选地被取代。.
[0178] “磺酰基”是指-SO2-。取代的磺酰基是指-SO2-Rη,其中Rη是烷基、芳基或其他适合的取代基。
[0179] “烷基磺酰基”是指-SO2-Rζ,其中Rζ是烷基,其可任选地被取代。典型的烷基磺酰基基团包括,但不限于,甲基磺酰基、乙基磺酰基、正丙基磺酰基,以及类似的。
[0180] “芳基磺酰基”是指-SO2-Rλ,其中Rλ是芳基,其可任选地被取代。典型的芳基磺酰基基团包括,但不限于,苯基磺酰基、(4-甲基苯基)磺酰基、吡啶基磺酰基,以及类似的。
[0181] “杂芳基磺酰基”是指-SO2-Rσ,其中Rσ是杂芳基基团,其可任选地被取代。
[0182] “亚磺酰基”是指-SO-。.取代的亚磺酰基是指-SO-Rη,其中Rη是烷基、芳基或其他适合的取代基。
[0183] “烷基亚磺酰基”是指-SO-Rζ,其中Rζ是烷基,其可任选地被取代。典型的烷基亚磺酰基基团包括,但不限于,甲基亚磺酰基、乙基亚磺酰基、正丙基亚磺酰基,以及类似的。
[0184] “芳基亚磺酰基”是指-SO-Rλ,其中Rλ是芳基,其可任选地被取代。典型的芳基亚磺酰基基团包括,但不限于,苯基亚磺酰基、(4-甲基苯基)亚磺酰基、吡啶基亚磺酰基,以及类似的。
[0185] “杂芳基亚磺酰基”是指-SO-Rσ,其中Rσ是杂芳基基团,其可任选地被取代。
[0186] “烷基氨基磺酰基烷基”是指被烷基-NH-SO2-基团取代的烷基。
[0187] “芳基磺酰基烷基”是指被芳基-SO2-基团取代的烷基。
[0188] “杂芳基磺酰基烷基”是指被杂芳基-SO2-基团取代的烷基。
[0189] “氨基磺酰基”是指-SO2NH2。取代的氨基磺酰基是指-SO2NRδRδ,其中氨基基团-NRηRη如本文所定义。
[0190] “杂芳基”是指1个至10个(含)碳原子和在环内的选自氧、氮和硫的1个至4个(含)杂原子的芳族杂环基团。此类杂芳基基团可具有单个环(例如,吡啶基或呋喃基)或多个稠
环(例如,吲哚嗪基或苯并噻吩基)。
[0191] “杂芳基烷基”是指被杂芳基取代的烷基,即,杂芳基-烷基-基团,优选具有在烷基部分中的1个至6个(含)碳原子和在杂芳基部分中的5个至12个(含)环原子。此类杂芳基烷基基团由吡啶基甲基以及类似的举例说明。
[0192] “杂芳基烯基”是指被杂芳基取代的烯基,即,杂芳基-烯基-基团,优选具有在烯基部分中的2个至6个(含)碳原子和在杂芳基部分中的5个至12个(含)环原子。
[0193] “杂芳基炔基”是指被杂芳基取代的炔基,即,杂芳基-炔基-基团,优选具有在炔基部分中的2个至6个(含)碳原子和在杂芳基部分中的5个至12个(含)环原子。
[0194] “杂环”、“杂环的”和可互换的“杂环烃基”是指具有单环或多个稠环,2个至10个(含)碳环原子和在环内的选自氮、硫或氧的1个至4个(含)杂环原子的饱和或不饱和的基团。此类杂环基团可具有单环(例如,哌啶基或四氢呋喃基)或多个稠环(例如,吲哚啉基、二氢苯并呋喃或奎宁环基)。杂环的实例包括,但不限于,呋喃、噻吩、噻唑、噁唑、吡咯、咪唑、吡唑、吡啶、吡嗪、嘧啶、哒嗪、吲嗪、异吲哚、吲哚、吲唑、嘌呤、喹嗪、异喹啉、喹啉、酞嗪、萘基吡啶、喹噁啉、喹唑啉、噌啉、蝶啶、咔唑、咔啉、菲啶、吖啶、菲咯啉、异噻唑、吩嗪、异噁唑、吩噁嗪、吩噻嗪、咪唑烷、咪唑啉、哌啶、哌嗪、吡咯烷、二氢吲哚以及类似的。
[0195] “杂环烷基烷基”是指被杂环烷基取代的烷基,即,杂环烷基-烷基-基团,优选具有在烷基部分中的1个至6个(含)碳原子和在杂环烷基部分中的3个至12个(含)环原子。
[0196] “杂环烷基烯基”是指被杂环烷基取代的烯基,即,杂环烷基-烯基-基团,优选具有在烯基部分中的2个至6个(含)碳原子和在杂环烷基部分中的3个至12个(含)环原子。
[0197] “杂环烷基炔基”是指被杂环烷基取代的炔基,即,杂环烷基-炔基-基团,优选具有在炔基部分中的2个至6个(含)碳原子和在杂环烷基部分中的3个至12个(含)环原子。
[0198] “元环”意指包括任何环状结构。术语“元”之前的数字表示构成该环的骨架原子的数目。因此,例如,环己基、吡啶、吡喃和噻喃是6元环而环戊基、吡咯、呋喃和噻吩是5元环。
[0199] “离去基团”通常是指在化学反应中能够被另一个原子或部分替换的任何原子或部分。更具体地,离去基团是指容易被亲核体(例如,胺、硫醇、醇或氰化物)替换和取代的原子或部分。此类离去基团是众所周知的,且包括羧酸盐、N-羟基琥珀酰亚胺(“NHS”)、N-羟基苯并三唑、卤素(氟、氯、溴或碘)和烷氧基基团。离去基团的非限制性特征和实例可见于例如Organic Chemistry,第2版,Francis Carey(1992),328-331页;Introduction to 
Organic Chemistry,第2版,Andrew Streitwieser and Clayton Heathcock(1981),169-
171页;以及Organic Chemistry,第5版,John McMurry,Brooks/Cole Publishing(2000),
398和408页;所有这些都通过引用并入本文。
[0200] 除非另有说明,否则在上述基团中由氢占据的位置可被取代基进一步取代,所述取代基的示例为,但不限于,羟基、氧代、硝基、甲氧基、乙氧基、烷氧基、取代的烷氧基、三氟甲氧基、卤代烷氧基、氟、氯、溴、碘、卤代、甲基、乙基、丙基、丁基、烷基、烯基、炔基、取代的烷基、三氟甲基、卤代烷基、羟烷基、烷氧基烷基、硫代、烷基硫代、酰基、羧基、烷氧基羰基、甲酰氨基、取代的甲酰氨基、烷基磺酰基、烷基亚磺酰基、烷基磺酰基氨基、磺酰氨基、取代的磺酰氨基、氰基、氨基、取代的氨基、烷基氨基、二烷基氨基、氨基烷基、酰氨基、脒基、氨基肟基(amidoximo)、羟基草氨酰基(hydroxamoyl)、苯基、芳基、取代的芳基、芳氧基、芳基烷基、芳基烯基、芳基炔基、吡啶基、咪唑基、杂芳基、取代的杂芳基、杂芳基氧基、杂芳基烷基、杂芳基烯基、杂芳基炔基、环丙基、环丁基、环戊基、环己基、环烷基、环烯基、环烷基烷基、取代的环烷基、环烷氧基、吡咯烷基、哌啶基、吗啉代、杂环、(杂环)氧基和(杂环)烷基;且优选的杂原子是氧、氮和硫。应理解,当这些取代基上存在开放化合价时,它们可被烷基、环烷基、芳基、杂芳基和/或杂环基团进一步取代,当碳上存在这些开放化合价时,它们可被卤素和被氧键合取代基、氮键合取代基或硫键合取代基进一步取代,并且当多个这样的开放化
合价存在时,这些基团可通过直接形成键或通过与新的杂原子,优选氧、氮或硫,形成键而被结合以形成环。还应理解,可以进行上述取代,只要用取代基取代氢不向本公开内容的分子引入不可接受的不稳定性,并且在其他方面是化学上合理的。
[0201] “任选的”或“任选地”是指随后描述的事件或情况可以发生或可以不发生,并且该描述包括其中所述事件或情况发生的情形和其中所述事件或情况不发生的情形。本领域普通技术人员将理解,对于描述为含有一个或更多个任选的取代基的任何分子,仅意在包括
立体上实际的和/或合成上可行的化合物。“任选地取代的”是指在化学基团的术语或系列中的所有其后的修饰词。例如,在术语“任选地取代的芳基烷基”中,分子的“烷基”部分和“芳基”部分可以被取代或可以不被取代,并且对于系列“任选地取代的烷基、环烷基、芳基和杂芳基”,该烷基、环烷基、芳基和杂芳基基团,独立于其他,可以被取代或可以不被取代。
[0202] “保护基团”是指当连接到分子中的反应性官能团时掩蔽、减少或阻止该官能团的反应性的原子团。通常,保护基团可在合成过程中根据需要被选择性地除去。保护基团的实例可见于Wuts和Greene“,Greene’s Protective Groups in Organic Synthesis,”第4版,Wiley Interscience(2006),以及Harrison等人,Compendium of Synthetic Organic Methods,第1-8卷,1971-1996,John Wiley&Sons,NY。可以具有保护基团的官能团包括但不
限于,羟基、氨基和羧基。代表性的氨基保护基团包括但不限于,甲酰基、乙酰基、三氟乙酰基、苄基、苄氧羰基(“CBZ”)、叔丁氧羰基(“Boc”)、三甲基甲烷基(“TMS”)、2-三甲基甲硅烷基-乙烷磺酰基(“SES”)、三苯甲基和取代的三苯甲基、烯丙氧基羰基、9-芴基甲基氧基羰基(“FMOC”)、硝基-藜芦氧基羰基(“NVOC”)以及类似的。
[0203] 如本文所用的“多元醇”是指包含多个羟基基团的化合物。关于聚合物,多元醇包括具有羟基官能团的聚合物。示例性聚合多元醇包括,通过举例的方式并非限制,聚醚和聚酯,例如,聚乙二醇、聚丙二醇、聚(四亚甲基)二醇和聚四氢呋喃。
[0204] 5.3工程化转氨酶多肽
[0205] 本公开内容提供了具有转氨酶活性的工程化多肽、编码多肽的多核苷酸、以及使用该多肽的方法。当上文描述涉及多肽时,应理解,其还描述了编码该多肽的多核苷酸。
[0206] 氨基转移酶,还称为转氨酶,催化氨基从氨基供体底物的伯胺向氨基受体分子的羰基(例如,酮基或醛基)转移。氨基转移酶已被从各种生物体,诸如反硝化产碱菌
(Alcaligenes  denitrificans)、支气管败血性博德特氏菌(Bordetella 
bronchiseptica)、副百日咳博德特氏菌(Bordetella parapertussis)、马他布鲁氏菌
(Brucella melitensis)、鼻疽伯克霍尔德氏菌(Burkholderia malle)、类鼻疽伯克霍尔德氏菌(Burkholderia pseudomallei)、青紫色素杆菌(Chromobacterium violaceum)、
Oceanicola granulosus HTCC2516、海洋杆菌(Oceanobacter sp.)RED65、海洋螺菌
(Oceanospirillum sp.)MED92、恶臭假单胞菌(Pseudomonas putida)、青枯雷尔氏菌
(Ralstonia solanacearum)、苜蓿根瘤菌(Rhizobium meliloti)、根瘤菌(Rhizobium sp.)菌株NGR234、河流弧菌(Vibrio fluvialis)、苏金杆菌(Bacillus thuringensis)和炎克雷伯氏菌(Klebsiella  pneumoniae)中鉴定(Shin等人 ,2001 ,
Biosci.Biotechnol.Biochem.65:1782-1788)。
[0207] 转氨酶通过利用转氨酶以立体特异性方式进行反应的能力而有用于外消旋胺的手性拆分,即一种对映体优先转化为相应的酮,由此产生富含另一种对映体的混合物(参
见,例如,Koselewski等人,2009,Org.Lett.11(21):4810-2)。转氨酶在酮向相应的胺转化中的立体选择性,还使这些酶在由相应的酮化合物不对称合成光学纯的胺中是有用的(参
见,例如, 等人,Biocatalytic Routes to Optically Active Amines,”
Chem.Cat.Chem.1(1):42-51;Zua和Hua,2009,Biotechnol J.4(10):1420-31)。
[0208] 来自河流弧菌的ω-转氨酶.(ω-VfT)表现出对于手性胺的(S)-对映体的高对映选择性并且具有对于手性芳香胺的独特的底物特异性(Shin和Kim,2001,J.Org.Chem.67:
2848-2853)。ω-VfT的高对映选择性已被应用于胺的手性拆分(H.Yun,等人,2004,
Biotechnol.Bioeng.87:772–778;Shin和Kim,1997,Biotechnol.Bioeng.55:348–358;M.等人,2008,Adv.Synth.Catal.350:802–807)。该酶还已被用于使用前手性酮底物
不对称合成光学纯胺。然而,不对称合成中的限制不利于逆反应的平衡(Shin和Kim,1999,
Biotechnol.Bioeng.65,206–211);通过胺产物抑制ω-VfT酶(Shin等人,2001,Biotechnol Bioeng 73:179–187;Yun和Kim,2008,Biosci.Biotechnol.Biochem.72(11):3030-3033);
对具有大侧链的氨基受体,诸如芳族基团的低活性(Shin和Kim,2002,J.Org.Chem.67:
2848-2853);以及低的酶稳定性(上述Yun和Kim)。
[0209] 具有对脂族酮的增加的抗性的源自河流弧菌的转氨酶的工程化转氨酶描述于Yun等人,2005,Appl Environ Micriobiol.71(8):4220–4224)中,而具有变宽的氨基供体底物特异性的ω-VfT描述于Cho等人,2008,Biotechnol Bioeng.99(2):275-84中。通过引用并
入本文的专利出版物WO2010081053和US20100209981描述了具有对温度和/或有机溶剂
增加的稳定性、并且结构上朝向不同氨基受体分子的酶活性的工程化ω-VfT。通过引用并
入本文的专利出版物WO2011159910描述了对以对映体过量将底物3’-对羟基苯乙酮转化为
产物(S)-3-(1-氨基乙基)-苯酚而优化的工程化ω-VfT。
[0210] 本公开内容涉及源自河流弧菌(V.fluvialis)的工程化转氨酶多肽,其有效地介导吲哚上的烷基羰基烷基或羰基烷基基团转化为相应的胺。显著地,本公开内容鉴定了转
氨酶多肽中增加酶活性、对映体选择性、稳定性和对产物抑制的耐受性的氨基酸残基位置
及相应突变。在一些实施方案中,工程化转氨酶能够在适当的反应条件下在氨基供体的存
在下将底物化合物(2),1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-酮,有效地转化为产物化合物
(1),(S)-1-(1H-5-6-氯-吲哚-3-基)丙-2-胺,其中以化合物(1b),(R)-1-(1H-5-6-氯-吲
哚-3-基)丙-2-胺的对映体过量产生了(S)-1-(1H-5-6-氯-吲哚-3-基)丙-2-胺(如方案1中
所示)。
[0211] 方案1
[0212]
[0213] 在一些实施方案中,多肽是与SEQ ID NO:2的野生型河流弧菌多肽、或另一种工程化多肽,例如SEQ ID NO:4相比的用于改进的特性而工程化的非天然存在的转氨酶。适于将
1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-酮有效地转化为(S)-1-(1H-5-氟-6-氯-吲哚-3-基)
丙-2-胺的这些工程化转氨酶多肽,具有与SEQ ID NO:2的氨基酸序列或参考工程化转氨酶
多肽,诸如SEQ ID NO:4的参考多肽相比的一个或更多个残基差异。残基差异与包括以下的酶特性的增强相关:酶活性、酶稳定性、和对产物胺抑制的抗性。
[0214] 在一些实施方案中,工程化转氨酶多肽显示用与野生型或参考工程化酶相比的相同量的酶在限定的时间内以对映体过量在将底物1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-酮转
化为产物(S)-1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺产物中的增强的活性。在一些实施方
案中,工程化转氨酶多肽在适当的反应条件下具有与由SEQ ID NO:4呈现的多肽相比的至
少约1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍、20倍、30倍、40倍、或50倍或更多倍的活性。
[0215] 在一些实施方案中,与野生型或参考工程化酶相比,工程化转氨酶多肽具有对转化反应中使用的温度和/或溶剂的增加的稳定性。在一些实施方案中,工程化转氨酶多肽在适当的反应条件下具有与SEQ ID NO:4的多肽相比的至少约1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍或更多倍的稳定性。
[0216] 在一些实施方案中,与野生型或参考工程化酶相比,工程化转氨酶多肽具有对产物胺(S)-1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺抑制的增强的耐受性或抗性。在一些实施
方案中,与由SEQ ID NO:4呈现的多肽相比,工程化转氨酶多肽在适当的反应条件下具有对
1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺,特别是(S)-1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺
抑制的至少约1.2倍、1.5倍、2倍、3倍、4倍、5倍、或更多倍的增强的抗性,如以下进一步描述的。
[0217] 在一些实施方案中,工程化转氨酶多肽能够在适当的反应条件下以相比于(R)-1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺大于90%、91%、92%、93%、94%、95%、96%、97%、
98%、99%、99.5或更大的对映体过量将底物1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-酮转化为(S)-1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺。
[0218] 在一些实施方案中,工程化转氨酶多肽能够在适当的反应条件下以相对于SEQ ID NO:4的参考多肽对底物存在的增加的耐受性将底物化合物(2)转化为化合物(1)。因此,在
一些实施方案中,工程化转氨酶多肽能够在适当的反应条件下在约72h或更短、约48h或更
短、约36h或更短、或约24h更短的反应时间内,以至少约至少约50%、至少约60%、至少约
70%、至少约80%、至少约90%、至少约95%、至少约98%、或至少约99%的转化率百分比在以下的底物载量浓度下将底物化合物(2)转化为产物化合物(1):至少约1g/L、约5g/L、约
10g/L、约20g/L、约30g/L、约40g/L、约50g/L、约70g/L、约100g/L、约125g/L、约150g/L、约
175g/L或约200g/L或更多。
[0219] 工程化多肽的以上描述的改进特性在其下进行转化的适当的反应条件可关于多肽、底物、辅因子、缓冲液、共溶剂的浓度或量、pH和/或包括温度及反应时间的条件来确定,如在以下和实施例中进一步描述的。
[0220] 与其改进特性相关的示例性工程化多肽包括与SEQ ID NO:2相比在以下残基位置上的一个或更多个残基差异:X9;X14;X18;X21;X26;X31;X33;X41;X45;X47;X57;X70;X86;
X88;X107;X113;X132;X133;X146;X147;X148;X153;X163;X168;X173;X177;X203;X211;
X233T;X235;X244;X250;X284;X294;X314;X315;X318;X323;X324;X324;X346;X383;X391;
X395;X398;X400;X417;X419;X420;X423;X424;X427;X448;和X451。与改进特性相关的这些位置的每一个上的特定氨基酸差异包括:X9T;X14V;X18A;X21H;X26R;X31M;X31S;X33T;
X41L;X45H;X47N;X57F;X57Y;X70A;X86D;X86Y;X88A;X88L;X107P;X113L;X113V;X132F;
X133R;X146L;X147K;X148Q;X148R;X153S;X163F;X163I;X163L;X163R;X163V;X168K;
X168S;X173A;X177L;X203S;X211K;X233T;X235P;X244T;X250A;X284A;X294V;X314N;
X315G;X318D;X323T;X324G;X324H;X346L;X383V;X391A;X395P;X398L;X398V;X398W;
X400G;X417M;X419S;X420N;X423I;X424V;X424A;X427Y;X448E;和X451D。
[0221] 与由SEQ ID NO:4呈现的工程化转氨酶相比,该残基差异包括以下残基位置上的那些:X14;X26;X31;X33;X41;X47;X57;X70;X86;X88;X107;X113;X132;X148;X163;X168;
X173;X203;X250;X284;X314;X315;X324;X346;X395;X398;X400;X417;X419;X420;X423;
X424;X448;和X451。在这些位置上的特定氨基酸差异包括:X14V;X26R;X31S;X33T;X41L;
X47N;X57F;X57Y;X70A;X86D;X88A;X88L;X107P;X113L;X113V;X132F;X148Q;X148R;X163I;
X163L;X163R;X163V;X168K;X168S;X173A;X203S;X250A;X284A;X314N;X315G;X324H;
X346L;X395P;X398L;X398V;X398W;X400G;X417M;X419S;X420N;X423I;X424V;X448E;和X451D。虽然与SEQ ID NO:4相比,残基差异还发生在残基位置X153和X383上,但这些差异表现对SEQ ID NO:2的野生型序列上存在的氨基酸残基的回复,表明在残基位置X153上氨基
酸S与V之间和在残基位置X383上氨基酸A与V之间的互变现象对工程化酶特性没有显著有
害效应。
[0222] 本公开内容的示例性非天然存在(或工程化)转氨酶多肽的结构与功能信息示于以下表2A和2B中。奇数序列标识符(即,“SEQ ID NO”)是指编码由偶数的SEQ ID NO提供的氨基酸序列的核苷酸序列,并且该序列被提供在伴随该公开内容的电子序列表文件中,该
序列表文件在此通过引用并入本文。氨基酸残基差异是基于与SEQ ID NO:4的参考序列比
较,SEQ ID NO:4的参考多肽序列为相对于SEQ ID NO:2具有以下24个氨基酸残基差异的源
自野生型ω-VfT多肽的工程化转氨酶:A9T;G18A;D21H;V31M;N45H;F86Y;A133R;R146L;
W147K;V153S;K163F;V177L;R211K;P233T;A235P;P244T;M294V;P318D;A323T;S324G;
A383V;T391A;C424A;和F427Y。各工程化多肽相对于SEQ ID NO:4的参考多肽的活性,在设定的时间段和温度内,在被用作初级筛选的高通量(HTP)测定中作为将酮底物1-(1H-5-氟-
6-氯-吲哚-3-基)丙-2-酮向产物胺化合物(S)-1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺的转
化确定。表2A中的HTP测定值,使用大肠杆菌(E.coli)澄清细胞溶解产物以~200μL体积/孔的96孔板格式,根据如表和实施例中标注的测定反应条件来确定。在某些情况下,使用摇瓶粉(SFP)和/或下游处理(DSP)粉测定作为次级筛选以评估工程化转氨酶的特性,其的结果
提供于表2B中。SFP和DSP形式提供工程化多肽的更纯的粉制品。例如,SFP制品中的工程化转氨酶是总蛋白的约30%,而DSP制品可包含总蛋白的约80%的工程化转氨酶。
[0223] 活性水平(即,“+”“++”,等)被如下定义:“+”指示对于工程化转氨酶多肽SEQ ID NO:6至14,与SEQ ID NO:4的活性相比的1.2倍或更大的活性,并且对于工程化转氨酶多肽SEQ ID NO:16至154,与SEQ ID NO:8的活性相比的1.2倍或更大的活性。“++”的活性水平指示对于工程化转氨酶多肽SEQ ID NO:6-14,与SEQ ID NO:4的活性相比的5倍或更大的活
性,并且对于工程化转氨酶多肽SEQ ID NO:16至154,与SEQ ID NO:8的活性相比的5倍或更大的活性。对产物抑制的耐受性数据(即,产物耐受性)通过以下来获得:在测定中包括产物(S)-1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺的以下量,以及与在相同条件下参考酶的量的
活性比较:14g/L用于分析SEQ ID NO.6至14的工程化转氨酶多肽,且16g/L用于分析SEQ ID NO.16至154的工程化转氨酶多肽。稳定性的评价通过比较两个不同温度55℃和50℃下的活
性来做出。
[0224] 表2A:使用HTP制品的工程化多肽和相对酶改进
[0225]
[0226]
[0227]
[0228]
[0229]
[0230]
[0231]
[0232]
[0233]
[0234]
[0235]
[0236]
[0237]
[0238]
[0239] 表2B:使用摇瓶和DSP制品的工程化多肽和相对酶改进
[0240]
[0241]
[0242] 从示例性多肽的检查,酶特性中的改进与相比于SEQ ID NO:4在以下残基位置上的残基差异相关:X14;X26;X31;X33;X41;X47;X57;X70;X86;X88;X107;X113;X132;X148;
X163;X168;X173;X203;X250;X284;X314;X315;X324;X346;X395;X398;X400;X417;X419;
X420;X423;X424;X448;和X451。与改进的特性相关的这些位置的每一个上的具体残基差异包括:X14V;X26R;X31S;X33T;X41L;X47N;X57F;X57Y;X70A;X86D;X88A;X88L;X107P;X113L;
X113V;X132F;X148Q;X148R;X163I;X163L;X163R;X163V;X168K;X168S;X173A;X203S;
X250A;X284A;X314N;X315G;X324H;X346L;X395P;X398L;X398V;X398W;X400G;X417M;
X419S;X420N;X423I;X424V;X448E;和X451D。
[0243] 与相比于SEQ ID NO:4在以上残基位置上的残基差异相关的特定酶特性包括,酶活性、稳定性、和产品耐受性,以及其他。酶活性中的改进与以下残基位置上的残基差异相关:X14;X26;X31;X33;X41;X57;X70;X86;X88;X163;X168;X284;X314;X417;X419;X420;和X424。酶稳定性中的改进与以下残基位置上的残基差异相关:X14;X26;X31;X33;X41;X57;
X70;X86;X88;X163;X168;X284;X314;X324;X417;X419;X420;X423;和X424。对产物抑制的耐受性(即,产物耐受性)中的改进与以下残基位置上的残基差异相关:X26;X70;X86;X88;
X113;X132;X163;X168;X314;X315;X395;X398;X417;和X419。如本领域技术人员将理解的,在前述残基位置上的残基差异对酶对映体选择性没有显著有害效应,维持对于化合物(1)
大于90%ee,并且通常导致等于或大于99%ee的对映体选择性。因此,前述残基位置上的残基残基,可以单独或以各种组合用于产生具有期望的改进的特性的工程化转氨酶多肽,期
望的改进的特性包括酶活性、立体选择性、稳定性、底物耐受性、和对产物抑制的耐受性,以及其他。
[0244] 根据本文提供的指导,进一步设想,以下的示例性工程化多肽的任何一种:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、96、98、102、104、106、108、110、
114、116、122、124、126、128、130、132、136、138、140、142、144、146、148、150、152、和154可用作用于合成其他工程化转氨酶多肽的起始氨基酸序列,例如,通过添加来自表2A和2B中的
其他多肽以及本文描述的其他残基位置的各种氨基酸差异的新组合通过随后几轮进化。进
一步的改进可通过包括在贯穿前几轮的进化中已被保持为不变的残基位置上的氨基酸差
异而产生。
[0245] 因此,在一些实施方案中,具有转氨酶活性的工程化多肽能够以与SEQ ID NO:4相比的改进的特性将底物化合物(2),1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-酮转化为产物化合
物(1),(S)-1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺,包括具有与参考序列SEQ ID NO:2至少
80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、
99%或更多序列同一性以及与SEQ ID NO:4相比在选自以下的残基位置上的一个或更多个
残基差异的氨基酸序列:X14;X26;X31;X33;X41;X47;X57;X70;X86;X88;X107;X132;X148;
X163;X168;X173;X203;X250;X284;X314;X315;X324;X346;X395;X398;X400;X417;X419;
X423;X448;和X451,其中在残基位置X31;X57;X86;X163;X168;X314;X324;X398;和X417上的残基差异选自:X31S;X57Y;X86D;X163I;X163L;X163R;X163V;X168S;X314N;X324H;
X398L;X398V;X398W;和X417M。
[0246] 在一些实施方案中,具有与SEQ ID NO:4相比改进的特性的工程化转氨酶多肽包括具有与参考序列SEQ ID NO:4至少80%、85%、86%、87%、88%、89%、90%、91%、92%、
93%、94%、95%、96%、97%、98%、99%或更多序列同一性以及与SEQ ID NO:4相比在选自以下的残基位置上的一个或更多个残基差异的氨基酸序列:X14;X26;X31;X33;X41;X47;
X57;X70;X86;X88;X107;X132;X148;X163;X168;X173;X203;X250;X284;X314;X315;X324;
X346;X395;X398;X400;X417;X419;X423;X448;和X451,其中在残基位置X31;X57;X86;
X163;X168;X314;X324;X398;和X417上的残基差异选自:X31S;X57Y;X86D;X163I;X163L;
X163R;X163V;X168S;X314N;X324H;X398L;X398V;X398W;和X417M。在一些实施方案中,工程化转氨酶多肽能够以本文描述的改进的对映体选择性,例如,≥90%ee将底物化合物(2)转化为产物化合物(1)。
[0247] 在一些实施方案中,具有与SEQ ID NO:4相比改进的特性的转氨酶活性的工程化多肽包括具有与选自以下的参考序列至少80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%或更多同一性的氨基酸序列:SEQ ID NO:4、
6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、
58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、
106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、
144、146、148、150、152、和154,以及与SEQ ID NO:4相比的选自以下的残基位置上的一个或更多个残基差异:X14;X26;X31;X33;X41;X47;X57;X70;X86;X88;X107;X132;X148;X163;
X168;X173;X203;X250;X284;X314;X315;X324;X346;X395;X398;X400;X417;X419;X423;
X448;和X451,其中在残基位置X31;X57;X86;X163;X168;X314;X324;X398;和X417上的残基差异选自:X31S;X57Y;X86D;X163I;X163L;X163R;X163V;X168S;X314N;X324H;X398L;
X398V;X398W;和X417M。在一些实施方案中,参考序列选自SEQ ID NO:4、8、14、16、132、134、和146。在一些实施方案中,参考序列是SEQ ID NO:4。在一些实施方案中,参考序列是SEQ ID NO:8。在一些实施方案中,参考序列是SEQ ID NO:134。在一些实施方案中,参考序列是SEQ ID NO:146。
[0248] 在一些实施方案中,具有转氨酶活性的工程化多肽具有包括选自以下的序列的氨基酸序列:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、
44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、
94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、
134、136、138、140、142、144、146、148、150、152、和154,并且具有与SEQ ID NO:4相比的选自以下的残基位置上的一个或更多个残基差异:X14;X26;X31;X33;X41;X47;X57;X70;X86;
X88;X107;X132;X148;X163;X168;X173;X203;X250;X284;X314;X315;X324;X346;X395;
X398;X400;X417;X419;X423;X448;和X451,其中在残基位置X31;X57;X86;X163;X168;
X314;X324;X398;和X417上的残基差异选自:X31S;X57Y;X86D;X163I;X163L;X163R;X163V;
X168S;X314N;X324H;X398L;X398V;X398W;和X417M。在一些实施方案中,氨基酸序列选自SEQ ID NO:4、8、14、16、132、134、和146。在一些实施方案中,氨基酸序列是SEQ ID NO:4。在一些实施方案中,氨基酸序列是SEQID NO:8。在一些实施方案中,氨基酸序列是SEQ ID NO:
134。在一些实施方案中,氨基酸序列是SEQ ID NO:146。
[0249] 在一些实施方案中,在残基位置X14;X26;X33;X41;X47;X70;X88;X107;X132;X148;X173;X203;X250;X284;X315;X346;X395;X400;X419;X423;X448;和X451上的残基差异选自X14V;X26R;X33T;X41L;X47N;X70A;X88A;X88L;X107P;X132F;X148Q;X148R;X173A;
X203S;X250A;X284A;X315G;X346L;X395P;X400G;X419S;X423I;X448E;和X451D。
[0250] 因此,在一些实施方案中,展示一种或更多种本文描述的改进特性的工程化转氨酶多肽可包括具有与参考序列的氨基酸序列同一性,如以上描述的,以及与SEQ ID NO:4相比选自以下的一个或更多个残基差异的氨基酸序列:X14V;X26R;X31S;X33T;X41L;X47N;
X57Y;X70A;X86D;X88A;X88L;X107P;X132F;X148Q;X148R;X163I;X163L;X163R;X163V;
X168S;X173A;X203S;X250A;X284A;X314N;X315G;X324H;X346L;X395P;X398L;X398V;
X398W;X400G;X417M;X419S;X423I;X448E;和X451D。
[0251] 在一些实施方案中,以上具有与SEQ ID NO:4相比在残基位置X14;X26;X31;X33;X41;X47;X57;X70;X86;X88;X107;X132;X148;X163;X168;X173;X203;X250;X284;X314;
X315;X324;X346;X395;X398;X400;X417;X419;X423;X448;和X451上的一个或更多个残基差异的工程化转氨酶多肽还可包括与SEQ ID NO:4相比选自以下的一个或更多个残基差
异:X57F;X113L;X113V;X168K;X420N;和X424V。
[0252] 在一些实施方案中,工程化转氨酶具有包括与SEQ ID NO:4相比选自以下的至少一个或更多个残基差异的氨基酸序列:X86D;X284A;和X400G。在一些实施方案中,残基差异包括至少X86D。在一些实施方案中,残基差异包括至少X400G。
[0253] 在一些实施方案中,工程化转氨酶具有包括与SEQ ID NO:4相比选自以下的至少一个或更多个残基差异的氨基酸序列:X14V;X26R;X31S;X163I/L/R/V;X315G;和X398L/V/W。在一些实施方案中,残基差异包括至少X14V。在一些实施方案中,残基差异包括至少
X163I/L/R/V。在一些实施方案中,残基差异包括至少X398L/V/W。
[0254] 在一些实施方案中,工程化转氨酶多肽包括具有与SEQ ID NO:4相比选自以下的残基差异的至少一个组合的氨基酸序列:X14V和X163I/L/V/H/R;X86D和X400G;X57F/Y和
X163I/L/R/V;X57F/Y和X398L/V/W;X14V、X113L/V、X163I/L/R/V、X284A、和X424V;和X31S、X57F/Y、X163I/L/V/H/R、X315G、X346L、和X398V/L/W。
[0255] 在一些实施方案中,工程化转氨酶多肽包括具有与SEQ ID NO:4相比选自以下的残基差异的至少一个组合的氨基酸序列:X14V、X113L、X163L、X284A、和X424V;X14V、X26R、X163L、X284A、和X400G;X14V、X26R、X88L、和X113L;X57F、X163L、X168K、X314N、X315G、X346L、和X398V;X14V、X163L、X173A、X400G、和X420N;X14V、X113L、X163L、和X284A;X14V、X26R、X163L、X284A、和X400G;和X14V、X33T、X57F、X113L、和X163L。
[0256] 如本领域技术人员将理解的,在一些实施方案中,被选择的以上残基差异的一个或组合在工程化转氨酶中作为核心序列(或特征)可以是保守的,并且在其他残基位置上的
另外的残基差异掺入进该核心序列以产生具有改进特性的另外的工程化转氨酶多肽。因
此,应理解,对于包含以上残基差异的一个或子集的任何工程化转氨酶,本公开内容涵盖包括残基差异的一个或子集、以及在本文公开的其他残基位置上的另外的一个或更多个残基
差异的其他工程化转氨酶。通过示例的方式而非限制,包含残基位置X163上的残基差异的
工程化转氨酶,还可在以下其他残基位置上掺入一个或更多个残基差异:例如X14;X26;
X31;X33;X41;X47;X57;X70;X86;X88;X107;X132;X148;X168;X173;X203;X250;X284;X314;
X315;X324;X346;X395;X398;X400;X417;X419;X423;X448;和X451。另一个实例是包含残基位置X14上的残基差异的工程化转氨酶,其还可在以下其他残基位置上包含一个或更多个
残基差异:例如X26;X31;X33;X41;X47;X57;X70;X86;X88;X107;X132;X148;X163;X168;
X173;X203;X250;X284;X314;X315;X324;X346;X395;X398;X400;X417;X419;X423;X448;和X451。对于每个前述实施方案,工程化转氨酶还可包括选自以下的另外的残基差异:X57F;
X113L;X113V;X168K;X420N;和X424V。
[0257] 在一些实施方案中,工程化转氨酶多肽能够以相对于SEQ ID NO:4的参考多肽的活性的至少1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍、20倍、30倍、40倍、50倍或更多的活性将底物化合物(2)转化为产物化合物(1)。在一些实施方案中,能够以相对于SEQ ID NO:4的参考多肽的活性的至少1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍、20倍、30倍、40倍、50倍或更多的活性将底物化合物(2)转化为产物化合物(1)的工程化转氨酶多肽包括具有与SEQ ID 
NO:4相比选自以下的一个或更多个残基差异的氨基酸序列:X14V、X26R;X31S;X33T;X41L;
X70A;X86D;X88A/L;X163I/L;X284A;和X419S。
[0258] 在一些实施方案中,能够以相对于SEQ ID NO:4的活性的至少1.2倍将底物化合物(2)转化为产物化合物(1)的工程化转氨酶多肽包括选自以下的氨基酸序列:SEQ ID NO:6、
8、10、12、14、16、22、24、28、30、32、48、52、56、62、64、66、68、86、88、90、92、98、100、104、106、
108、110、112、114、116、118、124、126、128、132、134、136、142、144、148、和154。
[0259] 在一些实施方案中,工程化转氨酶多肽能够以相对于SEQ ID NO:4的活性的至少5倍将底物化合物(2)转化为产物化合物(1),并且包括具有选自以下的一个或更多个残基差
异的氨基酸序列:X14V、X26R;X33T;X88A/L;X163I/L;和X284A。
[0260] 在一些实施方案中,能够以相对于SEQ ID NO:4的活性的至少5倍将底物化合物(2)转化为产物化合物(1)的工程化转氨酶多肽包括选自以下的氨基酸序列:SEQ ID NO:6、
8、10、14、16、22、24、28、30、32、48、52、56、62、64、86、88、90、92、98、100、104、106、108、110、
112、114、116、118、124、126、128、132、134、136、142、144、148、和154。
[0261] 如以上所提及,在一些实施方案中,与野生型或参考工程化酶(例如,SEQ ID NO;4)相比,工程化转氨酶多肽展示对产物胺(S)-1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺抑制
的增强的耐受性或抗性。对产物抑制的耐受性或抗性(即,产物耐受性)的改进的特性可通
过以下来测量:在产物化合物的存在下测量进化的酶的活性并比较其与在相同反应条件下
在产物化合物的存在下对照酶的活性。对产物抑制的耐受性可通过增加的酶活性的倍数来
评估。使用标准生物化学技术诸如HPLC分析,减去来自预添加的产物胺的背景,可进行测量酶活性。在一些实施方案中,在将化合物(2)转化为化合物(1)中,与由SEQ ID NO:4呈现的多肽相比,工程化转氨酶多肽具有对1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺,特别是(S)-1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺抑制的至少1.2倍、1.5倍、2倍、3倍、4倍、5倍、或更多倍的耐受性。通常,对产物化合物抑制的增加的耐受性或抗性可在HTP测定条件下在14g/L或
16g/L的化合物(1)的存在下来测量,如表2A和2B以及实施例中描述的。在一些实施方案中,具有对1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺抑制的至少1.2倍或更大的耐受性的工程化
转氨酶多肽包括具有与SEQ ID NO:4相比选自以下的一个或更多个残基差异的氨基酸序
列:X26R;X70A;X86D;X88A/L;X132F;X163L;X315G;X395P;X398L;和X419S。
[0262] 在一些实施方案中,具有对1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺,特别是(S)-1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺抑制的至少1.2倍或更大的耐受性的工程化转氨酶多
肽包括选自以下的氨基酸序列:SEQ ID NO:6、12、16、18、22、24、26、28、30、32、34、36、38、
40、42、46、48、52、54、56、58、60、62、74、76、98、122、124、130、132、134、138、140、144、146、和
152。
[0263] 在一些实施方案中,工程化转氨酶多肽具有对1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺,特别是(S)-1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺抑制的至少5倍或更大的耐受性,
并且包括具有与SEQ ID NO:4相比选自以下的一个或更多个残基差异的氨基酸序列:X26R;
X88L;和X163L。
[0264] 在一些实施方案中,具有对1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺,特别是(S)-1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺抑制的至少5倍或更大的耐受性的工程化转氨酶多肽
包括具有选自以下残基差异的至少一个组合的氨基酸序列:X14V、X113L、X163L、X284A、和X424V;X14V、X26R、X163L、X284A、和X400G;X14V、X26R、X88L、和X113L;X57F、X163L、X168K、X314N、X315G、X346L、和X398V;X14V、X163L、X173A、X400G、和X420N;X14V、X113L、X163L、和X284A;X14V、X26R、X163L、X284A、和X400G;和X14V、X33T、X57F、X113L、和X163L。
[0265] 在一些实施方案中,具有对1-(1H-5-氟-6-氯-吲哚-3-基)丙-2-胺抑制的至少5倍或更大的耐受性的工程化转氨酶多肽,与SEQ ID NO:4相比,包括选自以下的氨基酸序列:
SEQ ID NO:16、124、132、134、140、和146。
[0266] 在一些实施方案中,与SEQ ID NO:4的参考工程化转氨酶相比,工程化转氨酶多肽具有对转化反应中使用的温度和/或溶剂的增加的稳定性。在一些实施方案中,工程化转氨酶多肽具有在适当的反应条件下至少1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍或更多倍的稳定性,例如在HTP测定条件下55℃下的活性与50℃下的活性相比。在一些实施方案中,具有与SEQ ID NO:4的多肽相比的至少1.2倍增加的稳定性的工程化转氨酶多肽包括具有与SEQ 
ID NO:4相比选自以下的一个或更多个残基差异的氨基酸序列:X14V;X26R;X31S;X33T;
X41L;X70A;X86D;X88A/L;X163I/L/R/V;X284A;X324H;X419S;和X423I。
[0267] 在一些实施方案中,具有与SEQ ID NO:4的多肽相比的至少1.2倍增加的稳定性的工程化转氨酶多肽包括选自以下的氨基酸序列:SEQ ID NO:6、8、12、16、18、20、22、24、28、
30、32、34、36、38、40、42、44、46、48、50、52、56、60、62、64、66、68、70、72、74、76、78、80、82、
84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、
126、128、132、134、136、142、144、146、148、150、152、和154。
[0268] 在一些实施方案中,工程化转氨酶多肽能够在HTP测定条件、摇瓶测定条件、或DSP测定条件下,以约100g/L、约50g/L、或约25g/L的底物载量,在72h或更短、48h或更短、或24h或更短内将至少90%或更多、91%或更多、92%或更多、93%或更多、94%或更多、或95%或更多的化合物(2)转化为化合物(1)。在一些实施方案中,工程化转氨酶多肽能够在50℃下在HTP测定条件以约25g/L的底物载量在24或更短内将至少90%或更多的化合物(2)转化为
化合物(1)。在一些实施方案中,能够在50℃下在HTP测定条件以约25g/L的底物载量在24或更短内将至少90%或更多的化合物(2)转化为化合物(1)的工程化转氨酶多肽包括选自以
下的氨基酸序列:SEQ ID NO:124、132、134、140、144、和146。
[0269] 在一些实施方案中,具有转氨酶活性,特别是将底物化合物(2)转化为产物化合物(1)的工程化多肽具有包括选自以下序列的氨基酸序列:SEQ ID NO:6、8、10、12、14、16、18、
20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、
70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、
116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、和154。
[0270] 在一些实施方案中,具有转氨酶活性的工程化转氨酶包括具有与以下的序列之一至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、
98%、或99%同一性的氨基酸序列:SEQ ID NO:6、8、10、12、14、16、18、20、22、24、26、28、30、
32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、
82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、
124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、和154,并且与SEQ ID NO:4相比的氨基酸残基差异存在于以下的任何一个中:SEQ ID NO:6、8、10、12、14、16、
18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、
68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、
114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、
152、和154,如提供于表2A和2B中。
[0271] 除以上指定的残基位置之外,本文所公开的任何工程化转氨酶多肽还可包括相对于SEQ ID NO:2或4,在其他残基位置即,除以下残基位置外的残基位置的其他残基差异:
X9;X14;X18;X21;X26;X31;X33;X41;X45;X47;X57;X70;X86;X88;X107;X113;X132;X133;
X146;X147;X148;X153;X163;X168;X173;X177;X203;X211;X233;X235;X244;X250;X284;
X294;X314;X315;X318;X323;X324;X346;X383;X391;X395;X398;X400;X417;X419;X420;
X423;X424;X427;X448;和X451。在这些其他残基位置上的残基差异提供氨基酸序列的另外变体而没有不利地影响多肽进行转氨酶反应的,诸如以对映体过量将化合物(2)转化为化
合物(1)的能力。因此,在一些实施方案中,除了选自以下的工程化转氨酶多肽的任何一个的氨基酸残基差异之外:SEQ ID NO:6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、
38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、
88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、
128、130、132、134、136、138、140、142、144、146、148、150、152、和154,序列还可包括与SEQ ID NO:4相比在其他氨基酸残基位置上的1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、
1-9个、1-10个、1-11个、1-12个、1-14个、1-15个、1-16个、1-18个、1-20个、1-22个、1-24个、
1-26个、1-30个、1-35个、1-40个、1-45个、或1-50个残基差异。在一些实施方案中,与参考序列相比,氨基酸残基差异的数目可以是1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个、或50个残基位置。在这些其他位置上的残基差异可包括保守的变化或非保守的变化。在一些实施方案中,与SEQ ID NO:2的野生型转氨酶多肽或SEQ ID 
NO:4的工程化转氨酶多肽相比,残基差异可包括保守的取代和非保守的取代。
[0272] 相对于SEQ ID NO:2的野生型序列,在其他位置上的氨基酸残基差异以及这些差异对酶功能的效应对于其他工程化转氨酶多肽在专利出版物WO2010081053、
US20100209981、和WO2011159910;Yun等人,2005,Appl Environ Micriobiol.,71(8):
4220–4224);以及Cho等人,2008,Biotechnol Bioeng.99(2):275-84中描述,其全部通过引用并入本文。因此,在一些实施方案中,与SEQ ID NO:2或4的序列相比的一个或更多个氨基酸差异还可在选自以下的残基位置上被引入本公开内容的工程化转氨酶多肽:X4;X6;X12;
X18;X30;X44;X56;X81;X82;X85;X95;X112;X122;X127;X130;X157;X164;X166;X167;X174;
X181;X208;X228;X253;X256;X272;X285;X286;X293;X297;X302;X311;X312;X316;X317;
X319;X320;X321;X332;X385;X407;X408;X409;X415;X418;X431;X434;X438;X444;和X446。
特别是,在前述位置上的氨基酸残基可选自以下:X4R/Q/L;X6R/I/N;X12A/G/K;X18A/V/L/I;X30A;X44A;X56V;X81D;X82H;X85A/S/V/T/N/C/G;X95T;X112I;X122E;X127L;X130G/M/A/V/L/I;X157T;X164N/Q/S/T/G/M/A/V/L/I;X166S;X167K/R;X174E/D;X181R;X208I;X228G/T;X253M;X256A;X272A;X285H;X286N/Q/S/T;X293N/Q/S/T;X297A;X302K;X311V;X312D/E;
X316K/H/P;X317L/M/Y;X319Q/G/M/N/V;X320A/K;X321L/M/I;X332N/Q/S/T;X385R;X407S;
X408A;X409G;X415M/L;X418V/N/Q/S/T;X431D;X434V;X438L;X444V;和X446V。对这些残基位置上的氨基酸残基的选择以及其对期望的酶特性的效应的教导可参见引用的文献。
[0273] 在一些实施方案中,本公开内容还提供了包括本文描述的任何工程化多肽的片段的工程化转氨酶多肽,该片段保留了该工程化转氨酶的功能活性和/或改进特性。因此,在一些实施方案中,本公开内容提供了具有转氨酶活性,诸如在适当的反应条件下将化合物
(2)转化为化合物(1)的多肽片段,其中该片段包括本公开内容的工程化转氨酶多肽的全长
氨基酸序列的至少约80%、90%、95%、96%、97%、98%、或99%,工程化转氨酶多肽诸如选自以下的示例性工程化转氨酶多肽:6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、
38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、
88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、
128、130、132、134、136、138、140、142、144、146、148、150、152、和154。
[0274] 在一些实施方案中,工程化转氨酶多肽可具有包括本文描述的工程化转氨酶多肽中的任一个的缺失的氨基酸序列,诸如以下的示例性工程化多肽:SEQ ID NO:6、8、10、12、
14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、
64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、
110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、
148、150、152、和154。因此,对于本公开内容的工程化转氨酶多肽的每个和每一个实施方案,氨基酸序列可包括转氨酶多肽的一个或更多个氨基酸、2个或更多个氨基酸、3个或更多个氨基酸、4个或更多个氨基酸、5个或更多个氨基酸、6个或更多个氨基酸、8个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸、或20个或更多个氨基酸、多至氨基酸的总数的10%、多至氨基酸的总数的10%、多至氨基酸的总数的20%、或多至氨基酸的总数的
30%的缺失,其中保留了本文描述的工程化转氨酶的相关功能活性和/或改进特性。在一些实施方案中,缺失可包括1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、
1-15个、1-20个、1-21个、1-22个、1-23个、1-24个、1-25个、1-30个、1-35个、1-40个、1-45个、或1-50个氨基酸残基。在一些实施方案中,缺失的数目可以是1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、
23个、24个、25个、30个、30个、35个、40个、45个、或50个氨基酸残基。在一些实施方案中,缺失可以包括1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、
16个、18个、20个、21个、22个、23个、24个、或25个氨基酸残基的缺失。
[0275] 在一些实施方案中,本文的工程化转氨酶多肽可具有与本文描述的工程化转氨酶多肽中的任何一个相比包括插入的氨基酸序列,工程化转氨酶多肽诸如以下的示例性工程
化多肽:SEQ ID NO:6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、
46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、
96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、
134、136、138、140、142、144、146、148、150、152、和154。因此,对于本公开内容的转氨酶多肽的每个和每一个实施方案,插入可包括一个或更多个氨基酸、2个或更多个氨基酸、3个或更多个氨基酸、4个或更多个氨基酸、5个或更多个氨基酸、6个或更多个氨基酸、8个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸、20个或更多个氨基酸、30个或更多个氨基酸、40个或更多个氨基酸、或50个或更多个氨基酸,其中保留了本文描述的工程化转氨酶的相关功能活性和/或改进特性。插入可以是在转氨酶多肽的氨基末端或羧基末端、或内部部分。
[0276] 在一些实施方案中,本文的工程化转氨酶多肽可具有包括选自以下序列的氨基酸序列:SEQ ID NO:6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、
48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、
98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、
136、138、140、142、144、146、148、150、152、和154,和任选地一个或数个(例如,多达3个、4个、5个或多达10个)氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列任选地具有1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-15个、1-20个、1-
21个、1-22个、1-23个、1-24个、1-25个、1-30个、1-35个、1-40个、1-45个、或1-50个氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列任选地具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个、或50个氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列任选地具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、18个、20个、21个、22个、23个、24个、或25个氨基酸残基缺失、插入和/或取代。在一些实施方案中,取代可以是保守的或非保守的取代。
[0277] 在一些实施方案中,本公开内容提供了具有转氨酶活性的工程化多肽,其多肽包括具有与选自以下序列的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、
94%、95%、96%、97%、98%、或99%同一性的氨基酸序列:SEQ ID NO:6、8、10、12、14、16、
18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、
68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、
114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、
152、和154,条件是,该氨基酸序列与公开于以下的示例性工程化转氨酶多肽氨基酸序列的任一种不同(也就是,该氨基酸序列不包括公开于以下的示例性工程化转氨酶多肽氨基酸
序列的任一种):专利申请出版物WO2010081053、US20100209981、和WO2011159910;Yun等人,2005,Appl Environ Micriobiol.,71(8):4220–4224);以及Cho等人,2008,Biotechnol Bioeng.99(2):275-84;其全部通过引用并入本文。
[0278] 在上述实施方案中,用于工程化多肽的适当的反应条件可以是表2A和2B中所描述的那些条件。因此,在一些实施方案中,适当的反应条件是HTP测定条件,该条件包括:10g/L(44.4mM)化合物(2);1mM吡哆醛-5-磷酸(PLP);2M异丙胺(IPM),pH 7;100mM三乙醇胺
(TEA),pH 7;5%v/v PEG 200;10μL的HTP溶解产物;以及50℃持续24h。
[0279] 在一些实施方案中,适当的反应条件是对摇瓶粉(SFP)测定描述的那些条件,该条件包括:25g/L、50或100g/L化合物(2);1mM吡哆醛-5-磷酸(PLP);2M异丙胺(IPM),pH 7;5%v/v PEG200;100mM三乙醇胺(TEA),pH 7;2g/L来自包含转氨酶的摇瓶制品的蛋白;以及50℃持续24h。
[0280] 在一些实施方案中,适当的反应条件是对下游处理粉(DSP)测定描述的那些条件,该条件包括:25g/L、50或100g/L化合物(2);1mM吡哆醛-5-磷酸(PLP);2M异丙胺(IPM),pH 
7;5%v/v PEG200;100mM三乙醇胺(TEA),pH 7;2g/L来自包含转氨酶的DSP制品的蛋白;以及50℃持续24h。
[0281] 这些前述反应条件和转氨酶多肽的使用的指导提供于表2A和2B及实施例以及其他中。
[0282] 在一些实施方案中,本公开内容的多肽可以是融合多肽的形式,其中工程化多肽与其他多肽融合,所述其他多肽诸如通过举例的方式而非限制,抗体标签(例如,myc表位)、纯化序列(例如,用于结合至金属的His标签)和细胞定位信号(例如,分泌信号)。因此,本文描述的工程化多肽可与其它多肽融合或不与其它多肽融合使用。
[0283] 应理解的是,本文描述的多肽不限于遗传编码的氨基酸。除了遗传编码的氨基酸以外,本文描述的多肽可完全或部分包括天然存在的和/或合成的非编码氨基酸。本文描述的多肽可包括的某些常见非编码氨基酸包括但不限于:遗传编码的氨基酸的D-立体异构
体;2,3-二氨基丙酸(Dpr);α-氨基异丁酸(Aib);ε-氨基己酸(Aha);δ-氨基戊酸(Ava);N-甲基甘氨酸或肌氨酸(MeGly或Sar);鸟氨酸(Orn);瓜氨酸(Cit);叔丁基丙氨酸(Bua);叔丁基甘氨酸(Bug);N-甲基异亮氨酸(MeIle);苯基甘氨酸(Phg);环己基丙氨酸(Cha);正亮氨酸(Nle);萘基丙氨酸(Nal);2-氯苯丙氨酸(Ocf);3-氯苯丙氨酸(Mcf);4-氯苯丙氨酸(Pcf);
2-氟苯丙氨酸(Off);3-氟苯丙氨酸(Mff);4-氟苯丙氨酸(Pff);2-溴苯丙氨酸(Obf);3-溴苯丙氨酸(Mbf);4-溴苯丙氨酸(Pbf);2-甲基苯丙氨酸(Omf);3-甲基苯丙氨酸(Mmf);4-甲基苯丙氨酸(Pmf);2-硝基苯丙氨酸(Onf);3-硝基苯丙氨酸(Mnf);4-硝基苯丙氨酸(Pnf);
2-氰基苯丙氨酸(Ocf);3-氰基苯丙氨酸(Mcf);4-氰基苯丙氨酸(Pcf);2-三氟甲基苯丙氨酸(Otf);3-三氟甲基苯丙氨酸(Mtf);4-三氟甲基苯丙氨酸(Ptf);4-氨基苯丙氨酸(Paf);
4-碘苯丙氨酸(Pif);4-氨甲基苯丙氨酸(Pamf);2,4-二氯苯丙氨酸(Opef);3,4-二氯苯丙氨酸(Mpcf);2,4-二氟苯丙氨酸(Opff);3,4-二氟苯丙氨酸(Mpff);吡啶-2-基丙氨酸
(2pAla);吡啶-3-基丙氨酸(3pAla);吡啶-4-基丙氨酸(4pAla);萘-1-基丙氨酸(1nAla);
萘-2-基丙氨酸(2nAla);噻唑基丙氨酸(taAla);苯并噻吩基丙氨酸(bAla);噻吩基丙氨酸(tAla);呋喃基丙氨酸(fAla);高苯丙氨酸(hPhe);高酪氨酸(hTyr);高色氨酸(hTrp);五氟苯丙氨酸(5ff);苯乙烯基丙氨酸(sAla);蒽基丙氨酸(aAla);3,3-二苯丙氨酸(Dfa);3-氨基-5-苯基戊酸(Afp);青霉胺(Pen);1,2,3,4-四氢异喹啉-3-羧酸(Tic);β-2-噻吩基丙氨酸(Thi);甲硫氨酸亚砜(Mso);N(w)-硝基精氨酸(nArg);高赖氨酸(hLys);膦酰基甲基苯丙氨酸(pmPhe);磷酸丝氨酸(pSer);磷酸苏氨酸(pThr);高天冬氨酸(hAsp);高谷氨酸
(hGlu);1-氨基环戊-(2或3)-烯-4羧酸;哌可酸(PA);氮杂环丁烷-3-羧酸(ACA);1-氨基环戊烷-3-羧酸;烯丙基甘氨酸(aOly);炔丙基甘氨酸(pgGly);高丙氨酸(hAla);正缬氨酸
(nVal);高亮氨酸(hLeu);高缬氨酸(hVal);高异亮氨酸(hIle);高精氨酸(hArg);N-乙酰赖氨酸(AcLys);2,4-二氨基丁酸(Dbu);2,3-二氨基丁酸(Dab);N-甲基缬氨酸(MeVal);高半胱氨酸(hCys);高丝氨酸(hSer);羟基脯氨酸(Hyp)和高脯氨酸(hPro)。本文描述的多肽可包括的另外的非编码氨基酸对本领域技术人员将是明显的(参见,例如,在Fasman,1989,
CRC Practical Handbook of Biochemistry and Molecular Biology,CRC Press,Boca 
Raton,FL,在第3-70页及其中引用的参考文献中提供的多种氨基酸,全部参考文献通过引
用并入本文)。这些氨基酸可以是以L-构型或D-构型。
[0284] 本领域技术人员将认识到,带有侧链保护基的氨基酸或残基也可以构成本文所描述的多肽。在这种情况下属于芳香族类别的这些受保护的氨基酸的非限制性实例包括(在
括号中列出的保护基)但不限于:Arg(tos)、Cys(甲苄基)、Cys(硝基吡啶次磺酰基)、Glu(δ-苄基酯)、Gln(呫吨基)、Asn(N-δ-呫吨基)、His(bom)、His(苄基)、His(tos)、Lys(fmoc)、Lys(tos)、Ser(O-苄基)、Thr(O-苄基)和Tyr(O-苄基)。
[0285] 本文所述的多肽可包括的构型上受限制的非编码氨基酸包括但不限于,N-甲基氨基酸(L-构型);1-氨基酸环戊-(2或3)-烯-4-羧酸;哌可酸;氮杂环丁烷-3-羧酸;高脯氨酸(hPro);以及1-氨基环戊烷-3-羧酸。
[0286] 在一些实施方案中,工程化转氨酶多肽可被提供在固体支持物上,诸如膜、树脂、固体载体(solid carrier)、或其他固相材料。固体支持物可以包括有机聚合物如聚苯乙烯、聚乙烯、聚丙烯、聚氟乙烯、聚乙烯氧和聚丙烯酰胺以及其共聚物和接枝物。固体支持物还可以是无机的,诸如玻璃、二氧化硅、可控孔度玻璃(CPG)、反相二氧化硅或金属诸如金或铂。固体支持物的结构可呈珠、球、粒子、颗粒、凝胶、膜或表面的形式。表面可以是平面的、基本上平面的或非平面的。固体支持物可以是多孔的或非多孔的,并且可以具有溶胀的或
非溶胀的性质。固体支持物可以被配置成孔、凹部或其它容器、器皿(vessel)、特征
(feature)或位置(location)的形式。
[0287] 在一些实施方案中,本公开内容的具有转氨酶活性的工程化多肽可被固定在固体支持物上,使得它们保留它们的相对于SEQ ID NO:4的参考多肽改进的活性、立体选择性、和/或其他改进特性。在这样的实施方案中,固定的多肽可促进式(II)的底物化合物或其他适当的底物生物催化转化为式(I)的产物化合物或相应的产物(例如,如本文描述的方案1
和2中所示的),并且在反应完全后很容易保留(例如,通过保留在其上固定多肽的珠),并且然后在后续反应中再利用或回收。这样的固定的酶的方法允许更高的效率和成本降低。因
此,进一步设想,使用本公开内容的工程化转氨酶多肽的方法中的任一种,可使用结合或固定在固体支持物上的相同的工程化转氨酶多肽来进行。
[0288] 酶固定的方法是本领域中熟知的。可非共价地或共价地结合工程化转氨酶多肽。用于缀合和固定酶至固体支持物(例如,树脂、膜、珠、玻璃等等)的各种方法是本领域熟知的并描述于例如:Yi等人,“Covalent immobilization ofω-transaminase from Vibrio fluvialis JS17on chitosan beads,”Process Biochemistry 42(5):895-898(May 
2007);Martin等人,“Characterization  of free and  immobilized(S)-
aminotransferase for acetophenone production,”Applied Microbiology and 
Biotechnology76(4):843-851(Sept.2007);Koszelewski等人,“Immobilization of ω-transaminases by encapsulation in a sol-gel/celite matrix,”Journal of 
Molecular Catalysis B:Enzymatic,63:39-44(Apr.2010);Truppo等人,“Development of an Improved Immobilized CAL-B for the Enzymatic Resolution of a Key 
Intermediate to Odanacatib,”Organic Process Research&Development,published 
online:dx.doi.org/10.1021/op200157c;Hermanson,G.T.,Bioconjugate Techniques,
Second Edition,Academic Press(2008);Mateo等人,“Epoxy sepabeads:a novel epoxy support for stabilization of industrial enzymes via very intense multipoint 
covalent attachment,”Biotechnology Progress 18(3):629-34(2002);以及
Bioconjugation Protocols:Strategies and Methods,In Methods in Molecular 
Biology,C.M.Niemeyer编著,Humana Press(2004);其每个的公开内容通过引用并入本文。
可用于固定本公开内容的工程化转氨酶的固体支持物包括但不限于,包括以下的珠或树
脂:具有环氧官能团的聚甲基丙烯酸酯、具有氨基环氧官能团的聚甲基丙烯酸酯、具有十八烷基官能团的苯乙烯/DVB共聚物或聚甲基丙烯酸酯。可用于固定本公开内容的工程化转氨
酶的示例性固体支持物包括但不限于,壳聚糖珠、Eupergit C和SEPABEAD(Mitsubishi),包括以下不同类型的SEPABEAD:EC-EP、EC-HFA/S、EXA252、EXE119和EXE120。
[0289] 在一些实施方案中,工程化多肽可以是各种形式,例如,诸如分离的制剂,作为基本上纯的酶、用编码酶的基因转化的整个细胞、和/或作为细胞提取物和/或此类细胞的溶解产物。酶可以冻干、喷雾干燥、沉淀、或为粗糊料的形式,如以下进一步讨论的。
[0290] 在一些实施方案中,本文描述的多肽可以试剂盒的形式被提供。试剂盒中的酶可以单独地存在或作为多种酶存在。试剂盒还可包括用于进行酶促反应的试剂、用于评估酶
活性的底物、以及用于检测产物的试剂。试剂盒还可包括试剂分配器和试剂盒的使用说明
书。
[0291] 在一些实施方案中,多肽可以以阵列的形式被提供在固体支持物上,其中多肽被布置在定位上不同的位置中。阵列可用于测试用于被多肽转化的各种底物化合物。多种支
持物可以配置在阵列上的不同的位置,这对于试剂的机器人递送或通过检测方法和/或仪
器是可寻址的。用于缀合基质,例如膜、珠、玻璃等等的各种方法描述于Hermanson,G.T.,Bioconjugate Techniques,第2版,Academic Press;(2008),以及Bioconjugation 
Protocols:Strategies and Methods,In Methods in Molecular Biology,C.M.Niemeyer
编著,Humana Press(2004),以及其他;这些的公开内容通过引用并入本文。
[0292] 在一些实施方案中,本公开内容的试剂盒包括以下的阵列,其包括在不同的可寻址的位置的本文公开的多种不同的工程化转氨酶多肽,其中不同的多肽是参考序列的不同
的变体,各自具有至少一种不同的改进的酶性质。包括多种工程化多肽的这样的阵列和它
们的使用方法被描述在例如WO2009008908中。
[0293] 5.4编码工程化多肽的多核苷酸、表达载体和宿主细胞
[0294] 在另一个方面,本公开内容提供编码本文描述的工程化转氨酶多肽的多核苷酸。多核苷酸可与控制基因表达的一个或更多个异源的调节序列可操作地连接,以产生能够表
达多肽的重组的多核苷酸。包含编码工程化转氨酶的异源的多核苷酸的表达构建体可被引
入适当的宿主细胞以表达相应的转氨酶多肽。
[0295] 如对本领域技术人员将是明显的,蛋白序列的可用性和相应于各种氨基酸的密码子的知识提供了对能够编码该主题多肽的所有多核苷酸的描述。遗传密码的简并性,其中
相同氨基酸由替代的或同义的密码子编码,允许极大数目的核酸被制出,所有这些核酸编
码改进的转氨酶。因此,具有具体的氨基酸序列的知识后,本领域技术人员能够以不改变蛋白的氨基酸序列的方式通过仅仅变更序列的一个或更多个密码子来制出任何许多的不同
核酸。在这点上,本公开内容明确涵盖可通过选择基于可能的密码子选择的组合制出的编
码本文描述的多肽的多核苷酸的每种和每一种可能的变体,并且所有这些变体将被认为针
对本文描述的任何多肽被明确地公开,所述本文描述的任何多肽包括在表2A和2B中呈现的
以及作为以下通过引用并入本文的序列表中公开的氨基酸序列:SEQ ID NO:6、8、10、12、
14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、
64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、
110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、
148、150、152、和154。
[0296] 在各种实施方案中,密码子被优选地选择以适合在其中产生蛋白的宿主细胞。例如,细菌中使用的优选的密码子被用于在细菌中表达;酵母中使用的优选的密码子被用于
酵母中的表达;并且哺乳动物中使用的优选的密码子被用于哺乳动物细胞中的表达。在一
些实施方案中,所有密码子不需要被替换以优化转氨酶的密码子使用,因为天然序列将包
括优选的密码子并且因为优选的密码子的使用对于所有氨基酸残基可能不是必需的。因
此,编码转氨酶的密码子优化的多核苷酸可以在全长编码区域的约40%、50%、60%、70%、
80%或大于90%的密码子位置包括优选的密码子。
[0297] 在一些实施方案中,如上所述,多核苷酸编码具有本文公开的特性,特别是与SEQ ID NO:4相比以改进特性将底物化合物(2)转化为产物化合物(1)的能力的转氨酶活性的工程化多肽,其中多肽包括与选自以下的参考序列具有至少80%、85%、86%、87%、88%、
89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性的氨基酸序列:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、
48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、
98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、
136、138、140、142、144、146、148、150、152、和154,以及与SEQ ID NO:4相比在选自以下的残基位置上的一个或更多个残基差异:X14;X26;X31;X33;X41;X47;X57;X70;X86;X88;X107;
X132;X148;X163;X168;X173;X203;X250;X284;X314;X315;X324;X346;X395;X398;X400;
X417;X419;X423;X448;和X451,其中在残基位置X31;X57;X86;X163;X168;X314;X324;
X398;和X417上的残基差异选自:X31S;X57Y;X86D;X163I;X163L;X163R;X163V;X168S;
X314N;X324H;X398L;X398V;X398W;和X417M。在一些实施方案中,参考序列选自SEQ ID NO:
4、8、14、16、132、134、和146。在一些实施方案中,参考序列是SEQ ID NO:4。在一些实施方案中,参考序列是SEQ ID NO:8。在一些实施方案中,参考序列是SEQ ID NO:134。在一些实施方案中,参考序列是SEQ ID NO:146。
[0298] 在一些实施方案中,多核苷酸编码具有本文公开的特性的转氨酶活性的工程化多肽,其中多肽包括与参考序列SEQ ID NO:2或4具有至少80%、85%、86%、87%、88%、89%、
90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性以及与SEQ ID NO:4相比在选自以下的残基位置上的一个或更多个残基差异的氨基酸序列:X14;X26;X31;
X33;X41;X47;X57;X70;X86;X88;X107;X132;X148;X163;X168;X173;X203;X250;X284;
X314;X315;X324;X346;X395;X398;X400;X417;X419;X423;X448;和X451,其中在残基位置X31;X57;X86;X163;X168;X314;X324;X398;和X417上的残基差异选自:X31S;X57Y;X86D;
X163I;X163L;X163R;X163V;X168S;X314N;X324H;X398L;X398V;X398W;和X417M。
[0299] 在一些实施方案中,多核苷酸编码具有转氨酶活性的工程化多肽,其中多肽包括与参考序列SEQ ID NO:2或4具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、
93%、94%、95%、96%、97%、98%、99%或更多序列同一性以及与SEQ ID NO:4相比在选自以下的残基差异的至少一个组合的氨基酸序列:X14V和X163I/L/R/V;X86D和X400G;X57F/Y和X163I/L/R/V;X57F/Y和X398L/V/W;X14V、X113L/V、X163I/L/R/V、X284A、和X424V;和X31S、X57F/Y、X163I/L/R/V、X315G、X346L、和X398L/V/W。在一些实施方案中,残基差异的组合选自:X14V、X113L、X163L、X284A、和X424V;X14V、X26R、X163L、X284A、和X400G;X14V、X26R、X88L、和X113L;X57F、X163L、X168K、X314N、X315G、X346L、和X398V;X14V、X163L、X173A、X400G、和X420N;X14V、X113L、X163L、和X284A;X14V、X26R、X163L、X284A、和X400G;和X14V、X33T、X57F、X113L、和X163L。
[0300] 在一些实施方案中,多核苷酸编码具有转氨酶活性的工程化多肽,其中多肽包括与选自以下的任何一个的参考多肽具有至少80%、85%、86%、87%、88%、89%、90%、
91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列:SEQ ID NO:4、
6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、
58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、
106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、
144、146、148、150、152、和154,条件是氨基酸序列包括与SEQ ID NO:4相比包含在以下的任何一个多肽序列中的残基差异的集合的任何一个:SEQ ID NO:6、8、10、12、14、16、18、20、
22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、
72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、
116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、和154,如列于表2A和2B中。
[0301] 在一些实施方案中,编码工程化转氨酶的多核苷酸包括选自以下的多核苷酸序列:SEQ ID NO:5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、
49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、
99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、
137、139、141、143、145、147、149、151、和153。
[0302] 在一些实施方案中,多核苷酸能够在高度严格条件下与选自以下的参考多核苷酸序列或其互补序列杂交:SEQ ID NO:5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、
37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、
87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、
129、131、133、135、137、139、141、143、145、147、149、151、和153,并且编码具有本文描述的一种或更多种改进特性的转氨酶活性的多肽。在一些实施方案中,能够在高度严格条件下
杂交的多核苷酸编码包括氨基酸序列的转氨酶多肽,所述氨基酸序列具有与SEQ ID NO:4
相比在选自以下的残基位置上的一个或更多个残基差异:X14;X26;X31;X33;X41;X47;X57;
X70;X86;X88;X107;X132;X148;X163;X168;X173;X203;X250;X284;X314;X315;X324;X346;
X395;X398;X400;X417;X419;X423;X448;和X451,其中在残基位置X31;X57;X86;X163;
X168;X314;X324;X398;和X417上的残基差异选自:X31S;X57Y;X86D;X163I;X163L;X163R;
X163V;X168S;X314N;X324H;X398L;X398V;X398W;和X417M。
[0303] 在一些实施方案中,多核苷酸编码本文描述的多肽,但具有在核苷酸水平上与编码工程化转氨酶的参考多肽约80%或更多序列同一性,约80%、85%、86%、87%、88%、
89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%或更多序列同一性。在一些实施方案中,参考多核苷酸序列选自SEQ ID NO:5、7、9、11、13、15、17、19、21、23、25、27、
29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、
79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、
123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、和153。
[0304] 编码本文中任何工程化转氨酶多肽的分离的多核苷酸可以以多种方式操作以提供多肽的表达。在一些实施方案中,编码多肽的多核苷酸可以被提供为表达载体,其中存在一个或更多个控制序列以调控多核苷酸和/或多肽的表达。取决于表达载体,所分离的多核苷酸在其插入载体中之前的操作可以是令人期望的或必要的。利用重组DNA方法修饰多核
苷酸和核酸序列的技术是本领域熟知的。在Sambrook等人,2001,Molecular Cloning:A 
Laboratory Manual,第3版,Cold Spring Harbor Laboratory Press;以及Current 
Protocols in Molecular Biology,Ausubel.F.编著,Greene Pub.Associates,1998,更新
至2006中提供了指导。
[0305] 在一些实施方案中,控制序列包括启动子、前导序列、多腺苷酸化序列、前肽序列、信号肽序列、和转录终止子以及其他。适合的启动子可基于使用的宿主细胞来选择。对于细菌宿主细胞,用于指导本公开内容的核酸构建体的转录的适合的启动子包括获自以下的启动子:大肠杆菌lac操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂酶基因(dagA)、枯草芽孢杆菌(Bacillus subtilis)果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌(Bacillus 
licheniformis)α-淀粉酶基因(amyL)、嗜热芽孢杆菌(Bacillus stearothermophilus)淀
粉酶基因(amyM)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因和原核的β-内酰胺酶基因(Villa-Kamaroff等人,1978,Proc.Natl Acad.Sci.USA 75:3727-3731),以及tac启动子(DeBoer等人,1983,Proc.Natl Acad.Sci.USA 80:21-25)。用于丝状真菌宿主细胞的示例性启动子,包括获自以下基因的启动子:米曲霉(Aspergillus oryzae)TAKA淀粉酶、米黑根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定型α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡糖淀粉酶(glaA)、米黑根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉(Aspergillus nidulans)乙酰胺酶和尖孢镰刀菌(Fusarium oxysporum)胰蛋白酶样蛋白酶(WO 96/
00787)以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶和米曲霉磷酸丙糖异构酶的基因的
启动子的杂合体)和其突变的、截短的和杂合的启动子。示例性酵母细胞启动子可来自以下基因:酿酒酵母(Saccharomyces cerevisiae)烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶
(GAL1)、酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)和酿酒酵母3-磷酸甘油酸
激酶。用于酵母宿主细胞的其它有用的启动子由Romanos等人,1992,Yeast 8:423-488描
述。
[0306] 控制序列还可以是适当的转录终止子序列,转录终止子序列是由宿主细胞识别以终止转录的序列。终止子序列可操作地连接到编码多肽的核酸序列的3’末端。在选择的宿主细胞中有功能的任何终止子可用于本发明中。例如,用于丝状真菌宿主细胞的示例性转
录终止子可以获自以下的基因:米曲霉TAKA淀粉酶、黑曲霉葡萄糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖孢镰刀菌胰蛋白酶样蛋白酶。用于酵母宿主细胞的示例性终止子可以获自以下的基因:酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。用于酵母宿主细胞的其他有用的终止子由上述Romanos等人,
1992描述。
[0307] 控制序列还可以是适当的前导序列,mRNA的非翻译区,其对于由宿主细胞翻译是重要的。前导序列可操作地连接到编码多肽的核酸序列的5’末端。可使用在选择的宿主细胞中有功能的前导序列。用于丝状真菌宿主细胞的示例性前导序列获自以下的基因:米曲
霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶。用于酵母宿主细胞的适当的前导序列获自以下
的基因:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油激酶、酿酒酵母α因子和酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
[0308] 控制序列还可以是多腺苷酸序列,所述多腺苷酸序列是可操作地连接到核酸序列的3’末端的序列,并且当转录时,被宿主细胞识别为将聚腺苷残基加到转录的mRNA的信号。
在选择的宿主细胞中有功能的任何多腺苷酸序列可用于本发明中。用于丝状真菌宿主细胞
的示例性多腺苷酸序列可以获自以下的基因:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合成酶、尖孢镰刀菌胰蛋白酶样蛋白酶和黑曲霉α葡糖苷酶。用于酵母宿主细胞的有用的多腺苷酸序列由Guo和Sherman,1995,Mol Cell Bio 15:5983-5990描述。
[0309] 控制序列还可以是信号肽编码区,其编码与多肽的氨基末端连接的氨基酸序列并将编码的多肽引导入细胞的分泌通路。核酸序列的编码序列的5’末端可以本身包括信号肽编码区,其与编码分泌的多肽的编码区的区段以翻译读码框天然地连接。可选地,编码序列的5’末端可以包含对于编码序列是外来的信号肽编码区。将表达的多肽引导入选择的宿主细胞的分泌通路的任何信号肽编码区可以被用于表达工程化多肽。对细菌宿主细胞有效的
信号肽编码区是获自以下的基因的信号肽编码区:芽孢杆菌(Bacillus)NClB 11837生麦芽
糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA。另外的信号肽由Simonen和Palva,1993,Microbiol Rev 57:109-137描述。对丝状真菌宿主细胞有效的信号肽编码区可以是获自以下的基因的信号肽编码区:米曲霉TAKA淀粉酶、黑曲霉中性淀粉
酶、黑曲霉葡糖淀粉酶、米黑根毛霉天冬氨酸蛋白酶、特异腐质霉(Humicola insolens)纤维素酶和柔毛腐质霉(Humicola lanuginosa)脂肪酶。对酵母宿主细胞有用的信号肽可以
来自酿酒酵母α因子和酿酒酵母转化酶的基因。
[0310] 控制序列还可以是前肽编码区,其编码定位在多肽的氨基末端的氨基酸序列。产生的多肽称为前酶(pro-enzyme)或前多肽(或在一些情况中称为酶原(zymogen))。通过从
前多肽催化或自动催化裂解前肽,前多肽可以被转化成成熟的活性多肽。前肽编码区可以
获自以下的基因:枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α因子、米黑根毛霉天冬氨酸蛋白酶和嗜热毁丝霉(Myceliophthora thermophila)乳
糖酶(WO 95/33836)。当信号肽和前肽区均存在于多肽的氨基末端时,前肽区定位为紧邻多肽的氨基末端并且信号肽区定位为紧邻前肽区的氨基末端。
[0311] 加入调节序列也可以是期望的,调节序列允许关于宿主细胞的生长调节多肽的表达。调节系统的实例是引起响应化学或物理刺激物,包括调节化合物的存在,而开启或关闭基因的表达的那些调节系统。在原核宿主细胞中,适当的调节序列包括lac、tac和trp操纵子系统。在酵母宿主细胞中,适当的调节系统包括,作为实例的ADH2系统或GAL1系统。在丝状真菌中,适当的调节序列包括TAKAα-淀粉酶启动子、黑曲霉葡萄糖淀粉酶启动子和米曲霉葡萄糖淀粉酶启动子。
[0312] 在另一方面,本公开内容还涉及重组表达载体,取决于其将被引入的宿主的类型,重组表达载体包括编码工程化转氨酶多肽的多核苷酸、和一种或更多种表达调节区诸如启动子和终止子、复制起点等。以上描述的各种核酸和控制序列可连接在一起以产生重组表
达载体,其可包括一个或更多个方便的限制位点以允许编码多肽的核酸序列在这些位点的
插入或置换。可选地,本公开内容的核酸序列可通过将核酸序列或包括所述序列的核酸构
建体插入用于表达的适当的表达载体来表达。在产生表达载体时,编码序列位于载体中以
使编码序列与用于表达的适当的控制序列可操作地连接。
[0313] 重组表达载体可以是任何载体(例如,质粒或病毒),其可以方便地经历重组DNA程序并且可以引起多核苷酸序列的表达。载体的选择将通常取决于载体与载体将被引入的宿
主细胞的相容性。载体可以是线性的或闭合的环状质粒。
[0314] 表达载体可以是自主复制载体,即,作为染色体外的实体存在的载体,其复制独立于染色体复制,自主复制载体例如质粒、染色体外元件、微型染色体或人工染色体。载体可包含用于保证自身复制的任何工具(means)。可选地,载体可以是当被引入宿主细胞时,被整合进入基因组并与其被整合进入的染色体一起复制的载体。此外,可以使用单一载体或质粒或一起包括待引入宿主细胞的基因组的总DNA的两种或更多种载体或质粒,或转座子。
[0315] 表达载体优选地包含一个或更多个可选择的标记物,其使得容易选择转化细胞。可选择的标记物是基因,其产物提供杀生物剂或病毒抗性、对重金属的抗性、营养缺陷型的原养型以及类似性质。细菌的可选择的标记物的实例是来自枯草芽孢杆菌或地衣芽孢杆菌
的dal基因,或赋予抗生素抗性如氨苄西林、卡那霉素、氯霉素(实施例1)或四环素抗性的标记物。用于酵母宿主细胞的适当的标记物是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞的可选择的标记物包括但不限于:amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草胺膦乙酰基转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合成酶)以及其等同物。用于曲霉细胞的实施方案包括构巢曲霉或米曲霉的amdS和pyrG基因和吸水链霉
菌(Streptomyces hygroscopicus)的bar基因。
[0316] 在另一个方面,本公开内容提供了包括编码本公开内容的工程化转氨酶多肽的多核苷酸的宿主细胞,该多核苷酸与用于在该宿主细胞中表达转氨酶的一个或更多个控制序
列可操作地连接。在表达由本发明的表达载体编码的多肽中使用的宿主细胞是本领域熟知
的并且包括但不限于:细菌细胞,诸如大肠杆菌、河流弧菌、链霉菌属和鼠伤寒沙氏菌
(Salmonella typhimurium)的细胞;真菌细胞,诸如酵母细胞(例如,酿酒酵母或巴斯德毕赤酵母(Pichia pastoris)(ATCC保藏号201178));昆虫细胞诸如果蝇S2细胞和夜蛾
(Spodoptera)Sf9细胞;动物细胞诸如CHO、COS、BHK、293和Bowes黑色素瘤细胞;以及植物细胞。示例性宿主细胞是大肠杆菌W3110(ΔfhuA)和BL21。
[0317] 因此,在另一方面,本公开内容提供了制造工程化转氨酶多肽的方法,其中该方法可包括在适合于表达多肽的条件下培养能够表达编码工程化转氨酶多肽的多核苷酸的宿主细胞。方法还可包括分离的或纯化表达的转氨酶多肽,如本文描述的。
[0318] 用于以上描述的宿主细胞的适当培养基和生长条件是本领域熟知的。可通过本领域已知的多种方法将用于表达转氨酶的多核苷酸引入细胞中。技术包括电穿孔、生物射弹
粒子轰击、脂质体介导的转染、氯化转染和原生质体融合以及其他。
[0319] 对于本文中的实施方案,可使用本领域技术人员使用的方法获得工程化多肽及相应的多核苷酸。编码河流弧菌的野生型多肽的亲本多核苷酸序列已被描述于Shin等人,
2003,Appl.Microbiol.Biotechnol.61(5-6):463-471,并且产生具有改进的稳定性和底物
识别特性的工程化转氨酶多肽的方法被公开于专利申请出版物WO2010081053和
US20100209981中,其通过引用并入本文。
[0320] 具有本文公开的特性的工程化转氨酶可通过使编码天然存在的或工程化转氨酶的多核苷酸经历诱变和/或定向进化方法而获得,如以上所讨论的。示例性的定向进化技术是诱变和/或DNA改组,如Stemmer,1994,Proc Natl Acad Sci USA 91:10747-10751;WO 
95/22625;WO 97/0078;WO 97/35966;WO 98/27230;WO 00/42651;WO 01/75767和美国专利
6,537,746中所描述。可以使用的其它定向进化程序包括交错延伸过程(StEP)、体外重组
(Zhao等人,1998,Nat.Biotechnol.16:258–261)、诱变PCR(Caldwell等人,1994,PCR 
Methods Appl.3:S136-S140)、和盒式诱变(Black等人,1996,Proc Natl Acad Sci USA 
93:3525-3529)以及其他。可用于本文目的的诱变和定向进化技术也被描述在以下文献中:
Ling等人,1997,Anal.Biochem.254(2):157-78;Dale等人,1996,“Oligonucleotide-
directed random mutagenesis using the phosphorothioate method”,于Methods 
Mol.Biol.57:369-74;Smith,1985,Ann.Rev.Genet.19:423-462;Botstein等人,1985,Science 229:1193-1201;Carter,1986,Biochem.J.237:1-7;Kramer等人,1984,Cell,38:
879-887;Wells等人,1985,Gene 34:315-323;Minshull等人,1999,Curr Opin Chem Biol 
3:284-290;Christians等人,1999,NatureBiotech 17:259-264;Crameri等人,1998,
Nature 391:288-291;Crameri等人,1997,Nature Biotech 15:436-438;Zhang等人,1997,Proc Natl Acad SciUSA 94:45-4-4509;Crameri等人,1996,Nature Biotech 14:315-
319;Stemmer,1994,Nature 370:389-391;Stemmer,1994,Proc Natl Acad Sci USA91:
10747-10751;WO 95/22625;WO 97/0078;WO 97/35966;WO 98/27230;WO 00/42651;WO 01/
75767和美国专利号6,537,746。所有出版物通过引用并入本文。
[0321] 可对诱变处理后获得的克隆筛选具有期望的改进的酶特性的工程化转氨酶。例如,当期望的改进的酶特性是热稳定性时,可以在使酶制剂经历定义的温度并测量热处理
之后剩余的酶活性的量之后测量酶活性。然后包含编码转氨酶的多核苷酸的克隆被分离,
测序以鉴定核苷酸序列变化(如果有的话),并且用于在宿主细胞中表达酶。在产物胺的例
如以OPA衍生化之后使用标准生物化学技术,诸如HPLC分析,可进行测量来自表达文库的酶活性。
[0322] 当工程化多肽的序列是已知的时,编码酶的多核苷酸可根据已知的合成方法通过标准的固相方法被制备。在一些实施方案中,多至约100个碱基的片段可以被单独地合成,然后连接(例如,通过酶或化学连接方法或聚合酶介导的方法)以形成任何期望的连续序
列。例如,使用例如由Beaucage等人,1981,Tet Lett 22:1859-69描述的经典的亚磷酰胺法或由Matthes等人,1984,EMBO J.3:801-05描述的方法,例如,如通常在自动化合成方法中所实践的,本文公开的多核苷酸和寡核苷酸可通过化学合成被制备。根据亚磷酰胺方法,寡核苷酸被例如在自动化DNA合成器中合成,纯化,退火,连接和克隆入适当的载体。
[0323] 因此,在一些实施方案中,用于制备工程化转氨酶多肽的方法可包括:(a)合成编码多肽的多核苷酸,所述多肽包括选自以下的氨基酸序列:SEQID NO:6、8、10、12、14、16、
18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、
68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、
114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、
152、和154,并且具有与SEQ ID NO:4相比在选自以下的残基位置上的一个或更多个残基差异:X14;X26;X31;X33;X41;X47;X57;X70;X86;X88;X107;X132;X148;X163;X168;X173;
X203;X250;X284;X314;X315;X324;X346;X395;X398;X400;X417;X419;X423;X448;和X451,其中在残基位置X31;X57;X86;X163;X168;X314;X324;X398;和X417上的残基差异选自:
X31S;X57Y;X86D;X163I;X163L;X163R;X163V;X168S;X314N;X324H;X398L;X398V;X398W;和X417M;以及(b)表达由多核苷酸编码的转氨酶多肽。
[0324] 在该方法的一些实施方案中,在残基位置X14;X26;X33;X41;X47;X70;X88;X107;X132;X148;X173;X203;X250;X284;X315;X346;X395;X400;X419;X423;X448;和X451上的残基差异选自X14V;X26R;X33T;X41L;X47N;X70A;X88A;X88L;X107P;X132F;X148Q;X148R;
X173A;X203S;X250A;X284A;X315G;X346L;X395P;X400G;X419S;X423I;X448E;和X451D。
[0325] 在该方法的一些实施方案中,氨基酸序列还包括选自以下的一个或更多个残基差异:X57F;X113L;X113V;X168K;X420N;和X424V。
[0326] 在该方法的一些实施方案中,由多核苷酸编码的氨基酸序列可任选地具有一个或数个(例如,多达3个、4个、5个、或多达10个)氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列任选地具有1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-
10个、1-15个、1-20个、1-21个、1-22个、1-23个、1-24个、1-25个、1-30个、1-35个、1-40个、1-
45个、或1-50个氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列任选地具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个、或50个氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列任选地具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、18个、20个、21个、22个、23个、24个、或25个氨基酸残基缺失、插入和/或取代。在一些实施方案中,取代可以是保守的或非保守的取代。
[0327] 表达的工程化转氨酶可通过本文描述的任何测定条件来测量在将化合物(2)转化至化合物(1)中期望的改进的特性,例如,活性、对映体选择性、稳定性、和产物耐受性。
[0328] 在一些实施方案中,在宿主细胞中表达的任何工程化转氨酶可以使用任何一种或更多种熟知的蛋白纯化方法从细胞和或培养介质回收,方法包括,溶菌酶处理、声处理、过滤、盐析、超速离心和色谱法以及其他。用于裂解和从细菌诸如大肠杆菌高效提取蛋白的适合的溶液被提供于表2A和实施例中,并且还是例如从St.Louis MO的Sigma-Aldrich以商标
名CelLytic BTM商业上可获得的。
[0329] 用于分离转氨酶多肽的色谱方法包括,反相色谱法、高效液相色谱法、离子交换色谱法、凝胶电泳和亲和色谱法以及其他。用于纯化具体的酶的条件将部分地取决于如净电荷、疏水性、亲水性、分子量、分子形状等因素,并且对于本领域技术人员将是显然的。
[0330] 在一些实施方案中,亲和技术可被用于分离改进的转氨酶。对于亲和色谱纯化,可使用特异性结合转氨酶多肽的任何抗体。对于抗体的产生,各种宿主动物,包括但不限于:兔、小鼠、大鼠等,可通过注射转氨酶多肽或其片段而被免疫。借助侧链官能团或连接到侧链官能团的连接子,转氨酶多肽或片段可被连接到适合的载体,诸如BSA。
[0331] 5.7使用工程化转氨酶的方法
[0332] 在另一方面,本文描述的转氨酶可被用于进行转氨酶反应的方法中,其中将来自氨基供体的氨基基团转移至氨基受体,例如酮底物,以产生胺。前手性酮受体的使用可导致以对映体过量产生手性胺。通常,用于进行转氨反应的方法包括在适于将氨基受体转化为
胺的反应条件下使氨基供体和氨基受体接触本公开内容的工程化转氨酶多肽或与之温育。
[0333] 在一些实施方案中,转氨酶可被用于将式(II)的底物化合物转化为式(I)的产物化合物,如方案2中所示:
[0334] 方案2
[0335]
[0336] 其中
[0337] R1选自由以下组成的组:氢、羧基、羧基(C1-C6)烷基、任选地取代的(C1-C6)烷基、任选地取代的(C2-C6)烯基、任选地取代的烷氧基羰基、任选地取代的芳基羰基、任选地取代的芳基磺酰基、和保护基团;
[0338] R2选自由以下组成的组:氢、氧代、卤代、羟基、氨基、硫代、任选地取代的(C1-C6)烷基、(C1-C6)烷基氨基、(C1-C6)二烷基氨基、(C1-C6)烷基硫代、(C1-C6)烷基磺酰基、(C1-C6)烷基亚磺酰基、和任选地取代的(C1-C6)烷氧基;
[0339] R4、R6和R7各自彼此独立地选自由以下组成的组:氢、卤代、羟基、氨基、羧基、氰基、硝基、硫代、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的(C1-C6)烷氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫代、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基、氨基羰基(C1-C6)烷基、任选地取代的环烷基、任选地取代的杂环烷基、任选地取代的芳基、任选地取代的杂芳基、任选地取代的芳氧基、任选地取代的芳基氨基、任选地取代的芳基硫代、任选地取代的芳基磺酰基、任选地取代的芳基亚磺酰基、任选地取代的芳基氧基羰基、任选地取代的芳基羰基氧基、任选地取代的杂芳基氧基、任选地取代的杂芳基氨基、任选地取代的杂芳基硫代、任选地取代的杂芳基磺酰基、任选地取代的杂芳基亚磺酰基、任选地取代的杂芳基氧基羰基、任选地取代的杂芳基羰基氧基、烷基氨基磺酰基(C1-C6)烷基、芳基磺酰基(C1-C6)烷基、和杂芳基磺酰基(C1-C6)烷基;
[0340] R5选自由以下组成的组:氢、卤代、羟基、氨基、羧基、氰基、硝基、硫代、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的(C1-C6)烷氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫代、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基、氨基羰基(C1-C6)烷基、任选地取代的环烷基、任选地取代的杂环烷基、任选地取代的芳基、任选地取代的杂芳基、任选地取代的芳氧基、任选地取代的芳基氨基、任选地取代的芳基硫代、任选地取代的芳基磺酰基、任选地取代的芳基亚磺酰基、任选地取代的芳基氧基羰基、任选地取代的芳基羰基氧基、任选地取代的杂芳基氧基、任选地取代的杂芳基氨基、任选地取代的杂芳基硫代、任选地取代的杂芳基磺酰基、任选地取代的杂芳基亚磺酰基、任选地取代的杂芳基氧基羰基、任选地取代的杂芳基羰基氧基、烷基氨基磺酰基(C1-C6)烷基、芳基磺酰基(C1-C6)烷基、和杂芳基磺酰基(C1-C6)烷基、或与R4一起形成5至8元任选地取代的环烷基或任选地取代的杂环;
[0341] R8选自由以下组成的组:任选地取代的(C1-C6)烷基、任选地取代的(C1-C6)烷氧基、任选地取代的环烷基、任选地取代的杂环烷基、任选地取代的芳基、和任选地取代的杂芳基、或与R2一起形成任选地取代的5至8元环烷基或杂环;以及
[0342] n是1或2;
[0343] 条件是
[0344] (a)当R2是氢,则以下的至少一个适用:
[0345] (i)R1不是氢、甲基、4-(甲氧基)苯基羰基-、4-(三氟甲氧基)苯磺酰基-、3-溴苯基羰基-、3-氨基丙基、或3-(甲基羰基氨基)丙基-;
[0346] (ii)R4和R7各自彼此独立地不是氢或氯;
[0347] (iii)R5不是氢、羟基、甲基、甲氧基、氟、氯、三氟甲基、或氰基;
[0348] (iv)R6不是氢、羟基、甲氧基、氟或氯;或
[0349] (v)R8不是甲基、乙基、羟甲基、羧基、甲基氧基羰基、乙基氧基羰基、或三氟甲基-;以及
[0350] (b)当n是1,R2和R8一起形成环己基环,并且R1、R4、R6、和R7是氢时,则R5不是氟。
[0351] 在一些实施方案中,以上式(I)的产物化合物,并因此相应的酮底物,即以下式(II)的化合物,具有以下条件:
[0352] (a)当R2是氢,则以下的至少一个适用:
[0353] (i)R1不是氢、甲基、4-(甲氧基)苯基羰基-、4-(三氟甲氧基)苯磺酰基-、3-溴苯基羰基-、3-氨基丙基、或3-(甲基羰基氨基)丙基-;
[0354] (ii)R4和R7各自彼此独立地不是氢或氯;
[0355] (iii)R5不是氢、羟基、甲基、甲氧基、氟、氯、三氟甲基、或氰基;
[0356] (iv)R6不是氢、羟基、甲氧基、氟或氯;或
[0357] (v)R8不是甲基、乙基、羟甲基、或三氟甲基-;以及
[0358] (b)当n是1,R2和R8一起形成环己基环,并且R1、R4、R6、和R7是氢时,则R5不是氟。
[0359] 因此,明确排除式(I)的化合物,并因此相应的酮底物,即,以下式(II)的化合物,是式(I)的化合物,其中
[0360] R1是氢、甲基、或
[0361] 4-(甲氧基)苯基羰基-
[0362]
[0363] 4-(三氟甲氧基)苯磺酰基-
[0364]
[0365] 3-溴苯基羰基-
[0366]
[0367] 3-氨基丙基
[0368] 或
[0369] 3-(甲基羰基氨基)丙基-
[0370]
[0371] R4和R7各自彼此独立地是氢或氯;
[0372] R5为氢、羟基、甲基、甲氧基、氟、氯、三氟甲基、或氰基;
[0373] R6是氢、羟基、甲氧基、氟、或氯;
[0374] R8是氢、甲基、乙基、羟甲基、羧基、甲基氧基羰基(-CO2CH3)、乙基氧基羰基-(-CO2CH2CH3)、或三氟甲基;以及
[0375] n是1或2。
[0376] 因此,在一些实施方案中,用于制备产物化合物(I)的方法可包括在适当的反应条件下在氨基供体的存在下,使式(II)的底物化合物与本文公开的工程化转氨酶多肽接触
[0377]
[0378] 其中
[0379] R1、R2、R4、R5、R6、R7、R8和n如以上所定义。
[0380] 在该方法的一些实施方案中,式(I)的化合物包括在以*标记的碳原子上具有指定的立体化学的式(IS)的化合物,
[0381]
[0382] 其中式(IS)的化合物以对映体过量来形成。在一些实施方案中,式(IS)的化合物以至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大的对映体过量来形成。
[0383] 在该方法的一些实施方案中,以上式(I)的化合物包括式(Ia)的化合物,
[0384]
[0385] 其中
[0386] R1选自由以下组成的组:氢、羧基、羧基(C1-C6)烷基、任选地取代的(C1-C6)烷基、任选地取代的(C2-C6)烯基、任选地取代的烷氧基羰基、任选地取代的芳基羰基、任选地取代的芳基磺酰基、和保护基团;
[0387] R2选自由以下组成的组:氢、氧代、卤代、羟基、氨基、(C1-C6)烷基氨基、(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基、和任选地取代的(C1-C6)烷氧基;
[0388] R4、R6和R7各自彼此独立地选自由以下组成的组:氢、卤代、羟基、羟基(C1-C6)烷基、氨基、(C1-C6)烷基氨基、(C1-C6)二烷基氨基、氰基、硝基、磺酰基、氨基羰基、氨基羰基(C1-C6)烷基、(C1-C6)烷基氨基、羧基、羧基(C1-C6)烷基、任选地取代的(C1-C6)烷基、任选地取代的(C1-C6)烷氧基、任选地取代的环烷基、任选地取代的杂环烷基、任选地取代的芳基、任选地取代的杂芳基、烷基氨基磺酰基(C1-C6)烷基、芳基磺酰基(C1-C6)烷基、和杂芳基磺酰基(C1-C6)烷基;
[0389] R5选自由以下组成的组:氢、卤代、羟基、羟基(C1-C6)烷基、氨基、(C1-C6)烷基氨基、(C1-C6)二烷基氨基、氰基、硝基、磺酰基、氨基羰基、氨基羰基(C1-C6)烷基、(C1-C6)烷基氨基、羧基、羧基(C1-C6)烷基、任选地取代的(C1-C6)烷基、任选地取代的(C1-C6)烷氧基、任选地取代的环烷基、任选地取代的杂环烷基、任选地取代的芳基、任选地取代的杂芳基、烷基氨基磺酰基(C1-C6)烷基、芳基磺酰基(C1-C6)烷基、和杂芳基磺酰基(C1-C6)烷基,或与R4一起形成5至7元任选地取代的环烷基或任选地取代的杂环;
[0390] R8选自由以下组成的组:任选地取代的(C1-C6)烷基、任选地取代的(C1-C6)烷氧基、任选地取代的环烷基、任选地取代的杂环烷基、任选地取代的芳基和任选地取代的杂芳基;
[0391] 条件是当R2是氢,则以下的至少一个适用:
[0392] (i)R1不是氢、甲基、4-(甲氧基)苯基羰基-、4-(三氟甲氧基)苯磺酰基-、3-溴苯基羰基-、3-氨基丙基、或3-(甲基羰基氨基)丙基-;
[0393] (ii)R4和R7各自彼此独立地不是氢或氯;
[0394] (iii)R5不是氢、羟基、甲基、甲氧基、氟、氯、三氟甲基、或氰基;
[0395] (iv)R6不是氢、羟基、甲氧基、氟或氯;或
[0396] (v)R8不是甲基、乙基、羟甲基-、或三氟甲基-。
[0397] 因此,在一些实施方案中,用于制备式(Ia)的化合物的方法可包括在适当的反应条件下在氨基供体的存在下,使式(IIa)的化合物与本文公开的工程化转氨酶多肽接触
[0398]
[0399] 其中R1、R2、R4、R5、R6、R7、和R8如以上所定义。
[0400] 在该方法的一些实施方案中,式(Ia)的化合物包括在以*标记的碳原子上具有指定的立体化学的式(IaS)的化合物
[0401]
[0402] 其中化合物(IaS)以对映体过量来形成。在一些实施方案中,式(IaS)的化合物以至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大的对映体过量来形成。
[0403] 在该方法的一些实施方案中,以上式(I)的化合物包括式(Ia1)的化合物
[0404]
[0405] 其中
[0406] R1选自由以下组成的组:氢和(C1-C6)烷基;
[0407] R2选自由以下组成的组:氢、卤代、和(C1-C6)烷基;
[0408] R4、R5、R6、和R7各自彼此独立地选自由以下组成的组:氢、卤代、羟基、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、(C1-C6)烷基;氨基、(C1-C6)烷基氨基、和(C1-C6)二烷基氨基;以及
[0409] R9选自由以下组成的组:卤代、羟基、羟基(C1-C6)烷基、氨基、(C1-C6)烷基氨基、和(C1-C6)二烷基氨基;
[0410] 条件是当R2是氢,则以下的至少一个适用:
[0411] (i)R1不是氢或甲基;
[0412] (ii)R4和R7各自彼此独立地不是氢或氯;
[0413] (iii)R5不是氢、羟基、甲基、甲氧基、氟、氯、或三氟甲基;
[0414] (iv)R6不是氢、羟基、甲氧基、氟或氯;或
[0415] (v)R9不是羟基。
[0416] 因此,在一些实施方案中,用于制备式(Ia1)的化合物的方法可包括在适当的反应条件下在氨基供体的存在下,使式(IIa1)的化合物与本文公开的工程化转氨酶多肽接触
[0417]
[0418] 其中
[0419] R1、R2、R4、R5、R6、R7、和R9如以上所定义。
[0420] 在该方法的一些实施方案中,式(Ia)的化合物包括式(Ia2)的化合物
[0421]
[0422]
[0423] 其中
[0424] L是离去基团;
[0425] R10的每次出现彼此独立地选自由以下组成的组:卤代、羟基、氨基、羧基、氰基、硝基、硫代、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的(C1-C6)烷氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫代、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基、氨基羰基(C1-C6)烷基、任选地取代的环烷基、任选地取代的杂环烷基、任选地取代的芳基、任选地取代的杂芳基、任选地取代的芳氧基、任选地取代的芳基氨基、任选地取代的芳基硫代、任选地取代的芳基磺酰基、任选地取代的芳基亚磺酰基、任选地取代的芳基氧基羰基、任选地取代的芳基羰基氧基、任选地取代的杂芳基氧基、任选地取代的杂芳基氨基、任选地取代的杂芳基硫代、任选地取代的杂芳基磺酰基、任选地取代的杂芳基亚磺酰基、任选地取代的杂芳基氧基羰基、任选地取代的杂芳基羰基氧基、烷基氨基磺酰基(C1-C6)烷基、芳基磺酰基(C1-C6)烷基、和杂芳基磺酰基(C1-C6)烷基;
[0426] k为从3至5的整数;
[0427] n是1或2;以及
[0428] w是从0至4的整数。
[0429] 在式(Ia2)的化合物的一些实施方案中,R10选自由以下组成的组:卤代、羟基、羟基(C1-C6)烷基;氨基、(C1-C6)烷基氨基、(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基;任选地取代的(C1-C6)烷氧基、烷基氨基磺酰基(C1-C6)烷基、芳基磺酰基(C1-C6)烷基、和杂芳基磺酰基(C1-C6)烷基。
[0430] 因此,在一些实施方案中,用于制备式(Ia2)的化合物的方法可包括在适当的反应条件下在氨基供体的存在下,使式(IIa2)的化合物与本文公开的工程化转氨酶多肽接触,
[0431]
[0432] 其中
[0433] L、R10、k、n和w如以上所定义。
[0434] 离去基团L可包括可被亲核的氨基取代的任何适当的基团。在一些实施方案中,L选自氯、溴、烷氧基、芳氧基、烷基羰基氧基、芳基羰基氧基、烷基硫代、芳基硫代、和-OPO3。
在一些实施方案中,L是烷氧基,其中烷基基团选自任选地取代的甲基、乙基、正丙基、正丁基、异丁基、仲丁基、和叔丁基。在一些实施方案中,L是氯或溴。在一些实施方案中,k是3、4、或5。
[0435] 如在方案3中所示,离去基团L在式((Ia2)的产物化合物中的存在允许用于制备结构式(Ia3)的包含氮的杂环的产物化合物的环化:
[0436] 方案3
[0437]
[0438] 在转氨酶反应的反应条件下,离去基团的适当选择允许直接形成结构式(Ia3)的化合物,由此提供用于合成杂环的简易方法。在结构式(IIa2)的范围内的各种底物化合物
可被使用以制备结构式(Ia2)的相应产物化合物,然后结构式(Ia2)的相应产物化合物用作
用于制备结构式(Ia3)的范围内的杂环的中间体。
[0439] 在一些实施方案中,式(Ia3)的化合物包括式(Ia3’)的化合物,其可通过使式(IIa2’)的化合物与本公开内容的转氨酶接触以制备式(Ia2’)的产物化合物来制备,如方案4中所示:
[0440] 方案4
[0441]
[0442] 其中L、R10、n和w如对于式(Ia2)的化合物所定义的。在一些实施方案中,L是氯或溴。
[0443] 环化式(Ia2’)的化合物产生式(Ia3’)的化合物。在一些实施方案中,环化可在转氨酶反应的反应条件下进行,或在一些实施方案中,在转氨酶反应结束后单独进行。
[0444] 在该方法的一些实施方案中,式(I)的化合物包括式(Ib)的化合物,
[0445]
[0446] 其中
[0447] Z选自由以下组成的组:O、S、NH或-(CH2)m-,其中m是0、1、2或3;
[0448] R1选自由以下组成的组:氢、羧基、羧基(C1-C6)烷基、任选地取代的(C1-C6)烷基、任选地取代的(C2-C6)烯基、任选地取代的烷氧基羰基、任选地取代的芳基羰基、任选地取代的芳基磺酰基、和保护基团;
[0449] R4、R5、R6和R7各自彼此独立地选自由以下组成的组:氢、卤代、羟基、氨基、羧基、氰基、硝基、硫代、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的(C1-C6)烷氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫代、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基、氨基羰基(C1-C6)烷基、任选地取代的环烷基、任选地取代的杂环烷基、任选地取代的芳基、任选地取代的杂芳基、任选地取代的芳氧基、任选地取代的芳基氨基、任选地取代的芳基硫代、任选地取代的芳基磺酰基、任选地取代的芳基亚磺酰基、任选地取代的芳基氧基羰基、任选地取代的芳基羰基氧基、任选地取代的杂芳基氧基、任选地取代的杂芳基氨基、任选地取代的杂芳基硫代、任选地取代的杂芳基磺酰基、任选地取代的杂芳基亚磺酰基、任选地取代的杂芳基氧基羰基、任选地取代的杂芳基羰基氧基、烷基氨基磺酰基(C1-C6)烷基、芳基磺酰基(C1-C6)烷基、和杂芳基磺酰基(C1-C6)烷基;
[0450] 条件是当Z为-(CH2)m-,m是1,且R1、R4、R6和R7是氢,则R5不是氟。
[0451] 在用于制备式(IIb)的化合物的方法的一些实施方案中,Z是-(CH2)m-,其中m是1。
[0452] 因此,在一些实施方案中,用于制备式(Ib)的化合物的方法包括在适当的反应条件下在氨基供体的存在下,使式(IIb)的化合物与本公开内容的工程化转氨酶多肽接触,
[0453]
[0454] 其中
[0455] Z、R1、R4、R5、R6、和R7如以上所定义。
[0456] 在方法的一些实施方案中,式(Ib)的化合物包括在以*标记的碳原子上具有指定的立体化学的式(IbS)的化合物,
[0457]
[0458] 其中化合物(IbS)以对映体过量来形成。在一些实施方案中,化合物(IbS)以至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大的对映体过量来形成。
[0459] 在该方法的一些实施方案中,式(Ib)的化合物包括式(Ib1)的化合物,
[0460]
[0461] 其中
[0462] R1选自由以下组成的组:氢、羧基(C1-C6)烷基、和(C1-C6)烷基;
[0463] R11的每次出现彼此独立地选自由以下组成的组:氯、溴、碘、羟基、氨基、羧基、氰基、硝基、硫代、任选地取代的(C1-C6)烷基、羟基(C1-C6)烷基、任选地取代的(C1-C6)烷氧基、任选地取代的(C1-C6)烷基氨基、任选地取代的(C1-C6)二烷基氨基、任选地取代的(C1-C6)烷基硫代、任选地取代的(C1-C6)烷基磺酰基、任选地取代的(C1-C6)烷基亚磺酰基、羧基(C1-C6)烷基、(C1-C6)烷氧基羰基、(C1-C6)烷基羰基氧基、任选地取代的氨基羰基、氨基羰基(C1-C6)烷基、任选地取代的环烷基、任选地取代的杂环烷基、任选地取代的芳基、任选地取代的杂芳基、任选地取代的芳氧基、任选地取代的芳基氨基、任选地取代的芳基硫代、任选地取代的芳基磺酰基、任选地取代的芳基亚磺酰基、任选地取代的芳基氧基羰基、任选地取代的芳基羰基氧基、任选地取代的杂芳基氧基、任选地取代的杂芳基氨基、任选地取代的杂芳基硫代、任选地取代的杂芳基磺酰基、任选地取代的杂芳基亚磺酰基、任选地取代的杂芳基氧基羰基、任选地取代的杂芳基羰基氧基、烷基氨基磺酰基(C1-C6)烷基、芳基磺酰基(C1-C6)烷基、和杂芳基磺酰基(C1-C6)烷基;以及
[0464] w为从0至4的整数。
[0465] 在式(Ib1)的化合物的一些实施方案中,R11选自由以下组成的组:氨基、氨基羰基、和氨基羰基(C1-C6)烷基。
[0466] 因此,用于制备式(Ib1)的化合物的方法包括在适当的反应条件下在氨基供体的存在下,使式(Ib1)的底物化合物与本公开内容的工程化转氨酶多肽接触,
[0467]
[0468] 其中
[0469] R1、R11和w如以上所定义。
[0470] 在方法的一些实施方案中,产物化合物可选自表3中的结构,其中胺化合物(即,Ia3、Ia4、Ia5、Ia6、Ia7、Ia8、Ia9、Ia10、Ia11、Ia12、Ia13、Ib2、Ib3、Ib4、Ib5或Ib6)可在适当的反应条件下通过使相应氨基受体底物化合物(即,IIa3、IIa4、IIa5、IIa6、IIa7、IIa8、IIa9、IIa10、IIa11、IIa12、IIa13、IIb2、IIb3、IIb4、IIb5或IIb6)与本文公开的工程化转氨酶接触来制备。
[0471] 表3
[0472]
[0473]
[0474]
[0475]
[0476] 鉴于工程化酶的立体选择性,在一些实施方案中,该方法可被用于以对映体过量制备表3中的在以*指示的碳上具有立体化学的手性胺化合物(即,Ia3S、Ia4S、Ia5S、Ia6S、Ia7S、Ia8S、Ia9S、Ia10S、Ia11S、Ia12S、Ia13S、Ib2S、Ib3S、Ib4S、Ib5S、或Ib6S)。在一些实施方案中,特定手性化合物可以以至少90%、91%、92%、93%、94%、95%、96%、97%、98%、
99%或更大的对映体过量来制备。
[0477] 在一些实施方案中,工程转氨酶可被用于以对映体过量制备具有指示的立体化学的式(1)的化合物,
[0478]
[0479] 因此,在一些实施方案中,用于以对映体过量制备式(1)的化合物的方法包括在适当的反应条件下在氨基供体的存在下,使式(2)的化合物与本文描述的工程化转氨酶多肽
接触。
[0480]
[0481] 在该方法的一些实施方案中,式(1)的化合物可以以至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大的对映体过量来形成。
[0482] 对于本文中的实施方案,前手性酮底物化合物商购可得或可使用技术人员可得的方法被合成。例如,1-(1H-吲哚-3-基)-丙-2-酮和4-(1H-吲哚-3-基)-丁-2-酮商购可得。取代的酮底物可基于现有技术,例如WO2009132921和Pradhan等人,2005,Synthetic 
Comm.35:913-922中描述的方法来合成。用于合成吲哚上具有取代的酮底物的示例性方法
示于方案5中,其中R5和R6是氢或卤素(例如,R5是F且R6是Cl):
[0483] 方案5
[0484]
[0485] 在方案5中,取代的吲哚与三氯氧磷反应以产生吲哚-3-醛,然后将吲哚-3-醛用硝基乙烷转化为取代的3-(2-硝基-丙烯基)-IH-吲哚。硝基烯氧化水解为相应的酮用Fe-HCl
来完成(参见上述Pradhan)。备选地,硝基烯可被三烷基氢化物还原,并且将所得氮酸酯水解以产生酮(参见,例如,Kabalka等人,1999,Tetrahedron 46(21):7443-7457.
[0486] 用于制备吲哚上具有取代的酮底物的另一种示例性方法示于方案6中:
[0487] 方案6
[0488]
[0489] 在方案6中,取代的吲哚在碳酸的存在下与氯乙酸乙酯反应以形成取代的乙基-3-吲哚乙酸(参见,例如,Kumar等人,2010,Oriental J Chem.26(2):455-466)。吲哚氮的保护随后是使用N,O-二甲基羟基胺向Weinreb酰胺的转化。用格氏试剂(Grignard reagent)
CH3-MgBr或有机锂试剂CH3-Li的随后处理产生相应受保护的酮。基于酸的去保护产生5,6-
取代的1-(1H-吲哚-3-基)-丙-2-酮。
[0490] 对于前述方法,可使用本文描述的任何工程化转氨酶。通过示例的方法而非限制,在一些实施方案中,该方法可使用包括氨基酸序列的工程化转氨酶多肽,所述氨基酸序列具有与选自以下的参考序列至少80%、85%、86%、87%、88%、89%、90%、91%、92%、
93%、94%、95%、96%、97%、98%、99%或更多同一性:SEQ ID NO:4、6、8、10、12、14、16、
18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、
68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、
114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、
152、和154,以及与SEQ ID NO:4相比在选自以下的残基位置上的一个或更多个残基差异:
X14;X26;X31;X33;X41;X47;X57;X70;X86;X88;X107;X132;X148;X163;X168;X173;X203;
X250;X284;X314;X315;X324;X346;X395;X398;X400;X417;X419;X423;X448;和X451,其中在残基位置X31;X57;X86;X163;X168;X314;X324;X398;和X417上的残基差异选自:X31S;
X57Y;X86D;X163I;X163L;X163R;X163V;X168S;X314N;X324H;X398L;X398V;X398W;和X417M。在一些实施方案中,参考序列选自SEQ ID NO:4、8、14、16、132、134、和146。在一些实施方案中,参考序列是SEQ ID NO:4。在一些实施方案中,参考序列是SEQ ID NO:8。在一些实施方案中,参考序列是SEQ ID NO:134。在一些实施方案中,参考序列是SEQ ID NO:146。
[0491] 在该方法的一些实施方案中,以上具有与SEQ ID NO:4相比在残基位置X14;X26;X31;X33;X41;X47;X57;X70;X86;X88;X107;X132;X148;X163;X168;X173;X203;X250;X284;
X314;X315;X324;X346;X395;X398;X400;X417;X419;X423;X448;和X451上的一个或更多个残基差异的工程化转氨酶多肽还可包括与SEQ ID NO:4相比选自以下的一个或更多个残基
差异:X57F;X113L;X113V;X168K;X420N;和X424V。
[0492] 在一些实施方案中,能够进行本文中方法的示例性转氨酶可为包括选自以下氨基酸序列的多肽:SEQ ID NO:6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、
42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、
92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、
132、134、136、138、140、142、144、146、148、150、152、和154。关于工程化转氨酶的选择和使用的指导提供于本文的说明书中,例如表2和实施例。
[0493] 在本文中的实施方案中并在实施例中所示,可使用的适当的反应条件的各种范围,包括但不限于,氨基供体、pH、温度、缓冲液、溶剂系统、底物载量、多肽载量、辅因子载量、压力、和反应时间的范围。用于使用本文所述的工程化转氨酶多肽进行用于将底物化合物生物催化转化为产物化合物的方法的另外的适当的反应条件可根据本文提供的指导易
于通过常规实验来优化,常规实验包括但不限于:使工程化转氨酶多肽与底物化合物在浓
度、pH、温度、溶剂条件的实验反应条件下接触,并检测产物化合物。
[0494] 在本文的一些实施方案中,转氨酶多肽使用氨基供体以形成产物化合物。在一些实施方案中,在反应条件中的氨基供体可选自异丙胺(本文中还称为“IPM”),腐胺、L-赖氨酸、α-苯乙胺、D-丙氨酸、L-丙氨酸、或D,L-丙氨酸、或D,L-鸟氨酸。在一些实施方案中,氨基供体选自IPM、腐胺、L-赖氨酸、D-丙氨酸或L-丙氨酸。在一些实施方案中,氨基供体是IPM。
在一些实施方案中,适当的反应条件包括氨基供体,特别是以以下浓度存在的IPM:至少约
0.1至约3M、0.2至约2.5M、约0.5至约2M或约1至约2M。在一些实施方案中,氨基供体以以下浓度存在:约0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、1、1.5、2、2.5或3M。更高浓度的氨基供体,例如IPM可被用于将平衡移向胺产物形成。
[0495] 使用工程化转氨酶多肽的适当的反应条件通常还包括辅因子。用于本文转氨酶有用的辅因子包括,但不限于,吡哆醛-5’-磷酸(还称为吡哆醛磷酸、PLP、P5P)、吡哆醇(PN)、吡哆醛(PL)、吡哆胺(PM)、和它们的磷酸化的对应物磷酸吡哆醇(PNP)、和磷酸吡哆胺
(PMP)。在一些实施方案中,辅因子PLP天然存在于细胞提取物,并且不需要被补充。在该方法的一些实施方案中,适当的反应条件包括例如,当使用部分纯化的或纯化的转氨酶时,加入至酶反应混合物中的外源性辅因子。在一些实施方案中,适当的反应条件可以包括选自
PLP、PN、PL、PM、PNP、和PMP的辅因子以以下浓度的存在:约0.1g/L至约10g/L、约0.2g/L至约
5g/L、约0.5g/L至约2.5g/L。在一些实施方案中,反应条件包括以下的PLP浓度:约0.1g/L或更少、0.2g/L或更少、0.5g/L或更少、1g/L或更少、2.5g/L或更少、5g/L或更少、或10g/L或更少。在一些实施方案中,辅因子可在反应开始时被添加和/或另外的辅因子在反应过程中被添加。
[0496] 考虑到例如,产物化合物的需要量、底物浓度对酶活性的影响、酶在反应条件下的稳定性、以及底物至产物的转化率百分比,在反应混合物中的底物化合物可以被改变。在一些实施方案中,适当的反应条件包括以下的底物化合物载量:至少约0.5至约200g/L、1至约200g/L、约5至约150g/L、约10至约100g/L、约20至约100g/L、或约50至约100g/L。在一些实施方案中,适当的反应条件包括以下的底物化合物载量:至少约0.5g/L、至少约1g/L、至少约5g/L、至少约10g/L、至少约15g/L、至少约20g/L、至少约30g/L、至少约50g/L、至少约75g/L、至少约100g/L、至少约150g/L或至少约200g/L、或甚至更大。本文中提供的底物载量的值是基于化合物(2)的分子量,然而还设想,等摩尔量的化合物(2)的各种水合物和盐还可在
方法中被使用。此外,由式(II)涵盖的底物化合物,包括式(IIa)和(IIb)的化合物,还可根据针对化合物(2)使用的量以适当的量被使用。
[0497] 在进行本文描述的反应时,工程化转氨酶多肽可以以纯化的酶、用编码酶的基因转化的整个细胞、和/或作为细胞提取物和/或此类细胞的溶解产物被添加到反应混合物
中。用编码工程化转氨酶的基因转化的整个细胞或其细胞提取物、溶解产物和分离的酶可
以多种不同的形式被使用,包括固体(例如冻干的、喷雾干燥的以及类似的)或半固体(例
如,粗糊料)。细胞提取物或细胞溶解产物可通过沉淀(硫酸铵、聚乙烯亚胺、热处理或类似方法),随后脱盐程序,之后冻干(例如,超滤、渗析以及类似的)来部分地纯化。任何细胞制品可通过使用已知的交联剂,诸如例如戊二醛交联而被稳定或固定至固相材料(例如,
Eupergit C以及类似的)。
[0498] 编码工程化转氨酶多肽的基因可被单独地转化进入宿主细胞或一起转化进入同一宿主细胞。例如,在一些实施方案中,宿主细胞的一个集合可用编码一种工程化转氨酶多肽的基因转化并且另一集合可用编码另一工程化转氨酶多肽的基因转化。转化的细胞的两
个集合可在反应混合物中以整个细胞的形式或以从其得到的溶解产物或提取物的形式一
起被使用。在其他实施方式中,宿主细胞可用编码多个工程化转氨酶多塔的基因转化。在一些实施方式中,工程化多肽可以分泌的多肽的形式被表达并且包含分泌的多肽的培养介质
可以被用于转氨酶反应。
[0499] 本文公开的工程化转氨酶多肽的活性和/或立体选择性的改进,提供了其中较高转化率百分比可用较低浓度的工程化多肽实现的方法。在方法的一些实施方案中,适当的
反应条件包括以下的工程化多肽浓度:约0.01至约50g/L、约0.05至约50g/L、约0.1至约
40g/L、约1至约40g/L、约2至约40g/L、约5至约40g/L、约5至约30g/L、约0.1至约10g/L、约
0.5至约10g/L、约1至约10g/L、约0.1至约5g/L、约0.5至约5g/L、或约0.1至约2g/L。在一些实施方案中,转氨酶多肽浓度为约0.01、0.05、0.1、0.2、0.5、1、2、5、10、15、20、25、30、35、40或50g/L。
[0500] 在氨基转移反应的过程中,反应混合物的pH可以变化。反应混合物的pH可以被维持在期望的pH或在期望的pH范围内。这可通过在反应的过程之前和/或期间加入酸或碱来
实现。可选地,pH可以通过使用缓冲液来控制。因此,在一些实施方案中,反应条件包括缓冲液。用于维持期望的pH范围的适当的缓冲液是本领域已知的且包括,通过举例的方式而非
限制,硼酸盐缓冲液、碳酸盐缓冲液、磷酸盐缓冲液、三乙醇胺缓冲液(TEA)和类似缓冲液。
在一些实施方案中,缓冲液是硼酸盐。在方法的一些实施方案中,适当的反应条件包括TEA的缓冲溶液,其中TEA浓度是从约0.01至约0.4M、0.05至约0.4M、0.1至约0.3M、或约0.1至约
0.2M。在一些实施方案中,反应条件包括以下的TEA浓度:约0.01、0.02、0.03、0.04、0.05、
0.07、0.1、0.12、0.14、0.16、0.18、0.2、0.3、或0.4M。在一些实施方案中,反应条件包括水作为适当的溶剂,没有缓冲液存在。
[0501] 在方法的一些实施方案中,反应条件可包括适当的pH。期望的pH或期望的pH范围可通过使用酸或碱、适当的缓冲液、或缓冲液和酸或碱添加的组合来维持。反应混合物的pH可在反应的过程之前和/或期间被控制。在一些实施方案中,适当的反应条件包括从约6至
约12的溶液pH、从约6至约10的pH、从约6至约8的pH、从约7至约10的pH、从约7至约9的pH、或从约7至约8的pH。在一些实施方案中,反应条件包括约6、6.5、7、7.5、8、8.5、9、9.5、10、
10.5、11、11.5或12的溶液pH。
[0502] 在本文方法的实施方案中,例如,考虑到:在较高的温度下增加的反应速率、以及在反应时间段期间酶的活性,适当的温度可用于反应条件。例如,本公开内容的工程化多肽具有相对于天然存在的转氨酶多肽例如SEQ ID NO:2的野生型多肽增加的稳定性,这允许工程化多肽以较高的温度使用,用于增加的转化率和改进的底物可溶性特性。因此,在一些实施方案中,适当的反应条件包括以下的温度:约10℃至约70℃、约10℃至约65℃、约15℃至约60℃、约20℃至约60℃、约20℃至约55℃、约30℃至约55℃、或约40℃至约50℃。在一些实施方案中,适当的反应条件包括约10℃、15℃、20℃、25℃、30℃、35℃、40℃、45℃、50℃、
55℃、60℃、65℃、或70℃的温度。在一些实施方案中,酶促反应过程中的温度可在整个反应过程中保持在一个温度,或在反应期间被调节遍及温度分布。
[0503] 本文方法一般在溶剂中进行。适当的溶剂包括水、缓冲水溶液、有机溶剂、聚合溶剂、和/或共溶剂系统,其通常包括含水溶剂、有机溶剂和/或聚合溶剂。含水溶剂(水或含水的共溶剂系统)可以是pH缓冲的或无缓冲的。在一些实施方案中,方法通常在包括有机溶剂(例如,乙醇、异丙醇(IPA)、二甲基亚砜(DMSO)、乙酸乙酯、乙酸丁酯、1-辛醇、庚烷、辛烷、甲基叔丁基醚(MTBE)、甲苯以及类似物)、离子或极性溶剂(例如,1-乙基4-甲基咪唑鎓四氟硼酸盐、1-丁基-3-甲基咪唑鎓四氟硼酸盐、1-丁基-3-甲基咪唑鎓六氟磷酸盐、甘油、聚乙二醇以及类似物)的含水共溶剂系统中进行。在一些实施方案中,共溶剂可以是极性溶剂,诸如多元醇、二甲亚砜、DMSO、或低级醇。含水共溶剂系统的非含水共溶剂组分可以是与含水组分易混溶的,提供单一的液相,或可以是与含水组分部分地易混溶的或不易混溶的,提供两个液相。示例性含水共溶剂系统可包括水和选自有机溶剂、极性溶剂、和多元醇溶剂的一种或更多种共溶剂。通常,选择含水共溶剂系统的共溶剂组分使得其在反应条件下不会不利地使转氨酶失活。适当的共溶剂系统可通过使用酶活性测定,诸如本文描述的那些,用界定的感兴趣的底物在候选溶剂系统中测量特定的工程化转氨酶的酶促活性来容易地确定。
[0504] 在方法的一些实施方案中,适当的反应条件包括含水的共溶剂,其中该共溶剂包括聚合多元醇溶剂。适当的多元醇溶剂的实例包括,通过举例的方式而非限制,聚乙二醇、聚乙二醇甲醚、二甘醇二甲醚、三甘醇二甲醚、和聚丙二醇。在一些实施方案中,含水共溶剂包括聚乙二醇,其以不同的分子量可用。特别有用的是较低分子量聚乙二醇,诸如PEG200至PEG600。因此,在一些实施方案中,含水共溶剂包括约1%至约40%v/v、约1%至约40%v/v、约2%至约40%v/v、约5%至约40%v/v、约2%至约30%v/v、5%至约30%v/v、1%至约20%v/v、约2%至约20%v/v、约5%至约20%v/v、约1%至约10%v/v、约2%至约10%v/v的
PEG200。在一些实施方案中,适当的反应条件包括含水共溶剂,该含水共溶剂以以下包括
PEG200:约1%、2%、5%、10%、15%、20%;25%;30%;35%;35%或约40%v/v。
[0505] 在方法的一些实施方案中,适当的反应条件包括含水的共溶剂,其中该共溶剂以以下包括DMSO:约1%至约80%(v/v)、约1至约70%(v/v)、约2%至约60%(v/v)、约5%至约
40%(v/v)、10%至约40%(v/v)、10%至约30%(v/v)、或约10%至约20%(v/v)。在方法的一些实施方案中,适当的反应条件包括含水共溶剂,该含水共溶剂以以下包括DMSO:至少约
1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、
75%、或80%(v/v)。
[0506] 用于转氨基反应的反应物的量将一般取决于期望的产物的量、和伴随地使用的转氨酶底物的量而不同。本领域普通技术人员将容易地理解如何改变这些量以使它们适合期
望的水平的生产率和生产规模。
[0507] 在一些实施方案中,加入反应物的顺序不是关键的。可在相同的时间将反应物一起加到溶剂中(例如单相溶剂、双相含水共溶剂系统以及类似物),或可选地,反应物中的一些可以被单独地添加,并且一些反应物在不同的时间点一起添加。例如,辅因子、转氨酶和转氨酶底物可以被先加到溶剂中。
[0508] 可以多种不同的形式,包括粉末(例如冻干的、喷雾干燥的和类似粉末),溶液,乳液,悬浮液和类似形式向反应提供固体反应物(例如酶、盐、底物化合物等)。使用本领域普通技术人员已知的方法和装置可容易地冻干或喷雾干燥反应物。例如,蛋白溶液可在-80℃以小份冷冻,然后加到预冷的冻干室中,随后应用真空
[0509] 当含水的共溶剂系统被使用时,为了改进混合效率,转氨酶和辅因子可被首先加入并混合进入水相。然后可加入有机相并混合,随后加入转氨酶底物。可选地,在加入水相之前,转氨酶底物可以在有机相中预混合。
[0510] 通常允许转氨反应进行直到酮底物向胺产物的进一步转化不随反应时间显著变化,例如小于10%的底物被转化,或小于5%的底物被转化)。在一些实施方案中,允许反应进行直到存在底物酮向产物胺的完全或接近完全的转化。底物向产物转化可以使用已知的
方法通过检测底物和/或产物来监测。适合的方法包括气相色谱法、HPLC和类似方法。反应混合物中产生的手性胺产物的转化收率通常大于约50%,还可大于约60%,还可大于约
70%,还可大于约80%,还可大于90%并且还可大于约97%。在一些实施方案中,用于在适当的反应条件下使用工程化转氨酶多肽制备化合物(2)的方法导致在约48h或更短、约36h
或更短、约24h或更短、或甚至更短的时间内将至少约91%、92%、93%、94%、95%、96%、
97%、98%、99%或更大量酮底物,例如式(II)的化合物,转化至胺产物化合物例如式(I)的化合物。
[0511] 在方法的一些实施方案中,适当的反应条件包括至少约20g/L、30g/L、40g/L、50g/L、60g/L、70g/L、100g/L、或更多的底物载量,并且其中该方法导致在约48h或更短、约36h或更短、约24h或更短内将至少约91%、92%、93%、94%、95%、96%、97%、98%、99%或更大量的底物化合物转化至产物化合物。
[0512] 当在适当的反应条件下在该方法中使用时,本公开内容的工程化转氨酶多肽导致以至少90%、91%、92%、93%、94%、95%、97%、98、99%、99.1%、99.2%、99.3%、99.4%、
99.5%、99.6%、99.7%、99.8%、或99.9%.e.e的手性胺的对映体过量。
[0513] 在方法的另外的实施方案中,适当的反应条件可包括反应溶液的初始底物载量,然后该反应溶液被多肽接触。然后该反应溶液还随着时间以至少约1g/L/h、至少约2g/L/h、至少约4g/L/h、至少约6g/L/h、或更高的速率补充另外的底物化合物作为连续增加物。因
此,根据这些适当的反应条件,添加多肽至具有至少约20g/L、30g/L、或40g/L的初始底物载量的溶液。多肽的该添加然后随后是以约2g/L/h、4g/L/h、或4g/L/h的速率连续添加另外的底物至溶液,直到达到至少约30g/L、40g/L、50g/L、60g/L、70g/L、100g/L、150g/L、200g/L或更多的高的多的最终底物载量。因此,在方法的一些实施方案中,适当的反应条件包括将多肽添加至具有至少约20g/L、30g/L、或40g/L的初始底物载量的溶液中,然后以约2g/L/h、
4g/L/h、或6g/L/h的速率添加另外的底物至溶液中,直到达到至少约30g/L、40g/L、50g/L、
60g/L、70g/L、100g/L或更多的最终底物载量。该底物补充反应条件允许获得更高底物载
量,同时维持高速率将酮底物向胺产物至少约91%、92%、93%、94%、95%、96%、97%、
98%、99%或更大的转化。在方法的一些实施方案中,在以至少约0.5M、至少约1.0M、至少约
2.5M、至少约5M、至少约7.5M、至少约10.0M的浓度包含异丙胺或乙酸异丙胺的溶液中添加另外的底物。
[0514] 在方法的一些实施方案中,转氨反应可包括以下适当的反应条件:(a)以约5g/L至200g/L的底物载量;(b)约0.1至50g/L的转氨酶多肽;(c)约0.1至4M的异丙胺(IPM);(d)约
0.1至10g/L的磷酸吡哆醛(PLP)辅因子;(e)约6至9的pH;以及(f)约30℃至60℃的温度。
[0515] 在方法的一些实施方案中,转氨反应可包括以下适当的反应条件:(a)以约5至约20g/L的底物载量;(b)约0.05至2g/L的转氨酶多肽;(c)约1至10%v/v的PEG200;(d)约1至
2M的异丙胺(IPM);(e)约0.1至1g/L的磷酸吡哆醛(PLP)辅因子;(f)约0.1至约0.5M的三乙
醇胺(TEA);(g)约6至8的pH;以及(h)约45℃至55℃的温度。
[0516] 在方法的一些实施方案中,转氨反应可包括以下适当的反应条件:(a)约25至约100g/L的底物载量;(b)约0.5至10g/L的转氨酶多肽;(c)约1至10%v/v的PEG200;(d)约1至
2M的异丙胺(IPM);(e)约0.1至1g/L的磷酸吡哆醛(PLP)辅因子;(f)约0.1至约0.5M的三乙
醇胺;(g)约6至8的pH;以及(h)约45℃至55℃的温度。
[0517] 在一些实施方案中,进行另外的反应组分或另外的技术以补充反应条件。这些可包括采取措施以稳定或阻止酶的失活、减少产物抑制、和/或使反应平衡向产物胺形成转
移。
[0518] 因此,在用于制备胺,诸如手性胺的方法的一些实施方案中,可添加另外的量的氨基受体(达到饱和)和/或可连续地从反应混合物中除去形成的氨基受体(酮)。例如,溶剂桥或两相共溶剂系统可被用于除去提取液的胺产物,并且由此减少胺产物的抑制,且还将平衡移向产物形成(参见,例如,Yun和Kim,2008,Biosci.Biotechnol.Biochem.72(11):3030-
3033)。
[0519] 在方法的一些实施方案中,适当的反应条件包括还原型辅因子、烟酰胺腺嘌呤二核苷酸(NADH)的存在,其可用来限制转氨酶的失活(参见例如,van Ophem等人,1998,
Biochemistry 37(9):2879-88)。在这样的实施方案中,当NADH存在时,辅因子再生系统,诸如葡萄糖脱氢酶(GDH)和葡萄糖或甲酸脱氢酶和甲酸盐可被用于再生反应介质中的NADH。
[0520] 在一些实施方案中,方法还可包括当氨基基团被转移到氨基受体时,除去从氨基供体形成的羰基副产物。此类原位除去可降低逆反应的速率,使得正向反应占优势,并且更多底物然后被转化为产物。羰基副产物的除去可以以许多方式进行。当氨基供体是氨基酸,诸如丙氨酸时,羰基副产物是酮酸,可通过与过氧化物反应而被除去(参见,例如,美国
2008/0213845,通过引用并入本文)。可使用的过氧化物包括过氧化氢;过氧酸类(过酸)诸如过乙酸(CH3CO3H)、三氟过乙酸和间氯过氧苯甲酸;有机过氧化物诸如叔丁基过氧化物
((CH3)3COOH)或其他选择性氧化剂诸如四丙基高钌酸铵、MnO2、KMnO4、四氧化钌和相关化合物以及其他。可选地,丙酮酸盐的去除可通过利用乳酸脱氢酶将其还原为乳酸盐来实现,以将平衡转向产物胺(参见,例如,Koszelewski等人,2008,Adv.Syn.Catal.350:2761-2766)。
丙酮酸盐的去除还可通过利用丙酮酸脱羧酶(参见,例如, 等人,2008,Chem BioChem 
9:363-365)或乙酰乳酸合酶(参见,例如,上述Yun和Kim)将其脱羧来实现。
[0521] 可选地,在氨基酸用作氨基供体的实施方案中,酮酸羰基副产物可通过使用适当的脱氢酶例如氨基酸脱氢酶在氨基供体诸如氨的存在下与氨和NADH反应来再循环为氨基
酸,从而补充氨基供体。
[0522] 在一些实施方案中,当氨基供体的选择产生具有比水的蒸气压高的蒸气压的羰基副产物(例如,低沸点副产物诸如挥发性有机羰基化合物)时,羰基副产物可通过用非反应
性气体喷射反应溶液,或通过施加真空来降低反应压力,并除去气相中存在的羰基副产物
来除去。非反应性气体是不与反应组分起反应的任何气体。各种非反应性气体包括氮气和
稀有气体(例如,惰性气体)。在一些实施方案中,非反应性气体是氮气。在一些实施方案中,该方法中使用的氨基供体是异丙胺(IPM),其在向氨基受体转移氨基之后形成羰基副产物
丙酮。丙酮可通过用氮气喷射或向反应溶液施加真空,并通过丙酮阱诸如冷凝器或其他冷
阱从气相除去丙酮来除去。可选地,丙酮可通过使用转氨酶还原为异丙醇来除去。
[0523] 在以上除去羰基副产物的方法的一些实施方案中,在氨基转移反应期间可加入相应氨基供体以补充氨基供体和/或维持反应的pH。补充氨基供体还将平衡转移向产物形成,由此增加底物向产物的转化率。因此,在氨基供体是异丙胺并且丙酮产物被原位除去的一
些实施方案中,可向溶液加入异丙胺以补充丙酮除去期间失去的氨基供体并维持反应的
pH。
[0524] 在另外的实施方案中,任何以上描述的用于将底物化合物转化为产物化合物的方法还可包括选自以下的一种或更多种步骤:产物化合物的提取、分离、纯化、和结晶。用于从通过以上公开的方法产生的生物催化反应混合物中提取、分离、纯化、和/或结晶产物胺的方法、技术和试验方案是普通技术人员已知的和/或通过常规实验可获得的。另外,例证性的方法在下面的实施例中提供。
[0525] 本公开内容的各种特征和实施方案在以下代表性实施例中被说明,代表性实施例意图是说明性的而非限制性的。
[0526] 6.实施例
[0527] 实施例1:工程化转氨酶多肽的合成、优化和筛选
[0528] 基因合成与优化:编码来自SEQ ID NO:2的河流弧菌的经报道的野生型ω-转氨酶多肽的多核苷酸序列被密码子优化并合成为SEQ ID NO:1的基因。将SEQ ID NO:1的合成的
基因克隆进入pCK110900载体系统(参见例如,美国专利申请公布20060195947,该申请在此通过应用并入本文)并且随后于大肠杆菌W3110fhuA中表达。大肠杆菌W3110在lac启动子的
控制下表达转氨酶多肽作为细胞内蛋白。编码SEQ ID NO:4的工程化转氨酶多肽的多核苷
酸(SEQ ID NO:3)通过定向进化密码子优化的基因SEQ ID NO:1来获得。相对于SEQ ID NO:
2,SEQ ID NO:4的多肽具有24个氨基酸残基差异(A9T;G18A;D21H;V31M;N45H;F86Y;A133R;
R146L;W147K;V153S;K163F;V177L;R211K;P233T;A235P;P244T;M294V;P318D;A323T;
S324G;A383V;T391A;C424A;和F427Y)。该合成的基因SEQ ID NO:3(编码SEQ ID NO:4的多肽)被用作起始骨架用于使用定向进化的标准方法经由通过基因合成的迭代变体文库产
生,随后筛选和测序匹配(hits)来进一步优化以产生编码能够以相对于SEQ ID NO:2和4的
多肽的增强的酶特性将化合物(2)转化为化合物(1)的工程化转氨酶的基因。所得的工程化
转氨酶多肽序列和特定突变及相对活性列于表2A中。
[0529] 实施例2:生产工程化转氨酶
[0530] 工程化转氨酶多肽在宿主大肠杆菌W3110中作为在lac启动子的控制下表达的细胞内蛋白产生。多肽主要累积为可溶性的细胞溶质的活性酶(soluble cytosolic active 
enzyme)。摇瓶程序用于产生工程化多肽粉,其可在本文公开的活性测定或生物催化方法中使用。
[0531] 高通量生长与表达。细胞被挑选并在30℃,200rpm,85%湿度的培养条件下在包含1%葡萄糖和30μg/ml氯霉素(CAM)的LB培养基中生长过夜。将过夜生长的20μl等分部分转移至包含380μl的包含30μg/ml CAM、1mM IPTG的2xYT生长培养基的深孔板,且在30℃,
200rpm,和85%湿度下温育持续~18h。传代培养TB培养基由TB培养基(380μl/孔)、30μg/ml CAM、和1mM IPTG组成。细胞培养物以4000rpm、4℃离心10min,并丢弃培养基。将细胞团再悬浮在250或400μl溶解缓冲液(0.1M三乙醇胺(TEA)缓冲液、pH 9.0,包含400μg/ml PMBS和
500μg/ml溶菌酶)中,如以下所述。
[0532] 生产摇瓶粉(SFP)。摇瓶程序用于产生在本文公开的二次筛选测定或生物催化方法中使用的工程化转氨酶多肽粉。摇瓶粉(SFP)包括大约30%总蛋白并因此提供与HTP测定
中使用的细胞溶解产物相比更纯化的工程化酶制剂。将包含编码感兴趣的工程化转氨酶的
质粒的大肠杆菌的单菌落接种到包含30μg/ml氯霉素和1%葡萄糖的50mL Luria Bertani
肉汤中。细胞在培养箱(incubator)中在30℃下以250rpm摇动生长过夜(至少16小时)。将培养物稀释到1升烧瓶中包含30μg/ml氯霉素的250mL Terrific Broth(12g/L细菌用胰蛋白
胨、24g/L酵母提取物、4mL/L甘油、65mM磷酸钾,pH 7.0、1mM MgSO4)中,至600nm的光密度(OD600)为0.2,并允许在30℃生长。当培养物的OD600是0.6至0.8时,通过加入异丙基-β-D-硫代半乳糖苷(“IPTG”)至终浓度1mM来诱导转氨酶基因的表达。然后培养持续过夜(至少16小时)。通过离心(5000rpm、15min、4℃)收获细胞,并丢弃上清液。将细胞团块用等体积的冷(4℃)100mM三乙醇胺(氯化物)缓冲液,pH 7.0再悬浮,并如以上通过离心来收获。洗涤的细胞再悬浮于两体积的冷三乙醇胺(氯化物)缓冲液中,并且以12,000psi经过French Press
两次,同时保持在4℃。通过离心(9000rpm、45分钟、4℃)除去细胞碎片。收集澄清的溶解产物上清液,并储存在-20℃。冷冻的澄清溶解产物的冷冻干燥提供了粗制转氨酶多肽的干摇瓶粉。可选地,细胞团块(洗涤前或洗涤后)可储存在4℃或-80℃。
[0533] 生产下游处理(DSP)粉。DSP包括大约80%总蛋白并因此提供与高通量测定中使用的细胞溶解产物相比更纯化的工程化转氨酶制剂。用于生产DSP粉的工程化转氨酶的较大
规模(~100-120g)发酵可作为短分批进行,随后根据标准生物加工方法通过进料分批法进
行。简言之,通过添加IPTG至1mM的最终浓度来诱导转氨酶表达。在发酵之后,收获细胞,并将其再悬浮在100mM三乙醇胺-H2SO4缓冲液中,然后通过匀化而被机械破裂。细胞碎片和核酸用聚乙烯亚胺(PEI)絮凝,并通过离心使悬浮液澄清。使用切向横流超滤膜浓缩所产生的澄清上清液以除去盐和水。然后浓缩的和部分纯化的酶浓缩物可在冷冻干燥器中干燥并被
包装(例如,在聚乙烯容器中)。
[0534] 实施例3:分析程序
[0535] HTP反应的HPLC分析:对淬灭反应的等分部分在以下条件下进行HPLC分析。
[0536]
[0537] 化合物(2)至化合物(1)的转化由产生的色谱图来如下确定:
[0538] 转化率(%)=产物面积/(产物面积+底物面积x0.73)x100%
[0539] 5mL和100mL规模反应的HPLC分析:对淬灭反应的等分部分在以下条件下进行HPLC分析。
[0540]
[0541]
[0542] 化合物(2)至化合物(1)的转化由色谱图来如下确定:
[0543] 转化率(%)=产品面积/(产物面积+底物面积x0.73)x100%
[0544] 确定产物手性纯度(%ee):化合物(1)的手性纯度或对映体过量使用以下条件通过HPLC来评估。
[0545]
[0546] 确定产物纯度:产物纯度使用以下条件通过HPLC来确定。
[0547]
[0548] 实施例4:高通量(HTP)筛选用于将化合物(2)转化至化合物(1)的转氨酶
[0549] HTP筛选测定:用于指导变体的主要筛选的高通量筛选在96孔板中使用细胞溶解产物在以下测定条件下进行:10g/L化合物(2);1mM吡哆醛磷酸(PLP);2M异丙胺(IPM),pH 
7.0;0.1M三乙醇胺(TEA),pH 7;5%v/v PEG200;10μL溶解产物;和50℃或55℃。
[0550] 为了制备溶解产物,细胞如以上所述生长在96孔板中,并且溶解产物通过分配250μL(用于第1轮)或400μL(用于第2轮)的溶解缓冲液(1mg/mL溶菌酶、0.5mg/mL硫酸多粘菌素B、1mM PLP、0.1M三乙醇胺(TEA),pH 7.0)进入各孔来制备。将板密封、振摇2h,并且然后以
4,000rpm、4℃离心20min以沉淀细胞碎片。
[0551] 将10μL的贮备底物溶液(200g/L溶解于PEG200中的化合物(2))添加至96孔板的各孔,随后是180μL的异丙胺(IPM)/吡哆醛磷酸(PLP)的贮备溶液(100mM TEA中的2.2M IPM和
1.06mM PLP,pH 7.0)。为了评估对产物化合物(1)抑制的耐受性,将化合物(1)添加至反应混合物至最终14g/L用于第1轮测定并且16g/L用于第2轮测定。反应通过添加10μL的细胞溶解产物/孔来启动。将板密封,并在50℃或55℃下以震摇温育24h。反应用600μL的乙腈来淬灭,并且样品通过HPLC来检查,如实施例3中所述的。
[0552] 实施例5:用于在5mL规模中将化合物(2)转化为化合物(1)的方法
[0553] 如下进行5ml规模反应。将0.75mL(或在10%v/v PEG 200浓度的情况下0.5mL)的100mM TEA buffer(pH 7.0)添加至配备了十字形的磁性搅拌棒的20mL玻璃小瓶中。将2mL
的5M IPM·HCl贮备溶液添加至小瓶,随后是1mL的5mM PLP贮备溶液。以500rpm搅动(磁搅
动)混合物。然后使用1M NaOH溶液将混合物的pH调整至7。然后将固体底物125mg(或250mg
对于50g/L,或500mg对于100g/L浓度)添加至小瓶。然后将0.25mL(或0.5mL对于10%v/v)
PEG 200添加至混合物。组分的终浓度为:25g/L(或50或100g/L)的化合物(2);1mM PLP;2M IPM;5%v/v(或10%)PEG 200;2g/L转氨酶制品;和100mM TEA,pH 7.0。然后将混合物搅动并加热至50℃。
[0554] 反应通过添加1mL的酶贮备溶液(10g/L)来启动。在不同的时间点采取20μL的等分部分并用750μL甲醇稀释,且通过HPLC进行分析。24h后,反应混合物用5mL乙腈来淬灭,并通过HPLC分析样品以获得最终%转化。
[0555] 实施例6:用于在100mL规模中将化合物(2)转化为化合物(1)的方法
[0556] 如下进行100ml规模反应。将15mL的100mM TEA缓冲液(pH 7)添加至具有锚形搅拌叶的250mL圆底烧瓶中。将40mL的5M IPM·HCl贮备溶液添加至圆底烧瓶,随后是20mL的5mM PLP贮备溶液。以100rpm搅拌混合物(顶置式搅拌),并使用10M NaOH将pH调整至7。然后伴随搅拌经~5min将固体底物化合物(2)添加至圆底烧瓶。然后添加PEG200(5mL),并将混合物
加热至50℃。然后添加20mL的酶贮备溶液(10g/L)以启动反应。以200rpm搅动(顶置式搅动)反应。在不同的时间点采取20μL的等分部分并用750μL甲醇稀释,且通过HPLC进行分析。在某些情况下,24h后,反应混合物用100mL乙腈来淬灭,并通过HPLC分析样品以获得最终%转化。最终反应条件为:底物化合物(2),25g/L(或50或100g/L);1mM PLP;2M IPM;5%v/v PEG200;2g/L的转氨酶;和100mM TEA,pH 7。底物至产物的转化通过HPLC进行分析,如实施例3中所述。
[0557] 产物处理:在以上描述的条件下反应24h后,将反应混合物冷却至室温,并然后通过具有滤纸片(Whatman 1,孔径11μm)的标准G4烧结玻璃漏斗过滤。用20mL去离子水冲洗圆底烧瓶,然后将其通过同一漏斗过滤。用20mL去离子水洗涤过滤的滤饼两次。使用5M HCl溶液将滤液的pH从6.8调整至3。然后将滤液转移进入分液漏斗并用100mL MTBE进行萃取。允
许两相混合物分离。丢弃包含未反应底物和杂质的MTBE层。将水层转移进入烧杯,并添加
100mL MTBE。使用10M NaOH溶液将水层的pH从3调整至10。将混合物转移进入分液漏斗并且使相分离。然后用100mL MTBE萃取水层直到产物不存在于水层(~三次萃取)。将来自萃取
的MTBE相合并并使用旋转蒸发器蒸干。将粗制产物在真空下进一步干燥48h。
[0558] 在本申请中引用的所有出版物、专利、专利申请和其他文件出于所有目的均通过引用以其整体并入本文,其程度如同分别指出将每个单独的出版物、专利、专利申请或其它文件出于所有目的通过引用并入一样。
[0559] 尽管已经阐释和描述了各种具体实施方案,但应理解可以作出各种改变而不背离本发明的精神和范围。
QQ群二维码
意见反馈