首页 / 国际专利分类库 / 化学;冶金 / 生物化学;啤酒;烈性酒;果汁酒;醋;微生物学;酶学;突变或遗传工程 / 工程化亚胺还原酶以及用于酮和胺化合物的还原胺化的方法

工程化亚胺还原酶以及用于和胺化合物的还原胺化的方法

申请号 CN201380037039.4 申请日 2013-05-09 公开(公告)号 CN104428313B 公开(公告)日 2017-11-17
申请人 科德克希思公司; 发明人 陈海滨; 杰弗里·穆尔; 史蒂文·J·科利尔; 德里克·史密斯; 约瓦娜·纳佐尔; 格雷戈里·休斯; 雅各布·杰恩; 吉伽特; 哈思曼; 斯科特·诺维克; 尼古拉斯·阿加德; 奥斯卡·阿尔维左; 乔治·科普; 杨万林; 乔利·苏库玛兰; 斯特法妮·额·迈纳;
摘要 本公开内容提供了具有亚胺还原酶活性的工程化多肽、编码该工程化亚胺还原酶的多核苷酸、能够表达该工程化亚胺还原酶的宿主细胞、以及使用这些工程化多肽与一系列 酮 和胺底物化合物制备仲胺和叔胺产物化合物的方法。
权利要求

1.一种具有亚胺还原酶活性的工程化多肽,所述工程化多肽的基酸序列与SEQ ID NO:2的序列相比存在以下残基差异:X292C/G/I/P/S/T/V/Y,其中所述氨基酸序列选自由以下组成的组的序列:SEQ ID NO:56、58、62、66、68、70、72、74、88、90、92、96、98和100以及SEQ ID NO:112-750的偶数序列标识符。
2.如权利要求1所述的工程化多肽,其中所述工程化多肽的氨基酸序列与SEQ ID NO:2的序列相比存在选自以下的残基差异组合:
(a)X111M、X156T、X198H、X259M、X280L、X292V和X293H;
(b)X156T、X197P、X198H、X259H、X280L、X292P和X293H;
(c)X111M、X136G、X156S、X197I、X198H、X201L、X259H、X280L、X292V和X293H;
(e)X156T、X197I、X198E、X201L、X259H、X280L、X292V和X293H;
(f)X111M、X136G、X198H、X259M、X280L、X292S和X293H;以及
(g)X156V、X197P、X198E、X201L、X259M、X280L和X292T。
3.如权利要求1所述的工程化多肽,所述工程化多肽能够在适当的反应条件下将底物化合物(1b)环己
和底物化合物(2a)L-正缬氨酸
转化为产物化合物(3c),(S)-2-(环己基氨基)戊酸,
4.如权利要求2所述的工程化多肽,其中所述工程化多肽的氨基酸序列与SEQ ID NO:2的序列相比存在选自以下的残基差异组合:
(a)X111M、X156T、X198H、X259M、X280L、X292V和X293H;
(b)X156T、X197P、X198H、X259H、X280L、X292P和X293H;
(e)X156T、X197I、X198E、X201L、X259H、X280L、X292V和X293H;以及
(g)X156V、X197P、X198E、X201L、X259M、X280L和X292T,并且
所述工程化多肽能够在适当的反应条件下将底物化合物(1b)环己酮,
和底物化合物(2b)丁胺
转化为产物化合物(3d),N-丁基环己胺,
5.如权利要求1所述的工程化多肽,其中所述工程化多肽的氨基酸序列与SEQ ID NO:2的序列相比存在残基差异X156T、X197I、X198E、X201L、X259H、X280L、X292V和X293H的组合,和至少选自以下的残基差异组合:
(a)X29R、X184R、X223T、X261S、X284M和X287T;
(b)X29R、X157R、X184Q、X220H、X223T、X232A、X261I、X284M、X287T、X288S、X324L、X332V和X353E;
(c)X29R、X157R、X184Q、X220H、X223T、X232A、X259V、X261I、X284M、X287T、X288S、X324L、X332V和X353E;
(d)X29R、X94K、X111R、X137N、X157R、X184Q、X220H、X223T、X232A、X259V、X261I、X279V、X284M、X287T、X288S、X324L、X332V和X353E;以及
(e)X29R、X94K、X111R、X137N、X157R、X184Q、X220H、X223T、X232A、X259V、X261I、X266T、X279V、X284M、X287T、X288S、X295S、X311V、X324L、X328E、X332V和X353E。
6.如权利要求1所述的工程化多肽,所述工程化多肽能够在适当的反应条件下将底物化合物(1i),
和底物化合物(2b)
转化为产物化合物(3d)
7.如权利要求1所述的工程化多肽,所述工程化多肽能够在适当的反应条件下将底物化合物(1j),
和底物化合物(2b)
转化为产物化合物(3o),
8.一种多核苷酸,所述多核苷酸编码权利要求1至7的任一项所述的工程化多肽。
9.如权利要求8所述的多核苷酸,其中所述多核苷酸是选自由以下组成的组的核酸序列:SEQ ID NO:55、57、61、65、67、69、71、73、87、89、91、95、97和99以及SEQ ID NO:111-749的奇数序列标识符。
10.一种表达载体,所述表达载体包含权利要求8或9所述的多核苷酸。
11.一种宿主细胞,所述宿主细胞包含权利要求8或9所述的多核苷酸或权利要求10所述的表达载体。
12.一种制备具有亚胺还原酶活性的工程化多肽的方法,所述方法包括在适合于表达所述工程化多肽的条件下培养权利要求11所述的宿主细胞,任选地还包括分离所述工程化多肽。
13.一种用于制备式(III)的胺化合物的方法,
其中
R1和R2基团独立地选自氢原子,和任选地取代的烷基、烯基、炔基、烷基、羧基、氨基羰基、杂烷基、杂烯基、杂炔基、羧基烷基、氨基烷基、卤代烷基、烷基硫代烷基、环烷基、芳基、芳基烷基、杂环基、杂芳基和杂芳基烷基;且任选地R1与R2连接以形成3元至10元环;
R3和R4基团独立地选自氢原子,以及任选地取代的烷基、烯基、炔基、烷氧基、羧基、氨基羰基、杂烷基、杂烯基、杂炔基、羧基烷基、氨基烷基、卤代烷基、烷基硫代烷基、环烷基、芳基、芳基烷基、杂环烃基、杂芳基和杂芳基烷基,条件是R3和R4两者不能同时是氢;且任选地R3和R4连接以形成3元至10元环;以及
任选地,由*指示的原子和/或氮原子是手性的;
所述方法包括在适当的反应条件下在辅因子的存在下使
式(I)的化合物,
其中
R1、和R2如以上所定义;
以及
式(II)的化合物,
其中
R3、和R4如以上所定义;
与具有亚胺还原酶活性的工程化多肽接触,其中所述工程化多肽是:
(b)权利要求1至7的任一项所述的工程化多肽。
3 4
14.如权利要求13所述的方法,其中R和R连接以形成3元至10元环。
15.如权利要求13所述的方法,其中所述式(II)的化合物选自甲胺、二甲胺、异丙胺、丁胺、异丁胺、L-正缬氨酸、苯胺、(S)-2-氨基戊-4-烯酸、吡咯烷、和羟基吡咯烷。
16.如权利要求13所述的方法,其中式(I)的化合物的R1和R2的至少一个与式(II)的化
3 4
合物的R和R的至少一个连接,由此用于制备式(III)的胺化合物的方法包括分子内反应。
17.如权利要求13所述的方法,其中所述适当的反应条件包括
(a)10g/L至100g/L的底物载量;
(b)0.1g/L至50g/L的所述工程化多肽;
(c)0.05g/L至2.5g/L的NAD(P)H;
(d)6至10的pH;
(e)20℃至50℃的温度;以及
(f)2-120小时的反应时间。

说明书全文

工程化亚胺还原酶以及用于和胺化合物的还原胺化的方法

技术领域

[0001] 本公开内容涉及对于将各种酮和胺底物向仲胺和叔胺产物的转化有用的具有亚胺还原酶活性的工程化多肽。
[0002] 对序列表、表格或计算机程序的引用
[0003] 序列表的正式文本作为ASCII格式文本文件与说明书经EFS-Web同时被提交,文件名为“CX2-120US2_ST25.txt”,创建日期为2013年5月8日,且大小为1,729,414字节。经EFS-Web提交的序列表为本说明书的一部分,并且通过引用以其整体并入本文。

背景技术

[0004] 手性仲胺和叔胺是制药工业中的重要合成砌(building block)。不存在生产此类手性胺化合物的已知的有效生物催化路径。现有的化学方法使用手性试剂或多步合
成。
[0005] 存在很少有关仲胺的生物催化合成的文献的报道。报道厌细菌伍氏醋酸杆菌(Acetobacterium woodii)的完整细胞亚胺还原酶活性还原亚苄基亚胺和亚丁基亚胺
(Chadha,等人,2008,Tetrahedron:Asymmetry.19:93-96)。使用伍氏醋酸杆菌的完整细胞的另一个报道使用在含介质中的苯甲或丁醛和丁胺或苯胺(Stephens等人,2004,
Tetrahedron.60:753-758)。报道链霉菌Streptomyces sp.GF3587和GF3546立体选择性地
还原2-甲基-1-吡咯啉(Mitsukara等人,2010,Org.Biomol.Chem.8:4533-4535)。
[0006] 在开发用于该类型反应的生物催化路径中的一个挑战是鉴定可被工程化以提供在工业适用条件下有效地进行此类反应的酶种类。冠瘿脱氢酶(opine dehydrogenase)
是使用NADH或NADPH作为辅因子的作用于CH-NH键的一类氧化还原酶。冠瘿碱脱氢酶的天然
反应是α-酮酸基酸的还原胺化。已鉴定了编码具有冠瘿碱脱氢酶种类的特征活性的酶的具有一定同源性的至少五个天然存在的基因。这五种酶包括:来自节杆菌Arthrobacter Sp.菌株1C的冠瘿碱脱氢酶(CENDH)、来自欧洲大扇贝(Pecten maximus)(大扇贝(great 
scallop))的章鱼碱脱氢酶(OpDH)、乳酸乳球菌(Lactococcus lactis)K1的氨酸合酶
(CEOS)、来自斗笠螺(Cellana grata)的β-丙氨酸冠瘿碱(β-alanine opine)脱氢酶
(BADH)、和来自寄居蟹皮海绵(Suberites domuncula)的磺奥品(tauropine)脱氢酶
(TauDH)。已确认了冠瘿碱脱氢酶CENDH的晶体结构(参见Britton等人,“Crystal 
structure and active site location of N-(1-D-carboxyethyl)-L-norvaline 
dehydrogenase,”Nat.Struct.Biol.5(7):593-601(1998))。已知另一种酶,来自恶臭假单胞菌(Pseudomonas putida)的N-甲基L-氨基酸脱氢酶(NMDH)具有与冠瘿碱脱氢酶类似的
活性,与α-酮酸和烷基胺反应,但显示与冠瘿碱脱氢酶和氨基酸脱氢酶的很少或没有序列同源性。NMDH已表征为属于NAD(P)依赖的氧化还原酶的超家族(superfamily)(参见例如,
US 7,452,704B2;Esaki等人,FEBS Journal 2005,272,1117-1123)。
[0007] 本领域中存在对用于合成手性仲胺和叔胺的生物催化剂以及在工业适用条件下使用该生物催化剂的方法的需要。
发明内容
[0008] 本公开内容提供了用于通过使用未激活的酮和未激活的胺作为底物的直接还原胺化合成手性仲胺和叔胺的新颖生物催化剂以及使用该新颖生物催化剂的相关的方法。本
公开内容的生物催化剂是源自来自节杆菌Arthrobacter sp.菌株1C的野生型基因的工程
化多肽变体,该野生型基因编码具有SEQ ID NO:2的氨基酸序列的冠瘿碱脱氢酶。这些工程化多肽能够催化酮(包括未激活的酮底物诸如环己酮和2-戊酮)或醛底物,与伯胺或仲胺底
物(包括未激活的胺底物诸如丁胺、苯胺、甲胺、和二甲胺)的转化以形成仲胺或叔胺产物化合物。提及了源自冠瘿碱脱氢酶的这些工程化多肽的酶活性,且本文公开的工程化酶还称
为“亚胺还原酶(imine reductase)”或“IRED”。IRED的一般亚胺还原酶活性示于以下方案1中。
[0009] 方案1
[0010]
[0011] 本公开内容的具有亚胺还原酶活性的工程化多肽可接受宽范围的底物。因此,在方案1的生物催化反应中,式(I)的底物的R1和R2基团独立地选自氢原子,或任选地取代的烷基、烯基、炔基、烷氧基、羧基、氨基羰基、杂烷基、杂烯基、杂炔基、羧基烷基、氨基烷基、卤代烷基、烷基硫代烷基、环烷基、芳基、芳基烷基、杂环基、杂芳基和杂芳基烷基;且式(II)的底物的R3和R4基团独立地选自氢原子,以及任选地取代的烷基、烯基、炔基、烷氧基、羧基、氨基羰基、杂烷基、杂烯基、杂炔基、羧基烷基、氨基烷基、卤代烷基、烷基硫代烷基、环烷基、芳基、芳基烷基、杂环烃基、杂芳基和杂芳基烷基,条件是R3和R4两者不能同时是氢(both 
R3and R4cannot be hydrogen)。任选地,式(I)的底物的R1和R2基团与式(II)的底物的R3和R4基团的任一个或两个可以连接以形成3元至10元环。此外,方案1的生物催化反应可以是
分子内反应,其中式(I)的化合物的R1和R2基团的至少一个与式(II)的化合物的R3和R4的至少一个连接。另外,式(III)的产物化合物中由*指示的原子和/或氮原子中的一个或两个可以是手性的。如本文进一步描述的,具有亚胺还原酶活性的工程化多肽展示立体选择性,因此方案1的亚胺还原酶反应可用于在单一生物催化反应中建立式(III)的产物化合物的
一个、两个、或更多个手性中心。
[0012] 在一些实施方案中,本公开内容提供了具有亚胺还原酶活性的工程化多肽,所述工程化多肽包括具有与选自由以下组成的组的天然存在的冠瘿碱脱氢酶氨基酸序列的至
少80%序列同一性的氨基酸序列:SEQ ID NO:2、102、104、106、108、和110,并且还包括与选择的天然存在的冠瘿碱脱氢酶的氨基序列相比一个或更多个残基差异。在源自冠瘿碱脱氢
酶的工程化多肽的一些实施方案中,亚胺还原酶活性是以下的活性:方案1,任选地,如表2中公开的反应,以及任选地,将化合物(1b)和化合物(2b)转化为产物化合物(3d)的反应。
[0013] 在一些实施方案中,本公开内容提供了具有亚胺还原酶活性的工程化多肽,所述工程化多肽包括具有与SEQ ID NO:2的至少80%序列同一性和与SEQ ID NO:2的序列相比
在选自以下残基位置上的一个或更多个残基差异的氨基酸序列:X111、X136、X156、X197、X198、X201、X259、X280、X292、和X293。在一些实施方案中,残基差异选自X111M/Q/S、X136G、X156G/I/Q/S/T/V、X197I/P、X198A/E/H/P/S、X201L、X259E/H/I/L/M/S/T、X280L、X292C/G/I/P/S/T/V/Y、和X293H/I/K/L/N/Q/T/V。在一些实施方案中,工程化多肽包括与SEQ ID NO:
2的序列相比在残基位置X198上的残基差异,其中任选地在位置X198上的残基差异选自
X198A、X198E、X198H、X198P、和X198S。在一些实施方案中,工程化多肽包括具有选自X198E、和X198H的位置X198上的残基差异的氨基酸序列。在一些实施方案中,工程化多肽的氨基酸
序列包括至少选自以下的残基差异组合(at  least a combination of residue 
differences selected from):(a)X111M、X156T、X198H、X259M、X280L、X292V、和X293H;(b)X156T、X197P、X198H、X259H、X280L、X292P、和X293H;(c)X111M、X136G、X156S、X197I、X198H、X201L、X259H、X280L、X292V、和X293H;(d)X197I、X198E、X259M、和X280L;(e)X156T、X197I、X198E、X201L、X259H、X280L、X292V、和X293H;(f)X111M、X136G、X198H、X259M、X280L、X292S、和X293H;以及(g)X156V、X197P、X198E、X201L、X259M、X280L、和X292T。
[0014] 在一些实施方案中,本公开内容提供了具有亚胺还原酶活性的工程化多肽,所述工程化多肽包括具有与SEQ ID NO:2的至少80%序列同一性和与SEQ ID NO:2的序列相比
在选自以下残基位置上的一个或更多个残基差异的氨基酸序列:X111、X136、X156、X197、X198、X201、X259、X280、X292、和X293(如以上描述的),并且还包括与SEQ ID NO:2的序列相比在选自以下位置上的一个或更多个残基差异:X4、X5、X14、X20、X29、X37、X67、X71、X74、X82、X94、X97、X100、X111、X124、X137、X141、X143、X149、X153、X154、X157、X158、X160、X163、X177、X178、X183、X184、X185、X186、X220、X223、X226、X232、X243、X246、X256、X258、X259、X260、X261、X265、X266、X270、X273、X274、X277、X279、X283、X284、X287、X288、X294、X295、X296、X297、X308、X311、X323、X324、X326、X328、X332、X353、和X356。在一些实施方案中,这些进一步残基差异选自X4H/L/R、X5T、X14P、X20T、X29R/T、X37H、X67A/D、X71C/V、X74R、X82P、X94K/R/T、X97P、X100W、X111R、X124L/N、X137N、X141W、X143W、X149L、X153V/Y、X154F/M/Q/Y、X157D/H/L/M/N/R、X158K、X160N、X163T、X177C/H、X178E、X183C、X184K/Q/R、X185V、X186K/R、X220D/H、X223T、X226L、X232A/R、X243G、X246W、X256V、X258D、X259V/W、X260G、X261A/G/I/K/R/S/T、X265G/L/Y、X266T、X270G、X273W、X274M、X277A/I、X279F/L/V/Y、X283V、X284K/L/M/Y、X287S/T、X288G/S、X294A/I/V、X295R/S、X296L/N/V/W、X297A、X308F、X311C/T/V、X323C/I/M/T/V、X324L/T、X326V、X328A/G/E、X332V、X353E、X356R。
[0015] 在一些实施方案中,本公开内容提供了具有亚胺还原酶活性的工程化多肽,所述工程化多肽包括具有与SEQ ID NO:2的至少80%序列同一性和与SEQ ID NO:2的序列相比
在选自以下残基位置上的一个或更多个残基差异的氨基酸序列:X111、X136、X156、X197、X198、X201、X259、X280、X292、和X293(如以上描述的),并且还包括至少选自以下的残基差异组合:(a)X29R、X184R、X223T、X261S、X284M、和X287T;(b)X29R、X157R、X184Q、X220H、X223T、X232A、X261I、X284M、X287T、X288S、X324L、X332V、和X353E;(c)X29R、X157R、X184Q、X220H、X223T、X232A、X259V、X261I、X284M、X287T、X288S、X324L、X332V、和X353E;(d)X29R、X94K、X111R、X137N、X157R、X184Q、X220H、X223T、X232A、X259V、X261I、X279V、X284M、X287T、X288S、X324L、X332V、和X353E;以及(e)X29R、X94K、X111R、X137N、X157R、X184Q、X220H、X223T、X232A、X259V、X261I、X266T、X279V、X284M、X287T、X288S、X295S、X311V、X324L、X328E、X332V、和X353E。
[0016] 在一些实施方案中,本公开内容提供了具有亚胺还原酶活性的工程化多肽,所述工程化多肽包括具有与SEQ ID NO:2的至少80%序列同一性和残基差异X156T、X197I、
X198E、X201L、X259H、X280L、X292V、和X293H的组合的氨基酸序列,并且还包括选自以下的一个或更多个残基差异:X29R/T、X94K/R/T、X111R、X137N、X157D/H/L/M/N/R、X184K/Q/R、X220D/H、X223T、X232A/R、X259V/W、X261A/G/I/K/R/S/T、X266T、X279F/L/V/Y、X284K/L/M/Y、X287S/T、X288G/S、X295S、X311V、X324L/T、X328E、X332V、和X353E。在一些实施方案中,序列包括残基差异X156T、X197I、X198E、X201L、X259H、X280L、X292V、和X293H的组合,并且还包括至少选自以下的残基差异组合:(a)X29R、X184R、X223T、X261S、X284M、和X287T;(b)X29R、X157R、X184Q、X220H、X223T、X232A、X261I、X284M、X287T、X288S、X324L、X332V、和X353E;(c)X29R、X157R、X184Q、X220H、X223T、X232A、X259V、X261I、X284M、X287T、X288S、X324L、X332V、和X353E;(d)X29R、X94K、X111R、X137N、X157R、X184Q、X220H、X223T、X232A、X259V、X261I、X279V、X284M、X287T、X288S、X324L、X332V、和X353E;以及(e)X29R、X94K、X111R、X137N、X157R、X184Q、X220H、X223T、X232A、X259V、X261I、X266T、X279V、X284M、X287T、X288S、X295S、X311V、X324L、X328E、X332V、和X353E。
[0017] 在一些实施方案中,具有亚胺还原酶活性的工程化多肽包括具有与偶数序列标识符SEQ ID NO:4–100和112-750的序列的70%、80%、85%、90%、95%、97%、98%、99%、或更大同一性的氨基酸序列。
[0018] 在另一个方面,本公开内容提供了编码本文公开的具有亚胺还原酶活性的任何工程化多肽的多核苷酸。示例性多核苷酸序列提供于通过引用并入本文的序列表中并且包括
奇数序列标识符SEQ ID NO:3–99和111-749的序列。
[0019] 在另一个方面,编码本公开内容的具有亚胺还原酶活性的工程化多肽的多核苷酸可掺入进表达载体和宿主细胞用于表达多核苷酸和相应的编码多肽。同样地,在一些实施
方案中,本公开内容提供了通过将包含能够表达本公开内容的工程化多肽的多核苷酸或表
达载体的宿主细胞在适合于表达该多肽的条件下培养而制备工程化多肽的方法。在一些实
施方案中,制备亚胺还原酶多肽的方法可包括分离表达的多肽的另外步骤。
[0020] 在一些实施方案中,本公开内容还提供了制造具有亚胺还原酶活性的工程化多肽的方法,其中该方法可包括:(a)合成编码以下多肽的多核苷酸,所述多肽包括选自SEQ ID NO:4–100和112–750的偶数序列标识符,和具有与SEQ ID NO:2相比在选自以下的残基位置上一个或更多个残基差异的氨基酸序列:X4、X5、X14、X20、X29、X37、X67、X71、X74、X82、X94、X97、X100、X111、X124、X136、X137、X141、X143、X149、X153、X154、X156、X157、X158、X160、X163、X177、X178、X183、X184、X185、X186、X197、X198、X201、X220、X223、X226、X232、X243、X246、X256、X258、X259、X260、X261、X265、X266、X270、X273、X274、X277、X279、X280、X283、X284、X287、X288、X292,X293、X294、X295、X296、X297、X308、X311、X323、X324、X326、X328、X332、X353、和X356,以及(b)表达由多核苷酸编码的工程化多肽。如以上提到的,在这些位置上的残基差异可选自X4H/L/R;X5T;X14P;X20T;X29R/T;X37H;X67A/D;X71C/V;X74R;
X82P;X94K/R/T;X97P;X100W;X111M/Q/R/S;X124L/N;X136G;X137N;X141W;X143W;X149L;
X153V/Y;X154F/M/Q/Y;X156G/I/Q/S/T/V;X157D/H/L/M/N/R;X158K;X160N;X163T;X177C/H;X178E;X183C;X184K/Q/R;X185V;X186K/R;X197I/P;X198A/E/H/P/S;X201L;X220D/H;
X223T;X226L;X232A/R;X243G;X246W;X256V;X258D;X259E/H/I/L/M/S/T/V/W;X260G;
X261A/G/I/K/R/S/T;X265G/L/Y;X266T;X270G;X273W;X274M;X277A/I;X279F/L/V/Y;
X280L;X283V;X284K/L/M/Y;X287S/T;X288G/S;X292C/G/I/P/S/T/V/Y;X293H/I/K/L/N/Q/T/V;X294A/I/V;X295R/S;X296L/N/V/W;X297A;X308F;X311C/T/V;X323C/I/M/T/V;X324L/T;X326V;X328A/G/E;X332V;X353E;和X356R。如在详述中进一步提供的,在合成多核苷酸期间可掺入的另外的变异,以制备在表达的氨基酸序列中具有相应差异的工程化亚胺还原酶
多肽。
[0021] 在一些实施方案中,本公开内容的具有亚胺还原酶活性的工程化多肽可用于制备式(III)的仲胺或叔胺产物化合物的生物催化方法中,
[0022]
[0023] 其中,R1和R2基团独立地选自任选地取代的烷基、烯基、炔基、烷氧基、羧基、氨基羰基、杂烷基、杂烯基、杂炔基、羧基烷基、氨基烷基、卤代烷基、烷基硫代烷基、环烷基、芳基、芳基烷基、杂环烃基、杂芳基和杂芳基烷基;且任选地R1与R2连接以形成3元至10元环;R3和R4基团独立地选自氢原子,以及任选地取代的烷基、烯基、炔基、烷氧基、羧基、氨基羰基、杂烷基、杂烯基、杂炔基、羧基烷基、氨基烷基、卤代烷基、烷基硫代烷基、环烷基、芳基、芳基烷3 4 3 4
基、杂环烃基、杂芳基和杂芳基烷基,条件是R和R 两者不能同时是氢;且任选地R和R连接以形成3元至10元环;并且任选地,由*指示的碳原子和/或氮原子是手性的。方法包括在适当的反应条件下在辅因子的存在下使式(I)的化合物,
[0024]
[0025] 其中R1、和R2如以上所定义;和式(II)的化合物,
[0026]
[0027] 其中R3、和R4如以上所定义;与具有亚胺还原酶活性的工程化多肽接触
[0028] 在以上生物催化方法的一些实施方案中,具有亚胺还原酶活性的工程化多肽源自选自以下的天然存在的酶:来自节杆菌Arthrobacter sp.菌株1C(SEQ ID NO:2)的冠瘿碱
脱氢酶、来自欧洲大扇贝的D-章鱼碱脱氢酶(SEQ ID NO:102)、来自乳酸乳球菌K1的鸟氨酸脱氢酶(SEQ ID NO:104)、来自恶臭假单胞菌的N-甲基-L-氨基酸脱氢酶(SEQ ID NO:106)、来自斗笠螺的β-丙氨酸冠瘿碱脱氢酶(β-alanopine dehydrogenase)(SEQ ID NO:108)、和来自居蟹皮海绵的牛磺奥品脱氢酶(SEQ ID NO:110)。在一些实施方案中,工程化多肽源自SEQ ID NO:2的来自节杆菌Arthrobacter sp.菌株1C的冠瘿碱脱氢酶。本文描述的任何工
程化亚胺还原酶(并且由偶数序列标识符SEQ ID NO:4-100和112-750的工程化亚胺还原酶
多肽示例)可用于制备式(III)的仲胺或叔胺化合物的生物催化方法中。
[0029] 在使用工程化亚胺还原酶制备式(III)的产物化合物的方法的一些实施方案中,该方法还包括能够将NADP+转化为NADPH,或将NAD+转化为NADH的辅因子再生系统。在一些实施方案中,辅因子再循环系统包括甲酸(formate)和甲酸脱氢酶(FDH)、葡萄糖和葡萄糖脱
氢酶(GDH)、葡萄糖-6-磷酸和葡萄糖-6-磷酸脱氢酶、仲醇和醇脱氢酶、或亚磷酸
(phosphite)和亚磷酸脱氢酶。在一些实施方案中,可进行该方法,其中将工程化亚胺还原酶固定在固体支持物上。

具体实施方式

[0030] 除非上下文另外清楚地指明,否则如本说明书和所附的权利要求书中使用的单数形式“一(a)”、“一(an)”和“该(the)”包括复数指示物。因此,例如,提及“一种多肽”包括多于一种多肽。类似地,“包括(comprise)”、“包括(comprises)”、“包括(comprising)”、“包括(include)”、“包括(includes)”、和“包括(including)”是可互换的,且不意图为限制性的。
应理解的是,当各个实施方案的描述使用术语“包括(comprising)”时,本领域技术人员将理解,在一些特定情况下,实施方案可替代地利用措辞“基本上由…组成”或“由…组成”来描述。还应理解的是,当各种实施方案的描述使用“任选的”或“任选地”时,随后描述的事件或情况可以发生或可以不发生,并且该描述包括其中所述事件或情况发生的情形和其中所
述事件或情况不发生的情形。应理解的是,上述的一般说明和以下详述两者都只是示例性
和说明性的,而不是限制本公开内容。本文所用的章节标题仅用于组织目的,且不应当被解释为限制所描述的主题。
[0031] 缩写
[0032] 用于遗传编码的氨基酸的缩写是常规的,并如下:
[0033]
[0034] 当使用三个字母缩写时,除非前面明确加有“L”或“D”或从使用缩写的上下文明显,否则氨基酸可为关于α-碳(Cα)成L-构型或D-构型。例如,“Ala”表示丙氨酸,而没有规定关于α-碳的构型,但“D-Ala”与“L-Ala”分别表示D-丙氨酸与L-丙氨酸。当使用单字母缩写时,大写字母表示关于α-碳成L-构型的氨基酸类、而小写字母表示关于α-碳成D-构型的氨基酸类。例如,“A”表示L-丙氨酸而“a”表示D-丙氨酸。当多肽序列被呈现为一串单个字母或三个字母缩写(或其混合)时,根据通常惯例,序列以氨基(N)至羧基(C)方向呈现。
[0035] 用于遗传编码的核苷的缩写是常规的,并且是如下:腺苷(A)、鸟苷(G)、胞苷(C)、胸苷(T)、以及尿苷(U)。除非特别描绘,否则缩写的核苷酸可为核糖核苷或2’-脱氧核糖核苷。核苷可以单个计(on an individual basis)或以聚集体计(on an aggregate basis)被指定为核糖核苷或2’-脱氧核糖核苷。当核酸序列被呈现为一串一个字母缩写时,根据通常惯例,序列以5’至3’方向呈现,且没有显示磷酸(phosphate)。
[0036] 定义
[0037] 关于本公开内容,除非另外具体指明,否则本文的说明书中使用的技术术语和科学术语将具有本领域普通技术人员通常理解的含义。因此,以下术语意为具有以下含义:
[0038] “蛋白”、“多肽”和“肽”在本文中可互换使用,表示通过酰胺键共价连接的至少两个氨基酸的聚合物、而不论长度或翻译后修饰(例如、糖基化、磷酸化、脂化、肉豆蔻化(myristilation)、泛素化等等)。包括在这一定义中的是D-氨基酸和L-氨基酸,以及D-氨基酸和L-氨基酸的混合物。
[0039] “多核苷酸”或“核酸”是指共价地连接在一起的两个或更多个核苷。多核苷酸可完全由核糖核苷(即,RNA)组成,完全由2’脱氧核糖核苷酸(即,DNA)组成或由核糖核苷和2’脱氧核糖核苷的混合物组成。尽管核苷将通常通过标准磷酸二酯键合连接在一起,但多核苷酸可包括一个或更多个非标准的键合。多核苷酸可以是单链的或双链的,或可包括单链区
和双链区两者。此外,虽然多核苷酸将通常由天然存在的编码核碱基(即、腺嘌呤、鸟嘌呤、尿嘧啶、胸腺嘧啶和胞嘧啶)组成,但其可包括一个或更多个修饰的和/或合成的核碱基,诸如,例如,肌苷、黄嘌呤、次黄嘌呤等。优选地,这种修饰的或合成的核碱基将为编码核碱基。
[0040] 如本文所用的“冠瘿碱脱氢酶活性”是指其中将2-酮酸(例如,丙酮酸(pyruvate))的羰基基团和中性L-氨基酸(例如,L-正缬氨酸)的氨基基团转化为仲胺二羧酸化合物(例如,诸如N-[1-(R)-(羧基)乙基]-(S)-正缬氨酸)的酶活性。
[0041] 如本文所用的“冠瘿碱脱氢酶”是指具有冠瘿碱脱氢酶活性的酶。冠瘿碱脱氢酶包括但不限于以下天然存在的酶:来自节杆菌Arthrobacter sp.菌株1C的冠瘿碱脱氢酶(CENDH)(SEQ ID NO:2)、来自欧洲大扇贝的章鱼碱脱氢酶(SEQ ID NO:102)、来自乳酸乳球菌K1的鸟氨酸脱氢酶(CEOS)(SEQ ID NO:104)、来自恶臭假单胞菌的N-甲基-L-氨基酸脱氢
酶(NMDH)(SEQ ID NO:106)、来自斗笠螺的β-丙氨酸冠瘿碱脱氢酶(β-alanopine 
dehydrogenase)(BADH)(SEQ ID NO:108)、来自居蟹皮海绵的牛磺奥品脱氢酶(TauDH)(SEQ ID NO:110)、来自解脂耶氏酵母(Yarrowia lipolytica)的酵母氨酸(saccharopine)脱氢
酶(SacDH)(UniProtKB条目:P38997,条目名称:LYS1_YARLI)、以及来自根癌土壤杆菌
(Agrobacterium tumefaciens)(菌株T37)的D-胭脂碱脱氢酶(UniProtKB条目:P00386,条
目名称:DHNO_AGRT7)。
[0042] 如本文所用的“亚胺还原酶活性”是指其中在辅因子NAD(P)H的存在下将酮或醛的羰基基团与伯胺或仲胺的氨基基团(其中羰基和氨基基团可在单独的化合物或同一化合物
上)转化为仲胺或叔胺产物化合物的酶活性,如方案1中所示。
[0043] 如本文所用的“亚胺还原酶”或“IRED”是指具有亚胺还原酶活性的酶。应理解的是,亚胺还原酶不限于源自来自节杆菌Arthrobacter sp.菌株1C的野生型冠瘿碱脱氢酶的工程化多肽,而是可包括具有亚胺还原酶活性的其他酶,包括源自其他冠瘿碱脱氢酶的工
程化多肽,其他冠瘿碱脱氢酶诸如来自欧洲大扇贝的章鱼碱脱氢酶(OpDH)、来自乳酸乳球
菌K1的鸟氨酸合酶(CEOS)、来自斗笠螺的β-丙氨酸冠瘿碱脱氢酶(BADH)、来自居蟹皮海绵的牛磺奥品脱氢酶(TauDH);以及来自恶臭假单胞菌的N-甲基L-氨基酸脱氢酶(NMDH);或源自具有亚胺还原酶活性的野生型酶的工程化酶。如本文所用的亚胺还原酶包括天然存在的
(野生型)亚胺还原酶以及由人工操作产生的非天然存在的工程化多肽。
[0044] “编码序列”是指编码蛋白的氨基酸序列的核酸部分(例如,基因)。
[0045] “天然存在的”或“野生型”是指在自然界发现的形式。例如,天然存在的或野生型多肽或多核苷酸序列是生物体中存在的序列,其可从天然来源分离且未通过人为操纵而被有意识地修改
[0046] 当关于例如细胞、核酸或多肽使用时,“重组的”或“工程化的”或“非天然存在的”指如下材料或与该材料的自然或天然形式相应的材料:已经以自然界中本来不存在的方式被修饰或与其相同但由合成的材料和/或通过使用重组技术处理产生或衍生。非限制性实
例包括,表达在细胞的天然(非重组的)形式中未发现的基因或表达本来以不同的水平被表
达的天然基因的重组细胞以及其他。
[0047] “序列同一性的百分比”和“同源性百分比”在本文可互换使用以指多核苷酸以及多肽之间的对比、并通过跨比较窗比较两条最佳比对序列来确定,其中多核苷酸或多肽序列在比较窗中的部分与参考序列相比可以包括添加或缺失(即,空位),以用于两个序列的
最佳比对。百分比可以通过如下计算:确定两个序列中出现相同的核酸碱基或氨基酸残基
的位置的数目以产生匹配位置的数目,将匹配位置的数目除以比较窗中位置的总数目、并
将结果乘以100以得到序列同一性的百分比。可选地,百分比可以通过如下计算:确定两个序列中出现相同的核酸碱基或氨基酸残基或者核酸碱基或氨基酸残基与空位对齐的位置
的数目,以产生匹配位置的数目,将匹配位置的数目除以比较窗中位置的总数目并将结果
乘以100以得到序列同一性的百分比。本领域的技术人员理解,存在许多可用于比对两个序列的已建立的算法。用于比较的最佳序列比对可如下进行,例如,通过Smith和Waterman,
1981,Adv.Appl.Math.2:482的局部同源性算法、通过Needleman和Wunsch,1970,
J.Mol.Biol.48:443的同源性比对算法、通过Pearson和Lipman,1988,
Proc.Natl.Acad.Sci.USA 85:2444的相似度检索方法、通过这些算法的计算机化实现(在
GCG Wisconsin软件包中的GAP、BESTFIT、FASTA和TFASTA)、或通过目测(通常参见,Current Protocols in Molecular Biology,F.M.Ausubel等人编著,Current Protocols,a joint 
venture between Greene Publishing Associates,Inc.and John Wiley&Sons,Inc.,
(1995增刊)(Ausubel))。适合用于确定序列同一性和序列相似性百分比的算法的实例是
BLAST和BLAST 2.0算法,其被分别描述于Altschul等人,1990,J.Mol.Biol.215:403-410以
及Altschul等人,1977,Nucleic Acids Res.3389-3402中。用于进行BLAST分析的软件为通
过美国国家生物技术信息中心网站公共可获得的这一算法包括首先通过确定查询序列
(query sequence)中具有长度W的短字来确定高评分序列对(HSP),当其与数据库序列中相
同长度的字比对时、所述短字匹配或满足某个正值阈值评分T。T被称为邻近字评分阈值
(Altschul等人,如上述)。这些最初的邻近字匹配(word hit)用作启动检索的种子以找到
包括它们的更长的HSP。然后字击中沿着每个序列的两个方向延伸到累积比对评分不能增
加的程度。对于核苷酸序列,累积评分使用参数M(用于一对匹配残基的奖励评分;总是>0)和N(用于错配残基的惩罚评分;总是<0)来计算。对于氨基酸序列,使用评分矩阵以计算累积评分。当发生以下情况时字匹配在每个方向的延伸停止:累积比对评分从其最大获得的
值下降了量X;由于一个或更多个负评分残基比对的累积,累积评分变成零或以下;或达到任一序列的末端。BLAST算法参数W、T和X决定比对的灵敏度和速度。BLASTN程序(对于核苷酸序列)使用11的字长(W)、10的期望值(E)、M=5、N=-4、以及两个链的比较作为缺省值。对于氨基酸序列、BLASTP程序使用3的字长(W)、10的期望值(E)、和BLOSUM62评分矩阵作为缺省值(参见Henikoff和Henikoff,1989,Proc Natl Acad Sci USA 89:10915)。序列比对
与%序列同一性的示例性确定可使用GCG Wisconsin软件包(Accelrys,Madison WI)中的
BESTFIT或GAP程序、使用提供的缺省参数。
[0048] “参考序列”是指用作序列比较的基础的确定序列。参考序列可以是更大序列的子集,例如,全长基因或多肽序列的区段。通常,参考序列为至少20个核苷酸或氨基酸残基的长度、至少25个残基的长度、至少50个残基的长度、或核酸或多肽的全长。因为两种多核苷酸或多肽可以各自(1)包括两个序列之间相似的序列(即,完整序列的一部分),且(2)还可包括在两种序列之间不同的序列、所以两种(或更多种)多核苷酸或多肽之间的序列比较通
常通过在“比较窗”内比较两种多核苷酸或多肽的序列以确定和比较具有序列相似性的局
部区域来进行。在一些实施方案中,“参考序列”可基于基本氨基酸序列(primary amino acid sequence),其中参考序列为可在基本序列中具有一个或更多个变化的序列。例如,
“基于SEQ ID NO:4、在相应于X14的残基处具有缬氨酸的参考序列”或X14V是指在SEQ ID NO:4中X14处相应的残基已经改变成缬氨酸的参考序列。
[0049] “比较窗”是指至少约20个连续核苷酸位置或氨基酸残基的概念性片段、其中序列可与至少20个连续的核苷酸或氨基酸的参考序列进行比较、并且其中序列在比较窗中的部分与用于两个序列的最佳比对的参考序列(其不包含添加或缺失)相比、可以包括20%或更
少的添加或缺失(即,空位)。比较窗可以比20个连续的残基更长,并任选地包括30、40、50、
100或更长的窗。
[0050] “基本同一性”指以下的多核苷酸或多肽序列,在至少20个残基位置的比较窗内,经常在至少30-50个残基的比较窗内,其与参考序列相比,具有至少80%序列同一性,至少85%同一性和89%至95%序列同一性,更通常至少99%序列同一性,其中序列同一性百分
比通过在比较窗内比较参考序列与包括总计参考序列的20%或更少的缺失或添加的序列
来计算。在应用于多肽的特定的实施方案中,术语“基本同一性”指当最佳比对时,如通过程序GAP或BESTFIT使用缺省空位权重,两种多肽序列共有至少80%的序列同一性,优选地至
少89%的序列同一性,至少95%的序列同一性或更多(例如99%的序列同一性)。优选地,不相同的残基位置通过保守的氨基酸置换而不同。
[0051] 当在给定的氨基酸或多核苷酸序列编号的上下文中使用时,“对应于”,“关于”或“相对于”指当给定的氨基酸或多核苷酸序列与指定的参考序列相比时,参考序列的残基编号。换言之,给定的聚合物的残基数目或残基位置关于参考序列被指定,而不是通过给定的氨基酸或多核苷酸序列内残基的实际数字位置被指定。例如,给定的氨基酸序列,诸如工程化亚胺还原酶的氨基酸序列,可以通过引入空位以优化两个序列之间的残基匹配而与参考序列比对。在这些情况中,虽然存在空位,给定的氨基酸或多核苷酸序列中残基的编号是关于与其比对的参考序列作出的。
[0052] “氨基酸差异”或“残基差异”是指在多肽序列的位置上的氨基酸残基相对于参考序列中在相应位置上的氨基酸残基的变化。氨基酸差异的位置通常在本文中称为“Xn”,其中n是指残基差异所基于的参考序列中的相应位置。例如,“与SEQ ID NO:2相比在位置X25上的残基差异”是指相应于SEQ ID NO:2的位置25的多肽位置上的氨基酸残基的变化。因此,如果SEQ ID NO:2的参考多肽在位置25上具有缬氨酸,那么“与SEQ ID NO:2相比在位置X25上的残基差异”,在相应于SEQ ID NO:2的位置25的多肽位置上的缬氨酸以外的任何残
基的氨基酸置换。在本文的大多数情况下,位置上的特定氨基酸残基差异表示为“XnY”,其中“Xn”指定如上所述的相应位置,且“Y”是工程化多肽中发现的氨基酸的单字母标识符(即,与参考多肽相比的不同残基)。在一些实施方案中,当多于一个氨基酸可出现在指定残基位置中时,备选的氨基酸可以形式XnY/Z列出,其中Y和Z表示替代的氨基酸残基。在一些情况下(例如,在表3A、3B、3C、3D和3E中),本公开内容还提供了由常规表示法“AnB”表示的特定氨基酸差异,其中A是参考序列中残基的单字母标识符,“n”是参考序列中的残基位置的编号,且B是工程化多肽的序列中的残基置换的单字母标识符。此外,在一些情况下,本公开内容的多肽相对于参考序列可包括一个或更多个氨基酸残基差异,这由相对于参考序列
做出变化的特定位置的列表指示。本公开内容包括包含一个或更多个氨基酸差异的工程化
多肽序列,所述氨基酸差异包括保守和非保守氨基酸置换中的任一个/或两个。
[0053] “保守氨基酸置换”指用具有相似侧链的不同残基置换残基,并且因此,通常涉及用在氨基酸的相同或相似定义类别内的氨基酸置换多肽中的氨基酸。通过示例的方式而非限制,具有脂族侧链的氨基酸可被另一个脂族氨基酸置换,例如,丙氨酸、缬氨酸、亮氨酸和异亮氨酸;具有羟基侧链的氨基酸被具有羟基侧链的另一个氨基酸置换,例如,丝氨酸和苏氨酸;具有芳香族侧链的氨基酸被具有芳香族侧链的另一个氨基酸置换,例如,苯丙氨酸、酪氨酸、色氨酸和组氨酸;具有碱性侧链的氨基酸被具有碱性侧链的另一个氨基酸置换,例如,赖氨酸和精氨酸;具有酸性侧链的氨基酸被具有酸性侧链的另一个氨基酸置换,例如,天冬氨酸或谷氨酸;且疏水性氨基酸或亲水性氨基酸分别被另一个疏水性氨基酸或亲水性
氨基酸置换。示例性保守置换被提供在下面的表1中。
[0054] 表1
[0055]
[0056] “非保守置换”是指用具有显著差异侧链性质的氨基酸置换多肽中的氨基酸。非保守置换可以利用定义组之间,而不是它们之内的氨基酸,并影响(a)置换的区域中肽骨架的结构(例如,脯氨酸置换为甘氨酸)(b)电荷或疏水性,或(c)侧链的体积。通过示例的方式而非限制,示例性的非保守置换可以是酸性氨基酸被碱性或脂族氨基酸置换;芳香族氨基酸被小氨基酸置换;以及亲水性氨基酸被疏水性氨基酸置换。
[0057] “缺失”是指通过从参考多肽去除一个或更多个氨基酸而对多肽进行的修饰。缺失可以包括去除1个或多个氨基酸、2个或更多个氨基酸、5个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸、或20个或更多个氨基酸、多至组成参考酶的氨基酸总数的10%、或多至氨基酸总数的20%,同时保留酶活性和/或保留工程化亚胺还原酶的改进特
性。缺失可以涉及多肽的内部和/或端部。在各个实施方案中,缺失可以包括连续的区段或可以是不连续的。
[0058] “插入”是指通过向参考多肽添加一个或更多个氨基酸而对多肽进行的修饰。在一些实施方案中,改进的工程化亚胺还原酶包括一个或更多个氨基酸插入具有亚胺还原酶活性的天然存在的多肽,以及一个或更多个氨基酸插入其他改进的亚胺还原酶多肽。插入可
以是在多肽的内部或到羧基或氨基末端。如本文所用的插入包括如本领域已知的融合蛋
白。插入可以是氨基酸的连续区段或由天然存在多肽中的一个或更多个氨基酸分隔。
[0059] 如本文所用的“片段”是指如下多肽:所述多肽具有氨基末端和/或羧基末端缺失,但其中剩余的氨基酸序列与该序列中相应位置相同。片段可以是至少14个氨基酸长、至少20个氨基酸长、至少50个氨基酸长或更长,以及多至全长亚胺还原酶多肽,例如SEQ ID NO:
2的多肽或SEQ ID NO:96的工程化亚胺还原酶的70%、80%、90%、95%、98%和99%。
[0060] “分离的多肽”是指如下多肽:所述多肽与天然伴随其的其它污染物,例如,蛋白、脂质和多核苷酸基本上分离。该术语包括已从它们天然存在环境或表达系统(例如,宿主细胞或体外合成)中取出或纯化的多肽。改进的工程化亚胺还原酶可以存在于细胞内,存在于细胞培养基中,或以各种形式制备,诸如溶解产物或分离的制剂。因此,在一些实施方案中,工程化亚胺还原酶可以是分离的多肽。
[0061] “基本上纯的多肽”是指如下组合物,在所述组合物中多肽物质是存在的优势物质(即,在摩尔基础或重量基础上,它比在该组合物中的任何其它个体大分子物质更丰富),并且当目标物质构成存在的大分子物质的按摩尔或%重量计至少约50%时,一般是基本上纯化的组合物。通常,基本上纯的亚胺还原酶组合物包括以摩尔或%重量存在于组合物中的
全部大分子种类的约60%或更多、约70%或更多、约80%或更多、约90%或更多、约95%或更多、以及约98%或更多。在一些实施方案中,纯化对象种类至基本上同质(即,通过常规检测方法在组合物中不能检测到污染物种类),其中该组合物基本上由单一大分子种类组成。
溶剂种类,小分子(<500道尔顿),和元素离子种类不被认为大分子种类。在一些实施方案
中,分离的工程化亚胺还原酶多肽是基本上纯的多肽组合物。
[0062] “立体选择性”是指在化学或酶促反应中一种立体异构体比另一种立体异构体优先形成。立体选择性可以是部分的,其中一种立体异构体的形成优于另一种立体异构体的
形成,或立体选择性可以是完全的,其中只形成一种立体异构体。当立体异构体是对映体
时,立体选择性被称为对映体选择性,即一种对映体在两种对映体的总和中的分数(通常被报告为百分比)。它在本领域通常可选择地被报告为(通常为百分比)对映体过量(e.e.),其根据以下式计算:[主要对映体-次要对映体]/[主要对映体+次要对映体]。当立体异构体是非对映异构体时,立体选择性被称为非对映选择性,即一种非对映体在两种非对映体的混
合物中的分数(通常被报告为百分比),通常可选择地报告为非对映体过量(d.e.)。对映体
过量和非对映体过量是立体异构体过量的类型。
[0063] “高立体选择性”是指能够以具有至少约85%立体异构体过量将底物或底物,例如底物化合物(1e)和(2b),转化为相应胺产物,例如化合物(3i)的化学或酶促反应。
[0064] “改进的酶特性”是指相比于参考亚胺还原酶表现出任何酶特性的改进的亚胺还原酶多肽。对于本文描述的工程转亚胺还原酶多肽,通常对源自亚胺还原酶的野生型酶进
行比较,但是在一些实施方案中,参考酶可以是另一工程化亚胺还原酶。期望改进的酶特性包括,但不限于,酶活性(其可以底物的转化百分比的方式被表示)、热稳定性、溶剂稳定性、pH活性特征、辅因子需求、对抑制剂的耐受性(例如,底物或产物抑制)、立体定向
(stereospecificity)、和立体选择性(包括对映体选择性)。
[0065] “增加的酶活性”是指工程化亚胺还原酶多肽的改进特性,其可被表示为与参考亚胺还原酶相比,比活性(例如,产生的产物/时间/重量蛋白)的增加,或底物至产物的转化百分比(例如,在指定的时间段使用指定量的亚胺还原酶,起始量的底物至产物的转化百分比)。确定酶活性的示例性方法被提供于实施例中。可影响与酶活性相关的任何特性,包括经典的酶特性Km、Vmax或kcat,它们的改变可导致增加的酶活性。酶活性的改进可以是从相应的野生型酶的酶活性的约1.2倍,到相比于天然存在的或从其衍生亚胺还原酶多肽的另一
种工程化亚胺还原酶的多达2倍、5倍、10倍、20倍、25倍、50倍或更大的酶活性。亚胺还原酶活性可通过标准测定中的任何一个来测量,诸如通过监测底物、辅因子、或产物的性质中的变化。在一些实施方案中,生成的产物的量可通过液相色谱-质谱法(LC-MS)来测量。使用确定的酶制剂、在设定条件下的确定的测定(a defined assay under a set condition)、和一种或更多种确定的底物进行酶活性的比较,如本文进一步详细地描述的。通常,当比较溶解产物时,细胞的数目和测定的蛋白的量是确定的,并使用相同的表达系统和相同的宿主
细胞以将由宿主细胞产生的和溶解产物中存在的酶的量的变化最小化。
[0066] “转化(conversion)”是指底物至相应的产物的酶促转化。“转化百分比”是指在指定条件下一段时间内被转化为产物的底物的百分比。因此,亚胺还原酶多肽的“酶活性”或“活性”可表示为底物至产物的“转化百分比”。
[0067] “热稳定的”是指与野生型酶相比,亚胺还原酶多肽在暴露于高温(例如,40℃-80℃)持续一段时间(例如,0.5-24小时)之后维持相似活性(例如,大于60%至80%)。
[0068] “溶剂稳定的”指与野生型酶相比,亚胺还原酶多肽在暴露于不同浓度(例如5%-99%)的溶剂(乙醇、异丙醇、二甲亚砜(DMSO)、四氢呋喃、2-甲基四氢呋喃、丙酮、甲苯、乙酸丁酯、甲基叔丁基醚等)持续一段时间(例如0.5-24小时)之后维持相似的活性(多于例如
60%至80%)。
[0069] “热且溶剂稳定的”指热稳定的且溶剂稳定的亚胺还原酶多肽。
[0070] 本文中使用的“严格杂交”是指核酸杂交体(hybrid)在其下稳定的条件。如本领域技术人员已知,杂交体的稳定性通过杂交体的熔化温度(Tm)反映。大体上,杂交体的稳定性是离子强度、温度、G/C含量和离液剂存在的函数。使用预测熔化温度的已知的方法可以计算多核苷酸的Tm值(参见例如Baldino等人,Methods Enzymology 168:761-777;Bolton等人,1962,Proc.Natl.Acad.Sci.USA 48:1390;Bresslauer等人,1986,Proc.Natl.Acad.Sci USA83:8893-8897;Freier等人,1986,Proc.Natl.Acad.Sci USA 83:9373-9377;Kierzek等人,Biochemistry 25:7840-7846;Rychlik等人,1990,Nucleic Acids Res 18:6409-6412(勘误,1991,Nucleic Acids Res 19:698);Sambrook等人,上文);Suggs等人,1981,于Developmental Biology Using Purified Genes(Brown等人,编),683-693页,Academic 
Press;和Wetmur,1991,Crit Rev Biochem Mol Biol 26:227-259.所有出版物通过引用并入本文)。在一些实施方案中,多核苷酸编码本文公开的多肽并且在规定的条件下,诸如中度严格的或高度严格的条件下与编码本公开内容的工程化亚胺还原酶的序列的互补序列
杂交。
[0071] “杂交严格性”涉及核酸杂交中的杂交条件,诸如洗涤条件。通常,杂交反应在较低严格性的条件下进行,随后是不同的但较高严格性的洗涤。术语“中度严格杂交”指允许靶-DNA结合以下互补的核酸的条件,所述互补的核酸具有与靶DNA约60%的同一性、优选地约75%的同一性、约85%的同一性,与靶-多核苷酸的大于约90%的同一性。示例性中度严格的条件是等同于以下的条件:在50%甲酰胺、5×Denhart溶液、5×SSPE、0.2%SDS中在42℃杂交,随后在0.2×SSPE、0.2%SDS中在42℃洗涤。“高度严格的杂交”通常指以下的条件:偏离对于确定的多核苷酸序列在溶液条件下确定的热熔化温度Tm约10℃或更少。在一些实施
方案中,高度严格的条件指以下的条件,其仅允许在0.018M NaCl在65℃形成稳定的杂交体的那些核酸序列的杂交(即,如果杂交体在0.018M NaCl在65℃是不稳定的,其在高度严格
的条件下将是不稳定的,如本文所考虑)。可以例如通过以下提供高度严格条件:在与50%甲酰胺、5×Denhart溶液、5×SSPE、0.2%SDS在42℃等同的条件杂交,随后在0.1×SSPE和
0.1%SDS在65℃洗涤。另一高度严格的条件是在与以下等同的条件中杂交:在包含0.1%
(w:v)SDS的5X SSC中在65℃杂交并在包含0.1%SDS的0.1x SSC中在65℃洗涤。其他高度严
格的杂交条件,以及中度严格的条件在以上引用的文献中描述。
[0072] “异源的”多核苷酸指通过实验技术被引入宿主细胞的任何多核苷酸,且包括从宿主细胞取出,接受实验处理并然后再引入宿主细胞的多核苷酸。
[0073] “密码子优化”指编码蛋白的多核苷酸的密码子变化为具体的生物体中优先使用的那些,以使编码的蛋白在受关注的生物体中被有效地表达。尽管遗传密码是简并的,即大多数氨基酸由称为“同义的(synonyms)”或“同义(synonymous)”密码子的几个密码子表示,但熟知的是:具体的生物体的密码子使用是非随机的并且偏向特定的密码子三联体。对于
给定的基因、共同功能或祖先起源的基因、高度表达的蛋白对低拷贝数(low copy number)蛋白、和生物体基因组的聚集蛋白编码区,这一密码子使用偏好可以更高。在一些实施方案中,编码亚胺还原酶的多核苷酸可以为选择用于表达的宿主生物体中的最佳生产而进行密
码子优化。
[0074] “优选的、最佳的、高度密码子使用偏好的密码子”互换地指以下的密码子,其以比编码相同的氨基酸的其它密码子更高的频率在蛋白编码区中被使用。优选的密码子可以根据单个基因、共同功能或起源的一组基因、高度表达的基因中的密码子使用、整个生物体的聚集蛋白编码区中的密码子频率、相关的生物体的聚集蛋白编码区中的密码子频率、或其
组合确定。频率随着基因表达水平增加的密码子通常是用于表达的最佳密码子。已知多种
方法用于确定特定的生物体中的密码子频率(例如密码子使用、相对的同义密码子的使用)
和密码子偏好,包括多变量分析,例如,使用聚类分析或对应分析,和基因中使用的密码子的有效数目(参见GCG CodonPreference,Genetics Computer Group Wisconsin Package;
CodonW,John  Peden,University  of Nottingham;McInerney,J.O,1998,
Bioinformatics14:372-73;Stenico等,1994,Nucleic Acids Res.222437-46;Wright,F.,
1990,Gene 87:23-29)。222437-46;Wright,F.,1990,Gene 87:23-29)。对于增长的生物体列表密码子使用表是可获得的(参见,例如,Wada等,1992,Nucleic Acids Res.20:2111-
2118;Nakamura等,2000,Nucl.Acids Res.28:292;Duret,等人,如上述;Henaut和Danchin,“Escherichia coli and Salmonella,”1996,Neidhardt,等人编著,ASM Press,
Washington D.C.,2047-2066页)。用于获得密码子使用的数据来源可以依赖于能够编码蛋白的任何可获得的核苷酸序列。这些数据集合包括实际上已知编码表达的蛋白的核酸序列
(例如完整的蛋白编码序列-CDS)、表达的序列标签(ESTS)、或基因组序列的预测编码区(参见,例如,Mount,D.,Bioinformatics:Sequence and Genome Analysis,第8章,Cold 
Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.,2001;Uberbacher,E.C.,
1996,Methods Enzymol.266:259-281;Tiwari等,1997,Comput.Appl.Biosci.13:263-
270)。
[0075] “控制序列”在本文被定义为包括对于本公开内容的多核苷酸和/或多肽的表达是必需的或有利的所有组分。对于编码多肽的核酸序列,每个控制序列可以是天然的或外来
的。这些控制序列包括但不限于:前导序列(leader)、多腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。控制序列至少包括启动子、以及转录和翻译终止信号。控制序列可以与连接子一起被提供,以用于引入促进控制序列与编码多肽的核酸序列的编码区的连
接的特定的限制位点。
[0076] “可操作地连接”在本文被定义为以下的结构(configuration),其中控制序列被适当地置于(即,处于功能性关系)相对于受关注的多核苷酸的位置以使控制序列指导或调
节受关注的多核苷酸和/或多肽的表达。
[0077] “启动子序列”指被宿主细胞识别用于受关注的多核苷酸诸如编码序列的表达的核酸序列。启动子序列包含转录控制序列,其介导受关注的多核苷酸的表达。启动子可以是在选择的宿主细胞中显示转录活性的任何核酸序列,其包括突变体、截短的和杂合
(hybrid)启动子,并且可以获自编码对于宿主细胞同源的或异源的细胞外或细胞内多肽的
基因。
[0078] “适当的反应条件”是指在生物催化反应方案中的那些条件(例如,酶载量、底物载量、辅因子载量、温度、pH、缓冲液、共溶剂等的范围),在上述条件下本公开内容的亚胺还原酶多肽能够将底物化合物转化为产物化合物(例如,将化合物(2)转化为化合物(1))。示例性的“适当的反应条件”被提供在本公开内容中,并通过实施例说明。
[0079] “辅因子再生系统”或“辅因子再循环系统”是指一组参与还原辅因子的氧化形式的反应(例如,NADP+到NADPH)的反应物。由亚胺还原酶催化的酮底物的还原胺化而氧化的辅因子由辅因子再生系统以还原形式再生。辅因子再生系统包括化学计量的还原剂,其是
还原氢等同物的来源并且能够还原辅因子的氧化形式。辅因子再生系统还可包括催化剂,
例如酶催化剂,其催化还原剂对辅因子的氧化形式的还原。分别从NAD+或NADP+再生NADH或NADPH的辅因子再生系统,是本领域已知的并且可在本文描述的方法中使用。
[0080] “甲酸(Formate)脱氢酶”和“FDH”在本文中可互换使用以指NAD+或NADP+依赖性酶,其催化甲酸和NAD+或NADP+分别转化为二氧化碳和NADH或NADPH。
[0081] “载量”,诸如在“化合物载量”或“酶载量”或“辅因子载量”中是指在反应开始时反应混合物中组分的浓度或量。
[0082] 在生物催化剂介导的方法的上下文中的“底物”是指生物催化剂所作用于的化合物或分子。例如,在本文公开的还原胺化方法方法中使用的亚胺还原酶生物催化剂,存在式(I)的酮(或醛)底物,诸如环己酮,和式(II)的胺底物,诸如丁胺。
[0083] 在生物催化剂介导的方法的上下文中的“产物”是指由生物催化剂的作用产生的化合物或分子。例如,本文公开的方法中使用的亚胺还原酶生物催化剂的示例性产物是仲
胺或叔胺化合物,诸如式(III)的化合物。
[0084] “烷基(alkyl)”是指1个至18个(含)碳原子,直链的或支链的,更优选地1个至8个(含)碳原子,且最优选地1个至6个(含)碳原子的饱和烃基。具有指定数目的碳原子的烷基被表示在括号中,例如,(C1-C6)烷基是指1个至6个碳原子的烷基。
[0085] “亚烷基(Alkylene)”是指具有1个至18个(含)碳原子,更优选地1个至8个(含)碳原子,以及最优选地1个至6个(含)碳原子的直连或支链的二价烃基。
[0086] “烯基”是指包含至少一个双键,但任选地包含多于一个双键的2个至12个(含)碳原子的直链或支链的基团。
[0087] “亚烯基(Alkenylene)”是指具有2个至12个(含)碳原子和一个或更多个碳-碳双键,更优选地2个至8个(含)碳原子,以及最优选地2个至6个(含)碳原子的直连或支链的二
价烃基。
[0088] “炔基”是指含有至少一个三键,但任选地含有多于一个三键,并且另外任选地含有一个或更多个双键部分的2个至12个(含)碳原子的直链或支链的基团。
[0089] “环烷基”是指具有可任选地被1个至3个烷基基团取代的单环或多个稠环的3个至12个(含)碳原子的环状烷基基团。示例性的环烷基基团包括,但不限于,单环结构诸如环丙基、环丁基、环戊基、环辛基、1-甲基环丙基、2-甲基环戊基、2-甲基环辛基以及类似的,或多环结构,包括桥环系统,诸如金刚烷基以及类似的。
[0090] “环烷基烷基”是指被环烷基取代的烷基,即,环烷基-烷基-基团,优选具有在烷基部分中的1个至6个(含)碳原子和在环烷基部分中的3个至12个(含)碳原子。此类环烷基烷基基团由环丙基甲基、环己基乙基以及类似的举例说明。
[0091] “芳基”是指具有单环(例如,苯基)或多个稠环(例如,基或蒽基)的6个至12个(含)碳原子的不饱和芳香族碳环基团。示例性芳基包括苯基、吡啶基、萘基以及类似的。
[0092] “芳基烷基”是指被芳基取代的烷基,即芳基-烷基-基团,优选地具有在烷基部分的1个至6个(含)碳原子和在芳基部分的6个至12个(含)碳原子。此类芳基烷基基团由苯甲基、苯乙基以及类似的举例说明。
[0093] “杂烷基”、“杂烯基”和“杂炔基”是指其中一个或更多个碳原子各自独立地被相同或不同的杂原子或杂原子基团代替的如本文所定义的烷基、烯基和炔基。可代替碳原子的杂原子和/或杂原子基团包括,但不限于,-O-、-S-、-S-O-、-NRγ-、-PH-、-S(O)-、-S(O)2-、-S(O)NRγ-、-S(O)2NRγ-以及类似的,包括其组合,其中每个Rγ独立地选自氢、烷基、杂烷基、环烷基、杂环烃基、芳基、以及杂芳基。
[0094] “杂芳基”是指1个至10个(含)碳原子和在环内的选自氧、氮和硫的1个至4个(含)杂原子的芳族杂环基团。此类杂芳基基团可具有单个环(例如,吡啶基或呋喃基)或多个稠
环(例如,吲哚嗪基或苯并噻吩基)。
[0095] “杂芳基烷基”是指被杂芳基取代的烷基,即,杂芳基-烷基-基团,优选具有在烷基部分中的1个至6个(含)碳原子和在杂芳基部分中的5个至12个(含)环原子。此类杂芳基烷基基团由吡啶基甲基以及类似的举例说明。
[0096] “杂环”、“杂环的”和可互换的“杂环烃基(heterocycloalkyl)”是指具有单环或多个稠环、2个至10个(含)碳环原子和在环内的选自氮、硫或氧的1个至4个(含)杂环原子的饱和或不饱和的基团。此类杂环基团可具有单环(例如,哌啶基或四氢呋喃基)或多个稠环(例如,吲哚啉基、二氢苯并呋喃或奎宁环基)。杂环的实例包括,但不限于,呋喃、噻吩、噻唑、噁唑、吡咯、咪唑、吡唑、吡啶、吡嗪、嘧啶、哒嗪、吲嗪、异吲哚、吲哚、吲唑、嘌呤、喹嗪、异喹啉、喹啉、酞嗪、萘基吡啶、喹噁啉、喹唑啉、噌啉、蝶啶、咔唑、咔啉、菲啶、吖啶、菲咯啉、异噻唑、吩嗪、异噁唑、吩噁嗪、吩噻嗪、咪唑烷、咪唑啉、哌啶、哌嗪、吡咯烷、二氢吲哚以及类似的。
[0097] “杂环烃基烷基”是指被杂环烃基取代的烷基,即,杂环烃基-烷基-基团,优选具有在烷基部分中的1个至6个(含)碳原子和在杂环烃基部分中的3个至12个(含)环原子。
[0098] “氧基”是指二价基团-O-,其可具有各种取代基以形成不同的氧基基团,包括醚和酯。
[0099] “烷氧基(alkoxy)”或“烷基氧基(alkyloxy)”在本文可互换使用以指基团–ORζ,其中Rζ是烷基基团,包括任选地取代的烷基基团。
[0100] 如本文使用的“芳氧基”是指基团–OR,其中R是如以上定义的芳基基团,包括还如本文定义的任选地取代的芳基基团。
[0101] “羧基”是指-COOH。
[0102] “羧基烷基”是指被羧基基团取代的烷基。
[0103] “羰基”是指基团-C(O)-。取代的羰基是指基团Rη-C(O)-Rη,其中每个Rη独立地选自任选取代的烷基、环烷基、环杂烷基、烷氧基、羧基、芳基、芳氧基、杂芳基、杂芳基烷基、酰基、烷基氧基羰基、硫酰基(sulfanyl)、亚磺酰基、磺酰基、以及类似的。典型的取代的羰基基团,包括酸、酮、醛、酰胺、酯、酰卤、硫酯以及类似的。
[0104] “氨基”是指基团-NH2。取代的氨基是指基团-NHRη、NRηRη和NRηRηRη,其中各Rη独立地选自任选地取代的烷基、环烷基、环杂烷基、烷氧基、羧基、芳基、芳氧基、杂芳基、杂芳基烷基、酰基、烷氧基羰基、硫酰基、亚磺酰基、磺酰基,以及类似的。典型的氨基基团包括但不限于二甲 基 氨基 、二乙 基氨 基、三 甲基 铵、三乙 基铵 、甲基 磺酰 基氨 基(methylysulfonylamino)、呋喃基-氧基-磺氨基以及类似的。
[0105] “氨基烷基”是指其中氢原子中的一个或更多个被氨基,包括取代的氨基,取代的烷基基团。
[0106] “氨基羰基”是指被如本文定义的氨基基团,包括取代的氨基基团,取代的羰基基团,并且包括酰胺。
[0107] “氨基羰基烷基”是指被如本文所定义的氨基羰基基团取代的烷基。
[0108] “卤素”或“卤代”是指氟、氯、溴和碘。
[0109] “卤代烷基”是指其中氢原子中的一个或更多个被卤素代替的烷基基团。术语“卤代烷基”意指包括单卤代烷基、二卤代烷基、三卤代烷基等,直至全卤代烷基。例如,表述“(C1 C2)卤代烷基”包括1-氟甲基、二氟甲基、三氟甲基、1-氟乙基、1,1-二氟乙基、1,2-二氟乙基、1,1,1三氟乙基、全氟乙基等。
[0110] “羟基”是指-OH。
[0111] “羟基烷基”是指被一个或更多个羟基基团取代的烷基。
[0112] “硫代”或“硫酰基”是指–SH。取代的硫代或硫酰基是指–S-Rη其中Rη是烷基、芳基或其他合适的取代基。
[0113] “烷基硫代”是指-SRζ,其中Rζ是烷基,其可任选地被取代。典型的烷基硫代基团包括,但不限于,甲基硫代、乙基硫代、正丙基硫代,以及类似的。
[0114] “烷基硫代烷基”是指被烷基硫代基团-SRζ取代的烷基,其中Rζ是烷基,其可任选地被取代。
[0115] “磺酰基”是指-SO2-。取代的磺酰基是指–SO2-Rη,其中Rη是烷基、芳基或其他适合的取代基。
[0116] “烷基磺酰基”是指–SO2-Rζ,其中Rζ是烷基,其可任选地被取代。典型的烷基磺酰基基团包括,但不限于,甲基磺酰基、乙基磺酰基、正丙基磺酰基,以及类似的。
[0117] “烷基磺酰基烷基”是指被烷基磺酰基基团–SO2-Rζ取代的烷基,其中Rζ是烷基,其可任选地被取代。
[0118] “元环”意指包括任何环状结构。术语“元”之前的数字表示构成该环的骨架原子的数目。因此,例如,环己基、吡啶、吡喃和噻喃是6元环而环戊基、吡咯、呋喃和噻吩是5元环。
[0119] “稠合双环”是指在各环中具有5个或8个原子、环具有2个共有原子的未取代和取代的碳环部分和/或杂环部分。
[0120] 关于前述化学基团,如本文所用的“任选取代的”意指由氢占有的化学基团的位置可被另一种原子诸如碳、氧、氮、或硫、或化学基团取代,所述化学基团示例为,但不限于,羟基、氧代、硝基、甲氧基、乙氧基、烷氧基、取代的烷氧基、三氟甲氧基、卤代烷氧基、氟、氯、溴、碘、卤代、甲基、乙基、丙基、丁基、烷基、烯基、炔基、取代的烷基、三氟甲基、卤代烷基、羟烷基、烷氧基烷基、硫代、烷基硫代、酰基、羧基、烷氧基羰基、甲酰氨基、取代的甲酰氨基、烷基磺酰基、烷基亚磺酰基、烷基磺酰基氨基、磺酰氨基、取代的磺酰氨基、氰基、氨基、取代的氨基、烷基氨基、二烷基氨基、氨基烷基、酰氨基、脒基、氨基肟基(amidoximo)、羟基草氨酰基(hydroxamoyl)、苯基、芳基、取代的芳基、芳氧基、芳基烷基、芳基烯基、芳基炔基、吡啶基、咪唑基、杂芳基、取代的杂芳基、杂芳氧基、杂芳基烷基、杂芳基烯基、杂芳基炔基、环丙基、环丁基、环戊基、环己基、环烷基、环烯基、环烷基烷基、取代的环烷基、环烷氧基、吡咯烷基、哌啶基、吗啉代、杂环、(杂环)氧基和(杂环)烷基;其中优选的杂原子是氧、氮和硫。此外,当这些取代化学基团上存在开放化合价时,它们可被烷基、环烷基、芳基、杂芳基和/或杂环基团进一步取代,当这些开放化合价存在于碳上时,它们可被卤素和被氧键合取代基、氮键合取代基或硫键合取代基进一步取代,并且当多个这样的开放化合价存在时,这些基团可通过直接形成键或通过与新的杂原子,优选氧、氮或硫,形成键而被结合以形成环。还预期,只要用取代基取代氢不向本公开内容的分子引入不可接受的不稳定性,并且在其他
方面是化学上合理的,就可以进行上述取代。本领域普通技术人员将理解,对于描述为任选地取代的任何化学基团,仅意在包括空间上实际的和/或合成上可行的化合物。最后,如本文所用的“任选地取代的”是指在化学基团的术语或系列中的所有其后的修饰词。例如,在术语“任选地取代的芳基烷基”中,分子的“烷基”部分和“芳基”部分可以被取代或可以不被取代,并且对于系列“任选地取代的烷基、环烷基、芳基和杂芳基”,该烷基、环烷基、芳基和杂芳基基团,独立于其他,可以被取代或可以不被取代。
[0121] 工程化亚胺还原酶(IRED)多肽
[0122] 本公开内容提供了具有亚胺还原酶活性的工程化多肽、编码该多肽的多核苷酸、制备该多肽的方法、以及使用该多肽的方法。当描述涉及多肽时,应理解,其还描述了编码该多肽的多核苷酸。
[0123] 如以上提到的,亚胺还原酶属于催化酮底物与伯胺或仲胺底物还原胺化为仲胺或叔胺产物的一类酶,如由方案1所示(参见以上用于式(I)、(II)、和(III)的方案和基团结
构)。
[0124] 具有SEQ ID NO:2的氨基酸序列的来自节杆菌Arthrobacter sp.菌株1C的冠瘿碱脱氢酶(本文还称为“CENDH”),天然催化酮底物丙酮酸与氨基酸底物,L-2-氨基戊酸(或“L-正缬氨酸”)向产物(2S)-2-((1-羧乙酸)氨基)戊酸的转化。CENDH还催化丙酮酸与氨基酸底物L-鸟氨酸、和β-丙氨酸、以及结构相似的氨基磺酸底物牛磺酸的反应。此外,发现CENDH催化未激活的酮底物环己酮(而不是丙酮酸)与其天然胺底物L-正缬氨酸向仲胺产物(S)-2-
(环己基氨基)戊酸的转化。还发现CENDH催化其天然酮底物丙酮酸与伯胺丁胺、乙胺、和异丙胺向其各自的2-(烷基氨基)丙酸仲胺产物转化。然而,CENDH不展现对丙酮酸与仲胺,诸如二甲胺的转化的任何活性。另外,当连同未激活的伯胺底物丁胺一起使用时,CENDH不显示与未激活的酮底物环己酮的任何亚胺还原酶活性。
[0125] 在本公开内容中,描述了克服了野生型冠瘿碱脱氢酶CENDH的缺陷的工程化亚胺还原酶。源自节杆菌Arthrobacter sp.菌株1C的野生型酶的工程化亚胺还原酶多肽能够将
丙酮酸与L-正缬氨酸有效地转化为产物(2S)-2-((1-羧基乙基)氨基)戊酸,而且能够将一
系列式(I)的酮底物化合物与式(II)的胺底物化合物有效地转化为式(III)的仲胺和叔胺
产物化合物,如由通过以下表2中列出的(a)至(o)的转化反应所示的。
[0126] 表2
[0127]
[0128]
[0129]
[0130] 显著地,本公开内容鉴定了SEQ ID NO:2的CENDH多肽中与天然存在的酶相比改进了其酶特性的氨基酸残基位置和相应突变,酶特性包括亚胺还原酶活性、底物专一性、和选择性,以及其他。特别地,本公开内容提供了工程化IRED多肽,所述工程化IRED多肽能够催化还原胺化反应诸如表2的那些,即,式(I)的酮底物化合物(例如,环己酮)与式(II)的伯胺和仲胺底物化合物的还原胺化,由此产生式(III)的仲胺或叔胺化合物。
[0131] 在一些实施方案中,与野生型酶CENDH相比,在限定的时间内以相同量的酶,工程化亚胺还原酶多肽显示在式(I)的酮底物与式(II)的胺底物向式(III)的胺产物的转化中
增加的活性。在一些实施方案中,工程化亚胺还原酶多肽在适当的反应条件下具有与由SEQ ID NO:2呈现的野生型CENDH多肽相比的至少约1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍或更多倍的活性。
[0132] 在一些实施方案中,工程化亚胺还原酶多肽展示在式(I)的酮底物和式(II)的胺底物向式(III)的胺产物的转化中的亚胺还原酶活性,野生型多肽CENDH对该转化没有可检
测活性。
[0133] 由工程化亚胺还原酶多肽产生的式(III)的产物化合物可以是具有一个或更多个手性中心的仲胺或叔胺化合物。在一些实施方案中,工程化亚胺还原酶多肽能够以大于
90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、或更大的对映体或非对映体过量将式(I)与式(II)的酮和胺底物化合物转化为式(III)的手性胺产物化合物。
[0134] 在一些实施方案中,工程化亚胺还原酶多肽能够在适当的反应条件下,以对相对于SEQ ID NO:2的参考多肽的耐受性的对这些底物化合物的一种或两种的存在的增加的耐
受性转化式(I)和式(II)的酮和胺底物化合物。因此,在一些实施方案中,工程化亚胺还原酶多肽能够在适当的反应条件下在约120h或更短、72h或更短、约48h或更短、约36h或更短、或约24h更短的反应时间内,以至少约40%、至少约50%、至少约60%、至少约70%、至少约
80%、至少约90%、至少约95%、至少约98%、或至少约99%的转化百分比在以下的底物载量浓度下转化式(I)和式(II)的酮和胺底物化合物:至少约10g/L、约20g/L、约30g/L、约
40g/L、约50g/L、约70g/L、约100g/L、约125g/L、约150g/L、约175g/L或约200g/L或更多。
[0135] 工程化多肽的以上描述的改进特性在其下进行转化的适当的反应条件可关于多肽、底物、辅因子(例如,NAD(P)H)、辅酶(例如,FDH或GDH)、缓冲液、共溶剂的浓度或量、pH、温度、反应时间、和/或以多肽固定在固体支持物上的条件来确定,如在以下和实施例中进一步描述的。
[0136] 本公开内容提供了具有亚胺还原酶活性的众多示例性工程化多肽。这些示例性多肽由SEQ ID NO:2的野生型CENDH进化,并展示改进的特性,特别是在各种酮和胺底物的转
化中,包括化合物(1b)和(2b)向胺产物化合物(3d)的转化、化合物(1i)和(2b)向胺产物化
合物(3n)的转化、以及化合物(1j)和(2b)向胺产物化合物(3o)的转化中的增加的活性和稳
定性。这些具有亚胺还原酶活性的示例性工程化多肽具有以下氨基酸序列(在伴随序列表
中作为SEQ ID NO:4-100、和112-750的偶数序列标识符提供),所述氨基酸序列包括与SEQ ID NO:2相比在以下残基位置上的一个或更多个残基差异:X4、X5、X14、X20、X29、X37、X67、X71、X74、X82、X94、X97、X100、X111、X124、X136、X137、X141、X143、X149、X153、X154、X156、X157、X158、X160、X163、X177、X178、X183、X184、X185、X186、X197、X198、X201、X220、X223、X226、X232、X243、X246、X256、X258、X259、X260、X261、X265、X266、X270、X273、X274、X277、X279、X280、X283、X284、X287、X288、X292,X293、X294、X295、X296、X297、X308、X311、X323、X324、X326、X328、X332、X353、和X356。与表3A-3J的示例性多肽的改进特性相关的这些位置的每一个上的特定氨基酸差异包括:X4H/L/R;X5T;X14P;X20T;X29R/T;X37H;X67A/D;X71C/V;X74R;X82P;X94K/R/T;X97P;X100W;X111M/Q/R/S;X124L/N;X136G;X137N;X141W;X143W;
X149L;X153V/Y;X154F/M/Q/Y;X156G/I/Q/S/T/V;X157D/H/L/M/N/R;X158K;X160N;X163T;
X177C/H;X178E;X183C;X184K/Q/R;X185V;X186K/R;X197I/P;X198A/E/H/P/S;X201L;
X220D/H;X223T;X226L;X232A/R;X243G;X246W;X256V;X258D;X259E/H/I/L/M/S/T/V/W;
X260G;X261A/G/I/K/R/S/T;X265G/L/Y;X266T;X270G;X273W;X274M;X277A/I;X279F/L/V/Y;X280L;X283V;X284K/L/M/Y;X287S/T;X288G/S;X292C/G/I/P/S/T/V/Y;X293H/I/K/L/N/Q/T/V;X294A/I/V;X295R/S;X296L/N/V/W;X297A;X308F;X311C/T/V;X323C/I/M/T/V;
X324L/T;X326V;X328A/G/E;X332V;X353E;和X356R。
[0137] 本公开内容的示例性非天然存在(或工程化)的亚胺还原酶多肽的结构和功能信息是基于在这些酶的定向进化中使用的五种不同的高通量(HTP)筛选测定法:(1)酮和胺底
物化合物(1a)和(2b)向胺产物化合物(3b)的转化;(2)酮和胺底物化合物(1b)和(2a)向胺
产物化合物(3c)的转化;(3)酮和胺底物化合物(1b)和(2b)向胺产物化合物(3d)的转化;
(4)酮和胺底物化合物(1i)和(2b)向胺产物化合物(3n)的转化;以及(5)酮和胺底物化合物
(1j)和(2b)向胺产物化合物(3o)的转化。这些HTP筛选测定的结果示于以下表3A、3B、和3F-
3J中。奇数序列标识符(即,“SEQ ID NO”)是指编码由偶数的SEQ ID NO提供的氨基酸序列的核苷酸序列,并且该序列被提供在伴随本公开内容的电子序列表文件中,该序列表文件
在此通过引用并入本文。在表3A和3B中列出的氨基酸残基差异是基于与SEQ ID NO:2的参
考序列比较,其是来自节杆菌Arthrobacter sp.菌株1C的冠瘿碱脱氢酶CENDH的天然存在
的氨基酸序列。在表3F–3J中列出的氨基酸残基差异是基于与SEQ ID NO:96的参考序列比
较,其是具有与来自节杆菌Arthrobacter sp.菌株1C的冠瘿碱脱氢酶CENDH相比的以下7个
残基差异的工程化多肽的氨基酸序列:K156T、V197I、N198E、M201L、Y259H、Y280L、R292V、和Y293H。
[0138] 工程化亚胺还原酶多肽相对于SEQ ID NO:2的参考多肽的活性使用五种高通量(HTP)测定法中的一种或更多种作为初级筛选来确定:(1)底物丙酮酸(化合物(1a))和丁胺
(化合物(2b))向产物2-(丁基氨基)丙酸(化合物(3b))的转化;(2)底物环己酮(化合物
(1b))和L-正缬氨酸(化合物(2a))向产物(S)-2-(环己基氨基)戊酸(化合物(3c))的转化;
(3)底物环己酮和丁胺向产物N-丁基环己胺(N-butylcyclohexanamine)(化合物(3d))的转
化;(4)底物5-甲氧基-3,4-二氢化萘-2(1H)-酮(化合物(1i))和丁胺(化合物(2b))向仲胺
产物N-丁基-5-甲氧基-1,2,3,4-四氢化萘-2-胺(化合物(3n))的转化;以及(5)底物2-(3,
4-二甲氧基苯乙氧基)环己酮(化合物(1j)和丁胺(化合物(2b))向仲胺产物N-正丁基-2-
(3,4-二甲氧基苯乙氧基)环己胺(化合物(3o))的转化。表3A和3B中的HTP测定值,使用大肠杆菌(E.coli)澄清细胞溶解产物以~300μL体积/孔的96孔板格式,根据如表和实施例中标注的测定反应条件来确定。表3F–3J中的HTP测定值,使用大肠杆菌澄清细胞溶解产物以~
100μL体积/孔的96孔板格式,根据如表和实施例中标注的测定反应条件来确定。
[0139] 在某些情况下,还使用摇瓶粉(SFP)测定以评估工程化亚胺还原酶的活性,其结果提供于表3C和3D中。SFP制品提供多达总蛋白的约30%的工程化多肽的更纯的粉末。SFP测
定反应条件标注于表和实施例中。此外,表3C、3D和3E提供了当与表2中显示的酮和胺底物的其他组合使用时工程化亚胺还原酶多肽的SFP测定结果,所述酮和胺底物的其他组合包
括酮底物2-甲氧基-环己酮、环戊酮、和苯乙酮、羟丙酮,和胺底物甲胺、二甲胺、和苯胺。还通过测量反应中形成的产物,诸如非对映体产物化合物(3h)和(3i)的比测定了工程化亚胺
还原酶对一定对映体或非对映体产物的选择性,如表3C和3E中显示的。
[0140] 表3A:使用HTP制品的工程化多肽和相对酶改进
[0141]
[0142]
[0143]
[0144] 表3B:使用HTP制品的工程化多肽和相对酶改进
[0145]
[0146]
[0147] 表3C:使用SFP酶制品的工程化多肽和相对活性改进
[0148]
[0149] 表3D:使用工程化多肽的SFP酶制品的各种未激活的酮底物的相对活性改进
[0150]
[0151]
[0152] 表3E:使用工程化多肽的SFP酶制品的各种未激活的酮底物的相对活性改进
[0153]
[0154]
[0155] 表3F:使用HTP制品的工程化多肽和相对酶改进
[0156]
[0157]
[0158]
[0159]
[0160] 表3G:使用HTP制品的工程化多肽和相对酶改进
[0161]
[0162]
[0163]
[0164]
[0165] 表3H:使用HTP制品的工程化多肽和相对酶改进
[0166]
[0167]
[0168]
[0169]
[0170] 表3I:使用HTP制品的工程化多肽和相对酶改进
[0171]
[0172]
[0173]
[0174] 表3J:使用HTP制品的工程化多肽和相对酶改进
[0175]
[0176]
[0177]
[0178]
[0179]
[0180] 从示例性多肽的分析,酶特性中的改进与相比于SEQ ID NO:2在以下残基位置上的残基差异相关:X4、X5、X14、X20、X29、X37、X67、X71、X74、X82、X94、X97、X100、X111、X124、X136、X137、X141、X143、X149、X153、X154、X156、X157、X158、X160、X163、X177、X178、X183、X184、X185、X186、X197、X198、X201、X220、X223、X226、X232、X243、X246、X256、X258、X259、X260、X261、X265、X266、X270、X273、X274、X277、X279、X280、X283、X284、X287、X288、X292,X293、X294、X295、X296、X297、X308、X311、X323、X324、X326、X328、X332、X353、和X356。与改进的特性相关的这些位置的每一个上的具体残基差异包括:X4H/L/R;X5T;X14P;X20T;
X29R/T;X37H;X67A/D;X71C/V;X74R;X82P;X94K/R/T;X97P;X100W;X111M/Q/R/S;X124L/N;
X136G;X137N;X141W;X143W;X149L;X153V/Y;X154F/M/Q/Y;X156G/I/Q/S/T/V;X157D/H/L/M/N/R;X158K;X160N;X163T;X177C/H;X178E;X183C;X184K/Q/R;X185V;X186K/R;X197I/P;
X198A/E/H/P/S;X201L;X220D/H;X223T;X226L;X232A/R;X243G;X246W;X256V;X258D;
X259E/H/I/L/M/S/T/V/W;X260G;X261A/G/I/K/R/S/T;X265G/L/Y;X266T;X270G;X273W;
X274M;X277A/I;X279F/L/V/Y;X280L;X283V;X284K/L/M/Y;X287S/T;X288G/S;X292C/G/I/P/S/T/V/Y;X293H/I/K/L/N/Q/T/V;X294A/I/V;X295R/S;X296L/N/V/W;X297A;X308F;
X311C/T/V;X323C/I/M/T/V;X324L/T;X326V;X328A/G/E;X332V;X353E;和X356R。
[0181] 与相比于SEQ ID NO:4在以上残基位置上的残基差异相关的特定酶特性包括,酶活性、立体选择性、多肽表达,以及其他。酶活性的改进与以下残基位置上的残基差异相关:
X111、X136、X156、X197、X198、X201、X259、X280、X292、和X293。对未激活的酮底物的选择性的改进(如通过将环己酮和L-正缬氨酸转化为化合物(3c)中增加的活性来测量)与以下残
基位置上的残基差异相关:X197;X198;X201;X292;并包括以下的特定氨基酸残基差异:
X197I/P;X198A/E/H/P/S;X201L;X292C/G/I/P/S/T/V/Y;和X293H/I/K/L/N/Q/T/V。对未激活的胺底物的选择性的改进(如通过丙酮酸和丁胺至化合物(3b)中增加的活性来测量)与
以下残基位置上的残基差异相关:X111、X136、X156、X197P、X259、和X280;并包括以下的特定氨基酸残基差异:X111M/Q/S、X136G、X156G/I/Q/S/T/V、X197P、X259E/H/I/L/M/S/T、和X280L。对未激活的酮和未激活的胺底物的组合的选择性的改进(如通过将环己酮和丁胺转
化为化合物(3d)中的增加的活性来测量)与以下残基位置上的残基差异相关:X198、X259、和X280;并包括以下的特定氨基酸残基差异:X198E/H、X259M/H、和X280L。因此,前述残基位置上的残基残基可以单独或以各种组合用于产生具有期望的改进的特性的工程化转氨酶
多肽,期望的改进的特性包括酶活性、立体选择性、和底物耐受性,以及其他。影响多肽表达的其他残基差异可用于增加工程化亚胺还原酶的表达。
[0182] 酶活性和稳定性的改进与以下残基位置上的残基差异相关:X4、X5、X14、X20、X29、X37、X67、X71、X74、X82、X94、X97、X100、X124、X137、X141、X143、X149、X153、X154、X157、X158、X160、X163、X177、X178、X183、X184、X185、X186、X220、X223、X226、X232、X243、X246、X256、X258、X260、X261、X265、X266、X270、X273、X274、X277、X279、X283、X284、X287、X288、X294、X295、X296、X297、X308、X311、X323、X324、X326、X328、X332、X353、和X356。对于酮底物化合物(1i)或化合物(1j),与胺底物丁胺(2b)分别向胺产物化合物(3n)和(3o)的转化的活性和稳定性的改进与以下的特定氨基酸残基差异相关:X4H/L/R、X5T、X14P、X20T、X29R/T、X37H、X67A/D、X71C/V、X74R、X82P、X94K/R/T、X97P、X100W、X111R、X124L/N、X137N、X141W、X143W、X149L、X153V/Y、X154F/M/Q/Y、X157D/H/L/M/N/R、X158K、X160N、X163T、X177C/H、X178E、X183C、X184K/Q/R、X185V、X186K/R、X220D/H、X223T、X226L、X232A/R、X243G、X246W、X256V、X258D、X259V/W、X260G、X261A/G/I/K/R/S/T、X265G/L/Y、X266T、X270G、X273W、X274M、X277A/I、X279F/L/V/Y、X283V、X284K/L/M/Y、X287S/T、X288G/S、X294A/I/V、X295R/S、X296L/N/V/W、X297A、X308F、X311C/T/V、X323C/I/M/T/V、X324L/T、X326V、X328A/G/E、X332V、X353E、和X356R。
[0183] 另外,如背景中提到的,已确定了冠瘿碱脱氢酶CENDH的晶体结构(参见Britton等人,“Crystal structure and active site location of N-(1-D-carboxyethyl)-L-
norvaline dehydrogenase,”Nat.Struct.Biol.5(7):593-601(1998))。因此,本文公开的各种氨基酸差异和功能活性的这种相关性连同野生型酶CENDH的已知三维结构可为本领域
普通技术人员提供足够信息以理性地为本文提供的多肽(以及为同源的冠瘿碱脱氢酶包括
OpDH、BADH、CEOS、和TauDH)进一步设计变化,并且保留或改进亚胺还原酶活性特性。在一些实施方案中,设想此类改进可包括设计天然存在的冠瘿碱脱氢酶多肽或本公开内容的工程
化多肽以具有一系列底物的亚胺还原酶活性,并提供的一系列产物,如方案1中描述的。
[0184] 在一些实施方案中,本公开内容提供了具有亚胺还原酶活性的工程化多肽,所述工程化多肽包括具有与选自由以下组成的组的天然存在的冠瘿碱脱氢酶氨基酸序列的至
少80%序列同一性的氨基酸序列:SEQ ID NO:2、102、104、106、108、和110,并且还包括与选择的天然存在的冠瘿碱脱氢酶的氨基序列相比的一个或更多个残基差异。在源自冠瘿碱脱
氢酶的工程化多肽的一些实施方案中,亚胺还原酶活性是以下的活性:方案1,任选地,如表
2中公开的反应,以及任选地,将化合物(1b)和化合物(2b)转化为产物化合物(3d)的反应。
[0185] 根据本文提供的指导,进一步设想,偶数序列标识符SEQ ID NO:4–100和112–750的任何示例性工程化多肽序列,或SEQ ID NO:2、102、104、106、108、和110的示例性天然存在的冠瘿碱脱氢酶多肽,可用作用于合成其他工程化亚胺还原酶多肽的起始氨基酸序列,例如,通过添加来自表3A–3J中的其他多肽以及本文描述的其他残基位置的各种氨基酸差
异的新组合的随后轮次进化。进一步的改进可通过包括在贯穿较早轮次的进化中已被保持
为不变的残基位置上的氨基酸差异而产生。因此,在一些实施方案中,具有亚胺还原酶活性的工程化多肽包括具有与参考序列SEQ ID NO:2的至少80%、85%、86%、87%、88%、89%、
90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性以及与SEQ ID NO:2相比在选自以下的残基位置上的一个或更多个残基差异的氨基酸序列:X111、X136、
X156、X197、X198、X201、X259、X280、X292、和X293。
[0186] 在一些实施方案中,具有亚胺还原酶活性的工程化多肽包括具有与参考序列SEQ ID NO:2至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、99%或更多序列同一性以及与SEQ ID NO:2的序列相比在残基位置X198上的残基差异的氨基酸序列,其中任选地在位置X198上的残基差异选自X198A、X198E、X198H、
X198P、和X198S。在一些实施方案中,具有在位置X198上的残基差异的工程化多肽包括选自X198E、和X198H的氨基酸序列。
[0187] 在一些实施方案中,具有与SEQ ID NO:2相比改进的特性的亚胺还原酶活性的工程化多肽包括以下氨基酸序列,所的氨基酸序列具有与选自以下的参考序列至少80%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性:SEQ ID NO:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、
42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、
92、94、96、98、和100,以及与SEQ ID NO:2相比在选自以下的残基位置上的一个或更多个残基差异:X111、X136、X156、X197、X198、X201、X259、X280、X292、和X293。在一些实施方案中,参考序列选自SEQ ID NO:6、50、58、60、62、64、72、74、76、78、88、90、92、94、96、98和100。在一些实施方案中,参考序列是SEQ ID NO:2。在一些实施方案中,参考序列是SEQ ID NO:6。
在一些实施方案中,参考序列是SEQ ID NO:88。在一些实施方案中,参考序列是SEQ ID NO:
90。在一些实施方案中,参考序列是SEQ ID NO:92。在一些实施方案中,参考序列是SEQ ID NO:94。在一些实施方案中,参考序列是SEQ ID NO:96。在一些实施方案中,参考序列是SEQ ID NO:98。在一些实施方案中,参考序列是SEQ ID NO:100。
[0188] 在一些实施方案中,在残基位置X111、X136、X156、X197、X198、X201、X259、X280、X292、和X293上的残基差异选自X111M、X111Q、X111S、X136G、X156G、X156I、X156Q、X156S、X156T、X156V、X197I、X197P、X198A、X198E、X198H、X198P、X198S、X201L、X259E、X259H、X259I、X259L、X259M、X259S、X259T、X280L、X292C、X292G、X292I、X292P、X292S、X292T、X292V、X292Y、X293H、X293I、X293K、X293L、X293N、X293Q、X293T、和X293V。
[0189] 因此,在一些实施方案中,显示本文描述的一个或更多个改进的特性的工程化亚胺还原酶多肽可包括具有与如以上描述的参考序列的氨基酸序列同一性和与SEQ ID NO:2
相比选自以下的一个或更多个残基差异的氨基酸序列:X111M、X111Q、X111S、X136G、X156G、X156I、X156Q、X156S、X156T、X156V、X197I、X197P、X198A、X198E、X198H、X198P、X198S、X201L、X259E、X259H、X259I、X259L、X259M、X259S、X259T、X280L、X292C、X292G、X292I、X292P、X292S、X292T、X292V、X292Y、X293H、X293I、X293K、X293L、X293N、X293Q、X293T、和X293V。
[0190] 在一些实施方案中,工程化亚胺还原酶具有包括与SEQ ID NO:2相比选自以下的至少一个或更多个残基差异的氨基酸序列:X198E、X198H、X259M、X259H、和X280L。
[0191] 在一些实施方案中,工程化亚胺还原酶多肽包括具有与SEQ ID NO:2相比至少选自以下的残基差异组合的氨基酸序列:(a)X111M、X156T、X198H、X259M、X280L、X292V、和X293H;(b)X156T、X197P、X198H、X259H、X280L、X292P、和X293H;(c)X111M、X136G、X156S、X197I、X198H、X201L、X259H、X280L、X292V、和X293H;(d)X197I、X198E、X259M、和X280L;(e)X156T、X197I、X198E、X201L、X259H、X280L、X292V、和X293H;(f)X111M、X136G、X198H、X259M、X280L、X292S、和X293H;以及(g)X156V、X197P、X198E、X201L、X259M、X280L、和X292T。
[0192] 如本领域技术人员将理解的,在一些实施方案中,被选择的以上残基差异的一个或组合在工程化亚胺还原酶中作为核心序列可以被保持恒定,并且在其他残基位置上的另
外的残基差异掺入进该核心序列以产生具有改进的特性的另外的工程化亚胺还原酶多肽。
因此,应理解,对于包含以上残基差异的一个或子集的任何工程化亚胺还原酶,本公开内容涵盖包括该残基差异的一个或子集、以及另外的在本文公开的其他残基位置上的一个或更
多个残基差异的其他工程化亚胺还原酶。通过示例的方式而非限制,包括在残基位置X280
上的残基差异的工程化亚胺还原酶还可掺入在其他残基位置,例如,X111、X136、X156、
X197、X198、X201、X259、X292、和X293上的一个或更多个残基差异。另一个实例是包括在残基位置X156上的残基差异的工程化亚胺还原酶,其还可包括在其他残基位置,例如,X111、X136、X197、X198、X201、X259、X280、X292、和X293上的一个或更多个残基差异。
[0193] 实际上,包括与SEQ ID NO:2相比的以下残基差异的组合的SEQ ID NO:96的工程化亚胺还原酶多肽还被进化以产生具有改进的活性和稳定性的另外的工程化亚胺还原酶
多肽:X156T、X197I、X198E、X201L、X259H、X280L、X292V、和X293H。这些进一步改进的工程化亚胺还原酶多肽包括与SEQ ID NO:2的序列相比在选自以下的残基位置上的一个或更多个
残基差异:X4、X5、X14、X20、X29、X37、X67、X71、X74、X82、X94、X97、X100、X111、X124、X137、X141、X143、X149、X153、X154、X157、X158、X160、X163、X177、X178、X183、X184、X185、X186、X220、X223、X226、X232、X243、X246、X256、X258、X259、X260、X261、X265、X266、X270、X273、X274、X277、X279、X283、X284、X287、X288、X294、X295、X296、X297、X308、X311、X323、X324、X326、X328、X332、X353、和X356。与改进的活性或稳定性相关的这些位置上的特定氨基酸残基差异选自X4H/L/R、X5T、X14P、X20T、X29R/T、X37H、X67A/D、X71C/V、X74R、X82P、X94K/R/T、X97P、X100W、X111R、X124L/N、X137N、X141W、X143W、X149L、X153V/Y、X154F/M/Q/Y、X157D/H/L/M/N/R、X158K、X160N、X163T、X177C/H、X178E、X183C、X184K/Q/R、X185V、X186K/R、X220D/H、X223T、X226L、X232A/R、X243G、X246W、X256V、X258D、X259V/W、X260G、X261A/G/I/K/R/S/T、X265G/L/Y、X266T、X270G、X273W、X274M、X277A/I、X279F/L/V/Y、X283V、X284K/L/M/Y、X287S/T、X288G/S、X294A/I/V、X295R/S、X296L/N/V/W、X297A、X308F、X311C/T/V、X323C/I/M/T/V、X324L/T、X326V、X328A/G/E、X332V、X353E、和X356R。
[0194] 因此,在一些实施方案中,具有亚胺还原酶活性的工程化多肽包括具有与SEQ ID NO:2(或SEQ ID NO:4–100的任何示例性工程化多肽)的至少80%序列同一性和与SEQ ID 
NO:2的序列相比在选自以下的残基位置上的一个或更多个残基差异的氨基酸序列:X111、
X136、X156、X197、X198、X201、X259、X280、X292、和X293(如以上描述的),并且还包括与SEQ ID NO:2的序列相比在选自以下的残基位置上的一个或更多个残基差异:X4、X5、X14、X20、X29、X37、X67、X71、X74、X82、X94、X97、X100、X111、X124、X137、X141、X143、X149、X153、X154、X157、X158、X160、X163、X177、X178、X183、X184、X185、X186、X220、X223、X226、X232、X243、X246、X256、X258、X259、X260、X261、X265、X266、X270、X273、X274、X277、X279、X283、X284、X287、X288、X294、X295、X296、X297、X308、X311、X323、X324、X326、X328、X332、X353、和X356。
在一些实施方案中,这些进一步残基差异选自X4H/L/R、X5T、X14P、X20T、X29R/T、X37H、X67A/D、X71C/V、X74R、X82P、X94K/R/T、X97P、X100W、X111R、X124L/N、X137N、X141W、X143W、X149L、X153V/Y、X154F/M/Q/Y、X157D/H/L/M/N/R、X158K、X160N、X163T、X177C/H、X178E、X183C、X184K/Q/R、X185V、X186K/R、X220D/H、X223T、X226L、X232A/R、X243G、X246W、X256V、X258D、X259V/W、X260G、X261A/G/I/K/R/S/T、X265G/L/Y、X266T、X270G、X273W、X274M、X277A/I、X279F/L/V/Y、X283V、X284K/L/M/Y、X287S/T、X288G/S、X294A/I/V、X295R/S、X296L/N/V/W、X297A、X308F、X311C/T/V、X323C/I/M/T/V、X324L/T、X326V、X328A/G/E、X332V、X353E、X356R。
[0195] 在一些实施方案中,具有亚胺还原酶活性的工程化多肽可包括具有与SEQ ID NO:2的至少80%序列同一性,与SEQ ID NO:2的序列相比在选自以下残基位置上的一个或更多
个残基差异的氨基酸序列:X111、X136、X156、X197、X198、X201、X259、X280、X292、和X293(如以上描述的),并且还包括至少选自以下的残基差异组合:(a)X29R、X184R、X223T、X261S、X284M、和X287T;(b)X29R、X157R、X184Q、X220H、X223T、X232A、X261I、X284M、X287T、X288S、X324L、X332V、和X353E;(c)X29R、X157R、X184Q、X220H、X223T、X232A、X259V、X261I、X284M、X287T、X288S、X324L、X332V、和X353E;(d)X29R、X94K、X111R、X137N、X157R、X184Q、X220H、X223T、X232A、X259V、X261I、X279V、X284M、X287T、X288S、X324L、X332V、和X353E;以及(e)X29R、X94K、X111R、X137N、X157R、X184Q、X220H、X223T、X232A、X259V、X261I、X266T、X279V、X284M、X287T、X288S、X295S、X311V、X324L、X328E、X332V、和X353E。
[0196] 在一些实施方案中,具有亚胺还原酶活性的工程化多肽包括具有与SEQ ID NO:2的至少80%序列同一性,和以下残差异的组合的氨基酸序列:X156T、X197I、X198E、X201L、X259H、X280L、X292V、和X293H,并且还包括选自以下的一个或更多个残基差异:X29R/T、X94K/R/T、X111R、X137N、X157D/H/L/M/N/R、X184K/Q/R、X220D/H、X223T、X232A/R、X259V/W、X261A/G/I/K/R/S/T、X266T、X279F/L/V/Y、X284K/L/M/Y、X287S/T、X288G/S、X295S、X311V、X324L/T、X328E、X332V、和X353E。在一些实施方案中,序列包括残基差异X156T、X197I、X198E、X201L、X259H、X280L、X292V、和X293H的组合,并且还包括至少选自以下的残基差异组合:(a)X29R、X184R、X223T、X261S、X284M、和X287T;(b)X29R、X157R、X184Q、X220H、X223T、X232A、X261I、X284M、X287T、X288S、X324L、X332V、和X353E;(c)X29R、X157R、X184Q、X220H、X223T、X232A、X259V、X261I、X284M、X287T、X288S、X324L、X332V、和X353E;(d)X29R、X94K、X111R、X137N、X157R、X184Q、X220H、X223T、X232A、X259V、X261I、X279V、X284M、X287T、X288S、X324L、X332V、和X353E;以及(e)X29R、X94K、X111R、X137N、X157R、X184Q、X220H、X223T、X232A、X259V、X261I、X266T、X279V、X284M、X287T、X288S、X295S、X311V、X324L、X328E、X332V、和X353E。
[0197] 通常,本公开内容的具有亚胺还原酶活性的工程化多肽能够以相对于SEQ ID NO:2的节杆菌Arthrobacter sp.菌株C1野生型冠瘿碱脱氢酶参考多肽,或相对于选自偶数的
序列标识符SEQ ID NO:4–100和112-750的工程化多肽的具有亚胺还原酶活性的参考多肽
改进的活性和/或改进的立体选择性将式(I)的化合物和式(II)的化合物转化为式(III)的
胺产物化合物(如由方案1所示)。在一些实施方案中,改进的活性和/或改进的立体选择性
是关于表2中显示的式(I)的化合物与式(II)的化合物的特定组合向表2中显示的式(III)
的相应胺产物化合物的转化。
[0198] 因此,在一些实施方案中,本公开内容的具有亚胺还原酶活性的工程化多肽,其具有与选自偶数序列标识符SEQ ID NO:4–100和112-750的参考序列的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和与SEQ ID NO:2相比在选自以下的残基位置上一个或更多个残基差异的氨基酸序列:X4、X5、X14、X20、X29、X37、X67、X71、X74、X82、X94、X97、X100、X111、X124、X136、X137、X141、X143、X149、X153、X154、X156、X157、X158、X160、X163、X177、X178、X183、X184、X185、X186、X197、X198、X201、X220、X223、X226、X232、X243、X246、X256、X258、X259、X260、X261、X265、X266、X270、X273、X274、X277、X279、X280、X283、X284、X287、X288、X292、X293、X294、X295、X296、X297、X308、X311、X323、X324、X326、X328、X332、X353、和X356,能够在适当的反应条件下,以相对于偶数序列标识符SEQ ID NO:4–100和112-750的参考多肽的改进的活性和/或
改进的稳定性进行一个或更多个以下的转化反应:
[0199] (a)底物化合物(1a)和(2a)向产物化合物(3a)的转化;
[0200] (b)底物化合物(1a)和(2b)向产物化合物(3b)的转化;
[0201] (c)底物化合物(1b)和(2a)向产物化合物(3c)的转化;
[0202] (d)底物化合物(1b)和(2b)向产物化合物(3d)的转化;
[0203] (e)底物化合物(1b)和(2c)向产物化合物(3e)的转化;
[0204] (f)底物化合物(1b)和(2d)向产物化合物(3f)的转化;
[0205] (g)底物化合物(1c)和(2a)向产物化合物(3g)的转化;
[0206] (h)底物化合物(1d)和(2a)向产物化合物(3h)的转化;
[0207] (i)底物化合物(1e)和(2b)向产物化合物(3i)的转化;
[0208] (j)底物化合物(1f)和(2b)向产物化合物(3j)的转化;
[0209] (k)底物化合物(1g)和(2e)向产物化合物(3k)的转化;
[0210] (l)底物化合物(1b)和(2f)向产物化合物(3l)的转化;
[0211] (m)底物化合物(1h)和(2a)向产物化合物(3m)的转化;
[0212] (n)底物化合物(1i)和(2b)向产物化合物(3n)的转化;以及
[0213] (o)底物化合物(1j)和(2b)向产物化合物(3o)的转化。
[0214] 在一些实施方案中,具有亚胺还原酶活性并能够在适当的反应条件下,以改进的活性和/或立体选择性催化一个或更多个以上转化反应(a)–(o)的工程化多肽包括具有与
偶数序列标识符SEQ ID NO:2–100和112-750的一个的至少80%、85%、86%、87%、88%、
89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列,和与SEQ ID NO:2相比存在于偶数序列标识符SEQ ID NO:4–100和112-750的任何一个中的氨
基酸残基差异,如表3A–3J中提供的。在一些实施方案中,具有亚胺还原酶活性并能够在适当的反应条件下,以改进的活性和/或立体选择性催化一个或更多个以上转化反应(a)–(o)的工程化多肽具有包括选自偶数序列标识符SEQ ID NO:4–100和112-750的序列的氨基酸
序列。
[0215] 在一些实施方案中,工程化亚胺还原酶多肽能够以相对于SEQ ID NO:2的参考多肽的活性的至少1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍或更多的活性将酮底物化合物(1a)和胺底物化合物(2b)转化为胺产物化合物(3b)。在一些实施方案中,能够以相对于SEQ ID NO:2的参考多肽的活性的至少1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍、20倍、30倍、40倍、50倍或更多的活性将酮底物化合物(1a)和胺底物化合物(2b)转化为胺产物化合物(3b)的工
程化亚胺还原酶多肽包括具有选自以下的一个或更多个残基差异的氨基酸序列:X111M/Q/
S、X136G、X156G/I/Q/S/T/V、X259E/H/I/L/M/S/T、和X280L。在一些实施方案中,能够以相对于SEQ ID NO:2的活性的至少1.2倍将酮底物化合物(1a)和胺底物化合物(2b)转化为胺产
物化合物(3b)的工程化亚胺还原酶多肽包括选自以下的氨基酸序列:SEQ ID NO:8、12、14、
18、20、22、24、26、28、30、32、36、38、42、44、46、50、78、和84。
[0216] 在一些实施方案中,工程化亚胺还原酶多肽能够以相对于SEQ ID NO:2的参考多肽的活性的至少1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍或更多的活性将酮底物化合物(1b)和胺底物化合物(2a)转化为胺产物化合物(3c)。在一些实施方案中,能够以相对于SEQ ID NO:2的参考多肽的活性的至少1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍、20倍、30倍、40倍、50倍或更多的活性将酮底物化合物(1b)和胺底物化合物(2a)转化为胺产物化合物(3c)的工
程化亚胺还原酶多肽包括具有选自以下的一个或更多个残基差异的氨基酸序列:X197I/P、X198A/E/H/P/S、X201L、X292C/G/I/P/S/T/V/Y、和X293H/I/K/L/N/Q/T/V。在一些实施方案中,工程化亚胺还原酶多肽能够以相对于SEQ ID NO:2的活性的至少1.2倍将酮底物化合物
(1b)和胺底物化合物(2a)转化为仲胺产物化合物(3c),并包括选自以下的氨基酸序列:SEQ ID NO:4、6、16、40、48、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、和86。
[0217] 如以上提到的,从中衍生本公开内容的工程化多肽的SEQ ID NO:2的来自节杆菌Arthrobacter sp.菌株C1的野生型冠瘿碱脱氢酶(CENDH)不具有在将酮底物化合物(1b)和
胺底物化合物(2b)转化为仲胺产物化合物(3d)中的可检测的活性。然而,在一些实施方案
中,具有亚胺还原酶活性的工程化多肽能够将酮底物化合物(1b)和胺底物化合物(2b)转化
为仲胺产物化合物(3d)。另外,在一些实施方案中,工程化亚胺还原酶多肽能够以相对于
SEQ ID NO:90、92、或94的参考多肽的活性的至少1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍或更多的活性将酮底物化合物(1b)和胺底物化合物(2b)转化为胺产物化合物(3d),SEQ ID 
NO:90、92、或94中的每一个是具有至少该转化中的可检测活性的工程化多肽。在一些实施方案中,能够以相对于SEQ ID NO:90、92、或94的参考多肽的活性的至少1.2倍、1.5倍、2倍、
3倍、4倍、5倍、10倍或更多的活性将酮底物化合物(1b)和胺底物化合物(2b)转化为胺产物化合物(3d)的工程化亚胺还原酶多肽包括具有选自以下的残基差异的组合的氨基酸序列:
(a)X111M、X156T、X198H、X259M、X280L、X292V、和X293H;(b)X156T、X197P、X198H、X259H、X280L、X292P、和X293H;(c)X111M、X136G、X156S、X197I、X198H、X201L、X259H、X280L、X292V、和X293H;(d)X197I、X198E、X259M、和X280L;(e)X156T、X197I、X198E、X201L、X259H、X280L、X292V、和X293H;(f)X111M、X136G、X198H、X259M、X280L、X292S、和X293H;以及(g)X156V、X197P、X198E、X201L、X259M、X280L、和X292T。在一些实施方案中,工程化亚胺还原酶多肽能够将酮底物化合物(1b)和胺底物化合物(2b)转化为胺产物化合物(3d),包括选自以下的氨
基酸序列:SEQ ID NO:88、90、92、94、96、98、和100。
[0218] 除以上指定的残基差异的位置之外,本文所公开的任何工程化亚胺还原酶多肽还可包括相对于SEQ ID NO:2,在其他残基位置即,除以下残基位置外的残基位置的其他残基差异:X111、X136、X156、X197、X198、X201、X259、X280、X292、和X293。在这些其他残基位置上的残基差异可提供氨基酸序列的另外变异而没有不利地影响多肽催化来自表2的一个或更
多个以上转化反应(a)–(o)的能。因此,在一些实施方案中,除了选自以下的工程化亚胺还原酶多肽的任何一个中存在的氨基酸残基差异之外:SEQ ID NO:4、6、8、10、12、14、16、
18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、
68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、和100,序列还可包括与SEQ ID NO:2相比在其他氨基酸残基位置上的1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-11个、1-12个、1-14个、1-15个、1-16个、1-18个、1-20个、1-22个、1-24个、1-26个、1-30个、1-35个、1-40个、1-45个、或1-50个残基差异。在一些实施方案中,与参考序列相比,氨基酸残基差异的数目可以是1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个、或50个残基位置。在一些实施方案中,与参考序列相比,氨基酸残基差异的数目可以是1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、18个、20个、21个、22个、23个、24个、或25个残基位置。在这些其他位置上的残基差异可以是保守的变化或非保守的变化。在一些实施方案中,与SEQ ID NO:2的天然存在的亚胺还原酶多肽相比,残基差异可包括保守的置换和非保守的置换。
[0219] 在一些实施方案中,本公开内容还提供了包括本文描述的任何工程化亚胺还原酶多肽的片段、保留了该工程化亚胺还原酶的功能活性和/或改进特性的工程化多肽。因此,在一些实施方案中,本公开内容提供了能够在适当的反应条件下催化表2的以上转化反应
(a)–(o)的一个或更多个的多肽片段,其中该片段包括本公开内容的工程化亚胺还原酶多
肽的全长氨基酸序列的至少约80%、90%、95%、96%、97%、98%、或99%,工程化亚胺还原酶多肽诸如选自偶数序列标识符SEQ ID NO:4–100和112-750的示例性工程化亚胺还原酶
多肽。
[0220] 在一些实施方案中,工程化亚胺还原酶多肽可具有包括本文描述的工程化亚胺还原酶多肽中的任一个的缺失的氨基酸序列,工程化亚胺还原酶多肽诸如偶数序列标识符
SEQ ID NO:4–100和112-750的示例性工程化多肽。因此,对于本公开内容的工程化亚胺还原酶多肽的每个和每一个实施方案,氨基酸序列可包括一个或更多个氨基酸、2个或更多个氨基酸、3个或更多个氨基酸、4个或更多个氨基酸、5个或更多个氨基酸、6个或更多个氨基酸、8个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸、或20个或更多个氨基酸、多至亚胺还原酶多肽的氨基酸的总数的10%、多至氨基酸的总数的10%、多至氨基酸的总数的20%、或多至氨基酸的总数的30%的缺失,其中保留了本文描述的工程化亚胺还原
酶的相关功能活性和/或改进的特性。在一些实施方案中,缺失可包括1-2个、1-3个、1-4个、
1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-15个、1-20个、1-21个、1-22个、1-23个、1-24个、1-25个、1-30个、1-35个、1-40个、1-45个、或1-50个氨基酸残基。在一些实施方案中,缺失的数目可以是1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个、或50个氨基酸残基。在一些实施方案中,缺失可以包括1个、2个、3个、4个、5个、6个、7个、
8个、9个、10个、11个、12个、13个、14个、15个、16个、18个、20个、21个、22个、23个、24个、或25个氨基酸残基的缺失。
[0221] 在一些实施方案中,本文的工程化亚胺还原酶多肽可具有与本文描述的工程化亚胺还原酶多肽中的任一个相比包括插入的氨基酸序列,工程化亚胺还原酶多肽诸如偶数序
列标识符SEQ ID NO:4–100和112-750的示例性工程化多肽。因此,对于本公开内容的亚胺还原酶多肽的每个和每一个实施方案,插入可包括一个或更多个氨基酸、2个或更多个氨基酸、3个或更多个氨基酸、4个或更多个氨基酸、5个或更多个氨基酸、6个或更多个氨基酸、8个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸、20个或更多个氨基酸、30个或更多个氨基酸、40个或更多个氨基酸、或50个或更多个氨基酸,其中保留了本文描述的工程化亚胺还原酶的相关功能活性和/或改进的特性。插入可以是在亚胺还原酶多肽的氨
基末端或羧基末端、或内部部分。
[0222] 在一些实施方案中,本文的工程化亚胺还原酶多肽可具有包括选自偶数序列标识符SEQ ID NO:4–100和112-750的序列,和任选地一个或数个(例如,多达3个、4个、5个或多达10个)氨基酸残基缺失、插入和/或置换的氨基酸序列。在一些实施方案中,氨基酸序列任选地具有1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-15个、1-20个、
1-21个、1-22个、1-23个、1-24个、1-25个、1-30个、1-35个、1-40个、1-45个、或1-50个氨基酸残基缺失、插入和/或置换。在一些实施方案中,氨基酸序列的数目任选地具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、
20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个、或50个氨基酸残基缺失、插入和/或置换。在一些实施方案中,氨基酸序列任选地具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、18个、20个、21个、22个、23个、24个、或25个氨基酸残基缺失、插入和/或置换。在一些实施方案中,置换可以是保守的或非保守的置换。
[0223] 在上述实施方案中,用于工程化多肽的适当的反应条件可以是表3A–3J中所描述的那些条件。因此,在一些实施方案中,适当的反应条件是HTP测定条件,该条件包括:酮底物和胺底物化合物的每个的20mM载量;5mM NADH;20-100μL来自表达感兴趣的工程化多肽的大肠杆菌的澄清的溶菌产物;100mM磷酸缓冲液,pH 8.5或pH 10;以及约25℃(室温)下的反应温度进行约12h-24h的反应时间。在一些实施方案中,适当的反应条件是对摇瓶粉
(SFP)测定描述的那些条件,该条件包括:酮底物和胺底物化合物的每个的50mM载量;4.5mM(3g/L)NADH;5-50g/L感兴趣的工程化多肽的SFP;100mM甲酸钠;1g/L甲酸脱氢酶(FDH-101;
从Codexis,Inc.Redwood City,California,USA商购可得);100mM磷酸钾缓冲液,pH 8.5或pH 10;以及约30℃下的反应温度进行约12h-24h的反应时间。这些前述HTP和SFP反应条件
和亚胺还原酶多肽的使用的指导提供于表3A–3J及实施例以及其他中。
[0224] 在一些实施方案中,本公开内容的多肽可以是融合多肽的形式,其中工程化多肽与其他多肽融合,所述其他多肽诸如通过举例的方式而非限制,抗体标签(例如,myc表位)、纯化序列(例如,用于结合至金属的His标签)和细胞定位信号(例如,分泌信号)。因此,本文描述的工程化多肽可与其它多肽融合或不与其它多肽融合使用。
[0225] 应理解的是,本文描述的多肽不限于遗传编码的氨基酸。除了遗传编码的氨基酸以外,本文描述的多肽可完全或部分包括天然存在的和/或合成的非编码氨基酸。本文描述的多肽可包括的某些常见非编码氨基酸包括但不限于:遗传编码的氨基酸的D-立体异构
体;2,3-二氨基丙酸(Dpr);α-氨基异丁酸(Aib);ε-氨基己酸(Aha);G-氨基戊酸(Ava);N-甲基甘氨酸或肌氨酸(MeGly或Sar);鸟氨酸(Orn);瓜氨酸(Cit);叔丁基丙氨酸(Bua);叔丁基甘氨酸(Bug);N-甲基异亮氨酸(MeIle);苯基甘氨酸(Phg);环己基丙氨酸(Cha);正亮氨酸(Nle);萘基丙氨酸(Nal);2-氯苯丙氨酸(Ocf);3-氯苯丙氨酸(Mcf);4-氯苯丙氨酸(Pcf);
2-氟苯丙氨酸(Off);3-氟苯丙氨酸(Mff);4-氟苯丙氨酸(Pff);2-溴苯丙氨酸(Obf);3-溴苯丙氨酸(Mbf);4-溴苯丙氨酸(Pbf);2-甲基苯丙氨酸(Omf);3-甲基苯丙氨酸(Mmf);4-甲基苯丙氨酸(Pmf);2-硝基苯丙氨酸(Onf);3-硝基苯丙氨酸(Mnf);4-硝基苯丙氨酸(Pnf);
2-氰基苯丙氨酸(Ocf);3-氰基苯丙氨酸(Mcf);4-氰基苯丙氨酸(Pcf);2-三氟甲基苯丙氨酸(Otf);3-三氟甲基苯丙氨酸(Mtf);4-三氟甲基苯丙氨酸(Ptf);4-氨基苯丙氨酸(Paf);
4-碘苯丙氨酸(Pif);4-氨甲基苯丙氨酸(Pamf);2,4-二氯苯丙氨酸(Opef);3,4-二氯苯丙氨酸(Mpcf);2,4-二氟苯丙氨酸(Opff);3,4-二氟苯丙氨酸(Mpff);吡啶-2-基丙氨酸
(2pAla);吡啶-3-基丙氨酸(3pAla);吡啶-4-基丙氨酸(4pAla);萘-1-基丙氨酸(1nAla);
萘-2-基丙氨酸(2nAla);噻唑基丙氨酸(taAla);苯并噻吩基丙氨酸(bAla);噻吩基丙氨酸(tAla);呋喃基丙氨酸(fAla);高苯丙氨酸(hPhe);高酪氨酸(hTyr);高色氨酸(hTrp);五氟苯丙氨酸(5ff);苯乙烯基丙氨酸(sAla);蒽基丙氨酸(aAla);3,3-二苯丙氨酸(Dfa);3-氨基-5-苯基戊酸(Afp);青霉胺(Pen);1,2,3,4-四氢异喹啉-3-羧酸(Tic);E-2-噻吩基丙氨酸(Thi);蛋氨酸亚砜(Mso);N(w)-硝基精氨酸(nArg);高赖氨酸(hLys);膦酰基甲基苯丙氨酸(pmPhe);磷酸丝氨酸(pSer);磷酸苏氨酸(pThr);高天冬氨酸(hAsp);高谷氨酸(hGlu);
1-氨基环戊-(2或3)-烯-4羧酸;哌可酸(PA);氮杂环丁烷-3-羧酸(ACA);1-氨基环戊烷-3-羧酸;烯丙基甘氨酸(aOly);炔丙基甘氨酸(pgGly);高丙氨酸(hAla);正缬氨酸(nVal);高亮氨酸(hLeu);高缬氨酸(hVal);高异亮氨酸(hIle);高精氨酸(hArg);N-乙酰赖氨酸
(AcLys);2,4-二氨基丁酸(Dbu);2,3-二氨基丁酸(Dab);N-甲基缬氨酸(MeVal);高半胱氨酸(hCys);高丝氨酸(hSer);羟基脯氨酸(Hyp)和高脯氨酸(hPro)。本文描述的多肽可包括的另外的非编码氨基酸对本领域技术人员将是明显的(参见,例如,在Fasman,1989,CRC 
Practical Handbook of Biochemistry and Molecular Biology,CRC Press,Boca 
Raton,FL,在第3-70页及其中引用的参考文献中提供的多种氨基酸,全部参考文献通过引
用并入本文)。这些氨基酸可以是以L-构型或D-构型。
[0226] 本领域技术人员将认识到,带有侧链保护基的氨基酸或残基还可以构成本文所描述的多肽。在这种情况下属于芳香族类别的这些受保护的氨基酸的非限制性实例包括(在
括号中列出的保护基)但不限于:Arg(tos)、Cys(甲苄基)、Cys(硝基吡啶次磺酰基)、Glu(G-苄基酯)、Gln(呫吨基)、Asn(N-G-呫吨基)、His(bom)、His(苄基)、His(tos)、Lys(fmoc)、Lys(tos)、Ser(O-苄基)、Thr(O-苄基)和Tyr(O-苄基)。
[0227] 本文所述的多肽可包括的构型上受限制的非编码氨基酸包括但不限于,N-甲基氨基酸(L-构型);1-氨基酸环戊-(2或3)-烯-4-羧酸;哌啶酸;氮杂环丁烷-3-羧酸;高脯氨酸(hPro);以及1-氨基环戊烷-3-羧酸。
[0228] 在一些实施方案中,工程化多肽可以是各种形式,例如,诸如分离的制品,作为基本上纯化的酶、用编码酶的基因转化的完整细胞、和/或作为此类细胞的细胞提取物和/或溶解产物。酶可以冻干、喷雾干燥、沉淀、或为粗糊料的形式,如下面进一步讨论的。
[0229] 在一些实施方案中,工程化多肽可被提供在固体支持物上,诸如膜、树脂、固体载体(solid carrier)、或其他固相材料。固体支持物可包括有机聚合物如聚苯乙烯、聚乙烯、聚丙烯、聚氟乙烯、聚乙烯氧和聚丙烯酰胺以及其共聚物和接枝物。固体支持物还可以是无机的,诸如玻璃、二氧化、可控孔度玻璃(CPG)、反相二氧化硅或金属诸如金或铂。固体支持物的结构可呈珠、球、粒子、颗粒、凝胶、膜或表面的形式。表面可以是平面的、基本上平面的或非平面的。固体支持物可以是多孔的或非多孔的,并且可以具有溶胀的或非溶胀的性质。固体支持物可以被配置成孔、凹部或其它容器、器皿(vessel)、特征(feature)或位置(location)的形式。
[0230] 在一些实施方案中,本公开内容的具有亚胺还原酶活性的工程化多肽可被固定在固体支持物上,使得它们保留它们的相对于SEQ ID NO:2的参考多肽的改进活性、立体选择性、和/或其他改进特性。在这样的实施方案中,固定的多肽可促进式(I)和式(II)的酮和胺底物化合物生物催化转化为式(III)的胺产物化合物(例如,如表2中的转化反应(a)-(o)
中),并且在反应完全后很容易保留(例如,通过保留在其上固定多肽的珠),并且然后在后续反应中再利用或回收。这样的固定的酶的方法允许更高的效率和成本降低。因此,进一步设想,使用本公开内容的亚胺还原酶多肽的方法中的任一种可使用结合或固定在固体支持
物上的相同的亚胺还原酶多肽来进行。
[0231] 酶固定的方法是本领域中熟知的。可非共价地或共价地结合工程化多肽。用于缀合和固定酶至固体支持物(例如,树脂、膜、珠、玻璃等等)的各种方法是本领域熟知的并描述于例如:Yi等人,“Covalent immobilization ofω-transaminase from Vibrio 
fluvialis JS17on chitosan beads,”Process Biochemistry 42(5):895-898(May 
2007);Martin等人,“Characterization  of free and  immobilized(S)-
aminotransferase for acetophenone production,”Applied Microbiology and 
Biotechnology 76(4):843-851(Sept.2007);Koszelewski等人,“Immobilization ofω-transaminases by encapsulation in a sol-gel/celite matrix,”Journal of 
Molecular Catalysis B:Enzymatic,63:39-44(Apr.2010);Truppo等人,“Development of an Improved Immobilized CAL-B for the Enzymatic Resolution of a Key 
Intermediate to Odanacatib,”Organic Process Research&Development,published 
online:dx.doi.org/10.1021/op200157c;Hermanson,G.T.,Bioconjugate Techniques,第
二版,Academic Press(2008);Mateo等人,“Epoxy sepabeads:a novel epoxy support for stabilization of industrial enzymes via very intense multipoint covalent 
attachment,”Biotechnology Progress 18(3):629-34(2002);and Bioconjugation 
Protocols:Strategies and Methods,In Methods in Molecular Biology,C.M.Niemeyer
编著,Humana Press(2004);其每个的公开内容通过引用并入本文。可用于固定本公开内容的工程化亚胺还原酶的固体支持物包括但不限于,包括以下的珠或树脂:具有环氧官能团
的聚甲基丙烯酸酯、具有氨基环氧官能团的聚甲基丙烯酸酯、具有十八烷基官能团的苯乙
烯/DVB共聚物或聚甲基丙烯酸酯。可用于固定本公开内容的工程化亚胺还原酶多肽的示例
性固体支持物包括但不限于,壳聚糖珠、Eupergit C和SEPABEAD(Mitsubishi),包括以下不同类型的SEPABEAD:EC-EP、EC-HFA/S、EXA252、EXE119和EXE120。
[0232] 在一些实施方案中,本文描述的多肽可以试剂盒的形式被提供。试剂盒中的酶可以单独地存在或作为多种酶存在。试剂盒还可包括用于进行酶促反应的试剂、用于评估酶
活性的底物、以及用于检测产物的试剂。试剂盒还可包括试剂分配器和试剂盒的使用说明
书。
[0233] 在一些实施方案中,本公开内容的试剂盒包括以下的阵列,其包括在不同的可寻址的位置的多种不同的亚胺还原酶多肽,其中不同的多肽是参考序列的不同的变体,各自
具有至少一种不同的改进的酶特性。在一些实施方案中,固定在固体支持物上的多种多肽
可以配置在阵列上的不同的位置,这对于试剂的机器人递送或通过检测方法和/或仪器是
可寻址的。阵列可用于测试各种底物化合物被多肽的转化。包括多种工程化多肽的这样的
阵列和它们的使用方法被描述在例如WO2009/008908A2中。
[0234] 编码工程化亚胺还原酶的多核苷酸、表达载体和宿主细胞
[0235] 在另一个方面,本公开内容提供编码本文描述的工程化亚胺还原酶多肽的多核苷酸。多核苷酸可与控制基因表达的一个或更多个异源的调节序列可操作地连接,以产生能
够表达多肽的重组的多核苷酸。包含编码工程化亚胺还原酶的异源的多核苷酸的表达构建
体可被引入适当的宿主细胞以表达相应的亚胺还原酶多肽。
[0236] 如对本领域技术人员将是明显的,蛋白序列的可用性和相应于各种氨基酸的密码子的知识提供了对能够编码该主题多肽的所有多核苷酸的描述。遗传密码的简并性,其中
相同氨基酸由替代的或同义的密码子编码,允许极大数目的核酸被制出,所有这些核酸编
码改进的亚胺还原酶。因此,具有具体的氨基酸序列的知识后,本领域技术人员能够以不改变蛋白的氨基酸序列的方式通过仅仅变更序列的一个或更多个密码子来制出任何数目的
不同核酸。在这点上,本公开内容明确涵盖可通过选择基于可能的密码子选择的组合制出
的编码本文描述的多肽的多核苷酸的每种和每一种可能的变异,并且所有这些变异将被认
为针对本文描述的任何多肽被明确地公开,所述本文描述的任何多肽包括在表3A–3J中呈
现的以及作为偶数序列标识符SEQ ID NO:4–100和112–750在通过引用并入本文的序列表
中公开的氨基酸序列。
[0237] 在各种实施方案中,密码子被优选地选择以适合在其中产生蛋白的宿主细胞。例如,细菌中使用的优选的密码子被用于在细菌中表达基因;酵母中使用的优选的密码子被
用于酵母中的表达;并且哺乳动物中使用的优选的密码子被用于哺乳动物细胞中的表达。
在一些实施方案中,不需要替换所有密码子以优化亚胺还原酶的密码子使用,因为天然序
列将包括优选的密码子并且因为优选的密码子的使用对于所有氨基酸残基可能不是必需
的。因此,编码亚胺还原酶的密码子优化的多核苷酸可以在全长编码区的约40%、50%、
60%、70%、80%或大于90%的密码子位置包括优选的密码子。
[0238] 在一些实施方案中,多核苷酸包括编码SEQ ID NO:2的天然存在的亚胺还原酶多肽的密码子优化的核苷酸序列。在一些实施方案中,多核苷酸具有包括与SEQ ID NO:1的密码子优化的核酸序列的至少90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性的核酸序列。SEQ ID NO:1的密码子优化的序列增强编码的天然存在的亚胺还原
酶的表达,提供能够在微型-DSP测定条件下将超过80%的化合物(2)体外转化为化合物
(1),以及在DSP测定条件下将超过45%的化合物(2)转化为化合物(1)的酶制品。
[0239] 在一些实施方案中,多核苷酸能够在高度严格条件下与SEQ ID NO:1的参考序列或其互补序列杂交,并且编码具有亚胺还原酶活性的多肽。
[0240] 在一些实施方案中,如以上所述,多核苷酸编码具有与SEQ ID NO:2相比的改进特性的具有亚胺还原酶活性的工程化多肽,其中所述多肽包括以下氨基酸序列,所述氨基酸
序列具有与选自偶数序列标识符SEQ ID NO:4–100和112-750的参考序列的至少80%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性,和与SEQ ID NO:2相比在选自以下的残基位置上一个或更多个残基差异:X4、X5、X14、X20、X29、X37、X67、X71、X74、X82、X94、X97、X100、X111、X124、X136、X137、X141、X143、X149、X153、X154、X156、X157、X158、X160、X163、X177、X178、X183、X184、X185、X186、X197、X198、X201、X220、X223、X226、X232、X243、X246、X256、X258、X259、X260、X261、X265、X266、X270、X273、X274、X277、X279、X280、X283、X284、X287、X288、X292,X293、X294、X295、X296、X297、X308、X311、X323、X324、X326、X328、X332、X353、和X356。在一些实施方案中,在这些残基位置上的残基差异选自:X4H/L/R;X5T;X14P;X20T;X29R/T;X37H;X67A/D;X71C/V;
X74R;X82P;X94K/R/T;X97P;X100W;X111M/Q/R/S;X124L/N;X136G;X137N;X141W;X143W;
X149L;X153V/Y;X154F/M/Q/Y;X156G/I/Q/S/T/V;X157D/H/L/M/N/R;X158K;X160N;X163T;
X177C/H;X178E;X183C;X184K/Q/R;X185V;X186K/R;X197I/P;X198A/E/H/P/S;X201L;
X220D/H;X223T;X226L;X232A/R;X243G;X246W;X256V;X258D;X259E/H/I/L/M/S/T/V/W;
X260G;X261A/G/I/K/R/S/T;X265G/L/Y;X266T;X270G;X273W;X274M;X277A/I;X279F/L/V/Y;X280L;X283V;X284K/L/M/Y;X287S/T;X288G/S;X292C/G/I/P/S/T/V/Y;X293H/I/K/L/N/Q/T/V;X294A/I/V;X295R/S;X296L/N/V/W;X297A;X308F;X311C/T/V;X323C/I/M/T/V;
X324L/T;X326V;X328A/G/E;X332V;X353E;和X356R。在一些实施方案中,参考序列选自SEQ ID NO:6、50、58、60、62、64、72、74、76、78、88、90、92、94、96、98和100。在一些实施方案中,参考序列是SEQ ID NO:2。在一些实施方案中,参考序列是SEQ ID NO:6。在一些实施方案中,参考序列是SEQ ID NO:88。在一些实施方案中,参考序列是SEQ ID NO:90。在一些实施方案中,参考序列是SEQ ID NO:92。在一些实施方案中,参考序列是SEQ ID NO:94。在一些实施方案中,参考序列是SEQ ID NO:96。在一些实施方案中,参考序列是SEQ ID NO:98。在一些实施方案中,参考序列是SEQ ID NO:100。
[0241] 在一些实施方案中,多核苷酸编码与SEQ ID NO:2相比具有改进的特性的能够将底物化合物(1b)和(2b)转化为产物化合物(3d)的亚胺还原酶多肽,其中多肽包括具有与参
考序列SEQ ID NO:2的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、
94%、95%、96%、97%、98%、99%或更多序列同一性以及与SEQ ID NO:2相比在选自以下的残基位置上的一个或更多个残基差异的氨基酸序列:X111、X136、X156、X197、X198、X201、X259、X280、X292、和X293。
[0242] 在一些实施方案中,多核苷酸编码与SEQ ID NO:2相比具有改进特性的能够将底物化合物(1b)和(2b)转化为产物化合物(3d)的亚胺还原酶多肽,其中多肽包括具有与参考
序列SEQ ID NO:2的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、
95%、96%、97%、98%、99%或更多序列同一性以及与SEQ ID NO:2相比至少选自以下的残基差异组合的氨基酸序列:(a)X111M、X156T、X198H、X259M、X280L、X292V、和X293H;(b)X156T、X197P、X198H、X259H、X280L、X292P、和X293H;(c)X111M、X136G、X156S、X197I、X198H、X201L、X259H、X280L、X292V、和X293H;(d)X197I、X198E、X259M、和X280L;(e)X156T、X197I、X198E、X201L、X259H、X280L、X292V、和X293H;(f)X111M、X136G、X198H、X259M、X280L、X292S、和X293H;以及(g)X156V、X197P、X198E、X201L、X259M、X280L、和X292T。
[0243] 在一些实施方案中,多核苷酸编码与SEQ ID NO:2的参考多肽相比具有改进的酶特性的能够将底物化合物(1b)和(2b)转化为产物化合物(3d)的工程化亚胺还原酶多肽,其
中多肽包括具有与选自偶数序列标识符SEQ ID NO:4–100和112-750的任一个的参考多肽
的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、
98%、或99%同一性的氨基酸序列,条件是所述氨基酸序列包括与SEQ ID NO:2相比包含在偶数序列标识符SEQ ID NO:4–100和112-750的多肽序列的任何一个中的残基差异集合中
的任何一个,如表3A–3J中列出的。
[0244] 在一些实施方案中,编码工程化亚胺还原酶的多核苷酸包括选自奇数序列标识符SEQ ID NO:3–99和111-749的多核苷酸序列。
[0245] 在一些实施方案中,多核苷酸能够在高度严格条件下与选自奇数序列标识符SEQ ID NO:3–99和111-749的参考多核苷酸序列或其互补序列杂交,并且编码具有本文描述的
一种或更多种改进的特性的具有亚胺还原酶活性的多肽。在一些实施方案中,能够在高度
严格条件下杂交的多核苷酸编码具有以下氨基酸序列的亚胺还原酶多肽,所述氨基酸序列
包括与SEQ ID NO:2相比在选自以下的残基位置上的一个或更多个残基差异:X4、X5、X14、X20、X29、X37、X67、X71、X74、X82、X94、X97、X100、X111、X124、X136、X137、X141、X143、X149、X153、X154、X156、X157、X158、X160、X163、X177、X178、X183、X184、X185、X186、X197、X198、X201、X220、X223、X226、X232、X243、X246、X256、X258、X259、X260、X261、X265、X266、X270、X273、X274、X277、X279、X280、X283、X284、X287、X288、X292,X293、X294、X295、X296、X297、X308、X311、X323、X324、X326、X328、X332、X353、和X356。在一些实施方案中,在这些残基位置上的特定残基差异选自:X4H/L/R;X5T;X14P;X20T;X29R/T;X37H;X67A/D;X71C/V;X74R;
X82P;X94K/R/T;X97P;X100W;X111M/Q/R/S;X124L/N;X136G;X137N;X141W;X143W;X149L;
X153V/Y;X154F/M/Q/Y;X156G/I/Q/S/T/V;X157D/H/L/M/N/R;X158K;X160N;X163T;X177C/H;X178E;X183C;X184K/Q/R;X185V;X186K/R;X197I/P;X198A/E/H/P/S;X201L;X220D/H;
X223T;X226L;X232A/R;X243G;X246W;X256V;X258D;X259E/H/I/L/M/S/T/V/W;X260G;
X261A/G/I/K/R/S/T;X265G/L/Y;X266T;X270G;X273W;X274M;X277A/I;X279F/L/V/Y;
X280L;X283V;X284K/L/M/Y;X287S/T;X288G/S;X292C/G/I/P/S/T/V/Y;X293H/I/K/L/N/Q/T/V;X294A/I/V;X295R/S;X296L/N/V/W;X297A;X308F;X311C/T/V;X323C/I/M/T/V;X324L/T;X326V;X328A/G/E;X332V;X353E;和X356R。
[0246] 在一些实施方案中,多核苷酸编码本文描述的多肽,但具有在核苷酸水平上与编码工程化亚胺还原酶的参考多核苷酸的约80%或更多序列同一性,约80%、85%、86%、
87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%或更多序列同一性。在一些实施方案中,参考多核苷酸序列选自奇数序列标识符SEQ ID NO:3–99和
111-749。
[0247] 编码改进的亚胺还原酶多肽的分离的多核苷酸可以以多种方式操作以提供多肽的表达。在一些实施方案中,编码多肽的多核苷酸可以被提供为表达载体,其中存在一个或更多个控制序列以调控多核苷酸和/或多肽的表达。取决于表达载体,分离的多核苷酸在其插入载体中之前的操作可以是令人期望的或必要的。利用重组DNA方法修改多核苷酸和核
酸序列的技术是本领域熟知的。在Sambrook等人,2001,Molecular Cloning:A Laboratory Manual,第3版,Cold Spring Harbor Laboratory Press;以及Current Protocols in 
Molecular Biology,Ausubel.F.编著,Greene Pub.Associates,1998,更新至2006中提供
了指导。
[0248] 在一些实施方案中,控制序列包括启动子、前导序列、多腺苷酸化序列、前肽序列、信号肽序列、和转录终止子以及其他。适合的启动子可基于使用的宿主细胞来选择。对于细菌宿主细胞,用于指导本公开内容的核酸构建体的转录的适合的启动子包括获自以下的启动子:大肠杆菌lac操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂酶基因(dagA)、枯草芽孢杆菌(Bacillus subtilis)果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌(Bacillus 
licheniformis)α-淀粉酶基因(amyL)、嗜热芽孢杆菌(Bacillus stearothermophilus)淀
粉酶基因(amyM)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因和原核的β-内酰胺酶基因(Villa-Kamaroff等人,1978,Proc.Natl Acad.Sci.USA 75:3727-3731),以及tac启动子(DeBoer等人,1983,Proc.Natl Acad.Sci.USA 80:21-25)。用于丝状真菌宿主细胞的示例性启动子,包括获自以下基因的启动子:米曲霉(Aspergillus oryzae)TAKA淀粉酶、米黑根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定型α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡糖淀粉酶(glaA)、米黑根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉(Aspergillus nidulans)乙酰胺酶和尖孢镰刀菌(Fusarium oxysporum)胰蛋白酶样蛋白酶(WO 96/
00787)以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶和米曲霉磷酸丙糖异构酶的基因的
启动子的杂合体)和其突变的、截短的和杂合的启动子。示例性酵母细胞启动子可来自以下基因可来自以下基因:酿酒酵母(Saccharomyces cerevisiae)烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)和酿酒酵母3-
磷酸甘油酸激酶。对酵母宿主细胞的其它有用的启动子由Romanos等人,1992,Yeast 8:
423-488描述。
[0249] 控制序列还可以是适当的转录终止子序列,转录终止子序列是由宿主细胞识别以终止转录的序列。终止子序列可操作地连接到编码多肽的核酸序列的3’末端。在选择的宿主细胞中有功能的任何终止子可用于本发明中。例如,用于丝状真菌宿主细胞的示例性转
录终止子可以获自以下的基因:米曲霉TAKA淀粉酶、黑曲霉葡萄糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖孢镰刀菌胰蛋白酶样蛋白酶。用于酵母宿主细胞的示例性终止子可以获自以下的基因:酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。对酵母宿主细胞的其他有用的终止子由上述Romanos等人,1992
描述。
[0250] 控制序列还可以是适当的前导序列,其是对于由宿主细胞翻译重要的mRNA的非翻译区。前导序列可操作地连接到编码多肽的核酸序列的5’末端。可使用在选择的宿主细胞中有功能的前导序列。用于丝状真菌宿主细胞的示例性前导序列获自以下的基因:米曲霉
TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶。用于酵母宿主细胞的适当的前导序列获自以下的
基因:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子和酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
[0251] 控制序列还可以是多腺苷酸序列,所述多腺苷酸序列是可操作地连接到核酸序列的3’末端的序列,并且当转录时,被宿主细胞识别为将聚腺苷残基加到转录的mRNA的信号。
在选择的宿主细胞中有功能的任何多腺苷酸序列可用于本发明中。用于丝状真菌宿主细胞
的示例性多腺苷酸序列可以获自以下的基因:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖孢镰刀菌胰蛋白酶样蛋白酶和黑曲霉α葡糖苷酶。对酵母宿主细胞有用的多腺苷酸序列由Guo和Sherman,1995,Mol Cell Bio15:5983-5990描述。
[0252] 控制序列还可以是信号肽编码区,其编码与多肽的氨基末端连接的氨基酸序列并将编码的多肽引导入细胞的分泌通路。核酸序列的编码序列的5’末端可以本身包括信号肽编码区,其与编码分泌的多肽的编码区的区段符合翻译读码框地天然连接。可选地,编码序列的5’末端可以包含对于编码序列是外来的信号肽编码区。将表达的多肽引导入选择的宿主细胞的分泌通路的任何信号肽编码区可以被用于本发明中。对细菌宿主细胞有效的信号
肽编码区是获自以下的基因的信号肽编码区:芽孢杆菌(Bacillus)NClB11837生麦芽糖淀
粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA。另外的信号肽由
Simonen和Palva,1993,Microbiol Rev 57:109-137描述。对丝状真菌宿主细胞有效的信号肽编码区可以是获自以下的基因的信号肽编码区:米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米黑根毛霉天冬氨酸蛋白酶、特异腐质霉(Humicola insolens)纤维素酶和柔毛腐质霉(Humicola lanuginosa)脂肪酶。对酵母宿主细胞有用的信号肽可以来自
酿酒酵母α因子和酿酒酵母转化酶的基因。其他有用的信号肽编码区由上述Romanos等人,
1992描述。
[0253] 控制序列还可以是前肽编码区,其编码定位在多肽的氨基末端的氨基酸序列。产生的多肽称为前酶(pro-enzyme)或前多肽(或在一些情况中酶原(zymogen))。通过从前多
肽催化或自催化裂解前肽,前多肽可以被转化成成熟的活性多肽。前肽编码区可以获自以
下的基因:枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α因子、米黑根毛霉天冬氨酸蛋白酶和嗜热毁丝霉(Myceliophthora thermophila)乳糖酶
(WO95/33836)。当信号肽和前肽区均存在于多肽的氨基末端时,前肽区定位为紧邻多肽的
氨基末端并且信号肽区定位为紧邻前肽区的氨基末端。
[0254] 加入调节序列也可以是期望的,调节序列允许关于宿主细胞的生长调节多肽的表达。调节系统的实例是引起响应化学或物理刺激物,包括调节化合物的存在,而开启或关闭基因的表达的那些调节系统。在原核宿主细胞中,适当的调节序列包括lac、tac和trp操纵子系统。在酵母宿主细胞中,适当的调节系统包括,作为实例的ADH2系统或GAL1系统。在丝状真菌中,适当的调节序列包括TAKA α-淀粉酶启动子、黑曲霉葡萄糖淀粉酶启动子和米曲霉葡萄糖淀粉酶启动子。
[0255] 调节序列的其他实例是允许基因扩增的那些。在真核系统中,这些包括二氢叶酸还原酶基因,其在氨甲喋呤的存在下被扩增;和金属硫蛋白基因,其用重金属扩增。在这些情况中,编码本发明的多肽的核酸序列将与调节序列可操作地连接。
[0256] 在另一方面,本公开内容还涉及重组表达载体,取决于其将被引入的宿主的类型,重组表达载体包括编码工程化亚胺还原酶多肽的多核苷酸、和一种或更多种表达调节区诸如启动子和终止子,复制起点等。以上描述的各种核酸和控制序列可连接在一起以产生重
组表达载体,其可包括一个或更多个方便的限制位点以允许编码多肽的核酸序列在这些位
点的插入或置换。可选地,本公开内容的核酸序列可通过将核酸序列或包括所述序列的核
酸构建体插入用于表达的适当的载体来表达。在产生表达载体时,编码序列位于载体中以
使编码序列与用于表达的适当的控制序列可操作地连接。
[0257] 重组表达载体可以是任何载体(例如,质粒或病毒),其可以方便地经历重组DNA程序并且可以引起多核苷酸序列的表达。载体的选择将通常取决于载体与载体将被引入的宿
主细胞的相容性。载体可以是线性的或闭合的环状质粒。
[0258] 表达载体可以是自主复制载体,即,作为染色体外实体存在的载体,其复制独立于染色体复制,自主复制载体例如质粒、染色体外元件、微型染色体或人工染色体。载体可包含用于保证自身复制的任何工具(means)。可选地,载体可以是当被引入宿主细胞时,被整合进入基因组并与其被整合进入的染色体一起复制的载体。此外,可以使用单一载体或质粒或一起包括待引入宿主细胞的基因组的总DNA的两种或更多种载体或质粒,或转座子。
[0259] 本发明的表达载体优选地包含一个或更多个可选择的标记物,其使得容易选择转化细胞。可选择的标记物是其产物提供杀生物剂或病毒抗性、对重金属的抗性、营养缺陷型的原养型以及类似性质的基因。细菌的可选择的标记物的实例是来自枯草芽孢杆菌或地衣
芽孢杆菌的dal基因,或赋予抗生素抗性如氨苄西林、卡那霉素、氯霉素(实施例1)或四环素抗性的标记物。用于酵母宿主细胞的适当的标记物是ADE2、HIS3、LEU2、LYS2、MET3、TRP1、和URA3。用于丝状真菌宿主细胞的可选择的标记物包括但不限于:amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草胺膦乙酰基转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合酶)以及其等同物。用于曲霉细胞的实施方案包括构巢曲霉或米曲霉的amdS和pyrG基因
和吸水链霉菌(Streptomyces hygroscopicus)的bar基因。
[0260] 在另一个方面,本公开内容提供了包括编码本公开内容的改进的亚胺还原酶多肽的多核苷酸的宿主细胞,该多核苷酸与用于在该宿主细胞中表达亚胺还原酶的一个或更多
个控制序列可操作地连接。在表达由本发明的表达载体编码的多肽中使用的宿主细胞是本
领域熟知的并且包括但不限于:细菌细胞,诸如大肠杆菌、枯草芽孢杆菌、链霉菌属和鼠伤寒沙氏菌(Salmonella typhimurium)的细胞;真菌细胞,诸如酵母细胞(例如,酿酒酵母或巴斯德毕赤酵母(Pichia pastoris)(ATCC登录号201178));昆虫细胞诸如果蝇S2细胞和
夜蛾(Spodoptera)Sf9细胞;动物细胞诸如CHO、COS、BHK、293和Bowes黑色素瘤细胞;以及植物细胞。示例性宿主细胞是大肠杆菌W3110(ΔfhuA)和BL21。
[0261] 用于以上描述的宿主细胞的适当培养基和生长条件是本领域熟知的。可通过本领域已知的多种方法将用于表达亚胺还原酶的多核苷酸引入细胞中。技术包括电穿孔、生物
射弹粒子轰击、脂质体介导的转染、氯化转染和原生质体融合以及其他。
[0262] 在一些实施方案中,多肽可以在无细胞表达系统,例如描述于以下中的那些中表达:Kudlicki等人,Cell Free Expression,第1版,Landes Biosciences(2007)和Cell 
Free Protein Synthesis:Methods and Protocols,第1版,Spirin等人,编著,Wiley-VCH
(2007),所有这些都通过引用并入本文。
[0263] 在本文的实施方案中,可使用本领域技术人员使用的方法获得改进的多肽及相应的多核苷酸。本文所述的工程化亚胺还原酶可通过使编码天然存在的基因,该天然存在的
基因编码野生型冠瘿碱脱氢酶CENDH(SEQ ID NO:2)或其他工程化亚胺还原酶的多核苷酸
经历诱变和/或定向进化方法而获得,如以上所讨论的。示例性的定向进化技术是诱变和/
或定向进化方法(参见,例如,Stemmer,1994,Proc Natl Acad Sci USA 91:10747-10751;
PCT公布号WO 95/22625、WO 97/0078、WO 97/35966、WO 98/27230、WO 00/42651、和WO 01/
75767;美国专利号6,537,746、6,117,679、6,376,246、和6,586,182;以及美国专利公布号
20080220990A1和20090312196A1;其中的每一个在此通过引用并入本文。可以使用的其他
定向进化程序包括交错延伸过程(StEP)、体外重组(Zhao等人,1998,Nat.Biotechnol.16:
258–261)、诱变PCR(Caldwell等人,1994,PCR Methods Appl.3:S136-S140)、和盒式诱变(Black等人,1996,Proc Natl Acad Sci USA93:3525-3529)以及其他。用于本文目的的诱
变和定向进化技术也被描述在以下文献中:Ling,等人,1997,Anal.Biochem.254(2):157-
78;Dale等人,1996,“Oligonucleotide-directed random mutagenesis using the 
phosphorothioate method,”In Methods Mol.Biol.57:369-74;Smith,1985,
Ann.Rev.Genet.19:423-462;Botstein等人,1985,Science 229:1193-1201;Carter,1986,Biochem.J.237:1-7;Kramer等人,1984,Cell,38:879-887;Wells等人,1985,Gene 34:315-
323;Minshull等人,1999,Curr Opin Chem Biol 3:284-290;Christians等人,1999,
Nature Biotech 17:259-264;Crameri等人,1998,Nature 391:288-291;Crameri等人,
1997,Nature Biotech15:436-438;Zhang等人,1997,Proc Natl Acad Sci USA 94:45-4-
4509;Crameri等人,1996,Nature Biotech 14:315-319;Stemmer,1994,Nature370:389-
391;Stemmer,1994,Proc Natl Acad Sci USA 91:10747-10751;WO95/22625;WO 97/0078;
WO 97/35966;WO 98/27230;WO 00/42651;WO 01/75767和美国专利6,537,746。所有出版物通过引用并入本文。
[0264] 可对诱变处理后获得的克隆筛选具有一种或更多种期望的改进的酶特性的工程化亚胺还原酶。例如,当期望的改进的酶特性是酮化合物(1b)和胺化合物(2b)向仲胺化合
物(3d)的转化中的增加的活性时,酶活性可测量为化合物(3d)的产生。然后将包含编码具
有期望的特性,例如化合物(3d)的增加的生产的亚胺还原酶的多核苷酸克隆,分离、测序以确定核苷酸序列变化(如果有),并用于在宿主细胞中表达该酶。可使用标准生物化学技术,诸如HPLC分析和/或产物(分离前或分离后)的例如用丹磺酰氯或OPA衍生化,进行测量来自
表达文库的酶活性。
[0265] 当工程化多肽的序列是已知的时,编码酶的多核苷酸可根据已知的合成方法通过标准的固相方法被制备。在一些实施方案中,多至约100个碱基的片段可以被单独地合成,然后连接(例如,通过酶或化学连接方法或聚合酶介导的方法)以形成任何期望的连续序
列。例如,编码亚胺还原酶的部分的多核苷酸和寡核苷酸可使用以下通过化学合成被制备:
例如,由Beaucage等人,1981,Tet Lett 22:1859-69描述的经典的亚磷酰胺法或由Matthes等人,1984,EMBO J.3:801-05描述的方法,例如,如通常在自动化合成方法中所实践的。根据亚磷酰胺方法,寡核苷酸被例如在自动化DNA合成器中合成,纯化,退火,连接和克隆入适当的载体。此外,基本上任何核酸可从任何各种商业来源获得。在一些实施方案中,可通过合成包含缺失、插入、和/或置换的寡核苷酸,并以各种排列组合寡核苷酸以创造具有改进的特性的工程化亚胺还原酶。
[0266] 因此,在一些实施方案中,用于制备工程化亚胺还原酶多肽的方法可包括:(a)合成编码以下多肽的多核苷酸,所述多肽包括选自偶数序列标识符SEQ ID NO:4–100和112–
750,和具有与SEQ ID NO:2相比在选自以下的残基位置上一个或更多个残基差异的氨基酸
序列:X4、X5、X14、X20、X29、X37、X67、X71、X74、X82、X94、X97、X100、X111、X124、X136、X137、X141、X143、X149、X153、X154、X156、X157、X158、X160、X163、X177、X178、X183、X184、X185、X186、X197、X198、X201、X220、X223、X226、X232、X243、X246、X256、X258、X259、X260、X261、X265、X266、X270、X273、X274、X277、X279、X280、X283、X284、X287、X288、X292、X293、X294、X295、X296、X297、X308、X311、X323、X324、X326、X328、X332、X353、和X356;以及(b)表达由多核苷酸编码的亚胺还原酶多肽。
[0267] 在该方法的一些实施方案中,在残基位置X4、X5、X14、X20、X29、X37、X67、X71、X74、X82、X94、X97、X100、X111、X124、X136、X137、X141、X143、X149、X153、X154、X156、X157、X158、X160、X163、X177、X178、X183、X184、X185、X186、X197、X198、X201、X220、X223、X226、X232、X243、X246、X256、X258、X259、X260、X261、X265、X266、X270、X273、X274、X277、X279、X280、X283、X284、X287、X288、X292,X293、X294、X295、X296、X297、X308、X311、X323、X324、X326、X328、X332、X353、和X356上的残基差异选自X4H/L/R;X5T;X14P;X20T;X29R/T;X37H;X67A/D;X71C/V;X74R;X82P;X94K/R/T;X97P;X100W;X111M/Q/R/S;X124L/N;X136G;X137N;X141W;X143W;X149L;X153V/Y;X154F/M/Q/Y;X156G/I/Q/S/T/V;X157D/H/L/M/N/R;X158K;X160N;
X163T;X177C/H;X178E;X183C;X184K/Q/R;X185V;X186K/R;X197I/P;X198A/E/H/P/S;
X201L;X220D/H;X223T;X226L;X232A/R;X243G;X246W;X256V;X258D;X259E/H/I/L/M/S/T/V/W;X260G;X261A/G/I/K/R/S/T;X265G/L/Y;X266T;X270G;X273W;X274M;X277A/I;X279F/L/V/Y;X280L;X283V;X284K/L/M/Y;X287S/T;X288G/S;X292C/G/I/P/S/T/V/Y;X293H/I/K/L/N/Q/T/V;X294A/I/V;X295R/S;X296L/N/V/W;X297A;X308F;X311C/T/V;X323C/I/M/T/V;
X324L/T;X326V;X328A/G/E;X332V;X353E;和X356R。
[0268] 在该方法的一些实施方案中,多核苷酸可编码任选地具有一个或数个(例如,多达3个、4个、5个、或多达10个)氨基酸残基缺失、插入和/或置换的工程化亚胺还原酶。在一些实施方案中,氨基酸序列任选地具有1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-15个、1-20个、1-21个、1-22个、1-23个、1-24个、1-25个、1-30个、1-35个、1-40个、1-45个、或1-50个氨基酸残基缺失、插入和/或置换。在一些实施方案中,氨基酸序列的数目任选地具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个、或50个氨基酸残基缺失、插入和/或置换。在一些实施方案中,氨基酸序列任选地具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、18个、20个、21个、22个、23个、24个、或25个氨基酸残基缺失、插入和/或置换。在一些实施方案中,置换可以是保守的或非保守的置换。
[0269] 在另一方面,本公开内容提供了制造工程化亚胺还原酶多肽的方法,其中该方法可包括将能够表达编码亚胺还原酶多肽的多核苷酸的宿主细胞在适合于表达该多肽的条
件下培养。方法还可包括分离的或纯化表达的亚胺还原酶多肽,如本文描述的。
[0270] 在一些实施方案中,用于制备或制造工程化亚胺还原酶多肽的方法还包括分离多肽的步骤。工程化多肽可表达于适当的细胞,如以上所述,并使用任何一种或更多种用于蛋白纯化的熟知的技术从宿主细胞、培养基、和/或表达介质(expression medium)分离(或回收),技术包括,溶菌酶处理、声处理、过滤、盐析、超速离心和色谱法以及其他。用于溶解和从细菌,诸如大肠杆菌,高效提取蛋白的适合的溶液是商业上可获得的,诸如来自St.Louis MO的Sigma-Aldrich的CelLytic BTM。用于分离亚胺还原酶多肽的色谱方法包括,反相色谱法、高效液相色谱法、离子交换色谱法、凝胶电泳和亲和色谱法以及其他。
[0271] 在一些实施方案中,本公开内容的非天然存在的多肽可以以各种形式来制备和使用,所述形式包括但不限于粗提物(例如,无细胞溶解产物)、粉末(例如,摇瓶粉)、冻干产物、和基本上纯的制品(例如,DSP粉),如在以下实施例中进一步阐述的。
[0272] 在一些实施方案中,工程化多肽可以以纯化的方式,例如基本上纯化的方式来制备和使用。通常,用于纯化具体的多肽的条件将部分地取决于诸如净电荷、疏水性、亲水性、分子量、分子形状等因素,并且对于本领域技术人员将是显然的。为了便于纯化,可以设想,在一些实施方案中,工程化多肽可以表达为具有纯化标签,诸如具有对金属的亲和力的
His-标签、或结合到抗体上的抗体标签,例如myc表位标签的融合蛋白。
[0273] 在一些实施方案中,亲和技术可被用于分离改进的亚胺还原酶。对于亲和色谱纯化,可使用特异性结合亚胺还原酶多肽的任何抗体。对于抗体的产生,各种宿主动物,包括但不限于:兔、小鼠、大鼠等,可通过注射亚胺还原酶多肽或其片段而被免疫。亚胺还原酶多肽或片段可借助侧链官能团或连接到侧链官能团的连接子被连接到适合的载体,诸如BSA。
在一些实施方案中,亲和纯化可使用亚胺还原酶结合的特定配体,诸如聚(L-脯氨酸)或染
料亲和柱(参见,例如,EP0641862;Stellwagen,E.,2001,“Dye  Affinity 
Chromatography,”于Current Protocols in Protein Science Unit9.2-9.2.16)。
[0274] 使用工程化亚胺还原酶的方法
[0275] 在另一方面,具有本文描述的亚胺还原酶活性的工程化多肽可被用于将式(I)的化合物和式(II)的化合物转化为式(III)的仲胺或叔胺化合物的方法中,如以上所述和方
案1中所示。通常,用于进行方案1的还原胺化反应的此类生物催化方法包括在适于形成式
(III)的胺产物化合物的反应条件下,在辅因子,诸如NADH或NADPH的存在下,使酮和胺底物化合物与本公开内容的具有亚胺还原酶活性的工程化多肽接触或温育。
[0276] 在一些实施方案中,亚胺还原酶可用于制备式(III)的仲胺或叔胺产物化合物的生物催化方法中,
[0277]
[0278] 其中,R1和R2基团独立地选自任选地取代的烷基、烯基、炔基、烷氧基、羧基、氨基羰基、杂烷基、杂烯基、杂炔基、羧基烷基、氨基烷基、卤代烷基、烷基硫代烷基、环烷基、芳基、芳基烷基、杂环烃基、杂芳基和杂芳基烷基;且任选地R1与R2连接以形成3元至10元环;R3和R4基团独立地选自氢原子,以及任选地取代的烷基、烯基、炔基、烷氧基、羧基、氨基羰基、杂烷基、杂烯基、杂炔基、羧基烷基、氨基烷基、卤代烷基、烷基硫代烷基、环烷基、芳基、芳基烷基、杂环烃基、杂芳基和杂芳基烷基,条件是R3和R4两者不能同时是氢;且任选地R3和R4连接以形成3元至10元环;并且任选地,由*指示的碳原子和/或氮原子是手性的。该方法包括使式(I)的酮化合物,
[0279]
[0280] 其中R1、和R2如以上所定义;以及式(II)的胺化合物,
[0281]
[0282] 其中R3、和R4如以上所定义;与具有亚胺还原酶活性的工程化多肽接触,在适当的反应条件下在辅因子的存在下接触。
[0283] 如表2、和表3A-3J中的反应所示,本公开内容的具有亚胺还原酶活性的工程化多肽具有对以下的活性,或可进一步被设计以具有对以下的活性:在用于制备式(III)的化合物的方法中的宽范围的式(II)的胺底物化合物。因此,在用于制备式(III)的仲胺或叔胺产物化合物的以上生物催化方法的一些实施方案中,式(II)的化合物可以是伯胺,其中R3和R4的至少一个是氢,由此式(III)的产物是仲胺化合物。在该方法的一些实施方案中,R3或R4均不是氢,且式(II)的化合物是仲胺,由此式(III)的化合物是叔胺。在该方法的一些实施方案中,式(II)的化合物是仲胺,且R3或R4是不同的,由此式(III)的胺化合物的以*指示的氮原子是手性的。此外,在一些实施方案中,式(III)的手性胺化合物的一种立体异构体立体选择性地形成,并任选地高度立体选择性地形成(例如,以至少约85%立体异构体过量)。
[0284] 在用于制备式(III)的仲胺或叔胺产物化合物的生物催化方法的一些实施方案中,式(II)的化合物的R3和R4基团连接形成3元至10元环。在一些实施方案中,环是5元至8元的,是任选地取代的环烷基、芳基、芳基烷基、杂环烃基、杂芳基或杂芳烷基环。
[0285] 在用于制备式(III)的胺产物化合物的生物催化方法的一些实施方案中,式(II)的化合物是伯胺,其中R3基团是氢,且R4选自任选地取代的(C1-C6)烷基、(C1-C6)烯基、(C1-C6)炔基、(C1-C6)羧基烷基、(C1-C6)氨基烷基、(C1-C6)卤代烷基、和(C1-C6)烷基硫代烷基。在
4
一些实施方案中,R 基团选自任选地取代的(C1-C6)烷基、(C1-C6)羧基烷基、和(C1-C6)氨基烷基。在一些实施方案中,R4基团是任选地取代的(C1-C6)烷基、或(C1-C6)羧基烷基。在一些实施方案中,式(II)的化合物选自甲胺、二甲胺、异丙胺、丁胺、和异丁胺。在一些实施方案中,胺底物化合物R3基团是氢,且R4选自任选地取代的(C4-C8)环烷基、(C4-C8)杂环烃基、(C4-C8)芳基、(C4-C8)芳基烷基、(C4-C8)杂芳基、和(C4-C8)杂芳基烷基。在一些实施方案中,胺底物化合物R3基团是氢,且R4选自任选地取代的(C4-C8)芳基、(C4-C8)芳基烷基、(C4-C8)杂芳基、和(C4-C8)杂芳基烷基。在一些实施方案中,胺底物化合物R3基团是氢,且R4是任选地取代的(C4-C8)芳基。在一些实施方案中,式(II)的化合物是任选地取代的苯胺。
[0286] 如表2、和表3A-3J中的反应所示,本公开内容的具有亚胺还原酶活性的工程化多肽具有对以下的活性,或可进一步被设计以具有对以下的活性:在用于制备式(III)的化合物的方法中的宽范围的式(I)的酮底物化合物。在一些实施方案中,酮底物化合物(I)的R1
和R2基团是不同的,由此式(III)的胺化合物的由*指示的碳原子是手性的。此外,在该方法的一些实施方案中,式(III)的手性胺化合物的一种立体异构体立体选择性地形成,并任选地高度立体选择性地形成(例如,以至少约85%立体异构体过量)。
[0287] 在用于制备式(III)的仲胺或叔胺产物化合物的生物催化方法的一些实施方案中,式(I)的化合物的R1和R2基团连接形成3元至10元环。在一些实施方案中,环是任选地取代的环烷基、芳基、芳基烷基、杂环烃基、杂芳基或杂芳烷基环。在该方法的一些实施方案中,式(I)的化合物选自任选地取代的环丁酮、环戊酮、环己酮、和环庚酮。
[0288] 在用于制备式(III)的仲胺或叔胺产物化合物的生物催化方法的一些实施方案中,式(I)的化合物的R1和R2基团独立地选自任选地取代的(C1-C6)烷基、(C1-C6)烯基、(C1-C6)炔基、(C1-C6)羧基烷基、(C1-C6)氨基烷基、(C1-C6)卤代烷基、和(C1-C6)烷基硫代烷基。
[0289] 在用于制备式(III)的仲胺或叔胺产物化合物的生物催化方法的一些实施方案中,式(I)的化合物的R1基团选自任选地取代的(C1-C6)烷基、(C1-C6)烯基、(C1-C6)炔基、(C1-C6)羧基烷基、(C1-C6)氨基烷基、(C1-C6)卤代烷基、和(C1-C6)烷基硫代烷基;且式(I)的化合物的R2基团选自任选地取代的(C4-C8)环烷基、(C4-C8)杂环烃基、(C4-C8)芳基烷基、(C4-C8)杂芳基、和(C4-C8)杂芳基烷基。
[0290] 在用于制备式(III)的仲胺或叔胺产物化合物的生物催化方法的一些实施方案中,式(I)的化合物的R1基团是羧基。在一些实施方案中,式(I)的化合物是选自以下的2-酮酸:丙酮酸、2-氧代-丙酸、2-氧代-丁酸、2-氧代-戊酸、2-氧代-己酸。
[0291] 在用于制备式(III)的仲胺或叔胺产物化合物的生物催化方法的一些实施方案中,式(I)的化合物的R1基团是氢原子,且式(I)的化合物是醛。在此类实施方案中,式(I)的
1
化合物的R基团选自任选地取代的烷基、烯基、炔基、烷氧基、羧基、氨基羰基、杂烷基、杂烯基、杂炔基、羧基烷基、氨基烷基、卤代烷基、烷基硫代烷基、环烷基、芳基、芳基烷基、杂环烃基、杂芳基和杂芳基烷基。
[0292] 如由表2中的反应列出的式(I)、(II)、和(III)的化合物所示,在用于制备式(III)的仲胺或叔胺产物化合物的以上生物催化方法的一些实施方案中,式(III)的产物化合物包括选自由以下组成的组的化合物:化合物(3a)、化合物(3b)、化合物(3c)、化合物(3d)、化合物(3e)、化合物(3f)、化合物(3g)、化合物(3h)、化合物(3i)、化合物(3j)、化合物(3k)、化合物(3l)、化合物(3m)、化合物(3n)、和化合物(3o)。在该方法的一些实施方案中,式(I)的化合物包括选自由以下组成的组的化合物:化合物(1a)、化合物(1b)、化合物(1c)、化合物(1d)、化合物(1e)、化合物(1f)、化合物(1g)、化合物(1h)、化合物(1i)、和化合物(1j)。在该方法的一些实施方案中,式(II)的化合物包括选自由以下组成的组的化合物:化合物(2a)、化合物(2b)、化合物(2c)、化合物(2d)、化合物(2e)、和化合物(2f)。
[0293] 还预期在一些实施方案中,用于由本公开内容的具有亚胺还原酶活性的工程化多肽催化的制备式(III)的胺产物化合物的方法包括分子内反应,其中式(I)的化合物和式
(II)的化合物是相同的单分子上的基团。因此,在一些实施方案中,式(I)的酮化合物的R1和R2的至少一个连接至式(II)的胺化合物的R3和R4的至少一个上,并且该方法包括在适当
的反应条件下使具有连接至式(II)的胺基团的式(I)的酮基团的单一化合物与本公开内容
的工程化多肽接触。说明性的分子内反应包括但不限于以下表4中显示的方案2-5的反应,
其中,基团R1和R3如以上对于基团R1和R3所定义,且基团R5选自氢原子,和任选地取代的烷基、烯基、炔基、烷氧基、羧基、氨基羰基、杂烷基、杂烯基、杂炔基、羧基烷基、氨基烷基、卤代烷基、烷基硫代烷基、环烷基、芳基、芳基烷基、杂环烃基、杂芳基和杂芳基烷基。
[0294] 表4
[0295]
[0296] 不受理论所束缚,认为在大多数情况下,方案1的生物催化反应包括形成中间体胺化合物(例如,亚胺中间体),其然后进一步被酶还原为式(III)的最终仲胺或叔胺产物化合物。还预期,在一些实施方案中,用于由本公开内容的具有亚胺还原酶活性的工程化多肽催化的制备式(III)的胺产物化合物的方法包括使本公开内容的工程化亚胺还原酶多肽与式
(I)的酮化合物和式(II)的伯胺化合物接触,由此形成亚胺中间体,该亚胺中间体然后经历分子内非对称环化反应以产生环状仲或叔羟基胺中间体,其经历羟基消去以产生第二亚胺
(或烯胺)中间体。然后该第二亚胺(或烯胺)随后在原位被本公开内容的工程化亚胺还原酶
多肽还原以产生最终环状胺产物。包括通过羟基胺中间体的非对称环化的说明性的反应包
括但不限于以下表5中显示的方案6-9的反应,其中,基团R1和R3如以上对于基团R1和R3所定
5 6 7
义,且基团R、R 、和R独立地选自氢原子,和任选地取代的烷基、烯基、炔基、烷氧基、羧基、氨基羰基、杂烷基、杂烯基、杂炔基、羧基烷基、氨基烷基、卤代烷基、烷基硫代烷基、环烷基、芳基、芳基烷基、杂环烃基、杂芳基和杂芳基烷基。
[0297] 表5
[0298]
[0299] 不受理论所束缚,认为具有亚胺还原酶活性(IRED)的工程化多肽不仅介导如方案2-9的反应中显示的亚胺和/或羟基胺中间体的形成,而且介导由第二反应箭头所描绘的亚
胺中间体至式(III)的最终胺产物化合物的转化。
[0300] 通常,亚胺化合物不如胺化合物稳定并容易受到不期望的氧化反应。然而,预期,在本公开内容的方法的一些实施方案中,亚胺化合物,或可发生互变以形成亚胺的烯胺化合物,可在缺乏酶的存在下由式(I)的酮和式(II)的胺化合物形成,并且然后与本公开内容的工程化多肽接触以催化其向式(III)的仲胺或叔胺产物化合物的最终的转化。例如,亚胺或烯胺中间体化合物首先可通过合并式(I)的酮与式(II)的胺化合物来形成,如方案6-9中
所示,但没有IRED的存在(即,具有亚胺还原酶活性的工程化多肽)。然后可使直接形成的或来自烯胺化合物的互变异构化的亚胺化合物与具有亚胺还原酶活性的工程化多肽接触以
催化向式(III)的最终胺产物化合物的转化。在一些实施方案中,预期亚胺或烯胺中间体化合物,当适当地稳定时,可在进行使其与具有亚胺还原酶活性的工程化多肽接触的步骤之
前进行分离。因此,预期,在该方法的一些实施方案中,亚胺或烯胺化合物首先由式(I)和式(II)的化合物或通过具有与胺基团连接的酮基团的化合物的分子内反应来形成,并然后使
该亚胺或烯胺化合物与具有亚胺还原酶活性的工程化多肽接触以形成式(III)的胺产物化
合物。
[0301] 在一些实施方案中,稳定的亚胺或烯胺化合物可获得(即,无需首先使式(I)的酮化合物和式(II)的胺化合物反应)并直接用作IRED的底物。预期,在此类实施方案中,进行以下生物催化方法,其中仅存在是稳定的亚胺或烯胺化合物的单一底物,并且使该化合物
与本公开内容的具有亚胺还原酶活性的工程化多肽接触,该工程化多肽催化稳定的亚胺化
合物的还原以形成式(III)的仲化合物。在此类的反应中,工程化多肽的立体选择性可介导邻近式(III)的化合物的胺基团的手性中心的形成。表6(以下)列出了稳定的亚胺化合物的
三个实例,所述稳定的亚胺化合物可在使用本公开内容的工程化多肽的生物催化方法中经
历手性还原以产生用于合成药物索非那新(solifenacin)和他达拉非以及用于合成药物化
合物右哌甲酯(Dexmethylphenidate)的中间体化合物。
[0302] 表6
[0303]
[0304]
[0305] 可选地,还设想经由分离的亚胺或烯胺底物化合物的IRED催化的反应产生的式(III)的任何产物化合物(如表6中所示)还可使用亚胺或烯胺底物化合物的开链版本作为
底物经由IRED催化的分子内反应(像表4中所示的那些)来生成。因此,表6的每个产物化合
物还可使用表7中显示的分子间底物与本公开内容的具有亚胺还原酶活性的工程化多肽来
做出。
[0306] 表7
[0307]
[0308]
[0309] 存在大量包括仲胺或叔胺基团的活性药物成分化合物,所述仲胺或叔胺基团可经由使用本公开内容的具有亚胺还原酶活性的工程化多肽,和/或通过本公开内容的工程化
多肽的进一步定向进化产生的工程化多肽的生物催化还原胺化来产生。例如,表8列出了是已知的活性药物成分化合物、或用于合成活性药物成分化合物有用的中间体化合物的各种
式(III)的产物化合物,其可使用本公开内容的具有亚胺还原酶活性的工程化多肽与式(I)
和/或式(II)的相应底物化合物来生成。
[0310] 表8
[0311]
[0312]
[0313]
[0314] 在用于制备式(III)的仲胺或叔胺产物化合物的以上生物催化方法的一些实施方案中,具有亚胺还原酶活性的工程化多肽源自天然存在的冠瘿碱脱氢酶。在一些实施方案
中,天然存在的冠瘿碱脱氢酶选自:来自节杆菌Arthrobacter sp.菌株1C(SEQ ID NO:2)的冠瘿碱脱氢酶、来自欧洲大扇贝的D-章鱼碱脱氢酶(SEQ ID NO:102)、来自乳酸乳球菌K1的鸟氨酸脱氢酶(SEQ ID NO:104)、来自恶臭假单胞菌的N-甲基-L-氨基酸脱氢酶(SEQ ID 
NO:106)、来自斗笠螺的β-丙氨酸冠瘿碱脱氢酶(SEQ ID NO:108)、来自居蟹皮海绵的牛磺奥品脱氢酶(SEQ ID NO:110)。在一些实施方案中,具有亚胺还原酶活性的工程化多肽是源自SEQ ID NO:2的来自节杆菌Arthrobacter sp.菌株1C的冠瘿碱脱氢酶的工程化多肽,如
本文公开的,并且由偶数序列标识符SEQ ID NO:4-100和112-750的工程化亚胺还原酶多肽
示例。
[0315] 本文描述的任何工程化亚胺还原酶可用于制备式(III)的仲胺或叔胺化合物的以上生物催化方法中。通过示例的方法而非限制,在一些实施方案中,该方法可使用包括以下氨基酸序列的工程化亚胺还原酶多肽,所述氨基酸序列具有与选自偶数序列标识符SEQ ID NO:4–100和112-750的参考序列的至少80%、85%、86%、87%、88%、89%、90%、91%、
92%、93%、94%、95%、96%、97%、98%、99%或更多同一性。在该方法的一些实施方案中,工程化亚胺还原酶多肽包括具有与SEQ ID NO:2相比在以下残基位置上的一个或更多个残
基差异的氨基酸序列:X4、X5、X14、X20、X29、X37、X67、X71、X74、X82、X94、X97、X100、X111、X124、X136、X137、X141、X143、X149、X153、X154、X156、X157、X158、X160、X163、X177、X178、X183、X184、X185、X186、X197、X198、X201、X220、X223、X226、X232、X243、X246、X256、X258、X259、X260、X261、X265、X266、X270、X273、X274、X277、X279、X280、X283、X284、X287、X288、X292,X293、X294、X295、X296、X297、X308、X311、X323、X324、X326、X328、X332、X353、和X356。
在该方法的一些实施方案中,在残基位置X4、X5、X14、X20、X29、X37、X67、X71、X74、X82、X94、X97、X100、X111、X124、X136、X137、X141、X143、X149、X153、X154、X156、X157、X158、X160、X163、X177、X178、X183、X184、X185、X186、X197、X198、X201、X220、X223、X226、X232、X243、X246、X256、X258、X259、X260、X261、X265、X266、X270、X273、X274、X277、X279、X280、X283、X284、X287、X288、X292,X293、X294、X295、X296、X297、X308、X311、X323、X324、X326、X328、X332、X353、和X356上的残基差异选自X4H/L/R;X5T;X14P;X20T;X29R/T;X37H;X67A/D;
X71C/V;X74R;X82P;X94K/R/T;X97P;X100W;X111M/Q/R/S;X124L/N;X136G;X137N;X141W;
X143W;X149L;X153V/Y;X154F/M/Q/Y;X156G/I/Q/S/T/V;X157D/H/L/M/N/R;X158K;X160N;
X163T;X177C/H;X178E;X183C;X184K/Q/R;X185V;X186K/R;X197I/P;X198A/E/H/P/S;
X201L;X220D/H;X223T;X226L;X232A/R;X243G;X246W;X256V;X258D;X259E/H/I/L/M/S/T/V/W;X260G;X261A/G/I/K/R/S/T;X265G/L/Y;X266T;X270G;X273W;X274M;X277A/I;X279F/L/V/Y;X280L;X283V;X284K/L/M/Y;X287S/T;X288G/S;X292C/G/I/P/S/T/V/Y;X293H/I/K/L/N/Q/T/V;X294A/I/V;X295R/S;X296L/N/V/W;X297A;X308F;X311C/T/V;X323C/I/M/T/V;
X324L/T;X326V;X328A/G/E;X332V;X353E;和X356R。
[0316] 在以上方法的一些实施方案中,可使用能够进行本文公开的表2的转化反应(a)–(o)的示例性亚胺还原酶。这包括本文公开的、包括选自偶数序列标识符SEQ ID NO:4–100和112–750的氨基酸序列的工程化多肽。对工程化亚胺还原酶的选择和使用的指导提供于
本文的说明书,例如表3A–3J,和实施例。
[0317] 在本文中的实施方案中并在实施例中所示,可在方法中使用的适当的反应条件的各种范围,包括但不限于,底物载量、辅因子载量、多肽载量、pH、温度、缓冲液、溶剂系统、反应时间、和/或以多肽固定在固体支持物上的条件。用于使用本文所述的工程化亚胺还原酶多肽进行用于将底物化合物生物催化转化为产物化合物的方法的另外的适当的反应条件
可根据本文提供的指导易于通过常规实验来优化,常规实验包括但不限于:使工程化亚胺
还原酶多肽与感兴趣的酮和胺底物化合物在浓度、pH、温度、和溶剂条件的实验反应条件下接触,并检测产物化合物。
[0318] 通常,在本公开内容的方法中,适当的反应条件包括可在由亚胺还原酶进行的还原反应中起电子供体作用的辅因子分子的存在。在一些实施方案中,辅因子选自(但不限
于)NADP+(烟酰胺腺嘌呤二核苷酸磷酸)、NADPH(NADP+的还原形式)、NAD+(烟酰胺腺嘌呤二+
核苷酸)和NADH(NAD的还原形式)。通常,将辅因子的还原形式添加至酶反应混合物中。因
此,在一些实施方案中,方法在选自NADPH和NADH(这两个辅因子在本文中还统称为“NAD(P)H”)的辅因子的存在下进行。在一些实施方案中,电子供体是NADPH辅因子。在一些实施方案中,可进行该方法,其中反应条件包括以下的NADH或NADPH辅因子浓度:约0.03至约1g/L、
0.03至约0.8g/L、约0.03至约0.5g/L、约0.05至约0.3g/L、约0.05至约0.2g/L、或约0.1至约
0.2g/L。在一些实施方案中,在以下的NADH或NADPH辅因子浓度下进行该方法:约1g/L、约
0.8g/L、约0.5g/L、约0.3g/L、约0.2g/L、约0.1g/L、约0.05g/L、或约0.03g/L。
[0319] 在该方法的一些实施方案中,任选的辅因子再循环系统,还称为辅因子再生系统,+ +可用于从酶促反应中产生的NADP/NAD再生辅因子NADPH/NADH。辅因子再生系统是指参加
还原辅因子的氧化形式的反应(例如,NADP+至NADPH)的一组反应物。由多肽还原酮类底物
氧化的辅因子通过辅因子再生系统以还原形式再生。辅因子再生系统包括化学计量的还原
剂,其是还原氢等同物的来源并且能够还原辅因子的氧化形式。辅因子再生系统还可包括
催化还原剂对辅因子的氧化形式的还原的催化剂,例如酶催化剂。用于从NAD+或NADP+分别再生NADH或NADPH的辅因子再生系统是本领域已知的并且可在本文描述的方法中使用。
[0320] 可在本公开内容的亚胺还原酶方法中应用的适合的示例性辅因子再生系统包括,但不限于,甲酸和甲酸脱氢酶、葡萄糖和葡萄糖脱氢酶、葡萄糖-6-磷酸和葡萄糖-6-磷酸脱氢酶、仲醇和醇脱氢酶、亚磷酸和亚磷酸脱氢酶、分子氢和氢化酶等。这些系统可以与NADP+/NADPH或NAD+/NADH作为辅因子组合使用。使用氢化酶的电化学再生也可用作辅因子再生
系统。参见,例如,美国专利号5,538,867和6,495,023,这两者通过引用并入本文。包含金属催化剂和还原剂(例如,分子氢或甲酸)的化学辅因子再生系统还可以是适合的。参见,例
如,PCT公布WO 2000/053731,其通过引用并入本文。
[0321] 在一些实施方案中,辅因子再生系统包括甲酸脱氢酶,其是分别将甲酸和NAD+或NADP+催化转化为二氧化碳和NADH或NADPH的NAD+或NADP+依赖性酶。适合于在本文描述的亚胺还原酶方法中用作辅因子再生系统的甲酸脱氢酶包括天然存在的甲酸脱氢酶以及非天
然存在的甲酸脱氢酶。适合的甲酸脱氢酶描述于通过引用并入本文的PCT公布WO2005/
018579中。在一个实施方案中,在方法中使用的甲酸脱氢酶是商购可得(Codexis,
Inc.Redwood City,California,USA)的FDH-101。甲酸(Formate)可以以盐,通常碱盐或铵
盐(alkali or ammonium salt)的形式(例如,HCO2Na、KHCO2NH4,以及类似的),以甲酸,通常甲酸水溶液的形式或其混合物来提供。碱或缓冲液可用于提供所需的pH。
[0322] 在一些实施方案中,辅因子再循环系统包括葡萄糖脱氢酶(GDH),其是分别将D-葡萄糖和NAD+或NADP+催化转化为葡糖酸和NADH或NADPH的NAD+或NADP+-依赖性酶。适合于在
实践本文描述的亚胺还原酶方法中使用的葡萄糖脱氢酶包括天然存在的葡萄糖脱氢酶以
及非天然存在的葡萄糖脱氢酶。天然存在的葡萄糖脱氢酶的编码基因已报告于文献中,例
如,枯草芽孢杆菌(Bacillus subtilis)61297 GDH基因、蜡状芽孢杆菌(B.cereus)ATCC 
14579和巨大芽孢杆菌(B.megaterium)。使用例如诱变、定向进化等产生的非天然存在的葡萄糖脱氢酶提供于PCT公布WO2005/018579,和美国公布号2005/0095619和2005/0153417
中。所有这些序列通过引用并入本文。在一个实施方案中,在方法中使用的葡萄糖脱氢酶是CDX-901或GDH-105,其中的每个商购可得(Codexis,Inc.Redwood City,California,USA)。
[0323] 在一些实施方案中,辅因子再生系统包括醇脱氢酶或酮还原酶,其是分别将仲醇+ + + +
和NAD或NADP催化转化为酮和NADH或NADPH的NAD或NADP依赖性酶。在辅因子再生系统中
有用的适合的仲醇包括低级仲链烷醇和芳基-烷基甲醇,包括但不限于,异丙醇、2-丁醇、3-甲基-2-丁醇、2-戊醇、3-戊醇、3,3二甲基-2-丁醇,以及类似的醇。适合于在本文描述的方法中用作辅因子再生系统的醇脱氢酶包括天然存在的酮还原酶以及非天然存在的酮还原
酶。天然存在的醇脱氢酶/酮还原酶包括来自以下的已知的酶,例如并非限制:
Thermoanerobium brockii、红平红球菌(Rhodococcus erythropolis)、克菲尔乳杆菌
(Lactobacillus kefir)、和短乳杆菌(Lactobacillus brevis),且非天然存在的醇脱氢酶包括由此衍生的工程化醇脱氢酶。在一些实施方案中,可使用为了热稳定性或溶剂稳定性
而工程化的非天然存在的酮还原酶。此类酮还原酶描述于本申请和专利公布US 
20080318295A1、US  20090093031A1、US  20090155863A1、US 20090162909A1、
US20090191605A1、US 20100055751A1、WO/2010/025238A2、WO/2010/025287A2、和US 
20100062499A1;其中每一个通过引用并入本文。
[0324] 考虑到例如,产物化合物的需要量、底物浓度对酶活性的影响、酶在反应条件下的稳定性、以及底物至产物的转化百分比,在反应混合物中的酮和胺底物化合物的浓度可以被改变。在一些实施方案中,适当的反应条件包括以下的底物化合物载量:至少约0.5至约
200g/L、1至约200g/L、5至约150g/L、约10至约100g/L、20至约100g/L、或约50至约100g/L。
在一些实施方案中,适当的反应条件包括以下的酮和胺底物化合物的每个的载量:至少约
0.5g/L、至少约1g/L、至少约5g/L、至少约10g/L、至少约15g/L、至少约20g/L、至少约30g/L、至少约50g/L、至少约75g/L、至少约100g/L、至少约150g/L或至少约200g/L、或甚至更大。本文中提供的底物载量的值是基于化合物(1b)的分子量,然而还设想,等摩尔量的其他酮和
胺底物,诸如酮底物化合物(1a)–(1j),和胺底物化合物(2a)–(2f)可在方法中被使用,以及任何这些化合物的等摩尔量的水合物或盐可在方法中被使用。还设想,在一些实施方案中,适当的反应条件包括根据等于化合物(1b)的以上g/L浓度的摩尔浓度的酮和胺底物化合物
的每个的载量。因此,反应条件可包括以下的酮和胺底物化合物的每个的底物载量:至少约
5mM、至少约10mM、至少约25mM、至少约50mM、至少约75mM、至少约100mM、或甚至更大。此外,设想,由式(I)和(II)涵盖的底物化合物可以以用于化合物(1b)的那些量的相同范围使用。
[0325] 在进行本文描述的亚胺还原酶介导的方法时,工程化多肽可以以纯化的酶、部分纯化的酶、用编码酶的基因转化的完整细胞、作为细胞提取物和/或此类细胞的溶解产物、和/或作为固定在固体支持物上的酶的形式被添加到反应混合物中。用编码工程化亚胺还
原酶的基因转化的完整细胞或其细胞提取物、溶解产物和分离的酶可以多种不同的形式被
使用,包括固体(例如冻干的、喷雾干燥的以及类似的)或半固体(例如,粗糊料)。细胞提取物或细胞溶解产物可通过沉淀(硫酸铵、聚乙烯亚胺、热处理或类似方法,随后的冻干之前的脱盐程序(例如,超滤透析以及类似的)来部分地纯化。任何酶制品(包括完整细胞制品)可通过使用已知的交联剂,诸如,例如戊二醛交联或固定至固相材料(例如,Eupergit C以及类似的)而被稳定。
[0326] 编码工程化亚胺还原酶多肽的基因可被单独地转化进入宿主细胞或一起转化进入同一宿主细胞。例如,在一些实施方案中,宿主细胞的一个集合可用编码一种工程化亚胺还原酶多肽的基因转化并且另一集合可用编码另一工程化亚胺还原酶多肽的基因转化。转
化的细胞的两个集合可在反应混合物中以完整细胞的形式或以从其得到的溶解产物或提
取物的形式一起被使用。在其他实施方案中,宿主细胞可用编码多个工程化亚胺还原酶多
肽的基因转化。在一些实施方案中,工程化多肽可以分泌的多肽的形式被表达并且包含分
泌的多肽的培养基可被用于亚胺还原酶反应。
[0327] 本文公开的工程化亚胺还原酶多肽的改进的活性和/或立体选择性,提供了其中较高转化百分比可用较低浓度的工程化转多肽实现的方法。在该方法的一些实施方案中,
适当的反应条件包括约1%(w/w)、2%(w/w)、5%(w/w)、10%(w/w)、20%(w/w)、30%(w/w)、
40%(w/w),50%(w/w)、75%(w/w)、100%(w/w)或更多的底物化合物载量的工程化多肽量。
[0328] 在一些实施方案中,工程化多肽以约0.01g/L至约50g/L、约0.05g/L至约50g/L、约0.1g/L至约40g/L、约1g/L至约40g/L、约2g/L至约40g/L、约5g/L至约40g/L、约5g/L至约
30g/L、约0.1g/L至约10g/L、约0.5g/L至约10g/L、约1g/L至约10g/L、约0.1g/L至约5g/L、约
0.5g/L至约5g/L、或约0.1g/L至约2g/L存在。在一些实施方案中,亚胺还原酶多肽以约
0.01g/L、0.05g/L、0.1g/L、0.2g/L、0.5g/L、1、2g/L、5g/L、10g/L、15g/L、20g/L、25g/L、30g/L、35g/L、40g/L、或50g/L存在。
[0329] 在反应的过程中,反应混合物的pH可以变化。反应混合物的pH可以被维持在期望的pH或在期望的pH范围内。这可通过在反应的过程之前和/或期间加入酸或碱来实现。可选地,pH可以通过使用缓冲液来控制。因此,在一些实施方案中,反应条件包括缓冲液。维持期望的pH范围的合适的缓冲液是本领域已知的,并且包括,例如且不限于,硼酸盐、磷酸盐、2-(N-吗啉代)乙磺酸(MES)、3-(N-吗啉代)丙磺酸(MOPS)、乙酸盐、三乙醇胺和2-氨基-2-羟甲基-丙烷-1,3-二醇(Tris),以及类似的。在一些实施方案中,缓冲液是磷酸盐。在该方法的一些实施方案中,适当的反应条件包括缓冲液(例如,磷酸盐)浓度,所述缓冲液浓度是从约
0.01至约0.4M、0.05至约0.4M、0.1至约0.3M、或约0.1至约0.2M。在一些实施方案中,反应条件包括以下的缓冲液(例如,磷酸盐)浓度:约0.01、0.02、0.03、0.04、0.05、0.07、0.1、0.12、
0.14、0.16、0.18、0.2、0.3、或0.4M。在一些实施方案中,反应条件包括水作为适当的溶剂而没有缓冲液存在。
[0330] 在方法的一些实施方案中,反应条件可包括适当的pH。期望的pH或期望的pH范围可通过使用酸或碱、适当的缓冲液、或缓冲和酸或碱添加的组合来维持。反应混合物的pH可在反应的过程之前和/或期间被控制。在一些实施方案中,适当的反应条件包括从约4至约
10的溶液pH、从约5至约10的pH、从约7至约11的pH、从约8至约10的pH、从约6至约8的pH。在一些实施方案中,反应条件包括约4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5或10的溶液pH。
[0331] 在本文方法的实施方案中,例如,考虑到:在较高的温度下增加的反应速率、以及在反应时间段期间酶的活性,适当的温度可用于反应条件。因此,在一些实施方案中,适当的反应条件包括以下的温度:从约10℃至约80℃、约10℃至约70℃、约15℃至约65℃、约20℃至约60℃、约20℃至约55℃、约25℃至约55℃、或约30℃至约50℃。在一些实施方案中,适当的反应条件包括约10℃、15℃、20℃、25℃、30℃、35℃、40℃、45℃、50℃、55℃、60℃、65℃、70℃、75℃、或80℃的温度。在一些实施方案中,酶促反应过程中的温度可以贯穿反应过程维持在特定温度。在一些实施方案中,酶促反应过程中的温度可在反应过程期间按温度谱图来调节(adjusted over a temperature profile during the course of the 
reaction)。
[0332] 本公开内容的方法一般在溶剂中进行。适当的溶剂包括水、缓冲水溶液(aqueous buffer solution)、有机溶剂、聚合溶剂、和/或共溶剂系统,其通常包括含水溶剂(aqueous solvent)、有机溶剂和/或聚合溶剂。含水溶剂(水或含水共溶剂系统)可以是pH缓冲的或无缓冲的。在一些实施方案中,使用工程化亚胺还原酶多肽的方法可在包括以下的含水共溶
剂系统中进行:有机溶剂(例如,乙醇、异丙醇(IPA)、二甲亚砜(DMSO)、二甲基甲酰胺(DMF)、二甲基乙酰胺(DMAc)、N-甲基-吡咯烷酮(NMP)、乙酸乙酯、乙酸丁酯、1-辛醇、庚烷、辛烷、甲基叔丁基醚(MTBE)、甲苯以及类似物)、离子或极性溶剂(例如,1-乙基4-甲基咪唑鎓四氟硼酸盐、1-丁基-3-甲基咪唑鎓四氟硼酸盐、1-丁基-3-甲基咪唑鎓六氟磷酸盐、甘油、聚乙二醇(PEG)以及类似物)。在一些实施方案中,共溶剂可以是极性溶剂,诸如多元醇、二甲亚砜(DMSO)、或低级醇。含水共溶剂系统的非含水共溶剂组分可以是与含水组分易混溶的,提供单一的液相,或可以是与含水组分部分地易混溶的或不易混溶的,提供两个液相。示例性含水共溶剂系统可包括水和选自有机溶剂、极性溶剂、和多元醇溶剂的一种或更多种共溶剂。
通常,选择含水共溶剂系统的共溶剂组分使得其在反应条件下不会不利地使亚胺还原酶失
活。适当的共溶剂系统可通过使用酶活性测定,诸如本文描述的那些,用指定的感兴趣的底物在候选溶剂系统中测量特定的工程化亚胺还原酶的酶促活性来容易地确定。
[0333] 在方法的一些实施方案中,适当的反应条件包括含水共溶剂,其中该共溶剂包括以下的DMSO:约1%至约50%(v/v)、约1至约40%(v/v)、约2%至约40%(v/v)、约5%至约
30%(v/v)、约10%至约30%(v/v)、或约10%至约20%(v/v)。在该方法的一些实施方案中,适当的反应条件可包括含水共溶剂,其包括以下的DMSO:约1%(v/v)、约5%(v/v)、约10%(v/v)、约15%(v/v),约20%(v/v)、约25%(v/v)、约30%(v/v)、约35%(v/v)、约40%(v/v)、约45%(v/v)、或约50%(v/v)。
[0334] 在一些实施方案中,反应条件可包括用于稳定或增强反应的表面活性剂。表面活性剂可包括非离子、阳离子、阴离子和/或两亲性表面活性剂。示例性表面活性剂,包括例如且不限于,壬基酚聚氧乙烯醚(nonyl phenoxypolyethoxylethanol,NP40)、Triton X-100、聚氧化乙烯十八烷基胺、溴化十六烷基三甲铵、硫酸氨基油酸钠(sodium 
oleylamidosulfate)、聚氧乙烯-脱水山梨醇单硬脂酸酯(polyoxyethylene-
sorbitanmonostearate)、十六烷基二甲基胺(hexadecyldimethylamine)等。可应用可稳定或增强反应的任何表面活性剂。在反应中待应用的表面活性剂的浓度通常可以是从0.1至
50mg/ml,特别是从1至20mg/ml。
[0335] 在一些实施方案中,反应条件可包括止泡剂,其有助于减少或防止反应溶液中泡沫的形成,诸如当混合或喷射反应溶液时。止泡剂包括非极性油(例如,矿物油、硅酮油等)、极性油(例如,脂肪酸、烷基胺、烷基酰胺、烷基硫酸硫酸酯(alkyl sulfate)等)、和疏水性(例如,处理的二氧化硅、聚丙烯等),其中的一些还起表面活性剂的作用。示例性止泡剂包括, (Dow Corning)、聚二醇共聚物(poly-glycol copolymer)、氧化/乙氧基化的醇、
和聚二甲硅氧烷。在一些实施方案中,止泡剂可以以约0.001%(v/v)至约5%(v/v)、约
0.01%(v/v)至约5%(v/v)、约0.1%(v/v)至约5%(v/v)、或约0.1%(v/v)至约2%(v/v)存在。在一些实施方案中,当期望促进反应时,止泡剂可以以约0.001%(v/v)、约0.01%(v/v)、约0.1%(v/v)、约0.5%(v/v)、约1%(v/v)、约2%(v/v)、约3%(v/v)、约4%(v/v)、或约
5%(v/v)或更多存在。
[0336] 用于亚胺还原酶反应的反应物的量将一般取决于期望的产物的量、和伴随地使用的亚胺还原酶底物的量而不同。本领域普通技术人员将容易地理解如何改变这些量以使它
们适合期望的水平的生产力和生产规模。
[0337] 在一些实施方案中,加入反应物的顺序不是关键的。可在相同的时间将反应物一起加到溶剂中(例如单相溶剂、双相含水共溶剂系统以及类似物),或可选地,反应物中的一些可以被单独地添加,并且一些反应物在不同的时间点一起添加。例如,辅因子、共底物、亚胺还原酶和底物可以被先加到溶剂中。
[0338] 可以多种不同的形式,包括粉末(例如冻干的、喷雾干燥的和类似粉末)、溶液、乳液、悬浮液和类似形式向反应提供固体反应物(例如酶、盐等)。可使用本领域普通技术人员已知的方法和装置容易地冻干或喷雾干燥反应物。例如,蛋白溶液可在-80℃以小份冷冻,然后加到预冷的冻干室中,随后应用真空
[0339] 当含水共溶剂系统被使用时,为了改进混合效率,亚胺还原酶和辅因子可被首先加入并混合进入水相。然后可加入有机相并混合,随后加入亚胺还原酶底物和共底物。可选地,在加入水相之前,亚胺还原酶底物可以在有机相中预混合。
[0340] 通常允许亚胺还原酶反应进行直到底物向产物的进一步转化不随反应时间显著变化,例如小于10%的底物被转化,或小于5%的底物被转化)。在一些实施方案中,允许反应进行直到存在底物向产物完全或接近完全的转化。底物向产物转化可以使用已知的方法
在有或没有衍生化下通过检测底物和/或产物来监测。适合的分析方法包括气相色谱法、
HPLC、和类似方法。
[0341] 在该方法的一些实施方案中,适当的反应条件包括至少约5g/L、10g/L、20g/L、30g/L、40g/L、50g/L、60g/L、70g/L、100g/L、或更多的底物的载量,并且其中该方法导致在约48h或更短、约36h或更短、约24h或更短内将至少约50%、60%、70%、80%、90%、95%或更大的底物化合物至产物化合物的转化。
[0342] 当在适当的反应条件下在该方法中使用时,本公开内容的工程化亚胺还原酶多肽导致至少90%、95%、96%、97%、98%、99%、或更大的非对映体过量的期望的仲胺或叔胺产物。在一些实施方案中,未形成可检测量的不期望的非对映体仲胺或叔胺产物。
[0343] 在使用工程化亚胺还原酶多肽将底物化合物转化为胺产物化合物的方法的另外的实施方案中,适当的反应条件可包括反应溶液的初始底物载量,然后该反应溶液被多肽
接触。该反应溶液还随着时间以至少约1g/L/h、至少约2g/L/h、至少约4g/L/h、至少约6g/L/h、或更高的速率作为连续或分批添加来补充另外的底物化合物。因此,根据这些适当的反应条件,添加多肽至具有各至少约20g/L、30g/L、或40g/L的初始酮和胺底物载量的溶液。然后多肽的该添加之后是以约2g/L/h、4g/L/h、或6g/L/h的速率连续添加另外的酮和胺底物
至溶液,直到达到各至少约30g/L、40g/L、50g/L、60g/L、70g/L、100g/L、150g/L、200g/L或更多的高得多的最终底物载量。因此,在该方法的一些实施方案中,适当的反应条件包括将多肽添加至具有各至少约20g/L、30g/L、或40g/L的初始底物载量的溶液中,然后以约2g/L/h、
4g/L/h、或6g/L/h的速率添加另外的酮和胺底物至溶液中,直到达到至少约30g/L、40g/L、
50g/L、60g/L、70g/L、100g/L或更多的最终底物载量。这些底物补充反应条件允许获得更高底物载量,同时维持至少约50%、60%、70%、80%、90%或更大的底物转化的底物向胺产物的高转化率。
[0344] 在该方法的一些实施方案中,使用工程化亚胺还原酶多肽的反应可包括以下适当的反应条件:(a)以约5g/L至30g/L的底物载量;(b)约0.1g/L至10g/L的工程化多肽;(c)约
19g/L(0.13M)至57g/L(0.39M)的α-酮戊二酸;(d)约14g/L(0.08M)至63g/L(0.36M)抗坏血
酸;(e)约1.5g/L(3.8mM)至4.5g/L(11.5mM)的FeSO4;(f)约6至9的pH;(g)约20℃至50℃的温度;以及(h)2-24小时的反应时间。
[0345] 在该方法的一些实施方案中,使用工程化亚胺还原酶多肽的反应可包括以下适当的反应条件:(a)以约10g/L至100g/L的底物载量(b)约1g/L至约50g/L的工程化多肽;(c)以约0.1g/L至约5g/L的NADH或NADPH载量;(d)约6至10的pH;(g)约20℃至50℃的温度;以及
(h)6至120小时的反应温度。
[0346] 在一些实施方案中,进行另外的反应组分或另外的技术以补充反应条件。这些可包括采取措施以稳定或阻止酶的失活、减少产物抑制、使反应平衡向胺产物形成转移。
[0347] 在另外的实施方案中,任何以上描述的用于将底物化合物转化为产物化合物的方法还可包括选自以下的一种或更多种步骤:产物化合物的提取、分离、纯化、和结晶。用于从通过以上公开的方法产生的生物催化反应混合物中提取、分离、纯化、和/或结晶胺产物的方法、技术和试验方案是普通技术人员已知的和/或通过常规实验可获得的。另外,例证性的方法在下面的实施例中提供。
[0348] 本公开内容的各种特征和实施方案在以下代表性实施例中被说明,代表性实施例意图是说明性的而非限制性的。
[0349] 实施例
[0350] 实施例1:源自具有亚胺还原酶活性的CENDH的工程化多肽的合成、优化和筛选
[0351] 基因合成与优化:编码如由SEQ ID NO:2所呈现的来自节杆菌Arthrobacter sp.菌株C1的经报道的野生型冠瘿碱脱氢酶多肽CENDH的多核苷酸序列,使用GeneIOS合成平台
(GeneOracle)进行密码子优化并合成为SEQ ID NO:1的基因。将SEQ ID NO:1的合成的基因
克隆进入pCK110900载体系统(参见例如,美国专利申请公布20060195947,该申请在此通过引用并入本文)并且随后于大肠杆菌W3110fhuA中表达。大肠杆菌W3110在lac启动子的控制
下表达冠瘿碱脱氢酶多肽CENDH。基于与其他CENDH(以及其他氨基酸脱氢酶)的序列比较和
与底物对接(docked)的CENDH结构的计算机模拟,鉴定了与活性位点、肽环、溶液/底物交界面、和潜在的稳定性位置相关的残基位置。简言之,CENDH基因的定向进化通过构建变体基因的文库来进行,其中将与一定结构特征相关的这些位置进行诱变。然后将这些文库使用
如实施例2和3中描述的HTP测定法铺板、生长成熟、并筛选,以提供41个具有偶数序列标识符SEQ ID NO:4-86的具有亚胺还原酶活性的工程化CENDH变体多肽的第一轮(“轮次1”)。将这些轮次1中鉴定的这些氨基酸差异重组以构建新的轮次2文库,然后对其筛选具有对酮底
物化合物(1b)和胺底物化合物(2b)的活性。在轮次2中筛选的该亚胺还原酶活性在该变体
源自的天然存在的冠瘿碱脱氢酶CENDH多肽中是不可检测的。该第二轮定向进化导致7个具
有SEQ ID NO:88-100的偶数序列标识符的工程化多肽。CENDH的这些轮次2变体具有相对于
SEQ ID NO:2从4个至10个氨基酸差异,并具有将环己酮与丁胺还原胺化以产生仲胺产物化
合物(2d)的非天然亚胺还原酶活性。
[0352] 实施例2:源自CENDH的具有亚胺还原酶活性的工程化多肽的生产
[0353] 工程化亚胺还原酶多肽在大肠杆菌W3110中在lac启动子的控制下产生。用于HTP和SFP测定的酶制品制备如下。
[0354] 高通量(HTP)生长、表达、及溶解产物制备。细胞被挑选并在30℃,200rpm,85%湿度在包含1%葡萄糖和30μg/ml氯霉素(CAM)的LB培养基中生长过夜。将过夜生长的20μl转移至包含380μl的包含30μg/ml CAM、1mM IPTG的TB生长培养基的深孔板,并在30℃,200rpm,85%湿度下温育持续~18h。细胞培养物以4000rpm、4℃离心10min,并丢弃培养基。
将由此获得的细胞沉淀存储于-80℃并用于制备如下的用于HTP反应的溶解产物。在0.1M磷
酸盐缓冲液,pH 8.5(或pH 10)中制备包含1g/L溶菌酶和1g/L PMBS的溶解缓冲液。将96孔
板中的细胞沉淀溶解于250μL溶解缓冲液中,在室温下在滴定板振动器上以低速振摇1.5h。
然后将板在4℃下以4000rpm离心10分钟,并将澄清的上清液用作HTP测定反应中的澄清的
溶解产物。
[0355] 摇瓶粉(SFP)的生产:摇瓶程序用于产生在本文公开的二次筛选测定或生物催化方法中使用的工程化亚胺还原酶多肽粉。摇瓶粉(SFP)提供与HTP测定中使用的细胞溶解产
物相比更纯化的工程化酶制品(例如,多达总蛋白的30%),允许使用更浓缩的酶溶液,以及其他事项。将包含编码感兴趣的工程化多肽的质粒的大肠杆菌的单菌落接种到包含30μg/
ml氯霉素和1%葡萄糖的50mL Luria Bertani肉汤中。细胞在培养箱(incubator)中在30℃
下以250rpm摇动生长过夜(至少16小时)。将培养物稀释到1L烧瓶中包含30μg/ml氯霉素的
250mL Terrific Broth(12g/L细菌用胰蛋白胨、24g/L酵母提取物、4mL/L甘油、65mM磷酸
钾,pH 7.0,1mM MgSO4)中,至600nm的光密度(OD600)为0.2,并允许在30℃生长。当培养物的OD600是0.6至0.8时,通过加入异丙基-β-D-硫代半乳糖苷(“IPTG”)至终浓度1mM来诱导亚胺还原酶基因的表达。然后培养持续过夜(至少16小时)。通过离心(5000rpm、15min、4℃)收获细胞,并丢弃上清液。将细胞沉淀用等体积的冷(4℃)50mM磷酸钾缓冲液,pH 7.5再悬浮,并如以上通过离心来收获。洗涤的细胞再悬浮于两体积的冷50mM磷酸钾缓冲液、pH 7.5中,并且以12,000psi经过French Press两次,同时保持在4℃。通过离心(10,000rpm、45分钟、4℃)除去细胞碎片。收集澄清的溶解产物上清液,并储存在-20℃。冷冻的澄清溶解产物的冷冻干燥提供了粗制工程化多肽的干摇瓶粉。可选地,细胞沉淀(洗涤前或洗涤后)可储存在4℃或-80℃。
[0356] 实施例3:源自的CENDH的工程化多肽的对各种酮和胺底物化合物的改进的亚胺还原酶活性的HTP和SFP筛选
[0357] 轮次1工程化多肽的HTP筛选测定:使用澄清的细胞溶解产物在96孔板中进行指导变体的初级筛选使用的高通量筛选。来自CENDH(SEQ ID NO:2)诱变的第一轮的变体使用如
表3A中注释的两种不同的HTP测定反应来筛选:(1)酮底物化合物(1a)丙酮酸,和胺底物化
合物(2b)丁胺的组合;以及(2)酮底物(1b)环己酮,和胺底物化合物(2a)L-正缬氨酸的组
合。
[0358] 使用SFP制品的轮次1变体的二次筛选:制备SFP制品用于在一种或两种HTP筛选测定中选择相对于SEQ ID NO:2的CENDH野生型展现改进的活性的源自CENDH的轮次1工程化
多肽。将这些SFP制品使用如表3C中描述的SFP测定用三种底物组合环己酮/L-正缬氨酸、环戊酮/L-正缬氨酸、苯乙酮/L-正缬氨酸进行二次筛选。
[0359] 轮次2工程化多肽的HTP筛选测定:如实施例1所述,工程化多肽的轮次2文库通过将轮次1中鉴定的有益的氨基酸差异与具有N198H、和N198E氨基差异的SEQ ID NO:6或86的
“骨架”多肽序列重组来制备。这些轮次2文库进行如表3B中描述的环己酮/丁胺测定中的
HTP筛选。鉴定了七个具有将环己酮和丁胺转化为仲胺产物化合物(2d)的亚胺还原酶活性
的工程化多肽(SEQ ID NO:88、90、92、94、96、98、和100)。该活性在该多肽源自的天然存在的冠瘿碱脱氢酶CENDH中是不可检测的。这些轮次2工程化多肽具有相对于SEQ ID NO:2从4
个至10个氨基酸差异。
[0360] 使用SFP制品的轮次2变体的进一步活性筛选:为七个轮次2变体制备SFP制品,并且这些制品使用如表3D和3E中列出的一系列酮和胺底物化合物进行数个其他活性测定。
[0361] HTP和SFP测定反应的分析:液相色谱和质谱(LC-MS)的组合方法用作主要分析方法以检测和定量表3A、3B、3C、3D、和3E的各种HTP和SFP测定反应结果。以下提供LC-MS分析的详细内容。
[0362] LC-MS分析(表3A-3E):在HTP测定或SFP测定反应混合物在滴定板振动器上在室温下以高速振摇过夜后,各反应混合物用CH3CN来猝灭,并以CH3CN/H2O/甲酸(50/50/0.1)稀释
10倍。猝灭并稀释的反应混合物通过多重反应监测(MRM)模式的LC-MS来分析。相关LC仪器
参数和条件显示如下。
[0363]
[0364] 环己酮/L-正缬氨酸测定反应的相关MS参数是:[M+H]+:200;CE=20ev下的主要碎片离子:154、118、83、72、55。用于监测产物形成的MRM转变:200/118;200/72。
[0365] 丙酮酸/丁胺测定反应的相关MS参数是:[M+H]+:146;CE=20ev下的主要碎片离子:100。用于监测产物形成的MRM转变:146/100。
[0366] 环己酮/丁胺测定反应的相关MS参数是:[M+H]+:156;CE=20ev下的主要碎片离子;83、74、55。用于监测产物形成的MRM转变:156/83;156/74;156/55。
[0367] 环戊酮/L-正缬氨酸测定反应的相关MS参数:[M+H]+:186;CE=20ev下的主要碎片离子;140、118、79、72。用于监测产物形成的MRM转变:186/72;186/118;186/69。
[0368] 苯乙酮/L-正缬氨酸测定反应的相关MS参数:[M+H]+:222;CE=20ev下的主要碎片离子;118、105、72。用于监测产物形成的MRM转变:222/118;222/105;222/72。
[0369] 2-甲氧基环己酮/丁胺测定反应的相关MS参数:[M+H]+:186;CE=20ev下的主要碎片离子;154、113、98、81。用于监测产物形成的MRM转变:186/154;186/81。
[0370] 环己酮/甲胺测定反应的相关MS参数:[M+H]+:114;CE=20ev下的主要碎片离子;83、55。用于监测产物形成的MRM转变:114/83;114/55。
[0371] 环己酮/苯胺测定反应的相关MS参数:[M+H]+:176;CE=20ev下的主要碎片离子;135、94、83、55。用于监测产物形成的MRM转变:176/94。
[0372] 2-戊酮/丁胺测定反应的相关MS参数:[M+H]+:144;CE=15ev下的主要碎片离子;144、114、74、71。用于监测产物形成的MRM转变:144/74;144/71;144/43。
[0373] 羟基丙酮/二甲胺测定反应的相关MS参数:[M+H]+:104;CE=25ev下的主要碎片离子;86、71、46、41。用于监测产物形成的MRM转变:104/86;104/46。
[0374] 实施例4:源自SEQ ID NO:96的工程化多肽在制备化合物(3n)和(3o)中的改进的稳定性和亚胺还原酶活性的HTP筛选
[0375] SEQ ID NO:96的具有亚胺还原酶活性的轮次2工程化多肽用于进一步产生表3F-3J的工程化多肽,其具有进一步改进的稳定性(例如44℃下的活性)和改进的亚胺还原酶活
性(例如,酮底物化合物(1j)向产物的%转化)。具有偶数序列标识符SEQ ID NO:112-750的氨基酸序列的这些工程化多肽使用实施例1和2的定向进化方法连同如表3F-3J中注释的
HTP测定方法由SEQ ID NO:96的“骨架”氨基酸序列产生。以下提供测定混合物的胺产物LC-MS分析的进一步详细内容。
[0376] 胺产物化合物(3n)的LC-MS分析:在HTP测定混合物在35℃下在滴定板振动器上以250rpm振摇过夜后,各反应混合物通过加入250μL CH3CN来猝灭、振摇、并以4000rpm离心且在4℃进行10min。20μL的猝灭的混合物以180μL CH3CN/H2O(50/50)在混合下稀释10倍。然后将10μL的该10倍稀释混合物以190μL CH3CN/H2O(50/50)进一步稀释,总共400倍稀释的混合物。这些混合物通过MRM模式的LC-MS来分析。产物化合物(1i)N-丁基-5-甲氧基-1,2,3,4-
四氢化萘-2-胺的形成,使用MRM转换:234/161。另外的相关LC-MS仪器参数和条件显示如
下。
[0377]
[0378] 胺产物化合物(3o)的LC-MS分析:在HTP测定混合物在滴定板振动器上在35℃下以250rpm振摇过夜后,各反应混合物用100μL CH3CN来猝灭、加热密封、振摇、并在4℃下以
4000rpm离心10min。将20μL的猝灭的混合物以180μL CH3CN/H2O(50/50)在混合下稀释10倍。
将10倍稀释的反应混合物通过多重反应监测(MRM)模式的LC-MS来分析。相关仪器参数和条
件显示如下。
[0379]
[0380] 在本申请中引用的所有出版物、专利、专利申请和其他文件出于所有目的均通过引用以其整体并入本文,其程度如同分别指出将每个单独的出版物、专利、专利申请或其它文件出于所有目的通过引用并入一样。
[0381] 尽管已经阐释和描述了各种具体实施方案,但应理解可以作出各种改变而不背离本发明的精神和范围。
QQ群二维码
意见反馈