生物催化剂

申请号 CN201480044593.X 申请日 2014-06-12 公开(公告)号 CN105452475A 公开(公告)日 2016-03-30
申请人 联邦科学技术研究组织; 发明人 C·斯科特; M·怀尔丁; L·叶尔明; T·皮特; J·纽曼;
摘要 本 申请 涉及分离自假单胞属物种的丙 酮 酸 盐:ω- 氨 基酸转氨酶。所述转氨酶作用于长链氨基酸并且能够接受包含8-12个 碳 原子 的底物。所述酶适于作为用于制备尼龙的 生物 催化剂。
权利要求

1.一种基本上纯化的和/或重组的多肽,其包含:
i)SEQ ID NO:1、2或6-12中的任一个提供的基酸序列,
ii)与SEQ ID NO:1、2或6-12中的任何一个或多个至少40%相同的氨基酸序列,或iii)i)或ii)的生物学活性片段
其中所述多肽具有氨基转移酶活性。
2.权利要求1的多肽,其中所述多肽催化氨基从氨基供体到氨基受体的转移。
3.权利要求2的多肽,其中所述多肽催化氨基从氨基供体到氨基受体的可逆转移。
4.权利要求1-3中任一项的多肽,其中所述氨基供体或氨基受体包含3-12个
5.权利要求1-3中任一项的多肽,其中所述氨基供体或氨基受体包含4-12个碳。
6.权利要求1-3中任一项的多肽,其中所述氨基供体或氨基受体包含9-12个碳。
7.权利要求2-6中任一项的多肽,其中所述氨基供体是氨基酸或胺化合物。
8.权利要求7的多肽,其中所述氨基酸是α-氨基酸或ω-氨基酸。
9.权利要求8的多肽,其中所述ω-氨基酸选自3-氨基丙酸、4-氨基丁酸、5-氨基戊酸、
6-氨基己酸、7-氨基庚酸、8-氨基辛酸、11-氨基十一酸、12-氨基十二酸、3-氨基庚酸、3-氨基异丁酸及它们的衍生物。
10.权利要求7的多肽,其中所述胺化合物是二胺。
11.权利要求7的多肽,其中所述胺化合物选自:1,4-二氨基丁烷、1,5-二氨基戊烷、1,
6-二氨基己烷、6-氨基己烷-1-醇、磺酸、酪胺、环己胺、异丙胺、2-氨基茚满及它们的衍生物。
12.权利要求1-11中任一项的多肽,其中所述氨基受体是酸、酮或
13.权利要求12的多肽,其中所述醛是甘油醛或戊二醛。
14.一种分离的和/或外源的多核苷酸,其包含下述中的一种或多种:
i)SEQ ID NO:3-5或14-20中的任何一个或多个提供的核苷酸序列,
ii)编码权利要求1-13中任一项的多肽的核苷酸序列,
iii)与i)至少45%相同的核苷酸序列,
iv)在严格条件下与i)杂交的核苷酸序列,或
v)与i)至iv)中任一互补的核苷酸序列。
15.权利要求14的多核苷酸,其编码具有氨基转移酶活性的多肽。
16.一种载体,其包含权利要求14或权利要求15的多核苷酸。
17.一种宿主细胞,其包含权利要求14或权利要求15的多核苷酸、或者权利要求16的载体。
18.一种产生权利要求1-13中任一项的多肽的方法,所述方法包括在允许编码所述多肽的多核苷酸表达的条件下,培养编码所述多肽的权利要求17的宿主细胞或在无细胞表达系统中的编码所述多肽的权利要求16的载体,并且回收所表达的多肽。
19.一种多肽,其通过权利要求18的方法产生。
20.一种分离的或基本上纯化的抗体,其与权利要求1-13中任一项的多肽特异性结合。
21.一种转基因非人生物,其包含编码权利要求1-13中任一项的多肽的外源多核苷酸。
22.一种权利要求17的宿主细胞或权利要求21的转基因非人生物的提取物,其中所述提取物包含权利要求1-13中任一项的多肽。
23.一种组合物,其包含下述中的一种或多种或全部:
i)权利要求1-13或权利要求19中任一项的多肽;
ii)权利要求14或权利要求15的多核苷酸,
iii)权利要求16的载体,
iv)权利要求17的宿主细胞,
v)权利要求20的抗体,
vi)权利要求21的转基因非人生物,或
vii)权利要求22的提取物。
24.一种用于催化氨基从氨基供体到氨基受体的转移的组合物,所述组合物包含下述中的一种或多种或全部:
i)权利要求1-13或权利要求19中任一项的多肽;
ii)权利要求17的宿主细胞,
iii)权利要求21的转基因非人生物,或
iv)权利要求22的提取物。
25.一种用于催化氨基从氨基供体到氨基受体的转移的方法,所述方法包括使所述氨基供体和氨基受体与权利要求1-13中任一项的多肽或权利要求24的组合物接触
26.权利要求25的方法,其中所述多肽通过权利要求17的宿主细胞产生。
27.一种使用具有氨基转移酶活性的基本上纯化的和/或重组的多肽催化氨基从氨基供体到氨基受体的转移的方法,其中所述氨基供体或氨基受体包含至少9个碳。
28.权利要求27的方法,其中所述氨基供体和氨基受体两者均具有至少9个碳。
29.权利要求25-28中任一项的方法,其中所述方法产生工业产品。
30.权利要求29的方法,其中所述方法进一步包含一或多种反应以产生工业产品。
31.权利要求29或权利要求30的方法,其中所述工业产品是氨基酸、二酸、胺、二胺、酮酸、二酮酸、酮、二酮酸、醛、二醛、半醛、氨基醛、多肽、聚胺、聚酰胺、聚酮、聚醛、内酰胺、内酯或脂肪酸
32.一种产生多肽的方法,所述多肽具有增强的催化氨基从氨基供体到氨基受体的转移的能,或具有改变的底物特异性,所述方法包括:
i)改变权利要求1-13中任一项的多肽的一个或多个氨基酸,
ii)测定得自步骤i)的经改变的多肽催化氨基从氨基供体到氨基受体的转移的能力,和
iii)选择当与步骤i)中使用的多肽相比较时,具有增强的催化氨基从氨基供体的转移的能力、或具有改变的底物特异性的经改变的多肽。
33.一种多肽,其通过权利要求32的方法产生。
34.一种用于筛选能够催化来自包含至少9个碳的氨基供体的氨基转移的微生物的方法,所述方法包括:
i)在包含至少9个碳的氨基供体作为单独的氮源的存在下,培养候选微生物,和
ii)测定所述微生物是否能够生长和/或分裂。
35.一种试剂盒,其包含下述中的一种或多种或全部:
i)权利要求1-13或权利要求19中任一项的多肽;
ii)权利要求14或权利要求15的多核苷酸,
iii)权利要求16的载体,
iv)权利要求17的宿主细胞,
v)权利要求20的抗体,
vi)权利要求21的转基因非人生物,或
vii)权利要求22的提取物。
36.一种多肽的晶体结构,其包含:
i)SEQ ID NO:1、2或6-12中任一个提供的氨基酸序列,
ii)与SEQ ID NO:1、2或6-12中的任何一个或多个至少40%相同的氨基酸序列,或iii)i)或ii)的生物学活性片段,
其中所述多肽具有氨基转移酶活性。
37.权利要求36的晶体结构的原子坐标集合或其子集。
38.附录I中提供的原子坐标集合或其子集。
39.一种在其上记录有数据的计算机可读介质,所述数据代表权利要求36的晶体结构的原子坐标或其子集;或者附录I中提供的原子坐标或其子集;和/或使用所述原子坐标产生的模型。
40.一种鉴定与氨基转移酶结合的化合物的计算机辅助方法,所述方法包括下述步骤:
i)将候选化合物的结构与通过权利要求36的晶体结构的原子坐标或其子集,或者附录I中提供的原子坐标或其子集限定的结构对接,和
ii)鉴定可以与所述氨基转移酶结合的候选化合物,
其中所述氨基转移酶包含:
a)SEQ ID NO:1、2或6-12中任一个提供的氨基酸序列,
b)与SEQ ID NO:1、2或6-12中的任何一个或多个至少40%相同的氨基酸序列,或
c)a)或b)的生物学活性片段。
41.权利要求40的方法,其进一步包括合成或获得所鉴定的候选化合物,并且测定所述化合物是否与所述氨基转移酶结合。
42.一种用于鉴定具有氨基转移酶活性的多肽的计算机辅助方法,所述方法包括下述步骤:
i)比较通过权利要求36的晶体结构的原子坐标或其子集,或者附录I中提供的原子坐标或其子集限定的结构与候选多肽的三级结构的模型,和
ii)鉴定可能具有氨基转移酶活性的候选化合物。
43.权利要求42的方法,其进一步包括合成或获得所鉴定的多肽,并且测定所述多肽是否催化氨基从氨基供体到氨基受体的转移。

说明书全文

生物催化剂

技术领域

[0001] 本申请涉及转氨酶以及使用所述转氨酶作为生物催化剂的方法。

背景技术

[0002] 由于其以优良的区域选择性、立体选择性和对映选择性催化其反应的能,转氨酶越来越多地用于化学制品、药物和聚合物的商业规模制造。作为蛋白质,它们通常在性系统中工作,去除挥发性有害溶剂的需要,并且它们避免通常与竞争重金属催化剂相关的有害副产物的产生。此外,生物催化剂可以容易地与反应混合物分开,并且常规在环境友好的温度和压力下操作。大体上,它们视为常规催化化学的“绿色”替代物。
[0003] 然而,生物催化工艺开发通常受酶的可用性的挑战,所述酶满足给定靶化合物的底物特异性要求。例如,尼龙制造所需的长链氨基酸(例如C9-12)在自然界中并不丰富,没有这些分子的明确生理学作用。
[0004] 因为转氨酶通常具有有限的底物范围,所以需要另外的转氨酶。发明内容
[0005] 本发明人拥有经分离的新型转氨酶(例如来自新近分离的假单胞菌属物种(Pseudomonas sp.)的p6和p7),其可以用作工业相关物包括但不限于胺、二胺和氨基酸生产中的生物催化剂,所有这些工业相关物在例如聚酰胺或多肽生产中具有显著应用。
[0006] 相应地,本发明提供了基本上纯化的和/或重组的多肽,其包含:
[0007] i)SEQ ID NO:1、2或6-12中任一个提供的氨基酸序列,
[0008] ii)与SEQ ID NO:1、2或6-12中的任何一个或多个至少40%相同的氨基酸序列,或[0009] iii)i)或ii)的生物学活性片段
[0010] 在一个实施方案中,本发明提供了基本上纯化的和/或重组的多肽,其包含:
[0011] i)SEQ ID NO:1或SEQ ID NO:2中提供的氨基酸序列,
[0012] ii)与i)至少40%相同的氨基酸序列,或
[0013] iii)i)或ii)的生物学活性片段。
[0014] 本发明还提供了基本上纯化的和/或重组的多肽,其包含:
[0015] i)SEQ ID NO:1、2或6-12中任一提供的氨基酸序列,
[0016] ii)与SEQ ID NO:1、2或6-12中的任何一个或多个至少40%相同的氨基酸序列,或[0017] iii)i)或ii)的生物学活性片段,
[0018] 其中所述多肽具有氨基转移酶活性。
[0019] 在一个实施方案中,本发明还提供了基本上纯化的和/或重组的多肽,其包含:
[0020] i)SEQ ID NO:1或SEQ ID NO:2中提供的氨基酸序列,
[0021] ii)与i)至少40%相同的氨基酸序列,或
[0022] iii)i)或ii)的生物学活性片段,
[0023] 其中所述多肽具有氨基转移酶活性。
[0024] 在本发明的一个实施方案中,所述多肽包含与SEQ ID NO:1、2或6-12中的任何一个或多个至少75%、至少80%、至少85%、至少90%或至少95%相同的氨基酸序列。
[0025] 在本发明的一个实施方案中,所述多肽催化氨基从氨基供体到氨基受体的转移。换言之,本发明的多肽催化氨基从氨基供体的去除和氨基对氨基受体的添加。像这样,氨基供体和氨基受体两者均视为所述多肽的“底物”。
[0026] 氨基转移反应一般是可逆的。相应地,在本发明的一个实施方案中,所述多肽催化氨基从氨基供体到氨基受体的可逆转移。
[0027] 本发明人惊讶地发现本发明的多肽能够催化例如具有多达18个的显著更长底物的脱氨基/氨化。
[0028] 因此,在本发明的一个进一步的实施方案中,氨基供体或氨基受体包含至少3个碳。在本发明的另一个实施方案中,氨基供体或氨基受体包含至少4个碳。在本发明的另一个实施方案中,氨基供体或氨基受体包含至少9个碳。在本发明的一个进一步实施方案中,氨基供体或氨基受体包含多达12、13、14、15、16、17或18个碳。在本发明的另一个实施方案中,氨基供体或氨基受体包含9-12个碳。在本发明的另一个实施方案中,氨基供体或氨基受体包含9-13个碳。在本发明的另一个实施方案中,氨基供体或氨基受体包含9-14个碳。在本发明的另一个实施方案中,氨基供体或氨基受体包含9-15个碳。在本发明的另一个实施方案中,氨基供体或氨基受体包含9-16个碳。在本发明的另一个实施方案中,氨基供体或氨基受体包含9-17个碳。在本发明的另一个实施方案中,氨基供体或氨基受体包含9-18个碳。
[0029] 在一个实施方案中,所述多肽包含:
[0030] i)SEQ ID NO:1中提供的氨基酸序列,
[0031] ii)与i)至少40%相同的氨基酸序列,或
[0032] iii)i)或ii)的生物学活性片段,并且
[0033] 催化氨基从包含3-12个碳的氨基供体到氨基受体的转移。
[0034] 在一个实施方案中,所述多肽包含:
[0035] i)SEQ ID NO:1中提供的氨基酸序列,
[0036] ii)与i)至少40%相同的氨基酸序列,或
[0037] iii)i)或ii)的生物学活性片段,并且
[0038] 催化氨基从氨基供体到包含3-12个碳的氨基受体的转移。
[0039] 在一个实施方案中,所述多肽包含:
[0040] i)SEQ ID NO:2或6-12中的任何一个提供的氨基酸序列,
[0041] ii)与如SEQ ID NO:2或6-12中的任何一个至少40%相同的氨基酸序列,或[0042] iii)i)或ii)的生物学活性片段,并且
[0043] 催化氨基从包含4-12个碳的氨基供体到氨基受体的转移。
[0044] 在一个实施方案中,所述多肽包含:
[0045] i)SEQ ID NO:2或6-12中的任何一个提供的氨基酸序列,
[0046] ii)与如SEQ ID NO:2或6-12中的任何一个至少40%相同的氨基酸序列,或[0047] iii)i)或ii)的生物学活性片段,并且
[0048] 催化氨基从氨基供体到包含4-12个碳的氨基受体的转移。
[0049] 在本发明的一个实施方案中,所述氨基供体是氨基酸或胺化合物。
[0050] 在一个实施方案中,所述氨基酸是ω-氨基酸例如3-氨基丙酸、4-氨基丁酸、5-氨基戊酸、6-氨基己酸、7-氨基庚酸、8-氨基辛酸、11-氨基十一酸、12-氨基十二酸、3-氨基庚酸、3-氨基异丁酸,或其衍生物。3-氨基异丁酸是3-氨基丙酸或4-氨基丁酸的衍生物的实例。
[0051] 在一个实施方案中,所述氨基酸是β-氨基酸例如3-氨基庚酸或其衍生物。
[0052] 在一个实施方案中,所述胺化合物是伯胺,例如1,4-二氨基丁烷、1,5-二氨基戊烷、1,6-二氨基己烷、6-氨基己烷-1-醇、磺酸、酪胺、环己胺、异丙胺、2-氨基茚满,或其衍生物。
[0053] 所述伯胺可以是二胺例如1,4-二氨基丁烷、1,5-二氨基戊烷、1,6-二氨基己烷,或其衍生物。
[0054] 在本发明的一个实施方案中,胺化合物不是氨基丙二酸二乙酯、氨甲基膦酸、3-氨基环己酸、1-氨基环己酸、5-氨基乙酰丙酸、2,6-二氨基庚二酸酯、2,4-二氨基丁酸酯、肌酸、瓜氨酸、2-羟基-4-氨基丁酸酯、乙胺或1,3-二氨基丙烷、叔丁胺。
[0055] 在一个实施方案中,氨基受体是含羰基化合物例如酸、酮或。醛可以是例如甘油醛或戊二醛。
[0056] 在一个进一步的实施方案中,氨基受体还包括通过酶或全细胞过程转换为氨基受体的物质例如己二酸。己二酸可以通过己二酸半醛脱氢酶转换为1,6-己二醛(己二醛)和6-代己酸(己二酸半醛),这两者均可充当氨基受体。
[0057] 在一个实施方案中,本发明的多肽具有约pH 10的最佳pH。
[0058] 在本发明的一个实施方案中,所述多肽与至少一种其他多肽融合。所述至少一种其他多肽可以是例如增强本发明的多肽的稳定性的多肽,或帮助融合蛋白纯化的多肽。
[0059] 本发明还提供了经分离的和/或外源的多核苷酸,其包含下述中的一种或多种:
[0060] i)SEQ ID NO:3-5或14-20中任一提供的核苷酸序列,
[0061] ii)编码本发明的多肽的核苷酸序列,
[0062] iii)与SEQ ID NO:3-5或14-20中的任何一个或多个至少45%相同的核苷酸序列,[0063] iv)在严格条件下与i)杂交的核苷酸序列,或
[0064] v)与i)至iv)中任一互补的核苷酸序列。
[0065] 在一个实施方案中,所述多核苷酸包含下述中的一种或多种:
[0066] i)SEQ ID NO:3、SEQ ID NO:4或SEQ ID NO:5中提供的核苷酸序列,
[0067] ii)编码权利要求1-13中任一项的多肽的核苷酸序列,
[0068] iii)与i)至少45%相同的核苷酸序列,
[0069] iv)在严格条件下与i)杂交的核苷酸序列,或
[0070] v)与i)至iv)中任一互补的核苷酸序列。
[0071] 优选地,所述多核苷酸编码多肽,其编码具有氨基转移酶活性的多肽。
[0072] 优选地,所述多核苷酸与启动子可操作地连接。
[0073] 在本发明的一个实施方案中,多肽包含与SEQ ID NO:3-5或14-20中的任何一个或多个至少65%、至少70%、至少75%、至少80%、至少85%、至少90%或至少95%相同的氨基酸序列。
[0074] 本发明提供了包含本发明的多核苷酸的载体。优选地,所述多核苷酸与启动子可操作地连接。
[0075] 本发明还提供了包含本发明的多核苷酸或本发明的载体的宿主细胞。
[0076] 宿主细胞可以是任何类型的细胞。在本发明的一个实施方案中,宿主细胞是细菌或真菌细胞。
[0077] 本发明还提供了用于产生本发明的多肽的方法,该方法包括在允许编码多肽的多核苷酸表达的条件下,培养编码所述多肽的本发明的宿主细胞或在无细胞表达系统中的编码所述多肽的本发明的载体,并且回收所表达的多肽。
[0078] 还提供的是使用本发明的方法产生的多肽。
[0079] 本发明还提供了与本发明的多肽特异性结合的经分离的或纯化的抗体
[0080] 本发明还提供了转基因非人生物例如转基因非人动物或植物,其包含编码本发明的至少一种多肽的外源多核苷酸。
[0081] 优选地,所述多核苷酸稳定掺入所述生物的基因组内。
[0082] 本发明还提供了本发明的宿主细胞或本发明的转基因非人生物的提取物,其中所述提取物包含本发明的多肽。
[0083] 本发明还提供了包含下述一种或多种或全部的组合物:本发明的多肽、本发明的多核苷酸、本发明的载体、本发明的宿主细胞、本发明的抗体、本发明的转基因非人生物或本发明的提取物。
[0084] 本发明还提供了用于催化氨基从氨基供体到氨基受体的转移的方法,该方法包括使氨基供体和氨基受体与本发明的多肽或本发明的组合物接触。所述多肽可以通过本发明的宿主细胞产生。
[0085] 在本发明的一个进一步的实施方案中,氨基供体或氨基受体包含至少3个碳。在本发明的另一个实施方案中,氨基供体或氨基受体包含至少4个碳。在本发明的另一个实施方案中,氨基供体或氨基受体包含至少9个碳。在本发明的一个进一步实施方案中,氨基供体或氨基受体包含最高达12、13、14、15、16、17或18个碳。在本发明的另一个实施方案中,氨基供体或氨基受体包含9-12个碳。在本发明的另一个实施方案中,氨基供体或氨基受体包含9-13个碳。在本发明的另一个实施方案中,氨基供体或氨基受体包含9-14个碳。在本发明的另一个实施方案中,氨基供体或氨基受体包含9-15个碳。在本发明的另一个实施方案中,氨基供体或氨基受体包含9-16个碳。在本发明的另一个实施方案中,氨基供体或氨基受体包含9-17个碳。在本发明的另一个实施方案中,氨基供体或氨基受体包含9-12、9-13、9-14、9-
15、9-16、9-17或9-18个碳。
[0086] 本发明还提供了使用具有氨基转移酶活性的基本上纯化的和/或重组的多肽催化氨基从氨基供体到氨基受体的转移的方法,其中所述氨基供体或氨基受体包含至少9个碳。在一个实施方案中,氨基供体和氨基受体两者均具有至少9个碳。在一个实施方案中,氨基供体或氨基受体包含9-12、9-13、9-14、9-15、9-16、9-17或9-18个碳。多肽可以是本发明的多肽。所述多肽可以通过本发明的宿主细胞产生。
[0087] 上述方法可以进一步包括添加辅因子,例如5'磷酸吡哆醛(PLP)、PLP-磷酸吡哆醛、或磷酸吡哆胺。在一个优选实施方案中,所述辅因子是PLP-磷酸吡哆醛。
[0088] 在一个实施方案中,该方法产生工业产品。
[0089] 在一个进一步的实施方案中,该方法进一步包括一种或多种反应以产生工业产品。例如,脱氨基的氨基供体或胺化的氨基受体可以例如与化合物的一种或多种酶进一步反应以产生工业产品。
[0090] 所述工业产品可以是下述中的一种或多种或全部:氨基酸、二酸、胺、二胺、酮酸、二酮酸、酮、二酮、醛、二醛、半醛、氨基醛、多肽、聚胺、聚酰胺、聚酮、聚醛、内酰胺、内酯或脂肪酸
[0091] 在一个实施方案中,所述工业产品是氨基酸例如ω-氨基酸例如3-氨基丙酸、4-氨基丁酸、5-氨基戊酸、6-氨基己酸、7-氨基庚酸、3-氨基庚酸、8-氨基辛酸、11-氨基十一酸、12-氨基十二酸、3-氨基庚酸、3-氨基异丁酸或其衍生物。在另一个实施方案中,所述工业产品是β-氨基酸例如3-氨基庚酸或其衍生物。
[0092] 在另一个实施方案中,所述工业产品是胺,例如1,4-二氨基丁烷、1,5-二氨基戊烷、1,6-二氨基己烷、6-氨基己烷-1-醇、牛磺酸、酪胺、环己胺、异丙胺、2-氨基茚满或其衍生物。
[0093] 在另一个实施方案中,所述工业产品是包含羰基的化合物,例如酮酸、酮或醛。醛可以是例如甘油醛或戊二醛。
[0094] 在另一个实施方案中,所述工业产品是聚酰胺例如尼龙。
[0095] 在另一个实施方案中,所述工业产品是内酰胺。
[0096] 在另一个实施方案中,所述工业产品是多肽。
[0097] 在另一个实施方案中,所述工业产品是官能化的脂肪酸。
[0098] 本发明的方法可以用于产生药学相关的工业产品,例如药学相关的胺、多胺、氨基酸包括ω-氨基酸、多肽和内酰胺。
[0099] 本发明的方法还可以用于产生聚酰胺例如尼龙。例如,当与己二酸半醛脱氢酶结合使用时,本发明的多肽可以用于产生尼龙6,6的二酸和二胺组分(左下显示),或可替代地,由己二酸制备尼龙6(右下)的ω-氨基酸。
[0100]
[0101] 在这个例子中,二胺(六亚甲基二胺)和ω-氨基酸(氨基己酸)可以与尼龙6,6和尼龙6一样视为工业产品。
[0102] 本发明的方法还可以用于从氨基受体产生工业产品。例如,甘油(散装柴油废物)衍生物例如甘油醛、二羟基丙酮或酮基丙二酸酯可以用作化学生产的“底物”。
[0103] 本发明的方法还可以用于使脂肪酸官能化。脂肪族脂肪酸可以充当本发明的方法中的氨基受体。
[0104] 还应认识到氨基供体和氨基受体可以具有不对称中心,并且因此能够以超过一种立体异构形式存在。本发明因此还涉及在一个或多个不对称中心处以基本上纯的异构体形式的氨基供体和氨基受体的使用和生产,例如大于约90%ee,例如约95%或97%ee或大于99%ee,以及其混合物包括外消旋混合物。此类同分异构体可以通过不对称合成例如使用手性中间产物或通过手性拆分进行制备。
[0105] 在一个实施方案中,本发明的方法还可以用于制备对映纯的胺。以对映纯形式的手性胺是重要的化学构件,其可以用于例如药物的生产。
[0106] 本发明的多肽可以被突变,并且所得到的突变体就改变的活性例如增强的酶促活性或改变的底物特异性进行筛选。此类突变可以使用本领域已知的任何技术包括但不限于位点饱和诱变来进行。
[0107] 因此,本发明还提供了产生多肽的方法,所述多肽具有增强的催化氨基从氨基供体到氨基受体的转移的能力,或具有改变的底物特异性,所述方法包括:
[0108] i)改变本发明的多肽的一个或多个氨基酸,
[0109] ii)测定得自步骤i)的改变的多肽催化氨基从氨基供体到氨基受体的转移的能力,和
[0110] iii)选择当与步骤i)中使用的多肽相比较时,具有增强的催化氨基从氨基供体到氨基受体的转移的能力、或具有改变的底物特异性的改变的多肽。
[0111] 步骤i)可以使用本领域已知的任何合适技术进行,所述技术包括但不限于编码核酸的定点诱变、化学诱变和DNA改组。
[0112] 还提供的是通过本发明的方法产生的多肽。
[0113] 本发明还提供了用于筛选能够催化来自包含至少9个碳的氨基供体的氨基转移的微生物的方法,该方法包括:
[0114] i)在包含至少9个碳的氨基供体作为单独的氮源的存在下,培养候选微生物,和[0115] ii)测定微生物是否能够生长和/或分裂。
[0116] 在一个实施方案中,所述氨基供体包含9-12、9-13、9-14、9-15、9-16、9-17或9-18个碳。
[0117] 还提供的是使用本发明的方法鉴定的微生物。
[0118] 本发明还提供了包含下述中的一种或多种或全部的试剂盒:本发明的多肽、本发明的多核苷酸、本发明的载体、本发明的宿主细胞、本发明的抗体、本发明的转基因非人生物或本发明的提取物。
[0119] 本发明还提供了本发明的氨基转移酶的晶体结构。在一个实施方案中,所述氨基转移酶具有如SEQ ID NO:1或SEQ ID NO:2中提供的氨基酸序列。
[0120] 本发明还提供了本发明的晶体结构的原子坐标集合或其子集。
[0121] 本发明还提供了在附录I中提供的原子坐标集合或其子集。
[0122] 本发明还提供了在其上记录有数据的计算机可读介质,所述数据代表本发明的晶体结构的原子坐标或其子集;或者附录I中提供的原子坐标或其子集;和/或使用原子坐标产生的模型。
[0123] 本发明还提供了鉴定与本发明的氨基转移酶结合的化合物的计算机辅助方法,该方法包括下述步骤:
[0124] i)将候选化合物的结构与通过本发明的晶体结构的原子坐标或其子集,或者附录I中提供的原子坐标或其子集限定的结构对接,和
[0125] ii)鉴定可以与氨基转移酶结合的候选化合物。
[0126] 在一个实施方案中,所述氨基转移酶具有如SEQ ID NO:1或SEQ ID NO:2中提供的氨基酸序列。
[0127] 在一个实施方案中,该方法进一步包括合成或获得所鉴定的候选化合物,并且测定化合物是否与氨基转移酶结合。
[0128] 本发明还提供了用于鉴定具有氨基转移酶活性的多肽的计算机辅助方法,该方法包括下述步骤:
[0129] i)比较通过本发明的晶体结构的原子坐标或其子集,或者附录I中提供的原子坐标或其子集限定的结构与候选多肽的三级结构的模型,和
[0130] ii)鉴定可能具有氨基转移酶活性的候选化合物。
[0131] 在一个实施方案中,该方法进一步包括合成或获得所鉴定的多肽,并且测定多肽是否催化氨基从氨基供体到氨基受体的转移。
[0132] 本文的任何实施方案应在细节上作必要的修改,以应用于任何其他实施方案,除非另有具体说明。
[0133] 本发明在范围中并不限于本文描述的具体实施方案,其仅旨在用于例证的目的。显然功能上等价的产物、组合物和方法在本发明的范围内,如在本文描述。
[0134] 本发明在下文通过下述非限制性实施例且参考附图进行描述。

附图说明

[0135] 图1.使用祖先重建(ancestral reconstruction)产生的多肽的比对。
[0136] 序列表的注解
[0137] SEQ ID NO:1:p6的氨基酸序列。
[0138] SEQ ID NO:2:p7的氨基酸序列。
[0139] SEQ ID NO:3:p6的核苷酸序列。
[0140] SEQ ID NO:4:p7的核苷酸序列。
[0141] SEQ ID NO:5:具有单个点突变的p7的核苷酸序列。
[0142] SEQ ID NO:6:p4的氨基酸序列。
[0143] SEQ ID NO:7:p7N6的氨基酸序列。
[0144] SEQ ID NO:8:p7N15的氨基酸序列。
[0145] SEQ ID NO:9:p7N16的氨基酸序列。
[0146] SEQ ID NO:10:p7N17的氨基酸序列。
[0147] SEQ ID NO:11:p7N43的氨基酸序列。
[0148] SEQ ID NO:12:p7N48的氨基酸序列。
[0149] SEQ ID NO:13:GabT(γ-氨基丁酸转氨酶;E.C.2.6.1.19)的氨基酸序列。
[0150] SEQ ID NO:14:p4的核苷酸序列。
[0151] SEQ ID NO:15:p7N6的核苷酸序列。
[0152] SEQ ID NO:16:p7N15的核苷酸序列。
[0153] SEQ ID NO:17:p7N16的核苷酸序列。
[0154] SEQ ID NO:18:p7N17的核苷酸序列。
[0155] SEQ ID NO:19:p7N43的核苷酸序列。
[0156] SEQ ID NO:20:p7N48的核苷酸序列。

具体实施方式

[0157] 一般技术和定义
[0158] 除非另有具体定义,否则本文使用的所有技术和科学术语均应视为具有与本领域(例如细胞培养、分子遗传学、免疫学、免疫组织化学、蛋白质化学、多肽和聚酰胺的生产、以及生物化学)普通技术人员通常理解相同的含义。
[0159] 除非另有说明,否则本发明中利用的重组蛋白质、细胞培养和免疫学技术是本领域技术人员众所周知的标准程序。此类技术在例如下述来源中的参考文献自始至终得到描述和说明:J.Perbal,A Practical Guide to Molecular Cloning,John Wiley and Sons(1984),Maniatis等人,Molecular Cloning:A Laboratory Manual,Cold Spring Harbour Laboratory Press(1982),J.Sambrook等人,Molecular Cloning:A Laboratory Manual,Cold Spring Harbour Laboratory Press(1989),T.A.Brown(编辑),Essential Molecular Biology:A Practical Approach,第1和2卷,IRL Press(1991),D.M.Glover和B.D.Hames(编辑),DNA Cloning:A Practical Approach,第1-4卷,IRL Press(1995和1996),F.M.Ausubel等人,(编辑),Current Protocols in Molecular Biology,Greene Pub.Associates and Wiley-Interscience(1988,包括直到目前的所有更新),E.Harlow和D.Lane(编辑),Antibodies:A Laboratory Manual,Cold Spring Harbour Laboratory(1988),以及J.E.Coligan等人(编辑),Current Protocols in Immunology,John Wiley&Sons(1991,包括直到目前的所有更新)。
[0160] 本说明书自始至终,单词“包含”或其变化将理解为暗示包括所述元件、整数或步骤,或者元件、整数或步骤组,但不排除任何其他元件、整数或步骤,或者元件、整数或步骤组。
[0161] 如本文使用的,“约”一般应意指在给定指或范围的20%内、更优选在10%内、且甚至更优选在5%内。
[0162] 术语“和/或”例如“X和/或Y”应理解为意指“X和Y”或“X或Y”,并且应视为提供关于两种含义或任一含义的明确支持。
[0163] 多肽
[0164] 本发明涉及催化氨基从氨基供体到氨基受体的转移的多肽。此类多肽的例子包括但不限于包含如SEQ ID NO:1、2或6-12中任一提供的氨基酸序列的那些。
[0165] 术语“多肽”和“蛋白质”一般可互换使用。
[0166] 多肽或多肽类别可以通过其氨基酸序列与参考氨基酸序列的相同性程度(%相同性),或通过与一种参考氨基酸序列的%相同性大于另一种进行限定。多肽与参考氨基酸序列的%相同性通常通过GAP分析(Needleman和Wunsch,1970;GCG程序)进行测定,其参数为缺口产生罚分=5和缺口延伸罚分=0.3。查询序列为长度至少100个氨基酸,并且GAP分析在至少100个氨基酸的区域上比对两个序列。甚至更优选地,查询序列为长度至少250个氨基酸,并且GAP分析在至少250个氨基酸的区域上比对两个序列。甚至更优选地,查询序列为长度至少450个氨基酸,并且GAP分析在至少450个氨基酸的区域上比对两个序列。甚至更优选地,GAP分析在其整个长度上比对两个序列。多肽或多肽类别可以具有与参考多肽相同的酶促活性或不同的活性,或缺乏参考多肽的活性。优选地,多肽具有参考多肽活性至少10%、至少50%、至少75%或至少90%的酶促活性。
[0167] 如本文使用的,“生物学活性片段”是本发明的多肽的一部分,其保留全长参考多肽的所定义的活性,即氨基转移酶活性。如本文使用的,生物学活性片段排除全长多肽。生物学活性片段可以是任何大小的部分,只要它们保留所定义的活性。优选地,生物学活性片段保留全长蛋白质活性的至少10%、至少50%、至少75%或至少90%。
[0168] 就限定的多肽或酶而言,应了解高于本文提供那些的%相同性数字涵盖优选实施方案。因此,当适用时,按照最小%相同性数字,优选多肽/酶包含这样的氨基酸序列,其与相关指定SEQ ID NO至少40%、更优选至少45%、更优选至少50%、更优选至少55%、更优选至少60%、更优选至少65%、更优选至少70%、更优选至少75%、更优选至少80%、更优选至少85%、更优选至少90%、更优选至少91%、更优选至少92%、更优选至少93%、更优选至少94%、更优选至少95%、更优选至少96%、更优选至少97%、更优选至少98%、更优选至少
99%、更优选至少99.1%、更优选至少99.2%、更优选至少99.3%、更优选至少99.4%、更优选至少99.5%、更优选至少99.6%、更优选至少99.7%、更优选至少99.8%、且甚至更优选至少99.9%相同。
[0169] 可以通过将适当的核苷酸变化引入本文限定的核酸内或通过所需多肽的体外合成来制备本文限定的多肽的氨基酸序列突变体。此类突变体包括例如在氨基酸序列内的残基缺失、插入或置换。可以制备缺失、插入和置换的组合,以达成最终构建体,条件是最终多肽产物具有所定义的活性。优选的氨基酸序列突变体仅具有相对于参考多肽的一个、两个、三个、四个或小于10个氨基酸变化。
[0170] 突变型(改变的)多肽可以使用本领域已知的任何技术进行制备,例如使用定向进化或合理的设计策略(参见下文)。衍生自突变/改变的DNA的产物可以使用本文描述的技术容易地进行筛选,以测定它们是否具有氨基转移酶活性。
[0171] 在设计氨基酸序列突变体中,突变位点的位置和突变的性质取决于待修饰的一种或多种特征。突变位点可以例如通过下述个别地或系列地进行修饰:(1)首先用保守氨基酸选择置换,随后取决于达到的结果,用更激进的选择置换,(2)缺失靶残基,或(3)插入与定位位点邻近的其他残基。
[0172] 氨基酸序列缺失一般范围为约1-15个残基,更优选约1-10个残基,且通常为约1-5个邻接残基。
[0173] 置换突变体在多肽中至少一个氨基酸残基被去除且在其位置中插入不同的残基。最感兴趣的置换诱变位点包括鉴定为活性位点例如底物或辅因子结合位点的位点。其他感兴趣的位点是其中得自各个菌株或物种的具体残基相同的那些。这些位置对于生物学活性可能是重要的。这些位点尤其是落入至少三个其他相同保守位点的序列内的那些,优选以相对保守的方式进行置换。此类保守置换在表1中显示于“示例性置换”的标题下。
[0174] 在一个优选实施方案中,当与参考多肽相比较时,突变体/变体多肽仅具有或具有不超过一个或两个或三个或四个保守氨基酸变化。保守氨基酸变化的细节在表1中提供。如技术人员将意识到的,当在细胞中表达时,此类微小变化可以合理地预测为不改变多肽的活性。
[0175] 表1.示例性置换
[0176]
[0177]
[0178] 关于可以制备的氨基酸置换的大量指导可以通过比对本文描述的不同氨基酸转移酶来获得(参见例如图1)。关于哪些氨基酸可以改变,以及如果这样的话,哪些氨基酸可以用于特定位点处且维持功能,此类比对提供很大的信息量。
[0179] 在一个实施方案中,辅因子/底物结合位点中的氨基酸没有被改变,并且如果它们被改变,则它是使用保守氨基酸置换。辅因子/底物结合位点中的氨基酸的实例在下文概述:
[0180] p6:F89,V320,G325,T327,F24,L57,L60,W61,Y153,I166,G168,K171,S231,K288,I396,R414,F415,G416,G417,Q421,V156,
[0181] p7:S19,L58,Y59,H85,Y87,V88,L118,S119,G120,S121,Y153,G155,F169,E226,T231,D259,V261,V262,A287,K288,L297,A319,H322,G323,W324,T325,Y326,R419,[0182] p7N6:S19,L58,Y59,H85,Y87,V88,L118,S119,G120,S121,Y153,G155,F169,E226,T231,D259,V261,V262,A287,K288,L297,A319,H322,G323,W324,T325,Y326,R419,[0183] p7N15:S19,L58,Y59,H85,Y87,V88,M118,S119,G120,S121,Y153,G155,F169,E226,T231,D259,V261,V262,A287,K288,L297,P319,H322,G323,W324,T325,Y326,R419,[0184] p7N16:S19,L58,Y59,H85,Y87,V88,M118,S119,G120,S121,Y153,G155,F169,E226,T231,D259,V261,V262,A287,K288,L297,P319,H322,G323,W324,T325,Y326,R419,[0185] p7N17:S19,L58,Y59,H85,Y87,V88,M118,S119,G120,S121,Y153,G155,F169,E226,T231,D259,V261,V262,A287,K288,L297,P319,H322,G323,W324,T325,Y326,R419[0186] p7N43:S19,L58,Y59,H85,Y87,V88,M118,S119,G120,S121,Y153,G155,F169,E226,T231,D259,V261,V262,A287,K288,L297,V319,H322,G323,W324,T325,Y326,R419,和[0187] p7N48:S19,L58,Y59,H85,Y87,V88,M118,S119,G120,S121,Y153,G155,F169,E226,T231,D259,V261,V262,A287,K288,L297,P319,H322,G323,W324,T325,Y326,R419。
[0188] 此外,需要时,非天然氨基酸或合成氨基酸类似物可以作为置换或添加引入本发明的多肽内。此类氨基酸包括但不限于普通氨基酸的D-异构体、2,4-二氨基丁酸、α-氨基异丁酸、4-氨基丁酸、2-氨基丁酸、6-氨基己酸、2-氨基异丁酸、3-氨基丙酸、氨酸、正亮氨酸、正缬氨酸、羟脯氨酸、肌氨酸、瓜氨酸、高瓜氨酸、半胱磺酸、叔丁基甘氨酸、叔丁基丙氨酸、苯基甘氨酸、环己基丙氨酸、β-丙氨酸、氟-氨基酸、设计者氨基酸(designer amino acid)例如β-甲基氨基酸、Cα-甲基氨基酸、Nα-甲基氨基酸以及一般而言的氨基酸类似物。
[0189] 还包括在本发明的范围内的是这样的多肽,其在合成期间或在合成后通过生物素化、苄化、糖基化、乙酰化、磷酸化、酰胺化、通过已知的保护/阻断基团衍生化、蛋白水解切割、与抗体分子或其他细胞配体连接等进行差别修饰。这些修饰可以作用于增加本发明的多肽的稳定性和/或生物活性。
[0190] 本发明的多肽可以以各种方式进行生产,包括天然多肽的生产和回收、重组多肽的生产和回收、以及多肽的人造合成。在一个实施方案中,本发明的经分离的多肽通过在有效产生所述多肽的条件下培养能够表达所述多肽的细胞且回收所述多肽进行生产。优选待培养的细胞是本发明的宿主细胞。有效的培养条件包括但不限于允许多肽生产的有效培养基、生物反应器、温度、pH和氧条件。有效培养基指在其中培养细胞以产生本发明的多肽的任何培养基。此类培养基通常包括具有可同化的碳源、氮源和磷源,以及适当的盐、矿物质、金属和其他营养物例如维生素的水性培养基。
[0191] 本发明的细胞可以在常规发酵生物反应器、摇瓶、试管、微量滴定皿和培养皿中进行培养。培养可以在对于宿主细胞适当的温度、pH和氧含量下进行。此类培养条件在本领域普通技术人员的专业知识内。
[0192] 定向进化
[0193] 在定向进化中,将随机诱变应用于蛋白质,并且选择方案用于挑选具有所需性质例如增加的氨基转移酶活性的变体。随后应用更多轮的突变和选择。通常的定向进化策略涉及三个步骤:
[0194] 1)多样化:使编码目的蛋白质的基因随机突变和/或重组,以制备基因变体的大型文库。变体基因文库可以通过易错PCR(参见例如Leung,1989;Cadwell和Joyce,1992),由下述进行构建:亲本模板制备的DNA酶I消化片段库(Stemmer,1994a;Stemmer,1994b;Crameri等人,1998;Coco等人,2001)、简并寡核苷酸(Ness等人,2002,Coco,2002)或两者的混合物、或甚至未消化的亲本模板(Zhao等人,1998;Eggert等人,2005;Jézéquek等人,2008),并且通常通过PCR进行装配。文库还可以通过同源重组或非同源重组在体内或体外由亲本序列进行制备(Ostermeier等人,1999;Volkov等人,1999;Sieber等人,2001)。变体基因文库还可以通过下述进行构建:将目的基因亚克隆到合适载体内,将载体转化到“增变株”例如大肠杆菌(E.coli)XL-1red(Stratagene)内,并且将经转化的细菌繁殖合适代数。变体基因文库还可以通过对目的基因实施DNA改组(即通过随机断裂和重新装配对所选择的突变基因库体外同源重组)进行构建,如由Harayama(1998)广泛描述的。
[0195] 2)选择:使用筛选或选择就具有所需特性的突变体(变体)的存在来测试文库。筛选允许人工鉴定和分离高性能的突变体,而选择自动剔除所有无功能的突变体。筛选可以涉及就已知保守氨基酸基序的存在的筛选。可替代地或另外地,筛选可以涉及在细胞或转基因非人生物或其部分中表达突变的多核苷酸,并且通过例如定量细胞或转基因非人生物或其部分中、或者从细胞或转基因非人生物或其部分中提取的所得的产物水平,来测定例如氨基转移酶活性的水平,并且测定相对于缺乏突变多核苷酸和任选地表达亲本(未突变的)多核苷酸的相应细胞或转基因非人生物或其部分的产物水平。可替代地,筛选可以涉及用标记底物饲养细胞或转基因非人生物或其部分,并且测定细胞或转基因非人生物或其部分中、或者从细胞或转基因非人生物或其部分中提取的底物或产物,相对于缺乏突变多核苷酸和任选地表达亲本(未突变的)多核苷酸的相应细胞或转基因非人生物或其部分的水平。
[0196] 3)扩增:将在选择或筛选中鉴定的变体复制许多倍,允许研究者测序其DNA,以便理解哪些突变已发生。
[0197] 这三个步骤一起被称为“一轮”定向进化。大多数实验需要超过一轮。在这些实验中,先前轮的“胜出者”在下一轮中多样化,以制备新文库。在实验结束时,所有进化的蛋白质或多核苷酸突变体使用生物化学方法进行表征。
[0198] 合理设计
[0199] 蛋白质可以在关于蛋白质结构和折叠的已知信息的基础上进行合理设计。这可以通过从零开始设计(从头设计)或基于天然支架的重新设计来实现(参见例如Hellinga,1997;以及Lu和Berry,Protein Structure Design and Engineering,Handbook of Proteins 2,1153-1157(2007))。蛋白质设计通常涉及鉴定折叠成给定结构或靶结构的序列,并且可以使用计算机模型来实现。计算蛋白质设计算法在序列构象空间中搜索当折叠为靶结构时能量很低的序列。计算蛋白质设计算法使用蛋白质能量学的模型,来评估突变将如何影响蛋白质的结构和功能。这些能量函数通常包括分子力学、统计学(即基于知识的)及其他经验项的组合。合适的可用软件包括IPRO(Interative Protein Redesign and Optimization)、EGAD(A Genetic Algorithm for Protein Design)、Rosetta Design、Sharpen和Abalone。
[0200] 氨基转移酶活性
[0201] 本发明的多肽是转氨酶(在本文中也称为氨基转移酶)。
[0202] 如本文使用的,术语“转氨酶”或“氨基转移酶”指这样的酶,其催化氨基从氨基供体到氨基受体,例如从氨基酸到α-酮酸的转移。这个酶类别可以基于序列比对分成四个亚组(Mehta等人,1993)。亚组I、III和IV中的酶转移与氨基酸的α-糖键合的氨基。亚组II中的转氨酶可以转移来自不具有羧基的碳原子的氨基。亚组II中的转氨酶通常被称为ω-氨基酸转氨酶。在一个优选实施方案中,本发明的多肽是ω-氨基酸转氨酶。关于ω-氨基酸转氨酶的综述,参见Malik等人(2012)。
[0203] 如本文使用的,“ω-氨基酸转氨酶”指催化非α-氨基从氨基供体到氨基受体的转移的转氨酶。此类转氨酶通常具有更大的底物特异性,并且还可能能够将氨基从胺化合物转移到包含羰基的化合物例如酮酸、酮或醛。
[0204] 如本文使用的,术语“α-氨基酸”指具有氨基或胺基(NH2)和羧基(COOH)的化合物,其中氨基和羧基通过单个碳原子,α-碳原子分开。α-氨基酸包括天然存在和非天然存在的L-氨基酸及其D-异构体。
[0205] 如本文使用的,术语“ω-氨基酸”指具有附着至非α-碳的氨基的氨基酸。该术语是一般术语,其不指定氨基的实际位置,而是代表所有非α-位置,并且因此涵盖例如β-、γ-和δ-氨基酸。
[0206] 如本文使用的,术语“β-氨基酸”指这样的氨基酸,其不同于α-氨基酸之处在于:存在将羧基末端和氨基末端分开的两个(2)碳原子。β-氨基酸可以是例如3-氨基庚酸或其衍生物。具有特定侧链的β-氨基酸可以作为R或S对映体存在于α(C2)碳或β(C3)碳的任一处,导致关于任何给定侧链的总共4种可能异构体(如下所示)。侧链可以与天然存在的α-氨基酸的那些相同或可以是非天然存在的氨基酸的侧链。
[0207]
[0208] 类似地,其他ω-氨基酸的手性碳可以作为R或S对映体存在。如本领域将理解的,随着使羧基末端和氨基末端分开的碳原子数目增加,可能的异构体形式的数目也增加。例如,如果分子含有两个不对称碳,则存在最高达4种可能构型。随着分子中存在更多的不对称中心,可能性继续倍增。一般而言,分子的构型异构体数目可以通过计算2n进行测定,其中n=分子中的手性中心数目。这是对的,除了当分子具有内消旋形式的情况下之外。
[0209] “氨基供体”可以是能够贡献氨基或胺基(NH2)的任何化合物,例如氨基酸或胺化合物。氨基供体包括非手性氨基酸甘氨酸,具有S-构型的手性氨基酸例如L-丙氨酸或L-天冬氨酸、ω-氨基酸例如3-氨基丙酸(β-丙氨酸)、4-氨基丁酸、5-氨基戊酸、6-氨基己酸、7-氨基庚酸、8-氨基辛酸、11-氨基十一酸、12-氨基十二酸、3-氨基庚酸、3-氨基异丁酸及其衍生物。然而,氨基供体无需是氨基酸。例如,胺例如6-氨基己烷-1-醇、牛磺酸、酪胺、环己胺、异丙胺、2-氨基茚满及其衍生物,以及二胺例如1,4-二氨基丁烷、1,5-二氨基戊烷、和1,6-二氨基己烷及其衍生物可以用作氨基供体。氨基供体可以是通过酶或全细胞过程转换为氨基供体的化合物。
[0210] 氨基供体的碳原子可以排列为直链烷基、支链烷基、环烷基和芳基或其组合。
[0211] 如本文使用的,术语“环烷基”指环基。合适的环烷基包括但不限于环丙基、环丁基、环戊基和环己基。
[0212] 如本文使用的,术语“芳基”指C6-C10芳烃基例如苯基或基。
[0213] “氨基酸”是包含氨基或胺(NH2)基和羧基(COOH)的化合物。具有两个(2)胺基和至少一个羧基的氨基酸可以更具体而言被称为“二氨基酸”。然而,如本文使用的,术语“氨基酸”一般应理解为包括二氨基酸。α-碳的立体构型通常使用D/L符号就甘油醛的绝对构型而言提及。可替代地,(S)和(R)指示符可以用于指示绝对立体化学。
[0214] 如本文使用的,术语“非天然存在的氨基酸”指具有在自然界中不出现的侧链的氨基酸。非天然氨基酸和衍生物的例子包括但不限于4-氨基丁酸、5-氨基戊酸、6-氨基己酸、7-氨基庚酸、8-氨基辛酸、11-氨基十一酸、12-氨基十二酸、3-氨基庚酸和3-氨基异丁酸。
[0215] “胺化合物”是包含通过三个σ键连接至烷基、芳基或烷芳基或氢原子的氮原子的化合物(包括直链、支链和环状化合物)。根据与氮原子直接键合的碳数目,将胺分类为伯胺、仲胺或叔胺。伯胺具有与氮键合的一个碳。仲胺具有与氮键合的两个碳,并且叔胺具有与氮键合的三个碳。胺化合物可以具有一个或多个伯氨基(NH2)。具有两个伯氨基的胺可以更具体而言被称为“二胺”。具有两个或更多个伯氨基的胺可以更具体而言被称为聚胺。然而,如本文使用的,术语“胺”一般应理解为包括二胺和聚胺。胺化合物可以是手性胺化合物。
[0216] “氨基受体”可以是能够接受氨基或胺基(NH2)的任何化合物,例如包含羰基(C=O)的化合物,例如酮酸、酮或醛。氨基受体可以是这样的化合物,其通过酶或全细胞过程转换为氨基受体,例如富酸(其可以转换为草酰乙酸)、或葡萄糖(其可以转换为丙酮酸盐)、或己二酸(其可以通过己二酸半醛脱氢酶转换为1,6-己二醛(己二醛)和6-氧代己酸(己二酸半醛)。
[0217] “羰基”是由与氧原子双重键合的碳原子组成的官能团(C=O)。
[0218] “酮酸(或氧酸)”是包含羧酸基(-COOH)和酮基(R(CO)R1)的化合物。酮酸包括例如乙醛酸、丙酮酸、草酰乙酸等等,以及这些酸的盐。具有两个或更多个酮基和至少一个羧酸基的酮酸可以更具体而言被称为“二酮酸”。
[0219] “酮(或烷酮)”是包含与两个其他碳原子键合的羰基的化合物,具有通式R(CO)R1,其中R可以与R1相同或不同。具有两个酮基的酮可以更具体而言被称为二酮。具有两个或更多个酮基的酮可以更具体而言被称为聚酮。然而,如本文使用的,术语“酮”一般应理解为包括二酮和聚酮。
[0220] “醛”是包含甲酰基或醛基(CHO)的化合物,具有通式R-CHO。甲酰基由与氢键合的羰基(C=O)中心和R基组成,所述R基是H或烷基或芳基或芳烷基。醛不同于酮之处在于:羰基置于碳骨架的结束处而不是两个碳原子之间。醛包括例如戊二醛(戊二醛(pentanedial))和甘油醛。具有两个甲酰基的醛可以更具体而言被称为“二醛”。具有两个或更多个甲酰基的醛可以更具体而言被称为“聚醛”。具有甲酰基和羧基(COOH)的醛可以更具体而言被称为“半醛”。具有甲酰基和氨基或胺基(NH2)的醛可以更具体而言被称为“氨基醛”。然而,如本文使用的,术语“醛”一般应理解为包括二醛、聚醛、半醛和氨基醛。
[0221] 如本文使用的,“氨基转移酶活性”指多肽催化氨基从氨基供体到氨基受体的转移的能力。通常,多肽可以催化转氨作用的逆转。转氨酶反应分成两个半反应:氨基供体的氧化脱氨作用和氨基受体的还原胺化作用。关于活性,需要辅因子并且充当反应期间的氨基的中间载体。
[0222] 在一个实施方案中,该多肽包含:
[0223] i)SEQ ID NO:1中提供的氨基酸序列,
[0224] ii)与SEQ ID NO:1至少40%相同、或至少80%相同、或至少90%相同、或至少95%相同的氨基酸序列,或
[0225] iii)i)或ii)的生物学活性片段,
[0226] 其中所述多肽对选自下述但不限于下述的一种、多种或全部底物具有氨基转移酶活性:甘氨酸、β-丙氨酸、4-氨基丁酸酯、5-氨基戊酸酯、6-氨基己酸、7-氨基庚酸、8-氨基辛酸、11-氨基十一酸、12-氨基十二酸、3-氨基异丁酸酯、腐胺、尸胺、3-氨基环己酸酯、丙醛、丁醛、酪胺、2-氨基茚满、六亚甲基二胺、1,7-二氨基庚烷、1,8-二氨基辛烷、1,9-二氨基壬烷、1,10-二氨基癸烷、6-氨基己醇、7-氨基庚醇、8-氨基辛醇、9-氨基壬醇、10-氨基癸醇、牛磺酸、甘油醛、3-氨基庚酸、环己胺、2-甲基苄胺、二羟丙酮磷酸、羟甲基糠醛、乙醇胺、丙氨酸和丙酮酸盐。
[0227] 在一个实施方案中,该多肽包含:
[0228] i)SEQ ID NO:2中提供的氨基酸序列,
[0229] ii)与SEQ ID NO:2至少40%相同、或至少80%相同、或至少90%相同、或至少95%相同的氨基酸序列,或
[0230] iii)i)或ii)的生物学活性片段,
[0231] 其中所述多肽对选自下述但不限于下述的一种、多种或全部底物具有氨基转移酶活性:甘氨酸、4-氨基丁酸酯、5-氨基戊酸酯、6-氨基己酸、7-氨基庚酸、8-氨基辛酸、11-氨基十一酸、12-氨基十二酸、4-氨基-2-羟基丁酸酯、腐胺、尸胺、六亚甲基二胺、1,7-二氨基庚烷、1,8-二氨基辛烷、1,9-二氨基壬烷、1,10-二氨基癸烷、6-氨基己醇、7-氨基庚醇、8-氨基辛醇、9-氨基壬醇、10-氨基癸醇、2,4-二氨基丁酸酯、2-甲基苄胺、二羟丙酮磷酸、羟甲基糠醛、丙氨酸和丙酮酸盐。
[0232] 在一个实施方案中,该多肽包含:
[0233] i)SEQ ID NO:6中提供的氨基酸序列,
[0234] ii)与SEQ ID NO:6至少40%相同、或至少80%相同、或至少90%相同、或至少95%相同的氨基酸序列,或
[0235] iii)i)或ii)的生物学活性片段,
[0236] 其中所述多肽对选自下述但不限于下述的一种、多种或全部底物具有氨基转移酶活性:6-氨基己酸、7-氨基庚酸、8-氨基辛酸、11-氨基十一酸、12-氨基十二酸、腐胺、尸胺、3-氨基环己酸酯、丙醛、丁醛、酪胺、2-氨基茚满、2-甲基苄胺、六亚甲基二胺、1,7-二氨基庚烷、1,8-二氨基辛烷、1,9-二氨基壬烷、1,10-二氨基癸烷、环己胺、6-氨基己醇、7-氨基庚醇、8-氨基辛醇、9-氨基壬醇、10-氨基癸醇、环己酮、多巴胺、血清素、丙氨酸和丙酮酸盐。
[0237] 在一个实施方案中,该多肽包含:
[0238] i)SEQ ID NO:7中提供的氨基酸序列,
[0239] ii)与SEQ ID NO:7至少40%相同、或至少80%相同、或至少90%相同、或至少95%相同的氨基酸序列,或
[0240] iii)i)或ii)的生物学活性片段,
[0241] 其中所述多肽对选自下述但不限于下述的一种、多种或全部底物具有氨基转移酶活性:甘氨酸、4-氨基丁酸酯、5-氨基戊酸酯、6-氨基己酸、7-氨基庚酸、8-氨基辛酸、11-氨基十一酸、12-氨基十二酸、鸟氨酸、赖氨酸、3-氨基环己酸酯、4-氨基-2-羟基丁酸酯、腐胺、尸胺、六亚甲基二胺、1,7-二氨基庚烷、1,8-二氨基辛烷、1,9-二氨基壬烷、1,10-二氨基癸烷、6-氨基己醇、7-氨基庚醇、8-氨基辛醇、9-氨基壬醇、10-氨基癸醇、2,4-二氨基丁酸酯、2-甲基苄胺、二羟丙酮磷酸、羟甲基糠醛、丙氨酸和丙酮酸盐。
[0242] 在一个实施方案中,该多肽包含:
[0243] i)SEQ ID NO:8中提供的氨基酸序列,
[0244] ii)与SEQ ID NO:8至少40%相同、或至少80%相同、或至少90%相同、或至少95%相同的氨基酸序列,或
[0245] iii)i)或ii)的生物学活性片段,
[0246] 其中所述多肽对选自下述但不限于下述的一种、多种或全部底物具有氨基转移酶活性:甘氨酸、4-氨基丁酸酯、5-氨基戊酸酯、6-氨基己酸、7-氨基庚酸、8-氨基辛酸、11-氨基十一酸、12-氨基十二酸、鸟氨酸、赖氨酸、3-氨基环己酸酯、4-氨基-2-羟基丁酸酯、腐胺、尸胺、氨基丙二酸二乙酯、六亚甲基二胺、1,7-二氨基庚烷、1,8-二氨基辛烷、1,9-二氨基壬烷、1,10-二氨基癸烷、6-氨基己醇、7-氨基庚醇、8-氨基辛醇、9-氨基壬醇、10-氨基癸醇、2,4-二氨基丁酸酯、2-甲基苄胺、二羟丙酮磷酸、羟甲基糠醛、丙氨酸和丙酮酸盐。
[0247] 在一个实施方案中,该多肽包含:
[0248] i)SEQ ID NO:9中提供的氨基酸序列,
[0249] ii)与SEQ ID NO:9至少40%相同、或至少80%相同、或至少90%相同、或至少95%相同的氨基酸序列,或
[0250] iii)i)或ii)的生物学活性片段,
[0251] 其中所述多肽对选自下述但不限于下述的一种、多种或全部底物具有氨基转移酶活性:甘氨酸、4-氨基丁酸酯、5-氨基戊酸酯、6-氨基己酸、7-氨基庚酸、8-氨基辛酸、11-氨基十一酸、12-氨基十二酸、鸟氨酸、赖氨酸、3-氨基环己酸酯、4-氨基-2-羟基丁酸酯、腐胺、尸胺、N-乙酰基-L-鸟氨酸、六亚甲基二胺、1,7-二氨基庚烷、1,8-二氨基辛烷、1,9-二氨基壬烷、1,10-二氨基癸烷、6-氨基己醇、7-氨基庚醇、8-氨基辛醇、9-氨基壬醇、10-氨基癸醇、2,4-二氨基丁酸酯、2-甲基苄胺、二羟丙酮磷酸、羟甲基糠醛、丙氨酸和丙酮酸盐。
[0252] 在一个实施方案中,该多肽包含:
[0253] i)SEQ ID NO:10中提供的氨基酸序列,
[0254] ii)与SEQ ID NO:10至少40%相同、或至少80%相同、或至少90%相同、或至少95%相同的氨基酸序列,或
[0255] iii)i)或ii)的生物学活性片段,
[0256] 其中所述多肽对选自下述但不限于下述的一种、多种或全部底物具有氨基转移酶活性:甘氨酸、4-氨基丁酸酯、5-氨基戊酸酯、6-氨基己酸、7-氨基庚酸、8-氨基辛酸、11-氨基十一酸、12-氨基十二酸、鸟氨酸、赖氨酸、3-氨基环己酸酯、4-氨基-2-羟基丁酸酯、腐胺、尸胺、N-乙酰基-L-鸟氨酸、六亚甲基二胺、1,7-二氨基庚烷、1,8-二氨基辛烷、1,9-二氨基壬烷、1,10-二氨基癸烷、6-氨基己醇、7-氨基庚醇、8-氨基辛醇、9-氨基壬醇、10-氨基癸醇、2,4-二氨基丁酸酯、2-甲基苄胺、二羟丙酮磷酸、羟甲基糠醛、丙氨酸和丙酮酸盐。
[0257] 在一个实施方案中,该多肽包含:
[0258] i)SEQ ID NO:11中提供的氨基酸序列,
[0259] ii)与SEQ ID NO:11至少40%相同、或至少80%相同、或至少90%相同、或至少95%相同的氨基酸序列,或
[0260] iii)i)或ii)的生物学活性片段,
[0261] 其中所述多肽对选自下述但不限于下述的一种、多种或全部底物具有氨基转移酶活性:甘氨酸、4-氨基丁酸酯、5-氨基戊酸酯、6-氨基己酸、7-氨基庚酸、8-氨基辛酸、11-氨基十一酸、12-氨基十二酸、鸟氨酸、赖氨酸、3-氨基环己酸酯、4-氨基-2-羟基丁酸酯、腐胺、尸胺、N-乙酰基-L-鸟氨酸、氨基丙二酸二乙酯、环己胺、六亚甲基二胺、1,7-二氨基庚烷、1,8-二氨基辛烷、1,9-二氨基壬烷、1,10-二氨基癸烷、6-氨基己醇、7-氨基庚醇、8-氨基辛醇、
9-氨基壬醇、10-氨基癸醇、2,4-二氨基丁酸酯、2-甲基苄胺、二羟丙酮磷酸、羟甲基糠醛、丙氨酸和丙酮酸盐。
[0262] 在一个实施方案中,该多肽包含:
[0263] i)SEQ ID NO:12中提供的氨基酸序列,
[0264] ii)与SEQ ID NO:12至少40%相同、或至少80%相同、或至少90%相同、或至少95%相同的氨基酸序列,或
[0265] iii)i)或ii)的生物学活性片段,
[0266] 其中所述多肽对选自下述但不限于下述的一种、多种或全部底物具有氨基转移酶活性:甘氨酸、4-氨基丁酸酯、5-氨基戊酸酯、6-氨基己酸、7-氨基庚酸、8-氨基辛酸、11-氨基十一酸、12-氨基十二酸、鸟氨酸、赖氨酸、3-氨基环己酸酯、4-氨基-2-羟基丁酸酯、腐胺、尸胺、N-乙酰基-L-鸟氨酸、氨基丙二酸二乙酯、环己胺、六亚甲基二胺、1,7-二氨基庚烷、1,8-二氨基辛烷、1,9-二氨基壬烷、1,10-二氨基癸烷、6-氨基己醇、7-氨基庚醇、8-氨基辛醇、
9-氨基壬醇、10-氨基癸醇、2,4-二氨基丁酸酯、2-甲基苄胺、二羟丙酮磷酸、羟甲基糠醛、丙氨酸和丙酮酸盐。
[0267] 本发明的多肽可以用于产生工业产品。
[0268] 如本文使用的,术语“工业产品”指在商业规模上制造用于人类使用的产品。工业产品可以是中间产品,其可以出售或用于产生进一步的产品。例如,本发明的多肽可以用于产生胺,其自身视为工业产品。这些胺可以出售且用作聚酰胺例如尼龙(即进一步的工业产品)合成的构件块。工业产品可以是产品的混合物,例如氨基酸和胺的混合物。工业产品可以与例如一种或多种酶或化合物或自身进一步反应,以产生另一种工业产品。技术人员应了解工业产品可以是单体,其可以与自身或其他单体反应以形成聚合物。
[0269] 多核苷酸
[0270] 本发明涉及多种多核苷酸。
[0271] 术语“多核苷酸”和“核酸”可互换使用。多核苷酸是核苷酸单体的聚合物。本发明的多核苷酸可以具有任何长度,并且可以包含脱氧核糖核苷酸或核糖核苷酸、或其类似物或其混合物。本发明的多核苷酸可以具有基因组、cDNA、半合成或合成起源,双链的或单链的,并且由于其起源或操作:(1)不结合它在自然界中与之结合的多核苷酸的全部或一部分,(2)与除了它在自然界中与之连接那种之外的多核苷酸(例如启动子)连接,或(3)不在自然界中出现。下述是多核苷酸的非限制性例子:基因或基因片段的编码区或非编码区,由连分析限定的多个基因座(基因座)、外显子、内含子、信使RNA(mRNA)、转移RNA(tRNA)、核糖体RNA(rRNA)、核酶、cDNA、重组多核苷酸、分支多核苷酸、质粒、载体、经分离的DNA、经分离的RNA、嵌合DNA、核酸探针和引物。多核苷酸可以包含经修饰的核苷酸,例如甲基化核苷酸和核苷酸类似物。如果存在的话,则对核苷酸结构的修饰可以在聚合物装配之前或之后赋予。核苷酸的序列可以被非核苷酸组分间断。多核苷酸可以在聚合之后例如通过与标记组分缀合进一步进行修饰。
[0272] “分离的多核苷酸”意指这样的多核苷酸,其一般已与它在其天然状态中与之结合或连接的多核苷酸序列分开。优选地,分离的多核苷酸至少60%不含、更优选至少75%不含、且更优选至少90%不含它与之天然结合或连接的多核苷酸序列。
[0273] “外源多核苷酸”意指在无细胞表达系统或天然不含该多核苷酸的细胞中存在的多核苷酸,或者与其天然状态相比较,以改变的量表达或以改变的速率(例如在mRNA的情况下)表达的多核苷酸。在一个实施方案中,将多核苷酸引入天然不含所述多核苷酸的细胞内。通常,外源DNA用作mRNA转录的模板,其随后在经转化的细胞内翻译成编码本发明的多肽的氨基酸残基的连续序列。在另一个实施方案中,所述多核苷酸对于细胞是内源的,并且它的表达通过重组手段加以改变,例如在目的内源基因上游引入外源控制序列,以允许经转化的细胞表达由该基因编码的多肽。
[0274] 本发明的外源多核苷酸包括未与它存在于其中的基于细胞的表达系统或无细胞表达系统的其他组分分开的多核苷酸,以及在随后纯化掉至少一些其他组分的在所述基于细胞的表达系统或无细胞表达系统中产生的多核苷酸。
[0275] 就限定的多核苷酸而言,应了解高于上文提供那些的%相同性数字涵盖优选实施方案。因此,当适用时,按照最小%相同性数字,优选多核苷酸包含这样的多核苷酸序列,其与相关指定SEQ ID NO至少50%、更优选至少60%、更优选至少65%、更优选至少70%、更优选至少75%、更优选至少80%、更优选至少85%、更优选至少90%、更优选至少91%、更优选至少92%、更优选至少93%、更优选至少94%、更优选至少95%、更优选至少96%、更优选至少97%、更优选至少98%、更优选至少99%、更优选至少99.1%、更优选至少99.2%、更优选至少99.3%、更优选至少99.4%、更优选至少99.5%、更优选至少99.6%、更优选至少99.7%、更优选至少99.8%、且甚至更优选至少99.9%相同。
[0276] 本发明的多核苷酸或对于本发明有用的多核苷酸可以在严格条件下与本文限定的多核苷酸选择性杂交。如本文使用的,严格条件是这样的:(1)在42℃下在杂交期间采用变性剂例如甲酰胺,例如50%(v/v)甲酰胺与0.1%(w/v)牛血清白蛋白、0.1%Ficoll、0.1%聚乙烯吡咯烷酮、含有750mM NaCl以pH 6.5的50mM磷酸钠缓冲液、75mM柠檬酸钠;或(2)在42℃下采用在0.2x SSC和0.1%SDS中的50%甲酰胺、5x SSC(0.75M NaCl、0.075M柠檬酸钠)、50mM磷酸钠缓冲液(pH 6.8)、0.1%焦磷酸钠、5x Denhardt's溶液、超声处理的鲑精DNA(50g/ml)、0.1%SDS和10%硫酸葡聚糖,和/或(3)在50℃下采用低离子强度和高温用于洗涤,例如0.015M NaCl/0.0015M柠檬酸钠/0.1%SDS。
[0277] 当与参考多核苷酸相比较时,本发明的多核苷酸可以具有一个或多个突变,其是核苷酸残基的缺失、插入或置换。相对于参考序列具有突变的多核苷酸可以是天然存在的(即,从天然来源中分离的)或合成的(例如通过对核酸进行定点诱变或DNA改组)。
[0278] 重组载体
[0279] 本发明的一个实施方案包括重组载体,其包含本文限定的至少一种多核苷酸,并且能够将所述多核苷酸递送到宿主细胞内。重组载体包括表达载体。重组载体含有异源多核苷酸序列,即天然地未发现与本发明的多核苷酸邻近的多核苷酸序列,其优选衍生自除了本发明的多核苷酸由其衍生的物种之外的物种。载体可以是RNA或DNA、原核或真核的,并且通常为衍生自病毒的病毒载体或质粒。
[0280] 质粒载体通常包括另外的核酸序列,其提供用于在原核细胞中的容易选择、扩增和转化,例如pUC衍生的载体、pSK衍生的载体、pGEM衍生的载体、pSP衍生的载体、pBS衍生的载体、或含有一个或多个T-DNA区的二元载体。另外的核酸序列包括提供载体的自主复制的复制起点、优选编码抗生素或除草剂抗性的可选标记物基因、提供插入在核酸构建体中编码的核酸序列或基因的多重位点的独特多重克隆位点、以及增强原核细胞和真核细胞转化的序列。
[0281] 如本文使用的,“可操作地连接”指在两个或更多个核酸(例如DNA)区段之间的功能关系。通常,它指转录调节元件(启动子)与所转录序列的功能关系。例如,如果启动子刺激或调节编码序列在适当细胞中的转录,则它与本文限定的多核苷酸的编码序列可操作地连接。一般地,与所转录序列可操作地连接的启动子转录调节元件与所转录序列在物理上邻接,即它们是顺式作用的。然而,一些转录调节元件例如增强子无需与它们增强其转录的编码序列在物理上邻接或定位紧密接近。
[0282] 当存在多重启动子时,每个启动子可以独立地是相同或不同的。
[0283] 重组载体还可以含有:(a)编码信号肽序列的一种或多种分泌信号,以允许本文限定的所表达多肽从产生多肽的细胞中分泌,或提供所表达多肽的定位,例如用于将多肽保留在细胞中的内质网(ER)中,或转移到质粒内,和/或(b)含有导致核酸分子作为融合蛋白表达的融合序列。合适的信号区段的例子包括能够指导本文限定的多肽的分泌或定位的任何信号区段。重组载体还可以包括在本文限定的多核苷酸的核酸序列周围和/或之内的介入和/或未翻译序列。
[0284] 为了促进转化体的鉴定,除本文限定的多核苷酸的核酸序列之外,重组载体期望地包含可选择或可筛选标记物基因。“标记物基因”意指这样的基因,其对表达标记物基因的细胞赋予独特表型,并且因此允许此类经转化的细胞区别于不具有标记物的细胞。可选择标记物基因赋予性状,其可以基于对选择剂(例如除草剂、抗生素、辐射、热或破坏未经转化的细胞的其他处理)的抗性“加以选择”。可筛选标记物基因(或病毒基因)赋予可以通过观察或测试,即通过“筛选”鉴定的性状(例如β-葡萄糖醛酸酶、荧光素酶、GFP或未经转化的细胞中不存在的其他酶活性)。标记物基因和目的核苷酸序列无需是连接的,未连接基因的共转化在例如US 4,399,216中得到描述。标记物的实际选择并非关键,只要它与宿主细胞组合起作用(即选择性)。
[0285] 细菌可选择标记物的例子是赋予抗生素抗性,例如氨苄青霉素、红霉素、氯霉素或四环素抗性,优选卡那霉素抗性的标记物。用于选择植物转化体的示例性可选择标记物包括但不限于编码潮霉素B抗性的hyg基因;赋予对卡那霉素、巴龙霉素、G418的抗性的新霉素磷酸转移酶(nptII)基因;如例如EP 256223中所述,赋予对谷胱甘肽衍生的除草剂的抗性,来自大鼠肝脏的谷胱甘肽-S-转移酶基因;如例如WO 87/05327中所述,在过表达后,赋予对谷氨酰胺合成酶抑制剂例如草丁膦的抗性的谷氨酰胺合成酶基因;如例如EP 275957中所述,赋予对选择剂草丁膦的抗性,来自绿色产色链霉菌(Streptomyces viridochromogenes)的乙酰基转移酶基因;如例如由Hinchee等人(1988)描述的,编码5-烯醇式莽草酸-3-磷酸合酶(EPSPS)的基因,赋予对N-膦酰甲基甘氨酸的耐受性;如例如WO 
91/02071中所述,赋予针对双丙氨膦的抗性的bar基因;腈水解酶基因,例如来自臭鼻克雷伯氏菌(Klebsiella ozaenae)的bxn,其赋予对溴苯腈的抗性(Stalker等人,1988);赋予对氨甲蝶呤的抗性的二氢叶酸还原酶(DHFR)基因(Thillet等人,1988);突变型乙酰乳酸合酶基因(ALS),其赋予对咪唑啉酮、磺酰脲或其他ALS抑制化学制品的抗性(EP 154,204);突变的邻氨基苯甲酸合酶基因,其赋予对5-甲基色氨酸的抗性;或茅草枯脱卤素酶基因,其赋予对除草剂的抗性。
[0286] 优选的可筛选标记物包括但不限于编码β-葡萄糖醛酸酶(GUS)的uidA基因,关于所述GUS的各种生色底物是已知的;编码关于其的生色底物是已知的酶的β-半乳糖苷酶基因;可以用于敏感性生物发光检测的水母素基因(Prasher等人,1985);绿色荧光蛋白基因(Niedz等人,1995)或其衍生物;或允许生物发光检测的萤光素酶(luc)基因(Ow等人,1986)。“报道分子”意指通过其化学性质,提供了可经分析鉴定的信号的分子,所述信号促进通过参考蛋白质产物来测定启动子活性。
[0287] 优选地,重组载体稳定地被掺入细胞的基因组内。相应地,重组载体可以包含适当元件,其允许载体被掺入细胞的基因组或染色体内。
[0288] 表达载体
[0289] 如本文使用的,“表达载体”是DNA或RNA载体,其能够转化宿主细胞且实现一种或多种指定多核苷酸的表达。优选地,表达载体还能够在宿主细胞内复制。表达载体可以是原核或真核的,并且通常是病毒或质粒。本发明的表达载体包括任何载体,其在本发明的宿主细胞中起作用(即指导基因表达),所述宿主细胞包括细菌、真菌、体内寄生虫节肢动物、动物、植物和藻类细胞。本发明的特别优选的表达载体可以指导在细菌或真菌细胞中的基因表达。
[0290] 本发明的表达载体含有调节序列例如转录控制序列、翻译控制序列、复制起点、以及其他调节序列,其与宿主细胞相容且控制本发明的多核苷酸的表达。特别地,本发明的表达载体包括转录控制序列。转录控制序列是控制转录的起始、延伸和终止的序列。特别重要的转录控制序列是控制转录起始的那些,例如启动子、增强子、操纵子和阻遏子序列。合适的转录控制序列包括可以在本发明的宿主细胞中起作用的任何转录控制序列。使用的调节序列的选择取决于宿主细胞。此类调节序列可以得自任何真核生物,或可以是化学合成的。各种此类转录控制序列是本领域技术人员已知的。
[0291] 优选的转录控制序列包括在细菌、真菌、节肢动物、线虫、植物或哺乳动物细胞中起作用的那些,例如但不限于tac、lac、trp、trc、oxy-pro、omp/lpp、rrnB、细菌噬菌体λ、细菌噬菌体T7、T7lac、细菌噬菌体T3、细菌噬菌体SP6、细菌噬菌体SP01、金属硫蛋白、α-交配因子、毕赤酵母属(Pichia)醇氧化酶、甲病毒属亚基因组启动子(例如辛德毕斯病毒亚基因组启动子)、抗生素抗性基因、杆状病毒、玉米夜蛾(Heliothis zea)昆虫病毒、牛痘病毒、疱疹病毒、浣熊痘病毒、其他痘病毒、腺病毒、巨细胞病毒(例如立即早期启动子)、猿猴病毒40、逆转录病毒、肌动蛋白、逆转录病毒长末端重复序列、劳斯肉瘤病毒、热休克、磷酸盐硝酸盐转录控制序列、以及能够控制在原核细胞或真核细胞中的基因表达的其他序列。
[0292] 5'非翻译的前导序列可以衍生自选择为表达本发明的多核苷酸的异源基因序列的启动子,或可以就待产生的酶的编码区而言是异源的,并且可以在需要时进行特异性修饰,以便增加mRNA的翻译。关于优化转基因表达的综述,参见Koziel等人(1996)。本发明并不限于其中非翻译区衍生自伴随启动子序列的5'非翻译序列的构建体。前导序列还可以衍生自无关启动子或编码序列。
[0293] 转录终止伴随3'非翻译DNA序列,其在表达载体中与目的多核苷酸可操作地连接。重组DNA分子的3'非翻译区含有多腺苷酸化信号,其在宿主细胞中起作用,以促使腺嘌呤核苷酸添加到RNA的3'末端。
[0294] 通过操纵例如在宿主细胞内的多核苷酸拷贝数、那些多核苷酸由其转录的效率、所得的转录物由其翻译的效率以及翻译后修饰的效率,重组DNA技术可以用于改善经转化的多核苷酸的表达。可用于增加本文限定的多核苷酸表达的重组技术包括但不限于:使多核苷酸与高拷贝数质粒可操作地连接、将多核苷酸分子整合到一条或多条宿主细胞染色体内、将载体稳定性序列加入质粒、置换或修饰转录控制信号(例如启动子、操纵子、增强子)、置换或修饰翻译控制信号(例如核糖体结合位点、夏因-达尔加诺序列(Shine-Dalgarno sequence))、修饰多核苷酸以对应于宿主细胞的密码子使用、和缺失使转录物失稳的序列。
[0295] 宿主细胞和重组细胞
[0296] 如本文使用的,术语“宿主细胞”指能够用本发明的外源多核苷酸转化的细胞。一旦被转化,宿主细胞就能够被称为“重组细胞”或“转基因细胞”。
[0297] 术语“重组细胞”包括包含所述多核苷酸的其直接或间接后代细胞。
[0298] 多核苷酸转化到宿主细胞内可以通过任何方法完成,通过所述方法可以将多核苷酸插入细胞内。转化技术包括但不限于转染、电穿孔、显微注射、脂转染、吸附和原生质体融合。
[0299] 重组细胞可以保持单细胞的,或者可以生长成组织、器官或多细胞生物。本发明的经转化的多核苷酸可以保持染色体外的,或可以整合到经转化的(即重组)细胞的染色体内的一个或多个位点内,其方式使得它们被表达的能力得到保留。
[0300] 重组细胞可以是培养中的细胞、体外细胞或者在生物或其部分中的细胞。在一个实施方案中,重组细胞是非人细胞。
[0301] 待转化的合适宿主细胞包括可以用本发明的多核苷酸转化的任何细胞。本发明的宿主细胞可以内源地(即天然地)能够产生本发明的多肽,或在用本发明的至少一种多核苷酸转化后可能能够产生此类多肽。本发明的宿主细胞可以是能够产生本发明的至少一种蛋白质的任何细胞,并且包括细菌、真菌(包括酵母,例如假丝酵母属(Candida sp.)和酵母属(Saccharomyces))、丝状真菌细胞(例如青霉属(Penicillium)和曲霉属(Aspergillus))、寄生虫、线虫、节肢动物、动物和植物细胞。宿主细胞的例子包括沙氏菌属(Salmonella)、埃希氏菌属(Escherichia)、芽孢杆菌属(Bacillus)、李斯特氏菌属(Listeria)、假单胞菌属(Pseudomonas)、酵母属、斜纹夜蛾属(Spodoptera)、分枝杆菌属(Mycobacteria)、粉纹夜蛾属(Trichoplusia)、BHK(幼仓鼠肾)细胞、MDCK细胞、CRFK细胞、CV-1细胞、COS(例如COS-7)细胞和Vero细胞。宿主细胞的进一步例子是大肠杆菌,包括大肠杆菌K-12衍生物;伤寒沙门氏菌(Salmonella typhi);鼠伤寒沙门氏菌(Salmonella typhimurium)包括减毒株;草地贪夜蛾(Spodoptera frugiperda);粉纹夜蛾(Trichoplusia ni);和非致瘤性小鼠成肌细胞G8细胞(例如ATCC CRL 1246)。
[0302] 特别优选的宿主细胞是大肠杆菌、假单胞菌属、芽孢杆菌属、假丝酵母属、酵母属、青霉属和曲霉属。
[0303] 转基因非人生物
[0304] 术语“转基因非人生物”指例如非人动物、植物或真菌,其包含本发明的外源多核苷酸(转基因)或重组多肽。
[0305] “转基因”是已通过转化程序引入基因组内的基因。该术语包括细胞或非人生物或其部分中的基因,其被引入其祖细胞的基因组内。细胞或非人生物的后代可以是祖细胞或非人生物的至少第3代或第4代。后代可以通过有性生殖或营养繁殖例如由马铃薯块茎或甘蔗宿根而产生。术语“遗传修饰的”及其变形是更广泛的术语,其包括通过转化或转导将基因引入细胞内,使细胞中的基因突变,并且遗传改变或调整细胞中的基因调节,或如上所述修饰的任何细胞的后代。
[0306] 如本文使用的,术语“野生型”或其变形指未进行遗传修饰的细胞、或非人生物或其部分。
[0307] 转基因植物
[0308] 如本文使用的,术语“植物”指全植物,例如在野外生长的植物,以及存在于植物中、得自植物、衍生自植物或与植物有关的任何物质,例如营养结构(例如叶、茎)、根、花器官/结构、种子(包括胚、胚乳和种皮)、植物组织(例如脉管、组织、基本组织等等)、细胞(例如花粉)及其后代。
[0309] 考虑用于本发明的实践中的植物包括单子叶植物和双子叶植物。靶植物包括但不限于下述:谷物(小麦、大麦、黑麦、燕麦、稻、高粱、黑小麦及相关作物);甜菜(糖用甜菜饲料甜菜);梨果(苹果、梨)、核果(李子、桃子、杏仁、樱桃)、热带水果(香蕉、菠萝、木瓜)和软果(樱桃、草莓、覆盆子和黑莓);豆科植物(菜豆、小扁豆、豌豆、大豆、苜蓿、羽扇豆);油料植物(油菜、芥菜、罂粟、橄榄、向日葵、椰子、蓖麻油植物、可可豆、落花生);黄瓜属植物(西葫芦、黄瓜、甜瓜);纤维植物(花、棉花脱叶剂、亚麻、大麻、黄麻);柑橘类水果(橘子、柠檬、葡萄柚、柑橘);蔬菜(菠菜、莴苣、芦笋、卷心菜、胡萝卜、洋葱、西红柿、土豆、辣椒);樟科(鳄梨、肉桂、樟脑);或植物例如玉蜀黍、烟草、坚果、咖啡、甘蔗、茶叶、藤本植物、啤酒花、草坪草包括多年生草和虉草栽培品种sirolan和西罗内、和天然橡胶植物、以及观赏植物(花卉例如水仙、唐菖蒲和郁金香,灌木例如澳洲毒茄属(Duboisia)、阔叶树和常青树例如针叶树)。优选地,植物是被子植物。
[0310] 如本发明的上下文中限定的转基因植物包括植物(以及所述植物的部分和细胞)及其后代,其已使用重组技术进行遗传修饰,以促使本发明的至少一种多肽在所需植物或植物器官中产生。转基因植物可以使用本领域已知的技术产生,所述技术例如A.Slater等人,Plant Biotechnology-The Genetic Manipulation of Plants,Oxford University Press(2003);以及P.Christou和H.Klee,Handbook of Plant Biotechnology,John Wiley and Sons(2004)中一般描述的那些。
[0311] 在本发明的一个优选实施方案中,转基因植物对于已引入的每种和全部基因(转基因)是纯合的,使得它们的后代对于所需表型不分离。转基因植物还可以对于所引入的转基因是杂合的,例如在已由杂种种子生长的F1后代中。此类植物可以提供本领域众所周知的优点例如杂种优势
[0312] 本发明的多核苷酸可以在所有发育阶段期间在转基因植物中组成性表达。取决于植物或植物器官的使用,所述多肽可以以阶段特异性方式进行表达。此外,所述多核苷酸可以组织特异性表达。
[0313] 已知或发现促使编码目的多肽的基因在植物中表达的调节序列可以用于本发明中。所使用的调节序列的选择取决于目的靶植物和/或靶器官。此类调节序列可以得自植物或植物病毒,或者可以是化学合成的。此类调节序列是本领域技术人员众所周知的。
[0314] 适合于植物细胞的稳定转染或转基因植物的建立的许多载体已在例如下述中得到描述:Pouwels等人,Cloning Vectors:A Laboratory Manual(1985,supp.1987);Weissbach和Weissbach,Methods for Plant Molecular Biology,Academic Press(1989);和Gelvin等人,Plant Molecular Biology Manual,Kluwer Academic Publishers(1990)。通常,植物表达载体包括例如在5’和3’调节序列的转录控制下的一种或多种克隆的植物基因和显性可选标记物。此类植物表达载体还可以含有启动子调节区(例如控制可诱导或组成性、环境或发育调节、或者细胞或组织特异性表达的调节区)、转录起始开始位点、核糖体结合位点、RNA加工信号、转录终止位点和/或聚腺苷酸化信号。
[0315] 在植物细胞中活跃的许多组成型启动子已得到描述。用于在植物中的组成性表达的合适启动子包括但不限于:花椰菜花叶病毒(CaMV)35S启动子、玄参花叶病毒(FMV)35S、甘蔗杆状病毒启动子、鸭跖草黄斑驳病毒启动子、来自核酮糖-1,5-二-磷酸羧化酶小亚基的光诱导型启动子、水稻胞质磷酸丙糖异构酶启动子、拟南芥属(Arabidopsis)的腺嘌呤磷酸核糖基转移酶启动子、水稻肌动蛋白1基因启动子、甘露合酶和章鱼碱合酶启动子、Adh启动子、蔗糖合酶启动子、R基因复合物启动子和叶绿素α/β结合蛋白基因启动子。这些启动子已用于制备已在植物中表达的DNA载体;参见例如PCT公开WO 84/02913。所有这些启动子均已用于制备各种类型的植物可表达的重组DNA载体。
[0316] 5'非翻译的前导序列可以衍生自选择为表达本发明的多核苷酸的异源基因序列的启动子,并且可以在需要时进行特异性修饰,以便增加mRNA的翻译。关于优化转基因表达的综述,参见Koziel等人(1996)。5'非翻译区还可以得自植物病毒RNA(尤其是烟草花叶病毒、烟草蚀纹病毒、玉蜀黍矮花叶病毒、苜蓿花叶病毒)、合适的真核基因、植物基因(小麦和玉蜀黍叶绿素a/b结合蛋白基因前导区)、或合成基因序列。本发明并不限于其中非翻译区衍生自伴随启动子序列的5'非翻译序列的构建体。前导序列还可以衍生自无关启动子或编码序列。在本发明的上下文中有用的前导序列包含玉蜀黍Hsp70前导区(参见US 5,362,865和US 5,859,347)和TMVω元件。
[0317] 转录终止伴随3'非翻译DNA序列,其在嵌合载体中与目的多核苷酸可操作地连接。重组DNA分子的3'非翻译区含有多腺苷酸化信号,其在植物中起作用,以促使腺嘌呤核苷酸添加到RNA的3'末端。3'非翻译区可以得自在植物细胞中表达的各种基因。胭脂碱合酶3'非翻译区、来自豌豆小亚基Rubisco基因的3'非翻译区、来自大豆7S种子贮藏蛋白基因的3'非翻译区通常用于该能力中。含有土壤杆菌属(Agrobacterium)肿瘤诱导(Ti)质粒基因的多腺苷酸化信号的3'转录的非翻译区也是合适的。
[0318] 用于将基因直接递送到细胞内的四种一般方法已得到描述:(1)化学方法(Graham等人,1973);(2)物理方法例如显微注射(Capecchi,1980);电穿孔(参见WO 87/06614、US 5,472,869、5,384,253、WO 92/09696和WO 93/21335);和基因枪(参见US 4,945,050和US 
5,141,131);(3)病毒载体(Clapp,1993;Lu等人,1993;Eglitis等人,1988);和(4)受体介导机制(Curiel等人,1992;Wagner等人,1992)。
[0319] 为了证实转基因细胞和植物中的转基因存在,可以使用本领域技术人员已知的方法,进行聚合酶链反应(PCR)扩增或DNA印迹分析。取决于产物的性质,转基因的表达产物可以以各种方式中的任一种进行检测,并且包括蛋白质印迹和酶测定。定量蛋白质表达且检测不同植物组织中的复制的一种特别有用的方式是使用报道基因例如GUS。一旦已获得转基因植物,它们就可以生长以产生具有所需表型的植物组织或部分。可以收获植物组织或植物部分,和/或收获种子。种子可以充当用于生长具有所需特征的组织或部分的另外植物的来源。
[0320] 转基因非人动物
[0321] “转基因非人动物”指除了人之外的动物,其含有在相同物种或品种的野生型动物中未发现的基因构建体(“转基因”)。用于产生转基因动物的技术是本领域众所周知的。关于该主题有用的一般教科书是Houdebine,Transgenic animals–Generation and Use,Harwood Academic(1997)。
[0322] 异源DNA可以例如引入受精的哺乳动物卵子内。例如,全能干细胞或多能干细胞可以通过显微注射、磷酸钙介导的沉淀、脂质体融合、逆转录病毒感染或其他手段进行转化。经转化的细胞随后被引入胚胎内,并且胚胎随后发育成转基因动物。在高度优选的方法中,发育中的胚胎用含有所需DNA的逆转录病毒进行感染,并且由受感染胚胎产生转基因动物。
然而,在最优选的方法中,将适当DNA共注射到胚胎的原核或细胞质内,优选在单细胞阶段时,并且允许胚胎发育为成熟的转基因动物。
[0323] 用于产生转基因动物的另一种方法涉及通过标准方法将核酸显微注射到原核(pro-nuclear)阶段卵内。注射的卵随后在转移到假妊娠接受者的输卵管内之前进行培养。
[0324] 转基因动物还可以通过核转移技术进行产生。使用这种方法,来自供体动物的成纤维细胞用质粒稳定地进行转染,所述质粒掺入在调节序列的控制下的目的结合结构域或结合配偶体的编码序列。稳定转染子随后融合至去核卵母细胞,被培养且转移到雌性接受者内。
[0325] 组合物
[0326] 本发明的组合物可以包括载体。载体可以是固体或液体。有用的载体的例子包括但不限于稀释剂、溶剂、表面活性剂、赋形剂、悬浮剂、缓冲剂、润滑剂、佐剂、媒介物、乳化剂、吸收剂、分散介质、包衣、稳定剂、保护性胶体、粘合剂增稠剂、触变剂、渗透剂、多价螯合剂、等渗剂和吸收延迟剂,其不影响公开内容的活性剂的活性。
[0327] 赋形剂的例子包括水、盐水、林格氏溶液、右旋糖溶液、Hank氏溶液及其他水性生理学平衡的盐溶液。还可以使用非水性媒介物,例如不挥发性油、芝麻油、油酸乙酯或甘油三酯。其他有用的制剂包括含有粘度增强剂例如羧甲基纤维素钠、山梨糖醇或葡聚糖的悬浮液。赋形剂还可以含有少量添加剂,例如增强等渗性和化学稳定性的物质。
[0328] 缓冲液的例子包括磷酸缓冲液、碳酸氢盐缓冲液和Tris缓冲液,而防腐剂的例子包括硫柳汞或邻甲酚、福尔马林和苯甲醇。赋形剂还可以用于增加组合物的半衰期,例如但不限于聚合物控制释放媒介物、可生物降解植入物、脂质体、细菌、病毒、其他细胞、油、酯和二醇。
[0329] 此外,本文描述的多肽可以在组合物中提供,其增强氨基转移酶活性的速率和/或程度,或增加多肽的稳定性。例如,多肽可以固定到聚氨基甲酸酯基质上(Gordon等人,1999),或封装在适当脂质体内(Petrikovics等人,2000a和b)。多肽还可以掺入包含泡沫的组合物内,所述泡沫例如消防中常规使用的那些(LeJeune等人,1998)。
[0330] 本发明的一个实施方案是控制释放制剂,其能够缓慢释放本发明的组合物。如本文使用的,“缓慢释放制剂”包含在控制释放媒介物中的本发明的组合物。合适的控制释放媒介物包括但不限于生物相容性聚合物、其他聚合物基质、胶囊、微胶囊、微粒、弹丸制剂、渗透、扩散装置、脂质体、脂质球体和经皮递送系统。优选的控制释放制剂是可生物降解的(即生物蚀解的)。
[0331] 产生有效组合物(其用于催化氨基从氨基供体到氨基受体的转移)所需的本发明的多肽、载体、细菌、提取物或宿主细胞等的浓度取决于底物的性质、底物的浓度和组合物的制剂。在组合物内的多肽、载体、细菌、提取物或宿主细胞等的有效浓度可以容易地在实验上进行测定,如技术人员应理解的。
[0332] 如本文使用的,术语“提取物”指包含得自本发明的细胞、无细胞系统、培养基或非人生物的一种或多种组分的组合物。所述提取物包含本发明的多肽。术语“提取物”还预期涵盖包含分泌形式的本发明的多肽的上清液。
[0333] 抗体
[0334] 如本发明中使用的,术语“抗体”包括单克隆抗体、单克隆抗体、双特异性抗体、双抗体、三抗体、异源缀合抗体、嵌合抗体,包括完整分子以及其能够结合表位决定簇的片段,例如Fab、F(ab')2和Fv,以及其他抗体样分子。
[0335] 抗体片段保留与其抗原选择性结合的一些能力且如下定义:
[0336] (1)Fab,含有抗体分子的单价抗原结合片段的片段可以通过用木瓜蛋白酶消化全抗体而产生,以获得完整的轻链和一条重链的一部分;
[0337] (2)Fab',可以通过用胃蛋白酶处理全抗体随后还原而获得的抗体分子的片段,以获得完整的轻链和重链的一部分;每个抗体分子获得两个Fab'片段;
[0338] (3)(Fab')2,可以通过用胃蛋白酶处理全抗体而无需后续还原获得的抗体片段;(Fab')2是通过两个二硫键结合的两个Fab'片段的二聚体;
[0339] (4)Fv,定义为含有作为两条链表达的轻链可变区和重链可变区的遗传工程片段;和
[0340] (5)单链抗体("SCA"),定义为含有轻链可变区、重链可变区的遗传工程分子,通过合适的多肽接头连接为遗传融合的单链分子。
[0341] 制备这些片段的方法是本领域已知的(参见例如Harlow和Lane,Antibodies:A Laboratory Manual,Cold Spring Harbor Laboratory,New York(1988))。
[0342] (6)单结构域抗体,通常为缺乏轻链的可变重链结构域。
[0343] 术语“特异性结合”指抗体结合本发明的至少一种多肽而不结合其他已知蛋白质的能力。
[0344] 如本文使用的,术语“表位”指由抗体结合的本发明多肽的区域。表位可以施用于动物以生成针对该表位的抗体,然而,本发明的抗体优选特异性结合在整个多肽背景下的表位区。
[0345] 如果需要多克隆抗体,则用本发明的免疫原性多肽给选定的哺乳动物(例如小鼠、兔、山羊、马等)免疫接种。根据已知程序收集且处理来自免疫接种动物的血清。如果含有多克隆抗体的血清含有针对其他抗原的抗体,则多克隆抗体可以通过免疫亲和层析进行纯化。用于产生且加工多克隆抗血清的技术是本领域已知的。为了使此类抗体可以被制备,本发明还提供了对在动物中用作免疫原的另一种多肽半抗原化的本发明的多肽或其片段。
[0346] 针对本发明的多肽的单克隆抗体还可以通过本领域技术人员容易地产生。通过杂交瘤用于制备单克隆抗体的一般方法是众所周知的。可以通过细胞融合,以及其他技术例如用致癌DNA直接转化B淋巴细胞或用EB病毒转染,来制备永生化抗体生产细胞系。所产生的单克隆抗体实验对象组可以就多种特性进行筛选:即同种型和表位亲和力。
[0347] 可替代技术涉及筛选噬菌体展示文库,其中例如噬菌体在其衣壳表面上表达具有广泛多样的互补决定区(CDR)的scFv片段。这种技术是本领域众所周知的。
[0348] 用于产生本发明的抗体的其他技术是本领域已知的。
[0349] 本发明的抗体可以与固体支持物结合,和/或连同合适的试剂、对照、说明书等等一起包装到试剂盒内的合适容器中。
[0350] 在一个实施方案中,本发明的抗体是经可检测标记的。允许直接测量抗体结合的示例性可检测标记包括放射性标记、荧光团、染料、磁珠化学发光剂、胶体粒子等等。允许间接测量结合的标记的例子包括其中底物可以提供有色产物或荧光产物的酶。另外的示例性可检测标记包括在添加合适底物后,能够提供可检测产物信号的共价结合的酶。用于缀合物中的合适酶的例子包括辣根过氧化物酶、碱性磷酸酶、苹果酸脱氢酶等等。当在商业上无法获得时,此类抗体-酶缀合物通过本领域技术人员已知的技术容易地产生。进一步地,示例性可检测标记包括生物素,其以高亲和力结合抗生物素蛋白或链霉抗生物素蛋白;荧光团(例如藻胆蛋白、藻红蛋白和别藻蓝蛋白;荧光素和德克萨斯红),其可以与荧光激活细胞分选器一起使用;半抗原等等。优选地,可检测标记允许在板发光计中的直接测量例如生物素。此类标记抗体可以用于本领域已知的技术中,以检测本发明的多肽。
[0351] 氨基转移酶和与之结合的化合物的鉴定
[0352] 增强的氨基转移酶活性或改变的底物特异性
[0353] 在一个方面,本发明提供了用于鉴定酰基转移酶的方法,所述酰基转移酶具有增强的催化氨基从氨基酸或胺化合物到氨基受体的转移的能力,或改变的底物特异性。
[0354] 该方法包括改变本发明的多肽的一个或多个氨基酸。突变体可以使用本领域的标准程序(参见上文)进行改造,例如通过将适当的核苷酸变化引入本文定义的核酸内,或通过所需多肽的体外合成。突变体多肽可以使用本文描述的技术容易地进行筛选,以测定它们是否具有氨基转移酶活性,例如使用偶联的脱氢酶测定(Bernt和Bergmeyer,1974)。
[0355] 例如,使用例如易错PCR和/或DNA改组,可以使包含如SEQ ID NO:3-5或14-20中的任何一个或多个中所示的序列(其编码氨基转移酶)的多核苷酸随机突变和/或重组,以制备基因变体(突变体)的大型文库。突变体可以在它们包含保守氨基酸基序的基础上选择用于进一步研究。
[0356] 核酸或其片段的直接PCR测序可以用于测定确切核苷酸序列,并且推导相应的氨基酸序列,并且从而鉴定保守氨基酸序列。基于保守氨基酸序列的简并引物可以用于直接PCR扩增。简并引物还可以用作DNA杂交测定中的探针。可替代地,保守氨基酸序列可以在蛋白质杂交测定中进行检测,所述蛋白质杂交测定利用例如与保守氨基酸序列特异性结合的抗体,或与保守氨基酸序列特异性结合的底物。
[0357] 使用本领域的标准程序,例如通过经由例如磷酸钙沉淀、聚乙二醇处理、电穿孔和这些处理的组合,将核酸分子引入细胞内,可以获得包含核酸分子的细胞,所述核酸分子编码与在细胞中活跃的启动子可操作地连接的氨基转移酶。还可以使用细胞转化的其他方法,并且包括但不限于通过直接DNA转移或注射将DNA引入植物内。还可以使用如本文描述的土壤杆菌属介导的转移和加速方法,来获得经转化的植物细胞。
[0358] 该方法进一步包括测定当使用本领域的已知技术,与亲本未改变的多肽相比较时,氨基转移酶活性是否增加。例如,使用先前描述的偶联测定、HPLC、NMR或质谱法。
[0359] 如本文使用的,“与……相比较”指比较改变的多肽或者表达改变的多肽的细胞或转基因非人生物与本发明的多肽、细胞或转基因非人生物的氨基转移酶活性水平。
[0360] 本发明的多肽的三维结构
[0361] 如本文使用的,术语“晶体”意指这样的结构(例如三维(3D)固体聚集体),其中平面在限定度处相交,并且其中存在组成成分化学种类的规则结构(例如内部结构)。术语“晶体”特别指固体物理晶形例如实验上制备的晶体。
[0362] 应理解除非另有说明,否则当在通过附录I中所示的原子坐标描述的相应的主链原子上叠加时,本文对附录I中所示的原子坐标或原子坐标子集的任何提及应包括具有不超过 优选不超过 的主链原子的均方根差。下文限定两个数据集之间的术语“均方根差(RMSD)”。对于第一数据集中的每个元素,计算它与第二数据集中的相应项的偏差。
平方偏差是该偏差的平方,并且均方差是所有这些平方偏差的平均值。均方根差是均方差的平方根。优选变体是与附录I中给出的坐标相比较,其中除了氢之外的所有主链原子的x、y和z坐标的RMSD小于 (优选小于 或小于 )的那些。本领域技术人员
容易理解原子坐标的3D刚体旋转和/或平移不改变所涉及分子的结构。
[0363] 本发明的多肽例如SEQ ID NO:1或SEQ ID NO:2的三维结构可以用于本发明的方法,例如鉴定化合物(例如底物、辅因子、拮抗剂或激动剂)的计算机辅助方法,所述化合物结合如本文定义的多肽。
[0364] 例如,使用对接(docking)程序例如GRAM、DOCK或AUTODOCK(Dunbrack等人,1997),通过使用计算机建模可以鉴定底物、辅因子、拮抗剂或激动剂。计算机程序还可以用于估计候选化合物对多肽的吸引、排斥和立体阻碍。例如,当尝试鉴定本文限定的多肽的底物(即氨基供体或氨基受体)时,对接研究可以用于评价酶的结合袋中的立体阻碍水平。一般地,拟合越紧(例如立体阻碍越低,和/或吸引力越大),化合物更可能是底物。
[0365] 本发明的多肽例如SEQ ID NO:1或SEQ ID NO:2的三维结构还可以用于鉴定其他氨基转移酶。例如,同源性建模也称为蛋白质的比较建模,可以用于构建来自其氨基酸序列(查询序列)的候选多肽的三维结构模型。该模型可以用于评价多肽序列编码氨基转移酶的可能性。本发明的多肽例如SEQ ID NO:1或SEQ ID NO:2的三维结构还可以用于开发在计算机芯片上的方法,用于基于序列的底物特异性预测。负责所需活性的关键氨基酸残基的鉴定可以随后为公众数据库的考察,以鉴定携带所需氨基酸置换的候选酶。
[0366] 本发明的多肽例如SEQ ID NO:1或SEQ ID NO:2的三维结构还可以用于重新设计转移酶的底物特异性。转移酶的结合袋可以通过使用在计算机芯片上的建模、位点饱和诱变和定向进化的组合进行重新设计。
[0367] 对于大多数类型的模型,代表组成成分原子和基团之间的力的标准分子力场是必要的,并且可以选自物理化学中已知的力场。本领域已知且可以用于此类方法中的示例性力场包括但不限于恒价力场(CVFF)、AMBER力场和CHARM力场。不完整或较不准确的实验结构可以充当通过这些建模方法计算的完整和更准确结构的约束。
[0368] 分子建模系统的进一步例子是CHARMm和QUANTA程序(Polygen Corporation,Waltham,MA)。CHARMm进行能量最小化和分子动力学功能。QUANTA进行分子结构的构建、图形建模和分析。QUANTA允许分子与彼此的相互作用构建、修饰、显现和行为分析。
[0369] 如本文使用的,附录I中提供的原子坐标的“子集”指一组坐标,其可以用于本发明的方法,例如鉴定结合p6或本文限定的多肽的化合物(例如底物、辅因子、拮抗剂或激动剂)的计算机辅助方法,或者用于鉴定其他氨基转移酶或重新设计转移酶的底物特异性的计算机辅助方法。
[0370] 实施例
[0371] 背景
[0372] 尼龙制造所需的长链氨基酸(例如C9-12)在自然界中并不丰富,没有这些分子的明确生理学作用。鉴定这些底物的生物催化剂的文献检索也是不成功的。然而,在该领域中相关的是ω-转氨酶例如充分表征的GabT(γ-氨基丁酸转氨酶;E.C.2.6.1.19)由脂肪族羧酸半醛产生短链ω-氨基酸(报道的C4-C7)的能力,如下所示。
[0373]
[0374] γ-氨基丁酸酯,GabT的底物,是哺乳动物中枢神经系统中的重要神经递质,并且因此,该分子和蛋白质均为广泛医学研究的主题,提供本领域中的大量信息,但留下生物催化潜力未探测。
[0375] 使用专门设计的引物,由基因组DNA扩增编码来自大肠杆菌菌株BL21-DE3的GabT蛋白质的DNA。使用NdeI和BamHI限制性核酸内切酶(NEB)限制PCR产物,并且连接(T4DNA连接酶,NEB)到经修饰的pET表达载体内,所述pET表达载体也已使用上述酶进行限制,并且含有氨苄青霉素抗性用于选择性。将载体转化到电感受态大肠杆菌菌株BL21-DE3内,并且转化体在含有用于选择性的氨苄青霉素(100μg/mL)的LB琼脂平板上铺平板。将转化体DNA分离且送往测序,以证实载体构建体的身份。在DNA测序后,在含有氨苄青霉素(100μg/mL)和使用IPTG(异丙基β-D-1-硫代半乳糖苷;1mM最终浓度)诱导的LB培养基中实现GabT的过表达。使用HiTrap Chelating HP 5mL柱(GE Healthcare)用于在FPLC(Fast Protein Liquid Chromatography,GE Healthcare)上的镍亲和层析,采用在GabT上的N末端His6标签来纯化蛋白质。SDS-PAGE证实蛋白质大小。
[0376] 蛋白质活性使用偶联测定加以证实,所述偶联测定包含GabT和商购可得的谷氨酸脱氢酶(GDH;Sigma Aldrich)。该测定如下举例说明地工作,其中脱氢酶催化谷氨酸盐的氧化脱氨作用,所述谷氨酸盐是GabT转氨反应的副产物。脱氨作用需要使用辅因子,NAD(烟酰胺腺嘌呤二核苷酸),其同时被酶还原为NADH,并且这种还原产物的形成可以通过UV分光光度法(photospectrometry)检测为在340nm处的增色位移。
[0377]
[0378] 该测定用于测定GabT的底物范围,其最终显示为C4-C8ω-氨基酸。因此,尽管这些底物的可行生物催化剂已得到鉴定,但它不能产生所需长链(>C9)产物。考虑这点,采用了新策略。
[0379] 生物勘测(Bioprospecting)
[0380] 为了测试活性,使细菌菌株在最小培养基上生长,所述最小培养基不含除了覆盖一系列碳链长(C4-C12)的补充性ω-氨基烷酸酯(例如8-氨基辛酸、11-氨基十一酸和12-氨基十二酸)之外的氮源。细菌在37℃下温育几天,并且定期监控琼脂表面上的菌落形成。如果没有氮,细菌将不能生长,并且像这样,平板上的任何菌落将指示这样的菌株,其能够分解ω-氨基烷酸酯且释放氮用于生长。根据该筛选,一种细菌菌株假单胞菌属物种(Pseudomonas sp.)鉴定为能够在补充有C4-C12ω-氨基烷酸酯的最小培养基平板上生长,并且用该细菌接种大型培养物,以便就活性测试粗细胞裂解产物,并且鉴定对C12氨基酸起作用的蛋白质类型。还从菌株中分离基因组DNA且送往Beijing Genomics Institute用于测序。
[0381] 尽管并非结论性的,但无细胞提取物的测定提示转氨酶催化12-氨基十二酸的分解。筛选涉及丙酮酸盐和α-酮戊二酸两者,以及丙氨酸和谷氨酸脱氢酶两者的添加,并且以先前描述的方式筛选NADH形成。该测定对于转氨酶活性是阳性的。
[0382] 鉴定假单胞菌属物种内的生物催化剂
[0383] 在假单胞菌属物种的基因组序列阐明后,使用Exonerate分析基因组,所述Exonerate是可以针对基因组DNA比对查询序列且鉴定相似基因的序列比对工具。根据GabT的先前研究,这用作蛋白至基因组(protein2genome)模型比对中的查询序列,并且在基因组分析后,在假单胞菌属物种基因组中鉴定十四种潜在同系物。这些的序列相同性范围为4-74%。设计引物扩增来自基因组DNA的十四种基因中的每一种,用于克隆到大肠杆菌内。
[0384] 克隆和表达
[0385] 基因片段各自通过PCR从基因组DNA中进行扩增,使用NdeI和BamHI限制性核酸内切酶进行消化,并且以与先前描述的GabT相同的方式连接到经修饰的pET载体内。将该载体转化到电感受态大肠杆菌BL21-DE3内,并且在含有氨苄青霉素的LB琼脂平板上铺平板。在37℃下温育过夜后,观察到的转化体用于接种小型LBAmp培养物(通常为10mL)。从细菌中分离载体DNA且送往DNA测序以证实构建体。
[0386] 通过使200mL含有所需载体的大肠杆菌BL21-DE3在含有氨苄青霉素(100μg/mL)的LB培养基中在37℃下生长,来实现蛋白质过表达。当OD600达到0.6-1.0时,培养物通过添加IPTG(1mM最终浓度)进行诱导,并且进一步在37℃下温育18小时。细胞通过离心(4,500rpm;20分钟)进行分离,并且弃去上清液。将团块重悬浮于磷酸缓冲液(100mM,pH 7.5)中,并且使用 10x试剂(Merck)伴随在上的一小时振荡实现细胞裂解。细胞碎片通
过离心(18,000rpm,1小时)进行沉淀,并且使无细胞提取物针对增加浓度的咪唑经过FPLC上的HiTrap Chelating HP柱。洗脱的蛋白质在磷酸盐缓冲液(100mM,pH 7.5)中进行洗涤,并且通过利用旋转柱(GE Healthcare;10k MWCO)的离心进行浓缩。纯度通过SDS-PAGE进行评价。
[0387] 测定新活性
[0388] 使用如先前描述的偶联脱氢酶测定,评价每种蛋白质的活性。典型的测定包括:
[0389] ·底物(在磷酸钾缓冲液中的6.25mM最终浓度)
[0390] ·辅助底物(丙酮酸盐(0.5mM最终浓度)或α-KG(0.25mM最终浓度)
[0391] ·NAD(1.25mM最终浓度)
[0392] ·脱氢酶(1μL来自ADH-≥35单位/mL原液或GDH≥35单位/mg蛋白质母液)
[0393] ·转氨酶(最终浓度依赖性的)
[0394] ·磷酸钾缓冲液(100mM)
[0395] 在28℃下经过7.5-10的pH范围使用一系列底物记录在340nm处的UV吸光度。在测试的十四种蛋白质中,本文被称为p6(氨基酸序列在SEQ ID NO:1中提供;多核苷酸序列在SEQ ID NO:3中提供)、p7(氨基酸序列在SEQ ID NO:2中提供;多核苷酸序列在SEQ ID NO:4中提供)、和p4(氨基酸序列在SEQ ID NO:6中提供;多核苷酸序列在SEQ ID NO:14中提供)的三种,已显示对于ω-氨基酸的所需活性,值得注意的是包括长链氨基酸C11和C12(在左下显示;C9和C10并非商购可得的)。另外,p6酶还接受小至C3(β-丙氨酸)的底物,并且耐受沿碳链的一些官能化。类似地,p7酶接受小至C4(γ-氨基丁酸酯;GABA)的底物,并且耐受沿碳链的一些官能化。
[0396] p6酶是丙酮酸盐:ω-氨基酸转氨酶,其最佳pH为约pH 10。该酶与GabT具有19%序列相同性,并且针对在线蛋白质数据库,基于BLAST分析预测为β-丙氨酸:丙酮酸盐转氨酶。尽管数据库中的其他蛋白质共享高同源性(最高达87%,其中最近条目07.03.13共享99%,无一迄今为止已得到表征)。
[0397] p7酶是丙酮酸盐:ω-氨基酸转氨酶,其最佳pH为约pH 10。该酶与GabT具有27%序列相同性,并且针对在线蛋白质数据库,基于BLAST分析预测为乙酰鸟氨酸转氨酶。
[0398] p4酶是丙酮酸盐:ω-氨基酸转氨酶,其最佳pH为约pH 10。该酶与GabT具有23%序列相同性,并且针对在线蛋白质数据库,基于BLAST分析预测为腐胺转氨酶。
[0399] 为了确证UV测定的发现,使用C11氨基酸底物进行大规模(200mL)p6反应。在七天后,允许混合反应沉降,并且在反应表面上观察到黄色油。使该油在真空中进行浓缩,并且通过GC-MS进行分析。除丙氨酸(反应的副产物)的检测之外,还发现以大浓度的对应于C11二酸质量的峰。二酸被认为是通过转氨酶形成的半醛的氧化产物,进一步支持UV测定的发现。
[0400] 丙氨酸脱氢酶偶联测定已用于测定关于p6和p7的一些早期动力学参数。关于p6与C3-C8和C4-C8的反应已得到充分表征,并且未显示在反应速率相对于碳链长方面的明确趋势。对于C11和C12,底物的溶解度极低,并且因此,无法测定动力学参数。
[0401]
[0402] 祖先重建
[0403] p7N6、p7N15、p7N16、p7N17、p7N43和p7N48是基于p7的新形成的(de novo)肽序列。这些分子使用下文描述的方法通过祖先重建产生。
[0404] p7的同系物通过氨基酸序列的BLAST分析获得,并且彼此相比对。使用MAFFT版本7.043(Katoh和Standley,2013)和Seaview版本4.4.1(Gouy等人,2010),推断序列的多重序列比对(MSA)。使用MAFFT的LINSI选项来推断数据的初步MSA。使用Seaview,将初步比对精炼以获得最终比对。使用IQ-TREE版本0.9.3(Minh等人,2013),鉴定重复序列,并且随后从最终比对中去除。重新比对简化的数据。
[0405] 为了评价数据是否可以假定为已在总体静止、可逆和同质(SRH)的条件下进行(Jayaswal等人2011),本发明人使用Homo版本1.0(available at http://www.bioinformatics.csiro.au/homo)(Ababneh等人,2006)来审查比对。所观察到的p值针对在零分布下获得的预期p值进行标绘。18336个测试中的四十五个(~0.2%)产生p值<
0.05,并且最小p值为0.0126,暗示数据与在总体SRH条件下的进化一致。
[0406] IQ-TREE版本0.9.3(Minh等人,2013)用于鉴定最佳进化模型。使用由IQ-TREE调用的-m TESTONLY选项,鉴定用于主比对的最佳进化模型,并且发现为LG+I+G4模型。如IQ-TREE中实现的,使用最大似然性(ML)推断用于主比对的系统树。使用UFBoot方法(使用缺省设置)进行非参数自举分析,并且推断的树随后用于推断祖先序列。使用FastML(Pupko等人,2002),在ML标准下推断祖先氨基酸序列,并且随后鉴定下述祖先序列且用于进一步的生物化学分析;
[0407] ·p7N6,其与p7共享91%序列相同性,且与GabT共享25%序列相同性(p7N6的氨基酸序列在SEQ ID NO:7中提供;多核苷酸序列在SEQ ID NO:15中提供),
[0408] ·p7N15,其与p7共享85%序列相同性,且与GabT共享27%序列相同性(p7N15的氨基酸序列在SEQ ID NO:8中提供;多核苷酸序列在SEQ ID NO:16中提供),
[0409] ·p7N16,其与p7共享81%序列相同性,且与GabT共享27%序列相同性(p7N16的氨基酸序列在SEQ ID NO:9中提供;多核苷酸序列在SEQ ID NO:17中提供),
[0410] ·p7N17,其与p7共享80%序列相同性,且与GabT共享27%序列相同性(p7N17的氨基酸序列在SEQ ID NO:10中提供;多核苷酸序列在SEQ ID NO:18中提供),
[0411] ·p7N43,其与p7共享77%序列相同性,且与GabT共享27%序列相同性(p7N43的氨基酸序列在SEQ ID NO:11中提供;多核苷酸序列在SEQ ID NO:19中提供),和
[0412] ·p7N48,其与p7共享76%序列相同性,且与GabT共享27%序列相同性(p7N43的氨基酸序列在SEQ ID NO:12中提供;多核苷酸序列在SEQ ID NO:20中提供)。
[0413] 使用大肠杆菌重组表达平台表达由p7N6、p7N15、p7N16、p7N17、p7N43和p7N48编码的蛋白质,并且随后进行纯化。使用上文描述的相同偶联测定测试蛋白质,并且发现具有与p7一致的活性。
[0414] 功能表征
[0415] 蛋白质各自就底物特异性进行测定。通过对于蛋白质各自测定而鉴定的底物在下文概括。
[0416] p4—6-氨基己酸、7-氨基庚酸、8-氨基辛酸、11-氨基十一酸、12-氨基十二酸、腐胺、尸胺、3-氨基环己酸酯、丙醛、丁醛、酪胺、2-氨基茚满、2-甲基苄胺、六亚甲基二胺、1,7-二氨基庚烷、1,8-二氨基辛烷、1,9-二氨基壬烷、1,10-二氨基癸烷、环己胺、6-氨基己醇、7-氨基庚醇、8-氨基辛醇、9-氨基壬醇、10-氨基癸醇、环己酮、多巴胺、5-羟色胺、丙氨酸和丙酮酸盐。
[0417] p6—甘氨酸、β-丙氨酸、4-氨基丁酸酯、5-氨基戊酸酯、6-氨基己酸、7-氨基庚酸、8-氨基辛酸、11-氨基十一酸、12-氨基十二酸、3-氨基异丁酸酯、腐胺、尸胺、3-氨基环己酸酯、丙醛、丁醛、酪胺、2-氨基茚满、六亚甲基二胺、1,7-二氨基庚烷、1,8-二氨基辛烷、1,9-二氨基壬烷、1,10-二氨基癸烷、6-氨基己醇、7-氨基庚醇、8-氨基辛醇、9-氨基壬醇、10-氨基癸醇、牛磺酸、甘油醛、3-氨基庚酸、环己胺、2-甲基苄胺、二羟丙酮磷酸、羟甲基糠醛、乙醇胺、丙氨酸和丙酮酸盐。
[0418] p7—甘氨酸、4-氨基丁酸酯、5-氨基戊酸酯、6-氨基己酸、7-氨基庚酸、8-氨基辛酸、11-氨基十一酸、12-氨基十二酸、4-氨基-2-羟基丁酸酯、腐胺、尸胺、六亚甲基二胺、1,7-二氨基庚烷、1,8-二氨基辛烷、1,9-二氨基壬烷、1,10-二氨基癸烷、6-氨基己醇、7-氨基庚醇、8-氨基辛醇、9-氨基壬醇、10-氨基癸醇、2,4-二氨基丁酸酯、2-甲基苄胺、二羟丙酮磷酸、羟甲基糠醛、丙氨酸和丙酮酸盐。
[0419] p7N6—甘氨酸、4-氨基丁酸酯、5-氨基戊酸酯、6-氨基己酸、7-氨基庚酸、8-氨基辛酸、11-氨基十一酸、12-氨基十二酸、鸟氨酸、赖氨酸、3-氨基环己酸酯、4-氨基-2-羟基丁酸酯、腐胺、尸胺、六亚甲基二胺、1,7-二氨基庚烷、1,8-二氨基辛烷、1,9-二氨基壬烷、1,10-二氨基癸烷、6-氨基己醇、7-氨基庚醇、8-氨基辛醇、9-氨基壬醇、10-氨基癸醇、2,4-二氨基丁酸酯、2-甲基苄胺、二羟丙酮磷酸、羟甲基糠醛、丙氨酸和丙酮酸盐。
[0420] p7N15—甘氨酸、4-氨基丁酸酯、5-氨基戊酸酯、6-氨基己酸、7-氨基庚酸、8-氨基辛酸、11-氨基十一酸、12-氨基十二酸、鸟氨酸、赖氨酸、3-氨基环己酸酯、4-氨基-2-羟基丁酸酯、腐胺、尸胺、氨基丙二酸二乙酯、六亚甲基二胺、1,7-二氨基庚烷、1,8-二氨基辛烷、1,9-二氨基壬烷、1,10-二氨基癸烷、6-氨基己醇、7-氨基庚醇、8-氨基辛醇、9-氨基壬醇、10-氨基癸醇、2,4-二氨基丁酸酯、2-甲基苄胺、二羟丙酮磷酸、羟甲基糠醛、丙氨酸和丙酮酸盐。
[0421] p7N16—甘氨酸、4-氨基丁酸酯、5-氨基戊酸酯、6-氨基己酸、7-氨基庚酸、8-氨基辛酸、11-氨基十一酸、12-氨基十二酸、鸟氨酸、赖氨酸、3-氨基环己酸酯、4-氨基-2-羟基丁酸酯、腐胺、尸胺、N-乙酰基-L-鸟氨酸、六亚甲基二胺、1,7-二氨基庚烷、1,8-二氨基辛烷、1,9-二氨基壬烷、1,10-二氨基癸烷、6-氨基己醇、7-氨基庚醇、8-氨基辛醇、9-氨基壬醇、
10-氨基癸醇、2,4-二氨基丁酸酯、2-甲基苄胺、二羟丙酮磷酸、羟甲基糠醛、丙氨酸和丙酮酸盐。
[0422] p7N17—甘氨酸、4-氨基丁酸酯、5-氨基戊酸酯、6-氨基己酸、7-氨基庚酸、8-氨基辛酸、11-氨基十一酸、12-氨基十二酸、鸟氨酸、赖氨酸、3-氨基环己酸酯、4-氨基-2-羟基丁酸酯、腐胺、尸胺、N-乙酰基-L-鸟氨酸、六亚甲基二胺、1,7-二氨基庚烷、1,8-二氨基辛烷、1,9-二氨基壬烷、1,10-二氨基癸烷、6-氨基己醇、7-氨基庚醇、8-氨基辛醇、9-氨基壬醇、
10-氨基癸醇、2,4-二氨基丁酸酯、2-甲基苄胺、二羟丙酮磷酸、羟甲基糠醛、丙氨酸和丙酮酸盐。
[0423] p7N43—甘氨酸、4-氨基丁酸酯、5-氨基戊酸酯、6-氨基己酸、7-氨基庚酸、8-氨基辛酸、11-氨基十一酸、12-氨基十二酸、鸟氨酸、赖氨酸、3-氨基环己酸酯、4-氨基-2-羟基丁酸酯、腐胺、尸胺、N-乙酰基-L-鸟氨酸、氨基丙二酸二乙酯、环己胺、六亚甲基二胺、1,7-二氨基庚烷、1,8-二氨基辛烷、1,9-二氨基壬烷、1,10-二氨基癸烷、6-氨基己醇、7-氨基庚醇、8-氨基辛醇、9-氨基壬醇、10-氨基癸醇、2,4-二氨基丁酸酯、2-甲基苄胺、二羟丙酮磷酸、羟甲基糠醛、丙氨酸和丙酮酸盐。
[0424] p7N48—甘氨酸、4-氨基丁酸酯、5-氨基戊酸酯、6-氨基己酸、7-氨基庚酸、8-氨基辛酸、11-氨基十一酸、12-氨基十二酸、鸟氨酸、赖氨酸、3-氨基环己酸酯、4-氨基-2-羟基丁酸酯、腐胺、尸胺、N-乙酰基-L-鸟氨酸、氨基丙二酸二乙酯、环己胺、六亚甲基二胺、1,7-二氨基庚烷、1,8-二氨基辛烷、1,9-二氨基壬烷、1,10-二氨基癸烷、6-氨基己醇、7-氨基庚醇、8-氨基辛醇、9-氨基壬醇、10-氨基癸醇、2,4-二氨基丁酸酯、2-甲基苄胺、二羟丙酮磷酸、羟甲基糠醛、丙氨酸和丙酮酸盐。
[0425] X射线晶体学
[0426] 在20℃下使用200mM MgCl、以pH 7的100mM Tris缓冲液和10%PEG 8000的储库溶液,由在50mM磷酸钾缓冲液中以8mg/mL的纯化P6来结晶p6蛋白质。将晶体送往Australian Synchrotron,并且使用XDS(Kabsch,2010)将序列数据编入索引。数据使用CCP4程序套件进行换算,并且结构使用分子替换进行分辨,使用PDB代码3A8U作为起始模型和程序Phaser(McCoy等人,2007)。结构随后使用Coot(Emsley等人,2010)和Refmac(Mushudov等人,2011)进行重建和精炼(附录I)。
[0427] 由使用来自溶液的5mg/mL p7蛋白质(在PO4/NaCl中)生长的晶体测定p7的结构,所述溶液含有1.61M硫酸铵、0.05M MES钠6.8、0.9%v/v二噁烷。由使用来自溶液的10mg/mL蛋白质(在ADA钠/NaCl中)生长的晶体测定P7n6的结构,所述溶液含有0.155M氯化镁、0.1M tris氯化物pH 8.5、12.8%v/v甘油和15.2%w/v PEG 8000。由使用来自溶液的10mg/mL蛋白质(在ADA钠/NaCl中)生长的晶体测定P7n15的结构,所述溶液含有0.152M氯化镁、0.1M tris氯化物pH 7.2、17.1%v/v甘油和14.9%w/v PEG 8000。由使用来自溶液的10mg/mL蛋白质(在tris氯化物/NaCl中)生长的晶体测定P7n16的结构,所述溶液含有0.135M甲酸铵和20.1%w/v PEG 3350。由使用来自溶液的10mg/mL蛋白质(在tris氯化物/NaCl中)生长的晶体测定P7n17的结构,所述溶液含有0.152M氯化镁、0.1M tris氯化物pH 7.1、14.8%v/v甘油和11.9%w/v PEG 8000。由使用来自溶液的4mg/mL蛋白质(在MOPS钠/NaCl中)生长的晶体测定P7n43的结构,所述溶液含有0.011M乙酸钙、0.1M tris氯化物pH 7.1和15.1%w/v PEG 8000。由使用来自溶液的10mg/mL蛋白质(在PO4/NaCl中)生长的晶体测定P7n48的结构,所述溶液含有0.03M硝酸镁和15.6%w/v PEG 3350。p7、p7N6、p7N15、p7N16、p7N16、p7N17、p7N43和p7N48结构已得到解析(数据未示出),并且类似于p6。各自相对于p6的RMS值显示于下文。
[0428] p6,p7–1.106
[0429] p6,p7N6–1.094
[0430] p6,p7N15–1.076
[0431] p6,p7N16–1.076
[0432] p6,p7N17–1.054
[0433] p6,p7N43–1.076
[0434] p6,p7N48–1.114
[0435] 将晶体送往Australian Synchrotron,并且使用XDS(Kabsch,2010)将序列数据编入索引。数据使用CCP4程序套件进行换算,并且天然结构使用分子替换进行解析,使用PDB代码3GJU作为起始模型和程序Phaser(McCoy等人,2007)。结构随后使用Coot(Emsley等人,2010)和Refmac(Mushudov等人,2011)进行重建和精炼。使用相同程序,但使用天然结构作为分子替换的起点,来解析各种祖先蛋白质结构(结点n6至n48)。
[0436] 为了确证UV测定的发现,使用C11氨基酸底物进行大规模(200mL)p6反应。在七天后,允许混合反应沉降,并且在反应表面上观察到黄色油。使该油在真空中进行浓缩,并且通过GC-MS进行分析。除丙氨酸(反应的副产物)的检测之外,还发现以大浓度的对应于C11二酸质量的峰。二酸被认为是通过转氨酶形成的半醛的氧化产物,进一步支持UV测定的发现。
[0437] 丙氨酸脱氢酶偶联测定已用于测定关于所有上述酶的一些早期动力学参数。关于p6与C3-C8和关于p7与C4-C8的反应已得到充分表征,并且未显示在反应速率相对于碳链长方面的明确趋势。对于C11和C12,底物的溶解度极低,并且像这样,无法测定动力学参数。
[0438] 本领域技术人员应了解可以对如具体实施方案中所示的本发明作出众多变化和/或修饰,而不背离如广泛描述的本发明的精神或范围。呈现的实施方案因此在所有方面均视为举例说明性而不是限制性的。
[0439] 本申请要求来自于2013年6月12日提交的AU 2013902128的优先权,所述申请的完整公开内容引入本文作为参考。
[0440] 本文讨论和/或提及的所有出版物均整体引入本文。
[0441] 已包括在本说明书中的文件、动作、材料、装置、物品等等的任何讨论均仅用于提供本发明的背景的目的。它不视为这些内容中的任何或全部构成现有技术基础的部分或是与本发明相关领域中的公知常识的承认,因为它在本申请的每个权利要求的优先权日期之前存在。
[0442] 参考文献
[0443] Ababneh等人(2006)Bioinformatics 22:1225-1231,
[0444] Bernt和Bergmeyer(1974)Methoden Enzym.3(2):1749-53,
[0445] Cadwell和Joyce(1992)PCR Methods Appl.2:28-33,
[0446] Capecchi(1980)Cell 22:479-488,
[0447] Clapp(1993)Clin.Perinatol.20:155-168,
[0448] Coco等人(2001)Nature Biotechnology 19:354-359,
[0449] Coco等人(2002)Nature Biotechnology 20:1246-1250,
[0450] Crameri等人(1998)Nature 391:288-291,
[0451] Curiel等人(1992)Hum.Gen.Ther.3:147-154,
[0452] Dunbrack等人(1997)Folding and Design 2:R27-R42,
[0453] Eggert等人(2005)Chemobiochem.6:1062-1067,
[0454] Eglitis等人(1988)Biotechniques 6:608-614,
[0455] Emsley等人(2010)Acta Crystallogr.D Biol.Crystallogr.66:486–501,[0456] Gordon等人(1999)Chemical-Biological Interactions 14:463-470,
[0457] Gouy等人(2010)Molecular Biology and Evolution 27:221-224,
[0458] Graham等人(1973)Virology 54:536-539,
[0459] Harayama(1998)Trends Biotechnol.16:76-82,
[0460] Haseloff和Gerlach(1988)Nature 334:585-591,
[0461] Hellinga(1997)Proc Natl Acad Sci USA 94:10015-10017,
[0462] Hinchee等人(1988)Biotechnology 6:915-922,
[0463] Jayaswal等人(2011)Systematic Biology 60:74-86,
[0464] Kabsch(2010)Acta Crystallogr.Sect.D-Biol.Crystallogr.66:125-132,[0465] Katoh K和Standley(2013)Molecular Biology and Evolution 30:772-780,[0466] Koziel等人(1996)Plant Mol.Biol.32:393-405,
[0467] LeJeune等人(1998).Nature 395:27-28,
[0468] Leung等人(1989)Technique 1:11-15,
[0469] Lu等人(1993)J.Exp.Med.178:2089-2096,
[0470] Malik等人(2012)Appl.Microbiol.Biotechnol.94:1163-1171,
[0471] McCoy(2007)J.Appl.Crystallogr.40:658–674,
[0472] Mehta等人(1993)Eur.J.Biochem.214:549-561,
[0473] Minh等人(2013)Molecular Biology and Evolution 30:1188-1195,
[0474] Murshudov等人(2011)Acta Crystallogr.D Biol.Crystallogr.67:355–367,[0475] Needleman和Wunsch(1970)J.Mol.Biol.48:443-453,
[0476] Ness等人(2002)Nature Biotechnology 20:1251–1255,
[0477] Niedz等人(1995)Plant Cell Reports 14:403-406,
[0478] Ostermeier等人(1999)Nat Biotechnol.17:1205-1209,
[0479] Ow等人(1986)Science 234:856-859,
[0480] Petrikovics等人(2000a)Toxicology Science 57:16-21,
[0481] Petrikovics等人(2000b)Drug Delivery 7:83-89,
[0482] Pupko等人(2002)Bioinformatics 18:1116-1123,
[0483] Prasher等人(1985)Biochem.Biophys.Res.Commun.127:31-36,
[0484] Sieber等人(2001)Nature Biotechnology 19:456-460,
[0485] Stalker等人(1988)Science 242:419-423,
[0486] Stemmer(1994a)Proc.Natl.Acad.Sci.USA 91:10747-10751,
[0487] Stemmer(1994b)Nature 370(6488):389-391.
[0488] Thillet等人(1988)Journal of Biological Chemistry 263:12500-12508,[0489] Volkov等人(1999)Nucleic Acids Research 27:e18i-vi,
[0490] Wagner等人(1992)Proc.Natl.Acad.Sci.USA 89:6099-6103,
[0491] Zhao等人(1998)Nature Biotechnology 16:258261.
[0492] 附录I
[0493]
[0494]
[0495]
[0496]
[0497]
[0498]
[0499]
[0500]
[0501]
[0502]
[0503]
[0504]
[0505]
[0506]
[0507]
[0508]
[0509]
[0510]
[0511]
[0512]
[0513]
[0514]
[0515]
[0516]
[0517]
[0518]
[0519]
[0520]
[0521]
[0522]
[0523]
[0524]
[0525]
[0526]
[0527]
[0528]
[0529]
[0530]
[0531]
[0532]
[0533]
[0534]
[0535]
[0536]
[0537]
[0538]
[0539]
[0540]
[0541]
[0542]
[0543]
[0544]
[0545]
[0546]
[0547]
[0548]
[0549]
[0550]
[0551]
[0552]
[0553]
[0554]
[0555]
[0556]
[0557]
[0558]
[0559]
[0560]
[0561]
[0562]
[0563]
[0564]
[0565]
[0566]
[0567]
[0568]
[0569]
[0570]
[0571]
[0572]
[0573]
[0574]
[0575]
[0576]
[0577]
[0578]
[0579]
[0580]
[0581]
[0582]
[0583]
[0584]
[0585]
[0586]
[0587]
[0588]
[0589]
[0590]
[0591]
[0592]
[0593]
[0594]
[0595]
[0596]
[0597]
[0598]
[0599]
[0600]
[0601]
[0602]
[0603]
[0604]
[0605]
[0606]
[0607]
[0608]
[0609]
[0610]
[0611]
[0612]
[0613]
[0614]
[0615]
[0616]
[0617]
[0618]
[0619]
[0620]
[0621]
[0622]
[0623]
[0624]
[0625]
[0626]
[0627]
[0628]
[0629]
[0630]
[0631]
[0632]
[0633]
[0634]
[0635]
[0636]
[0637]
[0638]
[0639]
[0640]
[0641]
[0642]
[0643]
[0644]
[0645]
[0646]
[0647]
[0648]
[0649]
[0650]
[0651]
[0652]
[0653]
[0654]
[0655]
[0656]
[0657]
[0658]
[0659]
[0660]
[0661]
[0662]
[0663]
[0664]
[0665]
[0666]
[0667]
[0668]
[0669]
[0670]
[0671]
[0672]
[0673]
[0674]
[0675]
[0676]
[0677]
[0678]
[0679]
[0680]
[0681]
[0682]
[0683]
[0684]
[0685]
[0686]
[0687]
[0688]
[0689]
[0690]
[0691]
[0692]
[0693]
[0694]
[0695]
[0696]
[0697]
[0698]
QQ群二维码
意见反馈