首页 / 专利库 / 化学元素和化合物 / 放射性材料 / 用于脊椎动物细胞的杂合抑制tRNA

用于脊椎动物细胞的杂合抑制tRNA

阅读:1018发布:2020-08-01

专利汇可以提供用于脊椎动物细胞的杂合抑制tRNA专利检索,专利查询,专利分析的服务。并且本 发明 提供用于产生扩充 脊椎动物 细胞中基因编码 氨 基酸的数量的翻译组件的组合物和方法。所述组件包括 正交 tRNA、正交氨酰基-tRNA合成酶、tRNA/合成酶正交对和非天然氨基酸。还提供具有非天然氨基酸的 蛋白质 和在脊椎动物细胞中产生具有非天然氨基酸的蛋白质的方法。本发明对脊椎动物细胞提供翻译组件,例如正交氨酰基-tRNA合成酶(O-RS)与正交tRNA(O-tRNA)对和其个别组件,所述翻译组件可用于脊椎动物蛋白质 生物 合成机器中以将非天然氨基酸并入脊椎动物细胞中正在生长的多肽链中。,下面是用于脊椎动物细胞的杂合抑制tRNA专利的具体信息内容。

1.一种脊椎动物细胞或细胞系,其包含如SEQ ID NO:87或SEQ ID NO:88中所述的核苷
酸序列。
2.根据权利要求1所述的细胞,其中所述核苷酸序列编码具有对选择性密码子具特异
性的反密码子识别序列的tRNA分子。
3.根据权利要求2所述的细胞,其中所述选择性密码子选自由以下组成的群组:琥珀密
码子、赭石密码子、蛋白石密码子或者四个或四个以上基的密码子。
4.根据权利要求2所述的细胞,其中所述核苷酸序列编码能够利用至少一个非天然
基酸氨酰化的tRNA分子。
5.根据权利要求1所述的细胞,其中所述核苷酸序列编码作为正交tRNA(O-tRNA)的
tRNA分子。
6.根据权利要求5所述的细胞,其中所述O-tRNA包含如SEQ ID NO.:87、SEQ ID NO.:88
所述的氨基酸序列或其保守变异体。
7.根据权利要求5所述的细胞,其中所述O-tRNA能够利用天然氨基酸或非天然氨基酸
氨酰化。
8.根据权利要求4所述的细胞,其中所述O-tRNA能够利用天然氨基酸和非天然氨基酸
氨酰化。
9.根据权利要求5所述的细胞,其中所述O-tRNA能够利用非天然氨基酸氨酰化。
10.根据权利要求1所述的细胞,其中所述核苷酸序列是得自非脊椎动物生物体或一种
以上非脊椎动物生物体。
11.根据权利要求1所述的细胞,其中所述核苷酸序列是得自脊椎动物生物体或一种以
上脊椎动物生物体。
12.根据权利要求1所述的细胞,其中所述核苷酸序列是得自脊椎动物和非脊椎动物生
物体。
13.根据权利要求1所述的细胞,其中所述核苷酸序列为野生型、突变型或经修饰的野
生型。
14.根据权利要求5所述的细胞,其中所述核苷酸序列是得自大肠杆菌(Escherichia 
coli)或嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)。
15.根据权利要求1所述的细胞,其中所述脊椎动物细胞为哺乳动物细胞。
16.根据权利要求15所述的细胞,其中所述脊椎动物细胞为CHO-K1。
17.根据权利要求15所述的细胞,其中所述脊椎动物细胞为CHO DG-44。
18.根据权利要求15所述的细胞,其中所述脊椎动物细胞为人类细胞系。
19.根据权利要求9所述的细胞,其中所述非天然氨基酸选自由以下组成的群组:对-乙
酰基-L-苯丙氨酸;对-碘-L-苯丙氨酸;O-甲基-L-酪氨酸;对-炔丙基基苯丙氨酸;L-3-(2-基)丙氨酸;3-甲基-苯丙氨酸;O-4-烯丙基-L-酪氨酸;4-丙基-L-酪氨酸;三-O-乙酰基-GlcNAcβ-丝氨酸;L-多巴(L-Dopa);氟化苯丙氨酸;异丙基-L-苯丙氨酸;对-叠氮基-L-苯丙氨酸;对-酰基-L-苯丙氨酸;对-苯甲酰基-L-苯丙氨酸;L-磷酸丝氨酸;膦酸丝氨酸;膦酸酪氨酸;对-溴苯丙氨酸;对-氨基-L-苯丙氨酸;异丙基-L-苯丙氨酸;酪氨酸氨基酸的非天然类似物;谷氨酰胺氨基酸的非天然类似物;苯丙氨酸氨基酸的非天然类似物;丝氨酸氨基酸的非天然类似物;苏氨酸氨基酸的非天然类似物;烷基、芳基、酰基、叠氮基、氰基、卤基、肼、酰肼、羟基、烯基、炔基、醚、硫醇、磺酰基、硒基、酯、硫代酸、酸酯基、硼酸酯基、磷酸基、膦酸基、膦、杂环、烯、亚胺、、羟胺、酮基或氨基取代的氨基酸,或其任何组合;具有可光活化交联剂的氨基酸;自旋标记的氨基酸;发荧光氨基酸;结合金属的氨基酸;含金属氨基酸;放射性氨基酸;光笼蔽和/或光致异构化氨基酸;含生物素或生物素类似物氨基酸;含酮基氨基酸;包含聚乙二醇或聚醚的氨基酸;重原子取代的氨基酸;化学可裂解或可光裂解氨基酸;具有伸长侧链的氨基酸;含有毒基团的氨基酸;糖取代的氨基酸;含连接糖的氨基酸;具有氧化还原活性的氨基酸;含α-羟基的酸;氨基硫代酸;α,α双取代氨基酸;
β-氨基酸;除脯氨酸或组氨酸外的环状氨基酸;除苯丙氨酸、酪氨酸或色氨酸外的芳香族氨基酸。
20.根据权利要求15所述的细胞,其另外包含正交tRNA合成酶(O-RS),其中所述O-RS识
别所述tRNA,并且所述tRNA优先通过所述O-RS利用非天然氨基酸氨酰化。
21.根据权利要求20所述的细胞,其中所述O-RS是得自非脊椎动物生物体。
22.根据权利要求20所述的细胞,其中所述O-RS包含SEQ ID NO:3、4、5、6、7、8、9、10、
11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、
36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、
61、62、63、86的核苷酸序列或其保守变异体。
23.根据权利要求21所述的细胞,其中所述非脊椎动物生物体为大肠杆菌或嗜热脂肪
芽胞杆菌。
24.根据权利要求20所述的细胞,其另外包含核酸,所述核酸包含编码所关注多肽的多
聚核苷酸,其中所述多聚核苷酸包含由所述O-tRNA所识别的选择性密码子。
25.根据权利要求24所述的细胞,其中所述所关注多肽为治疗蛋白质、诊断性蛋白
质、工业酶或其部分。
26.根据权利要求24所述的细胞,其中所述所关注多肽包含选自由以下组成的群组的
蛋白质或蛋白质的一部分:细胞因子、生长因子、生长因子受体、干扰素、白细胞介素、炎症分子、癌基因产物、肽激素信号转导分子、类固醇激素受体、促红细胞生成素(EPO)、胰岛素、人生长激素、α-1抗胰蛋白酶、血管抑素、抗溶血因子、抗体、载脂蛋白、脱辅基蛋白、心房利钠因子、心房利钠多肽、心房肽、C-X-C趋化因子、T39765、NAP-2、ENA-78、Gro-a、Gro-b、Gro-c、IP-10、GCP-2、NAP-4、SDF-1、PF4、MIG、降素、c-kit配体、细胞因子、CC趋化因子、单核细胞趋化蛋白-1、单核细胞趋化蛋白-2、单核细胞趋化蛋白-3、单核细胞炎症蛋白-1α、单核细胞炎症蛋白-1β、RANTES、I309、R83915、R91733、HCC1、T58847、D31065、T64262、CD40、CD40配体、C-kit配体、胶原蛋白、群落刺激因子(CSF)、补体因子5a、补体抑制剂、补体受体
1、细胞因子、DHFR、上皮中性粒细胞活化肽-78、GROα/MGSA、GROβ、GROγ、MIP-1α、MIP-1δ、MCP-1、表皮生长因子(EGF)、上皮中性粒细胞活化肽、脱落毒素、因子IX、因子VII、因子VIII、因子X、纤维细胞生长因子(FGF)、纤维蛋白原、纤维粘连蛋白、G-CSF、GM-CSF、葡糖脑苷脂酶、促性腺激素、刺猬蛋白(hedgehog protein)、血红蛋白、肝细胞生长因子(HGF)、蛭素、人血清白蛋白、ICAM-1、ICAM-1受体、LFA-1、LFA-1受体、类胰岛素生长因子(IGF)、IGF-I、IGF-II、IFN-α、IFN-β、IFN-γ、IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、质细胞生长因子(KGF)、乳蛋白、白血病抑制因子、荧光素酶、神经营养因子、中性粒细胞抑制因子(NIF)、抑瘤素M、成骨蛋白、癌基因产物、甲状旁腺激素、PD-ECSF、PDGF、肽激素、多效生长因子、蛋白质A、蛋白质G、致热性外毒素A、B或C、松驰素、肾素、SCF、可溶性补体受体I、可溶性I-CAM 1、可溶性白细胞介素受体、可溶性TNF受体、生长调节素、生长抑素、生长激素、链激酶、超抗原、葡萄球菌肠毒素、SEA、SEB、SEC1、SEC2、SEC3、SED、SEE、类固醇激素受体、超氧化物歧化酶(SOD)、中毒性休克综合症毒素、胸腺肽α1、组织型纤溶酶原活化剂、肿瘤生长因子(TGF)、TGF-α、TGF-β、肿瘤坏死因子、肿瘤坏死因子α、肿瘤坏死因子β、肿瘤坏死因子受体(TNFR)、VLA-4蛋白、VCAM-1蛋白、血管内皮生长因子(VEGEF)、尿激酶、Mos、Ras、Raf、Met、p53、Tat、Fos、Myc、Jun、Myb、Rel、雌激素受体、孕酮受体、睾酮受体、醛固酮受体、LDL受体、SCF/c-Kit、CD40L/CD40、VLA-4/VCAM-1、ICAM-1/LFA-1、透明质酸/CD44和皮质酮。
27.一种脊椎动物细胞,其包含正交氨酰基-tRNA合成酶(O-RS)、由SEQ ID NO:87或SEQ 
ID NO:88所编码的tRNA、非天然氨基酸以及包含编码所关注多肽的多聚核苷酸的核酸,其
中所述多聚核苷酸包含由所述tRNA识别的选择性密码子,其中所述O-RS在所述脊椎动物细
胞中优先利用所述非天然氨基酸将所述tRNA氨酰化,且其中所述细胞产生具有所述非天然
氨基酸的所述所关注多肽。
28.根据权利要求1所述的核酸,其中所述核酸包含A盒和B盒。
29.根据权利要求1所述的细胞系,其中所述细胞系已经稳定转染
30.根据权利要求1所述的细胞系,其中所述细胞系已经瞬时转染。
31.一种在脊椎动物细胞中产生至少一种包含至少一个非天然氨基酸的蛋白质的方
法,所述方法包含:
使包含核酸的脊椎动物细胞在适当培养基中生长,所述核酸包含至少一个选择性密码
子且编码所述蛋白质;其中所述培养基包含非天然氨基酸且所述脊椎动物细胞包含:
tRNA,其具有SEQ ID NO:87或SEQ ID NO:88中所述的在所述细胞中起作用并识别所述
选择性密码子的核苷酸序列;和
正交氨酰基tRNA合成酶(O-RS),其优先利用所述非天然氨基酸将所述O-tRNA氨酰化。
32.根据权利要求31所述的方法,其中所述细胞已经稳定转染以包含所述O-tRNA和所
述O-RS。
33.根据权利要求31所述的方法,其中所述细胞已经瞬时转染以包含所述O-tRNA和所
述O-RS。
34.根据权利要求31所述的方法,其中所述细胞已经稳定转染以包含所述O-tRNA或所
述O-RS,并且经瞬时转染以包含所述O-tRNA或所述O-RS,以致所述细胞仍包含t-RNA和O-
RS。
35.根据权利要求31所述的方法,其中所述非天然氨基酸选自由以下组成的群组:对-
乙酰基-L-苯丙氨酸;对-碘-L-苯丙氨酸;O-甲基-L-酪氨酸;对-炔丙基氧基苯丙氨酸;L-3-(2-萘基)丙氨酸;3-甲基-苯丙氨酸;O-4-烯丙基-L-酪氨酸;4-丙基-L-酪氨酸;三-O-乙酰基-GlcNAcβ-丝氨酸;L-多巴;氟化苯丙氨酸;异丙基-L-苯丙氨酸;对-叠氮基-L-苯丙氨酸;
对-酰基-L-苯丙氨酸;对-苯甲酰基-L-苯丙氨酸;L-磷酸丝氨酸;膦酸丝氨酸;膦酸酪氨酸;
对-溴苯丙氨酸;对-氨基-L-苯丙氨酸;异丙基-L-苯丙氨酸;酪氨酸氨基酸的非天然类似
物;谷氨酰胺氨基酸的非天然类似物;苯丙氨酸氨基酸的非天然类似物;丝氨酸氨基酸的非天然类似物;苏氨酸氨基酸的非天然类似物;烷基、芳基、酰基、叠氮基、氰基、卤基、肼、酰肼、羟基、烯基、炔基、醚、硫醇、磺酰基、硒基、酯、硫代酸、硼酸酯基、硼酸酯基、磷酸基、膦酸基、膦、杂环、烯酮、亚胺、醛、羟胺、酮基或氨基取代的氨基酸,或其任何组合;具有可光活化交联剂的氨基酸;自旋标记的氨基酸;发荧光氨基酸;结合金属的氨基酸;含金属氨基酸;放射性氨基酸;光笼蔽和/或光致异构化氨基酸;含生物素或生物素类似物氨基酸;含酮基氨基酸;包含聚乙二醇或聚醚的氨基酸;重原子取代的氨基酸;化学可裂解或可光裂解氨基
酸;具有伸长侧链的氨基酸;含有毒基团的氨基酸;糖取代的氨基酸;含碳连接糖的氨基酸;
具有氧化还原活性的氨基酸;含α-羟基的酸;氨基硫代酸;α,α双取代氨基酸;β-氨基酸;除脯氨酸或组氨酸外的环状氨基酸;除苯丙氨酸、酪氨酸或色氨酸外的芳香族氨基酸。
36.根据权利要求32所述的方法,其中所述蛋白质包含治疗性蛋白质、诊断性蛋白质、
工业酶或其部分。
37.根据权利要求32所述的方法,其中所述蛋白质包含选自由以下组成的群组的蛋白
质或蛋白质的一部分:细胞因子、生长因子、生长因子受体、干扰素、白细胞介素、炎症分子、癌基因产物、肽激素、信号转导分子、类固醇激素受体、促红细胞生成素(EPO)、胰岛素、人生长激素、α-1抗胰蛋白酶、血管抑素、抗溶血因子、抗体、载脂蛋白、脱辅基蛋白、心房利钠因子、心房利钠多肽、心房肽、C-X-C趋化因子、T39765、NAP-2、ENA-78、Gro-a、Gro-b、Gro-c、IP-10、GCP-2、NAP-4、SDF-1、PF4、MIG、降钙素、c-kit配体、细胞因子、CC趋化因子、单核细胞趋化蛋白-1、单核细胞趋化蛋白-2、单核细胞趋化蛋白-3、单核细胞炎症蛋白-1α、单核细胞炎症蛋白-1β、RANTES、I309、R83915、R91733、HCC1、T58847、D31065、T64262、CD40、CD40配体、C-kit配体、胶原蛋白、群落刺激因子(CSF)、补体因子5a、补体抑制剂、补体受体1、细胞因子、DHFR、上皮中性粒细胞活化肽-78、GROα/MGSA、GROβ、GROγ、MIP-1α、MIP-1δ、MCP-1、表皮生长因子(EGF)、上皮中性粒细胞活化肽、脱落毒素、因子IX、因子VII、因子VIII、因子X、成纤维细胞生长因子(FGF)、纤维蛋白原、纤维粘连蛋白、G-CSF、GM-CSF、葡糖脑苷脂酶、促性腺激素、刺猬蛋白、血红蛋白、肝细胞生长因子(HGF)、水蛭素、人血清白蛋白、ICAM-1、ICAM-1受体、LFA-1、LFA-1受体、类胰岛素生长因子(IGF)、IGF-I、IGF-II、干扰素、IFN-α、IFN-β、IFN-γ、IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、角质细胞生长因子(KGF)、乳铁蛋白、白血病抑制因子、荧光素酶、神经营养因子、中性粒细胞抑制因子(NIF)、抑瘤素M、成骨蛋白、癌基因产物、甲状旁腺激素、PD-ECSF、PDGF、肽激素、多效生长因子、蛋白质A、蛋白质G、致热性外毒素A、B或C、松驰素、肾素、SCF、可溶性补体受体I、可溶性I-CAM 1、可溶性白细胞介素受体、可溶性TNF受体、生长调节素、生长抑素、生长激素、链激酶、超抗原、葡萄球菌肠毒素、SEA、SEB、SEC1、SEC2、SEC3、SED、SEE、类固醇激素受体、超氧化物歧化酶(SOD)、中毒性休克综合症毒素、胸腺肽α1、组织型纤溶酶原活化剂、肿瘤生长因子(TGF)、TGF-α、TGF-β、肿瘤坏死因子、肿瘤坏死因子α、肿瘤坏死因子β、肿瘤坏死因子受体(TNFR)、VLA-4蛋白、VCAM-1蛋白、血管内皮生长因子(VEGEF)、尿激酶、Mos、Ras、Raf、Met、p53、Tat、Fos、Myc、Jun、Myb、Rel、雌激素受体、孕酮受体、睾酮受体、醛固酮受体、LDL受体、SCF/c-Kit、CD40L/CD40、VLA-4/VCAM-1、ICAM-1/LFA-1、透明质酸/CD44和皮质酮。
38.一种用于产生包含至少一个非天然氨基酸的蛋白质的试剂盒,所述试剂盒包含:容
器,其含有SEQ ID NO:87或SEQ ID NO:88中所述的多聚核苷酸序列。
39.根据权利要求38所述的试剂盒,其中所述试剂盒另外包含至少一个非天然氨基酸。
40.根据权利要求38所述的试剂盒,其中所述试剂盒另外包含关于产生所述蛋白质的
说明材料。

说明书全文

用于脊椎动物细胞的杂合抑制tRNA

[0001] 分案说明
[0002] 本申请案是申请日为2007年9月7日,申请号为200780033108.9(国际申请号为PCT/US2007/019655),发明名称为“用于脊椎动物细胞的杂合抑制tRNA”专利申请的分案申请。

技术领域

[0003] 本发明涉及脊椎动物细胞中的翻译生物化学领域。本发明涉及在脊椎动物细胞中产生正交tRNA、正交合成酶和其对的方法以及正交tRNA、正交合成酶与其对的组合物。本发明还涉及非天然基酸组合物、包括非天然氨基酸的蛋白质以及在脊椎动物细胞中产生包括非天然氨基酸的蛋白质的方法。

背景技术

[0004] 从细菌到人类,每一种已知生物体的遗传密码都编码相同的二十种常见氨基酸。这二十种相同天然氨基酸的不同组合形成实质上进行生命的所有复杂过程(光合作用到信号转导和免疫反应)的蛋白质。为研究和修饰蛋白质的结构和功能,科学家们曾尝试操纵蛋白质的遗传密码和氨基酸序列。然而,难以去除由遗传密码所强加的将蛋白质局限于二十种基因编码的标准结构单元(其中极少见的特例为,硒代半胱氨酸(例如参看A.Bock等人,(1991),Molecular Microbiology 5:515-20)和吡咯赖氨酸(例如参看G.Srinivasan等人,(2002),Science 296:1459-62))的约束。
[0005] 已取得一些进展来去除这些约束,但这一进展受到限制并且合理控制蛋白质结构和功能的能仍不成熟。举例来说,化学家们已开发出合成和操纵小分子结构的方法和策略(例如参看E.J.Corey和X.-M.Cheng,The Logic of Chemical Synthesis(Wiley-Interscience,New York,1995))。全合成(例如参看B.Merrifield,(1986),Science 232:341-7(1986))和半合成方法(例如参看D.Y.Jackson等人,(1994)Science 266:243-7;以及P.E.Dawson和S.B.Kent,(2000),Annual Review of Biochemistry 69:923-60)使得合成肽和小蛋白质成为可能,但这些方法限制了超过10千道尔顿(kilo Dalton,kDa)的蛋白质的效用。诱变方法尽管有效,但也局限于有限数量的结构改变。在多种情况下,在整个蛋白质中竞争性并入常见氨基酸的极其接近的结构类似物已成为可能。例如参看R.Furter,(1998),Protein Science 7:419-26;K.Kirshenbaum等人,(2002),ChemBioChem 3:235-7;
和V.Doring等人,(2001),Science292:501-4。
[0006] 在尝试扩大操纵蛋白质结构和功能的能力的过程中,开发出使用经化学酰化的正交tRNA的活体外方法,其使得能在活体外响应无义密码子选择性并入非天然氨基酸(例如参看,J.A.Ellman等人,(1992),Science 255:197-200)。将具有新颖结构和物理特性的氨基酸选择性并入蛋白质中,来研究蛋白质折叠和稳定性以及生物分子识别和催化。例如参看,D.Mendel等人(1995),Annual Review of Biophysics and Biomolecular Structure24:435-462;和V.W.Cornish等人(1995年3月31日),Angewandte Chemie-International Edition in English 34:621-633。然而,这一方法的化学计量性质极大限制了能产生的蛋白质的量。
[0007] 已将非天然氨基酸显微注射到细胞中。举例来说,通过显微注射以化学方式错酰化的嗜热四膜虫(Tetrahymena thermophila)tRNA(例如,M.E.Saks等人(1996),An engineered Tetrahymena tRNAGln for in vivo incorporation of unnatural amino acids into proteins by nonsense suppression,J.Biol.Chem.271:23169-23175)和相关mRNA而将非天然氨基酸引入爪蟾卵母细胞(Xenopus oocyte)中的烟型乙酰胆碱受体中(例如,M.W.Nowak等人(1998),In vivo incorporation of unnatural amino acids into ion channels in Xenopus oocyte expression system,Method Enzymol.293:504-529)。这允许通过引入具有独特物理或化学特性的含侧链氨基酸来对卵母细胞中的受体进行详细生物物理研究。例如参看,D.A.Dougherty(2000),Unnatural amino acids as probes of protein structure and function,Curr.Opin.Chem.Biol.4:645-652。不幸的是,这种方法局限于细胞中可进行显微注射的蛋白质,并且由于相关tRNA是在活体外以化学方式酰化并且无法再酰化,故蛋白质的产率极低。
[0008] 为克服这些缺点,将新组件添加到原核生物大肠杆菌(Escherichia coli,E.coil)的蛋白质生物合成机器中(参看L.Wang等人,(2001),Science 292:498-500),这允许在活体内基因编码非天然氨基酸。已使用这种方法响应琥珀密码子TAG将多种具有新颖化学、物理或生物特性的新氨基酸有效且高保真地并入大肠杆菌的蛋白质中,所述新氨基酸包括光亲和标记和光致异构化氨基酸、基氨基酸和糖基化氨基酸。例如参看J.W.Chin等人,(2002),Journal of the American Chemical Society 124:9026-9027;J.W.Chin,&P.G.Schultz,(2002),Chem BioChem 11:1135-1137;J.W.Chin等人,(2002),PNAS United States of America 99:11020-11024;和L.Wang,&P.G.Schultz,(2002),Chem.Comm.,1-10。然而,原核生物和真核生物的翻译机器并不高度保守;因此,添加到大肠杆菌中的生物合成机器的组件通常无法用于将非天然氨基酸位点特异性并入脊椎动物细胞中的蛋白质中。举例来说,用于大肠杆菌中的詹氏甲烷球菌(Methanococcus jannaschii)酪氨酰-tRNA合成酶/tRNA对在脊椎动物细胞中并不正交。此外,真核生物而非原核生物中tRNA的转录是通过RNA聚合酶III进行,并且这会限制能在脊椎动物细胞中转录的tRNA结构基因的一级序列。而且,与原核生物细胞相比,脊椎动物细胞中的tRNA都是从转录tRNA的细胞核输出到细胞质,以进行翻译。最后,脊椎动物的80S核糖体与70S原核生物核糖体截然不同。因此,需要开发出经改进的生物合成机器组件以扩充脊椎动物遗传密码。如在仔细查看以下揭示内容后将显而易见,本发明满足这些要求和其它要求。

发明内容

[0009] 本发明对脊椎动物细胞提供翻译组件,例如正交氨酰基-tRNA合成酶(O-RS)与正交tRNA(O-tRNA)对和其个别组件,所述翻译组件可用于脊椎动物蛋白质生物合成机器中以将非天然氨基酸并入脊椎动物细胞中正在生长的多肽链中。
[0010] 本发明的组合物包括包含正交氨酰基-tRNA合成酶(O-RS)(例如,得自非脊椎动物生物体,诸如大肠杆菌、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)等)的脊椎动物细胞(例如,哺乳动物细胞、禽类细胞、鱼细胞、爬行动物细胞、两栖动物细胞、得自非哺乳动物的细胞等),其中O-RS优先在脊椎动物细胞中利用至少一个非天然氨基酸将正交tRNA(O-tRNA)氨酰化。可任选将指定脊椎动物细胞中的两个或两个以上OtRNA氨酰化。一方面,O-RS利用非天然氨基酸将O-tRNA氨酰化,这与具有(例如)如SEQ ID NO.:86或45中所述的氨基酸序列的O-RS例如至少40%、至少45%、至少50%、至少60%、至少75%、至少80%或者甚至90%或90%以上有效。在一个实施例中,本发明的O-RS利用非天然氨基酸将O-tRNA氨酰化,这比O-RS利用天然氨基酸将O-tRNA氨酰化有效例如至少10倍、至少20倍、至少30倍等。
[0011] 在一个实施例中,O-RS或其部分是由如SEQ ID NO.:3-35中任一序列所述的多聚核苷酸序列或其互补多聚核苷酸序列编码。在另一实施例中,O-RS包含如SEQ ID NO.:36-63和/或86中任一序列所述的氨基酸序列,或其保守变异体。在另一实施例中,O-RS包含例如与天然存在的酪氨酰基氨酰基-tRNA合成酶(TyrRS)的氨基酸序列至少90%、至少95%、至少98%、至少99%或至少99.5%或99.5%以上一致并且包含两个或两个以上来自A-E组的氨基酸的氨基酸序列。A组包括在与大肠杆菌TyrRS的Tyr37对应的位置的缬氨酸、异亮氨酸、亮氨酸、甘氨酸、丝氨酸、丙氨酸或苏氨酸。B组包括在与大肠杆菌TyrRS的Asn126对应的位置的天冬氨酸。C组包括在与大肠杆菌TyrRS的Asp182对应的位置的苏氨酸、丝氨酸、精氨酸、天冬酰胺或甘氨酸。D组包括在与大肠杆菌TyrRS的Phe183对应的位置的甲硫氨酸、丙氨酸、缬氨酸或酪氨酸;并且E组包括在与大肠杆菌TyrRS的Leu 186对应的位置的丝氨酸、甲硫氨酸、缬氨酸、半胱氨酸、苏氨酸或丙氨酸。
[0012] 在另一实施例中,O-RS具有一种或多种相比天然氨基酸改进或增强的针对非天然氨基酸的酶特性。举例来说,相比天然氨基酸,改进或增强的针对非天然氨基酸的特性包括例如较高Km、较低Km、较高kcat、较低kcat、较低kcat/km、较高kcat/km等。
[0013] 脊椎动物细胞还任选包括非天然氨基酸。脊椎动物细胞任选包括正交tRNA(O-tRNA)(例如,得自非脊椎动物生物体,诸如大肠杆菌、嗜热脂肪芽孢杆菌等),其中O-tRNA识别选择性密码子且优先通过O-RS利用非天然氨基酸氨酰化。一方面,O-tRNA例如以至少45%、至少50%、至少60%、至少75%、至少80%、至少90%、至少95%或99%的包含如SEQ ID NO.:65中所述的多聚核苷酸序列或在细胞中由如SEQ ID NO.:65中所述的多聚核苷酸序列加工的tRNA的效率,介导将非天然氨基酸并入蛋白质中。另一方面,O-tRNA包含SEQ ID NO.:65的序列,且O-RS包含选自SEQ ID NO.:36-63和/或86中任一序列中所述的氨基酸序列的多肽序列和/或其保守变异体。
[0014] 在另一实施例中,脊椎动物细胞包含包括编码所关注多肽的多聚核苷酸的核酸,其中所述多聚核苷酸包含由O-tRNA所识别的选择性密码子。一方面,包含非天然氨基酸的所关注多肽的产率例如为从多聚核苷酸缺乏选择性密码子的细胞中获得天然存在的所关注多肽的产率的至少2.5%、至少5%、至少10%、至少25%、至少30%、至少40%、50%或更多。另一方面,细胞在不存在非天然氨基酸的情况下以一定产率产生所关注多肽,所述产率例如为在存在非天然氨基酸的情况下多肽产率的不到35%、不到30%、不到20%、不到15%、不到10%、不到5%、不到2.5%等。
[0015] 本发明还提供一种脊椎动物细胞,其包含正交氨酰基-tRNA合成酶(O-RS)、正交tRNA(O-tRNA)、非天然氨基酸和包含编码所关注多肽的多聚核苷酸的核酸。所述多聚核苷酸包含由O-tRNA识别的选择性密码子。此外,在脊椎动物细胞中,O-RS优先利用非天然氨基酸将正交tRNA(O-tRNA)氨酰化,且所述细胞在不存在非天然氨基酸的情况下以一定产率产生所关注多肽,所述产率例如为在存在非天然氨基酸的情况下多肽产率的不到30%、不到20%、不到15%、不到10%、不到5%、不到2.5%等。
[0016] 包括包含正交tRNA(O-tRNA)的脊椎动物细胞的组合物也为本发明的特征。通常,O-tRNA介导在活体内将非天然氨基酸并入蛋白质中,所述蛋白质是由包含由O-tRNA识别的选择性密码子的多聚核苷酸编码。在一个实施例中,O-tRNA例如以至少45%、至少50%、至少60%、至少75%、至少80%、至少90%、至少95%或甚至99%或99%以上的包含如SEQ ID NO.:65中所述的多聚核苷酸序列或在细胞中由如SEQ ID NO.:65中所述的多聚核苷酸序列加工的tRNA的效率,介导将非天然氨基酸并入蛋白质中。在另一实施例中,O-tRNA包含如SEQ ID NO.:65中所述的多聚核苷酸序列或其保守变异体,或者是由如SEQ ID NO.:65中所述的多聚核苷酸序列或其保守变异体加工。在另一实施例中,O-tRNA包含可重复利用的O-tRNA。
[0017] 在本发明一方面中,O-tRNA经转录后修饰。本发明还提供一种在脊椎动物细胞中编码O-tRNA的核酸,或其互补多聚核苷酸。在一个实施例中,核酸包含A盒和B盒。
[0018] 本发明还涉及产生例如O-RS或O-tRNA/O-RS对等翻译组件的方法(和由这些方法产生的翻译组件)。举例来说,本发明提供产生正交氨酰基-tRNA合成酶(O-RS)的方法,所述O-RS在脊椎动物细胞中优先利用非天然氨基酸将正交tRNA氨酰化。所述方法包括例如(a)在存在非天然氨基酸的情况下,使第一物种的脊椎动物细胞群经历正选择,其中所述脊椎动物细胞各自包含:i)氨酰基-tRNA合成酶(RS)文库成员,ii)正交tRNA(O-tRNA),iii)编码正选择标记的多聚核苷酸,和iv)编码负选择标记的多聚核苷酸;其中在正选择下存活的细胞包含在存在非天然氨基酸的情况下将正交tRNA(O-tRNA)氨酰化的活性RS。使在正选择下存活的细胞在不存在非天然氨基酸的情况下经历负选择,以除去利用天然氨基酸将O-tRNA氨酰化的活性RS。这提供优先利用非天然氨基酸将O-tRNA氨酰化的O-RS。
[0019] 在某些实施例中,将编码正选择标记的多聚核苷酸可操作性连接到反应元件,并且所述细胞另外包含一种多聚核苷酸,其a)编码调节由反应元件进行的转录的转录调节蛋白(例如,脊椎动物转录调节蛋白等);且b)包含至少一个选择性密码子。通过利用非天然氨基酸氨酰化的O-tRNA将非天然氨基酸并入转录调节蛋白中,将会引起正选择标记的转录。在一个实施例中,转录调节蛋白为转录活化蛋白(例如GAL4等),且选择性密码子为琥珀终止密码子,例如其中所述琥珀终止密码子位于编码转录活化蛋白的DNA结合结构域的多聚核苷酸的一部分中,或实质上邻近编码转录活化蛋白的DNA结合结构域的多聚核苷酸的一部分。
[0020] 正选择标记可为多种分子中任一者。在一个实施例中,正选择标记包含供生长的营养补充并且所述选择是在缺乏所述营养补充的培养基上执行。在另一实施例中,编码正选择标记的多聚核苷酸例如为ura3、leu2、lys2、lacZ基因、his3(例如,其中his3基因编码咪唑甘油磷酸酯脱酶,通过提供3-氨基三唑(3-AT)检测)等。在另一实施例中,编码正选择标记的多聚核苷酸包含选择性密码子。
[0021] 与正选择标记相同,负选择标记也可为多种分子中的任一者。在某些实施例中,将编码负选择标记的多聚核苷酸可操作性连接到反应元件,转录调节蛋白通过所述反应元件介导转录。通过利用天然氨基酸氨酰化的O-tRNA将天然氨基酸并入转录调节蛋白中,将会引起负选择标记的转录。在一个实施例中,编码负选择标记的多聚核苷酸为例如ura3基因,且负选择是在包含5-氟乳清酸(5-FOA)的培养基上实现。在另一实施例中,用于负选择的培养基包含转化成通过负选择标记可检测的物质的选择或筛选剂。在本发明一方面中,可检测物质为有毒物质。在一个实施例中,编码负选择标记的多聚核苷酸包含选择性密码子。
[0022] 在某些实施例中,正选择标记和/或负选择标记包含在存在适当反应物的情况下发荧光或催化发光反应的多肽。在本发明一方面中,通过荧光活化细胞分选(fluorescence-activated cell sorting,FACS)或通过发光来检测正选择标记和/或负选择标记。在某些实施例中,正选择标记和/或负选择标记包含基于亲和力的筛选标记或转录调节蛋白。在一个实施例中,同一多聚核苷酸编码正选择标记和负选择标记。
[0023] 在一个实施例中,编码本发明的正选择标记和/或负选择标记的多聚核苷酸可包含至少两个选择性密码子,其各自或都可包含至少两个不同选择性密码子或至少两个相同选择性密码子。
[0024] 其它水平的选择/筛选严格度也可用于本发明方法中。在一个实施例中,所述方法可例如包含在步骤(a)、(b)或(a)和(b)中提供不同量的无活性合成酶,其中所述不同量的无活性合成酶提供另一水平的选择或筛选严格度。在一个实施例中,用于产生O-RS的方法的步骤(a)、(b)或步骤(a)和(b)包括改变例如正和/或负选择标记的选择或筛选严格度。所述方法任选包括使优先利用非天然氨基酸将O-tRNA氨酰化的O-RS经历另一回合选择,例如另一回合(数回合)正选择、另一回合(数回合)负选择或另一回合正和负选择的组合。
[0025] 在一个实施例中,选择/筛选包含一次或多次例如选自氨基酸渗透性改变、翻译效率改变、翻译保真度改变等的正或负选择/筛选。所述一种或多种改变是建立在一个或多个编码用于产生蛋白质的正交tRNA-tRNA合成酶对的组件的多聚核苷酸突变的基础上。
[0026] 通常,RS文库(例如,突变型RS文库)包含由例如来自非脊椎动物生物体的至少一种氨酰基-tRNA合成酶(RS)得到的RS。在一个实施例中,RS文库是从无活性RS得到,例如其中所述无活性RS是由使活性RS突变而产生。在另一实施例中,无活性RS包含氨基酸结合袋并且一个或多个包含所述结合袋的氨基酸经一个或多个不同氨基酸取代,例如所述经取代氨基酸经丙氨酸取代。
[0027] 在某些实施例中,产生O-RS的方法另外包括对编码RS的核酸执行随机突变、位点特异性突变、重组、嵌合构建或其任何组合,从而产生突变型RS文库。在某些实施例中,所述方法另外包括例如(c)分离出编码O-RS的核酸;(d)由所述核酸产生一组编码突变型O-RS的多聚核苷酸(例如,通过随机诱变、位点特异性诱变、嵌合构建、重组或其任何组合);和(e)重复步骤(a)和/或(b),直到获得优先利用非天然氨基酸将O-tRNA氨酰化的突变型O-RS。在本发明一方面中,将步骤(c)-(e)执行至少2次。
[0028] 产生O-tRNA/O-RS对的方法也为本发明的特征。在一个实施例中,如上文所述获得O-RS,且通过使第一物种的脊椎动物细胞群(其中所述脊椎动物细胞包含tRNA文库成员)经历负选择以除去包含经对于脊椎动物细胞为内源性的氨酰基-tRNA合成酶(RS)氨酰化的tRNA文库成员的细胞,来获得O-tRNA。这提供与第一物种的脊椎动物细胞正交的tRNA池。在本发明一方面中,tRNA文库包含由例如来自非脊椎动物生物体的至少一个tRNA得到的tRNA。在本发明另一方面中,氨酰基-tRNA合成酶(RS)文库包含由例如来自非脊椎动物生物体的至少一个氨酰基-tRNA合成酶(RS)得到的RS。在本发明另一方面中,tRNA文库包含由来自第一非脊椎动物生物体的至少一个tRNA得到的tRNA。氨酰基-tRNA合成酶(RS)文库任选包含由来自第二非脊椎动物生物体的至少一个氨酰基-tRNA合成酶(RS)得到的RS。在一个实施例中,第一与第二非脊椎动物生物体相同。或者,第一与第二非脊椎动物生物体可不同。由本发明方法产生的特定O-tRNA/O-RS对也为本发明的特征。
[0029] 本发明另一特征为用于在一种物种中产生翻译组件并将选择/筛选的翻译组件引入第二物种中的方法。举例来说,在第一物种(例如,脊椎动物物种,诸如酵母等)中产生O-tRNA/O-RS对的方法另外包括将编码O-tRNA的核酸和编码O-RS的核酸引入第二物种(例如,哺乳动物、昆虫、真菌、藻类、植物等)的脊椎动物细胞中。第二物种可使用引入的翻译组件在活体内例如在翻译期间将非天然氨基酸并入正在生长的多肽链中。
[0030] 在另一实例中,在脊椎动物细胞中产生优先利用非天然氨基酸将正交tRNA氨酰化的正交氨酰基-tRNA合成酶(O-RS)的方法包括:(a)在存在非天然氨基酸的情况下,使第一物种(例如,脊椎动物物种,诸如酵母等)的脊椎动物细胞群经历正选择。第一物种的脊椎动物细胞各自包含:i)氨酰基-tRNA合成酶(RS)文库成员,ii)正交tRNA(O-tRNA),iii)编码正选择标记的多聚核苷酸,和iv)编码负选择标记的多聚核苷酸。在正选择中存活的细胞包含在存在非天然氨基酸的情况下将正交tRNA(O-tRNA)氨酰化的活性RS。使在正选择下存活的细胞在不存在非天然氨基酸的情况下经历负选择,以除去利用天然氨基酸将O-tRNA氨酰化的活性RS,从而提供优先利用非天然氨基酸将O-tRNA氨酰化的O-RS。将编码O-tRNA的核酸和编码O-RS的核酸引入第二物种(例如,哺乳动物、昆虫、真菌、藻类、植物等)的脊椎动物细胞中。当在第二物种中翻译时,可使用这些组件将非天然氨基酸并入第二物种中的所关注蛋白质或多肽中。在一个实施例中,将O-tRNA和/或O-RS引入第二物种的脊椎动物细胞中。
[0031] 在某些实施例中,通过使第一物种的脊椎动物细胞群(其中所述脊椎动物细胞包含tRNA文库成员)经历负选择以除去包含经对于脊椎动物细胞为内源性的氨酰基-tRNA合成酶(RS)氨酰化的tRNA文库成员的细胞,来获得O-tRNA。这提供与第一物种和第二物种的脊椎动物细胞正交的tRNA池。
[0032] 具有至少一个非天然氨基酸的蛋白质(或所关注多肽)也为本发明的特征。在本发明某些实施例中,具有至少一个非天然氨基酸的蛋白质包括至少一个翻译后修饰。在一个实施例中,至少一个翻译后修饰包含通过[3+2]环加成将包含第二反应性基团的分子(例如,染料、例如聚乙二醇衍生物等聚合物、光交联剂、细胞毒性化合物、亲和标记、生物素衍生物、树脂、第二蛋白质或多肽、金属螯合剂、辅因子、脂肪酸水化合物、多聚核苷酸(例如,DNA、RNA等)等)与至少一个包含第一反应性基团的非天然氨基酸连接。举例来说,第一反应性基团为炔基部分(例如,在非天然氨基酸对-炔丙基基苯丙氨酸中)(这个基团有时也称为乙炔部分),且第二反应性基团为叠氮基部分。在另一实例中,第一反应性基团为叠氮基部分(例如,在非天然氨基酸对叠氮基-L-苯丙氨酸中)且第二反应性基团为炔基部分。在某些实施例中,本发明的蛋白质包括至少一个包含至少一个翻译后修饰的非天然氨基酸(例如,酮基非天然氨基酸),其中所述至少一个翻译后修饰包含糖部分。在某些实施例中,翻译后修饰是于脊椎动物细胞中在活体内进行。
[0033] 在某些实施例中,蛋白质包括至少一个在活体内由脊椎动物细胞所产生的翻译后修饰,其中所述翻译后修饰通常不是由原核细胞进行。翻译后修饰的实例包括(但不限于)乙酰化、酰化、脂质修饰、棕榈酰化、棕榈酸盐加成、磷酸化、糖脂连接修饰等。在一个实施例中,翻译后修饰包含通过GlcNAc-天冬酰胺键联将寡糖与天冬酰胺连接在一起(例如,寡糖包含(GlcNAc-Man)2-Man-GlcNAc-GlcNAc等的情形)。在另一实施例中,翻译后修饰包含通过GalNAc-丝氨酸、GalNAc-苏氨酸、GlcNAc-丝氨酸或GlcNAc-苏氨酸键联将寡糖(例如,Gal-GalNAc、Gal-GlcNAc等)与丝氨酸或苏氨酸连接在一起。在某些实施例中,本发明的蛋白质或多肽可包含分泌或定位序列、抗原决定基标签(epitope tag)、FLAG标签、聚组氨酸标签、GST融合体等。
[0034] 通常,蛋白质与任何可用蛋白质(例如,治疗性蛋白质、诊断性蛋白质、工业酶或其部分等)例如至少60%、至少70%、至少75%、至少80%、至少90%、至少95%或甚至至少99%或99%以上一致,且其包含一个或多个非天然氨基酸。在一个实施例中,本发明的组合物包括所关注蛋白质或多肽和赋形剂(例如,缓冲液、医药学上可接受的赋形剂等)。
[0035] 所关注蛋白质或多肽可含有至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个或者十个或十个以上非天然氨基酸。非天然氨基酸可相同或不同,例如可在蛋白质中1、2、3、4、5、6、7、8、9、10个或更多不同位点包含1、2、3、4、5、6、7、8、9、10个或更多不同非天然氨基酸。在某些实施例中,天然存在的蛋白质型式中所存在的至少一个(但少于全部)特定氨基酸经非天然氨基酸取代。
[0036] 蛋白质(或所关注多肽)的实例包括(但不限于)例如,细胞因子、生长因子、生长因子受体、干扰素、白细胞介素、炎症分子、癌基因产物、肽激素、信号转导分子、类固醇激素受体、促红细胞生成素(EPO)、胰岛素、人生长激素、α-1抗胰蛋白酶、血管抑素(Angiostatin)、抗溶血因子(Antihemolytic factor)、抗体、载脂蛋白、脱辅基蛋白、心房利钠因子、心房利钠多肽、心房肽、C-X-C趋化因子、T39765、NAP-2、ENA-78、Gro-a、Gro-b、Gro-c、IP-10、GCP-2、NAP-4、SDF-1、PF4、MIG、降素、c-kit配体、细胞因子、CC趋化因子、单核细胞趋化蛋白-
1、单核细胞趋化蛋白-2、单核细胞趋化蛋白-3、单核细胞炎症蛋白-1α、单核细胞炎症蛋白-
1β、RANTES、I309、R83915、R91733、HCC1、T58847、D31065、T64262、CD40、CD40配体、C-kit配体、胶原蛋白、群落刺激因子(CSF)、补体因子5a、补体抑制剂、补体受体1、细胞因子、DHFR、上皮中性粒细胞活化肽-78、GROα/MGSA、GROβ、GROγ、MIP-1α、MIP-1δ、MCP-1、表皮生长因子(EGF)、上皮中性粒细胞活化肽、促红细胞生成素(EPO)、脱落毒素、因子IX、因子VII、因子VIII、因子X、纤维细胞生长因子(FGF)、纤维蛋白原、纤维粘连蛋白、G-CSF、GM-CSF、葡糖脑苷脂酶、促性腺激素、生长因子、生长因子受体、刺猬蛋白(hedgehog protein)、血红蛋白、肝细胞生长因子(HGF)、水蛭素(hirudin)、人血清白蛋白、ICAM-1、ICAM-1受体、LFA-1、LFA-1受体、胰岛素、类胰岛素生长因子(IGF)、IGF-I、IGF-II、干扰素(IFN)、IFN-α、IFN-β、IFN-γ、白细胞介素、IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、质细胞生长因子(KGF)、乳蛋白、白血病抑制因子、荧光素酶、神经营养因子、中性粒细胞抑制因子(NIF)、抑瘤素M、成骨蛋白、癌基因产物、甲状旁腺激素、PD-ECSF、PDGF、肽激素、人生长激素、多效生长因子、蛋白质A、蛋白质G、致热性外毒素A、B或C、松驰素、肾素、SCF、可溶性补体受体I、可溶性I-CAM 1、可溶性白细胞介素受体、可溶性TNF受体、生长调节素、生长抑素、生长激素、链激酶、超抗原、葡萄球菌肠毒素、SEA、SEB、SEC1、SEC2、SEC3、SED、SEE、类固醇激素受体、超氧化物歧化酶(SOD)、中毒性休克综合症毒素、胸腺肽α1、组织型纤溶酶原活化剂、肿瘤生长因子(TGF)、TGF-α、TGF-β、肿瘤坏死因子、肿瘤坏死因子α、肿瘤坏死因子β、肿瘤坏死因子受体(TNFR)、VLA-4蛋白、VCAM-1蛋白、血管内皮生长因子(VEGEF)、尿激酶、Mos、Ras、Raf、Met、p53、Tat、Fos、Myc、Jun、Myb、Rel、雌激素受体、孕酮受体、睾酮受体、固酮受体、LDL受体、SCF/c-Kit、CD40L/CD40、VLA-4/VCAM-1、ICAM-1/LFA-
1、透明质酸(hyalurin)/CD44、皮质酮、存在于Genebank或其它可用数据库中的蛋白质等,和/或其部分。在一个实施例中,所关注多肽包括转录调节蛋白(例如,转录活化蛋白(诸如GAL4)或转录阻遏蛋白等)或其部分。
[0037] 本发明的脊椎动物细胞提供合成包含大量有用非天然氨基酸的蛋白质的能力。举例来说,可产生在细胞提取物、缓冲液、医药学上可接受的赋形剂等中浓度为例如至少10微克/升、至少50微克/升、至少75微克/升、至少100微克/升、至少200微克/升、至少250微克/升或至少500微克/升或更多蛋白质的包含非天然氨基酸的蛋白质。在某些实施例中,本发明的组合物包括例如至少10μg、至少50μg、至少75μg、至少100μg、至少200μg、至少250μg或至少500μg或更多包含非天然氨基酸的蛋白质。
[0038] 在某些实施例中,所关注蛋白质或多肽(或其部分)是由核酸编码。通常,核酸包含至少一个选择性密码子、至少两个选择性密码子、至少三个选择性密码子、至少四个选择性密码子、至少五个选择性密码子、至少六个选择性密码子、至少七个选择性密码子、至少八个选择性密码子、至少九个选择性密码子或甚至十个或十个以上选择性密码子。
[0039] 本发明还提供用于在脊椎动物细胞中产生至少一种包含至少一个非天然氨基酸的蛋白质的方法(以及由所述方法产生的蛋白质)。所述方法包括例如使包含包括至少一个选择性密码子且编码蛋白质的核酸的脊椎动物细胞在适当培养基中生长。脊椎动物细胞还包含正交tRNA(O-tRNA),其在细胞中起作用并且识别选择性密码子;和正交氨酰基tRNA合成酶(O-RS),其优先利用非天然氨基酸将O-tRNA氨酰化;并且所述培养基包含非天然氨基酸。在一个实施例中,O-RS利用非天然氨基酸将O-tRNA氨酰化,这与具有(例如)如SEQ ID NO.:86或45中所述序列的氨基酸序列的O-RS例如至少45%、至少50%、至少60%、至少75%、至少80%、至少90%、至少95%或者甚至99%或99%以上有效。在另一实施例中,O-tRNA包含SEQ ID NO.:64或65或者其互补多聚核苷酸序列;由SEQ ID NO.:64或65或者其互补多聚核苷酸序列加工;或由SEQ ID NO.:64或65或者其互补多聚核苷酸序列编码。在另一实施例中,O-RS包含如SEQ ID NO.:36-63和/或86中任一序列所述的氨基酸序列。
[0040] 在一个实施例中,所述方法另外包括将非天然氨基酸并入蛋白质中,其中所述非天然氨基酸包含第一反应性基团;和使所述蛋白质与包含第二反应性基团的分子(例如,染料、例如聚乙二醇衍生物等聚合物、光交联剂、细胞毒性化合物、亲和标记、生物素衍生物、树脂、第二蛋白质或多肽、金属螯合剂、辅因子、脂肪酸、碳水化合物、多聚核苷酸(例如,DNA、RNA等)等)接触。第一反应性基团与第二反应性基团反应以通过[3+2]环加成将所述分子与非天然氨基酸连接。在一个实施例中,第一反应性基团为炔基或叠氮基部分且第二反应性基团为叠氮基或炔基部分。举例来说,第一反应性基团为炔基部分(例如,在非天然氨基酸对炔丙基氧基苯丙氨酸中)且第二反应性基团为叠氮基部分。在另一实例中,第一反应性基团为叠氮基部分(例如,在非天然氨基酸对叠氮基-L-苯丙氨酸中)且第二反应性基团为炔基部分。
[0041] 在某些实施例中,所编码的蛋白质包含治疗性蛋白质、诊断性蛋白质、工业酶或其部分。在一个实施例中,由所述方法产生的蛋白质进一步通过非天然氨基酸来得以修饰。举例来说,例如通过亲核-亲电反应、[3+2]环加成等来修饰非天然氨基酸。在另一实施例中,在活体内通过至少一个翻译后修饰(例如,N-糖基化、O-糖基化、乙酰化、酰化、脂质修饰、棕榈酰化、棕榈酸盐加成、磷酸化、糖脂连接修饰等)来修饰由所述方法产生的蛋白质。
[0042] 还提供产生筛选或选择转录调节蛋白的方法(以及由所述方法产生的筛选或选择转录调节蛋白)。所述方法包括例如选择第一多聚核苷酸序列,其中所述多聚核苷酸序列编码核酸结合结构域;和使所述第一多聚核苷酸序列突变以包括至少一个选择性密码子。这将提供筛选或选择多聚核苷酸序列。所述方法还包括例如选择第二多聚核苷酸序列,其中所述第二多聚核苷酸序列编码转录活化结构域;提供包含可操作性连接到第二多聚核苷酸序列的筛选或选择多聚核苷酸序列的构建体;和将所述构建体、非天然氨基酸、正交tRNA合成酶(O-RS)和正交tRNA(O-tRNA)引入细胞中。利用这些组件,O-RS优先利用非天然氨基酸将O-tRNA氨酰化,且O-tRNA识别选择性密码子,并响应筛选或选择多聚核苷酸序列中的选择性密码子将非天然氨基酸并入核酸结合结构域中。这将提供筛选或选择转录调节蛋白。
[0043] 在某些实施例中,本发明的组合物和方法包括脊椎动物细胞。本发明的脊椎动物细胞包括例如哺乳动物细胞、酵母细胞、真菌细胞、植物细胞、昆虫细胞等中的任一种。本发明的翻译组件可得自多种生物体,例如非脊椎动物生物体,诸如原核生物体(例如,大肠杆菌、嗜热脂肪芽孢杆菌等)或古细菌;或例如脊椎动物生物体。
[0044] 本发明的选择性密码子将扩充脊椎动物蛋白质生物合成机器的遗传密码子框架。多个选择性密码子中的任一个可用于本发明中,包括终止密码子(例如,琥珀密码子、赭石密码子或蛋白石终止密码子)、无义密码子、稀有密码子、四(或更多)碱基密码子等。
[0045] 可用于本文所述的组合物和方法中的非天然氨基酸的实例包括(但不限于):对-乙酰基-L-苯丙氨酸;对-碘-L-苯丙氨酸;O-甲基-L-酪氨酸;对-炔丙基氧基苯丙氨酸;对-炔丙基-苯丙氨酸;L-3-(2-基)丙氨酸;3-甲基-苯丙氨酸;O-4-烯丙基-L-酪氨酸;4-丙基-L-酪氨酸;三-O-乙酰基-GlcNAcβ-丝氨酸;L-多巴(L-Dopa);氟化苯丙氨酸;异丙基-L-苯丙氨酸;对-叠氮基-L-苯丙氨酸;对-酰基-L-苯丙氨酸;对-苯甲酰基-L-苯丙氨酸;L-磷酸丝氨酸;膦酸丝氨酸;膦酸酪氨酸;对-溴苯丙氨酸;对-氨基-L-苯丙氨酸;异丙基-L-苯丙氨酸;酪氨酸氨基酸的非天然类似物;谷氨酰胺氨基酸的非天然类似物;苯丙氨酸氨基酸的非天然类似物;丝氨酸氨基酸的非天然类似物;苏氨酸氨基酸的非天然类似物;烷基、芳基、酰基、叠氮基、氰基、卤基、肼、酰肼、羟基、烯基、炔基、醚、硫醇、磺酰基、硒基、酯、硫代酸、酸酯基(borate)、硼酸酯基(boronate)、磷酸基、膦酸基、膦、杂环、烯酮、亚胺、醛、羟胺、酮基或氨基取代的氨基酸,或其任何组合;具有可光活化交联剂的氨基酸;自旋标记的氨基酸;发荧光氨基酸;结合金属的氨基酸;含金属氨基酸;放射性氨基酸;光笼蔽(photocaged)和/或光致异构化氨基酸;含生物素或生物素类似物氨基酸;含酮基氨基酸;包含聚乙二醇或聚醚的氨基酸;重原子取代的氨基酸;化学可裂解或可光裂解氨基酸;具有伸长侧链的氨基酸;含有毒基团的氨基酸;糖取代的氨基酸;含碳连接的糖的氨基酸;具有氧化还原活性的氨基酸;含α-羟基的酸;氨基硫代酸;α,α双取代氨基酸;β-氨基酸;除脯氨酸或组氨酸外的环状氨基酸;除苯丙氨酸、酪氨酸或色氨酸外的芳香族氨基酸等。
[0046] 本发明还提供多肽(O-RS)和多聚核苷酸,例如O-tRNA、编码O-RS或其部分(例如,合成酶活性位点)的多聚核苷酸、用于构建氨酰基-tRNA合成酶突变体的寡聚核苷酸、编码所关注蛋白质或多肽的包含一个或多个选择性密码子的多聚核苷酸等。举例来说,本发明的多肽包括:包含如SEQ ID NO.:36-63和/或86中任一序列中所述的氨基酸序列的多肽;包含由如SEQ ID NO.:3-35中任一序列所述的多聚核苷酸序列编码的氨基酸序列的多肽;以及与对包含如SEQ ID NO.:36-63和/或86中任一序列中所示的氨基酸序列的多肽具特异性的抗体特异性免疫反应的多肽;或包含由如SEQ ID NO.:3-35中任一序列所示的多聚核苷酸序列编码的氨基酸序列的多肽。
[0047] 本发明的多肽中还包括包含与天然存在的酪氨酰基氨酰基-tRNA合成酶(TyrRS)的氨基酸序列(例如,SEQ ID NO.:2)至少90%一致的氨基酸序列且包含两个或两个以上A-E组(上文所述)氨基酸的多肽。类似地,本发明的多肽还任选包括包含SEQ ID NO.:36-63和/或86中任一序列的至少20个相邻氨基酸以及两个或两个以上如上文在A-E组中所述的氨基酸取代的多肽。还包括包含任一上述多肽的保守变异体的氨基酸序列作为本发明的多肽。
[0048] 在一个实施例中,组合物包括本发明的多肽和赋形剂(例如,缓冲液、水、医药学上可接受的赋形剂等)。本发明还提供与本发明的多肽特异性免疫反应的抗体或抗血清。
[0049] 本发明中还提供多聚核苷酸。本发明的多聚核苷酸包括具有一个或多个选择性密码子的编码本发明的所关注蛋白质或多肽的多聚核苷酸。此外,本发明的多聚核苷酸包括例如:包含如SEQ ID NO.:3-35、64-85中任一序列所述的核苷酸序列的多聚核苷酸;与其多聚核苷酸序列互补或编码其多聚核苷酸序列的多聚核苷酸;和/或编码包含如SEQ ID NO.:36-63和/或86中任一序列中所述的氨基酸序列的多肽的多聚核苷酸,或其保守变异体。本发明的多聚核苷酸还包括编码本发明的多肽的多聚核苷酸。类似地,在高度严格条件下在实质上整个核酸长度上与上文所述的多聚核苷酸杂交的核酸为本发明的多聚核苷酸。
[0050] 本发明的多聚核苷酸还包括编码多肽的多聚核苷酸,所述多肽包含与天然存在的酪氨酰基氨酰基-tRNA合成酶(TyrRS)的氨基酸序列(例如,SEQ ID NO.:2)至少90%一致的氨基酸序列且包含两个或两个以上如上文在A-E组(上文指出)中所述的突变。本发明的多聚核苷酸中还包括与上文所述的多聚核苷酸至少70%(或至少75%、至少80%、至少85%、至少90%、至少95%、至少98%或至少99%或更多)一致的多聚核苷酸,和/或包含任一上文所述的多聚核苷酸的保守变异体的多聚核苷酸。
[0051] 在某些实施例中,载体(例如,质粒、柯斯质粒(cosmid)、噬菌体、病毒等)包含本发明的多聚核苷酸。在一个实施例中,载体为表达载体。在另一实施例中,表达载体包括可操作性连接到一个或多个本发明的多聚核苷酸的启动子。在另一实施例中,细胞包含包括本发明的多聚核苷酸的载体。
[0052] 另一方面,本发明提供化合物的组合物和制造所述化合物的方法。举例来说,化合物包括例如非天然氨基酸(诸如对-(炔丙基氧基)-苯丙氨酸(例如,图11中的1));叠氮基染料(诸如化学结构4和化学结构6中所示);炔基聚乙二醇(例如,如化学结构7中所示),其中n为介于例如50与10,000之间、75与5,000之间、100与2,000之间、100与1,000之间等的整数等。在本发明的实施例中,炔基聚乙二醇具有例如约5,000到约100,000Da、约20,000到约50,000Da、约20,000到约10,000Da(例如,20,000Da)的分子量。
[0053] 还提供包含这些化合物,例如具有蛋白质和细胞的各种组合物。一方面,包括对-(炔丙基氧基)-苯丙氨酸非天然氨基酸的组合物进一步包括正交tRNA。可将非天然氨基酸与正交tRNA键接(例如共价键接),例如通过氨酰基键与正交tRNA共价键接、与正交tRNA的末端核糖的3'OH或2'OH共价键接。
[0054] 试剂盒也为本发明的特征。举例来说,提供在细胞中产生包含至少一个非天然氨基酸的蛋白质的试剂盒,其中所述试剂盒包括含有编码O-tRNA的多聚核苷酸序列或O-tRNA以及编码O-RS的多聚核苷酸序列或O-RS的容器。在一个实施例中,试剂盒另外包括至少一个非天然氨基酸。在另一实施例中,试剂盒另外包含用于产生蛋白质的说明材料。附图说明
[0055] 图1绘示使用杂合tRNA使hGH的表达增加。

具体实施方式

[0056] 在详细描述本发明之前,应了解,本发明不限于特定装置或生物系统,其当然可以变化。还应了解,本文所使用的术语只是出于描述特定实施例的目的,并且不打算限制本发明。除非内容另作明确指示,否则如本说明书和随附权利要求中所使用,单数形式“一”和“所述”包括多个参考物。因此,例如提及“一细胞”包括两个或两个以上细胞的组合;提及“细菌”包括细菌混合物等。
[0057] 除非本文或下文说明书的剩余部分中另作定义,否则本文所使用的所有科技术语都具有与本发明所属领域技术人员通常所了解相同的含义。
[0058] 同源:当蛋白质和/或蛋白质序列是天然或以人工方式从共同的祖先蛋白质或蛋白质序列得到时,其为“同源”的。类似地,当核酸和/或核酸序列是天然或以人工方式从共同的祖先核酸或核酸序列得到时,其为同源的。举例来说,可通过任何可用的诱变方法来修饰任何天然存在的核酸以使其包括一个或多个选择性密码子。当表达时,这一经诱变核酸将编码包含一个或多个非天然氨基酸的多肽。当然,突变方法可另外改变一个或多个标准密码子,从而也使所得突变蛋白质中的一个或多个标准氨基酸改变。同源性一般是从两种或两种以上核酸或蛋白质(或其序列)之间的序列相似性推断得出。可用于确定同源性的序列之间相似性的确切百分比随所讨论的核酸和蛋白质而变化,但通常使用仅25%的序列相似性来确定同源性。较高的序列相似性水平(例如,30%、40%、50%、60%、70%、80%、90%、95%或99%或更多)也可用于确定同源性。测定序列相似性百分比的方法(例如,使用默认参数的BLASTP和BLASTN)在本文中得以描述并且一般可用。
[0059] 正交:如本文所使用,术语“正交”是指与对于细胞或翻译系统为内源的相应分子相比,以降低的效率利用细胞的内源性组件起作用,或者无法利用细胞的内源性组件起作用的分子(例如,正交tRNA(O-tRNA)和/或正交氨酰基tRNA合成酶(O-RS))。在tRNA和氨酰基-tRNA合成酶的情况下,正交是指与利用内源性tRNA合成酶起作用的内源性tRNA相比,正交tRNA无法利用内源性tRNA合成酶起作用或以降低的效率(例如,低于20%的效率、低于10%的效率、低于5%的效率或低于1%的效率)利用内源性tRNA合成酶起作用;或者与利用内源性tRNA起作用的内源性tRNA合成酶相比,正交氨酰基-tRNA合成酶无法利用内源性tRNA起作用或以降低的效率(例如,低于20%的效率、低于10%的效率、低于5%的效率或低于1%的效率)利用内源性tRNA起作用。正交分子在细胞中缺乏功能性内源互补分子。举例来说,当与通过内源性RS将内源性tRNA氨酰化相比较时,细胞中的任何内源性RS以降低的效率或甚至为零的效率将所述细胞中的正交tRNA氨酰化。在另一实例中,当与通过内源性RS将内源性tRNA氨酰化相比较时,正交RS以降低的效率或甚至为零的效率将所关注细胞中的任何内源性tRNA氨酰化。可将第二正交分子引入细胞中从而与第一正交分子一起作用。
举例来说,正交tRNA/RS对包括所引入的在细胞中相对于相应内源性tRNA/RS对以一定效率(例如,50%效率、60%效率、70%效率、75%效率、80%效率、90%效率、95%效率或99%或更高效率)一起作用的互补组件。
[0060] 互补:术语“互补”是指可一起作用的正交对O-tRNA与O-RS的组件,例如其中O-RS将O-tRNA氨酰化。
[0061] 优先氨酰化:术语“优先氨酰化”是指与O-RS将天然存在的tRNA或用于产生O-tRNA的原材料氨酰化相比,O-RS利用非天然氨基酸将O-tRNA氨酰化的效率,例如70%效率、75%效率、85%效率、90%效率、95%效率或99%或更高效率。将非天然氨基酸以高保真度,例如以对指定选择性密码子高于75%的效率、对指定选择性密码子高于约80%的效率、对指定选择性密码子高于约90%的效率、对指定选择性密码子高于约95%的效率或对指定选择性密码子高于约99%或更高效率并入正在生长的多肽链中。
[0062] 选择性密码子:术语“选择性密码子”是指在翻译过程中由O-tRNA识别且不被内源性tRNA识别的密码子。O-tRNA反密码子环识别mRNA上的选择性密码子并且在多肽中的这一位点并入其氨基酸,例如非天然氨基酸。选择性密码子可例如包括无义密码子,诸如终止密码子,例如琥珀密码子、赭石密码子和蛋白石密码子;四个或四个以上碱基的密码子;稀有密码子;从天然或非天然碱基对获得的密码子等。
[0063] 抑制性tRNA:抑制性tRNA是(例如)通过提供响应选择性密码子将氨基酸并入多肽链的机制来改变指定翻译系统中信使RNA(mRNA)的阅读的tRNA。举例来说,抑制性tRNA可通读例如终止密码子、四碱基密码子或稀有密码子等。
[0064] 可重复利用tRNA:术语“可重复利用tRNA”是指在翻译期间经氨酰化且可利用氨基酸(例如非天然氨基酸)反复地再氨酰化以将所述氨基酸(例如非天然氨基酸)并入一个或多个多肽链中的tRNA。
[0065] 翻译系统:术语“翻译系统”是指将天然存在的氨基酸并入正在生长的多肽链(蛋白质)的组件集合。翻译系统的组件可包括例如核糖体、tRNA、合成酶、mRNA、氨基酸等。本发明的组件(例如,ORS、OtRNA、非天然氨基酸等)可添加到活体外或活体内翻译系统中,例如脊椎动物细胞,例如酵母细胞、哺乳动物细胞、植物细胞、藻类细胞、真菌细胞、昆虫细胞等。
[0066] 非天然氨基酸:如本文所使用,术语“非天然氨基酸”是指不为20种常见的天然存在的氨基酸中的一种或者硒代半胱氨酸或吡咯赖氨酸的任何氨基酸、经修饰氨基酸和/或氨基酸类似物。
[0067] 得自:如本文所使用,术语“得自”是指从特定分子或生物体分离或者使用来自特定分子或生物体的信息制得的组件。
[0068] 无活性RS:如本文所使用,术语“无活性RS”是指已突变以致其无法再利用氨基酸将其天然同源tRNA氨酰化的合成酶。
[0069] 正选择或筛选标记:如本文所使用,术语“正选择或筛选标记”是指当存在(例如,经表达、经活化等)时导致将具有正选择标记的细胞从不具有正选择标记的细胞中鉴别出的标记。
[0070] 负选择或筛选标记:如本文所使用,术语“负选择或筛选标记”是指当存在(例如,经表达、经活化等)时使得鉴别出不具有所需特性(例如,当与具有所需特性的细胞相比较时)的细胞的标记。
[0071] 报告基因:如本文所使用,术语“报告基因”是指可用于选择所关注系统中的靶组件的组件。举例来说,报告基因可包括荧光筛选标记(例如,绿色荧光蛋白质);发光标记(例如,萤火虫荧光素酶蛋白);基于亲和力的筛选标记;或可选择标记基因,诸如his3、ura3、leu2、lys2、lacZ、β-gal/lacZ(β-半乳糖苷酶)、Adh(醇脱氢酶)等。
[0072] 脊椎动物:如本文所使用,术语“脊椎动物”是指属于系统发生域真核生物的生物体,诸如动物,例如哺乳动物、爬行动物、类等。
[0073] 非真核生物:如本文所使用,术语“非真核生物”是指非脊椎动物生物体。举例来说,非脊椎动物生物体可属于真细菌(例如,大肠杆菌(Escherichia coli)、极端嗜热细菌(Thermus thermophilics)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)等)系统发生域;或古细菌(例如,詹氏甲烷球菌(Methanococcus jannaschii)、嗜热自养甲烷杆菌(Methanobacterium thermoautotrophicum)、诸如沃氏嗜盐富饶菌(Haloferax volcanii)和嗜盐菌属NRC-1(Halobacterium species NRC-1)的嗜盐菌(Halobacterium)、超嗜热古菌(Archaeoglobus fulgidus)、强烈嗜热球菌(Pyrococcus furiosus)、极端嗜热古菌(Pyrococcus horikoshii)、嗜热泉生古细菌(Aeuropyrum pernix)等)系统发生域。
[0074] 抗体:如本文所使用,术语“抗体”包括(但不限于)实质上由一个或多个特异性结合并识别分析物(抗原)的免疫球蛋白基因或其片段所编码的多肽。实例包括多克隆抗体、单克隆抗体、嵌合抗体和单链抗体等。如本文所使用的术语“抗体”中也包括免疫球蛋白的片段,包括Fab片段和由表达文库(包括噬菌体呈现)所产生的片段。有关抗体结构和技术例如参看Paul,Fundamental Immunology,第4版,1999,Raven Press,New York。
[0075] 保守变异体:术语“保守变异体”是指在功能上与得到保守变异体的组件(例如O-tRNA或O-RS)类似但序列变异的翻译组件,例如保守变异体O-tRNA或保守变异体O-RS。举例来说,O-RS将利用非天然氨基酸将互补O-tRNA或保守变异体O-tRNA氨酰化,但所述O-tRNA和所述保守变异体O-tRNA不具有相同序列。保守变异体的序列可具有例如一处变异、两处变异、三处变异、四处变异或者五处或五处以上变异,只要保守变异体与相应O-tRNA或O-RS互补即可。
[0076] 选择或筛选剂:如本文所使用,术语“选择或筛选剂”是指当存在时允许从群体中选择/筛选某些组件的试剂。举例来说,选择或筛选剂例如包括(但不限于)养分、抗生素、光波长、抗体、经表达多聚核苷酸(例如,转录调节蛋白)等。可例如通过浓度、强度等来改变选择剂。
[0077] 可检测物质:如本文所使用,术语“可检测物质”是指当经活化、改变、表达等时允许从群体中选择/筛选出某些组分的试剂。举例来说,可检测物质可为化学剂,例如5-氟乳清酸(5-FOA),其在某些条件下,例如表达URA3报告基因时,变为例如杀死表达URA3报告基因的细胞的可检测的有毒产物。
[0078] 除由遗传密码所强加的化学约束外,直接在脊椎动物细胞中基因修饰蛋白质结构的能力将提供探查和操纵细胞过程的有力的分子工具。本发明提供扩充脊椎动物细胞中基因编码的氨基酸数量的翻译组件。其包括tRNA(例如,正交tRNA(O-tRNA))、氨酰基-tRNA合成酶(例如,正交合成酶(O-RS))、O-tRNA/O-RS对和非天然氨基酸。
[0079] 通常,有效地表达和加工本发明的O-tRNA且其在脊椎动物细胞中的翻译过程中起作用,但不会被宿主的氨酰基-tRNA合成酶有效氨酰化。在mRNA翻译期间,本发明的O-tRNA响应选择性密码子将不编码常见20种氨基酸中的任一种的非天然氨基酸递送到正在生长的多肽链中。
[0080] 本发明的O-RS在脊椎动物细胞中优先利用非天然氨基酸将本发明的O-tRNA氨酰化,但不会将任何细胞质中宿主的tRNA氨酰化。此外,本发明的氨酰基-tRNA合成酶的特异性使得能接受非天然氨基酸,同时排除任何内源性氨基酸。包括例如O-RS的氨基酸序列的多肽或其部分也为本发明的特征。此外,编码翻译组件O-tRNA、O-RS和其部分的多聚核苷酸为本发明的特征。
[0081] 本发明还提供产生所需翻译组件(例如)O-RS和或正交对(正交tRNA和正交氨酰基-tRNA合成酶)的方法,所述正交对利用非天然氨基酸用于脊椎动物细胞中,(和由所述方法产生的翻译组件)。举例来说,来自大肠杆菌的酪氨酰-tRNA合成酶/tRNACUA对为本发明的O-tRNA/O-RS对。此外,本发明还提供在一种脊椎动物细胞中选择/筛选翻译组件并且当选择/筛选后将这些组件用于不同脊椎动物细胞(未用于选择/筛选的脊椎动物细胞)中的方法。举例来说,可在酵母(例如酿酒酵母(Saccharomyces cerevisiae))中进行产生用于脊椎动物细胞的翻译组件的选择/筛选方法,且随后可将这些所选组件用于另一脊椎动物细胞中,例如另一酵母细胞、哺乳动物细胞、昆虫细胞、植物细胞、真菌细胞等。
[0082] 本发明进一步提供在脊椎动物细胞中产生蛋白质的方法,其中所述蛋白质包含非天然氨基酸。所述蛋白质是使用本发明的翻译组件产生。本发明还提供包括非天然氨基酸的蛋白质(和由本发明的方法产生的蛋白质)。所关注蛋白质或多肽还可包括翻译后修饰,其例如是通过[3+2]环加成或亲核-亲电反应添加,并非由原核细胞所产生等。在某些实施例中,利用非天然氨基酸产生转录调节蛋白的方法(和由所述方法产生的蛋白质)也都包括在本发明中。包括包含非天然氨基酸的蛋白质的组合物也为本发明的特征。
[0083] 用于产生具有非天然氨基酸的蛋白质或多肽的试剂盒也为本发明的特征。
[0084] 正交氨酰基-TRNA合成酶(O-RS)
[0085] 为了将非天然氨基酸特异性并入脊椎动物细胞中的所关注蛋白质或多肽中,将改变合成酶的底物特异性,以致仅将所需非天然氨基酸而非常见20种氨基酸中任一种装入tRNA中。如果正交合成酶混杂,那么其将产生在靶位置具有天然与非天然氨基酸的混合物的突变蛋白质。本发明提供对特定非天然氨基酸具有经修饰的底物特异性的正交氨酰基-tRNA合成酶的组合物以及产生所述合成酶的方法。
[0086] 包括正交氨酰基-tRNA合成酶(O-RS)的脊椎动物细胞为本发明的特征。O-RS在脊椎动物细胞中优先利用非天然氨基酸将正交tRNA(O-tRNA)氨酰化。在某些实施例中,O-RS利用一个以上非天然氨基酸,例如两个或两个以上、三个或三个以上等。因此,本发明的O-RS可具有优先利用不同非天然氨基酸将O-tRNA氨酰化的能力。这允许通过选择将何种非天然氨基酸或非天然氨基酸组合放于细胞中和/或通过选择不同量的放于细胞中的非天然氨基酸以供其并入来达到另一层面的控制。
[0087] 本发明的O-RS任选具有一种或多种相比天然氨基酸改进或增强的针对非天然氨基酸的酶特性。这些特性包括例如与天然存在的氨基酸(例如,20种已知常见氨基酸中的一种)相比较,针对非天然氨基酸的较高Km、较低Km、较高kcat、较低kcat、较低kcat/km、较高kcat/km等。
[0088] 可任选通过包括O-RS的多肽和/或编码O-RS或其部分的多聚核苷酸将O-RS提供到脊椎动物细胞中。举例来说,O-RS或其部分是由如SEQ ID NO.:3-35中任一序列所述的多聚核苷酸序列或其互补多聚核苷酸序列编码。在另一实例中,O-RS包含如SEQ ID NO.:36-63和/或86中任一序列所述的氨基酸序列,或其保守变异体。关于例示性O-RS分子的序列,例如参看本文中表5、6和8以及实例6。
[0089] O-RS还可包含与天然存在的酪氨酰基氨酰基-tRNA合成酶(TyrRS)的氨基酸序列(例如,如SEQ ID NO.:2中所述)例如至少90%、至少95%、至少98%、至少99%或甚至至少99.5%一致且包含两个或两个以上A-E组的氨基酸的氨基酸序列。A组包括在与大肠杆菌TyrRS的Tyr37对应的位置的缬氨酸、异亮氨酸、亮氨酸、甘氨酸、丝氨酸、丙氨酸或苏氨酸;B组包括在与大肠杆菌TyrRS的Asn126对应的位置的天冬氨酸;C组包括在与大肠杆菌TyrRS的Asp 182对应的位置的苏氨酸、丝氨酸、精氨酸、天冬酰胺或甘氨酸;D组包括在与大肠杆菌TyrRS的Phe183对应的位置的甲硫氨酸、丙氨酸、缬氨酸或酪氨酸;且E组包括在与大肠杆菌TyrRS的Leu186对应的位置的丝氨酸、甲硫氨酸、缬氨酸、半胱氨酸、苏氨酸或丙氨酸。
[0090] 除O-RS外,本发明的脊椎动物细胞还可包括其它组件,例如非天然氨基酸。脊椎动物细胞还包括正交tRNA(O-tRNA)(例如,得自非脊椎动物生物体,诸如大肠杆菌、嗜热脂肪芽孢杆菌等),其中O-tRNA识别选择性密码子且优先通过O-RS利用非天然氨基酸氨酰化。所述细胞中还可存在包含编码所关注多肽的多聚核苷酸的核酸,其中所述多聚核苷酸包含由O-tRNA识别的选择性密码子或者一个或多个所述密码子的组合。
[0091] 一方面,O-tRNA例如以至少45%、至少50%、至少60%、至少75%、至少80%、至少90%、至少95%或99%的包含如SEQ ID NO.:65中所述的多聚核苷酸序列或由如SEQ ID NO.:65中所述的多聚核苷酸序列加工的tRNA的效率,介导将非天然氨基酸并入蛋白质中。
另一方面,O-tRNA包含SEQ ID NO.:65,且O-RS包含SEQ ID NO.:36-63和/或86中任一序列中所述的多肽序列和/或其保守变异体。关于例示性O-RS和O-tRNA分子的序列,也例如参看本文中表5和实例6。
[0092] 在一个实例中,脊椎动物细胞包含正交氨酰基-tRNA合成酶(O-RS)、正交tRNA(O-tRNA)、非天然氨基酸和包含编码所关注多肽的多聚核苷酸的核酸,所述多聚核苷酸包含由O-tRNA识别的选择性密码子。在脊椎动物细胞中,O-RS优先利用非天然氨基酸将正交tRNA(O-tRNA)氨酰化,且所述细胞在不存在非天然氨基酸的情况下以一定产率产生所关注多肽,所述产率例如为在存在非天然氨基酸的情况下多肽产率的不到30%、不到20%、不到15%、不到10%、不到5%、不到2.5%等。
[0093] 用于产生O-RS的方法(其为本发明的特征)任选包括:由野生型合成酶框架产生突变合成酶池,且随后根据相对于常见20种氨基酸,针对非天然氨基酸的特异性选择突变RS。为分离出所述合成酶,其选择方法:(i)敏感,因为由最初几回合得到的所需合成酶的活性较低且群体较小;(ii“) 可调”,因为需要以不同选择回合改变选择严格度;和(iii)通用,以致所述方法可用于不同非天然氨基酸。
[0094] 在脊椎动物细胞中产生优先利用非天然氨基酸将正交tRNA氨酰化的正交氨酰基-tRNA合成酶(O-RS)的方法通常包括应用正选择随后负选择的组合。在正选择过程中,抑制正标记非必需位置处所引入的选择性密码子将使脊椎动物细胞能在正选择压力下存活。因此,在存在非天然氨基酸的情况下,存活细胞编码将非天然氨基酸装于正交抑制tRNA的活性合成酶。在负选择的过程中,抑制负标记非必需位置处所引入的选择性密码子将去除具有天然氨基酸特异性的合成酶。负选择和正选择的存活细胞编码只能(或至少优先)利用非天然氨基酸将正交抑制tRNA氨酰化(装入)的合成酶。
[0095] 举例来说,所述方法包括:(a)在存在非天然氨基酸的情况下,使第一物种的脊椎动物细胞群经历正选择,其中所述脊椎动物细胞各自包含:i)氨酰基-tRNA合成酶(RS)文库成员,ii)正交tRNA(O-tRNA),iii)编码正选择标记的多聚核苷酸和iv)编码负选择标记的多聚核苷酸;其中在正选择下存活的细胞包含在存在非天然氨基酸的情况下将正交tRNA(O-tRNA)氨酰化的活性RS;和(b)在不存在非天然氨基酸的情况下,使在正选择下存活的细胞经历负选择,以除去利用天然氨基酸将O-tRNA氨酰化的活性RS,从而提供优先利用非天然氨基酸将O-tRNA氨酰化的O-RS。
[0096] 正选择标记可为多种分子中任一个。在一个实施例中,正选择标记为提供营养补充以供生长的产物,并且所述选择是在缺乏所述营养补充的培养基上执行。编码正选择标记的多聚核苷酸的实例包括(但不限于)例如基于补充细胞的氨基酸营养缺陷的报告基因、his3基因(例如,其中所述his3基因编码咪唑甘油磷酸酯脱水酶,通过提供3-氨基三唑(3-AT)检测)、ura3基因、leu2基因、lys2基因、lacZ基因、adh基因等。例如参看G.M.Kishore,&D.M.Shah,(1988),Amino acid biosynthesis inhibitors as herbicides,Annual Review of Biochemistry 57:627-663。在一个实施例中,通过邻-硝基苯基-β-D-半乳糖吡喃糖苷(ONPG)水解检测lacZ产生。例如参看I.G.Serebriiskii,&E.A.Golemis,(2000),Uses oflacZ to study gene function:evaluation of beta-galactosidase assays employed in the yeast two-hybrid system,Analytical Biochemistry 285:1-15。其它正选择标记包括例如荧光素酶、绿色荧光蛋白质(GFP)、YFP、EGFP、RFP、抗生素抗性基因的产物(例如,氯霉素乙酰转移酶(CAT))、转录调节蛋白(例如GAL4)等。编码正选择标记的多聚核苷酸任选包含选择性密码子。
[0097] 可将编码正选择标记的多聚核苷酸可操作性连接到反应元件。还可存在另一多聚核苷酸,其编码调节由反应元件进行的转录的转录调节蛋白且包含至少一个选择性密码子。通过经非天然氨基酸氨酰化的O-tRNA将非天然氨基酸并入转录调节蛋白中,将引起编码正选择标记的多聚核苷酸(例如报告基因)的转录。选择性密码子任选位于编码转录调节蛋白的DNA结合结构域的多聚核苷酸的一部分中或实质上邻近编码转录调节蛋白的DNA结合结构域的多聚核苷酸的一部分。
[0098] 还可将编码负选择标记的多聚核苷酸可操作性连接到反应元件,转录调节蛋白将通过所述反应元件介导转录。例如参看A.J.DeMaggio等人,(2000),The yeast split-hybrid system,Method Enzymol.328:128-137;H.M.Shih等人,(1996),A positive genetic selection for disrupting protein-protein interactions:identification of CREB mutations that prevent association with the coactivator CBP,Proc.Natl.Acad.Sci.U.S.A.93:13896-13901;M.Vidal等人,(1996),Genetic 
characterization of a mammalian protein-protein interaction domain by using a yeast reverse two-hybrid system.[comment],Proc.Natl.Acad.Sci.U.S.A.93:10321-
10326;和M.Vidal等人,(1996),Reverse two-hybrid and one-hybrid systems to detect dissociation of protein-protein and DNA-protein interactions.
[comment],Proc.Natl.Acad.Sci.U.S.A.93:10315-10320。通过经天然氨基酸氨酰化的O-tRNA将天然氨基酸并入转录调节蛋白中,将引起负选择标记的转录。负选择标记任选包含选择性密码子。在一个实施例中,本发明的正选择标记和/或负选择标记可包含至少两个选择性密码子,其各自或都可包含至少两个不同选择性密码子或至少两个相同选择性密码子。
[0099] 转录调节蛋白为结合(直接或间接)核酸序列(例如,反应元件)且调节可操作性连接到反应元件的序列的转录的分子。转录调节蛋白可为转录活化蛋白(例如,GAL4、核激素受体、AP1、CREB、LEF/tcf家族成员、SMAD、VP16、SP1等)、转录阻遏蛋白(例如,核激素受体、Groucho/tle家族、Engrailed家族等)或可视环境而具有两种活性的蛋白质(例如LEF/tcf、同源异型盒蛋白等)。反应元件通常为转录调节蛋白所识别的核酸序列或与转录调节蛋白一起作用的额外试剂。
[0100] 转录调节蛋白的另一实例为转录活化蛋白GAL4。例如参看A.Laughon等人,(1984),Identification of two proteins encoded by the Saccharomyces cerevisiae GAL4gene,Molecular&Cellular Biology 4:268-275;A.Laughon,&R.F.Gesteland,(1984),Primary structure of the Saccharomyces cerevisiae GAL4gene.Molecular&Cellular Biology 4:260-267;L.Keegan等人,(1986),Separation of DNA binding from the transcription-activating function of a vertebrate regulatory protein,Science 231-.699-704;和M.Ptashne,(1988),How vertebrate transcriptional activators work,Nature 335:683-689。此881个氨基酸的蛋白质的N末端147个氨基酸形成特异性结合DNA序列的DNA结合结构域(DBD)。例如参看M.Carey等人,(1989),An amino-terminal fragment of GAL4binds DNA as a dimer,J.Mol.Biol.209:423-432;和E.Giniger等人,(1985),Specific DNA binding of GAL4,a positive regulatory protein of yeast,Cell 40:767-774。DBD通过插入蛋白质序列连接到当结合DNA时可活化转录的C末端113个氨基酸的活化结构域(AD)。例如参看J.Ma,&M.Ptashne,(1987),Deletion analysis of GAL4defines two transcriptional activating segments,Cell 48:847-853;和J.Ma,&M.Ptashne,(1987),The carboxy-terminal 30amino acids of GAL4are recognized by GAL80,Cell 50:137-142。将琥珀密码子朝向例如含有GAL4的N末端DBD和其C末端AD的单一多肽的N末端DBD放置,可将由O-tRNA/O-RS对执行的琥珀抑制连接到由GAL4执行的转录活化。可使用GAL4活化的报告基因以利用所述基因执行正选择和负选择。
[0101] 用于负选择的培养基可包含转化成通过负选择标记可检测的物质的选择或筛选剂。在本发明一方面中,可检测物质为有毒物质。编码负选择标记的多聚核苷酸可例如为ura3基因。举例来说,可将URA3报告基因置于含有GAL4DNA结合位点的启动子的控制下。当例如通过翻译编码具有选择性密码子的GAL4的多聚核苷酸产生负选择标记时,GAL4将活化URA3的转录。在包含5-氟乳清酸(5-FOA)的培养基上实现负选择,所述5-FOA将经ura3基因的基因产物转化成可检测物质(例如,杀死细胞的有毒物质)。例如参看J.D.Boeke等人,(1984),A positive selection for mutants lacking orotidine-5'-phosphate decarboxylase activity in yeast:5-fluoroorotic acid resistance,Molecular&General Genetics 197:345-346;M.Vidal等人,(1996),Genetic characterization of a mammalian protein-protein interaction domain by using a yeast reverse two-hybrid system.[comment],Proc.Natl.Acad.Sci.U.S.A.93:10321-10326;和M.Vidal等人,(1996),Reverse two-hybrid and one-hybrid systems to detect dissociation of protein-protein  and  DNA-protein  interactions,[comment],Proc.Natl.Acad.Sci.U.S.A.93:10315-10320。
[0102] 与正选择标记相同,负选择标记也可为多种分子中的任一个。在一个实施例中,正选择标记和/或负选择标记为在存在适当反应物的情况下发荧光或催化发光反应的多肽。举例来说,负选择标记包括(但不限于)例如荧光素酶、绿色荧光蛋白质(GFP)、YFP、EGFP、RFP、抗生素抗性基因的产物(例如,氯霉素乙酰转移酶(CAT))、lacZ基因的产物、转录调节蛋白等。在本发明一方面中,通过荧光活化细胞分选(FACS)或通过发光来检测正选择标记和/或负选择标记。在另一实例中,正选择标记和/或负选择标记包含基于亲和力的筛选标记。同一多聚核苷酸可编码正选择标记和负选择标记。
[0103] 其它水平的选择/筛选严格度也可用于本发明方法中。在产生O-RS的方法的一个或两个步骤中可改变选择或筛选严格度。这可包括例如改变编码正选择和/或负选择标记的多聚核苷酸中反应元件的量;将不同量的无活性合成酶添加到一个或两个步骤中;改变所使用的选择/筛选剂的量等。还可执行额外回合的正和/或负选择。
[0104] 选择或筛选也可包含一次或多次正或负选择或筛选,所述选择或筛选包括例如氨基酸渗透性的改变、翻译效率的改变、翻译保真度的改变等。通常,一种或多种改变是建立在一个或多个包含或编码用于产生蛋白质的正交tRNA-tRNA合成酶对组件的多聚核苷酸突变的基础上。
[0105] 还可使用模型富集研究从过量无活性合成酶中迅速选择活性合成酶。可进行正和/或负模型选择研究。举例来说,将包含潜在活性氨酰基-tRNA合成酶的脊椎动物细胞与不同倍数过量的无活性氨酰基-tRNA合成酶混合。在生长于非选择性培养基中并例如通过X-GAL覆盖分析的细胞与生长于选择性培养基(例如,在不存在组氨酸和/或尿嘧啶的情况下)中且能存活并例如通过X-GAL分析的细胞之间进行比率比较。对于负选择模型,将潜在活性氨酰基-tRNA合成酶与不同倍数过量的无活性氨酰基-tRNA合成酶混合,并利用例如5-FOA等负选择物质执行选择。
[0106] 通常,RS文库(例如,突变型RS文库)包含由例如来自非脊椎动物生物体的至少一种氨酰基-tRNA合成酶(RS)得到的RS。在一个实施例中,RS文库是得自无活性RS,例如其中无活性RS是通过使活性RS例如在所述合成酶的活性位点、所述合成酶的编辑机制位点、由组合合成酶的不同结构域得到的不同位点等突变而产生。举例来说,使RS活性位点中的残基突变成例如丙氨酸残基。将编码丙氨酸突变的RS的多聚核苷酸用作模板,以将丙氨酸残基诱变为所有20种氨基酸。选择/筛选突变型RS的文库以产生O-RS。在另一实施例中,无活性RS包含氨基酸结合袋并且一个或多个包含所述结合袋的氨基酸经一个或多个不同氨基酸取代。在一个实例中,经取代氨基酸是经丙氨酸取代。任选将编码丙氨酸突变的RS的多聚核苷酸用作模板以将丙氨酸残基诱变为所有20种氨基酸,并加以选择/筛选。
[0107] 产生O-RS的方法可进一步包括通过使用所属领域中已知的各种诱变技术产生RS文库。举例来说,可通过位点特异性突变、随机点突变、同源重组、DNA改组或其它递归式诱变方法、嵌合构建或其任何组合产生突变型RS。举例来说,可由两个或两个以上其它(例如)较小、较少多样性的“子文库”产生突变型RS文库。在使合成酶经历正和负选择/筛选策略后,可随后使这些合成酶经历进一步诱变。举例来说,可分离出编码O-RS的核酸;可由所述核酸产生一组编码突变型O-RS的多聚核苷酸(例如,通过随机诱变、位点特异性诱变、重组或其任何组合);且可重复这些个别步骤或这些步骤的组合,直到获得优先利用非天然氨基酸将O-tRNA氨酰化的突变型O-RS。在本发明一方面中,将所述步骤执行至少2次。
[0108] 有关产生O-RS的其它细节可见于题为“Methods and compositions for the production of orthogonal tRNA-aminoacyltRNA synthetase pairs.”的WO 2002/086075中。还参看Hamano-Takaku等人,(2000)A mutant Escherichia coli Tyrosyl-tRNA Synthetase Utilizes the Unnatural Amino Acid Azatyrosine More Efficiently than Tyrosine,Journal of Biological Chemistry.275(51):40324-40328;Kiga等人(2002),An engineered Escherichia coli tyrosyl-tRNA synthetase for site-specific incorporation of an unnatural amino acid into proteins in vertebrate translation and its application in a wheat germ cell-free system,PNAS 99(15):
9715-9723;和Francklyn等人,(2002),Aminoacyl-tRNA synthetases:Versatile players in the changing theater of translation;RNA.8:1363-1372。
[0109] 正交tRNA
[0110] 本发明提供包括正交tRNA(O-tRNA)的真核细胞。正交tRNA介导在活体内将非天然氨基酸并入蛋白质中,所述蛋白质是由包含由O-tRNA识别的选择性密码子的多聚核苷酸编码。在某些实施例中,本发明的O-tRNA例如以至少40%、至少45%、至少50%、至少60%、至少75%、至少80%或甚至90%或更高的包含如SEQ ID NO.:65中所述的多聚核苷酸序列或在细胞中由如SEQ ID NO.:65中所述的多聚核苷酸序列加工的tRNA的效率,介导将非天然氨基酸并入蛋白质中。参看本文中表5。
[0111] 本发明O-tRNA的实例为SEQ ID NO.:65(参看本文中实例6和表5)。SEQ ID NO.:65为剪接前/加工前转录物,其在细胞中任选例如使用标准内源细胞剪接和加工机器加工,且经修饰以形成活性O-tRNA。通常,所述剪接前转录物群在细胞中形成活性tRNA群。本发明还包括O-tRNA的保守变异体和其经加工细胞产物。举例来说,O-tRNA的保守变异体包括功能与SEQ ID NO.:65的O-tRNA类似且保持经加工形式的tRNA L形结构,但不具有相同序列的分子(且不为野生型tRNA分子)。通常,由于O-tRNA可在活体内再氨酰化,从而再次介导响应选择性密码子将非天然氨基酸并入由多聚核苷酸编码的蛋白质中,故本发明的O-tRNA为可重复利用的O-tRNA。
[0112] 真核生物而非原核生物中tRNA的转录是通过RNA聚合酶III进行,这将限制能在脊椎动物细胞中转录的tRNA结构基因的一级序列。而且,在脊椎动物细胞中,tRNA需要从转录tRNA的细胞核输出到细胞质,以进行翻译。编码本发明的O-tRNA或其互补多聚核苷酸的核酸也为本发明的特征。在本发明一个方面中,编码本发明的O-tRNA的核酸包括内部启动子序列,例如A盒(例如,TRGCNNAGY)和B盒(例如,GGTTCGANTCC,SEQ ID NO:95)。A盒和B盒序列的其它实例可见于Geiduschek,(1988),Transcription By RNA Polymerase III,Ann-Rev.Biochem.57:873-914,其以引用的方式并入本文中。本发明的O-tRNA也可经转录后修饰。举例来说,真核生物中tRNA基因的转录后修饰包括分别通过Rnase P和3'-内切核酸酶去除5'-和3'-侧接序列。添加3'-CCA序列也为真核生物中tRNA基因的转录后修饰。
[0113] 在一个实施例中,通过使第一物种的脊椎动物细胞群(其中所述脊椎动物细胞包含tRNA文库成员)经历负选择来获得O-tRNA。负选择除去包含如下tRNA文库成员的细胞,所述tRNA文库成员经对于脊椎动物细胞为内源性的氨酰基-tRNA合成酶(RS)氨酰化。这提供与第一物种的脊椎动物细胞正交的tRNA池。
[0114] 另外,或者与上文所述其它方法组合,使用反式翻译系统以将非天然氨基酸并入多肽中。此系统涉及存在于大肠杆菌中的称为tmRNA的分子。这一RNA分子在结构上与丙氨酰tRNA相关且经丙氨酰合成酶氨酰化。tmRNA与tRNA之间的差异在于,反密码子环经特定较大序列置换。这一序列允许核糖体使用tmRNA内编码的开放式阅读框作为模板在已停止的序列上重新开始翻译。在本发明中,可产生优先经正交合成酶氨酰化且装载有非天然氨基酸的正交tmRNA。通过所述系统转录基因,核糖体将在特定位点停止;将非天然氨基酸引入此位点处,并且使用正交tmRNA内编码的序列重新开始翻译。
[0115] 有关产生重组正交tRNA的其它方法可见于例如题为“Methods and compositions for the production of orthogonal tRNA-aminoacyltRNA synthetase pairs.”的国际专利申请案WO 2002/086075中。还参看Forster等人,(2003)Programmingpeptidomimetic synthetases by translating genetic codes designed de novo PNAS 100(11):6353-6357;和Feng等人,(2003),Expanding tRNA recognition of a tRNA synthetase by a single amino acid change,PNAS 100(10):5676-5681。
[0116] 正交TRNA与正交氨酰基-TRNA合成酶对
[0117] 正交对是由例如抑制tRNA、移码tRNA等O-tRNA与O-RS构成。O-tRNA不经内源性合成酶酰化,且能够在活体内介导将非天然氨基酸并入蛋白质中,所述蛋白质是由包含由O-tRNA识别的选择性密码子的多聚核苷酸编码。在脊椎动物细胞中,O-RS识别O-tRNA且优先利用非天然氨基酸将O-tRNA氨酰化。本发明中包括用于产生正交对的方法连同由所述方法产生的正交对,和用于脊椎动物细胞中的正交对组合物。多种正交tRNA/合成酶对的开发可允许使用不同密码子将多个非天然氨基酸同时并入脊椎动物细胞中。
[0118] 可通过利用无效跨物种氨酰化输入来自不同生物体的对(例如,无义抑制子对)在脊椎动物细胞中产生正交O-tRNA/O-RS对。在脊椎动物细胞中有效表达和加工O-tRNA和O-RS,并且将O-tRNA从细胞核有效地输出到细胞质。举例来说,一种所述对为来自大肠杆菌的酪氨酰-tRNA合成酶/tRNACUA对(例如参看,H.M.Goodman等人,(1968),Nature 217:1019-24;和D.G.Barker等人,(1982),FEBS Letters 150:419-23)。当在酿酒酵母细胞质中表达大肠杆菌酪氨酰-tRNA合成酶和其同源大肠杆菌tRNACUA时,大肠杆菌酪氨酰-tRNA合成酶有效地将其同源大肠杆菌tRNACUA氨酰化,但不会将酿酒酵母tRNA氨酰化。例如参看,H.Edwards,&P.Schimmel,(1990),Molecular&Cellular Biology 10:1633-41;和
H.Edwards等人,(1991),PNAS United States of America 88:1153-6。此外,大肠杆菌酪氨酰tRNACUA为酿酒酵母氨酰基-tRNA合成酶的弱底物(例如参看V.Trezeguet等人,(1991),Molecular&Cellular Biology 11:2744-51),但其有效地在酿酒酵母的蛋白质翻译中起作用。例如参看,H.Edwards,&P.Schimmel,(1990)Molecular&Cellular Biology 10:1633-
41;H.Edwards等人,(1991),PNAS United States of America 88:1153-6;和V.Trezeguet等人,(1991),Molecular&Cellular Biology 11:2744-51。此外,大肠杆菌TyrRS不具有校对接合到tRNA的非天然氨基酸的编辑机制。
[0119] O-tRNA和O-RS可为天然存在的,或可通过使来自多种生物体的天然存在的tRNA和/或RS突变得到,这将产生tRNA文库和/或RS文库。参看本文中题为“来源和宿主”的章节。在各个实施例中,O-tRNA和O-RS是得自至少一种生物体。在另一实施例中,O-tRNA得自第一物种的天然存在或突变的天然存在的tRNA,且O-RS得自第二物种的天然存在或突变的天然存在的RS。在一个实施例中,第一与第二非脊椎动物生物体相同。或者,第一与第二非脊椎动物生物体可不同。
[0120] 有关产生O-RS和O-tRNA的方法,参看本文中题为“正交氨酰基-tRNA合成酶(Orthogonal aminoacyl-tRNA synthetases)”和“O-tRNA”的章节。还参看题为“Methods and compositions for the production of orthogonal tRNA-aminoacyltRNA synthetase pairs.”的国际专利申请案WO 2002/086075。
[0121] 保真度、效率和产率
[0122] 保真度是指将所需分子(例如非天然氨基酸或氨基酸)并入正在生长的多肽中的所需位置的准确度。本发明的翻译组件响应选择性密码子以高保真度将非天然氨基酸并入蛋白质中。举例来说,与并入正在生长的多肽链中所需位置的特定天然氨基酸的不合需要的并入相比,使用本发明的组件将所需非天然氨基酸并入正在生长的多肽链中所需位置(例如响应选择性密码子)的效率为例如大于75%、大于85%、大于95%或甚至大于99%有效。
[0123] 效率还可以指与相关对照相比,O-RS利用非天然氨基酸将O-tRNA氨酰化的程度。本发明的O-RS可通过其效率定义。在本发明某些实施例中,将O-RS与另一O-RS相比较。例如,本发明的O-RS利用非天然氨基酸将O-tRNA氨酰化,这与具有(例如)如SEQ ID NO.:86或
45中所述的氨基酸序列的O-RS或表5)中另一特定RS将O-tRNA氨酰化相比例如至少40%、至少50%、至少60%、至少75%、至少80%、至少90%、至少95%或甚至99%或更高有效。在另一实施例中,本发明的O-RS利用非天然氨基酸将O-tRNA氨酰化,这比O-RS利用天然氨基酸将O-tRNA氨酰化有效例如至少10倍、至少20倍、至少30倍等。
[0124] 使用本发明的翻译组件,包含非天然氨基酸的所关注多肽的产率例如为从多聚核苷酸缺乏选择性密码子的细胞中获得天然存在的所关注多肽的产率的至少5%、至少10%、至少20%、至少30%、至少40%、50%或更多。另一方面,细胞在不存在非天然氨基酸的情况下以一定产率产生所关注多肽,所述产率例如为在存在非天然氨基酸的情况下多肽产率的不到30%、不到20%、不到15%、不到10%、不到5%、不到2.5%等。
[0125] 来源和宿主生物体
[0126] 本发明的正交翻译组件通常得自非脊椎动物生物体从而用于脊椎动物细胞或翻译系统。举例来说,正交O-tRNA可得自非脊椎动物生物体,例如真细菌,诸如大肠杆菌、极端嗜热细菌(Thermus thermophilus)、嗜热脂肪芽孢杆菌等;或古细菌,例如詹氏甲烷球菌、嗜热自养甲烷杆菌(Methanobacterium  thermoautotrophicum)、嗜盐古菌(Halobacterium)(诸如沃氏嗜盐富饶菌(Haloferax volcanii)和嗜盐古菌NRC-1
(Halobacterium species NRC-1))、闪烁古生球菌(Archaeoglobus fulgidus)、强烈火球菌(Pyrococcus furiosus)、掘越氏热球菌(Pyrococcus horikoshii)、嗜热泉生古细菌(Aeuropyrum pernix)等,而正交O-RS可得自非脊椎动物生物体,例如真细菌,诸如大肠杆菌、极端嗜热细菌、嗜热脂肪芽孢杆菌等;或古细菌,例如詹氏甲烷球菌、嗜热自养甲烷杆菌、嗜盐古菌(诸如沃氏嗜盐富饶菌和嗜盐古菌NRC-1)、闪烁古生球菌、强烈火球菌、掘越氏热球菌、嗜热泉生古细菌等。另外,还可使用脊椎动物来源,例如植物、藻类、原生生物、真菌、酵母、动物(例如,哺乳动物、昆虫、节肢动物等)等,例如其中所述组件与所关注细胞或翻译系统正交,或其中其经修饰(例如,突变)而与所述细胞或翻译系统正交。
[0127] O-tRNA/O-RS对的个别组件可得自相同生物体或不同生物体。在一个实施例中,O-tRNA/O-RS对是来自相同生物体。举例来说,O-tRNA/O-RS对可得自大肠杆菌的酪氨酰-tRNA合成酶/tRNACUA对。或者O-tRNA/O-RS对的O-tRNA和O-RS任选来自不同生物体。
[0128] 正交O-tRNA、O-RS或O-tRNA/O-RS对可经选择或筛选和/或用于脊椎动物细胞中以产生具有非天然氨基酸的多肽。脊椎动物细胞可来自各种来源,例如任何脊椎动物(例如,哺乳动物、两栖动物、鸟类、爬行动物、鱼类等)等。具有本发明的翻译组件的脊椎动物细胞的组合物也为本发明的特征。
[0129] 本发明还提供在一种物种中有效筛选以任选用于所述物种和/或第二物种(任选无需额外选择/筛选)中。举例来说,在一种物种(例如,易于操纵的物种,诸如酵母细胞等)中选择或筛选O-tRNA/O-RS组件,且将其引入第二脊椎动物物种,例如植物(例如复杂植物,诸如单子叶植物或双子叶植物)、藻类、原生生物、真菌、酵母、动物(例如哺乳动物、昆虫、节肢动物等)等中,以用于在活体内将非天然氨基酸并入所述第二物种中。
[0130] 举例来说,由于酿酒酵母(Saccharomyces cerevisiae,S.cerevisiae)为单细胞的,具有快速换代时间和相对充分表征的遗传学,故可将其选作脊椎动物第一物种。例如参看D.Burke等人,(2000)Methods in Yeast Genetics.Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY。此外,由于真核生物的翻译机器高度保守(例如参看(1996)Translational Control.Cold Spring Harbor Laboratory,Cold Spring Harbor,NY;Y.Kwok,&J.T.Wong,(1980),Evolutionary relationship between Halobacterium cutirubrum and eukaryotes determined by use of aminoacyl-tRNA synthetases as phylogenetic probes,Canadian Journal of Biochemistry 58:213-218;和(2001)The Ribosome.Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY),故可将在酿酒酵母中发现的用于并入非天然氨基酸的aaRS基因引入高级脊椎动物生物体中,且与同源tRNA合作(例如参看K.Sakamoto等人,(2002)Site-specific incorporation of an unnatural amino acid into proteins in mammalian cells,Nucleic Acids Res.30:4692-4699;和C.Kohrer等人,(2001),Import of amber and ochre suppressor tRNA's into mammalian cells:a general approach to site-specific insertion of amino acid analogues into proteins,Proc.Natl.Acad.Sci.U.S.A.98:14310-14315)用于并入非天然氨基酸。
[0131] 在一个实例中,在如本文所述的第一物种中产生O-tRNA/O-RS对的方法另外包括将编码O-tRNA的核酸和编码O-RS的核酸引入第二物种(例如,哺乳动物、昆虫、真菌、藻类、植物等)的脊椎动物细胞中。在另一实例中,产生在脊椎动物细胞中优先利用非天然氨基酸将正交tRNA氨酰化的正交氨酰基-tRNA合成酶(O-RS)的方法包括:(a)在存在非天然氨基酸的情况下,使第一物种(例如,酵母等)的脊椎动物细胞群经历正选择。所述脊椎动物细胞各自包含:i)氨酰基-tRNA合成酶(RS)文库成员,ii)正交tRNA(O-tRNA),iii)编码正选择标记的多聚核苷酸,和iv)编码负选择标记的多聚核苷酸。在正选择中存活的细胞包含在存在非天然氨基酸的情况下将正交tRNA(O-tRNA)氨酰化的活性RS。使在正选择下存活的细胞在不存在非天然氨基酸的情况下经历负选择,以除去利用天然氨基酸将O-tRNA氨酰化的活性RS。这提供优先利用非天然氨基酸将O-tRNA氨酰化的O-RS。将编码O-tRNA的核酸和编码O-RS的核酸(或O-tRNA和/或O-RS的组件)引入第二物种(例如,哺乳动物、昆虫、真菌、藻类、植物等)的脊椎动物细胞中。通常,通过使第一物种的脊椎动物细胞群经历负选择来获得O-tRNA,其中所述脊椎动物细胞包含tRNA文库成员。负选择标记除去包含tRNA文库成员的细胞,所述tRNA文库成员经对于脊椎动物细胞为内源性的氨酰基-tRN合成酶(RS)氨酰化,其提供与第一物种和第二物种的脊椎动物细胞正交的tRNA池。
[0132] 选择性密码子
[0133] 本发明的选择性密码子将扩充蛋白质生物合成机器的遗传密码子框架。举例来说,选择性密码子包括例如独特的三碱基密码子、无义密码子(诸如终止密码子,例如琥珀密码子(UAG)、蛋白石密码子(UGA))、非天然密码子、至少四碱基的密码子、稀有密码子等。可将多个(例如一个或多个、两个或两个以上、三个以上等)选择性密码子引入所需基因中。
基因可包括多个指定选择性密码子拷贝,或可包括多个不同选择性密码子或其组合。
[0134] 在一个实施例中,所述方法涉及使用作为终止密码子的选择性密码子以在脊椎动物细胞中于活体内并入非天然氨基酸。举例来说,产生识别终止密码子(例如UAG)且通过O-RS利用所需非天然氨基酸氨酰化的O-tRNA。天然存在的宿主氨酰基-tRNA合成酶不识别所述O-tRNA。可使用常规定点诱变将终止密码子(例如TAG)引入所关注多肽中的所关注位点处。例如参看Sayers,J.R.等人(1988),5',3'Exonuclease in phosphorothioate-based oligonucleotide-directed mutagenesis.Nucleic Acids Res.791-802。当在活体内将O-RS、O-tRNA和编码所关注多肽的核酸组合时,响应UAG密码子而并入非天然氨基酸从而得到在指定位置处含有所述非天然氨基酸的多肽。
[0135] 在活体内并入非天然氨基酸可在不显著干扰脊椎动物宿主细胞的情况下进行。举例来说,由于UAG密码子的抑制效率视O-tRNA(例如,琥珀抑制性tRNA)与脊椎动物释放因子(例如,eRF)(其与终止密码子结合并且起始正在生长的肽从核糖体释放)之间的竞争而定,故所述抑制效率可例如通过增加O-tRNA(例如,抑制性tRNA)的表达水平来调节。
[0136] 选择性密码子还包含扩充的密码子,例如四个或四个以上碱基的密码子,诸如四碱基密码子、五碱基密码子、六碱基密码子或更多个碱基的密码子。四碱基密码子的实例包括例如AGGA、CUAG、UAGA、CCCU等。五碱基密码子的实例包括例如AGGAC、CCCCU、CCCUC、CUAGA、CUACU、UAGGC等。本发明的特征包括基于移码抑制使用扩充的密码子。四个或四个以上碱基的密码子可将例如一个或多个非天然氨基酸插入同一蛋白质中。举例来说,在存在具有反密码子环、例如具有8-10nt反密码子环的突变O-tRNA(例如,特定移码抑制性tRNA)的情况下,将四个或四个以上碱基的密码子读作单一氨基酸。在其它实施例中,反密码子环可解码例如至少四碱基密码子、至少五碱基密码子或至少六碱基密码子或更多碱基的密码子。由于存在256个可能的四碱基密码子,故可在同一细胞中使用四个或四个以上碱基的密码子编码多个非天然氨基酸。参看Anderson等人,(2002)Exploring the Limits of Codon and Anticodon Size,Chemistry and Biology.9:237-244;Magliery,(2001)Expanding the Genetic Code:Selection of Efficient Suppressors of Four-base Codons and Identification of"Shifty"Four-base Codons with a Library Approach in Escherichia coli.J.Mol.Biol.307:755-769。
[0137] 举例来说,已使用四碱基密码子使用活体外生物合成方法将非天然氨基酸并入蛋白质中。例如参看Ma等人,(1993)Biochemistry,32:7939;和Hohsaka等人,(1999)J.Am.Chem.Soc,121:34。使用CGGG和AGGU利用两个以化学方式酰化的移码抑制性tRNA在活体外将2-萘基丙氨酸和赖氨酸的NBD衍生物同时并入抗生蛋白链菌素中。例如参看Hohsaka等人,(1999)J.Am.Chem.Soc,121:12194。在活体内研究中,Moore等人检查具有NCUA反密码子的tRNALeu衍生物抑制UAGN密码子(N可为U、A、G或C)的能力,并且发现四联体UAGA可以通过具有UCUA反密码子的tRNALeu以13%到26%的效率解码且在0或-1框内极少解码。参看Moore等人,(2000)J.Mol.Biol.,298:195。在一个实施例中,可将基于稀有密码子或无义密码子的扩充密码子用于本发明中,其可减少错义通读和其它不合需要的位点处的移码抑制。
[0138] 对于指定系统来说,选择性密码子也可包括一个天然三碱基密码子,其中内源系统不使用(或极少使用)天然碱基密码子。举例来说,这包括缺乏识别天然三碱基密码子的tRNA的系统和/或三碱基密码子为稀有密码子的系统。
[0139] 选择性密码子任选包括非天然碱基对。这些非天然碱基对使现有的遗传代码进一步扩展。一种额外的碱基对使三联体密码子的数量从64增加到125。第三碱基对的特性包括稳定且具选择性的碱基配对、通过聚合酶以高保真度有效酶促并入DNA中以及合成新的非天然碱基对之后有效的持续引物延伸。可适于方法和组合物的非天然碱基对的描述包括例如Hirao等人,(2002)An unnatural base pair for incorporating amino acid analogues into protein,Nature Biotechnology.20:177-182。其它相关公开案列于下文中。
[0140] 对于活体内使用来说,非天然核苷可渗透膜并且磷酸化形成相应的三磷酸盐。此外,增加的遗传信息稳定并且不被细胞酶所破坏。Benner和其它人先前的工作利用不同于规范Watson-Crick配对的氢键模式,最值得关注的实例为iso-C:iso-G配对。例如参看Switzer等人,(1989)J.Am.Chem.Soc,111:8322;和Piccirilli等人,(1990)Nature,343:33;Kool,(2000)Curr.Opin.Chem.Biol,4:602。一般说来,这些碱基在某种程度上与天然碱基错配并且无法酶促复制。Kool和同事证实,碱基之间的疏水堆积相互作用可替代氢键以驱动碱基对的形成。参看Kool,(2000)Curr.Opin.Chem.Biol,4:602;和Guckian及Kool,(1998)Angew.Chem.Int.Ed.Engl.,36,2825。在开发满足所有上述需求的非天然碱基对的工作中,Schultz、Romesberg和同事已系统地合成一系列非天然疏水碱基并且对其进行研究。已发现,PICS:PICS自身配对比天然碱基对稳定,并且能够通过大肠杆菌DNA聚合酶I的Klenow片段(KF)有效地并入DNA中。例如参看McMinn等人,(1999)J.Am.Chem.Soc,121:
11586;以及Ogawa等人,(2000)J.Am.Chem.Soc,122:3274。3MN:3MN自身配对可通过KF以足以用于生物功能的效率和选择性合成。例如参看Ogawa等人,(2000)J.Am.Chem.Soc.122:
8803。然而,两种碱基都充当用于进一步复制的链终止子。近来已开发出可用于复制PICS自身配对的突变体DNA聚合酶。此外,可复制7AI自身配对。例如参看Tae等人,(2001)J.Am.Chem.Soc,123:7439。也已开发出新颖的金属碱基对Dipic:Py,其在结合Cu(II)后形成稳定的配对。参看Meggers等人,(2000)J.Am.Chem.Soc,122:10714。由于扩充密码子和非天然密码子内在地与天然密码子正交,故本发明的方法可利用这一特性产生正交tRNA供其使用。
[0141] 也可使用翻译旁路系统将非天然氨基酸并入所需多肽中。在翻译旁路系统中,将较大序列插入基因中但并不被翻译成蛋白质。所述序列含有充当诱导核糖体越过所述序列并且在插入下游重新开始翻译的线索的结构。
[0142] 非天然氨基酸
[0143] 如本文所使用,非天然氨基酸是指除硒代半胱氨酸和/或吡咯赖氨酸和以下20种基因编码的α-氨基酸外的任何氨基酸、经修饰氨基酸或氨基酸类似物:丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、缬氨酸。通过式I说明α-氨基酸的一般结构:
[0144]
[0145] 非天然氨基酸通常为具有式I的任何结构,其中R基团为除二十种天然氨基酸中所用基团外的任何取代基。有关二十种天然氨基酸的结构,例如参看L.Stryer的Biochemistry,第3版1988,Freeman and Company,New York。应注意,本发明的非天然氨基酸可为除上述二十种α-氨基酸外的天然存在的化合物。
[0146] 由于本发明的非天然氨基酸与天然氨基酸的不同之处通常仅在于侧链,故非天然氨基酸以与其在天然存在的蛋白质中形成酰胺键相同的方式与其它氨基酸(例如,天然或非天然)形成酰胺键。然而,非天然氨基酸具有使其与天然氨基酸相区别的侧链基团。举例来说,式I中的R任选包含烷基-、芳基-、酰基-、酮基-、叠氮基-、羟基-、肼、氰基-、卤基-、酰肼、烯基、炔基、醚、硫醇、硒基-、磺酰基-、硼酸酯基(borate)、硼酸酯基(boronate)、磷酸基、膦酸基、膦、杂环、烯酮、亚胺、醛、酯、硫代酸、羟胺、胺等,或其任何组合。其它所关注非天然氨基酸包括(但不限于)包含可光活化交联剂的氨基酸、自旋标记的氨基酸、发荧光氨基酸、结合金属的氨基酸、含金属的氨基酸、放射性氨基酸、具有新颖官能团的氨基酸、与其它分子共价或非共价相互作用的氨基酸、光笼蔽和/或光致异构化氨基酸、含有生物素或生物素类似物的氨基酸、含酮基氨基酸、包含聚乙二醇或聚醚的氨基酸、重原子取代的氨基酸、可化学裂解和/或可光裂解的氨基酸、与天然氨基酸相比具有伸长侧链(例如,聚醚或长链,例如大于约5个、大于约10个碳原子等)的氨基酸、含碳连接的糖的氨基酸、具有氧化还原活性的氨基酸、含有氨基硫代酸的氨基酸和包含一个或多个有毒部分的氨基酸。在一些实施例中,非天然氨基酸具有例如用于将蛋白质与固体支撑物连接的可光活化交联剂。在一个实施例中,非天然氨基酸具有连接到氨基酸侧链的糖部分(例如,糖基化氨基酸)和/或其它碳水化合物修饰。
[0147] 除含有新颖侧链的非天然氨基酸外,非天然氨基酸还任选包含经修饰的主链结构,例如,如式II和III的结构所示:
[0148]
[0149] 其中Z通常包含OH、NH2、SH、NH-R'或S-R';X和Y可相同或不同且通常包含S或O;且R和R'任选相同或不同且通常选自与上文关于具有式I的非天然氨基酸所述的R基的组分相同的列表以及氢。举例来说,如式II和III所示,本发明的非天然氨基酸任选在氨基或羧基中包含取代。此类非天然氨基酸包括(但不限于)例如具有与常见二十种天然氨基酸相对应的侧链或非天然侧链的α-羟基酸、α-硫代酸、α-氨基硫代羧酸酯。此外,α-碳的取代任选包括L、D或α-α双取代氨基酸,诸如D-谷氨酸、D-丙氨酸、D-甲基-O-酪氨酸、氨基丁酸等。其它结构替代物包括环状氨基酸,诸如脯胺酸类似物以及3、4、6、7、8和9元环脯胺酸类似物;β和γ氨基酸,诸如经取代β-丙氨酸和γ-氨基丁酸。举例来说,许多非天然氨基酸都是建立在诸如酪氨酸、谷氨酸、苯丙氨酸等天然氨基酸的基础上。酪氨酸类似物包括对位取代的酪氨酸、邻位取代的酪氨酸和间位取代的酪氨酸,其中所述经取代酪氨酸包含例如酮基(例如乙酰基)、苯甲酰基、氨基、肼、羟胺、硫醇基、羧基、异丙基、甲基、C6-C20直链或支链烃、饱和或不饱和烃、O-甲基、聚醚基、硝基、炔基等。此外,也涵盖多取代的芳基环。本发明的谷氨酰胺类似物包括(但不限于)α-羟基衍生物、γ取代的衍生物、环状衍生物和酰胺取代的谷氨酰胺衍生物。苯丙氨酸类似物的实例包括(但不限于)对位取代的苯丙氨酸、邻位取代的苯丙氨酸和间位取代的苯丙氨酸,其中所述取代基包含例如羟基、甲氧基、甲基、烯丙基、醛、叠氮基、碘基、溴基、酮基(例如乙酰基)、苯甲酰基、炔基等。非天然氨基酸的特定实例包括(但不限于)对乙酰基-L-苯丙氨酸、对炔丙基氧基苯丙氨酸、O-甲基-L-酪氨酸、L-3-(2-萘基)丙氨酸、3-甲基-苯丙氨酸、O-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、三-O-乙酰基-GlcNAcβ-丝氨酸、L-多巴、氟化苯丙氨酸、异丙基-L-苯丙氨酸、对叠氮基-L-苯丙氨酸、对酰基-L-苯丙氨酸、对苯甲酰基-L-苯丙氨酸、L-磷酸丝氨酸、膦酰基丝氨酸、膦酰基酪氨酸、对碘-苯丙氨酸、对溴苯丙氨酸、对氨基-L-苯丙氨酸和异丙基-L-苯丙氨酸等。多种非天然氨基酸的其它结构提供于例如题为“In vivo incorporation of unnatural amino acids.”的WO 2002/085923的图16、17、18、19、26和29中。关于其它甲硫氨酸类似物,还参看Kiick等人,(2002)Incorporation of azides into recombinant proteins for chemoselective modification by the Staudinger ligtation,PNAS 99:19-24的图1结构2-5。
[0150] 在一个实施例中,提供包括非天然氨基酸(诸如对-(炔丙基氧基)-苯丙氨酸)的组合物。还提供包含对-(炔丙基氧基)-苯丙氨酸和例如蛋白质和/或细胞的各种组合物。一方面,包括对-(炔丙基氧基)-苯丙氨酸非天然氨基酸的组合物进一步包括正交tRNA。可将非天然氨基酸与正交tRNA键接(例如共价),例如通过氨酰基键与正交tRNA共价键接、与正交tRNA的末端核糖的3'OH或2'OH共价键接。
[0151] 可通过非天然氨基酸并入蛋白质中的化学部分为蛋白质提供多种益处和操纵。举例来说,酮基官能团的独特反应性允许在活体外和活体内利用多种含肼或羟胺试剂中任一种选择性修饰蛋白质。举例来说,重原子非天然氨基酸例如可用于定相x射线结构数据。使用非天然氨基酸位点特异性地引入重原子还为选择重原子的位置提供选择性和灵活性。光反应性非天然氨基酸(例如,具有二苯甲酮和叠氮芳基(例如叠氮苯)侧链的氨基酸)例如允许在活体内和活体外有效地光交联蛋白质。光反应性非天然氨基酸的实例包括(但不限于)例如对叠氮基-苯丙氨酸和对苯甲酰基-苯丙氨酸。随后可通过激发光反应性基团-提供时间(和/或空间)控制使具有光反应性非天然氨基酸的蛋白质随意交联。在一个实例中,非天然氨基酸的甲基可经作为局部结构和动力学探针(例如,使用核磁共振和振动光谱)的同位素标记的(例如)甲基取代。举例来说,炔基或叠氮基官能团允许利用分子通过[3+2]环加成反应选择性修饰蛋白质。
[0152] 非天然氨基酸的化学合成
[0153] 上文所提供的许多非天然氨基酸都是购自例如Sigma(USA))或Aldrich(Milwaukee,WI,USA)。非市售的非天然氨基酸是任选如本文所提供或如各种公开案中所提供或使用所属领域技术人员已知的标准方法来合成。有关有机合成技术,例如参看Fessendon和Fessendon的Organic Chemistry,(1982,第2版,Willard Grant Press,Boston Mass.);March的Advanced Organic Chemistry(第3版,1985,Wiley and Sons,New York);以及Carey和Sundberg的Advanced Organic Chemistry(第3版,第A和B部分,1990,Plenum Press,New York)。描述非天然氨基酸的合成的其它公开案例如包括:题为“In vivo incorporation of Unnatural Amino Acids”的WO 2002/085923,Matsoukas等人,(1995)J.Med.Chem.,38-4669;King,F.E.&Kidd,D.A.A.(1949)A New Synthesis of Glutamine and  of  γ-Dipeptides of  Glutamic  Acid from  Phthylated 
Intermediates.J.Chem.Soc.3315-3319;Friedman,O.M.&Chatterrji,R.(1959)Synthesis of Derivatives  of Glutamine as  Model Substrates  for  Anti-Tumor 
Agents.J.Am.Chem.Soc.81,3750-3752;Craig,J.C.等人(1988)Absolute Configuration of the Enantiomers of 7-Chloro-4[[4-(diethylamino)-1-methylbutyl]amino]quinoline(Chloroquine).J.Org.Chem.53,1167-1170;Azoulay,M.,Vilmont,M.&
Frappier,F.(1991)Glutamine analogues as Potential Antimalarials,
Eur.J.Med.Chem.26-5;Koskinen,A.M.P.&Rapoport,H.(1989)Synthesis of 4-
Substituted  Prolines as Conformationally Constrained Amino Acid 
Analogues.J.Org.Chem.54,1859-1866;Christie,B.D.&Rapoport,H.(1985)Synthesis of Optically Pure Pipecolates from L-Asparagine.Application to the Total 
Synthesis of(+)-Apovincamine through Amino Acid Decarbonylation and Iminium Ion Cyclization.J.Org.Chem.1989:1859-1866;Barton等人,(1987)Synthesis of Novelα-Amino-Acids and Derivatives Using Radical Chemistry:Synthesis of L-and D-α-Amino-Adipic Acids,L-α-aminopimelic Acid and Appropriate Unsaturated 
Derivatives.Tetrahedron 43:4297-4308;和Subasinghe等人,(1992)Quisqualic acid analogues:synthesis of bela-heterocyclic 2-aminopropanoic acid derivatives and their activity at a novel quisqualate-sensitized site.J.Med.Chem.35:4602-
7。
[0154] 非天然氨基酸的细胞摄取
[0155] 脊椎动物细胞对非天然氨基酸的摄取是在设计和选择例如并入蛋白质中的非天然氨基酸时通常考虑的一个问题。举例来说,α-氨基酸的高电荷密度表明这些化合物可能无法渗透细胞。天然氨基酸是经由一系列基于蛋白质的转运系统而吸收到脊椎动物细胞中。可进行快速筛选以评定哪些非天然氨基酸(如果存在)被细胞吸收。例如参看,例如2002年12月22日申请的题为“Protein Arrays”的代理人案号为P1001US00的申请案以及Liu,D.R.&Schultz,P.G.(1999)Progress toward the evolution of an organism with an expanded genetic code.PNAS United States 96:4780-4785中的毒性分析法。尽管易于利用各种分析法分析摄取,但设计适用于细胞摄取路径的非天然氨基酸的替代方法是提供生物合成路径以在活体内产生氨基酸。
[0156] 非天然氨基酸的生物合成
[0157] 许多生物合成路径已经存在于细胞中以产生氨基酸和其它化合物。特定非天然氨基酸的生物合成方法可能不存在于自然界(例如,脊椎动物细胞)中,而本发明提供所述方法。举例来说,任选在宿主细胞中通过添加新颖酶或改变现存的宿主细胞路径来产生非天然氨基酸的生物合成路径。其它新颖酶任选为天然存在的酶或人工开发的酶。举例来说,对氨基苯丙氨酸的生物合成(如题为“In vivo incorporation of unnatural amino acids”的WO 2002/085923中的实例所提供)依赖于添加来自其它生物体的已知酶的组合。可通过用包含这些酶的基因的质粒转化细胞来将所述基因引入脊椎动物细胞中。当在细胞中表达时,这些基因提供合成所需化合物的酶促路径。任选添加的酶类型的实例提供于下文实例中。其它酶序列可见于例如Genbank中。也任选以相同方式将人工开发的酶添加到细胞中。以此方式,操纵细胞机器和细胞资源以产生非天然氨基酸。
[0158] 多种方法可用于产生用于生物合成路径或发展现存路径中的新颖酶。举例来说,任选将(例如)如Maxygen,Inc.所开发的递归重组(recursive recombination)(可在万维网www.maxygen.com上获得)用于开发新颖酶和路径。例如参看Stemmer(1994),Rapid evolution of a protein in vitro by DNA shuffling,Nature 370(4):389-391;和Stemmer,(1994),DNA shuffling by random fragmentation and reassembly:In vitro recombination for molecular evolution,Proc.Natl.Acad.Sci.USA..91:10747-10751。类似地,任选将Genencor所开发的DesignPathTM(可在万维网genencor.com上获得)用于代谢路径工程改造,例如工程改造某一路径以在细胞中产生O-甲基-L-酪氨酸。这项技术使用例如通过功能性基因组学以及分子进化和设计所鉴别出的新基因的组合在宿主生物体中重建现存路径。Diversa公司(可在万维网diversa.com上获得)也提供迅速筛选基因文库和基因路径(例如建立新路径)的技术。
[0159] 通常以足以有效进行蛋白质生物合成但未达到影响其它氨基酸的浓度或耗尽细胞资源的程度的浓度(例如天然细胞量)来产生利用本发明的经工程改造的生物合成路径所产生的非天然氨基酸。在活体内以此方式所产生的典型浓度为约10mM到约0.05mM。在用包含用于产生特定路径所需的酶的基因的质粒转化细胞并且产生非天然氨基酸后,任选使用活体内选择以针对核糖体蛋白质合成和细胞生长进一步优化非天然氨基酸的产生。
[0160] 具有非天然氨基酸的多肽
[0161] 具有至少一个非天然氨基酸的所关注蛋白质或多肽为本发明的特征。本发明还包括使用本发明的组合物和方法产生的具有至少一个非天然氨基酸的多肽或蛋白质。赋形剂(例如,医药学上可接受的赋形剂)也可与蛋白质一起存在。
[0162] 通过在脊椎动物细胞中产生具有至少一个非天然氨基酸的所关注蛋白质或多肽,蛋白质或多肽通常将包括脊椎动物翻译后修饰。在某些实施例中,蛋白质包括至少一个非天然氨基酸和至少一个由脊椎动物细胞于活体内所产生的翻译后修饰,其中所述翻译后修饰不是由原核细胞产生。举例来说,翻译后修饰包括例如乙酰化、酰化、脂质修饰、棕榈酰化、棕榈酸盐加成、磷酸化、糖酯连接修饰、糖基化等。一方面,翻译后修饰包括通过GlcNAc-天冬酰胺键联将寡糖(例如(GlcNAc-Man)2-Man-GlcNAc-GlcNAc))与天冬酰胺连接在一起。参看表7,其列出脊椎动物蛋白质的N连接寡糖的一些实例(也可存在其它未展示的残基)。
另一方面,翻译后修饰包括通过GalNAc-丝氨酸或GalNAc-苏氨酸键联或者GlcNAc-丝氨酸或GlcNAc-苏氨酸键联将寡糖(例如Gal-GalNAc、Gal-GlcNAc等)与丝氨酸或苏氨酸连接在一起。
[0163] 表7:通过GlcNAc键联连接的寡糖的实例
[0164]
[0165]
[0166] 另一方面,翻译后修饰包括前体(例如,降钙素前体、降钙素基因相关肽前体、前甲状旁腺激素原、前胰岛素原、前胰岛素、前阿黑皮素原(prepro-opiomelanocortin)、阿黑皮素原等)的蛋白水解处理;组装成多亚单元蛋白质或大分子组装物;翻译到细胞中另一位点处(例如,细胞器,诸如内质网、高尔基体(golgi apparatus)、细胞核、溶酶体、过氧化物酶体、线粒体、叶绿体、液泡等,或通过分泌途径)。在某些实施例中,蛋白质包含分泌或定位序列、抗原决定基标签、FLAG标签、聚组氨酸标签、GST融合体等。
[0167] 非天然氨基酸的一个优势在于,其提供可用于添加额外分子的额外化学部分。这些修饰可在脊椎动物细胞中于活体内进行或在活体外进行。因此,在某些实施例中,翻译后修饰是通过非天然氨基酸进行。举例来说,翻译后修饰可通过亲核-亲电反应进行。当前用于选择性修饰蛋白质的大部分反应涉及亲核与亲电反应搭配物之间的共价键形成,例如α-卤代酮与组氨酸或半胱氨酸侧链的反应。在这些情况中,选择性是由蛋白质中亲核残基的数量和可接近性决定。在本发明的蛋白质中,可在活体外或活体内使用其它更具选择性的反应,诸如非天然酮基氨基酸与酰肼或氨氧基化合物的反应。例如参看Cornish等人,(1996)J.Am.Chem.Soc.118:8150-8151;Mahal等人,(1997)Science.276:1125-1128;Wang等人,(2001)Science 292:498-500;Chin等人,(2002)Am.Chem.Soc.124:9026-9027;Chin等人,(2002)Proc.Natl.Acad.Sci.,99:11020-11024;Wang等人,(2003)Proc.Natl.Acad.Sci 100:56-61;Zhang等人,(2003)Biochemistry.42:6735-6746;和Chin等人,(2003)Science.,出版中。这使得能够用包括荧光团、交联剂、糖衍生物和细胞毒性分子在内的多种试剂选择性标记几乎任何蛋白质。还参看2003年10月15日申请的题为“Glycoprotein synthesis”的专利申请案USSN 10/686,944。翻译后修饰(例如通过叠氮基氨基酸)也可通过施陶丁格接合(Staudinger ligation)(例如,用三芳基膦试剂)进行。例如参看Kiick等人,(2002)Incorporation of azides into recombinant proteins for chemoselective modification by the Staudinger ligtation,PNAS 99:19-24。
[0168] 本发明提供另一种选择性修饰蛋白质的极为有效的方法,其涉及响应选择性密码子将例如含有叠氮基或炔基部分的非天然氨基酸遗传并入蛋白质中。随后可通过例如胡伊斯根(Huisgen)[3+2]环加成反应(例如参看Padwa,A.Comprehensive Organic Synthesis,第4卷.(1991)Trost,B.M.编,Pergamon,Oxford,第1069-1109页;和Huisgen,R.1,3-Dipolar Cycloaddition Chemistry,(1984)Padwa,A.编,Wiley,New York,第1-176页)分别用例如炔基或叠氮化物衍生物来修饰这些氨基酸侧链。例如参看图16。由于这种方法涉及环加成而非亲核取代反应,故可以极高的选择性修饰蛋白质。可在室温下于水性条件中通过将催化量的Cu(I)盐添加到反应混合物中以优良的区位选择性(1,4>1,5)进行所述反应。例如参看Tornoe等人,(2002)J.Org.Chem.67:3057-3064;和Rostovtsev,等人,(2002)Angew.Chem.Int.Ed.41:2596-2599。可使用的另一方法是在双砷化合物上配体交换四半胱氨酸基元,例如参看Griffin等人,(1998)Science 281:269-272。
[0169] 可通过非天然编码的氨基酸的官能团添加到本发明的蛋白质中的分子包括实质上任何具有互补官能团的分子。所述分子包括(但不限于)染料、荧光团、交联剂、糖衍生物、聚合物(例如,聚乙二醇衍生物)、光交联剂、细胞毒性化合物、亲和标记、生物素衍生物、树脂、珠粒、第二蛋白质或多肽(或更多)、多聚核苷酸(例如,DNA、RNA等)、金属螯合剂、辅因子、脂肪酸、碳水化合物等。另一方面,本发明提供包括所述分子的组合物以及产生这些分子(例如,聚乙二醇)的方法,其中n为介于例如50与10,000之间、75与5,000之间、100与2,000之间、100与1,000之间等的整数。在本发明的实施例中,聚乙二醇具有例如约5,000到约
100,000Da、约20,000到约30,000Da、约40,000或约50,000Da、约20,000Da到约10,000Da等的分子量。
[0170] 还提供包含这些化合物,例如具有蛋白质和细胞的各种组合物。在本发明一方面中,包含叠氮基染料(例如,具有化学结构4或化学结构6)的蛋白质进一步包括至少一个非天然氨基酸(例如,炔基氨基酸),其中所述叠氮基染料通过[3+2]环加成连接到所述非天然氨基酸。
[0171] 本发明的脊椎动物细胞提供合成包含大量有用非天然氨基酸的蛋白质的能力。一方面,组合物任选包括例如至少10微克、至少50微克、至少75微克、至少100微克、至少200微克、至少250微克、至少500微克、至少1毫克、至少10毫克或更多包含非天然氨基酸的蛋白质,或可利用活体内蛋白质产生方法所实现的量(关于重组蛋白产生和纯化的细节提供于本文中)。另一方面,蛋白质任选以在例如细胞溶解产物、缓冲液、医药缓冲液或其它液体悬浮液(例如,在从约1nl到约100L间任何数量的体积中)中为例如每升至少10微克蛋白质、每升至少50微克蛋白质、每升至少75微克蛋白质、每升至少100微克蛋白质、每升至少200微克蛋白质、每升至少250微克蛋白质、每升至少500微克蛋白质、每升至少1毫克蛋白质或每升至少10毫克蛋白质或更高的浓度存在于组合物中。在包括至少一个非天然氨基酸的脊椎动物细胞中产生大量(例如,大于通常用其它方法、例如活体外翻译可能获得的量)蛋白质为本发明的特征。
[0172] 可进行非天然氨基酸的并入,例如以调整蛋白质结构和/功能的改变,例如改变尺寸、酸度、亲核性、氢键、疏水性、蛋白酶靶位点可接取性、靶向部分(例如,对于蛋白质阵列)等。包括非天然氨基酸的蛋白质可具有增强或者甚至全新的催化或物理特性。举例来说,任选通过将非天然氨基酸包涵入蛋白质中来改变以下特性:毒性、生物分布、结构特性、光谱特性、化学和/或光化学特性、催化能力、半衰期(例如,血清半衰期)、与其它分子反应(例如共价或非共价)的能力等。包括包含至少一个非天然氨基酸的蛋白质的组合物可用于例如新颖治疗剂、诊断剂、催化酶、工业酶、结合蛋白(例如,抗体)以及例如蛋白质结构和功能研究。例如参看Dougherty,(2000)Unnatural Amino Acids as Probes of Protein Structure and Function,Current Opinion in Chemical Biology.4:645-652。
[0173] 在本发明一方面中,组合物包括至少一种具有至少一个、例如至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个或至少十个或更多非天然氨基酸的蛋白质。非天然氨基酸可相同或不同,例如可在蛋白质中1、2、3、4、5、6、7、8、9、10个或更多不同位点包含1、2、3、4、5、6、7、8、9、10个或更多不同非天然氨基酸。另一方面,组合物包括蛋白质中存在的至少一个(但少于全部)特定氨基酸经非天然氨基酸取代的蛋白质。对于具有一个以上非天然氨基酸的指定蛋白质,非天然氨基酸可相同或不同(例如,所述蛋白质可包括两种或两种以上不同类型的非天然氨基酸,或可包括相同非天然氨基酸中的两个)。对于具有两个以上非天然氨基酸的指定蛋白质,非天然氨基酸可相同、不同或为多个相同种类的非天然氨基酸与至少一个不同非天然氨基酸的组合。
[0174] 基本上任何包括非天然氨基酸的蛋白质(或其部分)(以及任何相应编码核酸,例如其包括一个或多个选择性密码子)都可使用本文中的组合物和方法产生。未进行尝试来鉴别成千上万种已知蛋白质,所述蛋白质中任一种可例如通过调整任何可用突变方法以在相关翻译系统中包括一个或多个适当选择性密码子来修饰,从而包括一个或多个非天然氨基酸。已知蛋白质的常见序列谱系包括GenBank EMBL、DDBJ和NCBI。可易于通过搜索互联网鉴别其它谱系。
[0175] 通常,蛋白质与任何可用蛋白质(例如,治疗性蛋白质、诊断性蛋白质、工业酶或其部分等)例如至少60%、至少70%、至少75%、至少80%、至少90%、至少95%或至少99%或更高一致,且其包含一个或多个非天然氨基酸。可经修饰以包含一个或多个非天然氨基酸的治疗性、诊断性和其它蛋白质的实例包括(但不限于)例如α-1抗胰蛋白酶、血管抑素、抗溶血因子、抗体(关于抗体的其它细节见下文)、载脂蛋白、脱辅基蛋白、心房利钠因子、心房利钠多肽、心房肽、C-X-C趋化因子(例如,T39765、NAP-2、ENA-78、Gro-a、Gro-b、Gro-c、IP-10、GCP-2、NAP-4、SDF-1、PF4、MIG)、降钙素、CC趋化因子(例如,单核细胞趋化蛋白-1、单核细胞趋化蛋白-2、单核细胞趋化蛋白-3、单核细胞炎症蛋白-1α、单核细胞炎症蛋白-1β、RANTES、I309、R83915、R91733、HCC1、T58847、D31065、T64262)、CD40配体、C-kit配体、胶原蛋白、群落刺激因子(CSF)、补体因子5a、补体抑制剂、补体受体1、细胞因子(例如,上皮中性粒细胞活化肽-78、GROα/MGSA、GROβ、GROγ、MlP-1α、MIP-1δ、MCP-1)、表皮生长因子(EGF)、促红细胞生成素(“EPO”,代表通过并入一个或多个非天然氨基酸修饰的优选靶)、脱落毒素A和B、因子IX、因子VII、因子VIII、因子X、成纤维细胞生长因子(FGF)、纤维蛋白原、纤维粘连蛋白、G-CSF、GM-CSF、葡糖脑苷脂酶、促性腺激素、生长因子、刺猬蛋白(例如,音速(Sonic)、印度(Indian)、沙漠(Desert))、血红蛋白、肝细胞生长因子(HGF)、水蛭素、人血清白蛋白、胰岛素、类胰岛素生长因子(IGF)、干扰素(例如,IFN-α、IFN-β、IFN-γ)、白细胞介素(例如,IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12等)、角质细胞生长因子(KGF)、乳铁蛋白、白血病抑制因子、荧光素酶、神经营养因子、中性粒细胞抑制因子(NIF)、抑瘤素M、成骨蛋白、甲状旁腺激素、PD-ECSF、PDGF、肽激素(例如,人生长激素)、多效生长因子、蛋白质A、蛋白质G、致热性外毒素A、B和C、松驰素、肾素、SCF、可溶性补体受体I、可溶性I-CAM 1、可溶性白细胞介素受体(IL-1、2、3、4、5、6、7、9、10、11、12、13、14、
15)、可溶性TNF受体、生长调节素、生长抑素、生长激素、链激酶、超抗原(即葡萄球菌肠毒素(SEA、SEB、SEC1、SEC2、SEC3、SED、SEE))、超氧化物歧化酶(SOD)、中毒性休克综合症毒素(TSST-1)、胸腺肽α1、组织型纤溶酶原活化剂、肿瘤坏死因子β(TNFβ)、肿瘤坏死因子受体(TNFR)、肿瘤坏死因子α(TNFα)、血管内皮生长因子(VEGEF)、尿激酶等。
[0176] 可使用本文所述的用于活体内并入非天然氨基酸的组合物和方法产生的一类蛋白质包括转录调节蛋白或其部分。转录调节蛋白的实例包括调节细胞生长、分化、调控等的基因和转录调节蛋白。转录调节蛋白可在原核生物、病毒和真核生物(包括真菌、植物、酵母、昆虫,和动物,包括哺乳动物)中发现,从而提供多种治疗靶。应了解,表达和转录活化因子通过许多机制,例如通过结合受体、刺激信号转导级联、调控转录因子表达、结合启动子和增强子、与结合启动子和增强子的蛋白质结合、解开DNA、剪接前体mRNA、使RNA多聚腺苷酸化和降解RNA,来调控转录。举例来说,脊椎动物细胞中的GAL4蛋白或其部分的组合物也为本发明的特征。通常,GAL4蛋白或其部分包含至少一个非天然氨基酸。也参看本文中题为“正交氨酰基-tRNA合成酶”的章节。
[0177] 本发明的一类蛋白质(例如,具有一个或多个非天然氨基酸的蛋白质)包括表达活化因子,诸如细胞因子、炎症分子、生长因子、其受体和癌基因产物,例如白细胞介素(例如,IL-1、IL-2、IL-8等)、干扰素、FGF、IGF-I、IGF-II、FGF、PDGF、TNF、TGF-α、TGF-β、EGF、KGF、SCF/c-Kit、CD40L/CD40、VLA-4/VCAM-1、ICAM-1/LFA-1和透明质酸/CD44;信号转导分子和相应癌基因产物,例如,Mos、Ras、Raf和Met;和转录活化因子和抑制因子,例如p53、Tat、Fos、Myc、Jun、Myb、Rel,和类固醇激素受体,诸如雌激素、孕酮、睾酮、醛固酮、LDL受体配体和皮质酮的受体。
[0178] 本发明还提供具有至少一个非天然氨基酸的酶(例如,工业酶)或其部分。酶的实例包括(但不限于)例如酰胺酶、氨基酸消旋酶、酰化酶、脱卤酶、双加氧酶、二芳基丙烷过氧化物酶、表异构酶、环氧化物水解酶、酯酶、异构酶、激酶、葡萄糖异构酶、糖苷酶、糖基转移酶、卤素过氧化物酶、单加氧酶(例如,p450)、脂肪酶、木素过氧化物酶、腈水合酶、腈水解酶、蛋白酶、磷酸酶、枯草杆菌蛋白酶、转氨酶和核酸酶。
[0179] 这些蛋白质中有许多在市面上有售(例如参看,Sigma BioSciences 2002目录和报价单),且相应蛋白质序列和基因以及其许多常见变异体众所周知(例如参看Genbank)。可通过插入根据本发明的一个或多个非天然氨基酸来修饰其中任一种,从而例如改变蛋白质的所关注的一种或多种治疗、诊断或酶特性。治疗相关特性的实例包括血清半衰期、保存半衰期、稳定性、免疫原性、治疗活性、可检测性(例如,通过在非天然氨基酸中包涵报告子基团(例如,标记或标记结合位点))、LD50或其它副作用的减少、通过肠道进入身体的能力(例如,口服生物可用性)等。诊断特性的实例包括保存半衰期、稳定性、诊断活性、可检测性等。相关酶特性的实例包括保存半衰期、稳定性、酶活性、生产量等。
[0180] 还可对多种其它蛋白质加以修饰以包括本发明的一个或多个非天然氨基酸。举例来说,本发明可包括利用例如以下来源的蛋白质中的非天然氨基酸取代一种或多种蛋白疫苗中的一个或多个天然氨基酸:感染性真菌,例如曲霉属(Aspergillus)、念珠菌属(Candida);充当病原菌模型的细菌、尤其大肠杆菌,以及医学上重要的细菌,诸如葡萄球菌属(Staphylococci)(例如,金黄葡萄球菌(aureus))或链球菌属(Streptococci)(例如,炎链球菌(pneumoniae));原生生物,诸如孢子虫类(sporozoa)(例如,疟原虫(Plasmodia))、根足虫(rhizopod)(例如,内阿米巴属(Entamoeba))和鞭毛虫(flagellate)(锥虫(Trypanosoma)、利什曼虫(Leishmania)、毛滴虫(Trichomonas)、贾第虫(Giardia)等);病毒,诸如(+)RNA病毒(实例包括痘病毒,例如痘(vaccinia);细小核糖核酸病毒,例如,脊髓灰质炎病毒(polio);外衣病毒,例如疹病毒(rubella);黄病毒,例如HCV;和冠状病毒)、(-)RNA病毒(例如,棒状病毒,例如VSV;副粘病毒,例如RSV;流感粘病毒,例如流感病毒;本雅病毒(Bunyavirus);和腺病毒)、dsDNA病毒(例如,呼肠孤病毒(Reovirus)、RNA变为DNA的病毒(即逆转录病毒,例如HIV和HTLV)和某些DNA变为RNA的病毒(诸如乙型肝炎病毒)。
[0181] 农业相关的蛋白也为非天然氨基酸修饰的适当靶,诸如昆虫抗性蛋白(例如,Cry蛋白)、淀粉和脂质产生酶、植物和昆虫毒素、毒素抗性蛋白、霉菌毒素脱毒蛋白、植物生长酶(例如,1,5-二磷酸核酮糖羧化酶/加氧酶,“RUBISCO”)、脂氧合酶(LOX)和烯醇丙酮酸磷酸(PEP)羧化酶。
[0182] 本发明还提供用于在脊椎动物细胞中产生至少一种包含至少一个非天然氨基酸的蛋白质的方法(以及由所述方法产生的蛋白质)。举例来说,方法包括:使包含包括至少一个选择性密码子且编码蛋白质的核酸的脊椎动物细胞在适当培养基中生长。脊椎动物细胞还包含:正交tRNA(O-tRNA),其在细胞中起作用并且识别选择性密码子;和正交氨酰基-tRNA合成酶(O-RS),其优先利用非天然氨基酸将O-tRNA氨酰化;并且所述培养基包含非天然氨基酸。
[0183] 在一个实施例中,所述方法另外包括将非天然氨基酸并入蛋白质中,其中所述非天然氨基酸包含第一反应性基团;和使所述蛋白质与包含第二反应性基团的分子(例如,染料、例如聚乙二醇衍生物等聚合物、光交联剂、细胞毒性化合物、亲和标记、生物素衍生物、树脂、第二蛋白质或多肽、金属螯合剂、辅因子、脂肪酸、碳水化合物、多聚核苷酸(例如,DNA、RNA等)等)接触。第一反应性基团与第二反应性基团反应以通过[3+2]环加成将所述分子与非天然氨基酸连接。在一个实施例中,第一反应性基团为炔基或叠氮基部分且第二反应性基团为叠氮基或炔基部分。举例来说,第一反应性基团为炔基部分(例如,在非天然氨基酸对炔丙基氧基苯丙氨酸中)且第二反应性基团为叠氮基部分。在另一实例中,第一反应性基团为叠氮基部分(例如,在非天然氨基酸对叠氮基-L-苯丙氨酸中)且第二反应性基团为炔基部分。
[0184] 在一个实施例中,O-RS利用非天然氨基酸以与具有(例如)如SEQ ID NO.:86或45中所述的氨基酸序列的O-RS至少50%一样的效率将O-tRNA氨酰化。在另一实施例中,O-tRNA包含SEQ ID NO.:65或64或者其互补多聚核苷酸序列;由SEQ ID NO.:64或65或者其互补多聚核苷酸序列加工;或由SEQ ID NO.:64或65或者其互补多聚核苷酸序列编码。在另一实施例中,O-RS包含SEQ ID NO.:36-63和/或86中任一序列所述的氨基酸。
[0185] 所编码的蛋白质可包含例如治疗性蛋白质、诊断性蛋白质、工业酶或其部分。由所述方法产生的蛋白质任选进一步经非天然氨基酸修饰。举例来说,任选通过至少一种活体内翻译后修饰来修饰由所述方法产生的蛋白质。
[0186] 还提供产生筛选或选择转录调节蛋白的方法(以及由所述方法产生的筛选或选择转录调节蛋白)。举例来说,方法包括:选择第一多聚核苷酸序列,其中所述多聚核苷酸序列编码核酸结合结构域;和使所述第一多聚核苷酸序列突变以包括至少一个选择性密码子。这将提供筛选或选择多聚核苷酸序列。所述方法还包括:选择第二多聚核苷酸序列,其中所述第二多聚核苷酸序列编码转录活化结构域;提供包含可操作性连接到第二多聚核苷酸序列的筛选或选择多聚核苷酸序列的构建体;和将所述构建体、非天然氨基酸、正交tRNA合成酶(O-RS)和正交tRNA(O-tRNA)引入细胞中。利用这些组件,O-RS优先利用非天然氨基酸将O-tRNA氨酰化,且O-tRNA识别选择性密码子,并响应筛选或选择多聚核苷酸序列中的选择性密码子将非天然氨基酸并入核酸结合结构域中,从而提供筛选或选择转录调节蛋白。
[0187] 在某些实施例中,本发明的方法和/或组合物中的所关注蛋白质或多肽(或其部分)是由核酸编码。通常,核酸包含至少一个选择密码子、至少两个选择密码子、至少三个选择密码子、至少四个选择密码子、至少五个选择密码子、至少六个选择密码子、至少七个选择密码子、至少八个选择密码子、至少九个选择密码子、十个或十个以上选择密码子。
[0188] 可使用所属领域技术人员众所周知且在本文中在“诱变和其它分子生物学技术”下描述的方法诱变编码所关注蛋白质或多肽的基因以包括例如一个或多个选择性密码子以便并入非天然氨基酸。举例来说,使所关注蛋白质的核酸诱变以包括一个或多个选择性密码子,从而插入一个或多个非天然氨基酸。本发明包括例如包括至少一个非天然氨基酸的任何蛋白质的任何此种变异体(例如,突变体)型式。类似地,本发明还包括相应核酸,即,具有一个或多个编码一个或多个非天然氨基酸的选择性密码子的任何核酸。
[0189] 纯化包含非天然氨基酸的重组蛋白
[0190] 根据所属领域技术人员已知且使用的标准程序,可将本发明的蛋白质(例如包含非天然氨基酸的蛋白质、针对包含非天然氨基酸的蛋白质的抗体等)部分或实质上纯化成均质。因此,可通过所属领域中众所周知的众多方法中的任一种来回收和纯化本发明的多肽,这些方法包括例如硫酸铵或乙醇沉淀、酸或碱萃取、柱色谱、亲和柱色谱、阴离子或阳离子交换色谱、磷酸纤维素色谱、疏水相互作用色谱、羟基磷灰石色谱、凝集素色谱、凝胶电泳等。必要时,在制备正确折叠的成熟蛋白质时可使用蛋白质再折叠步骤。可将高效液相色谱(HPLC)、亲和色谱或其它适合方法用于需要高纯度的最后纯化步骤中。在一个实施例中,将针对非天然氨基酸(或包含非天然氨基酸的蛋白质)制成的抗体用作纯化试剂,例如以基于亲和力纯化包含一个或多个非天然氨基酸的蛋白质。必要时,在部分纯化或纯化达到均质后,任选将多肽例如用作分析组分、治疗剂或抗体产生的免疫原。
[0191] 除了本文中指出的其它参考文献之外,所属领域中众所周知多种纯化/蛋白质折叠方法,包括例如以下文献中描述的那些:R.Scopes,Protein Purification,Springer-Verlag,N.Y.(1982);Deutscher,Methods in Enzymology第182卷:Guide to Protein Purification.Academic Press,Inc.N.Y.(1990);Sandana,(1997)Bioseparation of Proteins.Academic Press,Inc.;Bollag等人(1996)Protein Methods,第2版Wiley-Liss,NY;Walker,(1996)The Protein Protocols Handbook Humana Press,NJ,Harris和Angal,(1990)Protein Purification Applications:A Practical Approach IRL Press at Oxford,Oxford,England;Harris和Angal,Protein Purification Methods:A Practical Approach IRL Press at Oxford,Oxford,England;Scopes,(1993)Protein Purification:Principles and Practice第3版Springer Verlag,NY;Janson和Ryden,(1998)Protein Purification:Principles.High Resolution Methods and 
Applications,第2版Wiley-VCH,NY;和Walker(1998),Protein Protocols on CD-ROM Humana Press,NJ;以及其中所引用的参考文献。
[0192] 在脊椎动物细胞中产生具有至少一个非天然氨基酸的所关注蛋白质或多肽的一个优点在于,通常所述蛋白质或多肽将以其天然构象折叠。然而,在本发明某些实施例中,所属领域技术人员将认识到,在合成、表达和/或纯化之后,蛋白质可具有与相关多肽的所需构象不同的构象。在本发明一个方面中,所表达的蛋白质任选变性且随后复性。这是例如通过将伴侣蛋白(chaperonin)添加到所关注蛋白质或多肽中,和/或通过将蛋白质溶解于诸如盐酸胍等离液剂中来实现。
[0193] 一般来说,有时候需要变性和还原所表达的多肽且随后使多肽再折叠成优选构象。举例来说,可将胍、尿素、DTT、DTE和/或伴侣蛋白添加到所关注翻译产物中。所属领域技术人员众所周知还原、变性和复性蛋白质的方法(参看上述参考文献,以及Debinski等人,(1993)J.Biol.Chem.,268:14065-14070;Kreitman和Pastan(1993)Bioconjug.Chem.,4:581-585;和Buchner等人,(1992)Anal.Biochem.,205:263-270)。举例来说,Debinski等人描述在胍-DTE中使包涵体蛋白质变性和还原。所述蛋白质可在含有例如氧化谷胱甘肽和L-精氨酸的氧化还原缓冲液中再折叠。再折叠试剂可流动或以其它方式移动以与一种或多种多肽或其它表达产物接触,或者一种或多种多肽或其它表达产物可流动或以其它方式移动以与再折叠试剂接触。
[0194] 抗体
[0195] 一方面,本发明提供针对本发明的分子,例如合成酶、tRNA和包含非天然氨基酸的蛋白质的抗体。针对本发明的分子的抗体可用作纯化试剂,例如以供纯化本发明的分子。此外,可将所述抗体用作指示剂以指示合成酶、tRNA或包含非天然氨基酸的蛋白质的存在,例如以便追踪所述分子的存在或位置(例如,活体内或原位)。
[0196] 本发明的抗体可为包含一个或多个实质上或部分由免疫球蛋白基因或免疫球蛋白基因片段编码的多肽的蛋白质。认可的免疫球蛋白基因包括κ、λ、α、γ、δ、ε和μ恒定区基因,以及多种免疫球蛋白可变区基因。轻链分为κ或λ。重链分为γ、μ、α、δ或ε,其又分别定义免疫球蛋白种类IgG、IgM、IgA、IgD和IgE。典型免疫球蛋白(例如抗体)结构单元包含四聚体。各四聚体是由两对相同的多肽链构成,各对具有一条“轻链”(约25kD)和一条“重链”(约50-70kD)。各链的N末端界定主要负责抗原识别的具有约100到110或更多个氨基酸的可变区。术语可变轻链(VL)和可变重链(VH)分别是指这些轻链和重链。
[0197] 抗体是以完整免疫球蛋白形式或由各种肽酶消化产生的多个充分表征的片段的形式存在。因此,举例来说,胃蛋白酶消化抗体铰链区中的二硫键联,产生F(ab')2,即Fab的二聚体,所述Fab本身为通过二硫键与VH-CH1连接的轻链。F(ab')2可在温和条件下还原以断开铰链区中的二硫键联,从而将F(ab')2二聚体转化成Fab'单体。Fab'单体基本上为具有铰链区的部分的Fab(关于其它抗体片段的更为详细地描述,参看Fundamental Immunology.第4版,W.E.Paul编,Raven Press,N.Y.(1999))。尽管根据完整抗体的消化定义各种抗体片段,但所属领域技术人员将了解,所述Fab'片段等可以化学方法或通过利用重组DNA方法重新合成。因此,如本文所使用,术语抗体还任选包括由修饰完整抗体产生或使用重组DNA方法重新合成的抗体片段。抗体包括单链抗体,包括单链Fv(sFv或scFv)抗体,其中可变重链与可变轻链连接在一起(直接连接或通过肽连接子连接)形成连续多肽。本发明的抗体可例如为多克隆抗体、单克隆抗体、嵌合抗体、人化抗体、单链抗体、Fab片段、由Fab表达文库产生的片段等。
[0198] 一般说来,本发明的抗体在多种分子生物或制药过程中作为普通试剂和治疗剂都极具价值。产生多克隆和单克隆抗体的方法可得到,并且可用于制造本发明的抗体。多个基本文本中描述标准抗体产生方法,包括例如Borrebaeck(编)(1995)Antibody Engineering.第2版Freeman and Company,NY(Borrebaeck);McCafferty等人(1996)Antibody Engineering,A Practical Approach IRL Oxford Press,Oxford,England(McCafferty);和Paul(1995)Antibody Engineering Protocols Humana Press,Towata,NJ(Paul);Paul(编),(1999)Fundamental Immunology.第5版Raven Press,N.Y.;Coligan(1991)Current Protocols in Immunology Wiley/Greene,NY;Harlow和Lane(1989)Antibodies:A Laboratory Manual Cold Spring Harbor Press,NY;Stites等人(编)Basic and Clinical Immunology(第4版)Lange Medical Publications,Los Altos,CA,和其中引用的参考文献;Goding(1986)Monoclonal Antibodies:Principles and Practice(第2版)Academic Press,New York,NY;以及Kohler和Milstein(1975)Nature 
256:495-497。
[0199] 已开发出多种用于抗体制备的不依赖于例如将抗原注射到动物中的重组技术,并且可将其用于本发明的情形中。举例来说,有可能在噬菌体或类似载体中产生并选择重组抗体文库。关于评论,例如参看Winter等人(1994)Making Antibodies by Phage Display Technology Annu.Rev.Immunol.12:433-55和其中所引用的参考文献。还参看,Griffiths和Duncan(1998)Strategies for selection of antibodies by phage display Curr Opin Biotechnol 9:102-8;Hoogenboom等人(1998)Antibody phage display technology and its applications Immunotechnology 4:1-20;Gram等人(1992)in vitro selection and affinity maturation  of antibodies from a naive combinatorial immunoglobulin library PNAS 89:3576-3580;Huse等人(1989)Science 246:1275-1281;
和Ward等人(1989)Nature 341:544-546。
[0200] 在一个实施例中,抗体文库可包括V基因谱系(例如,从淋巴细胞群采集或在活体外组装),其经克隆以在丝状噬菌体表面上展示相关重链和轻链可变结构域。通过结合抗原来选择噬菌体。可溶性抗体是由感染噬菌体的细菌表达并且可例如经由诱变来改进抗体。例如参看,Balint和Larrick(1993)Antibody Engineering  by Parsimonious 
Mutagenesis Gene 137:109-118;Stemmer等人(1993)Selection of an Active Single-Chain Fv Antibody From a Protein Linker Library Prepared by Enzymatic Inverse PCR Biotechniques 14(2):256-65;Crameri等人(1996)Construction and evolution ofantibody-phage libraries by DNA shuffling Nature Medicine 2:100-103;以及Crameri和Stemmer(1995)Combinatorial multiple cassette mutagenesis creates all the permutations of mutant and wildtype cassettes BioTechniques 18:194-195。
[0201] 用于克隆和表达重组抗体噬菌体系统的试剂盒也已知且可得,例如来自Amersham-Pharmacia Biotechnology(Uppsala,Sweden)的“重组噬菌体抗体系统小鼠ScFv组件(mouse ScFv module)”。也已产生噬菌体抗体文库以通过链改组制造高亲和力人类抗体(例如参看,Marks等人(1992)By-Passing Immunization:Building High Affinity Human Antibodies by Chain Shuffling Biotechniques 10:779-782)。还应认识到,可通过多种商务服务中任一种(例如,Bethyl Laboratories(Montgomery,TX)、Anawa
(Switzerland)、Eurogentec(Belgium且在US,Philadelphia,PA)等制备抗体。
[0202] 在某些实施例中,将本发明的抗体“人化”是有用的,例如在所述抗体将会治疗性投与的情况下。使用人化抗体倾向于减少针对治疗性抗体的不合需要的免疫反应的发生率(例如,当患者为人类时)。上述抗体参考文献中描述人化策略。除人化抗体外,人类抗体也为本发明的特征。人类抗体是由特征性人类免疫球蛋白序列组成。人类抗体可使用多种方法产生(关于评论,例如参看Larrick等人的美国专利第5,001,065号)。通过三源杂交瘤技术产生人类抗体的通用方法描述于Ostberg等人(1983),Hybridoma 2:361-367;Ostberg的美国专利第4,634,664号和Engelman等人的美国专利第4,634,666号中。
[0203] 已知多种将抗体用于蛋白质的纯化和检测中的方法,且其可用于检测和纯化如本文所述包含非天然氨基酸的蛋白质。一般说来,抗体为ELISA、Western印迹法、免疫化学、亲和色谱法、SPR和许多其它方法的有用试剂。上文所述的参考文献提供有关如何执行ELISA分析、Western印迹、表面等离子体共振(SPR)等的细节。
[0204] 在本发明一方面中,本发明的抗体本身包括非天然氨基酸,提供具有所关注特性的抗体(例如,改进的半衰期、稳定性、毒性等)。还参看本文中题为“具有非天然氨基酸的多肽”的章节。抗体占当前临床试验中所有化合物的近50%(Wittrup,(1999)Phage on display Tibtech 17:423-424)且抗体普遍用作诊断试剂。因此,利用非天然氨基酸修饰抗体的能力提供修饰这些有价值的试剂的重要工具。
[0205] 举例来说,存在将MAb用于诊断领域的多种应用。分析范围从简单的斑点试验到较为复杂的方法,诸如用于肿瘤成像的来自DuPont Merck Co.放射性标记的NR-LU-10MAb(Rusch等人(1993)NR-LU-10monoclonal antibody scanning.A helpful new adjunct to computed tomography in evaluating non-small-cell lung cancer.J Thorac Cardiovasc Surg 106:200-4)。如所述,MAb为ELISA、Western印迹法、免疫化学、亲和色谱法等的重要试剂。可对任何此类诊断抗体加以修饰以包括一个或多个非天然氨基酸,从而改变例如Ab对靶的特异性或亲合力,或例如通过在非天然氨基酸中包括可检测标记(例如,光谱、荧光、发光等)来改变一种或多种可检测特性。
[0206] 一类有价值的抗体试剂为治疗性Ab。举例来说,抗体可为通过靶向肿瘤细胞以通过抗体依赖细胞介导的细胞毒性(ADCC)或补体介导的细胞溶解(CML)破坏来阻止肿瘤生长的肿瘤特异性Mab(这些常见类型的Ab有时称为“魔术弹(magic bullet)”)。一个实例为利妥昔单抗(Rituxan),一种治疗非霍奇金氏淋巴瘤(Non-Hodgkins lymphoma)的抗CD20Mab(Scott(1998)Rituximab:a new therapeutic monoclonal antibody for non-Hodgkin's lymphoma Cancer Pract 6:195-7)。第二个实例涉及干扰肿瘤生长的关键组分的抗体。赫赛汀(Herceptin)为一种用于治疗转移性乳癌的抗HER-2单克隆抗体,并且提供具有此作用机制的抗体的实例(Baselga等人(1998)Recombinant humanized anti-HER2antibody(Herceptin)enhances the antitumor activity of paclitaxel and doxorubicin against HER2/neu over expressing human breast cancer xenografts[公开的勘误表见于Cancer Res(1999)59(8):2020],Cancer Res 58:2825-31)。第三个实例涉及将细胞毒性化合物(毒素、放射性核素等)直接递送到肿瘤或其它所关注部位的抗体。举例来说,一个应用Mab为CYT-356,一种将辐射直接靶向前列腺肿瘤细胞的90Y连接的抗体(Deb等人Treatment of hormone-refractory prostate cancer with 90Y-CYT-356monoclonal antibody Clin Cancer Res 2:1289-97)。第四个应用为抗体定向酶前药疗法(antibody-directed enzyme prodrug therapy),其中共定位于肿瘤的酶可活化在肿瘤邻近地区中全身投与的前药。举例来说,正开发一种连接到羧肽酶A的抗Ep-CAM1抗体来治疗结肠直肠癌(Wolfe等人(1999)Antibody-directed enzyme prodrug therapy with the T268G mutant of human carboxypeptidase A1:in vitro and in vivo studies with prodrugs of methotrexate and the thymidylate synthase inhibitors GW1031and GW1843Bioconiug Chem 10:38-48)。其它Ab(例如,拮抗剂)经设计以特异性抑制正常细胞功能用于治疗益处。实例为奥素健体(Orthoclone)OKT3,一种由强生公司(Johnsonand Johnson)所提供的用于减少急性器官移植物排斥的抗CD3MAb(Strate等人(1990)
Orthoclone OKT3as first-line therapy in acute renal allograft rejection Transplant Proc 22:219-20)。另一类抗体产物为激动剂。这些Mab经设计以特异性增强正常细胞功能用于治疗益处。举例来说,用于神经疗法的基于Mab的乙酰胆碱受体激动剂正在开发中(Xie等人Direct demonstration of MuSK involvement in acetylcholine receptor clustering through identification of agonist ScFv Nat.Biotechnol.15:
768-71)。这些抗体中任一种可经修饰以包括一个或多个非天然氨基酸以增强一种或多种治疗特性(特异性、亲合力、血清半衰期等)。
[0207] 另一类抗体产物提供新颖功能。这一组中的主要抗体为已经工程改造以模拟酶的催化能力的催化抗体,诸如Ig序列(Wentworth和Janda(1998)Catalytic antibodies Curr Opin Chem Biol 2:138-44)。举例来说,值得关注的应用涉及使用催化抗体mAb-15A10以在活体内水解可卡因(cocaine)以用于成瘾的治疗(Mets等人(1998)A catalytic antibody against cocaine prevents cocaine's reinforcing and toxic effects in rats Proc Natl Acad Sci USA 95:10176-81)。催化抗体还可经修饰以包括一个或多个非天然氨基酸以改进一种或多种所关注特性。
[0208] 通过免疫反应性定义多肽
[0209] 由于本发明的多肽提供多种新的多肽序列(例如,在本文中的翻译系统中合成的蛋白质的情况下包含非天然氨基酸;或例如在本文中新颖合成酶的情况下,包含新颖标准氨基酸序列),故所述多肽还提供可例如在免疫学分析中识别的新结构特征。特异性结合本发明多肽的抗体或抗血清的产生以及所述抗体或抗血清所结合的多肽为本发明的特征。
[0210] 举例来说,本发明包括合成酶蛋白,其特异性结合针对包含选自(SEQ ID NO:36-63和/或86)中一个或多个序列的氨基酸序列的免疫原所产生的抗体或抗血清或与所述抗体或抗血清特异性免疫反应。为除去与其它同源物交叉反应,利用诸如野生型大肠杆菌酪氨酰基合成酶(TyrRS)(例如SEQ ID NO.:2)等可用对照合成酶同源物消减抗体或抗血清。
[0211] 在一种典型形式中,免疫分析使用针对一种或多种包含一个或多个对应于SEQ ID NO:36-63和/或86中一个或多个序列或者其实质子序列(即,提供至少约30%的全长序列)的序列的多肽产生的多克隆抗血清。得自SEQ ID NO:36-63和86的潜在多肽免疫原组在下文中统称为“免疫原性多肽”。任选选择所得抗血清以对于对照合成酶同源物具有低交叉反应性,并且在免疫分析中使用多克隆抗血清之前,利用一种或多种对照合成酶同源物,例如通过免疫吸附去除任何此类交叉反应性。
[0212] 为了能产生用于免疫分析中的抗血清,可如本文所述产生一种或多种免疫原性多肽并加以纯化。举例来说,可在重组细胞中产生重组蛋白。利用免疫原性蛋白与标准佐剂(诸如,夫罗因德佐剂(Freund's adjuvant))的组合以及标准小鼠免疫方案,对近交系小鼠(因为结果归因于小鼠的实质遗传一致更为可重复从而用于此分析中)进行免疫(有关抗体产生、可用于测定特异性免疫反应性的免疫分析形式和条件,例如参看Harlow和Lane(1988)Antibodies,A Laboratory Manual.Cold Spring Harbor Publications,New York。有关抗体的其它参考文献和论述也见于本文中且可在本文中用于制造通过免疫反应性定义/检测多肽的抗体)。另外,可将得自本文中所揭示的序列的一种或多种合成或重组多肽与载体蛋白连结并用作免疫原。
[0213] 收集多克隆血清并且在免疫分析,例如,利用一种或多种固定于固体支撑物上的免疫原性蛋白的固相免疫分析中,对免疫原性多肽进行滴定。选择具有106或更高滴度的多克隆抗血清,汇集并利用对照合成酶多肽消减,以产生消减的经汇集的经滴定多克隆抗血清。
[0214] 在比较免疫分析中,测试消减的所汇集的经滴定多克隆抗血清对于对照同源物的交叉反应性。在这个比较分析中,测定用于消减的经滴定多克隆抗血清的差别结合条件,这引起比结合对照合成酶同源物高至少约5-10倍的经滴定多克隆抗血清和免疫原性合成酶的信噪比。也就是说,通过添加诸如白蛋白或无脂肪奶粉等非特异性竞争剂,和/或通过调节盐条件、温度等,来调节结合/洗涤反应的严格度。将这些结合/洗涤条件用于后续分析中,以测定所汇集的经消减的多克隆抗血清是否特异性结合测试多肽(与免疫原性多肽和/或对照多肽相比较的多肽)。具体说来,如与已知合成酶相比,在差别结合条件下展示比对照合成酶同源物高至少2-5×的信噪比以及为免疫原性多肽的至少约1/2的信噪比的测试多肽与免疫原性多肽共有相当大的结构相似性,且因此为本发明的多肽。
[0215] 在另一实例中,将竞争性结合形式的免疫分析用于检测测试多肽。举例来说,如所述,通过利用对照多肽的免疫吸附将交叉反应的抗体从汇集的抗血清混合物中去除。随后,将免疫原性多肽固定于暴露于所汇集的消减抗血清的固体支撑物上。将测试蛋白质添加到所述分析中以竞争结合所汇集的消减抗血清。将与固定蛋白质相比,测试蛋白质竞争结合所汇集的消减抗血清的能力与添加到所述分析中的免疫原性多肽竞争结合的能力(所述免疫原性多肽有效地与固定的免疫原性多肽竞争结合所汇集的抗血清)相比较。使用标准计算法计算测试蛋白质的交叉反应性百分比。
[0216] 在平行分析中,任选与免疫原性多肽竞争结合抗血清的能力相比较,测定对照蛋白质竞争结合所汇集的消减抗血清的能力。再使用标准计算法计算对照多肽的交叉反应性百分比。当测试多肽的交叉反应性百分比为对照多肽的至少5-10×高时,和或当测试多肽的结合大致在免疫原性多肽结合的范围内时,认为所述测试多肽特异性结合所汇集的消减抗血清。
[0217] 一般说来,可将经免疫吸附且汇集的抗血清用于如本文所述的竞争性结合免疫分析中,以将任何测试多肽与免疫原性和/或对照多肽相比较。为进行这个比较,分别分析多种浓度的免疫原性、测试和对照多肽,并且使用标准技术测定抑制50%的消减抗血清与例如经固定对照、测试或免疫原性蛋白质结合所需的各多肽的量。如果在竞争性分析中结合所需的测试多肽的量比所需的免疫原性多肽的量少2倍,那么只要所述量为对照多肽的至少约5-10×高,即认为测试多肽特异性结合针对免疫原性蛋白质所产生的抗体。
[0218] 作为特异性的另一测定法,任选利用免疫原性多肽(而非对照多肽)完全免疫吸附所汇集的抗血清,直到可检测到极少所得免疫原性多肽-经汇集的消减抗血清与免疫吸附中所使用的免疫原性多肽的结合或无法检测到结合。随后测试所述完全免疫吸附的抗血清与测试多肽的反应性。如果观察到极少反应性或未观察到反应性(即,关于完全免疫吸附的抗血清与免疫原性多肽结合观察到不超过2×的信噪比),那么免疫原性蛋白质引起抗血清与测试多肽的特异性结合。
[0219] 医药组合物
[0220] 将本发明的多肽或蛋白质(例如,合成酶、包含一个或多个非天然氨基酸的蛋白质等)任选例如与适当医药载剂组合用于治疗用途。所述组合物例如包含治疗有效量的化合物和医药学上可接受的载剂或赋形剂。所述载剂或赋形剂包括(但不限于)生理盐水、缓冲生理盐水、右旋糖、水、甘油、乙醇和/或其组合。调配物经制备成与投药模式相适应。一般来说,所属领域众所周知投与蛋白质的方法并且其可应用于投与本发明的多肽。
[0221] 根据所属领域众所周知的方法,任选在一种或多种适当的活体外和/或活体内动物疾病模型中测试包含一种或多种本发明的多肽的治疗性组合物,以确定功效、组织代谢并评估剂量。具体来说,最初可通过本文中非天然氨基酸同源物相对于天然氨基酸同源物的活性、稳定性或其它适当量度(例如,经修饰以包括一个或多个非天然氨基酸的EPO与天然氨基酸EPO的比较)(即在相关分析中)来确定剂量。
[0222] 投药可通过通常用于将分子引入以使其与血液或组织细胞紧密接触的任何途径进行。本发明的非天然氨基酸多肽是以任何适当的方式任选与一种或多种医药学上可接受的载剂一起投与。对患者投与本发明上下文中的所述多肽的适当方法都可用,且尽管可使用一种以上途径投与特定组合物,但特定途径通常能够提供比另一途径更快捷且更有效的作用或反应。
[0223] 医药学上可接受的载剂部分是由所投与的特定组合物以及用于投与组合物的特定方法决定。因此,存在多种本发明医药组合物的适当调配物。
[0224] 多肽组合物可通过多种途径投与,包括(但不限于)口服、静脉内、腹膜内、肌肉内、透皮、皮下、局部、舌下或直肠方式。还可经由脂质体投与非天然氨基酸多肽组合物。所属领域技术人员通常已知所述投药途径和适当的调配物。
[0225] 单独或与其它适当组分组合的非天然氨基酸多肽也可制成气雾剂调配物(即,其可“成雾状”)以经由吸入投与。可将气雾剂调配物放入诸如二氯二氟甲烷、丙烷、氮气等加压可接受推进剂中。
[0226] 适于不经肠投药(诸如通过关节内(在关节中)、静脉内、肌肉内、皮内、腹膜内和皮下途径)的调配物包括水性和非水性等张无菌注射液,其可含有抗氧化剂、缓冲剂、抑菌剂和使调配物与预定接受者血液等张的溶质,以及可包括悬浮剂、增溶剂增稠剂、稳定剂和防腐剂的水性和非水性无菌悬浮液。可于单位剂量或多剂量密封容器(诸如安瓿和小瓶)中提供包装好的核酸调配物。
[0227] 不经肠投药和静脉内投药是优选的投药方法。具体来说,已经用于天然氨基酸同源物治疗剂的投药途径(例如,通常用于EPO、GCSF、GMCSF、IFN、白细胞介素、抗体和/或任何其它医药学上递送蛋白质的途径)以及当前使用的调配物提供包括本发明的非天然氨基酸的蛋白质(当前治疗性蛋白质的聚乙二醇化变异体等)的优选投药途径以及调配物。
[0228] 在本发明的情况下,视应用而定,投与患者的剂量足以在患者体内随时间实现有益的治疗反应,或例如抑制病原体感染或其它适当活性。通过特定组合物/调配物的功效、所使用的非天然氨基酸多肽的活性、稳定性或血清半衰期和患者的病状以及欲治疗患者的体重或表面积来确定剂量。剂量大小也通过在特定患者体内伴随特定组合物/调配物的投药的任何不利副作用的存在、性质和程度等来确定。
[0229] 在确定疾病(例如,癌症、遗传疾病、糖尿病、AIDS等)的治疗或预防中欲投与的组合物/调配物的有效量时,医师会评估循环血浆水平、调配物毒性、疾病进展和/或(相关时)抗非天然氨基酸多肽抗体的产生。
[0230] 例如投与70公斤患者的剂量通常在等于当前使用的治疗性蛋白质的剂量范围内,所述范围可针对相关组合物的活性或血清半衰期的改变而调节。本发明的组合物/调配物可通过任何已知的常规疗法来补充治疗条件,包括抗体投与、疫苗投与、投与细胞毒性剂、天然氨基酸多肽、核酸、核苷酸类似物、生物反应调节剂等。
[0231] 对于投药,本发明的调配物是以由以下因素所确定的速率投与:相关调配物的LD-50,和/或例如当关系到患者的质量和总体健康状况时,对各种浓度的非天然氨基酸的任何副作用的观察。投药可以单次剂量或分剂量实现。
[0232] 如果进行调配物输注的患者出现发烧、寒战或肌肉疼痛,那么其接收适当剂量的阿司匹林(aspirin)、布洛芬(ibuprofen)、对乙酰氨基酚(acetaminophen)或其它疼痛/发烧控制药物。在将要进行输注之前30分钟,对经历输注反应(诸如发烧、肌肉疼痛和寒战)的患者预先给予阿司匹林、对乙酰氨基酚或例如苯海拉明(diphenhydramine)。将哌替啶(Meperidine)用于不能对解热剂和抗组织胺快速作出反应的更为严重的寒战和肌肉疼痛。视反应的严重程度减缓或中断治疗。
[0233] 核酸和多肽序列及变异体
[0234] 如上文和下文所述,本发明提供核酸多聚核苷酸序列和多肽氨基酸序列(例如,O-tRNA和O-RS)以及例如包含所述序列的组合物和方法。例如O-tRNA和O-RS等所述序列的实例在本文中揭示(参看表5,例如SEQ ID NO.3-65、86,以及SEQ ID NO.:1和2)。然而,所属领域技术人员将了解,本发明不限于本文(例如,实例和表5)中所揭示的这些序列。所属领域技术人员将了解,本发明还提供具有本文所述的功能(例如,编码O-tRNA或O-RS)的许多相关和甚至不相关的序列。
[0235] 本发明还提供多肽(O-RS);和多聚核苷酸,例如O-tRNA、编码O-RS或其部分(例如,所述合成酶的活性位点)的多聚核苷酸;用于构建氨酰基-tRNA合成酶突变体的寡聚核苷酸等。举例来说,本发明的多肽包括:包含如SEQ ID NO.:36-63和/或86中任一序列中所示的氨基酸序列的多肽;包含由如SEQ ID NO.:3-35中任一序列所示的多聚核苷酸序列编码的氨基酸序列的多肽;以及与对包含如SEQ ID NO.:36-63和/或86中任一序列中所示的氨基酸序列的多肽具特异性的抗体特异性免疫反应的多肽;或包含由如SEQ ID NO.:3-35中任一序列所示的多聚核苷酸序列编码的氨基酸序列的多肽。
[0236] 本发明的多肽中还包括包含与天然存在的酪氨酰基氨酰基-tRNA合成酶(TyrRS)的氨基酸序列(例如,SEQ ID NO.:2)至少90%一致的氨基酸序列且包含两个或两个以上A-E组氨基酸的多肽。举例来说,A组包括在与大肠杆菌TyrRS的Tyr37对应的位置的缬氨酸、异亮氨酸、亮氨酸、甘氨酸、丝氨酸、丙氨酸或苏氨酸;B组包括在与大肠杆菌TyrRS的Asn126对应的位置的天冬氨酸;C组包括在与大肠杆菌TyrRS的Asp 182对应的位置的苏氨酸、丝氨酸、精氨酸、天冬酰胺或甘氨酸;D组包括在与大肠杆菌TyrRS的Phe183对应的位置的甲硫氨酸、丙氨酸、缬氨酸或酪氨酸;且E组包括在与大肠杆菌TyrRS的Leu186对应的位置的丝氨酸、甲硫氨酸、缬氨酸、半胱氨酸、苏氨酸或丙氨酸。类似地,本发明的多肽还包括包含SEQ ID NO.:36-63和/或86的至少20个相邻氨基酸以及两个或两个以上如上文在A-E组中所述的氨基酸取代的多肽。还包括包含任一上述多肽的保守变异体的氨基酸序列作为本发明的多肽。
[0237] 在一个实施例中,组合物包括本发明的多肽和赋形剂(例如,缓冲液、水、医药学上可接受的赋形剂等)。本发明还提供与本发明的多肽特异性免疫反应的抗体或抗血清。
[0238] 本发明中还提供多聚核苷酸。本发明的多聚核苷酸包括编码本发明的所关注蛋白质或多肽或包括一个或多个选择性密码子或二者的多聚核苷酸。举例来说,本发明的多聚核苷酸包括例如:包含如SEQ ID NO.:3-35、64-85中任一序列所述的核苷酸序列的多聚核苷酸;与其多聚核苷酸序列互补或编码其多聚核苷酸序列的多聚核苷酸;和/或编码包含如SEQ ID NO.:36-63和/或86中任一序列中所述的氨基酸序列的多肽的多聚核苷酸,或其保守变异体。本发明的多聚核苷酸还包括编码本发明的多肽的多聚核苷酸。类似地,在高度严格条件下在实质上整个核酸长度上与上文所述的多聚核苷酸杂交的核酸为本发明的多聚核苷酸。
[0239] 本发明的多聚核苷酸还包括编码多肽的多聚核苷酸,所述多肽包含与天然存在的酪氨酰基氨酰基-tRNA合成酶(TyrRS)的氨基酸序列(例如,SEQ ID NO.:2)至少90%一致的氨基酸序列且包含两个或两个以上如上文在第11段中A-E组中所述的突变。本发明的多聚核苷酸中还包括与上文所述的多聚核苷酸至少70%(或至少75%、至少80%、至少85%、至少90%、至少95%、至少98%或至少99%或更多)一致的多聚核苷酸,和/或包含任一上文所述的多聚核苷酸的保守变异体的多聚核苷酸。
[0240] 在某些实施例中,载体(例如,质粒、柯斯质粒、噬菌体、病毒等)包含本发明的多聚核苷酸。在一个实施例中,载体为表达载体。在另一实施例中,表达载体包括可操作性连接到一个或多个本发明的多聚核苷酸的启动子。在另一实施例中,细胞包含包括本发明的多聚核苷酸的载体。
[0241] 技术人员还应了解,所揭示的序列的许多变异体都包括在本发明中。举例来说,本发明中包括得到功能相同的序列的所揭示的序列的保守变异体。认为核酸多聚核苷酸序列的变异体与至少一个所揭示的序列杂交的变异体包括在本发明中。本发明中还包括如例如通过标准序列比较技术确定的本文所揭示的序列的独特子序列。
[0242] 保守变异体
[0243] 归因于遗传密码的简并性,“沉默取代(silent substitution)”(即,不会引起所编码的多肽改变的核酸序列的取代)为编码氨基酸的各核酸序列所暗含的特征。类似地,“保守氨基酸取代”(即,氨基酸序列中一个或数个氨基酸经具有高度相似性的不同氨基酸取代)也易于鉴别为与所揭示的构建体高度相似。所述各所揭示序列的保守变异体为本发明的特征。
[0244] 特定核酸序列的“保守变异体”是指编码相同或基本上相同的氨基酸序列的核酸,或当所述核酸不编码氨基酸序列时是指基本上相同的序列。所属领域技术人员将认识到,在编码序列中改变、添加或缺失单一氨基酸或少量氨基酸(通常小于5%,更通常小于4%、2%或1%)的个别取代、缺失或添加为“保守性修饰变异”,其中所述改变将导致氨基酸的缺失、氨基酸的添加或化学上类似的氨基酸对氨基酸的取代。因此,本发明所列多肽序列的“保守变异”包括少量、通常小于5%、更通常小于2%或1%的多肽序列的氨基酸经具有相同保守取代基团的保守所选氨基酸取代。最后,不改变核酸分子的编码活性的序列的添加(诸如,非功能性序列的添加)为基本核酸的保守变异。
[0245] 所属领域技术人员众所周知提供功能类似的氨基酸的保守取代表。以下陈述含有包括彼此互为“保守取代”的天然氨基酸的例示性群组:
[0246] 保守取代组
[0247]
[0248] 核酸杂交
[0249] 可使用比较杂交来鉴别本发明的核酸,包括本发明核酸的保守变异体,并且所述比较杂交方法是区别本发明的核酸的优选方法。此外,与SEQ ID NO:3-35、64-85所示的核酸在高、超高和极高严格条件下杂交的靶核酸为本发明的特征。所述核酸的实例包括与指定的核酸序列相比具有一个或数个沉默或保守核酸取代的核酸。
[0250] 当测试核酸以其与完全匹配的互补靶杂交的至少1/2水平与探针杂交时,即,以高达探针与靶在一定条件下(其中完全匹配的探针以关于与任何不匹配靶核酸杂交所观察到的信噪比的至少约5×-10×高的信噪比与完全匹配的互补靶结合)杂交的信噪比的至少1/2信噪比杂交时,认为所述测试核酸与探针核酸特异性杂交。
[0251] 当核酸通常在溶液中缔合时,其“杂交”。核酸因存在多种诸如氢键、溶剂排斥、碱基堆叠等充分表征的物理化学力而杂交。核酸杂交的广泛指导可见于Tijssen(1993)Laboratory Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Acid Probes第2章第I部分“,Overview of principles of hybridization and the strategy of nucleic acid probe assays,”(Elsevier,New York),以及Ausubel,同上文中。Hames和Higgins(1995)Gene Probes 1IRL Press at Oxford University Press,Oxford,England,(Hames and Higgins 1)以及Hames和Higgins(1995)Gene Probes 2IRL Press at Oxford University Press,Oxford,England(Hames and Higgins 2)中提供有关合成、标记、检测和量化DNA和RNA(包括寡核苷酸)的细节。。
[0252] 在Southern印迹或Northern印迹中于过滤器上具有超过100个互补残基的互补核酸杂交的严格杂交条件的实例为42℃,50%福尔林和1mg肝素,且进行杂交整夜。严格洗涤条件的实例为65℃下0.2×SSC洗涤15分钟(关于SSC缓冲液的描述参看Sambrook,同上文)。通常,高度严格洗涤是在低严格度洗涤之前以去除背景探针信号。例示性低严格度洗涤是在40℃下以2×SSC洗涤15分钟。一般来说,5×(或更高)于在特定杂交分析中关于不相关探针所观察到的信噪比的信噪比指示检测到特异性杂交。
[0253] 在诸如Southern和Northern杂交等核酸杂交实验的情形中,“严格杂交洗涤条件”为序列依赖性,并且在不同环境参数下不同。有关核酸杂交的广泛指导可见于Tijssen(1993),同上文以及Hames和Higgins,1和2。任何测试核酸的严格杂交和洗涤条件都可易于根据经验确定。举例来说,在确定高度严格杂交和洗涤条件的过程中,将杂交和洗涤条件逐渐增加(例如,通过增加温度、降低盐浓度、增加清洁剂浓度和/或增加杂交或洗涤中诸如福尔马林等有机溶剂的浓度),直到满足一组所选择的标准。举例来说,逐渐增加杂交和洗涤条件,直到探针与完全匹配的互补靶以对于探针与不匹配靶杂交所观察到的至少5倍高的信噪比结合。
[0254] 选择与特定探针的热熔点(Tm)相等的“极严格”条件。Tm为50%的测试序列与完全匹配的探针杂交的温度(在指定离子强度和pH值下)。出于本发明的目的,一般地说,选择在指定离子强度和pH值下比特定序列的Tm低约5℃的“高度严格”杂交和洗涤条件。
[0255] “超高严格”杂交和洗涤条件为增加杂交和洗涤条件的严格度,直到探针与完全匹配的互补靶核酸结合的信噪比为对于杂交任何不匹配靶核酸所观察到的至少10倍高。据悉,在所述条件下以完全匹配的互补靶核酸的至少1/2的信噪比与探针杂交的靶核酸在超高严格条件下与所述探针结合。
[0256] 类似地,可通过逐渐增加相关杂交分析的杂交和/或洗涤条件来确定甚至较高的严格度。举例来说,增加杂交和洗涤条件的严格度,直到探针与完全匹配的互补靶核酸结合的信噪比为对于杂交任何不匹配靶核酸所观察到的至少10×、20×、50×、100×或500×或更高倍数。据悉,在所述条件下以完全匹配的互补靶核酸的至少1/2的信噪比与探针杂交的靶核酸在极高严格条件下与所述探针结合。
[0257] 如果在严格条件下彼此不杂交的核酸编码的多肽实质上相同,那么所述核酸也实质上相同。例如当使用遗传密码所允许的最大密码子简并性产生核酸拷贝时,出现此情形。
[0258] 独特子序列
[0259] 一方面,本发明提供一种核酸,其包含选自本文所揭示的O-tRNA和O-RS序列的核酸中的独特子序列。独特子序列与对应于任何已知的O-tRNA或O-RS核酸序列的核酸相比为独特的。可使用例如设置为默认参数的BLAST执行比对。任何独特子序列都例如可用作鉴别本发明的核酸的探针。
[0260] 类似地,本发明包括一种多肽,其包含选自本文所揭示的O-RS序列的多肽中的独特子序列。在本文中,独特子序列与对应于任何已知多肽序列的多肽相比为独特的。
[0261] 本发明还提供靶核酸,其在严格条件下与编码选自O-RS的序列的多肽中的独特子序列的独特编码寡聚核苷酸杂交,其中所述独特子序列与对应于任何对照多肽的多肽(例如,通过突变得到本发明的合成酶的亲本序列)相比为独特的。独特子序列是如上文所述确定。
[0262] 序列比较、一致性和同源性
[0263] 在两个或两个以上核酸或多肽序列的情形中,术语“一致”或“一致性”百分比是指当比较和比对最大对应性时,如使用下文所述的序列比较算法中的一种(或所属领域技术人员可用的其它算法)或通过目测所测量,相同或具有特定的相同氨基酸残基或核苷酸百分比的两个或两个以上序列或子序列。
[0264] 在两个核酸或多肽(例如,编码O-tRNA或O-RS的DNA,或O-RS的氨基酸序列)的情形中,短语“实质上一致”是指当比较和比对最大对应性时,如使用序列比较算法或通过目测所测量,具有至少约60%、优选80%、最优选90-95%的核苷酸或氨基酸残基一致性的两个或两个以上序列或子序列。在不提及实际祖先的情况下,通常认为所述“实质上一致”的序列“同源”。“实质一致性”优选在至少约50个残基长的序列区、更优选至少约100个残基的区域上存在,且最优选所述序列在至少约150个残基或欲比较的两个序列的全长上实质上一致。
[0265] 为进行序列比较和同源性测定,通常将一个序列充当与测试序列相比较的参考序列。当使用序列比较算法时,将测试序列和参考序列输入计算机内,视需要指定子序列坐标,并且指定序列算法程序参数。随后序列比较算法基于指定的程序参数计算测试序列相对于参考序列的序列一致性百分比。
[0266] 可例如通过Smith&Waterman,Adv.Appl.Math.2:482(1981)的局部同源性算法、Needleman&Wunsch,J.Mol.Biol.48:443(1970)的同源性比对算法、Pearson&Lipman,Proc.Nat’l.Acad.Sci.USA 85:2444(1988)的相似性搜索方法、这些算法的计算机实施(Wisconsin Genetics Software Package,Genetics Computer Group,575Science Dr.,Madison,WI中的GAP、BESTFIT、FASTA和TFASTA)或通过目测(例如参看Ausubel等人,同上文)进行供比较序列的最佳比对。
[0267] 适于测定序列一致性百分比和序列相似性的算法的一个实例为BLAST算法,其描述于Altschul等人,J.Mol.Biol.215:403-410(1990)中。执行BLAST分析的软件可通过美国生物技术信息中心(National  Center  for Biotechnology  Information,www.ncbi.nlm.nih.gov/)公共可用。所述算法涉及首先通过鉴别询问序列中长度W的短字来鉴别高得分的序列对(high scoring sequence pair,HSP),当与数据库序列中相同长度的字比对时,所述HSP匹配或满足一些正值临界得分T。T是指邻近字的临界分值
(neighborhood word score threshold)(Altschul等人,同上文)。这些初始邻近字匹配(word hit)充当起始搜索的种子以发现含有其的较长HSP。随后使字匹配沿各序列的两个方向延伸直到可增加累积比对的分值。对核苷酸序列使用参数M(一对匹配残基的奖励分值;通常>0)和N(错配残基的处罚分值,通常<0)计算累积分值。对于氨基酸序列,使用得分矩阵计算累积分值。当:累积比对分值比其所达到的最大值低数量X;累积分值因一个或多个负得分残基比对的积累而为零或更低值;或到达各序列的末端时,在各个方向上的字匹配延伸停止。BLAST算法参数W、T和X将决定比对的灵敏性和速度。BLASTN程序(对于核苷酸序列)使用11的字长(W)、10的期望值(expectation,E)、100的截止值、M=5、N=-4和两条链的比较作为默认值。对于氨基酸序列,BLASTP程序使用3的字长(W)、10的期望值(E)和BLOSUM62得分矩阵(参看Henikoff&Henikoff(1989)Proc.Natl.Acad.Sci.USA 89:10915)作为默认值。
[0268] 除计算序列一致性百分比外,BLAST算法还执行两个序列之间相似性的统计学分析(例如参看Karlin&Altschul,Proc.Nat'l.Acad.Sci.USA 90:5873-5787(1993))。BLAST算法所提供的一种相似性量度为最小和概率(smallest sum probability,P(N)),其提供对于两个核苷酸或氨基酸序列之间偶然出现匹配的概率的指示。举例来说,如果在将测试核酸与参考核酸相比较时,最小和概率小于约0.1、更优选小于约0.01且最优选小于约0.001,那么可认为所述核酸与参考序列相似。
[0269] 诱变和其它分子生物学技术
[0270] 描述分子生物技术的常见文章包括Berger和Kimmel Guide to Molecular Cloning Techniques. Methods in Enzymology第152卷Academic Press,Inc.,San Diego,CA(Berger);Sambrook等人,Molecular Cloning-A Laboratory Manual(第2版)第1-3卷.Cold Spring Harbor Laboratory,Cold Spring Harbor,New York,1989("
Sambrook")和Current Protocols in Molecular Biology.F.M.Ausubel等人,编,Current Protocols,Greene Publishing Associates,Inc.与John Wiley&Sons,Inc.的合资公司,(1999增刊)("Ausubel")。这些文章描述诱变、载体的使用、启动子和许多其它相关课题,所述相关课题涉及例如包括用于产生包括非天然氨基酸的蛋白质的选择密码子、正交tRNA、正交合成酶和其对在内的基因的产生。
[0271] 多类诱变方法用于本发明中,例如以产生tRNA文库、产生合成酶文库、插入编码所关注蛋白质或多肽中的非天然氨基酸的选择性密码子。所述诱变方法包括(但不限于)定点诱变、随机点诱变、同源重组、DNA改组或其它递归诱变方法、嵌合构建、使用含尿嘧啶的模板的诱变、寡核苷酸定向诱变、硫代磷酸酯修饰DNA诱变、使用缺口双螺旋DNA的诱变等或其任何组合。其它适当方法包括点错配修复、使用修复缺陷型宿主株的诱变、限制性选择和限制性纯化、缺失诱变、通过总基因合成诱变、双链断裂修复等。举例来说,涉及嵌合构建体的诱变也包括在本发明中。在一个实施例中,可通过天然存在分子或者改变或突变的天然存在的分子的已知信息(例如,序列、序列比较、物理特性、晶体结构等)指导诱变。
[0272] 上述本文中所见的文章和实例描述这些程序。其它信息可见于文中所引用的以下公开案和参考文献:Ling等人,Approaches to DNA mutagenesis:an overview,Anal Biochem.254(2):157-178(1997);Dale等人,Oligonucleotide-directed random mutagenesis using the phosphorothioate method,Methods Mol.Biol.57:369-374(1996);Smith,In vitro mutagenesis,Ann.Rev.Genet.19:423-462(1985);Botstein&Shortle,Strategies and applications of in vitro mutagenesis,Science 229:1193-1201(1985);Carter,Site-directed mutagenesis,Biochem.J.237:1-7(1986);Kunkel,The efficiency of oligonucleotide directed mutagenesis,Nucleic Acids&
Molecular Biology(Eckstein,F.和Lilley,D.M.J编,Springer Verlag,Berlin))(1987);
Kunkel,Rapid and efficient site-specific mutagenesis withoutphenotypic selection,Proc.Natl.Acad.Sci.USA 82:488-492(1985);Kunkel等人,Rapid and efficient site-specific mutagenesis without phenotypic selection,Methods in Enzymol.154,367-382(1987);Bass等人,Mutant Trp repressors with new DNA-binding specificities,Science 242:240-245(1988);Methods in Enzymol.100:468-500(1983);
Methods in Enzymol.154:329-350(1987);Zoller&Smith,Oligonucleotide-directed mutagenesis using M13-derived vectors:an efficient and general procedure for the production of point mutations in any DNA fragment,Nucleic Acids Res.10:
6487-6500(1982);Zoller&Smith,Oligonucleotide-directed mutagenesis of DNA fragments cloned into M13vectors,Methods in Enzymol.100:468-500(1983);Zoller&Smith,Oligonucleotide-directed mutagenesis:a simple method using two 
oligonucleotide primers and a single-stranded DNA template,Methods in 
Enzymol.154:329-350(1987);Taylor等人,The use of phosphor othioate-modified DNA in restriction enzyme reactions to prepare nicked DNA,Nucl.Acids Res.13:
8749-8764(1985);Taylor等人,The rapid generation of oligonucleotide-directed mutations at high frequency using phosphor othioate-modified DNA,Nucl.Acids Res.13:8765-8787(1985);Nakamaye&Eckstein,Inhibition of restriction 
endonuclease Nci I cleavage by phosphorothioate groups and its application to oligonucleotide-directed mutagenesis,Nucl.Acids Res.14:9679-9698(1986);Sayers等人,Y-T Exonucleases in phosphorothioate-based oligonucleotide-directed mutagenesis,Nucl.Acids Res.16:791-802(1988);Sayers等人,Strand specific cleavage of phosphorothioate-containing DNA by reaction with restriction endonucleases in the presence ofethidium bromide,(1988)Nucl.Acids Res.16:803-
814;Kramer等人,The gapped duplex DNA approach to oligonucleotide-directed mutation construction,Nucl.Acids Res.12:9441-9456(1984);Kramer&Fritz 
Oligonucleotide-directed construction of mutations via gapped duplex DNA,Methods in Enzymol.154:350-367(1987);Kramer等人,Improved enzymatic in vitro reactions in the gapped duplex DNA approach to oligonucleotide-directed construction of mutations,Nucl.Acids Res.16:7207(1988);Fritz等人,
Oligonucleotide-directed construction of mutations:a gapped duplex DNA procedure without enzymatic reactions in vitro,Nucl.Acids Res.16:6987-6999(1988);Kramer等人,Point Mismatch Repair,Cell 38:879-887(1984);Carter等人,Improved  oligonucleotide  site-directed  mutagenesis  using 
MI3vectors.Nucl.Acids Res.13:4431-4443(1985);Carter,Improved oligonucleotide-directed mutagenesis using M13vectors,Methods in Enzymol.154:382-403(1987);
Eghtedarzadeh&Henikoff,Use of oligonucleotides to generate large deletions,Nucl.Acids Res.14:5115(1986);Wells等人,Importance of hydrogen-bond formation in stabilizing the transition state of subtilisin,Phil.Trans.R.Soc.Lond.A 
317:415-423(1986);Nambiar等人,Total synthesis and cloning of a gene coding for the ribonuclease Sprotein,Science 223:1299-1301(1984);Sakamar和Khorana,Total synthesis and expression of a gene for the a-subunit of bovine rod outer segment guanine nucleotide-bindingprotein(transducin).Nucl.Acids Res.14:6361-6372(1988);Wells等人,Cassette mutagenesis:an efficient method for generation of multiple mutations at defined sites,Gene 34:315-323(1985);
等人,Oligonucleotide-directed mutagenesis by microscale'shot-gun'
gene synthesis,Nucl.Acids Res.13:3305-3316(1985);Mandecki,Oligonucleotide-directed double-strand break repair in plasmids of Escherichia coli:a method for site-specific mutagenesis,Proc.Natl.Acad.Sci.USA,83:7177-7181(1986);
Arnold,Protein engineering for unusual environments,Current Opinion in Biotechnology4:450-455(1993);Sieber,等人,Nature Biotechnology,19:456-460(2001).W.P.C.Stemmer,Nature 370,389-91(1994);和I.A.Lorimer,I.Pastan,Nucleic Acids Res.23,3067-8(1995)。关于众多上述方法的其它细节可见于Methods in 
Enzymology第154卷,其也描述对于各种诱变方法引起的故障查找问题的有效控制。
[0273] 本发明还涉及经由正交tRNA/RS对活体内并入非天然氨基酸的脊椎动物宿主细胞和生物体。利用本发明的多聚核苷酸或包括本发明的多聚核苷酸的构建体(例如本发明的载体,其可为例如克隆载体或表达载体)对宿主细胞进行基因工程改造(例如,转化、转导或转染)。载体可为例如质粒、细菌、病毒、裸多聚核苷酸或连结多聚核苷酸的形式。可通过标准方法将载体引入细胞和/或微生物中,所述方法包括电穿孔(Fromm等人,Proc.Natl.Acad.Sci.USA 82,5824(1985))、通过病毒载体感染、在小珠粒或粒子基质内或在表面上用具有核酸的小粒子高速弹道穿透(Klein等人,Nature 327,70-73(1987))。
[0274] 可在经调节适用于诸如筛选步骤、活化启动子或选择转化株的活动的常规营养培养基中培养经工程改造的宿主细胞。这些细胞可任选培养入转基因有机体中。关于例如细胞分离和培养(例如用于随后核酸分离)的其它有用参考文献包括Freshney(1994)Culture of Animal Cells,a Manual of Basic Technique,第3版,Wiley-Liss,New York及其中所引用的参考文献;Payne等人(1992)Plant Cell and Tissue Culture in Liquid Systems John Wiley&Sons,Inc.New York,NY;Gamborg和Phillips(编)(1995)Plant Cell,Tissue and Organ Culture;Fundamental Methods Springer Lab Manual,Springer-Verlag(Berlin  Heidelberg New York)以及Atlas和Parks(编)The  Handbook of MicrobiologicalMedia(1993)CRC Press,Boca Raton,FL。
[0275] 本发明还涉及具有经由正交tRNA/RS对并入一个或多个非天然氨基酸的能力的脊椎动物细胞系。可使用所属领域中已知的细胞培养技术在已经本发明的多聚核苷酸或包括本发明的多聚核苷酸的构建体转化、转导或转染的宿主细胞上建立这些细胞系。将外源核酸引入宿主细胞中的方法已为所属领域中众所周知且将随所使用的宿主细胞而变化。技术包括(但不限于)葡聚糖介导的转染、磷酸钙沉淀、氯化钙处理、聚凝胺(polybrene)介导的转染、原生质体融合、电穿孔、病毒或噬菌体感染、脂质体中多聚核苷酸的封装和定向微注射。
[0276] 可以允许瞬时或稳定并入DNA的方式转化或转染细胞。对于重组蛋白的长期、高产率产生来说,优选稳定表达。举例来说,可对稳定表达抗体分子的细胞系进行工程改造。可用通过适当表达控制元件(例如,启动子、增强子、序列、转录终止子、多聚腺苷酸位点等)控制的DNA和可选择标记转化宿主细胞,而非使用含有病毒复制起点的表达载体。在引入外来DNA后,可使经工程改造的细胞在富集培养基中生长1-2天,且随后转换为选择性培养基。重组质粒中的可选择标记赋予对选择的抗性,并且使细胞能将质粒稳定整合到其染色体组中并生长,从而形成细胞群,又可对其进行克隆并扩充成细胞系。可有利地使用所述方法来工程改造表达抗体分子的细胞系。所述经工程改造的细胞系尤其适用于筛选和评估与抗体分子直接或间接相互作用的化合物。另外,诸如一些病毒介导的载体转染技术等所属领域技术人员众所周知的其它技术可允许瞬时转染细胞。
[0277] 可使用将靶核酸引入细胞中的若干种众所周知的方法,其中任一种都可用于本发明中。这些方法包括:受体细胞与含有DNA的细菌原生质体融合、电穿孔、基因枪法(projectile bombardment)(对于较为稳定的表达)和经病毒载体感染(其可用于稳定或瞬时转染且也在下文中进一步论述)等。细菌细胞可用于扩增含有本发明的DNA构建体的质粒的数目。使细菌生长到对数生长期且可通过所属领域中已知的多种方法分离细菌中的质粒(例如参看Sambrook)。另外,可购得大量试剂盒以从细菌中纯化质粒(例如参看都来自Pharmacia Biotech的EasyPrepTM、FlexiPrepTM;来自Stratagene的StrataCleanTM;和来自Qiagen的QIAprepTM)。随后进一步操纵经分离和纯化的质粒以产生其它质粒,其用于转染细胞或并入相关载体中以感染生物体。典型载体含有转录和翻译终止子、转录和翻译起始序列以及可用于调控特定靶核酸表达的启动子。载体任选包含通用表达盒,其含有至少一个独立终止子序列、允许表达盒在真核细胞或原核细胞或两者中复制的序列(例如,穿梭载体)和用于原核系统与脊椎动物系统的选择标记。载体适用于在原核细胞、真核细胞或优选两者中复制和整合。参看Gillam&Smith,Gene8:81(1979);Roberts等人,Nature.328:731(1987);Schneider,B.等人,Protein Expr.Purif.6435:10(1995);Ausubel,Sambrook,Berger(都同上文)。例如,ATCC(例如由ATCC出版的The ATCC Catalogue of Bacteria and Bacteriophage(1992)Gherna等人(编))提供可用于克隆的细菌和噬菌体的目录。用于测序、克隆和分子生物学的其它方面的其它基本程序以及基础理论探讨也见于Watson等人(1992)Recombinant DNA第2版Scientific American Books,NY。另外,基本上任何核酸(和几乎任何标记核酸,无论标准或非标准)都可从多种商业来源中的任一种定制或标准定购,这些商业来源诸如Midland Certified Reagent Company(Midland,TX,mcrc.com)、The Great American Gene Company(Ramona,CA,可通过万维网在genco.com上获得)、ExpressGen Inc.(Chicago,IL,可通过万维网在expressgen.com上获得)、Operon Technologies Inc.(Alameda,CA)和许多其它来源。
[0278] 试剂盒
[0279] 试剂盒也为本发明的特征。举例来说,提供在细胞中产生包含至少一个非天然氨基酸的蛋白质的试剂盒,其中所述试剂盒包括含有编码O-tRNA的多聚核苷酸序列和/或O-tRNA和/或编码O-RS的多聚核苷酸序列和/或O-RS的容器。在一个实施例中,试剂盒另外包括至少一个非天然氨基酸。在另一实施例中,试剂盒另外包含用于产生蛋白质的说明材料。
[0280] 实例
[0281] 提供以下实例说明但非限制所主张的本发明。所属领域技术人员将认识到,在不背离所主张的本发明的范围的情况下,可改变多个不重要的参数。
[0282] 实例1:在脊椎动物细胞中产生并入非天然氨基酸的氨酰基-tRNA合成酶的方法以及所述氨酰基-tRNA合成酶的组合物
[0283] 扩充脊椎动物遗传密码以包括具有新颖物理、化学或生物特性的非天然氨基酸,将提供用于分析和控制这些细胞中的蛋白质功能的有效工具。为此,描述用于分离氨酰基-tRNA合成酶的通用方法,所述氨酰基-tRNA合成酶响应酿酒酵母(Saccharomyces cerevisiae,S.cerevisiae)中的琥珀密码子以高保真度并入非天然氨基酸。所述方法是建立在通过抑制GAL4的DNA结合结构域与转录活化结构域之间的琥珀密码子来活化GAL4反应性报告基因HIS3、URA3或LacZ的基础上。描述用于正选择活性大肠杆菌酪氨酰基-tRNA合成酶(EcTyrRS)变异体的GAL4报告基因的优化。还曾利用作为“有毒等位基因(toxic allele)”添加到生长培养基中的小分子,利用URA3报告基因来发展无活性EcTyrRS变异体的负选择。重要的是,可对单一细胞且以多种严格度执行正选择和负选择。这可促进从大型突变合成酶文库中分离出多种氨酰基-tRNA合成酶(aaRS)活性。用于分离所需aaRS表现型的方法的功效可通过模型选择加以证实。
[0284] 实例2
[0285] 大肠杆菌和嗜热脂肪芽孢杆菌Tyr tRNA杂合tRNA的构建
[0286] 从酿酒酵母中进行的工作已知,大肠杆菌Tyr tRNA/RS对与内源性tRNA/RS对正交并且支持非天然氨基酸抑制。然而,在活体内于哺乳动物细胞中转录功能性大肠杆菌tRNATyr的尝试富有挑战。为此,关注焦点已转向作为tRNA序列来源的嗜热脂肪芽孢杆菌,其可支持哺乳动物细胞中非天然氨基酸的抑制。尽管嗜热脂肪芽孢杆菌tRNA为大肠杆菌tRNATyr合成酶的底物,但仍需要进一步工程改造tRNA以改进tRNA氨酰化的效率。改进tRNA氨酰化将会改进抑制效率。tRNA的接受茎(acceptor stem)为tRNA合成酶识别的关键决定因素。在本实例中,通过将大肠杆菌与嗜热脂肪芽孢杆菌tRNATyr的不同结构组件组合来构建杂合tRNA。所述杂合tRNA具有大肠杆菌tRNATyr接受茎,以及D臂、TΨC臂、可变环和嗜热脂肪芽孢杆菌tRNATyr的反密码子茎。具有得自大肠杆菌的接受茎的新杂合tRNA为大肠杆菌tRNATyr合成酶的良好底物。下文的实验中将展示,当使用新近建立的杂合琥珀抑制tRNA时,获得改进的琥珀抑制效率。为进行比较,对杂合tRNA与得到所述杂合tRNA的嗜热脂肪芽孢杆菌tRNATyr加以测试。
[0287] 实验:
[0288] 编码杂合tRNA的质粒的构建:
[0289] 通过使用以下引物的重叠PCR:
[0290] FTam 73:具有EcoR I和Bgl II位点的正向引物:
[0291]GTACGAATTCCCGAGATCTGGATTACGCATGCTCAGTGCAATCTTCGGTTGCCTGGACTAGCGCTCCGGTTTTTCTGTGC(SEQ ID NO:91);
[0292] FTam 115:反向引物
[0293]AGTCCGCCGCGTTTAGCCACTTCGCTACCCCACCGACGTGTACGTGTGTCGGCGTCCCCTGAGGTTCAGCACAGAAAAACCGGAGCGC(SEQ ID NO:92);
[0294] Ftam116:第2段的正向引物:
[0295]GTGGCTAAACGCGGCGGACTCTAAATCCGCTCCCTTTGGGTTCGGCGGTTCGAATCCGTCCCCCACCAGACAAGTG(SEQ ID NO:93);
[0296] Ftam117:第2段的反向引物:
[0297]GATGCAAGCTTGATGGATCCGCCATAAGTCATCGGGAGCTGGAGAAAAAAACCGCACTTGTCTGGTGGGGGACGG(SEQ ID NO:94).,
[0298] 来构建单拷贝杂合琥珀抑制tRNA表达插入物,其包括5′限制性位点(EcoR I和Bgl II)、人类tRNATyr的5′侧接序列
[0299] (GGATTACGCATGCTCAGTGCAATCTTCGGTTGCCTGGACTAGCGCTCCGGTTTT
[0300] TCTGTGCTGAACCTCAGGGGACGCCGACACACGTACACGTC(SEQ ID NO:89)),、
[0301] 缺乏3′-CCA的杂合tRNA琥珀抑制突变体(杂合tRNA的核苷酸序列如下:
[0302]GGUGGGGUAGCGAAGUGGCUAAACGCGGCGGACUCUAAAUCCGCUCCCUUUGGGUUCGGCGGTUCGAAUCCGUCCCCCUCCACCA(SEQ ID NO:87)且编码所述tRNA的DNA序列如下:
[0303]GGTGGGGTAGCGAAGTGGCTAAACGCGGCGGACTCTAAATCCGCTCCCTTTGGGTTCGGCGGTTCGAATCCGTCCCCC A ( S E Q  I D  N O : 8 8 ) ) 、人 类 t R N A T y r 的 3 ' 侧 接 序 列(GACAAGTGCGGTTTTTTTCTCCAGCTCCCGATGACTTATGGC(SEQ ID NO:90))和3'限制位点(BamH I和Hind III)。
[0304] 将所述插入物接合到pUC19中EcoR I和Hind III位点处。
[0305] 利用杂合tRNA的琥珀抑制实验(图1):
[0306] 将编码hGH E88琥珀突变体、大肠杆菌tRNA合成酶和单拷贝琥珀抑制嗜热脂肪芽孢杆菌tRNA或单拷贝琥珀抑制杂合tRNA的质粒共转染到CHO K1细胞中。转染后42小时分析hGH的表达。当使用杂合tRNA(hb1)时,琥珀抑制效率相对于当使用嗜热脂肪芽孢杆菌琥珀抑制tRNA时所获得的效率增加约30%。
[0307] 实例3
[0308] 将分子添加到具有非天然氨基酸的蛋白质中
[0309] 一方面,本发明提供包含非天然氨基酸的蛋白质与其它取代基分子偶联的的方法和相关组合物。
[0310] 应了解,本文所述的实例和实施例仅出于说明性目的,并且将对所属领域技术人员提出根据所述实例和实施例的各种修改或改变,且所述修改和改变都将包括在本申请案的精神和范围以及随附权利要求书的范围内。
[0311] 尽管已出于清楚和理解的目的相当详细地描述本发明,但在阅读本发明后所属领域技术人员将了解,在不偏离本发明的真实范围的情况下,可对形式和细节进行各种修改。举例来说,上述所有技术和设备可以各种组合使用。本申请案中引用的所有公开案、专利、专利申请案和/或其它文献都以全文引用的方式并入本文中用于所有目的,所引用的程度就如同将各个别公开案、专利、专利申请案和/或其它文献个别地以引用的方式并入本文中用于所有目的一般。
[0312] 表5
[0313]
[0314]
[0315]
[0316]
[0317]
[0318]
[0319]
[0320]
[0321]
[0322]
[0323]
[0324]
[0325]
[0326]
[0327]
[0328]
[0329]
[0330] a这些克隆还含有Asp165Gly突变。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈