首页 / 专利库 / 信号处理 / 正交 / 选择性硫酸化的蛋白质在真细菌中的遗传编程表达

选择性硫酸化蛋白质在真细菌中的遗传编程表达

阅读:159发布:2023-03-11

专利汇可以提供选择性硫酸化蛋白质在真细菌中的遗传编程表达专利检索,专利查询,专利分析的服务。并且本 发明 涉及能将非天然 氨 基酸磺基酪氨酸掺入真细菌宿主细胞,例如大肠杆菌中产生的 蛋白质 的tRNA和氨酰基-tRNA 正交 配对 。本发明提供,例如但不限于新型正交氨酰基-tRNA合成酶、编码该新型合成酶分子的多核苷酸、鉴定和制备所述新型合成酶的方法、产生含有非天然氨基酸磺基酪氨酸的蛋白质的方法以及翻译系统。,下面是选择性硫酸化蛋白质在真细菌中的遗传编程表达专利的具体信息内容。

1.一种翻译系统,其包含:
(a)第一非天然基酸,即磺基酪氨酸;
(b)第一正交氨酰基-tRNA合成酶(O-RS);和
(c)第一正交tRNA(O-tRNA);
其中所述第一O-RS用所述磺基酪氨酸优先氨酰化所述第一O-tRNA,其 效率至少为包含所述O-tRNA、所述磺基酪氨酸以及含有SEQ ID NO:4、6、 8或10所示氨基酸序列的氨酰基-tRNA合成酶的翻译系统效率的50%。
2.如权利要求1所述的翻译系统,其特征在于,所述第一O-RS衍生自詹 氏甲烷球菌氨酰基-tRNA合成酶。
3.如权利要求1所述的翻译系统,其特征在于,所述第一O-RS衍生自野 生型詹氏甲烷球菌酪氨酰-tRNA合成酶。
4.如权利要求1所述的翻译系统,其特征在于,所述第一O-RS包含 SEQ ID NO:4、6、8或10所示氨基酸序列或其保守变体。
5.如权利要求1所述的翻译系统,其特征在于,所述第一O-tRNA是 琥珀抑制子tRNA。
6.如权利要求1所述的翻译系统,其特征在于,所述第一O-tRNA包 含SEQ ID NO:1所示多核苷酸序列或由其编码。
7.如权利要求1所述的翻译系统,还包括编码感兴趣蛋白质的核酸, 所述核酸含有至少一个选择者密码子,其中所述选择者密码子为所述第一 O-tRNA识别。
8.如权利要求7所述的翻译系统,还包括第二O-RS和第二O-tRNA, 其中所述第二O-RS用不同于所述第一非天然氨基酸的第二非天然氨基酸 优先氨酰化所述第二O-tRNA,其中所述第二O-tRNA识别不同于所述第一 O-tRNA识别的选择者密码子的选择者密码子。
9.如权利要求1所述的翻译系统,其特征在于,所述系统包括含有所 述第一非天然氨基酸、所述第一O-RS和所述第一O-tRNA的宿主细胞。
10.如权利要求9所述的翻译系统,其特征在于,所述宿主细胞是真 细菌细胞。
11.如权利要求10所述的翻译系统,其特征在于,所述真细菌细胞是 大肠杆菌细胞。
12.如权利要求9所述的翻译系统,其特征在于,所述宿主细胞含有 编码所述第一O-RS的多核苷酸。
13.如权利要求12所述的翻译系统,其特征在于,所述多核苷酸包含 SEQ ID NO:5、7、9或11所示核苷酸序列。
14.如权利要求9所述的翻译系统,其特征在于,所述宿主细胞包含 编码所述第一O-tRNA的多核苷酸。
15.一种在翻译系统内产生在选择位置上含有非天然氨基酸的蛋白质的 方法,所述方法包括:
(a)提供一种翻译系统,其包含:
(i)第一非天然氨基酸,即磺基酪氨酸;
(ii)第一正交氨酰基-tRNA合成酶(O-RS);
(iii)第一正交tRNA(O-tRNA),其中所述第一O-RS用所述磺基酪氨 酸优先氨酰化所述第一O-tRNA,其效率至少为包含所述O-tRNA、所述磺基 酪氨酸以及含有SEQ ID NO:4、6、8或10所示氨基酸序列的氨酰基-tRNA 合成酶的翻译系统效率的50%;和
(iv)编码所述蛋白质的核酸,其中所述核酸包含所述第一O-tRNA识 别的至少一个选择者密码子;和
(b)在所述蛋白质的翻译过程中对所述选择者密码子起反应而将所述 非天然氨基酸掺入所述蛋白质的所述选择位置,从而产生在选择位置含有 所述非天然氨基酸的所述蛋白质。
16.如权利要求15所述的方法,其特征在于,所述包含非天然氨基酸 的蛋白质是磺基蛭素。
17.如权利要求15所述的方法,其特征在于,所述提供翻译系统包括 提供编码所述O-RS的多核苷酸。
18.如权利要求15所述的方法,其特征在于,所述提供翻译系统包括 提供衍生自詹氏甲烷球菌氨酰基-tRNA合成酶的O-RS。
19.如权利要求15所述的方法,其特征在于,所述提供翻译系统包括 提供衍生自野生型詹氏甲烷球菌酪氨酰-tRNA合成酶的O-RS。
20.如权利要求15所述的方法,其特征在于,所述提供翻译系统包括 提供含有SEQ ID NO:4、6、8或10所示氨基酸序列和其保守变体的O-RS。
21.如权利要求15所述的方法,其特征在于,所述提供翻译系统包括 通过定点诱变突变野生型氨酰基-tRNA合成酶的氨基酸结合袋,以及选择 能用所述非天然氨基酸优先氨酰化所述O-tRNA的所得O-RS。
22.如权利要求21所述的方法,其特征在于,所述选择步骤包括在定 点诱变之后从含有多个所得氨酰基-tRNA合成酶分子的集合中对所述O-RS 进行正选择和负选择。
23.如权利要求15所述的方法,其特征在于,所述提供翻译系统包括 提供编码所述O-tRNA的多核苷酸。
24.如权利要求15所述的方法,其特征在于,所述提供翻译系统包括 提供O-tRNA,该O-tRNA是琥珀抑制子tRNA。
25.如权利要求15所述的方法,其特征在于,所述提供翻译系统包括 提供含有SEQ ID NO:1所示多核苷酸序列或由其编码的O-tRNA。
26.如权利要求15所述的方法,其特征在于,所述提供翻译系统包括 提供含有琥珀选择者密码子的核酸。
27.如权利要求15所述的方法,其特征还在于,所述蛋白质含有不同 于所述第一非天然氨基酸的第二非天然氨基酸,且其中所述翻译系统还包 括第二O-RS和第二O-tRNA,所述第二O-RS用不同于所述第一非天然氨 基酸的第二非天然氨基酸优先氨酰化所述第二O-tRNA,所述第二O-tRNA 识别核酸中不同于所述第一O-tRNA识别的选择者密码子的选择者密码子。
28.如权利要求15所述的方法,其特征在于,所述提供翻译系统包括 提供宿主细胞,其中所述宿主细胞含有所述第一非天然氨基酸、所述第一 O-RS、所述第一O-tRNA和所述核酸,所述掺入步骤包括培养所述宿主细 胞。
29.如权利要求28所述的方法,其特征在于,所述提供宿主细胞包括 提供真细菌宿主细胞。
30.如权利要求29所述的方法,其特征在于,所述提供真细菌宿主细 胞包括提供大肠杆菌宿主细胞。
31.如权利要求28所述的方法,其特征在于,所述提供宿主细胞包括 提供含有编码所述O-RS的多核苷酸的宿主细胞。
32.如权利要求31所述的方法,其特征在于,所述提供含有编码所述 O-RS的多核苷酸的宿主细胞的步骤包括提供包含含SEQ ID NO:5、7、9 或11所示核苷酸序列的多核苷酸的宿主细胞。
33.如权利要求15所述的方法,其特征在于,所述提供翻译系统包括 提供细胞提取物。
34.一种包含多肽的组合物,所述多肽含有SEQ ID NO:4、6、8或10 所示氨基酸序列或其保守变体。
35.如权利要求34所述的组合物,其特征在于,所述保守变体多肽用 非天然氨基酸氨酰化关联的正交tRNA(O-tRNA),效率至少为含有所述 O-tRNA、所述非天然氨基酸和含有SEQ ID NO:4、6、8或10所示氨基酸 序列的氨酰基-tRNA合成酶的翻译系统效率的50%。
36.一种编码权利要求34所述多肽的多核苷酸。
37.如权利要求36所述的多核苷酸,其特征在于,所述多核苷酸包含 SEQ ID NO:5、7、9或11所示核苷酸序列。
38.如权利要求34所述的组合物,其特征在于,所述组合物包含含有所 述多肽的细胞。
39.一种载体,其包含权利要求36所述的多核苷酸。
40.一种表达载体,其包含权利要求36所述多核苷酸。
41.一种包含载体的细胞,所述载体含有权利要求36所述的多核苷酸。
42.一种组合物,其包含含有SEQ ID NO:5、7、9或11所示核苷酸序列 的多核苷酸。

说明书全文

发明领域

本发明属于翻译生物化学领域。本发明涉及制备和利用正交(orthogonal) tRNA、正交酰基-tRNA合成酶和它们的配对将非天然氨基酸掺入蛋白质 的组合物和方法。本发明还涉及用这种配对在细胞中产生蛋白质的方法以 及用这种方法产生的蛋白质。

发明背景

酪氨酸硫酸化是分泌蛋白和膜结合蛋白的常见翻译后修饰(Kehoe和 Bertozzi,酪氨酸硫酸化:胞外蛋白-蛋白相互作用的调节物(Tyrosine sulfation:a modulator of extracellular protein-protein interactions),Chem Biol 7:R57-61 (2000))。尽管对于磺基酪氨酸生物学功能的了解程度刚刚起步,但在数种蛋白- 蛋白相互作用复合物中已发现它。例如,酪氨酸硫酸化在趋化因子与趋化因子 受体结合中扮有决定性作用,所述趋化因子受体包括CCR2(Preobrazhensky等, “单核细胞趋化蛋白-1受体CCR2B是一种在保守胞外区N末端区域酪氨酸硫 酸化的糖蛋白”(Monocyte chemotactic protein-1 receptor CCR2B is a glycoprotein that has tyrosine sulfation in a conserved extracellular N-terminal region)J Immunol 165:5295-5303(2000))、CCR5(Farzan等,“CCR5氨基末端的酪氨酸 硫酸化有助于HIV-1进入”(Tyrosine sulfation of the amino terminus of CCR5 facilitates HIV-1 entry)Cell 96:667-676(1999))、CXCR4(Farzan等,“CXCR4 氨基末端翻译后修饰在基质衍生因子1α结合和HIV进入中的作用”(The role of post-translational modifications of the CXCR4 amino terminus in stromal-derived factor 1 alpha association and HIV-1 entry)J Biol Chem 277:29484-29489(2002);Veldkamp等,“趋化因子基质细胞起源因子 1α(SDF-1α/CXCL12)识别CXCR4磺基酪氨酸”(Recognition of a CXCR4 sulfotyrosine by the chemokine stromal cell-derived factor-1alpha (SDF-1alpha/CXCL12))J Mol Biol 359:1400-1409(2006))和CX3CR1(Fong等, “CX3CR1酪氨酸硫酸化增强flk分形素(fractalkine)-诱导的细胞黏附” (CX3CR1 tyrosine sulfation enhances fractalkine-induced cell adhesion)J Biol Chem 277:19418-19423(2002))。同样,在流剪切下白细胞的翻滚也需要 PSGL-1的硫酸化以进行正确的结合和粘附(Somers等,“与SLe(X)和PSGL-1 结合的P-和E-选择素结构揭示的白细胞系链和翻滚的分子基础探密”(Insights into the molecular basis of leukocyte tethering and rolling revealed by structures of P-and E-selectin bound to SLe(X)and PSGL-1)Cell 103:467-479(2000))。酪氨酸 硫酸化也参与了凝血级联系统,发现于数种凝集因子以及天然凝血酶抑制剂 中,如水蛭分泌的抗凝蛭素(Dong等,“糖蛋白Ib-IX复合物的酪氨酸硫酸化: 识别硫酸化残基以及对配体结合的影响”(Tyrosine sulfation of the glycoprotein Ib-IX complex:identification of sulfated residues and effect on ligand binding) Biochemistry 33:13946-13953(1994);Bagdy等,“蛭素”(Hirudin)Methods Enzymol 45:669-678(1976))。此外,近来发现抗体可变环状区的酪氨酸硫酸化 在CD4诱导的HIV-1抗体中负责中和活性,因此证明磺基酪氨酸增加抗体-抗 原亲和力的能力(Choe等,“人抗体的酪氨酸硫酸化在识别HIV-1 gp120的 CCR5结合区的作用”(Tyrosine sulfation of human antibodies contributes to recognition ofthe CCR5 binding region of HIV-1 gp120)Cell 114:161-170(2003); Xiang等,“通过中和单克隆抗体模拟I型人体免疫缺陷病毒功能”(Functional mimicry of a human immunodeficiency virus type 1 coreceptor by a neutralizing monoclonal antibody)J Virol 79:6068-6077(2005))。
测定硫酸化在超过60种已知的和超过2100种预测(基于小鼠蛋白序列的 研究)的含磺基酪氨酸蛋白中的功能的主要障碍是选择性合成硫酸化蛋白的能 力(Moore,“蛋白质酪氨酸O-硫酸化的生物学及酶学”(The biology and enzymology of protein tyrosine O-sulfation)J Biol Chem 278:24243-24246 (2003))。当前的方法依赖于肽合成或体外酶硫酸化(Veldkamp等,“通过趋化 因子基质细胞衍生因子1α(SDF-1α/CXCL12)识别CXCR4磺基酪氨酸” (Recognition of a CXCR4 sulfotyrosine by the chemokine stromal cell-derived factor-1alpha(SDF-1alpha/CXCL12))J Mol Biol 359:1400-1409(2006);Kirano 等,“胆囊收缩素-33(CCK-33)的全合成”(Total synthesis of porcine cholecystokinin-33(CCK-33))J.Chem.Soc.,Chem.Commun.323-325(1987); Muramatsu等,“用来自真细菌A-44的硫酸转移酶对酪氨酸残基进行酶的O- 硫酸化”(Enzymic O-sulfation of tyrosine residues in hirudins by sulfotransferase from Eubacterium A-44)Eur J Biochem 223:243-248(1994);Young和Kiessling ,“硫酸化肽的合成策略”(A strategy for the synthesis of sulfated peptides)Angew Chem Int Ed Engl 41:3449-3451(2002));然而,两者都缺乏普遍性:前者受限 于长度限制以及酸性条件下磺基酪氨酸有去硫酸化的趋势;后者受限于附加 硫酸转移酶的可用性以及其相关识别序列的限制。
在蛋白的已知位点直接掺入遗传编码的非天然氨基酸磺基酪氨酸可克 服上述限制。直接掺入磺基酪氨酸将极大地利于研究生物学调节过程中的 硫酸化事件,并可创造具有显著多样性的硫酸化抗体和肽库。而且,生产 蛋白蛭素的硫酸化形式的能力具有直接的临床应用,可作为改良的抗凝剂 (相对于非硫酸化形式的改良)。本领域需要能将非天然氨基酸磺基酪氨酸掺 入蛋白质的新方案。
现已开发了在原核和真核生物中将各种非天然氨基酸体内位点特异性地 掺入蛋白质的通用方法。这些方法依赖于正交蛋白质翻译组分,所述组分识别 合适的选择者密码子(selector codon)从而能在体内多肽翻译期间将所需的非天 然氨基酸插入限定位置。这些方法利用识别选择者密码子的正交 tRNA(O-tRNA),而相应的特异性正交氨酰基-tRNA合成酶(O-RS)用非天然氨 基酸加载该O-tRNA。这些组分不与宿主生物体内的任何内源性tRNA、RS、 氨基酸或密码子交叉反应(即,它必须是正交的)。利用这种正交tRNA-RS配对 可能遗传编码大量结构各异的非天然氨基酸。
本领域普遍知道利用适合于制备含一个或多个非天然氨基酸的蛋白质的 正交翻译系统,例如产生正交翻译系统的通用方法。例如,参见国际公布号 WO 2002/086075,其名为“METHODS AND COMPOSITION FOR THE PRODUCTION OF ORTHOGONAL tRNA-AMINOACYL-tRNA SYNTHETASE PAIRS(产生正交tRNA-氨酰基-tRNA合成酶配对的方法和 组合物)”;WO 2002/085923,其名为“IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS(非天然氨基酸的体内掺入)”;WO 2004/094593,其名为“EXPANDING THE EUKARYOTIC GENETIC CODE(扩展真核遗传密码)”;2004年7月7日提交的WO 2005/019415; 2004年7月7日提交的WO 2005/007870;2004年7月7日提交的WO 2005/007624;和2005年10月27日提交的WO 2006/110182,其名为 “ORTHOGONAL TRANSLATION COMPONENTS FOR THE IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS(体内掺入非天然氨基 酸的正交翻译组分)”。这些申请各自通过引用全文纳入本文。掺入非天然 氨基酸的正交翻译系统及它们的产生和使用方法的其它讨论还可参见 Wang和Schultz,“Expanding the Genetic Code(扩展遗传密码)”,Chem. Commun.(Camb.)1:1-11(2002);Wang和Schultz“Expanding the Genetic Code(扩展遗传密码)”,Angewandte Chemie Int.Ed.,44(1):34-66(2005); Xie和Schultz,“An Expanding Genetic Code(扩展遗传密码)”,Methods 36(3):227-238(2005);Xie和Schultz,“Adding Amino Acids to the Genetic Repertoire(将氨基酸加入遗传库)”Curr.Opinion in Chemical Biology 9(6):548-554(2005);Wang等,“Expanding the Genetic Code(扩展遗传密 码)”,Annu.Rev.Biophys.Biomol.Struct.,35:225-249(2006;2006年1月 13日电子公开);Xie和Schultz,“A chemical toolkit for proteins-an expanded genetic code(蛋白质的化学工具箱-扩展的遗传密码)”,Nat.Rev. Mol.Cell Biol.,7(10):775-782(2006;2006年8月23日电子公开)。
本领域需要开发能将非天然氨基酸磺基酪氨酸掺入蛋白质的正交翻译组 分,其中所述非天然氨基酸掺入在任何指定位置。纵览下文后可明白本文描述 的本发明满足了这些和其它需求。
发明概述
尽管酪氨酸硫酸化是多细胞真核生物中普遍的翻译后修饰(Moore,“蛋 白酪氨酸O-硫酸化的生物学和酶学”(The biology and enzymology of protein tyrosine O-sulfation),J Biol Chem 2003)),但其生物学功能大部分未知。部 分因为合成选择性硫酸化蛋白的困难。本发明提供了在细菌中通过响应琥 珀无义密码子TAG而遗传编码修饰氨基酸,从而将磺基酪氨酸掺入蛋白质 中。而且显示了用此策略可使以前无法通过重组方法得到的磺基蛭素在大 肠杆菌(E.Coli)中直接表达。如本文所述,动力学分析显示磺基-蛭素对人 凝血酶的亲和力比脱磺基-蛭素增强10倍以上,这个发现为磺基-蛭素作为 抗凝剂提供了临床优势(Di Nisio等,“直接凝血酶抑制剂”(Direct thrombin inhibitors)N Engl J Med 353:1028-1040(2005))。这个生物合成硫酸化蛋白的 通用方法有利于对出现的翻译后修饰,酪氨酸硫酸化进行进一步研究和应 用。
本发明提供在体内(例如在宿主细胞内)对选择者密码子,如琥珀终止密 码子起反应而将非天然氨基酸磺基酪氨酸掺入延伸中的多肽链的组合物和 方法。这些组合物包含不与宿主细胞翻译机制相互作用的正交-tRNA (O-tRNA)和正交氨酰基-tRNA合成酶(O-RS)配对。即,内源性宿主细胞氨 酰基-tRNA合成酶不会用氨基酸(天然或非天然)加载O-tRNA(或加载水平 不明显)。类似地,本发明提供的O-RS不以显著或可检测的水平用氨基酸(天 然或非天然)加载内源性tRNA。这些新组合物能够产生含有翻译掺入的磺 基酪氨酸的大量蛋白质。
在一些方面,本发明提供翻译系统。这些系统包含第一正交氨酰基 -tRNA合成酶(O-RS)、第一正交tRNA(O-tRNA)和第一非天然氨基酸,即 磺基酪氨酸,其中所述第一O-RS用所述第一非天然氨基酸磺基酪氨酸优先 氨酰化所述第一O-tRNA。在一些方面,所述O-RS用磺基酪氨酸优先氨酰 化所述O-tRNA,其效率至少为包含所述O-tRNA、磺基酪氨酸以及含有SEQ ID NO:4、6、8或10所示氨基酸序列的氨酰基-tRNA合成酶的翻译系统 效率的50%。
该翻译系统可使用衍生自各种来源的组分。在一个实施方式中,所述 第一O-RS衍生自詹氏甲烷球菌(Methanococcus jannaschii)氨酰基-tRNA合 成酶,例如野生型詹氏甲烷球菌酪氨酰-tRNA合成酶。用于该系统的O-RS 可包含SEQ ID NO:4、6、8或10所示氨基酸序列及该序列的保守变体。 在一些实施方式中,所述O-tRNA是琥珀抑制子tRNA。在一些实施方式中, 所述O-tRNA包含SEQ ID NO:1或由其编码。
在一些方面,翻译系统还包含编码感兴趣蛋白质的核酸,其中所述核 酸具有O-tRNA识别的至少一个选择者密码子。
在一些方面,翻译系统包括利用第二非天然氨基酸的第二正交配对(即 第二O-RS和第二O-tRNA),现在该系统能在多肽的不同所选位置掺入至少 两个不同的非天然氨基酸。在这种双重系统中,第二O-RS用不同于第一非 天然氨基酸的第二非天然氨基酸优先氨酰化第二O-tRNA,而第二O-tRNA 识别不同于第一O-tRNA所识别的选择者密码子的选择者密码子。
在一些实施方式中,翻译系统位于宿主细胞中(包括该宿主细胞)。所用 的宿主细胞不作具体限定,只要O-RS和O-tRNA在它们的宿主细胞环境中 能保留其正交性。所述宿主细胞可以是真细菌细胞,如大肠杆菌。所述宿 主细胞可含有一种或多种编码包括O-RS或O-tRNA在内的翻译系统组分的 多核苷酸。在一些实施方式中,编码O-RS的多核苷酸包含SEQ ID NO:5、 7、9或11所示核苷酸序列。
本发明还提供产生在所选位置含有一个或多个非天然氨基酸的蛋白质 的方法。这些方法利用上述翻译系统。这些方法通常始于提供含有以下组 分的翻译系统的步骤:(i)第一非天然氨基酸,即非天然氨基酸磺基酪氨酸; (ii)第一正交氨酰基-tRNA合成酶(O-RS);(iii)第一正交tRNA(O-tRNA), 其中所述O-RS用所述非天然氨基酸优先氨酰化所述O-tRNA;和(iv)编码 蛋白质的核酸,其中所述核酸含有O-tRNA识别的至少一个选择者密码子。 然后在所述蛋白质的翻译过程中该方法对选择者密码子起反应而将所述非 天然氨基酸掺入所述蛋白质的所选位置,从而产生在所选位置含有所述非 天然氨基酸的蛋白质。在这些方法的一些方面,所述O-RS用磺基酪氨酸优 先氨酰化所述O-tRNA,其效率至少为包含所述O-tRNA、磺基酪氨酸以及含 有SEQ ID NO:4、6、8或10所示氨基酸序列的氨酰基-tRNA合成酶的翻 译系统效率的50%。在一些方面,使用这些方法产生硫酸化形式的蛭素。
可利用各种试剂和步骤广泛实施这些方法。在一些实施方式中,提供 编码O-RS的多核苷酸。在一些实施方式中,提供衍生自詹氏甲烷球菌氨酰 基-tRNA合成酶的O-RS,例如可以提供野生型詹氏甲烷球菌酪氨酰-tRNA 合成酶。在一些实施方式中,该提供步骤包括提供含有SEQ ID NO:4、6、 8或10所示氨基酸序列及其保守变体的O-RS。
在这些方法的一些实施方式中,提供翻译系统的步骤包括通过定点诱 变使野生型氨酰基-tRNA合成酶的氨基酸结合袋(binding pocket)发生突变, 选择用所述非天然氨基酸优先氨酰化所述O-tRNA的所得O-RS。所述选择 步骤可包括定点诱变后从得到的氨酰基-tRNA合成酶分子库正选择和负选 择所述O-RS。在一些实施方式中,提供步骤提供编码O-tRNA的多核苷酸, 例如,O-tRNA是琥珀抑制子tRNA,或者O-tRNA包含SEQ ID NO:1所示 多核苷酸或由其编码。在这些方法中,提供步骤还包括提供含有翻译系统 所用的琥珀选择者密码子的核酸。
还可改进这些方法以在蛋白质中掺入一个以上非天然氨基酸。在那些 方法中,联用第二正交翻译系统与第一翻译系统,其中第二系统具有不同 的氨基酸和选择者密码子特异性。例如,提供步骤可包括提供第二O-RS 和第二O-tRNA,其中第二O-RS用不同于第一非天然氨基酸的第二非天然 氨基酸优先氨酰化第二O-tRNA,且第二O-tRNA识别核酸中不同于第一 O-tRNA所识别的选择者密码子的选择者密码子。
还可在宿主细胞环境中实施产生含非天然氨基酸的蛋白质的方法。在 这些情况中,提供的宿主细胞含有非天然氨基酸、O-RS、O-tRNA和编码 蛋白质的含至少一个选择者密码子的核酸,而培养该宿主细胞可导致非天 然氨基酸的掺入。在一些实施方式中,提供步骤包括提供真细菌宿主细胞 (例如,大肠杆菌)。在一些实施方式中,提供步骤包括提供含有编码O-RS 的多核苷酸的宿主细胞。例如,编码O-RS的多核苷酸可包含SEQ ID NO:5、 7、9或11所示核苷酸序列。在一些实施方式中,通过提供细胞提取物实现 提供翻译系统的步骤。
本发明还提供包含核酸和蛋白质的各种组合物。除了组合物含有所述 核酸或蛋白质外,对该组合物的性质不作具体限制。本发明组合物可含有 任何数量、任何性质的其它组分。
例如,本发明提供含有O-RS多肽的组合物,其中所述多肽含有SEQ ID NO:4、6、8或10所示氨基酸序列或其保守变体。在一些方面,所述保守 变体多肽用非天然氨基酸氨酰化关联(cognate)正交tRNA(O-tRNA)的效率 至少为含有该O-tRNA、该非天然氨基酸和含有SEQ ID NO:4、6、8或10 所示氨基酸序列的氨酰基-tRNA合成酶的翻译系统所观察到的效率的50%。 本发明还提供编码上述任何多肽的多核苷酸。在一些实施方式中,这些多 核苷酸可含有SEQ ID NO:5、7、9或11所示核苷酸序列。在一些实施方式 中,多肽在细胞中。
本发明还提供含有SEQ ID NO:5、7、9或11所示核苷酸序列的多核苷 酸组合物。在一些实施方式中,本发明提供含有所述多核苷酸的载体,如 表达载体。在一些实施方式中,本发明提供含有上述载体的细胞。
定义
在详细描述本发明前,应该知道本发明不局限于具体的生物系统,本 发明当然可以有各种变化。还应知道本文所用的术语只是为了描述具体的 实施方式,而非限制性的。除非另有明确指出,本说明书和随附的权利要 求书中使用的单数形式“一个”、“一种”和“该”也包括复数对象。因 此,例如述及“一个细胞”包括两个或多个细胞的组合;“一个多核苷酸” 实际上包括该多核苷酸的多份拷贝。
除了此处和说明书以下其余部分所定义的,本文所用的所有技术和科 学术语都与本发明所属领域普通技术人员常规理解的意义相同。
正交:本文所用的术语“正交”指与某细胞或翻译系统的内源性相应分 子相比,某分子(例如,正交tRNA(O-tRNA)和/或正交氨酰tRNA合成酶(O-RS)) 与该细胞内源性组分起作用的效率降低,或不能与该细胞的内源性组分起作 用。就tRNA和氨酰基-tRNA合成酶而言,正交指与和内源性tRNA合成酶起 作用的内源性tRNA相比,正交tRNA不能与内源性tRNA合成酶起作用或起 作用的效率降低;或者与和内源性tRNA起作用的内源性tRNA合成酶相比, 正交氨酰tRNA合成酶与内源性tRNA不起作用或起作用的效率降低,所述效 率降低例如,小于20%的效率,小于10%的效率,小于5%的效率,或小于1% 的效率。正交分子缺乏细胞中功能正常的内源性互补分子。例如,与内源性 RS氨酰化内源性tRNA相比,细胞的任何内源性RS氨酰化细胞中正交tRNA 的效率降低或者甚至为0。在另一例子中,与内源性RS氨酰化内源性tRNA 相比,正交RS氨酰化感兴趣细胞中任何内源性tRNA的效率降低或者甚至为 0。可将能与第一正交分子起作用的第二正交分子引入细胞。例如,正交 tRNA/RS配对包括引入的互补组份,与对照,例如相应的tRNA/RS内源性配 对或活性正交配对(如酪氨酰正交tRNA/RS配对)相比,它们在细胞中共同起作 用的效率是,例如45%效率、50%效率、60%效率、70%效率、75%效率、80% 效率、90%效率、95%效率或99%效率,或更高。
正交酪氨酰-tRNA:本文所用的正交酪氨酰-tRNA(酪氨酰-O-tRNA)是 与感兴趣翻译系统正交的tRNA,其中所述tRNA是:(1)与天然酪氨酰 -tRNA相同或基本类似;(2)通过天然或人工诱变衍生自天然酪氨酰tRNA; (3)由考虑了(1)或(2)的野生型或突变型酪氨酰tRNA序列的任何方法产生; (4)与野生型或突变型酪氨酰tRNA同源;(5)与图7中称为酪氨酰tRNA 合成酶底物的任何示例性tRNA同源;或(6)图7中称为酪氨酰tRNA合成 酶底物的任何示例性tRNA的保守变体。酪氨酰tRNA可加载有氨基酸,或 处于非负载状态。还应知道“酪氨酰-O-tRNA”任选被关联(cognate)合成酶 分别加载(氨酰化)除酪氨酸以外的氨基酸,例如非天然氨基酸。应该知道, 实际上优选利用本发明酪氨酰-O-tRNA在翻译期间对选择者密码子起反应 而基本上可将任何氨基酸(无论天然或非天然的)掺入延伸的多肽内。
正交酪氨酰氨基酸合成酶:本文所用的正交酪氨酰氨基酸合成酶(酪氨 酰-O-RS)是在感兴趣翻译系统内用氨基酸优先氨酰化酪氨酰-O-tRNA的 酶。酪氨酰-O-RS加载到酪氨酰-O-tRNA上的氨基酸可以是任何氨基酸, 无论是天然的、非天然的还是人工的,并且不限于本文所述的。该合成酶 任选与天然酪氨酰氨基酸合成酶相同或同源,或者与图7中称为O-RS的合 成酶相同或同源。例如,所述O-RS可以是图7的酪氨酰-O-RS的保守变体, 和/或与图7中O-RS的序列至少有50%、60%、70%、80%、90%、95%、 98%、99%或以上相同。
关联(cognate):术语“关联”指共同起作用或彼此具有一定特异性的组分, 例如正交tRNA和正交氨酰基-tRNA合成酶。这些组分也可互称为“互补的”。
优先氨酰化:对于本文所用正交翻译系统而言,当某表达系统中O-RS使 O-tRNA带上氨基酸的效率高于其使任何内源性tRNA带上氨基酸的效率时, 该O-RS“优先氨酰化”关联O-tRNA。即,当翻译系统中存在摩尔比大致相等 的O-tRNA与任何给定的内源性tRNA时,O-RS加载O-tRNA的频率高于它 加载内源性tRNA的频率。当翻译系统中存在等摩尔浓度的O-tRNA与内源性 tRNA时,由O-RS加载的O-tRNA与由O-RS加载的内源性tRNA的相对比例 优选较高,最好导致O-RS仅加载或几乎仅加载O-tRNA。当存在等摩尔浓度 的O-tRNA与O-RS时,O-RS加载的O-tRNA与内源性tRNA的相对比例大于 1∶1,优选至少约2∶1,更优选5∶1,更优选10∶1,更优选20∶1,更优选50∶1, 更优选75∶1,更优选95∶1、98∶1、99∶1、100∶1、500∶1、1,000∶1、5,000∶1 或更高。
当(a)与内源性tRNA相比,O-RS优先氨酰化O-tRNA,和(b)与O-RS 用任何天然氨基酸氨酰化O-tRNA相比,氨酰化对非天然氨基酸特异时,称 O-RS“优先用非天然氨基酸氨酰化O-tRNA”。即,当包含O-RS和O-tRNA 的翻译系统中存在等摩尔量的非天然和天然氨基酸时,O-RS用非天然氨基酸 加载O-tRNA的频率高于用天然氨基酸加载的频率。加载有非天然氨基酸的 O-tRNA与加载有天然氨基酸的O-tRNA的相对比例优选较高。O-RS最好使 O-tRNA仅加载,或者几乎仅加载有非天然氨基酸。当翻译系统中存在等摩尔 浓度的天然和非天然氨基酸时,使O-tRNA带上非天然氨基酸与使O-tRNA带 上天然氨基酸的相对比例大于1∶1,优选至少约2∶1,更优选5∶1,更优选10∶ 1,更优选20∶1,更优选50∶1,更优选75∶1,更优选95∶1、98∶1、99∶1、100∶ 1、500∶1、1,000∶1、5,000∶1或更高。
选择者密码子:术语“选择者密码子”指翻译过程中为O-tRNA所识别而 不为内源性tRNA所识别的密码子。O-tRNA反密码子环识别mRNA上的选择 者密码子并在多肽的此位置掺入其氨基酸,例如非天然氨基酸。选择者密码子 可包括,例如无义密码子,如终止密码子(如,琥珀、赭石和乳白密码子);四 基或四碱基以上密码子;罕用密码子;衍生自天然或非天然碱基对的密码子, 等等。
抑制子tRNA:抑制子tRNA是在多肽翻译期间通常对终止密码子起反应 而掺入氨基酸(即,“连读”)来改变给定的翻译系统中信使RNA(mRNA)阅读 的tRNA。在一些方面,本发明的选择者密码子是抑制子密码子,例如,终止 密码子(如,琥珀、赭石和乳白密码子)、四碱基密码子、罕用密码子等。
抑制活性:本文所用的术语“抑制活性”总体上指tRNA(例如,抑制子tRNA) 能翻译连读在其它情况中可导致翻译终止或错译(例如,移码)的密码子(例如, 作为选择者密码子的琥珀密码子或四个或以上个碱基的密码子)的能力。抑制 子tRNA的抑制活性可表示为与第二抑制子tRNA,或与对照系统,例如缺乏 O-RS的对照系统相比,观察到的翻译连读活性的百分比。
本发明提供定量测定抑制活性的各种方法。特定O-tRNA和O-RS对感兴 趣选择者密码子(例如,琥珀密码子)的抑制百分比指,在感兴趣的翻译系统中, 在编码表达测试标记的核酸中含有选择者密码子的该给定表达测试标记(例 如,LacZ)的活性与阳性对照构建物相比的百分比,所述感兴趣的翻译系统包 含O-RS和O-tRNA,所述阳性对照没有O-tRNA、O-RS和选择者密码子。因 此,例如,如果在给定翻译系统中观察到不含选择者密码子的活性阳性对照标 记构建物的活性为X(其单位与所述标记试验相关),则含有选择者密码子的测 试构建物的抑制百分比是在与阳性对照标记的表达基本相同的环境条件下(除 了该测试标记构建物在也含有O-tRNA和O-RS的翻译系统中表达外),该测试 标记构建物显示的X百分比。表达该测试标记的翻译系统一般也包含O-RS和 O-tRNA识别的氨基酸。可任选通过将测试标记与“背景”或“阴性”对照标 记构建物比较来校正抑制百分比的测量值,所述“背景”或“阴性”对照标记 构建物含有与测试标记相同的选择者密码子,但其所在的系统不含O-tRNA、 O-RS和/或O-tRNA和/或O-RS识别的相关氨基酸。该阴性对照可用于标准化 抑制百分比测定值以补偿感兴趣的翻译系统中标记的背景信号的影响。
可通过本领域已知的许多试验测定抑制效率。例如,可采用β-半乳糖苷酶 报道试验,如可将衍生的lacZ质粒(该构建物在lacZ核酸序列中含有选择者密 码子)连同含有本发明的O-tRNA的质粒引入合适生物(例如,可利用正交组分 的生物)的细胞。还可引入关联合成酶(可以是多肽或表达时能编码该关联合成 酶的多核苷酸)。细胞在培养基中生长至所需密度,例如至OD600约为0.5,进 行β-半乳糖苷酶试验,例如用诺瓦金公司(Novagen)的BetaFluorTM β-半乳糖苷 酶试验试剂盒。可将抑制百分比计算为样品相对于可比较对照,例如,衍生的 lacZ构建物的观察值的活性百分比,该构建物在所需位置具有相应的有义密码 子而非选择者密码子。
翻译系统:术语“翻译系统”指将氨基酸掺入延伸中的多肽链(蛋白质)的 各组分。翻译系统的组分可包括,例如核糖体、tRNA、合成酶、mRNA等。 本发明的O-tRNA和/或O-RS可加入体外或体内翻译系统或是其一部分,例如 存在于非真核细胞,如细菌(如大肠杆菌)中,或存在于真核细胞中,如酵母菌、 哺乳动物细胞、植物细胞、藻类细胞、真菌细胞、昆虫细胞等。
非天然氨基酸:本文所用的术语“非天然氨基酸”指不在20种常见天然 氨基酸或硒代半胱氨酸或吡咯赖氨酸(pyrrolysine)之列的任何氨基酸,修饰的 氨基酸和/或氨基酸类似物。例如,本发明可使用非天然氨基酸磺基酪氨酸(参 见图1)。
衍生自:本文所用的术语“衍生自”指分离自特定分子或生物,或是用特 定分子或生物的信息制得的某组份。例如,衍生自第二多肽的多肽含有与该第 二多肽的氨基酸序列相同或基本上类似的氨基酸序列。以多肽为例,可通过, 例如天然产生的诱变、人工定向诱变或人工随机诱变获得衍生的种类。用于衍 生多肽的诱变可以是有意定向或有意随机的,或混用两种方法。诱变多肽以产 生衍生自第一(多肽)的不同多肽可以是随机的(例如,聚合酶失真所致),可通 过合适的筛选方法,例如本文所述的方法鉴定衍生的多肽。诱变多肽通常需要 对编码该多肽的多核苷酸进行操作。
正选择或筛选标记:本文所用的术语“正选择或筛选标记”指当存在该标 记时(例如被表达或激活等)可从不具有特征的细胞中鉴定出具有特征的细胞, 例如具有正选择标记的细胞。
负选择或筛选标记:本文所用的术语“负选择或筛选标记”指当存在该标 记时(例如被表达或激活等)可鉴定不含有所选特性或特征的细胞(例如,与确实 具有该特性或特征的细胞相比)。
报道分子:本文所用的术语“报道分子”是指可用于鉴定和/或选择感 兴趣系统的靶组分的组分。例如,报道分子可以包括蛋白质,如能赋予抗 生素抗性或敏感性的酶(如β-内酰胺酶、氯霉素乙酰转移酶(CAT)等)、荧光 筛选标记(如绿色荧光蛋白(如GFP)、YFP、EGFP、RFP等)、冷光标记(如 萤火虫萤光素酶蛋白)、亲和力筛选标记,或者可选择的正或负标记基因如 lacZ、β-gal/lacZ(β-半乳糖苷酶)、ADH(乙醇脱氢酶)、his3、ura3、leu2、lys2 等。
真核生物:本文所用的术语“真核生物”指属于真核生物界(Kingdom Eucarya)的生物。真核生物通常因其以下特征而区别于原核生物:典型的多细 胞组织(但不都是多细胞,例如酵母),存在膜限制的核与其它膜限制的细胞器, 线形遗传物质(即,线形染色体),不存在操纵子,存在内含子、信使(RNA)加 帽和聚-A mRNA,以及其它生物化学特征,如不同的核糖体结构。真核生物包 括,例如动物(如哺乳动物、昆虫、爬行动物、等),纤毛虫,植物(如单子叶 植物、双子叶植物、藻类等)、真菌、酵母菌、鞭毛虫类、微孢子虫、原生动 物等。
原核生物:本文所用的术语“原核生物”指属于原核生物界(也称为原核 生物(Procarya))的生物。原核生物通常因其以下特征而区别于真核生物:单细 胞组织,通过出芽或分裂的无性生殖,缺乏膜限制的核与其它膜限制的细胞器, 环状染色体,存在操纵子,不存在内含子、信使(RNA)加帽和聚-A mRNA,以 及其它生物化学特征,如不同的核糖体结构。原核生物包括真细菌和古细菌 (Archaea)(有时称为“古细菌(Archaebacteria)”)亚界。在原核生物界有时将 蓝细菌(蓝绿藻)与支原体分为不同类别。
细菌:本文所用的术语“细菌”和“真细菌”指不同于古细菌的原核生物。 类似地,古细菌指不同于真细菌的原核生物。可根据许多形态和生物化学标准 区分真细菌和古细菌。例如,可采用核糖体RNA序列、RNA聚合酶结构的差 异,内含子的存在与否,抗生素敏感性,细胞壁肽聚糖和其它细胞壁组分的存 在与否,膜脂质的分枝与不分枝结构,存在/不存在组蛋白和组蛋白样蛋白而将 某生物指定为真细菌或古细菌。
真细菌的例子包括大肠杆菌(Escherichia coli)、嗜热栖热菌(Thermus thermophilus)、枯草芽孢杆菌(Bacillus subtilis)和嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)等)。古细菌的例子包括詹氏甲烷球菌(Methanococcus jannaschii)(Mj)、梅氏甲烷八叠球菌(Methanosarcina mazei)(Mm)、嗜热碱甲烷 杆菌(Methanobacteriurn thermoautotrophicum)(Mt)、海沼甲烷球菌 (Methanococcus maripaludis)、甲烷嗜热菌(Methanopyrus kandleri)、盐细菌 (Halobacterium)(例如沃氏富盐菌(Haloferax volcanii)和盐细菌种NRC-1)、闪烁 古生球菌(Archaeoglobus fulgidus)(Af)、激烈火球菌(Pyrococcus furiosus)(Pf)、极 端嗜热古菌(Pyrococcus horikoshii)(Ph)、好火球菌(Pyrobaculum aerophilum)、 深海火球菌(Pyrococcus abyssi)、硫磺矿硫化叶菌(Sulfolobus solfataricus)(Ss)、 超嗜热泉古菌(Sulfolobus tokodaii)、嗜热泉生古细菌(Aeuropyrum pernix)(Ap)、 嗜酸热原体(Thermoplasma acidophilum)和火山热原体(Thermoplasma volcanium)。
保守性变体:就翻译组分而言,本文所用的术语“保守性变体”指某翻译 组份,例如保守性变体O-tRNA或保守性变体O-RS,其所执行的功能与与其 相似的基本组分(例如O-tRNA或O-RS)相类似,但与参比O-tRNA或O-RS 相比序列中有变异的。例如,O-RS或该O-RS的保守性变体可用非天然氨 基酸,例如磺基酪氨酸氨酰化关联O-tRNA。在该例子中,所述O-RS及保 守性变体O-RS的氨基酸序列不相同。所述保守性变体在序列中可具有例如 一处变异、两处变异、三处变异、四处变异或五处或更多处变异,只要该保守 性变体仍与关联的相应O-tRNA或O-RS互补(例如,与之起作用)。
在一些实施方式中,保守性变体O-RS与衍生其的O-RS相比,含有一 个或多个保守性氨基酸取代。在一些实施方式中,保守性变体O-RS与衍生 其的O-RS相比,含有一个或多个保守性氨基酸取代,此外还保留了O-RS 的生物学活性;例如,保守性变体O-RS保留了衍生其的亲本O-RS分子至 少10%,或者至少20%,至少30%,或至少40%的生物学活性。在一些优 选实施方式中,所述保守性变体O-RS保留了衍生其的亲本O-RS分子至少 50%的生物学活性。保守性变体O-RS的保守性氨基酸取代可出现在该O-RS 的任何结构域内,包括氨基酸结合袋。
选择或筛选试剂:本文所用的术语“选择或筛选试剂”指当存在时可从某 群体中选择/筛选某些组分的试剂。例如,选择或筛选试剂可以是但不限于,如 营养物、抗生素、某波长的光、抗体、表达的多核苷酸等。选择试剂可因例如 浓度、强度等而有所不同。
起反应:本文所用的术语“起反应”指本发明的O-tRNA识别选择者密码 子并介导与该tRNA偶联的非天然氨基酸掺入延伸中的多肽链的过程。
编码:本文所用的术语“编码”指用多聚大分子或序列链中的信息来指导 不同于该第一分子或序列链的第二种分子或序列链产生的任何过程。本文所用 的该术语应用广泛,可用于各领域。在一些方面,术语“编码”描述了半保留 DNA复制的过程,其中双链DNA分子的一条链用作模板,借助依赖DNA的 DNA合成酶来编码新合成的互补姊妹链。
在另一方面,术语“编码”指用一种分子的信息来指导产生化学性质不同 于该第一分子的第二种分子的任何过程。例如,DNA分子可编码RNA分子(例 如,包含依赖DNA的RNA聚合酶的转录过程)。RNA分子也可编码多肽,例 如翻译过程。当术语“编码”用于描述翻译过程时,其含义也延伸至编码氨基 酸的三联密码子。在一些方面,RNA分子可编码DNA分子,例如通过包含依 赖RNA的DNA合成酶的逆转录过程。在另一方面,DNA分子可编码多肽, 应该知道该情况用“编码”同时包括转录和翻译过程。
附图简述
图1提供了非天然氨基酸磺基酪氨酸的化学结构。
图2显示了考斯亮蓝染色的变性PAGE凝胶,展示了磺基-蛭素和磺基- 蛭素的迁移。由于蛭素的非典型带电因此无法通过分子量标准品判断其分子 量。
图3A和3B提供了凝血酶抑制的代表性图示,分别在原始数据点上拟合 了过程曲线。在含聚乙二醇6000和HAS的Tris-HCl盐水缓冲液中用50μM荧 光底物、40pM人α-凝血酶和100pM表达蛭素进行酶实验。图3A显示了无 抑制(对照)、脱磺基-蛭素抑制及磺基-蛭素抑制的荧光强度随时间变化图。图 3B显示对脱磺基-蛭素和磺基-蛭素的放大图以便比较。
图4A和4B显示了Z-结构域的磺基酪氨酸依赖性表达。图4A提供了表 达7位具有琥珀密码子的Z-结构域的细胞的Ni-NTA纯化细胞裂解物经考马斯 亮蓝染色的变性PAGE凝胶。只有使用磺基酪氨酸补充培养基表达时产生全长 Z-结构域。图4B提供了Ni-NTA纯化细胞裂解物(浓缩并对水透析)正-离子线 性模式MALDI-TOF谱(用THAP基质产生),显示了含单一磺基酪氨酸并缺少 甲硫氨酸的全长Z-结构域对应的峰。也观察到从质谱分析条件中导致硫酸基团 丢失所对应的峰。
图5A、5B和5C显示了不同的MALDI-TOF谱。图5A所示纯磺基-蛭素 正离子线性模式MALDI-TOF谱(用THAP基质产生),显示完整[M+H]磺基-蛭 素峰(7059Da)和质谱分析中硫酸基团丢失所对应的峰(6979Da)。注意主峰右侧 的小峰是钠加合物。它们以22Da的间隔出现。图5B所示MALDI-TOF谱(用 芥子基质产生)记录了样品的纯度。为了增强对可能杂质的检测,使用更严苛 的导致[M+H-80]峰突显的芥子基质。13964Da的峰归因于磺基-蛭素二聚化。 未观察到其它杂质。图5C显示了相关区域的放大图,以显示[M+H-80]和完整 磺基-蛭素峰的存在。因为使用了更严苛的芥子基质,完整的磺基-蛭素是较小 的峰。主峰右侧的小峰是钠加合物。
图6A和6B显示了不同的MALDI-TOF谱。图6A显示了在磺基酪氨酸不 存在时表达对应的未纯化磺基-蛭素表达培养基的MALDI-TOF谱(使用芥子基 质产生)。仅发现截短蛭素的峰;未观察到全长蛋白。图6B显示了在磺基酪氨 酸存在时表达对应的未纯化磺基-蛭素表达培养基的MALDI-TOF谱(使用芥子 基质产生),显示了截短与全长磺基-蛭素的峰比例。因为需要更严苛的条件更 好地检测粗样品混合物,所以仅清晰观察到磺基-蛭素的离子化形式。
图7提供核苷酸和氨基酸序列。
发明详述
尽管酪氨酸硫酸化是多细胞真核生物中普遍的翻译后修饰(Moore,“蛋 白酪氨酸O-硫酸化的生物学和酶学”(The biology and enzymology of protein tyrosine O-sulfation),J Biol Chem 2003)),但其生物学功能大部分未知。部 分因为合成选择性硫酸化蛋白的困难。本发明提供了在细菌中通过响应琥 珀无义密码子TAG而遗传编码修饰氨基酸,从而将磺基酪氨酸掺入蛋白质 中。而且显示了用此策略可使以前无法通过重组方法得到的磺基蛭素在大 肠杆菌中直接表达。如本文所述,动力学分析显示磺基-蛭素对人凝血酶的 亲和力比脱磺基-蛭素增强10倍以上,这个发现为磺基-蛭素作为抗凝剂提 供了临床优势(Di Nisio等,“直接凝血酶抑制剂”(Direct thrombin inhibitors) N Engl J Med 353:1028-1040(2005))。这个生物合成硫酸化蛋白的通用方法 有利于对出现的翻译后修饰,酪氨酸硫酸化进行进一步研究和应用。
作为蛋白位点特异性硫酸化的一般方法,本发明描述了正交tRNA/氨 酰基-tRNA合成酶(aaRS)对的演化,以便在真核生物如大肠杆菌中响应于琥 珀无义密码子而有效和选择性地将磺基酪氨酸掺入蛋白质中。使用独特的 抑制子tRNA/aaRS对,可直接表达蛭素的天然硫酸化形式,证明其对人凝 血酶的亲和力比脱磺基-蛭素强10倍以上,这与此前文献报道一致(Stone 和Hofsteenge,“蛭素对凝血酶抑制的动力学”(Kinetics of the inhibition of thrombin by hirudin)Biochemistry 25:4622-4628(1986))。
本发明提供能在大肠杆菌中对选择者密码子(例如琥珀终止密码子TAG) 起反应而将磺基酪氨酸(参见图1)体内选择性引入蛋白质的正交tRNA/氨酰基 -tRNA合成酶配对。本发明提供用非天然氨基酸磺基酪氨酸特异性加载相关的 正交tRNA(O-tRNA)的新正交氨酰基-tRNA合成酶(O-RS)多肽。
在某些方面,为证明(但不是限制)本发明,本文内容证明可将非天然氨基 酸部分掺入各种模型蛋白质。掺入非天然氨基酸不必局限于任何特定的蛋白 质。从本发明可以明白,将非天然氨基酸磺基酪氨酸掺入感兴趣的特定蛋白质 对于各种目的是有利的。
本文还描述了开发能在真细菌中起作用而对选择者密码子起反应,从 而位点特异性地掺入非天然氨基酸磺基酪氨酸(如图1所示)的新型正交 tRNA/氨酰基-tRNA合成酶配对的方法。简言之,本发明提供了在大肠杆菌 宿主细胞中用非天然氨基酸磺基酪氨酸选择性加载抑制子RNA的詹氏甲烷 球菌酪氨酰-tRNA合成酶的新型突变体。
可利用这些开发的tRNA-合成酶配对将非天然氨基酸磺基酪氨酸位点特 异性地掺入蛋白质。可通过工程改造编码感兴趣蛋白质的多核苷酸序列使之含 有能发出掺入非天然氨基酸信号的选择者密码子,从而能将非天然氨基酸编程 掺入任何所需位置。
本文所述发明提供在真细菌,例如大肠杆菌中将非天然氨基酸磺基酪氨酸 遗传编码并掺入蛋白质的正交配对,其中所述正交组分不与宿主细胞翻译机制 的内源性大肠杆菌组分交叉反应,但能识别所需的非天然氨基酸并对选择者密 码子(例如,琥珀无义密码子,TAG)起反应而将其掺入蛋白质。本发明提供的 正交组分包括衍生自詹氏甲烷球菌酪氨酰tRNA-合成酶的正交氨酰基-tRNA合 成酶,和突变型酪氨酰tRNACUA琥珀抑制子,二者在真细菌宿主细胞中用作正 交配对。
本发明提供鉴定和产生其它正交tRNA-氨酰基-tRNA合成酶配对,例如 O-tRNA/O-RS配对的组合物和方法,所述配对可用于将磺基酪氨酸掺入蛋白 质。本发明的O-tRNA/O-RS配对能介导磺基酪氨酸掺入多核苷酸编码的蛋白 质,其中所述多核苷酸包含所述O-tRNA识别的选择者密码子。所述O-tRNA 的反密码子环识别mRNA上的选择者密码子,进而将非天然氨基酸掺入多肽 中的该位点。本发明的正交氨酰基-tRNA合成酶通常只用一种特定的非天然氨 基酸优先氨酰化(或加载)其O-tRNA。
正交tRNA/氨酰基-tRNA合成酶技术
理解与正交tRNA和正交氨酰基-tRNA合成酶配对有关的活性有助于 理解本发明的新型组合物和方法。为在遗传密码中加入额外的非天然氨基 酸,需要含有氨酰基-tRNA合成酶和适当tRNA的新正交配对,它们可在 宿主翻译机制中有效起作用,但对于所述翻译系统是“正交”的,这意味 着它可不依赖于翻译系统的内源性合成酶和tRNA而起作用。正交配对的所 需特征包括能解码或识别不由任何内源性tRNA解码的仅一种特定密码子(例 如选择者密码子)的tRNA,和只能用一种特定非天然氨基酸优先氨酰化(或“加 载”)其关联tRNA的氨酰基-tRNA合成酶。内源性合成酶通常不氨酰化 O-tRNA(或氨酰化,即加载不佳)。例如,在大肠杆菌宿主系统中,正交配对包 括不与任何内源性tRNA(例如,大肠杆菌中有40种)交叉反应的氨酰基-tRNA 合成酶和不被任何内源性合成酶(例如,大肠杆菌中有21种)氨酰化的正交 tRNA。
本领域已知适于制备含有一个或多个非天然氨基酸的蛋白质的正交翻译 系统的通用原则,例如制备正交翻译系统的通用方法。例如,可参见国际公开 号WO 2002/086075,名为“METHODS AND COMPOSITIONS FOR THE PRODUCTION OF ORTHOGONAL tRNA-AMINOACYL-tRNA SYNTHETASE PAIRS”(产生正交tRNA-氨酰基-tRNA合成酶配对的方法和 组合物);WO 2002/085923,名为“IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS”(非天然氨基酸的体内掺入);WO 2004/094593,名为“EXPANDING THE EUKARYOTIC GENETIC CODE” (扩展真核遗传密码);2004年7月7日提交的WO 2005/019415;2004年7 月7日提交的WO 2005/007870;2004年7月7日提交的WO 2005/007624; 2005年10月27日提交的WO 2006/110182,名为“ORTHOGONAL TRANSLATION COMPONENTS FOR THE IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS”(用于体内掺入非天然氨基酸的正交翻译组 分)和2007年3月7日提交的WO 2007/103490,名为“SYSTEMS FOR THE EXPRES SION OF ORTHOGONAL TRANSLATION COMPONENTS IN EUBACTERIAL HOST CELLS(在真细菌宿主细胞中表达正交翻译组分的 系统)”。这些申请各自通过引用全文纳入本文。掺入非天然氨基酸的正交 翻译系统和它们的产生及使用方法的讨论还可参见Wang和Schultz, “Expanding the Genetic Code(扩展遗传密码)”,Angewandte Chemie Int. Ed.,44(1):34-66(2005);Xie和Schultz,“An Expanding Genetic Code(扩 展的遗传密码)”,Methods 36(3):227-238(2005);Xie和Schultz,“Adding Amino Acids to the Genetic Repertoire(将氨基酸加入遗传库)”,Curr. Opinion in Chemical Biology 9(6):548-554(2005);和Wang等,“Expanding the Genetic Code(扩展遗传密码)”,Annu.Rev.Biophys.Biomol.Struct., 35:225-249(2006);这些文献的内容通过引用全文纳入本文。
正交翻译系统
正交翻译系统一般包括含有正交tRNA(O-tRNA)、正交氨酰tRNA合成酶 (O-RS)和非天然氨基酸的细胞(可以是原核细胞,例如大肠杆菌),其中所述 O-RS用所述非天然氨基酸氨酰化所述O-tRNA。本发明的正交配对可以包括 O-tRNA,例如抑制子tRNA、移码tRNA等和关联O-RS。本发明的正交系统 通常包含处于宿主细胞环境中或无宿主细胞的O-tRNA/O-RS配对。除多组分 系统外,本发明还提供新型单组分,例如,新型正交氨酰基-tRNA合成酶多肽 (例如,SEQ ID NO:4、6、8或10)和编码那些多肽的多核苷酸(例如,SEQ ID NO:5、7、9或11)。
当正交配对识别选择者密码子并对该选择者密码子起反应而加载氨基酸 时,通常称该正交配对“抑制”该选择者密码子。即,不被翻译系统的(例如, 细胞的)内源性机制识别的选择者密码子通常不被加载,从而阻断了多肽产生, 否则可自核酸翻译该多肽。在正交配对系统中,O-RS用特定的非天然氨基酸 氨酰化O-tRNA。加载的O-tRNA识别选择者密码子并抑制选择者密码子所致 的翻译阻断。
在一些方面,与包含本文序列表所示多核苷酸序列或由其编码的 O-tRNA的抑制效率相比,本发明的O-tRNA识别选择者密码子并在关联合 成酶存在下对选择者密码子起反应而具有至少约,例如,45%、50%、60%、 75%、80%或90%或更高的抑制效率。
在一些实施方式中,联用O-RS和O-tRNA的抑制效率是缺乏O-RS的 O-tRNA的抑制效率的约,例如5倍、10倍、15倍、20倍或25倍或更高。 在一些方面,联用O-RS和O-tRNA的抑制效率是本文序列表所示正交合成 酶配对的抑制效率的至少约,例如35%、40%、45%、50%、60%、75%、 80%或90%或更高。
宿主细胞利用O-tRNA/O-RS配对将非天然氨基酸掺入延伸中的多肽链, 例如经由包含编码感兴趣多肽的多核苷酸的核酸,其中所述多核苷酸包含所述 O-tRNA识别的选择者密码子。在某些优选方面,细胞可包含一种或多种其它 O-tRNA/O-RS配对,其中所述其它O-RS用不同的非天然氨基酸加载所述其它 O-tRNA。例如,O-tRNA之一可识别四碱基密码子,其它O-tRNA可识别终止 密码子。或者,多个不同的终止密码子或多个不同的四碱基密码子可用于同一 编码核酸。
应注意,在一些实施方式中,细胞或其它翻译系统中可存在多个 O-tRNA/O-RS配对,从而能将多个非天然氨基酸掺入多肽。例如,细胞还可包 含额外的不同O-tRNA/O-RS配对和第二非天然氨基酸,其中该额外的O-tRNA 识别第二选择者密码子,该额外的O-RS用该第二非天然氨基酸优先氨酰化该 额外的O-tRNA。例如,包含O-tRNA/O-RS配对的细胞(其中所述O-tRNA识 别,例如琥珀选择者密码子)还可包含第二正交配对,其中该第二O-tRNA识别 不同的选择者密码子,例如乳白密码子、四碱基密码子等。不同的正交配对优 选衍生自不同来源,从而有助于识别不同的选择者密码子。
在某些实施方式中,系统包含例如大肠杆菌细胞等细胞,这些细胞含有正 交tRNA(O-tRNA)、正交氨酰tRNA合成酶(O-RS)、非天然氨基酸和包含编码 感兴趣多肽的多核苷酸的核酸,其中所述多核苷酸包含所述O-tRNA识别的选 择者密码子。翻译系统还可以是无细胞系统,例如与本文所述O-tRNA/O-RS 配对和非天然氨基酸组合的各种市售可得“体外”转录/翻译系统。
O-tRNA和/或O-RS可以是天然产生的,或者可以是,例如天然tRNA和 /或RS经突变衍生,例如,通过产生各种生物的tRNA文库和/或RS文库和/ 或采用各种可用的突变方案。例如,产生正交tRNA/氨酰基-tRNA合成酶配对 的一种方案包括将,例如得自除宿主细胞外的来源或多个来源的异源(对宿主 细胞而言)tRNA/合成酶配对输入宿主细胞。候选异源合成酶的特性包括,例如 不加载任何宿主细胞tRNA,候选异源tRNA的特性包括,例如不被任何宿主 细胞合成酶所氨酰化。此外,异源tRNA对于所有宿主细胞合成酶是正交的。 产生正交配对的第二种方案包括产生用于筛选和/或选择O-tRNA或O-RS的突 变体文库。也可联用这些方案。
正交tRNA(O-tRNA)
本发明的正交tRNA(O-tRNA)优选在例如体内或体外介导将非天然氨 基酸掺入蛋白质内,所述蛋白质由含选择者密码子的多核苷酸编码,而这 种选择者密码子可被该O-tRNA识别。在某些实施方式中,与包含本文序 列表中O-tRNA序列所示多核苷酸序列或由其编码的O-tRNA相比,本发 明的O-tRNA在关联合成酶存在下,对选择者密码子起反应而具有至少 45%、50%、60%、75%、80%、90%或更高的抑制效率。
可通过本领域已知的多种试验测定抑制效率。例如,可采用β半乳糖 苷酶报道分子试验,例如,将衍生的lacZ质粒(该构建物在lacZ核酸序列 中含有选择者密码子)和含有本发明O-tRNA的质粒一起导入合适生物(如 可利用正交组分的生物)的细胞内。还可导入关联合成酶(多肽或表达时可编 码关联合成酶的多核苷酸)。将细胞在培养基内培养到所需密度,如OD600 约0.5时,采用例如诺瓦金公司(Novagen)的BetaFluorTM β-半乳糖苷酶检测 试剂盒进行β半乳糖苷酶试验。抑制百分率可以计算为样品相对于可比较 对照(如衍生的lacZ构建物的观察值,所述构建物在所需位置上含有相应的 有义密码子而不是选择者密码子)的活性百分数。
本发明O-tRNA的例子见本文序列表,例如参见图7和SEQ ID NO:1。 本文内容还提供了设计其它等价O-tRNA的指导。在RNA分子(例如O-RS mRNA或O-tRNA分子)中,与给定序列(或对编码DNA而言反之亦然)或其 互补序列相比,胸腺嘧啶(T)被尿嘧啶(U)取代。还可存在碱基的其它修饰以 大量产生功能等价分子。
本发明还包括对应于本文具体O-tRNA的O-tRNA保守性变体。例如, O-tRNA保守性变体包括功能与具体O-tRNA(例如本文序列表中的)相似的, 和因合适的自身互补性而保留了tRNA的L-形结构但不具有与例如序列表 或图7所示那些(序列)相同的序列并且最好也不是野生型tRNA分子的那些 分子。
含O-tRNA的组合物还可包含正交氨酰基-tRNA合成酶(O-RS),其中 所述O-RS用非天然氨基酸优先氨酰化O-tRNA。在某些实施方式中,含有 O-tRNA的组合物还可包含(例如体外或体内)翻译系统。细胞中也可存在含 有编码感兴趣多肽的多核苷酸的核酸或这些物质中一个或多个的组合,其 中所述多核苷酸含有O-tRNA能识别的选择者密码子。
产生正交tRNA(O-tRNA)的方法也是本发明的特征之一。通过该方法 产生的正交tRNA(O-tRNA)也是本发明的特征之一。在本发明的某些实施方 式中,可通过构建突变体文库来产生O-tRNA。可采用本领域已知的各种诱 变技术构建突变体tRNA文库。例如,可通过位点特异性突变、随机位点 突变、同源重组、DNA改组或其它递归诱变(recursive mutagenesis)方法、 嵌合体构建、或者这些技术的任何组合产生突变体tRNA,例如SEQ ID NO: 1所示O-tRNA。
也可将其它突变引入特定位置,例如tRNA的所需环或区域(如反密 码子环、接纳茎、D臂或环、可变环、TPC臂或环、tRNA分子的其它区域 或其组合)中一个或多个非保守位置、保守位置、一个或多个随机位置或 者二者的组合位置。tRNA中的突变通常包括使突变型tRNA文库内各成员 的反密码子环突变以使其能识别选择者密码子。该方法还可包括给O-tRNA 加上额外序列。与起始材料(例如多种tRNA序列)相比,O-tRNA通常提高 了对所需生物的正交性,同时保留其对所需RS的亲和力。
这些方法任选包括分析tRNA和/或氨酰基-tRNA合成酶序列的相似性 (和/或所推断的同源性)以确定显示与特定生物正交的潜在候选O-tRNA、 O-RS和/或其配对。可利用本领域已知和本文所述的计算机程序进行这种分 析,例如可用BLAST和堆积(pileup)程序。在一个实施例中,为筛选用于 大肠杆菌的可能的正交翻译组分,可选择与真细菌生物不显示接近的序列 相似性的合成酶和/或tRNA。
通常可通过,例如负选择第一物种的细胞群以获得O-tRNA,其中所述 细胞含有多种潜在O-tRNA的某成员。负选择可去除含有被细胞内源性氨 酰基-tRNA合成酶(RS)氨酰化的潜在O-tRNA文库某成员的细胞。这样就可 以得到第一物种细胞的正交tRNA库。
某些实施方式在负选择中将选择者密码子引入编码负选择标记(例如 能赋予抗生素抗性的酶如β内酰胺酶;能得到可检测产物的酶如β半乳糖 苷酶、氯霉素乙酰转移酶(CAT),所述产物例如是毒性产物,如芽孢杆菌 RNA酶)的多核苷酸的非必须位置(例如,仍能产生功能性芽孢杆菌RNA酶) 等。还任选在选择性试剂(比如抗生素,如氨苄青霉素)存在下培养细胞群来 进行筛选/选择。在一个实施方式中,选择性试剂的浓度不同。
例如,为检测抑制子tRNA的活性,可利用基于选择者密码子的体内 抑制的选择系统,例如将无义(如终止)或移码突变引入编码负选择标记的多 核苷酸(如编码β-内酰胺酶的基因(bla))中。例如,构建在某位置(如,A184) 含有选择者密码子的多核苷酸变体,如bla变体。用这些多核苷酸转化细胞, 如细菌。以不能被内源性大肠杆菌合成酶有效加载的正交tRNA为例,抗 生素抗性(例如氨苄青霉素抗性)应约为或小于未用质粒转化的细菌的抗 生素抗性。如果tRNA不是正交的,或者能加载该tRNA的异源合成酶在此 系统内共同表达,应可观察到更高水平的抗生素(如氨苄青霉素)抗性。选出 那些在抗生素浓度与未用质粒转化的细胞大致相等的LB琼脂平板上不能 生长的细胞,如细菌。
以毒性产物(如核糖核酸酶或芽孢杆菌RNA酶)为例,当多种潜在的 tRNA中的成员被内源性宿主(如大肠杆菌)合成酶(即与宿主如大肠杆菌合 成酶不是正交的)氨酰化时,选择者密码子被抑制,所产生的毒性多核苷酸 产物导致细胞死亡。而含有正交tRNA或非功能性tRNA的细胞可存活。
然后,在一个实施方式中,对与所需生物正交的tRNA库进行正选择, 其中将选择者密码子置于正选择标记中(例如抗药性基因(如β内酰胺酶基 因)编码的标记)。对以下细胞进行正选择:含有编码与该细胞正交的tRNA 库某成员的多核苷酸或包含该成员的多核苷酸、含有编码正选择标记的多 核苷酸和含有编码关联RS的多核苷酸。在某些实施方式中,第二群细胞含 有不能通过负选择除去的细胞。该多核苷酸在胞内表达,细胞在有选择试 剂(如氨苄青霉素)存在下生长。然后选择能被共同表达的关联合成酶氨酰化 以及对此选择者密码子起反应而插入氨基酸的tRNA。与一种或多种含有非 功能性tRNA或不能被感兴趣合成酶有效识别的tRNA的细胞相比,这些细 胞通常显示抑制效率升高。含有非功能性tRNA或不能被感兴趣合成酶有 效识别的tRNA的细胞对该抗生素敏感。因此在两次选择中能保留下的 tRNA是:(i)不是内源性宿主(如大肠杆菌)合成酶的底物;(ii)能被感兴趣 的合成酶氨酰化;以及(iii)能在翻译过程中起作用。
因此,取决于筛选所处的环境,同一标记可以是正或负标记。即,如果为 了筛选该标记,则它是正标记,但如果为了抵御该标记则它是负标记。
上述方法中,筛选,如正选择、负选择或者正负选择的严格性任选包 括改变选择的严格性。例如,由于芽孢杆菌RNA酶是毒性极高的蛋白质, 可通过将不同数目的选择者密码子引入到芽孢杆菌RNA酶基因内和/或使 用可诱导启动子来控制负选择的严格性。在另一实施例中,选择或筛选试 剂的浓度(如氨苄青霉素的浓度)可以不同。在本发明的一些方面,因为在前 几轮中所需活性较低,严格性可以不同。因此,前几轮适用较低的严格性 筛选标准,而后几轮选择适用更严谨的标准。在某些实施方式中,负选择、 正选择或者正负选择可重复多次。也可使用多个不同的负选择标记、正选 择标记或正负选择标记。在某些实施方式中,正选择标记和负选择标记可 以相同。
其他类型的选择/筛选方法也可用于本发明以制备正交翻译组分,如 O-tRNA、O-RS和能对选择者密码子起反应而加载非天然氨基酸的 O-tRNA/O-RS配对。例如,负选择标记、正选择标记或正负选择标记可包括发 荧光的或在合适反应物存在下能催化发光反应的标记。在另一实施方式中,可 通过荧光激活细胞分选(FACS)或发光检测标记的产物。标记任选可包括亲和筛 选标记。也参见Francisco,J.A.等(1993),“Production and fluorescence-activated cell sorting of Escherichia coli expressing a functional antibody fragement on the external surface(在外表面表达功能性抗体片段的大肠杆菌的制备与荧光激活 细胞分选)”,Proc Natl Acad Sci USA.,90:10444-8。
制备重组正交tRNA的其它方法可见,例如名为“METHODS AND COMPOSITIONS FOR THE PRODUCTION OF ORTHOGONAL tRNA AMINOACYL-tRNA SYNTHETASE PAIRS(制备正交tRNA-氨酰基-tRNA 合成酶配对的方法和组合物)”的国际申请公开号WO 2002/086075;名为 “EXPANDING THE EUKARYOTIC GENETIC CODE(扩展真核生物遗传 密码)”的WO 2004/094593;与2004年7月7日提交的WO 2005/019415。 也参见Forster等,(2003),“Programming peptidomimetic synthetases by translating genetic codes designed de novo(通过翻译从头设计的遗传密码来 编程肽模拟合成酶)”,PNAS,100(11):6353-6357;和Feng等,(2003), “Expanding tRNA recognition of a tRNA synthetase by a single amino acid change(通过单氨基酸改变扩大tRNA合成酶的tRNA识别)”,PNAS,100 (10):5676-5681。
正交氨酰基-tRNA合成酶(O-RS)
本发明的O-RS在体外或体内能用非天然氨基酸优先氨酰化O-tRNA。 可通过含O-RS的多肽和/或编码O-RS或其部分的多核苷酸将本发明的 O-RS提供给翻译系统,如细胞。例如,示例性O-RS包含SEQ ID NO:4、6、 8或10所示氨基酸序列或其保守变体。在另一实施例中,O-RS或其部分是 由编码含本文序列表和实施例所示的氨基酸序列的多核苷酸序列或其互补 多核苷酸序列编码。可参见,例如SEQ ID NO:5、7、9或11所示多核苷酸。
鉴定可与O-tRNA一起应用的正交氨酰基-tRNA合成酶(O-RS),例如 O-RS的方法也是本发明的特征之一。例如,一种方法包括选择(如正选择) 第一物种的细胞群,其中所述细胞各自含有:1)多种氨酰基-tRNA合成酶 (RS)的成员之一(例如,所述多种RS可包括突变型RS、衍生自第一物种之 外的物种的RS,或突变型RS和衍生自第一物种之外的物种的RS二者); 2)正交tRNA(O-tRNA)(例如,一个或多个物种的);以及3)编码选择(例如 正选择)标记并含有至少一个选择者密码子的多核苷酸。与缺乏所述多种RS 的成员或成员数目少的细胞相比,选择或筛选显示抑制效率提高的那些细 胞。可用本领域已知和本文所述的方法测定抑制效率。抑制效率提高的细 胞包含能氨酰化O-tRNA的活性RS。将第一物种的第一组tRNA的活性RS 氨酰化的水平(体外或体内)与第二物种的第二组tRNA被活的RS氨酰化的 水平作比较。通过可检测物质(例如,标记的非天然氨基酸)测定氨酰化水平。 通常选择与第一组tRNA相比更有效地氨酰化第二组tRNA的活性RS,从 而获得能与O-tRNA联用的有效(优化)正交氨酰基-tRNA合成酶。采用这种 方法鉴定的O-RS也是本发明的特征之一。
可用许多试验来测定氨酰化。这些试验可在体外或体内进行。例如, 体外氨酰化试验可见例如Hoben和Soll,(1985),Methods Enzymol.,113: 55-59。也可联用报道分子和正交翻译组分并检测细胞中的报道分子来测定 氨酰化,所述细胞表达含有至少一个选择者密码子并编码某蛋白质的多核 苷酸。也参见名为“IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS(非天然氨基酸的体内掺入)”的WO 2002/085923和名为 “EXPANDING THE EUKARYOTIC GENETIC CODE(扩展真核生物遗传 密码)”的WO 2004/094593。
还可进一步改造鉴定的O-RS以改变该合成酶的底物特异性,从而使 得O-tRNA只加载上所需的非天然氨基酸,而不是任何常见的20种氨基酸。 产生对非天然氨基酸具有底物特异性的正交氨酰tRNA-合成酶的方法包 括,例如通过组合合成酶的不同结构域而使合成酶在其活性位点、在其编 辑机制位点、在不同位点发生突变等,并应用选择方法。也可以采用先正 选择再负选择的方案。在正选择中,抑制引入阳性标记的一个或多个非重 要位置的选择者密码子使得细胞在正选择压力下存活。在同时有天然和非 天然氨基酸存在时,如此存活的细胞编码使正交抑制子tRNA带有天然或 非天然氨基酸的活性合成酶。在负选择中,抑制引入阴性标记的一个或多 个非重要位置的选择者密码子使合成酶失去天然氨基酸特异性。经正、负 选择而存活的细胞编码只用非天然氨基酸氨酰化(加载)正交抑制子tRNA的 合成酶。然后通过例如DNA改组或其它递归诱变方法进一步诱变这些合成 酶。
可采用本领域已知的各种诱变技术产生突变型O-RS文库。例如,可 用位点特异性突变、随机点突变、同源重组、DNA改组或其它递归诱变方 法,嵌合构建或它们的组合来制备突变型RS。例如,可从两种或更多种其 它如较小、多样性较低的“亚文库”来制备突变型RS文库。本发明也包括 RS的嵌合文库。应注意,可以构建各种生物(例如微生物,如真细菌或古细 菌)的tRNA合成酶文库,例如具有天然多样性的文库(参见,例如授予Short 等的美国专利号6,238,884;授予Schallenberger等的美国专利号5,756,316; 授予Petersen等的美国专利号5,783,431;授予Thompson等的美国专利号 5,824,485;授予Short等的美国专利号5,958,672),并任选构建和筛选正交 配对。
一旦合成酶经历正和负选择/筛选方法,就可进一步诱变这些合成酶。 例如可分离编码O-RS的核酸;从该核酸产生编码突变O-RS的一组多核苷 酸(例如通过随机诱变、位点特异性诱变、重组或它们的任何组合);可重复 各步骤或各步骤的组合直至获得能用非天然氨基酸优先氨酰化O-tRNA的 突变O-RS。在本发明的一些方面,这些步骤可进行多次,例如至少两次。
本发明方法也可采用其它水平的选择/筛选严格性来产生O-tRNA、 O-RS或其配对。可改变O-RS产生方法中一个或两个步骤的选择或筛选严 格性。这包括,例如,改变选择/筛选试剂的用量等。也可额外进行几轮正 和/或负选择。选择或筛选也可包括以下一种或多种改变:氨基酸渗透性、 翻译效率、翻译保真度(translational fidelity)等。一种或多种改变通常依据 用正交tRNA-tRNA合成酶配对来产生蛋白质的生物中一种或多种基因突 变。
产生O-RS并改变合成酶底物特异性的其它常规细节见名为 “METHODS AND COMPOSITIONS FOR THE PRODUCTION OF ORTHOGONAL tRNA AMINOACYL-tRNA SYNTHETASE PAIRS(产生正 交tRNA-氨酰基tRNA合成酶配对的方法和组合物)”的WO 2002/086075 和名为“EXPANDING THE EUKARYOTIC GENETIC CODE(扩展真核生物 遗传密码)”的WO 2004/094593。也可参见Wang和Schultz,“Expanding the Genetic Code(扩展遗传密码)”,Angewandte Chemie Int.Ed.,44(1):34-66 (2005),其内容以引用方式全文纳入。
来源和宿主生物
本发明正交翻译组分(O-tRNA和O-RS)可得自任何生物(或生物的组 合),可用于任何其它物种的宿主翻译系统,只要所述O-tRNA/O-RS组分 与宿主系统能以正交方式起作用。某正交配对中的O-tRNA和O-RS无需得 自同一生物。在一些方面,正交组分得自用于真细菌宿主系统的古菌(即, 古细菌)基因。
例如,正交O-tRNA可衍生自古菌生物,例如古细菌,如詹氏甲烷球菌、 嗜热碱甲烷杆菌;盐细菌,如沃氏富盐菌和盐细菌种NRC-1;闪烁古生球 菌、激烈火球菌、极端嗜热古菌、嗜热泉生古细菌、海沼甲烷球菌、甲烷嗜 高热菌(Methanopyrus kandleri)、梅氏甲烷八叠球菌(Mm)、耐超高温热棒菌 (Pyrobaculum aerophilum)、深海火球菌、硫磺矿硫化叶菌(Ss)、超嗜热古菌 (Sulfolobus tokodaii)、嗜酸热原体、火山热原体等;或真细菌,如大肠杆菌、 嗜热栖热菌、枯草芽胞杆菌(Bacillus subtilis)、嗜热脂肪芽孢杆菌等;而正 交O-RS可得自以下生物(或生物的组合),例如古细菌,如詹氏甲烷球菌、 嗜热碱甲烷杆菌;盐细菌,如沃氏富盐菌和盐细菌种NRC-1;闪烁古生球 菌、激烈火球菌、极端嗜热古菌、嗜热泉生古细菌、海沼甲烷球菌、甲烷嗜 高热菌、梅氏甲烷八叠球菌、耐超高温热棒菌、深海火球菌、硫磺矿硫化叶 菌、超嗜热古菌、嗜酸热原体、火山热原体等;或真细菌,如大肠杆菌、 嗜热栖热菌、枯草芽胞杆菌、嗜热脂肪芽孢杆菌等。在一个实施方式中, 真核生物来源,例如植物、藻类、原生动物、真菌、酵母菌、动物(例如哺 乳动物、昆虫、节肢动物等)等也可用作O-tRNA和O-RS的来源。
O-tRNA/O-RS配对的各组分可得自同一生物或不同生物。在一个实施 方式中,O-tRNA/O-RS配对可来自同一生物。或者,O-tRNA/O-RS配对的 O-tRNA和O-RS可来自不同生物。
O-tRNA、O-RS或O-tRNA/O-RS配对可在体内或体外选择或筛选和/ 或可用于细胞,例如真细菌细胞,从而产生含有非天然氨基酸的多肽。所 用的真细菌细胞例如但不限于大肠杆菌、嗜热栖热菌、枯草芽胞杆菌、嗜 热脂肪芽孢杆菌等。含本发明翻译组分的真细菌细胞组合物也是本发明特 征之一。
为在一种生物中筛选O-tRNA和/或O-RS以用于另一种生物,也可参 见2004年4月16日提交的名为“EXPANDING THE EUKARYOTIC GENETIC CODE(扩展真核生物遗传密码)”的国际申请公布号WO 2004/094593。
虽然正交翻译系统(例如,含有O-RS、O-tRNA和非天然氨基酸)可利 用培养的宿主细胞产生含非天然氨基酸的蛋白质,但并非要求本发明的正 交翻译系统需要完整的、有活力的宿主细胞。例如,在细胞提取物存在下, 正交翻译系统可利用无细胞系统。实际上,使用无细胞的体外转录/翻译系 统产生蛋白质是公认的技术。利用本文所述的正交翻译系统组分,使这些 体外系统适用于产生含非天然氨基酸的蛋白质也属于本发明的范围。
选择者密码子
本发明的选择者密码子扩大了蛋白质生物合成机理的遗传密码子框 架。例如,选择者密码子包括,如独特的三碱基密码子、无义密码子(如终 止密码子(如琥珀密码子(UAG)或乳白密码子(UGA)))、非天然密码子、至少 四碱基的密码子、罕用密码子等。可将许多选择者密码子引入所需基因, 例如一个以上、两个以上、三个以上等。利用不同的选择者密码子,可利 用多对正交tRNA/合成酶配对,从而能利用这些不同的选择者密码子同时 位点特异性地掺入多个非天然氨基酸,例如包含至少一个非天然氨基酸。
在一个实施方式中,这些方法包括利用作为终止密码子的选择者密码 子在细胞中体内掺入非天然氨基酸。例如,制备能识别终止密码子的 O-tRNA,并由O-RS用非天然氨基酸氨酰化该O-tRNA。宿主的天然氨酰 基-tRNA合成酶不识别该O-tRNA。可采用常规的定点诱变将终止密码子引 入编码感兴趣多肽的多核苷酸中感兴趣的位点。可参见,例如Sayers,J.R. 等,(1988),“5′,3′Exonuclease in phosphorothioate-based oligonucleotide- directed mutagenesis(硫代磷酸酯寡核苷酸定向诱变中的5’,3’核酸外切 酶)”,Nucleic Acids Res,791-802。当例如在体内联用O-RS、O-tRNA和 编码感兴趣多肽的核酸时,可对终止密码子起反应而掺入非天然氨基酸, 从而获得在特定位点含有非天然氨基酸的多肽。在本发明的一个实施方式 中,用作选择者密码子的终止密码子是琥珀密码子UAG和/或乳白密码子 UGA。在一实施例中,UAG和UGA都用作选择者密码子的遗传密码可编 码22个氨基酸,同时保留赭石无义密码子,UAA,其是最丰富的终止信号。
体内掺入非天然氨基酸不会显著干扰宿主细胞。例如,在非真核细胞, 如大肠杆菌中,由于UAG密码子的抑制效率依赖于O-tRNA(如琥珀抑制子 tRNA)与释放因子1(RF1)(其可结合UAG密码子,进而引起延伸中的肽从 核糖体释放)之间的竞争,因此可通过,例如提高O-tRNA(如抑制子tRNA) 的表达水平,或利用RF1缺陷型菌株调节抑制效率。在真核细胞中,由于 UAG密码子的抑制效率依赖于O-tRNA(如琥珀抑制子tRNA)和真核释放因 子(如eRF)(其可结合终止密码子,进而引起延伸中的肽从核糖体释放)之间 的竞争,因此可通过,例如提高O-tRNA(如抑制子tRNA)的表达水平调节 抑制效率。此外,也可存在其它化合物,例如还原剂,如二硫苏糖醇(DTT)。
非天然氨基酸也可由罕用密码子编码。例如,当体外蛋白合成反应中 的精氨酸浓度下降时,证实罕用的精氨酸密码子AGG可利用丙氨酸酰化的 合成tRNA而有效插入ala。可参见Ma等,Biochemistry,32:7939(1993)。 在此情况中,合成tRNA可与大肠杆菌中作为次要成分存在的天然tRNAArg 竞争。此外,一些生物不能利用所有三联密码子。已可在体外转录/翻译提 取物中利用藤黄微球菌(Micrococcus luteus)的未指定密码子AGA插入氨基 酸。可参见,例如Kowal和Oliver,Nucl.Acid.Res.,25:4685(1997)。可产 生本发明的各组分以体内利用这些罕用密码子。
选择者密码子也可包括延伸密码子,例如四个或四个以上碱基的密码 子,如四个、五个、六个或更多碱基的密码子。四碱基密码子的例子包括, 例如AGGA、CUAG、UAGA、CCCU等。五碱基密码子的例子包括,例如 AGGAC、CCCCU、CCCUC、CUAGA、CUACU、UAGGC等。本发明方 法可包括使用基于移码抑制的延伸密码子。四个或四个以上碱基的密码子 可将例如一个或多个非天然氨基酸插入同一蛋白质。在其它实施方式中, 反密码子环可解码例如至少一种四碱基密码子、至少一种五碱基密码子或 至少一种六碱基密码子或更多。由于可能的四碱基密码子有256种,所以 同一细胞中可用四个或四个以上碱基的密码子编码多种非天然氨基酸。也 可参见,Anderson等,(2002),“Exploring the Limits of Codon and Anticodon Size(密码子和反密码子大小极限的研究)”,Chemistry and Biology,9: 237-244和Magliery,(2001),“Expanding the Genetic Code:Selection of Efficient Suppressors of Four-base Codons and Identification of″Shifty″ Four-base Codons with a Library Approach in Escherichia coli(扩增遗传密码: 在大肠杆菌中选择有效的四碱基密码子抑制剂并用文库方法鉴定“变化的” 四碱基密码子)”,J.Mol.Biol.,307:755-769。
例如,已采用体外生物合成方法利用四碱基密码子将非天然氨基酸掺 入蛋白质。参见,例如Ma等,(1993),Biochemistry,32:7939和Hohsaka 等,(1999),J.Am.Chem.Soc.,121:34。联用CGGG和AGGU及两种化学 酰化的移码抑制子tRNA在体外将2-基丙氨酸和赖氨酸的NBD衍生物同 时掺入链霉亲和素。可参见,例如Hohsaka等,(1999),J.Am.Chem.Soc., 121:12194。在体内研究中,Moore等检测了含NCUA反密码子的tRNALeu 衍生物抑制UAGN密码子(N可以是U、A、G或C)的能力,发现含UCUA 反密码子的tRNALeu能解码四联UAGA,其效率为13到26%,而在0或-1 读框中几乎不解码。可参见Moore等,(2000),J.Mol.Biol.,298:195。在 一个实施方式中,本发明可利用基于罕用密码子或无义密码子的延伸密码 子,它们能降低在其它不期望位点的错义连读(missense readthrough)和移码 抑制。四碱基密码子已在各种正交系统中用作选择者密码子。可参见,例 如,WO 2005/019415;WO 2005/007870和WO 2005/07624。也可参见Wang 和Schultz,“Expanding the Genetic Code(扩展遗传密码)”,Angewandte Chemie Int.Ed.,44(1):34-66(2005),其内容通过引用的方式全文纳入。虽 然以下例子利用琥珀选择者密码子,但通过改进本文的实例使之包含四碱 基O-tRNA和经修饰包含与之前描述的各非天然氨基酸O-RS的突变相似的 突变的合成酶,也可使用四碱基或更多碱基的密码子。
对于给定系统,选择者密码子还可包括天然三碱基密码子中内源性系 统不用(或很少用)的那个天然碱基密码子。例如,这包括缺乏能识别该天然 三碱基密码子的tRNA的系统,和/或该三碱基密码子是罕用密码子的系统。
选择者密码子任选包含非天然碱基对。这些非天然碱基对进一步扩大 了现有的遗传字符集(genetic alphabet)。一种额外的碱基对可将三联密码子 的数目从64增加至125。第三碱基对的特性包括:稳定和选择性的碱基配 对,利用聚合酶高保真地有效酶促掺入DNA,新生非天然碱基对合成后引 物继续有效延伸。适用于这些方法和组合物的非天然碱基对的描述包括: 例如Hirao等,(2002),“An unnatural base pair for incorporating amino acid analogues into protein(将氨基酸类似物掺入蛋白质的非天然碱基对)”, Nature Biotechnology,20:177-182。也可参见Wu,Y.等,(2002),J.Am.Chem. Soc.,124:14626-14630。下文列出了其它的相关出版物。
对于体内使用,非天然核苷是膜可渗透的,并可磷酸化形成相应的磷 酸三酯。此外,增加的遗传信息稳定且不为细胞酶所破坏。Benner与他人 先前的工作利用了不同于经典Watson-Crick配对的氢键模式,其中最值得 注意的例子是异-C:异-G配对(iso-C:iso-G pair)。参见,例如Switzer等, (1989),J.Am.Chem.Soc.,111:8322;Piccirilli等,(1990),Nature,343:33; Kool,(2000),Curr.Opin.Chem.Biol.,4:602。这些碱基通常与天然碱基 有一定程度的错配,因而不能酶促复制。Kool和同事证明,碱基间的疏水 包装相互作用(hydrophobic packing interaction)可替代氢键以驱动碱基对形 成。参见Kool,(2000),Curr.Opin.Chem.Biol.,4:602;Guckian和Kool, (1998),Angew.Chem.hit.Ed.Engl.,36:2825。在致力于开发符合以上所有 要求的非天然碱基对的过程中,Schultz、Romesberg和同事已系统地合成 并研究了一系列非天然疏水碱基。发现PICS:PICS自身配对比天然碱基对 更稳定,并可用大肠杆菌DNA聚合酶I的Klenow片段(KF)有效地掺入 DNA。可参见,例如McMinn等,(1999),J.Am.Chem.Soc.,121:11586; 和Ogawa等,(2000),J.Am.Chem.Soc.,122:3274。就生物学功能而言, KF合成3MN:3MN自身配对的效率和选择性足够。可参见,例如Ogawa 等,(2000),J.Am.Chem.Soc.,122:8803。然而,这两种碱基均作为进一 步复制的链终止子而起作用。近来开发了可用于复制PICS自身配对的突变 型DNA聚合酶。此外,可复制7AI自身配对。可参见,例如Tae等,(2001), J.Am.Chem.Soc.,123:7439。还已开发了与Cu(II)结合后可形成稳定配对 的金属碱基(metallobase)对Dipis:Py。可参见,Meggers等,(2000),J.Am. Chem.Soc.,122:10714。因为延伸密码子和非天然密码子在本质上与天然 密码子正交,所以本发明方法可利用该特性产生它们的正交tRNA。
还可利用翻译旁路系统将非天然氨基酸掺入所需多肽。在翻译旁路系 统中,可将一个大序列插入基因,但该序列不翻译成蛋白质。该序列含有 可作为提示的结构,从而能诱导核糖体跳过该序列然后恢复该插入序列的 下游翻译。
非天然氨基酸
本文所用的非天然氨基酸指除硒代半胱氨酸和/或吡咯赖氨酸和以下 20种遗传编码的α-氨基酸以外的任何氨基酸、修饰的氨基酸或氨基酸类似 物:丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨 酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、 脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、缬氨酸。α-氨基酸的通用结 构如式I所示:

非天然氨基酸一般具有式I所示的任何结构,其中R基团是除20种天 然氨基酸中所用以外的任何取代基。20种天然氨基酸的结构可参见,例如 《生物化学》(Biochemistry),L.Stryer编,第三版,1988,福里曼公司(Freeman and Company),纽约。注意,本发明的非天然氨基酸可以是除以上20种α- 氨基酸以外的天然化合物。
由于本发明的非天然氨基酸与天然氨基酸通常区别在侧链,所以非天 然氨基酸与其它氨基酸(例如天然或非天然的)形成酰胺键的方式与天然蛋 白质中酰胺键的形成方式相同。然而,非天然氨基酸的侧链不同于天然氨 基酸的侧链。
本文特别感兴趣的是非天然氨基酸磺基酪氨酸(参见图1)。除了非天然 氨基酸磺基酪氨酸外,可将其它非天然氨基酸同时掺入感兴趣的多肽,例 如联用合适的第二O-RS/O-tRNA配对与本发明提供的正交配对。已知许多 这样的其它非天然氨基酸和合适的正交配对。参见本文内容和本文引用的 参考文献。例如,参见Wang和Schultz,“Expanding the Genetic Code(扩 展遗传密码)”,Angewandte Chemie Int.Ed.,44(1):34-66(2005);Xie和 Schultz,“An Expanding Genetic Code(扩展遗传密码)”,Methods 36(3):227-238(2005);Xie和Schultz,“Adding Amino Acids to the Genetic Repertoire(将氨基酸加入遗传库)”,Curr.Opinion in Chemical Biology 9(6):548-554(2005);和Wang等,“Expanding the Genetic Code(扩展遗传 密码)”,Annu.Rev.Biophys.Biomol.Struct.,35:225-249(2006);这些文献 各自的内容以引用的方式全文纳入本文作为参考。
虽然本文所述实施例中主要感兴趣的是非天然氨基酸磺基酪氨酸(图1 所示),但并非要将本发明严格限制于该结构。实际上,不难制备各种易于 获得且结构相关的类似物,这些类似物保留图1所示磺基酪氨酸的主要特 性,而且本发明的氨酰基-tRNA合成酶(例如,SEQ ID NO:4、6、8和10 所示O-RS)还特异性识别这些类似物。这些相关的氨基酸类似物属于本发 明的范围。
在其它非天然氨基酸中,例如式I中的R可任选含有烷基-、芳基-、酰 基-、肼、氰基-、卤代-、酰肼、烯基、醚、酸基(borate)、硼酸酯基(boronate)、 磷、膦酰基、膦、烯、亚胺、酯、羟胺、胺等,或上述基团的任何组合。 感兴趣的其它非天然氨基酸包括但不限于:含光可活化交联剂的氨基酸、 自旋-标记的氨基酸、荧光氨基酸、金属结合氨基酸、含金属的氨基酸、放 射性氨基酸、含有新官能团的氨基酸、能与其它分子共价或非共价相互作 用的氨基酸、光定(photocaged)和/或光致异构(photoisomerizable)的氨基 酸、含生物素或生物素类似物的氨基酸、含酮基的氨基酸、糖基化的氨基 酸、与氨基酸侧链相连的糖部分、含聚乙二醇或聚醚的氨基酸、重原子取 代的氨基酸、化学方法可切割或光可切割的氨基酸、与天然氨基酸相比侧 链延长的氨基酸(如聚醚或长链,如超过约5个、约10个原子等)、含 碳连接糖的氨基酸、含氨基硫代酸的氨基酸以及含一个或多个毒性部分的 氨基酸。
本发明另一方面提供具有以下式IV所示通用结构的非天然氨基酸:

具有此结构的非天然氨基酸一般可以是任何结构,其中R1是20种天 然氨基酸之一(例如,酪氨酸或苯丙氨酸)所用的取代基,R2是取代基。因 此,此类非天然氨基酸可视作天然氨基酸衍生物。
除了含有图1所示磺基酪氨酸结构的非天然氨基酸外,非天然氨基酸 还可任选含有经修饰的骨架结构,例如式II和III所示的结构:

其中,Z一般包含OH、NH2、SH、NH-R′或S-R′;X和Y可以相同或 不同,一般包含S或O,R和R′可任选相同或不同,通常选自与上述式I 所示非天然氨基酸的R基团相同的组成以及氢。例如,本发明的非天然氨 基酸还任选在式II和III所示氨基或羧基中包含取代基。该类型的非天然氨 基酸包括但不限于:例如含有20种常见氨基酸的相应侧链或非天然侧链的 α-羟酸、α-硫代酸、α-氨基硫代羧酸酯等。另外,α碳上的取代基还任选包 括L、D或α-α-双取代氨基酸,如D-谷氨酸、D-丙氨酸、D-甲基-O-酪氨酸、 氨基丁酸等。其它替代结构包括环形氨基酸,如脯氨酸类似物以及3、4、6、 7、8和9元环脯氨酸类似物,β和γ氨基酸,如取代的β丙氨酸和γ-氨基 丁酸。
在一些方面,本发明使用L-构型的非天然氨基酸。然而,本发明并非 仅限于使用L-构型的非天然氨基酸。还考虑了这些非天然氨基酸的D-对映 体可用于本发明。
本发明所用的非天然氨基酸不严格局限于图1所示的非天然氨基酸磺 基酪氨酸。本领域技术人员知道不难获得天然氨基酸的各种非天然类似物。 例如,但不限于不难制备衍生自酪氨酸的非天然(氨基酸)。酪氨酸类似物包 括,例如对位取代的酪氨酸、邻位取代的酪氨酸和间位取代的酪氨酸,其 中该取代的酪氨酸含有炔基、乙酰基、苯甲酰基、氨基、肼、羟胺、巯基、 羧基、异丙基、甲基、C6-C20直链或支链烃、饱和或不饱和的烃、O-甲基、 聚醚基团、硝基等。此外,也包括多取代的芳环。本发明的谷氨酰胺类似 物包括但不限于:α-羟基衍生物、γ-取代的衍生物、环形衍生物和酰胺取代 的谷氨酰胺衍生物。苯丙氨酸类似物的例子包括但不限于:对位取代的苯 丙氨酸、邻位取代的苯丙氨酸和间位取代的苯丙氨酸,其中所述取代基含 有炔基、羟基、甲氧基、甲基、烯丙基、基、硝基、巯基或酮基等。非 天然氨基酸的具体例子包括但不限于:磺基酪氨酸、对-乙基硫代羰基-L- 苯丙氨酸、对-(3-氧代丁酰基)-L-苯丙氨酸、1,5-丹酰-丙氨酸、7-氨基-香豆 素氨基酸、7-羟基-香豆素氨基酸、硝基苄基-丝氨酸、O-(2-硝基苄基)-L-酪 氨酸、对-羧甲基-L-苯丙氨酸、对-氰基-L-苯丙氨酸、间-氰基-L-苯丙氨酸、 联苯基丙氨酸、3-氨基-L-酪氨酸、联吡啶基丙氨酸、对-(2-氨基-1-羟乙基)-L- 苯丙氨酸、对-异丙基硫代羰基-L-苯丙氨酸、3-硝基-L-酪氨酸和对-硝基-L- 苯丙氨酸。还包括对-炔丙氧基苯丙氨酸、3,4-二羟基-L-苯丙氨酸(DHP)、 3,4,6-三羟基-L-苯丙氨酸、3,4,5-三羟基-L-苯丙氨酸、4-硝基-苯丙氨酸、对 -乙酰基-L-苯丙氨酸、O-甲基-L-酪氨酸、L-3-(2-萘基)丙氨酸、3-甲基-苯丙 氨酸、O-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、3-硝基-酪氨酸、3-巯基- 酪氨酸、三-O-乙酰基-GlcNAc β-丝氨酸、L-多巴(Dopa)、氟化苯丙氨酸、 异丙基-L-苯丙氨酸、对-叠氮基-L-苯丙氨酸、对-酰基-L-苯丙氨酸、对-苯 甲酰基-L-苯丙氨酸、L-磷酸丝氨酸、膦酰丝氨酸、膦酰酪氨酸、对-碘代- 苯丙氨酸、对-溴代苯丙氨酸、对-氨基-L-苯丙氨酸以及异丙基-L-苯丙氨酸 等。本文引用的参考文献披露了各种非天然氨基酸的结构。还可参见2005 年10月27日提交的WO 2006/110182,名为“ORTHOGONAL TRANSLATION COMPONENTS FOR THE VIVO INCORPORATION OF UNNATURAL AMINO ACIDS(体内掺入非天然氨基酸的正交翻译组分)”。
非天然氨基酸的化学合成
上述许多非天然氨基酸可以从,例如美国的西格玛公司(Sigma)或美 国威斯康星州密尔沃基市的阿尔得里奇公司(Aldrich)等购得。那些不能商 品化购得的非天然氨基酸可任选如各种出版物所述或采用本领域技术人员 已知的标准方法合成。有机合成技术可参见,例如Fessendon和Fessendon, Organic Chemistry(有机化学),(1982,第二版,威拉德格兰特出版社(Willard Grant Press),波士顿,马萨诸塞州);March,Advanced Organic Chemistry(高 级有机化学)(第三版,1985,威立父子公司(Wiley and Sons),纽约);以及 Carey和Sundberg的Advanced Organic Chemistry(高级有机化学)(第三版, A和B部分,1990,普莱纳姆出版社(Plenum Press),纽约)。其它描述非天 然氨基酸合成的出版物包括:名为“非天然氨基酸的体内掺入”的国际专 利申请WO 2002/085923;Matsoukas等,(1995)J.Med.Chem.,38, 4660-4669;King和Kidd,(1949)“A New Synthesis of Glutamine and of γ- Dipeptides of Glutamic Acid from Phthylated Intermediates”(从邻苯二甲酰化 中间体合成谷氨酰胺和γ-二肽的新方法).J.Chem.Soc.,3315-3319; Friedman和Chatterrji,(1959)“Synthesis of Derivatives of Glutamine as Model Substrates for Anti-tumor Agents(合成谷氨酰胺衍生物作为抗肿瘤药 物的模拟底物)”.J.Am.Chem.Soc.81,3750-3752;Craig等,(1988)“Absolute Configuration of the Enantiomers of 7-Chloro-4 [[4-(diethylamino)-1-methylbutyl]amino]quinoline(Chloroquine)(7-氯-4[[4-(二 乙基氨基)-1-甲基丁基]氨基]喹啉(氯喹)对映体的绝对构型)”.J.Org.Chem. 53,1167-1170;Azoulay M.、Vilmont,M.和Frappier,F.(1991)“Glutamine analogues as Potential Antimalarials(谷氨酰胺类似物作为潜在的抗疟药)”, Eur.J.Med.Chem.26:201-205;Koskinen,A.M.P.和Rapoport,H.(1989) “Synthesis of 4-Substituted Prolines as Conformationally Constrained Amino Acid Analogues(合成4-取代的脯氨酸作为构象约束的氨基酸类似物)”.J. Org.Chem.54:1859-1866;Christie,B.D.和Rapoport,H.(1985)“Synthesis of Optically Pure Pipecolates from L-Asparagine.Application to the Total Synthesis of(+)-Apovincamine through Amino Acid Decarbonylation and Iminium Ion Cyclization(从L-天冬酰胺合成光学纯的哌啶酸酯,应用于通过 氨基酸脱羰基和亚氨鎓离子环化总合成(+)-阿扑长春胺)”.J.Org.Chem. 1989:1859-1866;Barton等,(1987)“Synthesis of Novel α-Amino-Acids and Derivatives Using Radical Chemistry:Synthesis of L-and D-α-Amino-Adipic Acids,L-α-aminopimelic Acid and Appropriate Unsaturated Derivatives(采用 自由基化学方法合成新的α-氨基酸和衍生物:合成L-和D-α氨基酸、L-α- 氨基庚二酸以及合适的不饱和衍生物)”.Tetrahedron Lett.43:4297-4308; 以及Subasinghe等,(1992)“Quisqualic acid analogues:synthesis of beta-heterocyclic 2-aminopropanoic acid derivatives and their activity at a novel quisqualate-sensitized site(使君子氨酸类似物:β-杂环2-氨基丙酸衍生 物的合成及其在使君子氨酸敏化部位的活性)”.J.Med.Chem.35:4602-7。还 可参见2003年12月22日提交的名为“Protein Arrays(蛋白质阵列)”的国 际专利申请WO2004/058946。
非天然氨基酸的细胞摄取
细胞摄取非天然氨基酸通常是设计和选择非天然氨基酸,例如用于掺 入蛋白质中应考虑的问题之一。例如,α-氨基酸的高电荷密度提示这些化 合物不可能透过细胞。天然氨基酸通过蛋白质转运系统的收集(作用)摄取入 细胞,这些系统往往显示程度不同的氨基酸特异性。可进行快速筛选来评 估细胞将摄取哪种非天然氨基酸(如果有的话)。可参见,例如2003年12月 22日提交的名为“Protein Arrays(蛋白质阵列)”的国际公布WO 2004/058946 中的毒性试验;Liu和Schultz,(1999),“Progress toward the evolution of an organism with an expanded genetic code(含扩增遗传密码的生物演化的进 展)”,PNAS,96:4780-4785。虽然不难采用各种试验分析摄取情况,但设 计适合于细胞摄取途径的非天然氨基酸的另一种方法是提供生物合成途 径,从而能在体内产生氨基酸。
非天然氨基酸的生物合成
细胞中已有许多生物合成途径来产生氨基酸和其它化合物。虽然自然 界中,例如细胞中,可能不存在特定非天然氨基酸的生物合成方法,但本 发明提供了这种方法。例如,通过加入新的酶或修饰现有的宿主细胞途径 可以在宿主细胞中任选产生非天然氨基酸的生物合成途径。其它新的酶任 选是天然产生的酶或人工开发的酶。例如,生物合成对氨基苯丙氨酸(如 WO 2002/085923中的实施例所示)依赖加入其它生物的已知酶的混合物。可 通过用含这些酶的基因的质粒转染细胞而将这些基因引入细胞。当这些基 因在细胞中表达时,它们提供了合成所需化合物的酶途径。可任选加入的 酶类型的例子见以下实施例。其它酶序列见例如Genbank。也可以相同方 式将人工开发的酶任选加入细胞。可以此方式操控细胞机理和资源用以产 生非天然氨基酸。
实际上,可采用各种方法产生新的酶从而在体内或体外用于生物合成 途径,改进现有途径,产生非天然氨基酸。开发酶和其它生物合成途径组 分的许多现有方法适用于本发明以产生非天然氨基酸(或者,实际上,用于 开发合成酶使之具有新的底物特异性或其它感兴趣的活性)。例如,可任选 采用DNA改组来开发新的酶和/或这些酶的途径,从而能在体外或体内产 生非天然氨基酸(或产生新的合成酶)。可参见,例如Stemmer,(1994), “Rapid evolution of a protein in vitro by DNA shuffling(通过DNA改组在体 外快速进化蛋白质)”,Nature,370(4):389-391;Stemmer,(1994),“DNA shuffling by random fragmentation and reassembly:In vitro recombination for molecular evolution(通过随机断裂和装配的DNA改组:分子进化的体外 重组)”,Proc.Natl.Acad.Sci.USA.,91:10747-10751。相关方法改组关联 的(例如同源的)基因家族,从而能快速开具有所需特性的酶。这种“家族基 因改组”方法的例子见Crameri等,(1998),“DNA shuffling of a family of genes from diverse species accelerates directed evolution(不同种类基因家族 的DNA改组加速了定向进化)”,Nature,391(6664):288-291。也可采用 称为“产生杂交酶的递增截短”(ITCHY)的DNA重组方法来产生新的酶(无 论是生物合成途径组分或合成酶),例如Ostermeier等,(1999),“A combinatorial approach to hybrid enzymes independent of DNA homology(不 依赖DNA同源性的杂交酶的组合方法)”,Nature Biotech,17:1205中所 述。该方法也可用于产生用作一种或多种体外或体内重组方法底物的酶或 其它途径变体的文库。也可参见,Ostermeier等,(1999),“Combinatorial Protein Engineering by Incremental Truncation(采用递增截短的组合蛋白质 工程)”,Proc.Natl.Acad.Sci.USA,96:3562-67;Ostermeier等,(1999), “Incremental Truncation as a Strategy in the Engineering of Novel Biocatalysts(作为工程改造新生物催化剂的方法的递增截短)”,Biological and Medicinal Chemistry,7:2139-44。另一种方法采用指数集合诱变 (exponential ensemble mutagenesis)来产生酶或其它途径变体的文库,其能例 如催化与产生非天然氨基酸(或新合成酶)有关的生物合成反应。在该方法 中,平行地随机选取(randomized)感兴趣序列中的小基团残基,以在各不同 位置鉴定可产生功能性蛋白质的氨基酸。适用于本发明以产生新酶进而产 生非天然氨基酸(或新合成酶)的此类方法的例子见Delegrave和Youvan, (1993),Biotechnology Research,11:1548-1552。在另一方法中,利用掺杂 或简并寡核苷酸的随机或半随机诱变可用于工程改造酶和/或途径成分,例 如采用如以下文献所述的通用诱变方法:Arkin和Youvan,(1992), “Optimizing nucleotide mixtures to encode specific subsets of amino acids for semi-random mutagenesis”(优化核苷酸混合物来编码用于半随机诱变的特 定氨基酸亚组),Biotechnology 10:297-300;或Reidhaar-Olson等,(1991), “Random mutagenesis of protein sequences using oligonucleotide cassettes” (用寡核苷酸盒随机诱变蛋白质序列),Methods Enzymol.,208:564-86。利 用多核苷酸重装配和位点饱和诱变的另一种方法(常称为“非随机”诱变) 可用于产生酶和/或途径组分,然后筛选它们行使一种或多种合成酶或生物 合成途径功能(例如在体内产生非天然氨基酸)的能力。可参见,例如Short, “NON-STOCHASTIC GENERATION OF GENETIC VACCINES AND ENZYMES(遗传疫苗和酶的非随机产生)”,WO 00/46344。
这种突变方法的替代方法包括重组生物的整个基因组并选择得到的后 代的特定途径功能(常称为“全基因组改组”)。该方法适用于本发明,例如 通过基因组重组并选择能够产生非天然氨基酸(或其中间体)的生物(大肠杆 菌或其它细胞)。例如,以下出版物所指导的方法可应用于途径设计,从而 能开发细胞中现有和/或新的途径进而在体内产生非天然氨基酸:Patnaik 等,(2002),“Genome shuffling of lactobacillus for improved acid tolerance(乳 酸杆菌基因组改组来提高酸耐受性)”,Nature Biotechnology,20(7):707-712; 和Zhang等,(2002),“Genome shuffling leads to rapid phenotypic improvement in bacteria(基因组改组导致细菌表型快速改善)”,Nature,2 月7日,415:644-646。
其它可用于生物和代谢途径工程改造(例如为产生所需化合物)的技术 也适用于产生非天然氨基酸。指导有用的路径工程改造方法的出版物的例 子包括:Nakamura和White,(2003),“Metabolic engineering for the microbial production of 1,3 propanediol(微生物生产1,3丙二醇的代谢工程)”,Curr. Opin.Biotechnol.,14(5):454-9;Berry等,(2002),“Application of Metabolic Engineering to improve both the production and use of Biotech Indigo(应用代 谢工程来提高Biotech Indigo的生产和用途)”,J.Industrial Microbiology and Biotechnology,28:127-133;Banta等,(2002),“Optimizing an artificial metabolic pathway:Engineering the cofactor specificity of Corynebacterium 2,5-diketo-D-gluconic acid reductase for use in vitamin C biosynthesis(优化人 工代谢途径:工程改造用于维生素C生物合成的棒状杆菌2,5-二酮基-D-葡 糖酸还原酶的辅助因子特异性)”,Biochemistry,41(20):6226-36;Selivonova 等,(2001),“Rapid Evolution of Novel Traits in Microorganisms(微生物中 新特性的快速进化)”,Applied and Environmental Microbiology,67:3645, 和许多其它出版物。
无论采用什么方法,用本发明工程改造的生物合成途径产生的非天然 氨基酸的浓度足以有效地生物合成蛋白质,例如天然细胞含量,但不应达 到显著影响其它细胞氨基酸的浓度或耗尽细胞资源的程度。以此方式在体 内所产生的浓度一般为约10mM到约0.05mM。一旦细胞被工程改造从而 产生了特定途径所需的酶和非天然氨基酸,为了核糖体蛋白质合成和细胞 生长,可任选采用体内选择以进一步优化非天然氨基酸的产生。
掺入非天然氨基酸的正交组分
本发明提供制备正交组分从而能在体内对选择者密码子,如琥珀终止 密码子、无义密码子、四碱基或多碱基密码子等起反应而将非天然氨基酸 磺基酪氨酸(参见图1)掺入延伸的多肽链中的方法和组合物。例如,本发明 提供了正交-tRNA(O-tRNA)、正交氨酰基-tRNA合成酶(O-RS)及其配对。这 些配对可用于将非天然氨基酸掺入延伸的多肽链中。
本发明的组合物包含正交氨酰基-tRNA合成酶(O-RS),所述O-RS用磺 基酪氨酸优先氨酰化O-tRNA。在某些实施方式中,O-RS包含含有SEQ ID NO:4、6、8或10的氨基酸序列及其保守变体。在本发明的某些实施方式 中,O-RS用特定的非天然氨基酸优先氨酰化O-tRNA胜过任何内源性 tRNA,其中所述O-RS对O-tRNA有偏好(bias),其中加载有非天然氨基酸 的O-tRNA与加载有相同非天然氨基酸的内源性tRNA的比例大于1∶1,更 优选O-RS排他性地或者几乎排他性地加载O-tRNA。
含O-RS的组合物还可任选含有正交tRNA(O-tRNA),该O-tRNA识别 选择者密码子。与包含本文序列表(例如,SEQ ID NO:1)和实施例所列的多 核苷酸序列或由其编码的O-tRNA的抑制效率相比,在关联合成酶存在下, 本发明O-tRNA对选择者密码子起反应而通常具有至少约,例如45%、50%、 60%、75%、80%、90%或更高的抑制效率。在一个实施方式中,O-RS结合 O-tRNA的抑制效率至少是没有O-RS存在下O-tRNA的抑制效率高,例如 5倍、10倍、15倍、20倍、25倍或更高。在一些方面,O-RS与O-tRNA 一起的抑制效率至少是衍生自詹氏甲烷球菌的正交酪氨酰-tRNA合成酶的 抑制效率的45%。
包含O-tRNA的组合物还可任选包含细胞(例如真细菌细胞,如大肠杆 菌细胞等,或真核细胞,如酵母细胞)和/或翻译系统。
本发明还提供包含翻译系统的细胞(如真细菌细胞或酵母细胞),所述翻 译系统包含正交-tRNA(O-tRNA);正交氨酰基-tRNA合成酶(O-RS)和非天然 氨基酸磺基酪氨酸。O-RS通常用非天然氨基酸优先氨酰化O-tRNA胜过任 何内源性tRNA,该O-RS对O-tRNA有偏好,加载有非天然氨基酸的O-tRNA 与加载有相同非天然氨基酸的内源性tRNA的比例大于1∶1,更优选该O-RS 排他性地或者几乎排他性地加载O-tRNA。O-tRNA识别第一选择者密码子, O-RS能用非天然氨基酸优先氨酰化O-tRNA。在一个实施方式中,O-tRNA 含有SEQ ID NO:1所示多核苷酸序列或其互补多核苷酸序列,或者由其编 码。在一个实施方式中,该O-RS含有SEQ ID NO:4、6、8或10所示氨基 酸序列和其保守变体。
本发明的细胞还可任选包含其它不同的O-tRNA/O-RS配对和第二非 天然氨基酸,例如,此O-tRNA识别第二选择者密码子,此O-RS用第二非 天然氨基酸优先氨酰化相应的O-tRNA,其中所述第二氨基酸不同于第一非 天然氨基酸。本发明的细胞可任选包含含有编码感兴趣多肽的多核苷酸的 核酸,所述多核苷酸含有所述O-tRNA能识别的选择者密码子。
在某些实施方式中,本发明的细胞是真细菌细胞(如大肠杆菌),所述细 胞含有正交-tRNA(O-tRNA)、正交氨酰基-tRNA合成酶(O-RS)、非天然氨基 酸和含有编码感兴趣多肽的多核苷酸的核酸,其中所述多核苷酸含有该 O-tRNA能识别的选择者密码子。在本发明的某些实施方式中,所述O-RS 用所述非天然氨基酸优先氨酰化所述O-tRNA,其效率高于该O-RS氨酰化 任何内源性tRNA的效率。
在本发明的某些实施方式中,本发明的O-tRNA含有本文序列表(例如, SEQ ID NO:1)或实施例中所示的多核苷酸序列或其互补多核苷酸序列,或 由这些序列编码。在本发明的某些实施方式中,O-RS含有序列表中所示氨 基酸序列或其保守变体。在一个实施方式中,O-RS或其部分由编码本文序 列表和实施例所示氨基酸序列的多核苷酸序列或其互补的多核苷酸序列编 码。
本发明的O-tRNA和/或O-RS可衍生自各种生物(如真核和/或非真核生 物)。
多核苷酸也是本发明的特征。本发明的多核苷酸(例如,SEQ ID NO:5、 7、9或11)包括人工的(如人造的和非天然产生的)多核苷酸,所述多核苷酸 序列含有编码本文序列表所示多肽的核苷酸序列,和/或与该多核苷酸序列 互补。本发明的多核苷酸还可包括在高度严谨条件下能与上述多核苷酸在 基本全长的核酸上杂交的核酸。本发明的多核苷酸还包括与天然tRNA或 相应编码核酸的序列具有,例如至少75%、至少80%、至少90%、至少95%、 至少98%或更高相同性的多核苷酸(但是本发明的多核苷酸不是天然tRNA 或相应的编码核酸),所述tRNA识别选择者密码子,如四碱基密码子。与 上述任何多核苷酸序列和/或含上述任何序列的保守变体的多核苷酸有,例 如至少80%、至少90%、至少95%、至少98%或更高相同性的人工多核苷 酸也包括在本发明的多核苷酸内。
含本发明多核苷酸的载体也是本发明的特征。例如,本发明的载体可 以是质粒、粘粒、噬菌体、病毒、表达载体等。含本发明载体的细胞也是 本发明的特征。
O-tRNA/O-RS配对组分的制备方法也是本发明的特征。用这些方法制 备的组分也是本发明的特征。例如,产生至少一种与细胞正交的 tRNA(O-tRNA)的方法包括制备突变体tRNA文库;使突变体tRNA文库中 各成员的反密码子环突变使得其能识别选择者密码子,藉此提供潜在的 O-tRNA文库,并对第一物种的第一细胞群进行负选择,所述细胞含有潜在 O-tRNA文库的成员。负选择可去除含潜在O-tRNA文库成员的细胞,该潜 在O-tRNA可被细胞的内源性氨酰基-tRNA合成酶(RS)氨酰化。由此提供与 第一物种的细胞正交的tRNA库,从而至少提供一种O-tRNA。还提供用本 发明方法产生的O-tRNA。
在某些实施方式中,这些方法还包括正选择第一物种的第二细胞群, 其中所述细胞含有与第一物种的细胞正交的tRNA库的成员、关联氨酰基 -tRNA合成酶和阳性选择标记。采用正选择可选择或筛选出含有能被关联 氨酰基-tRNA合成酶氨酰化而且在阳性选择标记存在下可显示所需反应的 tRNA库成员的那些细胞,藉此提供O-tRNA。在某些实施方式中,第二细 胞群含有未被负选择去除的细胞。
还提供能用非天然氨基酸加载O-tRNA的正交-氨酰基-tRNA合成酶的 鉴定方法。例如,该方法包括对第一物种的细胞群进行筛选,其中所述细 胞各自含有:1)多种氨酰基-tRNA合成酶(RS)的成员(例如,所述多种RS 可包括突变型RS、衍生自第一物种以外的物种的RS、或者突变型RS和衍 生自第一物种以外的物种的RS二者);2)正交-tRNA(O-tRNA)(如衍生自 一个或多个物种);和3)编码阳性选择标记并且包含至少一个选择者密码 子的多核苷酸。
选择或筛选与不含所述多种RS的成员或所含成员数目较少的细胞相 比细胞(如宿主细胞)中显示抑制效率提高的那些细胞。这些选择/筛选的细 胞含有能氨酰化O-tRNA的活性RS。用这些方法鉴定到的正交氨酰基-tRNA 合成酶也是本发明的特征。
在细胞(例如真细菌细胞,如大肠杆菌细胞等,或酵母细胞)内产生在所 选位置含有非天然氨基酸的蛋白质的方法也是本发明的特征。例如,一种 方法包括在适当的培养基内培养细胞,其中所述细胞含有核酸,而该核酸 含有至少一个选择者密码子并编码一种蛋白,从而提供非天然氨基酸并在 含所述至少一个选择者密码子的核酸的翻译过程中将该非天然氨基酸掺入 该蛋白质的特定位置,从而产生该蛋白质。细胞还含有:在细胞内起作用 并识别选择者密码子的正交-tRNA(O-tRNA);以及用非天然氨基酸优先氨 酰化O-tRNA的正交氨酰基-tRNA合成酶(O-RS)。用这种方法产生的蛋白 质也是本发明的特征。特别感兴趣的是产生可用作抗凝剂的硫酸化形式的 蛭素的方法。
本发明还提供含有蛋白质的组合物,其中所述蛋白质包含磺基酪氨酸。 在某些实施方式中,蛋白质包含的氨基酸序列与已知蛋白,如蛭素、治疗 蛋白、诊断蛋白和工业用酶或其一部分的氨基酸序列有至少75%相同性。 组合物任选包含药学上可接受的载体。
核酸和多肽序列及变体
如本文所述,本发明提供编码例如O-tRNA和O-RS的多核苷酸序列, 多肽氨基酸序列,例如O-RS,以及例如包含所述多核苷酸或多肽序列的组 合物、系统和方法。本文披露了所述序列的例子,如O-tRNA和O-RS的氨 基酸和核苷酸序列(见图7,例如SEQ ID NO:1和4-11)。然而,本领域技 术人员应知道本发明并不限于本文,例如实施例和序列表中披露的那些序 列。本领域技术人员应知道本发明还提供具有本文所述功能的许多相关序 列,例如编码本文所披露O-RS的保守变体的多核苷酸和多肽。
实施例1描述了能用磺基酪氨酸氨酰化O-tRNA的正交合成酶种类 (O-RS)的构建和分析。该实施例描述能掺入非天然氨基酸磺基酪氨酸的 O-RS种类的构建和分析。
本发明提供多肽(O-RS)和多核苷酸,如O-tRNA、编码O-RS或其诸部 分的多核苷酸,用于分离氨酰基-tRNA合成酶克隆的寡核苷酸等。本发明 的多核苷酸包括编码本发明的感兴趣蛋白或多肽并含有一个或多个选择者 密码子的那些多核苷酸。另外,本发明多核苷酸包括,例如含有SEQ ID NO:5、7、9或11所示核苷酸序列的多核苷酸;与其多核苷酸序列互补或 编码其多核苷酸序列的多核苷酸。本发明的多核苷酸还包括编码含有SEQ ID NO:4、6、8或10的O-RS氨基酸序列的任何多核苷酸。类似地,在高 严谨条件下,可与上述多核苷酸在基本全长的核酸上杂交(并且不是天然多 核苷酸序列)的人工核酸也是本发明多核苷酸。在一个实施方式中,组合物 包含本发明的多肽和赋形剂(如缓冲液、水、药学上可接受的赋形剂等)。本 发明还提供可与本发明多肽发生特异性免疫反应的抗体或抗血清。人工多 核苷酸是人造而不是天然产生的多核苷酸。
本发明的多核苷酸还包括人工多核苷酸,即与天然tRNA具有如至少 75%、至少80%、至少90%、至少95%、至少98%或更高相同性(但不是天 然tRNA)。多核苷酸还包括与天然tRNA具有如至少75%、至少80%、至 少90%、至少95%、至少98%或更高相同性(但不是100%相同)的人工多核 苷酸。
在某些实施方式中,载体(如质粒、粘粒、噬菌体、病毒等)含有本发明 的多核苷酸。在一个实施方式中,所述载体是表达载体。在另一个实施方 式中,所述表达载体包含与本发明的一种或多种多核苷酸操作性相连的启 动子。在另一个实施方式中,细胞包含含有本发明多核苷酸的载体。
本领域技术人员还知道本发明包括所披露序列的多种变体。例如,产 生功能相同序列的所披露序列的保守变体也属于本发明。核酸多核苷酸序 列的变体也属于本发明,所述变体与至少一种所披露序列杂交。本文披露 序列的独特亚序列,例如可通过标准序列比较技术测定的独特亚序列也属 于本发明。
保守性变异
由于遗传密码的简并性,“沉默取代”(即,核酸序列中的取代不导致 所编码多肽改变)是编码氨基酸序列的每条核酸序列所隐含的特征。类似 地,也不难鉴定氨基酸序列中有一个或少数氨基酸被具有高度相似特性的 不同氨基酸取代的“保守性氨基酸取代”,因为它与披露的构建物高度相 似。披露的各序列的这种保守性变异是本发明的特征之一。
具体核酸序列的“保守性变异”指编码相同或基本相同的氨基酸序列 的那些核酸,或者,如果核酸不编码氨基酸序列,则指基本上相同的序列。 技术人员知道改变、加入或删除所编码序列中一个氨基酸或少部分氨基酸 (一般低于5%、更常见低于4%、2%或1%)的各种取代、缺失或插入是“保 守性修饰变异”,这些改变导致氨基酸的缺失、插入或被化学性质相似的 氨基酸所取代。因此,本发明所列举多肽序列的“保守性变异”包括用同 一保守性取代组的氨基酸取代该多肽序列的少部分(通常低于5%,更常见 是低于2%或1%)的氨基酸。最后,加入不改变某核酸分子所编码活性的序 列(例如加入无功能序列)是基础核酸的保守性变异。
本领域熟知提供功能类似的氨基酸的保守性取代表,其中一个氨基酸 残基被另一个具有相似化学特性(例如芳族侧链或带正电荷的侧链)的氨基 酸残基取代,因此基本上不改变该多肽分子的功能特性。以下例举多组化 学特性相似的天然氨基酸,其中,各组内的取代即“保守性取代”。
保守性氨基酸取代
  非极性和/或脂族   侧链   极性,不带电   荷的侧链   芳族侧链   带正电荷   的侧链   带负电荷的   侧链   甘氨酸   丙氨酸   缬氨酸   亮氨酸   异亮氨酸   脯氨酸   丝氨酸   苏氨酸   半胱氨酸   甲硫氨酸   精氨酸   谷氨酰胺   苯丙氨酸   酪氨酸   色氨酸   赖氨酸   精氨酸   组氨酸   天冬氨酸   谷氨酸
核酸杂交
可采用比较杂交来鉴定本发明的核酸,包括本发明核酸的保守性变体, 该比较杂交方法是区别本发明核酸的优选方法。此外,在高度、超高度和 超超高度严谨性条件下能与SEQ ID NO:5、7、9或11所示核酸杂交的靶核 酸是本发明的特征。这种核酸的例子包括与某给定的核酸序列相比,含有 一个或少许沉默或保守性核酸取代的核酸。
当测试核酸与探针的杂交程度是与完美匹配的互补靶标杂交程度的至 少50%,即信噪比至少是该探针与靶标在完美匹配的探针与完美匹配的互 补靶标结合的条件下杂交的信噪比的一半高时,可称该测试核酸与探针核 酸特异性杂交;此条件下,完美匹配的探针与完美匹配的互补靶核酸结合 的信噪比至少是与任何不匹配靶核酸杂交所观察到的信噪比的约5-10倍。
当核酸结合(一般在溶液中)时,称其“杂交”。核酸因各种已充分表征 的理化力,例如氢键、溶剂排斥、碱基堆积等而杂交。核酸杂交的广泛指 南见Tijssen,(1993),Laboratory Techniques in Biochemistry and Molecular Biology--Hybridization with Nucleic Acid Probes(生物化学与分子生物学的 实验室技术——核酸探针杂交),第一部分第二章,“Overview of principles of hybridization and the strategy of nucleic acid probe assays(杂交原理概述与 核酸探针试验方法)”,(尔赛弗公司(Elsevier),纽约);以及Current Protocols in Molecular Biology(最新分子生物学方法),Ausubel等编,“Current Protocols”(最新方法),格林出版合伙公司(Greene Publishing Associates,Inc.) 和约翰威立父子公司(John Wiley&Sons)的合资企业,(2006年增补);Hames 和Higgins,(1995),Gene Probes 1(基因探针1)和Gene Probes 2(基因探针 2),IRL出版社,牛津大学出版社,牛津,英格兰,它们提供了合成、标记、 检测和定量测定DNA及RNA,包括寡核苷酸的细节。
在Southern或northern印迹滤膜上具有100个以上互补残基的互补核 酸杂交的严谨性杂交条件的例子是:含1mg肝素的50%福尔马林,42℃杂 交过夜。严谨性洗涤条件的例子是65℃,用0.2×SSC洗涤15分钟(SSC 缓冲液的描述可参见Sambrook等;Molecular Cloning-A Laboratory Manual(分子克隆-实验室手册),(第三版),第1-3卷,冷泉港实验室,冷泉 港,纽约,2001)。通常先进行低严谨性洗涤除去背景探针信号,再进行高 严谨性洗涤。示例性低严谨性洗涤是40℃,用2×SSC洗涤15分钟。具体 杂交试验中信噪比是无关探针观察到的信噪比的5倍(或更高)通常表示检 测到特异性杂交。
核酸杂交实验(例如,Southern和northern杂交)的“严谨性杂交洗涤条 件”取决于序列,并随不同的环境参数而不同。核酸杂交的广泛指南见 Tijssen,(1993),生物化学与分子生物学的实验室技术——核酸探针杂交, 第一部分第二章,“杂交原理概述与核酸探针试验方法”,(艾尔赛弗公司, 纽约);Hames和Higgins,(1995),基因探针1,IRL出版社,牛津大学出 版社,牛津,英格兰,和Hames和Higgins,(1995),基因探针2,IRL出 版社,牛津大学出版社,牛津,英格兰。不难凭经验确定适合任何测试核 酸的严谨性杂交和洗涤条件。例如,在确定严谨性杂交和洗涤条件时,可 逐渐提升杂交和洗涤条件(例如,通过升高杂交或洗涤的温度、降低杂交或 洗涤中的盐浓度、增加杂交或洗涤中的洗涤剂浓度和/或增加杂交或洗涤中 的有机溶剂如福尔马林的浓度)直至符合选定的标准。例如,在高度严谨性 杂交和洗涤条件中,逐渐提升杂交和洗涤条件直至探针与完美匹配的互补 靶标结合的信噪比至少是该探针与不匹配靶标杂交所观察到的信噪比的5 倍。
选择的“非常严谨”的条件等于具体探针的热解链温度(Tm)。Tm是50% 的测试序列与完美匹配的探针杂交时的温度(在规定的离子强度和pH下)。 为本发明的目的,“高度严谨”的杂交和洗涤条件一般选择为在规定的离 子强度和pH下比具体序列的Tm约低5℃。
“超高严谨”的杂交和洗涤条件指,增加杂交和洗涤条件的严谨性直 至探针与完美匹配的互补靶核酸结合的信噪比至少是任何不匹配靶核酸杂 交时观察到的信噪比的10倍。靶核酸在这种条件下与探针杂交的信噪比至 少是完美匹配的互补靶核酸的1/2时,可称其在超高严谨性条件下与探针结 合。
类似地,可通过逐渐提升相关杂交试验的杂交和/或洗涤条件来确定甚 至更高的严谨性水平。例如,提升杂交和洗涤的条件的严谨性直至探针与 完美匹配的互补靶核酸结合的信噪比至少是任何不匹配靶核酸杂交信噪比 的10、20、50、100或500倍或更高。靶核酸在这种条件下与探针杂交的 信噪比至少是完美匹配的互补靶核酸的1/2时,可称其在超超高度严谨性条 件下与探针结合。
如果在严谨性条件下彼此不杂交的核酸所编码的多肽基本相同,则这 些核酸仍基本相同。例如,当利用遗传密码所允许的最大密码简并性产生 核酸的拷贝时会发生这种情况。
独特亚序列
在一些方面,本发明提供含有选自本文披露的O-tRNA和O-RS序列的 核酸中独特亚序列的核酸。与对应于任何已知O-tRNA或O-RS核酸序列的 核酸相比,所述独特亚序列是独特的。可采用,例如设置默认参数的BLAST 进行核酸比对。任何独特亚序列可用作,例如探针来鉴定本发明核酸或相 关核酸。
类似地,本发明包括含有选自本文披露的O-RS序列的多肽中独特亚 序列的多肽。与对应于任何已知多肽序列的多肽相比,本文的独特亚序列 是独特的。
本发明还提供能在严谨性条件下与独特的编码寡核苷酸杂交的靶核 酸,所述寡核苷酸编码选自O-RS序列的多肽中的独特亚序列,其中与对应 于任何对照多肽(例如,通过突变获得本发明合成酶的亲代序列)的多肽相 比,所述独特亚序列是独特的。可如上所述测定独特序列。
序列比较、相同性和同源性
对于两个或多个核酸或多肽序列,术语“相同的”或“相同性百分比” 指当用下文所述序列比较算法(或技术人员可用的其它算法)或通过目测观 察来比较和比对最大相应性时,这两个或多个序列或亚序列相同,或者有 特定百分比的氨基酸残基或核苷酸相同。
对于两个核酸或多肽(例如,编码O-tRNA或O-RS的DNA,或O-RS 的氨基酸序列),术语“基本相同”指当利用序列比较算法或通过目测观察 来比较和比对最大相应性时,两个或多个序列或亚序列至少有约60%、约 80%、约90-95%、约98%、约99%或更多的核苷酸或氨基酸残基相同。这 种“基本相同”的序列通常认为是“同源的”,而不论实际祖先。优选在 至少长约50个残基的序列区域,更优选在至少约100个残基的区域存在“基 本相同性”,待比较两条序列最好在至少约150个残基或者在全长上基本 相同。
当蛋白质和/或蛋白质序列(天然或人工地)衍生自同一祖先蛋白或蛋白 序列时,它们是“同源的”。类似地,当核酸和/或核酸序列(天然或人工地) 衍生自同一祖先核酸或核酸序列时,它们是“同源的”。例如,可通过任 何可用的诱变方法来修饰任何天然核酸使之含有一个或多个选择者密码 子。当该诱变的核酸表达时,它编码的多肽含有一个或多个非天然氨基酸。 当然,该突变方法还可改变一个或多个标准密码子,从而也改变了所得突 变型蛋白质中的一个或多个标准氨基酸。通常可从两种或多种核酸或蛋白 质(或其序列)间的序列相似性推断同源性。可用于确认同源性的序列间精确 的相似性百分比因所研究的核酸与蛋白质而有所不同,但常规利用低至 25%的序列相似性来确认同源性。还可用更高水平的序列相似性,例如30%、 40%、50%、60%、70%、80%、90%、95%或99%或更高来确认同源性。本 文描述了测定序列相似性百分比的方法(例如,采用参数默认的BLASTP和 BLASTN),这些方法众所周知。
对于序列比较和同源性测定,通常将一条序列用作参比序列与测试序 列相比较。当采用序列比较算法时,将测试序列与参比序列输入计算机, 如果需要可指定亚序列坐标,并指定序列算法程序参数。然后根据所指定 的程序参数,序列比较算法可计算测试序列相比于参比序列的序列相同性 百分比。
可用以下方法进行比较序列的最佳比对,例如Smith和Waterman的局 部同源性算法,Adv.Appl.Math.,2:482,(1981);Needleman和Wunsch的 同源性比对算法,J.,Mol.Biol.,48:443,(1970);Pearson和Lipman的相 似性检索方法,Proc.Nat’l.Acad.Sci.USA,85:2444,(1988);计算机执行 这些算法(威斯康星遗传软件包中的GAP,BESTFIT,FASTA和TFASTA, 遗传学计算机组(Genetics Computer Group),575 Science Dr.,麦迪逊,威斯 康星州);或者目测观察(一般可参见Current Protocols in Molecular Biology(最新分子生物学方法),Ausubel等编,“Current Protocols(最新方 法)”,格林出版合伙公司和约翰威立父子公司的合资企业,2006年增补)。
适用于测定序列相同性和序列相似性百分比的算法的一个例子是 Altschul等,J.Mol.Biol.,215:403-410,(1990)所述的BLAST算法。进行 BLAST分析的软件由国家生物技术信息中心对公众开放。该算法包括:首 先通过在查询序列中鉴定长为W的短字串来鉴定高评分序列配对(HSP), 这些字串与数据库序列中相同长度的字串比对时符合或满足某些正值阈值 评分T。T称为邻近字串评分阈值(Altschul等,J.Mol.Biol.,215: 403-410(1990))。这些原始邻近字串选中(hit)作为启动检索的种子来找寻含 有它们的较长HSP。然后使这些字串选中沿着各条序列双向延伸,以致累 积比对评分增加。对于核苷酸序列,用参数M(一对匹配残基的奖励评分; 恒大于0)和N(错配残基的罚分;恒小于0)计算累积评分。对于氨基酸序列, 则用评分矩阵来计算累积评分。当出现以下情况时终止各方向的字串选中 延伸:累积比对评分从其达到的最高值下降X;因一个或多个负评分残基 比对的累积导致累积评分降至0或0以下;或者到达各序列的末端。BLAST 算法参数W、T和X决定比对的灵敏度和速度。BLAST程序(用于核苷酸 序列)默认11为字长(W)、10为期望值(E)、100为截断值、M=5、N=-4,并 进行双链比较。对于氨基酸序列,BLAST程序默认3为字长(W)、10为期 望值(E)并采用BLOSUM62评分矩阵(参见Henikoff和Henikoff,(1989), Proc.Natl.Acad.Sci.USA,89:10915)。
除了计算序列相同性百分比外,BLAST算法也可对两条序列间的相似 性进行统计学分析(参见,例如Karlin和Altschul,Proc.Nat’l.Acad.Sci. USA,90:5873-5787,(1993))。BLAST算法提供的相似性量度之一是最小 总概率(P(N)),其指示两条核苷酸或氨基酸序列之间发生随机匹配的概率。 例如,如果在测试核酸与参比核酸的比较中最小总概率小于约0.1,更优选 小于约0.01,最优选小于约0.001,则可认为该核酸与参比核酸相似。
诱变与其它分子生物学技术
可采用分子生物学技术操作本发明的和用于本发明的多核苷酸和多 肽。描述分子生物学的通用教材包括Berger和Kimmel,Guide to Molecular Cloning Techniques(分子克隆技术指南),Methods in Enzymology(酶学方法), 第152卷,学术出版社公司(Academic Press,Inc.),圣迭戈,加利福尼亚州; Sambrook等,Molecular Cloning-A Laboratory Manual(分子克隆-实验室手 册),(第三版),第1-3卷,冷泉港实验室,冷泉港,纽约,2001和Current Protocols in Molecular Biology(最新分子生物学方法),Ausubel等编; “Current Protocols in Molecular Biology(分子生物学最新方法)”,格林出 版合伙公司和约翰威立父子公司的合资企业,(2006年增补)。这些教材描 述了诱变、载体的应用、启动子和涉及,例如产生含有选择者密码子的基 因从而产生含非天然氨基酸的蛋白质,正交tRNA、正交合成酶及其配对的 许多其它相关课题。
本发明可采用各种类型的诱变,例如以使tRNA分子突变、产生tRNA 文库、产生合成酶文库、插入编码感兴趣蛋白质或多肽中的非天然氨基酸 的选择者密码子。它们包括但不限于:定点诱变、随机点诱变、同源重组、 DNA改组或其它递归诱变方法、嵌合构建、利用含尿嘧啶的模板诱变、寡 核苷酸指导的诱变、硫代磷酸酯修饰的DNA诱变、利用缺口双螺旋DNA 的诱变等,或者是它们的任何组合。其它合适的方法包括点错配修复、利 用修复缺陷宿主株的诱变、限制性选择和限制性纯化、缺失诱变、总基因 合成诱变、双链断裂修复等。本发明也包括,例如涉及嵌合构建物的诱变。 在一个实施方式中,可用天然分子或经改变或突变的天然分子的已知信息, 例如序列,序列比较、物理特性、晶体结构等来指导诱变。
可利用本发明多核苷酸或含有本发明多核苷酸的构建物,例如本发明 的载体(例如可以是克隆载体或表达载体)来遗传改造(例如转化、转导或转 染)宿主细胞。例如,可将正交tRNA、正交tRNA合成酶和待衍生蛋白质 的编码区操作性连接于可在所需宿主细胞中起作用的基因表达控制元件。 典型的载体含有转录和翻译终止子、转录和翻译起始序列和用于调节具体 靶核酸表达的启动子。这些载体可任选地包含遗传表达盒,所述表达盒含 有至少一个独立的终止子序列,允许该表达盒在真核细胞或原核细胞或二 者中复制的序列(例如,穿梭载体),和适用于原核与真核系统的选择标记。 载体适用于在原核细胞、真核细胞或优选二者中复制和/或整合。参见 Giliman和Smith,Gene,8:81,(1979);Roberts等,Nature,328:731,(1987); Schneider等,Protein Expr.Purif.,6435:10,(1995);Berger和Kimmel, 分子克隆技术指南,酶学方法,第152卷,学术出版社公司,圣迭戈,加 利福尼亚州;Sambrook等,分子克隆-实验室手册,(第三版),第1-3卷, 冷泉港实验室,冷泉港,纽约,2001;和最新分子生物学方法,Ausubel 等编;最新方法,格林出版合伙公司和约翰威立父子公司的合资企业,(2006 年增补)。例如,载体可以是质粒、细菌、病毒、裸多核苷酸或缀合的多核 苷酸形式。可通过标准方法将载体导入细胞和/或微生物,所述方法包括电 穿孔(From等,Proc.Natl.Acad.Sci.USA,82,5824,(1985)),病毒载体感 染,利用在小珠或颗粒的基质内或其表面上含有核酸的小颗粒的高速弹丸 穿透(Klein等,Nature,327:70-73(1987))等。
开发了能在大肠杆菌中对琥珀终止密码子(UAG)起反应而将非天然氨 基酸位点特异性掺入蛋白质的高效且通用的单质粒系统。在该新系统中, 詹氏甲烷球菌抑制子tRNAtyr(CUA)和酪氨酰-tRNA合成酶配对由与大多数 大肠杆菌表达载体相容的单个质粒编码。构建在proK启动子和终止子控制 下的单顺反子tRNA操纵子,用于优化二级结构和tRNA加工。引入突变形 式的合成酶glnS启动子显著提高了抑制效率和保真度。利用多拷贝的tRNA 基因以及该合成酶上的特定突变(D286R)也可提高抑制效率(Kobayashi 等,“Structural basis for orthogonal tRNA specificities of tyrosyl-tRNA synthetases for genetic code expansion(用于遗传密码扩展的酪氨酰-tRNA合 成酶的正交tRNA特异性的结构基础)”,Nat.Struct.Biol.,10(6): 425-432(2003))。几种不同非天然氨基酸的掺入高效且精确也证明该优化系 统的通用性,所述非天然氨基酸在研究蛋白质功能和结构中的独特用途已 得到证实。
ATCC提供了可用于克隆的细菌和细菌噬菌体目录,例如ATCC出版 的The ATCC Catalogue of Bacteria and Bacteriophage(ATCC细菌和细菌噬 菌体目录),(1996),Gherna等编。测序、克隆的其它基本方法和分子生物 学的其它方面及基础理论思考也可参见Sambrook等,分子克隆-实验室手 册,(第三版),第1-3卷,冷泉港实验室,冷泉港,纽约,2001;最新分子 生物学方法,Ausubel等编;最新方法,格林出版合伙公司和约翰威立父子 公司的合资企业,(2006年增补);和Watson等,(1992),Recombinant DNA(重 组DNA),第二版,科学美国书籍公司(Scientific American Books),纽约。 此外,可以向各种商业来源定制或标准定购基本上任何核酸(和实际上任何 标记的核酸,无论标准或非标准的),例如米德兰检定试剂公司(Midland Certified Reagent Company)、加利福尼亚州雷蒙纳市的大美国基因公司(The Great American Gene Company,Ramona,CA)、伊利诺斯州芝加哥市的表 达基因公司(ExpressGen Inc.)、加利福尼亚州阿拉米达市的操纵子技术公司 (Operon Technologies Inc.)和许多其它公司。
可利用为例如筛选步骤、激活启动子或选择转化子的活性而作适当改 进的常规营养培养基培养工程改造的宿主细胞。这些细胞任选培养成转基 因生物。其它可用的参考文献,例如细胞分离和培养(例如,用于随后核酸 分离)的文献包括:Freshney,(1994),Culture of Animal Cells,a Manual of Basic Technique(动物细胞培养,基本技术手册),第三版,威立利斯公司 (Wiley-Liss),纽约及其所引用的参考文献;Payne等,(1992),Plant Cell and Tissue Culture in Liquid Systems(液体系统中的植物细胞与组织培养),约翰 威立父子公司,纽约,纽约州;Gamborg和Phillips编,(1995),Plant Cell, Tissue and Organ Culture(植物细胞、组织和器官培养);Fundamental Methods(基本方法),Springer Lab Manual(斯普林格实验室手册),S-V公司 (Springer-Verlag)(伯林海德尔堡纽约);Atlas和Parks编,The Handbook of Microbiological Media(微生物培养基手册),(1993),CRC出版社(CRC Press),伯克莱屯,佛罗里达州。
感兴趣的蛋白质与多肽
在细胞中产生在特定位置含非天然氨基酸的蛋白质的方法也是本发明 特征之一。例如,一种方法包括用适当的培养基培养细胞,其中所述细胞 包含含有至少一个选择者密码子并编码蛋白质的核酸;和提供非天然氨基 酸;其中所述细胞还包含:在细胞内具有功能并识别选择者密码子的正交 -tRNA(O-tRNA);和用非天然氨基酸优先氨酰化O-tRNA的正交氨酰基 -tRNA合成酶(O-RS)。该方法所产生的蛋白质也是本发明特征之一。
在某些实施方式中,与表达系统中任何内源性tRNA相比,O-RS偏向 于氨酰化关联的O-tRNA。当O-tRNA和O-RS以等摩尔浓度存在时,O-RS 所加载的O-tRNA与内源性tRNA的相对比例大于1∶1,优选至少约2∶1, 更优选5∶1,更优选10∶1,更优选20∶1,更优选50∶1,更优选75∶1,更 优选95∶1,98∶1,99∶1,100∶1,500∶1,1,000∶1,5,000∶1或更高。
本发明还提供包含蛋白质的组合物,所述蛋白质含有非天然氨基酸。在某 些实施方式中,所述蛋白质含有的氨基酸序列与治疗性蛋白、诊断性蛋白、 工业用酶或其部分的序列至少有75%相同。
本发明的组合物和本发明方法制备的组合物任选处于细胞中。然后可 将本发明的O-tRNA/O-RS配对或各组分用于宿主系统的翻译机制中,从而 将非天然氨基酸掺入蛋白质。2004年4月16日提交的,名为“EXPANDING THE EUKARYOTIC GENETIC CODE(扩展真核遗传密码)”的国际公布号 WO 2004/094593和名为“IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS(非天然氨基酸的体内掺入)”的国际公布号WO 2002/085923 描述了该方法,这两篇文献以引用的方式纳入本文。例如,当O-tRNA/O-RS 配对引入宿主,例如大肠杆菌细胞时,该配对对选择者密码子起反应而将 非天然氨基酸,例如磺基酪氨酸在体内掺入蛋白质。加入系统的非天然氨 基酸可以是合成氨基酸,例如可以外源性加入生长培养基的苯丙氨酸或酪 氨酸衍生物。本发明的组合物任选为体外翻译系统,或体内系统。
本发明的细胞能大量合成包含非天然氨基酸的蛋白质。在一些方面, 组合物任选包含,例如至少10微克、至少50微克、至少75微克、至少100 微克、至少200微克、至少250微克、至少500微克、至少1毫克、至少 10毫克或更多含非天然氨基酸的蛋白质,或者体内蛋白质产生方法所能达 到的含量(本文提供重组蛋白质制备和纯化的细节)。在另一方面,组合物中 包含在例如细胞裂解液、缓冲液、药学缓冲液或其它液体混悬液中(例如,体 积为约1nL-约100L)的蛋白质浓度任选是,例如每升至少10微克蛋白质、每 升至少50微克蛋白质、每升至少75微克蛋白质、每升至少100微克蛋白 质、每升至少200微克蛋白质、每升至少250微克蛋白质、每升至少500 微克蛋白质、每升至少1毫克蛋白质或每升至少10毫克蛋白质或更高。在 细胞中制备大量(例如,大于采用其它方法如体外翻译通常可能得到的量) 包含至少一个非天然氨基酸的蛋白质是本发明特征之一。
可掺入非天然氨基酸来,例如改变蛋白质结构和/或功能,如改变大小、 酸性、亲核性、氢键、疏水性、蛋白酶靶位的易接近性、对某部分的靶向(如 用于蛋白阵列)、掺入标记物或反应基团等。含有非天然氨基酸的蛋白质的 催化或物理特性可得到改善,甚至获得全新的催化或物理特性。例如,可 通过将非天然氨基酸掺入蛋白质来任选改进以下特性:毒性、生物分布、 结构特性、光谱特性、化学和/或光化学特性、催化能力、半衰期(例如血清 半衰期)、与其它分子的反应能力(如共价或非共价的)等。包含含有至少一 个非天然氨基酸的蛋白质的组合物可用作,例如新型治疗剂、诊断剂、催 化酶、工业用酶、结合蛋白(如抗体)以及用于例如研究蛋白质结构和功能。 参见例如Dougherty,(2000),“Unnatural Amino Acids as Probes of Protein Structure and Function(作为蛋白质结构和功能探针的非天然氨基酸”), Current Opinion in Chemical Biology,4:645-652。
在本发明的一些方面,组合物包含至少一种含有至少一个,例如至少两个、 至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个 或至少十个或更多非天然氨基酸的蛋白质。所述非天然氨基酸可以相同或不 同,例如蛋白质中可以在1、2、3、4、5、6、7、8、9或10个或更多不同的 位点上含有1、2、3、4、5、6、7、8、9或10个或更多不同的非天然氨基酸。 在另一方面,组合物包含蛋白质,该蛋白质中存在的至少一个(但不是全部) 具体氨基酸是非天然氨基酸。对于给定的含多个非天然氨基酸的蛋白质, 所述非天然氨基酸可以相同或不同(如蛋白质可包含两个或多个不同类型 的非天然氨基酸,或者可包含两个相同的非天然氨基酸)。对于含两个以上 非天然氨基酸的给定蛋白质,所述非天然氨基酸可以相同,不同,或是多 个同一类型的非天然氨基酸与至少一个不同的非天然氨基酸的组合。
利用本文组合物和方法可制备基本上任何含非天然氨基酸的蛋白质(或其 一部分)(与任何相应的编码核酸,例如含有一个或更多选择者密码子的核酸)。 未试图鉴定成百上千的已知蛋白质,可修饰它们中的任一种使之含有一个或多 个非天然氨基酸,例如通过改进任何可用的突变方法从而使相关翻译系统中包 含一个或多个合适的选择者密码子。已知蛋白质的共有序列库包括GenBank EMBL、DDBJ和NCBI。通过检索互联网不难鉴定其它库。
这些蛋白质通常与任何可用的蛋白质(例如,治疗性蛋白、诊断性蛋白、 工业用酶或其一部分等)有,例如至少60%、至少70%、至少75%、至少80%、 至少90%、至少95%或至少99%或更高的相同性,同时这些蛋白质含有一个 或多个非天然氨基酸。可经修饰包含一个或多个非天然氨基酸的治疗性、诊断 性和其它蛋白质的例子参见但不限于2004年4月16日提交的名为 “Expanding the Eukaryotic Genetic Code(扩展真核生物遗传密码)”的国际 公布号WO 2004/094593和名为“IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS.(非天然氨基酸的体内掺入”)的WO 2002/085923。可经修饰包含一个或多个非天然氨基酸的治疗性、诊断性和其 它蛋白质的例子包括但不限于:例如蛭素、α-1抗胰蛋白酶、血管生成抑制 素、抗溶血因子(Antihemolytic factor)、抗体(抗体的其它细节见下文)、载脂 蛋白、脱辅蛋白、心房利钠因子、心房利钠多肽、心房肽(Atrial peptides)、 C-X-C趋化因子(如T39765、NAP-2、ENA-78、Gro-a、Gro-b、Gro-c、IP-10、 GCP-2、NAP-4、SDF-1、PF4、MIG)、降素、CC趋化因子(如单核细胞 趋化蛋白-1、单核细胞趋化蛋白-2、单核细胞趋化蛋白-3、单核细胞炎性蛋 白-1α、单核细胞炎性蛋白-1β、RANTES、I309、R83915、R91733、HCC1、 T58847、D31065、T64262)、CD40配体、C-kit配体、胶原、集落刺激因子 (CSF)、补体因子5a、补体抑制剂、补体受体1、细胞因子(如,上皮嗜中性 活化肽-78(epithelial Neutrophil Activating Peptide-78)、GROα/MGSA、 GROβ、GROγ、MIP-1α、MIP-1δ、MCP-1)、表皮生长因子(EGF)、促红细 胞生成素(“EPO”)、剥落性毒素A和B、因子IX、因子VII、因子VIII、 因子X、纤维细胞生长因子(FGF)、血纤蛋白原、纤连蛋白、G-CSF、 GM-CSF、葡糖脑苷脂酶、促性腺激素、生长因子、Hedgehog蛋白(如Sonic, Indian,Desert)、血红蛋白、肝细胞生长因子(HGF)、水蛭素、人血清白蛋 白、胰岛素、胰岛素样生长因子(IGF)、干扰素(如,IFN-α、IFN-β、IFN-γ)、 白介素(如,IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、 IL-11、IL-12等)、质形成细胞生长因子(KGF)、乳蛋白、白血病抑制 因子、萤光素酶、神经营养因子(Neurturin)、嗜中性白细胞抑制因子(NIF)、 抑瘤蛋白M、成骨蛋白、甲状腺激素、PD-ECSF、PDGF、肽激素(如,人 生长激素)、多效营养因子、A蛋白、G蛋白、热源性外毒素A、B和C、 松弛素、肾素、SCF、可溶性补体受体I、可溶性I-CAM 1、可溶性白介素 受体(IL-1、2、3、4、5、6、7、9、10、11、12、13、14、15)、可溶性TNF 受体、生长调节素、促生长素抑制剂、促生长素、链激酶、超抗原,即葡 萄球菌肠毒素(SEA、SEB、SEC1、SEC2、SEC3、SED、SEE)、超氧化物 岐化酶(SOD)、中毒性休克综合征毒素(TSST-1)、胸腺素α1、组织纤溶酶原 激活物、肿瘤坏死因子β(TNF β)、肿瘤坏死因子受体(TNFR)、肿瘤坏死因 子-α(TNF α)、血管内皮生长因子(VEGEF)、尿激酶和许多其它蛋白。
可采用本文所述能在体内掺入非天然氨基酸的组合物和方法制备的一类 蛋白质包括转录调节剂或其一部分。示例性转录调节剂包括调节细胞生长、分 化、调控等的基因和转录调节蛋白。转录调节剂存在于原核生物、病毒和真核 生物(包括真菌、植物、酵母菌)、昆虫和动物(包括哺乳动物)中,从而提供了 广泛的治疗靶点。应该理解表达和转录激活物通过许多机理调控转录,例如通 过与受体结合、刺激信号转导级联反应、调控转录因子表达、与启动子和增强 子结合、与结合启动子和增强子的蛋白质结合、DNA解链、前-mRNA剪接、 RNA聚腺苷酸化和RNA降解。
本发明的一类蛋白质(例如,含有一个或多个非天然氨基酸的蛋白质)包括 生物学活性蛋白,例如蛭素、细胞因子、炎性分子、生长因子、它们的受体和 癌基因产物,如白介素(如IL-1、IL-2、IL-8等)、干扰素、FGF、IGF-I、IGF-II、 FGF、PDGF、TNF、TGF-α、TGF-β、EGF、KGF、SCF/c-Kit、CD40L/CD40、 VLA-4/VCAM-1、ICAM-1/LFA-1和透明素(hyalurin)/CD44;信号转导分 子和相应的癌基因产物,例如Mos、Ras、Raf和Met;转录激活物和阻遏 物,例如p53、Tat、Fos、Myc、Jun、Myb、Rel和类固醇激素受体,例如 雌激素、孕酮、睾酮、醛甾酮的那些受体,LDL受体配体和皮质酮。
本发明也提供含有至少一个非天然氨基酸的酶(例如工业用酶)或其一部 分。酶的例子包括但不限于:酰胺酶、氨基酸消旋酶、酰基转移酶、脱卤酶、 双加氧酶、二芳基丙烷过氧化物酶(diarylpropane peroxidases)、差向异构酶、 环氧化物水解酶、酯酶、异构酶、激酶、葡糖异构酶、糖苷酶、糖基转移 酶、卤素过氧化物酶(haloperoxidases)、单加氧酶(例如p450)、脂酶、木质 素过氧化物酶、腈水合酶、腈水解酶、蛋白酶、磷酸酶、枯草杆菌蛋白酶、 转氨酶和核酶。
许多这些蛋白质可商品化购得(参见,例如西格玛生物科学公司(Sigma BioSciences)),相应的蛋白质序列和基因及其许多变体通常是熟知的(参见, 例如Genbank)。可根据本发明通过插入一个或多个非天然氨基酸来修饰任 何这些蛋白,从而(例如)改变这些蛋白质一种或多种感兴趣的治疗、诊断或 酶活性。治疗相关特性包括血清半衰期、保存半衰期、稳定性、免疫原性、 治疗活性、可检测性(例如,通过在非天然氨基酸中加入报道基团(如标记物 或标记结合位点))、LD50或其他负效应的降低、通过胃肠道进入体内的能 力(如口服利用度)等。诊断特性的例子包括保存半衰期、稳定性、诊断活性、 可检测性等。相关的酶特性的例子包括保存半衰期、稳定性、酶活性、生 产能力等。
也可采用本发明方法和组合物修饰各种其它蛋白质使之包含一个或多个 非天然氨基酸。例如,本发明可包括用非天然氨基酸取代一种或多种疫苗蛋白 质中的一个或多个天然氨基酸,例如以下来源的蛋白质:感染性真菌,如曲霉 (Aspergillus)、假丝酵母(Candida)种;细菌,特别是用作病原性细菌模型的 大肠杆菌,以及医学上重要的细菌,如葡萄球菌属(Staphylococci)(如,金黄 色葡萄球菌)或链球菌属(Streptococci)(如,炎链球菌);原生动物,如孢子 纲(如,疟原虫(Plasmodia))、根足虫(rhizopods)(如,内变形虫(Entamoeba)) 和鞭毛虫类(锥虫(Trypanosoma)、利什曼原虫(Leishmania)、毛滴虫 (Trichomonas)、贾第虫(Giardia)等);病毒,如(+)RNA病毒(例子包括痘病 毒,如痘苗病毒(vaccinia);小RNA病毒,如脊髓灰质炎病毒(polio);披膜 病毒,如疹病毒(rubella);黄病毒(Flaviviruses),如HCV;和冠状病毒)、 (-)RNA病毒(如棒状病毒(Rhabdovirus),如VSV;副粘病毒,如RSV; 正粘病毒,如流感病毒;布尼亚病毒和嵌沙样病毒)、dsDNA病毒(如呼肠 孤病毒)、RNA到DNA的病毒,即逆转录病毒,如HIV和HTLV和某些 DNA到RNA的病毒,如乙肝病毒。
农业相关的蛋白也是非天然氨基酸修饰的合适靶位,例如抗虫蛋白(如Cry 蛋白)、淀粉和脂质产生酶、植物和昆虫毒素、毒素耐受性蛋白、真菌毒素 解毒蛋白、植物生长酶(如核酮糖1,5-二磷酸羧化酶/加氧酶,“RUBISCO”)、 脂氧合酶(LOX)和磷酸烯醇式丙酮酸(PEP)羧化酶。
在某些实施方式中,本发明方法和/或组合物中的感兴趣多肽或蛋白质(或 其一部分)由核酸编码。所述核酸通常含有至少一个、至少两个、至少三个、 至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、十个 或更多个选择者密码子。
可采用本领域技术人员熟知和本文在“诱变与其它分子生物学技术”中所 述的方法诱变编码感兴趣蛋白质或多肽的基因,从而使之含有(例如)一个或多 个选择者密码子来掺入非天然氨基酸。例如,可诱变感兴趣蛋白质的核酸,使 之含有一个或多个选择者密码子以插入一个或多个非天然氨基酸。本发明包括 任何蛋白质的这种变体(例如突变体)形式,例如含有至少一个非天然氨基酸。 类似地,本发明也包括相应的核酸,即具有编码一个或多个非天然氨基酸的一 个或多个选择者密码子的任何核酸。
为制备含有非天然氨基酸的蛋白质,可利用适合通过正交tRNA/RS配对 在体内掺入非天然氨基酸的宿主细胞和生物。可用表达正交tRNA、正交tRNA 合成酶的一个或多个载体和编码待衍生蛋白质的载体来遗传改造(例如转化、 转导或转染)宿主细胞。各组分可以位于同一载体或各自位于不同载体,或者 可以两个组分位于一个载体而第三组分位于第二载体。载体可以是例如质粒、 细菌、病毒、裸多核苷酸或偶联多核苷酸的形式。
通过免疫反应性测定多肽
因为本发明多肽提供了各种新的多肽序列(例如,以在本文翻译系统中合 成的蛋白质为例,多肽含有非天然氨基酸;或者,以新的合成酶为例,则是标 准氨基酸的新序列),这些多肽也提供了可在例如免疫测定中识别的新结构特 征。产生能与本发明多肽特异性结合的抗血清以及能与这种血清结合的多肽是 本发明的特征之一。本文所用的术语“抗体”包括但不限于:基本上由一个或 多个免疫球蛋白基因编码的多肽,或其能特异性结合并识别分析物(抗原)的片 段。例子包括多克隆、单克隆、嵌合型和单链抗体等。本文所用的术语“抗体” 也包括免疫球蛋白片段,包括Fab片段和由表达文库(包括噬菌体展示文库)产 生的片段。抗体的结构与术语可参见,例如Paul,Fundamental Immunology(基 础免疫学),第四版,1999,雷文出版社(Raven Press),纽约。
为产生用于免疫测定的抗血清,可如本文所述产生并纯化一种或多种免疫 原性多肽。例如,可在重组细胞中产生重组蛋白。采用标准小鼠免疫方案(关 于用于测定特异性免疫反应性的抗体产生、免疫测定形式和条件的标准说 明可参见,例如Harlow和Lane,(1988),Antibodies,A Laboratory Manual(抗 体,实验室手册),冷泉港出版社,纽约),用免疫原性蛋白和标准佐剂(如弗 氏佐剂)免疫小鼠的近交品系(此类小鼠因其实际遗传相同性使得实验结果重现 性较高而用于测定)。蛋白质、抗体、抗血清等的其它细节可见名为 “EXPANDING THE EUKARYOTIC GENETIC CODE(扩展真核生物遗传 密码)”的国际公布号WO 2004/094593;名为“IN VIVO INCORPORATION OF UNNATURAL AMINO ACIDS(非天然氨基酸的体内掺入)”的WO 2002/085923;名为“GLYCOPROTEIN SYNTHESIS(糖蛋白合成)”的WO 2004/035605和名为“PROTEIN ARRAYS(蛋白质阵列)”的WO 2004/058946。
O-tRNA和O-RS以及O-tRNA/O-RS配对的应用
本发明的组合物和用本发明方法制备的组合物任选存在于细胞内。然 后可将本发明的O-tRNA/O-RS配对或各组分用于宿主系统的翻译机制中, 从而将非天然氨基酸掺入蛋白质。Schultz等人的名为“非天然氨基酸的体 内掺入”的国际公布号WO 2002/085923描述了该方法,该篇文献以引用的 方式纳入本文。例如,当O-tRNA/O-RS配对引入宿主,例如大肠杆菌细胞 或酵母时,该配对对选择者密码子,例如琥珀无义密码子起反应而将可外 源性加入生长培养基的非天然氨基酸在体内掺入蛋白质,例如肌红蛋白测 试蛋白或治疗蛋白中。本发明的组合物可以任选处于体外翻译系统,或细 胞体内系统中。含非天然氨基酸的蛋白质的应用范围广泛。例如掺入蛋白 质的非天然部分可作为广泛修饰的靶标,如与其它蛋白质、与小分子如标 记物或染料和/或生物分子交联。通过这些修饰,掺入非天然氨基酸可产生 改进的治疗蛋白,可用于改变或提高酶的催化功能。在一些方面,蛋白质 中掺入非天然氨基酸和随后进行修饰有助于研究蛋白质的结构、与其它蛋 白质的相互作用,等等。
试剂盒
试剂盒也是本发明特征之一。例如,提供用于在细胞中产生含至少一 个非天然氨基酸的蛋白质的试剂盒,所述试剂盒中装有至少一个容器,而 该容器含有编码O-tRNA的多核苷酸序列、和/或O-tRNA、和/或编码O-RS 的多核苷酸序列、和/或O-RS。在一个实施方式中,所述试剂盒还包含非天 然氨基酸磺基酪氨酸。在另一实施方式中,所述试剂盒还包含制备蛋白质 和/或宿主细胞的使用说明材料。
实施例
提供以下实施例只是为了说明,并非要限制本发明。技术人员应该知 道可以改变各种非关键性参数而不会脱离本发明的范围。应该知道,本文 所述的实施例和实施方式只是为说明目的,本领域技术人员借鉴这些实施 例和实施方式可以作出各种改进或改变而仍属于本申请的构思和权限以及 随附权利要求书的范围内。
实施例1
磺基酪氨酸特异性突变合成酶的遗传选择
此前已报道将非天然氨基酸系统地加入大肠杆菌(Wang等,“扩展大肠杆 菌的遗传编码”(Expanding the genetic code of Escherichia coli)Science 292:498-500(2001))、酵母(Chin等,“扩展的真核遗传编码”(An expanded eukaryotic genetic code)Science 301:964-967(2003))和哺乳动物细胞(Zhang等, “将5-羟基色氨酸选择性掺入哺乳动物细胞蛋白”(Selective incorporation of 5-hydroxytryptophan into proteins in mammalian cells)Proc Natl Acad Sci USA 101:8882-8887(2004))遗传密码的方法。此类方法基于具有正交特性的无义抑 制子tRNA/aaRS对的进化,正交性定义为响应独特密码子掺入给定氨基酸而不 与内源性宿主tRNA、氨酰基-tRNA合成酶或氨基酸交叉反应的能力。
为了产生独特插入磺基酪氨酸(图1)的正交tRNA/aaRS对,使用詹氏甲烷 球菌(Methanococcus jannaschii)酪氨酰-tRNA合成酶(MjTyrRS)活性位点突变体 的文库,该文库带有一个不被大肠杆菌合成酶识别的工程改造的詹氏甲烷球菌 无义抑制子(MjtRNATyrCUA)(Wang等,“扩展大肠杆菌的遗传编码”(Expanding the genetic code of Escherichia coli,”Science 292:498-500(2001))。对这个设计 和产生另有描述(Bose等,“将光异构化氨基酸掺入大肠杆菌蛋白”(The incorporation of a photoisomerizable amino acid into proteins in E.coli)J Am Chem Soc 128:388-389(2006))的文库进行一系列的正向和负向选择(3个正向和 2个负向)。正向选择的存活率取决于2mM磺基酪氨酸存在下氯霉素乙酰基转 移酶(CAT)基因中琥珀突变的抑制作用;负向选择的存活率取决于不存在磺基 酪氨酸时毒性baRNA酶蛋白编码基因中三个琥珀突变的不充分抑制(Wang等 ,“扩展大肠杆菌的遗传编码”(Expanding the genetic code of Escherichia coli,” Science 292:498-500(2001))。仅当克隆响应琥珀密码子独特地掺入磺基酪氨酸 时,才能在正向和负向选择轮次中均存活。
在这些选择之后,鉴定出数个克隆,携带允许位点112处具有琥珀突变的 CAT基因的细胞能在2mM磺基酪氨酸存在下130μg/mL氯霉素中存活。不存 在磺基酪氨酸时,同样的细胞不能在20μg/mL氯霉素中生长,这与有效掺入 磺基酪氨酸而极少或不掺入内源性氨基酸的背景相一致。候选突变合成酶克隆 (名为STyrRS)测序揭示了四个合成酶克隆,每个均符合正交翻译系统的标准。 主要是克隆1(Tyr32Leu、Leu65Pro、Asp158Gly、Ile159Cys、Leu162Lys)。图 7提供了这些克隆和野生型种类各自的核苷酸和氨基酸序列。

可能为这些突变指定可能的功能,尤其是Lys162,它可能与磺基酪氨酸 SO3-形成盐桥相互作用。Leu32和Gly158可容纳较大的SO3-基团并移除内源性 酪氨酸的亲和性(Tyr32和Asp158参与和野生型酶的酪氨酸酚基形成氢键)。用 Gly替换阴离子性质的Asp158可能消除与磺基酪氨酸的不利静电作用。然而, 制造或使用本发明无需了解不同取代位置的机制或功能。
选择磺基酪氨酸氨酰基tRNA合成酶的详细方法
为了选择STyrRS,使用构建于pBK载体的MjTyrRS活性位点文库 (pBK-lib)(Bose等,“将光异构化氨基酸掺入大肠杆菌蛋白”(The incorporation of a photoisomerizable amino acid into proteins in E.coli)J Am Chem Soc 128:388-389(2006))。用pBK-lib转化含有pRep(一种含有工程改造的 MjtRNATyrCUA、112位(允许位点)引入琥珀密码子的氯霉素乙酰基转移酶基因和 四环素抗性标记的正向选择质粒)的DH10B细胞,并铺于含2mM磺基酪氨酸 (思恩化学公司(Senn Chemicals))和68μg/mL氯霉素的GMML琼脂平板上。 37℃培养72小时后,从平板上刮下并抽提pBK-lib载体。
然后,用该文库质粒集合转化含pNeg(一种含有工程改造的 MjtRNATyrCUA、引入三个琥珀密码子的毒性baRNA酶基因和氯霉素抗性标记 的负向选择质粒)的DH10B细胞。将细胞铺于不含磺基酪氨酸的LB琼脂平板 上,并在37℃培养12小时后从存活细胞中抽提pBK-lib载体。再重复一次本 轮正向和负向选择,接着用选出的pBK-lib载体转化含pRep的DH10B细胞, 铺于含和不含磺基酪氨酸的GMML琼脂平板上。那些在含有磺基酪氨酸和130 μg/mL氯霉素的平板上生长而在不存在磺基酪氨酸的含20μg/mL氯霉素的平 板上不生长的细胞被认为是强命中(strong hit)。
挑选这些命中,通过在存在或不存在磺基酪氨酸的条件下表达在7位含有 琥珀密码子的Z-结构域蛋白来确认对应合成酶的正交性。正交合成酶是那些仅 在磺基酪氨酸存在的条件下表达全长Z-结构域的那些合成酶。使用 MALDI-TOF确认磺基酪氨酸确实被掺入全长Z-结构域中。
实施例2
表达并鉴定含有磺基酪氨酸的突变模式蛋白
为了检验所选合成酶STyrRS独特掺入磺基酪氨酸,在含有琥珀突变Z- 结构域、MjtRNATyrCUA和STyrRS的质粒的大肠杆菌(克隆1)中表达C-末端His6 标签Z-结构域蛋白的琥珀突变体(残基7)。Ni-NTA纯化后聚丙烯酰胺凝胶电泳 (PAGE)分析显示仅当蛋白表达于含2mM磺基酪氨酸的培养基中时,出现Z- 结构域的强条带,无磺基酪氨酸时未观察到条带,确认了琥珀抑制对磺基酪氨 酸的依赖(图4A)。
为了进一步鉴定,对纯化突变Z-结构域进行MALDI-TOF分析。值得注 意的是酪氨酸-硫酸化蛋白的MALDI-TOF和ESI分析导致硫酸基团的部分丢 失,其程度取决于条件的严格性(22,23)。因此,使用温和的正离子模式条件 及中性pH基质(2,4,6-三羟基-苯乙酮),在这个条件下,出现对应含单个磺基酪 氨酸并缺少甲硫氨酸的Z结构域的7876Da主峰[M+H](M理论值=7877.5Da)。我 们也观察到7798Da(M理论值=7797.5Da)的小峰[M+H](<10%),这是在 MALDI-TOF中丢失硫酸基团留下酪氨酸的结果(图4B)。尽管单靠这些质谱数 据无法排除STyrRS背景酪氨酸掺入,但我们可以在PAGE凝胶分析的基础上 进行排除。因此STyrRS独特地掺入磺基酪氨酸,允许在细菌中重组表达硫酸 化蛋白。
实施例3
表达来自高等有机体的硫酸模式蛋白(蛭素)
检验该用于产生硫酸化蛋白的正交系统是否可用于产生通常仅在高等有 机体中生物合成的选择性硫酸化的天然蛋白。出于此目的,我们选择了在63 位酪氨酸硫酸化的蛋白蛭素。医用水蛭-欧洲医蛭(Hirudo medicinalis)分泌的 蛭素是最有效的天然凝血酶抑制剂,临床上使用由其重组形式作为抗凝剂。然 而,重组表达药用蛭素的大肠杆菌和酵母因为缺少必要的磺基转移酶产生的是 非硫酸化的形式(脱磺基蛭素)(Markwardt,“蛭素作为候选抗凝剂-历史综述” (Hirudin as alternative anticoagulant--a historical review)Semin Thromb Hemost 28,405-414(2002))。尽管脱磺基蛭素仍然是有效的凝血酶抑制剂,但其与人 凝血酶的亲和力比磺基蛭素低至少一个数量级,其Ki约为20fM(Braun等,“使 用定位诱变研究蛭素特异性的基础”(Use of site-directed mutagenesis to investigate the basis for the specificity of hirudin)Biochemistry 27,6517-6522 (1988))。
为表达磺基蛭素,将STyrRS(克隆1)基因克隆入pSup载体主链,该载体 主链含有6个MjRNATyrCUA拷贝及优化的启动子(Ryu和Schultz,“将非天然 氨基酸有效掺入大肠杆菌的蛋白中”(Efficient incorporation of unnatural amino acids into proteins in Escherichia coli)Nat Methods 3:263-265(2006))。合成在63 位具有琥珀密码子并具有gIII周质信号序列的蛭素基因,并将其插入pBAD载 体。用两个质粒共转化DH10B大肠杆菌细胞后,在含有10mM磺基酪氨酸的 液体甘油基本培养基(GMML)中震荡摇瓶培养。因为蛭素很小,导入周质有效 引起分泌;因此,用Q琼脂糖阴离子交换柱后随大小排阻色谱通过FPLC直接 从浓缩培养基中直接纯化磺基蛭素,产率5mg/L。为了进行比较,用类似方法 表达63位酪氨酸编码的脱磺基蛭素,纯化产率为12mg/L。
克隆、表达和纯化磺基蛭素和脱磺基蛭素的详细方法
用和表达优化(Expression Optimization)合成与[Leu1, Thr2]-63-脱磺基-蛭素(商品名:来匹卢定(Lepirudin)())对应并与用于 分泌的gIII周质信号序列融合的基因。将该基因插入pBAD载体(英杰公 司)(Invitrogen)产生araBAD启动子控制下的pBAD-蛭素。利用快变 (Quickchange)(斯彻塔基因公司(Stratagene))定位诱变在来匹卢定基因的63位引 入TAG,产生用于表达磺基-蛭素的pBAD-蛭素TAG。
将所选STyrRS(克隆1)对应的基因插入pSup载体的PstI和NdeI位点之 间,在glnS启动子的控制下,产生pSup-STyrRS。pSup-STyrRS也包含proK 启动子的控制下的6个拷贝的工程改造MjRNATyrCUA。
用pSup-STyrRS和pBAD-蛭素TAG共同转化电感受态DH10B细胞,在 含50μg/ml氨苄青霉素、20μg/ml氯霉素和10mM磺基酪氨酸的GMML培养 基中37℃培养该细胞。当细胞达到OD6000.6时,加入L-阿拉伯糖至终浓度为 0.2%以诱导蛋白质表达。细胞在37℃继续生长24小时。利用搅拌细胞设备收 集细胞团并浓缩培养基。
将浓缩培养基对水进行透析并施加于50mM Tris-HCl、1mM EDTA和10 mM β-巯基乙醇,pH 7.4事先平衡的阴离子交换柱(HiLoad 26/10Q琼脂柱,GE 保健公司(GE Healthcare))。用线性梯度0.025-1M NaCl洗脱蛋白。用PAGE分 析峰组分。将来自0.3M NaCl洗脱的主峰组分汇集、浓缩、对水透析并进行凝 胶过滤(Superdex 200 10/300GL,GE保健公司)。用Tris-缓冲的盐水(25mM Tris-HCl,125mM NaCl和2mM KCI,pH 7.6)洗脱蛋白质。使用50μM凝血 酶Boc-Asp(OBzl)-Pro-Arg-MCA的荧光底物(肽国际公司)(Peptides International,Inc.)测定凝血酶活性,用1nM人α-凝血酶(代尔法玛公 司)(Diapharma)滴定磺基蛭素的最终浓度。这种测定的前提是假定从化学计量 上看蛭素1∶1抑制凝血酶,当使用紧密结合动力学(Szedlacsek和Duggleby,“缓 慢和紧密结合抑制剂的动力学”(Kinetics of slow and tight-binding inhibitor) Methods Enzymol 249:144-180(1995))所限定的浓度时此假定有效。使用相似方 法表达、纯化并定量测定[Leu1,Thr2]-63-脱磺基-蛭素。
实施例4
鉴定遗传编码的硫酸化蛭素
通过PAGE分析鉴定上述实施例所得蛭素,每种均表现为单一条带。磺基 蛭素区别于脱磺基蛭素,前者比后者迁移得更远产生凝胶位移(图2)。 MALDI-TOF分析表明磺基蛭素的正确[M+H]质量(7059Da;M理论值=7059.5Da) 和脱磺基蛭素的正确[M+H]质量(6979Da;M理论值=6979.5Da),在磺基蛭素例子 中出现两个峰是因为硫酸基团丢失产生小[M+H-80]信号(参见图5)。
为了进一步验证仅由质谱分析所得的第二个峰,进行两个实验。第一,从 阴离子交换柱洗脱磺基蛭素发生时的离子强度比相同梯度条件下洗脱磺基蛭 素发生时的离子强度高10%,因此可完全分离同时出现的两种蛭素(通过区分 磺基-蛭素与脱磺基-蛭素的峰得到证实)。在相应洗脱组分的质谱中缺少脱磺基 蛭素峰,由此确定磺基蛭素阴离子交换纯化中未观察到脱磺基蛭素峰,因此我 们得出结论:当表达磺基蛭素时不产生脱磺基蛭素。
第二,进行不加入磺基酪氨酸的对照表达。接着对含有所有分泌蛋白混合 物的粗浓缩培养基进行的MALDI-TOF分析表明仅有6578Da[M+H]峰,对应 来自TAG另一作为终止密码子的行为造成的截短蛋白(M理论值=6575Da);未观 察到对应全长蛋白的峰(参见图6A)。与之形成对比的是磺基酪氨酸存在时的表 达,在质谱中可找到强度大约相同的截短和全长蛋白的峰(参见图6B),表明琥 珀抑制对磺基酪氨酸存在的严格依赖。通过这两个实验可得出结论:磺基蛭素 MALDI-TOF中的[M+H-80]信号仅归因于质谱过程中的SO3-切割,确认了 STyrRS仅使其关联tRNA带上磺基酪氨酸而未观察到酪氨酸的氨酰化。
应当注意的是,在磺基蛭素表达培养基粗提物质谱中截短和全长峰的相似 强度,以及脱磺基蛭素表达产率约为同样条件下磺基蛭素表达的两倍的事实表 明在磺基蛭素表达中大约一半翻译事件被抑制。因此可推测在我们系统中的双 重抑制将产生约75%截短蛋白质和25%全长蛋白质,假定没有琥珀抑制。考虑 到截短蛋白的存在是因为大肠杆菌对阴离子磺基酪氨酸的低渗透性,导致携带 氨基酸的MjtRNATyrCUA群体减少。事实上,使用同样的系统,但使用高渗的对 乙酰基苯丙氨酸及其相应突变合成酶表达蛭素时,得到对乙酰苯丙氨酸的掺入 而未测得截短蛋白(数据未显示)。因此,递送磺基酪氨酸的前药策略也许能消 除截短蛋白的出现并提高产率。
实施例5
遗传编码的磺基蛭素的生物学活性的鉴定
为了检测表达磺基蛭素作为抗凝剂的功效,使用文献(Cha,“紧密结合抑 制剂-III.测定紧密结合抑制剂和考福霉素腺苷脱氨酶底物抑制间竞争的新方 法”(Tight-binding inhibitors--III.A new approach for the determination of competition between tight-binding inhibitors and substrates--inhibition of adenosine deaminase by coformycin)Biochem Pharmacol 25:2695-2702(1976);Komatsu等, “CX-937,具有蛭素变体-1和-3杂交序列的新重组蛭素同系物”(CX-397,a novel recombinant hirudin analog having a hybrid sequence of hirudin variants-1 and-3,”Biochem Biophys Res Commun 196:773-779(1993))报道的基于单一过 程曲线方法的荧光酶实验测定凝血酶抑制动力学。在这个实验中,100pM磺 基蛭素或脱磺基蛭素与50μM荧光底物混合,并加入人α-凝血酶启动该反应。 活性被磺基蛭素和脱磺基蛭素不同程度抑制的凝血酶对荧光底物的切割产生 荧光强度随时间变化的图(图3)。
假定1∶1结合的情况下,用一定浓度范围的凝血酶滴定蛭素和磺基蛭素的 准确浓度。按照适合蛭素的紧密结合动力学(Stone和Hofsteenge,“蛭素抑制 凝血酶的动力学”(Kinetics of the inhibition of thrombin by hirudin,”Biochemistry 25:4622-4628(1986)),将这些实验数据拟合成等式1,处理提取常数后得到Ki、 k结合和k解离。该分析说明,磺基-蛭素和脱磺基-蛭素的Ki分别为26fM和307fM, 与文献报道(17)相符。不出所料,磺基-蛭素的k结合(0.95×108M-1s-1)大于脱磺 基-蛭素(0.38×108M-1s-1),而磺基-蛭素的k解离(0.22×10-5s-1)小于脱磺基-蛭素 (1.18×10-5s-1)。下表显示至少3次读数的平均值和标准差产生的进程曲线的非 线性拟合产生的凝血酶抑制动力学常数。
  Ki  k结合×10-8(M-1s-1)   k解离×105(s-1)   磺基蛭素   26±9.8  0.95±0.56   0.22±0.06   脱磺基蛭素   307±72  0.38±0.07   1.18±0.45
亲和力较高的磺基蛭素与脱磺基蛭素相比的优势在凝血酶浓度范围被各 自Ki松散结合时尤其显著(Szedlacsek和Duggleby,“缓慢和紧密结合抑制剂 的动力学”(Kinetics of slow and tight-binding inhibitor)Methods Enzymol 249:144-180(1995))。因此有趣的是,活性人凝血酶的基线生理稳态浓度落入 此范围(Velan和Chandler,“手术外伤和心肺旁路对体内活性凝血酶浓度和凝 血酶抑制率的影响”(Effects of surgical trauma and cardiopulmonary bypass on active thrombin concentrations and the rate of thrombin inhibition in vivo,” Pathophysiol Haemost Thromb 33:144-156(2003)),表明硫酸化在天然水蛭蛭素 中可能的进化推动力。这些评论应该作为优于普遍非硫酸化重组形式的遗传 编码磺基蛭素(本文所述)治疗应用的指南。
在翻译的同时将磺基酪氨酸掺入蛋白质使得可能在大肠杆菌中有效表达 更多选择性硫酸化的蛋白质,包括抗体、趋化因子受体基序和凝集因子,因而 利于硫酸化蛋白的结构功能研究以及实践治疗应用。而且,该体内策略可应用 于构建硫酸化抗体文库和噬菌体展示硫酸化蛋白,使目前可用的肽合成、天然 化学连接和表达蛋白连接方法无法达到的途径变得更有希望。或者,可将此策 略扩展至直接在真核生物中表达酪氨酸硫酸化蛋白。
表达蛭素物质的动力学鉴定的详细方法
利用荧光酶标仪(分子仪器公司(Molecular Devices),SpectraMax Gemini) 测量荧光强度(激发波长=365nm;发射波长=450nm),以监测由凝血酶活性引 起的从50μM Boc-Asp(OBzl)-Pro-Arg-MCA释放的7-氨基-4-甲基香豆素。酶 反应一式三份进行,并重复三次,37℃于96孔板中在含0.1%聚乙二醇6000( 福卢卡公司)(Fluka)、100mM NaCl和250μg/mL HSA(凯尔生化公 司)(Calbiochem)的50mM Tris-HCl缓冲液,pH 7.8中进行反应。在这些条件下 的底物的米氏常数为11.6μM(Komatsu等,“CX-937,具有蛭素变体-1和-3 杂交序列的新重组蛭素同系物”(CX-397,a novel recombinant hirudin analog having a hybrid sequence of hirudin variants-1 and-3,”Biochem Biophys Res Commun 196:773-779(1993))。
表达的磺基-蛭素和脱磺基-蛭素的凝血酶抑制动力学参数来自自用单一 过程曲线方法(Komatsu等,“CX-937,具有蛭素变体-1和-3杂交序列的新重 组蛭素同系物”(CX-397,a novel recombinant hirudin analog having a hybrid sequence of hirudin variants-1 and-3,”Biochem Biophys Res Commun 196:773-779(1993))对40pM α-凝血酶和100pM磺基蛭素或脱磺基蛭素下获得 的过程曲线的非线性拟合。根据蛭素的缓慢紧密结合竞争抑制机制,产物的形 成可由等式1描述(Stone和Hofsteenge,“蛭素对凝血酶抑制的动力学” (Kinetics of the inhibition of thrombin by hirudin)Biochemistry 25:4622-4628 (1986);Cha,“紧密结合抑制剂-III。测定紧密结合抑制剂和考福霉素腺苷脱 氨酶底物抑制间竞争的新方法”(Tight-binding inhibitors--III.A new approach for the determination of competition between tight-binding inhibitors and substrates--inhibition of adenosine deaminase by coformycin)Biochem Pharmacol 25:2695-2702(1976)):
P = v s t + ( 1 - γ ) ( v 0 - v s ) λγ ln ( 1 - γe - λt 1 - γ )
其中P是时间t时形成的产物量,vo和vs是反应的起始和稳态的反应速 率。可用下列式子描述等式1中的vs、γ和λ:
v s = v 0 ( E t - I t - K i + Q 2 E t )
γ = K i + E t + I t - Q K i + E t + I t + Q
λ=k结合Q,
其中
K i = K i ( 1 + S K m )

Q = ( K i + E t + I t ) 2 - 4 E t I t
使用这些等式测定Ki和k结合。k解离的值是k结合和Ki的积。用GraphPad Prism 程序进行非线性回归拟合计算。
***
虽然出于清晰和理解的目的描述了上述发明的一些细节,但应该知道 本领域技术人员通过阅读本文内容可对形式和细节作出各种改变而不脱离 本发明的范围。如同每一份出版物、专利、专利申请和/或其它文件单独表 明出于所有目的以引用的方式纳入本文一样,本申请引用的所有出版物、 专利、专利申请和/或其它文件出于所有目的以引用的方式全文纳入本文。
相关申请的交叉引用
本申请要求以下申请的优先权:2006年9月21日提交的美国临时申请序 列号60/846,519;和2006年10月28日提交的美国临时申请序列号60/855,210; 两篇申请的内容通过引用全文纳入本文。
对联邦资助研发下所作发明的权利的声明
本发明在国立卫生研究院资助号GM62159的政府支持下做出。政府对本 发明享有一定权利。
相关专利内容
标题 发布/更新时间 阅读量
三分正交分频器 2020-05-12 116
采样正交解调器 2020-05-12 21
正交连接器系统 2020-05-12 720
正交底板连接器 2020-05-13 512
正交时钟除法器 2020-05-13 113
正交检测器、正交解调器及采样正交解调器 2020-05-11 10
正交望远镜 2020-05-11 174
正交导流整流器 2020-05-12 850
正交调制系统 2020-05-12 384
正交调制系统 2020-05-13 207
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈