多肽和方法

申请号 CN201380015571.6 申请日 2013-01-21 公开(公告)号 CN104203971B 公开(公告)日 2019-08-09
申请人 医药研究委员会; 北卡罗来纳州大学; 发明人 贾森·钦; 亚历山大·戴特斯; 凯瑟琳·郎;
摘要 本 发明 涉及包含具有降 冰 片烯基团的 氨 基酸的多肽。合适的,所述降冰片烯基团作为氨基酸残基降冰片烯赖氨酸而存在。本发明还涉及产生包含降冰片烯基团的多肽的方法,所述方法包括以遗传方式将包含降冰片烯基团的氨基酸掺入多肽中。
权利要求

1.包含具有降片烯基团的单个基酸的多肽,其中所述降冰片烯基团作为氨基酸残基降冰片烯赖氨酸而存在,其中所述氨基酸是Nε-5-降冰片烯-2-基羰基-L-赖氨酸,如下式:
2.根据权利要求1所述的多肽,其中所述单个氨基酸不是N-末端氨基酸。
3.根据权利要求1或2所述的多肽,其中在与野生型多肽中赖氨酸残基相对应的位置掺入所述具有降冰片烯基团的氨基酸。
4.产生包含降冰片烯基团的多肽的方法,所述方法包括以遗传方式将包含降冰片烯基团的氨基酸掺入多肽中,所述氨基酸是Nε-5-降冰片烯-2-基氧羰基-L-赖氨酸,如下式:
5.根据权利要求4所述的方法,其中产生所述多肽包括
(i)提供编码所述多肽的核酸,其中所述核酸包含编码具有降冰片烯基团的氨基酸的正交密码子;
(ii)在能够识别所述正交密码子并将所述具有降冰片烯基团的氨基酸掺入多肽链的正交性tRNA合成酶/tRNA对存在下,翻译所述核酸。
6.根据权利要求5所述的方法,其中所述正交密码子包括琥珀密码子TAG,所述tRNA包括MbtRNACUA并且所述tRNA合成酶包括MbPyIRS。
7.根据权利要求4至6任一项所述的方法,其中在与野生型多肽中赖氨酸残基相对应的位置掺入所述具有降冰片烯基团的氨基酸。
8.根据权利要求1所述的多肽,其包含单个降冰片烯基团。
9.根据权利要求2所述的多肽,其包含单个降冰片烯基团。
10.根据权利要求1、2、8或9中任一项所述的多肽,其中所述降冰片烯基团与四嗪基团连接。
11.根据权利要求10所述的多肽,其中所述四嗪基团还与荧光团或与PEG基团连接。
12.根据权利要求11所述的多肽,其中所述荧光团包括荧光素。
13.根据权利要求11所述的多肽,其中所述荧光团包括四甲基罗丹明(TAMRA)。
14.根据权利要求11所述的多肽,其中所述荧光团包括-二吡咯亚甲基(BODIPY)。
15.Nε-5-降冰片烯-2-基氧羰基-L-赖氨酸,如下式

说明书全文

多肽和方法

发明领域

[0001] 本发明涉及通过(扩展的)遗传密码而位点特异性的掺入生物正交基团。具体而言,本发明涉及将降片烯基团掺入多肽中。
[0002] 发明背景
[0003] 通过遗传密码扩展而位点特异性的掺入生物正交基团提供了用任何探针位点特异性标记蛋白质的有通用策略。但是,可以按遗传方式编码的生物正交官能团的缓慢反应性限制了这项策略的实用性。
[0004] 迫切需要在多样背景下采用用户定义的探针位点特异性标记蛋白质的通用方法。
[0005] 当前的蛋白质标记方法涉及使用荧光蛋白融合物[1-4]、自标记蛋白(例如,SNAP标签、HALO标签、CLIP标签)[5-8]、连接酶(例如,生物素连接酶、硫辛酸连接酶、分选酶和磷酸泛酰巯基乙胺基转移酶)[9-15]和自标记标签(例如,四半胱酸和四丝氨酸)[16,17]。尽管这些方案中的一些允许快速标记并且已经对生物研究产生重大影响,但是它们需要使用蛋白质融合物和/或向目的蛋白引入额外的序列。这可能扰动蛋白质的结构和功能并使得在蛋白质中的任何位置安置探针具有挑战性。
[0006] 另外,可以通过这些方法中某些方法掺入的探针的范围有限[3,4,18]。
[0007] 用于蛋白质标记的理想方法将i)允许将探针容易地置于多种细胞中的蛋白质中的任何位置,ii)是快速和定量的,iii)对蛋白质中用户限定的位点特异,iv)显示'接通(turn on)'荧光且具有最少脱位点或背景标记,和v)允许用多种探针标记。原则上,以遗传编码方式位点特异性掺入携带生物正交官能团的非天然氨基酸将允许用基本上任何探针在所定义的位点标记特定蛋白质。
[0008] 已经使用琥珀抑制基因氨酰基tRNA合成酶/tRNACUA对通过遗传方式编码生物正交基团,包括叠氮化物、炔、、苯胺、烯、四唑和[1,2]氨基硫醇[19-29]。对于所建立的已经在蛋白质上证明的的反应,相应模型反应的速率常数[30]处于10-2M-1s-1至10-4M-1s-1的范围内(虽然对于新出现的方法有报道更高的速率)[29,31,32]。
[0009] 所建立反应的速率显然足以允许在细胞表面上以高密度存在的以代谢方式掺入的携带叠氮基和酮的聚糖类似物的有用标记,和在蛋白质组掺入氨基酸类似物的标记[33-35]。但是所建立的生物正交反应的迟缓性经常造成难以在体外在限定的位点定量标记物蛋白质,并且可以解释如下事实:目前没有使用遗传编码的非天然氨基酸标记在哺乳动物细胞表面上表达的蛋白质的例子。
[0010] 本发明寻求克服与现有技术相关的问题。
[0011] 发明简述
[0012] 生物正交化学的最新进展已经证明,包括降冰片烯和反-环辛烯在内的应变烯(strainded alkene)与四嗪在逆向电子需求Diels-Alder环加成中迅速并特异性反应以形成稳定加合物,速率常数量级快于已建立的生物正交反应[36-38]。本发明人已经产生了用于以遗传方式编码这些反应的组分的系统,所述系统包括方法和新试剂。这为位点特异性快速蛋白质标记的实现提供了有效的策略。
[0013] 更具体地,发明人证明了在大肠杆菌和哺乳动物细胞中使用吡咯赖氨酰-tRNA合成酶/tRNACUA对按遗传方式编码降冰片烯氨基酸。发明人提供了一系列基于四嗪的探针,所述探针与降冰片烯快速反应时显示“接通”的荧光。发明人证明,对所编码的降冰片烯的标记相对于整个蛋白质组是特异的并且比所建立的可编码生物正交反应快数千倍。发明人明确显示了,对于体外蛋白标记和在哺乳动物细胞上的蛋白标记,本发明的方法优于现有的生物正交反应,这证明了哺乳动物细胞表面上的蛋白质的首次生物正交性位点特异性标记。
[0014] 本发明人还进一步教导了,遗传编码的降冰片烯通过快速生物正交环加成指导哺乳动物细胞表面上的位点特异性蛋白质标记。
[0015] 发明详述
[0016] 在一个方面,本发明提供了包含具有降冰片烯基团的氨基酸的多肽。掺入降冰片烯基团具有本文中描述并证明的许多益处。
[0017] 合适的,降冰片烯基团作为氨基酸残基降冰片烯赖氨酸存在。
[0018] 在一个实施方案中,本发明提供了包含单个具有降冰片烯基团的氨基酸的多肽。仅具有单个携带降冰片烯基团的氨基酸提供了准确限定的多肽产物。仅具有单个携带降冰片烯基团的氨基酸避免了多重标记或不完全标记问题(如果反应没有完成,则可以产生异质产物,这可能是通过仅具有单个携带降冰片烯基团的氨基酸而有效解决的问题)。在一个优选实施方案中,所述降冰片烯基团作为氨基酸残基降冰片烯赖氨酸而存在。优选地,所述单个氨基酸不是N端氨基酸。优选地,N末端氨基不包含降冰片烯。优选地,携带降冰片烯的氨基酸残基是多肽的内部氨基酸。
[0019] 在另一个方面,本发明涉及产生包含降冰片烯基团的多肽的方法,所述方法包括以遗传方式将包含降冰片烯基团的氨基酸掺入多肽中。以遗传方式掺入降冰片烯基团能够准确的构建给定的多肽。降冰片烯基团的位置可受到准确控制。这有利地避免了为了添加降冰片烯基团而使整个多肽经历复杂反应步骤的需求。
[0020] 合适的,所描述的用于产生多肽的方法包括:
[0021] (i)提供编码所述多肽的核酸,所述核酸包含编码具有降冰片烯基团的氨基酸的正交密码子;
[0022] (ii)在能够识别所述正交密码子并将所述具有降冰片烯基团的氨基酸掺入多肽链的正交性tRNA合成酶/tRNA对存在下翻译所述核酸。
[0023] 适当地,所述正交密码子包含琥珀密码子(TAG),所述tRNA包含MbtRNACUA,所述tRNA合成酶包含MbPylRS。
[0024] 适当地,所述包含降冰片烯基团的氨基酸是降冰片烯赖氨酸。
[0025] 适当地,所述氨基酸是Nε-5-降冰片烯-2-基羰基-L-赖氨酸。
[0026] 适当地,在与野生型多肽中赖氨酸残基相对应的位置掺入所述具有降冰片烯基团的氨基酸。这具有以下优点:维持含有降冰片烯的多肽与从中衍生该多肽的野生型多肽的可能的最密切的结构关系。
[0027] 适当地,该多肽包含单个降冰片烯基团。这具有以下优点:维持可能指向降冰片烯基团的任何进一步的化学修饰的特异性。例如当目的多肽中仅存在单个降冰片烯基团时,则有利地避免了可能的部分修饰的问题(例如,其中多肽中仅降冰片烯基团的子集随后被修饰的情况下,或相同多肽中可替代的降冰片烯基团之间反应微环境不同的问题(这可能导致该多肽中不同位置处不同降冰片烯基团之间的不均等反应性)。适当地,所述多肽包含单个降冰片烯氨基酸残基。
[0028] 掺入降冰片烯基团的重要优势在于,允许多种非常有用的进一步的化合物如标记物容易且特异地连接至降冰片烯基团。
[0029] 适当地,所述降冰片烯基团与四嗪基团连接。
[0030] 适当地,所述四嗪基团进一步与荧光团连接。
[0031] 适当地,所述四嗪基团进一步与PEG基团连接。
[0032] 适当地,所述荧光团包括荧光素、四甲基罗丹明(TAMRA)或-二吡咯亚甲基(BODIPY)。
[0033] 在另一个方面,本发明涉及包含降冰片烯基团的新的非天然氨基酸,如Nε-5-降冰片烯-2-基氧羰基-L-赖氨酸。
[0034] 适当地,Nε-5-降冰片烯-2-基氧羰基-L-赖氨酸对应于式2:
[0035]
[0036] 在另一个方面,本发明涉及与荧光团连接的四嗪化合物。
[0037] 在另一个方面,本发明涉及与聚乙二醇(PEG)基团连接的四嗪化合物。
[0038] 适当地,所述四嗪选自图1的5、6、7或8。
[0039] 适当地,所述荧光团包括荧光素、四甲基罗丹明(TAMRA)或硼-二吡咯亚甲基(BODIPY)。
[0040] 适当地,与荧光团连接的所述四嗪化合物选自图1的9、10、11、12、13或14。
[0041] 在另一个方面,本发明涉及产生包含四嗪基团的多肽的方法,所述方法包括提供如上文所述的包含降冰片烯基团的多肽,使所述多肽与四嗪化合物接触,并温育以允许所述四嗪通过环加成反应与降冰片烯基团连接。
[0042] 适当地,所述环加成反应是逆向电子需求Diels-Alder环加成反应。
[0043] 这种化学具有反应速度的优势。因此适当地,允许所述反应进行16小时或更短时间。更适当地,允许所述反应进行2小时或更短时间。最适当地,允许所述反应进行30分钟或更短时间。
[0044] 在另一个方面,本发明涉及使多肽PEG化的方法,所述方法包括实施如上文所述的方法,其中所述四嗪化合物是与PEG基团连接的四嗪化合物。
[0045] 应当注意,某些反应环境可能影响反应时间。最适当地,最短时间如2小时或更短或30分钟或更短适用于体外反应。
[0046] 可能需要实施体内或在真核培养条件如组织培养基或用于真核细胞的其他合适培养基中的反应超过30分钟或超过2小时以实现最大标记。熟练操作人员能够基于本文提供的指导,通过反复试验确定最佳反应时间。
[0047] 适当地,在所描述的方法中使用的所述四嗪化合物是如上文所述的四嗪化合物。
[0048] 在另一个方面,本发明涉及选自图1的5、6、7或8中的四嗪化合物。这些新化合物尤其如本文所述那样使用。
[0049] 还描述了产生包含降冰片烯基团的多肽的方法,所述方法包括修饰编码所述多肽的核酸以在与所述多肽中期望掺入降冰片烯基团的位置相对应的一个或多个位置提供琥珀密码子。适当地,修饰所述核酸包括使赖氨酸的密码子突变成琥珀密码子(TAG)。
[0050] 适当地进行靶向(即,通过例如琥珀抑制作用用非天然氨基酸取代),从而所所选择的位置可获得(accessible)四嗪-荧光团,即位于折叠蛋白质的表面上。因此,原始野生型序列中的极性氨基酸是特别合适靶向的位置。
[0051] 因此,本发明不限于使赖氨酸密码子突变。原则上,本发明可以适用于多肽中的任何位置。适当地,本发明不适用于多肽的N-末端氨基酸。在目的多肽中选择要靶向的氨基酸位置时,选择表面残基是有利的。可以通过序列分析确定表面残基。可以通过三维分子建模确定表面残基。可以通过本领域已知的任何合适方法确定表面残基。靶向表面残基的优势包括更好呈递染料如荧光物或标记物如生物物理标记物。靶向表面残基的优势包括更简单或更有效的下游修饰。靶向表面残基的优势包括因应用标记物而破坏多肽结构和/或功能的可能性较小。
[0052] 目的多肽中特别合适靶向的氨基酸残基包括非疏性残基。适当地,根据本发明不靶向疏水性残基。适当地,靶向亲水残基。适当地,靶向极性残基。适当地,靶向丙氨酸或赖氨酸。适当地,靶向赖氨酸。'靶向'优选地意指用正交密码子取代正在靶向的残基的密码子并合成如本文中详述的多肽。
[0053] 在另一个方面,本发明涉及如上文所述的均一重组多肽。适当地,通过如上文所述的方法产生所述多肽。
[0054] 还公开了通过如上文所述方法产生的多肽。并且作为那些新方法的产物,这种多肽具有包含降冰片烯的技术特征。
[0055] 突变具有其本领域的一般含义并且可以指取代或截短或缺失所指的残基、基序或结构域。突变可以在多肽水平通过例如合成具有突变序列的多肽来实现,或可以在核苷酸水平通过例如产生编码突变序列的核酸并可随后翻译以产生所述突变多肽来实现。其中未指定作为给定突变位点的替换氨基酸的氨基酸的情况下,适当地,利用所述位点的随机化。作为默认突变(default mutation),可以使用丙氨酸(A)。适当地,在特定位点所用的突变如本文中阐述。
[0056] 片段适当地是至少10个氨基酸长度、适当地至少25个氨基酸长度、适当地至少50个氨基酸长度、适当地至少100个氨基酸长度、适当地至少200个氨基酸长度、适当地至少250个氨基酸长度、适当地至少300个氨基酸长度、适当地至少313个氨基酸长度,或适当地是目的多肽的大部分。
[0057] 遗传掺入和多肽产生
[0058] 在本发明的方法中,所述遗传掺入优选地使用正交或扩展的遗传密码,其中已经分配一个或多个特定正交密码子以编码具有降冰片烯基团的特定氨基酸残基,从而可以使其通过使用正交性tRNA合成酶/tRNA对以遗传方式掺入。正交性tRNA合成酶/tRNA对原则上可以是任何这类对子,它能够使tRNA装载包含降冰片烯基团的氨基酸并且能够响应正交密码子而将包含降冰片烯基团的这种氨基酸掺入多肽链。正交密码子可以是正交密码子琥珀密码子(amber)、赭石密码子(ochre)、蛋白石密码子(opal)或四联体密码子。密码子必需只对应于将用来携带包含降冰片烯基团的氨基酸的正交tRNA。优选地,正交密码子是琥珀密码子。
[0059] 应当指出,本文中显示的具体例子已经使用琥珀密码子和相应的tRNA/tRNA合成酶。如上文所示,这些可以变动。可选地,为了使用其他密码子而不陷入使用或选择能够随包含降冰片烯基团的氨基酸一起发挥作用的可选tRNA/tRNA合成酶对的麻烦,可以简单地用选项密码子的期望反密码子区替换tRNA的反密码子区。反密码子区不参与tRNA的装载或掺入功能,也不参与被tRNA合成酶识别,从而使这种替换完全处于熟练操作者的能力范围内。
[0060] 因此如果需要,可以使用可选的正交性tRNA合成酶/tRNA对。
[0061] 优选地,正交性合成酶/tRNA对是巴氏甲烷八叠球菌(Methanosarcina barkeri)MS吡咯赖氨酸tRNA合成酶(MbPyIRS)和其同族琥珀阻抑基因tRNA(MbtRNACUA)。
[0062] 巴氏甲烷八叠球菌PylT基因编码MbtRNACUAtRNA。
[0063] 巴氏甲烷八叠球菌PylS基因编码MbPyIRS tRNA合成酶蛋白。当使用数字地址提到特定氨基酸残基时,使用MbPyIRS(巴氏甲烷八叠球菌吡咯赖氨酰-tRNA合成酶)氨基酸序列作为参考序列(即,如通过公众可获得的野生型巴氏甲烷八叠球菌PylS基因登录号Q46E77所编码)取得编号:
[0064] MDKKPLDVLI SATGLWMSRT GTLHKIKHYE VSRSKIYIEM ACGDHLVVNN
[0065] SRSCRTARAF RHHKYRKTCK RCRVSDEDIN NFLTRSTEGK TSVKVKVVSA
[0066] PKVKKAMPKS VSRAPKPLEN PVSAKASTDT SRSVPSPAKS TPNSPVPTSA
[0067] PAPSLTRSQL DRVEALLSPE DKISLNIAKP FRELESELVT RRKNDFQRLY
[0068] TNDREDYLGK LERDITKFFV DRDFLEIKSP ILIPAEYVER MGINNDTELS
[0069] KQIFRVDKNLCLRPMLAPTL YNYLRKLDRI LPDPIKIFEV GPCYRKESDG
[0070] KEHLEEFTMV NFCQMGSGCT RENLESLIKE FLDYLEIDFE IVGDSCMVYG
[0071] DTLDIMHGDL ELSSAVVGPV PLDREWGIDK PWIGAGFGLE RLLKVMHGFK
[0072] NIKRASRSES YYNGISTNL。
[0073] 所述序列在下文注释为SEQ ID NO.1。
[0074] 如果需要,本领域技术人员可以通过使其突变改造MbPyIRS tRNA合成酶蛋白,从而对要使用的降冰片烯氨基酸最有效。突变的需求取决于使用的降冰片烯氨基酸。其中不需要突变MbPyIRS tRNA合成酶的例子是步骤(a)中使用的降冰片烯氨基酸是Nε-5-降冰片烯-2-基氧羰基-L-赖氨酸时。其中可能需要突变MbPyIRStRNA合成酶的例子是当MbPyIRS tRNA合成酶蛋白不加工降冰片烯氨基酸时。
[0075] 可以通过向MbPyIRS tRNA合成酶引入突变而实施这种突变,例如在MbPyIRS tRNA合成酶中的以下一个或多个位置引入突变:M241、A267、Y271、L274和C313。
[0076] tRNA合成酶
[0077] 本发明的tRNA合成酶可以变动。虽然特定tRNA合成酶序列可能已经用于实施例中,但是本发明不意在仅限于这些实施例。
[0078] 原则上,可以在本发明中使用提供相同tRNA装载(氨酰化)功能的任何tRNA合成酶。
[0079] 例如,tRNA合成酶可以来自任何合适物种,如来自古细菌,例如来自巴氏甲烷八叠球菌MS;巴氏甲烷八叠球菌Fusaro株;氏甲烷八叠球菌(Methanosarcina mazei)Go1;醋酸甲烷八叠球菌(Methanosarcina acetivorans)C2A;嗜热甲烷八叠球菌(Methanosarcina thermophila);或布氏拟甲烷球菌(Methanococcoides burtonii)。可选地,tRNA合成酶可以来自细菌,例如来自哥本哈根脱亚硫酸菌(Desulfitobacterium hafniense)DCB-2;哥本哈根脱亚硫酸菌Y51;哥本哈根脱亚硫酸菌PCP1;乙酸氧化脱硫肠状菌(Desulfotomaculum acetoxidans)DSM771。
[0080] 来自这些生物的示例性序列是公众可获得的序列。提供以下例子作为吡咯赖氨酸tRNA合成酶的示例性序列:
[0081] >巴氏甲烷八叠球菌MS/1-419/
[0082] 巴氏甲烷八叠球MS
[0083] 版本Q6WRH6.1GI:74501411
[0084] MDKKPLDVLISATGLWMSRTGTLHKIKHHEVSRSKIYIEMACGDHLVVNNSRS
[0085] CRTARAFRHHKYRKTCKRCRVSDEDINNFLTRSTESKNSVKVRVVSAPKVKKA
[0086] MPKSVSRAPKPLENSVSAKASTNTSRSVPSPAKSTPNSSVPASAPAPSLTRSQLD
[0087] RVEALLSPEDKISLNMAKPFRELEPELVTRRKNDFQRLYTNDREDYLGKLERDI
[0088] TKFFVDRGFLEIKSPILIPAEYVERMGINNDTELSKQIFRVDKNLCLRPMLAPTL
[0089] YNYLRKLDRILPGPIKIFEVGPCYRKESDGKEHLEEFTMVNFCQMGSGCTREN
[0090] LEALIKEFLDYLEIDFEIVGDSCMVYGDTLDIMHGDLELSSAVVGPVSLDREW
[0091] GIDKPWIGAGFGLERLLKVMHGFKNIKRASRSESYYNGISTNL
[0092] >巴氏甲烷八叠球菌F/1-419/
[0093] 巴氏甲烷八叠球菌Fusaro株
[0094] 版本YP_304395.1GI:73668380
[0095] MDKKPLDVLISATGLWMSRTGTLHKIKHYEVSRSKIYIEMACGDHLVVNNSRS
[0096] CRTARAFRHHKYRKTCKRCRVSDEDINNFLTRSTEGKTSVKVKVVSAPKVKK
[0097] AMPKSVSRAPKPLENPVSAKASTDTSRSVPSPAKSTPNSPVPTSAPAPSLTRSQL
[0098] DRVEALLSPEDKISLNIAKPFRELESELVTRRKNDFQRLYTNDREDYLGKLERD
[0099] ITKFFVDRDFLEIKSPILIPAEYVERMGINNDTELSKQIFRVDKNLCLRPMLAPTL
[0100] YNYLRKLDRILPDPIKIFEVGPCYRKESDGKEHLEEFTMVNFCQMGSGCTREN
[0101] LESLIKEFLDYLEIDFEIVGDSCMVYGDTLDIMHGDLELSSAVVGPVPLDREWG
[0102] IDKPWIGAGFGLERLLKVMHGFKNIKRASRSESYYNGISTNL
[0103] >马氏甲烷八叠球菌/1-454
[0104] 马氏甲烷八叠球菌Go1
[0105] 版本NP_633469.1GI:21227547
[0106] MDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSS
[0107] RTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKK
[0108] AMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTG
[0109] ATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPF
[0110] RELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYI
[0111] ERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPC
[0112] YRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCM
[0113] VYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDF
[0114] KNIKRAARSESYYNGISTNL
[0115] >醋酸甲烷八叠球菌/1-443
[0116] 醋酸甲烷八叠球菌C2A
[0117] 版本NP_615128.2GI:161484944
[0118] MDKKPLDTLISATGLWMSRTGMIHKIKHHEVSRSKIYIEMACGERLVVNNSRS
[0119] SRTARALRHHKYRKTCRHCRVSDEDINNFLTKTSEEKTTVKVKVVSAPRVRKA
[0120] MPKSVARAPKPLEATAQVPLSGSKPAPATPVSAPAQAPAPSTGSASATSASAQR
[0121] MANSAAAPAAPVPTSAPALTKGQLDRLEGLLSPKDEISLDSEKPFRELESELLS
[0122] RRKKDLKRIYAEERENYLGKLEREITKFFVDRGFLEIKSPILIPAEYVERMGINS
[0123] DTELSKQVFRIDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPCYRKESD
[0124] GKEHLEEFTMLNFCQMGSGCTRENLEAIITEFLNHLGIDFEIIGDSCMVYGNTL
[0125] DVMHDDLELSSAVVGPVPLDREWGIDKPWIGAGFGLERLLKVMHGFKNIKRA
[0126] ARSESYYNGISTNL
[0127] >嗜热甲烷八叠球菌/1-478
[0128] 嗜热甲烷八叠球菌,版本DQ017250.1GI:67773308
[0129] MDKKPLNTLISATGLWMSRTGKLHKIRHHEVSKRKIYIEMECGERLVVNNSRS
[0130] CRAARALRHHKYRKICKHCRVSDEDLNKFLTRTNEDKSNAKVTVVSAPKIRK
[0131] VMPKSVARTPKPLENTAPVQTLPSESQPAPTTPISASTTAPASTSTTAPAPASTTAP
[0132] APASTTAPASASTTISTSAMPASTSAQGTTKFNYISGGFPRPIPVQASAPALTKSQ
[0133] IDRLQGLLSPKDEISLDSGTPFRKLESELLSRRRKDLKQIYAEEREHYLGKLERE
[0134] ITKFFVDRGFLEIKSPILIPMEYIERMGIDNDKELSKQIFRVDNNFCLRPMLAPNL
[0135] YNYLRKLNRALPDPIKIFEIGPCYRKESDGKEHLEEFTMLNFCQMGSGCTREN
[0136] LEAIIKDFLDYLGIDFEIVGDSCMVYGDTLDVMHGDLELSSAVVGPVPMDRD
[0137] WGINKPWIGAGFGLERLLKVMHNFKNIKRASRSESYYNGISTNL
[0138] >布氏拟甲烷球菌/1-416
[0139] 布氏拟甲烷球菌DSM6242,版本YP_566710.1GI:91774018
[0140] MEKQLLDVLVELNGVWLSRSGLLHGIRNFEITTKHIHIETDCGARFTVRNSRSS
[0141] RSARSLRHNKYRKPCKRCRPADEQIDRFVKKTFKEKRQTVSVFSSPKKHVPKK
[0142] PKVAVIKSFSISTPSPKEASVSNSIPTPSISVVKDEVKVPEVKYTPSQIERLKTLMS
[0143] PDDKIPIQDELPEFKVLEKELIQRRRDDLKKMYEEDREDRLGKLERDITEFFVD
[0144] RGFLEIKSPIMIPFEYIERMGIDKDDHLNKQIFRVDESMCLRPMLAPCLYNYLR
[0145] KLDKVLPDPIRIFEIGPCYRKESDGSSHLEEFTMVNFCQMGSGCTRENMEALID
[0146] EFLEHLGIEYEIEADNCMVYGDTIDIMHGDLELSSAVVGPIPLDREWGVNKPW
[0147] MGAGFGLERLLKVRHNYTNIRRASRSELYYNGINTNL
[0148] >哥本哈根脱亚硫酸菌_DCB-2/1-279
[0149] 哥本哈根脱亚硫酸菌DCB-2
[0150] 版本YP_002461289.1GI:219670854
[0151] MSSFWTKVQYQRLKELNASGEQLEMGFSDALSRDRAFQGIEHQLMSQGKRH
[0152] LEQLRTVKHRPALLELEEGLAKALHQQGFVQVVTPTIITKSALAKMTIGEDHPL
[0153] FSQVFWLDGKKCLRPMLAPNLYTLWRELERLWDKPIRIFEIGTCYRKESQGAQ
[0154] HLNEFTMLNLTELGTPLEERHQRLEDMARWVLEAAGIREFELVTESSVVYGDT
[0155] VDVMKGDLELASGAMGPHFLDEKWEIVDPWVGLGFGLERLLMIREGTQHVQ
[0156] SMARSLSYLDGVRLNIN
[0157] >哥本哈根脱亚硫酸菌_Y51/1-312
[0158] 哥本哈根脱亚硫酸菌Y51
[0159] 版本YP_521192.1GI:89897705
[0160] MDRIDHTDSKFVQAGETPVLPATFMFLTRRDPPLSSFWTKVQYQRLKELNASG
[0161] EQLEMGFSDALSRDRAFQGIEHQLMSQGKRHLEQLRTVKHRPALLELEEGLA
[0162] KALHQQGFVQVVTPTIITKSALAKMTIGEDHPLFSQVFWLDGKKCLRPMLAP
[0163] NLYTLWRELERLWDKPIRIFEIGTCYRKESQGAQHLNEFTMLNLTELGTPLEER
[0164] HQRLEDMARWVLEAAGIREFELVTESSVVYGDTVDVMKGDLELASGAMGPH
[0165] FLDEKWEIVDPWVGLGFGLERLLMIREGTQHVQSMARSLSYLDGVRLNIN
[0166] >哥本哈根脱亚硫酸菌POP1/1-288
[0167] 哥本哈根脱亚硫酸菌
[0168] 版本AY692340.1GI:53771772
[0169] MFLTRRDPPLSSFWTKVQYQRLKELNASGEQLEMGFSDALSRDRAFQGIEHQL
[0170] MSQGKRHLEQLRTVKHRPALLELEEKLAKALHQQGFVQVVTPTIITKSALAK
[0171] MTIGEDHPLFSQVFWLDGKKCLRPMLAPNLYTLWRELERLWDKPIRIFEIGTC
[0172] YRKESQGAQHLNEFTMLNLTELGTPLEERHQRLEDMARWVLEAAGIREFELV
[0173] TESSVVYGDTVDVMKGDLELASGAMGPHFLDEKWEIFDPWVGLGFGLERLL
[0174] MIREGTQHVQSMARSLSYLDGVRLNIN
[0175] >乙酸氧化脱硫肠状菌/1-277
[0176] 乙酸氧化脱硫肠状菌DSM771
[0177] 版本YP_003189614.1GI:258513392
[0178] MSFLWTVSQQKRLSELNASEEEKNMSFSSTSDREAAYKRVEMRLINESKQRLN
[0179] KLRHETRPAICALENRLAAALRGAGFVQVATPVILSKKLLGKMTITDEHALFSQ
[0180] VFWIEENKCLRPMLAPNLYYILKDLLRLWEKPVRIFEIGSCFRKESQGSNHLNE
[0181] FTMLNLVEWGLPEEQRQKRISELAKLVMDETGIDEYHLEHAESVVYGETVDV
[0182] MHRDIELGSGALGPHFLDGRWGVVGPWVGIGFGLERLLMVEQGGQNVRSMG
[0183] KSLTYLDGVRLNI
[0184] 当已经通过突变tRNA合成酶提供特定的tRNA装载(氨酰化)功能时,简单地使用另一种野生型tRNA序列(例如选自以上的一个)可能不适宜。在这种情况下,保留相同tRNA装载(氨酰化)功能将是重要的。这通过以下而实现:将示例性tRNA合成酶中的突变转移至可选的tRNA合成酶主链中,如选自以上的一个主链。
[0185] 以这种方式,应当可能将所选择的突变转移至相应的tRNA合成酶序列,如除示例性巴氏甲烷八叠球菌和/或马氏甲烷八叠球菌序列之外来自其他生物的相应pylS序列。
[0186] 可以通过与已知的tRNA合成酶如示例性巴氏甲烷八叠球菌序列和/或马氏甲烷八叠球菌序列比对,选择靶tRNA合成酶蛋白/主链。
[0187] 这个主题现在通过参考pylS(吡咯赖氨酸tRNA合成酶)序列来说明,但是这些原理同等地适用于特定的目的tRNA合成酶。
[0188] 例如,图5提供全部PylS序列的比对结果。这些序列可以具有低的总体序列同一性%。因此,重要的是通过例如将所述序列与已知的tRNA合成酶比对(而非单纯使用低序列同一性评分)而研究序列,以确保正在使用的序列的确是tRNA合成酶。
[0189] 因此适当地,当考虑序列同一性时,适当地如图5所示在多种tRNA合成酶范围内考虑。适当地,可以如图5中那样限定同一性%。图6显示tRNA合成酶之间序列同一性的简图。适当地,可以如图6中那样限定同一性%。
[0190] 关注催化区域可能是有用的。图7仅比对催化区域。这种比对的目的是提供可以限定高同一性%的tRNA催化区域,以捕获/鉴定适于接受为了产生相同tRNA装载(氨酰化)功能(例如新的或非天然的氨基酸识别作用)所移植的突变的主链支架
[0191] 因此适当地,当考虑序列同一性时,适当地如图7所示在催化区域范围内考虑。适当地,可以根据图7限定同一性%。图8显示催化区域之间序列同一性的简图。适当地,可以根据图8限定同一性%。
[0192] '转移'或'移植'突变到可选的tRNA合成酶主链上可以通过位点定向诱变编码tRNA合成酶主链的核苷酸序列来完成。这项技术是本领域熟知的。基本上,选择主链pylS序列(例如使用上文讨论的活性部位比对法)并且将所选择的突变转移至相应/同源位置(即在其中产生)。
[0193] 当使用数字地址提到特定氨基酸残基时,除非另外显而易见,否则使用MbPyIRS(巴氏甲烷八叠球菌吡咯赖氨酰-tRNA合成酶)氨基酸序列作为参考序列(即,如通过公众可获得的野生型巴氏甲烷八叠球菌PylS基因登录号Q46E77所编码)取得编号:
[0194] MDKKPLDVLI SATGLWMSRT GTLHKIKHYE VSRSKIYIEM ACGDHLVVNN
[0195] SRSCRTARAF RHHKYRKTCK RCRVSDEDIN NFLTRSTEGK TSVKVKVVSA
[0196] PKVKKAMPKS VSRAPKPLEN PVSAKASTDT SRSVPSPAKS TPNSPVPTSA
[0197] PAPSLTRSQL DRVEALLSPE DKISLNIAKP FRELESELVT RRKNDFQRLY
[0198] TNDREDYLGK LERDITKFFV DRDFLEIKSP ILIPAEYVER MGINNDTELS
[0199] KQIFRVDKNL CLRPMLAPTL YNYLRKLDRI LPDPIKIFEV GPCYRKESDG
[0200] KEHLEEFTMV NFCQMGSGCT RENLESLIKE FLDYLEIDFE IVGDSCMVYG
[0201] DTLDIMHGDL ELSSAVVGPV PLDREWGIDK PWIGAGFGLE RLLKVMHGFK
[0202] NIKRASRSES YYNGISTNL。
[0203] 如本领域中充分理解,这将用来定位目的残基。这不总是一种严格的计数行为-必须注意上下文或比对结果。例如,如果目的蛋白的长度略有不同,则该序列中对应于(例如)L266的正确残基的定位可能需要比对序列并且挑出等同或相应的残基,而不是简单地采用目的序列的第266位残基。这完全处于技术人员的能力范围内。
[0204] 本文所用的对突变的标注是本领域的标准。例如L266M意指与野生型序列的第226位的L相对应的氨基酸被替换为M。
[0205] 现在参考示例性巴氏甲烷八叠球菌序列和马氏甲烷八叠球菌序列来说明可选tRNA主链之间突变的移植,但是相同原理同等地适用于移植到其他主链上或从其他主链移植。
[0206] 例如Mb AcKRS是用于掺入AcK的工程化合成酶
[0207] 亲本蛋白/主链:巴氏甲烷八叠球菌PylS
[0208] 突变:L266V、L270I、Y271F、L274A、C317F
[0209] Mb PCKRS:用于掺入PCK的工程化合成酶
[0210] 亲本蛋白/主链:巴氏甲烷八叠球菌PylS
[0211] 突变:M241F、A267S、Y271C、L274M
[0212] 可以通过将这些突变移植入马氏甲烷八叠球菌PylS中获得具有相同底物特异性的合成酶。两种合成酶的序列同源性可见于图9中。因此可以通过将突变从Mb主链移植到Mm tRNA主链上来产生以下合成酶:Mm AcKRS将突变L301V、L305I、Y306F、L309A、C348F引入马氏甲烷八叠球菌PylS中,Mm PCKRS将突变M276F、A302S、Y306C、L309M引入马氏甲烷八叠球菌PylS中。
[0213] 下文给出这些示例性移植突变合成酶的全长序列。
[0214] >Mb_PylS/1-419
[0215] MDKKPLDVLISATGLWMSRTGTLHKIKHHEVSRSKIYIEMACGDHLVVNNSRS
[0216] CRTARAFRHHKYRKTCKRCRVSDEDINNFLTRSTESKNSVKVRVVSAPKVKKA
[0217] MPKSVSRAPKPLENSVSAKASTNTSRSVPSPAKSTPNSSVPASAPAPSLTRSQLD
[0218] RVEALLSPEDKISLNMAKPFRELEPELVTRRKNDFQRLYTNDREDYLGKLERDI
[0219] TKFFVDRGFLEIKSPILIPAEYVERMGINNDTELSKQIFRVDKNLCLRPMLAPTL
[0220] YNYLRKLDRILPGPIKIFEVGPCYRKESDGKEHLEEFTMVNFCQMGSGCTREN
[0221] LEALIKEFLDYLEIDFEIVGDSCMVYGDTLDIMHGDLELSSAVVGPVSLDREW
[0222] GIDKPWIGAGFGLERLLKVMHGFKNIKRASRSESYYNGISTNL
[0223] >Mb_AcKRS/1-419
[0224] MDKKPLDVLISATGLWMSRTGTLHKIKHHEVSRSKIYIEMACGDHLVVNNSRS
[0225] CRTARAFRHHKYRKTCKRCRVSGEDINNFLTRSTESKNSVKVRVVSAPKVKKA
[0226] MPKSVSRAPKPLENSVSAKASTNTSRSVPSPAKSTPNSSVPASAPAPSLTRSQLD
[0227] RVEALLSPEDKISLNMAKPFRELEPELVTRRKNDFQRLYTNDREDYLGKLERDI
[0228] TKFFVDRGFLEIKSPILIPAEYVERMGINNDTELSKQIFRVDKNLCLRPMVAPTIF
[0229] NYARKLDRILPGPIKIFEVGPCYRKESDGKEHLEEFTMVNFFQMGSGCTRENLE
[0230] ALIKEFLDYLEIDFEIVGDSCMVYGDTLDIMHGDLELSSAVVGPVSLDREWGID
[0231] KPWIGAGFGLERLLKVMHGFKNIKRASRSESYYNGISTNL
[0232] >Mb_PCKRS/1-419
[0233] MDKKPLDVLISATGLWMSRTGTLHKIKHHEVSRSKIYIEMACGDHLVVNNSRS
[0234] CRTARAFRHHKYRKTCKRCRVSDEDINNFLTRSTESKNSVKVRVVSAPKVKKA
[0235] MPKSVSRAPKPLENSVSAKASTNTSRSVPSPAKSTPNSSVPASAPAPSLTRSQLD
[0236] RVEALLSPEDKISLNMAKPFRELEPELVTRRKNDFQRLYTNDREDYLGKLERDI
[0237] TKFFVDRGFLEIKSPILIPAEYVERFGINNDTELSKQIFRVDKNLCLRPMLSPTLC
[0238] NYMRKLDRILPGPIKIFEVGPCYRKESDGKEHLEEFTMVNFCQMGSGCTRENL
[0239] EALIKEFLDYLEIDFEIVGDSCMVYGDTLDIMHGDLELSSAVVGPVSLDREWGI
[0240] DKPWIGAGFGLERLLKVMHGFKNIKRASRSESYYNGISTNL
[0241] >Mm_PylS/1-454
[0242] MDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSS
[0243] RTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKK
[0244] AMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTG
[0245] ATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPF
[0246] RELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYI
[0247] ERMGIDNDTELSKQIFRVDKNFCLRPMLAPNLYNYLRKLDRALPDPIKIFEIGPC
[0248] YRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCM
[0249] VYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDF
[0250] KNIKRAARSESYYNGISTNL
[0251] >Mm_AcKRS/1-454
[0252] MDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSS
[0253] RTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKK
[0254] AMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTG
[0255] ATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPF
[0256] RELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYI
[0257] ERMGIDNDTELSKQIFRVDKNFCLRPMVAPNIFNYARKLDRALPDPIKIFEIGPC
[0258] YRKESDGKEHLEEFTMLNFFQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCM
[0259] VYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDF
[0260] KNIKRAARSESYYNGISTNL
[0261] >Mm_PCKRS/1-454
[0262] MDKKPLNTLISATGLWMSRTGTIHKIKHHEVSRSKIYIEMACGDHLVVNNSRSS
[0263] RTARALRHHKYRKTCKRCRVSDEDLNKFLTKANEDQTSVKVKVVSAPTRTKK
[0264] AMPKSVARAPKPLENTEAAQAQPSGSKFSPAIPVSTQESVSVPASVSTSISSISTG
[0265] ATASALVKGNTNPITSMSAPVQASAPALTKSQTDRLEVLLNPKDEISLNSGKPF
[0266] RELESELLSRRKKDLQQIYAEERENYLGKLEREITRFFVDRGFLEIKSPILIPLEYI
[0267] ERFGIDNDTELSKQIFRVDKNFCLRPMLSPNLCNYMRKLDRALPDPIKIFEIGPC
[0268] YRKESDGKEHLEEFTMLNFCQMGSGCTRENLESIITDFLNHLGIDFKIVGDSCM
[0269] VYGDTLDVMHGDLELSSAVVGPIPLDREWGIDKPWIGAGFGLERLLKVKHDF
[0270] KNIKRAARSESYYNGISTNL
[0271] 相同原理同等地适用于其他突变和/或其他主链。
[0272] 应当有利地测试以这种方式产生的经移植的多肽,以确保已经保留了所需的功能/底物特异性。
[0273] 有利的合成酶
[0274] 本发明人进行了选择,目的是找到指导具有更高产率的降冰片烯赖氨酸掺入的正交性tRNA/tRNA合成酶对。一种优选的合成酶由催化活性部位中具有以下突变的MbtRNA合成酶(MbPyIRS)组成:L275A、C314S、M316I。这种合成酶适当地随MbtRNACUAtRNA一起使用。利用这种tRNA/tRNA合成酶对获得更好的蛋白质表达产率。如上文解释,可以在其他合成酶主链上进行相同的突变。
[0275] 此外,用于掺入降冰片烯赖氨酸的基于马氏甲烷八叠球菌的其他tRNA合成酶序列的例子包括:
[0276] 具有突变Y306A、Y384F的MmPyIRS,其在下文中描述:Amino acids for diels-alder reactions in living cells.Plass,T.,Milles,S.,Koehler,C.,Szymanski,J.,Mueller,R.,Wiessler,M.,Schultz,C.和Lemke,E.A.Angew Chem  Int  Ed Engl.2012Apr23;51(17):4166-70.doi:10.1002/anie.201108231.Epub2012Mar30。
[0277] 如上文解释,可以在其他合成酶主链上进行相同的突变。
[0278] 具有突变Y384F、Y306G和I405R的MmPyIRS,其在下文中描述:A genetically encoded norbornene amino acid for the mild and selective modification of proteins in a copper-free click reaction(用于无点击反应中轻度和选择性修饰蛋白质的遗传编码的降冰片烯氨基酸).Kaya E,Vrabel M,Deiml C,Prill S,Fluxa VS,Carell T,,Angew Chem Int Ed Engl.2012Apr27;51(18):4466-9.doi:10.1002/anie.201109252.Epub2012Mar21。
[0279] 如上文解释,可以在其他合成酶主链上进行相同的突变。
[0280] 可以将用于上文所述方法的编码目的多肽的多核苷酸引入到重组的复制型载体中。这种载体可以用来在相容性宿主细胞中复制所述核酸。因此,在又一个实施方案中,本发明提供通过以下方式产生本发明多核苷酸的方法:将本发明的多核苷酸引入至复制型载体中,将该载体引入相容性宿主细胞中,并在导致载体复制的条件下培育宿主。可以从宿主细胞回收载体。合适的宿主细胞包括细菌,如大肠杆菌。
[0281] 优选地,载体中本发明的多核苷酸与能够使宿主细胞表达编码序列的调控序列有效连接,即该载体是表达载体。术语“有效连接”意指所述组件处在允许它们以其预期方式发挥功能的关系。与编码序列“有效连接”的调节序列的连接方式使得在与所述调控序列相容的条件下实现编码序列的表达。
[0282] 可以将本发明的载体如所述那样转化或转染至合适的宿主细胞中以提供本发明的蛋白质表达。这种过程可以包括:在使载体表达编码蛋白质的编码序列的条件下,培养用如上文所述的表达载体转化的宿主细胞并且任选地回收表达的蛋白质。
[0283] 载体可以是,例如提供有复制起点、任选的用于表达所述多核苷酸的启动子和任选的所述启动子的调节基因的质粒载体或病毒载体。所述载体可以含有一个或多个选择标记基因,例如在细菌质粒的情况下氨苄青霉素耐药基因。载体可以用来,例如转染或转化宿主细胞。
[0284] 与编码本发明蛋白质的序列有效连接的控制序列包括启动子/增强子和其他表达调节信号。可以选择这些控制序列以相容于表达载体计划在其中使用的宿主细胞。术语启动子是本领域熟知的并且涵盖在尺寸和复杂性方面从最小启动子至包含上游元件和增强子的启动子的核酸区域。
[0285] 本发明的另一个方面是将含有降冰片烯的氨基酸通过遗传位点特异性的掺入到所选择的蛋白质中(适当地在真核细胞中)的方法,如体外方法。通过所述方法以遗传方式掺入的一个优势是一旦形成,不需要将包含降冰片烯氨基酸的蛋白质递送至细胞中,因为在这个实施方案中,这些可以在靶细胞中直接合成。所述方法包括以下步骤:
[0286] (i)在编码蛋白质的核苷酸序列中的所需位点处引入正交密码子如琥珀密码子或用其替换特定密码子,
[0287] (ii)在细胞中引入正交性tRNA合成酶/tRNA对(如吡咯赖氨酰-tRNA合成酶/tRNA对)的表达系统,
[0288] (iii)在具有本发明的含有降冰片烯的氨基酸的培养基中培育细胞。
[0289] 步骤(i)涉及在蛋白质的遗传序列中所需位点处用正交密码子如琥珀密码子替换特定密码子。这可以通过简单地引入具有编码蛋白质的核苷酸序列的构建体(如质粒)实现,其中改变需要引入/替换含有降冰片烯的氨基酸的位点以包含正交密码子如琥珀密码子。这完全处于本领域技术人员的能力范围内并且下文给出其例子。
[0290] 步骤(ii)需要正交表达系统以在所需的位置特异性掺入含有降冰片烯的氨基酸(例如琥珀密码子)。因此,需要特定正交性tRNA合成酶如正交性吡咯赖氨酰-tRNA合成酶和相应的特定正交tRNA对,其共同能够使所述tRNA装载含有降冰片烯的氨基酸。本文提供这些例子。
[0291] 蛋白质表达和纯化
[0292] 包含本发明多核苷酸的宿主细胞可以用来表达本发明的蛋白质。可以在允许表达本发明蛋白质的合适条件下培养宿主细胞。本发明蛋白质的表达可以是组成型的从而使其持续产生,或者是诱导性的从而需要刺激物启动表达。在诱导型表达的情况下,当需要时,可以通过例如添加诱导物质如地塞米松或IPTG至培养基来启动蛋白质产生。
[0293] 可以通过本领域已知的多种技术,包括酶促裂解、化学裂解和/或渗透裂解和物理破坏,从宿主细胞提取本发明的蛋白质。
[0294] 可以通过本领域已知的标准技术,如制备性层析、亲和纯化或任何其他合适的技术纯化本发明的蛋白质。
[0295] 四嗪化合物
[0296] 适当地,掺入目的多肽中的降冰片烯基团与四嗪化合物反应。四嗪发挥作用以便利地通过降冰片烯使目的分子连接至多肽。因此适当地,四嗪化合物携带目的分子。
[0297] 适当地,所述四嗪基团可以进一步与任何合适的目的分子连接以通过降冰片烯-四嗪反应使所述目的分子连接至多肽。将四嗪按照如此方式设计并合成,从而使它们具有容易接触的伯氨基。这种氨基可以利用标准胺偶联反应与多种化合物反应。由于四嗪在多种反应条件下均稳定,几乎任何化合物均可以与目的四嗪偶联。
[0298] 与四嗪连接(用于通过降冰片烯连接至多肽)的示例性化合物包括如本文中(如在实施例部分中)提到的多种荧光团。四嗪也可以与更复杂的荧光团连接,例如适于超高分辨率显微术如STORM、PALM或STED(例如开发用于STED显微术的来自Abberior的Alexa染料或专用染料)的那些。脂质可以通过标准技术与四嗪偶联。PEG可以与四嗪偶联(见实施例),这有益于通过本发明的降冰片烯使多肽PEG化。
[0299] 在全部情况下,本发明方法的重要益处包括以下事实:本发明降冰片烯的掺入是位点特异的并且最重要地可以在体内(和/或在体外在生物如大肠杆菌中)进行。相比之下,在现有方法中,纯化的抗体或蛋白质仅能在体外与降冰片烯以如上所述具有许多问题的非选择性和非位点特异性方式反应。因此,与本文中所证明的,本发明与现有技术方法相比具有明显的益处。
[0300] 含有降冰片烯的本发明多肽的可以便利地连接于荧光团之外的其他生物物理标记物上,例如NMR探针、自旋标记物探针、IR标记物、EM-探针以及小分子、寡核苷酸、脂质、纳米粒子量子点、生物物理探针(EPR标记物、NMR标记物、IR标记物)、小分子(生物素、药物、脂质)、寡核苷酸(DNA、RNA、LNA、PNA)、粒子(纳米粒子、病毒)、聚合物(PEG、PVC)、蛋白质、肽、表面等。
[0301] 定义
[0302] 术语'包含'(包括)应当理解成具有本领域的一般含义,即包括所述的特征或特征群组,但是该术语并不排除还含有任何其他特征或特征群组。
[0303] 其他优点
[0304] Blackmann等人JACS2008在水、细胞培养基或细胞裂解物中在四嗪和应变烯(反环辛烯)之间的逆向电子需求Diels-Alder反应。小蛋白(硫氧还蛋白)用反-环辛烯衍生物官能化。硫氧还蛋白是含有单个二硫键的小蛋白(11kDa)。这种二硫键一旦还原,则硫醇基与连接至反-环辛烯衍生物的马来酰亚胺选择性的反应。如此修饰的硫氧还蛋白随后与四嗪反应并且通过质谱法证实四嗪连接。这种现有方法是标准的生物化学连接,其不能选择性的进行。存在的全部半胱氨酸都将由这种方法标记。如果不存在半胱氨酸,反应将不可能。相比之下,本发明允许标记多肽上的任何预定位点。相比之下,本发明允许选择性标记。相比之下,本发明避免了这种现有技术的复杂的翻译后化学。相比之下,本发明在不需要产生纯化蛋白质的情况下允许标记发生(例如,见图3和实施例)。相比之下,本发明允许在活细胞中以胜过其他蛋白质的高度选择性进行标记。
[0305] Weissleder也已经将降冰片烯偶联至不同抗体并且此后用四嗪荧光团标记它们。同样,在这些情况下,用标准胺偶联技术标记抗体,即将抗体与活化形式(大多是琥珀酰亚胺酯)的相应应变烯(例如降冰片烯)温育,从而使全部赖氨酸以及抗体多肽的N末端与之反应。因此,这种已知的方法不是位点选择性标记方法。此外,这种已知的方法局限于生物化学反应。这种反应必须在纯化的抗体多肽上进行。相比之下,本发明允许标记多肽上的任何预定位点。相比之下,本发明允许选择性标记。相比之下,本发明避免这种现有技术的复杂翻译后化学。相比之下,本发明避免标记多肽的N末端。相比之下,本发明在不需要产生纯化蛋白质的情况下允许标记发生(例如,见图3和实施例)。相比之下,本发明允许在活细胞中以胜过其他蛋白质的高度选择性进行标记。
[0306] 本发明的优点是将降冰片烯选择性的掺入到多肽中。
[0307] 本发明的优点是将降冰片烯以优异产率掺入到多肽中。
[0308] 本发明的优点是将降冰片烯以与已知的方案相比改善(更快的)动力学掺入多肽中。
[0309] 本发明的优点是将降冰片烯掺入在多肽的预定位置。
[0310] 附图简述
[0311] 图1至图4在实施例中描述。
[0312] 图5显示PylS序列的比对结果。
[0313] 图6显示PylS序列的序列同一性。
[0314] 图7显示PylS序列的催化结构域(从350至480;来自图5的比对结果的编号)的比对结果。
[0315] 图8显示PylS序列的催化结构域的序列同一性。
[0316] 图9显示基于巴氏甲烷八叠球菌PylS或马氏甲烷八叠球菌PylS的具有所移植的突变的合成酶的比对结果。红色星号显示突变的位置。
[0317] 图10显示PEG化的简图和照片。
[0318] 补充图1至17在实施例中描述。
[0319] 以下通过举例方式描述本发明。这些实施例旨在示例,而不是限制所附权利要求书。实施例
[0320] 实施例1:与现有技术的比较
[0321] 背景
[0322] 用于蛋白质修饰的常规方法包括存在于天然氨基酸侧链中的官能团的选择性反应1。半胱氨酸和赖氨酸是迄今最常用的残基,原因在于它们在蛋白质中的丰度相对低并且调节其亲核性侧链的方法有很多2。这种方法被广泛用于连接几种小分子探针,如生物素和荧光团。然而,这种用于蛋白质修饰的残基特异性方法总体上不够用,原因在于在生物系统内部和蛋白质本身内部存在多个相同残基。
[0323] 迄今,用于细胞中蛋白质的细胞成像的主流加标签策略包括荧光蛋白(FP)的遗传融合。绿色荧光蛋白(GFP)及其相关变体的可用性提供了在活细胞或模式生物中研究蛋白质的结合相互作用、运输、稳定性、功能和时空分布的手段3-5。然而,FP的巨大尺寸经常干扰靶蛋白的折叠和活性6-7。FP的替代品利用了共价性标签介导标记方法,如自标记蛋白和酶介导的标记。最广泛使用的自标记蛋白是HaloTag8-9、SNAP-标签10和CLIP-标签11。这种方法的优点是选择标签的灵活性。虽然这些修饰相对于GFP较小,但是与其天然对应物相比,靶蛋白仍受到干扰,因此荧光蛋白融合物的主要限制仍持续存在。然而酶介导的标记提供了小标签尺寸和高度特异性的便利组合,但是不幸地也具有非常有限的探针分子组,并且在大多数情况下限于标记细胞表面蛋白12,13。
[0324] 一种高度靶向的蛋白质标记策略是引入单个残基修饰。然而,为了在天然环境下研究蛋白质,化学选择性需要不仅适用于复杂混合物,还需要适用于单个蛋白及其标记配偶物上存在的官能团。因此,在特定位置,应当将不明显的生物正交修饰在生理条件下引入蛋白质中。
[0325] 本发明
[0326] 根据本发明,可以通过改变蛋白质翻译装置以引入具有生物正交柄状物(例如降冰片烯)的非天然氨基酸来实现这一点:
[0327]
[0328] 选择性的生物正交结合反应的代表。与引入蛋白质中的生物分子(橙色-菱形)(例如,非天然氨基酸)连接的化学柄状物(黄色-饼形)和携带生物正交官能团的反应性探针(绿色-斜三形)之间的反应在生理条件下活系统内部找得到的全部官能团(蓝色-环绕周边的余下形状)存在下进行。
[0329] 生物结合反应则涉及携带独特化学柄状物(官能化的非天然氨基酸,例如,降冰片烯赖氨酸)的位点特异性预修饰的蛋白质,其将在不扰动结构和功能的情况下与标记分子特异性的共价结合。另外,可用于蛋白质标记的大部分方法(上文描述的一些方法)已经经初步开发用以提供荧光标签,而非天然氨基酸允许引入实际上任何类型的物理标记物和化学标记物,甚至是聚合物如聚乙二醇(PEG)。因此,在复杂环境内部携带特定反应性柄状物的蛋白质可以与能够被追踪和检测到的惰性分子结合。使用非天然氨基酸与蛋白质的生物结合反应(bioconjugation)是开发新技术以研究并理解生命中细胞过程的关键。
[0330] 已经通过不同手段开发并建立了用于在蛋白质和其他生物分子中利用生物正交化学探针的许多物结合反应2,14。下表中列出并简要描述le1生物结合反应的选择。
[0331] 表:生物正交标记中所用的生物结合反应。四嗪和降冰片烯(A)之间的反应具有胜过本领域迄今开发的全部其他生物结合反应的重要优点。本发明的实施方案以粗体显示。
[0332]
[0333]
[0334]
[0335]
[0336] 本发明的优点和应用
[0337] 四嗪和应变烯之间的逆向电子需求Diels-Alder(IED-DA)环加成反应是一种优越的生物正交反应,具有胜过表1中显示的其他生物结合反应的重要优点,如在含水介质中的高度选择性、优异产率和极快动力学。最近,IED-DA反应已经成功地用在生物结合反应中用于乙酸盐缓冲液中四嗪修饰的硫氧还蛋白(Trx)15以及血清和活细胞中携带降冰片烯的抗体16。
[0338] 本发明人通过合成并以遗传方式掺入新降冰片烯赖氨酸氨基酸,已经大大拓展了IED-DA反应用于蛋白质生物结合目的的适用性。这种氨基酸的遗传性编码允许在原核细胞和真核细胞两者中重组表达在限定位置携带降冰片烯部分的蛋白质。具体而言,可以按产业规模容易地产生蛋白质并且可以用完整的氨基酸特异性进行生物结合反应。
[0339] 这能够使用多种类型的探针精确修饰蛋白质,原因是IED-DA反应显示宽泛的官能团耐受性并以高产率进行。这种方法的另外应用是:
[0340] -用生物物理探针和细胞探针(例如,荧光标记物、自旋标记物(spin lable)、NMR标记物、IR标记物等)标记蛋白质
[0341] -用生物活性小分子(例如,细胞毒化合物或细胞靶向化合物)生物结合治疗性蛋白
[0342] -用聚合物(例如,增强稳定性和循环时间的聚乙二醇或用于细胞摄取的多胺)生物结合治疗性蛋白
[0343] -将蛋白质固定在表面上(例如,用于产生生物传感器)
[0344] 实施例1的参考文献
[0345] 1.Basle,E.,Joubert,N.和Pucheault,M.Protein chemical modification on endogenous amino acids.Chem Biol17,213-227(2010).
[0346] 2.Sletten,E.M.和Bertozzi,C.R.Bioorthogonal chemistry:fishing for selectivity in a sea of functionality.Angew Chem IntEdEngl48,6974-6998(2009).[0347] 3.Tsien,R.Y.The green fluorescent protein.Annu Rev Biochem67,509-544(1998).
[0348] 4.Lippincott-Schwartz,J.和Patterson,G.H.Development and use of fluorescent protein markers in living cells.Science300,87-91(2003).
[0349] 5.Hadjantonakis,A.K.,Dickinson,M.E.,Fraser,S.E.和Papaioannou,V.E.Technicolour transgenics:imaging tools for functional genomics in the mouse.Nat Rev Genet4,613-625(2003).
[0350] 6.Strack,R.L.等人,A noncytotoxic DsRed variant for whole-cell labeling.Nat Methods5,955-957(2008).
[0351] 7.Tour,O.等人,Calcium Green FlAsH as a genetically targeted small-molecule calcium indicator.Nat Chem Biol3,423-431(2007).
[0352] 8.Los,G.V.和Wood,K.The HaloTag:a novel technology for cell imaging and protein analysis.Methods Mol Biol356,195-208(2007).
[0353] 9.Los,G.V.等人,HaloTag:a novel protein labeling technology for cell imaging and protein analysis.ACS Chem Biol3,373-382(2008).
[0354] 10.Keppler,A.等人,A general method for the covalent labeling of fusion proteins with small molecules in vivo.Nat Biotechnol21,86-89(2003).[0355] 11.Gautier,A.等人,An engineered protein tag for multiprotein labeling in living cells.Chem Biol15,128-136(2008).
[0356] 12.Cronan,J.E.Biotination of proteins in vivo.A post-translational modification to label,purify,and study proteins.J Biol Chem265,10327-10333(1990).
[0357] 13.Walsh,C.T.,Garneau-Tsodikova,S.和Gatto,G.J.Protein posttranslational  modifications:the  chemistry  of  proteome 
diversifications.Angew Chem Int Ed Engl44,7342-7372(2005).
[0358] 14.Lim,R.K.和Lin,Q.Bioorthogonal chemistry:recent progress and future directions.Chem Commun(Camb)46,1589-1600(2010).
[0359] 15.Blackman,M.L.,Royzen,M.和Fox,J.M.Tetrazine ligation:fast bioconjugation based on inverse-electron-demand Diels-Alder reactivity.J Am Chem Soc130,13518-13519(2008).
[0360] 16.Devaraj,N.K.,Weissleder,R.和Hilderbrand,S.A.Tetrazine-based cycloadditions:application to pretargeted live cell imaging.Bioconjug Chem19,2297-2299(2008).
[0361] 17.Devaraj,N.K.和Weissleder,R.Biomedical Applications of Tetrazine Cycloadditions.Acc Chem Res(2011).
[0362] 18.Geoghegan,K.F.和Stroh,J.G.Site-directed conjugation of nonpeptide groups to peptides and proteins via periodate oxidation of a2-amino alcohol.Application to modification at N-terminal serine.Bioconjug Chem3,138-
146(1992).
[0363] 19.Gaertner,H.F.和Offord,R.E.Site-specific attachment of functionalized poly(ethylene  glycol)to  the  amino  terminus  of 
proteins.Bioconjug Chem7,38-44(1996).
[0364] 20.Breinbauer,R.和Kohn,M.Azide-alkyne coupling:a powerful reaction for bioconjugate chemistry.Chembiochem4,1147-1149(2003).
[0365] 21.Hein,C.D.,Liu,X.M.和Wang,D.Click chemistry,a powerful tool for pharmaceutical sciences.PharmRes25,2216-2230(2008).
[0366] 22.de Graaf,A.J.,Kooijman,M.,Hennink,W.E.和Mastrobattista,E.Nonnatural amino acids for site-specific protein conjugation.Bioconjug Chem20,1281-1295(2009).
[0367] 23.Agard,N.J.,Prescher,J.A.和Bertozzi,C.R.A strain-promoted[3+2]azide-alkyne cycloaddition for covalent modification of biomolecules in living systems.J Am Chem Soc126,15046-15047(2004).
[0368] 24.Shelbourne,M.,Chen,X.,Brown,T.和El-Sagheer,A.H.Fast copper-free click  DNA  ligation  by  the  ring-strain  promoted alkyne-azide cycloadditionreaction.Chem Commun(Camb)47,6257-6259(2011).
[0369] 25.Kohn,M.和Breinbauer,R.The Staudinger ligation-a gift to chemical biology.Angew Chem Int Ed Engl43,3106-3116(2004).
[0370] 26.Debets,M.F.,van der Doelen,C.W.,Rutjes,F.P.和van Delft,F.L.Azide:a unique dipole for metal-free bioorthogonal ligations.Chembiochem11,1168-1184(2010).
[0371] 27.Tona,R.和Haner,R.Synthesis and bioconjugation of diene-modified oligonucleotides.Bioconjug Chem16,837-842(2005).
[0372] 28.Hill,K.W.等人,Diels—Alder bioconjugation of diene-modified oligonucleotides.J Org Chem66,5352-5358(2001).
[0373] 29.de  Araujo,A.D.等人,Diels-Alder ligation of  peptides and proteins.Chemistry12,6095-6109(2006).
[0374] 30.Palomo,J.M.Diels-Alder  Cycloaddition  in  Protein Chemistry.Eur.J.Org.Chem 33,6303-6314(2010).
[0375] 31.Filice,M.,Romero,O.,Guisan,J.M.和Palomo,J.M.trans,trans-2,4-Hexadiene incorporation on enzymes for site-specific immobilization and fluorescent labeling.OrgBiomol Chem9,5535-5540(2011).
[0376] 32.Wang,Y.,Vera,C.I.和Lin,Q.Convenient synthesis  of highly functionalized  pyrazolines via  mild,photoactivated1,3-dipolar 
cycloaddition.Org Lett9,4155-4158(2007).
[0377] 33.Song,W.,Wang,Y.,Qu,J.和Lin,Q.Selective functionalization of a genetically encoded alkene-containing protein via"photoclick chemistry"in bacterial cells.J Am Chem Soc130,9654-9655(2008).
[0378] 34.Lin,Y.A.,Chalker,J.M.,Floyd,N.,Bernardes,G.J.和Davis,B.G.Allyl sulfides are privileged substrates in aqueous cross-metathesis:application to site-selective protein modification.J Am Chem Soc130,9642-9643(2008).[0379] 35.Chalker,J.M.,Lin,Y.A.,Boutureira,O.和Davis,B.G.Enabling olefin metathesis on proteins:chemical methods for installation of S-allyl cysteine.Chem Commun(Camb),3714-3716(2009).
[0380] 36.Lin,Y.A.和Davis,B.G.The allylic chalcogen effect in olefin metathesis.Beilstein J Org Chem6,1219-1228(2010).
[0381] 37.Hoyle,C.E.和Bowman,C.N.Thiol-ene click chemistry.Angew Chem Int Ed Engl 49,1540-1573(2010).
[0382] 38.Weinrich,D.等人,Oriented immobilization of farnesylated proteins by the thiol-ene reaction.Angew Chem Int Ed Engl49,1252-1257(2010).
[0383] 39.Kodama,K.等人,Régioselective carbon-carbon bond formation in proteins with palladium catalysis;new protein chemistry by organometallic chemistry.Chembiochem7,134-139(2006).
[0384] 40.Kodama,K.等人,Site-specific functionalization of proteins by organopalladium reactions.Chembiochem8,232-238(2007).
[0385] 41.Brustad,E.等人,A genetically encoded boronate-containing amino acid.Angew Chem Int Ed Engl47,8220-8223(2008).
[0386] 实例1A:靶向变动的残基
[0387] 靶残基不必是目的多肽中的赖氨酸。
[0388] 已经表达了在以下位置掺入(即替换成)降冰片烯赖氨酸(NorK)的以下蛋白质:
[0389] T4溶菌酶(位置83,在野生型位置83中是赖氨酸)
[0390] 肌红蛋白(位置4,其在野生型序列中是丝氨酸)
[0391] sfGFP(位置150,其在野生型序列中是天冬酰胺)
[0392] 由此证明了靶向除赖氨酸之外的残基。
[0393] 实例1B:降冰片烯-四嗪反应针对大肠杆菌蛋白质组的选择性
[0394] 为探测遗传编码的降冰片烯和基于四嗪的荧光团之间反应的特异性,我们在表达C端加His标签的sfGFP或加His标签的肌红蛋白的大肠杆菌蛋白质组中实施标记反应。通过调节添加至细胞的降冰片烯赖氨酸浓度,我们控制重组蛋白表达的水平,从而它等于或小于内源蛋白的表达水平。这确保相对于天然蛋白,对靶蛋白的任何特异性标记不是靶蛋白丰度的人为现象。
[0395] 将细胞在诱导蛋白质表达后3至4小时收获,用PBS洗涤并且与荧光团探针在室温温育。在洗涤细胞沉淀物后,裂解细胞并通过SDS PAGE分析反应混合物从而评估蛋白质组水平。SDS-PAGE凝胶的荧光扫描揭示相对于其他大肠杆菌蛋白质,四嗪-降冰片烯环加成对降冰片烯高度特异。图3d中显示结果。
[0396] 实施例1C:降冰片烯赖氨酸掺入在用聚乙二醇以位点特异性方式修饰蛋白质中的应用:
[0397] 降冰片烯-PEG试剂的合成:
[0398]
[0399] 遵循已发表的四嗪装配法(Angew.Chem.Int.Ed.2012,51,5222-5225),从市售试剂以3个步骤合成两种示例性PEG-四嗪试剂,分别为5kDa和20kDa(R=H)。
[0400] 为了微调e四嗪试剂的反应性,可以使用其他R基团,例如,卤化物、链烷、卤代链烷、芳烃、杂芳烃、卤代芳烃和其他。
[0401] 也可以使用不同分子量(例如,1kDa、2kDa、40kDa、100kDa)的其他线型和分枝的PEG基团。
[0402] 可选的聚合物(例如,肽、寡核苷酸、聚乙烯、聚氯乙烯、多糖或其他)也可能用一种或多种四嗪修饰并用于与蛋白质生物结合。
[0403] 蛋白质PEG化反应:
[0404] 图10A显示降冰片烯-蛋白质和四嗪-PEG试剂的蛋白质PEG化反应的示意图。
[0405] 图10B显示大肠杆菌表达系统中含有第00位置处掺入的降冰片烯赖氨酸(NorK)的纯化的高级折叠物绿色荧光蛋白(sfGFP)的PAGE凝胶。
[0406] 图10C显示因添加单个PEG基团而显示sfGFP分子量的明显变化的PEG化反应的PAGE凝胶(成像GFP荧光)。
[0407] 因此,证明了本发明的PEG化。
[0408] 实施例2
[0409] 结果和讨论
[0410] 含有降冰片烯的氨基酸的合成和遗传编码
[0411] 来自天然掺入吡咯赖氨酸的甲烷八叠球菌物种的吡咯赖氨酰-tRNA合成酶/tRNACUA对(PylRS/tRNACUA)(1,图1b)与大肠杆菌和真核细胞中的内源性tRNA和氨酰基-tRNA合成酶正交39-42。使用这种对子及其合成演化的衍生物,我们和其他人已经指向非天然氨基酸(包括翻译后修饰的氨基酸、化学柄状物和光笼蔽氨基酸)在大肠杆菌、酵母和哺乳动物27,28,39,40,43,46
细胞中期望蛋白质内特定位点处高效掺入 。另外,使用这个对子,我们最近已经在完整动物中证明了非天然氨基酸的掺入42。我们预期,这种合成酶/tRNA对可能用来将含有降冰片烯的氨基酸位点特异性和定量地掺入多种生物中所产生的蛋白质,并且可以用基于四嗪的探针快速、选择性地标记含有降冰片烯的蛋白质。
[0412] 我们设计了含有降冰片烯的氨基酸Nε-5-降冰片烯-2-基氧-羰基-L-赖氨酸(2,图1b)并以三个步骤和77%总产率合成它(补充信息和补充方案1)。为了研究2是否为MbPylRS/tRNACUA对的底物,我们用pBKPylS(其编码MbPylRS)和psfGFP150TAGPylT-His6(其编码MbtRNACUA和C端加六个组氨酸标签的在第150位置处具有琥珀密码子的sfGFP基因)转化大肠杆菌。在2(1mM)存在下,全长sfGFP以良好产率分离(图2,4mg L-1培养物),这可比于其他充分掺入的非天然氨基酸的产率28,32,45。GFP表达明显是氨基酸依赖性的。类似地,在第
4位置处携带琥珀密码子的肌红蛋白和在第83位置处携带琥珀密码子的T4溶菌酶在2存在时产生良好的蛋白质产率,但是在2不存在时未产生良好的蛋白质产率(图2和补充图1)。通过纯化蛋白质的电喷雾电离质谱,进一步证实2的掺入(图2和补充图1)
[0413] 生物相容性四嗪的合成
[0414] 为了产生含有独特反应基团的非对称四嗪用于利用生物物理探针官能化(图1c、补充方案2和补充信息),我们使等摩尔量的5-氨基-2-氰基吡啶和2-氰基吡啶(或2-氰基嘧啶)与过量含水肼反应以获得s-二氢四嗪S5a和S6a36。用从氯甲酸异丁酯和N-叔丁氧羰基甘氨酸原位形成的混合型酐处理这些二氢四嗪,分别产生了化合物S5b和S6b,所述化合物用含硝酸钠的乙酸容易地氧化成其相应的四嗪5和6。叔丁氧羰基的酸性脱保护产生四嗪S5c和S6c47。这些四嗪衍生物中的伯氨基提供了柄状物用于利用生物物理探针一步官能化。
[0415] 我们预期,携带替代胺的羧基的5和6的类似物将更缺少电子,并且与降冰片烯的逆向电子需求环加成中可能有更大反应性。为了产生四嗪7和8,我们使N-叔丁氧羰基乙二胺与6-氰基吡啶-3-羧酸在标准酰胺偶联条件下反应。所产生的腈S7a与乙腈或2-氰基嘧啶在含水肼中反应以分别产生二氢四嗪S7b和S8b,其在硝酸钠氧化后产生四嗪7和8。在酸性条件下8的去保护产生四嗪S8c。这种四嗪衍生物中的伯氨基提供了柄状物用于用生物物理探针一步官能化。所有合成的四嗪在MeOH/H2O和DMSO/H2O中在室温均稳定数日,如LCMS数据所测定(数据未显示)。
[0416] 快速四嗪DielsAlder环加成的动力学分析
[0417] 四嗪(5-8)在质子性溶剂中以>96%转化率与5-降冰片烯-2-醇容易地反应以形成相应的二氢哒嗪S15和其异构形式S16(补充图2和补充信息)。在拟一级条件下通过跟踪四嗪在320nm或300nm处的UV吸光度随时间推移的指数衰减,测定这些反应的速率常数(补充36,48
图3)。如预期,反应在较极性的溶剂系统(即,具有较高含水量的溶剂混合物)中更快 。
[0418] 四嗪8针对5-降冰片烯-2-醇显示最高活性,在H2O/MeOH(95:5)中在21℃的二级速率常数是大约9M-1s-1,而5在相同条件下以大约1M-1s-1的速率常数反应(补充表1和补充信息)。这证实四嗪降冰片烯反应的量级快于所建立的生物正交反应。
[0419] 基于四嗪的荧光团-'接通'荧光探针
[0420] 为了产生基于5、6和8的荧光探针,S5c、S6c和S8c的伯氨基与荧光素、四甲基罗丹明(TAMRA)和硼-二吡咯亚甲基(BODIPY)染料的琥珀酰亚胺基酯或异硫氰酸酯结合(补充信息、补充图4和5、补充表2)。
[0421] 相对于亲本荧光团的琥珀酰亚胺基或异硫氰酸酯衍生物的荧光,发射可见光的TAMRA四嗪结合物9和BODIPY四嗪结合物10的荧光显著降低。这与最近研究一致,所述研究显示荧光团可以被向在510nm和530nm之间吸收的近端四嗪发色团的能量转移猝灭49。但是,尽管5、6和8具有非常相似的吸收谱,染料-结合物的荧光减少取决于四嗪和荧光团的具体组合。例如,相对于亲本TAMRA-X,9(5-TAMRA-X)显示比10(6-TAMRA-X)和12(8-TAMRA-X)大得多的荧光减少。荧光素(在518nm最大发射)因与8结合而被最少淬灭。与5-降冰片烯-2-醇环加成时,9、11和13的荧光接通,导致荧光强度增加5-10倍(图3a,补充图5)。
[0422] 用基于四嗪的探针体外快速标记含有降冰片烯的蛋白质
[0423] 为了证明我们的四嗪-染料探针与携带位点特异性掺入的2的重组蛋白高效的特异性反应,将纯化的sfGFP-2、Myo-2和T4L-2在室温与荧光团9(10当量)温育过夜。基于SDS-PAGE的荧光成像和ESI-MS分析(图3a和补充图7)证实了含有2的蛋白质的定量标记,而在相同位点用含有替代2的Nε-叔丁氧羰基-L-赖氨酸(3)的对照蛋白则未检测到非特异性标记。在其他实验中,我们通过质谱法证明了用四嗪衍生物5、6和8以及用四嗪荧光团12、13和14对含有2的蛋白质的特异性的定量标记(补充图6和7)。用特定荧光团标记含有非天然氨基酸的蛋白质的先前实验需要洗涤步骤以移除与蛋白质非共价结合的游离染料。这里,我们发现我们可以在不洗涤样品或凝胶的情况下对含有2的蛋白质的特异性标记成像;这种改善可以至少部分地因“接通”四嗪荧光团的荧光所致。
[0424] 为进一步探测遗传编码的降冰片烯和基于四嗪的荧光团之间反应的特异性,我们对表达sfGFP-2-His6或Myo-2-His6的大肠杆菌蛋白质组实施标记反应(图3d和补充图8)。通过调节添加至细胞的2的浓度,我们控制重组蛋白表达的水平,从而使它等于或小于内源蛋白的表达水平;这确保相对于天然蛋白,对靶蛋白的任何特异性标记不是靶蛋白丰度的人为现象。将细胞在诱导蛋白质表达后3.5小时收获,用PBS洗涤并且与荧光团探针(12或13)在室温温育。在洗涤细胞沉淀物后,裂解细胞并通过SDS PAGE分析反应混合物以评估蛋白质水平。SDS-PAGE凝胶的荧光扫描揭示相对于其他大肠杆菌蛋白质,四嗪-降冰片烯环加成对2高度特异50。
[0425] 为证明对小分子测量的高速率常数转换成快速蛋白质标记,我们用12(10当量)标记在第4位置携带2的肌红蛋白。在作为时间函数的标记反应的凝胶荧光成像中(图3c),证明反应在大约30分钟内完成。还观察到了利用探针9和12对掺入2的蛋白质的快速标记(补充图9)。相比之下,在铜催化的点击反应中,在肌红蛋白相同位点处含有炔的氨基酸的标记需要50当量叠氮化物荧光团和18小时完成28。这证明,我们报道的标记方法具有标记重组蛋白的明显优点。
[0426] 在哺乳动物细胞表面上的位点特异性蛋白质标记
[0427] 尽管可能通过代谢性掺入生物正交官能团,在细胞表面上多个化学柄状物处标记丰富分子33-35,但是不存在使用目前可以遗传编码的任何非天然氨基酸在哺乳动物细胞表面上标记蛋白质上单个遗传限定位点的报道。
[0428] 我们通过蛋白质印迹法、荧光成像和质谱法证明,可以使用MmPy1RS/tRNACUA对,将2按遗传方式以高效率编码到哺乳动物细胞中的蛋白质内(图4和补充图10)。为了显示哺乳动物蛋白质的位点特异性标记,我们在含有MmPylRS的载体中将琥珀密码子在受体的胞外部分中的第128位置处引入EGFR(表皮生长因子受体)-GFP融合基因中,产生pMmPylRS-EGFR(128TAG)-GFP-HA。我们用pMmPylRS-EGFR(128TAG)-GFP-HA和编码4个拷贝MmPyltRNACUA的p4CMVE-U6-PylT转染HEK293细胞。在2或3存在下,细胞产生可以通过荧光显微术在细胞膜处可视化的全长EGFR-GFP。为了证明用四嗪-荧光团对含有2的EGFR-GFP的特异性标记,我们用9(200nM)处理细胞,洗涤细胞并对源自TAMRA标记的红色荧光以及源自表达全长EGFR-GFP的绿色荧光成像,其中C端GFP为胞内。在2小时内观察到携带EGFR-2-GFP的细胞的清晰标记并且TAMRA荧光清楚地与与细胞表面EGFR-GFP荧光共定位。对不表达EGFR-GFP的相同样品中细胞未观察到标记,并且携带EGFR-3-GFP的细胞未用9标记。这些观察结果证实,在EGFR的第128位置处的2用四嗪-TAMRA结合物9特异性标记(图4和补充图11-14)。
[0429] 接下来,我们的目的是使用环辛炔对哺乳动物细胞表面上2的位点特异性四嗪标记与位点特异性掺入的叠氮化物的标记进行比较,一种先前已经用来成功标记安装入细胞表面聚糖并且遍及蛋白质组各处的叠氮化物的反应33,34。我们首先证实,使用PylRS/tRNACUA对,能够将含有叠氮化物的氨基酸Nε-(2-叠氮基乙氧羰基-L-赖氨酸(4,图1b)高效掺入到哺乳动物细胞中的蛋白质内(补充图15)。我们随后将4在第128位置掺入EGFR-GFP中。4以可比较于2的效率掺入,如通过GFP荧光判定。但是当我们试图用基于环辛炔的荧光团(S17,TAMRA-DiBO-炔,从Invitrogen可商业获得,补充图4)标记4时,在用来以四嗪-荧光团标记2的相同条件下,我们未观察特异性标记(补充图16)。类似地,当我们试图在供应商提供的条件下标记4时,我们未观察细胞表面EGFR的特异性标记(补充图17)。这些结果表明,降冰片烯-四嗪反应的较快速率转化成哺乳动物细胞表面上标记蛋白质的明显优点。
[0430] 结论和展望
[0431] 总之,我们报道了含有降冰片烯的氨基酸2的高效合成和将其以位点特异性、遗传编码方式掺入大肠杆菌和哺乳动物细胞中的蛋白质内。我们描述了一系列基于四嗪的探针的开发,所述探针与降冰片烯快速反应时显示“接通”荧光。我们证明可以在体外、在复杂混合物和在哺乳动物细胞的表面上特异性标记携带2的蛋白质并且明确地证明这种方法对于位点特异性蛋白质标记的优点。
[0432] 图注
[0433] 图1.(a)遗传编码的降冰片烯与四嗪在水溶液中在环境温度和压力下快速反应以位点特异性标记蛋白质,(b)吡咯赖氨酸(1)、Nε-5-降冰片烯-2-基氧羰基-L-赖氨酸(2)、Nε-叔丁氧羰基-L-赖氨酸(3)和Nε-(2-叠氮基乙氧-羰基-L-赖氨酸(4)的氨基酸结构。(c)这项研究中使用的四嗪和四嗪-荧光团的结构(5-14)。
[0434] 图2.使用PylRS/tRNACUA对在大肠杆菌中以遗传定向方式高效掺入2。(a)在第150位置处携带琥珀密码子的sfGFP和在第4位置处携带琥珀密码子的肌红蛋白的氨基酸依赖性表达。(b)氨基酸掺入的MS表征,左:sfGFP-2-His6,测定值:27975.5±1.5Da,计算值:27977.5Da;右:Myo-2-His6,测定值:18532.5±1.5Da,计算值:18532.2Da)。
[0435] 图3.四嗪降冰片烯反应的表征。(a)与5-降冰片烯-2-醇(Nor)反应时四嗪-荧光团的荧光“接通”。(b)携带2的sfGFP的特异性定量标记,由SDS PAGE(考马斯染色和凝胶中荧光)和质谱法证明。红色质谱:在生物结合之前,测定值:27975.5±1.5Da,期望值:27977.5Da。蓝色质谱:在生物结合后,测定值:28783.0±1.5Da,期望值:28784.4Da。(c)用
12标记在第4位置处携带2的肌红蛋白。顶部荧光成像,底部考马斯染色的内参对照,(d)sfGFP中相比于大肠杆菌蛋白质组中标记2的特异性。泳道1-5:考马斯染色的凝胶,显示来自在所示浓度的非天然氨基酸2或3存在下产生sfGFP的大肠杆菌的蛋白质。泳道6-10:使用抗His6抗体在裂解物中检测所表达的蛋白质。泳道11-20:用所示荧光团12或13标记的蛋白质的荧光图像。
[0436] 图4.将2在哺乳动物细胞中的蛋白质内的位点特异性方式掺入以及四嗪-荧光团9对细胞表面上的EGFR-GFP的特异性标记。(a)含有PylRS/tRNACUA对和mCherry(TAG)eGFP-HA报道分子的细胞仅在2存在下产生GFP。(b)蛋白质印迹法证实全长mCherry(TAG)eGFP-HA的表达依赖于2的存在。(c)活哺乳动物细胞中细胞表面蛋白的特异性快速标记。在第128位置处携带2或3的EGFR-GFP作为转染的细胞的膜处的绿色荧光可见(左小图)。用9(200nM)处理细胞导致含有2的EGFR的选择性标记(中部小图)。在添加9后4小时将细胞成像。
[0437] 方法
[0438] 可以在补充信息中找到化学合成降冰片烯赖氨酸2和多种四嗪探针的方案。
[0439] 蛋白质表达和纯化
[0440] 为了表达具有掺入的非天然氨基酸的sfGFP,我们用pBKPylS(其编码MbPylRS)和psfGFP150TAGPylT-His6(其编码MbtRNACUA和C端加六个组氨酸标签的在第150位置处具有琥珀密码子的sfGFP基因)转化大肠杆菌DH10B细胞。将细胞在1ml S.O.B培养基(补充有0.2%葡萄糖)中在37℃恢复1小时,之后在100ml含有卡那霉素(50μg/mL)和四环素(25μg/mL)的LB中温育(16小时,37℃,230转/分钟)。将20ml这种过夜培养物用来接种1L补充有卡那霉素(25μg/mL)和四环素(12μg/mL)d1LB并在37℃温育。在OD600=0.4至0.5,添加2在H2O中的溶液至终浓度2mM。在30分钟后,通过添加阿拉伯糖至终浓度0.2%诱导蛋白质表达。在
3小时诱导后,通过离心收获细胞并且将其冷冻在-80℃直至需要。将细胞在冰上解冻并悬浮于30ml裂解缓冲液(10mM Tris-HCl,20mM咪唑,200mM NaCl,pH8,1mM苯基甲磺酰氟,1mg/mL溶菌酶,100μg/mL DNA酶A,Roche蛋白酶抑制剂)中。通过在4℃超声处理,提取蛋白质。通过离心(20分钟,21,000g,4℃)澄清提取物,将600μL Ni2+-NTA珠(Qiagen)添加至提取物并且将混合物在4℃伴随搅拌温育1小时。通过离心收集珠子(10分钟,1000g)。将珠子在30mL洗涤缓冲液(10mM Tris-HCl,20mM咪唑,200mM NaCl,pH8)中重悬3次并以1000g离心。随后,将珠子重悬于10mL洗涤缓冲液中并转移至柱子。将蛋白质用补充有200mM咪唑的3ml洗涤缓冲液洗脱并使用HiLoad16/60Superdex75制备级柱(GE Life Sciences)以流速1mL/分钟(缓冲液:20mMTris-HCl,100mM NaCl,pH7.4),通过大小排阻层析进一步纯化。将含有蛋白质的级分汇集并用Amicon Ultra-153kDa MWCO离心滤器装置(Millipore)浓缩。通过4-
12%SDS-PAGE分析纯化的蛋白质。按照相同方式制备掺入2的抹香鲸肌红蛋白和T4溶菌酶,不同在于细胞用pMyo4TAGPylT-His6)(其编码MbtRNACUA和C末端加6个组氨酸标签的在第4位置处具有琥珀密码子的抹香鲸肌红蛋白基因)和pBKPylS或pT4L83TAGPylT-His6(其编码MbtRNACUA和C端加六个组氨酸标签的在第83位置处具有琥珀密码子的T4溶菌酶基因)和pBKPylS转化。纯化蛋白质的产率达4mg/L。
[0441] 蛋白质质谱法
[0442] 使用Agilent 1200LC-MS系统,用6130四极谱仪实施ESI-MS。溶剂体系由以下组成:H2O中的0.2%甲酸作为缓冲液A和乙腈(MeCN)中的0.2%甲酸作为缓冲液B。使用Phenomenex Jupiter C4柱(150x2mm,5μm)对蛋白质实施LC-ESI-MS,并且以正模式分析样品,随后在214nm和280nm分析蛋白质的UV吸光度。通过MS Chemstation软件(Agilent Technologies)内部的反卷积,计算总蛋白质量。用LCT TOF质谱仪(Micromass,见下文)另外实施蛋白质质谱。另外,在具有电喷雾电离的LCT飞行时间质谱仪(ESI,Micromass)上测定蛋白质总质量。将蛋白质在20mM酸氢铵中再缓冲并与含有1%甲酸的乙腈1:1混合。可选地,用C4Ziptip(Millipore)制备样品并将样品直接输注在含有1%甲酸的50%含水乙腈中。以10μL min-1注射样品并且使用马心脏肌红蛋白以正离子模式进行校正。将30次扫描平均化并且通过最大熵反卷积用MassLynx4.1(Micromass)获得分子质量。使用Protparam(http://us.expasy.org/tools/protparam.html计算野生型蛋白质的理论质量,并且手工调整含有非天然氨基酸的蛋白质的理论质量。
[0443] 通过四嗪-降冰片烯环加成标记蛋白质
[0444] 用不同四嗪在体外标记纯化的蛋白质
[0445] 向40μL纯化的重组蛋白(20mM Tris-HCl,100mM NaCl,pH7.4中约10μM)添加4μL或8μL1mM四嗪化合物5、6、7或8在MeOH中的溶液(约10或20当量)。将溶液随后在室温温育并在不同的时间点由LC-ESI-MS分析。(补充图6)
[0446] 用四嗪-染料结合物在体外标记纯化的蛋白质
[0447] 将位点特异性掺入2的纯化重组蛋白:sfGFP-2、Myo-2、T4L-2(在20mMTris-HCl,100mM NaCl,pH7.4中均约10μM存在)与10当量四嗪-染料结合物9(DMSO中的2mM)温育。将溶液在室温温育,并且在12小时后取得等分试样并将等分试样通过SDS PAGE分析,并且用C4-ZIPTIP脱盐后,通过ESI-MS分析。SDS PAGE凝胶用考马斯染色或用Typhoon成像仪扫描以使凝胶中荧光可视。
[0448] 作为时间函数用四嗪-染料结合物在体外标记所纯化的蛋白质
[0449] 将2nmol纯化的Myo-2(20mM Tris-HCl,100mM NaCl,pH7.4中10μM)与20nmol四嗪-染料结合物12(2mM在DMSO中的溶液10μl)温育。在不同时间点(0秒、30秒、1分钟、2分钟、3分钟、5分钟、10分钟、30分钟、1小时、2小时),从溶液取得8μL等分试样并用200倍过量的5-降冰片烯-2-醇猝灭并投入液氮中。将样品与补充有5%(β-巯基乙醇)的NuPAGE LDS样品缓冲液混合,加热10分钟至90℃并通过4-12%SDS PAGE分析。通过用Typhoon Trio磷光成像仪(GE Life Sciences)扫描荧光条带对标记蛋白质的量定量。使用橡胶条带背景扣除,用ImageQuantTMTL软件(GE Life Sciences)对条带定量。凝胶中荧光显示使用10当量四嗪-荧光团12时,30分钟内标记是完整的(图3c)。在相似的实验中,将sfGFP-2与四嗪荧光团12或9温育并且在不同时间点分析样品(补充图9)。
[0450] 用四嗪-染料结合物标记完整大肠杆菌蛋白质组
[0451] 将含有psfGFP150TAGPylT-His6和pBKPylS或pmyo4TAGPylT-His6和pBKPylS的大肠杆菌DH10B细胞接种至含有卡那霉素(50μg/mL)和四环素(25μg/mL)的LB中。将细胞在37℃、250转/分钟伴随振摇温育过夜。将2ml过夜培养物用来接种入100mL补充有卡那霉素(25μg/mL)和四环素(12μg/mL)的LB并在37℃温育。在OD600=0.5,取出3ml培养物等分试样并补充不同浓度(1mM,2mM和5mM)的2mM和1mM的3。在37℃伴随振摇温育30分钟后,通过添加30μL20%阿拉伯糖诱导蛋白质表达。在表达3.5小时后,通过离心(16000g,5分钟)1mL细胞悬液收集细胞。将细胞重悬于PBS缓冲液中,再次离心并抛弃上清液。这个过程再重复2次。最后,将洗涤的细胞沉淀物悬浮于100μL PBS中并且在室温与3μL四嗪-染料结合物12或13(在DMSO中2mM)温育过夜。再次通过离心收集细胞并用1ml PBS通过悬浮和离心洗涤两次。最后,将细胞重悬于补充有5%(β-巯基乙醇)的100μL NuPAGE LDS样品缓冲液中,在90℃加热
10分钟并以16000g离心10分钟。通过4-12%SDS-PAGE分析粗制细胞裂解物以评估蛋白质水平。将凝胶用考马斯染色或用Typhoon成像仪扫描以使荧光条带可见。用针对6组氨酸标签的抗体(Cell Signaling Technology,His标签27E8小鼠mAb#2366)进行蛋白质印迹。
[0452] 确定动力学速率常数(小分子)
[0453] 在拟一级条件下用甲醇/水混合物中10倍至100倍过量的5-降冰片烯-2-醇,通过跟踪320nm或300nm处四嗪的UV吸光度随时间推移的指数衰减,测量不同四嗪的速率常数k(补充图3和补充表1)。
[0454] 制备每种四嗪(9/1水/甲醇中0.1mM)和5-降冰片烯-2-醇(甲醇或水中1至10mM)的母液。混合等体积已制备的母液产生0.05mM四嗪终浓度和与10至100当量相对应的0.5至5mM 5-降冰片烯-2-醇终浓度。使用以下仪器参数记录波谱:波长,对于6和8,320nm;对于5和3,6-二吡啶基-1,2,4,5-四嗪,300nm;对于7,280nm;波谱带宽(SBW),1.0nm;数据点集合增量,0.5秒或2.0秒。全部数据均在21℃记录。数据对单指数方程拟合。将每次测量实施3次并且将观察速率k的均数对5-降冰片烯-2-醇的浓度作图由曲线的斜率获得速率常数k。使用Kaleidagraph软件(Synergy Software,Reading,UK)执行全部数据处理
[0455] 用于哺乳动物细胞的克隆
[0456] 用以下引物在EGFR-EGFP融合蛋白的第128位置处引入琥珀密码子:
[0457] 正向引物:
[0458] ACCAGggtctcGATGCAtagAAAACCGGACTGAAGGAGCTGCCCATG,
[0459] 反向引物:TTGCAggtctcTGCATCATAGTTAGATAAGACTGCTAAGGCATAG。
[0460] 在PCR后,将产物用Bsal消化并且随后连接以环化。通过测通EGFR验证诱变。对pEGFPN1载体中的EGFR-EGFP融合物实施初始诱变。随后使用酶Nhel和Mfel(NEB),将EGFR从pEGFPN1载体消化下来。类似地,用相同的酶消化pMmPylRS-mCherry-TAG-EGFP-HA46以移除mCherry-TAG-EGFP-HA报道基因。使用T4DNA连接酶(NEB),将EGFR-EGFP连接入pMmPylRS-mCherry-TAG-EGFP-HA载体中替代mCherry-EGFP,以产生pMmPylRS-EGFR(128TAG)-GFP-HA。
[0461] 在哺乳动物细胞中掺入2
[0462] 将HEK293细胞接种到96孔Corning平板上并在含有青霉素/链霉素的10%FBS DMEM中培育至大约90%汇合度。将细胞用2种质粒转染:
[0463] pMmPylRS-mCherry-TAG-EGFP-HA和含有4拷贝野生型吡咯赖氨酰tRNA的p4CMVE-U6-PylT。使用来自Invitrogen的脂质转染胺2000转染试剂,根据制造商的方案实施转染。其中转染细胞的生长培养基是10%FBS DMEM,并且如所示含有1mM2,1mM3或不含额外氨基酸。在16-24小时后,将细胞在Zeiss710激光扫描式显微镜上成像以分析eGFP和mCherry表达。随后使用补充有CompleteMini蛋白酶抑制剂混合物(Roche)的IX Repoter裂解缓冲液(Promega)裂解细胞。在裂解后,沉淀细胞残片并且取出含有可溶性蛋白的上清液并添加至
4XNuPage LDS样品缓冲液(Invitrogen)。将样品加载并通过SDS-PAGE电泳。实施蛋白质印迹以使用兔抗-HA(Sigma)抗体检测全长报道蛋白,所述兔抗-HA抗体用抗兔HRP结合物(Cell signaling)检测。作为转染对照,还实施蛋白质印迹以使用小鼠抗-FLAG抗体(AbFrontier)检测合成酶,所述小鼠抗-FLAG抗体由结合有HRP的抗小鼠第二抗体(Cell Signaling)检测。
[0464] MS/MS分析
[0465] 将细胞在100mm组织培养皿上培育至约90%汇合度。使用脂质转染胺2000(Invitrogen),用pMmPylRS-mCherry-TAG-EGFP-HA和p4CMVE-U6-PylT转染细胞。16-24小时后,在1mM2存在下将细胞裂解在RIPA缓冲液中并且使用GFP Trap A系统(Chromotek),纯化mCherry-eGFP融合蛋白。由NextGen Sciences或通过内部设施进行MS/MS分析。对于前者,将洗脱物添加至4X NuPage LDS样品缓冲液并且在SDS-PAGE凝胶上电泳。随后切下与全长mCherry-eGFP融合物相对应的条带。将凝胶以胰蛋白酶消化过夜。随后在LTQ Orbitrap XL质谱仪上,通过LC/MS/MS采用30分钟梯度分析消化物。将产物-离子数据针对4种蛋白质序列的数据库检索(在通常使用的可变修饰当中掺入赖氨酸修饰)。使用Mascot搜索引擎,而Scaffold程序用于数据的整理和分析。
[0466] 对于内部分析,使用标准方法使蛋白质溶液还原并烷基化,之后用Promega猪胰蛋白酶过夜消化。将生成的肽在采用15cm,75Um,C18acclaim pep-map柱的Dionex Ultimate3000HPLC系统上分离并且在Thermo Scientific LTQ XL Orbitrap质谱仪上分析。使用内部Mascot数据库实施蛋白质鉴定。
[0467] 在哺乳动物细胞中标记
[0468] 在聚-L-赖氨酸(Sigma)包被的35mmμ培养皿(Ibidi)上接种并培育细胞。在约90%汇合度时,使用脂质转染胺2000(Invitrogen),以2种质粒p4CMVE-U6-PylT和pMmPylRS-EGFR(128TAG)-GFP-HA转染细胞。在具有0.1%FBS并含有1mM如所示的2、3或4的DMEM中实施转染。在转染后,将细胞培育16小时并且随后在具有0.1%FBS的无氨基酸DMEM中温育2-5小时。随后将hEGFR-eGFP融合物用200nm四嗪-染料结合物9(tet1-TAMRA-X)如所示那样标记2-16小时,在具有0.1%FBS的DMEM中洗涤10分钟,并且在Zeiss LSM780或Zeiss LSM710激光扫描式显微镜上以Plan Apochromat63x油浸物镜并使用1x或2x扫描缩放成像,平均16。
使用488nm氩激光激发并在493nm和554nm之间检测EGFP。TMR使用DPSS561nm激光激发并在
566-685nm检测。将氨基酸4存在下转染的细胞在转染后培育16至24小时。根据供应商方案,将细胞在具有1%FBS的DPBS中洗涤,与具有1%FBS的DPBS中的DiBO-TAMRA染料
(Invitrogen)温育16小时,在具有1%FBS的DPBS中洗涤4次并且在具有1%FBS的DPBS中成像。
[0469] 参考文献
[0470] 1.Chalfie,M.,Tu,Y.,Euskirchen,G.,Ward,W.W.和Prasher,D.C.Green fluorescent protein as a marker for gene expression.Science263,802-805(1994).[0471] 2.Heim,R.,Prasher,D.C.和Tsien,R.Y.Wavelength  mutations and posttranslational autoxidation of green fluorescent protein.Proc Natl Acad Sci USA91,12501-12504(1994).
[0472] 3.Giepmans,B.N.,Adams,S.R.,Ellisman,M.H.和Tsien,R.Y.The fluorescent toolbox for assessing protein location and function.Science312,217-224,doi:312/5771/217[pii]10.1126/science.1124618(2006).
[0473] 4.Shaner,N.C.,Steinbach,P.A.和Tsien,R.Y.A guide to choosing fluorescent proteins.Nat Methods2,905-909,doi:nmeth819[pii]10.1038/nmeth819(2005).
[0474] 5.Los,G.V.等人,HaloTag:a novel protein labeling technology for cell imaging and protein analysis.ACS Chem Biol3,373-382,doi:10.1021/cb800025k(2008).
[0475] 6.Keppler,A.等人,A general method for the covalent labeling of fusion proteins with small molecules in vivo.Nat Biotechnol21,86-89,doi:10.1038/nbt765nbt765[pii](2003).
[0476] 7.Kosaka,N.等人,In vivo stable tumor-specific painting in various colors using dehalogenase-based protein-tag fluorescent ligands.Bioconjug Chem20,1367-1374,doi:10.1021/bc9001344(2009).
[0477] 8.Gautier,A.等人,An engineered protein tag for multiprotein labeling in living cells.Chem Biol15,128-136,doi:S1074-5521(08)00041-0[pii]10.1016/j.chembiol.2008.01.007(2008).
[0478] 9.George,N.,Pick,H.,Vogel,H.,Johnsson,N.和Johnsson,K.Specific labeling of cell surface proteins with chemically diverse compounds.J Am Chem Soc126,8896-8897,doi:10.1021/ja048396s(2004).
[0479] 10.Zhou,Z.,Koglin,A.,Wang,Y.,McMahon,A.P.和Walsh,C.T.An eight residue fragment of an acyl carrier protein suffices for  post-translational introduction of fluorescent pantetheinyl arms in protein modification in vitro and in vivo.J Am Chem Soc130,9925-9930,doi:10.1021/ja802657n(2008).[0480] 11.Yin,J.等人,Genetically encoded short peptide tag for versatile protein labeling by Sfp phosphopantetheinyl transferase.Proc Natl Acad Sei USA102,15815-15820,doi:0507705102[pii]10.1073/pnas.0507705102(2005).
[0481] 12.Fernandez-Suarez,M.等人,Redirecting lipoic acid ligase for cell surface protein labeling with small-molecule probes.Nat Biotechnol25,1483-1487,doi:nbtl355[pii]10.1038/nbtl355(2007).
[0482] 13.Uttamapinant,C.等人,A fluorophore ligase for site-specific protein labeling inside living cells.Proc Natl Acad Sei USA107,10914-10919,doi:0914067107[pii]10.1073/pnas.0914067107(2010).
[0483] 14.Popp,M.W.,Antos,J.M.,Grotenbreg,G.M.,Spooner,E.和Ploegh,H.L.Sortagging:a versatile method for protein labeling.Nat Chem Biol3,707-
708,doi:nchembio.2007.31[pii]10.1038/nchembio.2007.31(2007).
[0484] 15.Antos,J.M.等人,Site-specific N-and C-terminal labeling of a single polypeptide using sortases of different specificity.J Am Chem Soc131,10800-10801,doi:10.1021/ja902681k(2009).
[0485] 16.Griffin,B.A.,Adams,S.R.和Tsien,R.Y.Specific covalent labeling of recombinant protein molecules inside live cells.Science281,269-272(1998).[0486] 17.Halo,T.L.,Appelbaum,J.,Hobert,E.M.,Balkin,D.M.和Schepartz,A.Selective recognition of protein tetraserine motifs with a cell-permeable,pro-fluorescent bis-boronic acid.J Am Chem Soc131,438-439,doi:10.1021/ja807872s10.1021/ja807872s[pii](2009).
[0487] 18.Hinner,M.J.,Johnsson,K.How to obtain labeled proteins and what to do with them.Curr Opin Biotechnol21,766-776(2010).
[0488] 19.Chin,J.W.等人,Addition of p-azido-L-phenylalanine to the genetic code of Escherichia coli.J Am Chem Soc124,9026-9027,doi:ja027007w[pii](2002).[0489] 20.Zhang,Z.,Wang,L.,Brock,A.和Schultz,P.G.The selective incorporation of alkenes into proteins in Escherichia coli.Angew Chem Int Ed Engl41,2840-2842,doi:10.1002/1521-3773(20020802)41:15<2840::AID-ANIE2840>3,O.CO;2-#(2002).
[0490] 21.Chin,J.W.等人,An expanded eukaryotic genetic code.Science301,964-967,doi:10.1126/science.1084772301/5635/964[pii](2003).
[0491] 22.Deiters,A.等人,Adding amino acids with novel reactivity to the genetic code of Saccharomyces cerevisiae.J Am Chem Soc125,11782-11783,doi:10.1021/ja0370037(2003).
[0492] 23.Deiters,A.,Cropp,T.A.,Summerer,D.,Mukheiji,M.和Schultz,P.G.Site-specific PEGylation of proteins containing unnatural amino acids.Bioorg Med Chem  Lett14,5743-5745,doi:S0960-894X(04)01181-3[pii]10.1016/j.bmcl.2004.09.059(2004).
[0493] 24.Mehl,R.A.el al.Generation of a bacterium with a21amino acid genetic code.J Am Chem Soc125,935-939,doi:10.1021/ja0284153(2003).
[0494] 25.Wang,L.,Zhang,Z.,Brock,A.和Schultz,P.G.Addition of the keto functional group to the genetic code of Escherichia coli.Proc Natl Acad Sci U SA100,56-61,doi:10.1073/pnas.02348241000234824100[pii](2003).
[0495] 26.Carrico,Z.M.,Romanini,D.W.,Mehl,R.A.和Francis,M.B.Oxidative coupling of peptides to a virus capsid containing unnatural amino acids.Chem Commun(Camb),1205-1207,doi:10.1039/b717826c(2008).
[0496] 27.Fekner,T.,Li,X.,Lee,M.M.和Chan,M.K.A pyrrolysine analogue for protein click chemistry.Angew Chem Int Ed Engl48,1633-1635,doi:10.1002/anie.200805420(2009).
[0497] 28.Nguyen,D.P.et al Genetic encoding and labeling of aliphatic azides and alkynes in recombinant proteins via a pyrrolysyl-tRNA Synthetase/tRNA(CUA)pair and click chemistry.J Am Chem Soc131,8720-8721,doi:10.1021/ja900553w(2009).
[0498] 29.Wang,Y.,Song,W.,Hu,W.J.和Lin,Q.Fast alkene functionalization in vivo by Photoclick chemistry:HOMO lifting of nitrile imine dipoles.Angew Chem Int Ed Engl48,5330-5333,doi:10.1002/anie.200901220(2009).
[0499] 30.Agard,N.J.,Baskin,J.M.,Prescher,J.A.,Lo,A.和Bertozzi,C.R.A comparative study of bioorthogonal reactions with azides.ACS Chem Biol1,644-648(2006).
[0500] 31.Wang,J.et al A biosynthetic route to photoclick chemistry on proteins.J Am Chem Soc132,14812-14818,doi:10.1021/jal04350y(2010).
[0501] 32.Nguyen,D.P.,Elliott,T.,Holt,M.,Muir,T.W.和Chin,J.W.Genetically Encoded 1,2-Aminothiols Facilitate Rapid and Site-Specific Protein Labeling via a Bio-orthogonal Cyanobenzothiazole Condensation.J Am Chem Soc133,11418-11421,doi:10.1021/ja203111c(2011).
[0502] 33.Laughlin,S.T.和Bertozzi,C.R.Imaging the glycome.Proc Natl Acad Sci U SA106,12-17,doi:0811481106[pii]10.1073/pnas.0811481106(2009).
[0503] 34.Prescher,J.A.和Bertozzi,C.R.Chemical technologies for probing glycans.Cell126,851-854,doi:S0092-8674(06)01084-l[pii]10.1016/j.cell.2006.08.017(2006).
[0504] 35.Johnson,J.A.,Lu,Y.Y.,Van Deventer,J.A.,Tirrell,D.A.Residue-specific incorporation of non-canonical amino acids into proteins:recent developments and applications.Curr Opin Biotechnol14,774-780(2010).
[0505] 36.Blackman,M.L.,Royzen,M.和Fox,J.M.Tetrazine ligation:fast bioconjugation based on inverse-electron-demand Diels-Alder reactivity.J Am Chem Soc130,13518-13519,doi:10.1021/ja8053805(2008).
[0506] 37.Devaraj,N.K.,Weissleder,R.和Hilderbrand,S.A.Tetrazine-based cycloadditions:application to pretargeted live cell imaging.Bioconjug Chem19,2297-2299,doi:10.1021/bc800444610.1021/bc8004446[pii](2008).
[0507] 38.Devaraj,N.K.和Weissleder,R.Biomedical Applications of Tetrazine Cycloadditions.Acc Chem Res,doi:10.1021/ar200037t(2011).
[0508] 39.Mukai,T.el al.Adding 1-lysine derivatives to the genetic code of mammalian cells with engineered pyrrolysyl-tRNA synthetases.Biochem Biophys Res Commun  371,818-822,doi:S0006-291X(08)00860-7[pii]10.1016/j.bbrc.2008.04.164(2008).
[0509] 40.Neumann,H.,Peak-Chew,S.Y.和Chin,J.W.Genetically encoding N(epsilon)-acetyllysine in recombinant proteins.Nat Chem Biol4,232-234,doi:
nchembio.73[pii]10.1038/nchembio.73(2008).
[0510] 41.Hancock,S.M.,Uprety,R.,Deiters,A.和Chin,J.W.Expanding the genetic code of yeast for incorporation of diverse unnatural amino acids via a pyrrolysyl-tRNA synthetase/tRNA pair.J Am Chem Soc132,14819-14824,doi:10.1021/jal04609m(2010).
[0511] 42.Greiss,S.和Chin,J.W.Expanding the Genetic Code of an Animal.J Am Chem Soc,doi:10.1021/ja2054034(2011).
[0512] 43.Polycarpo,C.R.el al Pyrrolysine analogues as substrates for pyrrolysyl-tRNA synthetase.FEBS Lett580,6695-6700,doi:S0014-5793(06)01347-0[pii]10.1016/j.febslet.2006.11.028(2006).
[0513] 44.Li,X.,Fekner,T.,Ottesen,J.J.和Chan,M.K.A pyrrolysine analogue for site-specific protein ubiquitination.Angew Chem Int Ed Engl48,9184-9187,doi:10.1002/anie.200904472(2009).
[0514] 45.Nguyen,D.P.,Garcia Alai,M.M.,Kapadnis,P.B.,Neumann,H.和Chin,J.W.Genetically encoding N(epsilon)-methyl-L-lysine in recombinant histones.J Am Chem Soc131,14194-14195,doi:10.1021/ja906603s(2009).
[0515] 46.Gautier,A.el al.Genetically encoded photocontrol of protein localization in mammalian cells.J Am Chem Soc132,4086-4088,doi:10.1021/ja910688s(2010).
[0516] 47.Direct oxidation of dihydrotetrazines5a and6a to the corresponding tetrazines lead to compounds,whose amino groups were not susceptible to any further transformation,probably because the amino group looses its nucleophilicity through7i-conjugation with the aromatic rings..
[0517] 48.Wijinen,J.W.,Zavarise,S.,Engberts,J.B.F.N;Cahrton,Ml.J.Substituent Effects on an Inverse Electron Demand Hetero Diels-Alder Reaction in Aqueous Solution and Organic Solvents:Cycloaddition of Substituted Styrenes to Di(2-pyridyl)-1,2,4,5-tetrazine.J Org Chem61,2001(1996).
[0518] 49.Devaraj,N.K.,Hilderbrand,S.,Upadhyay,R.,Mazitschek,R.和Weissleder,R.Bioorthogonal Turn-On Probes for Imaging Small Molecules inside Living Cells.Angew Chem Int Ed Engl49,2869-2872,doi:10.1002/anie.200906120(2010).[0519] 由于我们添加标记物至细胞群体并随后裂解细胞,我们不能排除标记可能在裂解物中发生。
[0520] 实施例3
[0521]
[0522]
[0523] 化学合成:
[0524] 一般方法
[0525] 在Bruker400MHz仪上记录1H和13CNMR谱。相对于TMS并参考氘化溶剂中的残留质子信号报告化学位移(8):CDCl3(7.26ppm)、d6-DMSO(2.49ppm)用于1H-NMR谱、d6-DMSO(39.5ppm)的CDCl3(77.0ppm)用于13C-NMR谱。J值以赫兹给出,并且裂分图样设计如下:s,单峰;s,br,宽阔单峰;d,二重峰;t,三重峰;m,多重峰。在胶60F-254板上实施分析性薄层层析(TLC)。通过紫外线(254nm)和/或通过高锰酸盐染色法显现各个点。在硅凝胶60(230-400目或70-230目)上实施快速柱层析。使用Agilent1200LC-MS系统,用6130四极谱仪实施ESI-MS。溶剂体系由以下组成:H2O中的0.2%甲酸作为缓冲液A和乙腈(MeCN)中的0.2%甲酸作为缓冲液B。使用Phenomenex Jupiter C18柱(150x2mm,5μm)实施小分子LC-MS。使用可变波长并以正离子模式和负离子模式实施MS捕获。
[0526] 降冰片烯赖氨酸2的合成
[0527]
[0528] 补充方案1.Nε-5-降冰片烯-2-基氧-羰基-L-赖氨酸(2)的合成途径
[0529] 将二琥珀酰亚胺碳酸酯(6.3g,0.024mol)在室温添加至(1R,4R)-5-降冰片烯-2-醇(内切/外切混合物,1.5g,0.014mol)和三乙胺(5.7mL,0.041mol)在无水乙腈(50mL)中的溶液。将所产生的混合物搅拌过夜并且随后在真空下浓缩。通过SiO2上柱层析(二氯甲烷中1-5%二乙醚)纯化产物以产生作为白色固体的S2a,82%,7:3endo/exo(2.8g,0.011mol)。
1
Rf(Et2O/DCM,1/99):0.4;H-NMR(300MHz,CDC13):66.32和6.23(mendo,ddexo,J=2.7Hz,1H),
5.94和5.89(mendo,texo,J=3.6Hz,1H),5.28和4.66(mendo,dexo,J=5.7Hz,1H),3.19和3.00(sendo,sexo,1H),2.84(s,1H),2.80(s,4H),2.21-2.13和1.81-1.57(mendo,mexo,1H),1.52-
1.49(m,1H),1.32(d,J=9.0Hz,1H),1.14-1.08(dt,J1=12.9Hz,J2=2.4Hz,1H)ppm;13C-NMR(300MHz,CDC13):6169.02,168.95,151.25,142.10,139.16,131.69,130.90,83.20,
82.76,47.58,47.23,46.23,45.72,42.16,40.52,34.43,25.44ppm;ESI-MS(m/z):[M+Na]+C12H13NO5的计算值为274.0686,测定值为274.0683。
[0530] 将Boc-Lys-OH(3.2g,0.013mol)添加至S2a(2.5g,0.010mol)在无水二甲基甲酰胺(35mL)中的搅拌溶液。允许反应在室温过夜进行。将混合物稀释于水(150mL)中并用乙酸乙酯(150mL x3)提取。将合并的有机层用水(100mL x3)和盐水(75mL)洗涤。将所产生的有机层在Na2SO4上干燥,过滤并在真空下浓缩至干燥。化合物S2b以95%产率(3.6g,9.40mmol)作为米白色泡沫获得。Rf(Et2O/DCM,5/95):0.1;1H-NMR(300MHz,CDC13):69.11(s,br,1H),8.03(s,br,1H),6.30-6.21(m,1H),5.95-5.93(m,1H),5.30和4.59(d,brendo,J=7.2Hz;d,brexo,J=6.9Hz,1H),5.24(s,br,1H),4.86(m,br,1H),4.77(m,br,1H),4.28(s,br,1H),
4.09(m,br,1H),3.12(m,br,2H),2.80(m,br,1H),2.09(m,1H),1.81-1.28(m,br,15H),0.90(d,br,J=12.9Hz,1H)ppm;13C-NMR(300MHz,CDC13):6 175.95,156.76,155.58,140.74,
138.19,132.49,131.43,79.76,75.35,75.14,52.90,47.39,47.20,45.91,45.74,41.95,
40.30,40.14,34.28,31.73,29.14,28.09,22.10,21.75ppm;ESI-MS(m/z):[M+Na]+C19H30N2O6的计算值为405.1996,测定值为405.1983。
[0531] 向S2b(3.3g,8.60mmol)和Et3SiH(2.7ml,0.017mol)在无水二氯甲烷(120mL)中的溶液逐滴添加三氟乙酸(6.4mL,0.086mol),并且允许反应混合物在室温搅拌过夜。将溶剂在降低的压力下蒸发。使残余物再溶解于1M HCl溶液中(1,4-二噁烷中5mL4N HCl,15mL无水甲醇),允许搅拌10分钟并且随后浓缩。后一过程再重复两次以确保彻底交换HCl盐。将浓缩的残余物再溶解于最小量的甲醇中并沉淀至冰冷的二乙醚中,过滤和在真空下干燥,以定量产率(2.7g,8.50mmol)产生作为白色固体氨基酸2。1H-NMR(300MHz,CD3OD):66.30-6.25(m,1H),6.00-5.93(m,1H),5.15和4.52(mendo,mexo,1H),4.85(m,1H),3.55(t,J=5.4Hz,1H),3.07(q,J=6.7Hz,2H),2.81(d,J=6.6Hz,1H),2.13-2.05(m,1H),1.93-1.74(m,2H),
1.68-1.63(m,1H),1.53-1.28(m,5H),0.93-0.87(dt,Jj=12.3Hz,J2=2.7Hz,1H)ppm;13C-NMR(300MHz,CD3OD):6 174.82,159.52,142.37,139.36,133.84,132.80,76.73,76.73,
56.16,47.43,47.13,43.63,41.93,41.42,35.67,32.80,32.07,30.74,28.90,24.22,+
23.63ppm;ESI-MS(m/z):[M+Na]C14H22N2O4的计算值为305.1472;测定值为305.1475。
[0532] 四嗪探针的合成
[0533]
[0534] 补充方案2.这项研究中所用的多种四嗪的合成途径概述。a)4当量肼水合物(64%),12小时,90℃,33%;b)4当量N-叔丁氧羰基甘氨酸,5当量N-甲基吡咯烷酮,3.3当量氯甲酸异丁酯在THF中,0℃-室温,3小时,80%;c)乙酸中的1.5当量硝酸钠,10分钟,室温,65%;d)二噁烷/DCM中的4N HCl,30分钟,室温,100%;e)在DCM中的0.5当量4-二甲氨基吡啶、1.5当量N-叔丁氧羰基乙二胺、1.5当量1-乙基-3-(3-二甲氨基丙基)碳二亚胺,0℃-室温,5小时,90%;f)乙腈中的5当量肼水合物(64%),90℃,12小时,45%;g)1.5当量硝酸钠在乙酸中,10分钟,室温,55%;h)乙醇中的1当量嘧啶-2-甲腈,5当量肼水合物(64%),90℃,12小时,40%;i)乙酸中的1.5当量硝酸钠,10分钟,室温,50%;j)在二噁烷/DCM中的4N HCl,30分钟,室温,100%。THF,四氢呋喃;DCM:二氯甲烷;Boc,N-叔丁氧羰基。
[0535]
[0536] 将等摩尔量的5-氨基-2-氰基吡啶(1.14g,9.6mmol)和2-氰基吡啶(1.00g,9.6mmol)与64%含水肼(1.85ml,38.4mmol)混合并在防爆盾后面加热12小时至90℃。使混合物冷却室温(rt),将橙色沉淀物通过过滤分离,用冷水洗涤并在真空下干燥。将粗制固体溶解于甲醇中,浓缩到二氧化硅凝胶上并且通过在SiO2(二氯甲烷中的0%至3%甲醇)上的层析纯化S5a作为橙色固体(802mg,33%)。Rf(CH2Cl2/MeOH,92/8):0.50;1H-NMR(400MHz,d6-DMSO):δ8.77(s,1H),8.72(s,1H),8.66-8.68(m,1H),7.93-8.03(m,3H),7.71(d,J=8.4Hz,
1H),7.54-7.57(m,1H),7.04-7.07(dd,J1=8.8Hz,J2=2.8Hz.1H),5.93(s,2H)ppm;13C-NMR(400MHz,de-DMSO):δ148.52(CH),147.48(C),146.65(C),146.62(C),146.59(C),137.29(CH),134.15(C),134.06(CH),125.12(CH),121.81(CH),120.76(CH),120.27(CH)ppm;ESI-MS(m/z):[M+H]+C12H11N7的计算值为253.11,测定值为253.3。
[0537] 在相似的实验中,将5-氨基-2-氰基吡啶(1.51g,9.52mmol)和嘧啶-2-甲腈(1.00g,9.52mmol)与64%肼水合物(2.3ml,47.6mmol)在90℃混合12小时,并且通过SiO2上柱层析分离化合物S6a(750mg,31%)。Rf(CH2Cl2/MeOH,92/8):0.50;1H-NMR(400MHz,d6-DMSO):δ8.95(d,J=4.8Hz,2H),8.88(s,1H),8.71(s,1H),7.99(d,J=2.4Hz,1H),7.70(d,J=8.4Hz,1H),7.64(t,J=4.8,1H),7.04-7.07(dd,Ji=8.4,J2=2.4,1H),5.94(s,2H)ppm;13C-NMR(400MHz,d6-DMSO):δ157.62(CH),156.12(C),146.66(C),146.11(C),146.00(C),134.09(CH),133.96(C),121.96(CH),121.92(CH),120.28(CH)ppm;ESI-MS(m/z):[M+H]+C11H10N8的计算值为254.10,测定值为254.3。
[0538]
[0539] 向N-(叔丁氧羰基)甘氨酸(1.66g,9.48mmol)在无水THF中的搅拌溶液添加N-甲基吡咯烷酮(1.3ml,11.85mmol)。将反应混合物冷却至0℃,之后逐滴添加氯甲酸异丁酯(1.0ml,7.82mmol)。白色沉淀物瞬间形成并且将混合物在0℃搅拌,之后逐份添加无水THF(15ml)中的3-(5-氨基吡啶-2-基)-6-(吡啶-2-基)-1.4-二氢-s-四嗪S5a(600mg,2.37mmol)。伴随搅拌允许反应加温至室温,并且在3小时后,通过TLC分析判断反应完成。将溶剂蒸发并且残余物溶解于二氯甲烷中。溶液用5%柠檬酸、水和饱和碳酸氢钠溶液提取。
在Na2SO4上干燥有机层并且通过SiO2上柱层析(二氯甲烷中0%至4%甲醇)分离产物S5b(778mg,80%)。Rf(CH2Cl2/MeOH,95/5):0.70;1H-NMR(400MHz,de-DMSO):δ10.41(s1H),8.94(s,1H),8.88(s,1H),8.24-8.29(d,J=2.0Hz,1H),8.63-8.65(m,1H),8.15-8.17,dd,J1=
8.8,J2=2.4Hz,1H),7.92-7.99(m,3H),7.52-7.55(m,1H),7.13(t,J=6.0Hz,1H),3.78(d,J=6.0Hz,2H),1.39(s,9H)ppm;13C-NMR(400MHz,d6-DMSO):δ169.12(C),155.80(C),148.56(CH),147.27(C),146.30(C),146.02(C),141.57(C),138.91(CH),137.35(CH),136.95(C),
126.75(CH),125,265(CH),121.39(CH),120.92(CH),78.13(C),43.81(CH2),28.16(3×CH3)ppm;ESI-MS(m/z):[M+H]+C19H22N8O3的计算值为410.18,测定值为410.2。
[0540] 通过S6a(500mg,1.96mmol)与无水THF中的N-叔丁氧羰基甘氨酸(1.37g,7.84mmol)、氯甲酸异丁酯(883mg,840μl,6.47mmol)和N-甲基吡咯烷酮(991mg,1.08ml,
9.8mmol)反应,以相似方式合成化合物S6b(605mg,75%)。Rf(CH2Cl2/MeOH,95/5):0.70;1H-NMR(400MHz,de-DMSO):δ10.42(s,1H),9.05(s,1H),8.93(d,J=4.8Hz,2H),8.89(s,1H),
8.82(m,1H),8.14-8.19(m,1H),7.93-7.96(m,1H),7.62(t,J=4.8Hz,1H),7.13(t,J=
6.0Hz,1H),3.79(d,J=6.0Hz,2H),1.41(s,9H)ppm;13C-NMR(400MHz,d6-DMSO):δ169.14(C),157.66(2×CH),155.98(C),155.91(C),145.64(C),145.55(C),141.40(C),138.95(CH),136.98(C),126.77(CH),122.08(CH),121.49(CH),78.14(C),43.82(CH2),27.34(3×CH3)ppm;ESI-MS(m/z):[M+H]+C18H21N9O3的计算值为411.18,测定值为411.3。
[0541]
[0542] 在室温向S5b(200mg,0.49mmol)在乙酸(10ml)中的搅拌溶液添加亚硝酸钠(50mg,0.73mmol)。在10分钟后,将反应混合物用二氯甲烷稀释并用半饱和碳酸氢钠溶液提取几次。在Na2SO4上干燥有机层并蒸发溶剂。在SiO2(二氯甲烷中的0%至8%甲醇)上的柱层析提供作为粉红色固体的5(130mg,65%)。Rf(CH2Cl2/MeOH,9/1):0.50;1H-NMR(400MHz,d6-DMSO):δ10.62(s,1H),9.06(d,J=2.28,1H),8.94(m,1H),8.65(d,J=8.68,1H),8.60(d,J=7.88,1H),8.43(dd,J1=8.68,J2=2.36,1H),8.16(dt,J1=7.76,J2=1.72,1H),7.73(ddd,J1=7.76,J2=1.72,1H),7.18(t,J=6.0Hz,1H),3.85(d,J=6.0Hz,1.42,s9H)ppm;
13C-NMR(400MHz,d6-DMSO):δ169.5(C),163.0(C),162.7(C),156.0(C),150.6(CH),150.2(C),144.0(C),141.3(CH),138.2(C),137.8(CH),126.5(CH),126.3(CH),124.9(CH),124.2(CH),78.2(CH2),43.9(C),28.2(CH3)ppm;ESI-MS(m/z):[M+H]+C19H2ON8O3的计算值为
408.17,测定值为408.2.
[0543] 相似条件下用NaNO2(38mg,0.55mmol)氧化S6b(150mg,0.36mmol)产生88mg(60%)化合物6。Rf(CH2Cl2/MeOH,9/1):0.50;1H-NMR(400MHz,de-DMSO):δ10.64(s,1H),9.21(d,J=4.8Hz,2H),9.07(d,J=2.4Hz,1H),8.67(d,J=8.8Hz,1H),8.43-8.46(dd,Jj=8.8Hz,J2=2.4Hz,1H),7.84(t,7=4.8,1H),7.18(t,J=6.0,1H),3.84(d,J=6.0Hz,1H),1.42(s,9H)ppm;"C-NMR(400MHz,d6-DMSO):δ169.4(C),162.76(C),162.68(C),159.09(C),158.47(CH),155.95(C),143.78(C),141.34(C),138.33(C),126.22(CH),125.30(CH),122.95(CH),78.18(C),43.93(CH2),28.18(3×CH3)ppm;ESI-MS(m/z):[M+H]+C18H19N9O3的计算值为
409.16,测定值为409.4。
[0544]
[0545] 向化合物5(100mg,0.24mmol)在无水二氯甲烷(4ml)中的搅拌溶液添加二噁烷(2ml)中的4N HCl溶液,并且允许反应混合物在室温搅拌30分钟,在此时间后,通过LC-MS和TLC分析观察到原料完全消耗。将反应混合物在降低的压力下浓缩至干燥,以产生作为HCl盐的化合物S5c(85mg,100%)。认为粗制材料纯到足以用于后续反应。1H-NMR(400MHz,d6-DMSO):δ11.7(s,1H),9.13(d,J=2.4Hz,1H),8.87-8.89(m,1H),8.61(d,J=8.8Hz,1H),8.56(d,J=8.0Hz,1H),8.38-8.41(dd,J1=8.8Hz,J2=2.4Hz,1H和s,br,2H),8.12-8.16(dt,J1=7.6Hz,J2=1.8Hz,1H),7.69-7.72(m,1H),3.88(m,2H)ppm;13C-NMR(400MHz,d6-DMSO):δ166.08(C),162.81(C),162.67(C),150.24(CH),147.90(C),144.40(C),141.21(CH),138.35(CH),137.76(C),126.79(CH),126.61(CH),125.06(CH),124.32(CH),41.20(CH2)ppm;ESI-MS(m/z):[M+H]+C14H12N8O的计算值为308.11,测定值为308.3。
[0546] 在相似酸性条件下对化合物6(150mg,0.37mmol)去保护提供作为HCl盐的化合物S6c(126mg,100%)。1H-NMR(400MHz,de-DMSO):δ11.79(s,1H),9.13(m,3H),8.62(d,J=4.4Hz,1H),8.38-8.41(m,br,3H),7.77(t,J=4.8Hz,1H),3.88(m,2H)ppm;13C-NMR(400MHz,d6-DMSO):δ166.11(C),162.77(C),162.58(C),159.02(C),158.49(2×CH),144.19(C),
141.21(CH),137.90(C),126.61(CH),125.40(CH),122.99(CH),43.58(CH2)ppm;ESI-MS(m/z):[M+H]+C13H11N9O的计算值为309.11,测定值为309.5。
[0547]
[0548] 向6-氰基烟酸(500mg,3.38mmol)在无水二氯甲烷(30ml)中的搅拌溶液添加4-二甲氨基吡啶(DMAP,206mg,1.69mmol)并且将溶液冷却至0℃。逐份添加N-Boc-乙二胺(811mg,800ul,5.06mmol)和1-乙基-3-(3-二甲氨基丙基)碳二亚胺(EDCI,971mg,5.06mmol)并允许反应混合物加温至室温并搅拌5小时。将反应混合物用二氯甲烷稀释,用
5%柠檬酸和饱和碳酸氢钠溶液提取,并且在Na2SO4上干燥有机层。蒸发溶剂斌并且化合物S7a(882mg,90%)可以在不作进一步纯化的情况下用于下一个步骤。Rf(CH2Cl2/MeOH,9/1):
0.50;1H-NMR(400MHz,d6-DMSO):δ9.11(s,1H),8.88(t,J=5.2Hz,1H),8.37-8.40(m,1H),
8.14-8.19(M,1H),6.93(t,J=5.6Hz,1H),3.30-3.33(m,2H),3.11-3.18(m,2H),1.37(s,
13
9H)ppm;C-NMR(400MHz,d6-DMSO):δ163.50(C),155.70(C),149.79(CH),136.61(CH),
134.12(C),133.01(C),128.75(CH),117.12(C),77.66(C),39.92(CH2),39.71(CH2),28.18(3×CH3)ppm;ESI-MS(m/z):[M+H]+C14H18N4O3的计算值为290.14,测定值为290.5。
[0549]
[0550] 向干燥圆底烧瓶充入化合物S7a(150mg,0.52mmol)和在无水乙腈(2ml)中的64%肼水合物(130μl,2.58mmol)。将烧瓶装上回流冷凝器,并将混合物在防爆盾后加热到90℃、12小时。允许反应混合物冷却至室温,蒸发溶剂,将残余物溶解于二氯甲烷中并用5%柠檬酸和饱和碳酸氢钠溶液提取。将有机层在硫酸钠上干燥并在真空下浓缩至干燥以提供纯度足够用于下一个步骤的化合物S7b(84mg,45%)。Rf(CH2Cl2/MeOH,94/6):0.50;1H-NMR(400MHz,d6-DMSO):δ9.04(s,1H),8.82(t,J=5.2Hz,1H),8.31(d,J=8.0,1H),8.04(d,J=
8.0,1H),7.00(m,1H),3.36(m,2H),3.18(m,2H),1.87(s,3H),1.42(s,9H)ppm;13C-NMR(400MHz,d6-DMSO):δ164.28(C),155.69(C),149.43(C),147.51(C),147.42(CH),145.28(C),135.99(CH),130.61(C),120.11(CH),77.65(C),39.62(CH2),39.37(CH2),28.19(3×CH3),15.60(CH3)ppm;ESI-MS(m/z):[M+H]+C16H23N7O3的计算值为361.19,测定值为361.5。
[0551]
[0552] 将等摩尔量的S7a(1.28g,4.4mmol)和嘧啶-2-甲腈(462mg,4.4mmol)与乙醇(5ml)中的64%肼水合物(1.06ml,22.0mmol)混合并在防爆盾后加热至90℃、12小时。允许混合物冷却至室温(rt),蒸发溶剂,将残余物溶解于乙酸乙酯中并用5%柠檬酸和饱和碳酸氢钠溶液提取。将有机层在Na2SO4上干燥并在真空下蒸发至干燥以提供化合物S8b(748mg,40%),其中认为所述化合物S8b纯到足以用于后续步骤。Rf(CH2Cl2/MeOH,96/4):0.50;1H-NMR(400MHz,d6-DMSO):δ9.24(s,1H),9.12(s,1H),9.09(m,1H),8.99(d,J=4.8Hz,2H),8.82(m,1H),8.33-8.72(m,1H),8.10(d,J=8.4Hz,1H),7.68(t,J=8.4Hz,1H),7.68(t,J=4.8Hz,1H),6.98(t,J=5.8Hz,1H),3.25-3.38(m,2H),3.18-3.20(m,2H),1.41(s,9H)ppm;
13C-NMR(400MHz,d6-DMSO):δ171.18(C),164.25(C),157.69(2×CH),155.86(C),155.70(C),148.84(C),148.75(C),147.52(CH),136.19(CH),131.15(C),122.17(CH),120.61(CH),77.66(C),39.65(CH2),39.37(CH2),28.19(3×CH3)ppm;ESI-MS(m/z):[M+H]+C19H23N9O3的计算值为425.19,测定值为425.5。
[0553]
[0554] 在室温向S7b(75mg,0.21mmol)在乙酸(3ml)中的搅拌溶液添加亚硝酸钠(22mg,0.31mmol)。在10分钟后,将反应混合物用二氯甲烷稀释并用半饱和碳酸氢钠溶液提取几次。在Na2SO4上干燥有机层并蒸发溶剂。在SiO2(二氯甲烷中的0%至4%甲醇)上的柱层析提供作为粉红色固体的7(40mg,55%)。Rf(CH2Cl2/MeOH,94/6):0.40;1H-NMR(400MHz,d6-DMSO):δ9.27(s,1H),8.89(t,J=5.2Hz,1H),8.61(d,J=8.4Hz,1H),8.46-8.49(dd,J1=
8.4Hz,J2=2.0Hz,1H),6.97(t,J=5.8Hz,1H)3.35(m,2H),3.08(s,3H),3.17(m,2H),1.40(s,9H)ppm;13C-NMR(400MHz,de-DMSO):δ167.61(C),164.28(C),162.85(C),155.73(C),
152.02(C),149.17(CH),136.59(CH),131.64(C),123.28(CH),77.67(C),39.74(CH2),
39.37(CH2),28.21(3×CH3),20.97(CH3)ppm;ESI-MS(m/z):[M+H]+C16H21N7O3的计算值为
359.17,测定值为359.6。
[0555]
[0556] 在室温向S8b(200mg,0.47mmol)在乙酸(10ml)中的搅拌溶液添加亚硝酸钠(48.6mg,0.71mmol)。在10分钟后,将反应混合物用二氯甲烷稀释并用半饱和碳酸氢钠溶液提取几次。在Na2SO4上干燥有机层并蒸发溶剂。在SiO2(二氯甲烷中的0%至8%甲醇)上的柱层析提供作为粉红色固体的8(100mg,50%)。Rf(CH2Cl2/MeOH,9/1):0.50;1H-NMR(400MHz,d6-DMSO):δ9.38(d,J=1.2Hz,1H),9.28(d,J=4.8Hz,2H),8.98-9.01(t,J=5.4Hz,1H),8.80(d,J=8.4Hz,1H),8.57-8.59(dd,J1=8.2Hz,J2=1.8Hz,1H),7.91-7.93(t,J=4.8Hz,
1H),7.03-7.05(t,J=5.8Hz,1H),3.43-3.45(m,2H),3.19-3.26(m,2H),1.44(s,9H)ppm;
13C-NMR(400MHz,de-DMSO):δ164.24(C),162.94(2×C),158.98(C),158.54(2×CH),155.74(C),151.64(C),149.34(CH),136.67(CH),132.16(C),124.17(CH),123.09(CH),77.68(C),
39.77(CH2),39.38(CH2),28.22(3×CH3)ppm;ESI-MS(m/z):[M+H]+C19H21N9O3的计算值为
423.18,测定值为423.5。
[0557]
[0558] 向化合物8(200mg,0.47mmol)在无水二氯甲烷(4ml)中的搅拌溶液添加二噁烷(2ml)中的4N HCl溶液,并且允许反应混合物在室温搅拌45分钟,在此时间后,通过LC-MS和TLC分析观察到原料完全消耗。将反应混合物在降低的压力下浓缩至干燥,以产生作为HCl盐的化合物S8c(170mg,100%)。认为粗制材料纯到足以用于后续反应。1H-NMR(400MHz,d6-DMSO):δ9.44(s,1H),9.34-9.37(t,J=5.2Hz,1H),9.24(d,J=4.8Hz,1H),8.77(m,1H),8.63-8.67(m,1H),8.24(s,br,2H),7.87-7.89(t,J=4.8Hz,1H),3.62-3.66(m,2H),3.06-
3.09(m,2H)ppm;13C-NMR(400MHz,d6-DMSO):δ164.66(C),162.93(C),158.95(C),158.55(2×CH),151.78(C),149.59(CH),136.90(CH),131.68(C),124.12(CH),124.12(CH),123.11(CH),66.31(CH2)ppm;ESI-MS(m/z):[M+H]+C14H13N9O的计算值为323.12,测定值为323.3。
[0559] 用于合成四嗪-荧光团结合物的一般方法
[0560] 向适宜荧光团(15μmol)在无水dmf中的琥珀酰亚胺酯或异硫氰酸酯的溶液,添加相应的四嗪HCl盐S5c、S6c或S8c(30μmol)和N,N-二异丙基乙胺(45μmol)并且将反应混合物于黑暗下搅拌。通过LC-MS跟踪反应进程并且在几小时后,通过原料的消耗判断反应完成。将溶剂蒸发并且在真空下干燥残余物。使用20%至85%缓冲液B在缓冲液A中的梯度(缓冲液A:H2O,0.1%TFA;缓冲液B:乙腈,0.1%TFA),通过制备性反相HPLC纯化产物。通过LC-MS证实结合物本身和纯度(见补充表2和补充图4)
[0561] 在以上说明书中提到的全部出版物在本文中通过引用的方式并入。本发明所述方面和实施方案的多种修改和变化对于本领域技术人员将显而易见,而不脱离本发明的范围。虽然已经联系具体的优选实施方案描述本发明,应当理解所主张的本发明不应不当地受限于此类具体的实施方案。实际上,所述用于实施本发明的模式的本领域技术人员显而易见的多种修改应当属于以下权利要求书的范围内。
QQ群二维码
意见反馈