首页 / 国际专利分类库 / 化学;冶金 / 组合化学 / 组合化学;化合物库,如化学库、虚拟库 / 用于蛋白性分子的标记和亲和力选择的化合物和方法

用于蛋白性分子的标记和亲和选择的化合物和方法

申请号 CN200980111901.5 申请日 2009-04-02 公开(公告)号 CN102099685A 公开(公告)日 2011-06-15
申请人 皇家飞利浦电子股份有限公司; 发明人 R·霍夫曼; E·P·罗米恩; E·H·C·迪克森;
摘要 本 发明 涉及用于蛋白性分子的同位素/同量异位素标记以及后续亲和选择和分析的 试剂 盒 和方法。特别地,本发明涉及包括用于标记蛋白性分子的组合的多种标记试剂的由各部分组成的试剂盒,每种标记试剂包括同量异位素标记组分、同位素标记组分和能够与蛋白性分子反应的反应基团,其中同位素标记组分同时是亲和标记物。本发明还涉及用于分析蛋白性分子的相应方法,其包括通过采用如本文定义的由各部分组成的试剂盒标记存在的至少一个蛋白性分子亚组,和随后经由标记中包括的亲和标记物,通过亲和纯化来分离标记的分子。最后,本发明涉及此类方法用于 蛋白质 表达概况分析或蛋白质组分析的用途。
权利要求

1.由各部分组成的试剂盒,其包括用于标记蛋白性分子的n·m种组合的多种标记试剂,每种标记试剂包括:
(a)同量异位素标记组分;
(b)同位素标记组分,其同时是亲和标记物;和
(c)能够与蛋白性分子反应的反应基团;
其中所述整数n≥4,并且代表差异标记的同量异位素标记组分的数目;并且其中所述整数m≥2,并且代表差异标记的同位素标记组分/亲和标记物的数目。
2.权利要求1的由各部分组成的试剂盒,其中所述同位素标记/亲和标记物选自(His)6标记物、(His)4标记物、(His)3标记物、(His)2标记物、(Leu)4标记物、(Leu)3标记物、(Leu)2标记物、c-Myc标记物、HA标记物、FLAG标记物、VSV-G标记物、HSV标记物、V5标记物、生物素及其衍生物、化合物和聚糖。
3.权利要求2的由各部分组成的试剂盒,其中所述同位素标记/亲和标记物选自(His)6标记物、(His)4标记物、(His)3标记物、(His)2标记物、(Leu)4标记物、(Leu)3标记物和(Leu)2标记物。
4.权利要求1-3中任一项的由各部分组成的试剂盒,其中所述标记试剂具有这样的构型:其中所述同位素标记组分/亲和标记物排列在所述同量异位素标记组分和所述反应基团之间。
5.权利要求1-3中任一项的由各部分组成的试剂盒,其中所述标记试剂具有这样的构型:其中所述同量异位素标记组分排列在所述同位素标记组分/亲和标记物和所述反应基团之间。
6.权利要求1-5中任一项的由各部分组成的试剂盒,其中所述反应基团选自基反应基团、巯基反应基团和羧基反应基团。
7.用于分析一个或多个样品中的一种或多种蛋白性分子的方法,其包括
(a)提供如权利要求1-6中任一项限定的由各部分组成的试剂盒,所述由各部分组成的试剂盒包括n·m种组合的多种标记试剂;
(b)通过使所述一个或多个样品各自与所述n·m种标记试剂中的另一种单个接触,标记所述一个或多个样品中包括的至少一个蛋白性分子亚组;
(c)使一个或多个样品组合;
(d)经由所述标记中包括的所述亲和标记物,通过亲和纯化分离所述标记的至少一个蛋白性分子亚组;和
(e)分析所述分离的至少一个蛋白性分子亚组。
8.权利要求7的方法,其用M·N个样品执行,其中所述整数M代表样品组的数目,并且所述整数N代表每个样品组的单个成员的数目,并且其中N=n且M=m。
9.权利要求7或8的方法,其进一步包括:在执行步骤(b)前,将所述蛋白性分子切割成肽。
10.权利要求7-9中任一项的方法,其进一步包括:在执行步骤(e)前,将所述分离的至少一个蛋白性分子亚组分级分离。
11.权利要求7-10中任一项的方法,其中所述分离的至少一个蛋白性分子亚组的分析借助于质谱法执行。
12.权利要求7-11中任一项的方法,其进一步包括:比较所述一个或多个样品各自在步骤(e)中获得的分析结果。
13.权利要求7-12中任一项的方法,其中所述方法以高通量形式执行。
14.权利要求1或6的任一项的由各部分组成的试剂盒用于执行蛋白质表达概况分析或用于执行蛋白质组分析的用途。

说明书全文

用于蛋白性分子的标记和亲和选择的化合物和方法

[0001] 发明主题
[0002] 本发明涉及用于通过使蛋白性分子的同位素和同量异位素双重标记与其借助于同时充当同位素标记组分的亲和标记物的后续亲和纯化偶联,从复杂样品分离和后续分析蛋白性分子的化合物、和优选地包括此类化合物的试剂盒以及方法。
[0003] 发明背景
[0004] 从复杂样品鉴定、分离和分析特定蛋白质或蛋白质亚组对于揭示生物过程如何在分子平上发生或蛋白质在各种细胞类型中或在生理学状态之间不同至何种程度是极有价值的。
[0005] 现代生物学中的主要挑战涉及由生物编码的完整蛋白质组的表达、功能和调节的理解,即,通常称为蛋白质组学的技术领域。然而,因为不存在扩增蛋白质的可能性,所以这个领域中的研究一般是相当繁重的,因为即使相对简单的原核生物的细胞提取物也包含包括巨大浓度范围的许多蛋白质。因此,此类任务超出了任何目前简单分析法的能力。
[0006] 因此,由于方法约束,蛋白质组分析不仅依赖于鉴定且定量蛋白质的方法,还在相当大的程度上也依赖于根据其结构和/或功能性质允许其精确和可靠分离的方法,其中这些亚组随后更容易用于进一步分析。
[0007] 蛋白质组具有动态性质,其响应外部刺激或细胞环境中的改变而在蛋白质合成、激活和/或翻译后修饰中有改变。因此,蛋白质组的固有复杂性超过基因组或转录组(细胞的mRNA互补序列)的复杂性。
[0008] 由于在此类蛋白质组学研究中待处理的超乎寻常的数据量,蛋白质/肽鉴定过程需要极大的分辨能力。通常用于分辨此类高度复杂混合物的两种方法是二维凝胶电泳(2D-GE;参照例如,O′Farrell,P.H.(1975)J.Biol.Chem.250,4007-4021)和(二维)液相色谱((2D)-LC;参照例如,Lipton,M.S.等人(2002)Proc.Natl.Acad.Sci.USA 99,11049-11054)。通过2D-GE或2D-LC分离的肽和蛋白质通常通过质谱法或通过测定基酸组成和/或氨基酸序列进行鉴定。
[0009] 然而,尽管对于许多应用有用,但这些鉴定技术就待研究高度复杂样品的蛋白质组学研究而言具有较大缺点。例如,疏水膜蛋白质、高性或酸性蛋白质、极大或极小蛋白质经由2D-GE通常弱分辨。此外,这些方法的检测(灵敏度)限制以及标记技术中的不足不允许多个样品的平行可靠分析,例如比较不同疾病组之间、疾病的不同进展阶段和疾病状态与健康对照之间的相对蛋白质水平,或用于执行高通量筛选分析例如蛋白质表达概况分析或蛋白质生物标记的鉴定。
[0010] 目前,存在使得能够鉴定和表征给定样品中的特定蛋白质的几种可用技术,例如质谱法。然而,总体蛋白质组研究一般由于检测的有限灵敏度而被妨碍。因此,需要可能干扰进一步分析的另外分级分离、富集或选择步骤(例如,通过亲和纯化),以便减少样品的复杂性。决定统计上显著的测定结果中的另一个问题是多个样品之间蛋白质表达的差异的相对定量。因此,高度希望开发克服上述局限性且使得能够平行处理多个重复杂样品的方法,以便减少不同的单个样品之间的方法学变异性,并且因此增加所获得的测定结果的统计学显著性。
[0011] 近来,已开发了用于蛋白质标记的两种不同方法以便解决这个目标。
[0012] 第一种技术被称为同位素编码的亲和标记物(Isotope-Coded Affinity Tag)(ICAT)技术,且允许基于关联蛋白质混合物的差异同位素标记的定量蛋白质组分析(参照Gygi等人(1999)Nat.Biotechnol.17,994-999)。即,这种标记方法采用一组标记,其具有相同化学式,但在一种或多种原子中存在的同位素数目和/或类型方面彼此不同,导致质量差异。所述的ICAT试剂使用3种功能元件:用于选择性标记被还原的半胱氨酸残基的硫醇反应基团、允许选择性分离半胱氨酸标记的肽的生物素亲和标记物、和以两种同位素形2 13
式——“轻”(非同位素)或“重”(利用 H或 C)形式合成的同位素标记物。因为给定样品中仅相对中等数目的蛋白质在其一级序列中包含半胱氨酸残基,所以导致样品的复杂性降低,这随后促进后续样品处理的可靠性。
[0013] 可替代方法利用被称为用于相对和绝对定量的同量异位素标记物(Isobaric Tag for Relative and Absolute Quantitation)(iTRAQ;参照Ross,P.L.等人(2004)Mol.Cell.Proteomics 3,1154-1169)的同量异位素标记的试剂。这种方法采用4种不同试剂,其各自包含报道基团、平衡基团和与伯胺基团反应的肽反应基团。报道基团具有114、115、12 13 16 18
116或117Da的质量,这取决于每种试剂中 C/ C和 O/ O的差异同位素组合。平衡基团的质量从31到28Da不等,以确保报道基团和平衡基团的组合质量对于4种试剂保持恒定(145Da)。因此,用这些试剂各自标记相同肽得到同量异位且因此可用色谱法彼此区分的肽(即,所有促成在MS分析中观察到且用于CID的一个离子种类)。然而,在MS/MS串联质谱法过程中,至少各自的报道基团在碰撞诱导的解离(CID)后释放,显示114-117Da的独特质量。这些片段的强度可以用于在单次实验中定量单个蛋白质和/或肽。这导致信号强度增加,且因此正确鉴定肽特别是低丰度肽的可能性增加。
[0014] 上述ICAT和iTRAQ技术允许两种(ICAT)或最高达4种(iTRAQ)单个样品的多路技术且允许使其同时处理,从而使技术变异性降到最低。然而,这两种方法都具有明显局限性。
[0015] ICAT方法即使允许快速筛选蛋白质表达差异,但局限于仅两种样品例如两个疾病组的研究,其通常不代表疾病相关组(例如,疾病的不同进展阶段)的完全谱。因此,具有允许研究超过两个组的可用技术将是有利的。
[0016] 另一方面,iTRAQ技术尽管允许多样品分析,但具有明确缺点:它需要对每种MS信号(对于未标记和标记的蛋白质和/或肽)执行MS/MS扫描用于信号的相对定量。在实践中,当原材料具有高度复杂性例如在人血清或其他体液中时,这是不可行的,因为分析将是非常费时的。
[0017] 因此,仍需要用于蛋白性分子的改良标记试剂和包括此类标记试剂的试剂盒,以及克服上述局限性且使得能够平行处理多个复杂样品的相应标记方法。特别地,希望提供同时允许标记的蛋白性分子的后续选择性纯化和分析的标记方法。
[0018] 发明目的和简述
[0019] 本发明的目的是提供用于对来自复杂样品的蛋白性分子进行标记以及后续分离和分析的新化合物和相应方法。更具体而言,本发明的一个目的是提供用于平行执行多个此类分析的方法。
[0020] 通过独立权利要求的主题实现从下述描述显而易见的这个目的以及其他目的。
[0021] 本发明的某些优选实施方案由从属权利要求的主题限定。
[0022] 在第一个方面,本发明涉及用于标记蛋白性分子的标记试剂,其包括:
[0023] (a)同量异位素标记组分;
[0024] (b)同位素标记组分;和
[0025] (c)能够与蛋白性分子反应的反应基团;
[0026] 其中同位素标记组分同时是亲和标记物。
[0027] 在一个优选实施方案中,本发明涉及由各部分组成的试剂盒(kit-of-parts),其包括用于标记蛋白性分子的n·m种组合的多种标记试剂(a combinatorial plurality of n·m labeling reagents),每种标记试剂包括:
[0028] (a)同量异位素标记组分;
[0029] (b)同位素标记组分,其同时是亲和标记物;和
[0030] (c)能够与蛋白性分子反应的反应基团;
[0031] 其中整数n≥2,并且代表差异标记的同量异位素标记组分的数目,并且[0032] 其中整数m≥2,并且代表差异标记的同位素标记组分/亲和标记物的数目。特别优选地,整数n≥2,并且整数m≥2。在一个优选实施方案中,同位素标记/亲和标记物选自(His)6标记物、(His)4标记物、(His)3标记物、(His)2标记物、(Leu)4标记物、(Leu)3标记物、(Leu)2标记物、c-Myc标记物、HA标记物、FLAG标记物、VSV-G标记物、HSV标记物、V5标记物、生物素及其衍生物、水化合物和聚糖,其中由(His)6标记物、(His)4标记物、(His)3标记物、(His)2标记物、(Leu)4标记物、(Leu)3标记物和(Leu)2标记物组成的组是特别优选的。
[0033] 在另一个优选实施方案中,标记试剂具有这样的构型:其中同位素标记组分/亲和标记物排列在同量异位素标记组分和反应基团之间。
[0034] 在一个进一步的可替代实施方案中,标记试剂具有这样的构型:其中同量异位素标记组分排列在同位素标记组分/亲和标记物和反应基团之间。
[0035] 在一个进一步优选的实施方案中,反应基团选自氨基反应基团、巯基反应基团和羧基反应基团。
[0036] 在第二个方面,本发明涉及用于分析一个或多个样品中的一种或多种蛋白性分子的方法,其包括:
[0037] (a)提供如本文定义的由各部分组成的试剂盒,所述由各部分组成的试剂盒包括n·m种组合的多种标记试剂;
[0038] (b)通过使一个或多个样品各自与n·m种标记试剂中的另一种单个接触,标记一个或多个样品中包括的至少一个蛋白性分子亚组;
[0039] (c)使一个或多个样品组合;
[0040] (d)经由标记中包括的亲和标记物,通过亲和纯化分离标记的至少一个蛋白性分子亚组;和
[0041] (e)分析分离的至少一个蛋白性分子亚组。
[0042] 在一个优选实施方案中,该方法用M·N个样品执行,其中整数M代表样品组的数目,并且整数N代表每个样品组的单个成员的数目,并且其中N=n且M=m。
[0043] 在一个实施方案中,该方法进一步包括在执行步骤(c)前,将蛋白性分子切割成肽。
[0044] 在另一个实施方案中,该方法进一步包括在执行步骤(f)前,将分离的至少一个蛋白性分子亚组分级分离。
[0045] 在本发明方法的一个优选实施方案中,分离的至少一个蛋白性分子亚组的分析通过质谱法执行。
[0046] 在另一个优选实施方案中,该方法进一步包括:比较一个或多个样品各自在步骤(f)中获得的分析结果。特别优选地,该方法以高通量形式执行。
[0047] 在最后一个方面,本发明涉及如本文定义的由各部分组成的试剂盒用于执行蛋白质表达概况分析或用于执行蛋白质组分析的用途。
[0048] 本发明的其他实施方案从下文的详述将是显而易见的。附图说明
[0049] 图1描述本发明的标记试剂的两种代表构型的示意性举例说明,其优选包括在本文定义的由各部分组成的试剂盒中。在构型(a)中,同位素标记组分/亲和标记物排列在同量异位素标记组分和反应基团之间。在构型(b)中,同量异位素标记组分/亲和标记物排列在同位素标记组分/亲和标记物和反应基团之间。
[0050] 图2描述本发明的方法用于分析两个不同样品组(例如,代表疾病阶段和健康对照)的应用的示意性举例说明,每个组包括4个成员(例如,分别代表不同患者和健康受试者)。8个单个样品指定为S1-S8(S1-S4代表第一个样品组,并且S5-S8代表第二个样品组)。在样品处理(例如,高度丰富蛋白质的消除和/或蛋白水解切割)后,每个样品用本发明的不同标记试剂进行标记。对于第一个样品组,使用同位素标记1(“IT1”),而对于第二个样品组,使用同位素标记2(“IT2”)。重要的是,IT1和IT2同时是亲和标记物。两个样品组因此可以通过质谱(MS)分析中的特征性质量差异加以区分。在样品组内的单个成员分别用不同的同量异位素标记(指定为“IB1”-“IB4”)进行标记。因此,每个样品组的4个成员可以在串联MS/MS分析中加以区分。随后,使单个样品组合,并且经由标记中包括的亲和标记物(即,IT1和IT2),通过亲和色谱纯化标记的蛋白质和/或肽。使纯化的蛋白质和/或肽分离,任选分级分离且通过质谱法分析。通过比较两个样品组的结果,可以测定蛋白质表达的差异。
[0051] 图3描述在本发明的标记试剂和优选地在本发明的由各部分组成的试剂盒中待用作同位素标记/亲和标记物的代表性寡组氨酸(His)化合物。图3A显示(His)2(7)、(His)3(8)和(His)4(9)化合物的化学结构,其可以使用一种或多种原子中的不同同位素进行合成。图3B显示作为合成途径起始步骤的组氨酸侧链甲基化(参照Recueil Trav.Chim.Pays-Bas(1978)97,281)。最后,图3C示意性举例说明图3A中显示的3种化合物的合成途径。
[0052] 图4描述在本发明的标记试剂和优选地在本发明的由各部分组成的试剂盒中待用作同位素标记/亲和标记物的代表性寡亮氨酸(Leu)化合物。图4A显示(Leu)2(24)、(Leu)3(25)和(Leu)4(26)化合物的化学结构,其可以使用一种或多种原子中的不同同位素进行合成。图4B示意性举例说明图4A中显示的3种化合物的合成途径。
[0053] 图5描述图4A中显示的(Leu)3化合物的化学合成的详细反应步骤。合成方案在实施例1中概述。
[0054] 图6描述使用如图5中合成的(Leu)3化合物来标记血清白蛋白(BSA)的预试验。图6A示意性举例说明包括同量异位素标记组分的报道离子和平衡基团以及作为反应基团的NHS-酯的(Leu)3化合物。BSA的标记和胰蛋白酶消化根据实施例2执行。作为质量对照,通过MALDI MS/MS分析来分析标记的片段释放(图6B)。对于肽鉴定,使用反相液相色谱-电喷射离子陷阱质谱法分级分离的(分选的)消化的BSA肽(LC-MS;参照图6C,上图)。使用MS进一步分析代表性LC-MS峰(图6C,中图)。随后对相应于标记的肽的代表性MS峰实施MS/MS分析(图6C,下图)。随后将所得到的MS/MS谱转变成mgf-文件(Mascot Generic Format),其使用Mascot软件针对SwissProt数据库进行检索。最后,分析的肽的氨基酸序列(单字母编码)测定为CCTKPESER(图6D)。
[0055] 发明详述
[0056] 本发明基于出乎意料的发现:标记试剂和优选地,包括此类标记试剂的由各部分组成的试剂盒的使用,允许蛋白质和/或肽的简单一步标记方案,随后允许从复杂样品选择性亲和纯化标记的蛋白性分子,其中每种标记试剂组合了同量异位素标记组分和同位素标记组分,同位素标记组分同时充当亲和标记物。
[0057] 本文使用的标记试剂的特别设计,即具有共有同位素标记/亲和标记物组分的标记试剂,导致产生具有简化化学结构的分子,和与其包括亲和标记物作为独立的另外实体的各自对应物比较小得多的分子量。此外,这种设计还允许省略可切割接头,以便在蛋白质/肽纯化后切掉亲和标记物,且最终还导致较不复杂的节约的标记试剂合成。
[0058] 在下文中举例说明性描述的本发明可以适当地在不存在本文未具体公开的任何一种或多种元件、一种或多种限制的情况下进行实践。
[0059] 本发明将针对具体实施方案并参照特定附图进行描述,但本发明并不限于其而仅受权利要求限制。所述附图仅是示意性的且不是限制性的。在附图中,出于举例说明目的,某些元件的大小可能放大且未按比例描绘。
[0060] 当术语“包括”在本说明书和权利要求中使用时,它不排除其他元件或步骤。为了本发明的目的,术语“由......组成”被视为术语“包括”的优选实施方案。如果在下文中,组被定义为包括至少特定数目的实施方案,那么这也应理解为公开了优选仅由这些实施方案组成的组。
[0061] 当提及单数名词时使用不定冠词或定冠词,例如“一个”或“一种”、“该”的情况下,这包括该名词的复数,除非特别指出并非如此。
[0062] 在本发明的上下文中的术语“约”指本领域技术人员应当理解为仍确保所讨论的特征的技术效果的精确度区间。该术语一般指示与所指出的数值±10%,优选±5%的偏差。
[0063] 此外,在说明书和权利要求中的术语第一、第二、第三等用于区分相似元件,并且不一定用于描述顺次或时间发生次序。应当理解如此使用的术语在合适情况下可互换,并且本文描述的本发明的实施方案能够以除本文描述或举例说明外的其他顺序操作。
[0064] 进一步的术语定义将在下文中使用术语的上下文中给出。
[0065] 在一个方面,本发明涉及用于标记蛋白性分子的标记试剂,其包括:
[0066] (a)同量异位素标记组分;
[0067] (b)同位素标记组分;和
[0068] (c)能够与蛋白性分子反应的反应基团;
[0069] 其中同位素标记组分同时是亲和标记物。
[0070] 在一个优选实施方案中,本发明涉及由各部分组成的试剂盒,其包括用于标记蛋白性分子的n·m种组合的多种标记试剂,每种标记试剂包括:
[0071] (a)同量异位素标记组分;
[0072] (b)同位素标记组分,其同时是亲和标记物;和
[0073] (c)能够与蛋白性分子反应的反应基团;
[0074] 其中整数n≥2,并且代表差异标记的同量异位素标记组分/亲和标记物的数目,并且
[0075] 其中整数m≥2,并且代表差异标记的同位素标记组分的数目。
[0076] 特别优选地,由各部分组成的试剂盒包括n·m种组合的多种标记试剂,其中整数n≥4,并且其中整数m≥2。如本文所使用的,术语“蛋白性分子(proteinaceous molecule)”指包括经由肽键连接的多个天然或经修饰的氨基酸的任何天然存在或合成的(例如,通过化学合成或重组DNA技术产生的)大分子。此类蛋白性分子的长度可以从2到数千个氨基酸不等(该术语因此不仅包括一般被称为肽和蛋白质的物质,还包括一般被称为寡肽的物质)。一般地,术语“蛋白性分子”指长度超过20个氨基酸的蛋白质。
[0077] 在本发明中待分析的“蛋白质”可以具有约30-约2500个氨基酸、约50-约1000个氨基酸或约100-约1000个氨基酸的长度。
[0078] 如本文所使用的,术语“肽”指在一个或多个肽键断裂后获得的上述“蛋白性分子”的任何片段。如本发明中使用的肽就其大小或性质而言不以任何方式受限制。一般地,在本发明中待分析的肽可以具有约2-约20个氨基酸、约3-约18个氨基酸或约5-约15个氨基酸的长度。
[0079] 如本文所使用的,术语“标记(labeling)”是指将“标记(label)”(即,可检测标记)(化学)附着或掺入本发明中使用的蛋白性分子内。
[0080] 如本文所使用的,术语“标记”指任何包括一种或多种合适的化学物质或酶(其在本文中指示“标记组分”)的部分,其在化学、物理或酶促反应中直接或间接产生可检测化合物或信号。如果至少两种标记组分存在于给定标记中,那么基于其特定性质,每种标记组分可以是可区分检测的。在本发明的范围内,术语“标记”应理解为指与蛋白性分子结合的部分。在与蛋白性分子结合前的部分在本文中称作“标记试剂”。
[0081] 在本发明的标记试剂,优选地,在本发明的由各部分组成的试剂盒中使用的标记可以经由共价或非共价键与蛋白质和/或肽的氨基酸残基连接。一般地,键是共价键。根据本发明,这种键经由“反应基团”来实现,所述“反应基团”是在标记试剂中包括的能够与蛋白性分子反应的化学官能团。在优选实施方案中,反应基团选自氨基反应基团(即,与NH2氨基反应的化学基团)、巯基反应基团(即,与SH巯基反应的化学基团)和羧基反应基团(即,与COOH羧基反应的化学基团)。
[0082] 本发明的标记/标记试剂,优选地,本发明的由各部分组成的试剂盒一般分别包括两种标记组分(即,是“双重标记的”),即同量异位素标记组分和同位素标记组分,其中同位素标记组分同时是亲和标记物。然而,所使用的标记/标记试剂包括一种或多种另外标记组分也在本发明的范围内。这些一种或多种另外标记组分也可以是同量异位素标记组分和/或同位素标记组分,或可以是本领域已知的任何其他标记组分,包括酶标记、有色标记、荧光标记、生色标记、发光标记、放射性标记、半抗原、生物素、金属络合物、金属和胶体金等等。
[0083] 在一种或多种此类另外的标记组分存在于本发明中使用的标记试剂中的情况下,所述标记试剂可以进一步包括可切割部分,用于在对标记的蛋白性分子实施进一步分析前特异性切掉/去除一种或多种另外的标记组分。可切割部分可以选自酸不稳定部分、碱不稳定部分、可通过UV辐射切割的部分、可通过微波辐射切割的部分、可通过改变电位切割的部分、可通过化切割的部分、可通过还原切割的部分、可以通过链复分解改变的部分、和可以通过二硫化物交换改变的部分(即,二硫化物部分)。在优选实施方案中,可切割部分选自二硫化物部分和酸不稳定部分。
[0084] 本发明基于使同位素标记组分和同量异位素标记组分组合的标记试剂的使用,以便使得多路蛋白质分析成为可能,其用于平行执行多个分析,例如4、8、16个或更多个平行样品,或甚至高通量测定。如上概述,仅使用同位素标记将只允许平行处理两个样品。特别地,采用同位素和同量异位素标记组分的此类组合的标记策略也提供不同样品之间的相对蛋白质水平的比较。因此,仅需要对观察到差异表达水平的那些蛋白质和/或肽进行特异性分析,例如通过串联MS/MS分析进行特异性分析,因此导致更快和更不复杂的样品分析。
[0085] 如本文所使用的,术语“同量异位素标记组分”(也称为“同量异位素标记物”)指具有相同结构和相同质量的一组可检测部分,由于同位素在同量异位素标记内的差异分布,同量异位素标记在断裂后释放具有相同结构但质量不同的特定片段。同量异位素标记一般包括报道基团和平衡基团,其在断裂后分离且显示同位素的差异分布。在质谱分析中,报道基团在碰撞诱导的解离(CID,即片段释放)后产生强特征离子。由于一种或多种同位12 13 14 15 16 18
素(例如,C/ C、N/ N、O/ O)的差异存在,在一组同量异位素标记组分内,特征离子单个地质量不同。平衡基团包括特定补偿数目的同位素,以便确保报道基团和平衡基团的组合质量对于不同同量异位素标记是恒定的。平衡基团可以在CID后从标记中释放或不释放。本发明的同量异位素标记组分的分子量是20Da-2500Da、优选50Da-2000Da、且最优选
100Da-1500Da。
[0086] 在本发明中使用的优选的同量异位素标记组分包括用于相对和绝对定量的同量异位素标记物(iTRAQ)标记组分等等(参照Ross,P.L.等人(2004)Mol.Cell.Proteomics3,1154-1169)。这种标记方法采用4种不同iTRAQ试剂,各自包含报道基团、平衡基团和与伯胺基团(例如,赖氨酸氨基酸残基的ε氨基基团)反应的肽反应基团。报道基团具有
12 13 16 18
114、115、116或117Da的质量,这依赖于每种试剂中 C/ C和 O/ O的差异同位素组合。
平衡基团的质量从28到31Da不等,以确保报道基团和平衡基团的组合质量对于4种试剂保持恒定(145Da)。因此,用这些试剂各自标记相同肽,得到这样的肽:其是同量异位的,并且因此例如在液相色谱中共洗脱且因此可通过色谱彼此区分。然而,在质谱法过程中,至少各自的报道基团在CID后释放,显示114-117Da的不同质量。这些片段的强度可以用于单次定量单个蛋白质和/或肽。
[0087] 如本文所使用的,术语“同位素标记组分”(也称为“同量异位素标记物”)指一组可检测部分,其具有相同化学式但在一种或多种原子存在的同位素的数目和/或类型方面彼此不同,导致可以例如经由质谱法检测的标记的蛋白性分子质量的差异。换言之,用不同12 13 14 15 16 18
同位素标记(例如,C/ C、N/ N、O/ O)标记的在其他方面等同的蛋白质和/或肽因此可以基于质量的差异加以区分。尽管同量异位素标记(参见上文)原则上构成特定类型的同位素标记,但在本发明的上下文中,术语同位素标记将用于指并非同量异位但可以像这样基于其分子量加以区分的标记。
[0088] 在本发明内,同位素标记组分同时是亲和标记物。如本文所使用的,术语“亲和标记物”指示这样的任何化学部分:由于其对于特定基质(例如,固相支持体、色谱树脂、基质或抗体)的(可逆)结合亲和力,允许借助于亲和纯化法分离与其附着的分子(参见下文)。因此,换言之,本发明的同位素标记组分是在一种或多种原子处包括不同同位素的亲和标记物。因此,在本发明中使用的同位素标记组分例如不同于已知的同位素编码的亲和标记物(ICAT)标记(参照Gygi,S.P.等人(1999)Nat.Biotechnol.17,994-999),因为它们不包括亲和标记物作为独立的另外实体。
[0089] 一般地,在本发明中使用的同位素标记组分以两种同位素形式,即“轻”形式(利12 14 16 13 15 18
用例如 C、N或 O)和“重”形式(利用例如 C、N或 O)合成。本发明的同位素标记组分的分子量是100Da-3000Da,优选100Da-1500Da。
[0090] 任何亲和标记物可以用于合成在本发明中使用的同位素标记组分。此类亲和标记物的例子包括小化合物(例如生物素及其衍生物)和短氨基酸序列,一般长度2-20个氨基酸,且优选长度4-1两个氨基酸(例如(His)6标记物、(Leu)3标记物、FLAG标记物或c-Myc标记物)等等。所有这些亲和标记物是本领域充分建立和商购可得的。
[0091] 在本发明的标记试剂和优选地,本发明的由各部分组成的试剂盒的优选实施方案中,亲和标记物选自(His)6标记物、(His)4标记物、(His)3标记物、(His)2标记物、(Leu)4标记物、(Leu)3标记物、(Leu)2标记物、c-Myc标记物、HA标记物、FLAG标记物、VSV-G标记物、HSV标记物、V5标记物、生物素及其衍生物、碳水化合物和聚糖。本发明特别优选的亲和标记物选自(His)6标记物、(His)4标记物、(His)3标记物、(His)2标记物、(Leu)4标记物、(Leu)3标记物和(Leu)2标记物。
[0092] 为了产生在质量方面具有等同差异的相同分子结构的几种同位素变体,可能必须在具有潜在不同的官能团和反应机制、同位素交换的不同纯度或可变原子富集的合成途径中使用不同构件。这需要许多不同反应步骤,使得此类标记组分的合成费力、费时而且相当昂贵。
[0093] 因此,在本发明的特定实施方案中,采用同位素标记组分,其已通过重复相同反应方案数次从用作前体的共同构件开始合成,这依赖于标记组分的所需长度大小。此类构件的例子包括以高纯度以及以具有高原子富集的不同同位素变体形式商购可得的氨基酸和糖分子等等。当采用此类构件作为前体时,根据本发明的一组同位素标记组分的合成导致简化得多且因此更快速和节约成本的反应方案。可以以此类方式制备的本发明的优选同位素标记组分是(His)6标记物。
[0094] 类似地,本发明的同量异位素标记组分也可以通过采用共有构件合成。报道基团可以例如基于N-甲基哌嗪,而平衡基团可以基于例如氨基酸或糖分子。
[0095] 本发明的标记试剂和优选地,本发明的由各部分组成的试剂盒的不同组分可以以任何允许反应基团与蛋白性分子结合的构型排列。各个组分(即,同量异位素标记组分、同位素标记组分/亲和标记物、和反应基团)可以彼此直接连接或通过接头序列分开。它们可以以线性方式排列,如通过图1中示意性举例说明的两个实施方案例示的,或以分支形式排列。
[0096] 在一个优选实施方案中,标记试剂具有(线性)构型,其中同位素标记组分/亲和标记物排列在同量异位素标记组分和反应基团之间(参照图1(a))。在另一个优选实施方案中,标记试剂具有(线性)构型,其中同量异位素标记组分排列在同位素标记组分/亲和标记物和反应基团之间(参照图1(b))。
[0097] 本发明的标记试剂和优选地,本发明的由各部分组成的试剂盒的分支构型的一个例子是这样的排列:其中同量异位素标记组分经由接头序列与反应基团连接,同位素标记组分/亲和标记物与所述接头序列附着。此类分支构型的另一个例子是相反排列,其中同量异位素标记组分与接头序列附着,所述接头序列使同位素标记组分/亲和标记物和反应基团连接。此类分支构型的第三个例子是这样的排列:其中同量异位素标记组分经由接头序列与同位素标记组分/亲和标记物连接,反应基团与所述接头序列附着。
[0098] 本发明的由各部分组成的试剂盒包括如本文定义的n·m种组合的多种标记试剂,其中整数n≥2,并且代表差异标记的同量异位素标记组分/亲和标记物的数目,并且其中整数m≥2,并且代表差异标记的同位素标记组分的数目。
[0099] 如本文所使用的,术语“组合的多种(combinatorial plurality)”指所述多种标记试剂包括可以通过使n种不同的同位素标记组分/亲和标记物和m种不同的同量异位素标记组分组合来达到的最高数目排列。
[0100] 例如,当使4种不同的同量异位素标记组分IB1、IB2、IB3和IB(即n=4)与两种不同的同位素标记组分/亲和标记物IT1和IT2(即m=2)组合时,如本文所定义的,组合的多种包括4·2=8种不同组合:IT1/IB1、IT1/IB2、IT1/IB3、IT1/IB4、IT2/IB1、IT2/IB2、IT2/IB3和IT2/IB4。
[0101] 在一个特别优选的实施方案中,n·m种组合的多种标记试剂包括至少4种不同的同量异位素标记组分(即n≥4)和至少两种不同的同位素标记组分/亲和标记物(即m≥2)。因此,本发明的由各部分组成的试剂盒可以例如包括通过使4、8、12或16种不同的同量异位素标记组分与2、3、4或6种不同的同位素标记组分/亲和标记物组合而达到的组合的多种。
[0102] 在一个进一步的方面,本发明涉及用于分析一个或多个样品中的一种或多种蛋白性分子的方法,其包括:
[0103] (a)提供如本文定义的由各部分组成的试剂盒,所述由各部分组成的试剂盒包括n·m种组合的多种标记试剂;
[0104] (b)通过使一个或多个样品各自与n·m种标记试剂中的另一种单个接触,标记一个或多个样品中包括的至少一个蛋白性分子亚组;
[0105] (c)使一个或多个样品组合;
[0106] (d)经由标记中包括的亲和标记物,通过亲和纯化分离标记的至少一个蛋白性分子亚组;和
[0107] (e)分析分离的至少一个蛋白性分子亚组。
[0108] 根据本发明的方法用于分析两个不同样品组(例如,代表疾病阶段和健康对照)的应用的示意性举例说明显示于图2中,每个组包括4个成员(例如,分别代表不同患者和健康受试者)。
[0109] 如本文所使用的,术语“样品”不意欲必须包括或排除在执行本发明的方法前的任何处理步骤。样品可以是未处理的(“粗的”)样品、提取的蛋白质/肽级分、纯化的蛋白质/肽级分等。例如,所采用的样品可以通过一个或多个(高度)丰富蛋白质亚组的免疫耗竭进行预处理。合适的样品包括原核生物(例如,细菌、病毒样品)或真核生物来源的样品(例如,真菌酵母植物、无脊椎动物哺乳动物和特别地,人样品)。
[0110] 如本文所使用的,术语“复杂样品”指使用本发明的方法分析的样品一般包括以不同浓度存在的许多不同蛋白质和/或肽(或此类蛋白质和/或肽的不同变体)的事实。例如,在本发明内的复杂样品可以包括至少约500、至少约1000、至少约5000或至少约10000种蛋白质和/或肽。在本发明中使用的一般复杂样品尤其包括原核生物或真核生物来源的细胞提取物或裂解物,以及人或非人体液例如全血、血清、血浆样品等。
[0111] 该方法可以用单一样品执行,但一般平行处理两个或更多个样品。在某些实施方案中,该方法用M·N个样品执行,其中整数M代表样品组的数目(例如,疾病阶段和健康对照或疾病的不同进展阶段),并且整数N代表每个样品组的单个成员数目(例如,来自不同患者或健康受试者的样品),并且其中N=n并且M=m(参见上文)。
[0112] 在一个优选实施方案中,该方法进一步包括在对蛋白性分子实施标记方案前(即在执行根据本发明的方法的步骤(b)前),将其切割成肽。此类蛋白质切割可以用化学方法达到(例如,经由酸或碱处理,所述处理采用化学物质例如溴化氰、2-(2′-硝基苯基磺酰基)-3-甲基-3-溴-假吲哚(BNPS)、甲酸、羟胺、碘苯甲酸和2-硝基-5-氰硫基苯甲酸)或经由蛋白酶(包括胰蛋白酶、胃蛋白酶、凝血酶、木瓜蛋白酶和胃蛋白酶K等等)酶促达到,两种操作都是本领域众所周知的。
[0113] 待分析的单个样品通过使每个样品与在本发明的由各部分组成的试剂盒中包括的本发明的不同标记试剂分开接触进行标记,以确保每个样品的特异性标记。标记经由标记试剂中包括的反应基团与一个或多个样品中包括的至少一个蛋白性分子亚组附着。随后,使一个或多个样品组合用于进一步分析。
[0114] 如本文所使用的,术语“至少一个蛋白性分子亚组”应以这样的方式加以理解:依赖于样品处理,特别是标记方案等,它可能涉及给定样品或其特定部分中存在的蛋白性分子的全体。
[0115] 然后,经由与蛋白性分子附着的标记中包括的亲和标记物,通过亲和纯化分离在组合的样品中包括的标记的至少一个蛋白性分子亚组。如本文所使用的,术语“亲和纯化”指用于分离样品(移动相)中的蛋白性分子的、任何基于与基质的结合相互作用差异的纯化方法(例如,亲和柱色谱或相应批设置),所述基质固定于静止的材料(固相)。蛋白性分子与基质的选择性结合一般经由标记(即亲和标记物)完成,所述标记显示对于基质的特异性结合活性。一般地,待用作亲和基质的材料在发现靶分子的系统中是不可溶的。合2+
适基质的例子包括亲和素或链霉亲和素(在生物素用作亲和标记物的情况下),Ni -螯合的NTA(在(His)6用作亲和标记物的情况下)、或可以与支持物偶联的抗标记物抗体(例如,抗FLAG抗体、抗(His)抗体、抗(Leu)抗体)(即免疫亲和色谱)等等。所有这些亲和基质(即树脂和/或抗标记物抗体)是本领域充分建立和商购可得的。
[0116] 最后,对分离的标记的蛋白性分子实施进一步定性和/或定量分析(即蛋白质/肽鉴定和测定其在待分析的一个或多个样品中的绝对和/或相对浓度)。
[0117] 在某些实施方案中,在进一步分析前(即在执行根据本发明的方法的步骤(e)前),分离的(标记)至少一个蛋白性分子亚组进行进一步分级分离。
[0118] 如本文所使用的,术语“分级分离”指任何以下类型处理步骤:其中根据蛋白质和/或肽的物理化学性质例如分子量、其大小及其总体净电荷的任何差异,以特定量存在于样品中的蛋白质和/或肽以许多较小量(即级分)分开(即分选)。分级分离中的常见性状是需要发现在收集的级分量和每种级分中的所需纯度之间的最适条件。分级分离使得能够在单次运行中分离混合物中的超过两种组分。这种性质使它与其他分离技术分开。
[0119] 存在本领域充分建立的用于分级分离蛋白质和/或肽的几种方法,包括经典SDS聚丙烯酰胺凝胶电泳(SDS-PAGE)、二维凝胶电泳、大小排阻色谱、(二维)液相色谱和等电点聚焦,其中后面一种是特别优选的。用于在分级分离已发生后分析特别是显现蛋白性分子的方法是本领域充分建立的。也可以考虑其他分级分离方法及其组合。因此,分级分离/再分级分离可能依赖于离子交换色谱、大小排阻色谱、疏水相互作用色谱、反相色谱和/或亲和色谱。
[0120] 在其他实施方案中,当用超过一种样品执行分析时,本发明的方法进一步包括:比较对于一个或多个样品中的每一个样品获得的分析结果,以便测定单个样品之间的相对(蛋白质表达)差异。
[0121] 在优选实施方案,分离的至少一个蛋白性分子亚组的分析借助于质谱法,即用于测量离子的质荷比的分析技术执行。所应用的具体质谱分析可能依赖于在不同样品中测定的蛋白质和/或肽表达水平。在某些实施方案中,本发明的方法以高通量形式执行。
[0122] 在一个进一步的实施方案中,本发明涉及如本文描述的标记试剂、由各部分组成的试剂盒和/或方法用于执行蛋白质表达概况分析或用于执行蛋白质组分析的用途。
[0123] 尽管上述发明已就某些其优选实施方案进行描述,但这决不限制本发明的范围。技术人员明确知道关于先前所述实施方案的进一步实施方案和改变,这仍在本发明的范围内。
实施例
[0124] 实施例1-(Leu)3标记化合物的合成
[0125] 图4A和6A中显示的(Leu)3标记化合物根据下述方案进行化学合成。各个合成步骤与图5中所述的反应方案对应。
[0126] 步骤(1):使原料(S)-2-(叔丁氧基羰基氨基)-4-甲基戊酸、(S)-甲基-2-氨基-4-甲基戊酸酯盐酸盐、1-(双(二甲氨基)亚甲基)-1H-[1,2,3]三唑并[4,5-b]吡啶-1- -3-氧化物六氟磷酸盐(V)、和N-乙基-N-二异丙-2-胺溶解于二氯甲烷(150ml)中,加入2.0ml DMF,并且使混合物搅拌2小时,这之后受Boc保护的胺已消失(TLC洗脱剂EtOAc/庚烷1∶1)。加入150ml饱和氯化铵,并且用二氯甲烷(8x 30ml)萃取粗产物。使有机层在硫酸钠上干燥,并且在减压下浓缩。使用溶于庚烷中的40%EtOAc作为洗脱剂,使粗产物在具有胶的玻璃滤器上纯化。这得到1.96g(84%)纯产物(S)-甲基-2-((S)-2-(叔丁氧基羰基氨基)-4-(甲基戊酰氨基)-4-甲基戊酸酯。
[0127] 步骤(2):使步骤(1)中受Boc保护的二肽溶解于DCM/TFA(44∶11ml)中,并且搅拌1.5小时。在逐步引起反应后,具有饱和NaHCO3TLC的小样品显示反应完全。使反应1
混合物在减压下浓缩,得到2.58g微黄色油。H NMR显示产物还必须包含与产物一起存在的某些游离三氟乙酸,通过蒸馏去除游离三氟乙酸的尝试失败,并且因此无需进一步纯化而使用粗产物(S)-甲基-2-((S)-2-氨基-4-甲基戊酰氨基)-4-甲基戊酸酯2,2,2-三氟乙酸盐。
[0128] 步骤(3):使步骤(2)的氨基三氟乙酸盐溶解于二氯甲烷(150ml)中。在0℃下,加入DIPEA,随后加入HATU和Boc-Leu-OH。使混合物在室温下搅拌2小时。根据TLC,反应是完全的。用饱和氯化铵猝灭混合物,并且用二氯甲烷(8x 50ml)萃取水层。使合并的有机层在硫酸钠上干燥,并且在减压下浓缩。使用溶于庚烷中的EtOAc(4∶6)作为洗脱剂,使粗产物在硅胶上纯化。所得到的三肽(6S,9S,12S)-甲基-6,9-二异丁基-2,2-14-三甲基-4,7,10-三氧代-3-氧杂-5,8,11-三氮杂十五烷-12-甲酸酯以1.78g(3.77mmol;50%)的产率获得。
[0129] 步骤(4):使步骤(3)的受Boc保护的三肽溶解于DCM/TFA(44∶11ml)中,并且搅拌1.5小时。在逐步引起反应后,具有饱和NaHCO3TLC的小样品显示反应完全(产物不用溶于庚烷中的50%EtOAc运行)。使反应混合物在减压下浓缩并且用二氯甲烷剥离一次。将二乙醚(20ml)加入产物中用于研磨,在5分钟后,加入10ml庚烷,并且过滤掉固体,在40分钟后得到1,480g白色粉末((S)-甲基-2-((S)-2-氨基-4-甲基戊酰氨基)-4-甲基戊酰氨基)-4-甲基戊酸酯2,2,2-三氟乙酸盐)。
[0130] 步骤(5):向步骤(4)的三肽-TFA盐、N-甲基-哌嗪基乙酸、EDC和HOAt在甲苯(50ml,考虑它是二氯甲烷)的混合物中,加入DIPEA,并且使混合物搅拌1小时,在这个过程中在烧瓶的底部上形成黄色固体。用饱和碳酸氢钠(70ml)猝灭混合物。使两个相分离,并且用二氯甲烷(4x50ml)萃取水相。使合并的有机层在硫酸钠上干燥,并且在减压下浓缩,1
得到0.203g粗材料,这包含所需产物以及原料(根据LC-MS和 H NMR)。粗材料在2小时过程中用溶于二氯甲烷(25ml)中的EDC、HOAt和DIPEA再处理一次。在逐步引起反应后(类似于上述操作),获得0.231g粗材料。根据LC-MS,反应是完全的。在硅胶上使用溶于二氯甲烷中的MeOH中的5-10%0.5M NH3梯度的纯化得到作为结晶白色固体的0.158g产物((S)-甲基-4-甲基-2-((S)-4-甲基-2-((S)-4-甲基-2-(2-(4-甲基哌嗪-1-基)乙酰氨基)戊酰氨基)-戊酰氨基)戊酸酯)。
[0131] 步骤(6):使步骤(5)的原料溶解于Tesser′s碱(二 烷/MeOH/含水4N NaOH15∶4∶1)中,并且使混合物在室温下搅拌。在搅拌一夜后,使溶液浓缩,得到粗产物(S)-4-甲基-2-((S)-4-甲基-2-((S)-4-甲基-2-(2-(4-甲基哌嗪-1-基)乙酰氨基)戊酰氨基)戊酰氨基)戊酸钠。这种化合物无需进一步纯化在下一个步骤中使用,执行Na分析。
[0132] 步骤(7):在0℃下向溶于二氯甲烷(5ml)中的步骤(6)的粗产物悬浮液中,顺次加入NHS和EDC,并且使混合物在0℃下搅拌3小时。使混合物浓缩,得到粘性固体。使粘性固体再溶解于二氯甲烷(7ml)中。随后,加入二乙醚(7ml),并且使溶剂蒸发直至一半体积。添加二乙醚,随后部分蒸发,重复2次,这之后过滤沉淀物(乙基(N,N-二甲基氨基)1
丙基-ureum和氯化钠)。使滤液浓缩,得到52mg粘稠油。当察看 H NMR谱时,看起来这个级分可能包含所需琥珀酸酯((S)-2,5-二氧代吡咯烷-1-基-4-甲基-2-((S)-4-甲基-2-((S)-4-甲基-2-(2-(4-甲基哌嗪-1-基)乙酰氨基)-戊酰氨基)戊酰氨基)戊酸酯),其被乙基二异丙基ureum等污染。过滤的沉淀物(33mg)可能包含所需产物(在
2.65ppm处的单峰,琥珀酸酯质子)。
[0133] 步骤(8):使步骤(6)的原料溶解于Tesser′s碱(二 烷/MeOH/含水4N NaOH15∶4∶1)中,并且使混合物在室温下搅拌。通过LC-MS(酸性模式)监控反应。在搅拌
2小时后,使溶液浓缩,得到粗产物。这种化合物无需进一步纯化在下一个步骤中使用。未测定产率。
[0134] 步骤(9):在室温下向溶于二 烷(无水的)和二氯甲烷((2.0ml,无水的)的1∶1混合物中的步骤(8)的粗产物溶液中,顺次加入NHS、DIPEA(26μl)和EDC(18.9mg),并且使混合物在室温下搅拌5小时。加入6-氨基己酸和2ml二 烷(无水的)。使混合物搅拌过夜。在第二天时,加入更多EDC(19mg),以产生活化的琥珀酰亚胺酯。使混合物再次搅拌过夜。在第二天时,从反应混合物中取出样品,将正丁胺加入样品中,并且使所得到的混合物搅拌10分钟。使溶液在减压下浓缩,并且通过LC-MS分析:粗产物由来自己酸加合物的预期丁酰胺(在m/z处的[M+H]+=666.4)、己酸加成产物([M+H]+在m/z=611.4)、来自原料的琥珀酰亚胺酯([M+H]+在m/z=553.4)及其相应甲酯([M+H]+在m/z=512.4)组成。反应混合物在饱和碳酸氢钠(25ml)中猝灭,并且加入水(5ml)。用二氯甲烷(5x 20ml)萃取水相,并且在硫酸钠上干燥合并的有机层,并且在减压下浓缩。这得到41mg固体。用LC-MS5分析固体,以揭示它是化合物的混合物。获得样品以用丁胺执行测试反应(参见上文)。用LC-MS5分析来自这个测试反应的产物。它包含预期丁酰胺,但它的丰度看起来低于第一个测试反应中的丰度。由于混合物的复杂性和关于产物组成的不确定连同其潜在不稳定性,决定不运送这种产物。
[0135] 步骤(10):借助于制备型HPLC纯化步骤(9)的产物。这得到8mg游离酸[0136] 步骤(11):向溶于DMF中的步骤(10)的原料溶液中,加入EDC和N-羟基琥珀酰亚胺(NHS),并且使混合物在N2气氛下搅拌过夜。在第二天时,加入更多NHS(4mg),并且使混合物再次搅拌5小时。获得测试样品,并且使其与过量N-丁胺反应用于分析。这种样品的LC-MS显示形成产物(m/z=667的丁酰胺)。使混合物在减压下浓缩且再溶解于二氯甲烷(20ml)中。用饱和NaHCO3(20ml)猝灭这种溶液。用饱和NaCl洗涤有机层,并且在硫酸钠上干燥。获得测试样品用于分析:加入过量丁胺,并且使混合物搅拌15分钟。使溶液在减压下浓缩且通过LC-MS分析。这种分析显示产物具有良好品质。使溶液浓缩以得到7mg所需(Leu)3产物。
[0137] 实施例2-使用(Leu)3标记试剂标记肽
[0138] 在预试验中,图6A中显示的(Leu)3化合物用作标记试剂,用于标记牛血清白蛋白(BSA)。图6A示意性举例说明包括同量异位素标记组分的报道离子和平衡基团以及作为反应基团的NHS-酯的(Leu)3化合物。串联质谱法(MS/MS)中的断裂位点由箭头指示。
[0139] 为了标记,使50mg牛血清白蛋白还原(5mM TCEP,在56℃下温育15分钟),并且烷基化(10mM碘乙酰胺,在室温下在黑暗中温育30分钟);使一批MC标记(400mg)溶解于80ml乙醇中(取3ml用于标记的分离质谱分析,参照图6B),并且随后加入还原且烷基化的BSA中。使这种混合物在室温下温育2小时。
[0140] 在标记后,使用5K MWCO(分子量截止)超滤滤器,将反应混合物的缓冲液更换成100mM碳酸氢铵,pH 8。以1∶25比值加入胰蛋白酶,并且使这种混合物在37℃下温育过夜。
[0141] 对于肽鉴定,使用反相液相色谱-电喷射离子阱质谱法分级分离(分选)消化的BSA肽(LC-MS;参照图6C,上图)。使用MS进一步分析代表性LC-MS峰(图6C,中图)。随后对与标记的肽相应的代表性MS峰实施MS/MS分析(图6C,下图)。随后将所得到的MS/MS谱转化成mgf-文件(Mascot Generic Format),其使用Mascot软件针对SwissProt数据库进行检索。紧接着甲硫氨酸氧化和半胱氨酸脲基甲基化(carbamidomethylation)后,考虑赖氨酸MC-L3作为可能修饰。最后,待分析的肽的氨基酸序列(单字母编码)测定为CCTKPESER(图6D)。在另一个实施方案中(数据未显示),使用(Leu)3标记试剂可以成功地鉴定具有氨基酸序列CASIQKFGER的第二种BSA肽。
[0142] 实施例3-前列腺癌中的生物标记鉴定
[0143] 前列腺癌(PCa)是欧洲男性中最常见的恶性肿瘤。在2002年,在约225000个男性中新近诊断PCa,并且约83000个男性死于这种疾病。PCa通过前列腺组织的组织学检查进行诊断,所述组织学检查通过超声引导的经直肠活组织检查获得。活组织检查的适应症主要是增加的血清前列腺特异性抗原(PSA)和/或异常直肠指检。PSA是标准诊断和预后PCa标记。PCa知晓导致PSA测试的广泛使用,已导致在诊断时更低的肿瘤分期和级别。
[0144] 然而,PSA的使用与特定缺点相关。首先,PSA的增加可以反映良性以及恶性前列腺疾病,即PSA不是癌症特异性的,导致70-80%的阴性活组织检查率。因此,大量患者不必要地经历前列腺活组织检查。此类增加的检测导致临床上无关肿瘤的诊断和潜在地治疗过度。此外,还存在患者具有临床上局限性疾病的问题,所述患者具有未被检出的微小转移,导致在期限内的有症状癌症。目前,这些患者是不可治愈的。最后,未通过放射治疗治愈的许多PCa患者将最终发展激素非依赖性和治疗抗性。借助于在肿瘤进展的早期阶段时的次级治疗,雄激素非依赖性的早期识别可能是全身疗法的适应症。然而,目前无法在早期阶段时预测对治疗的抗性。
[0145] 因此,需要其应用导致诊断特异性增加的PCa标记,使得能够区分无害和侵入性肿瘤,并且允许在早期疾病阶段时鉴定朝向雄激素非依赖性的进展。
[0146] 血清和尿包含良性和恶性细胞的降解产物及其分泌产物。这些体液中的生物标记测定具有超过使用组织标记的特定优点。尽管PCa相关蛋白质和/或肽释放到血清和尿不完全反映肿瘤代谢,但这些体液可以容易地获得。相比之下,前列腺组织取样需要介入性操作(即,经直肠超声引导的活组织检查)。
[0147] 实施例4-潜在可治疗的肿瘤的鉴定
[0148] 血清前列腺特异性抗原(PSA)测试以及随后经直肠超声引导穿刺活组织检查允许检测某些男性中的前列腺癌,所述男性可能获益于基本干预(在50到70岁之间)。前列腺癌可以在2%(Frankel,S.等人(2003)Lancet 361,1122-28)到40%(Thompson,I.M.等人(2003)New Engl.J.Med.349,215-24)的病例中检测出,这依赖于筛选努力的强度(例如,执行的PSA测试数目、PSA截止值水平、所获得的活组织检查数目和频率)。因为PSA不是前列腺癌特异性的,所以大量假阳性结果发生(癌症在经历活组织检查PSA水平升高的约70%男性中未发现)。这种简单PSA血液测试是安全和可接受的,但活组织检查可以是不舒服或疼痛的,并且带有出血和感染的危险。此外,将存在不可预知的假阴性数目,其随后在‘正常’PSA测试的存在下发展前列腺癌:在欧洲随机化筛选试验(European Randomized Screening Trial)(ERSPC)具有低于4ng/ml的PSA水平的男性中鉴定出36.5%可检测肿瘤( F.H.等人(2000)J.Urology 163,806-812)。
[0149] 明确的是需要用于前列腺癌的改良诊断测试。PSA已成为有用工具,以“触发”活组织检查并且监控具有已知癌症的男性,但对于筛选无效。在男性已进行数次活组织检查的前列腺癌预防试验(Prostate Cancer Prevention Trial)中,不管PSA水平,前列腺癌的发病率显示是低的(Thompson,I.M.等人(2004),同上):具有0.5的PSA水平时是6.6%,具有0.6到1.0的PSA水平时是10.1%,具有1.1到2.0的PSA水平时是17.0%,具有2.1到3.0的PSA水平时是23.9%,并且具有3.1到4.0的PSA水平时是26.9%。
[0150] 即使在诊断有局限性前列腺癌的那些患者中,也存在进一步不确定。肿瘤进展的可能性和速度目前无法预测。具有高Gleason级别的肿瘤比具有低级别的那些更可能进展。然而,在诊断15年内死亡的危险从患有具有8-10最高得分的肿瘤的那些患者的60-80%,到患有具有2-4得分的肿瘤的那些患者的4-7%,和患有具有最常见筛选检测得分6的肿瘤的那些患者的18-30%(Albertsen,P.C.等人(1998)JAMA280,975-80)。
[0151] 目前筛选技术因此使得能够鉴定肿瘤,但因为目前无法区分发展缓慢和威胁生命的病变,存在相当大的过度治疗无意义疾病的可能性。
[0152] 实施例5-用于生物标记发现的患者样品的平行筛选
[0153] 为了测定不同样品之间的临床上相关的蛋白质表达差异,根据本发明使用如图2中举例说明的实验设计。
[0154] 选择实验设计,使得在各自的“轻”和“重”同位素标记组分之间的质谱法(MS)水平上出现的任何表达差异都反映来自健康/对照供体或在局部或晚期疾病中的良性疾病与受影响癌症患者的样品之间的潜在相关的区别特征。借助于采用同量异位素标记组分的串联MS/MS获得的MS信号的进一步分析得到关于研究组之间在蛋白质表达方面的差异的更详细答案。
[0155] 在解决不同临床疑问的情况下,必须相应调整实验设计。例如,如果目的是鉴定用于前列腺癌分期的标记,那么实验策略设计可以是下述:
[0156] -样品组1:良性供体或上皮内赘生物(PIN)
[0157] -样品组2:局部PCa疾病
[0158] -样品组3:局部晚期的PCa疾病
[0159] -样品组4:迅速发展的、激素难治性PCa疾病
[0160] 在使用如本文定义的标记试剂单个标记待分析的样品的蛋白性分子后,使样品组合,并且经由标记中包括的同位素标记组分/亲和标记物,借助于亲和纯化分离标记的蛋白性分子。
[0161] 分离的标记的蛋白性分子通过质谱技术进行进一步分析。
[0162] 在某些实施方案中,本发明涉及:
[0163] 1.用于标记蛋白性分子的标记试剂,其包括:
[0164] (a)同量异位素标记组分;
[0165] (b)同位素标记组分;和
[0166] (c)能够与蛋白性分子反应的反应基团;
[0167] 其中同位素标记组分同时是亲和标记物。
[0168] 2.如1中限定的标记试剂,其具有这样的构型:其中同位素标记组分/亲和标记物排列在同量异位素标记组分和反应基团之间。
[0169] 3.如1中限定的标记试剂,其具有这样的构型:其中同量异位素标记组分排列在同位素标记组分/亲和标记物和反应基团之间。
[0170] 4.如1-3中任一项中限定的标记试剂,其中亲和标记物选自(His)6标记物、(His)4标记物、(His)3标记物、(His)2标记物、(Leu)4标记物、(Leu)3标记物、(Leu)2标记物、c-Myc标记物、HA标记物、FLAG标记物、VSV-G标记物、HSV标记物、V5标记物、生物素及其衍生物、碳水化合物和聚糖。
[0171] 5.如1-4中任一项中限定的标记试剂,其中反应基团选自氨基反应基团、巯基反应基团和羧基反应基团。
[0172] 6.由各部分组成的试剂盒,其包括n·m种组合的多种1-5中任一项中限定的标记试剂,其中整数n≥2,并且代表差异标记的同量异位素标记组分的数目,并且其中整数m≥2,并且代表差异标记的同位素标记组分/亲和标记物的数目。
[0173] 7.如6中限定的试剂盒,其中整数n≥4,并且整数m≥2。
[0174] 8.用于分析一个或多个样品中的一种或多种蛋白性分子的方法,其包括[0175] (a)提供如5-7中任一项限定的由各部分组成的试剂盒,所述由各部分组成的试剂盒包括n·m种组合的多种标记试剂;
[0176] (b)通过使一个或多个样品各自与n·m种标记试剂中的另一种单个接触,标记一个或多个样品中包括的至少一个蛋白性分子亚组;
[0177] (c)使所述一个或多个样品组合;
[0178] (d)经由标记中包括的亲和标记物,通过亲和纯化分离标记的至少一个蛋白性分子亚组;和
[0179] (e)分析分离的至少一个蛋白性分子亚组。
[0180] 9.如8中限定的方法,其用M·N个样品执行,其中整数M代表样品组的数目,并且整数N代表每个样品组的单个成员的数目,并且其中N=n且M=m。
[0181] 10.如8或9中限定的方法,其进一步包括:在执行步骤(b)前,将蛋白性分子切割成肽。
[0182] 11.如8-10中任一项中限定的方法,其进一步包括:在执行步骤(e)前,将分离的至少一个蛋白性分子亚组分级分离。
[0183] 12.如8-11中任一项中限定的方法,其中分离的至少一个蛋白性分子亚组的分析借助于质谱法执行。
[0184] 13.如8-12中任一项中限定的方法,其进一步包括:比较一个或多个样品各自在步骤(e)中获得的分析结果。
[0185] 14.如8-13中任一项中限定的方法,其中所述方法以高通量形式执行。
[0186] 15.如1-5中任一项中限定的标记试剂和/或如6或7中限定的由各部分组成的试剂盒用于执行蛋白质表达概况分析或用于执行蛋白质组分析的用途。
QQ群二维码
意见反馈