首页 / 专利库 / 物理 / 离子回旋共振 / 用于蛋白质或多肽的混合物的从上到下多路复用质谱分析的方法

用于蛋白质或多肽的混合物的从上到下多路复用质谱分析的方法

阅读:1017发布:2020-10-13

专利汇可以提供用于蛋白质或多肽的混合物的从上到下多路复用质谱分析的方法专利检索,专利查询,专利分析的服务。并且本 发明 公开离子‑离子反应化学方法的应用,其中使用质子转移反应(PTR)和实时数据分析方法以:(1)简化引入到质谱仪中的样本的复杂混合物分析,以及(2)通过移除电荷且减少碰撞横截面而改善超过50kDa的大 蛋白质 的分析的 分辨率 和灵敏度。,下面是用于蛋白质或多肽的混合物的从上到下多路复用质谱分析的方法专利的具体信息内容。

1.一种用于识别液体样本内的蛋白质或多肽分析物化合物的存在或不存在的方法,所述样本包括化合物的混合物,所述混合物包含多种蛋白质化合物或多种多肽化合物或多种蛋白质和多肽化合物,所述方法包括以下步骤:
(a)将所述液体样本的一部分引入到质谱仪的电喷射电离源中;
(b)通过电喷射电离形成所述液体样本的所述部分的所述化合物混合物的带正电离子,所述带正电离子包括多个离子物质;
(c)隔离包括第一质荷比(m/z)比率范围的所述离子物质的第一子集,所述范围包含所述分析物化合物的特定预定多质子化分子物质的质荷比;
(d)通过致使所述隔离的离子物质的第一子集在预定持续时间中与反应剂阴离子反应而从所述隔离的离子物质的第一子集产生多个第一代产物离子物质,所述反应剂阴离子在反应后从一或多个离子物质中的包括蛋白质或多肽化合物的质子化分子物质的每一者提取质子;
(e)使用质量分析器产生所述第一代产物离子物质或从所述第一代产物离子物质产生的第二代产物离子物质的质谱;
(f)从所述第一代或所述第二代产物离子物质的所述质谱辨识作为所述蛋白质或多肽分析物化合物的诊断的一或多个质荷比的集合;以及
(g)如果在所述质谱中识别出一或多个质荷比的所述集合,那么识别所述样本内的所述分析物化合物的存在,
其中辨识作为所述蛋白质或多肽分析物化合物的诊断的一或多个质荷比的所述集合的所述步骤(f)采用数学分析算法,其中所述质谱中观测到的峰的强度表示为布尔型值且每一峰的所述质荷比由变量T(m/z)表示,其中T(m/z)=ln((m/z)-Mproton)且Mproton是质子的质量。
2.根据权利要求1所述的方法,其进一步包括第二次重复所述步骤(a)到(e),其中在所述步骤(a)到(e)的所述第二次重复期间或之前执行所述步骤(f)和(g)。
3.根据权利要求1所述的方法,其进一步包括多次重复执行步骤(a)到(g),其中步骤(a)的每一重复包括将来自对应于相应滞留时间的层析柱的溶离液引入到所述电喷射电离源中。
4.根据权利要求1所述的方法,其中辨识作为所述蛋白质或多肽分析物化合物的诊断的一或多个质荷比的所述集合的所述步骤(f)包括辨识对应于所述分析物化合物的多质子化离子物质序列的所述第一代产物离子物质的所述质谱内的一系列质荷比,所述分析物化合物的所述多质子化离子物质相对于所述特定预定多质子化分子物质的电荷态逐渐地减少电荷。
5.根据权利要求1所述的方法,其中:
所述步骤(c)包括进一步隔离所述离子物质的第二子集,所述第二子集包括第二质荷比范围,所述第二质荷比范围包含第二蛋白质或多肽分析物化合物的特定预定多质子化分子物质的质荷比;
所述步骤(f)包括从所述第一代或所述第二代产物离子物质的所述质谱且使用所述数学分析算法辨识作为所述第二蛋白质或多肽分析物化合物的诊断的一或多个质荷比的第二集合;且
所述步骤(g)包括如果在所述质谱中识别出质荷比的所述第二集合,那么识别所述样本内的第二分析物化合物的存在。
6.根据权利要求5所述的方法,其中所述第一子集的质荷比范围相同于所述第二质荷比范围。
7.根据权利要求5所述的方法,其中所述步骤(c)包括同时隔离包括所述第一子集的质荷比范围的所述离子物质的所述第一子集以及包括所述第二质荷比范围的所述离子物质的所述第二子集以使得所述第一子集的质荷比范围和第二质荷比范围是非邻接的。
8.根据权利要求1所述的方法,其中产生多个第一代产物离子物质的所述步骤(d)包括致使所述步骤(c)隔离的离子物质的第一子集和反应剂阴离子在一持续时间中反应,所述持续时间致使在步骤(e)中的所述质谱的后续产生期间所述步骤(d)的第一代产物离子物质稳定而不会分解。
9.根据权利要求8所述的方法,其中所述步骤(e)包括使用质量分析器产生所述第一代产物离子物质的质谱,所述质量分析器通过检测由离子阱内所述第一代产物离子物质的所述离子的运动造成的镜像电流来产生所述质谱。
10.根据权利要求1所述的方法,其中产生多个第一代产物离子物质的所述步骤(d)包含跨越离子阱的电极施加补充AC电压,在所述离子阱内所述隔离的离子物质的第一子集与反应剂阴离子反应,其中所述补充AC电压的频率使得禁止所述反应剂阴离子与选定的第一代产物离子物质之间的离子-离子反应。
11.根据权利要求10所述的方法,其中所述补充AC电压的所述频率使得在步骤(d)的执行之后,由所述分析物化合物形成的产物离子大体上作为具有特定电荷态的单个离子物质而存在。
12.根据权利要求11所述的方法,其中:
所述步骤(e)包括产生所述第一代产物离子物质的质谱;且
其中所述单个离子物质的质量大于20,000Da且所述单个离子物质的电荷态充分大以使得可在所述质谱的产生期间通过四极质量分析器、傅立叶变换离子回旋共振质谱仪或静电阱质量分析器检测所述单个离子物质的离子。
13.根据权利要求1所述的方法,其中产生质谱的所述步骤(e)包括产生第二代产物离子物质的质谱,其中所述第二代产物离子物质是通过以下步骤产生:
产生包括所述第一代产物离子物质的质谱的第一质谱;
隔离包括特定产物离子质荷比范围的所述第一代产物离子物质的子集,所述特定产物离子质荷比范围是使用通过将所述数学分析算法应用于所述第一质谱而产生的结果自动选择的;以及
使所述第一代产物离子物质的所述隔离的子集分段以便形成片段离子物质,其中所述片段离子物质包括所述第二代产物离子物质。
14.根据权利要求1所述的方法,其中产生质谱的所述步骤(e)包括产生第二代产物离子物质的质谱,其中所述第二代产物离子物质是通过以下步骤产生:
产生包括所述第一代产物离子物质的质谱的第一质谱;
隔离包括特定产物离子质荷比范围的所述第一代产物离子物质的子集,所述特定产物离子质荷比范围是使用通过将所述数学分析算法应用于所述第一质谱而产生的结果自动选择的;以及
致使所述第一代产物离子物质的所述隔离的子集在第二预定时间持续时间中与所述反应剂阴离子反应,其中所述第一代产物离子物质与所述反应剂阴离子之间的反应的产物包括所述第二代产物离子物质。
15.根据权利要求14所述的方法,其中跨越离子阱的电极施加补充AC电压,在所述离子阱内所述第一代产物离子物质与所述反应剂阴离子反应,其中所述补充AC电压的频率使得禁止所述反应剂阴离子与选定产物离子物质之间的离子-离子反应。
16.根据权利要求1所述的方法,其进一步包括通过包括以下各步骤的程序产生包括所述化合物混合物的所述液体样本:
(i)培养生物或细胞;
(ii)裂解来自步骤(i)经培养的微生物或细胞;以及
(iii)从来自步骤(ii)的经培养的微生物或细胞的裂解物提取蛋白质。
17.根据权利要求16所述的方法,其中从所述裂解物提取所述液体样本的所述步骤(iii)包含使所述裂解物通过固相提取设备。
18.根据权利要求1所述的方法,其中通过辨识所述T(m/z)值的对之间的特定差而将离子电荷态指派给所述质谱的所述峰的一部分。
19.根据权利要求18所述的方法,其进一步包括调整根据权利要求18指派的离子电荷态以使得经权利要求18所述的方法调整的离子电荷态最佳地相互一致。

说明书全文

用于蛋白质或多肽的混合物的从上到下多路复用质谱分析的

方法

技术领域

[0001] 本发明涉及质谱法,并且更确切地说,涉及用于通过包含以下操作的方法对蛋白质或多肽的复杂混合物的质谱分析的方法:使电离样本经受质子转移反应以使电离蛋白质和多肽与其它分子分离,且执行所得反应产物的数学解卷积分析以同时表征所述混合物中的多个蛋白质和/或多肽。

背景技术

[0002] 活细胞和组织中的蛋白质的研究(蛋白质组研究)是临床和基本科学研究的作用领域,因为细胞和组织中的代谢控制是在蛋白质层级锻炼的。举例来说,健康的与患病的组织之间或者病原的与非病原的生物菌株之间的蛋白质平表达的比较可加速新的药物化合物或农业产物的发现与开发。此外,患病的组织或从经受处理的生物切离的组织中的蛋白质表达模式的分析也可充当疾病病况的诊断或处理策略的功效,以及提供关于个别患者的合适的处理模态与治疗选择的预测信息。再者,从微生物(例如,细菌)导出的样本中的蛋白质集合的识别可提供识别微生物的物质和/或菌株以及关于细菌识别此些物质或菌株的可能抗药性性质的手段。
[0003] 蛋白质组研究的一个重要方面是具有更改的表达含量的蛋白质的识别。随着时间或群体当中的和代谢物水平的差异可与患病的状态、药物治疗或代谢改变相关联。经识别的分子物质可充当所讨论的疾病或病况的生物标记,从而允许开发诊断和治疗的新方法。常规地,由于从自然组织或细胞提取的任何样本中一般存在的大量蛋白质,所述蛋白质必须首先通过凝胶或毛细电泳法或亲和技术而分离为个别组分,然而所述个别蛋白质水平可以被评估且与数据库进行比较或在样本之间进行比较。
[0004] 因为其可提供详细结构信息,所以质谱法(MS)当前被认为是用于生物化学混合物分析和蛋白质识别的有价值的分析工具。蛋白质分析的常规方法因此常常组合用于分离和定量的二维(2D)凝胶电泳与蛋白质的质谱识别。而且,毛细管液相层析以及各种其它“前端”分离技术已经与用于大尺度蛋白质识别的电喷射电离串连质谱法组合而无需凝胶电泳。使用质谱法,可识别质谱之间的定性差异,且对应于仅在谱的某部分中发生的峰的蛋白质充当候选生物标记。
[0005] 近年来,质谱法由于其在与传统的用于识别微生物的方法相比时增加的准确性和缩短的得到结果的时间,也已经作为用于识别微生物的工具而获得普及。到目前为止,用于微生物识别的最常见质谱法方法是基质辅助激光解吸电离飞行时间(MALDI-TOF)质谱法。在MALDI-TOF中,未知微生物的细胞与合适的紫外光吸收基质溶液混合且允许在样本板上干燥。替代地,使用微生物细胞的提取而不是完整细胞。在转移到质谱仪的离子源之后,使激光束指向样本以用于蛋白质的解吸附和电离,且收集时间相依性质谱数据。
[0006] 由MALDI-TOF方法产生的微生物的质谱揭露了来自完整的肽、蛋白质、蛋白质片段以及其它分子的若干个峰,其构成微生物的“指纹”。此方法依赖于未知微生物的质谱中的峰分布与参考数据库的图案匹配,所述参考数据库包括使用基本上相同实验条件获得的已知微生物的质谱的收集。隔离的微生物的谱与参考数据库中的谱之间的匹配越好,在种属、物质或在一些情况下亚种水平下对生物的识别的置信度水平越高。因为所述方法依赖于匹配MALDI-TOF质谱中的峰的图案,所以不要求识别或另外表征所述未知微生物的谱中表示的蛋白质以便对其进行识别。
[0007] 虽然MALDI-TOF方法是快速且经济的,但它们具有的局限是限制了对病原体表征和识别的应用范围,包含但不限于毒性检测和定量、电阻标记确定、应变匹配以及抗生素易感性测试(仅举几例)。MALDI质谱内的信息内容反映了在所使用实验条件下一般受限于核糖体蛋白质的大多数充足且可电离的蛋白质。因为核糖体蛋白质在原核细胞当中是高度守恒的,所以通过MALDI-TOF对接近相关的微生物的区分受到限制。在此情况下,跨越接近相关的物质的许多核糖体蛋白质含有相同或稍微不同的基酸序列(即,单氨基酸取代),这无法以低分辨率质谱仪有效地区分。此外,菌株和/或血清变型类型、抗生素抗性、抗生素易感性、毒性或其它重要特性的确定依赖于除核糖体蛋白质外的蛋白质标记的检测,这进一步限制MALDI-TOF用于微生物分析的应用。使用MALDI-TOF用于微生物识别的实验室必须使用其它方法来进一步表征经识别的微生物。另外,MALDI-TOF方法对匹配谱图案的依赖要求纯的培养基以得到高质量结果,且因此一般不适合于直接测试、混合培养基、血培养基或含有不同微生物的其它复杂样本。
[0008] 已经使用用于微生物检测的若干其它质谱法方法。举例来说,已经描述基于质谱法的蛋白质定序方法,其中液相层析与串连质谱法结合(LC-MS/MS),且根据从微生物样本导出的蛋白质的酶消化获得序列信息。被称为“从下到上”蛋白质组研究的此方法是用于蛋白质识别的广泛实践的方法。所述方法可提供对亚种或菌株层级的识别,因为色谱分离允许除仅核糖体蛋白质外的额外蛋白质的检测,包含可用于抗生素抗性标记和毒性因数的表征的那些。
[0009] 与“从下到上”蛋白质组研究相比,“从上到下”蛋白质组研究指代其中将蛋白质样本完整地引入质谱仪而无需酶、化学品或其它分解方式的分析方法。从上到下的分析实现完整蛋白质的研究,从而允许直接在蛋白质层级的识别、主要结构确定以及转译后修饰(PTM)的局部化。从上到下的蛋白质组分析通常包括将完整蛋白质引入质谱仪的电离源中,使蛋白质离子断裂,且测量如此产生的各种片段的质荷比和丰度。所得分段比肽分段复杂得多,这在无本文教示的方法存在下可能必须要使用具有极高质量准确性和分辨率能力的质谱仪以便以可接受的确定性解译分段图案。所述解译一般包含将观测的分段图案与包含从已知样本产生的经编译实验分段结果的蛋白质序列数据库进行比较,或替代地与理论上预测分段图案进行比较。举例来说,举例来说,Liu等(《经由四极/飞行时间串连质谱仪中的离子阱碰撞引起的解离和离子/离子反应对先验未知蛋白质的从上到下的蛋白质识别/表征(Top-Down Protein Identification/Characterization of a Priori Unknown Proteins via Ion Trap Collision-Induced Dissociation and Ion/Ion Reactions in a Quadrupole/Time-of-Flight Tandem  Mass  Spectrometer)》,《分析化学(Anal.Chem.)》,2009,81,1433-1441)已经描述对具有多达28kDa的质量的经改质和未改质的未知蛋白质的从上到下的蛋白质识别和表征。
[0010] 从上到下的分析优于从下到上的分析的优点在于可直接识别蛋白质,而不是如从下到上的分析中肽的情况那样进行推断。另一优点在于可以识别蛋白质的替代形式,例如转译后修饰和拼接变体。然而,从上到下的分析当与从下到上的分析相比时具有的缺点在于许多蛋白质会难以隔离和纯化。因此,不完全分离混合物中的每一蛋白质可在质谱分析后即刻产生多个离子物质,每一物质对应于不同相应质子化程度和不同相应电荷态,且每一此类离子物质可带来多个同位素变体。从上到下的分析中测得的单个MS谱可容易含有属于不同分析物的数百到甚至数千个峰,全部在给定m/z范围上交织,其中具有极不同强度的离子信号重叠且相互抑制。
[0011] 因为在从上到下分析中获得的生物样本的质谱一般是极复杂的,所以需要改进的方法用于解译质谱。此些方法必须克服的所得计算挑战是追溯每一峰返回至某一分析物,并且一旦这对于一个或几个分析物完成便在最佳地描述为数学分解(此项技术中也称为数学解卷积)的过程中确定分析物的分子量。与临床设置中的蛋白质和多肽的质谱分析的使用相关联的再另一挑战是在可能的最短时间周期中导出此信息,常常被称为“实时”分析。显然,所述计算在自动从上到下数据相依性分析期间实时的是更有挑战性的,因为尤其当涉及层析分离时这应当极快速地发生。为了继续,需要提供以下两者:(i)经优化实时计算策略,以及(ii)质谱数据获取策略,其针对每一离子物质预测多个质谱线且从潜在众多的污染化合物预测所关注的分析物化合物的有效隔离。
[0012] 现有数据相依性和动态排除工作流技术及对应算法是针对小分子、小肽和在电喷射电离过程中获取有限数目的电荷(例如,1-3个电荷)的其它分析物而开发。当应用于较高分子量生物聚合物分析物(最经常是在从上到下蛋白质组研究的过程期间的完整蛋白质)时,这些常规方法由于不同电喷射行为和计算限制的组合而显著执行不足。更具体来说:(1)一般来说完整高质量分析物且确切地说蛋白质形成的电荷态(每分子多达50个电荷或更多,例如图12C)比在电喷射电离过程期间的小分子多得多,原因是导致复杂得多的MS谱的较大数目的电荷获取位点;(2)在例如细胞裂解物或其部分等复杂混合物中,存在分子量的宽分布以及导致具有变化强度的电荷态分布图案的极复杂重叠的副本数目;(3)相同或不同化学性质的高质量分析物的生理化学性质的变化率产生层析峰形状的显著变化率和柱上的分析物保持;(4)如果在例如OrbitrapTM质量分析器(一类静电阱质量分析器)或飞行时间(TOF)质量分析器等具有高分辨力的质谱仪上获取质谱,那么对应峰进一步解析为质量常常远离理论二项分布的一系列群集中的同位素的数目;(5)多种不同蛋白质的基质电离效应可极大地影响多个重叠物质的观测强度以便使任何给定标准或样本中发现的蛋白质强度的真实比率失真。相同分析物或加成物的化物质、同位素群集的重叠以及现有软件工具不能正确地计算高质量物质的电荷态引入了额外的复杂性水平。
[0013] 实际上,以上考虑暗示在完整蛋白质和其它生物聚合物的情况下,现有数据相依性算法是混杂的,且对来自同一生物聚合物的若干不同电荷态以冗余方式执行MS/MS。并且,当同位素群集并不匹配由给定生物聚合物中存在的、氢、氮、氧和硫原子的数目界定的传统二项分布模式或并不满足强度阈值信噪比要求时,从对属于同一同位素群集的多个同位素进行分段发生冗余。此重复工作导致最充足的/可电离的蛋白质的识别中的冗余,n同时关于其它物质的信息丢失且提供触发MS分析的极少机会。
[0014] 关于高效仪器相关联数据获取策略,可注意到离子-离子反应在近十年来已经在生物质谱法领域中得到较大实用性,主要使用电子转移解离(ETD)来解离肽/蛋白质且确定主要序列信息和表征转译后修饰。作为另一类型的离子-离子反应的质子转移也已经在生物应用中充分使用。以实验方式,在一种形式的质子转移中,允许来自样本的多正电荷蛋白质离子(即,蛋白质阳离子)与单电荷反应剂阴离子反应以便减少个别蛋白质阳离子的电荷态以及蛋白质阳离子的此些电荷态的数目。当反应剂阴离子大量超过蛋白质阳离子群体而存在时,这些反应以伪一级反应动力学继续。反应的速率与蛋白质阳离子(或其它多电荷阳离子)的电荷的平方乘以反应剂阴离子上的电荷成正比。同一关系也适用于相反极性的反应,此处经界定为单电荷反应剂阳离子与从蛋白质样本导出的多电荷阴离子的群体之间的反应。这产生一系列伪一级连续反应曲线,如由起始的多电荷蛋白质阳离子群体界定。虽然所述反应是高度发热的(超过100千卡/摩尔),但质子转移是在1毫托的背景气体(即氦气)存在下执行的偶电子过程,且因此不使起始的多电荷蛋白质阳离子群体分段。碰撞气体用以在微秒时间尺度(108碰撞每秒)上移除过量能量,因此防止所得产物离子群体的分段。碰8
撞气体用以在微秒时间尺度(10碰撞每秒)上移除过量能量,因此防止所得产物离子群体的分段。
[0015] 质子转移反应(PTR)已经成功地用以识别蛋白质混合物中的蛋白质。具体来说,质子转移反应方法的应用可设想为混合物简化过程,其在质谱仪中实时(几毫秒)实行,其使得蛋白质和多肽的质谱特征彼此分离以及与一般低电荷污染离子分离。此程序实现分析物蛋白质和多肽离子作为群组或作为个别离子物质的隔离,且因此已经用以确定高质量蛋白质的电荷态和分子量。PTR也已经用于简化从多电荷前驱体蛋白质离子的碰撞激活导出的产物离子谱。虽然PTR减少了从多电荷蛋白质离子导出的总体信号,但这由所得PTR产物离子的信噪比的显著增益更多地补偿。PTR过程是100%高效的,其产生仅单一系列的反应产物,且不产生需要特殊解译和数据分析的副反应产品。
[0016] PTR对肽、多肽和蛋白质的分析的应用的各种方面已经在以下文献中描述:在发明人Hunt等的名义下的第7,749,769B2号美国专利、在发明人Hartmer等的名义下的第2012/0156707A1号美国专利预授权公开案、在发明人Zabrouskov的名义下的第2012/0205531A1号美国预授权公开案;McLuckey等的《离子/离子质子转移动力学:用于从蛋白质混合物的电喷射导出的离子的分析的暗示(Ion/Ion Proton-Transfer Kinetics:Implications for Analysis of Ions Derived from Electrospray of Protein Mixtures)》,《分析化学(Anal.Chem.)》1998,70,1198-1202;Stephenson等的《涉及非共价交互的生物离子的离子-离子质子转移反应:全肌红蛋白(Ion-ion Proton Transfer Reactions of Bio-ions Involving Noncovalent Interactions:Holomyoglobin)》,《美国质谱学会期刊(J.Am.Soc.Mass Spectrom.)》,1998,8,637-644;Stephenson等的《气相中的离子/离子反应:涉及多电荷蛋白质的质子转移反应(Ion/Ion Reactions in the Gas Phase:Proton Transfer Reactions Involving Multiply-Charged Proteins)》,《美国化学学会期刊(J.Am.Chem.Soc.)》,1996,118,7390-7397;McLuckey等的《用于电喷射质谱法中改进的有效质量分辨率的离子/分子反应(Ion/Molecule Reactions for Improved Effective Mass Resolution in Electrospray Mass Spectrometry)》,《分析化学(Anal.Chem.)》,
1995,67,2493-2497;Stephenson等的《用于蛋白质混合物分析的离子/离子质子转移反应(Ion/Ion ProtonTransfer Reactions for Protein Mixture Analysis)》,《分析化学(Anal.Chem.)》,1996,68,4026-4032;Stephenson等的《用于寡肽混合物分析的离子/离子反应:对由0.5-100kDa组分构成的混合物的应用(Ion/Ion Reactions for Oligopeptide Mixture Analysis:Application to Mixtures Comprised of 0.5-100kDa 
Components)》,《美国质谱学会期刊(J.Am.Soc.Mass Spectrom.)》,1998,9,585-596;
Stephenson等的《用于通过电喷射质谱法的高质量物质和混合物组分的改进质量确定的电荷操纵(Charge Manipulation for Improved Mass Determination of High-mass Species and Mixture Components by Electrospray Mass Spectrometry)》《,质谱学期刊(J.Mass Spectrom.)》,1998,33,664-672;Stephenson等的《经由离子/离子化学方法从多电荷母代离子导出的产物离子谱的简化(Simplification of Product Ion Spectra Derived from Multiply Charged Parent Ions via Ion/Ion Chemistry)》,《分析化学(Anal.Chem.)》,1998,70,3533-3544,以及Scalf等的《电荷减少电喷射质谱法(Charge Reduction Electrospray Mass Spectrometry)》,《分析化学(Anal.Chem.)》,2000,72,52-
60。一般离子/离子化学方法的各种方面已经在McLuckey等的《高质量多电荷离子的离子/离子化学方法(Ion/Ion Chemistry of High-Mass Multiply Charged Ions)》,《质谱学回顾(Mass Spectrom.Rev.)》,1998,17,369-407以及在发明人McLuckey等的名义下的第7,
550,718B2号美国专利中描述。用于执行PTR且用于减少质谱仪中的离子电荷态的设备已经在以下各者中描述:在发明人Chen等的名义下的第2011/0114835A1号美国预授权公开案,在发明人Brown等的名义下的第2011/0189788A1号美国预授权公开案,在发明人Brown等的名义下的第8,283,626B2号美国专利,以及在发明人Frey等的名义下的第7,518,108B2号美国专利。PTR电荷减少技术对生物的检测和识别的适配已由McLuckey等描述(《用于生物的检测和识别的电喷射/离子阱质谱法(Electrospray/Ion Trap Mass Spectrometry for the Detection and Identification of Organisms)》,生物质谱法的首次联合服务研讨会会刊,巴尔的摩,里兰州,1997年7月28-30日,127-132)。
[0017] 由PTR过程产生的产物离子可通过使用被称为“离子停车”的技术积聚到一个或若干电荷态中。离子停车在反应周期期间使用补充AC电压在特定质荷比(m/z)值下将由任何给定蛋白质分子的原始不同地质子化离子形成的PTR产物离子固结为特定电荷态。此技术可用以将产物离子信号集中到单个或有限数目的电荷态中(且因此集中到单个或几个相应m/z值中)以用于较高灵敏度检测或者使用碰撞激活、ETD或其它离子操纵技术的进一步操纵。离子停车的各种方面已经在以下各者中描述:在发明人McLuckey的名义下的第7,064,317B2号美国专利;在发明人McLuckey的名义下的第7,355,169B2号美国专利;在发明人McLuckey的名义下的第8,334,503B2号美国专利;在发明人Le Blanc的名义下的第8,440,
962B2号美国专利;且在以下文献中描述:McLuckey等的《在电动离子阱中的离子/离子反应期间的离子停车(Ion Parking during Ion/Ion Reactions in Electrodynamic Ion Traps)》,《分析化学(Anal.Chem.)》,2002,74,336-346;Reid等的《来自复杂混合物的完整蛋白质的气相浓度、纯化和识别(Gas-Phase Concentration,Purification,and Identification of Whole Proteins from Complex Mixtures)》,《美国化学学会期刊(J.Am.Chem.Soc.)》,2002,124,7353-7362;He等的《在单个气相纯化和浓度程序之后多个蛋白质离子电荷态的解离(Dissociation of Multiple Protein Ion Charge States Following a Single Gas-Phase Purification and Concentration Procedure)》,《分析化学(Anal.Chem.)》,2002,74,4653-4661;Xia等的《混合线性离子阱中的相互存储模式离子/离子反应(Mutual Storage Mode Ion/Ion Reactions in a Hybrid Linear Ion Trap)》《,美国质谱学会期刊(J.Am.Soc.Mass Spectrom.)》,2005,16,71-81;Chrisman等的《平行离子停车:改善电子转移解离中的母代到第一代产物的转换(Parallel Ion Parking:Improving Conversion of Parents to First-Generation Products in Electron Transfer Dissociation)》,《分析化学(Anal.Chem.)》,2005,77(10),3411-
3414,以及Chrisman等的《蛋白质混合物的平行离子停车(Parallel Ion Parking of Protein Mixtures)》,《分析化学(Anal.Chem.)》,2006,78,310-316。
[0018] 由于用于实时或近实时分析复杂的自然样本的质谱蛋白质组分析的此项技术中的进行中的要求,因此存在对起作用的且计算的质量分析的改进方法的需要,其可有效分离分析物与污染物,区分信号与噪声,正确地分配相关m/z值到恰当同位素群集中,正确地确定电荷态,且将各种电荷态恰当地组织到分布包络中。在数据获取以及任选地获取后处理工作流中的成功都需要这些改进。优选地,改进的起作用的方法、工作流和算法应当能够在“实时”环境中工作以使得可在正获取质谱的同时做出自动数据相依性决策,且使得可在随后不久做出临床解译。本发明解决这些需要。

发明内容

[0019] 本发明教示离子-离子反应化学方法的应用,其中:(i)使用一个或多个阶段的质子转移反应,任选地由数据相依性分段补充,以简化从样本的电喷射电离导出的错离子群体的质谱分析,所述样本包括从组织、生物流体、微生物或其它细胞的样本提取的化合物的混合物;以及(ii)采用经优化谱解卷积程序以在充分短时间内(即,一秒或更短的计算时间)自动区别简化谱中的多个生物聚合物分子的质谱标志,以使得可实时做出关于同一相应样本的后续质谱分析步骤的过程的决策。
[0020] 确切地说,本发明人已经发现,通过使此些离子的质荷比受限子集经受PTR,所得产物离子的群体包括具有较低总电荷值的电荷态的简单得多的群体(其中词“较低”或“减少”在此上下文中指代在绝对值方面较低或减少),其可容易解析且指派给特定蛋白质或肽离子。因为PTR产物离子表示比原始前驱体离子小的从电荷态的复杂混合物导出的多电荷物质的子集,所以极大地简化质谱解译,且可对从微生物提取物导出的单个蛋白质或其它组分执行使用串连质谱法(MS/MS或MSn)的目标分析。
[0021] 从给定质子转移反应产生的电荷减少的蛋白质和肽产物离子产生比原始m/z值大的质荷比(m/z)值。对于具有相同m/z值但不同质量和电荷的蛋白质离子的混合物,所述混合物可在微秒或毫秒时间尺度上分离。此外,具有不同质量和电荷的相同m/z值的这些多电荷蛋白质离子可基于反应的电荷平方相依性而与从小分子、脂质、溶剂或其它干扰物导出的低m/z值背景离子分离。多电荷离子因此及时与背景信号分离因此在高度增加的信噪比(s/n)比率下产生分离蛋白质混合物。本发明人已经发现,由于这两个因素,蛋白质/肽或任何其它分析物产物离子的谱特征可以与大多数干扰物离子的那些谱特征显著分离。另外,可执行PTR反应的多个阶段以在低分辨率仪器上分离蛋白质混合物,例如线性离子阱质谱n仪,以便简化且隔离这些蛋白质和其它分析物以使得可经由MS分析执行目标分析。本发明人已进一步发现,通过与PTR反应结合执行“离子停车”程序可甚至进一步放大简单PTR反应的有利性质,因此使得系统分析师能够至少部分地选择或控制由PTR反应产生的产物离子电荷态分布。
[0022] PTR也可用以改善质谱法中的高质量性能。在质谱法中,可对离子指派整数标称质量或质荷比或者准确或确切的质量或质荷比。准确或确切的质量或质荷比可视为包括整数分量或值以及十进制分量或值。原子和分子质量是以道尔顿(Da)的单位测得,且m/z比值一般是以每基本电荷的道尔顿或Da/e或汤姆森(Th)的单位给定。应注意,在本文档中的m/z比的描述数值的实例中,此些比率应理解为以每基本电荷的道尔顿或Th的单位提供。准确或确切(即非整数)质量或m/z比可表示为整数标称质量或质荷比值或分量以及对应的十进制分量。因此,如本文档中所使用,准确质量确定或质量分析可视为包括子整数精度,即±0.5Da或更好且优选0.1Da或更好的准确性。
[0023] 替代地,准确或确切质量或m/z比可在百万分率(ppm)质量准确性方面界定。对于多肽和蛋白质的质谱确定,一般需要50ppm或更好、较优选10ppm或更好且再优选1ppm或更好的实验质量准确性,因为这些分子及其离子经常具有至少10,000Da且多达100,000Da的分子或离子量。因此,如本文档中所使用,准确质量确定或质量分析可替代地被视为包括50ppm或更好、较优选10ppm或更好且再优选1ppm或更好的准确性。
[0024] 除改善此类型分析的信噪比之外,本发明人还考虑了蛋白质离子上的电荷减少造成这些大离子在气相中再折叠,如Zhao等的《离子/离子质子转移反应对气相细胞色素C离子的构形的影响(Effects of Ion/Ion Proton Transfer Reactions on Conformation of Gas-Phase Cytochrome c Ions)》《,美国质谱学会期刊(J.Am.Soc.Mass Spectrom.)》2010,21,1208-1217中描述。据相信,这带来更紧凑的配置,其减少蛋白质离子的碰撞横截面并且因此增加其稳定性而防止由于与存在于质量分析器腔室中的背景气体分子的碰撞而分段。本发明人已经发现此效应可特别有益于采用镜像电流检测的质量分析器,例如傅里叶变换离子回旋共振(FT-ICR)质量分析器或OrbitrapTM质量分析器(可购自美国马萨诸塞州的Thermo Fisher Scientific of Waltham的一类静电阱质量分析器)中所完成。改进的高质量性能的另一潜在原因是进入由PTR过程产生的给定蛋白质离子的大的能量沉积。
由于PTR过程而沉积的能量超过100千卡/摩尔,且随后因碰撞能量的存在而有效地衰减。此快速加热过程使得可能经由离子-偶极子、离子-引发偶极子或偶极子-引发偶极子交互而附着到蛋白质的中性分子“沸腾”。最重要的是,用于高质量蛋白质的电荷态的减少可显著改善这些离子从其中通常执行PTR过程的离子导向器、离子存储或离子捕获装置的相对高压力传送到例如OrbitrapTM质量分析器等质量分析器的较低压力区。减少的电荷态意味着离子以较少动能传送,因此限制了离子散射、直接分段或亚稳定物质的形成。本发明人进一步考虑此后一种性质在例如OrbitrapTM型静电阱质量分析器等准确质谱仪中实现PTR产物离子的高准确性质量分析方面尤其显著,所述准确质谱仪检测在一延伸时间范围中通过循环离子运动产生的镜像电流。
[0025] 本发明教示尤其可用于具有超过50kDa的分子量的完整蛋白质的分析和识别。本发明人已经发现出人意料的结果,所述结果与上文提到的各种有利因素结合在一起可实现从自然微生物样本导出的极复杂混合物中准确识别多个完整蛋白质或大的肽。此识别可在物质、亚种或甚至菌株层级上实现微生物识别。目标蛋白质或多肽离子单物质或多物质可经选择以便基于先验知识或信息个别地或组合地指示特定微生物或细胞类型或者微生物或细胞类型的特定菌株或变体或者给定毒性因数或毒素在样本中的存在,或者指示微生物或细胞抵抗抗菌剂化合物或抗生素药品的能力。
[0026] 本发明在一个方面中提供对传统的从下到上蛋白质组研究方法的替代,即经由方法对从微生物细胞导出的完整蛋白质的从上到下分析,所述方法适用于大体上所有微生物,包含革兰氏阳性细菌、革兰氏阴性细菌、分枝杆菌、霉浆菌、酵母原生动物、丝状(即,微观)真菌。本发明提供甚至在含有微生物的混合物和/或直接来自纯的和/或混合培养基及来自直接样本(例如,表面签、体液等)分析的微生物的样本中在种属、物质、亚种、菌株致病变型和血清变型层级对微生物的识别。另外,本文教示的方法可用于毒性因数、抗生素抗性和易感性标记或其它特性的目标检测。本发明教示的从上到下方法是简单且快速的,因为不需要样本的化学或酶分解且实时地实现数据处理
[0027] 根据本发明教示的方法可包括以下步骤中的至少一或多个:微生物细胞中断,蛋白质的溶解,样本净化(脱盐、移除不可溶组分和残渣,和/或聚集),样本灌注或流动注入,快速部分液体层析分离,标准层析分离,等电点聚焦,溶液中蛋白质的电离,离子的给定m/z范围的隔离,致使离子的隔离范围经受PTR以便形成第一代PTR产物离子,第一代PTR产物离子的m/z范围的任选隔离,MS或MS/MS模式中的任选质谱法,任选地致使第一代PTR产物离子的隔离范围经受第二PTR反应以便形成第二代PTR产物离子,MS或MS/MS模式中的质谱法,以及经由分子量分析和/或蛋白质序列分析的微生物识别,或使用任何统计分类方法。优选但不一定地,以高分辨率、高准确性质谱仪执行质谱法步骤,例如包括OrbitrapTM质量分析器的质谱仪。
[0028] 因为执行使用化学反应剂的有限集合的常用方法,所以本发明教示的方法适合于在完全自动系统内使用以用于样本制备和质谱法。理想地,这些方法可从样本制备到结果报告都是自动的。结果可自动传送到医院的电子医疗记录系统,其中结果可直接链接到患者治疗策略、保险、记账或在流行病报告中使用。此集成系统促进了在医院、本地、地区和全球层级对流行病爆发的跟踪。对于高处理量实验室,多个系统可介接到中央计算机,所述中央计算机在报告之前整合来自不同仪器的数据。所述系统可导入表现型易感性数据,其中所述数据可与由本发明产生的识别、毒性、抗生素抗性和键入信息组合。
[0029] 本文所描述的计算方法实现有效的(1)非冗余数据相依性质谱法分析,其采用基于计算结果的质谱工作流决策,以及任选地用于个别高质量分析物及其不同复杂度的混合物的获取后数据处理。对于数据相依性质谱法分析,本文描述的新颖“最高P个唯一分析物特定群集”工作流及相关联计算代替了先前常规现有技术的“最高P个最充足前驱体”逻辑。每一此类物质相关的包络是根据本发明教示的方法指示为全部从单个唯一分子产生的相关质谱线(m/z值)的集合。每一物质相关的包络将经指示为已经从单个分子产生的各种电荷态和同位素群集分组在一起。所述方法还有用于其中未观测到可归因于同位素分布的峰(例如低分辨率数据的情况)的质谱数据或者具有经解析同位素分布但每分子仅一个电荷态的质谱数据。然而,物质相关的包络可在需要时排除在数据分析之前移除的加成物。
[0030] 可基于计算结果仅对给定物质相关的电荷态分布包络的选定代表执行串连质谱法(或更一般的MSn分析),在此之后数据获取是针对在先前MS谱中所确定的下一物质相关的电荷态分布包络(即,不同化合物的包络),等等。在各种实施例中,使用如上所述从质子转移反应(PTR)对从生物样本导出的离子子集的应用的一个或多个阶段导出的数据进行计算,所述生物样本包括蛋白质和/或多肽和其它有机分子的复杂混合物。在MSn分析之前,对计算的电荷态分布模式进行过滤以便排除同一分析物的氧化(或其它指定)物质和各种其它不希望的加成物。在此方法中,在层析时间尺度上或者在通过灌注、流动注入或借助于任何其它样本引入装置将样本引入到质谱仪中的实验中检索关于样本中的分析物的最可能的充足信息。在所有情况下,全部消除或显著减少数据获取冗余。
[0031] 经优化“最高P个唯一分析物特定群集”计算工作流可包含以下各者中的一或多者:(1)用于表示峰位置的质心的使用;(2)用于表示峰高度的二进制或简化强度尺度的使用;(3)电荷态对扫描中找到的同位素群集中的每一峰(质心)的正确计算指派;(4)用以将同位素群集(经解析或未解析)指派到适当电荷态包络的关于电荷态的信息的使用;(5)分子量的任选确定;以及(6)以每一个别电荷态包络仅允许一个(或选定数目)MSn事件的方式对数据相依性获取的控制。“最高P个唯一群集”方法可经设置以辨识且作用于给定生物聚合物的最密集电荷态、所检测最高电荷态与观测到的最密集电荷态之间的中值电荷态,或任何其它所需电荷态(即,不仅是最大或中值电荷态)或电荷态组合。所述方法因此非常适合与用于离子分段的多种离子激活方法一起使用,包含但不限于碰撞引发的解离(CID)以及电子转移解离(ETD),其是针对给定分子量范围或在其中首先查询最不充足的蛋白质物质的实例中界定。可采用类似方法用于获取后数据处理,其中将同一计算逻辑应用于在所述新颖方法的执行之前完成获取的原始MS谱。实时或获取后数据处理可进一步包含分子量确定和分析物识别。
[0032] 本发明教示的这些原理可在高分辨率串连质谱法系统上应用于各种分子量和化学性质的分析物,所述系统包含但不限于基于或包含OrbitrapTM质量分析器的质谱仪仪器。此些仪器包含Orbitrap FusionTM、Orbitrap Velos-ProTM、Q-ExactiveTM和Orbitrap EliteTM以及四极飞行时间(QTOF)质谱仪和傅立叶变换离子回旋共振(FT-ICR)质谱仪。此外,相同计算原理可应用于在用于相对极高质量分析物的高分辨率质谱法系统上获得的质谱中可见的同位素未解析电荷态包络,或应用于在例如离子阱或任何其它Paul阱配置等质量分析器上获得的单位分辨率质谱。在实例中,并非基于同位素群集的个别解析线之间的距离做出电荷确定,而是使用同一电荷态包络内的电荷态之间的距离计算这些确定。再次,此基于群集的策略可应用于单位分辨率数据以及通过线性离子阱和三重四极仪器产生的数据。
[0033] 当与层析分离结合使用时,所提议的计算工作流方法使得来自在层析运行过程期间获得的每一个别质谱的信息最大化。所述新颖方法也可以与其中通过灌注或流动注入而引入样本的质谱实验结合使用。在大多数实验情形中,所述新颖方法显著减少总分析时间。当应用于已经获取的数据时,新颖的“最高P个唯一分析物特定群集”工作流方法可使来自MS谱的信息产量最大化且可实时计算分析物的分子量。
[0034] 本发明中描述且教示的新颖原理、工作流和算法及方法在所有情况下当若干分析物在同一质谱内以质谱法(MS)可检测时适用。举例来说,可在两个或更多个分析物从层析柱共溶离且将共溶离分析物同时引入到质谱仪中的情况下采用所述新颖教示。作为第二实例,可在使用流动注入方法将两个或更多个分析物引入到质谱仪中的情况下采用所述新颖教示。在再第三实例中,可在使用针筒灌注将两个或更多个分析物引入到质谱仪中的情况下采用所述新颖教示。在再其它实例中,可在通过毛细电泳法设备或芯片实验室设备的分离之后将分析物引入到质谱仪中的情况下采用所述新颖教示。所述新颖方法可与采用任何已知电离技术的质谱仪结合使用,例如(但不限于)光电离、热喷射电离、电喷射电离(ESI)、解吸附电喷射电离(DESI)、纸喷雾电离、大气压化学电离(APCI)。
[0035] 因此,在第一方面中,揭示一种用于识别液体样本内的蛋白质/多肽或其它生物相关化合物的存在或不存在的方法,所述液体样本包括化合物的混合物,所述混合物包含多种蛋白质化合物或多种多肽化合物或多种蛋白质和多肽或其它化合物,其中所述方法包括:(a)将所述液体样本的一部分或全部引入到质谱仪的电喷射电离源中;(b)通过电喷射电离形成所述液体样本的所述部分的所述化合物混合物的带正电离子,所述带正电离子包括多个离子物质;(c)隔离包括第一质荷比(m/z)比率范围的所述离子物质的第一子集,所述范围包含所述分析物化合物的多质子化分子物质的m/z比;(d)通过致使所述隔离的离子物质的第一子集在预定持续时间中与反应剂阴离子反应而从所述隔离的离子物质的第一子集产生多个第一代产物离子物质,所述反应剂阴离子在反应后从一或多个离子物质中的包括蛋白质或多肽化合物的质子化物质的每一者提取质子;(e)使用质量分析器产生所述第一代产物离子物质或从所述第一代产物离子物质产生的第二代产物离子物质的质谱;(f)进行对所述第一代或所述第二代产物离子物质的所述质谱的搜索以找到作为所述蛋白质或多肽分析物化合物的诊断的一或多个m/z比的集合;以及(g)基于在所述质谱中识别的m/z比的集合与一或多个诊断m/z比的集合之间的相似性量度而产生所述样本内的所述分析物化合物的存在或不存在的确定。所述相似性量度可包括基于发现在经识别m/z比的测得集合中发生的一或多个诊断m/z比的所确定百分比或比例而计算的度量。替代地,可通过比较所述质谱中识别的m/z比的集合与基于蛋白质、DNA或碳水化合物的数据库中包含的集合之间的相似性量度;以及(h)使用前述信息作为使用谱库、基于序列的搜索、统计分类方法(包含但不限于贝叶斯、逻辑回归和决策树分类器)积极地识别任何未知的微生物,来确定样本内的分析物化合物的存在。作为在步骤(b)中形成带正电离子的一个替代方案,实际上可产生带负电分析物离子物质。在此些情况下,选择反应剂阴离子以便将质子转移到分析物离子物质,进而减少其负电荷的绝对值。
[0036] 在第二方面中,揭示一种识别样本中的微生物类型的存在或不存在的方法,其包括:(i)识别在所述样本中的同时存在是所述样本中的所述微生物类型的存在的诊断的一系列分子量;(ii)识别在所述样本中的同时存在是所述样本中的所述微生物类型的存在的诊断的分析物化合物列表,所述分析物化合物列表包括蛋白质化合物、多肽化合物或蛋白质和多肽化合物两者;(iii)从所述样本提取包括从样本导出的蛋白质和多肽的混合物的液体溶液;(iv)针对所述列表中的每一相应分析物化合物执行分析步骤的集合;以及(v)如果所述液体溶液内识别出所述分析物化合物列表的微生物特定分析物化合物的存在,那么识别所述样本内的微生物类型的存在。针对所述列表中的每一相应分析物执行的分析步骤包括:(a)将所述液体溶液的一部分引入到质谱仪的电喷射电离源中;(b)通过电喷射电离形成所述液体溶液的所述部分的所述化合物混合物的带正电离子,所述带正电离子包括多个离子物质;(c)隔离包括第一质荷比(m/z)比率范围的所述离子物质的第一子集,所述范围包含所述相应分析物化合物的随机或特定预定多质子化分子物质的m/z比;(d)通过致使所述隔离的离子物质的第一子集在预定持续时间中与反应剂阴离子反应而从所述隔离的离子物质的第一子集产生多个第一代产物离子物质,所述反应剂阴离子从一或多个离子物质中的包括蛋白质或多肽化合物的质子化物质的每一者自发地提取质子;(e)使用质量分析器产生所述第一代产物离子物质或从所述第一代产物离子物质产生的第二代产物离子物质的质谱;(f)进行所述第一代或所述第二代产物离子物质的所述质谱的搜索以找到作为所述相应分析物化合物的诊断的一或多个m/z比的集合;以及(g)基于所述质谱中识别的m/z比的集合与一或多个诊断m/z比的所述集合之间的相似性量度而识别所述液体溶液内的所述相应分析物化合物的存在。所述相似性量度可包括基于发现在经识别m/z比的测得集合中发生的一或多个诊断m/z比的所确定百分比或比例而计算的度量。可从谱库或序列数据库导出诊断m/z比。如果在步骤(c)中隔离的m/z比是随机多质子化分子物质,那么在步骤(f)中进行的搜索是基于序列的搜索。否则,如果在步骤(c)中隔离的m/z比是特定预定多质子化分子物质,那么在步骤(f)中进行谱库搜索。除使用前述信息作为使用谱库或基于序列的搜索而积极地识别未知微生物之外,还可利用统计分类方法(包含但不限于贝叶斯、逻辑回归和决策树分类器)用于微生物表征和识别。作为在步骤(b)中形成带正电离子的一个替代方案,实际上可产生带负电分析物离子物质。在此些情况下,选择反应剂阴离子或阳离子以便将质子转移到分析物阴离子物质,从而减少其负电荷的绝对值。本文所描述的PTR实验过程的控制可使用实时光谱解卷积实时地手动或自动执行。
[0037] 在上文中的术语“实时谱解卷积”指代质谱数据的谱解卷积,其与产生(或已经产生)所述质谱数据的质谱实验或分析运行是同时执行的。举例来说,通过在梯度溶离期间在第一保持层析滞留时间溶离的分析物的质量分析获取的质谱数据可经解卷积,以便识别分析物,同时继续在同一梯度溶离期间在第二较晚的滞留时间溶离的额外分析物的额外质谱数据的收集。同样,可执行额外质谱数据的解卷积以便识别额外分析物,同时继续在同一梯度溶离期间在第三溶离时间溶离的分析物的质谱数据的收集。可通过使用快速计算机来促进实时光谱解卷积,例如采用并行处理或图形处理单元(GPU)执行必要计算的计算机。替代地或另外,可通过使用计算上高效或经优化算法来促进实时谱解卷积,例如至少部分以汇编语言编写或广泛利用高速缓冲存储器中查找表的算法。有利地且如根据本发明教示的解卷积计算方法(附录中描述)提供,相对于在不执行解卷积计算的情况下的同一工作流,所述数学计算将不引入任何显著延迟(即,大于1.0秒)到工作流中。
[0038] 更一般地,术语“实时”可理解为意味着当参考与数据获取过程相关联的事件或活动而使用时,在所述数据获取过程的一些方面或子过程在进行中的同时发生所述事件或活动。数据获取过程自身可包含以下个别子过程中的一或多个:样本纯化(例如,固相萃取、尺寸排阻层析);样本分离(例如,层析法);进入质谱仪的样本传送(例如,溶离液从层析仪的灌注或进入);离子源中的样本电离以产生第一代离子;离子的选择和隔离以用于进一步操纵;致使从样本导出的离子的分段或从样本导出的离子与反应剂离子的反应以便产生第一代产物离子;产物离子的任选选择和隔离;产物离子的任选进一步分段或产物离子的进一步反应;离子(第一代离子或第一代或后续代产物离子)到质量分析器的传送,质量分析器的检测器对离子质荷比的检测和测量;以及从检测和测量导出的数据向用于存储、数学分析等的数字处理器的传送。如此界定的可“实时”发生的事件或活动可包含但不一定限于:样本中的分析物的存在的确定或识别;样本中的微生物的存在的识别或确定;以及向用户提供样本中的分析物或微生物的存在的识别或确定的通知。
[0039] 本发明教示的上述以及各种其它特征和优点将从以下描述和所附权利要求书变得更完全明了,或可通过如下文阐述的本发明的实践而习得。附图说明
[0040] 为进一步阐明本发明的以上和其它优点及特征,将参照附图中说明的其特定实施例呈现本发明的更具体描述。应了解,这些图只是描绘了本发明的所说明的实施例,且因此不应当被看作限制了本发明的范围。本发明将以额外特殊性和细节经由使用随附图式进行描述和阐述,附图中:
[0041] 图1是示意性地说明用于来自至少一个微生物的可溶蛋白质的快速提取和分析以用于识别所述至少一个微生物的系统的框图
[0042] 图2是适合于与根据本发明教示的方法结合采用的示范性质谱仪的示意性表示,所述质谱仪包括混合系统,所述混合系统包括四极滤质器、双压力四极离子阱质量分析器和静电阱质量分析器;
[0043] 图3A是根据本发明教示的第一方法的流程图
[0044] 图3B是根据本发明教示的替代方法的流程图;
[0045] 图3C是根据本发明教示的另一替代方法的流程图;
[0046] 图3D和图3E说明根据本发明教示的又一替代方法的流程图;
[0047] 图3F是根据本发明教示的再另一替代方法的流程图;
[0048] 图4A是经由典型大肠杆菌提取物的直接输注的ESI质谱;
[0049] 图4B是通过隔离以m/z=750Th为中心的2Th质量窗口内的图4A的大肠杆菌提取物的离子且使隔离的离子与PTR反应剂阴离子反应而产生的PTR产物离子质谱;
[0050] 图5A是通过隔离以1200Th为中心的宽度5Th的质量窗口内的大肠杆菌提取物的离子且使隔离的离子与PTR反应剂阴离子反应而产生的第一代PTR产物离子的质谱;
[0051] 图5B是通过隔离以1320Th为中心的宽度5Th的质量窗口内的图5A的第一代PTR产物离子的离子且第二次使隔离的第一代产物离子与PTR反应剂阴离子反应而产生的第二代PTR产物离子的质谱;
[0052] 图6A是通过隔离以640Th为中心的宽度5Th的质量窗口内的大肠杆菌提取物的离子且使隔离的离子与PTR反应剂阴离子反应而产生的PTR产物离子的质谱;
[0053] 图6B是选自图6A的产物离子集合且具有833Th的m/z比的隔离的PTR产物离子物质的质谱;
[0054] 图6C是通过图6B的隔离的PTR产物离子物质的碰撞引发的解离(CID)产生的第二代产物离子的质谱;
[0055] 图6D是选自图6A的产物离子集合且具有926Th的m/z比的隔离的PTR产物离子物质的质谱;
[0056] 图6E是通过图6D的隔离的PTR产物离子物质的碰撞引发的解离产生的第二代产物离子的质谱;
[0057] 图6F是选自图6A的产物离子集合且具有917Th的m/z比的隔离的PTR产物离子物质的质谱;
[0058] 图6G是图6F的隔离的PTR产物离子物质的碰撞引发的解离产生的第二代产物离子的质谱;
[0059] 图7A是根据本发明教示的通过电喷射产生的第一代前驱体离子的多个m/z范围的同时隔离和反应进行的选定分析物的离子向PTR产物离子集合的改进效率的PTR转换的方法的示意性绘图;
[0060] 图7B是如离子的改进效率的PTR转换方法的初始步骤中可采用的用于PTR反应的电喷射产生的第一代前驱体离子的第一随机所选范围的隔离的示意图;
[0061] 图7C是如可用作离子的改进效率的PTR转换的方法的中间步骤的对应于不同分析物分子的PTR产物离子的两个电荷态序列的辨识的示意性绘图;
[0062] 图8是根据本发明教示的选定分析物的离子向PTR产物离子集合的改进效率的PTR转换的方法的流程图;
[0063] 图9A是在大肠杆菌提取物的十分钟梯度反相液相层析分离的过程期间在10分钟30秒的滞留时间下从溶离液产生的第一代离子的全扫描质谱;
[0064] 图9B是在以750Th为中心的10Th宽隔离窗口内使六氟化硫与图9A的样本的隔离离子群体反应10ms产生的PTR产物离子谱;
[0065] 图10A是在大肠杆菌提取物的六十分钟梯度反相液相层析分离的过程期间在42分钟30秒的滞留时间下从溶离液产生的第一代离子的全扫描质谱;
[0066] 图10B是通过在以750Th为中心的10Th宽隔离窗口内使六氟化硫与图10A的样本的隔离离子群体反应10ms产生的PTR产物离子谱;
[0067] 图11A是在三十分钟梯度反相液相层析分离的过程期间在18分钟9秒的滞留时间下从溶离液产生的第一代离子的全扫描质谱;
[0068] 图11B是通过在以750Th为中心的10Th宽隔离窗口内PTR反应剂离子与图11A的样本的隔离离子群体的反应产生的PTR产物离子谱;
[0069] 图11C是在图11A中标绘了其较早溶离结果的同一三十分钟梯度反相液相层析分离的过程期间以22分钟27秒的滞留时间从溶离液产生的第一代离子的全扫描质谱;
[0070] 图11D是通过在以750Th为中心的10Th宽隔离窗口内PTR反应剂离子与图11C的样本的隔离离子群体的反应产生的PTR产物离子谱;
[0071] 图12A是展现良好解析层析峰的两个分析物的简单基于强度阈值的数据相依性质谱分析的示意性说明;
[0072] 图12B是具有两者均高于分析阈值的高度重叠溶离峰的层析图的一部分的示意性说明;
[0073] 图12C是两个同时溶离的生物聚合物分析物的多个交错质谱峰的图示;
[0074] 图13是从大肠杆菌提取物的单个液相层析质谱法实验运行收集的一组层析图,其包含总离子电流层析图(顶部曲线)并且还说明贡献于总离子电流的各种提取离子层析图(下部曲线),每一提取离子层析图表示相应的m/z比范围;
[0075] 图14是根据本发明教示的各种方法采用的一般步骤集合的流程图;
[0076] 图15是根据本发明教示的将以实验方式测得的质谱质心转换为占用阵列的方法的流程图,所述阵列具有通过囊封于矩阵中的电荷态而彼此相关的索引;
[0077] 图16是根据本发明教示的用于从以实验方式确定的质谱质心数据在数学变换质荷比空间内构造布尔型占用阵列的方法的流程图;
[0078] 图17A和接续的图17B是根据本发明教示的用于为多个以实验方式确定的质谱质心指派试验性电荷态的方法的流程图;
[0079] 图18是根据本发明教示的用于调整先前尝试性地指派的电荷态的集合以使得所得最终经指派电荷态自一致的方法的流程图;
[0080] 图19是根据本发明教示的用于将具有经指派电荷态的以实验方式确定的质心的集合分解为分析物特定群集的方法的流程图;
[0081] 图20A和接续的图20B、20C和20D是展示典型分子量、最充足同位素中的C13原子的预期数目(模式)、所有同位素当中的C13原子的预期平均数以及预期平均数与模式之间的差,因为它们随着蛋白质中的C12原子的总数变化;
[0082] 图21A、21B、21C和21D是计算机屏幕用户接口的绘图,其可与对采用根据本发明教示的方法的计算机软件的用户控制和来自所述计算机软件的信息显示相结合;
[0083] 图22A是说明如由采用根据本发明教示的方法的计算机软件产生的峰群集分解结果的计算机屏幕信息显示的描述,其是从由细胞色素C、溶菌酶、肌血球素、胰蛋白酶抑制剂和碳酸酐酶组成的五组分蛋白质混合物的质谱所计算;
[0084] 图22B是说明如由采用根据本发明教示的方法的计算机软件产生的峰群集分解结果的计算机屏幕信息显示的描述,所述显示说明图22A中所示的分解结果的扩展部分;
[0085] 图22C是说明如由采用根据本发明教示的方法的计算机软件产生的峰群集分解结果的计算机屏幕信息显示的描述,所述显示说明图12B中所示的分解结果的甚至进一步扩展部分;
[0086] 图23A是说明如由采用根据本发明教示的方法的计算机软件产生的峰群集分解结果的计算机屏幕信息显示的描述,所述显示说明从直接灌注到质谱仪中的细菌大肠杆菌的粗提取物的单级质谱计算的峰群集分解结果;
[0087] 图23B是说明如由采用根据本发明教示的方法的计算机软件产生的峰群集分解结果的计算机屏幕信息显示的描述,所述显示说明图23A中所示的分解结果的扩展部分;
[0088] 图23C是图23A-23B中展示其峰群集分解的质谱数据的描述,展示如由常规质谱峰分析计算机程序提供的峰位置和电荷态指派;
[0089] 图23D是图23A-23B中展示其峰群集分解的质谱数据的描述,展示如由根据本发明教示的方法提供的电荷态指派;
[0090] 图24A是具有变化程度的糖基化的完整抗体的质谱的描述(主绘图),还展示(插图)说明所述抗体的不同糖型的谱的扩展部分;
[0091] 图24B是说明如由采用根据本发明教示的方法的计算机软件产生的峰群集分解结果的计算机屏幕信息显示的描述,其是从图24A中所示的质谱数据计算,展示范围从148378Da到148763Da的抗体的四个经分解糖型的计算的分子量;
[0092] 图25A是由在m/z=807.00Da处发生的蛋白质的+26电荷态的碰撞引发的解离产生的蛋白质碳酸酐酶II的MS2谱的描述,展示如由常规质谱分析方法所确定的峰指派;
[0093] 图25B是说明如由采用根据本发明教示的方法的计算机软件产生的峰群集分解结果的计算机屏幕信息显示的描述,其是从图25A中所示的MS2质谱数据计算;
[0094] 图25C是由在m/z=1001.00Da处的蛋白质的+21电荷态的碰撞引发的解离产生的蛋白质碳酸酐酶II的第二MS2谱的描述,展示如由常规质谱分析方法所确定的峰指派;以及[0095] 图25D是说明如由采用根据本发明教示的方法的计算机软件产生的峰群集分解结果的计算机屏幕信息显示的描述,其是从图25C中所示的MS2质谱数据计算。

具体实施方式

[0096] 呈现以下描述以使得所属领域的技术人员能够制作并使用本发明,并且在特定应用以及其要求的背景下提供以下描述。对于所属领域的技术人员而言,对所描述的实施例的各种修改将是显而易见的,并且本文中的通用原理可以应用到其它实施例。因此,本发明并不希望限于所示的实施例和实例,而是应被赋予根据权利要求书的最广可能的范围。本发明的特定特征和优点将与本文档的主体中的以下描述结合参考附图1到11D以及与本文档的附录中的描述结合的图12A到25D变得更显而易见。
[0097] 现参看图1,示意性地说明用于从一或多种微生物提取蛋白质、检测所述蛋白质且识别所述一或多种微生物的系统100。系统100包含样本处置装置115、可由样本处置装置115接达的样本110,以及反应剂、缓冲剂及类似物的源120,这些源通过各种管道或其它传输线流体地耦合到样本处置装置115。系统100进一步包含第一以及任选地第二样本纯化装置135(例如固相萃取盒),其经配置以用于清洁样本(例如,去盐、移除污染物、聚集蛋白质),以及任选的层析柱140,其可经配置以用于通过在质谱分析之前的液相层析而至少部分地纯化样本110。至少一个样本纯化装置135可包括直列式尺寸排阻层析柱,其可用以不仅移除盐而且还移除小分子和脂质。样本110、第一和任选的第二样本纯化装置135以及任选的层析柱140与流体处置130、各种反应剂、缓冲剂和其它流体120以及质谱仪150成流体连通。
[0098] 样本处置装置115能够准备含有一或多种微生物的某一范围的样本类型,且将从所述微生物提取的可溶蛋白质部分递送到质谱仪150用于分析。样本110可为疑似含有一或多种微生物的任何类型,包含但不限于来自培养基板的隔离的群落、来自液体生长介质的细胞、血液、血培养基、唾液、尿、粪便、痰液、伤口和身体部位棉签、土壤、食物、饮料、水、空气以及环境表面棉签。
[0099] 样本处置装置115可包含细胞中断构件、机器人液体处置构件、离心机、过滤构件、孵育箱、混合构件、真空泵、流体泵以及反应剂120中的一或多者,其可用于微生物的中断以及可溶蛋白质部分的隔离。细菌、真菌、霉浆菌细胞、病毒及类似物的中断可通过机械、化学、酶和其它方式实现,如此项技术中通常已知。机械方法包含打珠、例如French压机及类似物的压力的使用、超声处理或此项技术中已知的其它方法。化学方法包含暴露于例如尿素、硫脲或胍HCl等离液剂以使微生物细胞裂解且溶解其内含物。替代地,有机酸/溶剂混合物可用来破坏细胞。酶方法包含使用溶菌酶、溶葡球菌酶或其它裂解酶类以在细菌细胞壁中形成“孔”,其允许内含物渗出到周围溶液中。
[0100] 如图1中所说明,系统100进一步包含任选的控制单元160,其可通过联动装置170a-170d链接到系统100的各种组件。举例来说,控制单元160可链接到样本110以控制样本施加,链接到反应剂120以控制各种反应剂的施加,链接到泵130以控制流体处置、流动速率等,链接到样本处置装置115以控制样本准备,且链接到质谱仪150以控制质谱法参数。在所说明的实施例中,控制单元160也可充当数据处理单元以例如处理来自质谱仪150的数据,或将数据转发到服务器以用于处理和存储(图1中未图示服务器)。控制单元160也可实n
时确定PTR产物离子的任何产生的分子量和电荷态以用于MS/MS、MS 或分子量确定。控制单元160也可用以将结果自动转发到医疗保健专业人士。
[0101] 在一些实施例中,系统100经设计以由临床医生或一般实验室技术员使用,其不一定在样本准备、LC-MS操作、LC-MS方法开发及类似等所有方面中都有专业技能。因此,控制单元160可经设计以通过为用户提供简化应用程序接口而囊封数据系统环境,所述应用程序接口可用以起始且监视测定样本110的基本上所有方面而不需要用户与系统100的总体硬件和控制系统交互。控制单元160因此经配置以提供用户与控制着装置、数据文件和用于将数据转换为用户可读形式的算法的底层服务之间的分离程度。即,控制单元160使得用户不需要知道或控制硬件以用于分析临床样本,且提供简化接口以从质谱仪发送和接收信息。
[0102] 控制单元160可经配置以内部地监视每一样本分析请求,且能够通过系统100始终跟踪分析请求。一旦系统100正在获取或已经获取样本110的数据,则控制单元160可经配置以基于由用户选择的测定类型而自动开始后处理数据。最重要的是,控制单元160可经配置以在获取过程期间实时处理数据。此处实时地将结果返回到用户,其包含微生物识别、毒性和抗性表征、菌株匹配信息,以及关于抗生素易感性测试的数据。此外,控制单元160可经配置以基于由用户选择的测定类型而自动选择后处理参数,从而一旦测定已选定且开始用于分析则进一步减少用户与系统交互的需要。控制单元160可被设计为配合于系统100与用户之间的层,以减少设置样本测定以用于获取所需的复杂性。控制系统160还可经配置以仅将最相关数据返回到用户以避免用户接收太多的额外信息。
[0103] 在一个实施例中,系统100可进一步包含可操作地耦合到样本处置装置115或与其集成的样本检测装置(未图示)。所述样本检测装置可与样本处置装置115一起工作或独立于样本处置装置115而执行以下功能中的至少一者:i.识别进入系统的样本;ii.识别用于进入系统的样本的测定类型;iii.基于预期测定类型和/或所关注的分析物而选择测定协议;iv.引导样本处置装置和/或控制系统以起始对样本中所关注的分析物的分析;v.引导控制系统基于针对测定类型和/或所关注的分析物选定的测定协议而选择一或多种反应剂;vi.引导控制系统基于针对测定类型和/或所关注的分析物选定的测定协议而选择液相层析移动相条件,且致使液相层析系统执行测定和/或纯化所关注的分析物;vii.引导控制系统基于针对测定类型和/或所关注的分析物选定的测定协议而选择质谱仪设定,且致使质谱仪产生与选定测定类型和/或所关注的分析物相关联的质谱数据;以及viii.引导控制系统分析与选定测定类型和/或所关注的分析物相关联的质谱数据以识别所关注的分析物的存在和/或浓度。
[0104] 样本或经处理样本可在质谱法的分析之前经净化和或纯化。此纯化或样本净化可指代从粗细胞提取物移除盐或脂质的程序,或使所关注的一或多种分析物相对于样本的一或多种其它组分变丰富的程序。其也可指代具有用于处置分枝杆菌或丝状真菌的生物安全三级机构的单独实验室中的样本处理和净化。在此实施例中,样本传送到系统且可如先前所描述进行分析。在一个实施例中,此纯化或样本净化可通过固相萃取装置、直列式尺寸排阻层析和/或任选的层析柱140实现。
[0105] 在一个实施例中,第一和/或第二样本纯化装置135可包含固相萃取(SPE)盒。在一些实施例中,SPE盒可直接与高分辨率/高质量准确性质谱仪150成直列式。在一个实施例中,SPE盒可为具有具有小体积的二氧化或其它吸附剂的聚丙烯尖端,其含有固定于盒中的键合的C4、C8或C18或其它官能团,例如StageTipTM盒(Thermo Fisher Scientific)。在替代实施例中,可使用聚合吸附剂或螯合剂。床体积可小达1μL或更小,但也可以使用较大体积。所述设备和方法良好地适合于从微生物细胞导出的复杂样本,因为每一SPE盒仅使用一次,从而使从一个样本到另一样本的残留问题最小化。
[0106] 在一个实施例中,样本纯化装置135可为直列式尺寸排阻层析柱,其经设计以从样本110移除盐、小分子和脂质。所述方法还可用以分离媒介与大分子量蛋白质。将相选择为与部分(即,少于100%)有机溶液和有机酸相容。相可适应分子量从103到108Da不同的蛋白质尺寸分布。实时经调流动速率以实现完整蛋白质从小分子的分离,其中分离流动速率通常比用以从系统移除小分子、脂质和盐的较高流动速率小得多。在此实施例中,样本纯化装置135也可以经加热以促进完整蛋白质的较快扩散速率,因此显著缩短运行时间。移动相通过样本纯化装置135的流动也可以在净化过程的一部分期间分流,以从流动的流移除某些杂质且防止其进入质谱仪150。
[0107] 在一个实施例中,任选的层析柱140可包含经配置以用于样本中的蛋白质的至少部分层析分离的柱。层析柱中的固定相可为多孔或非多孔的二氧化硅或琼脂糖颗粒,或所述柱内部聚合或另外形成的单材料。所述固定相可涂覆有适当材料,例如C18、C8、C4或另一合适的衍生物,或含有阳离子交换剂或其它材料,或以上的组合以促进蛋白质的分离,且此材料可以化学方式键合到颗粒或在所述柱内为单块的。颗粒大小通常在1.5μm到30μm的范围内变化。孔径可以在50到300埃的范围内变化。柱的内径通常在50μm到2.1mm的范围内变化,且柱长度在约0.5cm到25cm的范围内或以其它方式变化。移动相或溶离剂可为纯溶剂或者两种或更多种溶剂的混合物,且可含有添加的盐、酸和/或其它化学改质剂。蛋白质基于一或多个生理化学性质在柱上分离,包含大小、净电荷、疏水性、亲和力或其它生理化学性质。层析分离方法包含离子交换、尺寸排阻、HILIC、疏水性交互、亲和力、正常相或反向相层析法中的一或多者。
[0108] 纯化样本的额外方法可包含(不限于)液相层析、HPLC、UHPLC、沉淀、固相萃取、液-液提取、透析、亲和力捕获、电泳、过滤、超过滤或此项技术中已知用于纯化的其它合适的方法。
[0109] 已经描述涉及在质谱法分析之前使用HPLC用于样本净化的各种方法。所属领域的技术人员可选择适合于在本发明中使用的HPLC仪器和柱。层析柱通常包含媒介(即,填充材料)以在空间和时间上促进化学部分的分离。所述媒介可包含极小颗粒,其可具有与各种化学部分交互以促进所关注的分析物的分离的键合表面。一个合适的键合表面是疏水性键合表面,例如烷基键合表面。烷基键合表面可包含C4、C8或C18键合烷基。另外,也可以使用现有技术水平中已知的单块和其它相。层析柱包含用于接收样本的入口端口以及用于排放包含部分分离样本的流出物的出口端口。举例来说,测试样本可在入口端口处施加于柱,以溶剂或溶剂混合物溶离,且在出口端口处排放。在另一实例中,多于一个柱可循序地使用或作为二维(2D)层析法系统,其中测试样本可在入口端口处施加于第一柱,以溶剂或溶剂混合物溶离到第二柱上,且以溶剂或溶剂混合物从所述第二柱溶离到出口端口。可选择不同溶剂模式用于溶离分析物。举例来说,可使用梯度模式、等度模式或多型(即混合)模式执行液相层析。
[0110] 图2是可用作图1的质谱仪150的示范性质谱仪150a的示意性绘图。在图2中说明的质谱仪是混合质谱仪,包括多于一个类型的质量分析器。具体地说,质谱仪150a包含离子阱质量分析器216以及OrbitrapTM分析器,其为一类静电阱质量分析器。如下文将描述,由于根据本发明教示的各种分析方法采用多次质量分析数据采集,因此混合质谱仪系统可有利地用以通过同时使用两个或更多个分析器而改善工作循环。OrbitrapTM质量分析器212采用镜像电荷检测,其中通过借助离子阱内的离子的运动检测电极上引起的镜像电流而间接检测离子。
[0111] 在质谱仪150a的操作中,电喷射离子源201提供待分析的样本的离子到撇渣器202的孔隙,在此处离子进入第一真空腔室。在进入之后,由堆叠环离子导向器204将离子捕获且聚焦为密集束。第一离子光学传送组件203a将束传送到下游的质谱仪的高真空区。大多数剩余的中性分子和不合意的高速度离子群集(例如溶合离子)通过弯曲束导向器206从离子束分离。中性分子和离子群集跟随直线路径,而所关注的离子由曳力场引起弯曲约九十度转弯,从而产生分离。
[0112] 质谱仪150a的四极滤质器208在其常规意义上用作可调谐的滤质器以便仅在选定窄的m/z范围内使离子通过。后续离子光学传送组件203b将经过滤离子递送到弯曲四极离子阱(“C阱”)组件210。C阱210能够沿着四极滤质器208与离子阱质量分析器216之间的路径传送离子。C阱210也具有临时收集且存储离子群体并且然后将离子作为脉冲或包递送到OrbitrapTM质量分析器212中的能力。离子包的传送是通过在C阱210与安置于C阱210和TMOrbitrap 质量分析器212之间的一组注入电极211之间施加电位差来控制。C阱的曲率经设计以使得离子群体在空间上聚焦以便匹配OrbitrapTM质量分析器212的入口孔径的接受
[0113] 多极离子导向器214和光学传送组件203b用来在C阱210与离子阱质量分析器216之间导引离子。多极离子导向器214提供临时离子存储能力以使得在分析方法的第一处理步骤中产生的离子可稍后被取得以用于后续步骤中的处理。多极离子导向器214也可充当分段单元。沿着C阱210与离子阱质量分析器216之间的路径的各种栅电极是可控的,以使得离子可在任一方向上传送,这取决于任何特定分析方法中所需的离子处理步骤的序列。
[0114] 离子阱质量分析器216是双压力线性离子阱(即,二维阱),其包括高压线性阱单元217a和低压线性阱单元217b,所述两个单元定位成邻近于彼此,通过具有小孔隙的板透镜分隔开,所述小孔隙准许所述两个单元之间的离子传送且呈现泵送限制并允许在所述两个阱中维持不同的压力。高压单元217a的环境有利于离子冷却、通过碰撞引起的解离或电子转移解离的离子分段,或例如质子转移反应等离子-离子反应。低压单元217b的环境有利于以高分辨力和质量准确性进行分析扫描。低压单元包含双倍增极离子检测器215。
[0115] 质量分析方法内的电子转移解离或质子转移反应的步骤的使用需要在质谱仪内引起受控离子-离子反应的能力。离子-离子反应又需要产生反应剂离子以及致使反应剂离子与样本离子混合的能力。如图2中所描绘的质谱仪150a说明两个替代的反应剂离子来源,第一反应剂离子源299a安置于堆叠环离子导向器204与弯曲束导向器206之间,且第二反应剂离子源299b安置在仪器的相对端,邻近于线性离子阱质量分析器216的低压单元217b。大体上,任何特定系统将至多仅包含一个反应剂离子源。然而,此处为了说明性目的而描绘且论述两个不同反应剂离子源。虽然以下论述是针对用于PTR的反应剂离子源,但类似论述可应用于ETD反应剂离子源。
[0116] 第一可能的反应剂离子源299a可位于堆叠环离子导向器204与弯曲束导向器206之间。反应剂离子源299a包括辉光放电单元,其包括暴露于反应剂气体导管298a的一对电极(阳极阴极),所述反应剂气体导管从具有使反应剂化合物挥发的加热器的反应剂液体(或固体)储集器297a递送反应剂气体。当跨电极施加高电压时,起始辉光放电,其使在电极之间流动的反应剂电离。来自辉光放电源的反应剂阴离子被引入到在四极滤质器208前方的离子光学元件路径,在其内它们可进行m/z选择。反应剂离子接着可在多极离子导向器214中积聚,且随后传送到双压力线性离子阱216的高压单元217b中,在其内使得它们可用于PTR反应。反应产物可直接传送到低压力单元217a或OrbitrapTM质量分析器212用于m/z分析。
[0117] 可能的替代反应剂离子源299a可邻近于低压力线性阱单元217b定位,在此其可包括额外高真空腔室292,反应剂离子可以从所述高真空腔室通过腔室292与高压单元之间的孔隙而引导到高压力单元217b中。在操作中,气态反应剂化合物从具有使反应剂化合物挥发的加热器的反应剂液体(或固体)储集器297b供应,且被引导通过反应剂气体导管298b,所述反应剂气体导管将反应剂气体递送到部分地被限制的离子产生体积296中。在操作中,从电加热长丝294供应的热离子电子通过在长丝294与加速器电极(未图示)之间施加电位而以某一预定能量引导到离子产生体积296中。供应的高能电子造成反应剂气体的电离以便产生反应剂离子。反应剂离子接着可在栅电极(未图示)的操作下由离子光学传送组件203a导引到高压单元217b中。
[0118] 根据本发明教示的示范性方法在图3A到3F中所示的流程图中示意性地说明。图3A示意性地说明用于监视生物样本中的某些特定目标分析物蛋白质或肽的存在且任选地对其进行量化的第一此类示范性方法方法300。举例来说,所述样本可为微生物的样本。方法300的初始步骤302、304和306分别是细胞裂解(如果所述样本是微生物或其它细胞的样本)和提取、固相净化或尺寸排阻层析和层析分离的步骤,如上文所描述。步骤302可仅在所述样本包括组织样本、细菌细胞样本、另一微生物的细胞样本或另一形式的细胞样本的情况下适用。在一些实验情形中,可在后续样本引入步骤308中将所提取样本直接灌注到质谱仪中,因此,步骤304和306由虚线展示为任选的。也可以使用离线方法制备样本,包含透析或现有技术水平中已知的其它技术。然而,在许多其它实验情形中,步骤304和306是有用的以便在质谱分析之前至少部分地纯化样本。
[0119] 当必须根据时间约束完成分析时,如一些临床应用中,分析所需的时间可通过采用SPE步骤304(如发明人Enke的U.S.5,175,430中所描述的时间压缩层析法步骤)或如国际(PCT)专利申请公开案WO 2013/166169 A1中所描述的层析法步骤306中的“快速部分层析分离”(FPCS)的方法而缩短。大体上,在执行FPCS中,含有各种有机和无机分析物的复杂混合物的微生物细胞的粗提取物(小有机分子、蛋白质及其天然产生片段、脂质、核酸、多糖、脂蛋白等)加载于层析柱上且经受层析法。然而,并非允许梯度来单独地溶离每一分析物(理想地,每层析峰一种分析物),而是有意加速所述梯度以使得在例如近似八分钟或更短时间内、且优选地五分钟或更短时间内大体上不获得层析峰,而不是获得基线分离原本将需要的长得多的运行时间。在FPCS分离中,许多分析物是根据其性质以及使用的层析法的类型(反相、HILIC等)而在任何给定时间从柱有意地共溶离。部分或不完全分离也可通过所属领域的技术人员已知的其它方法实现,包含但不限于减少化合物在柱上的保持的移动相溶剂和/或改质剂的使用,减少化合物在柱上的保持的固定相媒介的选择(包含粒度、微孔尺寸等),层析系统以较高流动速率的操作,层析系统以高温的操作,或不同层析分离模式(即,反相、尺寸排阻等)的选择。FPCS技术产生很少或可能不产生跨越整个梯度的解析层析峰。因此,从层析图导出的大体上仅相关信息是从柱的溶离时间。记录的每一质谱表示共溶离分析物的“子集”,其随后经电离、在质量分析器中分离且被检测。
[0120] 在步骤308(图3A)中,将样本引入到质谱仪中。所述样本可提供为从SPE盒、层析法设备或替代地通过溶离液溶液的直接输注而出现的溶离液材料。在提供到质谱仪后,通过质谱仪的电喷射电离源将样本化合物电离(步骤308)。这些电喷射产生的离子在本文称为“第一代”离子。在此时,可任选地执行完整或分段MS1扫描(步骤309)以便识别m/z空间中的富蛋白质区。(应注意在本文档中,可采用术语“扫描”来当用作名词时一般指代质谱,或替代地当用作动词时指代质谱的获取)。在优选实施例中,可在质谱仪仪器的完整质量范围上获得MS1扫描以便能够随后以数据相依或独立方式选择谱的富信息部分以用于隔离(步骤310)。然而,在目标分析的情况下,MS1扫描可能是不必要的,且方法300的执行可直接继续到步骤310,其中随后隔离离子的子集以用于进一步反应和分析。当采用目标分析时,在步骤310中执行的隔离可以使得某一预定m/z范围或可能多个预定m/z范围内的离子被保持以用于后续反应和分析,而一或多个预定m/z范围外的离子被丢弃。预定m/z范围经选择以便对应于目标分析物蛋白质或肽的优选地已知m/z比,在方法的执行中检测或监视所述目标分析物蛋白质或肽的存在或数量。
[0121] 大体上,可以已知方式通过将来自离子源的离子引入到离子阱(例如三维离子阱、弯曲离子阱(有时称为“C阱”)、单片段线性离子阱、多分段线性离子阱、多极离子导向器或四极滤质器)中,并且然后通过跨离子阱的电极对施加补充AC电压或施加适当RF/DC电压比以隔离所关注的离子群体而共振地喷出m/z比在所希望范围之外的离子,来执行步骤310的隔离。在一些实施例中,补充电压的频率可扫过各种频率以使得离子根据其m/z比按顺序喷出。在此些情况下,可在离子喷出时检测离子以便产生离子的原始集合的质谱。然而,由于在此阶段可能不需要质谱,因此可替代地施加补充AC电压作为叠加频率的组合,其经选择以便造成m/z比在所希望范围之外的离子的基本上同时排出。在一些实施例中,叠加频率的组合可具备遗失频率的多个片段(即,“缺口”)以使得包括两个或更多个非邻接m/z比范围的离子在阱内同时隔离。非邻接m/z比范围中的每一个可对应于相应唯一目标分析物蛋白质或肽的优选地已知m/z比。四极滤质器的施加RF/DC电压比率也可用以隔离所关注的经界定或目标质量范围。第一代离子的特定m/z范围是通过单个或一系列固定RF/DC电压比率而选择以便选择适当的质量隔离窗口。在此情况下采用的起作用的配置可为混合质谱仪仪器,其包括四极、C阱、OrbitrapTM质量分析器以及高能量碰撞池(HCD),其中隔离的离子群体可存储在C阱或HCD池中用于PTR实验。第一代离子的隔离群体在本文称为“前驱体”离子,因为这些离子将经受后续离子-离子反应或分段。
[0122] 在优选实施例中,前驱体离子群体的隔离可在分段线性离子阱的第一片段中执行。在所需离子群体的隔离之后,多电荷蛋白质离子群体可有利地移动到线性离子阱的另一片段。这些步骤可在PTR过程之前针对前驱体离子的隔离的经界定范围重复多次。
[0123] 接着,使用具有化学电离的基于铼的长丝或辉光放电电离源从合适的基于高电子亲和性的气态反应剂产生阴离子。可使用氮气、甲烷、异丁烷或现有技术水平中的其它已知气体执行化学电离。阴离子反应剂可为在室温下的气体,或可为具有足够蒸气压力以产生过量阴离子的液体,所述过量阴离子将在伪一级反应条件下驱动PTR过程。阴离子随后从源区传送到分段线性阱,借此使用如上文所描述的补充AC电压使特定阴离子反应剂质量隔离。阴离子源可与电喷射源成直列式或安装在分段线性离子阱的相对端上。替代地,四极滤质器也可执行阴离子隔离,其中后续PTR过程在仪器的C阱或HCD池中发生。
[0124] 在方法300(图3A)的步骤312中,在步骤310中经质量隔离的离子(即,“前驱体”离子)经受质子转移反应,其中反应剂阴离子物质在指定时间周期中与离子阱中的样本前驱体离子反应以便从前驱体阳离子提取质子。在一个实施例中,通过调整分段线性离子阱的DC电压偏移以便存储多电荷正离子与单电荷阴离子以促进PTR过程,而使多电荷前驱体离子群体与单电荷阴离子群体反应。反应剂阴离子经选择以使得在此实例中反应剂阴离子表现为 -Lowry,且使得前驱体离子表现为一或多种 -Lowry酸。反应剂阴离子是通过具有足够蒸气压力的合适的反应剂气体/液体的单独电离而形成,其包含(但不限于)六氟化硫、全氟-1,3-二甲基环己烷、全氟烷以及全氟菲烷。在允许反应继续指定时间之后,跨越离子阱的电极施加补充AC电压以便排出反应剂阴离子,从而在离子阱内留下产物离子并且可能留下一些残余前驱体离子。
[0125] 在相反极性实验中,从蛋白质或其它生物分子导出的多电荷阴离子也可与单电荷阳离子反应。可采用多种源来产生单电荷阳离子,包含电子、化学和电喷射电离过程。这些反应遵循先前描述的相同反应动力学。典型反应剂阳离子包含吡啶、苯并(f)喹诺以及惰性气体氩和氙。另外,相反极性的多电荷蛋白质也已反应,以及来自核酸的多电荷阴离子与蛋白质的多电荷阳离子也已反应。
[0126] 在方法300(图3A)的步骤314中,从在所关注的m/z比的完整范围中保持于离子阱中的来自PTR过程的产物离子获得质谱。可用已知方式通过按其m/z比次序检测从3D或线性离子阱循序地喷出的离子而获得质谱。替代地,可将离子引导到质谱仪的不同质量分析器,例如飞行时间(TOF)质量分析器或OrbitrapTM型静电阱质量分析器,以用较大准确性或质量分辨率进行分析,随后通过离子阱的顺序扫描而可用。此外,通过将产物离子引导到单独分析器,在正执行质量分析时可以对离子阱重新填充前驱体离子的新样本。如果准确质量分析器是检测由离子阱内的循环离子运动产生的镜像电流的类型,例如FT-ICR质量分析器或OrbitrapTM质量分析器,那么PTR反应步骤可有利地减少目标蛋白质或多肽分子的碰撞横截面,以使得这些分子在阱中保持稳定足够的时间长度以产生高质量质谱。并且,PTR产物离子当在其传送到OrbitrapTM质量分析器后离开高压力C阱区时将具有较少动能。由于PTR过程,所得产物离子群体将完全去溶剂化,这将改善所得质谱的质量。
[0127] 在方法300的步骤316中,自动检查由在步骤314中执行的质量分析产生的质谱,以便辨识一或多个个别系列的相关m/z比,其中一系列的每一m/z比表示单个完整蛋白质或多肽分子的相应不同电荷态,即不同质子化程度。举例来说,参见图7C,其描绘两个不同系列的行,分别由包络905和包络906表示。在电离之后以及在PTR反应之后,具有质量mp的每一蛋白质或多肽分子M表示为至少一种(且可能若干不同)蛋白质或多肽阳离子物质。由特定z+分子M形成的相关系列的每一此类阳离子物质可由化学式(M+zH) 表示,其中整数z是加合到原始分子的质子的数目或是在PTR步骤之后在蛋白质上剩余的质子的数目。在此实例中,仅考虑单同位素离子,质荷比(m/z)ion因此如下给出:
[0128] (m/z)ion≈(mp+z×1.007)/z≈(mp+z)/z≈mp/z     (等式1)
[0129] 其中最终近似是得自mp>>z的事实。因此,仅表示质子化的不同状态的此系列的离子物质可通过实时使用自动软件以确定单同位素离子而容易辨识。一旦已经辨识出此系列,便可实时辨别母代蛋白质或多肽分子的分子质量mp。也可以使用平均或单同位素质量将类似方法应用于较大分子量的分子。质谱数据的自动检查以及相关m/z比的一或多个个别系列的辨识可通过具体地说为此目的设计的许多已知质谱数据分析程序或软件包中的任一者执行。然而,为了在临床应用或其它时间关键应用中使用,此自动检查优选地由经优化计算方法执行,例如本文档的附录中详细描述的计算方法。
[0130] 可随后对照含有蛋白质或多肽的m/z值或分子量的列表值的数据库搜索由PTR过程产生的m/z值或替代地从PTR产物离子获得的分子量(图3A的步骤402)以便辨识样本中此些分析物的存在。如果样本是从微生物导出,那么数据库可涉及含有来自已知参考标准/患者样本的观测m/z值或分子量的个别病原体标准。在此些情况下,通过从含有个别参考病原体的数据库匹配这些m/z值或分子量,获得可能的病原体识别的小子集。可通过确定特定质量准确性、将个别峰的强度加权和/或通过在给定评分系统中按质量计将分子量值加权来限制所述子集。
[0131] 在微生物研究的某些情况下,m/z或分子量匹配可提供与可自动确定的特定病原体识别的直接匹配(例如图3A的步骤404)。然而,在所有概率中,m/z分子量信息将大体上减少可使用串连质谱法明确地识别的可能病原体识别的数目。在国际(PCT)专利申请公开案WO 2013/166169A1中最初描述此过程以与步骤302、304、306和308-310结合使用。另外,可采用贝叶斯、逻辑回归或基于决策树的方法以进一步精炼病原体的识别。在优选实施例中,在数据获取期间(即,在正分析样本时)实时执行此m/z或分子量搜索。替代地,也可在获取后(即,在已分析样本)之后执行搜索。蛋白质的少量m/z值或分子量(3到10个)与参考数据库的比较将一般足以显著减少病原体识别的候选数目为五个或更少。
[0132] 任选地,在如由图3A中的虚线箭头指示的步骤402的执行之后,方法300的执行可返回至步骤302、308或310中的任一者。此同一选项也适用于在图3B中说明的方法370、在图3C中说明的方法380、在图3D到3E中说明的方法390以及在图3F中说明的方法395。返回到步骤302对应于在不同样本的分析中重复方法300的全部。返回到步骤308对应于将同一样本的不同部分引入到质谱仪系统中且对所述不同部分重复质谱分析。在一些情况下,同一样本的不同部分可包括同一样本的不同化学分数(即,其可包括与先前分析部分不同的组成),前提是所述样本例如通过层析法(步骤306)或通过某种其它化学部分分离技术而化学部分分离。在一些情况下,样本的不同部分可包括与先前分析部分相同的组成(或可视为包括基本上相同的组成),前提是不存在化学分馏步骤或者由分馏造成的化学组成的变化率比质谱仪系统可重复步骤312-402的速率慢得多。
[0133] 从步骤402返回到步骤310对应于对步骤310中的离子物质的一或多个第二不同预定m/z范围(与步骤310的先前执行中隔离的离子物质的m/z范围相比)进行质量隔离,且随后使用新隔离的离子物质及其反应产物重复步骤312-402。重复步骤310-402的此程序在可假定这些步骤的连续迭代之间样本组成未改变的情况下尤其有用。在这些环境下,步骤310-402的重复可提供来自同一样本组成的额外信息。所述样本可常常假定保持恒定或几乎没有不同,前提是在样本引入质谱仪中之前不存在化学分馏或者由分馏造成的化学组成的变化率比质谱仪系统可重复步骤312-402的速率慢得多。
[0134] 图3B示意性地说明根据本发明教示的第二示范性方法方法370的流程图。方法370(图3B)的步骤302-314相同于方法300(图3A)的类似编号的步骤,且因此此处不重复这些步骤的描述。方法370不同于方法300之处仅关于在步骤314中产生质谱之后的步骤。根据早先描述的方法300,PTR产物离子的质谱假定足以检测或定量所关注的蛋白质和多肽。然而,在许多情况下,可能在PTR反应产物的产生之后必须执行串连质谱法(有时称为MS/MS或MSn)以便解析特定蛋白质或多肽分子的辨识中的剩余不明确性。在其它情况下,可能必须执行如下方进一步论述的PTR的第二阶段。在其中需要分段的情况下,PTR反应产物可视为包括第一代反应产物,其随后经分段以形成第二代产物离子。第一代反应产物的特定m/z比与片段离子的一或多个特定m/z比的组合在许多情况下可允许与给定病原体相关联的特定蛋白质或多肽分子的识别。在许多情况下,以特定病原体识别的蛋白质也可以在其它类似病原体中找到。为了正确地识别单个病原体,可能需要对以给定PTR分数或同一样本的多个PTR分数存在的一样多的蛋白质执行方法370(具体地说串连质谱法)。
[0135] 在方法370的步骤316中,执行计算方法以便自动分析在步骤314中获得的PTR反应产物的质谱数据。所述计算方法尝试识别蛋白质或多肽的电荷态序列。在方法370的步骤316中获得的实时自动计算分析的结果可稍后用作在后续步骤318中做出m/z选择的基础,其中包括m/z比的受限制范围的PTR产物离子的子集被选择且隔离以便稍后在步骤320中分段。优选地,电荷态序列的自动识别(步骤316)是通过快速计算方法实行,例如本文档的附录中详细描述的计算方法,其针对此些实时数据分析而优化。
[0136] 因此,方法370(图3B)的步骤318-322表示应用于由PTR形成的离子的串连质谱法或选定反应监视(SRM)的技术的应用。如果特定采用的质谱法系统准许,那么PTR产物离子的一部分可能已经存储(紧接在步骤312之后)在质谱仪系统的离子存储设备中。在此些情况下,分支步骤315致使步骤317a的执行,其中检索先前存储的离子用于进一步处理。否则,如果质量分析步骤(步骤314)耗尽PTR产物离子的先前批次,那么根据替代的步骤317b,可能需要重新执行步骤308-312以便产生此些PTR产物离子的新批次。
[0137] 在方法370的步骤318中,一特定m/z范围或多个特定m/z范围内的某些PTR反应产物离子(即,第一代产物离子)通过喷出m/z比不在所关注的一或多个范围内的离子而被质量隔离。在步骤320中随后将隔离的离子分段。特定所选的一或多个范围将一般响应于在步骤316的执行之前立即识别的特定经识别电荷态序列的细节,且所述选择将一般由计算机自动做出。因此,用于隔离和分段的一或多个特定m/z范围的选择是所谓的“数据相依分析”(或“数据相依获取”等)的实例。
[0138] 在涉及几百到几千道尔顿的低质量分子的大多数常规MS/MS分析中,数据相依分段包括基于先前MS1数据获取的信息挑选“最高P数目的最充足的前驱体”用于串连质量分析,其中数目P是常数或可能是由用户输入的变量。已发现此常规形式的数据相依分析当在生物聚合物分析物的多组分样本的分析中使用时表现并不良好。举例来说,图7C说明分别由包络905和包络906表示的两个电荷态分布。在此实例中,每一包络对应于不同的相应分析物分子物质。因此,由包络905和906包含的行的集合可被称为“分子物质相关电荷态分布”。考虑图7C中的行(个别m/z值)表示前驱体离子,则如果P=10,那么常规数据相依分段技术将选择包络906下方的十个最左边实心垂直行用于分段。使用常规技术,将不选择对应于包络905的点线。常规程序因此将产生与对应于包络906的分子物质相关的冗余信息且不产生与对应于包络905的分子物质相关的信息。
[0139] 为了克服当应用于高分子量分子时常规数据相依分段的缺点,本发明人已经开发本文使用的新颖“最高P个唯一分析物特定群集”数据相依技术以便替换先前的“最高P数目的最充足的前驱体”逻辑以应用于高分子量分子。每一分子物质相关电荷态分布是根据新颖“最高P个唯一分析物特定群集”逻辑解译为全部从单个唯一分子产生的相关质谱线(m/z值)的集合。每一分子物质相关电荷态分布将被指示为在电离之前已经从单个分子产生的各种电荷态和同位素群集分组在一起。然而,分子物质相关分布排除了在数据分析之前移除的加成物。根据所述新颖方法,仅对给定分子物质相关电荷态分布包络的一个(或可能更多)选定代表执行分段,从而避免上文与常规数据相依分段方法相关联所述的冗余。根据新颖“最高P个唯一分析物特定群集”逻辑,在已针对第一分子物质相关电荷态分布选择代表性m/z比(或多个比率)之后,任何进一步分段是针对下一所确定的分子物质相关电荷态分布的代表性m/z比,以此类推。
[0140] 如先前描述,在方法370的步骤318中执行的隔离可通过以下方式实现:跨离子阱的电极对施加补充AC电压以使得m/z比不在所关注的一或多个范围内的离子从阱喷出,而m/z比在所述一或多个范围内的那些离子保持在阱内。在一些情况下,用于质量隔离的离子阱可相同于在步骤314中用以进行全扫描质量分析的质量分析器。
[0141] 施加于用于质量隔离的离子阱的补充AC电压可包括叠加频率的求和以使得两个或更多个非邻接m/z范围内的离子被同时隔离。在后续步骤320中,经质量隔离的第一代产物离子通过例如碰撞引发的解离(CID)等合适的离子分段技术分段。所述分段可通过用已知方式将第一代产物离子(由原始前驱体离子的PTR形成的产物离子)传送到专用分段单元而实现,所述传送的离子在所述分段单元内分段以便产生片段离子,这些片段离子包括第二代反应产物。任选地,在任选的步骤321中可存储片段产物离子的一部分以用于可能的未来额外分段。
[0142] 在方法370(图3B)的步骤322中,由质谱仪的质量分析器对步骤320中产生的片段进行质量分析。如果第二代产物离子是在具体来说专用于分段目的的分段单元内产生,那么在步骤322的执行之前所述离子必须首先传送到质量分析器。在步骤322中可采用离子阱质量分析器以分析第二代产物离子,在此情况下用于步骤322的质量分析器可相同于步骤314的用于进行全扫描质量分析的质量分析器。替代地,可采用能够以10ppm或更好的准确性测量质荷比的准确质量分析器用于步骤322,例如FT-ICR质量分析器、飞行时间(TOF)质量分析器或OrbitrapTM型静电阱质量分析器。
[0143] 如所已知,经受分段的某一选定离子物质的m/z值与由分段产生的一或多个片段离子物质的m/z值(或多个值)之间的相关可足以自动确定(在步骤402b中)选定离子物质的化学身份。在此情况下,选定离子物质是在步骤318中经质量隔离的在步骤312中产生的PTR反应产物物质。少量(即,3到10种)此类蛋白质的识别将一般足以唯一地识别微生物物质(任选的步骤404b)。然而,单个阶段的分段可能不足以用于执行化学物质识别。在此类情况下,第二代产物离子可进一步分段以便形成下一代产物离子,由从步骤322返回至步骤318的任选的重复(以虚线指示)指示,其中片段产物离子的选定子集根据其m/z值而被隔离,且如此隔离的片段离子被进一步分段。更一般化地,可选择nth代产物离子的子集用于通过任何合适的离子分段方法而进一步分段,例如(但不限于)碰撞引起的分段、较高能量碰撞解离、电子转移解离、电子捕获解离、负电子转移解离、电子分离解离、源中分段、表面引起的解离或光致解离,从而形成(n+1)th代产物离子。质量分析步骤322的结果可形成关于是否需要每一额外分段以及如果需要则哪些m/z值对应于待分段的离子物质的自动决策的基础。
[0144] 在以上论述中,关于进一步分段先前产生的片段离子的目的而描述方法370的从步骤322返回至步骤318的任选重复。然而,在一些实施例中,步骤318的第二或后续执行可出于以下目的:基于在步骤316中先前执行的电荷态序列的自动识别而挑选PTR反应产物的第二不同离子物质(在步骤312中产生且可能存储)用于分段。现在可参看图12C理解第二PTR步骤的可能的需要。作为一实例,质量隔离步骤(方法370的步骤318)的第一执行可隔离对应于属于电荷态包络A208的质谱线的离子物质,而步骤318的第二执行可隔离对应于属于电荷态包络A206的质谱线中的一者的离子物质。如本文档的附录中所描述,质谱线的每一此类集合(属于包络A208的集合或属于包络A206的集合)。附录中描述的新颖的“最高P个唯一分析物特定群集”工作流具体地说适于辨识对应于不同相应潜在分析物分子的此类群集。根据此工作流程序,执行方法370的隔离步骤(步骤318)和分段步骤(步骤320)的第二执行,以便排除对应于包络A208的离子物质的隔离和分段(假定一种此类离子物质在这些步骤的较早执行期间隔离且分段),即使它们可能具有比对应于包络A206的离子物质大的强度也是如此。以此方式,在包括步骤318-322的任选循环的每一迭代期间获得关于不同潜在分析物的片段信息。
[0145] 上文所论述的图3A中描绘的方法300提供了样本分析的相对简单且直接的方法,其可适用于相对低复杂性的样本,例如当在将层析部分引入到质谱仪中(步骤308)之前已执行高度解析层析分离(步骤306)时。然而,简单方法300可能不适合于更复杂的样本,且此些样本的分析可能存在一些挑战。首先,复杂混合物中存在的蛋白质具有广泛范围的分子量。第二,由大量离胺酸、精胺酸、组胺酸残余的存在引起的大量电荷态可导致多个重叠的峰集合,每一峰集合对应于不同化学物质。第三,如果质量分析(步骤314)具有充分高分辨率,那么任何给定电荷态的同位素分布的解析峰的存在会混淆大多数数据处理算法。最后,多个电荷态当中以及可能多个同位素状态当中可用离子的分布必定减少质量分析中的任何解析峰的信号强度。
[0146] 为了解决复杂样本的分析中的上述挑战,在图3C中说明其示意性流程图的方法380提供了进行多个PTR阶段的机会。在早先描述的方法300下,假定第一代PTR反应产物(步骤312中产生)的(在步骤314中)获得的质谱展现信噪比的足够改进以及同量异位干扰的足够减少,以使得可辨识电荷态顺序且可识别蛋白质或多肽。如果质谱质量中的此改进在第一PTR反应事件之后仍不足以用于此目的,那么可执行方法380(图3C)的额外精炼步骤327-
330。此外,PTR阶段中的一或多者可利用“离子停车”的已知技术以便简化电荷态分布,如先前段落中所提到。离子停车是禁止离子阱内的特定选定离子/离子反应的技术。实际上,跨离子阱的电极对、离子导向器或其它离子存储装置施加谐振激发波形,其振幅不足以造成离子排出但足以增加具有选定m/z值的离子的速度。此激发过程增加了激发离子(阳离子,出于本论述的目的)与反应剂阴离子之间的相对速度,且据信此相对速度增加造成激发阳离子与反应剂阴离子之间的反应速率的减少。
[0147] 在PTR过程期间,阳离子与反应剂阴离子之间的反应速率随着各种阳离子的电荷数的平方而变化,其中反应剂离子上的阴离子电荷等于-1。因此,无离子停车存在下,PTR过程导致高度带电阳离子的数目的快速减少。在反应的过程中,从单个分子物质M(具有质量mp的蛋白质或多肽分子)导出的阳离子的电荷态的分布朝向较低电荷态移位。具有中间电荷态的每一离子物质的群体将首先随着较高带电前驱体离子失去质子而增加,并且然后随着每一相应物质丢失更多质子而减小,随后其从较高带电阳离子的递减数量得益。如果允许PTR反应前进到完成,那么最终结果是所有此些阳离子的完全中和以及所有质谱信号的全损耗。
[0148] 当在PTR反应期间应用离子停车技术时,则电荷减少过程基本上停止在电荷态z1,其对应于由施加的AC波形谐振激发的离子的特定质荷比(例如,mp/z1)。从具有初始电荷态z的分子物质M导出以使得z>z1的那些前驱体阳离子将失去质子,直到其电荷态减少到z1,在此之后将禁止进一步反应和质子损失。从具有初始电荷状态z以使得z
[0149] 返回到图3C中概括的方法380的论述,应注意方法380的步骤302-310相同于方法300(图3A)的类似编号的步骤且此处不再描述。随后,在步骤328中,前驱体离子经受PTR,任选地由离子停车技术改质。如前文所述,通过跨离子阱的一对电极施加补充AC激发波形而执行步骤328,样本导出的阳离子在所述离子阱内与反应剂阴离子反应达预定时间段。如上文所描述,此“离子停车”程序的采用将使从任何特定蛋白质或多肽导出的离子的分布集中于m/z值的特定受限范围中。这将一般将从任何特定蛋白质或多肽导出的离子限制到特定电荷态中,从而简化所得质谱且增加对应于特定蛋白质或多肽的任何质谱峰的强度。离子受限于其中的m/z值的特定范围可包括从不同相应分子物质导出的不同相应电荷态的离子。在一些实施例中,用以实现离子停车的所施加AC波形可包括不同相应频率的波形的求和,以使得所求和波形致使PTR反应产生对应于两个或更多个非邻接m/z范围的PTR产物离子的最终群体。
[0150] 在后续步骤330中,通过质量分析器对在步骤328中产生的PTR产物离子的群体进行质量分析,并且在步骤331中,可对在质量分析中产生的数据执行自动计算以便自动识别所述数据中可表示的任何电荷态序列,其中每一此类电荷态序列对应于不同潜在蛋白质或多肽分析物。在步骤330的质量分析之前,可存储PTR产物离子的一部分(步骤329)以准备用于可能的后续PTR反应。取决于电荷态序列的自动识别(步骤331)的结果,可做出使PTR产物离子经受此进一步PTR反应的自动决策,如由图3C中所示的虚线任选路径指示。所述决策也可以基于电荷态序列的自动识别的结果而做出以仅使PTR产物离子的选定子集经受后续PTR反应。在此些情况下,执行步骤327。因此,根据一些实施例,步骤327-331可包括迭代循环,其中在循环的每一迭代,选择且隔离对应于不同相应蛋白质或多肽的不同相应离子物质以用于通过PTR过程的进一步纯化。可根据本文档的附录中描述的新颖的“最高P个唯一分析物特定群集”工作流在步骤331中确定以此方式选择的离子物质。
[0151] 如果在步骤330中采用的质量分析器是检测通过离子阱或其它离子存储装置内的循环离子运动产生的镜像电流的类型,例如FT-ICR质量分析器或OrbitrapTM质量分析器,那么PTR反应步骤可有利地减少目标蛋白质或多肽分子的碰撞分布以使得这些分子在阱中保持稳定达足够时间长度以产生高质量质谱。在足够数目的PTR反应步骤之后,接着可通过匹配于已知分子质量的数据库而快速辨别蛋白质或多肽的化学身份(在步骤402c中)。少量(3到10种)蛋白质的识别将一般足以唯一地识别微生物物质(任选的步骤404c)。识别也可经由如先前所论述使用应用于PTR数据的分类器而实现,其包含(但不限于)贝叶斯、逻辑回归或基于决策树的方法。
[0152] 图3D到3E以流程图形式说明根据本发明教示的另一方法方法390。方法390的步骤302-331在图3D中所示且相同于方法380(图3C)的先前论述类似编号的步骤,因此,此处不再描述这些步骤。并非从步骤330直接前进到识别步骤402d(如图3C的方法380中),方法390(图3D到3E)的执行从步骤330前进到质量选择和隔离步骤332。在步骤332中,根据选定m/z比隔离通过PTR程序的一或多次应用而产生的PTR产物离子的子集。关于在此步骤期间将隔离的特定m/z比的决策可基于在步骤330中获得的质谱结果或者相对于任选的后续质量隔离和分段(参见图3E的任选重复分支)基于片段离子本身的质量分析的结果(步骤338)而自动执行。在图3E中说明的步骤332-338表示可迭代(参见任选的重复分支)以便产生多代分段产物离子的离子分段程序。这些步骤332-338类似于图3B中说明的方法370的步骤318-
322且因此不详细论述。
[0153] 在分段和质量分析步骤的执行之后,执行方法390(图3E)的肽识别步骤402d。方法300(图3A)的识别步骤402a仅利用包括质子化或多质子化分析物分子的离子物质的m/z比(或分子量),而方法390的识别步骤402d还考虑了这些离子物质的片段(可能多代)的m/z比。因此,在蛋白质或多肽的复杂混合物的情况下,较大置信度可与使用方法390进行的识别的结果相关联。根据一些实施例通过如上所述利用实时数据解卷积可实时执行对实验的控制。在步骤402d中对少量(3到10个)蛋白质物质的识别将一般足以在步骤404d中唯一地识别微生物物质。
[0154] 图3F以流程图形式概略地说明根据本发明教示的另一方法方法395。方法395(图3F)中的大多数步骤类似于方法370(图3B)中类似地编号的步骤且不再详细地描述这些步骤。类似于方法370,方法395包含使原始前驱体离子经受PTR电荷减少的步骤(步骤312),随后是隔离选定PTR产物离子物质且使隔离的离子物质经受分段以便形成片段产物离子物质的步骤(步骤318和320)。方法395通过提供使片段离子经受PTR电荷减少的额外步骤步骤
340而不同于方法370。由于从原始前驱体离子产生的各种PTR产物离子物质可为多电荷的且可以各种程度的质子化在物质当中分布,因此由其形成的片段离子本身可在多个质子化状态当中分布。在步骤340中碎片离子物质的PTR电荷减少可在步骤341中的其质量分析之前简化片段离子的电荷态分布。任选地,PTR步骤(步骤312和步骤340)中的任一者可采用离子停车。从步骤341返回至步骤318的任选重复以便重复步骤318-341可出于以下目的而执行:基于在步骤316中先前执行的电荷态序列的自动识别而挑选PTR反应产物的第二不同离子物质(在步骤312中产生且可能存储)以用于分段。如先前相对于方法370(图3B)论述,所述第二不同离子物质可属于第二电荷态包络的线的集合,所述第二电荷态包络不同于先前隔离且分段的离子物质属于的电荷态包络(还参见图12C)。附录中描述的新颖的“最高P个唯一分析物特定群集”工作流具体地说适于辨识对应于不同相应潜在分析物分子的此类群集。以此方式,在包括方法395的步骤318-341的任选循环的每一迭代期间获得关于不同潜在分析物的片段信息。
[0155] 实例A
[0156] 图4A和4B提供由单个PTR反应步骤提供的质谱信号增强的实例(例如,如图3A中所示的方法300中)。在第一应用(图4A,4B)中,经由直接输注分析来自病原体大肠杆菌的提取物,图4A中示出第一代电喷射产生的离子的质谱。正如期望,存在以各种m/z值重叠的许多蛋白质,导致近似m/z=780与m/z=1420之间存在宽谱区域,其内检测到许多离子但在可辨别的蛋白质电荷态分布方面只有极少的可用信息。接着,具有宽度2Th且以m/z=750为中心的第一代离子的m/z“窗口”被隔离,且所得隔离的离子群体经受PTR反应。图4A中所示的m/z位置412a指示隔离窗口的中心位置。
[0157] 图4B展示大肠杆菌提取物的前驱体离子的PTR反应产物的质谱。实行PTR反应,其中在递送到如图2中所说明的相同一般配置的质谱仪的离子光学元件内含有的辉光放电反应剂离子源的氮气流中从3ppm的六氟化硫(SF6)导出的反应剂阴离子。如同大多数PTR产物离子光谱,图4B中所示的质谱在原始第一代离子隔离窗口的位置(如位置412b指示)处展现相对强烈的隔离峰。在隔离窗口的位置处的这些峰一般指示在隔离的位置处偶然发生的残余单电荷第一代离子(一般不关注)的存在。图4B的谱中的其它峰表示从PTR反应产生的产物离子。这些产物离子一般包括相关离子的重叠集合,每一集合对应于包括来自原始隔离窗口内的原始多电荷前驱体离子的电荷态分布的离子。一种此类可能的电荷态分布图案由包络413近似指示。图4A和4B中所示的结果展示PTR反应过程一般显著简化谱且减少背景干扰。但是,由于许多蛋白质导出或肽导出的前驱体离子可能存在于原始隔离窗口中,因此电荷态分布图案可能重叠。可能需要数学分解(有时称为“解卷积”)来辨识个别图案。
[0158] 实例B
[0159] 图5A和5B说明由包含PTR反应的两个阶段的程序执行的大肠杆菌提取物的分析的实例(例如,参见图3C中的方法380的步骤327、328、329和330)。图5A说明来自以m/z=1200为中心的5Th质量窗口内的PTR产物离子谱产生的隔离第一代前驱体离子,由图5A中的位置711指示。在此实例中,初始PTR谱不包含经充分良好解析以实现样本中的任何蛋白质的识别的峰。因此,针对来自以m/z=1320为中心的5Th质量窗口内的PTR的第二阶段隔离第一代PTR产物离子的子集,由图5A中的位置712a和图5B中的位置712b指示。在图5B中以大于1320的m/z比发生的第二代PTR产物离子展示可成功地用于样本中蛋白质的识别的清楚电荷态分布图案。
[0160] 图6A到6G说明由包含通过PTR反应的产物离子形成的第一阶段随后是PTR反应产物离子的CID的后续阶段的程序(例如,参见图3B中的方法370的步骤312到322)执行的大肠杆菌提取物分析的实例。图6A说明来自以m/z=640为中心的5Th质量窗口内的PTR产物离子谱产生的隔离第一代前驱体离子,由图6A中的位置811指示。PTR产物离子以比图6A中位置811指示的情况更大的m/z比发生。图6A中分别位于833、926和917的m/z比处且有质谱峰
813、814和815指示的三种最强烈PTR产物离子随后被个别地隔离且单独地经受碰撞引起的解离以便产生第二代产物离子的三个集合。图6B和6C分别描绘在m/z=833处的隔离PTR产物离子以及通过隔离PTR产物离子的CID产生的第二代产物离子(片段离子)。同样,图6D和
6E分别描绘在m/z=926处的隔离PTR产物离子以及通过在m/z=926处的隔离PTR产物离子的CID产生的第二代产物离子。同样,图6F和6G分别描绘在m/z=917处的隔离PTR产物离子以及通过在m/z=917处的隔离PTR产物离子的CID产生的第二代产物离子。
[0161] 实例C
[0162] 如从先前论述将显而易见,任何蛋白质或多肽分子的阳离子电喷射电离将由于原始分子的不同程度质子化而产生包括不同相应电荷态(即,电荷数目)的多个离子。+50或更多的电荷态或者可能的及每一电荷态将由表示不同程度的自然同位素取代的多个质谱线表示。另一并发情况从以下事实产生:对于大多数自然生物样本,多肽分子的许多不同蛋白质可在质谱中表示。又一并发情况从以下事实产生:不一定关注的许多其它分子可能存在于样本中。
[0163] 在许多面向基本研究的研究中,多个分析物和多个干扰物质的上述并发因素可以通过在将每一分离化合物个别地引入质谱仪中之前执行色度分离而部分地或完全地解析。然而,临床分析常常会在紧张的时间约束下执行,这并不允许传统的耗时层析分离。临床时间约束可仅允许使用固相萃取(SPE)、尺寸排阻层析或上述快速部分层析分离(FPCS)的方法的不完全或部分分离。因此,当采用这些部分分离程序时,任何特定蛋白质或多肽的质谱特征可以扩展到宽质荷比之外,且可与其它化合物的质谱特征复杂地重叠。由于由电喷射设备提供的可用电荷将在许多不同类型的离子上扩展,因此大多数观测到的质谱线将共存且可能隐藏于一般密集群体且低强度或不良界定的谱“背景”中,这由图7A到7B中的谱包络
902示意性地指示。
[0164] 发明人已经实现任何特定蛋白质、多肽或其它生物相关高分子量分析物的质谱特征可通过以下方式假设地放大:同时隔离同一原始分子的多个电荷态,并且然后使多个态的集合与PTR反应剂离子反应以便将所述集合同时减少到在几个电荷态值上分布的少量电荷态,这些电荷态值相对于原始电荷态经减少。此概念由图7A中上覆于一般电荷态包络902上所示的垂直方框904a-904g说明。每一此垂直框表示特定前驱体离子物质且表示经选择为对应于特定分析物的特定电荷态(且可能包含几个同位素变体)的m/z值的小范围。假设地,如果可排除对应于垂直方框的范围之外的所有离子且仅来自所指示范围内的离子混合在一起,那么后续PTR将基本上提供来自各种原始的多个电荷态的信号的求和。多个前驱体离子物质的此多物质隔离的使用可使分析的灵敏度增加多达N倍,其中N是经选择且同时隔离的m/z范围的数目。
[0165] 当在线性离子阱(例如在图2中说明的低压线性阱单元217b)中执行时此多物质隔离相当容易实现,因为用以排出不希望的离子的谐振激发波形可构造有多个缺口。每一此缺口对应于不同的相应m/z窗口,其内将不排出离子(且因此隔离)。因此,在一些实施例中,可通过同时隔离全部多个前驱体离子物质而执行多个电喷射产生(第一代)前驱体离子物质的共同隔离。进行此的一种方式是通过将宽带谐振排出频率波形应用于从电喷射源接收的离子已经引入其中的离子阱,其中所述波形包括多个求和的正弦频率分量,其中包含的频率分量对应于希望从阱排出的离子的m/z范围且排除的频率分量对应于希望在阱内保持的离子的m/z范围。在此程序中,省略的频率界定排出频率波形中的一或多个频率缺口。可通过首先挑选所需的多缺口波形并且然后计算所需波形的傅里叶逆变换而计算所述频率分量。
[0166] 替代地,可通过使用施加于离子阱的相应单缺口波形在常规意义上每次一种离子物质地隔离个别前驱体离子物质而执行所述多个前驱体离子物质的共同隔离。个别地隔离的前驱体离子物质可一次一个地传送到离子存储组件(例如在图2中说明的多极离子导向器214),其中各种选定且隔离的离子物质随时间而积聚。作为又一替代例,可通过使从电喷射源接收的多个离子通过四极滤质器,同时所述四极滤质器的带通经循序地调谐以又优先发射对应于特定前驱体离子物质的每一m/z范围而执行所述多个前驱体离子物质的共同隔离。通过四极滤质器的经过滤离子随后传递到离子存储组件,所述组件积聚来自所有优先发射的m/z范围的离子。举例来说,在图2中说明的质谱仪150a中,四极滤质器208可执行过滤步骤的序列且每一发射m/z范围的离子可发射到多极离子导向器214内且在其内积聚。积聚的前驱体离子物质接着可传送返回至低压单元217b用于PTR反应。
[0167] 采用同时的多物质隔离的上述程序假定先验已知的适当隔离范围904a-904g。关于将采用的正确隔离范围的此知识在目标分析的某些例子中当待搜索的分析物的身份(和关于其的其它信息)已经已知且分析的目的是确定所述分析物存在或不存在或者确定所述分析物的数量或浓度时是可用的。然而,在其中分析物的身份可能不是事先已知的调查分析的情况下以上假设可为无效的。在后面的这些情况下,可通过如图7B中示意性地描绘隔离第一代离子的随机质量范围903并且然后使隔离的离子与PTR反应剂阴离子反应而执行初始随机调查。如先前在图4A和4B中说明,此程序可提供与一或多个分析物的电荷态分布相关的经解析、可解译的质谱线。在许多情况下,可通过相关线的m/z值与用于连续整数z的某一序列的等式1的相互一致性来辨识相关线的集合。线位置的一致性的程度可通过计算机分析自动执行以使得此些相关线的重叠集合可在数学上经分解且辨识。
[0168] 作为以上类型分析的实例,通过m/z范围903内的前驱体离子的隔离和反应而产生的PTR产物离子线的数学分解可导致对如图7C中所说明由包络905和包络906描绘的两个重叠线集合的辨识。借助通过此初始调查程序提供的信息,可选择适当且一致的m/z值集合,其可用于后续同时的多物质隔离和反应程序中。举例来说,可能可以自动选择包络905下方的线的某些解析实例的m/z值。对应于这些所选m/z值的前驱体离子的后续多物质隔离和PTR反应将随后提供放大的谱,所述谱可用以确定由包络905表示的特定分子的数量或浓度。此程序可稍后使用相关联包络906重复以便确定另一分子的数量或浓度。所确定的数量或浓度在绝对意义上可能不是准确的,但所确定的数量或浓度的比率可提供与相对数量或浓度相关的有用信息。上文概述的此整个程序可使用不同随机选择的m/z范围903重复多次,从而提供若干化合物的相对数量或浓度的确定。如先前陈述,可利用实时光谱解卷积的结果以数据相依方式实现对此些实验的控制。
[0169] 图8提供使用上文概括的通过PTR反应剂离子与来自多个非邻接m/z范围的第一代离子的反应的PTR信号放大进行调查分析的示范性方法方法397的一般流程图。方法397的步骤302、304、306、308、309、312、314、316、402和404相同于在图3A中说明的方法300的类似编号的步骤且因此此处不再描述。并且,新步骤311类似于方法300的先前描述的步骤310,但步骤311仅涉及第一代离子的随机m/z范围(例如图7C中所描绘的范围903)的质量隔离,而不涉及如针对先前方法300描述的“一或多个随机或预定m/z范围”。在初始调查PTR反应(步骤312)和电荷态序列的识别(步骤316)(后者优选地通过本文档的附录中描述的计算方法执行)之后,执行步骤323,其中隔离且积聚第一代离子的多个非邻接m/z范围,其中所述非邻接m/z范围对应于经识别电荷态序列。可从先前存储的此些离子的批次获得第一代离子(先前步骤319a),或替代地(先前步骤319b),可能需要重复样本引入和电喷射离子产生步骤。
[0170] 在第一代离子的多个非邻接m/z范围的隔离和积聚(步骤323)之后,使积聚的离子与PTR反应剂离子反应(步骤324)。所得放大的谱将一般具有高质量,从而促进例如对应于多个非邻接m/z范围的分子的准确分子量或者此分子的准确数量、浓度或相对丰度的导出(步骤325)。如果步骤316的紧邻在前的执行识别出相关m/z比的多于一个集合,那么可使用对应于不同经识别电荷态序列的非邻接m/z范围的新集合再次执行步骤319a或319b和步骤323-325(跟随步骤326的最左边“Y”分支)。如果针对可能的额外分析物的搜索将继续,那么执行可返回到步骤311(跟随步骤326的最右边“Y”分支),在此选择不同的随机m/z范围。
[0171] 实例D
[0172] 依据根据本发明教示的利用质子转移反应的样本复杂性减少的另一方法,采用PTR的质谱分析可与层析法直接关联以便简化且检测原本将错过的额外蛋白质。在此实施例中,采取全扫描质谱且使用实时解卷积程序计算蛋白质分子量。接着,选择具有经界定宽度的隔离窗口,且使所述窗口中的m/z值的子集经受PTR反应。
[0173] 举例来说,图9A展示在大肠杆菌提取物的十分钟梯度反相液相层析分离的过程期间在10分钟30秒的滞留时间下从溶离液产生的第一代离子的全扫描质谱。如图9A中的括号指示,此全扫描质谱展现分别具有35.1和31.1kDa的近似分子量的两种蛋白质的相异光谱特征。对于下一步骤,具有10Th宽度且以750Th为中心的m/z隔离窗口510内的m/z值的离子群体被隔离。随后使隔离的离子群体经受与阴离子反应剂六氟化硫的PTR反应达10ms。图9B中所示的所得产物离子质谱展现了具有11220.07Da和24599.56Da的分子量的全扫描质谱中未见的两种额外蛋白质的质谱特征。另外,在全扫描质谱中先前观测到的35.1kDa蛋白质组分也展现PTR产物离子谱中的谱特征,其包含对应于在749的标称m/z值处的+47电荷态的线,在方框520中描绘。在749Th处的线表示35.1kDa蛋白质的甚至更高电荷态的电荷减少。在11.2和24.6kDa处观测到的蛋白质在反相层析运行的此实例中无PTR步骤存在下将不会被识别,原因是复杂的谱重叠以及来自大量单电荷背景离子的干扰噪声。
[0174] 图10A和10B展示来自六十分钟梯度溶离运行的在42分钟30秒的滞留时间下从溶离液获得的类似层析法/MS实验的结果。如图10A中所示,在此溶离时间下的高背景造成识别全扫描谱中的分析物峰的困难。然而,图10B中标绘的PTR产物离子谱更容易经受解译和质谱解卷积。PTR产物离子谱展现原本将观测不到的三种相异蛋白质(具体地说具有11165.92Da、13480.28Da和18727.23Da的分子量)的质谱特征。在此实例中,从10Th宽度的以m/z 750为中心的质谱窗口(图10A中由方框610指示)产生的隔离前驱体离子产生PTR产物离子。通过对在单个实验过程期间在各种不同滞留时间下溶离的溶离液执行此类型的分析,可辨识足够数目的样本肽以便实现在物质、亚种或菌株层级的对微生物的识别。如图9A到9B中所示的结果也指示,如果存在来自隔离窗口内的全质谱的蛋白质离子的m/z重叠,那么所述蛋白质将也在PTR产物离子质谱中见到。
[0175] 有趣的是,全扫描质谱和PTR产物离子质谱可提供互补信息,如图11A和11B中所说明,其表示在三十分钟层析分离的过程中从在18分钟9秒的滞留时间下溶离的溶离液获得的质谱结果。在此实例中,全扫描质谱(图11A)展现具有9534.3Da的分子量的基本上单个蛋白质的强质谱特征,然而,当PTR产物离子谱是从在以m/z 750Th为中心的10Th宽窗口(方框530)内隔离的离子产生时,质谱特征包括来自具有14965.5Da的分子量的蛋白质(由在近似
1247Th处的+12电荷态的峰535最佳表示)以及具有12669.8Da、14150.0Da、14236.1Da、
14965.5Da和15117.5Da的分子量的五个其它微小蛋白质的强信号。图11C是在同一层析分离期间从在22分钟27秒的滞留时间下溶离的溶离液获得的全扫描质谱。所述谱包含指示具有24961.3Da的分子量的蛋白质的存在的峰。在隔离窗口540内隔离的离子的PTR反应后,获得图11D中所示的PTR产物离子谱。PTR产物离子谱中的质谱特征包含来自具有28461.5Da的分子量的蛋白质(由在近似1294Th处的+22电荷态的峰545最佳表示)以及具有18590.5Da和
20168.0Da的分子量的两个其它蛋白质的相对强信号。因此,仅从这两个滞留时间处的数据,有可能检测十一种不同蛋白质的存在和分子量。
[0176] 额外实例
[0177] 以下段落列出根据本发明教示的各种具体实施例的额外具体实例。
[0178] 实例1.一种用于识别液体样本内的蛋白质或多肽分析物化合物的存在或不存在的方法,所述液体样本包括化合物的混合物,所述混合物包含多种蛋白质化合物或多种多肽化合物或多种蛋白质和多肽化合物,所述方法包括:
[0179] (a)将所述液体样本的一部分引入到质谱仪的电喷射电离源中;
[0180] (b)通过电喷射电离形成所述液体样本的所述部分的所述化合物混合物的带正电离子,所述带正电离子包括多个离子物质;
[0181] (c)隔离包括第一质荷比(m/z)比率范围的所述离子物质的第一子集,所述范围包含所述分析物化合物的特定预定多质子化分子物质的m/z比;
[0182] (d)通过致使所述隔离的离子物质的第一子集在预定持续时间中与反应剂阴离子反应而从所述隔离的离子物质的第一子集产生多个第一代产物离子物质,所述反应剂阴离子在反应后从一或多个离子物质中的包括蛋白质或多肽化合物的质子化分子物质的每一者提取质子;
[0183] (e)使用质量分析器产生所述第一代产物离子物质或从所述第一代产物离子物质产生的第二代产物离子物质的质谱;
[0184] (f)进行对所述第一代或所述第二代产物离子物质的所述质谱的搜索以找到作为所述蛋白质或多肽分析物化合物的诊断的一或多个m/z比的集合;以及
[0185] (g)如果在所述质谱中识别出一或多个m/z比的所述集合,那么识别所述样本内的所述分析物化合物的存在。
[0186] 实例2.根据实例1所述的方法,其进一步包括第二次重复所述步骤(a)到(e),其中在所述步骤(a)到(e)的所述第二次执行期间或之前执行所述步骤(f)和(g)。
[0187] 实例3.根据实例1所述的方法,其进一步包括多次重复执行步骤(a)到(g),其中步骤(a)的每一重复包括将来自对应于相应滞留时间的层析柱的溶离液引入到所述电喷射电离源中。
[0188] 实例4.根据实例1所述的方法,其中所述步骤(f)包括进行对所述第一代产物离子物质的所述质谱的搜索以找到对应于所述分析物化合物的多质子化离子物质序列的一系列m/z比,所述多质子化离子物质序列相对于所述特定预定多质子化分子物质的电荷态渐进地电荷减少。
[0189] 实例5.根据实例1所述的方法,其中:
[0190] 所述步骤(c)包括进一步隔离所述离子物质的第二子集,所述第二子集包括第二m/z比范围,所述范围包含第二蛋白质或多肽分析物化合物的特定预定多质子化分子物质的m/z比;
[0191] 所述步骤(f)包括进行对所述第一代或所述第二代产物离子物质的所述质谱的额外搜索以找到作为所述第二蛋白质或多肽分析物化合物的诊断的一或多个m/z比的第二集合;以及
[0192] 所述步骤(g)包括如果在所述质谱中识别出m/z比的所述第二集合,那么识别所述样本内的所述第二分析物化合物的存在。
[0193] 实例6.根据实例5所述的方法,其中所述第一m/z比范围相同于所述第二m/z比范围。
[0194] 实例7.根据实例5所述的方法,其中所述步骤(c)包括同时隔离包括所述第一m/z比范围的所述离子物质的所述第一子集以及包括所述第二m/z比范围的所述离子物质的所述第二子集以使得所述第一和第二m/z比范围是非邻接的。
[0195] 实例8.根据实例1所述的方法,其中产生多个第一代产物离子物质的所述步骤(d)包括致使所述隔离的离子物质的第一子集和反应剂阴离子在一持续时间中反应,所述持续时间致使在步骤(e)中的所述质谱的后续产生期间所述产物离子物质稳定而不会分解。
[0196] 实例9.根据实例8所述的方法,其中所述步骤(e)包括使用质量分析器产生所述第一代产物离子物质的质谱,所述质量分析器通过检测由离子阱内所述产物离子物质的所述离子的运动造成的镜像电流来产生所述质谱。
[0197] 实例10.根据实例1所述的方法,其中产生多个第一代产物离子物质的所述步骤(d)包含跨越离子阱的电极施加补充AC电压,在所述离子阱内所述隔离的离子物质的第一子集与反应剂阴离子反应,其中所述补充AC电压的频率使得禁止所述反应剂阴离子与选定的第一代产物离子物质之间的离子-离子反应。
[0198] 实例11.根据实例10所述的方法,其中所述补充AC电压的所述频率使得在步骤(d)的执行之后,由所述分析物化合物形成的产物离子大体上作为具有特定电荷态的单个离子物质而存在。
[0199] 实例12.根据实例11所述的方法,其中:
[0200] 所述步骤(e)包括产生所述第一代产物离子物质的质谱;以及
[0201] 其中所述单个离子物质的质量大于20,000Da且所述单个离子物质的电荷态充分大以使得可在所述质谱的产生期间通过四极质量分析器、傅立叶变换离子回旋共振质谱仪或静电阱质量分析器检测所述单个离子物质的离子。
[0202] 实例13.根据实例1所述的方法,其中产生质谱的所述步骤(e)包括产生第二代产物离子物质的质谱,其中所述第二代产物离子物质是通过以下步骤产生:
[0203] 隔离包括特定产物离子m/z比范围的所述第一代产物离子物质的子集;以及[0204] 使所述第一代产物离子物质的所述隔离的子集分段以便形成片段离子物质,其中所述片段离子物质包括所述第二代产物离子物质。
[0205] 实例14.根据实例1所述的方法,其中产生质谱的所述步骤(e)包括产生第二代产物离子物质的质谱,其中所述第二代产物离子物质是通过以下步骤产生:
[0206] 致使所述第一代产物离子物质在第二预定持续时间中与所述反应剂阴离子反应,其中所述第一代产物离子物质与所述反应剂阴离子之间的反应的产物包括所述第二代产物离子物质。
[0207] 实例15.根据实例14所述的方法,其中跨越离子阱的电极施加补充AC电压,在所述离子阱内所述第一代产物离子物质与所述反应剂阴离子反应,其中所述补充AC电压的频率使得禁止所述反应剂阴离子与选定产物离子物质之间的离子-离子反应。
[0208] 实例16.根据实例1到15中的任一者所述的方法,其进一步包括通过包括以下各项的程序产生包括所述化合物混合物的所述液体样本:
[0209] (i)培养微生物或细胞;
[0210] (ii)裂解所述经培养的微生物或细胞;以及
[0211] (iii)从经培养的微生物或细胞的所述裂解物提取蛋白质。
[0212] 实例17.根据实例16所述的方法,其中从所述裂解物提取所述液体样本的所述步骤(iii)包含使所述裂解物通过固相提取设备。
[0213] 实例18.一种识别样本中的微生物类型的存在或不存在的方法,其包括:
[0214] (i)识别在所述样本中的同时存在是所述样本中的所述微生物类型的存在的诊断的分析物化合物的列表,所述分析物化合物的列表包括蛋白质化合物、多肽化合物或蛋白质和多肽化合物两者;
[0215] (ii)从所述样本提取包括从样本导出的蛋白质和多肽的混合物的液体溶液;
[0216] (iii)对于所述列表中的每一相应分析物化合物,执行以下步骤:
[0217] (a)将所述液体溶液的一部分引入到质谱仪的电喷射电离源中;
[0218] (b)通过电喷射电离形成所述液体溶液的所述部分的所述化合物混合物的带正电离子,所述带正电离子包括多个离子物质;
[0219] (c)隔离包括第一质荷比(m/z)比率范围的所述离子物质的第一子集,所述范围包含所述相应分析物化合物的特定预定多质子化分子物质的m/z比;
[0220] (d)通过致使所述隔离的离子物质的第一子集在预定持续时间中与反应剂阴离子反应而从所述隔离的离子物质的第一子集产生多个第一代产物离子物质,所述反应剂阴离子在反应后从一或多个离子物质中的包括蛋白质或多肽化合物的质子化分子物质的每一者提取质子;
[0221] (e)使用质量分析器产生所述第一代产物离子物质或从所述第一代产物离子物质产生的第二代产物离子物质的质谱;
[0222] (f)进行对所述第一代或所述第二代产物离子物质的所述质谱的搜索以找到作为所述相应分析物化合物的诊断的一或多个m/z比的集合;以及
[0223] (g)如果在所述质谱中识别出一或多个m/z比的所述集合,那么识别所述液体溶液内的所述相应分析物化合物的存在;以及
[0224] (iv)如果在所述液体溶液内识别出所述分析物化合物列表的每一和每个分析物化合物的存在,那么识别所述样本内的所述微生物类型的存在。
[0225] 实例19.一种识别样本中的微生物类型的存在或不存在的方法,其包括:
[0226] (i)识别在所述样本中的同时存在是所述样本中的所述微生物类型的存在的诊断的分析物化合物的列表,所述分析物化合物的列表包括蛋白质化合物、多肽化合物或蛋白质和多肽化合物两者;
[0227] (ii)从所述样本提取包括从样本导出的蛋白质和多肽的混合物的液体溶液;
[0228] (iii)将所述液体溶液的至少第一部分引入到质谱仪的电离源中;
[0229] (iv)从所述电离源处的所述液体溶液的所述至少第一部分产生所述化合物混合物的带正电离子,所述带正电离子包括多个离子物质;
[0230] (v)隔离所述多个离子物质的至少第一子集,所述至少第一隔离的子集的每一隔离的子集包括相应质荷比(m/z)比率范围;
[0231] (vi)通过使离子物质的每一所述隔离的子集在预定持续时间中与反应剂阴离子反应而从离子物质的每一隔离的子集产生多个第一代产物离子物质,所述反应剂阴离子在反应后从离子物质的所述隔离的子集的一或多个离子物质中的包括蛋白质或多肽化合物的质子化分子物质的每一者提取质子;
[0232] (vii)使用所述质谱仪的质量分析器产生第一代产物离子物质或通过所述第一代产物离子物质的进一步反应产生的第二代产物离子物质的至少一个质谱;
[0233] (viii)对于所述列表中的每一相应分析物化合物,执行以下步骤:
[0234] (a)进行对所述第一代或所述第二代产物离子物质的所述至少一个质谱的搜索以找到作为所述相应分析物化合物的诊断的一或多个m/z比的集合;以及
[0235] (b)如果在所述质谱中识别出一或多个m/z比的所述集合,那么识别所述液体溶液内的所述相应分析物化合物的存在;以及
[0236] (ix)如果在所述液体溶液内识别出所述分析物化合物列表的每一和每个分析物化合物的存在,那么识别所述样本内的所述微生物类型的存在。
[0237] 实例20.根据实例19所述的方法,其中与所述步骤(iii)到(vii)中的一或多者的执行同时执行所述步骤(a)和(b)的执行。
[0238] 实例21.根据实例19所述的方法,其中所述微生物类型经界定为特定细菌种类,且所述分析物化合物列表包含作为所述特定细菌种类的诊断的足够数目的分析物化合物以实现所述样本中所述特定细菌种类的存在或不存在的识别。
[0239] 实例22.根据实例19所述的方法,其中所述微生物类型经界定为特定细菌物质,且所述分析物化合物列表包含作为所述特定细菌物质的诊断的足够数目的分析物化合物以实现所述样本中所述特定细菌物质的存在或不存在的识别。
[0240] 实例23.根据实例19所述的方法,其中所述微生物类型经界定为特定细菌子物质,且所述分析物化合物列表包含作为所述特定细菌子物质的诊断的足够数目的分析物化合物以实现所述样本中所述特定细菌子物质的存在或不存在的识别。
[0241] 实例24.根据实例19所述的方法,其中所述微生物类型经界定为特定病毒菌株,且所述分析物化合物列表包含作为所述特定病毒菌株的诊断的足够数目的分析物化合物以实现所述样本中所述特定病毒菌株的存在或不存在的识别。
[0242] 实例25.根据实例19所述的方法,其中所述微生物类型经界定为特定病毒菌株,且所述分析物化合物列表包含作为所述特定病毒菌株的诊断的足够数目的分析物化合物以实现所述样本中所述特定病毒菌株的存在或不存在的识别。
[0243] 实例26.一种用于识别样本内的蛋白质或多肽分析物化合物的存在或不存在的方法,所述样本包括化合物的混合物,所述混合物包含多种蛋白质化合物或多种多肽化合物或多种蛋白质和多肽化合物,所述方法包括:
[0244] (a)将所述液体样本的一部分引入到质谱仪的电喷射电离源中;
[0245] (b)通过电喷射电离形成所述液体样本的所述部分的所述化合物混合物的带正电离子,所述带正电离子包括多个第一代离子物质;
[0246] (c)隔离包括相应质荷比(m/z)比率范围的所述第一代离子物质的多个子集,其中每一m/z比范围包含包括所述分析物化合物的相应质子化状态的离子物质的m/z比;
[0247] (d)通过致使所述第一代离子物质的所述隔离的多个子集在预定持续时间中与反应剂阴离子反应而从所述第一代离子物质的所述隔离的多个子集产生多个第一代产物离子物质,所述反应剂阴离子在反应后从包括所述分析物化合物的相应质子化状态的每一离子物质提取质子;
[0248] (e)产生所述第一代产物离子物质的质谱;以及
[0249] (f)如果所述质谱包括在相应预定m/z比处的包括高于预定阈值的相应强度的一或多条线,那么识别所述样本内的所述分析物化合物的存在,或否则识别所述样本内的所述分析物化合物的不存在。
[0250] 实例27.根据实例26所述的方法,其进一步包括多次重复执行步骤(a)到(f),其中步骤(a)的每一重复包括将来自对应于相应滞留时间的层析柱的溶离液引入到所述电喷射电离源中。
[0251] 实例28.根据实例26所述的方法,其中所述步骤(f)进一步包括如果所述质谱包括在相应预定m/z比处的包括高于预定阈值的相应强度的一或多条线,那么基于所述一或多个强度确定所述样本内的所述分析物化合物的数量或浓度。
[0252] 实例29.根据实例26所述的方法,其进一步包括在形成带正电离子的所述步骤(b)之后且在隔离所述第一代离子物质的多个子集的所述步骤(c)之前的以下步骤:
[0253] (b1)隔离包括随机选择的质荷比(m/z)比率范围的所述第一代离子物质的子集;
[0254] (b2)通过致使所述第一代离子物质的所述隔离的子集与反应剂阴离子反应而从所述第一代离子物质的所述隔离的子集产生多个产物离子物质,所述反应剂阴离子在反应后从包括所述分析物化合物的相应质子化状态或者另一蛋白质或多肽化合物的相应质子化状态的每一离子物质提取质子;
[0255] (b3)产生所述产物离子物质的质谱;以及
[0256] (b4)基于所述产物离子的所述质谱自动确定在所述后续步骤(c)中将使用的所述m/z比范围。
[0257] 实例30.根据实例28所述的方法,其中所述步骤(b4)包括从所述质谱自动确定对应于另一蛋白质或多肽化合物的多质子化离子物质的m/z比的集合。
[0258] 实例31.一种识别样本中的微生物的存在或不存在的方法,其包括:
[0259] 制作所述样本的提取物;
[0260] 重复执行根据实例26所述的方法以便在每一执行识别所述样本提取物内的不同相应蛋白质或多肽分析物化合物的存在或不存在;以及
[0261] 如果所述样本提取物内每一相应蛋白质或多肽分析物化合物存在,那么识别所述样本内的所述微生物的存在,或否则识别所述样本内的所述微生物的不存在。
[0262] 结论
[0263] 如本文档中教示的离子-离子反应的PTR类型的使用具有若干优点用于蛋白质或多肽离子的复杂混合物的分析。通过比较图4A与图4B可容易观测到第一显著优点是由极大地改进的信噪比提供。即使由于PTR过程而丢失一些电荷(即,完全中和),由于多电荷蛋白质与单电荷阴离子的反应也获得显著信噪比。此反应的速率与电荷的乘积的平方成比例。因此,最初高度带电分析物离子转换为较少带电PTR产物离子,其质谱特征在显著较大质荷比处出现。相比之下,低电荷态化学背景离子在典型实验反应周期期间受PTR过程影响显著较少,原因是这些离子的反应的低速率。此过程基本上从低质量、低电荷态化学背景“噪声”移除了蛋白质和多肽的质谱特征。举例来说,如图4B中所示,背景离子由在m/z≈642的“左后方”的大的单电荷峰表示。还认为仍粘附到大蛋白质的加成物或水分子由于由PTR反应沉积的发热反应热(至少125千卡/摩尔)而移除。此些离子变换为简单质子化分子可进一步增强信噪比特性。潜在地,经由此方法获得的蛋白质识别的数目可超过利用某一形式的分离技术的当前复杂的从上到下方法。
[0264] 与根据本发明教示的方法相关联的第二重要优点是由极大地改进的电荷态指派提供。举例来说,本发明人已经以实验方式确定,通过采用根据本发明教示的方法可正确地指派用于个别电荷态的电荷态指派的近似75%。此改进的辨识电荷态的能力是得自显著改进的信噪比。这又提供蛋白质或多肽的分子量的较准确确定。此比较适用于经常用于实时电荷态确定的当前Patterson-FFT电荷态算法。与根据本发明教示的方法相关联的另一重要优点是由执行快速处理量分析的能力提供。当与上文应用的快速部分层析分离技术结合时,这些方法允许在一分钟或更短的时间尺度上以高处理量方式分析样本。
[0265] 本申请中所包括的论述是希望充当基本描述。尽管已经根据所展示和描述的各种实施例描述了本发明,但所属领域的一般技术人员将容易认识到,可以存在对这些实施例的变化,并且那些变化将在本发明的精神和范围内。因此,读者应该知道,具体的论述可以不明确地描述所有可能的实施例;很多替代方案是隐含的。因此,在不脱离如权利要求书所描述的本发明的范围的情况下,所属领域的技术人员可做出许多修改。描述和术语均不希望限制本发明的范围。本文中提到的任何专利、专利申请案、专利申请公开案或其它文献在此被以引用的方式按其相应的全部内容并入本文中,如同在本文中被充分阐明一般。
[0266] 附录-数学计算方法
[0267] 例如蛋白质等复杂结构的电离分子的结构阐明常常使用耦合到液体层析仪的串连质谱仪实行。对从通过液相层析(LC)分离的化合物产生的离子进行质谱法(MS)分析的一般技术可被称为“LC-MS”。如果质谱法分析作为串连质谱法(MS/MS)进行,那么上述程序可被称为“LC-MS/MS”。在常规LC-MS/MS实验中,初始地通过质谱法分析样本以确定对应于所关注的峰的质荷比(m/z)。随后通过对选定峰执行产物离子MS/MS扫描而进一步分析样本。1
具体地说,在经常称为“MS”的分析的第一阶段中,获得包括初始调查扫描的全扫描质谱。
此全扫描谱之后是一或多个前驱体离子物质的选择(从获得的结果中)。选定物质的前驱体离子经受反应,一般例如可采用碰撞池或采用另一形式的分段单元(例如采用表面引发的解离、电子转移解离或光解离的那些)而实现分段。在第二阶段中,检测所得片段(产物)离
2
子以用于使用同一或第二质量分析器进行进一步分析(经常称为“MS/MS”或“MS”)。所得产物谱展现一组分段峰(片段集合),其在许多情况下可用作导出与前驱体肽或蛋白质或其它生物化学寡聚物相关的结构信息的手段。应注意,使用片段离子作为起始群体,离子选择和后续分段的过程可再次重复,进而产生“MS3”谱。在一般情况中,在选择和分段的(n-1)次迭代阶段之后获得的质谱可被称为“MSn”谱。这是耗时的过程,因为样本需要分析至少两次且仅针对有限数目的组分记录MS/MS数据。
[0268] 能够串连分析的大多数当前可用的质谱仪配备有自动数据相依性功能,借此当从MS1中的离子峰选择用于MS2分析的前驱体离子时以逐渐减小的强度选择离子前驱体。在图12A中所示的简单数据相依性实验中,检测器连续地测量可归因于进入质谱仪检测器的离子的总电流。设定总离子电流的阈值强度水平A8,在低于此水平下仅获取MS1数据。在作为峰A10所检测的第一组分溶离时,总离子电流强度在时间t1跨越阈值A8。当这发生时,质谱仪的机载处理器或其它控制器确定MS1谱中的最强烈离子且立即起始关于最强烈离子的MS/MS扫描。随后,检测另一溶离峰A12的前边缘。当总离子电流在时间t3再次突破阈值强度A8时,关于在时间t3之后检测到的最强烈离子起始MS/MS扫描。大体上,峰A12将对应于不同化学组分的溶离,且因此在时间t3之后检测到的最充足离子将不同于在溶离峰A10期间进行其MS/MS分析的离子。以此方式,对每一组分在其溶离时获取MS和MS/MS谱两者。
[0269] 上述简单数据相依性实验对于层析解析或部分地解析的组分良好地起作用,如在图12A中说明。然而,在极复杂的混合物中可能存在溶离峰完全重叠的组分,如图12B中离子电流强度对滞留时间的曲线图所说明。在此实例中溶离峰A11表示可归因于离子m11的离子电流,且溶离峰A13表示可归因于离子m13的离子电流,这些离子的质量在插图方框A16中的质谱表示中示意性地说明。在图12B中所示的假设情形中,存在引起离子m11和m13的化合物的溶离的几乎完全重叠,其中在溶离过程期间离子m11的质谱强度始终大于离子m13的质谱强度。在这些条件下,上文参考图12A所论述的简单数据相依性技术将不能一直起始离子m13(及可能其它重要离子)的MS/MS分析,因为将仅选择最密集组分(m11)用于MS/MS。
[0270] 在图12B中说明的假设两个离子情形是简化实例。大多数现代的质谱仪仪器能够关于MS1分析中所检测的若干充足离子中的每一相应一者执行一系列MS/MS分析。通常,替代于挑选仅单个最充足的前驱体,现代的仪器将基于先前MS1数据获取的信息而选择“最高P数目的最充足前驱体”用于串连质量分析,其中数目P是常数或可能是由用户输入的变量。但是,由图12B表明的基本问题尤其对于可能引起单个质谱中的数十到数百个质谱峰的生物聚合物分析物的多组分样本仍然存在。无论如何将此样本引入到质谱仪(例如,通过层析分离、流动注入或毛细电泳法;作为从芯片实验室装置递送的单独化学品,通过灌注或其它方法),都可以在来自单个时间点的单个质谱中表示多于一个分析物,且每一此类分析物可引起许多离子,如在图12C中说明的假设质谱中所说明。在图12C中,由包络A208概括的实心垂直线表示从第一分析物化合物产生的质谱峰的第一集合的质心,且由包络A206概括的点线垂直线表示从第二共溶离分析物化合物产生的质谱峰的第二集合的质心。显然,即使有待分析的最充足的峰的数目P等于例如10,也多于将选择分析物化合物中的仅一者的离子用于使用上述传统的数据相依性方法进行MS/MS分析。与第二分析物相关的信息将丢失。此外,因此获得的数据将包括关于同一组分的冗余信息。
[0271] 为了更成功地解决共溶离化合物的质谱分析的复杂度,许多质谱仪器还采用所谓n n的“动态排除”原理,借此在获取其MS谱之后将质荷比临时放入排除列表中。MS不再次分析排除的质荷比,直到在先前MSn谱获取之后已经过某一持续时间为止。此技术使同一前驱体离子在若干后续扫描中分段的机会最小化,且允许质谱仪收集关于原本将不检查的具有较不密集峰的其它组分的MSn谱。在选定时间周期之后,将从列表移除排除的离子以使得可分析具有相同质荷比的任何其它化合物。离子物质在排除列表上的此持续时间一般是基于平均或估计层析峰宽度而估计。因此,动态排除原理的使用允许关于复杂混合物中的更多组分获得更多数据。
[0272] 不利的是,现有动态排除技术对于分析复杂生物分子的混合物的质谱可能表现不良。举例来说,再次考虑在图12C中说明的假设情形。如果使用动态排除原理分析图12C中所描绘的离子,那么将通过MSn分析按所说明的MS1谱中其强度的降序分析从单个分析物导出的至少10个离子物质(由包络A208概括),然后才考虑来自较低丰度分析物的任何峰(由包络A206概括)。无论每一前驱体每一离子物质在其相应分析之后放置到排除列表上的事实,此序列都将发生。执行十次不必要的冗余MSn分析消耗的时间量接着可导致最充足的离子的排除时间的到期(或可导致可用于完全分析少量最充足离子的时间的耗尽),在此之后可n重复MS分析的整个序列。
[0273] 将动态排除原理应用于复杂生物分子的混合物的质量分析中的另一并发因素得自以下事实:各种化合物的溶离分布是高度可变的且难以预测。由于层析固定相与具有多个分子交互位点的生物聚合物之间的复杂交互,不同生物聚合物化合物可展现不同溶离分布。此外,由于质谱仪的电离源内的电离抑制,从甚至单个此类化合物产生的各种离子的时间分布可能不能与未电离化合物的溶离分布相关或者与彼此的分布相关。
[0274] 作为可能遇到的溶离分布变化率的实例,图13说明从大肠杆菌提取物的单个液相层析质谱法实验运行收集的一组层析图。总离子电流在最上部层析图(曲线A40)中示出,且说明由相应m/z比率范围贡献的离子电流的各种提取离子层析图在最下部五个绘图(曲线A50、A60、A70、A80和A90)中示出。曲线A50表示m/z范围660.0-660.5Da。类似地,曲线A60、A70、A80和A90表示m/z范围700.5-701.5Da、1114.5-1114.5Da、942.5-943.5Da和540.5-540.5Da。峰A1、A2和A3是具有宽层析分布的峰的实例。峰A4和A5是窄的分布的实例。峰A6展示极宽的峰。峰宽度跨越一数量级,因此严重限制具有预定义排除持续时间的排除列表的适用性。为了解决以上计算困难,以下描述改进的经优化计算方法,用于进行电荷态指派且用于多路复用电荷态分布的实时辨识,此方法称为“最高P个唯一分析物特定群集”的。
[0275] 2.1.自一致映射电荷指派算法的关键特征
[0276] 2.1.1.专质心的使用。标准质谱电荷指派算法(例如,Senko等,1995)使用质谱中的线的全分布数据。相比之下,本发明方法中采用的新颖方法使用质心。使用线分布上的质心的关键优点是数据精简。通常分布数据点的数目大约比质心的数目大一个数量级。使用质心的任何算法将获得优于标准指派方法的计算效率的显著优点。对于需要实时电荷指派的应用,优选地设计仅需要质心数据的算法。使用质心的主要缺点是m/z值的不精确性。例如质量准确性、分辨率和峰挑选效率等因素全部趋于影响质心数据的质量。但这些问题可通过将m/z不精确性纳入采用质心数据的算法中而大部分减轻。
[0277] 2.1.2.强度是二进制的。与大多数现有算法的另一关键不同是根据本发明方法将强度编码为二进制(或布尔型)变量(真/假或存在/缺乏)。本发明方法仅考虑质心强度是否高于阈值。如果强度值满足基于信号强度或信噪比或这两者的用户可设定准则,那么所述强度值采用布尔型“真”值,否则指派“假”的值,无论所述强度的实际数字值如何。数字值作为简单二进制值的编码再次带来显著的数据精简。在许多编程语言中,双精度值使用八字节的存储器存储,而二进制(或布尔型)值使用仅单个字节。并且,布尔型量的比较固有地比双精度变量的比较快得多。使用布尔型值的众所周知的缺点是信息的损失。然而,如果具有大量的数据点要处理,例如典型高分辨率谱中的数千个质心,那么通过布尔型变量的绝对数目来较多地补偿强度信息的损失。因此,发明人的方法及因此本文教示的算法利用此数据丰度来实现效率和准确性两者。
[0278] 但是,可通过使用近似强度值而不是仅布尔型真/假变量来实现无显著计算速度损失的额外准确性。举例来说,可设想其中仅将类似高度的峰彼此进行比较的情形。可通过将强度值离散化为少量低分辨率二进位(例如,“低”、“中”、“高”和“极高”)而容易地适应添加的信息。此二进位化可实现具有“高度信息”的良好平衡,而不会牺牲强度的极简化表示的计算简单性。
[0279] 2.1.3.将质荷比值变换且组合为低分辨率二进位,且预先计算相对电荷态间隔一次且高速缓冲存储以获得效率。本发明中教示的方法的另一创新在于质谱线的m/z值从其以道尔顿计的正常线性标度变换为更自然的无量纲对数表示。如从以下具体论述可见,此变换极大地简化属于例如同一蛋白质但表示潜在不同电荷态的任何峰的m/z值的计算。此变换不涉及精度的降低。当执行经变换变量的计算时,可利用高速缓冲存储的相对m/z值以改善计算效率。
[0280] 2.1.4.基于简单计数的计分和统计选择准则组合质心强度作为布尔型值的编码以及m/z值的变换,本发明方法将所讨论的任何质谱的整个内容编码为单布尔型值阵列。电荷态的计分减少到在适合于正查询的电荷态的经变换m/z位置处布尔型变量的是或否(真或假)的简单计数。此方法再次绕过涉及双精度变量的计算上代价大的操作。一旦针对某一范围的潜在电荷态编译出得分,便可通过简单统计程序容易地拾取最优值。使用统计准则比使用任意得分截止或仅挑选最高计分电荷态更严格且可靠。
[0281] 2.1.5.实现最优性且由电荷指派的完全自一致性界定的迭代过程本发明新颖方法的最终关键特征是使用将电荷指派导向解决方案的适当最优性条件。最优条件简单地经界定为谱的所有质心的电荷的最一致指派。此条件下是推断指派给每一质心的电荷态应当与指派给谱中的其它质心的那些电荷态一致。本发明算法实施迭代程序以产生如以上最优性条件所指导的电荷态指派。此程序符合优化程序的公认标准。即,首先界定适当最优性条件,并且然后设计算法以满足此条件,并且最后可接着通过算法满足最优性条件的良好程度来判断所述算法的有效性。大多数现有方法缺乏此逻辑框架,且其理论优点因此难以客观地评估。
[0282] 2.2.分解算法的细节
[0283] 本发明人已开发尤其能够将自一致电荷态指派到质谱线且将包括关于若干分析物的重叠信息的复杂质谱分解为多个线集合的方法,其中每一线集合对应于相应分析物。图14是用于实现这些结果的根据本发明教示的一般步骤集合的概述流程图。图14中列出的若干操作在伴随的附图集合的其它流程图中更详细说明。
[0284] 2.2.1.高级方法。如图所示,图14描绘至少两个一般执行或工作流路径。根据第一一般执行路径或工作流,此处仅出于参考目的而被称为“文件解卷积工作流”,采用本发明教示的方法以用于分析且可能解译先前收集且存储的质谱数据的目的。根据第二一般执行路径或工作流,此处仅出于参考目的而被称为“数据相依性获取工作流”,在正获取质谱数据时以“实时”或“在线”方式采用本发明教示的方法,且基于根据本发明的计算或算法的结果而确定或控制数据获取过程的至少一些方面。图14中说明的一些步骤是上文界定的执行路径两者所共同的,且在图14中由双线界定的方框表示。其它步骤是数据相依性获取工作流路径专有的,且由虚线界定的方框表示。至少一个步骤步骤A312是文件解卷积工作流路径专有的,且由点线界定的方框表示。最后,由具有单实线的方框描绘的步骤A920和A925是关于数据相依性获取工作流任选的,但将一般与文件解卷积工作流结合而执行。文件解卷积工作流将通常跟随由图14的下部部分的点线箭头指示的一般路径。
[0285] 仍参考图14,文件解卷积工作流在步骤A312开始,其中呈至少一个质谱形式的先前所获取且存储的质谱数据从电子存储装置输入且可用于后续分析中的使用。所述质谱可为MS1谱、MS2谱或大体上任何形式的MSn谱。相比之下,数据相依性获取工作流开始于步骤A310,其中将样本引入到质谱仪中且随后在步骤A315中电离。所述样本引入可借助于注入1
或其它手段而来自层析仪。在步骤A320中产生离子的MS谱。假定在包含步骤A312的替代路径中输入的数据的产生中已经执行类似于步骤A310、A315和A320的步骤。
[0286] 在步骤A325中,识别新的峰质心(即,在所讨论的实验期间或在输入数据的MS1谱中先前未识别的质心)且添加到质心列表。在下一步骤A400中,变换质心的m/z值且将强度数据转换成布尔型值数据阵列,其中在经变换m/z尺度上指派二进位。步骤A400包括构造且填充布尔型占用阵列的第一子步骤A420以及构造且填充相对分离矩阵的第二子步骤A460(参见图15)。在本发明的后续部分中更详细地描述这些子步骤的细节。
[0287] 在仅应用于数据相依性获取工作流的步骤A510中,如果正对组成是时变的样本(例如对来自层析柱的流出物)执行质量分析,那么从“选择列表”移除已完成MSn分析的分析物的质心且可添加到“排除列表”。选择列表包含有待分析或正通过串连质量分析(MS/MS分析)或可能MSn分析而由质谱仪分析的一或多个质荷比(m/z)值或值范围,每一此类m/z值或范围对应于如通过本发明教示的方法识别的样本的化学组分。所述排除列表包含在实验的持续时间或实验期间的临时时间周期中将从未来分析排除的一或多个质荷比(m/z)值或值范围。可根据本发明教示的方法确定临时时间周期(如果采用),如本发明的后续部分中所描述。替代地对于直接输注或流动注射分析,可基于信号等级而执行将从未来分析排除的所述一或多个质荷比值或值范围。在步骤A515中从排除和选择列表移除描绘低强度质谱线的质心。如果对应质谱信号强度随后在实验运行期间增加,那么稍后可将移除的m/z值或范围添加到选择列表。
[0288] 在步骤A600中,做出尝试性的电荷态指派,如图17A和B中概括以及下文参考所述图进一步论述。随后,在步骤A700中,使用自一致性的要求调整尝试性地指派的电荷态且做出最终电荷态指派。此过程的细节在图18中概括且下文参考所述图进一步论述。一旦已经做出最终电荷态指派,则在步骤A800中使用从同位素群集的间距导出的信息将以实验方式观测到的质心分解为分析物特定的群集。步骤A800的细节在图19中说明且参考所述图进一步描述。
[0289] 方法A300的执行可在步骤A910处沿着分别由实线箭头和点线箭头指示的两个可能的执行路径中的一者分支。如果通过先前数据分析的结果控制实时串连质谱法,那么方法执行可跟随从步骤A910直接到步骤A915的“否”分支(由实线表示),从而跳过步骤A920和A925。替代地,如果将对在步骤A320中测得的MS1数据进行更多数据分析操作或者如果在步骤A312中先前输入数据,那么跟随步骤A910的“是”分支,然后可计算分子量或识别分析物物质(步骤A920),且可报告或存储计算的结果(步骤A925)。如在步骤A915处所确定,如果将执行串连质谱法,如将一般跟随数据相依性获取工作流执行路径的情况,那么所述方法沿着“是”分支而分支到步骤A930。否则,执行沿着“否”分支前进到步骤A960。
[0290] 现在考虑在图14的右侧上说明的“在线”执行路径,在步骤A930中做出所考虑质心集合中是否存在可归因于已知加成物的质心的确定。如此(步骤A930的“是”分支)则在步骤A935中将对应于加合物物质或另外经改质物质(例如从中性分子的损失产生的物质)的质心添加到排除列表。否则,绕过步骤A935。步骤A940是从上到下分析的开始,其中从在步骤A800中确定的最高P个分析物特定群集中的每一者选择代表性峰用于分段。以下步骤A945、A950和A955分别是隔离对应于选定质心的m/z比的离子、对隔离的离子进行分段以及执行产物离子的质量分析(MS2)的常规步骤。
[0291] 如果质谱实验或数据分析完成,那么方法A300的执行可在步骤A960之后结束。否则,执行返回至将样本的下一部分引入到质谱仪的步骤A310或返回至输入质谱数据的下一部分的步骤A312。
[0292] 2.2.2.建置布尔型值占用阵列。图16展示建置占用阵列[Ok]的步骤A420的细节。所述阵列值是布尔型变量,且所述阵列的索引对应于离散经变换质量/电荷值。步骤A420采取质心集合Ci(1≤i≤L)作为输入,其中L是观测到的质谱线的数目。每一Ci的特征在于其质量/电荷(m/z)i、其强度Ii、其信噪比(S/N)i及其分辨率Ri。接着,借助收集通过了强度和信噪比阈值的用户可设定准则的质心的子集{F}而执行质心的过滤(步骤A422)。接着,在步骤A424中,通过采取质量/电荷值减去质子的质量Mproton的自然对数而对{F}中的每一Ci执行质量/电荷变换,如等式1中那样。
[0293] T(m/z)i=ln((m/z)i-Mproton)     等式(1)
[0294] 在此变换之后,子集{F}中的每一质心Ci的特征在于T(m/z)i、Ii、(S/N)i和Ri。在步骤A426中标注来自子集{F}的T(m/z)值的最大值T(m/z)High和最小值T(m/z)low。此信息随后用以产生值的阵列[Ok],其中所述阵列的每一元素是布尔型值“占用”,其维持“信号”是否被认为在与所述阵列元素相关联的相应经变换质荷比值T(m/z)k处发生的记录。在创建后,将所述阵列的每一元素Ok初始化为布尔型值“假”。阵列中的离散元素的数目或阵列[Ok]的“长度”表示为Loccs,其确定为
[0295]
[0296] 其中D是阵列中的每一二进位的宽度且D=MA/106,其中通常为10的MA表示所关注的谱的质量准确性的用户可设定参数。
[0297] 在创建和初始化之后,必须以有意义的值填充阵列[Ok](在步骤A436中执行)。占用阵列[Ok]的元素是以变量k(1≤k≤Loccs)作索引,而经过滤质心子集{F}的元素是以变量i作索引。后者的索引在步骤A430中转换为对应的k值,其中对于子集{F}中的每一质心Ci,对应索引ki确定如下:
[0298]
[0299] 且被舍入到最近的整数(舍入操作由图16中的算子“ROUND[]”指示。如果质心Ci的分辨率Ri可用(例如质心模式中收集的那些的某个谱可能未做出此界定),那么跟随决策步骤A432的“是”分支,其中在步骤A434a中计算额外索引 和 如下
[0300]
[0301]
[0302] 其中值舍入到最近的整数。在其中Ri不可用的情况下,这些索引实际上在步骤A434b中分别设定成ki-1和ki+1。最后,在步骤A436中,将阵列值全部设定成用于范围从到 的索引的布尔型值“真”,即
[0303] Ok:=真;
[0304] 2.2.3.建置相对分离矩阵(RSM)。如图15中所示,步骤A460是构造相对分离矩阵的步骤且是一般步骤A400的第二子步骤。相对分离矩阵的创建是通过以下观测而促动:给定两个质心C1和C2,则如果它们属于同一蛋白质同位素峰但恰好电荷态不同,那么其质量/电荷值如下相关
[0305] |z1|×((m/z)1-Mproton)=|z2|×((m/z)2-Mproton)     等式(6)
[0306] 其中z1和z2分别是质心C1和C2的电荷态,且Mproton是质子的质量。电荷态值z1和z2将一般为全正或全负,这取决于进行分析的质谱仪仪器中使用的电离模式。执行如等式(1)中所描述的变换产生以下关系:
[0307] T(m/z)1=T(m/z)2+ln|z2/z1|       等式(7)
[0308] 等式(7)的重要性质在于在不同电荷态下的经变换T(m/z)i值是通过独立于经变换值的相加性因数而相关。因此可预先计算且高速缓冲存储量ln(z2/z1)作为可通过预先计算RSM的简单查询而在后续计算中再使用的矩阵。电荷态的绝对值将一般范围在单位一与某个最大值|Zmax|之间,或更具体来说1≤z1,z2≤|Zmax|。最后步骤是通过如等式(4)中除以D而离散化ln|z2/z1|矩阵:
[0309]
[0310] 由Zmax确定的矩阵的限制可由用户预期在谱的集合中将遇到的最大和最小电荷态来设定。替代地,Zmax可为预定或预先计算的值。通常,对于从上到下的实验,电荷态的绝对值范围是从1到50。因此在此情况下,RSM将为50x 50反对称矩阵。
[0311] 2.2.4.建置每一质心的计分分布且将其用于指派试验性的电荷态。在可通过迭代确定电荷指派的自一致集合(在图18的步骤A700中)之前,必须调配试验性的电荷指派的合理初始集合。图17A和17B中展示其细节的步骤A600通过将可能的电荷态指派到子集{F}的各质心而产生此初始集合。步骤A601-A615考虑每一此类质心,又并且针对每一考虑的质心,从最小电荷态值Zmin直到最大电荷态值Zmax逐步通过假定电荷态z的假定值。举例来说,可能针对每一质心考虑从z=1到z=50的假定电荷态。对于质心Ci的每一组合(如在步骤A601或步骤A615中选择)和假定的电荷态zi(如步骤A609的A603中设定),在步骤A605中计算“探测索引”kp(Ci,zi)的集合。探测索引是为了测试在这些索引中的每一者处的“真”值的目的而参考占用阵列[Ok]的二进位的k值的集合。kp(Ci,zi)矩阵包含的第一行的索引对应于选定质心Ci的(+/-m)理论同位素峰的离散化T(m/z)i值。举例来说,如果m=5,那么对应于(+/-5)理论同位素峰的探测索引是如下的经变换值:
[0312]
[0313] kp(Ci,zi)矩阵还包含两个额外行,其元素是通过针对上述行中的2m个探测索引中的每一者产生对应于z-1峰的预期位置的额外探测索引以及对应于z+1峰的预期位置的另一额外探测索引而计算出。具体地说,产生索引[kp(Ci,zi)+RSM(zi-1,zi)]和[kp(Ci,zi)+RSM(zi+1,zi)],其中RSM是上述预先计算且高速缓冲存储的相对分离矩阵。应注意质心Ci自身的ki索引从探测索引矩阵排除,因为在算法的此执行阶段,假定占用阵列在此索引处含有“真”的值。类似地,也可增加探测矩阵而包含(z-m,z-m+1,…,z+m-1,z+m)的更多电荷态而不是如上文所描述的仅(z-1,z,z+1)。
[0314] 在步骤A607中,针对每一测试的z值和每一质心Ci计算得分值。得分集合用以产生每一z值的计分分布。通过针对zi的每一可能的值将以实验方式导出的占用值求和而计算得分S(z)。具体地说,z的每一值的得分如下确定:
[0315] S(z)=∑Ok/C        等式(9)
[0316] 其中所述总和是在kp(Ci,zi)的k上以使得(1≤k≤Loccs)且C恰好是此k的数目。换句话说,在z处的得分恰好是如在步骤A420(图15)中构造的占用阵列中经译码的测得的高于阈值的质谱信号(即,“真”的值)“占据”的kp(Ci,zi)索引的分数。因此,在步骤A605中的计算呈流线型近似“内积”计算的形式,其中任何单个计算的最大可能的得分是单位一。通过从最低到最高用户可设定限制将z的每一值的得分求和而形成得分分布。使用1和50的我们的实例作为低和高限制,我们将得到每一质心的50个得分的分布。
[0317] 决策步骤A611针对每一质心确定是否已考虑z的最大值。如果否,那么执行返回到步骤A605用于以z的新值(如在步骤A609中设定)计算探测索引。否则,执行分支到决策步骤A613,其确定是否已考虑子集{F}中的最后质心。如果否,那么执行前进到步骤A615,其中选择下一质心,并且然后到步骤A603,其中将z值复位到其初始状态。否则,执行前进到步骤A617(图17B),在此开始调配试验性的电荷指派的过程。
[0318] 图17B中所示的步骤A617-A635说明使用在步骤A607(图17A)的多个迭代中先前产生的计分分布做出试验性的电荷指派的过程。在步骤A617中,选择第一质心;稍后在步骤A635中更新正考虑的质心的选择。在这两个步骤中的任一者之后,在步骤A620中计算相应计分分布的平均值μ和标准差σ。因此,步骤A620-A635的重复迭代致使针对与每一质心相关联的计分分布计算这些统计量度。在步骤A625中,如果存在任何得分大于平均值μ+3σ,那么将具有最大得分的z值指派给质心作为初始电荷态指派。如果不存在得分大于μ+3σ,那么提供空值作为用于所讨论质心的初始指派。
[0319] 2.2.5.通过迭代实现完全自一致电荷指派的最优性。在步骤A600中已经做出试验性的电荷态指派之后,方法A300(图14)的执行前进到步骤A700,其中调整试验性的电荷态指派。步骤A700的细节在图18中展示。最优条件简单地经界定为谱的所有质心的电荷的最一致指派。此条件下是推断指派给每一质心的电荷态应当与指派给谱中的其它质心的那些电荷态一致。
[0320] 步骤A700的细节在图18中展示,其如上方最优性条件指导而实施迭代程序以产生电荷态指派。具有非空指派(如图17B的步骤A625中指派的每一质心)继而得到考虑。这些中的每一者可与如在图17A的步骤A605中指示的探测索引的集合相关联。针对具有非空指派的所有质心重复此过程,且在每一探测索引处确定新的电荷态分布。具体地说,在步骤A702中,选择具有非空尝试性地指派的电荷态zt的第一或下一质心。在步骤A704中,如果必要则如先前相对于图17A的步骤A605描述而产生所讨论质心的探测索引。随后,在步骤A706中,假定选定质心的电荷态是zt,在对应于所讨论质心的探测索引中的每一者处计算电荷态。对于每一探测索引,保持针对所述探测索引计算每一电荷态多少次的记录。在开始通过步骤A702-A710的每一循环之前,在步骤A701中清除这些记录(复位为零)。随后,在每一循环期间,每次在步骤A706中针对探测索引计算电荷态,便递增在所述探测索引处已如此计算电荷态的次数。如果在步骤A710,存在具有非空指派的额外质心,那么执行返回到步骤A702且选择下一此类质心。
[0321] 在已考虑最后质心之后,执行分支到步骤A712。在步骤A712中,在每一探测索引处将每一电荷态的出现次数(如在步骤A706中计算)列表,进而产生每一探测索引的电荷态分布。使用新电荷态分布,在步骤A714中通过调整每一探测索引处的试验性电荷态以便使电荷态等于相应索引处列表的最高数目而获得“按大多数的电荷指派”(CAM)。所有此些CAM电荷指派的集合形成值阵列-按大多数的电荷指派阵列。
[0322] 如果在步骤A716,CAM阵列的值不同于在CAM阵列的产生中使用的电荷态值,那么电荷指派被认为是不一致的。相比之下,将完全自一致电荷指派界定为在每一索引处的电荷指派以使得其与来自产生于其的CAM阵列的指派完全一致。因此,在步骤A716,将经调整试验性的电荷态与其先前值进行比较。如果已存在大于某一可耐受限制的改变,那么所述电荷指派不是自一致的。在此情况下,跟随步骤A716的“否”分支,且执行返回到步骤A701,借此执行新的计算集合以便实现自一致性。因此,通过使用来自每一CAM的电荷以产生后续CAM而执行CAM阵列确定的一组重复。当实现收敛时实现最优性,即,CAM产生同一CAM。
[0323] 实际上,通过此程序可能不实现确切的收敛。然而,发明人的经验展示在几次迭代之后,非一致的发生变成可忽视地小,且因此可在极好的电荷态指派下停止迭代。因此,在步骤A716中,当连续CAM阵列中的差在某一可耐受限制内(即,某一容限内)时视为操作性地实现收敛。在此情况下,执行分支到步骤A718,在此将最终自一致电荷态和每一质心设定成等于发生操作性收敛的试验性的电荷态。
[0324] 2.3.分析物特定群集的确定
[0325] 群集方法开始于由等式(10)界定的群集准则,其中合理地预期在受限制m/z范围内发生的C13非单同位素峰的数目ΔNC13如下给出:
[0326]
[0327] 其中z1和z2是指派给质谱线的电荷态,(m/z)1和(m/z)2是以实验方式测得的质荷比值,MC13是碳同位素C13与C12之间的质量差,且Mproton是质子的质量。与所述计算相关联的误差(δ)或标准差是从用户供应的以ppm界定的准确性值α以及考虑中的质心的分辨率R1和R2计算,如等式(11)中描述:
[0328]
[0329] 为了确定任何两个质心(峰)是否属于同一分析物特定群集(与例如蛋白质等特定生物分子相关联),使用等式(10)计算理论ΔNC13值。如果计算的ΔNC13值是测量误差内的整数,如等式(11)中计算,那么将所述两个质心视为属于同一分析物特定群集,前提是C13峰的数目不超过用户界定的限制(通常为10到15)。当然,所属领域的技术人员可容易地使用众多其它类似统计测试,例如z测试或t测试,以确定所述两个峰是否相差整数数目的C13,以α编码的其m/z的不确定性以及分辨率R为前提。
[0330] 图19中所示的将质谱线分解为分析物特定群集的步骤A800利用了上述推理。步骤A800考虑已经对其做出电荷指派的质心,如先前描述。步骤A805以具有最大以实验方式观测的强度的经电荷指派质心开始。如此选定的质心随后用作第一群集的“种子”。随后,按逐渐减小的强度次序进行(步骤A810到A830),做出检查以确定列表中的下一质心是否以此群集的种子质心而群集。此检查是通过首先分别使用等式10和等式11计算ΔNC13及其误差δ而执行(步骤A815)。如果在决策步骤A820中注意到ΔNC13的当前计算值是计算误差内的整数,那么执行沿着“是”分支跟随到步骤A825,其中将考虑中的质心连同种子质心一起分组为属于单个群集。如果不是,那么跟随“否”分支以使得在步骤A830中,如果存在剩余的非种子质心,那么执行返回到步骤A810,其中选择下一密集非种子质心用于群集检查。如果在步骤A830,非种子质心的列表耗尽(即,不存在具有小于当前考虑质心的强度的剩余非种子质心)但存在剩余非群集质心(在步骤A835中确定),那么执行返回到步骤A805,其中使用最密集非种子质心作为新种子而开始新群集。后续迭代针对产生的所有群集种子进行检查,且在新质心不以任何先前群集而群集的情况下产生新群集。
[0331] 最后,在步骤A840中,使用简单试探法来确定由群集算法产生的任何群集是否是“健康的”。在我们的初始实施方案中,我们使用“健康的”群集必须具有至少四个相异电荷态或至少N个(用户可设定,但默认为15)成员质心的简单规则。我们根据这些准则滤出不“健康”的群集。在“不健康”群集的移除之后,剩余是最终分析物特定群集,各自表示不同生物聚合物或其它高质量化合物。
[0332] 2.4.蛋白质分子量计算
[0333] 从实验高分辨率谱计算蛋白质的单同位素分子量Mmono的更常见方式中的一者是使用所谓的“Averagine”方法(Senko,M.W,Beu,S.C.和McLafferty,F.W.,1995,《从解析的同位素分布确定大生物分子的单同位素质量和离子群体(Determination  of monoisotopic masses and ion populations for large biomolecules from resolved isotopic distributions)》,《美国质谱学会期刊(J.Am.Soc.Mass Spectrom.)》,6:229-
233),其自身是用于低分辨率数据的更早方法的扩展(Zubarev,R.A.和Bonddarenko,P.V.,
1991《,肽和寡核苷酸的平均与单同位素质量之间的先验关系(An a-priori relationship between  the  average  and  monoisotopic masses  of  peptides  and 
oligonucleotides)》,《质谱快讯(Rapid Commun.Mass Spectrom.)》,5:276-277)。简要地,Averagine方法首先通过假设模型分子“Averagine”分子对实验同位素群集进行建模。通过优化实验与理论同位素分布之间的配合,可得到所需单同位素质量的估计。
[0334] Averagine技术在可购自美国马萨诸塞州沃尔瑟姆市的Thermo Fisher Scientific的各种质谱法峰分解和分析算法内使用。虽然Averagine方法已高度成功,但本发明人受激发而基于以下考虑开发不同方法:(1)计算速度。Averagine拟合可为耗时的,这对于实时应用并非无关紧要的考虑,例如本文所描述的其中实时自动做出关于若干观测离子中的哪些将片段的决策的那些应用。然而,应注意在其中不需要大量谱拟合的情形中,计算速度可不存在任何问题;以及(2)质量准确性。对于其特征在拥挤的谱中出现的较大分子量蛋白质,对应同位素群集趋向于为有噪声的且不完整的(遗失同位素,尤其是边缘,遗失电荷态等)。在此类情况下Averagine拟合的使用可能不是适当的。
[0335] 本发明人因此在此教示一种方法,所述方法有望产生单同位素质量的稳健估计,其极容易计算且更抗噪声和假象。接受估计可能偏置的影响下,主要目标是稳健性和精度。简单地说,所述估计可能不是“真实”单同位素质量(但是与其极接近),但在面对实验缺陷时将是稳健/稳定的。在将质量准确性纳入考虑之后,误差应当从真实单同位素质量精确偏离0或+/-1道尔顿(1Da)。本发明人此处指出在许多情况下稳健性比准确性更重要。举例来说,如果将基于实验数据建置分子量数据库,那么一般需要在建置数据库的同时以及在通过新数据测试数据库的同时产生相同答案的能力,即使所述估计从真实分子量潜在地偏离
1Da但是在实验之间是相同的。
[0336] 所述方法以三个简单观测开始:(1)大多数蛋白质的同位素模式是由于C12/C13二项分布且所有其它同位素具有过低丰度而无法保证考虑;(2)二项分布的模式(即,具有最大强度的峰)是与分布的平均值、标准差或确切边界相比的所述二项分布的极稳健特征,且(3)对于二项分布,所述模式位于平均值左边少于1Da(参见图20A到20D中呈现的表A1)。这意味着所述模式是用于平均值的极可用替换,所述平均值自身对于较多噪声的数据是较难以估计的。举例来说,在边缘处截断的分布将引起不可靠的平均估计,而所述模式除非分布高度失真,否则都对此截断极稳定。
[0337] 所述计算的起始点由 界定,其为同位素群集的观测模式。随后采用计算单同位素质量的第一近似的Zubarev方法,其中:
[0338]
[0339] 单同位素质量的第二近似随后如下界定:
[0340]
[0341] 其中n是最小整数以使得M2≥M1。最后,在单同位素质量Mmono的计算中,如果存在1道尔顿内的群集的大于M2的实验峰,那么:
[0342] Mmono=M2+1.003       等式(14a)
[0343] 否则,
[0344] Mmono=M2      等式(14b)
[0345] 计算单同位素质量的此方法已并入在本文所说明的结果中。发明人的结果展示所述预测与由Averagine方法预测的那些结果相比极有利。对于大蛋白质,对标准蛋白质的测试指示单同位素质量估计是稳定的。另外,还针对接近地相关的峰或蛋白质变体计算群集分子量。我们将此计算的结果称为“群集分子量”。在已经成批发现蛋白质变体之后,使用更有辨识力的误差函数执行所有蛋白质变体的群集分析:
[0346] 误差=min|w1-w2-N×1.003|        等式(15)
[0347] 其中-3≤N≤3。如果误差<0.5(w1+w2)×10ppm,那么w1和w2应当被视为相等的。每一蛋白质变体随后将映射到由共识单同位素质量表示的相等蛋白质变体的群集中。此质量被称为且存储为“共识MW”。
[0348] 2.5.程序输入和输出
[0349] 图21A展示采用本文所描述的数据相依性方法的计算机程序的数据获取后版本的起始页(即,视觉显示屏截图)。在图21A中说明的显示器的左边,“原始文件”方框充当用于待处理的质谱法数据文件的输入线。可启用“批次模式”复选框,进而允许用户处理多个数据文件,而“自动扫描递增”复选框用以启用连续谱的处理。通过用户启用“绘图解卷积”复选框可在显示器中标绘来自所述程序的数据获取后版本的结果。将处理的最小和最大谱(扫描)数目是由“扫描按钮”设定,其直接默认为文件长度(以扫描数计)或可由用户设定。
[0350] 如图21A下部左侧所见,可通过致使结果输出到峰列表且通过用户将输出指定为MS1或MS2类型数据(以csv文件格式)来控制输出。质量容限(Mass Tol)默认为3;然而这也可由用户设定。输出也可以.puf文件格式产生以用于输入到ProSightTM PC蛋白质识别程序中。谱分解结果(在本文中也被称作“解卷积”结果)的细节也可以.csv文件格式存储以用于进一步数据分析。“结果”标签中的解卷积概述列出了经分析以产生报告的数据文件和扫描。沿标签向下是所检测质心的总数以及作为程序的部分经过滤的数目。成功地接收电荷态指派的峰的百分比在“Zscape”方框中找到,还有与所述领域的技术人员当前使用的前导现有解卷积程序中的一者所计算的结果的比较。“两者经指派”和“一致”方框量度所述两个程序之间的协定。移动到“结果”标签的底部,展示经指派群集的百分比以及经解卷积的唯一蛋白质的总数。图21D中展示此标签的放大图。
[0351] 图21A中所示的位于显示的右侧的两个标签提供挑选与解卷积过程相关联的指派和群集参数。在图21B中,“指派参数”标签包含以百万分率(ppm)计的质量准确性、最小峰强度阈值、需要的最小信噪比(s/n)以及解卷积过程预期的最低和最高电荷态。这些参数进一步划分成两个列,各自用于MS1和MS2分析。
[0352] 图21C中所示的“群集参数”标签也划分成分别与MS1和MS2分析相关的两个列。提供邻接电荷态和同位素的最小数目的用户输入以用于上述群集收敛计算。此输入标签上还呈现“足够邻接电荷态”、“足够邻接同位素”和“质量分离”参数输入显示。
[0353] 2.6.实例
[0354] 图22A展示来自由细胞色素C、溶菌酶、肌血球素、胰蛋白酶抑制剂和碳酸酐酶组成的五组分蛋白质混合物的解卷积结果。所述显示的顶部显示面板A1203展示从表示为质心的质谱法所获取的数据。位于中央的主显示面板A1201说明每一峰为相应符号。用于顶部面板A1203和中央面板A1201的水平安置的质荷比(m/z)尺度A1207展示于中央面板下方。计算机显示还可包含(图22A中未具体展示)用于质量准确性(以ppm表达)的设定、峰/同位素群集设定、最小强度阈值和信噪比设定,以及与计算相关联的最小和最大电荷态。显示的左侧的面板A1205展示蛋白质分子的以道尔顿计的所计算分子量。侧面板A1205的分子量(MW)尺度垂直地定向于所述显示上,其垂直于关于检测到的离子的水平定向m/z尺度A1207。中央面板A1201中的每一水平线指示在此实例中具有对应于离子电荷态的点线轮廓线的蛋白质的检测,其显示为先前论述的变换计算的直接结果。在图22B中展示关于同一数据集的显示,其中分子量(MW)尺度相对于图22A中所示的视图极大地扩展。图22B的扩展图说明单个蛋白质电荷态的良好解析同位素(左面板A1205的最下部部分)以及潜在加合物或杂质峰(所述显示中存在两个)。这三个分子中最密集的是胰蛋白酶抑制剂蛋白质。图22C中的另一扩展图展示胰蛋白酶抑制剂蛋白质在同位素层级的确切细节。用以表示个别同位素的符号大小根据每一同位素峰的强度而按比例缩放。
[0355] 图23A展示来自细菌大肠杆菌的粗提取物的数据和解卷积结果。使用仅单级质谱法将此样本直接灌注到质谱仪中。使用根据本发明教示的方法获得的计算结果指示此样本中58个唯一可辩别的蛋白质的存在。在此实例中的许多所述蛋白质具有重叠电荷态,其容易使用前述算法而群集。图23B说明对应于同一数据集的另一显示,其展示m/z=700Da/e附近的m/z尺度的扩展图(以及以道尔顿计的MW尺度的扩展图),其展示由顶部面板A1203中的不同图案化质心描绘的三个相异电荷态。所述显示的顶部面板A1203中的质心A1301对应于具有质量15,305.76Da的蛋白质的+22同位素解析电荷态。在此情况下,这是存在的仅有电荷态分布,但即使质心条A1303和A1305在所讨论电荷态的1Da内发生,所述算法也正确地识别群集。许多当前可用的解卷积程序无法正确地指派电荷态到3Da窗口内的独立分布(两个不同蛋白质)。并且,质心条A1305表示具有质量16,017.57Da的大肠杆菌的蛋白质的+23电荷态。应注意此蛋白质的+23电荷态与具有质量15327.47Da的单独+22电荷态蛋白质的质心条A1303直接重叠。典型解卷积程序不能够正确地指派具有此种类小间距或重叠电荷态的谱中的峰,如通过与图23C的比较可见,图23C展示使用采用常规算法的程序所获取且处理的同一质谱。常规方法不能够在谱的此区中做出任何电荷态指派,如由图中所关注的峰上的“问题标记”指示。图23D已经正确地标记如由我们的采用本文教示的新颖方法的算法指派的用于上述两个重叠电荷态的原始分布数据的电荷态。
[0356] 采用根据本发明教示的方法的程序也可确定并不含有个别地解析的同位素的那些峰的电荷态。在图24A中说明的另一实例中,以变化程度的糖基化展示完整抗体的质谱。图24A的插图中显示抗体的不同糖型的实例。图24B说明范围从148378Da到148763Da的四个解卷积糖型的解卷积分子量。
[0357] 根据本发明教示的方法也具有用于解卷积串连质谱法数据的实用性。在如图25A和25B中说明的另一实例中,针对碰撞激活解离而选择来自蛋白质碳酸酐酶II的两个电荷态。在图25A中展示碳酸酐酶II的+26电荷态的MS/MS谱和对应解卷积。与使用常规算法的仅9%相比,此处正确地识别64%的质心。甚至在许多MS/MS片段并不产生同一片段的多个电荷态的情况下也群集确切50%的质心。经正确识别的片段离子的总数是35。图25B展示在m/z 1001处的碳酸酐酶II的+21电荷态的MS/MS分段和解卷积。此处正确地群集74%的质心且指派78%的电荷态。使用所述程序识别总共49个片段离子。
[0358] 2.7.引导数据相依性获取以避免冗余测量
[0359] 在建立动态排除列表的传统方法中,m/z值在指定时间周期中放置在列表上,所述时间周期近似为给定化合物/化合物类型的平均峰宽度。当对于小分子或肽(即通常具有相同生理化学性质的胰蛋白酶肽)使用此方法时,其良好起作用而增加与化合物识别过程相关联的动态范围。与其相反,完整蛋白质(如在从上到下蛋白质组研究中测得)在大小、胺基酸组合物、生理化学性质和3-D结构方面广泛变化。此变化率通常导致蛋白质上的更多位点(与较小分子分析物的情况相比)与层析柱的固定相交互。结果是一些峰可能为仅几秒宽,而其它峰可持续约数分钟。图13中说明可预期的变化率的典型实例,其展示从单个层析运行获得的变化峰分布。因此,动态排除的标准方法不是用于从上到下分析的理想拟合。为了矫正此问题,本发明方法采用信号强度分级系统以确定与给定蛋白质相关联的电荷态应当放置在动态排除列表上多长时间。在此新方法中,每一群集的种子质心放在排除列表上。当后续MS1扫描中提出新种子质心时,首先在步骤A510中进行检查以确定所述新质心是否以当前在选择列表上的种子质心中的任一者而群集(图14)。如果是这样,那么进行检查以确定新质心的强度是否已经下降到低于阈值(如原始种子质心的强度的分数)。仅当强度确实下降到低于阈值时,才将原始种子质心从排除列表去掉(步骤A515)。
[0360] 替代地,来自给定蛋白质的所有电荷态可放置在排除列表上,因此避免从用于串连MS分析的同一蛋白质选择不同电荷态。虽然这些电荷态在动态排除列表上,但监视构成所述列表的峰的信号强度直到它们低于经界定最小强度或者存在从在经界定质量差(ppm)的电荷态中的一者的信号增加,其指示具有不同质量和电荷但相同m/z值的两个组分的存在。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈