首页 / 专利库 / 物理 / 质量 / 质量分析数据解析装置及程序

质量分析数据解析装置及程序

阅读:3发布:2021-12-10

专利汇可以提供质量分析数据解析装置及程序专利检索,专利查询,专利分析的服务。并且提供一种 质量 分析数据解析装置,在质量分析数据解析装置中作为解析对象的质谱数据使用质心数据。首先,将所述质心数据的峰值从强度大的峰值起顺次 指定 为用于同定同位素群的基准峰值,将在该基准峰值的前后所排列的峰值的出现模式与假设各价数时所预想的同位素群的出现模式进行比较,检测出同位素群。将由此所同定的同位素群的价数设为该同位素群所属的峰值的价数,将该群的前头的峰值同定为单一同位素峰值。根据这样的质量分析数据解析装置,能在短时间内进行质谱上的各峰值的价数的判定及单一同位素峰值的同定。,下面是质量分析数据解析装置及程序专利的具体信息内容。

1.一种质量分析数据解析装置,通过对质量分析所取得的质谱数据 进行解析,来判定该质谱中的各离子峰值的价数以及同定单一同位素峰 值,
该质量分析数据解析装置具备:
(a)质心数据作成部件,根据作为所述质谱数据所取得的分布数据 来作成质心数据;和
(b)数据解析部件,根据所述质心数据上峰值的出现模式来检测出 质谱上的同位素群,根据其结果对该同位素群所属的峰值的价数进行判定 以及对该同位素群的单一同位素峰值进行同定。
2.根据权利要求1所述的质量分析数据解析装置,其特征在于,
所述数据解析部件还具备:
(c)基准峰值指定部件,将所述质心数据上的峰值从强度大的峰值 起顺次指定为用于同定同位素群的基准峰值;
(d)模式匹配部件,将在所述基准峰值的前后排列的峰值的出现模 式与规定的价数范围中的同位素群的峰值出现模式进行比较;
(e)同位素群同定部件,当所述模式匹配部件所完成的比较结果为 所述基准峰值和其前后排列的峰值的出现模式与所述同位素群的出现模 式一致时,对含有该基准峰值的同位素群的价数进行决定以及对该同位素 群所属的峰值进行决定;
(f)峰值价数判定部件,将由所述同位素群同定部件所决定的同位素 群的价数决定为该同位素群所属的峰值的价数;和
(g)单一同位素峰值同定部件,将该同位素群中质量电荷比最小的 峰值作为单一同位素峰值。
3.根据权利要求2所述的质量分析数据解析装置,其特征在于,
所述同位素群同定部件在决定同位素群所属的峰值之际,利用针对已 匹配的峰值的相对强度作为所述基准峰值或该同位素所属的峰值,并且对 该同位素群所属的各峰值候补进行选择。
4.一种程序,使计算机作为权利要求1~3中任一项所述的质量分析 数据解析装置发挥功能。

说明书全文

技术领域

发明涉及用于通过对质量分析所得到的数据进行解析、来判定质谱 上的各离子峰值的价数以及同定单一同位素峰值(monoisotopic peak)的 质量分析数据解析装置。

背景技术

以往,在对质量分析所得到的数据进行解析之际,如专利文献1及2 所示,已知有以下的方法:作为表示质谱的数据,使用根据连续检测出的 离子的m/z值(质量电荷比)及其检测强度来表示质谱的分布(profile) 数据。分布数据为相当于质量分析装置的原始数据(Raw Data)的数据形 态,在使用该分布数据的以往的质量分布数据解析方法中,通过利用模式 识别算法对分布数据上的各峰值的形状进行解析,同定同位素群(源于具 有同一元素组成的离子,由用于表示随着离子中的同位素组成的不同而不 同的m/z值的多个峰值构成的峰值组),基于其结果对各峰值的价数或单 一同位素峰值(成为同位素群的代表的离子的峰值。通常指由天然存在比 最大的同位素构成的离子的峰值。)进行同定。

发明内容

上述的质量分析数据解析方法利用于例如在质量分析装置的数据分 析结束之后以离线(offline)进行解析的“蛋白质解析软件”等中。但是, 基于质量分析的蛋白质解析等中,通过使用四极型离子阱(Quadrupole Ion Trap:QIT)的碰撞诱导分解(Collision lnduced Dissociation:cld)等对特 定的峰值所对应的离子进行捕捉和开裂(splitting)的、所谓的MS/MS分 析(或者MSn分析)被广泛应用,于是,在分析中大多数需要用于动态地 选择准(precursor)离子的功能(Data Dependent Acquisition:DDA功能)。
一般在MS/MS分析中,首先从分析对象物将具有特定的质量电荷比 (m/z)的离子选择为准离子,对通过CID使该准离子开裂而产生的离子 (生成离子:product ion)进行质量分析,从而取得关于作为目的的离子 的质量或化学构造的信息。因此,为了实现DDA功能,就需要在分析实 施中(即在线(online))从质谱中判定作为准离子应选择的峰值的价数、 并且自动地判定该峰值是否为单一同位素峰值的功能。
对质谱中的峰值的价数进行判定或同定单一同位素峰值的技术,如上 所示,可通过以往的使用分布数据进行解析的离线解析用的软件等来实 现,但在这样的以往的解析方法中,由于在解析处理中需要很多的时间, 因此不能实现在分析实施中由在线进行的DDA功能。
因而,本发明所要解决的问题在于,提供一种可在短时间内对质谱上 的各峰值的价数进行判定及同定单一同位素峰值的质量分析数据解析装 置。
为了解决上述课题,本发明的质量分析数据解析装置,通过对质量分 析所取得的质谱数据进行解析,来判定该质谱中的各离子峰值的价数及同 定单一同位素峰值,
该质量分析数据解析装置具备:
(a)质心数据作成部件,根据作为所述质谱数据所取得的分布数据 来作成质心数据;和
(b)数据解析部件,根据所述质心数据上的峰值的出现模式来检测 出质谱上的同位素群,根据其结果对该同位素群所属的峰值的价数进行判 定以及对该同位素群的单一同位素峰值进行同定。
在此,质心数据是指用于表示质谱的数据形态的一种,将质谱上的各 峰值通过用于表示其峰值的质心的m/z值和其峰值的面积值这两个值来表 示。
进一步,上述本发明的质量分析数据解析装置,优选所述数据解析部 件具备:
(c)基准峰值指定部件,将所述质心数据上的峰值从强度大的峰值 起顺次指定为用于同定同位素群的基准峰值;
(d)模式匹配部件,将在所述基准峰值的前后排列的峰值的出现模 式与规定的价数范围中的同位素群的峰值出现模式进行比较;
(e)同位素群同定部件,当所述模式匹配部件所完成的比较结果为 所述基准峰值和其前后排列的峰值的出现模式与所述同位素群的出现模 式一致时,对含有该基准峰值的同位素群的价数进行决定以及对该同位素 群所属的峰值进行决定;
(f)峰值价数判定部件,将由所属同位素群同定部件所决定的同位素 群的价数决定为该同位素群所属的峰值的价数;和
(g)单一同位素峰值同定部件,将该同位素群中质量电荷比最小的 峰值作为单一同位素峰值。
进一步,本发明的质量分析数据解析装置,作为优选,所述同位素群 同定部件在决定同位素群所属的峰值之际,利用针对已匹配的峰值的相对 强度作为所述基准峰值或该同位素所属的峰值,并且对该同位素群所属的 各峰值候补进行选择。
另外,本发明的程序,使计算机作为上述的质量分析数据解析装置发 挥功能。
根据具有上述构成的本发明的质量分析数据解析装置,作为成为解析 对象的质谱数据而使用质心数据,与以往的使用分布数据进行解析的情况 相比,不仅使输入数据的信息量大幅度减少,并且能简化用于同定同位素 群的模式匹配的算法。因此,其结果能大幅度地缩短用于同位素群的同定、 各峰值的价数的判定及单一同位素峰值的同定、这些处理所需的时间。
另外,将本发明的质量分析数据解析装置形成为具有上述的基准峰值 指定部件、模式匹配部件、同位素群同定部件、峰值价数判定部件及单一 同位素峰值同定部件的装置时,为了在质谱中从强度大的峰值起顺次对该 峰值的前后的峰值进行模式匹配,此时基于作为基准峰值或其同位素群所 属的同位素峰值相对已匹配的峰值的相对强度,能对该同位素群所属的各 峰值的候补进行选择。当本发明的质量分析数据解析装置形成为用于实施 上述选择的装置时,能降低将噪音等的峰值误识为包含在同位素群中的匹 配错误,能确保高的解析精度
附图说明
图1是表示本实施例的质量分析数据解析装置的概略构成的图。
图2是表示该实施例的质量分析数据解析装置中的数据处理的步骤的 流程图
图3是使用该实施例的质量分析数据解析装置中的质心数据的模式匹 配处理的概念图
图4是由该实施例的质量分析数据解析装置所同定的同位素群峰值的 例子,(a)是在PEG的质谱中同定为1价的同位素群的例子,(b)是在 胰岛素的质谱中同定为6价的同位素群的例子。
图中:10-LCMS-IT-TOF装置,20-分离/检测部,21-离子化部, 22-离子阱型质量分离部,23-飞行时间型质量分离部,24-离子检测部, 30-控制/处理部,31-控制部,32-数据处理部。

具体实施方式

下面,利用实施例对用于实施本发明的优选实施方式进行说明。
[实施例]
本实施例的质量分析数据解析装置,是在具备离子阱和飞行时间型质 量分析器的液体色谱法质量分析装置(LCMS-IT-TOF(株式会社岛津 制作所的注册商标))10所包含的计算机上搭载了本发明的用于质量分析 数据解析的程序的装置,作为该LCMS-IT-TOF装置10的一部分进行 动作。此外,该计算机也可以是组装入该LCMS-IT-TOF装置10的一 部分的装置,也可以是使用市场上出售的个人计算机的装置。
本实施例的LCMS-IT-TOF装置10,如图1所示,大体上由分离/ 检测部20和控制/处理部30构成。分离/检测部20具备:利用电雾离子化 法(Electrospray lonization:ESI)使用于分析的试料离子化的离子化部1、 具备将具有规定的m/z值的离子选择为准离子且使该准离子开裂而产生生 成离子的功能的四极离子阱型质量分离部22、基于m/z值将离子分离的飞 行时间型质量分离部23、和离子检测部24。
控制/处理部30是由LCMS-IT-TOF装置10所包含的计算机来实现 的部件,具备:用于控制分离/检测部20的各部的控制部31;和用于处理 来自离子检测部24的信号并进行规定的解析的数据处理部32。数据处理 部32作成质谱数据,并且进行基于该质谱数据的同位素群的检测、峰值 价数的判定及单一同位素峰值的同定等处理,其功能由搭载在所述计算机 中的本发明的程序来实现。
下面,用图2的流程图及图3的概念图来说明使用本实施例的质量分 析数据解析装置的数据处理的步骤。
首先,将基于来自离子检测部24的信号所作成的质谱的分布数据进 行变换而作成质心数据(S1)。该质心数据由含有各峰值的m/z值、强度、 和在同位素峰值时的该同位素群的ID编号、价数、包含是否为单一同位 素峰值的标记等信息的结构体的列表(索引按m/z值的顺序排列)构成(但 是,解析前的状态中,所述同位素群ID编号、价数、单一同位素峰值有 关的信息为空白)。
首先,为了按强度顺序访问上述质心数据,作成按照质心数据上的各 峰值的强度为下降顺序的方式排列的各峰值的索引列表(强度下降顺序索 引列表)(S2)。接着,将由此可找到的同位素群的ID编号(群索引值) 及上述强度下降顺序索引的索引值进行初始化(S3、S4)之后,在质心数 据上首先决定成为用于寻找同位素群模式的基准的峰值(基准峰值)的候 补的峰值(S5)。在此,从大强度起顺次选择成为基准峰值的峰值,因此 在最初的处理中基础峰值(所测定的峰值中具有最大的强度的峰值,图3 中为A的峰值)成为基准峰值。此外,第二次以后的处理中,通过以前的 处理已经作为同位素群所属的峰值所同定的峰值,不会选择为基准峰值。
接着,以上述基准峰值为中心,检查其周围的峰值模式,判断该峰值 模式是否与各价数的同位素群中的峰值的出现模式一致(将该处理称作价 数模式匹配,S7)。
此时,作为价数模式匹配时的参数将设定以下的值。
(1)用于寻找同位素群的价数范围(默认值:1~10价)
(2)用于寻找同位素群所属的峰值的分辨率的允许范围(默认值: ±50ppm)
(3)可认为是用于构成同位素群的峰值数的最小值(默认值:3)
(4)群前方匹配最大阈值(详情后述)(默认值:0.3)
(5)相邻峰值匹配阈值(详情后述)  (默认值:0.05)
从基准峰值的m/z值的位置起在每离开了假设该基准峰值包含于各价 数的同位素群时的步骤宽度量的位置上(由上述参数所指定的分辨率的允 许范围内)、检查是否存在峰值来实施价数模式匹配。例如,在基准峰值 包含于1价的同位素群时,该同位素群所属的多个峰值表示m/z值逐个不 同的峰值模式,因此所述步骤宽度变为1(图3的同位素群1);包含于2 价的同位素群时,该同位素群所属的峰值表示m/z值按每1/2不同的峰值 模式,因此上述步骤宽度变为1/2(图3的同位素群2)。
但是,对于比基准峰值位于更前方的峰值(前方峰值),设定对于随 着基准峰值的质量(mass)值(m/z值中,为与假设的价数z相乘后的值, 单位[Da]而变化的基准峰值的相对强度的阈值(该阈值的上限值为“群前 方匹配最大阈值”),具有该阈值以下的强度的峰值在匹配之际从同位素 群所属的峰值的候补错开。例如,图3中由箭头表示的峰值其与含有基准 峰值A的1价的同位素群的峰值模式相匹配的、相对基准峰值A的相对强 度为阈值以下,因此判断其为噪音,从而从同位素群1所属的峰值的候补 中除去。
进一步,通过对作为该同位素群所属的峰值所匹配的相邻的峰值的相 对强度,决定用于匹配的强度的上下限值(将它称为“相邻峰值匹配阈 值”),并将具有从其上下限值偏离的强度的峰值从同位素群峰值的候补 中去除。例如,对相邻峰值的相对强度阈值为0.05的情况下,相邻的峰 值的强度为100时,为100×0.05=5以上且100/0.05=2000以下。另外, 已经作为同位素群所属的峰值被同定的峰值也将从匹配的对象中去除。
在上述价数模式匹配中,选出以基准峰值为中心的峰值模式和匹配后 的同位素群价数模式中的、匹配分辨率(寻找同位素群所属的各峰值之际 的测定值和预测值之差的标准偏差)为最小的同位素群价数模式(匹配后 的价数模式为一个时决定该价数模式),由此同定同位素群(S9)。
接着,将S9所选择的价数模式的价数作为同定后的同位素群所属的 各峰值的价数来进行判定,并且将位于该同位素群的前头的峰值同定为单 一同位素峰值(S10),将同定后的同位素群所属的各峰值的群ID编号、 价数、单一同位素峰值有关的信息作为追加信息反映在上述的质心数据中 (S11)。
其后,对群索引值及强度下降顺序索引列表的索引值分别追加1(S12、 S13),对质心数据中的全部的峰值执行上述S5~S13的处理。此外,在 价数模式匹配(S7)中,在基准峰值的周围作为同位素群而匹配的峰值模 式不存在时(图3的基准峰值B),跳过上述S9~S12的处理而执行S13, 进行下一个基准峰值(图3的基准峰值C)的决定。此外,S6中,若强度 下降顺序列表的索引值不能变为质心数据上的数据数以上,则判定为基准 峰值的决定处理正常结束,解析处理继续进行;当不是上述的情况时,判 断为异常结束,解析处理结束。
通过以上的处理,按质谱上的峰值强度顺序依次进行以其峰值为中心 的同位素群的匹配,同定后的同位素群所属的峰值的价数及单一同位素峰 值被决定。图4示出了由以上的处理所同定的同位素峰值的一例。图4(a) 是在作为分析试料使用聚乙烯乙二醇(PEG)时的质谱上同定为1价的同 位素群的例子,图4(b)是在作为分析试料使用胰岛素时的质谱上同定为 6价的同位素群的例子。
实验例:
将以肌红蛋白为分析试料的质谱的质心数据(m/z=400~1500,峰值 数754)进行输入,本实施例的质量分析数据解析装置所需要的处理时间 被测定为29.4ms。另外,此时分布数据要变换为质心数据所需的时间为 85.1ms,质谱中的离子峰值的价数及单一同位素峰值的自动判定处理所需 的整个执行时间为85.1+29.4=114.5ms。与此相对,以往技术的算法中, 在1个质谱中,为了进行全同位素群的同定而需要大约2小时,通过本实 施例的质量分析数据解析装置,可确认能大幅度地缩短解析时间。另外, 为了实现上述的DDA功能,对于1个质谱,需要以大约100ms的量级完 成各峰值的价数的判定及单一同位素峰值的同定,根据上述实验结果确认 了本实施例的质量分析数据解析装置可以充分地实现DDA功能。
此外,本发明的质量分析数据解析装置,将用于按照如上所述的数据 处理步骤执行质谱上的同位素群的检测、峰值的价数判定及单一同位素峰 值的同定的、处理的软件搭载在具有上述LCMS-IT-TOF装置的MS/MS 解析功能的装置的内部所设置的计算机,从而实现DDA功能,但是并不 限于此,在与各种质量分析装置连接所使用的外部的个人计算机上搭载如 上所述的软件,也可以进行在线或离线中的数据解析。
非专利文献1:Journal of the American Society for Mass Spetrometry(美 国),2000年,第11卷,pp.320-332
非专利文献2:Journal of the American Society for Mass Spetrometry(美 国),1995年,第6卷,pp.229-233
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈