首页 / 专利库 / 诊断设备和程序 / 肿瘤标记物 / 使用所测分析物改进疾病诊断的方法

使用所测分析物改进疾病诊断的方法

阅读:1022发布:2020-08-27

专利汇可以提供使用所测分析物改进疾病诊断的方法专利检索,专利查询,专利分析的服务。并且本 发明 提供了改进临床诊断测试的方法以及相关的诊断技术。,下面是使用所测分析物改进疾病诊断的方法专利的具体信息内容。

1.一种试剂盒,其用于实施用于诊断疾病的方法,所述方法包括以下步骤:
a)确定来自受试者的盲样中的至少三种预定生物标记物的浓度;
b)选择与所述受试者相关的一个或多个元变量,元变量在与已知有或没有所述疾病的群体成员的受试者相关的群体中变化;
c)将所述生物标记物的浓度转换为一个或多个群体分布特征和所述一个或多个元变量的函数,以计算表示每种生物标记物的伪浓度,其中,所述伪浓度通过如下等式计算:
伪浓度=α×自然对数((Ci/C(c或h))-(Ch/Cc))2,其中:
α为比例常数;
Ci=实际患者的生物标记物的测量浓度;
C(c或h)=该患者生物标记物的患者年龄调整浓度;
Ch=非疾病患者的生物标记物的患者年龄调整平均浓度;
Cc=疾病患者的生物标记物的患者年龄调整平均浓度;
d)比较所述伪浓度和确定的已知有或没有疾病的群体成员的伪浓度的训练集模型,所述比较包括在多维空间的空间分析,所述在多维空间的空间分析包括拓扑稳定性调节、元变量标准化和/或伪浓度转换中的一种或多种;以及
e)确定所述比较是否提供所述受试者具有所述疾病的指示,其中所述指示是分数,所述分数的确定是通过使用单独的样品的单独的网格点确定乘以单独的双标记平面的总预测能
2.根据权利要求1所述的试剂盒,所述训练集模型的制备方法包括以下步骤:
a)确定来自一组受试者的样品的训练集中至少三种预定生物标记物的浓度;
b)选择与所述受试者相关的元变量,所述元变量在与已知有或没有所述疾病的群体成员的受试者相关的群体中变化;
c)将所述生物标记物的浓度转换为一个或多个群体分布特征和所述元变量的函数,以计算表示每种生物标记物的伪浓度;以及
d)由确定的已知有或没有疾病的群体成员的伪浓度制备所述训练集模型。
3.根据权利要求1或2所述的试剂盒,其中,所述疾病为选自由以下组成的组的实体组织癌:乳腺癌前列腺癌癌。
4.根据权利要求1或2所述的试剂盒,其中,所述比较步骤还包括使用不一致训练集模型。
5.根据权利要求1或2所述的试剂盒,其中,用于标准化处理以及对浓度的不规则或不连续分布进行平滑处理的数学方法是将非疾病和疾病状态下的蛋白质的测量浓度与经年龄调整的浓度的平均值的比值取对数,其中单独的样品是预测的,以及将非疾病和疾病状态下的蛋白质的浓度的比值取对数,使得在相关计算中使用的所得的新自变量的分布被压缩以帮助相关计算。
6.根据权利要求1或2所述的试剂盒,其中,所述诊断疾病的方法还包括基于对足够的双标记平面上的双标记平面拓扑不稳定性的知识,通过调整所述单独的生物标记物的加权影响对所述训练集模型的校正步骤,以显著改变险分数,这些不稳定性是由每个双标记平面的拓扑结构中的陡坡或高峰或深谷引起的。
7.一种试剂盒,其用于实施用于诊断疾病的方法,该方法包括在选自包括免疫系统促炎症和抗炎症标记物、肿瘤抗发生标记物、血管新生标记物、细胞凋亡标记物、血管生成蛋白标记物和组织标记物的集的至少三种生物标记物的生物样品中的浓度的确定,其中,除所述组织标记物外的所述生物标记物的任何一种或多种是低丰度蛋白,其中,所述试剂盒用于实施在多维空间中对所述生物标记物进行空间分析,所述在多维空间的空间分析包括拓扑稳定性调节、元变量标准化和/或伪浓度转换中的一种或多种,并且所述群体也具有所述疾病,其中,所述伪浓度通过如下等式计算:
伪浓度=α×自然对数((Ci/C(c或h))-(Ch/Cc))2,其中:
α为比例常数;
Ci=实际患者的生物标记物的测量浓度;
C(c或h)=该患者生物标记物的患者年龄调整浓度;
Ch=非疾病患者的生物标记物的患者年龄调整平均浓度;
Cc=疾病患者的生物标记物的患者年龄调整平均浓度;
其中,所述伪浓度提供受试者患有疾病的指示,所述指示是分数,所述分数的确定是通过使用单独的样品的单独的网格点确定乘以单独的双标记平面的总预测能力。
8.根据权利要求7所述的试剂盒,其中,所述疾病为选自由以下组成的组的实体组织癌:乳腺癌、前列腺癌和肺癌。
9.根据权利要求7所述的试剂盒,其中,至少一种确定的生物标记物的浓度值低于LOD,其中,这种生物标记物的浓度值是通过对于生物标记物的LOD和最低读数之间的直线或其他合适的标准曲线拟合方法而确定的,并且其中,没有生物标记物被赋予零或负值,并且类似样品中没有生物标记物被赋予小于为生物标记物的最低接受值的值。
10.一种能够诊断疾病的训练集模型,其制备方法包括以下步骤:
a)确定来自一组受试者的样品的训练集中至少三种预定生物标记物的浓度;
b)选择与所述受试者相关的元变量,所述元变量在与已知有或没有所述疾病的群体成员的受试者相关的群体中变化;
c)将所述生物标记物的浓度转换为一个或多个群体分布特征和所述元变量的函数,以计算表示每种生物标记物的伪浓度,其中所述转换包括在多维空间中对所述生物标记物进行空间分析,所述在多维空间的空间分析包括拓扑稳定性调节、元变量标准化和/或伪浓度转换中的一种或多种,其中,所述伪浓度通过如下等式计算:
伪浓度=α×自然对数((Ci/C(c或h))-(Ch/Cc))2,其中:
α为比例常数;
Ci=实际患者的生物标记物的测量浓度;
C(c或h)=该患者生物标记物的患者年龄调整浓度;
Ch=非疾病患者的生物标记物的患者年龄调整平均浓度;
Cc=疾病患者的生物标记物的患者年龄调整平均浓度;以及
d)由确定的已知有或没有疾病的群体成员的伪浓度制备所述训练集模型,其中所述制备保持聚类,其中,所述训练集模型提供分数,所述分数的确定是通过使用单独的样品的单独的网格点确定乘以单独的双标记平面的总预测能力。
11.根据权利要求10所述的训练集模型,其中,所述疾病选自由以下组成的组的实体组织癌:乳腺癌、前列腺癌和肺癌。
12.根据权利要求10所述的训练集模型,其中,用于标准化处理以及对浓度的不规则或不连续分布进行平滑处理的数学方法是将非疾病和疾病状态下的蛋白质的测量浓度与经年龄调整的浓度的平均值的比值取对数,其中单独的样品是预测的,以及将非疾病和疾病状态下的蛋白质的浓度的比值取对数,使得在相关计算中使用的所得的新自变量的分布被压缩以帮助相关计算。
13.根据权利要求10所述的训练集模型,其中,所述自变量和所述元变量之间的关系包括选自由以下组成的组的自变量的群体分布特征:疾病和非疾病状态之间的关系的非线性程度、一个或多个高斯组、一个或多个非高斯组、组平均值、组平均数、组中值和组动态范围值。
14.根据权利要求10所述的训练集模型,其中,所述制备方法还包括基于在相关群体中的典型受试者中的疾病进展过程中单独的生物标记物的上调或下调特性诸如子分组或非线性程度的知识,通过调整所述单独的生物标记物的加权影响对所述训练集模型的校正步骤。
15.根据权利要求10所述的训练集模型,其中,所述制备方法还包括基于对足够的双标记平面上的双标记平面拓扑不稳定性的知识,通过调整所述单独的生物标记物的加权影响对所述训练集模型的校正步骤,以显著改变风险分数,这些不稳定性是由每个双标记平面的拓扑结构中的陡坡或高峰或深谷引起的。
16.根据权利要求10所述的训练集模型,其中,所述制备方法还包括通过使用不一致训练集模型校正由于足够的双标记平面上的拓扑不稳定性导致的结果预测中显示不稳定性的单独的盲样对所述训练集模型的校正步骤,以显著改变风险分数,这些不稳定性是由每个双标记平面的拓扑结构中的陡坡或高峰或深谷引起的。

说明书全文

使用所测分析物改进疾病诊断的方法

[0001] 本申请是申请日为2014年3月13日的题为“使用所测分析物改进疾病诊断的方法”的中国专利申请号201480024982.6的分案申请。

技术领域

[0002] 本发明涉及改进疾病诊断的准确性的方法,并且涉及包括所测分析物与二元结果的相关性的相关联的诊断测试。

背景技术

[0003] 其中三个或多个自变量用于关联二元结果(诸如存在或不存在给定疾病)的相关方法通常与聚类或邻域搜索法、回归法和小波分析法一起使用。在疾病预测的情况下,测量血液或血清的常见成分并且使用这些浓度作为各种疾病状态预测的自变量来尝试关联。在结果是“疾病”或“非疾病”的给定疾病状态的情况下,通常使用逻辑回归法。其他技术包括例如遗传算法。这些方法的预测能高度依赖于选择用于该方法的成分分析物。本领域的技术人员认识到,似乎有预测能力的许多分析物和参数在实践中不会改进诊断和分析能力。
[0004] 回归方法使用自变量中的趋势以与结果关联。线性方法是基于线性趋势且逻辑回归是基于对数趋势。在生物疾病预测中通常使用逻辑回归。
[0005] 分组聚类方法考察对类似结果分组的变量相关拓扑学。该聚类方法的优点是它可以找到其中趋势不连续但在趋势上具有拓扑局部逆转的相关性。这种方法虽然高度非线性且易受具有小测量误差的局部高度可变结果的影响,但在生物用途中可以更具预测性。此外,这两种方法通常都可以与聚类法组合小规模应用于整体回归方法。
[0006] 然而,逻辑上似乎关联的一些自变量在实践中不显示预测趋势。因此,所需要的是通过利用迄今还没有为疾病状态的诊断贡献出有用信息的患者特异性和群体特异性变量来改进诊断准确性的方法。
[0007] 已经完成了发现生物标记物的大量研究,生物标记物可以单独或组合地预测疾病状态且具有足够的可重复性和供临床使用的预测能力。这项研究具有有限成功或没有成功。高丰度蛋白(HAP)已经被大量研究以发现可以作出这一预测的单一蛋白。已经发现无数实例例,但没有足够低的假阴性平,以便用标记物为患者筛查疾病。结果,这种单一生物标记物只能用于治疗监测,除前列腺癌的PSA之外。该测试要求指示活检是适当的的浓度严重倾斜,以降低导致假阳性水平非常高的假阴性。指示需要活检的多达80%的男性实际上是前列腺癌阴性。
[0008] 也已发现DNA标记在一些情况下对于子类型的癌症非常好,但出于与如上所述HAP的相同原因同样不适合用于筛查。
[0009] 还研究了使用多种蛋白的蛋白质组学方法。该项工作再次集中于HAP或高水平效应蛋白。该项工作由蛋白质测量的多重方法支配,诸如免疫测定、芯片和质谱法。更早的工作在卵巢癌方面已经取得了一些成功。然而,所有这些方法的问题是,所选的许多蛋白与健康至疾病的进展不具有很强的相关性(并且许多与疾病状态不具有已知的生物相关性,例如,如通常是质谱法的情况下)。此外,质谱经受严重过采样问题,这是由于通过分光光度计询问全血清样品的蛋白质水平并因此使相关算法的训练困难的事实所致。在质谱法的情况下,全血清样品可以具有超过200个蛋白和10000个质谱峰。
[0010] 在诊断领域一直需要利用对诊断目的比HAP更有用的低丰度蛋白的技术,以及提供低丰度生物标记物的分析的分析技术。

发明内容

[0011] 形成本专利申请的一部分的权利要求中阐述了本发明和各种实施例。不限于前述内容,在优选的方面,在优选的实施例中,本发明涉及使用多变量(多变量)相关方法改进用于预测疾病状态的方法的预测能力和诊断准确性。这些方法包括蛋白质组学、代谢组学和涉及确定如在体液和组织样品中发现的各种生物标记物的水平的其他技术。
[0012] 发明人预期的和本申请中讨论的各种实施例包括元变量的使用,特别是使用调整所测生物标记物分析物对相关性分数的影响的方法。这种元变量可基于免疫系统应答的专知识和可能的测量误差的知识来识别。这些方法可以应用到训练集模型的构建或诊断中的盲样。
[0013] 在一个实施例中,本发明涉及一种用于诊断疾病的方法,包括以下步骤:a)确定来自受试者的盲样中的至少三种预定分析物的浓度;b)选择与受试者相关的一个或多个元变量,其在与已知有或没有疾病的群体成员的受试者相关的群体中变化;c)将分析物的浓度转换为一个或多个群体分布特征和一个或多个元变量的函数,以计算表示每种分析物的伪浓度;d)将伪浓度与确定用于已知有或没有疾病的群体成员的伪浓度的训练集模型比较;和e)确定比较是否指示该受试者具有疾病。预期确定预定分析物的浓度(或水平)的步骤(a)可以在与该方法的其余步骤的不同的时间和地点进行。类似地,该方法的其他(多个)步骤可以全部或部分在不同的时间和地点实施。因此,本发明人还预期包含更少步骤、特别是只有步骤(b)-(e)的方法作为他们的发明。
[0014] 在本发明的一个方面,上述方法使用至少三种、至少四种、至少五种或至少六种或更多种分析物,它们被测量或确定取自受试者或患者的生物样品中它们的水平。在另一个方面,上述方法涉及给定疾病存在或不存在的评估或预测,这种实体组织癌包括但不限于乳腺癌、前列腺癌和癌。
[0015] 在一些实施例中,元变量是年龄。在某些实施例中,元变量选自由以下组成的组:绝经前、期间和绝经后状态、柔毛、体重、样品源的地理位置、体脂百分比、种族(race)或种族混合(racial mix)或族群(ethnicity)、物种或时间段的时代(或范围)。
[0016] 在另一实施例中,本文所描述的“比较”步骤涉及使用选择技术的的相关方法,包括但不限于:聚类、邻域搜索、回归或小波分析方法。而且,任选地可以包括使用不一致训练集模型。这种不一致训练集模可视情况与本发明的任何方法使用,诸如与转换步骤相关的方法,可用次级训练集模型重复比较和确定,能够识别受试者群体中的非疾病病症,其部分模仿疾病状态中的血清分析物的变化,但不是由与疾病本身的病症或病理学相对的疾病状态引起的。因此,相关的实施例包括次级训练集模型,以及用于三种状态的疾病评价和预测:非疾病,部分模仿疾病状态的非疾病病症以及疾病状态。
[0017] 在本发明的另一个方面,本发明的方法是通过使用微处理器由计算机执行的,且任选地进一步包括以下步骤:以有利于保健实践者的形式输出分数,诸如作出疾病诊断的医生。
[0018] 本发明的某些实施例利用用于标准化的数学方法和浓度的不规则或不连续分布的平滑,其包括使用测量的浓度与对于非疾病和疾病状态的蛋白质的浓度的年龄调整平均值的比值的对数以及非疾病和疾病状态的蛋白质的浓度的比值的对数,单独的样品是预测的,使得在相关中使用的所得的新自变量的分布被压缩以帮助相关计算。
[0019] 在本发明的另一方面,自变量和元变量之间的关系包括与疾病和非疾病状态之间的关系的非线性程度相关的自变量的群体分布特征、一个或多个组(高斯或非高斯)、组平均值(group mean values)、组平均数(group average values)、组中值(group median values)和组动态范围值。
[0020] 本发明的某些实施例包括基于在相关群体中的典型受试者中的疾病进展过程中的单独的生物标记物上调或下调特性(诸如子分组或非线性的程度)的常规(或专门)知识,调整训练集模型以加权单独的生物标记物的影响。
[0021] 某些其他实施例包括基于对双标记平面足够的双标记平面拓扑不稳定性的常规(或专门)知识,调整训练集模型以加权单独的生物标记物的影响,以显著改变险分数或疾病状态预测,其中这些不稳定性是由每个双标记平面的拓扑结构中的陡坡或高峰或深谷引起的。
[0022] 在其他实施例中,基于生物标记物测定的不确定性的常规(或专门)知识,诸如可能发生在测定结果曲线上的非常低或非常高水平处的不确定性,调整训练集模型以加权单独的生物标记物的影响。
[0023] 在本发明的另一个方面,不一致训练集模型被用来调整或校正由于足够的双标记平面上拓扑不稳定性导致的结果预测中显示不稳定性的单独的盲样,以显著改变给定盲样的风险分数,其中不稳定性是由双标记平面的拓扑结构中的陡坡或高峰或深谷引起的。
[0024] 另一实施例涉及诊断和治疗的更个性化用药方法,其中单独的蛋白(或其他分析物,诸如代谢物)浓度的基线值被确定用于受试者一段时间,包括受试者在非疾病状态的一段时间,而不是期望预测疾病的存在或其诊断的疾病的群体值。
[0025] 本发明的另一方面涉及包括信号传导蛋白的低丰度生物标记物的测量,其包括至少三个种类的每个中的至少一种生物标记物,包括:免疫系统炎症标记物、肿瘤抗发生标记物(tumor anti-genesis markers)、血管新生标记物(angiogenesis markers)、细胞凋亡标记物、血管生成蛋白相关标记物(vascularizationproteins associated markers)和组织标记物。在本发明的实施例中,低丰度生物标记物是非常低丰度的蛋白,在取自给定受试者的至少约20%的相关群体的样品中浓度水平低于约1pg/ml。
[0026] 本发明的另一个实施例涉及在选自包括免疫系统炎症标记物、肿瘤抗发生标记物、血管新生标记物、细胞凋亡标记物、血管生成蛋白和组织标记物的种类的至少三种生物标记物的生物样品中的浓度的确定,其中除组织标记物外的至少三种生物标记物的任何一种或多种是低丰度蛋白,对于期望诊断或预测疾病的可能性用于在具有该疾病的亚群中的给定受试者的至少约20%的相关群体,确定浓度低于约1pg/ml。
[0027] 在优选的实施例中,疾病是癌症,更具体地为实体瘤。
[0028] 在其他实施例中,对至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种生物标记物进行评估(或确定其水平)。
[0029] 本发明的另一个方面涉及其中至少一种确定(或测量)的分析物的浓度值低于LOD的评估或分析,其中这种分析物的浓度值由对于分析物的LOD和最低读数之间的直线或其他合适的标准曲线拟合方法确定。优选地,没有分析物被赋予零或负值,并且类似样品中没有分析物被赋予小于约为该分析物的最低接受值的值。
[0030] 在其他实施例中,本发明涉及具有用于检测低于它们的LOD的一种或多种分析物、两种或多种分析物、三种或多种分析物、四种或多种分析物、五种或多种分析物、六种或多种分析物、七种或多种分析物、八种或多种分析物、九种或多种分析物或十种或多种分析物的试剂诊断试剂盒
[0031] 本发明的另一实施例涉及用于完成本文所述的任何方法、诊断预测和分析(包括该说明书中所讨论的任何一个或多个步骤)的计算机系统和微处理器介导的设备和系统。附图说明
[0032] 在下面描述和并入说明书中并构成说明书的一部分的以下附图示出根据本发明的示例性实施例,并且不应被认为限制本发明的范围,因为本发明可允许其他同等有效的实施例。附图不一定按比例绘制,并且出于清楚和简明的目的,某些特征和附图的某些视图可以按比例放大或示意性显示。
[0033] 图1是表示构建训练集模型(或诊断模型)然后产生用于评估具有疾病状态或非疾病状态的盲样的诊断分数的过程的流程图
[0034] 图2表示在为细胞因子白介素6的情况下的典型的群体分布。
[0035] 图3表示显示诊断方法中使用的两种生物标记物的伪浓度的十分之一这种平面的双标记平面。
[0036] 图4示出具有训练集数据点的双标记平面。
[0037] 图5示出没有训练集数据点的双标记平面。
[0038] 图6示出具有其中免疫系统响应的影响被降低的阴影区的双标记面。
[0039] 图7示出具有其中拓扑稳定性问题的影响被降低的阴影区的双标记平面。
[0040] 图8示出具有其中已知的测定测量不确定性的影响被降低的阴影区的双标记平面。
[0041] 图9示出具有拓扑不稳定测试失败并用不一致算法校正的两个样品的盲测的结果。
[0042] 图10示出在使用10个双标记平面显示训练集模型I的训练集癌症分数的情况下乳腺癌的临床研究的结果。
[0043] 图11示出在使用105个双标记平面显示训练集模型II的训练集癌症分数的情况下乳腺癌的临床研究的结果。
[0044] 图12示出具有运行临床研究的盲样的实际诊断的结果。
[0045] 图13示出具有盲样数据点的蛋白质TNFα的校准曲线。
[0046] 图14示出5%癌症分数误差的TNFα蛋白测定误差线。
[0047] 表1示出来自临床研究的算法I的稳定性计算和品质因数。
[0048] 表2示出对868位女性进行乳腺癌的临床前研究的结果。
[0049] 表3示出对868位女性进行乳腺癌研究的各种相关方法的相对预测能力。
[0050] 表4示出对107位女性进行卵巢癌的临床前研究的结果。
[0051] 表5示出对259位男性进行前列腺癌的临床前研究的结果。

具体实施方式

[0052] 以下参见详细的说明性实施例描述本发明。显而易见的是,本发明可以体现为各种形式,一些可能与所公开的实施例有很大不同。因此,以下公开的具体的结构和功能细节仅仅是代表性的,并不限制本发明的范围。
[0053] 在优选的实施例中,本发明涉及一种用于诊断疾病的方法,如在下面更详细描述的。通过介绍接下来的方式,该方法整体利用来自患者的盲样中测得的预定分析物的浓度,期望对患者有无疾病进行预测诊断。根据本发明的方法,基于使用与该患者有关的的至少一个所选的元变量将每种分析物的浓度转换成伪浓度,其中元变量也在与患者有关的选定群体中变化。在选定群体中,测量已知有或没有疾病的群体成员的相同预定分析物的浓度。对于疾病诊断的目的,伪浓度通过以下描述的方法和算法进行处理。将经处理的伪浓度值与对已知有或没有疾病的群体成员确定并类似地处理的伪浓度的诊断模型(或训练集模型)进行比较。最终,就取自患者的样品的评价是否指示患者的状况为具有非疾病或疾病状态的群组作出决定。该决定可以被视为例如由卫生保健提供者使用从计算机化系统输出的结果。
[0054] 处理步骤示出在图1的流程图中。首先完成训练集模型的构建,其最终产品能够产生被称为盲样的未知患者样品的诊断结果,因为正确的诊断在分析这些盲样的时候尚不可知。一般情况下,本发明为卫生保健提供者提供了风险分数,然后他考虑此分数以及其他患者因素作出关于给定疾病状态的存在或不存在的医学判断。
[0055] 定义:
[0056] “分析灵敏度”被定义为零校准以上的三个标准差。低于这个水平的浓度的诊断表现不被认为是准确的。因此低于这个水平的临床相关浓度不被认为是准确的且不用于临床实验室中的诊断目的。
[0057] “双标记”是被标准化和功能上与相对于从非疾病到疾病状态的生物过渡的元变量变化相关的一组两个伪浓度,当以两轴图(或网格)绘制时,例如如图3所示,并且以下称为“双标记平面”。
[0058] “生物样品”是指组织或体液,诸如血液或血浆,取自受试者和由此可以测定诊断性信息分析物(也称为标记物或生物标记物)的浓度或水平。
[0059] “生物标记物”或“标记物”是指受试者的生物样品的生物成分,它通常是在体液中测量的蛋白或代谢组学分析物,诸如血清蛋白。实例包括细胞因子、肿瘤标记物等。
[0060] “盲样”是取自无已知的给定疾病诊断的生物样品,并且期望为他们提供关于疾病的存在或不存在的预测。
[0061] “检测限(LOD)”定义为“零”浓度校准值以上的浓度值2个标准差。通常,零校准以20个或更多个重复运行,以得到测量的标准差的精确表示。低于这个水平的浓度测定被认为是零或者不存在,例如对病毒或细菌的检测。对于本发明的目的来说,样品一式两份运行时可以使用1.5个标准差,虽然优选使用20次重复。需要浓度数的诊断表现并不导致低于这个水平。
[0062] “低丰度蛋白”是在血清中水平非常低的蛋白。该水平的定义没有明确地定义在文献中,但如在本说明书中所使用的,该水平在血清或血浆和获得样品的其他体液中小于约1pg/ml。
[0063] “元变量”是指表示给定受试者特征的信息,除了分析物和生物标记物的浓度或水平外,但其对该受试者而言不必是个性化的或独特的。这样的元变量的实例包括但不限于:受试者的年龄,绝经状态(绝经前、绝经期和绝经后)和其他条件和特点,诸如柔毛、体重、患者居住的地理位置或地区、生物样品的地理来源、体脂百分比、年龄、种族或种族混合或时代。
[0064] “群体分布”是指给定受试者群体的生物样品中的特定分析物的浓度范围。特定“群体”是指,但不限于:选自地理区域、特定种族或特定性别的受试者。并且选择用于本申请中描述的群体分布特征还预期在较大限定群体内使用两个不同的亚群,它们是已诊断为有给定疾病状态(疾病亚群)或没有疾病状态(非疾病亚群)的群体成员。群体可以是其中期望疾病预测的任何组。此外,预期适当的群体包括具有相对于给定疾病的进展的其他阶段已经发展到特定临床阶段的疾病的那些受试者。
[0065] “群体分布特征”可在生物标记物的群体分布内确定,诸如特定分析物的浓度的平均值,或它的中值浓度值,或浓度的动态范围,或群体分布如何落入被识别为不同峰的组,各种生物标记物向上或向下调节的程度和感兴趣的元变量受疾病发作和进展的影响,因为患者经历从非疾病到疾病状态的生物过渡或进展。
[0066] “预测能力”指诊断测定或测试的灵敏度和特异性的平均值。
[0067] “伪浓度”指测量的生物标记物的浓度的替代或替换值,并且实际上是可用于诊断相关性分析的新的自变量。伪浓度涉及测量的生物标记物分析物的浓度并由其计算,其中这样的分析物对于给定的疾病状态具有固有的预测能力。使用元变量调整的感兴趣的群体分布特征计算伪浓度以转换期望诊断的给定患者的预测生物标记物的实际测量浓度。
[0068] “拓扑不稳定”是所有或大多数双标记平面的网格上的区域,其中该区域中所有或大部分点都位于拓扑的陡坡部分。拓扑是考虑所有测量的自变量(即,所确定的生物标记物的浓度)和元变量的多维相关计算的形状。对于元变量的单个值,这种拓扑是五种生物标记物(可以更多)测量的至少五个尺寸。拓扑的形状也随元变量的值的变化而变化。这种多维拓扑结构可使10个双平面薄片逐个经过拓扑而使其通过眼睛可视化。这使得计算的疾病分数处于由于测量噪声导致的错误“风险”。该分数可以通过对疾病和非疾病状态的预测能力的各个双标记曲线加权并通过考虑其他因素诸如拓扑测量不稳定和简单的测量误差而导出。分数范围是任意的,正如本领域技术人员所公知的,并且该值代表处于疾病或非疾病状态下的患者的百分比可能性。
[0069] “训练集”是具有已知的生物标记物浓度、已知的元变量值和已知诊断的一组患者(200或更多,通常达到统计显著性)。训练集被用于确定“双标记”平面的坐标轴值“伪浓度”以及来自将用于对单独的盲样评分的聚类分析的分数网格点。
[0070] “训练集模型”是由允许评价有关受试者(或患者)有疾病或没有疾病的概率的预测结果的盲样的训练集构建的一种算法或一组算法。然后“训练集模型”用于计算盲样品的分数用于临床和诊断的目的。为了这个目的,提供任意范围内的分数,其指示疾病或非疾病的百分比可能性或可由正在开发患者诊断的保健提供者优选的一些其他读数。
[0071] “不一致训练集模型”(或“辅助算法”)是使用不同的现象数据还原方法的辅助训练集模型,使得双标记平面的网格上的单独的点不太可能同时在主相关训练集模型和此辅助算法中不稳定。
[0072] 讨论
[0073] 本发明的包括定义术语的某些方面作为本领域技术人员实施本发明的指导在下文中进行了更详细的讨论。
[0074] 元变量:
[0075] 本发明部分涉及用于使用元变量的相关的诊断测定的改进的诊断方法。当他们在已知有或没有给定疾病的群体成员中表现出“正常”值偏差的显著范围时,此类元变量可能有助于用于诊断目的的预测能力。如本说明书所述,元变量用于将测量的分析物水平转换或转化为“伪浓度”。可以预期可由诊断领域中技术人员已知的技术测量或确定各种分析物的水平或浓度。
[0076] 当元变量具有与反映疾病状态随时间变化发展的受试者的生物状态生理或物理化学连接时,即使该元变量不在预测中,尤其本身不具备预测性时,元变量可能具有相对更多的信息。例如,体重指数(BMI)是可用的元变量,并且体重本身影响心脏疾病中的各种信号传导蛋白水平。在本发明的方法中,当BMI用作元变量而不是另一自变量时,诸如像各种循环血蛋白的测量水平的自变量,BMI可以在预测分析中明显更为有用。本发明部分地基于这样的发现,即与人类受试者相关的整个群体的体重偏差进一步与测量的血清蛋白水平可确定的群体分布模式相关。这些蛋白(或生物标记物)水平是用于诊断目的测量的自变量,因为给定受试者经历了从非疾病到疾病状态的生物过渡(或进展)。
[0077] 类似地,发明人已经显示诊断疾病(例如癌症)中受试者的年龄,当其自身作为自变量与传统相关方法中测量的分析物水平一起使用时没有临床预测性。然而,当年龄用作根据本发明的方法的元变量时,它的使用确实改进了诊断的准确性。
[0078] 通常,当比较非疾病和疾病受试者时,如果测量的分析物的群体分布特征显示显著的功能分离(或方差),则本申请中定义和描述的元变量对于诊断目的将是预测性的。这种功能分离意味着疾病状态和非疾病状态的元变量(年龄)和感兴趣的群体特征(群体平均值)之间的关系显著不同。
[0079] 图2的图示出IL-6的群体分布,特别是包括标记为I至IV的四个不同的群体亚组,这反映了对癌症进展的免疫应答。较高浓度组被认为是对免疫刺激(诸如感染、伤口、过敏以及当然癌症更强的免疫应答的结果,且最高组(IV)示出对IL 6这些刺激的决定性非线性反应。这些群体分布特征和测量分析物的这种分组可用来改进训练集诊断模型的预测能力。
[0080] 本发明的元变量诊断方法基于包括约868位患者样品的评价的研究。在那些样品中,在临床诊断为有或没有乳腺癌的受试者中测量五种已证明的低水平信号传导蛋白(PSA、IL-6、IL-8TNFα和VEGF)的浓度。蛋白(或分析物)水平是用于疾病诊断测试的传统自变量。
[0081] 本发明还获得了这些受试者中的每个的年龄信息。五种生物标记物的传统逻辑回归分析实现了约82%的预测能力,并且发现在该分析方法中使用年龄作为第六个自变量产生了在预测能力方面可忽略不计的改进。仅使用确定的生物标记物的数据聚类方法也实现了约88%的略高的预测能力。同样,使用年龄作为自变量基本上没有更高的预测性。
[0082] 类似地,使用传统聚类分析,将浓度值转换为对数,实现了约92%的预测能力,但使用年龄作为自变量增加了不超过0.5%的预测能力。在这种分析中,如已知的,使用样品浓度的对数,因为这些分析物浓度可散布在四或更多对数的动态范围。还已知癌症患者中五种分析物的血液水平趋向于发展成高度升高的浓度,但并非总是如此。因此,这种方法使多维聚类图上的训练集模型中的点紧密靠近,避免低浓度时超采样聚类点的趋势。此压缩的对数方法是常用的,因为它减少间距的偏差。
[0083] 发明人确定了个体受试者的年龄例如可用于创建在说明书中被称为的元变量。元变量反过来用于创建新的自变量,在说明书中称为伪浓度,其由测量的自变量(在此情况下,蛋白质浓度)的群体分布特征来计算。这样做,如在说明书中更详细地讨论的,在两个分析模型中产生了约97%至超过100%的预测能力。对于本申请的目的,超过100%的预测能力意味着“疾病”和“非疾病”状态是由相关分数中的显著间隙分隔开的。
[0084] 群体分布特征:
[0085] 当年龄被选择为元变量时,发明人已发现要证明的群体分布特征的实例是有或没有该疾病的患者的每个测量的分析物的平均浓度值;以及如图2所示的对于疾病和非疾病患者组,用于分离的年龄组(或对于整个群体)的浓度值的子组的中值浓度值。在群体分布图所示的子组在数学上调整方式不同,即,5pg/ml以上的组中高水平上调浓度被高度压缩。这些关系产生了新的基于年龄的自变量,然后其直接用于聚类分析,而不是测量生物标记物分析物的实际浓度水平。
[0086] 确定诊断为非疾病和疾病状态的患者相对于年龄的浓度平均值。这被称为每个状态的年龄调整平均值。使用等式1(描述于涉及伪浓度的小节)由患者的这些平均值和实际浓度计算伪浓度值。
[0087] 正如常见的多自变量相关分析,多个自变量在多维绘图中配对用于传统聚类邻近分析的基础。而且,常常压缩这些变量,以便容纳测量的变量的相对较大的动态范围散布(即,分析物)。在这种情况下,基于年龄或其他元变量和实际浓度,我们在这里描述了其中自变量是“伪浓度”值的方法。可以预期本领域技术人员能够容易地识别和选择改进预测能力的群体分布特征。
[0088] 伪浓度:
[0089] 为提取患者年龄的预测能力,其本身在其他诊断方法中也可以视为自变量,发明人使用年龄作为元变量来计算随后被用作确定的分析物的实际测量浓度的替代的“伪浓度”。重要的是,在给定的感兴趣的群体中,该元变量在非疾病状态和疾病状态之间必须有分隔,以提取对于所有元变量值的预测能力,例如,在乳腺癌情况下的年龄。“分隔”是指在非疾病和疾病亚群中受试者的群体特征之间观察到的关系对于特定元变量不同。这可通过测量和计算凭经验来确定。并且通过期望的预测结果组的性质确定感兴趣的群体,它可以是,但不限于:地理区域,诸如例如美国大陆;特定的种族或民族群体;或特定的性别,诸如例如女性。
[0090] 在实施用于预测乳腺癌疾病的根据本发明的方法中,五或六种非常低水平的信号传导蛋白的浓度优选是用于诊断相关的自变量。测量五种生物标记物的每一种,并且确定测试群体中的年龄变化,该群体为35岁至80岁的女性,其中一半是健康的,另一半被诊断患有乳腺癌。群体内的受试者通常被认为是有疾病或没有疾病,确定的单个受试者的生物标记物水平随受试者的疾病进展而变化,并不是所有的受试者在其发病前和疾病发展经过其各个阶段的过程中具有相同的生物标记物水平。因此,群体分布特征反映了生物标记物在非疾病状态的亚群中的正常变化以及生物标记物在疾病状态的亚群中的正常变化。
[0091] 这种情况下的群体分布特征为:1)非疾病状态和疾病状态(此情况下,癌症)相对于年龄的平均值;和2)从非疾病到疾病的生物标记物上调的程度和非线性。例如,白介素6的上调示出在图2中,因为这种细胞因子的水平反映了受试者对由癌症引起的免疫挑战的反应。IL-6是已知的促炎性应答子,其作为对免疫系统的信号上调以调高其一般应答。四个单独的分组表现出不同的上调水平。当计算伪浓度时考虑这些水平。例如,从实际压缩到伪浓度的数据压缩程度通过分组位置而不同,并且对于上组4非常严重。
[0092] 为了实现前述内容,必须测量具有非疾病和疾病状态的相等数量的受试者的群体。该训练集的大小任选地由所用的生物标记物的数量来确定。优选大小是其中训练集模型的预测能力对于类似或更大的盲群组在约95%的准确度内。然后可以确定这两种状态的年龄调整平均值,并可以看到该疾病对生物标记物的上调或下调程度的影响。
[0093] 图2示出生物标记物IL-6的群体分布特征,当免疫系统受到癌症或其他促炎性病症的存在的挑战时,免疫系统上调该蛋白。从测量浓度到伪浓度的转换涉及再次将非疾病和疾病的群体的浓度标准化为年龄调整平均值,并压缩测量的浓度值的动态范围。高度压缩例如高于5pg/ml延伸到高达100pg/ml的组中的高度分散的外围浓度。这改进了预测能力。结果是新的自变量,在说明书中被称为伪浓度,其无单位并被标准化,在一个优选的实施例中,其反映了生物标记物的群体分布的年龄变化。
[0094] 使用包括非疾病和疾病的年龄调整平均值以及以下形式的实际患者样品浓度的关系:等式1:伪浓度=α×自然对数((Ci/C(c或h))-(Ch/Cc))2,其中:
[0095] α为比例常数;
[0096] Ci=实际患者的分析物的测量浓度;
[0097] C(c或h)=该患者分析物的患者年龄调整浓度;调整该值,无论患者是非疾病或疾病状态;
[0098] Ch=非疾病患者的分析物的患者年龄调整平均浓度;
[0099] Cc=疾病患者的分析物的患者年龄调整平均浓度。
[0100] 等式1被设计为根据上调分组(见例如图2中的峰)来调整压缩和膨胀。上述伪浓度的公式实现了这一要求;然而,可以实施对于本领域技术人员显而易见的该等式的许多其他形式。例如,Ci、Ch和Cc可以是直接来自如上讨论的子组中值或动态范围边缘的平均值、中值或距离的浓度或浓度距离。
[0101] 伪浓度(无单位,并且因此不是浓度或水平)然后用于相关聚类多维绘图中用于分析。而且所有的绘图被标准化为群体分布的共同特征;非疾病和疾病(年龄调整与否)的年龄平均值,中值或子分组的动态范围。这些方法可以改进5个或更多个百分点的预测能力。
[0102] 个体化用药的情况日益普及并且有效。还预期,上述疾病预测方法可以通过用个体的非疾病基线测量替换这些专利中开发和描述的针对非疾病病症的群体分布特征来个性化。换句话说,以上等式中的Ch值将是个体患者的实际基线值,而不是非疾病状态的群体平均值。然后该疾病评估相应地基于个人的从这些测量的非疾病特征到指示一般群体的疾病特征的过渡。
[0103] 双标记平面:
[0104] 对于使用五种生物标记物(和一个元变量)的分析,将有十个这样的双标记平面。图3中的图示出红色疾病和黄色非疾病网格点。训练集样品使用独立测量的变量(浓度)和元变量(年龄)确定年龄群体特征,计算轴上的伪浓度距离,并将这些伪浓度应用到10个双标记平面的每个。将该图分为每个轴2000个网格,共40000个网格点。
[0105] 网格点是疾病或非疾病的确定是通过确定用于训练集样品的每个单独的网格点至最近的测量数据点的距离而计算出的。图3提供了实例,在这种情况下,两种生物标记物是IL-6和VEGF,并且使用的元变量是年龄。纵坐标和横坐标都是如上所述确定的伪浓度。因此元变量和测量的自变量嵌入这些图上的伪浓度中。网格点各自作为非疾病和疾病,并给予相应的数字分数(例如,+1和-1,虽然实际数字是任意的)。这个分数是通过计算到两个训练集数据点(非疾病或疾病)的距离来确定的。最短距离确定此分数。训练集样品的数量可以变化以确定这个距离(例如,约4至6),见图3。相对较少数量的对比样品可能致使相对降低的预测能力。同样,增加数量的对比样品可以降低预测能力,因为网格点的“到达”延伸到远到拓扑上的非局部区域。最佳数量通过实验计算确定。
[0106] 对比样品点的优选数量是其中训练集模型与实际诊断最一致。图3示出两种生物标记物IL-6和VEFG的这个计算过程。通过确定这种情况下与每个非疾病或疾病下三个最接近训练集数据点的距离来分配非疾病和疾病状态的未知网格点(在平面上的y轴上约12.00且在x轴上约4.00的小方框)。这些距离相加,然后网格点被分配适当的非疾病或疾病状态(计算分数分别为+1或-1)。在未来的某个点诊断的任何盲样基于它落在该网格的位置将被分配状态分数。也将对所有双标记平面的每个盲样进行评分。训练集样品的总数可以为至少200和更多。
[0107] 对盲样的总癌症分数的确定是通过使用单独的样品的单独的网格点确定乘以单独的双标记平面的总预测能力由所有双标记平面来确定的。使单独的盲样网格点值(例如+1或-1)乘以单独的双标记平面的预测能力(或灵敏度)。然后将所有十个平面相加。典型的线性和/或二乘法的总和的平方根用于产生所有双标记平面的最终总分数。对分数进行标准化并偏移以产生从0到200的分数,它是由卫生保健提供者使用的输出。这个范围是任意的。
[0108] 可以由相同组的生物标记物通过数学操作它们来构建较大集的双标记平面。这些较大的双标记集可能有更大的预测能力,或者它们可能构成不一致的训练集模型(或二次算法)用于进一步改进预测能力。例如使用5种生物标记物的浓度比而不是浓度本身用于每个伪浓度的构建,这将创建10个伪浓度值和45个双标记平面。伪浓度和双标记平面的构建很可能更具预测性,但可能需要更大的训练集,以与一般群体准确地关联。人们也可以使用例如各浓度除以1减去另一个浓度值的比值。本领域技术人员通过用盲样集测试预测能力的方法可以容易地确定用于调节多维聚类分析的数据的这些可选方法是否具有更好的预测能力。
[0109] 为了进一步改进预测能力,这些年龄或分组调整浓度被调节为标准化它们并减少或消除用于聚类邻近分析的整个多维分组标记图的聚类中的间距偏差。见图3,呈现了IL-6和VEGF的双标记平面。有五种生物标记物乳腺癌测试板的十种这些平面。在这种情况下,对计算的伪浓度值标准化并偏移以产生0和20之间的任意值,高度压缩异常高度上调的浓度。
[0110] 将来自年龄/分组分析的同一标准化间距相对于浓度上的多维标记平面的双标记投影的每一个进行压缩并针对年龄调整平均值以及年龄(或整个群体)调整子分组标准化。
[0111] 训练集的预测能力的改进
[0112] 使用可调双标记平面影响水平的模型:
[0113] 通常用二进制数对非疾病和疾病的双标记平面评分(例如,+1和-1)。本文描述的伪浓度方法适合通过选择性调整这两个二进制数的影响水平来进一步改进预测能力。在训练集模型中开发下述方法并且一旦设置即固定在模型中。
[0114] 下面的图4和图5示出了五种生物标记物用于预测疾病状态的存在的情况下的一个双向标记物平面的投影,在这种情况下乳腺癌使用了五种标记物:IL-6、IL-8、TNFα、VEGF和PSA。图4示出了具有用于通过聚类搜索分析对图上的网格点评分的数据的训练集模型。图5示出了没有数据的训练集模型。这构成了训练集模型。当对40000个网格点的每个评分并通过盲样落入网格的位置对盲样评分时,不需要用于创建模型的训练集数据。拓扑示出红色为癌症阳性且蓝色为癌症阴性。在这种情况下计算总分数时,非疾病网格点被设定为+
1且疾病(癌症)网格点被设定为-1。在五个正交空间中分析这5种生物标记物实例中的每个双标记,其中图5是二维的一个投影。该图示出了免疫系统应答的各种子分组的拓扑。在这种情况下,以常见方法对所有网格点(在此情况下,2000×2000或40000)评分,疾病状态阳性分配的值是-1(乳腺癌)且非疾病是+1。通过伪浓度间距和如上所述的元变量年龄来标准化该双标记平面。
[0115] 图6示出相同的双标记模型和灰色区域内的另外的免疫应答分组(见图2)。调整灰色区域的影响以反映这样的事实,即每个灰度遮挡区域对该患者是非疾病或疾病的概率具有稍微不同的影响。这种调整可以通过用训练集验证(该调整产生校正的训练集结果)进行人工估计或者通过严格的计算机多变量增量分析作出。创建用于两个结果即疾病和非疾病状态的两个单独的双标记平面。在这种情况下,免疫应答组IV的盲数据点更可能是疾病,且该影响将略微(例如,通过改变分数从-1至-1.1)增加(绝对值)。增量的实际量优选将通过计算机分析或可能通过严格的人工方法来确定。这种方法对于相关分析的聚类搜索方法是可行的,但其他方法可用于同样的效果。加权相对于疾病关联的影响的这些方法可产生约1%的预测能力的改进。在95%以上的预测能力处,这是非常显著的。
[0116] 图7再次示出具有灰色区的相同双标记平面,该灰色区在非线性快速变化的疾病与非疾病拓扑的复杂区域中呈圆形。这些区域可以通过将有注入噪声(例如+/-10%)的测试盲样值插入到模型中,然后注入测量的噪声量来识别。大多数这些盲点在疾病(此处,癌症)分数中不会大幅变化。然而,可以发现一些网格点在这种噪声调整后从非病病急剧跳跃到疾病分数。这些是其中大部分或所有双标记平面具有与多维整体双标记平面重叠的迅速变化的拓扑的区域。通过小心地降低这些区域中的影响,加权可以在一些相关的双标记平面中增加,嘈杂数据位于宽广的平面而不被邻近改变结果边界。这种方法已被示出为校正错误的预测。在以上的情况下,红色癌症区域的影响将例如从-1.0下移(绝对值)至-0.9。或者,蓝色非疾病区域将从+1.0下移至-0.9。最佳偏移水平可以通过严格的计算机分析来确定。
[0117] 测定噪声会影响相关分析的准确度。该噪声可能在处于或低于检测的测定极限水平处特别成问题。该噪声还可以通过降低这些不稳定区域中的单独的生物标记物的测量点的影响来减轻。图8再次示出乳腺癌板的PSA和IL-6的双标记平面。该图的底部左侧的灰色矩形区域内的区域都低于测定的常规检测限(LOD)。传统地,LOD被定义为20个零校准的两个标准差加上20个零校准的平均值。该水平的值的统计确定性是95%位于两个标准差的范围内,并且当然当测量样品低于LOD时,测量确定性下降。该数据仍然可能具有有用的信息,但应当适用于影响较小的分析。在这种情况下,对灰色区域内的盲样数据点的影响会降低,例如,对于灰色区域内的训练集模型的网格点从+1.0到-0.9。这增加了对位于它们的其他双标记平面上的高于检测限的该测试样品中的数据点的影响。
[0118] 前述方法是互补的,并且可以通过组合影响的变化一起执行。
[0119] 改进预测能力的方法
[0120] 通过测试盲样的不稳定性:
[0121] 一旦训练集模型完成并固定,其即被用于计算盲患者样品的癌症分数。发明人使用用于产生癌症分数的两种优选方法。第一种方法被称为线性方法(CSI),第一种方法使拓扑位置分数(+1或-1)乘以双标记平面的预测能力。然后将这些相加并缩放和偏移以产生从0至200的分数。第二种分数被称为q分数(CSq),其是通过使用这些相同值的平方和的平方根来计算。第二种方法突出单独的双标记分数的差别并用于医生整体的最终诊断。
[0122] 拓扑不稳定性由于相关性的聚类方法的高度非线性性质仍留在该双标记平面并且无法完全消除。这些不稳定性的位置可以通过对在每个双标记平面逐步递增伪浓度值的每个网格点的计算的癌症分数大量而严格的评估找到。这将涉及大量的电脑计算,即40000网格点乘以10个双标记平面乘以生物标记物的数量(对于5个生物标记物,200万次计算)。不稳定区域将通过相邻网格点处的癌症分数的大幅波动而揭示。这也可以较少严格地通过对所有10个双标记平面寻找从健康到疾病(例如,癌症大约5个或更多平面)紧密过渡的区域的视觉叠加来完成。然后,这些视觉上发现的区域可以通过更少数量的计算机验证计算来验证。
[0123] 根据本发明的另一个方面,涉及注入噪声的稳定性测试和技术可以应用到盲数据集。而不一致的训练集模型可以用来裁断或校正癌症分数。对于本发明的这一方面,为每个盲患者数据集(例如,加或减10%)注入固定水平的噪声。如果盲样品集是大约100名患者,则实际训练集模型计算机运行将是300个样品集,每个一式三份(原始数据加上噪声和减去噪声)。然后测试所得三份的数据集的稳定性(a为-10%,b为+10%和c点是原始数据)。表1示出了对临床研究数据的稳定性测试的结果。请注意,三个样品在癌症分数中示出非常高的不稳定性。样品138、207、34和29都示出非常高的品质因数。品质因数(越低越好)应包括分数变化的程度和特别是是否为预测从健康到癌症的分数变化,反之亦然。来自盲样的这些数据集处于不正确的预测诊断的高风险。
[0124] 不一致的训练集模型可以用来裁断优质噪声测试失败的“风险”患者样品数据集。这些点由于不可避免的测量噪声而处于危险中,测量噪声是随机或系统的并伴有由以下事实引起的极端拓扑不稳定性,即盲样品数据点位于如果不是所有的双标记平面则为大多数双标记平面上的非常陡的斜坡上,从而小的扰动会引起分数的大幅摆动。表1示出了有噪声注入的样品。每个样品有三个值,1)加噪声,2)减噪声和3)无噪声的原始数据。这些样品示出从疾病跳到非疾病并返回的癌症分数,噪声注入+-10%。这种情况下的这些样品数据被判断为不稳定的。没有准确定义不稳定的水平并且可对噪声注入的各种水平作出调整。在这种情况下,这些用+-10%的噪声和大于200的稳定性分数进行校正(注意,稳定性分数和癌症分数是有不同含义的两个明显不同的数字)。
[0125] 测量噪声可以用该不一致的第二种算法进行裁断。用于裁断的不一致算法可以用于校正这些“风险”患者样品集,即使其比主要算法有稍微较小的预测能力,因为它会提高该点是正确的几率。在这种情况下,两个被校正(见图9);样品138的非疾病分数为85,并已用不一致算法校正为195(用算法I该点是稳定的),样品34的分数为102(线性方法),并用算法II再次校正为198。样品29和207未被不一致算法改变。
[0126] 不一致训练集模型(算法II)使用105个双标记平面并且其与初级训练集模型(算法I)不一致,这些相同的样品在算法II稳定性测试中显示是稳定的。不一致训练集模型以与初级训练集模型完全相同的方式完成测试。注意,逻辑回归法也可用于计算这些样品分数。算法II具有较高的预测能力,因此被使用。裁断训练集模型可被使用,即使其预测能力(优选,不小于50%的预测能力)比主要算法小,但只要其有可能正确的结果而没有不稳定。注意,校正对于所讨论的噪声测试失败的盲样品是引人注目的。这些样品实际上都是高分数的癌症。这些样品中十分之八的双标记平面位于具有很高不稳定网格点的拓扑结构上。
因此,分数处于风险中并且确实是不正确的(一个是不正确的,并且一个是不确定的,分数为100/120)。在这种情况下,校正一个样品以将预测能力从97%提高至98%,非常显著地减小了误差(50%)。一个样品虽然不确定会变为癌症,但也对其校正。
[0127] 改进疾病状态相关二元结果的方法
[0128] 通过部分排除独立状态的预测能力
[0129] 模仿原发疾病分析的结果状态之一:
[0130] 聚类分析通常使用三个或多个自变量,通常是患者的血清蛋白浓度。相关算法可以仅作用于非疾病或疾病的二元结果,但它产生连续的评分,其与两个二进制条件的实际结果的概率更密切相关。在一些情况下,存在其他条件,名义上归类为非疾病,其部分地模仿所用的生物标记物的群体分布内的疾病状态。在这些的一些情况下,这种非疾病“MIMIC”状态可能导致相关分析的假阳性结果。解决这种假阳性结果的方案是创建与非疾病或疾病分析完全分开的额外的新的相关分析。这个新的相关分析优选使用对于非疾病或疾病相关的完全相同的生物标记物测量数据,或者它可以使用一些或所有不同的生物标记物。这个新的相关分析提供了“非疾病MIMIC”或“疾病”的结果,或者至少产生了允许对患者的实际状态作出判断的分数。非疾病或疾病分析的不确定的或接近的过渡分数与非疾病MIMIC或疾病相关的非常低或高的分数一起可以帮助医师执业者改善疾病状态的判断并且减少假阳性分数。
[0131] 其中非疾病病症模仿疾病状态的这种情况的一个实例是非恶性病症良性前列腺增生(BPH)。此病症通常会显示出用于诊断前列腺癌的至少一种生物标记物的高水平。例如,生物标记物前列腺特异性抗原将在有BHP以及还有前列腺癌的男性中升高。表5示出,这种附加的相关分析方法可以区分有BHP和前列腺癌的男性,同样使用相同的生物标记物但是不同的训练集模型,可以区分被推定处于非疾病状态的男性和被证实处于前列腺癌疾病状态的那些。在一小部分男性中,非疾病与癌症训练集模型会导致假阳性,但是这将通过BHP与癌症训练集模型来区分。在这些情况下,两个分数,一个用于推定的非疾病和癌症且一个用于BHP和癌症,会帮助医生或其他卫生保健医生决定下一诊断步骤。例如,对于两个模型从0到200的总分数(对于CS1或CSq),非前列腺癌或前列腺癌的分数为110,这表示癌症阳性的弱分数,但也考虑为BPH或癌症的第二分数30,这对于医师执业者指示BPH的高可能性而不是癌症。医生执业者将使用该附加信息以及其他医疗信息和病史来决定诊断的下一步骤。
[0132] 本说明书中已描述了用于改进诊断疾病的传统蛋白质组学相关方法的预测能力的几种方法。这些包括:1)使用相关的元变量和伪浓度值,和2)使用拓扑稳定性的专业知识和测定测量特性来调整训练集模型中的双标记平面的影响。此外,描述了使用不一致训练集模型发现和校正对于特定训练集模型独有的盲样稳定性问题的方法。此外,描述了发现和校正部分模仿给定疾病状态的训练集模型的非疾病病症的方法。所有这些方法是互补的并且可以一齐使用。例如,调整不稳定的高可能性的区域的训练集模型不能完全消除来自盲样预测计算的问题,因而这两种方法可以用于改进预测能力。发明人已发现,将这些方法组合可以产生95%以上的预测能力,并且实例1中讨论的乳腺癌研究产生超过98%的预测能力(100%灵敏度,97.5%特异性)。
[0133] 实例1:临床研究-乳腺癌血液测试的评估
[0134] 在实验中评价OTraces BC Sera Dx测试试剂盒和OTraces CDx免疫化学仪器系统(www.otraces.com)的性能,以评估乳腺癌的存在的风险。该测试试剂盒测量五种非常低水平的细胞因子和组织标记物的浓度,并使用如上所述开发的训练集模型来计算分数CS1和CSq,用于评估乳腺癌的风险。测量的蛋白是IL-6、IL-8、VEGF、TNFα和PSA。包括测量约300例患者样品的实验分为:约50%为通过活检诊断的乳腺癌病例,和50%的患者推定为非疾病(或在这种情况下,没有乳腺癌)。在这一组中,200个样品的活检结果被精确地分为50%非疾病和50%有乳腺癌疾病,并且每个组又细分为特定的年龄组。
[0135] 样品分析结果被用来开发预测疾病状态的训练集模型。然后通过训练集模型将剩余的样品(约110)作为盲样处理以获得所得癌症的风险数值分数,并且将这些分数披露给主机临床中心。这些盲样分数随后由临床中心进行分析,以评估结果的临床准确性。
[0136] 开发两个诊断模型用于这个实验,在说明书中被称为算法I(或训练集模型I)和算法II(或训练集模型II),如上所讨论。分析的相邻聚类方法用于这两种算法。受试者的年龄不用作自变量,而是作为元变量来将测量的浓度转换成新的自变量,在本说明书中称为伪浓度,其直接用于相关分析中。算法I和算法II之间的不同是相关中使用的新自变量的数目。算法I在十维聚类空间中使用五个伪浓度变量。该空间可通过投影或切割该多维空间而被人眼观察到,从而看到二维双标记平面。算法I中有十个这样的平面。
[0137] 算法II使用10倍多创建的自变量,从而有大约100个双标记平面。预计200个样品足够用于训练集模型,使得它合理地紧密模拟一般群体。从相同的200个样品训练数据集开发二级或不一致训练集模型。训练集模型是用于描述说明书中结果的主要评分方法。不一致训练集模型用于裁断被认为不稳定的初级训练集模型计算的癌症分数;即,落在拓扑不稳定区域上的分数。虽然不一致训练集模型对盲样不那么准确,但它仍然可以裁断初级训练集模型并由此改进预测能力。
[0138] 分析的前述聚类方法相对于逻辑回归具有显著的优点,能够容纳用于创建计算结果的自变量中的高度非线性趋势。结果是疾病或非疾病(在这种情况下,是癌症或非癌症),并且它是基于对训练集模型计算的伪浓度。这种方法的缺点是高度非线性区域可以与非常陡的拓扑斜坡相关联。因此,未知(或盲)样品可以落在陡峰或深谷中,该放大具有放大计算的伪浓度中的小误差的作用。我们用专有稳定性测试评估计算的分数的稳定性,然后用算法II裁断算法I,如果算法II用于示出稳定性的样品。
[0139] 图10、11和12示出算法I训练集结果。模型本身由40000个拓扑点的10个双标记平面组成,通过聚类方法对非疾病和疾病(此处,乳腺癌)的每个点进行评分。该模型分离非癌症和癌症的两组的能力示于这些图中。模型必须从非常靠近或优选刚好50%和50%或非常接近两个结果状态来构建。另外,该方法使用年龄作为转化元变量。训练集样品具有分布在所有感兴趣的年龄组的样品。算法I的模型(图10)由100名健康女性和98名乳腺癌女性构建。
[0140] 图10的汇总表示出了数值结果,其中N=198是样品的数目。CI是正确称谓的样品,且F1是错误称谓的样品,并且4个样品被认为是不确定的。
[0141] 次级训练集模型的开发是为了区分由于使用初级训练集模型而导致的这四个不确定的样品。这种模型是不一致训练集模型。该次级模型使用与初级训练集模型相同的训练集数据。
[0142] 图11示出了不一致训练集模型计算的结果。算法II示出用超过60个分离点的100%分离。
[0143] 乳腺癌研究中测试盲样的结果:
[0144] 图12示出临床研究中评估的盲样的结果。结果示出100%的灵敏度和97.5%的特异性。临床研究中心的肿瘤学家设定诊断过渡值,使得乳腺癌阳性样品均被正确识别。因此,两个非疾病样品被称为癌症阳性。这是医学上的声音,判断为阳性的样品都将获得下一个诊断步骤,成像乳房X光检查。很多女性没有获得成像乳房X光检查,因为他们没有居住至足够接近医疗设备设施的地方。然而,可从临床实验室远程抽取他们的血液并在上运送到大城市的实验室。
[0145] 实例2:使用元变量“年龄”改进诊断准确性。
[0146] 表2示出了为868名乳腺癌受试者样品临床研究的统计结果。表3示出用于相关计算的各种方法的比较。标准方法即逻辑回归仅示出82%的预测能力。标准邻近聚类分析改进了这一点,产生约88%的预测能力。说明书中描述的的方法产生大于97%的预测能力,其使用元变量和加权方法、拓扑稳定性调节、免疫系统应答分组和用于测定性能的加权调节,结合盲样的不稳定性测试和不一致算法校正。
[0147] 实例3:使用元变量“年龄”改进卵巢癌研究中的诊断准确性。
[0148] 表4示出使用本文所述的元变量方法对107位卵巢癌或没有卵巢癌的女性研究的结果。这项研究并没有使用本说明书中描述的所有的预测能力的改进,但仍然实现了约95%的相对优越的预测能力。
[0149] 实例4:使用元变量“年龄”改进前列腺癌中的诊断准确性。
[0150] 表5示出使用本说明书中描述的元变量方法对259位患有前列腺癌或良性前列腺增生(BPH)的男性研究的结果。这项研究也没有使用本文描述的所有的预测能力的改进,但仍然实现了约94%的相对优越的预测能力。注意,BPH是迄今为止最常见的病症,其导致在当前的前列腺癌的PSA测试的假阳性结果。在常规前列腺癌诊断中约五分之四的BPH男性是阳性,导致大部分前列腺癌活检是阴性的。如上所述,元变量方法能够校正这些不正确的诊断。
[0151] 实例3和4中的上述结果(分别对于卵巢癌和前列腺癌)没有使用元变量或影响调整方法(LOD,亚群分组和不稳定性),也没有使用盲样稳定性方法,因为测量该数据时发明人并没有发现这些。
[0152] II.使用优选的分析物种类的诊断方法
[0153] 并且测量的分析物低于常规检测限。
[0154] 本发明还基于一个发现,即某些免疫系统蛋白允许在基本上低于目前用于商业诊断测试的那些的测量浓度处诊断给定疾病的风险。这些包括:细胞因子,其功能性(主要但不能完全作为信号传导蛋白)在某些组内;免疫系统炎症标记物;肿瘤抗发生(tumor anti-genesis)、血管新生(angiogenesis);细胞凋亡和肿瘤血管生成标记物(tumor vascularization markers);以及已知的肿瘤组织标记物。
[0155] 发明人已经示出,选择一些非常低丰度蛋白LAP和使用相关分析和用于由免疫测定分析方法确定浓度的非传统方法极大地改进了预测能力。称为信号传导蛋白的这些低水平蛋白(即,服务于信号传导网络中的若干类型的功能的一种或多种的蛋白)对肿瘤的存在直接作出免疫系统应答作用或是由引导生物体的肿瘤作用以提供肿瘤需要进展的所需的生理响应。此外,选择一些LAP(优选约6或更低)解决了采样和训练集大小的棘手问题。这些蛋白处于或低于传统定义的检测限的事实此前一直阻碍对其效用的研究。
[0156] 本发明还基于一个令人惊讶的发现:低于检测水平的浓度值,如常规确定的,提供了疾病的相关风险评估中有意义的信息。由于它们的不准确性,这些信息在传统上不用于临床诊断。然而,发明人已发现测试运行中提供从LOD校准点到最低信号值的直线曲线拟合并利用那些值是有效的。这样做提供了用于群体分布分析的平滑的高斯分布,而且还令人惊讶的是,提供了准确的癌症分数预测。在该诊断方法中,不应报告低于LOD的读数,这低于该标记物的大规模群体评估中通常见到的。例如,如果信号水平(或测量浓度)低于LOD,使用本文所述的技术适当降低到正常血清中发现的最低水平。因此,当IL-6的LOD为约250fg/ml,但血清中发现的报告值低至10fg/ml时,该水平应是根据本发明的测定中所用的最低水平。此外,没有值可以是零或负的。这种方法适用于各种常规标准曲线创建策略。
[0157] 发明人已经意外地发现,使用免疫系统蛋白,细胞因子,其功能在某些组内;免疫系统炎症;肿瘤抗发生;细胞凋亡和肿瘤血管生成标记物;以及已知的肿瘤组织标记物,可以实现这样的预测能力,使得相关模型的假阴性表现优于95%且假阳性表现也优于95%。这些蛋白质需要在一些标记物远低于1pg/ml的水平提取有用的浓度信息的方法。对于乳腺癌的特定蛋白质组测试板,例如使用PSA用于组织标记物,IL-6用于炎症应答,IL-8用于炎症和血管生成,VEGF用于血管生成,TNFα用于抗肿瘤发生,已经产生98%以上的预测能力。
这些中的几个标记物具有低于1pg/ml(下降到小于50fg/ml)的显著群体分布。这使研究人员探索利用这些蛋白质用于临床诊断方法感到气馁。
[0158] 预期本发明包括诊断测试,其中例如使用免疫系统炎症(IL-6、IL-8)、血管生成(IL-8、VEGF)、抗肿瘤发生(TNFα)蛋白与组织标记物(PSA)预测乳腺癌。可以使用落入这些种类内的其他标记物,诸如CA19.9对于PSA,组织标记物;或添加IL-1或用其取代IL-6。对于前列腺癌,预期可以利用预测分析,其包括免疫系统炎症标记物(IL-6、IL-18)、血管生成标记物(IL-8、VEGF),抗肿瘤发生(TNFα)蛋白和组织标记物(PSA)。也可以使用落入这些种类内的其他标记物(例如,添加IL-1或用其取代IL-6)。预期使用免疫系统炎症标记物(IL-6、IL-18)、血管生成(IL-8、VEGF)、抗肿瘤发生(IL-12)蛋白与组织标记物(CA-125)进行卵巢癌状态的预测。可以使用落入这些种类内的其他标记物(例如,TNFα对于IL-12)。
[0159] 而且,发明人发现,相关分析要求100%的群体具有可行地准确测量,否则预测能力受到损害。可行地准确并不意味着这些测量的准确性必须相当于今天临床实验室中所用的临床诊断的测量预期。在临床实验室中,当需要诊断的浓度数目时,测定校准曲线上的点必须在分析灵敏度以上,这意味着结果的99.7%的确定性在实际值的3个标准差内。
[0160] 对标记物具有不确定值或0值的任何样品未锚定相关计算,致使这个样品完全不正确。一些LAP信号传导蛋白和非常低水平浓度测量提取法的组合使得结果得到显著改善。在低于可接受的常规测定检测限的非常低水平处,通过简单地使用从LOD到最低信号样品的直线和使用血清中发现的最低生理水平获得准确性,因为测试中该点的浓度运行许多样品。在此直线上估计LOD和最低读数之间的样品点。也可使用其他标准曲线拟合方法。这些改进足够显著使得测量板可用于筛查癌症(产生98%或更高的预测能力)。
[0161] 本发明人已经发现,使用免疫系统蛋白,细胞因子,其功能在某些组内;免疫系统炎症;肿瘤抗发生;细胞凋亡和肿瘤血管生成标记物;以及已知的肿瘤组织标记物,可以实现这样的预测能力,使得相关模型的假阴性表现优于95%,且假阳性表现也优于95%。这些蛋白质需要在一些标记物远低于1pg/ml的水平提取有用的浓度信息的方法。
[0162] 对于乳腺癌的特定蛋白质组测试板,例如使用PSA用于组织标记物,IL-6用于炎症应答,IL-8用于炎症和血管生成,VEGF用于血管生成,TNFα用于抗肿瘤发生,已经产生95%以上的预测能力。所用这些标记物具有低于1pg/ml(下降到小于100fg/ml)的显著群体分布。相关分析要求非常高的群体百分比(100%)具有可行地准确测量或者该相关失败。对标记物具有不确定值或0值的任何样品未锚定相关计算,可能致使这个样品完全不正确。一些LAP信号传导蛋白和非常低水平浓度测量提取法的组合使得结果得到显著改善。足够显著的测量板可以用于筛查癌症。
[0163] 图13示出用于TNFα的典型的ELISA校准曲线。在这种情况下,检测限(LOD)为约1.0pg/ml,这大约是当前快速筛查测量技术可实现的最佳程度。注意,群体的显著百分比低于LOD。令人惊讶的是,这些数据点非常有用,并且实际上是要实现高预测能力相关所必需的。
[0164] 在临床实验室中,通常实践是检测限被定义为零校准之上的两个标准差,其中通常使用20个零标准计算标准差。通常不报告低于这个水平的测量结果,或如果报告,则被标记为低于LOD。当单分析物测定用于临床诊断目的时,它必须具有LOD以上的准确独立编号以为医生执业者适当地提供诊断信息并且需要常规方法。
[0165] 在使用低水平信号传导蛋白的诊断测定的情况下,如本说明书所描述的,用于对非疾病和疾病状态的概率进行可靠评分的测量不使用这些低于LOD的测量。图14示出来自图13的数据,但误差线示出保持所计算的癌症分数误差不超过5%的错误容许量。在处于或低于LOD的极低检测水平,相对量误差是可以容忍的。在非常高的浓度也是如此。
[0166] 用于诊断测定的校准曲线的关键区域是其中诊断预测分数在明确指示非疾病状态的分数至明确指示疾病状态的分数的范围内的区域。另请注意,如果低于LOD的数据被消除或报告为0,则该患者的评分可以简单地归为极端误差,低分数健康可以归为高分数癌症。这是因为该算法必须能够“锚定”,所有五种标记物在极端时为一些一般水平并在过渡时是准确的。如果一种标记物是未锚定的,则计算结果仅基于另四种。很可能的情况是,4种升高的结果不指示癌症,并且需要所有5种且必须升高以指示癌症和准确地作出分数。每个单独的标记物对单独的癌症分数的影响有限,并且基于校准曲线的位置,通过标记物实际影响和其可能的噪声水平对这种影响进行加权。
[0167] 例如,本文所讨论的乳腺癌测试板,其包括板中的PSA,对于大训练集(200个样品)的整体分析,在整体训练集模型预测能力中只示出3%至4%的改进。然而,从一个盲样品中除去它可以驱动从训练集模型评分要足够以使得这个样品可以从健康或癌症变化(例如,0至200标度上,50分至180)。这些盲样可以是罕见的,但只有百分之一产生了预测能力的1%的下降。用这些方法,发明人已实现了98%的预测能力,因此1%的损失非常显著。用于PSA的盲样数据点,以举例的方式,如果在约10fg/ml的非常低水平估计可以相差20倍,而不会产生显著的癌症分数误差。另一方面,如果PSA被省略或称为零,癌症分数通过低PSA水平变为“未锚定”,并且如果不包括则癌症分数可以有偏移以使其完全不正确。
[0168] 理解这些低测量水平处涉及的不确定性是重要的。对于一式两份运行的测量样品,与标称测量点1.5个标准差的置信水平是95%。与标称测量点0.75个标准差的置信度为67%。在这些方法中这种准确性水平大于非常低水平的足够准确度,并且完全没有数字可能使得该方法不实用。
[0169] 根据本发明,通过以下管理用于评估相关评估的测量点的值的方法:
[0170] 1)传统的校准曲线使用典型的免疫测定方法例如ELISA应从开发过程中评估的用于测定的LOD通过群体动态范围延伸至尽可能高。
[0171] 2)低于LOD,所有点被假定为具有显著的噪声,并因此实际测量点可以低于最低校准值。在这些情况下,所报告的结果必须是:
[0172] a.高于零,负浓度是不可能的,并且在相关算法中零值正好是有害的,因为对结果的准确性没有价值。
[0173] b.确定的,而不是仅仅具有分配给所有不确定的患者样品点浓度的值,这将扭曲子组训练集模型构建所需的群体分布。
[0174] c.报告没有低于在该标记物的大规模的群体评估中通常见到的。
[0175] 发明人已经意外地发现,测试运行中仅使用从LOD校准点到最低信号值的直线曲线拟合是足够的。这为群体分布分析提供了平滑的高斯分布和准确的癌症分数计算。使用这种方法,如果遵循上述规则,则任何数量的不同标准曲线创建策略将起作用。
[0176] 预期所公开用于利用低于约定LOD的分析物浓度的技术可用于利用例如患者样品中的标记物的测量浓度的任何测定。优选的实施例包括用于各种疾病的诊断测定,诸如实体瘤,包括前列腺癌、肺癌、乳腺癌和卵巢癌。这些技术可以任选地但优选地与本说明书中其他地方描述的其他数据分析和诊断技术组合。
[0177] 此外,本领域技术人员将理解,由所用的相关方法引起的分析误差,诸如双标记平面拓扑不稳定性,或本说明书其他地方所述的不足的训练集大小,是由完全不同的现象引起的并且需要完全不同的方法来缓解。例如,某些公开的误差和校正方法适用于极端非线性(或非常陡的)斜坡,在其上测试样品点位于相关双标记拓扑上。而且,这样的错误可以通过注射人工噪声和用不一致训练集模型裁断而发现。这里所指的噪声是由实验误差引起的测定测量中固有的,但理解噪声对所得癌症分数的影响是非常关键的。
[0178] III.通过计算机系统的实现方式
[0179] 本文所描述的各种技术的实现方式可用数字电子电路、或者用计算机硬件固件软件或它们的组合来实现。实现方式可以实现为计算机程序产品,例如有形地具体化在信息载体中的计算机程序,信息载体例如机器可读存储设备或传播信号,用于通过数据处理装置执行或控制数据处理装置的操作,数据处理装置例如可编程处理器、计算机或多个计算机。计算机程序诸如上述的计算机程序,可以用任何形式的编程语言编写,包括编译或解释语言,并且可以以任何形式部署,包括作为独立的程序或者作为模块、组件、子程序或适于在计算环境中使用的其他单元。计算机程序可以被部署以在一个站点或者分布在多个站点的一个计算机或多个计算机上执行,并通过通信网络相互连接。
[0180] 可以通过执行计算机程序的一个或多个可编程处理器执行方法步骤,以通过操作输入数据和生成输出来执行功能。方法步骤还可以通过专用逻辑电路来执行,并且该装置可以实现为专用逻辑电路,例如FPGA(现场可编程门阵列)或ASIC(专用集成电路)。
[0181] 适合于执行计算机程序的处理器包括,通过举例的方式,通用和专用微处理器以及任何类型的数字计算机的任何一个或多个处理器。通常,处理器将接收来自只读存储器随机存取存储器或两者的指令和数据。计算机的元件可以包括用于执行指令的至少一个处理器和用于存储指令和数据的一个或多个存储设备。通常,计算机还可以包括或者可操作地连接以接收来自用于存储数据的一个或多个大容量存储设备的数据或将数据传送至用于存储数据的一个或多个大容量存储设备或两者,大容量存储设备例如磁盘、磁光盘或光盘。适于具体化计算机程序指令和数据的信息载体包括所有形式的非易失性存储器,例如包括半导体存储设备,例如EPROM、EEPROM和闪存设备;磁盘,例如内部硬盘或可移动盘;磁光盘;以及CD-ROM和DVD-ROM盘。处理器和存储器可以由专用逻辑电路补充或并入专用逻辑电路中。
[0182] 为了提供与用户的交互,实现方式可以在具有显示设备的计算机上实现,例如阴极射线管(CRT)或液晶显示器(LCD)监视器,用于为用户显示信息,和键盘和定点设备,例如鼠标轨迹球,用户利用它们可以提供到计算机的输入。其他种类的设备也可用于提供与用户的互动;例如,提供给用户的反馈可以是任何形式的感官反馈,例如视觉反馈、听觉反馈或触觉反馈;来自用户的输入可以以任何形式接收,包括声音、语音或触觉输入。
[0183] 实现方式可以在计算系统中实现,其包括后端组件例如作为数据服务器,或包括中间件组件例如应用服务器,或包括前端组件例如具有图形用户界面或Web浏览器的客户端计算机,通过它用户可以与实现方式交互,或这些后端组件、中间件或前端组件的任何组合。组件可以通过任何形式或介质的数字数据通信互连,例如通信网络。通信网络的实例包括局域网(LAN)和广域网(WAN),例如因特网。
[0184] 在本说明书中描述的本发明一般涉及改进用于预测疾病状态的蛋白质组学和代谢组学相关方法的诊断准确性或预测能力的方法。虽然某些示例性实施例已在上面详细描述并且示出在随附的附图中,但应当理解,这些实施例仅是说明性的而不是对广泛发明的限制。特别是,应认识到,本发明的教导适用于多种疾病。另外,虽然本发明的优选实施例涉及期望疾病诊断的受试者(或患者)中人类疾病的诊断,明确预期本说明书中公开的方法和系统对非人类物种的诊断目的有用,尤其是灵长类动物和其他哺乳动物,并因此是本发明的一部分。
[0185] 虽然如本文所描述的,已示出所描述的实现方式的某些特征,但本领域技术人员现将想到许多修改、替换、变化和等同。因此,应理解本发明并不限于公开的具体实施例或布置,而是旨在涵盖任何变化、调整或修改,其落入所附权利要求所限定的本发明的范围和精神内。
[0186] 参考文献:
[0187] 本说明书中提及的所有的期刊文章和所有其他出版物、专利和文本的全部内容结合于此作为参考,包括以下内容。
[0188] (1)Drukier,et al.,"High-Sensitivity Blood-Based Detection of Breast Cancer by Multi Photon Detection Diagnostic Proteomics,"Journal of Proteome Research 2006,5:1908,1915.
[0189] (2)Lokshin et al.,"Multimarker assay for early diagnosis of ovarian cancer,"American Association for Cancer Research,Amer Assoc Cancer Res 2006,47:653.CME:Disclosure.
[0190] (3)Drukier,et al.,"Ultra-Sensitive Immunoassays Using Multi Photon Detection in Diagnostic Proteomics of Blood,"Journal of Proteome Research 2005,4:2375-2378.
[0191] (4)Drukier,"Supersensitive Immunoassays,"美国专利第7604956号(2009).
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈