冠状动脉疾病险的测定

阅读:702发布:2020-07-26

专利汇可以提供冠状动脉疾病险的测定专利检索,专利查询,专利分析的服务。并且本 发明 提供用于评估受试者 冠状动脉 疾病 的标志物和方法,以及用于测量它们表达的 试剂 盒 。本发明还提供基于所述标志物的 预测模型 ,以及 计算机系统 和给样品评分和任选分类的模型的 软件 实施方式。,下面是冠状动脉疾病险的测定专利的具体信息内容。

1.一种计算机实施的用于对从受试者获得的第一样品评分的方法,包括:
获得与所述第一样品有关的第一数据集,其中所述第一数据集包括选自项目1、项目
2、项目3、项目4、项目5、项目6和项目7中的标志物组中的至少一个标志物组的定量表达数据;
其中项目1包括标志物1、标志物2和标志物3,其中标志物1包括AF 161365,其中标志物2包括HNRPF或ACBD5,且其中标志物3包括TFCP2或DDX18;
其中项目2包括标志物4、标志物5和标志物6,其中标志物4包括AF289562或CD248,其中标志物5包括HNRPF或ACBD5,且其中标志物6包括TFCP2或DDX18;
其中项目3包括标志物7、标志物8、标志物9和标志物10,其中标志物7包括CD79B或CD19,其中标志物8包括SPIB或BLK,其中标志物9包括CD3D或LCK,且其中标志物10包括TMC8或CCT2;
其中项目4包括标志物11、标志物12、标志物13和标志物14,其中标志物11包括
S100A12或MMP9,其中标志物12包括CLEC4E或ALOX5AP,其中标志物13包括S 100A8或NAMPT,且其中标志物14包括RPL28或SSRP1;
其中项目5包括标志物15、标志物16、标志物17、标志物18和标志物19,其中标志物15包括S100A12或MMP9,其中标志物16包括CLEC4E或ALOX5AP,其中标志物17包括S100A8或NAMPT,其中标志物18包括AQP9或GLT1D1,且其中标志物19包括NCF4或NCF2;
其中项目6包括标志物20、标志物21、标志物22、标志物23、标志物24、标志物25和标志物26,其中标志物20包括CASP5或H3F3B,其中标志物21包括IL18RAP或TXN,其中标志物22包括TNFAIP6或PLAUR,其中标志物23包括IL8RB或BCL2A1,其中标志物24包括TNFRSF10C或PTAFR,其中标志物25包括KCNE3或LAMP2,且其中标志物26包括TLR4或TYROBP;以及
其中项目7包括标志物27、标志物28、标志物29和标志物30,其中标志物27包括
SLAMF7或CX3CR1,其中标志物28包括KLRC4或CD8A,其中标志物29包括CD3D或LCK,且其中标志物30包括TMC8或CCT2;以及
通过计算机处理器,使用解释函数由第一数据集确定第一评分,其中所述第一评分预测所述受试者的CAD。
2.根据权利要求1所述的方法,其中,所述第一数据集包括选自项目1、项目2、项目3、项目4、项目5、项目6和项目7中的标志物组的至少两个标志物组的定量表达数据。
3.根据权利要求1所述的方法,其中,所述第一数据集包括选自项目1、项目2、项目3、项目4、项目5、项目6和项目7中的标志物组的至少三个标志物组的定量表达数据。
4.根据权利要求1所述的方法,其中,所述第一数据集包括选自项目1、项目2、项目3、项目4、项目5、项目6和项目7中的标志物组的至少四个标志物组的定量表达数据。
5.根据权利要求1所述的方法,其中,所述第一数据集包括选自项目1、项目2、项目3、项目4、项目5、项目6和项目7中的标志物组的至少五个标志物组的定量表达数据。
6.根据权利要求1所述的方法,其中,所述第一数据集包括选自项目1、项目2、项目3、项目4、项目5、项目6和项目7中的标志物组的至少六个标志物组的定量表达数据。
7.根据权利要求1所述的方法,其中,所述第一数据集包括项目1、项目2、项目3、项目
4、项目5、项目6和项目7中的标志物组的定量表达数据。
8.根据权利要求1所述的方法,其中,所述解释函数基于预测模型
9.根据权利要求8所述的方法,其中,所述第一数据集进一步包括临床因素。
10.根据权利要求9所述的方法,其中,所述临床因素选自:年龄、性别、胸痛类型、嗜中性粒细胞计数、种族、疾病持续时间、舒张血压、收缩血压、家族史参数、医疗史参数、医学症状参数、身高、体重、人体质量指数、静息心率以及吸烟者/非吸烟者状态。
11.根据权利要求8所述的方法,其中,所述预测模型选自偏最小二乘法模型、逻辑回归模型、线性回归模型、线性判别分析模型、岭回归模型和基于树的递归分割模型。
12.根据权利要求1所述的方法,其中,获得与所述第一样品有关的第一数据集包括获得所述第一样品以及处理所述第一样品以实验测定所述第一数据集。
13.根据权利要求1所述的方法,其中,获得与所述第一样品有关的第一数据集包括从已处理所述第一样品以实验测定所述第一数据集的第三方接收所述第一数据集。
14.根据权利要求1所述的方法,进一步包括根据所述第一评分对所述第一样品进行分类。
15.根据权利要求14所述的方法,其中,所述分类预测所述受试者中CAD的存在或缺乏。
16.根据权利要求14所述的方法,其中,所述分类预测所述受试者中CAD的程度。
17.根据权利要求14所述的方法,其中,所述分类预测所述受试者中CAD的险。
18.根据权利要求1所述的方法,进一步包括基于所述第一评分对CAD风险评级。
19.根据权利要求1所述的方法,其中,所述预测模型性能的特征是曲线下面积(AUC)为0.68-0.70。
20.根据权利要求1所述的方法,其中,所述预测模型性能的特征是AUC为0.70-0.79。
21.根据权利要求1所述的方法,其中,所述预测模型性能的特征是AUC为0.80-0.89。
22.根据权利要求1所述的方法,其中,所述预测模型性能的特征是AUC为0.90-0.99。
23.根据权利要求1所述的方法,其中,所述第一样品包括外周血细胞。
24.根据权利要求23所述的方法,其中,所述外周血细胞包括白细胞。
25.根据权利要求1所述的方法,其中,所述第一样品包括提取自外周血细胞的RNA。
26.根据权利要求1所述的方法,其中,所述定量表达数据源于杂交数据。
27.根据权利要求1所述的方法,其中,所述定量表达数据源于聚合酶链反应数据。
28.根据权利要求1所述的方法,其中,所述定量表达数据源于抗体结合分析。
29.根据权利要求1所述的方法,其中,所述第一数据集获得和存储在存储器中。
30.根据权利要求1所述的方法,其中,所述受试者是人。
31.根据权利要求1所述的方法,其中,所述受试者具有稳定的胸痛。
32.根据权利要求1所述的方法,其中,所述受试者具有典型心绞痛或非典型心绞痛或心绞痛等同症状。
33.根据权利要求1所述的方法,其中,所述受试者之前没有心肌梗死(MI)的诊断。
34.根据权利要求1所述的方法,其中,所述受试者未接受过血管重建过程。
35.根据权利要求1所述的方法,其中,所述受试者未患糖尿病。
36.根据权利要求1所述的方法,其中,所述受试者不具有炎性状况或传染性状况。
37.根据权利要求1所述的方法,其中,所述受试者当前未服用类固醇、免疫抑制剂化学治疗剂。
38.一种计算机实施的对从受试者获得的第一样品评分的方法,包括:
获得与所述第一样品相关的第一数据集,其中所述第一数据集包括临床因素和选自AF161365、HNRPF、ACBD5、TFCP2、DDX18、AF289562、CD248、CD79B、CD19、SPIB、BLK、CD3D、LCK、TMC8、CCT2、S100A12、MMP9、CLEC4E、ALOX5AP、S100A8、NAMPT、RPL28、SSRP1、AQP9、GLT1D1、NCF4、NCF2、CASP5、H3F3B、IL18RAP、TXN、TNFAIP6、PLAUR、IL8RB、BCL2A1、TNFRSF10C、PTAFR、KCNE3、LAMP2、TLR4、TYROBP、SLAMF7、CX3CR1、KLRC4和CD8A中的至少两个标志物的定量表达数据;以及
通过计算机处理器使用解释函数由所述第一数据集确定第一评分,其中所述第一评分预测所述受试者的CAD。
39.根据权利要求38所述的方法,其中,所述第一数据集包括至少三个标志物的定量表达数据。
40.根据权利要求38所述的方法,其中,所述第一数据集包括至少四个标志物的定量表达数据。
41.根据权利要求38所述的方法,其中,所述第一数据集包括至少五个标志物的定量表达数据。
42.根据权利要求38所述的方法,其中,所述第一数据集包括至少六个标志物的定量表达数据。
43.根据权利要求38所述的方法,其中,所述解释函数基于预测模型。
44.根据权利要求43所述的方法,其中,所述临床因素是年龄和/或性别。
45.根据权利要求43所述的方法,其中,所述临床因素选自:年龄、性别、胸痛类型、嗜中性粒细胞计数、种族、疾病持续时间、舒张血压、收缩血压、家族史参数、医疗史参数、医学症状参数、身高、体重、人体质量指数、静息心率以及吸烟者/非吸烟者状态。
46.根据权利要求43所述的方法,其中,所述预测模型选自偏最小二乘法模型、逻辑回归模型、线性回归模型、线性判别分析模型、岭回归模型和基于树的递归分割模型。
47.根据权利要求38所述的方法,其中,获得与所述第一样品有关的第一数据集包括获得所述第一样品以及处理所述第一样品以实验测定所述第一数据集。
48.根据权利要求38所述的方法,其中,获得与所述第一样品有关的第一数据集包括从已处理所述第一样品以实验测定所述第一数据集的第三方接收所述第一数据集。
49.根据权利要求38所述的方法,进一步包括根据所述第一评分对所述第一样品进行分类。
50.根据权利要求49所述的方法,其中,所述分类是预测所述受试者中CAD的存在或缺乏。
51.根据权利要求49所述的方法,其中,所述分类预测所述受试者中CAD的程度。
52.根据权利要求49所述的方法,其中,所述分类预测所述受试者中CAD的风险。
53.根据权利要求38所述的方法,进一步包括基于所述第一评分对CAD风险评级。
54.根据权利要求38所述的方法,其中,所述预测模型性能的特征是AUC为
0.68-0.70。
55.根据权利要求38所述的方法,其中,所述预测模型性能的特征是AUC为
0.70-0.79。
56.根据权利要求38所述的方法,其中,所述预测模型性能的特征是AUC为
0.80-0.89。
57.根据权利要求38所述的方法,其中,所述预测模型性能的特征是AUC为
0.90-0.99。
58.根据权利要求38所述的方法,其中,所述第一样品包括外周血细胞。
59.根据权利要求58所述的方法,其中,所述外周血细胞包括白细胞。
60.根据权利要求38所述的方法,其中,所述第一样品包括提取自外周血细胞的RNA。
61.根据权利要求38所述的方法,其中,所述定量表达数据源于杂交数据。
62.根据权利要求38所述的方法,其中,所述定量表达数据源于聚合酶链反应数据。
63.根据权利要求38所述的方法,其中,所述定量表达数据源于抗体结合分析。
64.根据权利要求38所述的方法,其中,所述第一数据集获得和存储在存储器中。
65.根据权利要求38所述的方法,其中,所述受试者是人。
66.根据权利要求38所述的方法,其中,所述受试者具有稳定的胸痛。
67.根据权利要求38所述的方法,其中,所述受试者具有典型心绞痛或非典型心绞痛或心绞痛等同症状。
68.根据权利要求38所述的方法,其中,所述受试者之前没有MI的诊断。
69.根据权利要求38所述的方法,其中,所述受试者未接受过血管重建过程。
70.根据权利要求38所述的方法,其中,所述受试者未患糖尿病。
71.根据权利要求38所述的方法,其中,所述受试者不具有炎性状况或传染性状况。
72.根据权利要求38所述的方法,其中,所述受试者当前未服用类固醇、免疫抑制剂或化学治疗剂。
73.一种用于预测受试者中CAD的系统,所述系统包括:
存储器,其用于存储与从所述受试者获得的样品相关的数据集,其中所述数据集包括选自项目1、项目2、项目3、项目4、项目5、项目6和项目7中的标志物组中的至少一个标志物组的定量表达数据;其中项目1包括标志物1、标志物2和标志物3,其中标志物1包括AF161365,其中标志物2包括HNRPF或ACBD5,和其中标志物3包括TFCP2或DDX18;其中项目2包括标志物4、标志物5和标志物6,其中标志物4包括AF289562或CD248,其中标志物5包括HNRPF或ACBD5,和其中标志物6包括TFCP2或DDX18;其中项目3包括标志物7、标志物8、标志物9和标志物10,其中标志物7包括CD79B或CD19,其中标志物8包括SPIB或BLK,其中标志物9包括CD3D或LCK,和其中标志物10包括TMC8或CCT2;其中项目4包括标志物11、标志物12、标志物13和标志物14,其中标志物11包括S100A12或MMP9,其中标志物12包括CLEC4E或ALOX5AP,其中标志物13包括S100A8或NAMPT,和其中标志物14包括RPL28或SSRP1;其中项目5包括标志物15、标志物16、标志物17、标志物18和标志物19,其中标志物15包括S100A12或MMP9,其中标志物16包括CLEC4E或ALOX5AP,其中标志物17包括S100A8或NAMPT,其中标志物18包括AQP9或GLT1D1,和其中标志物19包括NCF4或NCF2;其中项目6包括标志物20、标志物21、标志物22、标志物23、标志物24、标志物25和标志物26,其中标志物20包括CASP5或H3F3B,其中标志物21包括IL18RAP或TXN,其中标志物22包括TNFAIP6或PLAUR,其中标志物23包括IL8RB或BCL2A1,其中标志物24包括TNFRSF 10C或PTAFR,其中标志物25包括KCNE3或LAMP2,和其中标志物26包括TLR4或TYROBP;以及其中项目7包括标志物27、标志物28、标志物29和标志物30,其中标志物27包括SLAMF7或CX3CR1,其中标志物28包括KLRC4或CD8A,其中标志物29包括CD3D或LCK,和其中标志物30包括TMC8或CCT2;以及
与所述存储器通讯偶联的处理器,其使用解释函数确定评分,其中所述评分预测受试者的CAD。
74.一种存储计算机可执行程序代码的计算机可读存储介质,所述程序代码包括:
用于存储与从所述受试者获得的样品相关的数据集的程序代码,其中所述数据集包括选自项目1、项目2、项目3、项目4、项目5、项目6和项目7的标志物组中的至少一个标志物组的定量表达数据;其中项目1包括标志物1、标志物2和标志物3,其中标志物1包括AF161365,其中标志物2包括HNRPF或ACBD5,和其中标志物3包括TFCP2或DDX18;其中项目2包括标志物4、标志物5和标志物6,其中标志物4包括AF289562或CD248,其中标志物
5包括HNRPF或ACBD5,和其中标志物6包括TFCP2或DDX18;其中项目3包括标志物7、标志物8、标志物9和标志物10,其中标志物7包括CD79B或CD19,其中标志物8包括SPIB或BLK,其中标志物9包括CD3D或LCK,和其中标志物10包括TMC8或CCT2;其中项目4包括标志物11、标志物12、标志物13和标志物14,其中标志物11包括S100A12或MMP9,其中标志物12包括CLEC4E或ALOX5AP,其中标志物13包括S100A8或NAMPT,和其中标志物14包括RPL28或SSRP1;其中项目5包括标志物15、标志物16、标志物17、标志物18和标志物19,其中标志物15包括S100A12或MMP9,其中标志物16包括CLEC4E或ALOX5AP,其中标志物
17包括S100A8或NAMPT,其中标志物18包括AQP9或GLT1D1,和其中标志物19包括NCF4或NCF2;其中项目6包括标志物20、标志物21、标志物22、标志物23、标志物24、标志物25和标志物26,其中标志物20包括CASP5或H3F3B,其中标志物21包括IL18RAP或TXN,其中标志物22包括TNFAIP6或PLAUR,其中标志物23包括IL8RB或BCL2A1,其中标志物24包括TNFRSF10C或PTAFR,其中标志物25包括KCNE3或LAMP2,和其中标志物26包括TLR4或TYROBP;以及其中项目7包括标志物27、标志物28、标志物29和标志物30,其中标志物
27包括SLAMF7或CX3CR1,其中标志物28包括KLRC4或CD8A,其中标志物29包括CD3D或LCK,和其中标志物30包括TMC8或CCT2;以及
使用解释函数确定评分的程序代码,其中所述评分预测受试者的CAD。
75.一种用于预测受试者的CAD的方法,包括:
从所述受试者获得样品,其中所述样品包括多个分析物;
将所述样品与试剂接触
产生多个所述试剂与所述多个分析物的复合物;
检测该多个复合物以获得与所述样品相关的数据集,其中所述数据集包括选自项目1、项目2、项目3、项目4、项目5、项目6和项目7的标志物组中的至少一个标志物组的定量表达数据;其中项目1包括标志物1、标志物2和标志物3,其中标志物1包括AF161365,其中标志物2包括HNRPF或ACBD5,和其中标志物3包括TFCP2或DDX18;其中项2包括标志物
4、标志物5和标志物6,其中标志物4包括AF289562或CD248,其中标志物5包括HNRPF或ACBD5,和其中标志物6包括TFCP2或DDX18;其中项目3包括标志物7、标志物8、标志物9和标志物10,其中标志物7包括CD79B或CD19,其中标志物8包括SPIB或BLK,其中标志物
9包括CD3D或LCK,和其中标志物10包括TMC8或CCT2;其中项目4包括标志物11、标志物
12、标志物13和标志物14,其中标志物11包括S100A12或MMP9,其中标志物12包括CLEC4E或ALOX5AP,其中标志物13包括S100A8或NAMPT,和其中标志物14包括RPL28或SSRP1;
其中项目5包括标志物15、标志物16、标志物17、标志物18和标志物19,其中标志物15包括S100A12或MMP9,其中标志物16包括CLEC4E或ALOX5AP,其中标志物17包括S100A8或NAMPT,其中标志物18包括AQP9或GLT1D1,和其中标志物19包括NCF4或NCF2;其中项目
6包括标志物20、标志物21、标志物22、标志物23、标志物24、标志物25和标志物26,其中标志物20包括CASP5或H3F3B,其中标志物21包括IL18RAP或TXN,其中标志物22包括TNFAIP6或PLAUR,其中标志物23包括IL8RB或BCL2A1,其中标志物24包括TNFRSF10C或PTAFR,其中标志物25包括KCNE3或LAMP2,和其中标志物26包括TLR4或TYROBP;以及其中项目7包括标志物27、标志物28、标志物29和标志物30,其中标志物27包括SLAMF7或CX3CR1,其中标志物28包括KLRC4或CD8A,其中标志物29包括CD3D或LCK,和其中标志物
30包括TMC8或CCT2;以及
使用解释函数从所述数据集确定评分,其中所述评分预测受试者的CAD。
76.一种用于预测受试者的CAD的试剂盒,包括:
一组试剂,包括用于从所述受试者获得的样品测定选自项目1、项目2、项目3、项目4、项目5、项目6和项目7的标志物组中的至少一个标志物组的定量表达数据的多个试剂;其中项1包括标志物1、标志物2和标志物3,其中标志物1包括AF161365,其中标志物2包括HNRPF或ACBD5,和其中标志物3包括TFCP2或DDX18;其中项目2包括标志物4、标志物
5和标志物6,其中标志物4包括AF289562或CD248,其中标志物5包括HNRPF或ACBD5,和其中标志物6包括TFCP2或DDX18;其中项目3包括标志物7、标志物8、标志物9和标志物10,其中标志物7包括CD79B或CD19,其中标志物8包括SPIB或BLK,其中标志物9包括CD3D或LCK,和其中标志物10包括TMC8或CCT2;其中项目4包括标志物11、标志物12、标志物13和标志物14,其中标志物11包括S100A12或MMP9,其中标志物12包括CLEC4E或ALOX5AP,其中标志物13包括S100A8或NAMPT,和其中标志物14包括RPL28或SSRP1;
其中项目5包括标志物15、标志物16、标志物17、标志物18和标志物19,其中标志物15包括S100A12或MMP9,其中标志物16包括CLEC4E或ALOX5AP,其中标志物17包括S100A8或NAMPT,其中标志物18包括AQP9或GLT1D1,和其中标志物19包括NCF4或NCF2;其中项目
6包括标志物20、标志物21、标志物22、标志物23、标志物24、标志物25和标志物26,其中标志物20包括CASP5或H3F3B,其中标志物21包括IL18RAP或TXN,其中标志物22包括TNFAIP6或PLAUR,其中标志物23包括IL8RB或BCL2A1,其中标志物24包括TNFRSF10C或PTAFR,其中标志物25包括KCNE3或LAMP2,和其中标志物26包括TLR4或TYROBP;以及其中项目7包括标志物27、标志物28、标志物29和标志物30,其中标志物27包括SLAMF7或CX3CR1,其中标志物28包括KLRC4或CD8A,其中标志物29包括CD3D或LCK,和其中标志物
30包括TMC8或CCT2;以及
使用所述多个试剂从所述样品测定定量数据的说明书,其中所述说明书包括从所述数据集确定评分的说明,其中所述评分预测受试者的CAD。
77.根据权利要求76所述的试剂盒,其中,所述说明书包括用于进行微阵列分析的说明。
78.根据权利要求76所述的试剂盒,其中,所述说明书包括用于进行聚合酶链反应分析的说明。
79.一种用于预测受试者的CAD的系统,所述系统包括:
存储器,其用于存储与从所述受试者获得的样品相关的数据集,其中所述数据集包括临床因素和选自AF161365、HNRPF、ACBD5、TFCP2、DDX18、AF289562、CD248、CD79B、CD19、SPIB、BLK、CD3D、LCK、TMC8、CCT2、S100A12、MMP9、CLEC4E、ALOX5AP、S100A8、NAMPT、RPL28、SSRP1、AQP9、GLT1D1、NCF4、NCF2、CASP5、H3F3B、IL18RAP、TXN、TNFAIP6、PLAUR、IL8RB、BCL2A1、TNFRSF10C、PTAFR、KCNE3、LAMP2、TLR4、TYROBP、SLAMF7、CX3CR1、KLRC4和CD8A中的至少两个标志物的定量表达数据;以及
与所述存储器通讯偶联的处理器,其使用解释函数确定评分,其中所述评分预测受试者的CAD。
80.一种存储计算机可执行程序代码的计算机可读存储介质,所述程序代码包括:
用于存储与从所述受试者获得的样品相关的数据集的程序代码,其中所述数据集包括临床因素和选自AF161365、HNRPF、ACBD5、TFCP2、DDX18、AF289562、CD248、CD79B、CD19、SPIB、BLK、CD3D、LCK、TMC8、CCT2、S100A12、MMP9、CLEC4E、ALOX5AP、S100A8、NAMPT、RPL28、SSRP1、AQP9、GLT1D1、NCF4、NCF2、CASP5、H3F3B、IL18RAP、TXN、TNFAIP6、PLAUR、IL8RB、BCL2A1、TNFRSF10C、PTAFR、KCNE3、LAMP2、TLR4、TYROBP、SLAMF7、CX3CR1、KLRC4和CD8A中的至少两个标志物的定量表达数据;以及
使用解释函数确定评分的程序代码,其中所述评分预测受试者的CAD。
81.一种用于预测受试者的CAD的方法,包括:
从所述受试者获得样品,其中所述样品包括多个分析物;
将所述样品与试剂接触;
产生所述试剂与所述多个分析物的多个复合物;
检测该多个复合物以获得与所述样品相关的数据集,其中所述数据集包括临床因素和选自AF161365、HNRPF、ACBD5、TFCP2、DDX18、AF289562、CD248、CD79B、CD19、SPIB、BLK、CD3D、LCK、TMC8、CCT2、S100A12、MMP9、CLEC4E、ALOX5AP、S100A8、NAMPT、RPL28、SSRP1、AQP9、GLT1D1、NCF4、NCF2、CASP5、H3F3B、IL18RAP、TXN、TNFAIP6、PLAUR、IL8RB、BCL2A1、TNFRSF10C、PTAFR、KCNE3、LAMP2、TLR4、TYROBP、SLAMF7、CX3CR1、KLRC4和CD8A中的至少两个标志物的定量表达数据;以及
使用解释函数从所述数据集确定评分,其中所述评分预测受试者的CAD。
82.一种用于预测受试者的CAD的试剂盒,包括:
一组试剂,包括用于从所述受试者获得的样品测定选自下组中至少两个标志物的定量表达数据的多个试剂:AF161365、HNRPF、ACBD5、TFCP2、DDX18、AF289562、CD248、CD79B、CD19、SPIB、BLK、CD3D、LCK、TMC8、CCT2、S100A12、MMP9、CLEC4E、ALOX5AP、S100A8、NAMPT、RPL28、SSRP1、AQP9、GLT1D1、NCF4、NCF2、CASP5、H3F3B、IL18RAP、TXN、TNFAIP6、PLAUR、IL8RB、BCL2A1、TNFRSF10C、PTAFR、KCNE3、LAMP2、TLR4、TYROBP、SLAMF7、CX3CR1、KLRC4和CD8A;以及
使用所述多个试剂从所述样品测定定量数据的说明书,其中所述说明书包括从所述数据集和临床因素确定评分的说明,其中所述评分预测受试者的CAD。

说明书全文

冠状动脉疾病险的测定

[0001] 相关申请的交叉引用
[0002] 本申请要求于2009年6月15日提交的美国临时申请No.61/187,203和2009年9月23日提交的美国临时申请No.61/245,190的利益,因此对于所有目的,它们的全部公开内容通过引用的方式整体并入到本申请中。

技术领域

[0003] 本发明涉及基于标志物表达测量测定冠状动脉疾病(CAD)风险程度的预测模型,涉及它们的使用方法,并且涉及用于其实现的计算机系统软件
[0004] 相关技术的说明
[0005] CAD和心肌梗死(MI)引起的死亡率和发病率是全球主要的健康负担。目前CAD可1,2
能性的主要决定因素是性别、年龄和胸痛类型 。其它风险因素例如糖尿病、吸烟、血脂异
3
常和家族史与未来的心脏血管事件风险有关 。此外,动脉粥样硬化具有全身性的炎症成分
4,5
包括免疫细胞活化和迁移到血管壁内 。实际上,由于这些细胞源于循环血并与循环血相
6,7
互作用,因此循环血细胞基因表达的定量测量反映CAD的程度 。这些观察很可能反映细
8
胞类型分布的变化(这对于心脏血管事件具有预后价值 )和特定细胞类型或谱系内的基因表达变化。
[0006] 用于检测CAD的“金标准”是侵入性冠状动脉造影;但是,这种检测费用大,而且可能给患者带来风险。血管造影之前,可使用例如心肌灌注显像(MPI)和CT血管造影的非侵入性诊断模式,然而这些模式具有并发症,包括射线暴露、造影剂敏感性,且对于阻塞性CAD9,10
鉴别只适度地增加 。
[0007] 未满足的临床和科学需要
[0008] 能可靠地鉴别具有CAD的患者的非侵入性的血液测试将具有显著的临床实用性。像这样,对抗动脉粥样硬化的大的进步是开发可有助于诊断和评估患者的CAD程度的非侵入性诊断测试。此处描述为此目的使用标志物表达和临床因素(例如,年龄和性别)的算法的开发和验证。
[0009] 发明概述
[0010] 本发明披露一种计算机实施的用于对来自受试者的第一样品评分的方法,包括:获得与所述第一样品有关的第一数据集,其中所述第一数据集包括选自项目1、项目2、项目3、项目4、项目5、项目6和项目7的标志物组中的至少一个标志物组的定量表达数据;
其中项目1包括标志物1、标志物2和标志物3,其中标志物1包括AF161365,其中标志物2包括HNRPF或ACBD5,和其中标志物3包括TFCP2或DDX18;其中项目2包括标志物4、标志物5和标志物6,其中标志物4包括AF289562或CD248,其中标志物5包括HNRPF或ACBD5,和其中标志物6包括TFCP2或DDX18;其中项目3包括标志物7、标志物8、标志物9和标志物10,其中标志物7包括CD79B或CD19,其中标志物8包括SPIB或BLK,其中标志物9包括CD3D或LCK,和其中标志物10包括TMC8或CCT2;其中项目4包括标志物11、标志物12、标志物13和标志物14,其中标志物11包括S100A12或MMP9,其中标志物12包括CLEC4E或ALOX5AP,其中标志物13包括S100A8或NAMPT,和其中标志物14包括RPL28或SSRP1;
其中项目5包括标志物15、标志物16、标志物17、标志物18和标志物19,其中标志物15包括S100A12或MMP9,其中标志物16包括CLEC4E或ALOX5AP,其中标志物17包括S100A8或NAMPT,其中标志物18包括AQP9或GLT1D1,和其中标志物19包括NCF4或NCF2;其中项目
6包括标志物20、标志物21、标志物22、标志物23、标志物24、标志物25和标志物26,其中标志物20包括CASP5或H3F3B,其中标志物21包括IL18RAP或TXN,其中标志物22包括TNFAIP6或PLAUR,其中标志物23包括IL8RB或BCL2A1,其中标志物24包括TNFRSF10C或PTAFR,其中标志物25包括KCNE3或LAMP2,和其中标志物26包括TLR4或TYROBP;以及其中项目7包括标志物27、标志物28、标志物29以及标志物30,其中标志物27包括SLAMF7或CX3CR1,其中标志物28包括KLRC4或CD8A,其中标志物29包括CD3D或LCK,和其中标志物30包括TMC8或CCT2;以及通过计算机处理器使用解释函数从所述第一数据集确定第一评分,其中所述第一评分预测所述受试者的CAD。
[0011] 在一个实施方式中,所述第一数据集包括选自项目1、项目2、项目3、项目4、项目5、项目6和项目7中的标志物组的至少两个标志物组的定量表达数据。在一个实施方式中,所述第一数据集包括选自项目1、项目2、项目3、项目4、项目5、项目6和项目7中的标志物组的至少三个标志物组的定量表达数据。在一个实施方式中,所述第一数据集包括选自项目1、项目2、项目3、项目4、项目5、项目6和项目7中的标志物组的至少四个标志物组的定量表达数据。在一个实施方式中,所述第一数据集包括选自项目1、项目2、项目3、项目4、项目5、项目6和项目7中的标志物组的至少五个标志物组的定量表达数据。在一个实施方式中,所述第一数据集包括选自项目1、项目2、项目3、项目4、项目5、项目6和项目7中的标志物组的至少六个标志物组的定量表达数据。在一个实施方式中,所述第一数据集包括项目1、项目2、项目3、项目4、项目5、项目6和项目7中的标志物组的定量表达数据。
[0012] 在一个实施方式中,所述解释函数基于预测模型。在一个实施方式中,所述预测模型选自偏最小二乘法模型、逻辑回归模型、线性回归模型、线性判别分析模型、岭回归模型和基于树的递归分割模型。在一个实施方式中,所述预测模型性能的特征是曲线下面积(AUC)为0.68-0.70。在一个实施方式中,所述预测模型性能的特征是AUC为0.70-0.79。在一个实施方式中,所述预测模型性能的特征是AUC为0.80-0.89。在一个实施方式中,所述预测模型性能的特征是AUC为0.90-0.99。
[0013] 在一个实施方式中,所述第一数据集进一步包括临床因素。在一个实施方式中,所述临床因素选自:年龄、性别、胸痛类型、嗜中性粒细胞计数、种族、疾病持续时间、舒张血压、收缩血压、家族史参数、医疗史参数、医学症状参数、身高、体重、人体质量指数、静息心率以及吸烟者/非吸烟者状态。
[0014] 在一个实施方式中,所述获得与所述第一样品有关的第一数据集包括获得所述第一样品以及处理所述第一样品以实验测定所述第一数据集。在一个实施方式中,获得与所述第一样品有关的第一数据集包括从已处理所述第一样品以实验测定所述第一数据集的第三方接收所述第一数据集。
[0015] 在一个实施方式中,所述方法包括根据所述第一评分对所述第一样品进行分类。在一个实施方式中,所述分类预测所述受试者中CAD的存在或缺乏。在一个实施方式中,所述分类预测所述受试者中CAD的程度。在一个实施方式中,所述分类预测所述受试者中CAD的风险。在一个实施方式中,所述方法包括基于所述第一评分对CAD风险评级。
[0016] 在一个实施方式中,所述第一样品包括外周血细胞。在一个实施方式中,所述外周血细胞包括白细胞。在一个实施方式中,所述第一样品包括提取自外周血细胞的RNA。
[0017] 在一个实施方式中,所述定量表达数据源于杂交数据。在一个实施方式中,所述定量表达数据源于聚合酶链反应数据。在一个实施方式中,所述定量表达数据源于抗体结合分析。在一个实施方式中,所述第一数据集获得和存储在存储器上。
[0018] 在一个实施方式中,所述受试者是人。在一个实施方式中,所述受试者具有稳定的胸痛。在一个实施方式中,所述受试者具有典型心绞痛或非典型心绞痛或心绞痛等同症状。在一个实施方式中,所述受试者之前没有心肌梗死(MI)的诊断。在一个实施方式中,所述受试者未接受过血管重建过程。在一个实施方式中,所述受试者未患糖尿病。在一个实施方式中,所述受试者不具有炎性状况或传染性状况。在一个实施方式中,所述受试者当前未服用类固醇、免疫抑制剂化学治疗剂。
[0019] 本发明还描述一种计算机实施的用于对从受试者获得的第一样品评分的方法,包括:获得与所述第一样品相关的第一数据集,其中所述第一数据集包括选自AF161365、HNRPF、ACBD5、TFCP2、DDX18、AF289562、CD248、CD79B、CD19、SPIB、BLK、CD3D、LCK、TMC8、CCT2、S100A12、MMP9、CLEC4E、ALOX5AP、S100A8、NAMPT、RPL28、SSRP1、AQP9、GLT1D1、NCF4、NCF2、CASP5、H3F3B、IL18RAP、TXN、TNFAIP6、PLAUR、IL8RB、BCL2A1、TNFRSF10C、PTAFR、KCNE3、LAMP2、TLR4、TYROBP、SLAMF7、CX3CR1、KLRC4和CD8A中的至少两个标志物的定量表达数据;以及通过计算机处理器使用解释函数从所述第一数据集确定第一评分,其中所述第一评分预测所述受试者的CAD。
[0020] 在一个实施方式中,所述第一数据集包括临床因素。在一个实施方式中,所述临床因素是年龄和/或性别。在一个实施方式中,所述临床因素选自:年龄、性别、胸痛类型、嗜中性粒细胞计数、种族、疾病持续时间、舒张血压、收缩血压、家族史参数、医疗史参数、医学症状参数、身高、体重、人体质量指数、静息心率以及吸烟者/非吸烟者状态。
[0021] 在一个实施方式中,所述第一数据集包括至少三个标志物的定量表达数据。在一个实施方式中,所述第一数据集包括至少四个标志物的定量表达数据。在一个实施方式中,所述第一数据集包括至少五个标志物的定量表达数据。在一个实施方式中,所述第一数据集包括至少六个标志物的定量表达数据。
[0022] 在一个实施方式中,所述解释函数基于预测模型。在一个实施方式中,所述预测模型选自偏最小二乘法模型、逻辑回归模型、线性回归模型、线性判别分析模型、岭回归模型和基于树的递归分割模型中。在一个实施方式中,所述预测模型性能的特征是曲线下面积(AUC)为0.68-0.70。在一个实施方式中,所述预测模型性能的特征是AUC为0.70-0.79。在一个实施方式中,所述预测模型性能的特征是AUC为0.80-0.89。在一个实施方式中,所述预测模型性能的特征是AUC为0.90-0.99。
[0023] 在一个实施方式中,所述获得与所述第一样品有关的第一数据集包括获得所述第一样品以及处理所述第一样品以实验测定所述第一数据集。在一个实施方式中,所述获得与所述第一样品有关的第一数据集包括从已处理所述第一样品以实验测定所述第一数据集的第三方接收所述第一数据集。
[0024] 在一个实施方式中,所述方法包括根据所述第一评分对所述第一样品进行分类。在一个实施方式中,所述分类是预测所述受试者中CAD的存在或缺乏。在一个实施方式中,所述分类是预测所述受试者中CAD的程度。在一个实施方式中,所述分类是预测所述受试者中CAD的风险。在一个实施方式中,所述方法包括基于所述第一评分对CAD风险评级。
[0025] 在一个实施方式中,所述第一样品包括外周血细胞。在一个实施方式中,所述外周血细胞包括白细胞。在一个实施方式中,所述第一样品包括提取自外周血细胞的RNA。
[0026] 在一个实施方式中,所述定量表达数据源于杂交数据。在一个实施方式中,所述定量表达数据源于聚合酶链反应数据。在一个实施方式中,所述定量表达数据源于抗体结合分析。在一个实施方式中,所述第一数据集获得并存储在存储器上。
[0027] 在一个实施方式中,所述受试者是人。在一个实施方式中,所述受试者具有稳定的胸痛。在一个实施方式中,所述受试者具有典型心绞痛或非典型心绞痛或心绞痛等同症状。在一个实施方式中,所述受试者之前没有心肌梗死(MI)的诊断。在一个实施方式中,所述受试者未接受过血管重建过程。在一个实施方式中,所述受试者未患糖尿病。在一个实施方式中,所述受试者不具有炎性状况或传染性状况。在一个实施方式中,所述受试者当前未服用类固醇、免疫抑制剂或化学治疗剂。
[0028] 本发明还描述一种用于预测受试者的CAD的系统,所述系统包括:存储器,其用于存储与从所述受试者获得的样品相关的数据集,其中所述第一数据集包括选自项目1、项目2、项目3、项目4、项目5、项目6和项目7的标志物组中的至少一个标志物组的定量表达数据;其中项目1包括标志物1、标志物2和标志物3,其中标志物1包括AF161365,其中标志物2包括HNRPF或ACBD5,和其中标志物3包括TFCP2或DDX18;其中项目2包括标志物4、标志物5和标志物6,其中标志物4包括AF289562或CD248,其中标志物5包括HNRPF或ACBD5,和其中标志物6包括TFCP2或DDX18;其中项目3包括标志物7、标志物8、标志物9和标志物10,其中标志物7包括CD79B或CD19,其中标志物8包括SPIB或BLK,其中标志物
9包括CD3D或LCK,和其中标志物10包括TMC8或CCT2;其中项目4包括标志物11、标志物
12、标志物13和标志物14,其中标志物11包括S100A12或MMP9,其中标志物12包括CLEC4E或ALOX5AP,其中标志物13包括S100A8或NAMPT,和其中标志物14包括RPL28或SSRP1;
其中项目5包括标志物15、标志物16、标志物17、标志物18和标志物19,其中标志物15包括S100A12或MMP9,其中标志物16包括CLEC4E或ALOX5AP,其中标志物17包括S100A8或NAMPT,其中标志物18包括AQP9或GLT1D1,和其中标志物19包括NCF4或NCF2;其中项目
6包括标志物20、标志物21、标志物22、标志物23、标志物24、标志物25和标志物26,其中标志物20包括CASP5或H3F3B,其中标志物21包括IL18RAP或TXN,其中标志物22包括TNFAIP6或PLAUR,其中标志物23包括IL8RB或BCL2A1,其中标志物24包括TNFRSF10C或PTAFR,其中标志物25包括KCNE3或LAMP2,和其中标志物26包括TLR4或TYROBP;以及其中项目7包括标志物27、标志物28、标志物29和标志物30,其中标志物27包括SLAMF7或CX3CR1,其中标志物28包括KLRC4或CD8A,其中标志物29包括CD3D或LCK,和其中标志物
30包括TMC8或CCT2;以及与所述存储器通讯偶联的处理器,其使用解释函数确定评分,其中所述评分预测受试者的CAD。
[0029] 本发明还描述一种存储计算机可执行程序代码的计算机可读存储介质,所述程序代码包括:用于存储与从所述受试者获得的样品相关的数据集的程序代码,其中所述第一数据集包括选自项目1、项目2、项目3、项目4、项目5、项目6和项目7的标志物组中的至少一个标志物组的定量表达数据;其中项目1包括标志物1、标志物2和标志物3,其中标志物1包括AF161365,其中标志物2包括HNRPF或ACBD5,和其中标志物3包括TFCP2或DDX18;
其中项目2包括标志物4、标志物5和标志物6,其中标志物4包括AF289562或CD248,其中标志物5包括HNRPF或ACBD5,和其中标志物6包括TFCP2或DDX18;其中项目3包括标志物7、标志物8、标志物9和标志物10,其中标志物7包括CD79B或CD19,其中标志物8包括SPIB或BLK,其中标志物9包括CD3D或LCK,和其中标志物10包括TMC8或CCT2;其中项目
4包括标志物11、标志物12、标志物13和标志物14,其中标志物11包括S100A12或MMP9,其中标志物12包括CLEC4E或ALOX5AP,其中标志物13包括S100A8或NAMPT,和其中标志物14包括RPL28或SSRP1;其中项目5包括标志物15、标志物16、标志物17、标志物18和标志物19,其中标志物15包括S100A12或MMP9,其中标志物16包括CLEC4E或ALOX5AP,其中标志物17包括S100A8或NAMPT,其中标志物18包括AQP9或GLT1D1,和其中标志物19包括NCF4或NCF2;其中项目6包括标志物20、标志物21、标志物22、标志物23、标志物24、标志物25和标志物26,其中标志物20包括CASP5或H3F3B,其中标志物21包括IL18RAP或TXN,其中标志物22包括TNFAIP6或PLAUR,其中标志物23包括IL8RB或BCL2A1,其中标志物24包括TNFRSF10C或PTAFR,其中标志物25包括KCNE3或LAMP2,和其中标志物26包括TLR4或TYROBP;以及其中项目7包括标志物27、标志物28、标志物29和标志物30,其中标志物27包括SLAMF7或CX3CR1,其中标志物28包括KLRC4或CD8A,其中标志物29包括CD3D或LCK,和其中标志物30包括TMC8或CCT2;以及使用解释函数确定评分的程序代码,其中所述评分预测受试者的CAD。
[0030] 本发明还描述一种用于预测受试者的CAD的方法,包括:从受试者获得样品,其中所述样品包括多个分析物;将所述样品与试剂接触;产生所述试剂和所述多个分析物的多个复合物;检测该多个复合物以获得与所述样品相关的数据集,其中所述第一数据集包括选自项1、项目2、项目3、项目4、项目5、项目6和项目7的标志物组中的至少一个标志物组的定量表达数据;其中项1包括标志物1、标志物2和标志物3,其中标志物1包括AF161365,其中标志物2包括HNRPF或ACBD5,和其中标志物3包括TFCP2或DDX18;其中项目2包括标志物4、标志物5和标志物6,其中标志物4包括AF289562或CD248,其中标志物5包括HNRPF或ACBD5,和其中标志物6包括TFCP2或DDX18;其中项目3包括标志物7、标志物8、标志物9和标志物10,其中标志物7包括CD79B或CD19,其中标志物8包括SPIB或BLK,其中标志物9包括CD3D或LCK,和其中标志物10包括TMC8或CCT2;其中项目4包括标志物11、标志物12、标志物13和标志物14,其中标志物11包括S100A12或MMP9,其中标志物12包括CLEC4E或ALOX5AP,其中标志物13包括S100A8或NAMPT,和其中标志物14包括RPL28或SSRP1;其中项目5包括标志物15、标志物16、标志物17、标志物18和标志物19,其中标志物15包括S100A12或MMP9,其中标志物16包括CLEC4E或ALOX5AP,其中标志物17包括S100A8或NAMPT,其中标志物18包括AQP9或GLT1D1,和其中标志物19包括NCF4或NCF2;其中项6包括标志物20、标志物21、标志物22、标志物23、标志物24、标志物25和标志物26,其中标志物20包括CASP5或H3F3B,其中标志物21包括IL18RAP或TXN,其中标志物22包括TNFAIP6或PLAUR,其中标志物23包括IL8RB或BCL2A1,其中标志物24包括TNFRSF10C或PTAFR,其中标志物25包括KCNE3或LAMP2,和其中标志物26包括TLR4或TYROBP;以及其中项目7包括标志物27、标志物28、标志物29和标志物30,其中标志物
27包括SLAMF7或CX3CR1,其中标志物28包括KLRC4或CD8A,其中标志物29包括CD3D或LCK,和其中标志物30包括TMC8或CCT2;以及使用解释函数确定从所述数据集确定评分,其中所述评分预测受试者的CAD。
[0031] 本发明还描述一种用于预测受试者的CAD的试剂盒,包括:一组试剂,其包括用于从受试者获得的样品测定选自项目1、项目2、项目3、项目4、项目5、项目6和项目7的标志物组中的至少一个标志物组的定量表达数据多个试剂;其中项目1包括标志物1、标志物2和标志物3,其中标志物1包括AF161365,其中标志物2包括HNRPF或ACBD5,和其中标志物3包括TFCP2或DDX18;其中项目2包括标志物4、标志物5和标志物6,其中标志物4包括AF289562或CD248,其中标志物5包括HNRPF或ACBD5,和其中标志物6包括TFCP2或DDX18;其中项目3包括标志物7、标志物8、标志物9和标志物10,其中标志物7包括CD79B或CD19,其中标志物8包括SPIB或BLK,其中标志物9包括CD3D或LCK,和其中标志物10包括TMC8或CCT2;其中项目4包括标志物11、标志物12、标志物13和标志物14,其中标志物11包括S100A12或MMP9,其中标志物12包括CLEC4E或ALOX5AP,其中标志物13包括S100A8或NAMPT,和其中标志物14包括RPL28或SSRP1;其中项目5包括标志物15、标志物16、标志物17、标志物18和标志物19,其中标志物15包括S100A12或MMP9,其中标志物
16包括CLEC4E或ALOX5AP,其中标志物17包括S100A8或NAMPT,其中标志物18包括AQP9或GLT1D1,和其中标志物19包括NCF4或NCF2;其中项目6包括标志物20、标志物21、标志物22、标志物23、标志物24、标志物25和标志物26,其中标志物20包括CASP5或H3F3B,其中标志物21包括IL18RAP或TXN,其中标志物22包括TNFAIP6或PLAUR,其中标志物23包括IL8RB或BCL2A1,其中标志物24包括TNFRSF10C或PTAFR,其中标志物25包括KCNE3或LAMP2,和其中标志物26包括TLR4或TYROBP;以及其中项目7包括标志物27、标志物28、标志物29和标志物30,其中标志物27包括SLAMF7或CX3CR1,其中标志物28包括KLRC4或CD8A,其中标志物29包括CD3D或LCK,和其中标志物30包括TMC8或CCT2;以及使用所述多个试剂测定所述样品的定量数据的说明书,其中所述说明书包括从所述数据集确定评分的说明,其中所述评分预测受试者的CAD。
[0032] 在一个实施方式中,所述说明书包括用于进行微阵列分析的说明书。在一个实施方式中,所述说明书包括用于进行聚合酶链反应分析的说明书。
[0033] 本发明还描述一种用于预测受试者的CAD的系统,所述系统包括:存储器,其用于存储与从所述受试者获得的样品有关的数据集,其中所述数据集包括选自AF161365、HNRPF、ACBD5、TFCP2、DDX18、AF289562、CD248、CD79B、CD19、SPIB、BLK、CD3D、LCK、TMC8、CCT2、S100A12、MMP9、CLEC4E、ALOX5AP、S100A8、NAMPT、RPL28、SSRP1、AQP9、GLT1D1、NCF4、NCF2、CASP5、H3F3B、IL18RAP、TXN、TNFAIP6、PLAUR、IL8RB、BCL2A1、TNFRSF10C、PTAFR、KCNE3、LAMP2、TLR4、TYROBP、SLAMF7、CX3CR1、KLRC4和CD8A中的至少两个标志物的定量表达数据;以及与所述存储器通讯偶联的处理器,其使用解释函数确定评分,其中所述评分预测受试者的CAD。
[0034] 本发明还描述一种存储计算机可执行程序代码的计算机可读存储介质,所述程序代码包括:用于存储与从所述受试者获得的样品相关的数据集的程序代码,其中所述数据集包括选自AF161365、HNRPF、ACBD5、TFCP2、DDX18、AF289562、CD248、CD79B、CD19、SPIB、BLK、CD3D、LCK、TMC8、CCT2、S100A12、MMP9、CLEC4E、ALOX5AP、S100A8、NAMPT、RPL28、SSRP1、AQP9、GLT1D1、NCF4、NCF2、CASP5、H3F3B、IL18RAP、TXN、TNFAIP6、PLAUR、IL8RB、BCL2A1、TNFRSF10C、PTAFR、KCNE3、LAMP2、TLR4、TYROBP、SLAMF7、CX3CR1、KLRC4和CD8A中的至少两个标志物的定量表达数据;以及使用解释函数确定评分的程序代码,其中所述评分预测受试者的CAD。
[0035] 本发明还描述一种用于预测受试者的CAD的方法,包括:从受试者获得样品,其中所述样品包括多个分析物;将所述样品与试剂接触;产生所述试剂和所述多个分析物的多个复合物;检测该多个复合物以获得与所述样品相关的数据集,其中所述数据集包括选自AF161365、HNRPF、ACBD5、TFCP2、DDX18、AF289562、CD248、CD79B、CD19、SPIB、BLK、CD3D、LCK、TMC8、CCT2、S100A12、MMP9、CLEC4E、ALOX5AP、S100A8、NAMPT、RPL28、SSRP1、AQP9、GLT1D1、NCF4、NCF2、CASP5、H3F3B、IL18RAP、TXN、TNFAIP6、PLAUR、IL8RB、BCL2A1、TNFRSF10C、PTAFR、KCNE3、LAMP2、TLR4、TYROBP、SLAMF7、CX3CR1、KLRC4和CD8A中的至少两个标志物的定量表达数据;以及使用解释函数从所述数据集确定评分,其中所述评分预测受试者的CAD。
[0036] 本发明还描述一种用于预测受试者的CAD的试剂盒,包括:一组试剂,其包括用于从受试者获得的样品测定选自AF161365、HNRPF、ACBD5、TFCP2、DDX18、AF289562、CD248、CD79B、CD19、SPIB、BLK、CD3D、LCK、TMC8、CCT2、S100A12、MMP9、CLEC4E、ALOX5AP、S100A8、NAMPT、RPL28、SSRP1、AQP9、GLT1D1、NCF4、NCF2、CASP5、H3F3B、IL18RAP、TXN、TNFAIP6、PLAUR、IL8RB、BCL2A1、TNFRSF10C、PTAFR、KCNE3、LAMP2、TLR4、TYROBP、SLAMF7、CX3CR1、KLRC4和CD8A中至少两个标志物的定量表达数据的多个试剂;以及使用所述多个试剂从所述样品测定定量数据的说明书,其中所述说明书包括所述数据集确定评分的说明,其中所述评分预测受试者的CAD。
[0037] 附图简述
[0038] 结合下面的描述以及附图,本发明的这些和其它特征、方面和优点将变得更好理解,其中:
[0039] 图1-基因发现、算法开发以及验证患者和逻辑流程示意图。最初的基因发现(CATHGEN储库)包括糖尿病和非糖尿病患者。来自Personalized Risk Evaluation and Diagnosis in the Coronary Tree(PREDICT)的基因发现涉及配对的微阵列分析中的非糖尿病患者,其产生与来自CATHGEN阵列的那些共同的655个重要基因。对于RT-PCR,选择113个基因并在640个PREDICT患者样品上测试,由其衍生并定最终的算法,然后在PREDICT验证群组(N=526)中进行验证。
[0040] 图2-来自CATHGEN微阵列分析的糖尿病对非糖尿病重要基因的RT-PCR分析。示出了选自非糖尿病(ND)和糖尿病(D)患者中的CATHGEN微阵列群组的单个基因的重要性。对来自各个子集中CAD逻辑回归分析的性别/年龄调节的P值绘图(对数标度)。显著性P值(<0.05)以红色指示基因符号(左上四分之一和右下四分之一),非显著性的P值以黑色示出(右上四分之一)。
[0041] 图3-微阵列的维恩图、RT-PCR和算法基因源。鉴别了总计7718个基因,2438个和5935个分别来自CATHGEN和PREDICT微阵列分析,具有655个基因的交叉。对于113个RT-PCR基因,52个来自PREDICT,22个来自CATHGEN,29个来自两者;10个是标准化的基因7
或者来自早先的研究 。最终的算法包含20个信息基因:10个同时来自两项微阵列研究,8个单独来自PREDICT,2个单独来自CATHGEN。
[0042] 图4-PREDICT算法开发群组中测量的113个PCR基因的PCR基因表达对淋巴细胞部分(y-轴)和嗜中性粒细胞部分(x-轴)的相关性。相关性的范围最高至0.6,总共42个基因与嗜中性粒细胞部分以>0.2相关,而在相同阈值下39个基因与淋巴细胞计数相关。使用表2中的编号方案识别基因。
[0043] 图5-算法结构和基因的示意图。所述算法包括男性和女性的基因表达函数与对于前者的性别特异性线性年龄函数和对于后者的非线性年龄函数的重叠。对于所述基因表达成分,4个项目中的16/23个基因与性别无关:项目1-嗜中性粒细胞激活和凋亡;项目3-NK细胞活化对T细胞比率;项目4,B对T细胞比率;以及项目5-对TFCP2和HNRPF标准化的AF289562表达。此外,项目2由3个与性别无关的嗜中性粒细胞/先天免疫基因(S100A8、S100A12、CLEC4E)组成,其对于女性的整体嗜中性粒细胞基因表达(AQP9、NCF4)标准化及对于男性的RPL28(淋巴细胞)标准化。最终的男性特异性项目是TSPAN16的标准化表达。
算法评分定义为1.821-.755×项目1-.406×项目3-.308×项目2×性别-.137×项目
4-.548×项目2×(1-性别)-.246×项目5-.481×项目6×性别+.851×性别+.045×
性别×年龄+.123×(1-性别)×max(0,年龄-55),其中性别表示为0/1的性别指示,0=女性、1=男性,年龄以年表示,并如所述的进行计算(下文的方法部分)。
[0044] 图6-交叉验证估计和独立验证之间的算法性能的比较。相对于0.50的AUC(点线),示出了所述算法的交叉验证(虚线)和独立验证(实线)的ROC曲线。95%的置信区间由实心区表示。AUC值为:对于交叉验证为0.77(95%CI,0.73-0.81),对于独立验证群-16组为0.70(95%CI,0.65-0.75,p=10 )。
[0045] 图7-来自用于算法开发和验证的PREDICT试验的患者的分配。在总共1569个符合该研究的选择/排除标准的受试者中,226个用于基因发现。如所示的,剩余的1343个分成用于算法开发(694)和验证(649)的独立群组;在这些群组中94%的患者来自相同的中心。对于算法开发,使用总共640个患者样品;由于不完全数据(Diamond GA,Forrester JS.Analysis of probability as an aid in the clinical diagnosis of coronary-artery disease.N Engl J Med.1979;300(24):1350-8.),不充足的血量(Stangl V,Witzel V,Baumann G,Stangl K.Current diagnostic concepts to detect coronary artery disease in women.Eur Heart J.2008;29(6):707-17.),实验和临床记录之间的性别失配(Gibbons RJ,Abrams J,Chatterjee K,等人ACC/AHA 2002 guideline update for the management of patients with chronic stableangina--summary article:a report of the Ametican College of Cardiology/American Heart Association Task Force on practice guidelines(Committee on the Management of Patients With Chronic StableAngina).JAm Coll Cardiol.2003;41(1):159-68.),或者统计离群值评估(Cook NR,Ridker PM.Advances in measuring the effect of individual predictors of cardiovascular risk:the role of reclassification measures.Ann Intern Med.2009;150(11):795-802.),54个被排除。对于验证群组,基于不充足的血量或RNA产量(43)、基因组DNA的严重污染(78)或者指定前的统计离群值评估(2),总共123个样品被排除。
[0046] 图8-用于诊断的净效益曲线,随阈概率pt变化,其表示假阳性和假阴性之间的折中。所述曲线定量在pt的可能值的范围上的所述净效益,按照评分>pt=阳性的决策规则。参考线反映a)所有阳性受试者(较低曲线)或b)所有阴性受试者(净效益=0的线)的净效益。所述基因表达算法的净效益曲线显示为顶部曲线,且在临床相关pt范围上比任一参考线更大。
[0047] 图9-算法和临床变量的验证群组性能的ROC分析。算法性能通过Diamond-Forrester增加到临床因素。示出了ROC分析中D-F评分和算法评分(重实线)的组合与单独D-F评分(---)的比较。AUC=0.50线(轻实线)示为参考。526个验证群组患者中共计525个具有可用于计算D-F评分的信息。所述两个ROC曲线的AUC为0.721±0.023和0.663±0.025,p=0.003。
[0048] 图10-算法评分对验证群组中%最大狭窄(Maximum Stenosis)的相关性。通过QCA最大%狭窄定量每位患者的疾病程度并分组成5个类别:无可测量的疾病、1-24%、25-49%在≥1血管中、1血管≥50%,以及>1血管≥50%。示出了各组的平均算法评分;
误差棒对应于95%的置信区间。
[0049] 发明详述
[0050] 定义
[0051] 通常,用于权利要求书和说明书中的术语意于解释为具有本领域普通技术人员理解的平常的意义。一些术语定义如下以使得更加清楚。在平常的意义和给出的定义之间冲突的情况下,使用给出的定义。
[0052] 术语“急性冠状动脉综合征”包括所有形式的不稳定的冠状动脉疾病。
[0053] 术语“冠状动脉疾病”或“CAD”包括所有形式的影响冠状动脉的动脉粥样硬化疾病。
[0054] 术语“Ct”是指周期阈值并被定义为其中荧光值高于设定阈值的PCR循环数。因此,低Ct值对应高平的表达,而高Ct值对应低水平的表达。
[0055] 术语“Cp”是指交叉点并被定义为实时PCR仪器(例如,如LightCycler)中标准的扩增曲线对数-线性部分的最佳拟合和所述噪声频带(根据背景荧光测量设定)的交叉。
[0056] 术语“FDR”表示错误发现率。FDR可以通过在给定的P值阈值下分析随机改变序列的数据集和对基因的平均数制表来估计。
[0057] 术语“GL”、“GM”和“GU”分别指算法开发数据集中该基因的第1百分位数、中位数和第99百分位数的Cp。
[0058] 术语“标志物”或“多个标志物”包括但不限于脂质、脂蛋白、蛋白质、细胞因子、趋化因子、生长因子、肽、核酸、基因和寡核苷酸、以及它们的相关复合物、代谢产物、突变、变异体、多态性、修饰、片段、亚单元、降解产物、元件和其它分析物或样品产生的测量。标志物还可以包括突变蛋白质、突变核酸、拷贝数的变异和/或转录物变异体,在其中这些突变、拷贝数的变异和/或转录物变异体用于产生预测模型,或者用在使用相关标志物(例如,所述蛋白或核酸的非突变形式、替代转录物等)开发的预测模型的情况下。
[0059] 术语“高度相关的基因表达”或“高度相关的标志物表达”指的是基因或标志物表达值,其具有足够的相关度以允许它们在冠状动脉疾病的预测模型中互换使用。例如,如果具有表达值X的基因x用于构建预测模型,具有表达值Y的高度相关的基因y可以以对于本领域普通技术人员来说显而易见以及有益于本申请的直接方式代入所述预测模型中。假定基因x和y的表达值之间为近似线性的关系,由此Y=a+bX,那么X可以被代入具有(Y-a)/b的预测模型中。对于非线性相关性,可以使用相似的数学转换,有效地将基因y的表达值转化成基因x的相应的表达值。术语“高度相关的标志物”或“高度相关的替代标志物”指的是可以基于例如上述标准被代入和/或添加到预测模型中的标志物。高度相关的标志物可以以至少两种方式使用:(1)通过高度相关的标志物替换最初标志物并产生用于预测CAD风险的新模型;或者(2)通过高度相关的标志物替换用于预测CAD风险的现有模型中的最初标志物。
[0060] 术语“哺乳动物”包括人类和非人类,且包括但不限于人类、非人类的灵长类、犬科动物、猫科动物、鼠科动物、和猪。
[0061] 术语“元基因(metagene)”指的是它们的表达值组合以产生单一值的一组基因,该单一值可以用作预测模型中的成分(Brunet,J.P.,等人Proc.Natl.Acad.Sciences 2004;101(12):4164-9)。
[0062] 术语“心肌梗死”指的是缺血性心肌坏死。这通常是流向心肌(心脏的肌肉组织)段的冠状动脉血流量突然降低的结果。心肌梗死可以分类为ST-段抬高型和非ST-段抬高型MI(也称作不稳定型心绞痛)。心肌坏死引起任一类别。ST-段抬高型或非ST-段抬高型类别的心肌梗死是不稳定形式的动脉粥样硬化性心血管疾病
[0063] 术语“样品”可以包括来自受试者的单细胞或多细胞或细胞的片段或体液等分试样,通过包括静脉穿刺术、排泄、射精、按摩、活组织检查、针吸取、灌洗样品、擦拭、外科切口或介入的方法或其它本领域已知的方法。
[0064] 术语“受试者”包括细胞、组织或有机体,人类或非人类,不论体内、活体外或者体外,男性或女性。
[0065] 术语“获得与样品有关的数据集”包括获得一组从至少一个样品测定的数据。获得数据集包括获得样品,以及处理所述样品以实验测定所述数据。所述词语还包括接收一组数据,例如从已处理所述样品以实验测定所述数据集的第三方。此外,所述词语包括来自至少一个数据集或至少一个出版物或数据集和出版物的结合的挖掘数据。数据集可以由本领域的技术人员通过多种包括存储在存储器上的已知方法获得。
[0066] 术语“临床因素”指的是受试者的状况的测量,例如疾病活跃度或严重度。“临床因素”包括受试者健康状况的所有标志物,包括受试者的非样品标志物和/或其它特征,例如但不限于年龄和性别。临床因素可以是从来自受试者或测定条件下的受试者的样品(或样品群)的评估获得的评分、数值或数值组。临床因素还可以通过标志物和/或其它参数(例如基因表达替代)预测。
[0067] 必须注意的是,本说明书和所附的权利要求中使用的,单数形式“一个”、“一种”或“该”包括复数指代,除非上下文清楚地指出其它情况。
[0068] 方法
[0069] 标志物和临床因素
[0070] 本发明的一个或多个标志物的量可以表示为值。值可以是在一定条件下评估样品获得的一个或多个数值。所述值可以例如通过在实验室中进行的测定从样品实验地获得测量结果,或者可选择地从例如实验室的服务提供者,或者从数据库或数据集存储于其上(例如,在存储器上)的服务器获得。
[0071] 在一个实施方式中,一个或多个标志物的量可以是一个或多个与下述的表达水平有关的数值:AF161365、HNRPF、ACBD5、TFCP2、DDX18、AF289562、CD248、HNRPF、ACBD5、TFCP2、DDX18、CD79B、CD19、SPIB、BLK、CD3D、LCK、TMC8、CCT2、S100A12、MMP9、CLEC4E、ALOX5AP、S100A8、NAMPT、RPL28、SSRP1、S100A12、MMP9、CLEC4E、ALOX5AP、S100A8、NAMPT、AQP9、GLT1D1、NCF4、NCF2、CASP5、H3F3B、IL18RAP、TXN、TNFAIP6、PLAUR、IL8RB、BCL2A1、TNFRSF10C、PTAFR、KCNE3、LAMP2、TLR4、TYROBP、SLAMF7、CX3CR1、KLRC4、CD8A、CD3D、LCK、TMC8或CCT2;从一定条件下样品的评估获得。根据Human Genome Organisation(HUGO)Gene Nomenclature Committee(HGNC)提供的指南,该命名法用于指人类基因。进一步的关于各人类基因的信息(例如登录号和别名)可以通过在HGNC Search genenames.org网站上的检索页面中输入所述基因的名字来查找。例如,在2010年6月1日将术语“CD3D”输入到HGNC网站的简单检索域中得到CD3D的核准的基因名(CD3d分子,δ(CD3-TCR复合物)),CD3D的序列登录号ID(X01451;NM_000732),以及CD3D的以前的代号(T3D)。进一步的人类基因名称提供在下面的实施例部分中。
[0072] 在一个实施方式中,一定条件可以包括一个临床因素或多个临床因素。在一个实施方式中,临床因素可以包括在数据集中。数据集可以包括一个或更多、两个或更多、三个或更多、四个或更多、五个或更多、六个或更多、七个或更多、八个或更多、九个或更多、十个或更多、十一个或更多、十二个或更多、十三个或更多、十四个或更多、十五个或更多、十六个或更多、十七个或更多、十八个或更多、十九个或更多、二十个或更多、二十一个或更多、二十二个或更多、二十三个或更多、二十四个或更多、二十五个或更多、二十六个或更多、二十七个或更多、二十八个或更多、二十九个或更多或者三十个或更多重叠的或不同的临床因素。临床因素可以是例如受试者处于疾病存在或不存在情况下的状况。可选择地,或者另外地,临床因素可以是受试者的健康状态。可选择地,或者另外地,临床因素可以是年龄、性别、胸痛类型、嗜中性粒细胞计数、种族、疾病持续时间、舒张血压、收缩血压、家族史参数、医疗史参数、医学症状参数、身高、体重、人体质量指数、静息心率以及吸烟者/非吸烟者状态。临床因素可以包括是否所述受试者有稳定的胸痛,是否所述受试者有典型的心绞痛,是否所述受试者有非典型的心绞痛,是否所述受试者有心绞痛等同症状,是否所述受试者之前被诊断有MI,是否所述受试者已经接受过血管重建过程,是否所述受试者患有糖尿病,是否所述受试者具有炎症状况,是否所述受试者具有传染性状况,是否所述受试者正在服用类固醇,是否所述受试者正在服用免疫抑制剂和/或是否所述受试者正在服用化学治疗剂。其它的临床因素的实例列于表和附图中。
[0073] 在一个实施方式中,标志物的相关值可以包括在与从受试者获得的样品有关的数据集中。数据集可以包括两个或更多、三个或更多、四个或更多、五个或更多、六个或更多、七个或更多、八个或更多、九个或更多、十个或更多、十一个或更多、十二个或更多、十三个或更多、十四个或更多、十五个或更多、十六个或更多、十七个或更多、十八个或更多、十九个或更多、二十个或更多、二十一个或更多、二十二个或更多、二十三个或更多、二十四个或更多、二十五个或更多、二十六个或更多、二十七个或更多、二十八个或更多、二十九个或更多或者三十个或更多标志物的标志物表达值。例如,数据集可以包括AF161365、HNRPF、ACBD5;AF161365、HNRPF;或者AF161365、ACBD5的表达值。其它组合更加详细地描述在下面的实施例部分中。
[0074] 在一个实施方式中,一个或更多标志物可以分成项目。项目可以包括一个标志物,但是通常包括三个或更多标志物。项目可以包括在与从受试者获得的样品有关的数据集中。所述数据集可以包括一个或更多项目、两个或更多项目、三个或更多项目、四个或更多项目、五个或更多项目、六个或更多项目、七个或更多项目、八个或更多项目、九个或更多项目、或者十个或更多项目。在一个实施方式中,项目可以包括一个或更多、两个或更多、三个或更多、四个或更多、五个或更多、六个或更多、七个或更多、八个或更多、九个或更多、十个或更多、十一个或更多、十二个或更多、十三个或更多、十四个或更多、十五个或更多、十六个或更多、十七个或更多、十八个或更多、十九个或更多、二十个或更多、二十一个或更多、二十二个或更多、二十三个或更多、二十四个或更多、二十五个或更多、二十六个或更多、二十七个或更多、二十八个或更多、二十九个或更多或者三十个或更多标志物。在一个实施方式中,所述标志物分成7个不同的项目:项目1、项目2、项目3、项目4、项目5、项目6和项目7。在一个实施方式中,项目1可以包括标志物1、标志物2和标志物3,其中标志物1包括AF161365,其中标志物2包括HNRPF或ACBD5,和其中标志物3包括TFCP2或DDX18。在一个实施方式中,项目2可以包括标志物4、标志物5和标志物6,其中标志物4包括AF289562或CD248,其中标志物5包括HNRPF或ACBD5,和其中标志物6包括TFCP2或DDX18。在一个实施方式中,项目3可以包括标志物7、标志物8、标志物9和标志物10,其中标志物7包括CD79B或CD19,其中标志物8包括SPIB或BLK,其中标志物9包括CD3D或LCK,和其中标志物10包括TMC8或CCT2。在一个实施方式中,项目4可以包括标志物11、标志物12、标志物13和标志物14,其中标志物11包括S100A12或MMP9,其中标志物12包括CLEC4E或ALOX5AP,其中标志物13包括S100A8或NAMPT,和其中标志物14包括RPL28或SSRP1。在一个实施方式中,项目5可以包括标志物15、标志物16、标志物17、标志物18和标志物19,其中标志物15包括S100A12或MMP9,其中标志物16包括CLEC4E或ALOX5AP,其中标志物17包括S100A8或NAMPT,其中标志物18包括AQP9或GLT1D1,和其中标志物19包括NCF4或NCF2。在一个实施方式中,项目6可以包括标志物20、标志物21、标志物22、标志物23、标志物24、标志物25和标志物26,其中标志物20包括CASP5或H3F3B,其中标志物21包括IL18RAP或TXN,其中标志物22包括TNFAIP6或PLAUR,其中标志物23包括IL8RB或BCL2A1,其中标志物24包括TNFRSF10C或PTAFR,其中标志物25包括KCNE3或LAMP2,和其中标志物26包括TLR4或TYROBP。在一个实施方式中,项目7可以包括标志物27、标志物28、标志物29和标志物30,其中标志物27包括SLAMF7或CX3CR1,其中标志物28包括KLRC4或CD8A,其中标志物29包括CD3D或LCK,和其中标志物30包括TMC8或CCT2。
[0075] 在另一实施方式中,本发明包括获得与受试者有关的样品,其中所述样品包括一个或多个标志物。所述样品可以由所述受试者或由第三方(例如,医学专业人员)获得。医学专业人员的实例包括内科医师、急救医学技术人员、护士、第一急救者、心理学家、医学物理学人员、开业护士、外科医生、牙科医生以及本领域技术人员已知的任何其他明显的医学专业人员。样品可以包括外周血细胞、分离的白细胞或者从外周血细胞或分离白细胞提取的RNA。所述样品可以从任何体液获得,例如,羊水、眼房水、胆汁、淋巴、乳汁、细胞间液、血液、血浆、耵聍(垢)、Cowper液体(射精前液体)、乳糜、食糜、女性射出液、月经、粘液、唾液、尿、呕吐物、眼泪、引道润滑液、汗液、血清、精液、皮脂、脓汁、胸膜液、脑脊液、滑液、细胞内液和玻璃状液。在一个实例中,所述样品从抽取的血液获得,其中所述医学专业人员从受试者抽取血液,例如通过注射器。然后可以检测所述体液以使用分析测定一个或多个标志物的值。然后所述一个或多个标志物的值可以由相同的一方使用本发明的方法进行评估,或者发送给第三方使用本发明的方法进行评估。
[0076] 解释函数
[0077] 在一个实施方式中,解释函数可以是预测模型产生的功能。解释函数还可以由多个预测模型产生。在一个实施方式中,解释函数可以包括项目Norm1、Norm2、NKup、Tcell、Bcell、Neut、Nup、Ndown、SCA1、AF2、TSPAN、SEX和INTERCEPT。在相关的实施方式中,Norm1= RPL28、Norm2 = (.5×HNRPF+.5×TFCP2)、NKup = (.5×SLAMF7+.5×KLRC4)、Tcell =(.5×CD3D+.5×TMC8)、Bcell=(2/3×CD79B+1/3×SPIB)、Neut=(.5×AQP9+.5×NCF4)、Nup = (1/3×CASP5+1/3×IL18RAP+1/3×TNFAIP6)、Ndown = (.25×IL8RB+.25×TNFRSF10C+.25×TLR4+.25×KCNE3)、SCA1 = (1/3×S100A12+1/3×CLEC4E+1/3×S100A8)、AF2=AF289562.如果(AF161365-Norm2>6.27或AF161365=NoCall)TSPAN=1、否 则
=0、对于男性SEX=1,对于女性=0。在相关的实施方式中,对于男性,INTERCEPT=Intercept+SEX+MAGE×Age,年龄以年表示,对于女性,INTERCEPT=截距+OFAGE2×max(0,Age-60),年龄以年表示。在相关的实施方式中,系数截距=1.82120871、SEX=0.851181、OFAGE2 = 0.123283、MAGE = 0.044868、TSPAN = -0.48182、AF2 = --0.24592、Bcell= -0.13717、SCA1M= -0.30754、NeutF = -0.54778、Nupdown = -0.75514,以 及 NK=-0.40579。在相关的实施方式中,评分根据INTERCEPT-Nupdown×(Nup-Ndown)-NK×(NKup-Tcell)-SCA1M×SEX×(SCA1-Norm1)-Bcell×(Bcell-Tcell)-NeutF×(1-SEX)×(SCA1-Neut)-TSPANcoef×SEX×(TSPAN)-AF2×(AF2-Norm2)进行测定。在一个实施方式中,解释函数可以包括任何年龄、性别(例如,性)以及一个或多个项目的线性组合。
[0078] 在一个实施方式中,预测模型可以包括偏最小二乘法模型、逻辑回归模型、线性回归模型、线性判别分析模型、岭回归模型和基于树的递归分割模型。在一个实施方式中,预测模型还可以包括支持向量机、二次判别分析或LASSO回归模型。参见Elements of Statistical Learning,Springer 2003,Hastie,Tibshirani,Friedman;对于全部目的,其全部内容通过引用的方式并入到本申请中。预测模型性能的特征可以由曲线下面积(AUC)表征。在一个实施方式中,预测模型性能的特征是AUC为0.68-0.70。在一个实施方式中,预测模型性能的特征是AUC为0.70-0.79。在一个实施方式中,预测模型性能的特征是AUC为0.80-0.89。在一个实施方式中,所述预测模型性能的特征是AUC为0.90-0.99。
[0079] 分析
[0080] 用于一个或多个标志物的分析的实例包括DNA分析、微阵列、聚合酶链反应(PCR)、RT-PCR、Southern印迹法、Northern印迹法、抗体结合分析、酶联免疫吸附分析(ELISA)、流式细胞分析、蛋白质分析、Western印迹法、浊度测定法、比浊法、色谱法、质谱法、免疫分析,包括(仅为举例,但不限于)RIA、免疫荧光、免疫化学发光、免疫电化学发光或竞争免疫分析、免疫沉淀以及下面的实施例部分中描述的分析。来自所述分析的信息可以是定量的并发送到本发明的计算机系统。所述信息还可以是定性的,例如观察模式或荧光,其可以由用户或者由阅读仪或计算机系统自动地翻译成定量的测量结果。在一个实施例中,所述受试者还可以给计算机系统提供分析信息以外的信息,例如种族、身高、体重、年龄、性别、眼色、毛发颜色、家族医疗史和可以对于用户有用的任何其它信息,例如上述的临床因素。
[0081] 信息标志物组
[0082] 除了本申请中通过名称、登录号或序列确认的特定的、示例性的标志物之外,包括在本发明范围内的是所有可操作的CAD的预测模型和使用它们评分及任选地使用与示例序列具有至少90%或至少95%或至少97%或更大的同一性的变体序列或者与示例基因或序列编码的蛋白质具有至少90%或至少95%或至少97%或更大的同一性的该编码蛋白的表达值对样品分类的方法。序列同一性的百分数可以使用本领域普通技术人员公知的算法确定,包括例如Stephen F.Altschul等人,J.Mol.Biol.215:403-410(1990)中描述的BLASTn和BLASTp,其可在国立卫生研究院维护的National Center for Biotechnology Information网站上获得。根据本发明的实施方式,如下所述的是所有可操作的预测模型及其使用标志物表达测量在评分和任选地对样品分类中使用的方法,除该示例标志物表达值之外或者替代该示例标志物表达值,所述标志物表达测量现在已知或随后被发现与该示例标志物表达值的表达高度相关。为了本发明的目的,这些高度相关基因包括在要求保护的发明的文字范围之内或者可选择地作为示例性标志物的等效物包括在内。具有与示例性标志物的表达值高度相关的表达值的标志物的鉴别,以及使用它们作为预测模型的成分在本领域普通技术人员的技术水平内。下面的实施例部分提供了多个用于鉴别高度相关的标志物并在CAD的预测模型中用它们替代算法标志物的方法以及使用它们评分和任选地给样品分类的方法的实施例。
[0083] 计算机实现
[0084] 在一个实施方式中,计算机包括至少一个与芯片组偶联的处理器。与所述芯片组偶联的还有内存、存储设备、键盘、图形适配器、定点设备和网络适配器。显示器与所述图形适配器偶联。在一个实施方式中,所述芯片组的功能性是由存储控制器集线器和I/O控制器集线器提供。在另一实施方式中,所述内存与所述处理器直接偶联而不是所述芯片组偶联。
[0085] 所述存储设备是任何能够保持数据的设备,像硬盘驱动器、光盘只读存储器(CD-ROM)、DVD或固态存储设备。所述内存保持所述处理器使用的指令和数据。所述定点设备可以是鼠标轨迹球或其它类型的定点设备,并与将数据输入到所述计算机系统的键盘组合使用。所述图形适配器在所述显示器上显示影像和其它信息。所述网络适配器将所述计算机系统偶联到局域网或广域网。
[0086] 如本领域已知的,除了先前描述的那些之外,计算机可以具有不同和/或其它组件。此外,所述计算机可以缺少某些组件。而且,所述存储设备可以处于所述计算机本地和/或是远程的(例如体现在存储域网(SAN)内)。
[0087] 如本领域已知的,计算机适合执行计算机程序以提供此处描述的功能。此处使用的术语“模块”指的是用于提供指定功能的计算机程序逻辑。因此,模块可以在硬件固件和/或软件内实现。在一个实施方式中,程序模块存储在存储设备上,载入内存中,并由处理器执行。
[0088] 在两个或更多核酸或多肽序列的情况下,术语百分“同一性”指的是当比较和比对以获得最大对应时具有指定百分数的相同核苷酸或基酸残基的两个或更多序列或子序列,如使用下面描述的序列比较算法的一种(例如,技术人员可获得的BLASTP和BLASTN或其它算法)或通过目测检查所测量的。取决于应用,所述百分“同一性”可以存在于进行比较的序列的区域,例如,在功能域上,或者可选择地,存在于待进行比较的两个序列的全长上。
[0089] 对于序列比较,通常一个序列充当测试序列与其进行比较的参比序列。当使用序列比较算法时,将测试和参比序列输入计算机,需要时指定子序列坐标,以及指定序列算法程序参数。然后在所述指定的程序参数基础上,所述序列比较算法计算所述测试序列相对于所述参比序列的百分序列同一性。
[0090] 用于比较的序列的最佳以对可以例如通过Smith&Waterman,Adv.Appl.Math.2:482(1981)的局部同源算法,通过Needleman&Wunsch,J.Mol.Biol.48:443(1970)的同源比对算法,通过Pearson&Lipman,Proc.Nat′l.Acad.Sci.USA 85:2444(1988)的相似性检索方法,通过这些算法(GAP,BESTFIT,FASTA和TFASTA,在Wisconsin Genetics Software Package中,Genetics Computer Group,575Science Dr.,Madison,Wis.)的计算机化实施,或者通过目测检查(一般地参见Ausubel等人,见下文)进行。
[0091] 一个适合测定百分序列同一性和序列相似性的算法的实例是BLAST算法,其描述在Altschul等人,J.Mol.Biol.215:403-410(1990)中。进行BLAST分析的软件可以通过National Center for Biotechnology Information而公开获得。
[0092] 此处描述的对象的实施方式除了此处描述的之外可以包括其它和/或不同模块。此外,构成所述模块的功能可以通过其它实施方式中的其它或不同的模块进行。此外,为了清楚和方便的目的,本说明书偶尔省略了术语“模块”。
实施例
[0093] 下面是用于实施本发明的具体实施方式的实例。提供所述实施例仅用于说明的目的,而不意图以任何方式限制本发明的范围。关于使用的数字(例如,数量、温度等),已努确保其准确性,但是当然应当允许一些实验误差和偏差。
[0094] 除非另有说明,本发明的实践将使用本领域技术内的蛋白质化学、生物化学、重组DNA技术和药理学的常规方法。这些技术在文献中被充分地解释。参见,例如 T.E.Creighton,Proteins:Structures and Molecular Properties(W.H.Freeman and Company,1993);A.L.Lehninger,Biochemistry(Worth Publishers,Inc.,current addition);Sambrook 等 人,Molecular Cloning:A Laboratory Manual(2nd Edition,1989);Methods In Enzymology(S.Colowick and N.Kaplan eds.,Academic Press,Inc.);Remington′s Pharmaceutical Sciences,18th Edition(Easton,Pennsylvania:
Mack Publishing Company,1990);Carey和Sundberg Advanced Organic Chemistry 3rd Ed.(Plenum Press)Vols A和B(1992)。
[0095] 材料和方法
[0096] 一般研究设计
[0097] 总体的研究设计示于图1中。该研究有四个独立的、连续的阶段。PREDICT临床试验注册信息可以在2010年5月28日以NCT00500617在clinicaltrials.gov网站上获得。
[0098] 阶段1-CATHGEN发现
[0099] 阶段1是来自Duke University CATHGEN登记的Initial Gene Discovery,一种11
追溯性血液储存库 。简言之,在2004年8月和2005年11月间将该储存库的198位受试者(88个病例,110个对照)纳入研究中。临床入组和排除标准如前所述,并包括糖尿病和
7
非糖尿病患者 。所有CATHGEN患者给予书面知情同意书,且研究方案由Duke University IRB批准。进行微阵列来鉴别CAD敏感基因,选择亚组基因用于RT-PCR复制。假定阶段I的发现的情况下,随后仅包括非糖尿病受试者。
[0100] 阶段II-预测发现
[0101] 阶段2是使用来自PREDICT研究的受试者的预期基因发现阶段,其中198位患者(99个病例:对照对,年龄和性别匹配)经过微阵列分析以鉴别差异表达的基因。
[0102] 阶段III-预测开发
[0103] 阶段3是使用640位患者(210个病例,430个对照)进行的预期算法开发以确定临床因素、血细胞计数、基因表达和CAD之间的相关性。
[0104] 阶段IV-预测验证
[0105] 阶段III完成之后,在526位患者的独立群组(192个病例,334个对照)中预测性地验证锁定的算法。
[0106] 来自PREDICT的受试者是合格的,如果他们具有胸痛的历史、可疑的心绞痛等同症状、或者没有已知MI、血管重建或CAD情况下的CAD高风险。已经描述了详细的入组/排12
除标准 。糖尿病状态通过临床鉴别、血糖(非禁食≥200或禁食≥126)、rorhemoglobin A1c(≥6.5)或糖尿病医学描述定义。从所有患者获得具有差别的全血计数。PREDICT患者给予书面知情同意书,研究方案由Westem Institutional Review Board批准。
[0107] 血液收集、RNA纯化和RT-PCR
[0108] 冠状血管造影术之前,根据制造商的说明将全血样品收集在 管中,然后在-20℃冷冻。对于CATHGEN样品,如所述的(PreAnalytix,Franklin Lakes,NJ)纯化RNA,接着定量分析(Ribogreen,Molecular Probes,Eugene,OR)。对于PREDICT样品,使用Agencourt RNAdvance系统的自动化方法。微阵列样品加标签并使用制造商的方案与41K Human Whole Genome Array(Agilent,PN#G4112A)杂交。对于PREDICT微阵列,所有匹配的对加标签并一起杂交以使得微阵列批效应最小化。微阵列数据集保留在GEO(GSE
20686)。
[0109] 如前所述进行扩增子设计、cDNA合成和RT-PCR7,12。所有PCR反应重复三次进行并将中值用于分析。引物和探针示于下面的非正式序列表中。标志物CD3D的引物和探针从Applied Biosystems,Inc.商购获得(Assay ID:Hs00174158_m1;Part No.4331182)。
[0110] 用于细胞类型特异性基因表达测量的全血细胞的分级分离
[0111] 对EDTA管中收集的新鲜血进行细胞分级分离。将合并自四个不同供体的120ml血液按照1∶1用1X PBS稀释。T细胞、B细胞、NK细胞和单核细胞分级分离之前,15%的血液用于通过密度离心法的粒细胞分离,85%的血液用于PBMC分离。
[0112] 外周血单核细胞(PBMC)分离
[0113] 通过密度离心法分离PBMC。在50ml圆锥管中,将20ml稀释血液在20mlHistopaque 1077(Sigma Cat No.10771)上成层,并在室温下以400Xg离心30分钟。将PBMC层小心地吸入到新试管中并用1X的磷酸缓冲盐水(PBS)洗涤两次,以200Xg离心10分钟。将洗过的PBMC再次悬浮在冷的缓冲液1(1X PBS,0.1%BSA和2mM EDTA)中并存储在中。5%的细胞在RLT缓冲液(Qiagen RNeasy Mini kit,Cat No.74104)中溶解用于预选RNA分离。
[0114] 粒细胞分离
[0115] 使用两种不同的密度介质通过密度离心法纯化粒细胞(嗜中性粒细胞、嗜酸性粒细胞、嗜性粒细胞)。在15ml的圆锥管中,将3mlHisopaque 1077在3ml Histopaque1119(Sigma Cat No.11191)上成层,然后将6ml的稀释血液在Histopaque 1077上成层。
将所述试管在室温(RT)下以700Xg离心30分钟。然后将粒细胞层吸入新试管中并洗涤两次。将细胞团再次悬浮在RLT缓冲液中用于粒细胞RNA分离。
[0116] 使用磁珠的阳性细胞分离
[0117] 后续的细胞类型(T细胞、B细胞、天然杀伤(NK)细胞、单核细胞)从PBMC阳性选择,使用下述试剂和推荐方法。
[0118] CD8+T细胞- CD8阳性分离试剂盒(Invitrogen Cat.No.113.33D)
[0119] CD3+T细胞- CD3(Invitrogen Cat.No.111.51D)
[0120] CD19+B细胞- CD19 pan B(Invitrogen Cat.No.111.43D)
[0121] CD14+单核细胞- CD14(单核细胞/巨噬细胞)(Invitrogen Cat.No.111.49D)
[0122] CD56+NK细胞- Pan Mouse IgG(Invitrogen Cat.No.110.41),与小鼠抗人CD56抗体(BD bioscience Cat No.556325)交联。
[0123] 简言之,将PBMC与抗体偶联的磁珠在4℃下孵育20分钟并在磁体上用缓冲液1洗涤3次。然后将选择的细胞再次悬浮在RLT缓冲液中用于RNA分离。
[0124] RNA分离
[0125] 按照制造商的说明书,使用Qiagen RNeasy Mini试剂盒纯化RLT缓冲液中的RNA样品。
[0126] 冠状血管造影分析和病例:对照定义
[0127] 所有患者在临床上依赖于血管造影术并在本地、建立方案的基础上进行血管造影。对于CATHGEN患者,临床血管造影解释定义病例为在一个主要血管中≥75%的最大狭窄或者在两个血管中≥50%,且对照为在所有主要血管中<25%狭窄。
[0128] 对于PREDICT患者,中心实验室QCA读数(Cardiovascular Research Foundation New York)用于病例:对照分类。病例在至少一个主要冠状血管中具有≥50%狭窄,而对照在所有主要血管中具有<50%狭窄。
[0129] 基因表达和细胞类型分布之间的相关性
[0130] 与全血计数的相关性和数据库基因表达分析(SymAtlas)用于鉴别高度细胞类型选择基因。此外,在特定细胞部分上进行通过密度离心法或阳性抗体选择的全血细胞分级分离,然后进行RT-PCR。
[0131] 统计方法
[0132] 所有统计学方法使用R软件包进行。所使用的统计方法在下面更详细地描述并指明。
[0133] 阵列标准化
[0134] 将Agilent处理的阵列标准化的信号值放大成100的截尾均值,然后进行log2转化。标准阵列QC度量(目前的百分数、配对的相关性和信号强度)用于质量评估,结果198个CATHGEN中的3个和210个PREDICT中的12个样品被排除。
[0135] 阵列分析
[0136] 对于CATHGEN阵列,逻辑回归(未调整的和性别/年龄调整的)用于评估与病例:对照状态有关的基因表达。对于PREDICT阵列,给定配对设计,使用条件逻辑回归。假发现率用于解释多重比较。GOEAST用于确定基因本体论(GO)项的过度代表性(overrepresentation)。
[0137] 基因选择
[0138] 基于显著性、倍数变化、路径分析和文献支持选择用于RT-PCR的基因。基于基因:基因相关性的层次聚类确保RT-PCR基因代表多个簇。基于低差异、中等至高表达及与病例:对照状态、性别、年龄或细胞计数的非显著关联性选择标准化基因。
[0139] PCR统计分析
[0140] 使用单变量和多变量逻辑回归,评估临床/人口统计因素的CAD关联性。通过稳健逻辑回归(未调整的和性别/年龄调整的)评估与CAD和其它临床/人口统计因素的基因表达关联性。
[0141] 算法开发和验证
[0142] 使用相关性截止值,层次聚类用于给基因分组。基于相关性结构、已知生物学和细胞计数相关性,将簇缩减为元基因(meta-gene)14和标准化基因。对于具有高相关性和相反疾病调节的元基因,定义比率项目(对数标度上的差异)。通过LASSO方法选择与结果独立地相关的元基因,与性别独立地相关的元基因通过变量选择过程中允许的元基因相互作15
用选择 。
[0143] 最终算法使用岭回归拟合16,其中结果变量为病例:对照状态且预测元是LASSO-选择的元基因和性别特异性年龄项。性别是二元预测元,且年龄对于男性、女性>60和女性<60是具有独立斜率的线性预测元。基因表达项罚分基于交叉验证和先前证据。
使用留一法交叉验证估计模型性能。算法性能使用ROC分析作为主要端点在独立患者群组中验证。
[0144] 算法计算和转换
[0145] 数据预处理和QC步骤
[0146] 1)对于各算法基因/样品,计算重复三次的孔的中值
[0147] a.如果一个孔没有调用,采用两个剩余孔的中值
[0148] b.如果两个或三个孔没有调用,所述算法基因对于该样品接受无调用。
[0149] 2)如果AF161365(TSPAN16)接受无调用,输入值38作为该基因的中值
[0150] 3)如果AF161365之外任何算法基因接受无调用,所述样品对于Missing Gene Cp.是无效的。在算法开发中640个样品中没有样品对该度量无效。
[0151] 4)计算所述算法基因SD(不包括AF161365)的中值。如果该值大于.15,所述样品对于High Replicate SD是无效的。
[0152] 5)对于各算法基因i,通过用GLi替换小于GLi的值来为所述CP值打底(floor)。该值表示算法开发集中该基因的Cp的第1百分位数。
[0153] 6)对于各算法基因i,通过用GUi替换大于GUi数值来为所述CP值做顶(ceiling)。该值表示算法开发集中该基因的Cp的第99分位数。
[0154] 7)对于各算法基因i,计算它的CP值和GMi之间差异的绝对值,其中GMi表示算法开发集中该基因的中值Cp。合计算法基因(不包括AF161365)的该值。如果总和大于27.17,所述样品对于Expression Profile Out of Range是无效的。27.17表示所述算法开发集中该度量的最大值。
[0155] 在某些情况下,对于受试者不计算算法评分。其理由包括低 试管血量、实验室QC失败等。虽然这些受试者将不包括在分析组中,但是这些失败的出现频率将被制表。丢失Diamond Forrester评分的受试者将不包括在分析组中。
[0156] 算法计算
[0157] 1)定义Norm1=RPL28
[0158] 2)定义Norm2=(.5×HNRPF+.5×TFCP2)
[0159] 3)定义NKup=(.5×SLAMF7+.5×KLRC4)
[0160] 4)定义Tcell=(.5×CD3D+.5×TMC8)
[0161] 5)定义Bcell=(2/3×CD79B+1/3×SPIB)
[0162] 6)定义Neut=(.5×AQP9+.5×NCF4)
[0163] 7)定义Nup=(1/3×CASP5+1/3×IL18RAP+1/3×TNFAIP6)
[0164] 8)定义Ndown=(.25×IL8RB+.25×TNFRSF10C+.25×TLR4+.25×KCNE3)
[0165] 9)定义SCA1=(1/3×S100A12+1/3×CLEC4E+1/3×S100A8)
[0166] 10)定义AF2=AF289562
[0167] 11)定义TSPAN=1,如果(AF161365-Norm2>6.27或者AF161365=无调用),否则=0
[0168] 12)定义对于男性SEX=1,对于女性=0
[0169] 13)定义截距
[0170] a.对于男性,INTERCEPT=2.672+0.0449×年龄
[0171] b.对于女性,INTERCEPT=1.821+0.123×(年龄-60),如果为负数,则设置为0[0172] 14)定义评分=INTERCEPT-0.755×(Nup-Ndown)-0.406×(NKup-Tcell)-0.308×SEX×(SCA1-Norm1)-0.137×(Bcell-Tcell)-0.548×(1-SEX)×(SCA1-Neut)-0.482×SEX×(TSPAN)-0.246×(AF2-Norm2)
[0173] 评分转换
[0174] 使用原始算法评分进行规定的端点分析。为了临床报告目的以及呈现方便性,原始评分可以转换成如下的具有为了临床使用方便设计的等级的转换评分:
[0175] 输入的是原始评分
[0176] 如果原始评分<-2.95,设置原始分数=-2.95
[0177] 如果原始评分>1.57,设置原始分数=1.57
[0178] 原始评分=2.95+原始分数
[0179] 最终评分=原始分数×40/4.52
[0180] 最终评分向上取整至最接近整数
[0181] 如果最终评分大于40,设置为40
[0182] 如果最终评分小于1,设置为1
[0183] 得到的值为所述最终转换评分
[0184] 评分变异性的估计
[0185] 从大的 血液库测试总共41个重复样品。这些重复的原始评分的标准差为.13。然后给定的原始评分的置信区间为所述原始评分加或减1.96×.13。这些置信区间的上界和下界线性转换为0~40的等级,然后使用上述的似然函数的评分转化为可能性的置信区间。
[0186] 实施例1:人口统计学数据
[0187] 所述CATHGEN注册和PREDICT研究患者群组的基线人口学特征示于表1中。大体上,CAD病例更常见地为男性、年长者、具有较高的SBP,以及更高的血脂异常。
[0188] 实施例2:阶段I:最初基因发现(CATHGEN)
[0189] 在195个受试者病例:对照分析中,总共2438个基因显示显著的CAD关联性(p<0.05)(图1)。基因表达的临床和人口统计学因素分析显示糖尿病为最显著的(p=0.0006,表3)。基于统计显著性和生物学关联,在这些相同的样品上选择88个基因(表4)用于RT-PCR分析。非糖尿病和糖尿病子集(N分别=124和71)中的CAD-基因表达分析分别显示42和12个显著基因(p<0.05),没有交叉(图2)。由此进一步的工作限于非糖尿病患者。
[0190] 我们观察到CATHGEN群组中对于CAD风险的强烈的糖尿病-基因表达相互作用效应,并由此限制算法开发为PREDICT非糖尿病。CATHGEN糖尿病受试者包括多种疾病严重度17
和多种药物治疗,它们中的一些调节基因表达并影响心血管疾病 。
[0191] 实施例3:阶段II:非糖尿病基因发现(PREDICT)
[0192] 210个PREDICT患者样品的微阵列CAD基因发现使用配对的病例:对照试验设计,以减少年龄、性别和微阵列批处理的混杂效应。QC排除后的99个病例:对照对的CAD分析产生5935个显著基因(p<0.05),其中655个基因与所述CATHGEN结果相同(图3,表5)。
[0193] 发现基因的途径分析
[0194] 这655个基因的基因本体论(GO)分析确认189个显著的生物学过程项(p<0.05,表6),主要反映炎症、细胞和应激反应、细胞死亡和细胞凋亡。细胞和分子本体论分别显示32和49项的富集,包括线粒体功能、细胞凋亡蛋白酶激活剂活性和抗原结合。
[0195] 基因选择
[0196] 通过统计显著性、生物学关联以及与CAD和在PREDICT开发群组中通过RT-PCR测量的基因表达的在先关联性选择总计113个基因(表2)。还表示了已知的细胞类型特异性标志物,PREDICT中与细胞计数有关的那些,以及候选标准化基因。
[0197] 实施例4:阶段III:预期的算法开发(PREDICT)
[0198] 算法使用RT-PCR和临床数据从PREDICT开发群组推导。对于CAD:基因表达关联性的最显著临床因素为年龄、性别、胸痛类型和嗜中性粒细胞计数。年龄和性别是CAD的独立风险因素(表1)并显示显著的基因表达相关性。胸痛类型也是显著的独立风险因素(p=0.005),但是与基因表达无关。嗜中性粒细胞计数显著地与113个RT-PCR基因中的93个的表达相关(正相关或负相关),并且与男性的CAD显著相关(p=0.049),但是不与女性的CAD显著相关(p=0.77)。计算所有基因与嗜中性粒细胞和淋巴细胞分数的基因表达相关性(图4)。>0.2的相关性截止值产生39个与淋巴细胞有关的基因和42个与嗜中性粒细胞有关的基因。与嗜中性粒细胞相关的基因同时显示上调和下调CAD状态,而与淋巴细胞有关的基因通常下调。存在嗜中性粒细胞相关基因的显著性别特异性调节(男性40/42基因上调,女性41/42下调),而淋巴细胞基因下调与性别无关。
[0199] 113个PCR基因的层次聚类导致18个相关的簇(表2),在淋巴细胞和嗜中性粒细胞相关基因内具有更精细的相关子结构。存在3个代表T细胞(簇1、2、3)、B细胞(簇3)和NK细胞(簇12)的淋巴细胞亚组。还鉴别出三个嗜中性粒细胞亚组:之前描述的嗜中性粒细胞基因(IL8RB,S100A8,S100A12,TXN,BCL2A1;簇13,16);最近鉴别的上调的嗜中性粒细胞基因(CLEC4E,CASP5,TNFAIP6;簇16)和下调的嗜中性粒细胞基因(KCNE3,TLR4,7
TNFRSF10C;簇13,14)。簇4-11中的29个基因不具有清楚的细胞类型关联性。
[0200] 算法推导
[0201] 基于所述相关性和细胞类型分析,15个元基因和3个标准化基因确定为用于模型变量选择的输入。通过LASSO方法的选择和通过岭回归的加权罚分形成最终的、锁定的算法,包括6个元基因中的20个CAD相关的基因和3个标准化基因(图5)。所述算法评分定义为预测回归模型值。
[0202] 总结
[0203] PCR算法开发集充分地提供动力以研究CAD、临床因素和基因表达之间的关系。对于CAD,最显著的独立临床风险因素是年龄、性别和胸痛类型,CAD可能性
1 12
Diamond-Forrester风险模型的成分 ,支持它用作基准来评估算法性能 。
[0204] 年龄、性别、CAD和基因表达之间的关系是复杂的。年龄增大和男性性别是公知的18,19
CAD的风险因素,其影响循环细胞中的基因表达 。在该研究中通过RT-PCR测定的多数基因与淋巴细胞或嗜中性粒细胞分数相关(图4;r>0.2,分别对于39和42个基因)。嗜
7
中性粒细胞相关组中的基因包括许多我们之前鉴别的(簇6、13、14;表2)。淋巴细胞组基因包括已知在T细胞(CD3,TMC8)、B细胞(SPIB,CD79B)和NK细胞(SLAMF7,KLRC4)中表达的那些(分别为簇1、3和12)。淋巴细胞相关的基因表达以性别独立方式随着CAD减少,
8
这与减少的淋巴细胞计数与增加的心脏血管风险相关的情况一致 。相反,嗜中性粒细胞相关的基因显示在具有CAD的情况下显著的性别特异性表达差别:在男性中,95%的嗜中性粒细胞基因为上调,而在女性中,98%为下调,这与男性中增加的粒细胞计数与更高的CAD
20
风险相关而在女性中具有更小的影响的情况一致 。
[0205] 算法项目的生物学重要性
[0206] 对于所述算法,相关的元基因作为构件块的使用是基因表达细胞类型特异性的重要反映。所述算法基因在包括嗜中性粒细胞、NK细胞、B和T淋巴细胞的多个类型的循环细21 4
胞中选择性表达 ,从而支持动脉粥样硬化中适应性的和天生的免疫反应的作用 。
[0207] 在嗜中性粒细胞中优先表达的算法项目1基因(图5)可以反映嗜中性粒细胞的凋亡,因为半胱天冬酶-5随着CAD增加,而TNFRSF10C(TRAIL的抗细胞凋亡诱饵受体)减22 23
少 。随CAD上调的项目2基因很可能同时反映天生免疫活化(S100A8和S100A12) 和细
24
胞坏死反应(CLEC4E) 。S100A8和S100A12在慢性炎症状态下被上调,或许反映更普通的
25,26
病理生理信号,这在例如类风湿关节炎的病症中与增加的CAD一致 。
[0208] 项目2以性别特异性方式标准化。在男性中,相对RPL28(其在淋巴细胞中强烈表达)的标准化反映嗜中性粒细胞与淋巴细胞的比率,其对于CAD人群的死亡或MI是预兆性的。在女性中,相对于AQP9和NCF4(两个CAD非敏感嗜中性粒细胞基因)的标准化允许评估S100s和CLEC4E的嗜中性粒细胞的上调。
[0209] 项目3由2个NK细胞受体(SLAMF7和KLRC4)组成,其相对于T细胞特异性基27
因(TMC8和CD3D)标准化。SLAMF7可以特异性激活NK细胞功能,同时抑制B和T细胞 。
28
KLRC4也可能涉及NK细胞激活 。NK细胞与小鼠模型和人中的动脉粥样硬化相关,并降低
8,29
与心脏事件有关的淋巴细胞计数 。
[0210] 项目4是B/T细胞比率的基于基因表达的测量。T细胞的作用是复杂的,而B细胞30,31
在小鼠模型中已显示为动脉粥样化保护的 。在该研究中,明显的B细胞特异性基因的上调与CAD相关,也许表明对疾病的免疫应答。最后两项目,基于AF289562(AF2)和TSPAN16,是具有未知功能的基因。
[0211] 实施例5:阶段IV:预期算法验证(PREDICT)
[0212] 在PREDICT开发集中,ROC分析中的估计的交叉验证算法AUC为0.77(95%CI0.73~0.81);在526个患者(192个病例,334个对照)的独立PREDICT验证集中的预期验证产生的AUC为0.70(95%CI=0.65~0.75)(图6)。
[0213] 对于阶段III和IV中的算法开发,我们使用稳健的途径,其通过使用元基因作为14,32
构件块将任何单一基因的效应最小化 。处罚逐步逻辑回归(LASSO)从大大超过候选变量(15个元基因)的数目的640个患者数据集中选择重要的元基因,从而降低过度拟合的可能性。进一步,为了使得单个项目的过度加权最小化,使用岭回归处罚元基因系数。
[0214] 交叉验证模型AUC为0.77(95%CI 0.73至0.81),暗示算法评分是显著的CAD预测元,且验证群组AUC为0.70,具有重叠的置信区间(95%CI=0.65至0.75)。这一适度的减少可以反映过于乐观的交叉验证估计,因为在各迭代中我们没有再次选择项目。
[0215] 因此,使用一系列的微阵列和RT-PCR数据集,包括超过1,500个患者,我们推导并验证算法,由23个基因的表达水平、性别和年龄组成,其评估非糖尿病患者中阻塞性CAD的可能性。
[0216] 实施例6:上述实施例的总结
[0217] 这一研究呈现了基于全血源的RT-PCR的基因表达算法用于评估非糖尿病患者中阻塞性CAD可能性的算法的开发和验证,并包括几个关键发现。第一,区别患有或不患有CAD的糖尿病患者的基因表达模式与用于研究不具有糖尿病的患者的基因表达模式大大不同。在最初的基因发现群组中,2438个基因在病例中与对照中差异地表达。在第二非糖尿病患者的PREDICT基因发现群组中,5935个基因差异表达,且655个与最初的基因发现基因重叠。基于整体相关性和生物学重要性,选择这655个基因中的113个用于独立算法开发群组中的RT-PCR分析(阶段III),其还鉴别临床因素、细胞计数和基因表达之间的相关性。包括23个基因表达水平、年龄和性别的算法源自这些数据并被锁定。然后预期地显示在阶段IV(预期PREDICT验证群组)中具有显著的诊断准确度,AUC为0.70(95%CI=0.65至-16
0.75;p=10 )。
[0218] 我们认为我们的结果是稳健的,这归于至少两个因素。第一,我们使用精心设计的、系列的、四阶段研究,包括>1,500位患者,在独立患者中通过定量RT-PCR测量确认最初的基于微阵列的基因发现。第二,我们使用QCA来定义CAD病例和对照,从而产生更加准确的金标准。
[0219] 实施例7:从算法中移除一个项目
[0220] 在下面的系列实施例(7-47)中,我们检验算法的灵敏度和算法开发过程在项目、标志物和统计方法中的差异。各实施例遵循相同的一般程序:1)鉴别似乎可能的替代模型途径(例如,更少的项目、替代标志物等);2)基于该替代途径重建算法,包括适当地对所述项目和/或标志物重新加权;以及3)评估新的模型是否保持显著的预测准确性。
[0221] 评估在所述七个项目缺少一个时所述算法测定CAD的可能性的能力。单一项目从所述算法中连续移除而同时保持其它项目和年龄和性别的临床因素。例如,项目1从所述算法中移除,而项目2-7和临床因素(年龄和性别)保留在所述算法中。项目1-7中的标志物示于下表中。两种统计方法用于评估:逻辑回归和岭回归。对于所有分析,ROC曲线下的面积(AUC)为使用的主要准确度度量。使用交叉验证计算AUC。例如,当项目1从所述算法移除时,改变的算法如下:
[0222] 算法计算(岭回归;移除项目1)
[0223] 1)定义Norm1=RPL28
[0224] 2)定义Norm2=(.5×HNRPF+.5×TFCP2)
[0225] 3)定义NKup=(.5×SLAMF7+.5×KLRC4)
[0226] 4)定义Tcell=(.5×CD3D+.5×TMC8)
[0227] 5)定义Bcell=(2/3×CD79B+1/3×SPIB)
[0228] 6)定义Neut=(.5×AQP9+.5×NCF4)
[0229] 7)定义Nup=(1/3×CASP5+1/3×IL18RAP+1/3×TNFAIP6)
[0230] 8)定义Ndown=(.25×IL8RB+.25×TNFRSF10C+.25×TLR4+.25×KCNE3)
[0231] 9)定义SCA1=(1/3×S100A12+1/3×CLEC4E+1/3×S100A8)
[0232] 10)定义AF2=AF289562
[0233] 11)定义对于男性SEX=1,对于女性=0
[0234] 12)定义截距
[0235] a.对于男性,INTERCEPT=0.70+0.044×年龄
[0236] b.对于女性,INTERCEPT=0.38+0.126×(年龄-60),如果为负数,则设置为0[0237] 13)定义评分=INTERCEPT-0.39×(Nup-Ndown)-0.26×(NKup-Tcell)-0.33×SEX×(SCA1-Norm1)-0.06×(Bcell-Tcell)-0.07×(1-SEX)×(SCA1-Neut)-0.26×(AF2-Norm2)[0238] 相似的算法开发过程用于在此实施例以及下面的实施例中顺序移除其它项目。各个计算的总结统计以及结果的均值和标准差示于表7中。AUC大于Diamond Forrester(DF)的AUC的置信区间的上限被认为是显著地好于DF模型。参见表8。所有测试的6个项目组显著地好于DF模型,表明所述算法甚至在移除一个项目之后仍然保持预测CAD的可能性。
[0239]项目 标志物
项目1 AF161365,HNRPF,TFCP2
项目2 AF289562,HNRPF,TFCP2
项目3 CD79B,SPIB,CD3D,TMC8
项目4 S100A12,CLEC4E,S100A8,RPL28
项目5 S100A12,CLEC4E,S100A8,AQP9,NCF4
项目6 CASP5,IL18RAP,TNFAIP6,IL8RB,TNFRSF10C,KCNE3,TLR4
[0240]项目 标志物
项目7 SLAMF7,KLRC4,CD3D,TMC8
[0241] 实施例8:从所述算法移除两个项目
[0242] 评估在所述七个项目缺少两个时所述算法确定CAD的可能性的能力。两个不同的项目从所述算法中移除而保持其它项目和临床因素年龄和性别。例如,项目6-7从所述算法中移除而项目1-5和临床因素保留在所述算法中。评估所有可能的五个项目的组合。两种统计方法用于评估:逻辑回归和岭回归。对于所有分析,ROC曲线下面积(AUC)为使用的主要准确度度量。使用交叉验证计算AUC。各个计算的总结统计以及结果的均值和标准差示于表9中。AUC大于Diamond Forrester(DF)的AUC的置信区间的上限被认为是显著好于DF模型。参见表8。所有测试的5个项目组显著地好于DF模型,表明所述算法甚至在移除两个项目之后仍然保持预测CAD的可能性。
[0243] 实施例9:从所述算法中移除三个项目
[0244] 评估在所述七个项目缺少三个时所述算法确定CAD的可能性的能力。三个不同的项目从所述算法中移除而保持其它项目和临床因素年龄和性别。例如,项目5-7从所述算法中移除,而项目1-4和临床因素保留在所述算法中。评估所有可能的四个项目的组合。两种统计方法用于评估:逻辑回归和岭回归。对于所有分析,ROC曲线下的面积(AUC)为使用的主要准确度度量。使用交叉验证计算AUC。各个计算的总结统计以及结果的均值和标准差示于表10中。AUC大于Diamond Forrester(DF)的AUC的置信区间的上限被认为是显著好于DF模型。参见表8。所有测试的4个项目组显著好于DF模型,表明所述算法甚至在移除三个项目之后仍然保持CAD可能性的预测。
[0245] 实施例10:从所述算法中移除四个项目
[0246] 评估在所述七个项目缺少四个时所述算法确定CAD的可能性的能力。四个不同的项目从所述算法中移除而保持其它项目和临床因素年龄和性别。例如,项目4-7从所述算法中移除而项目1-3和临床因素保留在所述算法中。评估所有可能的三个项目的组合。两种统计方法用于评估:逻辑回归和岭回归。对于所有分析,ROC曲线下的面积(AUC)为使用的主要准确度度量。使用交叉验证计算AUC。各个计算的总结统计以及结果的均值和标准差示于表11中。AUC大于Diamond Forrester(DF)的AUC的置信区间的上限被认为是显著好于DF模型。参见表8。所有测试的3个项目的组显著地好于DF模型,表明所述算法甚至在移除四个项目之后仍然保持对CAD可能性的预测。
[0247] 实施例11:从所述算法中移除五个项目
[0248] 评估在所述七个项目缺少五个时所述算法确定CAD的可能性的能力。五个不同的项目从所述算法中移除而保持其它项目和临床因素年龄和性别。例如,项目3-7从所述算法中移除而项目1-2和临床因素保留在所述算法中。评估所有可能的两个项目的组合。两种统计方法用于评估:逻辑回归和岭回归。对于所有分析,ROC曲线下的面积(AUC)为使用的主要准确度度量。使用交叉验证计算AUC。各个计算的总结统计以及结果的均值和标准差示于表12中。AUC大于Diamond Forrester(DF)的AUC的置信区间的上限被认为是显著好于DF模型。参见表8。所有测试的2个项目的组显著地好于DF模型,表明所述算法甚至在移除五个项目之后仍然保持CAD可能性的预测。
[0249] 实施例12:从所述算法中移除六个项目
[0250] 评估在所述七个项目缺少六个时所述算法确定CAD的可能性的能力。六个不同的项目从所述算法中移除而保持其它项目和临床因素年龄和性别。例如,项目2-7从所述算法中移除而项目1和临床因素保留在所述算法中。两种统计方法用于评估:逻辑回归和岭回归。对于所有分析,ROC曲线下的面积(AUC)为使用的主要准确度度量。使用交叉验证计算AUC。各个计算的总结统计以及结果的均值和标准差示于表13中。AUC大于Diamond Forrester(DF)的AUC的置信区间的上限被认为是显著好于DF模型。参见表8。所有测试的1个项目的组显著地好于DF模型,表明所述算法甚至在移除六个项目之后仍然保持CAD可能性的预测。
[0251] 实施例13:从所述算法中移除所有七个项目
[0252] 评估在所述七个标志物表达项目缺少七个时所述算法确定CAD的可能性的能力。七个不同的项目从所述算法中移除而保持临床因素年龄和性别。两种统计方法用于评估:逻辑回归和岭回归。对于所有分析,ROC曲线下的面积(AUC)为使用的主要准确度度量。使用交叉验证计算AUC。各个计算的总结统计数值示于表14中。AUC大于Diamond Forrester(DF)的AUC的置信区间的上限被认为是显著好于所述DF模型。参见表8。年龄加性别加测试的零标志物表达项目组显著地好于DF模型,表明所述算法甚至在移除所有七个标志物表达项目之后仍然保持CAD可能性的预测。这表明所述算法中性别和年龄的加权优于DF模型中临床因素的加权。
[0253] 实施例14:用高度相关的替代标志物代替S100A12
[0254] 对于各算法标志物,高度相关的、非算法替代标志物从上述的阶段III PCR数据集中鉴别(参见表1b和表2)。对于各个标志物,计算该标志物和所有其它标志物之间的Pearson相关性值,然后我们挑选具有与目标算法标志物最大相关性的替代标志物。该替代物是具有与所述算法标志物最高相关性的标志物,受到该限制:替代标志物在所述算法的项目中使用不超过一次。这一具体替换的相关值示于表15中。两种统计方法用于评估:逻辑回归和岭回归。对于该分析,ROC曲线下面积(AUC)为主要准确度度量。使用交叉验证计算AUC。计算一次替换一个基因的模型的准确度。在该实施例中,MMP9代替所述算法的所有相关项目中的S100A12,这里MMP9代替项目4和5中的S100A12。例如,当S100A12在所述算法中被MMP9代替时,改变的算法如下:
[0255] 算法计算(逻辑回归;MMP9代替S100A12)
[0256] 1)定义Norm1=RPL28
[0257] 2)定义Norm2=(.5×HNRPF+.5×TFCP2)
[0258] 3)定义NKup=(.5×SLAMF7+.5×KLRC4)
[0259] 4)定义Tcell=(.5×CD3D+.5×TMC8)
[0260] 5)定义Bcell=(2/3×CD79B+1/3×SPIB)
[0261] 6)定义Neut=(.5×AQP9+.5×NCF4)
[0262] 7)定义Nup=(1/3×CASP5+1/3×IL18RAP+1/3×TNFAIP6)
[0263] 8)定义Ndown=(.25×IL8RB+.25×TNFRSF10C+.25×TLR4+.25×KCNE3)
[0264] 9)定义SCA1=(1/3×S100A12+1/3×CLEC4E+1/3×S100A8)
[0265] 10)定义AF2=AF289562
[0266] 11)定义如果(AF161365-Norm2>6.27或者AF161365=无调用),TSPAN=1,否则=0
[0267] 12)定义对于男性SEX=1,对于女性=0
[0268] 13)定义截距
[0269] a.对于男性,INTERCEPT=5.28+0.047×年龄
[0270] b.对于女性,INTERCEPT=4.44+0.120×(Age-60),如果为负数,设置为0[0271] 14)定义评分=INTERCEPT-1.05×(Nup-Ndown)-0.56×(NKup-Tcell)-0.35×SEX×(SCA1-Norm1)-0.30×(Bcell-Tcell)-0.89×(1-SEX)×(SCA1-Neut)-0.87×SEX×(TSPAN)-0.38×(AF2-Norm2)
[0272] 相似的算法开发过程用于下面的实施例中。所述计算的总结统计示于表15中。AUC大于Diamond Forrester(DF)的AUC的置信区间的上限被认为是显著好于DF模型。参见表16的DF AUC。所述具有替代标志物的算法保持显著地好于DF模型,表明所述算法甚至用高度相关的替代标志物代替所述算法标志物之后仍然保持CAD可能性的预测。
[0273] 实施例15:用高度相关的替代标志物代替CLEC4E
[0274] 对于各算法标志物,高度相关的、非算法替代标志物从上述的阶段III PCR数据集中鉴别。对于各个标志物,计算该标志物和所有其它标志物之间的Pearson相关值,然后我们挑选具有与感兴趣的算法标志物最大相关性的替代标志物。该替代物是具有与所述算法标志物最高相关的标志物,受到该限制:替代标志物在所述算法的项目中使用不超过一次。这一具体替换的相关值示于表15中。两种统计方法用于评估:逻辑回归和岭回归。对于该分析,ROC曲线下面积(AUC)为主要准确度度量。使用交叉验证计算AUC。计算一次替换一个基因的模型的准确度。在该实施例中,ALOX5AP代替所述算法的所有相关项目中的CLEC4E。所述计算的总结统计示于表15中。AUC大于Diamond Forrester(DF)的AUC的置信区间的上限被认为是显著好于所述DF模型。参见表16的DF AUC。所述具有替代标志物的算法仍然显著地好于所述DF模型,表明所述算法甚至用高度相关的替代标志物代替所述算法标志物之后仍然保持CAD可能性的预测。
[0275] 实施例16:用高度相关的替代标志物代替S100A8
[0276] 对于各算法标志物,高度相关的、非算法替代标志物从上述的阶段III PCR数据集中鉴别。对于各个标志物,计算该标志物和所有其它标志物之间的Pearson相关值,然后我们挑选具有与感兴趣的算法标志物最大相关的替代标志物。该替代物是具有与所述算法标志物最高相关的标志物,受到该限制:替代标志物在所述算法的项目中使用不超过一次。这一具体替换的相关值示于表15中。两种统计方法用于评估:逻辑回归和岭回归。对于该分析,ROC曲线下面积(AUC)为主要准确度度量。使用交叉验证计算AUC。计算一次替换一个基因的模型的准确度。在该实施例中,NAMPT代替所述算法的所有相关项目中的S100A8。所述计算的总结统计示于表15中。AUC大于Diamond Forrester(DF)的AUC的置信区间的上限被认为是显著好于所述DF模型。参见表16的DFAUC。所述具有替代标志物的算法仍然显著地好于所述DF模型,表明所述算法甚至用高度相关的替代标志物代替所述算法标志物之后仍然保持CAD可能性的预测。
[0277] 实施例17:用高度相关的替代标志物代替CASP5
[0278] 对于各算法标志物,高度相关的、非算法替代标志物从上述的阶段III PCR数据集中鉴别。对于各个标志物,计算该标志物和所有其它标志物之间的Pearson相关值,然后我们挑选具有与感兴趣的算法标志物最大相关的替代标志物。该替代物是具有与所述算法标志物最高相关的标志物,受到该限制:替代标志物在所述算法的项目中使用不超过一次。这一具体替换的相关值示于表15中。两种统计方法用于评估:逻辑回归和岭回归。对于该分析,ROC曲线下面积(AUC)为主要准确度度量。使用交叉验证计算AUC。计算一次替换一个基因的模型的准确度。在该实施例中,H3F3B代替所述算法的所有相关项目中的CASP5。所述计算的总结统计示于表15中。AUC大于Diamond Forrester(DF)的AUC的置信区间的上限被认为是显著好于所述DF模型。参见表16的DFAUC。所述具有替代标志物的算法仍然显著地好于所述DF模型,表明所述算法甚至用高度相关的替代标志物代替所述算法标志物之后仍然保持CAD可能性的预测。
[0279] 实施例18:用高度相关的替代标志物代替IL18RAP
[0280] 对于各算法标志物,高度相关的、非算法替代标志物从上述的阶段III PCR数据集中鉴别。对于各个标志物,计算该标志物和所有其它标志物之间的Pearson相关值,然后我们挑选具有与感兴趣的算法标志物最大相关的替代标志物。该替代物是具有与所述算法标志物最高相关的标志物,受到该限制:替代标志物在所述算法的项目中使用不超过一次。这一具体替换的相关值示于表15中。两种统计方法用于评估:逻辑回归和岭回归。对于该分析,ROC曲线下面积(AUC)为主要准确度度量。使用交叉验证计算AUC。计算一次替换一个基因的模型的准确度。在该实施例中,TXN代替所述算法的所有相关项目中的IL18RAP。所述计算的总结统计示于表15中。AUC大于Diamond Forrester(DF)的AUC的置信区间的上限被认为是显著好于所述DF模型。参见表16的DFAUC。所述具有替代标志物的算法仍然显著地好于所述DF模型,表明所述算法甚至用高度相关的替代标志物代替所述算法标志物之后仍然保持CAD可能性的预测。
[0281] 实施例19:用高度相关的替代标志物代替TNFAIP6
[0282] 对于各算法标志物,高度相关的、非算法替代标志物从上述的阶段III PCR数据集中鉴别。对于各个标志物,计算该标志物和所有其它标志物之间的Pearson相关值,然后我们挑选具有与感兴趣的算法标志物最大相关的替代标志物。该替代物是具有与所述算法标志物最高相关的标志物,受到该限制:替代标志物在所述算法的项目中使用不超过一次。这一具体替换的相关值示于表15中。两种统计方法用于评估:逻辑回归和岭回归。对于该分析,ROC曲线下面积(AUC)为主要准确度度量。使用交叉验证计算AUC。计算一次替换一个基因的模型的准确度。在该实施例中,PLAUR代替所述算法的所有相关项目中的TNFAIP6。所述计算的总结统计示于表15中。AUC大于Diamond Forrester(DF)的AUC的置信区间的上限被认为是显著好于所述DF模型。参见表16的DF AUC。所述具有替代标志物的算法仍然显著地好于所述DF模型,表明所述算法甚至用高度相关的替代标志物代替所述算法标志物之后仍然保持CAD可能性的预测。
[0283] 实施例20:用高度相关的替代标志物代替AQP9
[0284] 对于各算法标志物,高度相关的、非算法替代标志物从上述的阶段III PCR数据集中鉴别。对于各个标志物,计算该标志物和所有其它标志物之间的Pearson相关值,然后我们挑选具有与感兴趣的算法标志物最大相关的替代标志物。该替代物是具有与所述算法标志物最高相关的标志物,受到该限制:替代标志物在所述算法的项目中使用不超过一次。这一具体替换的相关值示于表15中。两种统计方法用于评估:逻辑回归和岭回归。对于该分析,ROC曲线下面积(AUC)为主要准确度度量。使用交叉验证计算AUC。计算一次替换一个基因的模型的准确度。在该实施例中,GLT1D1代替所述算法的所有相关项目中的AQP9。所述计算的总结统计示于表15中。AUC大于Diamond Forrester(DF)的AUC的置信区间的上限被认为是显著好于所述DF模型。参见表16的DFAUC。所述具有替代标志物的算法仍然显著地好于所述DF模型,表明所述算法甚至用高度相关的替代标志物代替所述算法标志物之后仍然保持CAD可能性的预测。
[0285] 实施例21:用高度相关的替代标志物代替NCF4
[0286] 对于各算法标志物,高度相关的、非算法替代标志物从上述的阶段III PCR数据集中鉴别。对于各个标志物,计算该标志物和所有其它标志物之间的Pearson相关值,然后我们挑选具有与感兴趣的算法标志物最大相关的替代标志物。该替代物是具有与所述算法标志物最高相关的标志物,受到该限制:替代标志物在所述算法的项目中使用不超过一次。这一具体替换的相关值示于表15中。两种统计方法用于评估:逻辑回归和岭回归。对于所有分析,ROC曲线下面积(AUC)为最初的准确度度量。使用交叉验证计算AUC。计算一次替换一个基因的模型的准确度。在该实施例中,NCF2代替所述算法的所有相关项目中的NCF4。所述计算的总结统计示于表15中。AUC大于Diamond Forrester(DF)的AUC的置信区间的上限被认为是显著好于所述DF模型。参见表16的DFAUC。所述具有替代标志物的算法仍然显著地好于所述DF模型,表明所述算法甚至用高度相关的替代标志物代替所述算法标志物之后仍然保持CAD可能性的预测。
[0287] 实施例22:用高度相关的替代标志物代替CD3D
[0288] 对于各算法标志物,高度相关的、非算法替代标志物从上述的阶段III PCR数据集中鉴别。对于各个标志物,计算该标志物和所有其它标志物之间的Pearson相关值,然后我们挑选具有与感兴趣的算法标志物最大相关的替代标志物。该替代物是具有与所述算法标志物最高相关的标志物,受到该限制:替代标志物在所述算法的项目中使用不超过一次。这一具体替换的相关值示于表15中。两种统计方法用于评估:逻辑回归和岭回归。对于该分析,ROC曲线下面积(AUC)为主要准确度度量。使用交叉验证计算AUC。计算每次替换一个基因的模型的准确度。在该实施例中,LCK代替所述算法的所有相关项目中的CD3D。所述计算的主要统计示于表15中。AUC大于Diamond Forrester(DF)的AUC的置信区间的上限被认为是显著好于所述DF模型。参见表16的DF AUC。所述具有替代标志物的算法仍然显著地好于所述DF模型,表明所述算法甚至用高度相关的替代标志物代替所述算法标志物之后仍然保持CAD可能性的预测。
[0289] 实施例23:用高度相关的替代标志物代替TMC8
[0290] 对于各算法标志物,高度相关的、非算法替代标志物从上述的阶段III PCR数据集中鉴别。对于各个标志物,计算该标志物和所有其它标志物之间的Pearson相关值,然后我们挑选具有与感兴趣的算法标志物最大相关的替代标志物。该替代物是具有与所述算法标志物最高相关的标志物,受到该限制:替代标志物在所述算法的项目中使用不超过一次。这一具体替换的相关值示于表15中。两种统计方法用于评估:逻辑回归和岭回归。对于该分析,ROC曲线下面积(AUC)为主要准确度度量。使用交叉验证计算AUC。计算一次替换一个基因的模型的准确度。在该实施例中,CCT2代替所述算法的所有相关项目中的TMC8。所述计算的主要统计示于表15中。AUC大于Diamond Forrester(DF)的AUC的置信区间的上限被认为是显著好于所述DF模型。参见表16的DFAUC。所述具有替代标志物的算法仍然显著地好于所述DF模型,表明所述算法甚至用高度相关的替代标志物代替所述算法标志物之后仍然保持CAD可能性的预测。
[0291] 实施例24:用高度相关的替代标志物代替CD79B
[0292] 对于各算法标志物,高度相关的、非算法替代标志物从上述的阶段III PCR数据集中鉴别。对于各个标志物,计算该标志物和所有其它标志物之间的Pearson相关值,然后我们挑选具有与感兴趣的算法标志物最大相关的替代标志物。该替代物是具有与所述算法标志物最高相关的标志物,受到该限制:替代标志物在所述算法的项目中使用不超过一次。这一具体替换的相关值示于表15中。两种统计方法用于评估:逻辑回归和岭回归。对于该分析,ROC曲线下面积(AUC)为主要准确度度量。使用交叉验证计算AUC。计算一次替换一个基因的模型的准确度。在该实施例中,CD19代替所述算法的所有相关项目中的CD79B。所述计算的主要统计示于表15中。AUC大于Diamond Forrester(DF)的AUC的置信区间的上限被认为是显著好于所述DF模型。参见表16的DFAUC。所述具有替代标志物的算法仍然显著地好于所述DF模型,表明所述算法甚至用高度相关的替代标志物代替所述算法标志物之后仍然保持CAD可能性的预测。
[0293] 实施例25:用高度相关的替代标志物代替SPIB
[0294] 对于各算法标志物,高度相关的、非算法替代标志物从上述的阶段III PCR数据集中鉴别。对于各个标志物,计算该标志物和所有其它标志物之间的Pearson相关值,然后我们挑选具有与感兴趣的算法标志物最大相关的替代标志物。该替代物是具有与所述算法标志物最高相关的标志物,受到该限制:替代标志物在所述算法的项目中使用不超过一次。这一具体替换的相关值示于表15中。两种统计方法用于评估:逻辑回归和岭回归。对于该分析,ROC曲线下面积(AUC)为主要准确度度量。使用交叉验证计算AUC。计算一次替换一个基因的模型的准确度。在该实施例中,BLK代替所述算法的所有相关项目中的SPIB。所述计算的主要统计示于表15中。AUC大于Diamond Forrester(DF)的AUC的置信区间的上限被认为是显著好于所述DF模型。参见表16的DF AUC。所述具有替代标志物的算法仍然显著地好于所述DF模型,表明所述算法甚至用高度相关的替代标志物代替所述算法标志物之后仍然保持CAD可能性的预测。
[0295] 实施例26:用高度相关的替代标志物代替HNRPF
[0296] 对于各算法标志物,高度相关的、非算法替代标志物从上述的阶段III PCR数据集中鉴别。对于各个标志物,计算该标志物和所有其它标志物之间的Pearson相关值,然后我们挑选具有与感兴趣的算法标志物最大相关的替代标志物。该替代物是具有与所述算法标志物最高相关的标志物,受到该限制:替代标志物在所述算法的项目中使用不超过一次。这一具体替换的相关值示于表15中。两种统计方法用于评估:逻辑回归和岭回归。对于该分析,ROC曲线下面积(AUC)为主要准确度度量。使用交叉验证计算AUC。计算一次替换一个基因的模型的准确度。在该实施例中,ACBD5代替所述算法的所有相关项目中的HNRPF。所述计算的主要统计示于表15中。AUC大于Diamond Forrester(DF)的AUC的置信区间的上限被认为是显著好于所述DF模型。参见表16的DFAUC。所述具有替代标志物的算法仍然显著地好于所述DF模型,表明所述算法甚至用高度相关的替代标志物代替所述算法标志物之后仍然保持预测CAD的可能性。
[0297] 实施例27:用高度相关的替代标志物代替TFCP2
[0298] 对于各算法标志物,高度相关的、非算法替代标志物从上述的阶段III PCR数据集中鉴别。对于各个标志物,计算该标志物和所有其它标志物之间的Pearson相关值,然后我们挑选具有与感兴趣的算法标志物最大相关的替代标志物。该替代物是具有与所述算法标志物最高相关的标志物,受到该限制:替代标志物在所述算法的项目中使用不超过一次。这一具体替换的相关值示于表15中。两种统计方法用于评估:逻辑回归和岭回归。对于该分析,ROC曲线下面积(AUC)为主要准确度度量。使用交叉验证计算AUC。计算一次替换一个基因的模型的准确度。在该实施例中,DDX18代替所述算法的所有相关项目中的TFCP2。所述计算的总结统计示于表15中。AUC大于Diamond Forrester(DF)的AUC的置信区间的上限被认为是显著好于所述DF模型。参见表16的DFAUC。所述具有替代标志物的算法仍然显著地好于所述DF模型,表明所述算法甚至用高度相关的替代标志物代替所述算法标志物之后仍然保持预测CAD的可能性。
[0299] 实施例28:用高度相关的替代标志物代替RPL28
[0300] 对于各算法标志物,高度相关的、非算法替代标志物从上述的阶段III PCR数据集中鉴别。对于各个标志物,计算该标志物和所有其它标志物之间的Pearson相关值,然后我们挑选具有与感兴趣的算法标志物最大相关的替代标志物。该替代物是具有与所述算法标志物最高相关的标志物,受到该限制:替代标志物在所述算法的项目中使用不超过一次。这一具体替换的相关值示于表15中。两种统计方法用于评估:逻辑回归和岭回归。对于该分析,ROC曲线下面积(AUC)为主要准确度度量。使用交叉验证计算AUC。计算一次替换一个基因的模型的准确度。在该实施例中,SSRP1代替所述算法的所有相关项目中的RPL28。所述计算的总结统计示于表15中。AUC大于Diamond Forrester(DF)的AUC的置信区间的上限被认为是显著好于所述DF模型。参见表16的DFAUC。所述具有替代标志物的算法仍然显著地好于所述DF模型,表明所述算法甚至用高度相关的替代标志物代替所述算法标志物之后仍然保持CAD可能性的预测。
[0301] 实施例29:用高度相关的替代标志物代替AF289562
[0302] 对于各算法标志物,高度相关的、非算法替代标志物从上述的阶段III PCR数据集中鉴别。对于各个标志物,计算该标志物和所有其它标志物之间的Pearson相关值,然后我们挑选具有与感兴趣的算法标志物最大相关的替代标志物。该替代物是具有与所述算法标志物最高相关的标志物,受到该限制:替代标志物在所述算法的项目中使用不超过一次。这一具体替换的相关值示于表15中。两种统计方法用于评估:逻辑回归和岭回归。对于该分析,ROC曲线下面积(AUC)为主要准确度度量。使用交叉验证计算AUC。计算一次替换一个基因的模型的准确度。在该实施例中,CD248代替所述算法的所有相关项目中的AF289562。所述计算的总结统计示于表15中。AUC大于Diamond Forrester(DF)的AUC的置信区间的上限被认为是显著好于所述DF模型。参见表16的DF AUC。所述具有替代标志物的算法仍然显著地好于所述DF模型,表明所述算法甚至用高度相关的替代标志物代替所述算法标志物之后仍然保持CAD可能性的预测。
[0303] 实施例30:用高度相关的替代标志物代替SLAMF7
[0304] 对于各算法标志物,高度相关的、非算法替代标志物从上述的阶段III PCR数据集中鉴别。对于各个标志物,计算该标志物和所有其它标志物之间的Pearson相关值,然后我们挑选具有与感兴趣的算法标志物最大相关的替代标志物。该替代物是具有与所述算法标志物最高相关的标志物,受到该限制:替代标志物在所述算法的项目中使用不超过一次。这一具体替换的相关值示于表15中。两种统计方法用于评估:逻辑回归和岭回归。对于该分析,ROC曲线下面积(AUC)为主要准确度度量。使用交叉验证计算AUC。计算一次替换一个基因的模型的准确度。在该实施例中,CX3CR1代替所述算法的所有相关项目中的SLAMF7。所述计算的总结统计示于表15中。AUC大于Diamond Forrester(DF)的AUC的置信区间的上限被认为是显著好于所述DF模型。参见表16的DF AUC。所述具有替代标志物的算法仍然显著地好于所述DF模型,表明所述算法甚至用高度相关的替代标志物代替所述算法标志物之后仍然保持CAD可能性的预测。
[0305] 实施例31:用高度相关的替代标志物代替KLRC4
[0306] 对于各算法标志物,高度相关的、非算法替代标志物从上述的阶段III PCR数据集中鉴别。对于各个标志物,计算该标志物和所有其它标志物之间的Pearson相关值,然后我们挑选具有与感兴趣的算法标志物最大相关的替代标志物。该替代物是具有与所述算法标志物最高相关的标志物,受到该限制:替代标志物在所述算法的项目中使用不超过一次。这一具体替换的相关值示于表15中。两种统计方法用于评估:逻辑回归和岭回归。对于该分析,ROC曲线下面积(AUC)为主要准确度度量。使用交叉验证计算AUC。计算一次替换一个基因的模型的准确度。在该实施例中,CD8A代替所述算法的所有相关项目中的KLRC4。所述计算的总结统计示于表15中。AUC大于Diamond Forrester(DF)的AUC的置信区间的上限被认为是显著好于所述DF模型。参见表16的DFAUC。所述具有替代标志物的算法仍然显著地好于所述DF模型,表明所述算法甚至用高度相关的替代标志物代替所述算法标志物之后仍然保持CAD可能性的预测。
[0307] 实施例32:用高度相关的替代标志物代替IL8RB
[0308] 对于各算法标志物,高度相关的、非算法替代标志物从上述的阶段III PCR数据集中鉴别。对于各个标志物,计算该标志物和所有其它标志物之间的Pearson相关值,然后我们挑选具有与感兴趣的算法标志物最大相关的替代标志物。该替代物是具有与所述算法标志物最高相关的标志物,受到该限制:替代标志物在所述算法的项目中使用不超过一次。这一具体替换的相关值示于表15中。两种统计方法用于评估:逻辑回归和岭回归。对于该分析,ROC曲线下面积(AUC)为主要准确度度量。使用交叉验证计算AUC。计算一次替换一个基因的模型的准确度。在该实施例中,BCL2A1代替所述算法的所有相关项目中的IL8RB。所述计算的总结统计示于表15中。AUC大于Diamond Forrester(DF)的AUC的置信区间的上限被认为是显著的好于所述DF模型。参见表16的DFAUC。所述具有替代标志物的算法仍然显著地好于所述DF模型,表明所述算法甚至用高度相关的替代标志物代替所述算法标志物之后仍然保持CAD可能性的预测。
[0309] 实施例33:用高度相关的替代标志物代替TNFRSF10C
[0310] 对于各算法标志物,高度相关的、非算法替代标志物从上述的阶段III PCR数据集中鉴别。对于各个标志物,计算该标志物和所有其它标志物之间的Pearson相关值,然后我们挑选具有与感兴趣的算法标志物最大相关的替代标志物。该替代物是具有与所述算法标志物最高相关的标志物,受到该限制:替代标志物在所述算法的项目中使用不超过一次。这一具体替换的相关值示于表15中。两种统计方法用于评估:逻辑回归和岭回归。对于该分析,ROC曲线下面积(AUC)为主要准确度度量。使用交叉验证计算AUC。计算一次替换一个基因的模型的准确度。在该实施例中,PTAFR代替所述算法的所有相关项目中的TNFRSF10C。所述计算的总结统计示于表15中。AUC大于Diamond Forrester(DF)的AUC的置信区间的上限被认为是显著好于所述DF模型。参见表16的DF AUC。所述具有替代标志物的算法仍然显著地好于所述DF模型,表明所述算法甚至用高度相关的替代标志物代替所述算法标志物之后仍然保持CAD可能性的预测。
[0311] 实施例34:用高度相关的替代标志物代替KCNE3
[0312] 对于各算法标志物,高度相关的、非算法替代标志物从上述的阶段III PCR数据集中鉴别。对于各个标志物,计算该标志物和所有其它标志物之间的Pearson相关值,然后我们挑选具有与感兴趣的算法标志物最大相关的替代标志物。该替代物是具有与所述算法标志物最高相关的标志物,受到该限制:替代标志物在所述算法的项目中使用不超过一次。这一具体替换的相关值示于表15中。两种统计方法用于评估:逻辑回归和岭回归。对于该分析,ROC曲线下面积(AUC)为主要准确度度量。使用交叉验证计算AUC。计算一次替换一个基因的模型的准确度。在该实施例中,LAMP2代替所述算法的所有相关项目中的KCNE3。所述计算的总结统计示于表15中。AUC大于Diamond Forrester(DF)的AUC的置信区间的上限被认为是显著好于所述DF模型。参见表16的DFAUC。所述具有替代标志物的算法仍然显著地好于所述DF模型,表明所述算法甚至用高度相关的替代标志物代替所述算法标志物之后仍然保持CAD可能性的预测。
[0313] 实施例35:用高度相关的替代标志物代替TLR4
[0314] 对于各算法标志物,高度相关的、非算法替代标志物从上述的阶段III PCR数据集中鉴别。对于各个标志物,计算该标志物和所有其它标志物之间的Pearson相关值,然后我们挑选具有与感兴趣的算法标志物最大相关的替代标志物。该替代物是具有与所述算法标志物最高相关的标志物,受到该限制:替代标志物在所述算法的项目中使用不超过一次。这一具体替换的相关值示于表15中。两种统计方法用于评估:逻辑回归和岭回归。对于该分析,ROC曲线下面积(AUC)为主要准确度度量。使用交叉验证计算AUC。计算一次替换一个基因的模型的准确度。在该实施例中,TYROBP代替所述算法的所有相关项目中的TLR4。所述计算的总结统计示于表15中。AUC大于Diamond Forrester(DF)的AUC的置信区间的上限被认为是显著好于所述DF模型。参见表16的DFAUC。所述具有替代标志物的算法仍然显著地好于所述DF模型,表明所述算法甚至用高度相关的替代标志物代替所述算法标志物之后仍然保持CAD可能性的预测。
[0315] 实施例36:用五个不同的、高度相关的替代标志物随机代替五个算法标志物[0316] 对于各算法标志物,高度相关的、非算法替代标志物从上述的阶段III PCR数据集中鉴别。对于各个标志物,计算该标志物和所有其它标志物之间的Pearson相关值,然后我们挑选具有与感兴趣的算法标志物最大相关的替代标志物。该替代物是具有与所述算法标志物最高相关的标志物,受到该限制:替代标志物在所述算法的项目中使用不超过一次。所述高度相关的替代标志物参见表15。两种统计方法用于分析:逻辑回归和岭回归。对于该分析,ROC曲线下面积(AUC)为主要准确度度量。使用交叉验证计算AUC。计算一次用五个高度相关的标志物随机替换五个不同的算法标志物的模型的准确度。对于所述随机标志物替换,进行各100个重复,并计算均值和标准差。所述计算的总结统计示于表16中。AUC大于Diamond Forrester(DF)的AUC的置信区间的上限被认为是显著好于所述DF模型。所述具有替代标志物的算法仍然显著地好于所述DF模型,表明所述算法甚至用五个高度相关的替代标志物代替五个算法标志物之后仍然保持CAD可能性的预测。
[0317] 实施例37:用十个不同的、高度相关的替代标志物随机代替十个算法标志物[0318] 对于各算法标志物,高度相关的、非算法替代标志物从上述的阶段III PCR数据集中鉴别。对于各个标志物,计算该标志物和所有其它标志物之间的Pearson相关值,然后我们挑选具有与感兴趣的算法标志物最大相关的替代标志物。该替代物是具有与所述算法标志物最高相关的标志物,受到该限制:替代标志物在所述算法的项目中使用不超过一次。所述高度相关的替代标志物参见表15。两种统计方法用于分析:逻辑回归和岭回归。对于该分析,ROC曲线下面积(AUC)为主要准确度度量。使用交叉验证计算AUC。计算一次用十个高度相关的标志物随机替换十个不同的算法标志物的模型的准确度。对于所述随机标志物替换,进行各100个重复,并计算均值和标准差。所述计算的总结统计示于表16中。AUC大于Diamond Forrester(DF)的AUC的置信区间的上限被认为是显著好于所述DF模型。所述具有替代标志物的算法仍然显著地好于所述DF模型,表明所述算法甚至用十个高度相关的替代标志物代替十个算法标志物之后仍然保持CAD可能性的预测。
[0319] 实施例38:用十五个不同的、高度相关的替代标志物随机代替十五个算法标志物[0320] 对于各算法标志物,高度相关的、非算法替代标志物从上述的阶段III PCR数据集中鉴别。对于各个标志物,计算该标志物和所有其它标志物之间的Pearson相关值,然后我们挑选具有与感兴趣的算法标志物最大相关的替代标志物。该替代物是具有与所述算法标志物最高相关的标志物,受到该限制:替代标志物在所述算法的项目中使用不超过一次。所述高度相关的替代标志物参见表15。两种统计方法用于分析:逻辑回归和岭回归。对于该分析,ROC曲线下面积(AUC)为主要准确度度量。使用交叉验证计算AUC。计算一次用十五个高度相关的标志物随机替换十五个不同的算法标志物的模型的准确度。对于所述随机标志物替换,进行各100个重复,并计算均值和标准差。所述计算的总结统计示于表16中。AUC大于Diamond Forrester(DF)的AUC的置信区间的上限被认为是显著好于所述DF模型。所述具有替代标志物的算法仍然显著地好于所述DF模型,表明所述算法甚至用十五个高度相关的替代标志物代替十五个算法标志物之后仍然保持CAD可能性的预测。
[0321] 实施例39:用二十个不同的、高度相关的替代标志物随机代替二十个算法标志物[0322] 对于各算法标志物,高度相关的、非算法替代标志物从上述的阶段III PCR数据集中鉴别。对于各个标志物,计算该标志物和所有其它标志物之间的Pearson相关值,然后我们挑选具有与感兴趣的算法标志物最大相关的替代标志物。该替代物是具有与所述算法标志物最高相关的标志物,受到该限制:替代标志物在所述算法的项目中使用不超过一次。所述高度相关的替代标志物参见表15。两种统计方法用于分析:逻辑回归和岭回归。对于该分析,ROC曲线下面积(AUC)为主要准确度度量。使用交叉验证计算AUC。计算一次用二十个高度相关的标志物随机替换二十个不同的算法标志物的模型的准确度。对于所述随机标志物替换,进行各100个重复,并计算均值和标准差。所述计算的总结统计示于表16中。AUC大于Diamond Forrester(DF)的AUC的置信区间的上限被认为是显著好于所述DF模型。所述具有替代标志物的算法仍然显著地好于所述DF模型,表明所述算法甚至用二十个高度相关的替代标志物代替二十个算法标志物之后仍然保持预测CAD的可能性。
[0323] 实施例40:用不同的、高度相关的替代标志物随机代替所有算法标志物
[0324] 对于各算法标志物,高度相关的、非算法替代标志物从上述的阶段III PCR数据集中鉴别。对于各个标志物,计算该标志物和所有其它标志物之间的Pearson相关值,然后我们挑选具有与感兴趣的算法标志物最大相关的替代标志物。该替代物是具有与所述算法标志物最高相关的标志物,受到该限制:替代标志物在所述算法的项目中使用不超过一次。所述高度相关的替代标志物参见表15。两种统计方法用于分析:逻辑回归和岭回归。对于该分析,ROC曲线下面积(AUC)为主要准确度度量。使用交叉验证计算AUC。计算一次用高度相关的标志物随机替换所有算法标志物的模型的准确度。对于所述随机标志物替换,进行各100个重复,并计算均值和标准差。所述计算的总结统计示于表16中。AUC大于Diamond Forrester(DF)的AUC的置信区间的上限被认为是显著好于所述DF模型。所述具有替代标志物的算法仍然显著地好于所述DF模型,表明所述算法甚至用高度相关的替代标志物代替所有算法标志物之后仍然保持CAD可能性的预测。
[0325] 实施例41:从项目1中移除标志物
[0326] 顺序从所述算法移除项目1算法标志物和高度相关的替代标志物以确定是否所述算法在它们缺失下将仍保持CAD可能性的预测。从所述算法中移除所有其它的项目和与它们有关的标志物,由此在该分析中,各项目就其本身考虑。所述模型的各项目为δ项目,n_i标志物在所述δ项目的左侧和m_i标志物在所述δ项目的右侧。我们检验两标志物“简化项目”,其中仅一个所述n_i左手侧标志物和一个可能的m_i右手侧标志物用于所述项目中。因此存在n_i×m_i可能的两标志物简化项目。我们还检验了通过从所述算法标志物以及所述替代标志物的全项目中相继移除标志物产生的“简化项目”。
[0327] 对于各个简化项目,包括性别、年龄和所述简化项目的模型进行拟合,估计交叉验证的AUC。这些交叉验证的AUC与包括性别、年龄和全项目的模型的AUC比较。对于各个简化项目,我们测试是否仍然存在所述项目的统计学上显著的预测效果,即是否AUC的降低足以赋予在CAD的预测中无益处的标志物简化组。对于所有简化的标志物组重复相同的过程,其中相关的替换标志物用于替代最初的算法标志物。
[0328] 我们发现该分析中产生的所有简化项目仍然保持CAD的预测。参见表17。
[0329] 实施例42:从项目2中移除标志物
[0330] 顺序从所述算法移除项目2算法标志物和高度相关的替代标志物以确定是否所述算法在它们缺失下将仍保持CAD可能性的预测。从所述算法中移除所有其它的项目和与它们有关的标志物,由此在该分析中,各项目就其本身考虑。所述模型的各项目为δ项目,n_i标志物在所述δ项目的左侧,m_i标志物在所述δ项目的右侧。我们检验两标志物“简化项目”,其中仅一个所述n_i左手侧标志物和一个可能的m_i右手侧标志物用于所述项目中。因此存在n_i×m_i可能的两标志物简化项目。我们还检验了通过从所述算法标志物以及所述替代标志物的全项目中相继移除标志物产生的“简化项目”。
[0331] 对于各个简化项目,包括性别、年龄和所述简化项目的模型进行拟合,估计交叉验证的AUC。这些交叉验证的AUC与包括性别、年龄和全项目的模型的AUC比较。对于各个简化项目,我们测试是否仍然存在所述项目的统计学上显著的预测效果,即是否AUC的简化足以赋予在CAD的预测中无益处的标志物简化组。对于所有简化的标志物组重复相同的过程,其中相关的替换标志物用于替代最初的算法标志物。
[0332] 我们发现该分析中产生的所有简化项目仍然保持CAD的预测。参见表18。
[0333] 实施例43:从项目3中移除标志物
[0334] 顺序从所述算法移除项目3算法标志物和高度相关的替代标志物以确定是否所述算法在它们缺失下将仍保持CAD可能性的预测。从所述算法中移除所有其它的项目和与它们有关的标志物,由此在该分析中,各项目就其本身考虑。所述模型的各项目为δ项目,n_i标志物在所述δ项目的左侧,m_i标志物在所述δ项目的右侧。我们检验两标志物“简化项目”,其中仅一个所述n_i左手侧标志物和一个可能的m_i右手侧标志物用于所述项目中。因此存在n_i×m_i可能的两标志物简化项目。我们还检验了通过从所述算法标志物以及所述替代标志物的全部项目中相继移除标志物产生的“简化项目”。
[0335] 对于各个简化项目,包括性别、年龄和所述简化项目的模型进行拟合,估计交叉验证的AUC。这些交叉验证的AUC与包括性别、年龄和全项目的模型的AUC比较。对于各个简化项目,我们测试是否仍然存在所述项目的统计学上显著的预测效果,即是否AUC的简化足以赋予在CAD的预测中无益处的标志物简化组。对于所有简化的标志物组重复相同的过程,其中相关的替换标志物用于替代最初的算法标志物。此外,对于所述两标志物简化组,再次重复相同的过程,其中一个相关的替换标志物与一个最初的算法标志物一起使用。
[0336] 我们发现除了LCK/CCT2/CD19/BLK、LCK/CD19/BLK、CCT2/CD19/BLK、LCK/CCT2/CD19、LCK/CD19、CCT2/CD19、CD3D/CD19、LCK/CD19和CCT2/CD19外,该分析中产生的所有简化项目仍然保持CAD的预测。参见表19。当使用岭回归计算AUC时而不使用逻辑回归计算AUC时,TMC8/CD19为CAD预测的。参见表19。
[0337] 实施例44:从项目4中移除标志物
[0338] 顺序从所述算法移除项目4算法标志物和高度相关的替代标志物以确定是否所述算法在它们缺失下将仍保持CAD的可能性。从所述算法中移除所有其它的项目和与它们有关的标志物,由此在该分析中,各项目就其本身考虑。所述模型的各项目为δ项目,n_i标志物在所述δ项目的左侧,m_i标志物在所述δ项目的右侧。我们检验两个标志物“简化项目”,其中仅一个所述n_i左手侧标志物和一个可能的m_i右手侧标志物用于所述项目中。因此存在n_i×m_i可能的两标志物简化项目。我们还检验了通过从所述算法标志物以及所述替代标志物的全项目中相继移除标志物产生的“简化项目”。
[0339] 对于各个简化项目,包括性别、年龄和所述简化项目的模型进行拟合,估计交叉验证的AUC。这些交叉验证的AUC与包括性别、年龄和全项目的模型的AUC比较。对于各个简化项目,我们测试是否仍然是所述项目的统计学上显著的预测效果,即是否AUC的简化足以赋予在CAD的预测中无益处的标志物简化组。对于所有简化的标志物组重复相同的过程,其中相关的替换标志物用于替代最初的算法标志物。
[0340] 我们发现该分析中产生的所有简化项目仍然保持CAD的预测。参见表20。
[0341] 实施例45:从项目5中移除标志物
[0342] 顺序从所述算法移除项目5算法标志物和高度相关的替代标志物以确定是否所述算法在它们缺失下将仍保持CAD可能性的预测。从所述算法中移除所有其它的项目和与它们有关的标志物,由此在该分析中,各项目就其本身考虑。所述模型的各项目为δ项目,n_i标志物在所述δ项目的左侧,m_i标志物在所述δ项目的右侧。我们检验两标志物“简化项目”,其中仅一个所述n_i左手侧标志物和一个可能的m_i右手侧标志物用于所述项目中。因此存在n_i×m_i可能的两标志物简化项目。我们还检验了通过从所述算法标志物以及所述替代标志物的全项目中相继移除标志物产生的“简化项目”。
[0343] 对于各个简化项目,包括性别、年龄和所述简化项目的模型进行拟合,估计交叉验证的AUC。这些交叉验证的AUC与包括性别、年龄和全项目的模型的AUC比较。对于各个简化项目,我们测试是否仍然是所述项目的统计学上显著的预测效果,即是否AUC的简化足以赋予在CAD的预测中无益处的标志物简化组。对于所有简化的标志物组重复相同的过程,其中相关的替换标志物用于替代最初的算法标志物。此外,对于所述两标志物简化组,再次重复相同的过程,其中一个相关的替换标志物与一个最初的算法标志物一起使用。
[0344] 我们发现除了MMP9/ALOX5AP/GLT1D1/NCF2、MMP9/ALOX5AP/NAMPT/NCF2、MMP9/GLT1D1/NCF2、MMP9/ALOX5AP/NCF2、MMP9/NAMPT/NCF2、MMP9/GLT1D1、ALOX5AP/NCF2、MMP9/NCF2、ALOX5AP/AQP9和ALOX5AP/NCF2外,该分析中产生的所有简化项目仍然保持CAD的预测。参见表21。当使用岭回归计算AUC时而不使用逻辑回归计算AUC时,ALOX5AP/NCF4为CAD预测的。参见表21。
[0345] 实施例46:从项目6中移除标志物
[0346] 顺序从所述算法移除项目6算法标志物和高度相关的替代标志物测定是否所述算法在它们缺失下将仍保持CAD可能性的预测。从所述算法中移除所有其它的项目和与它们有关的标志物,由此在该分析中,各项目就其本身考虑。所述模型的各项目为δ项目,n_i标志物在所述δ项目的左侧,m_i标志物在所述δ项目的右侧。我们检验两标志物“简化项目”,其中仅一个所述n_i左手侧标志物和一个可能的m_i右手侧标志物用于所述项目中。因此存在n_i×m_i可能的两标志物简化项目。我们还检验了通过从所述算法标志物以及所述替代标志物的全项目中相继移除标志物产生的“简化项目”。
[0347] 对于各个简化项目,包括性别、年龄和所述简化项目的模型进行拟合,估计交叉验证的AUC。这些交叉验证的AUC与包括性别、年龄和全项目的模型的AUC比较。对于各个简化项目,我们测试是否仍然是所述项目的统计学上显著的预测效果,即是否AUC的简化足以赋予在CAD的预测中无益处的标志物简化组。对于所有简化的标志物组重复相同的过程,其中相关的替换标志物用于替代最初的算法标志物。此外,对于所述两个标志物简化组,再次重复相同的过程,其中一个相关的替换标志物与一个最初的算法标志物一起使用。
[0348] 我们发现除了H3F3B/TXN/BCL2A1/LAMP2/TYROBP、H3F3B/TXN/BCL2A1/LAMP2、H3F3B/TXN/BCL2A1/TYROBP、TXN/PLAUR/BCL2A1/TYROBP、H3F3B/TXN/PLAUR/BCL2A1、H3F3B/BCL2A1/TYROBP、TXN/BCL2A1/TYROBP、H3F3B/TXN/BCL2A1、H3F3B/TXN/TYROBP、TXN/PLAUR/BCL2A1、TXN/PLAUR/BCL2A1、H3F3B/BCL2A1、H3F3B/TYROBP、TXN/BCL2A1、TXN/TYROBP、TXN/IL8RB和TXN/TNFRSF10C,该分析中产生的所有简化项目仍然保持CAD的预测。参见表22。
[0349] 实施例47:从项目7中移除标志物
[0350] 顺序从所述算法移除项目7算法标志物和高度相关的替代标志物以确定是否所述算法在它们缺失下将仍保持CAD可能性的预测。从所述算法中移除所有其它的项目和与它们有关的标志物,由此在该分析中,各项目就其本身考虑。所述模型的各项目为δ项目,n_i标志物在所述δ项目的左侧,m_i标志物在所述δ项目的右侧。我们检验两标志物“简化项目”,其中仅一个所述n_i左手侧标志物和一个可能的m_i右手侧标志物用于所述项目中。因此存在n_i×m_i可能的两标志物简化项目。我们还检验了通过从所述算法标志物以及所述替代标志物的全项目中相继移除标志物产生的“简化项目”。
[0351] 对于各个简化项目,包括性别、年龄和所述简化项目的模型进行拟合,估计交叉验证的AUC。这些交叉验证的AUC与包括性别、年龄和全项目的模型的AUC比较。对于各个简化项目,我们测试是否仍然是所述项目的统计学上显著的预测效果,即是否AUC的简化足以赋予在CAD的预测中无益处的标志物简化组。对于所有简化的标志物组重复相同的过程,其中相关的替换标志物用于替代最初的算法标志物。此外,对于所述两个标志物简化组,再次重复相同的过程,其中一个相关的替换标志物与一个最初的算法标志物一起使用。
[0352] 我们发现除了LCK/CCT2/CX3CR1/CD8A、LCK/CX3CR1/CD8A、CCT2/CX3CR1/CD8A、LCK/CCT2/CD8A、LCK/CD8A、CCT2/CD8A、TMC8/CD8A和CD3D/CD8A外,该分析中产生的所有简化项目仍然保持CAD的预测。参见表23。
[0353] 实施例48:用于评估非糖尿病患者中CAD的算法的诊断准确度的验证
[0354] 此处我们报告用于阻塞性CAD可能性的基因表达算法的最初预期验证,定义为在具有可疑CAD的非糖尿病患者中引起≥50%腔的直径狭窄的一种或更多冠状粥样硬化病变。
[0355] 方法
[0356] 一般研究设计和研究人群
[0357] 2007年7月到2009年4月之间,受试者编入到PREDICT,39中心(US)前瞻性研究中。所述研究在所有参与中心和所有患者给予书面知情同意的情况下由机构评审委员会批准。涉及诊断冠状血管造影术的受试者是合格的,只要他们具有胸痛的历史、可疑的心绞痛等同症状、或者CAD的高风险,且先前没有已知心肌梗死(MI)、血管重建或阻塞性CAD。如果在导管插入时,受试者具有急性MI、高风险不稳定型心绞痛、严重的非冠脉心脏病(充血性心力衰竭、心肌病或瓣膜疾病)、全身感染或炎性状况或者正在服用免疫抑制或化学治疗剂,它们是不合格的。
[0358] 从2418个入组的符合选择标准的受试者,606个糖尿病患者被排除,因为该初始算法开发和验证集中在非糖尿病患者。剩余的1812个患者中,237个具有不适合QCA的血管造影影像,6个具有不可用的血样。对于剩余的1569个受试者,226个用于基因发现(Elashoff MR,Wingrove JA,Beineke P,等人Development of a Blood-based Gene Expression Algorithm for Assessment of Obstructive Coronary Artery Disease in Non-Diabetic Patients,submitted.Circulation:Cardiovascular Genetics.2010);剩余的1343个基于入组日期顺序分成独立算法开发和验证群组(图7)。
[0359] 临床评估和定量冠状血管造影术
[0360] 由调查研究协调者在研究场所使用标准化数据收集方法获得预定的临床数据,包括人口统计数据、药物治疗、病历和报告,以及MPI结果,且数据由独立的研究监督员核实。
[0361] 通过计算机辅助的QCA分析冠状动脉造影照片。特别地,将根据现场方案进行的临床指示的冠状动脉造影照片数字化、去标识和使用Cardiovascular Research Foundation,New York,NY(Lansky AJ,Popma JJ.Qualitative and quantitative angiography Philadelphia,PA:Saunders;1998Text Book of Interventional Cardiology))验证的定量方案,进行分析。受过训练的技师(不知晓临床和基因表达数据)在直径>1.5mm的血管中目视鉴别所有病变>10%直径狭窄(DS)。使用CMS Medis系统(Medis,version 7.1,Leiden,the Netherlands),技师跟踪最近的近端和远端的非患病的位置之间病变的血管腔。然后计算最小管腔直径(MLD)、参考管腔直径(RLD=病变的正常段近端和远端的平均直径)和%DS(%DS=(1-MLD/RLD)x100)。
[0362] 预期选择所述Diamond-Forrester(D-F)风险评分(包括年龄、性别和胸痛类型)来评估基因表达评分对临床因素的附加价值(Diamond GA,Forrester JS.Analysis of probability as an aid in the clinical diagnosis of coronary-artery disease.N Engl J Med.1979;300(24):1350-8)。基于受试者的会晤指定胸痛类型(典型性心绞痛、非典型性心绞痛和非心绞痛胸痛)的D-F分类(Diamond GA,Forrester JS.Analysis of probability as an aid in the clinical diagnosis of coronary-artery disease.N Engl J Med.1979;300(24):1350-8),以及指定D-F评分(Chaitman BR,Bourassa MG,DavisK等 人Angiographic prevalence of high-risk coronary artery disease in patient subsets(CASS).Circulation.1981;64(2):360-7)。不具有胸痛症状的受试者分类为非心绞痛胸痛。根据本地方案,如临床指示地进行MPI,且由有权使用临床数据而非基因表达或插管数据的本地阅读者解释。MPI定义为如果报告与阻塞性CAD一致的≥1的可逆或固定缺陷,则MPI为阳性。不确定或中间缺陷被认为是阴性。
[0363] 阻塞性CAD和疾病组定义
[0364] 具有阻塞性CAD的患者(N=192)预期定义为在主要冠状动脉(≥1.5mm腔的直径)中具有≥1动脉粥样硬化块的患者,导致通过QCA引起≥50%腔直径的狭窄;非阻塞性CAD(N=334)没有>50%的损害。
[0365] 血样
[0366] 冠状血管造影术之前,将静脉血样收集在 RNA保存试管中。根据制造商的说明书处理样品,然后冷冻于-20℃。
[0367] RNA纯化和RT-PCR
[0368] 使用Agencourt RNAdvance系统的全血样品的自动化RNA纯化、cDNA合成以及RT-PCR如描述的进行(Elashoff MR,Wingrove JA,Beineke P等人Development of a Blood-based Gene Expression Algorithm for Assessment of Obstructive Coronary Artery Disease in Non-Diabetic Patients,submitted.Circulation:Cardiovascular Genetics.2010)。全部PCR反应重复进行三次,中值用于分析。通过相对TFCP2和HNRPF的表达值标准化的跨剪切接头和内含子ADORA3测定的表达值的比较检测基因组DNA污染。进行RPS4Y1分析以验证所有患者的性别;如果与临床数据存在明显失配,将患者排除。预定义样品QC度量和取舍标准并在如所述评估结果前应用(Elashoff MR,Wingrove JA,Beineke P,等人Development of a Blood-based Gene Expression Algorithm for Assessment of Obstructive Coronary Artery Disease in Non-Diabetic Patients,submitted.Circulation:Cardiovascular Genetics.2010.)。
[0369] 统计方法
[0370] 对于表24的分析使用SAS版本9.1(SAS Institute Inc,Cary,NC,USA)。所有其它分析使用R版本2.7(R Foundation for Statistical Computing,Vienna,Austria)进行。除非另有指定,连续变量的单变量比较采用t检验,分类变量采用卡方检验。所有报告的P值是双侧的。
[0371] 基因表达算法评分
[0372] 在验证研究之前锁定算法。在所有统计分析中对于如描述和使用的23个算法基因、年龄和性别从中位表达值计算原始算法评分;评分线性转换为用于报告方便的0-40等级。
[0373] ROC估计和AUC比较
[0374] 估计ROC曲线用于a)基因表达算法评分、b)D-F风险评分、c)算法评分和D-F风险评分的组合模型、d)MPI和e)算法评分和MPI的组合模型。标准方法(Newson R.Confidence intervals for rank statistics:Somers′D and extensions.Stata Journal.2006;6:309-334.)用于估计经验ROC曲线和相关的AUC和AUC标准误。Z检验用于检验AUC对随机(AUC=.50)。
[0375] 配对AUC比较:i)基因表达算法评分加D-F风险评分对D-F风险评分,以及ii)基因表达算法评分加MPI对MPI;通过引导程序(bootstrap)进行。对于各个比较,进行10,000个引导程序重复,计算观察的AUC差异。所述中值引导程序的AUC差异用于估计AUC差异,使用引导程序的AUC差异的经验分布估计P值(即,在经验分布中观察的0AUC差异的分位数)。
[0376] 逻辑回归
[0377] 一系列的逻辑回归模型进行拟合,以疾病状态作为二元因变量,并使用套式模型之间的似然比检验进行比较。比较为:i)基因表达算法评分加D-F风险评分对单独的D-F风险评分;ii)基因表达算法评分加MPI对单独的MPI;iii)基因表达算法评分对所述基因表达算法评分的人口统计学成分。
[0378] 算法评分与最大百分狭窄的相关性
[0379] 算法评分和作为连续变量的百分最大狭窄之间的相关性通过线性回归进行评估。将狭窄值分组到5个渐增的类中(无可测量的疾病,1-24%,在≥1血管中25-49%,1血管≥50%,以及>1血管≥50%),ANOVA用于检验类间算法评分中的线性趋势。
[0380] 疾病状态的重新分类
[0381] 基因表达算法评分和D-F风险评分定义为低(0%~<20%)、中(≥20%,<50%)和高风险(≥50%)阻塞性CAD可能性。MPI结果分类为阴性(无缺损/可能的固定或可逆缺损)或阳性(固定或可逆缺损)。对于D-F风险评分分析,重新分类的受试者定义为i)D-F中度风险对低或高算法评分,ii)D-F高风险对算法低风险,或者iii)D-F低风险对算法高风险。对于MPI分析,重新分类的受试者包括i)MPI阳性对基于算法评分的低风险;或者ii)MPI阴性对基于算法评分的高风险。如在(Pencina MJ,D′Agostino RB,Sr.,D′Agostino RB,Jr.,Vasan RS.Evaluating the added predictive ability of a new marker:from area under the ROC curve to reclassification and beyond.Stat Med.2008;27(2):157-72;discussion 207-12.)中描述的,计算基因表达算法评分(和相关的P值)相对于D-F风险评分或MPI的净重新分类改善(NRI)。NRI为重新分类临床益处的测量,并对重新分类的分数和准确度敏感。
[0382] NRI公式
[0383] NRI作为阳性重新分类考虑他们的分类沿“正确”的方向移动(患病受试者移向更高的风险分类,和非患病受试者移向更低的风险分类)的那些患者。相似地,NRI作为阴性重新分类考虑他们的分类沿“错误”的方向移动(患病受试者移向更低的风险分类,和非患病受试者移向更高的风险分类)的那些患者。然后,NRI公式是阳性重新分类的分数和阴性重新分类的分类的差。
[0384] NRI=(p上,事件-p下,事件)-(p上,非事件-p下,非事件)
[0385] 其中:
[0386] p上,事件=#上移事件/#事件
[0387] p下,事件=#下移事件/#事件
[0388] p上,非事件=#上移非事件/#非事件
[0389] p下,非事件=#下移非事件/#非事件
[0390] 用于显著性检验,
[0391] z=NRI/(ve+vne)1/2
[0392] 其中:
[0393] ve=(p上,事件+p下,事件)/#事件
[0394] vne=(p上,非事件+p下,非事件)/#非事件
[0395] (公式来自{Pencina等人,2008})
[0396] 回归分析
[0397] D-F风险评分模型
[0398]模型项目 优势比 95%CI P值 模型AIC
D-F风险评分 1.018 1.012~1.023 <.001 652.53
[0399] 基因表达算法评分+D-F风险评分
[0400]模型项目 优势比 95%CI P值 模型AIC
D-F风险评分 1.012 1.007~1.018 <.001
基因表达算法评分 1.64 1.37~1.96 <.001 622.3
[0401] MPI模型
[0402]模型项目 优势比 95%CI P值 模型AIC
MPI 1.52 0.88~2.67 .14 388.53
[0403] 基因表达算法评分+MPI
[0404]模型项目 优势比 95%CI P值 模型AIC
MPI 1.04 0.57~1.90 .90
基因表达算法评分 1.85 1.45~2.37 <.001 362.15
[0405] 净效益分析
[0406] Vickers{Vickers等人,2008}定义诊断的净效益曲线为pt(表示假阳性和假阴性之间的折中的阈概率)的函数。所述曲线采用评分>pt=阳性的决策规则,在pt的可能值的范围内确定净效益的量。参考线反映a)所有阳性受试者(图8中较低的曲线)或b)所有阴性受试者(净效益=0的线)的净效益。所述基因表达算法的净效益曲线在图8中为上部曲线,并且在pt的临床相关范围内大于参考线。
[0407] 全临床模型
[0408] 方法
[0409] 为了进一步评估所述基因表达算法的附加值,开发了引入11个临床因素的“全”临床因素模型,该11个临床因素显示在开发集中阻塞性疾病和非阻塞性疾病患者之间单变量显著性(p<.05)。所述11个因素为:
[0410] ●性别
[0411] ●年龄
[0412] ●胸痛类型
[0413] ●种族
[0414] ●抑制素使用
[0415] ●阿司匹林使用
[0416] ●抗血小板药使用
[0417] ●ACE抑制剂使用
[0418] ●收缩血压
[0419] ●高血压
[0420] ●血脂异常
[0421] 逻辑回归模型随后使用疾病状态作为因变量以及这11个因素作为预测元变量进行拟合。受试者的“全临床模型评分”是受试者来自该模型的预期价值。
[0422] 结果
[0423] 对所述验证组报告结果,所述全临床模型的AUC为.732,且基因表达算法加全临床模型的AUC为.745(p=.09)。基因表达算法加全临床模型对单独全部临床模型的套式逻辑回归比较得到的P值为.014。
[0424] 基因表达算法加全临床模型对单独全临床模型的NRI为10%(p=.02)。
[0425] 讨论
[0426] 此处评估的全临床模型进一步支持算法评分增加到PREDICT群体中已知或明显临床因素中的观念。该模型受到缺乏独立验证的影响,如对Diamond-Forrester设计所进行的,因此它的作用是作为初级的比较器。
[0427] 统计离群值评估
[0428] 基于下述标准:∑|gi-mi|>27,其中gi为第i个基因的表达值和mi为开发集的第i个基因的中位表达值,样品分类为基因表达离群值。
[0429] 结果
[0430] 来自PREDICT试验的总共1343位非糖尿病患者(2007年7月到2009年4月入组)被顺序地分配到独立开发(N=694)和验证(N=649)集中。对于非糖尿病患者的限制是基于在依赖糖尿病状态的CAD分类基因集中观察的显著性差异(Elashoff MR,Wingrove JA,Beineke P等人,Development of a Blood-based Gene Expression Algorithm for Assessment of Obstructive Coronary Artery Disease in Non-Diabetic Patients,submitted.Circulation:Cardiovascular Genetics.2010.)。患者流、集的分配和排除情况示于图7中。排除后,按疾病状态的这些组的人口统计学和临床特征概述在表24中。所述开发和验证集的临床特征相似。总体上,受试者57%为男性,37%具有阻塞性CAD,和26%没有可检测的CAD。在两个群组中与阻塞性CAD相关的显著性临床和人口统计变量为增加的年龄、男性性别、胸痛类型、升高的收缩血压(所有p<0.001)、高血压(p=0.001)和白色人种(p=0.015)。
[0431] 如上所述开发基因表达算法,阻塞性CAD由QCA定义为在≥1主要冠状动脉中≥50%狭窄。这符合在临床血管造影读数的基础上近似65-70%的狭窄。所述23个算法基因(被分组在6个项目中,4个性别独立的和2个性别特异性的)示意性地示于图中。随后的分析仅对于独立验证组。
[0432] ROC分析
[0433] 预期确定的初级端点为疾病状态的算法评分预测的ROC曲线下面积。所述AUC是0.70±0.02,(p<0.001),在男性(0.66)和女性(0.65)子集(各为P<0.001)中具有独立的显著性性能。作为临床比较器,我们使用Diamond-Forrester(D-F)风险评分,其被开发以定量当前CAD的可能性并在大的群组中被验证(Diamond GA,Forrester JS.Analysis of probability as an aid in the clinical diagnosis of coronary-artery
disease.N Engl J Med.1979;300(24):1350-8.;Chaitman BR,Bourassa MG,Davis K等人Angiographic prevalence of high-risk coronary artery disease in patient subsets(CASS).Circulation.1981;64(2):360-7.)。与单独的D-F风险评分相比,ROC分析显示对于算法评分和D-F风险评分的组合的更高AUC(AUC 0.72对0.66,p=0.003,图
9)。
[0434] PREDICT中非侵入式成像的最普遍的形式为MPI。在验证集中,310位患者具有临床上显示的进行的MPI,其中72%为阳性。比较的ROC分析显示对于组合的算法评分和MPI对单独的MPI具有增加的AUC(AUC 0.70对0.54,p<0.001)。
[0435] 灵敏性,特异性
[0436] 在14.75的算法评分阈下测定敏感性和特异性,相当于20%的疾病可能性,33%的患者具有低于该值的评分。在该阈值下,敏感性为85%,特异性为43%,相当于分别为83%和46%的阴性和阳性预测值。
[0437] 回归分析
[0438] 一系列的套式逻辑回归模型(参见方法)用于评估所述算法评分和其它预测器的独立贡献。算法评分增加到D-F风险评分(p<0.001),并增加到MPI(p<0.001),且算法基因表达项目增加到(p=0.003)算法人口统计项目(参见方法)。
[0439] 与疾病严重性的关联
[0440] 所述算法评分与最大百分狭窄相关(R=0.34,p<0.001),且平均算法评分随着百分最大狭窄的增加而单调地增加(p<0.001,图10)。患有和未患有阻塞性CAD的患者的平均评分分别为25和17。
[0441] 重新分类
[0442] 重新分类可以是比例如AUC的标准测量更加临床相关的预测器相当性能的测量(Cook NR,Ridker PM.Advances in measuring the effect of individual predictors of cardiovascular risk:the role of reclassification measures.Ann Intern Med.2009;150(11):795-802.)。表25A和25B显示基因表达算法与D-F风险评分和MPI比较的重新分类结果。在该研究中,与所述D-F风险评分相比,所述基因表达算法评分的净重新分类改善为20%(p<0.001),与MPI相比为21%(p<0.001)。
[0443] 在具有中间D-F风险评分的患者中,78%(75/96)的患者通过基因表达算法重新分类。特别地,对于中间D-F组,22%(21/96)正确地和8%(7/96)错误地重新分类为低风险;27%(26/96)正确地和22%(21/96)错误地重新分类为高风险。额外的38个D-F低风险患者(15%)被重新分类为高风险(22个正确,16个错误),28个D-F高风险受试者(16%)被重新分类为低风险(22个正确,6个错误)。总体上,当发生重新分类错误时,它们达到更高的风险种类,与具有比PPV更高NPV的基因表达算法一致。
[0444] 讨论
[0445] 本研究在非糖尿病患者中预期地验证了对于由QCA限定的阻塞性CAD的非侵入式试验,它是基于循环全血细胞、年龄和性别的基因表达。本研究扩展了我们以前的关于血中基因表达变化与CAD的相关性(Wingrove JA,Daniels SE,Sehnert AJ等人,Correlation of Peripheral-Blood Gene Expression With the Extent of Coronary Artery Stenosis.Circulation:Cardiovascular Genetics.2008;1(1):31-38.)以通过ROC分析预期对于具有阻塞性CAD的非糖尿病患者的分类器的验证的工作(Elashoff MR,Wingrove JA,Beineke P,等人Development of a Blood-based Gene Expression Algorithm for Assessment of Obstructive Coronary Artery Disease in Non-Diabetic Patients,submitted.Circulation:Cardiovascular Genetics.2010.)。所述试验得到具有更高评分的数值评分(0-40),对应于阻塞性CAD的更高可能性和更高的最大百分狭窄。
[0446] 这暗示患者临床风险或状态(如通过NRI收集的)的重新分类可以是比用于评估潜在的生物标志物的相当ROC分析更加合适的测量方法(Pencina MJ,D′Agostino RB,Sr.,D′Agostino RB,Jr.,Vasan RS.Evaluating the added predictive ability of a new marker:from area under the ROC curve to reclassification and beyond.Stat Med.2008;27(2):157-72;discussion207-12.;Cook NR,Ridker PM.Advances in measuring the effect of individual predictors of cardiovascular risk:the role of reclassification measures.Ann Intern Med.2009;150(11):795-802.)。相对于所述D-F评分,基因表达算法评分改善NRI显示的临床CAD评估的准确度20%。对于最普遍的非侵入式试验,MPI,所述NRI为21%,虽然这些结果很可能被该血管造影涉及人群中固有的转诊偏见混淆。总体上,独立于MPI的结果或D-F风险类别,增大的基因表达评分单调地导致阻塞性CAD的风险增加(表25A、B)。
[0447] 相对于当前的非侵入式CAD诊断模式,本基因表达试验可具有临床优点,因为它仅需要抽取标准的静脉血,且不需要照射、静脉内对比或者生理和药理应激原。改善CAD的非侵入式评估的一个潜在的临床益处是减少不具有阻塞性CAD的患者中侵入式诊断冠状动脉造影照片。在验证群组中,例如,仅37%的经受侵入式血管造影术的患者具有阻塞性CAD,该比率在妇女中特别的低(26%)。在非常大的登记名册中不具有先前已知CAD的患者的血管造影术的相似总体阻塞性CAD比例最近被报道,其对阻塞性CAD的准确定义具有小的灵敏度(Patel MR,Peterson ED,Dai D等人,Low diagnostic yield of elective coronary angiography.N Engl J Med.2010;362(10):886-95.)。此处描述的基因表达试验鉴别在33%的涉及侵入式血管造影术的患者中阻塞性CAD的低可能性(<20%),即使这些患者的大多数通过临床因素分析也处于低风险(表25A)。
[0448] 结论
[0449] 我们描述了基于外周血的基因表达试验的前瞻多中心验证以确定侵入式血管造影术定义的非糖尿病患者中阻塞性CAD的可能性。本试验提供临床因素和患者CAD状态分类测量的非侵入式成像的附加信息。本试验的临床应用可以减少具有可疑CAD的患者的进一步测试。
[0450] 虽然已经详细地示出并参照优选的实施方式和多种代替实施方式描述了本发明,但是相关领域的技术人员应当理解,此处可以做出多种形式和内容上的变化,而不脱离本发明的实质和范围。
[0451] 为了所有目的,本说明书的主体中引用的全部参考文献、授权的专利和专利申请的全部内容由此通过引用的方式并入到本申请中。
[0452] 参考文献
[0453] 1.Diamond GA,Forrester JS.Analysis of probability as an aid in the clinical diagnosis of coronary-artery disease.N Engl J Med.1979;300(24):1350-1358.
[0454] 2.Chaitman BR,Bourassa MG,Davis K,Rogers WJ,Tyras DH,Berger R,Kennedy JW,Fisher L,Judkins MP,Mock MB,Killip T.Angiographic prevalence of high-risk coronary artery disease in patient subsets(CASS).Circulation.1981;64(2):360-367.
[0455] 3.Ridker PM,Buring JE,Rifai N,Cook NR.Development and validation of improved algorithms for the assessment of global cardiovascular risk in women:the Reynolds Risk Score.Jama.2007;297(6):611-619.
[0456] 4.Hansson GK,Libby P,Schonbeck U,Yan ZQ.Innate and adaptive immunity in the pathogenesis of atherosclerosis.Circ Res.2002;91(4):281-291.
[0457] 5.Libby P,Ridker PM,Maseri A.Inflammation and atherosclerosis.Circulation.2002;105(9):1135-1143.
[0458] 6.Sinnaeve PR,Donahue MP,Grass P,Seo D,Vonderscher J,Chibout SD,Kraus WE,Sketch M,Jr.,Nelson C,Ginsburg GS,Goldschmidt-Clermont PJ,Granger CB.Gene expression patterns in peripheral blood correlate with the extent of coronary artery disease.PLoS One.2009;4(9):e7037.
[0459] 7.Wingrove JA,Daniels SE,Sehnert AJ,Tingley W,Elashoff MR,Rosenberg S,Buellesfeld L,Grube E,Newby LK,Ginsburg GS,Kraus WE.Correlation of Peripheral-Blood Gene Expression With the Extent of Coronary Artery Stenosis.Circulation:Cardiovascular Genetics.2008;1(1):31-38.
[0460] 8.Horne BD,Anderson JL,John JM,Weaver A,Bair TL,Jensen KR,Renlund DG,Muhlestein JB.Which white blood cell subtypes predict increased cardiovascular risk?J Am Coll Cardiol.2005;45(10):1638-1643.
[0461] 9.Gibbons RJ,Abrams J,Chatterjee K,Daley J,Deedwania PC,Douglas JS,Ferguson TB,Jr.,Fihn SD,Fraker TD,Jr.,Gardin JM,O′Rourke RA,Pasternak RC,Williams SV.ACC/AHA 2002 guideline update for the management of patients with chronic stableangina--summary article:a report of the AmericanCollege of Cardiology/American Heart Association Task Force on practice guidelines(Committee on the Management of Patients With Chronic Stableangina).J Am Coll Cardiol.2003;41(1):159-168.
[0462] 10.Patel MR,Peterson ED,Dai D,Brennan JM,Redberg RF,Anderson HV,Brindis RG,Douglas PS.Low diagnostic yield of elective coronary angiography.N Engl J Med.2010;362(10):886-895.
[0463] 11.Wang L,Hauser ER,Shah SH,Pericak-Vance MA,Haynes C,Crosslin D,Harris M,Nelson S,Hale AB,Granger CB,Haines JL,Jones CJ,CrossmanD,Seo D,Gregory SG,Kraus WE,Goldschmidt-Clermont PJ,Vance JM.Peakwide mapping on chromosome3q13 identifies the kalirin gene as anovel candidate gene for coronary artery disease.Am J Hum Genet.2007;80(4):650-663.
[0464] 12.Rosenberg S,Elashoff MR,Beineke P,Daniels SE,Wingrove JA,Tingley WG,Sager PT,Sehnert AJ,Yau Y,Kraus W,Newby L,Schwartz R,Voros S,Ellis S,Tahirkheli N,Waksman R,McPherson J,Lansky A,SchorkN,Winn M,Topol E.Multi-Center Validation of the Diagnostic Accuracy ofa Blood-based Gene Expression Test for Assessment of Obstructive Coronary Artery Disease in non-Diabetic Patients.Submitted;2010.
[0465] 13.Zheng Q,Wang XJ.GOEAST:a web-based software toolkit for Gene Ontology enrichment analysis.Nucleic AcidsRes.2008;36(Web Server issue):W358-363.
[0466] 14.Brunet JP,Tamayo P,Golub TR,Mesirov JP.Metagenes and molecular pattern discovery using matrix factorization.Proc Natl Acad Sci U S A.2004;101(12):4164-4169.
[0467] 15.Tibshirani R.Regression shrinkage and selection via the lasso.J.Royal Statistical Society B.1996;58:267-288.
[0468] 16.Brown PJ.Measurement,Regression,and Calibration.Oxford,UK:Oxford University Press;1994.
[0469] 17.Hamblin M,Chang L,Fan Y,Zhang J,Chen YE.PPARs and the cardiovascular system.Antioxid Redox Signal.2009;11(6):1415-1452.
[0470] 18.Ellegren H,Parsch J.The evolution of sex-biased genes and sex-biased gene expression.Nat Rev Genet.2007;8(9):689-698.
[0471] 19.Hong MG,Myers AJ,Magnusson PK,Prince JA.Transcriptome-wide assessment of human brain and lymphocyte senescence.PLoS One.2008;3(8):e3024.[0472] 20.Rana JS,Boekholdt SM,Ridker PM,Jukema JW,Luben R,Bingham SA,Day NE,Wareham NJ,Kastelein JJ,Khaw KT.Differential leucocyte count and the risk of future coronary artery disease in healthy men and women:the EPIC-norfolk Prospective Population Study.J Intern Med.2007;262(6):678-689.
[0473] 21.Su AI,Wiltshire T,Batalov S,Lapp H,Ching KA,Block D,Zhang J,Soden R,Hayakawa M,Kreiman G,Cooke MP,Walker JR,Hogenesch JB.A gene atlas of the mouse and human protein-encoding transcriptomes.Proc Natl Acad Sci U S A.2004;101(16):6062-6067.
[0474] 22.Hasegawa H,Yamada Y,Harasawa H,Tsuji T,Murata K,Sugahara K,Tsuruda K,Masuda M,Takasu N,Kamihira S.Restricted expression of tumor necrosis factor-related apoptosis-inducing ligand receptor 4in human peripheral blood lymphocytes.Cell Immunol.2004;231(1-2):1-7.
[0475] 23.Lim SY,Raftery MJ,Goyette J,Hsu K,Geczy CL.Oxidative modifications of S100 proteins:functional regulation by redox.J Leukoc Biol.2009.
[0476] 24.Yamasaki S,Ishikawa E,Sakuma M,Hara H,Ogata K,Saito T.Mincle is an ITAM-coupled activating receptor that senses damaged cells.Nat Immunol.2008;9(10):1179-1188.
[0477] 25.Teixeira VH,Olaso R,Martin-Magniette ML,Lasbleiz S,Jacq L,Oliveira CR,Hilliquin P,Gut I,Cornelis F,Petit-Teixeira E.Transcriptome analysis describing new immunity and defense genes in peripheral blood mononuclear cells of rheumatoid arthritis patients.PLoS One.2009;4(8):e6803.
[0478] 26.Chung CP,Oeser A,Raggi P,Gebretsadik T,Shintani AK,Sokka T,Pincus T,Avalos I,Stein CM.Increased coronary-artery atherosclerosis in rheumatoid arthritis:relationship to disease duration and cardiovascular risk factors.Arthritis Rheum.2005;52(10):3045-3053.
[0479] 27.Cruz-Munoz ME,Dong Z,Shi X,Zhang S,Veillette A.Influence of CRACC,a SLAM family receptor coupled to the adaptor EAT-2,on natural killer cell function.Nat Immunol.2009;10(3):297-305.
[0480] 28.Kim DK,Kabat J,Borrego F,Sanni TB,You CH,Coligan JE.HumanNKG2F is expressed and can associate with DAP12.Mol Immunol.2004;41(1):53-62.
[0481] 29.Whitman SC,Rateri DL,Szilvassy SJ,Yokoyama W,Daugherty A.Depletion of natural killer cell function decreases atherosclerosis in low-density lipoprotein receptor null mice.Arterioscler Thromb Vasc Biol.2004;24(6):1049-1054.
[0482] 30.Major AS,Fazio S,Linton MF.B-lymphocyte deficiency increases atherosclerosis in LDL receptor-null mice.Arterioscler Thromb Vasc Biol.2002;22(11):1892-1898.
[0483] 31.Robertson AK,Hansson GK.T cells in atherogenesis:for better or for worse?Arterioscler Thromb Vasc Biol.2006;26(11):2421-2432.
[0484] 32.Park MY,Hastie T,Tibshirani R.Averaged gene expressions for regression.Biostatistics.2007;8(2):212-227
[0485] 表
[0486]
[0487]
[0488]
[0489]
[0490]
[0491]
[0492]
[0493]
[0494]
[0495]
[0496]
[0497]
[0498]
[0499]
[0500]表5
标志物符号
AA303143
AA601031
ABCC2
ABHD2
ABHD5
ABLIM1
ACO2
ACOX1
ACSL1
ACTB
ACVR2B
ADA
ADNP
AF034187
AF085968
AF161353
AF471454
AI276257
AIM1L
AK021463
AK022268
AK023663
AK024956
AK056689
AK092942
AK098835
AK124192
ALOX12
ALOX5
ALOX5AP
ALS2CR13
AMBN
AMFR
AMICA1
ANXA2
ANXA3
AOAH
AP1S2
APBA2
APBB1
APEH
APH1A
APOBEC3G
APRT
AQP2
AQP8
ARG1
ARHGAP24
ARHGAP9
ARHGDIA
ARID5B
ARPC1B
ASCL2
ATG3
ATP1B2
ATP5D
ATP6V0B
ATP7B
AW076051
AW579245
AX721252
AY003763
AY062331
A_23_P158868
A_23_P335398
A_23_P348587
A_23_P44053
A_24_P101960
A_24_P144383
A_24_P221375
A_24_P238427
A_24_P384604
A_24_P417996
A_24_P418712
A_24_P745883
A_24_P84408
A_24_P916228
A_24_P929533
A_32_P28158
A_32_P62137
B2M
B4GALT5
BACH2
BAGE
BAZ1A
BBS2
BC024289
[0501]
[0502]
[0503]BC031973
BC038432
BC043173
BC062739
BC073935
BCL2A1
BCL3
BCL6
BCL7A
BG777521
BI024548
BI026064
BM703463
BMX
BOP1
BQ365891
BRF1
BRI3
BST1
BTBD14A
BTNL8
BU633383
BX110908
BYSL
C10orf54
C11orf2
C12orf35
C14orf156
C15orf38
C16orf24
C16orf57
C1orf96
C20orf24
C20orf3
C20orf77
C2orf39
C6orf129
C6orf32
C7orf34
C8orf31
C9orf19
CALM3
CAMKK2
CAPNS1
CASP4
CASP5
CBS
CCDC108
CCDC92
CCL3L3
CCPG1
CD200
CD248
CD302
CD3D
CD3E
CD5
CD58
CD6
CD7
CD79B
CD93
CD96
CDKL5
CDKN1A
CEACAM4
CEBPB
CEBPD
CFLAR
CFP
CHI3L2
CIB3
CKLF
CLEC12A
CLEC2D
CLEC4D
CLEC4E
CLIC1
CMTM2
CNTNAP2
COL14A1
COMMD6
COP1
COX6B2
COX6C
CPD
CR2
CR593845
CR610181
CR613361
CR613944
CREB5
CRIP1
CRISPLD2
CSF2RA
CSF2RB
CSTA
CTBP2
CYB5D2
CYP1A2
CYP4F2
CYP4F3
CYP4F8
DCXR
DDX11
DDX3Y
DEDD2
DEFA4
DEK
DENND3
DHRS3
DHRS7B
DHRSX
DKFZP434B0335
DKFZp434F142
DKFZp547E087
DOCK10
DOCK8
DOK3
DPF3
DPPA5
DRAP1
DUOX2
DUSP13
DUSP3
DYNLT1
ECH1
ECHDC3
[0504]
[0505]
[0506]
[0507]EEF2
EIF1AX
EIF2AK2
EIF2C4
EIF4B
EIF5A
EMP3
EMR3
ENST00000337102
ENST00000360102
ENTPD1
ETS 1
EXOC6
EXOSC6
F5
FAIM3
FAM108A1
FAM113B
FAM26B
FAM44A
FAU
FBXL5
FCAR
FCER1A
FGD4
FIBP
FKBP5
FKBP9
FLJ22662
FLJ40092
FNDC3B
FOS
[0508]FOXJ1
FOXP1
FPR1
FRAT1
FRAT2
FRS2
FRS3
FTH1
FXYD5
FYB
GADD45GIP1
GAMT
GBP2
GCA
GLRX
GLT1D1
GLUL
GMFG
GNB1
GPA33
GPBAR1
GPC1
GPD1
GPR160
GPR172A
GPR37L1
GRB10
GSTT1
GTF2I
GYG1
H2AFZ
H3F3A
[0509]HAL
HAP1
HDAC4
HDDC2
HDGFL1
HEBP2
HIST1H2AC
HIST1H2AJ
HIST1H2AM
HIST1H2BC
HIST2H2AC
HLA-DRB5
HLA-E
HLA-F
HMGB2
HOMER3
HOXB7
HSBP1
HSDL2
HSPA1A
HSPB1
HTATIP2
ID2
ID3
IFITM4P
IGF2R
IGHA1
IGHD
IGHM
IL13RA1
IL18R1
IL1R2
[0510]IL23A
IL7R
IMPA2
IMPDH1
INCA
IRAK3
ISG20
ITM2C
JDP2
KCNE3
KCNG1
KCNJ15
KIAA0319L
KIAA1430
KIAA1833
KLF6
KLHL3
KLRC4
KSR1
LAG3
LAMP2
LAT2
LCK
LHPP
LILRA2
LILRB3
LILRP2
LIMS2
LIN7A
LIN7B
LOC137886
LOC149703
[0511]LOC150166
LOC153546
LOC220433
LOC389641
LOC401233
LOC401357
LOC439949
LOC440104
LOC440348
LOC440731
LOC497190
LOC644246
LOXL2
LPGAT1
LRRK2
LSM10
LSM7
LST1
LTBP2
LTBP3
LY96
MACF1
MAGED1
MAGED2
MAGEH1
MAK
MAN1C1
MAN2A2
MAP1LC3B
MAP3K2
MAP3K3
MAP4K4
[0512]MAPK14
MAPK8IP1
MAX
MBOAT2
MCL1
MEA1
MEGF10
METTL9
MGAM
MGC14425
MLKL
MLSTD2
MMD
MME
MMP9
MNDA
MORC3
MOSC1
MOSPD2
MPZL1
MRLC2
MRPL42P5
MRPL53
MSRB2
MST150
MUC20
MUM1
MXD1
MYBPH
MYC
MYH14
MYL6
[0513]MYO15B
MYO1F
MYO1G
NAPSA
NAPSB
NBPF11
NCF4
NDRG2
NDUFB3
NDUFS8
NFATC1
NFIL3
NGFRAP1
NIN
NMI
NMT2
否VA1
NPIP
NRBF2
NRIP3
NRP1
NRSN2
NUDT16
OLIG1
OR4C15
OR52B2
OSBPL2
OSBPL6
OSTF1
OXNAD1
PACSIN2
[0514]PADI4
PARP1
PDCD7
PDE9A
PDK2
PDLIM7
PELI1
PFDN5
PFKFB3
PGD
PHB
PHC2
PHF5A
PHGDH
PIK3C2B
PIM2
PISD
PITPNA
PLA2G4A
PLA2G7
PLAG1
PLD3
PLEKHA1
PLEKHM1
PLXNC1
POLR2A
PPP1R12B
PPP4R2
PRAP1
PRKAR1A
PRKAR1B
PRKCA
[0515]PRKCD
PRKDC
PRKY
PRSS23
PSMB9
PSMD8
PTEN
PTOV1
PTPRCAP
PTPRK
PTPRM
PXK
PYCARD
PYGL
QPCT
QPRT
RAB24
RAB27A
RAB31
RAB32
RABGAP1L
RABIF
RAC1
RAC2
RAI1
RALB
RALGDS
RARA
RASSF2
RBP7
RCC2
REEP5
[0516]REPS2
RFWD2
RGS16
RGS2
RHOG
RHOH
RIMS4
RIT1
RMND5A
RNF130
RNF182
RNF24
ROCK2
ROPN1L
RPL17
RPL18A
RPL22
RPL31
RPL34
RPL36A
RPL37
RPL39
RPS10
RPS15
RPS21
RPS27
RPS27A
RPS28
RPS4X
RPUSD2
RRN3
RTN3
[0517]S100A11
S100A12
S100A8
S100A9
S100P
SAMSN1
SAP30
SCRN2
SDCBP
SEC14L1
SEC22B
SEPX1
SERINC1
SERPINB1
SERPINB8
SERPINE1
SF3B14
SFT2D1
SGCE
SH2D5
SLA
SLC16A3
SLC1A7
SLC22A15
SLC22A4
SLC25A37
SLC2A10
SLC2A14
SLC2A8
SLC35B4
SLC37A3
SLC40A1
[0518]SLC45A2
SLC8A1
SLIT3
SMARCD3
SMC1A
SMUG1
SOD2
SP100
SPIB
SPRR2C
SRM
SRPK1
SSBP4
ST6GAL1
STAT5A
STC1
STK17B
STMN1
STX10
STX3
SULT1B1
SYNCRIP
SYT15
TAF9B
TALDO1
TANK
TARP
TAX1BP1
TBCD
TBL1XR1
TCEAL1
TCF3
[0519]TCF7
THBD
TLR2
TLR8
TM7SF2
TMEM102
TMEM48
TMEM49
TMEM68
TMEM86A
TNFAIP6
TNFRSF10A
TP53I11
TP53TG3
TPST1
TRA@
TRAPPC2L
TREM1
TRIB1
TRIM7
TSEN34
TSPAN13
TSPAN16
TSPAN33
TUFM
TXN
TYROBP
U2AF1
UBC
UBE2D3
UBE2G2
UBL5
[0520]UBQLN1
UCP2
UPF3A
URG4
USP11
USP53
USP6
VKORC1
VWCE
WDFY3
WDR18
XKR8
XPR1
YOD1
YPEL4
ZBED1
ZCCHC6
ZNF135
ZNF234
ZNF346
ZNF438
ZNF550
ZNF618
[0521]
[0522]
[0523]
[0524]
[0525]
[0526]
[0527]
[0528]
[0529]
[0530]
[0531]
[0532]
[0533]
[0534]
[0535]
[0536]
[0537]
[0538]
[0539]
[0540]
[0541]
[0542]
[0543]
[0544]
[0545]
[0546]
[0547]
[0548]
[0549]
[0550]
[0551]
[0552]
[0553]
[0554]
[0555]
[0556]
[0557]
[0558]
[0559]
[0560]
[0561]
[0562]
[0563]
[0564]
[0565]
[0566]
[0567]
[0568]
[0569]
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈