首页 / 专利库 / 诊断设备和程序 / 鉴别诊断 / 用于自身免疫疾病的鉴别诊断的方法

用于自身免疫疾病鉴别诊断的方法

阅读:246发布:2020-05-12

专利汇可以提供用于自身免疫疾病鉴别诊断的方法专利检索,专利查询,专利分析的服务。并且本文提供了用于自身免疫 疾病 的疾病进展的 鉴别 诊断 和检测的方法、测定和装置。本文提供的方法、测定和装置产生并分析模拟肽阵列上的外周血 抗体 的结合模式,其区分自身免疫疾病,并鉴定进展为内脏器官并发症如间质性 肺 病(ILD)和胃窦血管扩张(GAVE)或肾脏损害的患者。,下面是用于自身免疫疾病鉴别诊断的方法专利的具体信息内容。

1.一种对自身免疫疾病进行鉴别诊断的方法,所述方法包括:
(a)使来自受试者的样品与包含至少10,000个不同的原位合成的肽的肽阵列接触
(b)检测所述样品中存在的抗体与所述阵列上的至少25个肽的结合,以获得结合信号的组合;以及
(c)将结合信号的所述组合与一组或多组参考结合信号的组合进行比较,其中参考结合信号的组合的每个所述组中的至少一个从已知患有与所述受试者的自身免疫疾病不同的疾病的多个参考受试者获得,从而能够对所述受试者的自身免疫疾病进行鉴别诊断,其中所述方法性能的特征为所述自身免疫疾病与参考结合信号的组合的每个组之间的受试者工作特征(ROC)曲线下面积(AUC)大于0.6。
2.如权利要求1所述的方法,其中通过检测来自所述参考组中的所述多个受试者中的每一个的样品中存在的抗体与包含至少10,000个不同的原位合成的肽的肽阵列上的所述至少25个肽的结合来获得参考结合信号的所述组合中的每个组合。
3.如权利要求2所述的方法,其中针对所述至少25个肽的结合信号的所述组合与所述参考结合信号的所述组合之间的差异确定所述鉴别诊断。
4.如权利要求1所述的方法,其中所述不同的疾病是自身免疫疾病。
5.如权利要求1所述的方法,进一步包括:
(d)将结合信号的所述组合与从已知患有所述自身免疫疾病的多个参考受试者获得的参考结合信号进行比较。
6.如权利要求4所述的方法,其中所述自身免疫疾病是皮肌炎(DM),并且所述不同的自身免疫疾病是硬皮病(SSc)。
7.如权利要求6所述的方法,其中与所述阵列中的所述至少10,000个肽相比,区分结合信号的所述组合与所述参考结合信号的所述组合的所述至少25个肽对于选自丝酸、甘氨酸、酪氨酸、精氨酸、丙氨酸、谷氨酰胺和缬氨酸的一种或多种氨基酸而言富集至少100%。
8.如权利要求6所述的方法,其中与所述阵列中的所述至少10,000个肽相比,区分结合信号的所述组合与所述参考结合信号的所述组合的所述至少25个肽对于图13A所列的一个或多个基序而言富集。
9.如权利要求1所述的方法,进一步包括将来自所述受试者的结合信号与从健康受试者获得的参考结合信号的组合进行比较。
10.如权利要求9所述的方法,其中所述自身免疫疾病是SSc,并且区分结合信号的所述组合与所述参考结合信号的所述组合的所述至少25个肽对于选自酪氨酸、赖氨酸、精氨酸、苯丙氨酸、丝氨酸、色氨酸、甘氨酸和丙氨酸的一种或多种氨基酸而言富集至少100%。
11.如权利要求9所述的方法,其中所述自身免疫疾病是SSc,并且与所述阵列中的所述至少10,000个肽相比,区分结合信号的所述组合与所述参考结合信号的所述组合的所述至少25个肽对于图5A所列的一个或多个基序而言富集。
12.如权利要求9所述的方法,其中所述自身免疫疾病是DM,并且区分结合信号的所述组合与所述参考结合信号的所述组合的所述至少25个肽对于选自酪氨酸、色氨酸、丝氨酸、甘氨酸、天冬氨酸和苯丙氨酸的一种或多种氨基酸而言富集至少100%。
13.如权利要求9所述的方法,其中所述自身免疫疾病是DM,并且与所述阵列中的所述至少10,000个肽相比,区分结合信号的所述组合与所述参考结合信号的所述组合的所述至少25个肽对于图17A中所列的一个或多个基序而言富集。
14.如权利要求1所述的方法,其中所述自身免疫疾病是SSc,并且其中所述一组参考结合信号包含从患有其他自身免疫疾病的多个受试者获得的结合信号的组合,所述其他自身免疫疾病包括混合结缔组织病(MCTD)、未分化结缔组织病(UCTD)、肌炎、多肌炎、系统性红斑狼疮和硬斑病。
15.如权利要求14所述的方法,其中所述自身免疫疾病是SSc,并且区分结合信号的所述组合与所述参考结合信号的所述组合的所述至少25个肽对于选自天冬氨酸、谷氨酸、脯氨酸、缬氨酸、甘氨酸和丝氨酸的一种或多种氨基酸而言富集至少100%。
16.如权利要求14所述的方法,其中所述自身免疫疾病是SSc,并且与所述阵列中的所述至少10,000个肽相比,区分结合信号的所述组合与所述参考结合信号的所述组合的所述至少25个肽对于图7A中所列的一个或多个基序而言富集。
17.如权利要求1所述的方法,其中所述自身免疫疾病是DM,并且其中所述一组参考结合信号包含从患有其他自身免疫疾病的多个受试者获得的结合信号的组合,所述其他自身免疫疾病包括MCTD、UCTD、肌炎、多肌炎、系统性红斑狼疮和硬斑病。
18.如权利要求17所述的方法,其中所述自身免疫疾病是DM,并且区分结合信号的所述组合与所述参考结合信号的所述组合的所述至少25个肽对于选自赖氨酸、组氨酸、丝氨酸、精氨酸、谷氨酸、丙氨酸和甘氨酸的一种或多种氨基酸而言富集至少100%。
19.如权利要求16所述的方法,其中所述自身免疫疾病是DM,并且与所述阵列中的所述至少10,000个肽相比,区分结合信号的所述组合与所述参考结合信号的所述组合的所述至少25个肽对于图19A中所列的一个或多个基序而言富集。
20.如权利要求1所述的方法,其中所述方法性能的特征为所述受试者工作特征(ROC)曲线下面积(AUC)在0.60至0.70、0.70至0.79、0.80至0.89或0.90至1.00的范围内。
21.一种用于确定已知患有自身免疫疾病的受试者的疾病进展的方法,所述方法包括:
(a)使来自受试者的样品与包含至少10,000个不同的原位合成的肽的肽阵列接触;
(b)检测所述样品中存在的抗体与所述阵列上的至少25个肽的结合,以获得结合信号的第一组合;以及
(c)将结合信号的所述第一组合与至少参考结合信号的第二组合进行比较,其中所述参考结合信号的第二组合包括从包括具有指示所述自身免疫疾病的进展的临床表现的多个受试者的参考组获得的结合信号的组合,从而进行所述鉴别诊断,其中所述方法性能的特征为受试者工作特征(ROC)曲线下面积(AUC)大于0.6。
22.如权利要求21所述的方法,进一步包括:
(d)将结合信号的所述组合与从已知患有所述自身免疫疾病的多个参考受试者获得的参考结合信号进行比较。
23.如权利要求21所述的方法,其中通过检测来自所述参考组中的所述多个受试者中的每一个的样品中存在的抗体与包含至少10,000个不同的原位合成的肽的肽阵列上的所述至少25个肽的结合来获得参考结合信号的所述组合中的每个组合。
24.如权利要求23所述的方法,其中针对所述至少25个肽的结合信号的所述组合与所述参考结合信号的所述组合之间的差异确定所述疾病进展。
25.如权利要求21所述的方法,其中所述疾病进展在硬皮病(SSc)中确定。
26.如权利要求21所述的方法,其中所述疾病进展在SSc中确定,并且所述临床表现选自肾危象、间质性病(ILD)和胃窦血管扩张(GAVE)。
27.如权利要求21所述的方法,其中所述疾病进展在患有SSc的受试者中确定,并且所述临床表现是肾危象。
28.如权利要求27所述的方法,其中与所述阵列中的所述至少10,000个肽相比,区分结合信号的所述组合与所述参考结合信号的所述组合的所述至少25个肽对于选自脯氨酸、天冬氨酸和谷氨酸的一种或多种氨基酸而言富集至少100%。
29.如权利要求27所述的方法,其中与所述阵列中的所述至少10,000个肽相比,区分结合信号的所述组合与所述参考结合信号的所述组合的所述至少25个肽至少对于图9A中所列的一个或多个基序而言富集。
30.如权利要求21所述的方法,其中所述疾病进展在SSc中确定,并且所述临床表现是ILD。
31.如权利要求30所述的方法,其中与所述阵列中的所述至少10,000个肽相比,区分结合信号的所述组合与所述参考结合信号的所述组合的所述至少25个肽至少对于选自脯氨酸、精氨酸、赖氨酸、组氨酸和天冬氨酸的一种或多种氨基酸而言富集。
32.如权利要求30所述的方法,其中所述自身免疫疾病是SSc,并且与所述阵列中的所述至少10,000个肽相比,区分结合信号的所述组合与所述参考结合信号的所述组合的所述至少25个肽对于图15A中所列的一个或多个基序而言富集。
33.如权利要求21所述的方法,其中所述疾病进展在SSc中确定,并且所述临床表现是GAVE。
34.如权利要求33所述的方法,其中与所述阵列中的所述至少10,000个肽相比,区分结合信号的所述组合与所述参考结合信号的所述组合的所述至少25个肽至少对于选自精氨酸、酪氨酸、丝氨酸、组氨酸、赖氨酸和苯丙氨酸的一种或多种氨基酸而言富集。
35.如权利要求33所述的方法,其中所述自身免疫疾病是SSc,并且与所述阵列中的所述至少10,000个肽相比,区分结合信号的所述组合与所述参考结合信号的所述组合的所述至少25个肽对于图11A中所列的一个或多个基序而言富集。
36.如权利要求21所述的方法,其中所述疾病进展在皮肌炎(DM)中确定。
37.如权利要求21所述的方法,其中所述疾病进展在DM中确定,并且所述临床表现是ILD。
38.如权利要求37所述的方法,其中与所述阵列中的所述至少10,000个肽相比,区分结合信号的所述组合与所述参考结合信号的所述组合的所述至少25个肽至少对于选自脯氨酸、天冬氨酸、谷氨酸、丝氨酸、甘氨酸和谷氨酰胺的一种或多种氨基酸而言富集。
39.如权利要求37所述的方法,其中所述自身免疫疾病是DM,并且与所述阵列中的所述至少10,000个肽相比,区分结合信号的所述组合与所述参考结合信号的所述组合的所述至少25个肽对于图21A中所列的一个或多个基序而言富集。
40.如权利要求21所述的方法,其中所述方法性能的特征为所述受试者工作特征(ROC)曲线下面积(AUC)在0.60至0.70、0.70至0.79、0.80至0.89或0.90至1.00的范围内。
41.如上述权利要求中任一项所述的方法,其中所述受试者是人。
42.如上述权利要求中任一项所述的方法,其中所述样品是血液样品。
43.如权利要求40所述的方法,其中所述血液样品选自全血血浆或血清。
44.如上述权利要求中任一项所述的方法,其中所述样品是血清样品。
45.如上述权利要求中任一项所述的方法,其中所述样品是血浆样品。
46.如上述权利要求中任一项所述的方法,其中所述样品是干燥的血液样品。
47.如上述权利要求中任一项所述的方法,其中所述肽阵列上的所述至少10,000个不同的肽的长度为至少5个氨基酸。
48.如上述权利要求中任一项所述的方法,其中所述肽阵列上的所述至少10,000个不同的肽的长度为5至15个氨基酸。
49.如上述权利要求中任一项所述的方法,其中所述至少10,000个不同的肽由少于20种氨基酸合成。
50.如上述权利要求中任一项所述的方法,其中通过排除半胱氨酸、甲硫氨酸、异亮氨酸和苏氨酸中的一种或多种来合成所述肽阵列上的所述至少10,000个不同的肽。
51.一种用于鉴定自身免疫疾病的候选蛋白质生物标志物的方法,所述方法包括:
(a)鉴定区分所述自身免疫疾病与一种或多种不同的健康状况的一组辨别肽;
(b)将所述(辨别)肽组与蛋白质组中的蛋白质进行比对,以获得所述辨别肽组与所述蛋白质组中的一种或多种蛋白质的比对评分;
(d)根据统计学显著性对所述鉴定的蛋白质进行排序;以及
(d)将所述蛋白质鉴定为用于治疗所述自身免疫疾病的候选蛋白质生物标志物。
52.如权利要求51所述的方法,进一步包括获得重叠评分,其中所述评分校正肽文库的肽组成。
53.如权利要求51所述的方法,进一步包括鉴定区分所述自身免疫疾病与健康状况的一组辨别肽。
54.如权利要求51所述的方法,其中所述候选蛋白质生物标志物选自表3中所列的靶标。
55.如权利要求51所述的方法,其中所述辨别肽被鉴定为具有小于10-5、小于10-6、小于
10-7、小于10-8、小于10-9、小于10-10、小于10-11、小于10-12、小于10-13、小于10-14或小于10-15的p值。
56.如权利要求51所述的方法,其中按照小于10-3、小于10-4、小于10-5或小于10-6的p值对所述候选蛋白质生物标志物进行排序。
57.一种用于对自身免疫疾病进行鉴别诊断的系统,所述系统包括:
(a)包含至少10,000个不同的原位合成的肽的肽阵列,其中来自受试者的样品与所述阵列接触;
(b)用于检测所述样品中存在的抗体与所述阵列上的至少25个肽的结合的检测器,以获得结合信号的组合;以及
(c)用于分析和比较结合信号的所述组合与一组或多组参考结合信号的组合的数字处理设备,其中参考结合信号的组合的每个所述组包括从患有不同的疾病的多个受试者获得的结合信号的组合,从而进行所述鉴别诊断,其中所述方法性能的特征为受试者工作特征(ROC)曲线下面积(AUC)大于0.6。
58.如权利要求57所述的方法,其中所述不同的疾病是自身免疫疾病。
59.如权利要求58所述的方法,其中所述自身免疫疾病是皮肌炎(DM),并且所述不同的自身免疫疾病是硬皮病(SSc)。
60.一种用于确定已知患有自身免疫疾病的受试者的疾病进展的系统,所述方法包括:
(a)包含至少10,000个不同的原位合成的肽的肽阵列;
(b)用于检测所述样品中存在的抗体与所述阵列上的至少25个肽的结合的检测器,以获得结合信号的第一组合;以及
(c)用于分析和比较结合信号的所述第一组合与至少参考结合信号的第二组合的数字处理设备,其中所述参考结合信号的第二组合包括从包括具有指示所述自身免疫疾病的进展的临床表现的多个受试者的参考组获得的结合信号的组合,从而进行所述鉴别诊断,其中所述方法性能的特征为受试者工作特征(ROC)曲线下面积(AUC)大于0.6。
61.如权利要求60所述的系统,其中所述疾病进展在硬皮病(SSc)中确定。
62.如权利要求61所述的系统,其中所述疾病进展在SSc中确定,并且所述临床表现选自肾危象、间质性肺病(ILD)和胃窦血管扩张(GAVE)。
63.如权利要求60所述的系统,其中所述疾病进展在患有SSc的受试者中确定,并且所述临床表现是肾危象。
64.如权利要求60所述的系统,其中所述疾病进展在SSc中确定,并且所述临床表现是ILD。
65.如权利要求60所述的系统,其中所述疾病进展在SSc中确定,并且所述临床表现是GAVE。
66.如权利要求60所述的系统,其中所述疾病进展在皮肌炎(DM)中确定。
67.如权利要求60所述的系统,其中所述疾病进展在DM中确定,并且所述临床表现是ILD。

说明书全文

用于自身免疫疾病鉴别诊断的方法

交叉引用

[0001] 本专利申请要求于2016年6月20日提交的序号为62/352,525的美国申请以及于2016年11月11日提交的序号为62/421,180的美国申请的权益;这两篇美国申请均通过引用整体并入本文。

背景技术

[0002] 自身免疫疾病患者可经历慢性活动性疾病、波动的缓解和突发循环,或长时间的静止期。准确地检测和确定患者的状态对于开出适当的药物方案、评价治疗结果、确定患者亚组以及早期检测疾病的突发或进展至关重要,以便改善自身免疫疾病患者的治疗结果。发明内容
[0003] 本文提供了用于对自身免疫疾病进行鉴别诊断的方法、装置和测定,所述方法包括(a)使来自受试者的样品与包含至少10,000个不同的原位合成的肽的肽阵列接触;(b)检测所述样品中存在的抗体与所述阵列上的至少25个肽的结合,以获得结合信号的组合;以及(c)将结合信号的所述组合与一组或多组参考结合信号的组合进行比较,其中参考结合信号的组合的每个所述组中的至少一个从已知患有与所述受试者的自身免疫疾病不同的疾病的多个参考受试者获得,从而能够对所述受试者的自身免疫疾病进行鉴别诊断,其中所述方法性能的特征为所述自身免疫疾病与参考结合信号的组合的每个组之间的受试者工作特征(ROC)曲线下面积(AUC)大于0.6。
[0004] 在一些实施方案中,所述方法、装置和测定进一步包括通过检测来自所述参考组中的所述多个受试者中的每一个的样品中存在的抗体与包含至少10,000个不同的原位合成的肽的肽阵列上的所述至少25个肽的结合来获得参考结合信号的所述组合中的每个组合。在一些实施方案中,针对所述至少25个肽的结合信号的所述组合与所述参考结合信号的所述组合之间的差异确定所述鉴别诊断。在实施方案中,所述不同的疾病是自身免疫疾病。在一些实施方案中,所述方法、装置和测定进一步包括(d)将结合信号的所述组合与从已知患有所述自身免疫疾病的多个参考受试者获得的参考结合信号进行比较。
[0005] 在另一个实施方案中,所述自身免疫疾病是皮肌炎(DM),并且所述不同的自身免疫疾病是硬皮病(SSc)。在其他实施方案中,与所述阵列中的所述至少10,000个肽相比,区分结合信号的所述组合与所述参考结合信号的所述组合的所述至少25个肽对于选自丝酸、甘氨酸、酪氨酸、精氨酸、丙氨酸、谷氨酰胺和缬氨酸的一种或多种氨基酸而言富集至少100%。在另一个实施方案中,与所述阵列中的所述至少10,000个肽相比,区分结合信号的所述组合与所述参考结合信号的所述组合的所述至少25个肽对于图13A所列的一个或多个基序而言富集。
[0006] 在一些实施方案中,所述方法进一步包括将来自所述受试者的结合信号与从健康受试者获得的参考结合信号的组合进行比较。在一些实施方案中,其中所述自身免疫疾病是SSc,区分结合信号的所述组合与所述健康参考结合信号的所述组合的至少25个肽对于选自酪氨酸、赖氨酸、精氨酸、苯丙氨酸、丝氨酸、色氨酸、甘氨酸和丙氨酸的一种或多种氨基酸而言富集至少100%。在其他实施方案中,其中所述自身免疫疾病是SSc,与所述阵列中的所述至少10,000个肽相比,区分结合信号的所述组合与所述参考结合信号的所述组合的至少25个肽对于图5A中所列的一个或多个基序而言富集。
[0007] 在一些实施方案中,其中所述自身免疫疾病是DM,区分结合信号的所述组合与来自健康受试者的所述参考结合信号的所述组合的至少25个肽对于选自酪氨酸、色氨酸、丝氨酸、甘氨酸、天冬氨酸和苯丙氨酸的一种或多种氨基酸而言富集至少100%。在其他实施方案中,其中所述自身免疫疾病是DM,与所述阵列中的所述至少10,000个肽相比,区分结合信号的所述组合与所述参考结合信号的所述组合的至少25个肽对于图17A中所列的一个或多个基序而言富集。
[0008] 在一些实施方案中,所述自身免疫疾病是SSc,并且所述一组参考结合信号包含从患有其他自身免疫疾病的多个受试者获得的结合信号的组合,所述其他自身免疫疾病包括混合结缔组织病(MCTD)、未分化结缔组织病(UCTD)、肌炎、多肌炎、系统性红斑狼疮和硬斑病。在一些实施方案中,其中所述自身免疫疾病是SSc,区分结合信号的所述组合与所述参考结合信号的所述组合的所述至少25个肽对于选自天冬氨酸、谷氨酸、脯氨酸、缬氨酸、甘氨酸和丝氨酸的一种或多种氨基酸而言富集至少100%。在其他实施方案中,其中所述自身免疫疾病是SSc,与所述阵列中的所述至少10,000个肽相比,区分结合信号的所述组合与所述参考结合信号的所述组合的所述至少25个肽对于图7A中所列的一个或多个基序而言富集。
[0009] 在一些实施方案中,所述自身免疫疾病是DM,并且其中所述一组参考结合信号包含从患有其他自身免疫疾病的多个受试者获得的结合信号的组合,所述其他自身免疫疾病包括MCTD、UCTD、肌炎、多肌炎、系统性红斑狼疮和硬斑病。在一些实施方案中,其中所述自身免疫疾病是DM,区分结合信号的所述组合与所述参考结合信号的所述组合的所述至少25个肽对于选自赖氨酸、组氨酸、丝氨酸、精氨酸、谷氨酸、丙氨酸和甘氨酸的一种或多种氨基酸而言富集至少100%。在其他实施方案中,其中所述自身免疫疾病是DM,与所述阵列中的所述至少10,000个肽相比,区分结合信号的所述组合与所述参考结合信号的所述组合的至少25个肽对于图19A中所列的一个或多个基序而言富集。
[0010] 在其他实施方案中,本文公开的方法、装置和测定进一步包括将来自所述受试者的结合信号与从至少一个健康受试者获得的结合信号进行比较。在一些实施方案中,所述方法性能的特征为受试者工作特征(ROC)曲线下面积(AUC)在0.60至0.70、0.70至0.79、0.80至0.89或0.90至1.00的范围内。
[0011] 本文还提供了用于确定已知患有自身免疫疾病的受试者的疾病进展的方法、装置和测定,所述方法包括(a)使来自受试者的样品与包含至少10,000个不同的原位合成的肽的肽阵列接触;(b)检测所述样品中存在的抗体与所述阵列上的至少25个肽的结合,以获得结合信号的第一组合;以及(c)将结合信号的所述第一组合与至少参考结合信号的第二组合进行比较,其中所述参考结合信号的第二组合包括从包括具有指示所述自身免疫疾病的进展的临床表现的多个受试者的参考组获得的结合信号的组合,从而进行所述鉴别诊断,其中所述方法性能的特征为受试者工作特征(ROC)曲线下面积(AUC)大于0.6。在一些实施方案中,所述方法、装置和测定进一步包括(d)将结合信号的所述组合与从已知患有所述自身免疫疾病的多个参考受试者获得的参考结合信号进行比较。
[0012] 在一些实施方案中,通过检测来自所述参考组中的所述多个受试者中的每一个的样品中存在的抗体与包含至少10,000个不同的原位合成的肽的肽阵列上的所述至少25个肽的结合来获得参考结合信号的所述组合中的每个组合。在一个实施方案中,针对所述至少25个肽的结合信号的所述组合与所述参考结合信号的所述组合之间的差异确定所述疾病进展。在另一个实施方案中,所述疾病进展在硬皮病(SSc)中确定。在其他实施方案中,所述疾病进展在SSc中确定,并且所述临床表现选自肾危象、间质性病(ILD)和胃窦血管扩张(GAVE)。
[0013] 在一个实施方案中,所述疾病进展在患有SSc的受试者中确定,并且所述临床表现是肾危象。在一些实施方案中,与所述阵列中的所述至少10,000个肽相比,区分结合信号的所述组合与所述参考结合信号的所述组合的所述至少25个肽对于选自脯氨酸、天冬氨酸和谷氨酸的一种或多种氨基酸而言富集至少100%。在其他实施方案中,与所述阵列中的所述至少10,000个肽相比,区分结合信号的所述组合与所述参考结合信号的所述组合的所述至少25个肽至少对于图9A中所列的一个或多个基序而言富集。
[0014] 在另一个实施方案中,其中所述疾病进展在SSc中确定,并且所述临床表现是ILD。在一些实施方案中,与所述阵列中的所述至少10,000个肽相比,区分结合信号的所述组合与所述参考结合信号的所述组合的所述至少25个肽至少对于选自脯氨酸、精氨酸、赖氨酸、组氨酸和天冬氨酸的一种或多种氨基酸而言富集。在其他实施方案中,与所述阵列中的所述至少10,000个肽相比,区分结合信号的所述组合与所述参考结合信号的所述组合的所述至少25个肽对于图15A中所列的一个或多个基序而言富集。
[0015] 在另一个实施方案中,所述疾病进展在SSc中确定,并且所述临床表现是GAVE。在一个实施方案中,与所述阵列中的所述至少10,000个肽相比,区分结合信号的所述组合与所述参考结合信号的所述组合的所述至少25个肽至少对于选自精氨酸、酪氨酸、丝氨酸、组氨酸、赖氨酸和苯丙氨酸的一种或多种氨基酸而言富集。在另一个实施方案中,与所述阵列中的所述至少10,000个肽相比,区分结合信号的所述组合与所述参考结合信号的所述组合的所述至少25个肽对于图11A中所列的一个或多个基序而言富集。
[0016] 在另一个实施方案中,所述疾病进展在患有皮肌炎(DM)的受试者中确定,并且所述临床表现是ILD。在一个实施方案中,与所述阵列中的所述至少10,000个肽相比,区分结合信号的所述组合与所述参考结合信号的所述组合的所述至少25个肽至少对于选自脯氨酸、天冬氨酸、谷氨酸、丝氨酸、甘氨酸和谷氨酰胺的一种或多种氨基酸而言富集。在另一个实施方案中,与所述阵列中的所述至少10,000个肽相比,区分结合信号的所述组合与所述参考结合信号的所述组合的所述至少25个肽对于图21A中所列的一个或多个基序而言富集。
[0017] 在其他实施方案中,所述方法性能的特征为受试者工作特征(ROC)曲线下面积(AUC)在0.60至0.70、0.70至0.79、0.80至0.89、或0.90至1.00的范围内。
[0018] 在一些实施方案中,所述受试者是人。在其他实施方案中,所述样品是血液样品。在其他实施方案中,所述血液样品选自全血血浆或血清。在其他实施方案中,所述样品是血清样品。在一个实施方案中,所述样品是血浆样品。在另一个实施方案中,所述样品是干燥的血液样品。在其他实施方案中,所述肽阵列上的所述至少10,000个不同的肽的长度为至少5个氨基酸。在其他实施方案中,所述肽阵列上的所述至少10,000个不同的肽的长度为
5至15个氨基酸。在一些实施方案中,所述至少10,000个不同的肽由少于20种氨基酸合成。
在另一个实施方案中,通过排除半胱氨酸、甲硫氨酸、异亮氨酸和苏氨酸中的一种或多种来合成所述肽阵列上的所述至少10,000个不同的肽。
[0019] 在另一个方面,提供了一种用于鉴定自身免疫疾病的候选蛋白质生物标志物的方法,所述方法包括:(a)鉴定区分所述自身免疫疾病与一种或多种不同的健康状况的一组辨别肽;(b)将所述(辨别)肽组与蛋白质组中的蛋白质进行比对,以获得所述辨别肽组与所述蛋白质组中的一种或多种蛋白质的比对评分;(d)根据统计学显著性对所述鉴定的蛋白质进行排序;以及(e)将所述蛋白质鉴定为用于治疗所述自身免疫疾病的候选蛋白质生物标志物。在一些实施方案中,所述方法进一步包括鉴定区分所述自身免疫疾病与健康状况的一组辨别肽。在一些实施方案中,所述候选蛋白质生物标志物选自表3所列的靶标。
[0020] 在一些实施方案中,所述辨别肽被鉴定为具有小于10-5、小于10-6、小于10-7、小于10-8、小于10-9、小于10-10、小于10-11、小于10-12、小于10-13、小于10-14或小于10-15的p值。在其他实施方案中,按照小于10-3、小于10-4、小于10-5或小于10-6的p值对所述候选蛋白质生物标志物进行排序。
援引并入
[0021] 本说明书中提及的所有出版物、专利和专利申请均通过引用并入本文,其程度如同特别且单独地指出每个单独的出版物、专利或专利申请通过引用而并入。附图说明
[0022] 本专利或申请文件含有至少一幅彩色附图。具有彩色附图的本专利或专利申请公开的副本将在请求和支付必要费用后由主管局提供。
[0023] 本发明的新颖特征在所附的权利要求中具体阐述。通过参考以下对利用本发明的原理的说明性实施方案加以阐述的详细描述以及附图,将会获得对本发明的特征和优点的更好的理解,在这些附图中:
[0024] 图1A是SSc的临床表现及生理症状的列表。
[0025] 图1B显示了SSc的临床表现及生理症状的延续。
[0026] 图2是用于评估SSc诊断和评估的临床症状列表的示例。
[0027] 图3示出了多肌炎和皮肌炎的临床表现和症状的列表,以及两者的临床鉴别标准。
[0028] 图4为显示自身蛋白/抗原如何可导致肽微阵列中免疫特征的上调和下调的途径。
[0029] 图5是描述SSc患者与健康受试者比较时的最佳鉴别肽的表。
[0030] 图5A描述了最佳亚基序。
[0031] 图5B描述了前1000个鉴别肽中的富集肽。
[0032] 图6是图5中的结果的图形表示。
[0033] 图6A是描述通过肽结合强度对硬皮病(SSc)受试者与健康对照的鉴别的火山图。将来自硬皮病患者的样品的平均强度与对照患者的平均强度的比率相对于来自t-检验的平均值之差的p值作图。
[0034] 图6B是鉴别硬皮病患者与健康对照的硬皮病的免疫特征模型的ROC曲线。绿线(顶部)表示分类器(中间)的上95%置信区间,红线(底部)表示下95%置信区间。对90%特异性的试验提供灵敏度估计,并对90%灵敏度的试验提供特异性估计。准确度是在与灵敏度和特异性匹配的阈值下估计的。图6C是作为针对不同输入肽大小的模型提供的输入大小-ROC曲线下五折交叉验证面
积(+/-95%CI)的函数的ROC估计。基于t-检验选择肽,并且在支持向量机中使用前k个特征来构建硬皮病与健康对照的分类器。在交叉验证循环中进行特征选择和模型构建,以防止偏差。
[0035] 图7是描述被诊断为患有SSc和其他自身免疫病症的患者比较时的免疫特征中的最佳鉴别肽的表。
[0036] 图7A描述了最佳亚基序。
[0037] 图7B描述了前1000个鉴别肽中的富集肽。
[0038] 图8是图7中所示的结果的图形表示。
[0039] 图8A是描述通过肽结合强度对硬皮病(SSc)受试者与其他自身免疫模拟疾病(“其他AI”)受试者的鉴别的火山图。将来自硬皮病患者的样品的平均强度与其他自身免疫病症患者的平均强度的比率相对于来自t-检验的平均值之差的p值作图。
[0040] 图8B是鉴别硬皮病患者与其他自身免疫疾病患者的硬皮病的免疫特征模型的ROC曲线。绿线(顶部)表示分类器(中间)的上95%置信区间,红线(底部)表示下95%置信区间。对90%特异性的试验提供灵敏度估计,并对90%灵敏度的试验提供特异性估计。准确度是在与灵敏度和特异性匹配的阈值下估计的。
[0041] 图8C是作为针对不同输入肽大小的模型提供的输入大小-ROC曲线下四折交叉验证面积(+/-95%CI)的函数的ROC估计。基于t-检验选择肽,并且在支持向量机中使用前k个特征来构建硬皮病与其他自身免疫病症的分类器。在交叉验证循环中进行特征选择和模型构建,以防止偏差。
[0042] 图9是描述被诊断为患有SSc的患者和肾危象患者比较时的免疫特征中的最佳鉴别肽的表。
[0043] 图9A描述了最佳亚基序。
[0044] 图9B描述了前1000个鉴别肽中的富集肽。
[0045] 图10是图9中所示的结果的图形表示。
[0046] 图10A是描述通过肽结合强度对具有肾危象的硬皮病(SSc)受试者与没有肾危象的SSc受试者的鉴别的火山图。将来自具有肾危象的硬皮病患者的样品的平均强度与没有肾危象的SSc患者的平均强度的比率相对于来自t-检验的平均值之差的p值作图。
[0047] 图10B是鉴别具有肾危象的硬皮病患者与没有肾危象的SSc受试者的硬皮病的免疫特征模型的ROC曲线。绿线(顶部)表示分类器(中间)的上95%置信区间,红线(底部)表示下95%置信区间。对90%特异性的试验提供灵敏度估计,并对90%灵敏度的试验提供特异性估计。准确度是在与灵敏度和特异性匹配的阈值下估计的。
[0048] 图10C是作为针对不同输入肽大小的模型提供的输入大小-ROC曲线下四折交叉验证面积(+/-95%CI)的函数的ROC估计。基于t-检验选择肽,并且在支持向量机中使用前k个特征来构建具有肾危象的硬皮病与没有肾危象的SSc的分类器。在交叉验证循环中进行特征选择和模型构建,以防止偏差。
[0049] 图11是描述被诊断为患有SSc和胃窦血管扩张(GAVE)的患者比较时的免疫特征中的最佳鉴别肽的表。
[0050] 图11A描述了最佳亚基序。
[0051] 图11B描述了前1000个鉴别肽中的富集肽。
[0052] 图12是图11中所示的结果的图形表示。
[0053] 图12A是描述通过肽结合强度对具有胃窦血管扩张(GAVE)的硬皮病(SSc)受试者与没有GAVE的SSc受试者的鉴别的火山图。将来自具有GAVE的硬皮病患者的样品的平均强度与没有GAVE的SSc患者的平均强度的比率相对于来自t-检验的平均值之差的p值作图。
[0054] 图12B是鉴别具有GAVE的硬皮病患者与没有GAVE的SSc受试者的硬皮病的免疫特征模型的ROC曲线。绿线(顶部)表示分类器(中间)的上95%置信区间,红线(底部)表示下95%置信区间。对90%特异性的试验提供灵敏度估计,并对90%灵敏度的试验提供特异性估计。准确度是在与灵敏度和特异性匹配的阈值下估计的。
[0055] 图12C是作为针对不同输入肽大小的模型提供的输入大小-ROC曲线下四折交叉验证面积(+/-95%CI)的函数的ROC估计。基于t-检验选择肽,并且在支持向量机中使用前k个特征来构建具有GAVE的硬皮病与没有GAVE的SSc的分类器。在交叉验证循环中进行特征选择和模型构建,以防止偏差。
[0056] 图13是描述被诊断为患有SSc和DM的患者比较时的免疫特征中的最佳鉴别肽的表。
[0057] 图13A描述了最佳亚基序。
[0058] 图13B描述了前1000个鉴别肽中的富集肽。
[0059] 图14是图13中所示的结果的图形表示。
[0060] 图14A是描述通过肽结合强度对硬皮病(SSc)受试者与皮肌炎(DM)受试者的鉴别的火山图。将来自DM患者的样品的平均强度与DM患者的平均强度的比率相对于来自t-检验的平均值之差的p值作图。
[0061] 图14B是鉴别硬皮病患者与DM患者的硬皮病的免疫特征模型的ROC曲线。绿线(顶部)表示分类器(中间)的上95%置信区间,红线(底部)表示下95%置信区间。对90%特异性的试验提供灵敏度估计,并对90%灵敏度的试验提供特异性估计。准确度是在与灵敏度和特异性匹配的阈值下估计的。
[0062] 图14C是作为针对不同输入肽大小的模型提供的输入大小-ROC曲线下四折交叉验证面积(+/-95%CI)的函数的ROC估计。基于t-检验选择肽,并且在支持向量机中使用前k个特征来构建硬皮病与DM的分类器。在交叉验证循环中进行特征选择和模型构建,以防止偏差。
[0063] 图15是描述被诊断为患有SSc伴间质性肺病(ILD+)与没有间质性肺病(ILD-)的SSc的患者比较时的免疫特征中的最佳鉴别肽的表。
[0064] 图15A描述了最佳亚基序。
[0065] 图15B描述了前1000个鉴别肽中的富集肽。
[0066] 图16是图15中所示的结果的图形表示。
[0067] 图16A是通过肽结合强度对患有间质性肺病(ILD)(ILD+)的硬皮病(SSc)受试者与没有ILD(ILD-)的SSC受试者的鉴别。将来自硬皮病-ILD+患者的样品的平均强度与SSC ILD-患者的平均强度的比率相对于来自t-检验的平均值之差的p值作图。
[0068] 图16B是鉴别硬皮病ILD+患者与SSc ILD-受试者的硬皮病的免疫特征模型的ROC曲线。绿线(顶部)表示分类器(中间)的上95%置信区间,红线(底部)表示下95%置信区间。对90%特异性的试验提供灵敏度估计,并对90%灵敏度的试验提供特异性估计。准确度是在与灵敏度和特异性匹配的阈值下估计的。
[0069] 图16C是作为针对不同输入肽大小的模型提供的输入大小-ROC曲线下四折交叉验证面积(+/-95%CI)的函数的ROC估计。基于t-检验选择肽,并且在支持向量机中使用前k个特征来构建SSc ILD+与SSc ILD-的分类器。在交叉验证循环中进行特征选择和模型构建,以防止偏差。
[0070] 图17是描述被诊断为患有DM的患者与健康受试者比较时的免疫特征中的最佳鉴别肽的表。
[0071] 图17A描述了最佳亚基序。
[0072] 图17B描述了前1000个鉴别肽中的富集肽。
[0073] 图18是图17的图形表示。
[0074] 图18A是描述通过肽结合强度对皮肌炎(DM)受试者与健康对照的鉴别的火山图。将来自DM患者的样品的平均强度与对照患者的平均强度的比率相对于来自t-检验的平均值之差的p值作图。
[0075] 图18B是鉴别DM患者与健康对照的DM的免疫特征模型的ROC曲线。绿线(顶部)表示分类器(中间)的上95%置信区间,红线(底部)表示下95%置信区间。对90%特异性的试验提供灵敏度估计,并对90%灵敏度的试验提供特异性估计。准确度是在与灵敏度和特异性匹配的阈值下估计的。
[0076] 图18C是作为针对不同输入肽大小的模型提供的输入大小-ROC曲线下四折交叉验证面积(+/-95%CI)的函数的ROC估计。基于t-检验选择肽,并且在支持向量机中使用前k个特征来构建DM与健康对照的分类器。在交叉验证循环中进行特征选择和模型构建,以防止偏差。
[0077] 图19是描述被诊断为患有DM和其他自身免疫病症的患者比较时的免疫特征中的最佳鉴别肽的表。
[0078] 图19A描述了最佳亚基序。
[0079] 图19B描述了前1000个鉴别肽中的富集肽。
[0080] 图20是图19的图形表示。
[0081] 图20A是描述通过肽结合强度对皮肌炎(DM)受试者与其他自身免疫模拟疾病(其他AI)受试者的鉴别的火山图。将来自硬皮病患者的样品的平均强度与患有其他自身免疫病症的患者的平均强度的比率相对于来自t-检验的平均值之差的p值作图。
[0082] 图20B是鉴别皮肌炎(DM)受试者与其他自身免疫模拟疾病(其他AI)受试者的DM的免疫特征模型的ROC曲线。绿线(顶部)表示分类器(中间)的上95%置信区间,红线(底部)表示下95%置信区间。对90%特异性的试验提供灵敏度估计,并对90%灵敏度的试验提供特异性估计。准确度是在与灵敏度和特异性匹配的阈值下估计的。
[0083] 图20C是作为针对不同输入肽大小的模型提供的输入大小-ROC曲线下四折交叉验证面积(+/-95%CI)的函数的ROC估计。基于t-检验选择肽,并且在支持向量机中使用前k个特征来构建DM与其他自身免疫病症的分类器。在交叉验证循环中进行特征选择和模型构建,以防止偏差。
[0084] 图21是描述被诊断为患有间质性肺病(ILD+)的DM患者与没有间质性肺病(ILD-)的DM患者比较时的免疫特征中的最佳鉴别肽的表。
[0085] 图21A描述了最佳亚基序。
[0086] 图21B描述了前1000个鉴别肽中的富集肽。
[0087] 图22是图21的图形表示。
[0088] 图22A是描述通过肽结合强度对患有间质性肺病(ILD)(ILD+)的皮肌炎(DM)受试者与没有ILD(ILD-)的DM受试者的鉴别的火山图。将来自DM ILD+患者的样品的平均强度与DM ILD-患者的平均强度的比率相对于来自t-检验的平均值之差的p值作图。
[0089] 图22B是鉴别DMILD+患者与DMILD-受试者的DM的免疫特征模型的ROC曲线。绿线(顶部)表示分类器(中间)的上95%置信区间,红线(底部)表示下95%置信区间。对90%特异性的试验提供灵敏度估计,并对90%灵敏度的试验提供特异性估计。准确度是在与灵敏度和特异性匹配的阈值下估计的。
[0090] 图22C是作为针对不同输入肽大小的模型提供的输入大小-ROC曲线下五折交叉验证面积(+/-95%CI)的函数的ROC估计。基于t-检验选择肽,并且在支持向量机中使用前k个特征来构建DM ILD+与DM ILD-的分类器。在交叉验证循环中进行特征选择和模型构建,以防止偏差。
[0091] 图23A示出了针对与RNA Pol II亚基L氨基酸位置一起绘制的IMS肽-基序的比对计算的肽重叠差异评分s。
[0092] 图23B示出了对于人类蛋白质组中的每种蛋白质相比于SSc-健康分类肽,显示蛋白质表位评分S的分布的直方图。
[0093] 图24示出了代表IS鉴别肽的比对的频率的直方图,沿着CCL22的蛋白质序列,该IS辨别肽区分患有GAVE的SSc受试者与没有GAVE的SSc受试者。

具体实施方式

[0094] 公开的实施方案涉及方法、装置和系统,其用于从生物样品中获得抗体结合谱并对其定性,从而相对于健康个体诊断自身免疫疾病,相对于其他自身免疫疾病、非自身免疫模拟疾病和其他重叠疾病对自身免疫疾病进行鉴别诊断,并确定自身免疫疾病的进展。
[0095] 除非本文另有定义,否则本文使用的所有技术和科学术语的含义与本发明所属领域的普通技术人员通常所理解的含义相同。包括本文所包括的术语的各种科学词典是本领域技术人员公知的并且是可获得的。尽管与本文描述的方法和材料类似或等同的任何方法和材料可用于实施或测试本发明,但本文描述了一些优选的方法和材料。
[0096] 数值范围包括定义范围的数字。旨在使整个说明书中给出的每个最大数值限制都包括每个较低的数值限制,如同这些较低的数值限制在本文中明确写出。在整个说明书中给出的每个最小数值限制将包括每个较高的数值限制,如同这些较高的数值限制在本文中明确写出。在整个说明书中给出的每个数值范围都将包括落入该较宽数值范围内的每个较窄的数值范围,如同这些较窄的数值范围都在本文中明确写出。
[0097] 本文提供的标题不是对本发明的各个方面或实施方案的限制,其可以通过参考整个说明书而获得。
[0098] 通过参考整个说明书,可以更全面地描述下面紧接着定义的术语。需要理解的是,本发明不限于所描述的特定方法、方案和试剂,因为它们可以根据本领域技术人员使用的环境而变化。定义
[0099] 术语“状况”和“健康状况”在本文中可互换使用,以包括疾病和病症在内的所有疾病,但可包括可能影响人的健康、受益于医疗救助或对医学治疗有影响的损伤和正常健康状况,如妊娠。
[0100] 本文中的术语“免疫特征”是指通过相对于参考样品中的抗体与肽阵列的结合,来自受试者的样品中的抗体与肽阵列的差异结合产生的结合信号的组合。
[0101] 本文的术语“受试者”是指人受试者以及非人受试者,如非人哺乳动物。因此,考虑各种兽医应用,在这种情况下,受试者可以是非人哺乳动物(例如,猫科动物、猪科动物、科动物、科动物等)。本文描述的概念也适用于植物
[0102] 术语“患者样品”和“受试者样品”在本文中可互换使用,指从患者即医疗照顾、护理或治疗的接受者获得的样品,例如生物流体样品。受试者样品可以是本文所述的任何样品。在某些实施方案中,受试者样品通过非侵入性程序获得,例如外周血样品。
[0103] 如本文所用,术语“微阵列系统”是指通常由在如玻璃、塑料或芯片等固体平面表面上格式化的阵列肽,以及处理样品所需的仪器(自动机器人)、用于读取报告分子(扫描仪)和分析数据(生物信息学工具)的仪器中的任一种或多种组成的系统。
[0104] 本文的术语“阵列肽”是指固定在微阵列上的肽。
[0105] 术语“辨别”和“区分”在提及抗体结合谱/模式中的肽时在本文中可互换使用,该肽相对于参考受试者或受试者差异性地结合来自测试受试者的样品中的抗体,以确定测试受试者的健康状况。
[0106] 本文中的术语“准确度”是指通过所述方法分类的正确结果的比例。
[0107] 本文中的术语“灵敏度”是指被正确地鉴定为待测状况阳性的样品的比例。
[0108] 本文中的术语“特异性”是指被正确地鉴定为待测状况阴性的样品的比例。
[0109] 本文中的术语“氨基酸”是指天然存在的羧基氨基酸,包括丙氨酸(三字母代码:ala,单字母代码:A)、精氨酸(arg,R)、天冬酰胺(asn,N)、天冬氨酸(asp,D)、半胱氨酸(cys,C)、谷氨酰胺(gln,Q)、谷氨酸(glu,E)、甘氨酸(gly,G)、组氨酸(his,H)、异亮氨酸(ile,I)、亮氨酸(leu,L)、赖氨酸(lys,K)、甲硫氨酸(met,M)、苯丙氨酸(phe,F)、脯氨酸(pro,P)、丝氨酸(ser,S)、苏氨酸(thr,T)、色氨酸(tip,W)、酪氨酸(tyr,Y)和缬氨酸(val,V)。
[0110] 检测和诊断免疫介导的病症,如自身免疫病症,具有挑战性,患者很难获得准确或正确的诊断。在许多情况下,由于这些疾病的性质密切相关,患者经常被误诊为其他自身免疫状况。目前还没有可用于检测和评估自身免疫疾病或病症的可靠的生物标志物。
[0111] 例如,系统性硬化症或硬皮病(SSc)是一种多系统自身免疫疾病,其中纤维细胞活性增加,导致结缔组织异常生长。由于其与其他类似疾病关系密切,因此SSc难以诊断或获得疾病状况的预后。SSc引起皮肤、胃肠(GI)道和其他内脏器官的血管损伤和纤维化,并且怀疑在患有皮肤增厚、手指浮肿或肿胀、手僵硬和远端手指溃疡疼痛的患者中。雷诺现象(RP;影响血管的病症,主要发生在四肢(手指和脚趾);使血管在寒冷和压下收缩,从而导致受影响的四肢麻木)的症状和胃食管反流经常出现。图1A和1B描述了系统性硬化症的临床表现的列表,该临床表现是异质的,并且由于疾病类型(局限性或弥散性的)和器官损害而变化。
[0112] 系统性硬皮病的诊断可根据皮肤增厚的特征性发现来进行,这可能与雷诺现象和不同程度的内脏器官损害有关。在疾病的早期阶段,雷诺现象可能是该疾病的唯一临床表现。在这些情况下,甲褶毛细管检查(Nailfold capillarscopy)可能有助于确定雷诺现象是SSc原发性还是继发性的。美国湿病学会提出的SSc诊断标准在图2中列出。但专家们对这些标准的有用性存在分歧,并且到患者满足这些标准时,疾病表现往往已经提前。此外,临床表现的异质性、内脏器官损害的范围以及疾病进展率的差异使得对每个个体患者的疾病的咨询和管理具有挑战性。
[0113] 硬皮病可以单独发生或以与其他结缔组织疾病(如系统性红斑狼疮、皮肌炎和类风湿性关节炎)的重叠综合征发生。根据与其相关的其他疾病,该疾病状态可被称为“重叠综合征”。与硬皮病相关的重叠疾病也可以是模拟疾病,即与如硬皮病一起出现但不能轻易地与硬皮病症状区分开的不同的疾病。
[0114] 皮肌炎是特发性炎症性肌病,其特征性地呈现皮肤表现。虽然这种情况很罕见(成人中每百万例中有1至10例),但早期诊断和治疗很重要,因为系统性并发症可以增加该疾病的发病率。多肌炎包括在这些患者中观察到的炎症性肌病减去该疾病的皮肤发现。该疾病的分类在1975年首次被描述,见图3。难以从其他皮肤和结缔组织病症(如硬皮病)中诊断该疾病,使鉴别诊断指南和分析对于进行该疾病的正确诊断很重要。皮肌炎的鉴别诊断包括评估患者是否患有,例如HIV感染、扁平苔癣、多形性日光疹、脂溢性皮炎、系统性红斑狼疮、屑病、接触性皮炎、特应性皮炎、旋毛虫病、药物影响,包括青霉胺、非甾体类抗炎药、羟基脲、普伐他汀、氯贝丁酯和吐根,以及酒精的一般影响。
[0115] 因此,开发用于鉴别诊断密切相关的自身免疫病症的方法、测定和装置将是有用的和可取的,所述密切相关的自身免疫病症包括皮肌炎、SSc、肌炎、系统性红斑狼疮和其他自身免疫疾病。这是特别需要的,因为早期识别正确的潜在疾病或病症可有助于减少或减缓疾病的进展。例如,20-40%的皮肌炎患者出现间质性肺病;早期识别将有助于改善患者的护理并促进治疗努力。
[0116] 本文公开了鉴定外周血抗体与肽阵列结合的差异模式的方法、测定和装置。患者样品与阵列的差异结合导致指示患者疾病状态的特定结合模式或特征。这些结合特征可以准确地区分疾病活动与密切相关的疾病活动,包括但不限于自身免疫疾病或病症的不同分类。例如,本文公开的方法、装置和测定可以区分皮肌炎(DM)和系统性硬化症(SSc)和系统性红斑狼疮(SLE),以及其他自身免疫疾病,包括但不限于混合结缔组织病(MCTD)、未分化结缔组织病(UCTD)、系统性红斑狼疮(SLE)、多肌炎和局限性硬皮病(硬斑病)以及其他自身免疫病症。此外,本文公开的方法、装置和系统可以区分具有或没有特定内脏器官并发症,如间质性肺病(ILD)和胃窦血管扩张(GAVE)的患者的特征,该并发症指示例如系统性硬皮病和皮肌炎的疾病进展。
[0117] 所述方法基于样品(如血液样品)中复杂的抗体混合物与肽阵列的结合。本文公开的技术使用从化学序列空间设计的至少数千种独特肽的阵列,以使得能够从小样品对个体的抗体结合组库(repertoire)进行广泛调查。不同的样品包含结合不同组或组合的阵列肽的不同抗体混合物。这种差异结合导致特异性结合模式,本文称为免疫特征(IS),其指示从中获得样品的受试者的状况。通常,相对于一种或多种参考免疫特征确定状况的免疫特征,该参考免疫特征从获自一组或多组参考受试者(每组具有不同的状况)的一个或多个不同组的参考样品获得。例如,与具有可以诱导的不同状况的参考受试者的免疫特征相比,例如,通过疾病的发生、药物治疗、环境影响等,从测试受试者获得的免疫特征鉴定测试受试者的状况。因此,来自测试受试者的免疫特征与参考受试者的免疫特征的比较可以确定测试受试者的状况。参考组可以是一组健康受试者,并且该状况在本文中被称为健康状况。健康受试者通常是那些没有正在被测试的状况的受试者。
[0118] 在一些实施方案中,所述方法提供鉴别诊断。鉴别诊断是基于共同因素去除诊断的过程。例如,鉴别诊断区分模拟疾病,该模拟疾病是表现出与不易区分的其他疾病共同的症状的不同的疾病。这些疾病通常被称为重叠疾病。因此,对这样的疾病的正确诊断可能需要几个月甚至几年才能确定。它通常需要病史检查、多次体检、大量实验室测试以及经常扫描的组合。通常,针对这样的疾病的生物标志物不可用,并且诊断依赖于血清学检测,其信息可归因于其他疾病。一些自身免疫疾病的鉴别诊断特别难以实现。难以诊断的模拟疾病的示例包括但不限于自身免疫疾病,例如系统性红斑狼疮,其与类风湿性关节炎、混合结缔组织病、Sjogren综合征、雷诺综合征、硬皮病和系统性硬化症有重叠症状。例如,系统性硬皮病(SSc)和皮肌炎可以出现皮肤表现。从其他皮肤和结缔组织病症中诊断这些疾病之一的困难使鉴别诊断指南和测定对于做出正确的诊断非常重要。
[0119] 在一个方面,本发明的方法是诊断或确定受试者的自身免疫病症的存在或不存在的方法,所述方法包括:a.使肽阵列与来自个体患者或受试者的第一生物样品接触;b.检测第一生物样品中的抗体与肽阵列的结合,以获得第一免疫特征谱;c.使肽阵列与从患有已知自身免疫病症的一个或多个个体获得的对照样品接触;d.检测对照样品中的抗体与肽阵列的结合,以获得第二免疫特征谱;e.将第一免疫特征谱与第二免疫特征谱进行比较,以确定患者或受试者是否患有自身免疫疾病或病症。
[0120] 在一个实施方案中,提供了一种用于对自身免疫疾病进行鉴别诊断的方法,所述方法包括(a)使来自受试者的样品与包含至少10,000个不同的原位合成的肽的肽阵列接触;(b)检测所述样品中存在的抗体与所述阵列上的至少25个肽的结合,以获得结合信号的组合;以及(c)将结合信号的所述组合与一组或多组参考结合信号的组合进行比较,其中参考结合信号的组合的每个所述组包括从患有不同的疾病的多个受试者获得的结合信号的组合,从而进行所述鉴别诊断,其中所述方法性能的特征为受试者工作特征(ROC)曲线下面积(AUC)大于0.6。在一些实施方案中,所述不同的疾病是自身免疫疾病。在一些实施方案中,可以在硬皮病和皮肌炎之间进行诊断。在其他实施方案中,所述诊断区分SSc与其他自身免疫疾病的组合。例如,该方法可以区分患有SSc的受试者与患有不同的疾病,包括混合结缔组织病(MCTD)、未分化结缔组织病(UCTD)、肌炎、多肌炎、系统性红斑狼疮和硬斑病的一组参考受试者。
[0121] 在另一个方面,提供了一种通过比较从患有或疑似患有自身免疫疾病的受试者获得的免疫特征与从一组健康个体获得的参考结合信号的组合,来确定自身免疫疾病的存在的方法。在一些实施方案中,所提供的方法用于诊断受试者是否患有自身免疫疾病,该方法包括:对自身免疫疾病进行诊断的方法,所述方法包括:(a)使来自受试者的样品与包含至少10,000个不同的原位合成的肽的肽阵列接触;(b)检测所述样品中存在的抗体与所述阵列上的至少25个肽的结合,以获得结合信号的组合;以及(c)将结合信号的所述组合与一组或多组参考结合信号的组合进行比较,其中参考结合信号的组合的每个所述组包括从多个健康受试者获得的结合信号的组合,从而确定受试者中是否存在自身免疫疾病。在一些实施方案中,自身免疫疾病是SSc。在其他实施方案中,自身免疫疾病是DM。在一些实施方案中,所述方法性能的特征为受试者工作特征(ROC)曲线下面积(AUC)大于0.6。
[0122] 表征受试者样品即测试样品的健康状况的结合信息是作为可检测的、可定量的结合信号的组合获得的,所述结合信号反映样品中的抗体混合物与阵列肽组合的结合。将来自测试受试者的样品中的抗体的结合信号组合与具有已知状况的参考个体组共有的结合信号的一种或多种组合进行比较,以鉴定区分不同健康状况的结合信号组合。结合测定
[0123] 将受试者的IS鉴定为与阵列肽结合的抗体的结合模式。肽阵列可在任何合适的条件下与血清接触以促进血清中的抗体与阵列上固定的肽的结合。因此,本发明的方法不受所采用的任何特定类型的结合条件的限制。此类条件将根据结合方案中所使用的阵列、基底的类型、基底上排列的肽的密度、结合相互作用的期望严格性和竞争材料的性质而变化。在一个优选的实施方案中,所述条件包括从可寻址阵列中去除未结合的抗体的步骤。确定对该步骤的需要以及用于该步骤的合适的条件完全在本领域的技术平内。
[0124] 本发明的方法可以使用任何合适的检测技术,来检测血清中的抗体与阵列上的肽的结合,以产生疾病免疫谱;在一个实施方案中,任何类型的可检测标记物可用于标记阵列上的肽,包括但不限于放射性同位素标记物、荧光标记物、发光标记物和电化学标记物(即:具有不同电极中点电位的配体标记物,其中检测包括检测标记物的电位)。或者,例如可使用可检测地标记的第二抗体来检测结合的抗体。
[0125] 对来自可检测标记物的信号的检测完全在本领域的技术水平内。例如,荧光阵列读取仪是本领域熟知的,用于记录基底上的电位的仪器也是本领域熟知的(关于电化学检测,参见,例如,J.Wang(2000)Analytical Electrochemistry,Vol.,第2版,Wiley-VCH,New York)。结合相互作用还可使用其他无标记方法如SPR和质谱分析法来检测。SPR可提供对解离常数和解离率的测量。例如,A-100Biocore/GE仪器适合于这种类型的分析。FLEX芯片可用于在同一支持体上进行多达400个结合反应。
[0126] 或者,样品中的抗体与阵列上的肽之间的结合相互作用可以以竞争形式来检测。在存在与不存在结合的竞争性抑制剂的情况下阵列与样品的结合谱的差异在表征样品时可能是有用的。
分类算法
[0127] 对抗体结合信号数据即免疫标记的分析以及由其得到的诊断,通常使用各种计算机算法和程序进行。使用例如激光扫描仪扫描由标记的第二抗体产生的抗体结合模式。可以使用软件如GenePix Pro 8软件(Molecular Devices,Santa Clara,CA)导入和处理由扫描仪获取的结合信号图像,以提供每个肽的表格信息,例如,在0-65,000范围内的连续值。可以导入表格数据并使用例如,Agilent的GeneSpring7.3.1(Agilent,Santa Clara,CA)进行统计分析。
[0128] 可以使用已知的统计学检验,例如Welch-校正的T-检验或ANOVA来鉴定在从不同健康状况的受试者获得的样品之间显示差异信号模式的肽。例如,对于包含来自一组测试患者(如患有疾病的受试者)的样品的一组样品,可以获得与阵列肽结合的抗体模式,并且样品形成一组参考受试者,例如健康患者。比较结合信号信息,并应用统计分析来选择在预定的严格性水平下区分两种状况(即测试组和参考组)的鉴别肽。通过根据肽的p值对肽进行排序可以获得鉴别能力最佳的肽的列表。可以对鉴别肽进行排序,并将其鉴定为具有至少10-30、至少10-29、至少10-28、至少10-27、至少10-26、至少10-25、至少10-24、至少10-23、至少10-22、至少10-21、至少10-20、至少10-19、至少10-18、至少10-17、至少10-16、至少10-15、至少10-14、至少10-13、至少10-12、至少10-11、至少10-10、至少10-9、至少10-8、至少10-7、至少10-6或至少10-5的p值。
[0129] 或者,随后可以将在统计分析后选择的辨别肽的结合信号信息导入机器学习算法,以获得在期望的准确度、灵敏度和特异性下对抗体谱数据进行分类的模型,并确定疾病是否存在,疾病严重程度,疾病进展和本文其他地方描述的其他应用。一种基本的分类算法——线性判别分析(LDA)——广泛用于分析生物医学数据,以便对两种或更多种疾病类别进行分类。例如,LDA可以是分类算法。一种更复杂的分类方法——支持向量机(SVM),使用数学内核通过超平面分离类别,将原始预测子投影到更高维空间。一些常见的内核包括线性、多项式、S型或径向基函数。(Kukreja等人,BMC Bioinformatics.2012;13:139)中描述了对本领域中描述的常用分类器的比较研究。基于抗体结合谱数据的用于数据分析和预测建模的其他算法包括贝叶斯网络、逻辑回归、简单逻辑、多层感知器、K最近邻(KNearest neighbor)、K Star、属性选择分类器(ACS)、通过聚类分类、通过回归分类、Hyper Pipes、投票特征间隔分类器、J48(C4.5算法的Java实现)、随机树和随机森林
[0130] 在一些实施方案中,抗体结合谱从训练样品组获得,其用于通过应用基于SVM分析的消除算法鉴定最具辨别性的肽组合。通过交叉验证,可以确定在不同显著性水平下算法的准确度。为了产生和评估可行数量的辨别肽的抗体结合谱,可以使用多个辨别肽构建多个模型,以鉴定表现最佳的模型。在一些实施方案中,至少25、至少50、至少75、至少100、至少200、至少300、至少400、至少500、至少750、至少1000、至少1500、至少2000、至少3000、至少4000、至少5000、至少6000、至少7000、至少8000、至少9000、至少10000、至少11000、至少12000、至少13000、至少14000、至少15000、至少16000、至少17000、至少18000、至少19000、至少20000或更多个鉴别肽用于训练特定的疾病分类模型。在一些实施方案中,阵列上的肽的总数的至少0.00001%、至少0.0001%、至少0.0005%、至少0.001%、至少0.005%、至少
0.01%、至少0.05%、至少0.1%、至少0.5%、至少1.0%、至少2%、至少3%、至少4%、至少
5%、至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%或至少99%是鉴别肽,并且相应的结合信号信息用于训练特定的状况分类模型。在一些实施方案中,针对阵列上的所有肽获得的信号信息用于训练状况特异性模型。
[0131] 可以产生包含不同数目的鉴别肽的多个模型,并且可以通过交叉验证过程评估每个模型的性能。通过将训练样品集的每个样品分配给多个交叉验证组中的一个,可以训练和交叉验证SVM分类器。例如,对于四折交叉验证,将每个样品分配给四个交叉验证组中的一个,使得每组包括测试和对照样品,即参考样品;一个交叉验证组如组1被保留,并使用组2-4中的样品训练SVM分类器模型。对训练组中区分测试例和参考样品的肽进行分析并按p值排序;然后将前k个肽用作SVM模型的预测因子。为了阐明输入预测因子的数量与模型性能之间的关系,并防止过拟合,针对一系列k,例如,25、50、100、250、1000、200、3000个最佳肽或更多个,重复sub=loop。通过使用组2-4产生的模型进行预测,即组1中样品的分类。生成四组中每组的模型,并使用真实疾病样品的信号结合数据,使用来自4个模型的所有预测来计算性能(AUC、灵敏度和/或特异性)。交叉验证步骤重复至少100次,并且相对于置信区间,例如,95%,计算平均性能。诊断可视化可以通过例如火山图、ROC(受试者工作特征)曲线以及相对于输入肽数量的模型性能产生。
[0132] 选择基于针对一组辨别输入肽(最佳辨别肽的列表,k)的抗体结合信息的最佳模型,并使用该模型预测测试组的疾病状态。使用验证集确定不同分类器的性能,并且使用测试样品集,从具有最佳性能的模型获得如准确度、灵敏度、特异性和F测量的性能特征。鉴定不同组的辨别肽,以区分不同的状况。因此,针对将在患者中确定的每种健康状况,建立基于一组最佳辨别输入肽的最佳模型。
[0133] 在一些实施方案中,产生的分类性能可以作为受试者工作特征曲线(ROC)提供。分类的特异性、灵敏度和准确度度量可由ROC下面积(AUC)确定。在一些实施方案中,该方法在受试者工作特征(ROC)曲线下面积(AUC)大于0.60的方法性能或准确度下确定/分类受试者的健康状况。在其他实施方案中,所述方法性能的特征为受试者工作特征(ROC)曲线下面积(AUC)大于0.70、大于0.80、大于0.90、大于0.95,方法性能的特征为受试者工作特征(ROC)曲线下面积(AUC)大于0.97,方法性能的特征为受试者工作特征(ROC)曲线下面积(AUC)大于0.99。在其他实施方案中,所述方法性能的特征为受试者工作特征(ROC)曲线下面积(AUC)在0.60至0.70、0.70至0.79、0.80至0.89、或0.90至1.0的范围内。在其他实施方案中,方法性能以灵敏度、特异性、预测值或似然比(LR)表示。
[0134] 在一些实施方案中,所述方法具有至少60%的灵敏度,例如65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的灵敏度。
[0135] 在其他实施方案中,所述方法具有至少60%的特异性,例如65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的特异性。
[0136] 已经为特定健康状况或疾病建立了最佳分类器模型,该方法用于确定受试者的健康状况。从需要诊断的受试者获得样品。使样品与肽阵列接触,并且检测由受试者样品中的抗体与阵列上的多个肽结合产生的结合信号(例如,使用扫描仪),并将其导入软件以将由受试者样品中的结合抗体产生的结合信号与先前为最佳分类模型鉴定的辨别肽进行比较。提供了模型的辨别肽与从样品获得的相应肽的结合信号之间的信号差异的总得分,并给出了指示疾病存在或不存在的输出。
[0137] 在一些实施方案中,相对于一个或多个参考组的状况确定受试者的状况,其中所述方法性能的特征为受试者工作特征(ROC)曲线下面积(AUC)大于0.70、大于0.80、大于0.90、大于0.95,所述方法性能的特征为受试者工作特征(ROC)曲线下面积(AUC)大于0.97,所述方法性能的特征为受试者工作特征(ROC)曲线下面积(AUC)大于0.99。在其他实施方案中,所述方法性能的特征为受试者工作特征(ROC)曲线下面积(AUC)范围为0.60至0.70、
0.70至0.79、0.80至0.89或0.90至1.0。在其他实施方案中,方法性能以灵敏度、特异性、预测值或似然比(LR)表示。
[0138] 在一些实施方案中,该方法具有至少60%的灵敏度,例如65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的灵敏度。
[0139] 在其他实施方案中,该方法具有至少60%的特异性,例如65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的特异性。
[0140] 辨别肽的特征可以为富集一种或多种特定氨基酸,和/或富集一个或多个序列基序。氨基酸和基序含量的富集是相对于与阵列文库中所有肽的相应总氨基酸和基序含量。除非重要肽列表的长度少于100种肽,否则从该列表中鉴别出富集的基序,在这种情况下,使用基于与Welch t-检验相关的p值的前500种肽。将该肽列表中的不同n-聚体(n-mer)与总文库中相同大小的n-聚体进行比较,以确定任何n-聚体是否富集。富集倍数通过确定基序(例如ABCD)在列表中出现的次数除以该基序(ABCD)在文库中出现的次数来计算。该值进一步除以基序类型(例如,四聚体)在文库中出现的相对次数(即,列表中所有四聚体的总数除以文库中四聚体的总数)。这种富集倍数(E)计算可表示为:
E=(m/M)/(t/T)
其中m为该基序作为辨别肽列表的一部分出现的次数;M为该基序在文库中出现的总次
数;t为该基序类型在列表中出现的次数;T为该基序在文库中出现的次数。富集倍数也可以报告为富集百分比,即“富集值”乘以100。
[0141] 在一些实施方案中,在用本文公开的方法和阵列诊断或检测受试者的自身免疫疾病中区分患有自身免疫疾病的受试者与参考健康受试者的免疫特征结合模式的辨别肽对于至少一种、至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种不同的氨基酸而言富集。对于包含自身免疫疾病的免疫特征肽的至少一种氨基酸,氨基酸可以富集至少100%、至少125%、至少150%、至少175%、至少200%、至少225%、至少250%、至少275%、至少300%、至少350%、至少400%、至少450%或至少500%。
在优选的实施方案中,自身免疫疾病是SSc或DM。在一些实施方案中,区分SSc与健康参考受试者的辨别肽对于酪氨酸、赖氨酸、精氨酸、苯丙氨酸、丝氨酸、色氨酸、甘氨酸和丙氨酸中的一种或多种而言富集。在一些实施方案中,区分DM与健康参考受试者的辨别肽对于酪氨酸、色氨酸、丝氨酸、甘氨酸、天冬氨酸和苯丙氨酸中的一种或多种而言富集。
[0142] 在一些实施方案中,用于采用本文公开的方法和阵列诊断或检测受试者的自身免疫疾病的免疫特征结合模式的辨别肽对于至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个或至少十个不同的序列基序而言富集。对于包含自身免疫疾病的免疫特征的肽的至少一个基序,序列基序可以富集至少100%、至少125%、至少150%、至少175%、至少200%、至少225%、至少250%、至少275%、至少300%、至少350%、至少400%、至少450%或至少500%。在优选的实施方案中,自身免疫疾病是SSc或DM。在一些实施方案中,区分SSc与健康参考受试者的辨别肽对于图5A中提供的一个或多个基序而言富集。在一些实施方案中,区分DM与健康参考受试者的辨别肽对于图17A中提供的一个或多个基序而言富集。
[0143] 在一些实施方案中,用于采用本文公开的方法和阵列提供对受试者的自身免疫疾病的鉴别诊断的免疫特征结合模式的辨别肽对于至少一种、至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种不同的氨基酸而言富集。对于包含自身免疫疾病的免疫特征的肽的至少一种氨基酸,氨基酸可以富集至少100%、至少125%、至少150%、至少175%、至少200%、至少225%、至少250%、至少275%、至少300%、至少350%、至少400%、至少450%或至少500%。在优选的实施方案中,在SSc与DM之间进行鉴别诊断。在一些实施方案中,区分SSc与DM参考受试者的辨别肽对于丝氨酸、甘氨酸、酪氨酸、精氨酸、丙氨酸、谷氨酰胺和缬氨酸中的一种或多种而言富集。
[0144] 在一些实施方案中,用于采用本文公开的方法和阵列提供对受试者的自身免疫疾病的鉴别诊断的免疫特征结合模式的辨别肽对于至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个或至少十个不同的序列基序而言富集。对于包含自身免疫疾病的免疫特征的肽的至少一个基序,序列基序可以富集至少100%、至少125%、至少150%、至少175%、至少200%、至少225%、至少250%、至少275%、至少300%、至少350%、至少400%、至少450%或至少500%。在优选的实施方案中,自身免疫疾病是SSc或DM。在一些实施方案中,区分SSc与DM受试者的辨别肽对于图13A中提供的一个或多个基序而言富集。
[0145] 在一些实施方案中,可以相对于患有多种不同自身免疫疾病的一组参考受试者对受试者进行鉴别诊断。在一些实施方案中,相对于患有其他自身免疫疾病的一组受试者进行鉴别诊断,所述其他自身免疫疾病包括混合结缔组织病(MCTD)、未分化结缔组织病(UCTD)、肌炎、多肌炎、系统性红斑狼疮和硬斑病。用于采用本文公开的方法和阵列对受试者的自身免疫疾病进行鉴别诊断的免疫特征结合模式的辨别肽对于至少一种、至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种不同的氨基酸而言富集。对于鉴定自身免疫疾病的辨别肽的至少一种氨基酸,氨基酸可以富集至少100%、至少125%、至少150%、至少175%、至少200%、至少225%、至少250%、至少
275%、至少300%、至少350%、至少400%、至少450%或至少500%。在优选的实施方案中,自身免疫疾病是SSc或DM。区分患有SSc的受试者与各自患有多种不同种疾病中的一种的参考受试者的辨别肽对于天冬氨酸、谷氨酸、脯氨酸、缬氨酸、甘氨酸和丝氨酸中的一种或多种而言富集。
[0146] 区分患有DM的受试者与各自患有多种不同种疾病中的一种的参考受试者的辨别肽对于赖氨酸、组氨酸、丝氨酸、精氨酸、谷氨酸、丙氨酸和甘氨酸中的一种或多种而言富集。
[0147] 在一些实施方案中,用于采用本文公开的方法和阵列提供对受试者的自身免疫疾病的鉴别诊断的免疫特征结合模式的辨别肽对于至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个或至少十个不同的序列基序而言富集。对于包含自身免疫疾病的免疫特征的肽的至少一个基序,序列基序可以富集至少100%、至少125%、至少150%、至少175%、至少200%、至少225%、至少250%、至少275%、至少300%、至少350%、至少400%、至少450%或至少500%。在优选的实施方案中,自身免疫疾病是SSc或DM。在一些实施方案中,区分SSc与各自患有多种不同的自身免疫疾病中的一种的参考受试者的组的辨别肽对于图7A中提供的一个或多个基序而言富集。在一些实施方案中,区分DM与各自患有多种不同的自身免疫疾病中的一种的参考受试者的组的辨别肽对于图19A中提供的一个或多个基序而言富集。
[0148] 疾病免疫谱与参考例如健康的免疫谱的比较以及鉴定差异结合的肽可以揭示,与参考相比,至少一些辨别肽在疾病免疫谱中结合更多的抗体;和/或与参考相比,至少一些辨别肽在疾病免疫谱中结合更少的抗体。因此,在一些实施方案中,本发明的方法是用于诊断或检测自身免疫病症的方法,该方法包括:a)使肽阵列与来自患者或受试者的第一生物样品接触;b)检测第一生物样品中的抗体与肽阵列的结合,以获得第一免疫特征谱;c)使肽阵列与来自患有已知自身免疫疾病或病症的个体的对照样品接触;d)检测对照样品中的抗体与肽阵列的结合,以获得第二免疫特征谱;e)比较第一免疫特征谱与第二免疫特征谱,并鉴定与第二免疫特征谱相比,在第一免疫特征谱中结合更少或更多抗体的差异结合的肽;以及f)确定该患者或受试者是否患有自身免疫疾病或病症。
[0149] 较轻微形式的硬皮病通常局限于皮肤厚的区域;通常只有手指和/或脸部。每个硬皮病患者可能会有不同形式的症状,包括质沉着(即皮肤和组织下钙的沉积),雷诺现象、食管活动不良、指端硬化和毛细血管扩张。然而,硬皮病可以发展为弥散性疾病,其涉及更多区域和皮肤增厚,并且可以包括手臂、腿和躯干的皮肤。紧缩的皮肤使手指、手和其他关节难以弯曲。有时会出现关节、肌和肌肉的炎症。面部紧缩的皮肤可以减小人口腔的大小,并使良好的牙齿护理非常重要。皮肤会失去或获得色素;从而形成使变浅或变黑的皮肤区域。有些人会因为皮肤受损而发生四肢毛发脱落,汗液减少以及皮肤干燥。更重要的是,弥散性硬皮病可能与胃肠道、心脏、肺或肾脏等内脏器官的损害相关。器官损害程度是高度可变的——有些患者完全没有,其他患者器官可能受到严重影响。辨别肽也可以区分反映疾病(例如自身免疫疾病)的进展的不同状态。例如,SSc的进展可以在间质性肺病(ILD)中表现出来。在一些情况下,SSc可以进展为胃窦血管扩张(GAVE)中的表现。在其他情况下,SSc可进展为牵涉肾脏。与ILD和GAVE相关的并发症也可以发生在其他模拟自身免疫疾病例如DM中。
[0150] 在另一个方面,本发明的方法是确定受试者的自身免疫病症的疾病状态或进展的方法,所述方法包括:a.使肽阵列与来自患有已知自身免疫病症的个体患者或受试者的第一生物样品接触;b.检测第一生物样品中的抗体与肽阵列的结合,以获得第一免疫特征谱;c.使肽阵列与来自一个或多个处于已知自身免疫病症阶段的个体的对照样品接触;d.检测对照样品中的抗体与肽阵列的结合,以获得第二免疫特征谱;e.比较第一免疫特征谱与第二免疫特征谱,以确定患有自身免疫疾病或病症的患者或受试者的疾病阶段或进展。
[0151] 在一些实施方案中,所提供的测定、方法和装置可以确定已知患有自身免疫疾病的受试者的疾病进展。该方法包括:(a)使来自受试者的样品与包含至少10,000个不同的原位合成的肽的肽阵列接触;(b)检测样品中存在的抗体与所述阵列上的至少25个肽的结合,以获得结合信号的第一组合;以及(c)将结合信号的第一组合与至少参考结合信号的第二组合进行比较,其中所述参考结合信号的第二组合包括从包括具有指示所述自身免疫疾病的进展的临床表现的多个受试者的参考组获得的结合信号的组合,从而进行所述鉴别诊断,其中所述方法性能的特征为受试者工作特征(ROC)曲线下面积(AUC)大于0.6。在一些实施方案中,疾病进展在患有伴有ILD的SSC的受试者中确定。在其他实施方案中,进展在患有伴有ILD的SSC的受试者中确定。在其他实施方案中,进展在患有伴有ILD的DM的受试者中确定。
[0152] 在一些实施方案中,用于采用本文公开的方法和阵列确定受试者的自身免疫疾病的进展的免疫特征结合模式的辨别肽对于至少一种、至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种不同的氨基酸而言富集。对于包含自身免疫疾病的免疫特征的肽的至少一种氨基酸,氨基酸可以富集至少100%、至少125%、至少150%、至少175%、至少200%、至少225%、至少250%、至少275%、至少300%、至少350%、至少400%、至少450%或至少500%。在优选的实施方案中,疾病进展在患有SSc的受试者之间确定,并且进展在患有ILD和/或GAVE的受试者中确定。在一些实施方案中,相对于患有SSC但没有ILD的受试者确定患有SSc和ILD的受试者的疾病进展的辨别肽对于脯氨酸、精氨酸、赖氨酸、组氨酸和天冬氨酸中的一种或多种而言富集。在其他实施方案中,相对于患有SSC但没有GAVE的受试者确定患有SSc和GAVE的受试者的疾病进展的辨别肽对于精氨酸、酪氨酸、丝氨酸、组氨酸、赖氨酸和苯丙氨酸中的一种或多种而言富集。
[0153] 在一些实施方案中,用于采用本文公开的方法和阵列确定受试者的自身免疫疾病的进展的免疫特征结合模式的辨别肽对于至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个或至少十个不同的序列基序而言富集。对于包含自身免疫疾病的免疫特征的肽的至少一个基序,序列基序可以富集至少100%、至少125%、至少150%、至少175%、至少200%、至少225%、至少250%、至少275%、至少300%、至少350%、至少400%、至少450%或至少500%。在优选的实施方案中,自身免疫疾病是SSc或DM。在优选的实施方案中,疾病进展在患有SSc的受试者之间确定,并且进展在患有ILD和/或GAVE的受试者中确定。在一些实施方案中,相对于患有SSC但没有ILD的受试者确定患有SSc和ILD的受试者的疾病进展的辨别肽对于图15A中提供的一个或多个基序而言富集。
在其他实施方案中,相对于没有GAVE的SSC受试者确定患有SSc和GAVE的受试者的疾病进展的辨别肽对于图11A中提供的一个或多个基序而言富集。
[0154] 在一些实施方案中,用于采用本文公开的方法和阵列确定受试者的自身免疫疾病的进展的免疫特征结合模式的辨别肽对于至少一种、至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种不同的氨基酸而言富集。对于包含自身免疫疾病的免疫特征的肽的至少一种氨基酸,氨基酸可以富集至少100%、至少125%、至少150%、至少175%、至少200%、至少225%、至少250%、至少275%、至少300%、至少350%、至少400%、至少450%或至少500%。在优选的实施方案中,疾病进展在没有肾危象的SSc受试者之间确定,并且进展在具有肾危象的SSc受试者中确定。在一些实施方案中,相对于没有肾危象的SSC受试者确定没有肾危象的SSc受试者的疾病进展的辨别肽对于脯氨酸、天冬氨酸和谷氨酸中的一种或多种而言富集。
[0155] 在一些实施方案中,用于采用本文公开的方法和阵列确定受试者的自身免疫疾病的进展的免疫特征结合模式的辨别肽对于至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个或至少十个不同的序列基序而言富集。对于包含自身免疫疾病的免疫特征的肽的至少一个基序,序列基序可以富集至少100%、至少125%、至少150%、至少175%、至少200%、至少225%、至少250%、至少275%、至少300%、至少350%、至少400%、至少450%或至少500%。在优选的实施方案中,疾病进展在没有肾危象的SSc受试者之间确定,并且进展在具有肾危象的SSc受试者中确定。在一些实施方案中,相对于没有肾危象的SSC受试者确定具有肾危象的SSc受试者的疾病进展的辨别肽对于图9A中提供的一个或多个基序而言富集。
[0156] 在一些实施方案中,用于采用本文公开的方法和阵列确定受试者的自身免疫疾病的进展的免疫特征结合模式的辨别肽对于至少一种、至少两种、至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种不同的氨基酸而言富集。对于包含自身免疫疾病的免疫特征的肽的至少一种氨基酸,氨基酸可以富集至少100%、至少125%、至少150%、至少175%、至少200%、至少225%、至少250%、至少275%、至少300%、至少350%、至少400%、至少450%或至少500%。在优选的实施方案中,疾病进展在患有DM的受试者之间确定,并且进展在患有ILD和/或GAVE的受试者中确定。在一些实施方案中,相对于没有ILD的DM受试者确定患有DM和ILD的受试者的疾病进展的辨别肽对于脯氨酸、天冬氨酸、谷氨酸、丝氨酸、甘氨酸和谷氨酰胺中的一种或多种而言富集。
[0157] 在一些实施方案中,用于采用本文公开的方法和阵列确定受试者的自身免疫疾病的进展的免疫特征结合模式的辨别肽对于至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个或至少十个不同的序列基序而言富集。对于包含自身免疫疾病的免疫特征的肽的至少一个基序,序列基序可以富集至少100%、至少125%、至少150%、至少175%、至少200%、至少225%、至少250%、至少275%、至少300%、至少350%、至少400%、至少450%或至少500%。在优选的实施方案中,疾病进展在患有DM的受试者之间确定,并且进展在患有ILD和/或GAVE的受试者中确定。在一些实施方案中,相对于没有ILD的DM受试者确定患有DM和ILD的受试者的疾病进展的辨别肽对于图21A中提供的一个或多个基序而言富集。
[0158] 如针对诊断和差异诊断自身免疫疾病的方法所述,比较疾病免疫谱与反映疾病进展的参考(例如,具有器官损害的受试者的疾病免疫谱)以及鉴定差异结合的肽可以揭示,与参考相比,至少一些辨别肽在疾病免疫谱中结合更多的抗体;和/或与参考相比,至少一些辨别肽在疾病免疫谱中结合更少的抗体。在一些实施方案中,本发明的方法是用于确定自身免疫病症的疾病状态或进展的方法,所述方法包括:a)使肽阵列与来自患有自身免疫疾病或病症的患者或受试者的第一生物样品接触;b)检测第一生物样品中的抗体与肽阵列的结合,以获得第一免疫特征谱;c)使肽阵列与来自处于自身免疫疾病或病症的已知阶段或状态的个体的对照样品接触;d)检测对照样品中的抗体与肽阵列的结合,以获得第二免疫特征谱;e)比较第一免疫特征谱与第二免疫特征谱,并鉴定与第二免疫特征谱相比,在第一免疫特征谱中结合更少或更多抗体的差异结合的肽;以及f)确定该患有自身免疫疾病或病症的患者或受试者的疾病状态或进展。自身免疫疾病
[0159] 所提供的测定、方法和装置可用于诊断任何自身免疫疾病,提供相对于其他自身免疫疾病,非自身免疫模拟疾病以及其他重叠疾病的自身免疫疾病的鉴别诊断,确定自身免疫疾病的进展,对自身免疫疾病的活动进行评分,将用于评估的候选靶标鉴定为治疗自身免疫疾病的治疗剂,并基于预测的治疗反应将临床试验中的患者分层。可以根据提供的测定、方法和装置诊断、监测、预防、治疗或用于鉴定靶治疗剂的自身免疫疾病或病症的非限制性示例包括:系统性红斑狼疮(SLE)(例如,系统性红斑狼疮、盘状狼疮、药物性狼疮、新生儿狼疮)、类风湿性关节炎、舍格伦病、多发性硬化(MS)、炎症性肠病(IBD),例如克罗恩病、溃疡性结肠炎、胶原性结肠炎、淋巴细胞性结肠炎、缺血性结肠炎、转移性结肠炎、Behcet综合征、感染性结肠炎、不确定性结肠炎、间质性膀胱炎、银屑病关节炎、硬皮病(SSc)、I型糖尿病、迪生病、低丙种球蛋白血症、斑秃、淀粉样变性、强直性脊柱炎、抗GBM/抗TBM肾炎、抗磷脂综合征(APS)、自身免疫性肝炎、自身免疫性内疾病(AIED)、轴突和神经元神经病变(AMAN)、Behcet病、大疱性类天疱疮、Castleman病(CD)、乳糜泻、Chagas病、慢性炎症性脱髓鞘性多发性神经病(CIDP)、慢性复发性多病灶性骨髓炎(CRMO)、慢性阻塞性肺病(COPD)、Churg-Strauss、瘢痕性类天疱疮/良性粘膜类天疱疮、Cogan综合征、冷凝集素疾病、先天性心脏传导阻滞、柯萨奇心肌炎、CREST综合征、克罗恩病、疱疹样皮炎、皮肌炎、Devic病(视神经脊髓炎)、盘状狼疮、Dressler综合征、子宫内膜异位症、嗜酸性食管炎(EoE)、嗜酸性筋膜炎、结节性红斑、原发性混合型冷球蛋白血症、Evans综合征、纤维肌痛、纤维性肺泡炎、巨细胞动脉炎(颞动脉炎)、巨细胞心肌炎、肾小球肾炎、Goodpasture综合征、移植物抗宿主病(GVHD),例如排斥肾、肺、肝或心脏移植、伴有多血管炎的肉芽肿、格雷夫斯病、格林-巴利综合征、桥本氏甲状腺炎、溶血性贫血、Henoch-Schonlein紫癜(HSP)、妊娠疱疹或妊娠性类天疱疮(PG)、低丙球蛋白血症、IgA肾病、IgG4相关硬化病、包涵体肌炎(IBM)、间质性膀胱炎(IC)、青少年关节炎、青少年肌炎(JM)、川崎病、Lambert-Eaton综合征、白细胞破碎性血管炎、扁平苔癣、硬化性苔癣、木样结膜炎、线性IgA病(LAD)、慢性莱姆病、梅尼埃病、显微镜下多血管炎(MPA)、混合结缔组织病(MCTD)、Mooren溃疡、Mucha-Habermann病、重症肌无力、肌炎、发作性睡病、视神经脊髓炎、中性粒细胞减少症、眼瘢痕性类天疱疮、视神经炎、回文性风湿病(PR)、PANDAS(与链球菌相关的小儿自身免疫性神经精神疾病)、副肿瘤性小脑变性(PCD)、阵发性睡眠性血红蛋白尿症(PNH)、帕里罗姆伯格综合征、睫状体平坦部炎(外周葡萄膜炎)、Parsonnage-Turner综合征、天疱疮、周围神经病变、静脉周围脑脊髓炎、恶性贫血(PA)、POEMS综合征(多发性神经病、器官肿大、内分泌病、单克隆丙种球蛋白病、皮肤改变)、结节性多动脉炎、风湿性多肌痛、多发性肌炎、心肌梗塞后综合征、心包切开术后综合征、原发性胆汁性肝硬化、原发性硬化性胆管炎、孕激素性皮炎、银屑病、纯红细胞再生障碍(PRCA)、脓皮病(Pyoderma angrenosum)、雷诺现象、反应性关节炎、反射性交感神经营养不良、Reiter综合征、复发性多软骨炎、不宁腿综合征(RLS)、腹膜后纤维化、风湿热、类风湿性关节炎(RA)、结节病、施密特综合征、巩膜炎、精子和睾丸自身免疫、僵人综合征(SPS)、亚急性细菌性心内膜炎(SBE)、Susac综合征、交感性眼炎(SO)、Takayasu动脉炎、颞动脉炎/巨细胞动脉炎、血小板减少性紫癜(TTP)、Tolosa-Hunt综合征(THS)、横贯性脊髓炎、溃疡性结肠炎(UC)、未分化结缔组织病(UCTD)、葡萄膜炎、血管炎、白癜风和/或韦格纳肉芽肿病(现被称为伴有多血管炎的肉芽肿(GPA))。
样品
[0160] 根据提供的方法使用的样品可以是任何生物样品。例如,生物样品可以是包含抗体的生物液体样品。合适的生物液体样品包括但不限于血液、血浆、血清、汗液、泪液、痰液、尿液、粪便水、耳流体、淋巴液、唾液、脑脊髓液、破坏液、骨髓悬浮液、阴道流、经宫颈灌洗液、滑液、房水、羊水、耳垢、母乳支气管肺泡灌洗液、脑液、囊液、胸膜和腹膜液、心包液、腹水、乳汁、胰液、呼吸道分泌物、肠道和泌尿生殖道、羊水、乳汁和白细胞泳动样品。生物样品还可以包括囊胚腔、脐带血或母体循环,其可以是胎儿或母体来源。在一些实施方案中,样品是容易通过非侵入性方法获得的样品,例如,血液、血浆、血清、汗液、泪液、痰液、尿液、痰液、耳流体或唾液。在某些实施方案中,样品是外周血样品,或外周血样品的血浆或血清部分。如本文所用,术语“血液”、“血浆”和“血清”明确包括其部分或加工部分。
[0161] 由于其微创可及性及其容易获得,因此优选血液,即在临床实践中常规测量和收集的人体体液。此外,血液灌注全身组织及其组成因此作为个体的整体生理学指标是相关的。在一些实施方案中,用于获得免疫特征/抗体结合谱的生物样品是血液样品。在其他实施方案中,生物样品是血浆样品。在其他实施方案中,生物样品是血清样品。在其他实施方案中,生物样品是干燥的血液样品。生物样品可以通过第三方,例如不进行抗体结合谱分析的一方,和/或对肽阵列进行结合测定的一方获得。例如,样品可以通过临床医生、医师或从中获得样品的受试者的其他健康护理管理人员获得。或者,生物样品可以由进行样品与肽阵列的结合测定的一方,和/或分析抗体结合谱/IS的同一方获得。待测定的生物样品可以存档(例如,冷冻)或以其他方式在贮藏条件下储存。
[0162] 术语“患者样品”和“受试者样品”在本文中可互换使用,是指从患者(即医疗照顾、护理或治疗的接受者)获得的样品,例如,生物流体样品。受试者样品可以是本文所述的任何样品。在某些实施方案中,受试者样品通过非侵入性程序获得,例如外周血样品。
[0163] 根据使用有限量样品提供的方法,可以获得生物流体样品中循环抗体的抗体结合谱。例如,阵列上的肽可以与一毫升血液的一部分接触,以获得包含足够数量的信息性肽-蛋白质复合物的抗体结合谱,以鉴定受试者的健康状况。
[0164] 在一些实施方案中,获得抗体结合谱所需的生物样品的体积小于10ml、小于5ml、小于3ml、小于2ml、小于1ml、小于900ul、小于800ul、小于700ul、小于600ul、小于500ul、小于400ul、小于300ul、小于200ul、小于100ul、小于50ul、小于40ul、小于30ul、小于20ul、小于10ul、小于1ul、小于900nl、小于800nl、小于700nl、小于600nl、小于500nl、小于400nl、小于300nl、小于200nl、小于100nl、小于50nl、小于40nl、小于30nl、小于20nl、小于10nl或小于1nl。在一些实施方案中,可将生物流体样品稀释数倍以获得抗体结合谱。例如,可将从受试者获得的生物样品稀释至少2倍、至少4倍、至少8倍、至少10倍、至少15倍、至少20倍、至少30倍、至少40倍、至少50倍、至少100倍、至少200倍、至少300倍、至少400倍、至少500倍、至少
600倍、至少700倍、至少800倍、至少900倍、至少1000倍、至少5000倍或至少10,000倍。抗体存在于稀释的血清样品中,并且被认为对受试者的健康具有重要意义,因为如果抗体即使在稀释的血清样品中仍然存在,则它们必须合理地以相对高的量存在于患者的血液中。
[0165] 在实施例中给出了根据本文所述方法检测受试者疾病的示例。实施例表明,仅使用100微升血清或血浆就可以正确诊断硬皮病。鉴定候选靶蛋白
[0166] 获得的免疫特征随后可用于鉴定候选治疗靶标,并针对根据本文公开的方法和装置鉴定的自身免疫病症开发对于个体的治疗。在另一个方面,可以对鉴定阵列上的辨别肽的来自具有两种或更多种不同健康状况的受试者的样品中的抗体的差异结合进行分析,例如,通过比较区分蛋白质数据库中阵列序列的两种或更多种健康状况的一种或多种辨别肽的序列,以鉴定候选靶蛋白。在一些实施方案中,将抗体组库展开在肽阵列(免疫标记,IMS)上并比较来自患病受试者的样品与来自健康参考受试者或患有其他疾病或状况的受试者的样品,可对辨别肽进行鉴定,以揭示识别的蛋白质,即抗体结合的蛋白质。例如,可利用信息学方法来鉴定肽。
[0167] 在信息学无法鉴定推定的匹配的情况下,例如在非连续表位的情况下,可使用信息性的(informative)肽作为亲和试剂来纯化反应性抗体。而后可在标准免疫学技术中使用纯化的抗体来鉴定靶标。
[0168] 在诊断出状况后,可以查询适当的参考蛋白质组以关联样品中被抗体结合的辨别肽的序列。在所有蛋白质组中选择参考蛋白质组(手动和算法,根据许多标准),以提供生命树的广泛覆盖。参考蛋白质组构成了将在http://www.uniprot.org/proteomes/?query=reference:yes中的UniProtKB内发现的分类多样性的代表性横截面。参考蛋白质组包括经过充分研究的模式生物和生物医学和生物技术研究感兴趣的其他蛋白质组。具有特殊重要性的物种可以由特定生态型或感兴趣的菌株的许多参考蛋白质组表示。可以查询的蛋白质组的示例包括但不限于人蛋白质组,以及来自其他哺乳动物、非哺乳动物、病毒、细菌和原生动物寄生虫的蛋白质组。此外,可以查询的其他编译的蛋白质包括但不限于疾病相关蛋白质的列表、含有已知或未知突变(包括单核苷酸多态性、插入、置换和缺失)的蛋白质的列表、由已知和未知剪接变体组成的蛋白质的列表、或来自组合文库(包括天然和非天然氨基酸)的肽或蛋白质的列表。在一些实施方案中,可以使用辨别肽查询的蛋白质组,包括但不限于人蛋白质组RefSeq release 84,其对应于人类基因组构建GrCh38(https://www.ncbi.nlm.nih.gov/refseq/),于2016年3月10日编译,对每个独特的基因ID使用最长的转录变体。
[0169] 用于将单个和多个蛋白质与蛋白质组或蛋白质列表中的蛋白质进行比对的软件包括但不限于BLAST、CS-BLAST、CUDAWS++、DIAMOND、FASTA、GGSEARCH(GG或GL)、Genoogle、HMMER、H-suite、IDF、KLAST、MMseqs2、USEARCH、OSWALD、Parasail、PSI-BLAST、PSI_Protein、Sequilab、SAM、SSEARCH、SWAPHI、SWIMM和SWIPE。
[0170] 或者,相对于在阵列上的整个肽文库中发现的基序,在辨别肽中富集的序列基序可以与蛋白质组中的全长蛋白质或蛋白质片段进行比对,以鉴定可以作为治疗状况的可能治疗靶标进行验证的靶蛋白质。辨别肽与蛋白质组数据库中最长的可用转录物进行比对。用于鉴定蛋白质结构域、家族和功能位点的在线数据库和搜索工具是可用的,例如,ExPASy的Prosite、Motif Scan(MyHits,SIB,瑞士)、Interpro5、MOTIF(GenomeNet,日本)和Pfam(EMBL-EBI)。
[0171] 在一些实施方案中,比对方法可以是将查询序列的氨基酸映射到较长蛋白质序列上的任何方法,包括BLAST(Altschul,S.F.&Gish,W.[1996]"Local alignment statistics."Meth.Enzymol.266:460-480),使用组成替换和评分矩阵,有空位和无空位的精确匹配,表位预测,抗原性预测,疏水性预测,表面可及性预测。对于每种方法,可以使用规范或修改的评分系统,其中修改后的评分系统被优化,以校正肽文库组合物中的偏差。在一些实施方案中,使用修改的BLAST比对,需要3个氨基酸的种子,其中空位罚分为4,且评分矩阵为BLOSUM62(Henikoff,J.G.Amino acid substitution matrices from protein 
blocks.Proc.Natl.Acad.Sci.USA 89,10915–10919[1992]),该评分矩阵被修改为反映阵列的氨基组成(States,D.J.,Gish,W.,Altschul,S.F.[1991]"Improved sensitivity of nucleic acid database searches using application-specific scoring matrices."Methods 3:66-70.)。本领域技术人员容易辨别种子氨基酸的数量和空位罚分。这些修改可以包括提高简并置换的评分,去除阵列中缺失的氨基酸的罚分,并且对所有精确匹配同等地进行评分。
[0172] 可用于根据所提供的方法鉴定候选生物标志物蛋白的辨别肽是根据其区分两种或更多种不同健康状况的能力来选择的。因此,可以在预定的统计严格性下选择辨别肽,例如,通过区分两种或更多种状况的概率的p值;通过两种或更多种状况之间的相对结合信号强度变化的差异;通过其在单一状况下的强度等级;通过其在针对两种或更多种状况训练的机器学习模型中的系数,例如AUC,或通过其与一个或多个研究参数的相关性。
[0173] 被提供用于鉴定候选蛋白质生物标志物的方法利用辨别肽与蛋白质组或其他蛋白质列表中的蛋白质之间的同源性,同时校正相对于列表包含较大的肽的列表的潜在过度取样。
[0174] 查询肽是能够区分待比对的两种或更多种不同健康状况的辨别肽,该查询肽可以基于其区分两种或更多种状况的p值,其在两种或更多种状况之间的相对强度变化,通过其在单一状况下的强度等级,通过其在针对两种或更多种状况训练的机器学习模型中的系数,或者通过其与一个或多个研究参数的相关性进行选择。
[0175] 在鉴定了待查询的一组辨别肽和蛋白质组或蛋白质列表后,将所有辨别肽与蛋白质组或蛋白质列表中最长的可用蛋白质转录物进行比对,并鉴定具有正BLAST评分的肽。对于与辨别肽比对的每种蛋白质,比对中的BLAST-正评分肽的评分被组装成矩阵,例如修改的BLOSUM62。这些修改可以包括提高简并置换的评分,去除阵列中缺失的氨基酸的罚分,并且对所有精确匹配同等地进行评分。
[0176] 矩阵的每一行对应于所比对的肽,并且每一列对应于组成该蛋白质的连续氨基酸中的一种,在肽行内允许空位和缺失,以允许与蛋白质比对。
[0177] 通过使用上述修改的BLAST评分矩阵,矩阵中的每个位置接收该列中肽和蛋白质的配对氨基酸的评分。然后,对于蛋白质中的每种氨基酸,将相应的列相加,以产生“重叠评分”,其表示免疫特征辨别肽对该氨基酸的覆盖。
[0178] 氨基酸重叠评分s是辨别肽中氨基酸表示的校正评分,其解释了文库的组成。例如,阵列上的肽可以排除20种天然氨基酸中的一种或多种。因此,重叠评分考虑了文库中的氨基酸含量。为了针对文库组成校正该评分,对于列出的所有阵列肽使用相同方法计算重叠评分。这允许通过下式计算每个氨基酸的重叠评分ss=a-(b/d)*c
其中a是来自免疫特征肽的重叠评分,b是免疫特征肽的数目,c是整个肽阵列的重叠评分,并且d是整个阵列上肽的数目。
[0179] 接下来,将从每个辨别肽的比对获得的氨基酸重叠评分转换为蛋白质评分S。为了将这些在氨基酸水平上的评分s转换为全蛋白质统计值S,计算蛋白质中每个可能的平铺n聚体表位的评分的总和,并且最终得分是沿例如20聚体的窗口的最大值。
[0180] 相对于随机选择的非辨别肽的排序,对所鉴定的候选生物标志物进行排序。因此,如针对辨别肽所述,获得与相同的蛋白质组或蛋白质列表的一种或多种蛋白质的每一种比对的非辨别肽的重叠评分(非辨别's'评分)。然后将非辨别's'评分转换为多个随机选择的非辨别肽中的每一个的非辨别蛋白质'S'评分。例如,可获得至少25个、至少50个、至少100个或更多个随机选择的非辨别肽的非辨别蛋白质'S'评分。
[0181] 然后将鉴定的蛋白质生物标志物相对于通过非辨别肽比对鉴定的蛋白质进行排序。
[0182] 在一些实施方案中,提供了鉴定用于治疗人受试者的自身免疫疾病的候选靶蛋白的方法,该方法包括:(a)鉴定区分自身免疫疾病与一种或多种不同的自身免疫疾病的一组辨别肽;(b)将该组肽与人蛋白质组中的蛋白质进行比对;(c)鉴定该组中每个肽与免疫原蛋白质区域之间的同源区域;以及(d)将所述蛋白质鉴定为治疗所述自身免疫疾病的候选靶蛋白。该方法可以进一步包括鉴定一组区分自身免疫疾病与健康状况的辨别肽。实施例3说明了使用区分来自健康受试者的样品与来自患有SSc的受试者的样品的鉴别肽来鉴定候选靶蛋白的方法。表3提供了候选蛋白质靶标的列表。类似地,候选蛋白质靶标可以使用鉴别肽进行鉴定,该鉴别肽区分来自患有其他自身免疫疾病的受试者的样品与来自健康受试者的样品,来自患有其他自身免疫疾病的受试者的样品,和来自患有模拟或其他重叠疾病(可能是或可能不是自身免疫疾病)的受试者的样品。
[0183] 在一些实施方案中,提供了用于鉴定人受试者的自身免疫疾病的候选蛋白质生物标志物的方法,所述方法包括:(a)鉴定区分所述自身免疫疾病与一种或多种不同的健康状况的一组辨别肽;(b)将辨别肽组与蛋白质组中的蛋白质进行比对,以获得所述辨别肽组与所述蛋白质组中的一种或多种蛋白质的比对评分;根据统计学显著性对鉴定的蛋白质进行排序;以及将该蛋白质鉴定为所述自身免疫疾病的候选蛋白质生物标志物。在一些实施方案中,该方法进一步包括获得重叠评分,其中重叠评分校正肽文库的肽组成。在一些实施方-5 -6 -7 -8案中,该方法中使用的辨别肽被鉴定为具有小于10 、小于10 、小于10 、小于10 、小于10-9、小于10-10、小于10-11、小于10-12、小于10-13、小于10-14或小于10-15的p值。
[0184] 在一些实施方案中,所述方法进一步包括鉴定区分自身免疫疾病与健康状况的一组辨别肽。在其他实施方案中,该方法包括鉴定区分疾病进展的肽。在一些实施方案中,鉴别肽区分具有SSc和器官损害的受试者与具有SSc但没有器官损害的受试者。因此,候选生物标志物可用于诊断疾病,以鉴定疾病进展的阶段。生物标志物也可用于疾病监测。表3列出了针对硬皮病鉴定的候选生物标志物的示例。在一些实施方案中,根据该方法鉴定的候选生物标志物蛋白质按照小于10-3、小于10-4、小于10-5或小于10-6的p值进行排序。
[0185] 或者,根据所提供的方法鉴定的辨别肽可以使用在区分两种不同状况的最佳辨别肽中富集的序列基序来鉴定候选靶蛋白。在一个实施方案中,鉴定用于治疗人受试者的自身免疫疾病的候选靶标的方法包括(a)获得区分自身免疫疾病与一种或多种不同的自身免疫疾病的一组辨别肽;(b)鉴定所述辨别肽的一组基序;(c)将该组基序与人蛋白质组进行比对;(d)鉴定该组中每个基序与免疫原蛋白质区域之间的同源区域;以及(e)将所述蛋白质鉴定为治疗所述自身免疫疾病的候选靶标。该方法可以进一步包括鉴定区分自身免疫疾病和健康状况的一组辨别肽。基序在最佳辨别肽中富集,该辨别肽可用于鉴定候选靶蛋白以用于各种自身免疫疾病的开发和应用,图5、图7、图9、图11、图13、图15、图17、图19和图21提供了在不同进展阶段的一些基序。
[0186] 在一些实施方案中,鉴定来自受试者的样品的自身免疫疾病的步骤包括(i)使来自受试者的样品与包含至少10,000个不同的原位合成的肽的肽阵列接触;(ii)检测样品中存在的抗体与所述阵列上的至少25个肽的结合,以获得结合信号的组合;以及(iii)将结合信号的组合与一组或多组参考结合信号的组合进行比较,其中参考结合信号的组合的每个所述组包括从患有不同的自身免疫疾病的多个受试者获得的结合信号的组合。在一些实施方案中,将来自受试者的结合信号的组合与从一个或多个健康参考受试者获得的结合信号的组合进行比较。
[0187] 辨别肽还可以用作抑制或激活靶蛋白质-蛋白质相互作用的药物设计的基础。在另一个方面,提供了通过本发明方法鉴定的新型辨别肽的治疗和诊断用途。因此,这些方面和实施方案包括制剂、药物和药物组合物,其包含根据本发明的肽及其衍生物。在一些实施方案中,提供了用于医学的新型辨别肽或其衍生物。更具体地说,用于拮抗或激动(agonising)靶配体(例如细胞表面受体)的功能。本发明的辨别肽可用于治疗人体或动物体的各种疾病和状况,如癌症和退行性疾病。治疗还可包括预防性以及治疗性治疗以及疾病或状况的缓解。
[0188] 因此,本文公开的方法、系统和阵列装置能够筛选、鉴定治疗靶标,鉴定疫苗靶标,和/或在疾病和/或状况的早期阶段治疗该疾病和/或状况。例如,本文公开的方法、系统和阵列装置能够在传统的基于生物标志物的测定之前数天或数周检测、诊断和监测疾病和/或状况。此外,仅需要一个阵列,即一个免疫特征测定,即可检测、诊断和监测广谱的疾病和状况,包括炎性状况、自身免疫疾病、癌症和病原性感染。
[0189] 候选治疗靶标可以根据针对本文其他地方所述的任何一种自身免疫疾病提供的方法进行鉴定。在一些实施方案中,可以鉴定候选治疗靶标用于SSc的验证和后续治疗。表3提供了用于治疗SSc的示例性治疗候选物。疾病评分系统
通过本文公开的方法、装置和测定获得的差异结合活性或标记(也称为“免疫特征”
(IS))也可以与已知的疾病评分系统相关联。例如,与已知的免疫介导的疾病评分系统(包括针对SSc和DM开发的临床和实验室评分系统)相比,用所公开的方法和阵列获得的免疫特征结合模式具有至少0.6、至少0.65、至少0.7、至少0.75、至少0.8、至少0.85、至少0.9、至少
0.95、至少0.97、至少0.99或至少1.0的接受者工作特征(ROC)曲线下面积(AUC)(与被分析和诊断患有自身免疫疾病或病症的患者相比)。例如,辨别肽的结合信号数据可用于提供自身免疫疾病活性的评分。该评分可以与现有的评分系统相关联。例如,根据所提供的测定、方法和装置获得的SSc的评分可以与硬皮病的改良Rodnan皮肤评分、Medsger严重程度量表(Clin Exper Rheumatol 21:S42-S46[2003])和CT评分系统(Assayag等人,[2012]High Resolution Computed Tomography Scoring Systems for Evaluating Interstitial Lung Disease in Systemic Sclerosis Patients.Rheumatology S1:003.doi:10.4172/
2161-1149.S1-0030)关联。
[0190] 如本文所公开的,AUC可以解释为根据已知评分系统患有活动性疾病的患者的与免疫特征结合模式相关的值高于根据已知的评分系统患有非活动性疾病或无疾病的患者的概率。治疗和状况
[0191] 本发明的方法和阵列提供用于检测和诊断自身免疫病症的方法、测定和装置。可以检测和诊断在本文其他地方列出的任何一种自身免疫病症。本文公开的实施方案的方法和阵列可用于,例如,筛选受试者中的免疫病症。受试者可以是人、豚鼠、狗、猫、马、小鼠、兔和各种其他动物。受试者可以是任何年龄,例如,受试者可以是婴儿、幼儿、儿童、青春期前儿童、青少年、成年或老年个体。
[0192] 受试者的状况可以对应于疾病或健康状况。在一些实施方案中,受试者的状况是健康状况,并且本发明的方法监测该健康状况。在一些实施方案中,受试者的状况是疾病状况,并且本发明的方法用于诊断/监测该状况的状态和/或进展。本发明的方法还可用于预防状况。在一些实施方案中,本发明的方法与预防性处理结合使用。
[0193] 本发明的阵列和方法可由使用者使用。许多使用者可使用本发明的方法来鉴定和/或提供状况的治疗。使用者可以是,例如,希望监测其自身健康的人。使用者可以是,例如,卫生保健提供者。卫生保健提供者可以是,例如,医师。在一些实施方案中,使用者是照顾受试者的卫生保健提供者。可以是本发明的使用者的医师和卫生保健提供者的非限制性实例可包括麻醉师、减肥手术专业人员、血库输血医学专业人员、心脏电生理学医生、心脏外科医生、心脏病科医生、注册护理助理、临床心脏电生理学专业人员、临床神经生理学专业人员、临床护理专业人员、结直肠外科医生、重症护理医学专业人员、重症护理外科手术专业人员、牙科保健员、牙科医生、皮肤科医师、急诊医疗技师、急诊医学医师、胃肠外科医生、血液病医生、临终关怀和姑息医学专业人员、顺势疗法专业人员、传染病专业人员、内科医生、颌面外科医生、医务助理、体检医生(medical examiner)、医学遗传学家、医疗肿瘤学家、助产师、新生儿-围产期专业人员、肾病医生、神经科医生、神经外科医生、核医学专业人员、护士、开业护士、产科医师、肿瘤科医生、口腔外科医生、口腔正畸医师、整形外科专业人员、疼痛控制专业人员、病理学医师、儿科医师、灌注师、牙周病医师、整形外科医生、足病医生、直肠科医生、假肢专业人员、精神科医生、肺脏科医生、放射科医生(radiologist)、外科医生、胸科专业人员、移植专业人员、血管专业人员、血管外科医生和兽医。利用本发明的阵列和方法确定的诊断可并入受试者的病历中。阵列平台
[0194] 在一些实施方案中,本文公开了提供允许增加化学文库合成的多样性和保真度的阵列平台的方法和过程,阵列平台包含阵列表面上的多个单独特征。每个特征通常包含在阵列表面上原位合成的多个单独分子,其中分子在特征内是相同的,但是分子的序列或同一性在特征之间不同。阵列分子包括但不限于核酸(包括DNA、RNA、核苷、核苷酸、结构类似物或其组合)、肽、肽-模拟物及其组合等,其中阵列分子可包含分子中天然或非天然单体。这样的阵列分子包括大合成肽阵列的合成。在一些实施方案中,阵列中的分子为模拟表位,一种模拟表位结构并能够结合表位引发的抗体的分子。在一些实施方案中,阵列中的分子为互补位或互补位模拟物,其包含与抗原表位结合的抗体(或T细胞受体)的可变区中的位点。在一些实施方案中,本发明的阵列为包含随机、伪随机或最大多样化肽序列的肽阵列。
[0195] 所述肽阵列可包括与充分表征的单克隆抗体(mAb)的表位相匹配的对照序列。可以测量与对照序列以及与文库肽的结合模式,以使阵列和免疫特征测定过程符合要求。具有已知表位的mAb,例如4C1、p53Ab1、p53Ab8和LnKB2,可以以不同的剂量测定。此外,晶片间信号精度可以通过测试来自不同晶片的阵列上的样品重复,例如血浆样品,并计算所有文库肽的变异系数(CV)来确定。结合信号的测量精度可以被确定为在相同批次(在晶片批次内)晶片上合成的阵列上发生的阵列间、玻片间、晶片间和日间变化的集合。此外,可以针对不同批次(在晶片批次之间)晶片上的阵列确定测量精度。在一些实施方案中,可以在晶片批次之内和/或之间进行结合信号的测量,其精度变化小于5%、小于10%、小于15%、小于20%、小于25%或小于30%。
[0196] 本文公开的技术包括光刻阵列合成平台,该光刻阵列合成平台合并半导体制造过程和组合化学合成以在硅晶片上产生基于阵列的文库。通过利用光刻特征图案化的巨大进步,该阵列合成平台具有高度可扩展性,并且能够在8英寸晶片上产生具有4000万个特征的组合化学文库。使用半导体晶片生产设备在10,000级洁净室中进行光刻阵列合成,以实现高再现性。当将晶片切割成标准显微镜载玻片尺寸时,每个载玻片含有超过300万个不同的化学实体。
[0197] 在一些实施方案中,具有通过本文公开的光刻技术产生的化学文库的阵列用于基于免疫的诊断测定,例如称为免疫特征测定。使用来自与阵列结合的一滴血液的患者抗体组库,结合阵列的荧光结合剖面图像提供了足够的信息来对疾病与健康进行分类。
[0198] 在一些实施方案中,正在开发用于临床应用的免疫特征测定以诊断/监测自身免疫疾病并评估对自身免疫治疗的应答。免疫特征测定的示例性实施方案详细描述于题为“Compound Arrays for Sample Profiling”的美国预授权公开号2012/0190574和题为“Immunosignaturing:A Path to Early Diagnosis and Health Monitoring”的美国预授权公开号2014/0087963中,对于这样的公开内容,这两篇申请都通过引用并入本文。本文开发的阵列使用包括椭圆偏光法、质谱分析法和荧光的正交分析方法在每个合成阵列内结合分析测量能力。这些测量能够对阵列合成性能进行纵向定性和定量评估。
[0199] 在一些实施方案中,检测肽阵列上的抗体结合提出了一些可通过本文公开的技术解决的挑战。因此,在一些实施方案中,本文公开的阵列和方法利用阵列表面上的特定的涂层和官能团密度,其可调节进行免疫特征测定所必需的所需性质。例如,通过用适度亲水的单层聚乙二醇(PEG)、聚乙烯醇、羧甲基葡聚糖及其组合涂覆硅表面,可以使肽阵列上的非特异性抗体结合最小化。在一些实施方案中,所述亲水单层是均匀的。其次,使用使肽远离表面移动的间隔物将合成的肽与硅表面连接,使得肽以无阻碍的方向呈递给抗体。检测器装置
在一些实施方案中,本文公开的系统、平台和方法包括用于检测本文公开的阵列形式
上的结合(包括本文公开的肽阵列上的抗体结合)的检测器装置。在一些实施方案中,与光学检测方法(ccd、pmt、其他光学检测器、光学滤光器和其他光学检测装置)结合使用,抗体结合的检测通过光学检测实时地或以定时间隔来报告。在某些情况下,通过将光学检测转换为AFU(任意荧光单位)或通过阻抗测量或其他电化学传感将其转化为电信号,报告最终结合活性的定量。在其他情况下,通过光或电磁能量的发射或吸收来检测抗体结合,无论是在可见范围内,还是从应用于肽装置的探针上的光学可检测标记来检测。光学可检测的标记包括但不限于荧光、化学发光、电化学发光、发光、磷光、荧光偏振和电荷标记。在一些情况下,荧光标记的探针仅在特定靶标或抗体的存在下有活性,使得来自样品的荧光响应表示靶标或抗体的存在。
[0200] 在一些情况下,利用光传递方案来提供抗体结合的光学激发和/或发射和/或检测。在某些实施方案中,这包括使用流动池材料(热聚合物,如丙烯酸(PMMA)环烯聚合物(COP)、环烯烃共聚物(COC)等)作为光波导,以消除使用外部组件的需要。此外,在一些情况下,光源-发光二极管-LED、垂直腔表面发射激光器-VCSEL和其他照明方案直接集成在匣盒或检测装置内,或直接构建在肽阵列表面上,以具有内部控制且供电的光源。PMT、CCD或CMOS检测器也可以内置在检测装置或匣盒中。数字处理设备
[0201] 在一些实施方案中,本文所述的系统、平台、软件、网络和方法包括数字处理设备或其使用。在进一步的实施方案中,数字处理设备包括一个或多个硬件中央处理单元(CPU),即执行设备功能的处理器。在更进一步的实施方案中,数字处理设备进一步包含被配置为进行可执行指令的操作系统。在一些实施方案中,数字处理设备任选地连接计算机网络。在进一步的实施方案中,数字处理设备任选地连接到因特网,使得其访问万维网。在更进一步的实施方案中,数字处理设备任选地连接到计算基础设施。在其他实施方案中,数字处理设备任选地连接到内联网。在其他实施方案中,数字处理设备任选地连接到数据存储设备。
[0202] 根据本文的描述,作为非限制性实例,合适的数字处理设备包括服务器计算机、台式计算机、膝上型计算机、笔记本计算机、次笔记型计算机、上网本计算机、记事本计算机、机顶计算机、手持式计算机、互联网设备、移动智能电话、平板计算机、个人数字助理、视频游戏控制台和媒介物。本领域技术人员将认识到,许多智能电话适用于本文所述的系统。本领域技术人员还将认识到,具有可选计算机网络连接的选择电视、视频播放器和数字音乐播放器适用于本文所述的系统。合适的平板计算机包括具有本领域技术人员已知的小册子、平板和可转换配置的平板计算机。
[0203] 在一些实施方案中,数字处理设备包括被配置为执行可执行指令的操作系统。操作系统为例如包含程序和数据的软件,该软件管理设备的硬件并为应用程序的执行提供服务。本领域技术人员将认识到,作为非限制性实例,合适的服务器操作系统包括FreeBSD、OpenBSD、 Linux、 Mac OS X Windows和 本领域技术人员将认识到,作为非限制性实例,合适的
个人计算机操作系统包括
和类似UNIX的操作系统如GNU/ 在一些实施方案中,操作系统由云计算提供。本领
域技术人员还将认识到,作为非限制性实例,合适的移动智能电话操作系统包括
OS、 Research In BlackBerry
Windows OS、 Windows OS、

[0204] 在一些实施方案中,数字处理设备包括存储和/或存储器设备。该存储设备和/或存储器设备是用于临时或永久地存储数据或程序的一个或多个物理设备。在一些实施方案中,该设备是易失性存储器且需要电力来维护存储的信息。在一些实施方案中,该设备是非易失性存储器,并且在数字处理设备未通电时保留存储的信息。在进一步的实施方案中,非易失性存储器包含闪速存储器。在一些实施方案中,非易失性存储器包含动态随机存取存储器(DRAM)。在一些实施方案中,非易失性存储器包含电随机存取存储器(FRAM)。在一些实施方案中,非易失性存储器包含相变随机存取存储器(PRAM)。在其他实施方案中,该设备是存储设备,作为非限制性实例,该存储设备包括CD-ROM、DVD、闪速存储器设备、磁盘驱动器、磁带驱动器、光盘驱动器和基于云计算的存储器。在进一步的实施方案中,存储和/或存储器设备是诸如本文公开的那些设备的组合。
[0205] 在一些实施方案中,数字处理设备包括用于向用户发送视觉信息的显示器。在一些实施方案中,显示器是阴极射线管(CRT)。在一些实施方案中,显示器是液晶显示器(LCD)。在进一步的实施方案中,显示器是薄膜晶体管液晶显示器(TFT-LCD)。在一些实施方案中,显示器是有机发光二极管(OLED)显示器。在各种其他实施方案中,在OLED显示器上是无源矩阵OLED(PMOLED)或有源矩阵OLED(AMOLED)显示器。在一些实施方案中,显示器是等离子显示器。在其他实施方案中,显示器是视频投影仪。在更进一步的实施方案中,显示器是诸如本文公开的那些设备的组合。
[0206] 在一些实施方案中,数字处理设备包括用于从用户接收信息的输入设备。在一些实施方案中,输入设备是键盘。在一些实施方案中,输入设备是指向设备,作为非限制性实例,该指示设备包括鼠标跟踪球、跟踪板、操纵杆、游戏控制器或触笔。在一些实施方案中,输入设备是触摸屏或多点触摸屏。在其他实施方案中,输入设备是用于捕获语音或其他声音输入的麦克风。在其他实施方案中,输入设备是用于捕获运动或视觉输入的摄像机。在更进一步的实施方案中,输入设备是诸如本文公开的那些设备的组合。
[0207] 在一些实施方案中,数字处理设备包括数码相机。在一些实施方案中,数码相机捕捉数字图像。在一些实施方案中,数码相机是自动对焦相机。在一些实施方案中,数码相机是电荷耦合器件(CCD)相机。在进一步的实施方案中,数码相机是CCD摄像机。在其他实施方案中,数码相机是互补金属化物半导体(CMOS)相机。在一些实施方案中,数码相机捕捉静止图像。在其他实施方案中,数码相机捕捉视频图像。在各种实施方案中,合适的数码相机包括100万、200万、300万、400万、500万、600万、700万、800万、900万、1000万、1100万、1200万、1300万、1400万、1500万、1600万、1700万、1800万、1900万、2000万、2100万、2200万、2300万、2400万、2500万、2600万、2700万、2800万、2900万、3000万像素和更高像素的相机,包括其中的增量。在一些实施方案中,数码相机是标准清晰度相机。在其他实施方案中,数码相机是HD摄像机。在进一步的实施方案中,HD摄像机捕获具有至少约1280x约720像素或至少约1920x约1080像素的图像。在一些实施方案中,数码相机捕获彩色数字图像。在其他实施方案中,数码相机捕获灰度数字图像。在各种实施方案中,数字图像以任何合适的数字图像格式存储。作为非限制性实例,合适的数字图像格式包括联合图像专家组(JPEG)、JPEG 2000、可交换图像文件格式(Exif)、标记图像文件格式(TIFF)、RAW、便携式网络图形(PNG)、图形交换格式(GIF)、 位图(BMP)、便携式像素图(PPM)、便携式灰度图(PGM)、便
携式位图文件格式(PBM)和WebP。在各种实施方案中,数字图像以任何合适的数字视频格式存储。作为非限制性实例,合适的数字视频格式包括AVI、MPEG、
MP4、 Windows DivXTM、Flash Video、Ogg Theora、WebM和RealMedia。
非暂时性计算机可读存储介质
[0208] 在一些实施方案中,本文公开的系统、平台、软件、网络和方法包括用程序编码的一个或多个非暂时性计算机可读存储介质,该程序包括可由任选的联网的数字处理设备的操作系统执行的指令。在进一步的实施方案中,计算机可读存储介质是数字处理设备的有形组件。在更进一步的实施方案中,计算机可读存储介质任选地可从数字处理设备移除。在一些实施方案中,作为非限制性实例,计算机可读存储介质包括CD-ROM、DVD、闪速存储器设备、固态存储器、磁盘驱动器、磁带驱动器、光盘驱动器、云计算系统和服务器等。在一些情况下,所述程序和指令在介质上永久地、基本上永久地、半永久地或非暂时地编码。计算机程序
[0209] 在一些实施方案中,本文公开的系统、平台、软件、网络和方法包括至少一个计算机程序。计算机程序包括可在数字处理设备的CPU中执行的指令序列,该指令序列被编写以进行指定的任务。鉴于本文提供的公开内容,本领域技术人员将认识到,计算机程序可用各种语言的各种版本来编写。在一些实施方案中,计算机程序包含一个指令序列。在一些实施方案中,计算机程序包含多个指令序列。在一些实施方案中,从一个位置提供计算机程序。在其他实施方案中,从多个位置提供计算机程序。在各个实施方案中,计算机程序包括一个或多个软件模。在各种实施方案中,计算机程序部分或全部包括一个或多个web应用程序、一个或多个移动应用程序、一个或多个独立应用程序、一个或多个web浏览器插件、扩展、加载项或附加项或其组合。
Web应用程序
[0210] 在一些实施方案中,计算机程序包括web应用程序。鉴于本文提供的公开内容,本领域技术人员将认识到,在各种实施方案中,web应用程序利用一个或多个软件框架和一个或多个数据库系统。在一些实施方案中,基于诸如 NET或Ruby on Rails(RoR)的软件框架创建web应用程序。在一些实施方案中,web应用程序利用一个或多个数据库系统,作为非限制性实例,该数据库系统包括关系数据库系统、非关系数据库系统、面向对象的数据库系统、关联数据库系统和XML数据库系统。在进一步的实施方案中,作为非限制性实例,合适的关系数据库系统包括 SQL服务器、mySQLTM和 本领域技
术人员还将认识到,在各种实施方案中,web应用程序以一种或多种语言的一个或多个版本编写。Web应用程序可以用一种或多种标记语言、表示定义语言、客户端脚本语言、服务器端编码语言、数据库查询语言或其组合来编写。在一些实施方案中,web应用程序在某种程度上以诸如超文本标记语言(HTML)、可扩展超文本标记语言(XHTML)或可扩展标记语言(XML)的标记语言编写。在一些实施方案中,web应用程序在某种程度上以诸如级联样式表(CSS)的表示定义语言编写。在一些实施方案中,web应用程序在某种程度上以诸如异步
Javascript和XML(AJAX)、 动作脚本、Javascript或 的客户端脚本语
言编写。在一些实施方案中,web应用程序在某种程度上以诸如Active Server Pages
(ASP)、 Perl、JavaTM、JavaServer Pages(JSP)、超文本预处理器(PHP)、
PythonTM、Ruby、Tcl、Smalltalk、 或Groovy的服务器端编码语言编写。在一些
实施方案中,web应用程序在某种程度上以诸如结构化查询语言(SQL)的数据库查询语言编写。在一些实施方案中,web应用程序集成了诸如 Lotus 的企业服务器产
品。在一些实施方案中,用于为艺术家提供允许艺术家上传信息和媒体文件的职业发展网络的网络应用程序包括媒体播放器元件。在各种进一步的实施方案中,媒体播放器元件利用许多合适的多媒体技术中的一种或多种,作为非限制性实例,该多媒体技术包括
HTML 5、 JavaTM和
移动应用程序
[0211] 在一些实施方案中,计算机程序包括提供给移动数字处理设备的移动应用程序。在一些实施方案中,移动应用程序在其制造时被提供给移动数字处理设备。在其他实施方案中,经由本文所述的计算机网络将移动应用程序提供给移动数字处理设备。
[0212] 鉴于本文提供的公开内容,使用本领域已知的硬件、语言和开发环境,通过本领域技术人员已知的技术创建移动应用程序。本领域技术人员将认识到,移动应用程序是用几种语言来编写的。作为非限制性实例,合适的编程语言包括C、C++、C#、Objective-C、JavaTM、Javascript、Pascal、Object Pascal、PythonTM、Ruby、VB.NET、WML和具有或不具有CSS的XHTML/HTML或其组合。
[0213] 合适的移动应用程序开发环境可从多个来源获得。作为非限制性实例,商业上可用的开发环境包括AirplaySDK、alcheMo、 Celsius、Bedrock、Flash Lite、.NET Compact Framework、Rhomobile和WorkLight移动平台。其他开发环境可免费获得,作为非限制性实例,该其他开发环境包括Lazarus、MobiFlex、MoSync和Phonegap。此外,移动设备制造商分发软件开发者工具包,作为非限制性实例,该软件开发者工具包包括iPhone和iPad(iOS)SDK、AndroidTMSDK、 SDK、BREW SDK、 OS SDK、
Symbian SDK、webOS SDK和 Mobile SDK。
[0214] 本领域技术人员将认识到,多个商业论坛可用于分发移动应用程序,作为非限制性实例,该商业论坛包括 App Store、AndroidTMMarket、 App World、用于Palm设备的App Store、App Catalog for webOS、 Marketplace for 
Mobile、用于 设备的Ovi Store、 Apps和 DSi Shop。
独立应用程序
[0215] 在一些实施方案中,计算机程序包括独立应用程序,该独立应用程序是作为独立计算机进程运行的程序,而不是现有进程的附加项(例如,不是插件)。本领域技术人员将认识到经常编译独立应用程序。编译器是将用编程语言编写的源代码转换为二进制目标代码如汇编语言或机器代码的计算机程序。作为非限制性实例,合适的编译编程语言包括C、C++、Objective-C、COBOL、Delphi、Eiffel、JavaTM、Lisp、PythonTM、Visual Basic和VB.NET或其组合。通常至少部分地执行编译以创建可执行程序。在一些实施方案中,计算机程序包括一个或多个可执行编译的应用程序。软件模块
[0216] 在各个实施方案中,本文公开的系统、平台、软件、网络和方法包括软件、服务器和数据库模块。鉴于本文提供的公开内容,使用本领域已知的机器、软件和语言,通过本领域技术人员已知的技术创建软件模块。本文公开的软件模块以多种方式实现。在各种实施方案中,软件模块包含文件、代码段、编程对象、编程结构或其组合。在进一步的各种实施方案中,软件模块包含多个文件、多个代码段、多个编程对象、多个编程结构或其组合。在各种实施方案中,作为非限制性实例,一个或多个软件模块包含web应用程序、移动应用程序和独立应用程序。在一些实施方案中,软件模块在一个计算机程序或应用程序中。在其他实施方案中,软件模块在多于一个计算机程序或应用程序中。在一些实施方案中,软件模块托管在一台机器上。在其他实施方案中,软件模块托管在多于一台机器上。在进一步的实施方案中,软件模块托管在云计算平台上。在一些实施方案中,软件模块托管在一个位置中的一个或多个机器上。在其他实施方案中,软件模块托管在多于一个位置中的一个或多个机器上。
[0217] 在一些实施方案中,提供了用于进行鉴别诊断的系统,该系统包括(a)包含至少10,000个不同的原位合成的肽的肽阵列,其中来自受试者的样品与所述阵列接触;(b)用于检测所述样品中存在的抗体与所述阵列上的至少25个肽的结合的检测器,以获得结合信号的组合;和(c)用于分析和比较结合信号的所述组合与一组或多组参考结合信号的组合的数字处理设备,其中参考结合信号的组合的每个所述组包括从患有不同疾病的多个受试者获得的结合信号的组合,从而进行所述鉴别诊断,其中所述方法性能的特征为受试者工作特征(ROC)曲线下面积(AUC)大于0.6。
[0218] 在其他实施方案中,提供了用于确定已知患有自身免疫疾病的受试者的疾病进展的系统,所述方法包括:(a)包含至少10,000个不同的原位合成的肽的肽阵列;(b)用于检测所述样品中存在的抗体与所述阵列上的至少25个肽的结合的检测器,以获得结合信号的第一组合;和(c)用于分析和比较结合信号的所述第一组合与至少参考结合信号的第二组合的数字处理设备,其中所述参考结合信号的第二组合包括从包括具有指示所述自身免疫疾病的进展的临床表现的多个受试者的参考组获得的结合信号的组合,从而进行所述鉴别诊断,其中所述方法性能的特征为受试者工作特征(ROC)曲线下面积(AUC)大于0.6。
[0219] 在以下实施例中更详细地描述了本发明,这些实施例不以任何方式限制所要求保护的本发明的范围。附图被认为是本发明说明书和描述的组成部分。提供以下实施例是为了说明,而非限制要求保护的发明。
[0220] 虽然本发明的优选实施方案已经在本文中显示并描述,但是对于本领域技术人员显而易见的是,这些实施方案仅以示例的方式提供。在不脱离本发明的情况下,本领域技术人员现在会想到许多变化、改变和替换。应当理解,本文所述的本发明实施方案的各种替代方案可用于实施本发明。以下权利要求旨在限定本发明的范围,由此涵盖这些权利要求范围内的方法和结构及其等同物。实施例
实施例1——测定方法
[0221] 概括来说,“免疫特征”测定方案遵循ELISA的原理。洗涤肽阵列载玻片并在水中水合。然后将载玻片在轻轻摇动下用BSA(PBS-T中的3%w/v BSA)在室温下封闭60分钟。将从患病和健康志愿者获得的100微升血清或血浆样品在基于PBST的缓冲液中稀释。然后将90微升每种样品在肽阵列上按交替振荡方案在37℃下温育1小时。在样品(第一抗体)温育后,用PBST洗涤缓冲液洗涤该阵列。洗涤步骤后,将阵列与90ul第二抗体(偶联至Alexa-555的山羊抗人IgG,Life-Technologies)一起温育。第二试剂按交替振荡方案在37℃下温育1小时。每个载玻片上包含仅有第二抗体的对照(阴性对照)以及一式三份的正常血清对照样品,以验证测定质量和重现性。温育1小时后,再次用PBST洗涤缓冲液洗涤该阵列,然后用水和异丙醇洗涤,然后通过离心进行干燥。然后用Innopsys 910AL微阵列扫描仪(InnoScan,Inc.,序列号913p03)扫描载玻片。通过532nm的激光激发和547nm的发射定量来测量荧光信号
[0222] 使用Innopsys Mapix软件包(Innopsys Inc)进行数据采集。分析阵列的数据异常值。在中值归一化和log10变换后,计算技术重复中每个特征的中值强度,并将其用于分类器开发工作。
[0223] 通过将每个样品分配给四个交叉验证组之一,训练并交叉验证支持向量机(SVM)分类器。区分训练组中的个例和对照的特征按p-值排序。前k个特征用作SVM模型的输入。对每一组进行预测,并使用四种模型相对于真实疾病类别的所有预测,将性能计算为曲线下面积(AUC)或灵敏度/特异性/准确度。计算平均性能和置信区间(CI)。产生诊断可视化,包括“火山”图(即p-值对log变化倍数),ROC(受试者工作特征)曲线,以及模型性能相比于输入肽数目。实施例2——硬皮病和系统性硬化症的诊断和预后分析
[0224] 背景:硬皮病和系统性硬化症(SSc)是结缔组织的疾病,其特征为皮肤增厚,这可涉及皮肤和内脏的瘢痕形成、血管问题和不同程度的炎症。由于SSc的表现复杂,并且与其他自身免疫疾病重叠,因此其诊断困难。其诊断通常需要结合病史查阅、体格检查、实验室检查和X射线检查。尚无单一的生物标志物可用,但血清学检测已确定在60%-80%的患者中有ANA和抗着丝粒抗体(ACA),而30%的患者中有ScL 70抗体。然而,这些抗体也可以在一些健康个体或患有其他自身免疫疾病如皮肌炎(DM)的患者中发现。除了更好的诊断外,还需要更好的预后测试。雷诺综合征是约75%的患者中SSc的首次表现,但不作为预后性的。具有弥散性而非局限性皮肤累及的患者往往会发展为更严重的病况,如ILD、PAH、GAVE和肾脏并发症。然而,这种观察结果对于预后而言也不够可靠。
[0225] 方法:评价包含719个血浆样品的研究群体;其中包括SSC(n=301),DM(205),包括MCTD、UCTD、狼疮、肌炎和多肌炎、硬斑病在内的一组其他自身免疫疾病(95),以及健康样品(118)。一组84个对照样品用于促使测定符合要求。
[0226] 所有患者在诊断时均符合ACR分类标准。使用IS测定来检测与包含约126,000个独特肽的微阵列结合的血浆抗体。将肽序列(使用20种氨基酸中的16种)设计为广泛地对组合空间取样,从而提供用于抗体选择性和竞争性结合的多样性表位模拟物的文库。使用t-检验确定最能辨别SSc对比物的特征。通过5折交叉验证分析的100次迭代训练并评估支持向量机(SVM)分类器。评价了25至10000个肽输入的模型。
[0227] 结果:在10000个差异结合的肽上训练的分类器区分SSc患者与健康供体,具有强烈的性能特征。建立了模型大小相似的其他算法,它们区分SSc与其他自身免疫疾病,如DM。最后,曾经进展到几种更严重的状况(ILD、肾危象和GAVE)之一的SSc患者可以与那些未曾进展到该状况的SSc患者区分开。这些交叉验证的分类性能估计值在表1中提供。
[0228] 图5是描述当SSc患者与健康受试者比较时免疫特征中的最佳鉴别肽的表。图5A描述了最佳亚基序。图5B描述了前1000个鉴别肽中的富集肽。图6是图5中的结果的图形表示。标题适用于(A)中的基序列表和(B)中的氨基酸列表,以及本文提供的所有鉴别肽表,其中“n”是基序在最佳辨别肽的序列中出现的次数;“n.lib”是基序在文库中出现的次数;“富集”是辨别肽中的基序相对于在文库中所有序列中发现的所有基序的富集因子;
“padj.holm”是用于控制多个测试误差的p-调整值。
[0229] 图7是描述当被诊断为患有SSc与其他自身免疫病症的患者比较时免疫特征中的最佳鉴别肽的表。“其他自身免疫性病症”包括非典型性肌炎、红斑痤疮、抗PL7伴ILD和肌炎、非典型肌炎、Behcet病、克罗恩病伴非典型皮疹、皮肤狼疮、盘状狼疮、DM、DM皮疹但抗体阴性、DM vs狼疮、DM vs UCTD、药疹、嗜酸性筋膜炎、移植物抗宿主病(GVHD)、霍奇金病、扁平苔藓、lSSc、狼疮性脂膜炎、混合结缔组织病(MCTD)、硬斑病、可能药物诱发的肌炎、存在Jo-1抗体的肌炎、肾原性系统性纤维化、风湿性多肌痛、多肌炎、可能的DM——等待血清分型、可能的药疹、银屑病、肺纤维化、存在抗J01的肺纤维化、单纯雷诺病、横纹肌溶解症、Sle、SLE/混合、SSc、SSc/DM重叠、SSc/SLE、未分化结缔组织病(UCTD)、UCTD伴皮疹、不明疾病、具有荨麻疹特征的不明疾病以及无诊断的虚弱。图7A描述了最佳亚基序。图7B描述了前1000个鉴别肽中的富集肽。图8是图7中所示的结果的图形表示。
[0230] 图9是描述当被诊断为SSc的患者与肾危象患者比较时免疫特征中的最佳鉴别肽的表。图9A描述了最佳亚基序。图9B描述了前1000个鉴别肽中的富集肽。图10是图9中所示的结果的图形表示。
[0231] 图11是描述当被诊断为SSc与胃窦血管扩张(GAVE)的患者比较时免疫特征中的最佳鉴别肽的表。图11A描述了最佳亚基序。图11B描述了前1000个鉴别肽中的富集肽。图12是图11中所示的结果的图形表示。
[0232] 图13是描述当被诊断为SSc与DM的患者比较时免疫特征中的最佳鉴别肽的表。图13A描述了最佳亚基序。图13B描述了前1000个鉴别肽中的富集肽。图14是图13中所示的结果的图形表示。
[0233] 图15是描述当被诊断为患有SSc伴间质性肺病(ILD+)与没有间质性肺病(ILD-)的SSc的患者比较时免疫特征中的最佳鉴别肽的表。图15A描述了最佳亚基序。图15B描述了前1000个鉴别肽中的富集肽。图16是图15中所示的结果的图形表示。
[0234] 结论:在模拟肽微阵列上由外周血抗体组库产生的可再现结合模式可以区分SSc与健康供体和其他自身免疫疾病。此外,对于曾经进展为更严重的疾病表现的SSc患者,建立了独特的免疫特征。这表明IS技术可能有助于开发针对SSc的新诊断和预后测试。
[0235] 表1.用于SSc诊断和预后的IS的分类性能估计值实施例3:从间质性肺病患者中区分皮肌炎和系统性硬化症
[0236] 背景:皮肌炎(DM)是一种炎性自身免疫疾病,具有影响皮肤、肌肉和肺的不均一表现。呈现的复杂性使临床诊断和预后具有挑战性。组织学发现也各不相同,使得它们的效用发生混乱。已经鉴定了几种DM特异性抗原,表明血清学诊断是可能的。然而,由于许多DM患者不具有针对这些抗原的抗体,因此需要替代抗原。间质性肺病(ILD)在20-40%的患者中发生,表现范围从轻度至快速进展,以及可能致命的肺病。某些DM血清型比其他血清型具有更高的发生ILD进展的危险,但单独的血清分型对于指导临床医护来说并不足够灵敏或特异。
[0237] 区分DM与其他炎性自身免疫疾病并预测患者将进展为ILD的简单测试将改善患者医护。此外,新DM-抗原的发现方法将有助于诊断和治疗工作。对免疫特征(IS)平台进行了研究,以确定其是否可以满足临床和发现目标。
[0238] 方法:评价包含719个血浆样品的研究群体;其中包括SSC(n=301),DM(205),包括MCTD、UCTD、狼疮、肌炎和多肌炎、硬斑病的一组其他自身免疫疾病(95),以及健康样品(118)。一组84个对照样品用于促使测定符合要求。所有患者在诊断时均符合ACR分类标准。采用IS测定来检测与包含约126,000个独特肽的微阵列结合的血浆抗体。将肽序列设计为广泛地对组合空间取样,从而提供用于抗体选择性结合的多样性表位模拟物的文库。使用t-检验确定最能辨别DM对比物的特征。使用5折交叉验证的100次迭代,在支持向量机中确定分类功效。
[0239] 结果:分类性能的交叉验证估计在表2中提供。在差异结合的肽上训练的算法区分DM与健康供体和其他AI,如SSc。曾经进展为ILD的DM和SSc患者都可以与那些从未曾进展为ILD的患者区分开。鉴定了多达10,000个其抗体结合特征区分疾病组的肽,并使用它们作为这些分类器的输入。值得注意的是,用于DM:ILD+/-和SSc:ILD+/-的模型具有相似的预测性;然而,在这两个分类器中使用的显著区别的肽不显示重叠。表2.用于DM对比的IS的分类性能估计值
[0240] 图17是描述当被诊断为DM的患者与健康受试者比较时免疫特征中的最佳鉴别肽的表。图17A描述了最佳亚基序。图17B描述了前1000个鉴别肽中的富集肽。图18是图17的图形表示。
[0241] 图19是描述当被诊断为DM与其他自身免疫病症的患者比较时免疫特征中的最佳鉴别肽的表。“其他自身免疫性病症”包括非典型性肌炎、红斑痤疮、抗PL7伴ILD和肌炎、非典型肌炎、Behcet病、克罗恩病伴非典型皮疹、皮肤狼疮、盘状狼疮、DM、DM皮疹但抗体阴性、DM vs狼疮、DM vs UCTD、药疹、嗜酸性筋膜炎、移植物抗宿主病(GVHD)、霍奇金病、扁平苔藓、lSSc、狼疮性脂膜炎、混合结缔组织病(MCTD)、硬斑病、可能药物诱发的肌炎、存在Jo-1抗体的肌炎、肾原性系统性纤维化、风湿性多肌痛、多肌炎、可能的DM——等待血清分型、可能的药疹、银屑病、肺纤维化、存在抗J01的肺纤维化、单纯雷诺病、横纹肌溶解症、Sle、SLE/混合、SSc、SSc/DM重叠、SSc/SLE、未分化结缔组织病(UCTD)、UCTD伴皮疹、不明疾病、具有荨麻疹特征的不明疾病以及无诊断的虚弱。图19A描述了最佳亚基序。图19B描述了前1000个鉴别肽中的富集肽。图20是图19的图形表示。
[0242] 图21是描述当被诊断为DM伴间质性肺病(ILD+)与没有间质性肺病(ILD-)的DM的患者比较时免疫特征中的最佳鉴别肽的表。图21A描述了最佳亚基序。图21B描述了前1000个鉴别肽中的富集肽。图22是图21的图形表示。
[0243] 模拟表位结合模式可区分DM患者与非DM患者。解密这些肽所模拟的抗原可以揭示新的DM特异性抗原。还评价了用于DM对比其他AI以及用于进展为ILD的患者的分类器。尽管有共同的临床表现和治疗方案,但用于DM对比SSc患者的ILD预测肽之间缺乏任何重叠支持了它们是独特疾病的结论。
[0244] 虽然本文已经示出并描述了本发明的优选实施方案,但对于本领域技术人员将显而易见的是,这些实施方案仅以示例的方式提供。本领域技术人员在不脱离本发明的情况下现将会想到多种变化、改变和替代。应当理解,本文中所述的本发明实施方案的各种替代可用于实施本发明。旨在以下权利要求限定本发明的范围,并由此涵盖这些权利要求范围内的方法和结构及其等同物。实施例4——免疫原性自身抗原靶标的鉴定
[0245] 相对于人类蛋白质组分析区分健康受试者与患有SSc的受试者的辨别肽,以指示最初免疫原性的自身抗原靶标。选择p-值小于p<2.53E-06的辨别肽。
[0246] 蛋白质组比对:将阵列肽与2016年3月10日编译的人类蛋白质组RefSeq版本84(对应于人类基因组构建GrCh38(https://www.ncbi.nlm.nih.gov/refseq/))中的蛋白质进行比对,其中对每个独特的基因ID使用最长的转录物变体。比对算法使用修改的BLAST策略(Altschul,S.F.&Gish,W.(1996)"Local alignment statistics."Meth.Enzymol.266:460-480),其需要3个氨基酸的种子,间位罚分为4,使用BLOSUM62评分矩阵(Henikoff,J .G .Amino  acid  substitution  matrices  from  protein 
blocks.Proc.Natl.Acad.Sci.USA89:10915–10919[1992]),该评分矩阵被修改为反映阵列的氨基酸组成(States,D.J.,Gish,W.,Altschul,S.F.(1991)"Improved sensitivity of nucleic acid database searches using application-specific scoring matrices."Methods 3:66-70)。这些修改提高了简并置换的评分,去除了阵列中缺失的氨基酸的罚分,并且对所有精确匹配同等地进行评分。
[0247] 为了产生用于将一组免疫特征肽与蛋白质进行比对的p-值,将对蛋白质产生阳性BLAST评分的所有肽组装成矩阵,其中该矩阵的每一行对应于所比对的肽,每一列对应于组成该蛋白质的连续氨基酸中的一种,在肽行内允许有空位和缺失,以允许与蛋白质比对。矩阵内的每个位置都是该位置处的配对肽和蛋白质氨基酸来自与用于蛋白质组比对的相同评分矩阵的评分。然后,对于蛋白质中的每个氨基酸,将相应的列相加,以产生“重叠评分”,其表示免疫特征肽对该氨基酸的覆盖范围。为了针对文库组成校正该评分,对于列出的所有阵列肽使用相同方法计算重叠评分。最后,使用Fischer Exact检验来计算免疫特征重叠评分相对于整个文库重叠评分的p-值。为了将氨基酸水平上的这些p-值转换为全蛋白质统计值,计算蛋白质中每个可能的20-聚体表位的p-值的负对数之和,最终得分是每个蛋白质在这个20的滚动窗口内的最大值。
[0248] 表3提供了根据该方法鉴定的最高评分靶蛋白的列表。确定了169种候选生物标志物。通过Welch t-检验选择p-值小于p<2.53E-06的辨别肽。表3.从区分SSc患者样品与健康受试者样品的辨别肽的比对鉴定的候选靶蛋白
[0249] RNA Pol II亚基L是通过所述方法由区分健康受试者与SSc患者的鉴别肽鉴定的免疫原性自身抗原的示例(图23A和B)。
[0250] 图23A示出了针对与RNA Pol II亚基L氨基酸位置一起绘制的IMS肽-基序的比对计算的肽重叠差异评分s。来自SSc与健康对照的肽显示出与RNA pol II亚基L的显著对齐,在蛋白质组中20,378种人类蛋白质中排名35。右侧的球棒模型显示了RNA pol II亚基L的结构。球中显示的区域对应于图中用红色框标注的氨基酸位置。评分最高的氨基酸是RNA Pol簇中心的天冬氨酸D;它在球结构中显示为橙色。我们注意到簇中心附近的苏氨酸(T)评分很低;IMS阵列序列中没有T。图23B示出了对于人类蛋白质组中的每种蛋白质相比于SSc-健康分类肽,显示蛋白质表位评分S的分布的直方图。POLR2L的评分是583。
[0251] RNA pol II是在硬皮病患者中表征的已知自身抗原。
[0252] 图24示出了示例性自身抗原CCL22,其被确定为候选蛋白质生物标志物,其通过辨别肽鉴定,用于比较患有具有器官累及(GAVE+)的SSc的受试者与患有没有器官累及(GAVE-)的SSc的受试者。
[0253] 这些数据表明,区分不同疾病状态的辨别肽可用于鉴定可能为了用于开发治疗剂而研究的候选抗原或自身抗原靶标。此外,特异性抗原或自身抗原靶标的存在可用来确定疾病的严重程度,并可能预测疾病进展。实施例5——结合信号的测量精度
[0254] 使用一组8个血清样品,估计用来区分Chagas病检测呈血清阳性的受试者与血清阴性受试者的200个阵列特征(不同的肽)的结合精度。从整个供体群组中选择4个Chagas阳性样品和3个Chagas阴性样品,并在两个研究设计中在来自多个晶片的每个载玻片上一式三份进行测定。在每个载玻片上还对一个内部正常供体样品一式两份地进行测定。
[0255] 在晶片批次之内:从单个生产批次中选择三个晶片,并使用单载玻片QC样品组使其符合要求。来自每个晶片的其余12个载玻片使用精度研究样品组进行评价。载玻片在3天内每天在3个盒中运行。来自每个晶片的载玻片在3天内均匀分布,使每盒包含来自三个晶片之一的2个载玻片和来自其余两个晶片的1个载玻片。
[0256] 在晶片批次之间:从4个生产批次中各选择一个晶片,并使用单载玻片QC样品组使其符合要求。来自每个晶片的其余12个载玻片使用精度研究样品组进行评价。载玻片在3天内每天在4个盒中运行。来自每个晶片的载玻片在3天内均匀分布,使每盒包含来自四个晶片中的两片的2个载玻片。
[0257] 数据分析:使用混合效应模型来估计实验方差的来源。供体被视为固定效应。嵌套因子'晶片'、'载玻片'和'阵列'与'日'交叉,并被视为随机效应。使用lme4包将模型拟合于r。表4.信号结合测量的精度
在晶片批次之内 CV %贡献
阵列间 11.21 59.6
载玻片间 4.3 8.9
晶片间 2.7 3.5
日间 7.7 28.0
总和 14.6 100
在晶片批次之间 CV %贡献
阵列间 14.3 38.7
载玻片间 7.6 11.0
晶片间 14.6 40.6
日间 7.1 9.7
总和 22.9 100
数据显示,在晶片批次之内的阵列上进行的结合信号测量可以在小于15%的精度下进
行;在晶片批次之间的阵列上进行的结合信号测量可以在小于25%的精度下进行。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈