用于诊断卒中及其致因的生物标志物

申请号 CN201180042576.9 申请日 2011-07-14 公开(公告)号 CN103080339B 公开(公告)日 2016-08-31
申请人 加利福尼亚大学董事会; 发明人 弗兰克·沙普; 博亚纳·斯塔莫瓦; 格兰·C·吉克灵;
摘要 本 发明 提供了用于诊断卒中的发生和致因的组合物和方法。
权利要求

1.能与多种缺血性卒中相关基因杂交的多种探针在制备用于诊断缺血性卒中或发展为缺血性卒中的倾向的核酸阵列中的用途,其中所述阵列仅包含与缺血性卒中个体中过表达或低表达1.2倍以上的基因杂交的探针,其中使用所述阵列检测到包括RNF141,CLEC4E,TIMP2,PHTF1,CKLF,RRAGD,FGD4,CPEB2,LOC100290882,UBXN2B,ENTPD1,BST1,LTB4R,F5,IFRD1,KIAA0319,CHMP1B,MCTP1,VNN3,AMN1,LAMP2,FCHO2,ZNF608,REM2,QKI,RBM25,FAR2,ST3GAL6,HNRNPH2,GAB1,UBR5和VAPA的缺血性卒中相关生物标志物的表达平相比于所述基因的正常对照表达水平的升高,以及包括PGM5,CCDC144C///LOC100134159,LECT2,SHOX,TBX5,SPTLC3,SNIP,RBMS3,P704P,THSD4,FAT3,SNRPN,GLYATL1,GADL1,CXADR,OVOL2,SPIB,BXDC5,UNC5B,ASTN2,FLJ35934,ANKRD28,CCDC144A,TIMM8A,ALDOAP2,LDB3,PTPRD,LOC729222///PPFIBP1,CCRL1,HNRNPUL2,FCRL4,ELAVL2,PRTG,DLX6,FOXA2,SCD5,GABRB2,GYPA,LOC283027,LOC344595,LOC100129488,RPL22和SH3GL3的缺血性卒中相关生物标志物的表达水平相比于所述基因的正常对照表达水平的降低表明所述个体患有缺血性卒中或具有发展为缺血性卒中的倾向。
2.如权利要求1所述的用途,其中所述多种缺血性卒中相关基因还包括选自ABCA1,DKFZP434L187,ELL2,OSBPL1A和THBD的多种生物标志物。
3.如权利要求1所述的用途,其中在疑似缺血事件之后3小时或更短时间检测所述表达水平。
4.如权利要求1所述的用途,其中在疑似缺血事件之后至少3小时测定所述表达水平。
5.如权利要求1所述的用途,其中在转录水平上测定所述生物标志物的表达水平。
6.如权利要求1所述的用途,其中通过检测缺血性卒中相关基因探针与生物样本中所述生物标志物的基因转录物的杂交来测定表达水平。
7.如权利要求6所述的用途,其中所述杂交步骤在核酸阵列芯片上进行。
8.如权利要求6所述的用途,其中所述杂交步骤在微流体测定板中进行。
9.如权利要求1所述的用途,其中通过扩增所述生物标志物的基因转录物来测定表达水平。
10.如权利要求9所述的用途,其中扩增反应是聚合酶链式反应(PCR)。
11.如权利要求1所述的用途,其中在蛋白水平上测定所述生物标志物的表达水平。
12.如权利要求1所述的用途,其中在选自血液、血清和血浆的生物样本中检测所述表达水平。
13.如权利要求1所述的用途,其中所述缺血性卒中选自栓塞性卒中、短暂性缺血发作、和心源性卒中。
14.如权利要求13所述的用途,其中所述栓塞性卒中是血栓性卒中。
15.如权利要求14所述的用途,其中所述血栓性卒中是动脉粥样硬化性血栓性卒中。
16.如权利要求1所述的用途,其中所述对照是一种或多种稳定表达的内源性参照生物标志物的表达水平。
17.如权利要求16所述的用途,其中所述内源性参照生物标志物包括选自以下的一种或多种生物标志物:USP7,MAPRE2,CSNK1G2,SAFB2,PRKAR2A,PI4KB,CRTC1,HADHA,MAP1LC3B,KAT5,CDC2L1///CDC2L2,GTSE1,TCF25,CHP,LRRC40,hCG_2003956///LYPLA2///LYPLA2P1,DAXX,UBE2NL,EIF1,KCMF1,PRKRIP1,CHMP4A,TMEM184C,TINF2,PODNL1,FBXO42,LOC441258,RRP1,C10orf104,ZDHHC5,C9orf23,LRRC45,NACC1,LOC100133445///
LOC115110,PEX16。
18.如权利要求1所述的用途,其中还使用所述阵列检测到选自IRF6,ZNF254,GRM5,EXT2,AP3S2,PIK3C2B,ARHGEF5,COL13A1,PTPN20A///PTPN20B,LHFP,BANK1,HLA-DOA,EBF1,TMEM19,LHFP,FCRL1,OOEP和LRRC37A3的缺血性卒中相关生物标志物的表达水平相比于对照的升高,以及选自LOC284751,CD46,ENPP2,C19orf28,TSKS,CHURC1,ADAMTSL4,FLJ40125,CLEC18A,ARHGEF12,C16orf68,TFDP1和GSTK1的缺血性卒中相关生物标志物的表达水平相比于对照的降低指示所述个体已经历心源性卒中或有心源性卒中的险。
19.如权利要求18所述的用途,其中与对照相比,选自ZNF185,P2RX5,C21orf7,CBX5,CD8B,DAB2,HERC5,KLRK1,LOC401233,NUMB,PCNX,PPBP,PPP3R1///WDR92,PVRL2,RC3H1,RIOK3,RRAS2,SFRS6,SNAP29,ST20,XCL1和XCL1///XCL2的多种缺血性卒中相关生物标志物的表达水平的升高或降低指示所述个体已经历心源性卒中或有心源性卒中的风险。
20.如权利要求1所述的用途,其中还使用所述阵列检测到选自NT5E,CLASP2,GRM5,PROCR,ARHGEF5,AKR1C3,COL13A1,LHFP,RNF7,CYTH3,EBF1,RANBP10,PRSS35,C12orf42和LOC100127980的缺血性卒中相关生物标志物的表达水平相比于对照的升高,以及选自FLJ31945,LOC284751,LOC100271832,MTBP,ICAM4,SHOX2,DOPEY2,CMBL,LOC146880,SLC20A1,SLC6A19,ARHGEF12,C16orf68,GIPC2和LOC100144603的缺血性卒中相关生物标志物的表达水平相比于对照的降低指示所述个体已经历颈动脉狭窄或有颈动脉狭窄的风险。
21.如权利要求1所述的用途,其中还使用所述阵列检测到选自SMC1A,SNORA68,GRLF1,SDC4,HIPK2,LOC100129034,CMTM1和TTC7A的缺血性卒中相关生物标志物的表达水平相比于对照的升高,以及选自LRRC43,MIF///SLC2A11,PER3,PPIE,COL13A1,DUSP16,
LOC100129034,BRUNOL6,GPR176,C6orf164和MAP3K7IP1的缺血性卒中相关生物标志物的表达水平相比于对照的降低指示所述个体已经历心房纤颤或有心房纤颤的风险。
22.如权利要求1-21中任一项所述的用途,其包括使用所述阵列检测到多个缺血性卒中相关基因表达水平的升高或降低,其中所述多个缺血性卒中相关基因包括选自RNF141,CLEC4E,TIMP2,PHTF1,CKLF,RRAGD,FGD4,CPEB2,LOC100290882,UBXN2B,ENTPD1,BST1,LTB4R,F5,IFRD1,KIAA0319,CHMP1B,MCTP1,VNN3,AMN1,LAMP2,FCHO2,ZNF608,REM2,QKI,RBM25,FAR2,ST3GAL6,HNRNPH2,GAB1,UBR5,VAPA,PGM5,CCDC144C///LOC100134159,LECT2,SHOX,TBX5,SPTLC3,SNIP,RBMS3,P704P,THSD4,FAT3,SNRPN,GLYATL1,GADL1,CXADR,OVOL2,SPIB,BXDC5,UNC5B,ASTN2,FLJ35934,ANKRD28,CCDC144A,TIMM8A,ALDOAP2,LDB3,PTPRD,LOC729222///PPFIBP1,CCRL1,HNRNPUL2,FCRL4,ELAVL2,PRTG,DLX6,FOXA2,SCD5,GABRB2,GYPA,LOC283027,LOC344595,LOC100129488,RPL22和SH3GL3的多个生物标志物、选自IRF6,ZNF254,GRM5,EXT2,AP3S2,PIK3C2B,ARHGEF5,COL13A1,PTPN20A///PTPN20B,LHFP,BANK1,HLA-DOA,EBF1,TMEM19,LHFP,FCRL1,OOEP,LRRC37A3,LOC284751,CD46,ENPP2,C19orf28,TSKS,CHURC1,ADAMTSL4,FLJ40125,CLEC18A,ARHGEF12,C16orf68,TFDP1和GSTK1的多个生物标志物、选自NT5E,CLASP2,GRM5,PROCR,ARHGEF5,AKR1C3,COL13A1,LHFP,RNF7,CYTH3,EBF1,RANBP10,PRSS35,C12orf42,LOC100127980,FLJ31945,LOC284751,LOC100271832,MTBP,ICAM4,SHOX2,DOPEY2,CMBL,LOC146880,SLC20A1,SLC6A19,ARHGEF12,C16orf68,GIPC2和LOC100144603的多个生物标志物以及选自SMC1A,SNORA68,GRLF1,SDC4,HIPK2,LOC100129034,CMTM1,TTC7A,LRRC43,MIF///SLC2A11,PER3,PPIE,COL13A1,DUSP16,BRUNOL6,GPR176,C6orf164和MAP3K7IP1的多个生物标志物。
23.固体支持物,其包含能够与包括以下的多种基因杂交的多种核酸:RNF141,CLEC4E,TIMP2,PHTF1,CKLF,RRAGD,CLEC4E,FGD4,CPEB2,LOC100290882,UBXN2B,ENTPD1,BST1,LTB4R,F5,IFRD1,KIAA0319,CHMP1B,MCTP1,VNN3,AMN1,LAMP2,FCHO2,ZNF608,REM2,QKI,RBM25,FAR2,ST3GAL6,HNRNPH2,GAB1,UBR5,VAPA,PGM5,CCDC144C///LOC100134159,LECT2,SHOX,TBX5,SPTLC3,SNIP,RBMS3,P704P,THSD4,FAT3,SNRPN,GLYATL1,GADL1,CXADR,OVOL2,SPIB,BXDC5,UNC5B,ASTN2,FLJ35934,ANKRD28,CCDC144A,TIMM8A,ALDOAP2,LDB3,PTPRD,LOC729222///PPFIBP1,CCRL1,HNRNPUL2,FCRL4,ELAVL2,PRTG,DLX6,FOXA2,SCD5,GABRB2,GYPA,LOC283027,LOC344595,RPL22,LOC100129488和SH3GL3,其中所述固体支持物仅包含与缺血性卒中个体中过表达或低表达1.2倍以上的基因杂交的核酸。
24.如权利要求23所述的固体支持物,其还包含能够与选自以下的多种基因杂交的多种核酸:EBF1、GRM5、TSKS、ENPP2、AP3S2、LRRC37A3、C16orf68、LOC284751、IRF6、LHFP、BANK1、ARHGEF5、ZNF254、TFDP1、COL13A1、GSTK1、ADAMTSL4、P2RX5、LHFP、PIK3C2B、CHURC1、EXT2、HLA-DOA、OOEP、ZNF185、TMEM19、FCRL1、FLJ40125、ARHGEF12、CLEC18A、CD46、PTPN20A///PTPN20B和C19orf28。
25.如权利要求23所述的固体支持物,其还包含能够与选自以下的多种基因杂交的多种核酸:EBF1、FLJ31945、C16orf68、SLC20A1、DOPEY2、COL13A1、LHFP、LOC284751、GRM5、LOC100144603、MTBP、SHOX2、ARHGEF5、RNF7、CLASP2、GIPC2、RANBP10、CMBL、LOC100127980、CYTH3、PROCR、LOC146880、SLC6A19、ICAM4、C12orf42、ARHGEF12、PRSS35、NT5E、LOC100271832、LHFP、NT5E和AKR1C3。
26.如权利要求23所述的固体支持物,其还包含能够与选自以下的多种基因杂交的多种核酸:CMTM1、COL13A1、SDC4、C6orf164、GPR176、BRUNOL6、SNORA68、MIF///SLC2A11、DUSP16、HIPK2、TTC7A、PPIE、GRLF1、MAP3K7IP1、LOC100129034、PER3、SMC1A和LRRC43。
27.如权利要求23所述的固体支持物,其还包含能够与选自以下的多种基因杂交的多种核酸:USP7、MAPRE2、CSNK1G2、SAFB2、PRKAR2A、PI4KB、CRTC1、HADHA、MAP1LC3B、KAT5、CDC2L1///CDC2L2、GTSE1、TCF25、CHP、LRRC40、hCG_2003956///LYPLA2///LYPLA2P1、DAXX、UBE2NL、EIF1、KCMF1、PRKRIP1、CHMP4A、TMEM184C、TINF2、PODNL1、FBXO42、LOC441258、RRP1、C10orf104、ZDHHC5、C9orf23、LRRC45、NACC1、LOC100133445///LOC115110、PEX16。
28.如权利要求23所述的固体支持物,其包含与选自RNF141,CLEC4E,TIMP2,PHTF1,CKLF,RRAGD,FGD4,CPEB2,LOC100290882,UBXN2B,ENTPD1,BST1,LTB4R,F5,IFRD1,KIAA0319,CHMP1B,MCTP1,VNN3,AMN1,LAMP2,FCHO2,ZNF608,REM2,QKI,RBM25,FAR2,ST3GAL6,HNRNPH2,GAB1,UBR5,VAPA,PGM5,CCDC144C///LOC100134159,LECT2,SHOX,TBX5,SPTLC3,SNIP,RBMS3,P704P,THSD4,FAT3,SNRPN,GLYATL1,GADL1,CXADR,OVOL2,SPIB,BXDC5,UNC5B,ASTN2,FLJ35934,ANKRD28,CCDC144A,TIMM8A,ALDOAP2,LDB3,PTPRD,LOC729222///PPFIBP1,CCRL1,HNRNPUL2,FCRL4,ELAVL2,PRTG,DLX6,FOXA2,SCD5,GABRB2,GYPA,LOC283027,LOC344595,LOC100129488,RPL22和SH3GL3的多种基因杂交的多种核酸、与选自IRF6,ZNF254,GRM5,EXT2,AP3S2,PIK3C2B,ARHGEF5,COL13A1,PTPN20A///PTPN20B,LHFP,BANK1,HLA-DOA,EBF1,TMEM19,LHFP,FCRL1,OOEP,LRRC37A3,LOC284751,CD46,ENPP2,C19orf28,TSKS,CHURC1,ADAMTSL4,FLJ40125,CLEC18A,ARHGEF12,C16orf68,TFDP1和GSTK1的多种基因杂交的多种核酸、与选自NT5E,CLASP2,GRM5,PROCR,ARHGEF5,AKR1C3,COL13A1,LHFP,RNF7,CYTH3,EBF1,RANBP10,PRSS35,C12orf42,LOC100127980,FLJ31945,LOC284751,LOC100271832,MTBP,ICAM4,SHOX2,DOPEY2,CMBL,LOC146880,SLC20A1,SLC6A19,ARHGEF12,C16orf68,GIPC2和LOC100144603的多种基因杂交的多种核酸以及与选自SMC1A,SNORA68,GRLF1,SDC4,HIPK2,LOC100129034,CMTM1,TTC7A,LRRC43,MIF///SLC2A11,PER3,PPIE,COL13A1,DUSP16,BRUNOL6,GPR176,C6orf164和MAP3K7IP1的多种基因杂交的多种核酸。
29.如权利要求23所述的固体支持物,其中所述固体支持物是微阵列。
30.如权利要求23所述的固体支持物,其中所述多种为100种。
31.试剂盒,其包含权利要求23至30中任一项所述的固体支持物。

说明书全文

用于诊断卒中及其致因的生物标志物

[0001] 相关申请的引用
[0002] 本申请要求2010年7月15日提交的美国临时申请号61/364,449的优先权,通过引用将其全部公开内容并入本文用于所有目的。
[0003] 关于在联邦政府资助的研究和开发下作出的发明的权利的声明
[0004] 本发明是在国立卫生研究院和国立神经病症及卒中研究院(NINDS)资助的NS056302号基金以及美国心脏学会资助的0775014N号基金的政府支持下完成的。政府享有
本发明的某些权利。
发明领域
[0005] 本发明提供了用于诊断卒中和卒中险以及用于诊断卒中致因的组合物和方法。
[0006] 发明背景
[0007] 卒中是成年人死亡和残疾的主要致因[Thom T et al.,Circulation,113:e85-151(2006);WHO,The atlas of heart disease and stroke(2005)]。利用临床评估联合脑成像来作出缺血性卒中(IS)的诊断。然而,诊断并非总是明确的,尤其对于急性状况而言,准确、低价且快速的诊断对于最理想地治疗患者是至关重要的。
[0008] 大量的工作致于鉴定基于血液的IS生物标志物。超过58种蛋白和7组蛋白已被描述为IS的生物标志物[Whiteley W et al.,Stroke,39:2902-2909(2008);Foerch C et 
al.,Neurology,73:393-399(2009);Jensen MB et al.,Expert Rev Cardiovasc Ther.,
7:389-393(2009)]。还描述了IS中血液中的RNA表达谱[Tang Y et al.,J Cereb Blood 
Flow Metab.,26:1089-1102(2006);Moore DF et al.,Circulation,111:212-2212005]。
我们以前报道了预测IS的29个探针组的表达谱[Tang Y et al.,J Cereb BloodFlow 
Metab.,26:1089-1102(2006)]。该谱需要在另一队列中进行验证,这在本研究中已完成。本文描述了能区别IS与对照(例如,健康的个体、具有血管风险因子的个体或经历过心肌梗塞的个体)的97个探针组的表达谱。这些谱进一步表明基因表达可以作为急性IS患者的诊断
工具。
[0009] 最通常利用急性卒中治疗标准的ORG10172测试(TOAST)来分类缺血性卒中,其中将患者分为心源性、大血管性、小血管腔隙性、其它以及不明致因性[Adams HP,Jr.,et 
al.,Stroke,24:35-41(1993)]。TOAST标准提高了评价可靠性,并且当能明确鉴定出已知致因时,能指导治疗[Goldstein LB et al.,Stroke,32:1091-1098(2001);Ay H et al.,
Stroke,38:2979-2984(2007)]。然而,在很多患者中,尽管进行了大量的研究,卒中致因仍是未知的或不明的。由于致因不明的卒中占所有缺血性卒的大约30%,则需要更好的能够鉴定卒中致因的工具[Ionita CC et al.,Prev Cardiol.,8:41-46(2005)]。
[0010] 基于血液的生物标志物提供了确定卒中致因的有价值的工具。很多蛋白生物标志物与卒中亚型相关。例如,心源性卒中与脑利钠肽和D-二聚物相关;大血管性卒中与C反应蛋白相关;小血管腔隙性卒中与高半胱酸、ICAM-1和血栓调节蛋白相关[Laskowitz DT 
et al.,Stroke,40:77-85(2009);Shibazaki K et al.,Intern Med.,48:259-264(2009);
Montaner J et al.,Stroke,39:2280-2287(2008);Hassan A et al.,Brain,126:424-432
(2003)]。然而,目前,缺血性卒中亚型的生物标志物缺乏在临床实践中使用的足够的灵敏性和特异性。因此,将生物标志物组合到生物标志物谱中可能是能够提高诊断的特异性和
灵敏性的方法。
[0011] 本研究确定了,血液中的基因表达特征能够用于区分心源性卒中和大血管性缺血性卒中,以及能够用于预测致因不明的卒中患者的心源性致因和大血管性致因。缺血性卒
中中发生血细胞RNA表达改变的原因包括与急性脑缺血、有症状的动脉粥样硬化和血栓栓
塞相关的炎症改变[Xu H et al.,J Cereb Blood Flow Metab.,28:1320-1328(2008)9;
Tang Y et al.,J Cereb Blood Flow Metab.,26:1089-1102(2006);Du X et al.,
Genomics,87:693-703(2006)]。利用全基因组微阵列,鉴定出40个基因的谱以区别心源性
卒中和大血管性卒中,并鉴定了37个基因的谱以区别由于心房纤 颤导致的心源性卒中和
非心房纤颤致因导致的心源性卒中。这些基因在炎症中起作用并且代表向更好地确定致因
不明的卒中的致因迈进了一步。
[0012] 发明概述
[0013] 本发明提供了通过测定血液中生物标志物的过表达和低表达来诊断或预测卒中的发生以及卒中的致因的方法。
[0014] 因此,一方面,本发明提供了诊断缺血性卒中的发生和致因或发展为缺血性卒中的倾向的方法,所述方法包括:
[0015] a)测定来自患者的生物样本中至少15种缺血性卒中相关生物标志物的表达平,其中所述生物标志物选自表7A的多种生物标志物、表13A的多种生物标志物、表14的多种生物标志物以及表15的多种生物标志物;
[0016] b)将缺血性卒中相关生物标志物的表达水平与多种稳定表达的内源性参照生物标志物的表达水平进行比较,
[0017] 其中与多种内源性参照生物标志物的表达水平相比,选自表7A的多种生物标志物的表达水平的升高或降低指示所述患者罹患缺血性卒中或有发展为缺血性卒中的风险;
[0018] 其中与多种内源性参照生物标志物的表达水平相比,选自表13A的多种生物标志物的表达水平的升高或降低指示所述患者罹患心源性卒中或有发展为心源性卒中的风险;
[0019] 其中与多种内源性参照生物标志物的表达水平相比,选自表14的多种生物标志物的表达水平的升高或降低指示所述患者罹患颈动脉狭窄或有发展为颈动脉狭窄的风险;
[0020] 其中与多种内源性参照生物标志物的表达水平相比,选自表15的多种生物标志物的表达水平的升高或降低指示所述患者罹患心房纤颤或有发展为心房纤颤的风险,
[0021] 进而诊断缺血性卒中的发生和致因或发展为缺血性卒中的倾向。
[0022] 可同时或相继测定多种生物标志物的表达水平。
[0023] 在相关的方面中,本发明提供了诊断缺血性卒中的发生和致因或发 展为缺血性卒中的倾向的方法,所述方法包括:
[0024] a)测定来自患者的生物样本中多种(例如至少2、3、4、5、6、7、8、9、10、11、12、13、14、15或更多种或全部)缺血性卒中相关生物标志物的表达水平,其中所述生物标志物选自表7A的多种生物标志物、表13A的多种生物标志物、表14的多种生物标志物以及表15的多种生物标志物;
[0025] b)将缺血性卒中相关生物标志物的表达水平与对照表达水平进行比较,
[0026] 其中与对照表达水平相比,选自表7A的多种生物标志物的表达水平的升高或降低指示所述患者罹患缺血性卒中或有发展为缺血性卒中的风险;
[0027] 其中与对照表达水平相比,选自表13A的多种生物标志物的表达水平的升高或降低指示所述患者罹患心源性卒中或有发展为心源性卒中的风险;
[0028] 其中与对照表达水平相比,选自表14的多种生物标志物的表达水平的升高或降低指示所述患者罹患颈动脉狭窄或有发展为颈动脉狭窄的风险;
[0029] 其中与对照表达水平相比,选自表15的多种生物标志物的表达水平的升高或降低指示所述患者罹患心房纤颤或有发展为心房纤颤的风险,
[0030] 进而诊断缺血性卒中的发生和致因或发展为缺血性卒中的倾向。能够同时或相继测定多种生物标志物的表达水平。对照表达水平可以例如涉及多种稳定表达的内源性参照
生物标志物、涉及在另外的健康个体中相同的缺血相关生物标志物的表达水平(任选地,相对于多种稳定表达的内源性参照生物标志物的表达水平进行标准化),或涉及代表另外的
健康个体中相同的缺血相关生物标志物的表达水平的阈值水平(任选地,相对于多种稳定
表达的内源性参照生物标志物的表达水平进行标准化)。
[0031] 在多个实施方案中,测定的多种生物标志物来自表7A。在多个实施方案中,测定的多种生物标志物来自表13A。在多个实施方案中,测定的多种生物标志物来自表14。在多个实施方案中,测定的多种生物标志物来自表15。在多个实施方案中,测定的多种生物标志物来自表7A、表 13A、表14和表15中的两个或更多个。
[0032] 在一些实施方案中,多种稳定表达的内源性参照生物标志物选自表16中所示的生物标志物。在一些实施方案中,与多种稳定表达的内源性参照生物标志物(例如表16中所示的那些生物标志物)的表达水平相比,缺血性卒中相关生物标志物为过表达或低表达至少
约1.2倍、1.3倍、1.4倍、1.5倍、1.6倍、1.7倍、1.8倍、1.9倍、2.0倍、2.1倍、2.2倍、2.3倍、2.4倍、2.5倍、2.6倍、2.7倍、2.8倍、2.9倍、3.0倍、3.1倍、3.2倍、3.3倍、3.4倍或3.5倍或更多倍。在一些实施方案中,选自以下的2、3、4、5、6、7、8、9、10、15、20、25、30、35种或全部内源性参照生物标志物的表达水平被确定为对照:USP7、MAPRE2、CSNK1G2、SAFB2、PRKAR2A、PI4KB、CRTC1、HADHA、MAP1LC3B、KAT5、CDC2L1///CDC2L2、GTSE1、CDC2L1///CDC2L2、TCF25、CHP、LRRC40、hCG_2003956///LYPLA2///LYPLA2P1、DAXX、UBE2NL、EIF1、KCMF1、PRKRIP1、CHMP4A、TMEM184C、TINF2、PODNL1、FBXO42、LOC441258、RRP1、C10orf104、ZDHHC5、C9orf23、LRRC45、NACC1、LOC100133445///LOC115110、PEX16。
[0033] 在一些实施方案中,测定了约15-85、20-70、30-60或40-50种生物标志物的表达水平。在一些实施方案中,测定了约15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100种生物标志物。在一些实施方案中,测定了来自表7A的至少约3、5、10、15、20、25、30或更多种生物标志物的表达水平。在一些实施方案中,测定了来自表13A的至少约3、5、10、
15、20、25、30或更多种生物标志物的表达水平。在一些实施方案中,测定了来自表14的至少约3、5、10、15、20、25、30或更多种生物标志物的表达水平。在一些实施方案中,测定了来自表15的至少约3、5、10、15、20、25、30或更多种生物标志物的表达水平。在一些实施方案中,测定了表7A中所示的所有生物标志物的表达水平。在一些实施方案中,测定了表13A中所示的所有生物标志物的表达水平。在一些实施方案中,测定了表14中所示的所有生物标志物
的表达水平。在一些实施方案中,测定了表15中所示的所有生物标志物的表达水平。可以测定例如与对照表达水平相比,表达水平升高和/或 降低的卒中相关生物标志物。
[0034] 在一些实施方案中,在疑似缺血事件的3小时内测定指示卒中发生的生物标志物的表达水平。在另外的健康个体(即未患心肌梗塞,无血管风险因子)中,表7A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的升高指示患者罹患缺血性卒中
或有发展为缺血性卒中的风险:FAT3、GADL1、CXADR、RNF141、CLEC4E、TIMP2、ANKRD28、TIMM8A、PTPRD、CCRL1、FCRL4、DLX6、GABRB2、GYPA、PHTF1、CKLF、CKLF、RRAGD、CLEC4E、CKLF、FGD4、CPEB2、LOC100290882、UBXN2B、ENTPD1、BST1、LTB4R、F5、IFRD1、KIAA0319、CHMP1B、MCTP1、VNN3、AMN1、LAMP2、FCHO2、ZNF608、REM2、QKI、RBM25、FAR2、ST3GAL6、HNRNPH2、GAB1、UBR5、VAPA、MCTP1和SH3GL3。在另外的健康个体(即未患心肌梗塞、无血管风险因子)中,表
7A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的降低指示所述
患者罹患缺血性卒中或有发展为缺血性卒中的风险:PGM5、CCDC144C///LOC100134159、
LECT2、SHOX、TBX5、SPTLC3、SNIP、RBMS3、P704P、THSD4、SNRPN、GLYATL1、DKRZP434L187、OVOL2、SPIB、BXDC5、UNC5B、ASTN2、FLJ35934、CCDC144A、ALDOAP2、LDB3、LOC729222///PPFIBP1、HNRNPUL2、ELAVL2、PRTG、FOXA2、SCD5、LOC283027、LOC344595、RPL22、
LOC100129488和RPL22。
[0035] 在一些实施方案中,在疑似缺血事件的3小时内测定指示卒中发生的生物标志物的表达水平。在另外的健康个体(即未患心肌梗塞、无血管风险因子)中,表7A中选自以下的
1、2、3、4、5、6、7、8、9、10、11、12、13、14、15或更多种或全部缺血性卒中相关生物标志物表达水平的升高指示所述患者罹患缺血性卒中或有发展为缺血性卒中的风险:FGD4、F5、ABCA1、LOC100290882、LTB4R、UBXN2B、CKLF、CLEC4E、PHTF1、ENTPD1、OSBPL1A、RRAGD、CPEB2、CKLF、BST1和CKLF。
[0036] 在多个实施方案中,在表现出心肌梗塞的个体的疑似缺血事件的3小时内,表7A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的升高指示所述个体
罹患缺血性卒中或有发展为缺血性卒中 的风险:CLEC4E、TIMP2、FGD4、CPEB2、LTB4R和
VNN3。在多个实施方案中,在表现出心肌梗塞的个体的疑似缺血事件的3小时内,表7A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的降低指示所述个体罹
患缺血性卒中或有发展为缺血性卒中的风险:PGM5、CCDC144C///LOC100134159、LECT2、
SHOX、TBX5、SPTLC3、SNIP、RBMS3、P704P、THSD4、FAT3、SNRPN、GLYATL1、GADL1、CXADR、OVOL2、RNF141、SPIB、BXDC5、UNC5B,ASTN2、FLJ35934、ANKRD28、CCDC144A、TIMM8A、ALDOAP2、LDB3、PTPRD、LOC729222///PPFIBP1、CCRL1、HNRNPUL2、FCRL4、ELAVL2、PRTG、DLX6、FOXA2、SCD5、GABRB2、GYPA、PHTF1、CKLF、CKLF、RRAGD、CKLF、LOC100290882、UBXN2B、ENTPD1、BST1、F5、IFRD1、KIAA0319、CHMP1B、MCTP1、AMN1、LAMP2、FCHO2、ZNF608、REM2、QKI、RBM25、FAR2、ST3GAL6、HNRNPH2、GAB1、UBR5、VAPA、LOC283027、LOC344595、RPL22、LOC100129488、RPL22、MCTP1和SH3GL3。
[0037] 在多个实施方案中,在表现出心肌梗塞的个体的疑似缺血事件的3小时内,表7A中选自以下的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、
26、27、28、29、30或更多种或全部缺血性卒中相关生物标志物表达水平的降低指示所述个体罹患缺血性卒中或有发展为缺血性卒中的风险:THSD4、SNRPN、ASTN2、SNIP、FAT3、
TIMM8A、CCDC144C///LOC100134159、ANKRD28、TBX5、PGM5、SCD5、FCRL4、SHOX、CCRL1、LECT2、PTPRD、CCDC144A、LDB3、LOC729222///PPFIBP1、RBMS3、P704P、GYPA、PRTG、GABRB2、
HNRNPUL2、ELAVL2、SPTLC3、FOXA2、DLX6、ALDOAP2和FLJ35934。在多个实施方案中,在表现出心肌梗塞的个体的疑似缺血事件的3小时内,表7A中选自以下的1、2、3、4、5、6、7、8、9或10或更多种或全部缺血性卒中相关生物标志物表达水平的降低指示所述个体罹患缺血性卒中
或有发展为缺血性卒中的风险:THSD4、SNRPN、ASTN2、SNIP、FAT3、TIMM8A、CCDC144C///LOC100134159、ANKRD28、TBX5、PGM5。
[0038] 在多个实施方案中,在表现出一种或多种血管风险因子(例如,高血压、糖尿病、高脂血症或吸烟)的个体的疑似缺血事件的3小时内,表7A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的升高指示所述个体罹患缺血性卒中或有发展为缺血
性卒中的风险:RNF141、CLEC4E、TIMP2、PHTF1、CKLF、CKLF、RRAGD、CLEC4E、CKLF、FGD4、CPEB2、LOC100290882、UBXN2B、ENTPD1、BST1、LTB4R、F5、IFRD1、KIAA0319、CHMP1B、MCTP1、VNN3、AMN1、LAMP2、FCHO2、ZNF608、REM2、QKI、RBM25、FAR2、ST3GAL6、HNRNPH2、GAB1、UBR5、VAPA和MCTP1。在多个实施方案中,在表现出一种或多种血管风险因子的个体的疑似缺血事件的3小时内,表7A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平
的降低指示所述个体罹患缺血性卒中或有发展为缺血性卒中的风险:PGM5、CCDC144C///
LOC100134159、LECT2、SHOX、TBX5、SPTLC3、SNIP、RBMS3、P704P、THSD4、FAT3、SNRPN、GLYATL1、GADL1、CXADR、OVOL2、SPIB、BXDC5、UNC5B、ASTN2、FLJ35934、ANKRD28、CCDC144A、TIMM8A、ALDOAP2、LDB3、PTPRD、LOC729222///PPFIBP1、CCRL1、HNRNPUL2、FCRL4、ELAVL2、PRTG、DLX6、FOXA2、SCD5、GABRB2、GYPA、LOC283027、LOC344595、RPL22、LOC100129488、RPL22和SH3GL3。
[0039] 在多个实施方案中,在表现出一种或多种血管风险因子(例如,高血压、糖尿病、高脂血症或吸烟)的个体的疑似缺血事件的3小时内,表7A中选自以下的1、2、3或4种缺血性卒中相关生物标志物表达水平的升高指示所述个体罹患缺血性卒中或有发展为缺血性卒中的风险:RNF141、ELL2、TIMP2和CLEC4E。在多个实施方案中,在表现出一种或多种血管风险因子的个体的疑似缺血事件的3小时内,表7A中选自以下的1、2、3、4、5、6、7、8、9、10、11、12、
13、14、15种或全部缺血性卒中相关生物标志物表达水平的降低指示所述个体罹患缺血性
卒中或有发展为缺血性卒中的风险:SNIP、BXDC5、FAT3、LECT2、THSD4、CCDC144C///
LOC100134159、OVOL2、SPTLC3、GLYATL1、RBMS3、SPIB、DKFZP434L187、GADL1、SHOX、TBX5、UNC5B、PGM5和 CXADR。
[0040] 在一些实施方案中,在疑似缺血事件之后3小时或更长时间测定指示卒中发生的生物标志物的表达水平。在另外的健康个体(即未患心肌梗塞、无血管风险因子)中,表7A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的升高指示所述患者
罹患缺血性卒中或有发展为缺血性卒中的风险:PGM5、CCDC144C///LOC100134159、LECT2、SHOX、TBX5、SNIP、RBMS3、P704P、THSD4、FAT3、SNRPN、GLYATL1、GADL1、CXADR、OVOL2、RNF141、CLEC4E、BXDC5、UNC5B、TIMP2、ASTN2、FLJ35934、ANKRD28、CCDC144A、TIMM8A、ALDOAP2、LDB3、PTPRD、LOC729222///PPFIBP1、CCRL1、FCRL4、ELAVL2、PRTG、DLX6、SCD5、GABRB2、GYPA、PHTF1、CKLF、CKLF、RRAGD、CLEC4E、CKLF、FGD4、CPEB2、LOC100290882、UBXN2B、ENTPD1、BST1、LTB4R、F5、IFRD1、KIAA0319、CHMP1B、MCTP1、VNN3、AMN1、LAMP2、FCHO2、ZNF608、REM2、QKI、RBM25、FAR2、ST3GAL6、HNRNPH2、GAB1、UBR5、VAPA、LOC283027、LOC344595、RPL22、
LOC100129488和MCTP1。在另外的健康个体(即未患心肌梗塞、无血管风险因子)中,表7A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的降低指示所述患者
罹患缺血性卒中或有发展为缺血性卒中的风险:SPTLC3、DKRZP434L187、SPIB、HNRNPUL2、FOXA2、RPL22和SH3GL3。
[0041] 在一些实施方案中,在疑似缺血事件之后至少24小时测定指示卒中发生的生物标志物的表达水平。在另外的健康个体(即未患心肌梗塞、无血管风险因子)中,表7A中选自以下的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种缺血性卒中相关生物标志物表达水平的升高指示所述患者罹患缺血性卒中或有发展为缺血性卒中的风险:
ZNF608、FCHO2、ST3GAL6、ABCA1、THBD、AMN1、QKI、KIAA0319、MCTP1、VNN3、UBR5、FAR2、RBM25、CHMP1B、LAMP2、VAPA、IFRD1、HNRNPH2、REM2和GAB1。在另外的健康个体(即未患心肌梗塞、无血管风险因子)中,表7A中选自以下的1、2、3、4、5、6、7、8、9或10或更多种或全部缺血性卒中相关生物标志物表达水平的 升高指示所述患者罹患缺血性卒中或有发展为缺血性卒中的
风险:ZNF608、FCHO2、ST3GAL6、ABCA1、THBD、AMN1、QKI、KIAA0319、MCTP1和VNN3。
[0042] 在多个实施方案中,在表现出心肌梗塞的个体的疑似缺血事件之后3小时或更长时间,表7A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的升高指
示所述个体罹患缺血性卒中或有发展为缺血性卒中的风险:RNF141、CLEC4E、TIMP2、
HNRNPUL2、PHTF1、CKLF、CKLF、RRAGD、CLEC4E、CKLF、FGD4、CPEB2、UBXN2B、BST1、LTB4R、F5、IFRD1、KIAA0319、MCTP1、VNN3、AMN1、LAMP2、ZNF608、FAR2、GAB1、VAPA和MCTP1。在多个实施方案中,在表现出心肌梗塞的个体的疑似缺血事件之后3小时或更长时间,表7A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的降低指示所述个体罹患缺血
性卒中或有发展为缺血性卒中的风险:PGM5、CCDC144C///LOC100134159、LECT2、SHOX、
TBX5、SPTLC3、SNIP、RBMS3、P704P、THSD4、FAT3、SNRPN、GLYATL1、GADL1、CXADR、OVOL2、SPIB、BXDC5、UNC5B、ASTN2、FLJ35934、ANKRD28、CCDC144A、TIMM8A、ALDOAP2、LDB3、PTPRD、LOC729222///PPFIBP1、CCRL1、FCRL4、ELAVL2、PRTG、DLX6、FOXA2、SCD5、GABRB2、GYPA、LOC100290882、ENTPD1、CHMP1B、FCHO2、LOC283027、REM2、QKI、RBM25、ST3GAL6、HNRNPH2、UBR5、LOC344595、RPL22、LOC100129488、RPL22和SH3GL3。
[0043] 在多个实施方案中,在表现出心肌梗塞的个体的疑似缺血事件之后至少24小时,表7A中选自以下的1、2、3、4、5、6、7或更多种或全部缺血性卒中相关生物标志物表达水平的降低指示所述个体罹患缺血性卒中或有发展为缺血性卒中的风险:RPL22、LOC100129488、LOC283027、LOC344595、THSD4、FAT3、P704P。
[0044] 在多个实施方案中,在表现出一种或多种血管风险因子的个体的疑似缺血事件之后3小时或更长时间,表7A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表
达水平的升高指示所述个体罹患缺血性卒中或有发展为缺血性卒中的风险:RNF141、
CLEC4E、TIMP2、PHTF1、 CKLF、CKLF、RRAGD、CLEC4E、CKLF、FGD4、CPEB2、LOC100290882、UBXN2B、ENTPD1、BST1、LTB4R、F5、IFRD1、KIAA0319、CHMP1B、MCTP1、VNN3、AMN1、LAMP2、FCHO2、ZNF608、REM2、QKI、RBM25、FAR2、ST3GAL6、HNRNPH2、GAB1、UBR5、VAPA和MCTP1。在多个实施方案中,在表现出一种或多种血管风险因子的个体的疑似缺血事件之后3小时或更长
时间,表7A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的降低指
示所述个体罹患缺血性卒中或有发展为缺血性卒中的风险:PGM5、CCDC144C///
LOC100134159、LECT2、SHOX、TBX5、SPTLC3、SNIP、RBMS3、P704P、THSD4、FAT3、SNRPN、GLYATL1、GADL1、CXADR、OVOL2、SPIB、BXDC5、UNC5B、ASTN2、FLJ35934、ANKRD28、CCDC144A、TIMM8A、ALDOAP2、LDB3、PTPRD、LOC729222///PPFIBP1、CCRL1、HNRNPUL2、FCRL4、ELAVL2、PRTG、DLX6、FOXA2、SCD5、GABRB2、GYPA、LOC283027、LOC344595、RPL22、LOC100129488、RPL22和SH3GL3。
[0045] 在多个实施方案中,在表现出一种或多种血管风险因子的个体的疑似缺血事件之后至少24小时,表7A中选自TIMP2和MCTP1的一种或两种缺血性卒中相关生物标志物表达水
平的升高指示所述个体罹患缺血性卒中或有发展为缺血性卒中的风险。在多个实施方案
中,在表现出一种或多种血管风险因子的个体的疑似缺血事件之后至少24小时,表7A中选
自以下的1、2、3、4、5、6或7种缺血性卒中相关生物标志物表达水平的降低指示所述个体罹患缺血性卒中或有发展为缺血性卒中的风险:RPL22、SNIP、SH3GL3、FAT3、SPTLC3、RBMS3和SNRPN。
[0046] 关于对卒中致因的确定,在一些实施方案中,表13A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的升高指示所述患者已经历心源性卒中或有心源
性卒中的风险:IRF6、ZNF254、GRM5、EXT2、AP3S2、PIK3C2B、ARHGEF5、COL13A1、PTPN20A///PTPN20B、LHFP、BANK1、HLA-DOA、EBF1、TMEM19、LHFP、FCRL1、OOEP和LRRC37A3。在一些实施方案中,表13A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的降低
指示所述患者已经历心源性卒中或有心源性卒中的风险:LOC284751、CD46、ENPP2、
C19orf28、 TSKS、CHURC1、ADAMTSL4、FLJ40125、CLEC18A、ARHGEF12、C16orf68、TFDP1和GSTK1。
[0047] 在一些实施方案中,表13A中选自以下的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20种缺血性卒中相关生物标志物表达水平的升高指示所述患者已经历心源性卒中或有心源性卒中的风险:EBF1、GRM5、AP3S2、LRRC37A3、IRF6、LHFP、BANK1、ARHGEF5、ZNF254、COL13A1、P2RX5、LHFP、PIK3C2B、EXT2、HLA-DOA、OOEP、ZNF185、TMEM19、FCRL1和PTPN20A///PTPN20B。在一些实施方案中,表13A中选自以下的1、2、3、4、5、6、7、8、9、
10、11、12或13种缺血性卒中相关生物标志物表达水平的降低指示所述患者已经历心源性
卒中或有心源性卒中的风险:TSKS、ENPP2、C16orf68、LOC284751、TFDP1、GSTK1、ADAMTSL4、CHURC1、FLJ40125、ARHGEF12、CLEC18A、CD46和C19orf28。
[0048] 在一些实施方案中,表13A中选自以下的1、2、3、4、5、6、7、8、9、10或更多种或全部缺血性卒中相关生物标志物表达水平的升高指示所述患者已经历心源性卒中或有心源性卒中的风险:EBF1、GRM5、AP3S2、LRRC37A3、IRF6、LHFP、BANK1、ARHGEF5、ZNF254和COL13A1。
在一些实施方案中,表13A中选自以下的1、2、3、4、5、6、7、8、9、10或更多种或全部缺血性卒中相关生物标志物表达水平的降低指示所述患者已经历心源性卒中或有心源性卒中的风
险:TSKS、ENPP2、C16orf68、LOC284751、TFDP1、GSTK1、ADAMTSL4、CHURC1、FLJ40125和ARHGEF12。
[0049] 关于对卒中致因的确定,在一些实施方案中,表14中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的升高指示所述患者已经历颈动脉狭窄或有颈动
脉狭窄的风险:NT5E、CLASP2、GRM5、PROCR、ARHGEF5、AKR1C3、COL13A1、LHFP、RNF7、CYTH3、EBF1、RANBP10、PRSS35、C12orf42和LOC100127980。在一些实施方案中,表14中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的降低指示所述患者已经历颈动
脉狭窄或有颈动脉狭窄的风险:FLJ31945、LOC284751、LOC100271832、MTBP、ICAM4、SHOX2、 DOPEY2、CMBL、LOC146880、SLC20A1、SLC6A19、ARHGEF12、C16orf68、GIPC2和LOC100144603。
[0050] 关于对卒中致因的确定,在一些实施方案中,表14中选自以下的2、5、10、15或更多种或全部缺血性卒中相关生物标志物表达水平的升高指示所述患者已经历颈动脉狭窄或有颈动脉狭窄的风险:EBF1、COL13A1、LHFP、GRM5、ARHGEF5、RNF7、CLASP2、RANBP10、LOC100127980、CYTH3、PROCR、C12orf42、PRSS35、NT5E和AKR1C3。在一些实施方案中,表14中选自以下的2、5、10、15或更多种或全部缺血性卒中相关生物标志物表达水平的降低指示所述患者已经历颈动脉狭窄或有颈动脉狭窄的风险:FLJ31945、C16orf68、SLC20A1、DOPEY2、LOC284751、LOC100144603、MTBP、SHOX2、GIPC2、CMBL、LOC146880、SLC6A19、ICAM4、ARHGEF12和LOC10027183。
[0051] 关于对卒中致因的确定,在一些实施方案中,表15中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的升高指示所述患者已经历心房纤颤或有心房纤
颤的风险:SMC1A、SNORA68、GRLF1、SDC4、HIPK2、LOC100129034、CMTM1和TTC7A。在一些实施方案中,表15中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的降低
指示所述患者已经历心房纤颤或有心房纤颤的风险:LRRC43、MIF///SLC2A11、PER3、PPIE、COL13A1、DUSP16、LOC100129034、BRUNOL6、GPR176、C6orf164和MAP3K7IP1。
[0052] 关于对卒中致因的确定,在一些实施方案中,表15中选自以下的1、2、3、4、5、6、7或8种缺血性卒中相关生物标志物表达水平的升高指示所述患者已经历心房纤颤或有心房纤
颤的风险:CMTM1、SDC4、SNORA68、HIPK2、TTC7A、GRLF1、LOC100129034、SMC1A。在一些实施方案中,表15中选自以下的1、2、3、4、5、6、7、8、9或10种缺血性卒中相关生物标志物表达水平的降低指示所述患者已经历心房纤颤或有心房纤颤的风险:COL13A1、C6orf164、GPR176、BRUNOL6、MIF///SLC2A11、DUSP16、PPIE、MAP3K7IP1、PER3、LRRC43。
[0053] 在相关的方面中,本发明提供了确定是否已发生卒中或预测是否将发生卒中的方法。因此,本发明提供了诊断缺血性卒中或发展为缺血性 卒中的倾向的方法,所述方法包括:测定来自患者的生物样本中多种缺血性卒中相关生物标志物的表达水平,其中与对照
相比,所述水平的升高或降低指示所述患者罹患缺血性卒中或有发展为缺血性卒中的风
险,其中所述多种缺血性卒中相关生物标志物选自表7A中所示的生物标志物。在一些实施
方案中,确定卒中发生的方法进一步包括测定表7B中所示的一种或多种生物标志物的表达
水平。在一些实施方案中,缺血性卒中是选自以下的一种:栓塞性卒中、血栓性卒中、短暂性缺血发作、心源性卒中和动脉粥样硬化性血栓性卒中。
[0054] 在一些实施方案中,在疑似缺血事件的3小时内测定指示卒中发生的生物标志物的表达水平。在另外的健康个体(即未患心肌梗塞、无血管风险因子)中,表7A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的升高指示所述患者罹患缺血性
卒中或有发展为缺血性卒中的风险:FAT3、GADL1、CXADR、RNF141、CLEC4E、TIMP2、ANKRD28、TIMM8A、PTPRD、CCRL1、FCRL4、DLX6、GABRB2、GYPA、PHTF1、CKLF、CKLF、RRAGD、CLEC4E、CKLF、FGD4、CPEB2、LOC100290882、UBXN2B、ENTPD1、BST1、LTB4R、F5、IFRD1、KIAA0319、CHMP1B、MCTP1、VNN3、AMN1、LAMP2、FCHO2、ZNF608、REM2、QKI、RBM25、FAR2、ST3GAL6、HNRNPH2、GAB1、UBR5、VAPA、MCTP1和SH3GL3。在另外的健康个体(即未患心肌梗塞、无血管风险因子)中,表
7A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的降低指示所述
患者罹患缺血性卒中或有发展为缺血性卒中的风险:PGM5、CCDC144C///LOC100134159、
LECT2、SHOX、TBX5、SPTLC3、SNIP、RBMS3、P704P、THSD4、SNRPN、GLYATL1、DKRZP434L187、OVOL2、SPIB、BXDC5、UNC5B、ASTN2、FLJ35934、CCDC144A、ALDOAP2、LDB3、LOC729222///PPFIBP1、HNRNPUL2、ELAVL2、PRTG、FOXA2、SCD5、LOC283027、LOC344595、RPL22、
LOC100129488和RPL22。
[0055] 在多个实施方案中,在表现出心肌梗塞的个体的疑似缺血事件的3小时内,表7A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的升高指示所述个体
罹患缺血性卒中或有发展为缺血性卒中 的风险:CLEC4E、TIMP2、FGD4、CPEB2、LTB4R和
VNN3。在多个实施方案中,在表现出心肌梗塞的个体的疑似缺血事件的3小时内,表7A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的降低指示所述个体罹
患缺血性卒中或有发展为缺血性卒中的风险:PGM5、CCDC144C///LOC100134159、LECT2、
SHOX、TBX5、SPTLC3、SNIP、RBMS3、P704P、THSD4、FAT3、SNRPN、GLYATL1、GADL1、CXADR、OVOL2、RNF141、SPIB、BXDC5、UNC5B、ASTN2、FLJ35934、ANKRD28、CCDC144A、TIMM8A、ALDOAP2、LDB3、PTPRD、LOC729222///PPFIBP1、CCRL1、HNRNPUL2、FCRL4、ELAVL2、PRTG、DLX6、FOXA2、SCD5、GABRB2、GYPA、PHTF1、CKLF、CKLF、RRAGD、CKLF、LOC100290882、UBXN2B、ENTPD1、BST1、F5、IFRD1、KIAA0319、CHMP1B、MCTP1、AMN1、LAMP2、FCHO2、ZNF608、REM2、QKI、RBM25、FAR2、ST3GAL6、HNRNPH2、GAB1、UBR5、VAPA、LOC283027、LOC344595、RPL22、LOC100129488、RPL22、MCTP1和SH3GL3。
[0056] 在多个实施方案中,在表现出一种或多种血管风险因子(例如,高血压、糖尿病、高脂血症或吸烟)的个体的疑似缺血事件的3小时内,表7A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的升高指示所述个体罹患缺血性卒中或有发展为缺血
性卒中的风险:RNF141、CLEC4E、TIMP2、PHTF1、CKLF、CKLF、RRAGD、CLEC4E、CKLF、FGD4、CPEB2、LOC100290882、UBXN2B、ENTPD1、BST1、LTB4R、F5、IFRD1、KIAA0319、CHMP1B、MCTP1、VNN3、AMN1、LAMP2、FCHO2、ZNF608、REM2、QKI、RBM25、FAR2、ST3GAL6、HNRNPH2、GAB1、UBR5、VAPA和MCTP1。在多个实施方案中,在表现出一种或多种血管风险因子的个体的疑似缺血事件的3小时内,表7A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平
的降低指示所述个体罹患缺血性卒中或有发展为缺血性卒中的风险:PGM5、CCDC144C///
LOC100134159、LECT2、SHOX、TBX5、SPTLC3、SNIP、RBMS3、P704P、THSD4、FAT3、SNRPN、GLYATL1、GADL1、CXADR、OVOL2、SPIB、BXDC5、UNC5B、ASTN2、FLJ35934、ANKRD28、 CCDC144A、TIMM8A、ALDOAP2、LDB3、PTPRD、LOC729222///PPFIBP1、CCRL1、HNRNPUL2、FCRL4、ELAVL2、PRTG、DLX6、FOXA2、SCD5、GABRB2、GYPA、LOC283027、LOC344595、RPL22、LOC100129488、RPL22和SH3GL3。
[0057] 在一些实施方案中,在疑似缺血事件之后3小时或更长时间测定指示卒中发生的生物标志物的表达水平。在另外的健康个体(即未患心肌梗塞、无血管风险因子)中,表7A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的升高指示所述患者
罹患缺血性卒中或有发展为缺血性卒中的风险:PGM5、CCDC144C///LOC100134159、LECT2、SHOX、TBX5、SNIP、RBMS3、P704P、THSD4、FAT3、SNRPN、GLYATL1、GADL1、CXADR、OVOL2、RNF141、CLEC4E、BXDC5、UNC5B、TIMP2、ASTN2、FLJ35934、ANKRD28、CCDC144A、TIMM8A、ALDOAP2、LDB3、PTPRD、LOC729222///PPFIBP1、CCRL1、FCRL4、ELAVL2、PRTG、DLX6、SCD5、GABRB2、GYPA、PHTF1、CKLF、CKLF、RRAGD、CLEC4E、CKLF、FGD4、CPEB2、LOC100290882、UBXN2B、ENTPD1、BST1、LTB4R、F5、IFRD1、KIAA0319、CHMP1B、MCTP1、VNN3、AMN1、LAMP2、FCHO2、ZNF608、REM2、QKI、RBM25、FAR2、ST3GAL6、HNRNPH2、GAB1、UBR5、VAPA、LOC283027、LOC344595、RPL22、
LOC100129488和MCTP1。在另外的健康个体(即未患心肌梗塞、无血管风险因子)中,表7A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的降低指示所述患者
罹患缺血性卒中或有发展为缺血性卒中的风险:SPTLC3、DKRZP434L187、SPIB、HNRNPUL2、FOXA2、RPL22和SH3GL3。
[0058] 在多个实施方案中,在表现出心肌梗塞的个体的疑似缺血事件之后3小时或更长时间,表7A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的升高指
示所述个体罹患缺血性卒中或有发展为缺血性卒中的风险:RNF141、CLEC4E、TIMP2、
HNRNPUL2、PHTF1、CKLF、CKLF、RRAGD、CLEC4E、CKLF、FGD4、CPEB2、UBXN2B、BST1、LTB4R、F5、IFRD1、KIAA0319、MCTP1、VNN3、AMN1、LAMP2、ZNF608、FAR2、GAB1、VAPA和MCTP1。在多个实施方案中,在表现 出心肌梗塞的个体的疑似缺血事件之后3小时或更长时间,表7A中选自以
下的一种或多种或全部缺血性卒中相关生物标志物表达水平的降低指示所述个体罹患缺
血性卒中或有发展为缺血性卒中的风险:PGM5、CCDC144C///LOC100134159、LECT2、SHOX、TBX5、SPTLC3、SNIP、RBMS3、P704P、THSD4、FAT3、SNRPN、GLYATL1、GADL1、CXADR、OVOL2、SPIB、BXDC5、UNC5B、ASTN2、FLJ35934、ANKRD28、CCDC144A、TIMM8A、ALDOAP2、LDB3、PTPRD、LOC729222///PPFIBP1、CCRL1、FCRL4、ELAVL2、PRTG、DLX6、FOXA2、SCD5、GABRB2、GYPA、LOC100290882、ENTPD1、CHMP1B、FCHO2、LOC283027、REM2、QKI、RBM25、ST3GAL6、HNRNPH2、UBR5、LOC344595、RPL22、LOC100129488、RPL22和SH3GL3。
[0059] 在多个实施方案中,在表现出一种或多种血管风险因子的个体的疑似缺血事件之后3小时或更长时间,表7A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表
达水平的升高指示所述个体罹患缺血性卒中或有发展为缺血性卒中的风险:RNF141、
CLEC4E、TIMP2、PHTF1、CKLF、CKLF、RRAGD、CLEC4E、CKLF、FGD4、CPEB2、LOC100290882、UBXN2B、ENTPD1、BST1、LTB4R、F5、IFRD1、KIAA0319、CHMP1B、MCTP1、VNN3、AMN1、LAMP2、FCHO2、ZNF608、REM2、QKI、RBM25、FAR2、ST3GAL6、HNRNPH2、GAB1、UBR5、VAPA和MCTP1。在多个实施方案中,在表现出一种或多种血管风险因子的个体的疑似缺血事件之后3小时或更长
时间,表7A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的降低指
示所述个体罹患缺血性卒中或有发展为缺血性卒中的风险:PGM5、CCDC144C///
LOC100134159、LECT2、SHOX、TBX5、SPTLC3、SNIP、RBMS3、P704P、THSD4、FAT3、SNRPN、GLYATL1、GADL1、CXADR、OVOL2、SPIB、BXDC5、UNC5B、ASTN2、FLJ35934、ANKRD28、CCDC144A、TIMM8A、ALDOAP2、LDB3、PTPRD、LOC729222///PPFIBP1、CCRL1、HNRNPUL2、FCRL4、ELAVL2、PRTG、DLX6、FOXA2、SCD5、GABRB2、GYPA、LOC283027、LOC344595、RPL22、LOC100129488、RPL22和SH3GL3。
[0060] 在另一方面,本发明提供了确定个体心源性卒中的发生或患心源性 卒中的倾向的方法,所述方法包括:测定来自患者的生物样本中多种缺血性卒中相关生物标志物的表
达水平,其中与对照相比,水平的升高或降低指示所述患者已经历心源性卒中,其中所述多种缺血性卒中相关生物标志物选自表13A中所示的生物标志物。在一些实施方案中,选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的升高指示所述患者已经历
心源性卒中或有心源性卒中的风险:IRF6、ZNF254、GRM5、EXT2、AP3S2、PIK3C2B、ARHGEF5、COL13A1、PTPN20A///PTPN20B、LHFP、BANK1、HLA-DOA、EBF1、TMEM19、LHFP、FCRL1、OOEP和LRRC37A3。在一些实施方案中,选自以下的一种或多种或全部缺血性卒中相关生物标志物
表达水平的降低指示所述患者已经历心源性卒中或有心源性卒中的风险:LOC284751、
CD46、ENPP2、C19orf28、TSKS、CHURC1、ADAMTSL4、FLJ40125、CLEC18A、ARHGEF12、C16orf68、TFDP1和GSTK1。在一些实施方案中,还测定表13B中所示的多种缺血性卒中相关生物标志物的表达水平,其中与对照相比,所述水平的升高或降低指示所述患者已经历心源性卒中或
有心源性卒中的风险。在一些实施方案中,表13A中选自以下的1、2、3、4、5、6、7、8、9、10或更多种或全部缺血性卒中相关生物标志物表达水平的升高指示所述患者已经历心源性卒中
或有心源性卒中的风险:EBF1、GRM5、AP3S2、LRRC37A3、IRF6、LHFP、BANK1、ARHGEF5、ZNF254和COL13A1。在一些实施方案中,表13A中选自以下的1、2、3、4、5、6、7、8、9、10或更多种或全部缺血性卒中相关生物标志物表达水平的降低指示所述患者已经历心源性卒中或有心源
性卒中的风险:TSKS、ENPP2、C16orf68、LOC284751、TFDP1、GSTK1、ADAMTSL4、CHURC1、FLJ40125和ARHGEF12。
[0061] 在另一方面,本发明提供了确定个体颈动脉狭窄的发生或患颈动脉狭窄的倾向的方法,所述方法包括:测定来自缺血性卒中患者的生物样本中多种缺血性卒中相关生物标
志物的表达水平,其中与对照相比,所述水平的升高或降低指示所述患者已经历颈动脉狭
窄,其中所述多种缺血性卒中相关生物标志物选自表14中所示的生物标志物。在一些实施
方案中,选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水 平的升高指示
所述患者已经历颈动脉狭窄或有颈动脉狭窄的风险:NT5E、CLASP2、GRM5、PROCR、ARHGEF5、AKR1C3、COL13A1、LHFP、RNF7、CYTH3、EBF1、RANBP10、PRSS35、C12orf42和LOC100127980。在一些实施方案中,选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的降
低指示所述患者已经历颈动脉狭窄或有颈动脉狭窄的风险:FLJ31945、LOC284751、
LOC100271832、MTBP、ICAM4、SHOX2、DOPEY2、CMBL、LOC146880、SLC20A1、SLC6A19、ARHGEF12、C16orf68、GIPC2和LOC100144603。在一些实施方案中,表14中选自以下的2、5、10、15或更多种或全部缺血性卒中相关生物标志物表达水平的升高指示所述患者已经历颈动脉狭窄或
有颈动脉狭窄的风险:EBF1、COL13A1、LHFP、GRM5、ARHGEF5、RNF7、CLASP2、RANBP10、LOC100127980、CYTH3、PROCR、C12orf42、PRSS35、NT5E和AKR1C3。在一些实施方案中,表14中选自以下的2、5、10、15或更多种或全部缺血性卒中相关生物标志物表达水平的降低指示所述患者已经历颈动脉狭窄或有颈动脉狭窄的风险:FLJ31945、C16orf68、SLC20A1、DOPEY2、LOC284751、LOC100144603、MTBP、SHOX2、GIPC2、CMBL、LOC146880、SLC6A19、ICAM4、ARHGEF12和LOC10027183。
[0062] 在另一方面,本发明提供了确定个体心房纤颤的发生或患心房纤颤的倾向的方法,所述方法包括:测定来自患者的生物样本中多种缺血性卒中相关生物标志物的表达水
平,其中与对照相比,所述水平的升高或降低指示所述患者已经历心房纤颤或有心房纤颤
的风险,其中所述多种缺血性卒中相关生物标志物选自表15中所示的生物标志物。在一些
实施方案中,选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的升高指
示所述患者已经历心房纤颤或有心房纤颤的风险:SMC1A、SNORA68、GRLF1、SDC4、HIPK2、LOC100129034、CMTM1和TTC7A。在一些实施方案中,选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的降低指示所述患者已经历心房纤颤或有心房纤颤的风险:
LRRC43、MIF///SLC2A11、PER3、PPIE、COL13A1、DUSP16、LOC100129034、BRUNOL6、GPR176、C6orf164和MAP3K7IP1。在一 些实施方案中,表15中选自以下的1、2、3、4、5、6、7或8种缺血性卒中相关生物标志物表达水平的升高指示所述患者已经历心房纤颤或有心房纤颤的风
险:CMTM1、SDC4、SNORA68、HIPK2、TTC7A、GRLF1、LOC100129034、SMC1A。在一些实施方案中,表15中选自以下的1、2、3、4、5、6、7、8、9或10种缺血性卒中相关生物标志物表达水平的降低指示所述患者已经历心房纤颤或有心房纤颤的风险:COL13A1、C6orf164、GPR176、BRUNOL6、MIF///SLC2A11、DUSP16、PPIE、MAP3K7IP1、PER3、LRRC43。
[0063] 关于确定卒中的发生和/或致因的方法的实施方案,在一些实施方案中,总共测定约15-85、20-70、30-60或40-50种生物标志物的表达水平。在一些实施方案中,测定约15、
20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100种生物标志物。能够同时或相继测定多种生物标志物的表达水平。
[0064] 在一些实施方案中,对照水平是多种稳定表达的内源性参照生物标志物的表达水平。在一些实施方案中,多种稳定表达的内源性参照生物标志物选自表16中所示的生物标
志物。在一些实施方案中,与多种稳定表达的内源性参照生物标志物(例如,表16中所示的那些生物标志物)的表达水平相比,缺血性卒中相关生物标志物过表达或低表达至少约1.2
倍、1.3倍、1.4倍、1.5倍、1.6倍、1.7倍、1.8倍、1.9倍、2.0倍、2.1倍、2.2倍、2.3倍、2.4倍、
2.5倍、2.6倍、2.7倍、2.8倍、2.9倍、3.0倍、3.1倍、3.2倍、3.3倍、3.4倍或3.5倍或更多倍。在一些实施方案中,测定选自以下的2、3、4、5、6、7、8、9、10、15、20、25、30、35种或全部内源性参照生物标志物的表达水平,将其作为对照:USP7、MAPRE2、CSNK1G2、SAFB2、PRKAR2A、PI4KB、CRTC1、HADHA、MAP1LC3B、KAT5、CDC2L1///CDC2L2、GTSE1、CDC2L1///CDC2L2、TCF25、CHP、LRRC40、hCG_2003956///LYPLA2///LYPLA2P1、DAXX、UBE2NL、EIF1、KCMF1、PRKRIP1、CHMP4A、TMEM184C、TINF2、PODNL1、FBXO42、LOC441258、RRP1、C10orf104、ZDHHC5、C9orf23、LRRC45、NACC1、LOC100133445///LOC115110、PEX16。
[0065] 在一些实施方案中,对照水平是健康个体中相同生物标志物的表达水平,所述健康个体例如未经历血管事件和/或没有经历血管事件(例如,TIA、缺血性卒中、心肌梗塞、周围血管性疾病或静脉血栓栓塞)风险的个体。在一些实施方案中,对照是代表健康的个体群体的(例如相同缺血性卒中相关生物标志物的)阈值表达水平,所述阈值表达水平任选地相
对于稳定表达的内源性参照生物标志物的表达水平进行标准化。
[0066] 确定缺血事件的发生或倾向的方法还可以包括确定患者是否已患心肌梗塞或患者是否具有血管风险因子的步骤。
[0067] 在一些实施方案中,患者没有症状。在一些实施方案中,患者表现出缺血性卒中的症状,例如,已经历缺血事件的症状、正经历缺血事件的症状或即将经历缺血事件的症状。在一些实施方案中,患者已经历缺血事件。在一些实施方案中,测定步骤在缺血事件之后3小时或更短时间进行。在一些实施方案中,测定步骤在缺血事件之后3小时或更长时间进
行。
[0068] 在一些实施方案中,所述方法还包括向患者推荐或提供适于确定的卒中致因的治疗方案的步骤。例如,在诊断为经历心源性卒中或有经历心源性卒中的倾向的患者中,所述方法还包括推荐或提供心源性卒中的治疗或预防方案。在诊断为经历颈动脉狭窄或有经历
颈动脉狭窄的倾向的患者中,所述方法还包括推荐或提供颈动脉狭窄的治疗或预防方案。
在诊断为经历心房纤颤或有经历心房纤颤的倾向的患者中,所述方法还包括推荐或提供心
房纤颤的治疗或预防方案。
[0069] 关于测定生物标志物的表达水平的实施方案,在一些实施方案中,在转录水平上测定生物标志物的表达水平。例如,在一些实施方案中,通过检测缺血性卒中相关基因探针与生物样本中生物标志物的基因转录物的杂交来测定表达水平。在一些实施方案中,杂交
步骤在核酸阵列芯片上进行。在一些实施方案中,杂交步骤在微流体测定板中进行。在一些实施方案中,通过扩增生物标志物的基因转录物来测定表达水平。在一些实施方案中,扩增反应是聚合酶链式反应(PCR)。
[0070] 在一些实施方案中,在蛋白水平上测定生物标志物的表达水平。
[0071] 在一些实施方案中,所述方法还包括获得来自患者的生物样本。在一些实施方案中,生物样本是血液、血清或血浆
[0072] 在另一方面,本发明提供了固体支持物,其包含多种能够与表7A、7B、13A、3B、14和15(以及任选地表16)中所示的多个基因杂交的核酸,其中多种核酸与固体支持物连接。固
体支持物任选地可以包含多种能够与表16中所示的多个基因杂交的核酸。在多个实施方案
中,固体支持物是微阵列。在多个实施方案中,固体支持物与表7A、7B、13A、13B、14、15和/或
16中所示的至少约15、20、25、30、35、40、45、50、55、60、75、80、85、90、95或100或更多个或全部基因连接。
[0073] 在一实施方案中,固体支持物包含多种能够与表7A(以及7B)中所示的多个基因杂交的核酸。例如,在一实施方案中,固体支持物包含2、5、10、15、20或更多种或全部能够与选自以下的多种卒中相关生物标志物杂交的核酸:SNIP、BXDC5、FAT3、LECT2、THSD4、
CCDC144C///LOC100134159、OVOL2、SPTLC3、CLEC4E、GLYATL1、RBMS3、SPIB、DKFZP434L187、GADL1、SHOX、TBX5、UNC5B、PGM5、TIMP2、ELL2、CXADR和RNF141。在一实施方案中,固体支持物包含2、3、4、5、6、7、8或9种能够与选自以下的多种卒中相关生物标志物杂交的核酸:RPL22、SNIP、SH3GL3、MCTP1、FAT3、SPTLC3、RBMS3、SNRPN和TIMP2。在一实施方案中,固体支持物包含2、5、10、15或更多种或全部能够与选自以下的多种卒中相关生物标志物杂交的核酸:
FGD4、F5、ABCA1、LOC100290882、LTB4R、UBXN2B、CKLF、CLEC4E、PHTF1、ENTPD1、OSBPL1A、RRAGD、CPEB2、CKLF、BST1和CKLF。在一实施方案中,固体支持物包含2、5、10、15、20或更多种或全部能够与选自以下的多种卒中相关生物标志物杂交的核酸:ZNF608、FCHO2、ST3GAL6、ABCA1、THBD、AMN1、QKI、KIAA0319、MCTP1、VNN3、UBR5、FAR2、RBM25、CHMP1B、LAMP2、VAPA、IFRD1、HNRNPH2、REM2和GAB1。在一实施方案中,固体支持物包含2、5、10、15、20、25、30或更多种或全部能够与选自以下的多种卒中相关生物标志物杂交的核酸:THSD4、SNRPN、ASTN2、SNIP、FAT3、TIMM8A、CCDC144C//LOC100134159、ANKRD28、TBX5、PGM5、SCD5、FCRL4、SHOX、CCRL1、LECT2、PTPRD、CCDC144A、LDB3、LOC729222///PPFIBP1、RBMS3、P704P、GYPA、PRTG、GABRB2、HNRNPUL2、ELAVL2、 SPTLC3、FOXA2、DLX6、ALDOAP2和FLJ35934。在一实施方案中,固体支持物包含2、5、6、7或更多种或全部能够与选自以下的多种卒中相关生物标志物杂交的核酸:RPL22、LOC100129488、LOC283027、LOC344595、THSD4、FAT3和P704P。在一实施方案中,固体支持物包含15、20、25、30、35、40、50、55、60、65、70、75、80、85、90、95、100或更多种或全部能够与选自以下的多种卒中相关生物标志物杂交的核酸:SNIP、BXDC5、FAT3、LECT2、
THSD4、CCDC144C///LOC100134159、OVOL2、SPTLC3、CLEC4E、GLYATL1、RBMS3、SPIB、
DKFZP434L187、GADL1、SHOX、TBX5、UNC5B、PGM5、TIMP2、ELL2、CXADR、RNF141、RPL22、SH3GL3、MCTP1、SNRPN、FGD4、F5、ABCA1、LOC100290882、LTB4R、UBXN2B、CKLF、PHTF1、ENTPD1、OSBPL1A、RRAGD、CPEB2、CKLF、BST1、ZNF608、FCHO2、ST3GAL6、THBD、AMN1、QKI、KIAA0319、MCTP1、VNN3、UBR5、FAR2、RBM25、CHMP1B、LAMP2、VAPA、IFRD1、HNRNPH2、REM2、GAB1、ASTN2、TIMM8A、CCDC144C///LOC100134159、ANKRD28、SCD5、FCRL4、CCRL1、LECT2、PTPRD、CCDC144A、LDB3、LOC729222///PPFIBP1、P704P、GYPA、PRTG、GABRB2、HNRNPUL2、ELAVL2、FOXA2、DLX6、ALDOAP2、FLJ35934、LOC100129488、LOC283027和LOC344595。
[0074] 在一实施方案中,固体支持物包含多种能够与表13A(以及13B)中所示的多个基因杂交的核酸。在一实施方案中,固体支持物包含2、5、10、15、20、25、30、35或更多种或全部能够与选自以下的多种心源性卒中相关生物标志物杂交的核酸:EBF1、GRM5、TSKS、ENPP2、AP3S2、LRRC37A3、C16orf68、LOC284751、IRF6、LHFP、BANK1、ARHGEF5、ZNF254、TFDP1、COL13A1、GSTK1、ADAMTSL4、P2RX5、LHFP、PIK3C2B、CHURC1、EXT2、HLA-DOA、OOEP、ZNF185、TMEM19、FCRL1、FLJ40125、ARHGEF12、CLEC18A、CD46、PTPN20A///PTPN20B和C19orf28。
[0075] 在一实施方案中,固体支持物包含多种能够与表14中所示的多个基因杂交的核酸。在一实施方案中,固体支持物包含2、5、10、15、20、 25、30、35或更多种或全部能够与选自以下的多种心房纤颤卒中相关生物标志物杂交的核酸:EBF1、FLJ31945、C16orf68、
SLC20A1、DOPEY2、COL13A1、LHFP、LOC284751、GRM5、LOC100144603、MTBP、SHOX2、ARHGEF5、RNF7、CLASP2、GIPC2、RANBP10、CMBL、LOC100127980、CYTH3、PROCR、LOC146880、SLC6A19、ICAM4、C12orf42、ARHGEF12、PRSS35、NT5E、LOC100271832、LHFP、NT5E和AKR1C3。
[0076] 在一实施方案中,固体支持物包含多种能够与表15中所示的多个基因杂交的核酸。在一实施方案中,固体支持物包含2、5、10、15、18或更多种或全部能够与选自以下的多种心房纤颤卒中相关生物标志物杂交的核酸:CMTM1、COL13A1、SDC4、C6orf164、GPR176、BRUNOL6、SNORA68、MIF///SLC2A11、DUSP16、HIPK2、TTC7A、PPIE、GRLF1、MAP3K7IP1、LOC100129034、PER3、SMC1A和LRRC43。
[0077] 在多个实施方案中,固体支持物还包含多种能够与选自以下的多种内源性参照基因杂交的核酸:USP7、MAPRE2、CSNK1G2、SAFB2、PRKAR2A、PI4KB、CRTC1、HADHA、MAP1LC3B、KAT5、CDC2L1///CDC2L2、GTSE1、TCF25、CHP、LRRC40、hCG_2003956///LYPLA2///LYPLA2P1、DAXX、UBE2NL、EIF1、KCMF1、PRKRIP1、CHMP4A、TMEM184C、TINF2、PODNL1、FBXO42、LOC441258、RRP1、C10orf104、ZDHHC5、C9orf23、LRRC45、NACC1、LOC100133445///LOC115110、PEX16。
[0078] 定义
[0079] 除非另外限定,本文使用的所有技术和科学术语通常具有与本发明所述技术领域的普通技术人员所通常理解的相同的含义。通常,本文使用的命名以及下文描述的细胞培
养、分子遗传学、有机化学和核酸化学与杂交中的实验方案是本领域内公知且常用的那些。
核酸和肽合成中使用标准技术。通常,酶促反应以及纯化步骤按照厂商的说明书进行。技术和方案通常按照本领域内常规的方法和各种普通参考文献进行(通常参见,Sambrook et 
al.MOLECULAR CLONING:A LABORATORY MANUAL,3rd ed.(2001)Cold Spring Harbor 
Laboratory Press,Cold Spring Harbor,N.Y.和Ausubel,et al.,CURRENT PROTOCOLS IN 
MOLECULAR BIOLOGY,1990-2008,Wiley Interscience),其提供在整篇文件中。本文使用的命名以及下文描述的分析化学和有机合成中的实验方案是本领域内公知且常用的那些。化
学合成和化学分析中使用标准技术或其改进技术。
[0080] 本文使用的“缺血”或“缺血事件”指特征为由于向局部区域的血管堵塞而造成对该区域的血液供给(即循环)不足的疾病和病症。缺血包括例如,卒中和短暂性缺血发作。卒中包括例如,缺血性卒中(包括但不限于,心源性卒中、动脉粥样硬化性栓塞性或动脉粥样硬化性血栓性卒中(即由颈动脉、主动脉、心脏和脑的动脉粥样硬化导致的卒中)、小血管性卒中(即腔隙性卒中)、由血管壁疾病(即血管炎)导致的卒中、由感染导致的卒中、由血液学病症导致的卒中、由偏头痛导致的卒中以及由药物(如激素疗法)导致的卒中)、出血性缺血性卒中、脑出血以及蛛网膜下出血。
[0081] “缺血参照表达谱”指相对于对照(例如,没有缺血事件的个体中的表达水平或稳定表达的内源性参照生物标志物的表达水平),在缺血中差异表达(即过表达或低表达)的
一组基因(例如,表7A、7B、13A、13B、14和15中所示的多个基因)的表达模式。来自表7A、7B、
13A、13B、14和15的以高于对照水平至少约1.2倍、1.3倍、1.4倍、1.5倍、1.6倍、1.7倍、1.8倍、1.9倍、2.0倍、2.1倍、2.2倍、2.3倍、2.4倍、2.5倍、2.6倍、2.7倍、2.8倍、2.9倍、3.0倍、
3.1倍、3.2倍、3.3倍、3.4倍或3.5倍的水平表达的基因是缺血中过表达的基因,来自表7A、
7B、13A、13B、14和15的以低于对照水平至少约1.2倍、1.3倍、1.4倍、1.5倍、1.6倍、1.7倍、
1.8倍、1.9倍、2.0倍、2.1倍、2.2倍、2.3倍、2.4倍、2.5倍、2.6倍、2.7倍、2.8倍、2.9倍、3.0倍、3.1倍、3.2倍、3.3倍、3.4倍或3.5倍的水平表达的基因是缺血中低表达的基因。可选地,以高于对照水平至少约10%、20%、30%、40%、50%、60%、70%、80%、90%或100%的水平表达的基因是缺血中过表达的基因,以低于对照水平至少约10%、20%、30%、40%、50%、60%、70%、80%、90%或100%的水平表达的基因是缺血中低表达的基因。
[0082] “多种”指两种或更多种或全部,例如,2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23或更多种(例 如,基因)。在一些实施方案中,多种指约15-85、20-60或40-50个基因(例如,约15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100或更多种或全部基因)的同时或相继测定。在一些实施方案中,“多种”指一个或多个表格中所示的全部基因,例如,表7A、7B、13A、13B、14和15中所示的全部基因。
[0083] “样本”或“生物样本”包括诸如活检和尸检样本的组织切片以及采集用于组织学目的的冷冻切片。这类样本包括血液、唾液、组织、裂解的细胞、脑活检物、培养的细胞(例如,原代培养物、外植体和转化的细胞)、粪便、尿液等。生物样本通常获自真核生物,最优选获自哺乳动物,如灵长类,例如,黑猩猩或人;;狗;猫;啮齿类,例如,豚鼠、大鼠、小鼠;兔;或;爬行类动物;或鱼。
[0084] 本文使用的“阵列”指包含连接的核酸或肽探针的固体支持物。阵列通常包含按照不同的已知位置连接至基底表面的多种不同的核酸或肽探针。这些阵列,也称为“微阵列”或通俗来讲也称为“芯片”,通常描述于现有技术中,例如,美国专利号5,143,854、5,445,934、5,744,305、5,677,195、6,040,193、5,424,186和Fodor et al.、Science、251:767-777(1991)。通常可以利用机械合成方法或光引导合成方法来产生这些阵列,所述光引导合成
方法合并了光刻方法和固相合成方法的组合。利用机械合成方法合成这些阵列的技术描述
于例如,美国专利号5,384,261。阵列可以包含平坦的表面,或者可以是珠子、凝胶、聚合物表面、诸如光纤的纤维、玻璃或任何其它合适的基底上的核酸或肽,其它合适的基底描述于例如,美国专利号5,770,358、5,789,162、5,708,153、6,040,193和5,800,992。可以以一定的方式来包装阵列,从而允许进行全功能装置的诊断或其它方式的操纵,其描述于例如美
国专利号5,856,174和5,922,591。
[0085] 术语“基因”表示参与产生多肽链的DNA区段;其包括编码区之前和之后的区域(前导区和尾区)以及各个编码区段(外显子)之间的间插序列(内含子)。
[0086] 术语“核酸”和“多核苷酸”在本文可交换使用,指单链或双链形式的脱核糖核苷酸或核糖核苷酸及它们的聚合物。该术语包括含有已知核苷酸类似物或修饰的主链残基或连接的核酸,所述核酸是合成的、天然存 在的和非天然存在的,与参照核酸具有相似的结合特性,以及与参照核酸以相似的方式代谢。这类类似物的实例包括但不限于,硫代磷酸、磷酰胺、甲基磷酸、手性甲基磷酸、2-O-甲基核苷酸、肽核酸(PNA)。
[0087] 除非另外指出,具体的核酸序列还包括其保守型修饰的变体(例如,简并密码子取代)和互补序列,以及明确指明的序列。具体来说,简并密码子取代可以通过产生下述序列来实现,该序列中一个或多个选择(或全部)的密码子的第三位用混合基和/或脱氧肌苷
残基替代(Batzer et al.、Nucleic Acid Res.19:5081(1991);Ohtsuka et al.、
J.Biol.Chem.260:2605-2608(1985);Rossolini et al.、Mol.Cell.Probes8:91-98
(1994))。术语核酸与基因、cDNA、mRNA、寡核苷酸和多核苷酸可交换使用。
[0088] 短语“严紧杂交条件”指这样的条件:在该条件下,探针与其靶序列(通常位于核酸的复杂混合物中)杂交,而不与其它序列杂交。严紧杂交条件是序列依赖性的,且在不同的环境下是不同的。较长的序列在较高温度下特异性杂交。核酸杂交的详细指导见于Tijssen,Techniques in Biochemistry and Molecular Biology--Hybridization with 
Nucleic Probes,“Overview of principles of hybridization and the strategy of 
nucleic acid assays”(1993)。通常,对于规定的离子强度、Ph下的具体序列,严紧杂交条件选择为低于其热熔点约5-10°C。Tm是这样的温度(在规定的离子强度、Ph和核酸浓度下):
在该温度下,在平衡时,与靶标互补的探针中的50%与靶序列杂交(由于靶序列过量存在,因此在Tm下,平衡时,50%的探针被占据)。严紧杂交条件是下述条件,其中盐浓度低于约1.0M钠离子,通常为约0.01至1.0M钠离子浓度(或其它盐)、Ph7.0至8.3、温度对于短探针(例如,
10至50个核苷酸)为至少约30°C,对于长探针(例如,大于50个核苷酸)为至少约60°C。还可以通过添加去稳定剂(如甲酰胺)来实现严紧杂交条件。对于选择性或特异性杂交,阳性信
号是背景的至少2倍,任选地为背景杂交的10倍。示例性的严紧杂交条件可以如下:50%甲酰胺、5×SSC和1%SDS,于42°C孵育,或者5×SSC、1%SDS,于65°C孵育,在65°C下、0.2×SSC和
0.1%SDS中洗涤。
[0089] 如果核酸编码的多肽基本上相同,则在严紧杂交条件不彼此杂交的这些核酸仍是基本上相同的。例如,当利用遗传密码允许的最大密码子 简并性产生一个核酸拷贝时,就会发生这种情况。在这种情况下,核酸通常在中等严紧的杂交条件下杂交。示例性的“中等严紧的杂交条件”包括在37°C下在40%甲酰胺、1M NaCl、1%SDS的缓冲液中杂交,以及在45°C下在1×SSC中洗涤。阳性杂交是背景的至少两倍。本领域技术人员容易意识到,可以利用其它杂交和洗涤条件来提供相似严紧度的条件。
[0090] 术语“分离的”、“纯化的”或“生物学纯的”指基本上或实质上不含在材料天然状态下通常伴随其的成分的材料。通常利用分析化学技术(如聚丙烯酰胺凝胶电泳或高效液相色谱)来确定纯度和同质性。作为制剂中的主要种类存在的蛋白是基本上纯化的。术语“纯化的”表示在电泳凝胶中基本上产生一个条带的核酸或蛋白。具体来说,其表示核酸或蛋白是至少85%纯的、更优选至少95%纯的,最优选至少99%纯的。
[0091] 当涉及核酸的部分时,术语“异源的”表示核酸包含两种或更多种在自然界中没有发现彼此有相同关系的子序列。例如,核酸通常是通过重组产生的,具有来自不相关的基因的两条或更多条序列,这些序列被排列从而产生新的功能性核酸,例如,来自一种来源的启动子和来自另一来源的编码区。相似地,异源蛋白表示蛋白包含两种或更多种在自然界中没有发现彼此有相同关系的子序列(例如,融合蛋白)。
[0092] “表达载体”是利用一系列允许具体核酸在宿主细胞中转录的指定核酸元件,通过重组或合成方式产生的核酸构建体。表达载体可以是质粒、病毒或核酸片段的一部分。通常,表达载体包括与启动子可操作地连接的待转录的核酸。
[0093] 术语“多肽”、“肽”和“蛋白”在本文可交换使用,是指氨基酸残基的聚合物。该术语适用于一个或多个氨基酸残基是对应的天然存在的氨基酸的人工化学类似物的氨基酸聚合物,也适用于天然存在的氨基酸聚合物和非天然存在的氨基酸聚合物。
[0094] 术语“氨基酸”指天然存在的和合成的氨基酸,以及与天然存在的氨基酸以相似的方式发挥作用的氨基酸类似物和氨基酸模拟物。天然存在的氨基酸是由遗传密码编码的氨基酸以及随后经修饰的氨基酸(例如,羟脯氨酸、α-羧基谷氨酸和O-磷酸丝氨酸)。“氨基酸类似物”指与天然存在 的氨基酸具有相同的基本化学结构(即,与氢相连的α、羧基、氨基和R基)的化合物,例如,高丝氨酸、正亮氨酸、蛋氨酸亚砜、蛋氨酸甲基锍。这种类似物具有修饰的R基(例如,正亮氨酸)或修饰的肽主链,但保留与天然存在的氨基酸相同的基本化学结构。“氨基酸模拟物”指具有不同于氨基酸的一般化学结构的结构,但与天然存在的氨基酸以相似的方式发挥作用的化合物。
[0095] 在本文中,氨基酸可以通过其公知的三字母符号或IUPAC-IUB生化命名委员会(Biochemical Nomenclature Commission)推荐的单字母符号来表示。同样,核苷酸可以通过其普遍接受的单字母密码来表示。
[0096] “保守型修饰的变体”适用于氨基酸和核酸序列。就具体的核酸序列而言,保守型修饰的变体指编码相同的或基本相同的氨基酸序列的那些核酸,或者如果核酸不编码氨基酸序列,保守型修饰的变体指基本相同的序列。由于遗传密码的简并性,大量功能相同的核酸编码任一给定的蛋白。例如,密码子GCA、GCC、GCG和GCU都编码丙氨酸。因而,在由密码子指定为丙氨酸的每一位置,密码子可以被改变成所述的任一对应密码子,而不会改变所编
码的多肽。这类核酸变异是“沉默变异”,其是一类保守型修饰的变异。本文中,编码多肽的每一核酸序列还描述了该核酸的每一种可能的沉默变异。本领域技术人员应当意识到,核
酸中的每一密码子(除了AUG以及TGG,其中AUG通常是蛋氨酸的唯一密码子,TGG通常是色氨酸的唯一密码子)都能被修饰,而产生功能相同的分子。因此,编码多肽的核酸的每一沉默变异都暗含在每一所描述的序列中。
[0097] 就氨基酸序列而言,本领域技术人员应当意识到,对于改变、添加或缺失所编码的序列中的单个氨基酸或小比例氨基酸的对核酸、肽、多肽或蛋白序列的取代、缺失或添加,如果这些改变导致氨基酸被化学上相似的氨基酸取代,则认为是“保守型修饰的变体”。提供功能上相似的氨基酸的保守型取代表是本领域内公知的。这类保守型修饰的变体是除本发明的多态变体、种间同系物和等位基因之外的,但并不排除它们。
[0098] 以下八组每组均含有彼此为保守型取代的氨基酸:
[0099] 1)丙氨酸(A)、甘氨酸(G);
[0100] 2)天冬氨酸(D)、谷氨酸(E);
[0101] 3)天冬酰胺(N)、谷氨酰胺(Q);
[0102] 4)精氨酸(I)、赖氨酸(K);
[0103] 5)异亮氨酸(I)、亮氨酸(L)、蛋氨酸(M)、缬氨酸(V);
[0104] 6)苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W);
[0105] 7)丝氨酸(S)、苏氨酸(T);以及
[0106] 8)半胱氨酸(C)、蛋氨酸(M)
[0107] (参见例如,Creighton、Proteins(1984))。
[0108] 对于两条或更多条核酸或多肽序列,术语“一致的”或“一致性”百分比是指,当利用以下序列比较算法中的一种或通过手动比对和目测检查,在比较窗或指定区域时上进行最大对应的比较和比对的测量时,相同的或具有指定百分比的相同氨基酸残基或核苷酸
(即在缺血相关基因(例如,表7A、7B、13A、13B、14和15中所示的基因)的指定区域上具有60%一致性,优选65%、70%、75%、80%、85%、90%或95%一致性)的两条或更多条序列或子序列。这类序列被称为“基本上一致的”。该定义还指测试序列的互补体。优选地,一致性存在于长度为至少约25个氨基酸或核苷酸的区域上,或更优选在长度为50-100个氨基酸或核苷酸的区域
上。
[0109] 为了序列比较,通常将一条序列用作参照序列,将测试序列与其比较。当利用序列比较算法时,将测试序列和参照序列输入计算机,如果需要的话,指定子序列坐标,并指定序列算法程序参数。可以使用默认程序参数或可以指定备选参数。随后,序列比较算法基于程序参数计算测试序列相对于参照序列的序列一致性百分比。对于核酸和蛋白与缺血相关核酸和蛋白的序列比较,使用下文所述的BLAST和BLAST2.0算法以及默认参数。
[0110] 本文使用的“比较窗”包括具有选自20至600,通常为约50至约200,更通常为约100至约150中任一连续位置数的区段,其中在两条序列进行最佳比对之后,序列可以与相同连续位置数的参照序列进行比较。用于比较的序列比对方法是本领域内公知的。可以进行用于比较的最佳序列比对,例如,通过Smith&Waterman,Adv.Appl.Math.2:482(1981)的局部
同源性算法、通过Needleman&Wunsch,J.Mol.Biol.48:443(1970)的同 源性比对算法、通过Pearson&Lipman,Proc.Nat’l.Acad.Sci.USA85:2444(1988)的相似性搜索方法、通过这些
算法的计算机化执行(Wisconsin Genetics Software Package,Genetics Computer 
Group,575Science Dr.,Madison,WI中的GAP、BESTFIT、FASTA和TFASTA)或通过手工比对和目测检查(参见例如,Current Protocols in Molecular Biology(Ausubel et al.,
eds.1995增补))。
[0111] 适于确定序列一致性和序列相似性百分比的算法的优选实例是BLAST和BLAST2.0算法,其分别描述于Altschul et al.,Nuc.Acids Res.25:3389-3402(1977)和Altschulet al.,J.Mol.Biol.215:403-410(1990)中。利用本文描述的参数,使用BLAST和BLAST2.0确定本发明的核酸和蛋白的序列一致性百分比。进行BLAST分析的软件可通过国家生物信息中
心(NationalCenter for Biotechnology Information)(http://
www.ncbi.nlm.nih.gov/)公开获得。该算法包括首先通过鉴定查询序列中长度为W的短字
符鉴定高评分序列对(HSP),当与数据库序列中相同长度的字符比对时,所述高评分序列对匹配或满足一些正值的阈值评分T。T被称为邻字符评分阈值(Altschul et al.,同上)。这
些初始的邻字符命中作为开始搜索以找到包含它们的更长HSP的种子。所述字符命中沿每
条序列双向延长,只要累积比对评分能够增加。对于核苷酸序列,利用参数M(对一对匹配残基的奖励分;总是>0)和N(对错配残基的罚分;总是<0)计算累积评分。对于氨基酸序列,使用评分矩阵来计算累积分。当出现以下情况时,在每个方向的字符命中延伸停止:累积比对评分从其最大实现值下降量X;由于一个或多个负评分残基比对的累积使累积分达到零或
以下;或达到任一序列的末端。BLAST算法参数W、T和X决定了比对的灵敏性和速度。BLASTN程序(对于核苷酸序列)使用以下作为默认值:字长(W)为11,期望值(E)为10,M=5,N=-4和两条链的比较。对于氨基酸序列,BLASTP程序使用以下作为默认值:字长为3,期望值(E)为10,BLOSUM62评分矩阵(参见Henikoff&Henikoff,Proc.Natl.Acad.Sci.USA89:10915(1989)),
比对(B)为50,期望值(E)为10,M=5,N=-4和两条链的比较。
[0112] BLAST算法还进行两条序列间相似性的统计学分析(参见例如, Karlin&Altschul,Proc.Nat’l.Acad.Sci.USA90:5873-5787(1993))。BLAST算法提供的一种相似性测量是最小总和概率(P(N)),其提供了两条核苷酸或氨基酸序列之间偶然发生匹配的概率
指征。例如,如果在测试核酸与参照核酸的比较中、最小总和概率小于约0.2,更优选小于约
0.01,且最优选小于约0.001,则认为核酸与参照序列相似。
[0113] 两条核酸序列或多肽基本上一致的指征是由第一核酸编码的多肽能与针对第二核酸编码的多肽所产生的抗体发生免疫交叉反应,如下文描述。因而,例如,如果两条肽的区别仅在于保守型取代,则多肽通常与第二多肽基本上相同。两条核酸序列基本上一致的
另一指征是两个分子或其互补物能够在严紧杂交条件下彼此杂交,如下文描述。两条核酸
序列基本上一致的另一指征是能使用相同引物来扩增序列。
[0114] 短语“与…..选择性(或特异性)杂交”指在严紧杂交条件下,分子仅与复杂混合物(例如,总细胞DNA或RNA,或文库DNA或RNA)中存在的特定核苷酸序列结合、形成双螺旋或杂交。
[0115] “宿主细胞”表示含有表达载体并支持该表达载体的复制或表达的细胞。宿主细胞可以是例如,原核细胞(例如大肠杆菌)或真核细胞(例如酵母细胞或哺乳动物细胞,例如CHO细胞)。
[0116] 表达或活性的“抑制剂”、“活化剂”和“调节剂”分别用来指利用表达或活性的体外和体内测定鉴定出的抑制性分子、活化分子或调解分子,例如,配体、激动剂、拮抗剂及以上的同系物和模拟物。术语“调节剂”包括抑制剂和活化剂。抑制剂是,例如,能抑制本发明多肽或多核苷酸的表达,或结合、部分地或全部地阻断刺激或酶活性,使本发明多肽或多核苷酸的活性降低、阻止、延迟活化、失活、去敏感化或下调的试剂,例如,拮抗剂。活化剂是,例如,能诱导或活化本发明多肽或多核苷酸的表达,或结合、刺激、增加、开放、活化、促进、增强活化或酶活性,敏感化或上调本发明多肽或多核苷酸的活性的试剂,例如激动剂。调节剂包括天然存在的和合成的配体、拮抗剂、激动剂、小化学分子等。鉴定抑制剂和活化剂的测定包括,例如,在存在或不存在本发明多肽或多核苷酸的情况下,向细胞施加推定的调节剂化合物,随后测定对本发明多肽或多核苷酸活性的功能影响。将用可能的活化剂、抑制剂或调节剂 处理的含有本发明多肽或多核苷酸的样本或测定与没有所述抑制剂、活化剂或调节剂的对照样本进行比较,以检测影响的程度。将对照样本(未用调节剂处理)指定为100%
的相对活性值。当本发明多肽或多核苷酸的活性值相对于对照为约80%,任选地为50%或25-
1%时,实现了抑制。当本发明多肽或多核苷酸的活性值相对于对照为约110%、任选地为
150%、任选地为200-500%或1000-3000%或更高时,实现了活化。
[0117] 本文使用的术语“测试化合物”或“候选药物”或“调节剂”或语法等同词描述任何分子,天然存在的或合成的,例如,蛋白、寡肽(例如,长度为约5至约25个氨基酸,优选长度为约10至20或12至18个氨基酸,优选长度为12、15或18个氨基酸)、小有机分子、多糖、脂质、脂肪酸、多核苷酸、RNAi、寡核苷酸等。测试化合物可以为测试化合物文库的形式,诸如提供了足够多样性范围的组合或随机文库。测试化合物任选地与融合伴侣连接,所述融合伴侣例如靶向化合物、救援化合物、二聚化合物、稳定化化合物、可寻址化合物(addressable compound)及其它功能性部分。通常,通过以下来产生具有有用特性的新化学实体:鉴定具有一些期望特性或活性(例如,抑制活性)的测试化合物(称为“先驱化合物”),产生先驱化合物的变体,以及评价那些变体化合物的特性或活性。通常,对这类分析利用高通量筛选
(HTS)方法。
[0118] “小有机分子”指天然存在的或合成的、具有大于约50道尔顿且小于约2500道尔顿,优选小于约2000道尔顿,优选约100至约1000道尔顿,更优选约200至约500道尔顿的分子量的有机分子。
[0119] 附图简要说明
[0120] 图1.利用来自Tang et al,2006的IS的29个预测基因组,对IS和健康对照的PAM预测准确性。利用来自Tang et al,2006的29个IS预测基因,在来自本研究的第一随机半数IS(n=35,100份样本)和健康(n=19)个体的表达值上训练微阵列预测分析(PAM)算法(K-NN,邻近点的数量n=10)。然后,这29个IS预测基因被用于预测另外半数样本的类别(IS n=35,99份样本;以及健康者n=19,检验集)并计算预测准确性。X轴代表患者样本号,Y轴代表诊断的检验集概率(test set probability)。如果 预测的分类以大于0.5的概率与已知分类不匹
配,则认为样本被错误分类。
[0121] 图2A-C.本研究中IS预测基因的PAM预测准确性。利用PAM的检验集(Test Set)的预测准确性。微阵列的预测分析(PAM)用于进行预测(K-NN,邻近点n=10;阈值=0)。对于图A、B和C,X轴代表患者样本号,Y轴代表检验集概率。如果样本的正确分类的预测概率小于0.5,则认为样本被错误分类。训练集中的个体数是:3h IS n=34;24h IS n=33;SAVVY血管对照n=26;以及MI n=9。检验集中的个体数是:3h IS n=33;24h IS n=33;SAVVY n=26;以及MI n=
8。A.3h IS预测基因。将3h IS的60个探针组预测基因(由3h IS样本与来自训练集的健康
者、MI和SAVVY样本的比较组合而来)加入PAM,通过计算它们在给定类别中的概率来预测检验集个体样本的类别。B.24h IS预测基因。将24h IS的46个探针组预测基因(由24h IS样本与来自训练集的健康者、MI和SAVVY样本比较组合而来)加入PAM,通过计算它们在给定类别中的概率来预测检验集个体样本的类别。C.组合的3h和24h IS预测基因。将3h IS和24h IS的97个探针组预测基因(由3h IS和24h IS样本与来自训练集的健康者、MI和SAVVY样本比
较组合而来)加入PAM,通过计算它们在给定类别中的概率来预测检验集个体样本的类别。
[0122] 图3.用于鉴定IS预测基因的分析工作流程图
[0123] 图4.利用来自Tang et al,2006的IS的29个探针组预测基因,对IS和健康者的PAM预测准确性。来自Tang et al,2006的29个IS预测基因的全部IS(n=70,199份样本)和健康
者(n=38)的内参基因标准化的表达值被用作PAM的输入值。K-NN(邻近点的数量n=10),阈值=0(包括全部29个预测基因,10倍交叉验证用于评价预测准确性。X轴代表样本号,Y轴代表交叉验证的诊断概率。如果预测的分类以大于0.5的概率与已知分类不匹配,则认为样本被错误分类。
[0124] 图5.PAM3h相对于健康检验集+检验集的混淆矩阵(confusion matrix)
[0125] 图6.PAM3h相对于MI CV+CV的混淆矩阵
[0126] 图7.PAM3h相对于SAVVY检验集+检验集的混淆矩阵
[0127] 图8.PAM24h相对于健康检验集+检验集的混淆矩阵
[0128] 图9.PAM24h相对于MI CV+CV的混淆矩阵
[0129] 图10.PAM24h相对于SAVVY检验集+检验集的混淆矩阵
[0130] 图11A-C.组合的3h、24h和3+24h IS预测基因上的PAM。CV概率。图11A.3h IS预测基因。将来自对3h IS相对于全部对照(健康者、MI和SAVVY)上的组合分析的组合的60个探
针组预测基因输入PAM。图11B.24h IS预测基因。将来自对24h IS相对于全部对照(健康者、MI和SAVVY)上的组合分析的组合的46个探针组预测基因输入PAM。图11C.组合的3h和24h 
IS预测基因。将来自对3h IS和24h IS相对于全部对照(健康者、MI和SAVVY)上的组合分析
的组合的97个探针组预测基因输入PAM。
[0131] 图12A-B A.发现能将心源性卒中与大血管性卒中区别开的40个基因的分层聚类图。基因显示在Y轴上,个体显示在X轴上。红色表示高水平的基因表达,蓝色表示低水平的基因表达。一组基因在心源性卒中中具有高表达水平,而在大血管性卒中中具有低表达水
平。另一组基因在心源性卒中中具有低表达水平,而在大血管性卒中中具有高表达水平。心源性组似乎聚在两个亚组中。B.发现能将心源性卒中与大血管性卒中区别开的40个基因的
主成分分析(PCA)。每个球体代表一个个体。球体附近的椭圆体代表从组平均值的两个标准差。
[0132] 图13.发现能将心源性卒中与大血管性卒中区别开的共40个基因的留一交叉验证预测分析。预测的诊断的概率显示在Y轴上。实际的诊断显示在X轴上。对于69份样本中的69份,心源性卒中个体被预测为患有心源性卒中(100%正确预测)。对于30份样本中的29份,大血管性卒中个体被预测为患有大血管性卒中(96.7%正确预测)。如果预测的分类以大于0.5
的概率与已知分类不匹配,则认为样本错误分类。
[0133] 图14.从心源性卒中与对照的比较以及大血管性卒中与对照的比较鉴定出的基因的文氏图(p<0.005、FC>|1.2|)。发现共有503个基因是心源性卒中特有的。554个基因是大血管性卒中特有的,228个基因是卒中亚型共有的。这些基因列表用于表9-11中所示的功能分析。
[0134] 图15A-B.A.发现能将由心房纤颤引起的心源性卒中与非心房纤颤 致因区别开的37个基因的分层聚类分析。基因显示在Y轴上,个体显示在X轴上。红色表示高水平的基因表达,蓝色表示低水平的基因表达。可以观察到个体通过诊断聚簇。一组基因在由心房纤颤引起的心源性卒中中具有高表达水平而在非心房纤颤致因中具有低表达水平。一组基因在由
心房纤颤引起的心源性卒中中具有低表达水平而在非心房纤颤致因中具有高表达水平。B.
发现能将由心房纤颤引起的心源性卒中与非心房纤颤致因区别开的37个基因的主成分分
析。每个球体代表一个个体。球体附近的椭圆体代表从组平均值的两个标准差。
[0135] 图16.发现能将由心房纤颤引起的心源性卒中与非心房纤颤致因区别开的37个基因的留一交叉验证预测分析。预测的诊断的概率显示在Y轴上。实际的诊断显示在X轴上。对于30份样本中的30份,由心房纤颤引起的心源性卒中个体被预测为具有作为卒中致因的心
房纤颤(100%正确预测)。在24份样本中的22份中,由非心房纤颤致因引起的心源性卒中个
体被正确预测(91.7%正确预测)。如果预测的分类以大于0.5的概率与已知分类不匹配,则
认为样本错误分类。
[0136] 图17.发现能在卒中发作后3小时、5小时和24小时将心源性卒中与大血管性卒中区别开的40个基因的分层聚类图和PCA。分层聚类表明,在缺血性卒中发作后3小时、5小时和24小时,心源性卒中与大血管性卒中通过40个基因相区别。这通过PCA确认,所述PCA表明心源性卒中个体与大血管性卒中相差超过两个标准差。
[0137] 图18.发现能在卒中发作后3小时、5小时和24小时能将由心房纤颤引起的心源性卒中与非心房纤颤致因区别开的37个基因的分层聚类图和PCA。分层聚类表明,在缺血性卒中发作后3小时、5小时和24小时,所述37个基因能区别由心房纤颤致因和非心房纤颤致因
引起的心源性卒中。这通过PCA分析确认,所述PCA分析表明由心房纤颤引起的心源性卒中
个体与非心房纤颤致因相差超过两个标准差。
[0138] 发明详细描述
[0139] 1.引言
[0140] 本发明提供了用于诊断患者卒中发生和风险的生物标志物,以及用 于测定诊断为经历卒中或具有经历卒中倾向的个体中卒中致因的生物标志物。例如,血液、血清或血浆样本中组合的生物标志物表达水平的评价允许快速诊断经历疑似卒中事件或经历指示卒
中风险的症状的患者中卒中的发生和致因。通过同时确定是否发生卒中以及卒中的根本致
因,尽可能快地给予患者合适的医学治疗或干预方案。特别可取的是,能够在疑似卒中事件的3小时内诊断和治疗患者。本发明例如利用有效的微阵列技术使这成为可能。
[0141] 本文描述的用于诊断卒中发生和风险的生物标志物能够在,例如,单个微阵列上或单个测定步骤中一起使用。生物标志物还能独立地用于诊断卒中的发生,例如,与用于确定卒中致因的其他方法相结合,以及独立地用于确定卒中致因,例如,与用于确定是否发生卒中的其他方法相结合。
[0142] 2.能够从本方法受益的患者
[0143] 从本方法受益的个体可以正表现出缺血性卒中的症状。在一些实施方案中,个体已经历缺血事件(例如,TIA、缺血性卒中、心肌梗塞、周围血管性疾病或静脉血栓栓塞)。可选地,个体可以疑似经历缺血事件。在一些实施方案中,个体还未经历脑出血或出血性卒中和/或没有发生脑出血或出血性卒中的风险。在一些实施方案中,个体已被诊断为未经历脑出血或出血性卒中和/或没有发生脑出血或出血性卒中的风险。
[0144] 在一些实施方案中,在疑似缺血事件的3小时内测定生物标志物组的表达水平。在一些实施方案中,在疑似缺血事件之后3小时或更长时间测定生物标志物组的表达水平。在一些实施方案中,在疑似缺血事件的6、12、18、24、36、48小时内测定生物标志物组的表达水平。
[0145] 在一些情况下,个体没有症状,但可以具有经历缺血性卒中的风险或倾向,例如基于遗传学、相关的疾病状态、环境或生活方式。在一些实施方案中,患者具有一种或多种血管风险因子,例如,高血压、糖尿病、高脂血症或吸烟。
[0146] 3.可用于预测或诊断卒中的生物标志物
[0147] 可用于预测、诊断或确认缺血性卒中发生的生物标志物列举在表7A和7B中。可以测定表7A中多种生物标志物的表达水平用于预测、诊断或确认卒中的发生,以及联合本领
域内已知的用于预测、诊断或确认卒中发生的其它生物标志物,本领域内已知的用于诊断
卒中的其它方法,本文所描述的和本领域内已知的可用于确定卒中致因的生物标志物(例
如,本文所描述的)和/或本领域内已知的用于确定卒中致因的方法。
[0148] 表7A中多种生物标志物的表达水平的测定可以用于预测、诊断或确认卒中的发生,也可以独立进行,例如用来诊断卒中发生或确定患者可能患卒中的风险,不考虑致因。
[0149] 在一些实施方案中,测定来自表7A(和表7B)中至少约3、5、10、15、20、25、30、40、50、60或更多种生物标志物的表达水平。在一些实施方案中,测定表7A中多种生物标志物和表7B中多种生物标志物的表达水平。
[0150] 在一些实施方案中,在疑似缺血事件的3小时内测定指示卒中发生的生物标志物的表达水平。在另外的健康个体(即未患心肌梗塞、无血管风险因子)中,表7A中选自以下的一种或多种或全部缺血性卒中相关生物标志物的表达水平的升高指示所述患者罹患缺血
性卒中或有发展为缺血性卒中的风险:FAT3、GADL1、CXADR、RNF141、CLEC4E、TIMP2、
ANKRD28、TIMM8A、PTPRD、CCRL1、FCRL4、DLX6、GABRB2、GYPA、PHTF1、CKLF、CKLF、RRAGD、CLEC4E、CKLF、FGD4、CPEB2、LOC100290882、UBXN2B、ENTPD1、BST1、LTB4R、F5、IFRD1、KIAA0319、CHMP1B、MCTP1、VNN3、AMN1、LAMP2、FCHO2、ZNF608、REM2、QKI、RBM25、FAR2、ST3GAL6、HNRNPH2、GAB1、UBR5、VAPA、MCTP1和SH3GL3。在另外的健康个体(即未患心肌梗塞、无血管风险因子)中,表7A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表
达水平的降低指示所述患者罹患缺血性卒中或有发展为缺血性卒中的风险:PGM5、
CCDC144C///LOC100134159、LECT2、SHOX、TBX5、SPTLC3、SNIP、RBMS3、P704P、THSD4、SNRPN、GLYATL1、DKRZP434L187、OVOL2、SPIB、BXDC5、UNC5B、ASTN2、FLJ35934、CCDC144A、ALDOAP2、LDB3、LOC729222///PPFIBP1、HNRNPUL2、 ELAVL2、PRTG、FOXA2、SCD5、LOC283027、
LOC344595、RPL22、LOC100129488和RPL22。
[0151] 在多个实施方案中,在表现出心肌梗塞的个体的疑似缺血事件的3小时内,表7A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的升高指示所述个体
罹患缺血性卒中或有发展为缺血性卒中的风险:CLEC4E、TIMP2、FGD4、CPEB2、LTB4R和VNN3。
在多个实施方案中,在表现出心肌梗塞的个体的疑似缺血事件的3小时内,表7A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的降低指示所述个体罹患缺血
性卒中或有发展为缺血性卒中的风险:PGM5、CCDC144C///LOC100134159、LECT2、SHOX、
TBX5、SPTLC3、SNIP、RBMS3、P704P、THSD4、FAT3、SNRPN、GLYATL1、GADL1、CXADR、OVOL2、RNF141、SPIB、BXDC5、UNC5B、ASTN2、FLJ35934、ANKRD28、CCDC144A、TIMM8A、ALDOAP2、LDB3、PTPRD、LOC729222///PPFIBP1、CCRL1、HNRNPUL2、FCRL4、ELAVL2、PRTG、DLX6、FOXA2、SCD5、GABRB2、GYPA、PHTF1、CKLF、CKLF、RRAGD、CKLF、LOC100290882、UBXN2B、ENTPD1、BST1、F5、IFRD1、KIAA0319、CHMP1B、MCTP1、AMN1、LAMP2、FCHO2、ZNF608、REM2、QKI、RBM25、FAR2、ST3GAL6、HNRNPH2、GAB1、UBR5、VAPA、LOC283027、LOC344595、RPL22、LOC100129488、RPL22、MCTP1和SH3GL3。
[0152] 在多个实施方案中,在表现出一种或多种血管风险因子(例如,高血压、糖尿病、高脂血症或吸烟)的个体的疑似缺血事件的3小时内,表7A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的升高指示所述个体罹患缺血性卒中或有发展为缺血
性卒中的风险:RNF141、CLEC4E、TIMP2、PHTF1、CKLF、CKLF、RRAGD、CLEC4E、CKLF、FGD4、CPEB2、LOC100290882、UBXN2B、ENTPD1、BST1、LTB4R、F5、IFRD1、KIAA0319、CHMP1B、MCTP1、VNN3、AMN1、LAMP2、FCHO2、ZNF608、REM2、QKI、RBM25、FAR2、ST3GAL6、HNRNPH2、GAB1、UBR5、VAPA和MCTP1。在多个实施方案中,在表现出一种或多种血管风险因子的个体的疑似缺血事件的3小时内,表 7A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平
的降低指示所述个体罹患缺血性卒中或有发展为缺血性卒中的风险:PGM5、CCDC144C///
LOC100134159、LECT2、SHOX、TBX5、SPTLC3、SNIP、RBMS3、P704P、THSD4、FAT3、SNRPN、GLYATL1、GADL1、CXADR、OVOL2、SPIB、BXDC5、UNC5B、ASTN2、FLJ35934、ANKRD28、CCDC144A、TIMM8A、ALDOAP2、LDB3、PTPRD、LOC729222///PPFIBP1、CCRL1、HNRNPUL2、FCRL4、ELAVL2、PRTG、DLX6、FOXA2、SCD5、GABRB2、GYPA、LOC283027、LOC344595、RPL22、LOC100129488、RPL22和SH3GL3。
[0153] 在一些实施方案中,在疑似缺血事件之后3小时或更长时间测定指示卒中发生的生物标志物的表达水平。在另外的健康个体(即未患心肌梗塞、无血管风险因子)中,表7A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的升高指示所述患者
罹患缺血性卒中或有发展为缺血性卒中的风险:PGM5、CCDC144C///LOC100134159、LECT2、SHOX、TBX5、SNIP、RBMS3、P704P、THSD4、FAT3、SNRPN、GLYATL1、GADL1、CXADR、OVOL2、RNF141、CLEC4E、BXDC5、UNC5B、TIMP2、ASTN2、FLJ35934、ANKRD28、CCDC144A、TIMM8A、ALDOAP2、LDB3、PTPRD、LOC729222///PPFIBP1、CCRL1、FCRL4、ELAVL2、PRTG、DLX6、SCD5、GABRB2、GYPA、PHTF1、CKLF、CKLF、RRAGD、CLEC4E、CKLF、FGD4、CPEB2、LOC100290882、UBXN2B、ENTPD1、BST1、LTB4R、F5、IFRD1、KIAA0319、CHMP1B、MCTP1、VNN3、AMN1、LAMP2、FCHO2、ZNF608、REM2、QKI、RBM25、FAR2、ST3GAL6、HNRNPH2、GAB1、UBR5、VAPA、LOC283027、LOC344595、RPL22、
LOC100129488和MCTP1。在另外的健康个体(即未患心肌梗塞、无血管风险因子)中,表7A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的降低指示所述患者
罹患缺血性卒中或有发展为缺血性卒中的风险:SPTLC3、DKRZP434L187、SPIB、HNRNPUL2、FOXA2、RPL22和SH3GL3。
[0154] 在多个实施方案中,在表现出心肌梗塞的个体的疑似缺血事件之后3小时或更长时间,表7A中选自以下的一种或多种或全部缺血性卒中相关 生物标志物表达水平的升高
指示所述个体罹患缺血性卒中或有发展为缺血性卒中的风险:RNF141、CLEC4E、TIMP2、
HNRNPUL2、PHTF1、CKLF、CKLF、RRAGD、CLEC4E、CKLF、FGD4、CPEB2、UBXN2B、BST1、LTB4R、F5、IFRD1、KIAA0319、MCTP1、VNN3、AMN1、LAMP2、ZNF608、FAR2、GAB1、VAPA和MCTP1。在多个实施方案中,在表现出心肌梗塞的个体的疑似缺血事件之后3小时或更长时间,表7A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的降低指示所述个体罹患缺血
性卒中或有发展为缺血性卒中的风险:PGM5、CCDC144C///LOC100134159、LECT2、SHOX、
TBX5、SPTLC3、SNIP、RBMS3、P704P、THSD4、FAT3、SNRPN、GLYATL1、GADL1、CXADR、OVOL2、SPIB、BXDC5、UNC5B、ASTN2、FLJ35934、ANKRD28、CCDC144A、TIMM8A、ALDOAP2、LDB3、PTPRD、LOC729222///PPFIBP1、CCRL1、FCRL4、ELAVL2、PRTG、DLX6、FOXA2、SCD5、GABRB2、GYPA、LOC100290882、ENTPD1、CHMP1B、FCHO2、LOC283027、REM2、QKI、RBM25、ST3GAL6、HNRNPH2、UBR5、LOC344595、RPL22、LOC100129488、RPL22和SH3GL3。
[0155] 在多个实施方案中,在表现出一种或多种血管风险因子的个体的疑似缺血事件之后3小时或更长时间,表7A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表
达水平的升高指示所述个体罹患缺血性卒中或有发展为缺血性卒中的风险:RNF141、
CLEC4E、TIMP2、PHTF1、CKLF、CKLF、RRAGD、CLEC4E、CKLF、FGD4、CPEB2、LOC100290882、UBXN2B、ENTPD1、BST1、LTB4R、F5、IFRD1、KIAA0319、CHMP1B、MCTP1、VNN3、AMN1、LAMP2、FCHO2、ZNF608、REM2、QKI、RBM25、FAR2、ST3GAL6、HNRNPH2、GAB1、UBR5、VAPA和MCTP1。在多个实施方案中,在表现出一种或多种血管风险因子的个体的疑似缺血事件之后3小时或更长
时间,表7A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的降低指
示所述个体罹患缺血性卒中或有发展为缺血性卒中的风险:PGM5、CCDC144C///
LOC100134159、LECT2、SHOX、TBX5、SPTLC3、SNIP、RBMS3、P704P、THSD4、FAT3、SNRPN、GLYATL1、GADL1、CXADR、OVOL2、SPIB、BXDC5、UNC5B、 ASTN2、FLJ35934、ANKRD28、CCDC144A、TIMM8A、ALDOAP2、LDB3、PTPRD、LOC729222///PPFIBP1、CCRL1、HNRNPUL2、FCRL4、ELAVL2、PRTG、DLX6、FOXA2、SCD5、GABRB2、GYPA、LOC283027、LOC344595、RPL22、LOC100129488、RPL22和SH3GL3。
[0156] 与多种稳定表达的内源性参照生物标志物(例如,表16中所示的生物标志物)的表达水平相比,表7A(和表7B)的多种生物标志物过表达或低表达至少约1.2倍、1.3倍、1.4倍、
1.5倍、1.6倍、1.7倍、1.8倍、1.9倍、2.0倍、2.1倍、2.2倍、2.3倍、2.4倍、2.5倍、2.6倍、2.7倍、2.8倍、2.9倍、3.0倍、3.1倍、3.2倍、3.3倍、3.4倍或3.5倍或更多倍指示个体已经历缺血性卒中或有经历缺血性卒中的风险。与未经历血管事件的个体或个体群体中相同生物标志
物的表达水平相比,表7A(和表7B)的多种生物标志物过表达或低表达至少约1.2倍、1.3倍、
1.4倍、1.5倍、1.6倍、1.7倍、1.8倍、1.9倍、2.0倍、2.1倍、2.2倍、2.3倍、2.4倍、2.5倍、2.6倍、2.7倍、2.8倍、2.9倍、3.0倍、3.1倍、3.2倍、3.3倍、3.4倍或3.5倍或更多倍指示个体已经历缺血性卒中或有经历缺血性卒中的风险。
[0157] 4.可用于诊断卒中致因的生物标志物
[0158] 可用于确定和诊断卒中致因的生物标志物列举在表13A、13B、14和15中。可以独立地测定表13A、13B、14和15中多种生物标志物表达水平用于确定卒中致因,以及联合本文所描述的和本领域内已知的用于预测、诊断或确认卒中发生的生物标志物、本领域内已知的用于诊断卒中的其它方法、本领域内已知的可用于确定卒中致因的其它生物标志物(例如,本文所描述的)和/或本领域内已知的用于确定卒中致因的方法。卒中亚型的分类是本领域
内已知的,并且可参考例如,Amarenco,et al.,Cerebrovasc Dis(2009)27:493-501。
[0159] 表13A、14和15中多种生物标志物表达水平的测定可以用于确定卒中致因,还可以独立进行,例如,当已知发生了卒中或患者有经历缺血性卒中倾向时,用来诊断卒中致因。
[0160] 在一些实施方案中,独立地测定表13A(和表13B)的至少约3、5、 10、15、20、25、30、40、50、60或更多种生物标志物的表达水平。在一些实施方案中,独立地测定表14的至少约
3、5、10、15、20、25、30、40、50、60或更多种生物标志物的表达水平。在一些实施方案中,独立地测定表15的至少约3、5、10、15、20、25、30、40、50、60或更多种生物标志物的表达水平。在一些实施方案中,测定表13A中的多种多种生物标志物和表13B中的多种生物标志物的表达
水平。在一些实施方案中,测定表14中的多种生物标志物的表达水平。在一些实施方案中,测定表15中的多种生物标志物的表达水平。
[0161] 表13A和13B中的生物标志物可用于确定患者是否已经历心源性卒中(也称为心脏栓塞、心源性栓塞、栓塞性心脏病)或是否有经历心源性卒中的倾向。当血栓()从心脏离开,通过心血管系统移动,并留在脑中,首先中断血液供给,然后通常导致出血,此时发生心源性卒中。在一些实施方案中,表13A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的升高指示所述患者已经历心源性卒中或有经历心源性卒中的风险:
IRF6、ZNF254、GRM5、EXT2、AP3S2、PIK3C2B、ARHGEF5、COL13A1、PTPN20A///PTPN20B、LHFP、BANK1、HLA-DOA、EBF1、TMEM19、LHFP、FCRL1、OOEP和LRRC37A3。在一些实施方案中,表13A中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的降低指示所述患者
已经历心源性卒中或有经历心源性卒中的风险:LOC284751、CD46、ENPP2、C19orf28、TSKS、CHURC1、ADAMTSL4、FLJ40125、CLEC18A、ARHGEF12、C16orf68、TFDP1和GSTK1。
[0162] 与多种稳定表达的内源性参照生物标志物(例如,表16中所示的生物标志物)的表达水平相比,表13A(和表13B)的多种生物标志物过表达或低表达至少约1.2倍、1.3倍、1.4倍、1.5倍、1.6倍、1.7倍、1.8倍、1.9倍、2.0倍、2.1倍、2.2倍、2.3倍、2.4倍、2.5倍、2.6倍、
2.7倍、2.8倍、2.9倍、3.0倍、3.1倍、3.2倍、3.3倍、3.4倍或3.5倍或更多倍指示个体已经历心源性卒中或有经历心源性卒中的风险。与未经历血管事件的个体或个体群体中相同生物
标志物的表达水平相比,表13A(和表13B)的多种生物标志物过表达或低表达至少约1.2倍、
1.3倍、1.4倍、1.5倍、 1.6倍、1.7倍、1.8倍、1.9倍、2.0倍、2.1倍、2.2倍、2.3倍、2.4倍、2.5倍、2.6倍、2.7倍、2.8倍、2.9倍、3.0倍、3.1倍、3.2倍、3.3倍、3.4倍或3.5倍或更多倍指示个体已经历心源性卒中或有经历心源性卒中的风险。
[0163] 表14中的生物标志物可用于确定患者是否经历颈动脉狭窄或是否有经历颈动脉狭窄的倾向。颈动脉狭窄是颈动脉内表面(腔)变窄或缩窄,通常由动脉粥样硬化引起。斑块的炎症性形成能够使颈动脉变窄,并且可以是栓塞的来源。栓塞从斑块断裂并通过循环到
达脑中的血管而引起缺血,缺血可以是暂时性的(例如,短暂性缺血发作)或永久性的,这导致血栓栓塞性卒中(也称为动脉粥样硬化血栓形成、大动脉动脉粥样硬化、伴随狭窄的动脉粥样硬化)。在一些实施方案中,表14中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的升高指示所述患者已经历颈动脉狭窄或有颈动脉狭窄的风险:NT5E、
CLASP2、GRM5、PROCR、ARHGEF5、AKR1C3、COL13A1、LHFP、RNF7、CYTH3、EBF1、RANBP10、PRSS35、C12orf42和LOC100127980。在一些实施方案中,表14中选自以下的一种或多种或全部缺血
性卒中相关生物标志物表达水平的降低指示所述患者已经历颈动脉狭窄或有颈动脉狭窄
的风险:FLJ31945、LOC284751、LOC100271832、MTBP、ICAM4、SHOX2、DOPEY2、CMBL、
LOC146880、SLC20A1、SLC6A19、ARHGEF12、C16orf68、GIPC2和LOC100144603。
[0164] 与多种稳定表达的内源性参照生物标志物(例如,表16中所示的生物标志物)的表达水平相比,表14的多种生物标志物过表达或低表达至少约1.2倍、1.3倍、1.4倍、1.5倍、
1.6倍、1.7倍、1.8倍、1.9倍、2.0倍、2.1倍、2.2倍、2.3倍、2.4倍、2.5倍、2.6倍、2.7倍、2.8倍、2.9倍、3.0倍、3.1倍、3.2倍、3.3倍、3.4倍或3.5倍或更多倍指示个体已经历颈动脉狭窄或有经历颈动脉狭窄的风险。与未经历血管事件的个体或个体群体中相同生物标志物的表
达水平相比,表14的多种生物标志物过表达或低表达至少约1.2倍、1.3倍、1.4倍、1.5倍、
1.6倍、1.7倍、1.8倍、1.9倍、2.0倍、2.1倍、2.2倍、2.3倍、2.4倍、2.5倍、2.6倍、2.7倍、2.8倍、2.9倍、3.0倍、3.1倍、3.2倍、3.3倍、3.4倍或3.5倍或更多倍 指示个体已经历颈动脉狭窄或有经历颈动脉狭窄的风险。
[0165] 表15中的生物标志物可用于确定患者是否经历心房纤颤或是否有经历心房纤颤的倾向。心房纤颤(AF或A-fib)是最常见的心律失常,并且涉及心脏的两个上腔(心房)的纤颤(即颤动)而不是协调的收缩。在一些情况下,心源性卒中可以作为心房纤颤的结果发生。
心源性卒中可以是心房纤颤的下游结果,原因是纤颤心房中停滞的血液能够形成血栓,然
后血栓栓塞至脑循环,阻断动脉血流,并引起缺血性损伤。在一些实施方案中,表15中选自以下的一种或多种或全部缺血性卒中相关生物标志物表达水平的升高指示所述患者已经
历心房纤颤或有心房纤颤的风险:SMC1A、SNORA68、GRLF1、SDC4、HIPK2、LOC100129034、CMTM1和TTC7A。在一些实施方案中,表15中选自以下的一种或多种或全部缺血性卒中相关
生物标志物表达水平的降低指示所述患者已经历心房纤颤或有心房纤颤的风险:LRRC43、
MIF///SLC2A11、PER3、PPIE、COL13A1、DUSP16、LOC100129034、BRUNOL6、GPR176、C6orf164和MAP3K7IP1。
[0166] 与多种稳定表达的内源性参照生物标志物(例如,表16中所示的生物标志物)的表达水平相比,表15的多种生物标志物过表达或低表达至少约1.2倍、1.3倍、1.4倍、1.5倍、
1.6倍、1.7倍、1.8倍、1.9倍、2.0倍、2.1倍、2.2倍、2.3倍、2.4倍、2.5倍、2.6倍、2.7倍、2.8倍、2.9倍、3.0倍、3.1倍、3.2倍、3.3倍、3.4倍或3.5倍或更多倍指示个体已经历心房纤颤或有经历心房纤颤的风险。与未经历血管事件的个体或个体群体中相同生物标志物的表达水
平相比,表15的多种生物标志物过表达或低表达至少约1.2倍、1.3倍、1.4倍、1.5倍、1.6倍、
1.7倍、1.8倍、1.9倍、2.0倍、2.1倍、2.2倍、2.3倍、2.4倍、2.5倍、2.6倍、2.7倍、2.8倍、2.9倍、3.0倍、3.1倍、3.2倍、3.3倍、3.4倍或3.5倍或更多倍指示个体已经历心房纤颤或有经历心房纤颤的风险。
[0167] 5.与对照表达水平的比较
[0168] 将缺血性卒中相关生物标志物的表达与对照缺血性卒中的表达水平进行比较。如果合适的话,对照表达水平可以是另外的健康个体(例如,未经历TIA和/或没有经历TIA风
险的个体)中相同缺血性卒中相关生物 标志物的表达水平。在一些实施方案中,如本文所
述或本领域内已知的,对照表达水平是多种稳定表达的内源性参照生物标志物的表达水
平。在一些实施方案中,对照表达水平是,例如,基于另外的健康个体群体中生物标志物的表达水平,相同缺血性卒中相关生物标志物的预定阈值表达水平。在一些实施方案中,将缺血性卒中相关生物标志物和另外的健康个体中缺血性卒中相关生物标志物的表达水平相
对于例如多种稳定表达的内源性参照生物标志物的表达水平进行标准化,即,除以多种稳
定表达的内源性参照生物标志物的表达水平。
[0169] 在一些实施方案中,相对于另外的健康个体中相同缺血性卒中相关生物标志物的表达,确定缺血性卒中相关生物标志物的过表达或低表达。例如,健康或正常对照个体未经历缺血性卒中和/或没有经历缺血性卒中的风险。健康或正常对照个体通常未经历血管事
件(例如,TIA、缺血性卒中、心肌梗塞、周围血管性疾病或静脉血栓栓塞)。健康或正常对照个体通常没有一种或多种血管风险因子(例如,高血压、糖尿病、高脂血症或吸烟)。如果合适的话,可以将健康或正常对照个体中目标缺血性卒中相关生物标志物的表达水平相对于
多种稳定表达的内源性参照生物标志物的表达水平进行标准化,即,除以多种稳定表达的
内源性参照生物标志物的表达水平。
[0170] 在一些实施方案中,相对于一种或多种稳定表达的内源性参照生物标志物,确定缺血性卒中相关生物标志物的过表达或低表达。与对照患者相比,卒中或TIA患者的血液中内部控制生物标志物或内源性参照生物标志物以相同或接近相同的表达水平表达。卒中或
TIA患者的血液中目标生物标志物以较高或较低的水平表达。通过将目标生物标志物的表
达水平除以多种内源性参照生物标志物的表达水平,使目标生物标志物的表达水平相对于
参照生物标志物标准化。目标生物标志物的标准化的表达水平可以用于预测卒中或TIA的
发生与否和/或卒中或TIA的致因。
[0171] 在一些实施方案中,将来自疑似患有或经历缺血性卒中的患者和来自对照患者的缺血性卒中相关生物标志物的表达水平相对于多种稳定表达的内源性参照生物标志物的
表达水平标准化。将缺血性卒中相关生物标志物的标准化表达的表达水平与对照患者中相
同缺血性卒中相关生物 标志物标准化表达的表达水平进行比较。测定的表达倍数变化=缺
血性卒中患者中目标生物标志物的标准化表达/对照患者中目标生物标志物的标准化表
达。与健康对照患者中标准化的缺血性卒中相关生物标志物的表达水平相比,缺血性卒中
患者中标准化的缺血性卒中相关生物标志物过表达或低表达至少约1.2倍、1.3倍、1.4倍、
1.5倍、1.6倍、1.7倍、1.8倍、1.9倍、2.0倍、2.1倍、2.2倍、2.3倍、2.4倍、2.5倍、2.6倍、2.7倍、2.8倍、2.9倍、3.0倍、3.1倍、3.2倍、3.3倍、3.4倍或3.5倍或更多倍指示所述缺血性卒中患者已经历缺血性卒中或有经历缺血性卒中的风险。
[0172] 在一些实施方案中,对照表达水平是预定的阈值水平。阈值水平可以对应于另外的健康个体或另外的健康个体群体中相同缺血性卒中相关生物标志物的表达水平,任选
地,将其相对于多种内源性参照生物标志物的表达水平标准化。测定具有代表性数量的另
外的健康个体和倾向于经历缺血性卒中的个体中的缺血性卒中相关生物标志物的表达水
平和标准化表达水平之后,可以将缺血性卒中相关生物标志物的正常表达水平和缺血性卒
中表达水平保持在数据库中,从而允许确定指示是否有经历缺血性卒中的风险或缺血性卒
中发生的阈值表达水平。如果预定的阈值表达水平是相对于正常对照患者群体,则与阈值
水平相比,缺血性卒中患者中缺血性卒中相关生物标志物过表达或低表达(通常是标准化
的)至少约1.2倍、1.3倍、1.4倍、1.5倍、1.6倍、1.7倍、1.8倍、1.9倍、2.0倍、2.1倍、2.2倍、
2.3倍、2.4倍、2.5倍、2.6倍、2.7倍、2.8倍、2.9倍、3.0倍、3.1倍、3.2倍、3.3倍、3.4倍或3.5倍或更多倍指示缺血性卒中患者已经历缺血性卒中或有经历缺血性卒中的风险。如果预定
的阈值表达水平是相对于已知经历缺血性卒中或已知具有经历缺血性卒中风险的患者群
体,则疑似经历缺血性卒中的患者中的表达水平大致等于阈值水平(或过表达或低表达的
程度大于阈值表达水平)时,指示缺血性卒中患者已经历缺血性卒中或有经历缺血性卒中
的风险。
[0173] 关于用于比较的内源性参照生物标志物,优选地,可用的示例性内源性参照生物标志物列举在下文的表16中。其它合适的内源性参照生物标志物公开于,例如,Stamova,et al.,BMC Medical Genomics(2009)2:49 中。在一些实施方案中,测定多种内源性参照生物标志物的表达水平作为对照。在一些实施方案中,测定例如表16中所示的或本领域内已知
的至少约2、3、4、5、6、7、8、9、10、15、20、25、30、35或更多种或全部内源性参照生物标志物的表达水平作为对照。
[0174] 在一些实施方案中,测定内源性参照生物标志物GAPDH、ACTB、B2M、HMBS和PPIB的表达水平作为对照。在一些实施方案中,测定选自以下的2、3、4、5、6、7、8、9、10、15、20、25或更多种或全部内源性参照生物标志物的表达水平作为对照:USP7、MAPRE2、CSNK1G2、SAFB2、PRKAR2A、PI4KB、CRTC1、HADHA、MAP1LC3B、KAT5、CDC2L1///CDC2L2、GTSE1、CDC2L1///CDC2L2、TCF25、CHP、LRRC40、hCG_2003956///LYPLA2///LYPLA2P1、DAXX、UBE2NL、EIF1、KCMF1、PRKRIP1、CHMP4A、TMEM184C、TINF2、PODNL1、FBXO42、LOC441258、RRP1、C10orf104、ZDHHC5、C9orf23、LRRC45、NACC1、LOC100133445///LOC115110、PEX16。
[0175] 与多种稳定表达的内源性参照生物标志物的表达水平(例如,估计的内源性参照生物标志物(例如,表16中所示的2、3、4、5、6、7、8、9、10、15、20、25、30、35或更多种生物标志物)的几何平均表达水平)相比,指示卒中或卒中具体致因的生物标志物具有至少约1.2倍、
1.3倍、1.4倍、1.5倍、1.6倍、1.7倍、1.8倍、1.9倍、2.0倍、2.1倍、2.2倍、2.3倍、2.4倍、2.5倍、2.6倍、2.7倍、2.8倍、2.9倍、3.0倍、3.1倍、3.2倍、3.3倍、3.4倍或3.5倍或更多倍的表达水平。
[0176] 6.检测生物标志物的方法
[0177] 可以利用本领域内已知的任何方法测定基因表达。本领域技术人员应当理解,测定基因表达的手段不是本发明的重要方面。可以在转录或翻译(即蛋白)水平上检测生物标
志物的表达水平。
[0178] 在一些实施方案中,在转录水平上检测生物标志物的表达水平。利用核酸杂交技术进行具体DNA和RNA测量的多种方法是本领域技术人员已知的(参见Sambrook,同上,和
Ausubel,同上),并且可以用于检测表7A、7B、13A、13B、14和15中所示的基因的表达。一些方法涉及电 泳分离(例如,用于检测DNA的Southern印迹和用于检测RNA的Northern印迹),但是也可以在不利用电泳分离的情况下进行DNA和RNA的测量(例如,通过斑点印迹)。基因组
DNA(例如,来自人)的Southern印迹可用于筛选限制性片段长度多态性(RFLP),以检测影响本发明多肽的遗传病症的存在。可以检测所有形式的RNA,包括例如,信使RNA(mRNA)、微RNA(miRNA)、核糖体RNA(rRNA)和转运RNA(tRNA)。
[0179] 核酸杂交形式的选择不是关键的。多种核酸杂交形式是本领域技术人员已知的。例如,常见的形式包括夹心测定和竞争或替代测定。杂交技术通常描述于Hames and 
Higgins Nucleic Acid Hybridization,A Practical Approach,IRL Press(1985);Gall 
and Pardue,Proc.Natl.Acad.Sci.U.S.A.,63:378-383(1969);以及John et al.Nature,
223:582-587(1969)。
[0180] 杂交复合物的检测可需要产信号复合物与靶标和探针多核苷酸或核酸的双螺旋的结合。通常,这种结合通过配体和抗配体相互作用而发生,例如配体偶联的探针和偶联有信号的抗配体之间的相互作用。通过暴露于超声能,信号生成复合物的结合也易于得到加
速。
[0181] 标记也可以允许间接检测杂交复合物。例如,如果标记是半抗原或抗原,可以通过使用抗体来检测样本。在这些系统中,通过将荧光或酶分子连接于抗体,或在一些情况下,通过连接于放射性标记而产生信号(参见例如,Tijssen,“Practice and Theory of Enzyme Immunoassays,”Laboratory Techniques in Biochemistry and Molecular 
Biology,Burdon and van Knippenberg Eds.,Elsevier(1985),pp.9-20)。
[0182] 探针通常被直接标记,例如用同位素、发色团、发光团、色原体,或被间接标记,例如用生物素,链霉亲和素复合物随后可以与生物素结合。因此,本发明测定中所用的可检测的标记可以是一级标记(其中该标记包含可直接检测的元件或能产生直接可检测的元件的元件)或二级标记(其中可检测的标记与一级标记结合,例如,免疫标记中常用的)。通常,标记的信号核酸用于检测杂交。可以通过常用于检测杂交多核苷酸存在的数种方法中的任一
种标记互补的核酸或信号核酸。最常用的检测方法是利用用3H、125I、35S、14C或32P标记的探针等的放射自显影法。
[0183] 其它标记包括,例如,能结合标记抗体的配体、荧光团、化学发光 剂、酶以及能作为标记配体的特异结合对成员的抗体。对标记、标记步骤和标记检测的介绍见于Polak and Van Noorden Introduction to Immunocytochemistry,第二版,Springer Verlag,NY(1997);以及Haugland Handbook of Fluorescent Probes and Research Chemicals,由
Molecular Probes,Inc.出版的联合手册和名录(1996)。
[0184] 通常,监测具体探针或探针组合的检测器被用于检测检测试剂标记物。典型的检测器包括分光光度计、光电管和二极管显微镜、闪烁计数器、照相机、胶片等,以及以上的组合。合适的检测器的实例可广泛地从本领域技术人员已知的多种商业途径获得。一般地,使包含结合的标记部分的底物的光学图像数字化,用于随后的计算机分析。
[0185] 最通常地,通过检测试剂的结合、对固定于固体支持物的标记的量进行定量,来测量RNA的量。通常,相对于不含调节剂的对照孵育或者与为具体反应类型所建立的基线相比,孵育过程中调节剂的存在会增加或减少固定于固体支持物的标记的量。检测和定量标
记的手段是本领域技术人员公知的。
[0186] 在优选的实施方案中,将目标核酸或探针固定于固体支持物上。适用于本发明测定中的固体支持物是本领域技术人员已知的。本文使用的固体支持物是基本固定排列的材
料基质。
[0187] 例如,在本发明的一实施方案中,使用微阵列来检测基因表达模式。微阵列提供了一种同时测量大量基因表达水平的方法。每一阵列由连接于固体支持物的可复制模式的多种核酸(例如,能与表7A、7B、13A、13B、14和15中所示的多个基因杂交的多种核酸)组成。在一实施方案中,阵列含有能与表7A(和7B)中所示的多个基因杂交的多种核酸。在一实施方
案中,阵列含有能与表13A(和13B)中所示的多个基因杂交的多种核酸。在一实施方案中,阵列含有能与表14中所示的多个基因杂交的多种核酸。在一实施方案中,阵列含有能与表15
中所示的多个基因杂交的多种核酸。标记的RNA或DNA与阵列上互补的探针杂交,然后通过
激光扫描检测。测定阵列上每个探针的杂交强度,并将其转化成缺血(例如,卒中或短暂性缺血发作)中相对基因表达水平的定量读出。
[0188] 在一些实施方案中,从个体获得样本,从该样本分离总mRNA,并 将其转化成标记的cRNA,然后与阵列杂交。通过参照阵列上和样本中存在的合适对照来计算相对转录物水
平。参见Mahadevappa and Warrington,Nat.Biotechnol.17,1134-1136(1999)。
[0189] 多种自动化固相测定技术也是合适的。例如,可从Affymetrix,Inc.(Santa Clara,CA)购得的大规模的固定化多聚物阵列(VLSIPSTM)能被用于同时检测参与同一调控
通路的多个基因表达水平的变化。参见,Tijssen,同上,Fodor et al.(1991)Science,251:
767-777;Sheldon et al.(1993)Clinical Chemistry39(4):718-719,以及Kozal et al.
(1996)Nature Medicine2(7):753-759。还可以使用本领域内可利用的集成微流体系统
其它医疗点(point-of-care)诊断装置。参见,例如,Liu and Mathies,Trends 
Biotechnol.(2009)27(10):572-81和Tothill,Semin Cell Dev Biol(2009)20(1):55-62。
在检测多种核酸的表达水平中使用的微流体系统可获自,例如,NanoString 
Technologies,网址为nanostring.com。
[0190] 例如,可以通过使用能特异性结合双螺旋核酸的标记的检测部分(例如,对RNA-DNA双螺旋具有特异性的抗体)实现检测。一个优选的实例利用能识别DNA-RNA异双螺旋的
抗体,其中所述抗体与酶连接(通常通过重组或共价化学键)。当酶与其底物反应时,产生可检测的产物时,从而检测到抗体。Coutlee et al.(1989)Analytical Biochemistry181:
153-162;Bogulavski(1986)et al.J.Immunol.Methods89:123-130;Prooijen-Knegt
(1982)Exp.Cell Res.141:397-407;Rudkin(1976)Nature265:472-473,Stollar(1970)
Proc.Nat’l Acad.Sci.USA65:993-1000;Ballard(1982)Mol.Immunol.19:793-799;
Pisetsky and Caster(1982)Mol.Immunol.19:645-650;Viscidi et al.(1988)
J.Clin.Microbial.41:199-209;以及Kiney et al.(1989)J.Clin.Microbiol.27:6-12描
述了针对RNA双螺旋(包括同双螺旋和异双螺旋)的抗体。包含对DNA:RNA杂合体具有特异性
的抗体的试剂盒可获自,例如,Digene Diagnostics,Inc.(Beltsville,MD)。
[0191] 除了可购得的抗体之外,本领域技术人员利用已有的技术能够容易地制备对核酸双螺旋具有特异性的抗体,或能够修饰商购的或可公开获得的那些抗体。除了上文引用的
技术之外,产生多克隆和单克隆抗体的一般方法是本领域技术人员已知的(参见例如,Paul(第3版)Fundamental Immunology Raven Press,Ltd.,NY(1993);Coligan,et al.,
Current Protocols in Immunology,Wiley Interscience(1991-2008);Harlow and 
Lane,Antibodies:A Laboratory Manual Cold Spring Harbor Press,NY(1988);Harlow 
and Lane,Using Antibodies,Cold Spring Harbor Press,NY(1999);Stiteset al.(出
版)Basic and Clinical Immunology(第4版)Lange Medical Publications,Los Altos,
CA,以及其中引用的文献;Goding Monoclonal Antibodies:Principles and Practice(第
2版)Academic Press,New York,NY,(1986);以及Kohler and Milstein Nature256:495-
497(1975))。其它适于抗体制备的技术包括选择噬菌体或相似载体中的重组抗体文库(参
见,Huse et al.Science246:1275-1281(1989);以及Ward et al.Nature341:544-546
(1989))。特异性的单克隆和多克隆抗体以及抗血清通常以至少约0.1μM,优选至少约0.01μM或更好,以及最通常和优选0.001μM或更好的KD来结合。
[0192] 本发明中使用的核酸可以是阳性或阴性探针。阳性探针能与其靶标结合,双螺旋形成是靶标存在的证据。阴性探针不能与疑似靶标结合,未形成双螺旋是靶标存在的证据。
例如,使用野生型特异性核酸探针或PCR引物可以充当测定样本中的阴性探针,在所述样本中,只存在感兴趣的核苷酸序列。
[0193] 通过使用能增加待检测目标核酸的核酸扩增系统,可以增强杂交测定的灵敏性。这类系统的实例包括聚合酶链式反应(PCR)系统,尤其是RT-PCR或实时PCR,以及连接酶链
式反应(LCR)系统。本领域中近期描述的其它方法是基于核酸序列的扩增(NASBA,Cangene,
Mississauga,Ontario)和Qβ复制酶系统。这些系统能用于直接鉴定突变体,其中,PCR或LCR引物被设计成仅在存在选定序列时才会被延伸或连接。可选择地,通常能够利用例如非特
异性PCR引物扩增选定序列,并且随后探测扩增的靶区中指示突变的特定序列。还可利用高通量多元核酸测序或“深度测序”来检测捕获的表达的生物标志物基因。高通量测序技术是本领域内已知的(例如,在网址454.com上的454测序)。
[0194] 测定本发明核酸的表达水平的可选方式是原位杂交。原位杂交测定是公知的,并且通常描述于Angerer et al.,Methods Enzymol.152:649-660 (1987)中。在原位杂交测
定中,将细胞(优选人细胞,例如血细胞)固定于固体支持物(通常为玻璃载玻片)。如果欲探测DNA,则用加热或碱使细胞变性。然后,在中等温度下使细胞与杂交溶液接触,从而允许被标记的特异性探针退火。优选用放射性同位素或荧光报告子标记探针。
[0195] 在其它实施方案中,用定量RT-PCR来检测表7A、7B、13A、13B、14和15中所示的多个基因的表达。在一实施方案中,定量RT-PCR用于检测表7A(和7B)中所示的多个基因。在一实施方案中,定量RT-PCR用于检测表13A(和13B)中所示的多个基因。在一实施方案中,定量RT-PCR用于检测表14中所示的多个基因。在一实施方案中,定量RT-PCR用于检测表15中所
示的多个基因。适用技术的一般性综述可参见例如,A-Z of Quantitative PCR,Bustin,
ed.,2004,International University Line;Quantitative PCR Protocols,Kochanowski 
and Reischl,eds.,1999,Humana Press;Clinical Applications of PCR,Lo,ed.,2006,
Humana Press;PCR Protocols:A Guide to Methods and Applications(Innis et 
al.eds.(1990))以及PCR Technology:Principles and Applications for DNA 
Amplification(Erlich,ed.(1992))。此外,扩增技术描述于美国专利号4,683,195和4,
683,202中。本领域内已知的多重PCR方法适用于本发明。
[0196] 因此,在本发明的一实施方案中,提供了包含多种多核苷酸的反应混合物,所述多核苷酸能够与表7A、7B、13A、13B、14和15中所示的多个基因的核酸序列特异性杂交(例如,引物)。在一些实施方案中,本发明提供了包含多种多核苷酸的反应混合物,所述多核苷酸能够与表7A(和7B)中所示的多个基因的核酸序列特异性杂交(例如,引物)。在一些实施方案中,本发明提供了包含多种多核苷酸的反应混合物,所述多核苷酸能够与表13A(和13B)
中所示的多个基因的核酸序列特异性杂交(例如,引物)。在一些实施方案中,本发明提供了包含多种多核苷酸的反应混合物,所述多核苷酸能够与表14中所示的多个基因的核酸序列
特异性杂交(例如,引物)。在一些实施方案中,本发明提供了包含多种多核苷酸的反应混合物,所述多核苷酸能够与表15中所示的多个基因的核酸序列特异性杂交(例如,引物)。在一些实施方案中,反应混合物是PCR混合物,例如,多重PCR混合物。
[0197] 本发明依赖于重组遗传学领域的常规技术。通常,下文描述的重组DNA技术中的术语和实验方案是本领域内熟知的并且常用于本领域内。使用标准技术来进行克隆、DNA和
RNA分离、扩增和纯化。通常,涉及DNA连接酶、DNA聚合酶、限制性内切核酸酶等的酶学反应按照厂商的说明书进行。公开了本发明中使用的一般方法的基础文章包括Sambrook et 
al.,Molecular Cloning,A Laboratory Manual(第3版,2001);Kriegler,Gene Transfer 
and Expression:A Laboratory Manual(1990);以及Current Protocols in Molecular 
Biology(Ausubel et al.,eds.,1994-2008,Wiley Interscience))。
[0198] 对于核酸,以千碱基(kb)或碱基对(bp)来给出大小。这些是从琼脂糖或丙烯酰胺凝胶电泳、测序的核酸或公开的DNA序列得到的估计值。对于蛋白,以千道尔顿(kDa)或氨基酸残基数给出大小。蛋白大小是从凝胶电泳、测序的蛋白、得到的氨基酸序列或公开的蛋白序列估算出的。
[0199] 不可商购的寡核苷酸可以按照Beaucage&Caruthers,Tetrahedron Letts.22:1859-1862(1981)首次描述的固相亚磷酸酰胺三酯法,利用自动合成仪化学合成,如Van 
Devanter et.al.,Nucleic Acids Res.12:6159-6168(1984)中所描述的。通过非变性丙烯
酰胺凝胶电泳或通过Pearson&Reanier,J.Chrom.255:137-149(1983)中所描述的阴离子交
换HPLC进行寡核苷酸的纯化。
[0200] 在一些实施方案中,在转录水平或蛋白水平上检测本文描述的生物标志物的表达水平。蛋白检测是本领域内公知的,并且可以使用本领域内已知的蛋白检测方法。示例性的测定多种蛋白表达水平的测定包括,例如,ELISA、流式细胞术、质谱分析(例如,MALDI或SELDI)、表面等离子共振(例如,BiaCore)、微流体技术和其它生物传感器技术。参见例如,Tothill,Semin Cell Dev Biol(2009)20(1):55-62。
[0201] 7.缺血性卒中参照谱
[0202] 本发明还提供了缺血参照谱。参照谱包括将多种缺血相关基因(即,表7A、7B、13A、13B、14和15中所示的多个基因)的表达水平与具体类型的缺血关联起来的信息。在一实施
方案中,缺血参照谱将表7A(和 7B)中所示的多个基因的表达水平与缺血的发生或风险关
联起来。在一实施方案中,缺血参照谱将表13A(和13B)中所示的多个基因的表达水平与心
源性卒中的发生或风险关联起来。在一实施方案中,缺血参照谱将表14中所示的多个基因
的表达水平与颈动脉狭窄的发生或风险关联起来。在一实施方案中,缺血参照谱将表15中
所示的多个基因的表达水平与心房纤颤的发生或风险关联起来。这种谱可以方便地用于诊
断、监测和预测缺血。
[0203] 本发明的一实施方案提供了已经历卒中或有经历卒中风险的个体的缺血参照谱,不考虑致因。因此,缺血参照谱与选自表7A(和表7B)的多个基因的表达水平相关。例如,以下表达谱是已经历卒中或有卒中风险的个体的参照谱:表现出与对照水平相比,多种以下
基因的表达增加至少约1.2倍的表达谱:PGM5、CCDC144C///LOC100134159、LECT2、SHOX、TBX5、SNIP、RBMS3、P704P、THSD4、FAT3、SNRPN、GLYATL1、GADL1、CXADR、OVOL2、RNF141、CLEC4E、BXDC5、UNC5B、TIMP2、ASTN2、FLJ35934、ANKRD28、CCDC144A、TIMM8A、ALDOAP2、LDB3、PTPRD、LOC729222///PPFIBP1、CCRL1、FCRL4、ELAVL2、PRTG、DLX6、SCD5、GABRB2、GYPA、PHTF1、CKLF、CKLF、RRAGD、CLEC4E、CKLF、FGD4、CPEB2、LOC100290882、UBXN2B、ENTPD1、BST1、LTB4R、F5、IFRD1、KIAA0319、CHMP1B、MCTP1、VNN3、AMN1、LAMP2、FCHO2、ZNF608、REM2、QKI、RBM25、FAR2、ST3GAL6、HNRNPH2、GAB1、UBR5、VAPA、LOC283027、LOC344595、RPL22、
LOC100129488和MCTP1,以及表现出与对照水平相比,多种以下基因的表达降低至少约1.2
倍的表达谱:SPTLC3、DKRZP434L187、SPIB、HNRNPUL2、FOXA2、RPL22和SH3GL3。
[0204] 本发明的一实施方案提供了已经历心源性卒中或有经历心源性卒中风险的个体的缺血参照谱。因此,缺血参照谱与选自表13A(和表13B)的多个基因的表达水平相关。例
如,以下表达谱是已经历心源性卒中或有心源性卒中风险的个体的参照谱:表现出与对照
水平相比,多种以下基因的表达增加至少约1.2倍的表达谱:IRF6、ZNF254、GRM5、EXT2、AP3S2、PIK3C2B、ARHGEF5、COL13A1、PTPN20A///PTPN20B、LHFP、 BANK1、HLA-DOA、EBF1、TMEM19、LHFP、FCRL1、OOEP和LRRC37A3,以及表现出与对照水平相比,多种以下基因的表达降低至少约1.2倍的表达谱:LOC284751、CD46、ENPP2、C19orf28、TSKS、CHURC1、ADAMTSL4、FLJ40125、CLEC18A、ARHGEF12、C16orf68、TFDP1和GSTK1。
[0205] 本发明的一实施方案提供了已经历颈动脉狭窄和动脉粥样硬化性卒中或有经历颈动脉狭窄和动脉粥样硬化性卒中风险的个体的缺血参照谱。因此,缺血参照谱与选自表
14的多个基因的表达水平相关。例如,以下表达谱是已经历颈动脉狭窄和动脉粥样硬化性
血栓性卒中或有颈动脉狭窄和动脉粥样硬化性血栓性卒中风险的个体的参照谱:表现出与
对照水平相比,多种以下基因的表达增加至少约1.2倍的表达谱:NT5E、CLASP2、GRM5、
PROCR、ARHGEF5、AKR1C3、COL13A1、LHFP、RNF7、CYTH3、EBF1、RANBP10、PRSS35、C12orf42和LOC100127980,以及表现出与对照水平相比,多种以下基因的表达降低至少约1.2倍的表达谱:FLJ31945、LOC284751、LOC100271832、MTBP、ICAM4、SHOX2、DOPEY2、CMBL、LOC146880、SLC20A1、SLC6A19、ARHGEF12、C16orf68、GIPC2。
[0206] 本发明的一实施方案提供了已经历心房纤颤或有经历心房纤颤风险的个体的缺血参照谱。因此,缺血参照谱与选自表15的多个基因的表达水平相关。例如,以下表达谱是已经历心房纤颤或有发展为心房纤颤风险的个体的参照谱:表现出与对照水平相比,多种
以下基因的表达增加至少约1.2倍的表达谱:SMC1A、SNORA68、GRLF1、SDC4、HIPK2、
LOC100129034、CMTM1和TTC7A,以及表现出与对照水平相比,多种以下基因的表达降低至少约1.2倍的表达谱:LRRC43、MIF///SLC2A11、PER3、PPIE、COL13A1、DUSP16、LOC100129034、BRUNOL6、GPR176、C6orf164和MAP3K7IP1。
[0207] 可以将参照谱输入数据库,例如,包含符合预定种类的数据的关系数据库。每个表格或关系在纵行中含有一种或多种数据类别。每一横行含有纵行限定的类别的独有的数据实例。例如,本发明典型的数据库会包括这样的表格,在纵行描述样本的年龄、性别、生殖状况、表达谱等。 另一表格描述疾病:症状、等级、样本鉴定、表达谱等。在一实施方案中,本发明将实验样本与参照样本的数据库匹配。数据库由多种不同的样本组合,以便用作参照样
本。在一实施方案中,个体参照样本将获自就医过程中的患者。关于样本的生理状态、疾病状态和/或药理状态的信息也将通过任何可用的方法获得。这可以包括,但不限于,表达谱分析、临床分析、病史和/或患者面谈。例如,能够当面确定患者的年龄、性别、族源、症状或既往疾病诊断以及患者正进行的任何治疗的特征。采集多个这种参照样本。一个个体可以
贡献一个参照样本或随时间可以贡献多个样本。本领域技术人员应当认识到,当数据库中
参照样本的数量增加时,基于与数据库比较的预测的置信度也增加。
[0208] 将数据库组织为参照样本组。每个参照样本含有关于生理状态、药理状态和/或疾病状态的信息。一方面,数据库是具有组织到三个数据表格中的数据的关系数据库,一个是主要通过生理状态将样本分组的表格、一个是主要通过疾病状态将样本分组的表格,一个
是主要通过药理状态将样本分组的表格。在每个表格中,样本可以进一步按照两个余下的
类别进行分组。例如,生理状态表可以按照疾病状态和药理状态被进一步分类。
[0209] 如本领域技术人员所理解的,本发明还可以体现为方法、数据处理系统或程序产品。因此,本发明可以采用数据分析系统、方法、分析软件等形式。按照本发明编写的软件被存储在一些形式的计算机可读介质中(诸如存储器硬盘、DVD ROM或CD ROM)或通过网络传输,并通过处理器执行。本发明还提供了用于分析生理状态、疾病状态等级和/或治疗效力的计算机系统。该计算机系统包括处理器和存储器,该存储器与编码一个或多个程序的所
述处理器连接。存储器中所编码的程序使处理器执行上述方法的步骤,其中表达谱以及关
于生理状态、药理状态和疾病状态的信息由计算机系统接收作为输入。计算机系统可用于
执行本发明实施方案的软件(参见例如,美国专利号5,733,729)。
[0210] 8.为患者提供合适的治疗和预防方案
[0211] 例如,一旦利用本文提供的生物标志物,正面确定或确认患者已经 历卒中并确定卒中致因,本方法还包括制定、提供或实施缺血性卒中的预防或治疗方案的步骤。通过利用本文所述的生物标志物诊断卒中的发生和/或致因,患者可以快速接受经调整适合于已经
历的卒中类型或患者有风险经历的卒中类型的治疗。
[0212] 如果从表7A(和7B)评价的多种生物标志物的表达水平指示卒中的发生或风险,则可以利用本领域内已知的方法确认卒中的阳性诊断。例如,患者可以进行脑和血管的MRI成像、其它的血液测试、EKG和/或心回波检查。
[0213] 如果从表13A(和13B)评价的多种生物标志物的表达水平指示心源性卒中的发生和/或风险,则可以为患者制定或实施抗凝血剂方案。示例性抗凝血剂包括阿司匹林、肝素、华法令和达比加群。
[0214] 如果从表14评价的多种生物标志物的表达水平指示颈动脉狭窄的发生和/或风险,则可以为患者制定或实施抗血小板药物方案。最常用的抗血小板药物是阿司匹林。阿司匹林的替代品是抗血小板药物氯吡格雷(Plavix)。一些研究表明,阿司匹林与另一种抗血
小板药物组合是最有效的。在一些实施方案中,为患者制定低剂量阿司匹林和抗血小板药
物潘生丁(Aggrenox)的组合,以降低血凝。噻氯匹啶(Ticlid)是另一种可以使用的抗血小
板药物。患有中度或重度颈动脉(neck artery)(颈动脉(carotid))狭窄的患者可能需要或
受益于颈动脉内膜切除术。这种预防性的手术清除了颈动脉的脂肪沉积(动脉粥样硬化斑
块),从而预防了首次卒中或随后的卒中。在一些实施方案中,患者可能需要或受益于颈动脉成形术或支架。颈动脉成形术涉及利用囊样装置来打开阻塞的动脉,并将小线管(支架)
放置在动脉内以保持其畅通。
[0215] 如果从表15评价的多种生物标志物的表达水平指示心房纤颤的发生和/或风险,则可以为患者制定抗凝血剂(以预防卒中)和/或药学试剂的方案,以实现心率控制。示例性抗凝血剂包括阿司匹林、肝素、华法令和达比加群。示例性的心率控制药物包括β阻滞剂(例如,美托洛尔、阿替洛尔、比索洛尔)、非二氢吡啶类通道阻滞剂(例如,地尔硫卓或异搏定)和强心苷(例如,地高辛)。
[0216] 9.固体支持物和试剂盒
[0217] 本发明还提供了包含多种核酸探针的固体支持物,所述核酸探针能够与表7A、7B、13A、13B、14、15以及任选的表16中所示的多种(例如,两种或更多种或全部)基因杂交。例如,固体支持物可以是连接了多种核酸探针的微阵列,所述核酸探针能够与表7A以及任选
的表16中所示的多种(例如,两种或更多种或全部)基因杂交。例如,固体支持物可以是连接了多种核酸探针的微阵列,所述核酸探针能够与表13A以及任选的表16中所示的多种(例
如,两种或更多种或全部)基因杂交。例如,固体支持物可以是连接了多种核酸探针的微阵列,所述核酸探针能够与表14以及任选的表16中所示的多种(例如,两种或更多种或全部)
基因杂交。例如,固体支持物可以是连接了多种核酸探针的微阵列,所述核酸探针能够与表
15以及任选的表16中所示的多种(例如,两种或更多种或全部)基因杂交。
[0218] 在多个实施方案中,固体支持物被设置为排除与卒中或卒中致因的诊断、预测或确认无关或无法用于卒中或卒中致因的诊断、预测或确认的基因。例如,与对照表达水平相比,患有卒中或疑似患有卒中(不考虑致因)的个体中过表达或低表达小于1.2倍的基因可
以从本申请的固体支持物排除。在一些实施方案中,与对照表达水平相比,缺血性卒中(包括心源性卒中、动脉粥样硬化性血栓性卒中以及心房纤颤后的卒中)个体中过表达或低表
达小于1.2倍的基因可以从本申请的固体支持物排除。固体支持物可以包含多种核酸探针,所述核酸探针能够与本文所述的可用于诊断缺血性卒中、心源性卒中、颈动脉狭窄和/或心房纤颤的多种(例如,两种或更多种或全部)基因杂交。如果合适的话,可以将能够与可用于诊断缺血性卒中、心源性卒中、颈动脉狭窄和/或心房纤颤的多种(例如,两种或更多种或全部)基因杂交的核酸探针以预定的阵列排列在固体支持物上。在多个实施方案中,鉴定的非特异性核酸和/或与缺血性卒中、心源性卒中、颈动脉狭窄和/或心房纤颤的诊断不相关和/或不关联的核酸不被连接于固体支持物。固体支持物可以是试剂盒中的组分。
[0219] 本发明还提供了用于诊断缺血或发展为缺血的倾向的试剂盒。例如,本发明提供了包括一个或多个反应容器的试剂盒,所述反应容器中具有 本发明的部分或全部反应组
分的小份。小份可以为液态或干燥形式。反应容器可以包括允许在同一容器中容纳、处理
和/或扩增样本的样本处理盒或其它容器。试剂盒可以包含多种能够与表7A、7B、13A、13B、
14和15中所示的多个基因杂交的核酸探针。在一实施方案中,试剂盒包含多种能够与表7A
(和7B)中所示的多个基因杂交的核酸探针。在一实施方案中,试剂盒包含多种能够与表13A(和13B)中所示的多个基因杂交的核酸探针。在一实施方案中,试剂盒包含多种能够与表14中所示的多个基因杂交的核酸探针。在一实施方案中,试剂盒包含多种能够与表15中所示
的多个基因杂交的核酸探针。探针可以固定在本文所描述的阵列上。
[0220] 在一些实施方案中,试剂盒包含固体支持物,所述固体支持物包含多种核酸探针,所述核酸探针能够与表7A、7B、13A、13B、14、15以及任选的表16中所示的多个基因杂交。例如,固体支持物可以是连接了多种核酸探针的微阵列,所述核酸探针能够与表7A、7B、13A、13B、14、15以及任选的表16中所示的多个基因杂交。
[0221] 此外,试剂盒可以包含合适的缓冲液、盐及其它试剂,以便于用于测定表7A、7B、13A、13B、14和15中所示的多个基因的表达水平的扩增和/或检测反应(例如,引物、标记)。
在一实施方案中,试剂盒包含合适的的缓冲液、盐及其它试剂,以便于用于测定表7A(和7B)中所示的多个基因的表达水平的扩增和/或检测反应(例如,引物、标记)。在一实施方案中,试剂盒包含合适的缓冲液、盐及其它试剂,以便于用于测定表13A(和13B)中所示的多个基
因的表达水平的扩增和/或检测反应(例如,引物、标记)。在一实施方案中,试剂盒包含合适的缓冲液、盐及其它试剂,以便于用于测定表14中所示的多个基因的表达水平的扩增和/或检测反应(例如,引物、标记)。在一实施方案中,试剂盒包含合适的缓冲液、盐及其它试剂,以便于用于测定表15中所示的多个基因的表达水平的扩增和/或检测反应(例如,引物、标
记)。试剂盒还可以包括使用试剂盒的书面说明书。
[0222] 在一实施方案中,试剂盒包含多种能够与表7A、7B、13A、13B、14和15中所示的多种生物标志物结合的抗体。所述抗体可以固定或可以不固定于固体支持物(例如,ELISA板)上。
实施例
[0223] 提供以下实施例用于说明而非限制请求保护的发明。
[0224] 实施例1:用于诊断缺血性卒中的发生和/或风险的生物标志物材料和方法
[0225] 本研究有两个目的:(1)证实之前鉴定出的29种探针能在新的队列中区分IS与健康对照[Tang Y et al.,J Cereb Blood Flow Metab.,26:1089-1102(2006)];以及(2)鉴
定能将IS与血管风险因子(SAVVY)对照和心肌梗塞(MI)对照区别开的其它基因。在≤3、5和
24小时(3h IS、5h IS、24IS)时,从IS患者(n=70,199份样本)抽取全血,作为CLEAR试验的一部分[Pancioli AM et al.,Stroke,39:3268-3276(2008)](Clinical-Trials.gov上的
NCT00250991)。在获得3h血液样本后,用r-tPA对IS个体进行治疗,给予或不给予依替巴肽。
对照包括从SAVVY(Sex、Age and Variation in Vascular functionalitY)研究招募的健
康个体(n=38)、急性心肌梗塞个体(MI,n=17)和具有至少一种心血管风险因子(高血压、糖尿病、高脂血症或吸烟)的个体(n=52)。每个部的机构审查委员会都批准了本研究,并且每位患者都提供了知情同意书。血液样本被收集在PAXgene管(PreAnlytix,Germany)中。利用Ovation全血试剂(Nugen Technologies,San Carlos,CA)处理分离的RNA,并且使其杂交
到Affymetrix Genome U133Plus2GeneChips(Affymetrix Santa Clara,CA)上。利用
Robust Multichip Averaging(RMA)[Bolstad BM et al.,Bioinformatics,19:185-193
(2003)]和我们的内参基因标准化技术[Stamova BS et al.,BMC Med Genomics,2:49
(2009)]将数据标准化。
[0226] 目的1:利用PAM(Prediction Analysis of Microarrays)[Tibshirani R et al.,Proc Natl Acad Sci U S A,99:6567-6572(2002)]中的k-最邻近法确定以前鉴定出
的29个基因的预测能力。将IS和健康个体随机分成两半,通过组和时间点(对于IS样本)分
成训练集(以开发预测算法)和独立的检验(验证)集(用于评价预测算法的精确度)。
[0227] 目的2:为了鉴定能区分IS和全部对照组的基因,使用年龄、性别和微阵列批次影响调整的ANCOVA。利用最近收缩质心(nearest-shrunken centroids)算法(PAM)使预测性
基因的数量最小化。利用(1)10倍交叉验证(CV)以及(2)在第二(独立)检验(验证)集中利用
几种预测算法(k-最邻近法(K-NN)、支持向量机法(SVM)、线性判别分析法(LDA)以及二次判别分析法(QDA))评价鉴定出的基因从对照预测IS的能力。对于目的2,仅分析3h IS(未治疗的)和24h IS样本,因为它们被认为在临床上是最相关的。对于目的1和2的预测和交叉验证分析的详细情况,请参见补充的材料和方法。
[0228] 研究参与者
[0229] 缺血性卒中(IS)患者
[0230] 从CLEAR试验招募急性IS参与者(n=68),所述CLEAR试验是如之前所述的重组组织纤溶酶原激活剂(r-tPA)和依替巴肽的多中心、随机双盲安全性研究[Pancioli AM et 
al.,Stroke,39:3268-3276(2008)](Clinical-Trials.gov上的NCT00250991)。在缺血性卒
中开始之后≤3小时(3h IS)、5小时(5hr IS)和24小时(24IS)收集血液样本。在3h采血后给予r-tPA,给予或不给予依替巴肽。由卒中神经专科医师使用全部临床和诊断试验包括神经血管成像数据对IS进行诊断。
[0231] 对照组
[0232] 血管风险因子个体(SAVVY)
[0233] 从SAVVY(Sex、Age and Variation in Vascular functionalitY)研究招募具有至少一种心血管风险因子(高血压、糖尿病、高脂血症或吸烟)的个体(n=52)。这些个体在本研究中称为血管风险因子SAVVY对照。排除标准是既往的心血管疾病史(包括卒中、冠状动
2
脉疾病、周围动脉疾病或深静脉血栓形成),BMI>46kg/m ,癌症史、慢性感染、自身免疫疾病或血质不调。
[0234] 心肌梗塞(MI)患者
[0235] 从加利福尼亚大学戴维斯医学中心招募MI个体(n=16)。自事件后的平均时间是58.0h(范围19.3-176.5)。在采血之前,用抗血小板药物和抗 凝血剂急性治疗所有个体。在采血之前,在一些患者中进行了血管成形术(n=8)或CABG(n=1)。无MI患者接受r-tPA。
[0236] 健康对照
[0237] 从辛辛那提大学(n=15)、加利福尼亚大学戴维斯分校(n=3)和斯坦福大学(n=20)招募健康对照。这些个体从未住院治疗过,没有在服药,并且没有已知的重要医学、外科和精神学疾病。
[0238] 对于连续变量(年龄)使用Student’s双尾t检验,对于分类变量(性别、种族)使用χ2或费希尔精确检验,比较之前的研究[Tang Y et al.,J Cereb Blood Flow Metab.,26:
1089-1102(2006)]和本研究之间的基线人口统计学数据,以及比较本研究的IS和对照个体
之间的基线人口统计学数据。
[0239] 探针水平的数据分析
[0240] 利用Robust Multichip Averaging(RMA)标准化[Bolstad BM et al.,Bioinformatics,19:185-193(2003)],以及通过对稳定表达的内参基因的子集[Stamova 
BS et al.,BMC Med Genomics,2:49(2009)]的改进的内参基因标准化(准备中的稿件),将
来自Affymetrix U133Plus2.0表达阵列的每个探针的原始表达值转化成探针组水平的数
据。这涉及中位数修正概括步骤,即每个个体基因表达值除以参照基因的几何平均数,并进行log2变换。对于目的1中的分析,使用RMA和内参基因标准化的值。对于目的2中的所有分析,利用内参基因标准化的值进行差异基因的分离。在开发分类器中使用相同的值。
[0241] 批次校正
[0242] 由于各批次的不平衡的性质,因此当将批次用作ANCOVA模型中的因素时,引入偏倚。然而,解释现存的技术差异仍是可取的。在批次作为或不作为因素的情况下,通过选择ANCOVA输出集共有的基因来实现这一点。尽管该项技术引入了对选择差异基因的严格标
准,但其意图在于当进行随后的研究时能提高结果确认的几率,以及实现更好的普遍化,从而能被转化成IS预测临床测试。
[0243] 差异基因的鉴定
[0244] 单独进行每种比较的分析(分别为每个时间点(3h和24h)的IS相对于健康者、MI和SAVVY)。将样本随机分组,以便进行分样(split-sample)分析,其中预测算法在半数样本
(训练集)上训练,而在另外半数样本(检验集)上检验分类器的性能。分析的工作流程图如
图3所示。用于分别在健康者与3h IS和24h IS之间分离差异基因的特征选择涉及从四种不
同的ANCOVA分析(本文称为模型1-4)发现共同的探针组。分析中使用的所有因素是所有模
型(组、年龄、性别)所共有的,但除了批次,批次仅在模型1和3中作为因素。模型1和2应用于随机选择的通过组和时间点(对于IS样本)分级的半数样本(在此称为第一随机半数),而模
型3和4应用于全部数据集。由于在试图选择更加可靠的探针组中批次的不平衡的性质,因
此进行了具有批次和不具有批次的模型的重叠。进行完全组模型和分组模型的重叠,以实
现比分组模型更好的普遍化,从而能被转化成IS预测临床试验。
[0245] 开发了满足以下标准的基因列表:FDR校正的p值(组)≤0.05和倍数变化≤-1.5或≥1.5,以及对于其它因素(未校正的p(年龄)>0.5和未校正的p(性别)>0.05,以及对于包括批次的模型,未校正的p(批次)>0.05)是不显著的。目的是找到表达不受显著的技术(批
次)、性别或年龄影响的基因。
[0246] 在模型1中用于24h IS相对于健康者的流程图分析有例外,其中未校正的p(组)<0.01用于产生更大的基因列表。SAVVY相对于3h IS和24h IS的分析仅包括模型2和4,因为
由于批次完全混杂,而批次未作为因素。MI相对于3h IS和24h IS的分析仅包括模型3和4,因为MI患者的样本大小很小(n=17)。在这种情况下,使用10倍交叉验证程序来确定分类算
法的性能。如果特征选择步骤时的探针组数量较大,我们继续排除未注释的探针组、注释为染色体区段的探针组、注释为假定蛋白的探针组、按照Affimetrix注释可能检测出多于一
种独特的基因(*_x_at、*_a_at、*_s_at)的探针组,并排除重复。
[0247] 预测/分类
[0248] 使用不同的预测算法。微阵列预测分析(PAM)使用K-最邻近法作为分类引擎(默认值k=10)以及最近收缩质心法作为特征选择方法[Tibshirani R et al.,Proc Natl Acad 
Sci U S A,99:6567-6572(2002)]。将通过上文所述的标准的差异表达的基因输入PAM,并
选择具有最佳分类准确性的最少数量的基因。此外,在组合的3h IS预测基因、24h IS预测基因以及3h加24h IS预测基因的分析中评价多种其它分类方法,以便找到最佳模型并产生
预测准确性的无偏估计(Partek Genomics Suite,Partek Inc.,St.Louis,MI,USA中进行
的分析)。对于我们的特征约减步骤,使用ANCOVA模型和最近收缩质心法的组合。除了PAM之外,本研究中使用的分类模型是K最邻近法(K-NN),以欧氏距离相似性标准,k=1、3、5、7和9个邻近点;具有相等和成比例的先验概率的最近质心法(NC);具有相等和成比例的先验概
率的二次判别分析(QDA),具有相等和成比例的先验概率的线性判别分析(LDA),以及支持
向量机,组成121模型空间。对于这些方法的概述,参见[Asyali MH et al.,Current 
Bioinformatics,1:55-73(2006);Jain AK et al.,Statistical pattern recognition:A review,IEEE Transactions On Pattern Analysis and Machine Intelligence.,22:4-
37(2000)]。进行2级嵌套式交叉验证(CV),产生分类成功的较低的有偏估计(报道为准确性(标准化)估计)。在该方法中,进行“外部”交叉验证,以产生预测误差的无偏估计(通过保留样本作为独立的检验集)。为了选择应用于保留检验样本的最佳模型,在训练数据(未通过
“外部”交叉验证保留作为检验数据的数据)上进行另外的“内部”交叉验证。在整个集都用于训练和CV预测准确性的情况下,使用全留一(leave-one-out)交叉验证(CV)。
[0249] 对于结果部分中的表4,使用以下参数:*121模型空间的准确性(标准化)估计=91.2%(80.3/88)。最佳模型:SVM(收缩=是,损失=101、nu=0.5、tol=0.001、kern rbf deg=3、径向基函数(γ)=0.01、coef=0.0)。κ=0.83。  模型空间的准确性(标准化)估计=87.9%
(76.4/87)。最佳模型:SVM(收缩=是,损失=101、nu=0.5、tol=0.001、kern rbf deg=3、径向基函数(γ)=0.0001、coef=0.0)。κ=0.83。 模型空间的准确性(标准化)估计=91.2%
(110/121)。最佳模型:SVM(收缩=是,损失=701、nu=0.5、tol=0.001、kern rbf deg=3、径向基函数(γ)=0.00001、coef=0.0)。║在3h的正确分 类=76%、在24h的正确分类=97%。#在3h的正确分类=94%、在24h的正确分类=97%。
[0250] 鉴定组合的3h和24h IS预测基因中的生物学主题的差异基因的基因富集分析
[0251] 信号网络分析(Ingenuity Pathway Analysis)(IPA8.0、 Systems)用于鉴定3h和24h预测基因的组合97个探针组列表中过度表现的生物功能。使用费希尔精确
检验(p<0.1)来确定任何给定的生物功能中是否有97个探针组/基因的过度表现。从
Affymetrix NetAffix网站(因特网affymetrix.com/user/login.jsp?toURL=-/analysis/
netaffx/index.affx)获得卒中预测基因的基因本体。
[0252] 结果
[0253] 个体人口统计学
[0254] 表1(目的1)和表2(目的2)中提供了人口统计学信息。年龄在IS和对照组间具有显著差异(p<0.05)(表1和2)。性别在Tang et al,2006的研究[Tang Y et al.,J Cereb 
Blood Flow Metab.,26:1089-1102(2006)]和本研究(表1)中的IS和健康个体间、以及在本
研究中的IS和血管风险因子(SAVVY)对照个体间具有显著差异(表2)(p<0.05)。人种在IS与
健康者和MI对照之间具有显著差异(p<0.05)(表2)。高血压和糖尿病在各组之间没有显著
差异。
[0255] 表1.来自我们之前的Tang et al.2006研究[Tang Y et al.,J Cereb Blood Flow Metab.,26:1089-1102(2006)]和我们当前的缺血性卒中(IS)和健康对照的个体的人
口统计学总结。N=个体数
[0256]
[0257]
[0258] =3h为67,5h为66,24h为66。61个个体有所有的三个时间点。
[0259] *性别分布在本研究与Tang et al.20061研究的健康个体之间具有显著差异(p<0.05),而在本研究与Tang et al.2006[Tang Y et al.,J Cereb Blood Flow Metab.,26:
1089-1102(2006)]研究的IS个体之间具有边界性差异。
[0260] 表2本研究参与者的人口统计学总结
[0261]
[0262] =3h为67,5h为66,24h为66。61个个体有所有的三个时间点。
[0263] *性别分布在缺血性卒中(IS)和血管风险因子(SAVVY)对照之间具有显著差异(p<0.05)。
[0264] MI=心肌梗塞N=个体数
[0265] **人种在IS与健康者和MI之间具有显著差异(p<0.05)。
[0266] 1)在更大队列中Tang et al,2006[Tang Y et al.,J Cereb Blood Flow Metab.,26:1089-1102(2006)]的IS预测基因的重复
[0267] 由于Tang et al,2006[Tang Y et al.,J Cereb Blood Flow Metab.,26:1089-1102(2006)]的研究和本研究中使用不同的阵列处理方案,因此进行了以下分析:(1)在第
一随机半数新样本(训练集)上保留预测算法,并在第二半数样本中评价29个探针组的性能
(检验/确认集);以及(2)将Tang et al,2006研究[Tang Y et al.,J Cereb Blood Flow 
Metab.,26:1089-1102(2006)]和本研究中使用的样本相对于内参基因标准化。总的来说,
实现了高检 验集概率,IS的灵敏性为92.9%,健康对照的特异性为94.7%(图1,表3)。结果与这些预测基因分类以前公布的患者[Tang Y et al.,J Cereb Blood Flow Metab.,26:
1089-1102(2006)]的能力(IS的灵敏性为88.9%,健康对照的特异性为100%)相似(表3),此
外,为了与之前的研究[Tang Y et al.,J Cereb Blood Flow Metab.,26:1089-1102
(2006)]进行比较的目的,在我们的IS和健康样本的完整集上进行RMA标准化和交叉验证
(在之前的研究[Tang Y et al.,J Cereb Blood Flow Metab.,26:1089-1102(2006)]中使
用的)。获得了相似的结果(表5和图4)。
[0268] 表3.来自Tang et al.2006研究[Tang Y et al.,J Cereb Blood Flow Metab.,26:1089-1102(2006)]的29个探针组的验证。这些探针组在本研究的第一半数个体(n=35个
IS,n=19个健康者)(训练集)中训练,然后用于在本研究的第二半数缺血性卒中(IS)个体
(检验集)(n=35,99个样本)和健康个体(n=19,19个样本)上预测检验集概率。此外,使用相同的探针组在Tang etal.2006研究中原来的个体上预测检验集概率。
[0269]
[0270] 灵敏性=IS样本正确分类的百分比
[0271] 特异性=健康样本正确分类的百分比
[0272] 表4.3h和24h缺血性卒中(IS)预测基因的分类准确性(%)。半数个体(训练集)用于分离IS预测基因。对于第二半数个体上的检验集预测准确性评估,3h IS(n=33)、24h IS(n=
33)、健康者(n=19)、血管风险因子(SAVVY)(n=26)和MI(n=8)。60个探针组3h IS预测基因代表3h IS与以下三种对照组相比的总和:健康者(17)、SAVVY(22)和MI(31),其中10个是3h IS相比于MI的预测基因和3h IS相比于SAVVY的预测基因共有的,产生了60个探针组。46个
探针组24h IS预测基因代表24h IS与以下三种对 照组相比的总和:健康者(20)、SAVVY(9)和MI(17)。3h和24h IS组合预测基因代表3h IS预测基因(60)和24h IS预测基因(46)的总
和,其中9种是共有的,产生了97个探针组。
[0273]
[0274] ║3h的正确分类=76%,24h的正确分类=97%。#3h的正确分类=94%,24h的正确分类=97%。
[0275] 表5.来自Tang et al,2006研究[Tang Y et al.,J Cereb Blood Flow Metab.,26:1089-1102(2006)]的29个探针组的确认。交叉验证概率。在本研究样本(IS:n=70、199个样本)和健康样本(n=38、38个样本)上训练和交叉验证。
[0276]
[0277] 灵敏性=IS样本正确分类的%
[0278] 特异性=健康样本正确分类的%
[0279] 2)IS相对于数个不同对照组的预测的改进
[0280] IS患者与对照的区分
[0281] 对于每种比较,单独分离预测性基因表达特征。为了将3h IS组与健康者(训练集)、MI(交叉验证集,由于MI的样本较小)和SAVVY(训练集)对照组相区分,PAM分类算法分别分离出17、31和22种预测探针组/ 基因。3h IS与健康者、MI和SAVVY对照样本相比,将这些基因输入PAM来预测检验组中个体的类别分别产生87.9/94.7%、98.5/82.4%和100/96.2%
的灵敏性/特异性(分别为图5、6和7)。
[0282] 为了将24h IS组与健康者(训练集)、MI(CV组,由于MI的样本较小)和SAVVY(训练集)对照组相区分,PAM分类算法分别分离出20、19和9种预测探针组/基因。24h IS与健康
者、MI和SAVVY对照样本相比,将这些基因输入PAM来预测检验组中个体的类别分别产生
90.9/94.7%、93.9/88.2%和97/100%的灵敏性/特异性(分别为图8、9和10)。
[0283] 3h IS预测基因在3h IS、健康者、MI和SAVVY个体上的预测准确性
[0284] 将来自各比较分析的3h预测基因的列表组合产生了60个独特的探针组,代表56个注释的基因。利用PAM在检验集上的预测概率提供在图2A中。来自PAM以及最佳表现预测模
型(SVM)的正确预测的样本百分比提供在表4中。总(标准化)准确性是91.2%。利用SVM,灵敏性为94%,SAVVY的特异性为96%,MI的特异性为88%以及健康者的特异性为68%。与SVM相比,PAM分析对IS产生的较低的灵敏性,但对健康个体产生较高的特异性(表4)。除了分样分析,还进行10倍交叉验证,其是开发和评价小样本的预测算法的优选方法。这产生了预期的更
好的预测结果(表6和图11A)。
[0285] 表6.3h和24h缺血性卒中(IS)预测基因的分类准确性(正确分类%)。交叉验证使用的样本大小是:3h IS的n=67,24h IS的n=66,SAVVY的n=52,MI的n=17。在检验集上的分样预测性能评价使用的样本大小是:3h IS的n=33,24h IS的n=33,SAVVY的n=26,MI的n=8。60个探针组3h IS预测基因代表3h IS与以下三种对照组相比的总和:健康者(17个探针组)、
SAVVY对照(22个探针组)和MI(31个探针组)。46个探针组24h IS预测基因代表24h IS与以
下三种对照组相比的总和:健康者(20个探针组)、SAVVY对照(9个探针组)和MI(17个探针
组)。3h和24h IS组合预测基 因代表3h IS预测基因(60)和24h IS预测基因(46)的总和,其中9个是共有的,因而产生了97个探针组。
[0286] *121模型空间的准确性(标准化)估计=86.4%(150/174)。最佳模型:SVM
[0287]
[0288] (收缩=是,损失=201、nu=0.5、tol=0.001、kern rbf deg=3、径向基函数(γ)=0.001、coef=0.0)。 模型空间的准确性(标准化)估计=89.2%(154/173)。最佳模型:SVM
(收缩=是,损失=201、nu=0.5、tol=0.001、kern rbf deg=3、径向基函数(γ)=0.0001、coef=
0.0)。 模型空间的准确性(标准化)估计=88.2%(212/240)。最佳模型:SVM(收缩=是,损
失=101、nu=0.5、tol=0.001、kern rbf deg=3、径向基函数(γ)=0.01、coef=0.0)。║3h的正确分类为=87%、24h的正确分类为=96%。
[0289] 24h IS预测基因在24h IS、健康者、MI和SAVVY个体上的预测准确性
[0290] 将来自各比较分析的24h预测基因的列表组合产生了46个独特的探针组,其代表32个注释的基因。利用PAM在检验集上的预测概率提供在图2B中。来自PAM以及SVM(最佳表
预测模型)的正确预测的样本百分比提供在表4中。总(标准化)准确性是89.2%。利用SVM,灵敏性为94%,SAVVY的特异性为96%,MI的特异性为50%以及健康者的特异性为84%。利用10倍交叉验证再次获得了更好的结果(表6和图11B)。
[0291] 组合的3h和24IS预测基因在3h和24h IS、健康者、MI和SAVVY个体上的预测准确性
[0292] 将来自各比较分析的3h和24h预测基因的列表组合产生了97个独特的探针组,其代表79个注释的基因。利用PAM在检验集上的预测概 率提供在图2C中。来自PAM以及SVM(最佳表现预测模型)的正确预测的样本百分比提供在表4中。总(标准化)准确性是91.2%。利用SVM,灵敏性为95%,SAVVY的特异性为96%,MI的特异性为75%以及健康者的特异性为68%。与SVM相比,PAM分析对IS产生的较低的灵敏性,但对健康个体产生较高的特异性(表4)。同样的,由于MI个体的样本量较小,进行10倍交叉验证而产生了更好的结果(表6和图11C)。
[0293] IV.所述生物标志物的主要生物学功能
[0294] 利用信号网络分析软件(参见补充材料),凝血系统是组合的3h和24h IS预测基因的97个探针组列表中唯一的统计学过度表现的生物功能。凝血基因包括凝血因子V(促凝血
球蛋白原、易变因子)(F5)和血栓调节蛋白(THBD)。GO注释和预测基因的完整列表提供在表
7A-C中。严格性较低的标准产生大量具有很多调控通路的基因。
[0295] 表7A.组合的3h和24h IS预测基因–基因的鉴定
[0296]
[0297]
[0298]
[0299]
[0300]
[0301]
[0302]
[0303]
[0304]
[0305]
[0306]
[0307]
[0308]
[0309] 表7B.组合3h和24h IS预测基因–其它基因的鉴定
[0310]
[0311] 表7C组合的3h和24h IS预测基因–表达的倍数变化
[0312]
[0313]
[0314]
[0315]
[0316] 讨论
[0317] 缺血性卒中的诊断基于临床印象与脑成像的联合。然而,在急性环境下,脑成像并非总是容易获取,并且在卒中领域中有经验的人员的临床评价并非总是容易获得。在这些患者中,血液测试能够用于诊断缺血性卒中(IS)。几种蛋白生物标志物与IS相关,但在急性环境下,这些还没有显示出可用于临床的足够的灵敏性和特异性[Whiteley W et al.,
Stroke39:2902-2909(2008);Foerch C et al.,Neurology,73:393-399(2009);JensenMB et al.,Expert Rev Cardiovasc Ther.,7:389-393(2009)]。在本研究中,我们证实,基因表达谱能够用作IS的生物标志物,正如我们之前的发现所重复证实的,并且通过包括更多
相关的对照组改进了IS的基因表达特征。
[0318] 之前报道了能将IS与健康对照区分开的29个探针组谱[Tang Y et al.,J Cereb Blood Flow Metab.,26:1089-1102(2006)]。当该谱在本研究中用于预测更大的患者队列
时,其以92.9%的灵敏性和94.7%的特异性将IS与健康个体相区分。这是至关重要的,因为其表明这种构思的确认,即,基因表达谱能够鉴定卒中患者。基因表达谱的重复在本领域是一项挑战,在很大程度上是因为与进行多重比较相关的错误发现。详实的生物学反应和认真
分析使得在本研究内能够证实该29个探针组谱型。
[0319] 为了获得更多的生物学有用的IS预测基因,鉴定了能将IS与具有血管风险因子(RF)和心肌梗塞(MI)的患者区分开的基因谱。利用各种组比较,预测到与血管风险因子组
相比,IS组的诊断具有超过95%的灵敏性和特异性。利用各种组比较,以超过90%的灵敏性和超过80%的特异性将IS患者与MI区分开。在生物学上,这表明对脑和心脏中的梗塞的免疫应答中存在至少一些差异。
[0320] 3小时的时间点是大部分比较的重点,因为其代表作出关于急性治疗(诸如溶栓)的决定的关键时间。因而,为了开发即时检验,该时间段是基因表达谱能够发挥最大作用的时候。利用60个探针组特征,在3小时时间点时,对于IS、血管风险因子、MI和健康对照,分别获得了85-94%、92-96%、88%和68-84%的正确分类率。这接近临床有用的范围。
[0321] 尽管RNA谱是本研究的焦点,但是鉴定出的基因能够用作评价缺血 性卒中的蛋白生物标志物的指导。因子5和血栓调节素的基因都被鉴定为相对于对照在IS中是差异表达
的。这两种分子还被鉴定为与IS相关的蛋白[Tang Y et al.,J Cereb Blood Flow 
Metab.,26:1089-1102(2006);Moore DF et al.,Circulation,111:212-2212005;Kozuka K et al.,Atherosclerosis,161:161-168(2002)]。
[0322] 本研究的目的不是鉴定IS和对照间所有差异表达的基因,而是鉴定其表达模式可用于卒中预测的基因的组。因此,这些分析排除了在IS中是生物学相关的大量差异表达的
基因。这些将是未来研究的主题。本研究的局限包括(1)对照组中缺乏卒中“模拟”,(2)缺乏可能用于临床应用的qRT-PCR验证,(3)在来自IS患者的5h和24h血液样本中混杂的治疗效
应,(4)由于在某些人种类别中没有个体造成的不同分布而导致未包括人种,以及(5)年龄
是一种混杂因素,其是通过将年龄在ANCOVA模型中作为因素并通过选择与IS患者具有接近
的年龄分布的对照组来解决的。
[0323] 实施例2:用于诊断缺血性卒中致因的生物标志物
[0324] 1.研究患者
[0325] 如之前所述的,从CLEAR试验招募急性缺血性卒中患者,所述CLEAR试验是重组组织纤溶酶原活化剂(rt-PA)和依替巴肽的多中心、随机化的双盲安全性研究[Pancioli AM 
et al.,Stroke,39:3268-3276(2008)](Clinical-Trials.gov的NCT00250991)。每个地方
的机构审查委员会都批准了该研究方案,并且在进入研究之前,从每位患者获得书面知情
同意书。合格的患者具有急性缺血性卒中的诊断,在卒中发生3小时内开始治疗,美国国立卫生研究院卒中量表(NIHSS)>5,并且年龄为18-80岁。所有患者具有标准化的临床评价,包括NIHSS和脑成像。在卒中发生后≤3小时、5和24小时,将血液样本抽入PAXgene管
(PreAnalytiX,Hilden,Germany),用于基因表达分析。从76名患者获得总共194份样本。
[0326] 缺血性卒中的病因根据TOAST[Adams HP,Jr.,et al.,Stroke,24:35-41(1993)]分类。研究包括心源性卒中、大血管性卒中和致因不明的卒中(未确定病因)患者。心源性卒中需要鉴定出至少一种心脏栓塞来源,并排除大血管性或小血管性卒中致因。大血管性卒
中需要身体同侧的颅外或颅 内动脉狭窄大于50%,并排除心源性和小血管性卒中致因。利
用医疗史、血液检测、脑成像、多普勒与血管造影以及心脏检查确定卒中致因。利用心电图、超声心动图和24-48小时的心脏监测鉴定心房纤颤患者。对照血液样本采自与卒中个体年
龄、性别和人种相似的23名对照个体。这些个体没有缺血性卒中或心血管疾病病史,没有近期感染,没有血液病。
[0327] 2.样本处理
[0328] 从肘前静脉收集全血,移入PAXgene管(PreAnalytiX,Germany)。在室温下2小时后,将PAXgene管于-80°C冷冻。在同一实验室处理所有样本。按照生产商的方案(PAXgene血液RNA试剂盒;Pre-AnalytiX)分离总RNA。分析RNA中利用Agilent2100Bioanalyzer进行定
量,利用Nano-Drop(Thermo Fisher)进行浓缩。样本需要满足纯化的RNA的A260/A280吸光
度比值≥2.0,28S/18S rRNA比值≥1.8。利用Nugen’s Ovation Whole Blood Solution
(Nugen Technologies,San Carlos,CA)进行逆转录、扩增和样本标记。按照生产商的方案,将每个RNA样本杂交到Affymetrix Human U133Plus2.0GeneChips(Affymetrix Santa 
Clara,CA)上,其含有54,697个探针组。在Fluidics Station450上洗涤和处理阵列,然后在Genechip Scanner3000上扫描。样本随机分配至通过卒中致因分类的微阵列批次上。
[0329] 3.基因表达谱分析
[0330] 将原始表达值(探针水平数据)输入Partek软件(Partek Inc.,St.Louis,MO)中。将它们进行log变换,并利用RMA(Robust Multichip Average)和我们之前报道的内参基因
标准化方法[Stamova BS et al.,BMC Med Genomics,2:49(2009)]标准化。利用Partek 
Genomics Suite6.04进行统计学分析、主成分分析和分层无监督聚类分析。利用PAM
(Prediction Analysis of Microarrays)中的k-最邻近法和10倍留一交叉验证建立作为
类别预测工具的遗传生物标志物子集的保真度[Tibshirani RJ and Efron B.,Stat Appl 
Genet Mol Biol.,1:Article1(2002)]。留一交叉验证提供了遗传分类器的概括能力的相
对的无偏估计。在90%的样本上产生模型,并用于 预测其余10%的样本。将该过程重复10次,以计算模型中的总体误差。信号网络分析( IPA ,Ingenuity 
www.ingenuity.com)用于确定在给定的通路或细胞功能中受调控的基因数量是否大于偶
然预期(费希尔精确检验)。
[0331] 4.统计学分析
[0332] 利用费希尔精确检验和双尾t检验(如果合适的话)分析组间人口统计学数据的差异。将所有数据表示为平均值±标准误。为了鉴定能将心源性卒中与大血管性卒中区别开
的基因表达谱,使用重复测量方差分析(ANOVA),包括卒中病因、时间、卒中病因和时间相互作用和模型中的个体变异。使用无监督的分层聚类分析和主成分分析(PCA)来评价心源性
卒中和大血管性卒中间的相互关系。p值≤0.005和倍数变化≥|1.2|的基因探针被认为是
显著的。
[0333] 使用相似的分析来鉴定能将由于心房纤颤引起的心源性卒中与非心房纤颤致因区分开的基因表达谱。使用重复测量ANOVA,包括心源性卒中病因、时间和模型中的个体变异。使用无监督的分层聚类分析和PCA来评价心房纤颤导致的心源性卒中和非心房纤颤导
致的心源性卒中间的相互关系。p值≤0.005和倍数变化≥|1.2|的基因探针被认为是显著
的。
[0334] 通过将心源性卒中和大血管性卒中个体与对照个体进行比较来进行功能分析。使用单向ANCOVA,调整年龄和性别。p值≤0.005和倍数变化≥|1.2|的基因探针被认为是显著的,并在IPA中进行分析。
[0335] 结果
[0336] 心源性缺血性卒中相比于大血管性缺血性卒中
[0337] 用于比较心源性卒中与大血管性卒中的个体的人口统计学特征和临床特征如表8所示。心房纤颤是唯一的组间显著不同的变量(p<0.05)。有69个心源性卒中样本和30个大
血管性卒中样本。
[0338] 首先,评价之前公开的77个基因的列表将心源性卒中与大血管性卒中相区分的能力[Xu H et al.,J Cereb Blood Flow Metab.,28:1320-1328(2008)]。该基因列表基于最
初在CLEAR试验中招募的11名患者,其中 7名为心源性卒中,4名为大血管性卒中。利用k最邻近法预测模型,最初的77个基因的列表用于预测已完成的CLEAR试验患者群体。在82.6%
的样本中正确预测了心源性卒中,在80.0%的样本中正确预测了大血管性卒中。然而,在10倍留一交叉验证上,56.5%被正确预测为心源性卒中,60%被正确预测为大血管性卒中,在大多数样本中,预测诊断的概率低于90。这些结果表明,血液中的基因表达谱能够区分卒中致因,但是需要进一步的改进来为更大的患者群体更好地概括出基因组预测基因。
[0339] 因而进行了全部CLEAR试验患者的分析。重复测量ANOVA鉴定了在全部三个时间点、心源性卒中和大血管性卒中间显著差异的40个基因(表13)。40个基因的分层聚类图如
图12a所示,主成分分析(PCA)如图12b中所示。40个基因以至少2个标准差区分大血管性卒
中和心源性卒中(图12b)。分层聚类图证实了在心源性卒中中上调且在大血管性卒中中下
调的一组基因。还有一组在心源性卒中中下调且在大血管性卒中中上调的基因。在缺血性
卒中后≤3小时、5小时和24小时,40个基因区分大血管性卒中和心源性卒中,如图17所示。
[0340] 心源性卒中和大血管性卒中的预测
[0341] 利用PAM中的10倍留一交叉验证评价40个基因分别预测心源性卒中与大血管性卒中的能力。在99个样本中,69个心源性卒中样本中的100%被正确预测,30个大血管性卒中样本中的96.7%被正确预测(图13)。对于大多数样本,预测诊断的概率>90%(图13)。为了进一步评价40个基因的列表,其被应用于另外一组具有已知心源性卒中的患者。在10个样本中,
90%(9/10)被正确预测为心源性卒中。
[0342] 40个基因的列表随后被用于在致因不明的卒中患者中预测卒中致因。有36名患者(85个样本)具有致因不明的卒中。为了考虑通过预测模型分类,需要来自每位患者的全部
样本对相同的预测诊断具有>90%的概率。共15名患者(41%)被预测为具有与心源性卒中相
似的谱,概率>90%,共6名患者(17%)被预测为具有与大血管性卒中相似的谱,概率>90%。这代表致因不明的卒中中58%可能被重新归类为心源性卒中或大血管性卒中。
[0343] 功能分析
[0344] 为了确定与心源性卒中和大血管性卒中相关的功能通路,将心源性卒中和大血管性卒中个体与对照进行比较。在心源性卒中个体和对照间有731个显著差异的基因,在大血管性卒中和对照间有782个显著差异的基因(p<0.005,倍数变化≥|1.2|)。这两个基因列表如图14中的文氏图所示。有503个心源性卒中特有的基因,554个大血管性卒中特有的基因,以及228个心源性卒中和大血管性卒中共有的基因。这些基因列表的主要经典功能和分子
功能如表9-11所示。
[0345] 在503个心源性卒中基因中,之前已经与三种主要的心脏疾病相关的具体基因包括:心房纤颤基因:CREM、SLC8A1、KNCH7、KCNE1;心肌梗塞基因:PDE4B、TLR2;以及心衰基因:
MAPK1、HTT、GNAQ、CD52、PDE4B、RAF1、CFLAR和MDM2(表9)。心源性卒中与淋巴细胞的发育、炎性病症、心肌细胞死亡和磷脂酰肌醇4-磷酸修饰相关。主要经典途径(Top canonical 
pathway)包括肾素-血管紧缩素信号转导、促血小板生成素信号转导、NF-κB活化、心脏肥大和B细胞受体信号转导(表9)。
[0346] 在554个大血管性卒中基因中,之前已经与动脉粥样硬化损伤和动脉粥样硬化斑块相关的具体基因包括:MMP9、FASLG、CX3R1、RAG1、TNF、IRAG1、CX3CR和THBS1(表10)。大血管性卒中与T细胞和白细胞发育、炎症和侵袭相关。主要经典途径包括T细胞活化和调控、巨噬细胞中的CCR5信号转导、松弛素信号转导以及促肾上腺皮质激素释放信号转导(表10)。
[0347] 共228个基因是心源性卒中和大血管性卒中共有的,代表缺血性卒中(图14)。其与白细胞和吞噬细胞发育和移动、心血管过程、NF-κB应答元件表达和氧化应激相关(表11)。
主要经典途径包括p38MAPK信号转导、toll样受体信号转导、IL-6和IL-10信号转导、NK-κB信号转导、B细胞受体信号转导以及NRF介导的氧化应激(表11)。
[0348] 心房纤颤心源性卒中相比于非心房纤颤心源性卒中
[0349] 有23名个体患有心源性卒中,在常规检查上鉴定出10名患有房纤颤,13名未患心房纤颤。排除了非心房纤颤组中很可能具有阵发性心房纤颤的个体。为此,首先将10名心房纤颤卒中患者与10名大血管性卒中患者进行比较。重复测量的ANOVA鉴定出心房纤颤的39
个基因的谱。然后,用该谱预测在常规检查上鉴定为无心房纤颤的的13名心源性卒中个体
中哪些具有与心房纤颤相似的最高概率。有5名个体落入具有已知心房纤颤的患者的平均
预测概率的4个标准差内。这些患者被认为很可能患有阵发性心房纤颤,并因而排除在进一步的分析之外,其作为降低非心房纤颤组中存在阵发性心房纤颤的概率的保守方法。将其
余的8名非心房纤颤患者与10名心房纤颤患者进行比较。人口统计学特征和临床特征如表
12中所示。心房纤颤是两组间唯一的显著差异的变量(p<0.05)。重复测量ANOVA鉴定出37个在心源性卒中的心房纤颤和非心房纤颤致因之间显著差异的基因(表14)。37个基因的分层
聚类图如图15a所示,PCA如图15b所示。37个基因能清楚地区分非心房纤颤和心房纤颤(图
15)。在缺血性卒中后≤3小时、5小时和24小时,37个基因能够区分非心房纤颤和心房纤颤(图18)。将37个基因应用于排除在分析之外的5名个体,其中2名被预测为患心房纤颤,2名未确定,1名被预测未非心房纤颤心源性卒中。
[0350] 心房纤颤心源性卒中和非心房纤颤心源性卒中的预测
[0351] 利用PAM中的10倍留一交叉验证评价37个基因分别预测心源性卒中的心房纤颤致因和非心房纤颤致因的能力。在60个样本中,30个心房纤颤心源性卒中样本中的100%被正
确预测,30个非心房纤颤心源性卒中样本中的91.7%被正确预测(图16)。此外,对于大多数样本,预测诊断的概率>90%。
[0352] 37个基因的列表被用于预测在常规试验上鉴定为没有心房纤颤的10个心源性卒中样本的检验集。在这10个样本中,当与具有已知的有症状心房纤颤的个体的基因表达谱
相比,3名(30%)被预测为患有阵发性心房纤颤,概率>90%。37个基因的列表还被用于预测致因不明的卒中患者的卒中致因。有11名致因不明的卒中患者,基于40个基因谱,将他们预 测为患心源性卒中。在这11名患者中,基于与具有已知的心房纤颤卒中的个体相似的基因
表达谱,3名患者(27%)被预测为患阵发性心房纤颤,概率>90%。
[0353] 讨论
[0354] 确定缺血性卒中致因是至关重要的,因为其能指导处理决定,诸如是否启动抗血小板或抗凝血治疗。然而,在很多患者中鉴定卒中致因仍是有难度的,正如致因不明的卒中所示。考虑到致因不明的卒中占缺血性卒中的大约30%,需要更好的分类工具。本文描述了利用血液基因表达谱在分子水平上区分大血管性卒中和心源性卒。40个基因的表达谱能够
区分大血管性卒中和心源性卒中,37个基因的表达谱能区分由心房纤颤致因导致的心源性
卒中和由非心房纤颤导致的心源性卒中。当应用于致因不明的卒中时,58%的个体能以>90%的概率重新分类为心源性卒中或大血管性卒中。
[0355] 已经很好地描述了大规模基因表达谱分析的局限性[Schulze A and Downward J.,Nat Cell Biol.,3:E190-195(2001)]。然而,类似的方法已应用于人类恶性肿瘤患者,并且其被转化成用于诊断目的的基于PCR的阵列[Hedenfalk I et al.,N Engl J Med.,
344:539-548(2001);Valk PJ et al.,N Engl J Med.,350:1617-1628(2004)]。与具有不
同组织学标准的人类恶性肿瘤不同,缺血性卒中亚型是多种多样的,并且依赖于临床和检
验标准的组合。在严格的患者选择下,用生物标志物将缺血性卒中亚型通过分子学方式分
入临床相关的亚组似乎是可行的。事实上,血液中的数种促血栓形成和炎症生物标志物在
每种缺血性卒中亚型中是不同的[Laskowitz DT et al.,Stroke,40:77-85(2009);
Shibazaki K et al.,Intern Med.,48:259-264(2009);Montaner J et al.,Stroke,39:
2280-2287(2008);Hassan A et al.,Brain,126:424-432(2003);Xu H et al.,J Cereb 
Blood Flow Metab.,28:1320-1328(2008)]。
[0356] 心源性卒中和大血管动脉粥样硬化性卒中
[0357] 鉴定除了能够区分大血管性卒中与心源性卒中的基因表达谱。这种 差别在临床上是重要的,因为治疗和诊断测试在两种亚型间是不同的。通常,心源性卒中受益于抗凝处理,而大血管性卒中受益于抗血小板疗法和血管手术。确定卒中病因以及待启动的预防性
处理依赖于诊断性检测。事实上,TOAST标准需要排除卒中的其它致因,从而做出可能的致因诊断[Adams HP,Jr.,et al.,Stroke,24:35-41(1993)]。因此,缺血性卒中患者常常经历大量的检测来进行血管成像并评价心功能。通过利用基因表达谱能够更好地集中确定卒中
致因的诊断检测,尤其在致因不明的卒中中。以这种方式,可以将大量的资源投向个体将获得最高的收益的地方。
[0358] 心源性卒中
[0359] 目前,选择哪些缺血性卒中患者需要诸如动态心电图监测的心脏检查,并且超声心动图基于临床判断与脑成像的联合。然而,确定哪些缺血性卒中患者应当通过经胸廓和
经食管超声心动描记术筛查是有难度的。尽管年龄<50岁与较高的诊断率相关,但是很多卒中患者大于50岁。基因表达谱联合临床印象能作为指引超声心动描记术的向导。
[0360] 在缺血性卒中之后,还通常进行心律失常的心脏监测。鉴定心房纤颤是重要的,因为抗凝处理减少复发的栓塞事件。然而,心脏监测24至48小时常常会错过阵发性心房纤颤[Tayal AH et al.,Neurology,71:1696-1701(2008);Ziegler PD et al.,Stroke,41:
256-260]。提示患者具有高心房纤颤概率的基因表达谱可以作为额外工具来辅助预防这种
错过的治疗机会。在常规检查上鉴定为没有心房纤颤的10名心源性卒中的组中,证实了基
因表达谱能够以大于90%的概率预测3名个体(30%)患有阵发性心房纤颤。这与之前的在常
规检查上没有心房纤颤的心源性卒中的研究一致,其中利用长期心脏监测能鉴定出额外
23-28%的阵发性心房纤颤病例[Tayal AH et al.,Neurology,71:1696-1701(2008),
Ziegler PD et al.,Stroke,41:256-260]。通过基因表达谱鉴定看起来患有心房纤颤的个
体可以是这类长期心脏记录的目标组。
[0361] 大血管性卒中
[0362] 基因表达谱还可以辅助大血管性卒中的诊断。大血管动脉粥样硬化疾病的评价包括利用磁共振血管造影(MRA)的颅外和颅内血管成像、计算机断层扫描血管造影(CTA)、超
声和常规血管造影。血管成像结果会发生不一致的情况。例如,通过超声检测的颈动脉狭窄程度可能与通过MRA或CTA检测到的狭窄程度不一致。在成像之外补充能提示有症状的动脉
粥样硬化疾病的基因表达谱能够增加大血管动脉粥样硬化疾病诊断的可信度。大血管疾病
的存在主要基于单个因素,即血管狭窄的程度。在TOAST标准中,狭窄低于50%被认为是阴性的[Adams HP,Jr.,et al.,Stroke,24:35-41(1993)]。基因表达谱提供了与有症状的动脉
粥样硬化疾病(尤其是炎症)相关的因素的其它标准。这与确定粥样斑炎症的MRI方法的理
念相似[Tang TY et al.,Arterioscler Thromb Vasc Biol.,29:1001-1008(2009)]。基因
表达谱的这些推荐应用需要进一步的研究。然而,它们有前景作为更好的靶向于缺血性卒
中患者的研究和治疗的方法。
[0363] 致因不明的卒中
[0364] 致因不明的卒中是复杂的患者群体,其需要更好的诊断工具。本文描述的基因表达谱被应用于致因不明的卒中组,预测41%患有心源性卒中。在这些患者中,27%被提示患有心房纤颤。具有与心源性卒中相似的分子学特征的致因不明的卒中患者可以一组可以致力
于长期的心脏监测的群体,并且可能代表一组可以进行抗凝试验的群体[Tayal AH et 
al.,Neurology,71:1696-1701(2008);Harloff A et al.,Stroke,37:859-864(2006);
Sacco RL et al.,Cerebrovasc Dis.,22:4-12(2006);Mohr JP et al.,N Engl J Med.,
345:1444-1451(2001)]。致因不明组中的17%还被预测为患有大血管性卒中。该发现可能代表有症状的狭窄<50%,但是需要利用详细的血管成像进行进一步的研究。
[0365] 功能分析
[0366] 缺血性卒中患者的血液中基因表达变化的原因很大程度上取决于炎症模式的不同。血液中RNA的主要来源是免疫细胞,包括白细胞、嗜中性粒细胞和单核细胞[Du X et 
al.,Genomics,87:693-703(2006)]。免疫细胞 提供患者疾病状态及随后应答的间接反应,所述随后应答例如对缺血性脑组织的免疫应答和对血管风险因子介导的疾病的免疫应答。
这些应答中的大多数仍不清楚,但是这些应答在心源性卒中和大血管性卒中个体之间安排
的方式似乎存在差异。心源性卒中和大血管性卒中的40个基因谱,以及由于心房纤颤和非
心房纤颤引起的心源性卒中的37个基因谱证实了这一点。不同的基因与大血管性卒中、心
源性卒中和心房纤颤来源卒中有关这一事实提示每种疾病状态中特定的免疫应答。这些差
异的确切致因,包括免疫细胞-内皮相互作用,仍是未知的,并且随着每种疾病状态和致因的研究会变得更加清楚。
[0367] 综上所述,本发明提供了能够鉴别缺血性卒中的心源性亚型和大血管性亚型的基因表达特征。基因表达谱可用于血液测试的开发,从而辅助缺血性卒中的分类,靶向卒中研究和治疗,以及确定致因不明的卒中的致因。
[0368] 表格
[0369] 表8:心源性卒中和大血管性卒中个体的人口统计学变量。P值代表利用费希尔精确检验或双尾t检验(如果合适的话)进行的心源性卒中与大血管性卒中个体的比较。(BP:
血压;CABG:冠状动脉旁路搭桥术)
[0370]
[0371]
[0372] 表9:与对照相比,心源性卒中特有的503个基因的功能分析(p<0.005,FC>|1.2|)
[0373]
[0374]
[0375] 表10:与对照相比,大血管动脉粥样硬化性卒中特有的554个基因的功能分析(p<0.005,FC>|1.2|)。
[0376]
[0377]
[0378] 表11:对照相比,心源性卒中和大血管动脉粥样硬化性卒中共有的228个基因的功能分析(p<0.005,FC>|1.2|)。
[0379]
[0380]
[0381] 表12:由于心房纤颤和非心房纤颤致因导致的心源性卒中个体的人口统计学变量。P值代表利用费希尔精确检验或双尾t检验(如果合适的话)进行心房纤颤个体与非心房
纤颤个体的比较。(BP:血压;CABG:冠状动脉旁路搭桥术)
[0382]
[0383]
[0384] 表13A.能区分心源性卒中与大血管性卒中的40个基因的列表(p<0.005、倍数变化>|1.2|)。
[0385]
[0386]
[0387]
[0388]
[0389]
[0390]
[0391]
[0392]
[0393] 表13B.能区分心源性卒中与大血管性卒中的其它基因(p<0.005,倍数变化>|1.2|)。
[0394]
[0395]
[0396]
[0397]
[0398] 表14.能区分颈动脉狭窄与心房纤颤的基因(p<0.005,倍数变化>|1.2|)。
[0399]
[0400]
[0401]
[0402]
[0403]
[0404]
[0405]
[0406]
[0407] 表15.能区分心房纤颤与非心房纤颤的40个基因的列表(p<0.005,倍数变化>|1.2|)。
[0408]
[0409]
[0410]
[0411]
[0412]
[0413]
[0414]
[0415] 表16.用于标准化及用作对照水平的血液中稳定表达的38种内源性参照生物标志物。
[0416]
[0417]
[0418]
[0419]
[0420]
[0421]
[0422]
[0423] 实施例3:利用用于诊断缺血性卒中发生和缺血性卒中致因的基因表达分析的示例性流程概要
[0424] 以下实施例提供了利用本文描述的生物标志物诊断疑似患有卒中的患者中卒中的发生和致因的示例性概要。
[0425] (1)可以利用微阵列进行生物标志物的检测,例如,微流体方法。从患者血液样本RNA制备并标记(例如,利用荧光团)cDNA。将标记的cDNA与微流体装置内的阵列上的探针杂交。测量结合的cDNA的荧光,从而提供患者血液中表达的每个基因的RNA量的定量测量。
[0426] (2)首先测量血液样本中至少约15个目标基因的RNA的量。测量血液样本中至少约30个内源性参照生物标志物的RNA的量。将每个目标基因的RNA的量相对于参照基因(几何
平均值)标准化,并获得每个目标基因的标准化的表达值。然后,将所有目标基因(15个或更多个)的表达用作预测方程的输入(例如,支持向量机),其然后确定个体的基因表达谱是否与卒中或对照的基因表达谱最相似,以及个体的基因表达谱是否与心源性卒中、动脉粥样
硬化性栓塞性卒中最相似或与两者都不相似。
[0427] (3)基于上述生物标志物的检测结果,为患者推荐和/或实施卒中的预防和/或治疗方案。
[0428] (a)基于表7A的生物标志物,具有卒中阳性诊断的患者可以进行进一步的确认性诊断检测,例如脑和血管的MRI成像、血液检测、EKG、超声心动图等。
[0429] (b)基于表7A的生物标志物,具有卒中阴性诊断的患者可以被送回家或可以进行不同疾病状态的诊断分析和/或检测。
[0430] (c)致因不明的卒中:例如,如果基于表13A和15生物标志物被确定是心源性的,则可以推荐或给予抗凝血剂。
[0431] (d)致因不明的卒中:例如,如果基于表14的生物标志物被确定是动脉粥样硬化,则患者可以进行血管成像,以使颈动脉和其它脑血管成像;可以推荐或给予抗血小板剂。
[0432] (e)例如,如果基于表13A和15生物标志物被诊断为心源性卒中,则可以推荐或给予抗凝血剂。
[0433] (f)例如,如果基于表14的生物标志物被诊断为大血管动脉粥样硬 化性栓塞性卒中,则患者可以进行血管成像,以使颈动脉和其它脑血管成像。例如,如果狭窄<50%或如果颅内或主动脉粥样硬化,则可以推荐或给予抗血小板剂。如果狭窄>50%,推荐或进行颈动脉手术。
[0434] 应当理解,本文描述的实施例和实施方案仅用于说明性的目的,并且根据其做出的各种修改或变化对本领域技术人员是显而易见的,且应包括在本申请以及后附权利要求
范围的精神和意图内。将本文引用的所有出版物、序列登录号、专利和专利申请通过引用全部并入本文,用于所有目的。
QQ群二维码
意见反馈