首页 / 专利库 / 心理学与精神病学 / 自闭症谱系障碍 / 自闭症 / 自闭症和其它发育障碍的筛查、诊断和预后

自闭症和其它发育障碍的筛查、诊断和预后

阅读:1012发布:2020-05-23

专利汇可以提供自闭症和其它发育障碍的筛查、诊断和预后专利检索,专利查询,专利分析的服务。并且本 发明 提供一种组合了功能基因组学和遗传学、 蛋白质 组学、解剖神经影像学、功能神经影像学、行为和临床测量以及数据分析以进行 自闭症 儿童群体筛查、诊断或 预后 的方法和系统。更确切地说,本发明提供了一种针对自闭症的加权基因和特征测试,所述测试使用了健康个体和患病个体的加权基因标签矩阵来与参考 数据库 进行比较。本发明还提供了标准化的基因表达值标签用于与参考数据库相比较。本发明另外将所述加权基因或所述标准化基因分析同与基因网络标签矩阵、多模态标签矩阵以及旁系特征标签矩阵的比较相组合以改善在自闭症,特别是针对新生儿、从出生到1岁的婴儿、1到2岁的幼童、2到3岁的幼童及3到4岁的年幼儿童的自闭症相关性筛查、诊断和预后方面的准确性。,下面是自闭症和其它发育障碍的筛查、诊断和预后专利的具体信息内容。

1.一种进行自闭症加权基因和特征测试(WGFTA)用于自闭症筛查、诊断或预后的方法,包括:
a)从受试者的生物样品获得分析物以获得一组至少20个或更多个基因的分析物相关基因表达平,所述基因是选自来源于自闭症参考数据库的模型;
b)对经过表达的所选组基因各自的表达水平进行统计学标准化,以得出所述所选组中每个基因的标准化基因表达值(NGEV);
c)由所述自闭症参考数据库制备所述所选基因组的加权基因标签矩阵(WGSM);
d)通过用每个基因的NGEV乘以所述基因的基因特异性权重来计算所述所选组中
每个基因的加权基因表达水平,其中所述基因特异性权重是由加权基因表达参考数据库(WGERD)中编译的至少所述所选组基因的相对表达水平的基于计算机的生物信息学分析得到;及
e)确定所述受试者的所述组每个加权基因表达水平与所述WGERD的差异,由此进行所述WGFTA以指出与自闭症险、诊断或预后的增加的相关性。
2.如权利要求1所述的方法,其中所述基因被选择并排列成具有至少10个基因的4个组,各自如表1中所示。
3.如权利要求1所述的方法,其中所述制备所述WGSM包括在所述受试者的生物样品中表达的从表1中所列基因选出的一组30个或更多个基因的表达水平。
4.如权利要求1所述的方法,其中所述制备所述WGSM包括在所述受试者的生物样品中表达的从表1中所列基因选出的一组50个或更多个基因的表达水平。
5.如权利要求1所述的方法,其中所述制备所述WGSM包括在所述受试者的生物样品中表达的从表1中所列基因选出的一组80个或更多个基因的表达水平。
6.如权利要求1所述的方法,其中所述制备所述WGSM包括在所述受试者的生物样品中表达的从表1中所列基因选出的一组160个或更多个基因的表达水平。
7.如权利要求1所述的方法,其中所述制备所述WGSM包括在所述受试者的生物样品中表达的从表1中所列基因选出的一组320个或更多个基因的表达水平。
8.如权利要求1所述的方法,其中来源于所述自闭症参考数据库的所述模型包含所述WGERD中编译的来自超过40位健康个体和40位自闭症个体的至少所述所选组基因。
9.如权利要求1所述的方法,其中所述基因是选自第1到4组的基因,并且权重绝对值在约0.50到约1.00范围内,如表1.1到1.4中所示。
10.如权利要求1所述的方法,其中所述基因是选自表2和表16到25中所列的基因。
11.如权利要求1所述的方法,其中所述基因选自涉及到细胞周期、蛋白质折叠、细胞粘附、翻译、DNA损害反应、细胞凋亡、免疫/炎症功能、信号转导ESR1-核路径、转录-mRNA加工、细胞周期减数分裂、细胞周期G2-M、细胞周期有丝分裂、细胞骨架-纺锤体微管以及细胞骨架-细胞质微管功能的基因。
12.如权利要求1所述的方法,其中所述生物样品选自血液、脐血、血清、血浆、脑脊髓液、尿液、泪液、唾液、粘液、口腔拭子、牙髓、神经元、皮肤以及其它体液或组织。
13.如权利要求12所述的方法,其中所述分析物是来自白细胞的脐血源性RNA。
14.如权利要求1所述的方法,其中所述分析物选自DNA、RNA、蛋白质和代谢物
15.如权利要求1所述的方法,其中所述分析物是RNA。
16.如权利要求1所述的方法,另外包括将所述受试者的基因网络标签矩阵(GNSM)与GNSM参考数据库相比较,以基于所述受试者的GNSM与所述GNSM参考数据库的差异来进行所述WGFTA用于自闭症风险筛查、诊断或预后。
17.如权利要求16所述的方法,其中所述GNSM包含由基因与基因的相互作用计算的特异性基因权重和特征的相互作用模式。
18.如权利要求17所述的方法,其中所述相互作用模式是基于基因与非基因组特征的关系或状态计算。
19.如权利要求1所述的方法,另外包括将所述受试者的多模态标签矩阵(MMSM)与MMSM参考数据库相比较,以基于所述受试者的MMSM与所述MMSM参考数据库的差异来进行所述WGFTA用于自闭症风险筛查、诊断或预后。
20.如权利要求19所述的方法,其中所述MMSM是包含通过临床、行为、解剖学和功能测量获得的非基因组特征的定量的矩阵。
21.如权利要求20所述的方法,其中所述非基因组特征包含年龄、GeoPreference测试、MRI/fMRI/DT1测试、ADOS测试或CSBS测试。
22.如权利要求21所述的方法,其中所述非基因组特征为年龄。
23.如权利要求1所述的方法,另外包括将所述受试者的旁系特征标签矩阵(CFSM)与CFSM参考数据库相比较,以基于所述受试者的CFSM与所述CFSM参考数据库的差异来进行所述WGFTA用于自闭症风险筛查、诊断或预后。
24.如权利要求23所述的方法,其中所述CFSM包含所述受试者旁系的特征。
25.如权利要求24所述的方法,其中所述旁系特征包含妊娠期间母体血液中的分析物、患有自闭症的同胞、母体基因组标签或预处理,或者胎儿期或围产期不良事件。
26.一种用于进行自闭症加权基因特征测试(WGFTA)用于自闭症筛查、诊断或预后的方法,包括:
a)从所述样品中所含的细胞获得含所关注分析物的生物样品;
b)制备加权基因标签矩阵(WGSM),其包含从表1到2和表16到25中所列基因选出的一组两个或两个以上分析物相关基因的表达水平;
c)通过用所述WGSM的标准化基因表达值(NGEV)乘以所述基因的基因特异性权重来计算所选组中每个基因的加权基因表达水平,所述基因特异性权重是由加权基因表达参考数据库(WGERD)中编译的来自超过40位健康个体和40位自闭症个体的至少所述所选组基因的相对表达水平的基于计算机的生物信息学处理得到;及
d)确定所述受试者的所述组的每个加权基因表达水平与所述WGERD的差异,由此针对风险进行所述WGFTA。
27.一种用于有需要的受试者的自闭症筛查、诊断或预后的系统,包含由选自表1到
2和表16到25中所列基因的至少20个或更多个基因和通过加权基因表达参考数据库(WGERD)中编译的至少所选组基因的相对表达水平的生物信息学计算处理得到的相应基因特异性权重构成的数据库,以及将所述数据库用于加权基因标签矩阵(WGSM)的使用说明书,所述WGSM包含含所关注分析物的生物样品中所表达的所选一组相同的20个或更多个基因的表达水平,所述系统是通过以下方式操作:a)用所述WGSM的标准化基因表达值(NGEV)乘以表1到2和表16到25中所提供的基因的基因特异性权重来计算所述所选组中每个基因的加权基因表达水平;及b)确定所述受试者的所述组中每个加权基因表达水平与加权基因表达参考数据库(WGERD)的差异,由此指示与自闭症风险、诊断或预后的增加的相关性。
28.一种进行有需要的受试者的自闭症加权基因和特征测试(WGFTA)用于自闭症筛查、诊断或预后的方法,包括对如表2中所示的一组至少约20个或更多个年龄加权的标签基因的基因表达值进行测定并标准化。
29.如权利要求28所述的方法,其中所述基因选自基因IGF2R、ARAP3、FCGR3A、LOC389342、LOC648863、SPI1、LOC642567、CUTL1、PDE5A、ASAP1、KIAA0247、MAP1LC3A、ZNF185、IRS2、MTMR3、LOC100132510、IMPA2、NCALD及MPL。
30.如权利要求29所述的方法,其中所述方法提供至少70%的准确性。
31.如权利要求28所述的方法,其中所述方法包括对如表2中所示的一组至少约25个或更多个标签基因的基因表达值进行测定并标准化。
32.如权利要求31所述的方法,其中所述基因选自基因FCGR3A、LOC389342、
IGF2R、ARAP3、PDE5A、MPL、CUTL1、LOC642567、SDPR、PTGS1、MIR1974、MAP1LC3A、LILRA3、LOC100133875、SPI1、LOC653737、IRS2、MAST3、NCF1B、STK40、KIAA0247、LOC648863、CTDSPL及NCALD。
33.如权利要求32所述的方法,其中所述方法提供至少75%的准确性。
34.如权利要求28所述的方法,其中所述方法包括对如表2中所示的一组至少约30个或更多个标签基因的基因表达值进行测定并标准化。
35.如权利要求34所述的方法,其中所述基因选自基因AK3、LOC100132510、ARID4A、CMTM4、KIAA1430、LOC441013、MAL、SETD1B、AKR1C3、ATXN7L3B、PARP15、AP2S1、CA2、PAN3、MTMR3、TOP1P2、UHRF2、LOC92755、EPOR、MED31、LOC389286、LOC646836、MSRB3、GPR65、SMPD1、GPX4、LOC100133770、PRKCB及LOC100129424。
36.如权利要求35所述的方法,其中所述方法提供至少80%的准确性。

说明书全文

自闭症和其它发育障碍的筛查、诊断和预后

[0001] 相关申请案的交叉参考
[0002] 本申请要求2012年7月26日提交的美国临时申请No.61/675,928的优先权,该案的完整内容以引用的方式并入本文。
[0003] 有关联邦政府资助的研究的声明
[0004] 本发明是依据美国国家心理卫生研究所(National Institute of MentalHealth,NIMH)授予的资助号P50-MH081755、R01-MH080134以及R01-MH036840在政府支持
下进行。美国政府在本发明中享有某些权利。

技术领域

[0005] 本发明大体上涉及自闭症和其它发育障碍的筛查、诊断和预后。更确切地说,本发明涉及使用功能基因组标签和多模态标签的组合在自闭症险筛查以及自闭症的诊断和预后中的用途。其预后应用包括对可能的临床、神经系统和治疗进展和结果的预测和表征。
[0006] 发明背景
[0007] 改善有关自闭症(一种影响如社交、沟通、语言和认知等高级功能的复杂遗传的神经系统发育障碍)风险的早期筛查和检测具有极其重要的意义。早期检测的益处在于,
1
使鉴别与治疗的步调加速即使一年 也可以对受影响的新生儿、幼儿、幼童及年幼儿童的结果带来显著影响。
[0008] 在美国,尽管近期以大学为基础的研究在开发用于2岁内儿童自闭症筛查、检测和诊断评价的潜在方法方面取得了进步,但将这些方法在临床上转化成广泛使用并且有效
的社区实践尚未发生。取而代之的是,在美国大多数地方,3到5岁仍是自闭症首次临床鉴
1
别以及治疗服务转介的年龄 。研究发现,平均起来,患有自闭症的儿童在最终确诊之前曾由4到5位不同的专业人士进行诊断评价,而这一过程可能花费数年,在此期间,患儿未接
受适合治疗。从神经生物学的观点看,这是很成问题的,因为脑中的功能连接是在几岁的时
2,3
候牢固地建立 。在许多神经连接已经形成之后(而非之前)开始治疗将有可能降低治疗
功效和影响。数以百计的网站、文章、博客(blog)以及政府组织、专业组织和非政府组织提出了有关自闭症儿童早期筛查、检测、诊断和治疗转介的需求,但以大学为基础的研究在早期检测方面的进步与实际社区临床实践之间的巨大分歧令人担忧;举例来说,在2012年,
1
CDC文件记录在美国(基于2008年的数据),自闭症鉴别的平均年龄为约4岁 。在美国,
治疗转介的平均年龄相应地甚至更晚。另外,就早期筛查和进行凭经验地验证的早期干预
来说,该群体有大部分仍未得到服务。这个问题的严重性令人震惊:根据近期的患病率估计和美国的出生率,每年有52,000到84,000名幼儿将会发展自闭症。因此,在全美的普通社
区中,迫切需要大量有用并且具有成本效益的儿童群体筛查策略。不幸的是,目前在美国,数十万患有自闭症的幼童和年幼儿童被忽视,治疗不足并且可能具有比所需结果更差的结
果。
[0009] 此外,一旦儿童被鉴别患上自闭症谱系障碍(autism spectrum disorder,ASD),科学尚未提出有关预后的了解。患儿在言语、语言和社交能发育方面将始终面临极大障碍,或者他/她将属于在学校和校外取得成功的少数ASD个体。然而,目前还没有关于自闭
症的预后生物标记物;确切地说,缺乏预测和表征可能的临床、神经系统和治疗进展和结果的预后生物标记物。
[0010] 具有临床意义的发现风险行为标记物或生物标记物尽管很重要,但其高优先级在很大程度上仍未得到满足。在临床上满足普通儿童群体的这一需求的生物标记物和行为标
记物都未出现。举例来说,常用的父母报告筛查(例如M-CHAT、CSBS)是非常有价值的,但也
4-6
存在缺点 ,包括极高的假阳性率。M-CHAT当用于普通群体中时,具有极低的特异性(27%
5 7
)和阳性预测值(PPV,11%),使其在常规临床实践中的效用有限。类似地,在2013年公布
的由Chlebowski、Robins、Barton及Fein进行的最新并且最大规模的一项测试M-CHAT功
8 9 10
效的研究发现,当单独使用该工具时,假阳性率为80% 。尽管由Zwaigenbaum、Ozonoff 、
11 12
Paul 、Landa 等进行的高风险幼儿亲属研究披露了如社会注意力异常等关键的早期缺陷
9
,但他们只是在组群平上报告了数据,并未报告验证统计学,如PPV,而这是确定行为特性作为早期标记物的效用必需的首要步骤。
[0011] 若干团体使用了眼动追踪技术,并且报告相对于TD幼童,ASD幼童对于生物活动23 24 25 26 27
、眼睛注视区域 、头部区域 和共同注意困难 以及在明显二元信号期间的现场监测
的偏好减少。尽管这些研究共同地指出社交功能障碍的早期发育起源,但有报告的效果很
少,并且仅仅在整个组群水平上提供了结果,而且很难检测或诊断ASD。举例来说,在一项研究中,当幼童观看一名妇女制作三明治时,ASD幼童与TD幼童在注视朝向面部和眼睛区
27
域方面的差异没有不同,而且只在特定的3秒二元指示情况期间变得明显 。此外,在有关
ASD幼童的大多数眼动追踪研究中,并未提供将眼动追踪转化成筛查工具所需的验证统计
学(如特异性或阳性预测值)。
[0012] 尽管在了解自闭症的可能的遗传风险因素13-15和神经系统基础 16-18方面取得了较大进展,但截至目前所公布的基因异常和脑异常都未能转化成针对幼童自闭症风险的实用的临床群体筛查或测试。另外,在较小年龄时遗传与神经系统发育异常之间的关联在很大
程度上仍属未知。总的说来,有关潜在遗传与神经影像生物标记物的研究主要还是在“实验阶段”。
[0013] 本发明人之一19发现,大部分自闭症幼儿和幼童展现早期脑部过度生长,这表明自闭症可能涉及到早年调控细胞产生或自然细胞凋亡的机制异常。该发明人以两种方式分
析了自闭症中的遗传机制失调。第一,对在死亡后自闭症男童的前额皮质组织中的神经元
18
总数计数发现神经元过量高达67% 。第二,有证据显示,在死亡后的自闭症男童中,管理
14
前额皮质脑组织中的神经元数量的遗传机制失调 。
[0014] 这些发现推动了对于ASD的神经系统和遗传基础的大体了解,但没有提出在普通儿童群体中的个别儿童水平上进行ASD风险的早期筛查、自闭症的诊断评价及预后评估。
尽管其它研究提出有望鉴别出MRI神经影像生物标记物用于已知患有自闭症的年龄较大
的儿童或成人,但他们无法在最需要这些生物标记物的极幼小年龄改善普通儿童群体中的
18,19
风险评估。还有其它研究受到一些限制,如仅仅基于来自多发ASD家系的数据 ,而在普
通群体中留下大多数自闭症幼儿未解决,或基于鉴别与自闭症中潜在的脑发育不良具有极
20,21
小或无相关性的基因的算法
[0015] 从广义上说,目前的“生物标记物”(例如遗传、分子、影像)具有较差的诊断准确性、特异性和/或灵敏度;都不具有临床结果预测能力;大多数都很昂贵;都不适合在社区群体中作为早期筛查工具;并且极少数经历了严格临床审查和严密的验证。举例来说,遗传发现物一般为非特异性的,并且最佳表征的CNV可能出现在精神分裂症、躁郁症、智力障碍22
以及ASD(例如16p11.2)中。少数基因突变是复现性的 。CNV和复现性基因的组合在所
有ASD个体中极少,大致占约5-10%。因此,当前的DNA测试很少检测到自闭症病例并且缺
乏特异性。此外,由若干公司发布的遗传测试只能检出少数(5%到20%)的ASD个体,一
般缺乏良好的特异性(因为在如精神分裂症或躁郁症等众多非ASD病症中以及在无症状的
“典型”个体中也发现了CNV、基因突变和SNP标记物),漏检了大多数的ASD个体并且极其
昂贵,超出了大多数个体能承受的范围。针对年龄较大ASD患儿的婴儿亲属的遗传测试只
能提供大致的风险估计,不过当然,已育有患ASD的孩子的父母随后生育的子代会有风险。
从这一测试得到的益处很少,并且具有极小的实际临床效用。经显示,并无具有临床结果预测能力的遗传发现;也就是说,遗传测试不能提供有关日后可能的语言、社交或普通功能进展和能力的信息。近期对患有ASD的成人进行了MRI“生物标记物”研究,但成人ASD诊断
的临床价值极其有限。用年龄较大ASD患儿的幼儿同胞的少量样品进行的DTI研究显示组
群差异太小而无法保持诊断前景。先前诊断为ASD的5到11岁儿童的基因表达分类器在
21
验证集中的准确性、灵敏度和特异性分别仅为67.7%、69.2%及65.9% 。代谢组学分类
器仅测试了先前诊断为ASD的4到6.9岁儿童的样品,而未测试新生儿或0到4岁的儿童。
32
[0016] 总的说来,当前未报告有望在普通社区儿童中从出生到儿童期早期最需要临床工具的幼小年龄时作为主要或次要早期发育筛查或早期诊断或预后工具的生物标记物。也不
存在具有临床应用的常规灵敏度和特异性值的针对ASD发展风险的临床前筛查或测试。当
前预期ASD在发病机理上并且在临床上具有异质性,以致诊断性生物标记物和/或行为标
记物或生物标记物组合只可能检测一小部分病例,并且这些生物标记物和/或组合的行为
标记物与生物标记物将为灵敏但非特异性的或具有特异性但只针对极少数ASD谱系。
发明概要
[0017] 本发明提供了超出当前所有针对ASD的早期筛查、诊断和预后生物标记物测试的一大进步。在某些实施方案中,本发明的独特性在于,在所提供的其它优点中,它是唯一利用多模态(功能基因组学、遗传学、蛋白质组学、解剖神经影像学、功能神经影像学以及神经行为)数据与深入的临床表型分型数据的组合的方法,所有数据都来自代表普通社区儿
童群体的相同个体幼儿和幼童。本发明以新颖方式使用复杂的生物信息学方法,提供了ASD的新颖单态和多模态标签。
[0018] 在某些实施方案中,本发明的独特性在于基因以及基因与基因的相互作用(例如,基因路径、基因网络及枢纽基因活性模式和组织,包括可定量的标签特征)的鉴别与临床、神经影像学和行为信息相结合,其对于自闭症受试者,特别是包括从出生到1岁、1岁到
2岁、2岁到3岁以及3岁到4岁和更大年龄的那些受试者的早期筛查、诊断评价和预后评
估具有高准确性、特异性和灵敏度。
[0019] 本发明提供了特别令人意外的优点,这是因为:ASD被认为在病因上并且在临床上具有高度异质性,但本发明在某些实施方案中可以准确地检出绝大多数(如至少82%)
的病例,而不只是少数病例(这是当前其它ASD风险生物和行为测试所能达到的)。没有经
过证实的ASD临床前标记物,但本发明可以在普通自然儿童群体的临床症状发作之前以高
准确性、灵敏度和特异性检出ASD(不仅仅是因年龄较大的同胞患有ASD、畸形、疾病发作等而怀疑有高风险的病例)。相比之下,现有的遗传测试具有低特异性以及较差的灵敏度,当在普通临床前儿童群体中进行测试时,只能检出5%到20%的ASD病例。由于现有技术
权利要求是基于对因先前的临床测试而高度怀疑患有ASD的患者进行的测试,故其被夸大
了。本发明在特别需要早期筛查的普通儿童中意外地具有高准确性、灵敏度和特异性。现
有技术并未发现如何利用临床和神经行为信息有差别地调整基因组标签,由此对其进行调
节以适于普通群体筛查、诊断评价和预后评估的不同应用。
[0020] 在某些实施方案中,为进行筛查,加权基因表达模式可以单独使用或与易于得到的标准临床测量(头围、年龄、CSBS评分及GeoPrefernce测试评分)组合使用,并且不依赖
于神经影像或不适合普通群体筛查的其它工具,而对于儿童被怀疑存在风险之后进行的诊
断或预后应用,加权基因表达模式可以与如MRI或fMRI等专用工具组合使用以优化诊断和
预后判断。先前没有能够使用生物测量在如此小的年龄准确分类绝大多数ASD病例的预先
筛查、诊断和预后技术。总的说来,对于提供从出生到儿童期的最幼小年龄段内的有效性;
基因权重、模式和路径结合临床和神经行为变量的复杂算法的使用;高准确性、特异性和灵敏度;以及在自闭症筛查、诊断评价和预后评估中的灵活效用来说,当前没有可用的方法能媲美本发明。
[0021] 在某些实施方案中,本发明提供了进行自闭症加权基因和特征测试(weightedgene and feature test of autism,WGFTA)用于自闭症筛查、诊断或预后的方法。该方法可以包括a)从生物样品获得分析物以获得一组至少20个或更多基因的分析物相关基因表
达水平,这些基因是选自从自闭症参考数据库得到的模型,如表1和表2中所公开;b)对经
过表达的所选组基因各自的表达水平进行统计学标准化以得到受试者的所选组中每个基
因的标准化的基因表达值(normalized gene expression value,NGEV);c)制备所选基因
组的加权基因标签矩阵(weighted gene signature matrix,WGSM);d)通过将每个基因的
NGEV乘以该基因的基因特异性权重来计算所选组中每个基因的加权基因表达水平。基因权
重是由自闭症参考数据库中至少所选组的基因的相对表达水平的基于计算机的生物信息
分析得到,在某些实施方案中包括加权基因表达参考数据库(WGERD)中编译的至少40位健
康个体和40位自闭症个体;及e)确定受试者的该组每个加权基因表达水平与加权基因表
达参考数据库(WGERD)的差异,由此进行WGFTA以指出与自闭症风险、诊断或预后的增加的
相关性。
[0022] 可以通过本发明方法测试的基因包括本文表1和表2以及表16-25中所示的那些。这些基因可以基于其与诊断或预后的加权相关性选择。这些基因涉及细胞周期、蛋白
质折叠、细胞粘附、翻译、DNA损害反应、细胞凋亡、免疫/炎症功能、信号转导ESR1-核路径、转录-mRNA加工、细胞周期减数分裂、细胞周期G2-M、细胞周期有丝分裂、细胞骨架-纺锤体微管以及细胞骨架-细胞质微管功能。在某些实施方案中,本发明方法所测试的基因涉及
到脑发育过程中的DNA损害或促有丝分裂信号传导。
[0023] 在某些实施方案中,本发明的方法可以使用少到20个并且包括约4000个自闭症WSGM基因(在这些基因中包括特异性剪接变异体),这些基因可以被包含在少到单个基因
集或多达8个基因集和子集内。不同的集合和子集可以在不同检验和应用环境下用于优
化性能。在某些实施方案中,基因选自例如表1中的至少2、10、20、25、30、35、40、45、50、
55、60、70、80、160、320、640、762个或其间任何数目的基因。表1提供了本发明方法中基于最高权重排序而选择的基因,这些基因常常与ASD诊断有关。这些基因可以取决于其表达
模式的共同性进行排列并且选自如表1中所示的4个组。在第1-4组中权重绝对值在约
0.50-1.00范围内的前50个基因也在表1.1、表1.2、表1.3及表1.4中列出。
[0024] 在其它实施方案中,基因选自如以下所提供的表16到25中所示基因清单中的至少 2、10、20、25、30、35、40、45、50、55、60、70、80、100、120、150、200、250、300、400、500、600、
700、800、900、1000、1500、2000、2500个或更多个基因。在某些实施方案中,这些基因是在ASD幼童和对照幼童中所发现的差异表达(differentially expressed,DE)的独特基因。
举例来说,这些基因在DNA损害反应、促有丝分裂信号传导及细胞数量调控方面失调。
[0025] 在某些实施方案中,为了对ASD与非ASD进行分类,标签基因的标准化基因表达值(例如表1和表1.1-1.4)可以按原样使用,因此未进行加权。在某些实施方案中,使用提
升算法(Boosting)(参看评分和分类方法),以最少数量的要素对三个基因清单进行鉴别,
这些要素以至少70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的准确性对受试者进行分类。具有20、25和30种特征并且可以引起至少70%、至少75%和至少
80%正确分类的集合包括但不限于下表2中所示的那些。在某些实施方案中,基于受试者
的年龄调整基因权重是改善ASD分类准确性的最重要的单参数。
[0026] 本发明要求保护如以下关于每个WGSM基因所定义的基因权重和任选地特征标签的用途,这些WGSM基因当用于个体的实际基因表达时,可以在筛查中准确地预测该个体的
自闭症风险或对该个体作出准确的自闭症诊断或预后分类。它还可以作为自闭症诊断测试
用于已知具有高自闭症风险或怀疑患有自闭症和其它发育障碍的个体。它还可以在新生
儿、幼儿、幼童和年幼儿童中提供有关自闭症或其它发育障碍的诊断分类预测(自闭症、非自闭症)和概率风险估计。
[0027] 本发明方法可以另外包括在生物样品中获得分析物的早期步骤,该步骤是指在直接从受试者身体取得的生物样品中以物理方式获得所关注分析物,或以物理方式取出先前
已从受试者获取的样品。该生物样品可以包括但不限于,血液、脐血、血清、血浆、脑脊髓液、尿液、泪液、唾液、粘液、口腔拭子、牙髓皮肤、神经元以及任何其它体液、组织或器官。该生物样品还可以包括获自和/或源自于生物样品和/或细胞培养物的细胞,包括但不限于,干
细胞、纤维细胞、iPs、神经祖细胞以及神经细胞。在某些实施方案中,该分析物包括但不限于,在任何生物样品中的DNA、RNA、蛋白质或代谢物。在某些实施方案中,该分析物是来自白细胞的血液源性RNA。在某些实施方案中,WGSM对个体的标准化血液源性(包括新生
儿脐血源性)基因表达水平实行逐基因加权。因此,为了例如进行新生儿自闭症筛查和测
试,WGSM可以对个体的脐血源性的RNA基因表达水平实行逐基因加权,并且应用多种算法
计算自闭症风险。WGSM是单独使用或与以下论述的其它矩阵组合使用的。这些其它矩阵各
自所含的要素也可以在诊断分类或预后分析中用作预测因子。
[0028] 因此,本发明的方法还可以另外包括将受试者的基因网络(包括枢纽基因网络)标签矩阵(GNSM)与GNSM自闭症参考数据库相比较,以基于该受试者的GNSM与GNSM自闭
症参考数据库的差异确定一个评分,用于自闭症风险筛查、诊断或预后。在某些实施方案
中,GNSM包含由基因与基因相互作用(包括枢纽基因相互作用)计算的特异性基因权重和
特征的相互作用模式。这些相互作用模式是基于基因与非基因组特征的关系或状态计算。
[0029] 本发明的方法还可以包括以下步骤:将受试者的多模态标签矩阵(multi-modalsignature matrix,MMSM)与MMSM自闭症参考数据库相比较,以基于该受试者的MMSM与
MMSM自闭症参考数据库的差异确定一个评分,用于自闭症风险筛查、诊断或预后。在某些实施方案中,MMSM是包含通过临床、行为、解剖学和功能测量获得的非基因组特征的定量的一种矩阵。这些非基因组特征包含但不限于,年龄、GeoPreference测试评分、MRI/fMRI/DT1测试、ADOS测试或CSBS测试。
[0030] 在某些实施方案中,本发明的独特性在于,利用了基于经长期追踪确定患有自闭症的幼儿和幼童中异常基因表达的特定年龄加权并且随年龄变化的模式和基因权重(例
如,表1中的权重集1-4)的测试。在某些实施方案中,本发明提供了一种特别设计的方法,该方法权衡自闭症个体与正常个体之间的年龄相关性基因表达差异以便指出自闭症的风
险概率,因为自闭症在普通儿童群体中是在不同年龄出现,使这种方法成为独特的方法。因此,在某些实施方案中,本发明是基于针对自闭症的独特多维基因和年龄加权的数据集的
一种测试,该数据集是用于在新生儿到年幼儿童整个年龄段内测试新患者/受试者患自闭
症的风险的参考标准。因此,在某些实施方案中,它可以基于ASD受试者中基因表达如何随年龄(例如在一岁时)变化的独特资料,使用年龄转化WGSM和GNSM中各要素的值以改善
ASD测试的准确性。在某些实施方案中,它可以使用年龄作为一种特征进行分类(例如参看
以下评分/类别鉴定法)。本文最先提供了在这些早期年龄时在与ASD相关的任何组织中
年龄相关性基因表达变化的第一证据。实际上,WGSM和GNSM中的每个基因表达要素都将随
年龄而变化,并且这些变化从年龄不相关到随着年龄减小而表达增加或损失。这些年龄相
关性变化经过确定并且这一信息被用于调整每个基因的加权因子以进行适合年龄的加权,
由此增强在个别患者的年龄时的诊断性能。
[0031] 此外,在一些实施方案中,本发明提供的方法另外包括一个独特步骤:将受试者的旁系特征标签矩阵(collateral feature signature matrix,CFSM)与CFSM自闭症参考数据库相比较,以基于该受试者的CFSM与CFSM自闭症参考数据库的差异确定一个评分,用于
自闭症风险筛查、诊断或预后。CFSM包含受试者旁系的特征,例如这些旁系特征包含妊娠期间母体血液中的分析物、患有自闭症的同胞、母体基因组标签或预处理,或者胎儿期或围产期不良事件。
[0032] 在一些实施方案中,本发明另外提供一种自闭症临床前筛查、诊断或预后方法,该方法包括:a)获得含有所关注分析物的生物样品;b)制备加权基因标签矩阵(WGSM),其包含自表1-2和表16-25中所列基因中选出的一组两个或更多个分析物相关基因的表达水
平;c)通过用WGSM的标准化基因表达值(NGEV)乘以表1-2和表16-25中所提供的该基因
的基因特异性权重来计算所选组中每个基因的加权基因表达水平;及d)确定该受试者的
所述组中每个加权基因表达水平与加权基因表达参考数据库(WGERD)的差异,由此指出与
自闭症风险、诊断或预后的增加的相关性。在某些实施方案中,WGSM经过进一步处理以减
少维度或计算时间并且增加后续分析步骤的效力。
[0033] 在某些实施方案中,使用了功能基因组和生物系统分析,血液源性RNA表达的标签是源自于自闭症以及未患自闭症的受试者,这些标签是“基因特异性权重”的模式(WGSM)以及基因特异性权重模式随基因-基因相互作用模式的变化(GNSM)、个体的可定量特征
(例如,年龄、性别、头围、神经影像测量、眼动追踪评分;MMSM)和旁系特征(例如妊娠期间母体血液中的分析物、患有自闭症的同胞、胎儿期或围产期不良事件;CFSM)。事实上,这些基因组标签通过所得加权模式的基于算法和知识的选择性应用来对从个体获得的基因表
达水平测量值进行转化,这些加权模式选择性增强或减小测量水平对检测、诊断和预后分
类以及风险估计的影响。非基因组特征矩阵则充当预测因子变量。
[0034] 因此,在一些实施方案中,本发明提供了统一为加权基因和特征矩阵(WGFM)的这四种所得标签矩阵的用途,该WGFM是作为针对自闭症的加权基因和特征测试(WGFTA)实
施,以用于儿童群体的自闭症风险筛查以及新生儿、婴儿、幼儿、幼童及年幼儿童的自闭症诊断和预后研究。举例来说,其预后研究应用包括可能的临床、神经系统和治疗进展和结果的预测和表征。在某些实施方案中,WGFTA使用了WGFM的以下四种矩阵之一或任何组合:
加权基因标签矩阵(WGSM)、基因网络标签矩阵(GNSM)、多模态标签矩阵(MMSM)以及旁系特
征标签矩阵(CFSM)。在特定实施方案中,这些标签矩阵被设计用于优化(例如)针对有患
自闭症风险的新生儿和婴儿的筛查和检测,而其它矩阵被设计用于先前鉴别为有患自闭症
风险的婴儿、幼儿、幼童或年幼儿童的临床评价和确诊,并且还有其它矩阵被用于可能的临床过程(例如,恶化或改善的临床严重程度)、以后的临床结果(以后的语言、认知或社交能力)或治疗反应的预后评价。
[0035] 在一些实施方案中,本发明还提供了一种用于自闭症筛查、诊断或预后的系统,该系统包含如表1-2和表16-25中所提供的至少两个基因和相应基因特异性权重的数据库生成模型,以及有关将该数据库用于加权基因标签矩阵(WGSM)的说明书,该WGSM包含生物样
品中表达的一组所选相同的两个或更多个基因的表达水平,该系统是通过以下方式操作:
a)用该WGSM的标准化基因表达值(NGEV)乘以表1-2和表16-25中所提供的该基因的基因
特异性权重来计算所选组中每个基因的加权基因表达水平;以及b)确定受试者的所述组
的每个加权基因表达水平与加权基因表达参考数据库(WGERD)的差异,由此指出与自闭症
风险、诊断或预后的增加的相关性。
[0036] 本发明是当前唯一的针对自闭症的功能基因组测试,该测试是基于在不同的幼小发育年龄时引起自闭症脑发育不良的遗传功能影响和神经系统结果缺陷的直接实验资料,
并且还是唯一能检出大多数自闭症个体的自闭症遗传测试。本发明具有平台独立性,并且
已经通过使用不同方法,针对独立患者组进行测试和验证。
[0037] 附图简述
[0038] 图1a-1c.基因网络与神经解剖学测量值的变化相关,并且使ASD幼童与对照幼童相区分。图1a)ASD幼童和对照幼童的总脑容量(TBV)测量值分布。T测试显示两组的分布
无统计学显著差异(p值=0.645)。图1b)所有ASD受试者和对照受试者总体的WGCNA分
析(组合分析)鉴别出与神经解剖学测量有关的七个共表达基因模(也参看表5)。柱状
图展示了使用Metacore路径分析得到的七个模块的富集评分。图1c)这七个模块的特征
基因(eigengene)值被用于与神经解剖学测量值(参看表6)的相关分析中。这七个模块
(基因网络)中总计有六个与神经解剖学测量展示出统计学上显著的关联,但该关联在每
个组内是不同的。散布图提供了在ASD组(浅灰色)和对照组(深灰色)中模块特征基因
(基因表达差值)与总脑容量之间的关系的图解表示。两个组之间的最明显差异归因于细
胞周期、蛋白质折叠和细胞粘附模块中的基因模式。在细胞骨架、炎症和翻译基因模块中发现了其它差异。在正常小脑中发现较高的细胞周期和蛋白质折叠基因表达水平,而其它基
因网络看来在防止脑大小增长方面具有较弱的作用。相反,已发现细胞周期和蛋白质折叠
基因的减少与其它功能网络中基因表达水平的变化的组合引起了ASD中的病理性脑增大。
[0039] 图2.组合数据集(ASD加对照)的WGCNA分析确定了在对照幼童中哪些模块与总脑容量(TBV)测量值相关以及在ASD幼童中哪些模块与之相关。基因表达对脑大小变化的
影响是以对照幼童(深灰色)和ASD幼童(浅灰色)内每个TBV相关性模块的基因显著性
(Gene Significance,GS)来计算。柱状图显示了两组间GS的差异。负的GS值反映了特
征基因与TBV变化之间相对立的关系(参看表6),因此高基因表达水平与较小的脑相关,
反之亦然。带有星号的实心柱形指示,该关联是统计学上显著的。顶部不带星号的空心柱
形指示,该关联不具有显著性。一个模块内每个基因的GS与基因连接性(GC;定义枢纽基
因)之间的相关性展示了枢纽基因的活性模式的变化以及对脑大小变化的影响(每个模块
的左侧散布图)。GS与模块成员资格(MM;指定模块中一个基因的特异性)之间的相关性
展示了相对于枢纽基因改变的一致性活性模式变化(每个模块的右侧散布图)。三种网络
特征(GS、GC、MM)的前30种基因的分析展示,GS是每个模块中改变基因数量最高的特征。
总体来说,富集翻译的模块是ASD幼童与对照幼童之间基因变化数目最多的模块。
[0040] 图3.分别由对照样品和ASD样品的WGCNA分析产生的共表达模块。基于对照的模块(左侧)的GS绝对值与对照内由组合分析得到的模块一致(图2)。基于ASD的模块
(右侧)的GS绝对值与ASD组内的组合分析(图2)一致,并且展示出与TBV测量值相关的
模块数量增加。由此加强了独立WGCNA分析中与TBV测量值相关的模块的差异。
[0041] 图4a-4e.差异表达(DE)的基因的基于路径的复制分析。基于模块的分类器有效地使AS D受试者与对照受试者相区分,并且展示富集翻译基因的高蛋白质-蛋白质相互作
用(protein-protein interaction,PPI)。图4a)以Metacore进行的发现(Discovery)与
复制(Replication)DE基因之间的路径富集比较。DNA损害与促有丝分裂信号传导共有最
强的相似性。图4b)针对发现样品和复制样品中共有的失调基因的路径富集分析。图4c)
左图,由发现(ROC 1)和复制(ROC 2)受试者的分类得到的ROC曲线和AUC值。右图,由不
同诊断种类中所有受试者的分类得到的ROC曲线和AUC值。ROC 3=ASD幼童相对于典型
地发育(typically developing,TD)的幼童(由此排除对比受试者);ROC 4=ASD幼童相
对于对照幼童;ROC 5=对照幼童相对于TD幼童。图4d)从图C中的所有ROC曲线提取的
坐标。图4e)使用从具有直接PPI的四个模块(DAPPLE数据库)得到的基因以PanGIA模
块类型进行Cytoscape观测。相互作用的数量与该网络内的颜色位置相关。白色指示<8
个PPI;黄色到红色指示8≤PPI<31。由具有最高数量的相互作用的基因表示的网络核心
富含翻译基因。
[0042] 图5关于ASD幼童和对照幼童的WGCNA分析。生成共表达模块并以颜色编码(此处以灰度等级显示)。每条垂直线对应于一个基因,并且具有类似表达的基因群集成模块。
模块在本文中通过指定的WGCNA默认颜色命名。用计算机计算每个受试者和每个模块的模
块特征基因。
[0043] 图6使用WGCNA对所有发现受试者进行模块与神经解剖学测量值之间的相关分析。p值示于括号中。Dx=诊断,L=左,R=右,CB=大脑,CBLL=小脑,GM=灰质,WM=白质,TBV=总脑容量,hemi=半球,SA=表面积,BS=脑干。
[0044] 图7在ASD组和对照组中每个模块内的基因显著性(GS)与基因连接性(GC)的相关性。在所有组的22个共表达模块中有12个展示图案方向的明显变化(负到正或无显著
相关性),而有4个模块在相关性方面具有适度变化(相同方向)。
[0045] 图8使用WGCNA对于对照幼童进行模块与神经解剖学测量值之间的关联分析。L=左,R=右,CB=大脑,CBLL=小脑,GM=灰质,WM=白质,TBV=总脑容量,hemi=半
球,SA=表面积,BS=脑干。
[0046] 图9使用WGCNA对于ASD幼童进行模块与神经解剖学测量值之间的关联分析。L=左,R=右,CB=大脑,CBLL=小脑,GM=灰质,WM=白质,TBV=总脑容量,hemi=半
球,SA=表面积,BS=脑干。
[0047] 图10使用差异表达的基因进行的ASD幼童和对照幼童的WGCNA分析。生成共表达模块并以颜色编码(此处以灰度等级显示)。每条垂直线对应于一个基因,并且具有类似
模式的基因群集成模块。模块在本文中通过指定的WGCNA默认颜色命名。用计算机计算每
个受试者和每个模块的模块特征基因。
[0048] 图11分类器预测性能相对于受试者年龄的曲线。受试者年龄分布通过分类器准确性分隔。
[0049] 图12预测性能与年龄校正的总脑容量(TBV)、全大脑和小脑测量值的曲线。
[0050] 图13a-13c.年龄相关性和诊断相关性基因表达谱。图13a)在诊断主效应存在性基因表达变化的实例(以浅灰色表示的ASD组相对于以深灰色表示的对照组)。图13b)在
年龄和诊断主效应存在下基因表达变化的实例。图13c)存在年龄与诊断之间的相互作用
的基因表达变化的实例。
[0051] 图14a-14b.在使用提升算法的分类分析中纳入年龄。图14a)在训练集(连续线)中以及在以年龄作为额外预测因子的交叉验证(虚线)之后的分类结果的图解表示。
图14b)不以年龄作为预测因子的分类结果的图解表示。当使用年龄作为额外预测因子时,
交叉验证的误差从约0.3(30%)减小到约0.2(20%),由此表明年龄有助于改善分类准确
性。
[0052] 图15.表示ASD组(+1)和对照组(-1)的决策树分类的分裂点(左图)以及对应于所用特征的数量递归地分成更精细地分区的特征空间(右图)的图。
[0053] 图16.表示通过拟合基线分类器并使用其对训练数据的性能在后续拟合中对每个点的重要性进行再加权的提升算法(例如AdaBoost)的图。
[0054] 图17.使用标签矩阵的25个基因的提升分类性能。交叉验证的误差为约25%,由此得出分类准确性为75%。
[0055] 发明详述
[0056] 本说明书通篇引用了不同出版物,包括专利、公布请、技术论文和学术论文。这些引用的出版物各自以引用的方式整体并入本文中。
[0057] 在本说明书通篇,“包含(comprise)”一词,或如“包含(comprises)”或“包含(comprising)”等变化形式应理解为暗示包括所陈述的整数(或成分)或整数(或组分)的群组在内,但不排除任何其它整数(或组分)或整数(或组分)的群组。
[0058] 除非上下文另作清楚规定,单数形式“一个(种)”和“所述”包括复数形式。
[0059] 术语“包括”用于指示“包括但不限于”。“包括”与“包括但不限于”可互换使用。
[0060] 在一些实施方案中,本发明提供了使用功能基因组标签与基于功能基因组的多模态标签的组合进行自闭症风险筛查以及自闭症诊断和预后。多模态标签包括但不限于,身
体、神经行为、神经影像、神经生理学、临床病史、遗传、母体预处理、父母调查问卷、家族史及行为和心理测量学测试信息,并且来源于在体内从周围组织收集的包括脐血、血液、皮肤及尿液在内的分析物的生物信息学和生物系统分析。本发明特定地提供不同形式的所述标
签的用途,这些标签各自被定制成根据个体的年龄、性别、种族以及临床病史和家族史来优化自闭症筛查、诊断和预后,从而提供幼小年龄个体(包括新生儿、婴儿、幼儿、幼童及年幼儿童)的自闭症风险儿童群体筛查生物标记物以及自闭症(即,如在DSM V中所定义并且
在DSM-IV-TR广义地表征的自闭症谱系障碍或ASD)和自闭症风险诊断和预后生物标记物。
如本文所使用,预后生物标记物包括预测和表征可能的临床、神经系统和治疗进展和成果
的那些标记物。
[0061] 在某些实施方案中,本发明可以测试任何新生儿、幼儿、幼童或年幼儿童的自闭症风险。此处呈现的从年幼普通儿童群体开发的功能基因组和基于功能基因组的多模态标签对于ASD新生儿以及0到1岁、1到2岁、2到3岁和3到4岁儿童具有比任何先前开发的
基于生物或行为的筛查或早期分类器更高的准确性、特异性和灵敏度。在特定实施方案中,本发明提供了基于计算机的生物信息学分析,这些分析在体内取得在极幼小年龄时有效预
测自闭症的基因组和基于基因组的多模态标签。
[0062] 由于自闭症完全是一种神经系统发育的遗传性病症,故有关自闭症风险评估的主要突破点将是尽可能在最幼小年龄鉴别与自闭症的脑发育有关并且可能引起自闭症脑发
育的功能基因组缺陷的能力。从这些基因-脑资料,应当能获得有关早期风险的更好并且
更多的自闭症相关生物标记物。因此,在一些实施方案中,本发明提供了自闭症领域任何其它研究人员先前未进行过的独特分析,这些分析鉴别出血液白细胞mRNA中的功能基因组
缺陷,这些缺陷与极年幼自闭症受试者的脑和大脑皮质发育大小明显相关。在某些实施方
案中,本发明提供在所涉及的基因中,大部分基因相较于典型地发育的对照幼儿和幼童也
出现异常地失调。这一结果在一岁自闭症患者的功能基因组病理学中首次得到鉴别。使用
生物信息学和系统生物学分析,本发明提供了用于自闭症筛查、诊断和预后的功能基因组
和基于功能基因组的多模态标签(加权基因和特征矩阵),其被用于本发明的自闭症加权
基因和特征测试(WGFTA)中。
[0063] 本发明的WGFTA在普通儿童群体中在最幼小年龄时以高于任何其它公布的方法的准确性、特异性、灵敏度及阳性预测值检出自闭症和其它发育障碍,定量其风险并对其进行分类。这些是针对新生儿、幼儿、幼童和年幼儿童自闭症风险的首批临床上相关的、脑发育相关并且实用的基因组标签。这一组标签更严格地牵涉以及不太严格地牵涉到自闭症亚
型的检测。因此,WGFTA影响了具有较严重神经病理学的那些亚型的鉴别并且揭露出不同
的预后。此外,用WGFTA进行反复测试能够追踪并了解在整个自闭症发展过程中自闭症神
经病理学和临床病理学的纵向变化。本发明的WGFTA测试集不仅在个别儿童水平上具有重
要临床影响(首次在自闭症领域提出),而且本发明还影响关系到这一病症中的遗传性和
非遗传性病因变量的研究。
[0064] 本发明的WGFTA和相关标签矩阵将于下文更详细说明。在某些实施方案中,本发明提供了自闭症加权基因和特征测试(WGFTA),这些测试适用于以下每个矩阵或其任何组
合,这些矩阵统称为“加权基因和特征矩阵”(“WGFM”):
[0065] 加权基因标签矩阵(WGSM)是包含数组基因和基因权重的矩阵,该矩阵构成了参考数据集的模型。在某些实施方案中,基因权重是由至少所选组的基因的相对表达水平的
计算生物信息学分析得到,所选组的基因是来自加权基因表达参考数据库(WGERD)中所编
译的超过40位健康个体和40位自闭症个体。在某些实施方案中,本发明提供了具有至
少 2、10、20、25、30、35、40、50、60、70、80、160、320、640、762、800、900、1,000、1,500、2,000、
2,500个或更多个基因,或任何数量的基因以及如本文描述和示例说明而测定的其对应权
重的WGSM和/或WGERD。这些基因可以排列成具有共同表达模式的数组,举例来说,如表1
中所示的4个组。在某些实施方案中,本发明的参考数据库WGERD被设计成随新受试者和
另外的特征(例如,测序数据)持续更新,由此可以相应地更新基因和基因权重,以及非基
因组特征。
[0066] 表1中提供的基因权重可以舍入到最接近的1/10、1/100、1/1,000、1/10,000、1/100,000、1/1,000,000、1/10,000,000或1/100,000,000。如表1.1到表1.4中所提供,
这些基因是按其加权相关性的排列次序提供。
[0067] 用于测定加权值的一种基于计算机的生物信息学算法是在R计算机环境(cran.us.r-project.org/)中运行的加权基因共表达网络分析(WGCNA)软件包的一部分。这一
软件包的使用也描述于实施例1和实施例2方法(参看下文)中。基因表达水平的定量
并且因此权重的计算是与平台和方法不相关的。基于微阵列的平台(例如,Affymetrix、
Illumina Nimblegen芯片)、基于测序的反应(例如Illumina或Roche新一代测序,或传
统的Sanger测序)及任何其它定量方法(例如,基于qPCR的方法,如Fluidigm系统)都
可以用于确定标称基因表达水平并且用于本文所描述的任何权重计算方法中。使用WGCNA
软件包中的推荐设置,基于共表达的相似性,将清零并且标准化的基因表达数据群集成基
因集(本文中称为模块)。在所有受试者中具有类似表达模式的基因被分配到特定模块。
随后,对于每一模块和每位受试者,计算特征基因。特征基因值的计算是经由计算机公式
“moduleEigengenes(data)”进行,其中“data”是包含所有受试者的基因表达值的变量。
这一步骤相当于常规的主要成分分析,其中多维数据集(许多基因)的变异量是由一个值
(成分1或特征基因值)表示。接着,通过在R中以“data”和“eigengene”为自变量,使用“cor()”计算权重。这一函数进行了模块特征基因值与该模块内每个基因的表达值之间的相关分析。相关是对一个模块中的所有基因和所有模块进行。使用这种方法,权重值在-1
到1范围内,并且表示基因对每个特定模块的整体基因表达变化的贡献。权重值越接近-1
和1的基因具有最高贡献,由此具有重要意义。权重也可使用其它类似数据缩减法计算,这些方法可以包括或可以不包括如WGCNA(基于共表达)情形一般的先验的群集步骤。实例
有主成分分析(Principal Component Analysis,PCA)、多维标度法(Multi-Dimensional
Scaling,MDS)及独立成分分析(Independent Component Analysis,ICA)。在这些实例中,权重常称为“负荷(Loading)”。权重的计算还扩展到使用生物信息,如蛋白质-蛋白质相互作用(PPI)、基因与基因相互作用(GGI)、基因本体(GO)信息,以及网络或排列位置;因此,可以应用基于统计学和生物学的方法从基因表达数据得出权重/负荷。
[0068] 本发明首次提供了使用权重进行自闭症受试者,尤其是在幼小年龄(出生到4岁)时的筛查和诊断。自闭症涉及到枢纽基因和基因路径、子网络、网络和模块(参看实施例
1),并且这些系统内从少到多的异常基因表达的模式被编码并用于本发明中的自闭症筛查
和诊断。在一些实施方案中,这是经由刚刚陈述的PPI和/或GGI进行,并且此类模式信息
是在GNSM中。在其它实施方案中,从少到多的异常基因表达的模式是由基因权重编码。这
种基因加权改善了性能,并且可以与将基因分类到模块中或独立于模块来组合使用。类似
地,将基因群集成模块可以单独使用或与GNSM、MMSM及CFSM组合使用。
[0069] 针对ASD和对照幼儿和幼童的独特参考数据集研究为发现基因(优先级从低到高)在自闭症风险鉴别方面的重要意义提供了独特的机会。基于该参考数据集中呈现的生
物信息,具有较高优先级的基因在正确分类ASD患者方面具有较高重要性。优先级是基于
所计算的每个基因的权重值指定。如以上所描述,权重值越接近-1和1的基因具有最高贡
献(并由此具有重要意义)。因此,基因清单可以基于权重值进行选择。举例来说,在一些
实施方案中,基因清单可以选自绝对权重值为0.15到0.4、0.5到0.7或高于0.8的基因。
在某些实施方案中,基因清单可以通过选择绝对权重值高于0.15、高于0.20、高于0.25、高于0.30、高于0.35、高于0.40、高于0.45、高于0.50、高于0.55、高于0.60、高于0.65、高于0.70、高于0.75、高于0.80、高于0.85、高于0.90、高于0.91、高于0.92、高于0.93、高于
0.94、高于0.95、高于0.96、高于0.97、高于0.98或高于0.99的基因来产生。这些基因可
以在实行加权之前使用或不使用群集界定特定模块来选择。四个“前50位”基因的集合显
示了四个不同模块的前50位基因从约0.53到0.98的权重值。可选地,这些绝对权重值可
以用作阈值(使用或不使用群集)以确定权重值高于(例如)以上所列任何绝对权重值的
多个基因。
[0070] 表1
[0071]
[0072]
[0073]
[0074]
[0075]
[0076]
[0077]
[0078]
[0079] 表1.1
[0080]
[0081] 表1.2
[0082]
[0083] 表1.3
[0084]
[0085] 表1.4
[0086]
[0087] 在某些实施方案中,为了对ASD与非ASD进行分类,表1中的标签基因的标准化基因表达值可以按原样使用,因此未进行加权。在某些实施方案中,使用提升算法(参看评
分和分类方法),以最少数量的要素对三个基因清单进行鉴别,这些要素以至少70%、至少
75%及至少80%的准确性对受试者进行分类。具有20、25和30种特征并且可以引起至少
70%、至少75%和至少80%正确分类的集合包括但不限于下表2中所示的那些。在某些实
施方案中,基于受试者的年龄调整基因权重是改善ASD分类准确性的最重要的单参数。
[0088] 表2
[0089]
[0090] 基因网络标签矩阵(GNSM)是包含由基因与基因相互作用模式计算的权重和特征的一种矩阵。这些相互作用模式也可以基于基因与非基因组特征的关系或状态计算。
[0091] 多模态标签矩阵(MMSM)是包含通过临床、行为、解剖学和功能测量获得的非基因28
组特征的定量的一种矩阵。在某些实施方案中,MMSM包括但不限于,年龄、GeoPref测试 、
29,30
MRI/fMRI/DTI及ADOS测试。 在MMSM中还包括从调查问卷得到的评分,例如CSBS测试。
31
[0092] 旁系特征标签矩阵(CFSM)是包含与所研究的受试者不相关的任何特征的一种矩阵。在某些实施方案中,CFSM包括但不限于,妊娠期间母体血液中的分析物、患有自闭症的同胞、母体基因组标签或预处理以及胎儿期或围产期不良事件。
[0093] 在某些实施方案中,本发明提供了加权基因标签矩阵(WGSM)的用途,WGSM是例如基于以高准确性预测自闭症的四组基因和基因权重(权重集1-4,参看表1)。在一些示例
性实施方案中,WGSM包括如以上所列(参看表1)的总计762个基因,还可以包括以众多集
合排列的2个或更多个基因。应了解,在该方法中所使用的基因的确切数量以及基因类型
可以基于由自闭症参考数据库得出的模型而变化。
[0094] 在某些实施方案中,本发明的WGSM技术包括以下步骤:
[0095] 步骤1:收集血液白细胞质量样品并从白细胞提取RNA。从新生儿、幼儿、幼童或年幼儿童收集血液白细胞作为普通儿童筛查程序的一部分或作为处于高自闭症风险(如
有幼小的自闭症儿童同胞)或怀疑患有自闭症的那些儿童的诊断测试。在收集血液样品之
前,获取体温和病史并以文件记录。如果该儿童在抽血前72小时没有出现发烧、感冒、流
感、感染或其它疾病或者使用药物治疗,就收集样品。如果儿童出现发烧、感冒等,则应当在该疾病痊愈之后超过一周才收集血液样品。
[0096] 将四到六毫升血液收集到涂有EDTA的管中。捕获白细胞并立即使其稳定(例如TM
经由LeukoLOCK 过滤器(Ambion,Austin,TX,USA))并放入-20度的冷冻器中用于后续加
工。
[0097] 根据标准实践从白细胞中提取mRNA。举例来说,如果使用LeukoLOCK盘,则使其不含RNAlater并且使用Tri试剂冲洗掉捕获的淋巴细胞并溶解这些细胞。随后用乙醇使RNA沉淀并通过洗涤和基于滤筒的步骤进行纯化。用RNA完整度数值(RNA Integrity Number,
RIN)检验确定mRNA样品的质量并且只有7.0或更高值被认为可接受用于接下来的步骤中。
使用例如Nanodrop(Thermo Scientific,Wilmington,DE,USA)进行RNA的定量。
[0098] 步骤2:测定自闭症加权基因测试中使用的基因的基因表达水平。通过使用基于微阵列的平台(如Illumina HT-12或等效平台)或新一代测序法获得全基因组基因表达水
平。也可以对WGSM和/或基因网络标签矩阵(GNSM)基因使用基于定制微阵列的靶向法、
靶向测序或基于PCR的扩增法来进行基因表达水平的分析(参看下文的基因表达谱)。
[0099] 然而,不管使用哪种方法,都应提供WGSM中每个基因的高保真度表达水平。这是通过使用多种询问每个探针/基因的信号强度和分布的方法实现的。举例来说,使用检测
呼叫(detection call)p值0.01作为滤出具有质量较差的表达水平的探针/基因的阈值。
就同时对多位受试者进行分析来说,在至少一位受试者中具有不可检测的水平的任何探针
/基因也被排除。一旦确定了具有高保真度表达水平的最终探针/基因集合,就对数据进行
变换(例如用“log2”函数)并标准化。标准化步骤有助于获得信息丰富并且与加权基因
表达参考数据库相当的表达水平。
[0100] 在某些实施方案中,自闭症加权基因特征测试(WGFTA)技术利用了至少20、40、80、150位或更多受试者(以与下文所论述的参考数据集类似的标准募集并处理)的同时分
析进行独立标准化。在更少受试者的情况下,可以在进行标准化之前将这些受试者加到参
考数据库中。然后可以使用例如“分位数(quantile)”法进行标准化。
[0101] 在步骤2结束时,已经测定WGM中每个基因的关于个别受试者或患者的标准化基因表达值(normalized gene expression value,NGEV)。在一些实施方案中,使用了一个
或多个NGEV对用于本发明方法中的基因分类,而未另外使用基因特异性权重。在某些实施
方案中,将NGEV与MMSM值和/或CFSM值一起使用。在替代性实施方案中,NGEV未与MSSM
值和/或CFSM值一起使用。
[0102] 步骤3:自闭症加权基因特征测试(WGFTA)的程序涉及将加权基因标签矩阵中的基因特异性权重应用于每个儿童的NGEV。对于WGSM中的每个基因,用其NGEV乘以该基因
的基因特异性权重(例如参看表1)。所得到的每个基因的值就是加权基因表达水平。在
某些实施方案中,代表性实例权重集1-4中的基因构成了WGSM中的基因并且被用于WGFTA
中。
[0103] 可以使用如主成分分析(PCA)或特征值或多维标度法(MDS)等方法对受试者(或患者)的样品的加权基因表达水平进一步处理以缩减维度。这一步骤减少了后续分析步骤
的计算时间、数据误差并且增加计算能力,同时它还保留了可用于分类的生物信息。如果计算能力、时间和数据误差都不是障碍,则每个受试者或患者的加权基因表达水平数据可以
按原样用于下一步骤中。
[0104] 步骤4:自闭症加权基因特征测试(WGFTA)的第二个程序是将加权基因表达水平与独特的自闭症和对照加权基因表达参考数据库相比较。将受试者或患者的加权基因表达
水平集与特定的多维加权基因表达参考数据库相比较以确定自闭症风险评分和/或类别
鉴定(ASD、非ASD)。采用了两种不同的评分或类别鉴定法(参看下文)。
[0105] 在某些实施方案中,本发明的性能包括:加权参考数据库的预测准确性、具有估计的AUC的ROC曲线、准确性、特异性、灵敏度及有关所鉴别的基因集的权重矩阵。参看图4c和图4d(加权参考数据库的逻辑斯蒂回归分析(Logistic regression analysis)和分类
结果)及表1。
[0106] 评分/类别鉴定法
[0107] 在某些实施例中,使用了以下评分法。不过,目前已知或以后开发的任何可用的评分方法都涵盖在本发明的范围内。
[0108] 在某些实施方案中,方法使用了提升的分类树来构造筛查、诊断和预后分类器,其中使用或未使用模块对基因进行分类。这一分类方案分为两个主要成分。第一,基础的分类算法是分类树。第二,将提升应用于这一基线分类器以增加预测强度。所得到的学习算
法保留了基线分类器的强度,同时改善了整体预测能力。在特定实施方案中,有两个类别,ASD和非ASD;这些类别以记号+1和-1表示。训练数据集由带标号的病例(x1,y1),(x2,
y2),...,(xN,yN)组成。此处,yi是类别标记,并且xi是所测量的第i位个体的变量或特征向量。分类器由函数C(x)表示,该函数的输入为特征空间中的向量x并且其输出为一个类
别标记。
[0109] 在第一成分(即,分类树)中,所使用的基础学习算法是针对分类的决策树。任何分类器都可以通过将特征空间分隔成不相交的区域R1,R2,…,Rk并以相关标记c1,c2,…,ck
表示。一个新的未标记的病例的类别是通过将该区域定位在该病例的特征坐标所处位置中
并读出该区域的类别标记来预测。在决策树中,这一分隔是由二叉树中的叶节点表示(参
看图15)。从该树的根部开始,每个节点表示通过依据一个变量分开特征空间的一个区域而得到的分区。特征空间由此递归地分成越来越精细的亚区。在该树底部处的“叶”节点附
有类别标记。用于分类的最佳分隔是从以下数据学习:对于指定节点,选择整个特征集的变量以及将数据最佳地分成其组成类别的关于该变量的阈值,从而产生两个儿童节点。该选
择是基于使所得分类器适应性的某种量度(如信息增益)最大。对每个节点重复该过程,
直到达到停止标准,如当给定亚区中的所有训练数据点都属于同一类别时。
[0110] 接着,在第二成分(即,提升)中,使用提升算法(如AdaBoost)对分类树进行了改进。这一算法通过迭代地拟合基线分类器并使用其对训练数据的性能在后续拟合中对每
个点的重要性进行再加权来进行(参看图16)。起初,对每个数据点指定相等的权重。在
拟合分类器之后,使用有关训练数据的错误率产生与该分类器相关的权重α。接着更新数
据点的权重:误分类点的权重被增加,同时正确标记的点不再强调。这迫使下一分类器更关注先前出现错误的病例。在下一次迭代中使用再加权的观察结果重复该过程;当测试错误
(从测试数据集计算或经由交叉验证确定)已经稳定时,或当已经达到指定数目的迭代时,
停止该过程。形式上,该算法进行如下。使wi为第i个训练点的权重,i=1,…,N。将权
重预置为wi=1/N。对于j=1,…,J,执行以下操作:
[0111] 1.将分类器Cj(x)拟合到加权数据集。
[0112] 2.计算加权的训练错误率
[0113] 3.计算权重
[0114] 4.对于每个i,根据下式更新权重:
[0115] 结果是分类器和相关权重的序列(C1(x),α1),(C2(x),α2),…,(CJ(x),αJ)。通过取得该序列的加权总和的sign(符号函数),将该序列并入最后一个分类器中:
[0116] 在其它实施方案中,可以使用基于该树的分类器的替代方案,如基于距离的方法,这些方法利用了特征空间中的距离来预测类别标记。该程序可以对给定特征集符合每个类别的程序进行定量,并预测具有最高一致性的类别的标记。对于每个类别,使用样本均值
和样本协方差矩阵来估计特征分布的均值向量μ和协方差矩阵∑。然后,对于特征空间
T -1 1/2
中的给定点x,计算x与均值d=((x-μ)∑ (x-μ)) 之间的氏距离(Mahalanobis
distance)。x的预测标记是对应于使此距离最小的类别的标记。然后,可以通过使用所得
分类器作为以上略述的提升程序中的基线分类器来改善其性能。
[0117] 利用多个特征集,可以使用多种特征拟合在此详述的模型来进行预测。在一些情形中,在预测时只有某些类型的特征是可用的。举例来说,可能只观察到特定患者的基因表达标签和年龄。该模型可以使用来自MMSM和CFSM以及GNSM的各种特征模态的组合进行
拟合。结果是一套分类器,每一个适合于不同的特征类型配置。由此得到分类程序,该程序可以用于多种患者数据可用性并由此稳健地适用于所应用的设置。
[0118] 用若干算法(包括但不限于,基于随机森林(Random Forest)的方法、基于神经网络的方法、基于支持向量机的方法、基于提升的方法及基于逻辑斯蒂回归的方法)来测试
WGSM的性能,并针对自闭症和非自闭症受试者的第二数据集独立验证。这一测试在自闭症
的诊断分类方面具有高准确性(80%或更高的分类准确性),由此确定:1)独特的基因权重
模式的功效和特异性;2)所鉴别的四个基因集的相关性、灵敏度和特异性;以及3)有关自
闭症和对照的多维加权参考的可靠性。
[0119] 评分计算和类别预测是通过被选择用于测试新受试者的WGSM的基于计算机的算法来产生(参见以上段落)。通过使用基于距离的分类对新受试者矩阵与来自ASD受试者
和对照受试者的参考矩阵之间进行矩阵比较。
[0120] 基因表达谱
[0121] 本发明能够使用全基因组和基因靶向方法对测试受试者的外周血淋巴细胞的基因表达水平进行定量。如本文所使用,全基因组方法包括但不限于,使用基于微阵列的平台和新一代测序法。在标准的标准化、变换和过滤步骤(参看以下实施例中的方法)之后,提
取出属于WGSM的基因的表达水平。如本文所使用,基因靶向法包括但不限于,基于微阵列
的平台或基于PCR的扩增法。
[0122] 利用该靶向方法,只能测定属于WGSM的基因的表达水平。使用全基因组微阵列需要先验的构建基因库或使用基因捕获方法。可选地,经由基于微阵列的平台进行的靶向方
法是通过用对照探针和参考探针构建只含来自该四个基因集的基因的专设计的基因表
达微阵列来进行,并将其复制到该平台上以实现多位患者的高再现性和测试。接着,利用对照探针、参考基因和/或实验计算基因表达水平。
[0123] WGSM特征:
[0124] 1)标签基因组成:所提供的WGSM的实例包括762个基因。然而,可以在不同平台(如基于阵列的平台、基于测序的平台或基于PCR的平台)上分析任何2个或更多个基因。
[0125] 2)还使用了WGSM内基因的剪接变体的信息。
[0126] 3)数据检测工具也被用于WGSM的基因。
[0127] 在一些实施方案中,本发明提供的WGSM可以单独或与以上所描述的一种或多种其它矩阵组合用于自闭症加权基因特征测试(WGFTA)中。在某些实施方案中,组合使用了
WGSM与受试者年龄作为多模态标签矩阵(MMSM)。
[0128] 标签发现的主要意义在于使用一种通用、自然的群体筛查方法来募集受试者。这种方法允许在自闭症患者和对比患者出现于社区儿童诊所中时对其进行无偏见、前瞻性的
募集和独特研究。为了使用于标签发现的ASD受试者和对照受试者的数量最多,在两组受
试者分布中容许少许的年龄差异,标签纳入年龄作为分类分析的预测因子。接着,在受试者的分类过程中,通过用两项分布进行逻辑斯蒂回归来评估所有预测因子的影响。这些分析
的输出提供如下:
[0129] a)使用年龄作为诊断的唯一预测因子进行的分析显示出朝向ASD类别的极小ODDS比率,即1.07。
[0130] b)使用权重集1-4作为预测因子进行的分析显示出不常见的ODDS比率(分别为9577.88、17423.52、4.16e-05及3716.94)。
[0131] c)一起使用所有预测因子(权重集1-4和年龄)进行的分析再次显示出关于权重集1-4的极大ODDS比率(分别为1.73e+06、1.46e+05、5.31e-03及6.235152e+01)及关于
年龄的接近1的ODDS比率(1.089)。使用不同的算法,使分类性能平均改善3%-4%(参
看表3)。
[0132] 表3
[0133] 在利用和不利用年龄作为预测因子的情况下使用不同算法的分类性能
[0134]
[0135] 已知从ODDS值变换成概率是遵循指数曲线的一种单调变换。ODDS比率为1指示有0.5的概率归为任一类别,在这一情形中为ASD和非ASD。倾向于无穷大或零的ODDS分
别指示极高或极低的概率分类为ASD。由此证实,尽管在此研究中存在年龄影响,但考虑到基因表达标签预测因子(表1中的权重1-4)的影响,年龄影响极小。此外,通过在利用和不
利用年龄作为预测因子的情况下发现和复制受试者的分类,凭经验对这一影响进行定量。
已发现,当在该分析中纳入年龄作为预测因子时,分类准确性增加约3%-4%,因此在某些实施方案中,本发明使用了年龄作为预测因子用于ASD的筛查、诊断和预后标签,如以下实施例3中所示。
[0136] 类似地,来自MMSM的另外的预测因子包括通过临床、行为、解剖学和功能测量获得的非基因组可定量特征。在某些实施方案中,临床特征是在ADOS、穆林(Mullen)、文澜
(Vineland)及任何其它诊断和心理测量学测试量表上的评分。在某些实施方案中,神经行
为特征是眼动追踪测试,如有关自闭症的GeoPreference测试和探索测试。在某些实施方
案中,解剖学特征为MRI神经解剖学测量值,包括但不限于,如通过多种方法测定的全部和局部灰质或白质容积、皮质表面积或厚度以及皮质脑回,这些方法包括但不限于,基于体素的方法、基于统计制图的方法以及基于表面或结构重构的方法(例如,临时灰质容积,以及DTI测量,包括皮质束投射的皮质束FA和容积以及脑回图案)。
[0137] 在某些实施方案中,功能特征为fMRI测量,包括但不限于,激活、心理生理学(PPI)、动态因果模型(dynamic causal modeling)、无监督分类信息图和值。在分类和预后分析中,在以WGSM作为预测因子的情况下,使用了GNSM和CFSM中的类似特征。
[0138] 因此,在一些实施方案中,本发明利用了一种基于人体内特异性基因权重的特定模式的测试,这些特异性基因权重涉及管理细胞周期、DNA损害反应、细胞凋亡、蛋白质折叠、翻译、细胞粘附和免疫/炎症、信号转导ESR1-核路径、转录-mRNA加工、细胞周期减数分裂、细胞周期G2-M、细胞周期有丝分裂、细胞骨架-纺锤体微管以及细胞骨架-细胞质微
管功能。本发明所提供的WGFTA需要高质量分子成分,包括通过临床标准方法从血液和其
它组织提取的RNA、基因组DNA、细胞和血清蛋白质,及小分子分析物,所述血液和其它组织是使用临床常规方法从刚出生到1岁、1岁到2岁、2岁到3岁及3岁到4岁的儿童收集。本
发明提供的DNA和/或mRNA可以按许多方式收集和/或直接从生物组织或细胞样品(包
括但不限于,泪液、唾液、粘液、颊拭子、全血、血清、血浆、脑脊髓液、尿液等)或细胞(包括但不限于,成纤维细胞、iPS细胞、源自于iPS细胞的神经组细胞及源自于iPS细胞的神经元等)分离或纯化。生物样品也可以从特定细胞或组织或从任何分泌物或渗出物获得。在某
些实施方案中,该生物样品是从外周血获得的生物流体。在某些实施方案中,DNA是从源自于新鲜血液的外周血核细胞(PBMC)分离或纯化。用于从样品(如细胞、组织或生物流体)
中纯化出生物分子的技术是本领域众所周知的。所选技术可以随所检查的组织或样品而变
化,而将适当纯化程序与测试样品源相配正好在本领域的技能范围内。
[0139] 在一些实施方案中,本发明的WGFTA使用了若干已知并且现有技术水平的基于基因组RNA/基因表达检验(如RNA测序、定制基因表达阵列、基于PCR的检验、现有技术水平
的全基因组微阵列或基因组测序)中的任一种,其得到准确的表达水平。在一些实施方案
中,WGFTA是基于基因集,如例如四个集合:表1中的权重集1、权重集2、权重集3及权重集
4。在某些实施方案中,WGFTA包括基因的特定剪接变体。在一些实施方案中,加权基因矩
阵包含WGFTA中的基因和其基因特异性权重(参看表1)。此外,在某些实施方案中,自闭症
决定性加权基因表达水平是加权基因标签矩阵中的基因逐基因乘以基因特异性权重得到
的个体的标准化基因表达水平变换。
[0140] 取决于每个病例独有的因子以及所希望的特异性和准确性水平,可以例如从表1中所描述的基因中选出许多基因。在一些实施方案中,这些基因一般是基于权重的绝对值,根据相对重要性进行排列。在某些实施方案中,所选基因的数量包括所选基因集内的至少
10、20、25、30、35、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、200、210、
220、230、240、250、260、270、280、290、300、350、400、450、500、550、600、650、700、750个或更多基因,包括其间和更多的数量。
[0141] 在某些实施方案中,本发明的WGFTA是(a)将独有的基因特异性权重应用于这些基因的个体的标准化基因表达值,以便得出所述个体的自闭症决定性加权基因表达水平;
(b)应用通过尝试优化自闭症加权基因和特征测试的分类性能所得到的独有基因特异性权
重的任何子集;(c)由于优化通过WGM得到的自闭症和非自闭症加权基因表达参考数据库
对加权基因标签矩阵中权重进行修改;(d)比较个体的自闭症决定性加权基因表达水平与
自闭症和非自闭症加权基因表达参考数据库;及(e)任何基于RNA的检验的开发和使用,该
检验使用了加权基因标签矩阵来测试自闭症风险。
[0142] 在一些实施方案中,本发明还提出,将任何基于RNA的基因表达数据的开发和使用与MMSM测量(例如解剖学和/或功能性脑测量值)组合来筛查自闭症风险或诊断性分
类自闭症和其它发育障碍。举例来说,在某些实施方案中,将年龄与受试者的基因表达水平相结合并作为预测因子(例如,参看上述评分/类别鉴定方法)来调整和/或改善自闭症
风险筛查、自闭症诊断分类和预后分析,并且WGFTA是基于自闭症受试者与非自闭症受试
者的比较。此外,使用GeoPreference测试评分、沟通与象征行为量表(communication and symbolic behavior scale,CSBS)测试评分及基因组DNA(CNV、SNV、插入缺失(indel))标
记物与表达标签(例如,在上述评分/类别鉴定方法中所描述的方法的一个实施方案中)
的组合使WGFTA性能增加并且改善了自闭症与其它发育和神经精神障碍的分类。
[0143] 在一些实施方案中,本发明提供的自闭症和非自闭症参考数据库包含基因表达水平、权重和已经描述的所有非基因组特征的集合,其独特地源自于完整临床表征和诊断确
定患有自闭症,典型地发育(TD)的幼儿、幼童和年幼儿童,以及非自闭症非TD受试者。
[0144] 因此,在一些实施方案中,本发明提供的自闭症加权基因和特征测试(WGFTA)可以用于儿童群体的自闭症风险筛查以及怀疑有患自闭症风险的新生儿、幼儿、幼童及年幼
儿童的临床随访诊断和预后评价。本发明的一些特性是基于体内血液白细胞中mRNA表达
的功能基因组异常的分析,因为这些异常与脑和脑大小的测量以及典型地发育的对照中
mRNA表达模式有关。因此,在某些实施方案中,本发明是基于功能基因组缺陷的直接实验知识以及由此得到的相较于对照受试者在自闭症幼童中破坏的脑大小关系。
[0145] 参考文献
[0146] 1.Developmental Disabilities Monitoring Network PrincipalInvestigators.Prevalence of autism spectrum disorders--Autism and
Developmental Disabilities Monitoring Network,14 sites,United States,2008.MMWR Surveill Summ 61,1-19(2012)
[0147] 2.Huttenlocher,P.R.Dendritic and synaptic development in humancerebral cortex:Time course and critical periods.Developmental Neuropsychology
16,347-349(1999).
[0148] 3.Huttenlocher,P.R.&Dabholkar,A.S.Regional differences insynaptogenesis in human cerebral cortex.Journal of Comparative Neurology 387,
167-78(1997).
[0149] 4.Pierce K,CarterC,Weinfeld M,et al.Detecting,studying,and treating autism early:the one-year well-baby check-up approach.The Journal ofpediatrics2011;159:458-65 e1-6.
[0150] 5.Wetherby AM,Brosnan-Maddox S,Peace V,Newton L.Validation of theInfant-Toddler Checklist as a broadband screener for autism spectrum disorders from 9 to24 months of age.Autism 2008;12:487-511.
[0151] 6.Pandey J,Verbalis A,Robins DL,et al.Screening for autism in older and younger toddlers with the Modified Checklist for Autism in Toddlers.Autism2008;12:513-35.
[0152] 7.Kleinman,J.M.et al.The modified checklist for autism in toddlers:afollow-up study investigating the early detection of autism spectrum disorders.J Autism Dev Disord 38,827-39(2008).
[0153] 8.Chlebo wski,C.,Robins,D.L.,Barton,M.L.&Fein,D.Large-scale useof the modified checklist for autism in low-risk toddlers.Pediatrics131,e1
121-7(2013).
[0154] 9.Zwaigenbaum L,Bryson S,Rogers T,Roberts W,Brian J,SzatmariP.Behavioral manifestations of autism in the first year of life.Int J Dev
Neurosci 2005;23:143-52.
[0155] 10.Ozonoff S,Young GS,Carter A,et al.Recurrence risk for autismspectrum disorders:a Baby Siblings Research Consortium study.Pediatrics 2011;
128:e488-95.
[0156] 11.Paul R,Fuerst Y,Ramsay G,Chawarska K,Klin A.Out of the mouths of babes:vocal production in infant siblings of children with ASD.J Child Psychol Psychiatry 2011;52:588-98.
[0157] 12.Landa R,Garrett-Mayer E.Development in infants with autism spectrum disorders:a prospective study.Journal of child psychology and psychiatry,andallied disciplines 2006;47:629-38.
[0158] 13.Abrahams BS,Geschwind DH.Advances in autism genetics:on thethreshold of a new neurobiology.Nature reviews.Genetics.2008;9:341-355.
[0159] 14.Chow ML,Pramparo T,Winn ME,et al.Age-dependent brain gene expression and copy number anomalies in autism suggest distinct pathological processes at young versus mature ages.PLoS Genet.2012;8(3):e1002592.
[0160] 15.Devlin B,Scherer SW.Genetic architecture in autism spectrumdisorder.Current opinion in genetics&development.Jun 2012;22(3):229-237.
[0161] 16.Courchesne E,Pierce K,Schumann CM,et al.Mapping early braindevelopment in autism.Neuron.2007;56:399-413.
[0162] 17.Stanfield AC,McIntosh AM,Spencer MD,Philip R,Gaur S,LawrieSM.Towards a neuroanatomy of autism:a systematic review and meta-analysis of
structural magnetic resonance imaging studies.European psychiatry:the journal of the Association of European Psychiatrists.Jun 2008;23(4):289-299.
[0163] 18.Courchesne E,Mouton PR,Calhoun ME,et al.Neuron number and size in prefrontal cortex of children with autism.JAMA.Nov 9 2011;306(18):2001-2010.
[0164] 19.Courchesne E,Karns CM,Davis HR,et al.Unusual brain growth patterns in early life in patients with autistic disorder:an MRI study.Neurology.2001;57:245-254.
[0165] 20.Glatt SJ,Tsuang MT,Winn M,et al.Blood-based gene expressionsignatures of infants and toddlers with autism.J Am Acad Child Adolesc
Psychiatry2012;51:934-44 e2.And also
[0166] 21.Kong SW,Collins CD,Shimizu-Motohashi Y,et al.Characteristics and predictive value of blood transcriptome signature in males with autism spectrum disorders.PloS one.2012;7(12):e49475.
[0167] 22.O ′ Roak,B.J.et al.Multiplex targeted sequencing identifiesrecurrently mutated genes in autism spectrum disorders.Science 338,
1619-22(2012).
[0168] 23.Klin,A.,Lin,D.J.,Gorrindo,P.,Ramsay,G.&Jones,W.Two-year-olds with autism orient to non-social contingencies rather than biological motion.Nature459,257-61(2009).
[0169] 24.Jones,W.,Carr,K.&Klin,A.Absence of preferential looking to theeyes of approaching adults predicts level of social disability in 2-year-old
toddlers with autism spectrum disorder.Arch Gen Psychiatry 65,946-54(2008).
[0170] 25.Shic,F.,Bradshaw,J.,Klin,A.,Scassellati,B.&Chawarska,K.Limited activity monitoring in toddlers with autism spectrum disorder.Brain Res 1380,246-54(2011).
[0171] 26.Bedford,R.et al.Precursors to Social and Communication Difficulties in Infants At-Risk for Autism:Gaze Following and Attentional Engagement.JAutism Dev Disord(2012).
[0172] 27.Chawarska,K.,Macari,S.&Shic,F.Context modulates attention to social scenes in toddlers with autism.J Child Psychol Psychiatry 53,903-13(2012).
[0173] 28.Pierce,K.,Conant,D.,Hazin,R.,Stoner,R.&Desmond,J.Preference for geometric patterns early in life as a risk factor for autism.Archives of General Psychiatry 68,101-9(2011).
[0174] 29.Luyster,R.et al.The Autism Diagnostic Observation Schedule-toddler module:a new module of a standardized diagnostic measure for autism spectrumdisorders.J Autism Dev Disord 39,1305-20(2009).
[0175] 30.Lord,C.et al.The Autism Diagnostic Observation Schedule-Generic:AStandard Measure of Social and Communication Deficits Associated with
the Spectrum of Autism.in Journal of autism and developmental disorders
Vol.30205-223-223(Springer Netherlands,2000).
[0176] 31.Wetherby AM,Allen L,Cleary J,Kublin K,Goldstein H.Validity andreliability of the communication and symbolic behavior scales developmental
profile with very young children.Journal of speech,language,and hearing
research:JSLHR2002;45:1202-18.
[0177] 32.Burrier et al,INSAR abstract,2013.实施例
[0178] 实施例1
[0179] 自闭症幼童的破坏的基因网络引起早期脑发育不良并提供准确的分类
[0180] 引起患有自闭症谱系障碍(ASD)的幼童的异常早期神经系统发育的遗传机制仍未知,并且没有在此期间检测ASD风险的遗传或功能基因组标签。本实施例的目的是鉴别
引起ASD中神经系统发育的功能基因组异常和风险标签。
[0181] 使用了通用自然群体筛查方法对来自社区儿童诊所的ASD和对照幼童(典型地发育的幼童和对比幼童)进行前瞻性、无偏见的募集和研究。在年龄为1-4岁的142个男性
发现样品中分析全基因组白细胞表达和基于MRI的神经解剖学测量。应用共表达分析来鉴
别与神经解剖学测量变化有关的基因模块和ASD的候选基因组标签。使用类别比较和网络
分析来鉴别ASD幼童的失调的基因和网络。将结果与73个幼童的复制样品相比较。
[0182] 在ASD幼童与对照幼童中将基因表达谱与神经解剖学测量同针对年龄的标准化值的偏差相关联。使用逻辑斯蒂回归法和ROC分析测试分类性能。细胞周期和蛋白质折叠
基因网络在对照幼童中与脑大小、皮质表面积以及脑灰质和白质明显相关,但在ASD中呈
弱相关。而ASD幼童与一系列异常的不同基因网络(包括免疫/炎症、细胞粘附和翻译)
展现出相关性。DNA损害反应和促有丝分裂信号传导在发现样品和复制样品中是极为相似
的失调路径。富集免疫/炎症和翻译基因的基因组标签展现出75%-82%的分类准确性。
[0183] 引起ASD早期脑发育不良的功能性遗传病理学涉及破坏多个管理侧支基因网络的神经元数量和突触形成以及异常诱导的过程。基因网络失调的程度与脑大小之间的有序
相关性表明,在相当多的ASD幼童中可能存在一组共有的潜在异常遗传路径。这些了解将
有助于发现在大多数患病个体中导致早期治疗和常见生物治疗干预的生物靶的早期生物
标记物。
[0184] 先前在了解自闭症谱系障碍(ASD)的遗传基础1-3和神经系统基础 4-6方面取得了巨大进展。然而,仍有待确定ASD的这两个基础生物域之间的关联。有估计12%到37%的
患者在幼小年龄时在临床上出现巨颅,而有一小群具有较小的脑大小。然而,有关这一巨大变化的遗传解释仍不确定。此外,在普通儿童诊所中尚未发现幼儿和幼童有关于ASD风险
的遗传标签。
[0185] 长久以来建立的脑-基因关联理论至少在具有增大的脑的ASD中得到了新的ASD7 4,5,8-12
尸检证据的支持。该理论 在于在大多数ASD病例中出现的早期脑过度生长 可能是
由神经元因胎儿期管理神经形成的过程(如细胞周期和/或细胞凋亡)失调引起神经元过
多所致。一项近期的尸检研究发现在出现脑增大的ASD儿童的胎儿期皮质(引起自闭症症
6
状的区域)中神经元过多 ,并且另一项尸检研究也报导在ASD男性儿童的胎儿期皮质中
2
细胞周期和细胞凋亡路径存在异常基因表达 。在稍后的ASD尸检研究中所鉴别的基因路
13
径与在活的ASD患者中通过CNV路径富集分析所鉴别的那些路径一致 。补充理论是ASD
14
也可能涉及突触异常 ,但这与早期脑生长变异的关系尚不可知。由于在ASD中未曾进行
脑-基因组在早期发育期间的关系的直接分析,故细胞周期、细胞凋亡和/或突触过程的遗
传失调是否引起大多数ASD幼童中的脑生长和大小变化仍不可知。由于神经元数量和突触
形成及功能是发育的基础并且引起脑大小,故导致ASD的常见路径可能涉及其失调。
[0186] 在ASD幼童和对照幼童中进行体内基因组-脑关系的新颖研究。此研究的独特之处在于,所有幼童都来自普通自然群体筛查方法,该方法允许进行ASD、典型地发育(TD)的幼童和对比幼童的无偏见、前瞻性募集和研究,因为其出现在社区儿童诊所中。无偏见数据驱动的生物信息学方法被用来发现与ASD临床发作年龄时脑解剖学相关的功能基因组异
常并且将其与TD幼童和对比幼童相区别。利用这种自然主义者普通群体方法,还能够测试
一些功能基因组异常是否也可能在极幼小年龄时提供有关ASD风险的候选诊断标签。
[0187] 方法
[0188] 受试者、追踪和临床测量
[0189] 参与者为215位1-4岁的男性。147位幼童是发现样品(N=91位ASD,56位对照)并且73位(N=44位ASD,29位对照)为复制样品。经由1岁儿童健康检查法(1-Year
15
Well-Baby Check-Up Approach)从社区儿童诊所募集幼童 (参看实施例2中的方法),该
方法是一种用于ASD、典型地发育的受试者和对比患者的前瞻性研究的普通自然群体筛查
法。在这一方法中,幼童的父母在其儿科医生办公室完成了一项粗略的发育筛查,并且将幼童转介,进行评价并随时间进行追踪。由此提供了代表广泛分布并且种类众多的能力和残
疾的幼童的无偏见募集。从转介(无论出于何种转介原因)时并且在最后一次诊断评价之
前,从一小组受试者收集血液样品用于基因表达、DNA分析和MRI脑扫描。使用多种测试对
每位受试者进行评价,包括适当的自闭症诊断观察量表(Autism Diagnostic Observation
16,17 18
Schedule,ADOS) 和穆林早期学习量表(Mullen Scale of Early Learning) 模块。用
19
文澜适应行为量表(Vineland Adaptive Behavior Scale) 和医疗史面谈与父母进行面
谈。每6-12个月通过诊断方法和心理测量方法对在抽血时不到3岁的受试者进行纵向再
评价,直到其年满3岁,此时对其作出最终诊断。将受试者分入两个研究组中:ASD组和对
照组。对照组包含典型地发育(TD)的幼童和对比幼童(例如,语言、总体发育或动作延迟)
(表4)。
[0190] 表4
[0191] 受试者特征和临床信息概述
[0192]
[0193]
[0194] 在穆林量表上的语言分项测试上低于预期值>1个标准偏差
[0195] 在穆林量表的3个或更多个分项测试上低于预期值>1个标准偏差并且整体发育系数低于预期值>1个标准偏差(即,<85)
[0196] <超过37周妊娠
[0197] 《社交情感能力延迟的诊断
[0198] 母体在妊娠期间暴露于药物
[0199] *复制:ASD群体中32%具有ADOS T,48%具有ADOS 1,并且20%具有ADOS 2。
[0200] 发现:ASD群体中有64%具有ADOST,31%具有ADOS 1,并且5%具有ADOS 2。
[0201] 适应性行为量表适应性行为综合评分
[0202] 血液样品的收集和处理
[0203] 使用LeukoLOCKTM过滤器(Ambion,Austin,TX)从四毫升到六毫升血液中捕获白细胞(参看实施例2中的方法)用于发现样品和复制样品。在Illumina Human-HT12_v.4平
台上测试发现集中的RNA样品,同时将Illumina WG-6平台用于复制集。对五个低质量阵
列进行鉴别并将其从统计学分析中排除(参看实施例2中的方法)。最终的样品为87位
ASD和55位对照发现幼童,以及44位ASD和29位对照复制幼童(表4)。
[0204] MRI扫描和神经解剖学测量
[0205] 在自然睡眠期间从父母同意扫描的发现幼童(65位ASD幼童,38位对照幼童)获得MRI数据。使用半自动管道集成改良的FSL和BrainVisa特征(fmrib.ox.ac.uk/fsl/;
brainvisa.info)获得十二个神经解剖学测量值,并且其包括总脑容积、左大脑和右大脑灰质和白质容积、左大脑和右大脑皮质表面积、左小脑和右小脑灰质和白质容积,及脑干容积(参看实施例2中的方法)。
[0206] 统计学分析和生物信息学分析
[0207] 对经过标准化和过滤的表达数据进行统计学分析。经由广义相加模型(Generalized Additive Model)(GAM-R软件包1.06.2版)去除年龄对神经解剖学测量的
20
影响 。
[0208] 使用共表达分析(WGCNA)分别鉴别所有发现受试者以及每个研究组内的基因模块(参看实施例2中的方法)。WGCNA分析、泊松和斯皮尔曼相关分析(Pearson and
Spearman correlation)被用于鉴别所有发现幼童的基因表达模式与神经解剖学之间的关
联。同时使用WG CNA计算基因显著性(Gene Significance)(基因表达水平与表型的相关
性)和模块成员资格(每个模块内的基因连接性)(参看实施例2中的方法)。使用随机变
量模型,在BRB阵列工具(linus.nci.nih.gov/BRB-ArrayTools.html)中以10,000个单变
量置换测试进行类别比较分析。使用MetaCore软件进行路径富集分析。使用超几何概率
(Hyper-geom etric probability,Hyp.P)测试维恩分析(Venn analyse)对相等大小的随
机基因集的意义(参看实施例2中的方法)。使用来自发现幼童的差异表达(DE)的基因鉴
别ASD的潜在基因表达标签。使用逻辑斯蒂函数回归(glmnet)基于发现幼童的分类中的
AUC性能选出四个DE模块。使用CNVision判定如先前所描述误分类的ASD患者的拷贝数
2,21
变异(CNV)。
[0209] 结果
[0210] 大多数发现和复制受试者是来源于白种人。皮尔森卡方测试(Pearson’s2
Chi-squared test)显示ASD与对照之间在人种/种族方面无显著差异(发现X=7.98,
2
P=0.1569;复制X=7.19,P=0.2065)。
[0211] 在所有ASD幼童和对照幼童中,年龄校正的MRI总脑容积(TBV)测量值以及对于其它测量值遵循正态分布,并且无统计学显著差异(图1a,P=0.645)。
[0212] 在所有发现受试者中进行过滤之后,使用12208个基因探针进行下游分析。
[0213] 不同基因网络引起ASD组和对照组神经解剖学测量值的变化
[0214] 整个组合的ASD组和对照组的WGCNA
[0215] 使用WGCNA进行的非监督共表达分析鉴别出22个共表达基因模块(参看图5),其中特征基因值是关于每个模块以及每个ASD受试者和对照受试者计算。在这22个模块
中,有七个始终与所有受试者的神经解剖学测量值相关,包括TBV、大脑灰质、大脑白质和大脑皮质表面积(表5,图6),并且展现出统计学显著的富集(P<0.05,FDR<0.05;图1b)。黄
绿色和灰色60基因模块与所有组的脑容积和大脑容积的展现出最强的相关性(表5)并且
全部七个模块都与TBV测量相关。黄绿色模块展现在细胞周期功能方面的最高富集,而蛋
白质折叠基因在灰色60模块中最高(图1b,表8)。而七个不同的基因模块则与诊断相关
(参看实施例2中的表26)并且Metacore分析对于具有最强相关性的模块,继之以细胞周
期、翻译和炎症基因未展示显著富集(参看实施例2中的表26)。
[0216] 表5
[0217] 在ASD幼童和对照幼童组合中模块-特征基因和年龄校正的神经解剖学测量的WGCNA关联分析(皮尔森相关分析)
[0218]
[0219] 显著性代码也涉及图1B:p值***<0.001;**<0.01;*<0.05;SignifL=左,R=右,CB=大脑,CBLL=小脑,GM=灰质,WM=白质,TBV=总脑容积,hemi=半球,SA=表面积,BS=脑干,ns=无显著性
[0220] 在对照幼童中,只有细胞周期和蛋白质折叠模块特征基因(ME)与TBV和所有大脑测量值呈强相关(表6和表8)。相比之下,ASD幼童与若干ME展现出相关性,其中最强的
为细胞粘附、炎症和细胞骨架调控,并且最弱的为细胞周期、蛋白质折叠和转录(表6和表
8)。与对照幼童不同,ASD幼童的细胞周期和蛋白质折叠ME与大脑白质测量值无显著相关
性;不过,大脑白质容积与细胞粘附呈强相关性,并且在较低程度上,与炎症和细胞骨架调控ME相关(表6)。具有TBV变化(从小到大)的ME线性模型展现细胞周期和蛋白质折叠
基因在正常小脑中具有最高表达,而翻译、细胞粘附、细胞骨架和炎症基因使其减小到神经系统影响(图1c)。相反,细胞周期和蛋白质折叠基因的活性降低与细胞粘附、细胞骨架和
炎症的表达增加的组合作用看来驱动了ASD中的病理性脑增大(图1c)。
[0221] 表6
[0222] 在ASD幼童和对照幼童各自的模块-特征基因和年龄校正的神经解剖学测量的皮尔森和斯皮尔曼相关分析
[0223]
[0224] 显著性代码:p值皮尔森***<0.001;**<0.01;*<0.05;p值斯皮尔曼^^^<0.001;^^<0.01;^<0.05
[0225] 相关性涉及图1C、D;L=左,R=右,CB=大脑,GM=灰质,WM=白质,TBV=总脑容量,hemi=半球,SA=表面积
[0226] ns=无显著性
[0227] ASD组与对照组网络模式变化的比较
[0228] 每个模块的基因显著性(GS)值的计算提供了共表达的基因对正常和病理性脑大小变化的影响的量度。GS与模块内基因连接性(GC)之间的相关性分析揭露了在若干基因
网络中活性模式的主要重排(有关具有最高GS和GC的基因,参看表21-23)。22个模块中
有十二(12)个展现模式方向的移位(从负到正或无显著性,并且反之亦然),表明对于这
12个模块中的每一个,与对照相比较,枢纽基因对脑大小变化的影响在ASD中显著改变(图
7)。重要的是,细胞周期和蛋白质折叠枢纽基因在ASD幼童中展现减小的GS值,而对于细
胞骨架、炎症、细胞粘附及翻译模块中的枢纽基因观察到GS的明显增加(图2)。用于评估
基因对模块(模块成员资格,MM)的特异性(相对于其GS)的类似分析支持了基因连接性
变化(图2;有关具有最高MM的基因,参看表24和25)。
[0229] ASD组和对照组各自的WGCNA
[0230] 为了进一步测试ASD特异性基因表达与脑发育的关系,分别在每个研究组(ASD组、对照组)内通过WGCNA分析该12208个基因探针。在20个基于对照的共表达模块中,
仅2个与脑容积和大脑测量值呈显著并且较强的相关性(图8)。如与上述全组分析相同,
这两个模块富集细胞周期和蛋白质折叠基因并且对于正常TBV变化展现出高GS值(图3;
表9)。在22个基于ASD的共表达模块中,有11个与一个或多个神经解剖学测量值呈显著
相关性(图9)。不同于对照幼童,这11个模块的GS值与全组分析一致并且富集多个功能
域,包括免疫、炎症、细胞粘附、翻译及发育(图3,表10)。
[0231] 在ASD组对比对照组中DNA损害和促有丝分裂基因网络始终失调
[0232] ASD幼童与对照幼童之间的类别比较分析发现了2765个独特的差异表达(DE)的基因(参看表16)。Metacore富集展现出免疫/炎症反应、DNA损害/细胞凋亡和细胞周
期调控路径以及细胞凋亡的显著失调,如同最前面的Metacore过程网络(表11)。发现数
据集与复制数据集之间的路径比较指示,DNA损害反应和促有丝分裂信号传导是两种样品
中最相似并且最具统计学显著性的失调路径(图4a,表12)。在基因水平上,有405个基因
通常失调,并且主要涉及细胞数量调控的网络(图4b,表13和表17)。
[0233] 与神经解剖学测量值相关的基于组群的基因模块与2765个DE基因之间的文澜分析显示,这些基因模块中分别有12.7%(37/290;Hyp.P=0.38)和27.1%(786/2894;Hyp.
P=1.8e-127)在对照和ASD特异性模块中差异表达。
[0234] DNA损害和促有丝分裂信号传导种类的关键基因是CDK、CREB1、ATM、14-3-3s、AKT、BCL2、PCNA、STAT1、PI3K、β-连蛋白、卡斯帕酶(Caspase)、NUMA1、NFBD1、PP2A、RAD及MAPK(表18和表19)。
[0235] 基于模块的分类有效地区分ASD与对照幼童
[0236] 使用WGCNA进行的2765个DE基因的共表达分析发现,计算出每位受试者和每个模块的12个基因模块和特征基因(图10)。这些模块特征基因中有四个被用于分类分析中
并且以受试者年龄作为预测因子。以年龄作为预测因子进行的逻辑斯蒂回归产生1.07的
优势比(P<0.05)并且不包含年龄的分类准确性有3%-4%降低(数据未示出)。在发现受
试者和复制受试者的405个失调基因中,有24.2%(98/405,Hyp.P=2.7e-48)出现在这
四个模块中。用重复(3次)的10倍交叉验证和ROC分析进行的逻辑斯蒂回归在发现幼童
(训练集)和复制幼童(独立的验证测试集)中展现出高AUC,分别具有82.5%和75%准
确性(图4c、d;表14)。尽管在不同的类别比较中特异性仍很高,但准确性和灵敏度随样本大小减小而降低(图4d)。
[0237] 分类标签中基因的表征
[0238] 该四个模块分类器的Metacore分析展现出翻译和免疫/炎症基因的显著富集20
(表14)。这些基因模块的DAPPLE分析(broadinstitute.org/mpg/dapple) 揭露了蛋白
质-蛋白质相互作用的统计学富集(P<0.001)。接下来,基于具有最高相互作用次数的基因
建立分类网络。与富集发现一致,相当多的核糖体和翻译基因位于该网络的中心(图4e)。
DAPPLE优先级基因的富集分析确定翻译起始作为最前面的过程网络(P=4e-18)。此外,
这些分类器基因中有17.2%(131/762;Hyp.P=0.046)位于大小低于1Mb的自闭症相关
21
CNV(mindspec.org/autdb.html)内。这与先前的发现 相符,表明CNV为基因表达失调的
22
一种潜在的遗传机制 。
[0239] 与目前报导的分类器23,24的比较展现基因含量的从中等到低的重叠。报告的基因中有十二个(12/55)和十八个(18/43)在发现受试者中差异表达,其中分别只有两个和一个基因存在于该分类器中(表15)。
[0240] 预测性能和受试者特征
[0241] 所有分类的受试者(n=215)的预测性能与年龄、诊断亚组、临床和脑测量值相关。误分类的ASD幼童年龄明显更小,并且误分类的对照幼童年龄明显大于其正确分类的
同辈(图11);未发现其它测量值有显著差异(图12)。
[0242] 大多数受试者是白种人、拉丁裔或混血型的(分别为58.4%、22.4%及12.6%)。在这些组中,相较于白种人(74%),混血型和拉丁裔受试者分类更准确(97%和88%)。在
阈值为0.5时,14位误分类的ASD受试者中有12位进行基因型分析用于CNV分析。只在一
位受试者中发现属于已知的ASD病因学的罕见CNV,即CNTNAP2重复(表7)。
[0243] 表7
[0244] 误分类的ASD受试者的CNV分析
[0245]
[0246] DEL=杂合缺失,DUP=复制。参考基因组hg18
[0247] 表8
[0248] 在ASD幼童和对照幼童中通过WGCNA确定与神经解剖学测量值具有显著关联的七个模块的过程网络(Metacore)富集
[0249]
[0250]
[0251]
[0252]
[0253]
[0254] 表9
[0255] 使用对照幼童由WGCNA分析确定的与神经解剖学测量值相关的2个模块各自的过程网络(Metacore)富集
[0256]品红_基因清单
# 网络 p值 比率
1 细胞周期_核心 1.73E-39 37/115
2 细胞周期_有丝分裂 9.92E-36 40/179
3 细胞周期_S期 1.62E-30 34/149
4 细胞骨架_纺锤体微管 1.49E-29 30/109
5 细胞周期_G2-M 1.05E-19 29/206
6 细胞周期_G1-S 7.99E-09 16/163
7 DNA损害_检查点 1.02E-07 13/124
8 细胞周期_减数分裂 8.62E-06 10/106
9 DNA损害_MMR修复 4.69E-05 7/59
10 细胞骨架_细胞质微管 1.09E-04 9/115

深蓝色_基因清单
# 网络 p值 比率
1 蛋白质折叠_ER和细胞质 6.17E-06 4/45
2 蛋白质折叠_响应于未折叠蛋白质 3.43E-05 4/69
3 免疫反应_抗原呈递中的吞噬体 4.45E-04 5/243
4 蛋白水解_泛素-蛋白酶体蛋白水解 1.02E-03 4/166
5 细胞凋亡_内质网应激路径 1.71E-03 3/87
6 免疫反应_抗原呈递 1.92E-03 4/197
7 蛋白质折叠_在正常条件下折叠 4.17E-03 3/119
8 信号转导_雄激素体细胞核信号传导 4.90E-03 3/126
[0257] 表10
[0258] 使用ASD幼童由WGCNA分析确定的与神经解剖学测量值相关的11个模块各自的过程网络(Metacore)富集
[0259]
[0260]
[0261]
[0262]
[0263] 表11
[0264] 发现DE基因的过程网络(Metacore)富集
[0265]
[0266]
[0267]
[0268] 表12
[0269] 发现数据集与复制数据集之间的路径比较
[0270]
[0271]
[0272] 表13
[0273] 发现幼童与复制幼童中共有的失调路径
[0274]# 图谱文件 -log(p值) p值 比率
1 DNA损害反应 6.598599 2.52E-07 20/354
2 细胞周期和其调控 5.160019 6.92E-06 22/516
[0275]3 细胞凋亡 4.645892 2.26E-05 31/964
4 血管发育(血管生成) 4.177832 6.64E-05 21/553
5 肥胖症 2.446238 3.58E-03 9/203
6 免疫系统反应 2.430275 3.71E-03 26/1007
7 细胞分化 2.406936 3.92E-03 25/958
8 组织重塑和创伤修复 2.353302 4.43E-03 17/562
9 心脏肥大 2.025304 9.43E-03 9/236
10 促有丝分裂信号传导 1.977159 1.05E-02 16/564
[0276] 表14
[0277] 用作分类器的四个基因模块的过程网络和路径图(Metacore)富集
[0278]
[0279] 表15
[0280]
[0281] 表16
[0282] 独特的差异表达(DE)的基因的基因清单
[0283]
[0284]
[0285]
[0286]
[0287]
[0288] 表17
[0289] 发现幼童和复制幼童中共有的失调基因的基因清单
[0290]
[0291] 表18
[0292] DNA损害基因的基因清单
[0293]
[0294] 表19
[0295] 促有丝分裂信号传导基因的基因清单
[0296]
[0297] 表20
[0298] ASD中具有与脑大小变化相关的最高基因连接性的前30个基因
[0299]
[0300] 表21
[0301] 对照中具有与脑大小变化相关的最高基因连接性的前30个基因
[0302]
[0303] 表22
[0304] ASD中具有与脑大小变化相关的最高基因显著性的前30个基因
[0305]
[0306] 表23
[0307] 对照中具有与脑大小变化相关的最高基因显著性的前30个基因
[0308]
[0309] 表24
[0310] ASD中具有与脑大小变化相关的最高模块成员资格的前30个基因
[0311]
[0312] 表25
[0313] 对照中具有与脑大小变化相关的最高模块成员资格的前30个基因
[0314]
[0315] 讨论
[0316] 在极早期发育期间进行的这一有关自闭症脑大小和基因表达的自然研究中,在体内鉴别出ASD幼童的脑发育和大小有关的特定早期功能基因组病理学的迹象。结果显示,
ASD幼童中的异常脑发育和大小涉及细胞周期和蛋白质折叠网络的破坏以及细胞粘附、翻
译和免疫基因网络异常功能的诱导。此外,在两个ASD研究组中重现了DNA损害、细胞周期
调控、细胞凋亡、促有丝分裂信号传导、细胞分化和免疫系统反应基因网络的失调。先前在
2
ASD儿童尸检中已经报导,这些基因网络中有几个在前额皮质中破坏 。因此,尸检和本发
明的体内证据提出了一个理论,即,极早期(可能在胎儿期)若干关键发育基因网络的破坏
6 6-9,11,12 27 28
导致异常神经元数量 、脑生长 和身体 生长,以及突触发育和功能 的已知缺陷,
7,11,29-31
如先前所报导 。
32,33
[0317] 在动物模型研究的脑中 ,细胞周期和蛋白质折叠网络分别影响了大脑皮质神经元产生和突触发育,并且因此影响脑和皮质大小和功能。使用一种组合了MRI和基因表
达的新颖方法发现,两种网络的基因表达信号在对照幼童的血液中是可检测的,并且与脑
和大脑大小(包括皮质表面积)明显呈强相关性。ASD幼童中脑大小的变异与细胞产生和
蛋白质折叠表达水平仅呈弱相关性,而与多种其它功能,即细胞粘附、免疫/炎症、翻译和其它发育过程的相关性更强。因此,即使已知ASD幼童与对照幼童具有类似的脑大小或皮
质表面积,脑发育和生长的遗传学基础也是明显截然不同的。长久以来已提出细胞周期过
7
程的功能异常引起ASD中的脑生长病状 。目前的证据以及近期有关ASD男童的胎儿期皮
6
质神经元多出67%的证据 强调了这一理论说明ASD的分子和细胞发育神经病理学和起源
的相关性。
[0318] ASD幼童中细胞粘附网络以及蛋白质折叠的失调可能指向潜在的突触发育和功34,35
能异常,以及转录调控的总体变化 。错误折叠的蛋白质的积累导致未折叠蛋白质反应
36
(Unfolded Protein Response,UPR) 。收集的证据显示,错误折叠的蛋白质和UPR可能
37 38
引起自闭症 以及神经退化性病症 的突触功能减弱。此外,针对在自闭症患者中鉴别的
neurexin和neuroligin突变的模型研究的结果显示ER保留并且指出UPR为引起自闭症突
34,39,40
触功能异常的机制 。由于高度穿透性的突变占优势,故突触细胞粘附分子的破坏是充
14
分确定的引起ASD病理生理学的机制 ,并且近期的证据将结论扩展到在网络水平上的失
28
调 。本发明的发现显示,整合素家族的基因在ASD中异常“活化”,并因此可能引起异常的
41
突触结构和功能 并且影响细胞凋亡、增殖、迁移和细胞分化的调控。整合素还在小胶质细
41
胞行为的调节中起到作用,并由此另外参与神经系统炎症和免疫反应的调控 。
[0319] 免疫基因网络在两个ASD研究组中均失调,并且在ASD(但非TD)幼童中属于与脑大小相关的排位最前的网络。免疫/神经炎症机制的失调在有关年龄较大的ASD儿童和成
26,42
人的大量研究中是较强的信号 。然而,本发明的研究首次在大约首个临床ASD风险病征
年龄时发现免疫/神经炎症基因网络的明显失调,并且首次显示与ASD脑发育的关系。近
来,已经在有关年幼以及年长自闭症尸检病例的两项独立研究中报导冷冻皮质组织中存在
2,28
异常免疫/神经炎症基因表达 。在所研究的ASD从2岁到成人期的所有年龄中有报导
43,44
前额皮质中的小胶质细胞活化,其发生通常与神经炎症相关 。尽管有争议提出免疫涉及
的证据是在继ASD异常之后发生,但没有实验证据倾向于该观点,如通过在啮齿动物中建
45
立胎儿期母体免疫活化(MIA)模型进行的研究所证实,ASD有可能涉及胎儿期免疫变化 。
异常细胞周期控制和皮质细胞数量明显指出胎儿期起源,并且这些和其它遗传失调和病理
性细胞事件是否以及如何与免疫变化关联仍需仔细调查。在任一情形中,这一研究首次证
实免疫基因网络在1到2岁的首次临床问题和转介年龄时失调并且还涉及ASD脑异常。
[0320] 这一研究的独特性在于,它鉴别出一种候选的基因组标签,该标签在发现ASD对比对照(TD和对比)幼童的诊断分类方面具有高准确性、特异性和灵敏度水平,所有这些幼
童都来自普通的自然群体筛查。使用1岁婴儿健康检查法的策略允许ASD和对照幼童出现
在社区儿童诊所时对其进行无偏见的前瞻性募集和研究,这是各研究组先前未进行过的。
因此,ASD幼童不仅反映了在社区诊所所预期的广泛临床表型范围,而且对照幼童也反映了在社区诊所中通常见到的典型地发育、轻度语言延迟、暂时性语言延迟及总体发育延迟幼
童的自然混合。相对于这一有挑战性的对照,本研究的标签意外正确地鉴别出82.5%的发
现ASD幼童。从这一发现样品得到的候选标签在独立的复制组中也表现良好,不过在该组
中使用了完全不同的微阵列芯片型式。
[0321] 这一极佳的准确性水平胜过了文献中报导的有关ASD幼儿和幼童的其它行为和遗传筛查,尤其是当与用于年幼普通儿童群体(与从多种家庭预先选出的综合症患者或
ASD患者相对)的其它测试的性能相比较时。举例来说,M-CHAT(常用语父母报告筛查)当
46 47,48
用于普通群体时具有极低特异性(27%) 和阳性预测值(PPV,11-54%) 。尽管在了解
3
自闭症的可能的遗传风险因素方面取得了重要进展 ,但当前的DNA测试只能检测出极少的
49
自闭症病例并且缺乏特异性 或在较大年龄时确定自闭症并且未证实可有效用于ASD幼儿
26
和幼童 。因此,此处报告的从普通儿童群体开发的候选功能基因组标签是当前适于ASD幼
儿和幼童的基于血液或行为的性能极佳的候选分类器。
[0322] 本研究的结果支持以下模型:在绝大多数患病幼童中,ASD涉及所提出的一组关键神经系统发育遗传路径的破坏。这些通常破坏的路径管理神经元数量和存活、神经元功
能完整性和突触形成,这些是关键的神经系统发育过程。大多数ASD幼童中还涉及到免疫
遗传网络的破坏,这一作用在有关基因突变和CNV的DNA研究中未检测到,而只在ASD胎儿
期脑组织中发现。有证据表明,ASD中是否涉及免疫破坏不再是个问题,不过不了解其原因和方式。在这些常见路径中的一小组基因(值得注意的是,翻译、免疫/炎症、细胞粘附和
细胞周期基因)提供了在幼小年龄时自闭症风险的候选基因组标签。对于这些常见路径的
了解可能有助于研究生物治疗干预的生物靶以及开发准确的生物标记物以在普通儿童群
体中检测幼儿的ASD风险。
[0323] 参考文献
[0324] 1.Courchesne,E.et al.Unusual brain growth patterns in early life inpatients with autistic disorder:an MRI study.Neurology 57,245-54(2001).
[0325] 2.Redcay,E.&Courchesne,E.When is the brain enlarged in autism ? Ameta-analysis of all brain size reports.Biological Psychiatry 58,1-9(2005).
[0326] 3.Courchesne,E.et al.Mapping early brain development in autism.Neuron56,399-413(2007).
[0327] 4.Stanfield,A.C.et al.Towards a neuroanatomy of autism:a systematicreview and meta-analysis of structural magnetic resonance imaging studies.Eur
Psychiatry 23,289-99(2008).
[0328] 5.Vaccarino,F.M.&Smith,K.M.Increased brain size in autism--what itwill take to solve a mystery.Biol Psychiatry 66,313-5(2009).
[0329] 6.Stigler,K.A.,McDonald,B.C.,Anand,A.,Saykin,A.J.&McDougle,C.J.Structural andfunctional magnetic resonance imaging of autism spectrum
disorders.Brain Res 1380,146-61(2011).
[0330] 7.Courchcsne,E.,Campbell,K.&Solso,S.Brain growth across the lifespan in autism:age-specific changes in anatomical pathology.Brain Rcs 1380,
138-45(2011).
[0331] 8.Lainhart,J.E.&Lange,N.Increased neuron number and head size inautism.JAMA 306,2031-2(2011).
[0332] 9.Courchesne,E.et al.Neuron number and size in prefrontal cortex ofchildren with autism.JAMA 306,2001-10(2011).
[0333] 10.Chow,M.L.et al.Age-dependent brain gene expression and copy number anomalies in autism suggest distinct pathological processes at young versusmature ages.PLoS Genet 8,e1002592(2012).
[0334] 11.Pinto,D.et al.Functional impact of global rare copy number variation in autism spectrum disorders.Nature 466,368-372(2010).
[0335] 12.Zoghbi,H.Y.&Bear,M.F.Synaptic dysfunction in neurodevelopmentaldisorders associated with autism and intellectual disabilities.Cold Spring Harb Perspect Biol4(2012).
[0336] 13.Pierce,K.et al.Detecting,studying,and treating autism early:theone-year well-baby check-up approach.J Pediatr 159,458-465 e1-6(2011).
[0337] 14.Luyster,R.et al.The Autism Diagnostic Observation Schedule-toddler module:a new module of a standardized diagnostic measure for autism spectrumdisorders.J Autism Dev Disord 39,1305-20(2009).
[0338] 15.Lord,C.et al.The Autism Diagnostic Observation Schedule-Generic:AStandard Measure of Social and Communication Deficits Associated with the
Spectrum of Autism.in Journal of autism and developmental disorders Vol.30
205-223-223(Springer Netherlands,2000).
[0339] 16.Mullen,E.M.Mullen Scales of Early Learning,(American GuidanceService Inc.,MN,1995).
[0340] 17.Sparrow,S.,Cicchetti DV,Balla DA.Vineland Adaptive Behavior Scales.Second Edition.Survey Forms Manual.Pearson Assessments(2005).
[0341] 18.Hastie,T.&Tibshirani,R.Generalized additive models for medicalresearch.Stat Methods Med Res 4,187-96(1995).
[0342] 19.Sanders,S.J.et al.Multiple Recurrent De Novo CNVs,IncludingDuplications of the 7q11.23 Williams Syndrome Region,Are Strongly Associated
with Autism.Neuron 70,863-85(2011).
[0343] 20.Rossin,E.J.et al.Proteins encoded in genomic regions associated with immune-mediated disease physically interact and suggest underlying biology.PLoS Genet 7,e1001273(2011).
[0344] 21.Stranger,B.E.et al.Relative impact of nucleotide and copy numbervariation on gene expression phenotypes.Science 315,848-53(2007).
[0345] 22.Luo,R.et al.Genome-wide transcriptome profiling reveals thefunctional impact of rare de novo and recurrent CNVs in autism spectrum
disorders.Am J Hum Gener 91,38-55(2012).
[0346] 23.Glatt,S.J.et al.Blood-based gene expression signatures of infantsand toddlers with autism.J Am Acad Child Adolesc Psychiatry 51,934-44 e2(2012).[0347] 24.Kong.S.W.et al.Characteristics and predictive value of blood
transcriptome signature in males with autism spectrum disorders.PloS one 7,
e49475(2012).
[0348] 25.Chawarska,K.et al.Early generalized overgrowth in boys with autism.Arch Gen Psychiatry 68,1021-31(2011).
[0349] 26.Voineagu,I.et al.Transcriptomic analysis of autistic brain reveals convergent molecular pathology.Nature 474,380-4(2011).
[0350] 27.Courchesne,E.&Pierce,K.Brain overgrowth in autism during a critical time in development:implications for frontal pyramidal neuron and interneurondevelopment and connectivity.Int J Dev Neurosci 23,153-70(2005).
[0351] 28.Clement,J.P.et al.Pathogenic SYNGAP1 mutations impair cognitivedevelopment by disrupting maturation of dendritic spine synapses.Cell 151,
709-23(2012).
[0352] 29.Baudouin,S.J.et al.Shared synaptic pathophysiology in syndromic and nonsyndromic rodent models of autism.Science 338,128-32(2012).
[0353] 30.Mitsuhashi,T.&Takahashi,T.Genetic regulation of proliferation/differentiation characteristics of neural progenitor cells in the developing
neocortex.Brain Dev 31,553-7(2009).
[0354] 31.Good,M.C.,Zalatan,J.G.&Lim,W.A.Scaffold proteins:hubs forcontrolling the flow of cellular information.Science 332,680-6(2011).
[0355] 32.Falivelli,G.et al.Inherited genetic variants in autism-relatedCNTNAP2 show perturbed trafficking and ATF6 activation.Hum Mol Genet 21,
4761-73(2012).
[0356] 33.Mendillo,M.L.et al.HSF1 drives a transcriptional programdistinct from heat shock to support highly malignant human cancers.Cell 150,
549-62(2012).
[0357] 34.Walter,P.&Ron,D.The unfolded protein response:from stress pathway to homeostatic regulation.Science 334,1081-6(2011).
[0358] 35.Fujita,E.et al.Autism spectrum disorder is related to endoplasmicreticulum stress induced by mutations in the synaptic cell adhesion molecule,
CADM1.Cell Death Dis 1,e47(2010).
[0359] 36.Matus,S.,Glimcher,L.H.&Hetz,C.Protein folding stress inneurodegenerative diseases:a glimpse into the ER.Curr Opin Cell Biol 23,
239-52(2011).
[0360] 37.Zhang,C.et al.A neuroligin-4 missense mutation associated withautism impairs neuroligin-4 folding and endoplasmic reticulum export.J Neurosci
29,10843-54(2009).
[0361] 38.De Jaco,A.et al.Neuroligin trafficking deficiencies arising frommutations in the alpha/beta-hydrolase fold protein family.J Biol Chem 285,
28674-82(2010).
[0362] 39.Milner,R.&Campbell,I.L.The integrin family of cell adhesionmolecules has multiple functions within the CNS.J Neurosci Res 69,286-91(2002).[0363] 40.Rossignol,D.A.&Frye,R.E.A review of research trends in
physiological abnormalities in autism spectrum disorders:immune dysregulation,inflammation,oxidative stress,mitochondrial dysfunction and environmental
toxicant exposures.Mol Psychiatry 17,389-401(2012).
[0364] 41.Morgan,J.T.et al.Microglial activation and increascd microglialdensity observed in the dorsolateral prefrontal cortex in autism.Biological
Psychiatry 68,368-76(2010).
[0365] 42.Vargas,D.L.,Nascimbene,C.,Krishnan,C.,Zimmerman,A.W.&Pardo,C.A.Neuroglial activation and neuroinflammation in the brain of patients with
autism.Annals of neurology 57,67-81(2005).
[0366] 43.Oskvig,D.B.,Elkahloun,A.G.,Johnson,K.R.,Phillips,T.M.&Herkenham,M.Maternal immune activation by LPS selectively alters specific gene expression profiles of interneuron migration and oxidative stress in the fetus withouttriggering a fetal immune response.Brain Behav Immun 26,623-34(2012).
[0367] 44.Eaves,L.C.,Wingert,H.&Ho,H.H.Screening for autism:agreement with diagnosis.Autism 10,229-42(2006).
[0368] 45.Kleinman,J.M.et al.The modified checklist for autism in toddlers:a follow-up study investigating the early detection of autism spectrum disorders.J Autism Dev Disord 38,827-39(2008).
[0369] 46.Chlebowski,C.,Robins,D.L.,Barton,M.L.&Fein,D.Large-scale useof the modified checklist for autism in low-risk toddlers.Pediatrics 131,e1
121-7(2013).
[0370] 47.Devlin,B.&Scherer,S.W.Genetic architecture in autism spectrumdisorder.Curr Opin Genet Dev 22,229-37(2012).
[0371] 48.Roesser,J.Diagnostic yield of genetic testing in childrendiagnosed with autism spectrum disorders at a regional referral center.Clin
Pediatr(Phila)50,834-43(2011).
[0372] 实施例2
[0373] 其它方法、分析和结果
[0374] 主观募集、追踪和发育评价
[0375] 由博士水平的心理学家对所有幼童进行发育评价,并且在抽血时不满3岁的幼童每6个月进行追踪,直到满3周岁,此时进行最后一次诊断。只有假定或确定ASD诊断的
幼童被纳入本研究中。幼童是经由1岁婴儿健康检查法募集,该方法是被设计用于鉴别约
1周岁或来自普通社区来源(例如由朋友转介或响应于网站)的患有ASD的幼童的一种基
于普通群体的新型筛查方法。简单地说,1岁婴儿健康检查法利用了多种筛查工具,在常规
1
的1岁儿童体检时实施的CSBS DPIT体检表 。包括实施>10,000次CSBS筛查的137位儿
2
科医生参与的近期研究 显示,在1岁体检时未通过筛查的幼童中有75%具有真实的延迟
(ASD、语言延迟、总体发育延迟或其它情况)。尽管ASD幼童在血液取样时才小到12个月,
3
除3个幼童外全部都是用ADOS幼童模块 进行追踪和诊断,直到至少两岁,这是ASD诊断
4-6
相对较稳定的年龄 。幼童接受ADOS模块,该模块最适于其年龄和智力。对于发现样品,
ASD群体中有64%具有ADOST,31%具有ADOS 1,并且有5%具有ADOS 2,而对于复制样品,ASD群体中有32%具有ADOS T,有48%具有ADOS 1,并且有20%具有ADOS 2,只有假定或
3
确定ASD诊断的幼童被纳入本研究中。还通过修订的自闭症诊断面谈 确定超过30个月
的参与者的二十四例最终诊断。
[0376] 所有幼童都参与一套标准化实验测试,这些测试包括自闭症诊断观察量表3、穆7 8
林早期学习量表 和文澜适应性行为量表 。经由这些评估以及第4版《诊断与统计手册》
9
(Diagnostic and Statistical Manual)(DSM IV-TR)确定诊断 。测试过程一般持续4小
时并且在2个分开的日子进行,并且通常在第一天结束时抽取血样。所有标准化评估都是
由有经验的博士水平的心理学家施行。
[0377] 种族或人种信息是由父母自行报告。发现受试者:ASD(87位受试者)有44位白种人,24位拉丁裔,13位混血,4位亚裔,1位印第安人,1位美国黑人;对照(55位受试者)有38位白种人,7位拉丁裔,5位混血,2位美国黑人,3位亚裔。复制受试者:ASD(44位受
试者)有23位白种人,13位拉丁裔,6位混血,2位亚裔;对照(29位受试者)有20位白种
人,4位拉丁裔/拉丁美洲人,3位混血,1位美国黑人,1位未报告。
[0378] 为了监测健康状况,在即将抽血之前使用数字式温计获取每位幼童的体温。如果体温超过99,则重新安排另一天抽血。还将询问父母有关其子女健康状况(如存在感冒
或流感)的问题,并且如果存在或怀疑有任何疾病,则重新安排另一天抽血。
[0379] RNA提取、制备和质量控制
[0380] 在幼童就医时如果没有发烧、感冒、流感、感染或其它疾病,或在抽血前72小时服用治病药物,则从这些幼童收集四到六毫升血液放入涂有EDTA的管中。将血液放
TM
到LeukoLOCK 过滤器(Ambion,Austin,TX,USA)上以捕获白细胞并使其稳定,并立即放
入-20℃冷冻器中。
[0381] 遵循标准程序和制造商的说明(Ambion,Austin,TX,USA)提取总RNA。原则上,LeukoLOCK盘不含RNA-later并且使用了Tri试剂冲洗掉捕获的淋巴细胞并将这些细胞溶
解。随后用乙醇使RNA沉淀并通过洗涤和基于滤筒的步骤进行纯化。通过RNA完整度数
10
值(RIN)对mRNA样品的质量进行定量并且7.0或更高值被认为可接受 所有经过处理的
RNA样品通过RIN质量控制。使用Nanodrop(Thermo Scientific,Wilmington,DE,USA)进
行RNA的定量。样品以25ng/uL浓度放入96孔板中。
[0382] MRI扫描和神经解剖学测量
[0383] 在自然睡眠期间收集T1加权的IR-FSPGR矢状面方案(TE=2.8ms,TR=6.5ms,11
翻转=12度,带宽=31.25kHz,FOV=24X cm,切片厚度=1.2mm,165个图像) 。
[0384] FSL的线性配准工具(FSL’s linear registration tool,FLIRT)将脑图像严12
格地与先前于MNI空间中配准之定制模板配准 。接着,通过FSL的脑提取工具(brain
13
extraction tool,BET)对配准的图像进行处理,取出头骨和非脑组织 。由解剖学家去除残
14
留的非脑组织以确保准确的表面测量。经由修订版FAST算法 ,使用部分容积而非相邻体
15
素对灰质、白质和CSF进行分割以增加对于检测发育的脑中的较薄白质的灵敏度 。经由适
16
应性分离将脑分成大脑半球、小脑半球以及脑干 。从BrainVisa生成的脑渠蒙片(sulcal
mask)减去每个大脑半球蒙片并且将其与原始的FSL分割再组合以去除所有脑渠CSF体素。
17
将最终的半球蒙片在BrainVisa中重构成平滑的三维网以获得表面测量 。
[0385] 基因表达和数据处理
[0386] Scripps Genomic Medicine(La Jolla,CA,USA)上,根据制造商的说明使用表达BeadChips管道(Illumina,San Diego,CA,USA)分析RNA的标记、杂交和扫描。用Illumina
BeadArray 扫描所有阵列并读取到Illumina 软件(1.1.1
版)中。从Illumina 输出原始数据并使用针对R(R-project.org)和
19 18
Bioconductor(bioconductor.org) 的lumi软件包 进行数据预处理。
20,21
[0387] 若干质量标准被用于排除如先前所描述的低质量阵列 。简单地说,低质量阵列是信号强度较差(原始强度箱形图和平均信号低于平均值>2个标准偏差)、逐对相关曲
22
线偏移、累积分布函数曲线偏移、多维标度曲线偏移或分层聚类不良的那些阵列 。有五份样品(四份ASD样品和一份对照样品)因检出率不良、不同的分布和弯曲点状曲线而被鉴
别为低质量的,并且在标准化之前被去除。十八份(18)样品中具有1份复制并且每个复本
的所有逐对曲线的相关系数为0.99。对这些复制样品进行的分层聚类分析显示,有13份
样品有群集在一起的两个复本,因此,任意地选择B阵列用于以下步骤。对于这些复制样
品中的剩余5份样品,有两个复本未群集在一起,因此在以下步骤中使用平均基因表达水
平。未鉴别批次影响。原始数据和标准化数据被存储于基因表达综合库(Gene Expression Omnibus)(GSE42133)中。BrB阵列过滤工具被用于获得最终未遗失表达值的一组基因。过
滤标准为强度变化的对数值(Log Intensity Variation)(P>0.05)和遗失百分比(>50%
的受试者)。142份最终样品/阵列(87份ASD,55份对照)并因此142个独特的受试者数
据集被认为是高质量的并进入表达分析。阵列间相关性(Inter-array correlation,IAC)
为0.983。
[0388] 使用随机变量模型,在BRB阵列工具中通过类别比较(ASD相对于对照)来获得差异表达的基因(DE;P<0.05)。然后使用来自发现幼童的DE基因鉴别ASD的差异表达的路
径(Metacore)和潜在的基因表达标签。接着对复制幼童验证该表达标签。发现数据集和
复制数据集都经历相同的过滤和标准化步骤。
[0389] WGCNA和关联分析
[0390] 使用加权基因相关网络分析(WGCNA)软件包23,24鉴别所有发现受试者的基因模块与神经解剖学测量之间的功能关联。通过选择使无标度拓扑结构拟合指数达到0.90的最
低功率并通过用混合动态分支切割法(hybrid dynamic branch cutting method)构建符
25
号网络(即,双向)以将个别基因指定到模块中来执行共表达分析 。还使用WGCN A计算
基因显著性(GS;基因表达水平与神经解剖学测量之间的相关性的绝对值)和模块成员资
格(MM;模块内连接性或每个生物学相关模块内所有基因的共表达的量度)。计算GS相对
于MM的变化以提供ASD组与对照组之间基因活性模式的度量(有关指南和其它细节,参看
labs.genetics.ucla.edu/horvath/CoexpressionNetwork/Rpackages/WGCNA/)。为了分别
鉴别各研究组内基因-脑的关联,还在发现样品的ASD组与对照组内进行WGCNA分析。
[0391] 超几何分析和维恩分析
[0392] 使用以R表示的函数sum(dhyper())来进行超几何分布分析。用于测试所鉴别的基因集的显著性的相等大小的随机基因集中人类基因的总数为:对于富集分析为21,405
个(该数字代表了Metacore数据集中注释的所有基因);对于维恩分析为20,151个,
涉及DE基因和基因模块(这一数字代表了在发现研究中通过所有预处理分析的所有基
因);及对于CNV基因含量的维恩分析为26,210个(这一数字代表了目前定位并且呈现
于Illumina平台HumanHT-12v4上的所有参考序列人类基因)。大小低于1Mb的自闭症相
关CNV内独特基因的数量为4611个,并且是从AutDB数据库(参看mindspec.org/autdb.
html)分析获得。只选出在具有/不具有其它特征(例如:智力迟钝、神经认知能力削弱)
的情况下严格注释为ASD的病例。注释为智力障碍、发育延迟、语言延迟、亚斯伯格综合症(Asperger syndrome)、广谱自闭症、躁郁症、学习障碍的病例即使与自闭症特征关联也不作选择。只选择来自UCSC构造(build)36(人类基因组18)的CNV。使用pangloss.com/
seidel/Protocols/venn.cgi的在线工具进行维恩分析。
[0393] 分类器和性能分析
[0394] 通过WGCNA分析在发现样品中的2765个DE基因获得十二个模块特征基因。四个模块的鉴别是基于在逻辑斯蒂回归之后在该样品中的AUC性能。鉴别出在区分ASD与对照
受试者方面具有最佳性能的模块对。接下来,测试每添加单个额外的模块是增加还是降低
性能,并且如果性能增加,则该模块得以保留。这四个模块(蓝色、黑色、紫色和黄绿色)展现出最佳的AUC性能并且被用于独立地验证分类器。
[0395] 为了验证分类器,使用所选模块的基因与特征基因值的相关性,由这些基因计算基因权重。将权重应用于每个复制受试者的基因表达水平并计算特征基因,并且将其用于
逻辑斯蒂回归中以独立地验证分类性能。比较正确分类组和误分类组(ASD组与对照组)
的临床和MRI特征以确定该分类器是否对这些测量敏感。比较穆林评分、ADOS评分和文澜
评分的结果。同时针对总脑容积、大脑白质和灰质以及小脑白质和灰质比较残留脑容积。
[0396] 表26
[0397] 模块-特征基因和诊断的皮尔森和斯皮尔曼相关性(Dx)
[0398]模块 Dx 排在最前的网络
绿色 -0.18*/ns 炎症_干扰素信号传导
黑色 0.24**/0.2^ 翻译_翻译起始
品红 -0.24**/-0.25^^ ns
紫色 -0.26**/-0.32^^^ 细胞周期_减数分裂
橙红色 -0.39***/-0.4^^^ ns
深蓝色 0.18*/0.18^ 细胞粘附_整合素介导
浅青色 -0.37***/-0.34^^^ ns
暗红色 -0.2*/-0.20^ ns
[0399]
[0400] 显著性代码:p值皮尔森***<0.001;**<0.01;*<0.05;p值斯皮尔曼^^^<0.001;^^<0.01;^<0.05;ns=无显著性富集
[0401] 参考文献
[0402] 1.Wetherby AM,Allen L,Cleary J,Kuhlin K,Goldstein H.Validity andreliability of the communication and symbolic behavior scales developmental
profile with very young children.Journal of speech,language,and hearing
research:JSLHR2002:45:1202-18.
[0403] 2.Pierce K,Carter C,Weinfeld M,et.al.Detecting,studying,and treating autism early:the one-year well-baby check-up approach.The Journal of pediatrics2011;159:458-65e1-6.
[0404] 3.Luyster R,Gotham K,Guthrie W,et al.The Autism Diagnostic Observation Schedule-toddler module:a new module of a standardized diagnostic measure for autism spectrum disorders.Journal of Autism and Developmental Disorders2009;39:1305-20.
[0405] 4.Chawarska K,Klin A,Paul R,Macari S,Volkmar F.A prospective study of toddlers with ASD:short-term diagnostic and cognitive outcomes.J Child Psychol Psychiatry 2009;50:1235-45.
[0406] 5.Cox A,Klein K,Charman T,et al.Autism spectrum disorders at 20 and42 months of age:stability of clinical and ADI-R diagnosis.J Child Psychol
Psychiatry1999;40:719-32.
[0407] 6.Kleinman JM,Ventola PE,Pandey J.etal.Diagnostic stability in veryyoung children with autism spectrum disorders.J Autism Dev Disord 2008;
38:606-15.
[0408] 7.Mullen EM.Mullen Scales of Early Learning.AGS ed.MN:American Guidance Service Inc.;1995.
[0409] 8.Sparrow S,Cicchetti DV,Balla DA.Vineland Adaptive Behavior Scales.Second Edition.Survey Forms Manual.Pearson Assessments 2005.
[0410] 9.Association AP.Diagnostic and Statistical Manual of MentalDisorders.Fourth Edition,.American Psychiatric Association 2000.
[0411] 10.Schroeder A,Mueller O,Stocker S,et al.The RIN:an RNA integritynumber for assigning integrity values to RNA measurements.BMC Mol Biol 2006;
7:3.
[0412] 11.Eyler LT,Pierce K,Courchesne E.A failure of left temporal cortexto specialize for language is an early emerging and fundamcntal property of
autism.Brain2012;135:949-60.
[0413] 12.Jenkinson M,Smith S.A global optimisation method for robust affine registration of brain images.Medical image analysis 2001;5:143-56.
[0414] 13.Smith SM.Fast robust automated brain extraction.Hum Brain Mapp2002;17:143-55.
[0415] 14.Zhang Y,Brady M,Smith S.Segmentation of brain MR images through a hidden Markov random field model and the expectation-maximization algorithm.IEEE transactions on medical imaging 2001;20:45-57.
[0416] 15.Altaye M,Holland SK,Wilke M,Gaser C.Infant brain probabilitytemplates for MRI segmentation and normalization.NeuroImage 2008;43:721-30.
[0417] 16.Zhao L,Ruotsalainen U,Hirvonen J,Hietala J,Tohka J.Automaticcerebral and cercbellar hemisphere segmentation in 3D MRI:adaptive
disconnection algorithm.Medical image analysis 2010;14:360-72.
[0418] 17.Rivière D GD,Denghien I,Souedet N,Cointepas Y.BrainVISA:anextensible software environment for sharing multimodal neuroimaging data and
processing tools.NeuroImage 2009;47:S163.
[0419] 18.Du P,Kibbe WA,Lin SM.lumi:a pipeline for processing Illuminamicroarray.Bioinformatics(Oxford,England)2008;24:1547-8.
[0420] 19.Gentleman RC,Carey VJ,Bates DM,et al.Bioconductor:open softwaredevelopment for computational biology and bioinformatics.Genome Biology 2004;
5:R80.
[0421] 20.Chow ML,Li HR,Winn ME,et al.Genome-wide expression assay comparison across frozen and fixed postmortem brain tissue samples.BMC genomics2011;12:449.
[0422] 21.Chow ML,Pramparo T,Winn ME,et al.Age-dependent brain gene expression and copy number anomalies in autism suggest distinct pathological processes at young versus mature ages.PLoS Genet 2012;8:e1002592.
[0423] 22.Oldham MC,Konopka G,Iwamoto K,et al.Functional organization of the transcriptome in human brain.Nature Neuroscience 2008;11:1271-82.
[0424] 23.Langfelder P,Horvath S.WGCNA:an R package for weighted correlation network analysis.BMC Bioinformatics 2008;9:559.
[0425] 24.Langfelder P,Horvath S.Eigengene networks for studying therelationships between co-expression modules.BMC systems biology 2007;1:54.
[0426] 25.Pramparo T,Libiger O,Jain S,et al.Global developmental geneexpression and pathway analysis of normal brain development and mouse models of human neuronal migration defects.PLoS Genet 2011;7:e1001331.
[0427] 实施例3
[0428] ASD与非ASD对照基因表达的年龄相关性变化
[0429] 对于从幼儿到年幼儿童的ASD标签基因的年龄相关性变化进行分析并与非ASD对照相比较。我们发现在所有ASD标签基因中存在若干年龄依赖性表达变化模式,包括但不
限于以下三个实例:第一,鉴别出显示诊断的主效应(ASD相对于对照)并且无统计学显著
的年龄相关性变化的基因(图13a;ASD—浅灰色相对于对照—深灰色)。对于这些基因(它
们在所有ASD标签基因中占少数),绝对表达水平预示了诊断分类,无论在测试时的年龄如
何。第二,鉴别出显示诊断的主效应和年龄的主效应的其它基因(图13b);这些基因在所
有ASD标签基因中占大部分。因此,对于这些基因,除非考虑测试时的年龄,否则了解绝对表达水平可能作出错误分类。第三,还鉴别出其它标签基因,这些基因显示了年龄与诊断之间的相互作用(图13c),以致在一些年龄,ASD中的表达水平高于对照,而在其它年龄,表
达水平在ASD与对照之间无显著不同,并且在又其它年龄,对照中的表达水平超过ASD。大
部分标签都属于ASD和对照中基因表达水平存在年龄相关性变化这一种类。使ASD与对照
表达变化轨迹线相交的年龄在所有基因中不同,其中某种相交在早期年龄发生,其它在2-3岁并且其它在2到3岁之后发生。对于这些基因,除非在计算上考虑测试时的年龄,否则了
解绝对表达水平将作出完全错误的分类。
[0430] 将所研究的有关每一标签基因表达水平的这些年龄依赖性变化的资料并入WGERD中并在计算上与加权基因表达值组合,由此以年龄变化作为每个基因的预测因子,将优化
ASD的年龄特异性标签。已知在生物分析时儿童的年龄以及每个基因的表达水平,程序将计算该儿童的年龄调整的加权基因表达值以与WGERD年龄调整的加权基因表达标签相比较。
使用不同数量的标签基因(即,10、20、40、80、160等),年龄调整的表达标签比无任何年龄校正的表达标签优良4%到10%。有关当将年龄影响的资料与基因表达相组合时(图14a)
对比当不使用每个基因的年龄调整的计算值时(图14b)本发明的性能增强的一个实例,参
看图14以及上表3。
[0431] 实施例4
[0432] 加权基因表达值与GeoPref测试评分的组合
[0433] 以上在背景技术一节中清晰说明的问题是相当严重并且亟待解决的:已知当前的患病率,每年有52,000个和84,000个出生的婴儿将会发展ASD。因此,迫切需要可行、实用、具有成本效益并且具有临床效用的生物ASD测试,这些测试能够将在实际社区环境中准确
并特异性地检测、评价和转介的年龄减小到尽可能幼小的年龄。具有不良ASD特异性的程
序会使该问题恶化。缺乏灵敏度的程序会留下大量婴儿未检出和未得到诊断,这也无法解
决该问题的严重性。昂贵的测试(如全基因组测序)因为太过昂贵而无法解决该问题。
[0434] 简单地说,先前的方法未提出可在任何地方的普通社区环境由通常存在于诊所中的工作人员实施的容易、快速并且具有成本效益的筛查、检测和诊断评价方法。这些方法缺少的是高ASD特异性和极佳的灵敏度,以使得患有ASD的所有1到2岁、2到3岁及3到4
岁的真实婴儿病例中的大部分被检出并且得到正确地诊断,而且极少数的非ASD婴儿未被
错误地误诊为ASD。
[0435] 本发明的方法首次以一种容易、快速并且具有成本效益的方式提供了具有超出预期的高特异性水平和极佳灵敏度的程序。在一些实施方案中,本发明通过使用一种组合了
如以上所描述的基因表达与GeoPref测试数据和MMSM中的标签的新颖方法实现此目的。
[0436] GeoPref测试完整描述于Pierce等(2011)中。简单地说,GeoPref测试是一项简单并且快速的1分钟眼动追踪测试,该测试可以作为筛查或评价测试施用给普通儿童群体
中的个体。向婴儿、幼儿、幼童和年幼儿童显示一个计算机屏幕,该屏幕在一侧(“Geo”侧)上展现鲜艳的移动图案并在另一侧(“Social”侧)上展现生动地移动的儿童。有关儿童
注视一侧或另一侧的时间进行眼动追踪和评分是自动进行的。在1分钟测试中注视“Geo”
侧超过临界时间量的儿童被认为是Geo偏好型(或“GeoPref”)反应者。在婴儿、幼儿、幼
童和年幼儿童中GeoPref反应者有99%几率患ASD,而这一测试只检出所有ASD病例中的
20%到30%。
[0437] 通过在计算上组合儿童的加权基因表达值与GeoPref评分,获得了该儿童的基因表达-GeoPref标签,并将其与MMSM参考数据库相比较,基于该儿童的GeoPref MMSM标签与
GeoPref MMSM参考数据库的差异,计算该儿童的ASD风险评分。在该程序的一个实施方案
中,准确性保持在85%并且灵敏度略微降低到72%,而ASD特异性为98%。这是在从出生
到4岁间任何年龄时应用任何先前的生物或生物行为ASD测试的最高总体性能。重要的是,
这种组合的WGSM/MMSM标签能够在筛查和诊断评价中具有极高的有益影响,因为它不仅在
幼小年龄经由一种简单、快速的1分钟测试加上用于进行基因表达生物检验的普通抽血检
出绝大部分普通儿童ASD群体,而且它还具有极高的正确检出率和极低的假阳性率。因此,该标签以一种极有意义的方式解决了对于在美国每年出生的52,000到84,000个发展ASD
的婴儿中早期正确检出和确诊ASD的需求。
[0438] 参考文献
[0439] 1.Pierce,K.,Conant,D.,Hazin,R.,Stoner,R.&Desmond,J.Preference for geometric patterns early in life as a risk factor autism.Archives of GeneralPsychiatry68,101-9(2011).
[0440] 实施例5
[0441] 加权基因表达值与ASD蛋白质标签的组合
[0442] ASD和其它疾病表现为基因表达、代谢物谱和表达、翻译后加工以及血液和其它组织的细胞和非细胞成分中蛋白质和小分子相互作用的变化。任何特定蛋白质或其修饰变体的基因表达与水平之间的相关性存在巨大变化。已经发现,在许多实施例中特定蛋白质和
蛋白质变体的水平的这些变化与疾病和疾病进展相关。另外,相对较丰富的蛋白质的基因
表达与模式之间的相关性不良表明,蛋白质变体的产生易受与基因表达不同的疾病生物学
方面影响,并且还表明,血液和其它组织中蛋白质变体的模式的测量可以与加权基因表达
组合成为疾病的一种有价值的辅助评估。
[0443] 因此,在某些实施方案中,MMSM包括但不限于,外周血中蛋白质的检验。与RNA测试相同,只有一小组血液蛋白质可能会以使其测量值为自闭症的诊断提供资料的方式变
化。某些蛋白质丰度的简单变化可能与ASD相关,并且直接在血液中或从血液提取的这些
蛋白质中一种或多种的浓度测量值可能具有诊断价值。有用的测量技术涵盖多种特异性技
术方法。由特别独特的基因得到的蛋白质的高度特异性测量可以使用抗体试剂特异性定量
特定蛋白质种类。该方法可以扩展到使用靶向多种不同蛋白质的检测的抗体集合分析大量
不同蛋白质以便能测量血液中更大蛋白质组的丰度。对于诊断检验,所选抗体将各自识别
丰度或蛋白质质量随ASD状态变化的蛋白质种类,并且与ASD的这一关系将通过实验确定。
类似于在开发诊断性RNA标签时使用的加权基因标签,也可以使用多种蛋白质的加权表达
标签的测量将这些蛋白质的ASD相关性变化合并到ASD的分子印迹中。这一方法扩展到使
用简单的丰度测量值作为加权诊断标签将发现并使用其它蛋白质特性的ASD相关性变化
以用作诊断分子标签。除丰度测量外,这些其它信息丰富的变化包括蛋白质翻译后修饰的
变化、蛋白质三维构型、与其它血清组分(血液的其它蛋白质或非蛋白质组分)的复合物的
形成以及与配体(例如,可以结合因ASD而变化的蛋白质的蛋白质或小分子)相互作用的
能力的变化。发现蛋白质丰度或特许的这些ASD相关性变化的检验也可以直接或间接并入
诊断检验中。
[0444] 可以通过大量分级分离与分析技术的组合来发现ASD的蛋白质标签。可以直接分析(例如使用ForteBio Octet或其它免疫检测系统)全血蛋白质,或这可以通过针对细胞
和血浆部分的不同水平的分级分离来分离细胞与非细胞部分并单独进行分析。一般来说,
一种馏分内的蛋白质的分析更容易,因为该馏分的复杂性因分级分离而降低,但一些分析
技术可以直接作用于未分级分离或部分分级分离的样品。为了回答研究问题或生产蛋白质
产品而用于蛋白质研究和工业分级分离、纯化和分析的新蛋白质提取和分级分离技术有一
个较长的发展史。一般来说,可以通过溶解度(例如,通过硫酸铵部分沉淀,或通过在组成不同的溶剂之间分配),通过选择对于官能化表面的特定结合亲和力(例如,选择在HPLC
中对于离子交换或反相基质具有不同亲和力的蛋白质部分,或其它更具特异性亲和力的试
剂,如与固相基质或小分子衍生化表面偶联的抗体)或通过在筛分基质(例如尺寸排阻色
谱法或电泳)中选择特定迁移特征来对蛋白质进行分级分离。用于捕获和定量特定蛋白质
种类的亲和试剂可以是常见的(结合到特定基因的蛋白质产物的所有变体),或这些试剂
可以对通过翻译后加工、构形变化或配体结合得到的特定变体具有特异性(例如,对蛋白
质的翻译后修饰形式具有特异性的抗体)。一旦分离,就可以通过鉴别和定量蛋白质的多种技术分析该蛋白质。本领域技术人员将使用质谱法确定一种混合物内完整或分段的蛋白质
的遗传特性和数量,或将使用抗体或其它特定亲和试剂定量这些蛋白质。
[0445] 举例来说,通过对以下9种生物标记物进行免疫检验探索出ASD的蛋白质生物标记物:在由以下呈递用于临床ASD状态评估的142位儿童患者集合得到的血清样品中的
TNF-α、IL-6、IL-10、IP-10、sIL-6R、sFas、VEGF、sVEGFR-1及tPAI-1。
[0446]总计 典型 语言延迟(LD) ASD
142 66 27 49
[0447] 这些分析的结果表明,相对于TD患者,sFas水平(升高)以及VEGF、sIL-6R和IL-6水平(全部降低)异常与ASD患者显著关联。这证实,ASD存在许多蛋白质生物标记
物,并且预期将这些蛋白质变化的测量并入针对ASD的组合测试(例如,加权基因表达标
签、行为测试和血液蛋白质组成测量的组合)中可增强总体测试性能。将这一发现方法扩
展到更大并且更复杂的患者集并扩展到使用分级分离、检测和蛋白质鉴别的其它组合将扩
大这一诊断相关蛋白质变化的清单,并且选择何种测试来并入组合检验中是由前瞻性临床
试验决定,这与加权基因表达标签的初始发现相同。这些结果是一种原理验证,证实了蛋白质和蛋白质变体的血清表达水平可以随ASD状态而变化,并且这些水平的测量因此可以用
作另外的诊断检验在MMSM中与WGSM组合。
[0448] 本领域技术人员依据本公开将对其它实施方案和应用显而易见。本领域技术人员应理解,可以对本发明的实施方案进行多种改变和修改并且这些改变和修改可以在不偏离
本发明精神的情况下进行。因此,预期随附权利要求涵盖在本发明的真实精神和范围内的
所有此类等效变更。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈