[0002] 本
发明根据35 USC 119(e)要求2009年9月8日提交的美国临时
专利申请No.61/240,469的优先权。美国临时专利申请No.61/240,469的公开内容通过引用整体并入本文。
【技术领域】
[0003] 本发明总的涉及用于诊断
自闭症谱系障碍的组合物和方法。【背景技术】
[0004] 自闭症是干扰脑的社会关系和交往技能的区的正常发育的复合发育残疾。一般而言,自闭症儿童和成年在言语和非-言语交往,社会关系,及闲暇或游戏活动方面具有困难。
[0005] 自闭症通常特征在于是全身性发育迟缓(PDD)名下的5种病症之一,表征为几个发育区,包括社会关系和交往技能的严重的和全身性损伤的神经学病症类别。在PDD名下的5种病症包括:孤独性障碍,Asperger氏病症,童年瓦解性障碍(CDD),Rett氏病症和未另外特定的PDD(PDD-NOS)。各这些病症的特定诊断标准可见于American Psychiatric Association发布的American Psychiatric Association:Diagnostic and Statistical Manual of Mental Disorders,Fourth Edition,Text Revision.Washington,DC,American Psychiatric Association,2000。
[0006] 没有用于自闭症的
生物学表现的确定的诊断测试,由此其仍仅为必需几乎完全通过行为症状诊断的神经学病症之一。DSM-IV将自闭症分类为由12个诊断标准表征的全身性发育迟缓(PDD)。那些标准落入3个类别:社会关系障碍;交往障碍;及活动和兴趣局限。自闭症的诊断需要儿童显示12种症状中的至少6种。
[0007] 如果儿童不符合以上给的自闭症的定义,其可诊断为称之为未另外特定的全身性发育迟缓(PDD-NOS)的病情。该非特定形式的全身性发育迟缓(PDD)的诊断可包括:不落入以上类别的非典型类型的自闭症,因为发作的晚龄,例如,或亚-
阈值或非典型症状。根据DSM-IV,当自闭症-样行为存在时,尤其是当有严重的社会和言语交往技能发育损伤,但儿童不符合典型自闭症或任何其他特定全身性发育迟缓,
精神分裂症,精神分裂型
人格障碍或回避型人格障碍的标准时使用此诊断。
[0008] 各种剂已假定相关于自闭症发展,包括但不限于暴露于
杀虫剂和/或可导致出生
缺陷的剂。在至少一些情况中,似乎自闭症可具有遗传
基础。自闭症的遗传学呈现复杂性。例如,已显示尤其是在患自闭症或常见自闭症行为的综合征的患者的基因组区中存在拷贝数变异和
染色体结构异常(大和小)(Abrahams and Geschwind,Nature Reviews Genetics,2008,9:341-355)。DNA杂交研究显示了自闭症群体的结构异常。许多不同基因中的遗传变异的因果作用已推荐基于来自关联或联系研究的证据。尚且,基因组域关联研究未能关联单独或组合作用的特定常见的变体,尽管该研究鉴定了可指其他成因基因或通路的关联峰。有一些遗传变异可为至少非-综合征性自闭症的成因的证据。
[0009] 由一般包括医生和儿童的父母的团队进行诊断儿童的评估。因为自闭症谱系障碍的诊断是主观的,可常发生儿童的误诊。由此,有对可提供是否受试者遭受自自闭症谱系障碍的目的确定的诊断测试的未满足的需求。
[0010] 【发明概述】
[0011] 本发明通常涉及用于诊断自闭症谱系障碍的存在或增加的发展自闭症谱系障碍的
风险的组合物和方法。本发明的方法和组合物可用于获得或提供来自受试者的遗传信息以便客观地诊断受试者,或其他受试者中自闭症谱系障碍(ASD)的存在,或增加的发展自闭症谱系障碍的风险。
[0012] 在一实施方式中,本发明包含诊断受试者中自闭症谱系障碍的存在或增加的发展自闭症谱系障碍的风险的方法。方法可包括下列步骤:从来自受试者的生物学样品(例如,组织或体液样品)获得核酸,及进行鉴定是否受试者的核酸中有变体序列的检定。在某些实施方式中,方法可包括比较变体和与自闭症谱系障碍关联的已知的变体及测定是否变体是已之前鉴定为相关于自闭症的变体。或者,方法可包括将变体鉴定为新的,之前未表征的或之前未描述的变体。如果变体是新变体,方法还可包括进行分析以测定是否突变预期有害于基因的表达和/或基因编码的蛋白的功能。方法还可包括使用变体特征(即,受试者中鉴定的突变的编辑)以诊断自闭症谱系障碍的存在或增加的发展自闭症谱系障碍的风险。在一些实施方式中,方法可包括从来自受试者的组织或体液样品获得核酸及测序至少部分核酸以便获得至少一种基因的样品核酸序列。
[0013] 本发明的仍其他实施方式可包含用于鉴定与自闭症谱系障碍的存在或增加的发展自闭症谱系障碍的风险关联的突变(即,变体)的方法。方法可包括下列步骤:鉴定待评价为具有如果突变可相关于自闭症发展的序列的核酸。而且,方法可包括从来自患自闭症谱系障碍的受试者的生物学样品(例如,组织或体液样品)获得核酸样品;及进行检定以鉴定是否相比未患自闭症谱系障碍的个体中的核酸序列,患自闭症的受试者中的核酸序列中有突变,其中患自闭症谱系障碍的受试者中突变的存在指示突变可相关于自闭症谱系障碍的发展。如果变体是新变体,方法还可包括进行分析以测定是否突变预期有害于基因的表达和/或基因编码的蛋白的功能。方法还可包括编辑一组可用于诊断自闭症谱系障碍的存在或增加的发展自闭症谱系障碍的风险的变体突变。
[0014] 在仍其他实施方式中,本发明包含分离的核酸,其包含至少下列基因或基因组区的核酸:TSC1,TSC2,MECP2,SHANK3,GRM1,GRM5,ARC,EIF4E,HOMER1,HRAS,MAP2K1,MAP2K2,RAF1,PIK3CA,PIK3R1,FMR1,PTEN,RHEB或UBE3A,其中序列包含指示或与自闭症谱系障碍关联的变体。
[0015] 下文会描述本发明的其他特征。需知,本发明的应用不限于下列
权利要求,
说明书和图所示的细节。本发明能包括其他实施方式,且能以各种方式实践或实施。【
附图说明】
[0016] 本发明的各特征,方面和优势将参照下列图更加明了。
[0017] 图1显示根据本发明的一实施方式涉及mGluR
信号转导的基因。
[0018] 图2显示根据本发明的一实施方式的变体分级的方法。
[0019] 图3,分图A-LL,描绘如SEQ ID NO:1~38的,TSC1,TSC2,MECP2,SHANK3,GRM1,GRM5,ARC,EIF4E,HOMER1,HRAS,MAP2K1,MAP2K2,RAF1,PIK3CA,PIK3R1,FMR1,PTEN,RHEB和UBE3A基因的DNA序列和由这些基因编码的蛋白序列。
[0020] 图4描绘如SEQ ID NO:39~271的用于鉴定TSC1,TSC2,MECP2,SHANK3,GRM1,GRM5,ARC,EIF4E,HOMER1,HRAS,MAP2K1,MAP2K2,RAF1,PIK3CA,PIK3R1,FMR1,PTEN,RHEB和UBE3A基因中的突变的如
实施例中所述使用的外显子和侧翼序列,以及序列的染色体
位置。
[0021] 【发明详述】
[0022] 尽管本发明的表示广范围的数值范围和参数是近似值,但特定实施例中给出的数值尽可能精确地报道。但是,任何数值,固有地含有必然获自见于它们的相应测试测量的标准偏差的特定误差。而且,本文公开的全部范围应理解为包括其中包含的任何和全部子域。例如,陈述的“1~10”的范围应被认为包括最小值1和最大值10之间的任何和全部子域(包括端点);这是说,始于1或更大最小值,例如1~6.1,及结束于10或更小最大值,例如,5.5~10的全部子域。此外,任何被称为“并入本文”的引用应理解为整体并入。
[0023] 还需知,如此说明书中所述,单数形式“a”,“an”和“the”包括复数个指示物,除非明白地和明确地限于一个指示物。术语“和/或”通常用于指称至少一方或其他。在一些情况中,术语“和/或”与术语“或”互换使用。
[0024] 而且,术语“部分”和“
片段”互换使用,以指称多肽,核酸,或其他分子构建体的部分。
[0025] “多肽”和“蛋白”在本文互换使用,以描述可包含部分或全长蛋白的蛋白分子。术语“肽”用于表示小于全长的蛋白或非常短的蛋白,除非情景另外指示。
[0026] 如本领域中知道,″蛋白”、“肽″、″多肽″和″寡肽″是α
碳通过通过一个
氨基酸的α碳的羧基和另一氨基酸的α碳的氨基之间的缩合反应形成的肽键连接的氨基酸(一般L-氨基酸)链。一般而言,构成蛋白的氨基酸按顺序编号,开始于氨基末端残基及向蛋白的羧基末端残基的方向增加。
[0027] 如本领域知道,核酸序列彼此杂交的条件可描述为从低到高严格度。一般而言,高度严格杂交条件指称在低盐缓冲剂中于高温洗涤杂交体。杂交可为与滤膜结合的DNA的使用本领域中的标准杂交溶液诸如0.5M NaHPO4,7%十二烷基
硫酸钠(SDS),于65℃及在0.25MNaHPO4,3.5%SDS中洗涤,之后是依赖于探针长度从室温到68℃的
温度在0.1×SSC/0.1%SDS中洗涤(见例如Ausubel,F.M.et al.,Short Protocols in Molecular Biology,4th Ed.,Chapter 2,John Wiley & Sons,N.Y)。例如,高严格度洗涤包括在
6×SSC/0.05%焦
磷酸钠中,对于14个
碱基的寡核苷酸探针于37℃洗涤,或对于17个碱基的寡核苷酸探针于48℃洗涤,或对于20个碱基的寡核苷酸探针于55℃洗涤,或对于25个碱基的寡核苷酸探针于60℃洗涤,或对于长度约250个核苷酸的核苷酸探针于65℃洗涤。
32
可将核酸探针用
放射性核素通过用,例如,[γ- P]ATP的末端-标记或通过随机引物标记
32
并合放射性标记的核苷酸诸如[α- P]dCTP来标记。或者,探针可通过并合生物素化的或
荧光素标记的核苷酸来标记,及使用链霉亲和素或抗-荧光素
抗体检测探针。
[0028] 如本文所用,术语“上游”,当分子是蛋白时,是指N-端到其邻接残基的残基;或当分子是核酸时,是指5’到其邻接残基的残基。也如本文所用,术语“下游”,当分子是蛋白时,是指C-端到其邻接残基的残基;或当分子是核酸时,是指3’到其邻接残基的残基。本文公开的蛋白,多肽和肽序列全部从N-端氨基酸到C-端氨基酸排列,和本文公开的核酸序列全部从分子的5’端到分子的3’端排列。
[0029] 除非另外定义,本文所用的全部技术和科学术语具有与本领域普通技术人员通常明白的相同的含义。医师特别参照Current Protocols in Molecular Biology(Ausubel)理解本领域的定义和术语。氨基酸残基的缩写是本领域指称20种常见的L-氨基酸之一中使用的标准3-字母和/或1-字母代码。
[0030] “核酸”是多核苷酸诸如脱
氧核糖核酸(DNA)或核糖核酸(RNA)。术语用于包括单链核酸,双链核酸,及RNA和DNA由核苷酸或核苷类似物组成的。
[0031] 术语“鉴定”或“百分率同一”指称2个氨基酸序列之间或2个核酸序列之间的序列同一性。百分率同一性可通过比对2个序列来测定,且指称在比较的序列共享的位置的相同残基(即,氨基酸或核苷酸)数。序列比对和比较可使用本领域标准的
算法(例如Smith and Waterman,1981,Adv.Appl.Math.2:482;Needleman and Wunsch,1970,J.Mol.Biol.48:443;Pearson and Lipman,1988,Proc.Natl.Acad.Sci.,USA,85:2444)或通过以公共渠道可利用的这些算法的计算机化的版本如BLAST和FASTA(Wisconsin Genetics Software Package Release 7.0,Genetics Computer Group,575 Science Drive,Madison,WI)来进行。而且,通过National Institutes of Health,Bethesda MD可利用的ENTREZ可用于序列比较。在其他情况中,可商购的
软件,诸如GenomeQuest,可用于测定百分率同一性。当利用BLAST和空位BLAST程序时,可使用相应程序(例如,在美国生物技术信息中心的互联
网站可利用的BLASTN)的默认参数。在一实施方式中,2个序列的百分率同一性可为测定的使用具有1的空位权重的GCG,使得各氨基酸空位衡量为如是2个序列之间的单氨基酸错配。或者,可使用是GCG(Accelrys,San Diego,CA)序列比对软件
包装的部分的ALIGN程序(2.0版)。
[0032] 如本文所用,术语″保守残基″指称在具有相同的结构和/或功能的多个蛋白之中相同的氨基酸。保守残基的区可对蛋白结构或功能的重要。由此,如在3-维蛋白中鉴定的连续的保守残基可对蛋白结构或功能重要。为了发现保守残基,或3-D结构的保守的区,可比较来自不同物种或相同的物种的个体的相同的或类似蛋白的序列。
[0033] 如本文所用,术语“类似”或“同源物”,当指称氨基酸或核苷酸序列时,是指与野生型氨基酸序列具有一定程度的同源性或同一性的多肽。同源性比较可通过眼,或更通常,在容易可利用的序列比较程序的辅助下进行。这些可商购的
计算机程序可计算2个或更多序列之间的百分率同源性(例如Wilbur,W.J.and Lipman,D.J.,1983,Proc.Natl.Acad.Sci.USA,80:726-730)。例如,可采用同源序列来包括在替代实施方式中彼此至少70%同一,75%同一,80%同一,85%同一,90%同一,95%同一,97%同一或98%同一的氨基酸序列。
[0034] 如本文所用,术语至少90%同一包括与指示的序列具有跨90~100%同一性的序列,且包括期间的全部范围。由此,术语至少90%同一包括与指示的序列91,91.5,92,92.5,93,93.5。94,94.5,95,95.5,96,96.5,97,97.5,98,98.5,99,99.5%同一的序列。类似地术语“至少70%同一包括跨70~100%同一及期间的全部范围的的序列。百分率同一性使用本文所述的算法测定。
[0035] 如本文所用,多肽或蛋白“结构域”包含沿着包含独立单元的多肽或蛋白的区。结构域可依据结构,序列和/或生物学活性定义。在一实施方式中,多肽结构域可包含以基本上与其余蛋白独立的方式折叠的蛋白区。结构域可使用结构域
数据库诸如,但不限于PFAM,PRODOM,PROSITE,BLOCKS,PRINTS,SBASE,ISREC PROFILES,SAMRT和PROCLASS鉴定。
[0036] 如本文所用,基因是遗传单元。一般而言,基因是编码蛋白或功能RNA的部分DNA。基因的现代定义是对应于遗传单元的基因组序列的可
定位的区。基因可与调控区,转录的区及或其他功能序列区关联。
[0037] 如本文所用,基因调控元件或
调控序列是调控蛋白,诸如转录因子,结合以调控基因表达的DNA段。该调控区常常是基因调控的上游。
[0038] 如本文所用外显子是在RNA的其他部分(例如,已知为内含子的干扰区)已通过RNA剪接移出之后见于成熟或处理的RNA的核酸序列。像这样,外显子序列通常编码蛋白或蛋白的部分。内含子是通过RNA剪接从周围外显子序列除去的RNA部分。
[0039] 如本文所用,表达的RNA是编码蛋白或多肽的RNA(“编码RNA”),及任何其他转录但不翻译的RNA(“非-编码RNA”)。
[0040] 如本文所用,微RNA是微RNA(miRNA),是涉及基因表达的转录后调节的短(20~24nt)非-编码RNA。微RNA可影响mRNA的
稳定性和翻译。例如,微RNA可结合于靶mRNA的3’UTR中的互补序列及导致基因沉默。miRNA通过RNA聚合酶II作为可为蛋白-编码或非-编码的封头的及多聚腺苷
酸化的初级转录物(pri-miRNA)的部分转录。初级转录物可通过Drosha核糖核酸酶III酶切割而产生约70nt茎-环前体miRNA(前-miRNA),其还可通过
细胞质Dicer核糖核酸酶切割而产生成熟miRNA和反义miRNA星(miRNA*)产物。
可将成熟miRNA并 RNA-诱导的沉默复合物(RISC),其可通过与miRNA的不完全碱基
配对识别靶mRNA,且最通常导致靶mRNA的翻译抑制或去稳定。
[0041] 如本文所用,siRNA基本上是由约20个互补核苷酸组成的双链RNA分子。siRNA通过更大双链(ds)RNA分子的断裂创建。siRNA可通过由siRNA与mRNA的相互作用的方式将其对应mRNA固有地分裂为2个,导致mRNA降解来抑制基因表达。siRNA也可与DNA相互作用而辅助染色沉默及异染色质扩展。
[0042] 如本文所用,表观遗传元件可通过非成为基础的DNA序列中的变化的机理来变化基因表达。该元件可包括调控副突变,印迹,基因沉默,X染色体灭活,位置效应,重编程,转位,母体效应,组蛋白修饰,及异染色质的元件。
[0043] 如本文所用,术语突变和变体互换使用以描述核酸或蛋白序列变化。
[0044] 如本文所用,“与自闭症谱系障碍关联”是指在患自闭症的患者中相比在非-自闭症对照中更多发现的变体。一般而言,该关联的统计学意义可通过检定多个患者来测定。
[0045] 如本文所用,目标区靶向而用于检定DNA序列中的变体的部分染色体。
[0046] 【用于诊断自闭症谱系障碍的方法和组合物】
[0047] 本发明的实施方式包含用于诊断自闭症谱系障碍的存在或增加的发展自闭症谱系障碍的风险的组合物和方法。本发明的方法和组合物可用于获得或提供来自受试者的遗传信息以便客观地诊断受试者中自闭症谱系障碍的存在,或要发展自闭症谱系障碍的其他受试者中增加的发展自闭症谱系障碍的风险。
[0048] 在一实施方式中,本发明包含诊断受试者中自闭症谱系障碍的存在或增加的发展自闭症谱系障碍的风险的方法。方法可包括下列步骤:从来自受试者的组织或体液样品获得核酸及进行检定以鉴定是否受试者的核酸中有变体序列(即,突变)。在某些实施方式中,方法可包括比较变体和与自闭症谱系障碍关联的已知的变体及测定是否变体是已之前鉴定为相关于自闭症的变体。或者,方法可包括将变体鉴定为新的,之前未表征的变体。如果变体是新变体,方法还可包括进行分析以测定是否突变预期有害于基因的表达和/或基因编码的蛋白的功能。方法还可包括使用变体特征(即,受试者中鉴定的突变的编辑)以诊断自闭症谱系障碍的存在或增加的发展自闭症谱系障碍的风险。
[0049] 在某些实施方式中,本发明包含诊断受试者中自闭症谱系障碍的存在或增加的发展自闭症谱系障碍的风险的方法,所述方法包括:从来自受试者的组织或体液样品获得核酸;进行鉴定是否受试者的核酸中有变体序列,或多种变体序列的检定;对于检测的各变体,测定是否变体是与自闭症谱系障碍关联的已知的变体或之前未描述的变体;如果变体是之前未描述的变体,测定是否变体预期对至少基因表达和/或蛋白功能之一具有有害的效应;及基于检测的变体序列或多种变体序列诊断自闭症谱系障碍的存在或增加的发展自闭症谱系障碍的风险。
[0050] 在一些实施方式中,方法可包括从来自受试者的组织或体液样品获得核酸及测序至少部分核酸以便获得至少一种基因的样品核酸序列。在某些实施方式中,方法可包括比较变体和与自闭症谱系障碍关联的已知的变体及测定是否变体是已之前鉴定为相关于自闭症的变体。或者,方法可包括将变体鉴定为新的,之前未表征的变体。如果变体是新变体,或在一些之前表征的(即,鉴定的)变体的情况中,方法还可包括进行分析以测定是否突变预期有害于基因的表达和/或基因编码的蛋白的功能。方法还可包括使用变体特征(即,受试者中鉴定的变体的编辑)以诊断自闭症谱系障碍的存在或增加的发展自闭症谱系障碍的风险。
[0051] 在本发明的各方法的实施方式中,方法可包括在多个个体中进行测定(例如,测序)以测定关联的统计学意义。
[0052] 在本发明及本文更详细描述的方法的各种实施方式中,测定包括至少下列之一:核酸测序,杂交体捕获和/或表观遗传分析。例如,在某些实施方式中,可使用下一代(大规模-并行测序)。或者,可使用Sanger测序。或者,可使用下一代(大规模-并行测序)及Sanger测序的组合。另外,测序包含随合成单分子测序的至少一种。由此,在某些实施方式中,分析库中的多个DNA样品以鉴定显示变异的样品。另外,在某些实施方式中,分析多个库中的多个DNA样品以鉴定在至少2库中显示相同的变异的个体样品。
[0053] 而且,在各种实施方式中,进行步骤中的核酸包括:基因,RNA,外显子,内含子,基因调控元件,表达的RNA,siRNA或表观遗传元件。而且,可评价包括剪接位点,转录因子结合,A-I编辑位点,微RNA结合位点,及功能RNA结构位点的调控元件的突变(即,变体)。
[0054] 在某些实施方式中,选择用于分析变体的核酸包含选自知道或怀疑相关于一种或更多自闭症谱系障碍的序列的序列。例如,核酸包含表1中基因之一的至少一部分。或者,核酸可包含编码涉及可在自闭症谱系障碍(ASD)的发展中重要的生物化学通路的蛋白的基因。例如,在某些实施方式中,核酸源于编码亲代谢型谷氨酸受体信号转导通路中的蛋白的基因。例如,在某些实施方式中,变体包含至少表2中的变体之一。由此,在本发明的方法的某些实施方式中,核酸包含至少下列之一的基因的至少一部分:TSC1,TSC2,MECP2,SHANK3,GRM1,GRM5,ARC,EIF4E,HOMER1,HRAS,MAP2K1,MAP2K2,RAF1,PIK3CA,PIK3R1,FMR1,PTEN,RHEB或UBE3A。在一些实施方式中,核酸包含至少下列之一的基因的至少一部分:TSC1,TSC2,SHANK3或HOMER1。在某些实施方式中,变体包含至少下列突变之一:HOMER 1 c.195G>T,M65I;HOMER 1 c.290C>T,S97L;HOMER 1 c.425C>T,P142L;GRM5 c.3503T>C,L1168P;MAPK2c.581-1G>T;HRAS c.383G>A,R128Q;MECP2 c.1477G>T,E483X。
[0055] 在本发明的方法的各种实施方式中,自闭症谱系障碍可为至少下列之一:非-综合征性自闭症,典型自闭症,Asperger氏综合征,Rett氏综合征,童年瓦解性障碍,或不另外特定的全身性发育迟缓(PDD-NOS)。在某些实施方式中,自闭症谱系障碍包含非-综合征性自闭症(即,显示自闭症症状、但不呈现自闭症中常常发现的身体表现的患者)。
[0056] 本发明的方法还可包含诊断与自闭症关联的遗传综合征的存在,或增加的发展与自闭症关联的遗传综合征的风险,其中遗传综合征包含显性表型。例如,在某些实施方式中,遗传综合征包含至少下列之一:Angelman综合征,Prader-Willi综合征,15q11-q13重复,脆性X综合征,脆性X前突变,染色体2q缺失,XYY综合征,Smith-Lemli-Opitz综合征,Apert综合征,ARX基因中的突变,De Lange综合征,Smith-Magenis综合征,Williams综合征,Noonan综合征,Down综合征,软腭-心-面部综合征,肌强直营养不良,Steinert病,结节性硬化,Duchenne氏病,蒂莫西综合征,10p末端缺失,Cowden综合征,45,X/46,XY镶嵌现象,Myhre综合征,Sotos综合征,Cohen综合征,Goldenhar综合征,Joubert综合征,Lujan-Fryns综合征,Moebius综合征,伊藤黑色素过少症,1型神经
纤维瘤病,CHARGE综合征和/或HEADD综合征。
[0057] 方法可用于辅助尚未显示ASD症状,或诊断不明确的个体的诊断。例如,受试者可为儿童或
胎儿。
[0058] 用于测序核酸(DNA和RNA)的技术高度敏感,由此,可用于取自受试者的几乎任何生物学样品(即,组织或体液)。例如,在替代实施方式中,体液包含至少下列之一:
脑脊液,血,
羊水,母源血,或尿。
[0059] 如上所述,在某些实施方式中,评价突变的基因是编码与自闭症发展关联的生物化学通路中的蛋白的基因。例如,在某些实施方式中,基因涉及亲代谢型谷氨酸受体通路。在一实施方式中,通路是mGluR5信号转导通路和/或包括对mGluR5受体活性重要的基因。
或者,可评价与某些类型的自闭症综合征相关的其他生物化学通路。例如,在某些实施方式中,可评价表1中的基因和/或基因组区的至少之一。
[0060] 当通路是mGluR5信号转导通路和/或包括对mGluR5受体活性重要的基因时,DNA序列可源于表2中显示的基因或包含基因的基因组区。在方法的某些实施方式中,评价可指示ASD的存在或增加的ASD的风险的突变的基因和/或基因组区是ARC,EIF4E,FMR1,GRM1,GRM5,HOMER1,HRAS,MAP2K1,MAP2K2,MECP2,PIK3CA,PIK3R1,PTEN,RAF1,RHEB,SHANK3,TSC1,TSC2和/或UBE3A。在某些实施方式中,测定中使用的天然或非-变体序列包含来自至少下列基因之一的外显子序列:ARC,EIF4E,FMR1,GRM1,GRM5,HOMER1,HRAS,MAP2K1,MAP2K2,MECP2,PIK3CA,PIK3R1,PTEN,RAF1,RHEB,SHANK3,TSC1,TSC2和/或UBE3A。例如,在某些实施方式中,评价变体的基因序列包含外显子序列。或者,可评价内含子序列或其他非-编码区的潜在地有害的突变。在某些实施方式中,在测定中分析外显子序列和额外的侧翼序列(例如,UTR和/或内含子序列的约5,10,15,20,25,30,35,40,45,50,55或更多核苷酸)。或者可使用这些序列的部分。在某些实施方式中,评价的基因序列包含来自至少下列基因之一的外显子序列和/或侧接内含子或UTR序列:HOMER1,SHANK3,TSC1和/或TSC2。在某些实施方式中,评价的基因序列包含来自HOMER1基因的外显子序列。该变体基因序列可包括具有表2中显示的突变中的至少之一的序列。
[0061] 本发明的仍其他实施方式可包含鉴定与自闭症谱系障碍的存在或增加的发展自闭症谱系障碍的风险关联的突变的方法。方法可包括下列步骤:鉴定核酸序列,诸如如果突变可相关于自闭症发展的基因或基因组区。而且,方法可包括:从来自患自闭症谱系障碍的受试者的组织或体液样品获得核酸样品;及进行检定以鉴定是否相比未患自闭症谱系障碍的个体中的核酸序列,患自闭症的受试者中的核酸序列中有突变,其中患自闭症谱系障碍的受试者中突变的存在指示突变可相关于自闭症谱系障碍的发展。或者,方法可包括:分析对新变体(即,之前未发现的突变)的选择的基因或基因组区的序列。如果变体是新变体,或在之前鉴定的变体的一些情况中,方法还可包括进行分析以测定是否突变预期有害于基因的表达和/或基因编码的蛋白的功能。方法还可包括编辑一组可用于诊断自闭症谱系障碍的存在或增加的发展自闭症谱系障碍的风险的变体突变。
[0062] 由此,方法可包括鉴定与自闭症谱系障碍的存在或增加的发展自闭症谱系障碍的风险关联的突变的方法,包含:鉴定待评价为具有如果突变可为或相关于自闭症发展的序列的核酸;从来自患自闭症谱系障碍的受试者的组织或体液样品获得核酸样品;及进行检定以鉴定是否相比未患自闭症谱系障碍的个体中的核酸序列,患自闭症的受试者中的核酸序列中有突变,其中患自闭症谱系障碍的受试者中突变的存在指示突变可相关于自闭症谱系障碍的发展。
[0063] 在本发明的鉴定新突变的方法的实施方式中,方法可包括在多个个体中进行测定(例如,测序)以测定关联的统计学意义。
[0064] 在某些实施方式中,突变是之前已与自闭症谱系障碍的发展关联的变体。或者,突变可为之前未描述的变体。方法可额外地包括测定是否突变预期对至少基因表达和/或蛋白功能之一具有有害的效应。
[0065] 在某些实施方式中,选择用于分析变体的核酸包含选自知道或怀疑相关于一种或更多自闭症谱系障碍的序列的序列。例如,核酸包含表1中基因之一的至少一部分。或者,核酸可包含编码涉及可在自闭症谱系障碍(ASD)的发展中重要的生物化学通路的蛋白的基因。例如,在某些实施方式中,核酸源于编码亲代谢型谷氨酸受体信号转导通路中的蛋白的基因。例如,在某些实施方式中,变体包含至少表2中的变体之一。由此,在本发明的方法的某些实施方式中,核酸包含至少下列之一的基因的至少一部分:TSC1,TSC2,MECP2,SHANK3,GRM1,GRM5,ARC,EIF4E,HOMER1,HRAS,MAP2K1,MAP2K2,RAF1,PIK3CA,PIK3R1,FMR1,PTEN,RHEB或UBE3A。在一些实施方式中,核酸包含至少下列之一的基因的至少一部分:TSC1,TSC2,SHANK3或HOMER1。
[0066] 在本发明的方法的各种实施方式中,自闭症谱系障碍可为至少下列之一:非-综合征性自闭症,典型自闭症,Asperger氏综合征,Rett氏综合征,童年瓦解性障碍,或不另外特定的全身性发育迟缓(PDD-NOS)。在某些实施方式中,自闭症谱系障碍包含非-综合征性自闭症。
[0067] 或者,变体和与自闭症关联的(例如,遗传关联)其他综合征关联,所述其他综合征诸如至少下列之一:Angelman综合征,Prader-Willi综合征,15q11-q13重复,脆性X综合征,脆性X前突变,染色体2q缺失,XYY综合征,Smith-Lemli-Opitz综合征,Apert综合征,ARX基因中的突变,De Lange综合征,Smith-Magenis综合征,Williams综合征,Noonan综合征,Down综合征,软腭-心-面部综合征,肌强直营养不良,Steinert病,结节性硬化,Duchenne氏病,蒂莫西综合征,10p末端缺失,Cowden综合征,45,X/46,XY镶嵌现象,Myhre综合征,Sotos综合征,Cohen综合征,Goldenhar综合征,Joubert综合征,Lujan-Fryns综合征,Moebius综合征,伊藤黑色素过少症,1型神经纤维瘤病,CHARGE综合征和/或HEADD综合征。
[0068] 在各种实施方式中,在本发明及本文详述的方法中,测定至少包括核酸测序,杂交体捕获及表观遗传分析之一。例如,在某些实施方式中,可使用下一代(大规模-并行测序)。或者,可使用Sanger测序。或者,可使用下一代(大规模-并行测序)及Sanger测序的组合。另外,测序包含随合成单分子测序中的至少一种。由此,在某些实施方式中,分析库中的多个DNA样品以鉴定显示变异的样品。另外,在某些实施方式中,分析多个库中的多个DNA样品以鉴定在至少2库中显示相同的变异的个体样品。
[0069] 而且,在各种实施方式中,进行步骤中的核酸包含基因,RNA,外显子,内含子,基因调控元件,表达的RNA,siRNA或表观遗传元件。而且,可评价包括剪接位点,转录因子结合,A-I编辑位点,微RNA结合位点,及功能RNA结构位点的调控元件的突变(即,变体)。
[0070] 方法可用于辅助尚未显示ASD的症状,或诊断不明确的个体的诊断。例如,受试者可为儿童或胎儿。
[0071] 用于测序核酸(DNA和RNA)的技术高度敏感,由此可用于取自受试者的几乎任何生物学样品(即,组织或体液)。例如,在替代实施方式中,体液包含至少下列之一:脑脊液,血,羊水,母源血,或尿。
[0072] 再次,在某些实施方式中,评价新突变的基因是编码与自闭症发展关联的生物化学通路中的蛋白的基因。例如,在某些实施方式中,基因涉及亲代谢型谷氨酸受体通路。在一实施方式中,通路是mGluR5信号转导通路和/或包括对于mGluR5受体的活性重要的基因。或者,可评价与某些类型的自闭症综合征相关的其他生物化学通路。例如,在某些实施方式中,可评价表1中的基因和/或基因组区的至少之一。
[0073] 当通路是mGluR5信号转导通路和/或包括对于mGluR5受体的活性重要的基因时,DNA序列可源于表2中显示的基因或包含基因的基因组区。在方法的某些实施方式中,评价可指示ASD的存在或增加的ASD的风险的新突变的基因和/或基因组区是ARC,EIF4E,FMR1,GRM1,GRM5,HOMER1,HRAS,MAP2K1,MAP2K2,MECP2,PIK3CA,PIK3R1,PTEN,RAF1,RHEB,SHANK3,TSC1,TSC2和/或UBE3A。在某些实施方式中,天然或非-变体序列包含来自至少下列基因之一的外显子序列:ARC,EIF4E,FMR1,GRM1,GRM5,HOMER1,HRAS,MAP2K1,MAP2K2,MECP2,PIK3CA,PIK3R1,PTEN,RAF1,RHEB,SHANK3,TSC1,TSC2和/或UBE3A。例如,在某些实施方式中,评价变体的基因序列包含外显子序列。在某些实施方式中,在测定中分析外显子序列和额外的侧翼序列(例如,UTR和/或内含子序列的约5,10,15,20,25,30,35,40,45,50,55或更多核苷酸)。或者,可评价内含子序列或其他非-编码区的潜在地有害的突变。或者,可使用这些序列的部分。该变体基因序列可包括具有表2中显示的突变中的至少之一的序列。
[0074] 本发明的其他实施方式提供含有与自闭症谱系障碍相关的突变的分离的基因序列。该基因序列可用于客观地诊断受试者中自闭症谱系障碍的存在或增加的受试者发展自闭症谱系障碍的风险。在某些实施方式中,分离的核酸可含有下列中任一种或组合的非-变体序列或变体序列:ARC,EIF4E,FMR1,GRM1,GRM5,HOMER1,HRAS,MAP2K1,MAP2K2,MECP2,PIK3CA,PIK3R1,PTEN,RAF1,RHEB,SHANK3,TSC1,TSC2和/或UBE3A。例如,在某些实施方式中,基因序列包含外显子序列。在某些实施方式中,在测定中分析外显子序列和额外的侧翼序列(例如,UTR和/或内含子序列的约5,10,15,20,25,30,35,40,45,50,55或更多核苷酸)。或者,可使用内含子序列或其他非-编码区。或者,可使用这些序列的部分。在某些实施方式中,基因序列包含来自至少下列基因之一的外显子序列:HOMER1,SHANK3,TSC1和/或TSC2。在某些实施方式中,基因序列包含来自HOMER1基因的外显子序列。该变体基因序列包括具有表2中显示的突变中的至少之一的序列。在一实施方式中,分离的核酸可包含至少下列变体之一:HOMER 1 c.195G>T,M65I;HOMER 1c.290C>T,S97L;HOMER
1 c.425C>T,P142L;GRM5 c.3503T>C,L1168P;MAPK2 c.581-1G>T;HRAS c.383G>A,R128Q;MECP2c.1477G>T,E483X。
[0075] 自闭症谱系障碍通常表征为全身性发育迟缓(PDD)名下的5种病症之一。在PDD名下的5种病症包括:自闭症(典型自闭症),Asperger氏综合征,Rett氏综合征,童年瓦解性障碍,及不另外特定的全身性发育迟缓(PDD-NOS)。根据本发明,可分析知道或怀疑相关于5种病症和/或自闭症谱系障碍之一的一组基因。在某些实施方式中,自闭症是非-综合征性自闭症。或者,可表征其他类型的自闭症谱系障碍的存在或增加的发展其他类型的自闭症谱系障碍的风险。
[0076] 本发明的方法和组合物还可用于诊断或预测增加的发展与自闭症关联的遗传综合征的风险,由此测定是否受试者受综合征性自闭症或非-综合征性自闭症或另一自闭症谱系障碍的影响,或处于增加的发展综合征性自闭症或非-综合征性自闭症或另一自闭症谱系障碍的风险。通常与自闭症关联的遗传病症包括,例如,Angelman综合征,Prader-Willi综合征,15q11-q13重复,脆性X综合征,脆性X前突变,染色体2q缺失,XYY综合征,Smith-Lemli-Opitz综合征,Apert综合征,ARX基因中的突变,De Lange综合征,Smith-Magenis综合征,Williams综合征,Noonan综合征,Down综合征,软腭-心-面部综合征,肌强直营养不良,Steinert病,结节性硬化,Duchenne氏病,蒂莫西综合征,10p末端缺失,Cowden综合征,45,X/46,XY镶嵌现象,Myhre综合征,Sotos综合征,Cohen综合征,Goldenhar综合征,Joubert综合征,Lujan-Fryns综合征,Moebius综合征,伊藤黑色素过少症,1型神经纤维瘤病,CHARGE综合征和HEADD综合征。
[0077] 本发明的方法可利用核酸测序,杂交,定量PCR或本领域知道的其他技术,以鉴定与自闭症谱系障碍关联的变体。该技术的描述可见于本领域使用的教科书。或者,可使用诸如本文详述的较新测序技术(见例如,Bowers et al.,2009,Nature Methods,6:593-595;Ozsolak et al.,Nature,2009,461:814-818)。通过利用对象诊断测试,本发明的方法大大减少和/或消除与诊断自闭症谱系障碍的主观方法关联的误诊。
[0078] 例如,在某些实施方式中,本发明提供诊断受试者(例如,儿童或胎儿)中自闭症谱系障碍的存在或增加的发展自闭症谱系障碍的风险的方法,包括:从受试者获得核酸样品及鉴定指示自闭症谱系障碍的序列变体,重排,拷贝数变体等。序列变体可为已之前在受试者或患ASD的受试者中鉴定的序列变体。或者,序列变体可为新的(即,之前未描述的)。变体的鉴定可依经验或可通过和与本文教导的一种或更多自闭症谱系障碍关联的知道的序列改变比较来制造。
[0079] 可从体液或组织,诸如脑脊液,血,羊水,母源血,颊拭子,痰或尿得到核酸源材料。可通过任何遗传元件的分析来进行诊断,诸如但不限于基因,外显子,内含子,基因调控元件,内含子,表达的RNA,微RNA,siRNA和表观遗传元件。可使用对于检测基因的单拷贝足够敏感的测序方法。
[0080] 基因组的仍其他元件可对于基因表达重要,且像这样的作为可用于ASD的诊断学的变体而涵盖。例如,对于TSC1,TSC2,MECP2,SHANK3,GRM1,GRM5,ARC,EIF4E,HOMER1,HRAS,MAP2K1,MAP2K2,RAF1,PIK3CA,PIK3R1,FMR1,PTEN,RHEB和UBE3A基因,已标位包括剪接位点,转录因子结合,A-I编辑位点,微RNA结合位点,功能RNA结构位点的调控元件,且可评价本文所述的突变(变体)。
[0081] 由此,对于本发明的各方法和组合物,变体可包含包括至少下列之一的核酸序列:(1)A-到-I编辑位点-腺苷-到-肌苷(A-到-I)RNA编辑在脑中呈现精确的区域特异性及对于正常行为必要,及已将特定编辑位点的改变相关于一系列神经病理学,包括
癫痫和精神分裂症;(2)剪接位点-估计几乎一半的成因突变影响前-mRNA剪接,及通过剪接缺陷导致许多神经学
疾病,包括与第17染色体联
锁的肌强直营养不良和帕金森症;(3)保守的功能RNA结构-单链RNA-介导的调节是结构依赖性的,及重复使用几个核心二级结构,诸如发卡和茎-环,且这些结构的改变可影响它们导致疾病的功能,如在SEPN1-相关的肌病的典型例中;(4)确认的转录因子结合位点(TFBS)-Encyclopedia of DNA Elements(编码)计划使用CHiP-seq确认了几种转录因子与预测的转录因子结合位点(TFBS)的结合,及TFBS中的突变相关于几种
精神病学病症,包括精神分裂症及双相情感障碍;(5)微RNA(miRNA)结合位点-miRNA越来越认识为脑发育的关键调节物,通过沉默靶mRNA诱导基因表达程序中的全局变换,及微RNA结合位点中的突变已牵涉Tourette综合征和TDP43-阳性额颞痴呆;(6)多聚腺苷酸化位点-mRNA稳定必需3个多聚腺苷酸化,及多聚腺苷酸化缺陷可间接导致它们的mRNA的改变的表达,或,罕有功能效应的直接获得,诸如在眼咽肌肉营养不良中;(7)知道的调控元件-Open REGulatory ANNOtation数据库(ORegAnno)是用于展出来自科学文献的知道的调控元件的数据库;(8)在目标区(ROI)中作为几种miRNA基因编码的miRNA基因嵌入编码蛋白的基因之内,且miRNA基因中的多态性相关于阿尔茨海默病和精神分裂症;(9)ROI中编码的小核仁RNA基因-编码蛋白的基因中持有几个snoRNA基因,且脑特异性snoRNA的改变已相关于某些疾病,例如,Prader-Willi综合征;(10)在胎盘
哺乳动物间超保守的元件-超保守的元件已在巨大的进化压
力下,以防止经几百万年的任何序列切换,及像这样的被认为携带关键的功能作用。
[0082] 例如,本发明的实施方式提供诊断受试者(例如,儿童或胎儿)中自闭症谱系障碍的存在或增加的发展自闭症谱系障碍的风险的方法。该方法可包括从来自受试者或,在胎儿的情况中,来自其母的组织或体液样品获得核酸。方法还可包括下列步骤:测序核酸或测定基因组排列或核酸的拷贝数以检测是否核酸序列或基因组排列或拷贝数中有变体。方法还可包括下列步骤:评定核酸序列或基因组排列或拷贝数中的变体对于自闭症谱系障碍的临床意义。该分析可包括受影响的群体(即,患疾病的受试者)中变体序列的关联程度的评估。该分析也可包括突变可对基因表达和/或蛋白功能具有的效应的程度的分析。方法也可包括基于此评定的结果诊断自闭症谱系障碍的存在或增加的发展自闭症谱系障碍的风险。
[0083] 可使用许多不同基因组分析技术以便进行本文教导的评定。例如,其他变体的靶再测序,全基因组测序,单核苷酸多态性(SNP)分析,拷贝数,表观遗传比较,重排,缺失和鉴定/分析可用于进行本文教导的比较和鉴定。以下例示的旨在是例证性,且本领域技术人员明白可使用任何可利用的基因组分析技术以便达到本文所述的结果。
[0084] 根据本发明的分析用核酸可以任何临床可接受的方式从人样品,例如人组织或体液得到。核酸可从成年或儿童得到,或可为胚胎物质(例如,来自母源血清或羊水的胚胎染色体物质)。可接受任何组织或体液源,包括来自组织或
流体的细胞物质,诸如粘液,血,
血浆,血清,血清衍生物,胆汁,血,母源血,痰,唾液,汗,羊水,乳腺流体,尿和脑脊液(CSF)。样品也可为拭子或精细针抽吸或活检的组织。样品也可为含有细胞或
生物材料的培养基。在受试者是胎儿的实施方式中,液体样品可从羊水或母源血得到。
[0085] 核酸可测序和/或测定其基因组排列和/或拷贝数以便检测相比源于在
采样时间不知道遭受自自闭症谱系障碍的一或更多个体的参照序列的核酸中的变体(即,突变)。如上所述,序列变体也可依经验获得。核酸可包括源于多个遗传元件的多个核酸。本领域知道检测序列变体或基因组排列或拷贝数的方法,及序列变体或基因组排列或拷贝数可通过本领域中知道的任何测序方法,例如,总体测序或单分子测序,及通过本领域知道的检测基因组排列或拷贝数的任何方法,例如,阵列比较性基因组杂交来检测。
[0086] 进行测序的一种常规方法是通过链终止和凝胶分离,如描述于Sanger等人,1977,Proc Natl Acad Sci U S A,74:5463-67。另一常规测序方法涉及核酸片段的化学降解。见,Maxam et al.,1977,Proc.Natl.Acad.Sci.,74:560-564。最终,方法已基于通过杂交的测序开发。见,例如,Harris等人,美国专利申请公开No.20090156412。将各这些参考文献通过引用整体并入本文。
[0087] 在某些实施方式中,测序通过Sanger测序技术进行。典型Sanger测序涉及单链DNA模板,DNA引物,DNA聚合酶,放射性或荧
光标记的核苷酸,及终止DNA链延伸的修饰的核苷酸。如果标记物未附接于双脱氧核苷酸终止子(例如,标记的引物),或是单色标记物(例如,放射性同位素),则将DNA样品分为4个独立的测序反应,含有4种标准脱氧核苷酸(dATP,dGTP,dCTP和dTTP)和DNA聚合酶。向各反应仅添加4种双脱氧核苷酸(ddATP,ddGTP,ddCTP或ddTTP)之一。这些双脱氧核苷酸是链-终止核苷酸,在DNA链延伸期间2个核苷酸之间的磷酸二酯键的形成需要缺少3’-OH基团。但是,如果各双脱氧核苷酸携带不同标记物,(例如,4种不同
荧光染料),则无需独立反应,全部测序反应可一起进行。
[0088] 将双脱氧核苷酸并合到新生,即,延伸,DNA链终止DNA链延伸,产生一套不同长度的DNA片段。然后变性新合成的及标记的DNA片段,并使用在能在链长度上解析单-碱基差异的变性聚丙烯酰胺-脲凝胶上凝胶
电泳来依尺寸分离。如果将各4个DNA合成反应用相同的,单色标记物(例如,放射性同位素)标记,则使它们在凝胶中的4个个体,相邻泳道之一分离,其中凝胶中的各泳道根据相应反应中使用的双脱氧核苷酸命名,即,凝胶泳道A,T,G,C。如果利用4种不同标记物,则可将反应并入凝胶上的单泳道。然后通过放射自显影或荧光将DNA条带
可视化,及可从X-射线胶片或凝胶像直接读DNA序列,或连续监控作为反应产物的荧光经过凝胶中的特定点。
[0089] 根据加入反应而产生条带或其对应直接标记物的的双脱氧核苷酸鉴定的末端核苷酸碱基。然后使用凝胶中不同条带的相对位置来读(从最短到最长)指示的DNA序列。可使用DNA测序仪,诸如可从PerkinElmer,Beckman Coulter,Life Technologies,及其他商购的那些自动化Sanger测序过程。
[0090] 在其他实施方式中,核酸的测序通过单-分子或源于单分子的同一性非常大的分子组的大规模并行测序(也称之为“下一代测序”),通过由诸如PCR的方法的扩增来实现。大规模并行测序例如见于Lapidus等人,美国专利号7,169,560,Quake等人,美国专利号6,818,395,Harris美国专利号7,282,337和Braslavsky,等人,PNAS(USA),100:3960-3964(2003),将它们的内容通过引用整体并入本文。
[0091] 在下一代测序中,可对核酸进行PCR或全基因组扩增,以便获得足够的量的分析用核酸。在一些形式的下一代测序中,无需扩增,因为方法能从未扩增的DNA评价DNA序列。一旦测定,将来自测试样品的序列和/或基因组排列和/或基因组核酸的拷贝数与源于在它们的取样品时间不知道遭受自自闭症谱系障碍的一或更多个体的标准参照比较。来自测试样品和标准参照的核酸的序列和/或基因组排列和/或基因组排列和/或拷贝数之间的全部差异被认为是变体。
[0092] 在下一代(大规模并行测序)中,将全部目标区一起测序,并将各序列读取的起源通过与参照序列比较(比对)来测定。目标区可在一个反应中共富集,或它们可独立地富集,然后在测序之前组合。在某些实施方式中,及如本文实施例中详述,源于测定中包括的基因的编码外显子的DNA序列通过随机片段化的基因组DNA与特定RNA探针的整体杂交来富集。将相同的适配体序列附接于全部片段的末端,允许通过用一个引物对在一个反应中PCR来全部杂交-捕获的片段的富集。将通过杂交少有效捕获的区通过PCR用特定引物扩增。此外,用特定引物的PCR可用于扩增类似序列(“假外显子”)在基因组中的别处存在的外显子。
[0093] 在使用大规模并行测序的某些实施方式中,将PCR产物连接而形成DNA的长延伸物,将其剪切为短片段(例如,通过声能)。此步骤确保片段末端贯穿目标区分布。随后,将dA核苷酸的延伸物加入各片段的3’端,其允许片段结合到被寡(dT)引物包被的平面表面(“流动池”)。然后各片段可通过用荧光-标记的核苷酸延伸寡(dT)引物来测序。各测序循环期间,仅添加一种类型的核苷酸(A,G,T或C),且通过使用链终止核苷酸允许仅一个核苷酸合并。例如,在第1测序循环期间,可添加荧光标记的dCTP。此核苷酸会仅并入需要C作为下一核苷酸的那些生长互补DNA链。各测序循环之后,取流动池的像以确定哪个片段延伸。合并了C的DNA链会发光,而未合并C的DNA链会呈现暗。逆转链终止以使生长的DNA链可再次延伸,及重复过程总120个循环。
[0094] 将像转变为碱基串,通常称之为“读取”,其重现各片段的3’末端25~60个碱基。然后将读取与分析DNA的参照序列比较。由于25个碱基的任何给定串一般在人基因组中仅出现一次,多数读取可与人基因组中的一个特定位置“对齐”。最终,可从可利用的读取建造各基因组区的共有序列,及与在该位置的参照确切的序列相比。共有序列和参照之间的任何差异称之为序列变体。
[0095] 【鉴定自闭症标记物的方法】
[0096] 在某些实施方式中,本发明包含用于鉴定自闭症标记物的方法(即,以统计学地显著方式与自闭症关联的核酸序列中的变体)。就新标记物检定的基因和/或基因组区可基于它们在显示与自闭症的联系和/或原因的生物化学通路中的重要性来选择。或者,就标记物检定的基因和/或基因组区可基于和与家族中自闭症遗传遗传关联的DNA区的遗传关联来选择(例如,Abrahams和Geschwind,2008)。或者,可系统评价就标记物检定的基因和/或基因组区,以含盖尚未评价的染色体的某些区。
[0097] 如本文所述,自闭症谱系障碍通常表征为在全身性发育迟缓(PDD)名下的5种病症之一。在PDD名下的5种病症包括:孤独性障碍,Asperger氏病症,童年瓦解性障碍(CDD),Rett氏病症和未另外特定的PDD(PDD-NOS)。在某些情况中,自闭症可为非-综合征性的。以下表1提供可就新标记物评价以根据本发明的方法诊断自闭症谱系障碍的一组基因或基因组区。
[0098] 表1
[0099]基因 编码的蛋白
EIF4E 真核翻译起始因子4E
EBP1 真核翻译起始因子4E-结合蛋白1
EBP2 真核翻译起始因子4E-结合蛋白2
AKT1 RAC-α丝氨酸/苏氨酸-蛋白激酶
AKT2 RAC-β丝氨酸/苏氨酸-蛋白激酶
AKT3 RAC-γ丝氨酸/苏氨酸-蛋白激酶
PRKAA1 5’-AMP-活化的蛋白激酶催化性亚基α-1
APP
淀粉样蛋白前体蛋白
ARC 活性-调控的细胞骨架-关联的
ARX Aristaless相关的同源框
CACNA1C
钙通道,
电压-依赖性,L类型,α1C亚基
CAMK2G 钙/钙调素-依赖性蛋白激酶II型γ链
CDKL5 细胞周期蛋白-依赖性激酶-样5
MET MNNG(N-甲基-N′-硝基-N-亚硝基-胍)HOS转化
CNTNAP2
接触蛋白-关联的蛋白-样2
DHCR7 7-脱氢胆甾醇还原酶
DRD3 D(3)多巴胺受体
MAPK3 促细胞分裂原-活化的蛋白激酶3
MAPK1 促细胞分裂原-活化的蛋白激酶1
FKBP1A 肽基-腈氨酰顺式-反式异构酶FKBP1A
FMR1 脆性X心理延迟1蛋白(FMRP)
AFF2 AF4/FMR2家族成员2
FOXP2 叉头盒蛋白P2
FXR1 脆性X心理延迟综合征-相关的蛋白1
FXR2 脆性X心理延迟综合征-相关的蛋白2
GCH1 GTP环
水解酶1
Gq-α Gq蛋白或Gq/11
HLA-A 人白细胞
抗原HOMER1 Homer蛋白
HOXA1 同源框蛋白Hox-A1
HRAS ras癌基因
HTR3A 5-羟色胺受体3A
HTR3C 5-羟色胺受体3C
IGF1R 胰岛素-样生长因子1受体
IGFBP1 胰岛素-样生长因子-结合蛋白1
MIRLET7B 微RNA(无蛋白)
微 R N A
let-7b
MAP1B 微管-关联的蛋白1B
MECP2 甲基CpG结合蛋白2
MAP2K1 促细胞分裂原-活化的蛋白激酶激酶1
MAP2K2 促细胞分裂原-活化的蛋白激酶激酶1
GRM1 谷氨酸受体,亲代谢型1
GRM5 谷氨酸受体,亲代谢型5
MKNK1 MAP激酶-相互作用丝氨酸/苏氨酸-蛋白激酶1
MTOR 哺乳动物雷帕霉素靶(mTOR)
NF1 神经纤维瘤病I型(NF-1)
NLGN3 神经连接蛋白-3
NLGN4 神经连接蛋白-4
NLGN4X 神经连接蛋白-4,X-连锁的
NLGN4Y 神经连接蛋白-4,X-连锁的
NRXN1 Neurexin-1-α
OXTR 缩宫素受体
PAK1 丝氨酸/苏氨酸-蛋白激酶PAK 1
PAK2 丝氨酸/苏氨酸-蛋白激酶PAK 2
PDPK1 3-膦酸肌醇依赖性蛋白激酶-1
PDK1 丙
酮酸脱氢酶[硫辛酰胺]激酶同工酶1,线粒体
PDK2
丙酮酸脱氢酶[硫辛酰胺]激酶同工酶2,线粒体
PIK3CA 磷脂酰肌醇3-激酶,催化性亚基
PIK3R1 磷脂酰肌醇3-激酶,催化性亚基
PPP2CA 蛋白磷酸酶2(PP2)
PPP1CA 丝氨酸/苏氨酸-蛋白磷酸酶PP1-α催化性亚基
PPP1CC 丝氨酸/苏氨酸-蛋白磷酸酶PP1-γ催化性亚基
PPP2R2B 丝氨酸/苏氨酸-蛋白磷酸酶2A 55kDa调控亚基Bβ
异构体
PPP2R3B 丝氨酸/苏氨酸-蛋白磷酸酶2A调控亚基B亚基β
PPP3CA 钙神经素
PPP3CB 丝氨酸/苏氨酸-蛋白磷酸酶2B催化性亚基β异构
体
PPP3CC 丝氨酸/苏氨酸-蛋白磷酸酶2B催化性亚基γ异构
体
PRKCB 蛋白激酶Cβ类型
DLG4 Disks大同源物4
PTEN 磷酸酶和
张力蛋白同源物
PTPRD 受体-型酪氨酸-蛋白磷酸酶δ
PTPRF 受体-型酪氨酸-蛋白磷酸酶F
PTPRM 受体-型酪氨酸-蛋白磷酸酶μ
PTPRZ1 受体-型酪氨酸-蛋白磷酸酶ζ
RAC1 Ras-相关的C3肉毒毒素基材1
RAF1 Map激酶
RPTOR MTOR复合物的调控关联的蛋白
RELN RELN蛋白
RGS4 G蛋白信号转导4的调节物
RHEB 脑中富集的Ras同源物
RPS6KB1 核糖体蛋白S6激酶β-1
SHANK1 Shank蛋白1
SHANK3 Shank蛋白3
SLC6A4 溶质载体家族6(神经递质转运子,血清素)成员
SNRPN 小核核糖核蛋白-关联的蛋白N
TSC1 结节性硬化1
TSC2 结节性硬化2
UBE3A 泛素蛋白连接酶E3A
[0100]
[0101]
[0102] 在其他实施方式中,就新标记物评价的基因或基因组区可为可与自闭症发展关联的生物化学通路的部分。例如,在某些实施方式中,基因和/或基因组区涉及亲代谢型谷氨酸受体通路。在一实施方式中,通路是mGluR5信号转导通路和/或包括对于mGluR5受体作为mGluR5受体的活性重要的基因。由此,mGluR5受体信号转导通路可,基于其明显的在脆性X综合征发展中的重要性和广泛地定义的mGluR5信号转导通路之内的几种其他组分与ASD的关联,提供预测ASD的标记物。给定通路的多组分之内的个别罕见序列变体对相同的表型的累积贡献已显示对其他遗传疾病发生。或者,可评价与某些类型的自闭症综合征相关的其他生物化学通路。
[0103] 例如,图1提供涉及mGluR5信号转导通路及可根据本发明评估而确定是否该基因中的突变与自闭症发展关联的基因的描绘。当证据指示该序列变异可与自闭症发展关联时,可提供分离的序列用于患者样品的DNA测序,以提供受试者中自闭症的存在和/或增加的受试者发展自闭症的风险的指示。例如,及如本文详述,表2提供可评价的基因和/或基因组区的子集,以及见于自闭症受试者(即,被诊断患非-综合征性自闭症的患者)的突变。
[0104] 如在图2中描绘,可基于一种或更多下列方法评定对自闭症谱系障碍的变体和/或变体组合的临床意义。如果变体或变体组合被报道或知道,相比未患自闭症谱系障碍的受试者,更常发生在来自患自闭症谱系障碍的受试者的核酸,其被认为至少潜在地易感于自闭症谱系障碍。如果变体或变体组合被报道或知道完全或优先传递到患自闭症谱系障碍的个体,其被认为至少潜在地易感于自闭症谱系障碍。相反,如果变体以类似频度见于两群,其欠可能相关于自闭症综合征病症(ASD)的发展(见图2,右手侧)。
[0105] 如果变体或变体组合被报道或知道对适于测量蛋白或生物学系统的功能的实验模型系统中的蛋白或生物学系统的功能具有总体有害的效应,且如果此变体或变体组合影响知道相关于自闭症谱系障碍的基因,其被认为至少潜在地易感于自闭症谱系障碍。例如,如果基于预测的对蛋白或核酸的序列和/或结构的效应而预测变体或变体组合对蛋白或基因表达具有总体有害的效应(即,导致无义突变,移码突变,或剪接位点突变,或甚至错义突变),且如果此变体或变体组合影响知道相关于自闭症谱系障碍的基因,其被认为至少潜在地易感于自闭症谱系障碍(见图2,左-手侧)。
[0106] 而且,在某些实施方式中,变体总数可为重要。如果,在测试样品中,个别或组合检测一个变体或几个变体,其评定为至少可能与自闭症谱系障碍关联,则可将检测了此变体或这些变体的遗传物质的个体诊断为患自闭症谱系障碍或处于高发自闭症谱系障碍的风险。
[0107] 【用于诊断自闭症谱系障碍的方法和组合物】
[0108] 在某些实施方式中,自闭症谱系障碍的诊断通过检测序列,基因组位置或排列,和/或核酸的或一组核酸基因组拷贝数的变异来进行。例如,在一些实施方式中,评定变体的基因或基因组区选自表1中的基因。所述组可包括至少5,10,20,30,40,50,60,70,80或90个表1中的基因。在其他实施方式中,诊断用表1中的少于5个基因进行,且在某些实施方式中,用表1中的仅1个基因进行。
[0109] 例如,以下表2提供表1中基因的子集,其中至少一些涉及mGluR5受体信号转导。表2也提供可在患自闭症的受试者中检测到的这些基因的变体。这些变体可,在本发明的方法和组合物的某些实施方式中,指示受试者中的自闭症谱系障碍。
[0110] 表2:用于从mGluR5通路在ASD中检测的变体
[0111]
[0112]
[0113]
[0114]
[0115]
[0116]
[0117]
[0118] 在表2中,全部变体的数和名称相对于genome.ucsc.edu网站在2006年3月(hg18)公开的人参照序列及根据Human Genome Variation Society推荐的系统。根据HGVS系统,编码序列的起始(即,起始密码子ATG的″A″)
指定为+1。全部编码核苷酸,即,全部外显子核苷酸,在指定的mRNA异构体中连续地编号。内含子核苷酸相对于最近外显子核苷酸编号。例如,基因的头3个核苷酸(atg)会分别编号为1,2和3,而非-外显子元件如下编号(见例如,Correlagen网站,作为讨论)。
[0119]
[0120] 如表2中显示,序列变体根据它们在DNA序列中导致的变化和产生的对肽序列的变化(如果任何)命名。变化的最常见的类型是一个核苷酸用另一核苷酸的取代(例如,c.3G>T)。其他类型的变体包括一个或更多核苷酸的缺失(例如,c.4_6delGAA),一个或更多核苷酸的插入(例如,c.4_5insT)或一组核苷酸用一组不同核苷酸的取代,其中删除的及插入的核苷酸数可不同(例如,c.4_6delinsT)。
[0121] 突变,甚至单核苷酸取代,可具有非常不同结果。剪接位点突变毁坏既有的剪接位点或创建新剪接位点。两种类型的变异可导致改变的mRNA加工,由此产生显著不同的成熟mRNA和不同蛋白。
[0122] 无义突变将终止密码子引入编码区中,其导致蛋白截短。错义突变将蛋白中的一个氨基酸变化为另一氨基酸。同义突变是不变化氨基酸序列的突变。
[0123] 移码突变导致阅读框的移动,导致突变(即,移码位点)下游的氨基酸序列的完全变化。移码突变由不可被3整除的数的核苷酸的净删除或插入导致。框内缺失和/或插入导致蛋白中的一个或更多氨基酸的缺失或插入,但不改变阅读框,且由此不变化缺失或插入位点的氨基酸序列下游。
[0124] 已在患非-综合征性自闭症的受试者中使用本文所述的方法检测表2中的变体。在某些实施方式中,自闭症谱系障碍的诊断可通过包括变体的样品核酸与包括选自表2中的基因的核酸变体的一组核酸的比较来进行。或者,新变体可包括在组中。所述组可包括至少1,2,3,5,10,15,16个或全部表2中的基因。在其他实施方式中,诊断用小于3个表2中的基因进行,且在某些实施方式中,用仅1个表2中的基因进行。
[0125] 由此,ARC(活性-调控的细胞骨架-关联的)编码对突触可塑性的固定以及长期记忆的形成重要的蛋白。ARC也响应突触活性调控AMPA受体的胞吞,且涉及AMPA受体的稳态突触计量。ARC基因位于第8染色体的8q24.3,从p-端的143,689,412bp开始并从p-端的143,692,835bp结束(3,424个碱基;取向:负链)。ARC的基因组序列见于GenBank,登录号为No.NC_000008。基因序列(NM_015193)显示于图3A,为SEQ ID NO:1(编码序列202~1392);蛋白序列显示于图3B,为SEQ ID NO:2。除非在本文中说明,此序列中的变体被认为未之前显示相关于至少一些自闭症谱系障碍(例如,非-综合征性自闭症),且表2中的变体未之前显示相关于非-综合征性自闭症或综合征性自闭症。
[0126] EIF4E(真核翻译起始因子4E)编码真核翻译起始因子4E。EIF4E是涉及将核糖体导向mRNA的7-甲基-
鸟苷帽结构的真核翻译起始因子。EI4FE是EIF4E前起始复合物的部分。EIF4E的基因组序列见于GenBank,登录号为No.NC_000004。基因序列(NM_001968)显示于图3C,为SEQ ID NO:3(编码序列1524~2177);蛋白序列显示于图3D,为SEQ ID NO:4。除非在本文中说明,此序列中的变体被认为未之前显示相关于至少一些自闭症谱系障碍(例如,非-综合征性自闭症),且表2中的变体未之前显示相关于非-综合征性自闭症或综合征性自闭症。
[0127] FMR1(脆性X心理延迟1)编码脆性X心理延迟蛋白(FMRP)。此蛋白在许多组织中正常制造和可在脑内神经细胞之间的突触连接的发育中起到作用。FMRP可涉及突触可塑性的调节,其可在记忆及学习中重要。FMR1基因位于X染色体的长臂的第27.3位,从碱基对146,699,054到碱基对146,736,156。FMR1的基因组序列见于GenBank,登录号为No.NC_000023。基因序列(NM_002024)显示于图3E,为SEQ ID NO:5(编码序列230~2128);蛋白序列显示于图3F,为SEQ ID NO:6。除非在本文中说明,此序列中的变体被认为未之前显示相关于至少一些自闭症谱系障碍(例如,非-综合征性自闭症),且表2中的变体未之前显示相关于非-综合征性自闭症或综合征性自闭症。
[0128] GRM1(谷氨酸受体,亲代谢型1)编码亲代谢型谷氨酸受体1(mGluR1)蛋白。GRM5(谷氨酸受体,亲代谢型5)编码亲代谢型谷氨酸受体5(mGluR5)蛋白。L-谷氨酸是中枢神经系统中的主要兴奋性神经递质及活化亲离子型和亲代谢型谷氨酸受体。谷氨酸能神经传递涉及正常脑功能的多数方面,且可在许多神经病理学条件中被扰乱。亲代谢型谷氨酸受体是G蛋白-偶联的受体家族,其已基于序列同源性,推定的信号转导机理,及药理学性质被分为3组。组I包括GRM1和GRM5,且这些受体已显示活化磷脂酶C。组II包括GRM2和GRM3而组III包括GRM4,GRM6,GRM7和GRM8。组II和III受体与环状AMP级联的抑制关联,但在它们的激动剂选择性上不同。
[0129] GRM1基因位于第6染色体的6q24,从p-端的146,390,611bp开始并从p-端的146,800,427bp结束(409,817个碱基;取向:正链)。GRM1的基因组序列见于GenBank,登录号为No.NC_000006。基因序列(NM_000838)显示于图3G,为SEQ ID NO:7(编码序列
471~4055);蛋白序列显示于图3H,为SEQ ID NO:8。除非在本文中说明,此序列中的变体被认为未之前显示相关于至少一些自闭症谱系障碍(例如,非-综合征性自闭症),且表2中的变体未之前显示相关于非-综合征性自闭症或综合征性自闭症。
[0130] GRM5基因位于第11染色体的11q14.2~q14.3,从p-端的87,880,626bp开始并从p-端的88,438,761bp结束(558,136个碱基;取向:负链)。GRM5的基因组序列见于GenBank,登录号为No.NC_000011。基因序列(NM_000842)显示于图3I,为SEQ ID NO:9(编码序列369~3911);蛋白序列显示于图3J,为SEQ ID NO:10。除非在本文中说明,此序列中的变体被认为未之前显示相关于至少一些自闭症谱系障碍(例如,非-综合征性自闭症),且表2中的变体未之前显示相关于非-综合征性自闭症或综合征性自闭症。
[0131] HOMER1编码Homer树状蛋白家族的成员。此家族的成员调控组1亲代谢型谷氨酸受体功能。HOMER1基因位于第5染色体的5q14.2,从p-端的78,704,215bp开始并从p-端的78,845,796bp结束(141,582个碱基;取向:负链)。HOMER1的基因组序列见于GenBank,登录号为No.NC_000005。基因序列(NM_004272)显示于图3K,为SEQ ID NO:11(编码序列1104~2168);蛋白序列显示于图3L,为SEQ ID NO:12。除非在本文中说明,此序列中的变体被认为未之前显示相关于至少一些自闭症谱系障碍(例如,非-综合征性自闭症),且表
2中的变体未之前显示相关于非-综合征性自闭症或综合征性自闭症。
[0132] HRAS属于Ras癌基因家族,其成员与哺乳动物肉瘤反转录病毒的转化基因相关。由这些基因编码的产物在信号转导通路中发挥功能。这些蛋白可结合GTP和GDP,及它们具有固有GTP酶活性。HRAS基因位于第11染色体的11p15.5,从p-端的522,242bp开始并从p-端的525,591bp结束(3,350个碱基;取向:负链)。HRAS的基因组序列见于GenBank,登录号为No.NC_000011。基因序列(NM_176795)显示于图3M,为SEQ ID NO:13(编码序列
189~701);蛋白序列显示于图3N,为SEQ ID NO:14。除非在本文中说明,此序列中的变体被认为未之前显示相关于至少一些自闭症谱系障碍(例如,非-综合征性自闭症),且表2中的变体未之前显示相关于非-综合征性自闭症或综合征性自闭症。
[0133] MAP2K1(促细胞分裂原-活化的蛋白激酶激酶1)编码称之为MEK1蛋白激酶的蛋白。MAP2K2(促细胞分裂原-活化的蛋白激酶激酶2)编码称之为MEK2蛋白激酶的蛋白。这些蛋白是称之为RAS/MAPK通路的信号转导通路的部分,其将来自细胞之外的化学信号传递到细胞核。RAS/MAPK信号转导辅助控制细胞的生长和分化(增殖),细胞成熟而实施特定功能的加工(分化),细胞移动和细胞的自身-破坏(凋亡)。
[0134] MAP2K1基因位于第15染色体的15q22.1~q22.33,从p-端的64,466,674bp开始并从p-端的64,570,936bp结束(104,263个碱基;取向:正链)。MAP2K1的基因组序列见于GenBank,登录号为No.NC_000015。基因序列(NM_002755)显示于图3O,为SEQ ID NO:15(编码序列476~1657);蛋白序列显示于图3P,为SEQ ID NO:17。除非在本文中说明,此序列中的变体被认为未之前显示相关于至少一些自闭症谱系障碍(例如,非-综合征性自闭症),且表2中的变体未之前显示相关于非-综合征性自闭症或综合征性自闭症。
[0135] MAP2K2基因位于第19染色体的19p13.3,从p-端的4,041,319bp开始并从p-端的4,075,126bp结束(33,808个碱基;取向:负链)。MAP2K2的基因组序列见于GenBank,登录号为No.NC_000019。基因序列(NM_030662)显示于图3Q,为SEQ ID NO:17(编码序列255~1457);蛋白序列显示于图3R,为SEQ ID NO:18。除非在本文中说明,此序列中的变体被认为未之前显示相关于至少一些自闭症谱系障碍(例如,非-综合征性自闭症),且表
2中的变体未之前显示相关于非-综合征性自闭症或综合征性自闭症。
[0136] MECP2基因(甲基CpG结合蛋白2)编码正常脑发展必要的蛋白(MeCP2)。此蛋白似乎对于脑内神经细胞的功能重要,并在成熟神经细胞中以高水平存在。研究提示,MeCP2蛋白在发生细胞间通讯的神经细胞之间形成突触中起到作用。此蛋白沉默几种其他基因,防止它们制造蛋白。MECP2基因位于第X染色体的Xq28,从p-端的152,940,218bp开始并从p-端的153,016,406bp结束(76,189个碱基;取向:负链)。MECP2的基因组序列见于GenBank,登录号为No.NC_000023。基因序列(NM_004992)显示于图3S,为SEQ ID NO:19(编码序列227~1687);蛋白序列显示于图3R,为SEQ ID NO:20。除非在本文中说明,此序列中的变体被认为未之前显示相关于至少一些自闭症谱系障碍(例如,非-综合征性自闭症),且表2中的变体未之前显示相关于非-综合征性自闭症或综合征性自闭症。
[0137] PIK3CA编码代表使用ATP来磷酸化PtdIns,PtdIns4P和PtdIns(4,5)P2的磷脂酰肌醇3-激酶的催化性亚基的蛋白。基因位于第3染色体的3q26.3,从p-端的180,349,005bp开始并从p-端的180,435,194bp结束(86,190个碱基;取向:正链)。
PIK3CA的基因组序列见于GenBank,登录号为No.NC_000003。基因序列(NM_006218)显示于图3U,为SEQ ID NO:21(编码序列158~3364);蛋白序列显示于图3V,为SEQ ID NO:
22。除非在本文中说明,此序列中的变体被认为未之前显示相关于至少一些自闭症谱系障碍(例如,非-综合征性自闭症),且表2中的变体未之前显示相关于非-综合征性自闭症或综合征性自闭症。
[0138] PIK3R1编码代表磷脂酰肌醇3-激酶的85kD调控单元的蛋白。基因位于第5染色体的5q13.1,从p-端的67,558,218bp开始并从p-端的67,633,405bp结束(75,188个碱基;取向:正链)。PIK3R1的基因组序列见于GenBank,登录号为No.NC_000005。基因序列(NM_181523)显示于图3W,为SEQ ID NO:23(编码序列43~2217);蛋白序列显示于图3X,为SEQ ID NO:24。除非在本文中说明,此序列中的变体被认为未之前显示相关于至少一些自闭症谱系障碍(例如,非-综合征性自闭症),且表2中的变体未之前显示相关于非-综合征性自闭症或综合征性自闭症。
[0139] PTEN编码磷酸酶和张力蛋白同源性蛋白,是含有张力蛋白样结构域以及类似于双特异性蛋白酪氨酸磷酸酶的催化性结构域的3,4,5-三磷酸3-磷酸酶。PTEN蛋白优先去磷酸化膦酸肌醇底物,及负调控细胞内磷脂酰肌醇-3,4,5-三磷酸的细胞内水平。PTEN蛋白涉及细胞周期的调节,防止细胞生长太快。PTEN的基因组序列见于GenBank,登录号为No.NC_007466。基因序列(NM_000314)显示于图3Y,为SEQ ID NO:25(编码序列1032~2243);蛋白序列显示于图3Z,为SEQ ID NO:26。除非在本文中说明,此序列中的变体被认为未之前显示相关于至少一些自闭症谱系障碍(例如,非-综合征性自闭症),且表2中的变体未之前显示相关于非-综合征性自闭症或综合征性自闭症。
[0140] RAF1编码MAP激酶发挥与其直接结合的膜关联的GTP酶的Ras家族的下游的作用。一旦活化,细胞RAF1蛋白可磷酸化而活化双特异性蛋白激酶MEK1和MEK2,其进而磷酸化而活化丝氨酸/苏氨酸特异性蛋白激酶,ERK1和ERK2。活化的ERK是细胞生理的多效效应子,且在涉及细胞分裂周期,凋亡,细胞分化和细胞迁移的基因表达控制中起到重要作用。RAF1基因位于第3染色体的3p25,从p-端的12,600,108bp开始并从p-端的12,680,678bp结束(80,571个碱基;取向:负链)。RAF1的基因组序列见于GenBank,登录号为No.NC_000003。基因序列(NM_002880)显示于图3AA,为SEQ ID NO:27(编码序列
416~2362);蛋白序列显示于图3BB,为SEQ ID NO:28。除非在本文中说明,此序列中的变体被认为未之前显示相关于至少一些自闭症谱系障碍(例如,非-综合征性自闭症),且表
2中的变体未之前显示相关于非-综合征性自闭症或综合征性自闭症。
[0141] RHEB编码称之为脑中富集的Ras同源性的GTP-结合蛋白。Rheb是Ras超家族的成员,并可涉及神经可塑性。蛋白是小GTP酶超家族的成员及编码含Ras-相关的GTP-结合区的5个重复子的脂质-锚定的细胞膜蛋白。RHEB的基因组序列见于GenBank,登录号为No.NC_000007。基因序列(NM_005614)显示于图3CC,为SEQ ID NO:29(编码序列414~968);蛋白序列显示于图3DD,为SEQ ID NO:30。除非在本文中说明,此序列中的变体被认为未之前显示相关于至少一些自闭症谱系障碍(例如,非-综合征性自闭症),且表2中的变体未之前显示相关于非-综合征性自闭症或综合征性自闭症。
[0142] SHANK3编码构建脑内突触必需的蛋白。Shank蛋白是将神经递质受体,离子通道和其他膜蛋白关联到肌动蛋白细胞骨架和G-蛋白-偶联的信号转导通路的突触后
密度的多域
支架蛋白。Shank蛋白也在突触形成和树状脊柱成熟中起到作用。基因位于第22染色体的22q13.3,从p-端的49,459,936bp开始并从p-端的49,518,507bp结束(58,572个碱基;取向:正链)。SHANK3的基因组序列见于GenBank,登录号为No.NC_000022。基因序列(NM_001080420)显示于图3EE,为SEQ ID NO:31(编码序列1~5244);蛋白序列显示于图3FF,为SEQ ID NO:32。除非在本文中说明,此序列中的变体被认为未之前显示相关于至少一些自闭症谱系障碍(例如,非-综合征性自闭症),且表2中的变体未之前显示相关于非-综合征性自闭症或综合征性自闭症。
[0143] TSC1(结节性硬化1)编码已暗示为
肿瘤抑制物的外周膜蛋白。TSC1也以与TSC2的
复合体涉及囊泡运输及对接。TSC1基因位于第9染色体的9q34,从p-端的
134,756,557bp开始并从p-端的134,809,841bp结束(53,285个碱基;取向:负链)。TSC1的基因序列见于GenBank,登录号为No.NC_000009。基因序列(NM_000368)显示于图3GG,为SEQ ID NO:33(编码序列235~3729);蛋白序列显示于图3HH,为SEQ ID NO:34。除非在本文中说明,此序列中的变体被认为未之前显示相关于至少一些自闭症谱系障碍(例如,非-综合征性自闭症),且表2中的变体未之前显示相关于非-综合征性自闭症或综合征性自闭症。
[0144] 基因TSC2(结节性硬化2)编码称之为抗结核菌素的蛋白,且暗示为肿瘤抑制物。其基因产物与在细胞溶质复合物中的错构瘤蛋白关联,发挥错构瘤蛋白的伴侣的作用。TSC2在囊泡运输中具有功能,且TSC1和TSC2之间的相互作用辅助囊泡对接。TSC1和TSC2的基因产物一起工作而辅助控制细胞生长和尺寸。TSC2基因位于第16染色体的16p13.3,从p-端的2,037,991bp开始并从p-端的2,078,714bp结束(40,724个碱基;取向:正链)。
TSC2的基因组序列见于GenBank,登录号为No.NC_000016。基因序列(NM_000548)显示于图3II,为SEQ ID NO:35(编码序列107~5530);蛋白序列显示于图3JJ,为SEQ ID NO:
36。除非在本文中说明,此序列中的变体被认为未之前显示相关于至少一些自闭症谱系障碍(例如,非-综合征性自闭症),且表2中的变体未之前显示相关于非-综合征性自闭症或综合征性自闭症。
[0145] UBE3A(泛素蛋白连接酶E3A)编码称之为泛素蛋白连接酶E3A的酶。此酶涉及在细胞之内靶向待断裂的(降解的)蛋白。基因位于第15染色体的15q11~q13,从p-端的23,133,489bp开始并从p-端的23,235,221bp结束(101,733个碱基;取向:负链)。UBE3A的基因组序列见于GenBank,登录号为No.NC_000015。基因序列(NM_130839)显示于图3KK,为SEQ ID NO:37(编码序列658~3276);蛋白序列显示于图3LL,为SEQ ID NO:38。除非在本文中说明,此序列中的变体被认为未之前显示相关于至少一些自闭症谱系障碍(例如,非-综合征性自闭症),且表2中的变体未之前显示相关于非-综合征性自闭症或综合征性自闭症。
[0146] 例如,对于表2中的第1ARC变体,可使用SEQ ID NO:1的DNA序列来测定编码变体:c65T>G的基因的编码序列,及具有变体p.Val22Gly的蛋白的蛋白序列来测定此变体包含错义突变。还可对蛋白序列(SEQ ID NO:2)和功能评定突变的性质。例如,此突变可预期具有中等到少数效应,由于Gly用Val的氨基酸取代可被认为是保守性取代。或者,蛋白的3-维构象数据的更详细的分析可指示突变可有害于蛋白功能。可对表2中描述的各变体,使用图4,A-LL提供的序列进行类似分析。
[0147] 由此,在某些实施方式中,可检查编码来自患ASD(例如,非-综合征性自闭症)的患者及来自对照(即,非-自闭症个体)的样品中涉及mGluR5通路的许多关键蛋白的19种基因的编码区和连续的RNA调控区中的DNA序列变体的数和性质。靶向区可在样品库中富集,及通过下一代技术测序,以致使罕见变体的检测。本文更详细讨论了该方法的一实施方式。该测序通常在高灵敏度和低假发现率的条件下,以可接受的花费,使用本文所述的方法进行。变体检测的灵敏度可通常依赖于
覆盖此位置的读取的数(称之为“深度”或“覆盖度”),即,特定位置可利用的序列信息量。由于富集方法及测序步骤受序列情景影响,覆盖度可随区改变。此外,变体检测的灵敏度也依变体类型不同(取代对比缺失和/或插入)。在某些实施方式中,以高覆盖度(即,测序区≥30×),灵敏度对于检测取代变体是约99%,对于检测跨≤5个碱基的缺失和/或插入是90%,及对于检测跨6~约40个碱基的缺失和/或插入是约30%。也在某些实施方式中,跨≤5个碱基或≥6个碱基的插入和/或缺失分别占全部变体发生的约10%和1%,且是全部病原性变体发生的分别约16%和2.6%。考虑到在测序的区之内的各碱基位置的覆盖度,测序的区的长度,及变体-类型特异性灵敏度,可提供测定中包括的各基因的变体检测的总体灵敏度。例如,如果基因中80%的分析的碱基具有对应于97%灵敏度的覆盖度,15%具有对应于92%灵敏度的覆盖度,及5%具有对应于80%灵敏度的覆盖度,该基因的总体灵敏度会计算为95%。一般而言,具有小于50%的灵敏度的外显子不包括在每基因的总体灵敏度估计中,但作为不测序的段独立地报道。
[0148] 在某些实施方式中,通过单向Sanger测序确认通过知道或预测病原性的下一代测序检测的全部序列变体以及新的全部序列变体(即,未之前在文献或数据库中描述的)。因此,报道的变体的
假阳性率通常非常低。使用此方法,可检测相比几种不同基因中的对照的情况中的罕见变体总数以及罕见,潜在地破坏变体数的统计学地显著增加。
[0149] 例如,在一实施方式中,表2中描绘的变体见于来自患不见于未受影响的个体的一类自闭症综合征(即,非-综合征性自闭症)的个体的样品。
[0150] 例如,表3~5提供与见于不显示自闭症的症状(即,对照)或诊断为非-综合征性自闭症的个体的mGluR5信号转导关联的变体的分析。如本文实施例中详述,表2中的变体见于来自290名患自闭症谱系障碍(非-综合征性自闭症)的个体的样品。
[0151] 如表3~5中显示,这些基因中的至少4种(SHANK 3,TSC1,TSC2和HOMER 1)具有基于在自闭症患者中增加的检测的突变。而且,对于这些基因,及至少一些检定的其他基因,关于基因表达或蛋白功能的突变的严重性指示,变体可相关于非-综合征性自闭症的发展。这些突变也可涉及其他类型的自闭症综合征。这些基因中的至少一种(HOMER1)未之前功能性地,或遗传性地相关于自闭症。
[0152] 表3显示相比对照(即,未患自闭症或ASD的个体),来自如AGRE样品数据库提供的患非-综合征性自闭症的患者的样品中的常见和罕见变体数的比较。可见,对于一些基因,在来自患者库的个体中有罕见变体数的不同增加,然而更常见的变体在两组中呈现类似频度。
[0153] 表3
[0154]
[0155] 表4显示罕见和潜在地破坏性突变数的比较(即,基于突变的性质),相比对照,在患非-综合征性自闭症的患者中,这些突变预期破坏基因表达或蛋白功能。可见,对于一些基因,相比对照,AGRE群体中有潜在地破坏变体数的不同增加。
[0156] 表4
[0157]
[0158] 表5显示见于仅一个样品源的罕见,潜在地破坏的变体数。可见,对于至少4种基因(HOMER,SHANK 3,TSC1和TSC2),有见于患者(AGRE)群体的突变,但不见于对照。此展示在mGluR5通路和非-综合征性自闭症中特定基因中罕见(即,新的,在于这些变体之前未报道)变体之间的统计学地显著差异。
[0159] 表5
[0160]
[0161] 由此,在某些实施方式中,本发明提供可用于测定是否受试者患ASD,或处于增加的发展ASD的风险的方法和/或核酸序列。如上所述,在一些情况中,变体核酸可为新(即,之前未报道)变体,或其可为之前已发现相关于ASD的变体。在某些实施方式中,变体可为对于亲代谢型谷氨酸受体通路重要的基因之一中的新变体,或之前报道的变体。或者,可分析来自其他生物化学通路的基因。例如,在至少一实施方式中,至少4种基因(HOMER,SHANK3,TSC1和TSC2),有见于患非-综合征性自闭症的患者但不见于对照的突变。
[0162] 在一实施方式中,变体(突变)可为表2中列的变体之一。或者,变体可为HOMER1诸如,但不限于下列至少之一:c.195G>T,M65I;c.290C>T,S97L突变;或c.425C>T,P142L突变。另外,突变可包含GRM5 c.3503T>C,L1168P突变。另外,突变可包含MAPK2c.581-1G>T突变和/或HRAS c.383G>A,R128Q突变。另外,突变可包含MECP2 c.1477G>T,E483X突变。
[0163] 例如,HOMER1变体中的2种(c.195G>T,M65I和c.290C>T,S97L)位于Homer1中的EVH1结构域,其与mGluR1和mGluR5中的Pro-Pro-Ser-Pro-Phe基序相互作用。HOMER1中的第3潜在地损伤变体(c.425C>T,P142L)影响CRH1结构域的P-基序之内的保守的脯氨酸之一,其作为EVH1结构域的内部结合位点。已建议EVH1结合于mGluR诱导Homer1的同多聚化,而EVH1结合于Homer1中的内部P-基序阻拦此同多聚化。有趣的是,AGRE样品中检测的GRM5变体(c.3503T>C,L1168P)之一位于的相对接近于mGluR5中的保守的Pro-Pro-Ser-Pro-Phe Homer1结合基序。
[0164] 在其他实施方式中,检测的突变在TSC1或TSC2基因内(见表2)。在仍其他实施方式中,检测的突变在SHANK 3基因内(见表2)。
[0165] 在其他实施方式中,AGRE样品可在MAP2K2中具有变体,其影响保守的剪接位点,由此高度可能损伤(c.581-1G>T)。在仍其他实施方式中,也在HRAS(RAS/MAPK信号转导通路中的另一基因)中检测到潜在地损伤的变体。此HRAS变体(c.383G>A,R128Q)破坏第128位的精氨酸,其在结合GTP的H-ras的膜结合及功能中起到重要作用。
[0166] 在仍其他实施方式中,方法还可在单AGRE样品中检测在MECP2(知道相关于Rett氏综合征,另一综合征性形式的ASD的基因)中的无义突变(c.1477G>T,E483X)。【实施例】
[0167] 以下列非限制性实施例为例例示方法。
[0168] 【实施例1:自闭症候选基因中的变体发现】
[0169] 将来自AGRE收集物的290个样品和来自Coriell收集物的290个种族上匹配的样品中的假定相关于自闭症谱系障碍的19种候选基因及知道相关于肥大性心肌病的4种对照基因的全部编码外显子扩增。在扩增之前,通过在NANODROP分光光度计上测量来测定各样品中的DNA浓度,及然后使用等同量的DNA来产生各15库的20AGRE样品和各15库的20 Coriell样品。
[0170] 各收集物的10个样品以2库代表,允许那些样品中变体检测的独立复制。对于各库,产生总293种PCR产物,包括总共约116,000个碱基。PCR产物覆盖每mRNA异构体的全部编码区以及侧接内含子区。将高-保真度聚合酶用于PCR扩增来最小化PCR期间误差的导入。PCR引物以含有NotI限制性位点的序列结尾。在PCR扩增之后,将PCR产物合并及使经历用NotI限制酶的消化。连接NotI-消化的PCR产物来产生几kb长度的多连体。然后将多连体随机剪切为长度200~250bp的片段。根据ILLUMINA氏流程,将片段的末端-修复,以A结尾及连接到成叉状的适配体分子。通过PCR选择性地富集适配体-连接的片段。富集步骤期间,将6bp指标加入片段。片段的指标允许在Illumina GA2仪器的相同的泳道上测序来自不同样品库的片段。
[0171] 在ILLUMINA GA2上进行测序50个循环。每泳道的最小产率是5百万读取。每ILLUMINA GA2泳道测序来自2个不同样品库的片段库,每个碱基和样品库800倍,或每个体40倍(每个体染色体20倍)的平均靶向覆盖度。此平均覆盖度足以检测在20个样品的库中单杂合变体的出现。发现,覆盖度由此检测灵敏度在扩增的区之内及之间,以及片段库之间不同。
[0172] 将源于各ILLUMINA GA2泳道的序列数据通过用于碱基判定的BUSTARD处理,并输出数据,然后基于指标分离为不同文件。仅指标读数不同于1或更少时,使用来自实际指标序列的碱基。在指标-分离之后,分析序列数据②的使用由Gabor Marth博士在Boston College开发的流水线,其包含序列比对软件(MOSAIK)和变体判定器(GIGABAYES)。将序列读取与由以原PCR-产物库加约30个核苷酸的侧接非-编码序列代表的全部编码外显子的源于hg18的序列组装的参照序列对齐。对于被认为对齐的读取,需至少60%的碱基对齐,有最大1个错配。合并的数据中的变体判定基于3种类型的滤器的随后应用,之后是由GIGABAYES采用的基于Bayesian的变体判定算法的使用。滤器设计为减少假-阳性率而维持用于通过附加到下列实验条件来检测20个样品的库中的单杂合变体出现率的80~90%灵敏度:(1)碱基判定的QV值需为至少20;(2)少数等位基因判定的最小数需源于各DNA链(编码及非-编码);及(3)少数等位基因频度需达到特定值。
[0173] 如下应用滤器。将以至少20的QV在各DNA链上出现至少4次的少数等位基因继续考虑为潜在变体。在总覆盖度(即,任何QV值的碱基判定的总数)在1200以下的位置,将以至少20的QV在各DNA链上出现至少3次的少数等位基因继续考虑为潜在变体。在总覆盖度在900以下的位置,将以至少20的QV在各DNA链上出现至少2次的少数等位基因继续考虑为潜在变体。在潜在变体基于上述标准判定的全部位置,则将用在任何其他样品库中的任何滤器判定的全部变体继续考虑为潜在变体。然后使全部潜在变体判定以用于合并的样品中的变体判定的适当的设置经历GIGABAYES变体判定算法。在得到的变体判定中,仅接受具有1.5%或更大的少数等位基因频度的那些。
[0174] 【实施例2:见于AGRE和对照样品的变体数】
[0175] 在GA2和HELISCOPE平台上在AGRE和/或对照样品中检测总536个变体(表3)。这些变体,如果发现等位基因频度≥1%,则称之为‘常见的’,而如果发现等位基因频度<1%,则称之为‘罕见的’。分别在AGRE样品及对照中检测的336和310个变体是罕见的。常见的和罕见变体数在个体基因之间不同。表2显示检测的变体中的至少一些。
[0176] 方法可包括就具有潜在地破坏效应的罕见变体选择。在此组中,包括在蛋白水平产生错义或无义变化,影响保守的剪接位点,或位于3′UTR或5’UTR,且可由此冲击mRNA转录或加工的变体。在总216个罕见潜在地破坏变体中,147个见于AGRE,122个见于对照(表4)。在那些中,58个仅见于AGRE样品,31个仅见于对照(表5),指示AGRE样品中罕见,潜在地破坏变体的统计学地显著富集。在个体基因的水平上,对于基因HOMER1,SHANK3,TSC1和TSC2,富集达到统计学意义(表5)。
[0177] 这些基因中的3种(SHANK3,TSC1和TSC2)之前已展示在自闭症中的因果作用。但是,显著地,自闭症由于TSC1或TSC2中的变体而一般见于结节性硬化的情景,而在当前研究中,排除来自患综合征性形式的ASD的个体的样品。第4基因(HOMER1)未之前与自闭症有原因地相关。HOMER1变体中的2种(c.195G>T,M65I和c.290C>T,S97L)位于Homer1的EVH1结构域,其已显示与mGluR1和mGluR5中的Pro-Pro-Ser-Pro-Phe基序相互作用。HOMER1中的第3潜在地损伤变体(c.425C>T,P142L)影响CRH1结构域的P-基序之内的保守的脯氨酸之一,其作为EVH1结构域的内部结合位点。已建议EVH1结合于mGluR诱导Homer1的同多聚化,而EVH1结合于Homer1中的内部P-基序阻拦此同多聚化。有趣的是,在AGRE样品中检测到的GRM5变体之一(c.3503T>C,L1168P)位于相对接近于mGluR5中的保守的Pro-Pro-Ser-Pro-Phe Homer1结合基序。
[0178] 仅在AGRE样品中观察到的几种罕见,潜在地破坏TSC1和TSC2变体已被其他分类为罕见多态性,因为它们与清楚的疾病变体一起见到和/或与结节性硬化表型不明显分开。这些变体可由此代表关于结节性硬化的下效变体,且当与TSC1和TSC2中的其他变体一起出现时作为修饰物发挥作用。越来越良好认识单基因病症的多形性性质和更弱形式的单基因疾病中下效变体的作用。
[0179] 当AGRE样品中罕见,潜在地破坏变体的富集随此初始采样就基因中的4种达到统计学意义,特定单变体提示额外的基因与ASD的原因关系。特别是,一个AGRE样品在MAP2K2中带有变体,其影响保守的剪接位点,由此高度可能损伤(c.581-1G>T)。也在HRAS(RAS/MAPK信号转导通路中的另一基因)中检测到潜在地损伤变体。此HRAS变体(c.383G>A,R128Q)破坏第128位的精氨酸,其已显示在结合GTP的H-ras的膜结合及功能中起到重要作用。MAP2K2和HRAS已知分别与心-面-
皮肤和Costello综合征(与心理延迟及延迟关联的两种单基因病症)关联。但是,MAP2K2未之前与自闭症关联,而早期关联研究提示HRAS和ASD之间的联系。
[0180] 方法还在单AGRE样品中检测到MECP2(知道相关于Rett氏综合征,另一综合征性形式的ASD的基因)中的一种无义突变(c.1477G>T,E483X)。有趣的是,此无义突变导致MECP2的仅3个C-端氨基酸缺失,且可由此也代表下效变体。
[0181] 测定在任何或库中检测到变体的全部位置的各库中的各基因的平均覆盖度。在一个或少数库中的低覆盖度对常见变体的检测具有很少影响,由于变体会见于许多不同库。但是,如果它们仅在更低覆盖度的库中发生,罕见变体可丢失。为了理解这些效应,评价2种量度:(1)覆盖度低于特定截止值的库数(例如,对于20个样本库是160个,对于15个样本库是120);及(2)常见和罕见变体的相对频度。几个库中低覆盖度的存在及常见和罕见变体群之间的
不平衡的比降低给定基因中罕见变体的检测
置信度。
[0182] 本发明的方法提供用于在候选基因中发现罕见变体,进行测定以测定样品-库尺寸不限制变体检测的灵敏度。
[0183] 为了确证更大(20个样品)库中变体检测的灵敏度,构建来自之前已对基因MYBPC3,MHY7,TNNT2和TNNI3的全部编码外显子Sanger测序的20个样品的有效性库及使用PCR富集这些靶。将PCR产物连接,剪切及在GA2测序仪上在高覆盖度条件下测序。测序检测了之前通过Sanger测序检测的46个单-核苷酸变体的全部,包括在20个样品中的仅1个中杂合地存在的20种变体(singleton),展示该库中变体检测的高灵敏度(例如,在GA2上在高覆盖度条件下20个样品库)。尽管对于一些singleton,在自0.025的理论值偏离的库中检测的等位基因频度,以≥0.012,或理论值的一半的等位基因频度检测全部singleton。但是,以此等位基因-频度截止值,检测未通过Sanger测序发现的额外的82种变体,由此,对于64%的假-发现率(FDR),可能是假阳性。
[0184] 【实施例3:方法】
[0185] 【样品选择】
[0186] 从Autism Genetic Research Exchange(AGRE)收集库,基于下列包含标准得到来自患自闭症谱系障碍(ASD)的个体的DNA样品(n=290):由Autism Diagnostic Interview,修复的(ADI-R)和Autism Diagnostic Schedule(ADOS)的自闭症;特发性(即,非-综合征性)自闭症;至少一个受影响的家族成员;及RAVEN,Peobody和SRS的完全数据的利用的诊断。样品种族为白人,非西班牙人或拉丁美洲人,且一个种族不多于221名个体;白人,非西班牙人或拉丁美洲人,及一个种族多于11名个体;西班牙人或拉丁美洲人是53个体;及亚洲人是5名个体。从Coriell收集库得到300个对照DNA样品,及由高加索人或欧洲人种族是248个样品,西班牙人或拉丁美洲人种族是52个样品组成。
[0187] 【下一代测序】
[0188] 对于全部样品使用NANODROP分析系统测定DNA浓度,并将等同量的对照样品DNA合并入各20样品和15样品的
正交库。然后将各库作为用于各19种候选基因的最长异构体的全部编码外显子的使用5’端以含有Not1限制性位点的14bp序列结尾的特定PCR引物的PCR扩增的一个DNA模板。将源于相同的模板的全部PCR产物(即,样品库)合并,用Not1消化,及连接而形成多连体,其随后使用COVARIS S2仪器随机剪切为具有150~300bp的平均尺寸的片段。制备这些片段用于在ILLUMINA GA2(20-样品库)或HELICOS HELISCOPE(15-样品库)上根据制造商的使用说明测序。进行ILLUMINA测序50个循环,产生接近于50个碱基的读长,及进行HELISCOPE测序120个循环或30quad,产生约32个碱基的平均读长。
[0189] 【下一代测序数据的分析】
[0190] 将读取与包括在各侧“填补”30个侧接非-编码碱基的各扩增的外显子的源于hg18的序列的参照序列比对。将序列比对软件MOSAIK用于GA2读取,序列比对软件INDEXDP用于HELISCOPE读取。利用用于GA2读取的GIGABAYES,但不调用基于Bayesian的算法,及利用用于HELISCOPE读取的SNPSNIFFER进行变体判定。SNPSNIFFER需要1%的最小少数等位基因频度阈值。无最小少数等位基因频度阈值设置于GIGABAYES。在两种情况中,变体判定仅当它们在各DNA链出现至少一次时接受。在初始变体判定期间不使用其他滤器。
[0191] 【Sanger测序】
[0192] 对选择的基因区及选择的样品进行Sanger测序,以确认下一代测序期间检测的变体。PCR引物和条件与之前的相同,除了将个体样品用作模板代替样品库之外。然后将各PCR产物使用ABI BIGDYE
试剂,用作为测序引物的特定PCR引物循环-测序,及在ABI3730exl上分离测序产物。使用SEQUENCESCANNER(ABI)可视化测序踪迹,及通过与参照序列手工比较来测定给定突变的存在或缺失。
[0193] 已贯穿此公开参考和引用其他文献,诸如专利,专利申请,专利公开,期刊,书,论文,网页内容。全部该文献以全部目的通过引用整体并入本文。
[0194] 本发明和其许多进一步实施方式的各种修饰和相当体,除了本文显示及描述之外的那些,会由本领域技术人员从本文全部内容显而易见,包括对本文引用的科学和专利文献的参照。本文主题含有可适应于在其各种实施方式和其相当体中本发明的实践的信息,例示和引导。