首页 / 专利库 / 诊断设备和程序 / 免疫测定 / 免疫层析试验 / 妊娠试验 / 基于甲基化从母体样品中富集胎儿核酸的可用于无创性产前诊断的方法和组合物

基于甲基化从母体样品中富集胎儿核酸的可用于无创性产前诊断的方法和组合物

阅读:457发布:2020-06-14

专利汇可以提供基于甲基化从母体样品中富集胎儿核酸的可用于无创性产前诊断的方法和组合物专利检索,专利查询,专利分析的服务。并且提供利用在母体及其 胎儿 之间差异甲基化的基因组区以从母体样品分开、分离或富集胎儿核酸的组合物与方法。本文所述组合物与方法对于包括检查 染色 体非整倍性在内的无创性产前诊断特别有用。,下面是基于甲基化从母体样品中富集胎儿核酸的可用于无创性产前诊断的方法和组合物专利的具体信息内容。

1.一种制备胎儿核酸的方法,所述方法包括:
a)提供来自妊娠母本的样品;
b)根据胎儿核酸与母体核酸对应物间的差异甲基化状态将胎儿核酸与来自所述妊娠母本样品的母体核酸分离,其中所述胎儿核酸包含一种或多种SEQ ID NO:90-261所示多核苷酸序列的一个或多个CpG位点;以及
c)通过利用(b)部分中所分离的胎儿核酸为模板的方法来制备包含所述胎儿核酸的核酸。
2.如权利要求1所述的方法,其特征在于,所述胎儿核酸用特异性结合甲基化核苷酸的试剂从母体核酸分离。
3.如权利要求2所述的方法,其特征在于,所述能结合甲基化核苷酸的试剂是甲基-CpG结合蛋白(MBD)或其片段
4.如权利要求2所述的方法,其特征在于,所述能结合甲基化核苷酸的试剂结合甲基化胎儿核酸。
5.如权利要求2所述的方法,其特征在于,所述能结合甲基化核苷酸的试剂结合甲基化母体核酸。
6.如权利要求2所述的方法,其特征在于,所述胎儿核酸用特异性结合未甲基化核苷酸的试剂从母体核酸分离。
7.如权利要求1所述的方法,其特征在于,所述胎儿核酸用特异性消化未甲基化母体核酸的试剂从母体核酸分离。
8.如权利要求7所述的方法,其特征在于,所述特异性消化未甲基化母体核酸的试剂是甲基化敏感的限制性酶。
9.如权利要求8所述的方法,其特征在于,所述两种或更多种甲基化敏感的限制性酶用于同一反应。
10.如权利要求1所述的方法,其特征在于,所述步骤c)的方法是扩增反应。
11.如权利要求1所述的方法,其特征在于,所述步骤c)的方法用于确定胎儿核酸的绝对量。
12.如权利要求1所述的方法,其特征在于,制备SEQ ID NO:90-261中的3种或更多种多核苷酸序列。
13.一种确定母体样品中胎儿核酸的绝对量的方法,其中所述母体样品包含差异甲基化的母体和胎儿核酸,所述方法包括:
a)用一种或多种甲基化敏感的限制性酶消化母体样品中的母体核酸从而富集所述胎儿核酸,其中所述胎儿核酸包含一种或多种SEQ ID NO:90-261所示多核苷酸序列的一个或多个CpG位点;以及
b)采用不基于多态性且不基于亚硫酸氢盐的定量方法确定步骤a)中胎儿核酸的绝对量。
14.如权利要求13所述的方法,其特征在于,所述胎儿核酸的绝对量或浓度与诊断方法联用来确定胎儿性状,其中所述诊断方法需要给定的胎儿核酸绝对量或浓度以满足某些临床灵敏度或特异性要求。
15.一种确定母体样品中胎儿核酸的浓度的方法,其中所述母体样品包含差异甲基化的母体和胎儿核酸,所述方法包括:
a)确定母体样品中存在的核酸总量;
b)用甲基化敏感的限制性酶消化母体样品中的母体核酸从而富集所述胎儿核酸;
c)用不基于多态性且不基于亚硫酸氢盐的定量方法确定步骤b)的胎儿核酸量,其中所述胎儿核酸包含一种或多种SEQ ID NO:90-261所示多核苷酸序列的一个或多个CpG位点;以及
d)比较步骤c)的胎儿核酸量与步骤a)的核酸总量,从而确定母体样品中的胎儿核酸浓度。
16.如权利要求15所述的方法,其特征在于,所述胎儿核酸的绝对量或浓度与诊断方法联用来确定胎儿性状,其中所述诊断方法需要给定的胎儿核酸绝对量或浓度以满足某些临床灵敏度或特异性要求。
17.一种采用来自母体样品的胎儿核酸确定是否存在胎儿非整倍性的方法,其中所述母体样品包含差异甲基化的母体和胎儿核酸,所述方法包括:
a)用甲基化敏感的限制性酶消化母体样品中的母体核酸从而富集所述胎儿核酸;
b)用不基于多态性且不基于亚硫酸氢盐的定量方法确定来自靶染色体的胎儿核酸量,其中所述胎儿核酸包含一种或多种SEQ ID NO:164-261所示多核苷酸序列的一个或多个CpG位点;
c)用不基于多态性且不基于亚硫酸氢盐的定量方法确定来自参比染色体的胎儿核酸量,其中所述胎儿核酸包含一种或多种SEQ ID NO:90-163所示多核苷酸序列的一个或多个CpG位点;
d)比较步骤b)与步骤c)的胎儿核酸量,其中靶标与参比胎儿核酸之间的统计学显著差异表明存在胎儿非整倍性。
18.如权利要求17所述的方法,其特征在于,确定各靶染色体和参比染色体上在3-15个基因座的胎儿核酸的量。
19.如权利要求13、15或17所述的方法,其特征在于,确定所述甲基化敏感的限制性酶的消化效率。
20.如权利要求13、15或17所述的方法,其特征在于,所述用于进行所述定量的不基于多态性和不基于亚硫酸氢盐的方法利用基于竞争物的方法来确定胎儿核酸的量。
21.如权利要求13、15或17所述的方法,其特征在于,所述方法还包括确定母体样品中是否存在Y染色体核酸。
22.如权利要求21所述的方法,其特征在于,就雄性胎儿确定存在于母体样品中的Y染色体核酸量。
23.如权利要求22所述的方法,其特征在于,所述胎儿核酸的量与Y染色体核酸的量作比较。
24.如权利要求13或15所述的方法,其特征在于,确定2,3,4,5,6,7,8,9,10,15,20,
30,40,50或更多基因座的胎儿核酸量。
25.如权利要求13或17所述的方法,其特征在于,确定母体样品中存在的核酸总量。
26.如权利要求13、15或17所述的方法,其特征在于,确定核酸总量和雄性胎儿的Y染色体核酸量。
27.如权利要求13、15或17所述的方法,其特征在于,确定核酸总量,雄性胎儿的Y染色体核酸量,和甲基化敏感的限制性酶的消化效率。
28.如权利要求27所述的方法,其特征在于,两种或更多试验用于确定核酸总量,一种或多种试验用于确定雄性胎儿的Y染色体,一种或多种试验用于确定甲基化敏感的限制性酶的消化效率。
29.如权利要求28所述的方法,其特征在于,确定在3个或更多个基因座处的胎儿核酸量。
30.如权利要求13、15或17所述的方法,其特征在于,所述胎儿核酸的量通过扩增反应确定,所述扩增反应产生的扩增子大于所述经消化母体核酸的平均长度,从而进一步富集所述胎儿核酸。

说明书全文

基于甲基化从母体样品中富集胎儿核酸的可用于无创性产

前诊断的方法和组合物

[0001] 相关专利申请
[0002] 本专利申请是2009年9月16日所提交与本申请同名的美国专利申请第12/561,241号的部分继续申请,其代理人案卷号为SEQ-6022-UT,该申请要求2008年9
月16日所提交的美国临时专利申请第61/192,264号的权益,后者的代理人案卷号为
SEQ-6022-PV。上述专利申请的全部内容(包括所有文字、附图和表格)通过引用纳入本文。

技术领域

[0003] 本技术部分涉及产前诊断和富集方法。

背景技术

[0004] 无创性产前测试正成为关注度迅速提高的一个领域。包括妊娠期间的并发症和胎儿遗传缺陷在内的妊娠相关病症的早期检测至关重要,因为其允许进行对母婴安全所必需
的早期医学介入。已经通过例如绒膜绒毛取样(CVS)或羊膜穿刺术的方法用分离自胎儿的
细胞来进行产前诊断。但是,这些常规方法为侵入性,并对母婴都具有明显的险。国家卫生系统(National Health Service)目前引用的侵入性羊膜穿刺术和绒膜绒毛取样(CVS)
测试后的流产率为1-2%。
[0005] 在发现母体血浆和血清中可测得循环的无细胞胎儿核酸后,已开发这些侵入性方法的替代方法用于产前筛查,例如,检测胎儿异常(Lo等,Lancet 350:485-487,1997;和美国专利6,258,540)。循环的无细胞胎儿核酸(cffNA)具有多种优势,使其更适于无创性
产前测试。例如,无细胞核酸的存在平高于胎儿细胞,且浓度足以进行遗传分析。而且,cffNA在产后数小时内就从母体血流中清除,避免了此前妊娠的污染。
[0006] 通过检测母体血浆或血清中的胎儿DNA来进行产前诊断的示例包括胎儿恒河猴D(RhD)基因分型(Lo等,N.Engl.J.Med.339:1734-1738,1998),胎儿性别测定(Costa
等,N.Engl.J.Med.346:1502,2002)和多种胎儿疾病的诊断(Amicucci等,Clin.Chem.46:
301-302,2000;Saito 等,Lancet 356:1170,2000;和 Chiu 等,Lancet 360:998-1000,
2002)。此外,母体血浆/血清内胎儿DNA的定量异常已在先兆子痫(Lo等,Clin.Chem.45:
184-188,1999和Zhong等,Am.J.Obstet.Gynecol.184:414-419,2001),胎儿三体性21(Lo等,Clin.Chem.45:1747-1751,1999和Zhong等,Prenat.Diagn.20:795-798,2000)以及妊娠剧吐(Sekizawa等,Clin.Chem.47:2164-2165,2001)中有报道。
发明内容
[0007] 本发明提供了人表观遗传学生物标记等,可用于无创性检测胎儿遗传性状,包括但不限于:胎儿核酸的存在与否,胎儿核酸的绝对或相对量,胎儿性别,以及胎儿染色体异常如非整倍性。本发明所述人表观遗传学生物标记代表在胎儿与母体间显示差异CpG甲基
化模式的基因组DNA。本发明所述组合物与方法允许基于母体样品中核酸的甲基化状态来
检测并定量所述样品中的胎儿核酸。更具体地,可以相对于存在的核酸总量确定母体样品
中的胎儿核酸量,从而提供所述样品中胎儿核酸的百分数。而且,可以序列特异性(或基因座特异性)方式确定胎儿核酸的量,且灵敏度足以进行精确的染色体剂量分析(例如,用以
检测胎儿非整倍性的存在与否)。
[0008] 本发明的第一方面中,提供基于胎儿和母体核酸之间差异甲基化来从母体生物样品富集胎儿核酸的方法,所述方法包括以下步骤:(a)将来自某样品的靶核酸和来自所述
样品的对照核酸与甲基化特异性结合蛋白结合;以及(b)基于甲基化状态洗脱所结合的核
酸,其中差异甲基化核酸至少部分洗脱入单独的部分。在一种实施方式中,所述核酸序列
包括SEQ ID NO:1-261所示多核苷酸序列中的一种或多种。表4A-4C中提供SEQ ID NO:
1-261。本发明包括SEQ ID NO:1-261的序列及其变体。在一种实施方式中,步骤(a)不包
含对照核酸。
[0009] 在相关实施方式中,提供从母体样品中富集胎儿核酸的方法,所述方法包括以下步骤:(a)从女性获取生物样品;(b)基于样品中含CpG基因组序列的甲基化状态分离胎
儿和母体核酸,其中来自所述胎儿的基因组序列与来自所述女性的基因组序列为差异甲基
化,从而区分样品中来自所述女性的基因组序列和来自所述胎儿的基因组序列。在一种实
施方式中,所述基因组序列长度为至少15个核苷酸,包括至少一个胞嘧啶,而且其中所述
区域由以下组成(1)选自表1A-1C的基因组基因座;和(2)所述基因座上游和/或下游不
超过10kb的DNA序列。就本发明的这一方面和所有方面而言,从女性获取样品并非用以限
制本发明的范围。所述获取可以指从女性实际抽取样品(例如,采血)或从别处(例如,从
诊所或医院)接收样品并进行所述方法的其余步骤。
[0010] 在相关实施方式中,提供从母体样品中富集胎儿核酸的方法,所述方法包括以下步骤:(a)从女性获取生物样品;(b)基于样品中含CpG基因组序列的甲基化状态来消化或
去除母体核酸,其中来自胎儿的基因组序列与来自所述女性的基因组序列为差异甲基化,
从而富集样品中来自所述胎儿的基因组序列。可采用能根据核酸的甲基化状态选择性消
化或切割母体核酸的一种或多种甲基化敏感的限制性酶来消化母体核酸。在一种实施方
式中,所述基因组序列长度为至少15个核苷酸,包括至少一个胞嘧啶,而且其中所述区域
由以下组成(1)选自表1A-1C的基因组基因座;和(2)所述基因座上游和/或下游不超过
10kb的DNA序列。
[0011] 在本发明的第二方面,提供含胎儿核酸核苷酸序列的核酸制备方法,所述方法包括以下步骤:(a)提供来自妊娠母本的样品;(b)根据胎儿核酸与母体核酸对应物间的差异
甲基化状态将胎儿核酸与来自所述妊娠母本样品的母体核酸分离,其中所述胎儿核酸的核
苷酸序列在含有SEQ ID NO:1-261所示多核苷酸序列其一的基因或基因座的多核苷酸序列
内包括来自一种或多种SEQ ID NO:1-261所示多核苷酸序列的一个或多个CpG位点;以及
(c)通过利用(b)部分所分离胎儿核酸为模板的扩增方法来制备包含所述胎儿核酸核苷酸
序列的核酸。在一种实施方式中,提供含胎儿核酸核苷酸序列的核酸制备方法,所述方法包括以下步骤:(a)提供来自妊娠母本的样品;(b)根据胎儿核酸与母体核酸对应物间的差异
甲基化状态消化或去除所述妊娠母本样品中的母体核酸,其中所述胎儿核酸的核苷酸序列
在含有SEQ ID NO:1-261所示多核苷酸序列其一的基因的多核苷酸序列内包括一种或多种
SEQ ID NO:1-261所示多核苷酸序列的一个或多个CpG位点;以及(c)制备包含所述胎儿
核酸核苷酸序列的核酸。步骤(c)的制备方法可以是杂交方法、捕获方法或利用(b)部分
所分离胎儿核酸为模板的扩增方法。而且,在母体核酸被消化的上述实施方式中,可采用能根据核酸的甲基化状态选择性消化或切割母体核酸的一种或多种甲基化敏感的限制性酶
来消化母体核酸。在任一实施方式中,SEQ ID NO:1-261的多核苷酸序列可以在含有SEQ
ID NO:1-261所示多核苷酸序列其一的CpG岛的多核苷酸序列内。本文的表1-3中进一步
表征了SEQ ID NO:1-261所示多核苷酸序列,包括与SEQ ID NO:1-261中所提供多核苷酸
序列重叠的CpG岛的鉴定。在一种实施方式中,(c)部分所制备的核酸是在溶液中。在另
一实施方式中,所述方法还包括定量来自步骤(c)的扩增方法的胎儿核酸。
[0012] 在本发明的第三方面,提供从妊娠母本的样品中相对母体核酸富集胎儿核酸的方法,所述方法包括以下步骤:(a)提供来自妊娠母体的样品;和(b)根据胎儿核酸与母体核
酸对应物间的差异甲基化状态将胎儿核酸从所述妊娠母本样品的母体核酸相分离或捕获,
其中所述胎儿核酸的核苷酸序列在含有SEQ ID NO:1-261所示多核苷酸序列其一的基因的
多核苷酸序列内包括一种或多种SEQ ID NO:1-261所示多核苷酸序列的一个或多个CpG位
点。在一种实施方式中,SEQ ID NO:1-261的多核苷酸序列可以在含有SEQ ID NO:1-261
所示多核苷酸序列其一的CpG岛的多核苷酸序列内。本文的表1A-1C中表征了SEQ ID NO:
1-261的多核苷酸序列。在一种实施方式中,(b)部分所分离的核酸是在溶液中。在另一实
施方式中,所述方法还包括扩增和/或定量来自步骤(b)分离方法的胎儿核酸。
[0013] 在本发明的第四方面,提供包含来自妊娠母体的胎儿的分离核酸的组合物,其中所述核酸的核苷酸序列包含一种或多种SEQ ID NO:1-261所示多核苷酸序列。在一种实
施方式中,所述核苷酸序列基本由基因的核苷酸序列或其部分组成。在一种实施方式中,所述核苷酸序列基本由CpG岛的核苷酸序列或其部分组成。本文的表1A-1C中进一步表征了
SEQ ID NO:1-261的多核苷酸序列。在一种实施方式中,所述核酸是在溶液中。在一种实
施方式中,来自胎儿的核酸相对母体核酸得到富集。在一种实施方式中,所述组合物还包含结合甲基化核苷酸的试剂。例如,所述试剂可以是甲基-CpG结合蛋白(MBD)或其片段
[0014] 在本发明的第五方面,提供包含来自妊娠母体的胎儿的分离核酸的组合物,其中所述核酸的核苷酸序列在含有SEQ ID NO:1-261所示多核苷酸序列其一的基因或其部分的
多核苷酸序列内包括一种或多种SEQ ID NO:1-261所示多核苷酸序列的一个或多个CpG位
点。在一种实施方式中,所述核酸的核苷酸序列在含有SEQ ID NO:1-261所示多核苷酸序
列其一的CpG岛或其部分的多核苷酸序列内包括一种或多种SEQ ID NO:1-261所示多核苷
酸序列的一个或多个CpG位点。表1A-1C中进一步表征了SEQ ID NO:1-261的多核苷酸序
列。在一种实施方式中,所述核酸是在溶液中。在一种实施方式中,来自胎儿的核酸相对母体核酸得到富集。表1A-1C鉴定了本发明的高甲基化和低甲基化核酸序列。在一种实施方
式中,所述组合物还包含结合甲基化核苷酸的试剂。例如,所述试剂可以是甲基-CpG结合
蛋白(MBD)或其片段。
[0015] 在一些实施方式中,本发明的核苷酸序列包括3个或更多个CpG位点。在一种实施方式中,所述核苷酸序列包括5个或更多个CpG位点。在一种实施方式中,所述核苷酸序
列来自包含PRC2结构域的基因区(见表3)。在一种实施方式中,所述核苷酸序列来自参与
发育的基因区。例如,SOX14-本发明的一种表观遗传学标记物(见表1)-是参与调节胚胎
发育和确定细胞命运的转录因子SOX(SRY相关HMG盒)家族中的一员。
[0016] 在一些实施方式中,来自所述女性的基因组序列为甲基化而来自所述胎儿的基因组序列未甲基化。在其它实施方式中,来自所述女性的基因组序列未甲基化而来自所述胎
儿的基因组序列甲基化。在一种实施方式中,来自所述胎儿的基因组序列相对来自母亲的
基因组序列为高甲基化。SEQ ID NO:1-59,90-163,176,179,180,184,188,189,190,191,
193,195,198,199,200,201,202,203,205,206,207,208,209,210,211,212,213,214,221,
223,225,226,231,232,233,235,239,241,257,258,259和261中提供发现相对母体基因组序列为高甲基化的胎儿基因组序列。或者,来自所述胎儿的基因组序列相对来自母亲的基
因组序列为低甲基化。SEQ ID NO:60-85,164,165,166,167,168,169,170,171,172,173,
174,175,177,178,181,182,183,185,186,187,192,194,196,197,204,215,216,217,218,
219,220,222,224,227,228,229,230,234,236,237,238,240,242,243,244,245,246,247,
248,249,250,251,252,253,254,255,256和260中提供发现相对母体基因组序列为低甲基化的胎儿基因组序列。本发明所述甲基化敏感的限制性酶可以对低甲基化或高甲基化核酸
敏感。
[0017] 在一种实施方式中,所述胎儿核酸是胞外核酸。胞外胎儿核酸通常约为500,400,300,250,200或150(或其间的任意数值)个核苷酸基或更少。在一种实施方式中,经消
化的母体核酸少于约90,100,110,120,130,140或150个碱基对。在相关实施方式中,从经消化的母体核酸或相对其来基于大小选择性扩增、捕获或分离所述胎儿核酸。例如可设计
PCR引物来扩增超过约75,80,85,90,95,100,105,110,115或120(或其间任意数值)个碱基对的核酸,从而扩增胎儿核酸而不扩增经消化母体核酸。在一种实施方式中,所述核酸在进行本发明所述方法前经过片段化。核酸片段化方法的示例包括但不限于超声处理和限制
性酶消化。在一些实施方式中,所述胎儿核酸源自胎盘。在其它实施方式中,所述胎儿核酸是凋亡的。
[0018] 在一些实施方式中,本发明提供一种方法,其中所述样品是选自下组的一员:母体全血、母体血浆或血清、羊水、绒毛膜绒毛样品、移植前胚胎的活检材料、分离自母体血液的胎儿有核细胞或胎儿细胞残余物、母体尿液、母体唾液、母体生殖道清洗品和通过膜
间液抽取(celocentesis)或灌洗所得样品。在某些实施方式中,所述生物样品是母体
血液。在一些实施方式中,所述生物样品是绒膜绒毛样品。在某些实施方式中,所述母体
样品在进行本发明所述方法前就胎儿核酸经过富集。在PCT公开号WO/2007140417A2、
WO2009/032781A2和美国公开号20050164241中提供了胎儿富集方法的示例。
[0019] 在一些实施方式中,实施本发明所述方法前从样品中去除所有有核和无核的细胞群体。在一些实施方式中,以本领域普通技术人员已知能使样品中胎儿核酸的降解最小或
确保其品质的方式采集、保存或运输所述样品。
[0020] 所述样品可以来自任何动物,包括但不限于:人、非人、哺乳动物、爬行动物、、猫、狗、山羊、猪(swine)、小猪(pig)、猴、猿、猩猩、公牛、母牛、熊、绵羊家禽、小鼠、大鼠、鱼、海豚、鲸鱼和鲨鱼,或可具有可检测的妊娠相关疾病或染色体异常的任意动物或生物。
[0021] 在一些实施方式中,所述样品经差异修饰甲基化和未甲基化DNA的试剂处理。例如,所述试剂可包括亚硫酸盐;或者所述试剂可包括能优先切割甲基化DNA的一种或多种
酶;或者所述试剂可包括能优先切割未甲基化DNA的一种或多种酶。甲基化敏感的限制性
酶的示例包括但不限于HhaI和HpaII。
[0022] 在一种实施方式中,通过特异性结合胎儿核酸中甲基化核苷酸的试剂将所述胎儿核酸与母体核酸分离。在一种实施方式中,通过特异性结合母体核酸对应物中甲基化核苷
酸的试剂将所述胎儿核酸从母体核酸分离或移除。在一种实施方式中,能结合甲基化核苷
酸的所述试剂是甲基-CpG结合蛋白(MBD)或其片段。
[0023] 在本发明的第六方面,提供母体样品中胎儿DNA的含量或拷贝数的确定方法,所述样品中包含差异甲基化的母体和胎儿DNA。所述方法如下进行:a)根据差异甲基化状态
区分母体和胎儿DNA;和b)定量步骤a)中的胎儿DNA。在具体实施方式中,所述方法包括a)
用一种或多种甲基化敏感的限制性酶消化母体样品中的母体DNA从而富集所述胎儿DNA;
和b)确定来自步骤a)的胎儿DNA量。胎儿DNA的量可用来证实胎儿核酸的存在与否、确
定胎儿性别、诊断胎儿疾病或妊娠相关疾病等,或与其它胎儿诊断方法联用以改善灵敏度
或特异性。在一种实施方式中,所述确定胎儿DNA量的方法不需要使用多态性序列。例如,步骤b)中不采用等位基因比例来定量胎儿DNA。在一种实施方式中,所述确定胎儿DNA量
的方法不需要用亚硫酸氢盐处理DNA来将胞嘧啶残基转化为尿嘧啶。已知亚硫酸氢盐降解
DNA,因此进一步减少母体样品中本就有限存在的胎儿核酸。在一种实施方式中,通过以已知浓度引入一种或多种竞争剂来完成步骤b)中胎儿DNA量的确定。在一种实施方式中,通
过RT-PCR、引物延伸、测序或计数来完成步骤b)中胎儿DNA量的确定。在相关实施方式中,采用美国专利公开号US20070065823中所述的BEAMing技术确定核酸的量。在另一相关实
施方式中,采用美国专利公开号US20090029377(美国申请号12/178,181)中所述的枪测
序技术或其变形确定核酸的量。在一种实施方式中,确定限制性功效并用该效率比进一步
确定胎儿DNA的量。SEQ ID NO:1-261中提供了示例性差异甲基化核酸。
[0024] 在本发明的第七方面,提供确定母体样品中胎儿DNA浓度的方法,其中所述母体样品包含差异甲基化的母体和胎儿DNA,所述方法包括:a)确定所述母体样品中存在的DNA
总量;b)用一种或多种甲基化敏感的限制性酶选择性消化母体样品中的母体DNA从而富集
所述胎儿DNA;c)确定来自步骤b)的胎儿DNA量;以及d)比较步骤c)所得胎儿DNA的量
与步骤a)所得DNA的总量,从而确定母体样品中胎儿DNA的浓度。胎儿DNA的浓度可用
于和其它胎儿诊断方法联用来改善灵敏度或特异性等等。在一种实施方式中,所述确定胎
儿DNA量的方法不需要使用多态性序列。例如,步骤b)中不采用等位基因比例来定量胎儿
DNA。在一种实施方式中,所述确定胎儿DNA量的方法不需要用亚硫酸氢盐处理DNA来将胞
嘧啶残基转化为尿嘧啶。在一种实施方式中,通过以已知浓度引入一种或多种竞争剂来完
成步骤b)中胎儿DNA量的确定。在一种实施方式中,通过RT-PCR、测序或计数来完成步骤
b)中胎儿DNA量的确定。在一种实施方式中,测定限制性功效并用来进一步确定总DNA和
胎儿DNA的量。SEQ ID NO:1-261中提供了示例性差异甲基化核酸。
[0025] 在本发明的第八方面,提供采用来自母体样品的胎儿DNA来确定是否存在胎儿非整倍性的方法,其中所述母体样品包含差异甲基化的母体和胎儿DNA,所述方法包括:a)用一种或多种甲基化敏感的限制性酶选择性消化母体样品中的母体DNA从而富集所述胎儿
DNA;b)确定来自靶染色体的胎儿DNA量;c)确定来自参比染色体的胎儿DNA量;以及d)比
较步骤b)与步骤c)所得胎儿DNA的量,其中靶标与参比胎儿DNA量之间的生物学或统计
学显著性差异表明存在胎儿非整倍性。在一种实施方式中,所述确定胎儿DNA量的方法不
需要使用多态性序列。例如,步骤b)中不采用等位基因比例来定量胎儿DNA。在一种实施
方式中,所述确定胎儿DNA量的方法不需要用亚硫酸氢盐处理DNA来将胞嘧啶残基转化为
尿嘧啶。在一种实施方式中,通过以已知浓度引入一种或多种竞争剂来完成步骤b)和c)
中胎儿DNA量的确定。在一种实施方式中,通过RT-PCR、测序或计数来完成步骤b)和c)
中胎儿DNA量的确定。在一种实施方式中,比较步骤b)中所确定来自靶染色体的胎儿DNA
量与标准对照,例如来自整倍性妊娠的靶染色体的胎儿DNA量。在一种实施方式中,测定限制性功效并用来进一步确定来自靶染色体和来自参比染色体的胎儿DNA的量。SEQ ID NO:
1-261中提供了示例性差异甲基化核酸。
[0026] 本发明的第九方面,提供通过分析来自差异甲基化核酸样品的靶核酸与对照核酸的含量或拷贝数来检测是否存在染色体异常的方法,所述方法包括以下步骤:(a)根据甲
基化状态从某样品富集靶核酸以及来自所述样品的对照核酸;(b)在至少一种组分中进行
经富集靶核酸的拷贝数分析;(c)在至少一种组分中进行经富集对照核酸的拷贝数分析;
(d)比较步骤(b)所得拷贝数与步骤(c)所得拷贝数;以及(e)根据步骤(d)中的比较确
定是否存在染色体异常,其中所述靶核酸和对照核酸具有相同或基本相同的甲基化状态。
在相关实施方式中,提供通过分析来自差异甲基化核酸样品的靶核酸与对照核酸的含量或
拷贝数来检测是否存在染色体异常的方法,所述方法包括以下步骤:(a)将来自某样品的
靶核酸以及来自所述样品的对照核酸与结合剂结合;(b)根据甲基化状态洗脱所结合的核
酸,其中差异甲基化的核酸至少部分洗脱入不同组分;(c)在至少一种组分中进行已洗脱
靶核酸的拷贝数分析;(d)在至少一种组分中进行已洗脱对照核酸的拷贝数分析;(e)比较
步骤(c)所得拷贝数与步骤(d)所得拷贝数;以及(f)根据步骤(e)中的比较确定是否存在
染色体异常,其中所述靶核酸和对照核酸具有相同或基本相同的甲基化状态。SEQ ID NO:
1-261中提供差异甲基化核酸。
[0027] 本发明的第十方面,提供通过分析来自差异甲基化核酸样品的靶核酸与对照核酸的等位基因比例来检测是否存在染色体异常的方法,所述方法包括以下步骤:(a)将来自
某样品的靶核酸以及来自所述样品的对照核酸与结合剂结合;(b)根据甲基化状态洗脱所
结合的核酸,其中差异甲基化的核酸至少部分洗脱入不同组分;(c)在至少一种组分中进
行已洗脱靶核酸的等位基因比例分析;(d)在至少一种组分中进行已洗脱对照核酸的等位
基因比例分析;(e)比较步骤(c)所得等位基因比例与步骤(d)所得比例;以及(f)根据步
骤(e)中的比较确定是否存在染色体异常,其中所述靶核酸和对照核酸具有相同或基本相
同的甲基化状态。SEQ ID NO:1-261中提供差异甲基化核酸,而表2中提供所述差异甲基
化核酸内的SNP。所述方法还可用于检测妊娠相关疾病。
[0028] 在本发明的第十一方面,采用本发明所述基于甲基化的方法确定母体核酸的量。例如,可将胎儿核酸(例如,采用甲基化敏感的酶来消化)与样品中的母体核酸分离,且可
采用本发明所述方法定量所述母体核酸。一旦确定母体核酸的量,可将该量从样品中的核
酸总量中减去来确定胎儿核酸的量。如本文所述,胎儿核酸的量可用来检测胎儿性状,包括胎儿非整倍性。
[0029] 就本文所述本发明的所有方面和实施方式而言,所述方法还可用于检测妊娠相关疾病。在一些实施方式中,所述样品包含胎儿核酸,或者胎儿核酸与母体核酸。在所述样品包含胎儿与母体核酸的情况下,所述胎儿与母体核酸可具有不同的甲基化状态。具有差异
甲基化状态的核酸物质可用本领域已知的任意方法区分。在一种实施方式中,所述胎儿核
酸通过用甲基化敏感的限制性酶选择性消化母体核酸来富集。在一种实施方式中,所述胎
儿核酸通过在同一试验中用2种或更多种甲基化敏感的限制性酶选择性消化母体核酸来
富集。在一种实施方式中,所述靶核酸和对照核酸都来自所述胎儿。在一种实施方式中,所述胎儿核酸的平均大小为约100-500个碱基长度。在一种实施方式中,所述染色体异常是
非整倍性,例如三体性21。在一些实施方式中,所述靶核酸是可能异常的染色体的至少一部分,而对照核酸是极少异常的染色体的至少一部分。例如,当靶核酸来自染色体21时,对照核酸来自染色体21以外的染色体-优选另一常染色体。在一种实施方式中,所述结合剂是
甲基化特异性结合蛋白如MBD-Fc。而且所述经富集或洗脱的核酸用本领域已知的任意方法
扩增和/或定量。在一种实施方式中,所述胎儿DNA采用不需使用多态性序列的方法定量。
例如,不采用等位基因比例来定量胎儿DNA。在一种实施方式中,所述胎儿DNA量的定量方
法不需用亚硫酸氢盐处理DNA来将胞嘧啶残基转化为尿嘧啶。
[0030] 在一些实施方式中,本发明所述方法包括确定样品中一种或多种Y染色体特异性序列含量的额外步骤。在相关实施方式中,将采用本发明所述基于甲基化的方法所确定的
样品中胎儿核酸含量与所存在的Y染色体核酸含量作比较。
[0031] 用于根据甲基化状态区分核酸的方法,包括但不限于:甲基化敏感性捕获,例如采用MBD2-Fc片段;亚硫酸氢盐转化法,例如MSP(甲基化敏感的PCR),COBRA,甲基化敏感的TM
单核苷酸引物延伸(Ms-SNuPE)或塞昆纳姆股份有限公司(Sequenom)MassCLEAVE 技术;和
甲基化敏感的限制性酶的应用。除非明确指明,基于甲基化状态区分核酸的任何方法可与
本发明所述组合物和方法一起使用。
[0032] 在一些实施方式中,本发明所述方法还可包括扩增步骤。所述扩增步骤可用PCR如甲基化特异性PCR进行。在一种实施方式中,所述扩增反应在单分子上进行,例如通过数字PCR,其在美国专利号6,143,496和6,440,706中有进一步描述,这两篇专利在此通过引
用纳入。在其它实施方式中,所述方法不需要扩增。例如,可通过用流式细胞仪或无需扩增的测序手段对胎儿DNA(或其上连接的序列标签)计数而确定经富集胎儿DNA的量。在一
种实施方式中,胎儿DNA的量通过扩增反应确定,该扩增反应产生的扩增子大于经消化母
体核酸从而进一步富集所述胎儿核酸。
[0033] 在一些实施方式中,所述胎儿核酸(单独或与所述母体核酸联合)包括一种或多种检测部分。在一种实施方式中,所述检测部分可以是一种或多种复合体(compomer)、糖、肽、蛋白质抗体、化合物(例如,生物素)、质量标签(mass tag)(例如,金属离子或化学基团)、荧光标签、电荷标签(例如,如聚胺或带电染料)和疏水标签。在相关实施方式中,所述检测部分是由质谱检测的质量可区分产物(MDP)或MDP的部分。在具体实施方式中,所
述检测部分是由质谱检测的荧光标签或标记。在一些实施方式中,所述检测部分在检测寡
核苷酸5’末端,所述检测部分连接于检测寡核苷酸的非互补区,或者所述检测部分在非互补序列的5′末端。在某些实施方式中,所述检测部分纳入或连接内部核苷酸或检测寡核苷酸3’末端的核苷酸。在一些实施方式中,一种或多种检测部分单独或联合使用。参见例如美国专利申请US20080305479和US20090111712。在某些实施方式中,检测部分由限制性核
酸内切酶切割,例如美国申请号12/726,246中所述。在一些实施方式中,特定靶染色体标
记有特定检测部分且一个或多个非靶染色体标记有不同的检测部分,从而可比较靶染色体
的量和非靶染色体的量。
[0034] 就需要序列分析的实施方式而言,可采用以下任一测序技术:引物延伸法(例如,iPLEX 塞昆纳姆有限公司(Sequenom,Inc.))、直接DNA测序、限制性片段长度多态性(RFLP分析)、实时PCR,例如采用″STAR″(可升级转录分析程序)技术(见美国专利号
7,081,339)或其变形、等位基因特异性寡核苷酸(ASO)分析、甲基化特异性PCR(MSPCR)、
磷酸测序分析、无环引发(acycloprime)分析、反向斑点杂交,基因芯片(GeneChip)微
阵列、动态等位基因特异性杂交(DASH)、肽核酸(PNA)和定核酸(LNA)探针、TaqMan、分
子信标(Molecular Beacon)、嵌入染料、FRET引物、荧光标记dNTP/ddNTP、AlphaScreen、SNPstream、遗传位点分析(genetic bit analysis,GBA)、多重迷你测序、SNaPshot、GOOD测试、微阵列迷你测序(Microarray miniseq)、引物延伸芯片法(APEX)、微阵列引物延伸、标签阵列(Tag array)、编码微球(Coded microsphere)、模板定向掺入(TDI)、荧光极化、比色寡核苷酸连接测试(OLA)、序列编码OLA、微阵列连接、连接酶链反应、锁式探针(Padlock TM
probe)、侵入检测测试(Invader assay)、采用至少一种探针的杂交方法、采用至少一
种荧光标记探针的杂交方法、电泳、克隆与测序,例如在454平台(罗氏公司(Roche))
(Margulies,M.等,2005Nature 437,376-380)、Illumina基因组分析仪(或Solexa平
台)或SOLiD系统(应用生物系统公司(Applied Biosystems))上进行或用Helicos
True单分子DNA测序技术(Harris T D等,2008Science,320,106-109)、太平洋生物科学
公司(Pacific Biosciences)的单分子实时(SMRT.TM.)或基于纳米孔的测序(Soni GV
和Meller A.2007 Clin Chem 53:1996-2001),例如随着各碱基穿过样品孔底部的微孔采
用Ion Torrent离子传感器测定与DNA的各单独碱基关联的电荷,或用牛津纳米孔公司
(Oxford Nanopore)装置采用纳米孔测定与DNA的各单独单元关联的电荷,和其组合。基于
纳米孔的方法可包括采用纳米孔的核酸测序,或采用纳米孔的核酸分子计数,例如基于大
小,其中序列信息未确定。
[0035] 可确定一种或多种核酸的绝对拷贝数,例如,采用质谱,这是利用针对绝对拷贝数测定的竞争性PCR方法的系统。参见例如,Ding C,Cantor CR(2003)A high-throughputgene expression analysis technique using competitive PCR and matrix-assisted
laser desorption ionization time-of-flight MS.(采用竞争性PCR和基体辅助激光电
离飞行时间质谱法的高通量基因表达分析)Proc Natl Acad Sci U S A 100:3059-3064和
美国专利申请号10/655762,其公开为美国专利公开号20040081993,两者都通过引用纳入
本文。
[0036] 在一些实施方式中,基因组序列的量和标准对照作比较,其中比标准对照增加或减少表明妊娠相关疾病的存在或进展。例如,可将胎儿核酸的量与样品中存在的DNA总量
作比较。或者在检测是否存在胎儿非整倍性时,可将来自靶染色体的胎儿核酸量与来自参
比染色体的胎儿核酸量作比较。优选所述参比染色体是非整倍性率低的另一常染色体。靶
胎儿核酸与参比胎儿核酸的比例可以和来自正常的整倍体妊娠的同一比例作比较。例如,
可以从获自孕有健康胎儿的母体DNA样品确定对照比例,所述健康胎儿没有染色体异常。
优选采用对照样品组。已知某些染色体异常时,也可用表明特定疾病或病症的标准品。因
此,举例来说,为在妊娠女性的母体血浆中筛选3种不同的染色体非整倍性,优选采用对照DNA组,所述对照组分离自已知所孕胎儿含例如染色体13、18或21三体性的母亲,和所孕胎儿不含染色体异常的母亲。
[0037] 在一些实施方式中,本发明提供一种方法,其中来自靶核酸和对照核酸的等位基因由序列变化来区分。所述序列变化可以是单核苷酸多态性(SNP)或插入/缺失多态性。
在一种实施方式中,所述胎儿核酸应包含至少一种高频率杂合多态性(例如,约2%,3%,
4%,5%,6%,7%,8%,9%,10%,11%,12%,13%,14%,15%,16%,17%,18%,19%,
20%,25%或更高频率),这使得能确定所述核酸的等位基因比例以评估是否存在染色体异常。表2提供了示例性SNP列表,但这并不代表能用作本发明部分的多态性等位基因的完
全列表。也可考虑满足下列标准的任意SNP:(a)所述SNP的杂合频率大于约2%(优选覆
盖不同群体范围),(b)所述SNP是杂合基因座;以及(c)(i)所述SNP在本文所述的核酸序
列内,或(c)(iii)所述SNP在本文所述SNP的约5-2000个碱基对范围内(例如,在本文所
述SNP的约5,10,15,20,25,30,40,50,60,70,80,90,100,200,300,400,500,600,700,800,
900,1000,1250,1500,1750或2000个碱基对内)。
[0038] 在其它实施方式中,所述序列变化是短串联重复(STR)多态性。在一些实施方式中,所述序列变化落入限制性位点,从而一种等位基因易受限制性酶消化,而一种或多种其它等位基因则不易。在一些实施方式中,所述序列变化是甲基化位点。
[0039] 在一些实施方式中,进行等位基因比例分析,包括:通过从妊娠女性获取含核酸生物样品确定来自妊娠女性的胎儿的靶核酸和对照核酸的等位基因比例,其中所述生物样品含有胎儿核酸,基于差异甲基化将胎儿核酸部分或完全与母体核酸分离,区分来自靶核酸
与对照核酸的等位基因,然后确定等位基因的比例,并根据等位基因的比例来检测是否存
在染色体疾病,其中比例高于或低于正常整倍性比例表明有染色体疾病。在一种实施方式
中,所述靶核酸来自疑似非整倍性染色体(例如,染色体21),而对照核酸来自同一胎儿的
整倍性染色体。
[0040] 在一些实施方式中,本发明与其它胎儿标记物联用以检测多种染色体异常的存在与否,其中所述染色体异常选自下组:三体性21、三体性18和三体性13,或其组合。在一些实施方式中,所述染色体疾病涉及X染色体或Y染色体。
[0041] 在一些实施方式中,所述组合物或方法可在单个反应中多通路化。例如,可在基因组的多个基因座处确定胎儿核酸的量。或者当检测是否存在胎儿非整倍性时,可在一个或多个靶染色体(例如,染色体13、18或21)上和一个或多个参比染色体上的多个基因座处
确定胎儿核酸的量。若采用等位基因比例,则表2的一个或多个等位基因可进行检测并同
时区分。确定等位基因比例时,多通路实施方式在未知多态性基因座的基因型时特别重要。
在一些情况中,例如当母亲与胎儿在所述多态性基因座处为纯合时,该试验可能并不提供
信息。在一种实施方式中,超过1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,
25,30,35,40,50,100,200,300或500,以及任意中间水平的本发明所述核苷酸序列按本发明所述方法富集、分离和/或检查。通过分析靶核酸与对照核酸拷贝数来检测染色体异常
时,可能需要分析低于3,4,5,6,7,8,9,10,11,12,13或14种多核苷酸序列以精确检测是否存在染色体异常。在一种实施方式中,本发明的组合物或方法可用于试验已分为2,3,4,5,
6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,25,30,35,40,50,100或更多平行重复或分成单分子等价物的样品。美国申请号11/364,294中提供了在重复母体样品中分析胎儿核
酸的方法,包括单分子分析,该申请通过引用纳入本文。
[0042] 在进一步的实施方式中,本发明提供一种方法,其中的比较步骤显示,若等位基因的比例或靶核酸的绝对拷贝数比标准对照序列高或低1个标准差则胎儿具有染色体疾病的风险提高。在一些实施方式中,所述比较步骤显示,若等位基因的比例或靶核酸的绝对拷贝数比标准对照序列高或低2个标准差则胎儿具有染色体疾病的风险提高。在另一些实施
方式中,所述比较步骤显示,若等位基因的比例或靶核酸的绝对拷贝数比标准对照序列高
或低3个标准差则胎儿具有染色体疾病的风险提高。在一些实施方式中,所述比较步骤显
示,若等位基因的比例或靶核酸的绝对拷贝数高于或低于与对照的统计学显著标准差则胎
儿具有染色体疾病的风险提高。在一种实施方式中,所述标准对照是母体参比,而在一种实施方式中,所述标准对照是胎儿参比染色体(例如,非三体性常染色体)。
[0043] 在一些实施方式中,本发明所述方法可与其它方法联用以诊断染色体异常。例如,无创性诊断方法可能需要验证是否存在胎儿核酸,例如对雌性胎儿的性别测试或者验
证RhD阴性母亲内的RhD阴性雌性胎儿。在一种实施方式中,本发明所述组合物与方法
可用于确定母体样品中的胎儿核酸百分数,从而能够进行另一需要已知胎儿核酸百分数
的诊断方法。例如,样品是否满足某些阈浓度要求?确定等位基因比例以从母体样品诊
断胎儿非整倍性时,可能需要胎儿核酸的量或浓度以进行具有给定灵敏度和特异性的诊
断。在其它实施方式中,用于检测染色体异常的本发明所述组合物和方法可与其它已知
方法联用从而改善所述检测方法的总体灵敏度和特异性。例如,数学模型已提示,孕早
期(first-trimester)组合筛查项目利用母亲年龄(MA),颈部透明带(NT)厚度,无血清
β-hCG,和血清PAPP-A能以5%的侵入性测试率检测超过80%的唐氏综合征胎儿(Wald和
Hackshaw,Prenat Diagn 17(9):921-9(1997))。但是,常用的非整倍性检测方法与本文所述基于游离胎儿核酸的无创性方法的组合可提供改善的准确度和降低的假阴性率。PCT公
开号WO2008157264A2(指定给本申请人)中提供联合诊断方法的示例,其通过引用纳入本
文。在一些实施方式中,本发明所述方法可与基于细胞的方法联用,其中胎儿细胞可以侵入性或非侵入性获得。
[0044] 在某些实施方式中,染色体异常风险提高是基于本文提供的组合物或方法所得的后果或结果。后果的一种示例是偏离整倍性绝对拷贝数或等位基因比例,这表明存在染色
体非整倍性。绝对拷贝数或比例偏离标准对照的这种提高或降低表明具有染色体异常(例
如,三体性21)胎儿的风险提高。举例来说,涉及本文所述方法的信息,例如后果、结果或三体性或非整倍性风险,可以固定、重现、记录和/或显示在任意适当介质中。例如,可将后果固定在介质中以保存、存放、共享、交流或另行分析所述后果。所述介质可以是有形的(例如,纸张)或无形的(例如,电子介质),且介质示例包括但不限于:计算机介质、数据库、图表、病例表、记录、患者记录、图和表、以及其它任意表达介质。所述信息有时以计算机可读形式保存和/或重现,且有时保存并组编在数据库中。在某些实施方式中,所述信息可以用物理介质(例如,纸张)或计算机可读介质(例如,光学和/或磁性保存或传递介质,软盘
硬盘,随机存取存储器,中央处理单元,传真信号卫星信号,通过因特网(internet)传递或通过万维网(world-wide web)传递)从一个位置转移到另一位置。
[0045] 在上述所有方面的本发明实施中,一些情况中CpG岛可用作含CpG的基因组序列,而另一些情况中所述含CpG的基因组序列可能不是CpG岛。
[0046] 在一些实施方式中,本发明提供用以进行本发明所述方法的试剂盒。所述试剂盒的一种组分是甲基化敏感的结合剂。

附图说明

[0047] 图1:显示用于分离差异甲基化DNA的重组MBD-Fc蛋白的设计。
[0048] 图2:显示甲基-CpG-结合、抗体样蛋白对其″抗原″具有高亲和性与高亲合,所述″抗原″优选为在CpG二核苷酸处甲基化的DNA。
[0049] 图3:显示MBD-FC的甲基结合域结合所有DNA分子,无论其甲基化状态如何。这一蛋白/DNA相互作用的强度由DNA甲基化水平限定。结合基因组DNA后,可用盐浓度递增
的洗脱溶液分离未甲基化和甲基化DNA,从而能受控分离。
[0050] 图4:显示利用重组MBD-Fc蛋白和微阵列鉴定来自胎儿和母亲的差异甲基化DNA的实验。
[0051] 图5:显示Sequenom EpiTYPERTM方法产生的典型结果,用以验证图4所示实验所产生的结果。
[0052] 图6:显示源自微阵列分析的对数比(x轴)和EpiTYPER分析所得甲基化差异(y轴)间的相关性。各数据点代表所有测试样品的一个区域的均值。微阵列分析本质是比较
性的,因为母体DNA的高度甲基化部分与胎盘DNA的高度甲基化部分一起杂交。正值表明
胎盘样品的甲基化更高。在质谱中,各样品单独测定。我们首先通过从胎盘甲基化值减去
母体甲基化值来计算甲基化的差异。为将结果与微阵列数据作比较,我们就所有母体/胎
盘DNA对计算差异的均值。
[0053] 图8:显示预期的gDNA分子数和竞争性PCR联用质谱分析测定的分子数之间的相关性。该实验中采用全血(黑色+标志)和市售可得的全甲基化DNA(红色×)以90对10
比例衍生的DNA。我们采用MBD-FC融合蛋白分离DNA的未甲基化和甲基化部分。各组分
经过竞争性PCR分析采用质谱读取。此前已就拷贝数变化的分析描述该方法,并已可市售
获得用于基因表达分析。该方法允许借助已知浓度的合成寡核苷酸进行DNA分子的绝对定
量。该实验中,我们靶向MGMT基因座,其在本文所用全血样品中未甲基化。采用300个总
gDNA拷贝的输入,我们预期发现270拷贝的未甲基化DNA和30拷贝的甲基化DNA。测得的
拷贝数大致符合预期值。在600拷贝输入DNA的数据点表明反应中的偏好,并显示在所述
试验可采用前该初始概念论证实验需要续以更多的开发工作。但是,这一初始数据表明该
方法在过量未甲基化DNA物质存在时捕获和定量少量甲基化DNA拷贝的可行性。
[0054] 图9A-9C:按基因组位置显示微阵列分析(深色柱)和质谱分析(浅灰色柱)所得的甲基化差异柱状图。对微阵列鉴定为差异甲基化的85个区域各提供单独作图。各图
的x轴显示该区的染色体位置。Y轴显示对数比(在微阵列情况中)和甲基化差异(在质
谱结果情况中)。就微阵列而言,区域内的各杂交探针显示为单个黑色(或深灰色)柱。就
质谱结果而言,各CpG位点显示为浅灰色柱。显示数值大于0的柱表明胎盘样品中的甲基
化比母体DNA中高。就一些基因而言,差异小(即,RB1或DSCR6)但仍在统计上显著。那
些区域会较不适于胎儿DNA富集策略。
[0055] 图10:显示胎儿定量方法的一种实施方式。母体核酸被选择性消化,剩余的胎儿核酸采用已知浓度的竞争物来定量。该方案中,分离所述分析物并用质谱仪定量。
[0056] 图11:显示基于甲基化的胎儿诊断方法的一种实施方式。母体核酸被选择性消化,就3种不同染色体(13、18和21)定量剩余的胎儿核酸。该图的2和3部分显示消化前
与消化后样品中的核酸大小分布。扩增反应可用是大小特异性的(例如,超过100个碱基
对的扩增子),使得它们倾向于更长的未消化胎儿核酸而非经消化的母体核酸,从而进一步富集胎儿核酸。该图底部的谱图显示胎儿核酸染色体21量提高,指示三体性21。
[0057] 图12:显示分离自非妊娠女性血液的4种不同DNA样品的可扩增基因组拷贝总数。各样品稀释至每个反应约含2500、1250、625或313拷贝。通过获取两种总拷贝数试验
(表X中的ALB和RNAseP)所得平均DNA/竞争物比例来完成各测定。如图12所示,总拷贝
数在不同样品中准确且稳定,从而证实基于竞争物的方案的可用性。
[0058] 图13A和B:产生含恒定数量母体未甲基化DNA和加有变化量雄性胎盘甲基化DNA的模式系统。样品掺有雄性胎盘的量相对母体未甲基化DNA的范围在约0-25%。采用甲
基化试验(图13A)和Y染色体标记物(图13B)与总拷贝数试验相比所得的比例计算胎盘
DNA占比。表X中提供甲基化和Y染色体标记物。
[0059] 图14A和B:显示血浆样品总拷贝数试验的结果。图14A中,显示各样品的拷贝数。两个样品(编号25和26)具有的总拷贝数显著高于所有其它样品。获得均值约每毫升血
浆1300个可扩增拷贝(766-2055范围)。图14B显示给定数值的盒须图来概括结果。
[0060] 图15A和B:绘制采自孕有男性胎儿的妊娠女性的33个不同血浆样品的胎儿核酸量(或拷贝数)。所得拷贝数采用甲基化标记物和Y染色体特异性标记物用表X中提供的
试验计算得到。由图15B可见,给定数值的盒须图表明两种不同测定间的最小差异,从而证实所述方法的准确性和稳定性
[0061] 图16:显示图15A中采用甲基化标记物与Y染色体标记物所得结果之间的配对相关性。
[0062] 图17:显示限制性酶的消化效率,采用对照与竞争物的消化率并将该值与总拷贝数试验均值比较。除样品26外,所有反应的效率都超过约99%。
[0063] 图18:提供用于采用针对雄性妊娠的Y染色体特异性标记物和针对所有妊娠(不管胎儿性别)的甲基化占比均值计算样品中胎儿DNA占比(或浓度)的具体方法。
[0064] 图19:提供用于计算无Y染色体特异性标记物样品中胎儿DNA占比(或浓度)的具体方法。相反,仅采用甲基化定量试验确定胎儿DNA的浓度。
[0065] 图20:显示对采用本发明所述方法的模拟三体性21诊断的t检验的检定力计算。该图显示x轴上的变异系数(CV)与采用简单t检验区分试验群体的检定力(y轴)间的关
系。数据表明,假如CV等于或低于5%,所有情况中有99%能以0.001的显著性水平区分
两种群体(整倍体与非整倍体)。
[0066] 定义
[0067] 本申请所用术语″妊娠相关疾病″指可能影响妊娠女性、胎儿或同时影响所述女性与胎儿的任何病症或疾病。此类病症或疾病的症状可在有限时间段内显现,例如在
妊娠或分娩时,或者可在胎儿出生后持续其整个生命期。妊娠相关疾病的一些示例包括
异位妊娠、先兆子痫、未足月产、RhD不相容性、胎儿染色体异常如三体性21和遗传学上
遗传的胎儿疾病如胰囊性纤维变性、β-地中海贫血或其它单基因病。本文所述组合物
和方法特别可用于母体血浆/血清内胎儿DNA的定量异常相关的妊娠相关疾病的诊断、
预后和监控,所述疾病包括但不限于先兆子痫(Lo等,Clin.Chem.45:184-188,1999和
Zhong等,Am.J.Obstet.Gynecol.184:414-419,2001),胎儿三体性(Lo等,Clin.Chem.45:
1747-1751,1999和Zhong等,Prenat.Diagn.20:795-798,2000)以及妊娠剧吐(Sekizawa
等,Clin.Chem.47:2164-2165,2001)。例如,母体血液中胎儿核酸水平升高(与正常妊娠相比)可表明先兆子痫性妊娠。此外,可证明从母体样品富集胎儿核酸的能力对常染色体
隐性疾病的无创性产前诊断尤为有用,例如当母亲和父亲都有同一引发疾病的突变的情况
时,该情形此前视为基于母体血浆的非三体性产前诊断的难点。
[0068] 本文所用术语″染色体遗传″或″非整倍性″指对象染色体与正常同源染色体的结构之间的偏差。术语″正常″指特定物种健康个体中所见的支配性核型或带型,例如
整倍体基因组(人中的46XX或46XY)。染色体异常可以是数量上或结构上的,包括但不限
于非整倍性,多倍性,倒反,三体性,单体性,重复,缺失,缺失某染色体的部分,添加,添加某染色体的部分,插入,某染色体的片段,某染色体的区段,染色体重排和易位。染色体异常还可指染色体异常的状态,其中一条或多条染色体的部分由于如染色体易位而并非常规单倍
体的确切倍数。染色体易位(例如,染色体21和14间的易位,其中第14染色体的一些部
分被额外的第21染色体取代)可导致部分三体性21。染色体异常可与某病理状况的存在
或发生某病理状况的易感性相关。染色体异常可通过核酸的定量分析测定。
[0069] 术语“核酸”和“核酸分子”在本文中可互换使用。该术语指任意组合物的核酸,来自如:DNA(例如,互补DNA(cDNA),基因组DNA(gDNA)等),RNA(例如,信使RNA(mRNA),短抑制RNA(siRNA),核糖体RNA(rRNA),tRNA,微小RNA,胎儿或胎盘高度表达的RNA等),和/或DNA或RNA类似物(例如,含有碱基类似物,糖类似物和/或非天然主链等),RNA/DNA杂交体和聚酰胺核酸(PNA),所有这些可以是单链或双链形式,且除非另有限定,可涵盖能以与天然存在核苷酸相似方式起作用的天然核苷酸的已知类似物。例如,SEQ ID NO:1-261(见表4A-4C)中提供的核酸可以是能用于进行本文所述方法的任意形式(例如,线性、环状、超螺旋、单链、双链等)或可包括不改变其作为本发明部分的用途的变体(例如,插入、缺失或取代)。在某些实施方式中,核酸可以是或者可来自,质粒、噬菌体、自主复制序列(ARS)、着丝粒、人工染色体、染色体或能够在体外或者在宿主细胞、细胞、细胞的细胞核或细胞质中复制或被复制的其它核酸。在一些实施方式中,模板核酸可来自单个染色体(例如核酸样
品可来自二倍体生物所得样品的一个染色体)。除非明确限定,该术语涵盖含有结合特性
与参比核酸类似且与以与天然存在核苷酸相似方式代谢的天然核苷酸的已知类似物。除非
另有说明,具体核酸序列也包括其保守修饰变体(如,简并密码子取代),等位基因,直向同源物,单核苷酸多态性(SNP)和互补序列,以及明确指出的序列。具体地,可通过产生一个或多个选定(或所有)密码子的第三位置被混合碱基和/或脱肌苷残基取代的序列来获
得简并密码子取代(Batzer等,Nucleic Acid Res.19:5081(1991);Ohtsuka等,J.Biol.
Chem.260:2605-2608(1985);和Rossolini等,Mol.Cell.Probes 8:91-98(1994))。术语核酸与基因座、基因、cDNA、基因编码的mRNA互换使用。该术语也可包括从核苷酸类似物,单链(″有义″或″反义″,″正″链或″负″链,″正向″读框或″反向″读框)和双
链多核苷酸合成的RNA或DNA等价物、衍生物、变体和类似物。脱氧核糖核苷酸包括脱氧腺
苷、脱氧胞苷、脱氧鸟苷和脱氧胸苷。对于RNA,碱基胞嘧啶替换为尿嘧啶。模板核酸可采用获自对象的核酸作为模板制备。
[0070] 本文所用“含一个或多个CpG位点的核酸”或″含CpG的基因组序列″指个体如人胎儿或妊娠女性基因组内指定位置处DNA序列的区段。通常,″含CpG的基因组序列″
至少长15个核苷酸,且含有至少一个胞嘧啶。优选它可以长至少30、50、80、100、150、200、
250或300个核苷酸且含有至少2、5、10、15、20、25或30个胞嘧啶。对于给定位置处如以
给定遗传基因座为中心的区域内的任意″含CpG的基因组序列″(见表lA-1C),核苷酸序
列变化可在个体间存在且甚至就同一个体而言还可在等位基因间存在。通常,这种以给定
遗传基因座(例如,CpG岛)为中心的区域含有所述基因座以及上游和/或下游序列。所
述上游或下游序列(分别从所述遗传基因座的5′或3′边界计数)可以各自长达10kb,
在其它情况中可以长达5kb、2kb、1kb、500bp、200bp或100bp。此外,″含CpG的基因组序列″可涵盖转录或未转录用于蛋白生成的核苷酸序列,且所述核苷酸序列可以是基因间序
列,基因内序列,蛋白编码序列,非蛋白编码序列(例如,例如转录启动子),或其组合。
[0071] 本文所用的“甲基化核苷酸”或″甲基化核苷酸碱基″指核苷酸碱基上存在甲基部分,其中所述甲基部分不存在于公认的典型核苷酸碱基中。例如,胞嘧啶在其嘧啶环上不含甲基部分,但5-甲基胞嘧啶在其嘧啶环的位置5处含有甲基部分。因此,胞嘧啶不是甲
基化核苷酸而5-甲基胞嘧啶是甲基化核苷酸。在另一示例中,胸腺嘧啶在其嘧啶环的位
置5处含有甲基部分,但就本文目的而言,胸腺嘧啶存在于DNA中时不视为甲基化核苷酸,
因为胸腺嘧啶是DNA的典型核苷酸碱基。DNA的典型核苷酸碱基是胸腺嘧啶、腺嘌呤、胞嘧
啶、鸟嘌呤。RNA的典型碱基是尿嘧啶、腺嘌呤、胞嘧啶、鸟嘌呤。相应地,″甲基化位点″是靶基因核酸区域中发生或可能发生甲基化的位置。例如,含有CpG的位置是甲基化位点,其中的胞嘧啶可以被或未被甲基化。
[0072] 如本文所用,“CpG位点”或″甲基化位点″是核酸内易被体内天然发生事件或设立用于化学甲基化核苷酸的体外事件所甲基化的核苷酸。
[0073] 如本文所用,“甲基化核酸分子”指含有一个或多个已甲基化的甲基化核苷酸的核酸分子。
[0074] 本文所用的″CpG岛″描述含有功能性或结构性偏差CpG密度的DNA序列区段例如,Yamada等(Genome Research 14:247-266,2004)描述了用于确定CpG岛的标准品组:
其必须至少长400个核苷酸,GC含量大于50%,且OCF/ECF比例大于0.6。他人(Takai等,
Proc.Natl.Acad.Sci.U.S.A.99:3740-3745,2002)定义了较不严紧的的CpG岛,序列长度
至少为200个核苷酸,GC含量大于50%,且OCF/ECF比例大于0.6。
[0075] 本文所用术语″表观遗传学状态″或″表格遗传学状况″指核酸(例如,DNA或RNA)在一级核苷酸序列外的分子水平上的任何结构特征。例如,基因组DNA的表观遗传学
状态可包括例如由其甲基化模式或其与细胞蛋白的关联性所决定或影响的二级或三级结
构。
[0076] 本文所用的术语″甲基化概况″“甲基化状态”或″甲基化状况″描述基因组序列的甲基化状态,指DNA区段在特定基因组基因座处与甲基化相关的特征。此类特征包括
但不限于:该DNA序列内的任意胞嘧啶(C)残基是否被甲基化,甲基化C残基的位置,在任
意特定残基延伸段的甲基化C百分数,和甲基化中的等位基因差异,例如由于等位基因的
来源差异造成。术语″甲基化情况″或″甲基化状况″还指生物样品中残基的任意特定
延伸段的甲基化C或未甲基化C的相对或绝对浓度。例如,若DNA序列内的胞嘧啶(C)残
基已甲基化,其可称作“高甲基化”;而若DNA序列内的胞嘧啶(C)残基未甲基化,其可称作“低甲基化”。同样,若DNA序列(例如,胎儿核酸)内的胞嘧啶(C)残基与来自不同区域或
来自不同个体(例如相对母体核酸)的另一序列相比已甲基化,该序列与所述其它序列相
比视为高甲基化。或者,若DNA序列内的胞嘧啶(C)残基与来自不同区域或来自不同个体
(例如,母亲)的另一序列相比未甲基化,该序列与所述其它序列相比视为低甲基化。这些
序列表述为“差异甲基化”,且更具体地,当母亲和胎儿之间的甲基化状态不同时,所述序列视为“差异甲基化的母体和胎儿核酸”。
[0077] 本文所用的术语“结合甲基化核苷酸的试剂”指能结合甲基化核酸的物质。所述试剂可以是天然产生的或者是合成的,并可经过修饰或未经修饰。在一种实施方式中,所述试剂能根据各自甲基化状态分离不同核酸物质。PCT专利申请号PCT/EP2005/012707中描述了能结合甲基化核苷酸的试剂的示例,该申请公开为WO06056480A2并在此通过引用纳入。
所述试剂是双功能多肽,包含属于甲基-CpG结合蛋白(MBD)家族的某蛋白质的DNA结合域
和某抗体的Fc部分(见图1)。该重组甲基-CpG-结合的抗体样蛋白质可以抗体样方式优
先结合CpG甲基化DNA。这意味着所述甲基-CpG-结合的抗体样蛋白对其″抗原″具有高
亲和性与高亲合力,所述″抗原″优选为在CpG二核苷酸处甲基化的DNA。所述试剂还可以
是多价MBD(见图2)。
[0078] 本文所用的术语“多态性”指同一基因组序列的不同等位基因内的序列变化。含有多态性的序列视为“多态性序列”。一种或多种多态性的检测可区分单个基因组序列或两个或更多个体间的不同等位基因。本文所用的术语″多态性标记物″或“多态性序列”指
在个体间DNA序列内显示可遗传变化的DNA基因组的区段。这些标记物包括但不限于,单
核苷酸多态性(SNP),限制性片段长度多态性(RFLP),短串联重复(STR),例如二-,三-或
四-核苷酸重复,等等。本发明所述多态性标记物可用于特异性区分经富集胎儿核酸样品
中的母本与父本等位基因。
[0079] 本文所用的术语″单核苷酸多态性″或″SNP″指同一基因组序列的不同等位基因内的单个核苷酸残基处存在的多核苷酸序列变化。若在蛋白质生成中转录基因组序列,
该变化可发生在所述基因组序列的编码区或非编码区内(即,在启动子或内含子区域内)。
一种或多种SNP的检测可区分单个基因组序列或两个或更多个体间的不同等位基因。
[0080] 本文所用的术语″等位基因″是在染色体上占据同一位置的基因或DNA非编码区的多种替代形式之一。术语等位基因可用于描述来自任何生物的DNA,所述生物包括但不限于细菌、病毒、真菌原生动物、霉菌、酵母植物、人、非人、动物和古生菌。
[0081] 本文所用术语″等位基因的比例″或“等位基因比”指样品中一种等位基因群与其它等位基因群的比例。在一些三体性情况中,可能就特定基因座而言胎儿可以是三重等
位基因的。在此类情况中,术语″等位基因的比例″指任一种等位基因群与其它等位基因
中一种,或与另两种等位基因的比例。
[0082] 本文所用的术语“不基于多态性的定量方法”指用于确定分析物(例如,总核酸,Y染色体核酸或胎儿核酸)的量的方法不需要利用多态性标记物或序列。尽管多态性可能存在于序列中,定量所述序列不需要所述多态性。不基于多态性的定量方法的示例包括但不
限于:RT-PCR,数字PCR,基于阵列的方法,测序方法,基于纳米孔的方法,基于核酸结合珠的计数方法和基于竞争物的方法,其中以已知浓度引入一种或多种竞争物来确定一种或多
种分析物的量。在一些实施方式中,上述示例性方法中的一些(例如,测序)可能需要活性
修饰或设计从而不需要测定一种或多种多态性。
[0083] 本文所用的术语“绝对量”或“拷贝数”指分析物(例如,总核酸或胎儿核酸)的含量或数量。本发明提供用于确定在混合母体样品中胎儿核酸的绝对量的组合物和方法。
绝对量或拷贝数代表可检测的分子数,并可表示为每单位的基因组等价物。术语“浓度”指混合物或溶液中某物质的含量或比例(例如,含有母体与胎儿核酸混合物的母体样品中的
胎儿核酸量)。所述浓度可表示为百分数,其用于以百分率来表示一种量相对另一量有多大/多小。用于测定分析物(例如,靶核酸)的量或含量的平台包括但不限于质谱、数字PCR、
用合成平台的测序(例如,焦磷酸测序)、荧光光谱和流式细胞术。
[0084] 本文所用的术语“样品”指含有核酸的样品。样品的示例包括但不限于:组织,体液(例如,血液、血清、血浆、唾液、尿液、泪液、腹膜液、腹水液、阴道分泌物、乳腺体液、乳汁、淋巴液、脑脊髓液或粘膜分泌物),脐带血,绒毛,羊膜液,胚胎,双细胞胚,4细胞胚,8细胞胚,16细胞胚,32细胞胚,64细胞胚,128细胞胚,256细胞胚,512细胞胚,1024细胞胚,胚胎组织,淋巴液,脑脊髓液,粘膜分泌物或其它身体渗出物,粪便物质,个体细胞,或含有相同核酸的此类来源的提取物,和亚细胞结构如线粒体,采用本领域充分确立的方法。
[0085] 可获得胎儿DNA的来源包括但不限于:母体血液、母体血清、母体血浆、胎儿细胞、脐带血、绒毛、羊水、尿液、唾液、肺灌洗、细胞或组织。
[0086] 本文所用的术语″血液″指来自妊娠女性或就可能妊娠而作测试女性的血液样品或制品。该术语涵盖全血或血液的任何部分,例如常规定义的血清和血浆。
[0087] 本文所用的术语″亚硫酸氢盐″涵盖所有类型的亚硫酸氢盐,例如亚硫酸氢钠,其能将胞嘧啶(C)化学转化成尿嘧啶(U)而不化学修饰甲基化胞嘧啶,因而能用于根据DNA
的甲基化状态差异性修饰DNA序列。
[0088] 如本文所用,″差异修饰″甲基化或未甲基化DNA的试剂涵盖能在某过程中修饰甲基化和/或未甲基化DNA的任何试剂,通过该过程从甲基化和未甲基化DNA产生可区分
的产物,从而能够鉴定DNA甲基化状态。此类过程可包括但不限于:化学反应(例如,通过
亚硫酸氢盐的C至U转化(C.fwdarw.U))和酶处理(例如,用甲基化依赖性核酸内切酶切
割)。因此,能优先切割或消化甲基化DNA的酶是能在DNA甲基化时以高得多的效率切割或
消化DNA分子的一种酶,而能优先切割或消化未甲基化DNA的酶能在DNA未甲基化时显示
明显更高的效率。
[0089] 本文所用术语“不基于亚硫酸氢盐的方法”和“不基于亚硫酸氢盐的定量方法”指用于无需使用亚硫酸氢盐来定量甲基化或未甲基化核酸的任意方法。该术语还指无需亚硫酸氢盐处理即进行定量的核酸的制备方法。不基于亚硫酸氢盐的方法的示例包括但不限
于:用一种或多种甲基化敏感的酶消化核酸的方法和用根据甲基化状态结合核酸的试剂分
离核酸的方法。
[0090] 术语″甲基敏感的酶”和“甲基化敏感的限制性酶”是就活性而言取决于其DNA识别位点甲基化状态的DNA限制性内切酶。例如,有甲基敏感的酶仅在其DNA识别序列未甲基化时进行切割或消化。因此,与甲基化DNA样品相比,未甲基化DNA样品将被切成更小片
段。类似地,高甲基化DNA样品不被切割。相反,有甲基敏感的酶仅在其DNA识别序列甲基
化时进行切割。本文所用的术语“切割”,″剪切″和“消化”可以互换使用。
[0091] 本文所用的术语“靶核酸”指采用本文所述方法检查以确定所述核酸是否为妊娠相关疾病或染色体异常的部分的核酸。例如,可采用本发明所述方法检查来自染色体21的
靶核酸以检测唐氏综合征。
[0092] 本文所用的术语“对照核酸”指根据本文所述方法用作参比核酸以确定核酸是否是染色体异常部分的核酸。例如,来自染色体21以外染色体的对照核酸(本文中称作“参
比染色体”)可用作检测唐氏综合征的参比序列。在一些实施方式中,所述对照序列可以具有已知或已确定的量。
[0093] 本文所用的术语“序列特异性”或“基因座特异性方法”指根据序列组成研究(例如,定量)基因组中特定位置(或基因座)处的核酸的方法。序列特异性或基因座特异性方法允许对特定区段或染色体的定量。
[0094] 术语“基因”指参与产生多肽链的DNA区段;其包括参与基因产物的转录/翻译和所述转录/翻译调节的编码区之前和之后的区域(前导区和尾部区),以及单个编码区(外
显子)之间的插入序列(内含子)。
[0095] 本申请中,术语“多肽”、“肽”和“蛋白质”在本文中互换使用,指基酸残基的聚合物。该术语可应用于其中一个或多个氨基酸残基是相应天然产生氨基酸的人工化学模拟物的氨基酸聚合物,以及天然产生的氨基酸聚合物和非天然产生的氨基酸聚合物。如本文
所用,该术语涵盖任意长度的氨基酸链,包括全长蛋白(即,抗原),其中所述氨基酸残基通过共价肽键连接。
[0096] 术语“氨基酸”指天然产生的和合成的氨基酸,以及以类似于天然产生氨基酸的方式起作用的氨基酸类似物和氨基酸模拟物。天然产生的氨基酸是遗传密码编码的氨基酸,以及随后修饰的氨基酸,如羟基脯氨酸、γ-羧基谷氨酸和O-磷酸丝氨酸。
[0097] 在本文中,氨基酸可用IUPAC-IUB生物化学命名委员会推荐的通用三字母代号或单字母代号表示。同样,核苷酸可用其普遍接受的单字母代码表示。
[0098] 本文所用的″引物″指能用于扩增方法如聚合酶链反应(PCR)的寡核苷酸,所述扩增方法用于根据多核苷酸序列扩增核苷酸序列,所述多核苷酸对应于特定基因组序列,
例如以不同甲基化状态位于染色体21的CpG岛CGI137、PDE9A或CGI009内。用于扩增多
核苷酸序列的至少一种PCR引物对所述序列为序列特异性。
[0099] 术语″模板″指能用于本发明所述扩增的任意核酸分子。非天然双链的RNA或DNA可制成双链DNA从而用作双链DNA。含有多种不同双链DNA分子的任意双链DNA或制
品可用作模板DNA以扩增包含在模板DNA内的一个或多个感兴趣基因座。
[0100] 本文所用的术语“扩增反应”指用于一次或多次拷贝核酸的过程。在实施方式中,所述扩增方法包括但不限于:聚合酶链反应,自持序列反应,连接酶链反应,cDNA末端快速扩增,聚合酶链反应和连接酶链反应,Q-β噬菌体扩增,链置换扩增,或重叠延伸拼接聚合酶链反应。在一些实施方式中,扩增单分子核酸,例如,通过数字PCR。
[0101] 本文所用的术语“灵敏度”指真阳性的数量除以真阳性数量与假阳性数量之和,其中灵敏度(sens)可在0≤sens≤1范围内。理想地,本文的方法实施方式具有假阴性数量等于0或接近等于0,从而当对象事实上具有至少一种染色体异常或其它遗传疾病时,没
有对象被错误识别为不具有至少一种染色体异常或其它遗传疾病。相反,通常评估预测算
法正确分类阴性的能力,这是灵敏度的互补度量。本文所用的术语“特异性”指真阴性的数量除以真阴性数量与假阴性数量之和,其中特异性(spec)可在0≤spec≤1范围内。理
想地,本文的方法实施方式的假阳性数量等于0或接近等于0,从而当对象不具有所评估的
染色体异常或其它遗传疾病时,没有对象被错误识别为具有至少一种染色体异常或其它遗
传疾病。因此,有时选择灵敏度和特异性等于1或100%的方法。
[0102] 可采用一种或多种预测算法确定显著性或给出在变量条件下所采集检测数据的意义,它们的权重可相互独立或相互依赖。本文所用的术语“变量”指算法中具有某一或某组值的某因子、量或功能。例如,变量可设计为一组扩增核酸物质,扩增核酸物质组的数量,测试的胎儿遗传分布百分比,测试的母本遗传分布百分比,试验的染色体异常类型,试验的遗传疾病类型,试验的性别相关异常类型,母亲年龄等。本文所用的术语“独立”指不受其他影响或控制。本文所用的术语“依赖”指受其他影响或控制。例如,特定染色体和因某变量状况引起所述特定染色体发生三体性事件是相互依赖的变量。
[0103] 本领域技术人员可采用任何类型的方法或预测算法在可接受的灵敏度和/或特2
异性范围内给出本发明的数据的显著性。例如,可采用例如X 检验、z-检验、t-检验、
ANOVA(方差分析)、回归分析、神经网络、模糊逻辑隐马尔可夫模型、多重模型态评估等的预测算法。可确定一种或多种方法或预测算法以给出本发明具有不同独立和/或依赖变量
的数据的显著性。且可确定一种或多种方法或预测算法而不给出本发明具有不同独立和/
或依赖变量的数据的显著性。可根据一种或更多预测算法的结果设计或改变本文所述方法
2
的不同变量的参数(例如,所分析组的数量,各组内核苷酸物质的类型)。例如,应用X 检
验检测数据可能提示母体年龄的特异性范围与得到具有特定染色体异常后代的更高可能
性相关,从而母体年龄变量的权重可不同于其它变量,相比与其它变量相同。
[0104] 在某些实施方式中,可选择多种待测试的算法。这些算法可以用原始数据训练。对每个新的原始数据样品,受训算法将为该样品指定分类(即,三体性或正常)。根据新原始数据样品的分类,可基于灵敏度和特异性评估受训算法的性能。最后,可鉴定灵敏度和/或特异性或其组合最高的算法。
[0105] 发明详述
[0106] 导言
[0107] 母体血浆中胎儿核酸的存在首次报道于1997年,其为简单地通过母体血液样品的分析进行无创产前诊断提供了可能性(Lo等,Lancet 350:485-487,1997)。迄今已开发大量潜在临床应用。具体的,发现胎儿核酸如母体血浆中DNA浓度的定量异常与多种妊娠
相关疾病关联,包括先兆子痫,未足月产,产前出血,侵入性胎盘形成,胎儿唐氏综合征和其它胎儿染色体非整倍性。因此,母体血浆中的胎儿核酸分析代表了监控母婴健康的有力机
制。
[0108] 但是,胎儿DNA与背景母体共存于母体血浆中。因此,大多数所报道的应用依赖于Y染色体序列的检测,因为它们最易于从母体DNA区分。这种方法使已有试验的可应用
性限制于仅50%的所有妊娠,即那些孕有雄性胎儿的妊娠。因此,对用于从母体样品富集
和分析胎儿核酸的性别独立性组合物和方法有很大需求。而且,依赖于多态性标记物来定
量胎儿核酸的方法可能易受不同种族之间的杂合率变化影响,从而限制了其可应用性(例
如,提高需要的标记物数量)。
[0109] 此前已证明可根据甲基化状态差异区分胎儿与母体DNA(美国专利号6,927,028,其在此通过引用纳入)。甲基化是一种表观遗传学现象,指改变表型而不涉及DNA序列变化
的过程。通过探索母亲和胎儿间DNA甲基化状态的差异,可以成功地检测和分析母体核酸
背景中的胎儿核酸。
[0110] 本发明人提供了在来自胎儿(例如,来自胎盘)的胎儿DNA和来自母亲例如来自外周血细胞的母体DNA之间差异甲基化的新型基因组多核苷酸。因此,这一分析提供了用
于区分胎儿和母体基因组DNA的新方案和准确定量胎儿核酸的新方法,其可用于无创性产
前诊断。
[0111] 方法
[0112] 本发明的实施利用分子生物学领域的常规技术。公开本发明所用一般方法的基础文本包括Sambrook和Russell,Molecular Cloning,A Laboratory Manual(《分子克隆,
实验室手册》)(第3版,2001);Kriegler,Gene Transfer and Expression:A Laboratory Manual(《基因转移和表达:实验室手册》)(1990);以及Current Protocols in Molecular Biology(《新编分子生物学实验指南》)(Ausubel等编,1994))。
[0113] 对核酸而言,大小以千碱基(kb)或碱基对(bp)计。它们是获自琼脂糖或丙烯酰胺凝胶电泳、测序核酸或公开的DNA序列的估计值。对蛋白质而言,大小以千道尔顿(kDa)
或氨基酸残基数计。由凝胶电泳、测序蛋白质、衍生氨基酸序列或公开的蛋白质序列估计蛋白质大小。
[0114] 不能市售获得的寡核苷酸可以化学合成,例如用如Van Devanter等,NucleicAcidss Res.12:6159-6168(1984)中所述的自动合成仪按照固相亚磷酰胺三酯法合成,该
方法首先由Beaucage和Caruthers记载于Tetrahedron Letts.22:1859-1862(1981)。寡
核苷酸的纯化采用任何本领域公认策略进行,例如,天然丙烯酰胺凝胶电泳或阴离子交换
高效液相色谱法(HPLC),如Pearson和Reanier,J.Chrom.255:137-149(1983)中所述。
[0115] 获取血液样品并提取DNA
[0116] 本发明涉及分离、富集和分析母体血液中所见胎儿DNA,作为无创性手段来检测妊娠相关病症或疾病的存在和/或监控其进展。因此,实施本发明的第一步是从妊娠女性获取血液样品并从所述样品提取DNA。
[0117] A.获取血液样品
[0118] 血液样品获自孕龄妊娠女性,适合采用本发明所述方法的测试。适当孕龄可能视所测试的疾病而不同,如下所述。从女性采集血液按照医院或诊所通常遵循的标准方案进
行。采集适当量的外周血,例如,通常为5-50毫升,并在进一步制备前按照标准规程保存。
可以本领域普通技术人员已知能使样品中所存在核酸量的降解最小或确保其品质的方式
采集、保存或运输所述血液样品。
[0119] B.制备血液样品
[0120] 根据本发明所述采用例如全血、血清或血浆对母体血液中发现的胎儿DNA进行分析。本领域技术人员熟知从母体血液制备血清或血浆的方法。例如,可将妊娠女性的血液
置入含有避免血液凝结的EDTA或专用市售产品如Vacutainer SST(新泽西州富兰克林湖
市的BD公司(Becton Dickinson))的管内,然后可通过离心从全血获取血浆。另一方面,
可在血液凝固后用或不用离心获取血清。若采用离心,则尽管并非排他性,但通常在适当速度如1,500-3,000×g下进行。血浆或血清可在转移至用于DNA提取的新管之前经过其它
离心步骤。
[0121] 在全血的无细胞部分以外,还可从富集在暗黄层的细胞部分回收DNA,暗黄层可在来自女性的全血样品离心并去除血浆后获得。
[0122] C.提取DNA
[0123] 有多种已知方法用于从包括血液在内的生物样品中提取DNA。可采用DNA制备的常规方法(例如,描述于Sambrook和Russell,Molecular Cloning:A Laboratory
Manual(《分子克隆:实验室手册》),第3版,2001);多种市售可得试剂或试剂盒,例如凯杰公司(Qiagen)的QIAamp循环核酸试剂盒,QiaAmp DNA迷你试剂盒或QiaAmp DNA血液迷
TM
你试剂盒(德国海尔登的凯杰公司),GenomicPrep 血液DNA分离试剂盒(威斯康星州麦
TM
迪逊的普洛麦格公司(Promega,Madison,Wis.))和GFX 基因组血液DNA纯化试剂盒(新
泽西州皮斯卡特维的安玛西亚公司(Amersham))也可用于从来自妊娠女性的血液样品获
取DNA。也可采用这些方法中超过一种的组合。
[0124] 在一些实施方式中,所述样品可首先就胎儿核酸用一种或多种方法富集或相对富集。例如,胎儿和母体DNA的区分可以采用单独的本发明所述组合物和方法进行或与其它
区分因子联用。这些因子的示例包括但不限于染色体X和Y之间的单核苷酸差异,染色体
Y特异性序列,位于基因组其它位置的多态性,胎儿与母体DNA之间的大小差异和母体与胎
儿组织之间的甲基化模式差异。
[0125] 用于就特定核酸物质富集样品的其它方法描述于2007年5月30日提交的PCT专利申请号PCT/US07/69991,2007年6月15日提交的PCT专利申请号PCT/US2007/071232,
美国临时申请号60/968,876与60/968,878(指定给本申请人),(PCT专利申请号PCT/
EP05/012707,2005年11月28日提交),这些都通过引用纳入本文。在某些实施方式中,从
样品中选择性除去(部分、基本、几乎完全或完全)母体核酸。
[0126] 核酸的甲基化特异性分离
[0127] 本文所述方法提供用于根据差异甲基化DNA的甲基化特异性分离来富集胎儿DNA的替代方案。最近已发现很多参与发育调节的基因通过胚胎干细胞中的表观遗传学受控
制。因此,预期多个基因可在胎儿来源与母体来源的核酸之间显示差异DNA甲基化。一旦
鉴定出这些区域,可采用捕获甲基化DNA的技术特异性富集胎儿DNA。就差异甲基化区域的
鉴定而言,采用新方案捕获甲基化DNA。该方案采用蛋白质,其中MBD2的甲基结合域与抗
体的Fc片段融合(MBD-FC)(Gebhard C,Schwarzfischer L,Pham TH,Schilling E,Klug M,Andreesen R,Rehli M(2006)Genomewide profiling of CpG methylation identifies novel targets of aberrant hypermethylation in myeloid leukemia.(基因组范围
的CpG甲基化概况分析鉴定髓细胞性白血病中异常高甲基化的新靶标)Cancer Res 66:
6118-6128)。该融合蛋白相对常规的甲基化特异性抗体具有多种优势。所述MBD-FC对甲
基化DNA具有更高亲和性,且其结合双链DNA。更重要的是,两种蛋白质结合DNA的方式不
同。甲基化特异性抗体随机结合DNA,这意味这只能得到二元答案。另一方面,MBD-FC的
甲基结合域结合所有DNA分子,无论其甲基化状态如何。这一蛋白-DNA相互作用的强度
由DNA甲基化水平限定。结合基因组DNA后,可用盐浓度递增的洗脱液分离未甲基化和甲
基化DNA从而允许更为受控的分离(Gebhard C,Schwarzfischer L,Pham TH,Andreesen
R,Mackensen A,Rehli M(2006)Rapid and sensitive detection of CpG-methylation
using methyl-binding(MB)-PCR.(采用甲基结合(MB)-PCR的CpG甲基化快速及灵敏检测)
Nucleic Acids Res 34:e82)。因此,称为甲基-CpG免疫沉淀(MCIP)的该方法不但可以
富集,还可以根据甲基化水平分离基因组DNA,这在还需要研究未甲基化DNA部分时尤为有
用。
[0128] 甲基化敏感的限制性酶消化
[0129] 本发明还提供用于确定来自母体样品的胎儿核酸的量的组合物和方法。本发明允许通过用选择性且完全或部分消化母体核酸的酶选择性消化来自所述母体样品的核酸来
富集母体样品中的胎儿核酸区,从而就至少一种胎儿核酸区富集所述样品。消化效率优选
大于约75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,
89%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%。富集后,可通过不需要多态性序列或亚硫酸氢盐处理的定量方法来确定胎儿核酸的量,从而提供对于雌性胎儿和在
不同种族间同样有效且保留样品中存在的低拷贝数胎儿核酸的方案。
[0130] 例如,有甲基敏感的酶仅在其DNA识别序列未甲基化时优选或显著切割或消化。因此,与甲基化DNA样品相比,未甲基化DNA样品将被切成更小片段。类似地,高甲基化DNA样品不被切割。相反,有甲基敏感的酶仅在其DNA识别序列甲基化时切割。
[0131] 适用于本发明所述方法的消化未甲基化DNA的甲基敏感酶包括但不限于HpaII,HhaI,MaeII,BstUI和AciI。可用的一种酶是只切割未甲基化序列CCGG的HpaII。可用的
另一种酶是只切割未甲基化序列GCGC的HhaI。这两种酶都可从NEB公司(New England
BioLabs Inc.)获得。还可采用两种或多种只消化未甲基化DNA的甲基敏感酶的组合。
+
仅消化甲基化DNA的适当酶包括但不限于仅切割识别序列GATC的DpnI,和属于AAA 蛋白
m m
家族并切割含有经修饰胞嘧啶的DNA和切割5′...PuC(N40-3000)PuC...3′的McrBC(马萨
诸塞州贝弗利的NEB公司)。
[0132] 针对用于在特定位点切割DNA的选定限制性酶的切割方法和过程为本领域技术人员所熟知。例如,包括NEB公司、普洛麦格生化公司(Pro-Mega Biochems)、宝灵曼公
司(Boehringer Mannheim)等的很多限制性酶的供应商提供用特定限制性酶切割的条
件和DNA序列类型。Sambrook等(见Sambrook等,Molecular Biology:A laboratory
Approach(《分子生物学:实验室手册》),纽约州冷泉港,1989)提供用于采用限制性酶和其它酶的方法的概述。酶通常在能以约95%-100%,优选以约98%-100%的效率切割母体
DNA的条件下使用。
[0133] 甲基化分析的其它方法
[0134] 本领域已知各种甲基化分析方法,且可用于和本发明方法联用。这些试验允许确定DNA序列内一个或多个CpG岛的甲基化状态。此外,所述方法可用于定量甲基化核酸。此
类试验涉及经亚硫酸氢盐处理DNA的DNA测序,PCR(用于序列特异性扩增),Southern印
迹分析,和甲基化敏感限制性酶的使用等技术。
[0135] 基因组测序是通过采用亚硫酸氢盐处理分析DNA甲基化模式和5-甲基胞嘧啶分布的简化技术(Frommer等,Proc.Natl.Acad.Sci.USA 89:1827-1831,1992)。此外,可采用来自经亚硫酸氢盐转化DNA的PCR扩增产物的限制性酶消化,例如Sadri和Hornsby所述方
法(Nucl.Acids Res.24:5058-5059,1996)或COBRA(联合亚硫酸氢盐限制性分析)(Xiong
和Laird,Nucleic Acids Res.25:2532-2534,1997)。
[0136] COBRA分析是定量甲基化试验,可用于确定少量基因组DNA中特定基因座的DNA甲基化水平(Xiong和Laird,Nucleic Acids Res.25:2532-2534,1997)。简要来说,用限制性酶消化来展现经亚硫酸氢钠处理DNA的PCR产物中的甲基化依赖性序列差异。甲基化
依赖性序列差异最初按Frommer等(Proc.Natl.Acad.Sci.USA 89:1827-1831,1992)所述
过程通过标准亚硫酸氢盐处理引入基因组DNA。然后采用对感兴趣CpG岛特异性的引物进
行亚硫酸氢盐转化DNA的PCR扩增,然后是限制性核酸内切酶消化,凝胶电泳并采用特异性
带标记的杂交探针检测。初始DNA样品中的甲基化水平以跨越宽范围DNA甲基化水平的线
性定量方式用已消化和未消化PCR产物的相对量表示。此外,该技术能够可靠地应用于从
显微解剖的石蜡包埋组织样品获得的DNA。用于COBRA分析的典型试剂(例如,可在基于
COBRA的典型试剂盒中发现的试剂)可包括但不限于:针对特定基因的PCR引物(或甲基化
改变的DNA序列或CpG岛);限制性酶和适当缓冲液;基因杂交寡核苷酸;对照杂交寡核苷
酸;用于寡核苷酸探针的激酶标记试剂盒;以及放射性核苷酸。此外,亚硫酸氢盐转化试剂可包括:DNA变性缓冲液;磺化缓冲液;DNA回收试剂或试剂盒(例如,沉淀、超滤、亲和柱);
脱磺化缓冲液;以及DNA回收组分。
[0137] MethyLightTM试验是高通量定量甲基化试验,利用基于荧光的实时PCR(TaqMan.RTM.)技术,在PCR步骤后无需进一步操作(Eads等,Cancer Res.59:2302-2306,1999)。简要来说,MethyLight.TM.过程开始于基因组DNA的混合样品,其按标准过程在亚硫酸氢钠
反应中被转化成甲基化依赖性序列差异的混合库(所述亚硫酸氢盐过程将未甲基化的胞
嘧啶残基转化成尿嘧啶)。然后在″无偏″(用不与已知CpG甲基化位点重叠的引物)PCR
反应或在″偏向″(用与已知CpG双核苷酸重叠的PCR引物)反应中进行基于荧光的PCR。
序列区分可以发生在扩增过程的水平上或者在荧光检测过程的水平上,或者两者兼有。
[0138] MethyLight试验可用作基因组DNA样品中甲基化模式的定量测试,其中序列区分发生在探针杂交水平上。在该定量形式中,PCR反应提供与特定推测甲基化位点重叠的荧
光探针存在下的无偏扩增。通过没有引物也没有与任何CpG双核苷酸重叠的探针的反应提
供输入DNA量的无偏对照。或者,通过用不“覆盖”已知甲基化位点的对照寡核苷酸(基于
荧光的″MSP″技术的形式)或用覆盖潜在甲基化位点的寡核苷酸探测带偏PCR池来实现
对基因组甲基化的定性测试。
[0139] MethyLight过程可在扩增过程中与″TaqMan″探针一起使用。例如,双链基因组DNA用亚硫酸氢钠处理,然后经过采用TaqMan.RTM.探针的两组PCR反应的其一;例如,用
带偏引物和TaqMan.RTM.探针,或者用无偏引物与TaqMan.RTM.探针。所述TaqMan.RTM.
探针双重标记有荧光″报道″和″猝灭″分子,并设计为特异性针对较高GC含量区,使其
在PCR循环中的解链温度比正向或反向引物高约10℃。这使得TaqMan.RTM.探针能在PCR
退火/延伸步骤中保持完全杂交。在PCR过程中随着Taq聚合酶酶促合成新链,其将最终
到达已退火的TaqMan.RTM.探针处。此时Taq聚合酶的5′至3′核酸内切酶活性将通过
消化来置换TaqMan.RTM.探针以释放荧光报道分子,从而采用实时荧光检测系统来定量检
测现已解猝灭的信号。
[0140] 用于MethyLight.TM.分析的典型试剂(例如,可在基于MethyLight.TM.的试剂盒中发现的试剂)可包括但不限于:针对特定基因(或甲基化改变的DNA序列或CpG岛)
的PCR引物;TaqMan.RTM.探针;优化的PCR缓冲液和脱氧核苷酸;以及Taq聚合酶。
[0141] Ms-SNuPE技术是基于DNA的亚硫酸氢盐处理然后进行单核苷酸引物延伸来评估特定CpG位点处的甲基化差异的定量方法(Gonzalgo和Jones,Nucleic Acids Res.25:
2529-2531,1997)。
[0142] 简要来说,基因组DNA与亚硫酸氢钠反应将未甲基化的胞嘧啶转化成尿嘧啶而5-甲基胞嘧啶不改变。然后采用经亚硫酸氢盐转化DNA的特异性PCR引物进行所需靶序列
的扩增,并分离所得产物,用作在感兴趣CpG位点甲基化分析的模板。
[0143] 可以分析少量的DNA(例如,显微解剖的病理切片),且避免了利用限制性酶来确定CpG位点的甲基化状态。
[0144] 用于Ms-SNuPE分析的典型试剂(例如,可在基于Ms-SNuPE的典型试剂盒中发现的试剂)可包括但不限于:针对特定基因(或经甲基化改变的DNA序列或CpG岛)的PCR
引物;优化的PCR缓冲液和脱氧核苷酸;凝胶提取试剂盒;阳性对照引物;针对特定基因的Ms-SNuPE引物;反应缓冲液(用于Ms-SNuPE反应);以及放射性核苷酸。此外,亚硫酸氢盐
转化试剂可包括:DNA变性缓冲液;磺化缓冲液;DNA回收试剂或试剂盒(例如,沉淀、超滤、亲和柱);脱磺化缓冲液;以及DNA回收组分。
[0145] MSP(甲基化特异性PCR)可评估CpG岛内几乎任意CpG位点组的甲基化状态,不依赖于甲基化敏感的限制性酶的使用(Herman等Proc.Nat.Acad.Sci.USA 93:9821-9826,
1996;美国专利号5,786,146)。简要来说,通过亚硫酸氢钠修饰DNA,将所有未甲基化胞嘧啶转化成尿嘧啶,而不转化甲基化胞嘧啶,随后用特异性针对甲基化与未甲基化DNA的引
物进行扩增。MSP仅需少量DNA,对给定CpG岛基因座的0.1%甲基化等位基因敏感,并可
在提取自石蜡包埋样品的DNA上进行。用于MSP分析的典型试剂(例如,可在基于MSP的
试剂盒中发现的试剂)可包括但不限于:针对特定基因(或甲基化改变的DNA序列或CpG
岛)的甲基化与未甲基化PCR引物;TaqMan.RTM.探针;优化的PCR缓冲液和脱氧核苷酸;
以及特定探针。
[0146] MCA技术是能用来筛选基因组DNA中经改变的甲基化模式并分离与这些改变相关的特定序列的方法(Toyota等,Cancer Res.59:2307-12,1999)。简要来说,在随机引发的PCR扩增前,用对识别位点内胞嘧啶甲基化有不同灵敏度的限制性酶来消化得自原发肿瘤、细胞系、和正常组织的基因组DNA。克隆显示差异甲基化的片段,并将PCR产物在高分辨聚
丙烯酰胺凝胶上分离后测序。然后用所克隆的片段作为Southern分析的探针来证实这些
区域的差异甲基化。用于MCA分析的典型试剂(例如,可在基于MCA的试剂盒中发现的试
剂)可包括但不限于:用于随机引发基因组DNA的PCR引物;PCR缓冲液和核苷酸;限制性
酶和适当的缓冲液;基因杂交寡核苷酸或探针;对照杂交寡核苷酸或探针。
[0147] 分析甲基化位点的另一方法是引物延伸试验,包括优化的PCR扩增反应,其产生供随后采用质谱进行引物延伸基因分型分析的经扩增靶标。所述试验也可以多通路方式完
成。该方法(特别是其涉及单核苷酸多态性基因分型时)在PCT公开WO05012578A1和美
国公开US20050079521A1中有详细描述。就甲基化分析而言,该试验可用于检测亚硫酸氢
盐引入的甲基化依赖性C至T序列改变。这些方法尤其可用于在单孔中进行多通路扩增反
应和多通路引物延伸反应(例如,多通路均相引物物质延伸(hME)试验)以进一步为引物
延伸反应提高通量并降低每个反应的成本。
[0148] DNA甲基化分析的四种其它方法包括限制性界标基因组扫描(RLGS,Costello等,2000),甲基化敏感性代表性差异分析法(MS-RDA),甲基化特异性AP-PCR(MS-AP-PCR)和甲
基-CpG结合域柱/部分解链分子的分离(MBD/SPM)。
[0149] 可与本发明联用的其它甲基化分析方法在以下文章中有描述:Laird,P.W.Nature Reviews Cancer 3,253-266(2003);Biotechniques;Uhlmann,K. 等,Electrophoresis23:4072-4079(2002)-PyroMeth;Colella等,Biotechniques.2003年7月,35(1):146-50;
Dupont JM,Tost J,Jammes H和Gut IG.Anal Biochem,2004年10月,333(1):119-27;和Tooke N和Pettersson M.IVDT.2004年11月,41。
[0150] 多核苷酸序列扩增与确定
[0151] 以甲基化差异方式分离核酸后,所述核酸可进行基于序列的分型。此外,一旦确定胎儿来源的一种特定基因组序列相对母体对应物为高甲基化或低甲基化,该胎儿基因组序列的量就可确定。随后,可将该量与标准对照值作比较并用作某些妊娠相关疾病可能性的
指示。
[0152] A.核苷酸序列的扩增
[0153] 在很多情况中,需要采用本领域熟知的多种核酸扩增方法(前文列举并在下文有详述)中的任意一种来扩增本发明的核酸。具体而言,核酸扩增是酶合成含有与待扩增核
酸序列互补序列的核酸扩增子(拷贝)。核酸扩增在样品中的靶序列含量极低时特别有益。
通过扩增靶序列并检测所合成的扩增子,可以极大改善试验的灵敏度,由于试验开始时需
要较少的靶序列以更好地确保检测样品中属于感兴趣生物或病毒的核酸。
[0154] 已充分确立并在研究中常用多种多核苷酸扩增方法。例如,本领域熟知用于多核苷酸序列扩增的聚合酶链反应(PCR)的常规方法,因此本文不再详述。对于PCR方法、方案
和引物设计原理的综述可参见例如Innis等(1990)PCR Protocols,A Guide to Methods
and Applications(《PCR方案:方法与应用指南》,纽约的学术出版社有限公司(Academic Press,Inc.),1990)。PCR试剂与方案也可获自商业供应商,例如罗氏分子系统公司(Roche Molecular Systems)。
[0155] PCR最常用热稳定性酶以自动过程进行。该过程中,反应混合物的温度在变性区、引物退火区与延伸反应区间自动循环。特别适于该目的机器市售可得。
[0156] 尽管本发明的实施中通常采用多核苷酸序列的PCR扩增,本领域技术人员了解母体血液样品中所见基因组序列的扩增可通过任意已知方法实现,例如连接酶链反应(LCR)、转录介导的扩增和自持序列复制或基于核酸序列的扩增(NASBA),这些各自提供充分扩增。
更近期开发的分支-DNA技术也可用于定性证明本发明所述代表特定甲基化模式的具体基
因组序列的存在,或定量确定母体血液中该特定基因组序列的量。关于分支-DNA信号扩增
用于直接定量临床样品中核酸序列的综述参见Nolte,Adv.Clin.Chem.33:201-235,1998。
[0157] 本发明所述组合物和方法还在用数字PCR实施时特别有用。数字PCR最初由Kalinina及其同事开发(Kalinina等,“Nanoliter scale PCR with TaqMan detection.
(用TaqMan检测的纳升级PCR)”Nucleic Acids Research.25;1999-2004,(1997)),并由
Vogelstein和Kinzler进一步开发(Digital PCR.(数字PCR)Proc Natl Acad Sci U S
A.96;9236-41,(1999))。数字PCR与胎儿诊断一起使用的应用最初由Cantor等描述(PCT
专利公开号WO05023091A2),且此后由Quake等描述(美国专利公开号US 20070202525),
这两篇文献都通过引用纳入本文。数字PCR利用单分子水平核酸(DNA、cDNA或RNA)扩增
的优势并为定量分析低拷贝数核酸提供高度灵敏的方法。Fluidigm 公司提供系统用于核
酸的数字分析。
[0158] B.多核苷酸序列的确定
[0159] 用于多核苷酸序列确定的技术也已充分确立并在相关研究领域广泛实践。例如,多核苷酸测序的基本原理和常规技术在关于分子生物学和重组遗传学的多项研究报告和
论文中有述,例如Wallace等,同上;Sambrook和Russell,同上;Ausubel等,同上。研究实验室中常规实施的人工或自动的DNA测序方法可用于实施本发明。适于检测用于实施本发
明方法的多核苷酸序列中变化的其它方法包括但不限于质谱、引物延伸、多核苷酸杂交、实时PCR和电泳。
[0160] 在本发明所述方法中也可采用引物延伸反应。引物延伸反应通过例如由在引物延伸引物中掺入脱氧核苷酸和/或双脱氧核苷酸来区分SNP等位基因,所述引物与毗邻SNP
位点的区域杂交。所述引物由聚合酶延伸。经引物延伸的SNP可通过质谱或通过标签部分
如生物素来物理测得。由于SNP位点仅通过互补的标记有特定标记或产生具有特定质量的
引物延伸产物的脱氧核苷酸或双脱氧核苷酸来延伸,可以区分并定量SNP等位基因。
[0161] 逆转录并扩增的核酸可以是经修饰的核酸。经修饰的核酸可包括核苷酸类似物,且在某些实施方式中包括可检测标记和/或捕获剂。可检测标记的示例包括但不限于荧光
团、放射性同位素、发色剂、发光剂、化学发光剂、光散射剂、酶等。捕获剂的示例包括但不限于来自结合对的试剂,结合对选自抗体/抗原,抗体/抗体,抗体/抗体片段,抗体/抗体受
体,抗体/蛋白质A或蛋白质G,半抗原/抗半抗原,生物素/亲和素,生物素/链霉亲和素,
叶酸/叶酸盐结合蛋白,维生素B12/内源因子,化学反应基团/互补化学反应基团(例如
巯基/马来酰亚胺,巯基/卤化乙酰基衍生物,胺/异硫氰酸,胺/琥珀酰亚胺酯和胺/磺
酰卤化物)对,等等。在某些实施方式中,具有捕获剂的经修饰核酸可固定在固相载体上。
[0162] 质谱是用于检测本发明所述多核苷酸,例如PCR扩增子、引物延伸产物、切割自靶核酸的检测探针的特别有效的方法。通过将测得信号的质量与感兴趣多核苷酸的预期
质量作比较验证多核苷酸序列的存在。对于特定多核苷酸序列的相对信号强度,例如谱图
上的质量峰表明特定等位基因的相对群体,因此能从该数据直接计算等位基因比例。对
TM
使用Sequenom 标准iPLEX 试验和MassARRAY 技术进行基因分型的方法的综述参见
Jurinke,C.,Oeth,P.,van den Boom,D.,MALDI-TOF mass spectrometry:a versatile tool for high-performance DNA analysis(MALDI-TOF质谱:一种万能的高性能DNA分
TM
析工 具),Mol.Biotechnol.26,147-164(2004);Oeth,P.等,iPLEX Assay:Increased Plexing Efficiency and Flexibility for MassARRAY System through single base
TM
primer extension with mass-modified Terminators(iPLEX 测试:通过单碱基引物延
伸和质量修饰终止子提高MassARRAY 体系的复用效率和灵活性),塞昆纳姆应用说明
(SEQUENOM Application Note)(2005),两者都通过引用纳入本文。对采用可切割检测探针检测和定量靶核酸的综述参见2007年12月4日递交、通过引用纳入本文的美国专利申请
第11/950,395号,所述探针在扩增过程中被切割并可通过质谱检测。
[0163] 测序技术在通量和成本方面有改善。测序技术,例如在454平台(罗氏公司)(Margulies,M.等,2005 Nature 437,376-380)、Illumina基因组分析仪(或Solexa平
台)或SOLID系统(应用生物系统公司)或Helicos True单分子DNA测序技术(Harris
TD等,2008 Science,320,106-109),太平洋生物科学公司的单分子实时(SMRT.TM.)技术和纳米孔测序(Soni GV和Meller A.2007 Clin Chem 53:1996-2001)上所实现的,能以高
阶多通路按平行方式对样本中分离的多种核酸分子进行测序(Dear Brief Funct Genomic
Proteomic 2003;1:397-416)。
[0164] 这些平台中的每个都能测序克隆扩增或未扩增单分子核酸片段。例如,某些平台包括(i)利用染料修饰探针连接来测序(包括环化连接和切割),(ii)焦磷酸测序,以及
(iii)单分子测序。由此产生的核苷酸测序物质、扩增核酸物质和可检测产物可视为用于通过此类测序分析平台分析核苷酸序列目的的“在研核酸”。
[0165] 连接测序是一种依赖于DNA连接酶对碱基对错配灵敏度的核酸测序方法。DNA连接酶将碱基正确配对的DNA末端连接在一起。将DNA连接酶仅连接正确碱基配对DNA末端
的能力与荧光标记寡核苷酸或引物的混合库结合,能通过荧光检测进行序列测定。可通过
纳入含有能在标记识别后加以切割的可切割连接的引物实现更长的序列读数。接头的切割
除去标记并在已连接引物末端再生5’磷酸,以备所述引物进行另一轮连接。在一些实施方式中,引物可标记有多于一个荧光标记(例如,1个荧光标记,2、3或4个荧光标记)。
[0166] 普通技术人员可使用的基于连接测序的系统的实施例通常包括下列步骤。可在含所研究核酸(″模板″)、扩增反应组分、珠和引物的乳液微反应器中制备克隆珠群。扩增
后,模板被变性,并进行珠富集将具有已延伸模板的珠与不需要的珠(如具有未延伸模板
的珠)相分离。选定珠上的模板进行3’修饰以能与玻片共价结合,经修饰的珠可沉积到玻
片上。在珠装载过程中沉积室提供将玻片分成1、4或8个隔室的能力。对于序列分析,引
物与衔接子序列杂交。四色染料标记探针组竞争连接测序引物。通过研究连接系列中每第
4和第5个碱基实现探针连接的特异性。经5-7轮连接,检测和切割记录每第5位的颜色
通过所用库的类型确定轮数。每轮连接后,放入在5’方向偏移一个碱基的新互补引物进行另一系列连接。引物重置和连接轮(每轮5-7个连接循环)顺序重复5次以产生单个标签
的25-35碱基对序列。对于伴侣配对测序,对第二标签重复该过程。该系统可用于指数扩
增本文所述过程产生的扩增产物,例如通过连接异源核酸与本文所述过程产生的第一扩增
产物并采用与初始用于产生所述第一扩增产物相同或不同的固相载体进行乳液扩增。该系
统也可用于通过绕过指数扩增过程并在玻片上直接分选本文所述固相载体来分析本文所
述过程直接产生的扩增产物。
[0167] 焦磷酸测序是基于合成测序的核酸测序方法,其依赖于检测核苷酸掺入时释放的焦磷酸。通常,合成测序包括每次加入一个核苷酸来合成DNA链,所述链与正探求其序列的链互补。研究核酸可固定于固相载体,与测序引物杂交,与DNA聚合酶、ATP硫酸化酶、荧光素酶、腺苷三磷酸双磷酸酶、腺苷5’磷酰硫酸和荧光素一起孵育。依序添加和除去核苷酸溶液。核苷酸正确掺入可释放焦磷酸,在腺苷5’磷酰硫酸存在下焦磷酸与ATP硫酸化酶相
互作用并产生为荧光素反应提供能量的ATP,该反应产生允许序列测定的化学发光信号
[0168] 普通技术人员可使用的基于焦磷酸测序的系统的实施例通常包括下列步骤:将衔接子核酸与研究核酸连接并将研究核酸与珠杂交;在乳液中扩增研究核酸中的核苷酸
序列;用皮升多孔固相载体分选珠;通过焦磷酸测序方法对扩增核苷酸序列测序(例如,
Nakano等,“Single-molecule PCR using water-in-oil emulsion(采用油包水乳液的单
分子PCR)”Journal of Biotechnology 102:117-124(2003))。此类系统可用于指数式扩
增本文所述过程产生的扩增产物,例如通过连接异源核酸与本文所述过程产生的第一扩增
产物。
[0169] 某些单分子测序实施方式是基于合成测序的原理,并利用单一配对荧光共振能转移(单一配对FRET)作为核苷酸成功掺入引起光子发射的机理。通常采用强化或高灵敏度
冷却电荷耦联器件与内全反射显微镜(TIRM)联合检测发射的光子。仅当引入的反应溶液
含用于掺入测序过程产生的所合成生长核酸链中的正确核苷酸时,才发射光子。在基于单
分子测序的FRET中,能量通过长范围偶极相互作用在两种荧光染料之间转移,染料有时是
聚甲炔花青染料Cy3和Cy5。在特定激发波长下供体被激发,激发态能量非放射性地转移
至受体染料,后者进而被激发。受体染料最终通过光子的辐射发射返回基态.在单一配对
FRET中,能量转移过程所用的两种染料代表“单一配对”。Cy3常用作供体荧光团,并常掺入作为第一标记核苷酸。Cy5常用作受体荧光团,并用作掺入第一Cy3标记核苷酸以后后续核
苷酸添加的核苷酸标记。为成功发射能量转移,所述荧光团通常相隔10纳米内。
[0170] 可用于依据单分子测序的系统的实施例通常涉及将引物与研究核酸杂交以产生复合物;将所述复合物与固相结合;用标记有荧光分子的核苷酸反复延伸所述引物;
并在每次重复后捕获荧光共振能量转移信号的图像(例如,美国专利第7,169,314号;
Braslavsky等,PNAS 100(7):3960-3964(2003))。此类系统可用于直接测序本文所述过程产生的扩增产物。在一些实施方式中,所释放的扩增产物可以和含有固相载体如珠粒或玻
片上的固定化捕获序列的互补序列的引物杂交。引物-所释放线性扩增产物复合物与固定
化捕获序列的杂交将所释放线性扩增产物固定到基于单一配对FRET的合成测序所用固相
载体上。所述引物通常是荧光的,从而可产生带有固定化核酸的玻片表面的初始参比图像。
所述初始参比图像可用于确定发生真实核苷酸掺入的位置。“仅含引物”参比图像中最初未鉴定的阵列位置内测得的荧光信号视为非特异性荧光弃去。引物-所释放线性扩增产物复
合物固定化后,结合的核酸通常通过重复下列步骤平行测序:a)在一种荧光标记核苷酸存
在下的聚合酶延伸,b)采用合适的显微镜如TRIM检测荧光,c)除去荧光核苷酸,以及d)返
回步骤a,采用不同的荧光标记核苷酸。
[0171] 在一些实施方式中,可通过固相单核苷酸测序方法和过程进行核苷酸测序。固相单核苷酸测序方法包括在能使单个样品核酸分子与单个固相载体分子杂交的条件下使样
品核酸接触固相载体。所述条件可包括在″微反应器″中提供固相载体分子和单个样品核
酸分子。所述条件还可以包括提供使样品核酸分子可在固相载体上与固相核酸杂交的混合
物。2008年1月17日提交的美国临时专利申请序列号61/021,871中描述了可用于本文所
述实施方式的单一核苷酸测序方法。
[0172] 在某些实施方式中,纳米孔测序检测方法包括(a)将待测序核酸(″基础核酸″,如连接的探针分子)与序列特异性检测子在所述检测子与基础核酸中基本互补亚序列特
异性杂交的条件下接触;(b)检测来自检测子的信号以及(c)根据测得的信号确定基础核
酸的序列。在某些实施方式中,当检测子随着基础核酸通过孔而干扰纳米孔结构时,与基础核酸杂交的所述检测子从基础核酸上解离(例如,依序解离),并测得所述检测子从基础序
列上的解离。在一些实施方式中,从基础核酸解离的检测子发射可检测信号,而与基础核酸杂交的检测子发射不同的可检测信号或无可检测信号。在某些实施方式中,用对应特定核
苷酸的特定核苷酸序列(“核苷酸代表”)取代核酸(如连接的探针分子)中的核苷酸,从
而产生扩张的核酸(例如,美国专利第6,723,513号),而检测器子作为基础核酸与扩张核
酸中的核苷酸代表杂交。在这些实施方式中,可以二元或更高阶排列核苷酸代表(例如,
Soni和Meller,Clinical Chemistry 53(11):1996-2001(2007))。在一些实施方式中,核酸未扩张,不产生扩张的核酸,并直接用作基础核酸(例如,连接的探针分子用作未扩张基础核酸),检测子直接接触基础核酸。例如,第一检测子可与第一亚序列杂交,而第二检测子可与第二亚序列杂交,其中第一检测子与第二检测子各自具有能相互区分的可检测标记,
且当检测子从基础核酸解离时,来自第一检测子与第二检测子的信号可彼此区分。在某些
实施方式中,检测子包括与基础核酸杂交的区域(例如两个区),该区域可以长约3-100个
核苷酸(例如,长约4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、50、
55、60、65、70、75、80、85、90或95个核苷酸)。检测子还可包括不与基础核酸杂交的一个或多个核苷酸区域。在一些实施方式中,检测子是分子信标。检测子通常包含一个或多个独
立选自本文所述的可检测标记。可通过能检测各标记所产生信号的常规检测方法(例如,
磁性、电学、化学、光学等)测得各可检测标记。例如,可采用CD相机检测与检测子相连的一种或多种可区分量子点的信号。
[0173] 在某些序列分析实施方式中,可采用读数构建更大的核苷酸序列,这可通过鉴定不同读数中的重叠序列并采用读数中的识别序列得到促进。普通技术人员已知这
些序列分析方法和用于从读数构建更大序列的软件(例如,Venter等,Science 291:
1304-1351(2001))。在某些序列分析实施方式中,特异性读数、部分核苷酸序列构建和全长核苷酸序列构建可在样品核酸内的核苷酸序列间作比较(即,内部比较)或与参比序列作
比较(即,参比对比)。在样品核酸由多个样品或由含有序列变化的单一样品来源制备的情
况下,有时进行内部比较。当已知参比核苷酸序列且目的是确定样品核酸中是否含有与参
比核苷酸序列基本相似或相同或不同的核苷酸序列时,有时进行参比对比。序列分析由本
领域普通技术人员已知的序列分析仪器和组件促进。
[0174] 本文提供的方法允许高通量检测多种核酸中的核酸物质(例如如上产生的核苷酸序列物质、扩增核酸物质和可检测产物)。多通路化指同时检测超过一种的核酸物质。已知与质谱联合进行多通路反应的常规方法(参见美国专利号6,043,031、5,547,835与国际
PCT申请号WO 97/37041)。相较各单独的靶核酸物质必须在不同质谱分析中进行,多通路
化提供的优势能在少至单个质谱中鉴定多个核酸物质(例如,一些具有不同的序列差异)。
在一些实施方式中,本文提供的方法能用于快速且准确分析序列变化的高通量、高度自动
化过程。在一些实施方式中,本文的方法可在单一反应中以高水平多通路化。
[0175] 在某些实施方式中,多通路核酸物质的数量包括但不限于约1-500(例如,约1-3、3-5、5-7、7-9、9-11、11-13、13-15、15-17、17-19、19-21、21-23、23-25、25-27、27-29、29-31、
31-33、33-35、35-37、37-39、39-41、41-43、43-45、45-47、47-49、49-51、51-53、53-55、
55-57、57-59、59-61、61-63、63-65、65-67、67-69、69-71、71-73、73-75、75-77、77-79、
79-81、81-83、83-85、85-87、87-89、89-91、91-93、93-95、95-97、97-101、101-103、103-105、
105-107、107-109、109-111、111-113、113-115、115-117、117-119、121-123、123-125、
125-127、127-129、129-131、131-133、133-135、135-137、137-139、139-141、141-143、
143-145、145-147、147-149、149-151、151-153、153-155、155-157、157-159、159-161、
161-163、163-165、165-167、167-169、169-171、171-173、173-175、175-177、177-179、
179-181、181-183、183-185、185-187、187-189、189-191、191-193、193-195、195-197、
197-199、199-201、201-203、203-205、205-207、207-209、209-211、211-213、213-215、
215-217、217-219、219-221、221-223、223-225、225-227、227-229、229-231、231-233、
233-235、235-237、237-239、239-241、241-243、243-245、245-247、247-249、249-251、
251-253、253-255、255-257、257-259、259-261、261-263、263-265、265-267、267-269、
269-271、271-273、273-275、275-277、277-279、279-281、281-283、283-285、285-287、
287-289、289-291、291-293、293-295、295-297、297-299、299-301、301-303、303-305、
305-307、307-309、309-311、311-313、313-315、315-317、317-319、319-321、321-323、
323-325、325-327、327-329、329-331、331-333、333-335、335-337、337-339、339-341、
341-343、343-345、345-347、347-349、349-351、351-353、353-355、355-357、357-359、
359-361、361-363、363-365、365-367、367-369、369-371、371-373、373-375、375-377、
377-379、379-381、381-383、383-385、385-387、387-389、389-391、391-393、393-395、
395-397、397-401、401-403、403-405、405-407、407-409、409-411、411-413、413-415、
415-417、417-419、419-421、421-423、423-425、425-427、427-429、429-431、431-433、
433-435、435-437、437-439、439-441、441-443、443-445、445-447、447-449、449-451、
451-453、453-455、455-457、457-459、459-461、461-463、463-465、465-467、467-469、
469-471、471-473、473-475、475-477、477-479、479-481、481-483、483-485、485-487、
487-489、489-491、491-493、493-495、495-497、497-501)。
[0176] 用多通路测试获得解析质谱的设计方法可包括引物和寡核苷酸设计方法和反应设计方法。参见例如表X和Y中提供的多通路方案。就多通路试验中的引物与寡核苷酸设
计而言,单通路反应采用相同的引物设计总体方针,例如避免假引发和引物二聚体,只是多通路反应涉及更多引物。对于质谱应用,在某一试验质谱中的分析物峰从任意试验的产物
中充分解析,所述试验为包括暂停峰(pausing peak)和任意其它副产物峰的多通路试验。
还有,分析物峰优选落入用户指定的质量窗,例如,在5,000-8,500Da范围内。在一些实施方式中,多通路分析可适于如染色体异常的质谱检测。在某些实施方式中,多通路分析可适于本文所述的多种基于单核苷酸或纳米孔的测序方法。商业生产的微反应室或装置或阵列
或芯片可用来促进多通路分析,并已市售可得。
[0177] 检测胎儿非整倍性
[0178] 就胎儿非整倍性的检测而言,一些方法依赖于测定母本和父本遗传的等位基因之间的比例。但是,定量染色体变化的能力被无细胞核酸的母体份额削弱,这使得必须在测定前分离样品与母体DNA。有前景的方法利用胎儿和母体DNA的不同大小分布或测定仅由胎
儿表达的RNA(参见,例如美国专利申请号11/384128,其公开为US20060252071,并在此通
过引用纳入)。假设胎儿DNA在母体血浆中全部无细胞DNA中仅占约5%,则三体性样品和
健康对照之间的比例差异从1.6%降至仅约1.2%。因此,等位基因比例变化的可靠检测需
要富集无细胞DNA的胎儿部分,例如,采用本发明所述组合物与方法。
[0179] 一些方法依赖于测定母本与父本遗传等位基因的比例来从母体血浆检测胎儿染色体非整倍性。二倍体得到1∶1比例,而三倍体可测得2∶1比例。该差异的检测由于
胎儿DNA的低丰度,血浆样品中过量母体DNA的存在,以及测量技术的可变性而被统计取样
所削弱。后者通过采用具有高测量精度的方法如数字PCR或质谱来解决。样品中游离DNA
的胎儿部分的富集目前通过用尺寸排阻去除母体DNA或者着重于胎儿特异性核酸如胎儿
表达的RNA来实现。胎儿DNA的另一区分特征是其DNA甲基化模式。因此,本文提供用于
根据胎儿和母亲之间的差异甲基化来精确定量胎儿核酸的新型组合物与方法。所述方法依
赖于灵敏的绝对拷贝数分析来定量母体样品的胎儿核酸部分,从而能够进行胎儿性状的出
生前检测。本发明所述方法鉴定了基因组中在母体和胎儿DNA间差异甲基化的约3000个
富含CpG区。选定区域在所有测定样品间显示高度保守的差异甲基化。此外该组区域富含
对发育调节重要的基因,表明这些区域的表观遗传学调节是生物相关且一贯的过程(见表
3)。目前可采用我们的MBD-FC蛋白捕获所有无细胞DNA然后用高盐浓度洗脱高度甲基化
DNA部分来实现胎儿DNA的富集。采用低盐洗脱物部分,MBD-FC同样能富集未甲基化胎儿
DNA。
[0180] 本发明提供染色体13、18和21上已证实的63个基因组区域,其具有低水平母体甲基化和高水平胎儿甲基化。捕获这些区域后,可用SNP确定前述等位基因比例。在使用
高频SNP时,需测定约10个标记物以获得发现至少一种SNP(亲本具有相反的纯合基因分
型而子代具有杂合基因分型)的高置信度
[0181] 在一种实施方式中,提供一种染色体异常测定方法,所述方法利用绝对拷贝数的定量。二倍体染色体组将在所有染色体中显示差异甲基化区域的相同拷贝数量,但是,例如三体性21样品将显示针对染色体21上差异甲基化区域的1.5倍拷贝。二倍体染色体组的
基因组DNA量的标准化可以通过采用未改变常染色体(本文也有提供-见表1B)为参比来
实现。与其它方法可比,单个标记物可能不足以检测这一差异,因为总体拷贝数低。通常妊娠10-12周的母体血浆中每毫升含有约100-200拷贝的胎儿DNA。但是,本发明所述方法提
供冗余的可检测标记物以使得能高度可靠的区分二倍体与非整倍体染色体组。
[0182] 数据处理并鉴定是否存在染色体异常
[0183] 本文所用术语染色体异常的“测定″指通过数据的处理对染色体失衡进行鉴定,所述数据由扩增核酸物质组、核苷酸序列物质组或前述所得可检测产物组(统称″可检测
产物″)的检测所产生。如本文所述,可采用任何适当检测装置和方法区分一组或多组可
检测产物。关于是否存在染色体异常的结果可以任意适当形式表示,包括但不限于:与对象或样品存在染色体异常相关的概率(例如,让步比、p值),可能性,百分比,阈值上的值,或风险因子。在某些实施方式中,可用一种或多种灵敏度、特异性、标准偏差、变异系数(CV)和/或置信水平或其组合提供结果。
[0184] 基于一种或更多经计算变量鉴定根据一组或多组可检测产物测得的染色体异常,所述变量包括但不限于,灵敏度、特异性、标准偏差、变异系数(CV)、阈值、置信水平、评分、概率和/或其组合。在一些实施方式中,(i)诊断方法所选组的数量和/或(ii)诊断方法
所选各组的特定核苷酸序列物质,由这些计算变量中的一个或更多个部分或完全确定。
[0185] 在某些实施方式中,灵敏度、特异性和/或置信水平中的一个或多个表示为百分数。在一些实施方式中,独立地对应各变量的百分数超过约90%(例如,约90、91、92、93、
94、95、96、97、98或99%或超过99%(例如,约99.5%或更高,约99.9%或更高、约99.95%或更高、约99.99%或更高))。在一些实施方式中,变异系数(CV)表示为百分数,有时所述百分数为约10%或更低(例如,约10、9、8、7、6、5、4、3、2或1%或低于1%(例如,约0.5%或更低、约0.1%或更低、约0.05%或更低、约0.01%或更低))。在某些实施方式中,概率(例如,由算法确定不是随机产生特定结果)表示为p值,有时p值为约0.05或更低(例
如,约0.05、0.04、0.03、0.02或0.01、或低于0.01(例如,约0.001或更低、约0.0001或更低、约0.00001或更低、约0.000001或更低))。
[0186] 例如,评分或分数可指计算对象/样品中确实有或没有特定染色体异常的概率。分值可用来确定例如可对应实际染色体异常的扩增核可检测产物的变化、差异或比例。例
如,从可检测产物计算的正值可得到染色体异常的鉴定,这在单一样品分析中尤为相关。
[0187] 在某些实施方式中,模拟数据可协助数据处理,例如通过算法的训练或算法的测试。例如,模拟数据可涉及血清、血浆等中不同浓度胎儿和母体核酸的多个假定样品。模拟数据可基于真实群体中可能的预期情况或可被歪曲以测试算法和/或根据模拟数据组指
定正确的分类。本文中模拟数据也称为“虚拟”数据。样品内的胎儿/母体分布可模拟为
数字表格或阵列(例如,与参比生物分子或扩增核酸序列的切割产物的质量信号所对应峰
的列表)、质谱、凝胶条带模式或测量质量分布的任何代表技术。在大多数情况下可通过计算机程序进行模拟。在使用模拟数据组中一个可能的步骤是评估所鉴定结果的置信情况,
即所选阳性/阴性匹配样品的程度和是否有额外的变化。常见方法是计算概率值(p值),
该值评估随机样品具有优于选定值的可能性。由于某些情况中p值计算可能不适用,可评
估经验模型,该模型假设至少一个样品匹配参比样品(有或没有清晰变化)。或者,可采用
其它分布如泊松分布描述概率分布。
[0188] 在某些实施方式中,算法可指定算得真阳性、真阴性、假阳性和假阴性的置信值。也可根据某一概率模型指定发生某染色体异常的可能性。
[0189] 通常在计算机过程中产生模拟数据。本文所用的术语“计算机上(in silico)”指采用计算机进行的研究和实验。计算机上的方法包括但不限于,分子建模研究、染色体组型、遗传计算、生物分子对接实验和分子结构和/或过程如分子相互作用的虚拟表示。
[0190] 如本文所用,“数据加工路径”指确定所得数据(即,试验最终结果)的生物学显著性的过程,其可包含在软件内。例如,数据加工路径可基于采集的数据确定各核苷酸序列物质的含量。数据加工路径也可根据测得的结果控制仪器和/或数据采集路径。数据加工路径和数据采集路径通常整合并提供反馈以操纵设备的数据获取,并从而提供本文所述基于
测试的评判方法。
[0191] 如本文所用,软件指在计算机执行时进行计算机操作的计算机可读程序指令。通常,在含有程序指令的程序产品上提供软件,所述指令记录在计算机可读介质上,包括但不限于:磁性介质包括软盘、硬盘和磁带;和光学介质,包括CD-ROM盘、DVD盘、磁光盘,和其它可记录所述程序指令的此类介质。
[0192] 预测异常或正常的不同方法可产生不同类型结果。对任何给定预测,有四种可能的结果类型:真阳性、真阴性、假阳性或假阴性。本文所用术语“真阳性”指对象正确诊断为具有染色体异常。本文所用术语“假阳性”指对象错误鉴定为具有染色体异常。本文所用
术语“真阴性”指对象正确鉴定为不具有染色体异常。本文所用术语“假阴性”指对象错误鉴定为不具有染色体异常。可根据发生比例对任何给定方法计算两种性能度量:(i)灵敏
度值,正确鉴定为阳性的预测阳性中的占比(例如,由水平比较检测/测定指示染色体异常
所正确鉴定的核苷酸序列组相对由此正确或不正确鉴定的所有核苷酸序列组的占比),从
而反映染色体异常检测结果的准确性;和(ii)特异性值,正确鉴定为阴性的预测阴性中的
占比(由水平比较检测/测定指示染色体正常所正确鉴定的核苷酸序列组相对由此正确或
不正确鉴定的所有核苷酸序列组的占比),从而反映染色体异常检测结果的准确性。
实施例
[0193] 仅以说明的形式而非限制的形式提供以下实施例。本领域技术人员不难了解,可改变或调整各种非关键参数而获得基本相同或相似的结果。
[0194] 在下文实施例1中,申请人利用能捕获甲基化DNA的新型融合蛋白联合CpG岛阵列来鉴定在胎儿胎盘组织和母体血液之间差异甲基化的基因组区。采用严紧的统计方法,
仅选择在样品间显示很少变化并因此提示潜在生物机制的区域。证实了主要位于染色体
13、18和21的85种差异甲基化基因组区。就此验证而言,采用基于定量质谱的方案研究覆
盖这85个区域的261种PCR扩增子。结果有很好的一致性(95%证实),证明该方法的可
行性。
[0195] 申请人接着提供用于非整倍性测试的创新方法,其依赖于绝对拷贝数测量而非等位基因比例。
[0196] 实施例1
[0197] 在下面的实施例中,用10种成对母体与胎盘DNA样品来鉴定差异甲基化区。采用基于质谱的定量甲基化试验证实这些结果。首先,先提取来自母体暗黄层和相应胎盘组织
的基因组DNA。接着,用MBD-FC捕获各DNA样品的甲基化部分。见图1-3。这两种组织部分
用不同的荧光染料标记并与Agilent CpG岛微阵列杂交。见图4。这通过鉴定可用于产
前诊断的差异甲基化区来完成。因此,用两种标准选择基因组区作为潜在的富集标记物:所观察到的甲基化差异必须存在于所有测试的样品对中,且所述区域的长度必须大于200bp。
[0198] DNA制备与片段化
[0199] 来自母体暗黄层和胎盘组织的基因组DNA(gDNA)分别采用来自凯杰公司(德国海TM
尔登)的QIAamp DNA迷你试剂盒(QIAamp DNA Mini Kit )和QIAamp DNA血液迷你试剂
TM TM
盒(QIAamp DNA Blood Mini Kit )制备。对于MCIp,gDNA采用NanoDrop ND 1000 分光
光度计(塞摩费舍尔公司(Thermo Fisher),美国马萨诸塞州沃森姆)定量。2.5μg DNA
在500μl TE缓冲液中超声处理至平均片段大小为300-500bp,用必能信(Branson)数字
TM
超声分散仪450 (美国康涅狄格州丹伯里)进行,采用以下设定:振幅20%,超声时间110
秒,脉冲开启/脉冲关闭时间1.4/0.6秒。用凝胶电泳监测片段范围。
[0200] 甲基-CpG免疫沉淀
[0201] 对每个样品,将56μg纯化MBD-Fc蛋白和150μl蛋白质A琼脂糖4快速流动珠(新泽西州皮斯卡特维的安玛西亚生物科学公司(Amersham Biosciences ))在15ml TBS
中4℃旋转过夜。然后,转移MBD-Fc珠(150μl/试验)并分入2ml Ultrafree-CL离心过
滤装置(美国马塞诸塞州比尔瑞卡的密理博公司(Millipore ))中,并用缓冲液A(20mM
Tris-HCl,pH8.0,2mM MgCl2,0.5mM EDTA 300mM NaCl,0.1%NP-40)离心-清洗3次。将
经超声处理的DNA(2μg)加入含经清洗MBD-Fc珠的2ml缓冲液A中,并4℃旋转3小时。
将珠离心以回收未结合的DNA片段(300mM部分),然后用NaCl浓度递增(400、500、550、
600和1000mM)的600μl缓冲液清洗2次。将各清洗步骤的流出液采集在单独的管中,并
TM
用MinElute PCR纯化试剂盒(MinElute PCR Purification Kit ,凯杰公司)脱盐。平行
地,用MinElute PCR纯化试剂盒(凯杰公司)加工200ng经超声处理的输入DNA作为对照。
[0202] 微阵列处理与分析
[0203] 为产生用于微阵列杂交的荧光标记DNA,将各样品的600mM和1M NaCl部分(经富集的甲基化DNA)合并且用Alexa Fluor 555-aha-dCTP(母体)或Alexa Fluor
647-aha-dCTP(胎盘)经BioPrime总基因组标记系统(BioPrime Total Genomic Labeling
TM
System ,美国加利福尼亚州卡尔斯巴德的英杰公司(Invitrogen ))标记。根据生产商
的手册进行标记反应。匹配母体/胎盘对的差异标记基因组DNA片段合并至终体积80μl,
补充50μg Cot-1 DNA(英杰公司),52μl的安捷伦(Agilent)10X封闭试剂(美国加州圣
克拉拉的安捷伦技术公司(Agilent Technologies )),78μl去离子甲酰胺和260μl安
捷伦2X杂交缓冲液。样品加热至95℃保持3分钟,混合并随后在37℃孵育30分钟。然后
TM
用安捷伦SureHyb 室和安捷伦杂交箱于67℃在安捷伦CpG岛微阵列试剂盒(CpG Island
TM
Microarray Kit )上进行40小时的杂交。将阵列片在Wash I(6X SSPE,0.005%N-月桂
基肌氨酸)中室温清洗5分钟,再在Wash II(0.06X SSPE)中37℃清洗5分钟。接着,将阵
TM
列片分别在乙腈和安捷伦臭氧保护溶液(Ozone Protection Solution )中浸入30秒钟。
TM
用安捷伦DNA微阵列扫描仪(DNA Microarray Scanner )立即扫描图像并分析。用特征提
取软件9.5版(Feature Extraction Software v9.5)和标准CGH方案处理微阵列图像。
[0204] 亚硫酸氢盐处理
[0205] 用EZ-96 DNA甲基化试剂盒(EZ-96 DNA Methylation KitTM,加利福尼亚州橙县的ZR公司(ZymoResearch))进行基因组DNA的亚硫酸氢钠转化。按生产商方案进行,使用
1ug基因组DNA和替代转化方案(两温度的DNA变性)。
[0206] 定量甲基化分析
[0207] 用塞昆纳姆公司的MassARRAY 系统进行定量甲基化分析。该系统利用基体辅助激光解吸电离飞行时间(MALDI-TOF)质谱和RNA碱基特异性切割(Sequenom
TM
MassCLEAVE )的组合。然后就甲基化状态分析可检测模式。PCR引物采用Sequenom
TM
EpiDESIGNER (www.epidesigner.com)设计。覆盖85个靶区的总共261个扩增子用于验证
(扩增长度中值=367bp,最小值=108,最大值=500;每个扩增子的CpG数中值=23,最小值=4,最大值=65)。对于各反向引物,添加用于体内转录的额外T7启动子标签,以及在正向引物上添加10聚体标签用于调整解链温度差异。MassCLEAVE(tm)生物化学按此前所述
进行(Ehrich M,等(2005)Quantitative high-throughput analysis of DNA methylation patterns by base specific cleavage and mass spectrometry.(通过碱基特异性切割
和质谱定量高通量分析DNA甲基化模式)Proc Natl Acad Sci U S A 102:15785-15790)。
TM TM
采用MassARRAY 小型MALDI-TOF(圣迭戈的塞昆纳姆公司)获取质谱,并用EpiTYPER 软
件1.0版产生甲基化比例(圣迭戈的塞昆纳姆公司)。
[0208] 统计分析
[0209] 采用R统计软件包(www.r-project.org)进行所有统计计算。首先,将阵列探针根据其基因组位置分组。随后将相隔小于1000bp的探针归在一起。为鉴定差异甲基化区,
用对照样品作为参比。在对照样品中,将源自血液的对照DNA的甲基化部分对其自身杂交。
理想地,该样品应显示两个颜色通道的对数比约为0。但是由于杂交行为的可变性,探针显示平均对数比为0.02而标准偏差为0.18。接着,将我们样品中所观察到的对数比与对照样
品比较。采用双向成对t-检验来检验各组相同的零假设。所含探针少于4个的组从分析
中排除。对于包括4个或5个探针的组,所有探针都用于成对t-检验。对于有6个或更多
探针的组,采用每次由5个探针组成的滑动窗,其中该窗以一个探针的增量移动。各测试样品与对照样品作比较,记录p值。若10个样品中有8个显示p值<0.01,或者若10个样
品中有6个显示p值<0.001,则基因组区选为差异甲基化。当某组显示不足8个样品的p
值<0.01,以及不足6个样品的p值<0.001,则基因组区分类为非差异甲基化。不落入任
一分类的样品从分析中排除。对于已鉴定为差异甲基化的基因组区子集,采用定量甲基化
分析证实结果。
[0210] 用在线GOstat工具(http://gostat.wehi.edu.au/cgibin/-goStat.pl)进行Go分析。P值采用菲希尔精确检验(Fisher’s exact test)计算。
[0211] 基于微阵列的标记物发现结果
[0212] 为鉴定差异甲基化区,采用标准样品,其中单核细胞的甲基化DNA部分与其自身杂交。该标准提供用于基因组区中荧光检测变化的参比。然后通过将10种胎盘/母体样
品的各对数比与该标准作比较鉴定差异甲基化区。由于本研究的目的是鉴定能够可靠分离
母体和胎儿DNA的标记物,靶选择局限于在基因组DNA某连续延伸段显示稳定、一贯的甲基
化差异的基因。这将分析着重于多个探针表明差异甲基化的基因组区。该选择也局限于所
有样品均显示差异甲基化的靶区,排除有强个体间差异的那些。样品中的两个在微阵列分
析中显示的对数比一般较低。因为用成对检验进行靶选择,这对结果没有负面影响。
[0213] 根据这些选择标准,鉴定出在母体和胎儿DNA间差异甲基化的3043个基因组区。21778个区不显示甲基化差异。未观察到差异甲基化区分布的染色体间偏差。差异甲基化
区位于2159个已知基因附近或其内部。大部分差异甲基化区位于启动子区(18%)和编码
区内(68%),而仅有少数区域位于基因下游(7%)或自启动子到编码区的过渡段(7%)。
不显示差异甲基化的区域显示相似的启动子(13%)和下游(5%)位置分布,但位于启动
子到编码区的过渡段中的区部分较高(39%),而位于编码区内的部分较低(43%)。
[0214] 已在胚胎干细胞(ES)中显示,由多梳抑制复合体2(PRC2)靶向的基因中富集调节发育的基因(Lee TI,等(2006)Control of developmental regulators by Polycomb in
human embryonic stem cells.(在人胚胎干细胞中通过多梳控制发育调节子)Cell 125:
301-313)。也已显示在很多癌类型中差异甲基化基因富集PRC2靶向的基因(Ehrich M,等
(2008)Cytosine methylation profiling of cancer cell lines.(癌细胞系的胞嘧啶甲
基化分析)Proc Natl Acad Sci U S A 105:4844-48)。本研究中鉴定为差异甲基化的基因组也富集PRC2靶向的基因(p值<0.001,让步比=3.6,让步比=3.1-4.2的CI为95%)。
对差异甲基化基因组的GO分析显示该组显著富集在发育中重要的功能。10种最富集的功
能中有6种包括发育或形态过程[解剖结构形态(GO:0009653,p值=0),发育过程(GO:
0032502,p值=0),多细胞生物发育(GO:0007275,p值=0),器官发育(GO:0048513,p值=0),系统发育(GO:0048731,p值=0)和解剖结构的发育(GO:0048856,p值=0)]。
[0215] 用Sequenom EpiTYPERTM验证
[0216] 为验证微阵列的发现,选择来自染色体13、18和21的63个区域和来自其它常染TM
色体的另外26个区域用于通过不同技术证实。塞昆纳姆公司的EpiTYPER 技术用来定量检
TM
测母体和胎盘样品中的DNA甲基化。对于EpiTYPER 方法的解释可参见Ehrich M,Nelson
MR,Stanssens P,Zabeau M,Liloglou T,Xinarianos G,Cantor CR,Field JK,van den Boom D(2005)Quantitative high-throughput analysis of DNA methylation patterns
by base specific cleavage and mass spectrometry.(通过碱基特异性切割和质谱对DNA
甲基化模式的定量高通量分析)Proc Natl Acad Sci U S A 102:15785-15790)。对靶区
中各单独的CpG位点,计算所有母体DNA样品间和所有胎盘样品间的平均甲基化值。然后
将平均母体和胎盘甲基化之间的差异与微阵列结果作比较。两种技术的结果具有良好的一
致性(见图7)。对于85个靶区,定量结果证实微阵列结果(95%证实率)。对于均位于染
色体18的4个靶区,结果未被证实。这一偏差的原因目前尚不清楚。
[0217] 与着重于鉴定甲基化差异的微阵列相反,DNA甲基化的定量检测能分析绝对甲基化值。在85个经证实差异甲基化区的验证组中,有26个区域的子集在母体DNA样品中更
为甲基化,而59个区域在胎盘样品中更为甲基化(见表1A)。有意思的是,与在胎盘样品中
高甲基化的基因相比,在胎盘样品中低甲基化的基因倾向于显示更大的甲基化差异(低甲
基化基因的甲基化差异中值=39%,高甲基化基因的中值=20%).
[0218] 实施例2
[0219] 实施例2描述用于检测母体样品中存在的胎儿核酸量的无创性方案(本文称作“胎儿定量方法”),其可用于检测或证实胎儿性状(例如,RhD相容性的胎儿性别)或诊断
染色体异常如三体性21(本文将两者均称作“基于甲基化的胎儿诊断方法”)。图10显示
胎儿定量方法的一种实施方式,而图11显示基于甲基化的胎儿诊断方法的一种实施方式。
两种方法都采用获自母体样品的胎儿DNA。样品含有差异甲基化的母体和胎儿核酸。例如,样品可以是母体血浆或血清。胎儿DNA在母体血浆中约占总DNA的2-30%。胎儿对样品中
所存在总核酸的确切作用量视不同妊娠而变化,且可根据多种因素而变化,包括但不限于:
孕龄、母亲的健康和胎儿的健康。
[0220] 如本文所述,在母体血浆中分析胎儿DNA的技术难题在于需要能够从共存的背景母体DNA区分胎儿DNA。本发明的方法利用某些差异,例如在胎儿和母体DNA间观察到的差
异甲基化,作为母亲样品中存在的相对小百分数的胎儿DNA的富集手段。该方法的无创本
质提供了相对于常规产前诊断方法的主要优势,所述常规方法如羊膜穿刺术、绒膜绒毛取
样和脐穿刺,它们与小但限定的胎儿丢失风险相关联。而且,由于本方法不取决于处于任一特定细胞期的胎儿细胞,本方法提供快速检测手段来确定染色体异常的存在及其性质。此
外,本方法为性别独立性(即,无需存在Y染色体)和多态性独立性(即,不确定等位基因
比例)。因此,本发明所述组合物和方法代表经改善的用于准确测定母体样品中胎儿核酸量的通用无创性方法。
[0221] 试验设计与优势
[0222] 需要准确检测并定量无创分离自母体样品的胎儿DNA。本发明利用母体血浆或血清中存在的循环无细胞胎儿核酸(ccfDNA)。为了商业与临床的实用性,本发明所述方法
应当仅消耗小部分有限可得的胎儿DNA。例如,少于样品的50%,40%,30%,25%,20%,
15%,10%,5%或更少。此外,本方法还优选以多通路试验形式开发,其中包括以下试验中的一种或多种(优选全部):
[0223] ●用于检测样品中存在的基因组等价物总量的试验,即,同时识别母体和胎儿DNA物质的试验;
[0224] ●用于测定分离自雄性妊娠的胎儿DNA即染色体Y特异性序列的试验;
[0225] ●针对鉴定为在胎儿和母体间差异甲基化的区域特异性的试验;或
[0226] ●针对已知在所有研究组织中低甲基化的区域特异性的试验,其能用作限制效率的对照。
[0227] 所述试验的其它特征可包括以下一项或多项:
[0228] ●对于各试验,除了竞争物的可区分特征外,与靶序列相同或基本相同的靶特异性竞争寡核苷酸,例如相对靶序列相差一个或多个核苷酸。该寡核苷酸在加入PCR反应时
将与靶一起共扩增,获自这两种PCR扩增子间的比例将表明存在于母体样品中的靶特异性
DNA序列的量(例如,来自特定基因座的胎儿DNA)。
[0229] ●扩增子长度应优选为相似长度以避免扩增偏向较短片段。但是,只要扩增效率大致相等,可使用不同长度。
[0230] ●差异甲基化靶可选自表1A-1C或选自已知在母亲和胎儿间差异甲基化的任何其它靶。这些靶可以在分离自非妊娠女性的DNA中低甲基化,而在获自胎儿样品的样品中
高甲基化。这些试验将用作限制效率的对照。
[0231] ●获自不同试验的结果可用于定量以下一种或多种:
[0232] ○样品中存在的可扩增基因组的总数(基因组等价物的总量);
[0233] ○可扩增基因组的胎儿占比(胎儿浓度或百分数);或
[0234] ○胎儿衍生DNA序列之间(例如,胎儿染色体21和参比染色体如染色体3之间)拷贝数的差异。
[0235] 测试所用试验的示例
[0236] 以下是用于进行本发明某方法(如图10中所提供)的反应步骤的概述。这一概述不用于限定本发明的范围。而是提供本发明采用Sequenom MassARRAY 技术的一种实
施方式。
[0237] 1)从血浆样品分离DNA。
[0238] 2)用甲基化敏感的限制性酶(例如,HhaI和HpaII)消化DNA靶标。
[0239] 对于各反应,将可用DNA与水混合至终体积25ul。
[0240] 添加由10单位HhaI,10单位HpaII和反应缓冲液组成的10ul反应混合物。将样品在最适温度下与限制性酶一起孵育。HhaI和HpaII消化未甲基化DNA(且不消化半-或
完全甲基化DNA)。消化后,用加热步骤将酶变性。
[0241] 3)基因组扩增-通过添加PCR试剂(缓冲液,dNTP,引物和聚合酶)在总体积50ul中进行PCR。下文提供示例性PCR和延伸引物。此外,以已知浓度添加合成的竞争寡核苷
酸。
[0242] 4)平行重复(可选)-PCR后,将50ul反应分成5ul的平行反应(平行重复品)以使测试的PCR后步骤引入的变化最小。PCR后步骤包括SAP,引物延伸(MassEXTEND 技
术),树脂处理,Spectrochip和MassARRAY的分配。
[0243] 5)可扩增基因组的定量-用塞昆纳姆公司MassARRAY 技术测定各试验扩增产物的量。PCR后,用单碱基延伸试验研究经扩增区域(包括步骤3中引入的竞争寡核苷酸)。
引入设计用于直接杂交至感兴趣位点附近的特异性延伸引物。见下文提供的延伸引物。这
些DNA寡核苷酸称作iPLEX MassEXTEND 引物。延伸反应中,iPLEX引物与互补DNA模
板杂交并用DNA聚合酶延伸。含有不同脱氧和双脱氧核苷酸三磷酸组合和酶及缓冲液的特
定终止混合物,指导iPLEX引物的有限延伸。发生引物延伸直至掺入互补的双脱氧核苷酸。
[0244] 延伸反应产生不同长度的引物产物,各具有独特的分子量。结果是,引物延伸产物可以采用基体辅助激光解吸/电离飞行时间(MALDI-TOF)质谱法在MassARRAY 小型分析仪上同时分离并测定。此分离和测定后,用塞昆纳姆公司的专有软件自动分析数据。
[0245] 6)计算胎儿核酸的量和浓度-用于计算样品中存在的基因组等价物总量的方法,下文图18和19中提供分离自雄性妊娠的胎儿核酸的量(及浓度),和基于差异甲基化靶的
胎儿核酸的量(及浓度)。
[0246] 以上方案可用于进行一种或多种下述试验。除了下文直接提供的序列外,下表X中提供了研究多种靶标的多通路方案。
[0247] 1)用于定量样品中可扩增基因组等价物总数的试验
[0248] 在不位于染色体13、18、21、X或Y上的持家基因中选择靶标。所述靶标应在单拷贝基因中,且不含有甲基化敏感的限制性酶的任何识别位点。
[0249] 带下划线的序列是PCR引物位点,斜体为单碱基延伸引物的位点,而粗体字母(C)是人DNA上延伸的核苷酸
[0250] ApoE 染色体19:45409835-45409922 DNA靶序列,所研究核苷酸C为粗体。本节提供的所有染色体位置均来自2009年2月的UCSC基因组构建(Genome Build)。
[0251] GATTGACAGTTTCTCCTTCCCCAGACTGGCCAATCACAGGCAGGAAGATGAAGGTTCTGTGGGCTGCGTTGCTGGTCACATTCCTGGC
[0252] ApoE正向引物:5’-ACGTTGGATG-TTGACAGTTTCTCCTTCCCC(引物含有5’10bp的MassTag,隔以短划线)
[0253] ApoE反向引物:5’-ACGTTGGATG-GAATGTGACCAGCAACGCAG(引物含 有5’10bpMassTag,隔以短划线)
[0254] ApoE延伸引物:5’-GCAGGAAGATGAAGGTT[C/T]引物在人DNA靶上延伸C,在合成DNA靶上延伸T
[0255] ApoE合成竞争寡核苷酸:
[0256] 5’-GATTGACAGTTTCTCCTTCCCCAGACTGGCCAATCACAGGCAGGAAGATGAAGGTTTTGTGGGCTGCGTTGCTGGTCACATTCCTGGC(位置57处的粗体T不同于人DNA)
[0257] 2)用于定量样品中染色体Y序列总数的试验
[0258] 选择Y染色体特异性靶标,其在基因组他处没有相似或旁系同源物序列。所述靶标优选在单拷贝基因中,且不含有甲基化敏感的限制性酶的任何识别位点。
[0259] 带下划线的序列是PCR引物位点,斜体核苷酸为单碱基延伸引物的位点,而粗体字母(C)是人DNA上延伸的核苷酸。
[0260] chrY:2655628-2655717上的SRY(反向互补)
[0261] GAGTTTTGGATAGTAAAATAAGTTTCGAACTCTGGCACCTTTCAATTTTGTCGCACTCTCCTTGTTTTTGACAATGCAATCATATGCTTC
[0262] SRY正向引物:5’-ACG-TGGATAGTAAAATAAGTTTCGAACTCTG(引物含有5′3 bpMassTag,隔以短划线)
[0263] SRY反向引物:5’-GAAGCATATGATTGCATTGTCAAAAAC
[0264] SRY延伸引物:5’-aTTTCAATTTTGTCGCACT[C/T]引物在人DNA靶上延伸C,在合成DNA靶上延伸T。5’小写字母“a”是非互补核苷酸
[0265] SRY合成竞争寡核苷酸:5’-
[0266] GAGTTTTGGATAGTAAAATAAGTTTCGAACTCTGGCACCTTTCAATTTTGTCGCACTTTCCTTGTTTTTGACAATGCAATCATATGCTTC
[0267] 3)用于定量样品中存在的胎儿甲基化DNA序列的试验
[0268] 从已知在母体和胎儿DNA间差异甲基化的区域中选择靶标。选择含有多个用于甲基化敏感酶的限制性位点的序列。就本研究而言,采用HhaI(GCGC)和HpaII(CCGG)酶。
[0269] 带下划线的序列是PCR引物位点,斜体为单碱基延伸引物的位点,而粗体字母(C)是人DNA上延伸的核苷酸,小写字母是甲基化敏感的限制性酶的识别位点。
[0270] chr12:115124905-115125001上的TBX3
[0271] GAACTCCTCTTTGTCTCTGCGTGCccggcgcgcCCCCCTCccggTGGGTGATAAACCCACTCTGgcgccggCCATgcgcTGGGTGATTAATTTGCGA
[0272] TBX3正向引物:5’-ACGTTGGATG-TCTTTGTCTCTGCGTGCCC(引物含有5′10bpMassTag,隔以短划线)
[0273] TBX3反向引物:5’-ACGTTGGATG-TTAATCACCCAGCGCATGGC(引物含有5′10bpMassTag,隔以短划线)
[0274] TBX3延伸引物:5’-CCCCTCCCGGTGGGTGATAAA[C/T]引物在人DNA靶上延伸C,合成DNA靶上延伸T。5’小写字母“a”是非互补核苷酸
[0275] TBX3合成竞争寡核苷酸:
[0276] 5’-GAACTCCTCTTTGTCTCTGCGTGCCCGGCGCGCCCCCCTCCCGGTGGGTGATAAATCCACTCTGGCGCCGGCCATGCGCTGGGTGATTAATTTGCGA
[0277] 4)用于酶限制性效率的对照试验。
[0278] 从已知在所研究的任何组织中都不甲基化的区域中选择靶标。所选序列含有不超过一个的各待用限制性酶的位点。
[0279] 带下划线的序列是PCR引物位点,斜体核苷酸表示单碱基延伸引物的位点,而粗体字母(G)是人DNA上延伸的反向核苷酸,小写字母是甲基化敏感的限制性酶的识别位点。
[0280] CACNA1G chr17:48637892-48637977(反向互补)
[0281] CCATTGGCCGTCCGCCGTGGCAGTGCGGGCGGGAgcgcAGGGAGAGAACCACAGCTGGAATCCGATTCCCACCCCAAAACCCAGGA
[0282] HhaI正向引物:5’-ACGTTGGATG-CCATTGGCCGTCCGCCGTG(引物含有5′10bpMassTag,隔以短划线)
[0283] HhaI反向引物:5’-ACGTTGGATG-TCCTGGGTTTTGGGGTGGGAA(引物含有5′10bpMassTag,隔以短划线)
[0284] HhaI延伸引物:5’-TTCCAGCTGTGGTTCTCTC
[0285] HhaI合成竞争寡核苷酸:5’-
[0286] CCATTGGCCGTCCGCCGTGGCAGTGCGGGCGGGAGCGCAGAGAGAGAACCACAGCTGGAATCCGATTCCCACCCCAAAACCCAGGA
[0287] 验证实验
[0288] 采用模式系统和临床样品测定本发明的灵敏度和准确性。在不同样品中,运行多通路实验,含有针对总拷贝数定量的2种试验,针对甲基化定量的3种试验,特异性针对染
色体Y的1种试验和1种消化对照试验。见表X。表Y中提供具有额外试验的另一多通路
方案。
[0289]
[0290]
[0291] 采用基因组DNA的模式系统
[0292] 为了确定本方法在检测样品中可扩增基因组拷贝总数时的灵敏度和准确性,测试分离自非妊娠女性的不同DNA样品的子集。各样品稀释至每个反应约含2500、1250、625或
313拷贝。通过对获自3个总拷贝数试验的DNA/竞争物比例取均值获得可扩增基因组拷贝
的总数。图12显示来自4个不同样品的结果。
[0293] 为了优化反应,开发模式系统来模拟分离自血浆的DNA样品。这些样品含有恒定量的母体未甲基化DNA且掺有不同量的雄性胎盘甲基化DNA。样品掺有的量相对母体未甲
基化DNA的范围为约0-25%。图13A和B中显示结果。采用甲基化试验(图13A)和SRY
标记物(图13B)与总拷贝数试验所得的比例计算胎盘DNA占比。上文提供了用于甲基化
试验(TBX),Y染色体试验(SRY)和总拷贝数(APOE)的引物序列。该模式系统证明基于甲
基化的方法与Y染色体方法(SRY标记物)等同进行,从而证实基于甲基化的方法是性别独
立性胎儿定量方法。
[0294] 血浆样品
[0295] 为研究本方法在临床样品中的灵敏度和准确性,采用表X所示多通路方案研究获自孕有雄性胎儿的女性的33个血浆样品。对于各反应,使用四分之一的获自4ml提取物的
DNA,以满足仅使用部分总样品的重要要求。
[0296] 总拷贝数定量
[0297] 图14A和B中可见总拷贝数定量的结果。图14A中显示各样品的拷贝数。两个样品(编号25和26)具有的总拷贝数显著高于所有其它样品。一般,所得均值为约每毫升血
浆1300个可扩增拷贝(范围为766-2055)。图14B显示给定值的盒须图来概括结果。
[0298] 甲基化标记物和Y染色体标记物所得结果间的相关性
[0299] 图15A和B中绘制各样品的胎儿拷贝数。因为所有样品都来自雄性妊娠。可采用甲基化或Y染色体特异性标记物来计算所得拷贝数。由图15B可见,给定值的盒须图表明
两种不同测定之间的最小差异。
[0300] 图16所示结果表明甲基化标记物和Y染色体标记物(SRY)所得结果间的相关性。同样,基于甲基化的方法与Y染色体方法(SRY标记物)等同进行,进一步证实基于甲基化
的方法是性别独立性和多态性独立性的胎儿定量方法。采用表X中公开的多通路试验确定
胎儿核酸的量。
[0301] 最后,采用对照与竞争物的比例并将该值与总拷贝数试验均值比较来确定消化效率。见图17。除样品26以外,所有反应的效率都超过99%。
[0302] 数据分析
[0303] 采用Typer 4(塞昆纳姆公司软件产品)完成质谱分析。确定各单独DNA分析物和竞争物试验的峰高(噪音上信号),并输出用于进一步分析。
[0304] 通过将DNA特异性峰除以竞争物特异性峰给出比例来计算各扩增子存在的分子总数。(图18和19中的“DNA”峰可视为给定试验的分析物峰)。由于已知加入反应中的
竞争物分子数,可通过将该比例乘以所添加的竞争物分子数来确定DNA分子的总数。
[0305] 采用针对雄性妊娠的Y染色体特异性标记物和针对所有妊娠的甲基化占比均值计算各样品中胎儿DNA占比(或浓度)。简要来说,对于染色体Y,通过将分析物(DNA)峰
除以竞争物峰获得比例,并将该比例乘以加入反应中的竞争物分子数量。将该值除以由可
扩增基因组等价物测定(采用针对总量的试验)总数所得的相似比例。见图18。由于样品
中存在的核酸总量是母体和胎儿核酸的加和,胎儿份额可视为对较大的背景母体份额的占
比。因此,将此翻译成图18所示等式,样品中存在的总核酸的胎儿占比(k)等于等式:k=
2xR/(1-2R),其中R是Y染色体量和总量间的比例。由于Y染色体是单倍体,且用于总量的
试验采用二倍体靶标确定,该计算局限于胎儿占比小于母体占比50%的情况。
[0306] 图19中,显示通过采用甲基化特异性标记物(见用于甲基化定量的试验)针对胎儿浓度的类似计算。与Y染色体特异性标记物相反,这些标记物来自二倍体靶标,因此可忽略就Y染色体特异性试验所述限制。因此,胎儿占比(k)可用下式确定:k=R(1-R),其中
R是甲基化试验和总试验之间的比例。
[0307] 模拟
[0308] 进行的第一个简单检定力计算假设测量系统采用来自染色体21的20种标记物和来自一条或多条其它常染色体的20种标记物。始于100拷贝的胎儿DNA,测量标准偏差为
25拷贝且I型误差概率低于0.001,发现本发明所述方法能在99.5%的所有情况中区分二
倍体和三倍体染色体组。例如,此类方法的实用性应用可采用质谱、利用竞争性PCR方法进行绝对拷贝数测定的系统完成。该方法能在单个反应中运行20种试验,并已显示在重复测
定中的标准偏差约为3-5%。该方法用于与区分甲基化和未甲基化核酸的已知方法联用,例如,采用甲基结合剂分离核酸或采用甲基化敏感的酶消化母体核酸。图8显示MBD-FC蛋白
(甲基结合剂)在过量未甲基化DNA存在时捕获甲基化DNA并从而分离甲基化DNA的效力
(见图8)。
[0309] 进行第二种统计检定力分析来评估本文所述基于甲基化的胎儿诊断方法的实施方式的预测力。设计所述模拟以证明区分三体性染色体21特异性标记物组与参比标记物
组(例如,染色体21以外的常染色体)的可能性。很多参数影响可靠区分两个标记物群的
能力。对于本模拟,各参数的选定数值为已经基于实验显示最可能发生的数值。采用下列
参数和相应值:
[0310] 拷贝数
[0311] 母体拷贝数=2000
[0312] 21、X和Y以外染色体的胎儿拷贝数=200
[0313] 整倍体胎儿中染色体21的胎儿拷贝数=200
[0314] 非整倍体T21胎儿中染色体21的胎儿拷贝数=300
[0315] 胎儿DNA(在基于甲基化富集前)百分数=10%(见上文)
[0316] 甲基化频率
[0317] 母体DNA靶区的平均甲基化百分数=10%
[0318] 胎儿DNA靶区的平均甲基化百分数=80%
[0319] 未甲基化且未消化母体DNA(即,限制性效率(等)的函数)的平均百分数=5%
[0320] 靶向染色体21的试验数=10
[0321] 靶向21、X和Y以外染色体的试验数=10
[0322] 结果见图20。显示x轴上的变异系数(CV)与采用简单t检验区分试验群体的检定力(y轴)间的关系。数据表明,假如CV等于或低于5%,所有情况中有99%能以0.001
的显著性水平区分两种群体(整倍体与非整倍体)。基于这一模拟,本方法代表用于产前检
测胎儿非整倍性的有力的无创性诊断方法,其为性别独立性并适用于所有种族(即,没有
等位基因偏好)。
[0323] 实施例3-其它差异甲基化靶标
[0324] 不位于染色体21上的差异甲基化靶标
[0325] 选择其它差异甲基化靶标用于基于此前微阵列分析的进一步分析。微阵列分析的说明见实施例1。在微阵列筛选中,定义胎盘组织和PBMC之间的差异甲基化区(DMR)。选
择区域用于根据胎盘中相对PBMC的高甲基化进行EpiTYPER证实。在选定改变的取向后,
根据统计学显著性选择区域,设计区域起始于最高显著性并根据显著性下行推进。在8种
成对PBMC和胎盘样品中进行这些研究。表1B中提供了其它非染色体21靶标,以及表4B
中各靶标的代表性基因组序列。
[0326] 位于染色体21上的差异甲基化靶标
[0327] 微阵列筛选仅发现DMR的子集位于染色体21上。但是,该微阵列对染色体21的覆盖率不充分。因此,完成进一步分析,采用UCSC基因组浏览器的标准设定来检查染色体
21上的所有356个CpG岛。如下表1C所示,这些靶标中的一些与表1A中已经检查的相重
叠。更具体地,采用塞昆纳姆公司的EpiTYPER 技术研究位于染色体21上的CpG位点,包
括各CpG上游和下游~1000bp。塞昆纳姆公司EpiTYPER 技术的说明参见实施例1“用
TM
塞昆纳姆公司EpiTYPER 验证”。在8种成对PBMC和胎盘样品中进行这些研究。此外,由
于DMR还可能位于限定的CpG岛外,在公众可得的微阵列数据中进行数据挖掘以鉴定潜在
的候选区,其具有下列特征:胎盘中相对母体血液的高甲基化,不位于限定的CpG岛内,含有超过4个CpG二核苷酸,且含有甲基化敏感的限制性酶的识别序列。然后采用塞昆纳姆
公司的EpiTYPER 技术在8种成对PBMC和胎盘样品上检查满足这些标准的区段。表1C中
提供了其它染色体21靶标,以及表4C中各靶标的代表性基因组序列。
[0328] 表1B和1C提供不同靶标的说明,包括其位置和是否在不同分析期经过分析,即微阵列分析、EpiTYPER 8分析和EpiTYPER 73分析。“是”表明其已分析,而“否”表明其未经分析。表1B和1C中各列的定义列举如下。
[0329] ●区段名称:各区段用位于限定区域内或其附近的基因命名。未列出基因名称而仅含有基因座的区段在其附近没有refseq基因。
[0330] ●基因区:对于在其紧邻处含有基因或者在基因内的区段,基因区进一步解释该区段与邻近基因的关系。
[0331] ●染色体:DMR所在的染色体,采用UCSC基因组浏览器的hg18构建。
[0332] ●起始:由UCSC基因组浏览器的hg18构建指定的DMR起始位置。
[0333] ●终止:由UCSC基因组浏览器的hg18构建指定的DMR终止位置。
[0334] ●微阵列分析:描述该区段是否通过微阵列分析再次/最初确定为差异甲基化。用MBD-Fc10蛋白分离10种成对胎盘和PBMC样品的甲基化占比。然后采用BioPrime总基
TM
因组标记系统 用Alexa Fluor 555-aha-dCTP(PBMC)或Alexa Fluor 647-aha-dCTP(胎
盘)标记两种组织占比并与安捷伦 CpG岛微阵列杂交。这些研究中检查的很多区段不包
含在初始的微阵列中。
[0335] ●EpiTYPER 8样品:描述该区段是否采用EpiTYPER技术分析并确定为在8种成对的胎盘和外周血单核细胞(PBMC)样品中差异甲基化。选用于检查的区段是基于多项标
准。首先,基于微阵列分析的数据选择区段。其次,采取对位于染色体21上的所有CpG岛
的全面检查。最后,对染色体21上CpG频率低于CpG岛内的选定区段进行检查。
[0336] ●EpiTYPER 73样品:描述该区段是否随后采用EpiTYPER技术在由73种成对胎盘和PBMC样品组成的样品组中进行分析。选择用于该第二样品组中分析的所有区段都根
据EpiTYPER 8列中所述实验的结果选出。更具体地,该额外组中的区段显示的甲基化概况
与EpiTYPER 8样品分析中所确定的相似。例如,表1B-1C列举的所有区段在所检查的限定
区域内CpG二核苷酸的显著部分表现出不同水平的DNA甲基化。CpG位点的差异DNA甲基
化采用成对T检验确定,若p值(将胎盘组织与PBMC作比较时)为p<0.05,则那些位点
认为是差异甲基化。
[0337] ●此前证实的EpiTYPER:描述该区段或该区段的部分在先前实验中是否采用EpiTYPER证实。(见实施例1和2)。
[0338] ●胎盘相对母体的甲基化:描述差异甲基化的取向。标为“高甲基化”区段是指定区段在胎盘样品中的甲基化多于PBMC,而“低甲基化”为指定区段在PBMC样品中更多甲基化。
[0339]
[0340]
[0341]
[0342]
[0343]
[0344]
[0345]
[0346]
[0347]
[0348]
[0349]
[0350]
[0351]
[0352]
[0353]
[0354]
[0355]
[0356]
[0357]
[0358]
[0359]
[0360]
[0361]
[0362]
[0363]
[0364]
[0365]
[0366]
[0367]
[0368]
[0369]
[0370]
[0371]
[0372]
[0373]
[0374]
[0375]
[0376]
[0377]
[0378]
[0379]
[0380]
[0381]
[0382]
[0383]
[0384]
[0385]
[0386]
[0387]
[0388]
[0389]
[0390]
[0391]
[0392]
[0393]
[0394]
[0395]
[0396]
[0397]
[0398]
[0399]
[0400]
[0401]
[0402]
[0403]
[0404]
[0405]
[0406]
[0407]
[0408]
[0409]
[0410]
[0411]
[0412]
[0413]
[0414]
[0415]
[0416]
[0417]
[0418]
[0419]
[0420]
[0421]
[0422]
[0423]
[0424]
[0425]
[0426]
[0427]
[0428]
[0429]
[0430]
[0431]
[0432]
[0433]
[0434]
[0435]
[0436]
[0437]
[0438]
[0439]
[0440]
[0441]
[0442]
[0443]
[0444]
[0445]
[0446]
[0447]
[0448]
[0449]
[0450] ***
[0451] 本文中引用的各专利、专利申请、出版物和文献的全部内容均通过引用纳入本文。对上述专利、专利申请、出版物和文献的引用并不表示承认上述任何内容是相关的现有技
术,也并不表示承认这些出版物或文献的内容或日期。
[0452] 可对上述内容进行改变而不背离本技术的基本方面。尽管参考一个或多个具体实施方式充分详细描述了本技术,但是本领域普通技术人员应认识到可对本申请中具体公开
的实施方式进行改变,只要这些改变和改进在本技术的范围和精神内。
[0453] 本文中适当描述的技术可在没有任何本文未具体公开元件的情况下实施。因此,例如,在本文的各个例子中,术语“包含”、“基本由……组成”和“由……组成”中的任何一个都可用其它两个中的任一个代替。已经使用的术语和表达用作说明而非限制性的术语,这
些术语和表达的使用并不排除所显示和所描述的特征或其部分的任何等价物,以及在要求
权利的本技术范围内可进行各种改良。术语“一个”或“一种”表示一种或多种其修饰的要素(例如“一种试剂”可表示一种或多种试剂),除非上下文清楚表示所描述的是要素之一
或是一种以上的要素。本文所使用的术语“约”表示在基础参数的10%范围内的数值(即
±10%),在一列数值的开头处使用术语的“约”表示修饰该列数值中的各数值(即,“约1、
2和3”指约1、约2和约3)。例如,“约100克”的重量可包括90克-110克的重量。此外,
当本文描述数值列表(例如,约50%,60%,70%,80%,85%或86%),该列表包括其所有中间值和分数值(例如,54%,85.4%)。因此,应理解,尽管通过代表性实施方式和任选的特征具体描述了本技术,但是本领域技术人员能对本文所公开内容进行改良和变化,应认为
这些改良和变化落在本技术的范围内。
[0454] 在所附权利要求书中陈述了本技术的某些实施方式。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈