首页 / 专利库 / 诊断设备和程序 / 免疫测定 / 免疫层析试验 / 妊娠试验 / 基于甲基化富集母体样品中胎儿核酸的非侵入性产前诊断用方法和组合物

基于甲基化富集母体样品中胎儿核酸的非侵入性产前诊断用方法和组合物

阅读:721发布:2020-06-15

专利汇可以提供基于甲基化富集母体样品中胎儿核酸的非侵入性产前诊断用方法和组合物专利检索,专利查询,专利分析的服务。并且本 发明 提供的组合物和方法,可利用母亲与其 胎儿 之间基因组区域甲基化的差异而分出、分离或富集母体样品中的胎儿核酸。本文所述组合物和方法可用于非侵入性产前诊断,包括检测非整倍性 染色 体。,下面是基于甲基化富集母体样品中胎儿核酸的非侵入性产前诊断用方法和组合物专利的具体信息内容。

1.一种制备胎儿核酸的方法,其包括:
a)提供妊娠女性的样品;
b)根据所述妊娠女性样品中胎儿核酸与母体核酸之间的不同甲基化状态分离该胎儿核酸与相应母体核酸,其中所述胎儿核酸包含SEQ ID NO:1-89所示一种或多种多核苷酸序列中的一个或多个CpG位点;和
c)通过将在步骤(b)中分离的胎儿核酸用作模板的方法,制备含胎儿核酸的核酸。
2.如权利要求1所述的方法,其特征在于,通过特异性结合甲基化核苷酸的物质分离所述胎儿核酸与所述母体核酸。
3.如权利要求2所述的方法,其特征在于,结合甲基化核苷酸的所述物质是甲基-CpG结合蛋白(MBD)或其片段
4.如权利要求2所述的方法,其特征在于,结合甲基化核苷酸的所述物质结合甲基化的胎儿核酸。
5.如权利要求2所述的方法,其特征在于,结合甲基化核苷酸的所述物质结合甲基化的母体核酸。
6.如权利要求2所述的方法,其特征在于,借助特异性结合未甲基化核苷酸的物质分离所述胎儿核酸与所述母体核酸。
7.如权利要求1所述的方法,其特征在于,借助特异性消化未甲基化母体核酸的物质分离所述胎儿核酸与所述母体核酸。
8.如权利要求7所述的方法,其特征在于,所述特异性消化未甲基化母体核酸的物质是甲基化敏感的限制性内切酶。
9.如权利要求8所述的方法,其特征在于,在同一反应中采用两种或更多种甲基化敏感的限制性内切酶。
10.如权利要求1所述的方法,其特征在于,步骤c)的过程是扩增反应。
11.如权利要求1所述的方法,其特征在于,步骤c)的过程是测定胎儿核酸的绝对含量的方法。
12.如权利要求1所述的方法,其特征在于,制备SEQ ID NO:1-89所示多核苷酸序列中的三种或更多种。
13.一种测定母体样品中胎儿核酸绝对含量的方法,其中所述母体样品包含差异甲基化的母体和胎儿核酸,所述方法包括:
a)用一种或多种甲基化敏感的限制性内切酶消化母体样品中的所述母体核酸,从而富集所述胎儿核酸;和
b)采用非多态性和非亚硫酸氢盐的定量测定方法测定步骤a)的胎儿核酸的绝对含量。
14.如权利要求13所述的方法,其特征在于,联用胎儿核酸的绝对含量或浓度与诊断方法来测定胎儿性状,其中所述诊断方法需要使给定的胎儿核酸绝对含量或浓度符合某些临床灵敏度或特异性要求。
15.一种测定母体样品中胎儿核酸浓度的方法,其中所述母体样品包含差异甲基化的母体和胎儿核酸,所述方法包括:
a)测定所述母体样品中存在的核酸总量;
b)用甲基化敏感的限制性内切酶消化母体样品中的所述母体核酸,从而富集所述胎儿核酸;
c)采用非多态性和非亚硫酸氢盐的定量测定方法测定步骤b)中胎儿核酸的含量;和d)比较步骤c)的胎儿核酸含量与步骤a)的核酸总量,从而测定所述母体样品中胎儿核酸的浓度。
16.如权利要求15所述的方法,其特征在于,联用胎儿核酸的绝对含量或浓度与诊断方法来测定胎儿性状,其中所述诊断方法需要使给定的胎儿核酸绝对含量或浓度符合某些临床灵敏度或特异性要求。
17.一种利用母体样品中的胎儿核酸测定胎儿非整倍性存在与否的方法,其中所述母体样品包含差异甲基化的母体和胎儿核酸,所述方法包括:
a)用甲基化敏感的限制性内切酶消化母体样品中的所述母体核酸,从而富集所述胎儿核酸;
b)采用非多态性和非亚硫酸氢盐的定量测定方法测定靶染色体的胎儿核酸含量;
c)采用非多态性和非亚硫酸氢盐的定量测定方法测定参比染色体的胎儿核酸含量;
d)比较步骤b)与步骤c)的胎儿核酸含量,胎儿靶核酸与胎儿参比核酸含量之间有统计学显著差异表明存在胎儿非整倍性。
18.如权利要求17所述的方法,其特征在于,测定靶染色体和参比染色体各自3和15个基因座之间的胎儿核酸含量。
19.如权利要求13、15或17所述的方法,其特征在于,测定所述甲基化敏感的限制性内切酶的消化效率。
20.如权利要求13、15或17所述的方法,其特征在于,实施所述定量测定的非多态性和非亚硫酸氢盐方法是采用基于竞争的方法测定胎儿核酸含量。
21.如权利要求13、15或17所述的方法,其特征在于,所述方法还包括测定母体样品中是否存在Y-染色体核酸。
22.如权利要求21所述的方法,其特征在于,测定母体样品中存在的男性胎儿的Y-染色体核酸含量。
23.如权利要求22所述的方法,其特征在于,比较所述胎儿核酸含量与所述Y-染色体核酸含量。
24.如权利要求13或15所述的方法,其特征在于,测定2、3、4、5、6、7、8、9、10、15、20、
30、40、50个或更多个基因座的胎儿核酸含量。
25.如权利要求13或17所述的方法,其特征在于,测定母体样品中存在的核酸总量。
26.如权利要求13、15或17所述的方法,其特征在于,测定核酸总量和男性胎儿的Y-染色体核酸含量。
27.如权利要求13、15或17所述的方法,其特征在于,测定核酸总量、男性胎儿Y-染色体核酸含量和甲基化敏感的限制性内切酶的消化效率。
28.如权利要求27所述的方法,其特征在于,采用两种或更多种试验测定核酸总量,采用一种或多种试验测定男性胎儿Y-染色体核酸含量和采用一种或多种试验测定甲基化敏感的限制性内切酶的消化效率。
29.如权利要求28所述的方法,其特征在于,测定3个或更多个基因座的胎儿核酸含量。
30.如权利要求13、15或17所述的方法,其特征在于,通过扩增反应测定胎儿核酸含量,所述扩增反应产生大于经消化的母体核酸的平均长度的扩增子,从而进一步富集所述胎儿核酸。

说明书全文

基于甲基化富集母体样品中胎儿核酸的非侵入性产前诊断

用方法和组合物

[0001] 相关专利申请
[0002] 本申请要求2008年9月16日提交,名为“基于甲基化富集母体样品中胎儿核酸的非侵入性产前诊断用方法和组合物”(PROCESSES AND COMPOSITIONS FOR
METHYLATION-BASED ENRICHMENT OF FETAL NUCLEIC ACID FROM A MATERNAL SAMPLE
USEFUL FOR NON INVASIVE PRENATAL DIAGNOSES)的美国临时专利申请号61/192,264的优
先权,其发明人为Mathias Ehrich,代理人档案号为SEQ-6022-PV。包括全部文本、表格和附图在内的以上专利申请的全部内容通过引用纳入本文。

技术领域

[0003] 在某些实施方式中,提供生物学标记。在一些实施方式中,提供的生物学标记可用于非侵入性检测胎儿的遗传性状(genetic traits)。某些胎儿遗传性状包括但不限于是否存在胎儿核酸。
[0004] 背景
[0005] 非侵入性产前检验正吸引越来越多的关注。这对于早期检测包括妊娠期间并发症和胎儿遗传缺陷在内的妊娠相关疾病至关重要,因为这样才能进行母亲和胎儿安全所需的
早期医学干预。业已通过例如绒膜绒毛取样(CVS)或羊膜穿刺等方法,利用从胎儿分离的
细胞进行产前诊断。然而,这些常规方法是侵入性的,对母亲和胎儿均有可观的险。国家卫生局(The National Health Service)最近指出侵入性羊膜穿刺和绒膜绒毛取样(CVS)
检查后的流产率为1-2%。
[0006] 自发现在母体血浆和血清中可检测到循环性非细胞胎儿核酸(Lo等.,Lancet350:485-487,1997;和美国专利6,258,540)后,已经开发了这些侵入性方法的备选方法进行产前筛选,例如检测胎儿异常。循环性非细胞胎儿核酸(cffNA)具有的数个优点使其更
适合非侵入性产前检验。例如,非细胞核酸的存在平高于胎儿细胞,其浓度足以进行遗传分析。分娩后,cffNA在数小时内从母体血流中被清除,可防止先前妊娠的污染。
[0007] 通过检测母体血浆或血清中胎儿DNA进行产前检验的例子,包括恒河猴D(RhD)基因分型(Lo等.,N.Engl.J.Med.339:1734-1738,1998)、胎儿性别测定(Costa等.,N.Engl.J.Med.346:1502,2002)和诊断几种胎儿疾病(Amicucci等.,Clin.Chem.46:301-302,
2000;Saito等.,Lancet 356:1170,2000;和Chiu等.,Lancet 360:998-1000,2002)。此外,有报道说先兆子痫(Lo等.,Clin.Chem.45:184-188,1999和Zhong等.,Am.J.Obstet.Gynecol.184:414-419,2001)、胎儿三体性21(Lo等.,Clin.Chem.45:1747-1751,1999和Zhong等.,Prenat.Diagn.20:795-798,2000)和妊娠剧吐(Sekizawa等.,Clin.Chem.47:
2164-2165,2001)中母体血浆/血清的胎儿DNA含量异常。
[0008] 概述
[0009] 本发明提供可用于非侵入性检查胎儿遗传性状,包括但不限于检测是否存在胎儿核酸、胎儿核酸的绝对或相对含量、胎儿性别和胎儿染色体异常,例如非整倍性。本发明的人外遗传学生物标记代表了在胎儿和母亲之间显示不同CpG甲基化模式的基因组DNA。本
发明的组合物和方法能根据母体样品中核酸的甲基化状态检测和定量测定所述样品中的
胎儿核酸。更具体地说,可根据存在的核酸总量测定母体样品中胎儿核酸的相对量,从而提供样品中胎儿核酸的百分数。此外,可采用序列特异性(或基因座特异性)模式测定胎儿核
酸含量,其灵敏度足以进行精确的染色体剂量分析(例如,检测胎儿非整倍性存在与否)。
[0010] 本发明一方面根据胎儿核酸与母体核酸之间甲基化的差异提供富集母体生物学样品中胎儿核酸的方法,包括以下步骤:(a)使样品的靶核酸和该样品的对照核酸结合于
甲基化特异性结合蛋白;和(b)根据甲基化状态(不同)洗脱结合的核酸,其中差异甲基化
的核酸至少部分洗脱成不同组分。在一个实施方式中,所述核酸序列包括SEQ ID NO:1-89所示多核苷酸序列中的一个或多个。SEQ ID NO:1-89见表4。本发明包括SEQ ID NO:1-89所示序列及其变体。在另一实施方式中,步骤(a)不包括对照核酸。
[0011] 在一相关实施方式中,提供富集母体样品中胎儿核酸的方法,包括以下步骤:(a)获得妇女的生物学样品;(b)根据样品中含CpG的基因组序列的甲基化状态(不同)分离胎儿核酸与母体核酸,其中胎儿的基因组序列与妇女的基因组序列甲基化程度不同,从而
可区分样品中妇女的基因组序列与胎儿的基因组序列。在另一实施方式中,所述基因组序
列至少长15个核苷酸,包含至少一个胞嘧啶,该区域还具有(1)选自表1的基因座;和(2)
该基因座上游和/或下游不超过10kb的DNA序列。在诸实施方式中,获得妇女的生物学样
品不限制本发明范围。这种获得指实际收集妇女的样品(例如,抽血)或从它处(例如诊
所或医院)接受样品并实施该方法的步骤。
[0012] 在另一相关实施方式中,提供富集母体样品中胎儿核酸的方法,包括以下步骤:(a)获得妇女的生物学样品;(b)根据样品中含CpG的基因组序列的甲基化状态(不同)消
化或除去母体核酸,其中胎儿的基因组序列与妇女的基因组序列甲基化程度不同,从而富
集样品中胎儿的基因组序列。可利用根据甲基化状态选择性消化或切割母体核酸的一种或
多种甲基化敏感性限制性内切酶消化母体核酸。在另一实施方式中,基因组序列至少长15
个核苷酸,包含至少一个胞嘧啶,其中该区域还由(1)选自表1的基因座;和(2)该基因座
上游和/或下游不超过10kb的DNA序列组成。
[0013] 在本发明另一方面,提供制备含有胎儿核酸的核苷酸序列的核酸的方法,包括以下步骤:(a)提供妊娠女性的样品;(b)根据胎儿核酸与相应母体核酸之间的不同甲基化
状态分离妊娠女性样品中的胎儿核酸与母体核酸,其中所述胎儿核酸的核苷酸序列在含有
SEQ ID NO:1-89所示多核苷酸序列之一的基因或基因座的多核苷酸序列中,包含SEQ ID
NO:1-89所示一个或多个多核苷酸序列的一个或多个CpG位点;和(c)通过扩增方法制备
包含胎儿核酸的核苷酸序列的核酸,其中步骤(b)分离的胎儿核酸用作模板。在另一实施
方式中,提供制备含有胎儿核酸的核苷酸序列的核酸的方法,包括以下步骤:(a)提供妊娠女性的样品;(b)根据胎儿核酸与相应母体核酸之间甲基化状态的不同消化或除去妊娠女
性样品中的母体核酸,所述胎儿核酸的核苷酸序列在含有SEQ ID NO:89所示多核苷酸序列之一的基因的多核苷酸序列中,包含SEQ ID NO:89所示一个或多个多核苷酸序列的一个或多个CpG位点;和(c)制备包含所述胎儿核酸的核苷酸序列的核酸。步骤(c)的制备过程
可以是杂交过程、捕捉过程、或将步骤(b)分离的胎儿核酸用作模板的扩增过程。在消化母体核酸的以上实施方式中,还可利用根据其甲基化状态选择性消化或切割核酸的一种或多
种甲基化敏感的限制性内切酶消化母体核酸。在另一实施方式中,SEQ ID NO:1-89所示多核苷酸序列可以在含有SEQ ID NO:1-89所示多核苷酸序列之一的CpG岛的多核苷酸序列
内。本文表1-3进一步表征了SEQ ID NO:1-89所示多核苷酸序列,包括鉴定与SEQ ID NO:
1-89所示多核苷酸序列重叠的CpG岛。在另一实施方式中,步骤(c)制备的是核酸溶液
在还有另一实施方式中,所述方法还包括定量测定步骤(c)的扩增过程的胎儿核酸。
[0014] 本发明的另一方面,提供相对于母体核酸富集妊娠女性样品中胎儿核酸的方法,包括以下步骤:(a)提供妊娠女性的样品;和(b)根据胎儿核酸与母体核酸之间不同的甲基
化状态分离该妊娠女性样品中的胎儿核酸与母体核酸,或捕捉胎儿核酸,所述胎儿核酸的
核苷酸序列在含有SEQ ID NO:1-89所示多核苷酸序列之一的基因的多核苷酸序列中,包含SEQ ID NO:1-89所示一个或多个多核苷酸序列的一个或多个CpG位点。在另一实施方式
中,SEQ ID NO:1-89所示多核苷酸序列可以在含有SEQ ID NO:1-89所示多核苷酸序列之
一的CpG岛的多核苷酸序列内。本文表1表征了SEQ ID NO:1-89所示多核苷酸序列。在
另一实施方式中,步骤(b)分离的是核酸溶液。在还有另一实施方式中,所述方法还包括扩增和/或定量测定步骤(b)分离过程的胎儿核酸。
[0015] 本发明的另一方面,提供包含分离自妊娠妇女的胎儿核酸的组合物,其中所述核酸的核苷酸序列包含SEQ ID NO:1-89所示多核苷酸序列中的一个或多个。在一个实施方
式中,所述核苷酸序列基本上由基因的核苷酸序列或其一部分组成。在另一实施方式中,所述核苷酸序列基本上由CpG岛的核苷酸序列或其一部分组成。表1进一步表征了SEQ ID
NO:1-89所示多核苷酸序列。在另一实施方式中,所述核酸为溶液。在另一实施方式中,相对于母体核酸富集胎儿的核酸。在另一实施方式中,所述组合物还包含结合甲基化核苷酸
的物质。例如,该物质可以是甲基-CpG结合蛋白(MBD)或其片段
[0016] 在本发明的另一方面,提供包含妊娠女性胎儿的分离核酸的组合物,其中所述核酸的核苷酸序列在含有SEQ ID NO:1-89所示多核苷酸序列之一的基因或其一部分的多核
苷酸序列中包含SEQ ID NO:1-89所示一个或多个多核苷酸序列的一个或多个CpG位点。
在另一实施方式中,所述核酸的核苷酸序列在含有SEQ ID NO:1-89所示多核苷酸序列之一的CpG岛或其一部分的多核苷酸序列中,包含SEQ ID NO:1-89所示一个或多个多核苷酸序
列的一个或多个CpG位点。表1进一步显示了SEQ ID NO:1-89所示多核苷酸序列的特征。
在另一实施方式中,所述核酸为溶液。在另一实施方式中,胎儿核酸比母体核酸丰富。表1鉴定了本发明的高甲基化和低甲基化核酸序列。在另一实施方式中,所述组合物还包含结
合甲基化核苷酸的试剂。例如,该试剂可以是甲基-CpG结合蛋白(MBD)或其片段。
[0017] 在一些实施方式中,本发明的核苷酸序列包含三个或多个CpG位点。在另一实施方式中,所述核苷酸序列包含五个或多个CpG位点。在另一实施方式中,所述核苷酸序列来自包含PRC2区的基因区域(参见表3)。在另一实施方式中,所述核苷酸序列来自参与发育
的基因区域。例如,本发明的一种后成标记SOX14(参见表1),它是参与胚胎发育调节和决
定细胞命运的转录因子SOX(SRY-相关HMG-盒)家族的成员。
[0018] 在一些实施方式中,妇女的基因组序列为甲基化,而胎儿的基因组序列为未甲基化。在其它实施方式中,妇女的基因组序列为未甲基化,而胎儿的基因组序列为甲基化。在另一实施方式中,胎儿的基因组序列甲基化程度高于母亲的基因组序列。已发现的比母体
基因组序列甲基化程度高的胎儿基因组序列见SEQ ID NO:1-59。或者,胎儿的基因组序列比母亲的基因组序列甲基化程度低。已发现的比母体基因组序列甲基化程度低的胎儿基因
组序列见SEQ ID NO:60-85。本发明甲基化敏感的限制性内切酶对低度-甲基化核酸敏感,或对高度-甲基化核酸敏感。
[0019] 在另一实施方式中,所述胎儿核酸是细胞外核酸。细胞外胎儿核酸通常约有500、400、300、250、200或150(或其中的任何数值)个核苷酸基或更少。在另一实施方式中,消化的母体核酸少于约90、100、110、120、130、140或150个碱基对。在一相关实施方式中,相对于消化的母体核酸,根据大小,选择性扩增、捕捉或分离胎儿核酸。例如,可设计PCR引物来扩增大于约75、80、85、90、95、100、105、110、115或120(或之间的任何数值)个碱基对的核酸,从而扩增胎儿核酸和未消化的母体核酸。在另一实施方式中,先片段化核酸,再实施本发明的某些方法。片段化核酸的例子包括但不限于:超声处理和限制性内切酶消化。
在一些实施方式中,胎儿核酸衍生自胎盘。在其它实施方式中,胎儿核酸是细胞凋亡的。
[0020] 在一些实施方式中,本发明提供其中样品是选自以下的成员的方法:母体全血、母体血浆或血清、羊水、绒膜绒毛样品、胚胎植入前的活检材料、分离自母体血液的胎儿有核细胞或胎儿细胞残留物、母体尿液、母体唾液、女性生殖道冲洗液和腹腔穿刺或灌洗获得的样品。在某些实施方式中,生物学样品是母体血液。在一些实施方式中,生物学样品是绒膜绒毛样品。在某些实施方式中,先富集母体样品中的胎儿核酸,再实施本发明的某些方法。胎儿(核酸)富集方法的例子见PCT公布号WO/2007140417A2、WO2009/032781A2和美
国公布号20050164241。
[0021] 在一些实施方式中,先除去样品中的有核和无核细胞群,再实施本发明的某些方法(例如,基本上除去所有有核和无核细胞群)。在一些实施方式中,采用本领域普通技术
人员已知的方式收集、储存或转运样品,以最大程度减少样品中胎儿核酸的降解或维持其
质量
[0022] 所述样品可来自任何动物,包括但不限于:人、非人、哺乳动物、爬行动物、、猫、狗、山羊、猪、猴、猿、大猩猩、公牛奶牛、熊、绵羊家禽、小鼠、大鼠、鱼、海豚、鲸和鲨鱼,或患有可检测的妊娠相关疾病或染色体异常的任何动物或生物。
[0023] 在一些实施方式中,用差异修饰甲基化和未甲基化DNA的试剂处理样品。例如,所述试剂可包括亚硫酸氢盐;或者所述试剂可包括能优先切割甲基化DNA的一种或多种酶;或者所述试剂可包括能优先切割未甲基化DNA的一种或多种酶。甲基化敏感的限制性内切
酶的例子包括但不限于:HhaI和HpaII。
[0024] 在一个实施方式中,通过特异性结合胎儿核酸中的甲基化核苷酸的试剂将胎儿核酸与母体核酸分离。在另一实施方式中,通过能特异性结合相应母体核酸中的甲基化核苷
酸的试剂使母体核酸与胎儿核酸分离,或除去胎儿核酸。在一个实施方式中,能结合甲基化核苷酸的试剂是甲基-CpG结合蛋白(MBD)或其片段。
[0025] 本发明的另一方面,提供检测含有甲基化程度不同的母体与胎儿DNA的母体样品中胎儿DNA的含量或拷贝数的方法。通过以下步骤实施该方法:a)根据甲基化状态的不同
区分母体与胎儿DNA;和b)定量测定步骤a)的胎儿DNA。在一具体实施方式中,该方法包
括a)用一种或多种甲基化敏感的限制性内切酶消化母体样品中的母体DNA,从而富集胎儿
DNA;和b)测定步骤a)的胎儿DNA含量。利用胎儿DNA的含量可证实胎儿核酸存在与否、
测定胎儿性别、诊断胎儿疾病或与其它胎儿诊断方法联用以改善灵敏度或特异性。在一个
实施方式中,测定胎儿DNA含量的方法不需要利用多态性序列(polymorphic sequence)。
例如,在步骤b)中不用等位基因的比例来定量测定胎儿DNA。在另一个实施方式中,测定胎儿DNA含量的方法不需要用亚硫酸氢盐处理DNA将胞嘧啶残基转变为尿嘧啶。已知亚硫酸
氢盐能降解DNA,从而进一步减少了母体样品中已经有限的胎儿核酸。在一个实施方式中,通过引入已知浓度的一种或多种竞争物实施步骤b)中对胎儿DNA量的测定。在另一实施
方式中,通过RT-PCR、引物延伸、测序或计数实施步骤b)中对胎儿DNA量的测定。在一相关的实施方式中,如美国专利公布号US20070065823所述,采用BEAMing技术测定核酸含量。
在另一实施方式中,测定限制性(内切酶)效率(restriction efficiency),采用效率比
(efficiency rate)进一步测定胎儿DNA含量。示范性的甲基化程度不同的核酸见SEQ ID
NO:1-89。
[0026] 本发明的另一方面提供测定母体样品中胎儿DNA浓度的方法,其中所述母体样品包含差异甲基化的母体与胎儿DNA,包括a)测定母体样品的DNA总量;b)用一种或多种甲
基化敏感的限制性内切酶选择性消化母体样品中的母体DNA,从而富集胎儿DNA;c)测定步
骤b)的胎儿DNA含量;和d)比较步骤c)的胎儿DNA含量与步骤a)的DNA总量,从而测
定母体样品中胎儿DNA的浓度。胎儿DNA浓度可与其它胎儿诊断方法联用以改善灵敏度或
特异性。在一个实施方式中,测定胎儿DNA含量的方法不需要利用多态性序列。例如,在步骤b)中不用等位基因比例来定量测定胎儿DNA。在另一实施方式中,测定胎儿DNA含量的
方法不需要用亚硫酸氢盐处理DNA使胞嘧啶残基转变为尿嘧啶。在一个实施方式中,通过
引入已知浓度的一种或多种竞争物实施步骤b)对胎儿DNA量的测定。在另一实施方式中,
通过RT-PCR、测序或计数实施步骤b)测定胎儿DNA含量。在另一实施方式中,测定限制性
(内切酶)效率,用以进一步测定DNA总量和胎儿DNA量。示范性的差异甲基化核酸见SEQ
ID NO:1-89。
[0027] 本发明的另一方面,利用母体样品中的胎儿DNA,提供测定胎儿非整倍性存在与否的方法,其中所述母体样品包含差异甲基化的母体与胎儿DNA,该方法包括:a)用一种或多种甲基化敏感的限制性内切酶选择性消化母体样品中的母体DNA,从而富集胎儿DNA;b)测定靶染色体的胎儿DNA含量;c)测定参比染色体的胎儿DNA含量;和d)比较步骤b)与步
骤c)的胎儿DNA含量,其中靶胎儿DNA含量与参比胎儿DNA含量之间有生物学或统计学显
著差异表明存在胎儿非整倍性。在一个实施方式中,测定胎儿DNA含量的方法不需要利用
多态性序列。例如,在步骤b)中不用等位基因比例来定量胎儿DNA。在另一实施方式中,
测定胎儿DNA含量的方法不需要用亚硫酸氢盐处理DNA使胞嘧啶残基转变为尿嘧啶。在一
个实施方式中,通过引入已知浓度的一种或多种竞争物实施步骤b)和c)的胎儿DNA含量
测定。在另一实施方式中,通过RT-PCR、测序或计数,实施步骤b)和c)的胎儿DNA含量测
定。在另一实施方式中,将步骤b)测定的靶染色体胎儿DNA含量与标准对照,例如整倍体
妊娠靶染色体的胎儿DNA含量作比较。在另一实施方式中,测定限制性(内切酶)效率,用
以进一步测定靶染色体和参比染色体的胎儿DNA含量。示范性的差异甲基化核酸见SEQ ID
NO:1-89。
[0028] 本发明的另一方面,提供通过分析差异甲基化的核酸样品中靶核酸与对照核酸的含量或拷贝数来检测染色体异常存在与否的方法,包括以下步骤:(a)依据甲基化状态富
集样品的靶核酸和该样品的对照核酸;(b)对至少一部分的富集靶核酸进行拷贝数分析;
(c)对至少一部分的富集对照核酸进行拷贝数分析;(d)比较步骤(b)的拷贝数与步骤(c)
的拷贝数;和(e)根据步骤(d)的比较,测定是否存在染色体异常,其中所述靶核酸和对照
核酸具有相同或基本上相同的甲基化状态。在一相关实施方式中,提供通过分析差异甲基
化核酸样品中靶核酸与对照核酸的含量或拷贝数来检测是否存在染色体异常的方法,包括
以下步骤:(a)使样品的靶核酸和该样品的对照核酸与结合剂结合;(b)根据甲基化状态洗
脱结合的核酸,其中差异甲基化核酸至少部分被洗脱入不同的组分;(c)对至少一部分中
的洗脱靶核酸进行拷贝数分析;(d)对至少一部分中的洗脱对照核酸进行拷贝数分析;(e)
比较步骤(c)的拷贝数与步骤(d)的拷贝数;和(f)根据步骤(e)的比较结果测定是否存
在染色体异常,其中所述靶核酸和对照核酸具有相同或基本上相同的甲基化状态。示范性
的差异甲基化核酸见SEQ ID NO:1-89。
[0029] 本发明的另一方面,提供通过分析差异甲基化核酸样品中靶核酸和对照核酸的等位基因比例,检测是否存在染色体异常的方法,包括以下步骤:(a)使样品的靶核酸和该样品的对照核酸与结合剂结合;(b)根据甲基化状态洗脱结合的核酸,其中差异甲基化核酸
至少部分洗脱入不同的组分;(c)对至少一部分中的洗脱靶核酸进行等位基因比例分析;
(d)对至少一部分的洗脱对照核酸进行等位基因比例分析;(e)比较步骤(c)的等位基因比
例与步骤(d)的等位基因比例;和(f)根据步骤(e)的比较结果测定是否存在染色体异常,
其中所述靶核酸和对照核酸具有相同或基本上相同的甲基化状态。差异甲基化核酸见SEQ
ID NO:1-89,差异甲基化核酸内的SNP见表2。这些方法还可用于检测妊娠相关疾病。
[0030] 本发明的另一方面,采用依据甲基化的本发明方法测定母体核酸含量。例如,可分离(例如,用甲基化敏感的酶消化)样品中的胎儿核酸与母体核酸,采用本发明方法定量测定母体核酸。一旦测定了母体核酸含量,可从样品的核酸总量中扣除其含量而确定胎儿核
酸含量。可利用胎儿核酸含量检测胎儿性状,包括本文所述的胎儿非整倍性。
[0031] 对于本文所述本发明的各方面内容和实施方式,所述方法还可用于检测妊娠相关疾病。在一些实施方式中,样品包含胎儿核酸或胎儿核酸和母体核酸。以样品包含胎儿和母体核酸为例,胎儿核酸与母体核酸可具有不同甲基化状态。可用本领域已知的任何方法区
分甲基化状态不同的核酸种类。在一个实施方式中,用甲基化敏感的限制性内切酶选择性
消化母体核酸来富集胎儿核酸。在另一实施方式中,在同一试验中用两种或多种甲基化敏
感的限制性内切酶选择性消化母体核酸以富集胎儿核酸。在一个实施方式中,靶核酸和对
照核酸均来自胎儿。在另一实施方式中,胎儿核酸的平均大小长约100碱基到约500碱基。
在另一实施方式中,染色体异常是非整倍性,例如胎儿三体性21。在一些实施方式中,靶核酸是染色体(可以是异常染色体)的至少一部分,对照核酸是染色体(极少异常)的至少
一部分。例如,当靶核酸来自21号染色体时,对照核酸来自21号靶染色体以外的染色体,
优选另一常染色体。在另一实施方式中,结合试剂是甲基化特异性结合蛋白,例如MBD-Fc。
也可用本领域已知的任何方法扩增和/或定量测定富集的或洗脱的核酸。在一个实施方式
中,采用不需要利用多态性序列的方法定量测定胎儿DNA。例如,不利用等位基因的比例来定量测定胎儿DNA。在另一实施方式中,定量测定胎儿DNA含量的方法不需要用亚硫酸氢盐
处理胎儿DNA将胞嘧啶残基转变成尿嘧啶。
[0032] 在一些实施方式中,本发明方法包括测定样品中一种或多种Y-染色体特异性序列含量的额外步骤。在一相关实施方式中,将采用依据甲基化的本发明方法测定的样品胎
儿核酸含量与Y-染色体核酸存在量作比较。
[0033] 根据甲基化状态区分核酸的方法包括但不限于:甲基化敏感性捕捉,例如用MBD2-Fc片段;亚硫酸氢盐转变方法,例如MSP(甲基化-敏感性PCR)、COBRA、甲基化-敏感
TM
性单核苷酸引物延伸(Ms-SNuPE)或Sequenom MassCLEAVE 技术;和用甲基化敏感的限制
性内切酶。除了已明确表述的之外,根据甲基化状态区分核酸的任何方法可与本发明组合
物和方法联用。
[0034] 在一些实施方式中,本发明方法还可包括扩增步骤。可通过PCR,例如甲基化特异性PCR实施此扩增步骤。在另一实施方式中,对单一分子进行扩增反应,例如数字化PCR,在通过引用纳入本文的美国专利第6,143,496和6,440,706号中对其有进一步描述。在其
它实施方式中,所述方法不需要扩增。例如,可用流式细胞读数器或不需要扩增的测序方法来计数胎儿DNA(或与其相连的序列标签),以测定富集的胎儿DNA含量。在另一实施方式
中,通过扩增反应测定胎儿DNA含量,该反应产生的扩增子大于被消化的母体核酸,从而进一步富集胎儿核酸。
[0035] 对于需要序列分析的实施方式,可采用以下任何一种测序技术:引物延伸方法(例如,iPLEX ;塞昆纳姆股份有限公司(Sequenom,Inc.))、直接DNA测序,限制性片段长度多态性(RFLP分析)、等位基因特异性寡核苷酸(ASO)分析、甲基化-特异性PCR(MSPCR)、
高温测序分析、无环引物分析(acycloprime analysis)、反向斑点印迹(Reverse dot
blot)、基因芯片微阵列、动态等位基因特异性杂交(DASH)、肽核酸(PNA)和闭核酸(LNA)探针、TaqMan、分子信标(Molecular Beacons)、嵌入染料、FRET引物、荧光标记的dNTP/
ddNTP、AlphaScreen、SNPstream、遗传位分析(genetic bit analysis)(GBA)、多重迷你
测序(Multiplex minisequencing)、SnaPshot、GOOD试验、微阵列迷你测序(Microarray
miniseq)、阵列引物延伸(arrayed primer extension)(APEX)、微阵列引物延伸、标签阵列(Tag arrays)、编码微球(Coded microspheres)、模板引导的掺入(TDI)、荧光极化、寡核苷酸连接比色试验(OLA)、序列编码的OLA、微阵列连接、连接酶链式反应、挂锁探针(Padlock TM
probes)、Invader 试验、采用至少一种探针的杂交、采用至少一种荧光标记探针的杂交、电泳、克隆和测序,例如在454平台(罗氏公司(Roche)(Margulies,M.等.2005Nature 437,
376-380)、Illumina(公司)基因组分析仪(或Solexa平台)或SOLiD系统(应用生物系
统公司(Applied Biosystems))或赫氏真正的单分子DNA测序技术(Helicos True Single
Molecule DNA sequencing technology)(Harris T D 等 .2008Science,320,106-109)
进行,太平洋生物科学公司(Pacific Biosciences)的单分子实时(SMRT.TM.)技术或
纳米孔测序(nanopore-based sequencing)(Soni GV和Meller A.2007 Clin Chem 53:
1996-2001)和它们的组合。纳米孔方法可包括,例如根据大小,利用纳米孔给核酸测序或利用纳米孔计数核酸分子,其中序列信息未确定。
[0036] 例如,可采用质谱法,采用检测绝对拷贝数的竞争性PCR方法的系统,测定一种或多种核酸的绝对拷贝数。参见,例如Ding C,Cantor CR(2003)采用竞争性PCR和基质辅助的激光解吸电离飞行时间质谱的高通量基因表达分析技术(A high-throughput gene
expression analysis technique using competitive PCR and matrix-assisted laser
desorption ionization time-of-flight MS).Proc Natl Acad Sci U S A 100:3059-3064和美国专利申请号10/655762,其美国专利公布号为20040081993,二者通过引用纳入本
文。
[0037] 在一些实施方式中,将基因组序列的含量与标准对照作比较,高于或低于标准对照,表明存在妊娠相关疾病或有所发展。例如,可比较样品中的胎儿核酸含量与DNA总量。
或者在检测是否存在胎儿非整倍性时,可比较靶染色体的胎儿核酸含量与参比染色体的胎
儿核酸含量。参比染色体优选非整倍体比率低的另一常染色体。可将胎儿靶核酸与参比胎
儿核酸的比例与正常整倍体妊娠的同一比例作比较。例如,可测定从具有健康胎儿的女性
获得的DNA样品的对照比率,该胎儿不具有染色体异常。最好利用一组对照样品。已知某
些染色体异常时,也可具有表明特定疾病或病症的标准品。因此,例如为筛检妊娠妇女的母体血浆中三种不同染色体非整倍性,最好采用分离自已知怀有,例如染色体13、18或21三
体性胎儿的母亲和怀有染色体不异常胎儿的母亲的一组对照DNA。
[0038] 在一些实施方式中,本发明提供通过序列变异区分靶核酸的等位基因与对照核酸的等位基因的方法。所述序列变异可以是单个核苷酸多态性(SNP)或插入/缺失多态性。在
一个实施方式中,胎儿核酸应包含至少一种高频杂合多态性(例如,约2%、3%、4%、5%、
6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、25%或更高频率),从而得以测定核酸的等位基因比例评估是否存在染色体异常。示范性SNP的列
表见表2,然而,这不代表可用作本发明一部分的多态性等位基因的全部列表。也考虑符合以下标准的任何SNP:(a)杂合频率高于约2%(优选跨越不同人群范围)的SNP;(b)SNP是
杂合基因座;和(c)(i)所述SNP在本文所述核酸序列内,或(c)(iii)所述SNP位于本文所
述SNP的约5到约2000个碱基对内(例如,位于本文所述SNP的约5、10、15、20、25、30、40、
50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、1250、1500、1750或 2000碱基对内)。
[0039] 在其它实施方式中,所述序列变异是短串联重复(STR)多态性。在一些实施方式中,所述序列变异落在限制性位点内,藉此一个等位基因对该限制性内切酶消化敏感而一
个或多个其它等位基因则不是。在一些实施方式中,所述序列变异是含甲基化位点。
[0040] 在一些实施方式中,进行等位基因比例分析包括获得妊娠妇女的含核酸生物学样品,测定妊娠妇女胎儿靶核酸的等位基因与对照核酸的等位基因之比例,所述生物学样品
含有胎儿核酸;可根据甲基化差异部分或完全分离胎儿核酸与母体核酸;区分靶核酸的等
位基因与对照核酸的等位基因;然后测定这些等位基因之比例;和根据等位基因比例检测
胎儿是否存在染色体异常,其中比例高于或低于正常整倍体比例时,表明患有染色体疾病。
在一个实施方式中,靶核酸来自怀疑的非整倍染色体(例如,染色体21),对照核酸来自同
一胎儿的整倍染色体。
[0041] 在一些实施方式中,本发明与其它胎儿标记联用来检测是否存在多个染色体异常,所述染色体异常选自:三体性21、三体性18和三体性13或它们的组合。在一些实施方
式中,所述染色体疾病涉及X染色体或Y染色体。
[0042] 在一些实施方式中,本发明组合物或方法可在一个反应中多重应用。例如,可测定基因组的多个基因座的胎儿核酸含量。或者当检测是否存在非整倍体胎儿时,可测定一个或多个靶染色体(例如,染色体13、18或21)和一个或多个参比染色体上多个基因座的胎
儿核酸含量。如果采用等位基因比例,可同时检测和区分表2的一个或多个等位基因。测
定等位基因比例时,此多重实施方式对多态性基因座的基因型未知时特别重要。在一些例
子中,例如当母亲和孩子的多态性基因座是纯合时,该试验可能不提供信息。在一个实施
方式中,按照本发明方法可富集、分离和/或检测多于1、2、3、4、5、6、7、8、9、10、11、12、13、
14、15、16、17、18、19、20、25、30、35、40、50、100、200、300或500条和任何中间水平的本发明多核苷酸序列。当通过分析靶核酸与对照核酸的拷贝数来检测染色体异常时,需要分析少
于3、4、5、6、7、8、9、10、11、12、13或14条多核苷酸序列,以精确检测是否存在染色体异常。
在另一实施方式中,可用本发明组合物或方法检验已分成2、3、4、5、6、7、8、9、10、11、12、13、
14、15、16、17、18、19、20、25、30、35、40、50、100或更多份复制品或分成单一分子等价物的样品。分析一式多份母体样品中胎儿核酸的方法,包括单一分子分析,可参见通过引用纳入本文的美国申请号11/364,294,其美国专利公布号为US 2007-0207466A1。
[0043] 在另一实施方式中,本发明提供以下方法,其中如果靶核酸的等位基因比例或绝对拷贝数比标准对照序列高1个或低1个标准差,比较步骤可显示胎儿患染色体疾病的风
险高。在一些实施方式中,如果靶核酸的等位基因比例或绝对拷贝数比标准对照序列高2
个或低2个标准差,比较步骤可显示胎儿患染色体疾病的风险高。在一些实施方式中,如果靶核酸的等位基因比例或绝对拷贝数比标准对照序列高3个或低3个标准偏差,比较步骤
可显示胎儿患染色体疾病的风险高。在一些实施方式中,如果靶核酸的等位基因比例或绝
对拷贝数比对照的统计学显著标准偏差高或低,比较步骤可显示胎儿患染色体疾病的风险
高。在一个实施方式中,标准对照是母体参比品,在另一实施方式中,标准对照是胎儿参比染色体(例如,非三体性常染色体)。
[0044] 在一些实施方式中,本发明方法可与其它方法联用以诊断染色体异常。例如,非侵入性诊断方法可能需要证实是否存在胎儿核酸,例如女性胎儿的性别测试,或证实RhD
阴性母亲怀了RhD阴性女性胎儿。在另一实施方式中,可用本发明的组合物和方法测定母
体样品中胎儿核酸的百分比,从而能进行需要知道胎儿核酸百分比的另一诊断方法。例
如,样品是否符合某种浓度阈值的要求?当测定母体样品中的等位基因比例来诊断胎儿非
整倍性时,可能需要胎儿核酸含量或浓度以便作出具有给定灵敏度和特异性的诊断。在
其它实施方式中,检测染色体异常的本发明组合物和方法可与其它已知方法联用,从而改
善检测方法的总体灵敏度和特异性。例如,数学模型提示,采用母亲年龄(MA)、颈部半透
明带(NT)厚度、无血清β-hCG和血清PAPP-A的联合早孕检查方案(first-trimester
screening program),可检测出超过80%的唐氏综合征胎儿,而侵入性检验率是5%(Wald
和Hackshaw,Prenat Diagn 17(9):921-9(1997))。然而,常规联用非整倍性检测方法与本文所述非侵入性胎儿游离核酸方法可提高精确度降低假阳性率。联合诊断方法的例子见通
过引用纳入本文的PCT公布号WO2008157264A2(转让给申请人)。在一些实施方式中,本发
明方法可与细胞方法联用,其中胎儿细胞是侵入性或非侵入性取得。
[0045] 在某些实施方式中,染色体异常的风险升高是根据本文提供的组合物或方法产生的结果。这种结果的一个例子是与整倍体的绝对拷贝数或等位基因比例有偏差,该偏差表
明存在非整倍体染色体。绝对拷贝数或比例比标准对照高或低,表明胎儿患染色体异常
(例如,21号染色体三体综合征)的风险高。可用任何合适的媒介保留、演示、记录和/或展示涉及本文所述方法的信息,例如三体综合征或非整倍体的结局、结果或风险。例如,可将所述结果固定在媒介中以保留、储存、共享、交流或分析该结果。媒介可以是可触知的(例如纸)或不可触知的(例如电子媒介),媒介的例子包括但不限于:计算机媒介、数据库、图表、患者图表、记录、患者记录、图片和表格以及任何其它表达媒介。信息有时以计算机可读形式储存和/或保留,优选储存和组织成数据库。在某些实施方式中,可利用物理媒介(例
如纸)或计算机可读媒介(例如光和/或磁存储或传送媒介、软盘硬盘、随机存取存储器、计算机处理单元、传真信号卫星信号、跨因特网传送或跨万维网传送)将信息从一处传递至另一处。
[0046] 在一些情况中,CpG岛可用作含CpG的基因组序列,而在其它情况中,含CpG的基因组序列可以不是CpG岛。在一些实施方式中,本发明提供实施本发明方法的试剂盒。试
剂盒中的一种组分是甲基化敏感的结合试剂。
[0047] 附图简述
[0048] 图1显示设计的用于分离甲基化程度不同DNA的重组MBD-Fc蛋白。
[0049] 图2显示对其“抗原”具有高亲和和高亲合力的甲基-CpG-结合抗体样蛋白,所述“抗原”优选含甲基化CpG二核苷酸的DNA。
[0050] 图3显示MBD-Fc的甲基结合功能域能结合DNA分子,而不管它们的甲基化状态如何。该蛋白质/DNA相互作用的强度由DNA的甲基化水平决定。结合基因组DNA后,可用盐
浓度递增的洗脱液,洗脱成未甲基化与甲基化DNA组分,进行受控制的分离。
[0051] 图4显示用重组MBD-Fc蛋白和微阵列实验,鉴定胎儿与母亲的甲基化程度不同的DNA。
[0052] 图5显示用Sequenom EpiTYPERTM方法产生的典型结果,该结果用于验证图4所示实验产生的结果。
[0053] 图6显示获自微阵列分析的比例对数(x轴)和获自表型(EpiTYPER)分析的甲基化差异(y轴)之间的相关性。各数据点代表所有检测样品中一个区域的平均值。微阵列
分析本质上是比较分析,因为母体DNA的高度甲基化组分与胎盘DNA的高度甲基化组分一
起杂交。正值表明胎盘样品的甲基化较高。在质谱法中,各样品单独检测。我们先从胎盘
甲基化值中扣除母亲甲基化值计算出甲基化差异。将结果与微阵列数据作比较,我们计算
出所有母体/胎盘DNA配对的差异平均值。
[0054] 图8显示预计的gDNA分子数与联用竞争性PCR和质谱法分析测得的分子数之间相关性。在该实验中,我们采用90∶10比例的衍生自全血的DNA(黑色加号)和商品化购
得的完全甲基化DNA(红十字)。我们用MBD-FC融合蛋白分离非甲基化与甲基化的DNA组
分。对各组分作竞争性PCR分析与质谱读出。该方法早已见诸描述可用于分析拷贝数变
化,可商品化购得用作基因表达分析。该方法能借助浓度已知的合成寡核苷酸绝对定量测
定DNA分子。在该实验中,我们以MGMT基因座为目标,该基因座在本文所用的全血中未甲
基化。利用300个总gDNA拷贝的输入,我们预计能见到270个拷贝的未甲基化DNA和30
个拷贝的甲基化DNA。测到的拷贝数与预计值非常一致。输入DNA为600拷贝时的数据点
表明反应有偏向,表明经初步证明的此概念性实验还需要更多的开发工作然后才能利用该
试验。然而,该初步数据表明,存在过量的未甲基化DNA时,捕捉和定量测定几种甲基化的DNA具有可行性。
[0055] 图9A-9C显示,从微阵列分析(黑柱)和质谱分析(淡灰色柱)获得的关于它们基因组位置甲基化差异的柱状图。提供了通过微阵列鉴定到的甲基化有差异的85个区域各
自的图谱。各图的x轴显示该区域的染色体位置。y轴描述log比例(微阵列)和甲基化
差异(质谱结果)。对于微阵列,该区域中的各杂交探针显示为一条黑色(或暗灰色)棒。
对于质谱结果,各CpG位点显示为淡灰色棒。显示大于0数值的柱表示胎盘样品的DNA甲
基化程度比母体DNA高。某些基因差异小(即RB1或DSCR6),但仍有统计学显著性。那些
区域不大适合胎儿DNA富集方案。
[0056] 图10显示胎儿定量方法(Fetal Quantifier Method)的一个实施方式。选择性消化母体核酸,用浓度已知的竞争物定量测定残留的胎儿核酸。在该模式中,用质谱仪分离分析物并定量测定。
[0057] 图11显示基于甲基化胎儿诊断方法的一个实施方式。选择性消化母体核酸,定量测定残留胎儿核酸的三个不同染色体(13、18和21)。该图的部分2和3显示消化前后样品
中核酸的大小分布。扩增反应可以是大小特异性的(例如,大于100碱基对的扩增子),它
们有利于(获得)比消化的母体核酸更长的未消化胎儿核酸,从而进一步富集了胎儿核酸。
该图底部的图谱显示胎儿21号染色体核酸含量升高,表明有三体性21。
[0058] 图12显示从非妊娠妇女血液分离的四份不同DNA样品的可扩增基因组拷贝的总数。稀释各样品使每次反应含有约2500、1250、625或313份拷贝。通过取两个总拷贝数试
验(表X中的ALB和RNAseP)获得的DNA/竞争物平均比例,获得各检测值。如图12所示,
总拷贝数在不同样品之间精确而稳定,因此证实了该竞争方法的实用性。
[0059] 图13A和B:创建了含有恒定数量母体非甲基化DNA并掺入了不同数量男性胎盘甲基化DNA的一种模型系统。该样品掺入的男性胎盘DNA的量约为母体未甲基化DNA的
0-25%。与总拷贝数试验相比,利用从甲基化试验(图13A)和Y-染色体标记(图13B)获
得的比例计算出胎盘DNA的百分数。甲基化和Y-染色体标记见表X。
[0060] 图14A和B显示血浆样品总拷贝数试验的结果。图14A显示了各样品的拷贝数。两份样品(25和26号)的总拷贝数显著高于所有其它样品。每毫升血浆获得平均约1300
个可扩增拷贝(范围766-2055)。图14B显示给定值的箱线图(box-and-whisker plot),
总结了结果。
[0061] 图15A和B绘制了从怀有男性胎儿妊娠妇女取得的33份不同血浆样品的胎儿核酸含量(或拷贝数)。采用表X提供的试验,用甲基化标记和Y-染色体-特异性标记计算
出所得拷贝数。如图15B所示,给定值的箱线图表明两种不同检测值之间的差异很小,从而证实了该方法的精确度和稳定性
[0062] 图16显示用图15A的甲基化标记和Y-染色体标记所得结果之间为成对相关(paired correlation)。
[0063] 图17显示采用对照与竞争物的消化比例,比较该值与总拷贝数试验平均值,得到限制性内切酶的消化效率。除样品26外,所有反应均表明效率高于约99%。
[0064] 图18提供用男性胎儿妊娠的Y-染色体-特异性标记和所有妊娠(无论胎儿性别)的甲基化百分数平均值,计算出样品中胎儿DNA百分数(或浓度)的具体方法。
[0065] 图19提供计算样品中胎儿DNA百分数(或浓度)而不需要Y-染色体-特异性标记的具体方法。而仅用甲基化定量试验测定胎儿DNA的浓度。
[0066] 图20显示用本发明方法对模拟的21号三体染色体进行诊断的功率计算t-检验(power calculation t-test)。该图显示x-轴变异系数(CV)与采用简单t-检验区分试
验人群的功率(y-轴)之间的关系。数据表明在99%的所有情况中,可以0.001的显著性
水平区分这两类人群(整倍性和非整倍性),CV为5%或更低。
[0067] 定义
[0068] 本申请书所用的术语“妊娠相关疾病”指影响妊娠妇女、胎儿或二者的任何病症或疾病。此类病症或疾病可在有限时期内,例如妊娠或分娩期间表现出其症状,或者可在胎儿出生后持续终身。妊娠相关疾病的一些例子包括异位妊娠、先兆子痫、早产、RhD不相容、胎儿染色体异常,例如21三体综合征和基因遗传性胎儿疾病,例如囊性纤维化、β-地中海贫血或其它单基因疾病。能够富集母体样品中的胎儿核酸证明对于非侵入性产前诊断隐性常染色体疾病特别有用,例如母亲和父亲共患导致突变的同一种疾病,这种情况曾被认为是
基于母体血浆的非三体性产前诊断的难点。
[0069] 本文所用的术语“染色体异常”或“非整倍体”指对象染色体的结构与正常同源染色体结构之间有偏差。术语“正常”指在特定物种的健康个体中发现的占优势的核型或带型,例如,整倍体基因组(在人中是46XX或46XY)。染色体异常可以是数量或结构异常,包
括但不限于非整倍体、多倍体、颠倒、三体、单体、复制、缺失。染色体部分缺失、添加、染色体部分添加、插入、染色体片段、染色体区域、染色体重排和易位。染色体异常也指染色体状态的异常,因为(例如)染色体易位可导致一个或多个染色体不是通常单倍体数的精确倍数。
染色体易位(例如,染色体21与14之间的易位(其中第14号染色体的一部分被额外的第
21号染色体替换)可导致部分21三体。染色体异常可能与病理学状况或发生疾病的易感
性相关。可通过定量分析核酸来检测染色体异常。
[0070] 本说明书中的术语“核酸”和“核酸分子”可互换使用。这些术语指任何组成形式的核酸,例如DNA(如互补DNA(cDNA)、基因组DNA(gDNA)等)、RNA(如信使RNA(mRNA)、短抑制性RNA(siRNA)、核糖体RNA(rRNA)、tRNA、微小RNA、胎儿或胎盘高度表达的RNA等)和/或
DNA或RNA类似物(例如,含有碱基类似物、糖类似物和/或非天然骨架等等)、RNA/DNA杂
交体和聚酰胺核酸(PNA),所有这些可以是单链或双链形式,除非另有限制,可包括可以与天然产生的核苷酸相似的方式起作用的天然核苷酸的已知类似物。例如,SEQ ID No:1-89所示的核酸(见表4)可以是用于实施本文方法的任何形式(例如,线形、环状、超螺旋、单
链、双链等)或可包含不会改变它们用途的变异(例如,插入、缺失或取代)作为本发明的
一部分。核酸可以是或可来自质粒、噬菌体、自主复制序列(ARS)、着丝粒、人工染色体、染色体或能在体外或宿主细胞中复制的其它核酸、细胞、细胞的细胞核或细胞质(在某些实
施方式中)。在一些实施方式中,模板核酸可以来自一个染色体(例如,核酸样品可获自二
倍体生物样品的一个染色体)。除非另有限定,该术语包括含有天然核苷酸已知类似物的
核酸,其具有与参比核酸相似的结合特性,并且代谢方式类似于天然产生的核苷酸。除非另有指出,特定核酸序列还隐含包括其保守性修饰(例如,简并密码子取代)变体、等位基因、直向同源物、单个核苷酸多态性(SNP)和互补序列以及专指出的序列。具体地说,可通过其中一个或多个选择(或全部)密码子第三位(残基)被混合碱基和/或脱肌苷残基取
代产生的序列,而实现简并密码子取代(Batzer等.,Nucleic Acid Res.19:5081(1991);
Ohtsuka等.,J.Biol.Chem.260:2605-2608(1985);和Rossolini等.,Mol.Cell.Probes
8:91-98(1994))。术语核酸与基因座、基因、cDNA和基因编码的mRNA可互换使用。该术语还可包括从核苷酸类似物合成的RNA或DNA等价物、衍生物和类似物、单链(“有义”或“反义”,“正”链或“负”链,“正向”读框或“反向”读框)和双链多核苷酸。脱氧核糖核苷酸包括脱氧腺苷、脱氧胞苷、脱氧苷和脱氧胸苷。对于RNA,碱基胞嘧啶替换为尿嘧啶。可利用从对象获得的核酸作为模板来制备模板核酸。
[0071] 本文所用的“包含一个或多个CpG位点的核酸”或“含CpG的基因组序列”指个体,例如人胎儿或妊娠妇女的基因组中指定位置的DNA序列区段。“含CpG的基因组序列”通常至少长15个核苷酸,含有至少一个胞嘧啶。优选至少长30、50、80、100、150、200、250或300个核苷酸,含有至少2、5、10、15、20、25或30个胞嘧啶。对于给定位置,例如以给定遗传基因座为中心的区域(参见表1)的任何“含CpG的基因组序列”,个体之间和同一个体的等位
基因之间可存在核苷酸序列变异。以给定基因座(例如,CpG岛)为中心的此类区域通常
含有该基因座以及上游和/或下游序列。上游或下游序列(分别从基因座的5’或3’边界
计数)各自可长10kb,在其它情况中,可长5kb、2kb、1kb、500bp、200bp或100bp。此外,“含CpG的基因组序列”可包含产生蛋白质所需的转录或未转录的核苷酸序列,该核苷酸序列可以是基因间序列、基因内序列、蛋白质编码序列、非蛋白质编码序列(例如,转录启动子)或它们的组合。
[0072] 本文所用的“甲基化核苷酸”或“甲基化核苷酸碱基”指核苷酸碱基上存在甲基,公认的典型核苷酸碱基中不存在这种甲基。例如,胞嘧啶的嘧啶环不含甲基,但5-甲基胞嘧啶的嘧啶环5位含有甲基。因此,胞嘧啶是未甲基化的核苷酸,而5-甲基胞嘧啶是甲基
化核苷酸。在另一实例中,胸腺嘧啶的嘧啶环5位含有甲基,然而,对于本文的目的,DNA中的胸腺嘧啶不视为甲基化核苷酸,因为胸腺嘧啶是DNA的典型核苷酸碱基。DNA的典型核苷
酸碱基有胸腺嘧啶、腺嘌呤、胞嘧啶和鸟嘌呤。RNA的典型碱基有尿嘧啶、腺嘌呤、胞嘧啶和鸟嘌呤。相应地,“甲基化位点”是靶基因核酸区域中甲基化或可能发生甲基化的位置。例如,含CpG的位置是甲基化位点,其中胞嘧啶可以甲基化或未甲基化。
[0073] 本文所用的“CpG位点”或“甲基化位点”是核酸中因体内天然事件易被甲基化,或体外经化学方法易甲基化的核苷酸。
[0074] 本文所用的“甲基化核酸分子”指含有一个或多个被甲基化的甲基化核苷酸的核酸分子。
[0075] 本文所用的“CpG岛”指含有功能或结构上偏向CpG密集的DNA序列区段。例如Yamada等.(Genome Research 14:247-266,2004)描述的确定CpG岛的一组标准为:必须
至少长400个核苷酸,GC含量高于50%,OCF/ECF比例大于0.6。其他人(Takai等.,Proc.
Natl.Acad.Sci.U.S.A.99:3740-3745,2002)对CpG岛的定义没那么严格:序列至少长200
个核苷酸,GC含量高于50%,OCF/ECF比例大于0.6。
[0076] 本文所用的“外遗传学状态”或“外遗传学状况”指在分子水平上,核酸(例如,DNA或RNA)除一级核苷酸序列外的结构特征。例如,基因组DNA的外遗传学状态可包括受以下因素决定或影响的其二级或三级结构:其甲基化模式或其与细胞蛋白质的结合情况。
[0077] 本文所用的术语“甲基化模式”、“甲基化状态”或“甲基化状况”描述基因组序列的甲基化状态,指DNA区段的特定基因组基因座与甲基化相关的特征。此类特征包括但不限于:该DNA序列内是否有任何胞嘧啶(C)残基被甲基化,甲基化C残基的位置,残基任何特
定延伸段处甲基化C的百分比,和由于(例如)等位基因来源的差异导致的等位基因差异。
术语“甲基化模式”或“甲基化状况”也指生物学样品中任何特定残基延伸段的甲基化C或未甲基化C的相对或绝对浓度。例如,如果DNA序列内有一个或多个胞嘧啶(C)残基甲基
化,可称其为“高甲基化”;如果DNA序列内一个或多个胞嘧啶(C)残基未甲基化,可称其为“低甲基化”。类似地,如果DNA序列(例如,胎儿核酸)内一个或多个胞嘧啶(C)残基相对
于不同来源或不同个体的另一序列(例如,相对于母体核酸)被甲基化,则该序列相对于该
另一序列视作高甲基化。或者,如果DNA序列内的一个或多个胞嘧啶(C)残基相对于不同
来源或不同个体(例如,母亲)的另一序列未被甲基化,则该序列相对于该另一序列视作低
甲基化。将这些序列称为“差异甲基化”,更具体地说,当母亲与胎儿之间的甲基化状态不同时,这些序列视作“差异甲基化的母体和胎儿核酸”。
[0078] 本文所用的术语“结合甲基化核苷酸的试剂”指能结合甲基化核酸的物质。该试剂可以是天然或合成的,可经修饰或未修饰。在一个实施方式中,该试剂能根据核酸各自的甲基化状况分离不同的核酸种类。结合甲基化核苷酸的试剂的一个例子描述于通过引用纳
入本文的PCT专利申请号PCT/EP2005/012707,其公布号为WO06056480A2。描述的试剂是
包含属于甲基-CpG结合蛋白(MBD)家族的蛋白质的DNA结合区和抗体Fc区的双功能多肽
(参见图1)。这种重组的甲基-CpG-结合抗体样蛋白能以类似于抗体的模式优先结合CpG
甲基化DNA。这意味着,这种甲基-CpG-结合抗体样蛋白对其“抗原”具有高亲和力和高亲
合力,所述“抗原”优选在CpG二核苷酸处甲基化的DNA。该试剂还可以是多价MBD(参见图
2)。
[0079] 本文所用的术语“多态性”指同一基因组序列不同等位基因的序列变异。含多态性的序列视作“多态性序列”。检测一种或多种多态性可以区分一个基因组序列或两个或多个体之间的不同等位基因。本文所用的术语“多态性标记”或“多态性序列”指可在个体之间表现出DNA序列的可遗传变异的基因组DNA区段。此类标记包括但不限于:单个核苷酸
多态性(SNP)、限制性片段长度多态性(RFLP)、短串联重复序列,例如二-、三-或四个核苷酸重复序列(STR)等。可利用本发明的多态性标记特别区分富集的胎儿核酸样品中母体和
父体的等位基因。
[0080] 本文所用的术语“单个核苷酸多态性”或“SNP”指同一基因组序列不同等位基因存在一个核苷酸残基变异的多核苷酸序列。这种变异可发生在基因组序列的编码区或非编码区内(即,在启动子或内含子区域),如果该基因组序列在蛋白质产生期间转录的话。检
测一个或多个SNP能区分一个基因组序列或两个或多个体之间的不同等位基因。
[0081] 本文所用的术语“等位基因”是占据染色体DNA非编码区或基因中同一位置的几种可替代形式之一种。可用术语等位基因描述任何生物的DNA,包括但不限于:细菌、病毒、真菌原生动物、霉菌、酵母菌、植物、人、非人、动物和古细菌(archeabacteria)。
[0082] 本文所用的术语“等位基因比例”或“等位基因比率”指样品中人群的一种等位基因与其它等位基因的比例。在一些实施方式中,胎儿的某特定基因座可能有三个等位基因。在此类病例中,术语“等位基因比例”指人群中任何一种等位基因与其它等位基因之一,或任何一种等位基因与其它两种等位基因的比例。
[0083] 本文所用的术语“非多态性定量检测方法”指不需要利用多态性标记或序列的检测某分析物(例如,总核酸、Y-染色体核酸或胎儿核酸)含量的方法。虽然序列可能存在多
态性,但不需要利用多态性来定量测定该序列。非多态性定量检测方法的例子包括但不限
于:RT-PCR、数字PCR、阵列方法、测序方法、纳米孔方法、核酸结合珠计数方法和竞争方法,后一方法通过引入浓度已知的一种或多种竞争物来测定一种或多种分析物的含量。在一些
实施方式中,可能需要积极修改或设计一些上述示范性方法(例如,测序)而不必查询一种
或多种多态性。
[0084] 本文所用的术语“绝对量”或“拷贝数”指分析物(例如,总核酸或胎儿核酸)的含量或数量。本发明提供测定混合母体样品中胎儿核酸绝对量的组合物和方法。绝对量或拷贝数代表可检测到的分子数量,表示为每单位的等价基因组含量。术语“浓度”指混合物或溶液中某物质的含量或比例(例如,包含母体和胎儿核酸混合物的母体样品中胎儿核酸的
含量)。浓度可表示为百分比,用于表示一种数量相对于另一数量有多大/多小,可以百分
数表示。测定分析物(例如,靶核酸)数量或含量的平台包括但不限于:质谱法、数字PCR、通过合成平台测序(例如,高温测序)、荧光光谱法和流式细胞术。
[0085] 本文所用的术语“样品”指含有核酸的标本。样品的例子包括但不限于:用本领域熟知方法获得的组织、体液(例如,血液、血清、血浆、唾液、尿液、泪液、腹膜液、腹水、阴道分泌物、乳液、母乳、淋巴液、脑脊液或粘膜分泌物)、脐带血、绒毛、羊水;胚胎、双-细胞胚胎、四-细胞胚胎、八-细胞胚胎、十六-细胞胚胎、三十二-细胞胚胎、六十四-细胞胚胎、一百二十八-细胞胚胎、二百五十六-细胞胚胎、五百一十二-细胞胚胎、一千零二十四-细胞胚胎;胚胎组织、淋巴液、脑脊液、粘膜分泌物或其它身体渗出液、粪便、单个细胞或含有相同核酸和亚细胞结构(例如线粒体)的此类来源提取物。
[0086] 可从以下来源获得胎儿DNA,包括但不限于:母体血液、母体血清、母体血浆、胎儿细胞、脐带血、绒毛、羊水、尿液、唾液、肺灌洗液、细胞或组织。
[0087] 本文所用的术语“血液”指妊娠妇女或要检查是否可能怀孕的妇女的血液样品或制品。该术语包括全血或血液的任何组分,例如常规定义的血清和血浆。
[0088] 本文所用的术语“亚硫酸氢盐”包括能将胞嘧啶(C)化学转变成尿嘧啶(U)而不化学修饰甲基化胞嘧啶的任何合适类型的亚硫酸氢盐,例如亚硫酸氢钠,因此可用于根据DNA的甲基化状况而差异性修饰该DNA序列。
[0089] 本文所用的“差异性修饰”甲基化或未甲基化DNA的试剂包括修饰甲基化和/或未甲基化DNA的任何试剂,通过此过程区分甲基化与未甲基化DNA产物,从而得以鉴定DNA
的甲基化状况。此类过程包括但不限于:化学反应(例如,通过亚硫酸氢盐将C转变成U)
和酶处理(例如,通过甲基化依赖性内切酶的切割)。因此,优先切割或消化甲基化DNA的
酶是DNA被甲基化时能以较高效率切割或消化该DNA分子的酶,而优先切割或消化未甲基
化DNA的酶是DNA未被甲基化时能以较高效率切割或消化该未甲基化DNA分子的酶。
[0090] 本文所用的术语“非-亚硫酸氢盐方法”和“非-亚硫酸氢盐定量方法”指不需要用亚硫酸氢盐而能定量测定甲基化或非甲基化核酸的任何方法。该术语也指不需要用亚硫
酸氢盐处理而制备待定量测定的核酸的方法。非亚硫酸氢盐方法的例子包括但不限于:用
一种或多种甲基化敏感的酶消化核酸的方法和用根据甲基化状况结合核酸的试剂分离核
酸的方法。
[0091] 术语“甲基-敏感酶”和“甲基化敏感的限制性内切酶”是活性依赖于它们的DNA识别位点的甲基化状态的DNA限制性内切核酸酶。例如,有的甲基敏感酶仅在它们的DNA
识别序列未甲基化时在该处作切割或消化。因此,未甲基化的DNA样品切割成小于甲基化
DNA样品的片段。类似地,不会切割高度甲基化的DNA样品。相反,也有的甲基敏感酶仅在
它们的DNA识别序列甲基化时在该处作切割。本文所用的术语“切割”、“切断”和“消化”可互换使用。
[0092] 本文所用的术语“靶核酸”指采用本文公开的方法检测的核酸,以确定该核酸是否为妊娠相关疾病或染色体异常的一部分。例如,可用本发明方法检验染色体21的靶核酸以检测唐氏综合征。
[0093] 本文所用的术语“对照核酸”指用作本文所公开方法的参比核酸以确定该核酸是否为染色体异常的一部分的核酸。例如,除染色体21以外的染色体(本文称为“参比染色
体”)的对照核酸可以作为参比序列以检测唐氏综合征。在一些实施方式中,所述对照序列的含量已知或已预先确定。
[0094] 本文所用的术语“序列特异性”或“基因座特异性方法”指根据序列组成查询(例如,定量测定)基因组中特定位置(或基因座)核酸的方法。序列特异性或基因座特异性方法能定量测定特定区域或染色体。
[0095] 术语“基因”表示参与产生多肽链的DNA区段;其包括编码区之前和之后,参与转录/翻译基因产物和调节转录/翻译的区域(前导序列和尾序列),以及各编码区段(外显子)之间的插入序列(内含子)。
[0096] 在本申请书中,术语“多肽”、“肽”和“蛋白质”在本文中可互换使用,指基酸残基的聚合物。该术语适合用于其中一个或多个氨基酸残基是相应天然产生氨基酸的人工化学模拟物的氨基酸聚合物,以及天然产生的氨基酸聚合物和非天然产生的氨基酸聚合物。本
文所用的这种术语包括任何长度的氨基酸链,包括全长蛋白质(即抗原),其中氨基酸残基
通过共价肽键连接。
[0097] 术语“氨基酸”指天然产生的和合成的氨基酸,以及功能类似于天然产生氨基酸的氨基酸类似物和氨基酸模拟物。天然产生的氨基酸是遗传密码编码的氨基酸,以及随后经修饰的氨基酸,如羟基脯氨酸、γ-羧基谷氨酸和O-磷酸丝氨酸。
[0098] 在本文中,氨基酸可用IUPAC-IUB生物化学命名委员会推荐的通用三字母符或单字母符表示。同样,核苷酸可用其普遍接受的单字母代码表示。
[0099] 本文所用的“引物”指可用于扩增方法,例如聚合酶链式反应(PCR)的寡核苷酸,从而能根据对应于不同甲基化状况的特定基因组序列,例如位于染色体21的CpG岛
CGI137、PDE9A或CGI009内的序列的多核苷酸序列来扩增核苷酸序列。扩增多核苷酸序列
的PCR引物中至少一种对该序列是序列特异性的。
[0100] 术语“模板”指在本发明中可用于扩增的任何核酸分子。可将天然不是双链的RNA或DNA制成双链DNA以便用作模板DNA。任何双链DNA或含有多个不同双链DNA分子的制品均可用作模板DNA,以扩增模板DNA中所含的一个或多个感兴趣基因座。
[0101] 本文所用的术语“扩增反应”指将核酸拷贝一次或多次的过程。在各实施方式中,扩增方法包括但不限于:聚合酶链式反应、自身我维持的序列反应(self-sustained
sequence reaction)、连接酶链式反应、cDNA末端的快速扩增、聚合酶链式反应和连接酶链式反应、Q-β噬菌体扩增、链置换扩增或剪接重叠延伸聚合酶链式反应。在一些实施方式
中,例如可通过数字PCR扩增单分子的核酸。
[0102] 本文所用的术语“灵敏度”指真阳性的数值除以真阳性加上假阴性的数值,其中灵敏度(sens)可以在0≤sens≤1的范围内。本发明方法的各实施方式最好具有等于0或接近等于0的假阴性数值,从而不会在对象实际上具有至少一种染色体异常或其它遗传疾
病时将该对象错误鉴定成不具有至少一种染色体异常或其它遗传疾病。相反,评估常包括
预测算法能否正确分类阴性(对灵敏度的互补检测)。本文所用的术语“特异性”指真阴性
的数值除以真阴性加上假阳性的数值,其中特异性(spec)可以在0≤spec≤1的范围内。
本发明方法的各实施方式最好具有等于0或接近等于0的假阳性数值,从而不会在对象不
具有所评估的染色体异常或其它遗传疾病时将该对象错误鉴定成具有至少一种染色体异
常或其它遗传疾病。因此,有时选择灵敏度和特异性等于1或100%的方法。
[0103] 可采用一种或多种预测算法,测定在不同条件下所收集检测数据的显著性或给予其意义,可不依赖地或依赖地彼此进行权衡。本文所用的术语“变量”指具有某数值或一组数值的某算法的因素、数量或功能。例如,设计的变量可以是一组扩增核酸的种类,扩增核酸种类的组数、检测胎儿遗传贡献的百分比、检测母体遗传贡献的百分比、测定染色体异常的类型、测定遗传疾病的类型、测定性连锁异常的类型、母亲的年龄等。本文所用的术语“不依赖于”指不受另一因素的影响或控制。本文所用的术语“依赖于”指受另一因素的影响或控制。例如,活生物体中的特定染色体和该特定染色体产生的三体性事件是彼此依赖的变
量。
[0104] 本领域技术人员可采用任何类型的方法或预测算法判断本发明数据的显著性是2
否在可接受的灵敏度和/或特异性范围内。例如,可采用的预测算法有,如κ 检验、z-检
验、t-检验、ANOVA(方差分析)、回归分析、神经网络(neural net)、模糊逻辑、隐藏马氏模型(Hidden Markov Models)、多模型状态估计等。可确定本发明含有不同非依赖性和/或
依赖性变量的数据对分析的一种或多种方法或预测算法具有显著性。可确定本发明含有不
同非依赖性和/或依赖性变量的数据对分析的一种或多种方法或预测算法没有显著性。可
根据一种或多种预测算法的结果(例如,所分析组的数量、各组中核苷酸的类型)设计或改
2
变本文所述方法不同变量的参数。例如,用κ 检验检测的数据可能提示,母亲年龄的具体范围与后代患特定染色体异常的可能性较高相关,因此与其它变量相比,母亲年龄变量可
有不同权重。
[0105] 在某些实施方式中,可选择检验几种算法。可利用原始数据训练这些算法。对于每种新的原始数据样品,经过训练的算法会指定该样品的类别(即,三体性或正常)。对新
的原始数据样品类别,可根据灵敏度和特异性评估经过训练算法的性能。最后鉴定出具有
最高灵敏度和/或特异性或它们组合的算法。
[0106] 详述
[0107] 引言
[0108] 1997年首次报道母体血浆中存在胎儿核酸,从而为简单地通过分析母体血液样品进行非侵入性诊断提供了可能性(Lo等.,Lancet 350:485-487,1997)。迄今为止,已
开发了许多潜在的临床应用。具体地说,发现母体血浆中胎儿核酸(如DNA)浓度的含
量异常与许多妊娠相关疾病,包括先兆子痫、早产、产前出血、侵袭性胎盘形成(invasive placentation)、胎儿唐氏综合征和其它胎儿染色体非整倍性有关。因此,母亲血浆中的胎儿核酸分析代表了监测妇婴健康的有力机制。
[0109] 然而,胎儿DNA与背景母体DNA共同存在于母体血浆中。因此,大多数报道的应用依赖于检测Y-染色体序列,因为这些序列最易与母体DNA区分。此类方法将现有试验的应
用仅仅局限在50%的所有妊娠,即怀有男性胎儿的那些妇女。因此,很需要开发不依赖性别的组合物和方法以便富集和分析母体样品中的胎儿核酸。依赖于多态性标记来定量测定胎
儿核酸的方法还对不同种族之间的不同杂合率敏感,从而限制了它们的应用(例如,需要
增加标记物的数量)。
[0110] 已证明可通过胎儿与母体DNA甲基化状况的不同来区分它们(参见通过引用纳入本文的美国专利第6,927,028号)。甲基化是一种外遗传学现像,指改变表型而不涉及DNA
序列改变的过程。通过利用母亲与胎儿之间DNA甲基化状况的不同可成功检测并分析母体
核酸背景中的胎儿核酸。
[0111] 本发明人提供胎儿的胎儿DNA(例如,来自胎盘)与母亲的母体DNA(例如,来自外周血细胞)之间差异甲基化的新型基因组多核苷酸。因此,该发现为区分胎儿与母体基因
组DNA提供了一种新方法,为精确定量测定胎儿核酸提供了新方法,该方法可用于非侵入
性产前诊断。
[0112] 方法
[0113] 为实施本发明可采用分子生物学领域的常规技术。公开的可用于本发明的通用方法的基础教材包括Sambrook和Russell,《分子克隆:实验室手册》(Molecular Cloning,A Laboratory Manual)(第3版.,2001);Kriegler,《基因转移和表达:实验室手册》(Gene Transfer and Expression:A Laboratory Manual)(1990);和《分子生物学最新方案》
(Current Protocols in Molecular Biology)(Ausubel等编.,1994))。
[0114] 核酸的大小以千碱基(kb)或碱基对(bp)为单位给出。它们是从琼脂糖或丙烯酰胺凝胶电泳、测序核酸或公开的DNA序列获得的估计值。蛋白质的大小以千道尔顿(kDa)
或氨基酸残基数目为单位给出。由凝胶电泳、测序的蛋白质、推导的氨基酸序列或公开的蛋白质序列估计蛋白质大小。
[0115] 可化学合成不能商品化购得的寡核苷酸,例如按照Beaucage和Caruthers,Tetrahedron Lett.22:1859-1862(1981)首先描述的固相亚磷酰胺三酯方法,如Van
Devanter等.,Nucleic Acids Res.12:6159-6168(1984)所述用自动合成仪合成。可采用
本领域公知的方法,例如Pearson和Reanier,J.Chrom.255:137-149(1983)所述的天然丙
烯酰胺凝胶电泳或阴离子交换高效液相色谱(HPLC)纯化寡核苷酸。
[0116] 获得血液样品和提取DNA
[0117] 本发明涉及分离、富集和分析母体血液中发现的胎儿DNA,作为一种非侵入性方法可检测是否存在妊娠相关疾病或病症和/或监测其发展。因此,实施本发明的第一步骤是获得妊娠妇女的血液样品并提取该样品中的DNA。
[0118] A.获得血液样品
[0119] 获得适合用本发明方法检验的孕龄妊娠妇女的血液样品。如下所述,合适的孕龄根据所检验的疾病而不同。按照医院或诊所通常遵循的标准方法收集妇女的血液。收集适
当量的外周血,例如通常是5-50ml,按照标准流程储存,然后进一步制备。可按照本领域普通技术人员已知的方式收集、储存或转运血液样品,以最大程度减少样品中存在核酸的降
解或维持其质量。
[0120] B.制备血液样品
[0121] 可利用,例如全血、血清或血浆来实施本发明对母体血液中发现的胎儿DNA的分析。本领域技术人员熟知制备母体血液的血清或血浆的方法。例如,可将妊娠妇女的血液
置于含有EDTA或商品化专用产品,例如Vacutainer SST(新泽西州富兰克林湖的BD公司
(Becton Dickinson,Franklin Lakes,N.J.))的试管中以防血液凝固,然后离心获得全血的血浆。另一方面,可在血液凝固后离心或不离心获得血清。如果采用离心,通常(但不一定)以适当转速,例如1,500-3,000g进行。先对血浆或血清进行额外的离心步骤,再转移
到新的试管中提取DNA。
[0122] 除了全血的非细胞部分外,也可从富集在血沉棕黄层部分中的细胞组分回收DNA,其可在妇女的全血样品离心和除去血浆后获得。
[0123] C.提取DNA
[0124] 有许多已知方法从包括血液在内的生物学样品中提取DNA。可按照DNA制备的通用方法(例如,Sambrook和Russell,《分子克隆:实验室手册》,第3版.,2001所述的);也可用各种可商品化购得的试剂或试剂盒获得妊娠妇女血液样品中的DNA,所述试剂或试剂
盒例如有:恰根公司的QIAamp循环性核酸试剂盒(Qiagen’s QIAamp Circulating Nucleic Acid Kit)、德国希尔顿恰根公司(Qiagen,Hilden,Germany)的QiaAmp DNA迷你试剂盒
(QiaAmp DNA Mini Kit)或QiaAmp DNA血液迷你试剂盒(QiaAmp DNA Blood Mini Kit)、
TM
威斯康星州麦迪逊市普罗迈格公司(Promega,Madison,Wis.)的GenomicPrep 血液DNA分
TM
离试剂盒和新泽西州皮斯卡塔韦阿姆仙公司(Amersham,Piscataway,N.J.)的GFX 基因
组血液DNA纯化试剂盒。还可采用这些方法多个的组合。
[0125] 在一些实施方式中,可先用一种或多种方法富集或相对富集胎儿核酸。例如,然后单用本发明组合物和方法或与其它区分因素联用来区分胎儿与母体DNA。这些因素的例子包括但不限于:染色体X与Y之间的单个核苷酸差异、染色体Y-特异性序列、位于基因组
中它处的多态性、胎儿与母体DNA之间的大小差异和母体与胎儿组织之间甲基化模式的差
异。
[0126] 富集样品中特定核酸种类的其它方法描述参见通过引用纳入本文的2007年5月30日提交的PCT专利申请号PCT/US07/69991;2007年6月15日提交的PCT专利申请号PCT/
US2007/071232;美国临时申请号60/968,876和60/968,878(转让给本申请人)、(2005年
11月28日提交的PCT专利申请号PCT/EP05/012707)。在某些实施方式中,选择性除去样
品中的母亲核酸(部分、基本上、几乎完全或完全除去)。
[0127] 甲基化特异性分离核酸
[0128] 本文提供的方法是根据DNA甲基化差异的甲基化特异性分离法,为富集胎儿DNA提供了一种替代方案。最近发现参与发育调节的许多基因在胚胎干细胞中通过外遗传学
途径调节。因此,预计有多种基因在胎儿来源与母体来源核酸之间显示有DNA甲基化差
异。一旦鉴定到这些区域,可采用捕捉甲基化DNA的技术特异性富集胎儿DNA。为鉴定甲
基化有差异的区域,采用了新的方法捕捉甲基化的DNA。该方法采用的蛋白质是MBD2的
甲基结合功能域与抗体Fc片段融合的蛋白质(MBD-Fc)(Gebhard C,Schwarzfischer L,
Pham TH,Schilling E,Klug M,Andreesen R,Rehli M(2006)“CpG甲基化的基因组分布模式可鉴定髓细胞性白血病中异常高度甲基化的新靶标”(Genomewide profiling of CpG methylation identifies novel targets of aberrant hypermethylation in myeloid
leukemia).Cancer Res 66:6118-6128)。这种融合蛋白比常规的甲基化特异性抗体有几个优点。MBD-FC对甲基化DNA的亲和力较高,能结合双链DNA。最重要的是这两种蛋白质结
合DNA的方式不同。甲基化特异性抗体是随机结合DNA,这意味着只能获得二元产物。另
一方面MBD-FC的甲基结合区结合DNA分子,而无论它们的甲基化状况。这种蛋白质-DNA
相互作用的强度由DNA甲基化水平决定。结合基因组DNA后,可采用提高洗脱溶液的盐浓
度来分级非甲基化和甲基化DNA,从而能更受控的分离(Gebhard C,Schwarzfischer L,
Pham TH,Andreesen R,Mackensen A,Rehli M(2006)“采用甲基结合(MB)-PCR快速灵
敏地检测CpG-甲基化”(Rapid and sensitive detection of CpG-methylation using
methyl-binding(MB)-PCR).Nucleic Acids Res 34:e82)。因此,该方法(称为甲基-CpG
免疫沉淀法(MCIP))不仅能根据甲基化水平富集,而且能分组基因组DNA,当还要研究未甲
基化DNA组分时特别有用。
[0129] 甲基化敏感的限制性内切酶消化
[0130] 本发明还提供测定母体样品中胎儿核酸含量的组合物和方法。本发明通过选择性消化母体样品中的核酸来富集所述母体样品中的胎儿核酸区域,即,利用能选择性和完全
或基本上完全消化该母体核酸的酶来富集样品中至少一种胎儿核酸区域。消化效率优选
高于约75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、
89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%。富集后,用不需要多态性序列分析或亚硫酸氢盐处理的定量方法测定胎儿核酸含量,所得溶液对女性胎儿和不同人
种之间同样有效,并能保存样品中存在的低拷贝数胎儿核酸。
[0131] 例如,有的甲基敏感酶能优先或基本上完全切割或消化其识别的未甲基化DNA序列。因此,未甲基化的DNA样品将被切割成比甲基化DNA样品更小的片段。类似地,不会切
割高度甲基化的DNA样品。相反,也有的甲基敏感酶切割其识别的甲基化DNA序列。
[0132] 适合用于本发明方法的消化未甲基化DNA的甲基敏感酶包括但不限于:HpaII、HhaI、MaeII、BstUI和AciI。可用的一种酶是只切割未甲基化序列CCGG的HpaII酶。可用的另一种酶是只切割未甲基化序列GCGC的HhaI酶。这两种酶可购自New England BioLabs
Inc。也可联用两种或多种只消化未甲基化DNA的甲基-敏感酶。只消化甲基化DNA的合
+
适酶包括但不限于:切割识别序列GATC的DpnI酶和属于AAA 蛋白超家族、切割含修饰胞嘧
啶的DNA和切割识别位点5′...Pu.sup.mC(N.sub.40-3000)Pu.sup.mC...3′的McrBC酶
(马萨诸塞州贝弗利新英格兰生物实验室有限公司(New England BioLabs,Inc.,Beverly,Mass.))。
[0133] 本领域技术人员熟知所选限制性内切酶在特定位点切割DNA的切割方法和过程。例如,许多限制性内切酶的供应商提供了关于特异性限制性内切酶切割DNA序列的条件和
类型的信息,包括新英格兰生物实验室、普罗迈格公司、B-M公司(Boehringer-Mannheim)
等。Sambrook等(参见Sambrook等.,《分子生物学:实验室方法》(Molecular Biology:
A laboratory Approach),冷泉港(Cold Spring Harbor),纽约.,1989)全面描述了利用限制性内切酶和其它酶的方法。在本发明的方法中,通常在能以约95%-100%效率,优选约
98%-100%效率切割母亲DNA的条件下使用所述酶。
[0134] 甲基化分析的其它方法
[0135] 本领域已知有多种甲基化分析方法可与本发明联用。这些试验能测定DNA序列内的一个或多个CpG岛的甲基化状态。此外,可采用这些方法定量测定甲基化的核酸。此类
试验包括亚硫酸氢盐处理DNA后的DNA测序、PCR(序列特异性扩增)、Sourthern印迹分析
和利用甲基化敏感的限制性内切酶等其它技术。
[0136] 基因组测序是采用亚硫酸氢盐处理,分析DNA甲基化模式和5-甲基胞嘧啶分布的已简化的一种技术(Frommer等.,Proc.Natl.Acad.Sci.USA 89:1827-1831,1992)。此
外,可采用限制性内切酶消化被亚硫酸氢盐转变的DNA的PCR扩增产物,例如Sadri和
Hornsby(Nucl.Acids Res.24:5058-5059,1996)所述的方法或COBRA(联合的亚硫酸氢盐
限制性分析(Combined Bisulfite Restriction Analysis))(Xiong和Laird,Nucleic
Acids Res.25:2532-2534,1997)。
[0137] COBRA分析是用于测定少量基因组DNA中特定基因座DNA甲基化水平的一种定量测定甲基化的试验(Xiong和Laird,Nucleic Acids Res.25:2532-2534,1997)。简言之,采用限制性内切酶消化以揭示亚硫酸氢钠处理DNA的PCR产物中甲基化依赖性序列的差异。
按照Frommer等(Proc.Natl.Acad.Sci.USA 89:1827-1831,1992)所述的方法用标准亚硫
酸氢盐处理先将甲基化依赖性序列差异引入基因组DNA中。然后用感兴趣CpG岛的特异性
引物进行亚硫酸氢盐转变DNA的PCR扩增,再进行限制性核酸内切酶消化、凝胶电泳和用特
异性标记的杂交探针检测。原始DNA样品的甲基化水平在DNA甲基化水平的宽图谱上表示
为线性定量方式的消化和未消化PCR产物的相对含量。此外,该技术能够可靠地应用于石
蜡包埋组织样品显微切片获得的DNA。典型的COBRA分析试剂(例如,典型COBRA试剂盒中
用到的)包括但不限于:特定基因(或甲基化改变的DNA序列或CpG岛)的PCR引物,限制
性内切酶和适当的缓冲液,基因-杂交寡聚物,对照杂交寡聚物,寡聚物探针的激酶标记试剂盒,和放射性核苷酸。此外,亚硫酸氢盐转变试剂包括:DNA变性缓冲液,磺化缓冲液,DNA回收试剂或试剂盒(例如,沉淀、超滤、亲和柱),脱磺基缓冲液,和DNA回收组分。
[0138] MethyLightTM试验是采用荧光实时PCR(TaqMan.RTM.)技术的高通量定量甲基化试验,在PCR步骤后不需要作进一步操作(Eads等.,Cancer Res.59:2302-2306,1999)。简TM
言之,MethyLight. 方法开始时采用基因组DNA的混合样品,按照标准方法在亚硫酸氢钠
反应中将其转变成依赖于甲基化序列差异的混合合并物(亚硫酸氢盐方法将未甲基化胞
嘧啶残基转变成尿嘧啶)。然后以“无偏向”(用已知的CpG甲基化位点不重叠的引物)PCR
反应或“偏向”(用已知的CpG二核苷酸重叠的PCR引物)PCR反应进行荧光PCR。序列鉴
别可在扩增过程水平和/或荧光检测过程水平作出。
[0139] MethyLight试验可用作基因组DNA样品甲基化模式的定量试验,其中序列鉴别在探针杂交水平作出。在该定量检测中,当存在与特定的推定甲基化位点重叠的荧光探针时
PCR反应提供了无偏向扩增。其中引物或探针均不覆盖任何CpG二核苷酸的该反应为DNA
输入量提供了无偏向对照。或者,通过用不覆盖已知甲基化位点的对照寡核苷酸(荧光形
式的“MSP”技术),或用覆盖潜在甲基化位点的寡核苷酸,探查偏向PCR混合合并物进行基因组甲基化的定量检测。
[0140] 扩增过程中MethyLight方法可采用“TaqMan”探针。例如,用亚硫酸氢钠处理双链基因组DNA,用TaqMan.RTM探针进行两组PCR反应之一组,例如用偏向引物和TaqMan.RTM.探针,或无偏向引物和TaqMan.RTM.探针。设计TaqMan.RTM.探针用荧光“报道”和“猝灭”分子作双重标记,对GC含量较高区域具有特异性,因此在PCR循环中它的解链温度比正向
或反向引物高约10℃。如此TaqMan.RTM.探针能在PCR退火/延伸步骤期间维持完全杂
交。由于Taq聚合酶在PCR期间酶促合成新链,其最终到达退火的TaqMan.RTM.探针。随
后Taq聚合酶5’→3’核酸内切酶活性替换TaqMan.RTM.探针使探针消化释放出荧光报道
分子,以便用实时荧光检测系统定量检测其新的未猝灭信号。
[0141] MethyLight.TM.分析所用的典型试剂(例如,可在典型MethyLight.TM.试剂盒中找到)包括但不限于:特定基因(或甲基化改变的DNA序列或CpG岛)的PCR引物;TaqMan.
RTM.探针;优化的PCR缓冲液和脱氧核苷酸;和Taq聚合酶。
[0142] Ms-SnuPE技术是根据亚硫酸氢盐处理DNA,然后作单个核苷酸引物延伸,用以评估特定CpG位点甲基化差异的定量方法(Gonzalgo和Jones,Nucleic Acids Res.25:
2529-2531,1997)。
[0143] 简言之,基因组DNA与亚硫酸氢钠反应使未甲基化的胞嘧啶转变成尿嘧啶,而5-甲基胞嘧啶不变。然后用被亚硫酸氢盐转变的DNA的特异性PCR引物扩增所需靶序列,
分离得到的产物用作感兴趣CpG位点甲基化分析的模板。
[0144] 可分析微量DNA(例如,显微切割的病理学切片),和避免用限制性内切酶来测定CpG位点的甲基化状况。
[0145] Ms-SnuPE分析所用的典型试剂(例如,可在典型Ms-SnuPE试剂盒中找到)包括但不限于:特定基因(或甲基化改变的DNA序列或CpG岛)的PCR引物;优化的PCR缓冲液和
脱氧核苷酸;凝胶提取试剂盒;正对照引物;特定基因的Ms-SnuPE引物;反应缓冲液(对于Ms-SnuPE反应);和放射性核苷酸。此外,亚硫酸氢盐转变试剂可包括:DNA变性缓冲液;磺化缓冲液;DNA回收试剂或试剂盒(例如,沉淀、超滤、亲和柱);脱磺基缓冲液;和DNA回收组分。
[0146] MSP(甲基化-特异性PCR)能评估CpG岛内基本上任何CpG位点簇(group)的甲基化状况,而不依赖采用甲基化敏感的限制性内切酶(Herman等.Proc.Nat.Acad.Sci.USA
93:9821-9826,1996;美国专利第5,786,146号)。简言之,通过亚硫酸氢钠修饰DNA将未
甲基化(但不是甲基化的)胞嘧啶转变成尿嘧啶,随后用甲基化DNA(而不是未甲基化的
DNA)的特异性引物扩增。MSP仅需微量DNA,灵敏度可达到(检测出)对给定CpG岛基因
座等位基因0.1%甲基化水平,可应用于从石蜡包埋样品提取的DNA。MSP分析所用的典型
试剂(例如,可在典型MSP试剂盒中找到)包括但不限于:特定基因(或甲基化改变的DNA
序列或CpG岛)的甲基化和未甲基化PCR引物;优化的PCR缓冲液和脱氧核苷酸;及特异性
探针。
[0147] MCA技术是可用于筛选甲基化模式改变的基因组DNA和分离与这些改变相关的特定序列的一种方法(Toyota等.,Cancer Res.59:2307-12,1999)。简言之,先用对它们识别位点中胞嘧啶甲基化敏感性不同的限制性内切酶消化原发性肿瘤、细胞系和正常组织的
基因组DNA,再进行任意引发的PCR扩增。在高分辨聚丙烯酰胺凝胶上分辨PCR产物后,克
隆并测序显示甲基化状况不同的片段。然后将克隆的片段用作Sourthern分析的探针,以
证实这些区域的甲基化差异。MCA分析所用的典型试剂(例如,可在典型MCA试剂盒中找
到)包括但不限于:可任意引发基因组DNA的PCR引物;PCR缓冲液和核苷酸、限制性内切
酶和适当的缓冲液;基因-杂交寡核苷酸或探针;对照杂交寡核苷酸或探针。
[0148] 分析甲基化位点的另一方法是引物延伸试验,包括产生扩增靶序列以供随后用质谱法进行引物延伸基因型分析的优化PCR扩增反应。该试验也可以多重方式进行。该方法
(特别是其与单核苷酸多态性基因分型相关)的详细描述参见PCT公布号WO05012578A1和
美国公布号US20050079521A1。对于甲基化分析,可用该试验检测依赖于C→T序列改变的
亚硫酸氢盐引入的甲基化。这些方法特别可用于在一个孔中进行多重扩增反应和多重引物
延伸反应(例如,多重均相引物质量延伸(hME)试验)而进一步提高每次反应引物延伸的
通量和降低成本。
[0149] DNA甲基化分析的四种其它方法包括限制性标记基因组扫描(RLGS,Costello等.,2000)、甲基化-敏感的-再现差异分析法(MS-RDA)、甲基化-特异性
AP-PCR(MS-AP-PCR)和用甲基-CpG结合功能域柱/分离部分解链的分子(MBD/SPM)。
[0150] 可与本发明联用的其它甲基化分析方法的描述参见以下论文:Laird,P.W.Nature Reviews Cancer 3,253-266(2003);Biotechniques;Uhlmann,K. 等 .Electrophoresis23:4072-4079(2002)-PyroMeth;Colella等.Biotechniques.2003年7月;35(1):146-50;
Dupont JM,Tost J,Jammes H,和Gut IG.Anal Biochem,2004年10月;333(1):119-27;
Tooke N和Pettersson M.IVDT.2004年11月;41。
[0151] 多核苷酸序列的扩增和测定
[0152] 以甲基化差异模式分离核酸后,可对核酸作序列分析。此外,一旦测定到胎儿来源的一种特定基因组序列相比于母体序列高或低甲基化,即可测定该胎儿基因组序列的含
量。然后,可比较该量与标准对照值,作为可能患有某些妊娠相关疾病的指标。
[0153] A.扩增核苷酸序列
[0154] 在许多情况中,优选用本领域熟知的几种核酸扩增方法(上文和下文更详细描述)之一扩增本发明核酸序列。具体地说,核酸扩增是酶促合成含有与所扩增核酸序列互
补序列的核酸扩增子(拷贝)。当样品中存在的靶序列含量非常低时,核酸扩增尤其有利。
通过扩增靶序列检测合成的扩增子,试验的灵敏度大大提高,因为试验开始时只需要微量
靶序列,因而能更好地确保检测出样品中属于感兴趣生物或病毒的核酸。
[0155] 研究中频繁采用熟知的各种多核苷酸扩增方法。例如,本领域熟知用于多核苷酸序列扩增的聚合酶链式反应(PCR)通用方法,本文不再赘述。PCR方法、方案和设计引物的
原理的综述可参见,例如Innis等.,《PCR方案:方法与应用指南》(PCR Protocols:A Guide to Methods and Applications),学术出版社有限公司(Academic Press,Inc.),纽约.,
1990。PCR试剂和方法也可购自商业零售商,例如罗氏分子系统公司(Roche Molecular
Systems)。
[0156] PCR常用热稳定性酶自动进行。在该方法中,反应混合物的温度在通过变性区、引物退火区和延伸反应区时自动循环改变。可商品化购得专门适用于此目的的仪器。
[0157] 虽然通常用PCR扩增多核苷酸序列来实施本发明,但本领域技术人员知道可用任何已知方法,例如连接酶链式反应(LCR)、转录介导的扩增和自身维持的序列反应或核酸序列扩增(NASBA)来扩增母体血液样品中发现的基因组序列,各方法均可提供充分的扩增。
可采用近年开发的分支DNA技术定量显示代表特定甲基化模式的本发明特定基因组序列
是否存在,或定量测定母体血液中该特定基因组序列的含量。分支DNA信号扩增直接定量
测定临床样品核酸序列的综述参见Nolte,Adv.Clin.Chem.33:201-235,1998。
[0158] 当用数字PCR实施时,本发明的组合物和方法也特别有用。数字PCR由Kalinina与同事(Kalinina等.,“采用TaqMan检测的纳升规模PCR(Nanoliter scale PCR with
TaqMan detection).”Nucleic Acids Research.25;1999-2004,(1997)) 首 先 开 发,由Vogelstein和Kinzler(数 字PCR(Digital PCR).Proc Natl Acad Sci U S A.96;
9236-41,(1999))进一步改进。将数字PCR应用于胎儿诊断由Cantor等(PCT专利申请号
WO05023091A2)首先描述,随后由Quake等(美国专利公布号US 20070202525)描述,二者
均通过引用纳入本文。数字PCR的优点是可在单分子水平上扩增核酸(DNA、cDNA或RNA),
为定量测定低拷贝数核酸提供了高灵敏方法。Fluidigm 公司要提供数字分析核酸的系
统。
[0159] B.测定多核苷酸序列
[0160] 多核苷酸序列测定的技术也是熟知的并在相关领域广泛实施。例如,多核苷酸测序的基础原理和通用技术描述于分子生物学和重组遗传学的各种研究报告和论文,例如
Wallace等.,同上;Sambrook和Russell,同上;和Ausubel等.,同上。可采用研究实验室常规使用的、手工或自动DNA测序方法实施本发明。适合检测多核苷酸序列改变以实施本
发明方法的其它方式包括但不限于:质谱法、引物延伸、多核苷酸杂交、实时PCR和电泳。
[0161] 引物延伸反应也可应用于本发明方法中。例如,引物延伸反应的操作是,将脱氧核苷酸和/或二脱氧核苷酸(dideoxynucleotides)掺入与SNP位点毗邻区域杂交的引物延伸引物,来区分SNP等位基因。用聚合酶延伸引物。用质谱法或标记物(如生物素)物理
检测引物延伸的SNP。由于用特异性标记物标记互补脱氧核苷酸或二脱氧核苷酸,或产生具有特定质量的引物延伸产物,只能延伸SNP位点,因而可区分并定量测定SNP等位基因。
[0162] 逆转录和扩增的核酸可以是修饰的核酸。修饰的核酸可包含核苷酸类似物,在某些实施方式中,包含可检测标记物和/或捕捉剂。可检测标记物的例子包括但不限于:荧光团、放射性同位素、比色剂、发光试剂、化学发光试剂、光散射试剂、酶等。捕捉剂的例子包括但不限于选自以下的成对结合试剂:抗体/抗原、抗体/抗体、抗体/抗体片段、抗体/抗体
受体、抗体/A蛋白或G蛋白、半抗原/抗-半抗原、生物素/亲和素、生物素/链霉亲和素、
叶酸/叶酸结合蛋白、维生素B12/内因子、化学反应基团/互补化学反应基团(例如,巯基
/马来酰亚胺、巯基/卤代乙酰基衍生物、胺/异三氰酸盐或酯(isotriocyanate)、胺/琥
珀酰亚胺酯和胺/磺酰卤)对等。在某些实施方式中,可将含捕捉试剂的修饰核酸固定于
固体支持物。
[0163] 质谱法是检测本发明多核苷酸,例如PCR扩增子、引物延伸产物或从靶核酸切割下的检测探针的特别有效的方法。通过比较所检测信号的质量与感兴趣多核苷酸的预
计质量,可验证多核苷酸序列的存在。特定多核苷酸序列的相对信号强度,例如光谱的
质量峰,可表明具体等位基因的相对群,从而能从数据直接计算出等位基因比例。采用
TM
Sequenom 标准iPLEX 试验和MassARRAY 技术的基因分型方法的综述参见Jurinke,C.,
Oeth,P.,van den Boom,D.,“MALDI-TOF质谱法:高性能DNA分析的通用工具(MALDI-TOF mass spectrometry:a versatile tool for high-performance DNA analysis).”Mol.
TM
Biotechnol.26,147-164(2004);和Oeth,P.等.,“iPLEX 试验:通过采用质量修饰终
TM
止子的单碱基引物延伸提高了MassARRAY 系统的丛集效率和灵活性(iPLEX Assay:
Increased Plexing Efficiency and Flexibility for MassARRAY System through
single base primer extension with mass-modified Terminators.)”SEQUENOM
Application Note(2005),二者均通过引用纳入本文。利用能在扩增过程中切割和用质谱
法检测的可切割检测探针,检测和定量测定靶核酸的综述参见2007年12月4日提交的美
国专利申请号11/950,395(通过引用纳入本文)。
[0164] 测序技术的通量和成本正得到改进。测序技术能以高倍增数量级,平行测定从样品中分离的许多核酸分子的序列(Dear Brief Funct Genomic Proteomic 2003;1:
397-416),所述技术例如可在:454平台(罗氏公司)(Margulies,M.等.2005 Nature 437,
376-380)、Illumina基因组分析仪(或Solexa平台)或SOLiD系统(应用生物系统公司)上
完成,或赫氏真实单分子DNA测序技术(Harris T D等.2008Science,320,106-109)、太平洋生物科学公司的单分子、实时(SMRT.TM.)技术和纳米孔测序(Soni GV和Meller A.2007
Clin Chem 53:1996-2001)。
[0165] 这些平台各自能测序克隆扩增的或未扩增的核酸片段单分子。某些平台包括,例如(i)通过连接染料修饰的探针测序(包括环状连接和切割),(ii)高温测序和(iii)单
分子测序。为通过此类序列分析平台分析核苷酸序列,可将核苷酸序列种类、扩增的核酸种类和从它们产生的可检测产物视作“要研究的核酸”。
[0166] 连接测序是依赖于DNA连接酶对碱基对错配敏感的一种核酸测序方法。DNA连接酶能将碱基配对正确的DNA二末端连接在一起。联合了DNA连接酶只能将碱基配对正确的
DNA末端连接在一起和荧光标记寡核苷酸或引物的混合合并物通过检测荧光而测定序列
(这二种功能)。通过纳入含有可在标记物鉴定后被切割的可切割连接键的引物,可获得对
较长序列的读取。切断接头除去标记物后在连接引物的一端再产生5’磷酸根,从而制备用于另一轮连接的引物。在一些实施方式中,可用一种以上荧光标记物(例如,1种荧光标记
物,2、3或4种荧光标记物)标记这些引物。
[0167] 普通技术人员可用的基于连接测序的系统的一个例子通常包括以下步骤。在含有要研究的核酸(“模板”)、扩增反应组分、珠和引物的乳化微量反应器中制备克隆珠群。
扩增后,使模板变性,进行珠富集以分离含延伸模板的珠与不想要的珠(例如,含未延伸模板的珠)。所选珠上的模板经历3’修饰而共价结合于载玻片上,使修饰的珠沉积在载玻片
上。沉积室能在珠加载过程中将载玻片区分成1、4或8个室。引物与衔接序列杂交以供序
列分析。使一组四色染料标记的探针竞争与测序引物相连。通过查询系列连接期间的每个
第4和第5位碱基可实现探针连接的特异性。进行5-7轮连接、检测和切割,记录每个第五
位的颜色以及所用文库类型确定的循环轮次。每轮连接后,新的互补引物为另一系列的连
接在5’方向补偿加入一个碱基。重复引物复原和连接轮次(每轮5-7个连接循环)5次,
产生含25-35个碱基对序列的单个标签。用匹配的成对测序重复该过程产生第二标签。可
用此类系统指数扩增本文所述方法产生的扩增产物,例如将异源核酸连接于本文所述方法
产生的第一扩增产物,用与原用于产生第一扩增产物相同或不同的固体载体进行乳液扩增
(emulsion amplification)。还可通过绕过指数扩增过程和直接分选载玻片上的固体载
体,从而用此类系统分析本文所述方法直接产生的扩增产物。
[0168] 高温测序是基于合成法测序的一种核酸测序方法,依赖于检测掺入核苷酸后释放的焦磷酸。合成法测序通常包括一次合成一个核苷酸,产生与所研究序列的链互补的DNA
链。可将要研究核酸固定于固体载体,与测序引物杂交,与DNA聚合酶、ATP硫化酶、萤光素酶、核苷三磷酸二磷酸酶(apyrase)、腺苷5’磷酸和荧光素一起培育。依次加入和除去核苷酸溶液。正确掺入核苷酸释放的焦磷酸在腺苷5’磷酸存在下与ATP硫化酶相互作用产生
ATP,加入荧光素反应产生化学发光信号而能测定序列。
[0169] 普通技术人员可用的基于高温测序系统的例子,通常包括以下步骤:将衔接核酸连接于要研究的核酸使要研究的核酸与珠杂交;扩增乳液中要研究的核酸的核苷酸序
列;采用皮升多孔固体支持物分选珠;和用高温测序方法测定扩增核苷酸的序列(例如,
Nakano等.,“利用油包水乳液的单分子PCR(Single-molecule PCR using water-in-oil
emulsion)”Journal of Biotechnology 102:117-124(2003))。可用此类系统指数扩增本文所述方法产生的扩增产物,例如将异源核酸连接于本文所述方法产生的第一扩增产物。
[0170] 某些单分子测序实施方式依据合成法测序的原理,采用一对荧光共振能量转移分子(一对FRET)作为成功掺入核苷酸导致光子发射的机制。常联用增强的或高灵敏度的
有色电荷-偶联装置与全内反射显微镜(TRIM)来检测发射的光子。光子仅在加入的反应
溶液所含的核苷酸正确掺入到测序过程中合成的延伸核酸链时才发射。在基于FRET的单
分子测序中,能量通过长程偶极相互作用在两种荧光染料(有时是含多个次甲基的花青染
料Cy3与Cy5)之间转移。供体受激发产生其特定波长的激发光,激发态能量非放射性地转
移给受体染料,后者进而被激发。受体染料通过放射性发射光子最终回归其基态。在一对
FRET中,能量转移过程中所用的两种染料代表了这种“一对”。Cy3常用作供体荧光团,常掺入作为第一标记的核苷酸。Cy5常用作接受体荧光团,用作在掺入第一Cy3标记的核苷酸后
连续加入核苷酸的标记物。为成功转移能量,各荧光团通常彼此在10纳米以内。
[0171] 可用的基于单分子测序系统的例子,通常包括使引物与要研究的核酸杂交以产生复合物,使该复合物结合于固相,用荧光分子标记的核苷酸迭代延伸引物,和捕捉每次迭代延伸后荧光共振能量转移信号的图像(参见,美国专利第7,169,314号;Braslavsky等.,
PNAS 100(7):3960-3964(2003))。可利用此类系统直接测序本文所述方法产生的扩增产
物。在一些实施方式中,使释放的线形扩增产物与含有在固体支持物,例如珠或载玻片上的固定捕捉序列的互补序列的引物杂交。使引物-释放的线形扩增产物的复合物与固定的捕
捉序列杂交,将释放的线形扩增产物固定于固体支持物以便用合成法进行一对FRET测序。
引物通常为荧光引物,因此可产生含有固定核酸载玻片表面的最初参比图像。这种最初参
比图像可用于测定发生真实核苷酸掺入的位置。在“仅有引物”的参比图像中最初未鉴定
到但在阵列位置检测到的荧光信号作为非特异性荧光弃去。当引物-释放的线形扩增产物
的复合物固定后,常通过以下迭代步骤平行测定结合核酸的序列:a)在一种荧光标记核苷
酸存在下进行聚合酶延伸,b)用合适的显微镜,例如TRIM检测荧光,c)除去荧光核苷酸,和d)重返用不同荧光标记的核苷酸步骤a。
[0172] 在一些实施方式中,可用固相单个核苷酸测序方法进行核苷酸测序。固相单个核苷酸测序方法包括在单分子的样品核酸与单分子的固体支持物杂交条件下,使样品核酸接
触固体支持物。此类条件可包括在“微型反应器”中提供固体支持物分子和单分子样品核
酸。此类条件还包括提供混合物,该混合物中样品核酸分子与固体支持物上的固相核酸杂
交。可用于本文所述实施方式中的单个核苷酸测序方法参见2008年1月17日提交的美国
临时专利申请序列号61/021,871的描述。
[0173] 在某些实施方式中,纳米孔测序检测方法包括(a)使测序核酸(“基础核酸”,如连接的探针分子)接触序列特异性检测序列(detector),在检测序列特异性杂交基础核
酸的基本互补子序列的条件下进行接触;(b)检测该检测序列的信号和(c)根据检测到的
信号测定基础核酸的序列。在某些实施方式中,当检测序列在基础核酸通过孔时受纳米孔
结构的干扰,因而与基础核酸杂交的该检测序列从基础核酸上解离(例如,依次解离)下
来,从而可检测到与基础序列解离的该检测序列。在一些实施方式中,与基础核酸解离的
检测核酸发出可检测信号,而与基础核酸杂交的检测核酸发出不同的可检测信号或无可
检测信号。在某些实施方式中,核酸(例如,连接的探针分子)中的核苷酸被对应于特定
核苷酸(“核苷酸代表”)的特定核苷酸序列取代,从而产生扩展的核酸(参见,美国专利
第6,723,513号),检测序列可与用作基础核酸的这种扩展核酸中的代表性核苷酸杂交。
在此类实施方式中,可将代表性核苷酸排列成二元或更高元排列(例如,Soni和Meller,
Clinical Chemistry 53(11):1996-2001(2007))。在一些实施方式中,不扩展核酸、不产生扩展的核酸而直接用作基础核酸(例如,连接的探针分子用作未扩展的基础核酸),检测序
列与基础核酸直接接触。例如,第一检测序列可与第一子序列杂交,第二检测序列与第二子序列杂交,所述第一检测序列和第二检测序列各自含有彼此可区分的可检测标记,当检测
序列与基础核酸解离时,可彼此区分第一检测序列与第二检测序列的信号。在某些实施方
式中,检测序列包含能与基础核酸杂交的区域(例如,两个区域),长度可以是约3-100个
核苷酸(例如,长约4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、50、
55、60、65、70、75、80、85、90或95个核苷酸)。检测序列还可包含不与基础核酸杂交的一个或多个核苷酸区域。在一些实施方式中,检测序列是分子信标。检测序列常包含一个或多
个独立选自本文所述的可检测标记。可用能检测各标记产生的信号(例如,磁、电、化学、光等信号)的任何方便检测方法检测各可检测标记。例如,可用CD照相机检测与检测序列相
连的一个或多个可区分量子点的信号。
[0174] 在某些序列分析实施方式中,可利用读数(read)构建较大的核苷酸序列,通过鉴定不同读数中的重叠序列和利用读数鉴定序列有助于此种分析。普通技术人员知
道从读数构建较大序列的此类序列分析方法和软件(例如,Venter等.,Science 291:
1304-1351(2001))。在某些序列分析实施方式中,可比较样品核酸中核苷酸序列之间的具
体读数、部分核苷酸序列构建物和全部核苷酸序列构建物(即,内部比较),或可与参比序
列比较(即,参考比较)。有时在样品核酸是从多份样品或从含序列变异的单一样品来源制
备的情况下进行内部比较。有时在参比核苷酸序列已知和比较的目的是为了测定样品核酸
是否含有与参比核苷酸序列基本上相似或相同或不同的核苷酸序列时进行参考比较。本领
域普通技术人员知道用序列分析设备和组件有助于序列分析。
[0175] 本文提供的方法能高通量地检测多种核酸中的核酸物质(例如,核苷酸序列物质、扩增的核酸物质和上述产生的可检测产物)。多重指同时检测一种以上的核酸物
质。已知道联合进行多重反应与质谱法的通用方法(参见,例如美国专利号6,043,031、
5,547,835和国际PCT申请号WO 97/37041)。多重提供的优点是,与对每种靶核酸物质必
须分别进行质谱分析相比,可用最少一次的质谱鉴定多种核酸物质(例如,具有不同序列
变异的一些核酸)。在一些实施方式中,本文提供的方法是高速、高精确分析序列变异的高通量、高自动化方法。在一些实施方式中,本文的方法可在一次反应中高水平地多重检测
[0176] 在某些实施方式中,多重检测的核酸物质数包括但不限于约1-500种(例如,约1-3、3-5、5-7、7-9、9-11、11-13、13-15、15-17、17-19、19-21、21-23、23-25、25-27、27-29、
29-31、31-33、33-35、35-37、37-39、39-41、41-43、43-45、45-47、47-49、49-51、51-53、
53-55、55-57、57-59、59-61、61-63、63-65、65-67、67-69、69-71、71-73、73-75、75-77、
77-79、79-81、81-83、83-85、85-87、87-89、89-91、91-93、93-95、95-97、97-101、101-103、
103-105、105-107、107-109、109-111、111-113、113-115、115-117、117-119、121-123、
123-125、125-127、127-129、129-131、131-133、133-135、135-137、137-139、139-141、
141-143、143-145、145-147、147-149、149-151、151-153、153-155、155-157、157-159、
159-161、161-163、163-165、165-167、167-169、169-171、171-173、173-175、175-177、
177-179、179-181、181-183、183-185、185-187、187-189、189-191、191-193、193-195、
195-197、197-199、199-201、201-203、203-205、205-207、207-209、209-211、211-213、
213-215、215-217、217-219、219-221、221-223、223-225、225-227、227-229、229-231、
231-233、233-235、235-237、237-239、239-241、241-243、243-245、245-247、247-249、
249-251、251-253、253-255、255-257、257-259、259-261、261-263、263-265、265-267、
267-269、269-271、271-273、273-275、275-277、277-279、279-281、281-283、283-285、
285-287、287-289、289-291、291-293、293-295、295-297、297-299、299-301、301-303、
303-305、305-307、307-309、309-311、311-313、313-315、315-317、317-319、319-321、
321-323、323-325、325-327、327-329、329-331、331-333、333-335、335-337、337-339、
339-341、341-343、343-345、345-347、347-349、349-351、351-353、353-355、355-357、
357-359、359-361、361-363、363-365、365-367、367-369、369-371、371-373、373-375、
375-377、377-379、379-381、381-383、383-385、385-387、387-389、389-391、391-393、
393-395、395-397、397-401、401-403、403-405、405-407、407-409、409-411、411-413、
413-415、415-417、417-419、419-421、421-423、423-425、425-427、427-429、429-431、
431-433、433-435、435-437、437-439、439-441、441-443、443-445、445-447、447-449、
449-451、451-453、453-455、455-457、457-459、459-461、461-463、463-465、465-467、
467-469、469-471、471-473、473-475、475-477、477-479、479-481、481-483、483-485、
485-487、487-489、489-491、491-493、493-495、495-497、497-501)。
[0177] 用多重试验获得质谱分辨的设计方法可包括但不限于引物和寡核苷酸的设计方法及反应设计方法。参见,例如表X和Y中提供的多重方案。对于多重试验中的引物和寡
核苷酸设计,可将设计引物的同一通用指南应用于单重反应(uniplexed reaction),例如
避免假的引发和引物二聚体,单重反应仅涉及较多引物。对于质谱法应用,一次试验质谱图中的分析物峰足以与该多重试验中的任何试验的产物相分辨,包括间歇峰和任何其它副产
物峰。分析物峰还任选可落在用户指定的质量窗内,例如5,000-8,500Da范围内。在一些
实施方式中,例如,多重分析适合于用质谱法检测染色体异常。在某些实施方式中,多重分析适合于本文所述的各种单个核苷酸测序或纳米孔测序方法。可利用商品化生产的微型反
应室或装置或阵列或芯片促进多重分析,它们可商品化购得。
[0178] 检测胎儿非整倍性
[0179] 对于检测胎儿非整倍性,一些方法依赖于检测母体与父体遗传等位基因之间的比例。然而,母体提供的非细胞核酸损害了定量测定染色体改变的能力,从而需要先去除样品中的母体DNA再检测。有希望的方法利用胎儿DNA与母体DNA大小分布的不同,或检测胎
儿专门表达的RNA(参见,例如通过引用纳入本文的美国专利申请号11/384128,其公布号
为US20060252071)。假定胎儿DNA仅占母体血浆中所有非细胞DNA的约5%,在三体性样
品与健康对照之间该比例的差异从1.6%降低至仅约1.2%。因此,可靠地检测等位基因比
例的变化需要富集非细胞DNA中的胎儿组分,例如采用本发明的组合物和方法。
[0180] 一些方法依赖于检测母体与父体遗传等位基因之比例来检测母体血浆中的胎儿染色体非整倍性。二倍体产生1∶1比例,而三体检测为2∶1比例。由于统计学取样的
血浆样品中胎儿DNA丰度低、存在过量的母体DNA和检测技术的变异,从而损害了对这种差
异的检测。采用高精度检测方法,例如数字PCR或质谱法解决了后一问题。目前通过尺寸
排阻去除母体DNA或关注胎儿特异性核酸(例如胎儿表达的RNA)实现了富集样品中非细
胞DNA的胎儿组分。胎儿DNA的另一可区别性特征是其DNA甲基化模式。因此,本文提供
的新型组合物和方法可根据胎儿与母亲DNA之间的甲基化差异精确定量测定胎儿核酸。该
方法依赖于灵敏的绝对拷贝数分析来定量测定母体样品的胎儿核酸部分,从而能产前检测
出胎儿性状。本发明方法已鉴定到基因组中母体与胎儿DNA之间甲基化有差异的约3000
个富含CpG的区域。选出的区域在所有检测的样品中显示高度保守的甲基化差异。此外,
该组区域富含发育中至关重要的调控基因,表明这些区域的外遗传学调控是生物学相关的
恒定过程(参见表3)。现在利用我们的MBD-FC蛋白捕捉非细胞DNA(例如,基本上所有的
非细胞DNA)来富集胎儿DNA,然后用高盐浓度洗脱高度甲基化的DNA组分。采用低盐洗脱
组分,MBD-FC也同样能富集未甲基化的胎儿DNA。
[0181] 本发明提供了染色体13、18和21上经过证实的63个基因组区域,这些区域的母体甲基化水平低而胎儿甲基化水平高。捕捉这些区域后,可用SNP测定上述等位基因的比
例。当采用高频率SNP时,必须检测约10种标记以高可信度地发现至少一个SNP,其双亲具
有相反的纯合基因型,孩子具有杂合基因型。
[0182] 在另一实施方式中,提供检测染色体异常的方法采用定量测定绝对拷贝数。二倍体染色体组在所有染色体中显示相同数量拷贝的差异甲基化区域,但是,例如三体性21样
品显示染色体21上甲基化差异区域的拷贝数多1.5倍。采用未改变的常染色体作参比(本
文也提供了-见表1),可将二倍体染色体组的基因组DNA含量归一(标准)化。与其它方
法相当,用一种标记不大可能足以检测这种差异,因为总拷贝数低。妊娠10-12周时,1ml母体血浆中通常含有约100-200拷贝的胎儿DNA。然而,本发明方法提供了能高度可靠地区分
二倍体染色体组与非整倍性染色体组的富余可检测标记。
[0183] 数据处理和鉴定染色体异常存在与否
[0184] 本文所用的术语“检测”染色体异常,指通过处理数据来鉴定染色体失衡,所述数据得自扩增的核酸物质、核苷酸序列物质或以上产生的可检测产物(统称为“可检测产
物”)的检测组。可用任何合适的检测装置和方法区分一组或多组本文所述的可检测产物。
可将是否存在染色体异常的结果以任何合适形式表示,包括但不限于:与对象或样品存在
染色体异常相关的概率(例如,胜算比、p-值)、可能性、百分比、阈值以上的数值或危险系数。在某些实施方式中,可以提供结果与灵敏度、特异性、标准偏差、变异系数(CV)和/或置信水平中的一种或多种,或它们的组合。
[0185] 可根据一种或多种计算的变量,包括但不限于灵敏度、特异性、标准偏差、变异系数(CV)、阈值、置信水平、评分、概率和/或它们的组合鉴定的一组或多组可检测产物,来检测染色体异常。在一些实施方式中,部分或完全根据一种或多种此类计算的变量来确定:(i)用于诊断方法所选的组数,和/或(ii)用于诊断方法所选各组的具体核苷酸序列种类。
[0186] 在某些实施方式中,将灵敏度、特异性和/或置信水平中的一个或多个表示为百分比。在一些实施方式中,各变量独立的百分比高于约90%(例如,约90、91、92、93、94、95、
96、97、98或99%,或高于99%(例如,约99.5%或更高、约99.9%或更高、约99.95%或更高、约99.99%或更高))。在一些实施方式中,变异系数(CV)表示为百分比,有时该百分比约为10%或更低(例如,约10、9、8、7、6、5、4、3、2或1%,或低于1%(例如,约0.5%或更低、约0.1%或更低、约0.05%或更低、约0.01%或更低))。在某些实施方式中,概率(例
如,某算法测定的并非随机的具体结果)表示为p-值,有时p-值约为0.05或更低(例如,
约0.05、0.04、0.03、0.02或0.01,或低于0.01(例如,约0.001或更低、约0.0001或更低、约0.00001或更低、约0.000001或更低))。
[0187] 例如,“评分”指计算对象/样品中特定染色体异常是否实际存在的概率。可利用评分值测定,例如,对应于实际染色体异常的扩增的可检测核酸产物的变异、差异或比例。例如,从可检测产物计算出正值时,可鉴定到与单样品分析特别相关的染色体异常。
[0188] 在某些实施方式中,模拟数据可能有助于数据处理,例如通过训练某算法或检验某算法。例如,模拟数据可能涉及血清、血浆等中胎儿和母体核酸浓度不同的各种假定样
品。模拟数据可根据实际人群中可能的预测到的数据,或根据模拟数据集被歪斜(skewed)
以检验某算法和/或指定正确的分类。本文也将模拟数据称为“虚拟”数据。可将样品中
胎儿/母体贡献模拟成数字表格或阵列(例如,对应于参比生物分子或扩增核酸序列切割
产物质量信号的峰列表),质谱图,凝胶上的条带模式,或检测质量分布任何技术的代表图。
大多数情况中用计算机程序进行模拟。利用模拟数据集的一个可能步骤是评估鉴定结果的
置信度,即,所选的阳性/阴性值与样品如何良好匹配和是否有其它变异。常用的方法是计算概率值(p-值),该值预测随机样品具有优于所选样品的评分的概率。由于某些情形可能
禁止计算p-值,可评估经验模型,其中假定至少一个样品匹配参比样品(具有或不具有分
辨的差异)。或者,可采用其它分布,例如泊松分布描述概率分布。
[0189] 在某些实施方式中,算法可给计算出的真阳性、正阴性、假阳性和假阴性值指定置信度值。也可根据确定的概率模型指定发生染色体异常的可能性。
[0190] 常采用技术(in silico)方法产生模拟数据。本文所用的术语“硅技术”指用计算机进行研究和实验。硅技术方法包括但不限于:分子建模研究、核型研究、遗传计算、生物分子对接实验和分子结构和/或过程,例如分子相互作用的虚拟表现。
[0191] 本文所用的“数据处理程序”指某一过程,其可体现为软件,测定所得数据(即,试验的最终结果)的生物学显著性。例如,数据处理程序可根据收集的数据测定各核苷酸序列种类的含量。数据处理程序还可根据测定的结果控制仪器和/或数据收集程序。常集成
数据处理程序和数据收集程序,并提供反馈以通过仪器操控数据获取,从而提供了本文的
基于试验的判断方法。
[0192] 本文所用的软件指用计算机执行时可实施计算机操作的计算机可读程序指令。提供的软件通常是含有记录在计算机可读介质上的程序指令的程序产品,所述介质包括但不
限于:磁性介质,包括软盘、硬盘和磁带;光学介质,包括CD-ROM盘、DVD盘、磁盘和记录程序指令的其它此类介。
[0193] 预测异常或正常的不同方法可产生不同类型的结果。对于任何给定的预测,结果类型可能有四种:真阳性、真阴性、假阳性或假阴性。本文所用的术语“真阳性”指对象正确诊断为染色体异常。本文所用的术语“假阳性”指对象错误鉴定为染色体异常。本文所用的术语“真阴性”指对象正确鉴定为无染色体异常。本文所用的术语“假阴性”指对象错误鉴定为无染色体异常。可根据以下比例计算出衡量任何给定方法性能的两种参数:(i)灵敏
度值(sensitivity value),正确鉴定为阳性的预测阳性百分数(例如,通过水平比较检测
/测定正确鉴定为表示染色体异常的核苷酸序列组相对于正确或错误鉴定的所有核苷酸
序列的百分数),从而反映检测染色体异常结果的精确度;和(ii)特异性值(specificity
value),正确鉴定为阴性的预测阴性百分数(例如,通过水平比较检测/测定正确鉴定为表
示染色体正常的核苷酸序列组相对于正确或错误鉴定的所有核苷酸序列的百分数),从而
反映检测染色体异常结果的精确度。
实施例
[0194] 仅通过说明的方式、而非限制的方式提供以下实施例。本领域技术人员不难了解,可改变或改进各种非关键参数而获得基本相同或相似的结果。
[0195] 在以下实施例1中,申请人联用捕捉甲基化DNA的新型融合蛋白与CpG岛阵列,来鉴定胎盘组织与母体血液之间甲基化有差异的基因组区域。采用严格的统计学方法只能选
出样品之间显示差异不大的区域,因而提示可能存在有潜在的生物学机制。验证了主要位
于染色体13、18和21上的85个甲基化有差异的基因组区域。此验证采用定量质谱方法查
询覆盖这些85个区域的261个PCR扩增子。结果有非常好的一致性(95%确认),证明该
方案可行。
[0196] 随后申请人提供检测非整倍性的改进方案,依赖于检测绝对拷贝数而非等位基因比例。
[0197] 实施例1
[0198] 在以下实施例中,用10对母体和胎盘DNA样品来鉴定甲基化差异区域。采用基于质谱法的定量测定甲基化试验验证这些结果。首先提取母体血沉棕黄层和相应胎盘组织的
基因组DNA。随后用MBD-FC捕捉各DNA样品的甲基化组分。参见图1-3。两种组织组分用
不同荧光染料标记后与Agilent CpG岛微阵列杂交。参见图4。进行该操作以鉴定可用
于产前诊断的甲基化差异区域。因此,采用以下两个标准来选择基因组区域作为潜在的富
集标记:观察到的甲基化差异必须存在于所有检验的配对样品中,和该区域的长度必须超
过200bp。
[0199] DNA制备和片段化
[0200] 分别用德国希尔顿Qiagen 的QIAamp DNA迷你试剂盒TM和QIAamp DNA血液迷TM
你试剂盒 制备母体血沉棕黄层和胎盘组织的基因组DNA(gDNA)。对于MCIp,用NanoDrop
TM
ND 1000 分光光度计(Thermo Fisher 沃尔瑟姆,马萨诸塞州,美国)定量测定gDNA。采
TM
用以下设置,用Branson数字超声仪450 (丹伯里,康涅狄格州,美国),在500μl TE缓冲
液中将2.5μg DNA超声处理成平均大小为300-500bp的片段:振幅20%、超声时间110秒、
脉冲开/脉冲关时间1.4/0.6秒。采用凝胶电泳监测片段范围。
[0201] 甲基-CpG的免疫沉淀
[0202] 将每份样品、56μg纯化的MBD-Fc蛋白和150μl A蛋白琼脂糖4速流珠(Amersham Biosciences 皮斯卡塔韦,新泽西州,美国)在15ml TBS中4℃摇动过夜。然后
将MBD-Fc珠(150微升/试验)转移分散在2mlUltrafree-CL离心过滤装置(Millipore
比尔里卡,马萨诸塞州,美国)中,用缓冲液A(20mM Tris-HCl,pH8.0,2mM MgCl2,0.5mM EDTA 300mM NaCl,0.1%NP-40)离心洗涤三次。将超声处理的DNA(2μg)加入2ml含经过
洗涤的MBD-Fc珠的缓冲液A中,4℃摇动3小时。离心珠回收未结合的DNA片段(300mM组
分),然后用NaCl浓度递增(400、500、550、600和1000mM)的600μl缓冲液洗涤各两次。
TM
将各洗涤步骤的流穿液收集在不同试管中,用MinElute PCR纯化试剂盒 (Qiagen )脱
TM
盐。用MinElute PCR纯化试剂盒 (Qiagen )平行处理200ng经过超声的输入DNA。
[0203] 微阵列操作和分析
[0204] 为产生荧光标记的DNA以供微阵列杂交,混合每份样品的600mM和1MNaCl组分TM
(富集的甲基化DNA),用BioPrime总基因组标记系统 (Invitrogen 卡尔斯巴德,加利福
尼亚州,美国),以Alexa Fluor555-aha-dCTP(母体)或Alexa Fluor 647-aha-dCTP(胎
盘)标记。按照生产商手册进行标记反应。混合匹配的母体/胎盘对的不同标记的基因组
DNA片段至终体积为80微升,添加50μg Cot-1 DNA(Invitrogen )、52μl Agilent10X
封闭试剂(Agilent Technologies 圣克拉拉,加利福尼亚州,美国)、78μl去离子甲酰胺
和260μl Agilent 2X杂交缓冲液。将样品加热至95℃,3分钟,混合,随后37℃温育30分
TM TM
钟。然后用Agilent SureHyb 室和Agilent杂交烘箱,在Agilent CpG岛微阵列试剂盒
上67℃杂交40小时。室温用洗涤液I(6X SSPE,0.005%N-月桂酰肌氨酸)洗涤载玻片5
分钟,37℃用洗涤液II(0.06X SSPE)再洗涤5分钟。然后将载玻片分别浸在乙腈和Agilent TM TM
Ozone保护溶液 中各30秒。用Agilent DNA微阵列扫描仪 立即扫描图像并分析。用
特质提取软件9.5版和标准CGH方案处理微阵列图像。
[0205] 亚硫酸氢盐处理
[0206] 用加利福尼亚州橙县ZR公司(ZymoResearch,Orange County,CA)的EZ-96DNA甲TM
基化试剂盒 进行基因组DNA亚硫酸氢钠转变。利用1微克基因组DNA,遵循生产商的方
案和备选的转变方案(两种DNA变性温度)。
[0207] 甲基化定量分析
[0208] 用塞昆纳姆股份有限公司(Sequenom)的MassARRAY 系统进行甲基化定量分析。该系统联用基质辅助激光解吸电离飞行时间(MALDI-TOF)质谱法与RNA碱基特异性
TM
切割(Sequenom MassCLEAVE )。然后分析甲基化状况的可检测模式。用Sequenom
TM
EpiDESIGNER (www.epidesigner.com)设计PCR引物。经验证总共采用261个扩增子,覆盖
85个靶区域(扩增长度中值=367bp,最小=108,最大=500;每个扩增子CpG的中值数=
23,最小=4,最大=65)。对于各反向引物,加入额外的T7启动子标签以供体内转录以及在正向引物上加入10聚体标签以调节解链温度差异。如前人所述(Ehrich M等.(2005)“通
过碱基特异性切割和质谱法进行DNA甲基化模式的定量高通量分析”(Quantitative
high-throughput analysis of DNA methylation patterns by base specific
cleavage and mass spectrometry).Proc Natl Acad Sci USA 102:15785-15790)进行
TM
MassCLEAVE(tm)生物化学试验。用MassARRAY Compact MALDI-TOF(Sequenom 圣迭戈)
TM
获得质谱图,用EpiTYPER 软件1.0版(Sequenom 圣迭戈)产生甲基化比例。
[0209] 统计学分析
[0210] 用R统计学软件包(www.r-project.org)进行所有统计学计算。首先根据探针的基因组位置将阵列探针分组。将相距小于1000bp的子序列探针分成一组。为鉴定甲基化
差异区域,用对照样品作参比。在对照样品中,血液衍生对照DNA的甲基化组分可自身杂
交。该样品理想地应显示两种颜色通道的对数比例约为0。然而,由于杂交行为的变异,探针显示平均对数比例为0.02,标准偏差为0.18。然后将我们样品中观察到的对数比例与对
照样品作比较。采用双向配对t-检验,检验相同各组的NULL假设。分析中排除含有少于
4个探针的各组。对于包含4或5个探针的各组,将所有探针用于成对t-检验。对于含6
或更多个探针的各组,采用一次含5个探针的滑动窗检验(sliding window test),每次增
减一个探针移动该窗口。将各测试样品与对照样品作比较,记录p-值。如果10份样品中
有8份显示p值<0.01,或者如果10份样品中有6份显示p值<0.001,所选出的基因组
区域是甲基化差异区域。当该组少于8份样品显示p值<0.01,或者少于6份样品显示p
值<0.001时,将该基因组区域分类为甲基化无差异区域。分析中排除不属于这二种类别
的样品。对于鉴定为甲基化差异的基因组区域子集,用定量甲基化分析证实其结果。
[0211] 采用在线Gostat工具(http://gostat.wehi.edu.au/cgibin/-goStat.pl)进行Go分析。用费希尔精确检验(Fisher’s exact test)计算P值。
[0212] 基于微阵列标记发现的结果
[0213] 为鉴定甲基化差异的区域,采用其中可自身杂交的单核细胞的甲基化DNA组分作为标准样品。该标准品为基因组区域中的荧光检测的变异性提供了参比品。然后通过比较
10份胎盘/母体样品各自的对数比例与该标准品,可鉴定出甲基化差异区域。因为本项研
究的目的是鉴定能可靠地分离母体与胎儿DNA的标记,分离目标限于在基因组DNA连续延
伸段上显示有稳定一致甲基化差异的基因。如此将分析集中在多个探针表明甲基化有差异
的基因组区域。这种选择也局限于所有样品显示甲基化有差异的目标区域,排除个体间差
异强的那些区域。微阵列分析中,两份样品均显示对数比例较低。由于为选择目标采用了
配对检验,这不会负面影响结果。
[0214] 根据这些选择标准,鉴定到母体与胎儿DNA之间甲基化有差异的3043个基因组区域。21778个区域不显示甲基化有差异。在甲基化有差异区域的分布中未观察到染色体间
偏向。甲基化差异区域位于2159个已知基因之后或其中。大多数甲基化差异区位于启动
子区域(18%)和编码区内(68%),而只有少数甲基化差异区位于基因的下游(7%)或启
动子转换为编码区的区域中(7%)。启动子(13%)和下游(5%)位置的甲基化无差异区
域显示相类似的分布,但位于启动子转换为编码区的区域百分数较高(39%),位于编码区
内的百分数较低(43%)。
[0215] 业已证明,胚胎干细胞(ES)富含的polycomb抑制性复合物2(PRC2)靶向的基因是调控发育的基因(Lee TI等,(2006)“在人胚胎干细胞中Polycomb是控制发育的调节
剂”(Control of developmental regulators by Polycomb in human embryonic stem
cells.)Cell 125:301-313)。也已证明许多癌症类型中,PRC2靶向的基因是富含甲基
化差异的基因(Ehrich M等,(2008)“癌细胞系的甲基化胞嘧啶的分布模式”(Cytosine
methylation profiling of cancer cell lines.)Proc NatlAcad Sci U S A 105:
4844-48)。在本项研究中,PRC2靶向的基因,也是富含鉴定为甲基化有差异的一组基因
(p-值<0.001,胜算比=3.6,胜算比的95%CI=3.1-4.2)。该组甲基化差异基因的GO
分析显示,该组显著富含发育期间功能至关重要的基因。10个最富含基因中6个的功能包
括调节发育或形态学过程[解剖学结构形态发生(GO:0009653,p值=0)、发育过程(GO:
0032502,p值=0)、多细胞机体发育(GO:0007275,p值=0)、器官发育(GO:0048513,p值=0)、系统发育(GO:0048731,p值=0)和解剖学结构发育(GO:0048856,p值=0)的基
因]。
[0216] 用Sequenom EpiTYPERTM验证
[0217] 为验证该微阵列的发现,选择染色体13、18和21的63个区域和其它常染色体的TM
26个区域,用不同技术验证。采用Sequenom EpiTYPER 技术定量检测母体与胎盘样品的
TM
甲基化DNA。EpiTYPER 方法的解释可参见Ehrich M,Nelson MR,Stanssens P,Zabeau
M,Liloglou T,Xinarianos G,Cantor CR,Field JK,van den Boom D(2005)“通过碱基特异性切割和质谱法定量高通量分析DNA甲基化模式”(Quantitative high-throughput
analysis of DNA methylation patterns by base specific cleavage and mass
spectrometry).Proc Natl Acad Sci U S A 102:15785-15790)。计算出所有母亲DNA样
品和所有胎盘样品靶区域中各CpG位点的甲基化平均值。然后将母亲与胎盘甲基化的平均
差异与微阵列的结果作比较。两种技术所得结果非常一致(参见图7)。85个靶区域定量
测定的结果确认了微阵列的结果(95%确认率)。未能确认均位于染色体18上的4个靶区
域的结果。该偏差的原因尚未知。
[0218] 与微阵列集中关注鉴定甲基化差异相反,定量检测DNA甲基化能分析绝对甲基化值。在85个确认甲基化有差异区域的验证组中,母体DNA样品中26区域的亚组和胎盘样
品中59区域的亚组甲基化程度较高(参见,表1)。令人感兴趣的是,胎盘样品中低甲基化
的基因倾向显示甲基化差异大于胎盘样品中高甲基化的基因(低甲基化基因的甲基化差
异中值=39%,高甲基化基因=20%)。
[0219] 实施例2
[0220] 实施例2描述了检测母体样品中胎儿核酸含量的非侵入性方法(本文称为“胎儿定量方法”),该方法可用于检测或确认胎儿性状(例如,胎儿性别的RhD相容性)或诊断染
色体异常,例如三体性21(本文将二者均称为“基于甲基化的胎儿诊断方法”)。图10显示
该胎儿定量方法的一个实施方式,图11显示基于甲基化的胎儿诊断方法的一个实施方式。
两种方法均采用从母体样品获得的胎儿DNA。这种样品包含甲基化差异的母体核酸和胎儿
核酸。例如,该样品可以是母体血浆或血清。胎儿DNA占母体血浆中总DNA的约2-30%。
样品总核酸中胎儿核酸的实际含量随妊娠不同而不同,可能根据许多因素而改变,包括但
不限于:孕龄、母亲的健康状况和胎儿的健康状况。
[0221] 如本文所述,分析母体血浆中胎儿DNA的技术难点在于需要能区分胎儿DNA与共同存在的背景母体DNA。本发明方法利用这种差异,例如胎儿与母体DNA之间观察到的甲
基化差异作为富集母亲样品中百分比较低的胎儿DNA的手段。相比于产前诊断的传统方
法,例如羊膜穿刺、长期绒毛取样和脐穿刺与小但有限的胎儿损失风险相关,该方法的非侵入性特征是主要优势。由于该方法不依赖处于任何特定细胞分裂时相的胎儿细胞,该方法
还提供了测定是否存在染色体异常及其性质的快速检测手段。此外,该方法不依赖于性别
(即,不需要存在Y-染色体)和不依赖于多态性(即,不测定等位基因比例)。因此,本发明
的组合物和方法代表了精确测定母体样品中胎儿核酸含量的改进的通用、非侵入性方法。
[0222] 试验设计和优点
[0223] 本领域需要精确检测和定量测定从母体样品非侵入性分离的胎儿DNA。本发明利用了母体血浆或血清中存在的循环性非细胞性胎儿核酸(ccfDNA)。为了商品化和临床实
施,本发明方法应只消耗一小部分有限可用胎儿DNA。例如,少于样品的50%、40%、30%、
25%、20%、15%、10%、5%或更少。此外,该方法宜开发成包括一种或多种(最好全部)以下试验的多重试验形式:
[0224] ·检测样品中存在的基因组等价物总含量的试验,即,识别母体和胎儿DNA种类的试验;
[0225] ·检测男性胎儿妊娠分离的胎儿DNA,即染色体Y的特异性序列的试验;
[0226] ·鉴定胎儿与母亲之间DNA甲基化差异区域的特异性试验;或
[0227] ·已知在待研究的所有组织中低甲基化区域的特异性试验,其可用作限制性(内切酶)效率(restriction efficiency)的对照。
[0228] 该试验的其它特征可包括以下一种或多种:
[0229] ·对于各试验,包括与靶序列相同或基本上相同的靶特异性竞争寡核苷酸,除了该竞争寡核苷酸的可区分特征外,例如相比于靶序列有一个或多个核苷酸不同。当加入PCR反应时,该寡核苷酸与靶序列共同扩增,获得这两个PCR扩增子之间的比例,可表明母体样品中靶特异性DNA序列(例如,特定基因座的胎儿DNA)的数目。
[0230] ·扩增子长度最好相似,以避免偏向扩增较短的片段。然而,只要扩增效率大致相等,可采用不同长度。
[0231] ·可从表1或已知在母亲与胎儿之间甲基化有差异的任何其它靶区域选择甲基化差异靶区域。这些靶区域在分离自非妊娠妇女的DNA中可以是低甲基化的,而在获自胎儿
样品中是高甲基化的。这些试验将用作限制性(内切酶)效率的对照。
[0232] ·可利用不同试验获得的结果定量测定以下一种或多种:
[0233] 。样品中存在的可扩增基因组总数(基因组等价物的总量);
[0234] 。可扩增基因组中的胎儿百分数(胎儿浓度或百分比);或
[0235] 。胎儿衍生DNA序列之间(例如,胎儿染色体21和参比染色体,如染色体3之间)的拷贝数差异。
[0236] 检验所用试验的例子
[0237] 以下是用于实施本发明方法的反应步骤概述,例如图10提供的。此概述不应限制本发明的范围。相反它提供了本发明采用Sequenom MassARRAY 技术的一个实施方式。
[0238] 1)从血浆样品分离DNA。
[0239] 2)用甲基化敏感的限制性内切酶(例如,HhaI和HpaII)消化靶DNA序列。
[0240] 将各反应获得的DNA与水混合至终体积25ul。
[0241] 加入10单位HhaI、10单位HpaII和反应缓冲液构成的10ul反应混合物。在限制性内切酶的最佳温度下培育样品。HhaI和HpaII消化未甲基化的DNA(不消化半甲基化或
完全甲基化的DNA)。消化后,用加热步骤使酶变性。
[0242] 3)加入PCR试剂(缓冲液、dNTP、引物和聚合酶)在50ul的总体积中进行基因组-PCR扩增。示范性的PCR和引物延伸如下所示。此外,加入已知浓度的合成竞争寡核苷
酸。
[0243] 4)多份检测(任选的)-PCR后,将50ul反应液分成5ul多份进行平行反应(复制品)以最大程度减小该检验后续PCR步骤期间引入的变异。后PCR步骤包括SAP、引
物延伸(MassEXTEND 技术)、树脂处理、分配到光谱芯片(spectrochip)和质量阵列
(MassARRAY)。
[0244] 5)定量测定可扩增的基因组-用Sequenom MassARRAY 技术测定各试验扩增产物的量。PCR后,用单碱基延伸试验查询扩增区域(包括在步骤3中引入竞争寡核苷酸)。
加入设计的能与毗邻感兴趣位点直接杂交的特定延伸引物。延伸引物如下所示。这些DNA
寡核苷酸称为iPLEX MassEXTEND 引物。在延伸反应中,iPLEX引物与互补DNA模板杂
交,用DNA聚合酶延伸。含有脱氧和二脱氧核苷酸三磷酸连同酶和缓冲液不同组合的专用
终止混合物直接抑制了iPLEX引物的延伸。引物延伸直到掺入互补二脱氧核苷酸。
[0245] 延伸反应产生了各具有独特分子量的不同长度的引物产物。因此,可用MassARRAY 分析仪器包进行基质辅助的激光解吸/电离飞行时间(MALDI-TOF)质谱法同
时分离和检测引物延伸产物。该分离和检测后,用塞昆纳姆股份有限公司的软件自动分析
数据。
[0246] 6)计算胎儿核酸含量和浓度-根据甲基化差异的靶序列计算出样品中基因组等价物的总量、从男性妊娠胎儿分离的胎儿核酸含量(和浓度)和胎儿核酸含量(和浓度)
的方法见下图18和19。
[0247] 可用以上方法进行一种或多种下述试验。除了紧接下文提供的序列外,下表X提供了查询多种(靶序列)的多重方案。
[0248] 1)定量测定样品中可扩增基因组等价物总数目的试验
[0249] 在持家基因中选择不位于染色体13、18、21、X或Y上的靶序列。这种靶序列应位于单拷贝基因中,不含有甲基化敏感的限制性内切酶的任何识别位点。
[0250] 下划线所示序列是PCR引物位点,斜体字是单碱基延伸引物的位点,黑体字母(C)是在人DNA上延伸的核苷酸。
[0251] ApoE染色体19:45409835-45409922 DNA靶序列,查询的核苷酸C是黑体字。本节中提供的所有染色体位置来自2009年2月UCSC构造的基因组(Genome Build)。
[0252] GATTGACAGTTTCTCCTTCCCCAGACTGGCCAATCACAGTGTGGGCTGCGTTGCTGGTCACATTCCTGGC
[0253] ApoE正向引物:5’-ACGTTGGATG-TTGACAGTTTCTCCTTCCCC(引物含有破折号分开的5’10bp质量标签)。
[0254] ApoE反向引物:5’-ACGTTGGATG-GAATGTGACCAGCAACGCAG(引物含有破折号分开的5’10bp质量标签)
[0255] ApoE延伸引物:5’-GCAGGAAGATGAAGGTT[C/T]引物延伸的C在人DNA靶序列上,T在合成的DNA靶序列上。
[0256] ApoE合成的竞争寡核苷酸:5’-GATTGACAGTTTCTCCTTCCCCAGACTGGCCAATCACAGGCAGGAAGATGAAGGTT TGTGGGCTGCGTTGCTGGTCACATTCCTGGC(57位黑体字T不同于人DNA)
[0257] 2)定量测定样品中染色体Y序列总数目的试验
[0258] 选择Y-染色体的特异性靶序列,其包含基因组它处的相似序列或平行进化同源序列。靶序列优选位于单拷贝基因中,不含有甲基化敏感的限制性内切酶的任何识别位点。
[0259] 下划线所示序列是PCR引物位点,斜体核苷酸是单碱基延伸引物的位点,黑体字母(C)是在人DNA上延伸的核苷酸。
[0260] 染色体Y上的SRY:2655628-2655717(反向互补)
[0261] GAGTTTTGGATAGTAAAATAAGTTTCGAACTCTGGCACC TCCTTGTTTTTGACAATGCAATCATATGCTTC
[0262] SRY正向引物:5’-ACG-TGGATAGTAAAATAAGTTTCGAACTCTG(引物含有破折号分开的5’3bp质量标签)
[0263] SRY反向引物:5’-GAAGCATATGATTGCATTGTCAAAAAC
[0264] SRY延伸引物:5’-aTTTCAATTTTGTCGCACT[C/T]引物延伸的C在人DNA靶序列上,T在合成的DNA靶序列上。5’小写“a”是非互补核苷酸。
[0265] SRY合成的竞争寡核苷酸:5’-GAGTTTTGGATAGTAAAATAAGTTTCGAACTCTGGCACCTTTCAATTTTGTCGCACT TCCTTGTTTTTGACAATGCAATCATATGCTTC
[0266] 3)定量测定样品中胎儿甲基化DNA序列的试验。
[0267] 在已知的母亲与胎儿DNA之间甲基化有差异的区域中选择靶序列。选择的序列含有甲基化敏感酶的几个限制性位点。本研究采用HhaI(GCGC)和HpaII(CCGG)酶。
[0268] 下划线所示序列是PCR引物位点,斜体字是单碱基延伸引物的位点,黑体字母(C)是在人DNA上延伸的核苷酸,小写字母是甲基化敏感的限制性内切酶的识别位点。
[0269] 染色体12上的TBX3:115124905-115125001
[0270] GAACTCCTCTTTGTCTCTGCGTGCccggcgcgcCC CCACTCTGgcgccggCCATgcgcTGGGTGATTAATTTGCGA
[0271] TBX3正向引物:5’-ACGTTGGATG-TCTTTGTCTCTGCGTGCCC(引物含有破折号分开的5’10bp质量标签)
[0272] TBX3反向引物:5’-ACGTTGGATG-TTAATCACCCAGCGCATGGC(引物含有破折号分开的5’10bp质量标签)
[0273] TBX3延伸引物:5’-CCCCTCCCGGTGGGTGATAAA[C/T]引物延伸的C在人DNA靶序列上,T在合成的DNA靶序列上。5’小写“a”是非互补核苷酸。
[0274] TBX3合成竞争寡核苷酸:5’-GAACTCCTCTTTGTCTCTGCGTGCCCGGCGCGCCCCCCTCCCGGTGGGTGATAAA CCACTCTGGCGCCGGCCATGCGCTGGGTGATTAATTTGCGA
[0275] 4)限制性酶效率的对照试验
[0276] 在已知的任何被研究组织的未甲基化区域中选择靶序列。选择的序列不含所用各限制性酶一个以上的位点。
[0277] 下划线所示序列是PCR引物位点,斜体核苷酸代表单碱基延伸引物的位点,黑体字母(G)是在人DNA上延伸的反向核苷酸,小写母是甲基化敏感的限制性内切酶的识别位
点。
[0278] CACNA1G染色体17:48637892-48637977(反向互补)
[0279] CCATTGGCCGTCCGCCGTGGCAGTGCGGGCGGGAgcgcAGCCGATTCCCACCCCAAAACCCAGGA
[0280] HhaI正向引物:5’-ACGTTGGATG-CCATTGGCCGTCCGCCGTG(引物含有破折号分开的5’10bp质量标签)
[0281] HhaI反向引物:5’-ACGTTGGATG-TCCTGGGTTTTGGGGTGGGAA(引物含有破折号分开的5’10bp质量标签)
[0282] HhaI延伸引物:5’-TTCCAGCTGTGGTTCTCTC
[0283] HhaI合成的竞争寡核苷酸:5’-CCATTGGCCGTCCGCCGTGGCAGTGCGGGCGGGAGCGCAG CCGATTCCCACCCCAAAACCCAGGA
[0284] 验证实验
[0285] 用模型系统和临床样品检验本发明的灵敏度和精确性。对不同样品进行多重试验,包括2种定量测定总拷贝数的试验、3种定量测定甲基化的试验、1种染色体Y的特异性
试验和1种消化对照试验。参见表X1和X2。另一种多重方案和附加试验见表Y1和Y2。
[0286]
[0287]
[0288] 利用基因组DNA的模型系统
[0289] 为测定所述方法测定样品中可扩增基因组拷贝总数时的灵敏度和精确性,检测了分离自非妊娠妇女血液的一个亚组的不同DNA样品。稀释各样品使之在反应中各含约
2500、1250、625或313个拷贝。通过取3次总拷贝数试验所得DNA/竞争物的平均比例,获
得可扩增基因组拷贝总数。4个不同样品的结果示于图12。
[0290] 为优化反应,开发了模拟血浆分离DNA样品的模型系统。这些样品含有恒定量的母体未甲基化DNA,掺入不同含量的男性胎盘甲基化DNA。相对于母体未甲基化DNA,样品
的掺加量为约0-25%。结果示于图13A和B。用甲基化试验(图13A)、SRY标记(图13B)
和总拷贝数试验获得的比例计算出胎盘DNA的百分数。甲基化试验(TBX)、Y-染色体试验
(SRY)和总拷贝数(APOE)的引物序列已在上面提供。该模型系统证明实施的甲基化方法
与Y-染色体方法(SRY标记)等效,因而证实该甲基化方法是不依赖于性别的胎儿定量测
定方法。
[0291] 血浆样品
[0292] 为研究所述方法对临床样品的灵敏度和精确性,采用表X所示多重方案研究了从怀有男性胎儿的妇女获得的33份血浆样品。为符合仅利用总样品的一部分这一关键要求,
各反应只用从4ml提取物获得DNA的四分之一。
[0293] 总拷贝数定量测定
[0294] 总拷贝数定量测定的结果见图14A和14B。图14A显示了各样品的拷贝数。两份样品(25和26号)的总拷贝数显著高于所有其它样品。总体上每毫升血浆平均得到约1300
个可扩增拷贝(范围766-2055个)。图14B显示给定值的箱线图,总结了结果。
[0295] 从甲基化标记和Y-染色体标记所得结果之间的相关性
[0296] 图15A和B是绘制的各样品胎儿的拷贝数。所有样品来自男性胎儿妊娠。利用甲基化或Y-染色体特异性标记计算出所得拷贝数。如图15B所示,给定值的箱线图表明两种
不同检测值之间的差异很小。
[0297] 显示甲基化标记与Y-染色体标记(SRY)所得结果之间相关性的结果见图16。实施的甲基化方法仍与Y-染色体方法(SRY标记)等效,进一步证实该甲基化方法是不依赖
于性别和不依赖于多态性的胎儿定量测定方法。采用表X所示多重试验测定胎儿核酸含
量。
[0298] 最后,利用消化的对照与竞争物的比例,将其值与平均总拷贝数试验作比较,测定消化效率。见图17。除样品26外,所有反应表明效率高于99%。
[0299] 数据分析
[0300] 利用4型(塞昆纳姆股份有限公司软件产品)进行质谱分析。测定各DNA分析物和竞争物试验的峰高(信噪比),并输出作进一步分析。
[0301] 将特定DNA峰高除以特定竞争物峰高得到比例,计算出各扩增子的分子总数。(图18和19中的“DNA”峰可视作给定试验的分析物峰)。由于已知加入反应中的竞争物分子
数,可将该比例乘以加入的竞争物分子数确定DNA分子总数。
[0302] 利用男性胎儿妊娠的Y-染色体特异性标记和所有妊娠的甲基化百分数平均值计算出各样品中的胎儿DNA百分数(或浓度)。简言之,对于染色体Y,将分析物(DNA)峰高
除以竞争物峰高获得该比例,再将该比例乘以加入反应的竞争物分子数。将该值除以从可
扩增基因组等价物测定总数(采用总含量试验)获得的类似比例。见图18。由于样品中的
核酸总量是母亲和胎儿核酸之和,可将胎儿组分视作较大背景母体组分的百分数。因此,将其代入图18所示方程式,样品中总核酸的胎儿百分数(k)等于方程式:k=2xR/(1-2R),R
是Y-染色体含量与总量之比例。由于Y-染色体是单倍体,采用二倍体靶序列测定总量的
试验,该计算限于胎儿组分低于母体组分50%的样品。
[0303] 图19显示利用甲基化特异性标记(参见甲基化定量测定试验)类似计算出胎儿浓度。与Y-染色体特异性标记相反,这些标记来自二倍体靶序列,因此,可以忽略Y-染色
体特异性试验所述的局限性。如此,可用方程式:k=R(1-R)测定胎儿百分数(k),其中R
是甲基化试验与总试验之间的比例。
[0304] 模拟
[0305] 进行一级简单功率计算(first simple power calculation),假设检测系统采用染色体21的20种标记和一个或多个其它常染色体的20种标记。用100个拷贝的胎儿DNA
开始检测,25拷贝检测到的标准偏差和I型误差的概率低于0.001,发现本发明方法能区分
所有病例99.5%的二倍体与三倍体染色体。例如,可用质谱法(采用竞争性PCR方法的系
统)实施此类方法进行绝对拷贝数检测。该方法可在一次反应中运行20个试验,显示重复
检测的标准偏差约为3-5%。该方法可与区分甲基化与未甲基化核酸的已知方法联用,例如利用甲基结合试剂分离核酸或利用甲基化敏感的酶消化母体核酸。图8显示在过量未甲基
化DNA存在下,用MBD-FC蛋白(甲基结合试剂)捕捉从而分离甲基化DNA的效率(参见图
8)。
[0306] 进行二级统计学功率分析(second statistical power analysis)以评估本文所述甲基化胎儿诊断方法实施方式的预测能力。设计的这种模拟证明可能区分21号染色体
三体特异性标记组与参比标记组(例如,不包括21号染色体的常染色体)。许多参数影响
到能否可靠地区分两群标记。对于目前的模拟,根据实验为各参数选择最可能发生的数值。
采用了以下参数和代表性数值:
[0307] 拷贝数
[0308] 母体拷贝数=2000
[0309] 除21、X和Y以外的染色体的胎儿拷贝数=200
[0310] 21号染色体整倍体胎儿的胎儿拷贝数=200
[0311] 21号染色体非整倍体T21胎儿的胎儿拷贝数=300
[0312] 胎儿DNA百分数(甲基化富集前)=10%(见上文)
[0313] 甲基化频率
[0314] 母体DNA靶区域的平均甲基化百分数=10%
[0315] 胎儿DNA靶区域的平均甲基化百分数=80%
[0316] 未甲基化和未消化的母体DNA的平均百分数(即,限制性(内切酶)效率等的函数)=5%
[0317] 靶向21号染色体的实验数=10
[0318] 靶向21、X和Y以外染色体的实验数=10
[0319] 结果见图20。显示了x-轴变异系数(CV)与用简单t-检验区分试验群能力(y-轴)之间的关系。数据表明,在所有病例的99%中,能够区分两种人群(整倍体和非整
倍体),显著性水平为0.001,CV为5%或更低。依据该模拟,所述方法代表了产前检测胎儿非整倍性的强有力非侵入性诊断方法,该方法不依赖于性别,对所有种族都起作用(即,无等位基因偏向)。
[0320]
[0321]
[0322]
[0323]
[0324]
[0325]
[0326]
[0327]
[0328]
[0329]
[0330]
[0331] 表3
[0332]
[0333]
[0334]
[0335]
[0336]
[0337]
[0338]
[0339]
[0340]
[0341]
[0342]
[0343]
[0344]
[0345]
[0346]
[0347]
[0348]
[0349]
[0350]
[0351]
[0352]
[0353]
[0354]
[0355]
[0356]
[0357]
[0358] 本文引用的各专利、专利申请、出版物和文件的全部内容都通过引用纳入本文。上述专利、专利申请、出版物和文件的引用并非承认上述任何内容与现有技术相关,也并不表示承认这些出版物或文件的内容或日期。
[0359] 在不背离本发明基本方面的情况下,可对上述内容进行改变。虽然已参考一个或多个具体实施方式基本上详细地描述了本发明,但是本领域普通技术人员将明白到可对本
申请中具体揭示的实施方式作出改变,只要这些改变和改进在本发明的范围和构思内。
[0360] 本文适当描述的本发明可以在无本文中具体揭示的任何元素存在下实施。因此,例如,在本文的各个例子中,术语“包含”、“基本由……组成”和“由……组成”中的任何一个都可以用其它两个中的任何一个代替。所用术语和表达是用作说明而非限制性的术语,这
些术语和表达的使用并不排除所显示和所描述的特征或其各部分的任何等同特征,以及在
要求专利权的本发明范围内可能有各种改变。术语“一个”或“一种”指一种或多种其所修饰的元素(例如“一种试剂”可表示一个或多个试剂),除非上下文明确描述了一种元素或
一种以上元素。文中所使用的术语“约”表示在基础参数10%范围内的数值(即±10%),
在一列值的开头处用术语“约”修饰每个值(即,“约1、2和3”指约1,约2和约3)。例如,“约100克”重量包括90克到110克之间的重量。此外,当本文描述数值清单之时(例如,约
50%、60%、70%、80%、85%或86%),该清单包括其所有的中间和百分数值(例如54%、
85.4%)。因此,应理解尽管本发明通过代表性实施方式和任选的特征进行了具体描述,但是本领域技术人员能够想出对本文所揭示概念的改进和改变,这些改进和改变应认为落在
本发明的范围内。
[0361] 在所附权利要求书中列出了本发明的某些实施方式。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈