一种高通量基因组甲基化DNA富集方法及其所使用标签和标签接头专利检索- 组合化学专利检索查询-专利查询网

一种高通量基因组甲基化DNA富集方法及其所使用标签和标签接头
申请号	CN201010299246.5	申请日	2010-09-21	公开(公告)号	CN102409042A	公开(公告)日	2012-04-11
申请人	深圳华大基因科技有限公司; 深圳华大基因研究院;			发明人	孙继华; 王君文; 罗慧娟; 闫淑静; 章文蔚;
摘要	本发明提供一种可以进行大规模MeDIP-seq文库构建和同时多样本混合高通量测序的技术。本发明提供的方法对获得的多个样本的混合文库可以同时进行高通量测序，对测序获得的数据通过各自标签(也称为Index)序列进行区分从而分别进行高通量分析。
权利要求	1.一组标签，所述标签包括或由如下组成：选自表1中标签的至少5个，或至少10个，或至少15个，或全部20个，所述标签优选地至少包括表1所示的20个标签的DNA index-1-DNA index-5，或DNA index-6-DNA index-10，或DNA index-11-DNA index-15，或DNA index-16-DNA index-20，或者他们任何两个或多个的组合。 2.权利要求1所述的标签用于构建MeDIP-seq文库的用途。 3.通过权利要求1所述的标签构建的MeDIP-seq文库。 4.含有权利要求1所述的标签的一组标签接头，其中标签接头包含权利要求1所述的标签，并且优选地同时用作5’和3’接头，所述一组所述标签接头包括或由如下组成：选自表1中标签接头的至少5个，或至少10个，或至少15个，或全部20个；所述标签接头优选地至少包括表1所示的20个标签接头中的DNAindex-1F/R_adapter-DNA index-5F/R_adapter，或 DNAindex-6F/R_adapter-DNA index-10F/R_adapter，或 DNAindex-11F/R_adapter-DNA index-15F/R_adapter，或DNAindex-16F/R_adapter-DNA index-20F/R_adapter，或者他们任何两个或多个的组合。 5.权利要求4所述的标签接头用于构建MeDIP-seq文库的用途，优选地所述标签接头同时用作MeDIP-seq文库的5’和3’接头。 6.通过权利要求4或5所述的标签接头构建的MeDIP-seq文库。 7.一种MeDIP-seq文库构建的方法，所述方法包括：步骤一样品DNA片段化起始目的研究材料可以为任意物种，包括各种植物、动物、微生物，例如人，植物，昆虫，特别是哺乳动物包括人、小鼠的基因组DNA，片段化的方法包括雾化、超声片段化、HydroShear或酶切处理，从而将基因组DNA打断为大小优选为200-400bp的片段；其中片段化方法中优选地采用超声片段化法；步骤二DNA片段末端修复及3’端连接“A”碱基打断后的片段化DNA在包括但不限于T4DNA聚合酶、Klenow片段和T4多聚核苷酸激酶等酶的作用下，进行末端修复，形成平末端的DNA随机片段，然后在包括但不限于Klenow(3’-5’exo-)酶的作用下，在平末端化的DNA随机片段的3’末端连接“A”碱基；步骤三标签接头的连接及定量在包括但不限于T4 DNA连接酶的作用下，将末端连接“A”碱基的DNA随机片段末端连接不同的标签接头，优选地所述DNA随机片段5’和3’端同时连接所述标签接头；然后对连接产物采用包括但不限于实时定量PCR进行浓度检测，确定各个样品的有效浓度；步骤四样品混合，定量及免疫反应取含等量的连接有不同标签接头的连接产物，进行等量混合，总量控制在1-3μg，优选 1.5-2μg；混合后的样品中优选地加入外源的甲基化的阳性对照和未甲基化的阴性对照作为对照确定捕获效率；然后混合样品进行高温或NaOH变性后加入甲基化特异结合抗体，优选地是5mc抗体进行免疫反应(IP)；步骤五PCR扩增和文库大小选择对IP捕获纯化后的DNA进行优选的8-10个循环的低循环PCR扩增，扩增后产物即MeDIP-seq多样品混合测序文库，对所述PCR扩增产物优选地采用2％琼脂糖凝胶电泳进行切胶回收选择片段大小；将目的条带切下纯化后，即为待测序的MeDIP-seq文库；PCR扩增优选地使用热启动taq酶。 8.权利要求7所述的方法，所述方法在步骤五之前还进一步包括如下步骤：捕获DNA进行Q-PCR检测免疫反应(IP)捕获后的DNA纯化后进行Q-PCR检测富集效率，根据原混合样品和捕获DNA的Ct值检测抗体对甲基化DNA捕获效率。 9.权利要求7或8所述的方法，其中所述标签接头是权利要求4所述的标签接头。 10.通过权利要求7或8所述的方法构建的MeDIP-seq文库。 11.权利要求10所述的MeDIP-seq文库用于同时多样本混合高通量测序的用途，其中包括：使用所述测序文库进行高通量测序，所述测序可通过任何测序方法进行，包括但不限于双脱氧链终止法，优选高通量测序方法包括但不限于第二代测序技术或者是单分子测序技术。 12.权利要求11所述的用途，其中所述第二代测序技术包括但不限于SOLEXA、SOLID和 454测序技术；所述单分子测序技术包括但不限于True Single Molecule DNA sequencing技术，the singlemolecule，real-time(SMRT.TM.)技术，以及纳米孔测序技术。
说明书全文	一种高通量基因组甲基化DNA富集方法及其所使用标签和标签接头技术领域 [0001] 本发明涉及高通量基因组甲基化DNA富集技术领域。另外，本发明还涉及标签技术，以及实现多个样品在同一反应体系中进行构建标签文库，特别是MeDIP-seq文库的方法。本发明的方法特别适用于第二代测序技术，尤其是solexa测序技术。背景技术 [0002] 目前，基因组DNA甲基化是表观遗传学研究领域最为热点的方向之一，也正逐渐成为哺乳动物发育和癌症等多种疾病的表观遗传学标记。DNA甲基化不仅对染色质结构修饰，基因组稳定性具有重要作用，而且在真核生物中，DNA甲基化参与多种生物学过程，如胚胎发育，基因组印记，X染色体失活，基因表达的调节与沉默，逆转录转座子的沉默以及哺乳[1-2]动物肿瘤等多种疾病的发生。DNA甲基化生物标记不仅为多种疾病的早期诊断，而且对高危险个体的检测和评估提供了有利的工具。 [0003] BS-seq(重亚硫酸盐处理测序)，MeDIP-seq(抗体甲基化DNA免疫富集测序)，MBD-seq(甲基化特异结合蛋白富集甲基化DNA测序和RRBS(全基因组代表性甲基化测序)等是目前研究基因组甲基化较为流行的测序方法，但是它们不同程度上受到成本、通量和[3-5]分辨率的限制。BS-seq是CpG甲基化分析最常用的方法，可以提供单碱基分辨率的甲基化信息，但需要全基因组经重亚硫酸盐(bisulfite)处理之后结合测序研究，因此数据[5-6] 量庞大，测序及分析成本高。MeDIP-seq、MBD-seq和RRBS分别在不同程度上选择性的减少了测序的样本量。RRBS只能覆盖基因组约10-20％的区域，且主要是基因组的CpG岛[7-8] 和小部分启动子区域，很难在整体水平反应基因组甲基化特征。MBD-seq和MeDIP-seq分别利用甲基化特异结合蛋白(MBD2)和甲基化特异结合抗体(5mc抗体)与甲基化DNA结合起到富集的作用。MBD-seq主要富集高CpG区域的高甲基化DNA。MeDIP-seq主要富集高甲基化，适度CpG密度的区域。已知的BS-seq结果显示，大部分高甲基化的调节区域为较[3] 低的CpG密度，因此，MeDIP-seq更适合这种特征的分析。此外，5mC抗体不具有CpG位点[3] 的特异性，因此对非CpG位点的胞嘧啶甲基化特征的分析具有重要的意义。 [0004] 目前，已有MeDIP-seq技术主要缺陷是操作步骤繁琐不易对大规模样本进行研究。现有方法都是将单个样品单独进行免疫反应然后对富集得到的DNA结合高通量测序研究，这种方法使得对大样本量处理时在时间、人力和资金上的花费极其巨大，可行性大打折扣。发明内容 [0005] 本发明在已有基于高通量测序的MeDIP-seq技术的基础上创新性的开发了一种可以进行大规模MeDIP-seq文库构建和同时多样本混合高通量测序的技术。与已有方法比较主要优点是：可以将多个样本混合后同时进行DNA与抗体免疫反应(IP反应)。对获得的多个样本的混合文库可以同时进行高通量测序，对测序获得的数据通过各自标签(也称为Index)序列进行区分从而分别进行高通量分析。该发明方法大大节省了样本准备时间及试剂用量，使得高效、低成本的MeDIP-seq样品准备成为现实，使得大样本量的临床样本的MeDIP-seq群体研究成为可能。 [0006] 在本发明一个方面，提供了大规模的甲基化MeDIP-seq文库构建和同时多样本混合高通量测序的方法，所述方法包括： [0007] 步骤一样品DNA片段化 [0008] 起始目的研究材料可以为任意物种的基因组DNA，片段化常用的方法包括雾化、超声片段化、HydroShear或酶切处理，将基因组DNA 打断为大小200-400bp的片段。上述众多常用方法中优选地采用超声片段化法。 [0009] 步骤二DNA片段末端修复及3’连接“A”碱基 [0010] 打断后的片段化DNA在T4DNA聚合酶、Klenow片段和T4多聚核苷酸激酶等酶的作用下，进行末端修复，形成平末端的DNA随机片段，然后在Klenow(3’-5’exo-)酶的作用下，在平末端化的DNA的3’末端连接“A”碱基。 [0011] 步骤三标签接头(也称为Index adapter)的连接及实时定量PCR(也称为Q-PCR)定量 [0012] 在T4DNA连接酶的作用下，将末端连接“A”碱基的DNA在末端分别连接上不同的标签接头(表1)。连接产物采用实时定量PCR(Q-PCR)进行浓度检测，确定各个样品的有效浓度。所述实时定量PCR是本领域技术人员已知的方法。 [0013] 步骤四样品混合，定量及免疫反应 [0014] 取含等量的连接有标签接头的DNA产物(样品个数可根据实验确定)，进行等量混合，最终总量控制在1.5-2μg。如果3种样品混合，则每种样品所取的量为含有约为0.5μg的基因组DNA的量，如果6种样品混合，则每种样品所取的量为含有约为0.3μg的基因组DNA的量。混合后的样品中可加入外源的甲基化的阳性对照和未甲基化的阴性对照作为对照确定捕获效率。混合样品进行高温或NaOH变性后加入抗体进行免疫反应(IP)。 [0015] 步骤五捕获DNA进行Q-PCR检测 [0016] 免疫反应(IP)捕获后的DNA纯化后进行Q-PCR检测富集效率，根据原混合样品和[9]捕获DNA的Ct值检测抗体对甲基化DNA捕获效率。 [0017] 步骤六PCR扩增和文库大小选择 [0018] 对IP捕获纯化后的DNA进行低循环PCR扩增，扩增后产物即MeDIP-seq多样品混合测序文库，对所述PCR扩增产物采用2％琼脂糖凝胶电泳进行切胶回收选择目的片段。回收的目的片段即为高通量测序文库。 [0019] 本发明还提供上述MeDIP-seq文库用于同时多样本混合高通量测序的用途，所述测序可通过任何测序方法进行，包括但不限于双脱氧链终止法，优选高通量测序方法包括但不限于第二代测序技术或者是单分子测序技术。 [0020] 所述第二代测序技术包括但不限于SOLEXA、SOLID和454测序技术；所述单分子测序技术包括但不限于True Single Molecule DNAsequencing技术，the single molecule，real-time(SMRT.TM.)技术，以及纳米孔测序技术。 [0021] 本发明在已有基于高通量测序的MeDIP-seq技术的基础上创新性的开发了一种可以进行大规模MeDIP-seq文库构建和同时多样本混合高通量测序的技术。我们对加了标签接头的DNA片段采用实时定量PCR检测浓度，然后根据混合浓度将多个样本混合后同时进行DNA与抗体免疫反应(IP反应)。对捕获的含有多个样本的混合文库可以同时进行高通量测序，对测序获得的数据通过各自标签序列进行区分从而分别进行高通量分析。同时该方法经过QPCR定量可以确保不同样品进行均匀混合，因不同的样品在同一IP条件下反应，确保了IP反应对每种样品内的甲基化DNA片段进行有效的捕获效率相同，解决了不同样本间捕获效率差异。比较已有方法该该发明方法大大节省了样本准备时间及试剂用量，使得高效、低成本的MeDIP-seq样品准备成为现实，使得大样本量的临床样本的MeDIP-seq群体研究成为可能。 [0022] 本发明一方面提供了一组标签，所述标签包括或由如下组成：选自表1中标签的至少5个，或至少10个，或至少15个，或全部20个， [0023] 所述标签优选地至少包括表1所示的20个标签的DNA index-1-DNA index-5，或DNA index-6-DNA index-10，或DNA index-11-DNA index-15，或DNA index-16-DNA index-20，或者他们任何两个或多个的组合。 [0024] 在本发明的一个具体实施方式中，提供了所述的标签用于构建MeDIP-seq文库的用途。 [0025] 在本发明的一个具体实施方式中，提供了通过所述的标签构建的MeDIP-seq文库。 [0026] 本发明另一方面提供了含有上文所述的标签的一组标签接头，其中标签接头包含所述的标签，并且优选地同时用作5’和3’接头，所述一组所述标签接头包括或由如下组成：选自表1中标签接头的至少5个，或至少10个，或至少15个，或全部20个； [0027] 所述标签接头优选地至少包括表1所示的20个标签接头中的DNAindex-1F/R_adapter-DNA index-5F/R_adapter，或 DNAindex-6F/R_adapter-DNA index-10F/R_adapter，或DNAindex-11F/R_adapter-DNA index-15F/R_adapter，或 DNAindex-16F/R_adapter-DNA index-20F/R_adapter，或者他们任何两个或多个的组合。 [0028] 在本发明的一个具体实施方式中，提供了所述的标签接头用于构建MeDIP-seq文库的用途，优选地所述标签接头同时用作MeDIP-seq文库的5’和3’接头。 [0029] 在本发明的一个具体实施方式中，提供了通过上文所述的标签接头构建的MeDIP-seq文库。 [0030] 本发明另一方面提供了一种MeDIP-seq文库构建的方法，所述方法包括： [0031] 步骤一样品DNA片段化 [0032] 起始目的研究材料可以为任意物种，包括各种植物、动物、微生物，例如人，植物，昆虫，特别是哺乳动物包括人、小鼠的基因组DNA，片段化的方法包括雾化、超声片段化、HydroShear或酶切处理，从而将基因组DNA打断为大小优选为200-400bp的片段；其中片段化方法中优选地采用超声片段化法； [0033] 步骤二DNA片段末端修复及3’端连接“A”碱基 [0034] 打断后的片段化DNA在包括但不限于T4 DNA聚合酶、Klenow片段和T4多聚核苷酸激酶等酶的作用下，进行末端修复，形成平末端的DNA随机片段，然后在包括但不限于Klenow(3’-5’exo-)酶的作用下，在平末端化的DNA随机片段的3’末端连接“A”碱基； [0035] 步骤三标签接头的连接及定量 [0036] 在包括但不限于T4DNA连接酶的作用下，将末端连接“A”碱基的DNA随机片段末端连接不同的标签接头，优选地所述DNA随机片段5’和3’端同时连接所述标签接头；然后对连接产物采用包括但不限于实时定量PCR进行浓度检测，确定各个样品的有效浓度； [0037] 步骤四样品混合，定量及免疫反应 [0038] 取含等量的连接有不同标签接头的连接产物，进行等量混合，总量控制在1-3μg，优选1.5-2μg；混合后的样品中优选地加入外源的甲基化的阳性对照和未甲基化的阴性对照作为对照确定捕获效率；然后混合样品进行高温或NaOH变性后加入甲基化特异结合抗体，优选地是5mc抗体进行免疫反应(IP)； [0039] 外源的甲基化的阳性对照是指一段已知序列(如200-300bp的一段DNA序列)，当中的含有的CG位点是确定的(如5个CG位点)，阳性对照这些位点都是甲基化的(预先用甲基化转移酶处理)，未甲基化的阴性对照的这些位点都是未甲基化的，所以抗体会富集甲基化的而不富集未甲基化的。因为这200-300的片段都是设计好引物的，所以可以有此根据QPCR检测富集的效果。阳性对照和阴性对照是本领域技术人员已熟知的技术； [0040] 任选地，步骤五捕获DNA进行Q-PCR检测 [0041] 免疫反应(IP)捕获后的DNA纯化后进行Q-PCR检测富集效率，根据原混合样品和捕获DNA的Ct值检测抗体对甲基化DNA捕获效率； [0042] 步骤六PCR扩增和文库大小选择 [0043] 对IP捕获纯化后的DNA进行优选的8-10个循环的低循环PCR扩增，扩增后产物即MeDIP-seq多样品混合测序文库，对所述PCR扩增产物优选地采用2％琼脂糖凝胶电泳进行切胶回收选择片段大小；将目的条带切下纯化后，即为待测序的MeDIP-seq文库；PCR扩增优选地使用热启动taq酶。 [0044] 在本发明的一个具体实施方式中，所述的方法中所述标签接头是上文所述的标签接头。 [0045] 在本发明的一个具体实施方式中，提供了通过所述的方法构建的MeDIP-seq文库。 [0046] 本发明另一方面进一步提供了通过本发明的方法构建的MeDIP-seq文库用于同时多样本混合高通量测序的用途，其中包括： [0047] 步骤七使用所述测序文库进行高通量测序，所述测序可通过任何测序方法进行，包括但不限于双脱氧链终止法，优选高通量测序方法包括但不限于第二代测序技术或者是单分子测序技术。 [0048] 在本发明的一个具体实施方式中，所述第二代测序技术(MetzkerML.Sequencing technologies-the next generation.Nat Rev Genet.2010 Jan；11(1)：31-46)包括但不限于SOLEXA、SOLID和454(焦磷酸测序)测序技术(平台)；所述单分子测序技术(单分子测序平台)包括但不限于Helicos公司的True Single Molecule DNA sequencing技术，Pacific Biosciences公司的the single molecule，real-time(SMRT.TM.)技术，以及Oxford Nanopore Technologies公司的纳米孔测序技术等(Rusk，Nicole(2009-04-01).CheapThird-Generation Sequencing.Nature Methods 6(4)：244-245)。附图说明 [0049] 图1：MeDIP多样本大规模建库基本流程。 [0050] 图2：样品间富集片段的相关性分析，根据对不同区域片段的富集情况比较2个样品覆盖的区域是否一致。具体实施方式 [0051] 下面将结合实施例对本发明的实施方案进行详细描述，但是本领域技术人员将会理解，下列实施例仅用于说明本发明，而不应视为限定本发明的范围。 [0052] 使用此发明方法，我们以6个人外周血基因组DNA(各2μg)样品起始构建了1个混合6个样品的混合文库。采用TA clone检测了文库的质量，然后进行了高通量测序比较分析。 [0053] 1、实验部分： [0054] 主要实验仪器列表 [0055] [0056] 相关试剂列表 [0057] [0058] [0059] 表1，标签(DNA Index-N)及其相对应标签接头(由正向序列DNA index-NF_adapter和反向序列DNA index-NR_adapter组成)列表 [0060] [0061] [0062] [0063] [0064] 表2，PCR及QPCR使用到的引物列表 [0065] [0066] 1.1DNA片段化 [0067] 使用covaris(E-series)打碎仪，在96孔板中每孔加入2ug上文所述的人基因组DNA样品，用TE稀释成80ul体系，用热封膜密封后，2000rpm离心1min。按照功率20％、强度为10，循环为500，间歇时间设置为8，打断240s(60s四次)。打断后的样品用2％琼脂糖凝胶电泳检测合格后(DNA片段分布在200-400bp之间，无蛋白、RNA污染)，经Ampure Beads(Agencourt)纯化，纯化后回收到42μl的Elution Buffer(EB)中。 [0068] 1.2DNA片段末端修复及3’端加“A”碱基 [0069] 在42μl DNA溶液中加入5μl 10xT4多聚核苷酸激酶缓冲液，0.4μl 25mM dNTP，1.2μl T4 DNA聚合酶，0.2μl Klenow聚合酶和1.2μl T4多聚核苷酸激酶(也称为T4PNK酶)，20℃温育30分钟，对片段化的DNA进行补平末端。补平的DNA片段经Ampure Beads(Agencourt)纯化到22μl的Elution Buffer(EB)中。 [0070] 接着对回收的片段进行3’末端加“A”碱基，具体操作为：在19.7μl的DNA回收液中，加入2.3μl的10×Blue buffer，0.5μl 5mM dATP，0.5μl Klenow聚合酶(3’-5’exo-)，37℃温育30分钟，经Ampure Beads纯化到25μl的Elution Buffer(EB)中。 [0071] 1.3标签接头连接 [0072] 将合成好的100μM的Index-NF_adapter和Index-NR_adapter分别取10μL进行混合，94℃，5分钟，65℃水浴放置15分钟后自然冷却，得到50μM Index Adapter 退火产物。 [0073] 在末端加“A”碱基后的样品中加入25μl的2×Rapid ligationbuffer，1μl的Index Adapter(50μM)和3μl的T4 DNA连接酶，20℃温育15分钟，每种样品取等量混合，经Ampure Beads纯化回收到32μl的Elution Buffer(EB)中待用。 [0074] 1.4Q-PCR定量 [0075] 加完标签接头的DNA片段使用Q-PCR[9]进行定量，反应体系如下： [0076] DNA 1μl [0077] QPCR primer 1.1 1μl [0078] QPCR primer 2.1 1μl [0079] dNTP(2.5mM) 2μl [0080] EvaGreen 1.25μl [0081] Rox 0.5μl [0082] Taq酶 0.25μl [0083] H2O 18μl [0084] [0085] Total 25μl [0086] 1.5免疫沉淀反应及捕获DNA洗脱 [0087] 取6个加了不同标签接头的连接产物片段，根据QPCR测得的浓度结果按照1∶1混合样品，95℃孵育3分钟，快速放入冰水混合物中使之冷却。加入1.5ul的抗体和15μl的磁珠(Magnetic MethylatedDNA Immunoprecipitation Kit)，4℃旋转混合孵育免疫反应过夜。 [0088] 每个免疫反应加100ul的Buffer DIB和2ul的蛋白酶K(Magnetic Methylated DNA Immunoprecipitation Kit提供)，55℃反应15min后，100℃反应15min，然后在4℃下以14,000rpm离心5分钟，吸取上清分别转移至新的EP管中，经酚氯仿抽提纯化，最后溶解到32μl的Elution Buffer(EB)中。 [0089] 1.6PCR扩增 [0090] PCR扩增MeDIP捕获后的DNA片段，反应体系为： [0091] MeDIP捕获DNA 32μl [0092] 10×PCR buffer 5μl； [0093] Index primer1.1 2.5μl； [0094] Index primer2.1 2.5μl； [0095] MgSO4(50mM) 2μl； [0096] dNTP(2.5mM) 5μl； [0097] Platinum Pfx DNA Polymerase 1.0μl； [0098] [0099] 总体积 25μl [0100] PCR反应条件： [0101] 98℃ 30s [0102] [0103] 72℃ 2min [0104] 4℃ 保存 [0105] PCR扩增产物采用QIAquick Gel Extraction Kit(Qiagen)进行胶纯化回收，溶于30μl的Elution Buffer(EB)中，取5μl进行TAclone检测，剩余文库用于测序测序。 [0106] 1.7文库检测 [0107] 1)使用Agilent 2100 Bioanalyzer检测文库产量。 [0108] 2)使用QPCR定量检测文库产量[10]。 [0109] 2、结果部分： [0110] 2.1 TA clone文库检测结果 [0111] 表2.1：文库TA clone检测结果 [0112] [0113] 对混合文库进行TA clone检测，共测得有效序列51条，51条当中能够识别标签的有45条，标签有效率占88.24％，45条中有40条可比对回基因组，占88.89％。其中标签的有效率和比对回基因组效率都在85％以上，说明文库质量较好。另外从标签分布来看被测到条数最少的是index1和index4；index6各有6条被测到占全部有效index的13％；被测到条数最少的是index 3共有10条被测到占全部有效index的22％。整体来看各标签被测到的随机性较好，说明根据该方法是有效可行的。 [0114] 2.2测序(Illumina GA)数据信息高级分析比较结果 [0115] 1)整体数据比对结果 [0116] 表2.2-1：文库整体数据分析结果 [0117] [0118] 文库整体数据分析结果表明6个标签样品都可以有效且较均匀识别，且有效数据的唯一比对回基因组率都在70％以上。说明测序结果和TA clone结果一致，也说明该方法构建文库测序结果数据是可用的。 [0119] 2)测序数据覆盖区间的平均甲基化水平比较分析 [0120] 表2.2-2：6个样品覆盖区间的平均甲基化水平分析结果 [0121] [0122] 6个样品覆盖区间的平均甲基化水平分析结果表明样品间相差很小，甲基化水平都在70％左右，说明MeDIP建库富集到了高甲基化区域，且各个样品之间的差异性很小。 [0123] 3)样品间相关性分析(参见图2) [0124] 相关性分析可以看出2个样品数据之间的关联，即是否覆盖到共有的高甲基化区间，在高甲基化的区间的相关性越好说明实验越成功。本次实验相关性分析参数设置：数据量预先进行均一化处理，然后以1k为单位，50％以上被覆盖，覆盖的序列大于5条算一个有效的覆盖单位。然后比较2个样品对这样的1k的窗口的覆盖关系。 [0125] 选取index1和index2以1k长度为一个窗口，计算窗口中片段的个数，发现在高覆盖的区域不同样品间的片段覆盖情况相关性很好，这样就说明该发明建库测序记过表明不同样品都可对一些高甲基化区域有效富集不会出现因实验方法导致样品之间富集效果上的差异。 [0126] 尽管本发明的具体实施方式已经得到详细的描述，本领域技术人员将会理解。根据已经公开的所有教导，可以对那些细节进行各种修改和替换，这些改变均在本发明的保护范围之内。本发明的全部范围由所附权利要求及其任何等同物给出。 [0127] 参考文献 [0128] [1].Brena RM，Huang TH，Plass C.Quantitative assessment of DNA methylation：Potential applications for disease diagnosis，classification，and prognosis in clinical settings.J Mol Med.2006May；84(5)：365-77. [0129] [2].Egger G，Liang G，Aparicio A et al.Epigenetics in human disease and prospects for epigenetic therapy.Nature 2004 May27；429(6990)：457-63. [0130] [3].Li N，Ye M，Li Y et al.Whole genome DNA methylation analysis based on high throughput sequencing technology.Methods.2010 Apr 27.[Epub ahead of print] [0131] [4].Down TA，Rakyan VK，Turner DJ，et al.A Bayesian deconvolution strategy for immunoprecipitation-based DNAmethylome ahalysis.Nat Biotechnol.2008 Jul；26(7)：779-85. [0132] [5].Serre D，Lee BH，Ting AH.MBD-isolated Genome Sequencing provides a high-throughput and comprehensive survey of DNA methylation in the human genome.Nucleic Acids Res.2010Jan；38(2)：391-9. [0133] [6].Lister R，Pelizzola M，Dowen RH，et al.Human DNAmethylomes at base resolution show widespread epigenomicdifferences.Nature.2009 Nov 19；462(7271)：315-22. [0134] [7].Meissner A，Mikkelsen TS，Gu H，et al.Genome-scale DNAmethylation maps of pluripotent and differentiated cells.Nature.2008Aug 7；454(7205)：766-70. [0135] [8].Gu H，Bock C，Mikkelsen TS，et al.Genome-scale DNAmethylation mapping of clinical samples at single-nucleotideresolution.Nat Methods.2010 Feb；7(2)：133-6. [0136] [9]Ning Li，Mingzhi Ye，Yingrui Li，Zhixiang Yan，Lee M. Butcher，Jihua Sun，Xu Han，Quan Chen，Xiuqing zhang and JunWang.Whole genome DNA methylation analysis based on highthroughput sequencing technology.Methods，2010，Apr.(doi：10.1016/j.ymeth.2010.04.009). [0137] [10]Bernd Buehler，Holly H.Hogrefe，Graham Scott，et al.Rapid quantification of DNA libraries for next-generation sequencing.Methods.2010.50：S15-S18.

意见反馈