首页 / 国际专利分类库 / 化学;冶金 / 组合化学 / 甲基化高通量检测方法

甲基化高通量检测方法

申请号 CN201110133858.1 申请日 2011-05-23 公开(公告)号 CN102796808A 公开(公告)日 2012-11-28
申请人 深圳华大基因科技有限公司; 深圳华大基因研究院; 发明人 罗慧娟; 吉冠玉; 蒋慧; 吴明枝; 孙继华; 吴仁花; 王君文; 高飞;
摘要 本 发明 提供一种甲基化高通量检测方法,特别提供了一种结合序列捕获和重亚 硫酸 盐 测序的方法,该方法能够同时准确有效地分析几个样品中的目标区域甲基化状态,降低探针设计的难度,增加操作及应用的可行性,使得对全基因组内感兴趣的目标序列和区域进行高通量高 精度 的甲基化检测成为现实,并且该方法还具有针对性强以及节约成本和时间的特点。
权利要求

1.一种甲基化高通量检测方法,其包括以下步骤:序列捕获探针的选择、文库制备、序列捕获、重亚硫酸盐处理、上机测序及数据分析,其特征在于序列捕获和重亚硫酸盐处理在文库制备的接头连接步骤和PCR扩增及文库切胶纯化步骤之间进行。
2.根据权利要求1的方法,其中所述探针可以是用于液相或者固相芯片杂交的探针,优选地所述探针的长度是60mer-120mer,更优选地所述探针的平均长度为120mer。
3.根据权利要求1的方法,其中所述文库制备步骤包括甲基化标签接头的连接,特别是PEI甲基化接头的连接。
4.根据权利要求1的方法,其中在序列捕获前进行如下文库制备步骤:
步骤一样品基因组DNA以及外源基因组DNA的片段
样品基因组DNA和作为外源基因组DNA可以是任意物种,包括但不限于人、植物、昆虫的基因组DNA;利用物理或化学方法,优选的声波片段化方法将优选的5μg基因组DNA进行随机打断,优选地打断为200-300bp的片段;优选地外源基因组DNA是没有甲基化修饰的λDNA;
步骤二基因组DNA的末端修饰
随机打断后的DNA回收纯化后,通过优选的T4DNA聚合酶、Klenow片段和T4聚核苷酸激酶酶的作用进行末端修复,形成平末端的DNA片段;然后优选地利用Klenow片段(3’-5’exo-)聚合酶及dATP在补平的序列的3’末端加上“A”基;
步骤三PEI甲基化接头的连接
3’末端加上“A”碱基的序列在连接酶,优选的T4DNA连接酶的作用下与甲基化修饰,优选的C位点甲基化修饰的接头进行连接,纯化回收,对其进行定量。
5.根据权利要求4的方法,其中所述PEI甲基化接头包括:
PE Index_甲基化adapter 1:
Phos/TCAAGTAGATCGGAAGAGCACACGTCTGAACTCCAGTCAC,和
PE Index_甲基化adapter 2:
TACACTCTTTCCCTACACGACGCTCTTCCGATCTACTTGAT,其中所述接头的所有C位点均经甲基化修饰。
6.根据权利要求1的方法,其中序列捕获步骤包括将文库制备步骤中的连接产物文库在固相或液相杂交平台,优选是液相杂交平台进行杂交,其中优选地使用500-1000ng连接产物文库杂交,在杂交体系中同时加入接头封闭序列;待杂交完毕后,通过变性等方法收集捕获的序列并纯化,得到与杂交探针区域互补的DNA分子,其中优选地是对外显子组进行捕获。
7.根据权利要求6的方法,其中接头封闭序列是PEI甲基化接头的连接步骤中所使用PEI甲基化接头的互补序列,并且选自
PE Index_甲基化adapter 1:
Phos/TCAAGTAGATCGGAAGAGCACACGTCTGAACTCCAGTCAC,或
PE Index_甲基化adapter 2:
TACACTCTTTCCCTACACGACGCTCTTCCGATCTACTTGAT的互补序列,其中所述接头的所有C位点均经甲基化修饰。
8.根据权利要求1的方法,其中重亚硫酸盐处理步骤包括将序列捕获步骤中得到的DNA与片段化外源基因组DNA,一起用重亚硫酸盐进行处理,并且外源基因组DNA优选地是
200ng经片段化的λDNA。
9.根据权利要求1的方法,其中在重亚硫酸盐处理后进行如下文库制备中的PCR扩增及文库切胶纯化步骤:
以重亚硫酸盐转换后的DNA为模板,加入PCR引物序列进行PCR扩增,其中所使用的聚合酶包括针对重亚硫酸盐转换后的DNA的热启动taq酶、常规的r-taq或其它聚合酶扩增,优选的是针对重亚硫酸盐转换后的DNA的热启动taq酶;
对扩增产物进行纯化,纯化方法包括但不限于磁珠纯化、纯化柱纯化、2%的琼脂糖胶电泳纯化;纯化回收的产物进行QPCR定量,然后待上机测序。
10.根据权利要求9的方法,其中进一步包括将优选的6bp或8bp的标签序列通过接头或者PCR引物引入到DNA片段的一侧。
11.根据权利要求9的方法,其中PCR引物序列包括:
P1公用引物:
AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT,
Index1引物:
CAAGCAGAAGACGGCATACGAGATCTTGATGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT,和Index 2引物:
CAAGCAGAAGACGGCATACGAGATTCAAGTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT。
12.根据权利要求1的方法,其中上机测序及数据分析包括将重亚硫酸盐处理步骤得到的序列在测序平台,优选第二代测序平台,更优选的Solexa测序平台上进行测序,并进行数据分析比较。
13.根据权利要求1-12中任一项的方法构建的测序文库。
14.根据权利要求12的测序文库用于甲基化高通量测序的用途。
15.根据权利要求1-12中任一项的方法,适用于外显子组测序,进一步优选地用于检测人类全基因组外显子组的甲基化分布情况。

说明书全文

甲基化高通量检测方法

技术领域

[0001] 本发明涉及高通量基因组甲基化DNA检测领域,特别是提供了一种结合序列捕获和重亚硫酸盐(bisulfite)测序的方法。另外,本发明还涉及外显子组测序和基于重亚硫酸盐转换的甲基化分析测序技术领域。本发明还涉及甲基化标签(Index)接头技术,可以实现在一个芯片上同时进行几个样品的捕获。本发明的方法特别适用于第二代测序技术,尤其是solexa测序技术。

背景技术

[0002] DNA甲基化是表观遗传学研究领域最为热点的方向之一,也正逐渐成为哺乳动物发育和癌症等多种疾病的表观遗传学标记。DNA甲基化不仅对染色质结构修饰,基因组稳定性具有重要作用,而且在真核生物中,DNA甲基化参与多种生物学过程,如胚胎发育,基因组印记,X染色体失活,基因表达的调节与沉默,逆转录转座子的沉默以及哺乳动物肿瘤等多种疾病的发生(Brena RM et al.2006;Egger G et al.2004;Gu H et al.2010)。DNA甲基化生物标记为多种疾病的早期评估包括对高危险个体的检测评估,提供大量参考信息。
[0003] 目前,外显子组测序和基于重亚硫酸盐转换的甲基化分析测序均已成熟。以Illumina Solexa、AB SOLiD和Roche 454为代表的第二代测序技术在近几年得到快速发展,成为基因组学研究的重要工具。第二代测序技术最大的特点是高通量,其可对数以亿计的DNA片段同时进行测序,目前一台高通量测序仪一次可产生高达300Gb的数据,相当于将一个人的全基因组测序100次,高通量测序是通过声波或其他方法将基因组打断成一系列的小片段,并在小片段的两侧加上接头(adaptor),然后通过接头引物进行桥式PCR或乳液PCR(emulsion PCR)扩增形成测序的基本单位,再根据接头上的部分序列设计公共测序引物,对基因组DNA进行测序。当前研究DNA甲基化的方法主要有:基于PCR的甲基化分析方法、基于限制性内切酶的甲基化分析方法、基于重亚硫酸盐的甲基化分析方法和柱层析法等。重亚硫酸盐处理结合高通量测序是研究甲基化最常用也是最准确的方法,重亚硫酸盐测序法(bisulfite genomics sequencing)是利用重亚硫酸盐将基因组DNA中的未甲基化的胞嘧啶(C)修饰为尿嘧啶(U),甲基化的胞嘧啶(C)保持不变,在PCR扩增中,尿嘧啶(U)将变成胸腺嘧啶(T),因此甲基化位点就成为一个普通的C/T单基多态性位点,其中等位基因胞嘧啶(C)的频率即为基因甲基化的程度,该方法具有数据量大,成本高的缺点。结合高通量测序的还有甲基化DNA免疫共沉淀(Methylated DNA Immunoprecipitation,MeDIP)和甲基化CpG结合域(methyl-CpG binding domain,MBD)柱层析法,它们虽然能很好的对富含甲基化区域进行富集,但是覆盖度相对均一,缺乏针对性。
[0004] 序列捕获技术是一种对基因组特定区域进行选择性富集的技术,其通过合适的方法将感兴趣的区域从基因组中分离出来,然后再对该目标区域进行测序,这对于低成本地有针对性的基因组学研究有非常重要的意义。
[0005] 最近研究发现(Brenet F et al.2011;Harder A et al.2010;Suzuki MM et al.2008):外显子甲基化密度比之前认识到和期望的更为普遍,而第一个外显子和第一个内含子甲基化分布跟下游的外显子和内含子甲基化分布差异较大,大多下游区域甲基化的程度跟基因表达并非密切相关。总之,转录起始位点周围甲基化,第一个外显子区域甲基化与基因沉默的关系比上游启动子区域甲基化与之得关系更为密切。分析外显子甲基化对基因表达的研究有重大意义。现有研究大多是将基因组重亚硫酸盐处理后,根据C→T转换,设计特定的目标区域的探针,捕获靶区域甲基化的片段。这种方法在序列捕获之前将基因组进行重亚硫酸盐处理,增加了探针设计的难度及降低序列捕获的效率、目的区域的覆盖度,从而限制了应用的广泛性。

发明内容

[0006] 针对上述基于重亚硫酸盐的甲基化研究方法中存在的问题,本发明提出了一种结合序列捕获和重亚硫酸盐测序的方法,该方法能够通过一次序列捕获试验对几个样品中的目标区域进行捕获,能准确有效地分析目标区域甲基化状态,降低探针设计的难度,增加操作及应用的可行性,使得对全基因组内感兴趣的目标序列和区域进行高通量高精度的甲基化检测成为现实,并且该方法还具有针对性强以及节约成本和时间的特点。
[0007] 本发明涉及的目的区域是外显子区域,将外显子组捕获与重亚硫酸盐测序相结合,以此来检测人类全基因组外显子组的甲基化分布情况,这对研究发现外显子对基因表达调控的作用具有广泛的应用价值。该技术主要流程:先将基因组DNA随机打断,加上特定接头后用液相杂交方法进行序列捕获,捕获下来的DNA内加入外源DNA然后再进行重亚硫酸盐处理,对处理好的DNA进行PCR扩增,TA克隆检测重亚硫酸盐处理效果,然后对文库进行定量检测及用新一代测序仪进行高通量测序,最后进行特异性区域范围内高精度的甲基化状况分析。该技术方案主要由以下五部分组成:序列捕获探针的选择、文库制备、序列捕获、重亚硫酸盐处理、上机测序及数据分析。
[0008] 序列捕获探针的选择
[0009] 本技术方案中探针设计简单,可以基于目前液相或者固相芯片杂交技术设计探针,探针长度可以从60mer-120mer不等。如选择探针SureSelect Human All Exon 38M kit(Agilent),该探针覆盖了人全外显子区域及部分miRNA区域,与基因组目的区域内其中一条链互补,平均长度为120mer。
[0010] 文库制备
[0011] 步骤一样品基因组DNA以及外源基因组DNA的片段化
[0012] 起始目的研究材料和作为外源基因组DNA的材料可以为任意物种(例如人,植物,昆虫)的基因组DNA,利用物理或化学方法如超声波片段化方法将基因组DNA打断为200-300bp的片段。外源基因组DNA优选地选择没有甲基化修饰的λDNA,其作用是在重亚硫酸盐处理时与样品一起高效共处理,对微量的DNA片段起到保护作用,最大限度的降低重亚硫酸盐对微量DNA的破坏。
[0013] 取没有蛋白、RNA等污染的完整基因组DNA约5μg以及作为外源基因组的λDNA,通过超声片段化方法将基因组DNA打断为大小200-300bp的片段。
[0014] 步骤二基因组DNA的末端修饰
[0015] 随机打断后的DNA回收纯化后,通过T4DNA聚合酶(T4DNAPolymerase)、Klenow片段(Klenow Fragment)和T4聚核苷酸激酶(T4Polynucleotide Kinase)等酶的作用进行末端修复,形成平末端的DNA片段。然后利用Klenow片段(Klenow Frgment)(3’-5’exo-)聚合酶及dATP在补平的序列的3’末端加上“A”碱基。
[0016] 步骤三PEI(Paired-end Index)甲基化接头(Adapter),也称为双末端标签甲基化接头的连接
[0017] 3’末端加上“A”碱基的序列在T4DNA连接酶(T4DNA Ligase)的作用下与特殊设计且甲基化修饰的接头(C位点甲基化修饰)进行连接,纯化回收,如用MiniElute PCR Purification Kit(Qiagen)回收纯化反应体系中的DNA后,对其进行定量,如采用Qubit(Invitrogen)方法等。
[0018] 序列捕获
[0019] 取500-1000ng连接产物文库进行液相或固相杂交,如采用Agilent液相杂交平台或Nimblegen固相或液相杂交平台进行,在杂交体系中同时加入接头封闭序列待杂交完毕后,通过变性等方法收集捕获的序列并纯化,得到与杂交探针区域互补的DNA分子。
[0020] 重亚硫酸盐处理
[0021] 将捕获下来的DNA加入200ng片段化了的λDNA,然后一起用重亚硫酸盐处理,如TM利用EZ DNA Methylation-Gold Kit (ZYMO)使非甲基化胞嘧啶转换为尿嘧啶。
[0022] 步骤四PCR扩增及文库切胶纯化
[0023] 以重亚硫酸盐转换后的DNA为模板,加入PCR引物序列,用针对重亚硫酸盐转换后的DNA的热启动taq酶进行PCR扩增(可用常规的r-taq或其它聚合酶扩增),扩增产物可用例如如下三种方法进行纯化,分别为磁珠纯化、纯化柱纯化、2%的琼脂糖胶电泳纯化。纯化回收的产物进行QPCR定量,然后待上机测序。
[0024] 上机测序及数据分析
[0025] 将捕获的序列经过重亚硫酸盐处理后在第二代测序平台,例如在Solexa测序平台上采用边合成边测序的方法进行序列测定。为了将来源于不同样本制备的DNA文库在测序后区分开来,6bp或8bp的标签序列通过接头或者PCR引物引入到片段的一侧,这样可以方便将不同文库直接混合后上机测序。分析数据时参考的序列为hg18(已知的全基因组序列)
[0026] 测序所得的原始数据的分析流程参考LI Y et al.,Nature(2008)(JWang,et al.,(2008).The DNA Methylome of Human Peripheral Blood Mononuclear Cells.Nature,456:60.),在实际应用中,参考数据的选择会随着所研究的基因组来源不同而不同,基本分析过程包括以下主要步骤:将测序得到的数据正链的C全部转化成T,互补链的G全部转化成A,使用SOAP程序(Li R,Li Y.,Kristiansen K.& Wang,J.(2008).SOAP:short oligonucleotide alignment program.Bioinformatics,24:713-714.)分别比对到C全部转化为T,G全部转化为A的hg18参考基因组上,其中允许有两个碱基的错配。然后统计比对在目标区域唯一位置的读段(reads),并用这些比对上参考序列的读段,以Depth>4作为过滤参数进行过滤,将通过过滤后的位点的甲基化信息作为实际测到的甲基化信息,并以之为基础进行后续的比对信息分析。
[0027] 与常规研究报道的重亚硫酸盐处理基因组后再进行序列捕获的测序方法不同,在本发明中,首先进行特定区域的序列捕获,之后再用亚硫酸盐处理。因此,在序列捕获的过程中样品的甲基化的状态并没发生变化,设计捕获探针时就不需要考虑目的区域甲基化平对序列捕获效率的影响。可以捕获所有目标区域验证其甲基化情况,而不必事先考虑甲基化分布再来设计芯片,获得的数据更真实和充分。本发明可使序列捕获中的探针设计方法较为简单,且捕获效率高,进而能够就全面而准确地分析基因组甲基化水平。
[0028] 本技术方案中探针设计简单,可以基于目前液相或者固相芯片杂交技术设计探针,探针长度可以从60-120mer不等。
[0029] 本技术在文库构建时,在序列捕获前进行甲基化标签(Index)接头的连接,这样可将几个样品混合后同时进行序列捕获,大大节省了成本,从而实现大样本量的高通量甲基化水平检测。

具体实施方式

[0030] 下面将结合实施例对本发明的实施方案进行详细描述,但是本领域技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限定本发明的范围。
[0031] 本发明一方面提供了一种甲基化高通量检测方法,其包括以下步骤:序列捕获探针的选择、文库制备、序列捕获、重亚硫酸盐处理、上机测序及数据分析,其中序列捕获和重亚硫酸盐处理在文库制备的接头连接步骤和PCR扩增及文库切胶纯化步骤之间进行。
[0032] 在本发明的一个具体实施方式中,甲基化高通量检测方法中的所述探针可以是用于液相或者固相芯片杂交的探针,优选地所述探针的长度是60mer-120mer,更优选地所述探针的平均长度为120mer。
[0033] 在本发明的一个具体实施方式中,甲基化高通量检测方法中的所述文库制备步骤包括甲基化标签接头的连接。
[0034] 在本发明的一个具体实施方式中,甲基化高通量检测方法中在序列捕获前进行如下文库制备步骤:
[0035] 步骤一样品基因组DNA以及外源基因组DNA的片段化
[0036] 样品基因组DNA和作为外源基因组DNA可以是任意物种,包括但不限于人、植物、昆虫的基因组DNA;利用物理或化学方法,优选的超声波片段化方法将优选的5μg基因组DNA进行随机打断,优选地打断为200-300bp的片段;优选地外源基因组DNA是没有甲基化修饰的λDNA;
[0037] 步骤二基因组DNA的末端修饰
[0038] 随机打断后的DNA回收纯化后,通过优选的T4DNA聚合酶、Klenow片段和T4聚核苷酸激酶酶的作用进行末端修复,形成平末端的DNA片段;然后优选地利用Klenow片段(3’-5’exo-)聚合酶及dATP在补平的序列的3’末端加上“A”碱基;
[0039] 步骤三PEI甲基化接头的连接
[0040] 3’末端加上“A”碱基的序列在连接酶,优选的T4DNA连接酶的作用下与甲基化修饰,优选的C位点甲基化修饰的接头进行连接,纯化回收,对其进行定量。
[0041] 在本发明的一个具体实施方式中,甲基化高通量检测方法中所述PEI甲基化接头包括:
[0042] PE Index_甲基化adapter 1:
[0043] Phos/TCAAGTAGATCGGAAGAGCACACGTCTGAACTCCAGTCAC(SEQ ID NO:1,所有C位点甲基化修饰),和
[0044] PE Index_甲基化adapter 2:
[0045] TACACTCTTTCCCTACACGACGCTCTTCCGATCTACTTGAT(SEQ ID NO:2)。
[0046] 在本发明中可以改变上述接头序列中下划线部分的碱基,从而产生更多的、不同的标签引物,用于多种不同的样品。
[0047] 在本发明的一个具体实施方式中,甲基化高通量检测方法中的序列捕获步骤包括将文库制备步骤中的连接产物文库在固相或液相杂交平台,优选是液相杂交平台进行杂交,其中优选地使用500-1000ng连接产物文库杂交,在杂交体系中同时加入接头封闭序列;待杂交完毕后,通过变性等方法收集捕获的序列并纯化,得到与杂交探针区域互补的DNA分子,其中优选地是对外显子组进行捕获。
[0048] 在本发明的一个具体实施方式中,甲基化高通量检测方法中的序列捕获步骤中使用的接头封闭序列是PEI甲基化接头的连接步骤中所使用PEI甲基化接头的互补序列,并且选自
[0049] PE Index_甲基化adapter 1:
[0050] Phos/TCAAGTAGATCGGAAGAGCACACGTCTGAACTCCAGTCAC(SEQ ID NO:1),或[0051] PE Index_甲基化adapter 2:
[0052] TACACTCTTTCCCTACACGACGCTCTTCCGATCTACTTGAT(SEQ ID NO:2)的互补序列,其中所述接头的所有C位点均经甲基化修饰。
[0053] 在本发明的一个具体实施方式中,甲基化高通量检测方法中的重亚硫酸盐处理步骤包括将序列捕获步骤中得到的DNA片段化外源基因组DNA,一起用重亚硫酸盐进行处理,并且外源基因组DNA优选地是200ng经片段化的λDNA。
[0054] 本发明进一步提供了一种甲基化高通量检测方法,其中在重亚硫酸盐处理后进行如下文库制备中的PCR扩增及文库切胶纯化的步骤:
[0055] 以重亚硫酸盐转换后的DNA为模板,加入PCR引物序列进行PCR扩增,其中所使用的聚合酶包括针对重亚硫酸盐转换后的DNA的热启动taq酶、常规的r-taq或其它聚合酶扩增,优选的是针对重亚硫酸盐转换后的DNA的热启动taq酶;
[0056] 对扩增产物进行纯化,纯化方法包括但不限于磁珠纯化、纯化柱纯化、2%的琼脂糖胶电泳纯化;纯化回收的产物进行QPCR定量,然后待上机测序。
[0057] 在本发明的一个具体实施方式中,PCR扩增步骤进一步包括将优选的6bp或8bp的标签序列通过接头或者PCR引物引入到DNA片段的一侧。
[0058] 在本发明的一个具体实施方式中,在甲基化高通量检测方法中根PCR扩增中使用的PCR引物序列包括:
[0059] P1公用引物:
[0060] AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT(SEQ ID NO:3),
[0061] Index1引物:
[0062] CAAGCAGAAGACGGCATACGAGATCTTGATGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT(SEQ ID NO:4),和
[0063] Index 2引物:
[0064] CAAGCAGAAGAC GGCATAC GAGATTCAAGTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT(SEQ ID NO:5)。
[0065] 其中可以改变上述PCR引物中下划线部分的碱基,从而产生更多的、不同的标签引物,用于多种不同的样品。
[0066] 在本发明的一个具体实施方式中,甲基化高通量检测方法中的上机测序及数据分析包括将重亚硫酸盐处理步骤得到的序列在测序平台,优选第二代测序平台,更优选的Solexa测序平台上进行测序,并进行数据分析比较。
[0067] 本发明另一方面提供了根据本发明的甲基化高通量检测方法构建的测序文库。
[0068] 本发明另一方面提供了根据本发明的甲基化高通量检测方法构建的测序文库用于甲基化高通量测序的用途。
[0069] 进一步的,根据本发明的甲基化高通量检测方法适用于外显子组测序,进一步优选地用于检测人类全基因组外显子组的甲基化分布情况。附图说明
[0070] 图1:MDC PCR 2100检测结果。
[0071] 图2:YH PCR 2100检测结果。
[0072] 图3:YH和MDC在每条染色体上的覆盖度分布。其中红色柱YH表示YH全血基因组DNA,绿色柱mDC(Mature dendritic cells)表示成熟的树突状细胞DNA,横坐标(chromosome)表示染色体号,纵坐标(coverage of ech chromosome)表示测序覆盖度。
[0073] 图4:YH和MDC在每条染色体上深度分布。其中绿色柱YH表示YH全血基因组DNA,红色柱mDC表示成熟的树突状细胞DNA,横坐标(chromosome)表示染色体号,纵坐标(depth of ech chromosome)表示测序深度。
[0074] 图5:YH MDC捕获片段在基因上的分布。
[0075] 图6:MDC捕获下来目标区域与全基因组重亚硫酸盐数据比较。横坐标和纵坐标分别表示目标捕获得出来的甲基化率(methylation rate in target region)和全基因组测序的甲基化率。Pearson Correlation表示皮尔逊相关系数。
[0076] 图7:YH捕获下来目标区域与全基因组重亚硫酸盐数据比较。横坐标和纵坐标分别表示目标捕获得出来的甲基化率(methylation rate in target region)和全基因组测序的甲基化率。Pearson Correlation 表示皮尔逊相关系数。
[0077] 实施例
[0078] 主要实验仪器列表
[0079]
[0080]
[0081] 相关试剂列表
[0082]
[0083] 序列列表(5’->3’,下划线部分表示的是标签)
[0084]
[0085]
[0086] DNA片断化:
[0087] 使用covaris-S2打断仪,YH全血基因组DNA(炎黄全血基因组DNA,来自一个中国成年男子血液提取的基因组DNA)和MDC DNA(人免疫细胞系DNA)样品各以5μg为起始量进行打断(外源λDNA也是如此)。按照以下参数设置:
[0088]Treatment1(处理1) duty/cycle(%)(负载比) 10
Intensity(强度) 5
Cycle/burst(循环/脉冲) 200
Time(min)(时间(秒)) 50
Treatment2(处理2) Time(s)(时间(秒)) 0
Treatment(处理3) Time(s)(时间(秒)) 0
Treatment4(处理4) Time(s)(时间(秒)) 0
Cycles(循环) 3
[0089] 打断后的样品经2%琼脂糖凝胶电泳检测合格后(DNA片段主带集中在200-300bp之间,无蛋白、RNA污染),经QIAquick PCRPurification Kit(Qiagen)纯化,回溶到32μl的Elution Buffer(EB)中。
[0090] 基因组DNA的末端修饰:
[0091] 将上一步得到的DNA按下表在1.5ml的离心管中配制末端修复反应体系:
[0092]
[0093]
[0094] 然后将离心管放到调至20℃的Thermomixer(Eppendrf)上反应30min。反应完后用QIAquick PCR Purification Kit(Qiagen)进行纯化,最后将样品溶于34μl Elution Buffer(EB)中。
[0095] DNA片段3′末端加“A”碱基:
[0096] 将上一步得到的DNA按下表在1.5ml的离心管中配制加“A”反应体系:
[0097]
[0098] 然后将离心管放到调至37℃的Thermomixer(Eppendrf)上反应30min。反应完后用MiniElute PCR Purification Kit(Qiagen)进行纯化,最后将样品溶于16μL Elution Buffer(EB)。
[0099] PEI甲基化接头的连接:
[0100] 将上一步得到的DNA按下表配制甲基化接头连接反应体系:
[0101]
[0102] 然后放到调至20℃的Thermomixer(Eppendrf)上反应15min。反应完后用MiniElute PCR Purification Kit(Qiagen)进行纯化,将样品溶于12μL Elution Buffer(EB)。然后采用Qubit(Invitrogen)进行浓度检测,根据浓度检测结果将DNA的浓度控制在147ng/ul(通过浓缩或者稀释方式)。
[0103] 序列捕获:
[0104] 以一个杂交反应(试剂均来自SureSelect Human All Exon 38Mkit)为例:
[0105] a.杂交试剂A的准备:
[0106]
[0107] b.SureSelect Oligo Library Mix的准备(C):
[0108] PCR管中分装5μL Oligo Capture Library后加入2μL稀释后的RNase Block(其中RNase Block∶nuclease-free water=1∶3),置于上。
[0109] c.文库及block混合液B的配置:
[0110]文库 3.4μL 147ng/μL
SureSelect Block#1 2.5μL
SureSelect Block#2 2.5μL
Index Block 0.6μL
共计 9μL
[0111] PEI甲基化接头为双链DNA,其中在上述PEI甲基化接头的连接步骤中使用PE-index甲基化Adapter1单链(SEQ ID NO:1)时,相应的封闭序列(Index Block)是PE-index甲基化Adapter1单链(SEQID NO:1)的互补序列;在上述PEI甲基化接头的连接步骤中使用PE-index甲基化Adapter2单链(SEQ ID NO:2)时,加入的IndexBlock是PE-index甲基化Adapter2单链(SEQ ID NO:2)的互补序列。
[0112] 在PCR管中配置混合液B,并用移液器将混合液混匀,盖紧管盖,放置在PCR仪中按以下条件运行热循环仪程序:
[0113]
[0114] d.将杂交试剂A放置在热循环仪中于65℃至少保持5分钟。
[0115] e.将SureSelect Oligo Library Mix(C)放置在热循环仪中于65℃至少保持2分钟。
[0116] f.保持PCR管于65℃,迅速用20μl移液器把13μl的Hybridization BufferA转移到SureSelect Oligo Library Mix(C)管中;然后迅速用20ul移液器把文库及block混合液B中的混合液全部转移到SureSelect Oligo Library Mix(C)管中,用移液器缓慢上下吸吹8到10次。
[0117] g.盖紧PCR管盖,于65℃(热循环仪热盖设为105℃)杂交24小时。
[0118] 样品洗脱(试剂均来自SureSelect Human All Exon 38M kit):
[0119] a.磁珠准备
[0120] 每一个杂交反应取50μl DynabeadsM-280Streptavidin磁珠于一新1.5mL离心管;
[0121] 使用200μL SureSelect Binding buffer洗三次;
[0122] 最后加入200μl SureSelect Binding buffer重悬磁珠。
[0123] b.洗脱样品
[0124] 将装有杂交混合液和磁珠的离心管对称的固定于BD Clay AdamsNutator Mixer或类似的装置上360度旋转混匀,室温下孵育30分钟,瞬时离心3s后置于磁架上去除上清;
[0125] 用500μl SureSelect Wash Buffer#1重悬磁珠,并于漩涡混合仪上振荡5秒混匀样品,室温下孵育样品15分钟;
[0126] 按以下步骤洗涤磁珠获得目的片段:
[0127] a)将离心管转移放置在磁力架上,静置5-10min至澄清,并尽量去除上清液;
[0128] b)用500μl SureSelect Wash Buffer#2重悬磁珠,并于漩涡混合仪上振荡5秒以混匀样品;
[0129] c)将样品放Thermomixer中65℃孵育10分钟,颠倒离心管以混匀样品,瞬时离心3秒;
[0130] d)重复2次“步骤a到步骤c”,尽量将Wash Buffer#2去除干净。
[0131] e)加入50μL SureSelect Elution Buffer,并于漩涡混合仪上振荡5秒以重悬磁珠,将样品放于室温下孵育10分钟;
[0132] f)将离心管转移放置在Dynal磁力架上,静置5-10min至澄清;
[0133] g)用移液器将含有样品的洗脱液转移到一个新的1.5ml离心管中;
[0134] h)向捕获的DNA中加入50μl SureSelect Neutralization Buffer。
[0135] i)使用1.8倍Ampure Beads去除捕获样品溶液中的盐分。
[0136] 捕获产物加入外源DNA进行重亚硫酸盐共处理:
[0137] 捕获产物中加入200ng片段化的外源λDNA,然后加入重亚硫酸盐处理2h。重亚TM硫酸盐处理采用EZ DNA Methylation-Gold Kit (ZYMO),具体步骤如下:
[0138] A)CT Conversion Reagent的制备:从试剂盒试剂盒中取出CTConversion Reagent(固体混合物),然后添加900μl的水、50μl的M-Dissolving Buffer和300μl的M-Dilution Buffer到一管的CTConversion Reagent中。在室温下溶解并且震荡10分钟或在摇床上摇动10分钟.
[0139] B)M-WASH BUFFER的制备:添加24ml 100%的乙醇到M-WashBuffer中来制备最终可以使用的M-Wash Buffer,加完乙醇后在盖子上打钩(用记号笔标记),表明可以使用。
[0140] C)将待转换的DNA按照分装到PCR管中,补水至20μl。
[0141] D)PCR管中添加130μl的CT Conversion Reagent,通过轻弹试管或移液器操作来混合样品。
[0142] E)将样品管放到PCR仪上按以下步骤操作:
[0143] 98℃放置5分钟
[0144] 64℃放置2.5小时
[0145] 立刻进行下一步操作或者在4℃下存储(最多20小时).
[0146] F)添加600μl的M-Binding Buffer到Zymo-Spin ICTM Column中,并将柱放如试剂盒所提供的Collection Tube中。
[0147] G)装填样品到Zymo-Spin ICTM Column含有M-Binding Buffer。盖上盖将柱颠倒数次来混合样品。
[0148] H)全速(>10,000xg)离心30秒,去除流出液。
[0149] I)添加200μl的M-Wash Buffer到柱中,全速离心30秒。
[0150] J)添加200μl的M-Desulphonation Buffer到柱中并且在室温(20℃-30℃)下放置15分钟,在培养后,全速离心30秒。
[0151] K)添加200μl的M-Wash Buffer到柱中,全速离心30秒;再添加200μl的M-Wash Buffer并且离心30秒。
[0152] L)直接添加10μl的M-Elution Buffer到柱基质中。将柱放置在1.5ml的管中,全速离心来洗脱DNA。
[0153] PCR扩增及文库大小选择:将上一步得到的DNA按以下体系配制PCR反应体系:
[0154]重亚硫酸盐处理的DNA 10μl
dNTP(2.5mM) 2μl
10x pcr buffer 2.5ul
JumpStartTM Taq DNA Polymerase 0.3μl
P1公用引物 0.5μl
Index1或2引物 0.5μl
dH2O 9.2μl
总体积 25μl
[0155] PCR反应条件:
[0156]
[0157] 用PCR Purification Kit(Qiagen)对扩增产物进行纯化,然后用2%的琼脂糖胶进行电泳,然后对目的大小文库进行切胶选择,采用MiniElute PCR Purification Kit(Qiagen)进行胶纯化回收,最后将文库溶于20μl EB中。
[0158] 文库检测:TA克隆检测亚硫酸盐对基因组的转换效率;安捷伦2100Bioanalyzer检测文库产量;QPCR定量检测文库产量。
[0159] 测序及数据分析:
[0160] 将样品于Solexa测序平台中进行双末端测序。通过与相同样品来源的全基因组亚硫酸盐测序的结果及全外显子序列捕获的数据分析比较,分析序列捕获甲基化分析方法的可行性。
[0161] 实验结果:
[0162] 1PCR产物的安捷伦2100Bioanalyzer检测结果
[0163] 图1和图2的PCR产物安捷伦2100Bioanalyzer检测结果表明5μg起始的YH(炎黄全血基因组DNA)和MDC DNA(成熟的树突状细胞DNA)可构建利用高通量新一代测序仪器进行高通量测序的甲基化文库,结合下文所述实际测序数据分析结果表明该发明方法切实可行,可应用于实际研究中。
[0164] 2TA克隆结果
[0165] 表1YH与MDC DNA建库文库质量检测结果
[0166]
[0167] 2个文库分别挑选36和41个克隆进行质量检测,结果转换效率都在99%以上,说明重亚硫酸盐处理实现了高效的转换。
[0168] 3数据分析
[0169] 3.1与全基因组比对率比较
[0170] 表2YH、MDC与常规建库测序数据结果比对结果
[0171]
[0172] 从上表可以看出,YH与MDC的比对率分别为91.80%与87.17%。比对率,捕获效率和BS的转化率均在正常范围内。
[0173] 3.2覆盖度的分布图
[0174] 表3YH、MDC覆盖度分布图
[0175]
[0176] 表3显示数据在覆盖到的不同的乘数下的分布情况,在当前测序量数据很集中的分布在目标区域内。
[0177] 3.2.1各染色体平均覆盖度分布和测序深度分布从图3可看出,测序数据基本上可以覆盖到每条染色体上的目标区域。
[0178] 图4显示在目标区域内,在每条染色体上的深度都在50×左右,在计算甲基化率的过程中可以提供较为精确的位点甲基化信息。
[0179] 图5显示的是在12号染色体上捕获到的数据在染色体上的分布,可以看出数据只在有目标区域的地方有富集。
[0180] 3.3数据相关性比较
[0181] 图6和图7分别为两个样品(MDC和YH)使用本发明方法得到的测序数据的甲基化相关性分析与使用全基因组正常建库得到相应测序数据进行甲基化相关性分析的比较,数据为过滤深度在10×以上的数据的甲基化率分布情况;可以看到相同位点上的甲基化率基本一致,MDC样品的相关系数是0.94(皮尔逊相关系数),YH样品的相关系数为0.93。
[0182] 通过将YH和MDC进行特定区域捕获文库构建,得到测序数据与常规文库测序相应数据进行信息分析比较结果来看,从比对效率、覆盖度、每条染色体的甲基化率及相关性来看,各方面覆盖率都不错,甲基化率也有很好的一致性,而且此项技术可以在小范围内达到很深的数据量,这些都说明了采用特定区域进行甲基化高通量测序研究是切实可行的,这种方法降低探针设计的难度,增加操作及应用的可行性,使得对全基因组内感兴趣的目标序列和区域进行高通量高精度的甲基化检测成为现实,而且具有针对性强以及节约成本和时间的特点。
[0183] 参考文献:
[0184] [1]Brena RM,Huang TH,Plass C.Quantitative assessment of DNA methylation:Potential applications for disease diagnosis,classification,and prognosis in clinical settings.J Mol Med.2006May;84(5):365-77.
[0185] [2]Egger G,Liang G,Aparicio A et al.Epigenetics in human disease and prospects for epigenetic therapy.Nature 2004 May27;429(6990):457-63.[0186] [3]Gu H,Bock C,Mikkelsen TS,et al.Genome-scale DNAmethylation mapping of clinical samples at single-nucleotide resolution.Nat Methods.2010 Feb;7(2):133-6.
[0187] [4]Hodges E,Smith AD,et al.High definition profiling of mammalian DNA methylation by array capture and single molecule bisulfite sequencing.Genome Res.2009Sep;19(9):1593-605.
[0188] [5]Brenet F,Moh M,et al.DNA methylation of the first exon is tightly linked to transcriptional silencing.PLoS One.2011 Jan18;6(1):e14524.[0189] [6]Harder A,Titze S,et al.Monozygotic twins with neurofibromatosis type 1(NF1)display differences in methylation of NF1 gene promoter elements,5 ′untranslated region,exon and intron1.Twin Res Hum Genet.2010Dec;13(6):
582-94.
[0190] [7]Suzuki MM,Bird A.DNA methylation landscapes:provocative insights from epigenomics.Nat Rev Genet.2008Jun;9(6):465-76.
[0191] [8]Li R,Li Y.,Kristiansen K.& Wang,J.(2008).SOAP:short oligonucleotide alignment program.Bioinformatics,24:713-714.
QQ群二维码
意见反馈