一种基因组DNA的PCR-free测序文库制备方法

申请号 CN201610108344.3 申请日 2016-02-26 公开(公告)号 CN105734048A 公开(公告)日 2016-07-06
申请人 武汉冰港生物科技有限公司; 发明人 张洪源; 郑媛坤; 束礼平; 杨冰; 范艺翔; 王宇峰; 何银竹; 束礼伟; 黄刚; 董扬;
摘要 本 发明 涉及分子 生物 学技术领域,公开了一种基因组DNA的PCR?free测序文库制备方法,包含下述步骤:(1)基因组DNA 超 声波 打断;(2)对 片段 DNA进行纯化回收;(3)片段化DNA末端修复;(4)末端修复产物纯化回收;(5)DNA末端加A;(6)末端加A产物纯化回收;(7)DNA两侧加测序接头进行连接反应;(8)对连接产物进行片段筛选,回收产物即为测序文库;(9)对文库进行质检和上机测序。本发明提供了上述步骤(1)基因组DNA 超声波 打断方法、步骤(2)(4)(6)中对产物进行纯化的方法、步骤(3)(5)(7)中反应体系和条件以及步骤(7)中兼容于Illumina二代测序仪的测序接头的设计和使用方法,保证了本发明所提供的PCR?free文库构建方法能够快速顺利的进行,利用该方法可得到不经过PCR反应(PCR?free)而直接制备成上机测序的文库。
权利要求

1.一种基因组DNA的PCR-free测序文库制备方法,具体包括以下步骤:
(1)对基因组DNA进行超声打断;
(2)对超声打断的片段进行纯化回收;
(3)利用NEB末端修复试剂对纯化产物进行末端修复;
(4)对末端修复产物进行纯化回收;
(5)利用NEB末端加A试剂对上述纯化产物进行DNA末端加A反应;
(6)对上述加A产物进行纯化回收;
(7)对上述纯化产物进行连接反应,本发明专利设计了多种兼容于Illumina二代测序仪的测序接头,接头序列含有标签(Index)序列,可同时对多个样品进行标记,接头引物合成采用HPLC,使用前需进行一定条件的处理;
接头序列为:
P5(5’-3’):AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATC*T(SEQ ID No.1)
P7(5’-3’):/5’Pho/GATCGGAAGAGCACACGTCTGAACTCCAGTCACNNNNNNATCTCGTATGCCGTCTTCTGCTTG(SEQ ID No.2)其中P7引物序列种的六基序列NNNNNN代表标签(Index)序列,标签(Index)序列用于标记不同的样品,可以将带不同标签(Index)序列的样品构建混合文库;
(8)对连接产物进行片段筛选,回收产物即为测序文库;
(9)对文库进行质检和上机测序,检测测序文库的浓度和片段大小,利用Illumina公司的二代测序仪对浓度和片段大小符合要求的文库进行高通量测序。
2.根据权利要求1所述的一种基因组DNA的PCR-free测序文库制备方法,其特征在于:
步骤(1)中,打断范围为插入片段insert 300bp和insert 500bp两种,打断选用Covaris M220超声打断仪,打断参数依次是占空因数(Duty factor)设置为20%,峰值功率(Peak incident power)设置为50W,循环破碎系数(Cycles per burst)设置为200,工作温度设置为20℃,两种不同的打断范围insert 300bp打断持续时间70秒(sec),insert 500bp打断持续时间42sec,基因组DNA打断起始量为1μg-6μg之间,打断体系为130μL。
3.根据权利要求1所述的一种基因组DNA的PCR-free测序文库制备方法, 其特征在于:
所述步骤(2)、(4)、(6)的纯化为用磁珠进行纯化,磁珠选用AMpure XP Breads,纯化时磁珠用量均为1.6×(体积为所纯化的溶液体积的1.6倍),其中,步骤(2)也可选用PCR产物试剂盒(QIAGEN(货号Cat.no.28704))进行纯化回收。
4.根据权利要求1所述的一种基因组DNA的PCR-free测序文库制备方法,其特征在于:
所述步骤(3)中,采用NEB修复试剂,体系为修复试剂5μL,10×修复缓冲液试剂10μL,片段化DNA溶液85μL,总体系为100μL,修复条件为20℃,60分钟(min);4℃,终止(hold)。
5.根据权利要求1所述的一种基因组DNA的PCR-free测序文库制备方法,其特征在于:
所述步骤(5)中,采用NEB加A反应试剂,体系为10×加A反应缓冲液试剂5μL,克列诺片段(Klenow Fragment,3′→5′exo-)3μL,修复DNA溶液42μL,总体系50μL,连接条件为37℃,
60min;4℃,hold。
6.根据权利要求1所述的一种基因组DNA的PCR-free测序文库制备方法,其特征在于:
所述步骤(7)中,设计了不同含标签(Index)序列的特异接头引物(共24种),接头引物合成采用HPLC,接头引物配制时,先将上述P5和P7接头引物用无核酸(NFW)各自稀释成母液(浓度为100μM),再配制10×退火缓冲液(溶液终浓度100mM Tris-HCl,500mM NaCl,10mM EDTA,PH8.0),分别取P5和P7引物母液各9μL,再加入上述2μL 10×退火缓冲液中配制成接头工作液(20μL),然后在PCR仪器上进行退火,退火反应条件为:97.5℃,2min;6℃/min(每分钟降低6℃)至16℃;16℃,hold,-20度长期保存,下次使用时需重新退火,连接反应采用NEB加A反应试剂,体系为10×T4DNA连接酶缓冲液5μL,加A连连接试剂23μL,接头工作液(浓度为45μM)5μL,连接增强试剂1.5μL,上述加A的DNA溶液54μL,总体系88.5μL,所述此处工作液加入量根据步骤(1)中DNA起始量进行调整,当步骤(1)中DNA起始量大于5ug,接头工作液可加5μL;当DNA起始量为2-5μg之间可加3μL;当起始量小于2μg可加1.5μL,连接反应条件为
20℃,120min;4℃,hold。
7.根据权利要求1所述的一种基因组DNA的PCR-free测序文库制备方法,其特征在于:
所述步骤(8)中,用2%琼脂糖凝胶电泳分离不同片段大小的DNA,然后用切胶回收的方法进行片段筛选,2%琼脂糖凝胶电泳条件为:120V,1.5小 时(h),insert 300bp切取300-500bp之间的片段进行回收,insert500bp切取500-700bp之间的片段。
8.根据权利要求1所述的一种基因组DNA的PCR-free测序文库制备方法,其特征在于:
所述步骤(9)中,文库质检用Qubit3.0对文库样品进行浓度检测、安捷伦2100核酸分析仪对片段范围进行检测和QPCR进行定量检测。

说明书全文

一种基因组DNA的PCR-free测序文库制备方法

技术领域

[0001] 本发明涉及分子生物学中高通量测序技术的领域。更具体涉及一种基因组DNA PCR-free测序文库制备方法,它适用于基因组DNA不经过PCR扩增就进行文库构建的样品。

背景技术

[0002] 二代测序技术是现代分子生物学高通量测序研究中最常用的技术。由于传统的一代测序已经不能完全满足研究者的需要,对模式生物进行基因组重测序以及非模式生物基因组测序都需要费用更低、通量更高、速度更快的测序技术,因而催生了第二代测序技术(Next-generation sequencing)。现有第二代测序技术平台主要包括Roche/454FLX、Illumina/Solexa Genome Analyzer和Applied Biosystems SOLID system三种,其核心原理是边合成边测序(Sequencing by Synthesis),即通过捕捉新合成的末端标记基信息来确定DNA的序列。这三种测序平台各有优点,其中454FLX的测序读长(Read)最长,Solexa测序性价比最高,SOLID测序的准确度最高。这三种测序平台中Illumina公司的测序仪器占了全球市场七成的份额,其Solexa的升级版Hiseq系列是目前使用最多的测序仪。Hiseq测序平台单次反应的数据量由最初几十G已提升到1.5~1.8Tb,极大的降低了测序成本,使得一千美金测一个人类基因组已经成为了可能。目前第三代测序技术(单分子测序技术)仍旧存在准确度和通量不高等缺点,部分三代测序仪还处于研发和测试阶段,而二代测序技术自身也会在不断完善和发展,因此,在今后相当长的一段时间内二代测序还是占据主流。第二代测序技术对DNA测序的主要原理是先将的DNA进行片段化,片段化DNA末端修复,然后在两侧加上特异的接头,随后用不同的方法产生几百万个空间固定的PCR克隆阵列,利用引物杂交和酶延伸反应对每个延伸反应所掺入的荧光标记进行成像检测就可获取测序数据。
[0003] 二代测序对DNA进行测序主要包括到文库制备和上机测序两个过程。在文库制备过程中,一般通过标准的PCR来扩增随机打断的基因组片段。但对于一些特殊模板,存在二级结构复杂或者热稳定性不好因素,从而影响模板PCR的扩增偏好,所以并非所有基因组序列都能在PCR扩增文库中同等体现。特别是对一些高GC或者高AT含量的模板,有时很难用PCR方法来扩增进行文库构建。PCR-free文库和常规PCR文库上机测序时并没区别,只是建库过程中不做PCR,PCR-free文库理论上可以改善数据读取分布并产生更均一的基因组覆盖。采用Illimina公司测序仪对文库上机测序时,PCR-free文库和常规PCR文库的簇扩增相似,不过也存在一些差异,其差异主要在于构建接头的方式。在Illimina测序仪的Flow cell上簇扩增的接头包含一些额外的序列,能帮助与连接在流动槽表面的单链DNA进行分子杂交,流动槽本身会选择完全相连的模板分子且只扩增与接头序列完全连接的模板链,簇扩增便开展了类似普通PCR文库构建时的PCR富集扩增,这样可降低文库构建时PCR扩增引入的错误碱基和由此造成的偏向性。Illumina的TruSeq DNA PCR-free样品制备试剂盒采用了一种基于磁珠的流程,理论上可在一天内完成,并可与Illumina测序平台不断增加的读长兼容。但此试剂盒价格昂贵,单次建库成本高。另外,由于全程采用的是磁珠纯化的流程,其缺点是插入片段分布较宽,尤其在小片段区域分布较多,容易导致序列在两端测序时被测穿而产生数据浪费。综上,PCR-free文库是一种建库方法的补充,由于不进行PCR扩增而直接制备成上机文库,可提高一些高GC或者高AT区域的覆盖度,从而减少了PCR引入的错误碱基、数据偏向以及序列重复。

发明内容

[0004] 本发明的目的在于针对现有技术的不足,提供一种新的快速高效的可应用于Illumina二代测序平台的基因组DNA的PCR-free测序文库制备方法。此方法不进行PCR扩增而直接制备成上机文库,可提高一些高GC或者高AT区域的覆盖度,从而减少了PCR引入的错误碱基、数据偏向以及序列重复。因此,此方法特别适用于高GC或者高AT含量的基因组DNA或者为了降低非模式生物DNA De novo测序中碱基错误率和序列重复的文库构建。
[0005] 本发明提供以下技术方案:
[0006] 本发明提供的基因组DNA的PCR-free测序文库制备方法具体流程为:具体包括以下步骤:
[0007] (1)对基因组DNA进行超声打断;
[0008] (2)对超声打断的片段进行纯化回收;
[0009] (3)利用NEB末端修复试剂对纯化产物进行末端修复;
[0010] (4)对末端修复产物进行纯化回收;
[0011] (5)利用NEB末端加A试剂对上述纯化产物进行DNA末端加A反应;
[0012] (6)对上述加A产物进行纯化回收;
[0013] (7)对上述纯化产物进行连接反应,本发明专利设计了多种兼容于Illumina二代测序仪的测序接头,接头序列含有标签(Index)序列,可同时对多个样品进行标记,接头引物合成采用HPLC,使用前需进行一定条件的处理;
[0014] 接头序列为:
[0015] P5(5’-3’):AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATC*T(SEQ ID No.1)
[0016] P7(5’-3’):/5’Pho/GATCGGAAGAGCACACGTCTGAACTCCAGTCACNNNNNNATCTCGTATGCCGTCTTCTGCTTG(SEQ ID No.2)其中P7引物序列种的六碱基序列NNNNNN代表标签(Index)序列,标签(Index)序列用于标记不同的样品,可以将带不同标签(Index)序列的样品构建混合文库;
[0017] (8)对连接产物进行片段筛选,回收产物即为测序文库;
[0018] (9)对文库进行质检和上机测序,检测测序文库的浓度和片段大小,利用Illumina公司的二代测序仪对浓度和片段大小符合要求的文库进行高通量测序;
[0019] 本发明利用New England BioLabs(NEB)公司的常规建库试剂,采用磁珠和切胶回收相结合的方法,对DNA建库流程进行了改进和优化。
[0020] 本发明设计了P5端DNA接头序列如SEQ ID No.1所示。
[0021] 本发明设计了长度为6bp独特的24个标签(Index)序列,标签(Index)序列分别插入DNA接头(SEQ ID No.2)中,形成24个P7接头,P7端DNA接头序列如SEQ ID No.3-SEQ ID No.26所示。单个P7接头分别与P5组合,共24对DNA PCR-free标签接头。每一对标签接头可以单独用于构建一种测序文库。
[0022] 本发明还提供了通过连接酶的催化作用,直接将标签(Index)序列与DNA接头连接,不需要经过PCR反应而成功构建DNA测序文库。
[0023] 本发明提供的构建基因组DNA的PCR-free测序文库的起始量为1μg-6μg之间。
[0024] 本发明提供的Covaris M220超声打断仪将起始DNA进行打断。根据需要打断的片段大小,调整相应的打断时间。打断范围为插入片段insert 300bp和insert 500bp两种,打断选用Covaris M220超声打断仪,打断参数依次是占空因数(Duty factor)设置为20%,峰值功率(Peak incident power)设置为50W,循环破碎系数(Cycles per burst)设置为200,工作温度设置为20℃;两种不同的打断范围insert 300bp打断持续时间70秒(sec),insert 500bp打断持续时间42sec,基因组DNA打断起始量为1μg-6μg之间,打断体系为130μL。
[0025] 本发明提供的多个纯化步骤中都用到磁珠进行纯化,磁珠选用AMpure XP Breads,纯化时磁珠用量均为1.6×(体积为所纯化的溶液体积的1.6倍),其中,步骤(2)也可选用PCR产物试剂盒(QIAGEN(货号Cat.no.28704))进行纯化回收。
[0026] 本发明提供的末端修复步骤采用采用NEB修复试剂,体系为修复试剂5μL,10×修复缓冲液试剂10μL,片段化DNA溶液85μL,总体系为100μL,修复条件为20℃,60分钟(min);4℃,终止(hold)。
[0027] 本发明提供的末端加A反应步骤采用NEB加A反应试剂,体系为10×加A反应缓冲液试剂5μL,克列诺片段(Klenow Fragment,3′→5′exo-)3μL,修复DNA溶液42μL,总体系50μL,连接条件为37℃,60min;4℃,hold。
[0028] 本发明提供的接头与DNA连接的反应体系,根据起始DNA的量调整连接体系中接头工作液的量:起始DNA量>5μg,加5μL接头液;起始DNA量2-5μg,加3μL接头工作液。同时,设计了不同含标签(Index)序列的特异接头引物(共24种),接头引物合成采用HPLC,接头引物配制时,先将上述P5和P7接头引物用无核酸(NFW)各自稀释成母液(浓度为100μM),再配制10×退火缓冲液(溶液终浓度100mM Tris-HCl,500mM NaCl,10mM EDTA,PH8.0),分别取P5和P7引物母液各9μL,再加入上述2μL 10×退火缓冲液中配制成接头工作液(20μL),然后在PCR仪器上进行退火,退火反应条件为:97.5℃,2min;6℃/min(每分钟降低6℃)至16℃;16℃,hold,-20度长期保存,下次使用时需重新退火,连接反应采用NEB加A反应试剂,体系为
10×T4DNA连接酶缓冲液5μL,加A连连接试剂23μL,接头工作液(浓度为45μM)5μL,连接增强试剂1.5μL,上述加A的DNA溶液54μL,总体系88.5μL,所述此处工作液加入量根据步骤(1)中DNA起始量进行调整,当步骤(1)中DNA起始量大于5ug,接头工作液可加5μL;当DNA起始量为
2-5μg之间可加3μL;当起始量小于2μg可加1.5μL,连接反应条件为20℃,120min;4℃,hold。
[0029] 本发明采用2%琼脂糖凝胶电泳分离不同片段大小的DNA,然后用胶回收的方法进行片段筛选。2%琼脂糖凝胶电泳条件为:120V,1.5小时(h)。根据需要的insert片段大小,切取相应范围的胶进行回收。所述的insert 300bp切取300-500bp之间,insert500bp切取500-700bp之间。
[0030] 本发明的文库质检用Qubit3.0对文库样品进行浓度检测、安捷伦2100核酸分析仪对片段范围进行检测和QPCR进行定量检测。
[0031] 采用上述技术方案后,与现有技术相比,本发明具有以下有益效果:
[0032] 1、适用性广;本发明适用于所有已知或者未知参考基因组的物种,可为一般普通分子生物学实验室采用。
[0033] 2、操作简单;本发明利用常规分子操作,设计兼容Illumina二代测序仪的特异接头,并采用磁珠和胶回收的方法得到范围比较集中的测序文库。
[0034] 3、性价高;本发明主要采用NEB公司的常规建库试剂,自建文库构建流程,使得单次建库成本极大降低。
[0035] 4、重复序列和碱基错误率少;本发明由于不需要经过PCR反应而成功构建成DNA测序文库,因此重复序列和碱基错误少。附图说明
[0036] 下面结合附图和实施例对本发明进一步说明:
[0037] 图1本发明的PCR-free文库建库流程示意图。左侧为实验流程图,右侧为文库序列信息,两侧信息对应。箭头代表流程实验方向。N代表碱基,“….”代表省略的碱基。P5和P7代表接头引物序列,圆圈代表磷酸化修饰位点,P7和P5引物经过处理形成Y型接头。
[0038] 图2是实施示例中PCR-free文库安捷伦2100核酸分析仪片段范围检测结果。纵轴(FU)表示峰值大小,横轴(bp)表示片段大小范围,两次峰值为参照峰,中间峰为样本检测峰。旁边附图电泳图,上下两条带为参照带,中间为样本检测带。
[0039] 图3是实施示例中混样文库qPCR浓度定量结果图。(A)为文库QPCR定量检测溶解曲线,图中对应的线条的为本实例中样本和标准品的溶解曲线。横轴(Tm)为退火温度,纵轴(-Rn)为标准化报告Rn的倒数。(B)为qPCR产物2%琼脂糖电泳图,左边为文库扩增后产物,M为100bp DNA ladder,从上到到下依次为1500bp、1000bp、900bp、800bp、700bp、600bp、500bp、
400bp、300bp、200bp、100bp。中间最亮带为500bp。
[0040] 图4是实施示例中Hiseq2500测序仪下机数据质量FastQC评估结果。纵轴轴代表Q值大小,横轴代表数据长度。Q20处为临界点,代表单个碱基测序质量正确率99%。具体实施例
[0041] 下面结合说明书附图和实施例,对本发明的具体实施例做进一步详细描述:
[0042] 这些实施例仅用于说明本发明而不用于限制本发明要求保护的范围,任何对本流程采用相似的策略而只是进行部分修改的内容也在本专利的保护范围。下列实施例中未注明具体实验条件和方法,实验条件和方法参照相关试剂说明书。
[0043] 实施示例 一个茄科灯笼草(DC)DNA PCR-free文库的制备。
[0044] 用上述茄科灯笼草(DC)DNA样品构建两种插入片段长度(即insert 300bp和insert 500bp)的PCR-free文库包括以下步骤:
[0045] 1.DNA样品超声打断。分别取两管DC样本的DNA,每管5μg起始量。用Covaris M220超声打断仪分别进行打断,打断体系为130μL。打断参数是:
[0046]
[0047] 2.对超声打断的片段进行纯化回收。纯化采用PCR产物试剂盒进行纯化回收,采用QIAGEN(货号Cat.no.28704),用无核酸水(NFW)进行洗脱,洗脱体积为85μL。
[0048] 3.利用NEB末端修复试剂对纯化产物进行末端修复。修复体系为(共100μL):
[0049] NEB修复试剂(货号#E7371)       5μL
[0050] 10×修复缓冲液(货号#E7372)    10μL
[0051] 回收DNA溶液                   85μL
[0052] 修复条件为:20℃,60min;4℃,终止(hold)。
[0053] 4.对末端修复产物进行纯化回收。纯化时采用AMpure XP Breads磁珠,磁珠用量为1.6×,即160μL,回收体系为42μL。
[0054] 5.利用NEB末端加A试剂(货号#E6053)对上述纯化产物进行DNA末端加A反应。反应体系为(共50μL):
[0055] 10×加A反应缓冲液试剂            5μL
[0056] Klenow Fragment(3′→5′exo-)      3μL
[0057] 上述修复DNA溶液                  42μL
[0058] 6.对上述加A产物进行纯化回收。纯化时采用AMpure XP Breads磁珠,磁珠用量为1.6×,即90μL,回收体系为54μL。
[0059] 7.对上述纯化产物进行连接反应。本步骤可分为以下三个小步骤:
[0060] (1)配制接头工作液:先将P5(序列为SEQ ID No.1)和P7接头(序列为SEQ ID No.3)用无核酸水(NFW)各自稀释成母液(100μL),再配制10×退火缓冲液(100mM Tris-HCl,500mM NaCl,10mM EDTA,PH8.0)。接头工作液(共45μL)包括:
[0061]
[0062] (2)退火:在PCR仪器上进行97.5度,2min;6℃/min(每分钟降低6℃)至16℃;16℃,hold。-20度长期保存,下次使用时需重新退火一次。
[0063] (3)连接反应:采用NEB快速连接反应试剂(货号NEB#E7373),体系(共88.5μL)为:
[0064]
[0065]
[0066] 盖紧盖子后,在震荡仪瞬时震荡3s,小离心机上快速离心5s,在PCR上20℃,120min,4℃ hold。
[0067] 8.用2%琼脂糖凝胶电泳对连接产物进行片段筛选,电泳条件为:120V,1.5小时(h)。采用胶回收的方法进行片段筛选。insert 300bp切取300-500bp之间的片段进行回收,insert 500bp切取500-700bp之间的片段,胶回收两种片段的文库洗脱均为15μL。回收产物即为测序文库。
[0068] 9.质检和上机测序。文库质检用Qubit3.0对文库样品进行浓度检测、安捷伦2100核酸分析仪对片段范围进行检测(图2)和QPCR进行定量检测(图3)。将浓度和片段大小符合要求的文库利用Illumina公司的二代测序仪进行高通量测序。下机数据用FastQC软件进行数据质量和GC含量分析,重复序列(duplication)用Bowtie2.0软件进行分析,重复数据仅占极少部分。
[0069] 申请人文库制备结果表明本方法发明能够制备种一种基因组DNA PCR-free测序文库的制备方法,可以进行后续的高通量测序,测序数据也可用后续分析。据此,本发明专利普遍适于常规分子生物学实验室进行高GC、高AT含量的基因组DNA或者为了减少测序中碱基错误率和序列重复的文库构建。
[0070] 以上所述,仅是本发明的较佳实施例而已,并非对本发明的技术范围作出任何限制,故凡是依据本发明的技术实质对以上实施例所作的任何细微修改、等同变化与修饰,均仍属于本发明的技术方案范围内。
QQ群二维码
意见反馈