一种基因组混样测序文库的制备方法

申请号 CN201610108049.8 申请日 2016-02-26 公开(公告)号 CN105671644A 公开(公告)日 2016-06-15
申请人 武汉冰港生物科技有限公司; 发明人 张洪源; 郑媛坤; 束礼平; 杨冰; 范艺翔; 王宇峰; 何银竹; 束礼伟; 黄刚; 董扬;
摘要 本 发明 涉及分子 生物 学技术领域,公开了一种基因组混样测序文库的制备方法,包含下述步骤:(1)基因组DNA 超 声波 打断;(2)打断产物进行纯化和末端修复;(3)修复产物进行纯化和接头连接;(4)连接产物纯化回收和浓度测定;(5)混样和 片段 筛选;(6)片段筛选后的产物进行PCR扩增;(7)纯化PCR产物,得到测序文库;(8)文库质检和上机测序。本发明提供了上述步骤(2)中兼容于Illumina二代测序仪的接头、步骤(2)(3)(4)(7)中对产物进行纯化的方法、步骤(4)中混样的方法以及步骤(6)中PCR扩增体系及程序设置,保证了本发明所提供的建库方法能够快速顺利的进行多个样本混样建库,利用本发明所提供的方法可得到数据均一度好和 质量 较高的测序数据。
权利要求

1.一种基因组混样测序文库的制备方法,包括以下步骤:
(1)对需要混样测序样品的基因组DNA进行超声打断,打断的插入片段为350bp;
(2)对超声打断的片段进行纯化,利用NEB末端修复试剂对纯化产物进行末端修复;
(3)对末端修复产物进行纯化,利用特异的含不同标签(Barcode)接头序列分别对纯化产物进行连接反应,连接试剂采用NEB快速连接试剂;
接头的序列如下:
P5-P7-F(5’-3’):ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNN*T
P5-P7-R(5’-3’):/5Phos/YYYYYAGATCGGAAGAGCACACGTCTGAACTCCAGTC
其中,设计的P5-P7-R引物中的五基序列YYYYY与P5-P7-F引物中的五碱基序列NNNNN反向互补,其中NNNNN代表标签(Barcode)序列(表1),主要用于标记混样各个样本;
(4)对上述连接产物进行纯化,对后续需要混样的纯化产物逐一进行浓度测定;
(5)参照上述纯化产物的浓度和总量,依据所测样本的测序量对纯化产物进行混合,混合后进行片段筛选,片段筛选采用琼脂糖电泳和切胶回收的方法;
(6)利用含索引(Index)序列的PCR引物对上述的回收片段进行PCR扩增,PCR产物利用
1.6倍体积的磁珠纯化两次,纯化后的产物即为测序文库;
PCR引物序列为:
F(5’-3’):AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATC,R(5’-3’):CAAGCAGAAGACGGCATACGAGATNNNNNNGTGACTGGAGTTCAGACGTGTGCTCTTCCGATC,其中,PCR引物R序列中的NNNNNN代表索引(Index)序列,索引用于标记不同的混样文库,不同混样文库选用不同的索引(Index)引物;
(7)纯化PCR产物进行纯化回收即可得到测序文库;
(8)对上述测序文库进行浓度和片段大小范围检测;将文库浓度将检测合格后的文库利用Illumina公司的二代测序仪进行高通量测序。
2.根据权利要求1所述的一种基因组混样测序文库的制备方法,其特征在于:所述步骤(1)中,打断范围为插入片段350bp,可选用超声打断仪Covaris M220,占空因数(Duty factor 20%),峰值功率(Peak incident power,50W),循环破碎系数(Cycles per burst,
200),持续时间65秒,工作温度20度(℃),不同的样品的基因组DNA的起始量相同,起始量为
100~500ng之间,打断体系为50μL。
3.根据权利要求1所述的一种基因组混样测序文库的制备方法,其特征在于:所述步骤(2)中,采用NEB修复试剂,体系为修复试剂0.75μl,10倍浓度(10×)的修复缓冲液2μL,片段DNA溶液17.25μL,总体系为20μL,修复条件为20度℃,60分钟(min);65℃,30min;4℃,终止(hold)。
4.根据权利要求1所述的一种基因组混样测序文库的制备方法,其特征在于:所述步骤(3)中,设计了不同标签(Barcode)的特异接头引物(共10种,表1),采用NEB连接反应试剂,体系为10×T4DNA连接酶缓冲液2μL,加A连连接液3.75μL,接头(浓度为15μM)1μL,连接增强液0.25μL,修复DNA溶液18μL,总体系25μL,连接条件为20℃,90min;4度,hold。
5.根据权利要求1所述的一种基因组混样测序文库的制备方法,其特征在于:所述步骤(5)中,混样根据每个需要测量大小来确定,若所测数据量相同,可进行等量混合;电泳条件为2%琼脂糖凝胶电泳,电泳条件为120V,1.5小时(h),切取350-500bp之间的片段进行回收。
6.根据权利要求1所述的一种基因组混样测序文库的制备方法,其特征在于:所述步骤(6)中,采用NEB高保真热启动酶试剂,PCR扩增体系为正反向引物(浓度10μM)各取1μL,混样DNA溶液23μL,PCR扩增溶液(Mix)25μL,总体系50μL,反向引物(R)设计了12种索引(Index)序列;扩增条件为98℃,30秒(sec);98℃,10sec,65℃,30sec,72℃,30sec,8-12循环(cycles);75℃,5min;4℃,Hold。
7.根据权利要求1所述的一种基因组混样测序文库的制备方法,其特征在于:步骤(2)、(3)、(4)和(7)中的纯化为用磁珠进行纯化,纯化时磁珠用量 均为1.6×(体积为所纯化溶液的1.6倍);
表1.标签(Barcode)和索引(Index)信息表
标签编号 标签序列 索引编号 索引序列 索引编号 索引序列
标签1 CTGTA 索引1 CGTGAT 索引11 GTAGCC
标签2 TAACG 索引2 ACATCG 索引12 TACAAG
标签3 AGCAT 索引3 GCCTAA    
标签4 GCAGC 索引4 TGGTCA    
标签5 AGTAC 索引5 CACTGT    
标签6 TCGCA 索引6 ATTGGC    
标签7 GACTG 索引7 GATCTG    
标签8 CTAGT 索引8 TCAAGT    
标签9 GACTC 索引9 CTGATC    
标签10 CTCAG 索引10 AAGCTA    

说明书全文

一种基因组混样测序文库的制备方法

技术领域

[0001] 本发明涉及分子生物学中高通量测序技术的领域。更具体涉及一种基因组混样测序文库的制备方法,它适用于所有真核生物各种样本的重测序或者简化测序,尤其适用于小基因多样本数的重测序或者大基因群体的简化测序。

背景技术

[0002] 二代测序技术是目前现高通量测序研究中最常用的技术。DNA测序技术经过30多年的发展已经取得重大进展,以高通量为特点的第二代测序技术已经逐步成熟并且商业化。早期的测序技术主要依赖第一代测序,一代测序从传统的化学降解法、双脱链终止法以及在它们的基础上发展来的各种DNA测序技术统称为第一代DNA测序技术,其中Sanger法因操作简便,对单个序列检测较快且准确率较高,目前仍得到广泛的应用。第一代测序技术在分子生物学研究中发挥过重要的作用,如人类基因组计划(Human Genome Project,HGP)主要基于第一代DNA测序技术完成。但随着人类基因组计划以及其他模式生物的测序工作的完成,我们进入了后基因组时代即功能基因组时代,传统的一代测序方法已经不能满足深度测序和重测序等大规模基因组高通量测序的需求,因此,人类发展出来第二代测序技术。
[0003] 第二代测序技术主要包括罗氏454公司的GS FLX测序平台、ABI公司的SOLiD测序平台和Illumina公司的Solexa Genome Analyzer测序平台以及Solexa的升级版Hiseq测序平台等。第二代测序技术最显著的特征是高通量,一次能对几十万到几百万条DNA分子序列进行测序,使得对一个物种的转录组测序或基因组深度测序变得方便易行。第二代测序技术的主要原理是先将的基因组DNA进行片段化,在两侧加上各自特异的接头,随后用不同的方法产生几百万个空间固定的PCR克隆阵列,然后进行引物杂交和酶延伸反应,对每个延伸反应所掺入的荧光标记进行成像检测就可获取测序数据。454测序的特点是单次读长长大,但单次反应的数据量低。SOLiD测序读长为50bp,单次反应的数据量50G,特点是高通量和高准确度,但成本较高。而Illumina公司的Solexa测序读长为双端读长2×50bp,单次反应的数据量20G,测序成本较低,性价比高。Solexa的升级版Hiseq和桌面式测序仪Miseq以及Nextseq经过近几年的一系列版本的 发展,测序通量一致在不断提高,其中Hiseq从早期Hiseq1000和Hiseq2000已经发展到目前的Hiseq2500和Hisq3000/4000等,Hiseq测序平台单次反应可以产生的数据量由300-600G已提升到1.5Tb,双端读长也有50bp提升到了150bp,极大的提升了测序通量,同时降低了测序价格,使得1000美金测一个人类基因组成为了可能。
[0004] 随着测序技术的发展,测序仪的通量也会随之上升,测序价格也相应降低,大规模多样本数的基因重测序也已实现。但对于一些小基因组,例如真菌基因组大小约2.5~81.15Mb和细胞器基因组如叶绿体基因组大小为120K~217K等,当测序样本数较多时,测序数据量若小于2G时,若对单个文库建单独建库测序,单个样本文库的构建成本将超过其测序成本。本发明专利基于Illumina公司第二代测序平台,设计了含有新的标签(Barcode)序列的接头和含索引(Index)序列的PCR引物,结合New England BioLabs(NEB)公司的建库试剂,并对建库流程进行改进和优化,设计了一种对多个样本同时构建的混合建库方法,节约了建库成本,同时也提高了建库效率。

发明内容

[0005] 本发明的目的在于提供了一种基因组混样测序文库的制备方法,我们将设计了多对含有标签(Barcode)序列的接头和含索引(Index)序列的PCR引物对每种打断后的DNA片段进行标记混样和文库构建,这种方式节约了建库试剂,提高了建库的效率。此外,本发明专利设计兼容Illumina二代测序仪特异的接头连接后为双端标签(Barcode),增强了接头互补基数,提高了连接效率,可对样品进行精确标记。本发明普遍适于常规分子生物学实验室进行各种样本的重测序或者简化测序,尤其适用于小基因多样本数的重测序或者大基因群体的简化测序。
[0006] 为了实现上述的目的,本发明采用以下技术方案:
[0007] 上述种基因组混样测序文库的制备方法的具体流程为:利用超声破碎的方法,分别对每种基因组DNA进行打断,打断后的片段进行磁珠纯化,将设计特异的引物制备成接头(含标签序列)对上述纯化产物进行连接;分别将连接后的产物进行纯化和浓度测定,然后依据所测的每种样本的数据量进行混样;混样后的产物进行片段筛选,回收筛选后的片段利用含索引(Index)序列的引物进行PCR扩增;对PCR产物进行纯化,纯化后的产物即为上机文库,然后对文库浓度和片 段范围进行检测;最终将检测合格后的文库利用Illumina公司的二代测序仪进行上机测序。
[0008] 1、一种基因组混样测序文库的制备方法,其流程示意图如图1所示,具体包括以下步骤:
[0009] (1)对需要混样测序样品的基因组DNA进行超声打断,打断的插入片段为350bp。
[0010] (2)对超声打断的片段进行纯化,利用NEB末端修复试剂对纯化产物进行末端修复。
[0011] (3)对末端修复产物进行纯化,利用特异的含不同标签(Barcode)接头序列分别对纯化产物进行连接反应,连接试剂采用NEB快速连接试剂。
[0012] 接头的序列如下:
[0013] P5-P7-F(5’-3’):ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNN*T
[0014] P5-P7-R(5’-3’):/5Phos/YYYYYAGATCGGAAGAGCACACGTCTGAACTCCAGTC[0015] 其中,设计的P5-P7-R引物中的五碱基序列YYYYY与P5-P7-F引物中的五碱基序列NNNNN反向互补,其中NNNNN代表标签序列,主要用于标记混样各个样本,标签序列见下表1。此外,/5Phos/代表5’端起始碱基为磷酸基团(-PH3)修饰,*代表硫代磷酸酯化修饰。
[0016] (4)对上述连接产物进行纯化,对后续需要混样的纯化产物逐一进行浓度测定。
[0017] (5)参照上述纯化产物的浓度和总量,依据所测样本的测序量对纯化产物进行混合,混合后进行片段筛选。片段筛选采用琼脂糖电泳和切胶回收的方法。
[0018] (6)利用含索引(Index)序列的PCR引物对上述的回收片段进行PCR扩增,PCR产物利用1.6倍体积的磁珠纯化两次,纯化后的产物即为测序文库。
[0019] PCR引物序列为:
[0020] F(5’-3’):AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATC,[0021] R(5’-3’):CAAGCAGAAGACGGCATACGAGATNNNNNNGTGACTGGAGTTCAGACGTGTGCTCTTCCGATC。
[0022] 其中,PCR引物R序列中的NNNNNN代表索引(Index)序列,索引用于标记不同的混样文库,不同混样文库选用不同的索引(Index)引物。本发明总共设计了12种不同索引(Index)接头引物,索引(Index)信息见表1。
[0023] (7)纯化PCR产物进行纯化回收即可得到测序文库。
[0024] (8)对上述测序文库进行浓度和片段大小范围检测。将文库浓度将检测合格后的文库利用Illumina公司的二代测序仪进行高通量测序。
[0025] 优选的,如步骤(1)中,打断范围为插入片段350bp,可选用超声打断仪Covaris M220,占空因数(Duty factor 20%),峰值功率(Peak incident power,50W),循环破碎系数(Cycles per burst,200),持续时间65秒,工作温度20度(℃)。不同的样品的基因组DNA的起始量相同,起始量为100~500ng之间,打断体系为50μL。
[0026] 优选的,如步骤(2)中,采用NEB修复试剂,体系为修复试剂0.75μl,10倍浓度(10×)的修复缓冲液2μL,片段DNA溶液17.25μL,总体系为20μL。修复条件为20度℃,60分钟(min);65℃,30min;4℃,终止(hold)。
[0027] 优选的,如步骤(3)中,设计了不同标签(Barcode)的特异接头引物(共10种,表1),采用NEB连接反应试剂,体系为10×T4DNA连接酶缓冲液2μL,加A连连接液3.75μL,接头(浓度为15μM)1μL,连接增强液0.25μL,修复DNA溶液18μL,总体系25μL。连接条件为20℃,90min;4度,hold。
[0028] 进一步的说,如步骤(5)中,混样根据每个需要测量大小来确定,若所测数据量相同,可进行等量混合,电泳条件为2%琼脂糖凝胶电泳,电泳条件为120V,1.5小时(h)。
[0029] 进一步的说,如步骤(6)中,采用NEB高保真热启动酶试剂,PCR扩增体系为正反向引物(浓度10μM)各取1μL,混样DNA溶液23μL,PCR扩增溶液(Mix)25μL,总体系50μL。反向引物(R)设计了12种索引(Index)序列。扩增条件为98℃,30秒(sec);98℃,10sec,65℃,30sec,72℃,30sec,8-12循环(cycles);75℃,5min;4℃,Hold。
[0030] 更进一步的说,如步骤(2)、(3)、(4)和(7)中的纯化为用磁珠进行纯化,纯化时磁珠用量均为1.6×(体积为所纯化溶液的1.6倍)。
[0031] 表1.Barcode和Index信息表
[0032]标签编号 标签序列 索引编号 索引序列
标签1 CTGTA 索引1 CGTGAT
标签2 TAACG 索引2 ACATCG
标签3 AGCAT 索引3 GCCTAA
标签4 GCAGC 索引4 TGGTCA
标签5 AGTAC 索引5 CACTGT
标签6 TCGCA 索引6 ATTGGC
标签7 GACTG 索引7 GATCTG
标签8 CTAGT 索引8 TCAAGT
标签9 GACTC 索引9 CTGATC
标签10 CTCAG 索引10 AAGCTA
    索引11 GTAGCC
    索引12 TACAAG
[0033] 本发明的一种基因组混样测序文库的制备方法主要是基于Illumina高通量测序平台,是大规模重测序中性价比最高和最为切实可行的策略之一。本发明中设计了10种标签序列的接头,单次最多可建一个混合了10个样本的混样池,实际情况可对样本数目进行调整,一般下情况2-4个样本混成一个池进行文库构建较为切实可行。其次本发明专利设计兼容Illumina二代测序仪特异的接头为双端标签(Barcode),提高了接头连接效率,可对样品进行精确标记。另外,我们还设计了12种索引序列的PCR引物,可以同时构建12个混样文库。因此本方法最高可同时建120个样本(10个Barcode×12个Index)的混样文库,极大的节约了建库成本,提高建库效率。
[0034] 采用上述技术方案后,与现有技术相比,本发明具有以下有益效果:
[0035] 1、适用性广。本发明适用于所有已知或者未知参考基因组的真核生物物种,可为一般普通分子生物学实验室采用。
[0036] 2、高通量。本发明利用常规分子操作,设计兼容Illumina二代测序仪特异的接头和PCR引物,极大的提高了检测样本数。
[0037] 3、数据提取率高。本发明专利设计兼容Illumina二代测序仪特异的接头,接头连接后为双端标签(Barcode),提高了接头连接效率,可对样品进行精确标记,后续下机后数据分装成不同样品对应的数据时提取率高。
[0038] 4、性价高。本发明采用NEB公司性价比高的建库试剂,对建库流程进行了改进和优化,使得单次建库成本极大降低,若四个样进行混合构建,将节省75%的建库成本附图说明
[0039] 下面结合附图和实施例对本发明进一步说明:
[0040] 图1是混样建库流程示意图。左侧为实验流程,右侧为具体文库序列信息,两边信息相对应。箭头指示为实验流程方向,“。。。”指其他样本,混样样品数可根据实际情况进行调整。
[0041] 图2是实施示例中混样文库安捷伦2100核酸分析仪片段范围检测结果。左侧图纵轴(FU)表示峰值大小,横轴(bp)表示片段大小范围,两次峰值为参照峰,中间峰为样本检测峰。右侧图为电泳图,上下两条带为参照带,中间为样本检测带。
[0042] 图3是实施示例中混样文库qPCR浓度定量结果。(A)为文库QPCR定量检测溶解曲线,图中对应的线条的为本实例中样本和标准品的溶解曲线。横轴(Tm)为退火温度,纵轴(-Rn)为标准化报告Rn的倒数。(B)为qPCR产物2%琼脂糖电泳跑胶图,图中左边为文库扩增后产物孔道,右侧为DNA maker(M)。M为100bp DNA ladder,从上到到下依次为1500bp、1000bp、900bp、800bp、700bp、600bp、500bp、400bp、300bp、200bp、100bp。中间最亮带为
500bp。
[0043] 图4是实施示例中Hiseq2500测序仪下机数据质量结果图。(A)为测序数据过滤后结果,纵轴表示数量(M),横轴代表四个样本信息,每个样本左侧柱代表原始数据量,右侧柱代表过滤后数据量。(B)为FastQC数据质量评估结果,纵轴轴代表Q值大小,横轴代表数据长度。Q20处为高质量临界点处,此处代表单个碱基测序质量正确率为99%。

具体实施方式

[0044] 下面结合说明书附图和实施例,对本发明的具体实施例做进一步详细描述:
[0045] 下面结合具体实施例,进一步阐述本方法发明。这些实施例仅用于说明本发明而不用于限制本发明要求保护的范围。下列实施例中未注明具体实验条件和方法,实验条件和方法参照相关试剂说明书或者《分子克隆实验指南》(第3版)(J.萨姆布鲁克,D.W.拉塞尔主编,2008出版)。
[0046] 实施示例 四个茄科灯笼草(DC)样本混样测序文库的制备。
[0047] 表2.混样文库制备中样本、标签序列和索引序列信息表
[0048]
[0049] 四个样本分别采用四种标签序列,混样后用同一个含索引物建成一个混样文库。
[0050] 四个茄科灯笼草(DC)样本混样测序文库的制备包括以下步骤:
[0051] (1)DNA样品的提取和超声打断。利用2×CTAB提取液提取4个灯笼草叶片组织的基因组DNA。经液氮研磨、进行酚/氯仿(体积比1:1)抽提、异丙醇沉淀、75%乙醇洗涤和RNA酶处理等步骤后,将DNA溶于50μL TE溶液,Qubit2.0测定浓度。分别取四种样本的DNA,分别取500ng进行超声打断,打断体系为50μL,打断范围为插入片段350bp,可选用超声打断仪Covaris M220,占空因数(duty factor 20%),峰值功率(peak incident power,50W),循环破碎系数(Cycles per burst,200),持续时间65sec,工作温度20℃。
[0052] (2)纯化和修复反应。对上述超声打断的片段进行纯化,纯化时采用AMpure XP Breads磁珠,磁珠用量为1.6×,即90μL,回收体系为17.25μL。利用NEB末端修复试剂对纯化产物进行末端修复,NEB修复试剂(货号#E7371)和修复缓冲液(货号#E7372),体系为修复试剂0.75μl,10×修复缓冲液2μL,回收DNA溶液17.25μL,总体系为20μL。修复条件为20℃,60min;65℃,30min;4℃,终止(hold)。
[0053] (3)纯化和接头连接反应。对上述修复反应体系进行纯化,纯化时采用AMpure XP Breads磁珠,磁珠用量为1.6×,即32μL,回收体系为18μL。利 用特异的含不同标签(Barcode)接头序列分别对纯化产物进行连接反应,接头信息对应表2。连接试剂采用NEB快速连接反应试剂(货号NEB#E7373)、10×T4DNA连接酶缓冲液(货号NEB#B8001)和连接增强液(货号NEB#E7374)。体系为10×T4DNA连接酶缓冲液2μL,加A快速连接反应试剂3.75μL,接头(浓度为15μM)1μL,连接增强液0.25μL,DNA修复溶液18μL,总体系25μL。连接条件为20℃,90min;4度,hold。
[0054] 接头的序列如下:
[0055] P5-P7-F(5’-3’):ACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNN*T
[0056] P5-P7-R(5’-3’):/5Phos/YYYYYAGATCGGAAGAGCACACGTCTGAACTCCA GTC[0057] 其中,设计的P5-P7-R引物中的五碱基序列YYYYY与P5-P7-F引物中的五碱基序列NNNNN反向互补,其中NNNNN代表标签序列,主要用于标记混样各个样本,接头的标签序列见表2。此外,/5Phos/代表5’端起始碱基为磷酸基团(-PH3)修饰,*代表硫代磷酸酯化修饰。引物序列合成后采用HPLC纯化。
[0058] (4)纯化和浓度测定。对上述连接产物进行纯化,对后续需要混样的纯化产物逐一进行浓度测定。片段纯化时加入40μl AMpure XP breads(1.6X),洗脱体积15μl,取1μl进行Qubit2.0测定浓度,剩余14μl进行后续混样。测定的浓度分别对应DC-1为21.2ng/μl,DC-2为25.7ng/μl,DC-3为18.6ng/μl,DC-4为28.3ng/μl。
[0059] (5)纯化、混样和片段筛选。参照上述纯化产物的浓度和总量,依据所测样本的测序量(1G)对纯化产物进行等量混合,每个样本均取250ng进行等量混合。DC-1取11.79μl,DC-2取9.73μl,DC-3取13.44μl,DC-4取8.83μl。混合后进行片段筛选。片段筛选采用2%的琼脂糖电泳,电泳条件为120V,1.5小时(h),切取350-500bp之间的片段进行胶回收,胶回收采用QIAquick胶回收试剂盒(货号cat.No28606),洗脱体积为23μl。
[0060] (6)PCR扩增。利用设计的含索引(Index)序列的PCR引物对上述的回收液进行PCR扩增,采用NEB高保真热启动酶试剂(货号NEB#E7374),PCR扩增体系为正反向引物(浓度10μM)各取1μL,上述混样回收后的DNA溶液23μL,PCR扩增溶液(Mix)25μL,总体系50μL。扩增条件为98℃,30秒(sec);98℃,10sec,65℃,30sec,72℃,30sec,10循环(cycles);75℃,5min;4℃, Hold。
[0061] PCR引物序列为:
[0062] F(5’-3’):AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATC[0063] R(5’-3’):CAAGCAGAAGACGGCATACGAGATNNNNNNGTGACTGGAGTTCAGACGTGTGCTCTTCCGATC[0064] 其中,PCR引物R序列中的NNNNNN代表索引(Index)序列,索引用于标记不同的混样文库,不同混样文库选用不同的索引(Index)引物。本实施例1中的索引(Index)信息见表2。引物序列合成后采用HPLC纯化。
[0065] (7)PCR产物纯化。PCR产物进行纯化回收后即为测序文库。纯化时采用AMpure XP Breads磁珠,磁珠用量为1.6×,即80μL,纯化两次。最终的回收体系为15μL。
[0066] (8)文库质检和上机测序。对上述测序文库进行浓度和片段大小范围检测。浓度>2.0ng/μL、片段范围300-550bp之间和QPCR检测后无二聚体接头污染的文库可进行后续上机测序。文库浓度检测采用Qubit2.0,本实例中混样文库Qubti2.0检测浓度为4.68ng/μL,安捷伦2100核酸分析仪检测显示片段范围为350-550bp之间(图2),QPCR进行绝对定量浓度为16.61nM,QPCR产物用2%琼脂糖电泳检测片段范围主带在300-500之间且无二聚体污染(图3)。文库利用Illumina公司的二代测序仪Hisq2500进行双端(PE125)高通量测序,设定混样文库测序数据量为4G,其中每个样本理论的测序数据量为1G,而实际测序数据量数据总量是4.53G,其中DC-1为0.86G、DC-2为1.28G、DC-3为1.00G和DC-4为1.39G(表3),各样本数据偏移在可控范围内(图4),且可用过滤后的数据(clean date)大于99%(表3),测序数据质量Q20达到了100%(图4)。
[0067] 表3.测序下机后混样文库测序数据量及过滤后数据量结果
[0068]
[0069]
[0070] 申请人文库制备结果表明本方法发明能够制备出多个样本的混样测序文库,混样文库可以进行后续的高通量测序,测序下机数据也可于用后续生物信息学分析。据此,本发明专利普遍适于常规分子生物学实验室进行大规模样本的重测序或者简化测序,尤其适用于小基因多样本数的重测序或者大基因群体的简化测序。改进后的文库制备流程成本极大降低,因而本方法发明在同领域中具有极高的性价比。
[0071] 以上所述,仅是本发明的较佳实施例而已,并非对发明的技术范围作出任何限制,故凡是依据本发明的技术实质对以上实施例所作的任何细微修改、等同变化与修饰,均仍属于本发明的技术方案范围内。
QQ群二维码
意见反馈