一种构建测序用DNA文库的方法

申请号 CN201511028398.0 申请日 2015-12-30 公开(公告)号 CN105401222A 公开(公告)日 2016-03-16
申请人 安诺优达基因科技(北京)有限公司; 发明人 玄兆伶; 王占东; 李大为; 梁峻彬; 陈重建;
摘要 本 发明 涉及一种构建测序用DNA文库的方法、测序用DNA文库以及测序方法。采用构建测序用DNA文库的方法,通过利用全新设计的标签接头,能够在对大数目量样本的混合测序中,实现由每个样本进行一个PCR的扩增反应变成多个样本共用一个PCR反应,从而减少文库构建 试剂 用量、降低测序人工成本。
权利要求

1.一种构建测序用DNA文库的方法,其包括:
步骤A:分别将希望进行测序的多个样本中的DNA片段进行末端修复,得到多组平末端DNA片段;
步骤B:分别将所述多组平末端DNA片段进行3'端加A,得到多组3'端加A的DNA片段;
步骤C:分别将所述多组3'端加A的DNA片段进行加接头,得到多组加接头DNA片段;
步骤D:将所述多组加接头DNA片段混合,得到混合物;以及
步骤E:将所述混合物进行PCR扩增,得到扩增产物;
其中,所述步骤C中,对于每一组3'端加A的DNA片段,使用一个标签接头组进行加接头,所述标签接头组由一个i5标签接头和一个i7标签接头组成,所述i5标签接头含有选自SEQ ID NO:1~380中的标签,所述i7标签接头含有选自SEQ ID NO:1~380中的标签;
且对于每一组3'端加A的DNA片段,使用不同的标签接头组。
2.根据权利要求1所述的方法,其中,所述多组加接头DNA片段为97组以上。
3.一种测序用DNA文库,其是采用权利要求1或2所述的构建测序用DNA文库的方法构建的。
4.一种测序方法,其中,以权利要求3所述的测序用DNA文库作为对象进行测序。
5.根据权利要求4所述的测序方法,其中,所述测序利用Illumina平台进行。

说明书全文

一种构建测序用DNA文库的方法

技术领域

[0001] 本发明属于分子生物学领域,具体涉及构建测序用DNA文库的方法、以及该构建测序用DNA文库的方法在二代测序中的应用。

背景技术

[0002] 目前二代测序已经能够根据研究需求,应用于多个研究领域,比如基因组测序、外显子测序、转录组测序、表观基因组测序、染色体三维结构测序等。二代测序的主流平台一般均采用边合成边测序(Sequencing By Synthesis,SBS)技术进行核酸测序。测序前,需要对核酸(DNA或RNA)样本进行测序文库的构建,基本流程如下:首先将片段化后的DNA进行片段的末端修复,之后在修复后的片段3'端加“A”基,然后将上述DNA片段与含有测序引物结合位点的DNA接头(Adapter)连接,最后通过PCR进行扩增,完成测序文库构建。
[0003] 在传统的建库及测序方法中,是每个样本进行一个PCR反应,然后再将这些PCR扩增产物混合进行测序。例如,基于上述的建库及测序方法,Illumina公司推出了DNA标签(或称为Index、Barcode)建库方法和相应的文库构建试剂盒,例如 DNA Kit、DNA PCR-Free Kit、 Stranded RNA LT等。在基于这些试剂盒的建库及测序方法中,在测序前将不同标签标记的样本文库进行混合然后测序,测序完成后将测序数据按照标签序列将样本数据进行区分。这样的建库及测序方法无疑会增加PCR反应试剂成本和人工成本。

发明内容

[0004] 鉴于上述现有技术中存在的不足,本发明的目的在于提供一种能够减少文库构建试剂用量、降低测序人工成本的测序用文库构建方法,及该测序用文库构建方法在二代测序中的应用。
[0005] 本发明的发明人为解决上述技术问题进行了深入研究,结果发现:通过使用本发明人设计的标签接头,能够实现由每个样本进行一个PCR扩增反应变成多个样本共用一个PCR扩增反应,从而减少文库构建试剂用量、降低测序人工成本。
[0006] 即,本发明包括:
[0007] 1.一种构建测序用DNA文库的方法,其包括:
[0008] 步骤A:分别将希望进行测序的多个样本中的DNA片段进行末端修复,得到多组平末端DNA片段;
[0009] 步骤B:分别将所述多组平末端DNA片段进行3'端加A,得到多组3'端加A的DNA片段;
[0010] 步骤C:分别将所述多组3'端加A的DNA片段进行加接头,得到多组加接头DNA片段;
[0011] 步骤D:将所述多组加接头DNA片段混合,得到混合物;以及
[0012] 步骤E:将所述混合物进行PCR扩增,得到扩增产物;
[0013] 其中,所述步骤C中,对于每一组3'端加A的DNA片段,使用一个标签接头组进行加接头,所述标签接头组由一个i5标签接头和一个i7标签接头组成,所述i5标签接头含有选自SEQ ID NO:1~380中的标签,所述i7标签接头含有选自SEQ ID NO:1~380中的标签;且对于每一组3'端加A的DNA片段,使用不同的标签接头组。
[0014] 2.根据项1所述的方法,其中,所述多组加接头DNA片段为97组以上。
[0015] 3.一种测序用DNA文库,其是采用项1或2所述的构建测序用DNA文库的方法构建的。
[0016] 4.一种测序方法,其中,以项3所述的测序用DNA文库作为对象进行测序。
[0017] 5.根据项4所述的测序方法,其中,所述测序利用Illumina平台进行。发明效果[0018] 根据本发明,通过使用本发明人设计的标签接头,能够实现由每个样本进行一个PCR扩增反应变成多个样本共用一个PCR扩增反应,从而减少文库构建试剂用量、降低测序人工成本。
[0019] 发明的具体实施方式
[0020] 本说明书中提及的科技术语具有与本领域技术人员通常理解的含义相同的含义,如有冲突以本说明书中的定义为准。
[0021] 首先,在一个方面中,本发明提供一种构建测序用DNA文库的方法,其包括:
[0022] 步骤A:分别将希望进行测序的多个样本中的DNA片段进行末端修复,得到多组平末端DNA片段;
[0023] 步骤B:分别将所述多组平末端DNA片段进行3'端加A,得到多组3'端加A的DNA片段;
[0024] 步骤C:分别将所述多组3'端加A的DNA片段进行加接头,得到多组加接头DNA片段;
[0025] 步骤D:将所述多组加接头DNA片段混合,得到混合物;以及
[0026] 步骤E:将所述混合物进行PCR扩增,得到扩增产物;
[0027] 其中,所述步骤C中,对于每一组3'端加A的DNA片段,使用一个标签接头组进行加接头,所述标签接头组由一个i5标签接头和一个i7标签接头组成,所述i5标签接头含有选自SEQ ID NO:1~380中的标签,所述i7标签接头含有选自SEQ ID NO:1~380中的标签;且对于每一组3'端加A的DNA片段,使用不同的标签接头组。
[0028]
[0029]
[0030]
[0031]
[0032]
[0033]
[0034]
[0035]
[0036]
[0037]
[0038]
[0039]
[0040]
[0041]
[0042]
[0043]
[0044]
[0045]
[0046]
[0047]
[0048]
[0049]
[0050]
[0051]
[0052] 在本说明书中,为了记述方便,将SEQ ID NO:1~380中的标签依次称作标签1~380,相应的i5标签接头称作i5标签接头1~380,相应的i7标签接头称作i7标签接头
1~380。
[0053] 所述i5标签接头是在所述标签1~380的5'端加上用于与测序芯片上的序列匹配的DNA序列、且在3'端加上用于与测序引物及标签测序引物匹配的DNA序列而构成的。所述i7标签接头是在所述标签1~380的5'端加上用于与测序芯片上的序列匹配的DNA序列、且在3'端加上用于与测序引物及标签引物匹配的DNA序列而构成的。
[0054] 一个标签接头组由一个i5标签接头和一个i7标签接头组成。本发明中,对于每一组3'端加A的DNA片段,使用不同的标签接头组。所述“不同的标签接头组”是指两组或多组标签接头组中的i5标签接头和i7标签接头至少之一各不相同,优选i5标签接头和i7标签接头这两者均各不相同。在本说明书中,i5标签接头或i7标签接头各不相同是指i5标签接头或i7标签接头的标签各不相同。
[0055] 通常,在各个标签接头组的所有i5标签接头之间,除了标签不同之外,其他部分均是相同的;在各个标签接头组的所有i7标签接头之间,除了标签不同之外,其他部分也均是相同的。
[0056] 在本发明的一个实施方式中,可使用的i5标签接头是分别在各个所述标签的5'端加AATGATACGGCGACCACCGAGATCTACAC、在3'端加ACACTCTTTCCC TACACGACGCTCTTCCGATCT而得到的;可使用的i7标签接头是分别在各个所述标签的5'端加PhosGATCGGAAGAGCACA CGTC TGAACTC CAG TCAC、在3'端加ATCTCGTATGC CGTC TTCT GC TTG而得的。
[0057] 上述标签1~380是本发明人设计的全新标签,其设计主要考虑以下原则:
[0058] 1.考虑到标签序列之间的可识别性和识别率的问题,在设计标签时,保证了8bp标签中,碱基差异须大于或等于3个碱基;
[0059] 2.考虑到序列合成或者测序中出现的错误率,因此在设计标签时避免标签8个碱基中出现3个或3个以上的连续相同碱基;
[0060] 3.考虑到测序中,相同位置的ATGC 4个碱基的含量会影响到测序质量,在设计标签时,保证标签混合后每个位点的GT与AC碱基的平衡。
[0061] 正如前述,在二代测序方法中,在测序前将不同标签标记的样本文库进行混合然后测序,测序完成后将测序数据按照标签序列将样本数据进行区分。但是,现有的标签序列十分有限。例如, HT Sample Prep Kits采用6bp标签序列,只有24种标签;而HT Sample Prep Kits采用双标签设计,i5标签有8个,i7标签只有12个,总共也只有96种组合。也就是说,对于超过96种的样本,由于标签数量的限制,现有技术不可能将其混合测序,然后按照标签序列将样本数据加以区分。与此相对,采用本发明人全新设计的380种i5标签与380种i7标签,可以提供高达144400种组合,完全可以满足对大数目量样本进行混合测序的需要。因此,在本发明的构建测序用DNA文库的方法中,所述多组加接头DNA片段可以为97组以上,例如为100组以上,再例如为200组以上,再例如为300组以上,再例如为400组以上,再例如为500组以上,最多可达144400组;此外,从便于实际操作的度考虑,可以为2000组以下,例如为1000组以下,再例如为500组以下,再例如为400组以下。
[0062] 优选地,在本发明的构建测序用DNA文库的方法的各个步骤之间例如步骤A与步骤B之间、步骤B与步骤C之间、步骤C与步骤D之间、步骤D与步骤E之间,和/或在步骤E之后可以加入对DNA片段进行纯化的步骤。该纯化步骤可以采用本技术领域的常规方法来进行,例如可以通过使用纯化磁珠来进行。
[0063] 在另一方面中,本发明提供一种测序用DNA文库(本发明的测序用DNA文库),其是采用本发明的构建测序用DNA文库的方法构建的。
[0064] 此外,在一个方面中,本发明提供一种测序方法(本发明的测序方法),其中,以本发明的测序用DNA文库作为对象进行测序。
[0065] 除了以本发明的测序用DNA文库作为对象之外,本发明的测序方法可以采用本技术领域的常规方法来进行。优选地,本发明的测序方法可以利用Illumina平台(例如HiSeq2500、NextSeq 500、Hiseq 2000、Hiseq 4000、MiSeq、NextSeq 550等)进行。
实施例
[0066] 以下通过实施例对本发明进行更具体的说明。应当理解,此处所描述的实施例是用于解释本发明,而非用于限定本发明。
[0067] 实施例1
[0068] 本实施例采用180个16S V3+V4区域PCR扩增产物建库,片段大小约为460bp。文库构建流程如下:
[0069] 1.末端修复
[0070] 材料:
[0071] 样本DNA;
[0072] dNTPs的混合物(10mM);
[0073] T4DNA聚合酶(3U/μL);
[0074] Klenow片段(5U/μL);
[0075] T4PNK(T4多核苷酸激酶,10U/μL)及PNK缓冲液;
[0076] DNA纯化用磁珠;
[0077] PCR仪。
[0078] 程序:
[0079] A.准备以下反应的组合;
[0080]
[0081] B.在PCR仪孵育30分钟,温度20℃;
[0082] C.纯化——用磁珠对反应后产物进行纯化,用19.5μL的洗脱缓冲液EB(Elution Buffer)洗脱。
[0083] 2.对DNA进行3'端加A碱基处理
[0084] 接头序列需要连接到在3′端加上了单个“T”碱基突出端的磷酸化的DNA片段的平末端。要进行这一连接,需要先在第一步获得的DNA模板片段的3′端先添加互补的“A”碱基。而这需要使用缺失了3′到5′外切酶活性的Klenow片段来完成。
[0085] 材料:
[0086] 第一步获得的DNA(19.5μL);
[0087] Klenow缓冲液(10×);
[0088] dATP(1mM);
[0089] Klenow片段(缺失3′到5′外切酶活性,5U/μL);
[0090] PCR仪。
[0091] 程序:
[0092] A.准备以下反应的组合
[0093]
[0094] B.在PCR仪孵育30分钟,温度37℃。
[0095] 3.接头(Adapter)与DNA片段的两端进行连接。
[0096] 为了使DNA能够在下一步PCR中进行特异性扩增,我们在之前所得DNA片段用DNA连接酶在其两端各连接一个特异性接头(Adapter)。
[0097] 本实施例中,共180个样本,采用i5标签接头1~10以及i7标签接头153~170的两两组合,具体参见表1。在本实施例中,使用的i5标签接头是分别在各个标签的5'端加AATGATACGGCGACCACCGAGATCTACAC、在3'端加ACACTCTTTCCC TACACGACGCTCTTCCGATCT而得到的;使用的i7标签接头是分别在各个标签的5'端加PhosGATCGGAAGAGCACACGTCTGAACTCCAGTCAC、在3'端加ATCTCGTATGCCGTCTTCTGCTTG而得的。
[0098] 材料:
[0099] 第二步获得的DNA;
[0100] DNA连接酶缓冲液(2×);
[0101] DNA连接酶(1U/μL);
[0102] Adapter:标签接头组,其中包含i5和i7标签接头,由i5和i7标签接头退火,形成接头组,该接头组的浓度是20pmol/μL;
[0103] PCR仪;
[0104] DNA纯化用磁珠。
[0105] 程序:
[0106] A.准备以下反应的组合
[0107]
[0108] B.在PCR仪孵育15分钟,温度20℃。
[0109] C.纯化——用磁珠对扩增后产物进行纯化,用38.2μL的洗脱缓冲液EB(Elution Buffer)洗脱。
[0110] 4.对两端连接接头的DNA片段进行混样,PCR
[0111] 本实施例中,180例样本需要进行相同数据量的测序,因此需要对样本进行等比例的混合,对180个加接头产物进行定量,并等量混样后进行PCR。
[0112] PCR扩增中所用到的引物序列:
[0113] PCR引物1:5'AATGATACGGCGACCACCGA 3'
[0114] PCR引物2:5'CAAGCAGAAGACGGCATACGA 3'
[0115] 材料:
[0116] 第三步纯化后获得的DNA;
[0117] 10×DNA聚合酶扩增缓冲液;
[0118] dNTP的混合物(10mM);
[0119] MgSO4(50mM);
[0120] PCR引物1(10pmol/μL);
[0121] PCR引物2(10pmol/μL);
[0122] DNA聚合酶(2.5U/μL)。
[0123] 程序:
[0124] A.准备以下反应的组合
[0125]
[0126] B.按以下方法进行PCR扩增
[0127] 94℃保持2分钟;
[0128] 然后:[94℃,15秒;62℃,30秒;72℃,30秒],15个循环;
[0129] 然后72℃保持10分钟;
[0130] 然后将样本保持在4℃保存。
[0131] C.纯化——用磁珠对反应后产物进行纯化,用一定量的洗脱缓冲液EB(Elution Buffer)洗脱。
[0132] 文库制备完成,将文库保存在适当环境备用。
[0133] 将实施案例所得到的文库,使用Agilent Bioanalyzer 2100检测片段大小及浓度,确认了所构建的测序文库符合上机测序的要求。
[0134] 5.将所得文库使用Illumina公司测序平台进行测序,测序仪使用Hiseq2500,测序完成,经过数据拆分后,各样本数据产出如表1所示。
[0135] 表1
[0136]
[0137]
[0138]
[0139]
[0140]
[0141]
[0142]
[0143] 由表1可知,本次测序共产生reads数620561901条,其中未拆分数据13815395条,占总数据的2.23%,可识别标签占97.77%,符合标签测序的需求。
[0145] 以采用本发明的构建测序用DNA文库的方法构建的测序用DNA文库进行测序,能够降低测序的试剂成本及人工成本。
QQ群二维码
意见反馈