一种构建测序用DNA文库的方法 |
|||||||
申请号 | CN201511028398.0 | 申请日 | 2015-12-30 | 公开(公告)号 | CN105401222A | 公开(公告)日 | 2016-03-16 |
申请人 | 安诺优达基因科技(北京)有限公司; | 发明人 | 玄兆伶; 王占东; 李大为; 梁峻彬; 陈重建; | ||||
摘要 | 本 发明 涉及一种构建测序用DNA文库的方法、测序用DNA文库以及测序方法。采用构建测序用DNA文库的方法,通过利用全新设计的标签接头,能够在对大数目量样本的混合测序中,实现由每个样本进行一个PCR的扩增反应变成多个样本共用一个PCR反应,从而减少文库构建 试剂 用量、降低测序人工成本。 | ||||||
权利要求 | 1.一种构建测序用DNA文库的方法,其包括: |
||||||
说明书全文 | 一种构建测序用DNA文库的方法技术领域背景技术[0002] 目前二代测序已经能够根据研究需求,应用于多个研究领域,比如基因组测序、外显子测序、转录组测序、表观基因组测序、染色体三维结构测序等。二代测序的主流平台一般均采用边合成边测序(Sequencing By Synthesis,SBS)技术进行核酸测序。测序前,需要对核酸(DNA或RNA)样本进行测序文库的构建,基本流程如下:首先将片段化后的DNA进行片段的末端修复,之后在修复后的片段3'端加“A”碱基,然后将上述DNA片段与含有测序引物结合位点的DNA接头(Adapter)连接,最后通过PCR进行扩增,完成测序文库构建。 [0003] 在传统的建库及测序方法中,是每个样本进行一个PCR反应,然后再将这些PCR扩增产物混合进行测序。例如,基于上述的建库及测序方法,Illumina公司推出了DNA标签(或称为Index、Barcode)建库方法和相应的文库构建试剂盒,例如 DNA Kit、DNA PCR-Free Kit、 Stranded RNA LT等。在基于这些试剂盒的建库及测序方法中,在测序前将不同标签标记的样本文库进行混合然后测序,测序完成后将测序数据按照标签序列将样本数据进行区分。这样的建库及测序方法无疑会增加PCR反应试剂成本和人工成本。 发明内容[0004] 鉴于上述现有技术中存在的不足,本发明的目的在于提供一种能够减少文库构建试剂用量、降低测序人工成本的测序用文库构建方法,及该测序用文库构建方法在二代测序中的应用。 [0005] 本发明的发明人为解决上述技术问题进行了深入研究,结果发现:通过使用本发明人设计的标签接头,能够实现由每个样本进行一个PCR扩增反应变成多个样本共用一个PCR扩增反应,从而减少文库构建试剂用量、降低测序人工成本。 [0006] 即,本发明包括: [0007] 1.一种构建测序用DNA文库的方法,其包括: [0008] 步骤A:分别将希望进行测序的多个样本中的DNA片段进行末端修复,得到多组平末端DNA片段; [0009] 步骤B:分别将所述多组平末端DNA片段进行3'端加A,得到多组3'端加A的DNA片段; [0010] 步骤C:分别将所述多组3'端加A的DNA片段进行加接头,得到多组加接头DNA片段; [0011] 步骤D:将所述多组加接头DNA片段混合,得到混合物;以及 [0012] 步骤E:将所述混合物进行PCR扩增,得到扩增产物; [0013] 其中,所述步骤C中,对于每一组3'端加A的DNA片段,使用一个标签接头组进行加接头,所述标签接头组由一个i5标签接头和一个i7标签接头组成,所述i5标签接头含有选自SEQ ID NO:1~380中的标签,所述i7标签接头含有选自SEQ ID NO:1~380中的标签;且对于每一组3'端加A的DNA片段,使用不同的标签接头组。 [0014] 2.根据项1所述的方法,其中,所述多组加接头DNA片段为97组以上。 [0015] 3.一种测序用DNA文库,其是采用项1或2所述的构建测序用DNA文库的方法构建的。 [0016] 4.一种测序方法,其中,以项3所述的测序用DNA文库作为对象进行测序。 [0017] 5.根据项4所述的测序方法,其中,所述测序利用Illumina平台进行。发明效果[0018] 根据本发明,通过使用本发明人设计的标签接头,能够实现由每个样本进行一个PCR扩增反应变成多个样本共用一个PCR扩增反应,从而减少文库构建试剂用量、降低测序人工成本。 [0019] 发明的具体实施方式 [0021] 首先,在一个方面中,本发明提供一种构建测序用DNA文库的方法,其包括: [0022] 步骤A:分别将希望进行测序的多个样本中的DNA片段进行末端修复,得到多组平末端DNA片段; [0023] 步骤B:分别将所述多组平末端DNA片段进行3'端加A,得到多组3'端加A的DNA片段; [0024] 步骤C:分别将所述多组3'端加A的DNA片段进行加接头,得到多组加接头DNA片段; [0025] 步骤D:将所述多组加接头DNA片段混合,得到混合物;以及 [0026] 步骤E:将所述混合物进行PCR扩增,得到扩增产物; [0027] 其中,所述步骤C中,对于每一组3'端加A的DNA片段,使用一个标签接头组进行加接头,所述标签接头组由一个i5标签接头和一个i7标签接头组成,所述i5标签接头含有选自SEQ ID NO:1~380中的标签,所述i7标签接头含有选自SEQ ID NO:1~380中的标签;且对于每一组3'端加A的DNA片段,使用不同的标签接头组。 [0028] [0029] [0030] [0031] [0032] [0033] [0034] [0035] [0036] [0037] [0038] [0039] [0040] [0041] [0042] [0043] [0044] [0045] [0046] [0047] [0048] [0049] [0050] [0051] [0052] 在本说明书中,为了记述方便,将SEQ ID NO:1~380中的标签依次称作标签1~380,相应的i5标签接头称作i5标签接头1~380,相应的i7标签接头称作i7标签接头 1~380。 [0053] 所述i5标签接头是在所述标签1~380的5'端加上用于与测序芯片上的序列匹配的DNA序列、且在3'端加上用于与测序引物及标签测序引物匹配的DNA序列而构成的。所述i7标签接头是在所述标签1~380的5'端加上用于与测序芯片上的序列匹配的DNA序列、且在3'端加上用于与测序引物及标签引物匹配的DNA序列而构成的。 [0054] 一个标签接头组由一个i5标签接头和一个i7标签接头组成。本发明中,对于每一组3'端加A的DNA片段,使用不同的标签接头组。所述“不同的标签接头组”是指两组或多组标签接头组中的i5标签接头和i7标签接头至少之一各不相同,优选i5标签接头和i7标签接头这两者均各不相同。在本说明书中,i5标签接头或i7标签接头各不相同是指i5标签接头或i7标签接头的标签各不相同。 [0055] 通常,在各个标签接头组的所有i5标签接头之间,除了标签不同之外,其他部分均是相同的;在各个标签接头组的所有i7标签接头之间,除了标签不同之外,其他部分也均是相同的。 [0056] 在本发明的一个实施方式中,可使用的i5标签接头是分别在各个所述标签的5'端加AATGATACGGCGACCACCGAGATCTACAC、在3'端加ACACTCTTTCCC TACACGACGCTCTTCCGATCT而得到的;可使用的i7标签接头是分别在各个所述标签的5'端加PhosGATCGGAAGAGCACA CGTC TGAACTC CAG TCAC、在3'端加ATCTCGTATGC CGTC TTCT GC TTG而得的。 [0057] 上述标签1~380是本发明人设计的全新标签,其设计主要考虑以下原则: [0058] 1.考虑到标签序列之间的可识别性和识别率的问题,在设计标签时,保证了8bp标签中,碱基差异须大于或等于3个碱基; [0059] 2.考虑到序列合成或者测序中出现的错误率,因此在设计标签时避免标签8个碱基中出现3个或3个以上的连续相同碱基; [0061] 正如前述,在二代测序方法中,在测序前将不同标签标记的样本文库进行混合然后测序,测序完成后将测序数据按照标签序列将样本数据进行区分。但是,现有的标签序列十分有限。例如, HT Sample Prep Kits采用6bp标签序列,只有24种标签;而HT Sample Prep Kits采用双标签设计,i5标签有8个,i7标签只有12个,总共也只有96种组合。也就是说,对于超过96种的样本,由于标签数量的限制,现有技术不可能将其混合测序,然后按照标签序列将样本数据加以区分。与此相对,采用本发明人全新设计的380种i5标签与380种i7标签,可以提供高达144400种组合,完全可以满足对大数目量样本进行混合测序的需要。因此,在本发明的构建测序用DNA文库的方法中,所述多组加接头DNA片段可以为97组以上,例如为100组以上,再例如为200组以上,再例如为300组以上,再例如为400组以上,再例如为500组以上,最多可达144400组;此外,从便于实际操作的角度考虑,可以为2000组以下,例如为1000组以下,再例如为500组以下,再例如为400组以下。 [0062] 优选地,在本发明的构建测序用DNA文库的方法的各个步骤之间例如步骤A与步骤B之间、步骤B与步骤C之间、步骤C与步骤D之间、步骤D与步骤E之间,和/或在步骤E之后可以加入对DNA片段进行纯化的步骤。该纯化步骤可以采用本技术领域的常规方法来进行,例如可以通过使用纯化磁珠来进行。 [0063] 在另一方面中,本发明提供一种测序用DNA文库(本发明的测序用DNA文库),其是采用本发明的构建测序用DNA文库的方法构建的。 [0064] 此外,在一个方面中,本发明提供一种测序方法(本发明的测序方法),其中,以本发明的测序用DNA文库作为对象进行测序。 [0065] 除了以本发明的测序用DNA文库作为对象之外,本发明的测序方法可以采用本技术领域的常规方法来进行。优选地,本发明的测序方法可以利用Illumina平台(例如HiSeq2500、NextSeq 500、Hiseq 2000、Hiseq 4000、MiSeq、NextSeq 550等)进行。 实施例 [0066] 以下通过实施例对本发明进行更具体的说明。应当理解,此处所描述的实施例是用于解释本发明,而非用于限定本发明。 [0067] 实施例1 [0068] 本实施例采用180个16S V3+V4区域PCR扩增产物建库,片段大小约为460bp。文库构建流程如下: [0069] 1.末端修复 [0070] 材料: [0071] 样本DNA; [0072] dNTPs的混合物(10mM); [0073] T4DNA聚合酶(3U/μL); [0074] Klenow片段(5U/μL); [0075] T4PNK(T4多核苷酸激酶,10U/μL)及PNK缓冲液; [0076] DNA纯化用磁珠; [0077] PCR仪。 [0078] 程序: [0079] A.准备以下反应的组合; [0080] [0081] B.在PCR仪孵育30分钟,温度20℃; [0082] C.纯化——用磁珠对反应后产物进行纯化,用19.5μL的洗脱缓冲液EB(Elution Buffer)洗脱。 [0083] 2.对DNA进行3'端加A碱基处理 [0084] 接头序列需要连接到在3′端加上了单个“T”碱基突出端的磷酸化的DNA片段的平末端。要进行这一连接,需要先在第一步获得的DNA模板片段的3′端先添加互补的“A”碱基。而这需要使用缺失了3′到5′外切酶活性的Klenow片段来完成。 [0085] 材料: [0086] 第一步获得的DNA(19.5μL); [0087] Klenow缓冲液(10×); [0088] dATP(1mM); [0089] Klenow片段(缺失3′到5′外切酶活性,5U/μL); [0090] PCR仪。 [0091] 程序: [0092] A.准备以下反应的组合 [0093] [0094] B.在PCR仪孵育30分钟,温度37℃。 [0095] 3.接头(Adapter)与DNA片段的两端进行连接。 [0096] 为了使DNA能够在下一步PCR中进行特异性扩增,我们在之前所得DNA片段用DNA连接酶在其两端各连接一个特异性接头(Adapter)。 [0097] 本实施例中,共180个样本,采用i5标签接头1~10以及i7标签接头153~170的两两组合,具体参见表1。在本实施例中,使用的i5标签接头是分别在各个标签的5'端加AATGATACGGCGACCACCGAGATCTACAC、在3'端加ACACTCTTTCCC TACACGACGCTCTTCCGATCT而得到的;使用的i7标签接头是分别在各个标签的5'端加PhosGATCGGAAGAGCACACGTCTGAACTCCAGTCAC、在3'端加ATCTCGTATGCCGTCTTCTGCTTG而得的。 [0098] 材料: [0099] 第二步获得的DNA; [0100] DNA连接酶缓冲液(2×); [0101] DNA连接酶(1U/μL); [0102] Adapter:标签接头组,其中包含i5和i7标签接头,由i5和i7标签接头退火,形成接头组,该接头组的浓度是20pmol/μL; [0103] PCR仪; [0104] DNA纯化用磁珠。 [0105] 程序: [0106] A.准备以下反应的组合 [0107] [0108] B.在PCR仪孵育15分钟,温度20℃。 [0109] C.纯化——用磁珠对扩增后产物进行纯化,用38.2μL的洗脱缓冲液EB(Elution Buffer)洗脱。 [0110] 4.对两端连接接头的DNA片段进行混样,PCR [0111] 本实施例中,180例样本需要进行相同数据量的测序,因此需要对样本进行等比例的混合,对180个加接头产物进行定量,并等量混样后进行PCR。 [0112] PCR扩增中所用到的引物序列: [0113] PCR引物1:5'AATGATACGGCGACCACCGA 3' [0114] PCR引物2:5'CAAGCAGAAGACGGCATACGA 3' [0115] 材料: [0116] 第三步纯化后获得的DNA; [0117] 10×DNA聚合酶扩增缓冲液; [0118] dNTP的混合物(10mM); [0119] MgSO4(50mM); [0120] PCR引物1(10pmol/μL); [0121] PCR引物2(10pmol/μL); [0122] DNA聚合酶(2.5U/μL)。 [0123] 程序: [0124] A.准备以下反应的组合 [0125] [0126] B.按以下方法进行PCR扩增 [0127] 94℃保持2分钟; [0128] 然后:[94℃,15秒;62℃,30秒;72℃,30秒],15个循环; [0129] 然后72℃保持10分钟; [0130] 然后将样本保持在4℃保存。 [0131] C.纯化——用磁珠对反应后产物进行纯化,用一定量的洗脱缓冲液EB(Elution Buffer)洗脱。 [0132] 文库制备完成,将文库保存在适当环境备用。 [0133] 将实施案例所得到的文库,使用Agilent Bioanalyzer 2100检测片段大小及浓度,确认了所构建的测序文库符合上机测序的要求。 [0134] 5.将所得文库使用Illumina公司测序平台进行测序,测序仪使用Hiseq2500,测序完成,经过数据拆分后,各样本数据产出如表1所示。 [0135] 表1 [0136] [0137] [0138] [0139] [0140] [0141] [0142] [0143] 由表1可知,本次测序共产生reads数620561901条,其中未拆分数据13815395条,占总数据的2.23%,可识别标签占97.77%,符合标签测序的需求。 [0144] 工业实用性 [0145] 以采用本发明的构建测序用DNA文库的方法构建的测序用DNA文库进行测序,能够降低测序的试剂成本及人工成本。 |