一种基于PCR的DNA标签文库构建方法

申请号 CN201010299305.9 申请日 2010-09-21 公开(公告)号 CN102409049A 公开(公告)日 2012-04-11
申请人 深圳华大基因科技有限公司; 深圳华大基因研究院; 发明人 章文蔚; 于竞; 龚梅花; 张艳艳; 田方; 陈海燕; 周妍; 刘涛;
摘要 本 发明 设计了长度为8bp独特的161个标签序列,并将标签嵌入DNA PCR引物中从而形成DNA PCR标签引物,从而可以通过PCR反应导入标签序列。本发明成功地建立了DNA标签文库的建库方法,并应用于solexa DNA测序。
权利要求

1.一组DNA标签,所述DNA标签包括如下或由如下组成:表2所示的161个DNA标签或与之相差1个基的DNA标签中的至少10个,或至少20个,或至少30个,或至少40个,至少50个,或至少60个,或至少70个,或至少80个,或90个,或至少100个,或至少110个,或至少120个,或至少130个,或至少140个,或至少150个,或全部161个,所述DNA标签优选地至少包括表2所示的161个DNA标签的DNAIndex1~DNA Index10,或 DNA Index11 ~ DNA Index20,或 DNAIndex21 ~ DNA Index30,或 DNA Index31~DNA Index40,或DNAIndex41~DNA Index50,或DNA Index51~DNA Index60,或DNAIndex61~DNA Index70,或DNA Index71~DNA Index80,或DNAIndex81~DNA Index90,或DNA Index91~ DNA Index100,或DNAIndex101~DNA Index110,或 DNA Index111~DNA Index120,或DNAIndex121~DNA Index130,或DNA Index131~DNA Index140,或DNAIndex141~DNA Index150,或DNA Index151~DNA Index161,或者他们任何两个或多个的组合。
2.权利要求1所述的DNA标签,其中所述的相差1个碱基包括标签中1个碱基的取代、添加或删除。
3.权利要求1或2所述的DNA标签用于构建DNA标签文库的用途,其中DNA标签文库的DNA标签接头在3’末端包含所述DNA标签,从而构成各自相对应的DNA标签接头,所述DNA标签接头优选地用作DNA标签文库的3’接头。
4.权利要求3所述的用途,其中所述DNA标签插入DNA标签接头中的3’末端中,或通过或不通过连接子连接在DNA接头的3’末端,优选地插入DNA标签接头中的3’末端中;更优选地距离DNA标签接头中的3’末端1个碱基插入DNA标签接头中。
5.使用权利要求1或2的DNA标签构建的DNA标签文库。
6.含有权利要求1或2所述的DNA标签的一组DNA PCR标签引物,其中DNA PCR标签引物在3’末端包含权利要求1所述的标签,所述一组所述DNA PCR标签引物包括如下或由如下组成:表4所示161个DNAPCR标签引物或与其所包含的DNA标签序列相差1个碱基的DNAPCR标签引物中的至少10个,或至少20个,或至少30个,或至少40个,至少50个,或至少60个,或至少70个,或至少80个,或90个,或至少100个,或至少110个,或至少120个,或至少130个,或至少140个,或至少150个,或全部161个,
所述DNA PCR标签引物优选地至少包括表4所示的161个DNAPCR标签引物中的DNA PCR index1 primer~DNA PCR index10primer,或DNA PCR index11 primer~DNA PCR index20 primer,或DNA PCR index21 primer~DNA PCR index30 primer,或DNA PCRindex31 primer~DNA PCR index40 primer,或DNA PCR index41primer~DNA PCR index50 primer,或DNA PCR index51 primer~DNA PCR index60 primer,或DNA PCR index61 primer~DNA PCRindex70 primer,或DNA PCR index71 primer~ DNA PCR index80primer,或DNA PCR index81 primer~DNA PCR index90 primer,或DNA PCR index91 primer~DNA PCR index100 primer,或DNA PCRindex101 primer~DNA PCR index110 primer,或DNA PCR index111primer~DNA PCR index120 primer,或DNA PCR index121 primer~DNA PCR index130 primer,或DNA PCR index131 primer~DNAPCR index140 primer,或DNA PCR index141 primer~DNA PCRindex150 primer,或DNA PCR index151 primer~DNA PCR index161primer,或者他们任何两个或多个的组合。
7.权利要求6所述的DNA PCR标签引物,其中所述的相差1个碱基包括标签中1个碱基的取代、添加或删除。
8.权利要求6或7所述的DNA PCR标签引物用于构建DNA标签文库的用途,优选地所述DNA PCR标签引物用作DNA标签文库的下游引物。
9.通过权利要求6或7所述的DNA PCR标签引物构建的DNA标签文库。
10.一种标签文库的构建方法,所述方法的特征在于使用包含标签的DNA PCR标签引物来构建标签文库。
11.权利要求10所述的方法,其包括:
1)提供n个DNA样品,n为整数且1≤n≤161的整数,优选地n为整数且2≤n≤161,所述DNA样品来自所有真核和原核DNA样品,包括但不限于人DNA样品;
2)将基因组DNA打断,其中打断方法包括但不限于声波打断方法,优选地使打断后的DNA条带集中在200bp左右;
3)末端修复;
4)DNA片段3’末端加“A”碱基;
5)连接DNA接头;
6)将步骤5)得到的连接产物进行凝胶回收纯化,优选地通过2%的琼脂糖胶进行电泳并回收,并将各个DNA样品的回收产物混合在一起;
7)PCR反应,使用步骤6)的回收产物的混合物作为模板,在适于扩增目的核酸的条件下进行PCR扩增,将PCR产物进行胶回收纯化,优选地回收280~300bp的目的片段。
12.权利要求10或11所述的方法,其中步骤7)PCR反应中使用的引物如下:
上游引物是PE PCR Primers 1.0:
AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT;
下游引物是包括如下或由如下组成的DNA PCR标签引物:表4所示161个DNA PCR标签引物或与其所包含的DNA标签序列相差1个碱基的DNA PCR标签引物中的至少10个,或至少20个,或至少30个,或至少40个,至少50个,或至少60个,或至少70个,或至少80个,或90个,或至少100个,或至少110个,或至少120个,或至少130个,或至少140个,或至少150个,或全部161个,
所述DNA PCR标签引物优选地至少包括表4所示的161个DNAPCR标签引物中的DNA PCR index1 primer~DNA PCR index10primer,或DNA PCR index11 primer~DNA PCR index20 primer,或DNA PCR index21 primer~DNA PCR index30 primer,或DNA PCRindex31 primer~DNA PCR index40 primer,或DNA PCR index41primer~DNA PCR index50 primer,或DNA PCR index51 primer~DNA PCR index60 primer,或DNA PCR index61 primer~DNA PCRindex70 primer,或DNA PCR index71 primer~ DNA PCR index80primer,或DNA PCR index81 primer~DNA PCR index90 primer,或DNA PCR index91 primer~DNA PCR index100 primer,或DNA PCRindex101 primer~DNA PCR index110 primer,或DNA PCR index111primer~DNA PCR index120 primer,或DNA PCR index121 primer~DNA PCR index130 primer,或DNA PCR index131 primer~DNAPCR index140 primer,或DNA PCR index141 primer~DNA PCRindex150 primer,或DNA PCR index151 primer~DNA PCR index161primer,或者他们任何两个或多个的组合。
13.权利要求12所述的方法,其中所述的相差1个碱基包括标签中1个碱基的取代、添加或删除。
14.权利要求11所述的方法,其中步骤5)中使用的DNA接头是PE index Adapters:
5’Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCAC
5’TACACTCTTTCCCTACACGACGCTCTTCCGATCT。
15.通过权利要求10或11所述的方法构建的标签文库。

说明书全文

一种基于PCR的DNA标签文库构建方法

技术领域

[0001] 本发明涉及DNA文库构建技术领域,特别是DNA标签文库构建技术领域,特别是基于PCR的DNA标签文库构建方法。另外,本发明还涉及标签技术,以及实现多个样品在同一反应体系中进行文库构建的方法。本发明的方法特别适用于第二代测序技术,尤其是solexa测序技术。

背景技术

[0002] Illumina公司提供的Solexa DNA测序平台,可在一个反应中同时加入四种带荧光标记的核苷酸,采用边合成边测序(Sequencing BySynthesis,SBS),具有所需样品量少,高通量,高精确性,拥有简单易操作的自动化平台和功能强大等特点[1-4]。文库构建首先需要将目的片段进行末端修复,在目的片段的3’末端连接“A”基,将3’末端带有“A”碱基的目的片段与DNA接头(也称为adapter)连接,通过PCR反应将目的片段进行扩增,最后回收含有DNA接头的目的片段文库,见图1。目的片段文库与测序芯片上面的DNA接头进行杂交,通过桥式PCR进行扩增后,最后边合成边测序。在每个循环过程里,荧光标记的核苷和聚合酶被加入到单分子阵列中。互补的核苷和核苷酸片断的第一个碱基配对,通过酶加入到引物上。多余的核苷被移走。这样每个单链DNA分子通过互补碱基的配对被延伸,针对每种碱基的特定波长的激光激发结合上的核苷的标记,这个标记会释放出荧光,最后收集到的荧光信号来翻译成碱基序列。目前这种DNA建库方法可以根据需求运用于各种研究领域,如基因组的De Novo测序,基因组重测序、转录组测序和表观基因组测序等。
[0003] 基于上述建库方法illumina公司也推出了DNA标签(也称为index)建库方法,如图2所示。在DNA标签建库流程中,PCR过程使用了3条PCR标签引物,通过PCR导入标签来构建DNA标签文库[5]。专利申请WO2005068656A1和WO2008093098A2中公开了一种使用标签序列标记核酸样品的来源从而可以将样品进行混合测序的方法,可以通过PCR的过程将特定的核苷酸序列(即标签序列)通过PCR导入到文库中,PCR标签引物序列见表1。这些带有标签的文库可以根据需求进行任意混合,然后通过solexa测序仪器进行测序,最后将数据按标签标签序列进行分类。
[0004] 但是illumina公司提供的标签文库制备的方法存在着一些缺陷:第一、目前illumina公司只提供12个长度为6bp的标签序列,标签的数量较少,随着solexa测序通量的增加,不能对大量样本进行混合测序将是一个巨大的缺陷;第二、目前illumina公司提供的标签建库方法是通过PCR反应将标签序列导入到目的片段文库中,需要3条PCR引物对目的片段进行扩增(两条公用引物和一条PCR标签引物,如表1),而且PCR扩增效率不高。
[0005] 第三、illumina公司提供的标签建库方法中接头不包含标签序列,每一个标签文库需要通过一个PCR反应来导入标签序列,然后针对每一个标签文库都需要切胶回收,然后将切胶回收后的标签目的片段文库进行混合,这样不仅费时费,而且费用也较高。
[0006] 因此,对标签的序列及标签引入方法进行优化和改进,使标签引入的效率提高,扩大标签序列的数量,才能满足高通量的建库的要求,以适应测序通量不断提高的现状,使测序仪器的产能充分利用,降低测序的成本。
[0007] 表1illumina公司提供的标签序列及相对应的PCR标签引物序列
[0008]
[0009]

发明内容

[0010] 基于目前illumina公司的solexa测序平台提供的DNA标签文库制备方法,本发明改良了标签序列,分别设计了长度为8bp独特的标签序列,可以分别通过PCR反应导入标签序列,成功的建立了DNA标签文库的建库方法,并应用于solexa DNA测序,提高了DNA标签文库的制备的效率,增大了DNA样品的测序通量,降低了单个样品的solexa测序费用。
[0011] 标签设计首先需要考虑标签序列之间的可识别性和识别率的问题,然后需要考虑标签序列混合之后的每个位点的GT与AC碱基含量的平衡问题,最后考虑数据产出的可重复性和准确性。在设计标签的过程中,本发明充分考虑到以上几个因素,同时避免了标签的核酸序列出现3或3个以上连续的碱基,这样可以降低序列在合成过程中或测序过程中的错误率。同时尽量避免标签引物自身形成发夹结构,而导致PCR反应扩增效率的降低。
[0012] 本发明对illumina提供的DNA接头序列进行优化,将标签设计为长度为8bp的特殊序列,另外将illumina公司提供的的3条DNA标签PCR引物优化为两条PCR引物就能导入标签的建库方法。同时将illumina公司提供的通过3条DNA标签pcr引物导入标签的建库方法优化为通过两条PCR引物导入标签,优化后的标签引物,与illumina公司的DNA标签引物相比,提高了PCR扩增反应的效率,并提高了标签序列的识别效率。如图3所示为illumina公司的DNA标签建库流程图,图4为优化后的DNA标签建库实验流程图。
[0013] 本发明基于目前illumina公司提供的Solexa Paired End测序平台,设计一段长度为8bp的特定标签核酸序列。通过测试包含所述特定标签核酸序列的DNA标签PCR引物的扩增效率和标签核酸序列的识别率,最后优化并筛选出161条长度为8bp的DNA标签序列(如表2,8bp的DNA标签序列)及DNA PCR标签引物。这些长度为8bp的标签之间的差异在4个碱基,即至少4个碱基序列不同。当标签的8个碱基中的任意一个碱基出现测序错误或合成错误,都不影响到标签的最终识别。
[0014] 表2长度为8bp的DNA标签(indexN)序列
[0015]index序号 序列 index序号 序列 index序号 序列
Index1 CATTGCTT Index55 TACAGGCC Index109 TCCGACGG
Index2 TTCGGATT Index56 GTTAAGCC Index110 GCAGGCAT
Index3 TCATCATT Index57 TAATTACC Index111 GCCAGCGA
Index4 GCTCCTGT Index58 ATAACACC Index112 CACACTGG
Index5 AGCTCGGT Index59 CGTAGGAC Index113 GGCCTCGC
Index6 CAACAGGT Index60 CTCTCGAC Index114 GGCGCGCA
Index7 TTCAAGGT Index61 CTACGCAC Index115 CGCCACCT
Index8 CCTAACGT Index62 AGGTTAAC Index116 CATGCGGC
Index9 CACGTAGT Index63 GTTGCAAC Index117 GGCAACAG
Index10 GTAAGAGT Index64 CTCAATTA Index118 CGGTATCA
Index11 TACCTTCT Index65 CAAGTCTA Index119 CGGCCAAT
Index12 AAGTCTCT Index66 ACAACCTA Index120 AGCCGTCC
Index13 AGAGATCT Index67 CTACCATA Index121 ACAGAGTG
Index14 CCAGCGCT Index68 GACACATA Index122 ACGCAGCC
Index15 ATGAACCT Index69 AGATAATA Index123 GAGCTGAC
Index16 ACCAGACT Index70 CGCGGTGA Index124 TGATGGCT
Index17 CTATAACT Index71 TACTATGA Index125 TGAATCAT
Index18 GCGGAACT Index72 TTGTTGGA Index126 TGACAGAC
Index19 CTAGTTAT Index73 AGTGAGGA Index127 GTGGTCGT
Index20 TCTTATAT Index74 ATCGCCGA Index128 GCGTGGAG
Index21 GAATCGAT Index75 CTTATAGA Index129 ACTTCCGC
Index22 AATAAGAT Index76 CCATGAGA Index130 ACATGTAC
Index23 TATGCCAT Index77 TCACCTCA Index131 CCGGCTAA
Index24 ATTCTAAT Index78 ACCTTGCA Index132 CGATCCTG
Index25 TAATGTTG Index79 ATACTCCA Index133 GACGATAT
Index26 GTTACTTG Index80 GTTCGACA Index134 CCTGGCCA
Index27 ATTCACTG Index81 CATCATAA Index135 AAGACGTC
Index28 ATCATATG Index82 CACATGAA Index136 GCTCTCTA
Index29 GCTTAATG Index83 ATGAGGAA Index137 AGCGTGTC
Index30 GGATATGG Index84 TCCTCCAA Index138 CCGTTGTT
Index31 CTTGATGG Index85 TTAGACAA Index139 TTGCTACG
Index32 AAGATCGG Index86 GTCCAGAA Index140 TGTAACCA
Index33 TTAACCGG Index87 ATCTATCG Index141 TGTGTTAA
Index34 CTAAGTCG Index88 TTACTGTT Index142 GATAGCCG
Index35 TATTCGCG Index89 ACACGCGG Index143 TAACACCG
Index36 GAAGCACG Index90 TATCCAGA Index144 AGTAGTTA
Index37 TCCAGTAG Index91 TAGGAATA Index145 GTCTGCCT
Index38 TTGTCTAG Index92 GAACGTGA Index146 GGAGTAGA
Index39 AGCGCTAG Index93 CCGCACAG Index147 TGCGCAGC
Index40 CCTGTGAG Index94 ATTGCGTT Index148 TGCCTATA
Index41 CAACTAAG Index95 TCGTAAGC Index149 TGCTAGTG
Index42 ATAGGAAG Index96 CCGTCACG Index150 CCGAGCTC
Index43 ACTACAAG Index97 GCGAAGTA Index151 CGGATTAG
Index44 GATGGTTC Index98 GGACTGCG Index152 CGGACGGA
Index45 CCACATTC Index99 GAGCATTG Index153 GACTGAGG
Index46 TCTTGGTC Index100 TCGCCGTG Index154 GTGTGTTA
Index47 CGAGGATC Index101 CAGCGGCG Index155 CTCGTCCG
Index48 AGTCCATC Index102 AAGGATGC Index156 TGGAGAGG
Index49 CACTAATC Index103 GCAATGGC Index157 TGGAATTC
Index50 TAAGGCGC Index104 GTATTCTC Index158 TTGGCGCC
Index51 AATAGAGC Index105 GTCATTAC Index159 GCCTTAAT
Index52 ACTGTTCC Index106 ATCCAAGC Index160 AAGCGATT
Index53 CTTCCTCC Index107 GGTATACT Index161 AACCGCAA
Index54 GCGACTCC Index108 TTGCGTGC
[0016]
[0017] 使用Lasergene的PrimerSelect软件预测DNA PCR标签引物形成的发夹结构和自身的二级接头结构示意图。其中,[ST_Hairpin]Score表示发卡得分;[AD_Self_Extend_Dimer]Score表示自身延长二聚体得分;[ST_Self_Dimer]Score表示自身二聚体得分。
[0018] 表3:预测DNA PCR标签引物形成的发夹结构和自身的二级结构,不同DNA PCR标签引物的得分。
[0019]
[0020]
[0021]
[0022]附图说明
[0023] 图1:Ilumina公司提供的常规DNA建库流程示意图。
[0024] 图2:illumina公司提供的常规DNA标签建库流程示意图。
[0025] 图3:illumina公司的DNA标签建库流程图。
[0026] 图4:优化后的DNA标签建库实验流程图。
[0027] 图5:长 度 为8bp的DNA标 签 引 物 的1个 错 误匹 配/0个 错 误 匹 配(1mismatch/0mismatch)比例,大部分1mismatch/0mismatch的比例在2%左右,少数在4%左右,由于1mismatch/0mismatch小于5%便可以获得较好的数据结果,说以测试的161条长度为8bp的DNA标签引物合格。

具体实施方式

[0028] 下面将结合实施例对本发明的实施方案进行详细描述,但是本领域技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限定本发明的范围。
[0029] 本发明一方面提供了一组DNA标签,所述DNA标签包括如下或由如下组成:表2所示的161个DNA标签或与之相差1个碱基的DNA标签中的至少10个,或至少20个,或至少30个,或至少40个,至少50个,或至少60个,或至少70个,或至少80个,或90个,或至少
100个,或至少110个,或至少120个,或至少130个,或至少140个,或至少150个,或全部
161个,
[0030] 所述DNA标签优选地至少包括表2所示的161个DNA标签的DNAIndex1~DNA Index10,或DNA Index11~DNA Index20,或DNAIndex21~DNA Index30,或DNA Index31~DNA Index40,或DNAIndex41~DNA Index50,或DNA Index51~DNA Index60,或DNAIndex61~DNA Index70,或DNA Index71~DNA Index80,或DNAIndex81~DNA Index90,或DNA Index91~ DNA Index100,或DNAIndex101~DNA Index110,或 DNA Index111~DNA Index120,或DNAIndex121~DNA Index130,或DNA Index131~DNA Index140,或DNAIndex141~DNA Index150,或DNA Index151~DNA Index161,或者他们任何两个或多个的组合。
[0031] 在本发明的一个具体实施方式中,在关于所述DNA标签中所述的相差1个碱基包括标签中1个碱基的取代、添加或删除。
[0032] 在本发明的一个具体实施方式中,本发明提供了所述的DNA标签用于构建DNA标签文库的用途,其中DNA标签文库的DNA标签接头在3’末端包含所述DNA标签,从而构成各自相对应的DNA标签接头,所述DNA标签接头优选地用作DNA标签文库的3’接头。
[0033] 在本发明的一个具体实施方式中,在本发明所提供的用途中,所述DNA标签插入DNA标签接头中的3’末端中,或通过或不通过连接子连接在DNA接头的3’末端,优选地插入DNA标签接头中的3’末端中;更优选地距离DNA标签接头中的3’末端1个碱基插入DNA标签接头中。所述连接子是1-6个核苷酸序列,优选地1-3个核苷酸序列。
[0034] 在本发明的一个具体实施方式中,本发明提供了使用所述的DNA标签构建的DNA标签文库。
[0035] 本发明另一方面提供了含有上文所述DNA标签的一组DNA PCR标签引物,其中DNA PCR标签引物在3’末端包含上文所述的标签,所述一组所述DNA PCR标签引物包括如下或由如下组成:表4所示161个DNA PCR标签引物或与其所包含的DNA标签序列相差1个碱基的DNA PCR标签引物中的至少10个,或至少20个,或至少30个,或至少40个,至少50个,或至少60个,或至少70个,或至少80个,或90个,或至少100个,或至少110个,或至少120个,或至少130个,或至少140个,或至少150个,或全部161个,
[0036] 所述DNA PCR标签引物优选地至少包括表4所示的161个DNAPCR标签引物中的DNA PCR index1 primer~DNA PCR index10primer,或DNA PCR index11 primer~DNA PCR index20 primer,或DNA PCR index21 primer~DNA PCR index30 primer,或DNA PCRindex31 primer~DNA PCR index40 primer,或DNA PCR index41primer~DNA PCR index50 primer,或DNA PCR index51 primer~DNA PCR index60 primer,或DNA PCR index61 primer~DNA PCRindex70 primer,或DNA PCR index71 primer~DNA PCR index80primer,或DNA PCR index81 primer~DNA PCR index90 primer,或DNA PCR index91 primer~DNA PCR index100 primer,或DNA PCRindex101 primer~DNA PCR index110 primer,或DNA PCR index111primer~DNA PCR index120 primer,或DNA PCR index121 primer~DNA PCR index130 primer,或DNA PCR index131 primer~DNAPCR index140 primer,或DNA PCR index141 primer~DNA PCRindex150 primer,或DNA PCR index151 primer~DNA PCR index161primer,或者他们任何两个或多个的组合。
[0037] 在本发明的一个具体实施方式中,在所述DNA PCR标签引物中所述的相差1个碱基包括标签中1个碱基的取代、添加或删除。
[0038] 在本发明的一个具体实施方式中,本发明提供了上文所述的DNAPCR标签引物用于构建DNA标签文库的用途,优选地所述DNA PCR标签引物用作DNA标签文库的下游引物。
[0039] 在本发明的一个具体实施方式中,本发明提供了通过上文所述的DNA PCR标签引物构建的DNA标签文库。
[0040] 本发明另一方面还提供了一种标签文库的构建方法,所述方法的特征在于使用包含标签的DNA PCR标签引物来构建标签文库。
[0041] 在本发明的一个具体实施方式中,提供了一种标签文库的构建方法,所述方法包括:
[0042] 1)提供n个DNA样品,n为整数且1≤n≤161的整数,优选地n为整数且2≤n≤161,所述DNA样品来自所有真核和原核DNA样品,包括但不限于人DNA样品;
[0043] 2)将基因组DNA打断,其中打断方法包括但不限于声波打断方法,优选地使打断后的DNA条带集中在200bp左右;
[0044] 3)末端修复;
[0045] 4)DNA片段3’末端加“A”碱基;
[0046] 5)连接DNA接头;
[0047] 6)将步骤5)得到的连接产物进行凝胶回收纯化,优选地通过2%的琼脂糖胶进行电泳并回收,并将各个DNA样品的回收产物混合在一起;
[0048] 7)PCR反应,使用步骤6)的回收产物的混合物作为模板,在适于扩增目的核酸的条件下进行PCR扩增,将PCR产物进行胶回收纯化,优选地回收280~300bp的目的片段。
[0049] 在本发明的一个具体实施方式中,所述的方法中步骤7)PCR反应中使用的引物如下:
[0050] 上游引物是PE PCR Primers 1.0:
[0051] AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT;
[0052] 下游引物是包括如下或由如下组成的DNA PCR标签引物:表4所示161个DNA PCR标签引物或与其所包含的DNA标签序列相差1个碱基的DNA PCR标签引物中的至少10个,或至少20个,或至少30个,或至少40个,至少50个,或至少60个,或至少70个,或至少80个,或90个,或至少100个,或至少110个,或至少120个,或至少130个,或至少140个,或至少150个,或全部161个,
[0053] 所述DNA PCR标签引物优选地至少包括表4所示的161个DNAPCR标签引物中的DNA PCR index1 primer~DNA PCR index10primer,或DNA PCR index11 primer~DNA PCR index20 primer,或DNA PCR index21 primer~DNA PCR index30 primer,或DNA PCRindex31 primer~DNA PCR index40 primer,或DNA PCR index41primer~DNA PCR index50 primer,或DNA PCR index51 primer~DNA PCR index60 primer,或DNA PCR index61 primer~DNA PCRindex70 primer,或DNA PCR index71 primer~DNA PCR index80primer,或DNA PCR index81 primer~DNA PCR index90 primer,或DNA PCR index91 primer~DNA PCR index100 primer,或DNA PCRindex101 primer~DNA PCR index110 primer,或DNA PCR index111primer~DNA PCR index120 primer,或DNA PCR index121 primer~DNA PCR index130 primer,或DNA PCR index131 primer~DNAPCR index140 primer,或DNA PCR index141 primer~DNA PCRindex150 primer,或DNA PCR index151 primer~DNA PCR index161primer,或者他们任何两个或多个的组合。
[0054] 在本发明的一个具体实施方式中,在本发明提供的方法中所述的相差1个碱基包括标签中1个碱基的取代、添加或删除。
[0055] 在本发明的一个具体实施方式中,所述的方法中步骤5)中使用的DNA接头是PE index Adapters:
[0056] 5’Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCAC
[0057] 5’TACACTCTTTCCCTACACGACGCTCTTCCGATCT。
[0058] 本发明另一方面还进一步提供了通过上文所述的方法构建的标签文库。
[0059] Paired End DNA寡核苷酸序列:
[0060] PE index Adapters
[0061] 5’Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCAC
[0062] 5’TACACTCTTTCCCTACACGACGCTCTTCCGATCT
[0063] PE PCR Primers 1.0
[0064] AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT[0065] 表4DNA PCR标签引物(DNA PCR indexN primer)
[0066]
[0067]
[0068]
[0069]
[0070]
[0071]
[0072]
[0073]
[0074] 主要实验仪器及试剂
[0075]
[0076]
[0077]
[0078]
[0079] 实施例1:DNA标签实验建库方法具体
[0080] 1.1DNA片段化
[0081] 将人全血基因组DNA 5ug使用Covaris打碎仪打断6分钟(参数设置:Duty cycle(负载比)-20%;Intensity(强度)-5.0;Bursts persecond(每秒钟脉冲)-200;Duration(持续时间)-40 seconds;Mode(模式)-Frequency sweeping(频率扫描);
Power(功率)-33-34W;Temperature(温度)-5.5 to 6℃),使其在琼脂糖电泳中显示的主要条带集中在200bp左右[5]。
[0082] 1.2末端修复
[0083] 按照下列的配比准备反应混合:
[0084] DNA模板 35μL
[0085] T4 DNA连接酶缓冲液 50μL
[0086] dNTPs混合液 4μL
[0087] T4 DNA聚合酶 5μL
[0088] Klenow DNA聚合酶 1μL
[0089] T4多聚核苷酸激酶 5μL
[0090]
[0091] 总体积 100μL
[0092] 将舒适型恒温混匀器调至20℃,反应30min,然后用QIAquickPCR纯化试剂盒进行纯化,最后将样品溶于32μL EB solution。
[0093] 1.3DNA片段3′末端加“A”碱基
[0094] 按照下列的配比准备反应混合物:
[0095] 末端修复后的DNA 32μL
[0096] Klenow酶缓冲液 5μL
[0097] dATP(1mM) 10μL
[0098] Klenow酶(3′到5′外切酶活性) 3μL
[0099]
[0100] 总体积 50μL
[0101] 将舒适型恒温混匀器调至37℃,反应30min,然后用MiniElute PCR纯化试剂盒进行纯化,最后将样品溶于10μL EB solution。
[0102] 1.4连接DNA接头
[0103] 按照下列的配比准备反应混合物:
[0104] DNA 10μL
[0105] T4 DNA连接酶缓冲液 25μL
[0106] PE index Adapters 10μL
[0107] T4 DNA连接酶 5μL
[0108]
[0109] 总体积 50μL
[0110] 将舒适型恒温混匀器调至20℃,反应15min,然后用QIAquickPCR纯化试剂盒进行纯化,最后将样品溶于30μL EB solution
[0111] 1.5连接产物的胶回收纯化
[0112] 将连接产物于2%的琼脂糖胶中进行电泳分离;随后将目的片段条带切胶转移至Eppendorf管中。用QIAquick胶纯化试剂盒进行胶纯化回收,回收产物溶于20μL EB solution。
[0113] 1.6PCR反应导入标签接头
[0114] PCR反应:按照下列的反应体系准备反应混合物,将试剂放置于上。
[0115] 胶回收纯化后的DNA 10μL
[0116] Phusion DNA聚合酶 25μL
[0117] PE PCR Primers 1.0 1μL
[0118] DNA PCR标签引物 1μL
[0119] ddH2O 13μL
[0120]
[0121] 总体积 50μL
[0122] 注:对于每一个DNA样品,所使用的DNA PCR标签引物可为表4中所示DNA PCR标签引物(DNA PCR indexN primer)中的任意一种接头(表4),
[0123] PCR反应条件
[0124] 98℃ 30s
[0125]
[0126] 72℃ 5min
[0127] 4℃ 保存
[0128] 1.7PCR产物的胶回收纯化
[0129] 将PCR产物于2%琼脂糖胶中电泳分离,切割回收目的片段,用QIAquick胶纯化试剂盒进行胶纯化回收,回收产物溶于30μL ElutionBuffer。
[0130] 1.8DNA制备产物检测
[0131] 1)使用Agilent 2100 Bioanalyzer检测文库产量。
[0132] 2)使用QPCR定量检测文库产量。
[0133] Solexa测序结果统计如图5,1错误匹配(mismatch)/0错误匹配的比例均控制在5%以下,大部分控制在3%以下。共测出24362092条序列,其中标签完全配对的序列(0mismatch)有23099149条序列,标签测序出现1个错误碱基的有460238条序列,即可以识别的标签的比例为96.7%,可以满足solexa DNA标签建库需求。
[0134] 尽管本发明的具体实施方式已经得到详细的描述,本领域技术人员将会理解。根据已经公开的所有教导,可以对那些细节进行各种修改和替换,这些改变均在本发明的保护范围之内。本发明的全部范围由所附权利要求及其任何等同物给出。
[0135] 参考文献
[0136] 1、Paired-End sequencing User Guide;illumina part#1003880[0137] 2、Preparing samples for ChIP sequencing for DNA;illuminapart#11257047 Rev.A;
[0138] 3、mRNA sequencing sample preparation Guide;illuminapart#1004898 Rev.D[0139] 4、Preparing 2-5kb samples for mate pair library sequencing;illumina part#1005363 Rev.B;
[0140] 5、Preparing samples for multiplexed Paired-End sequencing;illumina part#1005361 Rev.B。
QQ群二维码
意见反馈