首页 / 专利库 / 生物工程 / 扩增子 / 一种用于扩增子测序的建库方法

一种用于扩增子测序的建库方法

阅读:873发布:2020-05-12

专利汇可以提供一种用于扩增子测序的建库方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及高通量测序技术领域,公开了一种用于 扩增子 测序的建库方法,包括以下步骤:(1)PCR扩增富集目标区域:对待测样品基因组DNA,针对目标区域设计引物序列,引物序列在正向引物和反向引物的5’端设有随机 碱 基序列和接头序列,进行PCR扩增,回收PCR产物;(2)PCR扩增引入测序接头:将上步所得的PCR产物进行混样,设计引物序列,引物序列包含与上步中的接头序列互补的序列,对混样进行PCR扩增,回收PCR产物,即得到用于扩增子测序的DNA文库。本发明的建库方法不但降低了扩增子测序的建库时间和成本,还能够降低对测序结果进行 生物 信息学分析错误的发生,提高分析结果的准确性和真实性。,下面是一种用于扩增子测序的建库方法专利的具体信息内容。

1.一种用于扩增子测序的建库方法,其特征在于,包括以下步骤:
(1)PCR扩增富集目标区域:对待测样品基因组DNA,针对目标区域设计引物序列,所述引物序列在正向引物和反向引物的5’端设有随机基序列和接头序列,进行PCR扩增,回收PCR产物;
(2)PCR扩增引入测序接头:将步骤(1)所得到的PCR产物进行混样,设计引物序列,所述引物序列包含与步骤(1)中的接头序列互补的序列,对混样进行PCR扩增,回收PCR产物,即得到用于扩增子测序的DNA文库。
2.根据权利要求1所述的用于扩增子测序的建库方法,其特征在于,在所述步骤(2)之后还包括测序并对测序数据进行生物信息学分析的步骤。
3.根据权利要求1所述的用于扩增子测序的建库方法,其特征在于,在所述步骤(1)之前还包括提取待测样品基因组DNA的步骤。
4.根据权利要求1所述的用于扩增子测序的建库方法,其特征在于,步骤(1)中回收PCR产物时采用凝胶电泳法切胶回收目的条带。
5.根据权利要求1所述的用于扩增子测序的建库方法,其特征在于,步骤(2)中在将PCR产物进行混样后还包括磁珠纯化的步骤。
6.根据权利要求1所述的用于扩增子测序的建库方法,其特征在于,步骤(2)中的引物序列中,在正向引物的5’端带有P5序列;在反向引物的5’端带有Index序列和P7序列。
7.根据权利要求1所述的用于扩增子测序的建库方法,其特征在于,步骤(2)中回收PCR产物时采用磁珠法或凝胶电泳法。
8.根据权利要求2所述的用于扩增子测序的建库方法,其特征在于,所述测序步骤通过一代测序平台或高通量测序平台进行。
9.一种用于扩增子测序的DNA文库,其根据权利要求1至8任一项所述的方法构建得到。

说明书全文

一种用于扩增子测序的建库方法

技术领域

[0001] 本发明涉及分子生物学技术领域,特别涉及一种用于扩增子测序的快速建库方法。

背景技术

[0002] 随着高通量测序技术的发展,测序成本的降低,使测序技术逐渐成为基础生物学研究和医学检测的常规实验方法。从人类基因组计划构建了第一个基因组图谱开始,新一代测序技术通过全基因组测序构建了大量常规物种的基因组图谱,也促进了测序技术的高速发展。但全基因组测序结构复杂,数据量大,周期长,费用高,限制了它的发展。
[0003] 同时,有的研究者只对特定的基因组区域感兴趣,这时就只需对相应区域进行测序研究,不需要对全基因组进行测序。扩增子测序(Amplicon Sequencing)就是只对目标区域进行测序研究的一项测序方法。通过设计感兴趣的基因组区域的引物,进行PCR扩增,对目标区域进行富集,然后针对特定长度的PCR产物或者捕获的片段进行建库,高通量测序,分析序列中的变异。扩增子测序能根据研究者目的,针对目标区域进行高覆盖度的测序,还可以检测到低频突变。采用扩增子测序,研究者可以对基因组中感兴趣的关键区域进行重点研究。这种高针对性的方法可以高效的发现,验证和筛选关注区域的基因组变异。相比全基因组测序,扩增子测序对目标区域有更准确快速的研究,适用于大量样本的特定基因组区域研究。
[0004] 目前的扩增子测序都是通过常规的建库方法,在通过PCR扩增富集到目标区域后,进行混样,然后进行末端修复和加A,再加接头,纯化样品,跑胶回收目的条带,然后PCR扩增,最后再跑胶回收主带,该种常规的建库方法步骤繁琐,浪费时间,工作量大,不利于大量样品的测序建库。

发明内容

[0005] 本发明的目的在于提供一种适用于扩增子测序的快速建库方法,以简化扩增子测序中建库步骤的操作过程,降低扩增子测序建库的时间和成本,同时保证不影响测序质量
[0006] 本发明所提供的用于扩增子测序的建库方法包括以下步骤:
[0007] (1)PCR扩增富集目标区域:对待测样品基因组DNA,针对目标区域设计引物序列,该引物序列在正向引物和反向引物的5’端设有随机基序列和接头序列,进行PCR扩增,回收PCR产物;
[0008] (2)PCR扩增引入测序接头:将步骤(1)所得到的PCR产物进行混样,设计引物序列,该引物序列包含与步骤(1)中的接头序列互补的序列,对混样进行PCR扩增,回收PCR产物,即得到用于扩增子测序的DNA文库。
[0009] 本发明的用于扩增子测序的建库方法,在步骤(1)之前还包括提取待测样品基因组DNA的步骤,该提取步骤可采用本领域内常规方法进行,例如使用Omega公司的SOIL DNA KIT进行提取;此外,在步骤(2)之后还包括测序并对测序数据进行生物信息学分析的步骤,本发明建库后的上机测序可以通过一代测序平台进行,也可通过高通量测序平台进行,例如ABI公司的3730XL测序平台或Illumina公司的miseq测序平台等。进行生物信息学分析的步骤主要是指通过质控和barcode得到优化数据,然后聚OTU,物种注释,α多样性分析(稀释曲线、shannon曲线、物种累积曲线;chao、simpson等多样性指数),β多样性分析(pca、pcoa聚类;系统进化树,物种分布、显著性差异、环境因子梯度分析、各种分组比较等)。
[0010] 本发明所提供的用于扩增子测序的建库方法的流程图附图1所示。
[0011] 具体来说,本发明的步骤(1)进行了第一次PCR扩增,以完成富集目标区域的操作。在针对测序目标区域进行引物设计时:引物总长度≤59bp,退火温度55℃~75℃。在正向引物和反向引物的5’端设有随机碱基序列和接头序列,其中随机碱基的个数可设计为1~10个,在本发明的具体实施方式部分采用的是1~5个随机碱基的方案。接头序列是与测序仪相配套的序列,例如illumina的”Y”字型的序列。随机碱基序列和接头序列的设计主要达到以下三个方面的目的:(1)引入区分样本标签;(2)引入去除嵌合体序列标签;
(3)引入测序接头,方便测序。最后,回收PCR产物时可采用凝胶电泳法切胶回收目的条带。
[0012] 本发明的步骤(2)进行了第二次PCR扩增,以完成引入测序接头、建成文库的操作。首先,在将上述第一次PCR的产物进行混样后,还包括磁珠纯化的步骤,采用磁珠纯化比一般的过柱纯化速度快,可节省实验时间。例采用Agencourt AMPure XP进行。磁珠纯化步骤之后,进行设计第二次PCR引物序列和对混样进行扩增的步骤。在第二次PCR的引物序列中,在正向引物的5’端带有P5序列;在反向引物的5’端带有Index序列和P7序列,这样的引物设计为区分每一个文库引入文库标签。在扩增完成之后,进行PCR产物的回收,回收PCR产物时采用磁珠法或凝胶电泳法,即得到用于扩增子测序的DNA文库。
[0013] 本发明还提供以上述方法所构建的用于扩增子测序的DNA文库。
[0014] 本发明采用了两步法建库的方法构建扩增子测序文库,与现有技术相比,具有如下两方面的优点:
[0015] 首先,目前现有技术中所采用的扩增子测序的建库方法和普通的全基因组测序的建库方法类似,不但增加了建库时间和成本,还增加了引入突变的可能。本发明的快速建库方法将PCR扩增富集到目标区域后的常规建库方法改为一次PCR,然后用磁珠法纯化PCR产物,即可得到测序文库。相比现有技术方案,本发明的整个建库过程只用了两次PCR,步骤简单,方便操作,使得扩增子建库的时间由原来的3~4小时,缩短到0.5小时,同时免去了建库试剂盒的成本,大大降低了扩增子测序建库的时间和成本,提高了效率;且避开了常规建库中繁琐的步骤可能引入的突变,与常规建库相比两步法建库不会影响测序质量,其测序质量更加准确精确。
[0016] 其次,在现有的扩增子测序建库过程中,由于PCR的扩增反应,不可避免地形成了嵌合体,使得在进行生物信息学分析时,在不能识别嵌合体的情况下,使得得到的UTR数据中含有嵌合体的数据。采用本发明的两步法建库,在第一次PCR扩增时引入的特异序列为嵌合体的识别提供了标签,在进行生物信息学分析时,通过简化扩增子测序建库方法中使用的标签,可以识别出引入接头的PCR扩增过程中产生的嵌合体,排除了由于建库实验的PCR扩增过程产生的嵌合体对真实数据结果的影响,提高生物信息学分析的结果的准确性,与现有的建库方法相比,本发明得到的数据能够降低生物信息学分析错误的发生,更加真实地反应出样品的实际情况,提高了生物信息学分析结果的准确性和真实性。

附图说明

[0017] 图1是本发明的用于扩增子测序的建库方法流程图;
[0018] 图2是具体实施方式中PCR扩增富集目标区域步骤的样品电泳图;
[0019] 图3是具体实施方式中PCR扩增引入测序接头步骤的样品电泳图;
[0020] 图4是以本发明方法所构建的文库进行测序的结果图;
[0021] 图5是以传统建库方法所构建的文库进行测序的结果图;
[0022] 图6是以本发明的建库方法所得文库的测序结果构建的进化树;
[0023] 图7是以传统建库方法所得文库的测序结果构建的进化树。

具体实施方式

[0024] 为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明的各实施方式进行详细的阐述。然而,本领域的普通技术人员可以理解,在本发明各实施方式中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施方式的种种变化和修改,也可以实现本申请各权利要求所要求保护的技术方案。
[0025] 实施例1
[0026] 首先按照常规方法使用Omega公司的SOIL DNA KIT,提取10个样品的土壤基因组DNA,步骤略。
[0027] 一、PCR扩增富集目标区域(PCR-1):
[0028] i.引物设计
[0029] 1)测序区域为NF-NR;
[0030] 2)在引物NF和NR的5’端设计独特的碱基(N代表碱基序列)、Adapter序列;
[0031] 3)具体引物序列信息见表1:
[0032] 正向引物NF:SEQ ID No 1;
[0033] 反向引物NR:SEQ ID No 2。
[0034] 表1 PCR-1扩增引物序列
[0035]Primer名称 序列(5'to3')
NF CTTTCCCTACACGACGCTCTTCCGATCTNNNNNNAGAGTTTGATCCTGGCTCAG
NR TGGAGTTCAGACGTGTGCTCTTCCGATCTNNNNNNTTACCGCGGCTGCTGGCAC
[0036] ii.PCR扩增
[0037] 1)对10个样品基因组DNA进行PCR扩增,每个样品分别做2次PCR扩增,标记为样品_1、样品_2,并加一个阴性对照CK;
[0038] 2)PCR采用TransGen AP221-02:TransStart Fastpfu DNA Polymerase,20ul反应体系;
[0039]
[0040] 3)PCR仪:ABI 9700型
[0041] PCR反应参数:
[0042] a.1×(2minutes at 95℃)
[0043] b.25×(30seconds at 95℃;30seconds at 55℃;45seconds at 72℃)[0044] c.10minutes at 72℃,10℃until halted by user
[0045] 4)2%凝胶电泳检测PCR产物,以DL2000为Marker,3ul上样检测,部分样品电泳图如附图2所示。
[0046] iii.切胶回收目的条带
[0047] 1)采用2%琼脂糖凝胶电泳,以DL2000作Marker,100V电泳至溴酚蓝到胶的2/3处,一般电泳2h即可进行切胶回收;
[0048] 2)注意:样品与样品之间、样品与Marker之间都要隔一个孔,防止样品污染;
[0049] 3)因为目的条带为507bp左右,所以切胶回收对应Marker500bp-750bp的片段,用新的刀片切胶,每切一个样品换一个新刀片;
[0050] 4)切下的胶放入已称重后的1.5ml离心管内,做好标记;
[0051] 5)胶纯化采用QIAGEN Gel Extraction Kit Protocol试剂盒;参照QIAquick Gel Extraction Kit Protocol;
[0052] 6)最后洗脱步骤加入43μL ddH2O进行溶解。
[0053] 二、PCR扩增引入测序接头(PCR-2):
[0054] i.混样
[0055] 1)用TBS380对切胶回收得到的10×2个样品进行浓度定量
[0056] 2)Pooling:混样DNA含量为500ng,对10×2个样品进行等量混样,具体混样信息见表2
[0057] 表2 10×2个样品浓度及混样信息
[0058]
[0059] 3)磁珠纯化:在1.5ml离心管中加入1.0x已充分涡旋振荡的Ampbeads,将上述混样DNA转到上述离心管中
[0060] 4)吸打或涡旋混匀,室温放置10min,将离心管放置于磁架上至少5min,弃上清[0061] 5)保持1.5ml离心管在磁力架上,加入200ul新鲜配置的80%Etoh,室温保持30s,弃上清
[0062] 6)重复5)一次,室温干燥10-20min(磁珠出现裂痕)
[0063] 7)加入52.5ul EB,吸打或涡旋混匀,室温保持2min
[0064] 8)离心管放置于磁力架上至澄清,吸取50ul上清于1.5ml离心管中
[0065] ii.引物设计
[0066] 1)扩增区域为第一次PCR产物中的Adapter之间的序列,所以设计的引物应有序列与第一次PCR产物中的Adapter互补
[0067] 2)正向引物(RD1)的5’端带有P5序列,反向引物(RD2-B44,RD2-B45,和RD2-B48)的5’端带有Index序列及P7序列
[0068] 3)引物具体信息见表3
[0069] 正向引物RD1:SEQ ID No 3;
[0070] 反向引物RD2-B48:SEQ ID No 4;
[0071] 反向引物RD2-B44:SEQ ID No 5;
[0072] 反向引物RD2-B45:SEQ ID No 6;
[0073] 表3 PCR-2扩增引物序列
[0074]RD1 AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCG
RD2-B48 CAAGCAGAAGACGGCATACGAGACTCTCCGTGACTGGAGTTCAGACGTGTGCTCTTCCGRD2-B44 CAAGCAGAAGACGGCATACGAGAGGCCATGTGACTGGAGTTCAGACGTGTGCTCTTCCGRD2-B45 CAAGCAGAAGACGGCATACGAGAAGCTGGGTGACTGGAGTTCAGACGTGTGCTCTTCCG[0075] iii.PCR扩增(PCR-2)
[0076] 1)对混样进行PCR扩增,PCR循环数分别设为6和8,重复三次,每次的引物分别为RD1和RD2-B44,RD1和RD2-B45,RD1和RD2-B48
[0077] 2)PCR采用TransGen AP221-02:TransStart Fastpfu DNA Polymerase,50ul反应体系;
[0078]
[0079] 3)PCR仪:ABI 9700型
[0080] PCR反应参数:
[0081] a.1×(3minutes at 95℃)
[0082] b.6or 8×(30seconds at 95℃;30seconds at 55℃;45seconds at 72℃)[0083] c.5minutes at 72℃,10℃until halted by user
[0084] 4)2%凝胶电泳检测PCR产物,以DL2000为Marker,2ul上样检测,电泳图如附图3所示。
[0085] iiii.磁珠法回收PCR产物
[0086] 1)在1.5ml离心管中加入1.0x已充分涡旋振荡的Ampbeads,将上述混样DNA转到上述离心管中
[0087] 2)吸打或涡旋混匀,室温放置10min,将离心管放置于磁力架上至少5min,弃上清[0088] 3)保持1.5ml离心管在磁力架上,加入200ul新鲜配置的80%Etoh,室温保持30s,弃上清
[0089] 4)重复5)一次,室温干燥10-20min(磁珠出现裂痕)
[0090] 5)加入52.5ul EB,吸打或涡旋混匀,室温保持2min
[0091] 6)离心管放置于磁力架上至澄清,吸取50ul上清于1.5ml新的离心管中[0092] 7)加入1.0x已充分涡旋振荡的Ampbeads
[0093] 8)吸打或涡旋混匀,室温放置10min,将离心管放置于磁力架上至少5min,弃上清[0094] 9)保持1.5ml离心管在磁力架上,加入200ul新鲜配置的80%Etoh,室温保持30s,弃上清
[0095] 10)重复9)一次,室温干燥10-20min(磁珠出现裂痕)
[0096] 11)加入52.5ul EB,吸打或涡旋混匀,室温保持2min
[0097] 12)离心管放置于磁力架上至澄清,吸取50ul上清于1.5ml新的离心管中,J即为测序文库。
[0098] 三、测序并对测序数据进行生物信息学分析
[0099] i.测序
[0100] 以上述采用本发明的两步法建库所得到的DNA文库,通过Illumina公司的miseq测序平台,进行扩增子测序,每个文库测400M数据量,所得到的测序结果如附图4所示。
[0101] 以采用现有技术中的常规建库方法(PCR扩增富集到目标区域后,进行混样,然后进行末端修复和加A,再加接头,纯化样品,跑胶回收目的条带,然后PCR扩增,最后再跑胶回收主带。详细操作省略)所得到的DNA文库,通过Illumina公司的miseq测序平台,进行扩增子测序,每个文库测400M数据量,所得到的测序结果如附图5所示。
[0102] ii.数据分析
[0103] (一)测序结果图比较
[0104] 从上述两步法构建文库和传统方法构建文库的测序结果图(附图4和附图5)可以得出以下结论:
[0105] 1)从图4中可以看出,多个样品的结果都显现出同一个样品的重复实验的数据结果基本一致的情况,说明本发明的两步建库方法的稳定性和重复性都很好,该方法可以运用到大量样本的测序中。
[0106] 2)对图4和图5进行比较,可以看出,同一个样本通过两步法和传统建库方法得到的结果基本一致,说明两步法建库得到的测序结果得到了传统建库方法的支持和验证,是准确有效的。且采用两步法建库得到的测序数据结果中,去除了嵌合体,更能反映样本的真实情况。
[0107] (二)测序数据比较
[0108] 以传统建库法的测序数据与本发明的两步建库法的测序数据进行比较,制作下表4:
[0109] 表4 传统建库和两步法建库的测序数据比对
[0110]
[0111] 从表4可以得出以下结论:与传统建库方法得到的数据结果相比,采用本发明的两步法建库得到的数据结果在进行生物信息学分析时,通过简化扩增子测序建库方法中使用的特殊标签,可以识别出引入接头的PCR扩增过程中产生的嵌合体,排除了由于建库实验的PCR扩增过程产生的嵌合体对真实数据结果的影响,提高生物信息学分析的结果的准确性,与现有的建库方法相比,本发明得到的数据能够更加真实的反应出样品的实际情况,得到更加准确、更加真实的UTR数据。
[0112] (三)构建进化树比较
[0113] 采用本发明的两步建库法的测序结果和传统建库法的测序结果,分别构建进化树。本实施方式中构建进化树的方法如下:使用描述群落组成关系和结构的算法计算样品间的距离,即根据beta多样性距离矩阵进行层次聚类(Hierarchical cluatering)分析,使用非加权组平均法UPGMA(Unweighted pair group method with arithmetic mean)算法构建树状结构,得到树状关系形式用于可视化分析。所使用的软件为:Qiime计算beta多样性距离矩阵,计算距离矩阵的算法为bray curtis。以上述方法所构建得到的进化树分别如附图6和附图7所示。
[0114] 从附图6和附图7进行比较,可以看出:
[0115] 1)2种方法建库结果构建的进化树整体上趋于一致。
[0116] 2)样品81、77在2种建库方法得到的进化树中地位不同,在两步法的进化树中,样品81和样品85间的进化关系最近,样品77与样品80、78、82较相近,而在传统建库结果中,样品81作为样品84、79、85、80、78、82、77的外群,样品77作为84、79、85、80、78、82的外群,由此可以得出,数据中嵌合体数据的存在对生物信息学分析有着明显的影响。
[0117] 因此,采用两步法建库得到的测序数据结果中,去除了嵌合体,由此构建的进化树,能够更加真实的反应出各个样品间的进化关系。
[0118] 此外,值得说明的是:本发明是由PCR扩增富集目标区域、PCR扩增引入测序接头及测序三部分构成,是由三个部分的流程操作而得到最终结果。三部分的操作方式不局限于上述事例展示的方法,在PCR扩增富集目标区域、PCR扩增引入测序接头及测序三个具体步骤的分别操作过程中可采用其他的方式,整体作用和流程不变。例如:在PCR扩增富集目标区域中可采用其他的方式,不局限于直接对目标DNA区域的富集,比如通过RT-PCR对RNA的富集;PCR扩增引入测序接头中,PCR产物的纯化方式也是可以用别的方法替代的,比如通过切胶回收目的条带。测序时可以采用常规测序方法,也可以采用构建高通量测序途径等。
[0119] 本领域的普通技术人员可以理解,上述各实施方式是实现本发明的具体实施例,而在实际应用中,可以在形式上和细节上对其作各种改变,而不偏离本发明的精神和范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈