首页 / 国际专利分类库 / 化学;冶金 / 组合化学 / PacBio测序平台多样品混合测序文库构建的带标签接头及应用

PacBio测序平台多样品混合测序文库构建的带标签接头及应用

申请号 CN201811067092.X 申请日 2018-09-13 公开(公告)号 CN109136222A 公开(公告)日 2019-01-04
申请人 武汉菲沙基因信息有限公司; 发明人 方涛;
摘要 本 发明 涉及一种PacBio测序平台多样品混合测序文库构建的带标签接头及应用,所述带标签接头包括5’端连接的16个 碱 基序列、3’端连接的16个碱基序列和PacBio测序平台通用的 哑铃 结构平末端接头,5’端连接的16个碱基序列与3’端连接的16个碱基序列反向互补 配对 ,带标签接头的碱基序列如SEQ ID No.1‑96所示。将该标签序列应用于混样测序,与 现有技术 相比,该标签序列的设计综合考虑每个标签之间的差异度、每个标签与通用接头之间的差异度,显著提高了标签序列识别效率和测序准确度,大幅度提高待测样本容量。同时,标签序列应用于混样测序,实现了同一个Cell中多个样本混合测序的流程,减少样本用量的同时也优化 试剂 用量,有效的节约了试剂耗材,降低了实验成本。
权利要求

1.一种PacBio测序平台多样品混合测序文库构建的带标签接头,其特征在于,所述带标签接头包括5’端连接的16个基序列、3’端连接的16个碱基序列和PacBio测序平台通用的哑铃结构平末端接头,所述5’端连接的16个碱基序列与3’端连接的16个碱基序列反向互补配对;所述带标签接头的碱基序列如SEQ ID No.1-96所示。
2.一种适用于PacBio测序平台的多样品混合测序文库构建方法,其特征在于,包括如下步骤:
(1)将打断后并已进行DNA损伤修复和末端修复的DNA样本作为起始样本;
(2)针对每一个样本,选择带标签接头作为该样本接头;所述带标签接头包括5’端连接的16个碱基序列、3’端连接的16个碱基序列和PacBio测序平台通用的哑铃结构平末端接头,所述5’端连接的16个碱基序列与3’端连接的16个碱基序列反向互补配对;所述带标签接头的碱基序列如SEQ ID No.1-96所示;每个样本对应的标签接头均不相同;
(3)纯化起始样本,分别对各个纯化起始样本及其对应的带标签接头进行连接反应;
(4)分别对获得的连接产物进行外切酶消化和纯化,将纯化后的所有样本等量混合得到适用于PacBio测序平台的多样品混合测序文库。
3.根据权利要求2所述的一种适用于PacBio测序平台的多样品混合测序文库构建方法,其特征在于,所述步骤(3)连接反应体系为:纯化起始样本15.5μL、20μM带标签接头1μL、
10X模板预制缓冲液2μL、10mM ATP Low 1μL、30U/μL连接酶0.5μL。
4.根据权利要求2所述的一种适用于PacBio测序平台的多样品混合测序文库构建方法,其特征在于,所述步骤(3)连接反应条件为:充分混匀,瞬时离心,25℃孵育15min,65℃孵育10min使连接酶失活。
5.根据权利要求2所述的一种适用于PacBio测序平台的多样品混合测序文库构建方法,其特征在于,其特征在于,所述步骤(4)中采用的外切酶为ExoIII和ExoVII外切酶。
6.根据权利要求5所述的一种适用于PacBio测序平台的扩增子混样测序文库构建方法,其特征在于,所述步骤(4)外切酶消化反应体系为:连接反应产物20μL、100U/μL外切酶III 0.5μL、10U/μL外切酶VII 0.5μL。
7.根据权利要求2所述的一种适用于PacBio测序平台的扩增子混样测序文库构建方法,其特征在于,所述步骤(4)中采用0.45X的AMPure PB磁珠进行两次纯化,以去除小片段文库。

说明书全文

PacBio测序平台多样品混合测序文库构建的带标签接头及

应用

技术领域

[0001] 本发明涉及分子生物学领域,更具体地,涉及一种PacBio测序平台多样品混合测序文库构建的带标签接头及应用。

背景技术

[0002] PacBio平台(PacBio核酸测序平台)采用的是单分子实时测序(Single Molecule Real-Time)。PacBio平台的测序基于两个关键技术,第一,Pacific Biosciences公司发明的一种直径只有几十纳米的纳米孔,该纳米孔内只能容许单分子核酸在DNA聚合酶作用下进行反应,检测纳米孔中合成过程的A、T、C、G这四种荧光标记的脱核苷酸,即可实现核酸测序;第二,利用共聚焦显微镜实时、快速地对集成在SMRT cell上的无数的纳米孔同时进行记录。PacBio核酸测序平台,其平均读长可达10-15k,且测序不受AT和CG含量的影响,能够对高GC含量或低GC含量的区域进行测序,相比二代测序有较大优势
[0003] 目前常规的PacBio基因组建库测序流程是通过一个样品一个文库,至少测序1个Cell的方案来设计的,混样测序时,测序数据并不能进行有效的区分。在二代基因组测序技术中,混样建库测序流程已经非常成熟,方法也有很多,但由于PacBio的基因组文库构建没有PCR扩增这一步,无法通过PCR引入标签序列,只能通过将标签序列添加到接头上的方法进行混样测序。同时,由于基因组片段过大,如果文库过大,会导致barcode的识别效率非常低,从而影响测序数据的拆分比例。

发明内容

[0004] 针对现有技术中存在的技术问题,本发明提出了一种PacBio测序平台多样品混合测序文库构建的带标签接头及应用,针对通用接头序列设计特异性的标签序列并将带标签的接头应用于混样测序,有效降低测序成本,提高测序准确度,并可大幅度提高待测样本容量。
[0005] 为实现上述目的,本发明是通过以下技术方案实现的:
[0006] 本发明的第一个目的在于提出一种PacBio测序平台多样品混合测序文库构建的带标签接头,所述带标签接头包括5’端连接的16个基序列、3’端连接的16个碱基序列和PacBio测序平台通用的哑铃结构平末端接头,所述5’端连接的16个碱基序列与3’端连接的16个碱基序列反向互补配对;所述带标签接头的碱基序列如SEQ ID No.1-96所示。
[0007] 本发明的第二个目的在于提出一种适用于PacBio测序平台的多样品混合测序文库构建方法,包括如下步骤:
[0008] (1)将打断后并已进行DNA损伤修复和末端修复的DNA样本作为起始样本;
[0009] (2)针对每一个样本,选择带标签接头作为该样本接头;所述带标签接头包括5’端连接的16个碱基序列、3’端连接的16个碱基序列和PacBio测序平台通用的哑铃结构平末端接头,所述5’端连接的16个碱基序列与3’端连接的16个碱基序列反向互补配对;所述带标签接头的碱基序列如SEQ ID No.1-96所示;每个样本对应的标签接头均不相同;
[0010] (3)纯化起始样本,分别对各个纯化起始样本及其对应的带标签接头进行连接反应;
[0011] (4)分别对获得的连接产物进行外切酶消化和纯化,将纯化后的所有样本等量混合得到适用于PacBio测序平台的多样品混合测序文库。
[0012] 进一步地,所述步骤(3)连接反应体系为:纯化起始样本15.5μL、20μM带标签接头1μL、10X模板预制缓冲液2μL、10mM ATP Low 1μL、30U/μL连接酶0.5μL。
[0013] 进一步地,所述步骤(3)连接反应条件为:充分混匀,瞬时离心,25℃孵育15min,65℃孵育10min使连接酶失活。
[0014] 进一步地,所述步骤(4)中采用的外切酶为ExoIII和ExoVII外切酶。
[0015] 更进一步地,所述步骤(4)外切酶消化反应体系为:连接反应产物20μL、100U/μL外切酶III 0.5μL、10U/μL外切酶VII 0.5μL。
[0016] 进一步地,所述步骤(4)中采用0.45X的AMPure PB磁珠进行两次纯化,以去除小片段文库。
[0017] 与现有技术相比,本发明的有益效果在于:
[0018] (1)本发明的PacBio测序平台多样品混合测序文库构建的带标签接头,针对通用接头序列设计含16对反向互补碱基的特异性的标签序列,并将该标签序列应用于混样测序,与现有技术相比,该标签序列的设计综合考虑每个标签之间的差异度、每个标签与通用接头之间的差异度,显著提高了标签序列识别效率和测序准确度,并可大幅度提高待测样本容量。
[0019] (2)同时,本发明的标签序列应用于混样测序,实现了在同一个Cell中进行多个样本混合测序的流程,减少样本用量的同时也优化试剂用量,有效的节约了试剂耗材,降低了实验成本。在测序结果出现偏差时,还可以通过调整混样文库比例的方法进行加测。附图说明
[0020] 图1为本发明的适用于PacBio测序平台的多样品混合测序文库构建流程图
[0021] 图2为本发明的带标签接头的结构示意图。

具体实施方式

[0022] 展示一下实例来具体说明本发明的某些实施例,且不应解释为限制本发明的范围。对本发明公开的内容可以同时从材料、方法和反应条件进行改进,所有这些改进,均应落入本发明的的精神和范围之内。
[0023] 本发明提供的适用于PacBio测序平台的多样品混合测序文库构建方法中所用试剂均可由市场购得;其中,AMPure PB磁珠、DNA损伤修复缓冲液、NAD+、ATP Hi、dNTP、DNA损伤修复酶预混液、末端修复酶预混液、模板预制缓冲液、ATP Low、连接酶、外切酶III、外切酶VII购自PacBio公司,无核酸酶购自NEB公司。
[0024] 本发明针对现有的利用PacBio测序平台混样测序存在的标签识别率低、测序准确度不高等技术问题,针对通用接头序列设计含16对互补碱基的特异性的标签序列,并将该标签序列应用于混样测序。该标签序列的设计综合考虑每个标签之间的差异度、每个标签与通用接头之间的差异度,显著提高了标签序列识别效率和测序准确度,并可大幅度提高待测样本容量。
[0025] 本发明的适用于PacBio测序平台多样品混合测序文库构建的带标签接头的具体结构如图1所示,图中N表示A、T、C、G,包括5’端连接的16个碱基序列、3’端连接的16个碱基序列和PacBio测序平台通用的哑铃结构平末端接头,5’端连接的16个碱基序列与3’端连接的16个碱基序列反向互补配对,带标签接头的碱基序列如SEQ ID No.1-96所示。标签序列用于识别不同的样本,对某一固定标签序列,其序列是固定的。
[0026] 设计好的引物在引物合成公司如上海生工等公司进行合成。
[0027] 将上述的带标签接头应用于PacBio测序平台的多样品混合测序文库构建,具体方法如图2所示:
[0028] (1)将打断后并已进行DNA损伤修复和末端修复的DNA样本作为起始样本。
[0029] (2)针对每一个样本,选择带标签接头作为该样本接头;所述带标签接头包括5’端连接的16个碱基序列、3’端连接的16个碱基序列和PacBio测序平台通用的哑铃结构平末端接头,所述5’端连接的16个碱基序列与3’端连接的16个碱基序列反向互补配对;所述带标签接头的碱基序列如SEQ ID No.1-96所示;每个样本对应的标签接头均不相同。
[0030] (3)纯化起始样本,分别对各个纯化起始样本及其对应的带标签接头进行连接反应。其中连接反应体系为:纯化起始样本15.5μL、20μM带标签接头1μL、10X模板预制缓冲液2μL、10mM ATP Low 1μL、30U/μL连接酶0.5μL。连接反应条件为:充分混匀,瞬时离心,25℃孵育15min,65℃孵育10min使连接酶失活。
[0031] (4)分别对获得的连接产物进行外切酶消化和采用0.45X的AMPure PB磁珠两次纯化,将纯化后的所有样本等量混合得到适用于PacBio测序平台的多样品混合测序文库。其中外切酶消化反应体系为:连接反应产物20μL、100U/μL外切酶III 0.5μL、10U/μL外切酶VII 0.5μL。在样本等量混合之前,纯化后的样本进行文库质检,确定文库大小。
[0032] 实施例1:
[0033] 对6个不同的微生物样本打断至10KB以后,使用具有标签序列的接头进行文库构建,然后将文库进行等量混样,采用PacBio Sequel测序1个cell,具体实验过程如下:
[0034] 1.基因组DNA样本的打断
[0035] 基因组DNA的打断使用gTube进行,具体操作流程如下:
[0036] 1)分别取2ug的基因组DNA,使用无核酸酶水稀释至80uL,加入至gTube管中;
[0037] 2)放置于Eppendorf 5424离心机上,使用4500rpm的速度,将基因组样本打断至10KB;
[0038] 3)使用AMPure PB磁珠进行纯化,最后使用18.5μL无核酸酶水洗脱。
[0039] 2.DNA损伤修复
[0040] 1)反应体系:
[0041] 表1
[0042]
[0043] 2)充分混匀,瞬时离心,37℃孵育30min,置于上;
[0044] 3.末端修复
[0045] 1)配置如下反应体系:
[0046] 表2
[0047]
[0048] 2)充分混匀,瞬时离心。25℃孵育5min;
[0049] 3)使用AMPure PB磁珠进行纯化,最后使用15.5μL无核酸酶水洗脱。
[0050] 4.连接接头
[0051] 本步操作需要使用带标签序列的平末端接头,同一批测序样本需要使用带不同标签的接头,且每个样本对应的标签是唯一无重复的。带标签序列的平末端接头为哑铃型结构,标签接头位于接头的末端。
[0052] 1)本次实验样本使用的带标签接头的序列如下:
[0053] 表3
[0054]样本名称 带标签的接头序列(5’→3’)
样本1 atgacgcatcgtctgaatctctctcaacaacaacaacggaggaggaggaaaagagagagattcagacgatgcgtcat样本2 gtcgtagagcacgcagatctctctcaacaacaacaacggaggaggaggaaaagagagagatctgcgtgctctacgac样本3 cacgatagtcgctatgatctctctcaacaacaacaacggaggaggaggaaaagagagagatcatagcgactatcgtg样本4 tgcatgcacagatgcgatctctctcaacaacaacaacggaggaggaggaaaagagagagatcgcatctgtgcatgca样本5 cacacgcgcgtgctcgatctctctcaacaacaacaacggaggaggaggaaaagagagagatcgagcacgcgcgtgtg样本6 atctgtgcgagactacatctctctcaacaacaacaacggaggaggaggaaaagagagagatgtagtctcgcacagat[0055] 2)按如下体系配置反应:
[0056] 表4
[0057]
[0058] 3)充分混匀,瞬时离心,25℃孵育15min,65℃孵育10min使连接酶失活。
[0059] 5.核酸外切酶消化
[0060] 1)按如下体系配置反应:
[0061] 表5
[0062]
[0063] 2)充分混匀,瞬时离心,37℃孵育1h。
[0064] 3)使用0.45X的AMPure PB磁珠进行两次纯化,最后使用11uL无核酸酶水洗脱,11uL洗脱液即为构建好的文库。
[0065] 6.文库质检
[0066] 取1μL文库,稀释5倍,取2μL稀释液进行Qubit定量,计算文库浓度;取1μL稀释液进行2100检测,确定文库大小。
[0067] 7.上机测序
[0068] 1)根据要求的测序数据量,将文库按照数据量要求比例进行等比例摩尔数混样测序。
[0069] 2)测序一个Sequel Cell,产出2.2G的数据,根据标签序列对测序数据进行拆分,拆分结果如下:
[0070] 表6
[0071]
[0072]
[0073] 从表中可以看出,有87.54%的原始数据可以识别出标签序列,说明通过在接头上添加标签序列的方法可以实现不同样本的区分,同时也能达到非常高的标签序列拆分率,每个样本的数据产出也接近322M的平均产出。
[0074] 以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
QQ群二维码
意见反馈