首页 / 专利库 / 生物防治 / 多倍体 / 一种长片段核酸文库的构建方法

一种长片段核酸文库的构建方法

阅读:1026发布:2020-07-05

专利汇可以提供一种长片段核酸文库的构建方法专利检索,专利查询,专利分析的服务。并且本 发明 提供了一种长 片段 核酸文库构建方法,首先制备批量Index标签簇,对长片段核酸分子进行批量标记,利用全基因组重测序建库构建适合于illumina测序平台的长片段文库,使每个片段在转座酶的作用下,直接带有适合illumina测序平台的接头,通过PCR扩增,筛选构建好的文库。本发明方法有效地解决了基因组从头测序技术中出现的 多倍体 、重复序列影响组装准确性的问题,可用于复杂基因组的组装,辅助de novo测序组装,提高组装准确性,缩短组装时间。,下面是一种长片段核酸文库的构建方法专利的具体信息内容。

1.一种批量制备Index簇的方法,其特征在于,将接头A1分别与链霉亲和素修饰的纳米磁珠连接,形成A1接头和纳米磁珠复合物,然后用T4DNA连接酶将包含有Sma I酶切位点的64种接头A分别随机一对一的连接在A1接头和纳米磁珠复合物上,将连接产物用Sma I进行酶切后再连接接头A,共计进行3次连接接头A酶切反应,最后连接接头A2-14U;
所述接头A1共64种,序列如SEQ ID NO.1-128所示;
所述接头A共64种,序列如SEQ ID NO.129-256所示;
所述接头A2-14U序列为:
F:5’-ACGCATGACTCAdUCGdUCGGCAGCGdUCAdUCTCGCAGTTG;
R:5’-CAACdUGCGAGAdUGACGCTGCCGACGATGAGTCATGCGT。
2.如权利要求1所述的批量制备Index簇的方法,其特征在于,纳米磁珠为M280磁珠、M270磁珠、T1或Ci的链霉亲和素修饰的纳米磁珠。
3.一种长片段核酸文库构建方法,包括以下步骤:
(1)长片段DNA文库的制备
(2)含标记的标签簇制备
通过酶切连接的方式,制备两种含有Index的标签簇,第一种是Index标签簇,第二种是长片段DNA捕获Index标签簇;其中Index标签簇是采用权利要求1所述的批量制备Index簇的方法,制备含有不同标签的Index标签簇;
(3)长片段DNA捕获复合物的获得
(4)二次破碎文库构建
将步骤(2)的Index标签簇与长片段DNA捕获复合物混合,并且用PTP板进行单孔处理,确保每个PTP板的小孔中分别包含一个Index标签簇和一个已连接大片段的长片段捕获标签簇,在转座酶的作用下,连接在长片段捕获标签簇上的大片段被打断成长度集中在
500bp-600bp左右的弥散带,每个片段在转座酶的作用下直接连接适合illumina测序平台的接头;
(5)长片段核酸文库的获得
将(4)步中获得的连上illumina测序平台接头的连接产物通过PCR扩增,筛选构建好的文库;通过HiSeq2500进行上机测序,并对测序结果进行分析。
4.如权利要求3所述的一种长片段核酸文库构建方法,其特征在于,其中步骤(1)具体步骤为:
①基因组DNA破碎
利用雾化的方法将基因组DNA破碎,获得集中带为2-10Kbp的弥散条带,在该区间内根据需要回收目的片段并纯化;
②末端修复、加A、加接头
用T4DNA聚合酶、T4多聚核苷酸激酶和克列诺酶对纯化好的大片段进行末端修复,并且用PCR产物纯化试剂盒纯化,末端修复纯化后对纯化样品进行加A处理并纯化,用T4DNA连接酶加接头,接头为MACCA,序列为:
F:’-ACTTCCATCCCCCATCCCCCATCCCCCATCCCGCTCTTCCGATCT
R:5’-GATCGGAAGAGCACACGTCT
连接完成后纯化连接产物;
③切胶选片段
配制0.6%琼脂糖凝胶,电泳100V、120min后,根据需求选择在2K-10K片段中进行切胶,用大片段回收试剂盒回收2K-10K这一范围内的目的片段;
④目的片段富集
利用扩增回收的目的片段进行PCR扩增富集,并纯化扩增产物。
5.如权利要求4所述的一种长片段核酸文库构建方法,其特征在于,步骤④中,进行PCR扩增富集使用的引物为:
F:5'-ACUTCCAUCCCCCAUCCCCCAUCCCCCAUCCC
R:5'-AGACGTGTGCTCTTCCGATC。
6.如权利要求3所述的一种长片段核酸文库构建方法,其特征在于,其中步骤(2)的所述的长片段DNA捕获Index标签簇的制备方法是:纳米磁珠与64种LF2接头连接,形成
64种LF2接头和纳米磁珠复合物,然后用T4DNA连接酶将包含有Sma I酶切位点的64种AU接头一对一的随机连接在一种LF2上,将连接产物用Sma I进行酶切后再一对一的随机连接在一种连接接头AU、LF2和纳米磁珠复合物上,共计进行3次连接接头AU酶切反应;
所述接头64种LF2接头序列如SEQ ID NO.257-384所示;
所述接头AU序列为如SEQ ID NO.385-512所示。
7.如权利要求3所述的一种长片段核酸文库构建方法,其特征在于,其中步骤(3)的长片段DNA捕获复合物通过以下步骤获得:
①用USER酶处理标记好的长片段DNA捕获Index标签簇;
②目的片段富集产物经USER酶处理后纯化回收;
③长片段DNA捕获复合物的获得
将经USER酶处理后的长片段扩增产物与经USER酶处理后的长片段DNA捕获Index标签簇混合,利用Taq DNA连接酶将长片段DNA连接到长片段DNA捕获Index标签簇的接头上,形成长片段DNA捕获复合物。
8.如权利要求7所述的一种长片段核酸文库构建方法,其特征在于,步骤①酶处理条件为37℃处理150分钟,步骤②酶处理条件为37℃处理60分钟。
9.如权利要求3所述的一种长片段核酸文库构建方法,其特征在于,其中步骤(4)转座酶的体系中,按如下条件反应:55℃,10min;45℃,60min。
10.如权利要求3所述的一种长片段核酸文库构建方法,其特征在于,其中步骤(5)PCR扩增的引物为长扩增引物5、长扩增引物7,
长扩增引物5:5’-TGACGACTACTTCGTTAGCGC,长扩增引物7:5’-TGAAGGTCCTGCGCGTGCATAGATTCGCCTTAGTCTCGTGGGCTCGG。

说明书全文

一种长片段核酸文库的构建方法

技术领域

[0001] 本发明涉及生物信息学领域,特别是涉及一种适用于基因组从头测序组装技术的长片段核酸文库构建方法。

背景技术

[0002] 高通量测序技术又称下一代测序技术,是相对于传统测序技术的一次革命性变革,可以对数百万个DNA分子进行同时测序。高通量测序技术不仅可以进行大规模基因组测序,还可用于基因表达分析、非编码小分子RNA的鉴定、转录因子靶基因的筛选和DNA甲基化等相关研究。
[0003] 全基因组De novo测序也叫做基因组从头测序,是指不依赖于任何已知基因组序列信息对某个物种的基因组进行测序,然后应用生物信息学手段对测序序列进行拼接和组装,最终获得该物种基因组序列图谱。第一个基因组的组装——人类基因组耗时13年,这是一个划时代的事件,同时又给科学家们提出了新的努方向,如何缩短整体时间。随着高通量测序技术的诞生,这一时间显著缩短,一天之内进行人类基因组测序成为可能。对于无参考基因组的物种,de novo组装时间也大大缩短,目前已有部分物种基因组组装完成,其中包括玉米、白菜、猕猴桃,以及中国的国宝大熊猫。但是,在复杂物种基因组组装的过程中,多倍体以及大量的重复序列,已经成为组装的技术壁垒,如果能解决这一问题,将为复杂基因组组装提供强有力的技术支持,提高组装准确性、缩短组装时间。
[0004] 目前,解决多倍体、重复序列对de novo影响的手段,除了生物信息学方法外,还包括实验技术方面的手段,主要有Mate Pair文库制备和长片段核酸分子测序两种,均为illumina公司的实验技术手段。其中Mate Pair文库制备旨在生成一些短的DNA片段,这些片段包含基因组中较大跨度(2-10kb)片段两端的序列,首先将基因组DNA随机打断到特定大小(2-10kb范围可选),然后依次经过末端修复、生物素标记和环化处理,环化后的DNA 分子被随机打断成400-600bp的片段并通过带有链亲和霉素的M280磁珠把带有生物素标记的片段捕获,这些捕获的片段再经末端修饰和加上特定接头后建成Mate Pair文库,经上机测序获得那些较大跨度的片段两端的序列,就极大简化了基因组(框架搭建、空缺区域补充)的复杂性。另外一种技术与Mate Pair一样,同属于illumina公司,其原理与基本流程如下:首先将基因组DNA打断至6-8kb片段,加上定位PCR接头(用于确定10kb片段的5’和3’位置),利用有限稀释来创建几百至几千个DNA分子的样品等份,确保每个孔内只含有少量的长片段分子(减少测序后10kb片段拼接的难度),同时利用长片段扩增技术,使少量10kb分子富集(提供足够的拼接数据),第二次将长片段破碎为短片段,添加可用于Illumina测序系统的双Index接头,构建小片段文库,利用Illumina HiSeq 2000测序,之后利用Velvet Assembler将每个Index的短末端配对读取分别组装,简化了组装问题。这种方法将新一代测序仪的读长有效提高了50倍,同时将错误率降低了几个数量级。但是,上述技术的缺点是在有限稀释过程中,极易受环境微生物基因组的影响,致使有效数据量低。

发明内容

[0005] 本发明的目的在于提供一种长片段核酸文库构建方法,以解决目前针对复杂基因组组装受多倍体、高度杂合和重复序列等因素影响所导致的组装难度大等问题。
[0006] 为了实现本发明的目的,本发明利用自主研发的基于批量Index簇制备的长片段核酸分子批量标记技术,结合常规全基因组重测序建库流程,构建了适合于illumina测序平台的长片段文库,并进行测序及后期的信息分析。技术方案如下:(1)常规长片段文库制备,低循环PCR富集大片段核酸;(2)通过酶切连接的方式,制备两种含有Index的标签簇,第一种是Index标签簇,第二种是大片段捕获标签簇;(3)长片段DNA捕获,将第一步的长片段扩增产物处理后与第二步中大片段捕获标签簇混合,将长片段“挂载”到大片段捕获标签簇上;(4)转座酶打断,将Index标签簇与已“挂载” 长片段的长片段捕获标签簇混合,并用PTP板进行小室化处理,使每个小室中分别包含一个Index标签簇和一个长片段捕获标签簇,在转座酶的作用下,“挂载”在长片段捕获标签簇上的大片段被打断成长度集中在500bp-600bp左右的弥散带,每个片段在转座酶的作用下,直接带有适合illumina测序平台的接头;(5)文库获取,通过PCR扩增,筛选构建好的文库;上机测序及信息分析。
[0007] 首先,本发明提供一种批量制备Index簇的方法,将接头A1分别与链霉亲和素修饰的纳米磁珠连接,形成A1接头和纳米磁珠复合物,然后用T4DNA连接酶将包含有Sma I酶切位点的64种接头A分别随机一对一的连接在A1接头和纳米磁珠复合物上,将连接产物用Sma I进行酶切后再连接接头A,共计进行3次连接接头A酶切反应,最后连接接头A2-14U;
[0008] 所述接头A1共64种,序列如SEQ ID NO.1-128所示;
[0009] 所述接头A共64种,序列如SEQ ID NO.129-256所示;
[0010] 所述接头A2-14U序列为:
[0011] F:5’-ACGCATGACTCAdUCGdUCGGCAGCGdUCAdUCTCGCAGTTG;
[0012] R:5’-CAACdUGCGAGAdUGACGCTGCCGACGATGAGTCATGCGT。
[0013] 其中,本发明所述的纳米磁珠为M280磁珠、M270磁珠、T1或Ci的链霉亲和素修饰的纳米磁珠。
[0014] 进一步,本发明提供一种长片段核酸文库构建方法,包括以下步骤:
[0015] (1)长片段DNA文库的制备
[0016] (2)含标记的标签簇制备
[0017] 通过酶切连接的方式,制备两种含有Index的标签簇,第一种是Index标签簇,第二种是长片段DNA捕获Index标签簇;其中Index标签簇是采用前述的批量制备Index簇的方法,制备含有不同标签的Index标签簇;
[0018] (3)长片段DNA捕获复合物的获得
[0019] (4)二次破碎文库构建
[0020] 将步骤(2)的的Index标签簇与长片段DNA捕获复合物混合,并且用 PTP板进行单孔处理,确保每个PTP板的小孔中分别包含一个Index标签簇和一个已连接大片段的长片段捕获标签簇,在转座酶的作用下,连接在长片段捕获标签簇上的大片段被打断成长度集中在500bp-600bp左右的弥散带,每个片段在转座酶的作用下直接连接适合illumina测序平台的接头;
[0021] (5)长片段核酸文库的获得
[0022] 将(4)步中获得的连上illumina测序平台接头的连接产物通过PCR扩增,筛选构建好的文库;通过HiSeq2500进行上机测序,并对测序结果进行分析。
[0023] 其中步骤(1)具体步骤为:
[0024] ①基因组DNA破碎
[0025] 利用雾化的方法将基因组DNA破碎,获得集中带为2-10Kbp的弥散条带,在该区间内根据需要回收目的片段并纯化;
[0026] ②末端修复、加A、加接头
[0027] 用T4DNA聚合酶、T4多聚核苷酸激酶和克列诺酶对纯化好的大片段进行末端修复,并且用PCR产物纯化试剂盒纯化,末端修复纯化后对纯化样品进行加A处理并纯化,用T4DNA连接酶加接头,接头为MANNN,序列为:
[0028] F:’-ACTTNNNTCCCNNNTCCCNNNTCCCNNNTCCCGCTCTTCCGATCT
[0029] R:5’-GATCGGAAGAGCACACGTCT
[0030] 连接完成后纯化连接产物;
[0031] ③切胶选片段
[0032] 配制0.6%琼脂糖凝胶,电泳100V、120min后,根据需求选择在2K-10K片段中进行切胶,用大片段回收试剂盒回收2K-10K这一范围内的目的片段;
[0033] ④目的片段富集
[0034] 利用扩增回收的目的片段进行PCR扩增富集,并纯化扩增产物。
[0035] 本发明的一种长片段核酸文库构建方法步骤(1)的步骤④中,进行PCR 扩增富集时使用的引物为:
[0036] F:5'-ACUTCCAUCCCCCAUCCCCCAUCCCCCAUCCC
[0037] R:5'-AGACGTGTGCTCTTCCGATC。
[0038] 本发明方法中,步骤(2)的所述的长片段DNA捕获Index标签簇的制备方法是:纳米磁珠与64种LF2接头连接,形成64种LF2接头和纳米磁珠复合物,然后用T4DNA连接酶将包含有Sma I酶切位点的64种AU接头一对一的随机连接在一种LF2上,将连接产物用Sma I进行酶切后再一对一的随机连接在一种连接接头AU、LF2和纳米磁珠复合物上,共计进行3次连接接头AU酶切反应;
[0039] 所述接头64种LF2接头序列如SEQ ID NO.257-384所示;
[0040] 所述接头AU序列为如SEQ ID NO.385-512所示。
[0041] 本发明方法中,其中步骤(3)的长片段DNA捕获复合物通过以下步骤获得:
[0042] ①用USER酶处理标记好的长片段DNA捕获Index标签簇;
[0043] ②目的片段富集产物经USER酶处理后纯化回收;
[0044] ③长片段DNA捕获复合物的获得
[0045] 将经USER酶处理后的长片段扩增产物与经USER酶处理后的长片段DNA捕获Index标签簇混合,利用Taq DNA连接酶将长片段DNA连接到长片段DNA捕获Index标签簇的接头上,形成长片段DNA捕获复合物。
[0046] 在步骤(3)中,步骤①酶处理条件为37℃处理150分钟,步骤②酶处理条件为37℃处理60分钟。
[0047] 在本发明提供的一种长片段核酸文库构建方法中,步骤(5)PCR扩增采用的引物为长扩增引物5和长扩增引物7,长扩增引物5:
[0048] 5’-TGACGACTACTTCGTTAGCGC,长扩增引物7:
[0049] 5’-TGAAGGTCCTGCGCGTGCATAGATTCGCCTTAGTCTCGTGGGCTCG G。
[0050] 进一步地,在步骤(5)中,将构建好的文库通过HiSeq2500进行上机 测序,同时检测每条测序片段中所含Index数,并计算测序片段中加上不同Index数的比例,确定是否能4
够产生1677万多种不同的Index标签簇(因为接头A1、A、LF2、AU各有64种,那么64即为16777216种),确定加上不同Index的片段数有多少,能否达到每一个单分子被不同的Index标签数捕获,用于后续的单分子测序和拼接。
[0051] 本发明中接头A1、A、LF2、AU各有64种。其中A1的64个接头中,其上游序列和下游序列拥有共同的骨架序列,即“TGACGACTAC TTCGTTAGCG CTACAGTCGT T”和“AACGACT GTAGCGCTAA CGAAGTAGTC GTCA”,64种A1接头的不同点在于上游序列骨架之后还有不同的3个基作为分子标签,下游序列骨架之前还有不同的3个碱基作为分子标签。如SEQ ID NO.1-128所示的64种A1接头,它们的反应条件、连接方式等均为相似的,不同之处仅为连接了不同的分子标签,因此本领域技术人员知晓,A1的64种接头的任意一种接头用于进行连接反应,其作用和效果都是相同的。A、LF2、AU的64种接头均同此情形。
[0052] 本发明具有下列优点及有益效果:
[0053] (1)本发明提供的一种批量制备Index簇的方法,每一个Index簇包含的每一个Index都与该簇上其他的Index是同样的,不同Index簇包含不同的Index簇,应用于单分子测序技术;
[0054] (2)一种批量标记核酸分子的手段,同时能形成1677万种标记核酸分子,可用于肿瘤诊断,癌细胞定量等研究领域;
[0055] (3)结合传统重测序实验流程,构建出长片段核酸文库,间接上极大程度延长了illumina测序平台的读长;
[0056] (4)长片段核酸测序的实现,将为解决复杂基因组的组装问题,提供有力的技术保障。本发明方法有效地解决了基因组从头测序技术中出现的多倍体、重复序列影响组装准确性的问题,可用于复杂基因组的组装,辅助de novo测序组装,提高组装准确性,缩短组装时间。附图说明
[0057] 图1是大片段核酸文库制备过程中雾化处理破碎后片段分布情况图,M:1kb DNA Ladder,1:破碎后的长片段DNA。
[0058] 图2是大片段核酸文库制备过程中选片段——切胶前后电泳图。其中,A图为长片段DNA文库片段选择切胶后电泳图,B图为长片段DNA文库片段选择切胶前电泳图,其中M1:1kb DNA Ladder,M2:DL15,000DNA Marker,1:破碎后的长片段DNA。
[0059] 图3是大片段核酸文库制备过程中琼脂糖凝胶电泳检测PCR扩增效果图,A图为5K扩增效果图,B图为6K扩增效果图。
[0060] 图4是大片段核酸文库获取步骤中基于标签簇的文库PCR扩增电泳图检查结果,左边D1-D4为纯化前效果图,右边D1-D4为纯化后效果图。
[0061] 图5是上机文库获取电泳图,左边D1-D4为纯化前效果图;右边D1-D4为纯化后效果图,CK为空白对照。
[0062] 图6为10K片段破碎图。是大片段核酸文库制备过程中雾化处理破碎后片段分布情况图,M:1kb DNA Ladder,M2:DL15,000DNA Marker,C27:样品C27分四次破碎后的长片段DNA。
[0063] 图7为10K片段切胶图。大片段核酸文库制备过程中选片段——切胶后电泳图。其中M:1kb DNA Ladder,C27:破碎后的长片段DNA。
[0064] 图8为10K片段扩增图。是大片段核酸文库制备过程中琼脂糖凝胶电泳检测PCR扩增效果图。
[0065] 图9为是实例2大片段核酸文库获取步骤中基于标签簇的文库PCR扩增电泳图检查结果。1:PCR产物,M:100bp DNA ladder。
[0066] 图10为是实例2上机文库获取电泳图。1:上机文库,CK:空白对照,M:100bp DNA ladder。
[0067] 图11为拼接片段长度分布图。横坐标:片段长度kbp,纵坐标:该拼接长度的片段数。
[0068] 图12为拼接片段染色体分布图。1、2、3、4、5:不同染色体编号。

具体实施方式

[0069] 以下实施例用于说明本发明,但不用来限制本发明的范围。
[0070] 实施例1长片段核酸文库构建方法
[0071] (1)大片段文库的制备
[0072] ①基因组DNA破碎
[0073] 将20μg(Nanodrop定量)稻日本晴基因组DNA样品,利用雾化的方法将基因组DNA破碎,获得集中带为5K和6K的弥散条带,分别回收5K和6K片段,电泳检测情况见图1;
[0074] ②末端修复、加A、加接头
[0075] 用T4DNA聚合酶、T4PNK和克列诺酶对纯化好的大片段进行末端修复并且用PCR产物纯化试剂盒纯化。末端修复纯化后对纯化样品进行加A处理和纯化,用T4DNA连接酶加接头,接头为MACCA(MANNN中NNN固定位CCA,验证接头连接效率),为Invitrogen公司合成,序列为:
[0076] F:’-ACTTCCATCCCCCATCCCCCATCCCCCATCCCGCTCTTCCGATCT;
[0077] R:5’-GATCGGAAGAGCACACGTCT)连接完成后纯化连接产物;
[0078] ③切胶选片段
[0079] 配制0.6%琼脂糖凝胶,电泳100V、120min后进行切胶选择5K和6K片段,用大片段回收试剂盒回收5K和6K的目的片段,切胶前后见图2;
[0080] ④目的片段富集
[0081] 分两个PCR管扩增回收5K和6K片段(Invitrogen合成,PCR引物序列为F:5'-ACUTCCAUCCCCCAUCCCCCAUCCCCCAUCCC,
[0082] R:5'-AGACGTGTGCTCTTCCGATC),获得足够数量的起始长片段,琼脂糖凝胶电泳检测PCR扩增效果图见图3。
[0083] (2)含Index标签簇制备
[0084] 通过酶切连接的方式,制备两种含有Index的标签簇,第一种是Index标签簇,第二种是大片段DNA捕获标签簇:
[0085] Index标签簇制备
[0086] 将 接 头A1( 序 列 为F:5’-TGACGACTAC TTCGTTAGCG CTACAGTCGT TCCA,R:5’-TGGAACGACT GTAGCGCTAA CGAAGTAGTC GTCA)连接到M280磁珠上,用T4DNA连接酶将包含有Sma I酶切位点的接头A(为Invitrogen合成,序列为:
[0087] F:5’-TGACTGCCAC TAGGCTTCAA TGGCCCGGG
[0088] R:5’-CCCGGGCCAT TGAAGCCTAG TGGCAGTCA)连接在A1上,将连接产物用Sma I进行酶切后再连接接头A,共计进行3次连接接头A-酶切反应,最后连接接头A2-14U(为Invitrogen合成,序列为:
[0089] F:5’-ACGCATGACTCAUCGUCGGCAGCGUCAUCTCGCAGTTG
[0090] R:5’-CAACUGCGAGAUGACGCTGCCGACGATGAGTCATGCGT)。
[0091] ②长片段DNA捕获Index标签簇的制备
[0092] 将接头LF2(为Invitrogen合成,序列为:
[0093] F:5’-GATGGACCGA CACTCTTTCC CTACACGACT TCCA
[0094] R:5’-TGGAagducgt gtagggaaag agtgtcggtc catc)连接到M280磁珠上,用T4DNA连接酶将包含有Sma I酶切位点的AU(为Invitrogen合成,序列为:
[0095] F:5’-Gactgccact aggcdutcaaCCACCCGGG
[0096] R:5’-CCCGGGTGGT TGAAGCCTAG TGGCAGTC)连接在LF2上,将连接产物用Sma I进行酶切后再连接接头AU,共计进行4次连接接头AU-酶切反应。
[0097] (3)长片段DNA捕获复合物的获得
[0098] 用USER酶处理标记好的长片段DNA捕获Index标签簇,酶处理条件为37℃处理150分钟,目的片段富集产物经USER酶处理后纯化回收,酶处理条件为37℃处理60分钟;
将经USER酶处理后的目的片段富集产物与经USER酶处理后的长片段DNA捕获Index标签簇混合,利用Taq DNA Ligase将目的片段富集产物的长片段扩增产物连接到长片段DNA捕获Index标签簇的接头上,得到长片段DNA捕获复合物。
[0099] (4)转座酶打断(小片段文库构建)
[0100] 表1 实验处理方法
[0101]
[0102] 注:D1-D4表示处理1-4;CCA表示处理中所加的Index标签簇;LF2A表示捕获的是5K长片段DNA;LF2B表示捕获的是6K长片段DNA,其中D1和D2为LF2A两个重复,D3和D4是LF2B两个重复;R1和R2分别为转座酶连接的转座酶接头。
[0103] 进行转座酶片段化,其中D1和D2按如下步骤进行:
[0104] 等体积混合制备好Index的标签簇和连接了长片段DNA的Index标签簇,用PTP板进行小室化处理,在转座酶的体系中,按如下条件反应:55℃,10min;45℃,60min。连接在长片段DNA捕获Index标签簇上的大片段被打断成长度集中在500bp-600bp左右的弥散带,每个片段在转座酶的作用下直接连接适合illumina测序平台的接头;
[0105] D3和D4按下面步骤进行:
[0106] 等体积混合制备好Index的标签簇和连接了长片段DNA的标签簇,在转座酶的体系中,按如下条件反应:55℃,10min;45℃,60min。连接在长片段捕获标签簇上的大片段被打断成长度集中在500bp-600bp左右的弥散带,每个片段在转座酶的作用下直接连接适合illumina测序平台的接头;
[0107] (5)文库获取
[0108] 将(4)步中获得的连上illumina测序平台接头的连接产物通过PCR扩增,i5/i7-long端引物(均为Invitrogen公司合成,序列分别为:
[0109] 长扩增引物55’-TGACGACTACTTCGTTAGCGC,
[0110] 长扩增引物7
[0111] 5’-TGAAGGTCCTGCGCGTGCATAGATTCGCCTTAGTCTCGTGGGCTCG
[0112] G)按照每50μl反应体系加入2.1ul i5/i7-long混合物添加:
[0113] 反应体系为50μl,按如下程序反应:
[0114] 98℃,30s;16个循环(98℃,10s;65℃,30s;72℃,30s);72℃,5min。取PCR上清液,纯化后电泳检测,结果见图4。
[0115] (6)上机文库的获取
[0116] 将文库进行Qubit定量后,将D1,D2,D3和D4文库进行末端加A、连接标准接头等步骤后,进行16循环的文库PCR扩增,用琼脂糖凝胶电泳检测文库构建情况,见图5。
[0117] (7)上机测序后的信息分析
[0118] 通过HiSeq2500进行上机测序,利用生物信息学软件对测序结果进行分析,统计随机Index的制备情况,结果见表2。通过标签制备、大片段捕获和测序,一共分别获得1956041、1556375、1485623和1993805reads,其中4个处理中,分别含有1579204、1245167、
1229178和1603009reads含有A1接头,分别占所有Index的比例为80.73%、80.00%、
82.74%和80.40%。含有A1+index+A2+R1接头的reads分别为141796、198587、103304和
137895条。该预实验的整体Index制备效率分别为7.47%、7.92%、8.40%和8.60%,分别制备了141796、198587、103304和137895个Index标签簇,能够捕获相应数量的单分子大片段,捕获的大片段能够分别组装,然后用于复杂基因组、多倍体和重复序含量高的基因组组装。
[0119] 表2 测序结果
[0120]
[0121]
[0122] 实施例2长片段核酸文库构建方法和序列拼接
[0123] (1)大片段文库的制备
[0124] ①基因组DNA破碎
[0125] 将20μg(Nanodrop定量)水稻日本晴基因组DNA样品,样品编号为C27,利用雾化的方法将基因组DNA破碎,获得集中带为10K的弥散条带,分别回收10K片段,电泳检测情况见图6;
[0126] ②末端修复、加A、加接头
[0127] 用T4DNA聚合酶、T4PNK和克列诺酶对纯化好的大片段进行末端修复并且用PCR产物纯化试剂盒纯化。末端修复纯化后对纯化样品进行加A处理和纯化,用T4DNA连接酶加接头,接头为MANNN,Invitrogen公司合成,序列为:
[0128] F:’-ACTTNNNTCCCNNNTCCCNNNTCCCNNNTCCCGCTCTTCCGATC T;
[0129] R:5’-GATCGGAAGAGCACACGTCT)连接完成后纯化连接产物;
[0130] ⑤切胶选片段
[0131] 配制0.6%琼脂糖凝胶,电泳100V、120min后进行切胶选择10K片段,用大片段回收试剂盒回收10K的目的片段,切胶后见图7;
[0132] ⑥目的片段富集
[0133] 分两个PCR管扩增回收10K片段(Invitrogen合成,PCR引物序列为
[0134] F:5'-ACUTNNNUCCCNNNUCCCNNNUCCCNNNUCCC,
[0135] R:5'-AGACGTGTGCTCTTCCGATC),获得足够数量的起始长片段,琼脂糖凝胶电泳检测PCR扩增效果图见图8。
[0136] (2)含Index标签簇制备
[0137] 通过酶切连接的方式,制备两种含有Index的标签簇,第一种是Index标签簇,第二种是大片段DNA捕获标签簇:
[0138] ①Index标签簇制备将接头A1(见序列表1-128)连接到M280磁珠上,用T4DNA连接酶将包含有Sma I酶切位点的接头A(为Invitrogen合成,见序列表129-256)连接在A1上,将连接产物用Sma I进行酶切后再连接接头A,共计进行3次连接接头A-酶切反应,最后连接接头A2-14U(为Invitrogen合成,)
[0139] ②长片段DNA捕获Index标签簇的制备
[0140] 将接头LF2(为Invitrogen合成,见序列表257-386),连接到M280磁珠上,用T4DNA连接酶将包含有Sma I酶切位点的AU(为Invitrogen合成,见序列表387-512)连接在LF2上,将连接产物用Sma I进行酶切后再连接接头AU,共计进行4次连接接头AU-酶切反应。
[0141] (3)长片段DNA捕获复合物的获得
[0142] 用USER酶处理标记好的长片段DNA捕获Index标签簇,酶处理条件为37℃处理150分钟,目的片段富集产物经USER酶处理后纯化回收,酶处理条件为37℃处理60分钟;
将经USER酶处理后的目的片段富集产物与经USER酶处理后的长片段DNA捕获Index标签簇混合,利用Taq DNA Ligase将目的片段富集产物的长片段扩增产物连接到长片段DNA捕获Index标签簇的接头上,得到长片段DNA捕获复合物。
[0143] (4)转座酶打断(小片段文库构建)
[0144] 进行转座酶片段化,步骤如下:
[0145] 等体积混合制备好Index的标签簇和连接了长片段DNA的Index标签簇,用PTP板进行小室化处理,在转座酶的体系中,按如下条件反应:55℃,10min;45℃,60min。连接在长片段DNA捕获Index标签簇上的大片段被打断成长度集中在500bp-600bp左右的弥散带,每个片段在转座酶的作用下直接连接适合illumina测序平台的接头;
[0146] (5)文库获取
[0147] 将(4)步中获得的连上illumina测序平台接头的连接产物通过PCR扩增,i5/i7-long端引物(均为Invitrogen公司合成,序列分别为:
[0148] 长扩增引物55’-TGACGACTACTTCGTTAGCGC,
[0149] 长扩增引物7
[0150] 5’-TGAAGGTCCTGCGCGTGCATAGATTCGCCTTAGTCTCGTGGGCTCG G)按照每50μl反应体系加入2.1ul i5/i7-long混合物添加:
[0151] 反应体系为50μl,按如下程序反应:
[0152] 98℃,30s;16个循环(98℃,10s;65℃,30s;72℃,30s);72℃,5min。取PCR上清液,纯化后电泳检测,结果见图9。
[0153] (6)上机文库的获取
[0154] 将文库进行Qubit定量后,将D1,D2,D3和D4文库进行末端加A、连接标准接头等步骤后,进行16循环的文库PCR扩增,用琼脂糖凝胶电泳检测文库构建情况,见图10。
[0155] (7)上机测序后的信息分析
[0156] 通过HiSeq2500进行PE125上机测序,统计随机Index的制备情况。通过标签制备、大片段捕获和测序,一共获得195M reads,含有A1+index+A2+R1接头的reads分别为184M,制备了16.5M个Index标签簇。然后用SOPdenovo软件对这些reads进行拼接,拼接出不同长度片段共15.9M条,片段长度主要分布在7-11K之间,约为82%,结果见图11。同时分析了片段在拟南芥上的分布情况,发现这些片段在不同染色体上的分布均匀,覆盖度达到95%以上(图12)。
[0157] 上文虽然已对本发明以及其实施方式做了详尽的描述,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以对相应的条件等做一些改进,这些改进也应视为本发明的保护范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈