首页 / 专利库 / 生物工程 / 扩增子 / 扩增子文库及其构建方法

扩增子文库及其构建方法

阅读:655发布:2020-05-12

专利汇可以提供扩增子文库及其构建方法专利检索,专利查询,专利分析的服务。并且本 发明 提供了一种 扩增子 文库及其构建方法。该构建方法包括以下步骤:S1,对多样本的目的 片段 进行PCR扩增,得到多个扩增产物;S2,对多个扩增产物进行等量混合,得到混合产物;S3,对混合产物依次进行片段化、末端修复和3’末端加“A”,得到带“A”修复产物;S4,采用PCR-free的接头对带“A”修复产物进行接头连接,得到扩增子文库。通过将扩增产物进行等量混合和使用优化的PCR-free进行接头连接,使得该方法避免了PCR产生的偏好性和环境样本中的嵌合体,使不同样本间的测序数据均一性好,使后续的 聚类分析 和技术重复性更合理、更准确,能更真实地反应环境样品间的进化关系。,下面是扩增子文库及其构建方法专利的具体信息内容。

1.一种扩增子文库的构建方法,其特征在于,所述构建方法包括以下步骤:
S1,对多样本的目的片段分别进行PCR扩增,得到多个扩增产物;
S2,对所述多个扩增产物进行等量混合,得到混合产物;
S3,对所述混合产物依次进行末端修复和3’末端加“A”,得到带“A”修复产物;
S4,采用PCR-free的接头对所述带“A”修复产物进行接头连接,得到所述扩增子文库。
2.根据权利要求1所述的构建方法,其特征在于,所述步骤S1中,采用带有样本特异标签序列的扩增引物对所述多样本的目的片段分别进行PCR扩增,得到所述多个扩增产物。
3.根据权利要求1所述的构建方法,其特征在于,在所述步骤S1后,以及所述步骤S2之前,还包括对所述多个扩增产物进行纯化的步骤,优选采用磁珠对所述多个扩增产物进行纯化;更优选采用等体积的磁珠对所述多个扩增产物进行纯化。
4.根据权利要求3所述的构建方法,其特征在于,在所述纯化的步骤后,还包括对所述多个扩增产物进行定量的步骤,优选采用分光光度计对所述多个扩增产物进行定量。
5.根据权利要求1所述的构建方法,其特征在于,在所述步骤S2之后,以及在所述步骤S3之前,还包括对所述混合产物进行电泳切胶纯化的步骤。
6.根据权利要求1所述的构建方法,其特征在于,在所述步骤S3中,采用The NEBNext Ultra End Repair/dA-Tailing Module进行末端修复和3’末端加“A”,得到所述带“A”修复产物。
7.根据权利要求1所述的构建方法,其特征在于,所述PCR-free的接头包括Illumina接头序列、文库标签序列以及目的片段测序引物序列。
8.根据权利要求1所述的构建方法,其特征在于,在所述步骤S4中,采用Truseq试剂盒中的PCR-free的接头进行接头连接,得到所述扩增子文库。
9.根据权利要求1或8所述的构建方法,其特征在于,在所述步骤S4中,在所述接头连接步骤后,以及得到所述扩增子文库之前,还包括对连上接头的带“A”修复产物进行纯化的步骤。
10.一种扩增子文库,其特征在于,采用权利要求1至9中任一项所述的构建方法构建而成。

说明书全文

扩增子文库及其构建方法

技术领域

[0001] 本发明涉及高通量测序领域,具体而言,涉及一种扩增子文库及其构建方法。

背景技术

[0002] 生命体遗传信息的快速获得对于生命科学的研究有着十分重要的意义。第一代测序仪对电泳分离技术的依赖,使其难以进一步提高分析的速度和并行化程度,也难以通过微型化降低测序成本。经过不断的技术开发和改进,21世纪初,以Roche 454技术、illumina公司的Genome Analyzer技术和ABI公司的Solid技术为标记的第二代测序技术诞生了。第二代技术大大降低了测序成本,还大幅度提高了测序速度并保持了高准确性。其中,illumina公司的第一台测序仪于2006年问世,之后开发出来一系列的测序仪,如Hiseq2000、Hiseq2500、Miseq、Hiseq X等,在准确性、通量、成本和速度方面表现更优秀,而使其成为全球使用量最大的第二代测序仪。在第二代测序平台不断完善的同时,以对单分子DNA进行非PCR测序为主要特征的第三代测序技术也初显端倪,但由于其关键技术问题尚待解决,目前还未得到广泛应用。
[0003] 环境中生物的群落结构和多样性是微生物生态学的研究热点。微生物多样性的研究涉及农业、土壤、林业、海洋、矿井、人体医学等诸多领域。传统研究手段存在实验操作费时费、不可培养性、无法检测痕量微生物、无法探索未知等的局限性。第二代高通量测序技术(尤其是illumina Miseq高通量测序技术)的成熟和普及,使我们能够对环境微生物进行深度测序,灵敏地检测环境样品在细菌、真菌、古菌分类方面物种之间的差异,精确指导不同环境微生物的构成。
[0004] 扩增子测序是对特定长度的PCR产物或者捕获的片段进行测序,不仅包括16S rDNA测序,还包括18S rDNA测序、ITS测序及功能基因检测等。采用illumina MiSeq第二代高通量测序平台对来源于不同环境样本进行16S/18S/ITS某个高变区域深度测序,能灵敏地探测出环境微生物群落结构随外界环境的变化而发生的极其微弱的变化,对于我们研究微生物与环境的关系,环境治理和微生物资源的利用有着重要的理论和现实意义。
[0005] 16S rDNA是编码细菌核糖体小亚基的DNA序列,分子大小约1540bp,由9个可变区和10个保守区交叉排列组成。保守区能反映物种间亲缘关系,可变区在不同菌种间存在差异。根据保守区序列设计引物,将可变区扩增出来进行测序,通过测序数据与相应数据库的比对,即可确定微生物在进化树中的位置,从而鉴定样本中可能存在的微生物种类。研究表明,V4靶基因区域(约300bp)对微生物进行分类较为准确。
[0006] 基于illumina测序平台的16S V4区扩增子样本的建库方法目前主要有三种。第一种方法为使用较早且广泛的PCR扩增建库法,即在建库过程中包含PCR扩增步骤。首先把混合产物切胶纯化;然后依次进行末端修复,加“A”,加Pair-end接头(在序列两端引入illumina测序引物序列)并纯化;最后以混合样品为模板进行PCR扩增反应(引入完整的illumina接头序列、index序列以及测序引物序列),再次纯化后,即可完成文库构建。
[0007] 第二种方法为illumina官方推荐的一步扩增法,即通过一步PCR完成建库过程。该方法使用包含16S V4区上游保守序列以及illumina P5端接头序列作为上游引物,16S V4区下游保守序列、index序列以及illumina P7端接头序列作为下游引物进行PCR扩增,产物混池后即可完成建库。
[0008] 第三种方法为Truseq PCR-free建库法,即完全应用Truseq PCR-free试剂盒构建文库。首先把混合产物切胶纯化;然后依次进行末端修复,加“A”,加PCR-free接头(连接完整的illumina接头序列、index序列以及测序引物序列);最后磁珠纯化后,即可完成文库构建。
[0009] 上述构建方法中,对携带标签序列的PCR扩增产物进行纯化和定量的方法主要有两种。第一种方法是在PCR扩增后,采用PCR产物回收试剂盒纯化,利用分光光度计定量,然后等摩尔量混合;第二种方法是在PCR扩增后,把PCR产物单独切胶回收和Qubit定量,然后等摩尔量混合。
[0010] 其中,第一种纯化定量的均一化方法无法除去PCR产物中的引物二聚体,影响分光光度计对目标片段的准确定量,使样本间无法真正地等摩尔量混合,而使测序数据的均一性较差,加测样本比例较高,项目周期无法保证;第二种纯化定量的均一化方法,胶回收效率较低,导致PCR产物损失较多,使建库起始量无法保证在正常范围内,进而影响建库成功率。同时操作繁琐,试剂成本较高。
[0011] 然而,在采用上述PCR扩增建库方法对如16S rDNA或者ITS等文库进行构建时,由于16S rDNA或者ITS等在扩增过程中使用的是混合模板,而且这些模板之间序列的相似性很高,所以基因组总DNA在16S rDNA扩增时容易出现错误,产生一些在环境中原本并不存在的“16S rDNA”序列。其中chimeria(嵌合体)和heteroduplex(异源双链)对文库的构建影响较大。嵌合体是在PCR的过程中来自不同微生物的16S rDNA发生共扩增造成的,当以微生物A的16S rDNA为模板进行扩增时,有可能由于延伸不完全,产生微生物A不完全的16SrDNA单链分子,而在下一轮PCR扩增时,它就可能与另一种序列相近的微生物B的16S rDNA分子退火,并自身作为引物以微生物B的16S rDNA分子为模板延伸,产生一个一部分来自于微生物A而另一部分来自于微生物B的嵌合体16S rDNA分子,这就叫做嵌合体。这种原始样品中并不存在的嵌合体分子,会使我们过高估计环境中微生物的多样性。异源双链是在PCR反应进入平台期以后,由于引物和模板之间的比例急剧降低,造成引物与模板之间退火的机率减小,而序列相近的模板之间退火的机率增加,这些序列相近的16S rDNA分子之间退火就形成了异源双链。信息分析表明,这种建库方法使样本间的生物学聚类不合理(有文库趋同的现象),同一样本的技术重复性差。
[0012] 而在采用一步扩增建库法对上述样本进行建库时,在上机测序时,不能使用illumina Miseq相配套的试剂进行测序,需要自定义测序引物,即单独合成16S V4区上游保守序列作为P5端测序引物,16S V4区下游保守序列引物作为P7端测序引物,16S V4区下游保守序列的反向序列作为index的测序引物,同时需要合成特制的Phix文库。一步扩增文库上机测序时,只能和相同可变区的扩增子文库混为一个运行通道(run),这样不仅影响排机测序灵活性,而且无法保证测序质量
[0013] Truseq PCR-free建库法可以直接使用Illumina Miseq相配套的试剂进行测序,且样本间生物学聚类合理,同一样本的重复性好,但是试剂成本较高(TruSeq DNA PCR-Free Sample Preparation Kit),需要攻克其技术壁垒。
[0014] 因此,如何提供一种操作简单、成本低且得到的不同样本间的测序数据均一性好的扩增子文库构建方法成了一个亟待解决的技术问题。

发明内容

[0015] 本发明的主要目的在于提供一种扩增子文库及其构建方法,以提高所构建文库在测序后所得测序数据的均一性。
[0016] 为了实现上述目的,根据本发明的一个方面,提供了一种扩增子文库的构建方法,该构建方法包括以下步骤:S1,对多样本的目的片段分别进行PCR扩增,得到多个扩增产物;S2,对多个扩增产物进行等量混合,得到混合产物;S3,对混合产物依次进行末端修复和3’末端加“A”,得到带“A”修复产物;S4,采用PCR-free的接头对带“A”修复产物进行接头连接,得到扩增子文库。
[0017] 进一步地,步骤S1中,采用带有样本特异标签序列的扩增引物对多样本的目的片段进行PCR扩增,得到扩增产物。
[0018] 进一步地,在步骤S1后,以及步骤S2之前,还包括对多个扩增产物进行纯化的步骤,优选采用磁珠对多个扩增产物进行纯化;更优选采用等体积的磁珠对多个扩增产物进行纯化。
[0019] 进一步地,在纯化后,还包括对多个扩增产物进行定量的步骤,优选采用分光光度计对多个扩增产物进行定量。
[0020] 进一步地,在步骤S2之后,以及在步骤S3之前,还包括对混合产物进行电泳切胶纯化的步骤。
[0021] 进一步地,在步骤S3中,采用The NEBNext Ultra End Repair/dA-Tailing Module进行末端修复和3’末端加“A”,得到带“A”修复产物。
[0022] 进一步地,PCR-free的接头包括Illumina接头序列、文库标签序列以及目的片段测序引物序列。
[0023] 进一步地,在步骤S4中,采用Truseq试剂盒中的PCR-free的接头进行接头连接,得到扩增子文库。
[0024] 进一步地,在接头连接步骤之后,还包括对带接头片段进行纯化的步骤。
[0025] 根据本发明的另一方面,提供了一种扩增子文库,采用上述任一种构建方法构建而成。
[0026] 应用本发明的技术方案,通过将扩增产物进行等量混合和使用优化的PCR-free进行接头连接,使得本发明的扩增子文库构建方法不仅在低成本、低操作复杂性的前提下实现了测序数据的均一性,而且避免了PCR产生的偏好性和环境样本中的嵌合体,使不同样本间的测序数据均一性好,进而使后续的聚类分析和技术重复性更合理、更准确,是一种优化的应用于扩增子均一性文库构建的方法,所构建的文库更能够真实地反应环境样品间的进化关系。附图说明
[0027] 构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0028] 图1示出了根据本发明一种典型的实施例中扩增子文库构建的流程示意图;
[0029] 图2示出了根据本发明另一种优选的实施例中扩增子文库构建的流程示意图;
[0030] 图3示出了根据本发明一种典型的实施例中经PCR扩增后的扩增产物的电泳检测图;
[0031] 图4示出了根据本发明一种典型的实施例中对所构建的扩增子文库进行库检的结果图;
[0032] 图5示出了采用现有技术中的一种方法所构建的扩增子文库所得数据的聚类效果图;
[0033] 图6示出了采用现有技术中的另一种方法所构建的扩增子文库所得数据的聚类效果图;以及
[0034] 图7示出了采用本发明的方法所构建的扩增子文库所得数据的聚类效果图。

具体实施方式

[0035] 需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
[0036] 正如背景技术部分所提到的,现有技术中的扩增子文库构建方法,尤其是对来源于不同环境的样本进行16S/18S/ITS某个高变区域的扩增子文库进行构建时,存在操作复杂、成本高以及各样本的测序数据均一性差的问题。为了改善解决上述问题,在本发明一种典型的实施方中,提供了一种扩增子文库的构建方法,如图1所示,该构建方法包括以下步骤:S1,对多样本的目的片段进行PCR扩增,得到多个扩增产物;S2,对多个扩增产物进行等量混合,得到混合产物;S3,对混合产物依次进行片段化、末端修复和3’末端加“A”,得到带“A”修复产物;S4,采用PCR-free的接头对带“A”修复产物进行接头连接,得到扩增子文库。
[0037] 本发明的上述构建方法,通过将扩增产物进行等量混合和使用优化的PCR-free进行接头连接,使得本发明的扩增子文库构建方法不仅在低成本、低操作复杂性的前提下实现了测序数据的均一性,而且避免了PCR产生的偏好性和环境样本中的嵌合体,使不同样本间的测序数据均一性好,进而使后续的聚类分析和技术重复性更合理、更准确,是一种优化的应用于扩增子均一性文库构建的方法,所构建的文库更能够真实地反应环境样品间的进化关系。
[0038] 在本发明的上述构建方法中,对于来源于不同环境的样本进行测序,为了区分各样本的环境来源,通常需要对来源于不同环境的样本进行标记。在本发明中,优选在上述步骤S1中,采用带有样本特异标签序列的扩增引物对多样本的目的片段进行PCR扩增,得到多个扩增产物。在实际文库构建中,是在目的片段扩增引物的外侧增加一段6-12bp的基序列作为样本标签序列,不同样本中,该样本标签序列不同。这样便于将多个样本混合在一起进行后续的文库构建步骤,在大规模样本进行扩增子文库构建时,能够省时省力,提高工作效率。
[0039] 在本发明的上述构建方法中,扩增产物进行等量混合的方法有多种,比如可以电泳检测各样本的扩增产物的量,然后根据各扩增产物的扩增条带的亮度强弱进行等量混合或采用分光光度计对各扩增产物进行浓度测量,然后进行等量混合。为了更准确地进行混合,以提高各样本测序数据的均一性。在本发明中,在步骤S1后,以及步骤S2之前,还包括对多个扩增产物进行纯化的步骤,优选采用磁珠对多个扩增产物进行纯化。在本发明一种更优选的实施例中,如图2所示,采用等体积的磁珠对多个扩增产物进行纯化。
[0040] 在本发明中,采用磁珠纯化能够高效回收目的片段。而且,采用等体积的磁珠对多个扩增产物进行纯化还能够针对选择特定大小的目的片段进行高效回收。采用等体积的磁珠纯化未见在生物扩增子文库构建领域的均一化纯化步骤中使用过,本发明通过采用等体积的磁珠对多个扩增产物进行纯化,不仅能够去除引物二聚体的干扰,而且同时还能去除一些RNA、蛋白等杂质的影响,使得后续的等量混合步骤能够混合的更准确。在本发明中,在纯化步骤后,还包括对多个扩增产物进行定量的步骤,优选采用分光光度计对多个扩增产物进行定量。常用的分光光度计,比如NanoDrop或Qubit都能快速、简单、准确地测定扩增产物的浓度,以实现不同样本之间的等摩尔量混合。
[0041] 在本发明的上述构建方法中,在对来源于多个环境的样本的扩增产物进行混合之后,便可进行后续的末端修复和加A步骤。为了进一步提高修复效率,提高建库质量,在本发明一种优选的实施例中,在步骤S2之后,以及在步骤S3之前,还包括对混合产物进行电泳切胶纯化的步骤。采用电泳切胶纯化的方式对混合产物进行纯化,一方面能够选择合适大小扩增产物进行后续操作,另一方面还能够去除扩增步骤中的引物二聚体、蛋白酶、以及非特异性片段等非目标片段,使目的片段更纯。
[0042] 在本发明的上述构建方法中,目的片段是PCR扩增产物,虽然相比超声打断的方式得到的DNA片段具有较少的突出末端或单链DNA片段,但为了防止在PCR过程中可能存在的非完整双链,因而还需要对上述混合的扩增产物进行末端修复的步骤。在上述末端修复和3’末端加“A”步骤中,可以采用常规的步骤进行,只要能够使上述混合片段进行末端修复并在其3’末端加上“A”即可。在本发明中,优选采用The NEBNext Ultra End Repair/dA-Tailing Module进行末端修复和3’末端加“A”,得到带“A”修复产物。NEB公司的文库构建试剂盒中的上述试剂能够使末端修复和3’末端加“A”一步完成,而且修复和“A”的连接效率更高,得到的带“A”修复产物浓度更高。
[0043] 在本发明的上述构建方法中,在步骤S4中,采用Truseq试剂盒中的PCR-free的接头进行接头连接,得到扩增子文库。采用Truseq试剂盒中的PCR-free的接头,不仅能够通过一步操作得到构建好的文库,而且由于采用非PCR扩增的方法得到文库,避免了不同环境样本中的目的片段在PCR扩增时形成嵌合体,从而人为引入微生物的多态性。在上述试剂盒中,PCR-free的接头包括Illumina接头序列、文库标签序列以及目的片段测序引物序列。使用具有上述三种序列组成的PCR-free接头,能够与Illumina Miseq相配套的试剂进行测序,而且得到的测序数据中样本间生物学聚类合理,同一样本的重复性好。
[0044] 在本发明一种更优选的实施例中,使用了NEB建库试剂盒和Truseq PCR-free接头,这在现有的专利文献和发表的文章中都未曾报道过的。本发明中,发现这两者结合的建库方法所构建的文库不仅具有稳定性高和合格率高的特点(合格率98%以上,与Truseq PCR-free试剂盒的合格率持平),而且对样本起始量要求低,建库操作时间短,技术复杂性低。
[0045] 在本发明的上述构建方法中,在接头连接步骤之后即可得到包含目的片段的扩增子文库。为了进一步提高文库的纯度,在本发明一种优选的实施例中,如图2所示,在接头连接之后还包括对带接头片段进行纯化的步骤,可以采用0.8×Ampure XP磁珠进行纯化,能够对带上接头后的文库的大小进行再次选择,得到目的大小更加富集的扩增子文库。
[0046] 在本发明另一种典型的实施方式中,提供了一种扩增子文库,该扩增子文库采用上述任一种文库构建方法构建而成。由于本发明的建库过程没有PCR扩增步骤,不会引入嵌合体和异源二聚体,使得同一样本的技术重复性好,不同样本间的测序数据均一性好,样本间的生物学聚类合理。
[0047] 下面将结合具体的实施例来进一步说明本发明的有益效果。
[0048] (1)收集稀土矿土壤、矸石土壤、油茶土壤、油茶施肥土壤、光合菌液和日本菌剂环境中的土壤,以便对土壤中的微生物样品进行分类或进行进化分析。采用土壤基因组DNA提取试剂盒(DP336,天根),从上述土壤样品中提取微生物的DNA。
[0049] (2)使用琼脂糖凝胶电泳,结合Qubit定量检测基因组DNA的完整性、浓度和污染情况。如果样品中存在大量的RNA需要使用RNase消化。
[0050] (3)根据样品的DNA浓度,将样品进行稀释,使用无菌稀释样品至1ng/μl。
[0051] (4)对16S rDNA的高可变区V4进行扩增。上下游扩增引物由通用目的片段扩增引物和样本标签序列组成。其中,通用的正向引物序列为SEQ ID NO.1:
F-GTGCCAGCMGCCGCGGTAA;反向引物为SEQ ID NO.2:R-GGACTACHVGGGTWTCTAAT;每个样本携带特异的标签序列具体见下表1。扩增反应体系如下(30μl):
[0052]
[0053] 表1:
[0054]
[0055] (5)反应程序如下:
[0056]
[0057] (6)每个样品扩增两个技术重复,并在检测前混合成一管。
[0058] (7)电泳检测PCR产物。对每个样品取3μl进行产物检测,16S V4区为300bp左右,检测如图3。图3中,中间条带为DNA分子大小标记,由下至上的5条分子标记依次为100bp、200bp、300bp、400bp和500bp,可以看出,PCR产物的大小与预期的目的片段大小一致。
[0059] (8)等体积磁珠纯化PCR扩增产物。每个样品取20μl扩增产物,分别加入20μl磁珠进行纯化(如Agencourt AMPure XP磁珠,Beckman),然后用无菌水溶解。
[0060] (9)分光光度计定量后等摩尔量混合。对每个纯化后的扩增产物分别进行分光光度计定量(如Nanodrop),并将同一目的片段的扩增产物取相同的质量混合得到混合产物。由于混合时会是相同片段大小的扩增产物混合成一个文库,所以最终能够实现等摩尔量。
[0061] (10)纯化混合产物中的目的片段并用本发明所优化的PCR-free法完成后续文库构建步骤。
[0062] 将混合产物进行电泳后,用QIAquick Gel Extraction Kit(Qiagen)进行目的片段的胶回收;
[0063] 然后采用NEB公司的The NEBNext Ultra End Repair/dA-Tailing Module和The NEBNext Ultra Ligation Module试剂进行末端修复和加“A”;
[0064] 采用Truseq试剂盒中的PCR-free的接头(包含完整的illumina接头序列、index序列以及测序引物序列)进行PCR-free接头连接;
[0065] 加完接头后,用0.8×Ampure XP磁珠对样品进行纯化。
[0066] (11)对上述文库进行库检,检测结果见图4。由于PCR-free文库所连接头为Y形接头,迁移率较普通平末端文库低,而且从图3所示的扩增产物的检测图来看,上述文库的插入片段为300bp左右,因此根据PCR-free文库的库检经验,图4中,574所示为连上单端接头的片段的峰,1156所示为连上双端接头的片段的峰。该库检图中,仅有两个主峰,表明本发明所构建的文库没有接头污染,具有PCR-free的文库的峰形特点。其余文库也具有相同的峰形特点,因而插入片度合格。合格后即可使用Miseq进行上机测序。
[0067] (12)对获得的数据进行信息分析,并与现有技术的建库方法所构建的扩增子文库的测序数据进行比较,不同样本在不同方法所构建的文库中所产出的拼接后的带标签的(raw tag)序列数目(combined tags)的比较结果见表2。
[0068] 表2:
[0069]
[0070]
[0071] 表2为实施例中所有样本的拼接后序列数目的原始数据。从表2可以看出,与现有技术中不经过纯化且不进行定量或不纯化定量的建库方法相比,采用本发明的建库方法所构建的文库,在所得到的拼接后的带标签(tag)的序列数目方面各有优劣。衡量测序数据中各样本的数据是否具有均一性,还需要对不同方法所构建的文库的均一性的指标进行统计学分析。将表2中的数据通过统计分析得到了定量方法的3种均一性指标,包括变异系数、小于1万条序列(reads)的样本比例、平均值上下30%范围内的样本比例,统计结果如表3所示。
[0072] 表3:
[0073]
[0074] 通过对比表3中不同定量方法的三个均一性指标,可以看出:“磁珠纯化Qubit定量”和“磁珠纯化Nanodrop定量”方法的变异系数(仅为7%左右)显著低于“不纯化不定量”和“不纯化Qubit定量”(高达44%以上)方法;并且小于1W条reads的样本比例和平均值上下30%范围内的样本比例显著高于后者。这三个均一性指标在“磁珠纯化Qubit定量”和“磁珠纯化Nanodrop定量”两种方法间没有显著差异。可见,采用本发明的方法所构建的文库在产出的数据均一性方面取得了预料不到的技术效果。并且“磁珠纯化Nanodrop定量”方法的试剂成本较低,是这3种定量方法中最适用于高品质大规模文库构建的方法。
[0075] 进一步地,发明人还对本发明的方法所构建的文库与现有技术所构建的文库的测序数据在聚类分析方面的特性进行了比较。
[0076] 首先,选了上述表2中稀土矿、煤矸石矿和油茶土壤三种不同来源的土壤,对三种不同来源的土壤中物种的测序数据进行了聚类分析,具体聚类分析结果如图5、6和7所示。在图5、6和7中,A、B、C分别表示上述3三种不同来源的土壤的编号,字母后面的第1个数字表示对每种土壤进行分组的小组编号(按照每种土壤的不同地域进行分组,同种土壤不同小组的物种组成有明显差异);第2个数字表示各小组中的样品编号,第3个数字是技术重复编号(即前面两个数字一样的是同一个样品),第4个数字是文库编号。
[0077] 采用一步扩增建库方法所构建文库的测序数据的聚类分析结果见图4。在图4中,从来源于同一种土壤的各小组的聚类分析来看:“B-5”小组中的B-5-1-1-2和B-5-2-1-2物种组成相近,因而聚类在一起;同样,“C-2”小组中,C-2-1-1-1、C-2-3-1-2、C-2-2-1-1和C-2-2-2-2三个样品的物种组成相近而聚类在一起。从样本的技术重复的聚类来看:“A-2-2-1-1”与“A-2-2-2-2”、“B-1-2-1-1”与“B-1-2-2-2”、“C-2-2-1-1”与“C-2-2-2-2”这3个样本中,每次技术重复之间,由于物种组成接近,能够两两聚类。该聚类分析结果表明:一步扩增的建库方法能实现较合理的聚类,并且技术重复性好。
[0078] 采用PCR扩增建库法所构建文库的测序数据的聚类分析结果见图6。在图6中,从来源于同一种土壤的各小组的聚类分析来看:“A-2”小组的样品由于分在两个文库中而分别和“A-1”、“A-3”小组根据文库聚在一起,“C-2”小组也表现出类似按照文库聚类的特点。从样本技术重复的聚类来看:仅有“B-1-2-6-7”与“B-1-2-7-8”这1个样本的技术重复能聚在一起,“A-2-2-6-7”与“A-2-2-7-8”、“C-2-2-6-7”与“C-2-2-7-8”均不能两两聚类,而表现出按照文库聚类的特点。该聚类分析结果表明:PCR扩增建库方法体现的是按照文库聚类,而非按照样本相似进行聚类,因而聚类不合理,技术重复性差,有文库趋同的现象。
[0079] 采用PCR-free建库法所构建文库的测序数据的聚类分析结果见图7。在图7中,从来源于同一种土壤的各小组的聚类分析来看:“A-2”小组、“B-2”小组和“C-2”小组,由于物种组成接近,分别有5、3和4个样本聚在一起。从样本技术重复的聚类来看:“A-2-2-8-9”与“A-2-2-9-10”、“B-1-2-8-9”与“B-1-2-9-10”、“C-2-2-8-9”与“C-2-2-9-10”这3个样本中,每次技术重复之间由于物种组成接近,能够两两聚类。该聚类分析结果表明:PCR-free建库法的聚类合理,技术重复性好,比一步扩增建库方法的聚类更符合生物学分组。
[0080] 从上述3种建库方法聚类分析的初步结论可以看出:PCR扩增建库法的聚类结果与生物学背景不吻合;本发明的PCR-free的建库方法与现有技术的1步扩增建库法的聚类结果符合生物学预期,但本发明的PCR-free的建库方法的技术重复性更好。
[0081] 从以上的描述中可以看出,本发明上述的实施例实现了如下技术效果:
[0082] (1)采用磁珠纯化与分光光度计定量相结合的均一化方法:试剂成本较低,操作简单,回收效率高,等体积磁珠纯化可以去除PCR产物中的引物二聚体,使分光光度计对目的片段的定量更准确,提高了测序数据的均一性。
[0083] (2)采用优化的PCR-free接头连接:操作简单,节省时间,试剂成本较低,并且可以直接使用illumina Miseq相配套的试剂进行测序。由于建库过程没有PCR扩增步骤,不会引入嵌合体和异源二聚体。而且,测序数据经分析表明,同一样本的技术重复性好,样本间的生物学聚类合理。
[0084] 可见,本发明的上述构建方法通过将操作较简单、回收效率高的纯化方法和准确性好、成本低的定量方法相结合,提高了多个样本间测序数据的均一性;同时采用优化的PCR-free接头连接,不仅提高了样本间的生物学聚类合理性、同一样本的技术重复性,而且降低试剂成本,使扩增子文库构建、上机测序和信息分析更加快捷和准确。
[0085] 以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
[0086]
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈