首页 / 专利库 / 土壤科学 / 土壤微生物区系 / 校正高通量测序原核与真核微生物基因序列读取数的方法及所用菌

校正高通量测序原核与真核生物基因序列读取数的方法及所用菌

阅读:75发布:2020-05-11

专利汇可以提供校正高通量测序原核与真核生物基因序列读取数的方法及所用菌专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种校正菌株E.coli WYL,为大肠杆菌Escherichia coli WYL,保藏编号为CCTCC NO:M 2017770。本发明还同时公开了利用上述校正菌株E.coli WYL进行的校正高通量测序原核与真核 微 生物 基因序列读取数的方法。本发明通过校正菌株的构建及其在样品中的添加,实现样品中原核微 生物群落 16S rRNA基因与真核微生物群落18S rRNA/ITS基因高通量测序读取数量的校正,以弥补 现有技术 的不足,使得样品中原核与真核微生物能更好的统筹,将有利于全面了解样品中微生物的群落结构变化。,下面是校正高通量测序原核与真核生物基因序列读取数的方法及所用菌专利的具体信息内容。

1.校正菌株E.coli WYL,其特征是:为大肠杆菌Escherichia coli WYL,保藏编号为CCTCC NO:M 2017770。
2.利用如权利要求1所述的校正菌株E.coli WYL进行的校正高通量测序原核与真核生物基因序列读取数的方法,其特征是依次包括以下步骤:
1)、将校正菌株E.coli WYL,重悬于无菌中,得菌悬液;
2)、校正菌株的添加:
将步骤1)所得的菌悬液加入至作为待测样品的土壤中,添加浓度为105-107cells g-1,浴环境下搅拌混匀;
3)、样本原核与真核微生物高通量测序:
提取土壤DNA,分别采用原核微生物通用引物515F/806R和真核微生物通用引物ITS-F/ITS-R对原核微生物16S rRNA基因与真核微生物ITS基因进行高通量测序,从而获得原核与真核微生物群落结构分类组成信息及其测序读取数量;
515F 5'-GTGYCAGCMGCCGCGGTAA-3’
806R 5'-GGACTACNVGGGTWTCTAAT-3’
ITS-F 5'-TCCTCCGCTTATTGATATGC-3’
ITS-R 5'-GCATCGATGAAGAACGCAGC-3’
4)、测序数据过滤与注释:
将步骤3)所得的高通量测序数据采用QIIME软件进行质控与过滤;正向与反向测序结果采用FLASH软件进行拼接;采用UPARSE软件将优质序列按97%的相似度归为一个OTU;将校正菌株中人工设计515F/806R及ITS-F/R所对应基信息分别添加进SILVA数据库及Unite数据库,采用包含校正菌株碱基信息的SILVA数据库及Unite数据库分别对原核微生物及真核微生物OTU进行注释;
5)、校正计算:
通过对单个样品中原核微生物16S rRNA基因及真核微生物ITS基因的高通量测序,获得各分类水平及各分类单元的原核微生物群落测得序列数量组成(TaxonPj,j=1,2,
3,……,n)及真核微生物群落测得序列数量组成(TaxonEj,j=1,2,3,……,n),且原核与真核微生物群落中均包含校正菌株的测得序列数量(ASP和ASE);通过校正菌株在原核与真核微生物群落中的16S rRNA基因与ITS基因读取数量的比值获得校正系数 并将真核微生物各分类单元ITS基因读取数量分别乘以ρ,即获得真核微生物群落各分类单元的校正读取数(TaxonEj×ρ,j=1,2,3,……,n);
6)、原核微生物群落(TaxonPj,j=1,2,3,……,n)测得序列数量与校正后的真核微生物群落(TaxonEj_A×ρ1,j=1,2,3,……,n)测得序列数量,即组成土壤样品微生物区系各分类单元总测得序列数量组成。
3.根据权利要求2所述的方法,其特征是:步骤1)所得的菌悬液为OD600nm=0.9~1.1。

说明书全文

校正高通量测序原核与真核生物基因序列读取数的方法及

所用菌

技术领域

[0001] 本发明属于微生物领域,涉及一株细菌菌株染色体基因的改造,并基于该人工改造细菌菌株,提供了一种实现原核微生物与真核微生物的高通量测序结果中基因序列读取数量(Number of reads)校正的技术。

背景技术

[0002] 微生物因其特有的物种丰富度,基因、代谢、生存环境多样性,以及大型动植物无法比拟的快速繁殖、变异速度,具有巨大的挖掘潜能和较高的经济价值。借助高通量测序技术,我们对微生物群落结构的认知正在被逐步推进,而全面解析微生物群落结构与其生存环境间相互作用关系,将成为进一步利用微生物解决农业、医疗、化工、环境等领域中科学问题的关键。
[0003] 目前,高通量测序解析微生物群落结构的原理是基于微生物16S rRNA基因与18S rRNA/ITS(Internal Transcribed Spacer,ITS)基因的差异,分别采用不同的引物对原核微生物群落16S rRNA基因或真核微生物群落18S rRNA/ITS基因进行扩增和分析,独立表征原核微生物与真核微生物的群落结构组成。即,需由两次分别针对原核微生物群落和真核微生物群落结构的高通量测序结果,才可表征某一样品中整个微生物群落结构的变化。通常,高通量测序技术的测序深度为30,000至50,000读取数量(reads),在此测序深度下可较好的平衡测序成本及数据可靠性代表性间的关系。然而,当同一样本中原核与真核微生物的总量存在数量级差异时,分别针对16S rRNA基因与18S rRNA/ITS基因的测序会使得原核微生物总量与真核微生物总量被同时固定为等同的测序深度,从而导致两者间本身的差异被缩小了。例如,土壤样本中存在1.0×109copies g-1的原核微生物,其中变形细菌的数量为3.5×108copies g-1,占据原核微生物总量的35%;与此同时,同一土壤样本中,共有1.0×108copies g-1的真核微生物,包含子囊菌门的数量为8.0×107copies g-1,占据真核微生物总量的80%;当分别对土壤原核和真核微生物进行深度为50,000reads的高通量测序时,即原核和真核微生物的高通量测序样本量均为50,000reads,则理论测得变形菌门(原核微生物)数量为17,500reads,子囊菌门(真核微生物)数量则为40,000reads。当两者进行相互比较时,因为分别的两次测序使得原核微生物总量与真核微生物总量被固定为相同大小的样本,使得本身变形菌门(3.5×108copies g-1,17,500reads)与子囊菌门(8.0×
107copies g-1,40,000reads)间的数量差异被模糊,从而可能得出土壤中子囊菌门真菌数量更多的错误结论。
[0004] 一个样本中,微生物的分类组成成百上千,上述相同测序深度导致的变形菌门与子囊菌门的比较误差只是其中很小一部分。为比较同一样品中,原核微生物与真核微生物间的变化差异,急需一种校正两次高通量测序基因读取数量(Number of reads)的方法,弥补现有分析方法的缺陷,使得原核微生物与真核微生物间变化的比较更为准确,且两者间数据可更好的进行统一,为全面解析样本微生物群落变化及微生物生态研究具有重要意义。

发明内容

[0005] 本发明要解决的技术问题是:通过校正菌株的构建及其在样品中的添加,实现样品中原核微生物群落16S rRNA基因与真核微生物群落18S rRNA/ITS基因高通量测序读取数量的校正,以弥补现有技术的不足,使得样品中原核与真核微生物能更好的统筹,将有利于全面了解样品中微生物的群落结构变化。
[0006] 为解决上述技术问题,本发明提供一种校正菌株E.coli WYL,为大肠杆菌Escherichia coli WYL,保藏编号为CCTCC NO:M 2017770。
[0007] 本发明还同时提供了利用上述校正菌株E.coli WYL进行的校正高通量测序原核与真核微生物基因序列读取数的方法,依次包括以下步骤:
[0008] 1)、将校正菌株E.coli WYL,重悬于无菌中,得菌悬液;
[0009] 2)、校正菌株的添加:
[0010] 将步骤1)所得的菌悬液加入至作为待测样品的土壤中,添加浓度为105-107cells g-1,浴环境下搅拌混匀(搅拌时间约为5min);
[0011] 3)、样本原核与真核微生物高通量测序:
[0012] 提取土壤DNA(提取方法参照MoBio DNA Isolation kit说明书),分别采用原核微生物通用引物515F/806R和真核微生物通用引物ITS-F/ITS-R对原核微生物16S rRNA基因与真核微生物ITS(Internal transcribed spacer)基因进行高通量测序,从而获得原核与真核微生物群落结构分类组成信息及其测序读取数量(Number of reads);
[0013] 4)、测序数据过滤与注释:
[0014] 将步骤3)所得的高通量测序数据采用QIIME软件(version 1.9.0)进行质控与过滤(测序片段<200bp、模糊基>6bp、聚合体>6bp、引物与接头中错配碱基≥1bp、质量低于Q20、具有嵌合体均被剔除,不再进行进一步分析);正向与反向测序结果采用FLASH软件进行拼接;采用UPARSE软件将优质序列(满足测序片段≥200bp、模糊碱基≤6bp、聚合体≤6bp、引物与接头中错配碱基<1bp、质量高于Q20条件的序列)按97%的相似度归为一个OTU(Operational taxonomic unit);将校正菌株中人工设计515F/806R及ITS-F/R所对应碱基信息分别添加进SILVA数据库及Unite数据库,采用包含校正菌株碱基信息的SILVA数据库及Unite数据库分别对原核微生物及真核微生物OTU进行注释;
[0015] 5)、校正计算:
[0016] 通过对单个样品中原核微生物16S rRNA基因及真核微生物ITS基因的高通量测序,获得各分类水平及各分类单元的原核微生物群落测得序列数量组成(TaxonPj,j=1,2,3,……,n)及真核微生物群落测得序列数量组成(TaxonEj,j=1,2,3,……,n),且原核与真核微生物群落中均包含校正菌株的测得序列数量(ASP和ASE);通过校正菌株在原核与真核微生物群落中的16S rRNA基因与ITS基因读取数量的比值获得校正系数 并将真核微生物各分类单元ITS基因读取数量分别乘以ρ,即获得真核微生物群落各分类单元的校正读取数(TaxonEj×ρ,j=1,2,3,……,n);
[0017] 6)、将原核微生物群落(TaxonPj,j=1,2,3,……,n)与校正后的真核微生物群落(TaxonEj_A×ρ,j=1,2,3,……,n)测得序列读取数合并,即为土壤样品微生物区系各分类单元总测得序列数量组成(至此,原核微生物与真核微生物间可进行数量上的相互比较)。
[0018] 作为本发明方法的改进,步骤3)的引物为:
[0019] 表1高通量测序引物信息
[0020]
[0021] 作为本发明方法的进一步改进,步骤1)所得的菌悬液为OD600nm=0.9~1.1(优选1.0,此时菌体浓度约为7.0×108CFU mL-1)。
[0022] 本发明具体如下:
[0023] 校正菌株E.coli WYL的构建,包括如下内容:以菌株Escherichia coli DH5ɑ为受体菌株,通过基因敲入技术,使其染色体基因片段上包含如下基因片段(方框标记碱基为ITS-F/ITS-R引物结合位点,下划线标记碱基为515F/806R引物结合位点):
[0024]
[0025]
[0026] 将包含上述基因片段的菌株命名为Escherichia coli WYL(E.coli WYL),采用25%甘油保存于-80℃条件保存。该菌株保藏于中国典型培养物保藏中心(China Center for Type Culture Collection,CCTCC),保藏编号为M 2017770。
[0027] 校正菌株的培养:离心获取培养14-16h的校正菌株E.coli WYL,重悬于无菌水中,调节菌悬液在紫外分光光度计OD600nm=1.0(此时菌体浓度约为7×108CFU mL-1)。
[0028] 综上所述,本发明提供了一种通过校正菌株的添加,可使得两次分别针对原核微生物16S rRNA基因与真核微生物ITS基因高通量测序的基因读取数量被校正的方法。将校正菌株添加至样品中与土著微生物一同进行高通量测序并分析,不仅可使得同一样品中两次测序获得的原核微生物与真核微生物间数量可以相互比较;与此同时,等量外源校正菌株的添加也可校正不同样品间微生物的数量差异,使得跨样本比较结果更为准确。
[0029] 本发明的发明过程具体如下:
[0030] 微生物分为原核微生物与真核微生物,两类微生物共存于同一生态环境中,存在频繁的相互作用关系。真核微生物可形成菌丝,具有较强的移动性,而原核微生物数量庞大种类丰富,具有较高的物种多样性。有研究表明,真菌菌丝的形成可携带帮助原核微生物完成距离上的迁移;原核与真核相互间也可分泌胞外物质为对方提供能源物质或抑制对方的生长;不仅如此,原核微生物还可生存于真核微生物体内,两者间互利共生。
[0031] 然而,现有高通量测序技术是基于不同的引物分别对原核微生物的16S rRNA基因与真核微生物18S rRNA基因进行扩增和测序鉴定,从而导致微生物区系群落结构的信息需由两次独立的高通量测序完成,与此同时,相同的测序深度使得原核微生物与真核微生物样本被固定为同等大小(30,000-50,000reads),缩小了原核与真核微生物总量间本身可能存在的数量差异,从而进一步导致两次测序数据无法很好的进行合并和统筹,阻碍了原核微生物与真核微生物变化的相互比较及对微生物区系变化的整体评估,限制了我们对微生物群落变化的深入解析。
[0032] 本发明提供一株校正菌株E.coil WYL,其染色体基因上同时包含可稳定遗传的人工设计的16S rRNA基因片段与ITS基因片段,具有较高的特异性,可在两次分别对原核微生物16S rRNA基因与真核微生物ITS基因的高通量测序中同时被测得,使其成为一个恒定的内参菌株,通过其在样品中的添加,可实现原核微生物群落与真核微生物群落高通量测序中测得16S rRNA与ITS基因测得数量的校正。附图说明
[0033] 下面结合附图对本发明的具体实施方式作进一步的详细说明。
[0034] 图1为人工合成片段保存于pUC57质粒图;
[0035] 图2为人工合成片段连接pART2质粒中卡那霉素抗性基因图;
[0036] 图3为敲入片段获得及纯化PCR产物琼脂糖凝胶成像图;
[0037] 图4为阳性克隆PCR产物琼脂糖凝胶成像图;
[0038] 图5为添加校正菌株的土壤样品原核与真核微生物群落高通量测序示意图;
[0039] 图6为土壤样品16S rRNA和ITS基因qPCR结果图;
[0040] 图7为土样A样品内原核与真微生物门水平16S rRNA和ITS基因序列读取数量校正图;
[0041] 图8为土样B样品内原核与真微生物门水平16S rRNA和ITS基因序列读取数量校正图;
[0042] 图9为土样A和B样品间原核与真微生物门水平16S rRNA和ITS基因序列读取数量校正图。

具体实施方式

[0043] 下面结合具体实施例对本发明进行进一步描述,但本发明的保护范围不仅限于此。
[0044] 实施例1、校正菌株构建
[0045] (1)人工合成包含原核与真核微生物高通量测序引物结合位点的目的基因片段,将其保存于pUC57质粒中(GenBank:Y14837.1)(图1);
[0046] (2)使用BamHI和XbaI限制内切酶同时对人工合成片段保存质粒和pART2质粒(GenBank:DQ191047.1)进行酶切后,将含有人工合成序列基因片段插入酶切后的pART2质粒中,使得设计片段与pART2质粒中卡那霉素抗性基因连接(图2);
[0047] (3)结合受体菌株E.coli Dh5ɑ16S rRNA基因序列,选取敲入位点,设计同源臂引物pART2-F1和KanR1对pART2质粒中合成片段及卡那霉素抗性基因进行PCR扩增,PCR反应体系(50μL)为:25μL 2×Super Pfu MasterMix,正、反向引物(pART2-F1、Kan-R1)各1μL(10μM),1μL质粒DNA及22μL ddH2O。
[0048] 反应条件如下:
[0049]
[0050]
[0051] (4)将步骤(3)所得的PCR产物置于琼脂糖(1.5%)凝胶电泳中(图3a),并按照GeneJET Gel Extraction Kit说明书对其进行割胶回收,之后采用引物F2和R2对回收PCR产物进行再次PCR扩增,反应条件同上,重复凝胶电泳(图3b)及割胶回收测序步骤,最终获得DNA敲入片段;
[0052] (5)采用CaCl2法将受体菌E.coli Dh5ɑ制成感受态细胞,并导入工作质粒pKD46(GenBank:MF287367.1),涂布于LB固体培养基(含苄青霉素100μg mL-1)上,37℃过夜培养挑选出阳性单克隆,于液体LB培养基(含氨苄青霉素100μg mL-1)中培养3-5h后,制成含有pkD46质粒的E.coli Dh5ɑ感受态细胞待用;
[0053] (6)吸取10μL步骤(4)中DNA敲入片段加入90μL含有pkD46质粒的E.coli Dh5ɑ感受态细胞,静置5-10min后用2500V,25Ω电击转化。加入1mL LB液体培养基,30℃静置培养2h后涂布于同时含有氨苄青霉素(100μg mL-1)和卡那霉素(50μg mL-1)的LB固体培养基上,30℃过夜培养,随机挑选长出的阳性单克隆用引物F2和R2进行PCR单菌落鉴定;
[0054] (7)将PCR鉴定为阳性的菌株(图4)加到LB液体培养基(含卡那霉素50μg mL-1)37℃过夜活化,将活化的菌株在含有卡那霉素(50μg mL-1)的LB固体培养基上划线培养,长出的单克隆同时点在分别含氨苄青霉素(100μg mL-1)和卡那霉素(50μg mL-1)抗性的LB固体培养基上,37℃培养过夜,挑取仅在含有卡那霉素的平板上生长的单菌落;
[0055] (8)将(7)中挑取单菌落接种于LB液体培养基(含卡那霉素50μg mL-1)中,37℃、250rpm条件下过夜培养后将菌株-80℃保存于25%甘油中。
[0056] 表2校正菌株构建所用引物信息
[0057]
[0058] 将上述菌株(校正菌株E.coli WYL)进行保藏,保藏名称Escherichia coli WYL大肠杆菌WYL,保藏单位:中国典型培养物保藏中心,保藏地址:中国武汉武汉大学,保藏编号:CCTCC NO:M 2017770,保藏时间2017年12月07日。
[0059] 实施例2、利用校正菌株E.coli WYL进行的校正高通量测序原核与真核微生物基因序列读取数的方法,依次进行以下步骤:
[0060] 一、土壤样品中校正菌株的添加
[0061] (1)吸取上述25%甘油保存的校正菌株E.coli WYL菌种200μL于20mL LB液体培养基(含卡那霉素50μg mL-1)中,37℃250rpm条件下培养12h;
[0062] (2)转入50mL无菌离心管中,离心10min(4℃,6000×g);
[0063] (3)弃上清液,加入20mL预冷(预冷至4℃)灭菌超纯水,涡旋使得菌体重悬,相同条件下再次离心。即4℃,6000×g条件下离心10min再使用超纯水重悬,重复该步骤两次;
[0064] (4)最后将菌体重悬浮于预冷灭菌超纯水中,测定紫外吸光度(600nm),稀释至OD600nm=1.0左右;
[0065] (5)吸取400μL上述D600nm=1.0的菌液至4.0g冷冻干燥(-50℃进行冷冻,直至含水率≤2%)土样中,置于冰浴上用无菌玻璃棒搅拌5min。
[0066] 二、土样DNA提取
[0067] 采用MoBio DNA Isolation kit(MoBio Laboratories,USA)及根据试剂盒操作步骤说明书对步骤一所得土壤DNA进行提取,按提取土壤DNA置于-80℃保存待用。
[0068] 三、原核与真核微生物高通量测序
[0069] 将同一土壤DNA样品分别进行原核微生物(古菌和细菌)16S rRNA基因高通量测序与真核微生物(真菌)ITS基因高通量测序(图5)。所选用引物分别为515F/806R和ITS-F/R,具体碱基信息如表1所示。
[0070] 注:
[0071] 原核微生物(古菌和细菌)16S rRNA基因高通量测序,参照Bates et al(2011)文献报道方法进行测序。真核微生物(真菌)ITS基因高通量测序,参照Tedersoo et al(2014)文献报道方法进行测序。
[0072] 测序结果采用QIIME软件包(version 1.9.0)进行分析。测序片段<200bp、模糊碱基>6bp、聚合体>6bp、引物与接头中错配碱基≥1bp、质量低于Q20、具有嵌合体均被剔除,不再进行进一步分析;正向与反向测序结果采用FLASH软件进行拼接( 和Salzberg,2011);采用UPARSE软件将优质序列(即,满足测序片段≥200bp、模糊碱基≤6bp、聚合体≤
6bp、引物与接头中错配碱基<1bp、质量高于Q20条件的序列)按97%的相似度归为一个OTU(Operational taxonomic unit)(Edgar,2013);将校正菌株中人工设计515F/806R及ITS-F/R所对应碱基信息分别添加进SILVA数据库(https://www.arb-silva.de/)及Unite数据库(https://unite.ut.ee/),标记为校正菌株,采用包含校正菌株碱基信息的SILVA数据库及Unite数据库分别对原核微生物及真核微生物OTU进行注释,该注释参照 et al(2013)和Quast et al(2013)文献报道中进行。通过注释后,可分别获取包含校正菌株的原核和真核微生物群落16S rRNA及ITS基因各分类水平下(界、门、纲、目、科、属)各分类单元(Taxon)OTU测得数量。
[0073] 相关参考文献:
[0074] Bates ST,Berg-Lyons D,Caporaso JG,Walters WA,Knight R,Fierer N.Examining the global distribution of dominant archaeal populations in soil.The ISME Journal 5,908-917(2011)[Bates ST,Berg-Lyons D,Caporaso JG,Walters WA,Knight R,Fierer N.全球土壤中优势古菌种群分布研究《. ISME杂志》5,908-917(2011)];
[0075] Tedersoo L,Bahram M,Polme S,Koljalg U,Yorou N S,Wijesundera R,et al.Global diversity and geography of soil fungi.Science 346,1256688(2014)[Tedersoo L,Bahram M,Polme S,Koljalg U,Yorou N S,Wijesundera R,等.全球土壤真菌的多样性和地理分布《. 科学》346,1256688(2014)];
[0076] Caporaso J G,Kuczynski J,Stombaugh J,et al.QIIME allows analysis of high-throughput community sequencing data.Nature Methods,2010,7:335-336[Caporaso J G,Kuczynski J,Stombaugh J,等.通过QIIME实现高通量测序数据分析《.自然方法》2010,7:335-336];
[0077] T,Salzberg S L.FLASH:Fast length adjustment of short reads to improve genome assemblies.Bioinformatics,2011,27(21):2957-2963[ T,Salzberg S L.FLASH:用于提高基因组拼接的短片段快速长度调整《. 生物信息学》2011,27(21):2957-2963];
[0078] Edgar R C.UPARSE:highly accurate OTU sequences from microbial amplicon reads.Nature Methods,2013,10(10):996[Edgar R C.UPARSE:微生物扩增片段的高准确OTU序列《.自然方法》2013,10(10):996];
[0079] U,Nilsson R H,Abarenkov K,Tedersoo L,Taylor A F S,Bahram M,et al.Towards a  unified paradigm for sequence-based identification  of fungi.Molecular Ecology,2013,22(21):5271-5277[ U,Nilsson R H,Abarenkov K,et al.建立以序列为基础的真菌鉴定统一标准《. 分子生态》2013,22(21):5271-5277];
[0080] Quast C,Pruesse E,Yilmaz P,Gerken J,Schweer T,Yarza P,et al.The SILVA ribosomal RNA gene database project:improved data processing and web-based tools.Nucleic Acids Research,2013,41(Database issue):590-6[Quast C,Pruesse E,Yilmaz P,Gerken J,Schweer T,Yarza P,等.SILVA核糖体RNA基因数据库项目:基于网络改进后的数据处理工具《. 核酸研究》2013,41(Database issue):590-6]。
[0081] 四、原核微生物16S rRNA基因及真核微生物ITS基因高通量测序读取数量样品内及样品间校正:
[0082] 表3样品内及样品间测得序列数量校正示意
[0083]
[0084] (1)样品内原核与真核微生物群落校正
[0085] 通过对单个样品中原核微生物16S rRNA基因及真核微生物ITS基因的高通量测序,我们可获得各分类水平及各分类单元的原核微生物群落测得序列数量组成(TaxonPj,j=1,2,3,……,n)及真核微生物群落测得序列数量组成(TaxonEj,j=1,2,3,……,n),且原核与真核微生物群落中均包含校正菌株的测得序列数量(ASP和ASE)。
[0086] 以表3中土壤样品A为例,可通过校正菌株在原核微生物群落(ASP_A)与真核微生物群落(ASE_A)中测得16S rRNA与ITS基因测得序列数量的比值 获得样品内测得序列数量校正指数ρ1,将真核微生物群落中其他分类单元(TaxonEj_A,j=1,2,3,……,n)测得读取数分别乘以校正系数ρ1,获得真核微生物群落各分类单元序列校正数量(TaxonEj_A×ρ1,j=1,2,3,……,n)。
[0087] 通过校正菌株E.coli WYL分别在原核微生物与真核微生物群落中测得序列数量,实现了不同样品等同测序深度导致的误差,使得校正后的原核微生物与真核微生物分类单元间可相互比较,即原核微生物群落(TaxonPj_A,j=1,2,3,……,n)与校正后的真核微生物群落(TaxonEj_A×ρ1,j=1,2,3,……,n)测得序列读取数成为土壤样品A微生物区系各分类单元总测得序列数量组成(如表3中土壤样品A样品内校正后行所示)。
[0088] (2)样品间微生物区校正
[0089] 步骤三(1)通过实现样品内中原核微生物16S rRNA基因及真核微生物ITS基因测得序列数量的校正,因此使得样本内原核微生物与真核微生物间能很好地统一。
[0090] 与此同时,可根据各样品中微生物区(真核与原核微生物)中等浓度校正菌株的添加,进一步校正不同样品中微生物数量的差异导致的误差。如表3中所示,按照步骤四(1)土壤样品A中原核微生物群落16S rRNA基因与真核微生物群落ITS基因序列测得数量校正的方法,可根据样品内校正系数 将土壤样品B中真核微生物群落各分类单元序列测得数量进行校正(TaxonEj_B×ρ2,j=1,2,3,……,n)。将原核微生物群落(TaxonPj_B,j=1,2,3,……,n)与校正后的真核微生物群落(TaxonEj_B×ρ2,j=1,2,3,……,n)测得序列读取数合并,即为土壤样品B微生物区系各分类单元总测得序列数量组成。
[0091] 将土壤样品A和B分别进行样品内原核与真核微生物序列测定数量校正后,再通过校正菌株在两个样品中的测得序列数的比值进行校正,以抵消不同样本微生物总量差异带来的误差。以土壤样品A中测得校正菌株16S rRNA基因测得数量(ASP_A)为标准,样品间校正系数为 在进行了样品内校正后,再将土壤样品B中原核微生物群落(TaxonPj_B,j=1,2,3,……,n)与校正后的真核微生物群落(TaxonEj_B×ρ2,j=1,2,3,……,n)分别乘以ρ3,即获得样品间校正的土壤样品B中校正原核微生物群落(TaxonPj_B×ρ3,j=1,2,3,……,n)与二次校正的真核微生物群落(TaxonEj_B×ρ2×ρ3,j=1,2,3,……,n)各分类单元总测得序列数量组成。
[0092] 为证明本发明实用性与可行性,实施例中选取原核与真核微生物总量差异显著的土壤样本A和B(图6):两样本中原核微生物16S rRNA基因与真核微生物ITS基因拷贝数均存在显著差异;土壤样品A与B的原核微生物16S rRNA基因与真核微生物ITS基因拷贝数均也同样分别存在显著差异。其中,土壤样本A和B中原核与真核微生物总量差异采用实时荧光定量PCR(qPCR)技术(LightCycler480,Roche)进行测定表征:采用与高通量测序中相同的515F/806R和ITS-F/ITS-R引物分别对16S rRNA和ITS基因进行qPCR绝对定量,反应体系(20μL)为:10μL SYBR Green qPCR SuperMix-UDG with Rox(Invitrogen,Carlsbad,USA),正、反向引物各0.4μL,8.2μL无核酸酶水,1μL染色体DNA。qPCR反应条件如下:
[0093] 表4 qPCR反应条件
[0094]
[0095] 所得结果为(图6),土壤样品A中原核微生物16S rRNA基因拷贝数为4.2×109±4.2×107copies g-1,真核微生物ITS基因拷贝数为6.3×108±6.8×107copies g-1;土壤样品B中原核微生物16S rRNA基因拷贝数为9.2×108±2.5×107copies g-1,真核微生物ITS基因拷贝数为1.5×108±4.5×106copies g-1。因此可得知,针对单个土壤样品A或B,原核微生物数量与真核微生物数量存在显著性差异;土壤样品A和B间,原核微生物数量和真核微生物数量间也均存在显著性差异,分别的、等同深度的高通量测序会模糊掉样品内及样品间原核微生物与真核微生物的数量差异,从而导致错误的结论。
[0096] 下面将结合实验1与实验2对该校正技术进一步说明。
[0097] 实验1、单个土壤样品中原核微生物与真核微生物测得序列数量校正[0098] (1)吸取200μL 25%甘油保存的校正菌株菌种E.coli WYL于20mL LB液体培养基(含卡那霉素50μg mL-1)中,37℃250rpm条件下培养12h;
[0099] (2)将菌悬液转入50mL无菌离心管中,离心10min(4℃,6000×g);
[0100] (3)弃上清液,加入20mL预冷灭菌超纯水,涡旋使得菌体重悬,相同条件下再次离心。
[0101] 重复该步骤两次;
[0102] (4)最后将菌体重悬浮于预冷灭菌超纯水中,测定紫外吸光度(600nm),用灭菌水将菌悬液稀释至OD600nm=1.0左右;
[0103] (5)吸取400μL上述OD600nm=1.0的菌液至4.0g冷冻干燥后的无土壤样品中,置于冰浴上用无菌玻璃棒搅拌5min。
[0104] (6)称取0.25g土样,并按照上述步骤二中方法进行土壤DNA提取。
[0105] (7)分别采用引物515F/806R和ITS-F/R对原核微生物群落16S rRNA基因和真核微生物群落ITS基因进行高通量测序,并按照步骤四对测序结果进行过滤和注释,即获得真核和原核微生物不同分类水平(界、门、纲、目、科、属)各分类单元的基因测得数量。
[0106] (8)通过校正菌株分别在原核和真核微生物群落中测得的16S rRNA基因及ITS基因序列读取序列数量的比值 并对无锡土壤样品A中真核微生物群落各ITS基因序列读取数量进行校正,本实施例中以门水平为例作为计算演示。
[0107] 通过上述实验1的方法,在40,000reads数左右的测序深度下,无锡土壤样品A中各原核和真微生物门水平16S rRNA和ITS基因序列读取序列数量如图7所示。校正菌株在原核微生物群落16S rRNA基因和真核微生物ITS基因高通量测序中均被测得,但测得序列数量相差接近三倍。人工合成16S rRNA基因和ITS基因为E.coli WYL染色体上同一片段,所对应的数量应当相等,而导致真核微生物群落中校正菌株比例偏高的原因是真核微生物总量较原核微生物总量低,因而等深度测序条件下,校正菌株的测得概率变大。因此,按照步骤四中的计算方法,以校正菌株在原核和真核微生物群落测得的16S rRNA基因和ITS基因的比值 将真核微生物群落各门水平分类单元ITS基因序列读取数量分别乘以0.29,即获得校正后的、可与原核微生物门水平分类单元进行相互比较的真核微生物ITS基因序列读取数量。未校正前,变形菌门16S rRNA基因序列读取数量为15839,子囊菌门ITS基因序列读取数量为37468,若以该数据作为比较,会认为环境中子囊菌门数量更为庞大,而通过校正后发现,等同取样及实验条件下,子囊菌门ITS基因序列读取数量应为
10756,较变形菌门数量少(图7)。
[0108] 实验2、多个土壤样品中原核微生物与真核微生物测得序列数量校正[0109] (1)吸取200μL 25%甘油保存的校正菌株菌种E.coli WYL于20mL LB液体培养基(含卡那霉素50μg mL-1)中,37℃250rpm条件下培养12h;
[0110] (2)将菌悬液转入50mL无菌离心管中,离心10min(4℃,6000×g);
[0111] (3)弃上清液,加入20mL预冷灭菌超纯水,涡旋使得菌体重悬,相同条件下再次离心。
[0112] 重复该步骤两次;
[0113] (4)最后将菌体重悬浮于预冷灭菌超纯水中,测定紫外吸光度(600nm),用灭菌水将菌悬液稀释至OD600nm=1.0左右;
[0114] (5)分别吸取400μL上述OD600nm=1.0的菌液至4.0g冷冻干燥后的无锡土壤样品A和B中,置于冰浴上用无菌玻璃棒搅拌5min。
[0115] (6)分别称取0.25g无锡土样样品A和B,并按照上述步骤三中方法进行土壤DNA提取。
[0116] (7)分别采用引物515F/806R和ITS-F/R对土样原核微生物群落16S rRNA基因和真核微生物群落ITS基因进行高通量测序,并按照步骤四对测序结果进行过滤和注释,即获得真核和原核微生物不同分类水平(界、门、纲、目、科、属)各分类单元的基因测得数量。
[0117] (8)通过校正菌株在无锡土壤样品A和B中原核和真核微生物群落测得的16S rRNA基因及ITS基因序列读取数量的比值( 和 ),分别对无锡土壤样品A和B中真核微生物群落各ITS序列读取数量进行校正。在此基础上,以土壤样品A中校正菌株基因序列测得数量为标准,对土壤样品B中16S rRNA基因序列读取数量进行校正,校正系数将土壤样品B中测得真核16S rRNA基因和ITS基因序列读取数量分别乘以校正系数ρ3,即获得二次校正的、可与土壤样品A横向比较的原核微生物群落16S rRNA基因和真核微生物群落ITS基因序列读取数量。
[0118] 通过上述实验2的方法,首先对无锡土壤B中,因真核微生物总量较原核微生物总量低所导致的门水平各分类单元ITS基因序列读取数量偏高进行校正,如图8中真菌子囊菌门,在校正前,其ITS基因序列读取数量为30345,高于原核微生物中变形菌门16S rRNA基因序列读取数量(14807) ,通过以校正菌株测得数量为参考对其进行校正其实际数量应为TaxonE子囊菌门_B×ρ2=30345×0.44=13204,
与原核变形菌门16S rRNA基因序列读取数量接近。
[0119] 然而,无锡土壤样品A和B中所添加的校正菌株浓度一致,在等同测序深度下(40,000reads),校正菌株16S rRNA基因序列读取数量却不一致(图7和图8),表明土壤样品A和B中微生物总量间的差异。而不将等同测序深度带来的误差校正,跨样品比较间将产生误差。
例如,未进行样品间校正前,变形菌门16S rRNA基因序列读取数量在土壤样品A和B中分别为15839和14807(图7和图8),在两个样品中差异较小。然而,因添加了校正菌株作为内参物质,可知,土壤样品A(15839)中变形菌门16S rRNA基因序列读取数量实际是土壤样品B(3045)中的接近5倍多。不仅如此,通过校正菌株为参考校正基因序列读取数量后,垮样品间真核与原核微生物也可以相互比较,例如土壤样品A中子囊菌门数量较土壤样品B中变形菌门多(图9)。
[0120] 结合实验1和实验2,本发明提供了一种校正菌株的构建方法,使其能同时在原核微生物群落16S rRNA基因与真核微生物群落ITS基因中被测得,校正因原核与真核微生物总量差异导致的误差。该人工合成16S rRNA基因与ITS基因序列位于校正菌株E.coli WYL染色体同一位点,保证了其在两次测序中测得序列数量的一致性。与此同时,在不同样品中加入等量校正菌株,可同时校正样品间真核与原核微生物总量差异导致的误差,使得相互间真核与原核微生物数量比较更为准确。
[0121] 对比实验1、无校正菌株添加单个土壤样品中原核微生物与真核微生物的比较[0122] 不添加校正菌株,直接对无锡土壤样品进行冷冻干燥后提取DNA,其余实验设置条件、分析方法等与实施例1保持一致。
[0123] 所得结果为:变形菌门16S rRNA基因序列读取数量较子囊菌门ITS基因序列读取数量低。分别针对原核和真核微生物群落进行的相等测序深度的高通量测序,使得原本总量不同的原核微生物群落和真核微生物群落被固定为等同大小样本(40,000reads测序深度),从而将真核微生物与原核微生物割裂开来,无法相互比较,若采用测得序列数量进行原核门和真核门数量多少的相互比较会导致错误结论。
[0124] 对比实验2、无校正菌株添加多个土壤样品间原核微生物与真核微生物的比较[0125] 不添加校正菌株,直接对无锡土壤样品A和B进行冷冻干燥后提取DNA,其余实验设置条件、分析方法等与实施例2保持一致。
[0126] 所得结果为:变形菌门16S rRNA基因序列读取数量在土壤样品A和B中分别为15839和14807,子囊菌门ITS基因序列读取数量在样品A和B中分别为37468和30345,因等同的测序深度使得不同样本间的真核微生物群落与原核微生物群落均被固定为等同样本大小(40,000),掩盖了样品间和原核与真核微生物群落间的真实差异,从而无法使得数据很好的统一起来,无法跨原核-真核微生物群落比较和跨样本比较,否则会导致错误的结论。
[0127] 对比试验3、将实验1中的“校正菌株E.coli WYL”改成常规的“大肠杆菌E.coli Dh5ɑ”,其余等同于实验1
[0128] 所得结果为:因普通大肠杆菌E.coli Dh5ɑ不包含ITS基因片段,故对一个土壤样品分别进行原核微生物和真核微生物高通量测序时,添加的普通大肠杆菌E.coli Dh5ɑ仅能在原核微生物高通量测序中被测得,真核微生物高通量测序结果中不包含普通大肠杆菌E.coli Dh5ɑ的信息,所以无法将其用于校准原核微生物与真核微生物间因相同高通量测序深度导致的测得序列数量的误差,一个土壤样本中的原核微生物与真核微生物间依旧不能进行相互比较,限制了对一个土壤样品中微生物的宏观把握。
[0129] 最后,还需要注意的是,以上列举的仅是本发明的若干个具体实施例。显然,本发明不限于以上实施例,还可以有许多变形。本领域的普通技术人员能从本发明公开的内容直接导出或联想到的所有变形,均应认为是本发明的保护范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈