首页 / 国际专利分类库 / 化学;冶金 / 组合化学 / 基于高通量测序的中枢系统感染病原检测文库构建方法、检测方法和试剂盒

基于高通量测序的中枢系统感染病原检测文库构建方法、检测方法和试剂

申请号 CN201811327028.0 申请日 2018-11-08 公开(公告)号 CN109610008A 公开(公告)日 2019-04-12
申请人 广州华大基因医学检验所有限公司; 华大生物科技(武汉)有限公司; 发明人 刘华勇; 萧卓; 袁剑颖; 吴红龙;
摘要 一种基于高通量测序的中枢系统感染病原检测文库构建方法、检测方法和 试剂 盒 ,文库构建方法包括:从样本中提取DNA并将DNA 片段 化得到片段化的DNA序列;将片段化的DNA序列加入末端修复体系中进行末端修复反应,末端修复反应完成后,直接向反应体系中添加接头序列、连接酶、ATP以及聚乙二醇,在连接酶作用下以ATP为辅酶,催化接头序列连接到末端修复反应产物的两端,得到接头连接产物;纯化接头连接产物后,加入与接头序列两端互补的核酸单链作为引物进行PCR扩增。该方法能够实现快速、广谱的中枢系统感染病原 微 生物 检测,无需预知太多检测样本的临床信息,可以快速高效地进行检测,检测结果无偏向性,还可以解决低浓度 脑脊液 样本文库构建失败率高的问题。
权利要求

1.一种基于高通量测序的中枢系统感染病原检测文库构建方法,其特征在于,所述方法包括:
从样本中提取DNA并将所述DNA片段化得到片段化的DNA序列;
将所述片段化的DNA序列加入末端修复体系中进行末端修复反应,末端修复反应完成后,直接向反应体系中添加接头序列、连接酶、ATP以及聚乙二醇,在所述连接酶作用下以ATP为辅酶,催化所述接头序列连接到末端修复反应产物的两端,得到接头连接产物;
纯化所述接头连接产物后,加入与所述接头序列两端互补的核酸单链作为引物进行PCR扩增,得到所述文库;
优选地,所述聚乙二醇为PEG 8000。
2.根据权利要求1所述的中枢系统感染病原检测文库构建方法,其特征在于,所述样本是疑似含有中枢系统感染病原生物的样本;
优选地,所述中枢系统感染病原微生物包括细菌、病毒、真菌和寄生虫;
优选地,所述中枢系统感染病原微生物包括炎链球菌(Streptococcus 
pneumoniae)、绿假单胞菌(Pseudomonas aeruginosa)、鲍曼不动杆菌(Acinetobacter baumannii)、单纯疱疹病毒1型(Herpes simplex virus 1,HSV1)、痘-带状疱疹病毒(Varicella zoster virus,VAV)、人巨细胞病毒(Cytomegalo virus,CMV)、黄曲霉、烟曲霉、白色念珠菌、恶性疟原虫和人隐孢子虫。
3.根据权利要求1所述的中枢系统感染病原检测文库构建方法,其特征在于,所述样本是脑脊液样本。
4.根据权利要求1所述的中枢系统感染病原检测文库构建方法,其特征在于,进行片段化的所述DNA含量为0.2-1000ng;优选为50ng。
5.根据权利要求1所述的中枢系统感染病原检测文库构建方法,其特征在于,所述片段化的DNA序列的平均长度为150-300bp;优选为200bp。
6.根据权利要求1所述的中枢系统感染病原检测文库构建方法,其特征在于,所述末端修复体系中含有多核苷酸激酶,以及具有5’-3’的聚合酶活性、3’-5’的外切酶活性和末端转移酶活性的多种聚合酶;
优选地,所述多核苷酸激酶为T4多核苷酸激酶;
优选地,所述多种聚合酶为Taq聚合酶、T4 DNA聚合酶和Klenow片段。
7.根据权利要求1所述的中枢系统感染病原检测文库构建方法,其特征在于,所述引物中有一条引物5’末端具有磷酸化修饰,所述PCR扩增得到双链DNA,其中一条链的5’端具有磷酸基团。
8. 根据权利要求1所述的中枢系统感染病原检测文库构建方法,其特征在于,所述接头序列包括SEQ ID NO:1和SEQ ID NO:2;所述引物包括SEQ ID NO:3和SEQ ID NO:4。
9.一种基于高通量测序的中枢系统感染病原检测方法,其特征在于,所述方法包括:
对权利要求1-8任一项所述的方法构建的文库进行测序,得到测序数据;
对所述测序数据进行分析,得到所述中枢系统感染病原信息;
优选地,所述对所述测序数据进行分析,得到所述中枢系统感染病原信息,包括:
(a)对所述测序数据进行过滤;
(b)将过滤后的测序数据与宿主基因组进行比对,去除比对到所述宿主基因组的序列;
(c)将未比对到所述宿主基因组的序列与病原微生物基因组进行比对;
(d)统计比对到所述病原微生物基因组的序列的检测参数,获得包括特异比对序列数、覆盖率、覆盖深度、相对丰度中的任一项或多项参数在内的检测结果;和
(e)输出所述检测结果;
优选地,所述测序数据的过滤去除下列序列中的至少之一:(a)与接头序列共有连续
10bp以上基的序列;(b)读段长度低于预定阈值的序列;所述预定阈值优选为50 55bp;
~
(c)序列中质量值小于5的碱基数占序列总碱基数的比值大于50%的序列;
优选地,所述宿主基因组包括人类参考基因组序列和炎黄基因组序列;
优选地,所述与病原微生物基因组进行比对,基于下列中的至少之一确定所述测序数据中来自于所述病原微生物的测序数据:(a)保留所述测序数据中比对长度占比大于90%的序列;(b)保留所述测序数据中错配碱基数小于5%的序列;(c)保留具有比对特异性的序列,其中所述具有比对特异性的序列为唯一比对序列或多比对结果中满足次优比对分值除以最优比对分值小于0.8的序列,其中所述唯一比对序列是唯一比对到所述病原微生物基因组一个位置上的序列。
10.一种基于高通量测序检测中枢系统感染病原的试剂盒,其特征在于,所述试剂盒包括构建中枢系统感染病原检测文库的试剂,所述试剂包括:
末端修复反应试剂,用于在末端修复体系中对片段化的DNA序列进行末端修复反应,优选地,所述末端修复反应试剂包括多核苷酸激酶,以及具有5’-3’的聚合酶活性、3’-5’的外切酶活性和末端转移酶活性的多种聚合酶;
接头序列、连接酶、ATP以及聚乙二醇,用于在末端修复反应完成后,在所述连接酶作用下以ATP为辅酶,催化所述接头序列连接到末端修复反应产物的两端,得到接头连接产物,优选地,所述接头序列是SEQ ID NO:1和SEQ ID NO:2所示的序列,所述连接酶是T4 DNA连接酶;
PCR扩增引物、dNTP以及DNA聚合酶,用于在所述接头连接产物纯化后,所述PCR扩增引物与所述接头序列两端互补,并以所述接头连接产物为模板进行PCR扩增以得到所述检测文库,优选地,所述引物是SEQ ID NO:3和SEQ ID NO:4所示的序列。

说明书全文

基于高通量测序的中枢系统感染病原检测文库构建方法、检

测方法和试剂

技术领域

[0001] 本发明涉及生物检测技术领域,具体涉及一种基于高通量测序的中枢系统感染病原检测文库构建方法、检测方法和试剂盒。

背景技术

[0002] 急性脑炎脑膜炎等中枢系统感染症候群包括各种病原所致,以脑实质和/或脑膜感染为病理表现的系列急性炎症疾病。它是严重威胁人类健康的疾病,据世界卫生组织估算全球病毒性脑炎发病率约为3.5/10万-7.4/10万。全世界每年约有12.5万婴幼儿死于细菌性脑膜炎,细菌性脑膜炎的致残率高达25%-50%。对脑炎脑膜炎症候群致病病原的及早有效诊断可有效避免由于迟诊误诊导致的预后不良甚至死亡。
[0003] 脑炎脑膜炎病原诊断方法有镜检、细菌培养、抗原抗体检测、生化反应、分子生物学方法等。传统的方法耗时比较长、漏检率高,经验性用药一方面加重病人经济负担,且易耽误病人的最佳诊疗时间。基于培养的病原鉴定方法所需时间长,最快也要三到四天时间,且只能针对细菌进行分析,无法鉴别病毒、真菌、寄生虫病原,而在细菌中不同种类也要求不同的培养条件,其中一部分较难通过培养方法学鉴定。基于PCR等分子生物学方法靶点有限,只能针对部分关注的病原微生物进行分析,无法进行广谱性的分析。
[0004] 高通量测序技术对微生物鉴定所采用的宏基因组策略,将测序结果与现有的微生物基因信息数据库进行逐一比对,可以迅速识别各类病原微生物,这样病原微生物的鉴定就不需要经过分离、培养、富集纯化的步骤,而是直接取得患者样本进行测序鉴定,使诊断时间缩短,诊断结果更加精确。随着测序技术的发展,测序时间和测序成本逐渐降低,使得基于宏基因组测序技术的检测产品在临床上的应用成为可能,能够有效辅助临床医生寻找致病微生物,制定个体化的治疗方案。
[0005] 然而,基于高通量测序的微生物分析目前尚无针对临床检测需要的解决方案,科研用的方法成本高、耗时长,且对样本起始量要求高,无法满足临床的需求。以脑脊液样本作为起始材料为例,脑脊液样本的核酸浓度差异大,导致测序文库构建失败率高。

发明内容

[0006] 本发明提供一种基于高通量测序的中枢系统感染病原检测文库构建方法、检测方法和试剂盒。
[0007] 根据第一方面,一种实施例中提供一种基于高通量测序的中枢系统感染病原检测文库构建方法,包括:
[0008] 从样本中提取DNA并将上述DNA片段化得到片段化的DNA序列;
[0009] 将上述片段化的DNA序列加入末端修复体系中进行末端修复反应,末端修复反应完成后,直接向反应体系中添加接头序列、连接酶、ATP以及聚乙二醇,在上述连接酶作用下以ATP为辅酶,催化上述接头序列连接到末端修复反应产物的两端,得到接头连接产物;
[0010] 纯化上述接头连接产物后,加入与上述接头序列两端互补的核酸单链作为引物进行PCR扩增,得到上述文库。
[0011] 优选地,上述聚乙二醇为PEG 8000。
[0012] 优选地,上述样本是疑似含有中枢系统感染病原微生物的样本。
[0013] 优选地,上述中枢系统感染病原微生物包括细菌、病毒、真菌和寄生虫。
[0014] 优选地,上述中枢系统感染病原微生物包括炎链球菌(Streptococcus pneumoniae)、绿假单胞菌(Pseudomonas aeruginosa)、鲍曼不动杆菌(Acinetobacter baumannii)、单纯疱疹病毒1型(Herpes simplex virus 1,HSV1)、痘-带状疱疹病毒(Varicella zoster virus,VAV)、人巨细胞病毒(Cytomegalo virus,CMV)、黄曲霉、烟曲霉、白色念珠菌、恶性疟原虫和人隐孢子虫。
[0015] 优选地,上述样本是脑脊液样本。
[0016] 优选地,进行片段化的上述DNA含量为0.2-1000ng;优选为50ng。
[0017] 优选地,上述片段化的DNA序列的平均长度为150-300bp;优选为200bp。
[0018] 优选地,上述末端修复体系中含有多核苷酸激酶,以及具有5’-3’的聚合酶活性、3’-5’的外切酶活性和末端转移酶活性的多种聚合酶。
[0019] 优选地,上述多核苷酸激酶为T4多核苷酸激酶。
[0020] 优选地,上述多种聚合酶为Taq聚合酶、T4DNA聚合酶和Klenow片段。
[0021] 优选地,上述引物中有一条引物5’末端具有磷酸化修饰,上述PCR扩增得到双链DNA,其中一条链的5’端具有磷酸基团。
[0022] 优选地,上述接头序列包括SEQ ID NO:1和SEQ ID NO:2;上述引物包括SEQ ID NO:3和SEQ ID NO:4。
[0023] 根据第二方面,一种实施例中提供一种基于高通量测序的中枢系统感染病原检测方法,包括:
[0024] 对第一方面的方法构建的文库进行测序,得到测序数据;
[0025] 对上述测序数据进行分析,得到上述中枢系统感染病原信息。
[0026] 优选地,上述对上述测序数据进行分析,得到上述中枢系统感染病原信息,包括:
[0027] (a)对上述测序数据进行过滤;
[0028] (b)将过滤后的测序数据与宿主基因组进行比对,去除比对到上述宿主基因组的序列;
[0029] (c)将未比对到上述宿主基因组的序列与病原微生物基因组进行比对;
[0030] (d)统计比对到上述病原微生物基因组的序列的检测参数,获得包括特异比对序列数、覆盖率、覆盖深度、相对丰度中的任一项或多项参数在内的检测结果;和[0031] (e)输出上述检测结果。
[0032] 为了更好地理解本发明,上述优选实施例中涉及的专业术语定义如下:
[0033] “比对序列数”是指在种水平上比对上该物种的序列数;
[0034] “覆盖率”是指检测到的微生物核酸序列长度占微生物整个基因组序列长度的百分比;
[0035] “覆盖深度”是指基因组上覆盖范围内的基平均深度;
[0036] “相对丰度”是指在种或属水平上检测到的微生物在整个样本中检测到的相同类型微生物中所占的比重。
[0037] 优选地,上述测序数据的过滤去除下列序列中的至少之一:(a)与接头序列共有连续10bp以上碱基的序列;(b)读段长度低于预定阈值的序列;上述预定阈值优选为50~55bp;(c)序列中质量值小于5的碱基数占序列总碱基数的比值大于50%的序列。
[0038] 优选地,上述宿主基因组包括人类参考基因组序列和炎黄基因组序列。
[0039] 优选地,上述病原微生物基因组比对,基于下列中的至少之一确定上述测序数据中来自于上述病原微生物的测序数据:(a)保留上述测序数据中比对长度占比大于90%的序列;(b)保留上述测序数据中错配碱基数小于5%的序列;(c)保留具有比对特异性的序列,其中上述具有比对特异性的序列为唯一比对序列或多比对结果中满足次优比对分值除以最优比对分值小于0.8的序列;
[0040] 为了更好地理解本发明,上述优选实施例中涉及的专业术语定义如下:
[0041] “比对长度占比”是指单条序列比对上参考序列的长度除以序列全长的值[0042] “唯一比对序列”是指唯一比对到上述病原微生物基因组一个位置上的序列。
[0043] “次优比对分值”是指单条序列比对到两个或两个以上病原微生物参考基因组时,选取排名第二的比对分值。
[0044] “最优比对分值”是指单条序列比对到两个或两个以上病原微生物参考基因组位置时,选取排名第一的比对分值。例如在利用bwa软件进行比对的过程中,比对结果中,类似AS:i:50标记中,50即最优比对分数;类似XS:i:45标记中,45即次优比对分数。具体原理如下:如果一条序列能比对到数据库中多个位置,比对软件会给每个比对位置计算得分,再将排名最高的两个得分作为最优比对分数和次优比对分数,这两个分数是可以相等的。我们要求次优比对与最优比对的“比值”小于0.8来定义最优比对足够特异。
[0045] 需要说明的是,上述一种基于高通量测序的中枢系统感染病原检测方法,本领域普通技术人员可知,上述方法可应用于非诊断目的,例如研究样本中病原体的感染情况,分析病原体的种类与人群之间的关系、分析病原体的种类与地域之间的关系等等。
[0046] 根据第三方面,一种实施例中提供一种基于高通量测序检测中枢系统感染病原的试剂盒,包括构建中枢系统感染病原检测文库的试剂,上述试剂包括:
[0047] 末端修复反应试剂,用于在末端修复体系中对片段化的DNA序列进行末端修复反应,优选地,上述末端修复反应试剂包括多核苷酸激酶,以及具有5’-3’的聚合酶活性、3’-5’的外切酶活性和末端转移酶活性的多种聚合酶;
[0048] 接头序列、连接酶、ATP以及聚乙二醇,用于在末端修复反应完成后,在上述连接酶作用下以ATP为辅酶,催化上述接头序列连接到末端修复反应产物的两端,得到接头连接产物,优选地,上述接头序列是SEQ ID NO:1和SEQ ID NO:2所示的序列,上述连接酶是T4DNA连接酶;
[0049] PCR扩增引物、dNTP以及DNA聚合酶,用于在上述接头连接产物纯化后,所述PCR扩增引物与上述接头序列两端互补,并以上述接头连接产物为模板进行PCR扩增以得到上述检测文库,优选地,上述引物是SEQ ID NO:3和SEQ ID NO:4所示的序列。
[0050] 本发明的基于高通量测序的中枢系统感染病原检测文库构建方法,能够实现快速、广谱的中枢系统感染病原微生物检测,无需预知太多检测样本的临床信息,可以快速高效地进行检测,检测结果无偏向性。另外,本发明的方法可以解决低浓度脑脊液样本文库构建失败率高的问题。
[0051] 此外,本发明针对庞大的测序下机结果,提供自动化分析流程和结果判读方法,设置数据过滤、序列比对和结果判定各环节的核心参数,解决了下机数据分析困难,测序结果无评判标准,解读困难的问题。
[0052] 本发明的方法可有效提高中枢系统感染病原的检测精度,有助于基于高通量测序技术的病原检测产品在临床的快速应用和转化。附图说明
[0053] 图1为本发明一个实施例的基于高通量测序的中枢系统感染病原检测方法流程图
[0054] 图2为本发明一个实施例中两例样本的核酸建库完成后的Agilent 2100质控结果,其中上图为样本CSF01、下图为样本CSF39。

具体实施方式

[0055] 下面通过具体实施方式结合附图对本发明作进一步详细说明。在以下的实施方式中,很多细节描述是为了使得本发明能被更好的理解。然而,本领域技术人员可以毫不费的认识到,其中部分特征在不同情况下是可以省略的,或者可以由其他元件、材料、方法所替代。
[0056] 另外,说明书中所描述的特点、操作或者特征可以以任意适当的方式结合形成各种实施方式。同时,方法描述中的各步骤或者动作也可以按照本领域技术人员所能显而易见的方式进行顺序调换或调整。因此,说明书和附图中的各种顺序只是为了清楚描述某一个实施例,并不意味着是必须的顺序,除非另有说明其中某个顺序是必须遵循的。
[0057] 图1示出了本发明实施例的检测中枢系统感染病原的流程图,包括样本处理(DNA提取、DNA片段化),文库构建(末端修复、接头连接、文库PCR),以及测序及数据分析(上机测序、数据分析)。
[0058] 本发明的实施例中提供一种基于高通量测序的中枢系统感染病原检测文库构建方法,包括:
[0059] (1)从样本中提取DNA并将上述DNA片段化得到片段化的DNA序列。
[0060] 在本发明的优选实施例中,样本是疑似含有中枢系统感染病原微生物的样本,可以是脑脊液样本。
[0061] 在本发明的优选实施例中,中枢系统感染病原微生物包括细菌、病毒、真菌和寄生虫,其中,细菌例如肺炎链球菌(Streptococcus pneumoniae)、铜绿假单胞菌(Pseudomonas aeruginosa)、鲍曼不动杆菌(Acinetobacter baumannii)等,病毒例如单纯疱疹病毒1型(Herpes simplex virus 1,HSV1)、水痘-带状疱疹病毒(Varicella zoster virus,VAV)、人巨细胞病毒(Cytomegalo virus,CMV)等,真菌例如黄曲霉、烟曲霉、白色念珠菌等,寄生虫例如恶性疟原虫和人隐孢子虫等。
[0062] 在本发明的优选实施例中,需要进行片段化的DNA含量为0.2-1000ng,优选为50ng。本发明能够实现对痕量DNA样本进行文库构建。
[0063] 在本发明的优选实施例中,片段化的DNA序列的平均长度为200bp左右,例如,150-300bp,优选为200bp。例如,将从样本中提取的DNA通过物理或者酶切片段化至200bp左右。
[0064] (2)将片段化的DNA序列加入末端修复体系中进行末端修复反应,末端修复反应完成后,直接向反应体系中添加接头序列、连接酶、ATP以及聚乙二醇,在连接酶作用下以ATP为辅酶,催化接头序列连接到末端修复反应产物的两端,得到接头连接产物。
[0065] 在本发明的优选实施例中,聚乙二醇具体为PEG8000,其作用为凝聚DNA分子,促进连接反应发生。在本发明的优选实施例中,末端修复体系中含有多核苷酸激酶,以及具有5’-3’的聚合酶活性、3’-5’的外切酶活性和末端转移酶活性的多种聚合酶,以及dNTP、缓冲溶液等组分,其中,多核苷酸激酶,可以作用于DNA分子,使5’-OH基团变成5’-PO4基团,使
3’-PO4基团变成3’-OH基团,例如T4多核苷酸激酶(T4PNK)等;5’-3’的聚合酶活性的聚合酶,可以补平凹陷的3’末端,例如Klenow大片段、T4DNA聚合酶等,3’-5’的外切酶活性的聚合酶,可以将突出的3’末端切掉,使其形成平末端,如T4DNA聚合酶、Klenow大片段等;末端转移酶活性的聚合酶,在体系中存在dATP的情况下,可以不依赖模板将dATP添加到平末端DNA分子的3’末端,例如Taq酶。在末端修复反应中,DNA分子在前两种酶活性(5’-3’的聚合酶活性、3’-5’的外切酶活性)的作用下被修复成平末端分子,之后在第三种酶活性(末端转移酶活性)的作用下在3’末端加上A碱基,形成适合与接头序列连接的结构。
[0066] 在本发明的实施例中,末端修复反应完成后,直接向体系中添加接头序列、连接酶、ATP以及聚乙二醇等原料,连接酶在以ATP做辅酶的情况下,催化接头序列连接到插入片段的两端;实现了在“一管”中完成DNA修复与加接头,中间不需要经过纯化步骤,节省了建库时间。
[0067] 在本发明的优选实施例中,接头序列包括AGTCGGAGGCCAAGCGGTCTTAGGAAGACAANNNNNNNNNNCAACTCCTTGGCTCACA(SEQ ID NO:1)和TTGTCTTCCTAAGGAACGACATGGCTACGATCCGACTT(SEQ ID NO:2)。
[0068] (3)纯化接头连接产物后,加入与接头序列两端互补的核酸单链作为引物进行PCR扩增,得到文库。
[0069] 在本发明的优选实施例中,引物中有一条引物5’末端具有磷酸化修饰,PCR扩增得到双链DNA,其中一条链的5’端具有磷酸基团。
[0070] 在本发明的优选实施例中,引物包括PO4-GAACGACATGGCTACGA(SEQ ID NO:3)和TGTGAGCCAAGGAGTTG(SEQ ID NO:4)。
[0071] 本发明的实施例中提供一种基于高通量测序的中枢系统感染病原检测方法,包括:
[0072] (1)对本发明上述实施例的方法构建的文库进行测序,得到测序数据。
[0073] 纯化上一步PCR扩增的产物后,得到文库。根据不同测序平台的要求进行上机测序。测序平台不限,可以是任何第二代高通量测序平台,包括但不限于Illumina、Ion Torrent、BGISEQ或MGISEQ测序平台等。在本发明一个实施例中,使用BGISEQ-50测序平台进行测序。
[0074] (2)对测序数据进行分析,得到中枢系统感染病原信息。
[0075] 在本发明的优选实施例中,上述步骤(2)包括:
[0076] (2a)数据过滤:对测序数据进行过滤。包括:1)过滤与接头序列共有连续10bp以上碱基的序列;2)过滤读段长度低于预定阈值(优选为50~55bp)的序列;3)过滤序列中质量值小于5的碱基数占序列总碱基数的比值大于50%的序列。
[0077] (2b)宿主序列去除:将过滤后的测序数据与宿主基因组进行比对,去除比对到宿主基因组的序列。在本发明的优选实施例中,过滤后的数据通过比对软件比对到宿主基因组序列,去除比对到宿主基因组的序列,保留比对失败的序列,宿主基因组数据库可以从NCBI官方网站下载人类参考基因组(hg38)以及从炎黄基因组公共数据库官方网站下载炎黄基因组序列两部分。
[0078] (2c)病原库比对:将未比对到宿主基因组的序列与病原微生物基因组进行比对。在本发明的优选实施例中,病原微生物基因组数据库是从NCBI、PATRIC、EuPathDB公共数据库下载的病原微生物基因组序列,并对基因组序列去冗余及聚类分析,获得各微生物最优代表性序列。使用比对软件将上一步骤中保留的序列比对到病原微生物基因组数据库,使用samtools进行比对结果排序以及PCR重复去除,去重后的比对结果进行质量控制,保留比对长度占比大于90%、错配碱基数小于5%及具有比对特异性的序列。其中具有比对特异性的序列为唯一比对序列或多比对结果中满足次优比对分值除以最优比对分值小于0.8的序列,其中唯一比对序列是唯一比对到病原微生物基因组一个位置上的序列。
[0079] (2d)病原注释分析:根据上一步骤中的病原微生物参考基因组数据库的比对结果,对检出病原微生物统计检测参数,包括特异比对序列数、覆盖率、覆盖深度、相对丰度。其中,比对序列数是在种水平上比对上该物种的序列数;覆盖率是检测到的微生物核酸序列长度占微生物整个基因组序列长度的百分比;覆盖深度是基因组上覆盖范围内的碱基平均深度;相对丰度是在种或属水平上检测到的微生物在整个样本中检测到的相同类型微生物中所占的比重。
[0080] (2e)输出检测结果。在本发明的优选实施例中,基于latex语言自动化生成tex格式报告并转换成pdf文档格式的检测分析报告,报告展示内容包含受检者基本信息、临床信息、样本信息、检测结果、结果说明、参考文献。
[0081] 本发明的实施例中提供一种基于高通量测序检测中枢系统感染病原的试剂盒,包括构建中枢系统感染病原检测文库的试剂,包括:
[0082] 末端修复反应试剂,用于在末端修复体系中对片段化的DNA序列进行末端修复反应,优选地,末端修复反应试剂包括多核苷酸激酶,以及具有5’-3’的聚合酶活性、3’-5’的外切酶活性和末端转移酶活性的多种聚合酶;
[0083] 接头序列、连接酶、ATP以及聚乙二醇,用于在末端修复反应完成后,在连接酶作用下以ATP为辅酶,催化接头序列连接到末端修复反应产物的两端,得到接头连接产物,优选地,接头序列是SEQ ID NO:1和SEQ ID NO:2所示的序列,连接酶是T4DNA连接酶;
[0084] PCR扩增引物、dNTP以及DNA聚合酶,用于在接头连接产物纯化后,所述PCR扩增引物与接头序列两端互补,并以接头连接产物为模板进行PCR扩增以得到检测文库,优选地,引物是SEQ ID NO:3和SEQ ID NO:4所示的序列。
[0085] 本发明的方法具有以下优势:
[0086] (1)本发明实现了在“一管”中完成DNA修复与加接头,即片段化DNA末端修复完成后,直接加接头,中间不需要经过纯化步骤,节省了建库时间,再搭配快速的测序平台(如BGISEQ-50、MGISEQ-200)和相应的比对软件及数据库,能在24小时内完成从样本到检测结果的输出,能有效地满足临床对于快速鉴定病原微生物的需求。
[0087] (2)本发明的建库方法对建库起始量要求较低,可有效对最低达0.2ng的DNA完成文库构建,适用的样本浓度跨度大,有效满足脑脊液样本的建库需求。
[0088] (3)使用本发明方法构建的文库检测脑脊液中的病原微生物核酸,检测类型全面、准确,结合二代测序技术可同时检测全面,包含不同的病原微生物种类包括细菌、病毒、真菌、寄生虫等,结合相应的比对算法和数据库,能实现到种水平的病原鉴定。
[0089] (4)此外,本发明方法的具体实施例中对多个建库步骤条件进行优化(例如PCR条件、磁珠纯化条件等),提高了对150-300bp小片段的富集,更加适合二代测序平台检测,目标片段富集效果更佳。
[0090] (5)本发明构建了一套可以直接从下机测序数据中进行数据过滤、核酸序列比对、注释分析算法、检测结果判读的信息分析流程,实现了高通量测序的信息分析流程自动化,提高了病原检测效率。
[0091] 以下通过实施例详细说明本发明的技术方案,应当理解,实施例仅是示例性的,不能理解为对本发明保护范围的限制。
[0092] 实施例:基于BGISEQ-50测序平台对疑似中枢系统感染病人的脑脊液样本进行病原检测
[0093] 本实施例,采用8例脑脊液样本进行核酸提取,文库构建。通过在同一反应体系中完成末端修复和接头添加反应,经过文库PCR后,在BGISEQ-50平台进行测序,下机数据经过分析和比对实现病原微生物鉴定。
[0094] 本实施例引物由上海生工生物科技有限公司合成,序列如表1所示:
[0095] 表1
[0096]
[0097] 上游接头、下游接头用NF-H2O溶解并稀释至10μM,之后按1:1体积进行混合,标记为接头备用。PCR引物-1、PCR引物-2用NF-H2O溶解并稀释至20μM,之后按1:1体积进行混合,标记为PCR引物备用。
[0098] 本实施例使用的试剂信息如下表2所示:
[0099] 表2
[0100]
[0101]
[0102] 本实施例检测流程如下:
[0103] 1、核酸提取和片段化
[0104] 脑脊液样本按照提取试剂盒说明书操作,进行DNA提取。提取的DNA取50ng用声波片段仪进行打断,片段化产物长度约在200bp左右。
[0105] 2、末端修复
[0106] 配置如下表3所示的末端修复体系,并按照表3所示的反应程序反应,对片段化DNA进行末端修复。
[0107] 表3
[0108]
[0109]
[0110] 3、接头连接
[0111] 配置如下表4所示的接头连接体系,并按照表4所示的反应程序反应,对DNA添加测序接头。
[0112] 表4
[0113]
[0114]
[0115] 4、连接产物纯化
[0116] 连接产物通过Axygen磁珠进行纯化,获得文库。具体包括如下步骤:
[0117] (1)加入40μL Axygen磁珠,充分混匀后室温静置5min;
[0118] (2)将上一步溶液——磁珠混合物短暂离心后置于磁力架上2min,小心吸弃上清;
[0119] (3)小心加入500μL 80%乙醇,并旋转离心管以充分洗涤磁珠,洗涤之后静置1min,吸弃乙醇;
[0120] (4)重复步骤(3)一次;
[0121] (5)小心吸弃乙醇之后室温晾干;
[0122] (6)加入21μL EB溶液,混匀磁珠,静置5min;
[0123] (7)短暂离心后置于磁力架上2min,小心吸取溶液至新的1.5mL离心管中。
[0124] 5、文库PCR
[0125] 配置如下表5所示的PCR体系,并按照表5所示的反应程序反应,扩增文库。
[0126] 表5
[0127]
[0128]
[0129] 6、文库纯化
[0130] PCR产物通过Axygen磁珠进行纯化,获得文库。具体包括如下步骤:
[0131] (1)加入50μL Axygen磁珠,充分混匀后室温静置5min;
[0132] (2)将上一步溶液——磁珠混合物短暂离心后置于磁力架上2min,小心吸弃上清;
[0133] (3)小心加入500μL 80%乙醇,并旋转离心管以充分洗涤磁珠,洗涤之后静置1min,吸弃乙醇;
[0134] (4)重复步骤(3)一次;
[0135] (5)小心吸弃乙醇之后室温晾干;
[0136] (6)加入20μL EB溶液,混匀磁珠,静置5min;
[0137] (7)短暂离心后置于磁力架上2min,小心吸取溶液至新的1.5mL离心管中;
[0138] (8)文库构建完成后,使用Agilent 2100进行文库质量质控。
[0139] 图2示出了两例样本的核酸建库完成后的Agilent 2100质控结果,其中上图为样本CSF01、下图为样本CSF39。
[0140] 7、上机测序
[0141] 将纯化的文库稀释至合适浓度,根据BGISEQ-50平台的要求制备DNB,上机测序分析。
[0142] 8、结果分析
[0143] 测序数据下机后,通过病原分析流程,检出这8例脑脊液样本的病原检测结果,如下表6所示:
[0144] 表6
[0145]
[0146] 以上应用了具体个例对本发明进行阐述,只是用于帮助理解本发明,并不用以限制本发明。对于本发明所属技术领域的技术人员,依据本发明的思想,还可以做出若干简单推演、变形或替换。
QQ群二维码
意见反馈