首页 / 专利库 / 解剖与生理 / 血浆 / 检测血液中微生物的方法及装置

检测血液中生物的方法及装置

阅读:3发布:2020-10-20

专利汇可以提供检测血液中生物的方法及装置专利检索,专利查询,专利分析的服务。并且本 发明 提供了一种检测 血浆 中 微 生物 的方法、一种检测宿主感染的病原体的方法及其装置。检测血浆中的微生物,包括:提取宿主血浆样本核酸,对提取的核酸的至少一部分进行序列测定,获得测序数据;去除测序数据中的宿主测序数据;将余下的测序数据比对到微生物参考 数据库 ,获得比对结果,所说的微生物参考数据库包括多种细菌的参考序列和多种病毒的参考序列;依据比对结果,确定血浆中微生物包含的物种及各物种的丰度。本发明的方法或装置能够对血浆中的微生物进行快速检测,可用于辅助临床诊断。,下面是检测血液中生物的方法及装置专利的具体信息内容。

1.检测血液中生物的方法,所述微生物包括细菌、真菌和病毒,所述方法包括:
(1)提取血液样本核酸,对所述核酸的至少一部分进行序列测定,获得测序数据;
(2)去除(1)中的测序数据中的宿主测序数据;
(3)将(2)中余下的测序数据比对到微生物参考数据库,获得比对结果,所述微生物参考数据库包含多种细菌的参考序列和多种病毒的参考序列;
(4)依据(3)的比对结果,确定所述微生物包含的物种以及各物种的丰度。
2.权利要求1的方法,其特征在于,所述核酸为DNA。
3.权利要求1的方法,其特征在于,(2)包括将(1)的测序数据比对到宿主参考序列,将比对上所述宿主参考序列的测序数据去除。
4.权利要求1的方法,其特征在于,(3)中的病毒参考序列包括所述病毒的所有亚型的参考基因组。
5.权利要求4的方法,其特征在于,所述病毒的参考基因组大于600bp。
6.权利要求1的方法,其特征在于,确定(4)中物种丰度是通过以下进行的:
公式I:丰度,其中,i表示物种;和/或,
公式II:,其中,,j表示物种。
7.确定宿主感染病原体的方法,所述宿主不包括人,所述病原体包括使宿主致病的细菌、和/或致病病毒、和/或致病真菌,所述方法包括:
(1)提取宿主血液样本核酸,对所述核酸的至少一部分进行序列测定,获得测序数据;
(2)去除(1)中的测序数据中的宿主测序数据;
(3)将(2)中余下的测序数据比对到病原体参考数据库,获得比对结果,所述病原体参考数据库包含多种致病细菌菌株的参考序列和多种致病病毒的参考序列;
(4)依据(3)的比对结果,确定所述样本包含的致病物种及各致病物种的丰度;
(5)将(4)中致病物种的丰度与所述致病物种的不致病丰度进行比较,两者有显著性差异则确定宿主感染所述致病物种;
任选的,所述核酸为DNA;
任选的,(2)包括将(1)的测序数据比对到宿主参考序列,将比对上所述宿主参考序列的测序数据去除;
任选的,(3)中的病原体参考数据库包含所有已知的致病细菌和致病病毒的参考序列信息;
任选的,(3)中的病原体参考数据库中的每个参考序列均大于600bp。
8.权利要求7的方法,其特征在于,所述病原体致使宿主不明原因发热。
9.权利要求7的方法,其特征在于,确定(4)中致病物种丰度是通过以下进行的:
公式I:丰度,其中,i表示物种;和/或,
公式II:,其中,,j表示物种。
10.权利要求9的方法,其特征在于,(5)中的致病物种的不致病丰度的确定,包括:
预先或同时对多个正常宿主的血液样本进行(1)-(4),获得多个正常宿主样本包含的多个致病物种的丰度,获得每个致病物种的多个丰度I值和多个丰度II值;
针对一个致病物种,集合来自所述多个正常宿主样本的多个丰度I值,设定置信度,获得所述致病物种的不致病丰度I值范围,以及,集合来自所述多个正常宿主样本的多个丰度II值,获得所述致病物种的不致病丰度II值;所述丰度I值是根据所述公式I计算获得的,所述丰度II值是根据所述公式II获得的。
11.权利要求10的方法,其特征在于,所述置信度为95%、99%或者99.9%。
12.权利要求10的方法,其特征在于,(5)包括:
将(4)中致病物种的丰度I值和丰度II值分别与该致病物种的不致病丰度I值范围和不致病丰度II值比较,当该致病物种的丰度I值不在该致病物种的不致病丰度I值范围内,并且,
该致病物种的丰度II值大于该致病物种的不致病丰度II值时,
表明所述致病物种的丰度与其不致病丰度差异显著,确定所述宿主感染所述致病物种。
13.确定宿主感染病原体的装置,所述宿主包括人,所述病原体包括致病细菌和/或致病病毒,和/或致病真菌,所述装置包括:
A.核酸提取单元,用于提取宿主血液样本核酸,对所述核酸的至少一部分进行序列测定,获得测序数据;
B.数据去除单元,连接A单元,用于接收A中的测序数据,去除所述测序数据中的宿主测序数据;
C.比对单元,连接B单元或者连接A和B单元,用于将B中余下的测序数据比对到病原体参考数据库,获得比对结果,所述病原体参考数据库包含多种致病细菌的参考序列和多种致病病毒的参考序列;
D.丰度计算单元,与C单元连接,用于接收C中的比对结果,确定所述样本中包含的致病物种及各致病物种的丰度;
E.判定单元,与D单元连接,用于接收D中的各个致病物种的丰度,将每个致病物种的丰度分别与该致病物种的不致病丰度进行比较,二者有显著性差异则确定宿主感染所述致病物种。

说明书全文

检测血液中生物的方法及装置

技术领域

[0001] 本发明涉及微生物检测,特别是血液中的微生物的检测方法、宿主感染病原体的检测方法及其装置。

背景技术

[0002] 基于宿主与微生物的关系,宿主中的微生物可分为多种,包括正常菌群、与宿主共生的包括寄生的微生物、引起机体感染致病的微生物——病原体等。宿主的血浆含有游离DNA,包括来源于宿主的和来源于微生物的游离DNA片段
[0003] 不 明 原 因 发 热 (fever of undetermined origin,fever of unknown origin,FUO),是指反复发热超过38.3℃,病程持续3周以上,并且经1周详细的检查仍无法明确诊断的疾病。根据潜在病因将FUO分为4种亚型-经典型(classic FUO)、院内型(nosocomial FUO)、免疫缺陷型(neutropenic FUO)和HIV相关型(HIV associated FUO)。
[0004] 据文献报道,目前FUO大约占发热病例的10%,其确诊率大约在90%左右。在已确诊的病例中,感染性疾病大约占到50%-55%,其中细菌感染大约占感染性疾病75%,占诊断明确疾病40%左右;病毒感染大约占感染性疾病20%,占诊断明确疾病10%左右;其他感染约占感染性疾病4%,占诊断明确疾病2%左右,包括真菌感染、支原体感染、立克次体感染、及寄生虫感染。非感染性疾病占45%-50%,其中自身免疫疾病约占非感染性疾病50%,占诊断明确疾病23%左右;肿瘤性疾病占非感染性疾病49%,占诊断明确疾病16%。
[0005] 不明原因发热的诊断关键在找出病因,临床上主要应鉴别4类疾病,即感染性疾病、恶性肿瘤自身免疫性疾病及其他可引起发热的疾病。目前针对不明原因发热病因诊断展开了大量的研究,研究证明感染仍是不明原因发热研究性报告中最为普遍的病因。
[0006] 目前,不明原因发热明确诊断方法中以血清学和(或)细菌学为主,其次为组织学活检,再次为临床过程和(或)治疗反应、影像学检查、体液或骨髓检查、手术探查。这些技术在临床诊断中已发挥了巨大的作用,但仍存在一些不足之处,例如培养技术繁琐而费时,组织学活检及手术探查等可能会给病人带来痛苦及负担,这些不足之处需要应用新的技术去弥补。

发明内容

[0007] 本发明一方面提供一种检测血液中微生物的方法,微生物包括细菌、病毒和真菌,包括:(1)提取血液样本核酸,对核酸的至少一部分进行序列测定,获得测序数据;(2)去除(1)中的测序数据中的宿主测序数据;(3)将(2)中余下的测序数据比对到微生物参考数据库,获得比对结果,所说的微生物参考数据库包含多种细菌的参考序列和多种病毒的参考基序列;(4)依据(3)的比对结果,确定微生物包含的物种及物种的丰度。
[0008] 本发明的另一方面提供一种确定宿主感染病原体的方法,所说的宿主包括人和哺乳动物,所说的病原体包括致病细菌和/或致病病毒,该方法包括:(1)提取宿主血液样本核酸,对核酸的至少一部分进行序列测定,获得测序数据;(2)去除(1)中的测序数据中的宿主测序数据;(3)将(2)中余下的测序数据比对到病原体参考数据库,获得比对结果;(4)依据(3)的比对结果,确定样本包含的致病物种及其丰度;(5)将(4)中致病物种的丰度与所述致病物种的不致病丰度进行比较,两者有显著性差异则确定该宿主感染这种病原体。
[0009] 本发明的再一方面提供一种确定宿主感染病原体的装置,该装置包括:A.核酸提取单元,用于提取宿主血液/血浆/血清样本核酸,对核酸的至少一部分进行序列测定,获得测序数据;B.数据去除单元,连接A单元,用于接收A中的测序数据,去除测序数据中的宿主测序数据;C.比对单元,连接B单元或者连接A和B单元,用于将B中余下的测序数据比对到病原体参考数据库,获得比对结果;D.丰度计算单元,与C单元连接,用于接收C中的比对结果,确定样本包含的病原体种类及各种病原体的丰度;E.判定单元,与D单元连接,用于接收D中的致病物种的丰度,将致病物种的丰度与该致病物种的不致病丰度进行比较,二者有显著性差异则确定宿主感染该致病物种。
[0010] 本发明提供的血液微生物的检测方法、检测宿主感染病原体的方法和装置,是基于新一代的高通量测序技术来进行的,本发明提供的方法只需要宿主的血液/血浆/血清即可,与组织学活检及手术探查等技术相比可以大大的减轻受检者的痛苦。同时,本发明的方法仅需要2-3天左右的时间,可以尽早的为受检者找到相关的微生物或病原体,以便及时的调整治疗方案以解除受检者或者患者的痛苦。此外,本发明的方法或装置的成本也相对较低,通量高,符合大多数受检者或患者的支付平,可以在临床中广泛推广,快速检测用于辅助临床诊断。还可用于血质的检测,利于健康输血用血。附图说明
[0011] 本发明的上述和/或附加的方面和优点从结合下面附图对实施方式的描述中将变得明显和容易理解,其中:
[0012] 图1是本发明的一个具体实施方式中的四个血浆样本病原体细菌丰度(abundance2)表达值前10位的数据趋势图;
[0013] 图2是本发明的一个具体实施方式中的四个血浆样本病原体病毒丰度(abundance2)表达值前10位的数据趋势图;
[0014] 图3是本发明的一个具体实施方式中的不明原因发热病原体检测信息分析流程示意图。

具体实施方式

[0015] 根据本发明的一个实施方式,提供了一种检测血液中微生物的方法,所说的微生物包括细菌、病毒和真菌,该方法包括如下步骤:
[0016] 步骤一:获得血液样本核酸测序数据
[0017] 所说的血液样本,包括全血样本、血浆样本和/或血清样本。获得宿主血液样本后,可处理血液样本获得血清或者血浆样本,提取血清或血浆中的核酸,对核酸的至少一部分进行序列测定,获得测序数据。血浆或血清中的核酸为游离核酸,为来自宿主以及宿主中的微生物的核酸混合物。这边的宿主可以是人也可以是其它哺乳动物,这边核酸可以是DNA,也可以是RNA,测定DNA和/或RNA的序列,可以依据所选用的测序方法进行相应的文库制备,可选用的测序方法根据来自的测序平台包括但不限于BGISEQ1000、BGISEQ100、Illumina/Solexa、ABI/SOLiD和Roche 454,依据所选测序平台进行相应的单端或双端测序文库的制备。根据本发明一种具体实施方式,宿主是人,提取的核酸是人血浆中游离DNA,利用华大基因(BGI)的BGISEQ100平台及其DNA文库构建说明DNA测序,获得测序数据,测序数据由多个测序序列(reads,读段)组成。在本发明的一个具体实施方式中,获得测序数据后,还去除获自BGISEQ100平台的测序数据中小于50bp的读段,因为获自BGISEQ100的读段长度不一,这样较严格的去掉较短的读段能提高整体读段的质量,提高数据利用率,利于后续准确检测。
[0018] 步骤二:去除测序数据中的宿主测序数据
[0019] 将步骤一的测序数据比对到宿主人的参考序列上,将比对上人参考序列的测序数据去除。参考序列为已知序列,他人公开或是自己测定。人的参考序列可以是已知的基因组或是已知的基因组的一部分序列,比如组装片段。序列比对可以利用已知软件比如SOAP或BWA来进行。在本发明的一个具体实施方式中,人参考基因组为HG19,获自NCBI网站,比对是利用Life Technologies的TMAP软件进行的,将比对上HG19的读段去除,屏蔽掉比对上的序列,得到非人的测序数据。去除大量的宿主源的数据,减少对微生物源核酸数据的干扰,便于后续微生物检测鉴定。
[0020] 步骤三:获得余下的测序数据的比对结果
[0021] 将步骤二中余下的测序数据比对到微生物参考数据库,获得比对结果,所说的微生物参考数据库包括多种细菌的参考基因序列和多种病毒的参考序列。细菌或病毒的参考序列可以是已知的该细菌或病毒的基因组或是基因组的一部分序列,比如该细菌/病毒的组装片段。细菌或病毒基因序列可以获自公开数据库,比如NCBI。在本发明的一个具体实施方式中,选择各种与人相关的细菌和病毒的参考基因组,分别构成细菌参考数据库和病毒参考数据库。针对细菌参考数据库中的每种细菌选择其一株菌株,优先选择遗传信息数据最多的菌株,这样可以保证细菌参考数据库物种的唯一性和全面性,以免受到物种内不同菌株由于高度近缘,序列高度相似而影响物种的定量分析;病毒参考数据库包含所有与宿主人相关的病毒全基因组序列,由于病毒变异较大,所以保留同种病毒不同亚型,即某种病毒的参考基因组包括该病毒的所有亚型的参考基因组,且选择基因组大小为600bp以上的病毒株的基因组作为参考序列。
[0022] 步骤四:确定检测到的微生物物种及各物种的丰度
[0023] 依据步骤三的比对结果,确定样本中包含的微生物种类及各物种的丰度。在本发明的一个具体实施方式中,根据与细菌和/或病毒数据库的比对结果,确定样本中细菌或病毒源核酸表达丰度。各微生物物种的量化,即表达丰度,包括依据比对结果中比对上该物种的测序数据计算得到的该物种的覆盖度和覆盖深度。在本发明的一个具体实施方式中,根据覆盖度和深度信息推演获得以下两组病原体量化公式:公式I:丰度其中,i表示物种;和/或,公式II:丰度其中, j表示与物种i同一参考数据库中物种,比如物种i是细菌,j
即为细菌参考数据库中包含的物种。
[0024] 根据本发明的另一个实施方式,提供了一种确定宿主感染病原体的方法,宿主包括人、其它哺乳动物以及非哺乳动物,所说的病原体属于本发明上一方面方法中的微生物,包括致病于宿主的细菌、和/或致病病毒、和/或致病真菌,致病细菌、致病病毒和致病真菌分别属于本发明上一方面方法中的细菌、病毒和真菌。确定宿主感染病原体方法,包括以下步骤:
[0025] (1)获得血液样本核酸测序数据;
[0026] (2)去除测序数据中的宿主测序数据;
[0027] (3)获得余下的测序数据的比对结果;
[0028] (4)检测样本包含的病原体种类及确定各种病原体的丰度;
[0029] 本发明这一实施方式提供的方法的步骤(1)-(4),与本发明前一个实施方式提供的检测血液中微生物的方法所包含的步骤对应,前面对本发明一个实施方式提供的检测血液中微生物的方法以及其包含的各个步骤的描述、特征说明和优点,也适用于本发明这一实施方式提供的确定宿主感染病原体的方法的步骤(1)-(4),在此不再赘述。在本发明的一个具体实施方式中,检测的样本来源于患不明原因发热的个体。
[0030] (5)判定宿主是否感染某个(些)病原体
[0031] 将(4)中获得的一个或多个致病物种的丰度与该致病物种的不致病丰度进行比较,两者有显著性差异则确定所述样本来源的宿主感染该致病物种。在本发明的一个具体实施方式中,致病物种的不致病丰度的确定,包括:预先或同时对多个正常物种宿主血液/血浆/血清样本进行(1)-(4),获得多个正常宿主各自包含的一个或多个致病物种的丰度,获得所述一个或多个致病物种的多个丰度I值和多个丰度II值;针对一个致病物种,集合来自多个正常宿主样本的多个丰度I值,设定置信度,获得该致病物种的不致病丰度I值范围,以及,集合来自多个正常宿主的多个丰度II值,获得所该病物种的不致病丰度II值;丰度I值是根据所述公式I计算获得的,丰度II值是根据所述公式II获得的,其中,公式I:丰度 i表示物种,公式II:丰度j表示与物种i同一细菌或者病毒参考数据库中的物种。可
以依照常规统计检验取置信度的值,比如将置信度设为95%、99%或者99.9%等。在本发明的一个具体实施方式中,该步骤(5)包括:将(4)中致病物种的丰度I值和丰度II值分别与该致病物种的不致病丰度I值范围和不致病II值比较,当该致病物种的丰度I值不在该致病物种的不致病丰度I值范围内,并且,该致病物种的丰度II值大于该致病物种的不致病丰度II值时,表明所述致病物种的丰度与其不致病丰度差异显著,则判定该宿主感染该致病物种。
[0032] 根据本发明的再一个实施方式,提供了能够分别执行上述本发明的两个实施方式的方法的部分或全部步骤的装置。比如,提供了一种检测宿主是否感染病原体的装置,所说的宿主包括人,病原体属于前述的微生物,包括致病宿主的细菌、和/或致病病毒和/或致病真菌,该装置包括:A.核酸提取单元,用于提取宿主血液/血浆/血清样本核酸,对所述核酸的至少一部分进行序列测定,获得测序数据;B.数据去除单元,连接A单元,用于接收A中的测序数据,去除所述测序数据中的宿主测序数据;C.比对单元,连接B单元或者连接A和B单元,用于将B中余下的测序数据比对到病原体参考数据库,获得比对结果,所说的病原体参考数据库包括多种致病细菌的参考基因序列和多种致病病毒的参考序列;D.丰度计算单元,与C单元连接,用于接收C中的比对结果,确定所述样本包含的病原体种类以及各种致病物种的丰度;E.判定单元,与D单元连接,用于接收D中的一个或多个致病物种的丰度,将一个或多个致病物种的丰度与各自对应致病物种的不致病丰度进行比较,二者有显著性差异则确定所述宿主感染该致病物种。上述的对本发明的一方面的血液微生物检测方法和/或检测宿主是否感染病原体的方法的优点和技术特征的描述,同样适用于该装置,在此不再赘述。
[0033] 下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
[0034] 除另有交待,以下实施例中涉及的未特别交待的试剂、序列(接头、标签和引物)、软件及仪器,都是常规市售产品或者公开的,比如购自华大基因的BGISEQ100测序平台建库相关试剂盒或服务等。以下实施例检测不明原因发热病原体大致包括以下步骤:(1)血浆样本核酸的提取;(2)DNA文库构建;(3)Agilent 2100及QPCR检测文库;(4)BGISEQ100上机测序;(5)数据预处理;(6)病原数据库比对,和(7)数据分析,确定引起发热的病原体。
[0035] 实施例一 血浆样本游离核酸序列测定
[0036] 不明原因发热患者的血液/血浆样本来自内蒙古妇幼保健院,提取样本核酸后,按照BGI的微芯片半导体测序平台BGISEQ100的建库和测序说明进行文库构建和测序。
[0037] 本项检测技术采用新一代高通量测序技术来检测不明原因发热患者血浆中的病原体,具体的实施步骤如下:
[0038] 血浆样本核酸的提取
[0039] 使用天根的微量样品基因组提取试剂盒,按照试剂盒中说明书的步骤提取血浆样本的核酸。
[0040] 2.DNA文库构建
[0041] 2.1末端修复
[0042] 2.1.1预先从-20℃保存的试剂盒中取出10×Polynucleotide Kinase(PNK)buffer、10mM dNTP Solution Set、Klenow Fragment、T4 Polynucleotide Kinase(T4 PNK)将其置于上融解并充分混匀。
[0043] 2.1.2配置末端修复反应体系:
[0044]试剂 V/反应(μL)
10 x Polynucleotide Kinase buffer 5
dNTP Solution Set(10mM) 2
T4 DNA Polymerase(3U/μL) 1
Klenow Fragment(稀释10倍) 1
T4 Polynucleotide Kinase(T4 PNK) 1
DNA 40
Total volume 50
[0045] 2.1.3震荡混匀并离心后,置于在Thermomixer中20℃温浴30min。
[0046] 2.1.4使用1.8倍磁珠(Agencourt AMPure XP)进行末端修复产物纯化,回收的DNA溶于37μL的水中。
[0047] 2..2 Adapter的连接(Adapter Ligation)
[0048] 2.2.1预先从-20℃保存的试剂盒中取出10×ligation buffer、Adapter、Barcode和T4 DNA Ligase将其置于冰上融解并充分混匀。
[0049] 2.2.2配置Adapter连接反应体系:
[0050]试剂 V/反应(μL)
10×ligation buffer 5
PE Adapter(12.5pmol/μL稀释4倍) 1
T4 DNA Ligase(1U/μL) 3
ATP 3.5
DNA片段 36.5
Barcode(12.5pmol/μL稀释4倍) 1
Total volume 50
[0051] 2.2.3震荡混匀并离心后,置于在Thermomixer中16℃,过夜连接。
[0052] 2.2.4使用1.2倍磁珠(Agencourt AMPure XP)进行加“Adaptor”产物纯化,回收的DNA溶于35μL的超纯水中。
[0053] 2.3 PCR
[0054] 2.3.1从-20 ℃ 保 存 的 试 剂 盒 中 取 出 10×Pfx Amplification Buffer、MgSO4(50mM)、dNTP Solution Set(10 mM)、T_PCR_A、Plamp将其置于冰上融解并充分混匀。
[0055] 2.3.2配置PCR反应体系:
[0056]反应个数 1个反应(μL)
T_PCR_A(50pmol/μL) 1.25
10×Pfx Amplification Buffer 5
dNTP Solution Set(10mM) 5
MgSO4(50mM) 2
Plamp(50pmol/μL) 1.25
DNA片段 34.5
Pfx polymerase 1
Total volume 50
[0057]
[0058] 2.3.3振荡混匀离心后,将混合液置于PCR仪中按照下列程序反应。
[0059]
[0060] 2.3.4使用1倍磁珠(Agencourt AMPure XP)进行PCR产物纯化,回收的DNA溶于30μL的超纯水中。
[0061] 3.文库检测
[0062] 使用Agilent 2100 Bioanalyzer检测DNA文库样本的片段大小范围,使用QPCR检测DNA文库样本的浓度。文库大小及浓度符合上机要求。
[0063] 4.BGISEQ100高通量测序,获得下机数据。
[0064] 实施例二 微生物/病原体检测
[0065] 整体检测分析流程如图3所示。
[0066] 依照实施例一的方法步骤1-4,获取血浆样本核酸的序列测定数据,测序数据由多个长短不一的读段组成。
[0067] 5.数据预处理
[0068] 5.1过滤原始数据,对于BGISEQ100测序数据,去除小于50bp读段。
[0069] 5.2过滤宿主人遗传物质。血浆样本中绝大部分是宿主人的游离DNA,数据显示高达95%以上,其余微生物含量在1%以下,为避免检测病原微生物时宿主人遗传物质的影响,利用TMAP软件与人参考基因组reference序列进行比对,屏蔽掉比对上的序列,得到非人的序列数据。
[0070] 6.病原数据库比对
[0071] 检测血浆病原微生物主要检测细菌和病毒及少部分真菌。从已知的公开的细菌数据库中每一个物种选择一株菌株,择优选择遗传信息最多的菌株。目的是为了保证细菌数据库物种的唯一性和全面性,以免受到物种内不同菌株由于高度近缘,序列高度相似而影响物种的定量分析。对于病毒数据库我们选择与人相关的病毒全基因组序列,由于病毒变异较大,所以保留同种病毒不同亚型,且病毒株的基因组大小为600bp以上。利用TMAP或者其它已知比对软件将经过预处理的测序数据分别与上述细菌库、病毒库分别比对,分别得到细菌和病毒的比对结果数据,在此保留全面比对结果,即包含比对上细菌或病毒库多处位置的测序序列(读段)。在此,经过过滤后得读段中只要有一条能够唯一比对到某种病原体的参考基因组,则认为该样本包含这种病原体。
[0072] 7.数据分析,确定引起不明原因发热的病原体
[0073] 7.1确定待检样本病原体表达丰度图谱。
[0074] 利用软件soap.coverage(http://soap.genomics.org.cn/)对细菌病毒比对结果进行统计,得到待检测样本中病原体的覆盖度和覆盖深度。根据覆盖度和深度信息推演两组病原体量化公式:I、物种A的丰度,丰度 其中,A表示物种;公式I为双向标准化。对于一个样本中某一病原体的丰度,每百万数据量中,来自于某物种每千bp长度的数据量多少(bp),在此消除了物种的长度和样本数据量的大小。
II、物种A的丰度,丰度 其中, i表示同一细菌或病毒参
考数据库中的物种。公式II为相对丰度,能够1)估计每个病原体的拷贝数,2)估计待检样本病原体的相对丰度。
[0075] 7.2阈值筛选设置
[0076] 通过上述公式1衡量病原体的丰度,在丰度值小于一定值的情况下,认为病原体的拷贝数很低不足以引起宿主感染而引起发发热。确定引起不明原因发热的丰度阈值,通过以下模型给定阈值参考范围。
[0077] 在正常样本数据量积累到一定程度的时候,比如30个以上的正常样本的数据量,可以认为样本中病原体含量是服从正态分布的,显著性水平α=0.05的情况下,其接收域μ±1.96σ其中,μ为样本均值,σ为样本方差。这些统计检验的参数的计算公式按照统计书籍中的检验方法,比如z检验进行。判定检测样本中病原体丰度与正常样本相比较是否具有显著的差异性,即待检样本病原体丰度值是否落在拒绝域中。如果落在拒绝域中统计学上可认为待检样本感染该病原体。
[0078] 通过上述公式II衡量病原体相关性丰度,在相关性丰度很低的情况下,认为病原体拷贝很低没有显著的优势,这种情况也不足以引起宿主感染。相关性丰度阈值确定可以根据经验值给定一个基线,比如可以根据相对丰度最高的物种的不致病丰度II值给出。四例血浆样本数据按照上述信息流程分析,检测出样本RTID2017感染绿脓杆菌,样本TJHBVS0559感染四型疱疹病毒,这一检测结果与临床检测一致。四例实例样本检测数据统计结果见表1;样本RTID2017的细菌丰度统计结果见表2;样本TJHBVS0559的病毒丰度检测结果见表3;四例实例样本的物种丰度见表4和表5;4例样本的检测结果如图1和图2所示,图1中横轴表示细菌表达值由高至底的序号,纵轴表示为相对表达丰度,直线基线为相对丰度表达阈值0.15,如图1显示,样本RTID2017感染了绿脓杆菌。图2横轴表示病毒表达值由高至底的序号,纵轴表示为相对表达丰度。直线基线为相对丰度表达阈值0.15,样本TJHBVS0559感染了四型疱疹病毒。
[0079] 7.3数据分析结果
[0080] 表1 四例待检样本测序数据统计结果
[0081]
[0082] 注:total表示Tmap软件对于一条reads比对多个位置的结果全部输出。
[0083] 表2 样本RTID2017细菌丰度统计
[0084]
[0085] 注:abundance1为利用公式1计算所得的丰度;abundance2为利用公式2计算所得的丰度。
[0086] 表3 样本TJHBVS559病毒丰度统计
[0087]
[0088] 表4 四例样本细菌相对丰度(abundance2)数据结果
[0089]
[0090]
[0091] 表5 四例样本病毒相对丰度(abundance2)结果数据
[0092]
[0093]
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈