首页 / 专利库 / 林业机械与工程 / 森林健康 / 一种基于肠道菌群的小规模精神分裂症生物标志物组合、其应用及mOTU筛选方法

一种基于肠道菌群的小规模精神分裂症生物标志物组合、其应用及mOTU筛选方法

阅读:97发布:2020-05-08

专利汇可以提供一种基于肠道菌群的小规模精神分裂症生物标志物组合、其应用及mOTU筛选方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于肠道菌群的小规模 精神分裂症 生物 标志物组合、其应用及mOTU筛选方法,可以利用候选药物使用前和使用后对这些生物标志物的影响,从而确定候选药物是否可以用于 治疗 或 预防 精神分裂症。克服现有精神分裂症诊断方法不能做到早期预警、不能预测精神分裂症发病以及发展趋势等缺点。从而可以应用于预测精神分裂症发病以及发展的趋势,以及应用于 疾病 病理分型的 试剂 盒 的制备应用。,下面是一种基于肠道菌群的小规模精神分裂症生物标志物组合、其应用及mOTU筛选方法专利的具体信息内容。

1.一种基于肠道菌群的小规模精神分裂症生物标志物组合,其特征在于,该生物标志物组合用于提供相对丰度信息,其包含选自以下的一种或多种:
生物标志物1:Bacteroides plebeius;
生物标志物2:Akkermansia muciniphila;
生物标志物3:Enterococcus faecium;
生物标志物4:Eubacterium siraeum;
生物标志物5:Bacteroides intestinalis。
2.如权利要求1所述的基于肠道菌群的小规模精神分裂症生物标志物组合,其特征在于,所述的生物标志物组合提供的相对丰度信息用于和参考值进行比较。
3.如权利要求1所述的基于肠道菌群的小规模精神分裂症生物标志物组合,其特征在于,所述的生物标志物1~5的相对丰度信息是基于能够对其进行丰度计算的基因序列来提供的。
4.权利要求1所述的基于肠道菌群的小规模精神分裂症生物标志物组合作为检测靶点或检测目标在制备检测试剂盒中的应用。
5.权利要求1所述的基于肠道菌群的小规模精神分裂症生物标志物组合作为靶点在筛选治疗和/或者预防精神分裂症的药物中的应用。
6.如权利要求5所述的应用,其特征在于,所述的生物标志物组合相对丰度的变化为确定候选药物是否有效提供依据。
7.权利要求1所述的基于肠道菌群的小规模精神分裂症生物标志物组合的筛选方法,其特征在于,步骤如下:
1)样本收集:采集粪便样品后冷冻运输并迅速转移到-80℃保存,进行DNA提取,得到提取的DNA样本,样本受试者包括精神分裂症病人和健康人;
2)宏基因组测序与组装
3)保守的单拷贝基因比对与丰度计算
3)将高质量的测序片段输入到软件mOTU计算出物种的相对丰度:
3.1)将高质量测序片段比对到参考的单拷贝基因上;
3.2)根据比对结果统计插入片段的数量;
3.3)将插入片段的数量对单拷贝基因的长度进行标准化得到对应的丰度。
4)从样本集中随机地选取精神分裂症病人和健康人作为训练集,其余样品作为验证集,计算训练集中每个样本中mOTU的相对丰度,然后将训练集的mOTU输入随机森林分类器,对分类器进行5次10折交叉验证,利用RF模型筛选的mOTU相对丰度对每一个体计算其精神分裂症患病险,绘制ROC曲线,并计算出AUC作为判别模型效能评价参数,选取标志物组合数<30,且判别效能最佳的组合,在模型中输出每个mOTU的重要性指数重要性指数越高,代表该标志物用来判别精神分裂症和非精神分裂症的重要性越高。
8.权利要求7所述筛选方法,其特征在于,所述样本集中,样本受试者包括90个精神分裂症病人和81个健康人,验证集中,样本受试者包括10个精神分裂症病人和10个健康人。

说明书全文

一种基于肠道菌群的小规模精神分裂症生物标志物组合、其

应用及mOTU筛选方法

技术领域

[0001] 本发明属于生物医药技术领域,涉及一种基于肠道菌群的精神分裂症的生物标志物、诊断或预测精神分裂症险的试剂盒及应用。

背景技术

[0002] 精神分裂症(英语:Schizophrenia)是一组病因未明的重性精神病,多在青壮年缓慢或亚急性起病,临床上往往表现为症状各异的综合征,涉及感知觉、思维、情感和行为等多方面的障碍以及精神活动的不协调。患者一般意识清楚,智能基本正常,但部分患者在疾病过程中会伴有认知功能的损害。病程一般迁延,呈反复发作、加重或恶化,多数患者最终出现衰退和精神残疾,仅少数患者经过治疗后可达到痊愈或基本痊愈状态。
[0003] 精神分裂症的全球患病率约为0.3-0.7%。截止2016年,全球估计有超过2100万名精神分裂症患者,其平均预期寿命较正常人缩短10年至25年。
[0004] 尽管既往研究表明精神分裂症发病是由遗传因素及环境因素共同作用所致,且患者的血清及脑组织都呈现部分异常改变,但目前对精神分裂症的诊断仍依赖于症状学评价,尚无可靠的生物学标记物标识。此外,现有的诊断标准不能早期预测精神分裂的发病,疗效及预后

发明内容

[0005] 本发明解决的问题在于提供一种基于肠道菌群的小规模精神分裂症生物标志物组合及其应用,仅使用最多5种标志物,即可以克服现有精神分裂症诊断不能做到早期预警、不能预测精神分裂症发病以及发展趋势等缺点,能够帮助疾病病理分型以及为药物作用靶点研究、精准用药、发病机理的研究等。
[0006] 本发明是通过以下技术方案来实现:
[0007] 一种基于肠道菌群的小规模精神分裂症生物标志物组合,该生物标志物组合用于提供相对丰度信息,其包含选自以下的一种或多种:
[0008] 生物标志物1:Bacteroides plebeius;
[0009] 生物标志物2:Akkermansia muciniphila;
[0010] 生物标志物3:Enterococcus faecium;
[0011] 生物标志物4:Eubacterium siraeum;
[0012] 生物标志物5:Bacteroides intestinalis。
[0013] 所述的生物标志物组合提供的相对丰度信息用于和参考值进行比较。
[0014] 所述的生物标志物1~5的相对丰度信息是基于能够对其进行丰度计算的基因序列来提供的。
[0015] 所述的基于肠道菌群的小规模精神分裂症生物标志物组合作为检测靶点或检测目标在制备检测试剂盒中的应用。
[0016] 所述的基于肠道菌群的小规模精神分裂症生物标志物组合的筛选方法,步骤如下:
[0017] 1)样本收集:采集粪便样品后冷冻运输并迅速转移到-80℃保存,进行DNA提取,得到提取的DNA样本,样本受试者包括精神分裂症病人和健康人;
[0018] 2)宏基因组测序与组装
[0019] 3)保守的单拷贝基因比对与丰度计算
[0020] 3)将高质量的测序片段输入到软件mOTU计算出物种的相对丰度:
[0021] 3.1)将高质量测序片段比对到参考的单拷贝基因上;
[0022] 3.2)根据比对结果统计插入片段的数量;
[0023] 3.3)将插入片段的数量对单拷贝基因的长度进行标准化得到对应的丰度。
[0024] 4)从样本集中随机地选取精神分裂症病人和健康人作为训练集,其余样品作为验证集,计算训练集中每个样本中mOTU的相对丰度,然后将训练集的mOTU输入随机森林分类器,对分类器进行5次10折交叉验证,利用RF模型筛选的mOTU相对丰度对每一个体计算其精神分裂症患病风险,绘制ROC曲线,并计算出AUC作为判别模型效能评价参数,选取标志物组合数<30,且判别效能最佳的组合,在模型中输出每个mOTU的重要性指数重要性指数越高,代表该标志物用来判别精神分裂症和非精神分裂症的重要性越高。
[0025] 所述样本集中,样本受试者包括90个精神分裂症病人和81个健康人,验证集中,样本受试者包括10个精神分裂症病人和10个健康人。
[0026] 上述标志物的使用方法即诊断对象是否患有精神分裂症或者预测对象是否患有精神分裂症的风险的方法为:
[0027] 1)从对象中采集样本;
[0028] 2)确定步骤1)中获得的所述样本中的生物标志物的相对丰度信息;
[0029] 3)将步骤2)中所述的相对丰度信息与参考数据集或参考值进行比较。所述方法不仅仅可以用于专利法意义上的疾病诊断,同时可以用作科学研究或者其他个人遗传信息的丰富以及遗传信息库的丰富等非疾病诊断。利用检测对象中的各生物标志物的相对丰度信息与参考数据集或参考值进行比较,来确定对象是否患有精神分裂症,或者预测其患有精神分裂症的风险。
[0030] 所述参考数据集包括来自多个精神分裂症患者和多个健康对照的样本中的生物标志物的相对丰度信息。
[0031] 所述参考数据集指的是对已确诊为患病个体和健康个体的样本进行操作,所获得的各生物标志物的相对丰度信息,用来作为每种生物标志物的相对丰度的参考。具体的,参考数据集可以是指训练数据集。根据本发明,所述训练集是指和验证集具有本领域公知的含义。在本发明的一个实施方案中,所述训练集是指包含一定样本数的精神分裂症受试者和非精神分裂症受试者待测样本中的各生物标志物的含量的数据集合。所述验证集是用来测试训练集性能的独立数据集合。
[0032] 本发明中所述参考值指的是健康对照的参考值或正常值。本领域技术人员已知,当样本容量足够大时,可利用本领域公知的检测和计算方法获得样品中每个生物标志物的正常值(绝对值)的范围。当采用测定方法检测生物标志物的平时,可将样品中的生物标志物水平的绝对值直接与参考值进行比较,以评估患病风险以及诊断或早期诊断精神分裂症,任选地,可以包括统计方法。
[0033] 步骤2)中所述的相对丰度信息与参考数据集进行比较的步骤中,还包括执行多元统计模型以获得患病概率。利用多元统计模型可以实现快速高效检测。具体的,所述多元统计模型为随机森林模型。
[0034] 所述患病概率大于阈值表明所述对象患有精神分裂症或相关疾病或者有患有精神分裂症或相关疾病的风险。具体的,所述阈值为0.5。
[0035] 步骤2)中所述生物标志物的相对丰度信息是利用测序方法得到的,进一步包括:从所述对象的所述样本中分离得到核酸样本,基于所获得的所述核酸样本,构建DNA文库,对所述DNA文库进行测序,以便获得测序结果;以及基于所述测序结果,将测序结果与参考基因集进行比对,以确定所述生物标志物的相对丰度信息。
[0036] 根据本发明的一种实施例,可以利用SOAP2和MAQ的至少一种将测序结果与参考基因集进行比对,由此,可以提高比对的效率,进而可以提高精神分裂症检测的效率。根据本发明的实施例,可以同时对多种(至少两种)生物标志物进行检测,可以提高精神分裂症检测的效率。
[0037] 所述参考基因集包括从多个精神分裂症患者和多个健康对照的样本中进行宏基因组测序,获得非冗余基因集,然后将所述非冗余基因集与肠道微生物基因集合并,得到所述参考基因集。本发明中的参考基因集可以是已有的基因集,如现有的已经公开的肠道微生物参考基因集;也可以是将多个精神分裂症患者和多个健康对照的样品进行宏基因组测序,获得非冗余基因集,然后将所述非冗余基因集与肠道微生物基因集合并,得到所述参考基因集,由此获得的参考基因集信息更全面,检测结果更可靠。
[0038] 所述非冗余基因集作本领域技术人员通常的理解来解释,简单来说是去除冗余基因后的剩余基因的集合。冗余基因通常指的是一条染色体上出现的一个基因的多个复份。
[0039] 具体的,所述样本为粪便样本。所述测序方法是通过第二代测序方法或第三代测序方法进行的。进行测序的手段并不受特别限制,通过二代或者三代测序的方法进行测序,可以实现快速高效的测序。
[0040] 所述测序方法是通过选自Hiseq2000、SOLiD、454、和单分子测序装置的至少一种进行的。由此,能够利用这些测序装置的高通量、深度测序的特点,从而有利于对后续测序数据进行分析,尤其是进行统计学检验时的精确性和准确度。
[0041] 本发明提出了所述的基于肠道菌群的小规模精神分裂症生物标志物组合作为检测靶点或检测目标在制备检测试剂盒中的应用,所述试剂盒用于诊断对象是否患有精神分裂症或相关疾病或者预测对象是否患有精神分裂症或相关疾病的风险。
[0042] 即,本发明提出了一种包括用于检测生物标志物的试剂的试剂盒,利用该试剂盒,可以确定这些标志物在肠道菌群中的相对丰度,由此,可以通过所得到的相对丰度值,从而确定对象是否患有或者易感精神分裂症,以及用于监控精神分裂症患者的治疗效果的效率。
[0043] 本发明提出了基于肠道菌群的小规模精神分裂症生物标志物组合作为靶点在筛选治疗和 /或者预防精神分裂症的药物中的应用。所述生物标志物为上述本发明提出的生物标志物,可以利用候选药物使用前和使用后对这些生物标志物的影响,从而确定候选药物是否可以用于治疗或预防精神分裂症。
[0044] 所述的生物标志物组合相对丰度的变化为确定候选药物是否有效提供依据。
[0045] 与现有技术相比,本发明具有以下有益的技术效果:
[0046] 本发明基于以下事实和问题的发现和认识作出的:肠道微生物是存在于人体肠道中的微生物群落,是人体的“第二基因组”。人体肠道菌群和宿主构成一个相互关联的整体。肠道微生物能够产生在人脑中发现的大多数神经递质。越来越多的证据支持肠道微生物影响中枢神经化学和行为的观点,肠易激综合征被认为是大脑-肠道微生物轴调节紊乱的典型案例。转化研究表明,某些特定的菌群可能会对压反应和认知功能产生影响。用益生菌或抗生素改变肠道微生物群,为提高大脑功能和治疗抑郁及自闭症等肠-脑轴疾病提供了一种新的方法。因此,本发明通过对精神分裂症患者和健康人群的肠道菌群以及基因序列进行分析,从而筛选出与精神分裂症相关性高的生物标志物,并且利用该标志物能够准确地诊断精神分裂症或者预测患病风险,并且可以用于监测治疗效果。
[0047] 粪便是人体的代谢产物,其内不仅包含人体的代谢产物,还包括对我们的机体代谢和免疫以及脑功能的变化密切相关的肠道微生物。对粪便进行研究,发现在精神分裂症患者和健康人群的肠道菌群的组成上存在明显的差异,可以准确地对精神分裂症患者进行患病风险评估、早期诊断。本发明基于对精神分裂症患者和健康人群肠道菌群的比较和分析,得到多种相关的肠道微生物,结合高质量的精神分裂症人群和健康人群mOTU作为训练集,能够准确地对精神分裂症患者进行患病风险评估、早期诊断。该方法与目前常用的诊断方法相比,具有方便、快捷的特点。
[0048] 本发明提出的精神分裂症相关的生物标记物对早期诊断是有价值的。第一,本发明的标记物具有较高的特异性和灵敏性。第二,粪便的分析保证准确性、安全性、可负担性和患者依从性。并且粪便的样本是可运输的。基于聚合酶链反应(PCR)的试验舒适且无创,所以人们会更容易参与给定的筛选程序。第三,本发明的标记物还可以用作于对精神分裂症患者进行治疗监测的工具以检测对治疗的响应。由于丰度度量的原因,本发明中五种标记物的组合特别适用于基于mOTU方法度量丰度的情况。附图说明
[0049] 图1为根据本发明一个实施例物种属水平上精神分裂症患者和健康对照β多样性的情况。图示表明,精神分裂症患者和健康对照存在显著差异。
[0050] 图2为根据本发明的一个实施例随机森林分类器中5次10折交叉验证的错误率分布情况。
[0051] 图3为根据本发明的一个实施例基于随机森林模型(5个肠道标志物),由精神分裂症患者和健康对照组成的训练集的接收者操作特征(Receiver  Operating Characteristic,ROC)曲线和曲线下面积(Area under Curve,AUC)。
[0052] 图4为根据本发明的一个实施例基于随机森林模型(5个肠道标志物),由精神分裂症患者和健康对照组成的验证集的ROC曲线和AUC。

具体实施方式

[0053] 本发明所用术语具有相关领域普通技术人员通常理解的含义。然而,为了更好地理解本发明,对一些定义和相关术语的解释如下:
[0054] “精神分裂症”,是一组病因未明的重性精神病,多在青壮年缓慢或亚急性起病,临床上往往表现为症状各异的综合征,涉及感知觉、思维、情感和行为等多方面的障碍以及精神活动的不协调。
[0055] “生物标志物”,也称为“生物学标志物”,是指个体的生物状态的可测量指标。这样的生物标记物可以是在个体中的任何物质,只要它们与被检个体的特定生物状态(例如,疾病) 有关系,例如,核酸标志物(也可以称为基因标志物,例如DNA),蛋白质标志物,细胞因子标记物,趋化因子标记物,水化合物标志物,抗原标志物,抗体标志物,物种标志物(种 /属的标记)和功能标志物(KO/OG标记)等。其中,核酸标志物的含义并不局限于现有可以表达为具有生物活性的蛋白质的基因,还包括任何核酸片段,可以为DNA,也可以为RNA,可以是经过修饰的DNA或者RNA,也可以是未经修饰的DNA或者RNA,以及由它们组成的集合。在本文中核酸标志物有时也可以称为特征片段。在本发明中,生物标志物也可以用“肠道标志物”来表示,因为所发现的与精神分裂症相关的生物标志物均存在于受试者的肠道内。生物标记物经过测量和评估,经常用以检查正常生物过程,致病过程,或治疗干预药理响应,而且在许多科学领域都是有用的。
[0056] 所述的生物标志物,可以运用高通量测序,批量分析健康人群和精神分裂症患者的粪便样本。基于高通量测序数据,对健康人群与精神分裂症患者群进行比对,从而确定与精神分裂症患者群相关的特异性核酸序列。简言之,其步骤如下:
[0057] 样品的收集与处理:收集健康人群与精神分裂症患者群的粪便样本,使用试剂盒进行 DNA提取,得到核酸样本;
[0058] 文库构建和测序:DNA文库构建和测序是利用高通量测序进行,以便得到粪便样品中所包含肠道微生物的核酸序列;
[0059] 通过生物信息学的分析方法,确定与精神分裂症患者相关的特异性肠道微生物核酸序列。首先,将测序序列(reads)与参照基因集(也称为参考基因集,可以为新构建的基因集或任何已知序列的数据库,例如,采用已知的人肠道微生物群落非冗余基因集)进行比对。接下来,基于比对结果,分别确定来自健康人群和精神分裂症患者群粪便样品的核酸样本中各基因的相对丰度。通过将测序序列与参照基因集进行比对,可以将测序序列与参照基因集中的基因建立对应关系,从而针对核酸样本中的特定基因,与其相对应的测序序列的数目可以有效地反映该基因的相对丰度。由此,可以通过比对结果,按照常规的统计分析,确定在核酸样本中基因的相对丰度。最后,在确定核酸样本中各基因的相对丰度后,对来自健康人群和精神分裂症患者群粪便的核酸样本中各基因的相对丰度进行统计检验,由此,可以判断在健康人群和精神分裂症患者人群中是否存在相对丰度有显著差异的基因,如果存在基因是显著差异的,则该基因被当作是异常状态的生物标志物,即核酸标志物。
[0060] 另外,对于已知或新构建的参照基因集,其通常包含基因物种信息和功能注释,由此,在确定基因相对丰度的基础上,可以进一步通过将基因的物种信息和功能注释进行分类,从而确定肠道菌群中各微生物的物种相对丰度和功能相对丰度,也就可以进一步确定异常状态的物种标志物和功能标志物。简言之,确定物种标志物和功能标志物的方法进一步包括:将健康人群和精神分裂症患者群的测序序列与参照基因集进行比对;基于比对结果,分别确定健康人群和精神分裂症病患者群的核酸样本中各基因的物种相对丰度和功能相对丰度;对来自健康人群和精神分裂症病患者群的核酸样本中各基因的物种相对丰度和功能相对丰度进行统计学检验;以及分别确定在健康人群和精神分裂症病患者群的核酸样本之间相对丰度存在显著差异的物种标志物和功能标志物。根据本发明的实施例,可以采用对来自相同物种的基因的相对丰度和具有相同功能注释的基因的相对丰度进行统计检验,例如加和、取平均值、中位数值等,来确定功能相对丰度和物种相对丰度。
[0061] 若未特别指明,实施例中所采用的技术手段为本领域技术人员所熟知的常规手段,可以参照《分子克隆实验指南》第三版或者相关产品进行,所采用的试剂和产品也均为可商业获得的。未详细描述的各种过程和方法是本领域中公知的常规方法,所用试剂的来源、商品名以及有必要列出其组成成分者,均在首次出现时标明,其后所用相同试剂如无特殊说明,均与首次标明的内容相同。
[0062] 本发明采用宏基因组关联分析(Metagenome-Wide Association Study,MWAS)的分析方法,经测序分析粪便样本的菌群组成,功能差异;用随机森林判别模型判别精神分裂症群体和非精神分裂症群体,获得患病概率,用于精神分裂症的患病风险评估、诊断、早期诊断或者寻找潜在药物靶点。
[0063] 根据本发明,术语“个体”指动物,特别是哺乳动物,如灵长类动物,最好是人。
[0064] 根据本发明,术语如“一”、“一个”和“这”不仅指单数的个体,而是包括可以用来说明特定实施方式的通常的一类。
[0065] 在本发明中,所述的测序(二代测序)和MWAS具有本领域所公知,本领域技术人员可以根据具体情况进行调整。根据本发明的实施例,可以依据文献(Jun Wang,and Huijue Jia. Metagenome-wide association studies:fine-mining the microbiome.Nature Reviews Microbiology 14.8(2016):508-522.)中记载的方法进行。
[0066] 根据本发明,术语“mOTU”是指操作分类单元(metagenomics Operational Taxonomic Units) (Sunagawa S,Mende D R,Zeller G,et al.Metagenomic species profiling using universal phylogenetic marker genes[J].Nature methods,2013,10(12):1196-1199.),是在系统发生学研究或群体遗传学研究中,为了便于进行分析,人为给某一个分类单元(品系,种,属,分组等) 设置的同一标志。通常按照相似性阈值将序列划分为不同的mOTU,每一个mOTU通常被视为一个微生物物种。
[0067] 在本发明中,随机森林模型和ROC曲线的使用方法为本领域所公知,本领域技术人员可以根据具体情况进行参数设置和调整。根据本发明的实施例,可以根据文献(Drogan D,Dunn WB,Lin W,Buijsse B,Schulze MB,Langenberg C,Brown M,Floegel a.,Dietrich S,Rolandsson O,Wedge DC,Goodacre R,Forouhi NG,Sharp SJ,Spranger J,Wareham NJ,Boeing H:Untargeted Metabolic Profiling Identifies Altered Serum Metabolites of Type 2-Diabetes Mellitus in a Prospective,Nested Case Control Study.Clin Chem 2015,61:487-497.;Mihalik SJ,Michaliszyn SF, de las Heras J,Bacha F,Lee S,Chace DH,DeJesus VR,Vockley J,Arslanian SA:Metabolomic profiling of fatty acid and amino acid metabolism in youth with obesity and type 2diabetes: evidence for enhanced mitochondrial oxidation.Diabetes Care 2012,35:605-611.)中记载的方法进行。
[0068] 在本发明中,构建了精神分裂症受试者和非精神分裂症受试者的生物标志物的训练集,并以此为基准,对待测样本的生物标志物含量值进行评估。
[0069] 本领域技术人员知晓,当进一步扩大样本量时,利用本领域公知的样本检测和计算方法,可以得出每种生物标志物在样本中的正常含量值区间(绝对数值)。可以将检测得到的生物标志物含量的绝对值与正常含量值进行比较,任选地,还可以结合统计学方法,以得出精神分裂症患病风险评价、诊断以及用于监控精神分裂症患者的治疗效果的效率等。
[0070] 不希望受任何理论的限制,发明人指出这些生物标志物是存在于人体中的肠道菌群。通过本发明所述的方法对受试者肠道菌群进行关联分析,得到精神分裂症群体的所述生物标志物在菌群检测中表现出一定的含量范围值。
[0071] 下面结合具体的实施例对本发明做进一步的详细说明,所述是对本发明的解释而不是限定。
[0072] 实施例1
[0073] 1.1样本收集
[0074] 参照文献A metagenome-wide association study of gut microbiota in type 2diabetes(Qin J et al.Nature.2012,490,55-60)记载的方法,采集粪便样品后冷冻运输并迅速转移到-80℃保存,进行DNA提取,得到提取的DNA样本。本发明的精神分裂症和非精神分裂症受试者的粪便样本来自中国。共计171例,其中健康样本81例和精神分裂症样本90例。
[0075] 1.2宏基因组测序与组装
[0076] 利用所提取的DNA样本构建测序文库,在Illumina HiSeq2000测序平台上进行双向 (Paired-end)宏基因组测序(插入片段350bp,读长100bp)。对测序产生的数据进行过滤 (quality-controlled),去除adapter污染序列、低质量序列和宿主基因组污染序列,得到高质量的测序片段(reads)。
[0077] 1.3保守的单拷贝基因比对与丰度计算
[0078] 将上述“1.2宏基因组测序与筛选”的高质量测序片段(reads)输入到软件mOTU (http://www.bork.embl.de/software/mOTU/download.html)即可计算出物种的相对丰度。参照文献Metagenomic species profiling using universal phylogenetic marker genes(Sunagawa S et al. Nature methods.2013,10(12),1196-9)记载的方法。其丰度计算步骤如下:1)将高质量测序片段比对到参考的单拷贝基因上;2)根据比对结果统计插入片段的数量;3)将插入片段的数量对单拷贝基因的长度进行标准化(按平均基因长度进行标准化,并按照向下取整的方式得到对应mOTU的丰度)得到对应的丰度。
[0079] 1.4利用随机森林(ROC/AUC)筛选精神分裂症发生发展的潜在生物标志物[0080] 为进一步筛选潜在疾病肠道生物标志物,本实施例构建了精神分裂症受试者和非精神分裂症受试者的生物标志物的训练集,并以此为基准,对待测样本的生物标志物含量值进行评估。其中,在本发明中,所述训练集和所述验证集具有本领域所公知的含义。在本发明的实施方案中,训练集是指包含一定样本数的精神分裂症受试者和非精神分裂症受试者待测样本中的各生物标志物的含量的数据集合。验证集是用来测试训练集性能的独立数据集合。其中,非精神分裂症受试者为精神状态良好的受试者,受试者可以为人或者模型动物,在本实施例中是以人为受试者进行实验的。
[0081] 具体包括如下步骤:
[0082] 本发明从171个样品(90个精神分裂症病人和81个健康人)中,随机地选取80个精神分裂症病人和71个健康人作为训练集(表1),其余样品作为验证集(10个精神分裂症病人和10个健康人)。
[0083] 1.4.1利用训练集数据筛选得到的生物标志物
[0084] 首先,按照1.3描述的方法计算训练集中每个样本中mOTU的相对丰度。然后将训练集的mOTU输入随机森林(randomForest 4.6-12in R 3.2.5,RF)分类器。对分类器进行5次10 折交叉验证,利用RF模型筛选的mOTU相对丰度对每一个体计算其精神分裂症患病风险,绘制ROC曲线,并计算出AUC作为判别模型效能评价参数。选取标志物组合数<30,且判别效能最佳的组合为本发明组合。在模型中输出每个mOTU的重要性指数,重要性指数越高,代表该标志物用来判别精神分裂症和非精神分裂症的重要性越高。
[0085] 最后,本发明所得RF分类器包含了5个代谢物(即5个生物标记物),这5个生物标记物的相对丰度分别如表1所示,其详细信息如表2所示。表3示出了5种生物标记物结合来预测训练集的患病概率,其中患病概率≥0.5确认个体具有患精神分裂的风险或者患有精神分裂症。
[0086] 图2示出了随机森林分类器中5次10折交叉验证的错误率分布情况。该模型用训练集样品在经MWAS流程处理得到的满足目标的mOTU相对丰度进行训练,粗黑色实曲线代表5 次试验(细黑色曲线代表5次试验)的平均值,黑色竖线代表所选最佳组合中mOTU数目。
[0087] 图3示出了基于随机森林模型(5个生物标志物)由精神分裂症患者和健康对照组成的训练集的ROC曲线和AUC,其中特异性表征的是对于不患病判对的概率,敏感性指的是对于患病判对的概率,对训练集样本的判别效能为:AUC=80.88%,95%置信区间CI=74-87.76%。结果表明该模型所得代谢物组合可作为区分精神分裂症与非精神分裂症的潜在生物标志物。
[0088] 1.4.2利用验证集数据验证筛选得到的生物标志物
[0089] 本发明随即使用独立人群对该模型进行验证,患病概率≥0.5预测个体具有精神分裂症患疾病风险或者患有精神分裂症。首先,按照1.3描述的方法计算训练集中每个样本中各生物标志物的相对丰度。然后按照1.4.1的方法利用随机森林模型对验证集数据进行验证。
[0090] 基于该模型:
[0091] 5个生物标记物在验证集中的相对丰度如表4所示。表5示出了基于5个生物标志物预测验证集的患病概率。
[0092] 图4示出了基于随机森林模型(5个生物标志物)由精神分裂症患者和健康对照组成的独立验证集的ROC曲线和AUC,模型的判别AUC=71%(95%CI=45.88%-96.12%)。
[0093] 在3.2.5版本R中使用“randomForest 4.6-12package”进行随机森林模型分类和回归。输入包括训练集数据(即训练样本中选定的mOTU标记物的相对丰度,见表1),样本疾病状态 (训练样本的样本疾病状态为矢量,‘1’代表精神分裂症,‘0’代表健康对照),以及一个验证集(验证集中所选mOTU标记物的相对丰度,见表4)。然后,发明人利用R软件中随机森林包的随机森林函数建立分类和预测函数对验证集数据进行预测,输出即为预测结果(患病概率);阈值为0.5,如果疾病的概率≥0.5,则认为有患精神分裂症的风险或者患有精神分裂症。
[0094] 表1随机森林模型训练集肠道标志物(mOTU)相对丰度数据
[0095]
[0096]
[0097]
[0098]
[0099]
[0100] *SZ:精神分裂患者;H:健康对照
[0101] 表2 5种生物标志物详细信息
[0102]
[0103] #验证集AUC,表示在训练集数据得到模型下,对验证集数据的判别程度。
[0104] &txid,表示该生物标记物在NCBI数据库中的编号。
[0105] 表3基于5种标志物组合训练集患病概率
[0106]
[0107]
[0108]
[0109] 表4随机森林模型验证集肠道标志物(mOTU)相对丰度数据
[0110]
[0111] 表5基于5种标志物组合验证集患病概率
[0112]
[0113]
[0114] 以上结果表明,本发明公开的生物标志物具有较高的准确度和特异性,具有良好的开发为诊断方法的前景,从而为精神分裂症的患病风险评估、诊断、早期诊断,寻找潜在药物靶点提供依据。
[0115] 因此,本发明提出以下应用:
[0116] 所述的基于肠道菌群的小规模精神分裂症生物标志物组合作为检测靶点或检测目标在制备检测试剂盒中的应用。
[0117] 所述的基于肠道菌群的小规模精神分裂症生物标志物组合作为靶点在筛选治疗和/或者预防精神分裂症的药物中的应用。
[0118] 所述的生物标志物组合相对丰度的变化为确定候选药物是否有效提供依据。
[0119] 尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈