首页 / 专利库 / 病理 / 乳糜泻 / 用于微生物组来源的诊断和治疗的方法及系统

用于生物组来源的诊断和治疗的方法及系统

阅读:1059发布:2020-07-06

专利汇可以提供用于生物组来源的诊断和治疗的方法及系统专利检索,专利查询,专利分析的服务。并且一种用于诊断和 治疗 受试者中的免疫 微 生物 功能异常的方法,该方法包括:接收来自受试者群体的生物样品的聚合集;生成受试者群体的微生物组组成数据集和微生物组功能多样性数据集中的至少一种;基于从微生物组组成数据集和微生物组功能多样性数据集中的至少一种提取的特征生成免疫微生物功能异常的表征,其中表征是诊断为克罗恩病、炎性肠病(IBD)、肠易激综合征(IBS)、溃疡性结肠炎和 乳糜泻 (celiac disease)中的至少一种;基于表征生成被配置为矫正免疫微生物功能异常的疗法模型;以及在与受试者相关联的输出设备,基于表征和疗法模型为受试者安排疗法。,下面是用于生物组来源的诊断和治疗的方法及系统专利的具体信息内容。

1.一种用于诊断和治疗受试者中的免疫生物功能异常的方法,所述方法包括:
·在样品处理网络,接收来自受试者群体的生物样品的聚合集;
·在与所述样品处理网络通信的计算系统,在以片段化操作、使用引物组的多重扩增操作、测序分析操作和比对操作处理所述生物样品的聚合集的每一个的核酸内容物后生成所述受试者群体的微生物组组成数据集和微生物组功能多样性数据集;
·在所述计算系统,接收与所述受试者群体的至少一个子集相关的补充数据集,其中所述补充数据集提供与所述免疫微生物功能异常相关的特性的信息;
·在所述计算系统,基于所述补充数据集和从所述微生物组组成数据集和所述微生物组功能多样性数据集中的至少一种提取的特征生成所述免疫微生物功能异常的表征;
·基于所述表征,生成被配置为矫正所述免疫微生物功能异常的疗法模型;以及·在与所述受试者相关联的输出设备,基于所述表征和所述疗法模型为患有免疫微生物功能异常的受试者安排疗法。
2.如权利要求1所述的方法,其中生成所述表征包括进行统计分析以评价在表现出所述免疫微生物功能异常的所述受试者群体的第一子集和未表现出所述免疫微生物功能异常的所述受试者群体的第二子集中具有变化的丰度程度的微生物组组成特征和微生物组功能特征的集合。
3.如权利要求2所述的方法,其中生成所述表征包括:
·提取与所述微生物组组成数据集中指示的微生物组组分的功能方面的集合相关的候选特征,以生成所述微生物组功能多样性数据集;以及
·关于所述功能方面的集合的子集表征所述免疫微生物功能异常,所述子集源自以下中的至少一种:蛋白特征的直系同源聚类、来自京都基因和基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)的基因组功能特征、化学功能特征和系统功能特征。
4.如权利要求2所述的方法,其中生成所述免疫微生物功能异常的表征包括生成诊断为克罗恩病、肠易激综合征(IBS)、炎性肠病(IBD)、溃疡性结肠炎和乳糜泻中的至少一种的表征。
5.如权利要求4所述的方法,其中生成诊断为克罗恩病的表征包括基于在处理所述生物样品的聚合集后确定并源自以下的特征的存在生成所述表征:1)分类单元的集合,所述分类单元的集合包括:梭菌属(Clostridium)(属)、Flavonifractor(属)、普氏菌属(Prevotella)(属)、梭菌科(Clostridiaceae)(科)、普氏菌科(Prevotellaceae)(科)、颤螺菌科(Oscillospiraceae)(科)、γ-变形菌纲(Gammaproteobacteria)(纲)和变形菌(Proteobacteria)(门);和2)功能的集合,所述功能的集合与以下有关:直系同源聚类(COG)D代码、COGI代码和COG J代码。
6.如权利要求4所述的方法,其中生成诊断为IBS的表征包括基于在处理所述生物样品的聚合集后确定并源自以下的特征的存在生成所述表征:分类单元的集合,所述分类单元的集合包括:Flavonifractor(属)、Odoribacter(属)、Blautia(属)、和Finegoldia(属)。
7.如权利要求4所述的方法,其中生成诊断为IBD的表征包括基于在处理所述生物样品的聚合集后确定并源自以下的特征的存在生成所述表征:1)分类单元的集合,所述分类单元的集合包括:梭菌属(属)、瘤胃球菌属(Ruminococcus)(属)、梭菌科(科)、韦荣球菌科(Veillonellaceae)(科)、Selenomonadales(目)、γ-变形菌纲(纲)、Negativicutes(纲)、和变形菌门(门);和2)功能的集合,所述功能的集合与以下中的至少一种有关:京都基因和基因组百科全书(KEGG)K13015代码、KEGG K07094代码、KEGG K00318代码、和KEGG K07482代码。
8.如权利要求4所述的方法,其中生成诊断为溃疡性结肠炎的表征包括基于在处理所述生物样品的聚合集后确定并源自以下的特征的存在生成所述表征:分类单元的集合,所述分类单元的集合包括:梭菌属(属)、毛螺菌属(Lachnospira)(属)、Blautia(属)、小杆菌属(Dialister)(属)、瘤胃球菌属(属)、梭菌科(科)、消化链球菌科
(Peptostreptococcaceae)(科)、韦荣球菌科(科)、丹毒丝菌科(Erysipelotrichaceae)(科)、克里斯滕森菌科(Christensenellaceae)(科)、丹毒丝菌目(Erysipelotrichales)(目)、γ-变形菌纲(纲)、和丹毒丝菌纲(Erysipelotrichia)(纲)。
9.如权利要求4所述的方法,其中生成诊断为乳糜泻的表征包括基于在处理所述生物样品的聚合集后确定并源自以下的特征的存在生成所述表征:分类单元的集合,所述分类单元的集合包括:梭菌属(属)、颤杆菌克属(Oscillibacter)(属)、Sutterella(属)、梭菌科(科)、消化链球菌科(科)、消化球菌科(Peptococcaceae)(科)、颤螺菌科(科)、和变形菌门(门)。
10.一种用于诊断和治疗受试者中的免疫微生物功能异常的方法,所述方法包括:
·在处理来自受试者群体的生物样品的聚合集后,生成所述受试者群体的微生物组组成数据集和微生物组功能多样性数据集中的至少一种,所述微生物组功能多样性数据集指示所述生物样品的聚合集的微生物组组分中存在的系统功能;
·在计算系统,基于从所述微生物组组成数据集和所述微生物组功能多样性数据集中的至少一种提取的特征生成所述免疫微生物功能异常的表征,其中所述表征是诊断为克罗恩病、炎性肠病(IBD)、肠易激综合征(IBS)、溃疡性结肠炎和乳糜泻中的至少一种;
·基于所述表征,生成被配置为矫正所述免疫微生物功能异常的疗法模型;以及·在与所述受试者相关联的输出设备,基于所述表征和所述疗法模型为所述受试者安排疗法。
11.如权利要求10所述的方法,其中生成所述表征包括用Kolmogorov-Smirnov检验和Welch t-检验中的至少一种进行统计分析,以评价在表现出所述免疫微生物功能异常的所述受试者群体的第一子集和未表现出所述免疫微生物功能异常的所述受试者群体的第二子集中具有变化的丰度程度的微生物组组成特征和微生物组功能特征的集合。
12.根据权利要求10所述的方法,其中生成所述表征包括用所述统计分析来分析来自所述微生物组组成数据集的特征集,其中所述特征集包括与以下相关的特征:所述微生物组组成数据集中呈现的不同分类群的相对丰度、在所述微生物组组成数据集中呈现的不同分类群之间的相互作用、以及在所述微生物组组成数据集中呈现的分类群之间的系统发育距离。
13.如权利要求10所述的方法,其中生成诊断为克罗恩病的表征包括基于在处理所述生物样品的聚合集之后确定并源自以下的特征的存在生成所述表征:1)分类单元的集合,所述分类单元的集合包括:梭菌属(属)、梭菌科(科)、普氏菌科(科)、γ-变形菌纲(纲)和变形菌门(门);和2)功能的集合,所述功能的集合与以下相关:直系同源聚类(COG)D代码、COG I代码和COG J代码。
14.如权利要求10所述的方法,其中生成诊断为IBS的表征包括基于在处理所述生物样品的聚合集之后确定并源自以下的特征的存在生成所述表征:分类单元的集合,所述分类单元的集合包括:Odoribacter(属)、Blautia(属)、和Finegoldia(属)。
15.如权利要求10所述的方法,其中生成诊断为IBD的表征包括基于在处理所述生物样品的聚合集之后确定并源自以下的特征的存在生成所述表征:1)分类单元的集合,所述分类单元的集合包括:梭菌属(属)、韦荣球菌科(科)、Selenomonadales(目)、γ-变形菌纲(纲)、Negativicutes(纲)、和变形菌门(门),和2)功能的集合,所述功能的集合与以下中的至少一种相关:京都基因和基因组百科全书(KEGG)K13015代码、KEGG K07501代码、KEGG K00318代码、和KEGG K07482代码。
16.如权利要求10所述的方法,其中生成诊断为溃疡性结肠炎的表征包括基于在处理所述生物样品的聚合集之后确定并源自以下的特征的存在生成所述表征:分类单元的集合,所述分类单元的集合包括:梭菌属(属)、瘤胃球菌属(属)、梭菌科(科)、消化链球菌科(科)、韦荣球菌科(科)、和γ-变形菌纲(纲)。
17.如权利要求9所述的方法,其中生成诊断乳糜泻的表征包括基于在处理所述生物样品的聚合集之后确定的并源自以下的特征的存在生成所述表征:分类单元的集合,所述分类单元的集合包括:梭菌属(属)、颤杆菌克属(属)、梭菌科(科)、消化链球菌科(科)、消化球菌科(科)、和颤螺菌科(科)。
18.如权利要求9所述的方法,其中安排所述疗法包括为所述受试者安排基于噬菌体的疗法,所述基于噬菌体的疗法提供选择性地下调与所述免疫微生物功能异常相关的不期望的分类单元的群体大小的噬菌体组分。
19.如权利要求18所述的方法,其中安排所述疗法包括基于所述疗法模型为所述受试者安排益生菌疗法,所述益生菌疗法提供选择性地支持与所述免疫微生物功能异常的矫正相关的期望的分类单元的群体大小增加的微生物组组分。
20.一种用于诊断和治疗受试者中的免疫微生物功能异常的方法,所述方法包括:
·在处理来自受试者群体的生物样品的聚合集之后,生成所述受试者群体的微生物组组成数据集和微生物组功能多样性数据集,所述微生物组功能多样性数据集指示存在于所述生物样品的聚合集的微生物组组分中的系统功能,
□其中生成所述微生物组功能多样性数据集包括提取与所述微生物组组成数据集中指示的微生物组组分的功能方面的集合相关的候选特征;以及
·关于所述功能方面的集合的子集表征所述免疫微生物功能异常,所述子集源自以下中的至少一种:蛋白特征的直系同源聚类、基因组功能特征、化学功能特征和系统功能特征。
21.如权利要求20所述的方法,其中表征所述免疫微生物功能异常包括基于在处理所述生物样品的聚合集之后确定并源自以下的特征的存在表征克罗恩病:1)分类单元的集合,所述分类单元的集合包括:梭菌属(属)、Flavonifractor(属)、普氏菌属(属)、梭菌科((科)、普氏菌科(科)、颤螺菌科(科)、γ-变形菌纲(纲)和变形菌门(门);2)直系同源聚类(COG)功能的集合,所述直系同源聚类(COG)功能的集合与以下相关:COG D代码、COG I代码和COG J代码;以及3)KEGG特征的集合,所述KEGG特征的集合包括:大亚基核糖体蛋白L20特征;Mg2+-输入ATP酶特征、IV型菌毛组装蛋白PilQ特征和转座酶特征。

说明书全文

用于生物组来源的诊断和治疗的方法及系统

[0001] 相关申请的交叉引用
[0002] 本申请要求2014年10月21日提交的序号为62/066,369的美国临时申请、2014年12月4日提交的序号为62/087,551的美国临时申请、2014年12月17日提交的序号为62/092,999的美国临时申请、2015年4月14日提交的序号为62/147,376的美国临时申请、2015年4月
14日提交的序号为62/147,212的美国临时申请、2015年4月14日提交的序号为62/147,362的美国临时申请、2015年4月13日提交的序号为62/146,855的美国临时申请、和2015年8月
18日提交的序号为62/206,654的美国临时申请的权益,其每一个通过该引用以其整体并入本文。

技术领域

[0003] 本发明总体涉及微生物学领域,且更具体地涉及微生物学领域中的用于微生物组来源(microbiome-derived)的诊断和治疗的新的且有用的方法及系统。
[0004] 背景
[0005] 微生物组是与生物体相关的共栖(commensal)、共生(symbiotic)和病原微生物的生态群。人类微生物组包含比人类细胞多超过10倍的微生物细胞,但由于样品处理技术、遗传分析技术和用于处理大量数据的资源方面的限制,人类微生物组的表征仍处于初期阶段。尽管如此,怀疑微生物组在许多与健康/疾病相关的状态(例如,分娩的准备(preparation for childbirth)、糖尿病、自身免疫性紊乱、胃肠道紊乱、类湿性紊乱、神经性紊乱等)中发挥至少部分的作用。鉴于微生物组在影响受试者健康方面的深远影响,应致于与以下相关的努力:微生物组的表征、从表征生成洞察、以及生成被配置为矫正失调状态的治疗。然而,目前用于分析人类的微生物组并基于获得的洞察提供治疗措施的方法及系统留下了许多未被答复的问题。特别地,由于目前的技术的限制,用于表征某些健康状况的方法和适合于特定受试者的疗法(例如,益生菌疗法)尚不可行。
[0006] 因此,在微生物学领域,对用于以个体化和群体广度的方式表征健康状况的新的且有用的方法及系统存在需求。本发明产生了这样的新的并有用的方法及系统。
[0007] 附图简述
[0008] 图1A是用于生成微生物组来源的诊断和治疗的第一种方法的实施方案的流程图
[0009] 图1B是用于生成微生物组来源的诊断和治疗的第二种方法的实施方案的流程图;
[0010] 图2示出了用于生成微生物组来源的诊断和治疗的方法及系统的实施方案;
[0011] 图3示出了用于生成微生物组来源的诊断和治疗的方法的实施方案的一部分的变化形式;
[0012] 图4示出了用于在用于生成微生物组来源的诊断和治疗的方法及系统的实施方案中生成模型的方法的变化形式;
[0013] 图5示出了在用于表征健康状况的方法的实施方案中基于益生菌的疗法藉以起作用的机制的变化形式;以及
[0014] 图6示出了在用于生成微生物组来源的诊断和治疗的方法的实例中疗法相关的通知提供的实例。
[0015] 实施方式的描述
[0016] 本发明的实施方案的以下描述不意图将本发明限制为这些实施方案,而是意图使本领域的任何技术人员能够制造和使用本发明。
[0017] 1.第一种方法
[0018] 如图1A中示出的,用于诊断和治疗免疫微生物功能异常(immune microbial dysfunction)的第一种方法100包括:接收来自受试者群体的生物样品的聚合集(an aggregate set of biological samples)S110;表征与受试者群体相关的生物样品的聚合集中的每一个的微生物组组成和/或功能特征,从而生成受试者群体的微生物组组成数据集和微生物组功能多样性数据集中的至少一种S120;接收与受试者群体的至少一个子集(at least a subset of the population of subjects)相关的补充数据集,其中补充数据集提供与免疫微生物功能异常相关的特性的信息S130;以及基于补充数据集和从微生物组组成数据集和微生物组功能多样性数据集中的至少一种提取的特征生成免疫微生物功能异常的表征S140。在一些变化形式中,第一种方法100还可以包括:基于表征,生成被配置为矫正免疫微生物功能异常的疗法模型S150。
[0019] 第一种方法100用于生成可用于根据受试者的微生物组组成和功能特征中的至少一种来表征和/或诊断受试者(例如,作为临床诊断、作为伴随诊断(companion diagnostic)等等)的模型,并基于对受试者群体的微生物组分析为受试者提供治疗措施(例如基于益生菌的治疗措施、基于噬菌体的治疗措施、基于小分子的治疗措施、临床措施等等)。因此,来自受试者群体的数据可以用于根据其微生物组组成和/或功能特征表征受试者,基于表征指示健康状态和改善的方面(area),以及安排(promote)可以使受试者的微生物组的组成朝向期望的平衡状态的集合中的一种或更多种调整的一种或更多种疗法。方法100的变化形式还可以例如通过贯穿疗法的过程接收、处理和分析来自受试者的另外的样品来便于监测和/或调整提供给受试者的疗法。在特定实例中,方法100可以用于为罹患免疫微生物功能异常的受试者安排靶向疗法。在特定实例中,方法100可以用于表征和/或治疗性干预以下中的一种或更多种:克罗恩病、炎性肠病(IBD)、肠易激综合征(IBS)、溃疡性结肠炎和乳糜泻(celiac disease)。
[0020] 因此,在一些实施方案中,第一方法100的输出可以用于基于受试者的微生物组组成和/或受试者的微生物组的功能特征的分析来为受试者生成诊断和/或提供治疗措施。因此,如图1B中示出的,源自第一种方法100的至少一种输出的第二种方法200可以包括:接收来自受试者的生物样品S210;基于处理源自生物样品的微生物组数据集,表征受试者具有免疫微生物功能异常的某种形式S220;以及基于表征和疗法模型为患有免疫微生物功能异常的受试者安排疗法S230。下文更详细地描述了第二种方法200的实施方案、变化形式和实例。
[0021] 方法100、200用于生成这样的模型,所述模型可用于基于对个体群体的微生物组分析对个体分类和/或向个体提供治疗措施(例如,疗法建议、疗法、疗法方案等等)。因此,来自个体群体的数据可以用于生成可以根据其微生物组组成对个体分类(例如,作为诊断措施)的模型,基于分类指示健康状况和改善的方面,和/或提供可以将个体微生物组的组成朝向改善的平衡状态的集合中的一种或更多种推进的治疗措施。第二种方法200的变化形式还可以例如通过贯穿疗法的过程接收、处理和分析来自个体的另外的样品来便于监测和/或调整提供给个体的疗法。
[0022] 在一种应用中,方法100、200中的至少一个至少部分地在如图2中示出的系统300实施,该系统300通过样品接收试剂盒的方式接收源自受试者(或与受试者相关的环境)的生物样品,并且在处理系统处理生物样品,所述处理系统实施表征方法和被配置为积极影响受试者(例如,人、非人类动物、环境生态系统等等)中的微生物分布的疗法模型。在该应用的变化形式中,处理系统可以被配置为基于从受试者群体接收的样品数据来生成和/或改进表征方法和治疗模型。然而,方法100可以可选地使用被配置为接收和处理与其他信息聚集的受试者的微生物组相关数据的任何其他合适的系统来实施,以生成用于微生物组来源的诊断及相关治疗的模型。因此,方法100可以针对受试者群体(例如,包括受试者,不包括受试者)来实施,其中受试者群体可以包括与受试者不同和/或类似的患者(例如,在健康状况方面、在膳食需要方面、在人口学特征方面等等)。因此,由于来自受试者群体的数据的聚集,可以使用源自受试者群体的信息来提供对在受试者的行为和对受试者微生物组的影响之间的联系的另外的洞察。
[0023] 因此,方法100、200可以针对受试者群体(例如,包括受试者,不包括受试者)来实施,其中受试者群体可以包括与受试者不同和/或类似的受试者(例如,在健康状况方面、在膳食需要方面、在人口学特征方面等等)。因此,由于来自受试者群体的数据的聚集,可以使用源自受试者群体的信息来提供在受试者的行为和对受试者的微生物组的影响之间的联系的另外的洞察。
[0024] 1.1第一种方法:样品处理
[0025] 模S110叙述:接收来自受试者群体的生物样品的聚合集,其作用是使能够生成可以从其生成用于表征受试者和/或向受试者提供治疗措施的模型的数据。在模块S110中,优选地以非侵入性方式从受试者群体中的受试者接收生物样品。在变化形式中,非侵入性方式的样品接收可以使用以下中的一种或更多种:渗透性基底(例如,被配置为擦拭受试者的身体的区域的拭子、厕纸、海绵等等)、非渗透性基底(例如,载玻片胶带等等)、被配置为从受试者的身体的区域接收样品的容器(例如,小瓶、管、袋等等)以及任何其他合适的样品接收物。在特定实例中,可以以非侵入性方式(例如,使用试子和小瓶)从受试者的鼻、皮肤、生殖器、口和肠中的一个或更多个收集样品。然而,可以另外地或可选地以半侵入性方式或侵入性方式接收生物样品集的一个或更多个生物样品。在变化形式中,样品接收的侵入性方式可以使用以下任何一种或更多种:针、注射器、活组织检查元件、柳叶刀和用于以半侵入性或侵入性方式收集样品的任何其他合适的器具。在特定实例中,样品可以包含血液样品、血浆/血清样品(例如,以使能够提取无细胞DNA)和组织样品。
[0026] 在以上变化形式和实例中,样品可以在无另一个实体(例如,与个人相关的看护者、健康保健专业人员、自动化或半自动化样本收集装置等等)的辅助下从受试者的身体获取,或者可以可选地在另一个实体的协助下从个体的身体获取。在其中在样品抽取过程中在无另一个实体的辅助下从受试者的身体获取样品的一个实例中,可以向受试者提供样品准备试剂盒。在该实例中,试剂盒可以包括用于样本采集的一个或更多个拭子、被配置为接收用于储存的拭子的一个或更多个容器、用于样品准备和使用者账户的设置的说明书,被配置为将样本与受试者相关联的元件(例如,条形码标识物、标签等等)和允许来自个体的样本被递送至样品处理操作(例如,通过邮件递送系统)的接收器(receptacle)。在其中在另一个实体的辅助下从使用者抽取样品的另一个实例中,可以在临床或研究环境中从受试者收集一个或更多个样品(例如,在临床预约期间)。
[0027] 在模块S110中,生物样品的聚合集优选地接收自很多种受试者,并且可以包括来自人类受试者和/或非人类受试者的样品。对于人类受试者,模块S110可以包括接收来自很多种人类受试者的样品,集合地包括以下中的一种或更多种的受试者:不同的人口学特征(例如,性别、年龄、婚姻状况、种族、国籍、社会经济状况、性取向等等)、不同的健康状况(例如,健康和疾病状态)、不同的生活情况(例如,独自生活、与宠物一起生活、与重要他人一起生活、与儿童一起生活等等)、不同的饮食习惯(例如,杂食、素食、纯素食、糖消费(sugar consumption)、酸消费(acid consumption)等等)、不同的行为倾向(例如,身体活动平、药物使用水平、酒精使用水平等等)、不同的活动性(mobility)水平(例如,关于在给定时间段内行进的距离)、生物标志物状态(例如,胆固醇水平,脂质水平等等)、体重、身高、身体质量指数、基因型因子以及对微生物组组成具有影响的任何其他合适的特征。因此,随着受试者人数的增加,关于基于其微生物组表征多种受试者,在方法100的随后模块中生成的基于特征的模型的预测能力增加。另外地或可选地,在模块S110中接收的生物样品的聚合集可以包括接收来自在以下一个或更多个方面相似的目标受试者群的生物样品:人口学特征、健康状况、生活情况、饮食习惯、行为倾向、活动性水平,以及对微生物组组成具有影响的任何其他合适的特征。
[0028] 在一些实施方案中,可以根据如于2015年1月9日提交且标题为“Method and System for Microbiome Analysis”的美国申请第14/593,424号中描述的样品接收的实施方案、变化形式和实例来进行模块S110中的接收生物样品的聚合集,其通过该引用以其整体并入本文。然而,在模块S110中接收生物样品的聚合集可另外地或可选地以任何其他合适的方式来进行。此外,第一种方法100的一些变化形式可以省略模块S110,如下文描述的在方法100的后续模块中进行处理源自生物样品集的数据。
[0029] 1.2第一种方法:样品分析、微生物组组成和功能方面
[0030] 模块S120叙述:表征与受试者群体相关的生物样品的聚合集中的每一个的微生物组组成和/或功能特征,由此生成受试者群体的微生物组组成数据集和微生物组功能多样性数据集中的至少一种。模块S120用于处理生物样品的聚合集中的每一个,以确定与受试者群体中的每一个的微生物组相关的组成和/或功能方面。组成和功能方面可以包括在微生物水平的组成方面,包括与微生物跨越界、、纲、目、科、属、种、亚种、菌株、种下分类单元(infraspecies taxon)(例如,如以每个群的总丰度、每个群的相对丰度、代表的群的总数等等测量的)和/或任何其他合适的分类单元的不同群的分布相关的参数。组成和功能方面也可以根据可操作分类单位(OTU)呈现。组成和功能方面可以另外地或可选地包括在遗传水平的组成方面(例如,通过多位点序列分型确定的区域、16S序列、18S序列、ITS序列、其他遗传标志物、其他系统发育标志物等等)。组成和功能方面可以包括与特定功能(例如,酶活性、转运功能、免疫活性等等)相关的基因的存在或不存在或量。因此,模块S120的输出可以用于提供感兴趣的特征用于模块S140的表征过程,其中该特征可以是基于微生物的(例如,细菌属的存在)、基于遗传的(例如,基于特异性遗传区域和/或序列的呈现)和/或基于功能的(例如,特定催化活性的存在、代谢途径的存在等等)。
[0031] 在一种变化形式中,模块1S120可以包括基于源自细菌和/或古细菌的与基因家族相关的系统发育标志物的鉴定而表征特征,所述基因家族与以下的一种或更多种相关:核糖体蛋白S2、核糖体蛋白S3、核糖体蛋白S5、核糖体蛋白S7、核糖体蛋白S8、核糖体蛋白S9、核糖体蛋白S10、核糖体蛋白S11、核糖体蛋白S12/S23、核糖体蛋白S13、核糖体蛋白S15P/S13e、核糖体蛋白S17、核糖体蛋白S19、核糖体蛋白L1、核糖体蛋白L2、核糖体蛋白L3、核糖体蛋白L4/L1e、核糖体蛋白L5、核糖体蛋白L6、核糖体蛋白L10、糖体蛋白L11、糖体蛋白L13、糖体蛋白L14b/L23e、核糖体蛋白L15、糖体蛋白L16/L10E、核糖体蛋白L18P/L5E、核糖体蛋白L22、核糖体蛋白L24、核糖体蛋白L25/L23、核糖体蛋白L29、翻译延伸因子EF-2、翻译起始因子IF-2、金属内肽酶(metalloendopeptidase)、ffh信号识别颗粒蛋白、苯丙酰-tRNA合成酶α亚基、苯丙氨酰-tRNA合成酶β亚基、tRNA假尿苷合成酶B、胆色素原脱氨酶、磷酸核糖甲酰甘氨脒环状连接酶(phosphoribosylformylglycinamidine cyclo-ligase)和核糖核酸酶HII。然而,标志物可以包括任何其他合适的标志物。
[0032] 因此,在模块S120中表征生物样品的聚合集中的每一个的微生物组组成和/或功能特征优选地包括样品处理技术(例如,湿实验室技术(wet laboratory techniques))和计算技术(例如,利用生物信息学工具)的组合,以定量地和/或定性地表征与来自受试者或受试者群体的每个生物样品相关的微生物组和功能特征。
[0033] 在变化形式中,模块S120中的样品处理可以包括以下中的任何一种或更多种:裂解生物样品、破坏生物样品的细胞中的膜、将不期望的成分(例如,RNA、蛋白)与生物样品分离、纯化生物样品中的核酸(例如,DNA)、扩增来自生物样品的核酸、进一步纯化生物样品的扩增的核酸以及测序生物样品的扩增的核酸。因此,可以使用如于2015年1月9日提交且标题为“Method and System for Microbiome Analysis”的美国申请第14/593,424号中描述的样品处理网络和/或计算系统的实施方案、变化形式和实例来实施模块S120的部分,其通过该引用以其整体并入本文。因此,实施方法100的一个或更多个部分的计算系统可以在一个或更多个计算系统中实施,其中计算系统可以至少部分地在中和/或作为被配置为接收存储计算机可读指令的计算机可读介质的机器(例如,计算机器、服务器、移动计算设备等)被实施。然而,可以使用任何其他合适的系统来进行模块S120。
[0034] 在变化形式中,裂解生物样品和/或破坏生物样品的细胞中的膜优选地包括物理方法(例如,珠击打、氮减压、均质化、超声处理),其省略了在测序后在某些细菌群的呈现方面产生偏倚的某些试剂。另外地或可选地,模块S120中的裂解或破坏可以包括化学方法(例如,使用去垢剂、使用溶剂、使用表面活性剂等等)。另外地或可选地,模块S120中的裂解或破坏可以包括生物学方法。在变化形式中,不期望的成分的分离可以包括使用RNA酶除去RNA和/或使用蛋白酶除去蛋白。在变化形式中,核酸的纯化可以包括以下中的一种或更多种:沉淀来自生物样品的核酸(例如,使用基于醇的沉淀方法)、基于液体-液体的纯化技术(例如,苯酚-氯仿提取)、基于层析的纯化技术(例如,柱吸附)、包括利用结合被配置为结合核酸并被配置为在洗脱环境(例如,具有洗脱溶液、提供pH改变、提供温度改变等等)的存在下释放核酸的部分结合颗粒(例如,磁珠、浮珠(buoyant beads)、具有粒度分布的珠、超声响应的珠等等)的纯化技术、以及任何其他合适的纯化技术。
[0035] 在变化形式中,对纯化的核酸进行扩增操作S123可以包括进行以下中的一种或更多种:基于聚合酶链式反应(PCR)的技术(例如,固相PCR、RT-PCR、qPCR、多重PCR、降落PCR(touchdown PCR)、纳米PCR(nanoPCR)、巢式PCR、热启动PCR等等)、依赖解旋酶的扩增(HDA)、环介导的等温扩增(LAMP)、自我持续序列复制(3SR)、基于核酸序列的扩增(NASBA)、链置换扩增(SDA)、滚环扩增(RCA)、连接酶链式反应(LCR)和任何其他合适的扩增技术。在纯化的核酸的扩增中,使用的引物优选地被选择以防止扩增偏倚或使扩增偏倚最小化,并且被配置为扩增核酸区域/序列(例如,16S区域、18S区域、ITS区域等等的),所述核酸区域/序列提供分类学信息、提供系统发育信息、提供用于诊断的信息、提供用于制剂(例如,用于益生菌制剂)的信息和/或提供用于任何其他合适的目的的信息。因此,在扩增中可以使用被配置为避免扩增偏倚的通用引物(例如,用于16S RNA的F27-R338引物组、用于16S RNA的F515-R806引物组等等)。在模块S110的变化形式中使用的引物可以另外地或可选地包括对每个生物样品特异的掺入的条形码序列,所述条形码序列可以有利于扩增后的生物样品的鉴定。在模块S110的变化形式中使用的引物可以另外地或可选地包括被配置为与包括互补衔接子的测序技术(例如,根据用于Illumina测序的方案)配合的衔接子区域。
[0036] 用于多重扩增操作的引物组的鉴定可以根据于2015年8月18日提交且标题为“Method and System for Multiplex Primer Design”的美国专利申请第62/206,654号中描述的方法的实施方案、变化形式和实例来进行,其通过该引用以其整体并入本文。在模块S123中使用引物组(a set of primers)进行多重扩增操作可另外地或可选地以任何其他合适的方式来进行。
[0037] 另外地或可选地,如图3中示出的,针对与扩增操作S123配合(例如,S122可以在S123之后进行、S122可以在S123之前进行、S122可以与S123基本上同时进行等等)的片段化操作S122(例如,片段化并用测序衔接子加标签)的表现,模块S120可以实施被配置以利于处理的任何其他步骤(例如,使用Nextera试剂盒)。另外,模块S122和/或S123可以在存在或不存在核酸提取步骤下进行。例如,可以在扩增核酸之前进行提取,随后进行片段化,且然后扩增片段。可选地,可以进行提取,随后进行片段化,且然后扩增片段。如此,在一些实施方案中,进行模块S123中的扩增操作可以根据如于2015年1月9日提交并且标题为“Method and System for Microbiome Analysis”的美国申请第14/593,424号中描述的扩增的实施方案、变化形式和实例来进行。此外,模块S123中的扩增可以另外地或可选地以任何其他合适的方式来进行。
[0038] 在特定实例中,来自生物样品集的生物样品的核酸的扩增和测序包括:固相PCR,所述固相PCR包括用寡核苷酸衔接子桥式扩增基底上的生物样品的DNA片段,其中扩增包括具有正向索引序列(例如,相应于MiSeq/NextSeq/HiSeq平台的Illumina正向索引)或反向索引序列(例如,相应于MiSeq/NextSeq/HiSeq平台的Illumina反向索引)的引物、正向条形码序列或反向条形码序列、转座酶序列(例如,相应于MiSeq/NextSeq/HiSeq平台的转座酶结合位点)、接头(例如,被配置以降低均一性并改善序列结果的0个、1个或2个基的片段)、另外的随机碱基和用于靶向特定靶标区域(例如,16S区域、18S区域、ITS区域)的序列。如遍及公开内容表明的,可进一步对任何合适的扩增子进行扩增和测序。在特定实例中,测序包括使用合成测序技术的Illumina测序(例如,用HiSeq平台、用MiSeq平台、用NextSeq平台等等)。
[0039] 模块S120中的样品处理的一些变化形式可以包括在测序之前进一步纯化扩增的核酸(例如,PCR产物),其用于除去过量的扩增成分(例如,引物、dNTP、酶、盐等等)。在实例中,可以使用以下中的任一种或更多种来利于另外的纯化:纯化试剂盒、缓冲液、醇类、pH指示剂、离液盐、核酸结合过滤器、离心和任何其他合适的纯化技术。
[0040] 在变化形式中,模块S120中的计算处理可以包括以下中的任一种或更多种:进行包括微生物组来源的序列(例如,与受试者序列和污染物相对)的鉴定的序列分析操作S124、进行微生物组来源的序列的比对和/或映射操作S125(例如,使用单端比对(single-ended alignment)、无空位比对(ungapped alignment)、空位比对(gapped alignment)、配对种的一种或更多种比对片段化的序列)以及生成源自与生物样品相关的微生物组的组成和/或功能方面的特征S126。
[0041] 以鉴定微生物组来源的序列进行测序分析操作S124可以包括将来自样品处理的序列数据映射到受试者参考基因组(例如,由Genome Reference Consortium提供的),以除去受试者基因组来源的序列。然后,在将序列数据映射到受试者参考基因组之后剩余的未被鉴定的序列,可以利用比对算法(例如,基本局部比对搜索工具(Basic Local Alignment Search Tool)、FPGA加速比对工具、具有BWA的BWT索引、具有SOAP的BWT索引、具有Bowtie的BWT索引等等),而进一步基于序列相似性和/或基于参考的方法(例如,使用VAMPS、使用MG-RAST、使用QIIME数据库)聚类成操作分类单位(OTU)、比对(例如,使用基因组散列方法(genome hashing approach)、使用Needleman-Wunsch算法、使用Smith-Waterman算法)、并映射到参考细菌基因组(例如,由国家生物技术信息中心(National Center for Biotechnology Information)提供的)。未被鉴定的序列的映射可以另外地或可选地包括映射到参考古细菌基因组、病毒基因组和/或真核基因组。此外,可以相对于现有数据库和/或相对于定制生成的数据库进行分类单元的映射。
[0042] 另外地或可选地,关于生成微生物组功能多样性数据集,模块S120可以包括提取与生物样品的聚合集中如微生物组组成数据集中指示的一种或更多种微生物组组分的功能方面相关的候选特征S127。提取候选功能特征可以包括鉴定与以下中的一种或更多种相关的功能特征:原核直系同源蛋白聚类(COG);真核直系同源蛋白聚类(KOG);任何其他合适类型的基因产物;RNA加工和修饰功能分类;染色质结构和动力学功能分类;能量生成和转化功能分类;细胞周期控制和有丝分裂功能分类;氨基酸代谢和转运功能分类;核苷酸代谢和转运功能分类;水化合物代谢和转运功能分类;辅酶代谢功能分类;脂质代谢功能分类;翻译功能分类;转录功能分类;复制和修复功能分类;细胞壁/膜/包膜生物发生功能分类;细胞运动功能分类;翻译后修饰、蛋白周转和伴侣功能功能分类;无机离子转运和代谢功能分类;次生代谢物生物合成、转运和分解代谢功能分类;信号转导功能分类;细胞内运输和分泌功能分类;核结构功能分类;细胞骨架功能分类;仅一般功能预测的功能分类;和功能未知的功能分类;和任何其他合适的功能分类。
[0043] 另外地或可选地,模块S127中的提取候选功能特征可以包括鉴定与以下中的一种或更多种相关的功能特征:系统信息(例如,细胞和生物体功能的途径图谱、基因的模块或功能单元、生物实体的分级分类);基因组信息(例如,全基因组、全基因组中的基因和蛋白、全基因组中的直系同源基因群);化学信息(例如,化学化合物和聚糖、化学反应、酶命名法);健康信息(例如,人类疾病、批准的药物、天然药物(crude drug)和健康相关物质);代谢途径图谱;遗传信息加工(例如,转录、翻译、复制和修复等等)途径图谱;环境信息处理(例如,膜转运、信号转导等等)途径图谱;细胞过程(例如,细胞生长、细胞死亡、细胞膜功能等等)途径图谱;生物体系统(例如,免疫系统、内分泌系统、神经系统等等)途径图谱;人类疾病途径图谱;药物开发途径图谱;和任何其他合适的途径图谱。
[0044] 在提取候选功能特征中,模块S127可以包括进行搜索一个或更多个数据库,诸如京都基因和基因组百科全书(the Kyoto Encyclopedia of Genes and Genomes,KEGG)和/或由国家生物技术信息中心(National Center for Biotechnology Information,NCBI)管理的直系同源聚类(Clusters of Orthologous Groups,COG)数据库。可以基于从生物样品的聚合集中的一个或更多个生成微生物组组成数据集的结果来进行搜索。另外地或可选地可以根据任何其他合适的过滤器进行搜索。在特定实例中,模块S127可以包括基于微生物组组成数据集从KEGG数据库资源和COG数据库资源提取候选功能特征;然而,模块S127可以包括以任何其他合适的方式提取候选功能特征。
[0045] 在鉴定与生物样品相关的微生物组的代表性微生物群和/或鉴定候选功能方面(例如,与生物样品的微生物组组分相关的功能)之后,可以进行生成源自与生物样品的聚合集相关的微生物组的组成方面和/或功能方面的特征。
[0046] 在一种变化形式中,生成特征可以包括生成源自多位点序列分型(MLST)的特征,其可以在与方法100、200的实施相关的任何阶段实验性地进行,以鉴定用于在方法100的后续模块中表征的标志物。另外地或可选地,生成特征可以包括生成描述微生物的某些分类群的存在或不存在和/或呈现的微生物的分类群之间的比率的特征。另外地或可选地,生成特征可以包括生成描述以下中的一种或更多种的特征:呈现的分类群的数量、呈现的分类群的网络、不同分类群的呈现的相关性、不同分类群之间的相互作用、由不同分类群产生的产物、由不同分类群产生的产物之间的相互作用、死亡和生活的微生物之间的比率(例如,对于呈现的不同的分类群,基于RNA的分析)、系统发育距离(例如,在Kantorovich-Rubinstein距离、Wasserstein距离等等方面)、任何其他合适的分类群相关特征、任何其他合适的遗传或功能特征。
[0047] 另外地或可选地,生成特征可以包括例如使用sparCC方法、使用基因组相对丰度和平均大小(Genome Relative Abundance and Average size,GAAS)方法和/或使用利用混合模型理论的基因组相对丰度(Genome Relative Abundance using Mixture Model theory,GRAMMy)方法生成描述不同微生物群的相对丰度的特征,所述利用混合模型理论的基因组相对丰度方法使用序列相似性数据来进行一个或更多个微生物群的相对丰度的最大似然估计。另外地或可选地,生成特征可以包括生成如源自丰度度量的分类学变化的统计测量。另外地或可选地,生成特征可以包括生成源自相对丰度因素(例如,关于分类单元的丰度的变化,其影响其他分类单元的丰度)的特征。另外地或可选地,生成特征可以包括生成描述单独的和/或组合的一个或更多个分类群的存在的定性特征。另外地或可选地,生成特征可以包括生成与遗传标志物(例如,代表性16S、18S和/或ITS序列)相关的特征,所述遗传标志物表征与生物样品相关的微生物组的微生物。另外地或可选地,生成特征可以包括生成与特定基因和/或具有该特定基因的生物体的功能关联相关的特征。另外地或可选地,生成特征可以包括生成与分类单元和/或归属于分类单元的产物的致病性相关的特征。然而,模块S120可以包括生成源自生物样品的核酸的测序和映射的任何其他合适的特征。
例如,特征可以是组合的(例如,包括成对的(pairs)、三个一组(triplets))、相关联的(例如,关于不同特征之间的相关性)和/或关于特征的变化(即,时间变化、跨样品部位的变化等等,空间变化等等)。然而,在模块S120中可以以任何其他合适的方式生成特征。
[0048] 1.3第一种方法:补充数据
[0049] 模块S130叙述:接收与受试者群体的至少一个子集相关的补充数据集,其中补充数据集提供与免疫微生物功能异常相关的特性的信息。模块S130用于获得与受试者的集合中的一个或更多个受试者相关的另外的数据,所述另外的数据可以用于训练和/或验证在模块S140中进行的表征过程。在模块S130中,补充数据集优选地包括调查来源的数据,但是可以另外地或可选地包括以下中的一种或更多种:源自传感器的上下文数据(contextual data)、医学数据(例如,当前和历史医学数据)以及任何其他合适类型的数据。在包括接收调查来源的数据的模块S130的变化形式中,调查来源的数据优选地提供与受试者相关的生理学信息、人口学信息和行为信息。生理学信息可以包括与生理学特征(例如,高度、体重、身体质量指数、身体脂肪百分比、身体毛发水平等等)相关的信息。人口学信息可以包括与人口学特征(例如,性别、年龄、种族、婚姻状况、同胞数、社会经济状况,性取向等等)相关的信息。行为信息可以包括与以下中的一种或更多种相关的信息:健康状况(例如,健康和疾病状态)、生活状况(例如,独自生活、与宠物一起生活、与重要他人一起生活、与儿童一起生活等等)、饮食习惯(例如,杂食、素食、纯素食、糖消费、酸消费等等)、行为倾向(例如,身体活动水平、药物使用水平、酒精使用水平等等)、不同的活动性水平(例如,关于在给定时间段内行进的距离)、不同的性活动水平(例如,关于伴侣数和性取向)以及任何其他合适的行为信息。调查来源的数据可以包括定量数据和/或可以被转化为定量数据的定性数据(例如,使用严重度等级、将定性反应映射到定量评分等等)。
[0050] 在有利于接收调查来源的数据方面,模块S130可以包括向受试者群体的受试者或向与受试者群体的受试者相关的实体提供一种或更多种调查。可以亲自(例如,与来自受试者的样品提供和接收协调)、电子地(例如,在受试者设置帐户期间、在受试者的电子设备执行的应用处、在通过互联网连接可进入的网络应用处等等)、和/或以任何其他合适的方式提供调查。
[0051] 另外地或可选地,在模块S130中接收的补充数据集的部分可以源自与受试者相关联的传感器(例如,可佩戴计算设备的传感器、移动设备的传感器、与使用者相关联的生物计量传感器等等)。因此,模块S130可以包括接收以下中的一种或更多种:身体活动(physical activity)相关数据或身体动作(physical action)相关数据(例如,来自受试者的移动设备或可佩戴电子设备的加速计和陀螺仪数据)、环境数据(例如,温度数据、高程数据(elevation data)、气候数据、光参数数据等等)、患者营养或饮食相关数据(例如,来自食品机构记录(food establishment check-ins)的数据、来自分光光度分析的数据等等)、生物计量数据(例如,通过患者的移动计算设备内的传感器记录的数据、通过与患者的移动计算设备通信的可佩戴或其他外围设备记录的数据)、位置数据(例如,使用GPS元件)以及任何其他合适的数据。另外地或可选地,补充数据集的部分可以源自受试者的医学记录数据和/或临床数据。因此,补充数据集的部分可以源自一个或多个受试者的一个或更多个电子健康记录(EHR)。
[0052] 另外地或可选地,模块S130的补充数据集可以包括任何其他合适的诊断信息(例如,临床诊断信息),其可以与源自特征的分析结合以支持方法100的后续模块中的受试者的表征。例如,源自结肠镜检查、活组织检查、血液测试、诊断成像、调查相关信息和任何其他合适的测试的信息可以用于补充模块S130。
[0053] 1.4第一种方法:免疫微生物功能异常的表征
[0054] 模块S140叙述:基于补充数据集和从微生物组组成数据集和微生物组功能多样性数据集中的至少一种提取的特征生成免疫微生物功能异常的表征。模块S140用于进行表征过程,所述表征过程用于鉴定可以用于基于受试者的微生物组组成和/或功能特征表征受试者或具有免疫微生物功能异常的群体的特征和/或特征组合。另外地或可选地,表征过程可以被用作诊断工具,所述诊断工具可以基于受试者的微生物组组成和/或功能特征,相对于其他健康状况状态、行为特征、医学状况、人口学特征和/或任何其他合适的特性,表征受试者(例如,在行为特征方面、在医学状况方面、在人口学特性方面等等)。然后此类表征可以通过模块S150的疗法模型用于建议或提供个性化疗法。
[0055] 在进行表征过程中,模块S140可以使用计算方法(例如,统计学方法、机器学习方法、人工智能方法、生物信息学方法等等)来将受试者表征为表现出具有免疫微生物功能异常的受试者群特有的特征。
[0056] 在一种变化形式中,表征可以基于源自在第一组受试者和第二组受试者之间的相似性和/或差异的统计分析(例如,概率分布的分析)的特征,所述第一组受试者表现出与免疫微生物功能异常相关的靶标状态(例如,健康状况状态),所述第二组受试者未表现出与免疫微生物功能异常相关的靶标状态(例如,“正常”状态)。在实施该变化形式时,可以使用Kolmogorov-Smirnov(KS)检验、置换检验(permutation test)、Cramér-von Mises检验和任何其他统计检验(例如,t检验、Welch t检验、z检验、卡方检验、与分布相关的检验等等)中的一种或更多种。特别地,一种或更多种此类统计假设检验可以用于评价在表现出与免疫微生物功能异常相关的靶标状态(即,不利状态)的第一组受试者和未表现出与免疫微生物功能异常相关的靶标状态(即,具有正常状态)的第二组受试者中具有变化的丰度程度的特征的集合。更详细地,可以基于丰度百分比和/或从属于与第一组受试者和第二组受试者相关的多样性的任何其他合适的参数来约束所评价的特征的集合,以提高或降低表征的置信度。在该实例的具体实施中,特征可以源自在特定百分比的第一组的受试者和第二组的受试者中丰富的微生物的分类单元和/或功能特征的存在,其中分类单元在第一组受试者和第二组受试者之间的相对丰度可以从具有显著性的指示(例如,在p-值方面)的KS检验或Welch t-检验来确定。因此,模块S140的输出可以包括具有显著性的指示(例如,p-值为0.0013)的归一化相对丰度值(例如,患病受试者中的分类单元来源的特征和/或功能特征的丰度比在健康患者中的大25%)。特征生成的变化形式可以另外地或可选地实施或源自功能特征或元数据特征(例如,非细菌标志物)。
[0057] 在进行表征过程中,模块S140可以另外地或可选地将来自微生物组组成数据集和微生物组功能多样性数据集中的至少一种的输入数据转换为可以在预测受试者群体的表征中测试功效的特征向量。来自补充数据集的数据可以用于报告免疫微生物功能异常的表征,其中用候选特征和候选分类的训练数据集训练表征过程以鉴定在准确预测分类方面具有高程度(或低程度)的预测能力的特征和/或特征组合。因此,用训练数据集改进(refinement)表征方法鉴定出与免疫微生物功能异常的存在具有高度相关性的特征集(例如,受试者特征的、特征的组合的)。
[0058] 在变化形式中,在预测表征过程的分类中有效的特征向量可以包括与以下中的一种或更多种相关的特征:微生物组多样性度量(例如,关于跨分类群的分布、关于跨古细菌、细菌、病毒和/或真核生物群的分布)、分类群在个体的微生物组中的存在、特定基因序列(例如,16S序列)在个体的微生物组中的呈现、分类群在个体的微生物组中的相对丰度、微生物组恢复力度量(例如,响应于从补充数据集确定的扰动)、编码具有给定功能的蛋白或RNA(酶、转运蛋白、来自免疫系统的蛋白、激素、干扰RNA等等)的基因的丰度以及微生物组来源多样性数据集和/或补充数据集的任何其他合适的特征。另外地,可以将特征的组合用于特征向量,其中在提供组合的特征作为特征集的一部分中,特征可以被分组和/或加权。例如,一个特征或特征集可以包括呈现的细菌类别在个体的微生物组中的数目、特定的细菌属在个体的微生物组中的存在、特定的16S序列在个体的微生物组中的呈现、以及第一细菌门相对于第二细菌门的相对丰度的加权的组合特征(weighted composite)。然而,特征向量可以另外地或可选地以任何其它合适的方式确定。
[0059] 如图4中示出的,在模块S140的一个此类可选的变化形式中,可以根据随机森林预测器(random forest predictor,RFP)算法来生成和训练表征过程,所述随机森林预测器(RFP)算法结合bagging(即,靴襻法聚集)和选择来自训练数据集的随机特征集,以构建与随机特征集相关的决策树集T。在使用随机森林算法中,来自决策树集的N个样本以替换随机取样,以创建决策树的子集,并且对于每个节点,从用于评价所有预测特征选择m个预测特征。在节点处提供最佳分裂的预测特征(例如,根据目标函数)用于进行分裂(例如,作为节点处的二叉树(bifurcation)、作为节点处的三叉树(trifurcation))。通过从大数据集多次取样,表征过程在鉴定在预测分类方面强的特征的强度可以实质性地增大。在该变化形式中,在处理期间可以包括防止偏倚(例如取样偏倚)和/或解释偏倚量的措施,以提高模型的稳健性。
[0060] 1.4.1克罗恩病表征
[0061] 在一种实施方式中,模块S140的基于统计分析的表征过程可以基于用源自受试者群体的子集的验证数据集训练并验证的算法,来鉴定与克罗恩病具有最高相关性的特征集,对于所述克罗恩病一种或更多种疗法将具有积极效果。特别地,该第一变化形式中的克罗恩病是通常基于以下中的一种或更多种诊断的胃肠道紊乱:基于结肠镜检查的方法、基于内窥镜检查的方法(例如,胶囊内窥镜检查)和计算机断层扫描(CT)以观察多核巨细胞。在第一种变化形式中,对于诊断有用的与克罗恩病相关的特征集包括源自以下分类单元中的一种或更多种的特征:梭菌属(Clostridium)(属)、Flavonifractor(属)、普氏菌属(Prevotella)(属)、梭菌科(Clostridiaceae)(科)、普氏菌科(Prevotellaceae)(科)、颤螺菌科(Oscillospiraceae)(科)、γ-变形菌纲(Gammaproteobacteria)(纲)和变形菌门(Proteobacteria)(门)。另外地或可选地,特征集可以源自以下分类单元中的一种或更多种:Eggerthella(属)、Akkermansia(属)、Anaerosporobacter(属)、丹毒丝菌属(Erysipelothrix)(属)、军团菌属(Legionella)(属)、Parabacteroides(属)、Odoribacter(属)、Barnesiella(属)、放线杆菌属(Actinobacillus)(属)、梭菌属(Clostridium)(属)、嗜血杆菌属(Haemophilus)(属)、韦荣球菌属(Veillonella)(属)、拟杆菌属(Bacteroides)(属)、巨球型菌属(Megasphaera)(属)、Marvinbryantia(属)、Butyricicoccus(属)、嗜胆菌属(Bilophila)(属)、颤杆菌克属(Oscillibacter)(属)、Butyricimonas(属)、瘤胃球菌属(Ruminococcus)(属)、八叠球菌属(Sarcina)(属)、乳酸杆菌属(Lactobacillus)(属)、链球菌属(Streptococcus)(属)、果胶杆菌属(Pectobacterium)(属)、粪球菌属(Coprococcus)(属)、真杆菌属(Eubacterium)(属)、柯林斯菌属(Collinsella)(属)、Faecalibacterium(属)、Subdoligranulum(属)、和克罗诺杆菌属(Cronobacter)(属)。
[0062] 另外地或可选地,与克罗恩病相关的特征集可以源自以下中的一种或更多种:COG(D)代码(例如,细胞周期控制、细胞分裂和染色体分配功能特征);COG(I)代码(例如,脂质转运和代谢功能特征);COG(J)代码(例如,翻译、核糖体结构和生物发生功能特征);细胞生长和死亡KEGG途径来源的特征;内分泌系统KEGG途径来源的特征;折叠、分选和降解KEGG途径来源的特征;代谢KEGG途径来源的特征;萜类化合物和聚化合物的代谢KEGG途径来源的特征;复制和修复KEGG途径来源的特征;翻译KEGG途径来源的特征;氨基酸相关酶KEGG途径来源的特征;氨酰-tRNA生物合成KEGG途径来源的特征;同源重组KEGG途径来源的特征;核苷酸切除修复KEGG途径来源的特征;PPAR信号传导途径KEGG途径来源的特征;肽聚糖生物合成KEGG途径来源的特征;朊病毒疾病KEGG途径来源的特征;核糖体KEGG途径来源的特征;翻译因子KEGG途径来源的特征;大亚基核糖体蛋白L20 KEGG来源的特征(例如,与RP-L20、MRPL20和/或rpIT相关的K02887 KEGG代码);Mg2+输入ATP酶(Mg2+-importing ATPase)[EC:2.6.3.2]KEGG来源的特征(例如,与mgtA和/或mgtB相关的K01531 KEGG代码);肽基-tRNA水解酶PTH1家族[EC:3.1.1.29]KEGG来源的特征(例如,与PTH1、pth和/或spoVC相关的K01056 KEGG代码);大亚基核糖体蛋白L13 KEGG来源的特征(例如,与RP-L13、MRPL13和/或rpIM相关的K02871 KEGG代码);IV型菌毛组装蛋白PilQ KEGG来源的特征(例如,与pilQ相关的K02666 KEGG代码,其中菌毛允许细菌细胞附着至肠壁);超化物歧化酶,Cu-Zn家族[EC:1.15.1.1]KEGG来源的特征(例如,与SOD1相关的K04565 KEGG代码);转座酶KEGG来源的特征(例如,与催化转座元件的复制型转座的转座酶相关的K07487 KEGG代码);和转座酶IS30家族KEGG来源的特征(例如,与催化转座元件的复制型转座的转座酶相关的K07482 KEGG代码)。因此,受试者的表征包括基于以经典诊断方法的替代或补充的方式检测以上特征中的一种或更多种而将受试者表征为患有克罗恩病的受试者。然而,在特定实例的变化形式中,特征集可以包括对诊断有用的任何其他合适的特征。
[0063] 1.4.2 IBS表征
[0064] 在另一种实施方式中,模块S140的基于统计分析的表征过程可以基于用源自受试者群体的子集的验证数据集训练并验证的算法,来鉴定与肠易激综合征(IBS)具有最高相关性的特征集,对于所述肠易激综合征(IBS)一种或更多种疗法将具有积极效果。特别地,该第一种变化形式中的IBS是以慢性腹部疼痛、不适、膨胀和肠排便习惯的改变为特征的胃肠道紊乱,如通常通过结肠镜检查并排除其他胃肠道疾病(例如,乳糜泻)来评价的。在第一种变化形式中,对于诊断有用的与IBD相关的特征集包括源自以下分类单元中的一种或更多种的特征:Flavonifractor(属)、Odoribacter(属)、Blautia(属)、和Finegoldia(属)。另外地或可选地,特征集可以源自以下分类单元中的一种或更多种:Flavonifractor plautii(种)、霍曼氏菌属(Holdemania)(属)、拟杆菌属(属)、拟杆菌科(Bacteroidaceae)(科)、Alistipes(属)、理研菌科(Rikenellaceae)(科)、细菌NLAE-zl-P827(种)、δ-变形菌纲(Deltaproteobacteria)(纲)、嗜胆菌属(Bilophila)(属)、巴斯德氏菌科(Pasteurellaceae)(科)、巴斯德氏菌目(Pasteurellales)(目)、γ-变形菌纲(纲)、沃氏嗜胆菌(Bilophila wadsworthia)(种)、梭菌目(Clostridiales)(目)、梭菌纲(Clostridia)(纲)、Odoribacter(属)、Clostridium lavalense(种)、Odoribacter splanchnicus(种)、红蝽菌科(Coriobacteriaceae)(科)、红螺菌目(Rhodospirillales)(目)、生物体宏基因组(未分类)、Anaerostipes(属)、放线菌纲(Actinobacteria)(纲)、普氏菌科(科)、红螺菌科(Rhodospirillaceae)(科)、细菌NLAE-zl-H54(种)、放线菌亚纲的种(Actinobacteridae spp.)(未分类)、罗氏菌属的种11SE38(Roseburia sp.11SE38)(种)、双歧杆菌科(Bifidobacteriaceae)(科)、双歧杆菌目(Bifidobacteriales)(目)、双歧杆菌属(Bifidobacterium)(属)、产丁酸盐细菌SR1/1(butyrate-producing bacterium SR1/1)(种)、大芬戈尔德菌(Finegoldia  magna)(种)、Finegoldia(属)、和嗜胨菌属(Peptoniphilus)(属)。
[0065] 另外地或可选地,与IBS相关的特征集可以源自以下中的一种或更多种:pcoC KEGG来源的特征(例如,K07156 KEGG代码);羧酸酯/酯-胺(carboxylate-amine)连接酶[EC:6.3.-.-]KEGG来源的特征(例如,与ybdK相关的K06048 KEGG代码);和异柠檬酸裂合酶[EC:4.1.3.1]KEGG来源的特征(例如,与aceA相关的K01637 KEGG代码)。因此,受试者的表征包括基于以经典诊断方法的替代或补充的方式检测一种或更多种以上特征,将受试者表征为患有IBS的受试者。然而,在特定实例的变化形式中,特征集可以包括对诊断有用的任何其他合适的特征。
[0066] 1.4.3 IBD表征
[0067] 在另一种实施方式中,模块S140的基于统计分析的表征过程可以基于用源自受试者群体的子集的验证数据集训练并验证的算法,来鉴定与炎性肠病(IBD)具有最高相关性的特征集,对于所述炎性肠病(IBD)一种或更多种疗法将具有积极效果。特别地,该第一种变化形式中的IBD是通过基于结肠镜检查的活组织检查和/或粪便防卫蛋白来表征的胃肠道紊乱。在第一种变化形式中,对诊断有用的与IBD相关的特征集包括源自以下分类单元中的一种或更多种的特征:梭菌属(属)、瘤胃球菌属(属)、梭菌科(科)、韦荣球菌科(科)、Selenomonadales(目)、γ-变形菌纲(纲)、Negativicutes(纲)、和变形菌门(门)。另外地或可选地,特征集可以源自以下分类单元中的一种或更多种:细菌NLAE-zl-P562(种)、Actinobacillus porcinus(种)、巨球型菌属(属)、放线杆菌属(属)、Flavonifractor plautii(种)、巴斯德氏菌科(科)、巴斯德氏菌目(目)、γ-变形菌纲(纲)、肠杆菌目(Enterobacteriales)(目)、肠杆菌科(Enterobacteriaceae)(科)、韦荣球菌科(科)、脆弱拟杆菌(Bacteroides fragilis)(种)、乳杆菌目(Lactobacillales)(目)、变形菌门(门)、Selenomonadales(目)、Negativicutes(纲)、链球菌科(Streptococcaceae)(科)、芽孢杆菌纲(Bacilli)(纲)、克罗诺菌属(属)、Cronobacter sakazakii(种)、链球菌属(属)、伯克氏菌目(Burkholderiales)(目)、β-变形菌纲(Betaproteobacteria)(纲)、Sutterellaceae(科)、丹毒丝菌科(Erysipelotrichaceae)(科)、丹毒丝菌纲(Erysipelotrichia)(纲)、丹毒丝菌目(Erysipelotrichales)(目)、未培养的红蝽菌纲(Coriobacteriia)细菌(种)、红蝽菌目(Coriobacteriales)(目)、红蝽菌科(科)、柯林斯菌属(属)、霍曼氏菌属(属)、罗氏菌属(Roseburia)(属)、瘤胃球菌科(Ruminococcaceae)(科)、δ-变形菌纲(纲)、假丁酸弧菌属(Pseudobutyrivibrio)(属)、δ/ε亚门(delta/epsilon subdivisions)(亚门)、脱硫弧菌目(Desulfovibrionales)(目)、克里斯滕森菌科(Christensenellaceae)(科)、紫单胞菌科(Porphyromonadaceae)(科)、氨基酸球菌科(Acidaminococcaceae)(科)、瘤胃球菌属(属)、Marvinbryantia(属)、衣原体/疣微菌门群(Chlamydiae/Verrucomicrobia group)(总门)、产丁酸盐细菌SR1/1(种)、鞘脂杆菌目(Sphingobacteriales)(目)、芽孢杆菌目(Bacillales)(目)、未定地位的芽孢杆菌目(未分类)、未定地位的芽孢杆菌科XI.(未分类)、和海洋螺菌目(Oceanospirillales)(目)。
[0068] 另外地或可选地,与IBD相关的特征集可以源自以下中的一种或更多种:复制和修复KEGG途径来源的特征;UDP-N-乙酰基-D-葡糖胺脱氢酶[EC:1.1.1.136]KEGG来源的特征(例如,与wbpA相关的K13015 KEGG代码);推定的甘油-1-磷酸异戊二烯转移酶[EC:2.5.1.-]KEGG来源的特征(例如,与pcrB相关的K07094 KEGG代码);假定的蛋白KEGG来源的特征(例如,K07501 KEGG代码);脯氨酸脱氢酶[EC:1.5.-.-]KEGG来源的特征(例如,与PRODH相关的K00318 KEGG代码);和转座酶IS30家族KEGG来源的特征(例如,与催化转座元件的复制型转座的转座酶相关的K07482代码)。
[0069] 因此,受试者的表征包括基于以经典诊断方法的替代或补充的方式检测一种或更多种以上特征,将受试者表征为患有IBD的受试者。然而,在特定实例的变化形式中,特征集可以包括对诊断有用的任何其他合适的特征。
[0070] 1.4.4溃疡性结肠炎表征
[0071] 在另一种实施方式中,模块S140的基于统计分析的表征过程可以基于用源自受试者群体的子集的验证数据集训练并验证的算法,来鉴定与溃疡性结肠炎具有最高相关性的特征集,对于所述溃疡性结肠炎一种或更多种疗法将具有积极效果。特别地,该第一种变化形式中的溃疡性结肠炎是通常通过以下中的一种或更多种来表征的胃肠道紊乱:全血细胞计数、电解质研究、肾功能测试、肝功能测试、x射线成像、尿分析、C-反应性蛋白测量、和乙状结肠镜检查。在第一种变化形式中,对诊断有用的与溃疡性结肠炎相关的特征集包括源自以下分类单元中的一种或更多种的特征:梭菌属(属)、毛螺菌属(Lachnospira)(属)、Blautia(属)、小杆菌属(Dialister)(属)、瘤胃球菌属(属)、梭菌科(科)、消化链球菌科(Peptostreptococcaceae)(科)、韦荣球菌科(Veillonellaceae)(科)、丹毒丝菌科(科)、克里斯滕森菌科(科)、丹毒丝菌目(目)、γ-变形菌纲(纲)、和丹毒丝菌纲(纲)。另外地或可选地,特征集可以源自以下分类单元中的一种或更多种:Actinobacillus porcinus(种)、放线杆菌属(属)、巴斯德氏菌科(科)、巴斯德氏菌目(目)、γ-变形菌纲(纲)、Flavonifractor plautii(种)、Flavonifractor(属)、乳杆菌目(目)、毛螺菌科细菌2_1_58FAA(Lachnospiraceae bacterium 2_1_58FAA)(种)、芽孢杆菌纲(纲)、韦荣球菌科(科)、细菌NLAE-zl-P430(bacterium NLAE-zl-P430)(种)、小杆菌属(属)、Parasutterella(属)、Faecalibacterium(属)、Parasutterella excrementihominis(种)、柯林斯菌属(属)、红蝽菌科(科)、未培养的红蝽菌纲细菌(种)、红蝽菌目(目)、假丁酸弧菌属(属)、脆弱拟杆菌(种)、霍曼氏菌属(属)、紫单胞菌科(科)、衣原体/疣微菌门群(总门)、迟缓埃格特菌(Eggerthella lenta)(种)、疣微菌门(Verrucomicrobia)(门)、拟杆菌目(Bacteroidales)(目)、拟杆菌纲(Bacteroidia)(纲)、拟杆菌门(Bacteroidetes)(门)、拟杆菌门/绿菌门群(Bacteroidetes/Chlorobi group)(总门)、疣微菌纲(Verrucomicrobiae)(纲)、疣微菌目(Verrucomicrobiales)(目)、疣微菌科(Verrucomicrobiaceae)(科)、Subdoligranulum(属)、Dorea(属)、δ-变形菌纲(Deltaproteobacteria)(纲)、δ/ε亚门(亚门)、未定地位的芽孢杆菌目(未分类)、脱硫弧菌目(目)、瘤胃球菌属(属)、粪球菌属(Coprococcus)(属)、真杆菌科(Eubacteriaceae)(科)、真杆菌属(Eubacterium)(属)、克里斯滕森菌科(科)、氨基酸球菌科(科)、红螺菌目(目)、Marvinbryantia(属)、红螺菌科(科)、芽孢杆菌目(目)、Alistipes putredinis(种)、和芽孢杆菌科(Bacillaceae)(科)。
[0072] 另外地或可选地,与溃疡性结肠炎相关的特征集可以源自以下中的一种或更多种:COG(B)代码(例如,染色质结构和动力学功能特征);COG(I)代码(例如,脂质转运和代谢功能特征);细胞生长和死亡KEGG途径来源的特征;萜类化合物和聚酮化合物的代谢KEGG途径来源的特征;信号转导KEGG途径来源的特征;翻译KEGG途径来源的特征;碱基切除修复KEGG途径来源的特征;细胞周期-柄杆菌属(Caulobacter)KEGG途径来源的特征;N-聚糖生物合成KEGG途径来源的特征;氧化磷酸化KEGG途径来源的特征;推定的甘油-1-磷酸异戊二烯基转移酶[EC:2.5.1.-]KEGG来源的特征(例如,与pcrB相关的K07094 KEGG代码);5,10-亚甲基四氢甲烷喋呤还原酶[EC:1.5.98.2]KEGG来源的特征(例如,与mer相关的K00320 +KEGG代码);谷氨酸盐/酯:Na 同向转运体ESS家族KEGG来源的特征(例如,与gltS相关的K03312 KEGG代码);推定的转座酶KEGG来源的特征(例如,K07494 KEGG代码);二酰甘油激酶(ATP)[EC:2.7.1.107]KEGG来源的特征(例如,与dagK相关的K07029 KEGG代码);未表征的蛋白KEGG来源的特征(例如,K06936 KEGG代码);未表征的蛋白KEGG来源的特征(例如,K07161 KEGG代码);未表征的蛋白KEGG来源的特征(例如,K09126 KEGG代码);LPPG:FO 2-磷酸-L-乳酸酯转移酶[EC:2.7.8.28]KEGG来源的特征(例如,与cofD相关的K11212 KEGG代码);和磷酸磺酸基乳酸酯合成酶[EC:4.4.1.19]KEGG来源的特征(例如,与comA相关的K08097 KEGG代码)。
[0073] 因此,受试者的表征包括基于以经典诊断方法的替代或补充的方式检测一种或更多种以上特征,将受试者表征为患有溃疡性结肠炎的受试者。然而,在特定实例的变化形式中,特征集可以包括对诊断有用的任何其他合适的特征。
[0074] 1.4.5乳糜泻表征
[0075] 在另一种实施方式中,模块S140的基于统计分析的表征方法可以基于用源自受试者群体的子集的验证数据集训练并验证的算法,来鉴定与乳糜泻具有最高相关性的特征集,对于所述乳糜泻一种或更多种疗法将具有积极效果。特别地,该第一种变化形式中的乳糜泻是引起胃肠道不适、麸质不耐受、疲乏和营养缺乏的小肠的自身免疫性紊乱。在第一种变化形式中,对诊断有用的与乳糜泻相关的特征集包括源自以下分类单元中的一种或更多种的特征:梭菌属(属)、颤杆菌克属(属)、萨特氏菌属(Sutterella)(属)、梭菌科(科)、消化链球菌科(科)、消化球菌科(Peptococcaceae)(科)、颤螺菌科(科)、和变形菌门(门)。另外地或可选地,特征集可以源自以下分类单元中的一种或更多种:Parasutterella(属)、单形拟杆菌(Bacteroides uniformis)(种)、Parasutterella excrementihominis(种)、脆弱拟杆菌(种)、酸杆菌门(acidobacteria)(门)、放线杆菌属(属)、Actinobacillus porcinus(种)、巴斯德氏菌科(科)、和巴斯德氏菌目(目)。
[0076] 另外地或可选地,与乳糜泻相关的特征集可以源自以下中的一种或更多种:COG(W)代码(例如,细胞外结构功能特征);推定的膜蛋白KEGG来源的特征(例如,与yagU相关的K08996 KEGG代码);一氧化氮还原酶B亚基[EC:1.7.2.5]KEGG来源的特征(例如,与norB相关的K04561 KEGG代码);感受态蛋白ComGA KEGG来源的特征(例如,与comGA相关的K02243 KEGG代码);感受态蛋白ComGC KEGG来源的特征(例如,与comGC相关的K02245 KEGG代码);DNA复制蛋白KEGG来源的特征(例如,与dnaD相关的K02086 KEGG代码);分离环形成调控因子KEGG来源的特征(例如,与ezrA相关的K06286 KEGG代码);甘油-3-磷酸脱氢酶(NADP+)[ED:1.2.1.9]KEGG来源的特征(例如,与gapN相关的K00131 KEGG代码);前导肽酶(prepilin肽酶)/N-甲基转移酶[EC:3.4.23.43 2.1.1.-](例如,与comC相关的K02236 KEGG代码);丙酮酸氧化酶[EC:1.2.3.3]KEGG来源的特征(例如,与poxL相关的K00158 KEGG代码);MFS转运蛋白、SHS家族、唾液酸转运蛋白KEGG来源的特征(例如,与nanT相关的K03290 KEGG代码);中链酰基-[酰基-载体-蛋白]水解酶[EC:3.1.2.21]KEGG来源的特征(例如,与MCH相关的K01071 KEGG代码);酰基辅酶A水解酶[EC:3.1.2.20]KEGG来源的特征(例如,K01073 KEGG代码);葡聚糖1,6-α-葡萄糖苷酶[EC:3.2.1.70]KEGG来源的特征(例如,与dexB相关的K01215 KEGG代码);推定的膜蛋白KEGG来源的特征(例如,K08987 KEGG代码);羟基甲基戊二酰辅酶A还原酶[EC:1.1.1.88]KEGG来源的特征(例如,与mvaA相关的K00054 KEGG代码);青霉素结合蛋白KEGG来源的特征(例如,与pbp相关的K03693 KEGG代码);感受态蛋白CoiA KEGG来源的特征(例如,与coiA相关的K06198 KEGG代码);氨基转移酶[EC:2.6.1.-]KEGG来源的特征(例如,与patA相关的K00841 KEGG代码);X-pro二肽基肽酶[EC:3.4.14.11]KEGG来源的特征(例如,与pepXP相关的K01281 KEGG代码);SprT样蛋白KEGG来源的特征(例如,与sprL相关的K03095 KEGG代码);普通应激蛋白13KEGG来源的特征(例如,与GSP13相关的K07570 KEGG代码);感受态蛋白ComGF KEGG来源的特征(例如,与comGF相关的K02248 KEGG代码);青霉素结合蛋白2A[EC:2.4.1.129 2.3.2.-]KEGG来源的特征(例如,与pbp2A相关的K12555 KEGG代码);对氨基苯甲酸合成酶/4-氨基-4-脱氧分支酸裂解酶(4-amino-4-deoxychorismate lyase)[EC:2.6.1.85 4.1.3.38]KEGG来源的特征(例如,与pabBC相关的K03342 KEGG代码);未表征的蛋白KEGG来源的特征(例如,K09962 KEGG代码);感受态蛋白ComFA KEGG来源的特征(例如,与comFA相关的K02240 KEGG代码);
和GMP还原酶[EC:1.7.1.7]KEGG来源的特征(例如,与guaC相关的K00364 KEGG代码)。
[0077] 因此,受试者的表征包括基于以经典诊断方法的替代或补充的方式检测一种或更多种以上特征,将受试者表征为患有乳糜泻的受试者。然而,在特定实例的变化形式中,特征集可以包括对诊断有用的任何其他合适的特征。
[0078] 受试者的表征可以另外地或可选地实施使用高假阳性测试和/或高假阴性测试,以进一步分析表征方法在根据方法100的实施方案生成的辅助性分析中的灵敏度。
[0079] 1.5第一种方法:疗法模型和提供
[0080] 如图1A中示出的,在一些变化形式中,第一种方法100还可以包括模块S150,所述模块S150叙述:基于表征,生成被配置为矫正免疫微生物功能异常的疗法模型。模块S150在改善受试者的健康方面,用以鉴定或预测可以使受试者的微生物组组成和/或功能特征朝向期望的平衡状态改变的疗法(例如基于益生菌的疗法、基于噬菌体的疗法、基于小分子的疗法等等)。在模块S150中,疗法可以选自包括以下中的一种或更多种的治法:益生菌疗法、基于噬菌体的疗法、基于小分子的疗法、认知/行为疗法、物理康复疗法(physical rehabilitation therapies)、临床疗法、基于药物的疗法、膳食相关疗法、和/或被设计为在改善使用者的健康方面以任何其他合适的方式起作用的任何其他适合的疗法。在基于噬菌体的疗法的特定实例中,可以使用对在患有免疫微生物功能异常的受试者中呈现的某些细菌(或其他微生物)特异的噬菌体的一个或更多个群体(例如,以集落形成单位为单位),以下调或以其他方式消除某些细菌的群体。因此,可以使用基于噬菌体的疗法来减小受试者中呈现的细菌的不期望的群体的大小。互补地,可以使用基于噬菌体的疗法来增大未被所用噬菌体靶向的细菌群体的相对丰度。
[0081] 例如,关于以上1.4.1至1.4.5部分中的免疫微生物功能异常的变化形式,疗法(例如,益生菌疗法、基于噬菌体的疗法等等)可以被配置为下调和/或上调与免疫微生物功能异常特有的特征相关的微生物群体或亚群(和/或其功能)。
[0082] 在益生菌疗法的特定实例中,如图5中示出的,治疗模型的候选疗法可以进行以下中的一种或更多种:通过提供物理屏障(例如,通过定植抵抗的方式)阻断病原体进入上皮细胞、通过刺激杯状细胞(goblet cells)诱导粘液屏障的形成、增强受试者的上皮细胞之间的顶端紧密连接的完整性(例如,通过刺激闭小带1(zona-occludens 1)的上调、通过防止紧密连接蛋白重新分布)、产生抗微生物因子、刺激抗炎细胞因子的产生(例如,通过树突细胞的信号传导和调节性T细胞的诱导)、触发免疫应答、以及进行调节受试者的微生物组远离失调状态的任何其他合适的功能。
[0083] 在变化形式中,疗法模型优选地基于来自大的受试者群体的数据,所述大的受试者群体可以包括在模块S110中微生物组相关数据集源自的受试者群体,其中在暴露于多种治疗措施之前以及暴露于多种治疗措施之后,微生物组组成和/或功能特征或健康状态被充分表征。在基于不同的微生物组表征鉴定为受试者提供期望结果的治疗措施中,此类数据可以用于训练和验证疗法提供模型。在变化形式中,作为监督式机器学习算法的支持向量机可用于生成疗法提供模型。然而,以上描述的任何其他合适的机器学习算法可以有利于疗法提供模型的生成。
[0084] 虽然以上关于模块的性能描述了统计分析和机器学习的一些方法,但是方法100的变化形式在进行表征过程中可以另外地或可选地使用任何其他合适的算法。在变化形式中,算法可以通过包括以下中的任何一种或更多种的学习方式来表征:监督式学习(例如,利用逻辑回归、利用反向传播神经网络)、非监督式学习(例如,利用Apriori算法、利用K-均值聚类)、半监督式学习、强化学习(例如,利用Q学习算法、利用时间差分学习)和任何其他合适的学习方式。此外,算法可以实施以下中的任何一种或更多种:回归算法(例如,普通最小二乘法、逻辑回归、逐步回归、多元自适应回归样条(multivariate  adaptive regression splines)、本地散点平滑估计(Locally Estimated Scatterplot Smoothing)等等)、基于实例的方法(例如,k最近邻域、学习向量量化、自组织映射等等)、正则化方法(例如,岭回归、最小绝对值收缩和选择算子(least absolute shrinkage and selection operator)、弹性网络等等)、决策树学习方法(例如,分类和回归树、迭代二叉树3代、C4.5、卡方自动交互检测、决策树、随机森林、多元自适应回归样条、梯度推进机(gradient boosting machines)等等)、贝叶斯方法(例如,朴素贝叶斯( Bayes)、平均单依赖估计(averaged one-dependence estimators)、贝叶斯置信网络(Bayesian belief network)等等)、核方法(例如,支持向量机、径向基函数、线性判别分析等等)、聚类方法(例如,k-均值聚类、期望最大化等等),关联规则学习算法(associated rule learning algorithm)(例如,Apriori算法、Eclat算法等等)、人工神经网络模型(例如,感知方法(Perceptron method)、反向传播方法(back-propagation method)、Hopfield网络方法、自组织映射方法、学习向量量化方法等等)、深度学习算法(例如,受限玻尔兹曼机(restricted Boltzmann machine)、深度置信网络方法(deep belief network method)、卷积网络方法(convolution network method)、栈式自编码器方法(stacked auto-encoder method)等等)、降维方法(例如,主成分分析、偏最小二乘回归、Sammon映射、多维标度(multidimensional scaling)、投影寻踪等等)、集成方法(例如,推进(boosting)、靴襻式聚集(boostrapped aggregation)、AdaBoost、堆叠泛化(stacked generalization)、梯度推进机方法(gradient boosting machine method)、随机森林法等等)和任何合适形式的算法。
[0085] 另外地或可选地,疗法模型可以涉及如从被鉴定为身体健康的受试者群体的受试者评价的“正常”或基线微生物组组成和/或功能特征的鉴定而得到。在鉴定被表征为身体健康的受试者群体的受试者子集(例如,使用表征过程的特征)之后,在模块S150中可以生成将微生物组组成和/或功能特征朝向处于身体健康的受试者的那些微生物组组成和/或功能特征调节的疗法。因此,模块S150可以包括鉴定一种或更多种基线微生物组组成和/或功能特征(例如,对于人口学特征集中的每一个,一个基线微生物组),以及可以使处于失调状态的受试者的微生物组朝向鉴定的基线微生物组组成和/或功能特征之一改变的潜在疗法制剂和疗法方案。然而,可以以任何其他合适的方式生成和/或精化疗法模型。
[0086] 与疗法模型相关的益生菌疗法相关微生物组合物优选地包括可培养(例如,能够扩增以提供可分级(scalable)疗法)且非致死性(例如,以其期望的治疗剂量是非致死性的)的微生物。此外,微生物组合物可以包含对受试者的微生物组具有急性或温和效果的单一类型的微生物。另外地或可选地,微生物组合物可以包括多种类型的微生物的平衡的组合,所述平衡的组合被配置为在将受试者的微生物组朝向期望的状态驱动方面彼此配合。例如,益生菌疗法中的多种类型的细菌的组合可以包括第一细菌类型,所述第一细菌类型生成被第二细菌类型使用的产物,所述第二细菌类型在积极影响受试者的微生物组方面具有强烈效果。另外地或可选地,益生菌疗法中的多种类型细菌的组合可以包括若干种细菌类型,所述若干种细菌类型产生具有积极影响受试者的微生物组的相同功能的蛋白。
[0087] 在益生菌疗法的实例中,益生菌组合物可以包含一种或更多种已鉴定的微生物分类群单元的组分(例如,如以上1.4.1至1.4.5部分描述的),所述组分以100万至100亿CFU的剂量提供,如从预测响应于该疗法积极调整受试者的微生物组的疗法模型确定的。另外地或可选地,疗法可以包括多剂量的归因于在未患有免疫微生物功能异常的受试者的微生物组组成中的功能存在的蛋白。在实例中,可以指导受试者摄入胶囊,所述胶囊根据对他/她的以下中的一种或更多种定制的方案包含益生菌制剂:生理学(例如,身体质量指数、体重、身高)、人口学特征(例如,性别、年龄)、失调的严重度、对药物的敏感性以及任何其他合适的因素。
[0088] 此外,基于益生菌的疗法的益生菌组合物可以天然地或合成地得到。例如,在一种应用中,益生菌组合物可以天然地源自粪便物质或其他生物物质,(例如,如利用表征过程和疗法模型鉴定的,具有基线微生物组组成和/或功能特征的一个或更多个受试者的)。另外地或可选地,益生菌组合物可以基于如利用表征过程和疗法模型鉴定的基线微生物组组成和/或功能特征合成地得到(例如,使用台式方法(benchtop method)得到)。在变化形式中,可以用于益生菌疗法的微生物剂可以包括以下中的一种或更多种:酵母(例如,布拉酵母菌(Saccharomyces boulardii))、革兰氏阴性细菌(例如,大肠杆菌Nissle(E.coli Nissle))、革兰氏阳性细菌(例如,重组双歧杆菌(Bifidobacteria  bifidum)、Bifidobacteria infantis、鼠李糖乳杆菌(Lactobacillus rhamnosus)、乳酸乳球菌(Lactococcus lactis)、植物乳杆菌(Lactobacillus plantarum)、嗜酸乳杆菌(Lactobacillus acidophilus)、干酪乳杆菌(Lactobacillus casei)、Bacillus polyfermenticus等等)和任何其他合适类型的微生物剂。
[0089] 另外地或可选地,通过模块S150的治疗模型安排的疗法可以包括以下中的一种或更多种:消费品(例如,食物类物品(food items)、饮料类物品(beverage items)、营养补充剂)、建议的活动(例如,运动方案、对酒精消费的调整、对香烟使用的调整、对药物使用的调整)、局部疗法(例如,洗剂、软膏剂、消毒剂(antiseptics)等等)、对卫生产品使用的调整(例如,洗发产品的使用、护发素产品(conditioner products)的使用、肥皂的使用、化妆品(makeup products)的使用等等)、对饮食的调整(例如,糖消费、脂肪消费、食盐消费、酸消费等等)、对睡眠行为的调整、生活安排的调整(例如,对与宠物一起生活的调整、对与个人的家庭环境中的植物一起生活的调整、对与个人的家庭环境中的光和温度的调整等等)、营养补充剂(例如,维生素、矿物质、纤维脂肪酸、氨基酸、益生元(prebiotics)、益生菌等等)、药物、抗生素和任何其他合适的治疗措施。
[0090] 然而,第一种方法100可以包括被配置为利于以下的任何其他合适的模块或步骤:接收来自个体的生物样品、处理来自个体的生物样品、分析源自生物样品的数据以及生成可用于根据个体的特定微生物组组成提供定制的诊断和/或治疗的模型。
[0091] 2.第二种方法:个性化诊断和治疗
[0092] 如以上提及的,在一些实施方案中,第一种方法100的输出基于个体的微生物组的分析可以用于生成诊断和/或为个体提供治疗措施。因此,源自第一种方法100的至少一种输出的第二种方法200可以包括:接收来自受试者的生物样品S210;基于处理源自生物样品的微生物组数据集,表征患有一种形式的免疫微生物功能异常的受试者S220;以及基于表征和疗法模型为患有免疫微生物功能异常的受试者安排疗法S230。
[0093] 模块S210叙述:接收来自受试者的生物样品,其用以利于生成受试者的微生物组组成数据集和/或微生物组功能多样性数据集。因此,处理和分析生物样品优选地利于生成受试者的微生物组组成数据集和/或微生物组功能多样性数据集,所述微生物组组成数据集和/或微生物组功能多样性数据集可用于提供输入,所述输入可用于关于免疫微生物功能异常的诊断表征个体,如模块S220中的。优选地以与以上关于模块S110描述的样品接收的实施方案、变化形式和/或实例之一的方式相似的方式进行接收来自受试者的生物样品。因此,可以使用与用于接收和处理用于生成第一种方法100的表征和/或疗法提供模型的生物样品的那些过程类似的过程,对受试者进行模块S210中的生物样品的接收和处理,以提供过程的一致性。然而,模块S210中的生物样品接收和处理可以可选地以任何其他合适的方式进行。
[0094] 模块S220叙述:基于处理源自生物样品的微生物组数据集,表征患有一种形式的免疫微生物功能异常的受试者。模块S220用于从受试者的微生物组来源的数据提取特征,并且使用该特征将个体正面地或负面地表征为患有一种形式的免疫微生物功能异常。因此,模块S220中的表征受试者优选地包括鉴定与受试者的微生物组组成和/或微生物组的功能特征相关的特征和/或特征的组合,并将这样的特征与患有免疫微生物功能异常的受试者特有的特征进行比较。模块S220还可以包括生成和/或输出与对个体的表征相关的置信度量。例如,置信度量可以源自用于生成分类的特征的数目、用于生成表征的特征的相对权重或排名、在以上模块S140中使用的模型中的偏倚的测量和/或与模块S140的表征操作的方面相关的任何其他合适的参数。
[0095] 在一些变化形式中,从微生物组数据集提取的特征可以用来自个体的调查来源的和/或病史来源的特征补充,这可以用于进一步精化模块S220的表征操作。然而,另外地或可选地可以以任何其他合适的方式使用个体的微生物组组成数据集和/或微生物组功能多样性数据集来增强第一种方法100和/或第二种方法200。
[0096] 模块S230叙述:基于表征和疗法模型为患有免疫微生物功能异常的受试者安排疗法。模块S230用于向受试者推荐或提供个性化治疗措施,以使个体的微生物组组成朝向期望的平衡状态改变。因此,模块S230可以包括矫正免疫微生物功能异常,或者以其他方式关于免疫微生物功能异常积极地影响使用者的健康。因此,模块S230可以包括基于受试者的关于免疫微生物功能异常的表征来为受试者安排一种或更多种治疗措施。
[0097] 在模块S230中,向受试者提供治疗措施可以包括推荐可用的治疗措施,所述治疗措施被配置为将受试者的微生物组组成朝向期望的状态调节。另外地或可选地,模块S230可以包括根据受试者的表征(例如,关于特定类型的免疫微生物功能异常)向受试者提供定制的疗法。在变化形式中,治疗措施可以包括以下中的一种或更多种:益生菌、基于噬菌体的疗法、消费品、建议的活动、局部疗法、对卫生产品使用的调整、对饮食的调整、对睡眠行为的调整、生活安排、对性活动水平的调整、营养补充剂、药物、抗生素和任何其他合适的治疗措施。模块S230中的疗法提供可以包括通过电子设备、通过与个体相关联的实体、和/或以任何其他合适的方式来提供通知。
[0098] 更详细地,模块S230中的疗法提供可以包括针对健康相关目标,向受试者提供关于推荐的治疗措施和/或其他行动路线的通知,如图6中示出的。可以通过执行被配置用于通知提供的应用程序、万维网界面和/或信息传递客户端(messaging client)的电子设备(例如,个人计算机、移动设备、平板计算机(tablet)、头戴式可佩戴计算设备、手腕式可佩戴计算设备等等)向个人提供通知。在一个实例中,与受试者相关联的个人计算机或膝上型计算机(laptop)的万维网界面可以由受试者提供对受试者的使用者帐户的访问,其中使用者帐户包括关于以下的信息:受试者的表征、受试者的微生物组组成和/或功能特征的方面的详细表征、以及关于在模块S150中生成的建议的治疗措施的通知。在另一个实例中,在个人电子设备(例如,智能电话、智能手表、头戴式智能设备)执行的应用程序可以被配置为提供关于由模块S150的疗法模型生成的治疗建议的通知(例如,显示、通过触觉(haptically)、以听觉方式等等)。另外地或可选地,可以通过与受试者相关的实体(例如,看护者、配偶、重要他人、医疗保健专业人员等等)直接提供通知。在一些另外的变化形式中,可以将通知另外地或可选地提供给与受试者相关的实体(例如,医疗保健专业人员),其中实体能够施用治疗措施(例如,通过处方、通过进行治疗会话等等)。然而,可以以任何其他合适的方式向受试者提供疗法施用的通知。
[0099] 此外,在模块S230的延伸中,可以利用在治疗方案的过程期间监测受试者(例如,通过贯穿疗法接受和分析来自受试者的生物样品、通过贯穿疗法接受来自受试者的调查来源的数据),对根据在模块S150中生成的模型提供的每个推荐的治疗措施生成疗法效果模型。
[0100] 实施方案的方法100、200和/或系统可以至少部分地呈现或实施为被配置为接收存储计算机可读指令的计算机可读介质的机器。指令可以通过与患者的计算机或移动设备的应用程序、小应用程序、主机、服务器、网络、网站、通信服务、通信界面、硬件/固件/软件元件集成的计算机可执行组件或其任何合适的组合来执行。实施方案的其他系统及方法可以至少部分地被呈现和.或实施为被配置为接收存储计算机可读指令的计算机可读介质的机器。指令可以通过与以上描述的类型的装置和网络集成的计算机可执行组件执行。计算机可读介质可以储存在任何合适的计算机可读介质上,诸如RAM、ROM、闪速存储器、EEPROM、光学设备(CD或DVD)、硬盘驱动器软盘驱动器或任何合适的设备。计算机可执行组件可以是处理器,虽然任何合适的专用硬件设备可以(另外地或可选地)执行指令。
[0101] 附图例证了系统、方法和计算机程序产品的根据优选的实施方案、实例配置及其变化形式的可能的实施的架构(architecture)、功能和操作。在这方面,流程图或框图中的每个模块可以代表模块、部分、步骤或部分代码,其包括用于实施指定的逻辑功能的一个或更多个可执行的指令。还应当指出的是,在一些可选的实施方式中,在模块中提到的功能可以以在附图中指出的顺序以外的顺序发生。例如,实际上,根据所牵涉的功能,示出的两个连续的模块可以基本上同时执行,或者模块有时可以以相反的顺序执行。还应当指出的是,框图和/或流程图说明中的每个模块,以及框图和/或流程图说明中的模块的组合,可以由进行指定功能或动作的基于特定目的的硬件的系统、或特定目的的硬件和计算机指令的组合来实施。
[0102] 如本领域技术人员将从之前的详细描述和从附图和权利要求认识到,可以对本发明的实施方案进行修改和改变而不偏离如以下权利要求中定义的本发明的范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈