首页 / 专利库 / 生物化学 / 次级代谢产物 / 用于表征艰难梭菌相关病症的方法和系统

用于表征艰难梭菌相关病症的方法和系统

阅读:1067发布:2020-06-06

专利汇可以提供用于表征艰难梭菌相关病症的方法和系统专利检索,专利查询,专利分析的服务。并且用于表征与使用者相关的梭菌相关病症的系统和方法的实施方案包括:处理网络,所述处理网络能够操作以接收包含来自使用者集合的物质的容器,所述处理网络包括能够操作以通过对物质进行测序来确定 微 生物 群系序列的测序系统;处理系统,所述处理系统能够操作以基于微生物群系序列生成微生物群系组成数据集和微生物群系功能多样性数据集,接收与该使用者集合的梭菌相关病症相关联的补充数据集;将补充数据集和从微生物群系组成数据集和微生物群系功能多样性数据集提取的特征转 化成 梭菌相关病症的表征模型;以及 治疗 系统,基于使用表征模型针对梭菌相关病症相关的使用者进行表征,所述治疗能够操作以促进对使用者的治疗。,下面是用于表征艰难梭菌相关病症的方法和系统专利的具体信息内容。

1.一种用于表征与使用者相关的梭菌相关病症的系统,所述系统包括:
●处理网络,所述处理网络能够操作以接收包含来自使用者集合的物质的容器,所述处理网络包括测序系统,所述测序系统能够操作以通过对所述物质进行测序来确定生物群系序列;
●处理系统,所述处理系统能够操作以:
●基于微生物群系序列生成微生物群系组成数据集和微生物群系功能多样性数据集;
●接收与所述使用者集合的梭菌相关病症相关的补充数据集;
●将补充数据集和从微生物群系组成数据集和微生物群系功能多样性数据集提取的特征转化成梭菌相关病症的表征模型;和
治疗系统,基于使用所述表征模型来表征与梭菌相关病症相关的使用者,所述治疗系统能够操作以促进对所述使用者的治疗。
2.根据权利要求1所述的系统,其中,所述处理系统进一步能够操作以:
●获得梭菌相关特征选择规则集,所述梭菌相关特征选择规则集将梭菌相关病症与微生物群系组成特征的子集和微生物群系功能多样性特征的子集相关联;和
●基于针对所述梭菌相关特征选择规则集评估所述微生物群系组成数据集和微生物群系功能多样性数据集,来生成所述特征。
3.根据权利要求2所述的系统,其中,所述梭菌相关特征选择规则集通过促进减少将所述补充数据集和所述特征转化成所述表征模型的处理时间来改进所述处理系统。
4.根据权利要求2所述的系统,其中,所述微生物群系功能多样性特征的子集包括以下项中的至少一个:蛋白质特征直系同源组的簇、基因组功能特征、分类特征、化学功能特征和系统功能特征。
5.根据权利要求1所述的系统,
●其中,所述梭菌相关病症包括艰难梭菌核糖体型027菌株感染,所述艰难梭菌核糖体型027菌株感染包括败血症和结肠炎中的至少一种,并且
●其中,所述相关的特征包括以下项中的至少一种:与胆汁酸代谢相关的微生物群系功能多样性特征和与拟杆菌、厚壁菌和变形菌的相对丰度相关的微生物群系组成特征。
6.根据权利要求1所述的系统,其中,所述特征包括与磷酸戊糖途径、糖异生和固定中的至少一种相关的京都基因和基因组百科全书(KEGG)功能特征。
7.根据权利要求1所述的系统,进一步包括界面,所述界面能够操作以改善对从所述表征模型得出的梭菌相关病症信息的显示,其中,所述梭菌相关病症信息包括相对于共享人口统计特征的使用者组而言的所述使用者的微生物群系组成,并且其中所述微生物群系组成包括分类组,所述分类组包括艰难梭菌、肉毒梭菌和产气荚膜梭菌中的至少一种。
8.根据权利要求7所述的系统,其中,所述梭菌相关病症信息包括所述使用者相对于所述使用者组的感染险,其中,所述感染风险与以下项中的至少一个相关:分类组和功能特征,并且其中所述治疗能够操作以降低所述感染风险。
9.根据权利要求1所述的系统,进一步包括样品试剂盒,所述样品试剂盒包括所述容器,其中,所述处理网络能够操作以将所述容器递送给所述使用者集合,并且其中所述处理网络进一步包括文库制备系统,所述文库制备系统能够操作以使用与梭菌相关病症相关的微生物群系靶标相容的引物对所述物质进行片段化和多重扩增。
10.一种用于表征与使用者相关的艰难梭菌(C.difficle)相关病症的方法,所述方法包括:
●基于源自使用者集合的物质样品的核酸序列生成微生物群系组成数据集和微生物群系功能多样性数据集;
●接收提供所述使用者集合的艰难梭菌相关病症的信息的补充数据集;
●获得艰难梭菌相关特征选择规则集,所述艰难梭菌相关特征选择规则集将艰难梭菌相关病症与微生物群系组成特征的子集和微生物群系功能多样性特征的子集相关联;
●基于针对所述艰难梭菌相关特征选择规则集,评估所述微生物群系组成数据集和微生物群系功能多样性数据集来生成特征集;
●将所述特征集与补充数据集一起应用以生成所述艰难梭菌相关病症的表征模型;
●使用所述表征模型生成与艰难梭菌相关病症相关的使用者的表征;和
●基于所述表征促进对所述使用者的治疗。
11.根据权利要求10所述的方法,其中,所述治疗能够操作以便于改变与艰难梭菌相关病症相关的使用者微生物群系组成和使用者微生物群系功能多样性,其中,促进所述治疗包括控制治疗系统以促进所述治疗。
12.根据权利要求10所述的方法,其中,生成相关的特征集包括基于所述微生物群系组成特征的子集和所述微生物群系功能多样性特征的子集来生成所述使用者集合的微生物群特征向量集,并且其中应用所述特征集包括用所述微生物群系特征向量集来训练所述表征模型。
13.根据权利要求10所述的方法,进一步包括:
●将来自所述样品物质中的微生物的核酸物质片段化并扩增;
●用任何合适的测序系统对所述核酸物质进行测序以确定核酸序列;和
●确定所述核酸序列和与艰难梭菌相关病症相关的参考序列之间的比对,其中基于所述比对生成所述微生物群系组成数据集和微生物群系功能多样性数据集。
14.根据权利要求10所述的方法,其中,所述艰难梭菌相关病症是包括败血症和结肠炎中的至少一种的艰难梭菌感染,并且其中所述使用者的表征包括对艰难梭菌感染的诊断性分析。
15.根据权利要求14所述的方法,其中,所述微生物群系功能多样性特征的子集包括与胆汁酸代谢相关的功能特征,并且其中生成所述诊断性分析是基于使用具有相关的功能特征的所述表征模型。
16.根据权利要求14所述的方法,其中,所述补充数据集包括生物度量传感器数据,所述生物度量传感器数据提供关于艰难梭菌感染的信息,并且其中所述艰难梭菌相关特征选择规则集将所述艰难梭菌感染与得自所述生物传感器数据的生物度量特征相关联。
17.根据权利要求10所述的方法,其中,所述艰难梭菌相关病症包括艰难梭菌感染风险,并且其中包括能够操作以便于改变使用者微生物群系组成以降低艰难梭菌感染风险的治疗。
18.根据权利要求17所述的方法,其中,所述微生物群系组成特征的子集包括与拟杆菌、厚壁菌和变形菌的相对丰度相关的组成特征,其中,生成所述表征包括基于使用具有所述组成特征的所述表征模型确定所述艰难梭菌感染风险,并且其中所述治疗能够操作以改变拟杆菌、厚壁菌和变形菌的相对丰度来降低艰难梭菌感染风险。
19.根据权利要求17所述的方法,其中,所述补充数据集包括与所述使用者集合相关联的抗生素方案数据,并且其中应用所述相关的特征集包括将所述相关的特征集与所述抗生素方案数据一起应用以生成所述表征模型。
20.根据权利要求10所述的方法,其中,所述艰难梭菌相关病症包括艰难梭菌核糖体型
027菌株的存在,并且其中生成所述表征包括确定使用者微生物群系组成中艰难梭菌核糖体型027菌株的存在。
21.根据权利要求19所述的方法,其中,所述相关的特征集包括与含梭菌(属)、梭菌(科)和厚壁菌()中的至少一种的分类组相关的组成特征,并且其中确定艰难梭菌核糖体型027菌株的存在包括处理具有组成相关的特征的表征模型。
22.根据权利要求20所述的方法,其中,所述相关的特征集包括与含以下项中的至少一项的分类单位集相关的组成特征:Flavonifractor plautii(种)、长双歧杆菌(种)、脆弱拟杆菌(种)、两歧双歧杆菌(种)、Erysipelatoclostridium ramosum(种)、Parabacteroides distasonis(种)、Bacteroides vulgatus(种)、普拉梭菌(种)、Blautia sp.YHC-4(种)、Blautia faecis(种)、Bacteroides acidifaciens(种)、产气柯林斯菌(种)、Anaerostipes caccae(种)、细菌NLAE-zl-P855(种)、多形拟杆菌(种)、Bacteroides vulgatus(种)、解木聚糖拟杆菌(种)、沃氏嗜胆菌(种)、Blautiaproduct(种)、Clostridium clostridioforme(种)、Clostridium hathewayi(种)、无害梭菌(种)、共生梭菌(种)、迟缓埃格特菌(种)、大肠杆菌(种)、副流感嗜血杆菌(种)、Intestinibacter bartlettii(种)、Ruminococcus gnavus(种)以及Ruminococcus torques(种);并且其中确定所述艰难梭菌菌株的存在包括处理具有组成相关的特征的所述表征模型。
23.根据权利要求20所述的方法,其中,所述相关的特征集包括与含以下项中的至少一项的分类单位集相关的组成特征:罗氏菌属(属)、韦荣氏球菌属(属)、克鲁维菌属(属)、八叠球菌属(属)、Subdoligranulum(属)、双歧杆菌属(属)、Faecalibacterium(属)、Bilophila(属)、乳杆菌属(属)、优杆菌属(属)、Parabacteroides(属)、Akkermansia(属)、Dorea(属)、Bacteroides(属)、Moryella(属)、Anaerotruncus(属)、肠球菌属(属)、Eggerthella(属)、Collinsella(属)、厌杆菌属(属)、巨型球菌属(属)、Alistipes(属)、Intestinimonas(属)、链球菌属(属)、Flavonifractor(属)、梭菌属(属)、Peptoclostridium(属)、假丁酸弧菌属(属)、Erysipelatoclostridium(属)、Anaerostipes(属)、Blautia(属)、埃希氏菌杆菌属-志贺菌属(属)、嗜血杆菌属(属)、Hungatella(属)、Intestinibacter(属)以及Lachnoclostridium(属);并且其中确定所述艰难梭菌菌株的存在包括处理具有组成相关的特征的所述表征模型。
24.根据权利要求20所述的方法,其中,所述相关的特征集包括与含以下项中的至少一项的分类单位集相关的组成特征:Ruminococcaceae(科)、肠杆菌科(科)、红蝽菌科(科)、乳杆菌科(科)、毛螺菌科(科)、双歧杆菌科(科)、优杆菌科(科)、疣微菌科(科)、拟杆菌科(科)、颤螺旋菌科(科)、肠球菌科(科)、理研菌科(科)、慢生根瘤菌科(科)、梭菌科(科)、Peptostreptococcaceae(科)、韦荣球菌科(科)、Christensenellaceae(科)、Erysipelotrichaceae(科)以及链球菌科(科);并且其中确定所述艰难梭菌菌株的存在包括处理具有组成相关的特征的所述表征模型。
25.根据权利要求20所述的方法,其中,所述相关的特征集包括与含以下项中的至少一项的分类单位集相关的组成特征:肠杆菌目(目)、梭菌目(目)、红蝽菌目(目)、双歧杆菌目(目)、疣微菌目(目)、Selenomonadales(目)、Erysipelotrichales(目)、乳杆菌目(目);并且其中确定所述艰难梭菌菌株的存在包括处理具有组成相关的特征的所述表征模型。
26.根据权利要求10所述的方法,其中,所述相关的特征集包括与含以下项中的至少一项的分类单位集相关的组成特征:羧菌纲(纲)、放线菌纲(纲)、疣微菌纲(纲)、α-变形菌纲(纲)、δ-变形菌纲(纲)、Negativicutes(纲)、Erysipelotrichia(纲)、γ-变形菌纲(纲)、杆菌纲(纲);并且其中确定所述艰难梭菌菌株的存在包括处理具有组成相关的特征的所述表征模型。
27.根据权利要求10所述的方法,其中,所述相关的特征集包括与含以下中的至少一项的分类单位集相关的组成特征:变形菌门(门)、放线菌门(门)、疣微菌门(门)以及厚壁菌门(门);并且其中确定所述艰难梭菌菌株的存在包括处理具有组成相关的特征的所述表征模型。
28.根据权利要求10所述的方法,其中,所述特征集包括与磷酸戊糖途径、糖异生和碳固定中的至少一种相关的京都基因和基因组百科全书(KEGG)功能特征,并且其中生成所述表征包括处理具有KEGG功能特征的所述表征模型。
29.根据权利要求10所述的方法,其中,所述特征集包括与以下项中的至少一项相关联的京都基因和基因组百科全书(KEGG)功能特征:翻译;代谢;环境适应;复制和修复;信号传导分子和相互作用;细胞过程和信号传导;能量代谢;细胞生长和死亡;基酸代谢;核苷酸代谢;感染性疾病;神经系统;信号转导;内分泌系统;其他氨基酸的代谢;碳化合物代谢;
辅因子和维生素的代谢;折叠、分类和降解;膜转运;萜类和聚化合物的代谢;异生素生物降解和代谢;细胞运动;代谢性疾病;酶家族及其他次级代谢物的生物合成;并且其中生成所述表征包括使用所述KEGG功能特征来处理所述表征模型。
30.根据权利要求10所述的方法,其中,所述特征集包括与以下项中的至少一项相关的京都基因和基因组百科全书(KEGG)功能特征:核糖体生物发生;肽聚糖生物合成;染色体;
无机离子转运和代谢;氨基酸相关酶;氨基酸代谢;核糖体;氨酰-tRNA生物合成;其他离子耦合转运蛋白;氮代谢;光合作用;翻译因子;光合蛋白;泛酸和辅酶A生物合成、植物-病原体相互作用、同源重组、萜类骨架生物合成、磷酸转移酶系统(PTS);细菌毒素;酸和二羧酸代谢;DNA修复和重组蛋白;翻译蛋白;多环芳降解;次级代谢产物的生物合成和生物降解;结核;嘧啶代谢;细胞骨架蛋白;蛋白质输出;碳水化合物代谢;通过叶酸进行的一碳单位代谢;RNA聚合酶;硫胺素代谢;苯丙氨酸;酪氨酸和色氨酸生物合成;缬氨酸、亮氨酸和异亮氨酸生物合成、戊糖和葡萄糖醛酸相互转化;细胞周期-柄杆菌属;丁酰苷菌素和新霉素生物合成;DNA复制蛋白;切除修复;细胞运动和分泌;核苷酸切除修复;烟酸和烟酰胺代谢;谷胱甘肽代谢;玉米素生物合成;霍乱弧菌致病周期;阿尔茨海默氏病;错配修复;
蛋白质折叠和相关加工;赖氨酸生物合成;脂肪酸生物合成;其他转运蛋白;柠檬烯和蒎烯降解;硫磺中继系统;谷氨酸能突触;甲烷代谢;脂质生物合成蛋白;C5-分支的二元酸代谢;
赖氨酸降解;异戊二烯基转移酶;真核生物中的核糖体生物合成;脂多糖生物合成蛋白;分子伴侣和折叠催化剂;色氨酸代谢;维生素代谢;D-谷氨酰胺和D-谷氨酸代谢;细菌趋化性;
转录机制;双组分体系;孢子形成;限制酶;光合生物体中的碳固定;药物代谢-其他酶;丙氨酸、天冬氨酸和谷氨酸代谢;孔离子通道;组氨酸代谢;精氨酸和脯氨酸代谢;肽酶;核黄素代谢;淀粉蔗糖代谢;原发性免疫缺陷;氧化磷酸化;脂质代谢;转录因子;D-丙氨酸代谢;
链霉素生物合成;磺酸和亚牛磺酸代谢;DNA复制;ABC转运蛋白;甘油磷脂代谢;缬氨酸、亮氨酸和异亮氨酸降解;β-丙氨酸代谢;原核生物中的碳固定途径;聚酮化糖生物合成;降解;甘油脂代谢;仅限一般功能预测;蛋白激酶;磷酸戊糖途径;维生素B6代谢;糖基转移酶;磷脂酰肌醇信号传导系统;果糖和甘露糖代谢;膜和细胞内结构分子;脂肪酸代谢和I型糖尿病;并且其中生成所述表征包括处理具有所述KEGG功能特征的所述表征模型。

说明书全文

用于表征艰难梭菌相关病症的方法和系统

[0001] 相关申请的交叉引用
[0002] 本申请是于2016年4月13日提交的美国专利申请No.15/097,862的部分接续申请,其要求于2015年4月13日提交的序列号为62/146,810的美国临时申请、于2015年4月13日提交的序列号为62/146,833的美国临时申请、于2015年4月14日提交的序列号为62/147,124的美国临时申请、于2015年4月13日提交的序列号62/146,852的美国临时申请、于2015年4月14日提交的序列号为62/147,058的美国临时申请、于2015年4月14日提交的序列号为62/147,077的美国临时申请、于2015年4月14日提交的序列号为62/147,315的美国临时申请以及于2015年4月14日提交的序列号为62/147,337的美国临时申请的权益,这些美国临时申请分别通过引用整体并入本文。
[0003] 本申请还要求于2015年12月9日提交的序列号为62/265,077的美国临时申请的权益,该美国临时申请通过引用整体并入本文。

技术领域

[0004] 本发明总体上涉及生物学领域,更具体地涉及微生物学领域中用于表征艰难梭菌相关病症的新的且有用的系统和方法。

背景技术

[0005] 微生物群系是与生物体相关的共栖、共生和致病微生物的生态群落。人类微生物群系包括与人类细胞相比多出超过10倍的微生物细胞,但由于样品处理技术、遗传分析技术以及用于处理大量数据的资源方面的局限性,对人类微生物群系的表征仍处于初期阶段。尽管如此,微生物群系被怀疑在许多与健康/疾病相关的状态(例如,准备分娩、糖尿病、自身免疫障碍、胃肠障碍、类湿性障碍、神经障碍等)中起着至少部分作用。考虑到微生物群系在影响受试者的健康方面的深刻影响,应付出与微生物群系的表征、由该表征形成见解以及生成被配置为从生态失调状态恢复的疗法相关的努。然而,目前用于分析人类微生物群系和基于所获见解提供治疗措施的方法和系统仍然遗留许多尚未被解答的问题。特别是,由于当前技术的局限性,基于微生物群系组成特征和/或功能特征来表征某些健康状况的方法以及针对具体受试者进行适应性调整的治疗(例如,益生菌治疗)尚不可行。
[0006] 因此,在微生物学领域,需要一种用于以个体化和群体范围的方式表征艰难梭菌(C.difficile)相关病症的新的且有用的系统和方法。本发明提供了这样一种新的且有用的系统和方法。附图说明
[0007] 图1A-1B是用于微生物群系表征的方法的实施方案的流程图
[0008] 图2描绘了用于微生物群系表征的系统和方法的实施方案;
[0009] 图3描绘了在用于微生物群系表征的系统和方法的实施方案中用于生成模型的过程的变型;
[0010] 图4描绘了基于益生菌的疗法在用于微生物群系表征的方法的实施方案中操作的机制的变型;
[0011] 图5描绘了在用于微生物群系表征的方法的实施例中的通知书的示例;
[0012] 图6描绘了在用于微生物群系表征的方法的实施例中用于提供与梭菌相关病症相关的信息的界面的变型;
[0013] 图7描绘了在用于微生物群系表征的方法的实施例中的通知书的示例;以及[0014] 图8描绘了在用于微生物群系表征的方法的实施例中的通知书的示例。

具体实施方式

[0015] 以下对本发明实施方案的描述无意于将本发明限于这些实施方案,而是旨在使本领域技术人员能够制造和使用本发明。
[0016] 1.概述。
[0017] 如图2所示,用于表征与使用者(例如,人类受试者、动物受试者等)相关的梭菌相关病症的系统200的一个实施方案包括:处理网络(例如,样品处理网络)210,其能够操作以接收包含来自使用者集合(例如,使用者群体)的物质(例如,包括微生物核酸物质的生物样品等)的容器,所述处理网络包括能够操作以通过对物质进行测序来确定微生物群系序列的测序系统;处理系统220,其能够操作以基于微生物群系序列生成微生物群系组成数据集和微生物群系功能多样性数据集,接收与该使用者集合的梭菌相关病症相关联的补充数据集;将补充数据集和从微生物群系组成数据集和微生物群系功能多样性数据集提取的特征转化成梭菌相关病症的表征模型;以及治疗系统230,基于使用表征模型针对梭菌相关病症相关的使用者进行表征,其能够操作以促进对使用者的治疗。
[0018] 系统200可以另外或可替选地包括以下中的一个或更多个:界面240,其能够操作以显示与梭菌相关病症相关的信息;样品试剂盒250,其用于向受试者提供用于收集和/或处理来自受试者的一个或更多个收集部位的生物样品的组分和/或说明;和/或任何其他合适的部组件。
[0019] 系统200和/或方法100用于生成和/或应用模型(例如,表征模型、治疗模型等),所述模型可用于根据其微生物群系组成和功能特征(例如,作为临床诊断、作为伴随诊断等)中的至少一个来对受试者进行表征(例如,诊断),和/或用于基于对受试者群体的微生物群系表征为受试者提供治疗措施(例如,基于益生菌的治疗措施、基于噬菌体的治疗措施、基于小分子的治疗措施、基于粪便物质移植物的治疗措施、临床措施等)。
[0020] 因此,可以使用来自受试者群体的数据根据受试者的微生物群系组成和/或功能特征来表征受试者、基于该表征指示健康状态和改善的区域,以及促进一种或更多种疗法,所述疗法可以将受试者的微生物群系的组成朝向一组或更多组理想的平衡状态调节。方法100的变型可以进一步有助于监测和/或调整提供给受试者的治疗,例如通过在整个治疗过程中接受、处理和分析来自受试者的额外样品。在具体的实施例中,系统200和/或方法100可用于促进针对患有各种健康状况的受试者的靶向治疗。
[0021] 系统200和/或系统200的组件优选地实施方法100和/或方法100的一部分,但是任何合适的组件都可以部分地和/或完全地实施方法100。方法100可以针对单个受试者实施,使用目标疗法对该单个受试者进行微生物群系表征和/或微生物群系调节,并且可以另外或可替选地针对受试者群体(例如,包括受试者、排除受试者)实施,其中受试者群体可以包括与受试者不相似和/或相似的患者(例如,在健康状况、饮食需求、人口统计学特征等方面)。因此,从受试者群体获得的信息由于来自受试者群体的数据集合而可以用于为受试者的行为和对受试者的微生物群系的影响之间的联系提供额外的见解。
[0022] 对于方法100的实施,生物样品的集合优选地从各种受试者接收,总的包括以下一种或更多种受试者:不同的人口统计学特征(例如,性别、年龄、婚姻状态、种族、民族、社会经济状态、性取向等)、不同的健康状况(例如,健康状态和疾病状态)、不同的生活情形(例如,独居、与宠物一起生活、与重要他人一起生活、与孩子一起生活等)、不同的饮食习惯(例如,杂食、素食、严格素食、糖消耗、酸消耗等)、不同的行为倾向(例如,体力活动平、药物使用、酒精使用等)、不同的移动性水平(例如,与在给定的时间段内行进的距离有关),和/或对微生物群系组成和/或功能特征有影响的任何其它合适的性状。这样,随着受试者数目的增加,在方法100的框中实施的对过程的预测能力相对于基于受试者的微生物群系表征各种受试者而言增加。然而,方法100可涉及生成由来自任何其它合适的受试者组的生物样品数据得出的诊断和治疗。
[0023] 在一个变型中,系统200可以用于实施用于表征与使用者相关的艰难梭菌(C.difficile)相关病症的方法100的一个实施方案,该实施方案包括:基于源自使用者集合(例如,使用者群体)的物质(例如,包括核酸物质的生物样品)的核酸序列生成微生物群系组成数据集和微生物群系功能多样性数据集;接收关于该使用者集合的艰难梭菌相关病症的信息的补充数据集;获得艰难梭菌组相关特征选择规则,该规则将艰难梭菌相关病症与微生物群系组成特征的子集和微生物群系功能多样性特征的子集相关联;基于针对艰难梭菌组相关特征选择规则评估所述微生物群系组成数据集和所述微生物群系功能多样性数据集来生成特征集;应用所述特征集与所述补充数据集以生成针对艰难梭菌相关病症的表征模型;使用所述表征模型生成对与艰难梭菌相关病症有关的使用者的表征;并基于该表征向使用者推荐治疗。
[0024] 2.益处。
[0025] 测序技术(例如,下一代测序)的开始引起了若非与对核酸物质进行测序相关的速度和数据生成的前所未有的发展否则将不会存在的技术问题(例如,数据处理问题、信息显示问题、微生物群系分析问题、治疗预测问题等)。系统200和方法100的实施例为至少这些技术问题提供了技术起源的解决方案。
[0026] 首先,该技术可以通过促进先前不可执行的功能的计算机性能来赋予对计算机相关技术(例如,人工智能机器学习等)的改进。例如,基于微生物群系序列数据集和微生物参考序列数据库(例如,基因组参考联盟(Genome Reference Consortium)),该技术可计算地生成微生物群系表征和推荐的与梭菌相关病症相关的疗法,该技术最近由于样品处理技术及测序技术的发展而可行。构成人类微生物群系的微生物细胞可以比人类细胞大超过十倍,其可以转化为大量数据,使得产生处理和分析问题以生成与潜在地危及生命的梭菌相关病症(例如败血症、结肠炎等)相关的可行的微生物群系见解。
[0027] 其次,该技术可赋予对处理速度和微生物群系表征准确度的改进。该技术可以生成和应用梭菌相关病症特征选择规则,以从大量潜在的特征池中选择优化的特征子集(例如,微生物群系组成特征、微生物群系功能多样性特征等)(例如,可从大量的微生物群系数据中提取)用于生成和应用表征模型和/或治疗模型。因此,梭菌相关病症特征选择规则能够实现更短的训练和执行时间(例如,用于预测性机器学习模型)、有助于高效地解释结果的模型简化、减少过度拟合以及其他适当的改进。
[0028] 第三,该技术可以将实体(例如,使用者、生物样品、包括医疗设备的治疗系统等)转化成不同的状态或事物。例如,系统200和/或方法100可以鉴定治疗以促进患者改变微生物群系组成和/或功能从而预防和/或改善梭菌相关病症,从而转变患者的微生物群系。在另一个实施例中,该技术可以将由患者群体接收的生物样品转化成可用于生成表征模型和/或治疗模型的微生物群系数据集。在另一个实施例中,该技术可以控制治疗系统以促进治疗(例如,通过生成用于治疗系统进行执行的控制指令),由此转化治疗系统。然而,在使用非广义计算机系统来表征微生物群系和/或促进相关治疗的情况下,该技术可以提供任何其他合适的益处。
[0029] 3.系统。
[0030] 系统200的样品处理网络210用于接收和处理(例如,片段化、扩增、序列等)生物样品以将生物样品的微生物核酸转化为遗传序列,随后可以对该遗传序列进行比对和分析以生成对梭菌相关病症的表征和治疗。样品处理网络210可以另外或可替选地用于例如通过邮件递送系统向使用者提供样品试剂盒250(例如,包括样品容器、说明书等)(例如,响应于样品试剂盒250的购买订单)。
[0031] 样品处理网络210可以另外或可替选地包括文库制备系统,其能够操作以通过测序系统以待测序的多重方式自动制备生物样品(例如,使用与微生物群系靶标相容的引物进行片段化和扩增,该微生物群系靶标与梭菌相关病症相关);和/或测序系统(例如,MiSeq/NextSeq/HiSeq和/或其他合适的测序平台),其能够操作以对在样品处理网络210处接收的生物样品来源的核酸(例如,微生物DNA和/或RNA)进行测序。样品处理网络210优选地远离使用者,使得使用者可以方便地将收集的生物样品发送到样品处理网络210,并且基于所收集的生物样品数字地接收结果。另外或可替选地,样品处理网络210可以包括使用者动作(例如,使用者预处理样品)、使用者设备(例如,在辅助样品分析的移动设备上执行的应用)、远程服务器、和/或任何其他合适的实体。然而,样品处理网络210可以以任何合适的方式来配置。
[0032] 系统200的处理系统220用于分析源自经处理的样品的数据集(例如,微生物群系序列数据集)以生成和/或应用表征模型来表征一种或更多种梭菌相关病症。另外或可替选地,处理系统220可以用于生成和/或应用治疗模型以鉴定用于治疗梭菌相关病症的治疗;用于促进治疗(例如,充当治疗系统230以在使用者设备处产生和/或输出治疗推荐给受试者);和/或执行任何合适的功能(例如,方法100的任何部分)。例如,处理系统220能够操作以获得梭菌特征选择规则集,该规则集将该病症与组成特征子集和功能多样性特征子集相关联;并且基于将规则应用于一个或更多个微生物群系数据集来生成特征集(例如,用于生成表征模型)。这样的特征选择规则可以通过促进减少将特征和/或其他合适的数据(例如,补充数据集)转化成特征模型(例如,通过使用源自补充数据集的训练数据标记来训练所述模型)的处理时间来改善处理系统220。
[0033] 另外或可替选地,处理系统200的该系统220的其他组件可以包括和/或传送数据到如下所述项目和/或从如下所述项目传送数据:远程计算系统(例如,远程服务器、系统等)、本地计算系统、使用者数据库(例如,存储使用者账户信息、诸如梭菌相关病症的表征信息、使用者健康记录、使用者人口统计信息、相关护理提供者信息、相关监护人信息、使用者设备信息等)、分析数据库(存储模型、收集的数据、历史数据、公共数据、模拟数据、生成的数据集、生成的分析、诊断结果、治疗建议等)、使用者设备(例如、执行用于存储的应用和/或执行表征和/或治疗模型等的智能手机)、护理提供者设备(例如,与使用者相关联的护理提供者的设备)、被配置为接收存储计算机可读指令的计算机可读介质的机器、和/或任何其它合适的组件。然而,处理系统220可以以任何合适的方式来配置。
[0034] 系统200的治疗系统230用于促进针对受试者或护理提供者实施一个或更多个治疗(例如,由治疗系统220生成和/或执行的治疗模型所鉴定的)以改善和/或预防梭菌相关病症。治疗系统230可以另外或可替选地用于监测一种或更多种治疗的功效以例如生成可用于更新模型(例如,治疗模型)的数据。治疗系统230可以包括以下项中的任何一种或更多种:通信系统(例如,用于将治疗推荐传达给使用者设备和/或护理提供者设备;使得能够在护理提供者和与梭菌相关病症相关的受试者之间进行远程医疗等)、可在使用者设备上执行的应用(例如,用于推荐微生物群系组成改变治疗的饮食方案应用等)、医疗设备(例如,用于施用药物和/或流体的中央静脉导管结肠镜检查设备、乙状结肠镜检查设备和/或其他筛选设备;生物度量传感器,用于监测与梭菌相关病症例如艰难梭菌毒素A或B相关的生物测定数据;生物取样设备,例如用于对受试者的粪便进行取样等)、使用者设备(例如,使用者智能手机的生物度量传感器,其能够操作以收集与梭菌相关病症相关的生物测定数据)和/或任何其他合适的组件。治疗系统230优选地可由处理系统220控制。例如,处理系统220可产生控制指令以传送至治疗系统230以执行促进治疗。在另一个实施例中,处理系统
220可以更新和/或以其他方式改变设备(例如,使用者智能电话)的应用和/或其他治疗系统软件以促进治疗(例如,在待办事项应用中促进生活方式变化以改变微生物群系功能多样性从而降低基于艰难梭菌的结肠炎感染的风险)。然而,治疗系统230可以以任何其他方式配置。
[0035] 如图6所示,系统200可以另外或可替选地包括界面240,界面240用于改善使用者设备和/或护理提供者设备(例如,在网站、文档等处通过应用远程访问界面240)处与梭菌相关病症相关的信息(例如,表征,治疗建议等)的显示。界面240可以是使用者界面(例如,用于显示给受试者)、护理提供者界面和/或任何其它合适的界面240。界面240优选地包括多个显示(例如,第一显示,其引入微生物群系组成和/或微生物群系功能多样性信息;第二显示,其分析信息等),但可以包括以任何方式配置的任何数量的显示。界面240可以以口头、数字、图形、音频和/或任何合适的信息形式显示信息。所显示的信息可以包括和/或与以下中的一种或更多种相关联:微生物群系组成、微生物群系功能多样性、与梭菌相关病症相关的信息(例如,梭菌微生物和/或感染的存在和/或风险等)、行为特征、人口统计学特征、个体特征、与其他受试者和/或人口统计学的比较(例如,比较使用者与吸烟者群体之间的梭菌感染风险等)、群体特征和/或任何其他合适的信息。在一个实施例中,界面240可以为使用者相对于共有人口统计学特征的使用者组为使用者提供微生物群系组成,其中微生物群系组成包括分类组,该分类组包括艰难梭菌、肉毒梭菌(Clostridium botulinum)和产气荚膜梭菌(Clostridium perfringens)中的至少一种。在另一个实施例中,如图8所示,界面240可显示微生物群系组成,其详述了不同梭菌菌株(例如,不同艰难梭菌菌株)的相对丰度,这些梭菌菌株可具有与梭菌感染不同的相关性(例如,与其他艰难梭菌菌株相比,来自艰难梭菌核糖体型027菌株的基于梭菌的败血症的发病率较高)。
[0036] 在一个变型中,界面240可以例如通过以下中的一个或更多个来自动地突出显示的信息的部分:调整大小操作(例如,图形、文本等,用于在特定设备的屏幕维度内拟合信息,和/或其他合适的目的)、颜色改变(例如,使用黄色来突出治疗推荐等)、残疾适应(例如,将文本翻译成音频)和/或其他合适的操作。突出显示的信息可以用于通过分析所显示的信息来指导受试者和/或护理提供者。在另一个变型中,界面240可以促进使用者与界面240的交互。例如,界面240可以提供用于选择不同人口统计学群体(例如,医院患者、最近出院的医院患者、锻炼者、吸烟者、益生菌消费者、抗生素使用者、经历特定疗法的群体等)的选项以比较(例如,通过图表和图)微生物群系组成、功能多样性和/或与其他梭菌相关病症相关的信息。在其他实施例中,界面240可以提供日志(例如,用于记录生活习惯、治疗方案等)、数字调查(例如,用于查询与梭菌感染相关的症状)、疗法和/或可以例如用于更新表征、疗法、模型和/或其他合适的数据的其他合适的组件。然而,界面240可以以任何合适的方式配置。
[0037] 在一些变型中,系统200的任何组件可以执行与其他组件相关联的功能。例如,处理系统220可以执行与测序系统相关联的测序功能;生成对梭菌相关病症的表征和治疗;和促进治疗(例如,通过生成和向受试者传达与治疗相关的通知)。另外或可替选地,系统200和/或方法100可以包括与如下美国专利申请中描述的那些相似的任何合适的组件和/或功能:于2015年1月9日提交的美国专利申请No.14/593,424、于2016年6月30日提交的美国专利申请No.15/198,818、于2016年4月13日提交的美国专利申请No.15/098,027、于2016年4月13日提交的美国专利申请No.15/098,248、于2016年4月13日提交的美国专利申请No.15/098,236、于2016年4月13日提交的美国专利申请No.15/098,222、于2016年4月13日提交的美国专利申请No.15/098,204、于2016年4月13日提交的美国专利申请No.15/098,174、于
2016年4月13日提交的美国专利申请No.15/098,110、于2016年4月13日提交的美国专利申请No.15/098,081、于2016年4月13日提交的美国专利申请No.15/098,153、于2016年8月4日提交的美国专利申请No.15/228,890、以及于2016年8月18日提交的美国专利申请No.15/
240,919,这些美国专利申请分别通过引用整体并入本文。然而,系统200的组件可以以任何合适的方式配置。
[0038] 4.方法。
[0039] 如图1A至图1B所示,用于表征与受试者相关的梭菌相关病症(例如,艰难梭菌病症)的方法100包括:基于处理与受试者群体相关联的生物样品生成微生物群系组成数据集和微生物群系功能多样性数据集中的至少一个S110;接收关于受试者群体的至少一个子集的梭菌相关病症的信息的补充数据集S120;和执行表征过程,该表征过程得自补充数据集和从微生物群系组成数据集和微生物群系功能多样性数据集中的至少一个提取的特征S130。方法100可以另外或可替代地包括:确定用于预防、改善和/或以其他方式改变梭菌相关病症的疗法S140;处理来自受试者的生物样品S150;利用表征过程基于处理源自受试者的生物样品的微生物群系数据集(例如,微生物群系组成数据集、微生物群系功能多样性数据集等)确定对受试者的表征S160;基于表征和治疗模型促进对受试者的治疗S170;基于处理生物样品以在与益生菌疗法相关联的一组时间点评估受试者的微生物群系组成和/或功能特征S180来监测对受试者的治疗的有效性;和/或任何其他合适的操作。
[0040] 框S110记载:基于处理与受试者群体相关联的生物样品来生成微生物群系成组数据集和微生物群系功能多样性数据集中的至少一个。框S110用于处理生物样品的集合中的每个生物样品,以确定与每个受试者群体的微生物群系相关的组成方面和/或功能方面。组成方面和功能方面可以包括微生物水平的组成方面,包括与界、、纲、目、科、属、种、亚种、株系和/或任何其它合适的种下分类组(例如,如在每组的总丰度、每组的相对丰度、示出的组的总数等中所测量的)的微生物分布相关的参数。组成方面和功能方面也可以用操作分类单位(OTU)表示。组成方面和功能方面可以另外或可替选地包括遗传水平的组成方面(例如,通过多位点序列分型、16S rRNA序列、18S rRNA序列、ITS序列、其它遗传标志物、其它系统发育标志物等确定的区域)。组成方面和功能方面可以包括存在或不存在与特定功能(例如,酶活性、转运功能、免疫活性等)相关的基因或所述基因的量。因此,可以使用框S110的输出来为框S130的表征过程和/或框S140的治疗过程提供目标特征,其中所述特征可以是基于微生物的(例如,存在细菌属)、基于遗传的(例如,基于特定遗传区域和/或序列的表示)、基于功能的(例如,存在特定催化活性)和/或以其它方式配置的。
[0041] 在一个变型中,框S110可以包括基于来源于细菌和/或古细菌的系统发育标志物进行评估和/或处理,所述系统发育标志物与和以下中的一种或更多种有关的基因家族相关:核糖体蛋白S2、核糖体蛋白S3、核糖体蛋白S5、核糖体蛋白S7、核糖体蛋白S8、核糖体蛋白S9、核糖体蛋白S10、核糖体蛋白S11、核糖体蛋白S12/S23、核糖体蛋白S13、核糖体蛋白S15P/S13e、核糖体蛋白S17、核糖体蛋白S19、核糖体蛋白L1、核糖体蛋白L2、核糖体蛋白L3、核糖体蛋白L4/L1e、核糖体蛋白L5、核糖体蛋白L6、核糖体蛋白L10、核糖体蛋白LI1、核糖体蛋白L13、核糖体蛋白L14b/L23e、核糖体蛋白L15、核糖体蛋白L16/L10E、核糖体蛋白质L18P/L5E、核糖体蛋白L22、核糖体蛋白L24、核糖体蛋白L25/L23、核糖体蛋白L29、翻译延伸因子EF-2、翻译起始因子IF-2、金属内肽酶、ffh信号识别颗粒蛋白、苯丙酰基-tRNA合成酶β亚基、苯丙氨酰基-tRNA合成酶α亚基、tRNA假尿苷合酶B、胆色素原脱氨酶、磷酸核糖基甲酰基甘氨酰脒环连接酶和核糖核酸酶HII。然而,所述标志物可以包括任何其它合适的标志物。
[0042] 因此,对于框S110,表征生物样品集合中的每一个的微生物群系组成和/或功能特征优选地包括样品处理技术(例如,湿式实验室技术)和计算技术(例如,利用生物信息学工具)的组合来定量地和/或定性地表征与来自受试者或受试者群体的每个生物样品相关的微生物群系和功能特征。在一些变型中,框S110中的样品处理可以包括以下项中的任意一种或更多种:裂解生物样品、破坏生物样品的细胞膜、从生物样品中分离非期望的组分(例如,RNA、蛋白质)、纯化生物样品中的核酸(例如,DNA)、扩增(例如,利用文库制备系统)来自生物样品的核酸、进一步纯化生物样品的扩增的核酸以及对生物样品的扩增的核酸进行测序(利用测序系统),和/或其它合适的样品处理操作。
[0043] 在框S110的一些变型中,裂解生物样品和/或破坏生物样品的细胞膜优选地包括物理方法(例如,珠磨、氮压、均质化、超声处理),其省略了测序时对某些细菌组的显示产生偏好的试剂。另外或可替选地,在框S110中的裂解或破坏可涉及化学方法(例如,使用去污剂、使用溶剂、使用表面活性剂等)。另外或可替选地,在框S110中裂解或破坏可涉及生物学方法。在一些变型中,分离非期望的组分可以包括使用RNA酶去除RNA和/或使用蛋白酶去除蛋白质。在一些变型中,核酸的纯化可以包括以下项中的一种或更多种:从生物样品中沉淀核酸(例如,使用基于醇的沉淀方法)、液-液基纯化技术(例如,酚-氯仿提取)、基于层析的纯化技术(例如,柱吸附)、涉及使用结合部分-结合颗粒(例如,磁珠浮力珠、具有大小分布的珠、超声响应珠等)的纯化技术以及任何其它合适的纯化技术,所述结合部分-结合颗粒被配置成结合核酸并被配置为在存在洗脱环境(例如,具有洗脱溶液,提供pH改变、提供温度变化等)的情况下释放核酸。
[0044] 在框S110的一些变型中,对纯化的核酸进行扩增优选地包括进行以下中的一种或更多种:基于聚合酶链式反应(PCR)的技术(例如,固相PCR、RT-PCR、qPCR、多重PCR、降落式PCR、纳米PCR、巢式PCR、热启动PCR等)、解旋酶依赖性扩增(HDA)、环介导的等温扩增(LAMP)、自主序列复制(3SR)、基于核酸序列的扩增(NASBA)、链置换扩增(SDA)、滚环扩增(RCA)、连接酶链式反应(LCR)以及任何其它合适的扩增技术。在扩增经纯化的核酸时,所用的引物优选地被选择为防止或最小化扩增偏差,并且被配置为扩增核酸区域/序列(例如,16S rRNA区域、18S rRNA区域、ITS区域等),其提供分类学、系统发生学、诊断、制剂(例如,益生菌制剂)方面的信息和/或用于任何其它合适的目的。因此,可以在扩增中使用被配置为避免扩增偏差的通用引物(例如,用于16S rRNA的F27-R338引物集、用于16S rRNA的F515-R806引物集等)。在框S110的一些变型中使用的引物可以另外或可替选地包括对每个生物样品特异的集成条形码序列,其可以便于在扩增后鉴定生物样品。用于框S110的一些变型中的引物可以另外或可替选地包括接头区域,该接头区域被配置成与涉及互补接头的测序技术(例如,Illumina测序)配合。可替选地或另外地,框S110可以实施被配置为促进处理(例如,使用Nextera试剂盒)的任何其他步骤。
[0045] 在框S110的一些变型中,对经纯化的核酸进行测序可以包括涉及靶向扩增子测序和/或宏基因组测序的方法,实施包括以下项一种或更多种技术在内的技术:边合成边测序技术(例如,Illumina测序)、毛细管测序技术(例如,Sanger测序)、焦磷酸测序技术、纳米孔测序技术(例如,使用津纳米孔技术)或任何其它合适的测序技术。
[0046] 在框S110的一个具体实施例中,对来自生物样品集中的生物样品的核酸的进行扩增和测序包括:固相PCR,其涉及在具有寡聚接头的基底上桥接扩增生物样品的DNA片段,其中扩增涉及具有以下序列的引物:正向索引序列(例如,对应于miSeq/NextSeq/HiSeq平台的Illumina正向索引)、正向条形码序列、转座酶序列(例如,对应于MiSeq/NextSeq/HiSeq平台的转座酶结合位点)、接头(例如,被配置为降低同质性和改善序列结果的零基、一个碱基或两个碱基的片段)、其它随机碱基、用于靶向特定靶区域(例如,16S rRNA区域、18S rRNA区域、ITS区域)的序列、反向索引序列(例如,对应于MiSeq/NextSeq/HiSeq平台的Illumina反向索引)和反向条形码序列。在具体的实施例中,测序包括使用边测序边合成技术的Illumina测序(例如,使用HiSeq平台、使用MiSeq平台、使用NextSeq平台等)。
[0047] 框S110中的样品处理的一些变型可以包括在测序之前进一步纯化扩增的核酸(例如,PCR产物),其用于去除多余的扩增组分(例如,引物、dNTP、酶、盐等)。在一些实施例中,可以使用以下中的任何一种或更多种来促进额外的纯化:纯化试剂盒、缓冲剂、醇、pH指示剂、离液序列高的盐、核酸结合过滤器、离心以及任何其它合适的纯化技术。
[0048] 在一些变型中,框S110中的计算处理可以包括以下项中的任意一项或更多项:鉴定微生物群系来源的序列(例如,与受试者序列和污染物相对);对微生物群系来源的序列进行比对和/或映射(例如,使用单末端比对、无空位比对、有空位比对、配对中的一个或更多个对片段化的序列进行比对),以及生成特征,所述特征来源于与生物样品相关的微生物群系的组成方面和/或功能方面。
[0049] 在框S110中,鉴定微生物群系来源的序列可以包括将来自样品处理的序列数据映射到受试者参考基因组(例如,由参考基因组联盟提供),以去除受试者基因组来源的序列。然后基于序列相似性和/或基于参考的方法(例如,使用VAMPS、使用MG-RAST、使用QIIME数据库),可以将在将序列数据映射至受试者参考基因组之后剩余的未被鉴定的序列进一步聚类为操作分类单位(OTU),使用比对算法(例如,基础局部比对搜索工具、FPGA加速比对工具、使用BWA的BWT索引、使用SOAP的BWT索引、使用Bowtie的BWT索引等)进行比对(例如,使用基因组散列方法、使用Needleman-Wunsch算法、使用Smith-Waterman算法),并映射到参考细菌基因组(例如,由美国国家生物技术信息中心提供)。未被鉴定的序列的映射可以另外或可替选地包括映射至参考古细菌基因组、病毒基因组和/或真核生物基因组。此外,可以与现有数据库相关地和/或与自定义生成的数据库相关地进行分类单位的映射。在一个实施例中,框S110可以包括确定微生物核酸序列与和艰难梭菌病症相关的参考序列之间的比对,其中基于该比对生成微生物群系组成数据集和微生物群系功能多样性数据集。
[0050] 在框S110中,在鉴定与生物样品相关联的微生物群系的微生物的所示出群组后,可以执行源自与生物样品相关联的微生物群系的组成方面和功能方面的特征的生成。另外或可替选地,生成的特征可以包括生成描述存在或不存在微生物的某些分类组和/或微生物的所表现出的分类组之间的比例的特征。另外或可替代地,生成特征可以包括生成描述以下中的一项或更多项的特征:示出的分类组的数量、示出的分类组的网络、示出的不同分类组的相关性、不同分类组之间的相互作用、由不同分类组产生的产物、由不同分类组产生的产物之间的相互作用、死亡的微生物和活的微生物之间的比率(例如,对于不同的所示出的分类组,基于RNA的分析)、系统发育距离(例如,依据Kantorovich-Rubinstein距离、Wasserstein距离等)、任何其它合适的与分类组相关的特征、任何其它合适的遗传特征或功能特征。
[0051] 关于框S110,另外或可替选地,生成特征可以包括例如使用sparCC方法、使用基因组相对丰度和平均大小(GAAS)方法和/或使用基因组相对丰度使用混合模型理论(GRAMM)方法来生成描述不同微生物组的相对丰度的特征,其中GRAMM方法使用序列相似性数据来进行一组或更多组微生物相对丰度的最大可能性评估。另外或可替选地,生成特征可以包括生成如源自丰度度量的分类变化的统计学量度。另外或可替选地,生成特征可以包括生成源自相对丰度因子(例如,与分类单位的丰度变化相关,该分类单位的丰度变化影响其它分类单位的丰度)的特征。另外或可替选地,生成特征可以包括单独和/或组合地生成描述一个或更多个分类组的存在的定性特征。另外或可替选地,生成特征可以包括生成与遗传标志物(例如,代表性16S rRNA、18S rRNA和/或ITS序列)相关的特征,所述遗传标志物表征与生物样品相关的微生物群系的微生物。另外或可替选地,生成特征可以包括生成与特定基因和/或具有特定基因的生物体的功能关联相关的特征。另外或可替选地,生成特征可以包括生成与分类单位的致病性和/或归属于分类单位的产物相关的特征。然而,框S120可包括生成源自对生物样品的核酸的测序和映射的任何其它合适的特征。例如,该一个或更多个特征可以是组合性的(例如,涉及成对体、三联体)、相关的(例如,与不同特征之间的相关性有关)、和/或与特征的变化有关(即,时间变化、样品位点的变化、空间变化等)。然而,框S110可以以任何合适的方式实施,一些实施例、变型及其实施例描述于:于2015年1月9日提交的美国申请No.14/593,424、于2015年6月30日提交的美国申请No.15/198,818、于2016年4月13日提交的美国请No.15/098,027、于2016年4月13日提交的美国申请No.15/098,248、于2016年4月13日提交的美国申请15/098,236、于2016年4月13日提交的美国申请15/098,
222、于2016年4月13日提交的美国申请No.15/098,204、于2016年4月13日提交的美国申请No.15/098,174、于2016年4月13日提交的美国申请No.15/098,110、于2016年4月13日提交的美国申请No.15/098,081、于2016年4月13日提交的美国申请No.15/098,153、于2016年8月4日提交的美国申请No.15/228,890、于2016年8月18日提交的美国申请No.15/240,919,这些美国申请分别通过引用整体并入本文。
[0052] 框S120记载:接收提供关于受试者群体的至少一个子集的艰难梭菌相关病症相关的补充数据集。框S120用于获取与该组受试者中的一个或更多个受试者相关的附加数据,其可用于训练(train)和/或验证在框S130中生成的表征过程。在框S120中,补充数据集优选地包括来源于调查的数据,但是可以另外或可替选地包括以下项中的任意一个或更多个:源自传感器的全方位数据、医学数据(例如,当前和历史医学数据)以及任何其它合适类型的数据。在包括接收来源于调查的数据的框S120的一些变型中,来源于调查的数据优选地提供与受试者相关的生理信息、人口统计学信息和行为信息。生理信息可以包括与生理特征(例如,身高、体重、体质指数、体脂百分比、体毛水平等)相关的信息。人口统计学信息可以包括与人口统计学特征(例如,性别、年龄、种族、婚姻状态、兄弟姐妹的数量、社会经济状态、性取向等)相关的信息。行为信息可以包括与以下中的一项或更多项有关的信息:健康状况(例如,健康状态和疾病状态)、生活情形(例如,独居、与宠物一起生活、与重要他人一起生活、与孩子一起生活等)、饮食习惯(例如,杂食、素食、严格素食、糖消耗、酸消耗等)、行为倾向(例如,身体活动水平、药物使用、酒精使用等)、不同的移动水平(例如,与在给定时间段内行进的距离有关)、不同水平的性活动(例如,与伴侣的数量和性取向相关)以及任何其它合适的行为信息。来源于调查的数据可以包括定量数据和/或可以被转化为定量数据的定性数据(例如,使用严重程度量表、将定性反应映射到量化分数等)和/或其它合适的数据。
[0053] 为了便于接收来源于调查的数据,框S120可以包括向受试者群体中的受试者或与受试者群体中的受试者相关的实体提供一项或更多项调查。调查可以亲自提供(例如,与样品提供和由受试者接待相配合)、电子地提供(例如,在受试者账户设置期间、在受试者的电子设备上执行应用期间、在通过互联网连接可访问的Web应用等),和/或以任何其它合适的方式提供。
[0054] 对于框S120,另外或可替选地,补充数据集的部分可以获自与受试者相关的传感器(例如,可佩戴式计算设备的传感器、移动设备的传感器、与使用者相关的生物度量传感器等)。由此,框S130可以包括接收以下中的一项或更多项:身体活动或身体动作相关数据(例如,来自受试者的移动设备或可穿戴式电子设备的加速度计陀螺仪数据)、环境数据(例如,温度数据、海拔数据、气候数据、光参数数据等)、患者营养或饮食相关数据(例如,来自食物建档记录(food establishment check-ins)的数据、来自分光光度分析等的数据)、生物计量学数据(例如,通过患者的移动计算设备中的传感器记录的数据、通过可穿戴式设备或与患者的移动计算设备相连通的其它外周设备记录的数据)、位置数据(例如,使用GPS元件),以及任何其它合适的数据。另外或可替选地,补充数据集的部分可以源自受试者的医学记录数据和/或临床数据。由此,补充数据集的部分可以源自受试者的一个或更多个电子健康记录(EHR)。另外或可替选地,框S120的补充数据集可以包括任何其它合适的诊断信息(例如,临床诊断信息),其可以与源自特征的分析组合以支持方法100的后续框中的受试者的表征。例如,源自结肠镜、活组织检查、血液测试、诊断影像、调查相关信息的信息以及任何其它合适的检测信息均可用于补充框S120。然而,补充数据集和接收补充数据集可以以任何合适的方式配置。
[0055] 框S130记载:进行源自补充数据集和从微生物群系组成数据集和微生物群系功能多样性数据集中的至少一个中提取的特征的表征过程。框S130用于基于受试者的微生物群系组成和/或功能特征来鉴定可用于表征受试者或组的特征和/或特征组合。另外或可替选地,框S130用于生成表征模型(例如,使用经鉴定的特征)以确定对与艰难梭菌相关的病症的表征。由此,表征过程可以被用作诊断工具,其可以基于受试者的微生物群系组成和/或功能特征与其健康状况状态、行为特征、医疗状况、人口统计学性状和任何其它合适的性状中的一个或更多个相关地表征受试者(例如,就行为特征而言、就医疗状况而言、就人口统计学性状而言)。然后,可以使用这样的表征通过框S140的治疗模型来建议或提供个性化治疗。
[0056] 在进行表征过程中,框S130可以使用计算方法(例如,统计学方法、机器学习方法、人工智能方法、生物信息学方法等)将受试者表征为表现出具有健康状况的受试者组的特征性特征。
[0057] 在框S130的一个变型中,表征可以基于根据特征选择原则(例如,艰难梭菌相关病症选择原则限定微生物群系特征与一个或更多个艰难梭菌相关病症之间的关系)确定的特征。例如,框S130可以包括获得将梭菌相关病症与微生物组成特征的子集和微生物群系功能多样性特征的子集相关联的梭菌(例如,艰难梭菌)相关的特征选择规则集;以及基于针对所述梭菌特征选择规则集评估所述微生物组成数据集和所述微生物群系功能多样性数据集来生成特征集。特征选择规则可以包括以下项中的一个或更多个:统计分析操作的应用(例如,概率分布的分析等)、基于补充数据集的特征选择规则(例如,选择与补充数据集相关的特征,该补充数据集提供关于梭菌相关病症的信息等)、基于处理效率和/或其它处理限制等选择特征的量和/或类型等)、基于准确性的特征选择规则(例如,过滤与梭菌相关病状有关的不相关和/或冗余特征等)、使用者选择的特征选择规则和/或任何其他合适的特征选择规则。例如,特征选择规则可以包括应用统计分析第一组受试者与第二组受试者之间的相似性和/或差异。所述第一组受试者表现出目标状态(例如,健康状况状态);第二组受试者未表现出目标状态(例如,“正常”状态)。在实施该变型时,可以使用Kolmogorov-Smirnov(KS)检验、排列检验、Cramér-von Mises检验以及任何其它统计学检验(例如,t检验、Welch's t检验、z检验、卡方检验、与分布相关的检验等)中的一个或更多个。特别地,可以使用一个或更多个这样的统计学假设检验来评定在如下所述受试者中具有不同丰度的特征集:表现出与目标状态(例如,不良状态)的第一组受试者和未表现目标状态(例如,正常状态)的第二组受试者。更详细而言,可以基于与第一组受试者和第二组受试者相关的丰度百分比和/或任何其它合适的涉及多样性的参数来约束所评定的特征集,以增加或降低表征的置信区间。在该实施例的一个具体实施方式中,特征可以来自细菌分类单位,该细菌分类单位在一定百分比的第一组受试者和第二组受试者中大量存在,其中可以由KS检验来确定第一组受试者与第二组受试者之间分类单位的相对丰度。因此,框S130的输出可以包括示出显著性(例如,p值为0.0013)的归一化的相对丰度值(例如,患病受试者中分类单位的相对丰度比健康受试者高25%)。特征生成的变型可以另外或可替选地实施或者源自功能特征或元数据特征(例如,非细菌标志物)。不同的特征选择规则可针对不同的人口统计学组、受试者、补充数据的类型和/或其他合适的标准而定制(例如,在生成模型中)。例如,框S130可以包括应用第一组特征选择规则来定义第一特征子集以用于生成第一艰难梭菌菌株的第一表征模型,和应用第二组特征选择规则来定义第二特征子集以用于生成第二艰难梭菌菌株的第一表征模型。然而,可以以任何方式应用任何合适的数量和/或类型的特征选择规则来定义一个或更多个特征集合。
[0058] 在执行表征过程中,框S130可以另外或可替选地将来自微生物群系组成数据集和微生物群系功能多样性数据集中的至少一个的输入数据转化成特征向量,其可以在预测受试者群体的表征中测试功效。例如,框S130可以包括基于微生物群系组成特征的子集和微生物群系功能多样性特征的子集来生成一组使用者(例如,受试者群体)的微生物群系特征向量集,并且用该微生物群系特征向量集来训练表征模型。来自补充数据集的数据可用于提供表征组的一个或更多个表征的指示,其中利用候选特征的训练数据集和候选分类来训练表征过程,以鉴定对准确地预测分类具有高度(或低度)预测能力的特征和/或特征组合。由此,利用训练数据集对表征过程的细化使得鉴定出与受试者的特定分类具有高度相关性的特征集(例如,受试者特征、特征的组合)。
[0059] 在框S130的变型中,有效预测表征过程的分类的特征向量可以包括与以下中的一项或更多项有关的特征:微生物群系多样性度量(例如,关于在各分类组中的分布、关于在古细菌组、细菌组、病毒组和/或真核生物组中的分布)、在一者的微生物群系中分类组的存在、在一者的微生物群系中特定遗传序列(例如,16S rRNA序列)的表示、在一者的微生物群系中分类组的相对丰度、微生物群系适应性度量(例如,响应于由补充数据集确定的扰动)、编码具有给定功能的蛋白质或RNA(酶、转运蛋白、来自免疫系统的蛋白质、激素、干扰RNA等)的基因的丰度以及源自微生物群系多样性数据集、微生物群系功能多样性数据集和/或补充数据集的任何其它合适的特征。例如,特征可以包括与胆汁酸代谢相关的功能多样性特征,和/或与拟杆菌(Bacteroidetes)、厚壁菌(Firmicutes)和变形菌(Proteobacteria)的相对丰度相关的组成特征,其中所述特征可以用于生成和/或应用表征模型(例如,用于表征包括脓毒症和结肠炎中的至少一种在内的艰难梭菌核糖体型027菌株感染等)。另外,可以在特征向量中使用特征的组合,其中,可以在提供组合特征作为特征集的一部分时将特征分组和/或衡量权重。例如,一个特征或特征集可以包括在一者的微生物群系中细菌的所示出类别的数目的经衡量权重的复合组成(weighted composite)、在一者的微生物群系中存在特定的细菌属、在一者的微生物群系中示出了特定的16S序列以及第一门的细菌相对于第二门的细菌的相对丰度。然而,特征向量可以另外或可替代地以任何其它合适的方式来确定。
[0060] 在一个变型中,框S130可以包括基于一个或更多个特征(例如,上面描述的)和/或补充数据生成表征模型,但是可以基于任何合适的数据来生成表征模型。例如,框S130可以包括应用特征集(例如,基于梭菌相关病症特征选择规则生成的)与补充数据集以生成艰难梭菌相关病症的表征模型。可针对不同的人口统计学组、个体受试者,补充数据(例如,模型并入源自生物度量传感器数据的特征相对于模型独立于补充数据等)和/或其他合适的标准生成不同的表征模型(例如,表征最近释放的医院患者的梭菌相关病症的第一表征模型、用于抗生素使用者的第二表征模型等)。在一个实施例中,该方法可以包括生成锻炼者的人口统计学组的表征模型;将表征模型与示出身体活动(例如,在由界面显示的数字调查处)的受试者的使用者账户(例如,在处理系统的数据库处)相关联;并检索表征模型(例如,从数据库)以表征受试者。生成适合于不同背景的多个表征模型可以通过如下所述来赋予改进:改进表征准确性(例如,通过调整针对特定受试者的人口统计学和/或情况等的分析)、从数据库中检索适当的表征模型(例如,通过将定制特征模型与特定使用者账户和/或其他标识符相关联)、训练和/或执行表征模型(例如,当将定制模型与潜在的梭菌相关病症特征池的子集相关联时,其中其余特征与特定受试者较不相关)和/或处理系统的其他合适的方面。
[0061] 在框S130中,如图3所示,在框S130的变型的一个实施例中,可以根据随机森林预测(RFP)算法来生成和训练表征过程,该算法将套袋法(bagging)(即,自助集合(bootstrap aggregation))和从训练数据集中选择随机特征集相结合以构建与随机特征集相关的决策树集T。在使用随机森林算法时,随机选取决策树集中的N个样例并进行替换以创建决策树的子集,并且对于每个节点,从全部预测特征中选择m个预测特征用于进行测定。使用在节点处(例如,根据目标函数)提供最佳分叉的预测特征来进行分叉(例如,在节点处分两叉(bifurcation)、在节点处分三叉(trifuracation))。通过从大型数据集中多次取样,在鉴定预测分类中强的特征中表征过程的强度可以大大增加。在该变型中,可以在处理期间包括用于防止偏差(例如,取样偏差)和/或导致偏差量的措施以增加模型的稳健性。另外或可替选地,为了任何合适的目的,可以生成任何数目的表征模型。然而,执行表征过程可以以任何合适的方式执行。
[0062] 4.1方法-艰难梭菌表征
[0063] 在一个实施方式中,框S130的基于统计分析的表征过程可以鉴定与艰难梭菌相关病症具有最高相关性的特征组。在一些应用中,如图7所示,框S130的表征过程可以有助于鉴定哪些微生物群体相对于艰难梭菌活性上调或下调、和/或哪些微生物群系功能方面(例如,相对于COG/KEGG途径)相对于艰难梭菌活性上调或下调。在一个实施例中,与艰难梭菌相关的组成和/或功能多样性可以相对于梭菌属内的其他种来表征。
[0064] 此外,如图8中所示,框S130的表征过程可以包括1)表征存在于样品中的艰难梭菌菌株(例如,核糖体型027、核糖体型002、核糖体型106、核糖体型017、核糖体型078等);和2)在菌株水平上表征艰难梭菌菌株与微生物群体之间的关系和/或功能方面上调/下调(例如,特定艰难梭菌菌株的上调/下调与其他分类组和/或其他菌株的上调/下调相关)。在一个特定的实施例中,方法100可用于鉴定来自受试者的样品中存在的全部艰难梭菌菌株的98%,以及存在的菌株与和来自受试者的样品相关的其它微生物的活性之间的关系(例如,与上调或下调相关、与功能活性相关)。在该特定实施例中,方法100可以鉴定样品中存在的艰难梭菌菌株、样品中的一个或更多个菌株和双歧杆菌群体之间的关系以及与pH和/或丁酸盐/酯调节有关的功能方面。在另一个实施例中,方法100可以包括鉴定特定的艰难梭菌菌株和微生物群系组成特征、功能多样性和/或梭菌相关病症。然而,表征与梭菌菌株有关的方面可以以任何合适的方式进行。
[0065] 在框S130的表征过程的一个变型中,可用于与艰难梭菌相关的表征的特征组包括来源于以下一个或更多个分类组的特征:Flavonifractor plautii(种)、长双歧杆菌(Bifidobacterium longum)(种)、脆弱拟杆菌(Bacteroides fragilis)(种)、两歧双歧杆菌(Bifidobacterium bifidum)(种)、Erysipelatoclostridium ramosum(种)、Parabacteroides distasonis(种)、Bacteroides vulgatus(种)、普拉梭菌(Faecalibacterium prausnitzii)(种)、Blautia sp.YHC-4(种)、Blautia faecis(种)、Bacteroides acidifaciens(种)、产气柯林斯菌(Collinsella aerofaciens)(种)、Anaerostipes caccae(种)、细菌NLAE-zl-P855(种)、多形拟杆菌(Bacteroides thetaiotaomicron)(种)、Bacteroides vulgatus(种)、解木聚糖拟杆菌(Bacteroides xylanisolvens)(种)、沃氏嗜胆菌(Bilophila wadsworthia)(种)、Blautiaproduct(种)、Clostridium clostridioforme(种)、Clostridium hathewayi(种)、无害梭菌(Clostridium innocuum)(种)、共生梭菌(Clostridium symbiosum)(种)、迟缓埃格特菌(Eggerthella  lenta)(种)、大肠杆菌(种)、副流感嗜血杆菌(Haemophilus parainfluenzae)(种)、Intestinibacter bartlettii(种)、Ruminococcus gnavus(种)、Ruminococcus torques(种)、罗氏菌属(Roseburia)(属)、韦荣氏球菌属(Veillonella)(属)、克鲁维菌属(Kluyvera)(属)、八叠球菌属(Sarcina)(属)、Subdoligranulum(属)、双歧杆菌属(Bifidobacterium)(属)、Faecalibacterium(属)、Bilophila(属)、乳杆菌属(Lactobacillus)(属)、优杆菌属(Eubacterium)(属)、Parabacteroides(属)、Akkermansia(属)、Dorea(属)、Bacteroides(属)、Moryella(属)、Anaerotruncus(属)、肠球菌属(Enterococcus)(属)、Eggerthella(属)、Collinsella(属)、厌杆菌属(Anaerobacter)(属)、巨型球菌属(Megasphaera)(属)、Alistipes(属)、Intestinimonas(属)、链球菌属(Streptococcus)(属)、Anaerostipes(属)、Blautia(属)、埃希氏杆菌属-志贺菌属(属)、嗜血杆菌属(Haemophilus)(属)、Hungatella(属)、Intestinibacter(属)、
Lachnoclostridium(属)、Flavonifractor(属)、梭菌属(Clostridium)(属)、Peptoclostridium(属)、假丁酸弧菌属(Pseudobutyrivibrio)(属)、
Erysipelatoclostridium(属)、Ruminococcaceae(科)、肠杆菌(Enterobacteriaceae)(科)、红蝽菌科(Coriobacteriaceae)(科)、乳杆菌科(Lactobacillaceae)(科)、毛螺菌科(Lachnospiraceae)(科)、双歧杆菌科(Bifidobacteriaceae)(科)、优杆菌科(Eubacteriaceae)(科)、疣微菌科(Verrucomicrobiaceae)(科)、拟杆菌科
(Bacteroidaceae)(科)、颤螺旋菌科(Oscillospiraceae)(科)、肠球菌科
(Enterococcaceae)(科)、理研菌科(Rikenellaceae)(科)、慢生根瘤菌科
(Bradyrhizobiaceae)(科)、梭菌科(Clostridiaceae)(科)、Peptostreptococcaceae(科)、韦荣球菌科(Veillonellaceae)(科)、Christensenellaceae(科)、Erysipelotrichaceae(科)、链球菌科(Streptococcaceae)(科)、肠杆菌目(Enterobacteriales)(目)、梭菌目(Clostridiales)(目)、红蝽菌目Coriobacteriales(目)、双歧杆菌目
(Bifidobacteriales)(目)、疣微菌目(Verrucomicrobiales)(目)、Selenomonadales(目)、Erysipelotrichales(目)、乳杆菌目(Lactobacillales)(目)、羧菌纲(Clostridia)(纲)、放线菌纲(Actinobacteria)(纲)、疣微菌纲(Verrucomicrobiae)(纲)、α-变形菌纲(Alphaproteobacteria)(纲)、δ-变形菌纲(Deltaproteobacteria)(纲)、Negativicutes(纲)、Erysipelotrichia(纲)、γ-变形菌纲(Gammaproteobacteria)(纲)、杆菌纲(Bacilli)(纲)、变形菌门(Proteobacteria)(门)、放线菌门(Actinobacteria)(门)、疣微菌门(Verrucomicrobia)(门)以及厚壁菌门(Firmicutes)(门)。
[0066] 另外或可替选地,在框S130中,与艰难梭菌相关病症相关联的特征组可以得自以下一项或更多项:直系同源组(COG)代码簇、源自京都基因和基因组(KEGG)百科全书细胞过程和信号传导途径的特征、源自代谢KEGG途径的特征、源自信号传导分子和相互作用KEGG途径的特征、源自翻译KEGG途径的特征、源自其他离子耦合转运蛋白KEGG途径的特征、源自细菌毒素KEGG途径的特征、源自己内酰胺降解KEGG途径的特征、源自抗坏血酸和杏仁酸代谢KEGG途径的特征、源自无机离子转运和代谢KEGG途径的特征、源自蛋白质SCO1/2 KEGG途径的特征(例如,与蛋白质SCO1/2相关的K07152 KEGG代码)、源自细胞色素KEGG途径的特征(例如、与CYC1、CYT1、petC-泛醇-细胞色素相关的还原酶细胞色素c1亚基相关的K00413 KEGG代码)、源自氮调节KEGG途径的特征(例如,与双组分系统相关的K13599 KEGG代码、NtrC科、氮调节响应调节因子NtrX)、源自作用于成对供体的氧化还原酶、并入或减少分子氧KEGG途径(例如,与双酚降解、多环芳降解、氨基苯甲酸降解、柠檬烯和蒎烯降解、芪类、二芳基庚烷和姜醇生物合成相关的K00517 KEGG代码)的特征、源自推定的膜蛋白KEGG途径的特征(例如,与推定膜蛋白相关的K08973 KEGG代码)、源自UQCRFS1/RIP1/petA KEGG途径的特征(例如,与泛醇-细胞色素c还原酶硫亚基[EC 1.10.2.2]相关的K00411KEGG代码)、源自CYTB/petB KEGG途径的特征(例如,与CYTB、petB、泛醌-细胞色素c还原酶细胞色素b亚基相关的KEGG K00412代码)、源自cobS KEGG途径的特征(例如,与钴化酶CobS[EC 6.6.1.2]相关的KEGG K09882代码)和K07018 KEGG途径来源的特征(例如与,未表征的蛋白质相关的特征)。在一个实施例中,特征可以包括与磷酸戊糖途径,糖异生和固定中的至少一项相关的KEGG功能特征。
[0067] 因此,对框S130中的受试者的表征可以包括基于对以上特征中的一个或更多个的特征的检测来描述与基于艰难梭菌的健康状况相关的受试者,其方式是替代方案或补充典型的诊断或表征方法。然而,在具体实施例的变型中,该特征组可以包括可用于受试者的诊断/表征的任何其他合适的特征。另外或可替选地,框S130中的对受试者的表征可以实施使用高假阳性测试和/或高假阴性测试来进一步分析表征过程在支持根据方法100的实施方案生成的分析中的灵敏度。
[0068] 在另一个变型中,在框S130中表征梭菌相关病症可以包括生成梭菌感染和/或相关并发症的诊断性分析(例如,评估感染风险、诊断感染等),所述梭菌感染和/或相关并发症包括如下所述中的任意一种或更多种:艰难梭菌感染(例如,败血症、结肠炎、有毒巨结肠、结肠穿孔、厌氧感染等)、肉毒梭菌感染(例如,肉毒中毒、弛缓性麻痹性疾病等)、产气荚膜梭菌感染(例如,蜂窝组织炎、筋膜炎、气性坏疽、组织坏死、菌血症、气肿性胆囊炎等)、破伤风梭菌(例如,破伤风等)和/或任何其他合适的感染和/或并发症。生成诊断性分析可以基于分类组的相对丰度(例如,基于艰难梭菌核糖体型027菌株的高丰度来诊断艰难梭菌感染;基于分类组的减少的与防止梭菌感染相关的丰度评估增加的感染风险)、功能多样性(例如,基于胆汁酸代谢;基于胆汁酸类型的增加的产生(例如,除虫去氧胆酸抑制梭菌孢子萌发等)评估降低的感染风险和/或任何其他合适的数据。
[0069] 在框S130的另一个变型中,可以基于一个或更多个补充数据集来表征梭菌相关病症。例如,梭菌相关特征选择规则集可以将梭菌感染与源自提供于梭菌相关病症的信息的生物度量传感器数据(例如,指示出现诸如发烧、恶心、腹痛、腹泻等症状的温度数据、心血管数据、血液数据、粪便数据等)的生物度量特征相关联。在另一个实施例中,可以基于与使用者群体相关联的抗生素和/或益生菌方案数据来进行表征过程(例如,生成表征模型),其中特定方案有助于说明与梭菌相关病症相关的微生物群系组成和/或功能多样性。然而,可以以任何合适的方式进行关于梭菌相关病症的表征过程。
[0070] 4.2方法-治疗
[0071] 方法100可以另外或可替选地包括框S140,框S140记载:确定用于预防、改善和/或以其他方式改变梭菌相关病症的治疗。框S140用于鉴定和/或预测疗法(例如,基于益生菌的疗法、基于噬菌体的疗法、基于小分子的疗法、基于粪便物质移植物的疗法等),所述疗法可以将受试者的微生物群系组成特征和/或功能特征转向理想的平衡状态以促进受试者的健康(例如,降低梭菌相关病症的风险、改善梭菌相关病症等)。另外或可替选地,框S140可以包括生成和/或应用用于确定治疗的治疗模型。
[0072] 在框S140中,治疗可以选自包括以下项中的一种或更多种的疗法:益生菌疗法、基于噬菌体的疗法、基于小分子的疗法、基于粪便物质移植物的疗法、认知/行为疗法、身体康复疗法、临床疗法、基于药物的疗法、饮食相关疗法和/或被设计成以任何其它合适的方式操作以促进使用者的健康的任何其它合适的疗法。在基于噬菌体的疗法的具体实施例中,可以使用对受试者中示出的特定细菌(或其它微生物)具有特异性的噬菌体的一个或更多个群体(例如,就集落形成单位而言)下调或以其它方式消除某些细菌的群体。由此,基于噬菌体的疗法可以用于减少受试者中示出的非期望细菌群体的大小。补充地,可以使用基于噬菌体的疗法来增加未被所使用的噬菌体靶向的细菌群体的相对丰度。
[0073] 关于框S140,在益生菌疗法的另一特定实施例中,如图4所示,治疗模型的候选疗法可以进行以下中的一项或更多项:通过提供物理屏障(例如,通过定植抗力)阻断病原体进入上皮细胞、通过刺激杯状细胞诱导形成粘膜屏障、增强受试者上皮细胞之间顶端紧密连接的完整性(例如,通过刺激带状疱疹1的上调、通过防止紧密连接蛋白的再分布)、产生抗微生物因子、刺激抗炎性细胞因子的产生(例如,通过树突细胞的信号传导和调节性T细胞的诱导)、引发免疫应答以及进行调节受试者的微生物群系远离失调状态的任何其它合适的功能。
[0074] 在框S140的一些变型中,治疗模型优选地基于来自大的受试者群体的数据,所述受试者群体可以包括在框S110中微生物群系多样性数据集所来自的受试者群体,其中对暴露于各种治疗措施之前和暴露于各种治疗措施之后的微生物群系组成特征和/或功能特征或状态健康进行了良好的表征。这些数据可用于训练和验证治疗提供模型,以基于不同的微生物群系表征鉴定为受试者提供期望的结果的治疗措施。在一些变型中,支持向量机作为一种监督机器学习算法,可用于生成治疗提供模型。然而,上述任何其它合适的机器学习算法都可以有助于生成治疗提供模型。治疗模型的处理可以类似于表征模型的处理(例如,针对框S130所述),其中可以为了不同的目的(例如,不同的人口统计组、个体、补充数据集等)生成任何数量的治疗模型,与使用者账户和/或其他标识符相关联,和/或以其他方式处理,以针对不同受试者定制治疗确定和/或促进。
[0075] 关于框S140,尽管与以上框的进行相关地描述了统计学分析和机器学习的一些方法,但是方法100的变型可以另外或可替选地利用任何其它合适的算法来进行表征过程。在一些变型中,可以通过学习方式来表征算法,所述学习方式包括以下项中的任意一个或更多个:监督学习(例如,使用逻辑回归、使用反向传播神经网络)、无监督学习(例如,使用Apriori算法、使用K-均值聚类)、半监督学习强化学习(例如,使用Q-学习算法、使用时间差异学习)以及任何其它合适的学习方式。此外,该算法可以实施以下中的任意一个或更多个:回归算法(例如,普通最小二乘法、逻辑回归、逐步回归、多变量自适应回归样条、本地散点平滑估计等)、基于实例的方法(例如,k-最近邻、学习向量量化、自组织映射等)、正则化方法(例如,脊(ridge)回归、最小绝对收缩和选择算子、弹性网络等)、决策树学习方法(例如,分类和回归树、迭代二分法3、C4.5、卡方自动交互检测、决策树桩、随机森林、多元自适应回归样条、梯度提升机(gradient boosting machines)等)、贝叶斯方法(例如,朴素贝叶斯、平均单依赖估计、贝叶斯信念网络等)、核方法(例如,支持向量机、径向基函数、线性区分分析等)、聚类方法(例如,k-均值聚类、期望最大化等)、关联的规则学习算法(例如,Apriori算法、Eclat算法等)、人工神经网络模型(例如,感知器方法、反向传播方法、Hopfield网络方法、自组织映射方法、学习向量量化方法等)、深度学习算法(例如,受限波尔兹曼机器、深信念网络方法、卷积网络方法、堆叠自编码器方法等)、维数约简法(例如,主分量分析、偏最小二乘回归、Sammon映射、多维尺度变换(multidimensional scaling)、投影寻踪等)、集成方法(例如,提升、自助聚合、AdaBoost、堆叠泛化(stacked generalization)、梯度提升机器方法、随机森林方法等)以及任何适当形式的算法。
[0076] 另外或可替选地,在框S140中,如由被鉴定为处于良好健康状况的受试者群体中的受试者所评定的,可以与鉴定“正常”或基线微生物群系组成特征和/或功能特征相关地得到治疗模型。一旦鉴定了被表征为处于良好健康状态的受试者群体中的受试者子集(例如,使用表征过程的特征),可以在框S140中生成朝向处于良好健康状态的受试者的微生物群系组成特征和/或功能特征来调节微生物群系组成特征和/或功能特征的疗法。因此,框S140可以包括鉴定一种或更多种基线微生物群系组成特征和/或功能特征(例如,用于人口统计学集中的每一个的一种基线微生物群系)和潜在的治疗制剂和治疗方案,所述潜在的治疗制剂和治疗方案可以使处于生态失调状态的受试者的微生物群系转向所鉴定的基线微生物群系组成和/或功能特征之一。然而,治疗模型可以以任何其它合适的方式生成和/或细化。
[0077] 关于框S140,与治疗模型相关的益生菌疗法相关的微生物群系组成优选地包括可培养微生物(例如,能够扩增以提供可扩展治疗)和非致死微生物(例如,在期望的治疗剂量下非致死)。此外,微生物群系组成可以包括对受试者的微生物群系具有急性或缓和作用的单一类型的微生物。另外或可替代地,微生物群系组成可以包括多种类型的微生物的平衡组合,所述多种微生物被配置成彼此协作以朝向理想的状态驱动受试者的微生物群系。例如,益生菌治疗中多种类型细菌的组合可以包括第一种细菌类型,其产生由第二种细菌类型使用的产物,所述第二种细菌类型具有积极影响受试者的微生物群系的作用。另外或可替代地,益生菌治疗中的多种类型的细菌的组合可以包括数种细菌类型,所述数种细菌类型产生具有积极影响受试者的微生物群系的相同功能的蛋白质。
[0078] 关于框S140,益生菌组合物可以是天然来源的或合成来源的。
[0079] 例如,在一个应用中,益生菌组合物可以天然地来源于粪便物质或其它生物物质(例如,具有基线微生物群系组成和/或功能特征的一个或更多个受试者的益生菌组合物,如使用表征过程和治疗模型鉴定的)。另外或可替代地,基于基线微生物群系组成和/或功能特征,益生菌组合物可以是合成地获得的(例如,使用台式法(bentop method)得到),如使用表征过程和治疗模型鉴定的。在一些变型中,可以用于益生菌疗法的微生物剂可以包括以下项中的一种或更多种:酵母(例如,布拉酵母菌(Saccharomyces boulardii))、革兰氏阴性菌(例如,E.coli Nissle)、革兰氏阳性菌(例如,鼠李糖乳杆菌、嗜酸乳杆菌、干酪乳杆菌、瑞士乳杆菌、植物乳杆菌、发酵乳杆菌、唾液乳杆菌、德氏乳杆菌(包括bulgaricus亚种)、约氏乳杆菌、罗伊氏乳杆菌、加氏乳杆菌、短乳杆菌(包括亚种coagulans)、动物双歧杆菌(包括lactis亚种)、长双歧杆菌(包括infantis亚种)、两歧双歧杆菌、假双歧杆菌、嗜热双歧杆菌、短双歧杆菌、嗜热链球菌、蜡状芽孢杆菌、枯草芽孢杆菌、聚酵素芽孢杆菌、克劳氏芽孢杆菌、地衣芽孢杆菌、凝结芽孢杆菌、短小芽孢杆菌(Bacillus pumilus)、短短芽孢杆菌、乳酸乳球菌、肠膜明串珠菌、屎肠球菌、粪肠球菌、耐久肠球菌、丁酸梭菌、费氏丙酸杆菌(Propionibacterium freudenreichii)、菊糖芽孢杆菌、Sporolactobacillus vineae、普拉梭菌(Faecalibacterium prausnitzii)、Prevotella bryantii、乳酸片球菌、戊糖片球菌、Akkermansia muciniphila等),和/或任何其它合适类型的微生物剂。
[0080] 对于框S140,在益生菌疗法的一些实施例中,益生菌组合物可以包括一个或更多个所鉴定的微生物分类单位的组分(例如,如上文第4.1节所述,以100万至100亿CFU的剂量提供,如由所述治疗模型所确定的,所述治疗模型预测受试者的微生物群系响应于所述疗法的积极调整。另外或可替选地,所述治疗可以包括由在没有特定病症的受试者的微生物群系组成中的功能性存在而得到的蛋白质的剂量。在实施例中,可以根据针对受试者的生理学(例如,体质指数、体重、身高)、人口统计学(例如,性别、年龄)、生态失调严重程度、对药物的敏感性以及任何其他合适的因素中的一个或更多个调整的方案指导受试者摄入含益生菌制剂的胶囊。
[0081] 此外,关于艰难梭菌表征和/或艰难梭菌菌株表征,框S140可以包括基于一种或更多种分析确定疗法(例如,益生菌疗法、基于噬菌体的疗法、抗生素疗法、粪便移植治疗等),所述疗法可以用于有利地调节受试者的微生物群系组成和/或与改善受试者的艰难梭菌相关病症有关的功能方面。具体而言,框S140可以包括为受试者下调和/或完全消除艰难梭菌群体而鉴定、开处方和/或提供疗法,同时不以任何其他方式对受试者的微生物群系产生不利影响(例如,关于微生物群体、关于功能方面等)。在一个实施例中,治疗可以包括推荐和/或控制用于施用药物(例如,抗生素、类固醇、血压支持物等)的中央静脉导管和/或用于改善败血症症状的流体,但是可以与治疗基于梭菌的败血症相关地促进任何合适的治疗。在另一个实施例中,治疗可以包括推荐和/或以其他方式辅助药物方案、外科手术(例如,结肠切除术等)和/或用于治疗基于梭菌的结肠炎的其他合适的疗法。在另一个实例中,治疗可以包括抗生素和/或益生菌方案以有助于适用于防御或预防梭菌感染的微生物群系组成,例如包含较小比例的拟杆菌和厚壁菌以及较高比例的变形菌(例如相对于其他使用者、相对于其他使用者组、相对于平均值和/或其他统计数据等)的微生物群系组成。另外或可替选地,治疗可以用于促进特定分类组的任何合适的相对丰度和/或任何合适的微生物群系组成。在另一个实施例中,治疗可以包括安排与护理提供者的预约(例如,响应于梭菌感染风险超过阈值,例如基于微生物群系功能多样性和指示与增加的风险相关的生活方式选择的补充数据集;响应于诊断梭菌感染等)。然而,框S140可以以任何合适的方式执行。
[0082] 4.3方法-个性化
[0083] 另外或可替选地,该方法可以包括框S150,框S150记载:处理来自受试者的生物样品,其用于接收和处理生物样品以促进生成针对受试者的微生物群系数据集,该微生物群系数据集可用于得到用于表征过程的输入。这样,接收、处理和分析生物样品优选地有助于生成用于受试者的微生物群系数据集,该微生物群系数据集可用于得到用于表征过程的输入。在框S150中,优选以非侵入性方式从受试者和/或受试者的环境产生生物样品。在一些变型中,样品接收的非侵入性方式可以使用以下中的任何一种或更多种:可渗透基底(例如,被配置为擦拭受试者身体区域的拭子、卫生纸、海绵等)、不可渗透的基底(例如,载玻片、条带等)、被配置为接收来自受试者的身体区域的样品的容器(例如,小瓶、管、袋等),以及任何其他合适的样品接收元件。在一个特定实施例中,可以以非侵入性方式(例如,使用拭子和小瓶)从受试者的鼻子、皮肤、生殖器、口腔和肠中的一个或更多个中收集生物样品。然而,另外或可替选地,可以以半侵入性方式或侵入性方式接收生物样品。在一些变型中,样品接收的侵入性方式可以使用以下中的任何一个或更多个来以半侵入性或侵入性方式收集样品:针、注射器、活组织检查元件、喷枪和任何其他合适的仪器。在一些特定实施例中,样品可以包括血液样品、血浆/血清样品(例如,以使得能够提取无细胞DNA)、组织样品和/或任何其他合适的样品。
[0084] 关于框S150,在上述变型和实施例中,生物样品可以取自受试者的身体,而无需由另一个实体(例如,与受试者相关的看护者、医疗保健专业人员、自动或半自动化样品采集设备等)辅助,或者可以可替选地在另一实体的协助下取自受试者的身体。在一个实施例中,在生物样品取自受试者而在样品提取过程中没有另一个实体辅助的情况下,可以向受试者提供样品试剂盒。在该实施例中,样品试剂盒可以包括用于样品采集的一个或更多个拭子、被配置为接收拭子和/或其他生物采样介质以供存储的一个或更多个容器、用于样品提供和使用者账户设置的说明书、被配置为将样品与受试者(例如,条形码标识符、标签等)相关联的元件以及允许来自受试者的样品被传送到样品处理操作(例如通过邮件传送系统)的接收器。在另一个实施例中,在另一个实体的帮助下从受试者中提取生物样品的情况下,可以在临床或研究背景下从受试者收集一个或更多个样品(例如,在临床预约期间)。然而,可以以任何其他合适的方式从受试者接收生物样品。
[0085] 此外,在框S150中,处理和分析来自受试者的生物样品优选地以与上文关于框S110所述的样品接收的实施方案、变型和/或实施例之一相似的方式执行。这样,可以使用与用于接收和处理用于生成方法100的表征过程和/或治疗模型的生物样品相似的过程来进行受试者执行框S150中的生物样品的接收和处理,以便提供过程的一致性。然而,框S150中的生物样品接收和处理可以可替选地以任何其他合适的方式执行。
[0086] 另外或可替选地,方法100可以包括框S160,框S160记载:利用表征过程,基于处理源自受试者的生物样品的微生物群系数据集(例如,微生物群系组成数据集、微生物群系功能多样性数据集等)来确定对受试者的表征。框S160用于从受试者的微生物群系来源的数据中提取特征,并将所述特征用作在上述框S130中描述的表征过程(例如,表征模型)的实施方案、变型或实施例的输入。因此,确定框S160中的表征优选地包括鉴定与受试者的微生物群系组成和/或受试者的功能特征相关联的特征和/或特征的组合,将所述特征输入到表征化过程中,并且接收表征受试者属于以下一项或更多项的输出:行为组、性别组、饮食组、疾病状态组和能够通过表征过程鉴定的任何其他合适的组。框S160可以进一步包括生成和/或输出与对受试者的表征相关联的置信度度量。例如,可以从用于生成表征的特征的数量、用于生成表征的特征的相对权重或排名、表征过程中的偏好的度量和/或与表征过程方面相关联的任何其它合适的参数得到置信度度量。
[0087] 在框S160的一些变型中,可以用来自受试者的调查得出和/或医疗历史得出特征来补充从受试者的微生物群系数据集中提取的特征,所述特征可以用于进一步细化框S130的表征过程。然而,受试者的微生物群系数据集可以另外或可替选地以任何其他合适的方式使用以增强方法100的模型。在一个变型中,框S160可以包括生成基于特征选择规则(例如,梭菌相关病症特征选择规则)选择的特征的值,并使用这些值来表征受试者。这样的过程可以通过基于特征选择规则仅提取特征组(例如,微生物群系组成特征、微生物群系功能多样性特征等)的子集(例如,用于确定在训练相应的表征模型中使用的特征的子集)而非生成特征组的每个特征来改进特征提取过程速度。然而,可以以任何合适的方式执行确定受试者的表征。
[0088] 另外或可替选地,方法100可以包括框S170,框S170记载:基于表征模型和治疗模型促进对受试者的治疗(例如,在框S140中确定),所述表征和治疗模型用于为受试者推荐或提供个性化治疗,以便将受试者的微生物群系组成和/或功能特征转向理想的平衡状态。框S170可以包括根据受试者的微生物群系组成和功能特征为受试者提供定制治疗,如图5所示,其中定制治疗是微生物制剂,该微生物制剂被配置为矫正具有所鉴定表征的受试者的生态失调特征。如此,框S140的输出可用于基于经训练的治疗模型直接为受试者促进定制的治疗制剂和方案(例如剂量、使用说明)。另外或可替选地,治疗提供可以包括推荐被配置成使微生物群系组成和/或功能特征转向期望的状态的可用治疗措施。在一些变型中,可用的治疗措施可以包括以下项中的以下中的一项或更多项:消耗品(例如,食品、饮用品等)、局部疗法(例如,洗剂、软膏防腐剂等)、营养补充剂(例如,维生素、矿物质、纤维脂肪酸、氨基酸、益生元等)、药物、抗生素、噬菌体、粪便物质移植物以及任何其它合适的治疗措施。例如,根据治疗模型的输出,市售益生菌补充剂的组合可以包括用于受试者的合适的益生菌治疗。
[0089] 另外或可选地,在一个特定实施例中,框S170的治疗可包括基于噬菌体的治疗。更详细地,可以使用对受试者中示出的特定细菌(或其他微生物)具有特异性的噬菌体的一个或更多个群体(例如,就集落形成单位而言)来下调或以其他方式消除某些细菌的群体。这样,可以使用基于噬菌体的疗法来减小受试者中示出的非期望的细菌群体的大小。补充地,基于噬菌体的疗法可用于增加未被所用噬菌体靶向的细菌群体的相对丰度。
[0090] 框S170中的治疗提供可以包括向受试者提供关于推荐的治疗和/或其他形式的治疗的通知。可以通过执行应用的电子设备(例如,个人计算机、移动设备、平板电脑、头戴式可佩戴计算设备、手腕式可佩戴计算设备等)、web界面和/或被配置成用于通知提供的信息传送客户端(messaging client)向个体提供通知。在一个实施例中,与受试者相关的个人计算机或平板电脑的web界面可以提供受试者对受试者的使用者账户的访问,其中使用者账户包括关于受试者的表征的信息、受试者的微生物群系方面的详细表征以及关于在框S140和/或S170中生成的建议的治疗措施的通知。在另一个实施例中,在个人电子设备(例如,智能电话、智能手表、头戴式智能设备)上执行的应用可以被配置为提供关于由框S170的治疗模型生成的治疗建议的通知(例如,在显示器、以触觉、以听觉方式等)。另外或可替代地,可以直接通过与受试者相关的实体(例如,护理人员、配偶、重要他人、专业医护人员等)提供通知和/或益生菌治疗。在一些进一步的变型中,另外或可替代地,通知可以提供给与受试者相关的实体(例如,医疗保健专业人员),其中该实体能够施用治疗措施(例如,通过处方、通过进行治疗讨论(therapeutic session)等)。但是,通知可以以任何其它合适的方式为受试者提供治疗施用。
[0091] 在框S170中促进治疗可以包括控制治疗系统(例如,通信系统、可在使用者设备上执行的应用、医疗设备、使用者设备等)以有助于治疗的促进。控制治疗系统可以包括生成用于治疗系统的控制指令(例如,在处理系统处),和基于控制指令来操作治疗系统(例如,通过将控制指令传输至治疗系统来执行)。在一个实施例中,促进治疗可以包括控制消耗品的管理系统(例如,自动药物匣盒(pillbox)、益生菌管理系统)以根据方案分配消耗品(例如,通过在管理系统处安排方案提醒;提示受试者服用特定的消耗品;等等)。然而,促进治疗可以以任何合适的方式进行。
[0092] 在一些变型中,另外或可替选地,方法100可以包括框S180,框S180记载:在与益生菌疗法相关的一组时间点,基于处理生物样品来评定受试者的微生物群系组成和/或功能特征从而监测针对受试者的治疗的有效。框S180用于收集关于具有给定特征的受试者的治疗模型所建议的益生菌疗法的正面效果、负面效果和/或缺乏有效性的附加数据,其中附加数据可以用于例如生成和/或更新一个或更多个表征模型、治疗模型和/或其他合适的模型。因此,在由治疗模型所促进的治疗过程期间(例如,通过在整个治疗过程中通过接收和分析来自受试者的生物样品、通过在整个治疗过程中接收来自受试者的调查得出的数据)监测受试者因此可用于生成为由框S130的表征过程提供的每个特征以及在框S140和S170中提供的每个推荐的治疗措施生成治疗-有效性模型。
[0093] 在框S180中,可以提示受试者在并入治疗的治疗方案的一个或更多个关键时间点提供另外的生物样品,并且可以处理和分析另外的生物样品(例如,以类似于关于框S120所描述的方式)来生成表征受试者的微生物群系成组成和/或功能特征的调节的量度。例如,涉及以下一项或更多项的度量:在较早时间点在受试者的微生物群系中示出的一个或更多个分类组的相对丰度的变化、受试者的微生物群系的特定分类组的表示的变化、受试者微生物群系的细菌的第一分类组的丰度与第二分类组的丰度之比、受试者的微生物群系中的一个或更多个功能科的相对丰度的变化以及任何其他合适的度量均可用于由微生物群系成和/或功能特征的变化评定治疗效果。另外或可替选地,可以使用来自受试者的调查得出的数据(与受试者在接受治疗时的经历有关)(例如,经历的副作用、改善的个人评定等)来确定框S180中的治疗的有效性。然而,可以以任何合适的方式执行一种或更多种治疗的监测有效性。
[0094] 然而,方法100可以包括任何其它合适的框或步骤,该框或步骤被配置为促进接收来自受试者的生物样品、处理来自受试者的生物样品、分析从生物样品获得的数据、和生成模型,该模型可用于根据受试者的特定微生物群系组成和/或功能特征提供定制诊断和/或基于益生菌疗法。
[0095] 可以将方法100和/或实施方案的系统至少部分地体现为和/或实施为被配置为接收存储计算机可读指令的计算机可读介质的机器。这些指令可以由与应用、小程序、主机、服务器、网络、网站、通信服务、通信界面、患者计算机或移动设备的硬件/固件/软件元件或其任何合适的组合等集成的计算机可执行组件执行。实施方案的其它系统和方法可以至少部分地体现为和/或被实施为被配置为接收存储计算机可读指令的计算机可读介质的机器。这些指令可以由与上述类型的装置和网络集成的计算机可执行组件来执行。计算机可读介质可以被存储在诸如RAM、ROM、闪存、EEPROM、光学设备(CD或DVD)、硬盘驱动器软盘驱动器或任何合适设备的任何合适的计算机可读介质上。计算机可执行组件可以是处理器,但是任何合适的专用硬件设备可以(可替代地或另外)执行指令。
[0096] 这些图说明了根据优选的实施方案、示例性构造及其变型,系统、方法和计算机程序产品的可能的实现的结构、功能和操作。就这一点而言,流程图或框图中的每个框可以表示模、段、步骤或部分代码,其包括用于实现指定的逻辑功能的一个或更多个可执行的指令。还应当注意,在一些替代实施方式中,框中提及的功能可以不按照图中指出的顺序发生。例如,根据所涉及的功能,连续示出的两个框实际上可以基本上同时执行,或者框有时可以以相反的顺序执行。还将注意到,框图和/或流程图说明中的每个框以及框图和/或流程图中的框的组合可以由执行指定功能或动作的基于专用目的硬件的系统或专用目的硬件和计算机指令的组合来实施。
[0097] 实施方案包括各种系统组件和各种方法过程的每个组合和置换,包括任何变型、实施例和特定实施例。
[0098] 如本领域技术人员将从先前的详细描述以及从附图和权利要求中认识到的,可以对本发明的实施方案进行修改和改变而不脱离如所附权利要求中限定的本发明的范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈