首页 / 专利库 / 疗法 / 连续性肾脏替代治疗 / 基于集成学习的早期死亡风险评估模型建立方法及装置

基于集成学习的早期死亡险评估模型建立方法及装置

阅读:415发布:2020-06-01

专利汇可以提供基于集成学习的早期死亡险评估模型建立方法及装置专利检索,专利查询,专利分析的服务。并且本 申请 提出一种基于 集成学习 的早期死亡 风 险评估模型建立方法及装置,其用于基于老年多器官功能衰竭患者进入 重症监护 室第一天的诊疗数据来评估患者住院期间的死亡风险;其包括数据集构建、 数据处理 、模型的构建和评估;通过获取患者住重症监护室期间第一天的3个人口统计学信息、5个生命体征信息、5个实验室检查指标和2个临床指标;将其输入到风险评估装置中,经过内部的数据预处理、特征计算和模型运算;最终可获得早期预测患者院内发生不良结局风险,辅助医生对患者进行及早干预和 治疗 。,下面是基于集成学习的早期死亡险评估模型建立方法及装置专利的具体信息内容。

1.一种基于集成学习的早期死亡险评估模型建立方法,所述早期死亡风险评估模型用于基于老年多器官功能衰竭患者进入重症监护室第一天的诊疗数据来评估患者住院期间的死亡风险;所述评估模型是XGBoost模型;该方法包括:
构建数据集的步骤;利用数据集构建模,根据临床诊断定义来标识第一数据库中的多器官功能衰竭患者,确定研究人群和研究纳入的四类特征,构成第一数据集;
数据处理的步骤;利用数据处理模块的数据提取与处理单元,在第一数据集中进行数据提取和处理,形成第二数据集,第二数据集分为训练集、验证集和测试集;利用数据处理模块的特征构建单元,对待输入到风险评估模型中的数据进行特征构建,以使其符合风险评估模型的数据输入要求;利用数据处理模块的患者结局标注单元,对患者结局进行标注;
模型的构建和评估步骤;使用XGBoost模型作为早期预测模型进行训练,通过早停机制,采用AUC作为性能评估指标,设定早停轮数,在验证集上测试模型的性能;当模型在验证集上的表现在连续的预定次数迭代性能不再提升则终止训练,获得模型训练的最优参数;
并采用测试集数据评估经训练的模型的预测性能,以防模型过拟合现象发生;
将最终的模型作为早期死亡风险评估模型。
2.如权利要求1所述的基于集成学习的早期死亡风险评估模型建立方法,其特征在于:
所确定的研究纳入的四类特征为:
人口统计学特征,其包括:入院类型、年龄、BMI指数、种族、入重症监护室类型、性别、身高、体重;
生命体征特征,其包括:中心静脉压、舒张压、心率、平均动脉压、呼吸速率、收缩压、休克指数、血饱和度、体温;
实验室检查特征,其包括:白蛋白磷酸酶、谷丙转酶、谷草转氨酶、碱剩余、酸氢盐、胆红素、B型尿钠肽、血尿素氮、氯化物、肌酐、纤维蛋白原、吸入氧浓度、血葡萄糖红细胞压积、血红蛋白、国际标准化比值、乳酸、淋巴细胞、镁、中性粒细胞、动脉血二氧化碳分压、氧合指数、血氧分压、ph值、血小板、、凝血酶原时间、凝血激活酶时间、血钠、肌蛋白、白细胞计数
临床特征,其包括:格拉斯哥评分、全身炎症反应综合征评分、全身性感染相关性器官功能衰竭评分的神经系统及呼吸系统分数、是否进行机械通气、是否进行连续性肾脏替代治疗、总排尿量、去甲肾上腺素使用速率。
3.如权利要求2所述的基于集成学习的早期死亡风险评估模型建立方法,其特征在于:
在数据处理的步骤中包括:
利用数据处理模块的数据提取与处理单元所进行的数据提取与处理包括:数据清洗、数据采样、数据插值;
利用数据处理模块的特征构建单元所进行的特征构建包括:人口统计学特征的原值;
生命体征特征的最大值、最小值、均值;实验室检查特征的最大值、最小值、原值、临床特征的最大值、最小值、均值、总和、原值。
4.如权利要求3所述的基于集成学习的早期死亡风险评估模型建立方法,其特征在于:
在性能评估时,通过内部验证和外部验证两种方式评估模型的性能,性能的衡量指标为AUC、特异性、敏感性、准确性、F1值、鲁棒性、普适性,性能评估的参照标准为基准模型和临床评分;最终的模型可基于特征排名函数获得与死亡关联的风险因素排名。
5.如权利要求4所述的基于集成学习的早期死亡风险评估模型建立方法,其特征在于:
所述基准模型选自:逻辑回归LR、支持向量机SVM、神经网络NN、随机森林RT、朴素贝叶斯NB模型;
所述临床评分选自:津急性疾病严重程度评分(OASIS)、急性生理与慢性健康评分(APACHE-IV)、急性生理评估评分(APSIII)、多器官功能障碍综合征评分(MODS)、全身性感染相关性器官功能衰竭评分(SOFA)、简化急性生理评分(SAPS)、改良早期预警评分(MEWS)、全身炎症反应综合征评分(SIRS)、快速序贯器官衰竭评分(qSOFA)、查尔森合并症指数评分(Charlson Comorbidity)。
6.如权利要求4所述的基于集成学习的早期死亡风险评估模型建立方法,其特征在于:
鲁棒性和普适性通过以下三方面评估:
内部验证:通过所述第二数据集的验证集与测试集,比较AUC、特异性、敏感性、准确性、F1值的变化情况,以获得性能最优模型参数和防止过拟合发生;
外部验证:采用由多中心大样本数据集以同样的数据处理方式获取该数据集对应的第二数据库数据集,比较AUC、特异性、敏感性、准确性、F1值的变化情况,并与内部验证结果相比较;
减少输入特征:通过减少输入最终的模型的特征个数,评估最终的模型在内部验证和外部验证相比于输入全部特征的AUC变化情况,并与临床评分相比较。
7.如权利要求1所述的基于集成学习的早期死亡风险评估模型建立方法,其特征在于:
所述老年多器官功能衰竭患者进入重症监护室第一天的诊疗数据包括:
人口统计学特征:年龄、体重、BMI;
生命体征特征:收缩压最小值、收缩压均值、休克指数最大值、休克指数最小值、呼吸速率均值、血氧饱和度最小值、体温最大值;
实验室检查指标:血尿素氮最小值、血糖最小值、氯化物最大值、血氧分压最大值、白细胞计数最小值;
临床特征:尿量总和、尿量最小值、格拉斯哥评分最大值、格拉斯哥评分均值。
8.一种基于集成学习的早期死亡风险评估装置,其基于老年多器官功能衰竭患者进入重症监护室第一天的诊疗数据来评估患者住院期间的死亡风险;其包括:数据预处理模块、特征计算模块、模型运算模块;
数据预处理模块通过计算机实现;所述数据预处理模块用于对所述诊疗数据进行提取和处理,得到预处理数据;
特征计算模块通过计算机实现;所述特征计算模块用于对所述预处理数据进行特征构建,形成适合输入模型运算模块的数据;
模型运算模块通过计算机实现;所述模型运算模块包括早期死亡风险评估模型,该早期死亡风险评估模型是以XGBoost模型为基础利用数据库中的数据集进行训练、调优和评估后得到的,其性能经过了多中心大样本数据集的有效验证和评估;经过特征构建的数据输入模型运算模块,模型运算模块输出患者住院期间的风险预测结果。
9.如权利要求8所述的基于集成学习的早期死亡风险评估装置,其特征在于:
所述模型运算模块所包含的模型为权利要求1-7中任一项所述的基于集成学习的早期死亡风险评估模型建立方法所建立的早期死亡风险评估模型。
10.如权利要求8所述的基于集成学习的早期死亡风险评估装置,其特征在于:
所述提取和处理包括对所述诊疗数据的清洗、采样、插值。

说明书全文

基于集成学习的早期死亡险评估模型建立方法及装置

技术领域

[0001] 本发明涉及一种死亡风险评估方法和装置,尤其涉及一种基于集成学习的老年多器官功能衰竭早期死亡风险评估模型建立方法和装置。

背景技术

[0002] 多器官功能衰竭(multiple organs dysfunction syndrome,MODS)的特征在于由某种诱因激发,出现了两个或多个器官(器官系统)进行性生理功能障碍。老年多器官功能衰竭(MODSE)是一种起病隐匿、多病因、发病机制复杂、易被临床医师忽视的临床综合症,是老年危重病人死亡的重要原因。据相关文献报道,若发生3个及以上器官功能衰竭,死亡率为50%~100%。同时其治疗和护理费用非常巨额,据统计平均每位患者的医疗花费约2.2万美元,全国每年的总费用支出约167亿美元,给家庭、医院和社会带来的沉重的负担。及早的诊断和及时的干预治疗是降低其病死率的重要途径和方法。
[0003] SOFA(Sepsis Related Organ Failure Assessment)是用于常用于评估全身性感染相关性器官功能衰竭的评分,包括呼吸、神经、心血管、肝脏、凝血共6个系统。改良多器官功能障碍综合征(The multiple organ dysfunction score,MODS)用于评估患者入重症监护室(Intensive care unit,ICU)每日器官功能衰竭的变化情况。简化急性生理评分(Simplified Acute Physiology Score,SAPS)常用于危重症疾病严重程度。急性生理学及慢性健康状况评分系统(Acute physiology and chronic health evaluation scoring system,APACHE-IV)是目前ICU中应用最为广泛和最具权威的危重疾病的评价系统。然而上述评分特征通常采用逻辑回归建模,并未考虑到器官功能之间的联系性。并假设预测变量与结局之间存在线性叠加关系,而真实疾病恶化、演变的复杂性远非简单线性模型所能表达和量化;各项子评分赋予的权重/系数存在较大的主观性,即通过专家小组对死亡率预测相关性的认知来选择和分配权重给相应的变量,并未通过大量的实验数据得到验证;老年人由于其基础疾病多、并发症多、器官衰老和功能减退等,成年人的评估标准并不能适用于老年人。而这些评分,鲜有针对老年患者提供更加详细的评估方案。
[0004] 电子健康档案(Electronic healthcare record,EHR)是以数字格式系统化地收集患者和人群的健康信息。它包含了患者的人口统计学、病史、药物和过敏、实验室检查结果、生命体征和账单等详细诊疗信息。近几年来,随着EHR在医疗办公事务在的普及和覆盖,以及大数据挖掘技术的发展和应用,利用EHR来改进医疗质量、提升医疗安全、优化医疗流程已不再是一个美好愿景。基于EHR的疾病严重程度/不良结局预测性分析现已成为学术和工业界研究的热点。2014年Pirracchio R等人研发的非参数、集成学习算法Super ICU Learner可更加准确地早期评估患者ICU的死亡风险,其模型的AUC高达0.88。2015年Henry,K.E等人针对早期预测脓毒症休克发展了一个“有针对性的实时预警评分”(TREWScore),该评分通过Cox比例风险回归模型可实现提前28.2小时(平均)预测脓毒症休克发生,模型AUC为0.83,敏感性为0.85。Dascena公司于2017年研发的‘Previse’自动诊断算法能够在患者达到临床诊断标准前一整天预测急性肾损伤,为临床医生提供充足的时间进行干预并预防长期损伤,算法在提前48小时预测具有84%的准确性。
[0005] XGBoost(eXtreme Gradient Boosting)是一种boosting算法,其思想是将许多弱分类器(树模型)集成在一起形成一个强分类器(提升树模型)。该模型在解决预测类问题具有高准确率,同时还具备运行速度快、防止过拟合和对稀疏数据建模的优势。因而被广泛用于数据竞赛、科研教学、工业应用中。

发明内容

[0006] 本申请旨在提出一种基于集成学习的早期死亡风险评估模型建立方法及装置,可通过老年多器官功能衰竭患者进入重症监护室第一天的诊疗数据,来评估患者住院期间的死亡风险。
[0007] 本申请的基于集成学习的早期死亡风险评估模型建立方法,所述早期死亡风险评估模型用于基于老年多器官功能衰竭患者进入重症监护室第一天的诊疗数据来评估患者住院期间的死亡风险;所述评估模型是XGBoost模型;该方法包括:
[0008] 构建数据集的步骤;利用数据集构建模,根据临床诊断定义来标识第一数据库中的多器官功能衰竭患者,确定研究人群和研究纳入的四类特征,构成第一数据集;
[0009] 数据处理的步骤;利用数据处理模块的数据提取与处理单元,在第一数据集中进行数据提取和处理,形成第二数据集,第二数据集分为训练集、验证集和测试集;利用数据处理模块的特征构建单元,对待输入到风险评估模型中的数据进行特征构建,以使其符合风险评估模型的数据输入要求;利用数据处理模块的患者结局标注单元,对患者结局进行标注;
[0010] 模型的构建和评估步骤;使用XGBoost模型作为早期模型进行训练,即通过早停机制,采用AUC作为性能评估指标,设定早停轮数,在验证集上测试模型的性能;当模型在验证集上的表现在连续的预定次数迭代性能不再提升则终止训练,获得模型训练的最优参数;并采用测试集数据评估经训练的模型的预测性能,以防模型过拟合现象发生;
[0011] 将最终的模型作为早期死亡风险评估模型。
[0012] 优选地,所确定的研究纳入的四类特征为:
[0013] 人口统计学特征,其包括:入院类型、年龄、BMI指数、种族、入重症监护室类型、性别、身高、体重;
[0014] 生命体征特征,其包括:中心静脉压、舒张压、心率、平均动脉压、呼吸速率、收缩压、休克指数、血饱和度、体温;
[0015] 实验室检查特征,其包括:白蛋白磷酸酶、谷丙转酶、谷草转氨酶、碱剩余、酸氢盐、胆红素、B型尿钠肽、血尿素氮、氯化物、肌酐、纤维蛋白原、吸入氧浓度、血葡萄糖红细胞压积、血红蛋白、国际标准化比值、乳酸、淋巴细胞、镁、中性粒细胞、动脉血二氧化碳分压、氧合指数、血氧分压、ph值、血小板、、凝血酶原时间、凝血激活酶时间、血钠、肌蛋白、白细胞计数
[0016] 临床特征,其包括:格拉斯哥评分、全身炎症反应综合征评分、全身性感染相关性器官功能衰竭评分的神经系统及呼吸系统分数、是否进行机械通气、是否进行连续性肾脏替代治疗、总排尿量、去甲肾上腺素使用速率。
[0017] 优选地,利用数据处理模块的数据提取与处理单元所进行的数据提取与处理包括:数据清洗、数据采样、数据插值;
[0018] 利用数据处理模块的特征构建单元所进行的特征构建包括:人口统计学特征的原值;生命体征特征的最大值、最小值、均值;实验室检查特征的最大值、最小值、原值、临床特征的最大值、最小值、均值、总和、原值。
[0019] 优选地,在性能评估时,通过内部验证和外部验证两种方式评估模型的性能,性能的衡量指标为AUC、特异性、敏感性、准确性、F1值、鲁棒性、普适性,性能评估的参照标准为基准模型和临床评分;最终的模型可基于特征排名函数获得与死亡关联的风险因素排名。
[0020] 优选地,所述基准模型选自:逻辑回归LR、支持向量机SVM、神经网络NN、随机森林RT、朴素贝叶斯NB模型;
[0021] 所述临床评分选自:津急性疾病严重程度评分(OASIS)、急性生理与慢性健康评分(APACHE-IV)、急性生理评估评分(APSIII)、多器官功能障碍综合征评分(MODS)、全身性感染相关性器官功能衰竭评分(SOFA)、简化急性生理评分(SAPS)、改良早期预警评分(MEWS)、全身炎症反应综合征评分(SIRS)、快速序贯器官衰竭评分(qSOFA)、查尔森合并症指数评分(Charlson Comorbidity)。
[0022] 优选地,鲁棒性和普适性通过以下三方面评估:
[0023] 内部验证:通过所述第二数据集的验证集与测试集,比较AUC、特异性、敏感性、准确性、F1值的变化情况,以获得性能最优模型参数和防止过拟合发生;
[0024] 外部验证:采用由多中心大样本数据集以同样的数据处理方式获取该数据集对应的第二数据库数据集,比较AUC、特异性、敏感性、准确性、F1值的变化情况,并与内部验证结果相比较;
[0025] 减少输入特征:通过减少输入最终的模型的特征个数,评估最终的模型在内部验证和外部验证相比于输入全部特征的AUC变化情况,并与临床评分相比较。
[0026] 优选地,所述老年多器官功能衰竭患者进入重症监护室第一天的诊疗数据包括:
[0027] 人口统计学特征:年龄、体重、BMI;
[0028] 生命体征特征:收缩压最小值、收缩压均值、休克指数最大值、休克指数最小值、呼吸速率均值、血氧饱和度最小值、体温最大值;
[0029] 实验室检查指标:血尿素氮最小值、血糖最小值、氯化物最大值、血氧分压最大值、白细胞计数最小值;
[0030] 临床特征:尿量总和、尿量最小值、格拉斯哥评分最大值、格拉斯哥评分均值。
[0031] 本申请的基于集成学习的早期死亡风险评估装置,其基于老年多器官功能衰竭患者进入重症监护室第一天的诊疗数据来评估患者住院期间的死亡风险;其包括:数据预处理模块、特征计算模块、模型运算模块;
[0032] 数据预处理模块通过计算机实现;所述数据预处理模块用于对所述诊疗数据进行提取和处理,得到预处理数据;
[0033] 特征计算模块通过计算机实现;所述特征计算模块用于对所述预处理数据进行特征构建,形成适合输入模型运算模块的数据;
[0034] 模型运算模块通过计算机实现;所述模型运算模块包括早期死亡风险评估模型,该早期死亡风险评估模型是以XGBoost模型为基础利用数据库中的数据集进行训练、调优和评估后得到的,其性能经过了多中心大样本数据集的有效验证和评估;经过特征构建的数据输入模型运算模块,模型运算模块输出患者住院期间的风险预测结果。
[0035] 优选地,所述模型运算模块所包含的模型为权利要求1-7中任一项所述的基于集成学习的早期死亡风险评估模型建立方法所建立的早期死亡风险评估模型。
[0036] 优选地,所述数据预处理模块对所述提取和处理包括对所述诊疗数据进行的清洗、采样、插值。
[0037] 本申请的基于集成学习的早期死亡风险评估模型建立方法及装置,
[0038] (1)可早期预测MODSE患者的院内不良结局发生概率,进而辅助医生对患者进行及早干预和治疗;
[0039] (2)经过内部和外部(大样本、多中心)数据集验证,模型性能良好,且优于基线模型和临床现有评分。同时,减少模型输入参数个数到20,仍具有不错的预测性能。该预测模型可便捷部署于医院信息系统;
[0040] (3)可提供与不良结局发生关联的重要因素,帮助医生理解疾病的发展过程;
[0041] (4)仅输入15种患者的临床信息,风险预测装置即可全自动输出早期对患者的发生院内不良结局(死亡)风险评估结果。附图说明
[0042] 图1为本申请的基于集成学习的早期死亡风险评估模型建立方法的执行流程;
[0043] 图2为MIMIC-III中老年多器官功能衰竭患者纳入流程;
[0044] 图3为MODSE死亡和存活患者ICU住院期间疾病发展轨迹可视化呈现;
[0045] 图4为早期预测患者死亡风险模型的ROC曲线;
[0046] 图5为预测模型与基线模型性能对比;
[0047] 图6为预测模型与临床常用评分性能对比;
[0048] 图7为预测模型前30个特征重要度排名;
[0049] 图8为采用前20个重要特征的预测模型的ROC曲线;
[0050] 图9为采用前20个重要特征的预测模型与临床评分性能对比;
[0051] 图10为预测模型在eICU多中心数据库中MODSE的纳入流程;
[0052] 图11为预测模型在eICU中验证的ROC曲线;
[0053] 图12为预测模型在eICU中验证与临床常用评分性能对比;
[0054] 图13为选前20个特征的预测模型在eICU中验证的ROC曲线;
[0055] 图14为选前20个特征的预测模型在eICU中验证与临床评分性能对比;
[0056] 图15为基于集成学习的老年多器官功能衰竭早期死亡风险评估装置的结构示意图;
[0057] 图16为预测模型的梯度提升决策树

具体实施方式

[0058] 下面,结合附图对本申请的基于集成学习的早期死亡风险评估模型建立方法及装置进行详细说明。
[0059] 本发明提出的基于电子健康档案发展疾病/结局预测模型及装置主要用于早期预测老年多器官功能衰竭患者在住院期间出现不良结局的概率/风险,目的是发展经大样本数据集验证可在临床落地的风险评估模型,全自动地对老年多器官功能衰竭患者的疾病严重程度进行及早的评估,帮助医生对有恶化风险患者及早干预和治疗。本发明利用了电子健康档案累积的多年的大样本数据,可以快速有效且低成本的发展模型,有效地解决了临床随机对照研究耗时、耗且花费巨额的问题;本方法经过另一多中心重症监护数据集的验证,其普适性和鲁棒性得到了有效地验证;且本方法在较少输入参数仍可保持较好预测性能;本方法最终被封装,可全自动计算患者发生不良结局的风险(概率)。
[0060] 本发明中提出的方法总体主要包括三个模块:(1)数据集构建模块;(2)数据处理模块:根据步骤(1)确定的研究群体和纳入的研究特征对数据进行提取、处理和特征构建;(3)模型构建与评估:根据步骤(2)得到的数据集进行模型的学习/训练和验证。其中步骤(1)主要利用了临床评估患者是否有多器官功能衰竭的标准对MIMIC-III数据库中的MODSE患者进行标注;步骤(2)主要根据步骤(1)给定的条件和范围从MIMIC-III数据库获取所需信息,为了便于模型计算和学习更加丰富信息,需要抽取统计特征;步骤(3)主要根据步骤(2)得到的数据进行模型的训练、优化和内部验证,进一步利用eICU数据库对模型进行了外部验证。
[0061] 本发明中提出的基于电子健康档案的老年多器官功能衰竭早期死亡风险评估方法,其预测性能优于基线模型和临床常用评分,为患者的恶化风险评估提供了更加准确的方法;其普适性和鲁棒性经受了截止目前(据我们所知)最大的样本数据集的验证;并且减少对模型的输入,模型性能良好且优于临床评分,模型的普适性和鲁棒性得到了不同方面的验证;同时该方法可获得与疾病恶化相关联的风险因素排名,有助于医生对MODSE疾病发展有更加深入的理解;最后该方法内置了并行计算,可以自动化、快速地获得患者住院期间的早期死亡风险。
[0062] 本发明提出的一种基于电子健康档案的老年多器官功能衰竭早期死亡风险评估方法的具体的实现如图1所示,包括以下步骤:
[0063] 一、本发明的中的数据集构建模块过程如下:
[0064] 首先根据临床诊断多器官功能衰竭的临床评分SOFA≥2(且至少两个系统异常)和国际规定对老年人的定义(年龄≥65岁)标定MIMIC-III数据库中的MODSE患者;随后,根据图2中MODSE患者纳入流程从数据库中确定本方法用于研究的人群。具体的纳入条件为:①年龄≥65岁,②ICU住院时长≥24小时,③第一次住院且第一次进入ICU,④住院期间发生了MODS(即SOFA≥2分,且至少两个器官系统发生衰竭),⑤住ICU第一天内至少各测量过一次:心率(HR)、呼吸率(RR)、平均动脉压(MAP)、格拉斯哥评分(GCS)、体温(T)、血氧饱和度(SpO2)。通过条件①~⑤最终共纳入15804名患者(2353名患者死亡);最后,需要确定研究特征,我们结合了临床医生的经验知识和部分文献,确定共纳入4类数据,分别为:人口统计学,生命体征(添加了休克指数shock index,即脉搏/收缩压),实验室检查,临床(评分、医疗干预、出量),将在(二)中详细描述具体内容。此外,我们挑选了7个临床关注的重要指标可视化呈现MODSE院内死亡和幸存患者的疾病发展轨迹,见图3。
[0065] 二、本发明中的数据处理模块过程如下:
[0066] 首先基于(一)中确认的纳入人群和研究特征,编写Postgresql语句从MIMIC-III数据;
[0067] 库中提取患者进入ICU头24小时所有的相关信息,分为以下3个步骤完成:①对数据进行格式标准化处理(如:葡萄糖的itemid为50809或50931,心率的itemid为211或220045),进一步需要将同时存在字符串和数值组合的信息进行清洗,并根据医生给出的每个指标的生理极限范围将异常值/离群值去除;②将(一)中提到的实验室检查、生命体征和临床指标进行降采样(若一小时内出现多个值则取均值,其中尿量较为特殊,采用一小时内的总和);③将降采样过后的数据进一步进行插值处理,当该特征的整个研究群体的缺少比例≤30%,则采用人群中位数插补。若缺少比例>30%,插入人群的均值,并加入该特征对应的标志指标(即0/1标签,代表未测/测量);
[0068] 接着,将整理好的数据进行特征构建,见图3中的观测窗口(入ICU头24h)。将所有患者观测窗口内的信息进行抽取,具体如下:①人口统计学特征(8个):保持原有值;②生命体征统计特征(25个):最大值、最小值、均值;③实验室检查统计特征:最大、最小值和标签flag(如:lactate_flag为是否测量乳酸(0/1));临床(16个):最大值、最小值、均值、总和(尿量)和标签flag(如:ventilation_flag为是否进行机械通气治疗(0/1))。表1为特征统计总表;
[0069] 最后,为了便于接下来进行模型的训练,对患者的结局进行标注(0:幸存,1:死亡)。
[0070] 表1预测模型纳入特征及结局标注
[0071]
[0072]
[0073] 三、本发明中的模型构建与评估模块过程如下:
[0074] 首先基于(二)中获得的整理过后的数据,将其输入到我们选定的模型XGBoost,XGBoost是集成模型,其运算速度快,且具有一定的可解释性。将数据集分为80%的训练集和验证集以及20%的测试集,其中80%的训练集和验证集会进一步分为80%的训练集和20%的验证集,采用交叉验证的方法优化XGBoost模型的超参数设置;
[0075] 接着为预测模型XGBoost性能评估,本方法采用的评价指标有AUC、特异性、敏感性、准确率、F1值和鲁棒性;采用的参照标准为基线模型(LR、NN、SVM、RF、NB)和临床常用评估危重病人病情的严重程度的评分(OASIS、APACHE-IV、MODS、SOFA、SAPS、MEWS、SIRS、qSOFA、Charlson Comorbidity);采用的方式为内部验证(即MIMIC-III数据集自身的模型训练与基于20%的测试集进行评估)和外部验证(即MIMIC-III数据集发展的预测模型在eICU数据集中整个研究人群中进行性能评估)。以下通过结合预测结果进行此过程的更加详细说明:
[0076] 1)XGBoost预测模型的内部验证结果解释
[0077] 图4为XGBoost预测模型(使用全部特征107个)的ROC曲线,AUC为0.866。图5为本方法与5个基线模型预测性能对比的ROC曲线图,XGBoost表现最优。表2为性能对比的具体指标,XGBoost的AUC为0.866,敏感性为0.774,特异性为0.808,准确性0.877,F1值为0.680。图6为本方法与10个临床常用评分性能对比的ROC曲线图,XGBoost表现也一致最优。表3为与临床性能对比的具体指标。XGBoost预测模型可以提供模型特征重要程度排名,这一特性为模型提供了可解释性的功能,即特征重要度的排名为临床医生提供了关于MODSE患者发生恶化早期应该重点关注的指标。图7为挑选出前30个特征重要度排名的展示,其中格拉斯哥评分的最大值(gcs_max)、呼吸速率的均值(rr_mean)、格拉斯哥评分的均值(gcs_mean)、收缩压的均值(sbp_mean)、总尿量(uo_sum)、体重(weight)、血尿素氮的最小值(bun_min)、年龄(age)、尿量的均值(uo_mean)、休克指数的最大值(si_max)排在前10位。表3为前30个重要特征的名称和具体的重要度数值。另外,为了验证模型是否可以应用于不同医疗资源配置机构中,我们将模型的输入特征个数限制到20个(@20),图8为该方法的ROC曲线,AUC为
0.857;图9为减少输入特征模型的性能与2个性能优良的临床评分(AUCOASIS=0.752,AUCAPACHE-IV=0.704)对比的ROC曲线,我们的方法尽管预测性能相比于输入全部特征略有下降,但仍远优于临床评分的性能。
[0078] 表2 XGBoost预测模型与其他基线模型的性能对比
[0079]模型名称 AUC 敏感性 特异性 准确性 F1值
XGBoost 0.866 0.774 0.808 0.877 0.680
NN 0.848 0.802 0.743 0.867 0.601
LR 0.847 0.841 0.703 0.871 0.674
SVM 0.834 0.763 0.773 0.853 0.460
RF 0.795 0.634 0.819 0.859 0.597
NB 0.778 0.696 0.742 0.819 0.664
[0080] 表3 XGBoost预测模型与临床常用评分的性能对比
[0081]
[0082]
[0083] 表4 XGBoost预测模型前30个重要特征
[0084]
[0085]
[0086] 2)XGBoost预测模型的外部验证结果解释
[0087] 本部分内容通过多中心的大样本数据集eICU对基于MIMIC-III数据集发展得到的MODSE早期死亡风险评估模型的普适性、鲁棒性进行验证。首先是数据集模块构建过程,需要通过与MIMIC-III中获取研究人群相同的流程获得eICU数据集中纳入人群,具体纳入流程见图10,最终纳入人群为34523名MODSE患者,其中死亡患者为3966名。与MIMIC-III数据集保持一致,也纳入相同的研究特征;接着为数据处理模块,与MIMIC-III数据集中的流程一致。最后是模型的外部验证,我们的方法在eICU数据集中进行验证,模型的ROC曲线见图11,其中AUC为0.837,由此可见模型的普适性/鲁棒性得到了很好的验证。图12为本方法与临床评分(OASIS,APACHE-IV)预测性能对比的ROC曲线,我们的方法依旧一致远优于临床评分(AUCOASIS=0.746,AUCAPACHE-IV=0.742)。我们依旧选用了部分输入特征(前20个重要特征)对模型的普适性/鲁棒性进行评估。图13为输入模型特征的方法在eICU数据集中外部验证的结果,AUC为0.828。图14为与临床评分对比性能对比的ROC曲线。结合图12和14,可知尽管模型模型的性能略有模型,模型性能依旧表现良好。
[0088] 表5展示了输入全部特征的预测模型、输入部分特征(@20)的预测模型和10个临床评分性能对比的汇总。
[0089] 表5预测模型在eICU数据集中验证与临床评分对比
[0090]名称 AUC 敏感性 特异性
XGBoost_all_features 0.837 0.763 0.752
XGBoost_20_features 0.828 0.733 0.769
MODS 0.763 0.719 0.667
OASIS 0.746 0.673 0.694
APACHE-IV 0.742 0.635 0.751
APSIII 0.736 0.663 0.716
SOFA 0.731 0.684 0.673
MEWS 0.719 0.614 0.712
SAPS 0.693 0.569 0.717
SIRS 0.670 0.734 0.531
qSOFA 0.675 0.597 0.710
Charlson Comorbidity 0.553 0.5229 0.569
[0091] 本发明中提出的全自动风险评估装置,见图15。我们兼顾了模型的预测性能(特异性、敏感性、准确性等)和适用性,挑选了特征重要性排名前20的特征(见表4)作为最终预测模型的输入信息,模型的超参数设置为{'base_score':0.5,'booster':'gbtree','colsample_bylevel':1,'colsample_bytree':1,'gamma':0,'learning_rate':0.1,'max_delta_step':0,'max_depth':3,'min_child_weight':1,'missing':None,'n_estimators':100,'n_jobs':-1,'nthread':None,'objective':'binary:logistic','random_state':0,'reg_alpha':0,'reg_lambda':1,'scale_pos_weight':1,'seed':None,'silent':1,'subsample':1,'eval_metric':'auc','tree_method':'approx'}。
[0092] 为了更加直观理解模型,绘制了预测模型的梯度决策提升树,见图16。
[0093] 产业利用可能性
[0094] 本申请的基于集成学习的早期死亡风险评估模型建立方法及装置将数据预处理、特征计算和模型运算进行了全自动封装,使得可以在接收到单独一位患者/多位患者的所需诊疗信息/数据后,即可自动、快速获得患者是否会在住院期间发生不良结局。帮助医生对患者的疾病严重程度进行更加全面的评估,进而对高风险患者进行及早护理和治疗。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈