首页 / 专利库 / 心理学与精神病学 / 生活质量 / 一种环境变化对疾病发病影响的分析预测装置

一种环境变化对疾病发病影响的分析预测装置

阅读:363发布:2021-05-13

专利汇可以提供一种环境变化对疾病发病影响的分析预测装置专利检索,专利查询,专利分析的服务。并且本 发明 通过对 门 诊量数据与气象变化和环境污染数据的关联情况进行分析,构建基于非参数泊松回归模型的环境变化对 疾病 发病率的影响程度的定量分析模型,并在此 基础 上构建基于支持向量回归机的环境变化对门诊量影响的 预测模型 ,对医院各科室的每周门诊量进行预测。使患者能够提前规避致病的不良气象条件和环境污染因素的影响,合理的安排日常活动;医院能够针对高发疾病合理配置各个科室的医疗资源和人手;公共卫生部门能够提前做好应急准备等,对特定人群进行提前干预,从而减少疾病的发病率,提高人类 生活 质量 。,下面是一种环境变化对疾病发病影响的分析预测装置专利的具体信息内容。

1.一种环境变化对疾病发病影响的分析预测装置,其特征在于,包括:
输入输出数据模,该输入输出数据模块的输入数据为:整理好的气象和环境污染因子的时序数据;该输入输出数据模块的输出数据为:各科室诊量;
数据预处理模块,用于:
对气象和环境污染因子决策矩阵 进行归一化处理,其中,xij表
示第i天的第j项气象和环境污染因子的数据指标;再计算归一化后的决策矩阵X的相关系数矩阵 其中rij表示第i天的第j项气象和环境污染因子数据指标的
相关系数,且rij=rji;同时计算气象和环境污染因子与各科室门诊量的相关系数矩阵R;
非参数泊松回归模型模块,用于:
1)构建非参数泊松回归模型,采用三次样条平滑函数拟合非线性自变量,并引入年份和周日亚元变量,消除自变量间自相关性和长期季节趋势的影响,为了得到气象和环境污染因子对门诊量的定量研究结果,将气象因子和环境污染因子作为变量引入模型,分别观察其对门诊量的影响:
log[E(Yi)]=a+ns[Xi]+YEAR+DOW+s(meteorology,df)+s(environment,df)式中,Yi为第i个观察日当天的门诊量;E(Yi)为第i个观察日门诊量的期望值;a为截距;
Xi为第i个观察日气象环境污染因子的分指数,DOW为周日亚元变量;s(meteorology,df)为气象因子的三次样条平滑函数;s(environment,df)为环境污染因子的三次样条平滑函数;
YEAR为年份亚变量;
2)脆弱性分析:分析当气象和环境污染因子变化某个单位时,对门诊量的影响程度,根据非参数泊松回归模型计算出各气象和环境污染因子的回归系数β,计算当各气象和环境污染因子变化四分位间距IQR时,门诊量自然对数的相对改变量,公式:[exp(β×IQR)-1]×
100%,并在此基础上计算平均百分比改变的95%的置信区间;
3)敏感性分析:分析当气象因子和环境因子变化时,将在多长时间内对门诊量造成影响,采用滞后效应进行研究,选择分析滞后期lag为0~7天的气象和环境污染因子效应,最后,根据非参数泊松回归模型计算出回归系数β,由β计算出不同滞后天数的RR值,根据RR值确定最佳滞后期;
降维模块,用于:求取相关系数矩阵R所对应的J个特征根以及特征向量,每个特征根对应一个主成分,并选取累积方差贡献度大于等于指定值的主成分,则从J个主成分中筛选出p个主成分及特征向量;计算各个主成分因子在各个变量上的成分得分矩阵,得到p个主成分在每周的得分;
数据分区模块,采用交叉验证的方法将输入向量矩阵及输出变量分为训练集和测试集,输入向量矩阵为p+2维,由降维模块中得到的主成分得分与年份亚变量和节假日变量组合构成,输出变量为下周的科室就诊人数平均值;
构建支持向量回归机模块,包括如下步骤:
第一步、模型参数选择,用于构建支持向量回归机的输入和输出,并且选择支持向量回归机的特征参数,其中,特征参数包括核函数、初始的惩罚因子C和核函数参数δ的试凑范围与步长,以及初始的精度参数ε,通过核函数将数据映射到高维的向量空间中,在约束条件,其中,xi为l维空间的输入向量,yi为l维空间的输出向量,w为特征空间连接到输出空间的权值参数,φ(x)为x在特征空间的像,b为偏置或者负阀值:
*
<w,φ(xi)>+b-yi≤ξi+ε,i=1,...,l
yi-<w,φ(xi)>-b≤ξi+ε,i=1,...,l
ξi,ξi*≥0,i=1,...,l
求解目标函数,其中,C为选定的正参数:
该问题的对偶形式为:
其中约束条件为:
0≤αi,αi*≤λiC,i=1,2,...l
*
从而求解出参数αi和αi;
第二步、训练模型,调用训练函数,输入训练集样本,计算出支持向量以及求解对应的参数,得到支持向量回归机:
根据支持向量回归机计算各科室就诊人数的预测值,计算实际输出与期望输出之间的MAE以及模型的拟合优度R2作为对模型拟合能评价指标,判断回归函数f(x)是否满足性能要求,若回归函数f(x)不满足性能要求,则需要调整支持向量回归机中的核函数和特征参数重新训练模型,并保存最终结果;
第三步、根据回归预测分析最佳的参数得到的支持向量回归机计算各科室就诊人数的预测值;
模型预测能力评估模块,其实施过程包括:
第一步、用支持向量回归机计算医院各科室的就诊人数的预测值;
第二步、获取各科室就诊人数的实际值,各科室就诊人数的预测值和实际值是同一时间段的就诊人数;
第三步、计算预测值与实际值之间的差异,并根据误差图对模型的预测效果进行评估,若模型的预测能力较差,则需要重新选择模型参数、重新训练模型,从而构建基于支持向量回归机的气象环境污染因子的就诊人数预测模型
在构建支持向量回归机模块的第二步的训练模型中,模型拟合能力评价指标:实际输出与期望输出之间的均方误差MAE以及拟合优度R2由下面的公式给出:
式中, 表示第i周的日平均就诊人数的预测值,yi表示第i周的日平均就诊人数的真实值,n,0<n<I,表示周数,其中MAE越小和R2越接近于1,表示所建立的支持向量回归机越具有良好的泛化能力。
2.如权利要求1所述的一种环境变化对疾病发病影响的分析预测装置,其特征在于,在数据预处理模块中,对决策矩阵X中第i天的第j项气象和环境污染因子数据指标xij进行归一化处理后得到zij,则 式中,x'及σ分别为xij的期望和标准差。
3.如权利要求1所述的一种环境变化对疾病发病影响的分析预测装置,其特征在于,在构建支持向量回归机模块,所述核函数为Sigmoid核函数,其表达式为
式中,c1为倾斜系数,c2为常数参数;或所述核函数为径向基核
函数,其表达式为 式中,γ为1/k,其中k为类别数;或所述核函数为
多项式核函数,其表达式为 式中,γ为1/k,其中k为类别数,a为常量
参数,d为最高次项次数。
4.如权利要求3所述的一种环境变化对疾病发病影响的分析预测装置,其特征在于,在所述构建支持向量回归机模块中,引入拉格朗日函数得到目标函数的对偶形式,如下所示:
其中αi,αi*,γi≥0,i=1,...,l
函数L的极值应满足条件:
得到下面的式子:
C-αi-αi*-γi=0
将上面3个公式带入到拉格朗日函数中即可得到函数的对偶形式。

说明书全文

一种环境变化对疾病发病影响的分析预测装置

技术领域

[0001] 本发明涉及一种基于非参数泊松回归模型的环境变化对疾病发病率的影响程度的定量分析模型,并在此基础上构建基于支持向量回归机的环境变化对诊量影响的预测方法。

背景技术

[0002] 人类健康与所处的外部环境因素息息相关,其中气象条件变化与环境污染对人类疾病的发生尤其相关。气象变化和环境污染对健康的影响已经成为普遍关注的焦点问题。目前,人们对气象变化和环境污染对疾病发病率的影响方面大多还处于感性的认识。都认为有影响,但对哪些疾病有影响以及影响程度如何?缺少定性和定量的分析。

发明内容

[0003] 本发明的目的是提供一种环境变化对疾病发病率的影响程度的定量分析方法。
[0004] 为了达到上述目的,本发明的技术方案是提供了一种环境变化对疾病发病影响的分析预测模型,其特征在于,包括:
[0005] 输入输出数据模,该输入输出数据模块的输入数据为:整理好的气象和环境污染因子的时序数据;该输入输出数据模块的输出数据为:各科室的门诊预测量;
[0006] 数据预处理模块,用于:
[0007] 对气象和环境污染因子决策矩阵 进行归一化处理,其中,xij表示第i天的第j项气象和环境污染因子的数据指标;再计算归一化后的决策矩阵X的相关系数矩阵 其中rij表示第i天的第j 项气象和环境污染因子数据指
标的相关系数,且rij=rji;同时计算气象和环境污染因子与各科室门诊量的相关系数;
[0008] 非参数泊松回归模型模块,用于:
[0009] 1)构建非参数泊松回归模型,采用三次样条平滑函数拟合非线性自变量,并引入年份和周日亚元变量,消除自变量间自相关性和长期季节趋势的影响,为了得到气象和环境污染因子对门诊量的定量研究结果,将气象因子和环境污染因子作为变量引入模型,分别观察其对门诊量的影响:
[0010] log[E(Yi)]=a+ns[Xi]+YEAR+DOW+s(meteoro log y,df)+s(environment,df)[0011] 式中,Yi为第i个观察日当天的门诊量;E(Yi)为第i个观察日门诊量的期望值;a 为截距;Xi为第i个观察日气象环境污染因子的分指数,DOW为周日亚元变量; s(meteoro logy,df)为气象因子的三次样条平滑函数;s(environment,df)为环境污染因子的三次样条平滑函数;
[0012] 2)脆弱性分析:分析当气象和环境污染因子变化某个单位时,对门诊量的影响程度,根据非参数泊松回归模型计算出各气象和环境污染因子的回归系数β,计算当各气象和环境污染因子变化四分位间距IQR时,门诊量自然对数的相对改变量,公式:[exp(β×IQR)-1]×100%,并在此基础上计算平均百分比改变的95%的置信区间;
[0013] 3)敏感性分析:分析当气象因子和环境因子变化时,将在多长时间内对门诊量造成影响,采用滞后效应进行研究,选择分析滞后期lag为0~7天的气象和环境污染因子效应。最后,根据非参数泊松回归模型计算出回归系数β,由β计算出不同滞后天数的RR值,根据RR值确定最佳滞后期;
[0014] 降维模块,用于:求取相关系数矩阵R所对应的J个特征根以及特征向量,每个特征根对应一个主成分,并选取累积方差贡献度大于等于指定值的主成分,则从J个主成分中筛选出p个主成分及特征向量;计算各个主成分因子在各个变量上的成分得分矩阵,得到p个主成分在每周的得分;
[0015] 数据分区模块,采用交叉验证的方法将输入向量矩阵及输出变量分为训练集和测试集,输入向量矩阵为p+2维,由降维模块中得到的主成分得分与年份亚变量和节假日变量组合构成,输出变量为下周的科室就诊人数平均值;
[0016] 构建支持向量回归机模块,包括如下步骤:
[0017] 第一步、模型参数选择,用于构建支持向量回归机的输入和输出,并且选择支持向量回归机的特征参数,其中,特征参数包括核函数、初始的惩罚因子C和核函数参数δ的试凑范围与步长,以及初始的精度参数ε,通过核函数将数据映射到高维的向量空间中,在约束条件,其中,xi为l维空间的输入向量,yi为l维空间的输出向量,w为特征空间连接到输出空间的权值参数,φ(x)为x在特征空间的像,b为偏置或者负阀值:
[0018] +b-yi≤ξi*+ε,i=1,...,l
[0019] yi--b≤ξi+ε,i=1,...,l
[0020] ξi,ξi*≥0,i=1,...,l
[0021] 下求解目标函数,其中,C为选定的正参数:
[0022]
[0023] 该问题的对偶形式为:
[0024]
[0025] 其中约束条件为:
[0026]
[0027] 0≤αi,αi*≤λiC,i=1,2,...l
[0028] 从而求解出参数αi和αi*;
[0029] 第二步、训练模型,调用训练函数,输入训练集样本,计算出支持向量以及求解对应的参数,得到支持向量回归机:
[0030]
[0031] 根据支持向量回归机计算各科室就诊人数的预测值,计算实际输出与期望输出之间的MAE以及模型的拟合优度R2作为对模型拟合能评价指标,判断回归函数f(x)是否满足性能要求,若回归函数f(x)不满足性能要求,则需要调整支持向量回归机中的核函数和特征参数重新训练模型,并保存最终结果;
[0032] 第三步、根据回归预测分析最佳的参数得到的支持向量回归机计算各科室就诊人数的预测值。
[0033] 优选地,还包括:模型预测能力评估模块,其实施过程包括:
[0034] 第一步、用支持向量回归机计算医院各科室的就诊人数的预测值;
[0035] 第二步、获取各科室就诊人数的实际值,各科室就诊人数的预测值和实际值是同一时间段的就诊人数;
[0036] 第三步、计算预测值与实际值之间的差异,并根据误差图对模型的预测效果进行评估,若模型的预测能力较差,则需要重新选择模型参数、重新训练模型,从而构建基于支持向量回归机的气象环境污染因子的就诊人数预测模型。
[0037] 优选地,在数据预处理模块中,对决策矩阵X中第i天的第j项气象和环境污染因子数据指标xij进行归一化处理后得到zij,则 式中,x′及σ分别为xij的期望和方差。
[0038] 优选地,在构建支持向量回归机模块,所述核函数为Sigmoid核函数,其表达式为式中,c1为倾斜系数,c2为常数参数;或所述核函数为径向基核函数,其表达式为 式中,γ为1/k (其中k为类别数);或所述核函数
为多项式核函数,其表达式为 式中,γ为1/k(其中k为类别数),a为
常量参数,d 为最高次项次数。
[0039] 优选地,在所述构建支持向量回归机模块中,引入拉格朗日函数得到目标函数的对偶形式,如下所示:
[0040]
[0041] 其中αi,αi*,γi≥0,i=1,...,l
[0042] 函数L的极值应满足条件:
[0043]
[0044] 得到下面的式子:
[0045]
[0046]
[0047] C-αi-αi*-γi=0
[0048] 将上面3个公式带入到拉格朗日函数中即可得到函数的对偶形式。
[0049] 优选地,在构建支持向量回归机模块的第二步的训练模型中,模型拟合能力评价指标:实际输出与期望输出之间的均方误差MAE以及拟合优度R2由下面的公式给出:
[0050]
[0051]
[0052] 式中,表示第i周的日平均就诊人数的预测值,yi表示第i周的日平均就诊人数的真实值,n,0<n<I,表示周数,其中MAE越小和R2越接近于1,表示所建立的支持向量回归机越具有良好的泛化能力。
[0053] 本发明通过对门诊量数据与气象变化和环境污染数据的关联情况进行分析,构建基于非参数泊松回归模型的环境变化对疾病发病率的影响程度的定量分析模型,并在此基础上构建基于支持向量回归机的环境变化对门诊量影响的预测模型,对医院各科室的每周患病人数进行预测。使患者能够提前规避致病的不良气象条件和环境污染因素的影响,合理的安排日常活动;医院能够针对高发疾病合理配置各个科室的医疗资源和人手;公共卫生部门能够提前做好应急准备等,对特定人群进行提前干预,从而减少疾病的发病率,提高人类生活质量附图说明
[0054] 图1为本发明提供的一种环境变化对疾病发病影响的分析预测模型的原理图;
[0055] 图2为原始数据和支持向量回归机预测的数据对比;
[0056] 图3为原始数据和支持向量回归机预测的误差图。

具体实施方式

[0057] 为使本发明更明显易懂,兹以优选实施例,并配合附图作详细说明如下。
[0058] 本发明利用过去两年上海市三甲医院的门诊数据,通过对门诊量数据与气象变化和环境污染数据的关联情况进行分析,构建基于非参数泊松回归模型的环境变化对疾病发病率的影响程度的定量分析模型,并在此基础上构建基于支持向量回归机的环境变化对门诊量影响的预测模型,对医院各科室的每周患病人数进行预测。使患者能够提前规避致病的不良气象条件和环境污染因素的影响,合理的安排日常活动;医院能够针对高发疾病合理配置各个科室的医疗资源和人手;公共卫生部门能够提前做好应急准备等,对特定人群进行提前干预,从而减少疾病的发病率,提高人类生活质量。
[0059] 结合图1,本发明提供的一种环境变化对疾病发病影响的分析预测模型的具体实施步骤为:步骤1:整理气象和环境污染因子的时序数据,对数据进行预处理,将每天的平均气温、最高气温、最低气温、温差、最大气压、平均气压、最大湿度、平均湿度、最大速、平均风速等气象因子按时间序列的形式进行汇总;将每天的 PM2.5分指数、PM10分指数、03分指数、SO2分指数、NO2分指数、CO分指数等环境污染因子按照时间序列的形式进行汇总;并计算24小时温差、24小时压差、24小时风速差、24小时湿度差等时间序列数据,将气象和环境污染数据作为输入数据,各科室门诊量作为输出数据。
[0060] 步骤2、对数据进行预处理,对数据进行归一化处理并求取相应的相关系数矩阵,归一化后的气象和环境污染因子的相关系数矩阵如表1所示:
[0061]
[0062]
[0063] 表1气象因子和环境污染因子的相关系数矩阵
[0064] 气象和环境污染因子与呼吸科就诊人数的相关系数矩阵如表2所示:
[0065]
[0066] 表2气象因子和环境污染因子与呼吸科就诊人数的相关系数矩阵
[0067] 步骤3、构建非参数泊松回归模型:
[0068] (1)构建非参数泊松回归模型:采用三次样条平滑函数拟合非线性自变量,并引入年份和周日亚元变量,消除自变量间自相关性和长期季节趋势的影响,为了得到气象和环境污染因子对门诊量的定量结果,将气象因子和环境污染因子作为变量引入模型,观察其对门诊量的影响:
[0069] log[E(Yi)]=a+ns[Xi,df=5]+YEAR+DOW+s(meteoro log y,df)+s(environment,df) 式中,Yi为第i个观察日当天的门诊量;E(Yi)为第i个观察日门诊量的期望值;a 为截距;Xi为第i个观察日气象环境污染因子的分指数,DOW为周日亚元变量; s(meteoro log y,df)为气象因子的三次样条平滑函数;s(environment,df)为环境污染因子的三次样条平滑函数。
[0070] (2)脆弱性分析:分析当气象和环境污染因子变化某个单位时,对门诊量的影响程度。分析结果如表3所示:
[0071]
[0072] 表3气象因子因子和环境污染因子的脆弱性分析
[0073] 在所有的气象因子中,气温对儿童各科室的就诊人数影响最大,同时气温对消化科的就诊人数的影响也大于呼吸科和皮肤科。在所有的环境污染因子中, NO2对儿童各科室的就诊人数影响最大,同时NO2对呼吸科的就诊人数的影响也大于消化科和皮肤科。
[0074] (3)敏感性分析:分析当气象和环境污染因子变化时,将在多长时间内对门诊量造成影响,我们用滞后效应进行研究。在所有的气象中,气温对儿童各科室的就诊人数主要集中在滞后1天,风速对当天的患病人数影响最大,气压和湿度主要影响滞后5天的就诊量。在所有的环境污染因子中,NO2对当天的儿童各科室的就诊量影响最大,SO2需要滞后2天,PM2.5和PM10则分别滞后4天和6天。
[0075] 步骤4、求取相关系数矩阵R所对应的特征根和特征向量,按照累积方差贡献度大于等于85%的原则,共提取6个主成分,如表4所示;
[0076]
[0077] 表4解释的总方差
[0078] 计算6个因子在各个气象和环境污染因子上的系数,从而计算每个因子的得分,各个因子的成分得分系数矩阵如表5所示:
[0079]
[0080]
[0081] 表5因子的成分得分系数矩阵
[0082] 计算每个主成分因子在各个气象和环境污染因子指标上的得分,取前10周的样例数据如表6所示:
[0083]
[0084] 表6因子在每周的得分
[0085] 步骤5、数据分区:将每项气象和环境污染因子提取的主成分与年份亚变量和节假日变量进行组合构成输入向量矩阵,将下一周的各科室门诊量均值作为输出变量,为了降低参数的影响,采用交叉验证的方法分将数据分为训练集和测试集,即对每周的数据划分标签,在训练集上构建相应的支持向量回归机,并对测试集进行预测;
[0086]
[0087] 表7支持向量回归机的决策矩阵
[0088] 步骤6、构建支持向量回归机:(1)采用支持向量回归机,将输入向量运用核函数Sigmoid核函数映射到高维的特征空间;同时设定初始的惩罚因子C的最小值为-8,最大值为8,核函数参数δ的最小值为-8,最大值为8,初始的步长0.5,以及初始的精度参数0.05,并将训练样本数据代入模型,利用回归预测分析进行训练,得出最佳的模型参数,并保存参数。
[0089] (2)训练模型,调用训练函数,输入训练集样本,计算出支持向量以及求解对应的参数,得到支持向量回归机:
[0090]
[0091] 根据支持向量回归机计算各科室就诊人数的预测值,计算实际输出与期望输出之间的MAE以及模型的拟合优度R2作为对模型拟合能力评价指标,通过不断调整模型参数,使回归函数f(x)满足性能要求。
[0092] (3)根据回归预测分析最佳的参数得到的支持向量回归机计算各科室就诊人数的预测值。
[0093] 步骤7、模型预测能力评估:通过支持向量回归机得到的最佳参数对测试组的上海市儿童呼吸科的就诊人数进行预测,并保存最终的预测结果,将实际的就诊人数与模型得到的每周的日均就诊人数进行比较,比较结果如图2所示,相应的残差图形如图3所示。
[0094] 通过计算模型拟合能力评价指标:实际输出与期望输出之间的均方误差及拟合优度 对模型的效果进行评价,并最终判断模型的效果是否符合标准,本次研究中运用支持向量回归机对呼吸科的就诊人数的预测过程中,得到最终的模型的均方误差MAE= 0.00332692,拟合优度R2=
0.928161,模型的拟合效果总体较好。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈