首页 / 专利库 / 人工智能 / 人工神经网络 / 一种城市空气质量浓度监测缺失数据的修复方法

一种城市空气质量浓度监测缺失数据的修复方法

阅读:957发布:2021-05-17

专利汇可以提供一种城市空气质量浓度监测缺失数据的修复方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种城市空气 质量 浓度监测缺失数据的修复方法,首先在城市范围内,获取影响各监测 站点 空气质量浓度的共性环境因子,基于共性环境因子历史数据和历史空气质量浓度监测数据预测各监测站点(含正常类与故障类站点)未来时刻空气质量浓度;然后将正常工作监测站点的未来时刻监测数据和基于历史数据的预测浓度进行比较,获取未来时刻监测浓度与预测浓度的偏差,并依据空间相关性理论对故障监测站点未来时刻的空气质量监测浓度与基于历史数据的预测浓度的偏差进行估算;最后利用上述步骤的故障监测站点偏差对故障站点基于历史数据预测的未来时刻空气质量浓度结果进行修正,生成故障监测站点未来时刻修复后的空气质量浓度监测数据。,下面是一种城市空气质量浓度监测缺失数据的修复方法专利的具体信息内容。

1.一种城市空气质量浓度监测缺失数据的修复方法,其特征在于,包括以下步骤:
步骤1:收集需进行空气质量浓度监测缺失数据修复的城市中各空气质量浓度监测站点时间超过一年以上的空气质量浓度监测数据和环境因子数据,以这些数据作为变量节点生成的贝叶斯网络节点,同时在所有贝叶斯网络节点之间用线进行连接,以此构成贝叶斯网络的完全连接图,然后对各变量节点之间进行关联性分析,并根据关联性分析结果,将完全连接图中不存在关联性的变量之间的对应连接线删除,并基于关联性分析结果筛选出不同监测站点共同包含的环境因子(即共性环境因子)作为后续空气质量浓度预测模型的输入变量;
步骤2:以人工神经网络来构建空气质量浓度预测模型,然后将步骤1筛选出的各监测站点具有关联性的共性环境因子作为空气质量浓度预测模型的输入变量,将监测站点历史空气质量浓度监测数据作为期望输出变量来对空气质量浓度预测模型进行训练,训练时通过分别输入不同时刻的各监测站点具有关联性的共性环境因子分别所对应的输出变量与期望输出变量进行对比,根据对比结果来对空气质量浓度预测模型的输入层网络节点与隐含层网络节点之间的权值、隐含层网络节点与输出层网络节点之间的权值、隐含层节点阈值和输出层节点阈值进行修正,当空气质量浓度预测模型的预测值与期望输出变量之间的误差满足精度要求时,则停止空气质量浓度预测模型的训练;然后将未来时刻的各正常工作的监测站点共同相关的环境因子和时间因子构成输入变量,并输入到构建完成的空气质量浓度预测模型中,进行监测站点未来时刻空气质量浓度值的预测;
步骤3:将步骤2所得到的正常工作的监测站点未来时刻空气质量浓度的预测浓度值与该未来时刻的空气质量监测浓度进行比较,并计算求得两者的偏差;然后通过对该偏差进行空间差值,求得未来时刻故障监测站点的空气质量浓度的预测值与该时刻的空气质量监测浓度修复值之间的偏差,再通过空气质量浓度预测模型求得故障监测站点未来时刻空气质量浓度的预测值,加上未来时刻故障监测站点的空气质量浓度的预测值与该时刻的空气质量监测浓度修复值之间的偏差,即可获得故障监测站点未来时刻的空气质量浓度监测缺失数据的修复值。
2.根据权利要求1所述的方法,其特征在于,步骤1中环境因子数据包括人口密度、地形、交通流量、土地利用类型、气温、速、风向、气压、湿度、光照。
3.根据权利要求1所述的方法,其特征在于,步骤1中对各变量节点之间进行关联性分析的步骤包括:
1)首先在非离散型变量历史空气质量浓度监测数据和环境因子数据中寻找最优离散点以进行离散化,离散时最优离散点选择的依据是熵最小原则,熵的计算公式如下:
其中,K表示非离散型变量中变量的总数;ki表示通过离散点分割后,第i个离散段中非离散型变量的个数;pi表示通过离散点分割后,第i个离散段中非离散型变量个数占非离散型变量总数的比例,G(X)表示通过离散后离散型变量的熵;
2)离散后,计算各离散变量xn的边缘概率P(xn)和各离散变量之间的联合概率P(y,x1,x2,…xn),并依据贝叶斯公式计算离散变量xn与多个变量y、x1、x2…xn-1之间的条件概率P(xn|y,x1,x2,…xn-1);离散变量xn与变量x1、x2…xn-1之间的条件概率P(xn|x1,x2,…xn-1),计算的公式如下:
3)通过下面公式确定在贝叶斯网络中变量xn和x0之间的关联性是否存在:
其中,V(xn,y)=1表示变量xn和y之间存在关联性,V(xn,y)=0表示变量xn和y之间不存在关联性。
4.根据权利要求1所述的方法,其特征在于,步骤2中所述的人工神经网络的节点个数为环境因子个数n与时间因子的个数1之和,也即是n+1;根据神经网络优化理论,人工神经网络隐含层的节点个数为2(n+1)+1;人工神经网络输出变量为历史空气质量浓度监测数据,人工神经网络输出层的节点个数为1。
5.根据权利要求1所述的方法,其特征在于,步骤2中所述的将监测站点历史空气质量浓度监测数据作为期望输出变量来对空气质量浓度预测模型进行训练的步骤包括:
1)将人工神经网络空气质量浓度预测模型中输入层网络节点与隐含层网络节点之间的权值Wijt、隐含层网络节点与输出层网络节点之间的权值Wjt、隐含层节点阈值 和输出层t
节点阈值θ 进行初始化,初始化值取在区间(-1,1)上随机生成且绝对值趋近于0的数;
2)将筛选出的环境因子变量、时间变量和历史空气质量浓度监测数据进行归一化,并将归一化后的环境因子变量和时间作为层节点Xi输入变量,将监测站点历史空气质量浓度监测数据作为期望输出变量y,其中i=1,2,…,n+1,归一化的公式如下:
其中, 为变量xi中的最大值, 为变量xi中的最小值,;ymax为变量yi中的最大值,min
y 为变量yi中的最小值
3)计算隐含层节点Lj的输出,j=1,2,…,2n+3:
Lj=f(netij)
其中,θj表示隐含层节点Lj的阈值,激活函数f(x)采用sigmoid函数,也即是:
4)计算输出层节点Y的输出:
Y=f(netj)
其中,θ表示输出层节点Y的阈值,激活函数f(x)采用sigmoid函数,也即是:
5)将监测站点历史空气质量浓度数据作为期望输出变量y,计算人工神经网络空气质量浓度预测模型的预测值Y与期望输出变量y之间的误差:
e=|Y-y|
6)利用误差e对输入层网络节点与隐含层网络节点之间的权值、隐含层网络节点与输
0
出层网络节点之间的权值、隐含层节点阈值和输出层节点阈值的初始值 θ进行修正;采用的修正公式如下:
其中,η为隐含层网络节点与输出层网络节点之间的权值的训练参数,η′为输入层网络节点与隐含层网络节点之间的权值的训练参数,μ为输出层节点阈值的训练参数,μ′为隐含层节点阈值的训练参数,当误差e减小且收敛时,表明以上参数取值合理;当误差e的大小出现振荡且不收敛的情况时,表明以上参数取值不合理,需分别降低或增加以上不同参数各自的取值,直至误差e减小且收敛;
7)将各空气质量浓度监测站点不同时刻的环境因子、历史空气质量浓度数据和时间因子作为输入层网络节点的输入变量,并按照训练步骤1)~6)不断的对输入层网络节点与隐含层网络节点之间的权值、隐含层网络节点与输出层网络节点之间的权值、隐含层节点阈值和输出层节点阈值进行修正,当人工神经网络空气质量浓度预测模型的预测值Y与期望输出变量y之间的误差e<ε,则停止人工神经网络空气质量浓度预测模型的训练;其中,ε为神经网络模型所需满足的精度要求。
6.根据权利要求1所述的方法,其特征在于,步骤3中所述的对正常工作的监测站点未来时刻空气质量浓度的预测浓度值与该未来时刻的空气质量监测浓度进行比较所得的偏差进行空间差值的步骤包括:
1)首先将正常工作的空气质量浓度监测站点未来时刻空气质量浓度的预测浓度值与该未来时刻的空气质量监测浓度进行比较,获得两者的偏差Δ;
2)选择并计算变异函数,如下式所示:
其中,γ(d)表示区域化变量在空间距离为d时相关性大小,n(d)表示区域内空间距离为d时插值点的个数,y(Pz)表示区域内插值点Pz的属性值,y(Pz+d)区域内插值点Pz+d的属性值;
3)求解Kriging方程组,如下式所示:
其中,Δi、Δj分别表示正常监测站点i、j未来时刻的空气质量浓度的预测值与该未来时刻的空气质量监测浓度修复值之间的差值,λi表示正常监测站点Δi对 的贡献大小,也称为权重系数;
4)根据所求得权重系数,计算未来时刻故障监测站点的空气质量浓度的预测值与该未来时刻的空气质量监测浓度修复值之间的偏差 ,公式如下:

说明书全文

一种城市空气质量浓度监测缺失数据的修复方法

技术领域

[0001] 本发明涉及环境监测与险评估领域,特别涉及利用邻近正常监测站点的空气质量浓度监测数据对由于日常维护、突发情况等原因所导致的空气质量浓度监测缺失数据进行修复的一种空气质量浓度监测缺失数据修复方法。

背景技术

[0002] 在常规的空气质量浓度监测过程中,经常需要对监测站点位置的监测仪器进行校零、校标等日常维护,同时也会遇到通信故障和停电等突发情况,由此导致这些故障监测站点在某时间段内的空气质量浓度监测数据缺失,空气质量浓度监测数据的缺失会影响公众对相关区域内空气质量浓度的及时获取,并降低向公众发布的空气质量浓度监测数据的准确性。因此,需要一种有效对故障监测站点空气质量浓度监测缺失数据的修复方法,以通过相应的技术和方法,对故障监测站点所缺失的空气质量浓度监测数据进行修复,以满足公众对于及时、准确的空气质量浓度监测数据的需求。
[0003] 区域环境因子的变化对于空气质量浓度的高低具有较强影响,同时对于局部区域而言,环境因子随时间变化的趋势相对稳定,因此,一个城市范围内空气质量浓度随时间变化的规律也具有一定的稳定性,可以通过分析历史空气质量浓度监测数据的规律,对未来时刻的空气质量浓度监测数据进行预测。因此,当某监测站点出现了日常维护或突发情况时,会导致空气质量浓度监测数据缺失,故障监测站点的历史空气质量浓度监测数据能够对该监测站点未来时刻的空气质量浓度监测缺失数据进行预测。
[0004] 然而,未来时刻的区域环境因子与历史时刻区域环境因子仍然存在差异,仅利用故障监测站点历史空气质量浓度监测数据对未来时刻缺失的空气质量浓度监测数据进行预测,会导致预测结果与真实监测结果存在一定偏差;但历史与未来时刻的环境因子在空间上具有相关性,使得故障监测站点历史空气质量浓度预测值与真实空气质量监测浓度存在的偏差,可以通过邻近正常工作监测站点上同样的偏差对其进行估算。因此,利用城市范围内邻近正常工作监测站点空气质量监测浓度预测值和真实监测浓度的偏差,以空间相关性理论为基础,对仅以历史空气质量浓度监测数据进行预测的故障监测站预测结果进行修正,可以获得故障监测站点空气质量浓度监测缺失数据较准确的修复结果。

发明内容

[0005] 为了实现准确、及时地对空气质量浓度监测缺失数据进行修复,以制定科学有效的防控措施目的,本发明的技术方案是,一种城市空气质量浓度监测缺失数据的修复方法,包括以下步骤:
[0006] 1、监测站点空气质量浓度关联性环境因子筛选
[0007] 本发明采用的监测站点空气质量浓度关联性环境因子的筛选步骤包括:
[0008] 收集某城市各监测站点位置时间超过一年以上的历史空气质量浓度监测数据和环境因子数据;其中环境因子数据包括:人口密度、地形、交通流量、土地利用类型、气温、风速、风向、气压、湿度、光照;
[0009] 依据所收集到的历史空气质量浓度监测数据和环境因子数据,以这些数据作为变量节点生成的贝叶斯网络节点,同时在所有贝叶斯网络节点之间用线进行连接,以此构成贝叶斯网络的完全连接图;
[0010] 由于收集到的历史空气质量浓度监测数据和环境因子数据是非离散型变量,需要对其进行离散化,在非离散型变量中寻找最优离散点,将非离散型变量转化为离散型变量,离散时最优离散点选择的依据是熵最小原则,熵的计算公式如下:
[0011]
[0012] 其中,K表示非离散型变量中变量的总数;ki表示通过离散点分割后,第i个离散段中非离散型变量的个数;pi表示通过离散点分割后,第i个离散段中非离散型变量个数占非离散型变量总数的比例,G(X)表示通过离散后离散型变量的熵;
[0013] 经上述步骤离散后,计算各离散变量xn的边缘概率P(xn)和各离散变量之间的联合概率P(y,x1,x2,…xn),并依据贝叶斯公式计算离散变量xn与多个变量y、x1、x2…xn-1之间的条件概率P(xn|y,x1,x2,…xn-1);离散变量xn与变量x1、x2…xn-1之间的条件概率P(xn|x1,x2,…,xn-1),计算的公式如下:
[0014]
[0015]
[0016] 通过下面公式确定在贝叶斯网络中变量xn和y之间的关联性是否存在:
[0017]
[0018] 其中,V(xn,x0)=1表示变量xn和y之间存在关联性,V(xn,y)=0表示变量xn和y之间不存在关联性;
[0019] 依次分别对以上各监测站点位置历史空气质量浓度监测数据和环境因子数据等n个变量之间分别进行关联性分析,并根据关联性分析结果,将在所构建的贝叶斯网络完全连接图中不存在关联性的变量之间的对应连接线删除,最终确定贝叶斯网络图;
[0020] 根据上述贝叶斯网络关联性分析结果,确定各监测站点用于未来时刻(T+1)空气质量浓度预测的环境因子;同时为了保证不同监测站点在利用历史空气质量浓度监测数据对未来时刻的空气质量浓度数据进行预测时,所选择的环境因子数据保持一致性,排除不同监测站点由于环境因子数据的差异对于后续未来时刻(T+1)故障监测站点的空气质量浓度的预测值与该时刻(T+1)的空气质量监测浓度修复值之间偏差的影响;因此,需要对获取的各监测站点对空气质量浓度监测数据存在影响的环境因子数据进行筛选,在贝叶斯网络图中,依据关联性分析结果,筛选出不同监测站点共同包含的环境因子作为后续空气质量浓度预测模型的输入变量。
[0021] 2、空气质量浓度正常工作监测站点未来时刻(T+1)空气质量浓度预测[0022] 本发明采用的监测站点未来时刻(T+1)空气质量浓度预测步骤包括:
[0023] 构建一个人工神经网络,按照上述步骤1所筛选出的各监测站点共性环境因子、历史空气质量浓度监测数据和时间因子来构建人工神经网络;其中人工神经网络输入层的节点个数为环境因子个数n与时间因子的个数1之和,也即是n+1;根据神经网络优化理论,人工神经网络隐含层的节点个数2(n+1)+1;人工神经网络输出变量为历史空气质量浓度监测数据,人工神经网络输出层的节点个数1;
[0024] 利用上述步骤筛选出的各监测站点具有关联性的共性环境因子作为后续空气质量浓度预测模型的输入变量,将监测站点历史空气质量浓度监测数据作为期望输出变量,输入到人工神经网络空气质量浓度预测模型中进行迭代训练,具体模型训练的过程如下:
[0025] 将人工神经网络空气质量浓度预测模型中输入层网络节点与隐含层网络节点之间的权值Wijt、隐含层网络节点与输出层网络节点之间的权值Wjt、隐含层节点阈值 和输出t层节点阈值θ 进行初始化,初始化值取在区间(-1,1)上随机生成且绝对值趋近于0的数;
[0026] 将筛选出的环境因子变量、时间变量和历史空气质量浓度监测数据进行归一化,并将归一化后的环境因子变量和时间作为层节点Xi输入变量,将监测站点历史空气质量浓度监测数据作为期望输出变量;
[0027] 计算隐含层节点Lj的输出,j=1,2,…,2n+3:
[0028] Lj=f(netij)
[0029]
[0030] 其中,θj表示隐含层节点Lj的阈值,激活函数f(x)采用sigmoid函数,也即是:
[0031] 计算输出层节点Y的输出:
[0032] Y=f(netj)
[0033]
[0034] 其中,θ表示输出层节点Y的阈值,激活函数f(x)采用sigmoid函数,也即是:
[0035] 将监测站点历史空气质量浓度数据作为期望输出变量y,计算人工神经网络空气质量浓度预测模型的预测值Y与期望输出变量y之间的误差:
[0036] e=|Y-y|
[0037] 利用误差e对输入层网络节点与隐含层网络节点之间的权值、隐含层网络节点与输出层网络节点之间的权值、隐含层节点阈值和输出层节点阈值的初始值0
θ 进行修正;采用的修正公式如下:
[0038]
[0039]
[0040] 其中,η隐含层网络节点与输出层网络节点之间的权值的训练参数,η′输入层网络节点与隐含层网络节点之间的权值的训练参数,μ输出层节点阈值的训练参数,μ′隐含层节点阈值的训练参数,以上参数需要根据各站点的实际情况,按照训练的速度和精度要求进行试验,当误差e减小且收敛时,表明以上参数取值合理;当误差e的大小出现振荡且不收敛的情况时,表明以上参数取值不合理,需分别降低或增加以上不同参数各自的取值,经过多次不断的调整和试验,直至误差e减小并收敛;
[0041] 将各空气质量浓度监测站点不同时刻的环境因子、历史空气质量浓度数据和时间因子作为输入层网络节点的输入变量,并按照步骤不断的对输入层网络节点与隐含层网络节点之间的权值、隐含层网络节点与输出层网络节点之间的权值、隐含层节点阈值和输出层节点阈值进行修正,当人工神经网络空气质量浓度预测模型的预测值Y与期望输出变量y之间的误差e<ε,则停止人工神经网络空气质量浓度预测模型的训练;其中,ε为神经网络模型所需满足的精度要求;
[0042] 当人工神经网络空气质量浓度预测模型训练完成后,通过未来时刻(T+1)的各监测站点共同相关的环境因子和时间因子构成输入变量,将其输入到构建完成的人工神经网络空气质量浓度预测模型中,进行空气质量浓度监测站点未来时刻(T+1)空气质量浓度值的预测。
[0043] 3、未来时刻(T+1)故障监测站点空气质量浓度缺失数据的修复,采用的步骤包括:
[0044] 将上述步骤2中正常工作的空气质量浓度监测站点未来时刻(T+1)空气质量浓度的预测浓度值与该时刻(T+1)的空气质量监测浓度进行比较,获得两者的偏差Δ;
[0045] 未来时刻(T+1)空气质量浓度的预测值与该时刻(T+1)的空气质量监测浓度之间的偏差Δ,在空间上具有空间相关性,可以利用该偏差Δ来对未来时刻(T+1)故障监测站点空气质量监测浓度进行修复;所以,可以通过对该偏差Δ进行空间插值,获得未来时刻(T+1)故障监测站点的空气质量浓度的预测值与该时刻(T+1)的空气质量监测浓度修复值之间的偏差Δ;
[0046] 利用上述步骤2获得的故障监测站点未来时刻(T+1)空气质量浓度的神经网络预测值,加上未来时刻(T+1)故障监测站点的空气质量浓度的预测值与该时刻(T+1)的空气质量监测浓度修复值之间的偏差Δ,就可以获得故障监测站点时刻(T+1)的空气质量监测浓度修复值。
[0047] 本发明通过首先收集城市范围内各个监测站点的历史空气质量浓度监测数据和环境因子数据(包括:人口密度、地形、交通流量、土地利用类型、气温、风速、风向、气压、湿度、光照),并对环境因子数据进行筛选,获取各个监测站点上对空气质量浓度监测数据存在影响的共性环境因子数据;其次利用各个监测站点的历史空气质量浓度的监测数据和筛选后的环境因子数据对各个监测站点未来时刻的空气质量浓度监测数据进行预测;然后将正常工作监测站点的未来时刻监测数据和基于历史数据预测浓度进行比较,获取未来时刻监测浓度与预测浓度的偏差,并依据空间相关性理论对故障监测站点未来时刻的空气质量监测浓度与基于历史数据的预测浓度的偏差进行估算;最后利用上述步骤的故障监测站点“偏差”对故障站点仅以历史监测数据预测未来时刻空气质量浓度结果进行修正,获得故障监测站点未来时刻修复后的空气质量浓度监测数据。
[0048] 与现有方法相比,本发明的技术效果在于:(1)本方法是在监测站点空气质量浓度监测数据缺失情况下,发明的一种耦合人工智能与地理信息理论和技术的新型空气质量浓度监测缺失数据修复方法;(2)同时本方法是一种较为精确的空气质量浓度监测缺失数据修复方法,本方法以空间相关性理论为基础,融合了各监测站点历史和未来时刻空气质量浓度的情景偏差,对仅以历史空气质量浓度监测数据和环境因子数据进行预测的故障监测站预测结果进行修正,修复结果较为精确;(3)本方法还是一种比较高效的故障监测站点空气质量浓度监测数据修复方法,所需要的技术和数据可以实时获取,算法高效,能够快速修复故障监测站点空气质量浓度监测缺失数据。附图说明
[0049] 图1为本发明的流程图,其中(a)表示监测站点空气质量浓度关联性环境因子的筛选流程,(b)表示空气质量浓度监测站点未来时刻(T+1)空气质量浓度预测,(c)表示未来时刻(T+1)故障监测站点空气质量浓度监测数据值的修复;
[0050] 图2为本发明的原理,其中:Y为T+1时刻人工神经网络空气质量浓度预测模型的预测值,y′为T+1时刻空气质量监测浓度修复值,y为T+1时刻正常监测站点空气质量监测浓度;
[0051] 图3为本发明贝叶斯网络原理图,其中V(0,n)表示因变量0与自变量n之间的依赖或因果关系,变量之间不存在连接边时说明变量之间不存在依赖或因果关系;变量之间依赖或因果大小的衡量用条件概率值表示P(n|0);
[0052] 图4为本发明人工神经网络空气质量浓度预测模型结构。具体实施方式:
[0053] 下面是对本发明一个优选实施例,结合附图进行的详细说明。
[0054] 1、监测站点空气质量浓度关联性环境因子筛选;本发明采用的监测站点空气质量浓度关联性环境因子筛选步骤包括:
[0055] 首先,收集城市范围内各监测站点位置时间超过一年以上的历史空气质量浓度监测数据和环境因子数据;其中环境因子数据包括:人口密度、地形、交通流量、土地利用类型、气温、风速、风向、气压、湿度、光照;
[0056] 然后,在各监测站点位置,利用以上收集到的历史空气质量浓度监测数据和环境因子数据,采用贝叶斯网络的算法,对空气质量浓度的历史监测数据和环境因子数据进行关联性分析,确定与空气质量浓度具有关联性的环境因子;贝叶斯网络的原理如图3所示:
[0057] (1)依据所收集到的历史空气质量浓度监测数据和环境因子数据,以这些数据作为变量节点生成的贝叶斯网络节点,同时在所有贝叶斯网络节点之间用线进行连接,以此构成贝叶斯网络的完全连接图;
[0058] (2)由于收集到的历史空气质量浓度监测数据和环境因子数据是非离散型变量,需要对其进行离散化,在非离散型变量中寻找最优离散点,将非离散型变量转化为离散型变量,离散时最优离散点选择的依据是熵最小原则,熵的计算公式如下:
[0059]
[0060] 其中,K表示非离散型变量中变量的总数;ki表示通过离散点分割后,第i个离散段中非离散型变量的个数;pi表示通过离散点分割后,第i个离散段中非离散型变量个数占非离散型变量总数的比例,G(X)表示通过离散后离散型变量的熵;
[0061] (3)经上述步骤离散后,计算各离散变量xn的边缘概率P(xn)和各离散变量之间的联合概率P(y,x1,x2,…xn),并依据贝叶斯公式计算离散变量xn与多个变量y、x1、x2…xn-1之间的条件概率P(xn|y,x1,x2,…xn-1);离散变量xn与变量x1、x2…xn-1之间的条件概率P(xn|x1,x2,…xn-1),计算的公式如下:
[0062]
[0063]
[0064] (4)通过下面公式确定在贝叶斯网络中变量xn和x0之间的关联性是否存在:
[0065]
[0066] 其中,V(xn,y)=1表示变量xn和y之间存在关联性,V(xn,y)=0表示变量xn和y之间不存在关联性;
[0067] (5)依次对以上的n个变量之间分别进行关联性分析,并根据关联性分析结果,将在步骤(1)中所构建的贝叶斯网络完全连接图中不存在关联性的变量之间的对应连接线删除,最终确定贝叶斯网络图;
[0068] 最后,根据贝叶斯网络关联性分析结果,确定各监测站点用于未来时刻(T+1)空气质量浓度预测的环境因子;同时为了保证不同监测站点在利用历史空气质量浓度监测数据对未来时刻的空气质量浓度数据进行预测时,所选择的环境因子数据保持一致性,排除不同监测站点由于环境因子数据的差异对于后续未来时刻(T+1)故障监测站点的空气质量浓度的预测值与该时刻(T+1)的空气质量监测浓度修复值之间偏差的影响;因此,需要对获取的各监测站点对空气质量浓度监测数据存在影响的环境因子数据进行筛选,在贝叶斯网络图中,依据关联性分析结果,筛选出不同监测站点共同包含的环境因子作为后续空气质量浓度预测模型的输入变量共性环境因子。
[0069] 2、空气质量浓度正常工作监测站点未来时刻(T+1)空气质量浓度预测,采用的步骤包括:
[0070] 本发明采用的监测站点未来时刻(T+1)空气质量浓度预测步骤包括:
[0071] 首先,构建一个人工神经网络,按照步骤1所筛选出的各监测站点共性环境因子、历史空气质量浓度监测数据和时间因子来构建人工神经网络;其中人工神经网络输入层的节点个数为环境因子个数n与时间因子的个数1之和,也即是n+1;根据神经网络优化理论,人工神经网络隐含层的节点个数2(n+1)+1;人工神经网络输出变量为历史空气质量浓度监测数据,人工神经网络输出层的节点个数1;构建好的人工神经网络空气质量浓度预测模型结构如图4所示;
[0072] 然后,利用上述步骤筛选出的各监测站点具有关联性的共性环境因子作为后续空气质量浓度预测模型的输入变量,将监测站点历史空气质量浓度监测数据作为期望输出变量,输入到人工神经网络空气质量浓度预测模型中进行迭代训练,具体模型训练的过程如下:
[0073] (1)将人工神经网络空气质量浓度预测模型中输入层网络节点与隐含层网络节点t t之间的权值Wij、隐含层网络节点与输出层网络节点之间的权值Wj、隐含层节点阈值 和t
输出层节点阈值θ 进行初始化,初始化值取区间在(-1,1)上随机生成且值较小的数;
[0074] (2)将筛选出的环境因子变量、时间变量和历史空气质量浓度监测数据进行归一化,并将归一化后的环境因子变量和时间作为层节点Xi输入变量,将监测站点历史空气质量浓度监测数据作为期望输出变量y,其中i=1,2,…,n+1,归一化的公式如下:
[0075]
[0076] 其中, 为变量xi中的最大值, 为变量xi中的最小值,;ymax为变量yi中的最min大值,y 为变量yi中的最小值
[0077] (3)计算隐含层节点Lj的输出,j=1,2,…,2n+3:
[0078] Lj=f(netij)
[0079]
[0080] 其中,θj表示隐含层节点Lj的阈值,激活函数f(x)采用sigmoid函数,也即是:
[0081] (4)计算输出层节点Y的输出:
[0082] Y=f(netj)
[0083]
[0084] 其中,θ表示输出层节点Y的阈值,激活函数f(x)采用sigmoid函数,也即是:
[0085] (5)将监测站点历史空气质量浓度数据作为期望输出变量y,计算人工神经网络空气质量浓度预测模型的预测值Y与期望输出变量y之间的误差:
[0086] e=|Y-y|
[0087] (6)利用误差e对输入层网络节点与隐含层网络节点之间的权值、隐含层网络节点与输出层网络节点之间的权值、隐含层节点阈值和输出层节点阈值的初始值0
θ 进行修正;采用的修正公式如下:
[0088]
[0089]
[0090] 其中,η隐含层网络节点与输出层网络节点之间的权值的训练参数,η′输入层网络节点与隐含层网络节点之间的权值的训练参数,μ输出层节点阈值的训练参数,μ′隐含层节点阈值的训练参数,以上参数需要根据各站点的实际情况,按照训练的速度和精度要求进行试验,当误差e减小且收敛时,表明以上参数取值合理;当误差e的大小出现振荡且不收敛的情况时,表明以上参数取值不合理,需分别降低或增加以上不同参数各自的取值,经过多次不断的调整和试验,直至误差e减小并收敛;
[0091] (7)将各空气质量浓度监测站点不同时刻的环境因子、历史空气质量浓度数据和时间因子作为输入层网络节点的输入变量,并按照步骤(1)~(6)不断的对输入层网络节点与隐含层网络节点之间的权值、隐含层网络节点与输出层网络节点之间的权值、隐含层节点阈值和输出层节点阈值进行修正,当人工神经网络空气质量浓度预测模型的预测值Y与期望输出变量y之间的误差e<ε,则停止人工神经网络空气质量浓度预测模型的训练;其中,ε为神经网络模型所需满足的精度要求;
[0092] 最后,通过未来时刻(T+1)的各监测站点共同相关的环境因子和时间因子构成输入变量,将其输入到构建完成的人工神经网络空气质量浓度预测模型中,进行空气质量浓度监测站点未来时刻(T+1)空气质量浓度值的预测。
[0093] 3、未来时刻(T+1)故障监测站点空气质量浓度缺失数据的修复,采用的步骤包括:
[0094] 首先,将上述步骤2中正常工作的空气质量浓度监测站点未来时刻(T+1)空气质量浓度的预测浓度值与该时刻(T+1)的空气质量监测浓度进行比较,获得两者的偏差Δ;
[0095] 其次,未来时刻(T+1)的区域环境因子与历史的区域环境因子仍然存在差异,仅利用故障监测站点历史空气质量浓度监测数据对未来时刻缺失的空气质量浓度监测数据进行预测,会导致预测结果与真实的监测结果存在一定偏差Δ;但是这种偏差是由于历史与未来时刻的环境因子差异所导致的,同时环境因子在空间上具有的相关性,使得故障监测站点历史空气质量浓度预测值与真实空气质量监测浓度存在的偏差,可以通过邻近正常工作监测站点上同样的偏差对其进行估算。因此,未来时刻(T+1)空气质量浓度的预测值与该时刻(T+1)的空气质量监测浓度之间的偏差Δ,在空间上也具有空间相关性,可以利用该偏差Δ来对未来时刻(T+1)故障监测站点空气质量监测浓度进行修复;所以,可以通过对该偏差Δ进行空间插值,获得未来时刻(T+1)故障监测站点的空气质量浓度的预测值与该时刻(T+1)的空气质量监测浓度修复值之间的偏差Δ;空间插值原理如下:
[0096] (1)选择并计算变异函数,如下式所示:
[0097]
[0098] 其中,γ(d)表示区域化变量在空间距离为d时相关性大小,n(d)表示区域内空间距离为d时插值点的个数,y(Pz)表示区域内插值点Pz的属性值,y(Pz+d)区域内插值点Pz+d的属性值;
[0099] (2)求解Kriging方程组,如下式所示:
[0100]
[0101] 其中,Δi、Δj分别表示正常监测站点i、j未来时刻(T+1)的空气质量浓度的预测值与该时刻(T+1)的空气质量监测浓度修复值之间的差值,λi表示正常监测站点Δi对的贡献大小,也称为权重系数;
[0102] (3)根据以上步骤(2)所求得权重系数,计算未来时刻(T+1)故障监测站点的空气质量浓度的预测值与该时刻(T+1)的空气质量监测浓度修复值之间的偏差 ,公式如下:
[0103]
[0104] 最后,利用上述步骤2获得的故障监测站点未来时刻(T+1)空气质量浓度的神经网络预测值,加上未来时刻(T+1)故障监测站点的空气质量浓度的预测值与该时刻(T+1)的空气质量监测浓度修复值之间的偏差 ,就可以获得故障监测站点时刻(T+1)的空气质量监测浓度修复值。
[0105] 在以上对本发明的详细介绍中,应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈