基于RBF神经网络的经济用水数据空间离散化方法专利检索-地理信息系统电信专利检索查询-专利查询网

基于RBF神经网络的经济用水数据空间离散化方法

阅读：930发布：2021-12-24

专利汇可以提供基于RBF神经网络的经济用水数据空间离散化方法专利检索，专利查询，专利分析的服务。并且本发明公开了一种基于RBF神经网络的经济用水数据空间离散化方法，包括：获得基本计算单元；获得基本计算单元和行政单元空间要素数据集；对生活用水、工业用水和农业用水采用定额法补充，对生态环境用水量采用相关因子分摊法进行补充；对生态环境用水量计算公式中的权重系数采用组合赋权法确定；经过模拟计算得到基本计算单元上离散预测结果；进行结果修正；按基本计算单元的水资源分区属性逐级汇总得到相应的用水数据。本发明提出的基于RBF神经网络的经济用水数据空间离散化方法，可获得全国各级水资源分区经济社会及用水数据，有助于水资源综合管理。，下面是基于RBF神经网络的经济用水数据空间离散化方法专利的具体信息内容。

权利要求

1.一种基于RBF神经网络的经济用水数据空间离散化方法，其特征在于，包括：
将县级行政区与水资源三级区矢量图进行叠加嵌套，获得每个县级行政单元所属不同水资源三级区部分的基本空间单元，作为基本计算单元；
将各类土地利用数据和DEM数据统计到各基本计算单元和行政单元空间上，获得基本计算单元和行政单元空间要素数据集；
根据各级行政单元经济社会用水数据，对县级行政单元生活用水、工业用水和农业用水采用定额法补充，对生态环境用水量采用相关因子分摊法进行补充；
对生态环境用水量采用相关因子分摊法进行补充得到的计算公式中的权重系数采用组合赋权法确定；
基于RBF神经网络模型，利用数据指标间相关关系，经过模拟计算得到基本计算单元上离散预测值，从而将县级行政单元经济社会用水数据展布到基本计算单元上；
以各基本计算单元预测值作为权重由所属县级行政单元总值向下分摊进行结果修正；
将修正后的经济社会用水数据值，按基本计算单元的水资源分区属性逐级汇总得到相应的用水数据。
2.根据权利要求1所述的方法，其特征在于，所述将县级行政区与水资源三级区矢量图进行叠加嵌套，获得每个县级行政单元所属不同水资源三级区部分的基本空间单元，作为基本计算单元的步骤包括：
采用地理信息系统软件Arc GIS，对县级行政区与水资源三级区矢量图进行叠加嵌套，获得每个县级行政单元所属不同水资源三级区部分的基本空间单元，作为基本计算单元；
将小于所在县级行政区面积10％的基本计算单元向邻近面积最大的基本计算单元合并。
3.根据权利要求1所述的方法，其特征在于，所述将各类土地利用数据和DEM数据统计到各基本计算单元和行政单元空间上，获得基本计算单元和行政单元空间要素数据集的步骤包括：
利用获得基本计算单元矢量图和包括各类土地利用数据和DEM数据的空间数据，基于Arc GIS区域统计(Zonal Statistics)模块，将各类土地利用数据和DEM数据统计到各基本计算单元上；
利用行政区单元矢量图统计获得各级行政单元各类土地利用数据和DEM数据；
获得基本计算单元和行政单元空间要素数据集，用于空间离散化分析。
4.根据权利要求1所述的方法，其特征在于，所述基于RBF神经网络模型，利用数据指标间相关关系，经过模拟计算得到基本计算单元上离散预测值，从而将县级行政单元经济社会用水数据展布到基本计算单元上的步骤包括：
用径向基函数作为隐含层神经元的基，构成隐含层空间，隐含层对输入矢量进行变换，将低维的模式输入数据变换到高维空间内，使得在低维空间内的线性不可分问题在高维空间内线性可分；所述径向基函数采用高斯函数，计算公式为：
其中：x为是n维输入向量；ci为第i个径向基函数的中心，是与x具有相同维数的向量；σi是第i个基函数的宽度；m是隐含层神经元的个数；||x-ci||为矢量x与ci之间的欧式范数；
模拟过程中，将任意2/3的数据样本进行训练学习，模拟因变量与其相关的自变量间复杂的非线性关系；同时，将另外1/3的样本作为验证数据，以验证训练学习效果；
分别计算训练学习阶段和验证阶段模拟结果与实测样本间的相关系数R12和R22，当两者均大于常数α(0<α<1)时认为训练效果合格，取α＝0.7～0.8；
以验证合格的神经网络预测模型，输入基本计算单元上与因变量相关的自变量指标数据，经过模拟计算得到基本计算单元上离散预测结果。
5.根据权利要求1所述的方法，其特征在于，所述以各基本计算单元预测值作为权重由所属县级行政单元总值向下分摊进行结果修正的步骤包括：
采用计算公式进行修正；
其中：为神经网络模型预测得到经济社会以及用水指标在基本计算单元i上的值；为基本计算单元i所属县级行政单元上经修正后的数据值；为修正后的基本计算单元i的数据值。
6.根据权利要求1所述的方法，其特征在于，所述将修正后的经济社会和用水数据值，按基本计算单元的水资源分区属性逐级汇总得到相应的用水数据的步骤包括：
采用计算公式进行汇总；
其中：为修正后的基本计算单元i的数据值；为基本计算单元i所属水资源三级区j对应指标数据值；为水资源三级区j所属水资源二级区k对应指标数据值；
为水资源二级区k所属水资源一级区l对应指标数据值。
7.根据权利要求1至6任意一项所述的方法，其特征在于，所述对生态环境用水量采用相关因子分摊法进行补充的步骤包括：
生态环境用水需求的影响因素包括林地、草地、水域、城镇用地、GDP和非农业人口，各级行政单元生态环境用水量计算公式为
其中：ki(i＝1,2,3,4,5,6)为权重系数；为行政单元i生态环境用水量，计算单位为亿m3；为上一级行政单元生态环境用水量，计算单位为亿m3；为行政单元i林地面积，计算单位为kha；为上一级行政单元林地面积，计算单位为kha；
为行政单元i草地面积，计算单位为kha；为上一级行政单元草地面积，计算单位为kha；为行政单元i水域面积，计算单位为kha；为上一级行政单元水域面积，计算单位为kha；为行政单元i城镇用地面积，计算单位为kha；
为上一级行政单元城镇用地面积，计算单位为kha；GDPi为行政单元i国民生产总值，计算单位为万元；GDP上为上一级行政单元国民生产总值，计算单位为万元；为行政单元i非农业人口数，计算单位为万人；为上一级行政单元非农业人口数，计算单位为万人。
8.根据权利要求7所述的方法，其特征在于，所述对生态环境用水量采用相关因子分摊法进行补充得到的计算公式中的权重系数采用组合赋权法确定的步骤包括：
对各指标样本数据进行归一化处理，计算公式如下：
其中：Yki为第k个指标的第i个样本数据归一化后的值；Vki为第k个指标的第i个样本数据；
分别利用归一化样本数据进行熵值法和复相关系数法赋权：
熵值法赋权：计算各评价指标的熵值，然后把熵值转化为权重，计算公式如下：
其中，Hi为第i个指标的熵值；Yki为第k个指标的第i个样本数据归一化后的值；Whi为第i个指标的熵值权重；
复相关系数法赋权：首先求出m个评价指标的相关系数矩阵R：
若要计算第m个指标Xm与其他m-1个指标间的复相关系数，对矩阵R分解如下：
其中：R-m为除去Xm的相关阵；为rm的转置矩阵；
得到Xm对其他m-1个指标的复相关系数为：
将R的第i行、第i列置换到最后一行、最后一列，再根据上式求出计算得到m个复相关系数ρi(i＝1,2,…,m)；
将复相关系数求倒数，并作归一化处理得到指标权重：
式中：Wρi为第i个指标的权重；
组合赋权：将熵值法和复相关系数法计算得到的权重值相乘，并作归一化处理即可得到最终组合权重值；计算公式如下：
式中：Wi为最终第i个指标的组合权重，计算所得Wi即为生态环境用水量补充权重系数ki(i＝1,2,3,4,5,6)。
9.根据权利要求8所述的方法，其特征在于，所述对生态环境用水量采用相关因子分摊法进行补充得到的计算公式中的权重系数采用组合赋权法确定的步骤还包括：
在补充后数据的基础上，以下级行政单元值作为权重由上级行政单元总值逐级向下分摊进行数据补充，计算公式为
其中：为上一级数据修正后的数据总值，全国总数不作修正；为修正后的行政单元i的数据值；为行政单元i的原始数据值；修正后的数据特征为：全国总值等于各省之和，各省总值等于其下各市之和，各市总值等于其下各区县之和。
10.根据权利要求9所述的方法，其特征在于，所述对县级行政单元生活用水、工业用水和农业用水采用定额法补充的步骤包括：
对县级行政单元生活用水量的补充：
假设上一级行政区单元生活用水综合定额与其下一级行政单元生活用水综合定额相同，并满足计算公式
其中：为行政单元i当年生活用水量，计算单位为亿m3；Ni为行政单元i当年用水人口数，计算单位为万人；为行政单元i的上级行政单元当年人均生活用水综合定额，计算单位为L/人·d；为行政单元i的上级行政单元当年生活用水量，计算单位为亿m3；N上为行政单元i的上级行政单元当年用水人口数，计算单位为万人；
对县级行政单元工业用水量的补充：
以工业增加值作为用水定额主要影响因素，假设上一级行政区单元工业用水定额与其下一级行政单元工业用水综合定额相等，并满足计算公式
其中：为行政单元i当年工业用水量，计算单位为亿m3；为行政单元i当年工业增加值，计算单位为万元；为行政单元i的上级行政单元当年万元工业增加值用水量，计算单位为亿m3/万元；为行政单元i的上级行政单元当年工业用水总量，计算单位为亿m3；
为行政单元i的上级行政单元当年工业增加值，计算单位为万元；
对县级行政单元农业用水量的补充：
在上级行政单元降水、蒸发及其他灌溉技术水平一定的条件下，假设下级行政单元作物灌溉强度与相应上级行政单元相同，由灌溉面积计算下级行政单元农业用水量，并满足计算公式
其中：为行政单元i农业用水量，计算单位为亿m3；为行政单元i农业灌溉面积，计算单位为kha；为上一级行政单元单位面积农业灌溉用水量，计算单位为亿m3/kha；
为上级行政单元农业用水量，计算单位为亿m3；为上级行政单元灌溉面积，计算单位为kha。

说明书全文

基于RBF神经网络的经济用水数据空间离散化方法

技术领域

[0001] 本发明涉及水利科学技术领域，特别是指一种基于RBF神经网络的经济用水数据空间离散化方法。

背景技术

[0002] 经济社会用水数据主要按行政单元统计而来，而其边界与水资源区边界不重合，导致水资源区用水数据的获得十分困难。现有的经济社会用水数据还存在共享困难、统计
困难与统计数据多样等问题。利用计算机技术获得水资源区经济社会用水数据，对于完善
水资源数据基础以支撑水资源行政区域与流域统一管理和减小人力普查投入十分重要。

[0003] 用水是指为了某种经济或社会目的，使用水资源某种属性的行为，是通过水资源开发，用水主体运用和使用已开发水资源的方式与方法的总称。经济社会用水指采用取水、输水工程措施，从河流、湖泊、水库和地下水层将水引至用水地区，满足城乡生产和生活需要的水量，包括生活用水、工业用水、农业用水和生态环境用水四项。

[0004] 水资源区是根据水资源的自然、社会和经济属性，按照开发、利用、治理、配置、节约、保护要求，将流域水系划分而得来。水资源分区主要包括水资源一级区、水资源二级区和水资源三级区。根据全国水资源分区标准，水资源一级区主要包括我国境内的10个大型流域，将各个水资源一级区细分为水资源二级区，各二级区再细分为水资源三级区。由于水资源区与行政区边界不重叠，导致一个县级行政区被多个水资源三级区分割。目前，按各级水资源分区统计的用水数据十分匮乏。

[0005] 综上所述，提出一种可靠的经济社会用水数据统计方法，以获得各水资源区上用水数据的分布情况是急待解决的问题。

发明内容

[0006] 有鉴于此，本发明的目的在于提出一种基于RBF神经网络的经济用水数据空间离散化方法，以获得各水资源区上用水数据的分布情况，从而获得全国各级水资源分区经济
社会及用水数据，有助于水资源综合管理。

[0007] 基于上述目的本发明提供的基于RBF神经网络的经济用水数据空间离散化方法，包括：

[0008] 将县级行政区与水资源三级区矢量图进行叠加嵌套，获得每个县级行政单元所属不同水资源三级区部分的基本空间单元，作为基本计算单元；

[0009] 将各类土地利用数据和DEM数据统计到各基本计算单元和行政单元空间上，获得基本计算单元和行政单元空间要素数据集；

[0010] 根据各级行政单元经济社会用水数据，对县级行政单元生活用水、工业用水和农业用水采用定额法补充，对生态环境用水量采用相关因子分摊法进行补充；

[0011] 对生态环境用水量采用相关因子分摊法进行补充得到的计算公式中的权重系数采用组合赋权法确定；

[0012] 基于RBF神经网络模型，利用数据指标间相关关系，经过模拟计算得到基本计算单元上离散预测值，从而将县级行政单元经济社会用水数据展布到基本计算单元上；

[0013] 以各基本计算单元预测值作为权重由所属县级行政单元总值向下分摊进行结果修正；

[0014] 将修正后的经济社会和用水数据值，按基本计算单元的水资源分区属性逐级汇总得到相应的用水数据。

[0015] 在一些实施方式中，所述将县级行政区与水资源三级区矢量图进行叠加嵌套，获得每个县级行政单元所属不同水资源三级区部分的基本空间单元，作为基本计算单元的步
骤包括：

[0016] 采用地理信息系统软件Arc GIS，对县级行政区与水资源三级区矢量图进行叠加嵌套，获得每个县级行政单元所属不同水资源三级区部分的基本空间单元，作为基本计算
单元；

[0017] 将小于所在县级行政区面积10%的基本计算单元向邻近面积最大的基本计算单元合并。

[0018] 在一些实施方式中，所述将各类土地利用数据和DEM数据统计到各基本计算单元和行政单元空间上，获得基本计算单元和行政单元空间要素数据集的步骤包括：

[0019] 利用获得基本计算单元矢量图和包括各类土地利用数据和DEM数据的空间数据，基于Arc GIS区域统计（Zonal Statistics）模块，将各类土地利用数据和DEM数据统计到各基本计算单元上；

[0020] 利用行政区单元矢量图统计获得各级行政单元各类土地利用和DEM数据；

[0021] 获得基本计算单元和行政单元空间要素数据集，用于空间离散化分析。

[0022] 在一些实施方式中，所述基于RBF神经网络模型，利用数据指标间相关关系，经过模拟计算得到基本计算单元上离散预测值，从而将县级行政单元经济社会用水数据展布到
基本计算单元上的步骤包括：

[0023] 用径向基函数作为隐含层神经元的基，构成隐含层空间，隐含层对输入矢量进行变换，将低维的模式输入数据变换到高维空间内，使得在低维空间内的线性不可分问题在
高维空间内线性可分；所述径向基函数采用高斯函数，计算公式为：

[0024] 其中：x为是n维输入向量；ci为第i个径向基函数的中心，是与x具有相同维数的向量；σi是第i个基函数的宽度；m是隐含层神经元的个数；||x-ci||为矢量x与ci之间的欧式范数；

[0025] 模拟过程中，将任意2/3的数据样本进行训练学习，模拟因变量与其相关的自变量间复杂的非线性关系；同时，将另外1/3的样本作为验证数据，以验证训练学习效果；

[0026] 分别计算训练学习阶段和验证阶段模拟结果与实测样本间的相关系数R12和R22，当两者均大于常数α（0<α<1）时认为训练效果合格，取α=0.7～0.8；

[0027] 以验证合格的神经网络预测模型，输入基本计算单元上与因变量相关的自变量指标数据，经过模拟计算得到基本计算单元上离散预测结果。

[0028] 在一些实施方式中，所述以各基本计算单元预测值作为权重由所属县级行政单元总值向下分摊进行结果修正的步骤包括：

[0029] 采用计算公式进行修正；

[0030] 其中：为神经网络模型预测得到经济社会以及用水指标在基本计算单元i上的值；为基本计算单元i所属县级行政单元上经修正后的数据值；为修正后的基本
计算单元i的数据值。

[0031] 在一些实施方式中，所述将修正后的经济社会和用水数据值，按基本计算单元的水资源分区属性逐级汇总得到相应的用水数据的步骤包括：

[0032] 采用计算公式进行汇总；

[0033] 其中：为修正后的基本计算单元i的数据值；为基本计算单元i所属水资源三级区j对应指标数据值；为水资源三级区j所属水资源二级区k对应指标数据值；
为水资源二级区k所属水资源一级区l对应指标数据值。

[0034] 在一些实施方式中，所述对生态环境用水量采用相关因子分摊法进行补充的步骤包括：

[0035] 生态环境用水需求的影响因素包括林地、草地、水域、城镇用地、GDP和非农业人口，各级行政单元生态环境用水量计算公式为

[0036]

[0037] 其中：ki(i=1,2,3,4,5,6)为权重系数；为行政单元i生态环境用水量，计算单位为亿m3；为上一级行政单元生态环境用水量，计算单位为亿m3；为行政单
元i林地面积，计算单位为kha；为上一级行政单元林地面积，计算单位为kha；
为行政单元i草地面积，计算单位为kha；为上一级行政单元草地面积，计算
单位为kha；为行政单元i水域面积，计算单位为kha；为上一级行政单元水
域面积，计算单位为kha；为行政单元i城镇用地面积，计算单位为kha；为上
一级行政单元城镇用地面积，计算单位为kha；GDPi为行政单元i国民生产总值，计算单位为万元；GDP上为上一级行政单元国民生产总值，计算单位为万元；为行政单元i非农业
人口数，计算单位为万人；为上一级行政单元非农业人口数，计算单位为万人。

[0038] 在一些实施方式中，所述对生态环境用水量采用相关因子分摊法进行补充得到的计算公式中的权重系数采用组合赋权法确定的步骤包括：

[0039] 对各指标样本数据进行归一化处理，计算公式如下：

[0040]

[0041] 其中：Yki为第k个指标的第i个样本数据归一化后的值；Vki为第k个指标的第i个样本数据；

[0042] 分别利用归一化样本数据进行熵值法和复相关系数法赋权：

[0043] 熵值法赋权：计算各评价指标的熵值，然后把熵值转化为权重，计算公式如下：

[0044]

[0045]

[0046] 其中，Hi为第i个指标的熵值；Yki为第k个指标的第i个样本数据归一化后的值；Whi为第i个指标的熵值权重；

[0047] 复相关系数法赋权：首先求出m个评价指标的相关系数矩阵R：

[0048]

[0049] 若要计算第m个指标Xm与其他m-1个指标间的复相关系数，对矩阵R分解如下：

[0050]

[0051] 其中：R-m为除去Xm的相关阵；为rm的转置矩阵；

[0052] 得到Xm对其他m-1个指标的复相关系数为：

[0053]

[0054] 将R的第i行、第i列置换到最后一行、最后一列，再根据上式求出计算得到m个复相关系数ρi(i=1,2,…,m)；

[0055] 将复相关系数求倒数，并作归一化处理得到指标权重：

[0056]

[0057] 式中：Wρi为第i个指标的权重；

[0058] 组合赋权：将熵值法和复相关系数法计算得到的权重值相乘，并作归一化处理即可得到最终组合权重值；计算公式如下：

[0059]

[0060] 式中：Wi为最终第i个指标的组合权重，计算所得Wi即为生态环境用水量补充权重系数K（i i=1,2,3,4,5,6）。

[0061] 在一些实施方式中，所述对生态环境用水量采用相关因子分摊法进行补充得到的计算公式中的权重系数采用组合赋权法确定的步骤还包括：

[0062] 在补充后数据的基础上，以下级行政单元值作为权重由上级行政单元总值逐级向下分摊进行数据补充，计算公式为

[0063] 其中：为上一级数据修正后的数据总值，全国总数不作修正；为修正后的行政单元i的数据值；为行政单元i的原始数据值；修正后的数据特征为：全国总值
等于各省之和，各省总值等于其下各市之和，各市总值等于其下各区县之和。

[0064] 在一些实施方式中，所述对县级行政单元生活用水、工业用水和农业用水采用定额法补充的步骤包括：

[0065] 对县级行政单元生活用水量的补充：

[0066] 假设上一级行政区单元生活用水综合定额与其下一级行政单元生活用水综合定额相同，并满足计算公式

[0067] 其中：为行政单元i当年生活用水量，计算单位为亿m3；Ni为行政单元i当年用水人口数，计算单位为万人；为行政单元i的上级行政单元当年人均生活用水综合
定额，计算单位为L/人·d；为行政单元i的上级行政单元当年生活用水量，计算单位
3 上
为亿m；N 为行政单元i的上级行政单元当年用水人口数，计算单位为万人；

[0068] 对县级行政单元工业用水量的补充：

[0069] 以工业增加值作为用水定额主要影响因素，假设上一级行政区单元工业用水定额与其下一级行政单元工业用水综合定额相等，并满足计算公式

[0070] 其中：为行政单元i当年工业用水量，计算单位为亿m3；为行政单元i当年工业增加值，计算单位为万元；为行政单元i的上级行政单元当年万元工业增加值用水
量，计算单位为亿m3/万元；为行政单元i的上级行政单元当年工业用水总量，计算单位
为亿m3；为行政单元i的上级行政单元当年工业增加值，计算单位为万元；

[0071] 对县级行政单元农业用水量的补充：

[0072] 在上级行政单元降水、蒸发及其他灌溉技术水平一定的条件下，假设下级行政单元作物灌溉强度与相应上级行政单元相同，由灌溉面积计算下级行政单元农业用水量，并
满足计算公式

[0073] 其中：为行政单元i农业用水量，计算单位为亿m3；为行政单元i农业灌溉面积，计算单位为kha；为上一级行政单元单位面积农业灌溉用水量，计算单位为亿m3/
kha；为上级行政单元农业用水量，计算单位为亿m3；为上级行政单元灌溉面积，计
算单位为kha。

[0074] 从上面所述可以看出，本发明提供的基于RBF神经网络的经济用水数据空间离散化方法，通过精确划分基本计算单元并进行相应数据统计、然后进行数据预处理、进一步进行空间离散化、最后采用结果修正和数据汇总完成数据后处理的方法，获得了全国各级水
资源分区经济社会及用水数据，有助于水资源综合管理；并且该方法适用于各级行政单元
经济社会数据与用水数据空间离散化处理，其数据结果质量高，从而减小了水资源分区用
水数据人力普查工作量和相关投入。
附图说明

[0075] 图1为本发明提供的基于RBF神经网络的经济用水数据空间离散化方法的一个实施例的流程示意图；

[0076] 图2为本发明提供的基于RBF神经网络的经济用水数据空间离散化方法的另一实施例的流程示意图；

[0077] 图3为本发明提供的基于RBF神经网络的经济用水数据空间离散化方法实施例中基本计算单元划分的示意图；

[0078] 图4为本发明提供的基于RBF神经网络的经济用水数据空间离散化方法实施例中数据空间离散化模型神经网络拓扑结构示意图；

[0079] 图5为本发明提供的基于RBF神经网络的经济用水数据空间离散化方法实施例中基于RBF神经网络的空间离散化模型构架示意图。

具体实施方式

[0080] 为使本发明的目的、技术方案和优点更加清楚明白，以下结合具体实施例，并参照附图，对本发明进一步详细说明。

[0081] 需要说明的是，本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量，可见“第一”“第二”仅为了表述的方便，不应理解为对本发明实施例的限定，后续实施例对此不再一一说明。

[0082] 参照附图1，为本发明提供的基于RBF神经网络的经济用水数据空间离散化方法的一个实施例的流程示意图。

[0083] 所述基于RBF神经网络的经济用水数据空间离散化方法，包括：

[0084] 步骤101：将县级行政区与水资源三级区矢量图进行叠加嵌套，获得每个县级行政单元所属不同水资源三级区部分的基本空间单元，作为基本计算单元；

[0085] 步骤102：将各类土地利用数据和DEM数据统计到各基本计算单元和行政单元空间上，获得基本计算单元和行政单元空间要素数据集；

[0086] 步骤103：根据各级行政单元经济社会用水数据，对县级行政单元生活用水、工业用水和农业用水采用定额法补充，对生态环境用水量采用相关因子分摊法进行补充；

[0087] 步骤104：对生态环境用水量采用相关因子分摊法进行补充得到的计算公式中的权重系数采用组合赋权法确定；

[0088] 步骤105：基于RBF神经网络模型，利用数据指标间相关关系，经过模拟计算得到基本计算单元上离散预测值，从而将县级行政单元经济社会用水数据展布到基本计算单元上；

[0089] 步骤106：以各基本计算单元预测值作为权重由所属县级行政单元总值向下分摊进行结果修正；

[0090] 步骤107：将修正后的经济社会和用水数据值，按基本计算单元的水资源分区属性逐级汇总得到相应的用水数据。

[0091] 参照附图2，为本发明提供的基于RBF神经网络的经济用水数据空间离散化方法的另一实施例的流程示意图。

[0092] 所述基于RBF神经网络的经济用水数据空间离散化方法包括：

[0093] 步骤100：基础数据收集；

[0094] 步骤200：计算单元划分与数据统计；

[0095] 步骤300：数据预处理；

[0096] 步骤400：空间离散化；

[0097] 步骤500：数据后处理。

[0098] 进一步的，所述步骤200——计算单元划分与数据统计，主要是指按水资源区划的原则将行政分区单元分割成分辨率更高的具有水资源分区属性的空间单元，作为空间离散
化的基本计算单元；然后对基本计算单元上空间要素进行统计分析。具体地，还可包括下述步骤：

[0099] 步骤201：在地理信息系统软件Arc GIS中利用“intersect”命令对县级行政区与水资源三级区矢量图进行叠加嵌套（参照附图3）；

[0100] 步骤202：获得每个县级行政单元所属不同水资源三级区部分的基本空间单元，即为基本计算单元；

[0101] 同时，还可对小于所在县级行政区面积10%的基本计算单元进一步处理，将其向邻近面积最大的基本计算单元合并。

[0102] 步骤203：利用获得基本计算单元矢量图和空间数据（DEM和MODIS土地利用），基于Arc GIS区域统计（Zonal Statistics）模块，将各类土地利用数据和DEM数据统计到各基本计算单元上；

[0103] 同时，利用行政区单元矢量图同样统计获得各级行政单元各类土地利用和DEM数据；

[0104] 从而获得基本计算单元和行政单元空间要素数据集，用于空间离散化分析。

[0105] 较佳的，所述步骤300——数据预处理：主要指在尽最大努力获取基础数据前提下，对可能存在的行政单元经济社会用水数据缺失问题，采用合理的分析算法进行补充；对统计数据多样问题，采用自上级向下级分摊方式进行修正。最终获得一套完整且配套的各
级行政单元经济社会用水基础数据集。具体地，还可包括下述步骤：

[0106] 步骤301：数据补充：根据各级行政单元经济社会用水数据，对县级行政单元生活用水、工业用水和农业用水采用定额法补充，对生态环境用水量采用相关因子分摊法进行
补充。补充方法如下：

[0107] （1）生活用水量补充

[0108] 生活用水量的重要影响因子是人口数。一个区域的生活用水量与其总人口数存正相关关系。而由于统计数据本身的缺失，对于本地区当年生活用水综合定额无法计算得到。
因此，假设上一级行政区单元生活用水综合定额与其下一级行政单元生活用水综合定额相
同，即满足下式：

[0109]

[0110] 式中：为行政单元i当年生活用水量，单位为亿m3；Ni为行政单元i当年用水人口数，计算单位为万人；为行政单元i的上级行政单元当年人均生活用水综合定
额，计算单位为L/人·d；为行政单元i的上级行政单元当年生活用水量，计算单位为
亿m3；N上为行政单元i的上级行政单元当年用水人口数，计算单位为万人。

[0111] （2）工业用水量补充

[0112] 以工业增加值作为用水定额主要影响因素，假设上一级行政区单元工业用水定额与其下一级行政单元工业用水综合定额相等，即满足下式：

[0113]

[0114] 式中：为行政单元i当年工业用水量，计算单位为亿m3；为行政单元i当年工业增加值，计算单位为万元；为行政单元i的上级行政单元当年万元工业增加值用水
量，计算单位为亿m3/万元；为行政单元i的上级行政单元当年工业用水总量，计算单位
为亿m3；为行政单元i的上级行政单元当年工业增加值，计算单位为万元。

[0115] （3）农业用水量补充

[0116] 在上级行政单元降水、蒸发及其他灌溉技术水平一定的条件下，假设下级行政单元作物灌溉强度与相应上级行政单元相同，可由灌溉面积计算下级行政单元农业用水量：

[0117]

[0118] 式中：为行政单元i农业用水量，计算单位为亿m3；为行政单元i农业灌溉面积，kha；为上一级行政单元单位面积农业灌溉用水量，亿m3/kha；为上级行政单
元农业用水量，计算单位为亿m3；为上级行政单元灌溉面积，kha。

[0119] （4）生态环境用水量补充

[0120] 生态环境用水量，与经济发展状况密切相关。随着经济社会的发展，生态环境用水需求增加，其主要影响因素包括林地、草地、水域、城镇用地、GDP和非农业人口。各级行政单元生态环境用水量计算如下：

[0121]

[0122] 式中：ki(i=1,2,3,4,5,6)为权重系数；为行政单元i生态环境用水量，计算单位为亿m3；为上一级行政单元生态环境用水量，计算单位为亿m3；为行政单元
i林地面积，计算单位为kha；为上一级行政单元林地面积，计算单位为kha；
为行政单元i草地面积，计算单位为kha；为上一级行政单元草地面积，计算单位为
kha；为行政单元i水域面积，计算单位为kha；为上一级行政单元水域面积，
计算单位为kha；为行政单元i城镇用地面积，计算单位为kha；为上一级行政
单元城镇用地面积，计算单位为kha；GDPi为行政单元i国民生产总值，计算单位为万元；GDP上为上一级行政单元国民生产总值，计算单位为万元；为行政单元i非农业人口数，计
算单位为万人；为上一级行政单元非农业人口数，计算单位为万人。

[0123] 进一步的，对于公式（4）中的权重系数，采用组合赋权法来确定。

[0124] 组合赋权法是将两种或者两种以上的赋权方法所取得的权重，通过组合算法，获取组合权重；组合权重能够解决单一赋权方法存在的无法避免的局限性，使权重获取更合
理。这里将熵值法与复相关系数法两种客观赋权方法进行组合获得生态用水补充所需组合
权重；其中，与复相关系数法的组合有利于消除熵值法赋权过程中评价指标间的信息冗余
的问题。该组合赋权法的具体确定方法如下：

[0125] 首先要对各指标样本数据进行归一化处理，计算公式如下：

[0126]

[0127] 其中：Yki为第k个指标的第i个样本数据归一化后的值；Vki为第k个指标的第i个样本数据。

[0128] 以下分别利用归一化样本数据进行熵值法和复相关系数法赋权：

[0129] 熵值法：根据各指标传输的信息量的大小来确定指标权数的方法；评价指标的差异越大，熵值越小，该指标包含和传输的信息越多，相应权重越大。首先计算各评价指标的熵值，然后把熵值转化为权重，如式（6）、（7）所示：

[0130]

[0131]

[0132] 公式（6）、（7）中，Hi为第i个指标的熵值；Yki为第k个指标的第i个样本数据归一化后的值；Whi为第i个指标的熵值权重。

[0133] 复相关系数法：根据评价指标重复信息的大小来确定权重的方法。该方法利用复相关系数来反映指标间的信息重复程度，能较准确的反映单项指标与其他指标间的重复信
息量的大小。具体步骤如下：

[0134] 首先求出m个评价指标的相关系数矩阵R：

[0135]

[0136] 若要计算第m个指标Xm与其他m-1个指标间的复相关系数，对矩阵R分解如下：

[0137]

[0138] 其中：R-m为除去Xm的相关阵；为rm的转置矩阵；

[0139] 得到Xm对其他m-1个指标的复相关系数为：

[0140]

[0141] 将R的第i行、第i列置换到最后一行、最后一列，再根据上式求出就能计算得到m个复相关系数ρi(i=1,2,…,m)。最后将复相关系数求倒数，并作归一化处理得到指标权重：

[0142]

[0143] 式中：Wρi为第i个指标的权重；

[0144] 组合赋权：将熵值法和复相关系数法计算得到的权重值相乘，并作归一化处理即可得到最终组合权重值；计算公式如下：

[0145]

[0146] 式中：Wi为最终第i个指标的组合权重，计算所得Wi即为生态环境用水量补充权重系数K（i i=1,2,3,4,5,6）。

[0147] 步骤302：数据修正：考虑各级行政单元可能存在统计口径不一的问题，在补充后数据的基础上，以下级行政单元值作为权重由上级行政单元总值逐级向下分摊，如下式所
示：

[0148]

[0149] 其中：为上一级数据修正后的数据总值，全国总数不作修正；为修正后的行政单元i的数据值；为行政单元i的原始数据值；修正后的数据特征为：全国总值等
于各省之和，各省总值等于其下各市之和，各市总值等于其下各区县之和。

[0150] 进一步的，所述步骤400——空间离散化：主要指在数据预处理所得相关基础数据的基础上，基于RBF神经网络模型，利用数据指标间相关关系，进行模拟预测将县级行政单元经济社会用水数据展布到基本计算单元上的过程。RBF神经网络即径向基函数神经网络
（Radical Basis Function）。径向基函数神经网络是一种高效的前馈式神经网络，它具有其他前向网络所不具有的最佳逼近性能和全局最优特性，并且结构简单，训练速度快。

[0151] 具体地，基于RBF神经网络模型的经济社会用水数据空间离散化方法，还可进一步包括下述步骤：

[0152] 步骤401：RBF神经网络由一个输入层、一个隐含层和一个输出层构成（参照附图4）。影响指标数据作为自变量进入输入层，同时影响指标向量维数决定了输入层节点的个数k。输出层是一个线性层，即输出层是隐含层输出的线性加权和。输出层节点数n，即模拟的因变量的结果。

[0153] 用径向基函数作为隐含层神经元的“基”，构成隐含层空间，隐含层对输入矢量进行变换，将低维的模式输入数据变换到高维空间内，使得在低维空间内的线性不可分问题在高维空间内线性可分。径向基函数采用高斯函数，其具体形式为：

[0154]

[0155] 其中：x为是n维输入向量；ci为第i个径向基函数的中心，是与x具有相同维数的向量；σi是第i个基函数的宽度；m是隐含层神经元的个数；||x-ci||为矢量x与ci之间的欧式范数。

[0156] 步骤402：基于RBF神经网络模型，经济社会用水数据模拟预测流程见图5所示。模拟过程中，将任意2/3的数据样本进行训练学习，模拟因变量与其相关的自变量间复杂的非线性关系；同时，将另外1/3的样本作为验证数据，以验证训练学习效果。分别计算训练学习阶段和验证阶段模拟结果与实测样本间的相关系数R12和R22，当两者均大于常数α（0<α<1）时认为训练效果合格，一般取α=0.7～0.8。最后，以验证合格的神经网络预测模型，输入基本计算单元上与因变量相关的自变量指标数据，经过模拟计算得到基本计算单元上离散预
测结果。

[0157] 因RBF神经网络模型预测输出到基本计算单元的数值并非与行政单元数据相匹配，进一步的，所述步骤500——数据后处理，具体包括：进一步修正预测数据结果，并按基本计算单元的水资源分区属性进一步汇总统计，得到各水资源区分布情况。具体包括以下
步骤：

[0158] 步骤501：结果修正：以各基本计算单元预测值作为权重由所属县级行政单元总值向下分摊修正，如下式所示。

[0159]

[0160] 式中：为神经网络模型预测得到经济社会以及用水指标在基本计算单元i上的值；为基本计算单元i所属县级行政单元上经修正后的数据值；为修正后的基本
计算单元i的数据值。

[0161] 步骤502：各级水资源分区用水数据汇总：将修正后的经济社会和用水数据值，按基本计算单元的水资源分区属性逐级汇总，计算表达式如下：

[0162]

[0163] 式中：为修正后的基本计算单元i的数据值；为基本计算单元i所属水资源三级区j对应指标数据值；为水资源三级区j所属水资源二级区k对应指标数据
值；为水资源二级区k所属水资源一级区l对应指标数据值。

[0164] 为了更清楚本发明提供的方法能够如何应用，下面结合方法应用实施例进行说明：

[0165] 结合参照附图1和附图2，该方法用于经济社会用水空间离散化的主要思想为：首先，利用空间数据和GIS技术进行空间计算单元的划分，确定数据离散化的基本计算单元，并统计获得基本计算单元和行政分区单元相关的空间要素数据。同时，利用各级行政单元
的经济社会数据、空间要素数据和用水数据，进行经济社会用水数据补充和修正，形成一套完整的行政分区基础数据集。然后，基于县级行政区和基本计算单元的基础数据，并考虑数据指标间相关关系，利用RBF神经网络模型先后将经济社会数据和用水数据向基本计算单
元空间离散化。最后，参考各县级行政区数据，将离散得到预测值进一步修正处理，并按水资源分区汇总用水数据结果，得到水资源一级区、水资源二级区和水资源三级区经济社会
用水数据离散结果。

[0166] 该方法不仅能将用水数据空间离散到各级水资源区上，还可将相关经济社会数据离散展布到水资源区单元上。以下对各处理步骤进行详细描述：

[0167] 基础数据收集。根据经济社会用水数据同化与空间离散化的要求，需首先收集基础分析数据，主要包括：空间数据和各级（省、市、县）行政单元经济社会数据与用水数据，如表1所示。其中，空间数据和各级行政单元经济社会数据应是完善的，而各级行政单元用水数据则可能存在数据缺失和统计数据多样的问题。

[0168] 表1 基础数据体系

[0169]

[0170] 计算单元划分。根据图1或图2所示流程，利用收集得到的县级行政单元和水资源三级区矢量图，进行Arc GIS矢量图叠套，获得基本计算单元分布矢量图。

[0171] 空间数据统计。利用所得基本计算单元矢量图以及DEM和MODIS土地利用，基于Arc GIS区域统计模块统计得到各县级行政单元和基本计算单元DEM数据（包括海拔和坡度）与六种土地利用数据（见表1），为RBF神经网络的模拟预测作数据准备。

[0172] 用水数据补充。如在收集到的基础数据中，行政单元经济社会用水数据存在缺失的问题，那么根据公式（1）～（3）分别计算补充完善各级行政单元生活、工业和农业用水数据。根据公式（5）～（12），以各省级行政单元分组，先后对每个省份下所有县级行政单元的林地、草地、水域和城镇用地面积（由第三步获得）以及GDP和非农业人口数据进行归一化处理，并计算各省级行政单元内生态用水量补充需的基于熵值法和复相关系数法的组合权重
系数。最后根据公式（4），计算并补充完善各县级行政单元生态环境用水量。

[0173] 数据修正。根据经济社会用水数据修正算法（见公式（13）），将补充完善后的各级行政单元基础数据进一步修正，获得上下级匹配的经济社会用水数据集。

[0174] RBF神经网络模拟预测。在前述数据准备完成后，基于RBF神经网络模型进行经济社会用水数据模拟预测，参照附图5。为尽量减小地区差异性对模拟训练和离散预测效果的影响，分别按水资源一级区分组进行训练模拟和离散预测分析——输入的训练样本主要来
自单个水资源一级区所涉及县级行政单元的指标数据样本。考虑到地空间要素指标、经济
社会指标与用水指标三者之间的相关关系，建立用水数据空间离散化神经网络模拟预测指
标体系，自变量与因变量指标如表2所示。在此基础上构建经济社会用水数据空间离散化流程：首先将县级行政单元的空间要素指标（海拔、坡度、土地利用）作为自变量，经济社会指标（人口、经济、农业生产）为因变量，进行神经网络训练，验证合格后输入基本计算单元上海拔、坡度、土地利用数据将经济社会数据离散预测到基本计算单元上；再以同样的方式，将空间要素指标和经济社会指标作为自变量，经济社会用水指标为因变量，将用水数据离
散到基本计算单元上。最终，离散获得基本计算单元经济社会数据和经济社会用水数据的
模拟预测值。

[0175] 表2 用水数据空间离散化神经网络模拟指标体系

[0176]自变量指标因变量指标
海拔、坡度、土地利用类人口类、经济类、农业生产类
海拔、坡度、土地利用类、人口类、经济类、农业生产类生活用水量、工业用水量、农业用水量、生态环境用水量[0177] 结果修正。根据公式（15），将第六步离散预测得到的基本计算单元经济社会数据和经济社会用水数据进一步修正处理，获得与县级行政单元相匹配的数据集。

[0178] 各级水资源分区用水数据汇总。根据公式（16），对第七步得到的基本计算单元数据结果分逐级汇总，获得各水资源分区上经济社会与经济社会用水数据。

[0179] 从上面所述可以看出，本发明提供的基于BP网络和基尼系数定权重的用水数据离散化方法，通过精确划分基本计算单元并进行相应数据统计、然后进行数据预处理、进一步进行空间离散化、最后采用结果修正和数据汇总完成数据后处理的方法，获得了全国各级
水资源分区经济社会及用水数据，有助于水资源综合管理；并且该方法适用于各级行政单
元经济社会数据与用水数据空间离散化处理，其数据结果质量高，从而减小了水资源分区
用水数据人力普查工作量和相关投入。

[0180] 所属领域的普通技术人员应当理解：以上所述仅为本发明的具体实施例而已，并不用于限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

标题	发布/更新时间	阅读量
一种地理信息系统的地图显示方法	2020-05-12	142
地理信息系统的地图生成方法和系统	2020-05-12	392
一种电力地理信息系统	2020-05-11	817
有线电视网络管理地理信息系统	2020-05-12	560
地理信息系统的地址自动分析匹配系统	2020-05-11	993
跨平台嵌入式地理信息系统	2020-05-13	299
教育地理信息系统	2020-05-11	696
地理信息系统软件测试方法	2020-05-13	450
污染源三维地理信息系统	2020-05-13	835
物流地理信息系统	2020-05-12	156

基于RBF神经网络的经济用水数据空间离散化方法

基于RBF神经网络的经济用水数据空间离散化方法

技术领域

背景技术

发明内容

具体实施方式

该功能需要专业版企业版VIP权限，您可以：