首页 / 专利库 / 资料储存系统 / 自动识别与数据采集技术 / 一种调度计划类数据多维度校验方法

一种调度计划类数据多维度校验方法

阅读:256发布:2021-03-05

专利汇可以提供一种调度计划类数据多维度校验方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种调度计划类数据多维度校验方法,包括下述步骤:步骤一、设计数据 质量 分析指标;步骤二、设计数据校验规则;步骤三、多维度数据质量校验;步骤四、数据质量分析。本发明从调度计划类数据的数据类型、数据量、周期等方面进行多维度量化分析,制定结合调度运行规律的校验规则,设计对数据可靠性、完整性、及时性、匹配性、一致性的多维度校验方法,提出数据质量评估体系,提升多源调度计划类数据质量,从而满足细颗粒度的多源调度计划类数据统计分析要求。,下面是一种调度计划类数据多维度校验方法专利的具体信息内容。

1.一种调度计划类数据多维度校验方法,其特征在于,所述方法包括下述步骤:
步骤一、设计数据质量分析指标;
步骤二、设计数据校验规则;
步骤三、多维度数据质量校验;
步骤四、数据质量分析。
2.如权利要求1所述的多维度校验方法,其特征在于,所述步骤一中的数据质量分析指标包括调度计划类数据的数据类型指标、数据量指标和时间指标;所述数据类型指标包括基础类数据指标、统计类数据指标、运行类数据指标和经济类数据指标;所述数据量指标以调度计划数据模型为基础评估同步数据表数据量、历史数据表数据量、单次同步数据量和单次报送数据量;所述时间指标包括数据同步周期指标和数据同步时间指标。
3.如权利要求2所述的多维度校验方法,其特征在于,所述基础类数据指标包括发电集团信息、电厂信息、计划单元信息、机组基本信息、电机组信息、火电机组信息和机组调度信息;所述统计类数据包括计划单元或电厂年度电量、机组月度电量及耗、机组日电量及耗煤和机组统计信息;所述运行类数据包括系统负荷预测、母线负荷预测、机组出、机组状态和光伏机组运行状态信息;所述经济类数据包括火/热电厂燃煤信息、机组经济参数信息和机组经济参数基准信息;
所述同步数据表作为数据采集接口,以不同类型数据的调用频度和同步周期作为设计同步数据表的数据量大小,超过规定数据量大小的数据作为备份数据存入历史数据表;
日度数据同步数据表规定最大数据量为单月数据量,月度数据同步数据表规定最大数据量为单年数据量,年度数据同步数据表规定最大数据量为两年数据量;由于网络传输速率和数据库处理能力方面限制,对于单次报送数据量大的数据,需采取多次同步的方式报送数据;
所述数据同步周期指标包括年度、月度、旬度、日度四个同步周期,每个周期设定相应的报送截止时间,以满足电网调度运行分析的数据需求;日度数据报送截止时间为次日
8:00前,旬度数据报送截止时间为次旬5日之内,月度数据报送截止时间为次月10日之内,年度数据报送截止时间为次年3个月之内之内;数据同步时间指标受同步数据表数据量、单次同步数据量、单次报送数据量以及当前的网络传输速度因素影响;数据同步时间与同步数据表数据量和当前的网络传输速度呈正相关,单次同步数据量=Σ单次报送数据量。
4.如权利要求1所述的多维度校验方法,其特征在于,所述步骤二中,数据校验包括:
①数据可靠性校验:
对数据内容执行进行数据量化分析,校验数据是否满足用户定义的条件或取值范围,依据数据校验规则库,提供不同类型数据的校验指标结果,校验内容包括:
校验机组基础信息和参数信息的取值范围:
发电集团信息登记∈{1001,1002,1003,1004,1005,1006,1007,1008,1009,1020};
校验机组最大技术出力和最小技术出力的可靠度:
最大技术出力≤铭牌容量;
校验区域联络线电量交换情况的可靠度:
交换电量≤区域联络线最大输送功率*24;
校验发电机组日度、月度和年度实际发电量的可靠度:
发电机组日度实际发电量≤最大出力*24;
发电机组月度实际发电量≤最大出力*24*当月天数;
发电机组年度实际发电量≤最大出力*24*当年天数;
校验发电机组日度信息重报率:
检查发电机组日度信息是否与前一日日度信息相同;
校验发电机组日度96点出力和最大出力信息的可靠度:
检查发电机组日度96点出力的最大值是否与最大出力信息相同;
校验发电机组月度和年度计划电量的可靠度:
发电机组月度计划电量≤最大出力*24*当月天数;
发电机组年度计划电量≤最大出力*24*当年天数;
校验发电机组申报发电能力的可靠度:
申报最大出力为零时,填报停机备用类别1、停机备用类别2、检修类别1、检修类别2。
非零时填写上限受阻电力、上限受阻类别、下调受限电力、下调受限类别;
申报报最大出力≤机组最大出力;
校验汇集型发电机组数据申报的可靠度:
申报最大出力为零时,填报停机备用类别1、停机备用类别2、检修类别1、检修类别2;
非零时填写上限受阻电力、上限受阻类别、下调受限电力和下调受限类别;
申报报最大出力≤Σ所属机组最大出力;
②数据完整性校验:
校验数据内容的是否存在缺失记录或缺失属性;对机组基础信息、机组运行参数信息、机组申报发电能力信息和机组月度发电量信息的申报记录数关键字段的缺失情况进行校验,校验内容包括:
校验发电机组日发电能力申报数据完整率:
检验机组停机备用类型和检修类型是否为空;
校验发电机组日计划和日实际电量完整率:
检验机组日机组日计划和日实际电量是否为空;
校验发电机组申报最大和最小出力完整率:
检验机组日机组申报最大和最小出力是否为空;
校验发电机组所属调度关系和归属关系信息完整率;
检验机组所属调度关系和归属关系是否为空;
校验发电机组月度计划电量、实际发电量和实际上网电量完整率;
检验机组月度计划电量、实际发电量和实际上网电量是否为空;
校验发电机组计划最大出力和实际最大出力信息完整率;
检验机组计划最大出力和实际最大出力信息是否为空;
校验区域负荷预测信息完整率;
检验区域负荷预测信息是否为空;
③数据及时性校验:
针对对不同时间维度数据的送达情况,量化分析各类数据的时效性;依据可配置的数据最长时效信息,在用户指定时间考察下级调度机构基础信息、日度信息、月度信息和年度信息的数据准确送达情况,校验内容包括:
计算发电机组基础信息和基本参数信息的可用时效:
可用时效=(数据变更日-申请变更日)-规定变更天数
计算发电机组日前发电能力及次日发电计划的数据完整送达延误率;
计算发电机组实际发电相关完成量信息、安全校核类信息的数据完整送达延误率;
完整送达延误率计算方法如下:
完整送达延误率=(完整送达数据量-规定报送数据量)/规定报送数据量*100%④数据匹配性校验:
校验发电机组的基础信息、日度信息、月度信息和年度信息的匹配情况,考察发电机组在多时间维度上报数据中的装机容量、申报发电能力、日度可发电量、日度发电量、月度发电量、年度发电量关键属性的关联合理性,校验内容包括:
校验发电机组基础信息、日度信息、月度信息和年度信息的机组标识匹配率:
基础信息机组ID与日度信息机组ID匹配个数/基础信息机组ID;;
校验发电机组日度信息与月度信息关联合理性:
校验发电机组月度信息与年度信息关联合理性:
⑤数据一致性校验:校验不同数据源描述相同业务同一属性的值是否一致;比较系统负荷预测、统调装机容量、统调装机台数和地县调装机容量信息在一体化统计分析中的数值,并提供多数据源差异比较信息。
5.如权利要求1所述的多维度校验方法,其特征在于,所述步骤二中,数据校验规则包括:
一)基础类数据指标校验规则包括发电机组信息校验,包括:机组信息完整率,以下信息校验有一项不完整,则视发电机组信息不完整:
1)机组名称完整率:机组基本信息表中机组名称是否为空;
2)所属电厂名称完整率:电厂中文名是否为空;
3)是否填报所属集团名称完整率:发电集团表中的发电集团中文名是否为空;
4)调度方式大类完整率:机组调度信息表中的调度方式大类是否取值正确;
取值范围:01统一调度、02非统一调度;
5)调度方式中级分类完整率:机组调度信息表中的调度方式中级分类是否取值正确,根据调度方式小分类判断调度方式中级分类是否正确;
取值范围:01国调、分调;02省调;03地调;04县调;
6)调度方式小分类完整率:机组调度信息表中的调度方式小分类是否取值正确;
取值范围:国调-gd,华北-nc,华东ec,华中cc,东北ne,西北nw;
7)服务对象分类完整率:机组调度信息表中的服务对象分类是否取值正确;
取值范围:01公用电厂、02自备电厂;
8)能源利用大类完整率:机组调度信息表中的能源利用大类是否取值正确;
取值范围:01水电、02火电、03核电、04风电、20其它;
9)能源利用小类完整率:机组调度信息表中的能源利用小类是否取值正确;
取值范围:01抽水蓄能,02煤电、03气电、04油电、05煤矸石、06垃圾、07余温、08余压、09余气、10秸秆发电;
10)按供热类型分类完整率:机组调度信息表中的按供热类型分类是否取值正确;
取值范围:01不供热,02供居民采暖,03供工业用汽,04供工业/居民;
11)是否AGC机组完整率:机组调度信息表中的AGC机组是否取值正确;
取值范围:1.是0.否;
12)是否联合循环完整率:机组调度信息表中的是否联合循环是否取值正确;
取值范围:1.是0.否;
13)厂用电率完整率:机组基本信息表中厂用电率是否取值正确;
14)设计发电煤耗完整率:机组基本信息表中设计发电煤耗火电燃煤机组是否填报;
15)设计供电煤耗完整率:机组基本信息表中设计供电煤耗火电燃煤机组是否填报;
16)机组商运时间完整率:机组基本信息表中机组商运时间是否取值正确;
机组商运时间应晚于调度标识中的机组投运时间;
17)汽轮机压力等级完整率:火电机组信息表中的气轮机压力等级火电机组是否填报;
18)实际燃料种类完整率:火电机组信息表中的实际燃料种类火电机组是否填报;
19)大气污染物治理设施安装情况完整率:火电机组信息表中的大气污染物治理设施安装情况火电机组是否填报;
二)年度电量数据校验规则,包括:
计划单元或电厂年计划电量>0;
计划单元或电厂年计划电量<计划单元额定容量和×24×天数(365or366);
计划单元或电厂年累计发电量>0;
计划单元或电厂年累计上网发电量>0;
计划单元或电厂计划外电量累计>0;
计划单元或电厂年累计发电量>计划单元或电厂年累计上网发电量;
计划单元或电厂年累计发电量>计划单元或电厂年累计计划外电量;
所属计划单元或电厂年计划电量总和=4月上报所属计划单元或电厂年计划电量总和;
三)月度电量校验规则:
机组月度实际发电量>=0;
机组月度实际发电量<=额定容量*24*当月天数,当月天数为31or30or29or28;
机组月度实际上网电量>=0;
机组月度实际上网电量<=额定容量*24*当月天数,当月天数为31or30or29or28;
机组月度实际发电量>机组月度实际上网电量;
机组所属计划单元月度计划电量>=0;
机组所属计划单元月度计划电量<=额定容量*24*当月天数,当月天数为
31or30or29or28;
同一计划单元下的机组所属计划计划单元月度计划电量是否相同;
机组月度实际发电量-机组日实际发电量月度累加/机组日实际发电量月度累加>10%;
四)日度电量校验规则:
机组最大出力<=机组额定容量;
机组实际发电量不为空个数;
机组实际发电量<=机组最大出力*24;
机组实际发电量<=机组额定容量*24;
(机组实际发电量>0&&最大出力值>0)or(机组实际发电量==0&&最大出力值==
0);
所属区域实际发电量累加;
五)日度机组统计信息校验规则:
机组最大出力值<=机组额定容量;
机组最小出力值<=机组最大出力值;
机组最大出力是否为空;
所属区域最大出力总和;
六)日度机组出力校验规则;
机组96点计划出力是否为空;
机组96点计划出力<机组额定容量;
机组96点实际出力是否为空;
机组96点实际出力<机组额定容量;
机组96点实际出力总和是否与前一日相同;
七)机组基础信息校验规则
(1)发电集团信息完整率:判断机组是否有所属的发电集团,即机组基本信息表中机组的所属电厂ID与电厂表中ID相匹配,其所属集团是否为空,且在发电集团表中有对应的记录,若没有为不合格数据;
(2)电厂信息完整率:判断机组是否有所属的电厂,即机组基本信息表中机组的所属电厂ID是否为空,且在电厂表中有相匹配的记录,若为没有视为不合格数据;
(3)额定容量偏差率:
额定容量偏差率=(一体化额定容量-入库额定容量)/一体化额定容量*100%(4)计划单元(电厂)个数偏差率:判断三公调度机组是否有所属的计划单元或电厂,即计划单元ID或电厂ID是否全为空,若全为空视为不合格数据;
(5)机组个数偏差率:
机组个数偏差率=(一体化机组个数-入库机组个数)/一体化机组个数*100%;
入库三公调度机组数:通过已经上报的三公调度机组的调度标识,与MARK相匹配得到机组ID,机组ID再与UNIT_ID相匹配,若能源利用大类为火电ENERGY_TYPE_A=1、能源利用小类为煤电ENERGY_TYPE_B=2且为统调机组DISPATCH_TYPE_A=1,则根据将该机组归算入对应调度机构DISPATHC_TYPE_C的入库三公调度机组数;
(6)年度计划基数电量偏差率:
入库年度计划基本电量:通过已经上报的三公调度机组的调度标识,与MARK相匹配得到所属计划单元ELEMENT_ID或所属电厂PLANT_ID,再与ELEMENT_ID或PLANT_ID相匹配,若TYPE=1,则按ELEMENT_ID匹配;TYPE=2,则按PLANT_ID匹配,得到该计划单元或电厂的计划电量,则根据将该计划电量归算如对应调度机构(调度机构的识别方法同上)的入库年度计划基本电量;
(7)月度完成基数电量偏差率:
入库月度完成基数电量:通过已经上报的三公调度机组的调度标识,与MARK相匹配得到所属计划单元ELEMENT_ID或所属电厂PLANT_ID,再与ELEMENT_ID或PLANT_ID相匹配,若TYPE=1,则按ELEMENT_ID匹配;TYPE=2,则按PLANT_ID匹配,得到该计划单元或电厂的年累计发电量ACTUAL、年累计上网发电量ACTUAL_NET、计划外电量累计,分别减去上月电量数据更新前的累计电量(国调侧对计划单元或电厂的每月电量进行存档),得到上月的电量;
根据各分调、省调上报数据统计口径配置表,计算上月的月度完成基数电量,将基数电量归算对应调度机构(调度机构的识别方法同上)的入库月度完成基数电量。
6.如权利要求1所述的多维度校验方法,其特征在于,所述步骤三包括下述步骤:
以调度计划类数据为基础,获取某数据库数据和文件管理系统的数据;
将不同数据表中数据采用拼合、裁切、汇总、细化多种方式构建数据校验模型;
按照校验指标的要求,从调度计划类数据校验规则库中选择相应的校验规则,调用数据校验程序,自动计算得到数据校验结果。
7.如权利要求1所述的多维度校验方法,其特征在于,所述步骤四的数据质量分析的目的是构建调度计划类数据质量分析体系,调度计划类数据质量分析体系由以下七个集合构成,如下所示:
A=<M,I,K,R,S,F,Q>
其中:A为调度计划类数据质量分析体系;
M:为构建的数据校验模型集合,M=<M1,M2,...,Mn>,n为需要校验的数据校验模型个数,M1为第一个数据校验模型,M2为第二个数据校验模型,...Mn为第n个数据校验模型;
I:为不同数据校验模型对应的质量评估指标集合,I=<I1.1,I1.2,...,I1.j,...In.j>,j为需要评估的指标个数,I1.1为第一个数据校验模型的第一个评估指标,I1.2为第一个数据校验模型的第二个评估指标,I1.j为第一个数据校验模型的第j个评估指标,In.j为第n个数据校验模型的第j个评估指标;i<=j;
K:为用户确定的质量评估指标的重要度集合,K=<K1.1,K1.2,...,K1.j,...Kn.j>,j为需要评估的指标个数,K1.1为第一个数据校验模型的第一个评估指标重要度;K1.2为第一个数据校验模型的第二个评估指标重要度;K1.j为第一个数据校验模型的第j个评估指标重要度;Kn.j为第n个数据校验模型的第j个评估指标重要度;
R:为不同质量评估指标对应的数据校验规则集合,R=<R1.1.1,R1.2.1,...,R1.j.r,...Rn.j.r>,r为需要校验的规则数;R1.1.1为第一个数据校验模型的第一个评估指标的第一个规则数;R1.2.1为第一个数据校验模型的第二个评估指标的第一个规则数;R1.j.r为第一个数据校验模型的第j个评估指标的第r个规则数;Rn.j.r为第n个数据校验模型的第j个评估指标的第r个规则数;
S:为不同质量评估指标对应的数据校验标准值集合,S=<S1.1.1,S1.2.1,...,S1.j.r,...Sn.j.r>,r为需要校验的规则数;S1.1.1为第一个数据校验模型的第一个评估指标第一个规则数的数据校验标准值;S1.2.1为第一个数据校验模型的第二个评估指标第一个规则数的数据校验标准值;S1.j.r为第一个数据校验模型的第j个评估指标第r个规则数的数据校验标准值;Sn.j.r为第n个数据校验模型的第j个评估指标的第r个规则数的数据校验标准值;
F:为不同质量评估指标对应的数据校验结果值集合,F=<F1.1.1,F1.2.1,...,F1.j.r,...Fn.j.r>,r为需要校验的规则数;F1.1.1为第一个数据校验模型的第一个评估指标第一个规则数的数据校验结果值;F1.2.1为第一个数据校验模型的第二个评估指标第一个规则数的数据校验结果值;F1.j.r为第一个数据校验模型的第j个评估指标第r个规则数的数据校验结果值;Fn.j.r为第n个数据校验模型的第j个评估指标的第r个规则数的数据校验结果值;
Q:为用户确定的质量评估指标的指数:
其中:Qn.j、Fn.j、Sn.j分别表示第n个数据校验模型第j个指标的指数、数据校验结果值和数据校验标准值。
8.如权利要求7所述的多维度校验方法,其特征在于,不同质量评估模式下的评估模型规范和评估结果计算方法如下:
对于单数据校验模型多指标质量评估模式下:
指标重要度集合:K1+K2+...+Kj=1,j为需要评估的指标个数;K1、K2、...Kj分别为第一个评估指标的重要度、第二个评估指标的重要度、...第j个评估指标的重要度;
指标指数集合: Ki表示第i个评估指标的重要度,Qi表示第i个评估指
标的指数;i<=j;
对于多数据校验模型单指标质量评估模式下:
指标重要度集合:K1+K2+...+Kn=1,n为需要校验的数据校验模型个数;K1为第一个数据校验模型评估指标的重要度;K2为第二个数据校验模型评估指标的重要度;Kn为第n个数据校验模型评估指标的重要度;
指标指数集合: Ki表示第i个数据校验模型评估指标重要度;Qi表示第
i个数据校验模型评估指标的指数;
对于多数据校验模型多指标质量评估模式下:
指标重要度集合: Ki.m表示第i个数据校验模型第m个评估指标的重要
度。;
指标指数集合: Qi.m表示第i个数据校验模型第m个评估指标的指数。

说明书全文

一种调度计划类数据多维度校验方法

技术领域

[0001] 本发明涉及电网调度机构在集中发电调度数据过程中,以满足电网调度运行分析要求为目标的校验方法,具体涉及一种调度计划类数据多维度校验方法。

背景技术

[0002] 目前的技术和专利很少专对调度计划类数据的校验方法进行研究,一般的数据校验方法未结合实际电网运行规律和调度计划业务特点,校验方法实用性不强。原有的调度计划类数据主要为单一调度机构内的调度计划统计分析结果,主要是对数据完整性的校验,在调度计划类数据内容不断丰富的背景下,传统的数据校验方式已无法满足对细颗粒度的多源调度计划类数据的质量要求。

发明内容

[0003] 为解决上述现有技术中的不足,本发明的目的是提供一种调度计划类数据多维度校验方法,能有效提升多源调度计划类数据质量。
[0004] 本发明的目的是采用下述技术方案实现的:
[0005] 本发明提供一种调度计划类数据多维度校验方法,其改进之处在于,所述方法包括下述步骤:
[0006] 步骤一、设计数据质量分析指标;
[0007] 步骤二、设计数据校验规则;
[0008] 步骤三、多维度数据质量校验;
[0009] 步骤四、数据质量分析。
[0010] 进一步地,所述步骤一中的数据质量分析指标包括调度计划类数据的数据类型指标、数据量指标和时间指标;所述数据类型指标包括基础类数据指标、统计类数据指标、运行类数据指标和经济类数据指标;所述数据量指标以调度计划数据模型为基础评估同步数据表数据量、历史数据表数据量、单次同步数据量和单次报送数据量;所述时间指标包括数据同步周期指标和数据同步时间指标。
[0011] 进一步地,所述基础类数据指标包括发电集团信息、电厂信息、计划单元信息、机组基本信息、电机组信息、火电机组信息和机组调度信息;所述统计类数据包括计划单元(电厂)年度电量、机组月度电量及耗、机组日电量及耗煤和机组统计信息;所述运行类数据包括系统负荷预测、母线负荷预测、机组出、机组状态和光伏机组运行状态信息;所述经济类数据包括火/热电厂燃煤信息、机组经济参数信息和机组经济参数基准信息;
[0012] 所述同步数据表作为数据采集接口,以不同类型数据的调用频度和同步周期作为设计同步数据表的数据量大小,超过规定数据量大小的数据作为备份数据存入历史数据表;日度数据同步数据表规定最大数据量为单月数据量,月度数据同步数据表规定最大数据量为单年数据量,年度数据同步数据表规定最大数据量为两年数据量;由于网络传输速率和数据库处理能力方面限制,对于单次报送数据量大的数据,需采取多次同步的方式报送数据;
[0013] 所述数据同步周期指标包括年度、月度、旬度、日度四个同步周期,每个周期设定相应的报送截止时间,以满足电网调度运行分析的数据需求;日度数据报送截止时间为次日8:00前,旬度数据报送截止时间为次旬5日之内,月度数据报送截止时间为次月10日之内,年度数据报送截止时间为次年3个月之内之内;数据同步时间指标受同步数据表数据量、单次同步数据量、单次报送数据量以及当前的网络传输速度因素影响;数据同步时间与同步数据表数据量和当前的网络传输速度呈正相关,单次同步数据量=Σ单次报送数据量。
[0014] 进一步地,所述步骤二中,数据校验包括:
[0015] ①数据可靠性校验:
[0016] 对数据内容执行进行数据量化分析,校验数据是否满足用户定义的条件或取值范围,依据数据校验规则库,提供不同类型数据的校验指标结果,校验内容包括:
[0017] 校验机组基础信息和参数信息的取值范围:
[0018] 发电集团信息登记∈{1001,1002,1003,1004,1005,1006,1007,1008,1009,1020};
[0019] 校验机组最大技术出力和最小技术出力的可靠度:
[0020] 最大技术出力≤铭牌容量;
[0021] 校验区域联络线电量交换情况的可靠度:
[0022] 交换电量≤区域联络线最大输送功率*24;
[0023] 校验发电机组日度、月度和年度实际发电量的可靠度:
[0024] 发电机组日度实际发电量≤最大出力*24;
[0025] 发电机组月度实际发电量≤最大出力*24*当月天数;
[0026] 发电机组年度实际发电量≤最大出力*24*当年天数;
[0027] 校验发电机组日度信息重报率:
[0028] 检查发电机组日度信息是否与前一日日度信息相同;
[0029] 校验发电机组日度96点出力和最大出力信息的可靠度:
[0030] 检查发电机组日度96点出力的最大值是否与最大出力信息相同;
[0031] 校验发电机组月度和年度计划电量的可靠度:
[0032] 发电机组月度计划电量≤最大出力*24*当月天数;
[0033] 发电机组年度计划电量≤最大出力*24*当年天数;
[0034] 校验发电机组申报发电能力的可靠度:
[0035] 申报最大出力为零时,填报停机备用类别1、停机备用类别2、检修类别1、检修类别2。非零时填写上限受阻电力、上限受阻类别、下调受限电力、下调受限类别;
[0036] 申报报最大出力≤机组最大出力;
[0037] 校验汇集型发电机组数据申报的可靠度:
[0038] 申报最大出力为零时,填报停机备用类别1、停机备用类别2、检修类别1、检修类别2;非零时填写上限受阻电力、上限受阻类别、下调受限电力和下调受限类别;
[0039] 申报报最大出力≤Σ所属机组最大出力;
[0040] ②数据完整性校验:
[0041] 校验数据内容的是否存在缺失记录或缺失属性;对机组基础信息、机组运行参数信息、机组申报发电能力信息和机组月度发电量信息的申报记录数关键字段的缺失情况进行校验,校验内容包括:
[0042] 校验发电机组日发电能力申报数据完整率:
[0043] 检验机组停机备用类型和检修类型是否为空;
[0044] 校验发电机组日计划和日实际电量完整率:
[0045] 检验机组日机组日计划和日实际电量是否为空;
[0046] 校验发电机组申报最大和最小出力完整率:
[0047] 检验机组日机组申报最大和最小出力是否为空;
[0048] 校验发电机组所属调度关系和归属关系信息完整率;
[0049] 检验机组所属调度关系和归属关系是否为空;
[0050] 校验发电机组月度计划电量、实际发电量和实际上网电量完整率;
[0051] 检验机组月度计划电量、实际发电量和实际上网电量是否为空;
[0052] 校验发电机组计划最大出力和实际最大出力信息完整率;
[0053] 检验机组计划最大出力和实际最大出力信息是否为空;
[0054] 校验区域负荷预测信息完整率;
[0055] 检验区域负荷预测信息是否为空;
[0056] ③数据及时性校验:
[0057] 针对对不同时间维度数据的送达情况,量化分析各类数据的时效性;依据可配置的数据最长时效信息,在用户指定时间考察下级调度机构基础信息、日度信息、月度信息和年度信息的数据准确送达情况,校验内容包括:
[0058] 计算发电机组基础信息和基本参数信息的可用时效:
[0059] 可用时效=(数据变更日-申请变更日)-规定变更天数
[0060] 计算发电机组日前发电能力及次日发电计划的数据完整送达延误率;
[0061] 计算发电机组实际发电相关完成量信息、安全校核类信息的数据完整送达延误率;
[0062] 完整送达延误率计算方法如下:
[0063] 完整送达延误率=(完整送达数据量-规定报送数据量)/规定报送数据量*100%
[0064] ④数据匹配性校验:
[0065] 校验发电机组的基础信息、日度信息、月度信息和年度信息的匹配情况,考察发电机组在多时间维度上报数据中的装机容量、申报发电能力、日度可发电量、日度发电量、月度发电量、年度发电量关键属性的关联合理性,校验内容包括:
[0066] 校验发电机组基础信息、日度信息、月度信息和年度信息的机组标识匹配率:
[0067] 基础信息机组ID与日度信息机组ID匹配个数/基础信息机组ID;;
[0068] 校验发电机组日度信息与月度信息关联合理性:
[0069]
[0070] 校验发电机组月度信息与年度信息关联合理性:
[0071]
[0072] ⑤数据一致性校验:校验不同数据源描述相同业务同一属性的值是否一致;比较系统负荷预测、统调装机容量、统调装机台数和地县调装机容量信息在一体化统计分析中的数值,并提供多数据源差异比较信息。
[0073] 进一步地,所述步骤二中,数据校验规则包括:
[0074] 一)基础类数据指标校验规则包括发电机组信息校验,包括:机组信息完整率,以下信息校验有一项不完整,则视发电机组信息不完整:
[0075] 1)机组名称完整率:机组基本信息表(plan_unit)中机组名称(name)是否为空;
[0076] 2)所属电厂名称完整率:电厂中文名(name)是否为空;
[0077] 3)是否填报所属集团名称完整率:发电集团表(plan_company)中的发电集团中文名(name)是否为空;
[0078] 4)调度方式大类完整率:机组调度信息表(unit_dispatch)中的调度方式大类(dispatch_type_a)是否取值正确;
[0079] 取值范围:01统一调度、02非统一调度;
[0080] 6)调度方式中级分类完整率:机组调度信息表(unit_dispatch)中的调度方式中级分类(dispatch_type_b)是否取值正确,根据调度方式小分类判断调度方式中级分类是否正确;
[0081] 取值范围:01国调、分调;02省调;03地调;04县调;
[0082] 12)调度方式小分类完整率:机组调度信息表(unit_dispatch)中的调度方式小分类(dispatch_type_c)是否取值正确;
[0083] 取值范围:国调-gd,华北-nc,华东ec,华中cc,东北ne,西北nw;
[0084] 13)服务对象分类完整率:机组调度信息表(unit_dispatch)中的服务对象分类(service_object是否取值正确;
[0085] 取值范围:01公用电厂、02自备电厂;
[0086] 14)能源利用大类完整率:机组调度信息表(unit_dispatch)中的能源利用大类(energy_type_a)是否取值正确;
[0087] 取值范围:01水电、02火电、03核电、04风电、20其它;
[0088] 15)能源利用小类完整率:机组调度信息表(unit_dispatch)中的能源利用小类(energy_type_b)是否取值正确;
[0089] 取值范围:01抽水蓄能,02煤电、03气电、04油电、05煤矸石、06垃圾、07余温、08余压、09余气、10秸秆发电;
[0090] 16)按供热类型分类完整率:机组调度信息表(unit_dispatch)中的按供热类型分类(heating_type)是否取值正确;
[0091] 取值范围:01不供热,02供居民采暖,03供工业用汽,04供工业/居民;
[0092] 17)是否AGC机组完整率:机组调度信息表(unit_dispatch)中的AGC机组(id_agc)是否取值正确;
[0093] 取值范围:1.是0.否;
[0094] 13)是否联合循环完整率:机组调度信息表(unit_dispatch)中的是否联合循环(is_recycle)是否取值正确;
[0095] 取值范围:1.是0.否;
[0096] 13)厂用电率完整率:机组基本信息表(plan_unit)中厂用电率(power_consumption_rate)是否取值正确;
[0097] 14)设计发电煤耗(克/千瓦时)完整率:机组基本信息表(plan_unit)中设计发电煤耗(produce_coal_consumption)火电燃煤机组是否填报;
[0098] 15)设计供电煤耗(克/千瓦时)完整率:机组基本信息表(plan_unit)中设计供电煤耗(provide_coal_consumption)火电燃煤机组是否填报;
[0099] 16)机组商运时间完整率:机组基本信息表(plan_unit)中机组商运时间(commercial_runtime)是否取值正确;
[0100] 机组商运时间应晚于调度标识中的机组投运时间;
[0101] 17)汽轮机压力等级完整率:火电机组信息表(thermal_power_unit)中的气轮机压力等级(air_turbine_pre_level)火电机组是否填报;
[0102] 18)实际燃料种类完整率:火电机组信息表(thermal_power_unit)中的实际燃料种类(actual_burning_material)火电机组是否填报;
[0103] 19)大气污染物治理设施安装情况完整率:火电机组信息表(thermal_power_unit)中的大气污染物治理设施安装情况(clean_air_equ_remark)火电机组是否填报;
[0104] 二)年度电量数据校验规则,包括:
[0105] 计划单元或电厂年计划电量>0;
[0106] 计划单元或电厂年计划电量<计划单元额定容量和×24×天数(365or366);
[0107] 计划单元或电厂年累计发电量>0;
[0108] 计划单元或电厂年累计上网发电量>0;
[0109] 计划单元或电厂计划外电量累计>0;
[0110] 计划单元或电厂年累计发电量>计划单元或电厂年累计上网发电量;
[0111] 计划单元或电厂年累计发电量>计划单元或电厂年累计计划外电量;
[0112] 所属计划单元或电厂年计划电量总和=4月上报所属计划单元或电厂年计划电量总和;
[0113] 三)月度电量校验规则:
[0114] 机组月度实际发电量>=0;
[0115] 机组月度实际发电量<=额定容量*24*当月天数(31or30or29or28);
[0116] 机组月度实际上网电量>=0;
[0117] 机组月度实际上网电量<=额定容量*24*当月天数(31or30or29or28);
[0118] 机组月度实际发电量>机组月度实际上网电量;
[0119] 机组所属计划单元月度计划电量>=0;
[0120] 机组所属计划单元月度计划电量<=额定容量*24*当月天数(31or30or29or28);
[0121] 同一计划单元下的机组所属计划计划单元月度计划电量是否相同;
[0122] 机组月度实际发电量-机组日实际发电量月度累加/机组日实际发电量月度累加>10%;
[0123] 四)日度电量校验规则:
[0124] 机组最大出力<=机组额定容量;
[0125] 机组实际发电量不为空个数;
[0126] 机组实际发电量<=机组最大出力*24;
[0127] 机组实际发电量<=机组额定容量*24;
[0128] (机组实际发电量>0&&最大出力值>0)or(机组实际发电量==0&&最大出力值==0);
[0129] 所属区域实际发电量累加;
[0130] 五)日度机组统计信息校验规则:
[0131] 机组最大出力值<=机组额定容量;
[0132] 机组最小出力值<=机组最大出力值;
[0133] 机组最大出力是否为空;
[0134] 所属区域最大出力总和;
[0135] 六)日度机组出力校验规则;
[0136] 机组96点计划出力是否为空;
[0137] 机组96点计划出力<机组额定容量;
[0138] 机组96点实际出力是否为空;
[0139] 机组96点实际出力<机组额定容量;
[0140] 机组96点实际出力总和是否与前一日相同;
[0141] 机组基础信息校验规则
[0142] (1)发电集团信息完整率:判断机组是否有所属的发电集团,即机组基本信息表中机组的所属电厂ID(PLANT_ID)与电厂表中ID相匹配,其所属集团(COMPANY_ID)是否为空,且在发电集团表中有对应的记录,若没有为不合格数据;
[0143] (2)电厂信息完整率:判断机组是否有所属的电厂,即机组基本信息表中机组的所属电厂ID(PLANT_ID)是否为空,且在电厂表中有相匹配的记录,若为没有视为不合格数据;
[0144] (3)额定容量偏差率:
[0145] 额定容量偏差率=(一体化额定容量-入库额定容量)/一体化额定容量*100%[0146] (4)计划单元(电厂)个数偏差率:判断三公调度机组是否有所属的计划单元或电厂,即计划单元ID或电厂ID是否全为空,若全为空视为不合格数据;
[0147] (5)机组个数偏差率:
[0148] 机组个数偏差率=(一体化机组个数-入库机组个数)/一体化机组个数*100%;
[0149] 入库三公调度机组数:通过已经上报的三公调度机组的调度标识,与MARK相匹配得到机组ID,机组ID再与UNIT_ID相匹配,若能源利用大类为火电(ENERGY_TYPE_A=1)、能源利用小类为煤电(ENERGY_TYPE_B=2)且为统调机组(DISPATCH_TYPE_A=1),则根据将该机组归算入对应调度机构(DISPATHC_TYPE_C)的入库三公调度机组数;
[0150] (6)年度计划基数电量偏差率:
[0151] 入库年度计划基本电量:通过已经上报的三公调度机组的调度标识,与MARK相匹配得到所属计划单元(ELEMENT_ID)或所属电厂(PLANT_ID),再与ELEMENT_ID或PLANT_ID相匹配(若TYPE=1,则按ELEMENT_ID匹配;TYPE=2,则按PLANT_ID匹配),得到该计划单元或电厂的计划电量(PLAN),则根据将该计划电量归算如对应调度机构(调度机构的识别方法同上)的入库年度计划基本电量;
[0152] (7)月度完成基数电量偏差率:
[0153] 入库月度完成基数电量:通过已经上报的三公调度机组的调度标识,与MARK相匹配得到所属计划单元(ELEMENT_ID)或所属电厂(PLANT_ID),再与ELEMENT_ID或PLANT_ID相匹配(若TYPE=1,则按ELEMENT_ID匹配;TYPE=2,则按PLANT_ID匹配),得到该计划单元或电厂的年累计发电量(ACTUAL)、年累计上网发电量(ACTUAL_NET)、计划外电量累计(OUT OF_PLAN),分别减去上月电量数据更新前的累计电量(国调侧对计划单元或电厂的每月电量进行存档),得到上月的电量;
[0154] 根据各分调、省调上报数据统计口径配置表,计算上月的月度完成基数电量,将基数电量归算对应调度机构(调度机构的识别方法同上)的入库月度完成基数电量。
[0155] 进一步地,所述步骤三包括下述步骤:
[0156] 以调度计划类数据为基础,获取某数据库数据和文件管理系统的数据;
[0157] 将不同数据表中数据采用拼合、裁切、汇总、细化多种方式构建数据校验模型;
[0158] 按照校验指标的要求,从调度计划类数据校验规则库中选择相应的校验规则,调用数据校验程序,自动计算得到数据校验结果。
[0159] 进一步地,所述步骤四的数据质量分析的目的是构建调度计划类数据质量分析体系,调度计划类数据质量分析体系由以下七个集合构成,如下所示:
[0160] A=<M,I,K,R,S,F,Q>
[0161] 其中:A为调度计划类数据质量分析体系;
[0162] M:为构建的数据校验模型集合,M=<M1,M2,...,Mn>,n为需要校验的数据校验模型个数,M1为第一个数据校验模型,M2为第二个数据校验模型,...Mn为第n个数据校验模型;
[0163] I:为不同数据校验模型对应的质量评估指标集合,I=<I1.1,I1.2,...,I1.j,...In.j>,j为需要评估的指标个数,I1.1为第一个数据校验模型的第一个评估指标,I1.2为第一个数据校验模型的第二个评估指标,I1.j为第一个数据校验模型的第j个评估指标,In.j为第n个数据校验模型的第j个评估指标;i<=j;
[0164] K:为用户确定的质量评估指标的重要度集合,K=<K1.1,K1.2,...,K1.j,...Kn.j>,j为需要评估的指标个数,K1.1为第一个数据校验模型的第一个评估指标重要度;K1.2为第一个数据校验模型的第二个评估指标重要度;K1.j为第一个数据校验模型的第j个评估指标重要度;Kn.j为第n个数据校验模型的第j个评估指标重要度;
[0165] R:为不同质量评估指标对应的数据校验规则集合,R=<R1.1.1,R1.2.1,...,R1.j.r,...Rn.j.r>,r为需要校验的规则数;R1.1.1为第一个数据校验模型的第一个评估指标的第一个规则数;R1.2.1为第一个数据校验模型的第二个评估指标的第一个规则数;R1.j.r为第一个数据校验模型的第j个评估指标的第r个规则数;Rn.j.r为第n个数据校验模型的第j个评估指标的第r个规则数;
[0166] S:为不同质量评估指标对应的数据校验标准值集合,S=<S1.1.1,S1.2.1,...,S1.j.r,...Sn.j.r>,r为需要校验的规则数;S1.1.1为第一个数据校验模型的第一个评估指标第一个规则数的数据校验标准值;S1.2.1为第一个数据校验模型的第二个评估指标第一个规则数的数据校验标准值;S1.j.r为第一个数据校验模型的第j个评估指标第r个规则数的数据校验标准值;Sn.j.r为第n个数据校验模型的第j个评估指标的第r个规则数的数据校验标准值;
[0167] F:为不同质量评估指标对应的数据校验结果值集合,F=<F1.1.1,F1.2.1,...,F1.j.r,...Fn.j.r>,r为需要校验的规则数;F1.1.1为第一个数据校验模型的第一个评估指标第一个规则数的数据校验结果值;F1.2.1为第一个数据校验模型的第二个评估指标第一个规则数的数据校验结果值;F1.j.r为第一个数据校验模型的第j个评估指标第r个规则数的数据校验结果值;Fn.j.r为第n个数据校验模型的第j个评估指标的第r个规则数的数据校验结果值;
[0168] Q:为用户确定的质量评估指标的指数:
[0169]
[0170] 其中:Qn.j、Fn.j、Sn.j分别表示第n个数据校验模型第j个指标的指数、数据校验结果值和数据校验标准值。
[0171] 进一步地,不同质量评估模式下的评估模型规范和评估结果计算方法如下:
[0172] 对于单数据校验模型多指标质量评估模式下:
[0173] 指标重要度集合:K1+K2+...+Kj=1,j为需要评估的指标个数;K1、K2、...Kj分别为第一个评估指标的重要度、第二个评估指标的重要度、...第j个评估指标的重要度;
[0174] 指标指数集合: Ki表示第i个评估指标的重要度,Qi表示第i个指标的指数;i<=j;
[0175] 对于多数据校验模型单指标质量评估模式下:
[0176] 指标重要度集合:K1+K2+...+Kn=1,n为需要校验的数据校验模型个数;K1为第一个数据校验模型评估指标的重要度;K2为第二个数据校验模型评估指标的重要度;Kn为第n个数据校验模型评估指标的重要度;
[0177] 指标指数集合:
[0178] 对于多数据校验模型多指标质量评估模式下:
[0179] 指标重要度集合:
[0180] 指标指数集合:
[0181] 与最接近的现有技术相比,本发明提供的技术方案具有的优异效果是:
[0182] 本发明从调度计划类数据的数据类型、数据量、周期等方面进行多维度量化分析,制定结合调度运行规律的校验规则,设计对数据可靠性、完整性、及时性、匹配性、一致性的多维度校验方法,通过量化分析调度计划类数据特征,提出数据质量评估体系,提升多源调度计划类数据质量,从而满足细颗粒度的多源调度计划类数据统计分析要求。附图说明
[0183] 图1是本发明提供的一种调度计划类数据多维度校验的流程图
[0184] 图2是本发明提供的多维度数据质量校验的流程图;
[0185] 图3是本发明提供的调度计划类数据质量分析体系的示意图。

具体实施方式

[0186] 下面结合附图对本发明的具体实施方式作进一步的详细说明。
[0187] 以下描述和附图充分地示出本发明的具体实施方案,以使本领域的技术人员能够实践它们。其他实施方案可以包括结构的、逻辑的、电气的、过程的以及其他的改变。实施例仅代表可能的变化。除非明确要求,否则单独的组件和功能是可选的,并且操作的顺序可以变化。一些实施方案的部分和特征可以被包括在或替换其他实施方案的部分和特征。本发明的实施方案的范围包括权利要求书的整个范围,以及权利要求书的所有可获得的等同物。在本文中,本发明的这些实施方案可以被单独地或总地用术语“发明”来表示,这仅仅是为了方便,并且如果事实上公开了超过一个的发明,不是要自动地限制该应用的范围为任何单个发明或发明构思。
[0188] 本发明涉及一种一种调度计划类数据多维度校验技术,其流程图如图1所示,所述方法包括以下步骤:
[0189] 步骤一、设计数据质量分析指标:
[0190] 本发明的步骤一设计数据质量分析指标,着重分析调度计划类数据的数据特征以及调度计划业务的应用特点,从调度计划类数据的数据类型、数据量、时间等方面,制定可靠性、完整性、及时性、匹配性、一致性等多项数据质量分析指标。数据类型方面包括基础类数据、统计类数据、运行类数据、经济类数据,数据量方面以调度计划数据模型为基础估算同步数据表数据量、历史数据表数据量、单次同步数据量、单次报送数据量等参数,时间方面包括数据同步周期和数据同步时间两部分。
[0191] 从数据类型方面分析,主要分为基础类数据、统计类数据、运行类数据、经济类数据四大类数据。其中,基础类数据中包括发电集团信息、电厂信息、计划单元信息、机组基本信息、水电机组信息、火电机组信息、机组调度信息。统计类数据包括计划单元(电厂)年度电量、机组月度电量及耗煤、机组日电量及耗煤、机组统计信息等。运行类数据包括系统负荷预测、母线负荷预测、机组出力、机组状态、风光伏机组运行状态信息等。经济类数据包括火(热)电厂燃煤信息、机组经济参数信息、机组经济参数基准信息等。
[0192] (1)发电机组基础信息报送内容包括发电机组基础调度信息、火电机组基础信息和水电机组基础信息。
[0193] (2)报送时间:在发电机组基础信息首次录入后,如果有新投机组、退役机组,在对发电机组调度标识进行(预)登记或修改的同时,对基础信息进行录入或更新;发电机组基础信息发生变更时,应在10个工作日内,到调度机构更新。
[0194] (3)基础调度信息
[0195] 1)D5000机组名称:对于D5000已建模机组填报对应GeneratingUnit表中的机组名称,对于D5000未建模机组填报申报名称。
[0196] 2)机组调度标识:指每台发电机组(含风电机组、光伏电站及小水电,光伏电站按逆变器单元计)在全网范围内唯一的、始终不变的标识,由发电机组地理信息、首次并网日期、退役日期、并网点电压等级、铭牌容量、机组类型和标志位字段值组成,共31位代码。机组调度标识应选自国家电网公司并网发电机组调度标识库。
[0197] 3)能源利用大类:按照能源利用方式,分成水电、火电、核电、风电、太阳能、地热和其它七大类,填报其中一类。
[0198] 4)能源利用小类:按照能源利用方式,分成抽水蓄能、煤电、气电、油电、煤矸石、垃圾、余温、余压、余气、秸秆发电、煤层气、光伏、沼气发电、潮汐和其它,填报其中一类。
[0199] 5)调度方式大类:填报统一调度、非统一调度中的一类。
[0200] 6)调度方式中级分类:对于统一调度机组,分为国调直调、分中心调度和省统一调度,填报其中一类;对于非统一调度,分为地调、县调,填报其中一类。
[0201] 7)调度方式小分类:对于省级及以上调度填报调度单位的两位字母代码,地调和县调不填写具体名称。
[0202] 8)服务对象分类:按服务对象分为公用电厂、自备电厂两类,填报其中一类。
[0203] 12)供热类型分类:分为不供热、供居民采暖、供工(商)业用汽、供工(商)业及居民四类,填报其中一类。
[0204] 9)是否AGC机组:填报机组是否为AGC机组。
[0205] 10)是否联合循环机组:填报机组是否为联合循环机组。
[0206] 11)机组上网电价:填报机组的上网电价,单位为元/兆瓦时。
[0207] (4)火电机组基础信息
[0208] 1)D5000机组名称:参数含义及填报方式同2.3.1。
[0209] 2)机组调度标识:参数含义及填报方式同2.3.2。
[0210] 3)厂用电率:指设计的厂用电量与发电量的比值,填报百分数。
[0211] 40设计发电煤耗:指设计的发电厂每发出1度电能平均耗用的标准煤量,单位为克/千瓦时。
[0212] 5)设计供电煤耗:指设计的发电厂每对外提供1度电能平均耗用的标准煤量,它是扣除厂用电后的净发电煤耗,单位为克/千瓦时。
[0213] 6)最大技术出力:指设计的发电机组允许运行出力范围的上限,单位为兆瓦。
[0214] 7)最小技术出力:指设计的发电机组允许运行出力范围的下限,单位为兆瓦。
[0215] 8)机组商运时间:指发电机组投入商业运行的时间,填报12位代码。
[0216] 9)汽轮机型号:指汽轮机设备铭牌上的型号。
[0217] 10)汽轮机型式:按照热力特性,汽轮机型式可以分为凝汽式、背压式、抽汽式、抽汽背压式、简单循环(燃气轮机)、复杂循环(燃气轮机)、增压式(内燃机)、非增压式(内燃机)和其它型式,填报其中的一种。
[0218] 11)汽轮机压力等级:按照新蒸汽压力,可以分为低压、中压、高压、超高压、亚临界、超临界和超超临界,填报其中的一类。
[0219] 12)汽轮机排汽冷却方式:分为开式循环、闭式循环、直接空冷、间接空冷,填报其中的一类。
[0220] 13)汽轮机制造国家:填报制造该汽轮机的国家名。
[0221] 14)汽轮机制造厂家:填报制造该汽轮机的厂家名。
[0222] 15)锅炉型号:指锅炉设备铭牌上的型号。
[0223] 16)锅炉容量:指锅炉每小时的蒸发量,单位为吨/小时。
[0224] 17)锅炉制造国家:填报制造该锅炉的国家名。
[0225] 18)锅炉制造厂家:填报制造该锅炉的厂家名。
[0226] 19)锅炉循环方式:分为自然循环炉、多次强迫循环炉、低倍率循环炉、直流炉、复合循环炉五类,填报其中的一类。
[0227] 20)锅炉燃烧方式:分为层状燃烧、煤粉燃烧、旋风燃烧、沸腾炉(非CFB)、循环流化床(CFB)五类,填报其中的一类。
[0228] 21)锅炉燃料种类:分为烟煤为主、无烟煤为主、贫煤为主、褐煤、煤矸石、油、天然气、油煤混烧、气煤混烧、油气混烧、垃圾、生物质和其它种类,填报其中的一类。对于生物质,注明其燃料名称。
[0229] 22)大气污染物治理设施安装情况:分为无、脱硫、脱硝、脱硫脱硝四类,填报其中的一类。
[0230] (5)水电机组基础信息:
[0231] 1)水轮发电机型式:分为悬式、普通伞式、半伞式、全伞式、普通卧式、灯泡式、全贯式和其它型式,填报其中的一类。
[0232] 2)水轮机型式:分为贯流定桨式、贯流转桨式、轴流定浆式、轴流转桨式、斜流式、混流式、切流式、斜击式、双击式和其它型式,填报其中的一类。
[0233] 3)水轮机装置型式:分为立式金属涡壳、立式混凝土涡壳、明槽灯泡式(单导叶)、罐式、竖井式、虹吸式、轴身式和其它型式,填报其中的一类。
[0234] 4)水轮机制造国家:填报制造该水轮机的国家名。
[0235] 5)水轮机制造厂家:填报制造该水轮机的厂家名。
[0236] 6)水电厂调节型式:分为径流式、日调节式、年调节式和多年调节式,填报其中的一类。
[0237] 从数据量方面分析,主要评估测算同步数据表数据量、历史数据表数据量、单次同步数据量、单次报送数据量。同步数据表主要作为数据采集的接口,以不同类型数据的调用频度和同步周期作为设计同步数据表的数据量大小,超过规定数据量大小的数据作为备份数据存入历史数据表。由于网络传输速率和数据库处理能力等方面限制,对于单次报送数据量较大的数据,需采取多次同步的方式报送数据,减轻数据传输压力,避免数据传输信息阻塞。
[0238] 从时间方面分析,主要分为数据同步周期、数据同步时间两个度。数据同步周期根据不同的数据分类,分为年度、月度、旬度、日度四个同步周期,每个周期设定相应的报送截止时间,以满足电网调度运行分析的数据需求。数据同步时间主要受同步数据表数据量、单次同步数据量、单次报送数据量以及当前的网络传输速度等因素影响。
[0239] 调度计划类业务以日前计划业务为主,偏重于对用电信息的预测、对未来电网运行情况的分析,因此对数据的实时性、即时性需求相对较低,对可靠性、完整性、匹配性要求较高。同时调度计划类业务作为电网调度运行的核心业务之一,与本级调度机构内各专业以及与不同级调度机构间相同专业的数据一致性要求较高。
[0240] 数据可靠性:
[0241] 对数据内容与其对应的客观实体的特征一执行进行量化分析,校验数据是否满足用户定义的条件或取值范围,依据数据校验规则库,提供不同类型数据的校验指标结果。该功能模
[0242] 校验机组基础信息、参数信息的取值范围。
[0243] 校验机组最大技术出力、最小技术出力的可靠度。
[0244] 校验区域联络线电量交换情况的可靠度。
[0245] 校验发电机组日度、月度、年度实际发电量的可靠度。
[0246] 校验发电机组日度信息重报率。
[0247] 校验发电机组日度96点出力、最大出力信息的可靠度。
[0248] 校验发电机组月度、年度计划电量的可靠度。
[0249] 校验发电机组申报发电能力的可靠度。
[0250] 校验汇集型发电机组数据申报的可靠度。
[0251] 数据完整性:
[0252] 校验数据内容的是否存在缺失记录或缺失属性。对机组基础信息、机组运行参数信息、机组申报发电能力信息、机组月度发电量等信息的申报记录数和关键字段的缺失情况进行校验,该功能模块:
[0253] 校验发电机组日发电能力申报数据完整率。
[0254] 校验发电机组日计划、日实际电量完整率。
[0255] 校验发电机组申报最大、最小出力完整率。
[0256] 校验发电机组所属调度关系、归属关系信息完整率。
[0257] 校验发电机组月度计划电量、实际发电量、实际上网电量完整率。
[0258] 校验发电机组计划最大出力、实际最大出力信息完整率。
[0259] 校验区域负荷预测信息完整率。
[0260] 数据及时性:
[0261] 针对对不同时间维度数据的送达情况,量化分析各类数据的时效性。依据可配置的数据最长时效信息,在用户指定时间考察下级调度机构基础信息、日度信息、月度信息、年度信息的数据准确送达情况。该功能模块:
[0262] 计算发电机组基础信息、基本参数信息的可用时效。
[0263] 计算发电机组日前发电能力及次日发电计划的数据完整送达延误率。
[0264] 计算发电机组实际发电相关完成量信息、安全校核类信息的数据完整送达延误率。
[0265] 数据匹配性:
[0266] 校验数据主属性在多类数据中是否保证关联的唯一性。校验发电机组的基础信息、日度信息、月度信息、年度信息的匹配情况,考察发电机组在多时间维度上报数据中的装机容量、申报发电能力、日度可发电量、日度发电量、月度发电量、年度发电量等关键属性的关联合理性。该功能模块:
[0267] 校验发电机组基础信息、日度信息、月度信息、年度信息的机组标识匹配率。
[0268] 校验发电机组基础信息与日度信息关联合理性。
[0269] 校验发电机组日度信息与月度信息关联合理性。
[0270] 校验发电机组月度信息与年度信息关联合理性。
[0271] 数据一致性:
[0272] 校验不同数据源描述相同业务同一属性的值是否一致。比较系统负荷预测、统调装机容量、统调装机台数、地县调装机容量等信息在其他数据源中的数值,并提供多数据源差异比较信息。
[0273] 步骤二、设计数据校验规则:
[0274] 根据数据质量分析指标,即数据可靠性、完整性、及时性、匹配性、一致性,分别制定相应的数据校验规则。为了便于管理和共享调度计划数据,可将调度计划类数据可分为基础类数据、调度信息类数据、日度数据、月度数据、年度数据等类别,各种类别的数据分别存储在不同的数据表中。
[0275] 一)发电机组信息校验:
[0276] 机组信息完整率:
[0277] 以下信息校验有一项不完整,则视该机组信息不完整。
[0278] 机组名称完整率:表4机组基本信息表(plan_unit)中机组名称(NAME)是否为空;
[0279] 所属电厂名称完整率:表2(plan_plant)中的电厂中文名(name)是否为空;
[0280] 是否填报所属集团名称完整率:表1发电集团表(plan_company)中的发电集团中文名(name)是否为空;
[0281] 调度方式大类完整率:表7机组调度信息表(unit_dispatch)中的调度方式大类(dispatch_type_a)是否取值正确;
[0282] 调度方式中级分类完整率:表7机组调度信息表(unit_dispatch)中的调度方式中级分类(dispatch_type_b)是否取值正确,根据调度方式小分类判断调度方式中级分类是否正确;
[0283] 调度方式小分类完整率:表7机组调度信息表(unit_dispatch)中的调度方式小分类(dispatch_type_c)是否取值正确;
[0284] 服务对象分类完整率:表7机组调度信息表(unit_dispatch)中的服务对象分类(service_object是否取值正确;
[0285] 能源利用大类完整率:表7机组调度信息表(unit_dispatch)中的能源利用大类(energy_type_a)是否取值正确;
[0286] 能源利用小类完整率:表7机组调度信息表(unit_dispatch)中的能源利用小类(energy_type_b)是否取值正确;
[0287] 按供热类型分类完整率:表7机组调度信息表(unit_dispatch)中的按供热类型分类(heating_type)是否取值正确;
[0288] 是否AGC机组完整率:表7机组调度信息表(unit_dispatch)中的是否AGC机组(id_agc)是否取值正确;
[0289] 是否联合循环完整率:表7机组调度信息表(unit_dispatch)中的是否联合循环(is_recycle)是否取值正确;
[0290] 厂用电率完整率:表4机组基本信息表(plan_unit)中厂用电率(power_consumption_rate)是否取值正确;
[0291] 设计发电煤耗(克/千瓦时)完整率:表4机组基本信息表(plan_unit)中设计发电煤耗(produce_coal_consumption)火电燃煤机组是否填报;
[0292] 设计供电煤耗(克/千瓦时)完整率:表4机组基本信息表(plan_unit)中设计供电煤耗(provide_coal_consumption)火电燃煤机组是否填报;
[0293] 机组商运时间完整率:表4机组基本信息表(plan_unit)中机组商运时间(commercial_runtime)是否取值正确;
[0294] 汽轮机压力等级完整率:表6火电机组信息表(thermal_power_unit)中的气轮机压力等级(air_turbine_pre_level)火电机组是否填报;
[0295] 实际燃料种类完整率:表6火电机组信息表(thermal_power_unit)中的实际燃料种类(actual_burning_material)火电机组是否填报;
[0296] 大气污染物治理设施安装情况完整率:表6火电机组信息表(thermal_power_unit)中的大气污染物治理设施安装情况(clean_air_equ_remark)火电机组是否填报;
[0297] 二)年度电量数据校验规则:
[0298] 计划单元(电厂)年计划电量>0
[0299] 计划单元(电厂)年计划电量<计划单元额定容量和×24×天数(365or366)[0300] 计划单元(电厂)年累计发电量>0
[0301] 计划单元(电厂)年累计上网发电量>0
[0302] 计划单元(电厂)计划外电量累计>0
[0303] 计划单元(电厂)年累计发电量>计划单元(电厂)年累计上网发电量[0304] 计划单元(电厂)年累计发电量>计划单元(电厂)年累计计划外电量[0305] 所属计划单元(电厂)年计划电量总和=4月上报所属计划单元(电厂)年计划电量总和
[0306] 三)月度电量校验规则:
[0307] 机组月度实际发电量>=0
[0308] 机组月度实际发电量<=额定容量*24*当月天数(31or30or29or28)[0309] 机组月度实际上网电量>=0
[0310] 机组月度实际上网电量<=额定容量*24*当月天数(31or30or29or28)[0311] 机组月度实际发电量>机组月度实际上网电量
[0312] 机组所属计划单元月度计划电量>=0
[0313] 机组所属计划单元月度计划电量<=额定容量*24*当月天数(31or30or29or28)[0314] 同一计划单元下的机组所属计划计划单元月度计划电量是否相同
[0315] ABS(机组月度实际发电量-机组日实际发电量月度累加)/机组日实际发电量月度累加>10%
[0316] 四)日度电量校验规则:
[0317] 机组最大出力<=机组额定容量
[0318] 机组实际发电量不为空个数
[0319] 机组实际发电量<=机组最大出力*24
[0320] 机组实际发电量<=机组额定容量*24
[0321] (机组实际发电量>0&&最大出力值>0)or(机组实际发电量==0&&最大出力值==0)
[0322] 所属区域实际发电量累加
[0323] 五)日度机组统计信息校验规则:
[0324] 机组最大出力值<=机组额定容量;
[0325] 机组最小出力值<=机组最大出力值;
[0326] 机组最大出力是否为空;
[0327] 所属区域最大出力总和;
[0328] 六)日度机组出力校验规则:
[0329] 机组96点计划出力是否为空;
[0330] 机组96点计划出力<机组额定容量;
[0331] 机组96点实际出力是否为空;
[0332] 机组96点实际出力<机组额定容量;
[0333] 机组96点实际出力总和是否与前一日相同;
[0334] 七)机组基础信息校验规则:
[0335] 1.发电集团信息完整率:判断机组是否有所属的发电集团,即表4机组基本信息表中机组的所属电厂ID(PLANT_ID)与表2电厂表中ID相匹配,其所属集团(COMPANY_ID)是否为空,且在表1发电集团表中有对应的记录,若没有为不合格数据。
[0336] 2.电厂信息完整率:判断机组是否有所属的电厂,即表4机组基本信息表中机组的所属电厂ID(PLANT_ID)是否为空,且在表2电厂表中有相匹配的记录,若为没有视为不合格数据。
[0337] 3.额定容量偏差率:
[0338] 额定容量偏差率=(一体化额定容量-入库额定容量)/一体化额定容量*100%[0339] 4.计划单元(电厂)个数偏差率:判断三公调度机组是否有所属的计划单元或电厂,即计划单元ID或电厂ID是否全为空,若全为空视为不合格数据。
[0340] 5.机组个数偏差率:
[0341] 机组个数偏差率=(一体化机组个数-入库机组个数)/一体化机组个数*100%[0342] 入库三公调度机组数:通过已经上报的三公调度机组的调度标识,与表4中MARK相匹配得到机组ID,机组ID再与表7中的UNIT_ID相匹配,若能源利用大类为火电(ENERGY_TYPE_A=1)、能源利用小类为煤电(ENERGY_TYPE_B=2)且为统调机组(DISPATCH_TYPE_A=1),则根据将该机组归算入对应调度机构(DISPATHC_TYPE_C)的入库三公调度机组数。
[0343] 6.年度计划基数电量偏差率:
[0344] 入库年度计划基本电量:通过已经上报的三公调度机组的调度标识,与表4中MARK相匹配得到所属计划单元(ELEMENT_ID)或所属电厂(PLANT_ID),再与表22中的ELEMENT_ID或PLANT_ID相匹配(若表22中TYPE=1,则按ELEMENT_ID匹配;TYPE=2,则按PLANT_ID匹配),得到该计划单元或电厂的计划电量(PLAN),则根据将该计划电量归算如对应调度机构(调度机构的识别方法同上)的入库年度计划基本电量。
[0345] 7.月度完成基数电量偏差率:
[0346] 入库月度完成基数电量:通过已经上报的三公调度机组的调度标识,与表4中MARK相匹配得到所属计划单元(ELEMENT_ID)或所属电厂(PLANT_ID),再与表22中的ELEMENT_ID或PLANT_ID相匹配(若表22中TYPE=1,则按ELEMENT_ID匹配;TYPE=2,则按PLANT_ID匹配),得到该计划单元或电厂的年累计发电量(ACTUAL)、年累计上网发电量(ACTUAL_NET)、计划外电量累计(OUT OF_PLAN),分别减去上月电量数据更新前的累计电量(国调侧对计划单元或电厂的每月电量进行存档),得到上月的电量。
[0347] 根据各分调、省调上报数据统计口径配置表,计算上月的月度完成基数电量,将该基数电量归算如对应调度机构(调度机构的识别方法同上)的入库月度完成基数电量。
[0348] 步骤三、多维度数据质量校验:
[0349] 多维度数据质量校验是数据质量评估的重要步骤,首先确定不同数据对调度计划业务重要度,从多源数据中(包括数据库、指定格式文本等不同数据源)筛选需要考察的数据内容;根据数据校验时的关联性特征,建立相应数据校验视图模型,提升数据校验效率;选择需要考察的评估指标,在校验规则库中确认指标对应的规则,通过计算机程序自动给出校验结果。参照附图2所示,以调度计划类数据为基础,获取A类数据库数据、文件管理系统的数据,将不同数据表中数据采用拼合、裁切、汇总、细化等多种方式构建数据校验模型,按照校验指标的要求,从调度计划类数据校验规则库中选择相应的规则,调用指定的数据校验程序计算得到数据校验结果。
[0350] 步骤四、数据质量分析:
[0351] 调度计划类数据质量分析是根据数据校验的结果,评估分析调度计划数据整体数据质量水平或者某一类数据校验模型的各项指标满足程度。按照评估指标的重要度量化数据质量评估结果,为调度计划类数据质量的提升提供指导。
[0352] 参照附图3,调度计划类数据质量分析体系由七个集合构成,如下所示:
[0353] A=<M,I,K,R,S,F,Q>,
[0354] 其中:
[0355] M:为构建的数据校验模型集合,M=<M1,M2,...,Mn>,n为需要校验的数据模型个数,如基础数据校验模型M1、电量数据校验模型M2;
[0356] I:为不同数据校验模型对应的质量评估指标集合,I=<I1.1,I1.2,...,I1.j,...In.j>,j为需要评估的指标个数,如I1.1为基础数据校验模型的可靠性指标;
[0357] K:为用户确定的质量评估指标的重要度集合,K=<K1.1,K1.2,...,K1.j,...Kn.j>,j为需要评估的指标个数,如K1.1为基础数据校验模型可靠性指标的重要度;
[0358] R:为不同质量评估指标对应的数据校验规则集合,R=<R1.1.1,R1.2.1,...,R1.j.r,...Rn.j.r>,r为需要校验的规则数,如R1.1.1为基础数据校验模型可靠性指标的第一个校验规则;
[0359] S:为不同质量评估指标对应的数据校验标准值集合,S=<S1.1.1,S1.2.1,...,S1.j.r,...Sn.j.r>,r为需要校验的规则数,如S1.1.1为基础数据校验模型可靠性指标的第一个校验规则的标准值;
[0360] F:为不同质量评估指标对应的数据校验结果值集合,F=<F1.1.1,F1.2.1,...,F1.j.r,...Fn.j.r>,r为需要校验的规则数,如F1.1.1为基础数据校验模型可靠性指标的第一个校验规则的结果值;
[0361] Q:为用户确定的质量评估指标的指数,
[0362]
[0363] j为需要评估的指标个数,如Q1.1为基础数据校验模型可靠性指标的指数;
[0364] 调度计划类数据质量评估,需要根据数据需求和业务要求对多个数据校验模型和多个指标进行评估,可以分为单数据校验模型多指标(single model-multiple indicators,SMMI)、多数据校验模型单指标(multiple model-single indicators,MMSI)、多数据校验模型多指标质量评估模式(multiple model-multiple indicators,MMMI)。下面分别介绍不同质量评估模式下的评估模型规范和评估结果计算方法:
[0365] 对于单数据校验模型多指标质量评估模式下:
[0366] 指标重要度集合:K1+K2+...+Kj=1,j为指标个数
[0367] 指标指数集合: j为指标个数
[0368] 对于多数据校验模型单指标质量评估模式下:
[0369] 指标重要度集合:K1.j+K2.j+...+Kn.j=1,n为数据校验模型个数,j为第j个指标[0370] 指标指数集合: n为数据校验模型个数,j为第j个指标
[0371] 对于多数据校验模型多指标质量评估模式下:
[0372] 指标重要度集合: n为数据校验模型个数,j为指标个数
[0373] 指标指数集合: n为数据校验模型个数,j为指标个数
[0374] 实施例
[0375] 本实施应用调度计划类数据评价指标,采用以某电网内2014年调度计划类数据,分省域构建数据校验模型,基于调度计划类数据质量评估体系,采用单数据校验模型多指标(single model-multiple indicators,SMMI)模式,计算各省域调度计划类数据质量评估关键指标。
[0376] 基于调度计划类数据库、文件管理系统和其他数据源,构建校验数据模型,为不同数据校验模型设置对应的质量评估指标集合,并设置不同指标的重要度,构建不同评估指标对应的数据校验规则,确定各类规则数据校验结果的标准值,按照规则计算数据校验结果,获取不同数据质量评估指标的指数,根据各类指标的重要度加权计算该数据校验模型的综合质量评估指数。
[0377] 如表1所示,本算例基于调度计划类基础数据构建数据校验模型1,包括数据日期、使用类型、单元名称、计划单元所在省份、计划单元所属调度机构,所属发电集团、计划单元总容量、计划单元所属机组容量等级、数据报送时间。
[0378] 表1数据校验模型
[0379]
[0380]
[0381]
[0382] 如表2、表3所示,表2表示了数据校验模型1需要评估的指标包括可靠性、完整性、及时性、匹配性、一致性。表3根据调度计划类业务需求分别用0至1表示不同指标的重要程度。
[0383] 表2质量评估指标集合
[0384]
[0385] 表3指标重要度集合
[0386]
[0387] 如表4、表5所示,表4表示数据校验模型1各评估指标对应的校验规则内容及校验结果取值方法,校验结果可采用离散或连续型表示方法。表5给出了各校验规则的标准值,若校验结果高于标准值,则对应的评估指标指数较高,反之,评估指标指数较低。
[0388] 表4数据校验规则集合
[0389]
[0390] 表5数据校验标准值集合
[0391]
[0392] 如表6、表7所示,表6表示自动计算的数据校验结果值,其中规则1、规则5的结果值高于标准值,规则2、规则4的结果值低于标准值,规则3的结果值等于标准值。表7给出了不同规则对应指标值,并按重要度加权汇总得到了数据模型1的综合评分95.39分。
[0393] 表6数据校验结果值集合
[0394]
[0395] 表7质量评估指标指标集合及综合评分
[0396]
[0397] 以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员依然可以对本发明的具体实施方式进行修改或者等同替换,这些未脱离本发明精神和范围的任何修改或者等同替换,均在申请待批的本发明的权利要求保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈