首页 / 专利库 / 电脑编程 / 算法 / 一种监控信息表自动结构化梳理的方法

一种监控信息表自动结构化梳理的方法

阅读:209发布:2021-06-09

专利汇可以提供一种监控信息表自动结构化梳理的方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种监控信息表自动结构化梳理的方法,包括如下步骤:获取监控表信息;建立监控信息结构化模型;字词库构建;自然语言解析和 机器学习 ;检验与辨识。本发明扩充电 力 专业名词及监控信息 知识库 ,为实现监控信息自动划归至设备鉴定 基础 。为监控数据向设备-间隔-接线形式- 电压 等级-变电站以及生产厂家、设备型号的溯源提供了依据,同时也为后续 大数据 分析建立了基础。仅需少量的人为干预即可实现大量的监控信息与设备的关联。解放人力的同时,提高工作 质量 ,极大程度加快了运行站的监控信息的有效管理。,下面是一种监控信息表自动结构化梳理的方法专利的具体信息内容。

1.一种监控信息表自动结构化梳理的方法,其特征在于:包括如下步骤:
步骤(1)、获取监控表信息;
步骤(2)、建立监控信息结构化模型;
构建变电站-电压等级-接线方式-间隔-设备-信息模型;
步骤(3)、字词库构建
分别建立电压等级关键字词库、间隔名称关键字词库、开关编号关键字词库、遥信关键字词库、遥测关键字词库、遥控关键字词库和遥调关键字词库,针对所述监控表信息进行文本分析,扩充完善监控信息的关键字词库;
步骤(4)、自然语言解析和机器学习
采用自然语言解析对监控信息表进行导分词处理,自动划归至设备,在此过程中,通过TensorFlow算法,通过机器自学习完善数据的结构化分析结果;
步骤(5)、检验与辨识
通过决策树算法对数据进行处理,利用归纳算法生成规则和决策树,并对上一阶段生成的决策树进行检验和校正。
2.根据权利要求1所述的监控信息表自动结构化梳理的方法,其特征在于:步骤(2)中,建立变电站-电压等级-接线形式-间隔-设备的典型关联关系,通过构建典型接线形式的模型,对所有电压等级下典型接线形式的管理;通过构建典型间隔的模型,对每一个电压等级及接线形式下典型间隔列表进行管理;通过构建间隔典型设备的模型,对每一类间隔下典型设备列表进行管理。
3.根据权利要求1所述的监控信息表自动结构化梳理的方法,其特征在于:步骤(3)中,电压等级关键字词库包括电网中全部的电压等级,信号拆分时能够自动识别出信号中的电压等级。
4.根据权利要求1所述的监控信息表自动结构化梳理的方法,其特征在于:步骤(3)中,通过间隔名称关键字词库建立间隔名称与间隔类型的关联关系;通过开关编号关键字词库建立开关编号与间隔类型、与电压等级间的关系。
5.根据权利要求1所述的监控信息表自动结构化梳理的方法,其特征在于:步骤(3)中,建立遥信信息关键字,建立一次设备、二次保护设备、以及公用设备的信息模型,通过信号描述判断出信号所属的具体设备;建立遥测信息关键字,建立全部量测类型;建立遥控信息关键字,对开关、刀闸、接地刀闸、主变分接头等信息的自动识别;建立遥调信息关键字,实现对保护切换定值区信息的智能划归。
6.根据权利要求1所述的监控信息表自动结构化梳理的方法,其特征在于:步骤(4)中,采用自然语言解析对监控信息表进行导分词处理具体过程如下:
(1)基于字符串匹配,即扫描字符串,并加启发式规则;
(2)基于人工标注的词性和统计特征,对中文进行建模,即根据观测到的数据对模型参数进行估计;在分词阶段再通过模型计算各种分词出现的概率,将概率最大的分词结果作为最终结果;
(3)把词处理成向量,并且保证向量间的相对相似度和语义相似度是相关的;自然语言处理系统把词编码成字符串是随意确定的,词向量把词或短语映射成实数向量,把特征从词汇表大小的高维度空间降低到一个相对低的维度空间。
7.根据权利要求1所述的监控信息表自动结构化梳理的方法,其特征在于:步骤(4)中,定义神经网络模型,准备数据和参数,定义网络模型,把计算过程表示成一个数据流图的过程,使用TensorFlow来进行计算,用计算图的方式建立计算网络,基于TensorFlow的基础上编写上层结构和库及底层的代码。
8.根据权利要求1所述的监控信息表自动结构化梳理的方法,其特征在于:步骤(5)中,使用决策树算法对数据进行处理,利用归纳算法生成可读的规则和决策树,通过一系列规则对数据进行分类分析,构造精度高、规模小的决策树;由训练样本集生成决策树,根据实际需要处理的数据集,并对上一阶段生成的决策树进行检验和校正,校验决策树生成过程中产生的初步规则,剪除影响预衡准确性的分枝。

说明书全文

一种监控信息表自动结构化梳理的方法

技术领域

[0001] 本方法涉及一种自动结构化梳理的方法,尤其是一种监控信息表自动结构化梳理的方法,属于电领域。

背景技术

[0002] 监控信息表的规范程度是电力系统中监控电网安全、设备运行的重要基础。随着智能变电站和大运行体系的快速发展,统一规范的监控信息已成为调控中心远程监控电网安全运行的关键。
[0003] 目前,一些投运时间比较久的变电站监控信息表仍然存在着很多不规范的情况,并且需全部凭借人工经验才能实现设备与监控信息的关联,在监视电网运行的过程中为调度管理人员、监控运行人员增大工作难度。客观上容易发生监测不严谨、异常发现不够及时等问题,影响监控信息判断,给电网稳定运行带来隐患和险。发明内容
[0004] 为了解决上述问题,本发明提出一种监控信息表自动结构化梳理的方法,采用自然语言解析技术,并通过机器自学习的方式对存量的监控信息进行逐条拆解,扩充电力专业名词及监控信息知识库,为实现监控信息自动划归至设备鉴定基础。
[0005] 本发明的技术方案具体如下:一种监控信息表自动结构化梳理的方法,包括如下步骤:
步骤(1)、获取监控表信息;
步骤(2)、建立监控信息结构化模型;
构建变电站-电压等级-接线方式-间隔-设备-信息模型;
步骤(3)、字词库构建
分别建立电压等级关键字词库、间隔名称关键字词库、开关编号关键字词库、遥信关键字词库、遥测关键字词库、遥控关键字词库和遥调关键字词库,针对所述监控表信息进行文本分析,扩充完善监控信息的关键字词库;
步骤(4)、自然语言解析和机器学习
采用自然语言解析对监控信息表进行导分词处理,自动划归至设备,在此过程中,通过TensorFlow算法,通过机器自学习完善数据的结构化分析结果;
步骤(5)、检验与辨识
通过决策树算法对数据进行处理,利用归纳算法生成规则和决策树,并对上一阶段生成的决策树进行检验和校正。
[0006] 进一步地,步骤(2)中,建立变电站-电压等级-接线形式-间隔-设备的典型关联关系,通过构建典型接线形式的模型,对所有电压等级下典型接线形式的管理;通过构建典型间隔的模型,对每一个电压等级及接线形式下典型间隔列表进行管理;通过构建间隔典型设备的模型,对每一类间隔下典型设备列表进行管理。
[0007] 进一步地,步骤(3)中,电压等级关键字词库包括电网中全部的电压等级,信号拆分时能够自动识别出信号中的电压等级。
[0008] 进一步地,步骤(3)中,通过间隔名称关键字词库建立间隔名称与间隔类型的关联关系;通过开关编号关键字词库建立开关编号与间隔类型、与电压等级间的关系。
[0009] 进一步地,步骤(3)中,建立遥信信息关键字,建立一次设备、二次保护设备、以及公用设备的信息模型,通过信号描述判断出信号所属的具体设备;建立遥测信息关键字,建立全部量测类型;建立遥控信息关键字,对开关、刀闸、接地刀闸、主变分接头等信息的自动识别;建立遥调信息关键字,实现对保护切换定值区信息的智能划归。
[0010] 进一步地,步骤(4)中,采用自然语言解析对监控信息表进行导分词处理具体过程如下:(1)基于字符串匹配,即扫描字符串,并加启发式规则;
(2)基于人工标注的词性和统计特征,对中文进行建模,即根据观测到的数据对模型参数进行估计;在分词阶段再通过模型计算各种分词出现的概率,将概率最大的分词结果作为最终结果;
(3)把词处理成向量,并且保证向量间的相对相似度和语义相似度是相关的;自然语言处理系统把词编码成字符串是随意确定的,词向量把词或短语映射成实数向量,把特征从词汇表大小的高维度空间降低到一个相对低的维度空间。
[0011] 进一步地,步骤(4)中,定义神经网络模型,准备数据和参数,定义网络模型,把计算过程表示成一个数据流图的过程,使用TensorFlow来进行计算,用计算图的方式建立计算网络,基于TensorFlow的基础上编写上层结构和库及底层的代码。
[0012] 进一步地,步骤(5)中,使用决策树算法对数据进行处理,利用归纳算法生成可读的规则和决策树,通过一系列规则对数据进行分类分析,构造精度高、规模小的决策树;由训练样本集生成决策树,根据实际需要处理的数据集,并对上一阶段生成的决策树进行检验和校正,校验决策树生成过程中产生的初步规则,剪除影响预衡准确性的分枝。
[0013] 与现有技术相比,本发明的有益效果如下:(1)本发明采用自然语言解析技术,并通过机器自学习的方式对存量的监控信息进行逐条拆解,扩充电力专业名词及监控信息知识库,为实现监控信息自动划归至设备鉴定基础。
[0014] (2)本发明通过对运行站的监控信息进行结构化梳理,为监控数据向设备-间隔-接线形式-电压等级-变电站以及生产厂家、设备型号的溯源提供了依据,同时也为后续大数据分析建立了基础。
[0015] (3)本发明通过变电站的监控信息表中的信息,结合计算机的算法分析,能够实现超过百分之九十的自动关联,仅需少量的人为干预即可实现大量的监控信息与设备的关联。解放人力的同时,提高工作质量,极大程度加快了运行站的监控信息的有效管理。附图说明
[0016] 图1为监控信息表自动结构化梳理的形成过程中的模型库调用示意图。
[0017] 图2为基于TensorFlow算法的数据结构化结果的深度学习过程。

具体实施方式

[0018] 下面将结合本发明实施例中的附图,对本实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是对本发明一部分实例,而不是全部的实例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0019] 本实施例的监控信息表自动结构化梳理的形成过程如图1所示。
[0020] 首先将监控信息表导入系统,通过模型库的调用,自动分析各侧电压等级及接线方式;其次生成不同电压下的不同间隔类型,系统将自动区分主变间隔与其余间隔,同时自动生成间隔下的设备类型,根据导入的监控信息表自动生成设备编号;最后根据导入的监控信息表实现四遥信息表的自动结构化梳理,将输入的四遥信息自动划归至电网的一、二次设备,完成监控信息与电压等级-间隔-设备的关系映射。为告警信号的设备型号的溯源提供了依据,同时也为后续大数据分析建立了数据基础。
[0021] 本实施例的基于TensorFlow算法的数据结构化结果的深度学习过程如图2所示。首先,输入监控信息表,利用自然语言解析技术将四遥信息的文字描述进行编码,并与已构建的结构化模型库、关键字模型库进行匹配,形成初始态编码信息(即中间过程,中间态编码数据)。计算机通过解码解析中间态数据,形成中间态结果进行存储,此时加入反馈机制,利用深度学习技术对中间态结果进行校验,形成修正后结果,达到校验标准后输出最终结果。
[0022] 具体的,本实施例的监控信息表自动结构化梳理的方法,针对四遥信息表,包括如下步骤:步骤(1)、获取基准电压表信息,获取一次接线图,获取存量四遥信息表。
[0023] 步骤(2)、建立监控信息结构化模型,实现变电站-电压等级-接线方式-间隔-设备-信息的模型构建。
[0024] 2.1建立变电站-电压等级-接线形式-间隔-设备的典型关联关系。
[0025] 2.2构建典型接线形式的模型,实现所有电压等级下典型接线形式的管理。本实施例中,220kV电压等级下典型接线形式包括双母双分、双母单分、双母等。
[0026] 2.3构建典型间隔的模型,实现每一个电压等级及接线形式下典型间隔列表的管理。本实施例中,220kV双母接线形式下的典型间隔包括线路间隔、母联间隔和母线间隔等。
[0027] 2.4构建间隔典型设备的模型,实现每一类间隔下典型设备列表的管理。本实施例中,220kV线路间隔包括断路器、刀闸、控制回路、线路保护、测控装置、线路PT、智能终端、合并单元等。
[0028] 步骤(3)、分别建立遥信关键字词库、遥测关键字词库、遥控关键字词库、遥调关键字词库,针对存量的四遥信息表进行文本分析,扩充完善监控信息的关键字词库。
[0029] 3.1建立电压等级关键字,词库中包含电网中全部的电压等级,信号拆分时将自动识别出信号中的电压等级。本实施例中,对于信号‘220kV版木线261断路器保护装置故障’,系统将自动识别信号中的电压等级为‘220kV’。
[0030] 3.2建立间隔名称关键字,建立间隔名称与间隔类型的关联关系。本实施例中,对于信号‘220kV版木线261断路器保护装置故障’,系统将自动识别信号中的间隔名称为‘版木线’,同时将该间隔归类为线路间隔类型。
[0031] 3.3建立开关编号关键字,并建立开关编号与间隔类型、与电压等级间的关系。本实施例中,对于信号‘220kV版木线261断路器保护装置故障’,系统将自动识别信号中的开关编号为‘261’,同时建立‘261’与线路间隔、‘220kV’的关系。
[0032] 3.4建立遥信信息关键字,建立一次设备、二次保护设备、以及公用设备的信息模型,通过信号描述判断出信号所属的具体设备。本实施例中,对于信号‘220kV版木线261断路器保护装置故障’,系统将结合已分析的间隔类型等信息,自动判断该信号属于线路保护类型
[0033] 3.5建立遥测信息关键字,建立全部量测类型。本实施例中,对于信号‘220kV版木线261断路器有功’,系统将分析出该信号为‘220kV’+‘版木线’+‘261断路器’+‘有功’,判断该信号属于220kV版木线,关键字为‘有功’。
[0034] 3.6建立遥控信息关键字,实现对开关、刀闸、接地刀闸、主变分接头等信息的自动识别。本实施例中,对于信号‘220kV版木线261断路器分位’,系统将自动分析出该信号所属设备为‘261断路器’。
[0035] 3.7建立遥调信息关键字,实现对保护切换定值区信息的智能划归。本实施例中,对于信号‘220kV版木线261断路器保护定值区’,系统将分析出该信号属于‘220kV版木线’。
[0036] 步骤(4)、采用自然语言解析(NLP)对监控信息表进行导分词处理,自动划归至设备,基于自然语言解析,将四遥监控信息表进行分词拆解,实现监控信息模型化构建。在此过程中通过TensorFlow算法,采用机器自学习方式完善数据的结构化分析结果。
[0037] 4.1基于字符串匹配,即扫描字符串,并加入一些启发式规则,本实施例中,可以加入“正向/反向最大匹配”、“长词优先”等策略。
[0038] 4.2基于统计以及机器学习的分词方式。基于人工标注的词性和统计特征,对中文进行建模,即根据观测到的数据对模型参数进行估计,即训练。 在分词阶段再通过模型计算各种分词出现的概率,将概率最大的分词结果作为最终结果。
[0039] 4.3把词处理成向量,并且保证向量间的相对相似度和语义相似度是相关的。自然语言处理(NLP)系统把词编码成字符串是随意确定的,词向量把词或短语映射成实数向量,把特征从词汇表大小的高维度空间降低到一个相对低的维度空间。
[0040] 深度学习过程中,基于多层神经元的自编码神经网络,发现信号的内在规律和表示层次,定义神经网络模型,准备数据和参数,定义网络模型,把计算过程表示成一个数据流图的过程,使用TensorFlow来进行计算,用计算图的方式建立计算网络,基于TensorFlow的基础上编写上层结构和库及底层的代码。
[0041] 步骤(5)、智能化的检验与辨识。使用决策树算法对数据进行处理,利用归纳算法生成可读的规则和决策树,通过一系列规则对数据进行分类分析,构造精度高、规模小的决策树。由训练样本集生成决策树,根据实际需要处理的数据集。并对上一阶段生成的决策树进行检验和校正,校验决策树生成过程中产生的初步规则,剪除影响预衡准确性的分枝。
[0042] 以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈