首页 / 专利库 / 地基 / 基础 / 一种基于深度学习的遥信梳理方法

一种基于深度学习的遥信梳理方法

阅读:12发布:2021-09-19

专利汇可以提供一种基于深度学习的遥信梳理方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于 深度学习 的遥信梳理方法,该方法包括步骤:1)建立遥信梳理工作平台界面;2)利用规则进行名称规范性验证;3)使用历史处理信息进行梳理操作;4)使用规范信息进行遗漏信息查阅:查阅模 块 处理过程中对相关间隔告警进行规范性核查;5)生成可导入 数据库 文件:通过一键生成可导入数据库CSV文件。本发明对相关信息进行查缺补漏,提高梳理 质量 ,减轻梳理人员的工作压 力 ,让遥信梳理工作更准确、便捷,减少了厂站信息漏发、误发的情况发生,确保调度自动化系统信息可靠性。,下面是一种基于深度学习的遥信梳理方法专利的具体信息内容。

1.一种基于深度学习的遥信梳理方法,其特征在于:该方法包括显示模、验证模块、梳理模块、查阅模块和存储模块,具体包括以下步骤:
1)建立遥信梳理工作平台界面:显示模块通过表格着色突出显示存在问题的描述并通过右键菜单、下拉选取方式进行梳理核对工作;
2)利用规则进行名称规范性验证:验证模块按通过规则进行遥信名称规范性识别,重组遥信名称,即通过电网间隔模型名称对原描述信息中间隔字符段、描述字符段进行处理;
3)使用历史处理信息进行梳理操作:梳理模块将步骤2)中信息规范匹配处理结果存储处理经验库中,通过深度学习方法的自然语言识别处理列出遥信最优选线;
4)使用规范信息进行遗漏信息查阅:查阅模块处理过程中对相关间隔告警进行规范性核查,即使用规范性告警描述文件进行告警信息筛查,检查出厂站间隔告警中出现的分级错误及遗漏的情况进行汇总分析;
5)生成可导入数据库文件:对生成厂站RTU模型数据库文件生成可导入数据库CSV文件。
2.根据权利要求1所述的一种基于深度学习的遥信梳理方法,其特征在于:自然语言识别处理方法:首先比对信息为告警信息规范化描述与实际告警描述之间进行对比描述,采用TF-IDF方法计算进行词条的相似度计算:
TF-IDF方法中词频:对于在特定文件里的词语ti来说,它的重要性表示为:
式中:ni,j是该词在文件dj中的出现次数,而分母∑knk,j则是在文件dj中所有字词的出现次数之和;
TF-IDF方法中逆向文件频率:对于特定词语的IDF,由总文件数目除以包含该词语之文件的数目,再将得到的商取以10为底的对数得到:
式中:|D|:语料库中的文件总数,{j:ti∈dj}包含词语的文件数目,如果该词语不在语料库中,就会导致分母为零,因此一般情况下使用作为分母;
TF-IDF计算就是在词频TF的基础上再加入逆文本IDF的信息:
tfidfi,j=tfi,j×idfi
通过TF-IDF公式计算方法,将两个待比较的词条进行逐字分解成数组,计算出TF-IDF矩阵,然后计算二者的交集大小和并集大小,作商得出告警规范化描述与实际描述的匹配度。
3.根据权利要求1所述的一种基于深度学习的遥信梳理方法,其特征在于:自然语言识别处理在半监督处理过程中,记录人工告警信息匹配的选取过程,将该处理经验存入经验学习库中,在下次描述词条处理过程中调取相关经验处理信息,并使用经验与词条进行TF-IDF匹配计算。
4.根据权利要求2所述的一种基于深度学习的遥信梳理方法,其特征在于:匹配度阈值为0.7-1。

说明书全文

一种基于深度学习的遥信梳理方法

技术领域

[0001] 本发明属于遥信梳理技术领域,涉及一种基于深度学习的遥信梳理方法。

背景技术

[0002] 现有的地方供电局网区完成调控一体化接入工作,完成接入厂站遥信数据量的接入。在接入工作中,遥信梳理作为信号核查、定级及描述规范的关键步骤,在整体工作中耗费人物力,常规110kV变电站3000个遥信量需要5个小时左右工作时间,同时工作存在一定遗漏。遥信梳理人员需要了解保护、自动化专业知识,并掌握遥信信息定级等规范。

发明内容

[0003] 本发明要解决的技术问题是:提供一种基于深度学习的遥信梳理方法,以解决现有技术中存在的问题。
[0004] 本发明采取的技术方案为:一种基于深度学习的遥信梳理方法,该方法包括显示模、验证模块、梳理模块、查阅模块和存储模块,具体包括以下步骤:
[0005] 1)建立遥信梳理工作平台界面:显示模块通过表格着色突出显示存在问题的描述并通过右键菜单、下拉选取方式进行梳理核对工作;
[0006] 2)利用规则进行名称规范性验证:验证模块按通过规则进行遥信名称规范性识别,重组遥信名称,即通过电网间隔模型名称对原描述信息中间隔字符段、描述字符段进行处理;
[0007] 3)使用历史处理信息进行梳理操作:梳理模块将步骤2)中信息规范匹配处理结果存储处理经验库中,通过深度学习方法的自然语言识别处理列出遥信最优选线;
[0008] 4)使用规范信息进行遗漏信息查阅:查阅模块处理过程中对相关间隔告警进行规范性核查,即使用规范性告警描述文件进行告警信息筛查,检查出厂站间隔告警中出现的分级错误及遗漏的情况进行汇总分析;
[0009] 5)生成可导入数据库文件:对生成厂站RTU模型数据库文件生成可导入数据库CSV文件。
[0010] 自然语言识别技术最初适用于互联网搜索引擎搜索结果排序,利用其匹配程度进行搜索结果排序,使用户优先浏览匹配较高的搜索结果。在告警信息核查过程中,以规范化告警词条进行全站信息检索也是一种搜索动作,但因未能进行匹配程度的排序导致依旧需要在大量的告警描述中寻找最优结果。因此使用自然语言识别技术,不仅使检索信息匹配更容易,通过计算机判断可自动进行选取匹配工作。
[0011] 规范化告警信息中,存在于某些告警信息某词义相似的情况,例如“重合闸动作”、“重合闸保护动作”,或相近的情况,例如“装置闭”、“装置故障”。该信息在处理过程中需要大量的调度运行、保护自动化等专业知识支持,对于此类信息的判断成为一个难点。针对这一问题,在软件设计中提出了机器学习的概念,程序在协助工作人员梳理过程中,记录经验丰富的梳理人员的梳理结果,当经验不足的梳理人员在处理相同或者相似问题时,系统通过调取经验匹配的方式自动给出建议,若有其他选项,在经过经验丰富的梳理人员的许可下,可以将其填写匹配结果,这一流程本质上是一个半监督的机器学习。
[0012] 优选的,上述自然语言识别处理方法:首先比对信息为告警信息规范化描述与实际告警描述之间进行对比描述,采用TF-IDF方法计算进行词条的相似度计算:
[0013] TF-IDF方法中词频:对于在特定文件里的词语ti来说,它的重要性表示为:
[0014]
[0015] 式中:ni,j是该词在文件dj中的出现次数,而分母∑knk,j则是在文件dj中所有字词的出现次数之和;
[0016] TF-IDF方法中逆向文件频率:对于特定词语的IDF,由总文件数目除以包含该词语之文件的数目,再将得到的商取以10为底的对数得到:
[0017]
[0018] 式中:|D|:语料库中的文件总数,{j:ti∈dj}包含词语的文件数目,如果该词语不在语料库中,就会导致分母为零,因此一般情况下使用作为分母;
[0019] TF-IDF计算就是在词频TF的基础上再加入逆文本IDF的信息:
[0020] tfidfi,j=tfi,j×idfi
[0021] 通过TF-IDF公式计算方法,将两个待比较的词条进行逐字分解成数组,计算出TF-IDF矩阵,然后计算二者的交集大小和并集大小,作商得出告警规范化描述与实际描述的匹配度。
[0022] 优选的,上述自然语言识别处理在半监督处理过程中,记录人工告警信息匹配的选取过程,将该处理经验存入经验学习库中,在下次描述词条处理过程中调取相关经验处理信息,并使用经验与词条进行TF-IDF匹配计算。
[0023] 优选的,上述匹配度阈值为0.7-1。
[0024] 本发明的有益效果:与现有技术相比,本发明深度学习中自然语言处理识别方法解决在调控一体化接入遥信梳理工作中需要对上送远传信息进行遥信名称梳理、规范、定级等工作提供解决方案,对相关信息进行查缺补漏,提高梳理质量,减轻梳理人员的工作压力,让遥信梳理工作更准确、便捷,减少了厂站信息漏发、误发的情况发生,确保调度自动化系统信息可靠性。附图说明
[0025] 图1是整体流程示意图;
[0026] 图2是数据处理流程图
[0027] 图3是机器学习处理流程图;
[0028] 图4是阈值选取分布曲线。

具体实施方式

[0029] 下面结合附图及具体的实施例对本发明进行进一步介绍。
[0030] 实施例:如图1-4所示,一种基于深度学习的遥信梳理方法,该方法包括以下步骤:
[0031] 1.根据导出的电网间隔模型文件,自动生成规范要求的全站标准信息表;
[0032] 2.导入规范点表和主站导出的变电站点表,逐间隔查找核实主站点表情况;
[0033] 3.全站核查结果汇总并生成报告。
[0034] 一种基于深度学习的遥信梳理方法,该方法具备包括显示模块、验证模块、梳理模块、查阅模块和存储模块,具体包括以下步骤:
[0035] 1)建立遥信梳理工作平台界面:显示模块通过表格着色突出显示存在问题的描述并通过右键菜单、下拉选取方式进行梳理核对工作;
[0036] 2)利用规则进行名称规范性验证:验证模块按通过规则进行遥信名称规范性识别,重组遥信名称,即通过电网间隔模型名称对原描述信息中间隔字符段、描述字符段进行处理;
[0037] 3)使用历史处理信息进行梳理操作:梳理模块将步骤2)中信息规范匹配处理结果存储处理经验库中,通过深度学习方法的自然语言识别处理列出遥信最优选线;
[0038] 4)使用规范信息进行遗漏信息查阅:查阅模块处理过程中对相关间隔告警进行规范性核查,即使用规范性告警描述文件进行告警信息筛查,检查出厂站间隔告警中出现的分级错误及遗漏的情况进行汇总分析;
[0039] 5)生成可导入数据库文件:对生成厂站RTU模型数据库文件生成可导入数据库CSV文件。
[0040] 优选的,上述自然语言识别处理方法:首先比对信息为告警信息规范化描述与实际告警描述之间进行对比描述,采用TF-IDF方法计算进行词条的相似度计算:
[0041] TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被搜索引擎应用,作为文件与用户查询之间相关程度的度量或评级。除了TF-IDF以外,互联网上的搜索引擎还会使用基于链接分析的评级方法,以确定文件在搜索结果中出现的顺序。
[0042] TF-IDF方法中词频:对于在特定文件里的词语ti来说,它的重要性表示为:
[0043]
[0044] 式中:ni,j是该词在文件dj中的出现次数,而分母∑knk,j则是在文件dj中所有字词的出现次数之和;
[0045] TF-IDF方法中逆向文件频率:对于特定词语的IDF,由总文件数目除以包含该词语之文件的数目,再将得到的商取以10为底的对数得到:
[0046]
[0047] 式中:|D|:语料库中的文件总数,{j:ti∈dj}包含词语的文件数目,如果该词语不在语料库中,就会导致分母为零,因此一般情况下使用作为分母;
[0048] TF-IDF计算就是在词频TF的基础上再加入逆文本IDF的信息:
[0049] tfidfi,j=tfi,j×idfi
[0050] 通过TF-IDF公式计算方法,将两个待比较的词条进行逐字分解成数组,计算出TF-IDF矩阵,然后计算二者的交集大小和并集大小,作商得出告警规范化描述与实际描述的匹配度。
[0051] 例如,计算“#2主变高压侧过负荷告警”规范化告警描述过程中,与实际厂站告警描述进行匹配结果如下:
[0052] 表1匹配值示意表
[0053]告警描述 匹配值
#2主变高压侧过负荷告警(软) 0.91
#2主变中压侧过负荷告警(软) 0.88
#2主变低压侧过负荷告警(软) 0.88
#2主变高压侧过负荷闭锁有载调压 0.49
#2主变中压侧过负荷闭锁有载调压 0.49
#2主变低压侧过负荷闭锁有载调压 0.49
[0054] 为避免在处理过程中出现重复匹配过程,提高匹配精度,自然语言识别处理在半监督处理过程中,记录人工告警信息匹配的选取过程,将该处理经验存入经验学习库中,在下次描述词条处理过程中调取相关经验处理信息,并使用经验与词条进行TF-IDF匹配计算,由于在实际运算过程中可能会存在无经验的情况,此时采用关键字匹配计算进行人工匹配工作,确保人工确认数量达到可控制范围,如图3所示。
[0055] 优选的,上述匹配度阈值为0.7-1,设定1000个规范化描述与实际描述匹配的训练集,阈值区间取值为0.7-1之间,以0.1为步长,最低选取匹配阈值如图4所示,统计结果中阈值等于1的情况不存在参考价值,故剔除后按照95%的准确率进行重统计计算。满足准确率95%时,阈值选取范围为0.82。在配合经验处理后可适当提高0.02-0.05左右提高识别精度。
[0056] 数据处理过程中多线程运用技术:单规范化词条与1000个厂站实际描述匹配值计算时间为5.3秒(常规工作站配置),为解决处理时长过长的问题,软件采用将所有待匹配的实际描述组按处理进程数进行随机均分,实现进程之间的负载均衡。实际采用8进程进行同时处理时,单规范词条处理时长降至1.4秒。
[0057] 本发明将人工智能领域中自然语言识别技术、机器学习技术应用于变电站信息核查工作,结合该工作的特点,创新性地建立了遥信信号命名经验库并将其应用于核查算法,创造性地解决了梳理工作依赖于人员经验的问题。在业务流程上,本发明构建了分布式的处理平台,应用经验数据库共享、多线程的技术,简化了梳理的繁琐流程,将人从繁复的操作中解放出来,使其专注于信号的梳理,而不是数据的整理工作,显著提高了梳理工作的效率和准确性。同时利用该技术经验,为今后告警信息智能化识别、处理、优化提供重要依据。
[0058] 以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内,因此,本发明的保护范围应以所述权利要求的保护范围为准。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈