专利汇可以提供一种针对变电站的基于机器学习的语义标注方法专利检索,专利查询,专利分析的服务。并且本 发明 公布了一种针对变电站的基于 机器学习 的语义标注方法。其包括对训练视频和测试视频图像进行特征提取,对特征进行聚类,将生成的视觉单词进行关联和量化,机器模型依据特征描述后的视频和图像进行学习,将最优参数下的半监督或弱 监督学习 方法用于对测试视频、图片进行标注。本发明可实现现场作业标准化和数据规范化,实现现场侧和中心侧的数据和分析 算法 互享,提高现场侧的数据分析能 力 ,加强现场运维的远程管控和实时技术支持能力。提高现场运维的专业化、智能化 水 平,提升运检工作效率、设备状态管控能力,强化状态检修和辅助决策。,下面是一种针对变电站的基于机器学习的语义标注方法专利的具体信息内容。
1.一种针对变电站的基于机器学习的语义标注方法,其特征在于:包括:
步骤1、采集数据集的图像并进行预处理;
步骤2、将预处理后的图像进行规范化;对于结构化的数据,如数值数据、参数、变量、录入数据和采样数据等的存储采用XML格式;针对非结构化数据的规范化转化方法主要是利用基于稀疏编码、视觉单词等技术对非结构化图谱、视频数据进行规范化和特征量提取;
步骤3、将训练视频图像类集合所提取的特征信息聚类,生成视觉单词并进行关联,然后量化视觉单词,新的视觉单词作为半监督或弱监督机器学习方法的输入,学习获得最优参数,将最优参数下的半监督或弱监督机器学习方法用于对测试视频、图像进行标注;
步骤4、利用变电设备图像结构特征,对步骤3得到的数据进行视频压缩,剔除无关信息并保留特征信息,实现现场视频数据的高效压缩和高速传输;
步骤5、研究各类状态检测数据的高维混合数据标识技术,建立高效多级状态检测数据综合索引模型,实现检测数据的多级多维等快速索引;
步骤6、基于各类检测数据的规范化模型与特征量,研究状态检测数据的分析诊断技术及个性化展示方法。
2.根据权利要求1所述的一种针对变电站的基于机器学习的语义标注方法,其特征在于:所述步骤1具体包括:
步骤1.1、图像增强;突出图像中感兴趣的信息,使有用信息得到增强,便于区分和解释;
步骤1.2、图像复原;主要任务是去噪声,去模糊。
3.根据权利要求1所述的一种针对变电站的基于机器学习的语义标注方法,其特征在于:所述步骤2具体包括:
步骤2.1、提出局部不变特征提取技术,提取具有尺度,旋转,光照,模糊和视角不变性的局部关键点特征,实现特征点的高准确度匹配,提取有效的区域不变特征,描述局部区域的相关特性,实现仿射和旋转不变性;
步骤2.2、提出有效的具有判决力的图谱描述算子,概括图谱主要内容信息;利用局部不变特征,设计有效的视觉单词索引技术,有效捕获空域及其特征域信息;利用稀疏编码技术,实现有效的图谱结构化描述方法,提取低维的图谱描述符,用于大数据库图谱的有效分类;利用稠密的采样技术,设计基于像素的特征描述,并结合视觉单词技术描述整幅图谱/纹理特征;
步骤2.3、提出有语义的对象及其场景信息描述方法;设计有效的对象检测算法,达到前景和背景信息的可靠分离;利用对象和场景上下文关系,建立有特定语义的图谱统一描述方法;建立有效的数学描述模型,完成对象和场景的语义建模;
步骤2.4、研究具有几何结构的多尺度、多层次的特征描述,挖掘对象的类别空域分布信息,有效提取中层语义信息;对于无法直接进行处理的非结构化图谱数据,通过图谱特征描述技术,实现非结构化图谱数据的结构化转换。
4.根据权利要求1所述的一种针对变电站的基于机器学习的语义标注方法,其特征在于:所述步骤3具体包括:
步骤3.1、对于相对静态的电力设备图谱,采用局部不变特征提取技术,提取具有尺度,旋转,光照,模糊和视角不变性的局部关键点特征,实现特征点的高准确度匹配,提取有效的区域不变特征,描述局部区域的相关特性,实现仿射和旋转不变性;对于可以进行结构化转换的非结构化数据,转换后变成特征向量,可以直接存储在XML结构中,对于不能转换的数据,如复杂的图像和视频数据,将其存储在文件系统中,并且在对应的XML词条中做标记,便于随时查询;
步骤3.2、将训练视频图像类集合所提取的特征信息聚类;聚类过程包括:
1)数据准备:包括特征标准化和降维.
2)特征选择:从最初的特征中选择最有效的特征,并将其存储于向量中.
3)特征提取:通过对所选择的特征进行转换形成新的突出特征.
4)聚类:首先选择合适特征类型的距离函数进行接近程度的度量;而后执行聚类或分组.
5)聚类结果评估:是指对聚类结果进行评估.评估主要有3种:外部有效性评估、内部有效性评估和相关性测试评估.
步骤3.3、聚类后视觉单词生成,再利用概率潜在语义分析模型挖掘视觉单词之间的共生概率,综合这两种关系得到图像块所对应的视觉单词在空间域的上下文语义共生概率,即关联视觉单词;最后综合特征域的相似性和空间域的语义约束性,量化视觉单词,新的视觉单词作为半监督或弱监督机器学习方法的输入,学习获得最优参数,将最优参数下的半监督或弱监督机器学习方法用于对测试视频、图像进行标注,可以获得相应的视频和图片标签;
步骤3.4、机器学习模型涉及从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法;半监督学习是有监督学习与无监督学习相结合的一种学习方法,利用有标记样本的信息,利用无标记样本的内在几何结构的信息,从而训练出优良的训练器。
5.根据权利要求1所述的一种针对变电站的基于机器学习的语义标注方法,其特征在于:所述步骤4具体包括:
步骤4.1、预处理,对输入的视频信号进行一些预处理,可以提高编码器的效率,如对输入信号进行采样和数字化,消除输入视频帧的一些不理想特征,在编码前先对输入帧进行噪声过滤;
步骤4.2、正交变换,对视频信息进行正交变换,可将图像像素转换成不同的空间区域,主要目的是去除视频序列中的统计冗余,正交变换是视频压缩系统的核心;
步骤4.3、量化,量化可以降低变换系数的精度以减少存储空间,可以去掉信号中的高频成分,从而达到压缩数据的目的,量化过程可以消去一些安全的信息而没有损失任何的视觉保真度,可将每个变换过的像素用有限的输出信号集表示;
步骤4.4、编码,编码是将码字分配给量化后的视频数据,重构视频图像的过程是压缩视频图像的反过程,主要有解码、反量化、反变换和后处理。
6.根据权利要求1所述的一种针对变电站的基于机器学习的语义标注方法,其特征在于:所述步骤5具体包括:建立高效多级状态检测数据综合索引模型,将状态检测数据从电力设备基础数据、电力设备运行数据、检测仪器、检测数据、气象信息维度上建立类型状态检测数据的高维混合数据标识模型,建模过程包括:
步骤5.1、选择有价值的变量作为建模对象;从数据的完整性、集中度、与其他变量的相关性等角度来考虑,选择如图4所示的树状图中设备运行数据、检测数据的特征量、仪器规格信息等作为建模变量;
步骤5.2、选择合适的算法并设定参数;利用K-prototype进行聚类分析,给出希望聚类的类别数量和起始的聚类中心和迭代次数上限,研究各个维度之间的关联性;
步骤5.3、加载算法并验证算法准确性和有效性;
步骤5.4、通过从状态检测数据样本库提取数据指纹来构建索引,有待检索数据后提取其数据指纹,将二者指纹进行搜索匹配,可得到检索结果,即如图5所示的状态检测数据快速索引模型。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
基于流形正则和范数正则的领域迁移极限学习机方法 | 2020-05-11 | 636 |
锥束计算机断层扫描图像注册与重叠方法 | 2020-05-15 | 667 |
一种基于ACGAN图像半监督分类算法 | 2020-05-15 | 968 |
一种基于商用WiFi的位置自适应动作识别方法 | 2020-05-08 | 767 |
一种移动式供热机组故障诊断方法 | 2020-05-17 | 61 |
半监督学习式目标检测神经网络训练方法、装置及应用 | 2020-05-14 | 692 |
神经网络的标注系统 | 2020-05-11 | 539 |
一种基于卷积神经网络的自动驾驶汽车前方物体检测方法 | 2020-05-17 | 259 |
一种资产配置方法、装置、电子设备及存储介质 | 2020-05-11 | 152 |
一种基于对抗训练和对抗学习网络的半监督文本分类方法 | 2020-05-18 | 95 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。