首页 / 专利库 / 电脑图像 / 字体微调 / 利用图像处理进行数据采集的方法及系统

利用图像处理进行数据采集的方法及系统

阅读:995发布:2020-05-11

专利汇可以提供利用图像处理进行数据采集的方法及系统专利检索,专利查询,专利分析的服务。并且本 发明 公开一种利用 图像处理 进行 数据采集 的方法及系统,包括:S1、在采集的图像中标定出每一待读参数对应的数值的识别框;S2、对识别框进行矩阵化处理和 对比度 锐化处理以突出识别框中的字符;S3、识别出识别框内的字符区域,据字符间的空格对字符区域进行切分以获得 块 字符,对每一块字符中的每一字符,通过字符的形状与对应 数据库 中的形状进行对比以匹配识别出每一字符;S4、将识别结果存储在边缘计算网关的数据库中。本发明通过对控制系统HMI的截屏,对截屏图片进行图像处理,识别图片中的文字、数字和字符等数据,将识别结果解析输出存储在边缘计算网关的数据库中,本发明能快速精确地识别截屏图片中的各输出参数,综合成本较低。,下面是利用图像处理进行数据采集的方法及系统专利的具体信息内容。

1.一种利用图像处理进行数据采集的方法,其特征在于,其包括以下步骤:
S1、在采集的图像中标定出每一待读参数对应的数值的识别框;
S2、对识别框进行矩阵化处理和对比度锐化处理以突出识别框中的字符;
S3、识别出识别框内的字符区域,根据字符间的空格对字符区域进行切分以获得字符,对每一块字符中的每一字符,通过字符的形状与对应数据库中的形状进行对比以匹配识别出每一字符;
S4、将识别结果解析输出存储在边缘计算网关的数据库中。
2.如权利要求1所述的利用图像处理进行数据采集的方法,其特征在于,在步骤S1中,微调识别框的上边框、下边框、左边框或右边框,以使得识别框内不掺杂背景干扰元素。
3.如权利要求1所述的利用图像处理进行数据采集的方法,其特征在于,在步骤S3中,针对块字符中的部分掩盖字体,通过掩盖字体的形状与对应数据库中的形状进行对比以匹配识别出掩盖字体所表示的字符。
4.如权利要求3所述的利用图像处理进行数据采集的方法,其特征在于,搜集掩盖字体的范例图片,对范例图片中掩盖字体进行识别框内容提取,采取背景去噪和对比度锐化处理,借助jTessBoxEditor工具对处理后的掩盖文本进行重标注,对重标注数据进行重训练,生成新的文本库,用新的文本库对未来的部分掩盖字体进行识别预测。
5.一种利用图像处理进行数据采集的系统,其特征在于,其包括标定模块、处理模块、识别模块和存储模块;
所述标定模块用于在采集的图像中标定出每一待读参数对应的数值的识别框;
所述处理模块用于对识别框进行矩阵化处理和对比度锐化处理以突出识别框中的字符;
所述识别模块用于识别出识别框内的字符区域,根据字符间的空格对字符区域进行切分以获得块字符,对每一块字符中的每一字符,通过字符的形状与对应数据库中的形状进行对比以匹配识别出每一字符;
所述存储模块用于将识别结果解析输出存储在边缘计算网关的数据库中。
6.如权利要求5所述的利用图像处理进行数据采集的系统,其特征在于,所述标定模块用于微调识别框的上边框、下边框、左边框或右边框,以使得识别框内不掺杂背景干扰元素。
7.如权利要求5所述的利用图像处理进行数据采集的系统,其特征在于,针对块字符中的部分掩盖字体,所述识别模块用于通过掩盖字体的形状与对应数据库中的形状进行对比以匹配识别出掩盖字体所表示的字符。
8.如权利要求7所述的利用图像处理进行数据采集的系统,其特征在于,所述系统还包括样本获取模块,所述样本获取模块用于搜集掩盖字体的范例图片,对范例图片中掩盖字体进行识别框内容提取,采取背景去噪和对比度锐化处理,借助jTessBoxEditor工具对处理后的掩盖文本进行重标注,对重标注数据进行重训练,生成新的文本库,用新的文本库对未来的部分掩盖字体进行识别预测。

说明书全文

利用图像处理进行数据采集的方法及系统

技术领域

[0001] 本发明涉及数据采集技术领域,特别是涉及一种利用图像处理进行数据采集的方法及系统。

背景技术

[0002] 在工业互联网领域,面对各种各样的工业设备,尤其是比较老旧的控制设备,如数控切割机、数控折弯机等,无法通过标准的通讯协议获取设备控制器的数据。工业现场控制系统往往基于Windows和Linux等操作系统平台,部分系统基于嵌入式的专用控制系统,对于控制系统的HMI界面,一般会实时显示设备的相关参数,如坐标值、告警信息等内容,往往这些数据是对工业互联网有重要价值的数据,需要进行数据采集。

发明内容

[0003] 本发明针对现有技术存在的问题和不足,提供一种利用图像处理进行数据采集的方法及系统。
[0004] 本发明是通过下述技术方案来解决上述技术问题的:
[0005] 本发明提供一种利用图像处理进行数据采集的方法,其特点在于,其包括以下步骤:
[0006] S1、在采集的图像中标定出每一待读参数对应的数值的识别框;
[0007] S2、对识别框进行矩阵化处理和对比度锐化处理以突出识别框中的字符;
[0008] S3、识别出识别框内的字符区域,根据字符间的空格对字符区域进行切分以获得字符,对每一块字符中的每一字符,通过字符的形状与对应数据库中的形状进行对比以匹配识别出每一字符;
[0009] S4、将识别结果解析输出存储在边缘计算网关的数据库中。
[0010] 较佳地,在步骤S1中,微调识别框的上边框、下边框、左边框或右边框,以使得识别框内不掺杂背景干扰元素。
[0011] 较佳地,在步骤S3中,针对块字符中的部分掩盖字体,通过掩盖字体的形状与对应数据库中的形状进行对比以匹配识别出掩盖字体所表示的字符。
[0012] 较佳地,搜集掩盖字体的范例图片,对范例图片中掩盖字体进行识别框内容提取,采取背景去噪和对比度锐化处理,借助jTessBoxEditor工具对处理后的掩盖文本进行重标注,对重标注数据进行重训练,生成新的文本库,用新的文本库对未来的部分掩盖字体进行识别预测。
[0013] 本发明还提供一种利用图像处理进行数据采集的系统,其特点在于,其包括标定模块、处理模块、识别模块和存储模块;
[0014] 所述标定模块用于在采集的图像中标定出每一待读参数对应的数值的识别框;
[0015] 所述处理模块用于对识别框进行矩阵化处理和对比度锐化处理以突出识别框中的字符;
[0016] 所述识别模块用于识别出识别框内的字符区域,根据字符间的空格对字符区域进行切分以获得块字符,对每一块字符中的每一字符,通过字符的形状与对应数据库中的形状进行对比以匹配识别出每一字符;
[0017] 所述存储模块用于将识别结果解析输出存储在边缘计算网关的数据库中。
[0018] 较佳地,所述标定模块用于微调识别框的上边框、下边框、左边框或右边框,以使得识别框内不掺杂背景干扰元素。
[0019] 较佳地,针对块字符中的部分掩盖字体,所述识别模块用于通过掩盖字体的形状与对应数据库中的形状进行对比以匹配识别出掩盖字体所表示的字符。
[0020] 较佳地,所述系统还包括样本获取模块,所述样本获取模块用于搜集掩盖字体的范例图片,对范例图片中掩盖字体进行识别框内容提取,采取背景去噪和对比度锐化处理,借助jTessBoxEditor工具对处理后的掩盖文本进行重标注,对重标注数据进行重训练,生成新的文本库,用新的文本库对未来的部分掩盖字体进行识别预测。
[0021] 在符合本领域常识的基础上,上述各优选条件,可任意组合,即得本发明各较佳实例。
[0022] 本发明的积极进步效果在于:
[0023] 本发明通过对控制系统HMI的截屏,并对截屏的图片进行图像处理,识别图片中的文字、数字和字符等数据,将识别结果解析输出存储在边缘计算网关的数据库中,本发明能够快速精确地识别截屏图片中的各输出参数,综合成本较低。附图说明
[0024] 图1为本发明较佳实施例的利用图像处理进行数据采集的方法的流程图
[0025] 图2为本发明较佳实施例的图像处理参数识别框定位的示意图。
[0026] 图3为本发明较佳实施例的利用图像处理进行数据采集的系统的结构框图

具体实施方式

[0027] 为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0028] 如图1所示,本实施例提供一种利用图像处理进行数据采集的方法,其包括以下步骤:
[0029] 步骤101、在采集的图像中标定出每一待读参数对应的数值的识别框,微调识别框的上边框、下边框、左边框或右边框,以使得识别框内不掺杂背景干扰元素,见图2。
[0030] 对每一个参数要求上下左右四个像素位置尽量在不掺杂其他背景干扰元素(例如边框、横线之类的干扰背景)的基础上尽可能地将参数内容全部包括到识别框(bounding box)当中,称为坐标调整的基准(base line)。
[0031] 步骤102、对识别框进行矩阵化处理和对比度锐化处理以突出识别框中的字符。
[0032] 背景噪音的处理首先要正确的截取出参数内容的bounding box。保证其bounding box中尽量少的包含各种背景噪音。比如边框、干扰线等等。同时还要避免双背景的情况,去噪的方法是通过对截取的参数内容的像素进行矩阵化处理。在此基础上找寻像素的分布规律,然后对色度值进行锐化处理。
[0033] 步骤103、识别出识别框内的字符区域,根据字符间的空格对字符区域进行切分以获得块字符,对每一块字符中的每一字符,通过字符的形状与对应数据库中的形状进行对比以匹配识别出每一字符。
[0034] 其中,针对块字符中的部分掩盖字体,通过掩盖字体的形状与对应数据库中的形状进行对比以匹配识别出掩盖字体所表示的字符。
[0035] 搜集掩盖字体的范例图片,对范例图片中掩盖字体进行识别框内容提取,采取背景去噪和对比度锐化处理,借助jTessBoxEditor工具对处理后的掩盖文本进行重标注,对重标注数据进行重训练,生成新的文本库,用新的文本库对未来的部分掩盖字体进行识别预测。
[0036] 步骤104、将识别结果解析输出存储在边缘计算网关的数据库中。
[0037] 如图3所示,本实施例还提供一种利用图像处理进行数据采集的系统,其包括标定模块1、处理模块2、识别模块3和存储模块4。
[0038] 所述标定模块1用于在采集的图像中标定出每一待读参数对应的数值的识别框,微调识别框的上边框、下边框、左边框或右边框,以使得识别框内不掺杂背景干扰元素。
[0039] 所述处理模块2用于对识别框进行矩阵化处理和对比度锐化处理以突出识别框中的字符。
[0040] 所述识别模块3用于识别出识别框内的字符区域,根据字符间的空格对字符区域进行切分以获得块字符,对每一块字符中的每一字符,通过字符的形状与对应数据库中的形状进行对比以匹配识别出每一字符。
[0041] 其中,针对块字符中的部分掩盖字体,所述识别模块用于通过掩盖字体的形状与对应数据库中的形状进行对比以匹配识别出掩盖字体所表示的字符。
[0042] 所述系统还包括样本获取模块,所述样本获取模块用于搜集掩盖字体的范例图片,对范例图片中掩盖字体进行识别框内容提取,采取背景去噪和对比度锐化处理,借助jTessBoxEditor工具对处理后的掩盖文本进行重标注,对重标注数据进行重训练,生成新的文本库,用新的文本库对未来的部分掩盖字体进行识别预测。
[0043] 所述存储模块4用于将识别结果解析输出存储在边缘计算网关的数据库中。
[0044] 针对工业现场的老旧设备,往往不支持标准的通讯协议,常规的数据采集思路很难实现对于该类型设备的数据采集,本方案可以弥补常规数据采集方案的不足,能够快速精确地识别截屏图片中的各输出参数,综合成本较低。
[0045] 虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这些仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈