首页 / 专利库 / 图形技术 / 可视化 / 一种数据可视化方法及设备

一种数据可视化方法及设备

阅读:381发布:2024-01-09

专利汇可以提供一种数据可视化方法及设备专利检索,专利查询,专利分析的服务。并且本 申请 提供了一种数据 可视化 方法及设备,该方案在获取输入图像之后,对所述输入图像进行预处理,获取所述输入数据中几何图形和文本的构图信息,然后分别基于几何图形的构图信息和文本的构图信息进行处理,根据所述几何图形的构图信息生成第一图层,以及根据所述文本的构图信息生成第二图层,最后融合第一图层和第二图层,从而快速地实现图像 数据可视化 重构、还原,生成符合用户期望的可视化设计。,下面是一种数据可视化方法及设备专利的具体信息内容。

1.一种数据可视化方法,其中,该方法包括:
在输入图像中识别出几何图形和文本图形,并获取所述输入数据中几何图形和文本图形的构图信息;
根据所述几何图形的构图信息生成第一图层,并根据所述文本图形的构图信息生成第二图层;
根据所述第一图层和所述第二图层,生成可视化图像。
2.根据权利要求1所述的方法,其中,在所述输入图像中识别出所述几何图形和文本图形,包括:
对所述输入图像进行图形识别,确定所述输入图像中的文本图形;
将所述输入图像中的其余图形确定为几何图形,其中,所述其余图形为所述输入图像中除所述文本图形之外的图形。
3.根据权利要求2所述的方法,其中,所述图形识别采用OCR技术。
4.根据权利要求1所述的方法,其中,所述构图信息包括文本图形和几何图形在所述输入图像中的位置信息。
5.根据权利要求4所述的方法,其中,在所述输入图像中识别出所述几何图形和文本图形之前,还包括:
对所述输入图像进行网格化处理,划分多个网格区域;
所述构图信息包括文本图形和几何图形的像素点在网格区域中的坐标值。
6.根据权利要求1所述的方法,其中,根据所述几何图形的构图信息生成第一图层,包括:
基于所述几何图形的构图信息确定所述几何图形对应的笔画信息;
根据所述笔画信息进行笔画分割,将所述几何图形分割为至少一个图元;
对所述图元进行直线和/或曲线的识别及拟合,确定所述图元对应的直线和/或曲线;
将图元对应的直线和/或曲线组合,生成所述第一图层。
7.根据权利要求6所述的方法,其中,根据所述笔画信息进行笔画分割,将所述几何图形分割为至少一个图元,包括:
根据所述笔画信息确定所述几何图形中的拐点,其中,所述拐点为几何图形中曲率大于预设值的位置;
根据所述拐点将所述几何图形分割为至少一个图元。
8.根据权利要求6所述的方法,其中,将图元对应的直线和/或曲线组合,生成所述第一图层,包括:
依次绘制所述图元对应的直线和/或曲线,对所述图元对应的直线和/或曲线的连接处进行融合和规整,生成所述第一图层。
9.根据权利要求1所述的方法,其中,该方法还包括:
对所述可视化图像中图形的视觉效果进行优化调整。
10.一种数据可视化设备,其中,该设备包括:
预处理模,用于在输入图像中识别出几何图形和文本图形,并获取所述输入数据中几何图形和文本图形的构图信息;
图形构建模块,用于根据所述几何图形的构图信息生成第一图层,并根据所述文本图形的构图信息生成第二图层;
可视化构建模块,根据所述第一图层和所述第二图层,生成可视化图像。
11.根据权利要求10所述的设备,其中,所述预处理模块,用于对所述输入图像进行图形识别,确定所述输入图像中的文本图形;将所述输入图像中的其余图形确定为几何图形,其中,所述其余图形为所述输入图像中除所述文本图形之外的图形。
12.根据权利要求11所述的设备,其中,所述图形识别采用OCR技术。
13.根据权利要求10所述的设备,其中,所述构图信息包括文本图形和几何图形在所述输入图像中的位置信息。
14.根据权利要求13所述的设备,其中,所述预处理模块,还用于在所述输入图像中识别出所述几何图形和文本图形之前,对所述输入图像进行网格化处理,划分多个网格区域,其中,所述构图信息包括文本图形和几何图形的像素点在网格区域中的坐标值。
15.根据权利要求10所述的设备,其中,所述图形构建模块,用于基于所述几何图形的构图信息确定所述几何图形对应的笔画信息;根据所述笔画信息进行笔画分割,将所述几何图形分割为至少一个图元;对所述图元进行直线和/或曲线的识别及拟合,确定所述图元对应的直线和/或曲线;将图元对应的直线和/或曲线组合,生成所述第一图层。
16.根据权利要求15所述的设备,其中,所述图形构建模块,用于根据所述笔画信息确定所述几何图形中的拐点,其中,所述拐点为几何图形中曲率大于预设值的位置;根据所述拐点将所述几何图形分割为至少一个图元。
17.根据权利要求15所述的设备,其中,所述图形构建模块,用于依次绘制所述图元对应的直线和/或曲线,对所述图元对应的直线和/或曲线的连接处进行融合和规整,生成所述第一图层。
18.根据权利要求10所述的设备,其中,该设备还包括:
调节模块,用于对所述可视化图像中图形的视觉效果进行优化调整。
19.一种数据可视化设备,其中,该设备包括:
处理器;以及
存储有机器可读指令的一个或多个机器可读介质,当所述处理器执行所述机器可读指令时,使得所述设备执行如权利要求1至9中任一项所述的方法。

说明书全文

一种数据可视化方法及设备

技术领域

[0001] 本申请涉及信息技术领域,尤其涉及一种数据可视化方法及设备。

背景技术

[0002] 数据可视化和可视分析作为帮助用户高效、准确理解数据,结合数据进行交互分析理解的重要手段,在数据时代显得越来越重要。相较于传统的图表,数据可视化能够以更生动、友好的形式即时呈现数据的含义。在各个领域,数据可视化和可视分析能够帮助用户发现业务问题,越来越成为大数据解决方案中不可或缺的一环。如何针对数据快速设计一个可视化方案并使之迅速、无槛地在终端设备中被重构、还原,并进行进一步的优化,生成期望的可视化设计,目前这种技术或者产品还是欠缺的。
[0003] 申请内容
[0004] 本申请的一个目的是提供一种数据可视化的方案,用以快速地实现图像数据可视化重构、还原,生成符合用户期望的可视化设计。
[0005] 为实现上述目的,本申请提供了一种数据可视化方法,该方法包括:
[0006] 在输入图像中识别出所述几何图形和文本图形,并获取所述输入数据中几何图形和文本图形的构图信息;
[0007] 根据所述几何图形的构图信息生成第一图层,并根据所述文本图形的构图信息生成第二图层;
[0008] 根据所述第一图层和所述第二图层,生成可视化图像。
[0009] 进一步地,在所述输入图像中识别出所述几何图形和文本图形,包括:
[0010] 对所述输入图像进行图形识别,确定所述输入图像中的文本图形;
[0011] 将所述输入图像中的其余图形确定为几何图形,其中,所述其余图形为所述输入图像中除所述文本图形之外的图形。
[0012] 进一步地,所述图形识别采用OCR技术。
[0013] 进一步地,所述构图信息包括文本图形和几何图形在所述输入图像中的位置信息。
[0014] 进一步地,在所述输入图像中识别出所述几何图形和文本图形之前,还包括:
[0015] 对所述输入图像进行网格化处理,划分多个网格区域;
[0016] 所述构图信息包括文本图形和几何图形的像素点在网格区域中的坐标值。
[0017] 进一步地,根据所述几何图形的构图信息生成第一图层,包括:
[0018] 基于所述几何图形的构图信息确定所述几何图形对应的笔画信息;
[0019] 根据所述笔画信息进行笔画分割,将所述几何图形分割为至少一个图元;
[0020] 对所述图元进行直线和/或曲线的识别及拟合,确定所述图元对应的直线和/或曲线;
[0021] 将图元对应的直线和/或曲线组合,生成所述第一图层。
[0022] 进一步地,根据所述笔画信息进行笔画分割,将所述几何图形分割为至少一个图元,包括:
[0023] 根据所述笔画信息确定所述几何图形中的拐点,其中,所述拐点为几何图形中曲率大于预设值的位置;
[0024] 根据所述拐点将所述几何图形分割为至少一个图元。
[0025] 进一步地,将图元对应的直线和/或曲线组合,生成所述第一图层,包括:
[0026] 依次绘制所述图元对应的直线和/或曲线,对所述图元对应的直线和/或曲线的连接处进行融合和规整,生成所述第一图层。
[0027] 进一步地,该方法还包括:
[0028] 对所述可视化图像中图形的视觉效果进行优化调整。
[0029] 基于本申请的另一方面,还提供了一种数据可视化设备,该设备包括:
[0030] 预处理模,用于在输入图像中识别出所述几何图形和文本图形,并获取所述输入数据中几何图形和文本图形的构图信息;
[0031] 图形构建模块,用于根据所述几何图形的构图信息生成第一图层,并根据所述文本图形的构图信息生成第二图层;
[0032] 可视化构建模块,根据所述第一图层和所述第二图层,生成可视化图像。
[0033] 进一步地,所述预处理模块,用于对所述输入图像进行图形识别,确定所述输入图像中的文本图形;将所述输入图像中的其余图形确定为几何图形,其中,所述其余图形为所述输入图像中除所述文本图形之外的图形。
[0034] 进一步地,所述图形识别采用OCR技术。
[0035] 进一步地,所述构图信息包括文本图形和几何图形在所述输入图像中的位置信息。
[0036] 进一步地,所述预处理模块,还用于在所述输入图像中识别出所述几何图形和文本图形之前,对所述输入图像进行网格化处理,划分多个网格区域,其中,所述构图信息包括文本图形和几何图形的像素点在网格区域中的坐标值。
[0037] 进一步地,所述图形构建模块,用于基于所述几何图形的构图信息确定所述几何图形对应的笔画信息;根据所述笔画信息进行笔画分割,将所述几何图形分割为至少一个图元;对所述图元进行直线和/或曲线的识别及拟合,确定所述图元对应的直线和/或曲线;将图元对应的直线和/或曲线组合,生成所述第一图层。
[0038] 进一步地,所述图形构建模块,用于根据所述笔画信息确定所述几何图形中的拐点,其中,所述拐点为几何图形中曲率大于预设值的位置;根据所述拐点将所述几何图形分割为至少一个图元。
[0039] 进一步地,所述图形构建模块,用于依次绘制所述图元对应的直线和/或曲线,对所述图元对应的直线和/或曲线的连接处进行融合和规整,生成所述第一图层。
[0040] 进一步地,该设备还包括:
[0041] 调节模块,用于对所述可视化图像中图形的视觉效果进行优化调整。
[0042] 此外,本申请还提供了一种数据可视化设备,该设备包括:
[0043] 处理器;以及
[0044] 存储有机器可读指令的一个或多个机器可读介质,当所述处理器执行所述机器可读指令时,使得所述设备执行前述的数据可视化方法。
[0045] 本申请提供的方案中,在获取输入图像之后,对所述输入图像进行预处理,获取所述输入数据中几何图形和文本的构图信息,然后分别基于几何图形的构图信息和文本的构图信息进行处理,根据所述几何图形的构图信息生成第一图层,以及根据所述文本的构图信息生成第二图层,最后融合第一图层和第二图层,从而快速地实现图像数据可视化重构、还原,生成符合用户期望的可视化设计。附图说明
[0046] 通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
[0047] 图1为本申请实施例提供的一种数据可视化方法的处理流程图
[0048] 图2为本申请实施例中输入图像的示意图;
[0049] 图3为本申请实施例中对输入图像进行网格化处理之后的示意图;
[0050] 图4为本申请实施例中生成第一图层时的处理流程图;
[0051] 图5为本申请实施例中输入图像中的拐点示意图;
[0052] 图6为本申请实施例中识别出的图元识别与拟合的示意图;
[0053] 图7为本申请实施例中未进行融合和规整处理的第一图层的显示效果图;
[0054] 图8为本申请实施例中进行了融合和规整处理的第一图层的显示效果图;
[0055] 图9为本申请实施例提供的一种数据可视化设备的示意图;
[0056] 图10为本申请实施例提供的另一种数据可视化设备的结构示意图;
[0057] 附图中相同或相似的附图标记代表相同或相似的部件。

具体实施方式

[0058] 下面结合附图对本申请作进一步详细描述。
[0059] 在本申请一个典型的配置中,终端、服务网络的设备均包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
[0060] 内存可能包括计算机可读介质中的非永久性存储器随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
[0061] 计算机可读介质包括永久性和非永久性、可移动和非可移动媒体,可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的装置或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。
[0062] 图1示出了本申请实施例提供的一种数据可视化方法,该方法可以对各类图像中的图形元素进行重构,重新生成可视化图像,包括了如下步骤:
[0063] 步骤101,对输入图像进行预处理,以提取到重构所需要的信息。
[0064] 其中,所述输入图像可以是任意形式的获取到的图像数据,例如扫描打印稿、照片、手绘稿等获取到的扫描图像,用户通过手绘板输入的手绘图像,或者从网络上下载或其它用户传输的图像等。
[0065] 预处理的过程主要可以包括:在所述输入图像中识别出所述几何图形和文本图形,并获取所述输入数据中几何图形和文本图形的构图信息。文本图形是指数字、文字的图像,例如输入图像中的阿拉伯数字、字母、汉字或者其它种类的数字或者文字。而所述几何图形是指输入图像中所有除了文本图形之外的其余图形,例如图2中“1”、“2”、“3”、“4”、“2000”、“月”均属于文本图形,而由四条直线构成的矩形则属于几何图形。
[0066] 在实际场景中,可以对所述输入图像进行图形识别,先确定所述输入图像中的文本图形,然后将输入图像中的其余图形确定为几何图形,由此可以分别确定输入图像中几何图形和文本图形。
[0067] 本申请实施例中所述的图形识别的方式,可以是任意能够识别出各类文字或者数字的识别技术,例如OCR(Optical Character Recognition,光学字符识别)技术。由于OCR在识别文字或者数字时,可以采用模版匹配的方式,因此可以预先设定各类文字和数字的模版,若输入图像中的某一图形未匹配成功,则无法完成OCR识别,表示该图形并非文字或数字,因此可以判定该图形属于几何图形。仍以图2为例,在进行OCR识别时,首先识别出1”、“2”、“3”、“4”、“2000”、“月”等几个文本图形,在对四条直线构成的矩形进行识别时,由于无法获得OCR识别结果,则将其作为几何图形。
[0068] 几何图形和文本图形的构图信息是指文本图形和几何图形在所述输入图像中的位置信息,该位置信息可以表示文本图形和几何图形在输入图像中所在的位置,为后续重构图像提供依据。根据实际应用场景的不同,该位置信息可以采用各类数据结构进行记录,例如记录图形中的每个像素点在所述输入图像中的坐标值,基于这些坐标值可以确定每个图形的像素点的实际位置,进而完成图形的重构。在实际场景中,可以将每个像素作为坐标轴上的一个单位,从而使得图形中的每个像素都可以采用一个坐标值进行标定。
[0069] 在本申请的一种实施例中,可以在所述输入图像中识别出所述几何图形和文本图形之前,对所述输入图像进行网格化处理,划分多个网格区域,而此时构图信息中可以进一步与划分出的网格区域关联,使得构图信息中包含文本图形和几何图形的像素点在网格区域中的坐标值。以图2为例,可以对其进行网格化处理,划分为12个网格区域,分别标记为1~12号网格区域,如图3所示。以“1月”的文本图形为例,其位于5号网格区域,由此构图信息中可以包含其属于5号网格区域中的坐标为(XX,YY)。
[0070] 在本申请方案的某些特定应用场景中,例如对手绘的输入图像进行可视化重构时,可以在获取其构图信息之前,对其进行一些优化处理,如去噪、二值化、平滑等处理,使得其提取到的构图信息能够更加精准、更加符合用户的实际需求。
[0071] 步骤S102,根据所述几何图形的构图信息生成第一图层,并根据所述文本图形的构图信息生成第二图层。本申请实施例中将图形分为了两类,即文本图形和几何图形,由于其重构方式不同,因此将其分别构建各自对应的图层,再来进行组合。在本实施例中,第一图层和第二图层分别是指重新构建的几何图形和文本图形所组成图层。
[0072] 在通过所述几何图形的构图信息生成第一图层时,可以采用如图4所示的步骤:
[0073] 步骤S401,笔画构建,基于所述几何图形的构图信息确定所述几何图形对应的笔画信息,笔画信息包含了几何图形上各个点所形成线条上的曲率,通过笔画信息可以标示出几何图形上线条的走向,例如在某一点处的曲率很大时,表示该图形的线条在该点处的弯曲程度越大,若曲率很小,则表示此处的线条接近直线。例如对于图2中的几何图形,其笔画信息中矩形上4个上的点处的曲率较大,而其它位置的曲率为0。
[0074] 步骤S402,笔画分割。根据所述笔画信息进行笔画分割,将所述几何图形分割为至少一个图元。由于任何的几何图形理论上都可以看作是由直线和圆、圆弧、椭圆、椭圆弧等曲线构建而成。因此可以根据笔画信息中曲率所表示弯曲程度对几何图形进行笔画分割,分割成单独的图元,每个图元即为直线或任意形式的一种曲线。
[0075] 在实际场景中,可以引入拐点的概念,即将几何图形中曲率大于预设值的位置确定标定为拐点。由于已经获取到了笔画信息,则可以根据所述笔画信息确定所述几何图形中的拐点,然后以所述拐点为分割点将所述几何图形分割为至少一个图元。例如,图2中的几何图形中,其4个角即为拐点,如图5所示,且由此可以分割为如图6所示的4个图元,即4条直线。
[0076] 步骤S403,线条识别和拟合,由于步骤S402中仅进行了图元的分割,对于每个图元,并未确定其具体是直线或者是哪种形式的曲线,因此需要对所述图元进行直线和/或曲线的识别,以确定所述图元对应的直线和/或曲线,使其接近于输入图像中的几何图形。
[0077] 在进行识别时,首先可以对所有图元逐一进行一次直线识别,判断是否为直线的依据如下:即图元的两个端点距离与图元中点序列的累积弦长的比率是否大于一个给定的阈值
[0078] 图元端点距离计算方法如下:
[0079]
[0080] 点序列的累积弦长的计算方法如下:
[0081]
[0082] 其中{P0,P1,P2…n}是构成所述图元的点序列,(x,y)值对是所述点序列中每一个点的横纵坐标。
[0083] 直线线性化比率R=d/L,R越接近1,则图元越接近直线。
[0084] 对于判定为非直线的图元,则对其进行曲线识别。
[0085] 本申请实施例中进行曲线识别时,所指的曲线包括圆、圆弧、椭圆、椭圆弧,其识别依据基于当前图元的点序列所拟合的二次曲线的一般方程。方程如下:
[0086] Ax2+Bxy+Cy2+Dx+Ey+F=0,其中ABC不全为0
[0087] 取
[0088] I1=+0
[0089]
[0090]
[0091]
[0092] I1、I2、I3是二次曲线的平移变换以及旋转变换下的不变量,K是旋转变换下的不变量,当I1=2=0时,K也是平移变换下的不变量。当 小于接近于0的某个预设值时,将该图元识别为圆或者圆弧,否则为椭圆或者椭圆弧。
[0093] 在识别出直线或者各类曲线之后,进行图元拟合,图元拟合的目的是使得手绘图与识别结果更接近,针对直线有以下拟合模型:
[0094] y=ax+b
[0095] 针对曲线有以下拟合模型:
[0096] y=Ax2+Bxy+Cy2+Dx+Ey+F
[0097] 采用最小中值二乘回归算法进行迭代拟合,假定图元的点序列中有n个点,拟合模型有p个参数,则步骤如下:
[0098] 1、在图元点序列的n个点中,选取m个点(m大于p),要求m个点在点序列中尽量均匀分布;
[0099] 2、用拟合模型逐个拟合m个点;
[0100] 3、计算拟合残差;
[0101] 重复1-3,直到拟合残差小于设定的阈值。
[0102] 此时拟合模型中的参数即可以作为该曲线的二次方程中的参数,由此,确定该曲线。
[0103] 基于上述两种拟合方式,可以确定几何图形中每个图元的所对应直线或曲线。
[0104] 此外,除了上述图元识别、拟合的方式之外,也可以基于神经网络等人工智能方法实现几何图形的重构,例如在通过训练集完成对神经网络的训练之后,将获取到的几何图形输入神经网络,从而可以确定组成第一图层的几何图形,进而生成第一图层。
[0105] 步骤S404,图元排序组合,将图元对应的直线和/或曲线组合,生成所述第一图层。在对几何图形进行分割时,可以为提取的图元排序,例如按照从左至右、从上至下的顺序,来排列图元,在完成识别和拟合之后,同样可以按照此顺序来依次绘制各个图元对应的直线和/或曲线,从而生成第一图层。在绘制各个图元时,可以对其连接处进行融合和规整的处理,使得最终生成的第一图层中的几何图形的显示效果更佳。实际场景中,若在之前的处理过程中确定了各个拐点的信息,由于拐点即为每个图元的连接处,则可以根据拐点的信息进行相应的融合和规整的处理,例如图7为未进行融合和规整处理的第一图层的显示效果图,图8为进行了融合和规整处理的第一图层的显示效果图。
[0106] 在根据所述文本图形的构图信息生成第二图层时,由于文本图形可以采用OCR技术进行识别,能够自动识别出对应的文本或数字,并记录其像素点的所属位置,因此无需再进行识别、拟合等处理,可以直接根据构图信息生成第二图层。
[0107] 步骤S103,根据所述第一图层和所述第二图层,将两个图层进行融合,生成可视化图像,形成完整的可视化方案。最终形成的可视化图像可以根据用户的需求,输出为各种形式的图像文件,例如矢量图、位图等。
[0108] 在实际场景中,为了使得最终的可视化方案更加符合用户的预期,可以对所述可视化图像中图形的视觉效果进行优化调整,例如对进行颜色、大小、布局等方面的调整。
[0109] 基于同一发明构思,本申请实施例中还提供了一种数据可视化设备,所述设备对应的方法是前述实施例中的方法,并且其解决问题的原理与该方法相似。
[0110] 图9示出了本申请实施例提供的一种数据可视化设备,该设备至少包括预处理模块910、图形构建模块920和可视化构建模块930。其中,所述预处理模块910用于在所述输入图像中识别出所述几何图形和文本图形,并获取所述输入数据中几何图形和文本图形的构图信息。所述图形构建模块920用于根据所述几何图形的构图信息生成第一图层,并根据所述文本图形的构图信息生成第二图层。所述可视化构建模块930根据所述第一图层和所述第二图层,生成可视化图像。
[0111] 所述输入图像可以是任意形式的获取到的图像数据,例如扫描打印稿、照片、手绘稿等获取到的扫描图像,用户通过手绘板输入的手绘图像,或者从网络上下载或其它用户传输的图像等。
[0112] 预处理的过程主要可以包括:在所述输入图像中识别出所述几何图形和文本图形,并获取所述输入数据中几何图形和文本图形的构图信息。文本图形是指数字、文字的图像,例如输入图像中的阿拉伯数字、字母、汉字或者其它种类的数字或者文字。而所述几何图形是指输入图像中所有除了文本图形之外的其余图形,例如图2中“1”、“2”、“3”、“4”、“2000”、“月”均属于文本图形,而由四条直线构成的矩形则属于几何图形。
[0113] 在实际场景中,可以对所述输入图像进行图形识别,先确定所述输入图像中的文本图形,然后将输入图像中的其余图形确定为几何图形,由此可以分别确定输入图像中几何图形和文本图形。
[0114] 本申请实施例中所述的图形识别的方式,可以是任意能够识别出各类文字或者数字的识别技术,例如OCR(Optical Character Recognition,光学字符识别)技术。由于OCR在识别文字或者数字时,可以采用模版匹配的方式,因此可以预先设定各类文字和数字的模版,若输入图像中的某一图形未匹配成功,则无法完成OCR识别,表示该图形并非文字或数字,因此可以判定该图形属于几何图形。仍以图2为例,在进行OCR识别时,首先识别出1”、“2”、“3”、“4”、“2000”、“月”等几个文本图形,在对四条直线构成的矩形进行识别时,由于无法获得OCR识别结果,则将其作为几何图形。
[0115] 几何图形和文本图形的构图信息是指文本图形和几何图形在所述输入图像中的位置信息,该位置信息可以表示文本图形和几何图形在输入图像中所在的位置,为后续重构图像提供依据。根据实际应用场景的不同,该位置信息可以采用各类数据结构进行记录,例如记录图形中的每个像素点在所述输入图像中的坐标值,基于这些坐标值可以确定每个图形的像素点的实际位置,进而完成图形的重构。在实际场景中,可以将每个像素作为坐标轴上的一个单位,从而使得图形中的每个像素都可以采用一个坐标值进行标定。
[0116] 在本申请的一种实施例中,所述预处理模块可以在所述输入图像中识别出所述几何图形和文本图形之前,对所述输入图像进行网格化处理,划分多个网格区域,而此时构图信息中可以进一步与划分出的网格区域关联,使得构图信息中包含文本图形和几何图形的像素点在网格区域中的坐标值。以图2为例,可以对其进行网格化处理,划分为12个网格区域,分别标记为1~12号网格区域,如图3所示。以“1月”的文本图形为例,其位于5号网格区域,由此构图信息中可以包含其属于5号网格区域中的坐标为(XX,YY)。
[0117] 在本申请方案的某些特定应用场景中,例如对手绘的输入图像进行可视化重构时,可以在获取其构图信息之前,对其进行一些优化处理,如去噪、二值化、平滑等处理,使得其提取到的构图信息能够更加精准、更加符合用户的实际需求。
[0118] 本申请实施例中将图形分为了两类,即文本图形和几何图形,由于其重构方式不同,因此将其分别构建各自对应的图层,再来进行组合。在本实施例中,第一图层和第二图层分别是指重新构建的几何图形和文本图形所组成图层。
[0119] 图形构建模920在通过所述几何图形的构图信息生成第一图层时,可以采用如图4所示的步骤:
[0120] 步骤S401,笔画构建,基于所述几何图形的构图信息确定所述几何图形对应的笔画信息,笔画信息包含了几何图形上各个点所形成线条上的曲率,通过笔画信息可以标示出几何图形上线条的走向,例如在某一点处的曲率很大时,表示该图形的线条在该点处的弯曲程度越大,若曲率很小,则表示此处的线条接近直线。例如对于图2中的几何图形,其笔画信息中矩形上4个角上的点处的曲率较大,而其它位置的曲率为0。
[0121] 步骤S402,笔画分割。根据所述笔画信息进行笔画分割,将所述几何图形分割为至少一个图元。由于任何的几何图形理论上都可以看作是由直线和圆、圆弧、椭圆、椭圆弧等曲线构建而成。因此可以根据笔画信息中曲率所表示弯曲程度对几何图形进行笔画分割,分割成单独的图元,每个图元即为直线或任意形式的一种曲线。
[0122] 在实际场景中,可以引入拐点的概念,即将几何图形中曲率大于预设值的位置确定标定为拐点。由于已经获取到了笔画信息,则可以根据所述笔画信息确定所述几何图形中的拐点,然后以所述拐点为分割点将所述几何图形分割为至少一个图元。例如,图2中的几何图形中,其4个角即为拐点,如图5所示,且由此可以分割为如图6所示的4个图元,即4条直线。
[0123] 步骤S403,线条识别和拟合,由于步骤S402中仅进行了图元的分割,对于每个图元,并未确定其具体是直线或者是哪种形式的曲线,因此需要对所述图元进行直线和/或曲线的识别,以确定所述图元对应的直线和/或曲线,使其接近于输入图像中的几何图形。
[0124] 图形构建模块在进行识别时,首先可以对所有图元逐一进行一次直线识别,判断是否为直线的依据如下:即图元的两个端点距离与图元中点序列的累积弦长的比率是否大于一个给定的阈值。
[0125] 图元端点距离计算方法如下:
[0126]
[0127] 点序列的累积弦长的计算方法如下:
[0128]
[0129] 其中{P0,P1,P2…Pn}是构成所述图元的点序列,(x,y)值对是所述点序列中每一个点的横纵坐标。
[0130] 直线线性化比率R=d/L,R越接近1,则图元越接近直线。
[0131] 对于判定为非直线的图元,则图形构建模块对其进行曲线识别。
[0132] 本申请实施例中进行曲线识别时,所指的曲线包括圆、圆弧、椭圆、椭圆弧,其识别依据基于当前图元的点序列所拟合的二次曲线的一般方程。方程如下:
[0133] Ax2+Bxy+Cy2+Dx+Ey+F=0,其中ABC不全为0
[0134] 取
[0135] I1=+C
[0136]
[0137]
[0138]
[0139] I1、I2、I3是二次曲线的平移变换以及旋转变换下的不变量,K是旋转变换下的不变量,当I1=2=0时,K也是平移变换下的不变量。当 小于接近于0的某个预设值时,将该图元识别为圆或者圆弧,否则为椭圆或者椭圆弧。
[0140] 图形构建模块在识别出直线或者各类曲线之后,进行图元拟合,图元拟合的目的是使得手绘图与识别结果更接近,针对直线有以下拟合模型:
[0141] y=ax+b
[0142] 针对曲线有以下拟合模型:
[0143] y=Ax2+Bxy+Cy2+Dx+Ey+F
[0144] 采用最小中值二乘回归算法进行迭代拟合,假定图元的点序列中有n个点,拟合模型有p个参数,则步骤如下:
[0145] 1、在图元点序列的n个点中,选取m个点(m大于p),要求m个点在点序列中尽量均匀分布;
[0146] 2、用拟合模型逐个拟合m个点;
[0147] 3、计算拟合残差;
[0148] 重复1-3,直到拟合残差小于设定的阈值。
[0149] 此时拟合模型中的参数即可以作为该曲线的二次方程中的参数,由此,确定该曲线。
[0150] 基于上述两种拟合方式,图形构建模块可以确定几何图形中每个图元的所对应直线或曲线。
[0151] 此外,除了上述图元识别、拟合的方式之外,也可以基于神经网络等人工智能方法实现几何图形的重构,例如在通过训练集完成对神经网络的训练之后,将获取到的几何图形输入神经网络,从而可以确定组成第一图层的几何图形,进而生成第一图层。
[0152] 步骤S404,图元排序组合,图形构建模块将图元对应的直线和/或曲线组合,生成所述第一图层。在对几何图形进行分割时,可以为提取的图元排序,例如按照从左至右、从上至下的顺序,来排列图元,在完成识别和拟合之后,同样可以按照此顺序来依次绘制各个图元对应的直线和/或曲线,从而生成第一图层。在绘制各个图元时,可以对其连接处进行融合和规整的处理,使得最终生成的第一图层中的几何图形的显示效果更佳。实际场景中,若在之前的处理过程中确定了各个拐点的信息,由于拐点即为每个图元的连接处,则可以根据拐点的信息进行相应的融合和规整的处理,例如图7为未进行融合和规整处理的第一图层的显示效果图,图8为进行了融合和规整处理的第一图层的显示效果图。
[0153] 图形构建模块在根据所述文本图形的构图信息生成第二图层时,由于文本图形可以采用OCR技术进行识别,能够自动识别出对应的文本或数字,并记录其像素点的所属位置,因此无需再进行识别、拟合等处理,可以直接根据构图信息生成第二图层。
[0154] 可视化构建模块可以根据所述第一图层和所述第二图层,将两个图层进行融合,生成可视化图像,形成完整的可视化方案。最终形成的可视化图像可以根据用户的需求,输出为各种形式的图像文件,例如矢量图、位图等。
[0155] 在实际场景中,为了使得最终的可视化方案更加符合用户的预期,本申请实施例提供的数据可视化设备中,还可以包含一调节模块940,该调节模块可以对所述可视化图像中图形的视觉效果进行优化调整,例如对进行颜色、大小、布局等方面的调整。
[0156] 综上所述,本申请提供的方案中,在获取输入图像之后,对所述输入图像进行预处理,获取所述输入数据中几何图形和文本的构图信息,然后分别基于几何图形的构图信息和文本的构图信息进行处理,根据所述几何图形的构图信息生成第一图层,以及根据所述文本的构图信息生成第二图层,最后融合第一图层和第二图层,从而快速地实现图像数据可视化重构、还原,生成符合用户期望的可视化设计。
[0157] 另外,本申请的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本申请的方法和/或技术方案。而调用本申请的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据程序指令运行的计算机设备的工作存储器中。在此,根据本申请的一个实施例包括一个如图10所示的设备,该设备包括存储有机器可读指令的一个或多个机器可读介质1010和用于执行机器可读指令的处理器1020,其中,当该机器可读指令被该处理器执行时,使得所述设备执行基于前述根据本申请的多个实施例的方法和/或技术方案。
[0158] 需要注意的是,本申请可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本申请的软件程序可以通过处理器执行以实现上文步骤或功能。同样地,本申请的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本申请的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
[0159] 对于本领域技术人员而言,显然本申请不限于上述示范性实施例的细节,而且在不背离本申请的精神或基本特征的情况下,能够以其他的具体形式实现本申请。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本申请的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本申请内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈