专利汇可以提供后光学字符识别处理中的形状聚类专利检索,专利查询,专利分析的服务。并且用于在包括光学字符识别(OCR)处理的输出的各种文档处理中的应用和形状聚类的技术和系统。,下面是后光学字符识别处理中的形状聚类专利的具体信息内容。
1.一种方法,包括:
将在所接收的由光学字符识别(OCR)处理所处理的文档的OCR 输出中限定的剪切图像归类为剪切图像的多个集群,每个集群包括被 所述OCR处理指派了相同的一个或多个字符码的剪切图像;
处理所述多个集群中的每一个中的剪切图像,以生成每个集群的 集群图像;
比较所述集群图像来检测被所述OCR处理对其错误指派了一个或 多个OCR字符码的集群;
对所述OCR输出中被检测为具有错误指派的一个或多个OCR字符 码的第一集群指派一个或多个新的OCR字符码;以及
在所述OCR输出中每次出现所述第一集群的所述剪切图像中的一 个时使用所述一个或多个新的OCR字符码替代错误指派的OCR字符码 以产生经修改的OCR输出。
2.如权利要求1所述的方法,其中:
每个集群中的剪切图像被所述OCR引擎识别为具有特定形状和 特定剪切图像大小。
3.如权利要求1所述的方法,其中:
每个剪切图像由所接收的OCR输出中的边框所限定,并且
所述集群包括(1)其中每个剪切图像与所接收的OCR输出中的 单个边框相关联的集群和(2)其中每个剪切图像与所接收的OCR输 出中的两个或更多相邻边框相关联的集群。
4.如权利要求1所述的方法,进一步包括:
将所接收的OCR输出中的相连剪切图像归类为形状和大小相同 或相似的相连剪切图像的多个相连集群,每个相连剪切图像是与所接 收的OCR输出中的两个或更多相邻边框相关联的两个或更多剪切图像 的组合;并且
对所述相连集群应用所述集群上的每个处理。
5.如权利要求1所述的方法,其中:
每个集群的集群图像是从相应的集群中的剪切图像的平均来获取 的。
6.如权利要求1所述的方法,其中:
每个集群的集群图像是选自相应的集群中的剪切图像中的一个。
7.如权利要求1所述的方法,进一步包括:
使用每个集群和其它集群之间集群图像的形状差异来检测在OCR 输出中被指派给集群的一个或多个OCR字符码中是否存在错误。
8.如权利要求7所述的方法,进一步包括:
获取集群图像之间的形状量度距离作为两个集群之间的形状差异 的度量。
9.如权利要求8所述的方法,进一步包括:
当第二集群在所有其它集群中具有与第一集群最短的形状量度距 离并且比所述第一集群具有更高的置信分值时,利用指派给所述第二 集群的一个或多个不同的第二OCR字符码替代指派给所述第一集群的 一个或多个第一OCR字符码作为在所述经修改的OCR输出中使用的 为所述第一集群新指派的一个或多个OCR字符码。
10.如权利要求9所述的方法,其中:
基于对对应的剪切图像的人工识别生成所述第二集群的所述一个 或多个第二OCR字符码。
11.如权利要求8所述的方法,进一步包括:
选择到任意的所有其它集群的形状量度距离大于阈值形状量度距 离的集群进行进一步处理,以验证当前指派给所选择集群的一个或多 个OCR字符码。
12.如权利要求11所述的方法,进一步包括:
请求对所选择集群的集群图像的人工识别;并且
使用所述人工识别来验证指派给所选择的集群的所述一个或多个 OCR字符码,或者生成新的一个或多个OCR字符码来替代指派给所选 择的集群的所述一个或多个OCR字符码。
13.如权利要求9所述的方法,其中:
所述第二集群具有比所述第一集群更大数目的剪切图像。
14.如权利要求1所述的方法,其中:
比较所述集群图像来检测对其错误指派了一个或多个OCR字符 码的集群,包括:
确定被指派了相同的一个或多个字符码的每个集群和每个所有其 它集群的集群图像之间的形状量度距离作为相应的集群之间的距离; 并且
如果第二集群比被指派了与第一集群相同的一个或多个字符码的 其它集群更接近第一集群并且如果所述第二集群被指派了与指派给所 述第一集群的一个或多个字符码不同的一个或多个字符码并且如果所 述第二集群具有比所述第一集群更高的置信等级,则检测所述第一集 群具有被错误指派的一个或多个OCR字符码。
15.如权利要求1所述的方法,进一步包括:
对每个剪切图像使用所述文档的所述原始图像中的灰度信息或色 彩信息来获取每个集群图像。
16.如权利要求15所述的方法,进一步包括:
使用所述文档的所述原始图像中的灰度信息或色彩信息获取不同 集群之间的形状距离;并且
使用所述形状距离来比较所述集群图像。
17.如权利要求1所述的方法,进一步包括:
获取每个剪切图像的质心;
相对于所获取的不同剪切图像的质心将集群内的所述不同剪切图 像对齐;并且
获取所述集群的所对齐的剪切图像的平均图像以生成所述集群的 集群图像。
18.如权利要求17所述的方法,其中:
所述OCR输出包括用于识别由所述OCR引擎产生的每个剪切图 像的边框,并且
通过由相应的边框所限定的图像区域的质心获取每个剪切图像的 质心。
19.如权利要求17所述的方法,进一步包括:
使用所述文档的所述原始图像中的每个剪切图像的灰度信息或色 彩信息来获取每个剪切图像的质心。
20.如权利要求17所述的方法,进一步包括:
使用所述文档的所述OCR输出中的每个剪切图像的图像信息来 获取每个剪切图像的质心。
21.如权利要求20所述的方法,其中:
所述文档的所述OCR输出中的每个剪切图像的图像信息是二进 制图像信息。
22.如权利要求1所述的方法,进一步包括:
选择剪切图像的数目小于阈值数目的集群进行进一步处理,以验 证当前指派给所选择集群的一个或多个对应的OCR字符码。
23.如权利要求22所述的方法,进一步包括:
请求来自个人的对所选择集群的所述集群图像的人工识别;并且
使用所述个人所进行的所述人工识别来验证指派给所选择集群的 所述一个或多个OCR字符码或者生成一个或多个新的OCR字符码来 替代指派给所选择集群的所述一个或多个OCR字符码。
24.如权利要求1所述的方法,进一步包括:
选择集群的集群图像以请求来自个人的人工识别;并且
使用所述个人所进行的所述人工识别来验证或校正指派给所选择 集群的一个或多个OCR字符码。
25.如权利要求1所述的方法,进一步包括:
将所选择集群的集群图像导引到在线服务器,所述在线服务器可 操作来将所述集群图像导引到一个或多个用户以便进行对所述集群图 像的人工识别;并且
使用从所述在线服务器返回的对所述集群图像的人工识别来验证 指派给所选择集群的一个或多个OCR字符码或者对所选择的集群指派 一个或多个新的OCR字符码。
26.如权利要求25所述的方法,进一步包括:
使用所述在线服务器所提供的在线游戏,以将所选择集群的所述 集群图像提供给所述一个或多个用户以便进行作为所述在线游戏一部 分的用户响应。
27.如权利要求25所述的方法,进一步包括:
使用所述在线服务器所提供的在线服务来提供所选择集群的所述 集群图像作为挑战-响应测试的一部分。
28.如权利要求27所述的方法,其中:
所述挑战-响应测试用于确定所述在线服务的用户是否为人类。
29.如权利要求1所述的方法,进一步包括:
选择包括高置信分值的集群的集群图像作为集群图像模板;
将所述集群图像模板沿预定方向与所接收的OCR输出中词的图 像内的多个不同部分对齐,每次一个部分;
分别获取所述集群图像模板和所述词图像的多个不同部分之间的 形状量度距离;
使用所获取的形状量度距离来确定所述词图像的一部分是否与所 述集群图像模板相匹配;
将所述词图像与所述集群图像模板相匹配的匹配部分与所述词图 像的一个或多个其它部分分离;并且
在所述经修改的OCR输出中将指派给所述集群的一个或多个 OCR字符码指派给所述词图像被分离的匹配部分。
30.如权利要求1所述的方法,进一步包括:
选择第一集群的第一集群图像作为集群图像模板;
将所述集群图像模板沿预定方向与所选择的第二集群的第二集群 图像内的多个不同部分对齐,每次一个部分;
分别获取所述集群图像模板和所述第二集群图像的所述多个不同 部分之间的形状量度距离;
使用所获取的形状量度距离来确定所述第二集群图像的一部分是 否与所述集群图像模板相匹配;
使用所述第二集群图像的与所述集群图像模板相匹配的匹配部分 作为要形成的第三集群的新的第三集群图像;
将所述第二集群中的每个剪切图像中与所述集群图像模板相对应 的对应部分分离以形成新的剪切图像;
使用分别从所述第二集群中的剪切图像分离出的新的剪切图像来 形成所述第三集群;
将指派给所述第一集群的一个或多个OCR字符码指派给所述第 三集群;
使用所述第二集群在所述第三集群的新剪切图像的分离之后剩余 的剪切图像来形成至少一个第四集群;并且
在产生所述经修改的OCR输出中使用所述第三集群和所述至少 一个第四集群来替代所述第二集群。
31.如权利要求30所述的方法,其中:
所述第二集群是连字的图像,所述连字表示在所述文档中使用的 一种或多种语言的至少两个语言标记。
32.如权利要求30所述的方法,进一步包括:
获取所述第四集群的集群图像和其它集群的集群图像之间的形状 量度距离;并且
将指派给第五集群的一个或多个OCR字符码指派给所述第四集 群,所述第五集群在所有其它集群中具有到所述第四集群最短的形状 量度距离。
33.如权利要求30所述的方法,进一步包括:
请求来自个人的对所述第四集群的所述集群图像的人工识别;并 且
使用所述个人所进行的所述人工识别来生成所述第四集群的一个 或多个新的OCR字符码。
34.如权利要求1所述的方法,其中:
OCR字符码是表示在所述文档中使用的字符的计算机代码。
35.如权利要求34所述的方法,其中:
所述字符包括字母、数字和符号或标记中的一个,所述符号或标 记包括标点符号、排字标记和变音符中的一个。
36.如权利要求1所述的方法,进一步包括:
使用每个集群中的图像的数目以及每个集群相对于其它集群的形 状量度距离来将所述多个集群归类为可接受集群和可疑集群,其中对 每个可接受集群所指派的一个或多个特定字符被用在所述经修改的输 出中而不进行进一步处理,并且对每个可疑集群指派的一个或多个特 定字符被标记为要进行进一步处理;
当可接受集群具有到可疑集群最短的形状量度距离并且具有比所 述可疑集群更大数目的图像时,利用对所述可接受集群指派的一个或 多个特定字符替代对所述可疑集群指派的一个或多个特定字符作为对 所述可疑集群新指派的经校正的一个或多个特定字符;并且
使用对所述可疑集群新指派的经校正的一个或多个特定字符来表 示其中出现所述可疑集群内的图像的所述文档的经修改输出中的每个 实例。
37.如权利要求1所述的方法,进一步包括:
使用每个集群中的图像的数目以及每个集群相对于其它集群的形 状量度距离来将所述多个集群归类为可接受集群和可疑集群,其中对 每个可接受集群所指派的一个或多个特定字符被用在所述经修改的输 出中而不进行进一步处理,并且对每个可疑集群指派的一个或多个特 定字符被标记为要进行进一步处理;
选择可疑集群的集群图像由个人进行人工识别;
使用所述个人对所选择的可疑集群所返回的一个或多个人工生成 的字符来验证或替代先前对所选择的可疑集群指派的一个或多个特定 字符;并且
将被指派了所述一个或多个人工生成的字符的所选择的可疑集群 重新归类为可接受集群。
38.如权利要求1所述的方法,进一步包括:
使用每个集群中的图像的数目以及每个集群相对于其它集群的形 状量度距离来将所述多个集群归类为可接受集群和可疑集群,其中对 每个可接受集群所指派的一个或多个特定字符被用在所述经修改的输 出中而不进行进一步处理,并且对每个可疑集群指派的一个或多个特 定字符被标记为要进行进一步处理;
将所选择的可疑集群的集群图像导引到在线服务器,所述在线服 务器可操作来将平均图像导引到与所述在线服务器进行交互的一个或 多个用户并且请求来自所述一个或多个用户的对所述平均图像的一个 或多个人工生成的字符;
使用从所述在线服务器返回的一个或多个人工生成的字符来验证 或替代先前对所选择的可疑集群指派的一个或多个特定字符;并且
将被指派了所述一个或多个人工生成的字符的所选择的可疑集群 重新归类为可接受集群。
39.如权利要求38所述的方法,其中:
所述在线服务器可操作来提供在线游戏,所述在线游戏将所选择 的可疑集群的平均图像提供给所述一个或多个用户以便进行作为所述 在线游戏一部分的用户响应。
40.如权利要求38所述的方法,其中:
所述在线服务器可操作来提供在线服务并且提供所选择的可疑集 群的平均图像作为挑战-响应测试的一部分,以确定所述在线服务的用 户是否为人类。
41.如权利要求1所述的方法,进一步包括:
使用每个集群中的图像的数目以及每个集群相对于其它集群的形 状量度距离来将所述多个集群归类为可接受集群和可疑集群,其中对 每个可接受集群所指派的一个或多个特定字符被用在所述经修改的输 出中而不进行进一步处理,并且对每个可疑集群指派的一个或多个特 定字符被标记为要进行进一步处理;
选择至少一个可接受集群以使用所选择的可接受集群的对应的集 群图像作为集群图像模板;
将所述集群图像模板沿预定方向在多个不同位置与所选择的可疑 集群的集群图像的多个不同位置对齐;
获取所述集群图像模板和所选择的可疑集群的所述集群图像的所 述多个不同部分中的每一个之间的形状量度距离;
使用所获取的集群图像模板的形状量度距离来确定所选择的可疑 集群的集群图像的一部分是否与所述集群图像模板相匹配;并且
将相匹配的部分与所选择的可疑集群的所述集群图像分离作为被 指派了所选择的可接受集群的所述一个或多个字符的新的可接受集 群。
42.一种编码在计算机可读介质上的计算机程序产品,可操作来 使得数据处理装置执行操作,所述操作包括:
将在所接收的由光学字符识别(OCR)处理所处理的文档的OCR 输出中限定的剪切图像归类为剪切图像的多个集群,每个集群包括被 所述OCR处理指派了相同的一个或多个字符码的剪切图像;
处理所述多个集群中的每一个中的剪切图像,以生成每个集群的 集群图像;
比较所述集群图像来检测被所述OCR处理对其错误指派了一个或 多个OCR字符码的集群;
对所述OCR输出中被检测为具有错误指派的一个或多个OCR字符 码的第一集群指派一个或多个新的OCR字符码;以及
在所述OCR输出中每次出现所述第一集群的所述剪切图像中的一 个时使用所述一个或多个新的OCR字符码替代错误指派的OCR字符码 以产生经修改的OCR输出。
43.一种用于光学字符识别(OCR)的系统,包括:
OCR引擎,可操作来处理文档的原始图像来产生包括从所述原始 图像提取的剪切图像的OCR输出并且向每个剪切图像指派一个或多个 字符;和
后OCR引擎,可操作来将所述OCR输出的剪切图像归类为剪切 图像的多个集群,每个集群包括被所述OCR引擎指派了相同的一个或 多个字符码的剪切图像;
其中所述后OCR引擎可操作来对所述多个集群中的每一个中的 剪切图像进行处理来生成每个集群的集群图像,将所述集群图像进行 比较来检测被所述OCR引擎错误指派了一个或多个OCR字符码的集 群,对OCR输出中被检测为具有错误指派的一个或多个OCR字符码 的第一集群指派一个或多个新的OCR字符码,并且在所述OCR输出 中每次出现所述第一集群的所述剪切图像中的一个时使用所述一个或 多个新的OCR字符码替代错误指派的OCR字符码以产生经修改的 OCR输出。
44.如权利要求43所述的系统,进一步包括:
包括所述OCR引擎和所述后OCR引擎的一个或多个服务器计算 机;和
所述一个或多个计算机服务器与其进行通信的通信网络,所述通 信网络可操作来将所述文档的所述原始图像从客户端计算机导引到所 述OCR引擎并且将所述经修改的OCR输出从所述后OCR引擎导引到 所述客户端计算机。
45.如权利要求44所述的系统,其中:
所述OCR引擎和所述后OCR引擎是在不同的服务器计算机上。
46.如权利要求43所述的系统,进一步包括:
包括所述OCR引擎和所述后OCR引擎的一个或多个服务器计算 机;
所述一个或多个计算机服务器与其进行通信的通信网络;和
与所述通信网络进行通信并且存储由所述OCR引擎和所述后 OCR引擎产生的所选择文档的图像的经修改的OCR输出的一个或多个 OCR存储服务器计算机,
其中所述通信网络提供在客户端计算机和所述一个或多个OCR 存储服务器计算机之间的通信以允许所述客户端计算机从所述一个或 多个OCR存储服务器计算机获取由所述OCR引擎和所述后OCR引擎 所产生的现有的经修改的OCR输出。
47.一种用于后光学字符识别(OCR)处理的方法,包括:
将在所接收的由光学字符识别(OCR)处理所处理的文档的OCR 输出中限定的剪切图像归类为剪切图像的多个集群,每个集群包括大 小相同或相似并且被所述OCR处理指派了相同的一个或多个字符码的 剪切图像;
处理所述多个集群中的每一个中的剪切图像以生成每个集群的集 群图像;
对于被指派了一个或多个第一OCR字符码的第一集群,识别: (1)被指派了与所述一个或多个第一OCR字符码不同的一个或多个 第二OCR字符码的第二集群,其中所述第二集群的所述集群图像在形 状上比被指派了与所述一个或多个第一OCR字符码不同的一个或多个 OCR字符的其它集群的集群图像更接近所述第一集群的集群图像,和 (2)被指派了与所述第一集群相同的一个或多个第一OCR字符码的 第三集群,其中所述第三集群的所述集群图像在形状上比被指派了所 述一个或多个第一OCR字符码的其它集群的集群图像更接近所述第一 集群的所述集群图像;并且
至少使用所述第一集群和所述第二集群的集群图像之间的形状差 异以及所述第一集群和所述第三集群的集群图像之间的形状差异来确 定指派给所述第一集群的所述一个或多个第一OCR字符码的置信等 级。
48.如权利要求47所述的方法,其中:
每个剪切图像由所接收的OCR输出中的边框来限定,并且
所述集群包括(1)其中每个剪切图像与所接收的OCR输出中的 单个边框相关联的集群和(2)其中每个剪切图像与所接收的OCR输 出中的两个或更多相邻边框相关联的集群。
49.如权利要求47所述的方法,其中:
每个集群中的剪切图像被所述OCR引擎识别为具有特定形状和 特定剪切图像大小。
50.如权利要求39所述的方法,其中:
每个剪切图像由所接收的OCR输出中的边框来限定。
51.如权利要求47所述的方法,其中:
每个集群的集群图像是从相应的集群中的图像的平均来获取的。
52.如权利要求47所述的方法,其中:
每个集群的集群图像选自相应的集群中的所述集群图像中的一 个。
53.如权利要求47所述的方法,进一步包括:
当从所述第一集群到所述第二集群的形状量度距离比从所述第一 集群到所述第三集群的形状量度距离短并且所述第二集群比所述第一 集群具有更大数目的图像时,利用指派给所述第二集群的一个或多个 不同的第二OCR字符码替代指派给所述第一集群的所述一个或多个第 一OCR字符码作为对所述第一集群新指派的一个或多个OCR字符码。
54.如权利要求53所述的方法,其中:
在从所述第一集群到所述第二集群的形状量度距离比从所述第一 集群到所述第三集群的形状量度距离长时保持指派给所述第一集群的 所述一个或多个第一OCR字符码。
55.如权利要求53所述的方法,进一步包括:
选择到所有其它集群中任意一个的形状量度距离大于阈值形状量 度距离的集群进行进一步处理,以验证当前指派给所选择的集群的一 个或多个OCR字符码。
56.如权利要求55所述的方法,进一步包括:
请求对所选择集群的所述集群图像的人工识别;并且
使用所述人工识别来验证指派给所选择的集群的所述一个或多个 OCR字符码,或者生成新的一个或多个OCR字符码来替代指派给所选 择的集群的所述一个或多个OCR字符码。
57.如权利要求53所述的方法,进一步包括:
选择剪切图像的数目小于阈值数目的集群进行进一步处理,以验 证当前指派给所选择的集群的一个或多个OCR字符码。
58.如权利要求57所述的方法,进一步包括:
请求来自个人的对所选择集群的所述集群图像所进行的人工识 别;并且
使用由所述个人进行的所述人工识别来验证指派给所选择的集群 的所述一个或多个OCR字符码,或者生成一个或多个新的OCR字符 码来替代指派给所选择的集群的所述一个或多个OCR字符码。
59.如权利要求47所述的方法,进一步包括:
对每个剪切图像使用所述文档的所述原始图像中的灰度信息或色 彩信息来获取每个集群图像。
60.如权利要求47所述的方法,进一步包括:
获取每个剪切图像的质心;
相对于所获取的不同剪切图像的质心将集群内的所述不同剪切图 像对齐;并且
获取所述集群的所对齐的剪切图像的平均图像以生成所述集群的 集群图像。
61.如权利要求60所述的方法,其中:
所述OCR输出包括用于识别由所述OCR引擎所产生的每个剪切 图像的边框,并且
通过相应的边框所限定的图像区域的质心获取每个剪切图像的质 心。
62.如权利要求60所述的方法,进一步包括:
使用所述文档的所述原始图像中的每个剪切图像的灰度信息或色 彩信息来获取每个剪切图像的质心。
63.如权利要求60所述的方法,进一步包括:
使用所述文档的所述OCR输出中的每个剪切图像的图像信息来 获取每个剪切图像的质心。
64.如权利要求63所述的方法,其中:
所述文档的所述OCR输出中的每个剪切图像的图像信息是二进 制图像信息。
65.如权利要求47所述的方法,进一步包括:
选择集群的集群图像以请求来自个人的人工识别;并且
使用所述个人所进行的所述人工识别来验证或校正指派给所选择 集群的一个或多个OCR字符码。
66.如权利要求65所述的方法,进一步包括:
将所选择集群的集群图像导引到在线服务器,所述在线服务器可 操作来将所述集群图像导引到一个或多个用户以便进行对所述集群图 像的人工识别;并且
使用从所述在线服务器返回的对所述集群图像的人工识别来验证 指派给所选择集群的一个或多个OCR字符码或者对所选择的集群指派 一个或多个新的OCR字符码。
67.如权利要求66所述的方法,进一步包括:
使用所述在线服务器所提供的在线游戏将所选择集群的所述集群 图像提供给所述一个或多个用户以便进行作为所述在线游戏一部分的 用户响应。
68.如权利要求66所述的方法,进一步包括:
使用所述在线服务器所提供的在线服务提供所选择集群的所述集 群图像作为挑战-响应测试的一部分。
69.如权利要求68所述的方法,其中:
所述挑战-响应测试用于确定所述在线服务的用户是否为人类。
70.如权利要求47所述的方法,进一步包括:
选择具有高置信分值的集群的集群图像作为集群图像模板;
将所述集群图像模板沿预定方向与所接收的OCR输出中词的图 像内的多个不同部分对齐,每次一个部分;
分别获取所述集群图像模板和所述词图像的所述多个不同部分之 间的形状量度距离;
使用所获取的形状量度距离来确定所述词图像的一部分是否与所 述集群图像模板相匹配;
将所述词图像与所述集群图像模板相匹配的匹配部分与所述词图 像的一个或多个其它部分分离;并且
将指派给所述集群的一个或多个OCR字符码指派给所述词图像 被分离的匹配部分。
71.如权利要求47所述的方法,进一步包括:
选择第一集群的第一集群图像作为集群图像模板;
将所述集群图像模板沿预定方向与所选择的第二集群的第二集群 图像内的多个不同部分对齐,每次一个部分;
分别使用所述集群图像模板和所述第二集群图像的所述多个不同 部分之间的形状量度距离来搜索匹配;并且
使用匹配部分将所述第二集群图像分割为两个或更多集群图像。
72.一种编码在计算机可读介质上的计算机程序产品,可操作来 使得数据处理装置执行操作,所述操作包括:
将在所接收的由光学字符识别(OCR)处理所处理的文档的OCR 输出中限定的剪切图像归类为剪切图像的多个集群,每个集群包括大 小相同或相似并且被所述OCR处理指派了相同的一个或多个字符码的 剪切图像;
处理所述多个集群中的每一个中的剪切图像以生成每个集群的集 群图像;
对于被指派了一个或多个第一OCR字符码的第一集群,识别: (1)被指派了与所述一个或多个第一OCR字符码不同的一个或多个 第二OCR字符码的第二集群,其中所述第二集群的所述集群图像在形 状上比被指派了与所述一个或多个第一OCR字符码不同的一个或多个 OCR字符的其它集群的集群图像更接近所述第一集群的集群图像,和 (2)被指派了与所述第一集群相同的一个或多个第一OCR字符码的 第三集群,其中所述第三集群的所述集群图像在形状上比被指派了所 述一个或多个第一OCR字符码的其它集群的集群图像更接近所述第一 集群的所述集群图像;并且
至少使用所述第一集群和所述第二集群的集群图像之间的形状差 异以及所述第一集群和所述第三集群的集群图像之间的形状差异来确 定指派给所述第一集群的所述一个或多个第一OCR字符码的置信等 级。
73.一种用于光学字符识别(OCR)的系统,包括:
OCR引擎,可操作来处理文档的原始图像来产生包括从所述原始 图像提取的剪切图像的OCR输出并且向每个剪切图像指派一个或多个 字符;和
后OCR引擎,可操作来将所述OCR输出中的剪切图像归类为剪切 图像的多个集群,每个集群包括大小相同或相似并且被所述OCR引擎 指派了相同的一个或多个字符码的剪切图像;
其中所述后OCR引擎可操作来对所述多个集群中的每一个中的剪 切图像进行处理来生成每个集群的集群图像;
其中所述后OCR引擎可操作来对于被指派了一个或多个第一OCR 字符码的第一集群识别(1)被指派了与所述一个或多个第一OCR字符 码不同的一个或多个第二OCR字符码的第二集群,其中所述第二集群 的集群图像在形状上比被指派了与所述一个或多个第一OCR字符码不 同的一个或多个OCR字符的其它集群的图像更接近所述第一集群的所 述集群图像,和(2)被指派了与所述第一集群相同的一个或多个第一 OCR字符码的第三集群,其中所述第三集群的集群图像在形状上比被 指派了所述一个或多个第一OCR字符码的其它集群的集群图像更接近 所述第一集群的所述集群图像;并且
其中所述后OCR引擎可操作来至少使用所述第一集群和所述第二 集群的集群图像之间的形状差异以及所述第一集群和所述第三集群的 集群图像之间的形状差异来确定指派给所述第一集群的所述一个或多 个第一OCR字符码的置信等级。
74.如权利要求73所述的系统,进一步包括:
包括所述OCR引擎和所述后OCR引擎的一个或多个服务器计算 机;和
所述一个或多个计算机服务器与其进行通信的通信网络,所述通 信网络可操作来将所述文档的所述原始图像从客户端计算机导引到所 述OCR引擎。
75.如权利要求74所述的系统,其中:
所述OCR引擎和所述后OCR引擎是在不同的服务器计算机上。
76.如权利要求73所述的系统,进一步包括:
包括所述OCR引擎和所述后OCR引擎的一个或多个服务器计算 机;
所述一个或多个计算机服务器与其进行通信的通信网络;和
与所述通信网络进行通信并且存储由所述OCR引擎和所述后 OCR引擎产生的所选择文档的图像的经修改的OCR输出的一个或多个 OCR存储服务器计算机,
其中所述通信网络提供在客户端计算机和所述一个或多个OCR 存储服务器计算机之间的通信以允许所述客户端计算机从所述一个或 多个OCR存储服务器计算机获取由所述OCR引擎和所述后OCR引擎 所产生的现有的经修改OCR输出。
77.一种用于光学字符识别(OCR)的系统,包括:
集群生成引擎,可操作来接收包括OCR引擎在处理文档的原始图 像中所产生的分离图像以及由所述OCR引擎向每个分离图像指派的一 个或多个字符,所述集群生成引擎可操作来将所述OCR输出中的分离 图像归类为具有特定图像大小并且被所述OCR引擎指派了相同的一个 和多个OCR字符码的分离图像的多个集群;和
集群处理引擎,可操作来获取一个集群的集群图像和其它集群的 集群图像之间的形状量度距离并且基于所获取的形状量度距离来检测 在所述OCR引擎指派给每个集群的一个或多个OCR字符码的指派中是 否存在错误,所述集群处理引擎可进一步操作来校正对集群错误指派 的一个或多个OCR字符码。
78.如权利要求77所述的系统,其中:
每个分离图像由所接收的OCR输出中的边框来限定,并且
所述集群包括(1)其中每个分离图像与所接收的OCR输出中的 单个边框相关联的集群和(2)其中每个分离图像与所接收的OCR输 出中的两个或更多相邻边框相关联的集群。
79.如权利要求77所述的系统,其中:
所述集群处理引擎可进一步操作来当第二集群在所有其它集群中 具有到第一集群最短的形状量度距离并且具有比所述第一集群更高的 置信等级时利用指派给所述第二集群的一个或多个第二OCR字符码替 代指派给所述第一集群的一个或多个第一OCR字符码作为所述第一集 群的新的一个或多个OCR字符码。
80.如权利要求79所述的系统,其中:
指派给所述第二集群的所述一个或多个第二OCR字符码由个人 人工生成。
81.如权利要求79所述的系统,其中:
所述第二集群具有大于所述第一集群的图像数目。
82.如权利要求79所述的系统,其中:
所述集群处理引擎可进一步操作来在获取每个集群图像中应用所 述文档中的所述原始图像的灰度或色彩信息。
83.如权利要求82所述的系统,其中:
所述集群图像是每个集群中的剪切图像的平均图像。
84.如权利要求82所述的系统,其中:
所述集群图像是每个集群中的集群图像中的一个。
85.如权利要求77所述的系统,其中:
所述集群处理引擎可进一步操作来:
将所选择集群的集群图像导引到在线服务器,所述在线服务器可 操作来将所述集群图像导引到一个或多个用户以便进行对所述集群图 像的人工识别;并且
使用从所述在线服务器返回的对所述集群图像的人工识别来验证 指派给所选择集群的一个或多个OCR字符码或者对所选择的集群指派 一个或多个新的OCR字符码。
86.如权利要求77所述的系统,进一步包括:
输出处理引擎,可操作来从所接收的OCR输出产生经修改的OCR 输出,其中所述输出处理引擎在产生所述经修改的OCR输出中将由所 述集群处理引擎所处理的每个集群的一个或多个字符指派给属于所述 集群的每个剪切图像。
87.如权利要求86所述的系统,其中:
所述输出处理引擎可操作来:
选择具有高置信分值的集群的集群图像作为集群图像模板;
将所述集群图像模板沿预定方向与所接收的OCR输出中词的图 像内的多个不同部分对齐,每次一个部分;
分别获取所述集群图像模板和所述词图像的所述多个不同部分之 间的形状量度距离;
使用所获取的形状量度距离来确定所述词图像的一部分是否与所 述集群图像模板相匹配;
将所述词图像与所述集群图像模板相匹配的匹配部分与所述词图 像的一个或多个其它部分分离;并且
在经修改的OCR输出中将指派给所述集群的一个或多个OCR字 符码指派给所述词图像被分离的匹配部分。
88.如权利要求77所述的系统,其中:
所述集群处理引擎可进一步操作来:
选择具有高置信分值的集群以使用所选择集群的对应的平均图像 作为集群图像模板;
将所述集群图像模板沿预定方向在多个不同位置与低置信分值的 第二所选择集群的平均图像的多个不同部分对齐;
获取所述集群图像模板和所述第二所选择集群的所述平均图像的 所述多个不同部分的每一个之间的形状量度距离;
使用所获取的所述集群图像模板的形状量度距离来确定所述第二 所选择集群的所述平均图像的一部分是否与所述集群图像模板相匹 配;
将来自所述第二所选择集群的所述平均图像的匹配部分分离为新 的集群;并且
向所述新的集群指派已经被指派给所述所选择集群的一个或多个 OCR字符码。
89.如权利要求77所述的系统,进一步包括:
包括所述OCR引擎、所述集群生成引擎和所述集群处理引擎的一 个或多个服务器计算机;和
所述一个或多个计算机服务器与其进行通信的通信网络,所述通 信网络可操作来将所述文档的所述原始图像从客户端计算机导引到所 述OCR引擎并且将所述文档的所述原始图像的所述经修改的OCR输 出从所述一个或多个服务器计算机导引到所述客户端计算机。
90.如权利要求89所述的系统,其中:
所述集群生成引擎和所述集群处理引擎被置于与提供所述OCR 引擎的计算机服务器分离的计算机服务器上。
91.如权利要求77所述的系统,进一步包括:
包括所述OCR引擎、所述集群生成引擎和所述集群处理引擎的一 个或多个OCR计算机服务器;
所述一个或多个OCR计算机服务器与其进行通信的通信网络,所 述通信网络可操作来将所述文档的所述原始图像从客户端计算机导引 到所述OCR引擎并且将所述文档的所述原始图像的经修改的OCR输 出从所述一个或多个OCR计算机服务器导引到所述客户端计算机;和
与所述通信网络进行通信并且可操作来将所选择的集群图像导引 到一个或多个用户以便进行对所选择集群图像的人工识别的计算机服 务器,
其中所述集群处理引擎可操作来:
将所选择集群的集群图像导向到计算机服务器;并且
使用从所述计算机服务器返回的对所述集群图像的人工识别来验 证或校正由所述OCR引擎指派给所选择集群的一个或多个OCR字符 码。
92.如权利要求77所述的系统,进一步包括:
包括所述OCR引擎、所述集群生成引擎和所述集群处理引擎的一 个或多个服务器计算机;
所述一个或多个计算机服务器与其进行通信的通信网络;和
与所述通信网络进行通信并且存储所述OCR引擎、所述集群生成 引擎和所述集群处理引擎所产生的所选择文档的图像的经修改的OCR 输出的一个或多个OCR存储服务器计算机,
其中所述通信网络提供在客户端计算机和所述一个或多个OCR 存储服务器计算机之间的通信以允许所述客户端计算机从所述一个或 多个OCR存储服务器计算机获取由所述OCR引擎和所述后OCR引擎 所产生的现有的经修改的OCR输出。
93.一种用于光学字符识别(OCR)的方法,包括:
接收包括由OCR引擎在处理文档的原始图像中所产生的分离图像 的OCR输出以及由所述OCR引擎指派给每个分离图像的一个或多个字 符;
将所述OCR输出中的所述分离图像归类为具有特定图像大小并且 被所述OCR引擎指派了相同的一个和多个OCR字符码的分离图像的多 个集群;
获取一个集群的集群图像和其它集群的集群图像之间的形状量度 距离并且基于所获取的形状量度距离来检测在所述OCR引擎指派给每 个集群的一个或多个OCR字符码的指派中是否存在错误;并且
校正对集群错误指派的一个或多个OCR字符码。
94.如权利要求93所述的方法,其中:
每个分离图像由所述OCR输出中的边框来限定,并且
所述集群包括(1)其中每个分离图像与所接收的OCR输出中的 单个边框相关联的集群和(2)其中每个分离图像与所述OCR输出中 的两个或更多相邻边框相关联的集群。
95.如权利要求93所述的方法,进一步包括:
当第二集群在所有其它集群中具有到第一集群最短的形状量度距 离并且具有比所述第一集群更高的置信等级时利用指派给所述第二集 群的一个或多个第二OCR字符码替代指派给所述第一集群的一个或多 个第一OCR字符码作为所述第一集群的一个或多个新的OCR字符码。
96.如权利要求95所述的方法,其中:
指派给所述第二集群的所述一个或多个第二OCR字符码由个人 人工生成。
97.如权利要求95所述的方法,其中:
所述第二集群具有大于所述第一集群的图像数目。
98.如权利要求95所述的方法,进一步包括:
在获取每个集群图像中应用所述文档中的所述原始图像中的灰度 或色彩信息。
99.如权利要求98所述的方法,其中:
所述集群图像是每个集群中的剪切图像的平均图像。
100.如权利要求98所述的方法,其中:
所述集群图像是每个集群中的集群图像中的一个。
101.如权利要求95所述的方法,进一步包括:
将所选择集群的集群图像导引到在线服务器,所述在线服务器可 操作来将所述集群图像导引到一个或多个用户以便进行对所述集群图 像的人工识别;并且
使用从所述在线服务器返回的对所述集群图像的人工识别来验证 指派给所选择集群的一个或多个OCR字符码或者对所选择的集群指派 一个或多个新的OCR字符码。
102.如权利要求93所述的方法,进一步包括:
选择具有高置信分值的集群的集群图像作为集群图像模板;
将所述集群图像模板沿预定方向与所述OCR输出中词的图像内 的多个不同部分对齐,每次一个部分;
分别获取所述集群图像模板和所述词图像的所述多个不同部分之 间的形状量度距离;
使用所获取的形状量度距离来确定所述词图像的一部分是否与所 述集群图像模板相匹配;
将所述词图像与所述集群图像模板相匹配的匹配部分与所述词图 像的一个或多个其它部分分离;并且
在所述经修改的OCR输出中将指派给所述集群的一个或多个 OCR字符码指派给所述词图像被分离的匹配部分。
103.如权利要求93所述的方法,进一步包括:
选择具有高置信分值的集群以使用所选择集群的对应的平均图像 作为集群图像模板;
将所述集群图像模板沿预定方向在多个不同位置与低置信分值的 第二所选择集群的平均图像的多个不同部分对齐;
获取所述集群图像模板和所述第二所选择集群的所述平均图像的 所述多个不同部分的每一个之间的形状量度距离;
使用所获取的所述集群图像模板的形状量度距离来确定所述第二 所选择集群的所述平均图像的一部分是否与所述集群图像模板相匹 配;
将来自所述第二所选择集群的所述平均图像的匹配部分分离为新 的集群;并且
向所述新的集群指派已经被指派给所述所选择集群的一个或多个 OCR字符码。
104.一种编码在计算机可读介质上的计算机程序产品,可操作来 使得数据处理装置执行操作,所述操作包括:
接收包括由光学字符识别(OCR)处理在处理文档的原始图像中 所产生的分离图像的OCR输出以及由所述OCR处理指派给每个分离图 像的一个或多个字符;
将所述OCR输出中的所述分离图像归类为具有特定图像大小并且 被所述OCR处理指派了相同的一个和多个OCR字符码的分离图像的多 个集群;
获取一个集群的集群图像和其它集群的集群图像之间的形状量度 距离并且基于所获取的形状量度距离来检测在所述OCR处理指派给每 个集群的一个或多个OCR字符码的指派中是否存在错误;并且
校正对集群错误指派的一个或多个OCR字符码。
105.一种方法,包括:
将在从对原始文档图像进行处理的光学字符识别(OCR)处理所 接收的OCR输出中限定的剪切图像归类为剪切图像的多个集群,每个 集群包括被所述OCR处理指派了相同的一个或多个特定字符的图像大 小和形状相同或相似的剪切图像;以及
在对每个集群的剪切图像求平均中应用来自所述原始文档图像的 灰度和色彩信息以生成每个集群的平均图像。
106.如权利要求105所述的方法,进一步包括:
使用每个集群的平均图像和其它集群的平均图像之间的形状差异 来验证或检测所述OCR处理对每个集群所指派的所述一个或多个特定 字符中是否存在错误;
通过向特定集群新指派一个或多个特定字符来校正所述特定集群 中所检测到的每个错误;并且
在经修改的OCR输出中使用对所述特定集群新指派的一个或多 个特定字符来替代先前由所述OCR处理指派的相应的一个或多个特定 字符。
107.如权利要求105所述的方法,进一步包括:
获取来自在所述OCR输出中不存在的所述原始文档图像的灰度 或色彩信息。
108.如权利要求105所述的方法,进一步包括:
在计算每个集群中的每个剪切图像的质心中应用来自所述原始文 档图像的灰度或色彩信息;
对齐每个集群中的所有剪切图像的质心以对齐所述剪切图像;并 且
对所对齐的剪切图像求平均以生成每个集群的所述平均图像。
109.如权利要求105所述的方法,其中:
每个剪切图像由所接收的OCR输出中的边框来限定,并且
所述集群包括(1)其中每个剪切图像与所接收的OCR输出中的 单个边框相关联的集群和(2)其中每个剪切图像与所接收的OCR输 出中的两个或更多相邻边框相关联的集群。
110.一种用于光学字符识别(OCR)的系统,包括:
OCR引擎,可操作来处理文档的原始图像以产生包括从所述原始 图像提取的剪切图像的OCR输出并且对每个剪切图像指派一个或多个 字符;和
后OCR引擎,可操作来将所述OCR输出中的剪切图像归类为剪切 图像的多个集群,每个集群包括被所述OCR引擎指派了相同的一个或 多个特定字符的图像大小和形状相同或相似的剪切图像,并且
其中所述后OCR引擎可操作来在对每个集群的剪切图像求平均中 应用来自所述原始文档图像的灰度或色彩信息以生成每个集群的平均 图像。
111.如权利要求110所述的系统,进一步包括:
包括所述OCR引擎和所述后OCR引擎的一个或多个服务器计算 机;和
所述一个或多个计算机服务器与其进行通信的通信网络,所述通 信网络可操作来将所述文档的所述原始图像从客户端计算机导引到所 述OCR引擎。
112.如权利要求111所述的系统,其中:
所述OCR引擎和所述后OCR引擎处于不同的服务器计算机上。
113.一种编码在计算机可读介质上的计算机程序产品,可操作来 使得数据处理装置执行操作,所述操作包括:
将在从对原始文档图像进行处理的光学字符识别(OCR)处理所 接收的OCR输出中限定的剪切图像归类为剪切图像的多个集群,每个 集群包括被所述OCR处理指派了相同的一个或多个特定字符的图像大 小和形状相同或相似的剪切图像;并且
在对每个集群的剪切图像求平均中应用来自所述原始文档图像的 灰度和色彩信息以生成每个集群的平均图像。
114.一种用于对来自光学字符识别(OCR)处理的输出进行处理 的方法,包括:
将从处理文档的原始图像所生成的OCR处理的输出中的分离图像 归类为分离图像的多个集群,每个集群包括被所述OCR处理指派了相 同的一个或多个特定字符的图像大小和形状相似的分离图像;
使用集群图像来表示相应的集群中的分离图像;
选择具有低置信等级的集群来获取一个或多个字符与所选择集群 的集群图像的人工指派;并且
使用通过所述人工指派所获取的所述一个或多个字符来验证或替 代先前由所述OCR处理在所述OCR处理的输出中所指派的相应的一个 或多个特定字符。
115.如权利要求114所述的方法,其中:
每个剪切图像由所接收的OCR输出中的边框来限定,并且
所述集群包括(1)其中每个剪切图像与所接收的OCR输出中的 单个边框相关联的集群和(2)其中每个剪切图像与所接收的OCR输 出中的两个或更多相邻边框相关联的集群。
116.如权利要求114所述的方法,进一步包括:
对每个集群中的分离图像求平均以生成平均图像作为所述集群图 像。
117.如权利要求114所述的方法,进一步包括:
使用每个集群的集群图像和所有其它集群的集群图像之间的形状 差异来测量由所述OCR处理指派给每个集群的所述一个或多个特定字 符的置信等级。
118.如权利要求114所述的方法,进一步包括:
当所述人工指派将所选择集群的所述集群图像识别为所述OCR处 理的无意义图像时,在所述OCR输出中指示所选择集群的无意义状态。
119.如权利要求114所述的方法,进一步包括:
将所选择集群的所述集群图像导引到在线服务器,所述在线服务 器可操作来将所述集群图像导引到一个或多个用户并且向所述一个或 多个用户请求所述集群图像的人工生成字符;并且
使用从所述在线服务器返回的一个或多个人工生成字符作为对所 选择集群新指派的一个或多个特定字符。
120.如权利要求119所述的方法,其中:
所述在线服务器可操作来提供在线游戏,所述在线游戏将所选择 集群的所述集群图像提供给所述一个或多个用户以便进行作为所述在 线游戏一部分的用户响应。
121.如权利要求119所述的方法,其中:
所述在线服务器可操作来提供在线服务并且提供所选择集群的集 群图像作为挑战-响应测试的一部分,以确定所述在线服务的用户是否 为人类。
122.如权利要求114所述的方法,其中:
所选择的集群与其它集群的形状距离大于阈值形状距离。
123.如权利要求114所述的方法,其中:
所选择的集群具有小于阈值数目的图像数目。
124.一种用于光学字符识别(OCR)的系统,包括:
OCR引擎,可操作来对文档的原始图像进行处理以产生从所述原 始图像提取的分离图像并且向每个分离图像指派一个或多个字符;和
后OCR引擎,可操作来将所述OCR输出中的分离图像归类为分离 图像的多个集群,每个集群包括被所述OCR引擎指派了相同的一个或 多个特定字符的图像大小和形状相似的分离图像,
其中所述后OCR引擎可操作来生成表示相应的集群中的分离图像 的集群图像,选择具有低置信等级的集群来获取一个或多个字符与所 选择集群的所述集群图像的人工指派,并且使用通过所述人工指派所 获取的所述一个或多个字符来验证或替代先前由所述OCR引擎所指派 的相应的一个或多个特定字符。
125.如权利要求124所述的系统,进一步包括:
包括所述OCR引擎和所述后OCR引擎的一个或多个服务器计算 机;
所述一个或多个计算机服务器与其进行通信的通信网络;和
与所述通信网络进行通信的在线服务器,
其中所述后OCR引擎可操作来将所选择集群的集群图像导引到 所述在线服务器,所述在线服务器可操作来将所述集群图像导引到一 个或多个用户并且向所述一个或多个用户请求所述集群图像的一个或 多个人工生成字符;并且
其中所述后OCR引擎可操作来使用从所述在线服务器返回的一 个或多个人工生成字符作为对所选择集群新指派的一个或多个特定字 符。
126.如权利要求125所述的系统,其中:
所述通信网络可操作来将所述文档的所述原始图像从客户端计算 机导引到所述OCR引擎并且将来自所述后OCR引擎的输出导引到所 述客户端计算机。
127.如权利要求125所述的系统,其中:
所述OCR引擎和所述后OCR引擎处于不同的服务器计算机上。
128.如权利要求125所述的系统,其中:
所述在线服务器可操作来提供在线游戏,所述在线游戏将所选择 集群的集群图像提供给所述一个或多个用户以便进行作为所述在线游 戏一部分的用户响应。
129.如权利要求125所述的系统,其中:
所述在线服务器可操作来提供在线服务并且提供所选择集群的所 述集群图像作为挑战-响应测试的一部分以确定所述在线服务的用户是 否为人类。
130.一种编码在计算机可读介质上的计算机程序产品,可操作来 使得数据处理装置执行操作,所述操作包括:
将在从处理文档的原始图像所生成的光学字符识别(OCR)处理 的输出中的分离图像归类为分离图像的多个集群,每个集群包括被所 述OCR处理指派了相同的一个或多个特定字符的图像大小和形状相似 的分离图像;
使用集群图像来表示相应的集群中的分离图像;
选择具有低置信等级的集群来获取一个或多个字符与所选择集群 的集群图像的人工指派;并且
使用通过所述人工指派所获取的所述一个或多个字符来验证或替 代先前由所述OCR处理在所述OCR处理的输出中所指派的相应的一个 或多个特定字符。
131.如权利要求130所述的计算机程序产品,其中:
所述操作进一步包括:
将所选择集群的所述集群图像导引到在线服务器,所述在线服务 器可操作来将所述集群图像导引到一个或多个用户并且向所述一个或 多个用户请求所述集群图像的一个或多个人工生成字符;并且
使用从所述在线服务器返回的一个或多个人工生成字符作为对所 选择集群新指派的一个或多个特定字符。
132.一种方法,包括:
将在所接收的由光学字符识别(OCR)处理所处理的文档的OCR 输出中限定的剪切图像归类为剪切图像的多个集群,每个集群包括被 所述OCR处理指派了相同的一个或多个特定字符的图像大小和形状相 似的剪切图像;
生成集群图像来表示每个集群中的剪切图像;
选择特定集群的集群图像作为在线挑战-响应测试的一部分来请 求对所述特定集群的所述集群图像的用户识别;并且
使用从所述在线挑战-响应测试接收的所述用户识别来验证或校 正由所述OCR处理指派给所述特定集群的一个或多个特定字符。
133.如权利要求132所述的方法,其中:
每个剪切图像由所接收的OCR输出中的边框来限定,并且
所述集群包括(1)其中每个剪切图像与所接收的OCR输出中的 单个边框相关联的集群和(2)其中每个剪切图像与所接收的OCR输 出中的两个或更多相邻边框相关联的集群。
134.如权利要求132所述的方法,进一步包括:
基于所述在线挑战-响应测试从多个不同用户中的每一个获取对 所述特定集群的所述集群图像的用户识别;
通过使用从所述多个不同用户的其它用户所获得的用户识别来验 证对所述特定集群的所述集群图像的特定用户识别;并且
使用经验证的用户识别来验证或校正由所述OCR处理指派给所述 特定集群的一个或多个特定字符。
135.如权利要求132所述的方法,其中:
所述在线挑战-响应测试用于确定在线服务的用户是否为人类。
136.一种方法,包括:
将在所接收的由光学字符识别(OCR)处理所处理的文档的OCR 输出中限定的剪切图像归类为剪切图像的多个集群,每个集群包括被 所述OCR处理指派了相同的一个或多个特定字符的图像大小和形状相 似的剪切图像;
使用集群图像来表示每个集群中的剪切图像;
使用在线游戏向所述在线游戏的一个或多个用户提供特定集群的 集群图像用于作为所述在线游戏的一部分的用户响应;并且
使用从所述在线游戏所接收的所述用户响应来验证或校正由所述 OCR处理指派给所述特定集群的一个或多个特定字符。
137.如权利要求136所述的方法,其中:
每个剪切图像由所接收的OCR输出中的边框来限定,并且
所述集群包括(1)其中每个剪切图像与所接收的OCR输出中的 单个边框相关联的集群和(2)其中每个剪切图像与所接收的OCR输 出中的两个或更多相邻边框相关联的集群。
138.一种用于光学字符识别(OCR)的系统,包括:
多个OCR引擎,每个OCR引擎可操作来对文档的原始图像进行处 理并且产生相应的OCR输出;
多个后OCR处理引擎,每个后OCR处理引擎可操作来从相应的 OCR引擎接收OCR输出并且可被操作来产生所述文档的相应的经修改 的OCR输出;和
表决处理引擎,可操作来从所述多个经修改的OCR输出选择部分 并且将所选择的部分组合为所述文档的最终OCR输出;
其中每个后OCR处理引擎可操作来:
将在所接收的所述文档的OCR输出中限定的剪切图像归类为剪切 图像的多个集群,每个集群包括由对应的OCR引擎所指派的相同的一 个或多个特定字符的图像大小和形状类似的剪切图像;并且
生成表示每个集群中的剪切图像的集群图像;
并且其中所述表决处理引擎可操作来:
使用每个集群的集群图像和其它集群的集群图像之间的形状差异 来检测由对应的OCR引擎指派给每个集群的所述一个或多个特定字符 中是否存在错误;
通过向特定集群新指派一个或多个特定字符来校正在所述特定集 群中所检测到的每个错误;并且
使用对所述特定集群新指派的一个或多个特定字符来替代对应的 经修改的OCR输出中先前由对应的OCR引擎所指派的相应的一个或多 个特定字符。
139.如权利要求138所述的系统,其中:
所述集群包括(1)其中每个剪切图像与相应的OCR引擎所产生 的单个边框相关联的集群和(2)其中每个剪切图像与相应的OCR引 擎所产生的两个或更多相邻边框相关联的集群。
140.如权利要求138所述的系统,其中:
所述多个OCR引擎可操作来并行处理所述原始图像;并且
所述多个后OCR处理引擎可操作来并行接收OCR输出。
141.如权利要求138所述的系统,其中:
所述多个OCR引擎可操作来串行处理所述原始图像。
142.如权利要求138所述的系统,进一步包括:
包括所述OCR引擎、所述后OCR引擎和所述表决处理引擎的一 个或多个服务器计算机;和
所述一个或多个计算机服务器与其进行通信的通信网络,所述通 信网络可操作来将所述文档的所述原始图像从客户端计算机导引到所 述OCR引擎并且将来自所述表决处理引擎的最终OCR输出导引到所述 客户端计算机。
143.如权利要求142所述的系统,其中:
所述OCR引擎、所述后OCR引擎和所述表决处理引擎分别处于不 同的服务器计算机上。
144.如权利要求138所述的系统,进一步包括:
包括所述OCR引擎、所述后OCR引擎和所述表决处理引擎的一 个或多个服务器计算机;
所述一个或多个计算机服务器与其进行通信的通信网络;和
与所述通信网络进行通信并且存储由所述OCR引擎、所述后OCR 引擎和所述表决处理引擎产生的所选择文档的图像的经修改的OCR输 出的一个或多个OCR存储服务器计算机,
其中所述通信网络提供在客户端计算机和所述一个或多个OCR 存储服务器计算机之间的通信,以允许所述客户端计算机从所述一个 或多个OCR存储服务器计算机获取现有的经修改的输出。
145.一种用于光学字符识别(OCR)的方法,包括:
使用多个OCR引擎来处理文档的原始图像并且分别产生OCR输 出;
与其它OCR输出的处理分离地对每个所述OCR输出进行处理以产 生所述文档的相应的经修改的OCR输出,所述处理包括:
将在所接收的所述文档的OCR输出中限定的剪切图像归类为剪切 图像的多个集群,每个集群包括由对应的OCR引擎所指派的相同的一 个或多个特定字符的图像大小和形状类似的剪切图像,
生成表示每个集群中的剪切图像的集群图像,
使用每个集群的集群图像和其它集群的集群图像之间的形状差异 来检测由对应的OCR引擎指派给每个集群的所述一个或多个特定字符 中是否存在错误,
通过向特定集群新指派一个或多个特定字符来校正在所述特定集 群中所检测到的每个错误,并且
使用对所述特定集群新指派的一个或多个特定字符来替代对应的 经修改的OCR输出中先前由对应的OCR引擎所指派的相应的一个或多 个特定字符;并且
从所述多个经修改的OCR输出选择部分并将所选择的部分组合为 所述文档的最终OCR输出。
146.如权利要求145所述的方法,进一步包括:
使用所述多个经修改的OCR输出的置信分值从所述多个经修改 的OCR输出中选择一部分。
147.如权利要求145所述的方法,其中:
对每个所述OCR输出的处理包括使用对集群图像的人工识别来 验证或校正对所述集群图像的一个或多个字符的指派。
148.如权利要求145所述的方法,其中:
对每个所述OCR输出的处理包括使用来自每个集群中的每个剪 切图像中的原始图像的灰度或色彩数据;并且
对每个集群中的集群图像求平均以产生平均剪切图像作为所述集 群图像。
149.一种编码在计算机可读介质上的计算机程序产品,可操作来 使得数据处理装置执行操作,所述操作包括:
使用多个光学字符识别(OCR)引擎来处理文档的原始图像并且 分别产生OCR输出;
与其它OCR输出的处理分离地对每个所述OCR输出进行处理以产 生所述文档的相应的经修改的OCR输出,所述处理包括:
将在所接收的所述文档的OCR输出中限定的剪切图像归类为剪切 图像的多个集群,每个集群包括由对应的OCR引擎所指派的相同的一 个或多个特定字符的图像大小和形状类似的剪切图像,
生成表示每个集群中的剪切图像的集群图像,
使用每个集群的集群图像和其它集群的集群图像之间的形状差异 来检测由对应的OCR引擎指派给每个集群的所述一个或多个特定字符 中是否存在错误,
通过向特定集群新指派一个或多个特定字符来校正在所述特定集 群中所检测到的每个错误,并且
使用对所述特定集群新指派的一个或多个特定字符来替代对应的 经修改的OCR输出中先前由对应的OCR引擎所指派的相应的一个或多 个特定字符;并且
从所述多个经修改的OCR输出选择部分并将所选择的部分组合为 所述文档的最终OCR输出。
150.一种方法,包括:
利用第一光学字符识别(OCR)引擎处理文档图像以生成第一OCR 输出,所述第一OCR输出包括识别位于所述文档图像中的第一剪切图 像的第一边框以及指派给每个第一剪切图像的相应的一个或多个字 符;
使用第二OCR引擎处理所述文档图像以生成第二OCR输出,所述 第二OCR输出包括识别位于所述文档图像中的第二剪切图像的第二边 框以及指派给每个第二剪切图像的相应的一个或多个字符;
对所述第一OCR输出应用形状聚类来产生具有第一剪切图像的第 一集群以及对第一剪切图像的一个或多个字符的每个指派的相应的置 信分值;
对所述第二OCR输出应用形状聚类来产生具有第二剪切图像的第 二集群以及对第二剪切图像的一个或多个字符的每个指派的相应的置 信分值;并且
从所述第一OCR输出和所述第二OCR输出生成最终的OCR输出, 所述最终的OCR输出包括边框并且使用对所述第一剪切图像和所述第 二剪切图像的所述一个或多个字符的指派的所述置信分值来对每个所 述边框选择和指派相应的一个或多个字符。
151.如权利要求150所述的方法,其中:
所述集群包括(1)其中每个剪切图像与相应的OCR引擎所产生 的单个边框相关联的集群和(2)其中每个剪切图像与相应的OCR引 擎所产生的两个或更多相邻边框相关联的集群。
152.如权利要求150所述的方法,进一步包括:
至少利用第三OCR引擎处理所述文档图像以生成第三OCR输出, 所述第三OCR输出包括识别位于所述文档图像中的第三剪切图像的第 三边框以及指派给每个第三剪切图像的相应的一个或多个字符,并且
其中生成所述最终的OCR输出包括使用所述第一、第二和第三 OCR输出并且使用对所述第一、第二和第三剪切图像的字符指派的置 信分值在所述最终的OCR输出中对每个边框选择和指派相应的一个或 多个字符。
153.如权利要求150所述的方法,其中:
形状聚类对多个集群中的每个集群指派相应的一个或多个字符, 每个集群包括一个或多个剪切图像;并且
应用形状聚类包括访问原始文档图像并且获取灰度或色彩数据来 确认或修改对集群的字符指派。
154.如权利要求150所述的方法,进一步包括:
在生成所述最终的OCR输出之前,处理所述第一集群以修改或验 证所述第一OCR输出中对所述第一剪切图像的字符指派;并且
在生成所述最终的OCR输出之前,处理所述第二集群以修改或验 证所述第二OCR输出中对所述第二剪切图像的字符指派。
155.一种编码在计算机可读介质上的计算机程序产品,可操作来 使得数据处理装置执行操作,所述操作包括:
利用第一光学字符识别(OCR)引擎处理文档图像以生成第一OCR 输出,所述第一OCR输出包括识别位于所述文档图像中的第一剪切图 像的第一边框以及指派给每个第一剪切图像的相应的一个或多个字 符;
利用第二OCR引擎处理所述文档图像以生成第二OCR输出,所述 第二OCR输出包括识别位于所述文档图像中的第二剪切图像的第二边 框以及指派给每个第二剪切图像的相应的一个或多个字符;
对所述第一OCR输出应用形状聚类来产生具有第一剪切图像的第 一集群以及对第一剪切图像的一个或多个字符的每个指派的相应的置 信分值;
对所述第二OCR输出应用形状聚类来产生具有第二剪切图像的第 二集群以及对第二剪切图像的一个或多个字符的每个指派的相应的置 信分值;并且
从所述第一OCR输出和所述第二OCR输出生成最终的OCR输出, 所述最终的OCR输出包括边框并且使用对所述第一剪切图像和所述第 二剪切图像的所述一个或多个字符的指派的所述置信分值来对每个所 述边框选择和指派相应的一个或多个字符。
156.一种用于光学字符识别(OCR)的系统,包括:
第一OCR引擎,可操作来处理文档图像以生成第一OCR输出,所 述第一OCR输出包括识别位于所述文档图像中的第一剪切图像的第一 边框以及对每个第一剪切图像指派的相应的一个或多个字符;
第一后OCR引擎,可操作来对所述第一OCR输出应用形状聚类来 产生具有第一剪切图像的第一集群以及对第一剪切图像的一个或多个 字符的每个指派的相应的置信分值;
第二OCR引擎,可操作来处理所述文档图像以生成第二OCR输出, 所述第二OCR输出包括识别位于所述文档图像中的第二剪切图像的第 二边框以及指派给每个第二剪切图像的相应的一个或多个字符;
第二后OCR引擎,可操作来对所述第二OCR输出应用形状聚类来 产生具有第二剪切图像的第二集群以及对第二剪切图像的一个或多个 字符的每个指派的相应的置信分值;以及
表决处理引擎,用来接收和处理所述第一OCR输出和所述第二 OCR输出,并且基于置信分值从所述第一和所述第二集群产生最终的 OCR输出。
157.如权利要求156所述的系统,其中:
所述第一后OCR引擎可操作来获取对集群图像的人工识别以验证 或校正对所述集群图像的一个或多个字符的指派。
158.如权利要求156所述的系统,进一步包括:
包括所述第一和第二OCR引擎、所述第一和第二后OCR引擎和 所述表决处理引擎的一个或多个服务器计算机;和
所述一个或多个计算机服务器与其进行通信的通信网络,所述通 信网络可操作来将所述文档的所述原始图像从客户端计算机导引到所 述第一和第二OCR引擎并且将来自所述表决处理引擎的最终OCR输出 导引到所述客户端计算机。
159.如权利要求158所述的系统,其中:
所述第一和第二OCR引擎、所述第一和第二后OCR引擎和所述表 决处理引擎分别处于不同的服务器计算机上。
160.如权利要求156所述的系统,进一步包括:
包括所述第一和第二OCR引擎、所述第一和第二后OCR引擎和 所述表决处理引擎的一个或多个服务器计算机;
所述一个或多个计算机服务器与其进行通信的通信网络;
与所述通信网络进行通信并且存储所述第一和第二OCR引擎、所 述第一和第二后OCR引擎和所述表决处理引擎产生的所选择文档的图 像的最终OCR输出的一个或多个OCR存储服务器计算机,
其中所述通信网络提供在客户端计算机和所述一个或多个OCR 存储服务器计算机之间的通信以允许所述客户端计算机从所述一个或 多个OCR存储服务器计算机获取现有的最终OCR输出。
161.一种方法,包括:
利用第一光学字符识别(OCR)引擎处理文档图像以生成第一OCR 输出,所述第一OCR输出包括识别位于所述文档图像中的第一剪切图 像的第一边框,所述第一OCR输出进一步包括指派给每个第一剪切图 像的相应的一个或多个字符;
利用第二OCR引擎处理所述文档图像以生成第二OCR输出,所述 第二OCR输出包括识别位于所述文档图像中的第二剪切图像的第二边 框,所述第二OCR输出进一步包括指派给每个第二剪切图像的相应的 一个或多个字符;
将所述第一剪切图像和所述第二剪切图像归类为集群,每个集群 仅包括对其指派了相同的一个或多个字符的剪切图像;
生成每个集群的集群图像;
使用所述集群图像来验证或校正对剪切图像的字符指派并且确定 对剪切图像的一个或多个字符的每个指派的置信分值;以及
使用对所述集群图像的字符指派来生成最终的OCR输出。
162.如权利要求161所述的方法,其中:
通过对所述集群中的剪切图像求平均来生成所述集群的集群图 像。
163.如权利要求161所述的方法,进一步包括:
在生成所述最终的OCR输出中,确定任意一个所述第一剪切图像 是否与任意一个所述第二剪切图像共享所述文档图像中的位置,以及 指派给所述一个第一剪切图像的一个或多个字符与指派给所述一个第 二剪切图像的一个或多个字符是否不同,如果是,则使用所述一个第 一剪切图像和所述一个第二剪切图像的相应的置信分值来选择所述位 置的一个或多个字符。
164.如权利要求161所述的方法,其中:
所述集群包括(1)其中每个剪切图像与相应的OCR引擎所产生 的单个边框相关联的集群和(2)其中每个剪切图像与相应的OCR引 擎所产生的两个或更多相邻边框相关联的集群。
165.一种编码在计算机可读介质上的计算机程序产品,可操作来 使得数据处理装置执行操作,所述操作包括:
利用第一光学字符识别(OCR)引擎处理文档图像以生成第一OCR 输出,所述第一OCR输出包括识别位于所述文档图像中的第一剪切图 像的第一边框,所述第一OCR输出进一步包括指派给每个第一剪切图 像的相应的一个或多个字符;
利用第二OCR引擎处理所述文档图像以生成第二OCR输出,所述 第二OCR输出包括识别位于所述文档图像中的第二剪切图像的第二边 框,所述第二OCR输出进一步包括指派给每个第二剪切图像的相应的 一个或多个字符;
将所述第一剪切图像和所述第二剪切图像归类为集群,每个集群 仅包括对其指派了相同的一个或多个字符的剪切图像;
生成每个集群的集群图像;
使用所述集群图像来验证或校正对剪切图像的字符指派并且确定 对剪切图像的一个或多个字符的每个指派的置信分值;以及
使用对所述集群图像的字符指派来生成最终的OCR输出。
166.一种用于光学字符识别(OCR)的系统,包括:
第一OCR引擎,可操作来处理文档图像以生成第一OCR输出,所 述第一OCR输出包括识别位于所述文档图像中的第一剪切图像的第一 边框,所述第一OCR输出进一步包括指派给每个第一剪切图像的相应 的一个或多个字符;
第二OCR引擎,可操作来处理所述文档图像以生成第二OCR输出, 所述第二OCR输出包括识别位于所述文档图像中的第二剪切图像的第 二边框,所述第二OCR输出进一步包括指派给每个第二剪切图像的相 应的一个或多个字符;
后OCR引擎,用来接收所述第一和第二OCR输出并且将所述第一 剪切图像和所述第二剪切图像归类为集群,每个集群仅包括对其指派 了相同的一个或多个字符的剪切图像以及表示每个集群的剪切图像的 集群图像;和
表决处理引擎,可操作来基于从所述后OCR引擎对所述集群图像 的字符指派来生成最终的OCR输出。
167.如权利要求166所述的系统,进一步包括:
包括所述第一和第二OCR引擎、所述后OCR引擎和所述表决处 理引擎的一个或多个服务器计算机;和
所述一个或多个计算机服务器与其进行通信的通信网络,所述通 信网络可操作来将所述文档的所述原始图像从客户端计算机导引到所 述第一和第二OCR引擎并且将来自所述表决处理引擎的最终OCR输出 导引到所述客户端计算机。
168.如权利要求167所述的系统,其中:
所述第一和第二OCR引擎、所述后OCR引擎和所述表决处理引擎 分别处于不同的服务器计算机上。
169.如权利要求166所述的系统,进一步包括:
包括所述第一和第二OCR引擎、所述后OCR引擎和所述表决处 理引擎的一个或多个服务器计算机;
所述一个或多个计算机服务器与其进行通信的通信网络;和
与所述通信网络进行通信并且存储所述第一和第二OCR引擎、所 述后OCR引擎和所述表决处理引擎产生的所选择文档的图像的最终 OCR输出的一个或多个OCR存储服务器计算机;
其中所述通信网络提供在客户端计算机和所述一个或多个OCR 存储服务器计算机之间的通信以允许所述客户端计算机从所述一个或 多个OCR存储服务器计算机获取现有的最终OCR输出。
170.一种方法,包括:
利用第一光学字符识别(OCR)引擎处理文档图像以生成第一OCR 输出,所述第一OCR输出包括识别位于所述文档图像中的剪切图像的 边框以及对每个剪切图像指派一个或多个字符的字符指派;
对所述第一OCR输出应用形状聚类以产生第一经修改的OCR输 出,所述第一经修改的OCR输出包括对于剪切图像的字符指派的修改, 所述第一经修改的OCR输出进一步包括在所述文档图像中认出的词;
识别所述第一经修改的OCR输出中的可疑词,所述可疑词是具有 被识别为可疑字符的字符的词;并且
利用第二OCR引擎对所述可疑词进行处理以认出所述可疑词。
171.如权利要求170所述的方法,进一步包括:
作为正确认出所述可疑词来选择所述第一经修改的OCR输出或所 述第二OCR引擎的输出。
172.如权利要求170所述的方法,进一步包括:
在所述第一经修改的OCR输出中应用形状聚类来产生对剪切图像 的一个或多个字符的每个指派的相应的置信分值;
利用所述第二OCR引擎处理所述文档图像以生成第二OCR输出;
对所述第二OCR输出应用形状聚类以产生第二经修改的OCR输 出,所述第二经修改的OCR输出包括所述第二OCR引擎对剪切图像的 字符指派的修改,所述第二经修改的OCR输出包括对剪切图像的一个 或多个字符的每个指派的相应的置信分值,所述第二经修改的OCR输 出进一步包括在所述文档图像中认出的词;
使用所述第一经修改的OCR输出的置信分值和所述第二经修改的 OCR输出的置信分值,作为正确认出所述可疑词来选择所述第一经修 改的OCR输出或所述第二OCR引擎的输出。
173.如权利要求172所述的方法,其中:
对所述第二OCR输出应用形状聚类包括:
将所述第二OCR引擎所定位的剪切图像归类为集群,每个集群仅 包括被所述第二OCR引擎指派了相同的一个或多个字符的剪切图像;
对每个集群生成集群图像,所述集群的集群图像是通过对所述集 群中的剪切图像求平均而生成的;
使用所述集群图像以生成对所述剪切图像的经校正的字符指派; 并且
使用所述经校正的指派的经校正的指派字符来认出词。
174.一种编码在计算机可读介质上的计算机程序产品,可操作来 使得数据处理装置执行操作,所述操作包括:
利用第一光学字符识别(OCR)引擎处理文档图像以生成第一OCR 输出,所述第一OCR输出包括识别位于所述文档图像中的剪切图像的 边框以及对每个剪切图像指派一个或多个字符的字符指派;
对所述第一OCR输出应用形状聚类以产生第一经修改的OCR输 出,所述第一经修改的OCR输出包括对于剪切图像的字符指派的修改, 所述第一经修改的OCR输出进一步包括在所述文档图像中认出的词;
识别所述第一经修改的OCR输出中的可疑词,所述可疑词是具有 被识别为可疑字符的字符的词;并且
利用第二OCR引擎对所述可疑词进行处理以认出所述可疑词。
175.一种用于光学字符识别(OCR)的系统,包括:
第一OCR引擎,可操作来处理文档图像以生成第一OCR输出,所 述第一OCR输出包括识别位于所述文档图像中的剪切图像的边框以及 对每个剪切图像指派一个或多个字符的字符指派;
第一后OCR引擎,可操作来对所述第一OCR输出应用形状聚类以 产生第一经修改的OCR输出,所述第一经修改的OCR输出包括对于剪 切图像的字符指派的修改,所述第一经修改的OCR输出进一步包括在 所述文档图像中认出的字,其中所述第一后OCR引擎可操作来识别所 述第一经修改的OCR输出中的可疑词,所述可疑词是具有被识别为可 疑字符的字符的字;和
第二OCR引擎,可操作来接收并处理所述可疑词以认出所述可疑 词。
176.如权利要求175所述的系统,进一步包括:
包括所述第一和第二OCR引擎和所述第一后OCR引擎的一个或 多个服务器计算机;和
所述一个或多个计算机服务器与其进行通信的通信网络,所述通 信网络可操作来将所述文档的所述原始图像从客户端计算机导引到所 述第一OCR引擎并且将来自所述第二OCR引擎的OCR输出导引到所述 客户端计算机。
177.一种方法,包括:
处理文档图像以产生所述图像的非重叠子区域的集合,每个子区 域为第一分辨率;
生成视觉上类似的剪切子区域的多个集群,其中所述集合中的每 个所述子区域包括在所述集群的一个中;
以高于所述第一分辨率的第二分辨率从在所述相应的集群中的所 述子区域对所述多个集群中每一个生成代表性集群图像;并且
通过利用其中包括子区域的集群的代表性集群图像替代所述图像 中的相应的子区域来产生所述文档的副本图像。
178.如权利要求177所述的方法,其中:
所述文档是多个页面的文档;并且
每个子区域是所述文档的一个页面的一部分。
179.如权利要求178所述的方法,其中:
每个原始子区域由矩形边框所限定。
180.如权利要求177所述的方法,其中:
所速文档包括多个不同的子文档。
181.如权利要求180所述的方法,其中:
所述多个不同的子文档以共同的风格被打印。
182.如权利要求181所述的方法,其中:
所述多个不同的子文档是期刊或书本中的文章。
183.如权利要求177所述的方法,其中:
所述图像的所述子区域包括灰度或色彩数据;并且
使用所述灰度或色彩数据生成所述第二分辨率的代表性集群图 像。
184.如权利要求177所述的方法,其中:
所述图像的所述子区域包括灰度或色彩数据并且从所述集群生成 的所述代表性图像是二进制图像。
185.如权利要求177所述的方法,进一步包括:
通过对所述子区域的集合应用分级凝聚集群算法生成所述视觉上 相似的子区域的多个集群。
186.如权利要求177所述的方法,进一步包括:
使用光学字符识别(OCR)引擎来处理为所述第一分辨率的图像 以识别所述子区域并且对每个子区域指派一个或多个字符;并且
通过对所述子区域的多个集群指派子区域来生成所述视觉上相似 的子区域的多个集群以使得每个集群仅包括被所述OCR引擎指派了相 同的一个或多个特定字符并且大小近似相同的子区域。
187.如权利要求177所述的方法,进一步包括:
打印所述副本图像。
188.如权利要求177所述的方法,进一步包括:
使用所述文档的图像中的灰度或色彩信息以所述第二分辨率生成 每个集群的平均图像。
189.如权利要求177所述的方法,其中生成平均图像进一步包括:
获取相应的集群中的每个子区域的灰度或色彩信息;
使用所述灰度或色彩信息获取每个子区域的质心位置;
重叠所述集群内的子区域的质心位置;并且
使用所述集群中的重叠的子区域获取所述平均图像。
190.如权利要求177所述的方法,进一步包括:
在对每个集群中的子区域求平均时执行内插以获取对应的平均图 像。
191.如权利要求190所述的方法,其中:
对所述内插应用双线性内插算法。
192.一种编码在计算机可读介质上的计算机程序产品,可操作来 使得数据处理装置执行操作,所述操作包括:
处理文档图像以产生所述图像的非重叠子区域的集合,每个子区 域为第一分辨率;
生成视觉上类似的剪切子区域的多个集群,所述集合中的每个所 述子区域包括在所述集群的一个中;
以高于所述第一分辨率的第二分辨率从在相应的集群中的所述子 区域对所述多个集群中每一个生成代表性集群图像;并且
通过利用其中包括子区域的集群的代表性集群图像替代所述图像 中的相应的子区域来产生所述文档的副本图像。
193.一种方法,包括:
对文档的原始图像应用光学字符识别(OCR)处理以产生所述原 始图像的不同位置的剪切图像,每个剪切图像为第一分辨率;
将所述剪切图像归类为剪切图像的多个集群,每个集群包括被所 述OCR处理指派了相同的一个或多个字符码并且大小相同或相似的剪 切图像;
将每个集群中的每个剪切图像转换为高于所述第一分辨率的第二 分辨率的经转换剪切图像;
对每个集群中的经转换剪切图像求平均以生成集群图像;并且
使用所述多个集群的集群图像来替代由所述OCR处理最初产生的 对应的剪切图像从而以所述第二分辨率生成所述文档的所述原始图像 的副本。
194.如权利要求193所述的方法,进一步包括:
对每个集群中的每个剪切图像应用内插算法以产生相应的经转换 的剪切图像。
195.如权利要求194所述的方法,其中:
所述内插算法是双线性内插算法。
196.如权利要求193所述的方法,进一步包括:
使用所述文档的所述原始图像中的灰度或色彩数据来形成每个集 群中的所述剪切图像。
197.如权利要求193所述的方法,进一步包括:
以所述第二分辨率打印所述副本。
198.如权利要求193所述的方法,进一步包括:
获取每个集群中的每个经转换剪切图像的质心位置;
重叠所述集群内的经转换剪切图像的质心位置;并且
对所述集群中重叠的经转换剪切图像求平均以获取所述集群图 像。
199.如权利要求193所述的方法,其中:
每个剪切图像由所接收的OCR输出中的边框来限定,并且
所述集群包括(1)其中每个剪切图像与所述OCR引擎产生的单 个边框相关联的集群和(2)其中每个剪切图像与所述OCR引擎产生 的两个或更多相邻边框相关联的集群。
200.一种编码在计算机可读介质上的计算机程序产品,可操作来 使得数据处理装置执行操作,所述操作包括:
对文档的原始图像应用光学字符识别(OCR)处理以产生所述原 始图像的不同位置的剪切图像,每个剪切图像为第一分辨率;
将所述剪切图像归类为剪切图像的多个集群,每个集群包括被所 述OCR处理指派了相同的一个或多个字符码并且大小相同或相似的剪 切图像;
将每个集群中的每个剪切图像转换为高于所述第一分辨率的第二 分辨率的经转换剪切图像;
对每个集群中的经转换剪切图像求平均以生成集群图像;并且
使用所述多个集群的集群图像来替代由所述OCR处理最初产生的 对应的剪切图像从而以所述第二分辨率生成所述文档的所述原始图像 的副本。
201.一种系统,包括:
光学字符识别(OCR)引擎,可操作来处理文档的原始图像以产 生包括在所述原始图像的不同位置的剪切图像的OCR输出,每个剪切 图像为第一分辨率;
后OCR引擎,与所述OCR引擎进行通信以接收所述OCR输出,
其中所述后OCR引擎可操作来:
将所述剪切图像归类为剪切图像的集群,每个集群包括被所述 OCR引擎指派了相同的一个或多个字符码并且大小相同或相似的剪切 图像;
将每个集群中的每个剪切图像转换为高于所述第一分辨率的第二 分辨率的经转换剪切图像;
对每个集群中的经转换剪切图像求平均以生成集群图像;并且
使用所述多个集群的集群图像来替代由所述OCR引擎最初产生的 对应的剪切图像从而以所述第二分辨率生成所述文档的所述原始图像 的副本。
202.如权利要求201所述的系统,进一步包括:
包括所述OCR引擎和所述后OCR引擎的一个或多个服务器计算 机;和
所述一个或多个计算机服务器与其进行通信的通信网络,所述通 信网络可操作来将所述文档的所述原始图像从客户端计算机导引到所 述OCR引擎。
203.如权利要求201所述的系统,其中:
所述OCR引擎和所述后OCR引擎处于不同的服务器计算机上。
204.如权利要求201所述的系统,进一步包括:
包括所述OCR引擎和所述后OCR引擎的一个或多个服务器计算 机;
所述一个或多个计算机服务器与其进行通信的通信网络;和
与所述通信网络进行通信并且存储所述OCR引擎和所述后OCR 引擎所产生的为第二分辨率的所选择原始图像的副本的一个或多个存 储服务器计算机;
其中所述通信网络提供在客户端计算机和所述一个或多个存储服 务器计算机之间的通信以允许所述客户端计算机从所述一个或多个存 储服务器计算机获取所述OCR引擎和所述后OCR引擎所产生的原始 图像的为所述第二分辨率的现有副本。
205.如权利要求201所述的系统,进一步包括:
连接到所述通信网络以打印所述后OCR引擎所产生的所述副本 的打印机。
于2006年9月8日提交的题为“Shape Clustering in Post Optical Character Recognition Processing”的No.11/517,818;
于2006年9月11日提交的题为“Shape Clustering and Cluster-Level Manual Identification in Post Optical Character Recognition Processing” 的No.11/519,368;
于2006年9月11日提交的题为“Optical Character Recognition based on Shape Clustering and Multiple Optical Character Recognition Processes”的No.11/519,376;和
于2006年9月11日提交的题为“High Resolution Replication of Document based on Shape Clustering”的No.11/519,320。
以上专利申请的公开内容通过引用合并为本申请说明书的一部 分。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
用于预防或治疗由eNOS表达而引起的疾病的药物 | 2020-05-13 | 627 |
14α,17α-C2-桥接的19-降孕酮衍生物 | 2020-05-11 | 737 |
从红霉素衍生的新的断大环内酯类及其制备方法 | 2020-05-12 | 905 |
新的法呢基转移酶抑制剂,其制法及其药物组合物 | 2020-05-11 | 470 |
含杂原子的并环戊二烯的制备方法 | 2020-05-12 | 338 |
会议音频系统、用于分发音频信号的方法以及计算机程序 | 2020-05-12 | 465 |
偶联生物分子及其制备 | 2020-05-11 | 64 |
14α,17α-C2-桥接的19-降孕酮衍生物 | 2020-05-11 | 139 |
利用无线LAN无线电波环境图来估计AP位置的方法和装置 | 2020-05-13 | 616 |
应用含杂原子的并环戊二烯抗微生物的方法 | 2020-05-12 | 319 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。