对包裹上的信息进行读取和解码的方法及系统

申请号 CN01823038.5 申请日 2001-01-18 公开(公告)号 CN1270834C 公开(公告)日 2006-08-23
申请人 联邦快递公司; 发明人 B·B·邦纳; O·-P·斯卡尔克斯鲁德; A·杨克维克斯;
摘要 在本 发明 的系统中,包裹(25)随机地放置在传送带(27)上,其标签朝向双摄像机组件(12)。随着传送带(27)移动,双摄像机组件(12)对置于架空摄像机下方的传送带连续摄像。摄像机的设计允许它拍摄未单列化的且未对齐的包裹流的高 分辨率 图像。然后将摄像机视场内的包裹的数字图像传送给处理系统进行分析。处理系统标识图像中的单个的包裹(25)并提取它们,然后分析包裹标签上书写的信息。分析过程利用常规的光学字符识别(OCR)和智能字符识别(ICR)技术来评估包裹标签上书写的信息。一旦信息已解码,则系统 访问 与该已解码的机器可读代码相关联的 数据库 记录或者创建新的记录。当碰到未知的单词图像时,就利用根据安装特定或用户特定的标准加以优化的词汇信息来协助字段特定的识别过程。词汇信息根据处理过的表单信息不断进行修订。
权利要求

1.一种同时从多个表单捕获和处理信息的方法,所述方法包括 如下步骤:
捕获多个随机放置在移动传送带上且为成像装置可见的表单的 图像,每一个所述表单分别与多个包裹中的一个相关;
在所述捕获的图像中定位所述多个表单中的至少一个,所述至少 一个表单包括多个信息数据字段;以及
对所述多个信息数据字段中的至少一个进行解码。
2.如权利要求1所述的方法,其特征在于它包括重复定位和解 码,直到所述捕获的图像中的每个表单均已被处理为止的步骤。
3.如权利要求1所述的方法,其特征在于所述图像包括多个未单 列化的表单。
4.如权利要求3所述的方法,其特征在于所述捕获的图像包括多 个未对齐的表单。
5.如权利要求1所述的方法,其特征在于所述定位步骤还包括如 下步骤:
在所述捕获的图像中定位预定图案;
在所述捕获图像中定位至少一个参考标记,所述至少一个参考标 记未超过至所述预定图案的预定距离;以及
确定感兴趣的区域,所述感兴趣的区域包围包括所述预定图案和 所述至少一个参考标记的区域。
6.如权利要求5所述的方法,其特征在于所述预定图案是机器可 读代码。
7.如权利要求5所述的方法,其特征在于所述预定图案是数字、 字母数字或字母文本。
8.如权利要求5所述的方法,其特征在于所述预定图案是图片。
9.如权利要求5所述的方法,其特征在于所述定位预定图案的步 骤还包括如下步骤:
确定所述捕获图像中遗漏所述预定图案的一部分;以及
将所述捕获的图像与至少一个预先存储的图像组合,以创建完整 的预定图案。
10.如权利要求5所述的方法,其特征在于所述确定步骤还包括 如下步骤:
确定所述捕获图像中遗漏所述预定图案的一部分;以及
将所述捕获的图像与至少一个预先存储的图像组合,以创建完整 的感兴趣的区域。
11.如权利要求1所述的方法,其特征在于所述解码步骤包括如 下步骤:
测量至少一个参考标记与预定图案之间的空间关系,所述空间关 系标识位于所述表单上的所述多个信息数据字段的至少其中之一的位 置和格式;以及
对所述多个信息数据字段中的至少一个进行解码。
12.如权利要求11所述的方法,其特征在于所述解码步骤包括如 下步骤:
标识一个与所述表单相关联的始发源;
从所述信息数据字段中的至少一个提取信息;
利用识别引擎对所述提取的信息解码,其中所述识别引擎由所述 信息数据字段的位置和格式确定;
将所述解码的信息同与所述始发源相关联的包裹信息数据库条 目比较;以及
只要满足预定标准,就用所述包裹信息替换所述解码的信息。
13.如权利要求12所述的方法,其特征在于如下步骤:只要满足 预定标准,就对所述包裹信息数据库重新排序。
14.一种用于同时捕获和处理传送带上传送的多个表单上的信息 的计算机系统,其包括:
含程序指令的存储器;以及
处理器,被配置为利用程序指令捕获所述多个表单的图像,每一 个所述表单分别与多个包裹中的一个相关,在所述捕获的图像中定位 所述多个表单中的至少一个,其中所述至少一个表单包括多个信息数 据字段,以及对所述多个表单中的所述至少一个表单上的信息解码。
15.如权利要求14所述的计算机系统,其特征在于所述处理器还 被配置为重复执行定位和解码指令,直到所述捕获的图像中的每个表 单均被处理为止。
16.如权利要求14所述的计算机系统,其特征在于所述定位指令 还包括如下指令:
在所述捕获的图像中定位预定图案;
在所述捕获图像中定位至少一个参考标记,其中所述至少一个参 考标记未超过至所述预定图案的预定距离;以及
确定感兴趣的区域,其中所述感兴趣的区域包围包括所述预定图 案和所述至少一个参考标记的区域。
17.如权利要求14所述的计算机系统,其特征在于所述定位预定 图案指令还包括如下指令:
确定所述捕获图像中遗漏所述预定图案的一部分;以及
将所述捕获的图像与至少一个预先存储的图像组合,以创建完整 的预定图案。
18.如权利要求16所述的计算机系统,其特征在于所述确定指令 还包括如下指令:
确定所述捕获图像中遗漏所述预定图案的一部分;以及
将所述捕获的图像与至少一个预先存储的图像组合,以创建完整 的感兴趣的区域。
19.如权利要求14所述的计算机系统,其特征在于所述解码指令 还包括如下指令:
测量至少一个参考标记与预定图案之间的空间关系,所述空间关 系标识所述表单上的所述多个信息数据字段中的至少一个的位置和格 式;以及
对所述多个信息数据字段中的至少一个进行解码。
20.如权利要求19所述的计算机系统,其特征在于所述解码指令 还包括如下指令:
标识一个与所述表单相关联的始发源;
从所述信息数据字段中的至少一个提取信息;
利用识别引擎对所述提取的信息解码,其中所述识别引擎由所述 信息数据字段的位置和格式确定;
将所述解码的信息同与所述始发源相关联的包裹信息数据库条 目作比较;以及
只要满足预定标准,就用所述包裹信息替换所述解码的信息。
21.如权利要求20所述的系统,其特征在于还包括如下指令:只 要满足预定标准,就对所述包裹信息数据库条目重新排序。
22.一种用于捕获多个随机放置在移动传送带上的物件的图像的 成像系统,其包括:
主透镜组件,用于将通过所述传送带的表面及随机放置在所述表 面的物件反射的光束进行汇聚;
辅助透镜组件,用于将来自所述主透镜组件的所述光束进行汇 聚;
相位掩模板,用于改变由所述辅助透镜组件汇聚的光束,以使所 述成像系统对放置在所述传送带上的物件与所述主透镜组件之间的短 距离不敏感;和
分光器,用于将所述改变的光束分到第一图像检测器及与所述第 一图像检测器成90°的度的第二图像检测器;
其中所述第一图像检测器生成所述传送带表面的第一部分的输 出信号;且其中所述第二图像检测器生成所述传送带表面的第二部分 的输出信号
23.如权利要求22所述的成像系统,其特征在于所述相位掩模板 采用可分离点扩散函数来编码。
24.一种同时从多个表单捕获和处理信息的方法,所述表单为成 像装置可见且与多个随机放置在移动传送带上的包裹相关,所述方法 包括如下步骤:
捕获所述多个包裹及相关的表单的图像;
在所述捕获的图像中定位所述多个表单中的至少一个,所述至少 一个表单包括多个信息数据字段;且
对所述多个信息数据字段中的至少一个进行解码。
25.如权利要求24所述的方法,其特征在于还包括重复定位和解 码,直到所述捕获的图像中的每个表单均已被处理为止的步骤。
26.一种同时从与包裹相关的多个表单捕获和处理信息的方法, 所述方法包括如下步骤:
捕获随机放置在移动传送带上的多个包裹的图像;
在所述捕获的图像中定位至少一个与多个包裹之一对应的表 单,所述至少一个表单包括多个信息数据字段;以及
对所述多个信息数据字段中的至少一个解码。

说明书全文

技术领域

发明涉及用于读取信息并对其解码的方法和装置,更具体地来 说,涉及用于对移动传送带上传送的物件表面所含信息成像并处理的 系统。

背景技术

全世界范围内包裹特快专递服务机构之间的竞争已达到划时代 阶段。为了保持或者甚至提高其市场份额,这些机构要在巨大压下 比它们的竞争对手更有效地处理包裹和并更快地将包裹送达其目的 地。虽然包裹自动分类和递送领域的软件硬件最近都有所进步,但 人们还是期望进一步的改进,以便取得完全且充分自动化的处理过程 自然产生的经济效益。
如今,现代包裹处理系统靠使用传送带将包裹送入处理装置,并 载送它们通过处理装置,同时这些包裹由高分辨率摄像机摄像并进行 处理以便最终递送到目的地。标题为“用于读取包裹信息的系统和方 法”的授予Moed等人的美国专利No.5770841中公开了一种这样的系 统。当到达分配中心时,包裹从运货车装载到传送带上,并由单列化 处理装置按单列排列。包裹高度传感器确定每个包裹的高度,并该信 息传送给高分辨率摄像机的聚焦系统。当每个包裹通过高分辨率摄像 机下方时,捕获包裹表面的图像。将数字化的图像传送给图像处理系 统,以对信息进行自动化分析。常规的包裹成像系统,如Moed等人 所讨论的系统一般要求包裹流至少单列化(单队列化),有时甚至要 求在对包裹成像之前将它们对齐,这是因为成像系统的聚焦物平面和 视场(FOV)很有限。本质上,当两个相邻物品处于不同的聚焦平面 (即它们与摄像机的距离不同)时,必须对这两个物品分别成像,否 则它们在一个图像中看起来都不会清晰。类似地,当两个相邻物品处 于同一个聚焦平面、但横向分隔开时,也必须对这两个物品分别成像, 否则可能在一个图像中只捕获到一个或两个物品的部分表面。不幸的 是,将包裹正确地单列化(singulated)和对齐的处理过程占用宝贵的 时间,严重地影响处理吞吐量。再者,如果包裹必须单列放置,就严 重限制了一次实际可以放置在传送带上供处理的包裹的数量。如果许 多邮递服务传送带的工作速度一定,则对必须处理的每个包裹聚焦, 成像,然后再聚焦的过程对甚至最高级的成像系统来说都造成很大的 负担。
在成像系统捕获包裹的图像之后,经验证明,该过程中最容易出 错的是在实际中识别包裹上的手写体文字信息以及及时根据该信息 确定包裹的正确目的地。大包裹递送公司的包裹处理量已经达到每天 数百万件的平并在不断提高,这一现实加重了本来已很艰巨的工 作。
为了提高处理吞吐量而又不相应地增加人手,包裹递送公司求助 于采用高速成像系统光学智能字符识别技术来快速地对包裹成像和 处理其上所含的印刷体和草写体信息。不幸的是,许多这种常规字符 识别引擎只能以大约98%的识别率来识别手写字符,这仍会导致每个 包裹2-3个错误。
因此,本领域需要一种允许更自由地在输送机上放置包裹的成像 系统。另外,还需要一种处理系统,其具有比当前系统更快更准地识 别印刷体和草写体字符的能力。

发明内容

根据本发明的一种同时从多个表单捕获和处理信息的方法,所述 方法包括如下步骤:捕获多个随机放置在移动传送带上且为成像装置 可见的表单的图像,每一个所述表单分别与多个包裹中的一个相关; 在所述捕获的图像中定位至少一个所述多个表单,所述至少一个表单 包括多个信息数据字段;以及对所述多个信息数据字段中的至少一个 解码。
根据本发明的一种用于同时捕获和处理传送带上传送的多个表 单上的信息的计算机系统,其包括:含编程指令的存储器;以及处理 器,被配置为利用程序指令捕获所述多个表单的图像,每一个所述表 单分别与多个包裹中的一个相关,在所述捕获的图像中定位所述多个 表单中的至少一个,其中所述至少一个表单包括多个信息数据字段, 以及对所述多个表单中的所述至少一个上的信息解码。
根据本发明的一种用于捕获多个随机放置在移动传送带上的物 件的图像的成像系统,其包括:主透镜组件,用于将通过所述传送带 的表面及随机放置在所述表面的物件反射的光束进行汇聚;辅助透镜 组件,用于将来自所述主透镜组件的所述光束进行汇聚;相位掩模板, 用于改变由所述辅助透镜组件汇聚的光束,以使成像系统对放置在所 述传送带上的物件与所述主透镜组件之间的短距离不敏感;及分光 器,用于将所述改变的光束分到第一图像检测器及与所述第一图像检 测器成90°的度的第二图像检测器;其中所述第一图像检测器生成 所述传送带表面的第一部分的输出信号;且其中所述第二图像检测器 生成所述传送带表面的第二部分的输出信号
根据本发明的系统和方法提供一种用于读取和解码从表单中提 取的信息的装置。本发明的系统中,包裹随意地放置在传送带上,只 是它们的标签要为包裹成像系统可见。当它们沿传送带移动时,包裹 成像摄像机及时拍摄任意瞬间传送带的局部图像。然后,将摄像机视 场内包裹的数字图像传送给处理系统以供分析。处理系统标识出图像 中的包裹个体并提取它们,然后分析书写或印刷在包裹标签上的信 息。分析过程采用常规的光学字符识别(OCR)和智能字符识别(ICR) 技术来评估书写在包裹标签上的信息,包括复选框。一旦已将信息解 码,系统就访问与解码的机器可读代码相关联的包裹记录数据库项或 者在需要时创建新的数据库项。然后用从包裹发货单上提取并验证过 的信息填写检索到的数据库条目。当遇到无法识别的单词图像时,字 段特定的识别过程会利用客户特定的或安装特定的词汇信息来辅助 该识别过程。词汇信息根据经过处理的表单信息不断进行修正和优 化。在最佳实施例中,与客户相关联且经过验证的目的地地址按照字 母顺序排列或根据出现的频率来分级排序。每次验证与客户相关联的 地址时,如果合适,就会将其添加到数据库中并修改相关目的地地址 的次序。仅在系统判定数据库中未存储该始发地客户之后,系统才求 助于ZIP+4或类似的数据库,以验证目的地地址。要明白的是,上述 的一般说明和下文的详细说明均只是示范性和解释性的,而不是为了 限制本发明,本发明由所附权利要求来限定。
附图说明
附图包括于本说明书中且构成本说明书的一部分,其说明本发明 目前的最佳实施例,并与上述一般说明以及下述最佳实施例的详细说 明共同用于解释本发明的原理。
图1是根据本发明的包裹处理装置的示意图;
图2是根据本发明的包裹处理系统的示意图;
图3是根据本发明的可被处理的表单的示例;
图4是根据本发明的主图像捕获站的详细方框图
图5是根据本发明的图像捕获系统的示意图;
图6是根据本发明的双摄像机组件的示意图;
图7是根据本发明的成像模的侧视图;
图8是图像捕获系统的电子部件模块的详细方框图;
图9是可由本发明的模式识别系统识别的各种预定图案模式的示 意图;
图10和图11是根据本发明的字段处理方法的详细流程图
图12是图2的用户终端的详细方框图;
图13是图2的别名服务器的详细方框图;以及
图14是源和目的地标签样本。

具体实施方式

在下文对最佳实施例的详细说明中,参考了构成说明书一部分的 附图,其中作为说明显示了可以实施本发明的特定实施例。对该实施 例作了足够详细的说明,以使本专业技术人员可以实施本发明,要理 解的是,在不背离本发明的范围的前提下,可以采用其它实施例以及 进行结构上的修改。因此,下述详细说明不应从限制意义上加以理解。
首先来看本说明书的术语,以下的详细说明主要是用常规计算机 组件(包括中央处理器(CPU)、CPU的存储装置和相连的面向象素 的显示器)所执行的操作的过程和符号表示来表示的。这些操作包括 由CPU执行的数据位操作以及维护驻留在一个或多个存储装置中的 数据结构内的这些比特。这种数据结构使得计算机内存中存储的数据 比特集合具有某种物理结构,且表示特定的电或磁部件。这些符号表 示是计算机编程和结构领域中专业人员所用的工具,用于非常有效地 将论述和发现传达给该领域的其它技术人员。
为了进行本讨论,构思一个一般的过程,该过程为取得预期结果 的计算机可执行步骤序列。这些步骤一般要求对物理量进行物理 处理。虽然并非必需,但这些物理量通常采取能够被存储、传递、 合并、比较或者处理的电、磁或光信号的形式。本专业技术人员通 常将这些信号称为比特、值、要素、符号、字符、术语、对象、数 字、记录、文件等。但应记住,这些和类似的术语应该与计算机操 作所用的合适的物理量相关联,而且这些术语只是存在于计算机操 作期间和之中的物理量所用的常规标号。
还应该理解的是,计算机内的操作常常涉及诸如添加、比较、 移动之类的术语,它们一般与操作员执行的手工操作相关联。必须 理解的是,在本发明中,操作员的此类介入并非必需的,或者说是 并非期望的。此处所述的操作是与计算机交互的操作员或用户关联 执行的机器操作。用于执行本发明的操作的机器包括通用数字计算 机或其它类似的计算设备。
此外,还应理解的是,这里所述的程序、过程、方法等并不与 任何特定的计算机或设备相关或局限于这些设备。相反,各种类型 的通用机器均可与根据这里所作论述构造的程序一起使用。类似地, 可以证明以下这种做法是有利的:通过具有硬布线逻辑的专用计算 机系统或保存在例如只读存储器非易失性存储器中的程序来构造 专用设备,以执行这里所述的方法步骤。
利用本发明的工作环境包括一般的分布式计算系统,其中通过 各种类型的通信链路将通用计算机、工作站或个人计算机连接起来。 在客户服务器设置中,程序和数据以及许多对象可由系统的各成员 所获得。
根据本发明,网络中远程终端处的用户通过网络与服务器或万 维网(Web)站点通信,并能够从服务器或万维网站点将数据下载到 用户的客户工作站。与对本说明书中本发明的实施例的描述一样, 将用于浏览网络(如因特网)的客户工作站上的万维网浏览器程序 称为浏览器,而将在下载期间与浏览器工作站通信的服务器工作站 称为服务器。
本发明的系统包括多个计算机终端和服务器。各种类型的计算 机一般都可能彼此相似,均包括中央处理器、显示设备和操作员输 入设备。而且应理解,各种类型的计算机均可执行这里所述的操作。 分布式系统可以包括客户计算机和服务器计算机通过其进行通信的 许多种网络中的任何一种,这些网络包括局域网(LAN)、广域网 (WAN)、因特网以及任何其它在许多节点之间分布处理和共享数 据的网络。在线服务一般提供诸如电子邮件(email)、文件传输协 议(FTP)以及万维网(WWW)访问的功能。
WWW是因特网的图形子网。利用常见的“万维网浏览器”软 件,如Mosaic或Netscape Navigator,用户可以容易地访问WWW上 的因特网信息和服务。浏览器处理查找和定位因特网上的信息并显 示服务器提供的信息的功能。WWW利用称为“超文本”的技术来 组织、搜索和显示因特网上的信息。利用浏览器,用户可以从查看 的文档中选择单词(“超文本单词”),从而链接到含与该单词相 关的信息的另一个文档。这些链接位于万维网服务器域内,实现逐 层深入的搜索或形成选择的基础
在商业领域里,服务提供商可以利用因特网地址和超文本编辑 器来制作称为“主页”的超文本文档,用户可以通过访问该提供商 的万维网服务器来浏览它。主页利用图形图像、声音、超链接选项 等提供有关提供商所提供服务的信息。利用该信息,引导用户浏览 主页,以便选择服务和期望的服务特性。
现在更仔细地来看附图,其中,相同的标号指几个图中相似的 部件,图1显示用于处理包裹的典型包裹分发装置5。每个包裹分发 装置5包括图像捕获站12、多个控制(keying)站14、异常处理站 16、标签站18以及包裹装载站20。包裹25在该图底部靠近图像捕 获站12处进入装置,继续前进,然后向左朝着包裹装载站20前进。 然而,如本专业技术人员所知,包裹流可以从任一方向开始,且传 送带27可采用任何形状。图1所示的包裹25在高度、重量和尺寸 上有所不同,可在传送带27上以任意方向放置。唯一的位置要求是 包裹标识信息、邮件标签或处理表单必须为成像系统可见。
图2显示图1局部所示的本发明的方框图。如图2所示,包裹 处理系统10被设计为通过网络29来进行通信。包裹处理系统10包 括多个互联的计算机和运行多个操作系统微处理器。作为示例, 网络可以包括工作在Windows/NT、UNIX和/或Windows/CE操作系 统上的基于pentiumTM的微处理器。图2还显示包裹处理系统10包 括基于知识的服务器31、包裹信息服务器32以及别名服务器33, 正如下文解释,基于知识的服务器31、包裹信息服务器32和别名服 务器33包含这样的信息,其可由登录到系统10的想要检索存储在 这些服务器其中之一上的信息的用户来访问。经编程,每个服务器 可分别存储基于知识的信息、包裹信息或跟踪信息,以供位于用户 终端28的客户使用。例如,想要确定其在运输中的包裹的位置的客 户会通过用户终端28上运行的浏览器访问别名服务器33,别名服务 器33接着可以访问包裹信息服务器32,以应答客户查询。位于系统 用户终端28的用户可以从几乎任何位置经由无线或有线接口通过网 络29访问系统10。经由无线接口与系统10接口的用户终端28通过 射频无线电波与系统10的其余用户终端通信,而经由有线接口连接 到网络的用户通过有线或光纤媒体与系统10的其它用户通信。
正如下文的解释,当包裹处理系统10识别出包裹25时,它要 么创建新的包裹记录数据库条目,要么更新现有条目,以此使得系 统处理的各个包裹的状态精确。如图2所示,图像捕获站12还包括 词汇数据库36、包裹记录数据库37和图像数据库38、表单识别模 块64和字段处理模块66。下面将更详细地说明图像捕获站12及其 部件。
图3显示包裹处理系统10处理的典型表单40。表单40包括源 地址42、目的地地址44、机器可读代码46a、参考标记48以及托运 信息50。源地址42和目的地地址44通常分别由两行至四行字母数 字文本,其中目的地地址44位于源地址42下方。机器可读代码46a 一般包括一维或二维条形码或其它符号。在最佳实施例中,机器可 读代码46a包括一个二维概率密度函数(PDF)417条形码。表单的 预定位置处有多个参考标记48,用于辅助系统10标识和正确解码成 像后的表单。表单40还包括可利用复选框记录在表单上的托运信息 50。为明确起见,本说明假定表单包括将该表单及相关的包裹递送 到预定目的地所必需的信息。应该理解的是,表单40可以包括任何 类型的信息,它可能与要递送的包裹相关,也可能不相关。
再次参考图1,将从其它细节描述包裹处理系统10的部件和工 作原理。当把包裹置于传送带27上时,它们首先被输送到图像捕获 站12,其功能是通过在预定时期内重复捕获传送带27的图像来捕获 经过图像捕获站12的各包裹的图像。在图像捕获站12捕获包裹25 的图像时起,直到包裹达到标签站18的时期内,包裹处理系统10 从被捕获的图像中提取各表单40,分析表单上书写的信息,并为该 包裹创建路由标签。因为图像捕获站12不是对单个表单成像,所以 处理系统10首先要从捕获的图像中分离出各个表单40,然后才能对 各个表单40上的信息进行解码。一旦识别出各表单,系统10即确 定那些已经贴上路由标签的包裹。路由标签由32位特殊的ASCII机 器可读代码和可选的二维符号组成。它标识应用所需的如下属性: 与包裹相关联的数据库记录标识符、源地址和目的地地址、包裹的 特殊处理程序以及原来就与包裹相关联的表单标识符。路由标签还 可以包括人可读的字母数字文本。可以为托运大量包裹的一方提供 路由标签生成系统,其允许在包裹到达包裹处理系统10之前将路由 标签贴到包裹上。在确定包裹没有路由标签之后,处理系统10标识 表单40,定位并解码表单40上的信息,并且如果有必要,建立包裹 记录数据库条目。如果系统无法执行任何前述任务(由于定位路由 标签异常),就提醒异常处理站16,并在该处纠正问题。当包裹25 到达标签站18时,如有必要,则创建路由标签,并在将其贴到包裹 25上之后才允许包裹进行到包裹装载站20。
下面将更详细地描述各包裹处理站的工作机制。如图4所示, 图像捕获站12包括图像捕获系统60、模式识别系统62、表单识别 系统64以及字段处理系统66。如图5所示,图像捕获站60包括成 像模块100和电子模块200。成像模块100由主镜头(或镜子)102、 第二镜头(或镜子)104、相位掩模(phase mask)106以及至少一个 检测器108。在工作中,成像模块100连续捕获一段传送带27的高 分辨率图像,包括及时捕获任意瞬间位于传送带段上的包裹25。不 同于现有技术的包裹成像系统,成像模块100可以同时捕获多个包 裹25上表面的清晰图像,而不管包裹高度如何。还可以对事先未对 齐的随传送带27移动的包裹25成像。传送带27通过主镜头102、 辅助镜头104以及相位掩模106成像到检测器108上。相位掩模106 改变透过它的光的相位。它包括不透明度、厚度或折射率有差异的 光学材料。相位掩模106用于改变非相干光学系统(一种只检测和 处理信号强度的系统),以便响应点对象或点扩散函数(PSF)的该 系统在对象距离的预定范围内对点与主镜头102的距离相对不敏感。 除了具有同时对多个包裹成像而无论其高度的能力之外,这种设置 还可使曲面和倾斜面上包裹标签图像的失真最小,从而提高随后用 于对条形码解码和执行字符识别的算法的性能。相位掩模106的输 出由检测器108采样,经摄像机电子装置110放大并在接收器112 中数字化,以供处理器114处理。
正如本专业技术人员周知,用于包裹路由自动化的字符识别技 术要求高分辨率图像(至少200点/英寸)。以此分辨率捕获整个传 送带27(通常为3-5英尺宽)的图像,则传送带27需要9-15000 个象素。为了完成此任务,图像捕获系统60采用由双摄像机组件116 构成的成像模块100。如图6所示,双摄像机组件116由两个方向差 90°的高分辨率摄像机120和120′构成。各高分辨率摄像机120和120′ 最好是线扫描或时间延迟积分(TDI)摄像机,以用于持续对移动的 传送带27成像。如图6所示,相位掩模106位于辅助镜头104之后 的孔径光阑中。小分光镜122置于相位掩模106之后的汇聚光束中, 它将图像分光束发送到检测器108和108′。该组件允许双摄像机通过 公用光路对传送带27成像。利用分光镜122可使各摄像机的视场 (FOV)完全相同,不同程度地重叠或者完全分开。在最佳实施例 中,双摄像机分别对传送带27的两侧(左和又)成像,其中各摄像 机视场仅有1%的重叠。从而,这种方法所取得的分辨率几乎是可获 得的最宽的高分辨率摄像机分辨率的两倍。
图7显示(图5所示)成像模块100的侧视图。除先前讨论的 部件之外,成像模块100还包括折叠镜202、204和206,用于将光 束从传送带27导向到辅助镜头104。如图7所示,传送带27上的物 体所反射的光沿着光束130传播,并首先被折叠镜202反射进成像 模块100中。光束130接着传到折叠镜204、主镜头102、折叠镜206、 直到双摄像机组件116。
图8说明电子模块200(图5)。如参考图5所进行的讨论,电 子模块200包括摄像机电子装置110、帧接收器112和处理器114。 如图8所示,摄像机电子装置110包括带编码器132、成帧控制处理 器134以及照明控制单元136。双摄像机120和120′分别将图像传送 给帧接收器112和112′,以便数字化。帧接收器112和112′处理图像, 作为响应,将摄像机控制信号反馈给摄像机120和120′。使用成帧控 制处理器134对带编码器脉冲执行倍频操作,以维持相对恒定的扫 描分辨率,从而使摄像机扫描与传送带运动同步。照明控制装置136 维持相对恒定的作为带速度函数的图像亮度,利用它,成帧控制处 理器134还控制摄像机120和120′的照度。然后,在将处理的图像传 送给模式识别系统62以进行其它处理之前,成像处理器114执行逐 象素的图像校正和分析,并将图像保存到(如图2和图4所示的) 图像数据库38中。本专业技术人员应理解,虽然被描述成包括单个 成像处理器114的系统,但可以采用任意数量的成像处理器114。例 如,如果采用两个成像处理器(分别用于摄像机120和120′),则它 们会就局部图像的传输进行通信和协调,以将图像跨双摄像机的场 图像“拼接”在一起。在任何情况下,图像解码操作的处理可以用 时域上的二维卷积运算来实现。但是,必须考虑在所需高分辨率下, 尤其是实际中采用最快传送带速度的情况下进行大型二维卷积对计 算吞吐量的要求。例如,最少需要1.5万亿次浮点运算(1500000百 万次浮点运算),才可对以500英尺/分钟速度运转的5英尺宽的传 送带执行64×64元素的卷积。为了降低计算量要求,所述实现方案 中的相位掩模106利用可分离的PSF(点扩散函数)来编码,该PSF 则利用两个正交的一维卷积来解码。在上述示例中,计算次数的减 少因子为32。
当(如图4所示的)模式识别系统62接收到数字化图像时,它 对捕获图像的亮度数据进行逐行分析,以定位预定的图案。虽然可 以使用任何数量的图案,但图9仅显示可用于本发明的四个图案示 例。如图9所示,图案46可以是机器可读代码46a、文本46b、重复 图案46c或图片46d。出于详细说明的目的,假定预定的图案46为 机器可读代码46a。因为图像捕获站60对传送带27的局部而非单个 包裹25成像,所以总是存在单幅图像中捕获局部图案的可能性。如 果模式识别系统62确定当前图像中仅捕获到部分图案,它会首先查 明在哪里可以找到该图案46的剩余部分(当前图像的顶部或是底 部)。如果在当前图像的顶部发现该剩余部分(表示在前一幅图像 中捕获到图案46的另一部分),它就会从图像数据库38检索出该 图案46的剩余部分并完成处理。如果模式识别系统62确定在当前 图像的底部发现模式46的剩余部分(表示尚未捕获到该图案的另一 部分),它就会把对该图案46的进一步处理推迟到捕获剩余部分时。 当模式识别系统62已经定位形成完整图案46所必需的所有图像时, 它会将分开的各部分拼接在一起以创建复合图案,于是处理将继续。
在模式识别系统62检测到机器可读代码46a之后,它判断代码 是否与路由标签对应,如果合适,就更新包裹记录数据库37中对应 的记录。如先前解释的,当模式识别系统62确定该机器可读代码46a 是路由标签时,则无需进一步的处理。
如果该机器可读代码46a不是路由标签,则包裹处理流程进到 表单识别系统64,其在表单40上定位参考标记48,并根据机器可 读代码46a和参考标记48的位置和朝向确定感兴趣的区域(ROI)。 然后从捕获图像中提取ROI,以作进一步的处理。与模式识别系统62 的情况类似,存在这种可能:虽然单个图像中捕获到一个完整图案 46,但ROI可能实际位于两个或两个以上连续图像中。如果表单识 别系统64确定多个连续图像才捕获到单个表单,处理将如先前参照 模式识别系统62所讨论的那样进行。即,表单识别系统64将访问 图像数据库38并检索先前所储表单的剩余部分或中止处理直到已经 捕获到完整的表单40。切记,ROI的尺寸随检测到的图案尺寸变化, 总之将受限于表单数据库78所存最大表单的尺寸。
下面将通过示例对模式识别系统62的工作机制作进一步说明。 图3所示的表单40代表将由图像捕获系统60捕获的典型表单。当 模式识别系统62接收到表单40的数字图像时,在模式识别系统62 中运行的处理器就分析从表单图像中捕获到的扫描数据,并尝试定 位表单40上的机器可读代码46a。一旦模式识别系统62定位到机器 可读代码46a,它就将图像传送给表单识别系统64,由其接着在表单 上定位参考标记48,计算ROI 49,从所捕获的图像中提取ROI 49所 界定的区域,并标识成像表单。
如图4所示,表单识别系统64访问表单数据库78以对成像表 单进行标识。无论何时将表单加入表单数据库78,就存储所有字段 的位置、字段特征、图案与参考标记的关系以及字段内的关系,以 供表单识别系统64访问。任何表单,甚至另一个供应商(例如UPS) 的也可以存储到表单数据库78中。在工作中,表单识别系统64将 观测的图案46与参考标记48之间的空间关系与表单数据库78中登 记存储的图案-参考标记关系进行比较来标识所捕获的表单。表单识 别系统64包括通用的高性能计算机,其与表单数据库78接口,用 于标识成像表单,以供字段处理系统66作进一步的处理。表单识别 过程可以利用表单40的任何物理特征,如字段位置、符号、或表单 尺寸来辅助标识过程。再者,如果表单40上的模式46是机器可读 指示符,则其内容也可以用作标识过程的一部分。如果表单识别过 程失败,则该图像被转送到异常处理站16进行人工处理。一旦已经 标识表单40,接着就将其身份和相关图像数据传送给字段处理系统 66。
除了从表单识别系统64接收成像表单及其身份,字段处理系统 66还接收成像表单上所有数据字段的位置、字段特征和字段内关系, 以辅助对成像表单的分析。字段数据可以是机器印制的、手写(印 刷体或草写体)但机器可读的、复选框式的或以上方式的组合。如 图4所示,字段处理系统66访问预印空运货单数据库72、词汇数据 库36、以及地址验证数据库76来对成像表单上书写的信息解码。基 础词汇信息既可用于字符识别又可用于验证处理字段,通过利用这 种基础词汇信息从而增强识别功能。一旦表单上的字段经过处理, 则系统会执行包裹-记录关联操作,其中,将包裹信息与包裹记录数 据库37中的现有条目相关联,或创建新条目。于是可以重新调用存 储在包裹记录数据库37中的信息,以便生成包含捕获信息的路由标 签。也可以生成这样的路由标签,它是引用捕获信息的标识符,或 者是以上所述两种类型的组合。接着通过物体(包裹)上存在的辅 助捕获机器可读代码46a将捕获的标签信息与含有表单40的物体(包 裹)相关联。此捕获操作由标签站18的操作员执行。它定位包裹记 录数据库37中存储的信息并生成路由标签。
图10是根据本发明的字段处理系统66的功能流程图。此系统 的要素之一在于其能够用词汇分析来补充专的OCR/ICR处理,以 便快速有效地识别未验证字符串的最佳匹配,或者标识出少数高频 候选项以供分别位于主或辅助控制站14a和14b的操作员检查。识别 引擎(OCR/ICR、条形码以及2D符号解码引擎等)的选择将由待处 理字段的特征来驱动。这种附加过程使上下文信息的使用与OCR/ICR 分析相配合,从而提高系统所取得的精确度。在有必要时,通过使 用安装特定的词汇信息来协助字段特定的识别过程,所述词汇信息 根据处理后的表单信息不断进行修正和优化。
这种词汇的一个示例可能是与某个特定用户所托运包裹的频繁 识别出的目的地相对应的美国(或其它国家代码)的城市名列表。 当系统判定一用户托运的包裹含有未经验证的字符串时,字段处理 系统66不是访问庞大的地址验证(ZIP+4)数据库76,而是访问相 当小且可管理的词汇,所述词汇是为该用户定制的,其包含最多大 约1000有效条目。
下面将会详述,本方法有两个阶段:(1)使用与识别引擎和词 汇一致的数据库,以动态处理字符串并消除歧义,或者得到有待操 作员分析的短的候选字符串列表(图10a);以及(2)根据处理过 的表单更新词汇(图10b)。
参考图10a,字段处理系统66首先判断解码的机器可读代码46a 是否与重复托运频率中等的托运人相关(步骤300)。在最佳实施例 中,将空运货单号预先分配给重复托运频率为中等的托运人,这些 托运人可以通过利用作为输入参数的解码机器可读代码46a访问预印 空运货单数据库72(图4)来加以识别。重复托运频率为中等的托 运人还有关联的数据记录被保存在词汇数据库36中(图4),这些 数据记录对应于该托运人最常用的包裹目的地。字段处理系统66访 问词汇数据库36以协助解码信息的验证。在某些情况中(例如,当 托运人从少数地址发送包裹时),可以将来自词汇数据库36的信息 直接复制到包裹记录数据库37中,以替代对表单数据解码的费时过 程。如果解码的机器可读代码46a与重复托运频率中等的托运人不相 关,则处理流程进入步骤306。另一方面,如果解码的机器可读代码 与重复托运频率中等的托运人相关,则处理流程进入步骤302,在步 骤302系统判断是否有单个源地址42与该解码的机器可读代码46a 相关。如果有单个源地址42与解码的机器可读代码46a相关,则处 理流程进入步骤304,从预印空运货单数据库72提取源地址。如果 没有单一源地址42与解码的机器可读代码46a相关联,则处理流程 进入步骤306。在步骤306,字段处理系统66利用最合适的识别引 擎(OCR或ICR)对源地址42解码,具体用哪种视待解码的数据格 式而定。接着处理流程进入步骤308,在步骤308字段处理系统66 利用识别引擎对目的地地址44解码。在步骤309,系统判断是否还 有字段要解码。如果有,则处理流程进入步骤310对下一个字段解 码。否则,处理流程进入步骤332(如图10b所示),在步骤332字 段处理系统66用解码表单的信息更新包裹记录数据库37。接下来在 步骤336,字段处理系统66更新并重新排列词汇数据库36中存储的 用户词汇数据,之后流程终止。
图11说明图10A所示步骤306、308和310中字段处理系统66 所执行的解码过程流程图。在步骤412,从成像表单40中读取期望 字段。然后在步骤414利用字段特定的识别引擎处理检索到的数据, 以验证检索字段中的信息。正如本专业技术人员所知,常规识别引 擎(I/OCR)仅逐字符分析输入字符串。当已对完整的单词进行了分 析,处理器将所分析的单词与拼写检查器比较,以作为一种进一步 验证逐字符分析的方法。一旦识别引擎已对数据进行了分析,则处 理流程进入步骤416,在步骤416字段处理系统66判断托运人是否 是以中等频率向同一目的地重复托运的那个人(步骤416)。如果托 运人不是以中等频率向同一目的地托运包裹的托运人,则将处理的 信息与地址验证数据库76所保存的信息作比较(步骤420)。否则, 将在步骤414中处理的信息与较小的词汇数据库36作比较(步骤 418)。将所分析的数据与合适的数据库中的条目进行比较,这提高 了正确分析词汇的可能性。
一旦将信息与词汇数据库36或地址验证数据库76中合适的记 录作了比较,字段处理系统66就判断所处理的信息是否构成一条有 效的条目(步骤422)。有效条目是与所选择的数据库中的某个条目 完全相同的条目,或是与某个条目充分匹配达到预定程度的条目。 如果在步骤422判断该条目是有效的,则解码过程完成。
如果在步骤422中评估的条目是无效的,则处理流程进入步骤 428,在步骤428系统从合适的数据库中检索相似的条目,然后根据 未验证信息的性质,将包含标识出的条目的记录发送到主控制站14a 或辅助控制站14b。如图2所示,主控制站14a都设在包裹分发装置 5,而辅助控制站14b可以设在提供对包裹处理系统10的网络访问 的任何位置。必须立即解码以创建路由标签的数据(例如源地址42、 目的地44等)被路由到现场的主控制站14a,而次要的(即不用于 创建路由标签的)数据被传送给场外的辅助控制站14b。一个装置的 主控制站可以是另一个装置的辅助控制站。如果控制站14的操作员 无法对信息解码,则将该包裹从传送带27上卸下并路由到异常处理 站16(步骤430),以对该包裹进行目视检验。否则,处理流程终 止。
将每个处理过的表单作为一个独立的数据记录处理。该数据记 录包含处理过的信息和/或由表单获得的图像信息。如果系统检测到 多个表单适用于同一个包裹的情况,则可为该记录补充对其它记录 的引用。此外,可以在记录中包含自动生成的记录标识符。这允许 使用访问捕获信息并用条形码或2D机器可读格式对其引用进行编码 的标准方法。它还允许希望跟踪在途包裹状态的用户方便地使用别 名服务器33(图2)。如前所述,当包裹25已经成像并经过处理, 就将从包裹25表面获取的数据填入包裹记录数据库37的条目。一 旦创建了包裹记录数据库的条目,用户就可对包含在包裹记录数据 库37中的包裹路由信息进行只读访问,以便跟踪包裹25从发源地 到目的地的进程。因为访问别名服务器33的用户一般不知道新近创 建的包裹记录数据库条目的记录标识符,所以别名服务器33提供利 用从包裹25表面检索到的任何信息定位包裹25的功能。例如,托 运人可以通过仅输入源地址42、目的地地址44、空运货单46a或它 们的组合从别名服务器33检索某个特定包裹的路由信息。虽然无法 单靠源地址42或目的地地址44来分离出特定的包裹,但是别名服 务器33提供标识满足输入条件的包裹集合的功能。
如图12所示,用户终端28最好包括主存储器500、显示装置510、 输入装置520(如键盘和定点设备(如鼠标轨迹球、笔、幻灯指示 器(slide pointer)或类似装置)、大容量存储装置540以及中央处 理单元(CPU)530,用于执行与检索和查看因特网上所存储的网页 有关的各种功能。这些部件通过系统总线或类似结构来进行通信。 此外,用户终端28最好连接到内置或外置调制解调器550或用于与 网络29通信的类似装置。此外,用户终端28还可以通过综合业务 数字网(ISDN)适配器和ISDN线路进行连接,以便与网络29通信。 用户装置28的大容量存储装置540维护因特网浏览器560,以指示 CPU 530执行与检索和查看因特网上所存网页有关的各种功能。
图13是根据本发明的别名服务器33的示意图。如图13所示, 别名服务器33包括主存储器600、显示装置610、输入装置620、大 容量存储装置640、CPU 630和内置或外置调制解调器650。又如图 13所示,大容量存储装置640维护包裹跟踪数据库660。一旦创建 包裹记录数据库条目,即从该条目中提取信息并将其复制到包裹跟 踪数据库660中的配对记录,以供访问别名服务器33的用户访问。 跟踪记录数据库660由有关在途包裹25的信息组成,可通过一系列 关联的网页在线访问。一旦用户访问包裹处理系统10的主页,则他/ 她将能够访问与该主页相关的所有包裹跟踪信息。单个页面一般以 超文本标记语言(HTML)页面的形式通过通信链路发送到请求用户 终端28上运行的WEB浏览器560。
为了说明根据最佳实施例的词汇的使用,图14显示始发地标签 和目的地标签样本。在此简化的字段处理示例中,有三种词汇。这 些词汇基于如下信息:街道级地址700、帐户特定的信息710、预印 空运货单号720、托运人信息42(如图3所示)、收件人信息44(如 图3所示)以及托运人-收件人历史730。如上所述,当字段处理系 统66从表单识别系统64接收到表单40图像以及解码的机器可读代 码46a时,它就访问词汇数据库36以判断预印空运货单号720是否 与重复托运频率中等的托运人相关联。如果是,则字段处理系统66 判断单个或少量的源地址42是否与该预印空运货单号720相关联。 如果较少数量的地址与该空运货单号720相关联,则字段处理系统66 就从预印空运货单数据库72提取地址。否则,它就利用合适的识别 引擎(O/ICR)对该地址解码。一旦源地址42被解码,字段处理系 统就再次访问词汇数据库36,以确认是否存在高优先级的托运人-收 件人历史730。实际上,字段处理系统66判断源地址中标识的托运 人是否常常向同一个地址托运。如果是,则识别引擎利用词汇数据 库对该目的地地址44解码。一旦已对该信息解码,则系统更新词汇 数据库36中的优先级,以反映先前处理过的表单。这样,与词汇数 据库36相关联的词汇反映了包裹处理方面托运人的最新趋势。通过 跟踪托运人行为,就可能按照各个托运人来选择优化的I/OCR-词汇 组合。如果托运人通常向大量不同的收件人发送,则对该托运人-收 件人词汇设置较低的优先级。这说明自适应推理如何影响将不同词 汇应用于特定字段或记录集的顺序。在应用时,利用字段间的关系 或字段内关系(如果这些作为表单登记选择的一部分存在),以及 现有经过验证的数据来处理信息。如前所述,这种关系在表单录入 时标识,并作为词汇选择过程的一部分。
还可能存在这样的情况:在递送包裹之前需要进行记录信息的 第三方验证。这种情况适用于与记帐有关的字段,如帐号和/或信用 卡信息。即,一旦模式识别系统62已对包裹作了处理,且已将机器 可读代码46a解码,则包裹处理系统10就可以尝试使记帐方法的认 证/验证安全可靠,以作为出具路由标签的前提条件。再者,还可能 存在这样的情况:构建记录需要表单上尚不具有的附加信息。这种 情况适用于其内容需要验证,以确保所提供的信息满足应用目标要 求的任何记录。一个示例是验证包含危险物品的包裹是否得到妥当 防护和正确包装
如图1所示,包裹25继续沿着传送带27移动,接下来经过标 签站18,在标签站18,操作员扫描机器可读符号46a以检索与成像 表单相关联的包裹记录数据库37。大多数情况都需要读取物件上的 条形码。当读取条形码时,就解码条目对包裹记录数据库37执行查 询。然后如果查找到该条目且所有需要的信息可用,就生成路由标 签。如果找到该条目,但没有足够的信息来生成路由标签,则生成 异常标签。在贴上异常标签之后,该物件被转送到异常处理站16。 一旦异常情况得到校正,就更新包裹记录数据库37的条目,并生成 新的路由标签并利用合适的打印机(如条形码打印机(未显示)) 打印。将路由标签贴到包裹上,由包裹装载站20的操作员利用来将 各表单及其相应的包裹正确地路由到正确的位置,并跟踪其进度。
在整个过程中,从将包裹置于传送带30上到包裹25到达标签 站18,包裹处理系统10不停地监视包裹的进程,并利用异常处理站 16校正可能发生的异常情况。异常处理站16实际是其它三种关键部 件(辅助图像捕获、主控制14a以及标签站18)的组合。出于这些 目的,异常包括如下这些情形:确实找不到表单(空运货单)图像, 标识出未登记的表单,OCR或ICR软件无法以高置信度对字符字段 解码,或以高置信度解码的数据存在矛盾(例如是不存在的地址)。 无论何时,只要识别出异常,就会通知操作员提供人工处理,创建 异常记录,或者二者兼有。
根据上文所述,应理解,显然本发明提出了一种用于读取包裹 信息的有效的系统和方法。本发明是联系特定实施例来说明的,在 所有方面,这些实施例都旨在说明而非限定。本专业技术人员应理 解,硬件的许多种不同组合均适于实现本发明。对于上述的每一种 部件,均可在市面上买到许多替代品,每种的成本和性能特性有所 不同。
虽然本发明许多方面被描述为存储在存储器中,但是本专业技 术人员知道这些方面还可以存储在其它类型的计算机可读媒体中或 从其中读取,如辅助存储设备,诸如硬盘软盘或CD-ROM、流行 的网络存储(carrier wave from internet)或其它形式的RAM或ROM。 类似地,本发明的方法可以用基于图10和图11所示流程图的程序 模块方便地加以实现。并未指定特定编程语言来实现上述各种过程, 因为考虑到充分公开上文所述及附图所示的操作、步骤和过程,以 允许本专业技术人员实现本发明。而且,存在许多可用于实现本发 明的计算机和操作系统,因此未提供适用于这些不同系统的任何详 细的计算机程序。特定计算机的每个用户应该知道对该用户的需求 和目的最有用的语言和工具。
存在未背离本发明精神和范围的各种备选实施例,这对本专业 技术人员来说是显而易见的。相应地,本发明的范围由所附权利要 求而非前述说明来限定。
QQ群二维码
意见反馈