通过验证矩阵进行视频编码的方法和设备

申请号 CN200480034087.9 申请日 2004-11-15 公开(公告)号 CN1894049A 公开(公告)日 2007-01-10
申请人 西门子公司; 发明人 W·罗森鲍姆; E·曼德勒;
摘要 本 发明 涉及用于分辨邮件上的非地址属性的一种系统和方法。本系统使用邮件分拣器来进行分拣并且使邮件扫描的获取变得便利。于是,由自动装置扫描图像以判断是否能够自动分辨非地址属性。倘若扫描不成功,则将图像转送到处理器,所述处理器对非地址属性进行功能分辨, 定位 样本属性,并且对它们进行排序,而且创建具有认知区中的样本属性的矩阵。所述矩阵被显示给编码者,所述编码者接着快速识别出所述属性与样本属性是否匹配。倘若不匹配,则创建具有下一个排序最高的样本属性的矩阵,并将其转送到编码者,直到不再有样本属性,其中整个图像被转送给编码者。
权利要求

1.一种用于对邮件图像的非地址属性进行编码的系统,包括:
-用于产生图像的装置;
-用于分辨所述非地址属性的装置;和
-用于产生包含未分辨的非地址属性和位于认知区中的样本非地 址属性的矩阵的装置。
2.如权利要求1所述的系统,其中
所述的用于产生图像的装置包括光学字符识别邮件分拣器,并且所 述邮件图像包括邮件的地址面。
3.如权利要求2所述的系统,其中所述邮件分拣器包括:
-被设置用于从料箱中移除邮件的馈送机构;
-被设置用于产生邮件图像的扫描仪
-被设置用于在分辨邮件的非地址属性期间临时容纳邮件的延迟 环;
-被设置用于在邮件上打印条形码的条形码打印机;和
-被设置用于使邮件分拣变得便利的分拣箱。
4.如权利要求1至3所述的系统,其中
所述的用于分辨非地址属性的装置包括至少一个被编程用来以高 置信度分辨非地址属性的处理器。
5.如权利要求4所述的系统,其中
所述的用于分辨非地址属性的装置还包括至少一个被编程用来以 功能置信度分辨非地址属性使得所述的功能度小于所述高的度的处理 器。
6.如权利要求1至5所述的系统,其中
所述的用于分辨非地址属性的装置包括至少一个被编程用来以功 能置信度分辨非地址属性的处理器。
7.如权利要求1至6所述的系统,其中
所述的用于分辨的装置包括光学字符识别装置或者模式匹配装 置。
8.如权利要求1至7所述的系统,其中
所述的用于产生矩阵的装置包括至少一个处理器。
9.如权利要求8所述的系统,其中
所述的至少一个用于产生矩阵的处理器是所述的至少一个用于分 辨非地址图像的处理器。
10.如权利要求8所述的系统,其中
所述的至少一个处理器包括用于以功能置信度分辨非地址属性的 装置、用于为可能使样本属性与非地址属性相匹配而查询数据库的装 置、和用于依照匹配置信度来排序查询结果的装置。
11.如权利要求10所述的系统,其中
所述的至少一个处理还包括用于产生相继的包含认知区中的样本 属性的矩阵的装置,所述相继的样本属性具有较低的置信度。
12.如权利要求11所述的系统,其中
所述系统还包括与至少一个处理器进行通信以便接收所述矩阵并 且利用样本属性与非地址属性之间的匹配的指示进行响应的至少一个 视频编码站。
13.如权利要求1至12所述的系统,其中
所述认知区位于所述矩阵中心。
14.如权利要求10所述的系统,其中
所述认知区包括成列的、成行的或单个的矩阵录入项中的一个。
15.如权利要求1至14所述的系统,还包括用于传递所述矩阵的 装置,并且所述系统还包括与至少一个处理器进行通信的以便接收所 述被传递的矩阵的至少一个视频编码站。
16.如权利要求15所述的系统,其中所述视频编码站包括:
-用于向编码者显示所述矩阵的装置;和
-用于从所述编码者接收通信的装置,所述通信指示在被分辨的 非地址属性与样本属性之间的关系。
17.如权利要求16所述的系统,其中
所述关系是匹配和不匹配中的一个。
18.如权利要求16所述的系统,其中
所述通信包括单个的指示器,所述指示器指示所有被分辨的非地址 属性与样本属性的关系。
19.如权利要求5所述的系统,其中所述的至少一个处理器包括 模式匹配处理器和逻辑处理单元,并且所述系统包括:
-至少一个数据库,所述数据库被设置用于与所述的至少一个处 理器进行通信,并且包括用于存储多个样本非地址属性且使得对其的 选择性检索变得便利的装置;和-条形码打印机,所述条形码打印机被设置用于与所述的至少一 个处理器进行通信以便在邮件上进行打印。
20.如权利要求1至19所述的系统,其中
非地址属性包括下列属性中的至少一个:邮票、图示、字母数字字 符、和标记。
21.一种用于分辨邮件上的非地址属性的方法,包括以下步骤:
-产生所述非地址属性的功能分辨;并且
-产生包含功能上被分辨的非地址属性和认知区中的样本非地址 属性的矩阵。
22.如权利要求21所述的方法,还包括以下步骤:
为所述样本非地址属性而搜索数据库;
-依照匹配置信度来排序搜索结果;
-将所述矩阵转送到至少一个视频编码站以便操作员进行编码;并 且
-产生包含认知区中的另外的样本属性的新矩阵,所述另外的样 本属性具有比所述样本属性更低的匹配置信度。
23.如权利要求22所述的方法,还包括以下步骤:重复转送及产 生的步骤,直到再也不能得到样本和另外的样本属性,并且在再也不 能得到样本和另外的样本属性时将邮件的图像转送到视频编码站。
24.如权利要求21至24所述的方法,还包括以下步骤:
-产生地址面的图像;
-判断非地址属性是否能够利用自动装置来分辨,并且
-如果所述非地址属性不能够利用自动装置来分辨,则产生所述 非地址属性的功能分辨。
25.如权利要求21至24所述的方法,还包括以下步骤:
-将操作员编码传送到条形码打印机;并且
-根据所接收的操作员编码在地址面上打印条形码。
26.如权利要求25所述的方法,还包括根据条形码来分拣邮件的 步骤。
27.如权利要求21至26所述的方法,还包括以下步骤:
-更新与标识条形码有关的信息;并且
-根据所更新的信息来分拣邮件。
28.如权利要求21至27所述的方法,其中操作员编码还包括以 下步骤,即将认知区中的非地址属性与所述样本非地址属性进行比 较。
29.如权利要求28所述的方法,其中所述认知区位于所述矩阵中 心。
30.如权利要求29所述的方法,其中所述认知区包括成列的、成 行的或单个的矩阵录入项中的一个。
31.如权利要求21至30所述的方法,其中
所述非地址属性包括下列属性中的至少一个:邮票、图示、字母数 字字符、和标记。

说明书全文

发明涉及邮件处理领域,并更具体地涉及用于分辨邮件项的地址 面上的非地址属性的一种系统和方法。

在此所使用的非地址属性包括:邮票、图示、字母数字字符、固定 格式的和无格式的原文区域、邮政背书、标志和标记等等,非地址属 性的分辨对于各个邮件的高效分拣以及对于诸如邮件转寄和返回发送 者功能等相关应用是期望的和/或必需的。

当前及先前的属性分辨系统通过光学字符识别软件(OCR)执行自 动地址读取。在德国专利DE 195 31 392 C1中展示了一种示例性系统。 理想地,当前的邮件处理自动化包括非地址属性识别的某种形式。但 是,非地址属性不服从当前的自动化规则,这包括在许多非地址属性 侯选者中缺少冗余和标准化。因此,利用当前的分辨技术,拒绝和错 误率比利用地址属性分辨时更高。如利用地址属性一样,在当前自动 化分辨装置遭遇到不可分辨的非地址属性时,包含不可分辨属性的图 像被转送到视频编码者以进行人工分辨。按照标准编码者技术,坐在 视频编码站前的视频编码者接收显示器(典型地为计算机监视器)上 的图像,为缺少的/不可分辨的属性而分析所述图像,并且人工地键入 或输入不能另外自动获取的信息。置信阈值被用来判断何时还未分辨 一个属性,并且必须对整个图像进行人工编码。

为了协助编码者,已经提出多种方法,其中令编码者注意所述图像 的特定部分(感兴趣的区域),在所述特定部分中(该方法)相信存 在不可分辨的属性。附加地,在一些情况下已经将编码者的信息通信 缩减为单次击键。但是,尽管有这样的辅助,人工编码仍然是低效的 解决方案,因为时常要求缩放和其他人工扫描,并且信息不总是能够 利用单次击键来传递。已经做出了尝试使人工解码更高效,其方式是 减少编码者为获得非地址属性图像位置所要求的步骤的数量,以及减 少分辨要求的击键数量。由美国专利5,455,875所提出的一个解决方 案包括证实表(truthing table)的使用。在证实表中,以矩阵格式 呈现图像的多个部分。按照上述专利的证实矩阵包含通过识别逻辑所 认为的那样所群集的不可分辨属性。该意见是基于不可分辨属性的部 分分辨率,其中部分分辨率低于置信阈值。在图1中描绘了来自’875 专利的现有技术矩阵(为了清晰起见具有参考数字)。矩阵录入项) 包括不同的背景以指示操作员在哪里标记了不匹配。

如图1所示,在计算机屏幕22上将矩阵10呈现给观看者。所述 矩阵包括多个其中具有或描绘“0”的框12。由操作员标记的例外被示 为具有阴影背景,并且示出“6”(单元14)、“L”(单元20)和“5” (单元18)。图1的矩阵被限制在区分单个的、操作员易识别的字母 数字字符的应用中。同样地,非地址属性不仅仅包括由’875对比文献 所分析的单个数字,并且通过该方法不能高效地处理复杂的特别(ad hoc)模式类别。因此,需要通过识别复杂的非地址属性来提高邮件分 拣。

发明概要

本发明的一个目的是,提供邮件处理自动化所要求的更有效地对非 地址属性进行视频编码的一种系统和方法,并且更具体地,在减小用 于对非地址属性进行视频编码的现有方法的操作员错误率的同时增加 生产率。一个附加的目的是,要说明的基本系统和方法能够以应用方 式超出非地址属性的先前所提及的实例(即邮票类别和背书),以便 包括模式的筛选,看它们是被结构化的(诸如常规的字母表)还是任 意的形状分类。又一个目的是,通过让编码操作员接触非击键密集的 任务和使用操作员认知智的方面的任务,来增加编码操作员的工作 满意等级。这些和其他的优点可以通过本发明得到。

本系统包括用于执行上述发明方法的装置。本系统包括用于处理邮 件的馈送机构,所述馈送机构包括用于将邮件送过高分辨率扫描仪或 类似的图像获取设备的装置。由扫描仪所创建的图像被转送到至少一 个用于分辨的处理器。倘若所述非地址属性是不可分辨的,则考虑第 二处理器和数据库以创建前述的矩阵,但是本矩阵包括一个认知区。 所述认知区包括样本非地址属性,其可能匹配于未分辨的非地址属 性。所述认知区位于中心并且可以包括单个录入项或成列或者成行的 录入项。接着,所述矩阵经由适当的装置被转送到多个视频编码站中 的一个以进行解码。本发明也包括一种利用上面提及的系统来执行非 地址属性分辨的方法。根据本方法,创建图像,并且通过自动装置来 分辨所述图像中的非地址属性。判断自动分辨是否成功。成功的判断 是超过特定阈值的判断。与给定的属性类具有识别类似但低于成功识 别阈值的未成功分辨的属性被分派给为所述属性类所指定的矩阵。将 包括样本属性的认知区插入到矩阵,并且将矩阵转送给编码者以进行 人工编码。通过将未分辨的属性与被认为匹配的样本属性进行匹配来 获得认知区中的样本属性,其中所述匹配根据置信等级加以评定。因 为初始分辨的置信等级不高,所以不总是保证认知区中所显示的样本 属性将匹配于未分辨的属性。如果编码者指明未分辨的属性不匹配于 认知区中的样本属性,则主题拒绝属性(subject reject attribute) 根据其下一个最高可能性识别被再次评估,并且作为候选者之一被插 入具有认知区的第二矩阵中,其中所述认知区包括与该新的识别替代 者相关的样本。本方法包括下面详述的其他步骤。

当指明不匹配时,利用具有下一个最高匹配置信等级的样本属性来 创建第二矩阵。第二矩阵被呈现给编码者以进行人工匹配。对于附加 的矩阵,这一直发生直到匹配置信等级低于预先设置的阈值;在此时 将整个图像呈现给编码者以进行人工编码。

附图的多个视图的简要说明

在下面的权利要求中列出了被认为是本发明特性的新颖特征和方 法步骤。但是,当结合附图进行阅读时,发明本身及其另外的特征和 优点通过参考详细说明被最好地理解,在所述附图中:

图1描绘了现有技术的不具有认知区的矩阵;

图2以示意形式描绘了本系统;

图3a和3b描绘了本方法的流程图

图4描绘了具有包括单个中心录入项的认知区的3×3矩阵;

图5描绘了具有包括中心列的认知区的5×5矩阵;

图6描绘了具有包括中心列的认知区的5×4矩阵;

图7描绘了具有两个不匹配的非地址属性的5×4矩阵;

图8描绘了具有一个不匹配的非地址属性的5×4矩阵;

图9描绘了具有认知区中的来自图8的另一样本属性的5×4矩阵; 并且

图10描绘了包含样本不可分辨的非地址属性的图像。

发明详述

图2描绘了根据本发明的非地址属性分辨系统的示意图。如所示 的,本系统包括用于移除及分拣邮件或邮件项102的邮件分拣器100。 当自动分辨或通过编码分辨非地址属性时,邮件分拣器能够分拣邮 件。

邮件分拣器100包括馈送机构104,所述馈送机构104从料箱106 中拉出连续的邮件102。邮件102被传送到高分辨率视频扫描仪108, 以便自动扫描邮件地址面110并产生其图像112。通过现有技术中已知 的装置可以按每秒大约10封邮件的速率来传送邮件102。尽管在此讨 论邮件地址面的扫描,但这应被理解为本发明的一个实施方案,而另 一实施方案包括邮件的非地址面的扫描。

所述图像112被送至OCR和模式匹配单元114。单元114包括互连 的至少一个微处理器122、存储器124、和地址寄存器或数据库126, 以便以高的置信度自动地分辨及解码图像122。通过本领域技术人员已 知的应用来设置被视为“高”的实际等级。高置信度分辨包括地址属 性和非地址属性两者的分辨。地址属性包括指出邮政地址或目的地地 址的字母数字字符。非地址属性包括邮票、图示、字母数字字符(即 背书)、标记等等。

在单元114处的图像分辨之前以及与之同时地,在延迟环116中 保持邮件102。如果图像应能够以高置信度被分辨,则在打印机118 处将条形码打印到邮件上,并且所述邮件被转交到分拣箱120,在那里 借助于条形码进行进一步分拣。未成功读取的图像被存储在数据库127 中。

处理器128被设置为与数据库127和处理器114进行通信。如处 理器114一样,处理器128接收图像并对其进行分辨。但是,利用处 理器128,从数据库127取出或接收所述图像,并且所述分辨具有较低 或功能置信度。在一个可替代的实施方案中,更低或功能度分辨可以 通过处理器114来实现。功能置信度是这样的置信度,在其中很可能 或可能识别非地址属性的一般性质到如此的程度,以致找到形式为样 本非地址属性的可能匹配。一旦获取,就为可能的匹配而将功能度与 数据库127中所存储的样本属性进行比较。为了使之变得便利,搜索 数据库127以寻找最可能的匹配,这些匹配根据它们的匹配置信度进 行排序。典型地,假设置信度较低(过程从该置信度开始),则确定 多于一个的可能匹配。可替代地,数据库126可以替代数据库127。典 型地,所述搜索将产生匹配置信,因为所述匹配可以是至少处于所述 功能等级。最后,处理器128包括适当的用于创建矩阵的程序设计, 其中所述矩阵包括认知区。功能的非地址属性占据除认知区以外的矩 阵,而该认知区被样本属性所占据。接着,新创建的矩阵被转送到一 个顺序分拣单元130以进一步传递到多个视频编码站132中的一个。 作为实例,示出四个视频编码站132。视频编码站132可以经由局域网 134被联网。条形码打印机136被包括在内并且被设置为与分拣装置 130进行通信。在运行中,当未成功读取图像时,打印机136在各个邮 件上打印一个跟踪(TID)条形码,所述邮件接着被送到适当长的延迟 环以使得能够人工/在线地分辨,或者被特别地保持以使得能够离线地 分辨。如现有技术中已知的,TID条形码使得邮件稍后能够例如经由箱 120重新加入成功读取的处于分拣中的邮件。作为实际打印条形码的 TID打印机的替代,可以使条形码打印机118打印条形码,如图2所示。 如果视频编码者应指出在被分辨的非地址属性与认知区中的样本非地 址属性之间出现不匹配,则令处理器128创建具有另一属性的第二矩 阵,其中所述另一属性具有更低的置信度。如果应出现又一次不匹配, 则产生另一个矩阵,这样直到不再有样本属性可被得到。在此处,将 整个图像展示给编码者以进行人工编码。

图3描绘了用于对未成功读取的非地址属性进行分辨的本方法的 流程图。未成功读取的图像112被存储在数据库127中,并且所述方 法采用这个图像开始(步骤200)。

在步骤202处,分析不可分辨的非地址属性。假设所述信息是不 可自动读取的,则在此使用较低的识别等级。在步骤204处,将现在 在某种程度上被分辨的非地址属性与合适的属性类别相匹配或相关 联。该步骤通过以下子步骤实现,即搜索不同的可用的类别并且确定 哪个类别和/或属性最好地匹配,这在功能上被分辨的属性方面是已知 的。根据匹配置信度排序所述类别和样本属性(分辨允许)。

在步骤206处,创建一个验证矩阵,所述验证矩阵包括设置在认 知区中的适当匹配属性类别的多个属性。矩阵和认知区可以依据应用 而在大小上变化。在步骤208处,所述矩阵被存储在上面提到的数据 库中的一个(即数据库127)中。

在步骤210处,经由上面所述的装置将所述矩阵转送到至少一个 视频编码站132。

在步骤212处,所述矩阵被显示给编码站操作员。所述操作员接 着指出哪里存在匹配或应用上的不匹配。如果所有未分辨的非地址属 性应匹配于样本属性,则在编码者处有一个选项以便通过单次击键来 指明这一点。这种指明可以通过已知的人机接口来实现。在步骤214 处,接受或不接受被所述操作员指明,并且被传送到处理器128。

在步骤216处,判断是否指明不匹配。如果指明匹配218,则所述 方法经由连接器D 252到下面列出的步骤240。如果未指明匹配220, 则所述方法经由连接器A 222/224继续。

在步骤224处,所述方法继续到一个判断。在步骤226处,判断 是否还有未试过的可用于矩阵的样本属性。如果不再有样本属性230, 则在步骤234中将包含未分辨的非地址属性的图像转送到编码者。

在步骤238处,编码者的匹配指示被传送给数据库128。

在步骤240处,打印条形码或者更新TID以反映在由编码者使用 对非地址属性的分辨的情况下所达到的最终决策。因此,所述邮件可 以被分拣。

在步骤242处,判断是否有其他的要分辨的邮件图像。如果不再 存在248,则所述方法结束250。如果存在附加的图像244,则所述方 法经由连接器C 246返回到开始200。

返回步骤226,如果确定存在附加的样本属性可用,则创建一个包 括认知区中的新样本属性的新矩阵,并且所述方法经由连接器B 236返 回到步骤208,由此将新矩阵视为先前的矩阵。

图4描绘了具有认知区302的3×3矩阵300,所述认知区302是位 于矩阵300中心的单个样本属性。非地址属性是一面美国国旗。在此, 编码者将按下单个键,这指明整个矩阵300匹配于认知区302属性。

图5描绘了具有认知区502的、美国国旗的5×5矩阵500,所述认 知区502是穿过矩阵中心的一列。再一次,解码者将通过单次击键来 指明整体匹配。可替换地,编码者可以利用指示器和鼠标点击来突出 匹配或不匹配。也可以使用本领域技术人员预想的其他这样的指示方 法。

图6描绘了将被显示在计算机监视器602上的5×4矩阵600。认知 区604穿过矩阵中心。矩阵600包括具有所有匹配的美国国旗,所述 匹配又可以利用单次击键来指明。

图7描绘了邮票的5×4矩阵700,所述邮票描绘了乔治华盛顿。所 述矩阵在其出现在计算机监视器702上时被描绘。认知区704是穿过 矩阵中心的一列。在此有两个不匹配的属性706。编码者将通过人机接 口(诸如击键或鼠标指示器)指明不匹配。

图8示出了在计算机监视器802上所描绘的美国国旗的5×4矩阵 800,所述矩阵800具有向下穿过中心的认知区804。在此,单个的属 性806是不匹配的。在运行中,将利用另一个可能与属性806相匹配 的样本属性来创建另一个矩阵。最初考虑美国国旗的当前样本属性, 因为不匹配属性806的取消包括类似于该旗的波浪线。

图9示出了在计算机监视器902上所描绘的圣母玛利亚和孩子的 5×4矩阵900,所述矩阵900具有向下穿过中心的认知区904。在此, 展示出匹配,并且本发明将根据匹配指示而打印适当的条形码,分拣 邮件以及返回到开始处。图10描绘了不可分辨的非地址属性的整个图 像,所述图像在用尽所有样本属性的情况下被描绘给编码者。

上面已经提出的本发明将在附带的权利要求书中被进一步列出。上 述说明是本发明的一个实施例,所述实施例未解决不背离本发明精神 的其他实施例和使用的可能性。例如,本申请可以被用于分辨邮票、 不同分类的信件和/或号码和/或图片、签名、标记等等。

对相关申请的交叉引用

本发明要求2003年11月18日提交的美国临时专利申请序列号 60/520,658和2004年7月7日提交的美国专利申请序列号 10/885,125的优先权,其在此被引入作为参考。

发明背景

QQ群二维码
意见反馈