首页 / 专利库 / 专利权 / 国际局 / 公报 / 住址识别方法、住址识别装置及纸件类自动处理系统

住址识别方法、住址识别装置及纸件类自动处理系统

阅读:212发布:2020-07-19

专利汇可以提供住址识别方法、住址识别装置及纸件类自动处理系统专利检索,专利查询,专利分析的服务。并且一种地址识别方法与装置,它无需登记庞大数量的街名而能高速、高 精度 地识别地址。它有对图象提取出的输入文字列逐字地选出并把各字与预先登记有文字信息的字库105的内容对照而进行文字识别的文字识别部104;根据文字识别部104中的文字识别结果而对输入文字列中各字的字种进行判定的字种判定部106;将输入文字列从头依次地检测其字种、检出街名码及住址表示号,并将检出的街名码及住址表示号合并作为住址加以识别的住址识别部107。,下面是住址识别方法、住址识别装置及纸件类自动处理系统专利的具体信息内容。

1.一种住址识别方法,其特征在于,对表示住址的含有与纸件 上所记载的街名等对应的街名码、地域名及住所表示号的输入文 字列进行图象提取,
对此图象提取的输入文字列进行逐字地选出,并分别将该文字 与预先登记了文字信息的字库內容进行对照比较而进行文字识别,
根据此文字识别的结果检出上述街名码及上述住所表示号,
把所检出的街名码及住所表示号组合在一起作为住址加以识 别。
2.如权利要求1所述的方法,其特征在于,根据上述文字识别结 果判定上述输入文字列中各文字的字种,对上述输入文字列从其开 头部分依次地进行字种检测以检出街名码及住所表示号。
3.如权利要求1中所述的方法,其特征在于,设置预先登记有与 街名码相对应的街名文字数的第1表及预先登记有市区名的第2表, 根据上述文字识别结果检出街名码,用上述第1表来检索与该街名 码对应的街名文字数,根据上述文字识别结果用上述第2表来检索 构成上述输入文字列的市区名,再根据由此检索出的街名文字数及 市区名对住所表示号进行检索。
4.如权利要求3所述的住址识别方法,其特征在于:在上述第2 表中所载市区名中预先指定的特定地域的市区名上附加街名标志, 对于检出的市区名附加有街名标志的场合,根据上述文字识别结果 及检出的市区名,用预先登记有与附加街名标志的市区名对应的街 名及与该街名所对应的街名码的第3表来检索对应于输入文字列中 记载的街名及与该街名所对应的街名码、再根据检出的市区名及 街名来检出住所表示号。
5.如权利要求4所述的住址识别方法,其特征在于,根据每个地 域所处理纸件的多少预先指定附加街名标志的特定地域。
6.一种住址识别装置,其特征在于,它设有
把表示住址的、含有对应于纸件上记载的街名等的街名码、 地域名及住所表示号的输入文字列进行图象提取的图象提取部件,
把由该图象提取部件所图象提取的输入文字列逐字地选出,并 分别把该文字与预先登记有文字信息的字库內容对照比较并进行 文字识别的文字识别部件,
根据在文字识别部件中对输入文字列的文字识别结果对上述 街名码及上述住所表示号进行检出的检出部件,
把在该检出部件中检出的街名码及住所表示号组合在一起作 为地址来进行识别的识别部件。
7.如权利要求6所述的地址识别装置,其特征在于,上述检出部 件设有根据上述文字识别部件的文字识别结果对上述输入文字列 中各字的字种进行判断的字种判定部件,
通过对上述输入文字列从开头部分起依次地进行字种检测而 检出街名码及住所表示号。
8.如权利要求6所述的住址识别装置,其特征在于,上述检出部 件设有预先登记有与街名码相对应的街名文字数的第1表与预先登 记有市区名的第2表,
根据上述文字识别部件的文字识别结果检出街名码,用上述第 1表对与该街名码相对应的街名文字数进行检索的街名文字数检索 部件,以及根据上述文字识别部件的文字识别结果用上述第2表对 构成上述输入文字列的市区名进行检索的市区名检索部件;
根据上述街名文字数检索部件中检出的文字数与在上述市区 名检索部件中检出的市区名来检出住所表示号。
9.如权利要求8所述的地址识别装置,其特征在于:在上述第2 表中所登记的市区名中预先指定的特定地域的市区名上附加街名 标志,
在上述市区名检索部件所检索的市区名上附有街名标志的场 合,根据上述文字识别部件的文字识别结果及上述市区名检索部件 检索的市区名,利用预登记有与附加上述街名标志的市区名相对应 的街名、及与该街名相对应的街名码的第3表,对上述输入文字列 中记载的街名及对应于该街名的街名码进行检索的街名检索部件,
根据在上述市区名检索部件中所检索的市区名及在上述街名 检索部件中检索的街名而检出住所表示号。
10.如权利要求9所述的住址识别装置,其特征在于:根据每个 地域处理纸件的多少来预先指定附加上述街名标志的特定地域。
11.一种纸件类自动处理系统,其特征在于,它设有用权利要求 1中所述的住址识别方法从输送的纸件上所载的、表示住址的输入 文字列来识别住址的住址识别装置,
把由该住址识别装置识别的住址变成条形码并打印在上述纸 件上的条形码印字装置,以及
对用该条形码印字装置印有条形码的纸件按照所印的条形码 进行处理的处理装置。 ~47,用于USPS自动地址读出分拣机(1985))公开了。    
至于设置有对纸件上所载文字进行扫描、把扫描图形作为单 词单位而进行提取的单词提取装置,和存有表示住址的预先设定地 址库图形的存贮装置,以及把由单词提取装置所提取的单词按纸件 上记载顺序进行排列并与地址库图形进行比较的比较装置,借助于 选出与在该比较装置中的比较结果最接近的组合而识别地址的方 法,已在例如特公昭62-62388号公报中公开了。
然而,在这种过去的住址识别装置中,必须把作为读出对象的 全部地名都记录在地址库中。例如,对于日本,都道府县市区名约 3000个,若再包含街名约有120000个,若要记录这么多地名则地址 库存贮内容就相当庞大了。因为,存在着使装置规模变大的问题。 此外,还由于要进行对照比较的件数太多,有处理速度非常慢的问 题。
为了解决这样的问题,本发明的目的是提供一种不登记庞大数 量的街名而能高速、高精度地读出住址的住址识别方法与住址识 别装置。还提供一种能进行把所读出的地址变成条形码,并打印处 理在纸件上的纸件类自动处理系统。
为了实现此目的,第1发明(权利要求1所述的发明)与第6发明( 权利要求6所述的发明)是对纸件上所载的街名所对应的街名编码, 表示含有地域名(都道府县市区街名)及住所表示号码的住址的输 入文字列进行图像提取,对图象提取出的文字逐字选出并把各个文 字与记录有文字信息的字库內容进行对照比较以预先对该文字进 行识别,根据该文字识别的结果检出街名编码与住所表示号码,结 合此检出的街名编码与住所表示号码来进行地址识别。
第2发明(权利要求2所述的发明)与第7发明(权利要求7所述的 发明)是在第1发明与第6发明中,根据文字识别的结果而判定输入 文字列中各字的字种,并把输入的文字列从起始部分依次进行字种 检测而检出街名编码与住所表示号的。
例如在第2与第7发明中,依据文字识别的结果来判定输入文字 列中各文字的字种(汉字、数字、符号等的不同),从起始部分开始 对输入的文字列依次进行字种检测,把最初的数字或符号的连续部 分视做街名码,再依据字种的变化,例如输入文字列从汉字变为数 字或符号的变化而把其数字或符号作为住所表示号检出。
第3发明(权利要求3所述的发明)与第8发明(权利要求8所述的 发明)是在第1与第6发明中设置预先登记与街名编码对应的街名文 字数的第1表与预先登记有市区名的第2表,按照文字识别结果检出 街名码,并用第1表对对应于街名码的街名文字数进行检索,按照文 字识别的结果用第2表对构成输入文字列的市区名进行检索,由此 检索出的街名的文字数与市区名来检出住所表示号码。
例如,在第3与第8发明中,按照文字识别的结果而把数字或符 号连续部分看做是街名码,用第1表对与该街名码对应的街名文字 数进行检索,再根据文字识别结果,把构成输入文字列的市区名在 第2表中进行检索,然后,按照从第1表中检出的街名文字数与从第 2表中检得的市区名来检出住所表示号的开始位置,并把从此开始 位置以后的文字列作为住所表示号码。
第4发明(权利要求4所述的发明)与第9发明(权利要求9所述的 发明)是在第3与第8发明中在登记到第2表中的市区名內所预先指 定的特定地域中的市区名上附加街名标志,在检索到的市区名上附

说明书全文

发明系关于纸件类分拣机中的高速、高精度地读出纸件类 上所记载住址的住址识别方法与住址识别装置,以及把其所读出的 住址变换成条形码并在纸件上打印等处理的纸件类自动处理系统。

参照图17对过去的住址识别装置加以说明。在此住址识别装 置中,首先在图像提取部121中输入纸件上所记的文字图形并将其 变成图像信号,提取与图象信号中的住址相符的文字图形。然后在 文字识别部122中,对图象提取部121中所提取的文字图形进行文字 选出处理,再在文字识别部122中,把字库123中预存的文字与选出 文字逐个地对照比较而进行文字识别。

然后,在单词识别部124中对文字识别部122所识别的文字列, 从收藏着预存单词的单词库125中读出单词,将其读出的单词与识 别的文字列进行对照比较而进行单词辩认,再由住址识别部126,把 从预存有住址的住址库127中读出的住址与单词辨认部124所认出 的单词比校对照而进行住址识别。

有关把作为读出对象的地址名称预先登记在住址库中、把从 纸件上的文字列的读出结果与从住址库中读出的地址名称对照比 较而辨认地址的方法,已在例如特开平2-181287号公报与USPS所用 的自动地址读出分拣机中(NEC技报,通卷187号、Vol.38,N04,P41 加有街名标志的场合下,根据文字识别结果与检得的市区名用预先 登记有与对应于加有街名标志的市区名的街名以及对应于其街名 的街名码的第3表对输入文字列中所记载的街名以及对应于该街名 的街名码进行检索,并根据检得的市区名与街名而检出住所表示号 码。

第5发明(权利要求5所述的发明)与第10发明(权利要求10所述 的发明)是在第4与第9发明中,依照各地域所处理的纸件的多少来 预先指定附加街名标志的特定地域的。

第11发明(权利要求11所述的发明)是用第1发明的住址识别方 法从表示输送纸件上所记载的住址的输入文字列来识别住址,把此 识别的住址变换成条形码并打印在上述纸件上,再根据所打印的条 形码对打有条形码的纸件进行处理。

图1是本发明第1实施例结构方框图

图2表示在纸件上所记载住址的一例视图,

图3表示文字库的一例视图,

图4是说明第1实施例动作的流程图

图5表示输入文字列与文字位置P(i)的关系,字库号D(j)与字 库、类目、字种之间关系、以及从r(i)中所存的比较结果的类目、 文字辨认部输出的文字识别结果的视图,

图6表示字种与类目的关系,从f(1)~f(m)中所收藏的最终结 果的类目、字种判定部输出的字种判定结果的视图,

图7是本发明第2实施例结构的方框图,

图8表示街名文字数表的一例视图,

图9表示市区名表的一例视图,

图10是说明本发明第2实施例动作的流程图,

图11是本发明第3实施例的结构方框图,

图12表示市区名表的一例视图,

图13是表示街名表的一例视图,

图14是说明第3实施例动作的流程图,

图15是举例表示进行把所识别的住址变成条形码并打印在纸 件上这样处理的邮件自动处理系统的概要图,

图16是中国与韩国邮件的示例图,

图17是过去的住址识别装置结构方框图。

下面,详细说明本发明的实施例。

纸件上所记载的住址,例如在日本,是由对应于市区名的邮政 编码、都道府县市区街名与住址表示号码等组成的,一般地都道府 县市区街名大致是汉字,地址表示号码则表示为数字与标记符号。 在下面说明的实施例中,是把与街名对应的数字等组成的编码(下 称街名码)附加在住址的开头。下面,把含有这种街名码、都道府 县市区街名与住所表示号的称为住址。

此外,住址的一例示于图2中。图中,1A为街名码,1B为市区名/ 街名,1C是住所表示号码。在此地址例中,街名码1A的前3位数即“ 183”相当于现在给定的邮政编码,在此情况下是表示“府中市”, 而街名码1A的后3位即“123”为街名,是对应于“日新町”的。

实施例1

下面,参照附图来说明本发明的第1实施例。

在此实施例中,对相当于住址的输入文字列逐字地进行文字识 别,并依据识别的结果判定字种(汉字、数字、符号等)。然后从输 入文字列的开头依次地检测字种,首先把数字或符号的连续部分看 做街名码,再检出字种从汉字转换为数字或符号的位置,把其以后 的部分看做住所表示号。结合此街名码与住所表示号来识别住址。

图1是实施例1的结构方框图,图象提取部101把纸件上的文字 或符号等变为电气图象信号。

地址位置检出部102检出在图象提取部101中变成的图象信号 的文字列的长度、方向与列的数等信息,根据所检出的信息而检出 与纸件上所载住址相符的文字列。作为这种住址位置检出技术,可 以考虑采用例如本申请人的特公昭59-39065号公报中所公开的技 术。

在特公昭59-39065号公报中,以一定的宽度范围扫描匀速输送 邮件的记有收件人姓名地址的一侧,把由此而得的文字列进行每隔 一定期间进行压缩并检出由此而得的经一定期间压缩的文字列的 起始与终点位置,再对由此而得到的压缩文字列组合的邮件上的收 件人姓名地址组及它的行、位置、文字大小及行的斜度等进行判 别。

文字选出部103是对作为住址而检出的文字列进行逐一地选出 处理。作为这种文字选出技术可以考虑采用例如本申请人的特公 昭63-57831号公报中所公开的技术。

特公昭63-57831公报中,在把输入操作信号沿与扫描线方向垂 直的方向进行压缩并更新的同时,依次存贮压缩的扫描信号中每个 文字模的压缩幅度,并将压缩的扫描信号与输入扫描信号进行比 较,对于压缩的连续文字模块所对应的输入扫描信号中不表示文字 的部分场合所作的文字选出动作进行检测,并读出以文字选出的同 步状态所存贮的压缩幅度。

文字识别部104把选出的文字与预先记入的文字库105进行比 较,以辨认所选出的文字。在文字库105中事先记入了约3000个汉 字、数字与符号等,文字识别部104中的文字识别结果是以例如JIS 码形态输出的,即,对于选出的文字为“1”与“府”的情况下,文 字识别部105中的文字识别结果分别以JIS码的“2331”与“495C” 输出,作为这种文字识别技术,可以采用本申请人提出的特开平1 -94490号与特开平2-137080号公报中所公开的技术。

在特开平1-94490号公报中,把识别用字库中同一类目的标准 图形模块化,在该类目內使中途停止对照的设定值逐次变小地予以 更新,而且在其不一致为0时中止该类目的对照,然后把对于1个类 目的1个最小不一致数作为结果来输出。

在特开平2-137080号公报中,从特征图形存贮部中读取特征图 形信号,从参考图形存贮部中读取各读出对象字种的每个参考图形, 在求特征图形各部分领域与参考图形上对应部分领域之间的不同 度时,把附加了记述特征图形各部分领域特征的各方向的特征系列 与对于各特征系列相邻部分领域上的邻接的特征系列的一部而得 到的系列以附加多个的方式形成多种类的特征系列,在各方向上, 在原特征系列与所形成的多种类特征系列的每一个和与原特征系 列对应的参考图形的特征系列之间进行非线性耦合,由于各方向的 非线性耦合的评定值是把其最小值的总合定为部分领域之间的不 同度,由此就确定出文字图形与各字种参考图形之间的不同度,根 据此不同度进行分类,并把所分出的结果加以输出。

字种判定部106是依据从文字识别部104输出的住址所用的文 字的辨认结果来判定字种(汉字、数字、符号等),即,当文字识别 部104中的文字识别结果以JIS码输出时,其JIS码若是2300号位(编 码的前3位是233)则判定该文字是“0”~“9”的阿拉伯数字,若 JIS码在3000号位以上(编码的第1位在3以上)则判定该文字是汉字。 对于标记符等符号也同样地进行判定,图3表示字种判字结果的一 例。

地址识别部107则首先按照字种判定部106中的判定结果对与 住址对应的输入文字列从其开头部分依次地检测其字种,并把数字 或符号的连续部分视做街名码而予以暂时存贮。再检出输入文字 列的字种从汉字到数字的转换点,即检出住所表示号的开始位置, 并把此开始位置以后的数字与符号视为住所表示号,然后,结合暂 时存贮的街名码与住所表示号来识别住所。

下面,再对这种住址识别装置作具体的说明。

在纸件上,例如,像图2所示的相当于住址的文字列记载为“ 183-123府中市日新町1-10”,此文字列是由住址开头所记载的街 名码1A,都道府县市区街名1B及住所表示号1C组成的。

首先,图象提取部101把该纸件上的文字与符号等转换为图象 电信号(图4所示的步骤401)。此提取出的图象信号被输给住址位 置检出部102,住址位置检出部102检出住址位置(步骤402),并提取 与住址相当的文字列,即“183-123府中市日新町1-10”的图象 信号。

然后,把住址位置检出部102中所提取的输入文字列在文字选 出部103中逐个地进行文字选出(步骤403),再在文字识别部104把 该选出的文字分别与文字库105中的內容加以对照,即,文字识别部 104是在使文字位置返回初始值(i=1:步骤404)的同时,字库号返回 初始值(j=1:步骤405),并将文字位置P(i)的文字与字库号No.D(j) 的文字进行对照比较(步骤406)。图5(a)示出了输入文字列与文字 位置P(i)的关系,图5(b)中表示字库号No.D(j)与字库、类目(JIS 码)、字种之间的关系。

文字识别部104在文字位置P(i)的文字与字库No.D(j)的文字 不一致时,使j=j+1(步骤408)后,返回步骤406。若文字位置P(i)的 文字与字库No.D(j)的文字一致时,则进入步骤409。在409中,存贮 r(i)的对照结果的类目(JIS码)(参见图5c),检查是否i=n?(步骤 410),若i≠n,使i=i+1(步骤411),并返回步骤405。步骤410中,若 i=n,把对照结果r(1)~r(n)从文字识别部104输出至字种判定部 106,即,以对照结果r(1)~r(n)作为文字识别结果,用图5(d)中所 示的JIS码输出。

字种判定部106中,接受来自识别部104的对照结果r(1)~r(n), 并把对照结果的存贮位置返回初始值(i=1:步骤412),然后根据对 照结果r(i)的类目对字种进行判定(步骤413),并将其判定字种存 入k(i)中(步骤414)。图6(a)中示出了字种与类目(JIS码)之间的 关系,即,若“2330”≤r(i)≤“2339”时,判定为数字,若r(i)=“ 213D”判定为符号,r(i)≥3000判字为汉字,并把判定结果存入k(i) 中。然后,检查是否i=n?(步骤415),若i≠n,使i=i+1(步骤416)后, 返回步骤413。在步骤415中若i=n,则把判定结果k(1)~k(n)从字 种判定部106传给地址识别部107,即把判定结果k(1)~k(n)作为字 种判定结果,如图6(c)所示的加以输出。

地址识别部107是从字种判定部106接收判定结果k(1)~k(n), 使对照结果与判定结果的存入位置返回初始值(i=1,步骤417),使 最后结果的存入位置回返至初始值(j=1,步骤418)。然后,检测判 定结果k(i)(步骤419),若为数字或符号,把对照结果r(i)的类目存 入最后结果f(j)中(步骤420),使j=j+1(步骤421),进入步骤422中。 在步骤419中,若其判定结果k(i)为汉字,则直接进入步骤422。在 步骤422中,检查是否i=n,若i≠n,使i=i+1(步骤423),并返回步骤 419。在步骤422中,若i=n,则把在步骤420中所得到的最后结果f(1) ~f(m)认定为住址(参见图6(b))。

即,住址识别部107是把对应于住址的输入文字列从头依次地 对字种进行检测,首先,把数字或符号的连续部分“183-123”看做 街名,并予暂时存贮。再检出输入文字列中的字种从汉字变为数字 的变换点,即检出住所表示号的开始位置,并把开始位置以后的数 字与符号“1-10”看做住所表示号。然后,将暂存的街名码“183 -123”与住所表示号“1-10”结合起来识别住址。

实施例2

下面,参照附图来说明本发明的第2实施例。

在此实施例中,对相当于住址的输入文字列逐字地进行文字识 别,首先通过识别输入文字列中的市区名来检出市区名与街名之边 界,再从文字识别结果检出街名码,并检出与此街名码对应的文字 数,然后,根据市区名与街名的边界位置和街名的文字数来检出住 所表示号的开始记载位置,并把此开始位置以后的输入文字列作为 住所表示号检出。把此住所表示号与街名码相结合就是住址识别 结果。

图7是表示实施例2结构的方框图,图象提取部101、地址位置 检出部102、文字选出部103、文字识别部104及字库105的结构均 与上述实施例1相同,故对重复部分的说明省略了。在本实施例中, 是把文字识别部104中的文字识别结果输给街名文字数检索部201、 市区名检索部203与地址识别部205。

街名文字数检索部201是对作为文字识别部104中的文字识别 结果的地址相对应的输入文字列从开头部分依次地进行检查,检出 街名码,并予以暂时存贮。然后用图8中所示的预登记的有街名码 及与此街名码对应的街名文字数的街名文字数表202对与此街名码 相对应的街名文字数进行检索。

市区名检索部203是把文字识别部104中的文字识别结果与预登 记有市区名的市区名表204的內容进行比较而进行市区名检索,这 样检索出市区名,并检出输入文字列中的市区名与其后所记载的街 名之间的边界位置。在此,市区名表204,如图9中所示,登记的是日 本全国的市区名及与其对应的文字的JIS码。而且,此市区名表 204的容量,从现状来看限定在约3000市区名的程度,与登记有街名 的表容量相比是非常小的。

地址识别部205是根据与街名文字数检索部201所检索的街名 码对应的街名文字数与市区名检索部202所检出的市区名和街名的 边界位置来检出住所表示号。于是就把此住所表示号和在街名文 字数检索部201中暂存的街名码相结合地来作为住址的识别结果。

下面,具体地说明这种地址识别装置。

在这种实施方式中,纸件上记载着如图2所示的相当于住址的 文字列“183-123府中市日新町1-10”。

首先,图象提取部101把纸件上的文字与符号等变成电气图象 信号(图4所示的步骤401)。把所提取的图象信号输送给住址位置 检出部102。住址位置检出部102检出住址位置(步骤402)、提取与 住址相符的文字列、即,“183-123府中市日新町1-10”的图象 信号。

然后,将在住址位置检出部102中所提取的输入文字列在文字 选出部103中逐字进行选择(步骤403)。再把选出的文字在文字识 别部104中每一个均与字库105的內容进行对照。再后的处理与实 施例1中的说明相同(步骤404~411)、文字识别部104把对照结果r (1)~r(n)作为文字识别结果以图5(d)所示的JIS码输出。

街名文字数检索部201从文字识别部104得到对照结果r(1)~ r(n)、从开头部分依次地对此对照结果r(1)~r(n)进行检查,提取 与街名码相符的类目(图10中步骤501),即,对作为文字识别部104 中的文字识别结果的住址相对应的输入文字列从开头部分起进行 检查,检出街名码“183-123”并予以暂存。然后,在图8所示的街 名文字数表202中检索与此街名码“183-123”对应的街名“日新 町”的文字数“3”,并将其存入CNO中(CNO=“3”,步骤502)。

与街名文字数检索部201中的处理同时,市区名检索部203把文 字识别部104中的文字识别结果与预登记有市区名的市区名表204 的內容进行比较,而检索市区名“府中市”。这样,在检索出其市 区名“府中市”时,检出记有都道府县市区街名部分的输入文字列 “府中市日新町”中市区名“府中市”与街名“日新町”的边界 位置。

即,市区名检索部203把市区名的开头位置设定为i=8(步骤 503)。然后使市区名表位置回返初始值(j=1,步骤504),并把市区 名表204的C(j)的文字码与r(8)以后的结果进行比较(步骤505)。 如果市区名表204的C(j)的文字码与r(8)以后的结果不一致,在步 骤506中为NO则进入步骤507,并使j=j+1,返回步骤505。若市区名 表204的C(j)的文字码与r(8)以后的结果一致,则与步骤506中的 YES对应,进入步骤508。在步骤508中,把市区名与街名的边界,即 街名的开头位置存入CST中。在此场合下,由于所得到的市区名是 “府中市”,故CST=“11”。

住址识别部205是根据与街名检索部201中检出的街名码对应 的街名文字数“3”(CNO=“3”)及在市区名检索部203中检出的市 区名“府中市”和街名“日新町”的边界位置(CST=“11”)来算 出住所表示号的开始位置JST(JST=CNO+CST,步骤509),并把在此住 所表示号开始位置JST以后的记载文字“1-10”看做是住所表示号。 然后,将此住所表示号“1-10”与暂存在街名文字数检索部201的 街名码“183-123”结合起来作为住址识别结果“183-123 1-10”。

即,住址识别部205把与街名码相符的对照结果r(1)~r(7)存 入最后结果f(1)~f(7)中(步骤510),并把相当于住所表示号的对 照结果r(JST)以后的信息存入最后结果f(8)以后中(步骤511),由 此而得到与图6(b)中所示的相同的最后结果f(1)~f(m)。

实施例3

下面,参照附图说明本发明的第3实施例。

本实施例是在例如所处理的大量纸件中有很多预先指定的特 定地域,即使该指定的特定地域中的街名码并未记载在相当于住 址的输入文字列中时,也能识别住址的装置。即,准备好有关此特 定地域的登记有街名及与其街名相对应的街名码的字库,由输入文 字列中所记载的街名推断出街名码。

图11是表示实施例3结构的方框图,图象提取部101、地址位置 检出部102、文字选出部103、文字识别部104及字库105都与上述 实施例1中相同,故省略重复部分的说明。在此实施例中,把文字识 别部104中的文字识别结果传输到市区名检索部301、街名检索部 303、街名文字数检索部305及住址识别部306中。

市区名检索部301将文字识别部104中的文字识别结果与预登 记有市区名的市区名表302的內容进行比较而对市区名进行检索。 并在检索市区名时检出记载有都道府县市区街名部分的输入文字 列中的市区名与街名之间的边界,把其检出的结果输出到街名检索 部303与住址识别部306中。

在市区名表302中,如图12所示,在所登记的市区名中与预先指 定的特定地域相符的市区名上记载街名标志为“有”,而不相符的 市区名上则记载街名标志“无”。在与由市区名检索部301所检索 的市区名相对应的街名标志为“有”的场合,把街名标志“有”输 给街名检索部303。而在检索出的市区名的街名标志为“无”时, 把街名标志“无”传给街名文字数检索部305。在此,尽可能把街 名标志为“有”的市区名指定为例如被处理的纸件与其它地域相 比多很多的地域。

街名检索部303是在接收到来自市区名检索部301的街名标志 “有”的输出时,根据从市区名检索部301输出的市区名与街名之 间的边界位置及从文字识别部104输出的文字识别结果,将市区名 以后的文字列的文字识别结果与登记有预定的特定地域街名的街 名表进行比较对照,检索街名。在此街名表上,如图13所示,登记有 街名及与该街名对应的街名码。街名检索部303输出其所检到的街 名及街名对应的街名码。进而,此街名表上所登记的街名,只限于 预先指定的特定地域內的街名,所以与登记有日本全国街名的情况 相比,其所使用的容量很小。

街名文字数检索部305,是在接收来自市区名检索部301的街名 标志“无”的输出的场合下,对于与作为文字识别部104中的文字 识别结果的住址相对应的输入文字列从开头起依次进行检查,检出 街名码并暂时存贮。然后,用图8中所示的预登记有街名码与对应 该街名码的街名文字数的街名文字数表202对与上述码对应的街名 文字数进行检索。

地址识别部306,是在检索到市区名检索部301中的街名标志“ 有”的情况下,根据从文字识别部104所输出的输入文字列的文字 识别结果、从市区名检索部301所输出的市区名与街名间的边界位 置及从街名检索部303所输出的街名来检出住所表示号,并将此住 所表示号与街名检索部303的街名码结合在一起来识别住址。

当检索到市区名检索部301中的街名标志“无”时,根据从文 字识别部104输出的输入文字列的文字识别结果,从市区名检索部 301输出的市区名与街名间的边界位置及从街名文字数检索部305 输出的街名文字数来检出住所表示号的起始位置,并检出该起始位 置以后的文字来作为住所表示号。然后,将此住所表示号与街名文 字数检索部305中暂存的街名码相结合的来识别住址。

下面,再对这种住址识别装置加以具体地说明。

在此实施例中,纸件上记载着如图2所示的相当于住址的文字 列“183-123府中市日新町1-10”。

首先,图象提取部101把该纸件上的文字与符号等变成电气图 象信号(图4中步骤401)。把所提取的图象信号传给住址位置检出 部102。住址位置检出部102检出住址位置(步骤402)、提取相当于 住址的输入文字列,即,“183-123府中市日新町1-10”的图象信 号。

然后,把住址位置检出部102中提取的输入文字列在文字选出 部103中逐字选出(步骤403)。再分别把所选出的文字在文字识别 部104中与字库105的內容相对照,之后,进行与在实施例1中所说明 的同样的处理(步骤404~411),文字识别部104把对照结果r(1)~ r(n)作为文字识别结果,以如图5(d)中所示的JIS码进行输出。

市区名检索部301是将文字识别部104中的文字识别结果与预 登记有市区名的市区名表302的內容进行比较,检索出市区名“府 中市”,然后,在检索出市区名的条件下检出记载都道府县区街名 部分的输入文字列中市区名“府中市”与街名“日新町”的边界 位置,并把此输出结果输给街名检索部303与住址识别部306。此外 由于检出的市区名“府中市”,是与如图12中所示的预先指定的特 定地域相符的,故检出街名标志为“有”,由此把街名标志“有” 输出给街名检索部303。此时,由于市区名检索部301未把街名标志 “无”传给街名文字数检索部305,故它不动作。

街名检索部303接受来自市区名检索部301的街名标志“有” 的输出,根据从市区名检索部301所输出的市区名“府中市”与街 名“日新町”间的边界位置及从文字识别部104输出的文字识别结 果,用街名表304来检索街名“日新町”,把检出的街名及与街名所 对应的街名码输给住址识别部306。

住址识别部306是根据从文字识别部104输出的输入文字列的 文字识别结果、从市区名检索部301输出的市区名“府中市”与街 名“日新町”间的边界位置及从街名检索部303所输出的街名来检 出住所表示号“1-10”,把此住所表示号“1-10”与从街名检索部 303输出的街名码“183-123”结合在一起作为住址“183-123 1 -10”来加以识别。

即,市区名检索部301接收来自文字识别部104的对照结果r(1) ~r(n),并使市区名表位置返回初始值(j=1,图10中步骤504)。然 后,将市区名表C(j)的文字码与r(8)以后的结果进行比较(步骤 505),若是一致,则把此时的j存入CFL中(CFL=j,图14中步骤601), 再检测街名标志g(CFL)的有、无(步骤602)、街名标志g(CFL)若为 无,与步骤603中的NO相对应,把街名标志“无”送入街名文字数检 索部305。由此,图10中步骤508以后的处理是借助于街名文字数检 索部305及住址识别部306来实现的。若街名标志g(CFL)为有,则与 步骤603中的YES对应,除了把街名的开头位置存入CST中(步骤604) 之外,还把该街名的开头位置CST及街名标志“有”送入街名检索 部303。

街名检索部303接收来自市区名检索部301的街名标志“有”, 把街名表位置返回初始值(j=1,步骤605),并把街名表t(j)的文字 码与r(CST)以后的结果进行对照(步骤606)。若街名表t(j)的文字 码与r(CST)以后的结果不一致,则在步骤607中对应于NO,进入步骤 608,使j=j+1,并返回步骤606。若街名表t(j)的文字码与r(CST)以 后的结果一致,则与步骤607中的YES对应,进入步骤609。在步骤 609中,把与r(CST)以后的结果一致的街名表t(j)表示的街名与街 名码向住址识别部306输出。此时,把街名码的各文字的类目从头 开始存入r′(1)~r′(7)中,并以其作为对照结果r′(1)~r′(7)输给 住址识别部306。

住址识别部306中求出来自市区名检索部301的市区名与街名 的边界位置、即街名的开头位置CST,以及来自街名检索部303的街 名的住所表示号的开头位置JST(步骤610)。再把来自街名检索部 303的对照结果r′(1)~r′(7)存入最后结果f(1)~f(7)中(步骤611) 。把住所表示号的开头位置JST以后的对照结果r(JST)看做住所表 示号,并把与此住所表示号相当的对照结果r(JST)以后信号作为最 后结果f(8)以后来存贮,借此而得到如图6(b)中所示的相同的最后 结果f(1)~f(m)。

邮件自动处理系统

在上述各种实施方式中,把作为住址而识别出的“183-123 1 -10”,变成例如条形码等,若把此条形码打印在纸件上,就能极大 地提高邮件自动处理系统的处理效率,这种情况下的邮件自动处理 系统的概要示于图15中。图中,2-1是纸件供给部、2-2是光学文字 识别部、2-3是条形码打印部、2-4(2-41~2-4n)为收集部、2-5是 控制器、2-6是输送道、2-7(2-71~2-7n)为闸门。另外,3-1为 纸件供给部、3-2为条形码读出部、3-3(3-31~3-3n)是收集部、3 -4是门控制器、3-5为输送道、3-6(3-61~3-6n)是闸门。

在这种邮件自动处理系统中,把纸件从纸件供给部2-1供至输 送道2-6。当纸件4到达光学文字识别部2-2时,光学文字识别部2-2 检出纸件上记载的相当于住址的文字列,用本发明的方式对地址进 行识别,即若在纸件4上记载着“183-123府中市日新町1-10”, 则把“183-123 1-10”作为住址来识别。然后,光学文字识别部2 -2把此识别了的住址“183-123 1-10”送入条形码打印部2-3中。 条形码打印部2-3把来自光学文字识别部2-2的住址“183-123 1- 10”变换成条形码,并在经光学文字识别部2-2送来的纸件4的既定 部位上打印该条形码。

这种印有条形码的纸件4被送到收集部2-4。在那里,由光学文 字识别部2-2识别的纸件4的住址“183-123 1-10”还送到门控制 器2-5,门控制器2-5根据所送来住址“183-123 1-10”控制闸门 2-71~2-7n的开闭。借此纸件4被收集在与由光学识别部2-2所识 别的住址“183-123 1-10”相对应的收集部2-4中。

从纸件供给部3-1来的纸件4,即用上述方法印上条形码的纸件 4供至输送道3-5中。当纸件4到达条形码读出部3-2时,条形码读出 部3-2读出纸件4上所印的条形码。然后把读出的条形码內容送入 门控制器3-4中。门控制器3-4按送来条形码的內容控制闸门3-61 ~3-6n的开闭。借此而把纸件4收集在与条形码读出部3-2读出的 条形码所表示的住址相对应的收集部3-3中。

虽然在上述各种实施方式中是以日本国內为对象的、住址形 式是汉字、符号及数字的组合而加以说明的,但对于中国或韩国等 的纸件也可以使用同样的方法。图16(a)是表示中国邮件的例子, 图16(b)是韩国邮件的例子。中国的邮件也和日本一样,其相当于 都道府县市区街名的部分是用汉字记载的,而住所表示号是用数字 代表的。在韩国的邮件中,相当于都道府县市区街名的部分是用高 丽文记载的,住所表示号是用数字及标记等符号表示的。

从以上的说明可以明了,在本发明的第1与第6发明中,由于把 街名码与住所表示号结合起来作为地址来加以辨认,使之与由预定 数字组成的街名码相对应,无需登记庞大数量的街名就能高速、高 精度地读出地址。

而第2与第7发明是在第1与第6发明中,把输入文字列从开头部 分依次对字种进行检索而检出街名码与住所表示号的,除了有第1 与第6发明的效果外,还能收到使街名码与住所表示号的检出更加 可靠的效果。

第3与第8发明是在第1与第6发明中,用第1表对与街名码相对 应的街名文字数进行检索,用第2表对组成输入文字列的市区名进 行检索,并根据所检索的街名的文字数与市区名检出住所表示号的, 除了具有第1与第6发明的效果外,还可有以使街名码与住所表示号 的检出更加可靠的效果。

第4与第9发明是在第3与第8发明中,在第2表上所登记的市区 名中的预先指定的特定地域市区名上附加街名标志,在检到的市区 名上附加有街名标志的情况下,根据文字识别结果与检索的市区名 用第3表检索出输入文字列中所载的街名及与该名对应的街名码, 并根据所检出的市区名与街名而检出住所表示号的,除了有第3与 第8发明的效果以外,还会有即便在未记载街名码的情况下也能可 靠地识别住址的效果。

第5与第10发明是在第4与第9发明中,根据每个地域所处理纸 件的多少来预先指定附加有街名码的特定地域的,除了有第4与第9 发明的效果外,还可以用少的登记街名而得到大的效果。

第11发明是用第1发明的住址识别方法,由送来纸件上所记载 的表示住址的输入文字列来识别地址,把识别的地址变换成条形码 并打印在上述纸件上,按照其所印的条形码而对印有这种条形码的 纸件进行处理的,除有第1发明的效果外,还可以收到按照条形码、 即识别的住址而自动地把纸件分类、收集的效果。

高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈