首页 / 专利库 / 人工智能 / 机器人技术 / 基于智能化识别技术的通关机器人

基于智能化识别技术的通关机器人

阅读:71发布:2020-05-13

专利汇可以提供基于智能化识别技术的通关机器人专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于智能化识别技术的通关 机器人 其包括:原始单证接收模 块 ,负责接受原始报关单证的图片;智能单证生成模块,负责将原始报关单证图片中的内容转换为文本格式,并将识别出来的文本内容生成 电子 档报关单证;智能单证校验模块,负责进行数据校验;智能交互对接模块,负责将上述智能单证校验模块校验合格的电子档报关单证上传到海关监管系统并接收海关监管系统的反馈。本发明应用文件智能识别,报关智能制单及EDI通信等技术,用以提高制作报关单证的效率及准确率,减少制单出错给后续带来的损失。,下面是基于智能化识别技术的通关机器人专利的具体信息内容。

1.一种基于智能化识别技术的通关机器人,其特征在于,其包括:
原始单证接收模,负责接受原始单证的扫描件;
智能单证生成模块,负责将原始单证扫描件中的内容转换为文本格式,并将识别出来的文本内容生成电子档报关报检单证;
智能单证校验模块,负责根据预设的海关规则对上述电子档报关报检单证进行数据校验;
智能交互对接模块,负责将上述智能单证校验模块校验合格的电子档报关报检单证通过EDI通道自动上传到海关国检监管系统并接收海关国检监管系统的回执反馈,完成通关过程。
2.根据权利要求1所述的基于智能化识别技术的通关机器人,其特征在于:所述智能单证生成模块工作流程为:
1)重复进行单证预处理直至完成,单证预处理的内容包括图像的倾斜矫正、优化算法进行图像二值化处理和图像的平滑去噪;
2)重复进行版面分析处理直至完成,版面分析处理的内容包括文本、图像和表格的区域识别,文本部分段落区分、排版顺序;
3)文本区域的字符识别,识别文本区域中的图像,将其转换为文本;
4)单证原型匹配,根据识别出的文本内容和预先设定的单证原型模板进行匹配;
5)存储单证,根据匹配的单证原型模板,将识别的文本填充到对应的区域,获得电子档报关报检单证。
3.根据权利要求2所述的基于智能化识别技术的通关机器人,其特征在于:所述步骤3)文本区域的字符识别包括文本识别和表格识别,并使用字符集特征库进行文本识别。
4.根据权利要求3所述的基于智能化识别技术的通关机器人,其特征在于:所述文本识别的步骤包括:
a)字符切割,将扫描件中的文字进行切割,以获得单个的文字图片;
b)特征提取,提取单个文字图片中的字符特征;
c)将字符特征和字符集特征库进行比较,以获得单个文字图片对应的字符。
5.根据权利要求4所述的基于智能化识别技术的通关机器人,其特征在于:所述步骤c)还包括特殊字符的上下文关联识别,所述特殊字符包括0、o、L、1,上下文关联识别的判别规则为:上下文为英文的,则当其字符判定为英文;如果上下文为数字的,则当其字符判定为数字。
6.根据权利要求1所述的基于智能化识别技术的通关机器人,其特征在于:所述智能单证校验模块校验的标准包括:
1)海关国检监管要求;
2)对历史申报积累的大数据挖掘出的相关性。
7.根据权利要求1所述的基于智能化识别技术的通关机器人,其特征在于:所述智能交互对接模块通过与海关国检监管系统的EDI通信对接技术,将电子档通关单证以XML加密报文的形式,实现交互,将原始单证的扫描件文件一并上传,实现自动化申报。
8.根据权利要求7所述的基于智能化识别技术的通关机器人,其特征在于:所述智能交互对接模块通过与海关国检监管系统通讯时,采用RSA非对称加密传输。

说明书全文

基于智能化识别技术的通关机器人

[0001]

技术领域

[0002] 本发明涉及一种进出口相关的自动化系统,具体涉及基于智能化识别技术的通关机器人。

背景技术

[0003] 当前,在货物进出口海关申报领域,准备好通关用的单证是保证进出口货物顺利通关的基础,要形成一份满足海关国检要求的标准格式通关单证,需要人工根据各种相关材料内容来手动完成,这中间需要花费大量的人、精力及时间,整个过程复杂且繁琐,而且非常容易出现错误,一旦发生错误,对进出口企业及国家造成重大影响及损害。
[0004]

发明内容

[0005] 针对目前货物进出口海关申报领域存在的制作报关报检单证繁琐且容易出错的问题,本发明应用文件智能识别,报关报检智能制单及EDI通信等技术,用以提高制作报关报检单证的效率及准确率,减少制单出错给后续带来的损失。
[0006] 本发明的技术方案是提供一种基于智能化识别技术的通关机器人,其特征在于,其包括:原始单证接收模,负责接受原始单证原始单证的扫描件;
智能单证生成模块,负责将原始单证原始单证扫描件中的内容转换为文本格式,并将识别出来的文本内容生成电子档报关报检单证;
智能单证校验模块,负责根据预设的海关规则对上述电子档报关报检单证进行数据校验;
智能交互对接模块,负责将上述智能单证校验模块校验合格的电子档报关报检单证上传到海关国检监管系统并接收海关国检监管系统的反馈。
[0007] 优选的,所述智能单证生成模块工作流程为:1)重复进行单证预处理直至完成,单证预处理的内容包括图像的倾斜矫正、优化算法进行图像二值化处理和图像的平滑去噪;
2)重复进行版面分析处理直至完成,版面分析处理的内容包括文本、图像和表格的区域识别,文本部分段落区分、排版顺序;
3)文本区域的字符识别,识别文本区域中的图像,将其转换为文本;
4)单证原型匹配,根据识别出的文本内容和预先设定的单证原型模板进行匹配;
5)存储单证,根据匹配的单证原型模板,将识别的文本填充到对应的区域,获得电子档报关报检单证。
[0008] 优选的,所述步骤3)文本区域的字符识别包括文本识别和表格识别,并使用字符集特征库进行文本识别。
[0009] 优选的,所述文本识别的步骤包括:a)字符切割,将扫描件中的文字进行切割,以获得单个的文字图片;
b)特征提取,提取单个文字图片中的字符特征;
c)将字符特征和字符集特征库进行比较,以获得单个文字图片对应的字符。
[0010] 优选的,所述步骤c)还包括特殊字符的上下文关联识别,所述特殊字符包括0、o、L、1,上下文关联识别的判别规则为:上下文为英文的,则当其字符判定为英文;如果上下文为数字的,则当其字符判定为数字。
[0011] 优选的,所述智能单证校验模块校验的标准包括:1)海关国检监管要求;
2)对历史申报积累的大数据挖掘出的相关性。
[0012] 优选的,所述智能交互对接模块通过与海关国检监管系统的EDI通信对接技术,将电子档报关报检单证以XML加密报文的形式,实现交互,将原始单证原始单证的扫描件文件一并上传,实现自动化申报。
[0013] 优选的,所述智能交互对接模块通过与海关国检监管系统通讯时,采用RSA非对称加密传输。
[0014] 本发明的基于智能化识别技术的通关机器人采用了多种相关技术方案。主要分三步对单证进行智能化处理,第一步,智能生成单证,在日常进出口申报业务过程中,需要将客户委托的包含大量信息的文件通过手动操作输入海关的通关系统,这里通过OCR(光学字符识别)技术,将文件图像内容智能转化为文本,包括对文本图像的整体分析,区分段落、排版顺序,以及表格的区域。根据定制的随附单证模版,智能填充生成模版内容,形成一份满足海关要求的完整单证。这里的关键的识别英文字母,数字,以汉字,技术上应用了微软的MODI(MicrosoftOffice Document Imaging)组件,来实现对图像文本的智能识别,技术处理步骤包含图像预处理,图像版面分析及切分,单字特征提取及分类,最终赋予之别结果,生成多层次的Json(JavaScript Object Notation, JS 对象标记)格式字符串,同时根据预先设定的单证模版格式,将识别文本内容填充到模版中,智能生成单证。此时完成了第一步智能生成单证,第二步,智能验证单证内容有效性,系统根据海关国检监管要求,基于历史申报的累积数据,建立了一套完整的数据有效性验证逻辑,其中应用了多种正则表达式,实现对量词,限定字符等过滤和匹配的目的,通过验证的数据才能进行下一步,避免一些基本的申报错误,完成智能制单。第三步,单证全自动上传,通过与海关国检监管系统的EDI(Electronic Data Interchange)通信对接技术,将申报信息以XML加密报文的形式,实现交互,将随附单证文件一并上传,实现智能申报。
[0015]附图说明
[0016] 图1是本发明最佳实施例的一种基于智能化识别技术的通关机器人的原理图;图2是智能单证生成模块的工作流程图
[0017]

具体实施方式

[0018] 下面对本发明的具体实施方式作进一步详细的描述。
[0019] 如图1和图2所示,本发明的一种基于智能化识别技术的通关机器人,其包括:原始单证接收模块,负责接受原始单证原始单证的扫描件;
智能单证生成模块,负责将原始单证原始单证扫描件中的内容转换为文本格式,并将识别出来的文本内容生成电子档报关报检单证;
智能单证校验模块,负责根据预设的海关规则对上述电子档报关报检单证进行数据校验;
智能交互对接模块,负责将上述智能单证校验模块校验合格的电子档报关报检单证上传到海关国检监管系统并接收海关国检监管系统的反馈。
[0020] 如图2所示,智能单证生成模块工作流程为:1)重复进行单证预处理直至完成,单证预处理的内容包括图像的倾斜矫正、优化算法进行图像二值化处理和图像的平滑去噪;
2)重复进行版面分析处理直至完成,版面分析处理的内容包括文本、图像和表格的区域识别,文本部分段落区分、排版顺序;
3)文本区域的字符识别,识别文本区域中的图像,将其转换为文本;其首先将对应的图像进行文本识别和表格识别,即区分为文本部分还是表格部分,然后使用字符集特征库进行文本识别。
[0021] 文本识别的步骤包括:a)字符切割,将扫描件中的文字进行切割,以获得单个的文字图片;
b)特征提取,提取单个文字图片中的字符特征;
c)将字符特征和字符集特征库进行比较,以获得单个文字图片对应的字符。
[0022] 其中,步骤c)还包括特殊字符的上下文关联识别,特殊字符包括0、o、L、1,上下文关联识别的判别规则为:上下文为英文的,则当其字符判定为英文;如果上下文为数字的,则当其字符判定为数字。例如:1205中的0,其上下文为数字,这其判定为数字0;而TOM中的O,因其上下文为英文字母,则判定为字母O。
[0023] 4)单证原型匹配,根据识别出的文本内容和预先设定的单证原型模板进行匹配;5)存储单证,根据匹配的单证原型模板,将识别的文本填充到对应的区域,获得电子档报关报检单证。
[0024] 其中,智能单证校验模块校验的标准包括:1)海关国检监管要求,即海关国检对进出口贸易中,成份、体积、重量等的基本要求;
2)历史申报积累的大数据挖掘出的相关性,同一客户进出口过程中,体积、重量等数据相互之间具有一定的制约,例如,该客户一直以来体积和重量比为1.2,而当其识别的数据的比值为2000,则显然存在识别的错误,需要提醒人工进行校正。当前识别的数据会进入后台进行保存,形成历史申报数据。
[0025] 智能交互对接模块通过与海关国检监管系统的EDI通信对接技术,将电子档报关报检单证以XML加密报文的形式,实现交互,将原始单证的扫描件文件一并上传,实现自动化申报。智能交互对接模块通过与海关国检监管系统通讯时,采用RSA非对称加密传输。
[0026] 以上实施例仅为本发明其中的一种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈