首页 / 专利库 / 专利权 / 专利合作条约 / 第I章 / 国际检索单位 / 国际检索 / 现有技术 / 技术标准的数字化处理方法

技术标准的数字化处理方法

阅读:5发布:2021-08-21

专利汇可以提供技术标准的数字化处理方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及计算机应用系统中的 数据采集 及处理技术的一种技术标准的数字化处理方法,包括步骤为:技术标准分页扫描为图像格式;使用OCR转换为PDF文件;创建主文件夹,创建公共属性;创建技术标准独立文件夹,设置公共属性值;技术标准的独立文件夹创建属性;上传PDF文件,抓取文本;后台 数据处理 软件 自动识别分析所述PDF文件的每页OCR文本,将条文编号写入每页的条文编号属性;前台Web检索浏览系统。本发明解决现有数字化技术存在的弊端,实现海量技术标准数字化后的全文检索和索引创建。,下面是技术标准的数字化处理方法专利的具体信息内容。

1.一种技术标准的数字化处理方法,包括下列步骤:
1)将技术标准分页扫描为图像格式;
2)使用OCR软件批量转换为PDF文件;
3)在软件系统中创建主文件夹,创建公共属性,所述公共属性包括标准名称和TAG;
4)在文件管理器中为所述技术标准建立独立文件夹,设置所述公共属性值;
5)在所述文件管理器中为所述技术标准的独立文件夹创建属性,所述属性包括页面内容和条文编号;
6)在所述技术标准的独立文件夹内上传所述PDF文件,后台从所述PDF文件中抓取文本内容存入数据库
7)后台数据处理软件自动识别分析所述PDF文件的每页OCR文本,将条文编号写入每页的条文编号属性;
8)前台Web检索浏览系统,可以根据技术标准的TAG属性过滤,在显示每一页时,右侧提供具有同样条文编号的页面链接,并按页面内容属性分类。

说明书全文

技术标准的数字化处理方法

技术领域

[0001] 本发明涉及计算机应用系统中的数据采集及处理技术,可用于各类技术标准文本的数字化处理、索引创建和检索。尤其适用于对技术标准的分类。

背景技术

[0002] 技术标准的整编、分类、管理、使用对于各行业具有特别重大的意义,在促进技术进步、科技创新,保证设计质量方面起着重要的作用。而由于技术标准本身在分类、管理上的复杂性,传统的纸质技术标准文本和人工发放管理的方式已经难以适应新的设计管理模式的要求,尽管有部分技术标准开始采用数字化的分发方式,但目前纸质版本的使用还是主流,现有的数字化技术仅仅是将纸质版本扫描成图像或PDF文件,使用者在电脑上一页页翻阅,对于大量的技术标准内容无法进行全文检索,也无法将技术标准的条文和条文说明相互参照。

发明内容

[0003] 本发明所要解决的技术问题是提供适合处理行业技术标准数字化的相关信息处理技术,解决现有数字化技术存在的弊端,实现海量技术标准数字化后的全文检索和索引创建。还可以融入企业的整体信息平台,在技术标准数据库系统中提供对标准条文的讨论功能,成为企业知识管理的重要数据来源。
[0004] 本发明的基本方案为:
[0005] 根据技术标准数字化应用的数据模型,综合考虑各种数据源和处理校对的工作量,本发明包括下列步骤:
[0006] 1.将技术标准分页扫描为图像格式;
[0007] 2.使用OCR软件批量转换为PDF文件,OCR软件为现有通用的光学字符识别软件;
[0008] 3.在软件系统中创建主文件夹,包含公共属性,所述公共属性包括标准名称和TAG,如下表所示:
[0009]
[0010] 4.在文件管理器中为所述技术标准建立独立文件夹,设置上述公共属性值;
[0011] 5.在所述文件管理器中所述技术标准的独立文件夹创建属性:
[0012]
[0013] 6.在所述技术标准的独立文件夹内上传PDF文件,后台从PDF文件中抓取文本内容存入数据库;
[0014] 7.后台数据处理软件自动识别分析所述PDF文件的每页OCR文本,将条文编号写入每页的条文编号属性;
[0015] 8.前台Web检索浏览系统,可以根据技术标准的TAG过滤,在显示每一页时,右侧提供具有同样条文编号的页面链接,并按页面内容属性分类。
[0016] 本发明的有益效果为:
[0017] (1)本发明解决了纸质技术标准数字化存储、全文检索以及应用的技术问题。
[0018] (2)本发明在查询技术标准文本的同时,还可以将技术标准的条文、条文说明进行即时的比对和参考,并提供针对标准条文、条文说明的讨论线索,大大方便了设计人员的使用。附图说明
[0019] 下面结合附图对本发明进一步说明:
[0020] 图1描述了技术标准数字化处理方法的8个步骤。

具体实施方式

[0021] 图1的步骤1-8所示为针对发明内容所述的8个步骤的流程图
[0022] 根据对技术标准分类、管理、使用要求的分析,对技术标准数据化方法制定以下实施方式:
[0023] 1.在服务器上安装布署本发明提供的后台文件管理系统、后台数据处理软件、前台Web检索浏览系统。
[0024] 2.后台文件管理系统设置数据模型,具体步骤如下:
[0025] 1)技术标准可按树结构进行分类。每本技术标准以一个独立文件夹的形式存在。
[0026] 2)为技术标准的独立文件夹创建属性。
[0027] 3)为技术标准的独立文件夹加上多个标签(TAG),可按TAG检索,例如《多高层结构住宅技术规程》可以打上“多高层”、“钢结构”、“住宅”三个TAG,通过点击TAG逐步缩小检索范围。
[0028] 4)技术标准内部数据的组织以页为单位,即将一本技术标准拆分为多个页面文件(每页一个文件)。
[0029] 5)为每个页面可以包含多个条文、条文说明。
[0030] 6)根据条文、条文说明的编号可以建立页面之间的关联。
[0031] 7)每个条文或条文说明可以关联多个讨论线索。
[0032] 8)页面中还可以包含指向其他技术标准的链接。
[0033] 3.扫描处理技术标准文本,上传到后台文件管理系统。
[0034] 4.用后台数据处理软件自动识别匹配,设置属性值,并进行校对。
[0035] 5.用前台Web界面进行检索和浏览。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈