技术领域
[0001] 本
发明涉及专利信息查询技术领域,具体涉及一种专利信息查询系统和查询方法。
背景技术
[0002] 随着经济的迅速发展,知识产权的作用日益体现,所受到的重视程度也在逐步提升。专利作为核心竞争
力和创新能力的象征,包含了大量的技术信息,对研发人员来说,通过专利信息可以启发研究思路,避免重复研究;对于企业来说,更要时时监控相关领域的专利情况,避免专利侵权,降低企业经营
风险。
[0003] 目前,已经有很多成熟的专利查询管理系统,可以实现自动更新、按
申请人、
发明人、地址、IPC分类号等分类管理,有的甚至可以实现复杂的专利分析功能。国家知识产权局提供官方的专利查询工具,可以检索1985年至今所有在中国的专利申请,而美国、欧盟、日本、韩国等知识产权发达国家和地区及WIPO等国际知识产权组织也提供一些专利查询工具和平台;另一方面,还有很多专业的知识产权信息提供商也提供专利查询工具,如Thomson Reuters公司的innography专利
数据库就提供世界诸多重要专利局的专利文件,可针对自己的需要构建检索式进行检索,对检索的专利文献可直接在注册账号下建立工程进行保存,在任何联网的地方都能方便的使用自己的搜索结果。对于检索得到的专利文献可进行下载,单篇专利的分析报告生成与下载,批量专利的分析报告生成与下载,批量专利标题、专利号、申请日、申请地、
失效时间等各项重要信息的列表
抽取等,方便世界范围内在需要领域的专利搜索,还具有强大的分析功能,有气泡图、直方图等各种直观的分析图表结果,帮助正确了解相关领域世界最前沿的技术态势和最具竞争力的对手。
[0004] 但是,由于各国要求专利申请文件必须以本国文字撰写和提交,因此技术人员检索到的国外的专利申请文件的
权利要求书和
说明书等内容都是以外文撰写的,必然对于技术人员理解专利技术带来了很大的困难。
发明内容
[0005] 本发明针对
现有技术的专利信息查询系统不能提供查询者认同的语言形式这一技术问题,提出一种专利信息查询系统和专利信息查询方法,具体的技术方案是:
[0006] 一种专利信息查询系统,包括
服务器1、客户机2和数据源3,所述客户机2向服务器1发送专利查询
请求,服务器1将对应的专利文件信息返回给客户机2,其特征在于:还包括翻译模
块4,所述翻译模块4将服务器1返回给客户机2的专利文件信息转换成特定的语言形式以后再返回给客户机2。
[0007] 本发明的有益效果:对检索到的专利文件信息进行翻译,并以特定的语言形式呈现,有利于技术人员理解专利技术。
附图说明
[0008] 图1为专利信息查询系统的模块图;
[0009] 图2为带OCR模块的专利信息查询系统模块图;
[0010] 图3为服务器模块图;
[0011] 图4为客户机模块图;
[0012] 图5为专利信息查询系统的索引建立方法
流程图;
[0013] 图6为专利信息查询系统的检索方法流程图。
具体实施方式
[0014] 本发明专利信息查询系统的模块图如图1所示,包括服务器1、客户机2和数据源3,所述客户机2向服务器1发送专利查询请求,服务器1将对应的专利文件信息返回给客户机2,其特征在于:还包括翻译模块4,所述翻译模块4将服务器1返回给客户机2的专利文件信息转换成特定的语言形式以后再返回给客户机2。
[0015] 所述服务器1包括侦测模块11、转换模块12、索引模块13及数据库17。所述客户端2包括检索模块20及显示模块21。
[0016] 每一专利文件包括说明书
摘要、说明书、权利要求书三个组成部分,说明书部分又分为标题、技术领域、背景技术、发明内容、附图说明、具体实施方式等多个子部分。说明书摘要部分提供相应的说明书摘要主要内容和关键字,说明书各子部分也提供相应的主要内容和关键字,权利要求书部分的每一项权利要求提供相应权利要求的主要内容和关键字。
[0017] 侦测模块11用于探测数据源3中是否增加了新的专利文件,当侦测到数据源3中增加了新的专利文件时,启动转换模块12进行转换作业。转换模块12用于从数据源3中获得新增的专利文件,依据上述描述的专利文件的组成部分对其进行分析,读取各组成部分的内容,并将该各组成部分的内容以预先定义的文件格式进行保存。该预先定义的文件格式的文件由标题、说明书摘要、说明书、权利要求书等部分组成,该预先定义的文件格式的文件所属的类型可以是网页、XML或其他可以转换成文本文件的类型。索引模块13使用索引建立技术将上述转换之后的专利文件各组成部分的内容添加到数据库17中,并对该数据库17中的所有转换之后的专利文件的各个组成部分的内容分别重新建立全文索引,包括对标题建立全文索引,说明书摘要部分建立全文索引,对说明书部分建立全文索引及对权利要求书部分建立全文索引。所述建立全文索引是指通过扫描每一部分内容的每一个词,对每一个词建立一个索引,指明该词在每一部分出现的次数及
位置。该数据库17中包含与专利文件转换后的文件中各组成部分相对应的栏位,用来存储专利文件转换后各部分的内容和关键字。
[0018] 数据源3可以采用国家知识产权局专利检索数据库或欧盟、美国、世界知识产权组织等建立的专利检索数据库。
[0019] 检索模块20用于根据查询者的检索标的对上述建立好索引的数据库17进行检索。通过检索每一专利文件各组成部分的条目对应的栏位,获得检索结果。检索结果为按照关键字在数据库17中检索出的所有专利文件的简要信息,包括专利标题、部分摘要内容、申请号等,所述条目包括专利文件的标题、说明书摘要、说明书内容及权利要求书。检索模块20进行的检索方式可为单一条目检索和多条目联合检索。显示模块21用于显示上述检索出的与当前关键词相关的专利文件的简要信息,从而方便阅读、参考;还用于当查询者点击检索出的专利标题时将专利文件下载或开启供查询者阅读;还用于在下载专利全文前进行专利全文的预览。
[0020] 还包括翻译模块4,所述翻译模块4将服务器1返回给客户机2的专利文件信息转换成特定的语言形式以后再返回给客户机2。
[0021] 优选在翻译模块4之前还包括语言识别模块,所述语言识别模块的作用是在服务器1返回给客户机2的专利文件信息到达翻译模块4之前确认其语言形式,并通知翻译模块4,翻译模块4将服务器1返回给客户机2的专利文件信息转换成特定的语言形式以后再返回给客户机2。
[0022] 所谓语言识别模块确定语言形式是指服务器1返回的专利文件信息是用什么语言记载的,语言识别模块确认专利文件信息的语言形式以后,通知翻译模块4。
[0023] 所谓特定的语言形式是指查询者熟悉的语言,如汉语或英语。本发明的目的就是将检索到的以日语、韩语、德语、法语等查询者不熟悉的语言翻译成查询者熟悉的语言如汉语,呈现给查询者的是其熟悉的语言,有助于理解发明专利的技术内容。
[0024] 本发明进一步优化的专利信息查询系统的模块图如图2所示,还包括OCR模块5,所述OCR模块5将服务器1返回给客户机2的图片形式的专利文件信息转换成文字形式,返回给翻译模块4,所述翻译模块4将文字形式的专利文件信息转换成特定的语言形式以后再返回给客户机2。
[0025] 存储在数据库17中的专利文件信息大部分为文字形式,如标题、说明书摘要部分等,但是对于一些以纸件形式申请的专利,其权利要求书部分和说明书在数据源3中是以图片的形式存在,专利信息查询系统的服务器1将这些图片形式的专利信息存放到数据库17中,客户机查询到的权利要求书和说明书只能是图片形式,在这种情况下,翻译模块4不能对图片形式的专利信息进行转换,只有先通过OCR模块5对图片形式的专利信息进行识别,将图片形式的专利信息转换成文字形式的专利信息以后再返回给翻译模块4,翻译模块4才能对文字形式的专利信息进行识别,并转换成特定的语言形式以后再返回给客户机2。
[0026] 本发明专利信息查询系统的索引建立方法流程图如图5所示。首先,侦测模块11在侦测到数据源3中增加了新的专利文件时,转换模块12从数据源3中获取该专利文件;转换模块12读取该专利文件各组成部分的内容,并将读取的专利文件的各组成部分的内容以预先定义的文件格式进行保存,该预先定义的文件格式的文件所属的类型可以是网页、XML或其他可以转换成文本文件的类型;索引模块13使用索引建立技术将上述转换之后的专利文件的各部分内容添加到数据库17中,并对该数据库17中的转换之后的所有专利文件的各个组在部分的内容分别重新建立全文索引,包括对标题建立全文索引,说明书摘要部分建立全文索引,对说明书部分建立全文索引及对权利要求书部分建立全文索引,所述建立全文索引是指通过扫描每一部分内容的每一个词,对每一个词建立一个索引,指明该词在每一部分出现的次数及位置。
[0027] 本发明专利信息查询系统的检索方法流程图如图6所示。检索模块20根据查询者提供的关键字,在建立索引之后的数据库17中依专利条目进行专利文件检索,检索到与该关键字相关的所有专利;所述检索结果指检索到的所有专利的简要信息,该简要信息包括专利标题、部分摘要内容、申请号等;所述专利条目可以是标题、说明书摘要、说明书内容及权利要求书。显示模块21显示上述检索出的与当前关键字相关的专利文件的简要信息,从而方便阅读。显示模块21根据查询者的选择,下载及显示所需的专利全文或预览专利全文。