专利检索方法和装置

阅读:1040发布:2020-06-01

专利汇可以提供专利检索方法和装置专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种 专利 检索方法和装置。其中,专利检索方法包括:接收用户的检索 请求 ;确定检索请求中的第一核心词;根据第一核心词和目标信息表确定第一联想词,其中,目标信息表中存储有与第一核心词具有关联关系的联想词;根据第一核心词和第一联想词确定检索条件;根据检索条件检索专利文件。通过本发明,解决了 现有技术 中专利检索结果不准确的问题。,下面是专利检索方法和装置专利的具体信息内容。

1.一种专利检索方法,其特征在于,包括:
接收用户的检索请求
确定所述检索请求中的第一核心词;
根据所述第一核心词和目标信息表确定第一联想词,其中,所述目标信息表中存储有与所述第一核心词具有关联关系的联想词;
根据所述第一核心词和所述第一联想词确定检索条件;以及
根据所述检索条件检索专利文件。
2.根据权利要求1所述的专利检索方法,其特征在于,所述检索请求中包括待检索内容,确定所述检索请求中的第一核心词包括:
对所述待检索内容按照关键词型要素、申请人型要素和分类号型要素进行抽取,得到一个或者多个待检索要素;
接收选择指令;以及
根据所述选择指令确定一个或者多个所述待检索要素中的一个要素为所述第一核心词。
3.根据权利要求1所述的专利检索方法,其特征在于,所述目标信息表包括第一信息表、第二信息表和第三信息表中至少之一,在接收用户的检索请求之前,所述专利检索方法还包括:
根据专利原始数据建立基本检索字段数据表,其中,所述专利原始数据由申请状态为已公开的专利申请文件组成;
根据所述基本检索字段数据表中的关键词,建立所述第一信息表,其中,所述第一信息表中存储有任意两个组成共现矩阵的关键词在已公开的所述专利申请文件的共同出现次数;
根据所述基本检索字段数据表中分类号和所述关键词,建立所述第二信息表,其中,所述第二信息表中包含每个所述分类号对应的关键词在已公开的所述专利申请文件中的共同出现次数;以及
根据所述基本检索字段数据表中申请人和所述关键词,建立所述第三信息表,其中,所述第三信息表中包含每个所述申请人对应的关键词在已公开的所述专利申请文件中的共同出现次数。
4.根据权利要求3所述的专利检索方法,其特征在于,在根据所述第一核心词和目标信息表确定第一联想词之前,所述专利检索方法还包括:
判断所述第一核心词的类型,其中,所述第一核心词的类型为关键词型、申请人型或分类号型;
其中,在判断出所述第一核心词的类型为关键词型的情况下,确定所述目标信息表包括所述第一信息表、所述第二信息表和所述第三信息表;在判断出所述第一核心词的类型为分类号型的情况下,确定所述目标信息表包括所述第二信息表;在判断出所述第一核心词的类型为申请人型的情况下,确定所述目标信息表包括所述第三信息表。
5.根据权利要求4所述的专利检索方法,其特征在于,所述第一核心词的类型为关键词型时,所述第一联想词包括关键词型联想词、分类号型联想词和申请人型联想词,根据所述第一核心词和目标信息表确定第一联想词包括:
根据所述第一核心词和所述第一信息表通过第一推荐模型公式recommend1word=get(maxn1(fre(word,word')))确定所述关键词型联想词,其中,word为所述第一核心词,recommend1word为所述第一推荐模型公式的名称,word'为所述关键词型联想词,n1为预设确定所述关键词型联想词的个数,fre(word,word')为第一核心词word与关键词型联想词word'在所述第一信息表中的共同出现次数,get(maxn1(fre(word,word')))为在所述第一信息表中获取与所述第一核心词word共同出现次数最多的n1个关键词型联想词;
根据所述第一核心词和所述第二信息表通过第二推荐模型公式recommend2word=get(maxn2(fre(word,ipc)))确定所述分类号型联想词,其中,ipc为所述分类号型联想词,recommend2word为所述第二推荐模型公式的名称,n2为预设确定所述分类号型联想词的个数,fre(word,ipc)为所述第一核心词word与分类号型联想词ipc在所述第二信息表中的共同出现次数,get(maxn2(fre(word,ipc)))为在所述第二信息表中获取与所述第一核心词word共同出现次数最多的n2个分类号型联想词;以及
根据所述第一核心词和所述第三信息表通过第三推荐模型公式recommend3word=get(maxn3(fre(word,appl)))确定所述申请人型联想词,其中,appl为所述申请人型联想词,recommend3word为所述第三推荐模型公式的名称,n3为预设确定所述申请人型联想词的个数,fre(word,appl)为所述第一核心词word与申请人型联想词appl在所述第三信息表中的共同出现次数,get(maxn3(fre(word,appl)))为在所述第三信息表中获取与所述第一核心词word共同出现次数最多的n3个申请人型联想词。
6.根据权利要求4所述的专利检索方法,其特征在于,所述第一核心词的类型为分类号型时,所述第一联想词包括关键词型联想词,根据所述第一核心词和目标信息表确定第一联想词包括:
根据所述第一核心词和所述第二信息表通过第四推荐模型公式recommendipc=get(maxn4(fre(ipc,word)))确定所述关键词型联想词,其中,recommendipc为所述第四推荐模型公式的名称,ipc为所述第一核心词,word为所述关键词型联想词,n4为预设确定所述关键词型联想词的个数,fre(ipc,word)为第一核心词ipc与关键词型联想词word在所述第二信息表中的共同出现次数,get(maxn4(fre(ipc,word)))为在所述第二信息表中获取与所述第一核心词ipc共同出现次数最多的n4个关键词型联想词。
7.根据权利要求4所述的专利检索方法,其特征在于,所述第一核心词的类型为申请人型时,所述第一联想词包括关键词型联想词,根据所述第一核心词和目标信息表确定第一联想词包括:
根据所述核心词和所述第三信息表通过第五推荐模型公式recommendappl=get(maxn5(fre(appl,word)))确定所述关键词型联想词,其中,recommendappl为所述第五推荐模型公式的名称,appl为所述第一核心词,word为所述关键词型联想词,n5为预设确定所述关键词型联想词的个数,fre(appl,word)为第一核心词appl与关键词型联想词word在所述第三信息中的共同出现次数,get(maxn5(fre(appl,word)))为在所述第二信息表中获取与所述第一核心词appl共同出现次数最多的n5个关键词型联想词。
8.根据权利要求1所述的专利检索方法,其特征在于,根据所述第一核心词和所述第一联想词确定检索条件包括:
获取目标检索词的类型,其中,所述目标检索词为在词汇集合中已选定作为检索元素的词,所述词汇集合为所述第一核心词和所述第一联想词组成的集合;
按照所述目标检索词的类型对所述目标检索词进行分类,得到不同的目标类型;以及将相同所述目标类型下所述目标检索词按照逻辑或的关系连接,并将不同所述目标类型下所述目标检索词按照逻辑与的关系连接生成搜索条件。
9.根据权利要求1所述的专利检索方法,其特征在于,所述第一联想词为多个,在根据所述第一核心词和目标信息表确定第一联想词之后,所述专利检索方法还包括:
判断是否接收到联想指令,其中,所述联想指令为从多个所述第一联想词中选择任一第一联想词的指令;
在判断出接收到所述联想指令的情况下,确定所述联想指令所选择的第一联想词为第二核心词;以及
根据所述第二核心词和所述目标信息表确定与所述第二核心词具有关联关系的第二联想词,其中,所述目标信息表中还存储有与所述第二核心词具有关联关系的所述第二联想词;
其中,根据所述第一核心词和所述第一联想词确定检索条件包括:根据所述第一核心词、所述第二核心词、所述第一联想词和所述第二联想词确定检索条件。
10.根据权利要求1所述的专利检索方法,其特征在于,在根据所述第一核心词和目标信息表确定第一联想词之后,所述专利检索方法还包括:
接收更换指令;以及
按照所述更换指令重新确定所述第一联想词;
其中,根据所述第一核心词和所述第一联想词确定检索条件包括:根据所述第一核心词和重新确定所述第一联想词确定检索条件。
11.一种专利检索装置,其特征在于,包括:
第一接收单元,用于接收用户的检索请求;
第一确定单元,用于确定所述检索请求中的第一核心词;
第二确定单元,用于根据所述第一核心词和目标信息表确定第一联想词,其中,所述目标信息表中存储有与所述第一核心词具有关联关系的联想词;
第三确定单元,用于根据所述第一核心词和所述第一联想词确定检索条件;以及检索单元,用于根据所述检索条件检索专利文件。
12.根据权利要求11所述的专利检索装置,其特征在于,所述检索请求中包括待检索内容,所述第一确定单元包括:
抽取模,用于对所述待检索内容按照关键词型要素、申请人型要素和分类号型要素进行抽取,得到一个或者多个待检索要素;
接收模块,用于接收选择指令;以及
第一确定模块,用于根据所述选择指令确定一个或者多个所述待检索要素中的一个要素为所述第一核心词。
13.根据权利要求11所述的专利检索装置,其特征在于,所述目标信息表包括第一信息表、第二信息表和第三信息表中至少之一,所述专利检索装置还包括:
第一建立单元,用于在接收用户的检索请求之前,根据专利原始数据建立基本检索字段数据表,其中,所述专利原始数据由申请状态为已公开的专利申请文件组成;
第二建立单元,用于根据所述基本检索字段数据表中的关键词,建立所述第一信息表,其中,所述第一信息表中存储有任意两个组成共现矩阵的关键词在已公开的所述专利申请文件的共同出现次数;
第三建立单元,用于根据所述基本检索字段数据表中分类号和所述关键词,建立所述第二信息表,其中,所述第二信息表中包含每个所述分类号对应的关键词在已公开的所述专利申请文件中的共同出现次数;以及
第四建立单元,用于根据所述基本检索字段数据表中申请人和所述关键词,建立所述第三信息表,其中,所述第三信息表中包含每个所述申请人对应的关键词在已公开的所述专利申请文件中的共同出现次数。
14.根据权利要求13所述的专利检索装置,其特征在于,所述专利检索装置还包括:
第一判断单元,用于在根据所述第一核心词和目标信息表确定第一联想词之前,判断所述第一核心词的类型,其中,所述第一核心词的类型为关键词型、申请人型或分类号型;
其中,在判断出所述第一核心词的类型为关键词型的情况下,确定所述目标信息表包括所述第一信息表、所述第二信息表和所述第三信息表;在判断出所述第一核心词的类型为分类号型的情况下,确定所述目标信息表包括所述第二信息表;在判断出所述第一核心词的类型为申请人型的情况下,确定所述目标信息表包括所述第三信息表。
15.根据权利要求14所述的专利检索装置,其特征在于,所述第一核心词的类型为关键词型时,所述第一联想词包括关键词型联想词、分类号型联想词和申请人型联想词,所述第二确定单元包括:
第二确定模块,用于根据所述第一核心词和所述第一信息表通过第一推荐模型公式recommend1word=get(maxn1(fre(word,word')))确定所述关键词型联想词,其中,word为所述第一核心词,recommend1word为所述第一推荐模型公式的名称,word'为所述关键词型联想词,n1为预设确定所述关键词型联想词的个数,fre(word,word')为第一核心词word与关键词型联想词word'在所述第一信息表中的共同出现次数,get(maxn1(fre(word,word')))为在所述第一信息表中获取与所述第一核心词word共同出现次数最多的n1个关键词型联想词;
第三确定模块,用于根据所述第一核心词和所述第二信息表通过第二推荐模型公式recommend2word=get(maxn2(fre(word,ipc)))确定所述分类号型联想词,其中,ipc为所述分类号型联想词,recommend2word为所述第二推荐模型公式的名称,n2为预设确定所述分类号型联想词的个数,fre(word,ipc)为所述第一核心词word与分类号型联想词ipc在所述第二信息表中的共同出现次数,get(maxn2(fre(word,ipc)))为在所述第二信息表中获取与所述第一核心词word共同出现次数最多的n2个分类号型联想词;以及
第四确定模块,用于根据所述第一核心词和所述第三信息表通过第三推荐模型公式recommend3word=get(maxn3(fre(word,appl)))确定所述申请人型联想词,其中,appl为所述申请人型联想词,recommend3word为所述第三推荐模型公式的名称,n3为预设确定所述申请人型联想词的个数,fre(word,appl)为所述第一核心词word与申请人型联想词appl在所述第三信息表中的共同出现次数,get(maxn3(fre(word,appl)))为在所述第三信息表中获取与所述第一核心词word共同出现次数最多的n3个申请人型联想词。
16.根据权利要求14所述的专利检索装置,其特征在于,所述第一核心词的类型为分类号型时,所述第一联想词包括关键词型联想词,所述第二确定单元包括:
第五确定模块,用于根据所述第一核心词和所述第二信息表通过第四推荐模型公式recommendipc=get(maxn4(fre(ipc,word)))确定所述关键词型联想词,其中,recommendipc为所述第四推荐模型公式的名称,ipc为所述第一核心词,word为所述关键词型联想词,n4为预设确定所述关键词型联想词的个数,fre(ipc,word)为第一核心词ipc与关键词型联想词word在所述第二信息表中的共同出现次数,get(maxn4(fre(ipc,word)))为在所述第二信息表中获取与所述第一核心词ipc共同出现次数最多的n4个关键词型联想词。
17.根据权利要求14所述的专利检索装置,其特征在于,所述第一核心词的类型为申请人型时,所述第一联想词包括关键词型联想词,所述第二确定单元包括:
第六确定模块,用于根据所述核心词和所述第三信息表通过第五推荐模型公式recommendappl=get(maxn5(fre(appl,word)))确定所述关键词型联想词,其中,recommendappl为所述第五推荐模型公式的名称,appl为所述第一核心词,word为所述关键词型联想词,n5为预设确定所述关键词型联想词的个数,fre(appl,word)为第一核心词appl与关键词型联想词word在所述第三信息中的共同出现次数,get(maxn5(fre(appl,word)))为在所述第二信息表中获取与所述第一核心词appl共同出现次数最多的n5个关键词型联想词。
18.根据权利要求11所述的专利检索装置,其特征在于,所述第三确定单元包括:
获取模块,用于获取目标检索词的类型,其中,所述目标检索词为在词汇集合中已选定作为检索元素的词,所述词汇集合为所述第一核心词和所述第一联想词组成的集合;
分类模块,用于按照所述目标检索词的类型对所述目标检索词进行分类,得到不同的目标类型;以及
生成模块,用于将相同所述目标类型下所述目标检索词按照逻辑或的关系连接,并将不同所述目标类型下所述目标检索词按照逻辑与的关系连接生成搜索条件。
19.根据权利要求11所述的专利检索装置,其特征在于,所述第一联想词为多个,所述专利检索装置还包括:
第二判断单元,用于在根据所述第一核心词和目标信息表确定第一联想词之后,判断是否接收到联想指令,其中,所述联想指令为从多个所述第一联想词中选择任一第一联想词的指令;
第四确定单元,用于在判断出接收到所述联想指令的情况下,确定所述联想指令所选择的第一联想词为第二核心词;以及
第五确定单元,用于根据所述第二核心词和所述目标信息表确定与所述第二核心词具有关联关系的第二联想词,其中,所述目标信息表中还存储有与所述第二核心词具有关联关系的所述第二联想词;
其中,所述第三确定单元包括:第七确定模块,用于根据所述第一核心词、所述第二核心词、所述第一联想词和所述第二联想词确定检索条件。
20.根据权利要求11所述的专利检索装置,其特征在于,所述专利检索装置还包括:
第二接收单元,用于在根据所述第一核心词和目标信息表确定第一联想词之后,接收更换指令;以及
第六确定单元,用于按照所述更换指令重新确定所述第一联想词,
其中,所述第三确定单元包括:第八确定模块,用于根据所述第一核心词和重新确定所述第一联想词确定检索条件。

说明书全文

专利检索方法和装置

技术领域

[0001] 本发明涉及检索领域,具体而言,涉及一种专利检索方法和装置。

背景技术

[0002] 近年来,随着国内专利申请量的增加,专利的数量不断膨胀,用户对专利申请的具体情况也越来越关注。现有技术中,用户通过在专利检索系统中输入检索条件,可以对各领域、各省市和各企业等的专利申请量进行统计分析,但是,不同于其他检索,专利检索对检索结果的要求较为严格,所以检索过程中,对检索要素的选择和组配上,有着非常专业的技能要求。现有技术中主要有以下三种专利检索方式,具体如下:
[0003] 第一种是目前所有专利检索平台的常规处理方式。在检索时,将检索字段尽可能多地提供给客户,由客户自行组配。此种专利检索方式的检索结果可控,但对用户的检索技能要求较高,容易造成关键检索信息遗漏,存在专利检索结果不准确的问题。
[0004] 第二种是常见的同义词检索或者公司代码检索。在检索时,根据用户的输入或者用户的选择,使用系统内建的词表进行有限扩展,最后使用扩展的检索要素进行检索。此种专利检索方式的检索结果可控,但只能在同检索要素内,进行非常有限的扩展,存在无法满足拆解式的检索要素联想需求和解决检索字段组配的问题,导致专利检索结果不准确。例如,检索洗衣机,用户需要联想到滚筒、智能控制面板,但是上述检索方式无法联想到滚筒、智能控制面板。
[0005] 第三种是常见的语义检索。在检索时,用户可以简单的输入要检索的词汇或描述语句。系统自动根据输入内容进行语义分析,抽取检索要素,使用语义匹配的方式自动进行检索。此种检索方式,整个检索过程用户完全不可控,并且检索结果不具备改进空间,存在专利检索结果不准确的问题。
[0006] 针对现有技术中专利检索结果不准确的问题,目前尚未提出有效的解决方案。

发明内容

[0007] 本发明实施例提供了一种专利检索方法和装置,以解决现有技术中专利检索结果不准确的问题。
[0008] 根据本发明实施例的一个方面,提供了一种专利检索方法。
[0009] 根据本发明的专利检索方法包括:接收用户的检索请求;确定所述检索请求中的第一核心词;根据所述第一核心词和目标信息表确定第一联想词,其中,所述目标信息表中存储有与所述第一核心词具有关联关系的联想词;根据所述第一核心词和所述第一联想词确定检索条件;以及根据所述检索条件检索专利文件。
[0010] 进一步地,所述检索请求中包括待检索内容,确定所述检索请求中的第一核心词包括:对所述待检索内容按照关键词型要素、申请人型要素和分类号型要素进行抽取,得到一个或者多个待检索要素;接收选择指令;以及根据所述选择指令确定一个或者多个所述待检索要素中的一个要素为所述第一核心词。
[0011] 进一步地,所述目标信息表包括第一信息表、第二信息表和第三信息表中至少之一,在接收用户的检索请求之前,所述专利检索方法还包括:根据专利原始数据建立基本检索字段数据表,其中,所述专利原始数据由申请状态为已公开的专利申请文件组成;根据所述基本检索字段数据表中的关键词,建立所述第一信息表,其中,所述第一信息表中存储有任意两个组成共现矩阵的关键词在已公开的所述专利申请文件的共同出现次数;根据所述基本检索字段数据表中分类号和所述关键词,建立所述第二信息表,其中,所述第二信息表中包含每个所述分类号对应的关键词在已公开的所述专利申请文件中的共同出现次数;以及根据所述基本检索字段数据表中申请人和所述关键词,建立所述第三信息表,其中,所述第三信息表中包含每个所述申请人对应的关键词在已公开的所述专利申请文件中的共同出现次数。
[0012] 进一步地,在根据所述第一核心词和目标信息表确定第一联想词之前,所述专利检索方法还包括:判断所述第一核心词的类型,其中,所述第一核心词的类型为关键词型、申请人型或分类号型;其中,在判断出所述第一核心词的类型为关键词型的情况下,确定所述目标信息表包括所述第一信息表、所述第二信息表和所述第三信息表;在判断出所述第一核心词的类型为分类号型的情况下,确定所述目标信息表包括所述第二信息表;在判断出所述第一核心词的类型为申请人型的情况下,确定所述目标信息表包括所述第三信息表。
[0013] 进一步地,所述第一核心词的类型为关键词型时,所述第一联想词包括关键词型联想词、分类号型联想词和申请人型联想词,根据所述第一核心词和目标信息表确定第一联想词包括:根据所述第一核心词和所述第一信息表通过第一推荐模型公式recommend1word=get(maxn1(fre(word,word')))确定所述关键词型联想词,其中,word为所述第一核心词,recommend1word为所述第一推荐模型公式的名称,word'为所述关键词型联想词,n1为预设确定所述关键词型联想词的个数,fre(word,word')为第一核心词word与关键词型联想词word'在所述第一信息表中的共同出现次数,get(maxn1(fre(word,word')))为在所述第一信息表中获取与所述第一核心词word共同出现次数最多的n1个关键词型联想词;根据所述第一核心词和所述第二信息表通过第二推荐模型公式recommend2word=get(maxn2(fre(word,ipc)))确定所述分类号型联想词,其中,ipc为所述分类号型联想词,recommend2word为所述第二推荐模型公式的名称,n2为预设确定所述分类号型联想词的个数,fre(word,ipc)为所述第一核心词word与分类号型联想词ipc在所述第二信息表中的共同出现次数,get(maxn2(fre(word,ipc)))为在所述第二信息表中获取与所述第一核心词word共同出现次数最多的n2个分类号型联想词;以及根据所述第一核心词和所述第三信息表通过第三推荐模型公式recommend3word=get(maxn3(fre(word,appl)))确定所述申请人型联想词,其中,appl为所述申请人型联想词,recommend3word为所述第三推荐模型公式的名称,n3为预设确定所述申请人型联想词的个数,fre(word,appl)为所述第一核心词word与申请人型联想词appl在所述第三信息表中的共同出现次数,get(maxn3(fre(word,appl)))为在所述第三信息表中获取与所述第一核心词word共同出现次数最多的n3个申请人型联想词。
[0014] 进一步地,所述第一核心词的类型为分类号型时,所述第一联想词包括关键词型联想词,根据所述第一核心词和目标信息表确定第一联想词包括:根据所述第一核心词和所述第二信息表通过第四推荐模型公式recommendipc=get(maxn4(fre(ipc,word)))确定所述关键词型联想词,其中,recommendipc为所述第四推荐模型公式的名称,ipc为所述第一核心词,word为所述关键词型联想词,n4为预设确定所述关键词型联想词的个数,fre(ipc,word)为第一核心词ipc与关键词型联想词word在所述第二信息表中的共同出现次数,get(maxn4(fre(ipc,word)))为在所述第二信息表中获取与所述第一核心词ipc共同出现次数最多的n4个关键词型联想词。
[0015] 进一步地,所述第一核心词的类型为申请人型时,所述第一联想词包括关键词型联想词,根据所述第一核心词和目标信息表确定第一联想词包括:根据所述核心词和所述第三信息表通过第五推荐模型公式recommendappl=get(maxn5(fre(appl,word)))确定所述关键词型联想词,其中,recommendappl为所述第五推荐模型公式的名称,appl为所述第一核心词,word为所述关键词型联想词,n5为预设确定所述关键词型联想词的个数,fre(appl,word)为第一核心词appl与关键词型联想词word在所述第三信息中的共同出现次数,get(maxn5(fre(appl,word)))为在所述第二信息表中获取与所述第一核心词appl共同出现次数最多的n5个关键词型联想词。
[0016] 进一步地,根据所述第一核心词和所述第一联想词确定检索条件包括:获取目标检索词的类型,其中,所述目标检索词为在词汇集合中已选定作为检索元素的词,所述词汇集合为所述第一核心词和所述第一联想词组成的集合;按照所述目标检索词的类型对所述目标检索词进行分类,得到不同的目标类型;以及将相同所述目标类型下所述目标检索词按照逻辑或的关系连接,并将不同所述目标类型下所述目标检索词按照逻辑与的关系连接生成搜索条件。
[0017] 进一步地,所述第一联想词为多个,在根据所述第一核心词和目标信息表确定第一联想词之后,所述专利检索方法还包括:判断是否接收到联想指令,其中,所述联想指令为从多个所述第一联想词中选择任一第一联想词的指令;在判断出接收到所述联想指令的情况下,确定所述联想指令所选择的第一联想词为第二核心词;以及根据所述第二核心词和所述目标信息表确定与所述第二核心词具有关联关系的第二联想词,其中,所述目标信息表中还存储有与所述第二核心词具有关联关系的所述第二联想词;其中,根据所述第一核心词和所述第一联想词确定检索条件包括:根据所述第一核心词、所述第二核心词、所述第一联想词和所述第二联想词确定检索条件。
[0018] 进一步地,在根据所述第一核心词和目标信息表确定第一联想词之后,所述专利检索方法还包括:接收更换指令;以及按照所述更换指令重新确定所述第一联想词;其中,根据所述第一核心词和所述第一联想词确定检索条件包括:根据所述第一核心词和重新确定所述第一联想词确定检索条件。
[0019] 根据本发明实施例的另一方面,还提供了一种专利检索装置。
[0020] 根据本发明的专利检索方法包括:第一接收单元,用于接收用户的检索请求;第一确定单元,用于确定所述检索请求中的第一核心词;第二确定单元,用于根据所述第一核心词和目标信息表确定第一联想词,其中,所述目标信息表中存储有与所述第一核心词具有关联关系的联想词;第三确定单元,用于根据所述第一核心词和所述第一联想词确定检索条件;以及检索单元,用于根据所述检索条件检索专利文件。
[0021] 进一步地,所述检索请求中包括待检索内容,所述第一确定单元包括:抽取模,用于对所述待检索内容按照关键词型要素、申请人型要素和分类号型要素进行抽取,得到一个或者多个待检索要素;接收模块,用于接收选择指令;以及第一确定模块,用于根据所述选择指令确定一个或者多个所述待检索要素中的一个要素为所述第一核心词。
[0022] 进一步地,所述目标信息表包括第一信息表、第二信息表和第三信息表中至少之一,所述专利检索装置还包括:第一建立单元,用于在接收用户的检索请求之前,根据专利原始数据建立基本检索字段数据表,其中,所述专利原始数据由申请状态为已公开的专利申请文件组成;第二建立单元,用于根据所述基本检索字段数据表中的关键词,建立所述第一信息表,其中,所述第一信息表中存储有任意两个组成共现矩阵的关键词在已公开的所述专利申请文件的共同出现次数;第三建立单元,用于根据所述基本检索字段数据表中分类号和所述关键词,建立所述第二信息表,其中,所述第二信息表中包含每个所述分类号对应的关键词在已公开的所述专利申请文件中的共同出现次数;以及第四建立单元,用于根据所述基本检索字段数据表中申请人和所述关键词,建立所述第三信息表,其中,所述第三信息表中包含每个所述申请人对应的关键词在已公开的所述专利申请文件中的共同出现次数。
[0023] 进一步地,所述专利检索装置还包括:第一判断单元,用于在根据所述第一核心词和目标信息表确定第一联想词之前,判断所述第一核心词的类型,其中,所述第一核心词的类型为关键词型、申请人型或分类号型;其中,在判断出所述第一核心词的类型为关键词型的情况下,确定所述目标信息表包括所述第一信息表、所述第二信息表和所述第三信息表;在判断出所述第一核心词的类型为分类号型的情况下,确定所述目标信息表包括所述第二信息表;在判断出所述第一核心词的类型为申请人型的情况下,确定所述目标信息表包括所述第三信息表。
[0024] 进一步地,所述第一核心词的类型为关键词型时,所述第一联想词包括关键词型联想词、分类号型联想词和申请人型联想词,所述第二确定单元包括:第二确定模块,用于根据所述第一核心词和所述第一信息表通过第一推荐模型公式recommend1word=get(maxn1(fre(word,word')))确定所述关键词型联想词,其中,word为所述第一核心词,recommend1word为所述第一推荐模型公式的名称,word'为所述关键词型联想词,n1为预设确定所述关键词型联想词的个数,fre(word,word')为第一核心词word与关键词型联想词word'在所述第一信息表中的共同出现次数,get(maxn1(fre(word,word')))为在所述第一信息表中获取与所述第一核心词word共同出现次数最多的n1个关键词型联想词;第三确定模块,用于根据所述第一核心词和所述第二信息表通过第二推荐模型公式recommend2word=get(maxn2(fre(word,ipc)))确定所述分类号型联想词,其中,ipc为所述分类号型联想词,recommend2word为所述第二推荐模型公式的名称,n2为预设确定所述分类号型联想词的个数,fre(word,ipc)为所述第一核心词word与分类号型联想词ipc在所述第二信息表中的共同出现次数,get(maxn2(fre(word,ipc)))为在所述第二信息表中获取与所述第一核心词word共同出现次数最多的n2个分类号型联想词;以及第四确定模块,用于根据所述第一核心词和所述第三信息表通过第三推荐模型公式recommend3word=get(maxn3(fre(word,appl)))确定所述申请人型联想词,其中,appl为所述申请人型联想词,recommend3word为所述第三推荐模型公式的名称,n3为预设确定所述申请人型联想词的个数,fre(word,appl)为所述第一核心词word与申请人型联想词appl在所述第三信息表中的共同出现次数,get(maxn3(fre(word,appl)))为在所述第三信息表中获取与所述第一核心词word共同出现次数最多的n3个申请人型联想词。
[0025] 进一步地,所述第一核心词的类型为分类号型时,所述第一联想词包括关键词型联想词,所述第二确定单元包括:第五确定模块,用于根据所述第一核心词和所述第二信息表通过第四推荐模型公式recommendipc=get(maxn4(fre(ipc,word)))确定所述关键词型联想词,其中,recommendipc为所述第四推荐模型公式的名称,ipc为所述第一核心词,word为所述关键词型联想词,n4为预设确定所述关键词型联想词的个数,fre(ipc,word)为第一核心词ipc与关键词型联想词word在所述第二信息表中的共同出现次数,get(maxn4(fre(ipc,word)))为在所述第二信息表中获取与所述第一核心词ipc共同出现次数最多的n4个关键词型联想词。
[0026] 进一步地,所述第一核心词的类型为申请人型时,所述第一联想词包括关键词型联想词,所述第二确定单元包括:第六确定模块,用于根据所述核心词和所述第三信息表通过第五推荐模型公式recommendappl=get(maxn5(fre(appl,word)))确定所述关键词型联想词,其中,recommendappl为所述第五推荐模型公式的名称,appl为所述第一核心词,word为所述关键词型联想词,n5为预设确定所述关键词型联想词的个数,fre(appl,word)为第一核心词appl与关键词型联想词word在所述第三信息中的共同出现次数,get(maxn5(fre(appl,word)))为在所述第二信息表中获取与所述第一核心词appl共同出现次数最多的n5个关键词型联想词。
[0027] 进一步地,所述第三确定单元包括:获取模块,用于获取目标检索词的类型,其中,所述目标检索词为在词汇集合中已选定作为检索元素的词,所述词汇集合为所述第一核心词和所述第一联想词组成的集合;分类模块,用于按照所述目标检索词的类型对所述目标检索词进行分类,得到不同的目标类型;以及生成模块,用于将相同所述目标类型下所述目标检索词按照逻辑或的关系连接,并将不同所述目标类型下所述目标检索词按照逻辑与的关系连接生成搜索条件。
[0028] 进一步地,所述第一联想词为多个,所述专利检索装置还包括:第二判断单元,用于在根据所述第一核心词和目标信息表确定第一联想词之后,判断是否接收到联想指令,其中,所述联想指令为从多个所述第一联想词中选择任一第一联想词的指令;第四确定单元,用于在判断出接收到所述联想指令的情况下,确定所述联想指令所选择的第一联想词为第二核心词;以及第五确定单元,用于根据所述第二核心词和所述目标信息表确定与所述第二核心词具有关联关系的第二联想词,其中,所述目标信息表中还存储有与所述第二核心词具有关联关系的所述第二联想词;其中,所述第三确定单元包括:第七确定模块,用于根据所述第一核心词、所述第二核心词、所述第一联想词和所述第二联想词确定检索条件。
[0029] 进一步地,所述专利检索装置还包括:第二接收单元,用于在根据所述第一核心词和目标信息表确定第一联想词之后,接收更换指令;以及第六确定单元,用于按照所述更换指令重新确定所述第一联想词,其中,所述第三确定单元包括:第八确定模块,用于根据所述第一核心词和重新确定所述第一联想词确定检索条件。
[0030] 在本发明实施例中,采用接收用户的检索请求;确定所述检索请求中的第一核心词;根据所述第一核心词和目标信息表确定第一联想词,其中,所述目标信息表中存储有与所述第一核心词具有关联关系的联想词;根据所述第一核心词和所述第一联想词确定检索条件;以及根据所述检索条件检索专利文件。通过根据检索请求确定核心词,进而可以根据预先设置的目标信息表确定出与核心词相关的联想词,实现了以核心词作为用户的检索意愿,为用户有方向、可控制提供了更多与核心词相关并且可以用于作为检索条件的联想词,并且上述联想词可以是与核心词为相同类型检索要素的词汇,也可以是与核心词为不同类型检索要素的词汇,使得用户可以有更大的选择空间根据核心词和推荐的联想词确定检索条件,进而根据上述检索条件进行专利检索,解决了现有技术中专利检索结果不准确的问题,进而达到了提高专利检索结果准确性的效果。附图说明
[0031] 此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0032] 图1是根据本发明实施例的专利检索方法的流程图;以及
[0033] 图2是根据本发明实施例的专利检索装置的示意图。

具体实施方式

[0034] 为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
[0035] 需要说明的是,本发明的说明书权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0036] 根据本发明实施例,提供了一种专利文件检索的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0037] 图1是根据本发明实施例的专利检索方法的流程图。如图1所示,该方法包括步骤S102至步骤S110,具体如下:
[0038] 步骤S102:接收用户的检索请求。具体地,检索请求中包括待检索内容,待检索内容可以是词、句子、段落或者篇章。
[0039] 在本发明实施例中,用户可以通过终端向执行本发明实施例的专利检索方法的专利检索系统发送检索请求。专利检索系统中设置有文本输入区,用户可以在文本输入区中通过键盘等设备输入待检索的相关文本内容,该文本输入区支持复制、粘贴操作,并且允许编辑修改输入的内容。如果输入的文本内容较多,每超过10个字,字号由28号字逐级缩小至直至12号字,文本输入区对输入内容支持的最大长度为个1000字符。当用户输入的文本内容为单个词汇时,可以提供以输入的上述单个词汇为前缀的相关提示信息供用户选择。例如:输入的文本内容为“发动”时,可以提供发动机和发动引擎等输入提示。
[0040] 步骤S104:确定检索请求中的第一核心词。具体地,第一核心词的类型可以为关键词型,例如汽车;可以为申请人型,例如ABC公司;还可以为分类号型,例如GO1M99/00(2011.01)。
[0041] 步骤S106:根据第一核心词和目标信息表确定第一联想词,其中,目标信息表中存储有与第一核心词具有关联关系的联想词。
[0042] 具体地,目标信息表为预先设置的多张信息表中与第一核心词具有关联关系的信息表,不同类型的第一核心词对应不同的目标信息表。第一联想词的类型同样也可以分为关键词型、申请人型和分类号型。第一联想词可以为一个,也可以为多个,并且每个第一联想词的类型可以与第一核心词的类型相同,也可以不同,即,每个第一联想词与第一核心词可以为相同类型检索要素,也可以为不同类型检索要素。
[0043] 在本发明实施例中,通过能够为用户提供与核心词为不同类型检索要素的联想词,使得用户对检索条件的选择范围不在只局限于相同类型检索要素之间,为后续用户确定检索条件提供了较为灵活的选择,进而达到了提高用户满意度的效果。
[0044] 步骤S108:根据第一核心词和第一联想词确定检索条件。在本发明实施例中,检索条件可以由核心词和联想词共同组成,可以只由核心词组成,也可以只由联想词组成,不论是由核心词和联想词共同组成的检索条件还是只由联想词组成的检索条件中的具体联想词以及联想词的数量都可以根据需求选择设置。
[0045] 步骤S110:根据检索条件检索专利文件。具体地,根据检索条件检索专利文件的检索范围是全部专利数据。
[0046] 在本发明实施例中,通过根据检索请求确定核心词,进而可以根据预先设置的目标信息表确定出与核心词相关的联想词,实现了以核心词作为用户的检索意愿,为用户有方向、可控制提供了更多与核心词相关并且可以用于作为检索条件的联想词,并且上述联想词可以是与核心词为相同类型检索要素的词汇,也可以是与核心词为不同类型检索要素的词汇,使得用户可以有更大的选择空间根据核心词和推荐的联想词确定检索条件,进而根据上述检索条件进行专利检索,解决了现有技术中专利检索结果不准确的问题,达到了提高专利检索结果准确性的效果。
[0047] 具体地,在本发明实施例中,检索请求中包括待检索内容,可以通过如下步骤确定检索请求中的第一核心词:
[0048] 步骤1041:对待检索内容按照关键词型要素、申请人型要素和分类号型要素进行抽取,得到一个或者多个待检索要素。具体地,可以通过内嵌的关键词抽取和实体识别算法自动对待检索内容按照关键词型要素、申请人型要素和分类号型要素进行抽取,从而得到上述待检索内容中包含的关键词型信息要素、分类号型信息要素和申请人型信息要素,上述抽取到的要素即为待检索要素,其中,申请人型信息要素可以包括公司名称或者个人名称。
[0049] 步骤1043:接收选择指令。具体地,选择指令用于允许用户根据需求选择步骤1041中抽取得到哪个待检索要素作为核心词。
[0050] 步骤1045:根据选择指令确定一个或者多个待检索要素中的一个要素为第一核心词。
[0051] 在本发明实施例中,通过对待检索内容进行抽取得到一个或者多个待检索要素后,还允许用户根据需求选择上述一个或者多个待检索要素的中的一个待检索要素作为核心词,而非直接将上述一个或者多个待检索要素作为检索条件自动进行检索,达到了提高检索准确度的效果,进而提高了用户的满意度。
[0052] 具体地,目标信息表包括第一信息表、第二信息表和第三信息表中至少之一,在接收用户的检索请求之前,本发明实施例所提供的专利检索方法还包括以下步骤:
[0053] 步骤S1:根据专利原始数据建立基本检索字段数据表,其中,专利原始数据由申请状态为已公开的专利申请文件组成。具体地,基本检索字段数据表中每条记录为一个专利申请,每条记录的内容包括申请号、单篇专利抽取的关键词、申请人和IPC分类号信息。
[0054] 在本发明实施例中,已公开的专利申请文件可以通过多种方式获取得到,例如:CNIPR专利信息服务平台或者Soopat专利数据搜索引擎等方式。
[0055] 步骤S3:根据基本检索字段数据表中的关键词,建立第一信息表,其中,第一信息表中存储有任意两个组成共现矩阵的关键词在已公开的专利申请文件的共同出现次数。在本发明实施例中,第一信息表也可以叫做关键词数据表,共同出现次数也可以叫做篇频次数,本步骤也就是,关键词数据表中记录了基本检索字段数据表中全部任意两个可以组成共现矩阵的关键词在已公开的专利申请文件中的篇频次数。例如,基本检索字段数据表中的关键词“汽车”和关键词“电脑”组成共现矩阵,假设关键词“汽车”和关键词“电脑”在1000个已公开的专利申请文件中的100个专利申请文件中共同出现了,那么关键词“汽车”和关键词“电脑”的篇频次数(即共同出现次数)为100次。其他任意两个组成共现矩阵的关键词的篇频次数的记录方式与上述举例说明一样。
[0056] 需要说明的是,基本检索字段数据表中的同一关键词可以与基本检索字段数据表中其他多个关键词分别组成共现矩阵,那么在关键词数据表中需要记录上述同一关键词分别与其他关键词在已公开的专利申请文件中的共同出现次数。
[0057] 步骤S5:根据基本检索字段数据表中分类号和关键词,建立第二信息表,其中,第二信息表中包含每个分类号对应的关键词在已公开的专利申请文件中的共同出现次数。具体地,第二信息表是以分类号为维度建立的信息表,每个分类号对应的关键词为包含该分类号的专利申请文件中包含的关键词。在本发明实施例中,第二信息表也可以叫做分类号-关键词数据表,本步骤也就是,分类号-关键词数据表中以分类号为维度,记录了每个分类号和与该分类号对应的关键词在已公开的专利申请文件中的共同出现次数。
[0058] 需要说明的是,一个分类号可能被多个专利申请文件包含,那么上述一个分类号对应的关键词由根据上述多个专利申请文件所包含的全部的不同关键词组成,即基本检索字段数据表中的同一分类号可以与基本检索字段数据表中多个关键词分别对应,那么在分类号-关键词数据表中需要记录上述同一分类号分别与上述多个关键词中每个关键词在已公开的专利申请文件中的共同出现频次。
[0059] 步骤S7:根据基本检索字段数据表中申请人和关键词,建立第三信息表,其中,第三信息表中包含每个申请人对应的关键词在已公开的专利申请文件中的共同出现次数。具体地,第三信息表是以申请人为维度建立的信息表,每个申请人对应的关键词为包含该申请人的专利申请文件中包含的关键词。在本发明实施例中,第三信息表也可以叫做申请人-关键词数据表,本步骤也就是申请人-关键词数据表中以申请人为维度,记录了每个申请人和该申请人对应的关键词在已公开的专利申请文件中的共同出现次数。
[0060] 需要说明的是,一个申请人可能被多个专利申请文件包含,那么上述一个申请人对应的关键词由根据上述多个专利申请文件所包含的全部的不同关键词组成,即基本检索字段数据表中的同一申请人可以与基本检索字段数据表中多个关键词分别对应,那么在申请人-关键词数据表中需要记录上述同一申请人分别与上述多个关键词中每个关键词在已公开的专利申请文件中的共同出现次数。
[0061] 例如:申请人为A公司,包含申请人为A公司的已公开的专利申请文件有两个,分别是专利申请文件B和专利申请文件C,其中,专利申请文件B中包含的关键词为手机和天线,专利申请文件C中包含的关键词为电脑,假设A公司和手机共同在25篇已公开的专利申请文件中出现,A公司和天线共同在20篇已公开的专利申请文件中出现,A公司和电脑共同在50篇已公开的专利申请文件中出现,那么在申请人-关键词数据表中,记录A公司和手机的共同出现次数为25次,A公司和天线的共同出现次数为20次,记录A公司和电脑的共同出现次数为50次。
[0062] 具体地,在根据第一核心词和目标信息表确定第一联想词之前,本发明实施例所提供的专利检索方法还包括步骤S9,具体如下:
[0063] 步骤S9:判断第一核心词的类型,其中,第一核心词的类型为关键词型、申请人型或分类号型;在判断出第一核心词的类型为关键词型的情况下,确定目标信息表包括第一信息表、第二信息表和第三信息表;在判断出第一核心词的类型为分类号型的情况下,确定目标信息表包括第二信息表;在判断出第一核心词的类型为申请人型的情况下,确定目标信息表包括第三信息表。
[0064] 在本发明实施例中,通过判断第一核心词的类型,进而可以根据第一核心词的类型确定目标信息表的范围,为后续确定与核心词为不同类型检索要素,但却具有关联关系的联想词提供了数据基础
[0065] 根据上述内容可知,第一核心词的类型可以为三种类型,分别是关键词型、分类号型和申请人型,不同类型的核心词对应的目标信息表的组成不同,以下分别针对第一核心词的类型为关键词型、分类号型和申请人型时,对如何根据第一核心词和目标信息表确定第一联想词进行具体介绍说明。
[0066] 类型一:当第一核心词的类型为关键词型时,此时,第一联想词包括关键词型联想词、分类号型联想词和申请人型联想词,可以通过步骤S1061至步骤S1065完成根据第一核心词和目标信息表确定第一联想词,步骤S1061至步骤S1065具体如下:
[0067] 步骤S1061:根据第一核心词和第一信息表通过第一推荐模型公式recommend1word=get(maxn1(fre(word,word')))确定关键词型联想词,其中,word为第一核心词,recommend1word为第一推荐模型公式的名称,word'为关键词型联想词,n1为预设确定关键词型联想词的个数,fre(word,word')为第一核心词word与关键词型联想词word'在第一信息表中的共同出现次数,get(maxn1(fre(word,word')))为在第一信息表中获取与第一核心词word共同出现次数最多的n1个关键词型联想词。在本步骤中,通过第一推荐模型公式实现了在第一信息表中获取与第一核心词共同出现次数最多的n1个关键词型联想词。具体地,n1的具体数值可以根据需求设置。
[0068] 假设:第一核心词word为汽车,n1设定为5,此时,上述第一推荐模型公式为recommend1汽车=get(max5(fre(汽车,word'))),表示在第一信息表(即关键词数据表)中获取与“汽车”共同出现次数排在前5名的关键词,上述排在前5名的关键词即为关键词型联想词,同时也是与第一核心词最具有关联性的联想词。
[0069] 在本发明实施例中,根据第一核心词、第一信息表通过模型公式实现了对与第一核心词为相同类型检索要素的确定。
[0070] 步骤S1063:根据第一核心词和第二信息表通过第二推荐模型公式recommend2word=get(maxn2(fre(word,ipc)))确定分类号型联想词,其中,ipc为分类号型联想词,recommend2word为第二推荐模型公式的名称,n2为预设确定分类号型联想词的个数,fre(word,ipc)为第一核心词word与分类号型联想词ipc在第二信息表中的共同出现次数,get(maxn2(fre(word,ipc)))为在第二信息表中获取与第一核心词word共同出现次数最多的n2个分类号型联想词。在本步骤中,通过第二推荐模型公式实现了在第二信息表中获取与第一核心词共同出现次数最多的n2个分类号型联想词。同样的,n2的具体数值也可以根据需求设置。
[0071] 假设:第一核心词word为汽车,n2设定为5,此时,上述第二推荐模型公式为recommend2汽车=get(max5(fre(汽车,ipc))),表示在第二信息表(即分类号-关键词数据表)中获取与“汽车”共同出现次数排在前5名的分类号,上述排在前5名的分类号即为分类号型联想词,同时也是与第一核心词最具有关联性的联想词。
[0072] 在本发明实施例中,根据第一核心词、第二信息表通过模型公式实现了对与第一核心词为不同类型检索要素的确定。
[0073] 步骤S1065:根据第一核心词和第三信息表通过第三推荐模型公式recommend3word=get(maxn3(fre(word,appl)))确定申请人型联想词,其中,appl为申请人型联想词,recommend3word为第三推荐模型公式的名称,n3为预设确定申请人型联想词的个数,fre(word,appl)为第一核心词word与申请人型联想词appl在第三信息表中的共同出现次数,get(maxn3(fre(word,appl)))为在第三信息表中获取与第一核心词word共同出现次数最多的n3个申请人型联想词。在本步骤中,通过第三推荐模型公式实现了在第三信息表中获取与第一核心词共同出现次数最多的n3个申请人型联想词。同样的,n3的具体数值也可以根据需求设置。
[0074] 假设:第一核心词word为汽车,n3设定为5,此时,上述第三推荐模型公式为recommend3汽车=get(max5(fre(汽车,appl))),表示在第三信息表(即申请人-关键词数据表)中获取与“汽车”共同出现次数排在前5名的申请人,上述排在前5名的申请人即为申请人型联想词,同时也是与第一核心词最具有关联性的联想词。
[0075] 在本发明实施例中,根据第一核心词、第三信息表通过模型公式实现了对与第一核心词为不同类型检索要素的确定。
[0076] 类型二:当第一核心词的类型为分类号型时,此时,第一联想词包括关键词型联想词,可以通过步骤S1067完成根据第一核心词和目标信息表确定第一联想词,步骤S1067具体如下:
[0077] 步骤S1067:根据第一核心词和第二信息表通过第四推荐模型公式recommendipc=get(maxn4(fre(ipc,word)))确定关键词型联想词,其中,recommendipc为第四推荐模型公式的名称,ipc为第一核心词,word为关键词型联想词,n4为预设确定关键词型联想词的个数,fre(ipc,word)为第一核心词ipc与关键词型联想词word在第二信息表中的共同出现次数,get(maxn4(fre(ipc,word)))为在第二信息表中获取与第一核心词ipc共同出现次数最多的n4个关键词型联想词。在本步骤中,通过第四推荐模型公式实现了在第二信息表中获取与第一核心词共同出现次数最多的n4个关键词型联想词。同样的,n4的具体数值也可以根据需求设置。
[0078] 假设:第一核心词ipc为AAA,n4设定为5,此时,上述第四推荐模型公式为recommendAAA=get(max5(fre(AAA,word))),表示在第二信息表(即分类号-关键词数据表)中获取与“AAA”共同出现次数排在前5名的关键词,上述排在前5名的关键词即为关键词型联想词,同时也是与第一核心词最具有关联性的联想词。
[0079] 在本发明实施例中,根据第一核心词、第二信息表通过模型公式实现了对与第一核心词为不同类型检索要素的确定。
[0080] 类型三:第一核心词的类型为申请人型时,此时,第一联想词包括关键词型联想词,可以通过步骤S1069完成根据第一核心词和目标信息表确定第一联想词,步骤S1069具体如下:
[0081] 步骤S1069:根据核心词和第三信息表通过第五推荐模型公式recommendappl=get(maxn5(fre(appl,word)))确定关键词型联想词,其中,recommendappl为第五推荐模型公式的名称,appl为第一核心词,word为关键词型联想词,n5为预设确定关键词型联想词的个数,fre(appl,word)为第一核心词appl与关键词型联想词word在第三信息中的共同出现次数,get(maxn5(fre(appl,word)))为在第二信息表中获取与第一核心词appl共同出现次数最多的n5个关键词型联想词。在本步骤中,通过第五推荐模型公式实现了在第三信息表中获取与第一核心词共同出现次数最多的n5个关键词型联想词。同样的,n5的具体数值也可以根据需求设置。
[0082] 假设:第一核心词appl为三星,n5设定为5,此时,上述第五推荐模型公式为recommend三星=get(max5(fre(三星,word))),表示在第三信息表(即申请人-关键词数据表)中获取与“三星”共同出现次数排在前5名的关键词,上述排在前5名的关键词即为关键词型联想词,同时也是与第一核心词最具有关联性的联想词。
[0083] 在本发明实施例中,根据第一核心词、第三信息表通过模型公式实现了对与第一核心词为不同类型检索要素的确定。
[0084] 优选地,通过步骤S1081至步骤S1085实现根据第一核心词和第一联想词确定检索条件包括:
[0085] 步骤S1081:获取目标检索词的类型,其中,目标检索词为在词汇集合中已选定作为检索元素的词,词汇集合为第一核心词和第一联想词组成的集合,本步骤也就是获取用户从第一核心词和第一联想词组成的集合中已选定作为检索元素词的类型。需要说明的是,已选定的检索元素包括第一核心词和第一联想词,可以只包括第一核心词,还可以只包括第一联想词,具体可以根据用户需求选择确定。
[0086] 在本发明实施例中,由语义计算联想扩展获得的检索要素(即联想词)并不直接构成检索式(即检索元素)参与检索,作为检索元素的联想词的选择,是开放给用户选择的,从而达到了使整个检索过程可控的目的。
[0087] 步骤S1083:按照目标检索词的类型对目标检索词进行分类,得到不同的目标类型,本步骤也就是,对已选定作为检索元素的第一核心词和第一联想词、第一核心词或者第一联想词进行分类,此时,不再对核心词和联想词进行区分。
[0088] 需要说明的是,由于第一核心词和第一联想词的类型都为同样的三种类型,分别是关键词型、申请人型和分类号型,所以目标类型最多也就分为三种类型,同样分别是关键词型、申请人型和分类号型。
[0089] 步骤S1085:将相同目标类型下目标检索词按照逻辑或的关系连接,并将不同目标类型下目标检索词按照逻辑与的关系连接生成搜索条件,也就是,每个相同目标类型下的目标检索词间采用逻辑“OR”的连接关系,每个目标类型间采用逻辑“AND”的连接关系。假设:在步骤S1083中得到的目标类型有三种,分别是关键词型、申请人型和分类号型,关键词型包括两个关目标检索词,分别是汽车和电脑,申请人型包括一个目标检索词:三星,分类号型包括一个目标检索词:AAA,那么上述目标检索词组成的搜索条件为(汽车OR电脑)AND三星AND AAA。
[0090] 需要说明的是,在执行本发明实施例的专利检索方法的专利检索系统中,当目标类型为关键词型时,对该目标类型下的关键词(即目标检索词)的检索范围包括:标题、摘要、主权项、权利要求书、说明书全文和附图说明;当目标类型为分类号型时,对该目标类型下的分类号(即目标检索词)的检索范围包括:IPC分类号和主IPC;当目标类型为申请人型时,对该目标类型下的申请人(即目标检索词)的检索范围包括:申请人、发明人、专利权人和相关权利人。在本专利检索系统中,用户可以对已选定的检索元素进行多次修改,以发送确定检索指令时对应选定的检索元素为准生成检索条件。
[0091] 在本发明实施例中,可以自动根据用户的选择,进行检索条件的组配关系,其结果用户可调,达到了既不影响检索结果的可控性,又能帮助客户组配较为复杂的检索逻辑的效果。
[0092] 优选地,第一联想词为多个,在根据第一核心词和目标信息表确定第一联想词之后,本发明实施例所提供的专利检索方法还包括步骤S11至步骤S15,具体如下:
[0093] 步骤S11:判断是否接收到联想指令,其中,联想指令为从多个第一联想词中选择任一第一联想词的指令,本步骤也就是,判断是否接收到从多个第一联想词中选择任意联想词进行联想的指令。
[0094] 步骤S13:在判断出接收到联想指令的情况下,确定联想指令所选择的第一联想词为第二核心词,即,如果接收到从多个第一联想词中选择任意联想词进行联想的指令,则将联想指令所选择的第一联想词作为新的核心词。
[0095] 步骤S15:根据第二核心词和目标信息表确定与第二核心词具有关联关系的第二联想词,其中,目标信息表中还存储有与第二核心词具有关联关系的第二联想词,本步骤同步骤S106,具体确定第二联想词的过程同确定第一联想词的过程,具体参考上述内容,此处不再重复说明。
[0096] 此时,根据第一核心词和第一联想词确定检索条件包括:根据第一核心词、第二核心词、第一联想词和第二联想词确定检索条件。在本发明实施例中,根据第一核心词、第二核心词、第一联想词和第二联想词确定检索条件的过程同第一核心词和第一联想词确定检索条件的过程,在此不再重复说明。
[0097] 需要说明的是,当第二联想词为多个时,还可以判断是否接收到从多个第二联想词中选择任意联想词进行联想的指令,如果判断出接收到从多个第二联想词中选择任意联想词进行联想的指令,那么可以将联想指令所选择的第二联想词作为第三核心词,进而可以根据第三核心词和目标信息表确定与第三核心词具有关联关系的第三联想词,所以依次类推,可以重复执行步骤S11至步骤S15,得到多个核心词和与该核心词具有关联关系的联想词。
[0098] 在本发明实施例中,通过可以将联想词转变为新的核心词,从而得到与上述新的核心词具有关联关系的联想词,实现了跨层次联想,不限于同级别的联想的效果,进一步达到了提高用户满意度的效果,并为后续检索结果准确性提供了良好的基础。
[0099] 在执行本发明实施例的专利检索方法的专利检索系统中,核心词和联想词均在可视化搜索界面显示,具体地,以核心词为中心,联想词依次以圆形结构排列分布在核心词周围。具体地,核心词用12号字显示,当核心词超过10个字时,则只显示三个点。在该专利检索系统中,用户还可以对核心词执行搜索操作、修改操作和查看操作。搜索操作用于以该核心词作为检索条件,检索得到预检结果,上述预检结果可以显示全部检索结果的条目数,并显示检索结果的前五条内容,具体包括名称、申请号、当前法律状态、专利类型以及摘要信息。该预检索结果通过浮窗的形式显示,用户可以通过点击浮窗中的收起按钮将浮窗收起。修改操作用于回到初始的文本输入模式下,也就是重新返回文本输入区,从而可对文本内容进行再次编辑。查看操作用于显示本次输入的待检索的全部文本内容,主要用于当文本内容较长时的全文查看。
[0100] 同样的,在本专利检索系统中,用户也可以对每个联想词进行一些操作,具体为修改操作、检索操作、联想操作和删除操作。修改操作用于对当前得到的联想词进行编辑修改;搜索操作用于以当前得到的某个联想词作为检索条件,检索得到预检结果,同样的,该预检结果可以显示全部检索结果的条目数,并显示检索结果的前五条内容,具体包括名称、申请号、当前法律状态、专利类型以及摘要信息。该预检索结果同样可以通过浮窗的形式显示,用户可以通过点击浮窗中的收起按钮将浮窗收起。联想操作用于以当前得到的某个联想词作为新的核心词,继续得到与该新的核心词具有关联关系的联想词;删除操作用于删除当前得到的某个联想词。
[0101] 在本专利检索系统中,当前核心词之前的核心词始终固定显示在可视化搜索界面的固定区域,例如在左上,当前核心词的上一个核心词用虚线和当前的核心词连接,其它在固定区域的核心词之间用虚线连接,以表明层级关系。随着联想的逐级深入,可在上述固定区域形成一棵联想树,该联想树记录了本次检索操作的整个扩展过程,联想树的节点为每次进行联想操作的核心词,点击该联想树上的任意节点,上述任意节点对应的核心词会再次展开显示,并用虚线连接该节点与其父节点子节点的关系。在本专利系统中,通过形成关于核心词的联想树,实现对检索操作过程的全程记录,并起到了保证联想过程的可逆性和可重复性的效果。
[0102] 优选地,在根据第一核心词和目标信息表确定第一联想词之后,本发明实施例所提供的专利检索方法还包括:接收更换指令;按照更换指令重新确定第一联想词,其中,根据第一核心词和第一联想词确定检索条件包括:根据第一核心词和重新确定第一联想词确定检索条件。
[0103] 在本发明实施例中,用户可以通过发送更换指令,实现对与当前核心词具有关联关系的联想词进行更换的效果,并扩大了用户后续选取检索元素的选择范围。需要说明的是,除核心词外,所有的联想词都会进行更换,具体每种类型联想词更换的数量根据上述内容提供的模型公式决定,此时,检索条件根据当前核心词和更换后的联想词确定。特别的,用户可以发送多次更换指令,检索条件由当前核心词和最后一次发送更换指令后对应的联想词确定。
[0104] 需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
[0105] 通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
[0106] 本发明实施例还提供了一种专利检索装置,该专利检索装置可以用于执行本发明实施例的专利检索方法。
[0107] 图2是根据本发明实施例的专利检索装置的示意图。如图2所示,该专利文件检索装置包括:第一接收单元10、第一确定单元20、第二确定单元30、第三确定单元40和检索单元50,其中:
[0108] 第一接收单元10用于接收用户的检索请求。具体地,检索请求中包括待检索内容,待检索内容可以是词、句子、段落或者篇章。
[0109] 在本发明实施例中,用户可以通过终端向具有本发明实施例的专利检索装置的专利检索系统发送检索请求。专利检索系统中设置有文本输入区,用户可以在文本输入区中通过键盘等设备输入待检索的相关文本内容,该文本输入区支持复制、粘贴操作,并且允许编辑修改输入的内容。如果输入的文本内容较多,每超过10个字,字号由28号字逐级缩小至直至12号字,文本输入区对输入内容支持的最大长度为个1000字符。当用户输入的文本内容为单个词汇时,可以提供以输入的上述单个词汇为前缀的相关提示信息供用户选择。例如:输入的文本内容为“发动”时,可以提供发动机和发动引擎等输入提示。
[0110] 第一确定单元20用于确定检索请求中的第一核心词。具体地,第一核心词的类型可以为关键词型,例如汽车;可以为申请人型,例如ABC公司;还可以为分类号型,例如GO1M99/00(2011.01)。
[0111] 第二确定单元30用于根据第一核心词和目标信息表确定第一联想词,其中,目标信息表中存储有与第一核心词具有关联关系的联想词。
[0112] 具体地,目标信息表为预先设置的多张信息表中与第一核心词具有关联关系的信息表,不同类型的第一核心词对应不同的目标信息表。第一联想词的类型同样也可以分为关键词型、申请人型和分类号型,第一联想词可以为一个,也可以为多个,并且每个第一联想词的类型可以与第一核心词的类型相同,也可以不同,即,每个第一联想词与第一核心词可以为相同类型检索要素,也可以为不同类型类检索要素。
[0113] 在本发明实施例中,通过能够为用户提供与核心词为不同类型检索要素的联想词,使得用户对检索条件的选择范围不在只局限于相同类型检索要素之间,为后续用户确定检索条件提供了较为灵活的选择,进而达到了提高用户满意度的效果。
[0114] 第三确定单元40用于根据第一核心词和第一联想词确定检索条件。在本发明实施例中,检索条件可以由核心词和联想词共同组成,可以只由核心词组成,也可以只由联想词组成,不论是由核心词和联想词共同组成的检索条件还是只由联想词组成的检索条件中的具体联想词以及联想词的数量都可以根据需求选择设置。
[0115] 检索单元50用于根据检索条件检索专利文件。具体地,根据检索条件检索专利文件的检索范围是全部专利数据。
[0116] 在本发明实施例中,通过根据检索请求确定核心词,进而可以根据预先设置的目标信息表确定出与核心词相关的联想词,实现了以核心词作为用户的检索意愿,为用户有方向、可控制提供了更多与核心词相关并且可以用于作为检索条件的联想词,并且上述联想词可以是与核心词为相同类型检索要素的词汇,也可以是与核心词为不同类型检索要素的词汇,使得用户可以有更大的选择空间根据核心词和推荐的联想词确定检索条件,进而根据上述检索条件进行专利检索,解决了现有技术中专利检索结果不准确的问题,进而达到了提高专利检索结果准确性的效果。
[0117] 具体地,在本发明实施例中,检索请求中包括待检索内容,第一确定单元20包括抽取模块、接收模块和第一确定模块,其中:
[0118] 抽取模块用于对待检索内容按照关键词型要素、申请人型要素和分类号型要素进行抽取,得到一个或者多个待检索要素。具体地,可以通过内嵌的关键词抽取和实体识别算法自动对待检索内容按照关键词型要素、申请人型要素和分类号型要素进行抽取,从而得到上述待检索内容中包含的关键词型信息要素、分类号型信息要素和申请人型信息要素,上述抽取到的要素即为待检索要素,其中,申请人型信息要素包括公司名称或者个人名称。
[0119] 接收模块用于接收选择指令。具体地,选择指令用于允许用户根据需求选择抽取模块中抽取得到哪个待检索要素作为核心词。
[0120] 第一确定模块用于根据选择指令确定一个或者多个待检索要素中的一个要素为第一核心词。
[0121] 在本发明实施例中,通过对待检索内容进行抽取得到一个或者多个待检索要素后,还允许用户根据需求选择上述一个或者多个待检索要素的中的一个待检索要素作为核心词,而非直接将上述一个或者多个待检索要素作为检索条件自动进行检索,达到了提高检索准确度的效果,进而提高了用户的满意度。
[0122] 具体地,目标信息表包括第一信息表、第二信息表和第三信息表中至少之一,本发明实施例所提供的专利检索装置还包括第一建立单元、第二建立单元、第三建立单元和第四建立单元,其中:
[0123] 第一建立单元用于在接收用户的检索请求之前,根据专利原始数据建立基本检索字段数据表,其中,专利原始数据由申请状态为已公开的专利申请文件组成。具体地,基本检索字段数据表中每条记录为一个专利申请,每条记录的内容包括申请号、单篇专利抽取的关键词、申请人和IPC分类号信息。
[0124] 在本发明实施例中,已公开的专利申请文件可以通过多种方式获取得到,例如:CNIPR专利信息服务平台或者Soopat专利数据搜索引擎等方式。
[0125] 第二建立单元用于根据基本检索字段数据表中的关键词,建立第一信息表,其中,第一信息表中存储有任意两个组成共现矩阵的关键词在已公开的专利申请文件的共同出现次数。在本发明实施例中,第一信息表也可以叫做关键词数据表,共同出现次数也可以叫做篇频次数,本单元也就是,关键词数据表中记录了基本检索字段数据表中全部任意两个可以组成共现矩阵的关键词在已公开的专利申请文件中的篇频次数。例如,基本检索字段数据表中的关键词“汽车”和关键词“电脑”组成共现矩阵,假设关键词“汽车”和关键词“电脑”在1000个已公开的专利申请文件中的100个专利申请文件中共同出现了,那么关键词“汽车”和关键词“电脑”的篇频次数(即共同出现次数)为100次。其他任意两个组成共现矩阵的关键词的篇频次数的记录方式与上述举例说明一样。
[0126] 需要说明的是,基本检索字段数据表中的同一关键词可以与基本检索字段数据表中其他多个关键词分别组成共现矩阵,那么在关键词数据表中需要记录上述同一关键词分别与其他关键词在已公开的专利申请文件中的共同出现次数。
[0127] 第三建立单元用于根据基本检索字段数据表中分类号和关键词,建立第二信息表,其中,第二信息表中包含每个分类号对应的关键词在已公开的专利申请文件中的共同出现次数。具体地,第二信息表是以分类号为维度建立的信息表,每个分类号对应的关键词为包含该分类号的专利申请文件中包含的关键词。在本发明实施例中,第二信息表也可以叫做分类号-关键词数据表,本单元也就是,分类号-关键词数据表中以分类号为维度,记录了每个分类号和与该分类号对应的关键词在已公开的专利申请文件中的共同出现次数。
[0128] 需要说明的是,一个分类号可能被多个专利申请文件包含,那么上述一个分类号对应的关键词由根据上述多个专利申请文件所包含的全部的不同关键词组成,即基本检索字段数据表中的同一分类号可以与基本检索字段数据表中多个关键词分别对应,那么在分类号-关键词数据表中需要记录上述同一分类号分别与上述多个关键词中每个关键词在已公开的专利申请文件中的共同出现频次。
[0129] 第四建立单元用于根据基本检索字段数据表中申请人和关键词,建立第三信息表,其中,第三信息表中包含每个申请人对应的关键词在已公开的专利申请文件中的共同出现次数。具体地,第三信息表是以申请人为维度建立的信息表,每个申请人对应的关键词为包含该申请人的专利申请文件中包含的关键词。在本发明实施例中,第三信息表也可以叫做申请人-关键词数据表,本单元也就是申请人-关键词数据表中以申请人为维度,记录了每个申请人和该申请人对应的关键词在已公开的专利申请文件中的共同出现次数。
[0130] 需要说明的是,一个申请人可能被多个专利申请文件包含,那么上述一个申请人对应的关键词由根据上述多个专利申请文件所包含的全部的不同关键词组成,即基本检索字段数据表中的同一申请人可以与基本检索字段数据表中多个关键词分别对应,那么在申请人-关键词数据表中需要记录上述同一申请人分别与上述多个关键词中每个关键词在已公开的专利申请文件中的共同出现次数。
[0131] 例如:申请人为A公司,包含申请人为A公司的已公开的专利申请文件有两个,分别是专利申请文件B和专利申请文件C,其中,专利申请文件B中包含的关键词为手机和天线,专利申请文件C中包含的关键词为电脑,假设A公司和手机共同在25篇已公开的专利申请文件中出现,A公司和天线共同在20篇已公开的专利申请文件中出现,A公司和电脑共同在50篇已公开的专利申请文件中出现,那么在申请人-关键词数据表中,记录A公司和手机的共同出现次数为25次,A公司和天线的共同出现次数为20次,记录A公司和电脑的共同出现次数为50次。
[0132] 具体地,本发明实施例所提供的专利检索装置还包括第一判断单元,其中,第一判断单元用于在根据第一核心词和目标信息表确定第一联想词之前,判断第一核心词的类型,其中,第一核心词的类型为关键词型、申请人型或分类号型;在判断出第一核心词的类型为关键词型的情况下,确定目标信息表包括第一信息表、第二信息表和第三信息表;在判断出第一核心词的类型为分类号型的情况下,确定目标信息表包括第二信息表;在判断出第一核心词的类型为申请人型的情况下,确定目标信息表包括第三信息表。
[0133] 在本发明实施例中,通过判断第一核心词的类型,进而可以根据第一核心词的类型确定目标信息表的范围,为后续确定与核心词为不同类型检索要素,但却具有关联关系的联想词提供了数据基础。
[0134] 根据上述内容可知,第一核心词的类型可以为三种类型,分别是关键词型、分类号型和申请人型,不同类型的核心词对应的目标信息表的组成不同,以下分别针对第一核心词的类型为关键词型、分类号型和申请人型时,对如何根据第一核心词和目标信息表确定第一联想词进行具体介绍说明。
[0135] 类型一:当第一核心词的类型为关键词型时,此时,第一联想词包括关键词型联想词、分类号型联想词和申请人型联想词,第二确定单元30包括第二确定模块、第三确定模块和第四确定模块,其中:
[0136] 第二确定模块用于根据第一核心词和第一信息表通过第一推荐模型公式recommend1word=get(maxn1(fre(word,word')))确定关键词型联想词,其中,word为第一核心词,recommend1word为第一推荐模型公式的名称,word'为关键词型联想词,n1为预设确定关键词型联想词的个数,fre(word,word')为第一核心词word与关键词型联想词word'在第一信息表中的共同出现次数,get(maxn1(fre(word,word')))为在第一信息表中获取与第一核心词word共同出现次数最多的n1个关键词型联想词。在本模块中,通过第一推荐模型公式实现了在第一信息表中获取与第一核心词共同出现次数最多的n1个关键词型联想词。具体地,n1的具体数值可以根据需求设置。
[0137] 假设:第一核心词word为汽车,n1设定为5,此时,上述第一推荐模型公式为recommend1汽车=get(max5(fre(汽车,word'))),表示在第一信息表(即关键词数据表)中获取与“汽车”共同出现次数排在前5名的关键词,上述排在前5名的关键词即为关键词型联想词,同时也是与第一核心词最具有关联性的联想词。
[0138] 在本发明实施例中,根据第一核心词、第一信息表通过模型公式实现了对与第一核心词为相同类型检索要素的确定。
[0139] 第三确定模块用于根据第一核心词和第二信息表通过第二推荐模型公式recommend2word=get(maxn2(fre(word,ipc)))确定分类号型联想词,其中,ipc为分类号型联想词,recommend2word为第二推荐模型公式的名称,n2为预设确定分类号型联想词的个数,fre(word,ipc)为第一核心词word与分类号型联想词ipc在第二信息表中的共同出现次数,get(maxn2(fre(word,ipc)))为在第二信息表中获取与第一核心词word共同出现次数最多的n2个分类号型联想词。在本模块中,通过第二推荐模型公式实现了在第二信息表中获取与第一核心词共同出现次数最多的n2个分类号型联想词。同样的,n2的具体数值也可以根据需求设置。
[0140] 假设:第一核心词word为汽车,n2设定为5,此时,上述第二推荐模型公式为recommend2汽车=get(max5(fre(汽车,ipc))),表示在第二信息表(即分类号-关键词数据表)中获取与“汽车”共同出现次数排在前5名的分类号,上述排在前5名的分类号即为分类号型联想词,同时也是与第一核心词最具有关联性的联想词。
[0141] 在本发明实施例中,根据第一核心词、第二信息表通过模型公式实现了对与第一核心词为不同类型检索要素的确定。
[0142] 第四确定模块用于根据第一核心词和第三信息表通过第三推荐模型公式recommend3word=get(maxn3(fre(word,appl)))确定申请人型联想词,其中,appl为申请人型联想词,recommend3word为第三推荐模型公式的名称,n3为预设确定申请人型联想词的个数,fre(word,appl)为第一核心词word与申请人型联想词appl在第三信息表中的共同出现次数,get(maxn3(fre(word,appl)))为在第三信息表中获取与第一核心词word共同出现次数最多的n3个申请人型联想词。在本模块中,通过第三推荐模型公式实现了在第三信息表中获取与第一核心词共同出现次数最多的n3个申请人型联想词。同样的,n3的具体数值也可以根据需求设置。
[0143] 假设:第一核心词word为汽车,n3设定为5,此时,上述第三推荐模型公式为recommend3汽车=get(max5(fre(汽车,appl))),表示在第三信息表(即申请人-关键词数据表)中获取与“汽车”共同出现次数排在前5名的申请人,上述排在前5名的申请人即为申请人型联想词,同时也是与第一核心词最具有关联性的联想词。
[0144] 在本发明实施例中,根据第一核心词、第三信息表通过模型公式实现了对与第一核心词为不同类型检索要素的确定。
[0145] 类型二:当第一核心词的类型为分类号型时,此时,第一联想词包括关键词型联想词,第二确定单元30包括第五确定模块,其中:
[0146] 第五确定模块用于根据第一核心词和第二信息表通过第四推荐模型公式recommendipc=get(maxn4(fre(ipc,word)))确定关键词型联想词,其中,recommendipc为第四推荐模型公式的名称,ipc为第一核心词,word为关键词型联想词,n4为预设确定关键词型联想词的个数,fre(ipc,word)为第一核心词ipc与关键词型联想词word在第二信息表中的共同出现次数,get(maxn4(fre(ipc,word)))为在第二信息表中获取与第一核心词ipc共同出现次数最多的n4个关键词型联想词。在本模块中,通过第四推荐模型公式实现了在第二信息表中获取与第一核心词共同出现次数最多的n4个关键词型联想词。同样的,n4的具体数值也可以根据需求设置。
[0147] 假设:第一核心词ipc为AAA,n4设定为5,此时,上述第四推荐模型公式为recommendAAA=get(max5(fre(AAA,word))),表示在第二信息表(即分类号-关键词数据表)中获取与“AAA”共同出现次数排在前5名的关键词,上述排在前5名的关键词即为关键词型联想词,同时也是与第一核心词最具有关联性的联想词。
[0148] 在本发明实施例中,根据第一核心词、第二信息表通过模型公式实现了对与第一核心词为不同类型检索要素的确定。
[0149] 类型三:第一核心词的类型为申请人型时,此时,第一联想词包括关键词型联想词,第二确定单元30包括第六确定模块,其中:
[0150] 第六确定模块用于根据核心词和第三信息表通过第五推荐模型公式recommendappl=get(maxn5(fre(appl,word)))确定关键词型联想词,其中,recommendappl为第五推荐模型公式的名称,appl为第一核心词,word为关键词型联想词,n5为预设确定关键词型联想词的个数,fre(appl,word)为第一核心词appl与关键词型联想词word在第三信息中的共同出现次数,get(maxn5(fre(appl,word)))为在第二信息表中获取与第一核心词appl共同出现次数最多的n5个关键词型联想词。在本模块中,通过第五推荐模型公式实现了在第三信息表中获取与第一核心词共同出现次数最多的n5个关键词型联想词。同样的,n5的具体数值也可以根据需求设置。
[0151] 假设:第一核心词appl为三星,n5设定为5,此时,上述第五推荐模型公式为recommend三星=get(max5(fre(三星,word))),表示在第三信息表(即申请人-关键词数据表)中获取与“三星”共同出现次数排在前5名的关键词,上述排在前5名的关键词即为关键词型联想词,同时也是与第一核心词最具有关联性的联想词。
[0152] 在本发明实施例中,根据第一核心词、第三信息表通过模型公式实现了对与第一核心词为不同类型检索要素的确定。
[0153] 优选地,第三确定单元40包括获取模块、分类模块和生成模块,其中:
[0154] 获取模块用于获取目标检索词的类型,其中,目标检索词为在词汇集合中已选定作为检索元素的词,词汇集合为第一核心词和第一联想词组成的集合,本模块也就是获取用户从第一核心词和第一联想词组成的集合中已选定作为检索元素词的类型。需要说明的是,已选定的检索元素包括第一核心词和第一联想词,可以只包括第一核心词,还可以只包括第一联想词,具体可以根据用户需求选择确定。
[0155] 在本发明实施例中,由语义计算联想扩展获得的检索要素(即联想词)并不直接构成检索式(即检索元素)参与检索,作为检索元素的联想词的选择,是开放给用户选择的,从而达到了使整个检索过程可控的目的。
[0156] 分类模块用于按照目标检索词的类型对目标检索词进行分类,得到不同的目标类型,本模块也就是,对已选定作为检索元素的第一核心词和第一联想词、第一核心词或者第一联想词进行分类,此时,不再对核心词和联想词进行区分。
[0157] 需要说明的是,由于第一核心词和第一联想词的类型都为同样的三种类型,分别是关键词型、申请人型和分类号型,所以目标类型最多也就分为三种类型,同样分别是关键词型、申请人型和分类号型。
[0158] 生成模块用于将相同目标类型下目标检索词按照逻辑或的关系连接,并将不同目标类型下目标检索词按照逻辑与的关系连接生成搜索条件,也就是,每个相同目标类型下的目标检索词间采用逻辑“OR”的连接关系,每个目标类型间采用逻辑“AND”的连接关系。假设:在分类模块中得到的目标类型有三种,分别是关键词型、申请人型和分类号型,关键词型包括两个关目标检索词,分别是汽车和电脑,申请人型包括一个目标检索词:三星,分类号型包括一个目标检索词:AAA,那么上述目标检索词组成的搜索条件为(汽车OR电脑)AND三星AND AAA。
[0159] 需要说明的是,在具有本发明实施例的专利检索装置的专利检索系统中,当目标类型为关键词型时,对该目标类型下的关键词(即目标检索词)的检索范围包括:标题、摘要、主权项、权利要求书、说明书全文和附图说明;当目标类型为分类号型时,对该目标类型下的分类号(即目标检索词)的检索范围包括:IPC分类号和主IPC;当目标类型为申请人型时,对该目标类型下的申请人(即目标检索词)的检索范围包括:申请人、发明人、专利权人和相关权利人。在本专利检索系统中,用户可以对已选定的检索元素进行多次修改,以发送确定检索指令时对应选定的检索元素为准生成检索条件。
[0160] 在本发明实施例中,可以自动根据用户的选择,进行检索条件的组配关系,其结果用户可调,达到了既不影响检索结果的可控性,又能帮助客户组配较为复杂的检索逻辑的效果。
[0161] 优选地,第一联想词为多个,本发明实施例所提供的专利检索装置还包括:第二判断单元、第四确定单元和第五确定单元,其中:
[0162] 第二判断单元用于在根据第一核心词和目标信息表确定第一联想词之后,判断是否接收到联想指令,其中,联想指令为从多个第一联想词中选择任一第一联想词的指令,本单元也就是,判断是否接收到从多个第一联想词中选择任意联想词进行联想的指令。
[0163] 第四确定单元用于在判断出接收到联想指令的情况下,确定联想指令所选择的第一联想词为第二核心词,即,如果接收到从多个第一联想词中选择任意联想词进行联想的指令,则将联想指令所选择的第一联想词作为新的核心词。
[0164] 第五确定单元用于根据第二核心词和目标信息表确定与第二核心词具有关联关系的第二联想词,其中,目标信息表中还存储有与第二核心词具有关联关系的第二联想词,本单元同第二确定单元,具体确定第二联想词的过程同确定第一联想词的过程,具体参考上述内容,此处不再重复说明。
[0165] 此时,第三确定单元包括第七确定模块,第七确定模块用于根据第一核心词、第二核心词、第一联想词和第二联想词确定检索条件。在本发明实施例中,根据第一核心词、第二核心词、第一联想词和第二联想词确定检索条件的过程同第一核心词和第一联想词确定检索条件的过程,在此不再重复说明。
[0166] 需要说明的是,当第二联想词为多个时,还可以判断是否接收到从多个第二联想词中选择任意联想词进行联想的指令,如果判断出接收到从多个第二联想词中选择任意联想词进行联想的指令,那么可以将联想指令所选择的第二联想词作为第三核心词,进而可以根据第三核心词和目标信息表确定与第三核心词具有关联关系的第三联想词,所以依次类推,可以重复调用第二判断单元、第四确定单元和第五确定单元,得到多个核心词和与该核心词具有关联关系的联想词。
[0167] 在本发明实施例中,通过可以将联想词转变为新的核心词,从而得到与上述新的核心词具有关联关系的联想词,实现了跨层次联想,不限于同级别的联想的效果,进一步达到了提高用户满意度的效果,并为后续检索结果准确性提供了良好的基础。
[0168] 在具有本发明实施例的专利检索装置的专利检索系统中,核心词和联想词均在可视化搜索界面显示,具体地,以核心词为中心,联想词依次以圆形结构排列分布在核心词周围。具体地,核心词用12号字显示,当核心词超过10个字时,则只显示三个点。在该专利检索系统中,用户还可以对核心词执行搜索操作、修改操作和查看操作。搜索操作用于以该核心词作为检索条件,检索得到预检结果,上述预检结果可以显示全部检索结果的条目数,并显示检索结果的前五条内容,具体包括名称、申请号、当前法律状态、专利类型以及摘要信息。该预检索结果通过浮窗的形式显示,用户可以通过点击浮窗中的收起按钮将浮窗收起。修改操作用于回到初始的文本输入模式下,也就是重新返回文本输入区,从而可对文本内容进行再次编辑。查看操作用于显示本次输入的待检索的全部文本内容,主要用于当文本内容较长时的全文查看。
[0169] 同样的,在本专利检索系统中,用户也可以对每个联想词进行一些操作,具体为修改操作、检索操作、联想操作和删除操作。修改操作用于对当前得到的联想词进行编辑修改;搜索操作用于以当前得到的某个联想词作为检索条件,检索得到预检结果,同样的,该预检结果可以显示全部检索结果的条目数,并显示检索结果的前五条内容,具体包括名称、申请号、当前法律状态、专利类型以及摘要信息。该预检索结果同样可以通过浮窗的形式显示,用户可以通过点击浮窗中的收起按钮将浮窗收起。联想操作用于以当前得到的某个联想词作为新的核心词,继续得到与该新的核心词具有关联关系的联想词;删除操作用于删除当前得到的某个联想词。
[0170] 在本专利检索系统中,当前核心词之前的核心词始终固定显示在可视化搜索界面的固定区域,例如在左上角,当前核心词的上一个核心词用虚线和当前的核心词连接,其它在固定区域的核心词之间用虚线连接,以表明层级关系。随着联想的逐级深入,可在上述固定区域形成一棵联想树,该联想树记录了本次检索操作的整个扩展过程,联想树的节点为每次进行联想操作的核心词,点击该联想树上的任意节点,上述任意节点对应的核心词会再次展开显示,并用虚线连接该节点与其父节点、子节点的关系。在本专利系统中,通过形成关于核心词的联想树,实现对检索操作过程的全程记录,并起到了保证联想过程的可逆性和可重复性的效果。
[0171] 优选地,本发明实施例所提供的专利检索装置还包括第二接收单元和第六确定单元,其中,第二接收单元用于在根据第一核心词和目标信息表确定第一联想词之后,接收更换指令;第六确定单元用于按照更换指令重新确定第一联想词;此时,第三确定单元包括第八确定模块,第八确定模块用于根据第一核心词和第一联想词确定检索条件包括:根据第一核心词和重新确定第一联想词确定检索条件。
[0172] 在本发明实施例中,用户可以通过发送更换指令,实现对与当前核心词具有关联关系的联想词进行更换的效果,并扩大了用户后续选取检索元素的选择范围。需要说明的是,除核心词外,所有的联想词都会进行更换,具体每种类型联想词更换的数量根据上述内容提供的模型公式决定,此时,检索条件根据当前核心词和更换后的联想词确定。特别的,用户可以发送多次更换指令,检索条件由当前核心词和最后一次发送更换指令后对应的联想词确定。
[0173] 从以上的描述中,可以看出,本发明解决了现有技术中专利检索结果不准确的问题,进而达到了提高专利检索结果准确性的效果。
[0174] 上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
[0175] 在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
[0176] 在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
[0177] 所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0178] 另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0179] 所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
[0180] 以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
相关专利内容
标题 发布/更新时间 阅读量
查全专利检索系统 2020-05-13 464
专利数据统计分析方法 2020-05-13 383
专利检索方法 2020-05-11 54
专利检索系统 2020-05-11 631
专利检索方法 2020-05-11 651
一种专利组合管理方法 2020-05-11 311
一种专利文献下载方法 2020-05-12 367
专利数据分析系统 2020-05-12 751
一种专利分类方法 2020-05-12 355
一种专利检索时智能推荐专利的方法 2020-05-11 441
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈