技术领域
[0001] 本
发明涉及
数据挖掘领域,特别是涉及一种文献分析方法和系统。
背景技术
[0002] 随着社会经济活动的进一步发展,
专利在技术推广与应用方面发挥愈来愈大的作用。为了避免在技术推广应用方面出现不必要的专利纠纷,各企业在进行市场评估时都会进行相应的专利
风险分析。
[0003] 目前,这种方式主要是以人工方式进行,即通过人工方式来分析企业竞争对手在有关国家或地区的专利
申请、分析有关专利申请的保护范围。由于与企业相关联的专利文献数量可能非常庞大,同时在对专利文献进行分析时,需要依赖分析人员的专业知识及工作经验,因此人工成本很高。这对专利风险评估而言是极其不利的。
发明内容
[0004] 本发明要解决的技术问题是提供一种文献分析方法和系统。通过计算目标方案在有关国家地区的专利风险预警值,来评估企业在这些国家地区应用有关技术方案所带来的专利风险。因此减小人工成本,提高工作效率,为企业的发展提供了准确的决策支持。
[0005] 根据本发明的一个方面,提供一种文献分析方法,包括:
[0006] 在
数据库中检索与目标方案相关联的至少一个专利文献;
[0007] 对于每个专利文献,利用专利文献的技术指标确定专利文献的风险系数值;
[0008] 利用专利文献的国家地区标识信息,将专利文献进行分组,其中在每个小组中,将公开专利文献的国家地区的风险等级信息作为小组的国家地区预警指标;
[0009] 在每一个小组中,利用风险系数值最高的n个专利文献,计算小组的区域风险值;
[0010] 利用小组的国家地区预警指标,对小组的区域风险值进行加权处理,以得到目标方案在所述国家地区的专利风险预警值。
[0011] 优选的,在每一个小组中,利用风险系数值最高的n个专利文献,计算小组的区域风险值的步骤包括:
[0012] 在每个小组中,对于风险系数值最高的n个专利文献中的每一个专利文献,利用
申请人权重值对专利文献的风险系数值进行加权处理,以得到风险值;
[0013] 计算n个风险值的平均值,以得到小组的区域风险值。
[0014] 优选的,技术指标包括专利文献的技术领域相对于目标方案的相似度。
[0015] 优选的,在专利文献的
发明名称、
摘要和/或
权利要求中,通过提取与目标方案相关联的至少一个关键词,统计所述关键词的出现频次,以作为专利文献的技术领域相对于目标方案的相似度。
[0016] 优选的,技术指标还包括专利文献的国际分类号数目。
[0017] 优选的,技术指标还包括专利文献的
说明书页数、权利要求数目、
独立权利要求数目中的至少一项。
[0018] 优选的,技术指标还包括专利文献引用其它专利文献的数目、专利文献引用其它非专利文献的数目、专利文献被其它专利文献引用的次数、专利文献的同族专利数目中的至少一项。
[0019] 优选的,技术指标还包括专利文献的申请类别、法律状态、专利权的有效期限中的至少一项。
[0020] 根据本发明的另一方面,提供一种文献分析系统,包括:
[0021] 检索单元,用于在数据库中检索与目标方案相关联的至少一个专利文献;
[0022] 风险系数确定单元,用于对于每个专利文献,利用专利文献的技术指标确定专利文献的风险系数值;
[0023] 分组单元,用于利用专利文献的国家地区标识信息,将专利文献进行分组,其中在每个小组中,将公开专利文献的国家地区的风险等级信息作为小组的国家地区预警指标;
[0024] 区域风险值确定单元,用于在每一个小组中,利用风险系数值最高的n个专利文献,计算小组的区域风险值;
[0025] 专利风险预警值确定单元,用于利用小组的国家地区预警指标,对小组的区域风险值进行加权处理,以得到目标方案在所述国家地区的专利风险预警值。
[0026] 优选的,区域风险值确定单元具体在每个小组中,对于风险系数值最高的n个专利文献中的每一个专利文献,利用申请人权重值对专利文献的风险系数值进行加权处理,以得到风险值;计算n个风险值的平均值,以得到小组的区域风险值。
[0027] 优选的,技术指标包括专利文献的技术领域相对于目标方案的相似度。
[0028] 优选的,在专利文献的发明名称、摘要和/或权利要求中,通过提取与目标方案相关联的至少一个关键词,统计所述关键词的出现频次,以作为专利文献的技术领域相对于目标方案的相似度。
[0029] 优选的,技术指标还包括专利文献的国际分类号数目。
[0030] 优选的,技术指标还包括专利文献的说明书页数、权利要求数目、独立权利要求数目中的至少一项。
[0031] 优选的,技术指标还包括专利文献引用其它专利文献的数目、专利文献引用其它非专利文献的数目、专利文献被其它专利文献引用的次数、专利文献的同族专利数目中的至少一项。
[0032] 优选的,技术指标还包括专利文献的申请类别、法律状态、专利权的有效期限中的至少一项。
[0033] 本发明通过在数据库中检索与目标方案相关联的至少一个专利文献;对于每个专利文献,利用专利文献的技术指标确定专利文献的风险系数值;利用专利文献的国家地区标识信息,将专利文献进行分组,其中在每个小组中,将公开专利文献的国家地区的风险等级信息作为小组的国家地区预警指标;在每一个小组中,利用风险系数值最高的n个专利文献,计算小组的区域风险值;利用小组的国家地区预警指标,对小组的区域风险值进行加权处理,以得到目标方案在所述国家地区的专利风险预警值。通过计算目标方案在有关国家地区的专利风险预警值,来评估企业在这些国家地区应用有关技术方案所带来的专利风险。从而减小人工成本,提高工作效率,为企业的发展提供了准确的决策支持。
附图说明
[0034] 图1为本发明文献分析方法一个
实施例的示意图。
[0035] 图2为本发明计算区域风险值一个实施例的示意图。
[0036] 图3为本发明文献分析系统一个实施例的示意图。
[0037] 图4为本发明风险地图一个实施例的示意图。
具体实施方式
[0038] 下面参照附图对本发明进行更全面的描述,其中说明本发明的示例性实施例。
[0039] 图1为本发明文献分析方法一个实施例的示意图。如图1所示,本实施例提供的文献分析方法步骤如下:
[0040] 步骤101,在数据库中检索与目标方案相关联的至少一个专利文献。
[0041] 步骤102,对于每个专利文献,利用专利文献的技术指标确定专利文献的风险系数值。
[0042] 步骤103,利用专利文献的国家地区标识信息,将专利文献进行分组,其中在每个小组中,将公开专利文献的国家地区的风险等级信息作为小组的国家地区预警指标。
[0043] 步骤104,在每一个小组中,利用风险系数值最高的n个专利文献,计算小组的区域风险值。
[0044] 步骤105,利用小组的国家地区预警指标,对小组的区域风险值进行加权处理,以得到目标方案在所述国家地区的专利风险预警值。
[0045] 基于本发明上述实施例提供的文献分析方法,通过在数据库中检索与目标方案相关联的至少一个专利文献;对于每个专利文献,利用专利文献的技术指标确定专利文献的风险系数值;利用专利文献的国家地区标识信息,将专利文献进行分组,其中在每个小组中,将公开专利文献的国家地区的风险等级信息作为小组的国家地区预警指标;在每一个小组中,利用风险系数值最高的n个专利文献,计算小组的区域风险值;利用小组的国家地区预警指标,对小组的区域风险值进行加权处理,以得到目标方案在所述国家地区的专利风险预警值。通过计算目标方案在有关国家地区的专利风险预警值,来评估企业在这些国家地区应用有关技术方案所带来的专利风险。从而减小人工成本,提高工作效率,为企业的发展提供了准确的决策支持。
[0046] 优选的,上述步骤104中计算区域风险值的一个实施例如图2所示。图2为本发明计算区域风险值一个实施例的示意图,其中在图2中:
[0047] 步骤201,在每个小组中,对于风险系数值最高的n个专利文献中的每一个专利文献,利用申请人权重值对专利文献的风险系数值进行加权处理,以得到风险值。
[0048] 步骤202,计算n个风险值的平均值,以得到小组的区域风险值。
[0049] 对于一个专利文献来说,若该专利文献的申请人为企业的竞争对手,则意味着该专利文献对企业的影响可能较大,也就是说,该专利文献导致的专利风险较大。通过提高竞争对手申请的申请人权重值,可进一步突出竞争对手所申请专利所带来的专利风险,这对于评估专利风险是有益的。
[0050] 优选的,可利用相加或相乘运算,以利用申请人权重值对专利文献的风险系数值进行加权处理。
[0051] 优选的,当企业的技术或产品推广到专利强势保护国家或地区时,这些国家或地区的专利风险较高。因此通过对这些国家或地区的专利增加权重,可有利于企业的专利风险评估。
[0052] 优选的,在上述步骤105中,在利用国家地区预警指标,对小组的区域风险值进行加权处理时,可利用相加或相乘运算进行加权处理。
[0053] 优选的,在上述步骤102中,专利文献的技术指标包括专利文献的技术领域相对于目标方案的相似度。通常,相似度越高,则专利文献所带来的专利风险越大。
[0054] 优选的,在专利文献的发明名称、摘要和/或权利要求中,通过提取与目标方案相关联的至少一个关键词,统计所述关键词的出现频次,以作为专利文献的技术领域相对于目标方案的相似度。
[0055] 需要说明的时,由于对于专利文献技术领域的分析,是根据统一的标准进行的,并不需要分析人员的专业知识及工作经验,因此提高的分析的准确性和
稳定性。
[0056] 优选的,技术指标还包括专利文献的国际分类号数目。
[0057] 国际专利分类号(International Patent Classification,简称:IPC)是根据1971年签订的《国际专利分类斯特拉斯堡协定》编制的,是目前惟一国际通用的专利文献分类和检索工具,用来对大量专利文献进行分类。国际专利分类系统按照技术主题设立类目,把整个技术领域分为5个不同等级:部、大类、小类、大组和小组。显然,若一个专利文献涉及的国际专利分类号的个数较多,则表明该专利文献所涉及的技术内容较宽,从而专利文献可能导致的专利风险也较大。
[0058] 优选的,技术指标还包括专利文献的说明书页数、权利要求数目、独立权利要求数目中的至少一项。
[0059] 说明书是记载专利技术方案具体实施方式的部分。说明书页数越多,表明该专利文献涉及的技术内容也越多,涉及的技术环节也越多,可能专利文献导致的专利风险也较大。
[0060] 权利要求是用于限定专利文献保护范围的文本。权利要求数目越多,表明专利文献保护范围越宽,专利文献可能导致的专利风险也较大。
[0061] 独立权利要求从整体上反应专利文献的技术方案,记载解决技术问题的必要技术特征。独立权利要求数目越多,则表明专利文献涉及的技术方案越多,从而专利文献可能导致的专利风险也较大。
[0062] 优选的,技术指标还包括专利文献引用其它专利文献的数目、专利文献引用其它非专利文献的数目、专利文献被其它专利文献引用的次数、专利文献的同族专利数目中的至少一项。
[0063] 专利文献引用其它专利文献,表明该专利文献与其它专利文献之间存在或多或少的联系,专利文献引用其它专利文献的数目越多,表明该专利与其它专利文献之间的关系越复杂,从而专利文献可能导致的专利风险也较大。
[0064] 专利文献引用其它非专利文献,表明该专利文献的技术内容与其它技术文件相关联,例如行业标准、技术规范、论文等。专利文献引用其它非专利文献的数目越多,则表明该专利越有可能在相关技术领域为
基础专利,从而专利文献可能导致的专利风险也较大。
[0065] 专利文献被其它专利文献引用的次数用于表明该专利文献在相关技术领域内受关注程度。专利文献被其它专利文献引用的次数越多,则表明该专利文献越有可能在相关技术领域为基础专利,受到的关注度越高,从而专利文献可能导致的专利风险也较大。
[0066] 同族专利是指基于同一
优先权文件,在不同国家或地区,以及地区间专利组织多次申请、多次公布或批准的内容相同或基本相同的一组专利文献。由至少一个共同优先权联系的一组专利文献,称一个专利族。在同一专利族中每件专利文献被称作专利族成员,同一专利族中每件专利互为同族专利。在同一专利族中最早优先权的专利文献称基本专利。
[0067] 专利文献的同族专利数目越多,表明该与专利文献相关联的技术方案在不同国家和
地区申请的次数越多,表明申请人对该专利文献涉及的技术方案的重视程度也越高,从而专利文献可能导致的专利风险也较大。
[0068] 优选的,技术指标还包括专利文献的申请类别、法律状态、专利权的有效期限中的至少一项。
[0069] 通常情况下,专利文献的申请类型包括发明、实用新型和外观设计。由于发明专利的保护期限更长,方案
保护类型更多,因此发明专利可能导致的专利风险也较大。
[0070] 通常情况下,专利文献的法律状态包括有效、无效、在审等状态。对于无效专利文献,由于其不再受到法律保护,因此可将无效专利文献的风险因素设为0。
[0071] 专利权的有效期限是指专利文献享有专利权的有效剩余时间。有效剩余时间越长,则专利文献可能导致的专利风险也较大。
[0072] 优选的,技术指标还可包括人工标引的项目,用于根据用户需求进行个性化的专利风险评估。
[0073] 图3为本发明文献分析系统一个实施例的示意图。如图3所示,文献分析系统包括检索单元301、风险系数确定单元302、分组单元303、区域风险值确定单元304和专利风险预警值确定单元305。其中:
[0074] 检索单元301,用于在数据库中检索与目标方案相关联的至少一个专利文献。
[0075] 风险系数确定单元302,用于对于每个专利文献,利用专利文献的技术指标确定专利文献的风险系数值。
[0076] 分组单元303,用于利用专利文献的国家地区标识信息,将专利文献进行分组,其中在每个小组中,将公开专利文献的国家地区的风险等级信息作为小组的国家地区预警指标。
[0077] 区域风险值确定单元304,用于在每一个小组中,利用风险系数值最高的n个专利文献,计算小组的区域风险值。
[0078] 专利风险预警值确定单元305,用于利用小组的国家地区预警指标,对小组的区域风险值进行加权处理,以得到目标方案在所述国家地区的专利风险预警值。
[0079] 基于本发明上述实施例提供的文献分析系统,通过在数据库中检索与目标方案相关联的至少一个专利文献;对于每个专利文献,利用专利文献的技术指标确定专利文献的风险系数值;利用专利文献的国家地区标识信息,将专利文献进行分组,其中在每个小组中,将公开专利文献的国家地区的风险等级信息作为小组的国家地区预警指标;在每一个小组中,利用风险系数值最高的n个专利文献,计算小组的区域风险值;利用小组的国家地区预警指标,对小组的区域风险值进行加权处理,以得到目标方案在所述国家地区的专利风险预警值。通过计算目标方案在有关国家地区的专利风险预警值,来评估企业在这些国家地区应用有关技术方案所带来的专利风险。从而减小人工成本,提高工作效率,为企业的发展提供了准确的决策支持。
[0080] 优选的,区域风险值确定单元具体在每个小组中,对于风险系数值最高的n个专利文献中的每一个专利文献,利用申请人权重值对专利文献的风险系数值进行加权处理,以得到风险值;计算n个风险值的平均值,以得到小组的区域风险值。
[0081] 优选的,技术指标包括专利文献的技术领域相对于目标方案的相似度。
[0082] 优选的,在专利文献的发明名称、摘要和/或权利要求中,通过提取与目标方案相关联的至少一个关键词,统计所述关键词的出现频次,以作为专利文献的技术领域相对于目标方案的相似度。
[0083] 优选的,技术指标还包括专利文献的国际分类号数目。
[0084] 优选的,技术指标还包括专利文献的说明书页数、权利要求数目、独立权利要求数目中的至少一项。
[0085] 优选的,技术指标还包括专利文献引用其它专利文献的数目、专利文献引用其它非专利文献的数目、专利文献被其它专利文献引用的次数、专利文献的同族专利数目中的至少一项。
[0086] 优选的,技术指标还包括专利文献的申请类别、法律状态、专利权的有效期限中的至少一项。
[0087] 本发明通过计算目标方案在有关国家地区的专利风险预警值,来评估企业在这些国家地区应用有关技术方案所带来的专利风险。从而减小人工成本,提高工作效率,为企业的发展提供了准确的决策支持。同时为企业创新研发、专利资产运营、侵权预警、专利评价、专利诉讼、合作并购等重大经营活动提供决策支持。
[0088] 通过在专利地图上以不同
颜色表示不同国家或地区的风险值,可进一步给用户提供直接的视觉
感知。
[0089] 图4为本发明风险地图一个实施例的示意图。如图4所示,将利用本发明上述各实施例计算得到的风险值在世界地图上进行展示,通过不同颜色表示不同区域的风险等级,便于分析并统计风险预警结果。其中,地图属性可包括:颜色、坐标、数值、文字等,并提供移动、缩放等特效功能。
[0090] 同时,对于每个地区提供的热点,可点击链接查看具体的专利文献清单。
[0091] 本发明的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本发明限于所公开的形式。很多
修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本发明的原理和实际应用,并且使本领域的普通技术人员能够理解本发明从而设计适于特定用途的带有各种修改的各种实施例。