用于网络数据集的呈现和可视导航的系统和方法专利检索-专利保护类型请求书国际申请第I章专利权专利检索查询-专利查询网

用于网络数据集的呈现和可视导航的系统和方法

阅读：147发布：2020-07-11

专利汇可以提供用于网络数据集的呈现和可视导航的系统和方法专利检索，专利查询，专利分析的服务。并且本文公开的是一种确定数据集中多个数据记录对目标数据记录的相似性分数的计算机实现的方法。相似性分数允许用户标识公开相似概念的次级数据记录或数据记录对。本文还公开一种用于包括相关数据记录的数据集的呈现和可视导航的计算机实现的方法。利用所公开的方法的数据集的呈现允许用户快速标识与关注数据记录非常相似的数据记录。该数据集可以包括直接连接的专利或间接连接的专利。，下面是用于网络数据集的呈现和可视导航的系统和方法专利的具体信息内容。

权利要求

1.一种确定多个数据记录对目标数据记录的相似性分数的计算机实现的方法，所述方法包括以下步骤：
从数据记录集中标识所述目标数据记录；
标识所述数据集中与所述目标记录具有初级连接和次级连接的数据记录以形成数据记录地图，上述记录是初级数据记录和次级数据记录；
对于所述次级数据记录中的至少一个次级数据记录，确定重要性值和相关性值，其中所述重要性值基于所述次级数据记录和所述数据地图中的其它数据记录以及所述数据集中的其它数据记录之间的互连，并且所述相关性值基于所述次级数据记录和所述数据地图中的其它数据记录之间的互连；以及
将所述重要性值和所述相关性值相结合以提供所述相似性分数，其中所述相似性分数允许用户标识公开相似概念的次级数据记录。
2.根据权利要求1所述的计算机实现的方法，其中通过以下步骤确定所述至少一个次级数据记录中每个次级数据记录的所述重要性值：
计算所述数据地图中所述次级数据记录和连接至所述次级数据记录的所述初级数据记录之间的连接强度；
确定所连接的初级数据记录中每个初级数据记录的数据记录强度；
计算所述数据地图中所述次级数据记录与其它次级数据记录之间的连接强度；以及确定所述数据集中所述次级数据记录中每个次级数据记录的所述数据记录强度；
其中将所述连接强度和所述数据记录强度相结合以形成所述重要性值。
3.根据权利要求1或权利要求2所述的计算机实现的方法，其中通过以下步骤确定所述至少一个次级数据记录中每个次级数据记录的所述相关性值：
计算所述次级数据记录连接至所述数据地图中的初级数据记录的次数，以形成第一投票；以及
计算所述次级数据记录连接至所述数据地图中的另一次级数据记录的次数，以形成第二投票；
其中将所述第一投票和第二投票相结合以形成所述相关性值。
4.根据权利要求2所述的计算机实现的方法，其中通过以下步骤确定所述至少一个次级数据记录中每个次级数据记录的所述相关性值：
依据所述连接强度，计算所述次级数据记录与所述目标数据记录之间的连接距离。
5.根据前述权利要求中任一项所述的计算机实现的方法，其中由用户标识所述目标数据记录。
6.根据前述权利要求中任一项所述的计算机实现的方法，其中所述重要性值和所述相关性值被认为是权重，并且被结合以计算所述相似性分数。
7.根据前述权利要求中任一项所述的计算机实现的方法，其中所述数据记录是专利，所述初级数据记录连接至所述目标数据记录，因为所述初级数据记录和所述目标数据记录共享引用。
8.根据前述权利要求中任一项所述的计算机实现的方法，所述次级数据记录连接至所述初级数据记录，因为所述次级数据记录与所述初级数据记录共享引用。
9.根据前述权利要求中任一项所述的计算机实现的方法，所述数据地图显示数据记录之间的连接。
10.一种用于排序、减少和呈现数据记录的系统，所述系统包括：
标识装置，用于标识所述目标数据记录；
处理器，用于根据权利要求1至9中任一项，计算所述次级数据记录的所述相似性分数，其中依据所述相似性分数对所述次级数据记录进行排序；
处理器，用于减少所述次级数据记录，该减少依据所述次级数据记录的排序；以及显示装置，用于与所述初级数据记录和所述目标数据记录一起呈现所减少的次级数据记录，该呈现允许用户标识公开相似概念的初级数据记录和次级数据记录。
11.一种确定至少一对数据记录的相似性分数的计算机实现的方法，所述方法包括以下步骤：
标识数据记录集中至少一对直接连接的数据记录；
计算所述直接连接的数据记录之间的连接距离；
标识所述一对间接连接的数据记录，所述间接连接的数据记录是通过至少两对直接连接的数据记录而连接的；以及
依据所述直接连接的数据记录之间的所述连接距离，计算所述一对间接连接的数据记录的所述相似性分数，其中所述相似性分数有助于标识公开相似概念的数据记录对。
12.根据权利要求11所述的计算机实现的方法，其中所述方法包括以下步骤：
依据所述直接连接的数据记录之间的所述连接距离，计算所述至少一对直接连接的数据记录的所述相似性分数。
13.根据权利要求11或权利要求12所述的计算机实现的方法，其中所述方法包括以下步骤：
计算所述直接连接的数据记录的连接强度，其中所述连接距离的计算依据所述连接强度。
14.根据权利要求13所述的计算机实现的方法，其中所述连接强度是通过以下步骤计算的：
标识与所述至少一对直接连接的数据记录中的两个数据记录都直接连接的其它数据记录，以获得所述至少一对数据记录之间的连接的总数的数量；以及
依据所述数量，计算所述连接强度。
15.根据权利要求11至权利要求14中任一项所述的计算机实现的方法，进一步包括以下步骤：
设置至少一对间接连接的数据记录之间的所述相似性分数的预定水平；
移除低于所述预定水平的所述至少一对间接连接的数据记录；以及
依据所述相似性分数，排序其余的至少一对间接连接的数据记录。
16.根据权利要求11至权利要求15中任一项所述的计算机实现的方法，其中，所述数据记录是专利，所述专利是直接连接的，因为所述专利共享引用。
17.一种用于排序、减少和呈现至少一对数据记录的系统，所述系统包括：
处理器，用于根据权利要求11至16中任一项计算至少一对数据记录的相似性分数，其中依据所述相似性分数排序所述至少一对数据记录；
处理器，用于减少所述至少一对数据记录，该减少依据所述至少一对数据记录的排序；
以及
显示装置，用于呈现所减少的至少一对数据记录，该呈现允许用户标识公开相似概念的数据记录对。
18.一种用于包括相关数据记录的数据集的呈现和可视导航的计算机实现的方法，所述方法包括以下步骤：
·从具有至少一些相关数据记录的数据集中接收关注数据记录的标识符；
·确定所述数据集中与所标识的关注数据记录关联的记录；
·在图形结构中生成所标识的数据记录和关联的数据记录的可视表现，其中所述数据记录是通过链接互连的节点，每个链接表示各个数据记录之间的关联，由此形成网络；
·在选择表现数据记录的节点时，显示来自底层数据记录的预定属性信息供考虑；
·在显示所述预定属性信息期间，允许指定关注的其它数据记录；以及·利用所指定的数据记录的标识符，重复该方法的步骤。
19.一种用于包括相关数据记录的数据集的呈现和可视导航的计算机实现的方法，所述方法包括以下步骤：
·从具有至少一些相关数据记录的数据集中接收关注数据记录的标识符；
·确定所述数据集中与所标识的关注数据记录关联的记录，包括为每个数据记录分配根据与所述数据集中其它数据记录的连通程度确定的分数；以及
·在图形结构中生成所标识的数据记录和关联的数据记录的可视表现，其中所述数据记录是通过链接互连的节点，每个链接表示各数据记录之间的关联，由此形成网络；
其中：
·网络的可视表现包括：与具有达到或高于预定阈值的分数的数据记录相比，以更低的显示密度表现代表具有低于所述预定阈值的分数的数据记录的幻影节点，以及与所述幻影节点的链接。
20.一种用于包括相关数据记录的数据集的呈现和可视导航的计算机实现的方法，所述方法包括以下步骤：
·从具有至少一些相关数据记录的数据集中接收关注数据记录的标识符；
·确定所述数据集中与标识的关注数据记录关联的记录；
·在图形结构中生成所标识的数据记录和关联的数据记录的可视表现，其中所述数据记录是通过链接互连的节点，每个链接表示各记录之间的关联，由此形成网络；
·在选择表示数据记录的节点时，显示所述数据记录的预定属性的底层细节供考虑；以及
·在显示所述预定属性信息期间，引起将所述属性信息复制到所述可视表现的单独区域内。
21.一种用于包括相关数据记录的数据集的呈现和可视导航的系统，所述系统包括：
处理器，被设置用于访问包括多个相关记录的数据集；
所述处理器与界面关联且进一步被设置用于：
·通过所述界面接收数据集中关注数据记录的标识符；
·确定所述数据集中与所标识的关注数据记录关联的记录；
·通过所述界面，在图形结构中生成所标识的数据记录和关联的数据记录的可视表现，其中所述数据记录是通过链接互连的节点，每个链接表示各数据记录之间的关联，由此形成网络；
·在通过所述界面选择表示数据记录的节点时，显示来自底层数据记录的预定属性信息供考虑；
·在显示所述预定属性信息期间，允许指定其它关注数据记录；以及
·利用所指定的数据记录的标识符，重复所述处理器实现的步骤。
22.一种用于包括相关数据记录的数据集的呈现和可视导航的系统，所述系统包括：
处理器，被设置用于访问包括多个相关记录的数据集；
所述处理器与界面关联并且进一步被设置用于：
·通过所述界面接收所述数据集中关注数据记录的标识符；
·确定所述数据集中与所标识的关注数据记录关联的记录，包括为每个数据记录分配根据与所述数据集中其它数据记录的连通程度确定的分数；以及
·在所述界面上，在图形结构中生成所标识的数据记录和关联的数据记录的可视表现，其中所述数据记录是通过链接互连的节点，每个链接表示各记录之间的关联，由此形成网络；
其中：
·网络的可视表现包括：与具有达到或高于预定阈值的分数的数据记录相比，以更低的显示密度表现代表具有低于所述预定阈值的分数的数据记录的幻影节点，以及与所述幻影节点的链接。
23.一种用于包括相关数据记录的数据集的呈现和可视导航的系统，所述系统包括：
处理器，被设置用于访问包括多个相关记录的数据集；
所述处理器与界面相关联并且进一步被设置用于：
·通过所述界面接收具有至少一些相关数据记录的数据集中关注数据记录的标识符；
·确定所述数据集中与标识的关注数据记录关联的记录；
·在所述界面上，在图形结构中生成所标识的数据记录和关联的数据记录的可视表现，其中所述数据记录是通过链接互连的节点，每个链接表示各记录之间的关联，由此形成网络；
·在选择表示数据记录的节点时，显示来自所述数据记录的预定属性的底层细节供考虑；
·在显示所述预定属性信息期间，引起将所述属性信息复制到所述可视表现的单独区域内。
24.一种计算机可读介质，包含指令序列，该指令序列在由一个或多个处理器执行时执行根据权利要求1至23中任一项所述的方法的步骤。
25.计算机数据信号的发射或接收，包括在权利要求24中限定的至少一个被编码的指令序列。

说明书全文

用于网络数据集的呈现和可视导航的系统和方法

技术领域

[0001] 本发明涉及用于对包括一个或多个相关数据记录网络的数据集进行可视导航的系统和方法，具体地但不仅仅涉及用于知识产权数据集(如专利数据库)的互动可视检索的系统和方法。

背景技术

[0002] 随着廉价且强大的计算系统的出现以及电子数据库的发展，在与技术、工业、商业和社会几乎所有领域相关的数据收集和电子存储方面已经出现了激增。通常在许多情况下、以“纪录”的形式保留数据，“记录”通常包括描述现实世界对象或事件的一系列属性。例如，一种数据记录是健康记录，健康记录保留与特定人的属性有关的信息，如该特定人的身高、性别、体重、现在的和过去的医疗情况、已进行的治疗等等。另一种数据记录是描述科学出版物的数据记录，其中多个这样的数据记录可以形成集合并且被保留在例如出版物数据库中。这样的出版物数据库可以包括与出版物相关的属性，如每个出版物的作者、对其它出版物的引用或参考、每个出版物的出版日期和主题。

[0003] 另一种结构化的数据集是描述知识产权的数据，如专利数据记录或商标数据记录。许多国家具有如下法律制度：知识产权的所有者或创造者可以登记其对发明、标志和/或设计的权利。这样的记录是高度结构化的且包括大量属性，如提交日期、所有者或申请者的名称、发明人或作者的名字、与本发明的历史以及特定知识产权局分类代码(如IPC(国际专利分类)代码)相关的数据以及描述知识产权性质的其它属性。

[0004] 由于专利数据实际上是创新活动的记录，所以可以从检索专利数据中获得价值，以提取商业上有用的信息。然而，随着每年提交的专利申请的数量不断增长，由于技术发展的速度不断增加以及覆盖发明的更强的法律权利意识，现在的专利数据库包含数百万或数千万计的记录，因此每个专利数据记录包含庞大而复杂的一组属性。因此，用于检索这样的数据库的传统方法(如通过查找标题、摘要或申请人详情属性中的关键字)可能精度不够，容易出现错误并且会返回庞大且不便的数据集。

[0005] 一种用于选择、分析及可视化相关数据库记录的方法鉴于这些记录中至少一些记录之间或之中存在的关系来利用网络范式(network paradigm)。例如，美国公开2010/0106752(EcKardt(艾卡特)等三人)描述了一种用于通过提供记录的网络图形表现来理解相关数据库记录或文献集的网络可视化系统和方法。然而，已认识到分析和图形表现大型且复杂的数据集(如‘752号公开的图13中描绘的超过1000个专利文献的表现)中固有的困难。艾卡特在段落[0177]中指出，难以确定从专利文献的这张网络图中理解到什么，在该网络图中节点表示文献并且链接是引用联系。

[0006] 此外，如果不寻求专业协助以及详细地研究每个专利说明书，则难以判断与其它专利及已授权的发明相比，特定专利或由该专利保护的底层发明的相对价值或“优点”。因此，传统检索方法努力充分提供与专利的相对优点或价值相关的任何复杂的或高层次的信息。

[0007] 在一项提议中，美国专利7,716,226(Barney(巴尼))描述了一种在统计地评级、评估及分析知识产权资产(包括专利、专利申请及相关文献)的背景中，概率地量化及可视化两个或两个以上在引用上或在背景上相关的数据对象之间的相关性的方法和系统。然而，巴尼依靠专利文献的概率分析，特别地利用多变量回归来提供可视地图。该方法具有固有缺点，缺点包括与概率技术中使用的求平均关联的固有不精确性。

发明内容

[0008] 本文公开的是一种确定多个数据记录对目标数据记录的相似性分数的计算机实现的方法。该方法包括以下步骤：

[0009] ·从数据记录集中标识所述目标数据记录；

[0010] ·标识所述数据集中与所述目标记录具有初级连接和次级连接的数据记录以形成数据记录地图，上述记录是初级数据记录和次级数据记录；

[0011] ·对于所述次级数据记录中的至少一个次级数据记录，确定重要性值和相关性值，其中所述重要性值基于所述次级数据记录和所述数据地图中的其它数据记录以及所述数据集中的其它数据记录之间的互连，并且所述相关性值基于所述次级数据记录和所述数据地图中的其它数据记录之间的互连；以及

[0012] ·将所述重要性值和所述相关性值相结合以提供所述相似性分数，其中所述相似性分数允许用户标识公开相似概念的次级数据记录。

[0013] 在一些形式中，通过以下步骤确定所述至少一个次级数据记录中每个次级数据记录的所述重要性值：

[0014] ·计算所述数据地图中所述次级数据记录和连接至所述次级数据记录的所述初级数据记录之间的连接强度；

[0015] ·确定所连接的初级数据记录中每个初级数据记录的数据记录强度；

[0016] ·计算所述数据地图中所述次级数据记录与其它次级数据记录之间的连接强度；以及

[0017] ·确定所述数据集中所述次级数据记录中每个次级数据记录的所述数据记录强度；

[0018] ·其中将所述连接强度和所述数据记录强度相结合以形成所述重要性值。

[0019] 在一些形式中，通过以下步骤确定所述至少一个次级数据记录中每个次级数据记录的所述相关性值：

[0020] ·计算所述次级数据记录连接至所述数据地图中的初级数据记录的次数，以形成第一投票；以及

[0021] ·计算所述次级数据记录连接至所述数据地图中的另一次级数据记录的次数，以形成第二投票；

[0022] ·其中将所述第一投票和第二投票相结合以形成所述相关性值。

[0023] 在一些形式中，通过以下步骤确定所述至少一个次级数据记录中每个次级数据记录的所述相关性值：

[0024] ·依据所述连接强度，计算所述次级数据记录与所述目标数据记录之间的连接距离。

[0025] 在一些形式中，由用户标识所述目标数据记录。在至少一个实施例中，所述重要性值和所述相关性值被认为是权重，并且被结合以计算所述相似性分数。

[0026] 在一些形式中，所述数据记录是专利，所述初级数据记录连接至所述目标数据记录，因为所述初级数据记录和所述目标数据记录共享引用。在一些形式中，所述次级数据记录连接至所述初级数据记录，因为所述次级数据记录与所述初级数据记录共享引用。在至少一个实施例中，所述数据地图显示数据记录之间的连接。

[0027] 本文还公开了一种用于排序、减少和呈现数据记录的系统。所述系统可以包括：

[0028] ·标识装置，用于标识所述目标数据记录；

[0029] ·处理器，用于计算所述次级数据记录的所述相似性分数，其中依据所述相似性分数对所述次级数据记录进行排序；

[0030] ·处理器，用于减少所述次级数据记录，该减少依据所述次级数据记录的排序；以及

[0031] ·显示装置，用于与所述初级数据记录和所述目标数据记录一起呈现所减少的次级数据记录，该呈现允许用户标识公开相似概念的初级数据记录和次级数据记录。

[0032] 在第二方面中，本公开提供一种用于包括相关数据记录的数据集的呈现和可视导航的计算机实现的方法，所述方法包括以下步骤：

[0033] ·从具有至少一些相关数据记录的数据集中接收关注数据记录的标识符；

[0034] ·确定所述数据集中与所标识的关注数据记录关联的记录；

[0035] ·在图形结构中生成所标识的数据记录和关联的数据记录的可视表现，其中所述数据记录是通过链接互连的节点，每个链接表示各个数据记录之间的关联，由此形成网络；

[0036] ·在选择表现数据记录的节点时，显示来自底层数据记录的预定属性信息供考虑；

[0037] ·在显示所述预定属性信息期间，允许指定关注的其它数据记录；以及[0038] ·利用所指定的数据记录的标识符，重复该方法的步骤。

[0039] 在实施例中，每个节点的表现反映根据与所述数据集中所有其它数据记录的连通程度确定的数据记录的分数。优选地，在选择显示图标时，在所述可视表现中提供可视线索，以将注意力引导至表示下一最相关的关联数据记录的节点。适当地，至少部分基于对关联的数据记录中每个关联的数据记录确定的分数，对下一最相关的数据记录适当地提供可视线索。最适当的是，提供具有下一最高分数的关联数据记录的线索以供用户查看。

[0040] 在另一实施例中，每个链接反映各互连的数据记录之间的关联的强度。优选地，链接的宽度和/或长度与和每对链接的数据记录关联的相关数据记录的数量成比例。

[0041] 在第三方面中，本公开提供一种用于包括相关数据记录的数据集的呈现和可视导航的计算机实现的方法，所述方法包括以下步骤：

[0042] ·从具有至少一些相关数据记录的数据集中接收关注数据记录的标识符；

[0043] ·确定所述数据集中与所标识的关注数据记录关联的记录，包括为每个数据记录分配根据与所述数据集中其它数据记录的连通程度确定的分数；以及

[0044] ·在图形结构中生成所标识的数据记录和关联的数据记录的可视表现，其中所述数据记录是通过链接互连的节点，每个链接表示各数据记录之间的关联，由此形成网络；其中：

[0045] ·网络的可视表现包括：与具有达到或高于预定阈值的分数的数据记录相比，以更低的显示密度表现代表具有低于所述预定阈值的分数的数据记录的幻影节点，以及与所述幻影节点的链接。

[0046] 呈现表现为第二级专利形式的幻影节点作为网络可视表现的一部分，为该计算机实现的方法的用户(例如，专利审查员)提供多个优点。包括第二级专利允许专利审查员快速并有效地标识与关注专利不具有直接引用的数据记录，即未被审查员或专利申请人引用的专利。这允许该方法的用户快速地标识该关注专利非常相似的专利。此外，以这样的方式呈现专利允许公司容易地找出在非常相似的技术领域运营的其它公司。

[0047] 在实施例中，为每个数据记录分配的分数具有根据与其它数据记录的连接数量和连接程度计算的值。适当地，可以对该数据集中的所有记录归一化该分数。在该数据集是专利数据库的特定实施例中，通过前向应用数量、后向引用数量和引用的相对年代的加权结合，计算为专利数据记录分配的分数。适当地，针对该专利数据库中小于预定时间(例如20年)的专利的平均分数，归一化为每个专利数据记录分配的分数。

[0048] 在第四方面中，本公开提供一种用于包括相关数据记录的数据集的呈现和可视导航的计算机实现的方法，所述方法包括以下步骤：

[0049] ·从具有至少一些相关数据记录的数据集中接收关注数据记录的标识符；

[0050] ·确定所述数据集中与标识的关注数据记录关联的记录；

[0051] ·在图形结构中生成所标识的数据记录和关联的数据记录的可视表现，其中所述数据记录是通过链接互连的节点，每个链接表示各记录之间的关联，由此形成网络；

[0052] ·在选择表示数据记录的节点时，显示所述数据记录的预定属性的底层细节供考虑；以及

[0053] ·在显示所述预定属性信息期间，引起将所述属性信息复制到所述可视表现的单独区域内。

[0054] 在实施例中，该单独区域包括每个被复制的数据记录的属性信息的列表。该显示步骤可以进一步包括活跃窗口帮助对由所选择的节点表示的数据记录的用户评论输入和/或排序分配。优选地，可以与该属性信息一起复制用户评论和/或所分配的排序，由此例如通过打印提供审查追踪供查看、存储或输出。

[0055] 在第五方面中，本公开涉及一种用于包括相关数据记录的数据集的呈现和可视导航的系统，所述系统包括：

[0056] 处理器，被设置用于访问包括多个相关记录的数据集；

[0057] 所述处理器与界面关联且进一步被设置用于：

[0058] ·通过所述界面接收数据集中关注数据记录的标识符；

[0059] ·确定所述数据集中与所标识的关注数据记录关联的记录；

[0060] ·通过所述界面，在图形结构中生成所标识的数据记录和关联的数据记录的可视表现，其中所述数据记录是通过链接互连的节点，每个链接表示各数据记录之间的关联，由此形成网络；

[0061] ·在通过所述界面选择表示数据记录的节点时，显示来自底层数据记录的预定属性信息供考虑；

[0062] ·在显示所述预定属性信息期间，允许指定其它关注数据记录；以及[0063] 利用所指定的数据记录的标识符，重复所述处理器实现的步骤。

[0064] 在第六方面中，本公开涉及一种用于包括相关数据记录的数据集的呈现和可视导航的系统，所述系统包括：

[0065] 处理器，被设置用于访问包括多个相关记录的数据集；

[0066] 所述处理器与界面关联并且进一步被设置用于：

[0067] ·通过所述界面接收所述数据集中关注数据记录的标识符；

[0068] ·确定所述数据集中与所标识的关注数据记录关联的记录，包括为每个数据记录分配根据与所述数据集中其它数据记录的连通程度确定的分数；以及

[0069] ·在所述界面上，在图形结构中生成所标识的数据记录和关联的数据记录的可视表现，其中所述数据记录是通过链接互连的节点，每个链接表示各记录之间的关联，由此形成网络；

[0070] 其中：

[0071] ·网络的可视表现包括：与具有达到或高于预定阈值的分数的数据记录相比，以更低的显示密度表现代表具有低于所述预定阈值的分数的数据记录的幻影节点，以及与所述幻影节点的链接。

[0072] 在第七方面中，本公开涉及一种用于包括相关数据记录的数据集的呈现和可视导航的系统，所述系统包括：

[0073] 处理器，被设置用于访问包括多个相关记录的数据集；

[0074] 所述处理器与界面关联并且进一步被设置用于：

[0075] ·通过所述界面接收具有至少一些相关数据记录的数据集中关注数据记录的标识符；

[0076] ·确定所述数据集中与标识的关注数据记录关联的记录；

[0077] ·在所述界面上，在图形结构中生成所标识的数据记录和关联的数据记录的可视表现，其中所述数据记录是通过链接互连的节点，每个链接表示各记录之间的关联，由此形成网络；

[0078] ·在选择表示数据记录的节点时，显示所述数据记录的预定属性的底层细节供考虑；

[0079] ·在显示所述预定属性信息期间，引起将所述属性信息复制到所述可视表现的单独区域内。

[0080] 在第八方面中，本公开提供一种计算机可读介质，该计算机可读介质包含指令序列，该指令序列在由一个或多个处理器执行时执行根据第二方面至第四方面中任一方面或第十方面所述的方法的步骤。

[0081] 在第九方面中，本公开提供计算机数据信号的发射或接收，包括来自第八方面的至少一个被编码的指令序列。

[0082] 在第十方面中，公开一种确定至少一对数据记录的相似性分数的计算机实现的方法，所述方法包括以下步骤：

[0083] ·标识数据记录集中至少一对直接连接的数据记录；

[0084] ·计算所述直接连接的数据记录之间的连接距离；

[0085] ·标识所述一对间接连接的数据记录，所述间接连接的数据记录是通过至少两对直接连接的数据记录而连接的；以及

[0086] ·依据所述直接连接的数据记录之间的所述连接距离，计算所述一对间接连接的数据记录的所述相似性分数，其中所述相似性分数允许用户标识公开相似概念的数据记录对。

[0087] 在一些形式中，确定至少一对数据记录的相似性分数的所述方法包括以下步骤：

[0088] ·依据所述直接连接的数据记录之间的所述连接距离，计算所述至少一对直接连接的数据记录的所述相似性分数。

[0089] 在一些形式中，确定至少一对数据记录的相似性分数的所述方法包括以下步骤：

[0090] ·计算所述直接连接的数据记录的连接强度，其中所述连接距离的计算依据所述连接强度。

[0091] 在一些形式中，所述连接强度是通过以下步骤计算的：

[0092] ·标识与所述至少一对直接连接的数据记录中的两个数据记录都直接连接的其它数据记录，以获得所述至少一对数据记录之间的连接的总数的数量；以及

[0093] ·依据所述数量，计算所述连接强度。

[0094] 在一些形式中，确定至少一对数据记录的相似性分数的所述方法包括以下步骤：

[0095] ·设置至少一对间接连接的数据记录之间的所述相似性分数的预定水平；

[0096] ·移除低于所述预定水平的所述至少一对间接连接的数据记录；以及[0097] ·依据所述相似性分数，排序其余的至少一对间接连接的数据记录。

[0098] 在一些形式中，所述数据记录是专利，所述专利是直接连接的，因为所述专利共享引用。

[0099] 本文还公开了一种用于排序、减少和呈现至少一对数据记录的系统，所述系统包括：

[0100] ·处理器，用于根据权利要求11至15中任一项计算至少一对间接连接的数据记录的相似性分数，其中依据所述相似性分数排序所述至少一对间接连接的数据记录；

[0101] ·处理器，用于减少所述至少一对间接连接的数据记录，该减少依据所述至少一对间接连接的数据记录的排序；以及

[0102] ·显示装置，用于呈现所减少的至少一对间接连接的数据记录，该呈现允许用户标识公开相似概念的数据记录对。附图说明

[0103] 尽管存在可能落在本公开范围内的任何其它实施例，但现在还是参照附图通过示例描述本发明的几个实施例，其中：

[0104] 图1是根据本发明的一个实施例的用于包括相关数据记录的数据集的呈现和可视导航的系统的示意框图；

[0105] 图2是根据本发明的一个实施例的用于数据集中的记录的呈现和可视导航的方法的流程图；

[0106] 图3是用于计算数据集中各记录的分数的方法的流程图；

[0107] 图4描绘根据本发明的一个实施例的可视界面的框架；

[0108] 图5描绘图4所示框架内的第一示例数据集中的相关数据记录网络的可视表现；

[0109] 图6描绘已由用户评级的图5的数据记录网络的可视表现；

[0110] 图6A描绘图6的可视表现的放大部分，其中选择的节点的数据已被评级；

[0111] 图7描绘第一示例数据集的另一相关数据记录网络的另一可视表现，其采用的不同焦点记录是图6A中概括的记录；

[0112] 图8描绘图7的网络的可视表现，其中已选择不同的节点；

[0113] 图8A描绘图8的可视表现的放大部分，其中选择的幻影节点的数据已被评级；

[0114] 图9描绘又一相关数据记录网络的可视表现，其采用另一不同的焦点记录；

[0115] 图10描绘图9的又一网络的可视表现，其中已选择另一不同节点；

[0116] 图11描绘一种用于计算幽灵专利的相似性分数的方法；以及

[0117] 图12描绘数据地图的可视表现。

具体实施方式

[0118] 参照图1，图示本发明的实施例。该实施例被设置为提供一种用于分析和可视化数据的系统，该系统包括用于接收用户指令和显示信息的界面以及用于执行用户命令的处理器，用户命令包括以合适的方式收集用于进一步处理的数据的命令。在该示例实施例中，由具有适当用户界面的计算机实现该界面和处理器。可以由任意的计算体系结构实现该计算机，该任意的计算体系结构包括独立PC、客户端/服务器体系结构、“哑”终端/主机体系结构或任意其它合适的体系结构。该计算设备适当地被编程来实现本文描述的实施例。

[0119] 在该实施例中，提供本地数据库，该本地数据库包含记录(如专利数据记录)的集。在本文描述的实施例中，这些记录可能已根据由申请人提交的标题为“A system,method and computer program for preparing data for analysis(一种用于为分析准备数据的系统、方法及计算机程序)”的被公开为US 2012/0011132的共同待审申请进行选择和整理，该共同待审申请通过引用并入本文。在另一实施例中，将理解，该系统可以访问包含专利数据记录的独立地设置和/或管理的数据库。该数据库可以由政府当局或第三方独立地管理。

[0120] 参照图1，示出用于可视化网络数据的系统的示意图，在该实施例中该系统包括计算机，该计算机可以包括任何客户端或服务器机器。在该实施例中，该计算机是服务器100。该计算机(如服务器100)包括接收、存储及执行适当的计算机指令所必须的合适组件。组件可以包括处理单元102、只读存储器(ROM)104、随机存取存储器(RAM)106以及输入/输出设备(如磁盘驱动器108)、输入设备110(如以太网端口、USB端口等等)、显示器112(如液晶显示器、发光显示器或任何其它合适的可视显示单元)以及通信链路114。服务器100包括可以包含在ROM 104、RAM 106或磁盘驱动器108中且可以由处理单元102执行的指令。可以提供多个通信链路114，多个通信链路114可以各自地连接至一个或多个计算设备，如服务器、个人计算机、终端、无线计算设备或手持计算设备。多个通信链路中的至少一个可以通过电话线、同轴电缆、光纤、无线连接或其它类型的通信链路连接至外部计算网络。

[0121] 服务器100可以包括存储设备(如磁盘驱动器108)，存储设备可以包括固态驱动器、硬盘驱动器、光驱动器或磁带驱动器。服务器100还可以使用一个或多个磁盘驱动器。服务器100还可以具有合适的操作系统130，适合的操作系统130位于磁盘驱动器108上或服务器100的ROM中。该系统具有数据库120，数据库120位于磁盘或其它存储设备上，该磁盘或其它存储设备被设置为存储至少一个记录122，该至少一个记录122在至少一个实施例中提供包含专利相关数据的多个记录。数据库120与界面(包括上述组件中的一个或多个)通信，该界面是由位于系统100上的计算机软件实现的。

[0122] 界面202提供一种设置，用户通过该设置可以向服务器100输入用于执行或处理的命令、指令或请求，该设置包括硬件设备和软件功能的布置。该界面与处理器连接，并且被布置为促进用户命令的输入以及信息向用户的显示。界面202可以用输入设备(如键盘116、触摸板、鼠标118或其它指点设备)实现，在另一示例实施例中，界面202包括软件模块，软件模块可以被布置为通过网络连接(包括以太网、Wi-Fi、火线、USB等)接收输入、请求或数据。本实施例的界面202提供在实质分析之前、期间和/或之后进行的专利相关数据的适当可视化。

[0123] 下面的描述提供由该系统用于呈现、导航和互动分析大型数据集的一系列可视化技术。虽然将这些技术描述为分立组件，但是应理解这些技术可以结合使用，以提供任何相关数据集的丰富且深入的可视化。该系统和关联软件应用程序允许用户以任意合适的顺序应用这些技术，以向用户提供他们特定需求的最合适可视化。

[0124] 在详细描这些技术之前，提供一些定义是有益的，使得读者可以更好地理解这些技术的背景。

[0125] 首先，本文描述的技术主要应用于“网络”可视化。网络可视化是显示多个实体和这些实体之间的关系的可视地图或表。例如，火车站地图图是简单网络地图的很好说明。每个点或“节点”代表火车站，每条线或“链接”表示这两个站之间的轨道连接。通过使用简单的图形设备(如节点和链接)，可以在小空间中表达大量关于整个轨道网的信息，并且更重要的是，以用户(例如火车通勤者)可直观地理解的方式表达。根据正显示的数据的相对复杂度，可以以二维格式或三维格式提供该地图/表。

[0126] 其次，在本文描述的实施例的上下文中，利用网络可视化技术可视化专利数据。每个节点代表专利或专利申请，并且每个链接代表共同的共享属性值，如共同的引用(即，后向引用或前向引用)。

[0127] 最后，应理解，任何合适的可视化技术/软件组件可以用于创建网络的可视图像。

[0128] 记住这些点—由该系统和方法利用的各种技术(其可以至少部分地被实现为软件应用程序)，现在将参照图2和图3描述其实施例。

[0129] 主软件模块执行具有图2中描绘的流程210的方法，该方法在步骤212中通过加载相关记录的数据集(例如来自数据库120的专利数据记录集)开始。在步骤212中，在例如可视显示单元112上显示界面框架500，下面结合图4进一步描述界面框架500。通过该框架向用户呈现的信息提示通过界面202输入关注的数据记录(如专利记录)的标识符，该标识符是在步骤216中接收的。

[0130] 在步骤218中，调用子模块，该子模块传递该标识符以确定该集合中与所标识的记录关联的数据记录，并因此向每个关联的记录(和所标识的记录)分配根据与该数据集中所有其它记录的连通程度确定的分数。这将在下文中结合图3进一步描述。在步骤220中，利用在步骤218中确定的关联和分数，该方法在图形结构中生成所标识的数据记录和关联的数据记录的可视表现，其中专利记录是点或“节点”，所关联的记录由弧线或“链接”连接。图5中示出这样的可视表现532的示例(其已经使用美国专利No.7,631,968作为所标识的或最初选择的专利数据记录)。下面结合图5描述此示例表现的附加特征，附加特征包括专利概要框540，专利概要框540包含将在步骤222中显示的被选择的底层专利记录的已选属性。在第一次经过方法步骤222时，所选择的记录默认为所标识的记录，等待进一步的用户输入。

[0131] 在步骤222结束时，此方法主动地等候来自用户的这样进一步输入。在该实施例中，决策步骤224处的专利记录的“选择”是由用户通过使用指点设备(如鼠标118)从一个节点移动至另一节点或通过键盘116上一个或多个预选择的按键，在该网络各处导航来实施的。如果需要，则该框架能够包括“Next”按钮501，通过该“Next”按钮501将用户引导至具有下一最高“分数”的专利记录。这有助于接近具有相对紧密分组的节点的网络，将结合图7进一步解释。在选择新节点(例如节点564)时，出现新的弹出式专利概要框540a(见图6A中与美国专利No.6,349,001相关的放大图)。作为流程返回步骤222的结果，该概要框540a包含来自底层专利记录的预定属性。

[0132] 决策步骤226处的操作涉及新数据记录的指定(不同于仅显示属性)，以重生成新的可视表现。在该实施例中并参考图6A，这被实现为在专利概要框540a中设置的“Focus”按钮556，其结果在图7中示出。将理解，该方法可以包括更多决策步骤，以适应显示要求。例如，可以在步骤224和步骤226之间提供用于过滤显示的决策步骤，该决策步骤由来自菜单栏506的年份、百分比或关键字过滤器的用户调整来触发，并且该决策步骤可以控制向步骤220的返回。这将实施对(已经显示的)专利网络图的调整，该调整由向该可视表现施加的不需要再生成的用户要求过滤器导致。作为示例，设置年份的下界至1990将排除与
1989年或更早发布的专利的所有记录有关的节点的呈现，这包括从1990年之前的专利至剩余专利记录的所有链接。

[0133] 我们现在转到与用于确定该集合中与所标识的记录关联的数据记录的子模块相关的流程的介绍，并且作为结果，向每个关联记录(及所标识的记录)分配根据与该数据集中所有其它记录的连通程度确定的分数。更特别地，我们将讨论如何确定性地计算该分数。就该实施例而言，连接属性是引用，因此节点基于引用在该表现中被链接在一起，链接优选地具有用于前向引用的第一外观以及用于后向引用的另一对照外观。转向图3所示的流程，子流程218中的第一步骤230涉及为每个数据记录对由引用属性创建的链接进行归类，这在每个情况中可能涉及多对一关系、多对多关系或者一对多关系。

[0134] 后续步骤涉及关于与其它数据记录的连接规模和连接深度的一些中间指标的计算。第二步骤232要求计算每个数据记录的第一级连接数：Fc，为方便起见称为“朋友”。然后，第三步骤234要求计算每对第一级连接(或每对朋友)中那些朋友共同具有(“朋友的朋友”)的对所有朋友对相加得到的第一级连接数：SFc，为方便起见称为“总共享朋友”。作为示例，如果特定记录只有2个“朋友”(即，第一级引用链接)且那两个朋友的两个记录中每个自身具有5个共同的朋友记录，则总共享朋友会是：2×5＝10。

[0135] 随后，下一步计算步骤236涉及为每个数据记录计算前向链接(即至时间上较晚的记录)的数量，以提供前向链接数量：FLc。可选地，前向链接数量受限于时间加权曲线，其降低较旧的前向引用的权重。下面在表1中陈述合适加权曲线的权重的示例。

[0136]1年 2年 3年 4年 5年 6年 7年 8年 9年 10年
1.0 1.0 1.0. 1.0 0.84 0.7 0.6 0.52 0.46 0.4
11年 12年 13年 14年 15年 16年 17年 18年 19年 20年
0.36 0.32 0.286 0.26 0.24 0.22 0.2 0.18 0.156 0.144

[0137] 表1–前向链接的权重降低

[0138] 专利记录示例中近期的前向引用通常表示近期活动，近期活动是好的。但是，如果专利是15年或更久的且其所有前向引用立刻后向，则这表示没有近期相关活动，因此，应大幅地降低这样的前向引用的权重，如通过此时间权重。进一步调整(尤其对于少于5年的专利)是按比例增加前向引用-例如：

[0139] 按年代比例修正的FLc＝年代修正的FLc*5/3………(1)

[0140] 最后，在步骤238中，在对数据集中的记录的平均值归一化之后，分数因此是两个组分SFc和FLc的因子相加，例如(在专利记录的情况下)过去20年里发布的专利。

[0141] 分数＝f1*|SFc|+f2*|FLc|........(2)

[0142] 其中，f1＝f2＝0.5

[0143] 申请人已找出通过此方法计算的每个记录的分数，以有效地反映包括链接起来的记录的数据集中数据记录的连通程度。回到图2，一般来说，申请人已找出这种确定性分数为生成步骤220中实施的相关记录的图形结构的标识提供依据，如图5所示。用于显示目的的粗略引导将示出从所标识的关注记录起向后不超过大概3个链接的节点。作为进一步的示例，在以特定表现显示的数据记录的分数的情境下，实施用于为下面进一步描述的所谓“幻影”节点(见例如图5中的节点560)提供阈值的合适数据记录分数的计算，即阈值在某种程度上是显示数据情境敏感的。

[0144] 图4示出根据第一实施例的用于可视界面的框架500，该可视界面可以在显示器112上呈现且用于通过输入设备(如键盘116及鼠标118)与用户交互。框架500在上边缘处包括菜单栏502，菜单栏502具有(从左向右移动)：“Search”输入域504，“Search”输入域504用于接收关注的初始数据记录的标识符；属性过滤器子菜单506，属性过滤器子菜单506具有用于指示期望年代范围508(例如1974-2007)和分数百分比510(在下面进一步描述)的滑动条；以及这里呈“key word”域512形式的字母数字输入域。可视化子菜单
514被设置在菜单栏右侧，具有刷新播放/暂停按钮516、呈鱼眼镜头518形式的局部显示放大按钮、“Save/Share”结果按钮520以及“Help”按钮522。

[0145] 为数据记录网络的可视表现保留的主显示区530左侧的界限是“Key”按钮524以及“Tips”按钮526连同关联的下拉列表。在促动该Key按钮时，该界面列出对该可视表现的要素应用的特定图标大小和外观代码，如颜色，并且通过促动Tips按钮526，另一下拉列表表示用户当前可用的动作。用户选择的结果区528以主显示区530右侧为边界，在本实施例中该用户选择的结果区528被布置为以列表的形式显示。该列表可以包括例如每个数据记录的标识符以及其它属性列，如用户相关性排序、文献标题、所有者、日期及系统计算的分数(在特定的实施例中被称为“全局分数”)。现在将结合特定示例描述该界面的操作。

[0146] 示例-US专利No.7,361,968

[0147] 现在结合图5至图7描述第一实施例的呈现和可视导航方法和系统的操作的第一示例，其中该数据记录集包括美国专利数据。在将“US7361968”输入到图5所示的检索域504中以后，生成数据记录网络的可视表现532。这里，美国专利数据记录检索的最初焦点是名称为“Cell phone display that clips onto eyeglasses(夹在眼镜上的手机显示器)”的美国发明专利No.7,361,968(‘968)，该专利被转让给‘Motion Research Technologies,Inc(运动研究技术公司)’并且于2006年被授权。在表现532中，数据记录是通过链接而与关联数据记录的节点互连的节点，由此形成专利记录网络，节点(记录)和链接(关联)被设置在图形结构中。在该实施例中，关联的数据记录是在专利申请的诉讼期间列出(“后向引用”)的专利文献的记录或在专利申请的诉讼期间列出该专利的后来申请(即，有时被称为“前向引用”)的专利文献的记录。应注意，在当前界面中已最小化了关键图标524和提示图标526以及用户结果/审核追踪区528，以便在显示器硬件上为主显示区530提供最大空间。

[0148] 每个节点被显示为代表底层专利记录的点，点534被对照(如红色)圆包围(点534在这里是‘968专利)，以指示该专利网络可视表现的“焦点”专利的节点。与’968专利关联的所有专利是该网络的互连节点，其中用浅灰色的点表现这些节点，用具有对比外观(如颜色)的弧线表现的链接。在一些实施例中，紫色线536用于显示后向引用链接是专利记录关联的第一子集，并且绿色线538用于显示前向引用链接是专利记录关联的第二子集。点的适当大小或面积代表根据至每个专利的互连的相对强度确定的分数，该分数有效地指示该网络中各个专利的影响(互连性)。在本示例中，‘968专利有0.24的分数。这是低于本实施例中的平均分数的分数，因为通过归一化结果，过去20年内授权的所有美国专利的平均互连强度在该确定中被设置为‘一’(1)。如果需要，线的粗度也可以被设置为反映两个特定节点之间的连接强度，如通过计算与一对专利记录共同关联的有时被称为“共享朋友”的其它数据记录。

[0149] 在最初生成专利网络表现532时，呈现包含该专利(这里是“焦点”专利‘968)的预选属性信息的弹出式概要框540以及该专利的分数。这里，属性信息被选择为包括专利的标题、编号、授权年份、受让人/所有人名字以及该专利记录中可用的(在示出的附属框542中)任何图像。图像是被认为是一种供用户快速连续查看许多记录的特别有效方式，以迅速将记录摒除为“不相关”或进一步查询该记录的细节(下面结合图6A讨论)。概要框540可以被拖动至主显示区530中的任意期望位置以例如显示出被遮盖的节点，但仍然通过直线544锚定至该节点以使混乱最少。右上角的呈包含叉的圆形式的图标546可以被促动，以“关闭”该概要框540。在替代布置中，专利概要框540可以被设置为出现在固定位置，例如在显示器的右下角。可以在缩短的用户结果区528(见图4)的底部设置一个合适的固定位置。在该概要框的右下角548显示上述‘968专利的分数—0.24。

[0150] 专利概要框540进一步包括(在左上角)评级按钮550，评级按钮550可以通过用户促动来循环经过多个预设的评级值。对专利记录施加的用户评级还可以导致各节点的选择性颜色编码，例如检索相关性包括：将不相关评级为“0”—节点颜色为绿色；将可能相关评级为“1”—节点颜色为橙色；以及将相关评级为“2”—节点颜色为品红色。参照图6，图6示出所有专利/节点的相关性被评级的专利网络表现532a。在专利概要框内还设置了用户可访问的“评论”域552，该“评论”域552允许用户按需插入自由文本。此外，本实施例的界面被配置为采集用户对任何专利的评级、评论和简要详细描述，例如通过将预选的专利细节复制至(目前最小化的)用户结果区528。在有序列表中适当地布置的这些采集能够形成该表现中已查看过哪些记录的历史。尽管目前的专利可以被从0评级到2，但是这可以根据底层数据的性质按需扩展。

[0151] 返回图5，专利框540的专利评级按钮550中的问题标记“？”显示用户还未评级‘968专利，该‘968专利的概要当前正在显示。本实施例的另一可视特征是将已访问(以及概要被查看，但未被评级)的节点的颜色从浅灰色变化为对照的浅色，如黄色。通过将此可视特征链接到用户评级功能，评级按钮550的背景颜色也可以做成与专利记录未被评级时相同，因此在该例子中是黄色。访问仅需要光标在节点上保持预设的一段时间(也导致显示专利概要框540)。在替代形式中，可能需要在关注的节点上的用户驱动(如鼠标单击)以引起概要框的显示，并因此构成访问。

[0152] 可视表现532还显示获得更高分数的专利的节点，这些获得更高分数的专利与本身连接至‘968专利的专利连接。这些间接连接的专利可以被视为有影响的‘朋友的朋友’。就该可视表现而言，这些节点被称为“幻影”节点，因为它们以较低的显示密度呈现，且优选地以透明为特征。因此，可以容易地将幻影节点(如节点56)标识为该表现中可看见底层链接562的节点，即：

[0153]

[0154] 相比之下，与满密度节点(如节点564)相反，其中连接线(如链接538)隐藏在用于直接连接的节点的点后，即：

[0155]

[0156] 申请人已经发现：位于幻影节点下面的专利记录(如节点560)可能非常有价值。这样的专利记录可以包含可能相关的公开，在官方审查期间未考虑这样的可能相关的公开，但仍可能与考虑正被检索的发明相关。

[0157] 现在转到图11，将参照专利文献详细描述确定多个数据记录对目标数据记录的相似性分数的计算机实现的方法。在步骤800中，从数据集中标识呈焦点专利形式的目标数据记录，该数据集具有至少一些相关专利。在一个形式中，用户输入专利的申请号。在步骤802和步骤804中，该数据集中具有与该焦点专利的初级连接和次级连接的专利被标识以形成数据记录地图，这样的记录是初级数据记录和次级数据记录。呈第一级专利形式的初级数据记录是直接连接至该焦点专利的专利。专利可以是直接连接的，因为它们共享引用。
呈第二级专利形式的次级数据记录是直接连接至第一级专利的专利。它们被称为第二级专利，因为它们与该焦点专利二次分离。在图11和图12中，专利是连接的，因为它们共享引用。根据参考专利，该引用可以是前向引用或后向引用。呈‘幻影节点’或‘幽灵节点’形式的第二级专利可能与焦点专利非常相似或与焦点专利密切相关。例如，第二级专利可以与焦点专利处于相同的技术领域或公开与焦点专利相似的概念。许多检索技术漏掉第二级专利。对于大多数专利而言，将存在非常大量的关联的第二级专利。因此，难以确定应向检索者呈现哪些第二级专利。图11和图12详细描述用于计算第二级专利的相似性分数的方法。

[0158] 在步骤810处，计算第二级专利的‘重要性值’。该重要性值考虑第一级专利与第二级专利之间的连接强度，所连接的第一级专利的强度，数据地图中的第二级节点之间(例如，共享引用但不与第一级专利共享引用的两个第二级专利之间)的连接强度以及此连接的第二级专利的强度。此重要性值给出第二级专利的‘重要性’的恰当指示，并且通过图12中示出的示例进一步详细描述该重要性值。图12示出简单数据地图，其中A是焦点专利。专利B、C、J、H和I是第一级专利，因为它们与A共享引用。箭头表示引用的方向。专利E、D、F和G是第二级专利，因为它们与直接连接至焦点专利的第一级专利共享引用。存在用于确定连接的专利之间的连接强度的多种方式。一种方法是计算‘链接值’。该链接值通过确定一对连接的专利之间的共享连接的数量来计算。例如，专利A和专利B之间的链接可以被分配3的链接值，因为该A-B对共享2个共同连接且直接连接。表2详细描述图12中的第一级专利的链接值。

[0159]连接链接值
A-I 1
A-H 1
A-J 2
A-B 3
A-C 2

[0160] 表2–焦点专利和第一级专利之间的链接值

[0161] 第二级专利连接至的第一级专利的强度可以是在执行检索以前向该数据集中的每个专利分配的预定值，该预定值呈‘全局分数’的形式，该全局分数可以与该数据集相关，而不是与数据地图相关，因为其是在标识焦点专利之前为该数据集中的每个专利计算的预定值。全局分数中可以包含的因素包括专利年代，其具有多少前向引用以及随时间推移的引用率。在一些形式中，对随时间推移的引用率进行归一化，以允许相对最近的专利具有高的全局分数。对于专利网络而言，当向该数据集添加新专利时，可以在执行检索之前更新受影响的专利的全局分数。以与计算第一级专利和焦点专利之间的链接值差不多的方式，计算两个第二级专利之间的连接强度。表3详细描述了图12中的第二级专利的链接值。

[0162]连接链接值
C-G 1
C-F 1
C-D 2

[0163]C-B 3
B-E 2
C-E 3
D-E 2

[0164] 表3–第一级专利和第二级专利之间的链接值

[0165] 除全局分数以外，在计算第二级专利的重要性值时还考虑第二级专利的强度。然后可以向这四个因素(第一级专利的强度、第一级专利和第二级专利之间的链接的强度、第二级专利的强度以及第二级专利之间的链接的强度)赋予权重，并且计算每个第二级专利的整体重要性值。表4详细描述了图12中的第二级专利E的重要值的示例计算(注意，已随机分配了这些专利的全局分数)。

[0166]

[0167] 表4–E的重要性值

[0168] 应注意，参照图11和图12作为示例使用的四个因素仅是说明性的。计算重要值的其它方法(从而可以使用这些因素中的三个或三个以下)也可能是有用的。但是，利用所有四个因素提供第二级专利的‘重要性’的恰当指示。

[0169] 在步骤812处，为每个第二级专利计算相关性值。相关性值提供第二级专利与数据地图内的焦点专利的相关性的恰当指示。使用投票方法计算该相关性值，其中该数据地图中的每个专利彼此投票。计算该数据地图中每个第二级专利被第一级专利参考的次数，并且向该参考给予两票(第一级专利给予其连接至的每个第二级专利两票)。计算该数据地图中每个第二级专利被第二级专利参考的次数，并且向该参考给予1票(第二级专利给其直接连接至的每个第二级专利一票)。在此示例中，考虑引用的方向。“被”指从一个数据记录至另一数据记录的前向引用。例如，结合图12，专利E将从D得到一票，但D不会从E得到投票。可以使用引用方向不影响网络中的专利的相关性值的另一方法，但是，这会对网络中每个专利的相关性和相似性给出不同结果。表5详细描述图12中示出的第二级专利E的相关值的示例计算。

[0170]连接票
C-E 2票
D-E 1票
B-E 2票

[0171] 表5–专利E的相关性值

[0172] 专利E的相关性值因此是5(从连接的第一级专利和第二级专利得到的投票之和)。然后，可以通过向重要性值和相关性值赋予权重来计算第二级专利(‘幽灵专利’)的整体相似性分数。在一个形式中，向重要性值赋予0.25的权重，向相关性值赋予0.75的权重。通常，认为相关性值比重要性值具有更大意义，因为相关性值对检索查询而言更具体。图12中的幽灵专利E的分数因此是4.82(0.75×5+0.25×4.29)。

[0173] 如对本领域技术人员来说显而易见的是，通常存在比第一级专利多得多的第二级专利。因此，呈现所有第二级专利可能扰乱呈现。处理此问题的一个方法是减少第二级专利的数量。减少的方法包括以下步骤：确定待显示的幽灵专利的理想数量(这基于网络中第一级专利的数量)，这于是确定减少程度；通过将相似性分数分布在百分数量(buckets)上(例如，0％的数量以10％的增量增加至100％将给出10个数量)来排序第二幽灵专利，然后确定得出少于所需数量的第二级专利的减少点。该百分数量确保具有相同分数的两个第二级专利二者都在减少过程中保留。然后，可以与第一级专利一起呈现经减少的幽灵专利集，如图5所示。

[0174] 可以提供呈计算机形式的系统，以排序、减少和呈现数据记录。该系统可以包括呈往计算机程序内的用户输入形式的用于标识焦点专利的标识装置。该系统还可以包括呈处理器形式的用于计算次级数据记录的相似性分数的计算装置。可以依据如上所述的相似性分数对次级数据记录进行排序。此外，可以提供再次呈处理器形式的用于减少次级数据记录的装置。此外，可以提供呈计算机屏幕形式的显示装置，以用于与初级数据记录和目标数据记录一起呈现经减少的次级数据记录。该呈现允许用户标识指向与焦点专利相似概念的初级数据记录和次级数据记录。

[0175] 返回图12以及表2和表3，示出确定至少一对数据记录的相似性分数的计算机实现的方法。该方法包括以下步骤：标识数据记录集中呈共享引用的专利形式的至少一对直接连接的数据记录。然后，该方法计算该直接连接的数据记录之间的连接距离。可以使用结合表2和表3描述的连接强度(也被称为链接值)确定该连接距离。该连接强度可以通过以下方式进行计算：标识与该对直接连接的数据记录中的两个数据记录直接连接的其它数据记录，以获取该对数据记录之间的连接总数的数量；以及依据该数量计算连接强度。

[0176] 确定直接连接的数据记录之间的连接距离的一个方法是：将连接强度转换成零和一之间的值，如在表6中参考表2和表3中确定的连接强度(链接值)详细示出的。在此示例中，链接值和连接距离之间的转换系数是1/sqrt(连接强度)。从连接强度到连接距离的转换可以是多种形式。甚至可能是平方和，或具有与使用连接强度确定两个间接连接的数据记录之间的相似性一样效果的另一种形式的转换。

[0177] 使用转换系数1/sqrt(连接强度)，高链接值成为小的连接距离。然后可以标识一对间接连接的数据记录，其中间接连接的数据记录通过至少两对直接连接的数据记录而连接。例如，图12中的数据记录I和D是间接连接的，因为它们通过四个直接连接的对D-E、B-E、A-B以及I-A而连接。数据记录I和D也通过六个直接连接的对I-A、A-J、J-B、B-C、C-E以及E-D而连接。如图12中能够看到的，间接连接的数据记录I和D之间存在许多路径。

[0178]连接连接强度连接距离
A-I 1 1.00
A-H 1 1.00
A-J 2 0.71
A-B 3 0.58
A-C 2 0.71
C-G 1 1.00
C-F 1 1.00
C-D 2 0.71
C-B 3 0.58
B-E 2 0.71

[0179]C-E 3 0.58
D-E 2 0.71
B-J 2 0.71

[0180] 表6–直接连接的数据记录对之间的连接距离

[0181] 然后，可以计算直接连接的和间接连接的数据记录对的相似性分数。此计算依据直接连接的数据记录之间的连接距离。例如，数据记录I和D之间的连接距离可以是直接连接的对D-E、B-E、A-B以及I-A或者I-A、A-J、J-B、B-C、C-E以及E-D中的每个对之间的连接距离之和。可以为每个间接连接的数据记录对分配最短连接距离。确定两个间接连接的数据记录之间的最短连接距离的一种方法是使用A*路径算法，或任意其它合适的最短路径寻找算法。对于I和D而言，最短连接距离是通过直接连接的对I-A(1)、A-C(0.71)和C-D(0.71)，是2.42。计算该数据地图中每对文献的相似性分数，该相似性分数的呈现允许用户标识直接或间接连接的数据记录对，直接或间接连接的数据记录对公开了可以处于相似技术领域或不相似技术领域的相似概念。例如，电信技术领域中的专利可以公开或要求保护与计算机科学技术领域中的专利相似的概念。

[0182] 在存在大量数据记录的情况下，仅呈现最相似的数据记录对是有好处的。因此，该方法还可以包括以下步骤：设置间接连接的数据记录对之间的相似性分数的预定水平，移除低于该预定水平的间接连接的数据记录对，以及依据相似性分数排序其余的间接连接的数据记录对。所排序的数据记录可以从最相似到最不相似的其余数据记录对。当数据记录表现为专利形式时，此排序会向用户提供详细描述最可能指向相似概念的专利的文献列表或图形。可替代地，该方法可以包括以下选项：一旦标识任何间接连接的数据记录对之间的引用距离大于预定值，就停止。随后的报告可以由直接连接和间接连接的数据记录对(表现为专利对的形式)及其连接距离值的列表构成，其中优先权日期可以用作确定专利占先或专利侵权的预示。

[0183] 例如，如果公司A具有大型专利组合并且想要将其组合与公司B的大型专利组合作比较，则此方法将为公司A提供快速评估公司A的与公司B的专利最相似的专利的能力。如果公司A想要确定公司B的那些专利最可能占先或侵权公司A的专利，这会是有用的。此外，此方法还可以在标识最相似的第二级专利时用作用于确定如上所述的‘相关性值’的方法的替代方法。此外，此方法还可以用于确定与目标数据记录非常相似的属于第三或第四级(或更高级)连接的数据记录。

[0184] 再次转向图6，申请人已致力于评级所有连接的专利，这导致各节点560、566、568、570、572、574的点的颜色改变至品红色，以反映“相关的”2的评级。节点564、576、578、
580、582和584有橙色的点，以反映“可能相关的”的1的评级；而节点586、588、590和592均被表现为绿色的点，以反映“不相关”的0(零)的评级。值得注意，申请人发现大部分幻影节点与其链接的专利记录的调查相关。

[0185] 在图6A中，放大并显示了可能相关的连接的美国专利No.6,349,001(‘001)的节点564，该节点被访问以显露根据相关专利记录填充的专利概要框540a。在该实施例中，鼠标单击促动可以将该概要框锁定为“打开”，并且允许为了比较目的而访问其它节点。这里，‘001专利被认为在专利数据集中“有影响力”，因为其具有13的分数548a。换句话说，‘001专利是授权的美国专利的平均值的影响力(即，互连至其它专利)的13倍。此示例说明了本实施例的系统和方法可能直观地检索记录的集合(如，数据库中的专利)以找出可能相关的记录。专利概要框540a包括位于评级按钮550a下方的另外两个用户可促动的按钮，即“Details”按钮554以及“Focus”按钮556。当促动“Details”按钮554时，本实施例的系统被设置为打开新窗口，该新窗口显示从关联的专利数据库(例如，通过谷歌专利门户网站提供的专利数据库)获得的专利记录的全部细节，以提供与该专利记录相关的全部细节。

[0186] Focus按钮556提供另一特征，该特征也能够辅助找出相关现有技术——即‘漫步网络’的能力，或将该专利网络重聚焦在另一专利上。在本示例中，已通过促动上面介绍的专利‘001的专利概要框540a中的Focus按钮，来完成这个。图7中示出重聚焦的结果，该结果实际上将US6349001指定为主要关注的专利记录的标识符并且在确定专利数据集中哪些专利连接至‘001专利并随后对每个连接的专利进行“评分”以后重新生成另一(新的)可视表现600。由于与‘001专利的特定链接，重要的是注意到该聚焦动作从专利数据库中显露出不同的一组数据。能够看到，专利概要框被锁定在适当位置且节点564被对比颜色的圆高亮。应注意到，新的表现600中的节点中的一些节点与已由用户查看并由用户排序的专利相关。因此，例如，节点588已具有对比绿色，节点576具有橙色，节点560、566、568、572以及574具有品红色。这是因为这些节点用于在聚焦在‘946专利上的网络表现中也能够看到的专利，并且本实施例的系统记得这些专利的之前用户评级并将这些评级转移至新的表现600。实际上，这意味着用户不必再次查看这些专利，且作为替代，可以关注重新生成的集合中的‘新’专利，这些‘新’专利由具有对比的灰色的节点表示。此外，在本实施例中还保留审计跟踪历史的内容(包括之前已在用户结果区528(见图4)中列出的被输入到框552中的评论)。

[0187] 从图7能够看出，可视表现600说明了具有比之前图5的表现532更多节点和链接的专利文献网络图。如结合图4介绍的，菜单栏506提供可以辅助降低表现复杂性的几个工具。这些工具包括：专利年份范围滑动条508——允许从该表现中暂时移除更早发布的专利；％滑动条510——允许暂时移除得分较低的专利；以及，关键字域512——允许输入关键字，如描述符或申请人名字，以高亮相关节点(如通过相关节点周围具有对比颜色的同心圆)。上面描述的专利节点的移除进一步减少了凌乱，因为还移除了至被过滤的专利节点的关联链接。

[0188] 但重新生成的表现600中的这些专利中的任何专利与‘946专利相关？是的，这些专利中的一些专利是这样的，由用户进行的进一步调查是值得的。例如，“漫步网络”的一种方式是由用户促动该框架左下角的“Next”按钮501。这利用专利分数值来选择下一最相关节点602，如图8中描绘的，下一最相关节点涉及相对接近的US5585871的专利记录。从专利概要弹出框540b中，我们观察到此专利有3.3的分数。申请人已针对与调查的相关性将此专利公开评级为“2”。因此，我们具有用于找出与关注的起始专利相关的专利的第二条途径。

[0189] 但是，也有不少用于其它专利的幻影节点，例如图8A中的节点604处的专利记录US5606743。通过点击Focus按钮605更新该显示。在促动时，该检索(见域504)已被重新聚焦，如图9所示。这是节点702处有影响力的专利，该有影响力的专利从各专利概要704中可见具有11的分数，换句话说，是被授权的US专利的平均影响力的11倍。这是检索期间标识相关专利的第三种方式。

[0190] 在促动Next按钮501时，我们被带至节点706，节点706涉及(根据评级按钮中的“？”图标)之前未被查看/被评级的专利记录US51006179，如图10中所示。

[0191] 在上面的示例的讨论中，我们已示出如何能够简单地通过从你关注的专利号开始，找出可能相关的专利现有技术，该可能相关的专利现有技术中的一些被专利审查过程忽略。该可能相关的现有技术可以包括：

[0192] ●直接连接的专利，

[0193] ●幽灵专利，

[0194] ●连接至直接连接的专利的专利(‘朋友的朋友’)，或

[0195] ●连接至幻影专利的专利(‘朋友的朋友的朋友’)。

[0196] 使用传统专利检索对接近但不够接近的专利的简单检索能够提供合适的起始专利。

[0197] 考虑在此检索示例中还未做什么也是值得的，即：

[0198] ●我们未查看任何关键字或语义项，但如果需要，此选择可以用。不同专利申请人可以对同样的发明概念使用不同的关键字，而这可能在仅使用关键字检索专利主题时引起错误。

[0199] ●我们未查看任何专利分类，如国际专利分类(IPC)代码，国际专利分类(IPC)代码可能不精确。

[0200] ●还没有必要未花费许多小时看较长的专利列表，他们中许多是不相关的。作为替代，我们依赖于引用网络的力量来快速标识相关，这些相关中的一些好像被最初的专利审查员漏掉。

[0201] 该实施例的网络图形表现可以基于节点大小、链接数量和粗度、该表现中节点相对于初始检索的“焦点”专利的节点的位置(距离)以及专利节点相对于其它专利的位置(聚类)(包括由幻影节点表示的专利)来提供可视导引机制。如从下面的讨论中将显而易见的，用户能够基于以下考虑中的一个或多个，直观地选择要查看的专利：

[0202] ●“有影响力的”专利，其中节点大小反映专利记录分数；

[0203] ●专利链接的数量，前向连接或后向连接；

[0204] ●焦点专利和关注的其它专利之间的链接的粗度，该链接可以反映该链接共享朋友数；

[0205] ●从本专利至焦点专利或可能关注的其它专利的距离；和/或

[0206] ●一些专利是否位于相似或相关专利的集群中。

[0207] 在另一实施例中，该系统和方法可以被设置为，通过将全局重要性分数(全局分数)和立即链接的(例如，通过引用链接)专利(或/和第二级等)的同样分数进行比较，提供局部重要性分数，而不是关于关键字或IPC分数。这样的局部重要性分数可以与连接的专利的相同分数的平均值作比较，或与关于这些其它分数的相对排序作比较、或任何其它合适的标准作比较。

[0208] 在本发明的另一实施例中，可以设想，该系统将能够：采集成经由唯一的超链接访问的文件的形式的专利图、排序等的表现，该文件可以通过电子邮件发送至用户的电子邮件地址或任何其它期望方/授权方；并且，能够在同一点通过选择此超链接来重新打开被采集的专利图的该可视表现。被超链接的文件将包括该专利图的所有用户附加评论和注释，并且可以用于从任何适当的可用的浏览器重新打开该图以及用户排序/评论等。

[0209] 在本发明的又一实施例中，可以提供特定专利数据库特有的工具，这些工具包括：

[0210] 1)族成员检索

[0211] 想象你选择澳大利亚的专利号，而仅找出几个引用链接。但存在专利概要框的一部分，该部分允许用户例如打开第二框，该第二框显示所有已知的族成员，这些族成员包括例如US专利族成员。通过选择此US族成员(或任何其它族成员)，基于此被选择的族成员形成新的网络，但在重新关注其它专利时保留所有检索历史和排序。

[0212] 此外，可以通过其全局分数评级，对族成员在此第二框中的顺序进行排序。

[0213] 2)新颖性/显而易见性链接的高亮

[0214] 一些专利审查员准备长的现有技术专利列表，但在其审查报告或审查意见通知中仅讨论少量专利。在美国，这些参考文献出现在“Notice of References Cited(引用的参考文献告知)”列表中，因为在新颖性和/或显而易见性驳回支持中引用这些参考文献。在后一种情况下，参考文献的顺序可能是重要的，因为第一个被提到的专利可能是对抗本专利申请的最有力证据。

[0215] 这样的现有技术专利(即引用连接)的列表。这样的连接可以是连接的更大列表的子集。另一程度的细节可以包括在专利数据网络的表现中高亮这样的连接，对新颖性驳回、第一显而易见性驳回、其它显而易见性驳回利用不同的高亮。可以选择地使所有其它连接与连接的专利一起消失，因此示出更紧凑的地图。该系统可以完全基于或偏重于这些新颖性/创造性连接来重新计算专利影响力分数。该系统还可以将链接的线粗度重新计算为偏重于这些新颖性/创造性连接。作为替代，我们可以基于比如说WO和/或EPO检索报告中的X和Y权重提供类似的机制。

[0216] 3)专利申请号的校正/替代

[0217] 当在检索域中插入专利申请号或公开号以及该申请存在具有不同号的授权专利时，翻译该号且随后在屏幕上将该号显示为该权限的等效授权号，而不是申请号/公开号。

[0218] 在该申请人给出的标题为“A system,method and computer program for analyzing and visualizing data(一种用于分析和可视化数据的系统、方法和计算机程序)”的共同待审的美国实用申请No.13/179,437中还描述了分析和可视化分析的系统和方法的替代实施例，该共同待审的申请以参引的方式并入于此。这些实施例的优点在于：提供了数据分析的替代方案，该数据分析的替代方案可以采用本公开的显而易见变形而方便地可视化。

[0219] 虽然不是必需的，但是参照附图描述的实施例可以被实现为应用编程接口(API)或由开发者使用的一系列库或可以被包括在另一软件应用程序中，如终端或个人计算机操作系统或便携式计算设备操作系统。一般来说，由于程序模块包括协助执行特定功能的例程、程序、对象、组件及数据文件，所以技术人员将理解：软件应用程序的功能可以分布在多个例程、对象或组件上，以实现本文描述的相同功能。

[0220] 还应意识到，本发明的方法和系统完全由计算系统或部分由计算系统实现，那么可以利用任何适当的计算系统体系结构。这将包括独立的计算机、网络计算机以及专用硬件设备。当使用术语“计算系统”和“计算设备”时，这些术语目的在于覆盖能够实现所描述的功能的计算机硬件的任何适当设置。

[0221] 本领域技术人员将意识到，可以对在具体实施例中示出的本发明做出许多变化和/或修改，而不脱离广义描述的本发明的精神和范围。例如，本发明的用于可视导航包括一个或多个相关数据记录网络的数据集的系统和方法可以适合于其它连接的数据记录，如交叉引用的文献集合、网站页面、出版物、商标记录、法院判决、在线对象、人民网等等。因此，在所有方面应将本发明的实施例视为说明性的而非限制性的。

[0222] 本文包含的对现有技术的任何引用不应被认为承认该信息是公知常识，除非另有说明。

[0223] 虽然不是必需的，但是参照附图描述的实施例可以被实现为适用于以任意类型的通信协议操作的任何形式的通信网络。一般来说，当基础通信网络或通信协议包括额外例程、功能、基础设施或分组格式时，本领域技术人员将理解，为了应用于这些额外的例程、功能、基础设施或分组格式，可以修改或优化参考附图描述的实施例的实现方式。

标题	发布/更新时间	阅读量
一种一阶连续搅拌釜式反应器的鲁棒预测控制方法	2021-06-23	4
一种搜索引擎热点词分析算法	2020-12-05	4
电路板转印机构	2020-11-13	1
一种专利申请平台	2020-05-11	5
一种弯折的弯曲元件及其毛坯和制造方法、一弯曲单元和一输送轨道	2020-07-17	4
气浮杂质清理用滚轮	2021-01-04	0
可双向微调误差值的测压装置	2020-11-05	0
一种六铝酸钙晶须增强钙铝质耐火材料	2022-08-08	0
基于单‑多模光纤耦合的光纤端面无标记光学传感器	2021-07-05	2
含阴离子粘土组合物的制备方法	2020-10-17	0

用于网络数据集的呈现和可视导航的系统和方法

用于网络数据集的呈现和可视导航的系统和方法

技术领域

背景技术

发明内容

具体实施方式

该功能需要专业版企业版VIP权限，您可以：