[0002] 根据美国法典第35条第119款(e)项(35U.S.C.119(e)),本申请要求2009年12月2日提交的第61/266,099号美国临时
专利申请的优先权,其全部内容通过引用并入本文。
技术领域
[0003] 本
发明一般地涉及执行分析,更具体地,本发明涉及对与各技术领域相关的文献执行分析的方法及系统。
背景技术
[0004] 为了确定技术领域中的产品或服务是否成功而执行分析是非常重要的。这种分析的结果能够被投资者用来决定是否对就此而言的特定产品、服务或技术领域进行投资。
[0005] 在一些传统方法中,对新兴商业产品的营销和市场规模的预计是通过调查专家意见或获取内部消息来完成的。在其他传统方法中,
跟踪公司通告或者比较相对于先例的发展。但是,这些方法完全基于人的(主观)判断,因而这些方法的结果可能非常不可靠。
[0006] 因此,需要一种使用基于机器的方法来执行具有可靠结果的分析的方法及系统。
发明内容
[0007] 根据本发明的一个方面,提供一种对与技术领域的一个或多个方面相关的文献执行分析的方法。所述方法包括根据基于所述文献和所述技术领域一个或多个方面创建的专利地图计算多个系数。所述方法进一步包括使用预定方法计算所述多个系数中每一个系数的权重。所述方法还包括使用所述多个系数和
指定给所述多个系数中每一个系数的所述权重来计算所述一个或多个方面的概率评分。
[0008] 根据本发明另一方面,提供一种对与技术领域的一个或多个方面相关的文献执行分析的系统。所述系统包括处理器。所述处理器用于根据基于所述文献和所述技术领域一个或多个方面创建的专利地图计算多个系数。所述处理器进一步用于使用预定方法计算所述多个系数中每一个系数的权重。所述处理器还用于使用所述多个系数和指定给所述多个系数中每一个系数的所述权重来计算所述一个或多个方面的概率评分。
[0009] 根据本发明又一方面,提供一种计算机可读存储介质,其包含对与技术领域一个或多个方面相关的文献执行分析的计算机可执行指令。所述指令包括根据基于所述文献和所述技术领域一个或多个方面创建的专利地图计算多个系数。所述指令进一步包括使用预定方法计算所述多个系数中每一个系数的权重。所述指令还包括使用所述多个系数和指定给所述多个系数中每一个系数的所述权重来计算所述一个或多个方面的概率评分。
附图说明
[0010] 附图用于进一步说明各
实施例并对各原理和优点加以解释。其中,所有单独附图中的同一附图标记指代相同要素或功能类似的要素,并且附图与下文的详细说明一起包含在本
说明书中并构成本说明书的一部分。
[0011] 图1是根据实施例对与技术领域的一个或多个方面相关的文献执行分析的方法的
流程图。
[0012] 图2是根据实施例用于计算多个系数中每一个系数权重的方法的流程图。
[0013] 图3是根据实施例描绘对与技术领域一个或多个方面相关的文献执行分析的系统的各组成部分的
框图。
具体实施方式
[0014] 在详细描述实施例之前,应当说明的是,本发明的实施例主要针对方法步骤及系统组成部分的结合,该方法步骤及系统组成部分与对与各技术领域相关的文献执行分析的方法和系统有关。因此,系统组成部件和方法步骤在附图中由合适的传统符号表示,且仅仅示出了对于理解实施例而言适当的具体细节,以便不会由于对本领域的技术人员而言显而易见的细节的描述而使具有本文所述优点的公开内容变得模糊不清。
[0015] 在该文件中,术语“包括”、“包含”或任何其他
变形,意在涵盖非排他性集合,使得包括一系列要素的过程、方法、产品或装置不只是包括那些要素,也可包括其他没有特别列举的要素或这些过程、方法、产品、装置固有的要素。以术语“包括……的”修饰的要素不受更多限制,不排除在包含该要素的过程、方法、产品或装置中存在附加的相同要素。
[0016] 各实施例提供对与各技术领域相关的文献执行分析的方法及系统。该方法包括根据专利地图(patent landscape)计算多个系数,该专利地图基于技术领域的一个或多个方面和文献创建。该技术领域的一个或多个方面可包括但不限于该技术领域的公司、专利子集、公司投资组合(company portfolios)、该技术领域的产品、该技术领域的服务、该技术领域内的子领域,以及该技术领域本身。
[0017] 该方法进一步包括使用预定方法计算多个系数中每一个系数的权重。此后,使用多个系数和指定给所述多个系数中每一个系数的权重计算所述一个或多个方面的概率评分。概率评分可作为判断所述一个或多个方面成功或失败的标准。例如,产品的概率评分可帮助判断该产品的市场潜
力。作为另一示例,技术领域的概率评分能够使投资者确定该技术领域没有突破性潜力,因此不应冒险进入。
[0018] 图1是根据实施例对与技术领域一个或多个方面相关的文献执行分析的方法的流程图。与上述一个或多个方面相关的文献可包括但不限于专利文献、金融文献、非专利文献的法律文献以及市场调查文献。
[0019] 基于文献和技术领域的一个或多个方面,处理器创建专利地图。在实施例中,专利文献可以是生成专利地图的主要信息源,而其他类型的文献可以是辅助信息源。技术领域的专利地图包括各种显示信息的图表和分析,所述信息包括但不限于技术领域的不同子领域、该技术领域各子领域中权利人(assignee)的数量、拥有最大数量专利的顶级权利人、该技术领域每年提交的专利数量、该技术领域中专利的向后引用和向前引用。
[0020] 步骤102中,处理器根据专利地图计算多个系数。所述多个系数可包括资本系数CC。CC基于一个或多个因素计算,所述一个或多个因素包括高级权利人(large scale assignee)系数、
专利合作条约(PCT)出版物系数,以及每个专利族的专利出版物的数量。可以针对技术领域的一个或多个方面来计算上述一个或多个因素。或者,可以针对该技术领域来计算所述一个或多个因素。
[0021] 为确定高级权利人系数,使用专利地图识别主要权利人。例如,每个具有五个或更多专利的权利人可被识别为高级权利人。或者,也可通过估量其年收入额和利润的方式识别高级权利人。在该技术领域本身或在该技术领域的子领域中高级权利人的存在确定了存在着对有价值的产品或服务具有营销能力并且能贯彻商业计划的公司。为此,在实施例中,高级权利人影响系数LAIC通过计算高级权利人的出版物数量与该技术领域或该技术领域子领域的出版物总数量的比率来计算。例如,权利人A可能在子领域具有10项专利,而子领域中专利的总数量可能是40项。这种情况下,LAIC是10/40,即0.25。
[0022] 计算CC的第二因素,即专利合作条约(PCT)出版物系数,通过计算PCT或WIPO出版物与该技术领域或该技术领域
中子领域的出版物总数量的比率来计算。该比例称为WIPO系数WIPOC。例如,如果在该技术领域中有20项PCT出版物,且总共有40项出版物,那么WIPOC是20/40,即0.5。WIPOC能够对该技术领域或其子领域的高级投资人的兴趣进行估量。高WIPOC表示权利人对保护世界范围内的该技术领域知识产权投入资金的意愿和能力。
[0023] 此外,计算CC的第三因素,即每个专利族的专利出版物的数量,通过判断该技术领域或该技术领域中子领域的每个专利族的平均专利数量而对其进行计算。该数量称作族规模系数FSC。和WIPOC相似,FSC表示权利人对保护世界范围内的该技术领域知识产权投入资金的意愿和能力。另外,FSC表明权利人对投入更多资金来提交继续申请案或分案申请(continuations or divisional)以保护和发展现有创意或产品上感兴趣。
[0024] CC可通过结合LAIC,WIPOC和FSC计算。在示例性实施例中,CC可使用下面给出的等式1计算:
[0025] CC=FSC+WIPOC+LAIC …………(1)
[0026] 或者,CC可通过标准化和整合LAIC、WIPOC和FSC计算。因为FSC可以是任何大于或等于1的数,而WIPOC和LAIC是小于1的分数,因此这些系数中的每一个都需要标准化。为完成该标准化,关于随机标准化数据集来计算平均CC,随机标准化数据集代表不同技术领域中多个专利种类。在示例性实施例中,平均CC可由下面给出的等式2计算:
[0027] CCm=[N1]FSCm+[N2]WIPOCm+[N3]LAICm……………(2)
[0028] 其中,
[0029] CCm是关于多个专利种类计算的随机CC的均值,
[0030] FSCm是标准化数据集中的族规模系数,
[0031] WIPOCm是标准化数据集中的WIPO系数,
[0032] LAICm是标准化数据集中的LAIC系数,
[0033] N1,N2,N3是基于标准化数据集导出的标准化系数。
[0034] 导出标准化系数以保证每个组成(FSC,WIPOC和LAIC的)平等。一旦N1,N2,N3的数值在高级标准化数据集中确定,则传递这些数值,从而通过上述给出的分析产生CC的最终数值。CC用于估量所述技术领域或所述技术领域的子领域中高级投资人的兴趣。此外,CC与投资人在所述技术领域中
风险投资的资本额和意愿相关。因此,CC越高,产品或服务在所述技术领域中的成功比例会越高。
[0035] 此外,所述多个系数可包括能力系数TC。TC基于与专利地图中公司专利权人有关的一个或多个因素来计算。所述一个或多个因素可包括销售量(A),总收入额(B),年增长(C),股票表现(D),授标(E),扣除利息、税收、贬值和偿还金之前的收益(EBITDA)(F),产品召回(G),负面测试结果(H),投诉历史(I)以及侵权诉讼(J)。当使用各种方法和组合使所有这些因素结合在一起时,可确定TC。比如说,TC可通过以下给出的等式3表示:
[0036] TC=A+B+C+D+E+F-G-H-I-J…………(3)
[0037] 因此,加入所有突出权利人积极方面的因素,减去所有突出权利人消极方面的因素。
[0038] 所述多个因素进一步包括政府支持系数(GSC)。GSC基于一个或多个因素计算,所述一个或多个因素包括美国政府组织在所述专利地图中作为专利权人的存在(K)和所述技术领域专用拨款的流入量(L)。技术领域专用拨款的流入量表示对该技术领域的服务或产品的公共需求,该技术领域的成熟度和该技术领域专家的共识。换句话说,专用拨款的流入量可预测产品或服务的市场成功率。GSC可使用下面给出的等式4计算:
[0039] GSC=K+L…………(4)
[0040] 除了上述系数外,所述多个系数包括近期兴趣系数(RIC)。近期兴趣系数(RIC)基于一个或多个因素计算,所述一个或多个因素包括,截止到提交了在专利地图中预定数量的专利时,在专利地图的生成日期(T)之前提交的该技术领域专利的中间日期(median date)(M)。该预定数量,例如可以是百分之五十。例如,专利地图在2010年1月20日(T)生成,而专利地图包括100项专利。为计算M,所有这100项专利可按它们提交日期的顺序排列,使得,具有最早提交日期的专利列在最前面,而具有最晚提交日期的专利列在最后面。从列在最后面的专利开始移动,第50项专利(从列在最后面的专利数起)的提交日期就是M。第50项专利可能在2005年1月20日提交。这种情况下,M是2005年1月20日。RIC可使用下面给出的等式5计算:
[0041] RIC=0.5/(M-T)…………(5)
[0042] RIC用于确定该技术领域中变化规律、对该技术领域的新理解、以及该技术领域中公众兴趣的觉醒。该技术领域或该技术领域的子领域中RIC越高表示本技术领域的近期兴趣越多。本领域的技术人员将明了,可采用不同的时间分割方法计算RIC。
[0043] 此外,所述多个系数包括诉讼系数(LC)。LC基于一个或多个因素计算,所述一个或多个因素包括技术领域中专利的引用(N),该技术领域中每项专利的
权利要求的平均数量(O),该技术领域中的侵权诉讼(P),该技术领域中公布的专利总数(Q),以及从该技术领域侵权诉讼中获得的赔偿金数量(R)。LC可使用下面给出的等式6计算:
[0044] LC=N+O+P+Q+R…………(6)
[0045] 向后引用的数量反映了该技术领域和许多现有产品或服务的关联性。类似的,向前引用的数量表示该专利出版物由于经过IP和技术专家评估而在该技术领域中起关键作用。同样,该技术领域的引用总数量反映其在该领域中的竞争力。此外,该技术领域中专利总数量反映了该领域中投入的资金和研究的总量。
[0046] 在计算所述多个系数之后,在步骤104中,处理器使用预定方法向所述多个系数中的每一个指定权重。结合图2对此做进一步解释。然后,在步骤106中,处理器使用所述多个系数和指定给所述系数的权重来计算所述一个或多个方面的概率评分。概率评分可使用下面给出的等式7计算:
[0047] P=[CC]W1[TC]W2[GSC]W3[RIC]W4[LC]W5…………(7)
[0048] 其中,
[0049] P是概率评分,
[0050] W1是指定给CC的权重,
[0051] W2是指定给TC的权重,
[0052] W3是指定给GSC的权重,
[0053] W4是指定给RIC的权重,
[0054] W5是指定给LC的权重。
[0055] 概率评分是技术领域的一个或多个方面的成功或失败的指示。例如,产品的概率评分有助于确定其市场潜力。作为另一示例,该技术领域的概率评分可使投资者确定该技术领域不具备突破性潜力,因此不应冒险进入。
[0056] 图2是根据实施例用于计算多个系数中每一个系数的权重的方法流程图。在计算所述多个系数之后,计算这些系数的权重。使用预定方法计算所述权重。为执行所述预定方法,在步骤202中,处理器使用数据的正样本训练集(positive training set of data)和数据的负样本训练集(negative training set of data)的地图历史来计算权重。数据的正样本训练集对应于该技术领域的积极样本,数据的负样本训练集对应于该技术领域的消极样本。该积极样本可包括但不限于拳头产品(blockbuster products)、产品市场的客观规模和增长、通过监管控制的候选药物,符合适销性要求和
燃料高效要求的车辆、以及满足重要的公共需求且带来极大销售量的小机械。类似的,消极样本可包括但不限于,失败的产品、显示出小的市场机会的产品、以及显示出销售动态停滞的产品、临床试验失败的具有很大
副作用的药物、燃料低效并需要高额维护的车辆、以及在销售环节中未售出的小机械。
[0057] 因此,该数据的正样本训练集,例如,可以是与市场中非常成功的产品有关的数据;该数据的负样本训练集,例如,可以是与市场中尚未那么成功的产品有关的数据。此后,选择所述权重的数值,使得对数据的正样本训练集计算出的概率评分和对数据的负样本训练集计算出的概率评分之间存在最优分离(optimal separation)。在步骤204中,处理器使用测试数据集验证所述权重。测试数据集是在创建专利地图之前准备好的,并只用于最终验证。
[0058] 在实施例中,数据的正样本训练集小于数据的负样本训练集,并且数据的正样本训练集是数据的负样本训练集的一小部分。这种情况下,对数据的正样本训练集计算的概率评分数值可视为数据的正样本训练集和数据的负样本训练集总体的正态分布离群值。此外,关于数据的正样本训练集将正态分布Z值最大化,然后为完成该最大化所提供的所述多个系数可用作实际操作的多个系数。
[0059] 在另一实施例中,数据的负样本训练集和数据的正样本训练集可通过生成自动地图研究对象来分离。自动地图研究对象可进一步划分为多个扇区(sector)。所述多个扇区中的一个或多个包括技术的积极样本,比如,轰动的药物种类。使用等式7可为每个扇区计算概率评分。指定给所述多个系数的所述权重最初并未设定任何数值。对于积极样本的扇区,将所述权重的初始值指定为1,并且基于该初始值计算多个扇区中每一个的概率评分。然后,将概率评分向量转
化成Z值向量。由此,修正所述权重。
[0060] 多个扇区中成功扇区的Z值成为正态分布的离群值。离群范围取决于权重向量的结构。权重向量的每次修正可导致成功扇区Z值的增加。在实施例中,多个扇区可包括一组成功扇区。这种情况下,可通过修正权重向量来最大化该组成功扇区的Z值总和。为实现该最大化,从等式(7)的左边开始修正所述权重。例如,先修正W1,接着修正W2、W3、W4、以及W5。权重可以是小数或负数。
[0061] 在通过W1完成成功扇区Z值或一组成功扇区Z值的局部最大化后,通过同样的方案修正下一个系数W2,直到Z值或相关联的Z值总和停止增加。如果任何权重的修正未能增加成功扇区或一组成功扇区的Z值,则该特定权重被原样留下,然后修正下一个权重。结果,计算出(调整得到)所述权重向量,以识别那些其主要组成部分中类似于已确定的成功扇区的扇区。基于上述方法,没有显示出显著的产品适销性、但就Z值而言接近已确定的成功扇区的扇区,可看作是有发展潜力的。
[0062] 本领域的技术人员将明了,可使用其他方法计算权重,其他方法包括但不限于神经网络、
支持向量机、
决策树、以及质心方法(Methods of Centroids)。
[0063] 图3是根据实施例描述用于对与技术领域的一个或多个方面相关的文献执行分析的系统300的各组成部分的流程图。系统300包括处理器302和显示器304。处理器302根据专利地图计算多个系数,专利地图基于文献和技术领域一个或多个方面创建。此后,处理器302使用预定方法计算多个系数中每一个系数的权重。然后,处理器302使用多个系数和指定给多个系数中每一个系数的权重计算一个或多个方面的概率评分。结合图1和图2已经对此作出详细解释。显示器304显示多个系数和概率评分的计算结果。
[0064] 各实施例提供用于对各技术领域相关的文献执行分析的方法和系统。在该方法中,地图化
进程依赖于上述参数的计算以及在监督式回归模型(supervised regression model)中这些参数的结合,监督式回归模型可通过与最优或最劣商业产品的专利历史相拟合来提取。概率评分可用于淘汰不具有突破性潜力的技术。另外,概率评分将有助于识别具有最大潜力的技术。这种功能对投资者、项目经理和政府策划人极其有用。此外,由于该方法是自动的,其能够与地图浏览
软件结合在一起。
[0065] 本领域的技术人员将意识到,上述认可的优点和本文描述的其它优点只作为示例,并非意欲完全呈现不同实施例的所有优点。
[0066] 所述用于对各技术领域相关的文献执行分析的方法或任何该方法的组成部分可用计算设备的形式表现。上述计算设备能够但不限于是,例如,计算机、可编程
微处理器、微
控制器、外围集成
电路元件、以及能执行组成所述方法的步骤的其他设备或设备配置。
[0067] 为了处理输入数据,计算设备执行一组保存在一个或多个存储单元中的指令。存储单元也可根据需要保存数据或其他信息。存储单元可在处理机中以
数据库或物理内存单元的形式存在。
[0068] 该组指令可包括指示计算设备执行具体任务的各种指令,具体任务例如构成所述方法的步骤。该组指令可以是程序形式或软件形式。软件可以是各种形式,比如
系统软件或
应用软件。此外,软件可以是独立程序的集合、具有较大程序的程序模
块、或程序模块的一部分。软件也可包括面向对象编程形式的模块编程。计算设备对输入数据的处理可以响应于用户命令,或响应于前面处理的结果,或响应于另一计算设备产生的要求。
[0069] 已经在上述说明中描述了具体的实施例。但是,本领域普通技术人员应该理解,在不背离下面本发明权利要求书限定的范围的情况下,可进行各种
修改和变化。因此,说明书和附图应看作具有示范性而非限制性意义,并且所有这些修改将包括在本发明的范围内。益处、优势、问题的解决方案、以及能引起任何益处、优势、解决方案的产生或使之变得更显著的任何要素,不应解释为任一项或所有权利要求的关键、必需或必要的特征或要素。本发明仅由所附权利要求书(其中包括本发明未决过程中做出的任何修改)以及所公开的那些权利要求的所有等同物限定。