专利汇可以提供一种面向目标的RESTfulWeb服务发现方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种面向目标的RESTful Web服务发现方法,首先收集RESTful Web服务的信息(特别是功能性的文本描述),并获得Web服务集的领域划分;然后从每个领域的Web服务集中进行领域 知识库 构建,包括Web服务‑服务目标关联矩阵、服务目标簇集等;最后基于构建的领域知识库,为给定的用户查询推荐语义相似的服务目标,然后将用户选择的服务目标集与Web服务的服务目标集进行匹配,得到候选Web服务集。本发明能够准确地发现满足用户需求目标的RESTful Web服务,具有很好的实用性;通过为用户的初始查询推荐语义相似的服务目标,可以帮助用户制定能够体现其需求的高 质量 查询。,下面是一种面向目标的RESTfulWeb服务发现方法专利的具体信息内容。
1.一种面向目标的RESTful Web服务发现方法,其特征在于,包括以下步骤:
步骤1:收集RESTful Web服务的信息,包括Web服务名称、所属领域和功能性的文本描述,得到Web服务集;
步骤2:对Web服务集进行预处理;
步骤3:针对预处理后的Web服务集,判断Web服务是否包含所属领域的信息;
若是,则执行下述步骤4;
若否,则执行下述步骤5;
步骤4:判断领域划分是否存在重叠;
若是,则执行下述步骤5;
若否,则执行下述步骤6;
步骤5:使用Web服务分类方法对Web服务集进行领域划分;
步骤6:针对每个领域的Web服务集进行领域知识库的构建,包括:领域词汇排序表、领域动词集、领域核心名词集、Web服务-服务目标关联矩阵和服务目标簇集;
步骤7:对给定的用户查询q进行Web服务发现。
2.根据权利要求1所述的面向目标的RESTful Web服务发现方法,其特征在于:步骤2中所述对Web服务集进行预处理,包括分词、词形还原、去停用词和词频统计,具体实现包括以下子步骤:
步骤2.1:对每个Web服务的信息进行解析,获取其中包含的所有词;
步骤2.2:将所有词还原成其基本原形;
步骤2.3:根据停用词表去掉一些无实际意义的词;
步骤2.4:统计每个词在Web服务中的频次。
3.根据权利要求1所述的面向目标的RESTful Web服务发现方法,其特征在于,步骤5的具体实现包括以下子步骤:
步骤5.1:指定需要进行分类的领域,将Web服务集划分为指定领域相关的Web服务集和领域无关的Web服务集;
步骤5.2:分别从领域相关的Web服务集和领域无关的Web服务集中选取数目相同的Web服务构造训练集,除训练集外的Web服务构成测试集;
步骤5.3:为训练集和测试集中的Web服务构建向量空间模型,即将每个Web服务表示为一个向量,向量的维度是所有Web服务包含的不同词的总数,向量的每一维表示一个词,每个词在每个Web服务向量中的权值采用TF-IDF计算;
步骤5.4:采用支持向量机对构建的向量空间进行分类,得到指定领域的Web服务集。
4.根据权利要求1所述的面向目标的RESTful Web服务发现方法,其特征在于,步骤6中,首先对每个领域,统计该领域预处理后的Web服务集中包含的所有词以及每个词在该领域所有Web服务中的出现频次之和;然后,为特定的领域d进行领域知识库构建,其具体实现包括以下子步骤:
步骤6.1:计算d中每个词对该领域的重要性,并按照重要性对d中所有词降序排列,得到d的领域词汇排序表,记为RDWLd;
步骤6.2:选出RDWLd的top 150个词中的名词,构成d的领域核心名词集,记为DCNd;
步骤6.3:从d中每个Web服务的文本描述中进行服务目标提取,得到d的Web服务-服务目标关联矩阵,记为WSSGAMd;
步骤6.4:统计d中所有服务目标包含的动词,得到d的领域动词集,记为DVd;
步骤6.5:计算d中服务目标之间的语义相似度,构建服务目标语义相似度矩阵,矩阵的每一行代表d中的一个服务目标,每一列也代表d中的一个服务目标,每个单元的值是该单元所在的行与列对应的两个服务目标之间的语义相似度;
步骤6.6:基于服务目标语义相似度矩阵,将d中每个服务目标表示为一个向量,向量的维数是d中服务目标的总数,向量的每一维表示d中的一个服务目标,每个服务目标sg的向量中每一维的值为sg与该维对应的服务目标之间的语义相似度;然后,利用K-Means算法对d中所有服务目标的向量进行聚类,得到d的服务目标簇集,记为SGCd。
5.根据权利要求4所述的面向目标的RESTful Web服务发现方法,其特征在于,步骤6.1中所述d中每个词w对该领域的重要性,计算方法如下:
其中,N(w,d)表示w在d中的出现频次, 表示d中词出现的最大频次,|{d:w
∈d}|表示包含w的领域数目,|D|表示全部Web服务所属的领域总数, 表示w
在所有领域中的出现频次之和,α为0到1之间的小数。
6.根据权利要求4所述的面向目标的RESTful Web服务发现方法,其特征在于,步骤6.3中所述从d中每个Web服务的文本描述中进行服务目标提取,其具体实现步骤为:首先,获取文本描述包含的语句集合;然后,利用Stanford Parser对每条语句进行语法解析,得到能够体现句中词汇之间语法依赖关系的SD集合;接着,根据3种SD模式:dobj(a,b)→、nsubjpass(a,b)→和prep(a,b)+nsubj(a,c)→,从每条语句的SD集中获取该语句包含的一些重要服务目标的骨架,称为初始目标;接着,利用每条语句中其它的SD关系对从该语句中获取的每个初始目标进行信息扩充,同时识别隐藏的服务目标,得到该语句的候选服务目标集;最后,对从所有语句中获取的候选服务目标进行词形还原和去停用词处理,得到Web服务的文本描述中包含的服务目标集。
7.根据权利要求4所述的面向目标的RESTful Web服务发现方法,其特征在于,步骤6.5中所述d中服务目标之间的语义相似度,计算方法如下:
首先,将d中每个服务目标sg包含的词划分为3个子集,即
Vd(sg)=W(sg)∩DVd,CNd(sg)=W(sg)∩DCNd,
Othd(sg)=W(sg)-Vd(sg)-CNd(sg),
其中,W(sg)代表sg包含的词集;DVd和DCNd分别代表d的领域动词集和领域核心名词集;
Vd(sg)、CNd(sg)和Othd(sg)分别代表sg包含的动词集、领域核心名词集以及除动词与领域核心名词外的其他词集;对服务目标来说,这3种词之间的重要性优先级为:领域核心名词>动词>其他词;
然后,计算d中任意两个服务目标sgi和sgj之间的语义相似度,采用如下公式:
gSim(sgi,sgj)=λ1×WSim(Vd(sgi),Vd(sgj))+λ2×WSim(CNd(sgi),CNd(sgj))+λ3×WSim(Othd(sgi),Othd(sgj)),
其中,λ1、λ2和λ3为权重因子;WSim(W1,W2)表示两个词集W1和W2之间的语义相似度,计算公式为:
其中,|W1|和|W2|分别代表词集W1和W2中包含的词的数目;wsim(wi,wj)代表两个词wi和wj之间的语义相似度; 代表词集W2中所有词与词wi之间的最大语义相似
度;WNSim(wi,wj)代表两个词wi和wj在WordNet中的语义相似度。
8.根据权利要求1所述的面向目标的RESTful Web服务发现方法,其特征在于,步骤7的具体实现包括以下子步骤:
步骤7.1:对给定的用户查询q进行预处理,包括分词、词形还原、去停用词和词频统计;
步骤7.2:计算q与每个领域之间的匹配度,得到与q匹配度最高的领域,记为md;
步骤7.3:计算q与md中每个服务目标簇之间的语义相似度,得到与q语义相似的服务目标簇集,记为mC;
步骤7.4:计算mC中每个服务目标与q之间的语义相似度,并按照语义相似度对mC中所有服务目标降序排列,得到q的服务目标推荐列表,从中用户选择能够体现其需求的服务目标,记为SGq,作为新的查询;
步骤7.5:将SGq与md中每个Web服务的服务目标集进行匹配,得到满足用户需求的候选Web服务集。
9.根据权利要求8所述的面向目标的RESTful Web服务发现方法,其特征在于,步骤7.2中所述计算q与每个领域d之间的匹配度,采用如下公式:
其中,K表示仅考虑d的领域词汇排序表RDWLd中的top K个词; 代表词wk对d的重要性; 代表词wk在q中的频次。
10.根据权利要求8所述的面向目标的RESTful Web服务发现方法,其特征在于,步骤
7.3中所述计算q与md中每个服务目标簇之间的语义相似度,具体方法如下:
首先,将md中每个服务目标簇Ci包含的词划分为3个子集,即
其中,Vmd(Ci)、CNmd(Ci)和Othmd(Ci)分别代表Ci包含的动词集、领域核心名词集和除动词与领域核心名词外的其他词集;Vmd(sgk)、CNmd(sgk)和Othmd(sgk)分别代表服务目标sgk包含的动词集、领域核心名词集和除动词与领域核心名词外的其他词集;
然后,分别获取Vmd(Ci)、CNmd(Ci)和Othmd(Ci)中与q中任意词语义相似的词汇子集;
Vmd(Ci)中与q中任意词语义相似的词汇子集,定义如下:
其中,W(q)代表q包含的词集;θv为相似度阈值;wsim(wi,wj)代表两个词wi和wj之间的语义相似度;
CNmd(Ci)中与q中任意词语义相似的词汇子集,定义如下:
其中,W(q)代表q包含的词集;θcn为相似度阈值;wsim(wi,wj)代表两个词wi和wj之间的语义相似度;
Othmd(Ci)中与q中任意词语义相似的词汇子集,定义如下:
其中,W(q)代表q包含的词集;θoth为相似度阈值;wsim(wi,wj)代表两个词wi和wj之间的语义相似度;
最后,计算q与Ci之间的语义相似度:
其中,Vmd(Ci)、CNmd(Ci)和Othmd(Ci)分别代表Ci包含的动词集、领域核心名词集和除动词与领域核心名词外的其他词集; 和 分别代表Vmd
(Ci)、CNmd(Ci)和Othmd(Ci)中与q中任意词语义相似的词汇子集;N(wk,Ci)代表词wk在Ci中的频次;λ1、λ2和λ3为权重因子,对应于权利要求7中的λ1、λ2和λ3。
11.根据权利要求10所述的面向目标的RESTful Web服务发现方法,其特征在于,步骤
7.3中所述mC定义如下:
mC={Ci|Ci∈SGCmd∧qCSim(q,Ci)≥θc},
其中,SGCmd代表md的服务目标簇集;qCSim(q,Ci)代表q与Ci之间的语义相似度,计算方式在权利要求10中已给出;θc为相似度阈值。
12.根据权利要求8所述的面向目标的RESTful Web服务发现方法,其特征在于,步骤
7.4中所述计算mC中每个服务目标与q之间的语义相似度,具体方法如下:
首先,将q包含的词划分为3个子集,即:
Vmd(q)=W(q)∩DVmd,CNmd(q)=W(q)∩DCNmd,
Othmd(q)=W(q)-Vmd(q)-CNmd(q),
其中,W(q)代表q包含的词集;DVmd和DCNmd分别代表md的领域动词集和领域核心名词集;
Vmd(q)、CNmd(q)和Othmd(q)分别代表q包含的动词集、领域核心名词集以及除动词与领域核心名词外的其他词集;
然后,计算mC中每个服务目标sg与q之间的语义相似度,采用公式:
a a
qGSim(q,sg)=λ1×WSim(Vmd(q),Vmd(sg))+λ2×WSim(CNmd(q),CNmd(sg))
+λ3×WSima(Othmd(q),Othmd(sg)),
其中,Vmd(q)、CNmd(q)和Othmd(q)分别代表q包含的动词集、领域核心名词集以及除动词与领域核心名词外的其他词集;Vmd(sg)、CNmd(sg)和Othmd(sg)分别代表sg包含的动词集、领域核心名词集以及除动词与领域核心名词外的其他词集;λ1、λ2和λ3为权重因子,对应于权利要求7中的λ1、λ2和λ3;WSima(W1,W2)表示两个词集W1和W2之间的非对称语义相似度,计算方式为:
其中,|W1|代表词集W1中包含的词的数目;wsim(wi,wj)代表两个词wi和wj之间的语义相似度,计算方式在权利要求7中已给出; 代表词集W2中所有词与词wi之间
的最大语义相似度。
13.根据权利要求8所述的面向目标的RESTful Web服务发现方法,其特征在于,步骤
7.5中所述候选Web服务集为:
其中,Smd代表md的Web服务集;SGq代表用户从q的服务目标推荐列表中选择的服务目标集;SGs代表Web服务s的服务目标集,可由WSSGAMmd得到,即SGs={sgj|WSSGAMmd(s,sgj)=1};
W(sgi)和W(sgj)分别代表sgi和sgj包含的词集。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
基于多视图联合嵌入空间的图像-文本双向检索方法 | 2020-05-12 | 551 |
一种面向硬件逻辑设计的需求建模与验证方法 | 2020-05-12 | 700 |
SCD虚端子推导现场一次设备主接线图的方法 | 2020-05-17 | 298 |
一种电磁内分泌调节护理机 | 2020-05-14 | 543 |
基于INP文件的ABAQUS三维无限元边界快速建模方法 | 2020-05-08 | 865 |
点云编解码方法和编解码器 | 2020-05-11 | 68 |
图谱的查询方法、装置、计算机设备以及存储介质 | 2020-05-16 | 207 |
交叉分量线性建模中的下采样 | 2020-05-13 | 349 |
基于神经网络对文本编码的方法、装置、设备及存储介质 | 2020-05-15 | 535 |
基于语义指导与记忆机制的视频描述方法 | 2020-05-11 | 278 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。