专利汇可以提供面向软件缺陷知识的知识搜索方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种面向 软件 缺陷 知识的知识搜索方法,属于软件开发与维护领域,包括以下步骤:对用户输入的搜索问句进行预处理以形成问句的语法依赖树;根据语法依赖树 抽取 问题语义三元组,该三元组包括主语、关系与宾语;将问题语义三元组与现有的 软件缺陷 知识图谱三元组库进行匹配,获得匹配三元组集合;根据匹配三元组集合构建搜索结果子图,并返回给用户。本发明方法针对软件缺陷领域用户可能会搜索的问题条件进行语义分析,并结合知识图谱、 自然语言处理 这些日益成熟的技术将用户的问题转 化成 结构化的查询语言并和已有的知识图谱相关联,能够实现更好的搜索交互过程,为软件开发和维护领域提供良好的缺陷信息搜索平台,辅助修复过程。,下面是面向软件缺陷知识的知识搜索方法专利的具体信息内容。
1.一种面向软件缺陷知识的知识搜索方法,其特征在于,包括以下步骤:
步骤1、对用户输入的搜索问句S进行预处理以形成问句的语法依赖树T;
步骤2、根据语法依赖树T抽取问题语义三元组,该三元组包括主语、关系与宾语;
步骤3、将所述问题语义三元组与现有的软件缺陷知识图谱三元组库进行匹配,获得匹配三元组集合;
步骤4、根据匹配三元组集合构建搜索结果子图,并返回给用户。
2.根据权利要求1所述的面向软件缺陷知识的知识搜索方法,其特征在于,步骤1所述预处理具体为自然语言处理,包括分词、词性标注以及句法分析。
3.根据权利要求1或2所述的面向软件缺陷知识的知识搜索方法,其特征在于,步骤2所述根据语法依赖树T抽取问题语义三元组,该三元组包括主语、关系与宾语,具体为:
根据语法依赖树T,分析词与词之间的依存关系即语法关系,并识别经步骤1预处理后问句S中的动词短语VP、名词短语NP,从而抽取出问题语义三元组为QTripe(NP1,VP1,NP2),其中第一名词短语NP1作为主语,第二名词短语NP2作为宾语,动词短语VP1作为NP1与NP2两者之间的语义关系。
4.根据权利要求1所述的面向软件缺陷知识的知识搜索方法,其特征在于,步骤3所述将问题语义三元组与现有的软件缺陷知识图谱三元组库进行匹配,获得匹配三元组集合,具体为:
步骤3-1、将所述问题语义三元组与现有的软件缺陷知识图谱三元组库进行实体匹配,实现问题语义三元组的实体与现有软件缺陷知识图谱的实体关联,获得实体匹配三元组集合;
步骤3-2、结合步骤3-1的实体匹配三元组集合进行关系匹配,实现问题语义三元组的关系与现有软件缺陷知识图谱的关系相关联,获得匹配三元组集合。
5.根据权利要求4所述的面向软件缺陷知识的知识搜索方法,其特征在于,步骤3-1所述将所述问题语义三元组与现有的软件缺陷知识图谱三元组库进行实体匹配,具体为:
步骤3-1-1、在字符层面进行实体匹配,获得初步实体匹配三元组集合,具体为:
(1)求取问题语义三元组中实体与软件缺陷知识图谱三元组库中每个三元组t中实体的相似度P(w1,w2),所用公式为:
式中,w1、w2分别表示问题语义三元组的实体、软件缺陷知识图谱三元组库中三元组中的实体,n(w1,w2)表示实体w1、w2中不同字符的个数,l(w1)表示实体w1的长度,l(w2)表示主体w2的长度;
由上获得问题语义三元组与软件缺陷知识图谱三元组库中每个三元组t的两个实体相似度P1、P2;
(2)判断实体相似度P1、P2与设定阈值f1之间的关系,若P1、P2均大于设定阈值f1,则软件缺陷知识图谱三元组库中三元组t与问题语义三元组相匹配;软件缺陷知识图谱三元组库中所有与问题语义三元组匹配的三元组t构成初步实体匹配三元组集合;
步骤3-1-2、基于语义相似度进行实体匹配,具体为:
(1)采用词向量word2vec模型将问题语义三元组中的实体与初步实体匹配三元组集合中每个三元组t中的实体均映射为空间向量;
(2)求取空间向量之间的欧式距离作为实体相似度,每个三元组t均获得两个实体相似度q1、q2,判断实体相似度q1、q2与设定阈值f2之间的关系,若q1、q2均大于设定阈值f2,则初步实体匹配三元组集合中三元组t与问题语义三元组相匹配;初步实体匹配三元组集合中所有与问题语义三元组匹配的三元组t构成最终的实体匹配三元组集合。
6.根据权利要求5所述的面向软件缺陷知识的知识搜索方法,其特征在于,步骤3-2所述结合步骤3-1的实体匹配三元组集合进行关系匹配,实现问题语义三元组的关系与现有软件缺陷知识图谱的关系相关联,获得匹配三元组集合,具体为:
针对问题语义三元组的关系r,获取实体匹配三元组集合中所有满足关系r的匹配三元组集合Tripe(r):
Tripe(r)={(ei,ej):(ei,r,ej)∈T}
式中,1≤i≤j≤n,ei、ej均表示缺陷实体节点,r表示缺陷实体对应的关系,n表示软件缺陷知识图谱中缺陷实体总数,T表示实体匹配三元组集合。
7.根据权利要求6所述的面向软件缺陷知识的知识搜索方法,其特征在于,步骤4所述根据匹配三元组集合构建搜索结果子图,并返回给用户,具体为:
针对匹配三元组集合Tripe(r)中的每个三元组t:
t=(es,rt,em)
式中,1≤s≤m≤n,es、em均表示缺陷实体节点,rt表示缺陷实体之间对应的关系;
将每个三元组t表示为一条边,若两个边共享某一个实体节点,则将三元组对应的实体节点合并,重复该过程直至遍历完整个匹配三元组集合,以此将匹配三元组集合Tripe(r)合并为一个结构化的搜索结果子图,并将搜索结果子图返回给用户。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
回归测试的流程覆盖方法、服务器及计算机可读存储介质 | 2020-05-16 | 945 |
软件缺陷检测方法及装置 | 2020-05-19 | 979 |
基于缺陷的回归测试用例的处理方法、装置及计算设备 | 2020-05-11 | 235 |
一种跨项目软件缺陷预测方法及其系统 | 2020-05-12 | 729 |
一种基于数据欠采样和集成学习的软件缺陷数目预测方法 | 2020-05-15 | 758 |
一种新的动态反馈和改进型补丁评价的软件自动修复方法 | 2020-05-12 | 224 |
基于多目标优化的软件缺陷定位方法 | 2020-05-20 | 668 |
一种软件缺陷培训方法和系统 | 2020-05-20 | 91 |
升级车载控制器程序的方法和车辆 | 2020-05-16 | 41 |
一种基于版本提交信息的软件缺陷自动分派方法及系统 | 2020-05-15 | 354 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。