专利汇可以提供用AIR树解决SKQwhy-not问题的方法及系统专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种用AIR树解决SKQwhy-not问题的方法及系统,涉及空间关键字查询技术领域,本发明通过将对象的数字属性以布尔表达式的形式表示,更接近现实应用场景;并设计AIR树来巧妙的组织对象信息,同时设计出相应的查询策略,实现通过 修改 查询q',用最小的修改代价,满足在查询结果中所有缺失对象均出现,进而解决空间关键字查询中why-not问题的方法及系统。,下面是用AIR树解决SKQwhy-not问题的方法及系统专利的具体信息内容。
1.一种用AIR树解决SKQwhy-not问题的方法,其特征在于,包括以下步骤:
获取所有对象o,构建AIR树索引;
获取初始查询q=(q.loc,q.doc0,q.B,k,α)和缺失对象集M;根据缺失对象的关键字的频率递减的顺序构建候选关键字列表CKS、根据缺失对象的相似性得分递减的顺序构建候选属性值对列表CAS;将精炼查询q'的关键字集q'.doc和属性值对q'.B'分别设置为q.doc0和q.B;
有序地抽取CKS中的关键字和CAS中的属性值对,分别添加至查询q'的关键字集q'.doc和查询q'的属性值对q'.B'中,形成新的精炼查询q';分别对各个精炼查询q'进行处理以找出最佳精炼查询,直至CKS和CAS都为空;
分别对各个精炼查询q'进行处理,具体包括:
计算q'的修改代价p',过滤掉p'≥pc的查询q',pc为保留初始查询关键字和属性、且所有的缺失对象都出现在查询结果中的查询qb的修改代价;
对于p'
对满足查询q'要求的对象中的所有对象均根据其相似性得分从高至低排序,直到所有原始结果对象和所有缺失对象均出现,获得k'个对象;
如果k'≤km,km为保留初始查询关键字和属性、且所有的缺失对象都出现在查询结果中时结果集的大小,则计算q'的修改代价p',如果p'
AIR树的每一个非叶子结点Ri包含四个属性:
<Ri.id,Ri.MBR,Ri.S,Ri.Address>,其中Ri.id是结点的id,Ri.MBR是包含结点Ri中所有对象的最小边界矩形,Ri.Address是Ri的所有子结点的地址列表,Ri.S是Ri中所有子结点的属性值对的并集;每一个非叶子结点Ri与一个倒排文件相关联,所述倒排文件由关键字列表组成,每个关键字都指向包含该关键字的Ri的子节点的ID的列表;
AIR树的每一个叶子结点Ri中每个对象oj的信息包含三个属性:(oj.id,oj.loc,oj.S),其中oj.id是对象id,oj.loc是oj的空间位置,oj.S是oj的属性值对。
3.如权利要求1所述的方法,其特征在于:B为布尔表达式:
为一个谓词集合,其中i∈[1,n],i∈N*。
4.如权利要求1所述的方法,其特征在于:计算q'的修改代价p',计算公式为:
其中,β1,β2,β3,β4分别表示是cost函数中k值、关键字、属性种类、属性值的权重;βi≥0且 k'是精炼查询q'的查询结果集的大小,k0是初始查询q的结果集的大小,km是保留初始查询关键字和属性,且所有的缺失对象都出现在查询结果中时结果集的大小,用km-k0规范化k'-k0;Δdoc是从q.doc0调整到q'.doc所需改变的关键字的数量,其中缺失对象集M={m1,m2,...,mj},通过|q.doc0∪M.doc|来规范化Δ
doc;ΔAn是从初始查询调整到精炼查询所需改变的属性种类的数量,通过|q.B∪M.B|来规范化ΔAn; n是q.B和M.B所包含的属性的总和;Δvi是包含属性Ai的所有对
象关于该属性的属性值的最大差值;|vi'-vi|是属性Ai中当前查询属性值vi'与初始查询属性值vi之间的差值的绝对值,且|vi'-vi|≤Δvi,通过Δvi来规范化|vi'-vi|。
5.如权利要求1所述的方法,其特征在于:计算查询q和对象o之间的相似性得分,计算公式为:
其中α是0到1之间的一个变量,用来定义距离邻近度与文本相关性之间的相对重要性,d(q.loc,o.loc)表示的是查询q与对象o之间的欧氏距离,dmax(q.loc,O.loc)表示的是查询点q到对象集合O中的所有对象的最大距离,用对象集O中所有对象间距离的最大值表示。
6.如权利要求2所述的方法,其特征在于:根据预设的非叶子结点筛选规则选出符合条件的AIR树的非叶子结点,得出待筛选的叶子结点的集合;根据预设的叶子结点筛选规则选出符合条件的AIR树的叶子结点,具体包括以下步骤:
将AIR树的非叶子结点加入待处理的非叶子结点集合;
判断待处理的非叶子结点集合中当前结点是否满足非叶子结点筛选规则;
若不满足,过滤掉该结点;若满足,则该结点是符合条件AIR树的非叶子结点,读取该非叶子结点的所有子结点,若其子结点为非叶子结点,将其子结点加入待处理的非叶子结点集合,若其子结点为叶子结点,将其子结点加入待筛选的叶子结点的集合;
判断待筛选的叶子结点中当前节点是否满足叶子结点筛选规则;若满足,记录为符合条件的AIR树的叶子结点,否则,过滤掉该结点。
7.如权利要求6所述的方法,其特征在于:所述非叶子结点筛选规则为:
a)是AIR树的非叶子结点;
b)在该结点上具有查询q'的所有属性类别;
c)查询q'的每一个属性值范围与该结点的对应属性值范围有交集;
d)查询q'的关键字与该结点的倒排文件关键字符合关键字匹配;
e)满足关于q'和结点的之间空间距离的不等式:
8.如权利要求6所述的方法,其特征在于:所述叶子结点筛选规则为:
a)查询q'与该结点满足综合匹配;
b)查询q'和该结点之间的空间距离满足以下不等式:
9.一种用AIR树解决SKQwhy-not问题的系统,其特征在于,包括:
AIR树索引构建模块,其用于:获取所有对象o,构建AIR树索引;
候选列表构建模块,其用于:获取初始查询q=(q.loc,q.doc0,q.B,k,α)和缺失对象集M;根据缺失对象的关键字的频率递减的顺序构建候选关键字列表CKS、根据缺失对象的相似性得分递减的顺序构建候选属性值对列表CAS;将精炼查询q'的关键字集q'.doc和属性值对q'.B'分别设置为q.doc0和q.B;
精炼查询模块,其用于:有序地抽取CKS中的关键字和CAS中的属性值对,分别添加至查询q'的关键字集q'.doc和查询q'的属性值对q'.B'中,形成新的精炼查询q';分别对各个精炼查询q'进行处理以找出最佳精炼查询,直至CKS和CAS都为空;分别对各个精炼查询q'进行处理,具体包括:
计算q'的修改代价p',过滤掉p'≥pc的查询q',pc为保留初始查询关键字和属性、且所有的缺失对象都出现在查询结果中的查询qb的修改代价;
对于p'
对满足查询q'要求的对象集中的所有对象均根据其相似性得分从高至低排序,直到所有原始结果对象和所有缺失对象均出现,获得k'个对象;
如果k'≤km,km为保留初始查询关键字和属性、且所有的缺失对象都出现在查询结果中时结果集的大小,则计算q'的修改代价p',如果p'
获取所有对象o,构建AIR树索引;
AIR树的每一个非叶子结点Ri包含四个属性:<Ri.id,Ri.MBR,Ri.S,Ri.Address>,其中Ri.id是结点的id,Ri.MBR是包含结点Ri中所有对象的最小边界矩形,Ri.Address是Ri的所有子结点的地址列表,Ri.S是Ri中所有子结点的属性值对的并集;每一个非叶子结点Ri与一个倒排文件相关联,所述倒排文件由关键字列表组成,每个关键字都指向包含该关键字的Ri的子节点的ID的列表;
AIR树的每一个叶子结点Ri中每个对象oj的信息包含三个属性:(oj.id,oj.loc,oj.S),其中oj.id是对象id,oj.loc是oj的空间位置,oj.S是oj的属性值对。
11.如权利要求10所述的系统,其特征在于:B为布尔表达式:
为一个谓词集合,其中i∈[1,n],i∈N*。
12.如权利要求10所述的系统,其特征在于:所述精炼查询模块具体用于:
将AIR树的非叶子结点加入待处理的非叶子结点集合;
判断待处理的非叶子结点集合中当前结点是否满足非叶子结点筛选规则;
若不满足,过滤掉该结点;若满足,则该结点是符合条件AIR树的非叶子结点,读取该非叶子结点的所有子结点,若其子结点为非叶子结点,将其子结点加入待处理的非叶子结点集合,若其子结点为叶子结点,将其子结点加入待筛选的叶子结点的集合;
判断待筛选的叶子结点中当前节点是否满足叶子结点筛选规则;若满足,记录为符合条件的AIR树的叶子结点,否则,过滤掉该结点。
13.如权利要求12所述的系统,其特征在于:所述非叶子结点筛选规则为:
a)是AIR树的非叶子结点;
b)在该结点上具有查询q'的所有属性类别;
c)查询q'的每一个属性值范围与该结点的对应属性值范围有交集;
d)查询q'的关键字与该结点的倒排文件关键字符合关键字匹配;
e)满足关于q'和结点的之间空间距离的不等式:
14.如权利要求12所述的系统,其特征在于:所述叶子结点筛选规则为:
a)查询q'与该结点满足综合匹配;
b)查询q'和该结点之间的空间距离满足以下不等式:
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种基于相似度度量的人脸确认方法 | 2020-05-11 | 463 |
一种知识图谱驱动型的法律智能咨询系统 | 2020-05-14 | 582 |
软件相似性度量方法及装置 | 2020-05-12 | 466 |
一种学术资源推荐服务系统与方法 | 2020-05-12 | 322 |
一种基于物品时间流行性的推荐方法 | 2020-05-08 | 846 |
基于语义指导与记忆机制的视频描述方法 | 2020-05-12 | 422 |
编码医学词汇的映射 | 2020-05-11 | 640 |
一种基于隔离森林的海量数据异常值检测算法 | 2020-05-13 | 628 |
使用来自正交行和列的全局机器学习特征的表头部检测 | 2020-05-15 | 917 |
一种基于事理推荐的逻辑图谱构建及预警方法和装置 | 2020-05-13 | 921 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。