专利汇可以提供采用AI3解决SKQwhy-not问题的方法及系统专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种采用AI3解决SKQwhy-not问题的方法及系统,涉及空间关键字查询技术领域,本发明通过将对象的数字属性以布尔表达式的形式表示,更接近现实应用场景;并设计AI3索引来巧妙的组织对象信息,同时设计出相应的查询策略,实现通过 修改 查询q',用最小的修改代价,满足在查询结果中所有缺失对象均出现,进而解决空间关键字查询中why-not问题的方法及系统。,下面是采用AI3解决SKQwhy-not问题的方法及系统专利的具体信息内容。
1.一种采用AI3解决SKQwhy-not问题的方法,其特征在于,包括以下步骤:
获取所有对象o,构建AI3索引;
获取初始查询q=(q.loc,q.doc0,q.B,k,α)和缺失对象集M;根据缺失对象的关键字的频率递减的顺序构建候选关键字列表CKS、根据缺失对象的相似性得分递减的顺序构建候选属性值对列表CAS;将精炼查询q'的关键字集q'.doc和属性值对q'.B'分别设置为q.doc0和q.B;
有序地抽取CKS中的关键字和CAS中的属性值对,分别添加至查询q'的关键字集q'.doc和查询q'的属性值对q'.B'中,形成新的精炼查询q';分别对各个精炼查询q'进行处理以找出最佳精炼查询,直至CKS和CAS都为空;
分别对各个精炼查询q'进行处理,具体包括:
计算q'的修改代价p',过滤掉p'≥pc的查询q',pc为保留初始查询关键字和属性、且所有的缺失对象都出现在查询结果中的查询qb的修改代价;
对于p'
若为非频繁关键字,则分析其对应的磁盘页面中的每个对象,若查询q'的属性值对q'.B'与对象的属性值对满足属性匹配,则将其对应的磁盘页面中的对象添加到满足查询q'要求的对象集中,并计算查询q'和对象之间的相似性得分;
对满足查询q'要求的对象集中的所有对象均根据其相似性得分从高至低排序,直到所有原始结果对象和所有缺失对象均出现,获得k'个对象;
如果k'≤km,km为保留初始查询关键字和属性、且所有的缺失对象都出现在查询结果中时结果集的大小,则计算q'的修改代价p',如果p'
使用四叉树结构将数据空间分层划分为单元格;将单元格作为基本的存储单位,存储包含关键字的对象的空间位置和属性信息;
创建三个组件:用作门户的查找表、包含密集关键字单元的摘要信息的头文件,以及在所有倒排列表中存储关键字单元元组的数据文件;
将频繁关键字的基本关键字单元的属性信息存储在四叉树的叶子结点中;
四叉树的每一个非叶子结点Ri都包含三个属性:Ri.id,Ri.S,Ri.Address,其中Ri.id是结点id,Ri.Address是Ri的所有子结点的地址列表和Ri.S是Ri的所有子结点的属性值对的并集;
四叉树的每一个叶子结点Ri都包含三个属性:Ri.id,Ri.S,Ri.Address,其中Ri.id是结点id,Ri.Address是它链接到的磁盘页面的地址,Ri.S是它链接到的磁盘页面中所有对象的属性值对的并集。
3.如权利要求1所述的方法,其特征在于:B为布尔表达式:
为一个谓词集合,其中i∈[1,n],i∈N*。
4.如权利要求1所述的方法,其特征在于:计算q'的修改代价p',计算公式为:
其中,β1,β2,β3,β4分别表示是cost函数中k值、关键字、属性种类、属性值的权重;βi≥0且 k'是精炼查询q'的查询结果集的大小,k0是初始查询q的结果集的大小,km是保留初始查询关键字和属性,且所有的缺失对象都出现在查询结果中时结果集的大小,用km-k0规范化k'-k0;Δdoc是从q.doc0调整到q'.doc所需改变的关键字的数量,其中缺失对象集M={m1,m2,...,mj},通过|q.doc0∪M.doc|来规范化
Δdoc;ΔAn是从初始查询调整到精炼查询所需改变的属性种类的数量,通过|q.B∪M.B|来规范化ΔAn; n是q.B和M.B所包含的属性的总和;Δvi是包含属性Ai的所有
对象关于该属性的属性值的最大差值;|vi'-vi|是属性Ai中当前查询属性值vi'与初始查询属性值vi之间的差值的绝对值,且|vi'-vi|≤Δvi,通过Δvi来规范化|vi'-vi|。
5.如权利要求1所述的方法,其特征在于:计算查询q和对象o之间的相似性得分,计算公式为:
其中α是0到1之间的一个变量,用来定义距离邻近度与文本相关性之间的相对重要性,d(q.loc,o.loc)表示的是查询q与对象o之间的欧氏距离,dmax(q.loc,O.loc)表示的是查询点q到对象集合O中的所有对象的最大距离,用对象集O中所有对象间距离的最大值表示。
6.如权利要求2所述的方法,其特征在于:若为频繁关键字,则将其在头文件中的四叉树根结点加入待处理的非叶子结点队列,根据预设的筛选规则选出符合条件的叶子结点,加入符合条件的叶子结点队列,具体包括以下步骤:
若为频繁关键字,将其在头文件中的四叉树根结点加入待处理的非叶子结点队列;
判断待处理的非叶子结点队列中当前结点的子结点是否是合格的结点;
若不是,过滤掉该子结点;若是,判断该子结点是非叶子结点还是叶子结点;
若是非叶子结点,将该非叶子结点加入待处理的非叶子结点队列等待处理;若是叶子结点,将该叶子结点加入符合条件的叶子结点队列。
7.如权利要求6所述的方法,其特征在于:判断待处理的非叶子结点队列中当前结点的子结点是否是合格的结点,判断标准是:
a)在该子结点上具有查询q'的所有属性类别;
b)查询q'的每一个属性值范围与该子结点的对应属性值范围有交集。
8.一种采用AI3解决SKQwhy-not问题的系统,其特征在于,包括:
AI3索引构建模块,其用于:获取所有对象o,构建AI3索引;
候选列表构建模块,其用于:获取初始查询q=(q.loc,q.doc0,q.B,k,α)和缺失对象集M;根据缺失对象的关键字的频率递减的顺序构建候选关键字列表CKS、根据缺失对象的相似性得分递减的顺序构建候选属性值对列表CAS;将精炼查询q'的关键字集q'.doc和属性值对q'.B'分别设置为q.doc0和q.B;
精炼查询模块,其用于:有序地抽取CKS中的关键字和CAS中的属性值对,分别添加至查询q'的关键字集q'.doc和查询q'的属性值对q'.B'中,形成新的精炼查询q';分别对各个精炼查询q'进行处理以找出最佳精炼查询,直至CKS和CAS都为空;分别对各个精炼查询q'进行处理,具体包括:
计算q'的修改代价p',过滤掉p'≥pc的查询q',pc为保留初始查询关键字和属性、且所有的缺失对象都出现在查询结果中的查询qb的修改代价;
对于p'
若为非频繁关键字,则分析其对应的磁盘页面中的每个对象,若查询q'的属性值对q'.B'与对象的属性值对满足属性匹配,则将其对应的磁盘页面中的对象添加到满足查询q'要求的对象集中,并计算查询q'和对象之间的相似性得分;
对满足查询q'要求的对象集中的所有对象均根据其相似性得分从高至低排序,直到所有原始结果对象和所有缺失对象均出现,获得k'个对象;
如果k'≤km,km为保留初始查询关键字和属性、且所有的缺失对象都出现在查询结果中时结果集的大小,则计算q'的修改代价p',如果p'
使用四叉树结构将数据空间分层划分为单元格;将单元格作为基本的存储单位,存储包含关键字的对象的空间位置和属性信息;
创建三个组件:用作门户的查找表、包含密集关键字单元的摘要信息的头文件,以及在所有倒排列表中存储关键字单元元组的数据文件;
将频繁关键字的基本关键字单元的属性信息存储在四叉树的叶子结点中;
四叉树的每一个非叶子结点Ri都包含三个属性:Ri.id,Ri.S,Ri.Address,其中Ri.id是结点id,Ri.Address是Ri的所有子结点的地址列表和Ri.S是Ri的所有子结点的属性值对的并集;
四叉树的每一个叶子结点Ri都包含三个属性:Ri.id,Ri.S,Ri.Address,其中Ri.id是结点id,Ri.Address是它链接到的磁盘页面的地址,Ri.S是它链接到的磁盘页面中所有对象的属性值对的并集。
10.如权利要求9所述的系统,其特征在于:B为布尔表达式:
*
为一个谓词集合,其中i∈[1,n],i∈N。
11.如权利要求9所述的系统,其特征在于:若为频繁关键字,所述精炼查询模块将其在头文件中的四叉树根结点加入待处理的非叶子结点队列,根据预设的筛选规则选出符合条件的叶子结点,加入符合条件的叶子结点队列,具体包括以下步骤:
若为频繁关键字,将其在头文件中的四叉树根结点加入待处理的非叶子结点队列;
判断待处理的非叶子结点队列中当前结点的子结点是否是合格的结点;
若不是,过滤掉该子结点;若是,判断该子结点是非叶子结点还是叶子结点;
若是非叶子结点,将该非叶子结点加入待处理的非叶子结点队列等待处理;若是叶子结点,将该叶子结点加入符合条件的叶子结点队列。
12.如权利要求11所述的系统,其特征在于:所述精炼查询模块判断待处理的非叶子结点队列中当前结点的子结点是否是合格的结点,判断标准是:
a)在该子结点上具有查询q'的所有属性类别;
b)查询q'的每一个属性值范围与该子结点的对应属性值范围有交集。
采用AI 解决SKQwhy-not问题的方法及系统
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
融合互补特征的视觉人体行为识别方法 | 2020-05-13 | 282 |
一种基于场景和社交网络位置的兴趣点推荐方法 | 2020-05-15 | 445 |
标识来自多个结果页面标识的优选结果页面 | 2020-05-11 | 335 |
一种基于关系指导及双通道交互机制的问题生成方法 | 2020-05-12 | 114 |
基于改进型循环神经网络单元的推荐系统 | 2020-05-13 | 978 |
一种LncRNA和环境因素关联关系的高效预测方法 | 2020-05-14 | 110 |
一种基于图嵌入法的链路预测方法 | 2020-05-11 | 82 |
一种基于隔离森林的海量数据异常值检测算法 | 2020-05-13 | 628 |
一种基于多目标区域特征聚合的卡口车辆检索方法及系统 | 2020-05-08 | 511 |
业务问题提取方法及装置 | 2020-05-15 | 128 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。