专利汇可以提供数据挖掘中数据分析方法的推荐方法专利检索,专利查询,专利分析的服务。并且本 发明 属于数据分析技术领域,具体为一种 数据挖掘 中数据分析方法的推荐方法。本发明的分析方法推荐方法主要包含四个部分:(1)基于数据集的最近邻推荐;(2)基于分析方法的协同过滤;(3)神经协同过滤;(4)推荐结果的融合。本发明通过基于数据分析的交互历史,挖掘数据集和分析方法的隐语义作为推荐依据,最终返回适合数据集的分析方法。本发明可帮助用户快速找到合适的分析方法,挖掘数据集中的信息。,下面是数据挖掘中数据分析方法的推荐方法专利的具体信息内容。
1.一种数据挖掘中数据分析方法的推荐方法,其特征在于,具体步骤如下:
给定m个数据集Di和n个分析方法Mj的交互矩阵Am*n,其中,Aij为数据集Di上分析方法Mj的得分,i=1,2,…,m,j=1,2,…,n,该得分由分析方法Mj在数据集Di上的误差和其他数据分析用户的评价得到:
(1)采用基于数据集的最近邻算法,预测数据集Di上分析方法Mj的得分,具体步骤为:
(1.1)对矩阵Aij做奇异值分解,得到矩阵Pm*k,Ik*k,Qk*n,使得A=P*I*Q;其中,矩阵P为数据集的隐因子矩阵,行向量Pi为数据集Di的特征向量;矩阵Q为分析方法的隐因子矩阵,列向量Qj为分析方法Mj的特征向量;
(1.2)对于数据集Di,定义它与数据集Dj的相似度
其中,α1+α2=1, 为数据集Di和数据集Dj特征向量间的余弦相似度, 为数据集Di和数据集Dj特征向量间的马氏相似度;
(1.3)计算数据集两两之间的相似度;
(1.4)对一个数据集Di,选取与它相似度最高的10个数据集构成数据集Di的最近邻集合(1.5)根据这些最近邻数据集上的评分记录,计算数据集Di上方法Mj的得分(2)采用基于分析方法的协同过滤算法,预测数据集Di上分析方法Mj的得分,具体步骤为:
(2.1)对矩阵Aij做奇异值分解,得到矩阵Pm*k,Ik*k,Qk*n,使得A=P*I*Q;其中,矩阵P为数据集的隐因子矩阵,Pi为数据集Di的特征向量;矩阵Q为分析方法的隐因子矩阵,Qj为分析方法Mj的特征向量;
(2.2)对于分析方法Mi,定义它与分析方法Mj的相似度
其中,α1+α2=1, 为数据集Di和数据集Dj特征向量间的余弦相似度,
为数据集Di和数据集Dj特征向量间的马氏相似度;
(2.3)计算分析方法两两之间的相似度;
(2.4)对一个数据集Di,根据该数据集上对每个分析方法的评分记录,计算数据集Di上方法Mj的得分
(3)采用奇异值分解的神经协同过滤算法,预测数据集Di上分析方法Mj的得分,具体步骤为:
(3.1)首先对矩阵Aij做奇异值分解,得到矩阵 使得A=PS*IS*QS;其
中,矩阵PS为数据集的隐因子矩阵, 为数据集Di的特征向量;矩阵QS为分析方法的隐因子矩阵, 为分析方法Mj的特征向量;
(3.2)再通过一个4层的MLP学习数据集Di和分析方法Mj的隐向量 和 向量维度与奇异值分解得到的向量维度相同;其中,激活函数使用ReLU函数;输出层的计算公式为:
……
其中,yui是数据集Di和分析方法Mj的预测评分,hT表示输出层边缘权重,zi是第i层的输出;
(3.3)结合前两步得到的隐向量,输出层的计算公式为:
其中, 是通过奇异值分解预测的得分, 是通过MLP预测的得分;使用sigmoid函数输出最后的预测得分;
(3.4)将数据集做10-fold交叉检验的训练,通过反向传播和随机梯度下降,得到模型最终参数;计算每个数据集Di上方法Mj的得分
(4)融合步骤(1)、(2)、(3)中三种模型预测的结果,具体步骤为:
(10)
(4.1)计算每种模型的误差:在测试数据集上计算三种模型的NDCG ,记为N1,N2,N3;
(4.2)融合前面三种模型预测的结果,得到最终数据集Di上方法Mj的得分:
其中
按照得分降序,返回列表中前十的算法作为推荐候选集,再按照{特征工程:2,模型选择:5,模型融合:1,调参、数据预处理:2}的上限做出过滤,即返回的算法中,属于“特征工程”的方法不超过2个,属于“模型选择”的方法不超过5个,属于“模型融合”的方法不超过1个,属于“调参、数据预处理”的方法不超过2个,此即为最后对数据分析任务推荐的方法列表。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种电力系统负荷预测和分析方法 | 2020-05-08 | 107 |
基于K最近邻算法攻击识别方法及充电装置 | 2020-05-11 | 699 |
基于重构模型的人体运动意向检测方法 | 2020-05-13 | 43 |
一种基于扩张点卷积空间金字塔池化的点云语义分割方法 | 2020-05-11 | 332 |
一种加强鲁棒性的无人机航拍图像拼接方法 | 2020-05-08 | 177 |
基于邻域回归与局部信息的图像重建方法 | 2020-05-11 | 174 |
基于因子分析与子空间协同表示的网络安全入侵检测方法 | 2020-05-12 | 644 |
一种基于粗糙-精细拟合的三维人脸检测方法 | 2020-05-08 | 94 |
一种基于空谱联合特征的高光谱海冰检测方法 | 2020-05-12 | 633 |
一种三维点云的处理方法、装置及设备 | 2020-05-11 | 859 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。