专利汇可以提供基于用户特征的协同过滤推荐算法专利检索,专利查询,专利分析的服务。并且基于用户特征的协同过滤推荐 算法 涉及协同过滤推荐算法的领域,为了缓解传统协同过滤推荐算法在 冷启动 、推荐准确性和数据稀疏性方面的问题。通过对基于用户的协同过滤算法的研究,该算法利用用户注册信息来提取用户属性特征,并用已有的评分信息提取用户的兴趣特征和用户之间的信任度,综合以上用户特征融合特征相似性进一步产生推荐。与传统的协同过滤推荐算法比较,基于用户特征的协同过滤推荐算法有效的提高了推荐准确性。,下面是基于用户特征的协同过滤推荐算法专利的具体信息内容。
1.基于用户特征的协同过滤推荐算法,其特征在于,包括以下步骤:
输入:用户-项目评分矩阵R(m,n),用户注册信息,目标用户u;
输出:目标用户u的top-N推荐集;
Step1根据用户注册信息获取用户属性信息;
Step2根据Step1提取的属性,得到用户属性相似度sima(u,v);
Step3将得到的用户属性相似度sima(u,v)与传统的pearson相似度融合,得到用户属性综合相似度simp(u,v);
Step4根据用户-项目评分矩阵R(m,n),计算用户兴趣度集合Iu;
Step5根据Step4中的用户兴趣集合Iu计算用户间兴趣相似度simI(u,v);
Step6将属性相似度simp(u,v)与兴趣相似度simI(u,v)融合,得到属性兴趣相似度simz(u,v);
Step7根据用户-项目评分矩阵R(m,n),计算出用户间的直接信任度,建立信任度矩阵T0,然后计算出用户间的间接信任度T1,然后填充到直接信任度矩阵T0中,构建用户信任度矩阵T(u,v);
Step8最终将用户信任度矩阵T(u,v)与属性兴趣相似度simz(u,v)结合得到最终的用户特征相似度simw(u,v);
Step9按照simw(u,v)的值从大到小排序,选取相似度最高的前N个邻居集合Nu,选取最靠前的N个项目作为目标用户u的top-N推荐集。
2.根据权利要求1所述的协同过滤推荐算法,其特征在于:
获取用户评分数据后,用pearson相关相似性计算用户间的评分相似性;其中,Ruv表示用户u和用户v共同评分项目集合,Ru,i表示用户u对第i个项目的评分,Rv,i表示用户v对第i个项目的评分, 表示用户u对已评项目的平均评分, 表示用户v对已评项目的平均评分,则用户u和用户v的评分相似性公式sim(u,v)如(1)所示;
获取用户属性信息分为三部分:用户性别、用户年龄和用户职业的信息;
(1)性别相似性
两个用户间性别相同则相似性为1,不同则相似性为0;设用户u的性别为Su,用户v的性别为Sv,则用户u和用户v在特征向量空间性别维的相似系数S(u,v)计算公式如(2)所示:
(2)年龄相似性
按照年龄段为5来划分分段函数;设用户u的年龄为Au,用户v的年龄为Av,则用户u和用户v在特征向量空间年龄维的相似系数A(u,v)的计算公式如(3)所示;
(3)职业相似性
将职业分类描述成一个树形结构,两个任意节点的长度设为1,总长度用Height表示,职业a和职业b在职业树中最近的共同父类称为父节点,其在职业树上所位于的层次称为其高度,记为Ha,b;用户u和用户v的职业分别用职业a和职业b表示,计算出职业a和职业b的相似度为simo(a,b)=1/3;则用户u和用户v在特征向量空间职业维的相似系数O(u,v)的计算公式如(4)所示;
(4)用户属性相似性;将上述性别,年龄,职业三个用户属性综合起来,则用户u和用户v在用户属性特征向量上的相似度sima(u,v)的计算公式如(5)所示;
sima(u,v)=αS(u,v)+βA(u,v)+γO(u,v) (5)
α、β、γ的取值为[0,1],同时满足α+β+γ=1;设定α、β、γ的取值以0.1为梯度进行遍历,采用MAE作为实验结果评价标准,MAE越小表明预测越准确、推荐质量越高;因此,在动态调整系数的过程中,当得到的MAE值最小时,将此时的α、β、γ值作为各个维的最终权重系数;MAE的计算公式如(6)所示;
其中,Pu,i表示目标用户u对第i个项目的预测评分,由公式(7)得到,Ru,i表示目标用户u对第i个项目的评分,n表示所有预测项目的个数。
3.根据权利要求1所述的协同过滤推荐算法,其特征在于:
首先根据用户属性相似度sima(u,v)选取相似度最高的前N个邻居集合,然后预测目标用户对目标项目的评分;预测评分公式如(7)所示,其中,Pu,i表示目标用户u对第i个项目的预测评分,Nu表示生成的top-N个邻居集合, 表示目标用户u对已评项目的平均评分, 表示用户v对已评项目的平均评分,Rv,i表示用户v对第i个目标项目的评分,sima(u,v)表示用户属性相似度;
将得到的用户属性相似度sima(u,v)与传统的pearson相似度进行融合,得到用户属性综合相似度simp(u,v),用户属性综合相似度计算公式如(8)所示;
其中,Ruv表示用户u和用户v共同评分项目集合,Ru,i表示用户u对第i个项目的评分,Rv,i表示用户v对第i个项目的评分, 表示用户u对已评项目的平均评分, 表示用户v对已评项目的平均评分,sima(u,v)表示用户属性相似度;
将用户对项目类别属性的喜好当作用户的兴趣特征,用户对某类项目的评价越多,则对此类项目的兴趣度越大;设NIu,i表示用户u对i类项目的评价总数,NIu表示用户已评价的项目总数,则用户u对某类项目的兴趣度Iu,i的计算公式如(9)所示;
计算出用户对每类项目的兴趣度,计算出用户间的兴趣相似度;设用户u的兴趣度用集合Iu=(Iu,1,Iu,2,…Iu,i)表示,Iuv表示用户u和用户v共同评分的项目类别集合,Iu,i表示用户u对i类项目的兴趣度,Iv,i表示用户v对i类项目的兴趣度,表示用户u对已评项目类别的平均兴趣度,表示用户v对已评项目类别的平均兴趣度;基于公式(1),任意两个用户间的兴趣相似度simI(u,v)的计算公式如(10)所示;
最后将用户属性综合相似度simp(u,v)与兴趣相似度simI(u,v)加权融合,计算出属性兴趣相似度simzu,v如公式(11)所示,同样采用MAE作为实验结果评价标准,MAE越小表明预测越准确、推荐质量越高,因此,在动态调整系数δ的过程中,当得到的MAE值最小时,将此时的δ值作为最终系数;
simz(u,v)=δsimI(u,v)+(1-δ)simp(u,v) (11)
其中,MAE计算公式如(6)所示,预测公式Pu,i由(12)得到;首先根据属性兴趣相似度simz(u,v)选取相似度最高的前N个邻居集合,然后预测目标用户对目标项目的评分;在预测评分公式(12)中,Pu,i表示目标用户u对第i个项目的预测评分,Nu表示生成的top-N个邻居集合, 表示目标用户u对已评项目的平均评分, 表示用户v对已评项目的平均评分,Rv,i表示用户v对第i个目标项目的评分,simZ(u,v)表示属性兴趣相似度;
。
4.根据权利要求1所述的协同过滤推荐算法,其特征在于:
引入信任度来计算用户间的综合相似性,并将信任度分为直接信任度和间接信任度;
(1)直接信任度
计算用户间的直接信任度首先要计算初始信任度;一个用户为另一个用户推荐的项目中,计算出被推荐用户满意的项目比例可作为用户初始信任度;
根据基于用户协同过滤算法的预测评分机制,可得到用户u为用户v在第i个项目上的预测评分值,设 表示目标用户v对已评项目的平均评分, 表示用户u对已评项目的平均评分,Ru,i表示用户u对第i个目标项目的评分,其中sim(u,v)使用公式(1),则预测评分公式Pu,v,i如(13)所示;
如果用户u预测用户v对于第i个项目的评分值Pu,v,i与用户v的真实评分Rv,i比较,得到的差值绝对值小于ε,则认为推荐成功;用户评分值区间为[0,5],在此设定ε=0.2,公式如(14)所示;
|Pu,v,i-Rv,i|<ε (14)
用公式Correct(u,v,i)表示用户u对用户v关于项目i是否预测成功,公式如(15)所示;
设Pu为用户u能为用户v推荐的项目集合,则可得到用户v对用户u的初始信任度T0(u,v)如(16)所示;
(2)间接信任度
设用户u和用户v没有直接关联,但用户u和用户u1有直接信任关系,用户u1和用户v有直接信任关系,那么就说用户u和用户v通过用户u1建立了间接信任关系;
根据六度空间理论,则信任从用户u到用户v的传递长度不会超过6,由于信任传递长度越大,信任度越低,因此设信任在传递过程中的长度衰减因子θ如(17)所示,其中阈值H≤6,当前路径传递长度为N;
将用户信任度传递中最小的信任度作为整条传递路径上信任度的重要因素;若两个有直接信任关系用户的信任度为负数,则是不信任的,因此终止此条路径上的信任传递;设μ为信任度阈值,取值为0;则用户u对用户v的间接信任度T1(u,v)如公式(18)所示,其中k1…km表示中间信任度传递的用户;
通过上述公式将用户间的间接信任度T1填充到直接信任度T0矩阵中,构建用户信任度矩阵T(u,v);
最后将用户信任度矩阵T(u,v)与属性兴趣相似度simz(u,v)结合得到最终的用户特征相似度simw(u,v)如公式(19)所示;
得到最终的用户特征相似度之后,选取相似度最高的前N个邻居集合,然后预测目标用户对目标项目的评分,评分预测公式如(20)所示;
其中,Pu,i表示目标用户u对第i个项目的预测评分,Nu表示生成的top-N个邻居集合,表示目标用户u对已评项目的平均评分, 表示用户v对已评项目的平均评分,Rv,i表示用户v对第i个项目的评分,simw(u,v)表示用户特征相似度;通过上述预测评分公式从大到小排序选取最靠前的N个项目作为目标用户u的top-N个推荐集。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种基于QT的SCADA系统HMI开发方法 | 2020-05-08 | 180 |
一种基于组件式开发前端界面控件实现方法 | 2020-05-12 | 796 |
基于树形结构的标签存储方法及装置 | 2020-05-08 | 882 |
一种基于人工智能的视频舆情监测方法及系统 | 2020-05-12 | 506 |
物品溯源查询方法、终端、溯源方法、服务器及系统 | 2020-05-12 | 563 |
电力设备缺陷文本自动分类实现方法 | 2020-05-11 | 941 |
基于可扩展分布式查询系统的可信存证方法与系统 | 2020-05-11 | 367 |
一种信息拦截的方法、装置及终端 | 2020-05-11 | 655 |
一种液态金属与低沸点工质混合器 | 2020-05-08 | 987 |
记账方法、装置及电子设备 | 2020-05-11 | 988 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。