首页 / 专利库 / 引擎 / 冷启动 / 一种基于用户偏好和信任的冷启动推荐方法

一种基于用户偏好和信任的冷启动推荐方法

阅读:1024发布:2020-05-31

专利汇可以提供一种基于用户偏好和信任的冷启动推荐方法专利检索,专利查询,专利分析的服务。并且本 发明 请求 保护一种基于用户偏好和信任的 冷启动 推荐方法,包括步骤:S1,依据用户社交信息,度量用户间的综合信任值,构建信任关系矩阵;S2,依据用户评分数据,计算用户的偏好相似度,构建偏好关系矩阵;S3,利用综合相似度计算方法融合偏好关系与信任关系,并使用蜂群 算法 迭代 更新综合相似度中的权值,进行多目标优化,使权值达到自适应最优,构建偏好信任关系矩阵;S4,基于偏好信任关系矩阵,选取目标用户的最可信邻居集为其预测相应项目的评分值;S5,将预测评分高的项目推荐给目标用户。本发明提高用户信任度量的精确度、更准确地构建用户行为偏好及提高了对冷启动用户的推荐 质量 。,下面是一种基于用户偏好和信任的冷启动推荐方法专利的具体信息内容。

1.一种基于用户偏好和信任的冷启动推荐方法,其特征在于,包括以下步骤:S1、依据用户社交信息,度量用户间的综合信任值,构建信任关系矩阵;S2、依据用户评分数据,计算用户的偏好相似度,构建偏好关系矩阵;S3、利用综合相似度计算方法融合步骤S2的偏好关系与步骤S1的信任关系,并使用蜂群算法迭代更新综合相似度中的权值,进行多目标优化,使权值达到自适应最优,构建偏好信任关系矩阵;S4、基于偏好信任关系矩阵,选取冷启动用户的最可信邻居集为其预测相应项目进行评分;S5、将预测评分高的项目推荐给冷启动用户。
2.根据权利要求1所述的基于用户偏好和信任的冷启动推荐方法,其特征在于,所述步骤S1构建信任关系矩阵包括以下步骤:
通过计算用户间的信任值得到用户对另一用户的信任程度,信任值为0的两用户间不存在信任关系,形成一个N×N有向邻接矩阵T,即用户的信任关系矩阵;其中的元素TS(ui,uj)代表第i个用户对第j个用户的综合信任程度;所述N为正整数,且i、j均为不大于N的正整数。
3.根据权利要求2所述的基于用户偏好和信任的冷启动推荐方法,其特征在于,所述步骤S1中计算用户间信任值的方法包括:
(1)根据用户社交网的特性将用户的信任分为直接信任Dt和间接信任IDt;
(2)根据用户在社交网中相对位置范围将用户的可被信任概率分为局部可被信任概率α和全局可被信任概率β;
(3)根据信任的非对称相似计算用户的局部可被信任概率α;
(4)根据用户在社交网中得声望机制计算用户全局可被信任概率β;
(5)根据以上推理公式以及社会学中的相关理论知识得到用户综合信任度TS(u,v),TS(u,v)=α(u,v)*Dt(u,v)+βv*IDt(u,v)。
4.根据权利要求2所述的基于用户偏好和信任的冷启动推荐方法,其特征在于,所述步骤S2构建用户的偏好关系矩阵具体包括:获取N个用户对M个项目的主动评分,未主动评分的项目评分为空值,形成一个N×M用户-项目评分矩阵R;其中元素R(ui,m)表示第i个用户对第m个项目的评分;所述N、M均为正整数,且i、m依次均为不大于N与M的正整数;基于此评分信息通过相似度计算得到用户间的评分相似度从而形成一个N×N矩阵S,即用户的偏好关系矩阵;其中元素S(ui,uj)代表第i个用户与第j个用户的评分相似程度,所述N为正整数,且i、j均为不大于N的正整数。
5.根据权利要求4所述的基于用户偏好和信任的冷启动推荐方法,其特征在于,所述步骤S2中计算用户间评分相似度的方法包括:
(1)将用户间的杰卡尔德共同评分项目占比定义为用户间的初始评分相似度;
(2)使用基于用户相似的用户评分偏好相似计算方法缓解用户间评分偏差对用户间的评分相似度带来的影响。
6.根据权利要求1所述的基于用户偏好和信任的冷启动推荐方法,其特征在于,所述步骤S3中计算用户间综合相似度的方法包括:
(1)采用综合相似度计算方法融合用户的社交信息和评分信息;
(2)以综合相似度中的权重序列为自变量,综合绝对平均误差和F调和率可得到一个多目标优化的目标函数;
(3)采用蜂群优化算法对所述多目标函数进行优化从而找到最优的权重系数集{a,b,c},最终达到权重系数自适应。
7.根据权利要求6所述的基于用户偏好和信任的冷启动推荐方法,其特征在于,所述步骤S4中计算目标用户u对项目m的预测评分值:
其中,CS(u,v)表示用户u和用户v之间的综合相似性度;R(v,m)是用户v对项目m的评分,TNu是目标用户的最近可信邻居集。
8.根据权利要求7所述的基于用户偏好和信任的冷启动推荐方法,其特征在于,所述步骤S5中对于待推荐的项目集合Irec共有|Irec|个预测评分;降序排列待推荐项目的预测评分,取预测评分靠前的top(1≤top≤M)个项目向目标用户进行推荐。

说明书全文

一种基于用户偏好和信任的冷启动推荐方法

技术领域

[0001] 本发明属于数据挖掘协同领域,特别是涉及一种基于用户偏好和信任的冷启动推荐方法。

背景技术

[0002] 推荐系统是指应用知识发现技术产生个性化推荐,从而帮助用户在大量的文章、产品、电影、音乐、网页等中筛选出有用的信息,已被广泛运用到各电子商务平台中。
[0003] 已有的推荐方法主要分为基于内容的分为基于关联规则的推荐、内容过滤推荐、协同过滤推荐等三种。尤其,协同过滤推荐技术是被应用得最为广泛的一种推荐方法。但是协同过滤推荐技术也存在着用户冷启动的问题。基于用户协同过滤推荐技术的冷启动推荐方法的原理:通过寻找与目标用户偏好相似度较高的用户群,然后将该用户群感兴趣的项目推荐给目标用户。因此,寻找与目标用户相似度较高的其他用户是解决用户冷启动问题的关键。目前,计算用户间相似度的方法主要利用用户评分项目信息,然而用户-项目评分矩阵中的数据通常非常稀疏。
[0004] 针对冷用户评分信息数据稀疏问题,目前使用最为广泛的就是应用多种类型的数据计算用户的综合相似度。其中,随着Web2.0的快速发展,用户的社交信息更容易被挖掘,且可靠性更高;因此,融合评分信息和社交信息计算用户间的综合相似度的方法是被应用得最广泛的。
[0005] 尽管科研人员通过使用以上两种类型的数据计算用户的综合相似度,在一定程度上提高了冷用户的个性化推荐精度。但却往往忽视了两种类型数据各自存在的独特性,从而在处理两种数据时存在以下两方面的问题:一方面,一般都仅从单一的信任度来考虑用户的信任关系,即仅考虑单一方面对用户信任的影响,且在用户评分相似上采用一般的相似度计算方法;另一方面,在用户综合相似度计算中,使用传统方法确定用户评分相似、信任值、社交相似的权值分配,导致用户的综合相似度准确度具有一定的片面性。因此,现有的融合信任信息和评分信息的用户冷启动推荐方法仍未能有效地提高冷用户的个性化推荐准确度。

发明内容

[0006] 本发明旨在解决以上现有技术的问题。提出了一种提高用户间信任值度量的准确度,同时提高用户评分相似度计算的精确度,多目标优化的基于用户偏好和信任的冷启动推荐方法。本发明的技术方案如下:
[0007] 一种基于用户偏好和信任的冷启动推荐方法,其包括以下步骤:S1、依据用户社交信息,度量用户间的综合信任值,构建信任关系矩阵;S2、依据用户评分数据,计算用户的偏好相似度,构建偏好关系矩阵;S3、利用综合相似度计算方法融合步骤S2的偏好关系与步骤S1的信任关系,并使用蜂群算法迭代更新综合相似度中的权值,进行多目标优化,使权值达到自适应最优,构建偏好信任关系矩阵;S4、基于偏好信任关系矩阵,选取冷启动用户的最可信邻居集为其预测相应项目进行评分;S5、将预测评分高的项目推荐给冷启动用户。
[0008] 进一步的,所述步骤S1构建信任关系矩阵包括以下步骤:
[0009] 通过计算用户间的信任值得到用户对另一用户的信任程度,信任值为0的两用户间不存在信任关系,形成一个N×N有向邻接矩阵T,即用户的信任关系矩阵;其中的元素TS(ui,uj)代表第i个用户对第j个用户的综合信任程度;所述N为正整数,且i、j均为不大于N的正整数。
[0010] 进一步的,所述步骤S1中计算用户间信任值的方法包括:
[0011] (1)根据用户社交网的特性将用户的信任分为直接信任Dt和间接信任IDt;
[0012]
[0013]
[0014] 其中,|Fu|表示用户u的好友数目;N表示用户和用户之间传递路径的[0015] 总数;d表示用户与用户间可达路径的长度,且为了节省计算开销和避免不[0016] 必要的信任传递,本方法设置3≥d>1。
[0017] 进一步的,所述步骤(1)中,用户间的信任值为:
[0018] T(u,v)=Dt(u,v)+IDt(u,v)
[0019] (2)根据用户在社交网中相对位置范围将用户的可被信任概率分为局部可被信任概率α和全局可被信任概率β;
[0020] (3)根据信任的非对称相似计算用户的局部可被信任概率α;
[0021]
[0022] 其中,Fu表示用户u的直接好友;Fv表示用户v的直接好友;Fu∩Fv表示用户u和用户v的共同好友,本发明为了避免用户间存在直接信任而局部可被信任概率α为0的矛盾,故默认设置所有可达好友间的共同好友数初始为1;α(u,v)和α(v,u)则分别表示用户v被用户u信任的概率和用户u被用户v信任的概率。
[0023] (4)根据用户在社交网中得声望机制计算用户全局可被信任概率β;
[0024]
[0025] 其中,|Iu|表示用户u的信任入度; 表示用户u所处社交网中用户的平均信任入度;当用户u的信任入度 时,用户u的全局可被信任概率为1。
[0026] (5)根据以上推理公式以及社会学中的相关理论知识得到用户综合信任度TS(u,v)。
[0027] TS(u,v)=α(u,v)*Dt(u,v)+βv*IDt(u,v)
[0028] 进一步的,所述步骤S2构建用户的偏好关系矩阵具体包括:获取N个用户对M个项目的主动评分,未主动评分的项目评分为空值,形成一个N×M用户-项目评分矩阵R;其中元素R(ui,m)表示第i个用户对第m个项目的评分;所述N、M均为正整数,且i、m依次均为不大于N与M的正整数;基于此评分信息通过相似度计算得到用户间的评分相似度从而形成一个N×N矩阵S,即用户的偏好关系矩阵;其中元素S(ui,uj)代表第i个用户与第j个用户的评分相似程度,所述N为正整数,且i、j均为不大于N的正整数。
[0029] 进一步的,所述步骤S2中计算用户间评分相似度的方法包括:
[0030] (1)使用用户间的杰卡尔德共同评分项目占比定义用户间的初始评分相似度is(u,v):
[0031]
[0032] 其中,Iu和Iv分别表示被用户u和用户v评分的项目的总数目。
[0033] (2)使用基于用户相似的用户评分偏好的相似计算方法缓解用户间评分偏差对用户间的评分相似度带来的影响。故最终的用户间评分相似度S(u,v):
[0034] S(u,v)=is(u,v)*URP(u,v)
[0035]
[0036] 其中,μu和μv分别代表用户u和用户v对项目的平均评分值;σu和σv分别代表用户u和用户v的评分标准差。
[0037] 进一步的,所述步骤S3中计算用户间综合相似度的方法包括:
[0038] (1)采用线性加权的方法融合用户的社交信息和评分信息,用户间的综合相似度为:
[0039] CS(u,v)=a*TS(u,v)+b*S(u,v)+c*J(u,v)
[0040]
[0041] 其中,a、b、c分别为三个权重系数,且三者满足a+b+c=1;J(u,v)表示用户u和用户v的社交相似。
[0042] (2)以综合相似度中的权重系数序列{a,b,c}为自变量,综合预测评分的绝对平均误差和F调和率可得到一个多目标优化的目标函数:
[0043]
[0044]
[0045] 其中,S表示目标函数;MAE表示绝对平均误差;P(u,m)表示用户对项目的预测评分,下文会介绍;N表示预测评分的次数;F调和率由准确率P和召回率R融合而成。
[0046] 进一步的,F调和率为:
[0047]
[0048]
[0049] 其中,M和N分别表示预测评分的项目数与测试集中被评分的项目数,H表示用户已经评过分的项目数。
[0050] (3)采用蜂群优化算法对这几个目标进行优化,当目标函数S取最小值时,其所对应的权重系数{a,b,c}即为最优解。
[0051] 进一步的,所述步骤S4中计算目标用户u对项目m的预测评分值:
[0052]
[0053] 其中,CS(u,v)表示用户u和用户v之间的综合相似性;R(v,m)是用户v对项目m的评分,TNu是目标用户的最近可信邻居集。
[0054] 进一步的,所述步骤S4中计算目标用户u对项目m的预测评分值:
[0055]
[0056] 其中,CS(u,v)表示用户u和用户v之间的综合相似性度;R(v,m)是用户v对项目m的评分,TNu是目标用户的最近可信邻居集。
[0057] 进一步的,所述步骤S5中对于待推荐的项目集合Irec共有|Irec|个预测评分;
[0058] 降序排列待推荐项目的预测评分,取预测评分靠前的top(1≤top≤M)个项目[0059] 向目标用户进行推荐。
[0060] 本发明的优点及有益效果如下:
[0061] 1.本发明细化用户信任,将其分为直接信任和间接信任,并考虑到社会学中信任传播的特性,首次引入可被信任概率来进一步提高用户信任度量的精确度,充分挖掘社交信任信息中存在的隐式信息,缓解冷用户的数据稀疏问题。
[0062] 2.在计算用户间的评分相似度时,本发明首先使用杰卡尔德相似度求得用户间的初始评分相似度,并考虑到等级评分对用户评分偏差的影响,采用URP相似度进行进一步降低由评分偏差导致的用户评分相似度的误差。
[0063] 3.以综合相似度中的权重序列为自变量,综合绝对平均误差和F调和率得到一个多目标优化的目标函数。本发明首次采用蜂群算法对这两个目标进行迭代优化,提高算法的收敛速度,使其权重系数自适应。保证用户综合相似度中的权重系数处于最优分配,提高用户综合相似度计算的准确度,从而提高对冷用户推荐的推荐质量附图说明
[0064] 图1是本发明提供优选实施例基于用户偏好和信任的冷启动推荐方法的原理图;
[0065] 图2为用户的信任关系矩阵示意图;
[0066] 图3为用户的信任关系网络示意图;
[0067] 图4为用户-项目评分矩阵的示意图;
[0068] 图5是本发明优选实施例基于用户偏好和信任的冷启动推荐方法的流程图

具体实施方式

[0069] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、详细地描述。所描述的实施例仅仅是本发明的一部分实施例。
[0070] 本发明解决上述技术问题的技术方案是:
[0071] 本发明公开了一种基于用户偏好和信任的冷启动推荐方法,如图1所示,包括以下步骤:
[0072] 第一步,构建用户的信任关系矩阵。获取如图2所示中的用户信任关系矩阵,并且依据其得到用户间的信任关系网络。如图3所示,即为用户间的信任关系网络,箭头表示两者为好友关系,例如,U1指向U2表示U1与U2为直接好友,即U1直接信任U2。
[0073] 在本实施方式中,运用以上获取到的用户信任关系矩阵的数据,通过计算用户间的信任值得到用户对另一用户的信任程度,信任值为0的两用户间不存在信任关系(表明两用户在社交网络中不存在可达路径),最终得到一个6×6矩阵T;其中的元素T(ui,uj)代表第i个用户对第j个用户的信任程度;且i、j均为不大于6的正整数。依据上述步骤S1中的用户间的综合信任值计算的理论推导公式和图2中的数据,本实施例可得到一组相关数据。例如用户U1与用户U2的信任关系数据:
[0074]
[0075]
[0076] 最终得到TS(u1,u2)=0.5*0.667+0.25*1=0.5835,表示用户U1对用户U2的综合信任程度为0.5835。以此类推可以计算得到其他用户间的信任值,从而形成包含信任程度的用户的信任关系矩阵T。
[0077] 第二步,构建用户的偏好关系矩阵。如图4所示,获取6个用户对6个项目的主动评分(本发明中的用户项目评分为等级评分,该等级评分分为1、2、3、4、5总共5个等级;评分越高表示用户对该项目的偏好越高),未主动评分的项目评分为空值,形成一个6×6用户-项目评分矩阵R;其中元素R(ui,im)表示第i个用户对第m个项目的评分;且i、m均为不大于6的正整数。
[0078] 在本实施方式中,运用以上得到的用户-项目评分矩阵中的数据信息,通过相似度计算得到用户间的评分相似度从而形成一个6×6矩阵S;其中元素S(ui,uj)代表第i个用户与第j个用户的评分相似程度,且i、j均为不大于6的正整数。依据上述步骤S2中的用户间的评分相似度计算的理论推导公式和图4中的数据,本实施例可得到一组相关数据。例如用户U1与用户U2的偏好关系数据:
[0079]
[0080]
[0081] 最终得到S(u1,u2)=is(u1,u2)·URP(u1,u2)=0.25*0.421=0.105,表示用户U1与用户U2的评分相似度为0.105,即偏好相似为0.105。以此类推可以计算得到其他用户间的评分相似度,从而形成包含偏好关系的用户的偏好关系矩阵S。
[0082] 第三步,构建用户的偏好信任关系矩阵。在本实施方式中,依据第一步得到的信任关系和第二步得到的偏好关系,通过综合相似度计算得到用户间的综合相似度,从而得到一个6×6矩阵CS,即用户的偏好信任关系矩阵;其中元素CS(ui,uj)代表第i个用户与第j个用户的综合相似度,且i、j均为不大于6的正整数。依据上述步骤S3中的用户间的综合相似度计算的理论推导公式和已得到的偏好关系和信任关系数据,本实施例可得到一组相关数据。例如用户U1与用户U2的社交相似:
[0083]
[0084] 以此本实施例可以得到含有权重系数的用户间的综合相似度:
[0085] CS(u1,u2)=a*0.75+b*0.105+c*0.333
[0086] 以综合相似度中的权重系数序列{a,b,c}为自变量,综合预测评分的绝对平均误差和F调和率得到一个多目标优化的目标函数S,并采用蜂群优化算法对这几个目标进行优化,当目标函数S取值最小时从而找到最优的权系数集合{a,b,c},假设此时的权重系数最优值为{0.4,0.4,0.2}。则
[0087] CS(u1,u2)=0.4×0.75+0.4×0.105+0.2×0.333=0.4086
[0088] 以此类推可以计算得到其他用户间的综合相似度,从而得到用户的偏好信任关系矩阵。
[0089] 第四步,寻找目标用户的最可信邻居集并得到项目的预测评分。依据第三步得到的用户的偏好信任关系矩阵的数据,降序排列目标用户的综合相似度,选择确定目标用户的可信邻居集(本实施方式中取K为10);通过评分预测公式计算该可信邻居集对项目的预测评分,即目标用户对该项目的预测评分值。在本实施方式中,假设U2为U1的唯一一个可信邻居,则用户U1对项目I3的预测评分值为:
[0090]
[0091] 第五步,将预测评分较高的项目推荐给冷用户。依据第四步得到的目标用户对项目的预测评分信息,降序排列待推荐项目的预测评分,选择预测评分排名靠前的待推荐项目对目标用户进行推荐。
[0092] 该基于用户偏好和信任的冷启动推荐方法,不仅能够挖掘出更多冷用户的可信好友解决冷用户的数据稀疏问题;而且多目标优化的方法提高用户间的综合相似度计算的精确度,从多类型数据角度展示用户间的偏好信任关系;提高对冷用户的个性化推荐质量。
[0093] 以上这些实施例应理解为仅用于说明本发明而不用于限制本发明的保护范围。在阅读了本发明的记载的内容之后,技术人员可以对本发明作各种改动或修改,这些等效变化和修饰同样落入本发明权利要求所限定的范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈