首页 / 专利库 / 商业 / 电子商务 / 一种基于跨域关联的兴趣点推荐方法

一种基于跨域关联的兴趣点推荐方法

阅读:1047发布:2020-05-17

专利汇可以提供一种基于跨域关联的兴趣点推荐方法专利检索,专利查询,专利分析的服务。并且本 发明 公开一种基于跨域关联的兴趣点推荐方法,着重解决POI推荐领域存在的数据稀疏问题和 冷启动 用户的问题。通过分析客观的 电子 商务数据集反应用户的购买偏好,映射到POI领域进行辅助推荐。能够很好的解决协同过滤技术中存在的不足。本发明考虑了用户在某一段时间内的兴趣迁移问题,能够更加充分地反应用户在不同季节时间段的购买偏好变化。,下面是一种基于跨域关联的兴趣点推荐方法专利的具体信息内容。

1.一种基于跨域关联的兴趣点推荐方法,其特征是,包括步骤如下:
步骤1、将用户在源域和目标域中的数据分别存储到源域矩阵和目标域矩阵中,其中源域矩阵的内容是用户购买物品及其购买次数,目标域矩阵的内容是用户签到兴趣点及其签到次数;
步骤2、采用LDA模型对每个用户的源域矩阵和目标域矩阵分别进行用户的购买偏好和签到偏好分布进行分析,得到每个用户的购买偏好分布和签到偏好分布;
步骤3、基于当前冷启动用户的购买偏好分布与其他用户的购买偏好分布,计算当前冷启动用户与其他用户之间的用户购买偏好相似度,并据此找到源域中与当前冷启动用户购买偏好相似的用户即共同用户,并将这些共同用户的购买偏好分布和签到偏好分布形成训练集后,输入MLP模型中进行训练,得到当前冷启动用户的MLP映射函数;
步骤4、以当前冷启动用户所在的某个签到兴趣点为中心,划定一个半径为r的圆的范围,将这个范围即兴趣点商业圈内所有用户签到过的历史记录存储到兴趣点历史签到矩阵中;其中r为设定值;
步骤5、采用LDA模型对兴趣点历史签到矩阵进行分析,得到当前兴趣点商业圈内所有用户的历史签到偏好分布;
步骤6、将当前冷启动用户在步骤2所得的购买偏好分布输入到步骤3所得的MLP映射函数中,得到当前冷启动用户的匹配签到偏好分布;
步骤7、基于当前冷启动用户的匹配签到偏好分布和当前冷启动用户所在兴趣点商业圈的历史签到偏好分布,计算当前冷启动用户偏好与兴趣点商业圈内兴趣点签到偏好的匹配度;
步骤8、先将步骤2所得当前冷启动用户的购买偏好分布和步骤6所得匹配签到偏好分布进行点乘计算,再将该点乘计算的结果与步骤7得到的当前冷启动用户偏好与兴趣点商业圈内兴趣点签到偏好的匹配度进行相乘计算,得到当前冷启动用户对于兴趣点商业圈内未签到过的兴趣点的预评分,并将预评分排在前面的兴趣点推送给当前冷启动用户。
2.根据权利要求1所述的一种基于跨域关联的兴趣点推荐方法,其特征是,步骤2中,购买偏好分布通过一个K维的向量来进行表示,该向量内容是用户对购买物品的偏好权重;签到偏好分布通过一个K维的向量来进行表示,该向量内容是用户对签到兴趣点的偏好权重;
其中K为设定值。
3.根据权利要求1所述的一种基于跨域关联的兴趣点推荐方法,其特征是,步骤3中,当前冷启动用户u'与源域中其他用户u之间的用户购买偏好相似度 为:
其中, 表示在购买偏好分布中,冷启动用户u'在某个时间段tk内购买偏好主题下的词分布, 表示在购买偏好分布中,其他用户u在某个时间段tk内购买偏好主题下的词分布。
4.根据权利要求1所述的一种基于跨域关联的兴趣点推荐方法,其特征是,步骤7中,当前冷启动用户u'与兴趣点商业圈内内兴趣点p的匹配度 为:
其中, 表示在匹配签到偏好分布中,冷启动用户u'在某个时间段tk内匹配签到偏好主题下的词分布; 表示在历史签到偏好分布中,冷启动用户u'在的当前的兴趣点在某个时间段tk内所处兴趣点商业圈内历史签到偏好主题下的词分布。
5.根据权利要求1所述的一种基于跨域关联的兴趣点推荐方法,其特征是,步骤8还进一步包括,将当前冷启动用户对于兴趣点商业圈内未签到过的兴趣点的预评分加上该兴趣点的全局平均签到次数,得到最终预评分,并将最终预评分排在前面的兴趣点推送给当前冷启动用户。

说明书全文

一种基于跨域关联的兴趣点推荐方法

技术领域

[0001] 本发明涉及数据推荐技术领域,具体涉及一种基于跨域关联的兴趣点推荐方法。

背景技术

[0002] 随着互联网信息爆炸式的增长,推荐系统成为帮助人们在大数据中寻找适用信息的利器,它能够在海量数据中,根据用户的偏好,为用户主动推荐个性化的服务,提升用户对系统的使用体验。目前,推荐系统的服务已经从电子商务领域扩展到很多其他领域,例如社交网络、位置服务、医疗服务等行业。在推荐系统相关技术的研究中,协同过滤技术是最热的技术之一,其虽然在研究中取得了很好的推荐效果,但是由于人们的购买能是有限的,推荐系统能够使用的数据通常非常稀疏,这会严重影响协同过滤的推荐效果。此外,推荐系统还存在用户的冷启动问题,即一个新的用户刚进入系统时是没有历史数据的,而协同过滤的基础是分析用户的历史数据,通过计算用户自身的兴趣和物品的相似度来进行推荐(如果一个用户A喜欢物品B,物品B与物品C相似,那么就可以给用户A推荐物品C),因此,原始的协同过滤技术无法解决用户的冷启动问题。

发明内容

[0003] 本发明所要解决的是现有协同过滤推荐方法存在数据稀疏性和冷启动用户的问题,提供一种基于跨域关联的兴趣点推荐方法。
[0004] 为解决上述问题,本发明是通过以下技术方案实现的:
[0005] 一种基于跨域关联的兴趣点推荐方法,包括步骤如下:
[0006] 步骤1、将用户在源域和目标域中的数据分别存储到源域矩阵和目标域矩阵中,其中源域矩阵的内容是用户购买物品及其购买次数,目标域矩阵的内容是用户签到兴趣点及其签到次数;
[0007] 步骤2、采用LDA模型对每个用户的源域矩阵和目标域矩阵分别进行用户的购买偏好和签到偏好分布进行分析,得到每个用户的购买偏好分布和签到偏好分布;
[0008] 步骤3、基于当前冷启动用户的购买偏好分布与其他用户的购买偏好分布,计算当前冷启动用户与其他用户之间的用户购买偏好相似度,并据此找到源域中与当前冷启动用户购买偏好相似的用户即共同用户,并将这些共同用户的购买偏好分布和签到偏好分布形成训练集后,输入MLP模型中进行训练,得到当前冷启动用户的MLP映射函数;
[0009] 步骤4、以当前冷启动用户所在的某个签到兴趣点为中心,划定一个半径为r的圆的范围,将这个范围即兴趣点商业圈内所有用户签到过的历史记录存储到兴趣点历史签到矩阵中;其中r为设定值;
[0010] 步骤5、采用LDA模型对兴趣点历史签到矩阵进行分析,得到当前兴趣点商业圈内所有用户的历史签到偏好分布;
[0011] 步骤6、将当前冷启动用户在步骤2所得的购买偏好分布输入到步骤3所得的MLP映射函数中,得到当前冷启动用户的匹配签到偏好分布;
[0012] 步骤7、基于当前冷启动用户的匹配签到偏好分布和当前冷启动用户所在兴趣点商业圈的历史签到偏好分布,计算当前冷启动用户偏好与兴趣点商业圈内兴趣点签到偏好的匹配度;
[0013] 步骤8、先将步骤2所得当前冷启动用户的购买偏好分布和步骤6所得匹配签到偏好分布进行点乘计算,再将该点乘计算的结果与步骤7得到的当前冷启动用户偏好与兴趣点商业圈内兴趣点签到偏好的匹配度进行相乘计算,得到当前冷启动用户对于兴趣点商业圈内未签到过的兴趣点的预评分,并将预评分排在前面的兴趣点推送给当前冷启动用户。
[0014] 上述步骤2中,购买偏好分布通过一个K维的向量来进行表示,该向量内容是用户对购买物品的偏好权重;签到偏好分布通过一个K维的向量来进行表示,该向量内容是用户对签到兴趣点的偏好权重;其中K为设定值。
[0015] 上述步骤3中,当前冷启动用户u'与源域中其他用户u之间的用户购买偏好相似度为:
[0016]
[0017] 其中, 表示在购买偏好分布中,冷启动用户u'在某个时间段tk内购买偏好主题下的词分布, 表示在购买偏好分布中,其他用户u在某个时间段tk内购买偏好主题下的词分布。
[0018] 上述步骤7中,当前冷启动用户u'与兴趣点商业圈内内兴趣点p的匹配度 为:
[0019]
[0020] 其中, 表示在匹配签到偏好分布中,冷启动用户u'在某个时间段tk内匹配签到偏好主题下的词分布; 表示在历史签到偏好分布中,冷启动用户u'在的当前的兴趣点在某个时间段tk内所处兴趣点商业圈内历史签到偏好主题下的词分布。
[0021] 作为改进,步骤8还进一步包括,将当前冷启动用户对于兴趣点商业圈内未签到过的兴趣点的预评分加上该兴趣点的全局平均签到次数,得到最终预评分,并将最终预评分排在前面的兴趣点推送给当前冷启动用户。
[0022] 与现有技术相比,本发明具有如下特点:
[0023] 1、采用用户在电子商务领域的购买记录数据对用户偏好进行分析来辅助跨域推荐。常用的推荐技术都是基于项目评分、用户评论等显式的用户消费行为数据进行分析的。其中基于项目评分的研究通常采用矩阵分解的方法,基于用户评论的研究通常采用隐语义模型对用户的偏好进行分析。本发明采用用户隐式的消费行为购买记录数据,因为这个数据集相对于评分或评论数据来说更加客观并且更加密集。通过建立LDA模型,分析得到用户在电子商务数据集中的购买主题偏好分布以及用户在POI数据集中的签到主题偏好分布。
将用户的数据存储在矩阵中,每一个用户的一行数据视作一篇文档采用模型来进行分析。
[0024] 2、增加时间维度,将用户一年内的历史购物记录数据和POI签到数据划分为四个时间段进行分析。考虑到用户当前临时的购买行为也可能受到多种因素的影响,并且用户的购买偏好是阶段性的,例如用户在在某个时间段内需要为结婚做准备,那么在这个时间段内,婚庆主题的用品会占据很大的购买比重。本发明将用户在一年内的购买记录分为四个季度,对用户在不同时间段内的偏好分别进行分析。
[0025] 3、基于用户的主题相似度学习用户的映射函数。考虑到传统的学习所有共同用户的分布会产生一定的数据冗余,并且会增加时间复杂度。本发明通过计算目标域冷启动用户在源域中的主题相似度来选择用来学习共同用户的函数,用户的主题相似度通过余弦相似度来衡量。最后得到夹的值越小,代表两个用户的主题向量越相似。
[0026] 4、基于跨域关联技术进行POI推荐。跨域推荐的实现是基于两个域之间存在一定的联系上实现的,考虑到用户在电子商务数据集中的偏好分布在一定程度上能够反映用户到达一个位置后可能发送的签到服务,基于这样的联系,本发明将用户在电子商务领域的偏好分布迁移到POI领域进行推荐。附图说明
[0027] 图1为一种基于跨域关联的兴趣点推荐方法的原理图。

具体实施方式

[0028] 为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实例,对本发明进一步详细说明。
[0029] 本发明利用电子商务领域数据与兴趣点(POI,Point-Of-Interest)领域数据之间的关联实现跨域推荐。本发明认为,用户在电子商务领域的数据集与用户的兴趣点签到是存在一定关联的,例如一个用户在电商网站中更偏好购买运动器材,那么他在到达一个位置后更可能发送与运动有关的兴趣点,如健身房等。在获得用户的源域和目标域的历史数据后,通过潜在狄利克雷分布(LDA,Latent Dirichlet Allocation)模型分别对用户的购买偏好和签到偏好进行分析,由于用户在不同域中的签到语义是不同的,电子商务领域的数据不能直接应用于POI领域进行推荐,因此本发明采用多层感知器(MLP,Multi-Layer Perception)的非线性映射方法,将电子商务领域分析得到的偏好分布映射到POI领域,从而实现利用辅助的电子商务数据分析用户偏好从而对用户进行POI领域的个性化推荐。
[0030] 一种基于跨域关联的兴趣点推荐方法,如图1所示,其具体包括如下步骤:
[0031] 步骤1、将用户在源域(即电子商务)和目标域(即兴趣点)中的数据分别存储到源域和目标域矩阵中,其中源域矩阵的内容是用户购买物品及其购买次数,目标域矩阵的内容是用户签到兴趣点及其签到次数。
[0032] 在本发明中,对于每个用户,可以将其所有时间段内的源域数据形成一个源域矩阵,目标域的数据形成一个目标域矩阵。但是考虑到用户的购买偏好是具有阶段性的,本发明优选实施例中,将用户在一年内的数据划分为四个季度(一季度1月至3月、二季度4月至6月、三季度7月至9月、四季度10月至12月),由此得到4个源域矩阵(第一季度源域矩阵、第二季度源域矩阵、第三季度源域矩阵和第四季度源域矩阵)和4个目标域矩阵(第一季度目标域矩阵、第二季度目标域矩阵、第三季度目标域矩阵和第四季度目标域矩阵)。
[0033] 另外,考虑到用户的签到特性受地理位置的影响,设定一个半径r,用户到达一个位置后,只统计以这个位置为圆心的半径为r的圆内的兴趣点签到次数。
[0034] 步骤2、对每个用户的源域矩阵和目标域矩阵分别采用LDA模型进行用户的购买偏好和签到偏好分布进行分析,得到每个用户的购买偏好分布 和签到偏好分布[0035] 每个用户ui的每一个购买偏好分布和每一个签到偏好分布分别可以通过一个K维的向量来进行表示,该向量内容是用户ui对主题Zi(即购买物品或签到地点)的偏好权重。其中偏好分布的维度K(即设定的购买物品的主题数量)和签到偏好分布的维度K(即设定的签到地点的主题数量)相同。
[0036] 在本发明优选实施例中,由于将用户的原始数据分为了四个时间段,因此需要对四个时间段中用户的数据分别使用LDA模型进行分析,每一个用户ui都可以得到四个时段的购买偏好分布 和四个时段的签到偏好分布
[0037] 步骤3、基于当前冷启动用户的购买偏好分布与源域中其他用户的购买偏好分布,计算当前冷启动用户与源域中其他用户之间的用户购买偏好相似度,并据此找到源域中与当前冷启动用户购买偏好相似的用户即共同用户,并将这些共同用户的购买偏好分布和签到偏好分布 形成训练集 i∈{1,2,...,N}后,输入MLP模型中进行训练,得到当前冷启动用户的MLP映射函数。
[0038] 当前冷启动用户与源域中其他用户之间的用户购买偏好相似度simu,u'用余弦相似度进行衡量,计算得到的夹角越小,代表越相似:
[0039] 其中
[0040] 其中, 是冷启动用户u'与源域中其他用户u之间的用户购买偏好相似度的集合,simu,u'是冷启动用户u'与源域中其他用户u之间的用户购买偏好相似度, 表示冷启动用户u'在源域中的某个时间段tk内够买物品下的词分布, 表示源域中其他用户u在源域中的某个时间段tk内够买物品下的词分布。
[0041] 在本发明优选实施例中,由于考虑加入了时间维度,因此所得到的MLP映射函数为四个不同时间段下的MLP映射函数。
[0042] 步骤4、以冷启动用户u'所在的某个兴趣点为中心,划定一个半径为r的圆的范围,将这个范围即兴趣点商业圈内所有用户签到过的历史记录存储到矩阵中,在目标域形成一个兴趣点历史签到矩阵。
[0043] 步骤5、将这个矩阵输入到LDA模型中,分析得到在当前兴趣点商业圈内所有用户的历史签到偏好分布。
[0044] 在本发明优选实施例中,由于加入了时间维度,因此兴趣点历史签到矩阵分为四个时间段进行分析,得到四个时间段下不同的历史签到偏好分布
[0045] 步骤6、将冷启动用户u'在源域中的购买偏好分布 输入到该冷启动用户的MLP映射函数中,得到与目标域偏好分布匹配的签到偏好分布
[0046] 步骤7、基于当前冷启动用户的匹配签到偏好分布和当前冷启动用户所在兴趣点商业圈的历史签到偏好分布,计算当前冷启动用户与兴趣点商业圈内兴趣点的匹配度[0047] 当前冷启动用户与兴趣点商业圈内内兴趣点的匹配度 用余弦相似度进行衡量,计算得到的夹角越小,代表越匹配:
[0048]
[0049] 其中, 代表当前冷启动用户u'与兴趣点商业圈内内兴趣点p的匹配度, 表示在匹配签到偏好分布中,冷启动用户u'在某个时间段tk内匹配签到偏好主题下的词分布; 表示在历史签到偏好分布中,冷启动用户u'所在的当前的兴趣点在某个时间段tk内所处兴趣点商业圈内历史签到偏好主题下的词分布;
[0050] 步骤8、得到用户购买偏好与兴趣点签到分布的相似度后,用以下公式预测冷启动用户u'对于未签到过的兴趣点的可能的打分:
[0051]
[0052] 本发明认为,一个人的兴趣可以分为长期的和阶段性的。因此如果一个人对于某一项兴趣只是在一段时间内产生,那么相对于一个长期的兴趣,这个阶段性的兴趣得分就会较低。
[0053] 为了获得更好的推荐效果,本发明将一个基本的评估函数和打分函数结合起来得到一个预测评分,以此来实现POI兴趣点的推荐:
[0054] S(u',p)=bP+ru',p
[0055] 其中,bP代表目标域中所有兴趣点的全局平均签到次数。
[0056] 至此,整个推荐过程就完成了。本发明着重解决POI推荐领域存在的数据稀疏问题和冷启动用户的问题。通过分析客观的电子商务数据集反应用户的购买偏好,映射到POI领域进行辅助推荐。能够很好的解决协同过滤技术中存在的不足。本发明考虑了用户在某一段时间内的兴趣迁移问题,能够更加充分地反应用户在不同季节时间段的购买偏好变化。
[0057] 需要说明的是,尽管以上本发明所述的实施例是说明性的,但这并非是对本发明的限制,因此本发明并不局限于上述具体实施方式中。在不脱离本发明原理的情况下,凡是本领域技术人员在本发明的启示下获得的其它实施方式,均视为在本发明的保护之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈