首页 / 专利库 / 广播 / 数字电视 / 互动电视 / 基于协同过滤的内容推荐系统与方法

基于协同过滤的内容推荐系统与方法

阅读:609发布:2020-05-16

专利汇可以提供基于协同过滤的内容推荐系统与方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于协同过滤的内容推荐系统及方法,该系统包括依次连接的数据预处理模 块 、 算法 混合模块、结果生成模块。其中,算法混合模块进一步包括算法选择单元、基于加权相似度的协作推荐算法单元、基于平衡评分预测机制的协作推荐算法单元、基于评分填充的混合推荐算法单元、利用评分时间特性的协作推荐算法单元。算法混合模块将预处理的数据分别输入基于加权相似度的协作推荐算法单元、基于平衡评分预测机制的协作推荐算法单元、基于评分填充的混合推荐算法单元、利用评分时间特性的协作推荐算法单元,算法选择单元选择最匹配的算法结果,并将算法结果输出至结果生成模块。本发明较好地解决了推荐系统中的稀疏性问题和概念漂移问题。,下面是基于协同过滤的内容推荐系统与方法专利的具体信息内容。

1.一种基于协同过滤的内容推荐系统,其特征在于,包括:
依次连接的数据预处理模算法混合模块、结果生成模块;
其中,算法混合模块进一步包括算法选择单元、基于加权相似度的协作推荐算法单元、基于平衡评分预测机制的协作推荐算法单元、基于评分填充的混合推荐算法单元、利用评分时间特性的协作推荐算法单元;
所述算法混合模块将预处理的数据分别输入基于加权相似度的协作推荐算法单元、基于平衡评分预测机制的协作推荐算法单元、基于评分填充的混合推荐算法单元、利用评分时间特性的协作推荐算法单元,所述算法选择单元选择最匹配的算法结果,并将所述算法结果输出至结果生成模块。
2.如权利要求1所述的基于协同过滤的内容推荐系统,其特征在于,所述基于加权相似度的协作推荐算法单元执行以下操作:
计算项目评分重合因子和基于项目的加权相似度;
选择邻居项目;
基于项目评分进行推荐预测。
3.如权利要求1所述的基于协同过滤的内容推荐系统,其特征在于,所述基于平衡评分预测机制的协作推荐算法单元执行以下操作:
计算基于项目的相似度;
统计项目评分的中位数和权重平衡参数;
选择邻居项目;
基于项目评分进行推荐预测。
4.如权利要求1所述的基于协同过滤的内容推荐系统,其特征在于,所述基于评分填充的混合推荐算法单元执行以下操作:
表示推荐项目内容;
基于内容用户模型进行学习;
计算基于内容的相似度;
基于CBF的评分预测与填充;
计算基于评分的相似度;
选择邻居项目;
基于项目评分进行推荐预测。
5.如权利要求1所述的基于协同过滤的内容推荐系统,其特征在于,所述利用评分时间特性的协作推荐算法单元执行以下操作:
计算项目评分排序和时间权重;
计算项目间基于时间的加权相似度;
选择邻居项目;
基于项目的加权评分进行推荐预测。
6.一种基于协同过滤的内容推荐方法,其特征在于,包括以下步骤:
数据预处理;
将预处理的数据分别进行基于加权相似度的协作推荐算法、基于平衡评分预测机制的协作推荐算法、基于评分填充的混合推荐算法、利用评分时间特性的协作推荐算法;
选择最匹配的算法结果,并将所述算法结果作为推荐内容。
7.如权利要求6所述的基于协同过滤的内容推荐方法,其特征在于,基于加权相似度的协作推荐算法包括以下步骤:
计算项目评分重合因子和基于项目的加权相似度;
选择邻居项目;
基于项目评分进行推荐预测。
8.如权利要求6所述的基于协同过滤的内容推荐方法,其特征在于,所述基于平衡评分预测机制的协作推荐算法包括以下步骤:
计算基于项目的相似度;
统计项目评分的中位数和权重平衡参数;
选择邻居项目;
基于项目评分进行推荐预测。
9.如权利要求6所述的基于协同过滤的内容推荐方法,其特征在于,所述基于评分填充的混合推荐算法包括以下步骤:
表示推荐项目内容;
基于内容用户模型进行学习;
计算基于内容的相似度;
基于CBF的评分预测与填充;
计算基于评分的相似度;
选择邻居项目;
基于项目评分进行推荐预测。
10.如权利要求6所述的基于协同过滤的内容推荐方法,其特征在于,所述利用评分时间特性的协作推荐算法包括以下步骤:
计算项目评分排序和时间权重;
计算项目间基于时间的加权相似度;
选择邻居项目;
基于项目的加权评分进行推荐预测。

说明书全文

基于协同过滤的内容推荐系统与方法

技术领域

[0001] 本发明涉及推荐算法及其系统,更具体地说,涉及一种基于协同过滤的内容推荐系统与方法。

背景技术

[0002] 随着互联网技术的流行,人们的生活越来越离不开网络,越来越多的人选择在网络上进行娱乐或购物。面对日益扩大的用户需求,以及越来越丰富的资源,如何能够充分理解用户的需求,快捷地为用户找到自己需要的资源,成为吸引用户的一个有手段。基于此需求,个性化推荐技术渐渐受到重视,如今已经进入一个成熟发展的阶段。
[0003] 个性化推荐技术,是用户行为分析技术的一个重要方面,简单的说,它就是一个为用户找到他可能感兴趣的资源的过程。为了实现个性化的资源推荐,必须“懂”用户、“懂”资源。通过对用户资料及大量历史行为的分析,从中得出用户的兴趣知识,然后以一种合理的方式来表示用户兴趣。同时对资源进行组织,选取合理表达方式来表达资源特征。然后采用恰当的推荐算法,匹配用户兴趣与资源特征,完成推荐。
[0004] 基于内容的信息推荐方法的理论依据主要来自于信息检索和信息过滤,所谓的基于内容的推荐方法就是根据用户过去的浏览记录来向用户推荐用户没有接触过的推荐项。主要是从两个方法来描述基于内容的推荐方法:启发式的方法和基于模型的方法。启发式的方法就是用户凭借经验来定义相关的计算公式,然后再根据公式的计算结果和实际的结果进行验证,然后再不断修改公式以达到最终目的。而对于模型的方法就是根据以往的数据作为数据集,然后根据这个数据集来学习出一个模型。
[0005] 一般的推荐系统中运用到的启发式的方法就是使用tf-idf的方法来计算,跟还有tf-idf的方法计算出这个文档中出现权重比较高的关键字作为描述用户特征,并使用这些关键字作为描述用户特征的向量;然后再根据被推荐项中的权重高的关键字来作为推荐项的属性特征,然后再将这个两个向量最相近的(与用户特征的向量计算得分最高)的项推荐给用户。在计算用户特征向量和被推荐项的特征向量的相似性时,一般使用的是cosine方法,计算两个向量之间夹的cosine值。
[0006] 然而,推荐系统在发展和应用的过程中,受到了各种问题不同程度的影响,特别是稀疏性问题和概念漂移问题已成为影响推荐质量的最主要问题。

发明内容

[0007] 针对现有技术中存在的稀疏性问题和概念漂移问题,本发明的目的是提供一种基于协同过滤的内容推荐系统与方法。
[0008] 为实现上述目的,本发明采用如下技术方案:
[0009] 一种基于协同过滤的内容推荐系统,包括依次连接的数据预处理模、算法混合模块、结果生成模块。其中,算法混合模块进一步包括算法选择单元、基于加权相似度的协作推荐算法单元、基于平衡评分预测机制的协作推荐算法单元、基于评分填充的混合推荐算法单元、利用评分时间特性的协作推荐算法单元。算法混合模块将预处理的数据分别输入基于加权相似度的协作推荐算法单元、基于平衡评分预测机制的协作推荐算法单元、基于评分填充的混合推荐算法单元、利用评分时间特性的协作推荐算法单元,算法选择单元选择最匹配的算法结果,并将算法结果输出至结果生成模块。
[0010] 根据本发明的一实施例,基于加权相似度的协作推荐算法单元执行以下操作:计算项目评分重合因子和基于项目的加权相似度;选择邻居项目;基于项目评分进行推荐预测。
[0011] 根据本发明的一实施例,基于平衡评分预测机制的协作推荐算法单元执行以下操作:计算基于项目的相似度;统计项目评分的中位数和权重平衡参数;选择邻居项目;基于项目评分进行推荐预测。
[0012] 根据本发明的一实施例,基于评分填充的混合推荐算法单元执行以下操作:表示推荐项目内容;基于内容用户模型进行学习;计算基于内容的相似度;基于CBF的评分预测与填充;计算基于评分的相似度;选择邻居项目;基于项目评分进行推荐预测。
[0013] 根据本发明的一实施例,利用评分时间特性的协作推荐算法单元执行以下操作:计算项目评分排序和时间权重;计算项目间基于时间的加权相似度;选择邻居项目;基于项目的加权评分进行推荐预测。
[0014] 为实现上述目的,本发明采用如下技术方案:
[0015] 一种基于协同过滤的内容推荐方法,包括以下步骤:数据预处理;将预处理的数据分别进行基于加权相似度的协作推荐算法、基于平衡评分预测机制的协作推荐算法、基于评分填充的混合推荐算法、利用评分时间特性的协作推荐算法;选择最匹配的算法结果,并将算法结果作为推荐内容。
[0016] 根据本发明的一实施例,基于加权相似度的协作推荐算法包括以下步骤:计算项目评分重合因子和基于项目的加权相似度;选择邻居项目;基于项目评分进行推荐预测。
[0017] 根据本发明的一实施例,基于平衡评分预测机制的协作推荐算法包括以下步骤:计算基于项目的相似度;统计项目评分的中位数和权重平衡参数;选择邻居项目;基于项目评分进行推荐预测。
[0018] 根据本发明的一实施例,基于评分填充的混合推荐算法包括以下步骤:表示推荐项目内容;基于内容用户模型进行学习;计算基于内容的相似度;基于CBF的评分预测与填充;计算基于评分的相似度;选择邻居项目;基于项目评分进行推荐预测。
[0019] 根据本发明的一实施例,利用评分时间特性的协作推荐算法包括以下步骤:计算项目评分排序和时间权重;计算项目间基于时间的加权相似度;选择邻居项目;基于项目的加权评分进行推荐预测。
[0020] 在上述技术方案中,本发明的基于协同过滤的内容推荐系统与方法较好地解决了推荐系统中的稀疏性问题和概念漂移问题,使得结果与实际情况的匹配度更高。附图说明
[0021] 图1是本发明基于协同过滤的内容推荐系统的结构示意图;
[0022] 图2是评分时间权重衰减曲线示意图。

具体实施方式

[0023] 下面结合附图和实施例进一步说明本发明的技术方案。
[0024] 参照图1,本发明公开一种基于协同过滤的内容推荐系统及其对应的方法。如图1所示,本发明的系统包括依次连接的数据预处理模块1、算法混合模块2、结果生成模块
3,并且算法混合模块2进一步包括算法选择单元21、基于加权相似度的协作推荐算法单元22、基于平衡评分预测机制的协作推荐算法单元23、基于评分填充的混合推荐算法单元
24、利用评分时间特性的协作推荐算法单元25。
[0025] 根据图1所示的结构,算法混合模块2将预处理的数据分别输入基于加权相似度的协作推荐算法单元22、基于平衡评分预测机制的协作推荐算法单元23、基于评分填充的混合推荐算法单元24、利用评分时间特性的协作推荐算法单元25,而算法选择单元21选择最匹配的算法结果,并将算法结果输出至结果生成模块3。
[0026] 下面来进一步详细说明上述各个单元所执行的算法。
[0027] 1.基于加权相似度的协作推荐算法单元22:
[0028] 本发明针对稀疏性问题,通过对推荐的各执行过程的相似性计算进行必要修正克服和缓解稀疏性问题的影响,提出了基于加权相似度的协作推荐算法,引用了适应不同项目评分数量分布的重合因子(Overlap Factor),并通过重合因子实现对传统相似度计算的修正和改进。
[0029] 重合因子从数量上度量了项目间公共评分在项目全局评分中所占比重,刻划了项目间公共评分的重合程度,强调了公共评分重合度在相似性度量中的重要性,通过将其作用于基于项目的相似度,可以从评分重合的角度区分相似度计算结果的可信度,即评分重合程度越高,则计算得到的相似度就越能反映项目间的真实相关性,反之,相似度计算的可信度则越低。对于参加项目间相似度计算的任意两项目ti和tj,已分别对两项目进行过评分的用户集合为Ui={uc|uc∈U∧rci≠0}和Uj={u|uc∈U∧rcj≠0},则评分重合因子可形式化为
[0030] 式2-1
[0031] 不同于显著性权重只与公共评分的绝对数量相关,通过公式2-1计算获得的重合因子不仅正比于两项目的公共评分数量,还反比于两项目各自的用户评分数量,保证评分重合因子可以适应不同项目的评分数量分布。通过使用重合因子可对传统相似度进行修正,形成对应的加权夹角余弦相似度(Weighted COsine SIMilarity,WCOSIM)和加权皮尔逊相关系数(Weighted Pearson Correlation Coefficient,WPCC),二者形式上可表示为传统相似度与重合因子的乘积,如公式所示。
[0032]
[0033] 式2-2
[0034]
[0035] 式2-3
[0036] 需要注意,本发明提出的重合因子都是全局相似度修正方案,是对CF中的所有项目间相似度进行的整体调整,而非局部独立相似度的修正,这种全局修正相似度只在整体使用时有意义。在此基础之上,通过将上述加权相似度集成到传统IBCF推荐过程中,本发明提出了基于加权相似度的协作推荐算法WSBCF(Weighted Similarity-Boosted Collaborative Filtering),WSBCF算法的执行过程可分为以下3步:
[0037] (1)项目评分重合因子和基于项目的加权相似度计算
[0038] 根据评分矩阵按照公式2-1计算任意项目ti和tj之间的重合因子,并通过公式计算任意项目间的加权相似度。
[0039] (2)邻居项目选择
[0040] 针对目标用户uc的任意未访问项目 根据步骤(1)获得的项目间加权相似度,对用户uc的已访问项目进行降序排序,并根据相对邻居选择阈值参数θ,选择top-θ部分项目作为项目ti的邻居集合Tci。
[0041] (3)基于项目的评分预测
[0042] 针对目标用户uc的任意未访问项目 根据目标用户uc的已有评分、项目ti的邻居项目集合Tci及相似度sim,采用如下公式对项目ti进行评分预测[0043] 式2-4
[0044] WSBCF算法在评分预测过程中,采用了传统加权评分聚合方法,根据目标用户的已有评分和目标项目的邻居,以邻居与目标项目的相似度为权重,通过加权求和实现对目标2
项目的评分预测。WSBCF的总时间复杂度为O(mn)+O(mn)+O(n),这对传统IBCF的时间复
2
杂度O(mn)的影响有限。
[0045] 2.基于平衡评分预测机制的协作推荐算法单元23:
[0046] 为了从评分预测角度减少稀疏性问题对IBCF推荐算法的影响,可在个性化评分与全局评分之间建立一种动态平衡。本发明建立了一种结合个性化评分与全局评分的动态平衡评分预测机制,并提出了一种基于平衡评分预测机制的协作推荐算法。
[0047] 为使两类评分在基于项目的评分预测中都能发挥各自的作用,本发明提出的动态平衡评分预测机制是一种关于两类评分的线性组合。同时,为了保持两类评分的动态平衡,可通过权重的变化来动态调整二者所发挥的作用,而将全局评分数据的分布特性作为权重动态调整的主要依据。针对推荐系统的任意用户uc及其未访问项目ti,集成两类评分的动态平衡评分预测可形式化为
[0048] 式2-5
[0049] 其中, 表示针对目标项目ti基于项目的个性化评分,该个性化评分采用了公式2-12所描述的IBCF评分预测方法,gi为目标项目的全局评分,而αi为个性化评分与全局评分之间的权重平衡参数。
[0050] 针对稀疏性问题对评分预测过程的影响,结合上述动态平衡评分预测机制,通过对传统IBCF评分预测过程进行必要的修正,形成一种基于平衡评分预测机制的协作 推 荐 算 法 IBCFBP(Item-Based Collaborative Filtering integrating Balanced Prediction),该算法的执行过程主要包括以下4步:
[0051] (1)基于项目的相似度计算
[0052] 基于已有评分数据,通过基于项目的相似度计算方法度量项目之间的相似度,对于任意项目ti和tj,基于项目的COSIM相似度可表示为
[0053]
[0054] 式2-6
[0055] 或者采用基于项目的PCC相似度,可表示为
[0056]
[0057] 式2-7
[0058] (2)统计项目评分中位数和权重平衡参数
[0059] 根据任意项目ti已获得的评分数据,统计该项目的全局评分中位数gi,并采用公式2-5、2-6或者2-7之一统计该项目全局评分数据的分散性,以表示平衡评分预测机制的权重平衡参数αi。
[0060] (3)邻居项目选择
[0061] 针对目标用户uc的任意未访问项目ti,根据该用户对已访问项目的评分,结合步骤(1)计算获得的项目间相似度,对用户uc的已访问项目进行降序排序,并选择top-θ部分项目作为项目ti的邻居项目集合Tci。
[0062] (4)基于项目的评分预测
[0063] 针对用户uc的任意未访问项目ti,根据该用户的已有评分、项目ti的邻居项目集合Tci以及相关相似度,采用公式对项目ti进行平衡评分预测。
[0064] IBCFBP的总时间复杂度为O(n)+O(mn2)+O(n),与传统协作推荐算法的时间复杂度2
O(mn)相当,而且项目中位数和权重平衡参数的计算均可离线完成,所以二者对推荐的计算效率影响基本可以忽略。
[0065] 3.基于评分填充的混合推荐算法单元24:
[0066] 本发明提出了一种基于评分填充的混合推荐算法HRRF(Hybrid Recommendation based on Rating Filling),该算法可根据用户已访问项目的信息内容实现自动化用户建模,并将基于内容的用户模型用于实现对用户未访问项目的个性化评分填充,提高了评分矩阵的整体密度,进而基于经填充处理的评分矩阵,采用IBCF推荐框架实现评分的预测,HRRF从评分填充的角度,减少了稀疏性问题通过评分矩阵对CF相似度计算和评分预测过程的影响。
[0067] 基于内容的用户模型是HRRF实现评分填充的依据,HRRF基于内容的用户模型在本质上起到了Filterbot的作用,但不同于Filterbot人工构造的方式,HRRF的用户模型是通过机器学习自动构造的。将用户模型的构造理解为一种基于机器学习的文本分类任务,根据已访问项目的内容信息,通过一定的机器学习算法可以自动训练针对不同用户的分类模型,并将该模型作为相应的用户描述,HRRF采用了Rocchio学习算法来实现基于内容的用户建模,也可以根据实际推荐环境选择其他机器学习算法来训练用户模型。
[0068] HRRF混合推荐算法的整体执行过程可以描述为以下7个步骤:
[0069] (1)推荐项目内容表示
[0070] 因为HRRF的用户模型是建立在推荐对象的内容基础上的,所以首先需要对信息对象的内容进行表示,HRRF采用了传统的VSM模型表示推荐对象的内容,设推荐系统包含由n个推荐项目构成的项目集合T={ts|1≤s≤n},用于描述项目内容的特征空间为X={x1,x2,...,xd},推荐对象ti的特征向量为 其中特征分量表示特征xj对于项目ti的权重。设 表示特征xj在项目ti内容中出现的词频,而dfj表示包含特征xj的项目个数,则特征权重 可表示为
[0071] 式2-8
[0072] (2)基于内容用户模型的学习
[0073] HRRF的用户模型使用了与推荐项目相同的特征空间X={x1,x2,...,xd},设推荐系统的用户集合U={uc|1≤c≤m},用户ui基于内容的用户模型表示为根据用户已有正例评分项目集合T+和负例评分项目集合T-,评分分类的阈值选择该目标用户的评分均值,根据Rocchio学习算法训练用户模型的特征权重可表示为
[0074]
[0075] 式2-9
[0076] 由于Rocchio学习算法是一种批学习算法(Batch Learning),所以用户模型必须进行周期性更新,但模型的更新可以离线完成,不会对推荐系统的在线计算性能造太大影响。
[0077] (3)基于内容的相似度计算
[0078] 根据步骤(2)所获得的基于内容的用户模型,针对推荐系统中的任意用户ui,通过传统基于内容的相似度计算方法度量该用户与其任意未评分项目tj在内容上的相似度,例如,可以采用公式2-10的COSIM相似度计算形式。
[0079] 式2-10
[0080] (4)基于CBF的评分预测与填充
[0081] 为了提高评分矩阵的整体密度,根据步骤(3)获得的用户模型与未评分项目间的相似度,采用传统CBF对用户的未访问项目进行评分预测,并使用预测评分填充相应的评分矩阵位置,形成用户-项目评分全矩阵。在评分值域范围为[min,max]的推荐系统中,对于用户ui以及其任意未访问项目tj,则预测评分值为
[0082] r′ij=min+s(i,j)|max-min| 式2-11
[0083] (5)基于评分的相似度计算
[0084] 通过步骤(1)-(4)的处理,原始稀疏用户评分矩阵已得到了填充处理,后续步骤将采用IBCF算法实现推荐,对于任意项目ti和tj,二者间基于项目的COSIM相似度为[0085] 式2-12
[0086] 注意,需要根据用户是否已访问过项目ti,决定选择基于内容的填充评分值r′ci或原始评分值rci来表示公式2-12中的评分r″ ci,即
[0087] 式2-13
[0088] (6)邻居项目选择
[0089] 针对目标项目ti,根据步骤(5)获得的项目间相似度,对所有其他项目进行降序排序,并选择最相似的k个项目构成项目ti的邻居集合Ti。
[0090] (7)基于项目的评分预测
[0091] 针对目标用户ui的任意未访问项目tj,通过IBCF方法进行该项目的评分预测。鉴于通过CBF生成的填充评分在可信度上要低于真实评分,在评分预测过程中,通过适当缩小相似度来降低评分填充值在评分预测中的作用,评分预测的计算可表示为[0092]
[0093]
[0094] 式2-14
[0095] TIBCF算法只在相似度计算和评分预测过程中引入了时间权重,从计算量上来看,时间权重的加入对推荐的整体计算复杂度影响有限。
[0096] 4.利用评分时间特性的协作推荐算法单元25:
[0097] 目前的推荐算法没有建立感知用户兴趣变化的动态机制,所形成的用户兴趣模型是一种静态模型,随着概念漂移的发生,推荐系统的推荐质量将表现的不稳定,特别是用户兴趣发生突变时,推荐的准确性将急剧恶化。因此,发明针对时漂移问题,发明提出了一种利用评分时间特性的协作推荐算法TIBCF(Temporal Item-Based Collaborative Filtering,TIBCF)。
[0098] 本发明提出的TIBCF算法在克服概念漂移的过程中,需要根据评分的生成时间对评分的重要性进行区分。因此,TIBCF算法对传统评分矩阵进行了必要的完善,除记录评分数值外,还记录了评分的产生时间信息,TIBCF算法中的用户-项目评分矩阵可表示为:
[0099] R(m×n)={<rij,dij> |(ui∈U)∧(tj∈T)∧(0≤r ij≤q)∧(dij=NULL∨dij∈DateTime)}
[0100] 用户ui针对项目tj的评分信息在评分矩阵R(m×n)表示为二元组<rij,dij>,rij和dij分别对应评分值和评分时间。为了在相似度计算和评分预测中从时间角度区分评分的重要性,TIBCF算法引入了时间权重的概念,为不同时间产生的评分赋予相应的时间权重。针对用户ui在时间dij对项目tj所产生的评分rij,TIBCF根据公式的指数衰减函数形式计算该评分的时间权重w(i,j)。
[0101] 式2-15
[0102] 其中,Ri为用户ui的历史评分有序集合,RK函数表示评分rij在Ri中的位置编号。结合文献中AWS的方法,TIBCF设置评分权重的半衰期(Half-Life Span)为λ/log(|Ri|),其既与用户的评分数量相关,又与衰减参数λ相关。通过衰减参数λ可以调整半衰期的长度,λ的选择与具体应用的评分分布有关,可以通过实验获得,也可依据推荐系统准确性的变化而动态调整。对于具有500个评分的用户,图2展示了λ=300和λ=500时评分权重衰减曲线的示例。
[0103] 在根据公式计算获得用不同评分的时间权重后,TIBCF在传统IBCF算法的相似度计算和评分预测中都集成了该权重,从而分别实现相应基于时间的加权相似度计算和加权评分预测,通过对IBCF两个关键过程进行基于时间的修正,可以最大限度地减少概念漂移问题对推荐的影响。TIBCF推荐算法的执行过程可以分为以下4个步骤:
[0104] (1)项目评分排序和时间权重计算
[0105] 针对任意用户 按照该用户已有评分的产生时间由近至远,对其所有历史评分进行按时间的排序生成历史评分有序集合Ri,计算用户ui的任意历史评分rij的时间权重w(i,j)。
[0106] (2)项目间基于时间的加权相似度计算
[0107] 通过步骤(1)获得所有评分的时间权重后,对系统中的任意两项目ti和tj,按照公式2-15或2-16计算二者间基于时间的加权皮尔逊相关系数(Temporal Pearson Correlation Coefficient,TPCC)或基于时间的加权夹角余弦相似度(Temporal COsine SIMilarity,TCOSIM)。
[0108] 式2-16
[0109]
[0110] 式2-17
[0111] (3)邻居项目选择
[0112] 针对目标用户uc的任意未访问项目ti,根据步骤(2)获得的项目间相似度,对用户uc的所有已访问项目进行降序排序,并选择top-θ部分项目作为项目ti的邻居项目集合Tci。
[0113] (4)基于项目的加权评分预测
[0114] 针对目标用户uc的任意未访问项目ti,根据用户uc的已有评分、ti的邻居项目集合Tci、评分时间权重w及相应加权相似度sim,通过如下公式对项目ti进行评分预测[0115] 式2-18
[0116] TIBCF算法只在相似度计算和评分预测过程中引入了时间权重,从计算量上来看,2
时间权重的加入对推荐的整体计算复杂度影响有限,仍可以保持与传统IBCF算法O(mn)相当的计算时间复杂度平。
[0117] 本技术领域中的普通技术人员应当认识到,以上的实施例仅是用来说明本发明,而并非用作为对本发明的限定,只要在本发明的实质精神范围内,对以上所述实施例的变化、变型都将落在本发明的权利要求书范围内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈