首页 / 专利库 / 专利权 / 第I章 / 文章推荐方法及其装置

文章推荐方法及其装置

阅读:372发布:2020-05-19

专利汇可以提供文章推荐方法及其装置专利检索,专利查询,专利分析的服务。并且本 发明 提出一种文章推荐方法及其装置,其中,方法包括:获取文章的用户行为数据和 属性信息 ;根据属性信息和文章的用户行为数据,获取每个用户的重要性权重;根据文章的用户行为数据和每个用户的重要性权重,获取每个文章的重要性权重;根据文章的重要性权重,从所有文章中获取推荐文章并向用户推送推荐文章。该方法通过根据文章的用户行为数据,即用户之间的互动信息,获取能够反映用户知识 水 平的用户重要性权重,再根据用户之间的互动信息和用户重要性权重,获得文章的重要性权重,根据文章的重要程度推荐文章,避免了人为干预,减少了人工成本,保证了文章的 质量 和文章的多样化。,下面是文章推荐方法及其装置专利的具体信息内容。

1.一种文章推荐方法,其特征在于,包括:
获取文章的用户行为数据和属性信息
根据所述属性信息和所述文章的用户行为数据,获取每个用户的重要性权重;
根据所述文章的用户行为数据和每个用户的重要性权重,获取每个文章的重要性权重;
根据所述文章的重要性权重,从所有文章中获取推荐文章并向用户推送所述推荐文章。
2.根据权利要求1所述的方法,其特征在于,所述根据所述属性信息和所述文章的用户行为数据,获取每个用户的重要性权重,包括:
根据所述属性信息从所有文章中,确定出每个用户所发表的文章;
根据每个用户所发表的文章的用户行为数据,获取两两用户之间的第一影响权重;
基于两两用户之间的所述第一影响权重迭代计算出每个用户的重要性权重。
3.根据权利要求2所述的方法,其特征在于,所述根据每个用户所发表的文章的用户行为数据,获取两两用户之间的第一影响权重,包括:
从第j个用户所发表的文章对应的用户行为数据中,获取第i个用户对应的用户行为数据;其中,1≤i,j≤N,i,j以及N为正整数;
根据第i个用户的用户行为数据,获取第i个用户对第j个用户的第一影响权重;
所述基于两两用户之间的所述第一影响权重迭代计算出每个用户的重要性权重,包括:
将第i个用户对每个用户的所述第一影响权重进行求和,得到第一影响总权重;
获取第i个用户对第j个用户的所述第一影响权重与所述第一影响总权重的比值,将所述比值作为两两用户之间的第二影响权重;
根据获取到的所有两两用户之间的第二影响权重,构成一个权重矩阵;其中,所述权重矩阵中的第i行表示第i个用户与每个用户之间的第二影响权重;
从预设的初始重要性权重向量开始,对每次获取到的权重矩阵进行迭代计算,直到重要性权重向量收敛;
根据收敛后的所述重要性权重向量确定每个用户的重要性权重;其中,所述重要性权重向量中一维向量元素代表一个用户的重要性权重。
4.根据权利要求3所述的方法,其特征在于,所述从第j个用户所发表的文章对应的用户行为数据中,获取第i个用户对应的用户行为数据,包括:
针对第j个用户所发表的文章对应的每个用户行为数据,提取每个用户行为数据对应的身份信息,根据所述身份信息确定出每个用户行为数据所隶属的用户,统计获取属于第i个用户的用户行为数据;
所述根据第i个用户的用户行为数据,获取第i个用户对第j个用户的第一影响权重,包括:
将第i个用户的用户行为数据中每个类型的行为数据与各自的权重进行相乘;
根据相乘后的结果,获取第i个用户对第j个用户的所述第一影响权重。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述根据所述文章的用户行为数据和每个用户的重要性权重,获取每个文章的重要性权重,包括:
针对每个文章,从所述文章的用户行为数据中,提取出每个用户的用户行为数据;
根据每个用户的用户行为数据以及各自的重要性权重,获取每个用户对所述文章的评论数据;
根据每个用户对所述文章的评论数据,得到所述文章的重要性权重。
6.根据权利要求5所述的方法,其特征在于,所述根据每个用户的用户行为数据以及各自的重要性权重,获取每个用户对所述文章的评论数据,包括:
针对每个用户,将所述用户的用户行为数据中每个类型的行为数据与各自的权重进行相乘;
根据相乘后的结果得到所述用户对所述文章的影响数据;
将所述影响数据与所述用户的重要性权重相乘,得到所述文章的评论数据。
7.一种文章推荐装置,其特征在于,包括:
第一获取模,用于获取文章的用户行为数据和属性信息;
第二获取模块,用于根据所述属性信息和所述文章的用户行为数据,获取每个用户的重要性权重;
第三获取模块,用于根据所述文章的用户行为数据和每个用户的重要性权重,获取每个文章的重要性权重;
推送模块,用于根据所述文章的重要性权重,从所有文章中获取推荐文章并向用户推送所述推荐文章。
8.一种计算机设备,其特征在于,包括处理器和存储器
其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如权利要求1-6中任一所述的文章推荐方法。
9.一种计算机程序产品,当所述计算机程序产品中的指令由处理器执行时,执行如权利要求1-6中任一项所述的文章推荐方法。
10.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-6中任一项所述的文章推荐方法。

说明书全文

文章推荐方法及其装置

技术领域

[0001] 本发明涉及信息处理领域,尤其涉及一种文章推荐方法及其装置。

背景技术

[0002] 目前,人们交流知识的方式多种多样,如现场交流方式,或者在知识社区进行互动交流。知识社区的主要功能在于知识分享,由知识拥有者向知识需求者传播,而知识拥有者和知识需求者本身色又存在交叉,拥有知识的人同时也是需求知识的人,需求知识的人同时也可能是拥有知识的人。
[0003] 随着IT技术的快速发展,知识社区更多的以互联网的方式展现,使用IT技术搭建知识社区网站,相关人员注册网站并共同使用该社区。知识拥有者可以通过发表文章传播知识。知识社区中的知识浩如海洋,可通过推荐文章的方式方便用户获取知识。现有技术中,主要通过两种方式推荐文章。一是,根据用户的喜好、用户关注的内容和用户经常点击查看的知识内容匹配更多的相关文章,不断的推荐给用户进行知识学习。二是,由专业人士梳理和推荐价值高的文章。
[0004] 第一种方式,可以推荐用户喜爱看的文章,但是对用户的推荐比较单一,导致用户的知识获取面狭窄,由于用户关注的知识相关文章数量有限,文章质量也无法保证,并且在用户平时很少关注的领域,即使有非常好的知识文章分享,用户可能也无法获得,对用户的知识面扩展非常不利。第二种方式,由专业人士推荐文章,可以保证文章的质量,但是由专业人士梳理文章,人工成本高,并且专业人士的平不均,无法保证每个专业人士都能给出最好的推荐,会使推荐文章的质量不稳定。
[0005] 可见,现有的推荐文章的方式,存在推荐的文章比较单一、不利于用户知识面的扩展、人工成本高、文章质量不稳定等问题。

发明内容

[0006] 本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
[0007] 为此,本发明的第一个目的在于提出一种文章推荐方法,通过根据用户之间的互动信息获取文章的重要性权重,根据文章重要性权重推荐文章,避免人为干预,减少了人工成本,保证了文章的质量和文章的多样化。
[0008] 本发明的第二个目的在于提出一种文章推荐装置。
[0009] 本发明的第三个目的在于提出一种计算机设备。
[0010] 本发明的第四个目的在于提出一种计算机程序产品。
[0011] 本发明的第五个目的在于提出一种非临时性计算机可读存储介质。
[0012] 为达上述目的,本发明第一方面实施例提出了一种文章推荐方法,包括:
[0013] 获取文章的用户行为数据和属性信息
[0014] 根据所述属性信息和所述文章的用户行为数据,获取每个用户的重要性权重;
[0015] 根据所述文章的用户行为数据和每个用户的重要性权重,获取每个文章的重要性权重;
[0016] 根据所述文章的重要性权重,从所有文章中获取推荐文章并向用户推送所述推荐文章。
[0017] 作为本发明第一方面实施例提供的一种可能的实现方式,所述根据所述属性信息和所述文章的用户行为数据,获取每个用户的重要性权重,包括:
[0018] 根据所述属性信息从所有文章中,确定出每个用户所发表的文章;
[0019] 根据每个用户所发表的文章的用户行为数据,获取两两用户之间的第一影响权重;
[0020] 基于两两用户之间的所述第一影响权重迭代计算出每个用户的重要性权重。
[0021] 作为本发明第一方面实施例提供的一种可能的实现方式,所述根据每个用户所发表的文章的用户行为数据,获取两两用户之间的第一影响权重,包括:
[0022] 从第j个用户所发表的文章对应的用户行为数据中,获取第i个用户对应的用户行为数据;其中,1≤i,j≤N,i,j以及N为正整数;
[0023] 根据第i个用户的用户行为数据,获取第i个用户对第j个用户的第一影响权重;
[0024] 所述基于两两用户之间的所述第一影响权重迭代计算出每个用户的重要性权重,包括:
[0025] 将第i个用户对每个用户的所述第一影响权重进行求和,得到第一影响总权重;
[0026] 获取第i个用户对第j个用户的所述第一影响权重与所述第一影响总权重的比值,将所述比值作为两两用户之间的第二影响权重;
[0027] 根据获取到的所有两两用户之间的第二影响权重,构成一个权重矩阵;其中,所述权重矩阵中的第i行表示第i个用户与每个用户之间的第二影响权重;
[0028] 从预设的初始重要性权重向量开始,对每次获取到的权重矩阵进行迭代计算,直到重要性权重向量收敛;
[0029] 根据收敛后的所述重要性权重向量确定每个用户的重要性权重;其中,所述重要性权重向量中一维向量元素代表一个用户的重要性权重。
[0030] 作为本发明第一方面实施例提供的一种可能的实现方式,所述从第j个用户所发表的文章对应的用户行为数据中,获取第i个用户对应的用户行为数据,包括:
[0031] 针对第j个用户所发表的文章对应的每个用户行为数据,提取每个用户行为数据对应的身份信息,根据所述身份信息确定出每个用户行为数据所隶属的用户,统计获取属于第i个用户的用户行为数据;
[0032] 所述根据第i个用户的用户行为数据,获取第i个用户对第j个用户的第一影响权重,包括:
[0033] 将第i个用户的用户行为数据中每个类型的行为数据与各自的权重进行相乘;
[0034] 根据相乘后的结果,获取第i个用户对第j个用户的所述第一影响权重。
[0035] 作为本发明第一方面实施例提供的一种可能的实现方式,所述根据所述文章的用户行为数据和每个用户的重要性权重,获取每个文章的重要性权重,包括:
[0036] 针对每个文章,从所述文章的用户行为数据中,提取出每个用户的用户行为数据;
[0037] 根据每个用户的用户行为数据以及各自的重要性权重,获取每个用户对所述文章的评论数据;
[0038] 根据每个用户对所述文章的评论数据,得到所述文章的重要性权重。
[0039] 作为本发明第一方面实施例提供的一种可能的实现,所述根据每个用户的用户行为数据以及各自的重要性权重,获取每个用户对所述文章的评论数据,包括:
[0040] 针对每个用户,将所述用户的用户行为数据中每个类型的行为数据与各自的权重进行相乘;
[0041] 根据相乘后的结果得到所述用户对所述文章的影响数据;
[0042] 将所述影响数据与所述用户的重要性权重相乘,得到所述文章的评论数据。
[0043] 本发明实施例的文章推荐方法,通过获取文章的用户行为数据和属性信息,根据属性信息和文章的用户行为数据,获取每个用户的重要性权重,根据文章的用户行为数据和每个用户的重要性权重,获取每个文章的重要性权重,根据文章的重要性权重,从所有文章中获取推荐文章并向用户推送推荐文章。本实施例中,通过根据文章的用户行为数据,即用户之间的互动信息,获取能够反映用户知识水平的用户重要性权重,再根据用户之间的互动信息和用户重要性权重,获得文章的重要性权重,根据文章的重要程度推荐文章,避免了人为干预,减少了人工成本,保证了文章的质量和文章的多样化,解决了现有的推荐文章的方法,存在推荐的文章比较单一、不利于用户知识面的扩展、人工成本高、文章质量不稳定等问题。
[0044] 为达上述目的,本发明第二方面实施例提出了一种文章推荐装置,包括:
[0045] 第一获取模,用于获取文章的用户行为数据和属性信息;
[0046] 第二获取模块,用于根据所述属性信息和所述文章的用户行为数据,获取每个用户的重要性权重;
[0047] 第三获取模块,用于根据所述文章的用户行为数据和每个用户的重要性权重,获取每个文章的重要性权重;
[0048] 推送模块,用于根据所述文章的重要性权重,从所有文章中获取推荐文章并向用户推送所述推荐文章。
[0049] 作为本发明第二方面实施例提供的一种可能的实现方式,所述第二获取模块,包括:
[0050] 确定单元,根据所述属性信息从所有文章中,确定出每个用户所发表的文章;
[0051] 第一获取单元,根据每个用户所发表的文章的用户行为数据,获取两两用户之间的第一影响权重;
[0052] 计算单元,基于两两用户之间的所述第一影响权重迭代计算出每个用户的重要性权重。
[0053] 作为本发明第二方面实施例提供的一种可能的实现方式,所述第一获取单元,还用于:
[0054] 从第j个用户所发表的文章对应的用户行为数据中,获取第i个用户对应的用户行为数据;其中,1≤i,j≤N,i,j以及N为正整数;
[0055] 根据第i个用户的用户行为数据,获取第i个用户对第j个用户的第一影响权重;
[0056] 计算单元,还用于:
[0057] 将第i个用户对每个用户的所述第一影响权重进行求和,得到第一影响总权重;
[0058] 获取第i个用户对第j个用户的所述第一影响权重与所述第一影响总权重的比值,将所述比值作为两两用户之间的第二影响权重;
[0059] 根据获取到的所有两两用户之间的第二影响权重,构成一个权重矩阵;其中,所述权重矩阵中的第i行表示第i个用户与每个用户之间的第二影响权重;
[0060] 从预设的初始重要性权重向量开始,对每次获取到的权重矩阵进行迭代计算,直到重要性权重向量收敛;
[0061] 根据收敛后的所述重要性权重向量确定每个用户的重要性权重;其中,所述重要性权重向量中一维向量元素代表一个用户的重要性权重。
[0062] 作为本发明第二方面实施例提供的一种可能的实现方式,所述第一获取单元,还用于:
[0063] 针对第j个用户所发表的文章对应的每个用户行为数据,提取每个用户行为数据对应的身份信息,根据所述身份信息确定出每个用户行为数据所隶属的用户,统计获取属于第i个用户的用户行为数据;
[0064] 将第i个用户的用户行为数据中每个类型的行为数据与各自的权重进行相乘;
[0065] 根据相乘后的结果,获取第i个用户对第j个用户的所述第一影响权重。
[0066] 作为本发明第二方面实施例提供的一种可能的实现方式,所述第三获取模块,包括:
[0067] 提取单元,用于针对每个文章,从所述文章的用户行为数据中,提取出每个用户的用户行为数据;
[0068] 第二获取单元,用于根据每个用户的用户行为数据以及各自的重要性权重,获取每个用户对所述文章的评论数据;
[0069] 第三获取单元,用于根据每个用户对所述文章的评论数据,得到所述文章的重要性权重。
[0070] 作为本发明第二方面实施例提供的一种可能的实现方式,所述第二获取单元,还用于:
[0071] 针对每个用户,将所述用户的用户行为数据中每个类型的行为数据与各自的权重进行相乘;
[0072] 根据相乘后的结果得到所述用户对所述文章的影响数据;
[0073] 将所述影响数据与所述用户的重要性权重相乘,得到所述文章的评论数据。
[0074] 本发明实施例的文章推荐装置,本发明实施例的文章推荐方法,通过获取文章的用户行为数据和属性信息,根据属性信息和文章的用户行为数据,获取每个用户的重要性权重,根据文章的用户行为数据和每个用户的重要性权重,获取每个文章的重要性权重,根据文章的重要性权重,从所有文章中获取推荐文章并向用户推送推荐文章。本实施例中,通过根据文章的用户行为数据,即用户之间的互动信息,获取能够反映用户知识水平的用户重要性权重,再根据用户之间的互动信息和用户重要性权重,获得文章的重要性权重,根据文章的重要程度重推荐文章,避免了人为干预,减少了人工成本,保证了文章的质量和文章的多样化,解决了现有的推荐文章的方法,存在推荐的文章比较单一、不利于用户知识面的扩展、人工成本高、文章质量不稳定等问题。
[0075] 为达上述目的,本发明第三方面实施例提出了一种计算机设备,包括:处理器和存储器
[0076] 其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现如本发明第一方面实施例所述的文章推荐方法。
[0077] 为达上述目的,本发明第四方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令由处理器执行时,执行如第一方面实施例所述的文章推荐方法。
[0078] 为达上述目的,本发明第五方面实施例提出了一种非临时性计算机可读存储介质,其上存储有计算机程序,当计算机程序被处理器执行时实现如第一方面实施例所述的文章推荐方法。
[0079] 本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。附图说明
[0080] 本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0081] 图1为本发明实施例提供的一种文章推荐方法的流程示意图;
[0082] 图2为本发明实施例提供的另一种文章推荐方法的流程示意图;
[0083] 图3为本发明实施例提供的一种文章推荐装置的结构示意图;
[0084] 图4为本发明实施例提供的另一种文章推荐装置的结构示意图;
[0085] 图5为本发明实施例提供的再一种文章推荐装置的结构示意图;
[0086] 图6为本发明实施例提供的一种计算机设备的结构示意图。

具体实施方式

[0087] 下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
[0088] 下面参考附图描述本发明实施例的文章推荐方法及其装置。
[0089] 现有知识社区中,主要通过两种方式推荐文章。一是,根据用户的喜好、用户关注的内容和用户经常点击查看的知识内容匹配更多的相关文章,不断的推荐给用户进行知识学习。二是,由专业人士梳理和推荐价值高的文章。
[0090] 第一种方式,可以推荐用户喜爱看的文章,但是对用户的推荐比较单一,导致用户的知识获取面狭窄,由于用户关注的知识相关文章数量有限,文章质量也无法保证,并且在用户平时很少关注的领域,即使有非常好的知识文章分享,用户可能也无法获得,对用户的知识面扩展非常不利。第二种方式,由专业人士推荐文章,可以保证文章的质量,但是由专业人士梳理文章,人工成本高,并且专业人士的水平不均,无法保证每个专业人士都能给出最好的推荐,会使推荐文章的质量不稳定。
[0091] 可见,现有的推荐文章的方式,存在推荐的文章比较单一、不利于用户知识面的扩展、人工成本高、文章质量不稳定等问题。
[0092] 针对这一问题,本发明实施例提出一种文章推荐方法,通过根据用户之间的互动信息获取文章的重要性权重,根据文章重要性权重推荐文章,避免人为干预,减少人工成本,保证文章的质量和文章的多样化。
[0093] 在知识社区中,一个文章是否重要,受其他用户的评价影响,其中,评价包括文章被点击次数、被评论次数、被点赞的次数等等。
[0094] 用户的知识水平千差万别,可以认为知识水平高的用户对文章的评价对文章的重要性影响更大。用户本身知识水平的高低可通过用户发表文章的重要程度决定,用户发表文章的重要程度可通过被点击次数、被评论次数等评价来衡量。
[0095] 因此,可先通过用户之间的互动信息,来获取用户的重要性权重,再根据用户的重要性权重,获取文章的重要性权重。
[0096] 图1为本发明实施例提供的一种文章推荐方法的流程示意图。
[0097] 如图1所示,该文章推荐方法包括以下步骤:
[0098] 步骤101,获取文章的用户行为数据和属性信息。
[0099] 本实施例中,可从知识社区中,获取每个文章的用户行为数据和属性信息。其中,用户行为数据可包括用户对文章的点击次数、评论次数、点赞次数、点踩次数、下载次数等,属性信息可包括文章的作者信息、发表时间和/或发表时所用的账号等。
[0100] 步骤102,根据属性信息和文章的用户行为数据,获取每个用户的重要性权重。
[0101] 本实施例中,可根据文章的属性信息和文章被点击次数、被评论次数等等,获取每个用户的文章被其他用户进行评价的信息,进而根据每个用户的文章被评价的信息,获取每个用户的重要性权重。其中,用户的重要性权重体现了用户的知识水平,用户的重要性权重越大,表明用户的知识水平越高。
[0102] 通过将用户之间的互动信息作为获取用户的重要性权重的基础,使得用户的重要性权重的预测更加准确。
[0103] 步骤103,根据文章的用户行为数据和每个用户的重要性权重,获取每个文章的重要性权重。
[0104] 由于一个文章的重要性权重,受具体的评价影响,如点赞可以提升文章的重要性权重,而点踩会降低文章的重要性权重,并且还受用户重要性权重的影响,如用户对文章进行点赞,用户重要性权重大越大,文章的重要性权重提升越大。因而,可以根据对文章进行评价的用户的行为数据和用户的重要性权重,获取每个文章的重要性权重。
[0105] 本实施例中,由于将用户的行为数据和用户的重要性权重作为获取文章重要性权重的基础,不仅使文章的重要性权重预测更加准确,而且以实际用户行为数据为依据,使文章的重要性权重预测更加真实。
[0106] 步骤104,根据文章的重要性权重,从所有文章中获取推荐文章并向用户推送推荐文章。
[0107] 本实施例中,可对知识社区中所有的文章按照文章的重要性权重,从大到小进行排序,按照排序结果截取预设个数的文章作为推荐文章。或者,将文章的重要性权重与预设的权重阈值进行比较,将超过权重阈值的文章作为推荐文章。之后,将获取到推荐文章,通过发送推送消息的方式推送给用户。
[0108] 为了更详细的说明上述实施例,下面通过另外一个实施例,说明本发明实施例提出的文章推荐方法。
[0109] 如图2所示,该文章推荐方法包括以下步骤:
[0110] 步骤201,获取文章的用户行为数据和属性信息。
[0111] 步骤201与上述实施例中的步骤101类似,故在此不再赘述。
[0112] 步骤202,根据属性信息从所有文章中,确定出每个用户所发表的文章。
[0113] 由于在知识社区中发表文章或者进行评价通常需要注册账号,登录账号后方可发表文章或进行评价,因此本实施例中,可根据属性信息获取文章的作者,或者对应的用户账号,从而可以确定每个文章所属的用户,进而可以确定出每个用户所发表的文章。
[0114] 步骤203,根据每个用户所发表的文章的用户行为数据,获取两两用户之间的第一影响权重。
[0115] 本实施例中,可根据其他用户对某个用户所发表的文章的用户行为数据,获取两两用户之间的第一影响权重。具体地,从第j个用户所发表的文章对应的用户行为数据中,获取第i个用户对应的用户行为数据,其中,1≤i,j≤N,i,j以及N为正整数。
[0116] 作为一种可能的实现形式,根据第i个用户的用户账号信息,从第j个用户所发表的文章对应的用户行为数据中,提取第i个用户的用户行为数据。
[0117] 作为另一种可能的实现形式,针对第j个用户所发表的文章对应的每个用户行为数据,提取每个用户行为数据对应的身份信息,如账号信息,根据身份信息确定出每个用户行为数据所隶属的用户,统计获取属于第i个用户的用户行为数据。
[0118] 在获取第i个用户的用户行为数据后,根据第i个用户的用户行为数据,获取第i个用户对第j个用户的第一影响权重。本实施例中,可将第i个用户的用户行为数据中每个类型的行为数据与各自的权重进行相乘,根据相乘后的结果,获取第i个用户对第j个用户的第一影响权重。如公式(1)所示。
[0119] Eij=A′*Aij+B′*Bij+C′*Cij-D′*Dij   (1)
[0120] 其中,Eij表示第i个用户对第j个用户的第一影响权重,Aij、Bij、Cij、Dij分别表示第i个用户对第j个用户所有文章的总点击数、总评论数、总点赞数、总点踩数,A′表示点击权重,B′表示评论权重,C′表示点赞权重,D′表示点踩权重。需要说明的是,为了后续计算方便,当Eij<0时,可设Eij=0。
[0121] 根据上述方法,可获取N个两两用户之间的第一影响权重。
[0122] 本实施例中,根据每个用户所发表的文章的用户行为数据,获取两两用户之间的第一影响权重,使得获得的第一影响权重能够准确的体现用户的知识水平。
[0123] 步骤204,基于两两用户之间的第一影响权重迭代计算出每个用户的重要性权重。
[0124] 在获取两两用户之间的第一影响权重后,可基于两两用户之间的第一影响权重迭代计算出每个用户的重要性权重。本实施例中,将第i个用户对每个用户的第一影响权重进行求和,得到第一影响总权重。然后,将第i个用户对第j个用户的第一影响权重与第一影响总权重作比值,该比值作为第i个用户对第j个用户的第二影响权重。如公式(2)所示。
[0125]
[0126] 其中,Fij表示第i个用户对第j个用户的第二影响权重,Eij表示第i个用户对第j个用户的第一影响权重, 表示第i个用户对每个用户的第一影响权重之和,即第一影响总权重。
[0127] 从而,根据上述方式可以获取到N个用户两两之间的第二影响权重。
[0128] 在获取两两用户之间的第二影响权重后,将两两用户之间的第二影响权重,构成一个权重矩阵。如公式(3)所示。
[0129]
[0130] 其中,T表示权重矩阵,权重矩阵中的第i行表示第i个用户与每个用户之间的第二影响权重,N表示用户总数。
[0131] 在构成权重矩阵后,从预设的用户初始重要性权重向量开始,对每次获取到的权重矩阵进行迭代计算,直到重要性权重向量收敛。如公式(4)、(5)(6)、(7)所示。
[0132] W2=W1*T   (4)
[0133] W3=W2*T   (5)
[0134] Wm=Wm-1*T   (6)
[0135] Wm=[Z1 Z2 … Zn-1 ZN] (7)
[0136] 其中,W1=[I1 I2 I3 … IN]为初始重要性权重向量,可设每个用户的重要性权重为1。在获得权重矩阵T之后,根据(4)、(5)(6)进行迭代计算,由于权重矩阵T每行的元素之和为1,且所有元素都大于零,所以权重矩阵T最终会收敛,得到矩阵Wm,如公式(7)所示。矩阵Wm为用户最终的重要性权重组成的矩阵,矩阵中的一个元素表示一个用户的重要性权重。
[0137] 步骤205,针对每个文章,从文章的用户行为数据中,提取出每个用户的用户行为数据。
[0138] 本实施例中,针对每个文章,可根据用户的账号信息,从文章的用户行为数据中,提取每个用户的用户行为数据。
[0139] 步骤206,根据每个用户的用户行为数据以及各自的重要性权重,获取每个用户对文章的评论数据。
[0140] 本实施例中,对于一个文章,可针对每个对文章进行评价的用户,将用户的用户行为数据中每个类型的行为数据与各自的重要性权重进行相乘,然后根据相乘后的结果得到用户对文章的影响数据。之后,将影响数据与用户的重要性权重相乘,得到用户对该文章的评论数据。如公式(8)、(9)所示。
[0141] Huv=A′*Auv+B′*Buv+C′*Cuv-D′*Duv   (8)
[0142] Yuv=Huv*Zu=A′*Auv*Zu+B′*Buv*Zu+C′*Cuv*Zu-D′*Duv*Zu   (9)
[0143] 其中,Huv表示第u个用户对文章Gv的影响数据,Auv、Buv、Cuv、Duv分别表示第u个用户对文章Gv的点击数、评论数、点赞数、点踩数,A′、B′、C′、D′分别表示点击权重、评论权重、点赞权重、点踩的权重,Yuv表示第u个用户对文章Gv的评论数据,Zu表示第u个用户的重要性权重。
[0144] 步骤207,根据每个用户对文章的评论数据,得到文章的重要性权重。
[0145] 在获取每个用户对一个文章的评论数据后,可根据每个用户对文章的评论数据求和,得到文章的重要权重。如公式(10)所示。
[0146]
[0147] 其中,Yv表示文章Gv重要性权重,Yuv表示第u个用户对文章Gv的评论数据,n表示对文章Gv进行评价的用户总数。
[0148] 根据上述方法,可获取所有文章的重要性权重。
[0149] 需要说明的是,本实施例中,用户行为数据的类型包括但不仅限于点击、评论、点赞、点踩。并且,每个类型的行为数据的权重可以按照实际情况进行设定,增加了计算的灵活性,使用户重要性权重和文章重要性权重的预测更加准确和真实。
[0150] 步骤208,根据文章的重要性权重,从所有文章中获取推荐文章并向用户推送推荐文章。
[0151] 在获取所有文章的重要性权重后,可把所有文章按照重要性权重降序排列,得到所有文章的重要性权重的排序向量,如公式(11)所示。
[0152] X=[Y1 Y2 Y3 … Ym]   (11)
[0153] 其中,Y1表示文章G1的重要性权重,Ym表示文章Gm的重要性权重,m表示文章的数量。
[0154] 最后,按照文章的重要性权重的顺序将文章推送给用户。具体地,可按照排序的结果,将前面预设个数的文章推送给用户。或者,将文章的重要性权重超过预设的权重阈值的文章推送给用户。
[0155] 本发明实施例的文章推荐方法,通过获取文章的用户行为数据和属性信息,根据属性信息和文章的用户行为数据,获取每个用户的重要性权重,根据文章的用户行为数据和每个用户的重要性权重,获取每个文章的重要性权重,根据文章的重要性权重,从所有文章中获取推荐文章并向用户推送推荐文章。本实施例中,通过根据文章的用户行为数据,即用户之间的互动信息,获取能够反映用户知识水平的用户重要性权重,再根据用户之间的互动信息和用户重要性权重,获得文章的重要性权重,根据文章的重要程度推荐文章,避免了人为干预,减少了人工成本,保证了文章的质量和文章的多样化,解决了现有的推荐文章的方法,存在推荐的文章比较单一、不利于用户知识面的扩展、人工成本高、文章质量不稳定等问题。
[0156] 为了实现上述实施例,本发明还提出一种文章推荐装置。
[0157] 如图3所示,该文章推荐装置包括:第一获取模块310、第二获取模块320、第三获取模块330、推送模块340。
[0158] 其中,第一获取模块310用于获取文章的用户行为数据和属性信息。
[0159] 第二获取模块320用于根据属性信息和文章的用户行为数据,获取每个用户的重要性权重。
[0160] 第三获取模块330用于根据文章的用户行为数据和每个用户的重要性权重,获取每个文章的重要性权重。
[0161] 推送模块340用于根据文章的重要性权重,从所有文章中获取推荐文章并向用户推送推荐文章。
[0162] 在本实施例一种可能的实现方式中,如图4所示,第二获取模块320包括:确定单元321、第一获取单元322、计算单元323。
[0163] 其中,确定单元321根据属性信息从所有文章中,确定出每个用户所发表的文章。
[0164] 第一获取单元322根据每个用户所发表的文章的用户行为数据,获取两两用户之间的第一影响权重。
[0165] 计算单元323基于两两用户之间的第一影响权重迭代计算出每个用户的重要性权重。
[0166] 在本实施例一种可能的实现方式中,第一获取单元322还用于:
[0167] 从第j个用户所发表的文章对应的用户行为数据中,获取第i个用户对应的用户行为数据;其中,1≤i,j≤N,i,j以及N为正整数;
[0168] 根据第i个用户的用户行为数据,获取第i个用户对第j个用户的第一影响权重;
[0169] 计算单元323还用于:
[0170] 将第i个用户对每个用户的第一影响权重进行求和,得到第一影响总权重;
[0171] 获取第i个用户对第j个用户的第一影响权重与第一影响总权重的比值,将比值作为两两用户之间的第二影响权重;
[0172] 根据获取到的所有两两用户之间的第二影响权重,构成一个权重矩阵;其中,权重矩阵中的第i行表示第i个用户与每个用户之间的第二影响权重;
[0173] 从预设的初始重要性权重向量开始,对每次获取到的权重矩阵进行迭代计算,直到重要性权重向量收敛;
[0174] 根据收敛后的重要性权重向量确定每个用户的重要性权重;其中,重要性权重向量中一维向量元素代表一个用户的重要性权重。
[0175] 在本实施例一种可能的实现方式中,第一获取单元322还用于:
[0176] 针对第j个用户所发表的文章对应的每个用户行为数据,提取每个用户行为数据对应的身份信息,根据身份信息确定出每个用户行为数据所隶属的用户,统计获取属于第i个用户的用户行为数据;
[0177] 将第i个用户的用户行为数据中每个类型的行为数据与各自的权重进行相乘;
[0178] 根据相乘后的结果,获取第i个用户对第j个用户的第一影响权重。
[0179] 在本实施例一种可能的实现方式中,如图5所示,第三获取模块330包括:提取单元331、第二获取单元332、第三获取单元333。
[0180] 其中,提取单元331用于针对每个文章,从文章的用户行为数据中,提取出每个用户的用户行为数据。
[0181] 第二获取单元332用于根据每个用户的用户行为数据以及各自的重要性权重,获取每个用户对文章的评论数据。
[0182] 第三获取单元333用于根据每个用户对文章的评论数据,得到文章的重要性权重。
[0183] 在本实施例一种可能的实现方式中,第二获取单元332还用于:
[0184] 针对每个用户,将用户的用户行为数据中每个类型的行为数据与各自的权重进行相乘;
[0185] 根据相乘后的结果得到用户对文章的影响数据;
[0186] 将影响数据与用户的重要性权重相乘,得到文章的评论数据。
[0187] 需要说明的是,前述对文章推荐方法实施例的解释说明,也适用于本实施例的文章推荐装置,故在此不再赘述。
[0188] 本发明实施例的文章推荐装置,本发明实施例的文章推荐方法,通过获取文章的用户行为数据和属性信息,根据属性信息和文章的用户行为数据,获取每个用户的重要性权重,根据文章的用户行为数据和每个用户的重要性权重,获取每个文章的重要性权重,根据文章的重要性权重,从所有文章中获取推荐文章并向用户推送推荐文章。本实施例中,通过根据文章的用户行为数据,即用户之间的互动信息,获取能够反映用户知识水平的用户重要性权重,再根据用户之间的互动信息和用户重要性权重,获得文章的重要性权重,根据文章的重要程度推荐文章,避免了人为干预,减少了人工成本,保证了文章的质量和文章的多样化,解决了现有的推荐文章的方法,存在推荐的文章比较单一、不利于用户知识面的扩展、人工成本高、文章质量不稳定等问题。
[0189] 为了实现上述实施例,本发明还提出一种计算机设备,包括:处理器和存储器。
[0190] 其中,处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,以用于实现如前述实施例所述的文章推荐方法。
[0191] 图6示出了适于用来实现本申请实施方式的示例性计算机设备30的框图。图6显示的计算机设备30仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
[0192] 如图6所示,计算机设备30以通用计算设备的形式表现。计算机设备30的组件可以包括但不限于:一个或者多个处理器或者处理单元31,系统存储器32,连接不同系统组件(包括系统存储器32和处理单元31)的总线33。
[0193] 总线33表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(Industry  Standard Architecture;以下简称:ISA)总线,微通道体系结构(Micro Channel Architecture;以下简称:MAC)总线,增强型ISA总线、视频电子标准协会(Video Electronics Standards Association;以下简称:VESA)局域总线以及外围组件互连(Peripheral Component Interconnection;以下简称:PCI)总线。
[0194] 计算机设备30典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备30访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
[0195] 系统存储器32可以包括易失性存储器形式的计算机系统可读介质,例如随机存取存储器(Random Access Memory;以下简称:RAM)40和/或高速缓存存储器41。计算机设备30可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例,存储系统42可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如:光盘只读存储器(Compact Disc Read Only Memory;以下简称:CD-ROM)、数字多功能只读光盘(Digital Video Disc Read Only Memory;以下简称:DVD-ROM)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线33相连。存储器32可以包括至少一个程序产品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配置以执行本申请各实施例的功能。
[0196] 具有一组(至少一个)程序模块51的程序/实用工具50,可以存储在例如存储器32中,这样的程序模块51包括——但不限于——操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块51通常执行本申请所描述的实施例中的功能和/或方法。
[0197] 计算机设备30也可以与一个或多个外部设备60(例如键盘、指向设备、显示器70等)通信,还可与一个或者多个使得用户能与该计算机设备30交互的设备通信,和/或与使得该计算机设备30能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口34进行。并且,计算机设备30还可以通过网络适配器35与一个或者多个网络(例如局域网(Local Area Network;以下简称:LAN),广域网(Wide Area Network;以下简称:WAN)和/或公共网络,例如因特网)通信。如图所示,网络适配器35通过总线33与计算机设备30的其它模块通信。应当明白,尽管图中未示出,可以结合计算机设备30使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储系统等。
[0198] 处理单元31通过运行存储在系统存储器32中的程序,从而执行各种功能应用以及数据处理,例如实现图1-图2所示的文章推荐方法。
[0199] 为了实现上述实施例,本发明还提出一种计算机程序产品,当计算机程序产品中的指令由处理器执行时,执行如前述实施例所述的文章推荐方法。
[0200] 为了实现上述实施例,本发明还提出一种非临时性计算机可读存储介质,其上存储有计算机程序,当计算机程序被处理器执行时实现如前述实施例所述的文章推荐方法。
[0201] 可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(Read Only Memory;以下简称:ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory;以下简称:
EPROM)或闪存、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0202] 计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括——但不限于——电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
[0203] 计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等,或者上述的任意合适的组合。
[0204] 可以以一种或多种程序设计语言或其组合来编写用于执行本申请操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(Local Area Network;以下简称:LAN)或广域网(Wide Area Network;以下简称:WAN)连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
[0205] 在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
[0206] 此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
[0207] 流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
[0208] 在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
[0209] 应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
[0210] 本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
[0211] 此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
[0212] 上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈