首页 / 专利库 / 电脑编程 / 算法 / 期望最大化算法 / 一种基于交易网络的商家推荐方法

一种基于交易网络的商家推荐方法

阅读:512发布:2020-09-18

专利汇可以提供一种基于交易网络的商家推荐方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于交易网络的商家推荐方法,其步骤为:(1) 整理 交易数据并建立交易网络;(2)根据用户交易历史对用户聚类;(3)对交易网络进行社团划分;(4)应用随机行走方法实现商家推荐。本发明可广泛应用于各类 电子 商务 网站 中的商家(卖家)推荐,为广大买家推荐合适的卖家;充分利用买家和卖家的历史交易数据,发掘买家和卖家的偏好特征,分析买家和卖家交易的相似性,合理应用随机行走方法,有效提高商家推荐的准确性和针对性。所采用的计算方法简单高效,切合 电子商务 网站海量交易数据、同时买家和卖家交易信息稀疏的特性,有较好的扩展性和适用性;有效填补目前电子商务网站商家推荐方面的空白。,下面是一种基于交易网络的商家推荐方法专利的具体信息内容。

1.一种基于交易网络的商家推荐方法,其特征在于包括以下步骤:
1)整理交易数据并建立交易网络,包括为每个用户,即买家和卖家,建立和维护偏好向量;并根据历史交易记录在用户之间建立交易网络;
2)根据用户交易历史对用户聚类;采用期望最大化算法EM,通过用户偏好向量进行用户聚类,形成偏好相似的用户簇;
3)对交易网络进行社团划分;采用K均值算法KM,根据交易网络中各用户节点的连接模式划分社团;
4)应用随机行走方法实现商家推荐,从买家出发,在社团间随机行走,根据用户簇决定停止概率,完成商家推荐。
2.根据权利要求1所述的基于交易网络的商家推荐方法,其特征在于,上述步骤1)中用户的偏好向量用数组表示:令 表示电子商务网站中商品类别的数量;用户 的偏好向量为 ;其中元
素 ( )的定义如下:


3.根据权利要求1所述的基于交易网络的商家推荐方法,其特征在于,上述步骤1)中的交易网络是一个有向图 ,其中 表示电子商务网站中的用户集合;有向边集合 反映用户之间的交易历史,对于任意两个用户 和 ( ),有向边
表示用户 曾经从用户 购买过商品; 是一个映射,其中 为自然
数集,作用是为 中的每一条有向边赋予权重;简化处理:有向边 的权重表示为,代表 向 购买商品的次数,若 ,则 ,另有 。
4.根据权利要求1、2或3所述的基于交易网络的商家推荐方法,其特征在于,上述步骤
2)中的EM算法包含两个阶段:E-Step根据用户簇的当前组成计算每个簇的中心点;M-Step将每个用户重新分配到从属概率最高的用户簇;具体过程为:
2.1)考虑E-Step,计算用户簇 的中心点 ,其中 表示商品类别
的数量,元素 的计算公式如下:
其中 表示用户簇 的规模,即簇中包含的用户数量; 是用户 的偏好向量 中的对应元素,必须属于 ;
2.2)考虑M-Step,用户 属于用户簇 的从属概率由 表示,为计算 ,引入背景向量 ,其中元素 的计算公式如下:
其中 为用户集合;再引入平滑因子 ,可设为0.01,取值范围0.001~0.06,交易数据越稀疏,取值越大;计算用户簇 的特征向量 ,其中元素 的计算公
式如下:
进一步计算系数向量 ,其中元素 的计算公式如下:
基于上述,计算用户 属于用户簇 的从属概率 ,公式如下:
将每个用户 重新分配到从属概率最大的用户簇 中,即:

5.根据权利要求4所述的基于交易网络的商家推荐方法,其特征在于,上述步骤2)中采用EM算法完成用户聚类的过程是:首先根据电子商务网站中的用户总数设置用户簇的数量 ,保证用户簇规模的平均范围为500~3000个用户;随机设定 个用户簇,对每一个用户,以均一概率 分配到某一个簇中;然后开始迭代:第一步执行EM算法为每一个用户重新分配用户簇;第二步对过大和过小的用户簇做处理,过程是:
2.3)判定过小的用户簇:设定用户簇规模的最小值 ,一般 ;如果存在用户簇的规模小于 ,则解散 ,其成员以均一概率分配到其他用户簇中;
2.4)判定过大的用户簇:计算所有用户簇规模取对数后的均值,用 表示,再计算用户簇规模取对数后的方差值,用 表示,如果用户簇 满足以下公式:
则 过大,在其中随机设定2个用户簇, 的每个成员以均一概率 分配到一个新簇中;
迭代结束时判断用户簇的组成是否发生变化:如果发生变化,则进入下一次迭代;如果没有发生变化,则迭代结束,输出聚类好的用户簇。
6.根据权利要求1、2或3所述的基于交易网络的商家推荐方法,其特征在于,上述步骤
3)中的KM算法包含两个阶段:K-Step将每个用户重新分配到匹配度最高的社团;M-Step根据社团的当前组成计算每个社团的特征向量;具体过程为:
3.1)考虑M-Step,计算社团 的特征向量 ,其中 为用户总数;元
素 ( )的计算公式如下:
其中 表示社团 的规模,即社团中包含的用户数量,必须属于 ; 是无向邻接矩阵 中元素, 是一个 对称矩阵,由交易网络 转换而来,矩阵元
素 的定义如下:
显然有 ;用户 的特征向量 为矩阵 中的第行,即有

3.2)考虑K-Step,用户 同社团 的匹配度基于用户特征向量 和社团特征向量 之间的欧氏距离 表示,计算公式如下:
将每个用户 重新分配到匹配度最高的社团 中,即:

7.根据权利要求6所述的基于交易网络的商家推荐方法,其特征在于,上述步骤3)中采用KM算法完成交易网络中社团划分的过程是:首先根据电子商务网站中的用户总数设置社团的数量 ,保证社团规模的平均值范围为500~3000个用户;然后初始化社团:
对交易网络 中的用户节点按度数,即出度+入度排序,等分为 个区间;从每个区间随机选择10~30个用户节点;每个用户节点单独作为一个社团,社团特征向量等于用户特征向量;每次选择两个特征向量的欧氏距离最近的社团,将这两个社团合并为一个社团,重新计算新社团的特征向量;重复上述操作,直至剩余 个社团;然后迭代执行KM算法,迭代过程的收敛条件是一次迭代后,每个用户同社团的从属关系没有发生改变;最后输出社团划分结果。
8.根据权利要求1、2或3所述的基于交易网络的商家推荐方法,其特征在于,上述步骤
4)中应用随机行走方法实现商家推荐的过程是:首先确定推荐的商家数量 , =3~20;
然后从目标用户 出发随机行走,选择下一个用户 ;判定随机行走是否终止;如果未能终止,则将 作为当前用户 继续随机行走;如果过程终止,输出 为推荐的商家;上述过程重复 次,最后输出所推荐的一组商家。
9.根据权利要求8所述的基于交易网络的商家推荐方法,其特征在于,
上述步骤4)中的随机行走过程包含两个阶段:其一是按概率选择一个社团 ;其二是按概率从 中选择一个用户;
4.1)令当前用户为 ,计算选择社团 的概率 ,公式如下:
其中 为社团数量, 表示社团 和社团 的连接强度,计算公式如下:
其中 和 分别代表社团 和 的规模, 是无向邻接矩阵 中元素;社团 是用户 所在的社团, 和 分别表示社团 同社团 及 的连接强度;
4.2)选定社团 之后,计算选择另一用户 ( )的概率 ,公式如下:
其中 和 基于交易网络 中的映射 定义,代表用户之间的交易次
数,但不考虑交易的方向,计算公式如下:
其中 和 代表用户之间的交易次数。
10.根据权利要求9所述的基于交易网络的商家推荐方法,其特征在于,上述步骤4)中计算随机行走的终止概率 分四种情况,其中令所选用户为 ,目标用户为 :
情况1. 不是卖家,或者 已经同 交易过,不需要再推荐;此时 ;
情况2. 和 属于同一个用户簇,此时 ,即随机行走立即终止;
情况3. 所属用户簇 与 所属用户簇 不相同,此时计算 对 的隶属度 ,公式如下:
其中 为商品类别数量, 为 的偏好向量中的元素; 为组成 中心点的元素;如果 ,则 ;
情况4. 所属用户簇 与 所属用户簇 不相同,且 ,此时考虑与 交易
过的买家集合 ,按以下公式计算 :
其中 和 分别代表用户 、 同用户 的交易次数。

说明书全文

一种基于交易网络的商家推荐方法

[0001]

技术领域

[0002] 本发明涉及电子商务领域中的商家推荐,特别涉及存在大量历史交易数据的情况下,充分发掘买家和卖家的交易偏好,构成用户簇;同时引入社会网络因素,为买家或卖家划分社团;通过随机行走完成商家推荐。

背景技术

[0003] 推荐系统已应用到信息检索、新闻传媒、电子商务、社会网络服务等诸多领域。在电子商务领域,良好的推荐系统能够有效提升用户体验(包括买家和卖家),增加用户黏着度,促进更多交易行为的发生。目前众多的电子商务网站,如淘宝、大众点评、亚逊、亿贝、京东等都建立了各自的推荐系统,在商品层面进行有效的统计、建模、挖掘和推荐工作,取得了良好成果。目前的推荐技术大致可分为三大类:基于内容的推荐、协同过滤、以及混合推荐。基于内容的推荐为用户(买家)推荐与其之前的选择相类似的物品(商品);协同过滤为用户推荐与其偏好最相近的用户所选择过的物品;混合方式采用多种推荐方法的组合为用户推荐物品,一种策略是结合基于内容和协同过滤为用户提供推荐,另一种目前比较流行的策略是在协同过滤中引入社会网络技术为用户推荐物品。
[0004] 目前电子商务网站在交易过程中主要承担平台和中介的色,每一次交易实际发生在买家和卖家之间。现有的推荐系统在为买家发掘商品、促进买家体验和交易量方面已取得良好成果;但对卖家的关注度仍然不够,实际是较少考虑到社会网络因素的影响。已有市场调查报告显示超过65%的买家更倾向于同信任的卖家进行交易,并建立所谓“老客”、“回头客”等相对稳固的信任交易关系;考虑到在线商品交易中更高的劣质商品险和质保代价,合理的商家推荐是当前电子商务领域需要立即考虑的问题。现有的推荐方法和技术尚未考虑商家推荐的问题,有效的商家推荐方法将填补这一空白。

发明内容

[0005] 本发明主要目的是针对传统推荐系统没有考虑商家推荐的问题,提出一种基于交易网络的商家推荐方法,通过在买家和卖家之间建立偏好相似的用户簇,根据交易网络的连接模式划分社团,通过随机行走完成商家推荐。
[0006] 为实现本发明所述目的,本发明采用如下的步骤:1)整理交易数据并建立交易网络,包含两个工作:其一为每个用户(包括买家和卖家)建立和维护偏好向量;其二根据历史交易记录在用户之间建立交易网络;
2)根据用户交易历史对用户聚类;采用期望最大化算法EM,通过用户偏好向量进行用户聚类,形成偏好相似的用户簇;
3)对交易网络进行社团划分;采用K均值算法KM,根据交易网络中各(用户)节点的连接模式划分社团;
4)应用随机行走方法实现商家推荐,从买家(目标用户)出发,在社团间随机行走,根据用户簇决定停止概率,完成商家推荐。
[0007] 上 述 步 骤 1) 中 用 户 的 偏 好 向 量 用 数 组 表 示:令 表示电子商务网站中商品类别的数量;用户 的偏好向量为 ;其中元素 ( )的定义如下:

[0008] 上述步骤1)中的交易网络是一个有向图 ,其中 表示电子商务网站中的用户集合;有向边集合 反映用户之间的交易历史,对于任意两个用户和 ( ),有向边 表示用户 曾经从用户 购买过商品; 是一个映射,其中 为自然数集,作用是为 中的每一条有向边赋予权重;简化处理:有向边的权重表示为 ,代表 向 购买商品的次数,若 ,则 ,另有

[0009] 上述步骤2)中的EM算法包含两个阶段:E-Step(Expectation)根据用户簇的当前组成计算每个簇的中心点;M-Step(Maximization)将每个用户重新分配到从属概率最高的用户簇;2.1)考虑E-Step,计算用户簇 的中心点 ,其中 表示商品类别
的数量,元素 的计算公式如下:
其中 表示用户簇 的规模,即簇中包含的用户数量; 是用户 的偏好向量 中的对应元素,必须属于 ;
2.2)考虑M-Step,用户 属于用户簇 的从属概率由 表示,为计算 ,引
入背景向量 ,其中元素 的计算公式如下:
其中 为用户集合;再引入平滑因子 ,可设为0.01,取值范围0.001~0.06,交易数据越稀疏,取值越大;计算用户簇 的特征向量 ,其中元素 的计算公
式如下:
进一步计算系数向量 ,其中元素 的计算公式如下:
基于上述,计算用户 属于用户簇 的从属概率 ,公式如下:
将每个用户 重新分配到从属概率最大的用户簇 中,即:

[0010] 上述步骤2)中采用EM算法完成用户聚类的过程是:首先根据电子商务网站中的用户总数设置用户簇的数量 ,保证用户簇规模的平均范围为500~3000个用户;随机设定 个用户簇,对每一个用户,以均一概率( )分配到某一个簇中;然后开始迭代:第一步执行EM算法为每一个用户重新分配用户簇;第二步对过大和过小的用户簇做处理,过程是:2.3)判定过小的用户簇:设定用户簇规模的最小值 ,一般 ;如果存在用户簇的规模小于 ,则解散 ,其成员以均一概率分配到其他用户簇中;
2.4)判定过大的用户簇:计算所有用户簇规模取对数后的均值,用 表示,再计算用户簇规模取对数后的方差值,用 表示,如果用户簇 满足以下公式:
则 过大,在其中随机设定2个用户簇, 的每个成员以均一概率 分配到一个新簇中;
迭代结束时判断用户簇的组成是否发生变化:如果发生变化,则进入下一次迭代;如果没有发生变化,则迭代结束,输出聚类好的用户簇。
[0011] 上述步骤3)中的KM算法包含两个阶段:K-Step将每个用户重新分配到匹配度最高的社团;M-Step(Means)根据社团的当前组成计算每个社团的特征向量;3.1)考虑M-Step,计算社团 的特征向量 ,其中 为用户总数;元
素 ( )的计算公式如下:
其中 表示社团 的规模,即社团中包含的用户数量,必须属于 ; 是无向邻接矩阵 中元素, 是一个 对称矩阵,由交易网络 转换而来,矩阵元
素 的定义如下:
显然有 ;用户 的特征向量 为矩阵 中的第行,即有

3.2)考虑K-Step,用户 同社团 的匹配度基于用户特征向量 和社团特征向量 之间的欧氏距离 表示,计算公式如下:
将每个用户 重新分配到匹配度最高的社团 中,即:

[0012] 上述步骤3)中采用KM算法完成交易网络中社团划分的过程是:首先根据电子商务网站中的用户总数设置社团的数量 ,保证社团规模的平均值范围为500~3000个用户;然后初始化社团:对交易网络 中的节点(用户)按度数(出度+入度)排序,等分为个区间;从每个区间随机选择10~30个用户(节点,一般选择20个);每个用户单独作为一个社团,社团特征向量等于用户特征向量;每次选择两个距离(指特征向量的欧氏距离)最近的社团,将这两个社团合并为一个社团,重新计算新社团的特征向量;重复上述操作,直至剩余 个社团;然后迭代执行KM算法,迭代过程的收敛条件是一次迭代后,每个用户同社团的从属关系没有发生改变;最后输出社团划分结果。
[0013] 上述步骤4)中应用随机行走方法实现商家推荐的过程是:首先确定推荐的商家数量 ,一般 (范围3~20);然后从目标用户 出发随机行走,选择下一个用户 ;判定随机行走是否终止;如果未能终止,则将 作为当前用户 继续随机行走;如果过程终止,输出 为推荐的商家;上述过程重复 次,最后输出所推荐的一组商家。
[0014] 上述步骤4)中的随机行走过程包含两个阶段:其一是按概率选择一个社团 ;其二是按概率从 中选择一个用户;4.1)令当前用户为 ,计算选择社团 的概率 ,公式如下:
其中 为社团数量, 表示社团 和社团 的连接强度,计算公式如下:
其中 和 分别代表社团 和 的规模, 是无向邻接矩阵 中元素;社团 是
用户 所在的社团, 和 分别表示社团 同社团 及 的连接强度;
4.2)选定社团 之后,计算选择另一用户 ( )的概率 ,公式如下:
其中 和 基于交易网络 中的映射 定义,代表用户之间的交易次
数,但不考虑交易的方向,计算公式如下:
其中 和 代表用户之间的交易次数。
[0015] 上述步骤4)中计算随机行走的终止概率 分四种情况,其中令所选用户为 ,目标用户为 :情况1. 不是卖家,或者 已经同 交易过,不需要再推荐;此时 ;
情况2. 和 属于同一个用户簇,此时 ,即随机行走立即终止;
情况3. 所属用户簇 与 所属用户簇 不相同,此时计算 对 的隶属度 ,
公式如下:
其中 为商品类别数量, 为 的偏好向量中的元素; 为组成 中心点的元素;如果 ,则 ;
情况4. 所属用户簇 与 所属用户簇 不相同,且 ,此时考虑与 交易
过的买家集合 ,按以下公式计算 :
其中 和 分别代表用户 、 同用户 的交易次数。
[0016] 本发明可广泛应用于各类电子商务网站中的商家(卖家)推荐,为广大买家推荐合适的卖家;充分利用买家和卖家的历史交易数据,发掘买家和卖家的偏好特征,基于连接模式分析买家和卖家交易的相似性,合理应用随机行走方法,有效提高商家推荐的准确性和针对性。实验数据表明,应用本发明方法,商家推荐的准确率达到了70%以上,考虑到买家和卖家交易的随机性,这个结果已经超过了目前大多数面向商品的推荐方法和技术。所采用的计算方法简单高效,切合电子商务网站海量交易数据、同时买家和卖家交易信息稀疏的特性,有较好的扩展性和适用性;有效填补了目前电子商务网站商家推荐方面的空白。附图说明
[0017] 图1 是基于交易网络的商家推荐方法的结构图;图2 是交易网络的一个示例图;
图3 是采用期望最大化算法EM进行用户聚类的算法流程图
图4 是采用K均值算法KM进行交易网络社团划分的算法流程图;
图5 是交易网络示例基于连接模式划分社团后的示意图;
图6 是应用随机行走方法实现商家推荐的工作流程图。

具体实施方式

[0018] 下面结合附图进行详细说明。
[0019] 如图1所示,基于交易网络的商家推荐方法包含四个主要步骤:整理交易数据并建立交易网络、根据用户交易历史对用户聚类、对交易网络进行社团划分、应用随机行走方法实现商家推荐。方法的输入是电子商务网站中的历史交易记录、以及商品的分类信息;输出是为指定买家推荐的一组商家。期间涉及的数据结构包括用户偏好向量、交易网络、用户簇、以及社团结构。
[0020] 步骤一是整理交易数据并建立交易网络,其中包含两个工作:一是根据历史交易记录和商品类别信息为每个用户建立偏好向量,这里的用户包含买家和卖家;二是根据历史交易记录在用户之间建立交易网络。
[0021] 给定用户 ,其偏好向量 ,其中 表示电子商务网站中商品类别的数量。 可以是一个买家,也可以是一个卖家;在大多数电子商务网站中,一个卖家同时也可能是一个买家,本发明方法不受是否单纯买家或卖家的限制。偏好向量中元素 的含义由公式(1)定义,即 的值为1或0取决于用户 是否购买或销售过类别为 的商品,例如一个电脑桌或者一个旅行背包:
(1)
交易网络是一个有向图 ,其中 表示电子商务网站中的用户集合;有
向边集合 反映用户之间的交易历史,对于任意两个用户 和 ( ),有
向边 表示用户 曾经从用户 购买过商品; 是一个映射,其中 为
自然数集,作用是为边集 中的每一条有向边赋予权重;有向边 的权重表示为,代表 向 购买商品的次数,即 。不失一般性,若 ,则
,另有 。
[0022] 图2所示是一个交易网络的示例图,其中没有显示有向边的方向和权重;图中存在环路,如1-2-6-1:表示用户 中至少有一个用户即是买家同时也是卖家。
[0023] 步骤二是根据用户交易历史对用户聚类,采用期望最大化算法EM,过程如图3所示。算法根据所有用户的偏好向量将用户划分为多个偏好相似的用户簇,每个用户必须且只能从属于一个用户簇。用户簇的数量 事先指定:可以根据电子商务网站中的用户总数,除以期望的簇规模来确定,簇规模的范围一般设置为500~3000。例如一个电子商务网6
站中用户总数为10,簇规模定为1000,则 的值为 。
[0024] EM算法的主体包括两个阶段:E-Step(Expectation)根据用户簇的当前组成计算每个簇的中心点;M-Step(Maximization)将每个用户重新分配到从属概率最高的用户簇。两个阶段迭代计算,收敛条件是一次迭代后,每个用户同用户簇的从属关系没有发生改变。
[0025] 考虑E-Step,用户簇 的中心点 ,其中 表示商品类别的数量,与偏好向量 中相同;元素 按公式(2)计算:
(2)
其中 表示用户簇 的规模,即簇中包含的用户数量; 是用户 的偏好向量 中的对应元素,必须属于 。
[0026] 考虑M-Step,用户 属于用户簇 的从属概率由 表示,为计算 ,首先引入背景向量 ,其中元素 由公式(3)计算:(3)
其中 为所有用户组成的集合。再引入平滑因子 , 可设为0.01,取值范围
0.001~0.06,取决于交易数据的稀疏程度:数据越稀疏,取值越大;意味着数据中的噪声比例越大,更需要背景向量进行平滑处理。
[0027] 然后基于背景向量 、平滑因子 和 的中心点 ,计算用户簇 的特征向量,其中元素 由公式(4)计算:(4)
根据特征向量 进一步计算系数向量 ,其中元素 由公式(5)计
算:
(5)
最后根据系数向量 ,结合特征向量 等,计算用户 属于用户簇 的从属概率,如公式(6)所示:
(6)
如图3所示,首先是用户簇初始化,随机设定 个用户簇,对每一个用户,以均一概率( )分配到某一个簇中;然后执行EM算法,在每一次迭代中,第一步执行E-Step,根据每个用户簇的当前构成计算其中心点;第二步执行M-Step,将每个用户 重新分配到从属概率最大的用户簇 中,由公式(7)表示:
(7)
M-Step执行完毕后,在下一次迭代开始之前,对过大和过小的用户簇做进一步处理:
对于过小的簇,设定用户簇规模的最小值 ,一般 ,如果存在用户簇 的规模小于 ,则解散 ,其成员以均一概率分配到其他用户簇中。
[0028] 对于过大的簇,计算所有用户簇规模取对数后的均值,用 表示,再计算用户簇规模取对数后的方差值,用 表示,如果用户簇 满足公式(8),则将 拆分成2个用户簇:
(8)
拆分过程是随机设定2个用户簇, 中每个成员以均一概率 分配到一个新簇中。
[0029] 如果一次迭代执行完毕后,用户同用户簇的从属关系没有发生改变,则算法执行过程终止。
[0030] 步骤三是对交易网络进行社团划分,采用K均值算法KM,过程如图4所示。算法根据交易网络中各节点(代表用户)的连接模式,将节点划分到多个连接模式相近的社团,每一个节点必须且只能从属于一个社团。社团的数量 事先指定:可以根据电子商务网站中的用户总数,除以期望的社团规模来确定,社团规模的范围同用户簇规模的范围相6
当,一般设置为500~3000。考虑一个拥有10 个用户的电子商务网站,假设社团规模设置为
2000,则 的值为500。
[0031] 为进行社团划分,需要将交易网络 转换为无向邻接矩阵 ,是一个 对称矩阵,其中 为用户(节点)总数(即 ),矩阵元素 的值由公式(9)定义:
(9)
按公式(9),显然有 。定义用户 的特征向量 为矩阵 中的第 行,即有

[0032] KM算法的主体亦包括两个阶段:K-Step将每个用户重新分配到匹配度最高的社团;M-Step(Means)根据社团的当前组成计算每个社团的特征向量;两个阶段迭代计算,收敛条件是一次迭代后,每个用户同社团的从属关系没有发生改变。
[0033] 考虑M-Step,社团 的特征向量 ,其中 为用户总数;元素按公式(10)计算:
(10)
其中 表示社团 的规模,即社团中包含的用户数量,必须属于 。
[0034] 考虑K-Step,用户 同社团 的匹配度基于用户特征向量 和社团特征向量 之间的欧氏距离 表示,由公式(11)计算:(11)
如图4所示,首先是社团初始化:对交易网络 中的节点(用户)按度数(出度+入度)排序,等分为 个区间;从每个区间随机选择10~30个用户(节点,一般选择20个);每个用户单独作为一个社团,社团特征向量等于用户特征向量;每次选择两个距离(指特征向量的欧氏距离,按公式(11)计算)最近的社团,将这两个社团合并为一个社团,重新计算新社团的特征向量;重复上述操作,直至剩余 个社团。
[0035] 然后执行KM算法,在每一次迭代中,第一步执行K-Step,将每个用户 重新分配到匹配度最高的社团 中,由公式(12)表示:(12)
K-Step执行完毕后,检查每个社团的组成是否发生改变,如果没有则迭代结束,输出社团划分结果;否则继续执行M-Step,根据每个社团的当前构成计算其特征向量;M-Step执行完毕后进入下一次迭代。图5所示是交易网络示例(图2)划分社团后的示意图,其中集合 中各节点的连接模式相似,被划入同一个社团;同理集合 中
各节点的连接模式与前述集合有较大不同,且彼此相似,被划入另一个社团。
[0036] 步骤四是基于用户簇和社团划分,应用随机行走方法实现商家推荐,过程如图6所示。从目标用户(买家)出发,一次随机行走到达下一个用户;然后以该用户为当前用户继续随机行走;直至达到终止条件。随机行走包含两个阶段:其一是按概率选择一个社团 ;其二是按概率从 中选择一个用户。
[0037] 令当前用户为 ,为计算选择社团 的概率 ,首先计算社团之间的连接强度;给定社团 和社团 , 和 之间的连接强度 按公式(13)计算:(13)
其中 和 分别代表社团 和 的规模, 是无向邻接矩阵 中元素,由公式
(9)定义。按公式(13)也可以计算社团 的自连接强度 。
[0038] 令当前用户 属于社团 ,社团选择概率 按公式(14)计算:(14)
其中 为社团总数, 和 分别表示社团 同社团 及 的连接强度。
[0039] 选定社团 之后,按公式(15)计算选择另一用户 ( )的概率 :(15)
其中 和 基于交易网络 中的映射 定义,代表用户之间的交易次
数,但不考虑交易的方向,如公式(16)所示:
(16)
按公式(16),显然有 ,不考虑 和 谁是买家或卖家。
[0040] 一次随机行走后,计算随机行走的终止概率 ;令所选用户为 ,目标用户为 ,分以下4种情况:情况1. 不是卖家,或者 ,即 已经同 交易过,不需要再推荐;此时

情况2. 和 属于同一个用户簇,此时 ,即随机行走立即终止;
情况3. 所属用户簇 与 所属用户簇 不相同,此时计算 对 的隶属度 ,
如公式(17)所示:
(17)
其中 为 的偏好向量中的元素,由公式(1)定义; 为组成 中心点的元素,由公式(2)定义;表示商品类别的数量。如果 ,则 ;
情况4. 所属用户簇 与 所属用户簇 不相同,且 ,此时考虑与 交易
过的买家集合 ,按公式(18)计算 :
(18)
其中 和 分别代表用户 、 同用户 的交易次数;公式(18)揭示 是否与 的大部分买家偏好相似。如果一次随机行走未能终止,则将所选用户 作为当前用户,继续下一次的随机行走。
[0041] 如图6所示,首先确定本次推荐的商家数量 ,一般 (范围3~20);然后从目标用户 出发随机行走,选择下一个用户 ;分四种情况判定随机行走是否终止;如果未能终止,则将 作为当前用户 继续随机行走;如果过程终止,输出 为推荐的商家;上述过程重复 次,最后输出所推荐的一组商家。
[0042] 我们根据电子商务网站中实际采集的交易数据对本发明方法进行检验:从所建立的交易网络中随机删除部分有向边,即删除部分买家和卖家之间的交易关系;然后以这些买家作为目标用户,应用本发明方法为其推荐合适的卖家(商家),如果推荐的卖家就是之前删除了交易关系的卖家,则证明推荐方法的合理性和准确性。实验数据表明,应用本发明方法,商家推荐的准确率达到了70%以上;考虑到买家和卖家交易的随机性,这个结果已经超过了目前大多数面向商品的推荐方法和技术。本发明方法计算简单高效,适合电子商务网站海量交易数据的特点,具有良好的适用性和扩展性。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈