首页 / 专利库 / 人工智能 / 预测模型 / 商品销量预测及模型训练方法、装置以及设备

商品销量预测及模型训练方法、装置以及设备

阅读:1016发布:2020-06-17

专利汇可以提供商品销量预测及模型训练方法、装置以及设备专利检索,专利查询,专利分析的服务。并且本公开提出了一种商品销量预测及模型训练方法、装置以及设备。获取商品在至少一个维度下的排名信息;基于排名信息,将对应于同一维度的商品的排名和至少一个其他商品的排名进行特征组合;以及将得到的特征输入 预测模型 ,以得到预测模型针对商品的销量爆发系数的预测结果,其中,销量爆发系数用于表征商品在活动期间的销量相对于活动期间之前的平日的销量的变化程度。由此,本公开通过对商品及其他商品的排名进行特征组合,可以使得最终得到的特征能够很好地表征商品及与其具有竞争关系的其他商品之间的关系,并且通过对销量爆发系数进行预测,可以避免由于特征空间的迁移导致的销量预测偏低的问题,从而可以提高销量预测的准确性。,下面是商品销量预测及模型训练方法、装置以及设备专利的具体信息内容。

1.一种商品销量预测方法,其特征在于,包括:
获取商品在至少一个维度下的排名信息;
基于所述排名信息,将对应于同一维度的所述商品的排名和至少一个其他商品的排名进行特征组合;以及
将得到的特征输入预测模型,以得到所述预测模型针对所述商品的销量爆发系数的预测结果,其中,所述销量爆发系数用于表征所述商品在活动期间的销量相对于所述活动期间之前的平日的销量的变化程度。
2.根据权利要求1所述的商品销量预测方法,其特征在于,所述获取商品在至少一个或维度下的排名信息的步骤包括:
获取商品及与所述商品具有同一属性特征的其他商品的特征数据;
基于所述特征数据,对所述商品及其他商品进行排名,以得到所述商品的至少一个属性特征在至少一个排名维度下的排名信息。
3.根据权利要求2所述的商品销量预测方法,其特征在于,所述特征数据包括以下至少一项:
成交量;
购物车量;
点击量;
收藏量;以及
评论数。
4.根据权利要求1所述的商品销量预测方法,其特征在于,所述进行特征组合的步骤包括:
根据同一维度下其他商品的排名,对所述商品的排名进行聚合。
5.根据权利要求4所述的商品销量预测方法,其特征在于,所述对商品的排名进行聚合的步骤包括:
使用高斯卷积核的方式对所述商品的排名进行聚合。
6.根据权利要求5所述的商品销量预测方法,其特征在于,基于如下公式对所述商品的排名进行聚合,
其中,Fi为经过聚合后得到的特征矩阵,G为高斯函数,σ为根据所述商品的排名确定的标准差大小,R1表示所述商品的多个属性特征在不同排名维度下的排名矩阵,R2表示其他商品的多个属性特征在不同排名维度下的排名矩阵,yj表示第j个属性特征。
7.根据权利要求1所述的商品销量预测方法,其特征在于,还包括:
根据所述销量爆发系数和所述商品在平日的销量,对所述商品在所述活动期间的销量进行预测。
8.根据权利要求7所述的商品销量预测方法,其特征在于,还包括:
向商家推送所述商品的销量的预测结果;并且/或者
根据所述商品的销量的预测结果和商家的商品库存,向所述商家提供销售建议。
9.根据权利要求8所述的商品销量预测方法,其特征在于,所述向所述商家提供销售建议的步骤包括:
在所述预测结果表明所述商品的销量大于商家的商品库存的情况下,向商家发出备货的建议;以及/或者
在所述预测结果表明所述商品的销量小于商家的商品库存的情况下,向商家发出推出促销活动的建议。
10.根据权利要求7所述的商品销量预测方法,其特征在于,所述商品包括多个最小库存单位,该方法还包括:
结合所述商品在所述活动期间的销量预测结果,以及所述多个最小库存单位的商品的历史销量,得到不同最小库存单位下的商品在所述活动期间的销量预测结果。
11.根据权利要求10所述的商品销量预测方法,其特征在于,所述商品在所述活动期间的销量预测结果是基于商品粒度的销量预测结果。
12.根据权利要求11所述的商品销量预测方法,其特征在于,所述商品粒度包括以下至少一项:
用于展示所述商品的商品页的访问人数;
用于展示所述商品的商品页的浏览总数;以及
点击进入商品详情页的次数。
13.根据权利要求10所述的商品销量预测方法,其特征在于,还包括:
向商家推送不同最小库存单位下的商品的销量预测结果;并且/或者
根据最小库存单位下的商品的销量预测结果和商家的商品库存,向所述商家提供销售建议。
14.根据权利要求13所述的商品销量预测方法,其特征在于,所述向所述商家提供销售建议的步骤包括:
在所述预测结果表明最小库存单位下的商品的销量大于商家的商品库存的情况下,向商家发出备货的建议;以及/或者
在所述预测结果表明最小库存单位下的商品的销量小于商家的商品库存的情况下,向商家发出推出促销活动的建议。
15.根据权利要求1所述的商品销量预测方法,其特征在于,还包括:
基于所述商品在所述活动期间的实际销量,计算所述商品的实际销量爆发系数;
以得到的所述特征作为样本特征,以所述实际销量爆发系数为样本标记,对所述预测模型进行训练,以更新所述预测模型。
16.一种预测模型训练方法,其特征在于,包括:
根据商品在活动期间的销量和在所述活动期间之前的平日的销量,确定所述商品的销量爆发系数,所述销量爆发系数用于表征所述商品在活动期间的销量相对于平日的销量的变化程度;
基于所述商品在至少一个维度下的排名信息,将对应于同一维度的所述商品的排名和至少一个其他商品的排名进行特征组合;以及
以得到的特征为样本特征,以所述销量爆发系数为样本标记,进行模型,以得到用于对商品的销量爆发系数进行预测的预测模型。
17.一种商品销量预测装置,其特征在于,包括:
排名信息获取模,用于获取商品在至少一个维度下的排名信息;
特征组合模块,用于基于所述排名信息,将对应于同一维度的所述商品的排名和至少一个其他商品的排名进行特征组合;以及
系数预测模块,用于将得到的特征输入预测模型,以得到所述预测模型针对所述商品的销量爆发系数的预测结果,其中,所述销量爆发系数用于表征所述商品在活动期间的销量相对于所述活动期间之前的平日的销量的变化程度。
18.一种预测模型训练装置,其特征在于,包括:
系数确定模块,用于根据商品在活动期间的销量和在所述活动期间之前的平日的销量,确定所述商品的销量爆发系数,所述销量爆发系数用于表征所述商品在活动期间的销量相对于平日的销量的变化程度;
特征组合模块,用于基于所述商品在至少一个维度下的排名信息,将对应于同一维度的所述商品的排名和至少一个其他商品的排名进行特征组合;以及
训练模块,用于以得到的特征为样本特征,以所述销量爆发系数为样本标记,进行模型,以得到用于对商品的销量爆发系数进行预测的预测模型。
19.一种计算设备,包括:
处理器;以及
存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如权利要求1-16中任何一项所述的方法。

说明书全文

商品销量预测及模型训练方法、装置以及设备

技术领域

[0001] 本公开涉及商品销量预测及模型训练方法、装置以及设备。

背景技术

[0002] 预测是对事物的发展趋势和在未来时期的数量表现做出推测和估计。目前,预测技术在各个领域中都起着举足轻重的作用。
[0003] 以电子商务领域中的商品销量预测为例。由于市场行为的不确定性,使得销量预测是现代电子商务行为中控制缺货和滞销险、控制供应链成本的重要手段,同时也是商家制定销售计划的重要参考。从横向看来,商品的销量行为在不同行业、不同季节、不同年份、大促与日常之间都有可能发生较大变化,其中时间间隔越长销量越难预估,行业内商品越杂乱销量越难预估,大促商品销量受促销活动影响较之日常也更难预估。从纵向看来,销量预测可以分为市场整体销量预测、行业整体销量预测、商家整体销量预测、商品粒度销量预测和SKU粒度商品销量预测,其中粒度越细,销量预测的难度也越高。
[0004] 因此,如何提高预测的精准度,是目前亟需解决的问题。发明内容
[0005] 本公开的一个目的在于提供一种能够提高预测精准度的商品销量预测及模型训练方法、装置、设备以及存储介质。
[0006] 根据本公开的第一个方面,提出了一种商品销量预测方法,包括:获取商品在至少一个维度下的排名信息;基于排名信息,将对应于同一维度的商品的排名和至少一个其他商品的排名进行特征组合;以及将得到的特征输入预测模型,以得到预测模型针对商品的销量爆发系数的预测结果,其中,销量爆发系数用于表征商品在活动期间的销量相对于活动期间之前的平日的销量的变化程度。
[0007] 可选地,获取商品在至少一个或维度下的排名信息的步骤包括:获取商品及与商品具有同一属性特征的其他商品的特征数据;基于特征数据,对商品及其他商品进行排名,以得到商品的至少一个属性特征在至少一个排名维度下的排名信息。
[0008] 可选地,特征数据包括以下至少一项:成交量;加购物车量;点击量;收藏量;以及评论数。
[0009] 可选地,进行特征组合的步骤包括:根据与商品属于同一维度下的其他商品的排名,对商品的排名进行聚合。
[0010] 可选地,对商品的排名进行聚合的步骤包括:使用高斯卷积核的方式对商品的排名进行聚合。
[0011] 可选地,基于如下公式对商品的排名进行聚合,
[0012]
[0013]
[0014] 其中,Fi为经过聚合后得到的特征矩阵,G为高斯函数,σ为根据商品的排名确定的标准差大小,R1表示商品的多个属性特征在不同排名维度下的排名矩阵,R2表示其他商品的多个属性特征在不同排名维度下的排名矩阵,yj表示第j个属性特征。
[0015] 可选地,商品销量预测方法,还包括:根据销量爆发系数和商品在平日的销量,对商品在活动期间的销量进行预测。
[0016] 可选地,商品销量预测方法,还包括:向商家推送商品的销量的预测结果;并且/或者根据商品的销量的预测结果和商家的商品库存,向商家提供销售建议。
[0017] 可选地,向商家提供销售建议的步骤包括:在预测结果表明商品的销量大于商家的商品库存的情况下,向商家发出备货的建议;以及/或者在预测结果表明商品的销量小于商家的商品库存的情况下,向商家发出推出促销活动的建议。
[0018] 可选地,商品包括多个最小库存单位,该方法还包括:根据商品在活动期间的销量预测结果,以及多个最小库存单位的商品的历史销量,得到不同最小库存单位下的商品在活动期间的销量预测结果。
[0019] 可选地,商品在活动期间的销量预测结果是基于商品粒度的销量预测结果。
[0020] 可选地,商品粒度包括以下至少一项:用于展示商品的商品页的访问人数;用于展示商品的商品页的浏览总数;以及点击进入商品详情页的次数。
[0021] 可选地,商品销量预测方法,还包括:向商家推送最小库存单位下的商品的销量预测结果;并且/或者根据同最小库存单位下的商品的销量预测结果和商家的商品库存,向商家提供销售建议。
[0022] 可选地,向商家提供销售建议的步骤包括:在预测结果表明最小库存单位下的商品的销量大于商家的商品库存的情况下,向商家发出备货的建议;以及/或者在预测结果表明最小库存单位下的商品的销量小于商家的商品库存的情况下,向商家发出推出促销活动的建议。
[0023] 可选地,商品销量预测方法,还包括:基于商品在活动期间的实际销量,计算商品的实际销量爆发系数;以得到的特征作为样本特征,以实际销量爆发系数为样本标记,对预测模型进行训练,以更新预测模型。
[0024] 根据本公开的第二个方面,还提供了一种预测模型训练方法,包括:根据商品在活动期间的销量和在平日的销量,确定商品的销量爆发系数,销量爆发系数用于表征商品在活动期间的销量相对于活动期间之前的平日的销量的变化程度;基于商品在至少一个维度下的排名信息,将对应于同一维度的商品的排名和至少一个其他商品的排名进行特征组合;以及以得到的特征为样本特征,以销量爆发系数为样本标记,进行模型,以得到用于对商品的销量爆发系数进行预测的预测模型。
[0025] 根据本公开的第三个方面,还提供了一种商品销量预测装置,包括:排名信息获取模,用于获取商品在至少一个维度下的排名信息;特征组合模块,用于基于排名信息,将对应于同一维度的商品的排名和至少一个其他商品的排名进行特征组合;以及系数预测模块,用于将得到的特征输入预测模型,以得到预测模型针对商品的销量爆发系数的预测结果,其中,销量爆发系数用于表征商品在活动期间的销量相对于活动期间之前的平日的销量的变化程度。
[0026] 可选地,排名信息获取模块包括:特征数据获取模块,用于获取商品及与商品具有同一属性特征的其他商品的特征数据;排名模块,用于基于特征数据,对商品及其他商品进行排名,以得到商品的至少一个属性特征在至少一个排名维度下的排名信息。
[0027] 可选地,特征数据包括以下至少一项:成交量;加购物车量;点击量;收藏量;以及评论数。
[0028] 可选地,特征组合模块根据与商品属于同一维度下的其他商品的排名,对商品的排名进行聚合。
[0029] 可选地,特征组合模块使用高斯卷积核的方式对商品的排名进行聚合。
[0030] 可选地,特征组合模块基于如下公式对商品的排名进行聚合,
[0031]
[0032]
[0033] 其中,Fi为经过聚合后得到的特征矩阵,G为高斯函数,σ为根据商品的排名确定的标准差大小,R1表示商品的多个属性特征在不同排名维度下的排名矩阵,R2表示其他商品的多个属性特征在不同排名维度下的排名矩阵,yj表示第j个属性特征。
[0034] 可选地,商品销量预测装置,还包括:第一销量预测模块,用于根据销量爆发系数和商品在平日的销量,对商品在活动期间的销量进行预测。
[0035] 可选地,商品销量预测装置还包括:预测结果推送模块,用于向商家推送商品的销量的预测结果;和/或建议提供模块,用于根据商品的销量的预测结果和商家的商品库存,向商家提供销售建议。
[0036] 可选地,在预测结果表明商品的销量大于商家的商品库存的情况下,建议提供模块向商家发出备货的建议,并且/或者,在预测结果表明商品的销量小于商家的商品库存的情况下,建议提供模块向商家发出推出促销活动的建议。
[0037] 可选地,商品包括多个最小库存单位,该装置还包括:第二销量预测模块,用于根据商品在活动期间的销量预测结果,以及多个最小库存单位的商品的历史销量,得到不同最小库存单位下的商品在活动期间的销量预测结果。
[0038] 可选地,商品在活动期间的销量预测结果是基于商品粒度的销量预测结果。
[0039] 可选地,商品粒度包括以下至少一项:用于展示商品的商品页的访问人数;用于展示商品的商品页的浏览总数;以及点击进入商品详情页的次数。
[0040] 可选地,商品销量预测装置还包括:预测结果推送模块,用于向商家推送最小库存单位下的商品的销量预测结果,和/或,建议提供模块,用于根据同最小库存单位下的商品的销量预测结果和商家的商品库存,向商家提供销售建议。
[0041] 可选地,可选地,在预测结果表明最小库存单位下的商品的销量大于商家的商品库存的情况下,建议提供模块向商家发出备货的建议,并且/或者,在预测结果表明最小库存单位下的商品的销量小于商家的商品库存的情况下,建议提供模块向商家发出推出促销活动的建议。
[0042] 可选地,商品销量预测装置还包括:系数计算模块,用于基于商品在活动期间的实际销量,计算商品的实际销量爆发系数;更新模块,用于以得到的特征作为样本特征,以实际销量爆发系数为样本标记,对预测模型进行训练,以更新预测模型。
[0043] 根据本公开的第四个方面,还提供了一种预测模型训练装置,包括:系数确定模块,用于根据商品在活动期间的销量和在活动期间之前的平日的销量,确定商品的销量爆发系数,销量爆发系数用于表征商品在活动期间的销量相对于平日的销量的变化程度;特征组合模块,用于基于商品在至少一个维度下的排名信息,将对应于同一维度的商品的排名和至少一个其他商品的排名进行特征组合;以及训练模块,用于以得到的特征为样本特征,以销量爆发系数为样本标记,进行模型,以得到用于对商品的销量爆发系数进行预测的预测模型。
[0044] 根据本公开的第五个方面,还提供了一种计算设备,包括:处理器;以及存储器,其上存储有可执行代码,当可执行代码被处理器执行时,使处理器执行如本公开第一个方面或第二个方面述及的方法。
[0045] 根据本公开的第六个方面,还提供了一种非暂时性机器可读存储介质,其上存储有可执行代码,当可执行代码被电子设备的处理器执行时,使处理器执行如本公开第一个方面或第二个方面述及的方法。
[0046] 本公开使用了一种全新的特征组合方式,例如可以通过高斯卷积和可变尺度滑动窗口优化,使得商品之间的竞争关系被很好的刻画出来,基于这种竞争关系对商品的销量爆发系数进行预测,最终实现对商品销量的预测。附图说明
[0047] 通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的上述以及其他目的、特征和优势将变得更加明显,其中,在本公开示例性实施方式中,相同的参考标号通常代表相同部件。
[0048] 图1是示出了根据本公开一实施例的商品销量预测方法的示意性流程图
[0049] 图2是示出了根据本公开一实施例的商品销量预测流程示意图。
[0050] 图3是示出了根据本公开一实施例的预测模型训练方法的示意性流程图。
[0051] 图4是示出了根据本公开一实施例的商品销量预测装置的结构的示意性方框图
[0052] 图5是示出了排名信息获取模块可以具有的功能模块的结构示意图。
[0053] 图6是示出了根据本公开一实施例的预测模型训练装置的结构的示意性方框图。
[0054] 图7是示出了根据本公开一实施例的计算设备的结构的示意性方框图。

具体实施方式

[0055] 下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
[0056] 【方案概述】
[0057] 由于经济的自然增长,商品销量在不同年份之间的差异是巨大的,一昧地使用历史数据进行模型训练将会使得模型拟合历史销量分布,当应用到实际预测问题中时常常出现销量预测值与真实值有很大偏差的情况。因此本公开提出了销量爆发系数的概念,用于衡量活动期间(如双十一购物节等大促期间)商品销量相对于平日(即没有活动的平销期间)的爆发程度。显然销量爆发系数避免了不同年份之间经济增长差异带来的影响,使得基于销量爆发系数预测得到的销量更为可信。
[0058] 进一步地,本公开发明人深入研究后发现,商品在大促期间的销量爆发系数与其所处排名存在很大关系。例如,商品按照GMV(网站成交额)在全网排名,排名顶部的商品爆发系数反而不如排名中部的商品,而排名尾部的商品爆发系数波动性很大。商品在某个维度下的排名反映其与同维度下其他商品之间的竞争关系,而排名接近的商品必然在某一些方面具有相似的表现,因此可以根据排名进行特征组合(例如可以通过聚合的方式实现特征组合),以充分挖掘商品与竞品、相似商品之间的关系。
[0059] 基于上述考量,本公开提出,可以将商品及其竞争商品的排名进行特征组合,组合后得到的特征既反映了商品自身的信息,也一定程度反映了商品与其竞争商品之间的相互信息。因此可以基于组合后得到的特征,使用预测模型对商品的销量爆发系数进行预测,由此可以得到较为准确的预测结果。
[0060] 至此,就本公开的商品销量预测方案的基本原理做了简要说明。下面就本公开涉及的细节做进一步说明。
[0061] 【商品销量预测方法】
[0062] 图1是示出了根据本公开一实施例的商品销量预测方法的示意性流程图。
[0063] 参见图1,在步骤S110,获取商品在一个或多个维度下的排名信息。
[0064] 此处述及的商品是用于对其销量进行预测的商品,为了便于区分,此处述及的商品可以称为“待预测商品”。排名信息可以是包括待预测商品在内的多个商品的排名信息,如可以是包括待预测商品在内的多个商品在一个多维度下的排名信息。作为示例,此处述及的排名信息可以是待预测商品的多个属性特征分别在不同排名维度下的排名信息。举例来说,假设待预测商品是“短袖T恤男士夏季新款t翻领POLO衫”,排名信息可以是T恤类商品的销量、加购物车量、收藏量、人气等诸多排名维度的排名信息,另外,排名信息也可以是“翻领POLO衫”类商品的销量、加购物车量、收藏量、人气等诸多排名维度的排名信息。可见,排名信息可以反映待预测商品与其他商品在相同维度下的竞争关系。
[0065] 作为本公开的一个示例,可以统计待预测商品及与待预测商品具有同一属性特征的其他商品的点击、成交量、评论数(如买家评论)、收藏量、加购物车量等特征数据,根据统计得到的特征数据对待预测商品及其他商品进行排名,以得到排名信息,其中,与待预测商品具有同一属性特征的其他商品可以视为待预测商品的竞争商品。
[0066] 作为本公开的另一个示例,也可以从已有的商品排名信息中抽取包括待预测商品的排名信息,例如,本公开述及的商品可以是电商平台上展示的商品,而电商平台可以基于预定的排序逻辑,对平台中的商品(如同类商品)进行排序,因此可以电商平台已经确定的排序信息中找出包括待预测商品在内的排序信息,作为商品的排名信息。
[0067] 在步骤S120,基于排名信息,将对应于同一维度的商品的排名和至少一个其他商品的排名进行特征组合。
[0068] 如上文所述,商品的销量爆发系数与其所处排名存在很大关系,商品在某个维度下的排名反映其与同维度下其他商品之间的竞争关系,而排名接近的商品必然在某一些方面具有相似的表现,因此可以根据排名进行特征组合,以充分挖掘商品与竞品、相似商品之间的关系。
[0069] 作为示例,可以根据同一维度下其他商品的排名,对商品的排名进行聚合,例如,可以使用高斯卷积核的方式对商品的排名进行聚合。具体地,可以基于如下公式对商品的排名进行聚合,
[0070]
[0071]
[0072] 其中,Fi为经过聚合后得到的特征矩阵,G为高斯函数,σ为根据商品的排名确定的标准差大小,R1表示商品的多个属性特征在不同排名维度下的排名矩阵,R2表示其他商品的多个属性特征在不同排名维度下的排名矩阵,yj表示第j个属性特征。
[0073] 例如,假设商品拥有n个属性特征,每个属性特征对应一个特征维度,每个特征维度在m个排名维度下分别拥有一个排名信息,R1,Fi分别可以表示为
[0074]
[0075]
[0076] 其中,fi,j表示第i个属性特征fi在第j个排名维度下根据排名聚合之后的特征。
[0077] 根据上式最终得到的商品特征矩阵Fi为经过聚合后的特征集合,包含了待预测商品的特征和竞争商品的特征,既反映了待预测商品自身的信息,也一定程度反映了待预测商品与竞争商品之间的相互信息。
[0078] 在步骤S130,将得到的特征输入预测模型,以得到预测模型针对商品的销量爆发系数的预测结果。
[0079] 在本公开中,预测模型用于对商品的销量爆发系数进行预测,预测模型的输入为通过特征组合得到的特征,预测模型的输入为商品的销量爆发系数。其中,预测模型可以是决策树模型,也可以是深度神经网络模型,关于预测模型的训练过程将在下文说明,此处暂不赘述。
[0080] 销量爆发系数用于表征商品在活动期间的销量相对于活动期间之前的平日的销量的变化程度。其中,活动期间可以是指电商平台开展的商品促销活动的期间,平日可以是指没有促销活动的期间(即平销期间),其中,活动期间可以包括但不限于“双11”、“618”、“双12”等购物节。作为示例,商品在活动期间的销量=销量爆发系数×商品在平日的销量。因此,根据预测的销量爆发系数和商品在平日的销量,就可以得到商品在活动期间的销量预测结果。
[0081] 在得到商品的销量的预测结果后,还可以向商家推送商品的销量的预测结果,并且/或者,还可以根据商品的销量的预测结果和商家的商品库存,向商家提供销售建议。例如,可以在预测结果表明商品的销量大于商家的商品库存的情况下,向商家发出备货的建议,也可以在预测结果表明商品的销量小于商家的商品库存的情况下,向商家发出推出促销活动的建议。
[0082] 【粒度预测】
[0083] 商品可以包括多个最小库存单位(SKU,Stock Keeping Unit),可以结合商品在活动期间的销量预测结果,以及多个最小库存单位的商品的历史销量,得到不同最小库存单位下的商品在活动期间的销量预测结果。
[0084] 以电商平台中的商品为例,商品可以是指属于同一品牌、类型的多个不同SKU(Stock Keeping Unit,最小库存单位)的统称。例如,对于某一品牌的衬衫,衬衫可以分为不同尺码、颜色等多个SKU粒度。
[0085] 由此,本公开提出可以先以商品为粒度对商品销量进行预测,再根据SKU粒度下的历史销售信息,分解得到各个SKU粒度的销量预测值。这是因为,平台展示商品过程是以商品页为单位进行的,因此在商品粒度上存在PV(商品页的浏览总量)、IPV(点击进入商品详情页的次数)、UV(商品页的访问人数)等较多信息可以作为销量预测的特征,而SKU是商品在不同尺码、颜色上的细分类型,不存在PV、UV等特征。因此本公开提出可以先以商品粒度(PV、IPV、UV)进行商品销量预测,为卖家投放流量,种草等行为提供依据,再根据SKU粒度的历史销量分布分解得到各个SKU的预计销量,为卖家备货提供参考。
[0086] 进一步地,在得到SKU粒度下的销量预测结果后,还可以向商家推送不同最小库存单位下的商品的销量预测结果,并且/或者,还可以根据最小库存单位下的商品的销量预测结果和商家的商品库存,向所述商家提供销售建议。例如,可以在在预测结果表明最小库存单位下的商品的销量大于商家的商品库存的情况下,向商家发出备货的建议,也可以在预测结果表明最小库存单位下的商品的销量小于商家的商品库存的情况下,向商家发出推出促销活动的建议。
[0087] 综上,本公开主要包括如下四个方面:(1)基于商品在不同维度下的排名信息,考虑商品与竞争商品之间的相互影响;(1)提出销量变化系数(例如商品销量爆发系数)的概念,解决了自然增长导致的特征空间分布不一致的问题;(3)综合普通特征与排名类特征,使用机器学习模型实现了销量变化系数的预测,最后根据预测的销量变化系数得到具体的销量预测数值;(4)提出先以商品粒度进行销量预测,再将预测结果进行分解,以得到各个SKU下的商品的销量预测结果。
[0088] 【模型更新】
[0089] 在使用预测模型对商品的销量爆发系数进行预测后,还可以根据商品在活动期间的实际销量,计算商品的实际销量爆发系数,实际销量爆发系数=商品在活动期间的实际销量/商品在平日的销量。然后可以以得到的特征作为样本特征,以实际销量爆发系数为样本标记,对预测模型进行训练,以更新预测模型。由此,可以不断完善预测模型,提高模型预测的准确性。
[0090] 至此,结合图1就本公开的商品销量预测方法的实现流程做了详细说明。
[0091] 【应用例
[0092] 下面以本公开应用于商品销量预测为例,进行示例性说明。应该知道,本公开还可以用于对商品的加购物车量、收藏量进行预测,并且除电商场景外,本公开还可以用于其他具有排名分布或重要性分布的场景,此处不再赘述。
[0093] 为了使得大促销活动(例如电商平台举办的购物节)能够逐步走向智能商业化,需要利用大数据为商家备货促销行为提供指导。具体地,电商平台上有为数众多的卖家和买家,同一个行业下的同类商品的数量规模也十分庞大,因此平台中有大量的信息反映了行业内部相近商品之间的竞争关系和商品优劣。由于市场整体的需求具有一定稳定性,如果充分利用平台优势、对这些反应商品之间相互竞争关系的数据进行深度挖掘、特征组合,可能可以比商家自身进行预测更为准确。因此,可以由掌握大量商品排行信息的电商平台执行本公开的方案,对平台上各卖家的商品在促销期间的销量进行预测,以为商家备货或提升促销度提供指导。
[0094] 图2是示出了根据本公开一实施例的商品销量预测流程示意图。
[0095] 参见图2,在步骤S210,针对待预测商品,首先可以统计待预测商品及与待预测商品具有同一属性特征的其他商品(即竞争商品)的成交量、加购物车量、点击量、收藏量、评论数等特征数据。
[0096] 在步骤S220,根据统计的特征数据,可以进行商品排名,以得到待预测商品的一个或多个属性特征在不同排名维度下的排名信息。
[0097] 在步骤S230,根据排名信息,可以将待预测商品的排名和相同排名维度下的竞争商品的排名进行聚合,例如可以使用高斯卷积函数进行特征聚合,以得到聚合后的特征。
[0098] 在步骤S240,聚合后得到的特征矩阵可以作为预测模型的输入,这里预测模型可以是决策树模型,也可以是深度神经网络模型。
[0099] 在步骤S250,预测模型可以用于对待预测商品的销量爆发系数进行预测。由此,通过对销量爆发系数进行预测,可以避免由于特征空间的迁移导致的销量预测偏低的问题,从而可以解决了经济增长带来的特征空间迁移的问题,使得使用历年数据训练得到的模型可以迁移到当前销量预测的业务中。
[0100] 在步骤S260,基于预测得到的销量爆发系数,可以得到以商品为粒度的销量预测结果。
[0101] 在步骤S270,根据商品在各个SKU的历史销量信息,可以分解得到各个SKU粒度的销量预测结果。
[0102] 在步骤S280,可以将各个SKU粒度的预测结果发送给卖家,以提前通知卖家缺货或滞销风险。
[0103] 在步骤S290,在供应链后端,根据预测的销量值与库存对比,卖家可以得出商品缺货\滞销的判断,并相应的进行备货或者促销措施。从而提高了销量确定性,减小了供应链成本。
[0104] 综上,本方案在对商品销量进行预测时,考虑了商品之间的排名信息,商品之间的排名信息反映了平台上商品之间的竞争关系,由于可以获得商品之间的竞争关系,因此相比于传统的只使用单个商品自身信息进行销量预测可以获得更高的精度。同时,本方案中对销量的排名特征进行了卷积处理,带来了精度的提升;对特征进行了爆发系数处理,解决了经济增长带来的样本空间迁移的问题。并且本方案中细化到了SKU粒度,相比于商品粒度销量预测为供应链后端提供了更为直接的参考。
[0105] 以优衣库旗舰店中的法兰绒衬衫式连衣裙为例,
[0106] (a)首先,可以收集平台中关于该商品的历史销量、点击、评价等信息,并可以收集平台中其他商品的历史信息。然后对收集到的特征进行排序处理,分析其中的竞品关系,比如该连衣裙销量在叶子类目下的排名,销量在自身优衣库官方旗舰店下的排名,该连衣裙商品页点击量在淘系和天猫全网的排名等等。
[0107] (b)其次,可以使用机器学习模型预测该商品的大促销量,并将预测的销量结果通过智能商业平台通知卖家;若卖家发现预测销量较低,低于库存,则联系行业小二进行流量投放或者广告推广(流量投放处于商品维度)。
[0108] (c)假设该商品具有七个不同的SKU,则可以根据历史销量得出每个SKU的销量占比,与预测的销量相结合得出各个SKU的预计销量,然后通过智能商业平台通知卖家。若卖家发现某些SKU的备货不足,小于预计销量值,则可以相应的补充货源(备货处于SKU维度),降低缺货风险。
[0109] 综上,本公开可以实现为一种SKU粒度的销量预测系统,可以为商家提前预知缺货滞销风险,降低供应链成本带来了新的可能,并且同时可以为卖家备货,投放广告提供可靠的参考。
[0110] 【模型训练方法】
[0111] 图3是示出了根据本公开一实施例的预测模型训练方法的示意性流程图。其中,图3所示的预测模型训练方法所训练的预测模型可以用于图1所示的商品销量预测方法。
[0112] 参见图3,在步骤S310,根据商品在活动期间的销量和在平日的销量,确定商品的销量爆发系数。
[0113] 销量爆发系数可以用于表征商品在活动期间的销量相对于平日的销量的变化程度。其中,活动期间可以是“双十一购物狂欢节”、“双十二购物狂欢节”等活动期间,平日可以是没有促销活动的期间(即平销期间)。作为示例,销量爆发系数可以等于商品在活动期间的销量与商品在平日的销量的比值。
[0114] 在步骤S320,基于商品在至少一个维度下的排名信息,将对应于同一维度的商品的排名和至少一个其他商品的排名进行特征组合。
[0115] 与商品属于相同维度的其他商品可以视为商品的竞争商品。将对应于同一维度的商品的排名和至少一个其他商品的排名进行特征组合的步骤可以参见上文图1中步骤S120的描述,此处不再赘述。
[0116] 在步骤S330,以得到的特征为样本特征,以销量爆发系数为样本标记,进行模型,以得到用于对商品的销量爆发系数进行预测的预测模型。
[0117] 此处述及的预测模型可以是决策树模型,也可以是深度神经网络模型,具体的训练过程为本领域成熟技术,此处不再赘述。
[0118] 综上,本公开可以从历年的销量数据中抽取得到训练用样本,所训练的模型用于对销量爆发系数进行预测,因此可以避免由于特征空间的迁移导致的销量预测偏低的问题,从而可以解决了经济增长带来的特征空间迁移的问题,使得使用历年数据训练得到的模型可以迁移到当前销量预测的业务中。
[0119] 【商品销量预测装置】
[0120] 图4是示出了根据本公开一实施例的商品销量预测装置的结构的示意性方框图。其中,商品销量预测装置的功能模块可以由实现本公开原理的硬件软件或硬件和软件的结合来实现。本领域技术人员可以理解的是,图4所描述的功能模块可以组合起来或者划分成子模块,从而实现上述发明的原理。因此,本文的描述可以支持对本文描述的功能模块的任何可能的组合、或者划分、或者更进一步的限定。
[0121] 下面就商品销量预测装置可以具有的功能模块以及各功能模块可以执行的操作做简要说明,对于其中涉及的细节部分可以参见上文结合图1的描述,这里不再赘述。
[0122] 参见图4,商品销量预测装置400包括排名信息获取模块410、特征组合模块420以及系数预测模块430。
[0123] 排名信息获取模块410用于获取商品在至少一个维度下的排名信息。如图5所示,排名信息获取模块410可以可选地包括特征数据获取模块4110和排名模块4120。特征数据获取模块4110用于获取商品及与商品具有同一属性特征的其他商品的特征数据,排名模块4120用于基于特征数据,对商品及其他商品进行排名,以得到商品的至少一个属性特征在至少一个排名维度下的排名信息。其中,特征数据可以包括以下至少一项:成交量;加购物车量;点击量;收藏量;以及评论数。
[0124] 特征组合模块420用于基于排名信息,将对应于同一维度的商品的排名和至少一个其他商品的排名进行特征组合。作为示例,特征组合模块420可以根据与商品属于同一维度下的其他商品的排名,对商品的排名进行聚合。例如,特征组合模块420可以使用高斯卷积核的方式对商品的排名进行聚合。具体地,特征组合模块420可以基于如下公式对商品的排名进行聚合,
[0125]
[0126]
[0127] 其中,Fi为经过聚合后得到的特征矩阵,G为高斯函数,σ为根据商品的排名确定的标准差大小,R1表示商品的多个属性特征在不同排名维度下的排名矩阵,R2表示其他商品的多个属性特征在不同排名维度下的排名矩阵,yj表示第j个属性特征。
[0128] 系数预测模块430用于将得到的特征输入预测模型,以得到预测模型针对商品的销量爆发系数的预测结果,其中,销量爆发系数用于表征商品在活动期间的销量相对于活动期间之前的平日的销量的变化程度。
[0129] 如图4所示,商品销量预测装置100还可以可选地包括图中虚线框所示的第一销量预测模块440,第一销量预测模块440可以用于根据销量爆发系数和商品在平日的销量,对商品在活动期间的销量进行预测。
[0130] 如图4所示,商品销量预测装置100还可以可选地包括图中虚线框所示的预测结果推送模块450和/或建议提供模块460。预测结果推送模块450用于向商家推送商品的销量的预测结果。建议提供模块460用于根据商品的销量的预测结果和商家的商品库存,向商家提供销售建议,例如,在预测结果表明商品的销量大于商家的商品库存的情况下,建议提供模块460可以向商家发出备货的建议,并且/或者,在预测结果表明商品的销量小于商家的商品库存的情况下,建议提供模块460可以向商家发出推出促销活动的建议。
[0131] 如图4所示,商品销量预测装置100还可以可选地包括图中虚线框所示的第二销量预测模块470。商品可以包括多个最小库存单位,第二销量预测模块470可以用于根据商品在活动期间的销量预测结果,以及多个最小库存单位的商品的历史销量,得到不同最小库存单位下的商品在活动期间的销量预测结果。在本实施例中,商品在活动期间的销量预测结果可以是基于商品粒度的销量预测结果,其中,商品粒度可以包括以下至少一项:用于展示商品的商品页的访问人数;用于展示商品的商品页的浏览总数;以及点击进入商品详情页的次数。
[0132] 预测结果推送模块450可以用于向商家推送最小库存单位下的商品的销量预测结果,并且/或者,建议提供模块460可以用于根据同最小库存单位下的商品的销量预测结果和商家的商品库存,向商家提供销售建议。例如,在预测结果表明最小库存单位下的商品的销量大于商家的商品库存的情况下,建议提供模块460可以向商家发出备货的建议,并且/或者,在预测结果表明最小库存单位下的商品的销量小于商家的商品库存的情况下,建议提供模块460可以向商家发出推出促销活动的建议。
[0133] 在本公开一个实施例中,商品销量预测装置还可以包括系数计算模块和更新模块(图中未示出)。系数计算模块用于基于商品在活动期间的实际销量,计算商品的实际销量爆发系数,更新模块用于以得到的特征作为样本特征,以实际销量爆发系数为样本标记,对预测模型进行训练,以更新预测模型。
[0134] 【预测模型训练装置】
[0135] 图6是示出了根据本公开一实施例的预测模型训练装置的结构的示意性方框图。其中,预测模型训练装置的功能模块可以由实现本公开原理的硬件、软件或硬件和软件的结合来实现。本领域技术人员可以理解的是,图6所描述的功能模块可以组合起来或者划分成子模块,从而实现上述发明的原理。因此,本文的描述可以支持对本文描述的功能模块的任何可能的组合、或者划分、或者更进一步的限定。
[0136] 下面就预测模型训练装置可以具有的功能模块以及各功能模块可以执行的操作做简要说明,对于其中涉及的细节部分可以参见上文结合图3的描述,这里不再赘述。
[0137] 参见图6,预测模型训练装置600包括系数确定模块610、特征组合模块620以及训练模块630。
[0138] 系数确定模块610用于根据商品在活动期间的销量和在平日的销量,确定商品的销量爆发系数,销量爆发系数用于表征商品在活动期间的销量相对于活动期间之前的平日的销量的变化程度。特征组合模块620用于基于商品在至少一个维度下的排名信息,将对应于同一维度的商品的排名和至少一个其他商品的排名进行特征组合。训练模块630用于以得到的特征为样本特征,以销量爆发系数为样本标记,进行模型,以得到用于对商品的销量爆发系数进行预测的预测模型。
[0139] 【计算设备】
[0140] 图7示出了根据本公开一实施例可用于实现上述商品销量预测方法或商品销量预测方法的数据处理的计算设备的结构示意图。
[0141] 参见图7,计算设备700包括存储器710和处理器720。
[0142] 处理器720可以是一个多核的处理器,也可以包含多个处理器。在一些实施例中,处理器720可以包含一个通用的主处理器以及一个或多个特殊的协处理器,例如图形处理器(GPU)、数字信号处理器(DSP)等等。在一些实施例中,处理器720可以使用定制的电路实现,例如特定用途集成电路(ASIC,Application Specific Integrated Circuit)或者现场可编程逻辑阵列(FPGA,Field Programmable Gate Arrays)。
[0143] 存储器710可以包括各种类型的存储单元,例如系统内存、只读存储器(ROM)和永久存储装置。其中,ROM可以存储处理器720或者计算机的其他模块需要的静态数据或者指令。永久存储装置可以是可读写的存储装置。永久存储装置可以是即使计算机断电后也不会失去存储的指令和数据的非易失性存储设备。在一些实施方式中,永久性存储装置采用大容量存储装置(例如磁或光盘、闪存)作为永久存储装置。另外一些实施方式中,永久性存储装置可以是可移除的存储设备(例如软盘光驱)。系统内存可以是可读写存储设备或者易失性可读写存储设备,例如动态随机访问内存。系统内存可以存储一些或者所有处理器在运行时需要的指令和数据。此外,存储器710可以包括任意计算机可读存储媒介的组合,包括各种类型的半导体存储芯片(DRAM,SRAM,SDRAM,闪存,可编程只读存储器),磁盘和/或光盘也可以采用。在一些实施方式中,存储器710可以包括可读和/或写的可移除的存储设备,例如激光唱片(CD)、只读数字多功能光盘(例如DVD-ROM,双层DVD-ROM)、只读蓝光光盘、超密度光盘、闪存卡(例如SD卡、min SD卡、Micro-SD卡等等)、磁性软盘等等。计算机可读存储媒介不包含载波和通过无线或有线传输的瞬间电子信号。
[0144] 存储器710上存储有可执行代码,当可执行代码被处理器720执行时,可以使处理器720执行上文述及的商品销量预测方法。
[0145] 上文中已经参考附图详细描述了根据本公开的商品销量预测及模型训练方法、装置以及设备。
[0146] 此外,根据本公开的方法还可以实现为一种计算机程序或计算机程序产品,该计算机程序或计算机程序产品包括用于执行本公开的上述方法中限定的上述各步骤的计算机程序代码指令。
[0147] 或者,本公开还可以实施为一种非暂时性机器可读存储介质(或计算机可读存储介质、或机器可读存储介质),其上存储有可执行代码(或计算机程序、或计算机指令代码),当所述可执行代码(或计算机程序、或计算机指令代码)被电子设备(或计算设备、服务器等)的处理器执行时,使所述处理器执行根据本公开的上述方法的各个步骤。
[0148] 本领域技术人员还将明白的是,结合这里的公开所描述的各种示例性逻辑块、模块、电路和算法步骤可以被实现为电子硬件、计算机软件或两者的组合。
[0149] 附图中的流程图和框图显示了根据本公开的多个实施例的系统和方法的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标记的功能也可以以不同于附图中所标记的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0150] 以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其他普通技术人员能理解本文披露的各实施例。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈